机器学习(十一)——常用机器学习算法优缺点对比、适用条件
demi 在 周四, 11/15/2018 - 13:46 提交
1、决策树
适用条件:数据不同类边界是非线性的,并且通过不断将特征空间切分为矩阵来模拟。特征之间有一定的相关性。特征取值的数目应该差不多,因为信息增益偏向于更多数值的特征。
优点:
• 直观的决策规则;
• 可以处理非线性特征;
• 考虑了变量之间的相互作用。
缺点:
• 容易过拟合(随机森林、剪枝);
• 处理缺失数据时的困难;
• 数据集中属性间的相关性。
2、SVM
适用条件:特征空间大,可以处理非线性的特征。
优点:
• 可以处理小样本情况下的机器学习问题;
• 可以处理高维特征;
• 使用核函数应对非线性特征空间,解决非线性问题;
• 分类面不依赖所有数据,只与几个支持向量有关