SVM和Logistic Regression的使用时的区别

来源：互联网发布：qq在线人数竞猜源码编辑：程序博客网时间：2024/06/02 04:45

这里写图片描述
上图来自Andrew Ng的机器学习课程，我做个搬运工：
假设： n = 特征数量，m = 训练样本数量
1）如果n相对于m更大，比如 n = 10,000，m = 1,000，则使用lr
理由：
特征数相对于训练样本数已经够大了，使用线性模型就能取得不错的效果，不需要过于复杂的模型；
2）如果n较小，m比较大，比如n = 10，m = 10,000，则使用SVM（高斯核函数）
理由：
在训练样本数量足够大而特征数较小的情况下，可以通过使用复杂核函数的SVM来获得更好的预测性能，而且因为训练样本数量并没有达到百万级，使用复杂核函数的SVM也不会导致运算过慢；
3）如果n较小，m非常大，比如n = 100, m = 500,000，则应该引入／创造更多的特征，然后使用lr或者线性核函数的SVM
理由：
因为训练样本数量特别大，使用复杂核函数的SVM会导致运算很慢，因此应该考虑通过引入更多特征，然后使用线性核函数的SVM或者lr来构建预测性更好的模型。

阅读全文

0 0