SVM 为什么说高斯核函数能把向量映射到无穷维

来源:互联网 发布:京瓷网络扫描设置 编辑:程序博客网 时间:2024/05/01 20:06

按照Andrew在视频课上的讲解,高斯核就是把每个数据都看做是一个基准然后分别计算所有数据与这个基准之间的高斯函数。

这样如果原始数据维度是2,有n条数据,就成功的把一个2维的向量升到了n维。


那么为什么说高斯核函数能将数据映射到无穷维度空间呢?

参考自水木社区:

如果映射后空间是k维的话,那内积矩阵的秩最大是k。而任给n个互不重合的样本, 
Gaussian kernel的内积矩阵都是满秩的。所以你无论假设k是多少,都能找到n>k,矛 
盾,所以必须是无限维的。 


意思是说,我现在有n条数据,那么我把k维成功升到了n维,你告诉我说高斯核函数能把数据集升到n维。这个时候我再给你加一条新的与原始数据不重合的样本,那么数据就可以映射到n+1维空间,与之前结论矛盾,因此,高斯核函数能将数据升到无穷维。


那么升到无限维有什么好处呢?

好处是:vc维提升(线性分类器的vc维是n+1,如果升到无穷维,则是vc维也是无穷的),即总能找到一个分类面将数据集很好的分开。vc维代表了分类能力。即在使用SVM的时候,只要C选的足够大,就可以保证拟合的很好,甚至是过拟合。



如果是高斯核函数,那svm train出来的model是不是得存储所有的原始训练数据呢?

答案是否定的。

由于w=Σαyx,由于非suppor vector对应的alpha的值都是0,所以它随便是多少都无所谓,一乘alpha直接原形毕露,所以其实还是只需要保存下来support vector的数据即可。

0 0
原创粉丝点击