支持向量机SVM（一）

来源：互联网发布：mac下制作黑苹果u盘编辑：程序博客网时间：2024/06/06 01:33

支持向量机，因其英文名为support vector machine，故一般简称SVM，是90年代中期发展起来的基于统计学习理论的一种机器学习方法，它是一种二类分类模型，其基本模型定义为特征空间上的间隔较大的线性分类器，其学习策略便是间隔较大化，最终可转化为一个凸二次规划问题的求解，从而达到在统计样本量较少的情况下，亦能获得良好统计规律的目的。

SVM最基本的应用是分类。求解最优的分类面，然后用于分类。
最优分类面的定义：对于SVM，存在一个分类面，两个点集到此平面的最小距离最大，两个点集中的边缘点到此平面的距离最大。

重新审视logistic回归
Logistic回归目的是从特征学习出一个0/1分类模型，而这个模型是将特性的线性组合作为自变量，由于自变量的取值范围是负无穷到正无穷。因此，使用logistic函数（或称作sigmoid函数）将自变量映射到(0,1)上，映射后的值被认为是属于y=1的概率。
形式化表示就是
假设函数
clip_image001

其中x是n维特征向量，函数g就是logistic函数。

clip_image002 的图像是

clip_image003

可以看到，将无穷映射到了(0,1)。

而假设函数就是特征属于y=1的概率。

clip_image004

当我们要判别一个新来的特征属于哪个类时，只需求 clip_image006 ，若大于0.5就是y=1的类，反之属于y=0类。

再审视一下 clip_image006[1] ，发现 clip_image006[2] 只和 clip_image008 有关， clip_image008[1] >0，那么 clip_image010 ，g(z)只不过是用来映射，真实的类别决定权还在 clip_image008[2] 。还有当 clip_image012 时， clip_image006[3] =1，反之 clip_image006[4] =0。如果我们只从 clip_image008[3] 出发，希望模型达到的目标无非就是让训练数据中y=1的特征 clip_image012[1] ，而是y=0的特征 clip_image014 。Logistic回归就是要学习得到 clip_image016 ，使得正例的特征远大于0，负例的特征远小于0，强调在全部训练实例上达到这个目标。

图形化表示如下：

clip_image017

中间那条线是这里写图片描述，logistic回顾强调所有点尽可能地远离中间那条线。学习出的结果也就中间那条线。考虑上面3个点A、B和C。从图中我们可以确定A是×类别的，然而C我们是不太确定的，B还算能够确定。这样我们可以得出结论，我们更应该关心靠近中间分割线的点，让他们尽可能地远离中间线，而不是在所有点上达到最优。因为那样的话，要使得一部分点靠近中间线来换取另外一部分点更加远离中间线。我想这就是支持向量机的思路和logistic回归的不同点，一个考虑局部（不关心已经确定远离的点），一个考虑全局（已经远离的点可能通过调整中间线使其能够更加远离）。这是我的个人直观理解。

阅读全文

0 0