SVM中为何间隔边界的值为正负1

来源：互联网发布：android 系统相机源码编辑：程序博客网时间：2024/06/05 23:21

在WB二面中，问到让讲一下SVM算法。

我回答的时候，直接答道线性分隔面将样本分为正负两类，取平行于线性分割面的两个面作为间隔边界，分别为：wx+b=1和wx+ b = -1。

面试官就问，为什么是正负1？

当时没有答上来，看来还是对模型不够理解。

回来查资料和ppt等，解答如下：

线性分割面是f(x) = wx + b，该线性分割面是要把样本点分为两类：

对于正样本，都满足：wx + b > 0；

对于负样本，都满足：wx + b < 0；

从式子中可以观察到，如果同时放大或缩小w和b，最后的结果是不受影响的，还是同一个线性分割面。因此，我们可以做一个要求：

对于所有正样本，都满足：wx + b >= 1；

对于所有负样本，都满足：wx + b <= -1；

其中，间隔边界外的点对应的是">"或"<"号，而间隔边界上的点，对应的是"="号。

即得到：

对于间隔边界上的正样本，都满足：wx + b = 1；

对于间隔边界上的负样本，都满足：wx + b = -1；

这就是间隔边界上的值为正负1的由来。

PS1：

硬间隔SVM中，最小化间隔为：

min f(w) = w.T * w / 2

其约束条件为：使所有的样本点都能正确划分，即：

s.t. y_i(w * x_i + b) >= 1。

注意：不等式是包含等号"="的，是说，所有的点都在间隔边界之上或之外，不允许出现在间隔边界与分类超平面之间的！

PS2：

对于软间隔SVM中的松弛变量的概念。噪声点并非只能存在于正确间隔边界外，由于有了松弛变量把它拉回来，因此，噪声点是可以到两个间隔边界之中，或者到错误的间隔边界之外的（当然，如果只是出现在分类超平面和正确的间隔边界之间，此时该点还是会被正确分类的，但是，此时它还是会为l(w)函数贡献松弛变量e的。）。此时的限制条件为：

s.t. y_i(w * x_i + b) + e_i >= 1，其中，e_i >= 0。

0 0