SVM与Logistic回归的关系

来源：互联网发布：淘宝排名在线查询编辑：程序博客网时间：2024/06/15 20:43

合页损失函数

[z] + = {z, z > 0 0, z \leq 0

对于线性SVM，我们知道它的原始最优化问题为：

m i n w, b, ξ 1 / 2 | | w | | 2 + C Σ N i = 1 ξ i s . t . y i (w \cdot x i + b) \geq 1 - ξ i, i = 1, 2, . . ., N ξ i \geq 0, i = 1, 2, . . ., N

对于原始优化问题，当

yi(w⋅xi+b)≥1时，数据点落在了间隔边界正确的一侧，这时

ξi为0，而当

yi(w⋅xi+b)<1的时候，这时

ξi=1−yi(w⋅xi+b).
因此，SVM的优化问题可以转化为最优化以下问题：

m i n w, b Σ N i = 1 [1 - y i (w \cdot x i + b)] + + λ | | w | | 2

其中，

λ=(2C)−1

对于logistic回归，我们知道sigmoid函数的形式为

f (a) = 1 1 + e x p { - ( w \cdot x + b ) } = 1 1 + e x p ( - a )

其中

a=w⋅x+b
sigmoid函数的性质：

对称性：f(−a)=1−f(a)

∂f∂a=f(1−f)

应用极大似然函数估计模型参数，首先构造似然函数，我们知道logistic回归模型为p(y=1|x)=π(x),p(y=0|x)=1−π(x)，则似然函数为：

Z = Π N i = 1 [π (x i)] y i [1 - π (x i)] 1 - y i

取似然函数的负对数得到误差函数，这个误差函数就是交叉熵（cross-entropy）误差函数：

L 1 = - l n Z = - Σ N i = 1 [y i l o g π (x i) + (1 - y i) l o g (1 - π (x i))]

去掉前面负号不影响优化问题，则：

L 2 = Σ N i = 1 [y i l o g π (x i) + (1 - y i) l o g (1 - π (x i))]

在处理logistic回归时，为了比较方便，我们对目标变量

y∈{0,1}进行操作，使用目标函数

y∈{−1,1}重写最大似然logistic函数。我们知道，

p(y=1|a)=f(a)，p(y=−1|a)=1−f(a)=f(−a)，根据sigmoid函数的对称性质，我们有：

p (y | a) = f (a y) = 1 1 + e x p ( - a y )

从上式子中通过对似然函数取负对数构造一个带正则化项的误差函数：

L = Σ N i = 1 l n (1 + e x p (- a i y i)) + λ | | w | | 2

把最终式换回去：

m i n w, b L = Σ N i = 1 l n (1 + e x p (- (w \cdot x i + b) y i) + λ | | w | | 2

和SVM作对比：

m i n w, b Σ N i = 1 [1 - y i (w \cdot x i + b)] + + λ | | w | | 2

因此，SVM和Logistic回归有相似的目标函数

附加：
logistic回归与最大熵模型的关系

阅读全文

0 0