SVM总结

来源:互联网 发布:巫妖王之怒cg知乎 编辑:程序博客网 时间:2024/06/05 02:37

开始:

给定训练集:

T={(x1,y1),(x2,y2),(x3,y3),...,(xn,yn)}
,其中xix=Rnyiy={+1,1}, i=1,2,...,N

定义:

函数间隔

超平面(w,b)关于样本点(xi,yi) 的函数间隔为:

γi^=yi(wxi+b)

超平面(w,b)关于训练集T的函数间隔为:
γ^=mini=1,...,Nγ^i

增加约束,使||w|| = 1,这时函数间隔称为几何间隔。

几何间隔

超平面(w,b)关于样本点(xi,yi)的几何间隔:

γi^=yi(w||w||xi+b||w||)

超平面(w,b)关于训练集T的几何间隔为:
γ^=mini=1,...,Nγ^i

1.线性可分

几何间隔最大化的分离超平面:

wx+b=0

相应的分类决策函数:
f(x)=sign(wx+b)

转化为优化问题:
maxw,bγ

s.t.yi(w||w||xi+b||w||)γ,i=1,2,...,N

由几何间隔和函数间隔的关系
maxw,bγ||w||

s.t. yi(wxi+b)γ,i=1,2,...,N

可以取γ^=1

s.t. yi(wxi+b1)0,i=1,2,...,N

就推出了 凸二次规划的形式。

插入知识点:1.凸优化

minwf(w)

s.t.gi(w)0,i=1,2,...,k

s.t.hi(w)=0,i=1,2,...,l

其中,目标函数f(w)和约束函数gi(w)都是Rn上连续可微的凸函数,约束函数hi(w)Rn上的仿射函数。

2.拉格朗日对偶性

对于上面的凸优化问题,引入拉格朗日函数:

L(x,α,β)=f(x)+i=1kαigi(x)+j=1lβjhj(x)

其中αi,βi是拉格朗日乘子,αi0
θp(x)=maxα,β;αi0L(x,α,β)
则,若x违反原始问题约束,则可以取α+或者取β+,因此针对这些情况θp(x)为正无穷。相反的,若x遵循原始问题的约束,那么无论α,θ如何取值,由于乘以0,最后都是0,于是θp(x)=f(x)

θp(x)={f(x),x+

minxθp(x)=minxmaxα,β;αj0L(x,α,β)

与原问题等价。
原始问题和对偶问题:
maxminL(x,α,β)minmaxL(x,α,β)

特别的,对于凸优化问题,等式成立的充要条件是KKT条件。
这里写图片描述

继续:

根据刚才补充的知识,凸二次问题等价于拉格朗日对偶问题(满足KKT条件)。

L(w,α,β)=12||w||2i=1Nαiyi(wxi+b)+i=1Nαi

其中,α=(α1,α2,...,αN)T是拉格朗日乘子向量。
原始问题:maxminL(x,α,β)
对偶问题:minmaxL(x,α,β)

(1)求minw,bL(w,b,α)

Lw=wi=1Nαiyixi=0

w=i=1Nαiyixi

Lb=i=1Nαiyi=0

i=1Nαiyi=0

上面两个推论代入,得
L(w,b,α)=12i=1Nj=1Nαiαjyiyj(xixj)+i=1Nαi

0 0
原创粉丝点击