SVM python3的实现

来源：互联网发布：微博营销数据分析编辑：程序博客网时间：2024/06/07 01:39

线性可分SVM硬间隔最大化
- 1 最大间隔法
- 2 算法72
线性支持向量机
非线性支持向量机
序列最小最优化算法SMO

SVM从简单到复杂分为三类模型：线性可分SVM、线性SVM、非线性SVM。各模型用到的关键知识点如下：

线性可分SVM：硬间隔最大化
线性SVM：软间隔最大化
非线性SVM：软间隔最大化和核技巧
本文参照李航博士的《统计学习方法》。

1. 线性可分SVM：硬间隔最大化

1.1 最大间隔法

P100 算法7.1 线性可分SVM学习算法——最大间隔法
（1）构造并求解约束最优化问题：

min w, b 1 2 | | w | | 2

s.t. y i (w \cdot x i + b) - 1 \geq 0

（2）求最优解

w∗,b∗。从而得到分类决策函数：

f(x)=sign(w∗⋅x+b)

为了求解最优解w∗,b∗，应用拉格朗日对偶性，通过求解对偶问题得到最优解，这就是线性可分支持向量机的对偶算法。拉格朗日对偶性引进了α，推导可看书103-106页，这里直接写结果：

1.2 算法7.2

算法7.2 线性可分支持向量机学习算法
（1）构造并求解约束最优化问题：

min α 1 2 \sum i = 1 N \sum i = 1 N α i α j y i y j (x i \cdot x j) - \sum i = 1 N α i

s.t. \sum i = 1 N α i y i = 0, α i \geq 0, i = 1, 2, . . ., N

求最优解

α∗=(α∗1,α∗2,...,α∗N)。
（2）然后计算

w∗和

b∗。

2 线性支持向量机

引进松弛变量ξ≥0，使函数间隔加上松弛变量大于等于1，约束条件变为yi(w⋅xi+b)≥1−ξi，再加一个惩罚参数C>0，则目标函数变为：

min w, b 1 2 | | w | | 2 + C \sum i = 1 N ξ i

转化为对偶问题为：

min α 1 2 \sum i = 1 N \sum i = 1 N α i α j y i y j (x i \cdot x j) - \sum i = 1 N α i

s.t. \sum i = 1 N α i y i = 0, 0 \leq α i \leq C, i = 1, 2, . . ., N

3 非线性支持向量机

（1）构造并求解约束最优化问题：

min α 1 2 \sum i = 1 N \sum i = 1 N α i α j y i y j K (x i ， x j) - \sum i = 1 N α i

s.t. \sum i = 1 N α i y i = 0, 0 \leq α i \leq C, i = 1, 2, . . ., N

（2）求

b * = y j - \sum i = 1 N α * i y i K (x i \cdot x j)

（3）构造决策函数：

f (x) = sign (\sum i = 1 N α * i y i K (x \cdot x i) + b *)

4 序列最小最优化算法(SMO)

从以上问题看到，支持向量机的学习问题可以形式化为求解凸二次规划问题。在python中，求解二次规划可用cvxopt包，可以看下这里的简单介绍，但是只说了使用方法，好像没介绍原理。还有是一份使用cvxopt的svm代码。

以上是背景。本文使用python，除了基本的numpy和matplotlib之外不用其它包。使用SMO算法求解二次规划问题。
SMO算法包括：求解两个变量（设为α1和α2）二次规划的解析方法和选择变量的启发式算法。算法流程如下：
（1）初始化参数。
（2）选择第1个变量α1。怎么选择呢？首先观察一下KKT条件：

α i = 0 ⟺ y i g (x i) \geq 1

0 < α i < C ⟺ y i g (x i) = 1

α i = C ⟺ y i g (x i) \leq 1

g (x i) = \sum j = 1 N α j y j K (x i, x j) + b

从上面三个条件可以得出，当

0<αi<C，样本点

(xi,yi)在间隔边界上。
因此，首先遍历在

间隔边界上的支持向量点，选择违反KKT条件最严重的样本点

(xi,yi)，将其对应的变量

αi作为第1个变量。如果这些样本点都满足KKT条件，那么遍历整个训练集，看其它的训练点是否满足KKT条件。
（3）选择

α1之后，要寻找第二个变量

α2，使

|E1−E2|最大，其中

Ei=g(xi)−yi，表示预测值和真实值的误差。为了节省计算时间，将所有的

Ei值保存在一个列表里面，

Ei的初始值为0，并用0和1标记是否更新过。

//最后贴个根据李航的《统计学习方法》写的python3 程序吧。

阅读全文

0 1