机器学习模型LaTeX公式版：支持向量机

来源：互联网发布：windows安全模式进不了编辑：程序博客网时间：2024/06/02 01:30

训练数据集

其中，，为第个特征向量（实例），为第的类标记，当时，称为正例；当时，称为负例，称为样本点。
线性可分支持向量机（硬间隔支持向量机）：给定线性可分训练数据集，通过间隔最大化或等价地求解相应地凸二次规划问题学习得到分离超平面为

以及相应的分类决策函数

称为线型可分支持向量机。
超平面关于样本点的函数间隔为

超平面关于训练集的函数间隔

即超平面关于训练集中所有样本点的函数间隔的最小值。
超平面关于样本点的几何间隔为

超平面关于训练集的几何间隔

函数间隔和几何间隔的关系

最大间隔分离超平面等价为求解

等价的

等价的

线性可分支持向量机学习算法（最大间隔法）：
输入：线性可分训练数据集，其中
输出：最大间隔分离超平面和分类决策函数
1. 构建并求解约束最优化问题

求得最优解。
2. 得到分离超平面

以及分类决策函数

（硬间隔）支持向量：训练数据集的样本点中与分离超平面距离最近的样本点的实例，即使约束条件等号成立的样本点

对的正例点，支持向量在超平面

对的正例点，支持向量在超平面

和称为间隔边界。
和之间的距离称为间隔，且。
最优化问题的求解：
1. 引入拉格朗日乘子构建拉格朗日函数

其中，为拉格朗日乘子向量。
2. 求:

得

代入拉格朗日函数，得

即

3.求:

等价的

线性可分支持向量机（硬间隔支持向量机）学习算法：
输入：线性可分训练数据集，其中
输出：最大间隔分离超平面和分类决策函数
1. 构建并求解约束最优化问题

求得最优解。
2. 计算

并选择的一个正分量，计算

3. 得到分离超平面

以及分类决策函数

线性支持向量机（软间隔支持向量机）：给定线性不可分训练数据集，通过求解凸二次规划问题

学习得到分离超平面为

以及相应的分类决策函数

称为线型支持向量机。
最优化问题的求解：
1. 引入拉格朗日乘子构建拉格朗日函数

其中，以及为拉格朗日乘子向量。
2. 求:

得

代入拉格朗日函数，得

即

3.求:

等价的

线性支持向量机（软间隔支持向量机）学习算法：
输入：训练数据集，其中
输出：最大间隔分离超平面和分类决策函数
1. 选择惩罚参数，构建并求解约束最优化问题

求得最优解。
2. 计算

并选择的一个分量，计算

3. 得到分离超平面

以及分类决策函数

（软间隔）支持向量：线性不可分情况下，最优化问题的解中对应于的样本点的实例。
实例的几何间隔

且
则实例到间隔边界的距离

线性支持向量机（软间隔）的合页损失函数

其中，“＋”为取正函数

核函数
设是输入空间（欧氏空间的子集或离散集合），是特征空间（希尔伯特空间），如果存在一个从到的映射

使得对所有，函数满足条件

则称为核函数，为映射函数，式中为和的内积。
常用核函数：
1. 多项式核函数

2. 高斯核函数

非线性支持向量机：从非线性分类训练集，通过核函数与软间隔最大化，学习得到分类决策函数

称为非线性支持向量机，是正定核函数。
非线性支持向量机学习算法：
输入：训练数据集，其中
输出：分类决策函数
1. 选择适当的核函数和惩罚参数，构建并求解约束最优化问题

求得最优解。
2. 计算

并选择的一个分量，计算

3. 得到分离超平面

以及分类决策函数

序列最小最优化（sequential minimal optimization，SMO）算法要解如下凸二次规划的对偶问题：

选择两个变量，其他变量是固定的，SMO的最优化问题的子问题

其中，是常数，且省略了不含的常数项。
设凸二次规划的对偶问题的初始可行解为，最优解为，且在沿着约束方向未经剪辑时的最优解为。
由于需要满足，所以最优解的取值范围需满足

其中，L与H是所在的对角线段断点的界。
如果，则

如果，则

记

令

则

由于，可将表示为

代入，得

对求导

令其为0，得

将代入，得

令代入，得

经剪辑后

由于及
则

由分量，则

由

则

代入，得

同理，得

如果满足，
则

否则

更新

其中，是所有支持向量的集合。
SMO算法：
输入：训练数据集，其中，精度；
输出：近似解
1. 取初始值，令；
2. 选取优化变量，求解

求得最优解，更新为；
3. 若在精度范围内满足停机条件

则转4.；否则令，转2.；
4.取。

0 0