程序博客网 > 淘宝非标品类目

【斯坦福---机器学习】复习笔记之顺序最小优化算法

来源：互联网发布：淘宝非标品类目编辑：程序博客网时间：2024/06/01 10:39

本讲大纲：

1.核（kernels）
2.软边界（soft margin）
3.SMO算法（SMO algorithm）

1.核

属性（attributes）:原始的输入值（房价的例子中，x，住房的面积）
特征（features）：由原始数据映射的一些数据
用这里写图片描述来表示特征映射，例如：

用代替x.
定义核为：
是很容易计算的，即使计算的代价很大（高维向量）. 在这种设定中，在算法中用一个很高效的方法计算，我们可以让SVM在高维特征中学习，而不用显示的表示出这里写图片描述 .

假设这里写图片描述，

可以写成，
以n=3为例，

直观上来说，如果这里写图片描述和很近，我们可能认为很大，相反，如果很远–几近正交，则很小. 因此，我们可以认为可以看作是和相似度的一种测量. 例如，或许选择，，这是一种合理的测量方法，当x和z很近时值接近于1，很远时值接近0. 在特定的例子中是可以作为SVM的核的. （这个核叫做高斯核 Gaussian kernel,映射到一个无限维的特征）

定理（Mercer）:给定K，这里写图片描述是给定的，对于一个确定的核，它的充分必要条件是相应的核矩阵式对称半正定的.

利用核的例子：
数字的识别,分类字符

2.软边界

正则化和不可分的例子（regularization and the non-separable case）
到目前为止，我们讨论SVM时认为数据是线性可分的, 把数据映射到高维空间一般会增加线性可分的可能性，但是我们不能保证一定可以.

左图显示的是一个最优间隔分类器，但是如果在左上区域加上一个异常值，决定边界线会发生剧烈的变化，
导致分类器有更小的边界.
这里写图片描述

为了使算法能够处理非线性可分的数据集并且对异常值不会这么敏感, 修订优化问题如下：
这里写图片描述

因此，样本现在允许边界小于1.

3.SMO算法

SMO（sequential minimal optimization）算法起源于SVM, John Platt起初了一个高效解决对偶问题的方法.

坐标上升（Coordinate ascend）
对于没有限制的优化问题：
这里写图片描述，除了用梯度上升和牛顿方法，还能使用坐标上升算法：

下图是坐标上升执行的一个过程：

这是我们要解决的对偶问题：
这里写图片描述

这里不能直接使用坐标上升算法，因此（19）的限制. 因此我们至少要同时改变两个才能满足限制. 因此：
这里写图片描述

SMO算法之所以高效是能够很高效的计算出ai,aj.

以改变a1,a2为例，这里写图片描述（常数），a1、a2的限制如下图所示：

得到：

之后计算出a1的值.

0 0

淘宝非标品类目

淘宝非标品类目

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子 byd速锐多少钱比亚迪速锐1.5t 锐陆轮胎比亚迪速锐多少钱比亚迪速锐vvl多少钱锐3 比亚迪速锐报价纳智捷锐3 byd速锐报价比亚迪速锐论坛比亚迪速锐买了后悔速锐报价速锐论坛速锐油耗 2015款速锐迪车会速锐论坛速锐发动机真不行锐速改装速锐速锐改装比亚迪速锐油耗比亚迪速比亚迪速锐销量比亚迪速悦比亚迪速锐遥控驾驶 byd速锐2016款怎么样 4g降速速降速降山地车 5g出来4g会降速吗流量降速降速电脑风扇降速流量降速什么意思极限速降速降绳索速降山地车价格移动降速后网速怎么样笔记本风扇降速 4g降速后有多慢二手速降山地车