程序博客网 > u盘修复软件

机器学习笔记（二）

来源：互联网发布：u盘修复软件编辑：程序博客网时间：2024/05/17 06:39

4.SVM

SVM（支持向量机）

包括：线性可分支持向量机（硬间隔最大化）；
线性支持向量机（近似线性可分，软间隔最大化）
非线性支持向量机（kernel trick）

如图所示的分类演示。代码来源：机器学习实战。
机器学习实战演示代码

图中圈出来的正是所谓的支持向量。SVM是一种决策机器，只提供分类的结果，并不提供后验概率。

补充一下（PRML）：分类问题划分为2个阶段，推断阶段和决策阶段。推断阶段，我们使用训练数据学习后验概率模型。决策阶段使用这些后验概率进行分类。还有一种方式，同时解决两个问题，简单学习一个函数，做判断。该函数又称为判别函数。
相应的直接使用判别函数的有很多缺点，而使用后验概率有一下优点（具体见PRML 1.5节）：
1、最小化风险。
2、拒绝选项
3、补偿先验概率

线性分类问题模型如：

y(x,w)=wTx+b(把b截距项拿出来)

假设空间是线性可分的，分离超平面 wTx+b=0（2维平面：w1x1+w2x2+b=0）

相应的决策函数f(x)=sign(wTx+b)，wTx+b>0去正例（y=+1），反之取负例（y=-1）。

如图很明显的，我们现在想让wTx+b=−1和wTx+b=1之间的距离最大化。

并且，对于所有的样本y(wTx+b)>=1（限制条件）。最小取1的点，即支持向量点。使分类效果更好，实际上是使两条平行线之间的距离最大，两平行线间的距离公式：即

l=|1−(−1)|||w||=2||w||

即转换成求w模的最小值。也是min12||w||2

分类间隔

引入拉格朗日函数，an>=0是拉格拉日乘子,限制条件y(wTx+b)>=1，根据拉格朗日对偶性，原问题的对偶问题是极大极小问题，即先求L(w,b,a)对w,b的极小值，再求对an的极大值。
步骤1
求极小：

L(w,b,a)=12||w||2+∑Nn=1an{y(wTx+b)−1}

令L(w,b,a)的导数为0 ，对我们要求的分界面参数，求导等于0，得到：

w=∑Nn=1anynxn

0=∑Nn=1anyn

代入原式。得到：

minw,bL(w,b,a)=−12∑Mm=1∑Nn=1amanymyn(xmxn)+∑Nn=1an

步骤2：求minw,bL(w,b,a)对a的极大值。注意限制条件：

0=∑Nn=1anyn
an>=0

具体推导，见统计学习方法。
常用SMO，算法来寻找a值。统计学习方法（P128）

0 0

u盘修复软件

u盘修复软件

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子歌莉娅属于什么档次歌莉娅的衣服怎么样歌丽娅 goelia 叶南弦沈蔓歌免费阅读50章蔓丽黛颜蔓丽黛颜化妆品价格表法国科丽蔓面膜怎么样歌行体歌行体的主要特点小丑表演是什么歌歌表演歌曲表演乐队表演表演唱遇见一场烟火的表演是什么歌遇见一场烟火的表演是哪首歌十九畏歌诀八会穴歌诀药性赋歌诀经络歌诀中药药性歌诀中医入门歌诀络穴歌诀历史歌诀中医歌诀通窍活血汤歌诀十二背俞穴歌诀中医方剂歌诀八脉交会歌诀中医内科歌诀龟形地歌诀针灸歌诀背诵方剂歌诀方歌和趣味速记大全十二原穴歌诀巧记频湖脉学歌诀中医入门必背歌诀中医必背口诀歌诀薏苡仁汤汤头歌诀上中下通用痛风方歌诀生长歌词