《机器学习》阅读心得——六、支持向量机
来源:互联网 发布:凯云水利软件 编辑:程序博客网 时间:2024/05/17 00:16
- 六支持向量机
- 1 间隔与支持向量
- 2 核函数
- 3 软间隔与正则化
- 4 支持向量回归
- 六支持向量机
六、支持向量机
6.1 间隔与支持向量
给定训练样本集
其中
假定超平面可以将样本正确分类,即对于
如下图所示,距离超平面最近的这些训练样本使得上式的等号成立,它们被称为“支持向量”。两个异类支持向量到超平面的距离之和为
它被称为“间隔”。
支持向量与间隔
要找到具有最大间隔的超平面,需要找到符合条件的
当使用拉格朗日乘子法对式(6.5)进行求解后,可以得到式(6.5)的对偶问题如下:
其中
解出式(6.6)可以得出支持向量机的重要性质:训练完成后,大部分的训练样本都不需要保留,最终模型仅与支持向量有关。
6.2 核函数
当训练样本不是线性可分的,如“异或”问题,可将样本从当前空间映射到一个更高维的特征空间,使得样本在这个空间中线性可分。如果原始空间是有限维,那么一定存在一个合适的高维特征空间使得样本可分。
令
类似式(6.5),可以得到
该式的对偶问题是
由于高维空间的维度可能很大,直接计算
由此,式(6.9)可以进行简化,进行求解后可以得到
该式显示模型最优解可以通过训练样本的核函数展开,这个式子也被称为“支持向量展式”。只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用。核函数的选择对于支持向量机的性能非常重要,如果核函数选择不合适,很可能导致支持向量机性能不佳。
6.3 软间隔与正则化
在现实任务中,往往很难确定合适的核函数使得训练样本在特征空间中线性可分,退一步说,即使找到了核函数使得训练集线性可分,也很难断定这个结果是不是由于过拟合造成的。
缓解该问题的一个方法是允许支持向量机在一些样本上出错,即允许一部分样本不满足约束
在最大化间隔的同时,不满足约束的样本应当尽可能少,所以优化目标可以写为
其中C>0是一个常数,
由于
当我们采用hinge函数进行求解后可知,此时软间隔向量机的最终模型仅与支持向量有关,即仍保持了稀疏性。一般地,当我们用别的函数替换0/1损失函数时,可以得到一个通用的目标公式
其中
6.4 支持向量回归
给定训练样本
于是,SVR问题可化为
其中C为正则化常数,
引入拉格朗日乘子法可解得SVR的支持向量是落在
其中
阅读全文
0 0
- 《机器学习》阅读心得——六、支持向量机
- 机器学习练习(六)—— 支持向量机
- 机器学习笔记(六)支持向量机
- 机器学习(六):黑箱方法——神经网络和支持向量机
- 机器学习(六)支持向量机svm初级篇
- 机器学习(六)支持向量机svm初级篇
- 机器学习之支持向量机(六)
- 监督学习之再聊支持向量机——Andrew Ng机器学习笔记(六)
- 机器学习教程 之 支持向量机:模型篇1—支持向量与间隔
- 机器学习——支持向量机support vector machine
- 斯坦福大学机器学习——支持向量机(1)
- 斯坦福大学机器学习——支持向量机(2)
- 斯坦福大学机器学习——支持向量机(3)
- 机器学习实战——第六章:支持向量机
- 机器学习——svm支持向量机的原理
- 机器学习——支持向量机(SVM)
- 机器学习——支持向量机SVM
- 机器学习基础——支持向量机
- 231. Power of Two
- POJ
- HDU-1398-Square Coins(完全背包)
- Oulipo 、Power Strings (KMP入门)
- 几行代码搞定Android底部导航栏
- 《机器学习》阅读心得——六、支持向量机
- php语言实现tcpip协议
- IaaS、Paas、Saas
- C语言基础之字符串
- socket并发编程博客推荐
- 使用迅雷下载百度云上文件
- FPGA错误总结
- POJ 2104 K-th Number
- java map集合遍历