#支持向量机(SVM)与其理论发展(1)
来源:互联网 发布:mac air使用教程视频 编辑:程序博客网 时间:2024/05/16 09:55
支持向量机(SVM)与其理论发展(1)
写作原因:
接触到支持向量机理论推导的一些问题,去查看了一下资料发现其中的内容并不简单,于是希望能在这里整理一下自己学习的内容,力求在数学上完善。自编自写,错误难免,欢迎交流~
0.简介
支持向量机(support vector machines)是一种有名的二分类模型,在简单的感知机的基础上,支持向量机要求所谓间隔最大,再进一步加上核技巧,这使得它进一步变为非线性分类器。
支持向量机的学习策略就是“间隔”的最大化,经过数学变形可以化为一个凸二次线性规划的求解问题。
一.起点:线性可分支持向量机
1.notation
- 给定的训练集
T={(x1,y1),(x2,y2),(x3,y3),⋯,(xN,yN)} , 其中xi∈Rn,yi∈{−1,+1}, i=1,2,⋯,N 。即赋予正负两类的数据。 w⋅x+b=0 : 给定超平面,(w,b) 分别是其法向量和截距。- 函数间隔
γi^=yi(w⋅xi+b) 。 - 几何间隔
γi=yi(w⋅xi+b)∥w∥=γi^/∥w∥ 。容易知道几何间隔,在点被正确分类的时候,就是数据点到超平面的距离,否则是距离的负数。
2.间隔最大化
(1)优化问题的数学表式
支持向量机的想法是,对于线性可分的数据集,希望分割的超平面距离样本点的最短距离尽可能的大,也就是
(称之为原优化问题)
或者说
我们注意到,
考虑如下的优化
不难发现,约束条件直接不允许
接下来我们表明该优化和原优化的“等价的”:
- 如果该优化有最有解,那么意味着原优化有最优解:设
- 再者,如果原问题有最优解
当然,有一个更加直接的方法:
对给定的正确分类的超平面,选取参数
显然对上面的优化有等价形式:
我们将它记为优化问题P。
(2)最优解的存在唯一性
P的可行域显然是一个凸集并且是一个闭集。不妨选取一个可行的
- 由于
对于唯一性,假设存在两个最优解
不难发现
由于最优,所以
考虑
- P的最有解是唯一的(或原问题最优解在几何意义上是唯一的)
(3)支持向量机叫法的由来
我们根据上面的推导得出了对于线性可分数据集对应的唯一超平面,同时得到的一个几何间隔
(网络图片,侵删)
也是入门自学,不足之处请多指点
之后会整理:拉格朗日对偶,仍然希望能够保持推导的完整。
太晚了今天不写了。。。
个人博客,请勿转载
- #支持向量机(SVM)与其理论发展(1)
- 支持向量机(SVM)与其理论发展(2):对偶学习
- 【SVM理论到实践1】SVM支持向量机的简介
- 支持向量机SVM(1)
- 支持向量机SVM
- SVM支持向量机
- svm支持向量机
- SVM支持向量机
- [SVM]支持向量机
- SVM 支持向量机
- 支持向量机SVM
- SVM 支持向量机
- svm支持向量机
- 支持向量机SVM
- svm支持向量机
- SVM (支持向量机)
- SVM支持向量机
- SVM支持向量机
- Spring核心原理AOP
- windows部署项目到服务器,文件名中文乱码
- Java 类的生命周期
- mybatis入门实战之CRUD
- python爬取糗事百科
- #支持向量机(SVM)与其理论发展(1)
- MySQL 5.7 EXPLAIN EXTENDED语句说明
- 次小生成树
- debug有感
- Python网络爬虫1
- vue.js 2.0实现的简单分页
- React实现按钮控制倒计时
- 基于vue2.0的一个分页组件
- dns-prefetch对网站速度能提升有多少?详解dns-prefetch