支持向量机之线性可分支持向量机(一)
来源:互联网 发布:sql视图添加数据 编辑:程序博客网 时间:2024/05/22 20:29
简介
支持向量机(support vector machines,SVM)是一种二分类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使得它有别于感知机;支持向量机还包括核技巧,这使得它成为实质上的非线性分类器。
支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划(convex quadratic programming)的问题,也等价于正则化的合页损失函数的最小化问题。支持向量机的学习算法是求解凸二次规划的最优算法。
支持向量机的方法包括:线性可分支持向量机(linear support vector machine in linearly)、线性支持向量机(linear support vector machine)以及非线性支持向量机(non-linear support vector machine)。上面三个方法由简到繁,简单模型是复制模型的基础,也是复杂模型的特殊情况。
当训练数据线性可分时,通过硬间隔最大化(hard margin maximization),学习一个线性的分类器,即线性可分支持向量机,又称硬间隔支持向量机;当训练数据近似线性可分时,通过软间隔最大化(soft margin maximization),学习一个线性的分类器,即线性支持向量机,又称软间隔支持向量机;当训练数据线性不可分时,通过核技巧(kernel trick)及软间隔最大化,学习非线性支持向量机。
当输入空间是欧式空间或者离散集合、特征空间为希尔伯特空间时,核函数(kernel function)表示将输入从输入空间映射到特征空间得到的特征向量之间的内积。通过使用核函数可以学习非线性支持向量机,等价于隐式地在高维的特征空间中学习线性支持向量机,这种方法称为核技巧。核方法(kernel method)是比支持向量机更为一般的机器学习方法。
线性可分支持向量机
对于 二分类问题。假设输入空间与特征空间为两个不同的空间,输入空间为欧氏空间或者离散集合,特征空间为欧氏空间或希尔伯特空间。线性可分支持向量机,线性支持向量机假设这两个空间的元素一一对于,并将输入空间中的输入映射为特征空间中的特征向量。非线性支持向量机利用一个从输入空间到特征空间的非线性映射将输入映射为特征向量。所有,输入都是由输入空间转换成特征空间,只需向量机的学习是在特征空间进行的。
假设给定一个特征空间上的训练数据集:
线性可分定义
对上面给的数据集,存在某个超平面
一般地,当训练数据集线性可分时,存在无穷多个超平面可将两类数据正确的分开。感知机利用误差分类最小的策略求得分离超平面,不过这个时候的解也是无穷多个。线性可分支持向量机利用间隔最大化求得分离最大化的最优分离超平面,这个解释唯一的。
线性可分支持向量机
给定线性可分训练数据集,通过硬间隔最大化或者等价的求解相应的凸二次规划问题学习得到的分离超平面为
如上图所示,对于特征向量是二维特征空间的二分类问题,训练数据集线性可分,存在超平面使数据集正确的分成两类。
函数间隔和几何间隔
对于一点距离分离超平面的远近可以表示分类预测的确信程度。在超平面
函数间隔
对于给定的训练数据集
定义超平面
函数间隔可以表示分类预测的正确性及确信度,但是选择分离超平面时,当
如上图,超平面
其中
若点
一般地,样本点
几何间隔
对于给定的训练数据集
定义超平面
定义超平面
函数间隔和几何间隔的关系:
当
间隔最大化
支持向量机学习的基本想法是:求解能够正确的划分训练数据集并且几何间隔最大的分离超平面。对于线性可分的训练数据集,线性可分的超平面有无穷多个,但是几何间隔最大的分离超平面式唯一的。这里的间隔最大化又称为硬间隔最大化。
间隔最大化的直观解释是:对训练数据集找到几何间隔最大的超平面意味着以充分大的确信度对训练数据集进行分类。也就是说,能够将正负样本点本开,对于难分的实例点,也能过以最大的确信度将它们分开。这样的超平面对于未知的新数据也能够很好的分类预测。
最大间隔分离超平面
几何间隔最大的分离超平面
转换成约束最优解问题:
即我们希望最大化超平面
改写成含有函数间隔的形式:
对于
线性可分支持向量机学习的最优化问题:
这是一个凸二次规划问题(convex quadratic programming)
凸优化问题
对于如下约束的最优化问题:
其中,目标函数
当目标函数
线性可分支持向量机学习算法–最大间隔法
输入:线性可分训练数据集
输入:间隔最大分离超平面和分类决策函数
(1)构建并求解约束最优化问题:
求得最优解
(2)分离超平面:
分类决策函数:
最大间隔分离超平面的存在唯一性
若训练集线性可分,则将训练数据集的样本点完全正确的分开的最大间隔分离超平面存在并且唯一。
(1)存在性
训练数据集线性可分–>约束问题存在可行解。
目标函数存在下界–>约束问题必有解
训练数据集中有正也有负+(0,b)不是最优的可行解
===>>>存在分离超平面
(2)唯一性
假设存在两个最优解
令
则:
k=1
则
设
得到
则
设
同上
则
所有
得证
支持向量和间隔边界
在线性可分情况下,训练数据集的样本点与分离超平面
也即:
也即:
对
对
如上图:
同时也发现
间隔依赖于分离超平面的法向量
- 支持向量机之线性可分支持向量机(一)
- 支持向量机(一)——线性可分支持向量机
- 线性可分支持向量机(一)
- 机器学习(7)——支持向量机(一):从感知机到线性可分支持向量机
- 支持向量机(二)线性可分支持向量机与硬间隔最大化
- 线性可分支持向量机
- 线性可分支持向量机笔记
- SVM笔记(三) 线性可分支持向量机
- 线性可分支持向量机(二)
- SVM(1)--线性可分支持向量机
- 统计学习方法笔记:支持向量机之线性可分支持向量机与硬间间隔最大化
- 支持向量机—线性可分支持向量机与硬间隔最大化
- 支持向量机 - 2 - 线性可分支持向量机与硬间隔最大化
- 支持向量机专题——线性可分支持向量机
- 机器学习(7)——支持向量机(二):线性可分支持向量机到非线性支持向量机
- 【机器学习基础】线性可分支持向量机
- 线性可分支持向量机对偶算法
- SVM再次总结 - 2 - 线性可分支持向量机
- 【C语言连载三】-----------运算符、Scanf函数
- 我的openwrt学习笔记(一):OpenWrt简介
- AltiumDesigner98——PCB中各层的作用
- 《Java设计模式》之责任链模式
- 【HDOJ 2089】不要62
- 支持向量机之线性可分支持向量机(一)
- UI导航控制器-----连载七
- 稳定排序和不稳定排序
- Timer用法
- Pots(POJ--3414
- 网络数据流量分析
- 【思维】poj3761Bubble Sort
- 串口之CreateFile 函数详解
- 堆排序、归并、快排、BSTree