机器学习之SVM简介

来源：互联网发布：2级钢筋弯勾算法编辑：程序博客网时间：2024/06/04 17:58

综述

在深度学习（2012）出现之前，SVM是ml算法中最优秀的算法。
支持向量机，本质是个分类器。核技巧+间隔最大
当间隔最大的时候，他的泛化能力是最强的，鲁棒性最高。

支持向量：和超平面平行的保持一定的函数距离的这两个超平面对应的向量，我们定义为支持向量
支持向量机：寻找支持向量的算法，并利用支持向量来寻找分界线的算法

算法的主要过程就是要求解超平面，超平面具有如下性质：

主要需要考量的是如何让距离最大，这里从向量的角度考虑
这些超平面可以由方程族描述：
$这里写图片描述$
$这里写图片描述$

两个支持向量之间的距离是
$这里写图片描述$
我们要寻找的是间隔最小的，也就是|w|要最大，这样最终转化成一个方程：
$这里写图片描述$
就是求解条件极值的方程，一个带有约束条件的最小极值方程。高数里面可以用拉格朗日方法求解
这个方程也就是SVM的基本型

训练集的最大间隔超平面是存在且唯一的。

当样本数据不是线性可分的时候，如何处理？
这里引入核函数的概念

当样本不是线性可分的时候，需要用到核函数，核函数的目的是将所有的样本转换成可划分的。通过对样本数据的转换，构造出一条直线划分原来的样本。

最关键的就是找到合适的映射。如何找到？没有系统的方法，需要考量数据格式，业务需要等，经验积累。一般来说，径向基函数/高斯核（rbf）效果大部分情况下还行。核函数也可以自己定义。如果需要具体操作，还需要另寻他法。

核函数是SVM的精华，如何选择合理的核函数，对于SVM的性能有着至关重要的影响。

核函数的选择对于性能的提升有着极为重要的作用。

libsvm
核函数的选择
凸优化问题

0 0