SVM 一气呵成
来源:互联网 发布:宝利通mcu服务器软件 编辑:程序博客网 时间:2024/04/28 13:18
阅读本文前,需要对机器学习有一定的了解,本文仅对SVM基本理论做一个梳理。
1 引入
机器学习一个最根本的任务就是分类,而分类问题中大多数又属于二分类问题,其最简单直接的描述方式如下:
给定一训练集 T,形如
和一个算法 A, 形如
当运行
为了能很好的理解SVM,先简单介绍一下感知机。如果把训练集用几何来表示,对于二维训练
如果能找到一条直线L,将二维平面划分成两部分,处于上半平面的属于一种类别,记为+1类,下半平面的又属于一种类别,记为-1类,那么就说该数据集线性可分。基本的感知机首先假设数据集线性可分,也就是说对于训练集T,能找到一个n-1 维的空间(也就是n维空间的超平面),将数据集完全划分开来。然后再去寻找这个超平面,感知机的思想是只要找到一个超平面即可,拿二维空间来说,为了找到一条直线划分训练集,存在无穷多条直线完成这个任务,那么,选哪一个好呢?在感知机中,这个超平面直接与最初的参数有关,虽然感知机将线性可分的数据集完全分开了,也就是说训练误差可以减小到0,但是它对于未知数据的分类能力未必就好。而机器学习往往需要的就是这种对未知数据的预测能力,而不在于对已知数据的拟合能力。
2 优化模型建立
基于上述原因,SVM被发展起来,在感知机的基础上进一步思考,既然已经可以找到一个超平面将线性可分的数据集完全分开,那么能不能找到一个超平面,它不仅可以将数据集分开,而且对于未知数据的也有较好的预测能力呢?
答案是肯定的。为了完成这个目标,我们假设数据点到超平面
显然,如果改变超平面
当然,上面的优化问题是不能直接优化的。但是我们可以通过等效的数学手段进行处理,使得它变成易于优化的形式。
首先,
进一步,对于内层的优化
这个等效的最优化问题更加容易进行数学处理,不过发现,
到了这里,实际上原始最优化问题的这个等价形式依然不能直接求解,不过,现在只需要简单的等价变换,就可以让其变得可以求解,
借助于现有的二次规划求解包,就可以求解该问题,但是当数据规模很大的时候,这个问题还是不易求解,优化时间甚至难以接受。需要继续处理上述优化问题,使得其更加易于求解。
3
此笔记未完待续…..
不足之处,欢迎批评指正。
reference:
统计学习方法/李航
- SVM 一气呵成
- 一气呵成
- 文章要一气呵成
- 编写博客代码一气呵成对不对
- 一气呵成编完代码的感觉对不对
- 第一个只看思路一气呵成的结果
- SVM
- SVM
- SVM
- svm
- svm
- svm
- svm
- SVM
- SVM
- SVM
- SVM
- svm
- LeetCode 526 Beautiful Arrangement
- MVC框架-Mentawai(2)
- Android Studio
- 5.head常用标签
- 网络端口分类
- SVM 一气呵成
- 后门工具dbd
- OSG+VS2010+win7环境搭建
- LeetCode 401 Binary Watch
- ASP.NET MVC 4使用PagedList.Mvc分页
- matplotlib subplots 调整子图间矩
- 《最长的一帧》理解
- 6.H5标签
- ASP.NET MVC动作过滤器