程序博客网 > java 判断紧急号码

支持向量机（SVM）（三）----核函数及正则化

来源：互联网发布：java 判断紧急号码编辑：程序博客网时间：2024/05/14 22:57

上一节最后我们说到我们根据求得的，可求得，，然后求出决策函数，但是我们知道：

是的函数，我们也许不必把带入上式来求解，我们直接把上式带入决策函数可有：

假如我们已经求得最优的，在作出预测的时候，我们可以只进行输入数据x与训练样本的内积即可。在转化为对偶条件的时候，我们知道要满足KKT条件，KKT条件中有一个是：

其中：

由此可以知道，若，则有函数间隔必然等于1，也就是说，只有支持向量满足，而不是支持向量的样本点，必然有。故而在计算下式的时候，我们只需考虑支持向量，而是支持向量的样本点有很少，所以这样会降低计算复杂度。这种形式也为引入核函数做出铺垫。

Kernels

我们上次最后说明了，如果遇到线性不可分的情况，根据现有的分类函数，可能解决不了，比如，下图（来源：知乎）

上图中的红点服从，蓝点服从，很明显红蓝点是不可分的，但是通过映射,将其映射到三维空间后，便有：

映射到三维空间之后，红蓝点变得线性可分了。核函数作用其实就是通过一个映射，把低维线性不可分的样本点，映射到高维中，使之变得线性可分。

吴恩达老师说，“原始”的输入我们称之为问题的属性，当“原始”输入经过映射得到一个新的集合，而这个集合传递给学习算法，这样的一个新的集合称之为特征。SVM的输入就是特征而不是原始的输入属性。当低维线性不可分的时候，我们把输入属性，映射到一个高维特征空间，并把映射后的特征作为新的输入，而新的决策函数，只是把原来的内积运算<x,z>简单替换为即可。而接下我们探讨这个核函数。

核函数定义为：

其中的为映射函数。

凭直觉来看，要求出，我们需要求出，然而要求代价是很大的，因为很难求得，另外当高维的维数很大的时候（这是很有可能的），我们的计算量也是很大的，这让我们很难承受，那么我们可不可以把的值在低维求出呢？

我们先看一个例子：

我们可以把上式写成如下的形式：

假如当N=3时，那么就是如下形式：

对于这个例子，我们在高维中计算的时间复杂度为，而在输入属性中计算，只需的时间，这样给了我们启发，对于高维中的内积，我们在低维中就可以解决。

对于kernel,我们有多项式kernel，Gaussian kernel等等，那么给定一个函数K，我们怎么知道他是不是有效的呢？也就是说对于所有的x,z是否存在一个映射，使得成立？

假如K是有效的，那么有，因此K一定是对称的。另外我们令表示向量的第k个坐标，对于任意向量z有：

这就说明了如果K是有效的，那么其对应的核矩阵就是半正定的。这是一个充分必要条件，也是Mercer定理。好了到此我们也说明了什么是核函数。下一节我们将继续上一节的话题，怎么样求解对偶问题的解。请看：

支持向量机(SVM)（四）----SMO

1 0

java 判断紧急号码

java 判断紧急号码

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子让右原则原则英语原则的意思原则是什么原则英文原则图片 smat原则四项基本原则四项基本原则内容秘书的潜原则四不放过原则原则是什么意思宪法基本原则行政法基本原则根本组织原则坚持四项原则民法基本原则宪法的基本原则过错责任原则静脉补钾原则四项基本原则包括选基金6个原则无过错责任原则四项基本原则包括哪些民法的基本原则党四项基本原则灰色搭配原则补钠原则及计算方法社会主义原则 midnights原则坚持四项基本原则质量管理八项原则社会主义根本原则我国宪法基本原则碱基互补配对原则转弯让直行三让原则 popo原创 popo原创集原创人生区晋江原创网晋江原创