核方法原理

来源：互联网发布：android软件开发项目编辑：程序博客网时间：2024/05/18 00:26

核方法原理

转载自：http://blog.csdn.net/ice110956/article/details/20450797

1.无力的线性分类器

一般情况下，我们考虑构造一个线性分类器来解决问题。但是实际中，线性分类器的效果达不到要求，因为大部分数据都不是线性可分的，如下面这幅图。一种改进的方法是把多个弱的线性分类器组合得到一个强分类器，如决策树，booting方法；另一个种方法就是接下来要说的高维投影。

2.高维线性可分

如果某个分类问题线性不可分，那么我们可以考虑把样本投影到非线性的高维空间上，从而实现高维可分。R（低维）->F（高维）。如下图。

3.高维计算的维数灾难

上面的映射会大大增加计算复杂度，因为投影需要计算复杂度，维数增加后再分类也要增加计算复杂度。

4.巧妙的核技巧（kernel trick）

有人发现了一些函数的特性，设为K（x,y）。有人发现，K（x,y）=<φ(x)* φ(y)>，也就是低维的函数（K（x,y）），可以得到高维空间的内积（<φ(x)* φ(y)>）。而如果内积<φ(x)* φ(y)>是我们投影到高维后，构造分类器所需要的主要计算，显然，我们只要在低维空间计算K（x,y）。通常情况下，K的计算复杂度会大大小于高维内积<φ(x)* φ(y)>。

以简单的线性核函数为例子阐述如下：