一个关于Perceptron 的C++程序part1

来源：互联网发布：unity3d vr抗锯齿编辑：程序博客网时间：2024/06/16 03:13

PerceptronA basic single layer perceptron。

在看程序之前，首先看看Perceptron的含义。

perceptron(感知器)就是一个学习一个binary classifier的算法。实质上，就是一个将输入的x(a real-valued vector )映射为f(x)值的函数：

NOTE：参见深度学习1的介绍。

下面做出如下解释：

函数f(x)的值（非0即1）(根据样本的特征向量x计算函数值），对样本x 进行分类。若b 为负值，那么输入各维特征的加权和只有大于 $|b|$ ，才能使得我们的Perceptron计算的加权和大于0，使得我们的样本归为正样本。改变bias b的值，我们的decision boundary （方程为 w x + b = 0）也会发生平移改变。这是显而易见的。

但是，如果我们的学习训练样本不是线性可分的，那么我们的Perceptron 永远无法达到对所有的样本正确分类的时候。因为一个线性的decision boudary(超平面) 不可能完全将一个线性不可分的（non-linear separable）样本集分开。perceptron 算法无法解决的一个典型线性不可分的问题就是异或问题。

在神经网络中， percetron 就是使用Heaviside step function 作为激活函数（activation function）。 perceptron algorithm 常常也被称作single-layer perceptron, 以便和multilayer perceptron 算法做出区别。作为一个线性分类器， single-layer Perceptron 是最简单的feedforward neural network(前馈神经网络)。

下面我们介绍关于single-layer Perceptron的学习算法。当然，当函数是非线性的，而且可微的时候，我们也可以使用dela rule 解决 single-layer perceptron.。（当然，对于具有hidden layer 的multi-layer perceptrons, 下面的算法就不合适了。此时必须用更加sophisticated 算法诸如BP算法。） Anyway, 这里介绍下面的一种。

在开始之前，首先preprocessing, 定义如下变量：

代表对 $y = f(\mathbf{z}) \,$ 于一个 input vector $\mathbf{z}$ 输入时的输出
$b \,$ 定义为bias 项，在下面，我们设定为0
$D = \{(\mathbf{x}_1,d_1),\dots,(\mathbf{x}_s,d_s)\} \,$ 为s个训练样本集合,其中: (1) $\mathbf{x}_j$ 为一个 $n$ -dimensional input vector