什么是神经网络

来源：互联网发布：软件使用许可费编辑：程序博客网时间：2024/06/13 23:05

本文结构：

神经网络就是按照一定规则将多个神经元连接起来的网络

例如全连接(full connected, FC)神经网络，它的规则包括：

不同的神经网络，具有不同的连接规则

神经元和感知器的区别也是在激活函数：
感知器，它的激活函数是阶跃函数，神经元，激活函数往往选择为 sigmoid 函数或 tanh 函数等

其中 sigmoid 函数的公式和图表示如下：

sigmoid 函数的求导公式：

想了解更多还可以看这篇：常用激活函数比较

先向前计算，再向后传播

例如上面神经网络的结构

输入层，首先将输入向量的每个元素的值，赋给输入层的对应神经元

隐藏层，前一层传递过来的输入值，加权求和后，再输入到激活函数中，根据如下公式，向前计算这一层的每个神经元的值

输出层的计算和隐藏层的一样

用矩阵来表示

这个公式适用于每个隐藏层和输出层，就是 W 的值和 f 的形式会不一样，
其中 W 是某一层的权重矩阵，x 是某层的输入向量，a 是某层的输出向量

模型要学习的东西就 W。

诸如神经网络的连接方式、网络的层数、每层的节点数这些参数，不是学习出来的，而是人为事先设置的，称之为超参数。

训练它们的方法和前面感知器中用到的一样，就是要用梯度下降算法：

完整的推导可以看这篇，一步一步很详细：
手写，纯享版反向传播算法公式推导

part 4. 代码实现下次再写

学习资料：
https://www.zybuluo.com/hanbingtao/note/476663

推荐阅读
历史技术博文链接汇总
也许可以找到你想要的

0 1