反向传播算法(过程及公式推导)
来源:互联网 发布:云南省扶贫大数据平台 编辑:程序博客网 时间:2024/06/05 20:11
反向传播算法(Backpropagation)是目前用来训练人工神经网络(Artificial Neural Network,ANN)的最常用且最有效的算法。其主要思想是:
(1)将训练集数据输入到ANN的输入层,经过隐藏层,最后达到输出层并输出结果,这是ANN的前向传播过程;
(2)由于ANN的输出结果与实际结果有误差,则计算估计值与实际值之间的误差,并将该误差从输出层向隐藏层反向传播,直至传播到输入层;
(3)在反向传播的过程中,根据误差调整各种参数的值;不断迭代上述过程,直至收敛。
反向传播算法的思想比较容易理解,但具体的公式则要一步步推导,因此本文着重介绍公式的推导过程。
1. 变量定义
上图是一个三层人工神经网络,layer1至layer3分别是输入层、隐藏层和输出层。如图,先定义一些变量:
表示第层的第个神经元连接到第层的第个神经元的权重;
表示第层的第个神经元的偏置;
表示第层的第个神经元的输入,即:
表示第层的第个神经元的输出,即:
其中表示激活函数。
2. 代价函数
代价函数被用来计算ANN输出值与实际值之间的误差。常用的代价函数是二次代价函数(Quadratic cost function):
其中,表示输入的样本,表示实际的分类,表示预测的输出,表示神经网络的最大层数。
3. 公式及其推导
本节将介绍反向传播算法用到的4个公式,并进行推导。如果不想了解公式推导过程,请直接看第4节的算法步骤。
首先,将第层第个神经元中产生的错误(即实际值与预测值之间的误差)定义为:
本文将以一个输入样本为例进行说明,此时代价函数表示为:
公式1(计算最后一层神经网络产生的错误):
其中,表示Hadamard乘积,用于矩阵或向量之间点对点的乘法运算。公式1的推导过程如下:
公式2(由后往前,计算每一层神经网络产生的错误):
推导过程:
公式3(计算权重的梯度):
推导过程:
公式4(计算偏置的梯度):
推导过程:
4. 反向传播算法伪代码
- 输入训练集
- 对于训练集中的每个样本x,设置输入层(Input layer)对应的激活值:
- 前向传播:
,
- 计算输出层产生的错误:
- 反向传播错误:
- 使用梯度下降(gradient descent),训练参数:
0 0
- 反向传播算法(过程及公式推导)
- 反向传播算法(过程及公式推导)
- 反向传播算法(过程及公式推导)
- 反向传播算法(过程及公式推导)
- 反向传播算法(过程及公式推导)
- 反向传播算法(过程及公式推导)
- 反向传播算法的公式推导(BP算法)
- 经典反向传播算法公式详细推导
- 反向传播算法公式的推导
- 手写,纯享版反向传播算法公式推导
- 神经网络反向传播算法公式推导详解
- 前馈神经网络与反向传播算法(推导过程)
- 反向传播及softmax算法推导
- CNN反向传播公式推导
- CNN反向传播公式推导
- 反向传播算法推导
- BP神经网络,BP推导过程,反向传播算法,误差反向传播,梯度下降,权值阈值更新推导,隐含层权重更新公式
- 卷积神经网络(CNN)反向传播算法公式详细推导
- 聊聊架构(2)
- 读书笔记《Effective C++》条款09:绝不在构造和析构过程中调用virtual函数
- android 串口通讯
- Canvas之drawPath
- JSF学习--JSF2组件与Tomcat9.*容器兼容的配置问题
- 反向传播算法(过程及公式推导)
- Easy-24
- react demo5 (自定义react复合组件)
- 设计模式中关系在代码中的体现
- Java字符串排序(低位优先排序,高位优先排序)
- {福利}C++初学
- Myeclipse2016如何关掉浏览器小菜单
- [Java] 的四种引用,强弱软虚,用到的场景
- 【笔记】Linux网络配置及远程连接