lstm的数学推导
来源:互联网 发布:apache 安装 编辑:程序博客网 时间:2024/04/27 01:18
本文是根据以下三篇文章整理的LSTM推导过程,公式都源于文章,只是一些比较概念性的东西,要coding的话还要自己去吃透以下文章。
前向传播:
1、计算三个gate(in, out, forget)的输入和cell的输入:
2、计算上述各个gate和cell的激活值:
3、假定该网络为一个标准的三层结构(如下图所示),即一个输入层,一个隐层和一个输出层。则对于一个输出单元,我们可以按下述的方式计算它的输入和激活值。其中m为所有与该输出单元连接的单元(包括输入层的和隐层的)。
4、计算当前时间点对应状态对input gate和、forget gate以及cell的偏导数。这里跟CNN不一样,CNN前向只是求值,没有传递梯度。但对于lstm,由于内部状态的改变依赖前一时间点的状态,因此内部状态的参数也会把错误传递到网络下一层,因此前向也涉及到梯度传递。
后向传播:
1、对于每个输出单元(output unit),我们可以计算它的 输出错误如下,其中
2、接下来计算每个输出单元的残差,这里的计算和CNN是一样的,就是对该层网络求导。
3、输出output gate的残差计算方式和output unit类似。(output unit只针对每一个小单元的权重,而output gate针对的是所有output unit连接到输出层的权重)
4、第2和第3条针对的是外部残差,内部残差(包括input gate, forget gate和cell)计算方式如下:
5、最后,根据残差更新各个参数(weight),注意外部和内部的表达式不一样,具体推导见原文。
1).output unit:
2).output gate:
3).input gate:
4).forget gate:
5).cell:
- lstm的数学推导
- lstm的数学推导
- LSTM简介以及数学推导(FULL BPTT)
- LSTM简介以及数学推导(FULL BPTT)
- LSTM简介以及数学推导(FULL BPTT)
- LSTM的公式推导详解
- LSTM中BPTT的推导
- LSTM的公式推导详解
- LSTM的公式推导详解
- LSTM中的推导(LATEX写的)
- LSTM的完整推导过程,附上推导的手写稿
- 惯性力的数学推导
- 惯性力的数学推导
- KMP 算法的数学推导
- svm的数学推导原理
- logistic回归的数学推导
- LSTM推导 源码分析
- LSTM公式推导过程
- spring log4j配置
- 串口通信问题处理
- 设计模式-命令模式
- c# int数组 每个int的各个位排序 和数组排序
- 哈理工OJ 1795 发现王国之旅(最小生成树)
- lstm的数学推导
- 蓝牙连接建立
- Dagger2使用进阶
- 读取common.properties文件
- jzoj 4683. 【GDOI2017模拟8.11】矩阵 后缀数组+哈希表
- Android开源库之使用ZXing开源库实现二维码功能
- 爬虫抓取美团网上所有商家信息
- oracle 启动监听提示 :The listener supports no services
- 重建二叉树