程序博客网 > 淘宝马克华菲折扣店

RNN网络结构及公式推导

来源：互联网发布：淘宝马克华菲折扣店编辑：程序博客网时间：2024/06/16 04:48

RNN结构如图所示：
这里写图片描述

Xt∈Rx表示t时刻的输入(Xt是多少维，则这一层有多少个神经元，这里设为x维，图中画的是3维）

ht∈Rh表示t时刻隐层的输出(假设这一层有h个神经元）

yt∈Ry表示t时刻的预测输出
dt∈Ry表示t时刻的期望输出
V∈Rx×h表示从输入层到隐层的权值矩阵
U∈Rh×h表示上一个时刻到这个时刻的权值矩阵
bh∈Rh表示隐层的偏置，其中每一项对应某一神经元的偏置项
W∈Rh×y表示隐层到输出层的权值矩阵
by∈Ry表示输出层的偏置项

正向传播过程：
Xti表示t时刻某个样本第i维的输入，即输入层第i个神经元的输入
t时刻隐层第j个神经元的输入：cthj=∑xi=1XtiVij+∑hs=1ht−1sUsj+bhj
t时刻隐层第j个神经元的输出:htj=f(chj)
t时刻输出层第k个神经元的输入:ctyk=∑hj=1htjWjk+byk
t时刻输出层第k个神经元的输出：ytj=g(cyk)

矩阵表示(只有一个样本的情况）:
t时刻隐层的输入，h*1向量，cth=VTXt+UTht−1+bh
t时刻隐层的输出，h*1向量，ht=f(cth)
t时刻输出层的输入，y*1向量，cty=WTht+by
t时刻输出层的输出，y*1向量，yt=g(cty)

反向求导过程：
假设共有p个样本，则t时刻的误差可以定义为：Et=∑p12∥dt−yt∥2,整个网络的误差为E=∑tEt=12∑p∑Tt=1∥dt−yt∥2,

∂E∂W=∑Tt=1∂E∂yt∂yt∂W

∂E∂yt=−(dt−yt)

∂yt∂W=∂yt∂cty∂cty∂W=g′(cty)ht

所以∂E∂W=−∑Tt=1(dt−yt)g′(cty)ht

∂E∂U=∑Tt=1∂E∂ht∂ht∂U，∂E∂V=∑Tt=1∂E∂ht∂ht∂V

由于ht一方面输到yt，一方面输到ht+1,所以它的误差来自两方面：

∂E∂ht=∂E∂yt∂yt∂ht+∂E∂ht+1∂ht+1∂ht=∂E∂yt∂yt∂cty∂cty∂ht+∂E∂ht+1∂ht+1∂ct+1h∂ct+1h∂ht=∂E∂ytg′(cty)W+∂E∂ht+1f′(ct+1h)U

∂ht∂U=∂ht∂cth∂cth∂U=f′(cth)ht−1，∂ht∂V=∂ht∂cth∂cth∂V=f′(cth)Xt

所以

∂E∂U=∑Tt=1[∂E∂ytg′(cty)W+∂E∂ht+1f′(ct+1h)U]f′(cth)ht−1

∂E∂V=∑Tt=1[∂E∂ytg′(cty)W+∂E∂ht+1f′(ct+1h)U]f′(cth)Xt

∂E∂by=∑Tt=1∂E∂yt∂yt∂cty∂cty∂by=−∑Tt=1(dt−yt)g′(cty)

∂E∂bh=∑Tt=1∂E∂ht∂ht∂cth∂cth∂bh=∑Tt=1[∂E∂ytg′(cty)W+∂E∂ht+1f′(ct+1h)U]f′(cth)

阅读全文

0 0

淘宝马克华菲折扣店

淘宝马克华菲折扣店

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子哈尔滨师大夜市义乌宾王夜市星露谷物语夜市拉差达火车夜市沈阳兴顺夜市天津夜市小吃街济南夜市在哪里义乌宾王夜市外国鸡多夜市炸串酱料怎么调制夜市卖什么好大连夜市小吃街在哪里锦州夜市开放时间郑州健康路夜市星露谷物语夜市贝壳敲击顺序夜市烧烤肉类大全青岛夜市小吃一条街沈阳夜市在哪开封夜市哪里好吃广州夜市小吃街哈尔滨师大夜市营业时间南昌紫荆夜市兰州夜市在哪条街济南环联夜市夜市摆地摊卖什么好夜市摆摊技巧夜市摆摊小吃夜市摆摊做什么好夜市小吃车价格做夜市卖什么好夜市摆地摊技巧夜市小吃卖什么好夜市卖什么小吃夜市适合卖什么夜市上什么东西好卖夜市地摊货批发网秋天夜市摆摊卖什么好夜市地摊卖什么好夜市上卖什么夜市小吃菜谱大全夜市千灯照碧云夜市服装批发