TensorFlow实战——RNN

来源：互联网发布：java替换字符串编辑：程序博客网时间：2024/05/29 18:49

http://blog.csdn.net/u011239443/article/details/73136866

RNN

循环神经网络（RNN）的特殊的地方在于它保存了自己的状态，每次数据输入都会更新状态，输出预测值，并输出更新后的状态，和批数据一起作为输入：

这里写图片描述

如上图，U为数据输入，V为预测值输出，W为状态值输出并输入下一轮。
由于现实中不能无限的迭代下去，我们将其展开，并在有限次迭代后结束：

这里写图片描述

RNN的状态是通过一个向量来表示的，设该向量的维度为n，输入数据x的维度为m，则参数个数为(n+m)∗n+n+n∗m+m。我们来举个例子,n=2,m=1。

设一开始的状态为w0=(0,0) , x1=(1) , RNN 和将其合并成一个向量y1=(0,0,1)，则参数矩阵A1 为一个(n+m)∗n即3∗2的矩阵。设：

A1=⎡⎣⎢⎢0.10.30.50.20.40.6⎤⎦⎥⎥

设，维度为n偏置向量：b1=(0.1,−0.1)

w1=y1∗A1+b1=(0.537,0.462)

即，输出到下一轮的状态向量为(0.537,0.462)，而在这轮该状态还会与参数n∗m参数矩阵A2相乘，再加上偏置向量m的偏置向量b2。设：

A2=[12]

b2=(0.1)

o1=w1∗A2+b2=(1.56)

设x2=2， y2为w1和x2合并，即 (0.54,0.46,2)

w2=y2∗A1+b1=(0.860,0.884)

o2=w2∗A2+b2=(2.73)

顾名思义，双向的状态传播：

这里写图片描述

这里写图片描述

要注意的是，RNN的dropout不会在深度方向上使用，只会在状态输出到下一轮的时候使用。

这里写图片描述

阅读全文

0 0