tensorflow-rnn代码解读

来源：互联网发布：刷钻软件编辑：程序博客网时间：2024/06/04 19:45

本文仅供自己学习记录使用
原文地址：http://blog.csdn.net/mylove0414/article/details/55805974 感谢博主———路一瓢的博客

# -*- coding:utf-8 -*-import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport tensorflow as tff=open('taiping2008-2016.csv')df=pd.read_csv(f)     #读入股票数据data=np.array(df['High'])   #获取最高价序列data=data[::-1]      #反转，使数据按照日期先后顺序排列#以折线图展示dataplt.figure()plt.plot(data)plt.show()normalize_data=(data-np.mean(data))/np.std(data)  #标准化normalize_data=normalize_data[:,np.newaxis]  #增加维度#———————————————————形成训练集—————————————————————#设置常量time_step=20      #时间步rnn_unit=10       #hidden layer unitsbatch_size=60     #每一批次训练多少个样例input_size=1      #输入层维度output_size=1     #输出层维度lr=0.0006         #学习率train_x,train_y=[],[]   #训练集for i in range(len(normalize_data)-time_step-1):    x=normalize_data[i:i+time_step]    y=normalize_data[i+1:i+time_step+1]    train_x.append(x.tolist())    train_y.append(y.tolist())X=tf.placeholder(tf.float32, [None,time_step,input_size])    #每批次输入网络的tensorY=tf.placeholder(tf.float32, [None,time_step,output_size]) #每批次tensor对应的标签#输入层、输出层权重、偏置weights={      'in':tf.Variable(tf.random_normal([input_size,rnn_unit])),         'out':tf.Variable(tf.random_normal([rnn_unit,1]))         }biases={        'in':tf.Variable(tf.constant(0.1,shape=[rnn_unit,])),        'out':tf.Variable(tf.constant(0.1,shape=[1,]))        }def lstm(batch):  #参数：输入网络批次数目    w_in=weights['in']    b_in=biases['in']    input=tf.reshape(X,[-1,input_size])  #需要将tensor转成2维进行计算，计算后的结果作为隐藏层的输入    input_rnn=tf.matmul(input,w_in)+b_in    input_rnn=tf.reshape(input_rnn,[-1,time_step,rnn_unit])  #将tensor转成3维，作为lstm cell的输入    cell=tf.nn.rnn_cell.BasicLSTMCell(rnn_unit)    init_state=cell.zero_state(batch,dtype=tf.float32)    output_rnn,final_states=tf.nn.dynamic_rnn(cell, input_rnn,initial_state=init_state, dtype=tf.float32)  #output_rnn是记录lstm每个输出节点的结果，final_states是最后一个cell的结果    output=tf.reshape(output_rnn,[-1,rnn_unit]) #作为输出层的输入    w_out=weights['out']    b_out=biases['out']    pred=tf.matmul(output,w_out)+b_out    return pred,final_statesdef train_lstm():    global batch_size    pred,_=lstm(batch_size)    #损失函数    loss=tf.reduce_mean(tf.square(tf.reshape(pred,[-1])-tf.reshape(Y, [-1])))    train_op=tf.train.AdamOptimizer(lr).minimize(loss)    saver=tf.train.Saver(tf.global_variables())    with tf.Session() as sess:        sess.run(tf.global_variables_initializer())        #重复训练10000次        for i in range(10000):            step=0            start=0            end=start+batch_size            while(end<len(train_x)):                _,loss_=sess.run([train_op,loss],feed_dict={X:train_x[start:end],Y:train_y[start:end]})                start+=batch_size                end=start+batch_size                #每10步保存一次参数                if step%10==0:                    print(i,step,loss_)                    print("保存模型：",saver.save(sess,'stock.model'))                step+=1def prediction():    pred,_=lstm(1)    #预测时只输入[1,time_step,input_size]的测试数据    saver=tf.train.Saver(tf.global_variables())    with tf.Session() as sess:        #参数恢复        module_file = tf.train.latest_checkpoint(base_path+'module2/')        saver.restore(sess, module_file)        #取训练集最后一行为测试样本。shape=[1,time_step,input_size]        prev_seq=train_x[-1]        predict=[]        #得到之后100个预测结果        for i in range(100):            next_seq=sess.run(pred,feed_dict={X:[prev_seq]})            predict.append(next_seq[-1])            #每次得到最后一个时间步的预测结果，与之前的数据加在一起，形成新的测试样本            prev_seq=np.vstack((prev_seq[1:],next_seq[-1]))        #以折线图表示结果        plt.figure()        plt.plot(list(range(len(normalize_data))), normalize_data, color='b')        plt.plot(list(range(len(normalize_data), len(normalize_data) + len(predict))), predict, color='r')        plt.show()

此代码来自博主：路一瓢的博客，请大家移步文始lainjie
如有侵权请联系我。
1. input=tf.reshape(X,[-1,input_size])
input_rnn=tf.matmul(input,w_in)+b_in
input_rnn=tf.reshape(input_rnn,[-1,time_step,rnn_unit])
input的形式[batch_size,time_step,input_size]
先转成二维，是为了乘以权重进行矩阵运算，再转成三维形式。转成二维时数据顺序没有改变，所以转回三维时的数据顺序也不变。
2. init_state=cell.zero_state(batch_size)对一个batch内的所有cell进行初始化
3. output_rnn,final_states=tf.nn.dynamic_rnn() 返回的output_rnn的shape是[batch_size,time_step,hidden_size],也就是说每一个cell的输出值都被保存下来了，实际进行预测的时候普遍使用的是一个time_step中的最后一维。final_states的shape是[batch_size,hidden_size],也就是说time_step上只有最后一个cell的fianl_state被保存下来了。
4. ,loss=sess.run([train_op,loss],feed_dict=
{X:train_x[start:end],Y:train_y[start:end]})
start+=batch_size
end=start+batch_size
每次输入一个batch进行训练

阅读全文

0 0