使用TensorFlow定义拥有一个隐藏层的神经网络

来源:互联网 发布:龙虎山的旅游收入数据 编辑:程序博客网 时间:2024/05/21 09:21

    咳咳,我们已经搞定了softmax regression模型,但是在测试集上的准确度确实不如人意,很气……我们已经不满足于仅仅建立一个模型了,我们现在需要更高精度的学习模型。现在尝试着在模型里面添加一层隐藏层吧!数据还是手写字体的数据,先看看拥有一层隐藏层的神经网络(多层感知机也叫)示意图吧!

    Boom!博主懒得网上找图了,直接动手……原谅我笨拙的字体和手法……接下去我们看看数据流图,就能清晰地了解代码的含义了。


    有了这两张图之后,以及前面的编程基础,下面的代码简直一目了然。

from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tfmnist=input_data.read_data_sets('MNIST_data/',one_hot=True)sess=tf.InteractiveSession()
  接下来定义一下输入节点和隐含层的输出节点,以及相应的各个参数                       
in_units=784 #输入节点数h1_units=300#隐含层的输出节点数w1=tf.Variable(tf.truncated_normal([in_units,h1_units],stddev=0.1))
  这里备注一下,权重w1的初始值设定为标准差为0.1的标准截断的正态分布b1=tf.Variable(tf.zeros([h1_units]))w2=tf.Variable(tf.zeros([h1_units,10]))b2=tf.Variable(tf.zeros([10]))
x=tf.placeholder(tf.float32,[None,in_units])
hidden1=tf.nn.sigmoid(tf.matmul(x,w1)+b1)  #这里使用传统的Sigmoid非线性激活函数y=tf.nn.softmax(tf.matmul(hidden1,w2)+b2)  #在输出层依然使用的softmax分类
  依然是选用信息熵作为Loss Funciton和SGD法
y_=tf.placeholder(tf.float32,[None,10])cross_entropy=tf.reduce_mean(-tf.reduce_sum(y_*tf.log(y),reduction_indices=[1]))train_step=tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)tf.global_variables_initializer().run()

    剩下的步骤与softmax无异,这里不表。
for i in range(3000):    batch_xs,batch_ys=mnist.train.next_batch(100)    train_step.run({x:batch_xs,y_:batch_ys})correct_prediction=tf.equal(tf.argmax(y,1),tf.argmax(y_,1))accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))print(accuracy.eval({x:mnist.test.images,y_:mnist.test.labels}))
最后测试结果,精度为0.9569,相比于softmax,提高了3个百分点。恩恩,不过这样我们依然不满足,下一节我们要介绍几种辅助方法,能够帮助这个神经网络的准确率再提升几个百分点。

阅读全文
2 0
原创粉丝点击