TensorFlow-3: 用 feed-forward neural network 识别数字
来源:互联网 发布:淘宝的宝贝卖点填什么 编辑:程序博客网 时间:2024/06/15 21:17
今天继续看 TensorFlow Mechanics 101:
https://www.tensorflow.org/get_started/mnist/mechanics
完整版教程可以看中文版tutorial:
http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mnist_tf.html
这一节讲了使用 MNIST 数据集训练并评估一个简易前馈神经网络(feed-forward neural network)
input,output 和前两节是一样的:即划分数据集并预测图片的 label
data_sets.train 55000个图像和标签(labels),作为主要训练集。data_sets.validation 5000个图像和标签,用于迭代验证训练准确度。data_sets.test 10000个图像和标签,用于最终测试训练准确度(trained accuracy)。
主要有两个代码:
mnist.py
https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/mnist/mnist.py
- 构建一个全连接网络,由 2 个隐藏层,1 个 `softmax_linearv 输出构成
- 定义损失函数,用 `cross entropyv
- 定义训练时的优化器,用
GradientDescentOptimizer
- 定义评价函数,用
tf.nn.in_top_k
fully_connected_feed.py
https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/mnist/fully_connected_feed.py
- 向
placeholder_inputs
传入batch size
,得到 image 和 label 的两个placeholder - 定义生成
feed_dict
的函数,key 是 placeholders,value 是 data - 定义
do_eval
函数,每隔 1000 个训练步骤,就对模型进行以下评估,分别作用于训练集、验证集和测试集 - 训练时:
- 导入数据
- 得到 image 和 label 两个 placeholder
- 传入
mnist.inference
定义的 NN, 得到 predictions - 将 predictions 传给
mnist.loss
计算 loss - loss 传给
mnist.training
进行优化训练 - 再用
mnist.evaluation
评价预测值和实际值
代码中涉及到下面几个函数:
with tf.Graph().as_default():
即所有已经构建的操作都要与默认的 tf.Graph
全局实例关联起来,tf.Graph
实例是一系列可以作为整体执行的操作
summary = tf.summary.merge_all():
为了释放 TensorBoard 所使用的 events file,所有的即时数据都要在图表构建时合并至一个操作 op 中,每次运行 summary 时,都会向 events file 中写入最新的即时数据
summary_writer = tf.summary.FileWriter(FLAGS.log_dir, sess.graph):
用于写入包含了图表本身和即时数据具体值的 events file。
saver = tf.train.Saver():
就是向训练文件夹中写入包含了当前所有可训练变量值 checkpoint file
with tf.name_scope('hidden1'):
主要用于管理一个图里面的各种 op,返回的是一个以 scope_name
命名的 context manager,一个 graph 会维护一个 name_space
的堆,实现一种层次化的管理,避免各个 op 之间命名冲突。例如,如果额外使用 tf.get_variable()
定义的变量是不会被 tf.name_scope()
当中的名字所影响的
tf.nn.in_top_k(logits, labels, 1):
意思是在 K 个最有可能的预测中如果可以发现 true,就将输出标记为 correct。本文 K 为 1,也就是只有在预测是 true 时,才判定它是 correct。
推荐阅读
历史技术博文链接汇总
也许可以找到你想要的
- TensorFlow-3: 用 feed-forward neural network 识别数字
- Feed Forward and Backward Run in Deep Convolution Neural Network 论文阅读笔记
- TensorFlow Neural Network Lab
- Tensorflow API: Neural network
- tensorflow编程: Neural Network
- Neural Network(神经网络)实例--手写数字识别
- Tensorflow: Convolutional Neural Network Basic
- TensorFlow-3 CNN数字识别
- Introduction to neural network —— C语言实现BP神经网络识别数字
- Neural Network实战:Java实现Back Propagation算法 + 手写数字识别
- Tensorflow: recurrent neural network (mnist basic)
- Tensorflow: recurrent neural network char-level 0
- Tensorflow: recurrent neural network char-level 1
- TensorFlow-1: 如何识别数字
- 用Tensorflow实现CNN手写数字识别
- TensorFlow-2: 用 CNN 识别数字
- 用CNN解决手写体数字识别。--tensorflow
- tensorflow识别手写数字
- D题 聪明的kk( DP数塔 )
- 整理C++面试经典编程题
- c++ 查找一个字符串中逗号的个数,并分别获取以逗号分隔的数值(此处设为字符串形式)
- 对W3C的理解
- jqGrid 使用知识点记录
- TensorFlow-3: 用 feed-forward neural network 识别数字
- vs2013设置快捷键、快捷输入(番茄助手)
- 使用QML制作超链接并打开超链接
- Android中Volley发送带有Cookie信息的请求
- Educational Codeforces Round 3 E. Minimum spanning tree for each edge MST+树上路径倍增
- 加快Android Studio的编译速度
- Plug-in JFace查看器
- GIS开源软件大全
- [Android]Ubuntu编译AOSP