【TensorFlow动手玩】常用集合: Variable, Summary, 自定义

来源：互联网发布：windows pro是啥编辑：程序博客网时间：2024/05/14 06:39

集合

tensorflow用集合colletion组织不同类别的对象。tf.GraphKeys中包含了所有默认集合的名称。

collection提供了一种“零存整取”的思路：在任意位置，任意层次都可以创造对象，存入相应collection中；创造完成后，统一从一个collection中取出一类变量，施加相应操作。

例如，tf.Optimizer只优化tf.GraphKeys.TRAINABLE_VARIABLES中的变量。

本文介绍几个常用集合
- Variable集合：模型参数
- Summary集合：监测
- 自定义集合

Variable

Variable被收集在名为tf.GraphKeys.VARIABLES的colletion中

定义

Tensorflow使用Variable类表达、更新、存储模型参数。

Variable是在可变更的，具有保持性的内存句柄，存储着Tensor。必须使用Tensor进行初始化。

k = tf.Variable(tf.random_normal([]), name='k')

创建的Variable被添加到默认的collection中。

初始化

在整个session运行之前，图中的全部Variable必须被初始化。

sess = tf.Session()init = tf.initialize_all_variables() sess.run(init)

在执行完初始化之后，Variable中的值生成完毕，不会再变化。

特别强调：Variable的值在sess.run(init)之后就确定了；Tensor的值要在sess.run(x)之后才确定。

获取

和Tensor, Operation一样，Variable也是全局的。
可以通过tf.all_variables()查看所有tf.GraphKeys.VARIABLES中的对象：

# example for y = k*xx = tf.constant(1.0, shape=[])      # 0D tensork = tf.Variable(tf.constant(0.5, shape=[]) )y = tf.mul(x, k)v = tf.all_variables()

也可以用通用方法直接访问collection：

v = tf.get_collection(tf.GraphKeys.VARIABLES)

各类Variable

另外，tensorflow还维护另外几个collection：

函数集合名意义 tf.all_variables() VARIABLES 存储和读取checkpoints时，使用其中所有变量 tf.trainable_variables() TRAINABLE_VARIABLES 训练时，更新其中所有变量 tf.moving_average_variables() MOVING_AVERAGE_VARIABLES ExponentialMovingAverage对象会生成此类变量 tf.local_variables() LOCAL_VARIABLES 在all_variables()之外，需要用tf.init_local_variables()初始化 tf.model_variables() MODEL_VARIABLES

Summary

Summary被收集在名为tf.GraphKeys.SUMMARIES的colletion中

定义

Summary是对网络中Tensor取值进行监测的一种Operation。这些操作在图中是“外围”操作，不影响数据流本身。

用例

我们模仿常见的训练过程，创建一个最简单的用例。

# 迭代的计数器global_step = tf.Variable(0, trainable=False)# 迭代的+1操作increment_op = tf.assign_add(global_step, tf.constant(1))# 实例应用中，+1操作往往在`tf.train.Optimizer.apply_gradients`内部完成。# 创建一个根据计数器衰减的Tensorlr = tf.train.exponential_decay(0.1, global_step, decay_steps=1, decay_rate=0.9, staircase=False)# 把Tensor添加到观测中tf.scalar_summary('learning_rate', lr)# 并获取所有监测的操作`sum_opts`sum_ops = tf.merge_all_summaries()# 初始化sesssess = tf.Session()init = tf.initialize_all_variables()sess.run(init)  # 在这里global_step被赋初值# 指定监测结果输出目录summary_writer = tf.train.SummaryWriter('/tmp/log/', sess.graph)# 启动迭代for step in range(0, 10):    s_val = sess.run(sum_ops)    # 获取serialized监测结果：bytes类型的字符串    summary_writer.add_summary(s_val, global_step=step)   # 写入文件    sess.run(increment_op)     # 计数器+1

调用tf.scalar_summary系列函数时，就会向默认的collection中添加一个Operation。

再次回顾“零存整取”原则：创建网络的各个层次都可以添加监测；在添加完所有监测，初始化sess之前，统一用tf.merge_all_summaries获取。

查看

SummaryWriter文件中存储的是序列化的结果，需要借助TensorBoard才能查看。

在命令行中运行tensorboard，传入存储SummaryWriter文件的目录：

tensorboard --logdir /tmp/log

完成后会提示：

You can navigate to http://127.0.1.1:6006

可以直接使用服务器本地浏览器访问这个地址（本机6006端口），或者使用远程浏览器访问服务器ip地址的6006端口。

自定义

除了默认的集合，我们也可以自己创造collection组织对象。网络损失就是一类适宜对象。

tensorflow中的Loss提供了许多创建损失Tensor的方式。

x1 = tf.constant(1.0)l1 = tf.nn.l2_loss(x1)x2 = tf.constant([2.5, -0.3])l2 = tf.nn.l2_loss(x2)

创建损失不会自动添加到集合中，需要手工指定一个collection：

tf.add_to_collection("losses", l1)tf.add_to_collection("losses", l2)

创建完成后，可以统一获取所有损失，losses是个Tensor类型的list：

losses = tf.get_collection('losses')

另一种常见操作把所有损失累加起来得到一个Tensor：

loss_total = tf.add_n(losses)

执行操作可以得到损失取值：

sess = tf.Session()init = tf.initialize_all_variables()sess.run(init)losses_val = sess.run(losses)loss_total_val = sess.run(loss_total)

实际上，如果使用TF-Slim包的losses系列函数创建损失，会自动添加到名为”losses”的collection中。

0 0