TensorFlow Dropout

来源:互联网 发布:centos压缩文件夹命令 编辑:程序博客网 时间:2024/04/25 19:51

TensorFlow Dropout

图 1:来自论文 "Dropout: A Simple Way to Prevent Neural Networks fromOverfitting" (https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf)

图 1:来自论文 "Dropout: A Simple Way to Prevent Neural Networks from Overfitting" (https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf)

Dropout 是一个降低过拟合的正则化技术。它在网络中暂时的丢弃一些单元(神经元),以及与它们的前后相连的所有节点。图 1 是 dropout 的工作示意图。

TensorFlow 提供了一个 tf.nn.dropout() 函数,你可以用来实现 dropout。

让我们来看一个 tf.nn.dropout()的使用例子。

keep_prob = tf.placeholder(tf.float32) # probability to keep unitshidden_layer = tf.add(tf.matmul(features, weights[0]), biases[0])hidden_layer = tf.nn.relu(hidden_layer)hidden_layer = tf.nn.dropout(hidden_layer, keep_prob)logits = tf.add(tf.matmul(hidden_layer, weights[1]), biases[1])

上面的代码展示了如何在神经网络中应用 dropout。

tf.nn.dropout()函数有两个参数:

  1. hidden_layer:你要应用 dropout 的 tensor
  2. keep_prob:任何一个给定单元的留存率(没有被丢弃的单元)

keep_prob 可以让你调整丢弃单元的数量。为了补偿被丢弃的单元,tf.nn.dropout() 把所有保留下来的单元(没有被丢弃的单元)* 1/keep_prob

在训练时,一个好的keep_prob初始值是0.5

在测试时,把 keep_prob 值设为1.0 ,这样保留所有的单元,最大化模型的能力。