tensorflow之学习率自衰减的实现

来源:互联网 发布:名赛公司取名软件 编辑:程序博客网 时间:2024/05/18 01:34

在训练神经网络时,需要设置学习率(learning rate)控制参数的更新速度,学习速率设置过小,会极大降低收敛速度,增加训练时间;学习率太大,可能导致参数在最优解两侧来回振荡。

tensorflow提供了一个灵活的学习率设置方法,指数衰减函数tf.train.exponential_decay(),它的计算实现如下:

decayed_learning_rate = learning_rate * decay_rate ^ (global_step / decay_steps)
其中decay_rate是衰减系数, decay_steps是衰减速度,learning_rate是初始学习率。


下面给出一个小demo:

...
current_epoch = tf.Variable(0)
loss = ...
learning_rate = tf.train.exponential_decay(0.03,                                           current_epoch,                                           decay_steps=num_epochs,                                           decay_rate=0.03)train_step = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(loss, global_step=current_epoch)...with tf.Session() as sess:    init = tf.global_variables_initializer()    sess.run(init)    for i in range(num_epochs):        current_epoch = i        ...
主要修改的部分在于上面加粗部分,注意在minimize()里面一定要加上
global_step=current_epoch
这样学习速率才会跟着迭代,不然学习速率会一直保持初始值。