TensotFlow 应用实例:05- activation function激活函数

来源:互联网 发布:阿里云盘怎么用 编辑:程序博客网 时间:2024/05/22 15:54

TensotFlow 应用实例:05- activation function激活函数

本文是我在学习TensotFlow 的时候所记录的笔记,共享出来希望能够帮助一些需要的人。

activation function激活函数,是相对于线性函数的概念,目的就是把线性函数的线“掰弯”的,代码如下:

import tensorflow as tfimport numpy as np# Linear Nonlinear# 线性 非线性# y = Wx 线性函数# y = AF(Wx) 激励函数# AF()# relu sigmoid tanh# 可以创造自己的激励函数,但是要求激励函数必须是可以微分的# 因为在误差反向传播的时候,只有可以微分的函数才能够将误差传递回去# 切记在多层网络的时候不能随便选择激励函数, 因为如果选择不对会造成梯度爆炸和梯度消失的问题# CNN(Convolutional Neural Network)# 卷积神经网络推荐使用 relu# RNN (Recurrent Neural Network)# 循环神经网络推荐使用 relu or tanh# 激励函数 activation function 应该放在layer将要输出的时候# https://www.tensorflow.org/versions/r0.10/api_docs/python/nn/activation_functions_# relu: 当x<0时候,y=0, 当x>0 时候 y = Wx + b# softplus 用作分类器# 每一个activation function 都有自己的适用之处# 添加神经层def add_layer(inputs, in_size, out_size, activation_function=None):    # Weights define    # 权重,尽量要是一个随机变量    # 随机变量在生成初始变量的时候比全部为零效果要好的很多    Weights = tf.Variable(tf.random_normal([in_size, out_size]))    # biases define    # 偏值项,是一个列表,不是矩阵,默认设置为0 + 0.1    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)    # W * x + b    Wx_plus_b = tf.matmul(inputs, Weights) + biases    # 如果activation_function是空的时候就表示是一个线性关系直接放回即可    if activation_function is None:        outputs = Wx_plus_b    else:        outputs = activation_function(Wx_plus_b)    return outputs# x_data 从-1到1的区间有300个单位# [:, np.newaxis] 加上一个维度,有300行,有300个例子x_data = np.linspace(-1, 1, 300)[:, np.newaxis]# noise is a [0, 0.05]之间的一个随机数# 加上一个noise使得更像真实的数据noise = np.random.normal(0, 0.05, x_data.shape)# y_data = x_data^2 -0.5 + noisey_data = np.square(x_data) - 0.5 + noise# define xs ys# placeholder# 这里的None表示无论输入多少个sample都可以# 是一个多行单列的矩阵,或者说是一个列表xs = tf.placeholder(tf.float32, [None, 1])ys = tf.placeholder(tf.float32, [None, 1])# 定义隐藏层 define hidden layerl1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)# 定义输出层 define output layer# prediction layerprediction = add_layer(l1, 10, 1, activation_function=None)# loss function# 损失函数 axis is new reduction_indicesloss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction),                                    axis=[1]))# 进行训练# 设置学习速率为0.1 通常设置为小于1的数字train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)# 对所有的变量进行初始化# this a very important step# 如果不进行初始化后续将无法运行# initialize_all_variables  deprecated("2017-03-02", "Use `tf.global_variables_initializer` instead.")init = tf.global_variables_initializer()sess = tf.Session()sess.run(init)for i in range(1000):    # train_step 训练    # 其中的feed_dict is input data    sess.run(train_step, feed_dict={xs: x_data, ys: y_data})    if i % 50 is 0:        # run loss, 只要是使用了placeholder的地方都要使用feed_dict传入        print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))

本文代码GitHub地址 tensorflow_learning_notes

原创粉丝点击