TensorFlow实现进阶的神经网络

来源:互联网 发布:淘宝砖石卖家信誉好吗 编辑:程序博客网 时间:2024/06/05 11:28

      很抱歉!本应该昨天就更新的,无奈遇到了比较棘手的问题,好在经过不懈的努力,还算是比较幸运地解决了问题。本次我们要使用的大名鼎鼎的CIFAR-10的数据集,这个集合里面包括十种类别,airplane,automobile,bird,cat,deer,dog,frog,horse,ship,truck,共有6w张32*32的图片,其中训练集5w,测试集1w。TF中是有自带的py文件能够下载这些数据,但是,但是……太慢了!为此我等了一天……然后还下载失败了,很气,下面提供博主最终修改过源码的文件和数据(提醒一下,楼主tf版本为1.2,如果有使用1.0的同学,建议到网上找原始的cifar10_input.py文件),这样能避免在数据上纠结。

链接:http://pan.baidu.com/s/1eSksdnO 密码:kvdq

      里面一个是cifar-10数据,将它解压到某个路径上去,然后将cifar10_input.py放在pycharm的site-packages中或者直接放在我们自己写的py文件的目录下,总之,要能import进去就行,下面是载入数据的代码

import cifar10_inputimport tensorflow as tfimport numpy as npimport time
max_steps=10000  #设置训练轮数,在这个程序里,轮数越大,准确度越高,但是……博主用的GPU版本,慢的跟蜗牛一样……data_dir='/tmp/cifar10_data/cifar-10-batches-bin'#这是tf默认下载数据的路径,我也按照这个来,C盘空间不够的同学可以再选个路径
batch_size=128   #大家应该很熟悉这货了
    接下来定义一个权重随机生成的函数,这里,我们首次使用正则化的概念,它是通过减少特征或者惩罚不重要特征的权重来缓解过拟合问题。(神经网络好矛盾,总在过拟合和缓解过拟合之间徘徊)具体算法的数学过程大家可以去搜搜文章看看,博主大部分机器学习的基础都是从周志华老师的《机器学习》上学得的
def variable_with_weight_loss(shape,stddev,w1): #这里定义了一个w1,用来控制L2正则化loss的大小    var=tf.Variable(tf.truncated_normal(shape=shape,stddev=stddev))    if w1 is not None:        weight_loss=tf.multiply(tf.nn.l2_loss(var),w1,name='weight_loss')        tf.add_to_collection('losses',weight_loss)    return var
images_train,labels_train=cifar10_input.distorted_inputs(data_dir=data_dir,batch_size=batch_size)images_test,labels_test=cifar10_input.inputs(eval_data=True,data_dir=data_dir,batch_size=batch_size)images_holder=tf.placeholder(tf.float32,[batch_size,24,24,3])#图片为RGB模式,有3个颜色通道,尺寸为24*24,在input.py中已经过处理labels_holder=tf.placeholder(tf.int32,[batch_size])

接下来定义第一个卷积层,这里不同于之前的卷积层,在池化层后,又加了一层LAN层。
weight1=variable_with_weight_loss(shape=[5,5,3,64],stddev=5e-2,w1=0.0)#第一层卷积不做正则化处理,所以令w1=0kernel1=tf.nn.conv2d(images_holder,weight1,[1,1,1,1],padding='SAME')bias1=tf.Variable(tf.constant(0.0,shape=[64]))conv1=tf.nn.relu(tf.nn.bias_add(kernel1,bias1))pool1=tf.nn.max_pool(conv1,ksize=[1,3,3,1],strides=[1,2,2,1],padding='SAME')#这里最大池化的尺寸和步长不一致,可以增加数据的丰富性norm1=tf.nn.lrn(pool1,4,bias=1.0,alpha=0.001/9.0,beta=0.75)#这里使用LRN层,该法能对局部神经元的活动创建竞争环境,使得相对大的值变得更大,并抑制较小的神经元

第二层卷积层,与第一层略有不同,在于将LRN层提前到池化层前,并且bias的初始值均设置为0.1
weight2=variable_with_weight_loss(shape=[5,5,64,64],stddev=5e-2,w1=0.0)kernel2=tf.nn.conv2d(norm1,weight2,[1,1,1,1],padding='SAME')bias2=tf.Variable(tf.constant(0.1,shape=[64]))conv2=tf.nn.relu(tf.nn.bias_add(kernel2,bias2))norm2=tf.nn.lrn(conv2,4,bias=1.0,alpha=0.001/9.0,beta=0.75)pool2=tf.nn.max_pool(norm2,ksize=[1,3,3,1],strides=[1,2,2,1],padding='SAME')
第三层全连接层,我们已经见了很多了。
reshape=tf.reshape(pool2,[batch_size,-1])#这里使用get_shape函数,获取数据扁平化后的长度
dim=reshape.get_shape()[1].value
weight3=variable_with_weight_loss(shape=[dim,384],stddev=0.04,w1=0.004)#这里设置隐层节点数为384bias3=tf.Variable(tf.constant(0.1,shape=[384]))local3=tf.nn.relu(tf.matmul(reshape,weight3)+bias3)

接下来这个连接层和前一层很像,不过将隐层节点下降一半weight4=variable_with_weight_loss(shape=[384,192],stddev=0.04,w1=0.004)bias4=tf.Variable(tf.constant(0.1,shape=[192]))local4=tf.nn.relu(tf.matmul(local3,weight4)+bias4)

最后一层输出层weight5=variable_with_weight_loss(shape=[192,10],stddev=1/192.0,w1=0.0)#将正态分布的标准差设为上一个隐层的节点数的倒数,且不计入L2正则化bias5=tf.Variable(tf.constant(0.0,shape=[10]))logits=tf.add(tf.matmul(local4,weight5),bias5)这里先不做softmax,我们把它放在计算loss的部分我们把softmax的计算和cross_entropy合并在了tf.nn.sparse_softmax_cross_entropy_with_logits里面def loss(logits,labels):    labels=tf.cast(labels,tf.int64)#转个类型    cross_entropy=tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits,labels=labels,name='cross_entropy_per_example')    cross_entropy_mean=tf.reduce_mean(cross_entropy,name='cross_entropy')    tf.add_to_collection('losses',cross_entropy_mean)#将cross_entropy的loss添加到整体的losses的collection中    return tf.add_n(tf.get_collection('losses'),name='total_loss')接着将logits节点和label_holder传入loss函数获得最终的lossloss=loss(logits,labels_holder)train_op=tf.train.AdagradOptimizer(1e-3).minimize(loss)#依然使用Adam optimizizer优化top_k_op=tf.nn.in_top_k(logits,labels_holder,1)#输出结果中的top k的准确率,默认使用top 1,也就是输出分数最高的那一类的准确率sess=tf.InteractiveSession()tf.global_variables_initializer().run()这里使用16个线程进行加速,如果这里不启动线程,后面的inference以及训练的操作是无法开始的tf.train.start_queue_runners()开始训练for step in range(max_steps):    start_time=time.time()    image_batch,labels_batch=sess.run([images_train,labels_train])    loss_value=sess.run([train_op,loss],feed_dict={images_holder:image_batch,labels_holder:labels_batch})    duration=time.time()-start_time    if step%10==0:        examples_per_sec=batch_size/duration  #每隔10个step会计算并展示当前的loss,每秒能训练的样本数量,以及训练一个batch所花费的时间        sec_per_batch=float(duration)        print(step,loss_value,examples_per_sec,sec_per_batch)#接下来我们测试准确率num_examples=10000import mathnum_iter=int(math.ceil(num_examples/batch_size))true_count=0total_sample_count=num_iter*batch_sizestep=0while step<num_iter:    image_batch,labels_batch=sess.run([images_test,labels_test])    predictions=sess.run([top_k_op],feed_dict={images_holder:image_batch,labels_holder:labels_batch})    true_count+=np.sum(predictions)    step+=1precision=true_count/total_sample_countprint('precision @ 1=%.3f'%precision)


      怎么说呢,这个近一百行代码的程序,看起来也不难,但是作为好奇宝宝,我们总有些疑问,比如,为何第一卷积层和第二卷积层中的池化层和LRN层顺序不一样?为何loss函数和softmax混合在了一起?……这个博主想了好久也没有找到答案。不过学到这里,大家要明确一点的是,往后的准确率的提升,很大一部分都是靠经验来调参……似乎只有上帝能够帮我们了……这个训练轮数我设置为10000次,就花了我电脑一晚上的时间来训练(心疼),言外之意就是,以后我们自己试验的运行的准确率高不了了(通常训练轮数越大,准确率是一定会提高的,博主这一次仅仅达到0.53的准确率)而且,仔细想想,这才是32*32的图片啊,突然就能理解为何google说要实现自动驾驶可能要二三十年后这种话了。目前处理器的制作工艺也快到头了(隧穿效应),基于冯诺依曼制作的计算机的计算能力已经可预见地看到了尽头?看看量子计算机能否引领新潮流?谁知道呢,那么这一篇到这里了。之后我们会尝试地看看一些经典的卷积神经网络,至于基于CPU的TF能否跑起来,那就……额,哈哈哈