Tensorflow训练卷积神经网络并保存模型,加载模型并导入手写图片测试

来源:互联网 发布:淮南大数据小镇规划 编辑:程序博客网 时间:2024/06/01 12:23

        刚学习tensorflow,折腾了这几天,之前一直按照书上的教程训练网络,看那些没玩没了的不断接近于1的准确率,甚是无聊,我一直想将辛辛苦苦训练出来的网络,那些识别率看上去很高的网络,是否能真正用来识别外面导入的图片呢,而不仅仅是那些训练集或者测试集的图片。

        之前写过一篇博客是用keras的基于tensorflow的高级API写的,模型的设置、训练、存储、加载都非常简单,其实我还是很喜欢用哪=那个高级API的,不过Tensorflow常用的套路还是需要会的,所以倒腾了这两天,按照书上写的卷积网络的步骤自己去实践,然后结合模型加载部分的代码区加载模型,然后通过OpenCV去导入图片和进行图片的变形,最后实现了对自己手写的图片的识别,还是很开心的。

       大家要是不会用OpenCV的话,对于外面导入图片以及图片处理的操作,Tensorflow也提供了相关的工具,我就不展开。

       下面就不多废话,直接看代码: (我的工程已经放在我的github上,地址为:https://github.com/MRJTM/Tensorflow_Mnist.git)注意这里的git是小写的,大写是无法访问的

import tensorflow as tffrom  tensorflow.examples.tutorials.mnist import input_dataimport numpy as npimport osimport cv2# 屏蔽waring信息os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'"""------------------加载数据---------------------"""# 载入数据mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)trX, trY, teX, teY = mnist.train.images, mnist.train.labels, mnist.test.images, mnist.test.labels# 改变数据格式,为了能够输入卷积层trX = trX.reshape(-1, 28, 28, 1)  # -1表示不考虑输入图片的数量,1表示单通道teX = teX.reshape(-1, 28, 28, 1)"""------------------构建模型---------------------"""# 定义输入输出的数据容器X = tf.placeholder("float", [None, 28, 28, 1])Y = tf.placeholder("float", [None, 10])# 定义和初始化权重、dropout参数def init_weights(shape):    return tf.Variable(tf.random_normal(shape, stddev=0.01))w1 = init_weights([3, 3, 1, 32])        # 3X3的卷积核,获得32个特征w2 = init_weights([3, 3, 32, 64])       # 3X3的卷积核,获得64个特征w3 = init_weights([3, 3, 64, 128])      # 3X3的卷积核,获得128个特征w4 = init_weights([128 * 4 * 4, 625])   # 从卷积层到全连层w_o = init_weights([625, 10])           # 从全连层到输出层p_keep_conv = tf.placeholder("float")p_keep_hidden = tf.placeholder("float")# 定义模型def create_model(X, w1, w2, w3, w4, w_o, p_keep_conv, p_keep_hidden):    # 第一组卷积层和pooling层    conv1 = tf.nn.conv2d(X, w1, strides=[1, 1, 1, 1], padding='SAME')    conv1_out = tf.nn.relu(conv1)    pool1 = tf.nn.max_pool(conv1_out, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')    pool1_out = tf.nn.dropout(pool1, p_keep_conv)    # 第二组卷积层和pooling层    conv2 = tf.nn.conv2d(pool1_out, w2, strides=[1, 1, 1, 1], padding='SAME')    conv2_out = tf.nn.relu(conv2)    pool2 = tf.nn.max_pool(conv2_out, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')    pool2_out = tf.nn.dropout(pool2, p_keep_conv)    # 第三组卷积层和pooling层    conv3 = tf.nn.conv2d(pool2_out, w3, strides=[1, 1, 1, 1], padding='SAME')    conv3_out = tf.nn.relu(conv3)    pool3 = tf.nn.max_pool(conv3_out, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')    pool3 = tf.reshape(pool3, [-1, w4.get_shape().as_list()[0]])  # 转化成一维的向量    pool3_out = tf.nn.dropout(pool3, p_keep_conv)    # 全连层    fully_layer = tf.matmul(pool3_out, w4)    fully_layer_out = tf.nn.relu(fully_layer)    fully_layer_out = tf.nn.dropout(fully_layer_out, p_keep_hidden)    # 输出层    out = tf.matmul(fully_layer_out, w_o)    return outmodel = create_model(X, w1, w2, w3, w4, w_o, p_keep_conv, p_keep_hidden)# 定义代价函数、训练方法、预测操作cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=model, labels=Y))train_op = tf.train.RMSPropOptimizer(0.001, 0.9).minimize(cost)predict_op = tf.argmax(model, 1,name="predict")# 定义一个saversaver=tf.train.Saver()# 定义存储路径ckpt_dir="./ckpt_dir"if not os.path.exists(ckpt_dir):    os.makedirs(ckpt_dir)"""------------------训练模型或者加载模型进行测试---------------------"""train_batch_size = 128  # 训练集的mini_batch_size=128test_batch_size = 256   # 测试集中调用的batch_size=256epoches = 5  # 迭代周期with tf.Session() as sess:    """-------训练模型--------"""    # 初始化所有变量    tf.global_variables_initializer().run()    # 训练操作    # for i in range(epoches):    #     train_batch = zip(range(0, len(trX), train_batch_size),    #                       range(train_batch_size, len(trX) + 1, train_batch_size))    #     for start, end in train_batch:    #         sess.run(train_op, feed_dict={X: trX[start:end], Y: trY[start:end],    #                                       p_keep_conv: 0.8, p_keep_hidden: 0.5})    #     # 每个周期用测试集中随机抽出test_batch_size个图片进行测试    #     test_indices = np.arange(len(teX))  # 返回一个array[0,1...len(teX)]    #     np.random.shuffle(test_indices)     # 打乱这个array    #     test_indices = test_indices[0:test_batch_size]    #    #     # 获取测试集test_batch_size章图片的的预测结果    #     predict_result = sess.run(predict_op, feed_dict={X: teX[test_indices],    #                                                      p_keep_conv: 1.0,    #                                                      p_keep_hidden: 1.0})    #     # 获取真实的标签值    #     true_labels = np.argmax(teY[test_indices], axis=1)    #    #     # 计算准确率    #     accuracy = np.mean(true_labels == predict_result)    #     print("epoch", i, ":", accuracy)    #    #     # 保存模型    #     saver.save(sess,ckpt_dir+"/model.ckpt",global_step=i)    """-----加载模型,用导入的图片进行测试--------"""    # 载入图片    src = cv2.imread('./Pictures/9.png')    cv2.imshow("待测图片", src)    # 将图片转化为28*28的灰度图    src = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)    dst = cv2.resize(src, (28, 28), interpolation=cv2.INTER_CUBIC)    # 将灰度图转化为1*784的能够输入的网络的数组    picture = np.zeros((28, 28))    for i in range(0, 28):        for j in range(0, 28):            picture[i][j] = (255 - dst[i][j])    picture = picture.reshape(1, 28, 28, 1)    # 载入模型    saver.restore(sess,ckpt_dir+"/model.ckpt-4")    # 进行预测    predict_result = sess.run(predict_op, feed_dict={X: picture,                                                    p_keep_conv: 1.0,                                                    p_keep_hidden: 1.0})    print("你导入的图片是:",predict_result[0])    cv2.waitKey(20170731)

以上代码注释掉的部分是用来训练的,如果你想先训练,就注释掉"""------加载摸型,用导入的图片进行测试------"""下面的代码,将"""--------训练模型--------""""下面被注释掉的代码取消注释即可,训练会产生一个ckpt_dir的文件夹,里边存放着保存的模型
如果训练好后想测试,那么就把训练部分注释掉,把"""------加载摸型,用导入的图片进行测试-----"""下面的代码取消注释即可

运行现象如下:
训练的时候,因为只有CPU,所以我只跑了5个迭代周期:

然后测试的时候,我用了一张手写的2去测试,效果如下:

                                                                            

阅读全文
2 0
原创粉丝点击