caffe例子mnist
来源:互联网 发布:windows如何切换到桌面 编辑:程序博客网 时间:2024/05/29 18:32
为了程序的简洁,在caffe中是不带练习数据的,因此需要自己去下载。但在caffe根目录下的data文件夹里,作者已经为我们编写好了下载数据的脚本文件,我们只需要联网,运行这些脚本文件就行了。
注意:在caffe中运行所有程序,都必须在根目录下进行,否则会出错
1、mnist实例
mnist是一个手写数字库,由DL大牛Yan LeCun进行维护。mnist最初用于支票上的手写数字识别, 现在成了DL的入门练习库。征对mnist识别的专门模型是Lenet,算是最早的cnn模型了。
mnist数据训练样本为60000张,测试样本为10000张,每个样本为28*28大小的黑白图片,手写数字为0-9,因此分为10类。
首先下载mnist数据,假设当前路径为caffe根目录
# sudo sh data/mnist/get_mnist.sh
运行成功后,在 data/mnist/目录下有四个文件:
train-images-idx3-ubyte: 训练集样本 (9912422 bytes)
train-labels-idx1-ubyte: 训练集对应标注 (28881 bytes)
t10k-images-idx3-ubyte: 测试集图片 (1648877 bytes)
t10k-labels-idx1-ubyte: 测试集对应标注 (4542 bytes)
这些数据不能在caffe中直接使用,需要转换成LMDB数据
# sudo sh examples/mnist/create_mnist.sh
注: 我的不能加 sudo ????? 不懂为啥
如果想运行leveldb数据,请运行 examples/siamese/ 文件夹下面的程序。 examples/mnist/ 文件夹是运行lmdb数据
转换成功后,会在 examples/mnist/目录下,生成两个文件夹,分别是mnist_train_lmdb和mnist_test_lmdb,里面存放的data.mdb和lock.mdb,就是我们需要的运行数据。
接下来是修改配置文件,如果你有GPU且已经完全安装好,这一步可以省略,如果没有,则需要修改solver配置文件。
需要的配置文件有两个,一个是lenet_solver.prototxt,另一个是train_lenet.prototxt.
首先打开lenet_solver_prototxt
# sudo vi examples/mnist/lenet_solver.prototxt
根据需要,在max_iter处设置最大迭代次数,以及决定最后一行solver_mode,是否要改成CPU
保存退出后,就可以运行这个例子了
# sudo time sh examples/mnist/train_lenet.sh
CPU运行时候大约13分钟,GPU运行时间大约4分钟,GPU+cudnn运行时候大约40秒,精度都为99%左右
以上参考 http://www.cnblogs.com/denny402/p/5075490.html后来发现作者根据 caffe-master/examples/mnist/readme 文件改的。
这个readme引人入胜,娓娓道来
其中提到的lenet 网络结构如下:
//*********************************************************************************************** name: "LeNet" //[1]网络(Net)的名称为:LeNet /*********************************************************************************************** *模块1: * 1--数据层----Data Layer * 2--该数据层只在[训练]阶段有效 ***********************************************************************************************/ layer { /****[1]定义一个数据层****/ name: "mnist" //[1]数据层的名字为--mnist type: "Data" //[2]层的层类型:Data(数据层)(数据库作为输入) top: "data" //[3]数据层的输出blob有两个:data,label(对应生成的CNN图看) top: "label" include { //[4]include里面的数据说明,该层只在训练阶段有效 phase: TRAIN } transform_param { //[5]数据预处理,转换参数的定义 scale: 0.00390625 //[5]特征归一化系数,将范围为[0,255]的MNIST数据归一化为[0,1] } data_param { //[6]数据层的参数 source: "examples/mnist/mnist_train_lmdb"//[1]由于该数据层的数据来源是数据库(由层类型Data指定), // 因此,source对应的就是数据库LMDB的路径,也就是训练 // 数据和测试数据的path batch_size: 64 //[2]批量数目,表示caffe一次从数据库LMDB读入的图片的数量 backend: LMDB //[3]数据库的类型说明区别于LevelDB数据库 } } /*********************************************************************************************** *模块2: * 1--数据层----Data Layer * 2--一个新的数据层,名字也叫做mnist,输出的blob也是data和label,但是这个数据层只在分类阶段有效,Test * 3--图片大小28*28 ***********************************************************************************************/ layer { name: "mnist" type: "Data" top: "data" top: "label" include { phase: TEST } transform_param { scale: 0.00390625 } data_param { source: "examples/mnist/mnist_test_lmdb" batch_size: 100 backend: LMDB } } /*********************************************************************************************** *模块3: * 1--第一个卷积层---Convolution * 2--定义一个新的卷积层,卷积层的输入blob为data;输出blob为conv1 * 3--Convolution层,使用一系列可训练的卷积核(相当于空间滤波的滤波算子)对输入图像进行卷积操作,每组 * 卷积核生成输出图像中的一个特征图(相当于对输入图像,使用20个不同的滤波算子(卷积)进行20次卷积 * 之后生成的20张经过滤波的特征图) * 4--输出图片大小:(28+2*0-5)/1+1=(img_h+2*pad_h-kernel_h)/stride_h+1======24*24 ***********************************************************************************************/ layer { name: "conv1" type: "Convolution" bottom: "data" //[1]卷积层的输入blob为data top: "conv1" //[2]卷积层的输出blob为conv1 param { //[3]卷积层的:权值学习速率倍乘因子,1表示,保持与全局参数一致 lr_mult: 1 } param { //[4]卷积层的:偏置项的学习速率倍乘因子,是全局参数的2倍 lr_mult: 2 } convolution_param { //[5]卷积层的计算参数 num_output: 20 //[1]输出feature map的数目为20,对应的也就是卷积核的数量 kernel_size: 5 //[2]卷积核的尺寸为:5*5 stride: 1 //[3]卷积核在输入图片上滑动的步长为:1 weight_filler { //[6]指定权值的初始化方案为:xavier type: "xavier" } bias_filler { //[7]偏执项的初始化方案为:constant,默认为0 type: "constant" } } } /*********************************************************************************************** *模块4: * 1--第一个池化层---pool1 * 2--定义一个下采样层(池化层),这个池化层的输入blob为conv1,输出blob为pool1 * 3--输出图片的大小===12*12 ***********************************************************************************************/ layer { name: "pool1" type: "Pooling" bottom: "conv1" top: "pool1" pooling_param { //[1]池化层(下采样)的参数 pool: MAX //[1]目前提供了三种池化的方法:最大值池化,均值池化,随机池化 // 很明显,该池化层使用了最大值池化MAX kernel_size: 2 //[2]指定池化窗口的宽度和高度:2*2 stride: 2 //[3]指定池化窗口在输入数据上滑动的步长为:2 } } /*********************************************************************************************** *模块5: * 1--第二个卷积层:conv2 * 2--该卷积层的输入blob为pool1,输出blob为conv2 * 3--注意:该卷积层输出的feature map(特征图的数量)为:50 * 4--输出图片的大小为:(12-2*0-5)/1+1=======8*8 ***********************************************************************************************/ layer { name: "conv2" type: "Convolution" bottom: "pool1" top: "conv2" param { lr_mult: 1 } param { lr_mult: 2 } convolution_param { num_output: 50 kernel_size: 5 stride: 1 weight_filler { type: "xavier" } bias_filler { type: "constant" } } } /*********************************************************************************************** *模块6: * 1--第二个池化层:pool2 * 2--该池化层的输入blob为conv2,输出blob为pool2 ***********************************************************************************************/ layer { name: "pool2" type: "Pooling" bottom: "conv2" top: "pool2" pooling_param { pool: MAX kernel_size: 2 stride: 2 } } /*********************************************************************************************** *模块7: * 1--第一个全连接层 * 2--该层的输入blob为:pool2,输出blob为iP1 * 3--注意:全连接层的的输出节点数(num_output==500)可以理解为滤波器的个数(滤波算子的个数),对应的也 * 就是输出特征图的个数 ***********************************************************************************************/ layer { name: "ip1" type: "InnerProduct" bottom: "pool2" top: "ip1" param { lr_mult: 1 } param { lr_mult: 2 } inner_product_param { //[1]全连接层的参数: num_output: 500 //[1]该层的输出元素的个数为:500 weight_filler { //[2]指定全连接层的初始化方案:xavier type: "xavier" } bias_filler { type: "constant" } } } /*********************************************************************************************** *模块8: * 1--新的非线性层(激活函数)(规整化线性单元),此激活层采用的激活函数为:RELU * 2--该激活层的输入blob为iP1,输出blob也为iP1 * 3--该(规整化线性单元)激活层的作用为:对全连接层的每一个输出数据进行判断,当x>0时,RELU的输出为x, * 根据X的大小,说明这个单元的激活程度(兴奋程度);如果x<=0,则这个信号(特征图)被完全抑制 ***********************************************************************************************/ layer { name: "relu1" type: "ReLU" bottom: "ip1" top: "ip1" } /*********************************************************************************************** *模块9: * 1--第二个全连接层InnerProduct * 2--该层的输入blob为iP1,输出blob为ip2 ***********************************************************************************************/ layer { name: "ip2" type: "InnerProduct" bottom: "ip1" top: "ip2" param { lr_mult: 1 } param { lr_mult: 2 } inner_product_param { //[1]全连接层的计算参数 num_output: 10 //[1]该层的输出为10个特征,对应0--9这10类数字 weight_filler { //[2]该层在网络初始化的初始化方案为:xavier type: "xavier" } bias_filler { //[3]给该层添加偏置项,偏置项网络的初始化方案为:constant type: "constant" } } } /*********************************************************************************************** *模块10: * 1--Accuracy---分类准确率层 * 2--Accuracy层的作用:该层用来计算网络输出相对于目标值的准确率 * 3--该层的输入blob为iP2和label,输出blob为accuracy * 4--注意:记住该层只在Test(测试)阶段有效,并且,它并不是一个Loss层,所以这次没有BP操作 ***********************************************************************************************/ layer { name: "accuracy" type: "Accuracy" bottom: "ip2" bottom: "label" top: "accuracy" include { phase: TEST } } /*********************************************************************************************** *模块11: * 1--Loss层,损失层 * 2--层类型:SoftnaxWithLoss---softmax损失层一般用于计算[多分类问题]的损失,在概念上等同于softmax * 层后面跟一个多变量的logistic回归损失层,但能提供更稳定的梯度 ***********************************************************************************************/ layer { name: "loss" type: "SoftmaxWithLoss" bottom: "ip2" bottom: "label" top: "loss" }
怎么直观看看这个结构呢?
一句话
sudo python ./python/draw_net.py ./examples/mnist/lenet_train_test.prototxt ./examples/mnist/lenet_train_test.jpeg
or :
sudo python ./python/draw_net.py --rankdir BT ./examples/mnist/lenet_train_test.prototxt ./examples/mnist/lenet_train_test.jpeg
- caffe例子mnist
- caffe例子mnist
- caffe笔记2——mnist例子
- Windows上运行Caffe自带的mnist例子
- caffe代码解读-mnist例子-前向计算
- caffe代码解读-mnist例子-后向计算
- caffe 自带例子之MNIST的网络解析
- Caffe中mnist例子(一)自定义输入层
- caffe学习例子(一) mnist手写字识别
- Caffe的Layer,Net,Solver概念--mnist例子
- Caffe学习笔记3:caffe跑第一个mnist的例子
- caffe windows mnist测试
- Caffe 训练mnist数据
- caffe学习笔记:mnist
- Caffe+mnist训练
- caffe mnist测试
- caffe mnist数据层
- Caffe-Mnist实验
- CentOS 6.5 下安装 Redis 2.8.7
- linux上搭建ftp服务器,并设置本地用户登陆。
- Javascript 显示在线时间
- 自有账户体系
- RXSwift 关于使用textFiled的时候onCompleted 什么时间执行的问题
- caffe例子mnist
- python 操作 excel
- ehcache.xml配置文件详解
- ElasticSearch重启集群方案
- GetSystemMetrics
- Objective-C中的hasPrefix
- Could not find Developer Disk Image10.1
- Revit开发通过轴网创建柱子
- Makefile详解-另类风格