训练自己特定的图片及预测单张图片(仅CPU)

来源：互联网发布：php curl header 设置编辑：程序博客网时间：2024/05/21 08:44

最近自己琢磨caffe，主要参考了博主徐其华denny的学习专栏，http://www.cnblogs.com/denny402/p/5083300.html，接下来的过程基本是按照他的步骤进行的。

好记性不如烂笔头，虽然对深度学习的了解才刚刚开始，但还是希望能记录点滴学习过程。以下是我训练自己的图片的过程，正确率只有0.333，可能是样本源的选择不好，但总算是训练出精度了，所以记录一下。

以下所有操作都是在caffe根目录下进行，否则都会出错。

我根据http://www.2cto.com/kf/201606/515700.html博主提供的数据（共10类1000张train,200test）训练36h后得到0.545的精度，训练时间太长（是跟电脑配置有关？），网上博主使用上面的配置训练，得到的结果准确率是0.2+，数据集的制作者迭代了12000次得到0.5的准确率。参数配置如下所示：

net: "examples/303file/train_val.prototxt"test_iter: 4test_interval: 300base_lr: 0.001lr_policy: "step"gamma: 0.1stepsize: 300display: 20max_iter: 1200momentum: 0.9weight_decay: 0.0005snapshot:600snapshot_prefix:"/home/jenny/caffe/examples/303file/"solver_mode: CPU

我主要目的是想对高压输电线上的三种金具（防震锤，间隔器，悬垂线夹）进行分类，所以用摄像头拍摄了一段视频截取了部分图片，图片背景比较昏暗，而且防震锤与悬垂线夹的差别不大，不知这是不是精度较低的原因。
总共300张图片，包括240张train，60张test，分三类，编号分别以1，3，5开头，每类80张训练，20张测试,图片大小为512*684。我将图片放在caffe根目录下的data文件夹下面。即训练图片目录：data/obstacle/train/ ,测试图片目录: data/obstacle/test/

二、转换lmdb格式

具体转换过程可参考denny博主的http://www.cnblogs.com/denny402/p/5082341.html
在examples下面创建一个jennyfile的文件夹，来用存放配置文件和脚本文件。然后编写一个脚本create_filelist.sh，用来生成train.txt和test.txt清单文件

sudo mkdir examples/jennyfilesudo vi examples/jennyfile/create_filelist.sh

编辑此文件，写入如下代码，并按Esc键，再按冒号：wq保存

#!/usr/bin/env shDATA=data/obstacle/MY=examples/jennyfileecho "Create train.txt..."rm -rf $MY/train.txtfor i in 1 3 5dofind $DATA/train -name $i*.jpg | cut -d '/' -f4-5 | sed "s/$/ $i/">>$MY/train.txtdoneecho "Create test.txt..."rm -rf $MY/test.txtfor i in 1 3 5dofind $DATA/test -name $i*.jpg | cut -d '/' -f4-5 | sed "s/$/ $i/">>$MY/test.txtdoneecho "All done"

然后，运行此脚本

sudo sh examples/jennyfile/create_filelist.sh

成功的话，就会在examples/jennyfile/ 文件夹下生成train.txt和test.txt两个文本文件，里面就是图片的列表清单。（此处需要注意的是图片名称与类别数字之间是一个空格，我之前遇到过can't find or open xxx.jpg的错误，原因就是中间是tab键而不是空格键，改过后就OK了）

接着再编写一个脚本文件，调用convert_imageset命令来转换数据格式。

sudo vi examples/jennyfile/create_lmdb.sh

插入代码如下：

#!/usr/bin/env shMY=examples/jennyfileecho "Create train lmdb.."rm -rf $MY/img_train_lmdbbuild/tools/convert_imageset \--shuffle \--resize_height=256 \--resize_width=256 \/home/jenny/caffe/data/obstacle/ \$MY/train.txt \$MY/img_train_lmdbecho "Create test lmdb.."rm -rf $MY/img_test_lmdbbuild/tools/convert_imageset \--shuffle \--resize_width=256 \--resize_height=256 \/home/jenny/caffe/data/obstacle/ \$MY/test.txt \$MY/img_test_lmdb

因为图片大小不一，因此我统一转换成256*256大小。运行成功后，会在 examples/jennyfile下面生成两个文件夹img_train_lmdb和img_test_lmdb，分别用于保存图片转换后的lmdb文件。

三、计算均值并保存

图片减去均值再训练，会提高训练速度和精度。因此，一般都会有这个操作。

caffe程序提供了一个计算均值的文件compute_image_mean.cpp，我们直接使用就可以了

sudo build/tools/compute_image_mean examples/jennyfile/img_train_lmdb examples/jennyfile/mean.binaryproto

compute_image_mean带两个参数，第一个参数是lmdb训练数据位置，第二个参数设定均值文件的名字及保存路径。
运行成功后，会在 examples/jennyfile/ 下面生成一个mean.binaryproto的均值文件（一定要保证均值文件生成成功，检查它的大小）。

四、创建模型并编写配置文件

模型就用程序自带的caffenet模型，位置在 models/bvlc_reference_caffenet/文件夹下, 将需要的两个配置文件，复制到jennyfile文件夹内

sudo cp models/bvlc_reference_caffenet/solver.prototxt examples/myfile/sudo cp models/bvlc_reference_caffenet/train_val.prototxt examples/myfile/

修改其中的solver.prototxt

sudo vi examples/jennyfile/solver.prototxt

更改为如下参数：

net: "examples/jennyfile/train_val.prototxt"test_iter:60test_interval: 40base_lr: 0.0001lr_policy: "step"gamma:0.1stepsize:50display: 10max_iter: 100momentum: 0.9snapshot:50snapshot_prefix:"/home/jenny/caffe/examples/jennyfile/"weight_decay: 0.005solver_mode: CPU

60个测试数据，batch_size为1，因此test_iter设置为60就能全cover了（这两个参数调整了多次，每次训练都不太理想，所以最后将batch_size设为1）。在训练过程中，调整学习率，逐步变小。
修改train_val.protxt，只需要修改两个阶段的data层就可以了，其他可以不用管。

name:"CaffeNet"layer {  name: "data"  type: "Data"  top: "data"  top: "label"  include {    phase: TRAIN  }  transform_param {    mirror: true    crop_size: 227    mean_file: "examples/jennyfile/mean.binaryproto"  }# mean pixel / channel-wise mean instead of mean image#  transform_param {#    crop_size: 227#    mean_value: 104#    mean_value: 117#    mean_value: 123#    mirror: true#  }  data_param {    source: "examples/jennyfile/img_train_lmdb"    batch_size: 60    backend: LMDB  }}layer {  name: "data"  type: "Data"  top: "data"  top: "label"  include {    phase: TEST  }  transform_param {    mirror: false    crop_size: 227    mean_file: "examples/jennyfile/mean.binaryproto"  }# mean pixel / channel-wise mean instead of mean image#  transform_param {#    crop_size: 227#    mean_value: 104#    mean_value: 117#    mean_value: 123#    mirror: false#  }  data_param {    source: "examples/jennyfile/img_test_lmdb"    batch_size:1    backend: LMDB  }}

除了修改两个Data layer的mean_file和source这两个地方，还要修改最后一个全连接层fc8的num_output参数，你训练的有几类就改为几类，我改为了3类。

layer {  name: "fc8"  type: "InnerProduct"  bottom: "fc7"  top: "fc8"  param {    lr_mult: 1    decay_mult: 1  }  param {    lr_mult: 2    decay_mult: 0  }  inner_product_param {    num_output: 3    weight_filler {      type: "gaussian"      std: 0.01    }    bias_filler {      type: "constant"      value: 0    }  }}

五、训练和测试

如果前面都没有问题，数据准备好了，配置文件也配置好了，这一步就比较简单。在终端输入：

sudo build/tools/caffe train -solver examples/jennyfile/solver.prototxt

运行时间和最后的精确度会根据机器配置、参数配置的不同而不同。我的是仅CPU运行100次，大约50分钟，精度为0.333，LOSS为1.32062.训练完成后会生成_iter_100.caffemodel和_iter_100.solverstate两个文件，接下来用一个训练好的caffemodel来对一张新的图片进行分类。（在训练的时候一直出现Restarting data prefetching from start，此时需要耐心等待，我有时候出现三四次，历时30min才会显示下一次）

六、用训练好的caffemodel来分类

此步骤需要三个文件，caffemodel文件、均值文化和label.txt文件，其中caffemodel文件是训练好后保存的模型文件，在测试阶段，需要把测试数据减去均值mean.binaryproto，label.txt文件中存放的是各个类的名称，比如的这次分类较少只有三类，所以我可以手动完成。如果类别太多，必须要批量处理了。

数据准备好了，我们就可以开始分类了，我采用的是C++方法。
在caffe根目录下的 examples/cpp-classification/ 文件夹下面，有个classification.cpp文件，就是用来分类的。当然编译后，放在/build/examples/cpp_classification/ 下面
我们可以直接运行命令或者写个脚本文件

sudo vi examples/jennyfile/testonepicture.sh

打开sh文件后插入如下代码：

sudo .build/examples/cpp_classification/classification.bin \  examples/jennyfile/deploy.prototxt \  examples/jennyfile/_iter_100.caffemodel \  examples/jennyfile/mean.binaryproto \  examples/jennyfile/labels.txt \  examples/images/jgq.jpg

其中jgq.jpg图片是我另找的一张间隔器图片，

最后得到的测试结果为0.3391的可能性为间隔器：

这次测试的精度很不理想，参数也没有仔细调，但是完整地走了一遍，最大的感受就是不要放弃。接下来就是学会调参，想办法提高精度。
caffe入门我主要是学习denny的学习专栏，非常感谢博主，里面有一系列的博文，http://www.cnblogs.com/denny402/tag/caffe/ 有兴趣的可以看看。

千里之行，始于足下，fighting！


                                                     0        0           	
					
					   训练自己特定的图片及预测单张图片(仅CPU)
	  	   使用lenet模型训练及预测自己的图片数据
	  	   caffe预测单张图片
	  	   caffe训练自己的图片进行分类预测
	  	   使用CAFFE训练自己的数据集并单张图片测试的方法
	  	   少量训练数据进行单张图片的事件检测
	  	   Caffe训练自己的图片
	  	   caffe+python+mnist从图片训练到测试单张图片
	  	   caffe+python+mnist从图片训练到测试单张图片
	  	   用训练好的模型测试单张图片存在的问题
	  	   用caffe训练好的lenet_iter_10000.caffemodel测试单张mnist图片
	  	   caffe+python 使用训练好的VGG16模型 对 单张图片进行分类，输出置信度
	  	   caffe+python 使用训练好的VGG16模型 对 单张图片进行分类，输出置信度
	  	   用caffe训练好的lenet_iter_10000.caffemodel测试单张mnist图片
	  	   CPU版SSD(Single Shot MultiBox Detector)检测单张图片
	  	   caffe windows 训练自己的图片数据
	  	   caffe  如何训练自己的数据图片
	  	   用caffe训练测试自己的图片
	     		  
	  	   Java中Scanner的next和nextLine的使用以及区别
	  	   Java框架研发思考
	  	   《JAVA与模式》之模板方法模式
	  	   Linux服务管理
	  	   spring,mybatis事务管理配置与@Transactional注解使用
	  	   训练自己特定的图片及预测单张图片(仅CPU)
	  	   Android移动安全开源项目汇总（持续更新）
	  	   input回车事件未实现但页面刷新
	  	   【程序24】 题目：给一个不多于5位的正整数，要求： 一、求它是几位数，二、逆序打印出各位数字。
	  	   代码大全（5）之面向对象设计
	  	   Maven的pom.xml介绍
	  	   war包和jar包的区别
	  	   shell 中 grep、sed、awk 命令
	  	   《JAVA与模式》之访问者模式