caffe训练我们自己的数据

来源:互联网 发布:网络术语举铁什么意思 编辑:程序博客网 时间:2024/06/10 04:26

本篇继续之前的教程,下面我们尝试使用别人定义好的网络,来训练我们自己的网络。

1、准备数据

首先很重要的一点,我们需要准备若干种不同类型的图片进行分类。这里我选择从ImageNet上下载了3个分类的图片(Cat,Dog,Fish)。

图片需要分两批:训练集(train)、测试集(test),一般训练集与测试集的比例大概是5:1以上,此外每个分类的图片也不能太少,我这里每个分类大概选了5000张训练图+1000张测试图。

找好图片以后,需要准备以下文件:

words.txt:分类序号与分类对应关系(注意:要从0开始标注

0 cat1 dog2 fish

 

train.txt:标明训练图片路径及其对应分类,路径和分类序号直接用空格分隔,最好随机打乱一下图片

复制代码
/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_4416.JPEG 0/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_3568.JPEG 0/opt/caffe/examples/my_simple_image/data/fish_train/n02512053_4451.JPEG 2/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_3179.JPEG 0/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_6956.JPEG 0/opt/caffe/examples/my_simple_image/data/cat_train/n02123045_10143.JPEG 0
......
复制代码

 

val.txt:标明测试图片路径及其对应分类

/opt/caffe/examples/my_simple_image/data/dog_val/n02084071_12307.JPEG 1/opt/caffe/examples/my_simple_image/data/dog_val/n02084071_10619.JPEG 1/opt/caffe/examples/my_simple_image/data/cat_val/n02123045_13360.JPEG 0/opt/caffe/examples/my_simple_image/data/cat_val/n02123045_13060.JPEG 0/opt/caffe/examples/my_simple_image/data/cat_val/n02123045_11859.JPEG 0
......

 

2、生成lmdb文件

lmdb是caffe使用的一种输入数据格式,相当于我们把图片及其分类重新整合一下,变成一个数据库输给caffe训练。

这里我们使用caffenet的create_imagenet.sh文件修改,主要是重新指定一下路径:

复制代码
EXAMPLE=examples/my_simple_image/DATA=examples/my_simple_image/data/TOOLS=build/toolsTRAIN_DATA_ROOT=/VAL_DATA_ROOT=/# 这里我们打开resize,需要把所有图片尺寸统一RESIZE=trueif $RESIZE; then  RESIZE_HEIGHT=256  RESIZE_WIDTH=256else  RESIZE_HEIGHT=0  RESIZE_WIDTH=0fi.......echo "Creating train lmdb..."GLOG_logtostderr=1 $TOOLS/convert_imageset \    --resize_height=$RESIZE_HEIGHT \    --resize_width=$RESIZE_WIDTH \    --shuffle \    $TRAIN_DATA_ROOT \    $DATA/train.txt \    $EXAMPLE/ilsvrc12_train_lmdb  #生成的lmdb路径echo "Creating val lmdb..."GLOG_logtostderr=1 $TOOLS/convert_imageset \    --resize_height=$RESIZE_HEIGHT \    --resize_width=$RESIZE_WIDTH \    --shuffle \    $VAL_DATA_ROOT \    $DATA/val.txt \    $EXAMPLE/ilsvrc12_val_lmdb    #生成的lmdb路径
echo "Done."
复制代码

 

3、生成mean_file

下面我们用lmdb生成mean_file,用于训练(具体做啥用的我还没研究。。。)

这里也是用imagenet例子的脚本:

复制代码
EXAMPLE=examples/my_simple_imageDATA=examples/my_simple_imageTOOLS=build/tools$TOOLS/compute_image_mean $EXAMPLE/ilsvrc12_train_lmdb $DATA/imagenet_mean.binaryprotoecho "Done."
复制代码

 

 

4、修改solver、train_val配置文件

这里我们可以选用cifar的网络,也可以用imagenet的网络,不过后者的网络结构更复杂一些,为了学习,我们就用cifar的网络来改。

把cifar的两个配置文件拷过来:

cifar10_quick_solver.prototxt
cifar10_quick_train_test.prototxt

首先修改cifar10_quick_train_test.prototxt的路径以及输出层数量(标注出黑体的部分):

复制代码
name: "CIFAR10_quick"layer {  name: "cifar"  type: "Data"  top: "data"  top: "label"  include {    phase: TRAIN  }  transform_param {    mean_file: "examples/my_simple_image/imagenet_mean.binaryproto"  }  data_param {
source: "examples/my_simple_image/ilsvrc12_train_lmdb" batch_size: 50 #一次训练的图片数量,一般指定50也够了 backend: LMDB }}layer { name: "cifar" type: "Data" top: "data" top: "label" include { phase: TEST } transform_param { mean_file: "examples/my_simple_image/imagenet_mean.binaryproto" } data_param { source: "examples/my_simple_image/ilsvrc12_val_lmdb" batch_size: 50 #一次训练的图片数量 backend: LMDB }}
..........
layer { name: "ip2" type: "InnerProduct" bottom: "ip1" top: "ip2" .......... inner_product_param { num_output: 3 #输出层数量,就是你要分类的个数 weight_filler { type: "gaussian" std: 0.1 } bias_filler { type: "constant" } }}......
复制代码

 

cifar10_quick_solver.prototxt的修改根据自己的实际需要:

复制代码
net: "examples/my_simple_image/cifar/cifar10_quick_train_test.prototxt"   #网络文件路径
test_iter: 20 #测试执行的迭代次数
test_interval: 10 #迭代多少次进行测试base_lr: 0.001 #迭代速率,这里我们改小了一个数量级,因为数据比较少
momentum: 0.9weight_decay: 0.004lr_policy: "fixed" #采用固定学习速率的模式display: 1 #迭代几次就显示一下信息,这里我为了及时跟踪效果,改成1max_iter: 4000 #最大迭代次数snapshot: 1000 #迭代多少次生成一次快照snapshot_prefix: "examples/my_simple_image/cifar/cifar10_quick" #快照路径和前缀solver_mode: CPU #CPU或者GPU
复制代码

 

5、开始训练

运行下面的命令,开始训练(为了方便可以做成脚本)

./build/tools/caffe train --solver=examples/my_simple_image/cifar/cifar10_quick_solver.prototxt

 

6、小技巧

网络的配置和训练其实有一些小技巧。

- 训练过程中,正确率时高时低是很正常的现象,但是总体上是要下降的

- 观察loss值的趋势,如果迭代几次以后一直在增大,最后变成nan,那就是发散了,需要考虑减小训练速率,或者是调整其他参数

- 数据不能太少,如果太少的话很容易发散

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 手机显示无法解析dns地址怎么办 台式电脑宽带连接不上怎么办 电信宽带账号登录密码忘记了怎么办 电信校园宽带超时了怎么办 宽带连接账号密码忘了怎么办 移动宽带路由器上不了网怎么办 移动宽带太卡了怎么办 电信adsl密码忘记了怎么办 移动宽带无法连接网络怎么办 移动宽带电视无信号怎么办 联通网线故障电话打不通怎么办 w10系统ip地址错误怎么办 移动流量太贵了怎么办 修改wifi密码ip地址怎么办 苹果6s接电话声音小怎么办 k歌录音器失败怎么办 想报警但不能说话怎么办 微粒贷要家人电话怎么办 4g网络信号差怎么办 手机移动网络信号不好怎么办 移动的4g网络差怎么办 4g移动网络慢怎么办 房间没有4g网络怎么办 oppo显示2g网络怎么办 oppo只有2g网络怎么办 移动卡4g网络慢怎么办 易信专线电话用完了怎么办 手机拨打电话时黑屏怎么办 网易号文章一直审核中怎么办 登陆积分会员忘记密码怎么办 易信密码忘记了怎么办 滴滴永久封停的号怎么办 微信版本过低怎么办 报关时通关单号没录怎么办 公司注销了行政许可证怎么办呢 报关项数超过50项怎么办 出口报关件数报多了怎么办 关税少交被海关缉私查到怎么办 外贸报关hs编码报错怎么办 报关金额少报了怎么办 进口报关金额少报了怎么办