caffe(6) 训练自己的CNN网络—图像数据转换成lmdb文件

来源:互联网 发布:centos中文输入法切换 编辑:程序博客网 时间:2024/05/18 03:55

在caffe中,最常用的数据是data类型,data类型要求输入数据是lmdb或者leveldb。而我们的原始数据通常为各种格式的图片,使用caffe生成高效数据输入就要涉及到数据转换了。caffe提供了数据转换需要的工具,convert_imageset.cpp,我们直接使用编译生成的可执行文件进行数据的转换。使用格式如下:

convert_imageset [FLAGS] ROOTFOLDER/ LISTFILE DB_NAME

ROOTFOLDER——图片存放的绝对路径

LISTFILE——文件列表清单,一般为一个txt文件,一行是一个图片的名称,如果是训练数据,则空格之后加一个标签

DB_NAME——生成的db文件的存放目录

例如,在~/caffe/examples/images/下的图片为例,建立一个脚本文件create_filellist.sh

# /usr/bin/env shDATA=examples/imagesecho "Create train.txt..."rm -rf $DATA/train.txtfind $DATA -name *cat.jpg | cut -d '/' -f3 | sed "s/$/ 1/">>$DATA/train.txt    #find the *cat.jpg, sed add "1"find $DATA -name *bike.jpg | cut -d '/' -f3 | sed "s/$/ 2/">>$DATA/tmp.txtcat $DATA/tmp.txt>>$DATA/train.txt  #combine two files togetherrm -rf $DATA/tmp.txtecho "Done.."

最后生成的train.txt如下:

cat.jpg 1fish-bike.jpg 2

接下来,我们来了解一下FLAGS这个参数组,有些什么内容:

-gray: 是否以灰度图的方式打开图片。程序调用opencv库中的imread()函数来打开图片,默认为false

-shuffle: 是否随机打乱图片顺序。默认为false

-backend:需要转换成的db文件格式,可选为leveldb或lmdb,默认为lmdb

-resize_width/resize_height: 改变图片的大小。在运行中,要求所有图片的尺寸一致,因此需要改变图片大小。 程序调用opencv库的resize()函数来对图片放大缩小,默认为0,不改变

-check_size: 检查所有的数据是否有相同的尺寸。默认为false,不检查

-encoded: 是否将原图片编码放入最终的数据中,默认为false

-encode_type: 与前一个参数对应,将图片编码为哪一个格式:‘png','jpg'......

准备好输入后,接下来写转哈un数据的脚本create_lmdb.sh

#!/usr/bin/en shDATA=examples/imagesrm -rf $DATA/img_train_lmdbbuild/tools/convert_imageset --shuffle \--resize_height=256 --resize_width=256 \/home/xxx/caffe/examples/images/ $DATA/train.txt  $DATA/img_train_lmdb

最后运行脚本即可得到需要的数据格式了



阅读全文
1 0
原创粉丝点击