SSD:Single Shot MultiBox Detector的安装配置和运行

来源:互联网 发布:惊讶猫走红网络 编辑:程序博客网 时间:2024/05/15 21:44

SSD(Single Shot MultiBox Detector)算是一个比较不错的目标检测算法,主攻方向是速度,当然精度也比Yolo提高了一些,最近在ubuntu16.04下实现了代码运行,此博文主要内容来自原作者的github,加上了一些个人理解,欢迎探讨。

准备工作:Linux+cuda+caffe是标配,我就不详述了,推荐博客:

ubuntu16.04+nvidia gt740m+cuda7.5+caffe安装、测试经历 http://blog.csdn.NET/WoPawn/article/details/52313914

下面正式开始:

1.获取源码

[plain] view plain copy
  1. git clone https://github.com/weiliu89/caffe.git  
  2. cd caffe  
  3. git checkout ssd  

说明:SSD采用的是在caffe文件夹中内嵌例程的方式,作者改动了原版caffe,所以你需要把原来的caffe文件夹移除,Git命令会新建一个带有SSD程序的caffe文件夹,当然,这个新的caffe要重新编译一次。

2.编译caffe

[plain] view plain copy
  1. cd /home/mx/caffe  
  2. cp Makefile.config.example Makefile.config  

运行时报错不断,事后总结,需要修改配置文件,用gedit或者vim打开配置文件进行修改:

1)Makefile.config文件中

USE_CUDNN :=1取消注释

2)Makefile.config文件中

INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include后面打上一个空格,

然后添加/usr/include/hdf5/serial, 如果没有这一句会报一个找不到hdf5.h的错误

3)makefile文件中

替换NVCCFLAGS += -ccbin=$(CXX) -Xcompiler -fPIC $(COMMON_FLAGS)

NVCCFLAGS += -D_FORCE_INLINES -ccbin=$(CXX) -Xcompiler -fPIC $(COMMON_FLAGS) 

保存退出。

继续输入命令

[plain] view plain copy
  1. make -j8 #8线程  
  2. make py  
  3. make test -j8  
  4. make runtest -j8 #貌似不是必须的,跑一遍用了10多分钟  

3.训练模型

节省时间的做法是,直接下载原作者最终弄好的模型:

http://www.cs.unc.edu/~wliu/projects/SSD/models_VGGNet_VOC0712_SSD_300x300.tar.gz 

解压后将voc0712文件夹放入/home/mx/caffe/models/VGGNet/之下

OR:条件较好的同学可以下载图片数据和预训练模型,进行finetuning,得到最终可用的模型,步骤如下:

1)下载预训练模型 

https://gist.github.com/weiliu89/2ed6e13bfd5b57cf81d6

将其放入新建的文件夹/home/mx/caffe/models/VGGNet/

2)下载voc2007和voc2012数据集

[plain] view plain copy
  1. cd /home/mx/data  
  2. wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar  
  3. wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar  
  4. wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar  

如果终端下载太慢,那就按照地址手动下载文件,依然放入文件夹/home/mx/data/

解压文件,按照顺序来

[plain] view plain copy
  1. cd /home/mx/data  
  2. wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar  
  3. wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar  
  4. wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar  

3)将图片转化为LMDB文件,用于训练

[plain] view plain copy
  1. cd /home/mx/caffe  
  2. ./data/VOC0712/create_list.sh  
  3. ./data/VOC0712/create_data.sh  

这里用的脚本实现批处理,可能会出现错误:no module named caffe或者no module named caffe-proto,那是caffe的Python环境变量未配置好,解决方法:

[plain] view plain copy
  1. echo "export PYTHONPATH=/home/username/caffe/python" >> ~/.profile  
  2. source ~/.profile  
  3. echo $PYTHONPATH #检查环境变量的值  

设好环境变量后,重新运行命令就不会出错了

4)训练模型(finetuning)

[plain] view plain copy
  1. cd caffe/  
  2. python examples/ssd/ssd_pascal.py  

4.演示效果

SSD的作者在/home/mx/caffe/examples/ssd/文件夹下,放了好几个Python文件,都是直接调用,可以检测图片,视频,以及电脑前置摄像头

1)图片测试集

[plain] view plain copy
  1. python examples/ssd/score_ssd_pascal.py  

大概看了下代码们这里是跑了一遍数据集,得出准确率,我记得是百分之70多。要想用单张图片检测,貌似ssd_detect.cpp可用,博主还要研究下

2)电脑前置摄像头

[plain] view plain copy
  1. python examples/ssd/ssd_pascal_webcam.py  

下图为检测效果,身在实验室,只能对准天花板了:

 3)视频检测

[plain] view plain copy
  1. python examples/ssd/ssd_pascal_video.py  

当然,这样直接跑肯定不行,要先用vim打开该文件,定位到51行,修改视频路径为已有本地视频,然后运行才不报错。

博主在youtube下载了一段车载视频,以下是检测效果图,还不错:

原作者说SSD运行时能有几十帧,可是人家用的是Titan X,我运行时只有10帧只能是GTX850M显卡太渣了。。。

参考文献:https://github.com/weiliu89/caffe/tree/ssd

下一步方向:研究SSD的python源代码,然后训练和检测自己的数据

0 0