Fast-RCNN-阅读理解-笔记

来源:互联网 发布:金亚洲软件下载 编辑:程序博客网 时间:2024/05/17 10:06

论文:Fast R-CNN

翻译:http://blog.csdn.net/qq_14839543/article/details/54425051 (这个翻译不是很好呢)

理解参考:http://blog.csdn.net/shenxiaolu1984/article/details/51036677
http://blog.csdn.net/u011534057/article/details/51241831
https://www.cnblogs.com/skyfsm/p/6806246.html

创新点,核心技术:
相比与原本的RCNN中的
1.在图像中确定一定数量的候选框
2.使用深度网络提取每一个候选框的特征
3.使用分类器判断提取出的特征所属的类
4.使用回归器调整正确分类的框的位置.
的方法来说fast-rcnn 将一整张图像送入深度网络中,然后送入候选区域,从特征图像上直接提取对应的候选区域的特征向量.大大减少了训练以及测试的时间消耗.
POI Pooling
近似于单层SPPNet的网络层,这个层可以把不同大小的输入映射到一个固定尺寸的特征向量,再送入分类器进行分类.
这里写图片描述
使用softmax进行分类操作,该操作直接在网络中完成,使用GPU显存,不需要再在硬盘中存储特征向量,减少了存储空间的开销.
joint training:

重要贡献:同样使用最大规模的网络,Fast RCNN和RCNN相比,训练时间从84小时减少为9.5小时,测试时间从47秒减少为0.32秒。在PASCAL VOC 2007上的准确率相差无几,约在66%-67%之间.

原创粉丝点击