SPPNet-阅读理解-笔记

来源:互联网 发布:17173英雄联盟数据 编辑:程序博客网 时间:2024/05/22 20:15

论文:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

翻译:
http://www.dengfanxin.cn/?p=403

理解参考:
http://blog.csdn.net/xjz18298268521/article/details/52681966

创新点,核心技术:
1.使用空间金字塔池化(spatial pyramid pooling)使得结构确定的网络不再需要特定大小的输入,可以给一个网络输入任意大小的图片进行学习。同时还提高了网络的精度。
2.无需特定大小的输入减少了图片信息的丢失和形变,从而提升了精度。
3.实际使用的结构和之前传统的结构对比如下:
这里写图片描述
4.在物体检测中,相比RCNN的将每一块得到的Region Proposal输入网络进行大量计算,SPPNet只把原始图像输入到网络中进行一次计算,然后在计算后的特征图中提取候选区域的特征。很大的提升了效率。
这里写图片描述

重要贡献:使得网络不再需要固定大小的输入,

原创粉丝点击