Faster R-CNN

来源:互联网 发布:汤普森数据 编辑:程序博客网 时间:2024/05/16 17:51

文章:http://arxiv.org/pdf/1506.01497v1.pdf

Faster R-CNN 可以看做是对 Fast R-CNN 的进一步加速,最主要解决的如何快速获得 proposal,一般的做法都是利用显著性目标检测(如Selective search)过一遍待检测图,得到proposal。基于区域的深度卷积网络虽然使用了 GPU 进行加速,但是the region proposal methods 确却都是在 CPU上实现的,这就大大地拖慢了整个系统的速度。然后作者提出,卷积后的特征图同样也是可以用来生成 region proposals 的。通过增加两个卷积层来实现 Region Proposal Networks (RPNs) , 一个用来将每个特征图 的位置编码成一个向量,另一个则是对每一个位置输出一个 objectness score 和 regressed bounds for k region proposals。



在每个sliding-window 位置, 提出K个proposal,这里面用到了 anchors 这个词,还没找到合适的中文翻译,这些 proposals 是 3 scales with box areas of 128*128,256*256, and512*512 pixels, and 3 aspect ratios of 1:1, 1:2, and 2:1。


现在坐等代码,本文最大的创新在于将region proposal放到卷积层中做,极大地利用了现有的资源(Shared conv feature),这些都在GPU中实现,期待实际应用的效果!




0 0
原创粉丝点击