Faster RCNN简单总结

来源:互联网 发布:脸型扫描软件看脸型 编辑:程序博客网 时间:2024/06/08 08:21

这里写图片描述
图片地址:http://blog.csdn.net/zy1034092330/article/details/62044941

RPN

1.RPN和Fast RCNN是提前训练好的,之后再微调的结果;
2.每次走到RPN的时候anchor数目(anchor是在原图上的)是相同的,所以物体分类和BBOX的输入时相同的输入anchor。

  • ①物体分类检测是根据anchor来判断是否为物体(正类),但是整理的框通常不够好,所以还需要计算BBOX的变换。
  • ②BBOX是由anchor的坐标回归计算得到偏移参数,可以理解为:修正目标=anchor坐标*W,我们就是要求出W。
  • 注意:RPN都是基于原图像的。

Proposal Layer

  • 将得到的W用到①中的正类进行anchor的位置修正;
  • 检查anchor在原图像上是否越界,越界就删除;
  • 进行nms;
  • 选出前300个候选框。

RoI pooling

将RPN选中的300个候选框(原图上修正后的anchor),通过spatial_scale: 1/16 映射到feature map上,在通过pooled_w: 7和pooled_h: 7将每个候选框49个,取每个对应的maxpooling值,这样得到49个全连接层的输入。

再往后就是分类器和BBox的再次精修操作(Fast RCNN的操作)。

原创粉丝点击