对Region Proposal Network,RPN的理解

来源:互联网 发布:结构有限元分析软件 编辑:程序博客网 时间:2024/06/06 19:44

RPN的网络结构
    从共享卷积特征图(若使用ZF,则为第五个卷积层,13*13)以卷积的方式(窗口大小为3*3)获得256维的特征向量,一共12*12个,每一个对应原图上171*171像素大小的区域。每一个256维的向量分别被送入两个全连接层,目标框回归层和目标分类层。
    RPN引入Anchor机制。在共享卷积特征图的每一个滑窗位置有k个原图上的候选矩形区域,用于训练全连接层的不同回归模型。因此矩形框回归层有4k个输出,表达k个矩形的坐标,目标分类层有2k个输出,表达k个候选区是目标以及不是目标的概率。每个滑窗位置候选矩形区形状有9种,128*128,256*256,512*512三种面积大小,以及1:1,1:2,2:1三种长宽比。可以覆盖原图上各个位置,各个大小的目标。
   

原创粉丝点击