Faster RCNN的理解点

来源:互联网 发布:开淘宝店好做吗 编辑:程序博客网 时间:2024/05/22 13:18

faster RCNN的训练过程

第一步:特征选择网络,把一张图片经过特征提取网络,生成一个特征map,然后采用anchors机制,开始得到每一个anchors的特征,得到每一个anchors的类别,根据IOU的大小。然后分类每一个anchors和回归每一个anchors,然后计算出来loss,然后反向的传播,跟新权重,选择更好的特征网络;

        其实这是第一阶段,首先选择12000个anchors,经过nms,之后得到2000个窗口,随机选择256个窗口去计算loss

      第二步:fastRCNN,通过特征层,之后得到一个特征map,之后经过nms之后得到较好的2000个窗口,直接经过ROI Pooling得到相同的特征维度,之后送入到RCNN中,进行分类和回归,最后得到人脸的检测框:

结构框图如下:


Face-RCN做人脸检测的paper,在FDDB和WIDERFACE上都是最好的结果,主要的工作是:

1. centerloss加入原有rcnn的结构中,其实就是用centerloss训个更好的脸和非脸的分类器

2. online hard negtive sampling改进

用了centerloss之后为了保持hard negtive和postive 的样本比例为1:1,所以对online hard negtive sample做了固定的比例约束,

3. 图像做multiscale输入的训练

就是把图像做不同层级的resize来训练,以此来提升对于小脸的效果,预测的时候也做多scale预测,

结果上看效果不错,但是没有具体对不同的策略对最终结果的影响,只对比了加数据和不加数据的结果差别,加了数据平均会高2个点吧。



原创粉丝点击