Faster RCNN的理解点

来源：互联网发布：开淘宝店好做吗编辑：程序博客网时间：2024/05/22 13:18

faster RCNN的训练过程

第一步：特征选择网络，把一张图片经过特征提取网络，生成一个特征map，然后采用anchors机制，开始得到每一个anchors的特征，得到每一个anchors的类别，根据IOU的大小。然后分类每一个anchors和回归每一个anchors，然后计算出来loss，然后反向的传播，跟新权重，选择更好的特征网络；

其实这是第一阶段，首先选择12000个anchors，经过nms，之后得到2000个窗口，随机选择256个窗口去计算loss

第二步：fastRCNN，通过特征层，之后得到一个特征map，之后经过nms之后得到较好的2000个窗口，直接经过ROI Pooling得到相同的特征维度，之后送入到RCNN中，进行分类和回归，最后得到人脸的检测框：

结构框图如下：

Face-RCN做人脸检测的paper，在FDDB和WIDERFACE上都是最好的结果，主要的工作是：

1. centerloss加入原有rcnn的结构中，其实就是用centerloss训个更好的脸和非脸的分类器

2. online hard negtive sampling改进

用了centerloss之后为了保持hard negtive和postive 的样本比例为1:1，所以对online hard negtive sample做了固定的比例约束，

3. 图像做multiscale输入的训练

就是把图像做不同层级的resize来训练，以此来提升对于小脸的效果，预测的时候也做多scale预测，

结果上看效果不错，但是没有具体对不同的策略对最终结果的影响，只对比了加数据和不加数据的结果差别，加了数据平均会高2个点吧。

阅读全文

0 0