级联人脸检测--Detecting Faces Using Inside Cascaded Contextual CNN

来源:互联网 发布:淘宝直播赚钱吗 编辑:程序博客网 时间:2024/05/17 23:34

Detecting Faces Using Inside Cascaded Contextual CNN
ICCV2017

这里也是使用级联思想来进行人脸检测,但是不是使用多个 CNN 网络来级联的,而是使用一个CNN中不同网络层来做级联的。简单的来说就是CNN网络的前几层完成简单的人脸检测,后面的网络完成难度较大的人脸检测。 同时使用 body part localization 来辅助人脸检测

real time performance

这里写图片描述
这里写图片描述

3 Overall Framework
这里写图片描述

本文的网络结构主要包括三个部分:人脸候选区域提取模块 Proposal Net (P-Net), two Refinement Nets (R-Net-1 and R-Net-2)

人脸候选区域提取模块 Proposal Net (P-Net) 是由全卷积网络构成的,采用滑动窗口的方式对 图像金字塔(多尺度输入图像)快速处理,得到人脸候选区域;
R-Net-1 and R-Net-2 主要对第一步得到的候选区域进行去虚警和 矩形框坐标回归 bounding box regression

4 Inside Cascaded Structure
ICS has two extra components, Early Rejection Classifier (ER-C) and Data Routing (DR) layer
CNN网络的前几层完成简单的人脸检测,后面的网络完成难度较大的人脸检测, 这个策略可以让我们后面的网络专注于学习难度较大的人脸检测, deeper layers can focus on handling more difficult samples compared to traditional CNN。因为简单的非人脸区域在网络的前几层就被快速排除,这样整体的检测计算量就会降低。

4.1. Early Rejection Classifier
ERC 是一个小型分类器,用于人脸区域的二分类判断。这个分类器得到的概率输入 next DR layer 依此来决定是否需要进行后续处理。

4.2. Data Routing Layer
DR layer will change the sample set for the following network components
简单的说就是后续区域不断的减少,容易的负样本被剔除了。

An example of neural network in ERC and CNN architectures of P-Net, R-Net-1 and R-Net-2
这里写图片描述

6 Experiments

FDDB
这里写图片描述

这里写图片描述

WIDER FACE
这里写图片描述

这里写图片描述

Speed
这里写图片描述

阅读全文
0 0