multi-view face detection using deep convolutional neural networksz

来源：互联网发布：软件研发面试题编辑：程序博客网时间：2024/05/16 07:28

新年的第一篇博客，希望自己能坚持一年把每周刷的文章都做个标记。加油 fighting

这个博客下讲的比较清楚:

http://m.blog.csdn.net/blog/shuzfan/49825751

摘要：

在这篇文章中我们主要讨论多视角人脸检测，目前主流的方法需要landmark点的标注信息（比如TSM），或者是人脸姿态的标注信息（就是要把检测到的人脸分成0°，左右30 ° 60 ° 90°等）同时也需要在所有的方向上训练多个模型（比如在HeadHunter method 中我们需要训练22 个模型）。在这篇文章中我们提出（Deep Dense Face Detector），这个方法不需要图像的landmark 点和角度的标注信息，用单个模型在wide 方向范围内检测人脸，这个方法是一个神经网络的方法。与其他最近的深度学习物体检测算法相比，这个算法有最小的复杂度并且它也不需要其他的操作，比如对图像进行分割，bounding-box regression 或者svm 分类器。更进一步地,我们得到一下结论：这个方法能够在多个角度上检测人脸并且能在一定程度上处理occlusion。2）正样本在训练集中的分布情况与（proposed face detector 的分数）有一定的相关性。2）使得我们相信更好的抽样策略和更好的数据扩充方式可以改进检测效果。

2）PROPOSED METHOD

我们使用fine-tuing AlexNet 网络来进行人脸检测。我们从AFLW中抽取训练集，为了增加正样本的个数，1.我们对训练样本进行随机crop，如果（IOU大于50%）我们认为正样本，2.随机flip 这些训练样本。最后的结果是我们得到200K 的positive 样本和20million 的negtive 样本，所有的图片resize 到227*227 finetuing AlexNet。我们使用50K 的迭代在batchsize 为128 的情况下。每个batchsize 里面包含32个正样本和96 个负样本（最佳比例？）

CNN 网络：5层卷积+3层全连接(转换全连接层到卷积层通过reshape layer 的参数)。这样可以得到热力图。

检测到的区域用极大值抑制来精确的定位位置信息。最后，我们在不同尺度上检测到人脸，得到新的热力图。

0 0