DeepFace介绍

来源：互联网发布：英语句子成分解析软件编辑：程序博客网时间：2024/06/07 19:46

DeepFace是FaceBook提出来的，后续有DeepID和FaceNet出现。而且在DeepID和FaceNet中都能体现DeepFace的身影，所以DeepFace可以谓之CNN在人脸识别的奠基之作，目前深度学习在人脸识别中也取得了非常好的效果。下边介绍DeepFace的基本框架：

一、人脸检测（face detection）

DeepFace采用了基于检测点的人脸检测方法（fiducial Point Detector）

二、人脸对齐（face alignment）

2D alignment：

对Detection后的图片进行二维裁剪， scale, rotate and translate the image into six anchor locations，将人脸部分裁剪出来。

3D alignment：

上图的2D alignment对应(b)图，3D alignment依次对应(c) ~ (h)。

三、人脸表示（face verification）

经过3D对齐以后，形成的图像都是152×152的图像，送入CNN，其结果如下：

C1：卷积层，卷积核尺寸11*11，共32个卷积核

M2：池化层，最大池化3*3，即stride = 2

C3：卷积层，卷积核尺寸9*9 ，共16个卷积核

L4：卷积层，卷积核尺寸9*9 ，共16个卷积核。L表示local，意思是卷积核的参数不共享

L5：卷积层，卷积核尺寸7*7 ，共16个卷积核。

L6：卷积层，卷积核尺寸5*5 ，共16个卷积核。

F7：全连接，4096个神经元

F8：全连接，4030个神经元

前三层的目的在于提取低层次的特征，比如简单的边和纹理。其中Max-pooling层使得卷积的输出对微小的偏移情况更加鲁棒。但没有用太多的Max-pooling层，因为太多的Max-pooling层会使得网络损失图像信息。

紧接着的三层都是使用参数不共享的卷积核，之所以使用参数不共享，有如下原因：

全连接层将上一层的每个单元和本层的所有单元相连，用来捕捉人脸图像不同位置的特征之间的相关性。其中，第7层（4096-d）被用来表示人脸。全连接层的输出可以用于Softmax的输入，Softmax层用于分类。

四、人脸表示的归一化

对于输出的4096维向量：

五、分类

得到表示后，使用了多种方法进行分类：

阅读全文

0 0