深度学习与人脸识别系列（7）__人脸识别算法简要说明与总结

来源：互联网发布：windows平板模式模拟器编辑：程序博客网时间：2024/05/21 07:15

作者：wjmishuai

出处：http://blog.csdn.net/wjmishuai/article/details/50854168

代码下载地址:https://github.com/PatienceKai/VGG_Face_Caffe_Model

现在，有很多关于人脸识别的卷积神经网络，我首先需要对这些模型进行了评估分析，从一些无关的信息中分析出对于人脸识别模型重要的信息。得到一个简单有效的网络架构，从而提取到表达能力比较强的特征。

由于目前有一些公开的人脸数据库（webface，CelebA等）可以用来训练深度卷积神经网络。但是相对于那些大公司，我们的训练集还是太少了。所以，在训练深度学习模型时我采取了一些策略，为的是解决人脸数据集因为数据量不够而导致模型不收敛的问题，比如说作镜像。

参考2014年Oxford在ImageNet比赛用的大规模图像识别的VGG网络，我们用这个网络来训练人脸识别模型。VGG网络由11个块组成。每个块都包含一个线性变换和紧随其后的一个或多个非线性变换，比如说ReLU(Rectified Linear Units) 和max pooling操作。加入非线性变换的原因是，线性模型的表达能力不够强，所以我们需要引进非线性的因素。前八个这样的块称做卷积层。最后三个块被称为全连接层（FC）。

我们的目标是训练模型的网络参数，使逻辑回归损失函数最小化。卷积神经网络使用的滤波器的权值采用随机采样的方式初始化，服从均值为0，标准差为的高斯分布。偏置被初始化为0。对训练的图像进行归一化，使其宽度和高度均为256。在训练过程中，我们从256*256的图像中随机采样224*224大小的图像，然后对数据集作镜像。这样做的目的都是为了扩充训练集，使卷积神经网络能够学习到更好的特征。

训练完成后，我们使用欧氏距离判断两个人脸图像是否具有相同的身份。

0 0