深度学习与人脸识别系列(7)__人脸识别算法简要说明与总结

来源:互联网 发布:windows平板模式模拟器 编辑:程序博客网 时间:2024/05/21 07:15

  

作者:wjmishuai

出处:http://blog.csdn.net/wjmishuai/article/details/50854168

声明:版权所有,转载请注明出处

代码下载地址:https://github.com/PatienceKai/VGG_Face_Caffe_Model    


        现在,有很多关于人脸识别的卷积神经网络,我首先需要对这些模型进行了评估分析,从一些无关的信息中分析出对于人脸识别模型重要的信息。得到一个简单有效的网络架构,从而提取到表达能力比较强的特征。


       由于目前有一些公开的人脸数据库(webface,CelebA等)可以用来训练深度卷积神经网络。但是相对于那些大公司,我们的训练集还是太少了。所以,在训练深度学习模型时我采取了一些策略,为的是解决人脸数据集因为数据量不够而导致模型不收敛的问题,比如说作镜像。


       参考2014年Oxford在ImageNet比赛用的大规模图像识别的VGG网络,我们用这个网络来训练人脸识别模型。VGG网络由11个块组成。每个块都包含一个线性变换和紧随其后的一个或多个非线性变换,比如说ReLU(Rectified Linear Units) 和max pooling操作。加入非线性变换的原因是,线性模型的表达能力不够强,所以我们需要引进非线性的因素。前八个这样的块称做卷积层。最后三个块被称为全连接层(FC)。



         我们的目标是训练模型的网络参数,使逻辑回归损失函数最小化。卷积神经网络使用的滤波器的权值采用随机采样的方式初始化,服从均值为0,标准差为的高斯分布。偏置被初始化为0。对训练的图像进行归一化,使其宽度和高度均为256。在训练过程中,我们从256*256的图像中随机采样224*224大小的图像,然后对数据集作镜像。这样做的目的都是为了扩充训练集,使卷积神经网络能够学习到更好的特征。

         训练完成后,我们使用欧氏距离判断两个人脸图像是否具有相同的身份。


0 0