DeepID2+ face recognition

来源:互联网 发布:python url encode 编辑:程序博客网 时间:2024/06/05 22:40

DeepID2+ face recognition

DeepID2+[1]的结构与DeepID2[2]基本一致,不同之处在于每个conv layer的feature maps数量不同,同时每个conv layer在maxpooling之后都连接了fully-connected layer(简称Fc-1,Fc-2,Fc-3,Fc-4)。与DeepID2一样,DeepID2+也引入了identification signals和verifacation signals,并且在所有的Fc层(Fc-1,Fc-2,Fc-3,Fc-4层)均含有这两类信号。
由于对结构进行了调整,使得人脸验证的准确率提升到了99.47%,并且对遮挡情况具有一定的鲁棒性。除此之外,在论文中作者还验证了DeepID2+的三个特性——sparsity,selectiveness和robustness,试图揭示深度神经网络为何具有如此高效的性能。

Network Architecture


上图为DeepID2+的网络结构。这里有几个不同的地方:

1.每个conv层的feature maps都增加到了128
2.training set更大,除了包含原来DeepID,DeepID2使用的CelebFaces+,还加入了WDRef数据集。使得训练集包含了290000 张12000不同identities的人脸,在之前的DeepID2中使用的数据集只包含了160000张8000不同identities的人脸。
3.对于每个conv层,在maxpooling之后都会连接一个fully-connected层,它们作为最终的人脸feature,后面的实验会介绍这几个fc层的使用,FC-4的鲁棒性是最好的。每个FC层都是512维的,训练的过程中都引入了identification signals和verifacation signals。

可以看出,相比于DeepID2,DeepID2+的网络规模更大,而且引入的信息也更多了。

Performance

在训练的过程中,参数的更新方式和DeepID2基本一样,input face patches也采用了和DeepID中一样的25个patches。
测试的时候,DeepID2+采用了FC-4 layer作为特征。
在性能上,25个不同的DeepID2+ features都完胜DeepID2 features

Three Properties

在介绍了DeepID2+之后,作者还试图从本质上揭示它如此高效的本质,揭开深度神经网络的神秘面纱。

sparsity

对于同一张输入图像,不同的神经元对它的反应是不同的,大概有一半的神经元处于激活状态,而另一半处于抑制状态,这使得不同的identity具有最大的区分性。
而对于同一神经元,大概有一半的样本能将其激活,而对另一半处于抑制状态,这使得神经网络具有最大的区分能力。
同时,是否使用dropout对上述两种现象基本没有影响。

之后,文章还验证了神经元的激活状态比激活值更重要,在将DeepID2+ features二值化之后,得到的验证结果只比原来稍微下降一点。将来可采用binary code直接作为特征,这样既能提高匹配速度,还能节省存储空间。

selectiveness

这里说明DeepID2+ features具有属性信息,除了能利用它来进行face cerification,还可以用来进行性别、肤色、种族等的区分。
除此之外,每个神经元对同一identify或者attribute的敏感程度不同,200左右的神经元较为活跃,neural ID大于400的神经元活跃度很低。而对于其它所有的图像,活跃度变化基本不大,而且活跃度基本处于中间位置,这里可以看出它增加了网络的识别能力。下图也显示了这一现象。

神经元激活值的分布直方图也反映了这一现象,我们可以看出,神经元对于不同的identify和attirbute都会有相应的反应,每个神经元都有一定的记忆性,包含大量的样本属性信息。

robustness


作者对测试样本采用了两种不同的处理方法——从下往上按一定比例遮挡,随机block遮挡。
但是这里有一点需要注意的是,训练样本中并未含有经遮挡处理后的图像,而在后面的人脸验证中却对遮挡具有很好的鲁棒性,这也说明了DeepID2+有多神奇。

对于不同的遮挡情况,神经元的激活值有会有相应的变化,当遮挡面积越来越多的时候,神经元的激活状态就开始具有一定的随机性。回想一下前面介绍的神经元激活值分布直方图,其实随着遮挡面积的增加,它就趋向于将输入识别为其它类别时的激活情况一致,因此这些神经元就失去了特殊性。
实验中作者还将25个FC-4+ features合并(DeepID2+ combine),同时还分别测试single FC-1,FC-2,FC-3,FC-4以及传统特征提取方法LBP,验证它们对于遮挡情况的鲁棒性。发现FC-1,FC-2,FC-3,FC-4鲁棒性基本上是从小到大排列的,DeepID2+ combine最高,而传统的LBP是最差的。在遮挡面积达到40%的时候,DeepID2+还能保持在90%以上。occlusion block大小为50×50的时候,DeepID2+最高还能达到92.4%,而LBP急剧下降。


25个FC-4组成的DeepID2+ combine features具有非常好的鲁棒性,同时二值化后的DeepID2+ combine features仍然能基本上完全保留原来的信息,可分性依然非常高,相比DeepID2,DeepID2+ combine features的维度更大一些。

参考文献

[1] Sun Y, Wang X, Tang X. Deeply learned face representations are sparse, selective, and robust[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2015: 2892-2900.
[2] Sun Y, Chen Y, Wang X, et al. Deep learning face representation by joint identification-verification[C]//Advances in Neural Information Processing Systems. 2014: 1988-1996.

0 0
原创粉丝点击