17.3.22 Multi-task Convolutional Nerual Network for Face Recognition 小感

来源:互联网 发布:数据宽度 编辑:程序博客网 时间:2024/05/01 22:19

最近读了Multi-task Convolutional Nerual Network for Face Recognition,本文主要利用了多任务学习的知识,详见http://blog.csdn.net/u011732139/article/details/61912960

首先,本文的主要贡献有四点:
1.解释了为什么可以利用多任务学习的方法(子任务是姿态,遮挡和表情,简称PIE)能够提高人脸识别的准确率。
2.提出了一种动态权重的方法,可以用这种方法来自动确定各个子任务之间的权重。
3.提出了一种基于姿态的多任务CNN来解决姿态问题
4.这是首个利用了整个Multi-PIE数据库来进行人脸识别的研究学习,并且在Multi-PIE, LFW, CFP and IJB-A这几个数据库上取得了较好的结果。

论文的第一部分首先介绍利用多任务学习的好处。一张简单的图可以比较好的解释。
这里写图片描述
在本文中,作者假设所有的任务都会公用同一张人脸特征。对于一个姿态变化较多的人脸数据库,利用单任务学习的方法可能学到的一个便捷如图左所示,每一类之间会存在一定的不可分区域,然而利用多任务学习,每个子任务(姿态)只会对每一类的影响较小,子任务只起到辅助的任务,所以显然可分。
人脸识别任务中主要的困难之处在于人脸的姿态,遮挡,(光照变化)和表情,简称为PIE。本文选取这三点作为子任务。

本文提出了多任务CNN的框架如图所示。
这里写图片描述
其中,
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述分别表示每一项任务的重要性。

接着本文提出了动态权重的方法(Dynamic-weighting scheme)
在这里,作者将主要任务权重设为1,设定一个新变量这里写图片描述
所以可以得到:
这里写图片描述
其中,新变量的大小应该小于1.

接着作者提出了给予姿态的多任务CNN。在这种方法里,作者将所有的人脸分为三个类,类别范围为:
这里写图片描述
这里写图片描述
这里写图片描述
接着作者通过一系列的实验(实验有点多),从实验结果来看,还是比较不错的。

0 0
原创粉丝点击