人脸识别 算法

来源:互联网 发布:网络机房搬迁方案 编辑:程序博客网 时间:2024/05/21 09:22

1.http://blog.csdn.net/stdcoutzyx/article/details/42091205

2.局部二值模式  LBP

http://blog.csdn.net/smartempire/article/details/23249517/

4.

鲁棒人脸识别            http://download.csdn.net/download/lly110120/4706016#

基于稀疏表示的鲁棒人脸识别(英文+重点翻译)

3.

http://www.vipzhuanli.com/pat/books/201710011190.0/2.html

本发明涉及人脸识别领域,更具体地,涉及一种基于稀疏编码的人脸识别方法。

背景技术

随着生物工程技术及计算机科技的迅速发展,人们对安全识别与身份验证问题的需求越来越高。具有非接触、非侵扰、友好、可扩展性等优点的人脸识别技术在多种生物识别技术中脱颖而出,在视频检索、治安监控、门禁出入、身份识别等领域获得了广泛应用。随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。

目前常用的人脸识别方法大体可以分为三种:基于2D图像的人脸识别方法、基于3D图像的人脸识别方法和基于深度学习的人脸识别方法。

传统的人脸识别方法主要基于2D图像,通过提取人脸上的几何特征或表观特征,训练特定的分类器(如最近邻分类器、支持向量机等)进行识别。由于特征提取的过程容易受到姿态、光照、表情、遮挡等因素影响,基于2D图像的人脸识别方法往往只能在一些受控的环境下进行,在实际的应用中还存在很多问题。

然而人脸实质上是具有立体结构的,2D图像无法很好地表示其三维结构信息。基于3D图像的人脸识别方法通过建立人脸的3D模型,可以获得人脸丰富的几何信息,并克服基于2D图像的人脸识别方法遇到的姿态难题。不过,基于3D图像的人脸识别方法所需的图像采集设备成本高昂,建模计算量较大,在一定程度上制约了这项技术的发展。

基于深度学习的人脸识别方法则试图以端到端的方式实现人脸识别。深度卷积神经网络具有复杂的网络结构,与传统机器学习方法相比具有更强大的特征学习和表达能力,辅之有效的分类方法,能够显著提高人脸识别率。所以,深度学习成为了近年来热门的研究课题。但是深度学习非常依赖大数据,难以处理小样本学习问题。另一方面,目前对深度学习的理解还有待进一步深入,其优化过程往往比较繁琐且需要大量经验。

近年来,稀疏表示方法被广泛应用在人脸等目标识别上,其核心思想是将未知类别的测试样本表示成已知类别标签的少数训练样本的一个线性组合,最终将测试样本划分为重构误差(残差)最小的那一类。大量的实验结果表明,对于遮挡、噪声等问题,该方法具有较好的鲁棒性。研究人员对此从不同的角度进行了探索和改进,延伸出了许多有效的稀疏表示方法,其中代表性的方法包括基于Gabor特征的稀疏表示方法以及基于鲁棒统计量的稀疏编码方法。但这些方法都存在一个共同的问题,即方法中残差的分布都是以假定的形式存在的。当人脸受到遮挡或有任意像素被损坏时,残差的真实分布难以确定。

虽然目前已有很多人脸识别方法被提出,但由于人脸自身以及环境的复杂性,人脸识别技术还有许多未克服的困难,特别是当人脸图像质量不佳,受到遮挡或噪声干扰时。鲁棒人脸识别仍然被认为是生物特征识别领域极具挑战而有重要应用前景的研究方向之一。

发明内容

本发明为解决以上现有技术的难题,提供了一种基于稀疏编码的人脸识别方法,该方法无需预先假定残差的分布形式,避免了不合理的残差分布函数对人脸识别鲁棒性带来的影响。

为实现以上发明目的,采用的技术方案是:

一种基于稀疏编码的人脸识别方法,包括以下步骤:

S1.设训练样本集中包括有k个已知对象,其中第i个对象所包含的ni个训练样本表示为矩阵其中i=1,2,…,k,vij∈Rm,j=1,2,...,ni,vij表示第i个对象的第j个训练样本对应的列向量,m表示vij的维度,则训练样本集A可表示为:

其中表示训练样本的总个数;

S2.设测试样本表示为y,令重构样本yrec初始化为所有训练样本的均值;

S3.计算y与yrec之间的残差e=y-yrec

S4.定义对角矩阵P=diag(p1,p2,…,pm);

其中ed表示残差e的第d个分量,d=1,2,…,m,τ表示设定的判决阈值;

S5.定义Ψ={d|pd=1,d∈{1,2,…,m}}为重构误差小于判决阈值的像素点位置集合,设Ψ中有c个元素,即Ψ={ψ12,…,ψc};

S6.从对角矩阵P中选择第ψ12,…,ψc行的元素构造投影矩阵P*∈Rc×m

S7.计算编码向量x:其中P*y-P*Ax用来衡量鲁棒编码后的重构人脸向量与输入人脸向量y之间的偏差,λ代表拉格朗日乘子,||·||1表示l1范式约束;

S8.计算重构样本yrec:yrec=Ax;

S9.如已收敛或达到最大迭代次数,则输出最后一次迭代得到的编码向量x:其中xi表示对象i的系数,否则再次执行步骤S3~S8;

S10.将编码向量x中除xi外的成员替换为0,得到向量δi∈Rn,i的初始值为1,然后对测试样本y进行重构:

表示对象i重构的测试样本;

S11.令i=i+1,然后重复执行步骤S10,直至i>k;

S12.求取与测试样本y的重构误差,测试样本y所属的对象为重构误差最小的对应的对象:

现有的基于稀疏编码的人脸识别方法往往事先假定残差满足一定的概率分布形式,如拉普拉斯分布或高斯分布,在此基础上提出了l1或l2范式来求解稀疏编码系数。这样的处理手段在一些情况下会严重影响人脸识别的鲁棒特性,因为在实际应用中,往往无法预先知道分布函数的形式,特别是当存在遮挡、噪声或其他形式的干扰时。本发明提供的方法针对以上方法的不足之处,引入迭代优化思想,其主要解决了以下两个问题:一是无需预先假定残差的分布形式,避免了不合理的残差分布函数对人脸识别鲁棒性带来的影响;二是有选择地保留了一部分有用的像素点进行识别,在大大减少了计算量的同时,更好地解决了遮挡和像素损坏等问题,获得了更鲁棒的识别性能。

优选地,所述

优选地,所述最大迭代次数为25;收敛的条件为其中表示在第r次迭代中求解的对角矩阵P中的第i个元素,

与现有技术相比,本发明的有益效果是:

①在稀疏编码中,不预先假定残差的分布函数,避免了不合理的分布函数可能对识别性能造成的影响,提高了方法的鲁棒性;

②只保留对识别有利的像素点位置,不仅能够很好地排除受到遮挡、噪声影响的像素点,还大大降低了稀疏编码中的向量维度,降低了计算复杂度,在加快识别速度的同时提高了识别率;

③通过迭代对选择的像素位置以及稀疏编码进行优化,提高了方法的识别率和鲁棒性。