人脸对齐之SDM论文解析

来源：互联网发布：林业优化投资率编辑：程序博客网时间：2024/04/20 09:16

Supervised Descent Method(人脸对齐之SDM论文解析）

标签： SDM NLS Jacobian Hessian FaceAlignment

作者：贾金让

1.概述

文章名称：Supervised Descent Method and its Applications to Face Alignment
文章来源：2013CVPR
文章作者：Xuehan Xiong，Fernando De la Torre
简要介绍：这篇文章主要提出了一种名为SDM（Supervised Descent Method）的方法，用来最小化非线性最小二乘（Non-linear Least Squares）目标函数，即目标函数是均方误差。SDM方法通过学习得到一系列下降的方向和该方向上的尺度，使得目标函数以非常快的速度收敛到最小值，回避了求解Jacobian矩阵和Hessian矩阵的问题。下面开始详细介绍，我补充了文章中只给出结果的推导过程，并且稍微调整了一下文章中牛顿步的推导过程。

2.从牛顿步说起

数值优化在很多领域都有很重要的应用，计算机视觉中很多重要的问题比如（行人跟踪、人脸对齐等）都可以化成非线性优化问题来解决。解决非线性优化的方法有很多，其中非常常用的有基于一阶的或者是二阶的优化方法，比如梯度下降方法、牛顿步、LM算法等等。尽管很多年过去了，在二阶导可求得情况下，牛顿步仍然被认为是一个非常优秀的算法。

那么什么是牛顿步方法呢？下面简单介绍一下牛顿步，后面还会详细推导牛顿步。

牛顿步：在Hessian矩阵正定的情况下，极小值可以通过求解线性方程组来迭代求解。给定一个初始的估计值x0∈Rp×1，牛顿步的更新迭代公式如下：

x k + 1 = x k - H - 1 (x k) J f (x k) (1)

其中

H−1(xk)∈Rp×p 是在

xk点的Hessian矩阵,

Jf(xk)∈Rp×1 是在

xk点的 Jacobian矩阵。
牛顿步方法有两个主要优点：
1. 如果牛顿步可以收敛，那么它的收敛速度是二次的，收敛速度非常快。
2. 如果初始点在最小点邻域附近，那么它一定可以收敛。
但牛顿法在应用中，也有几个缺点：
1. Hessian矩阵在极小值附近是局部正定的，但可能不是全局正定的，这就会导致牛顿步并不一定朝向下降的方向。
2. 牛顿步需要函数二次可导。这个要求在实际应用中是一个很强的要求，比如图像处理中经常被使用的SIFT特征，它可以被看成是一个不可导的特征，因此在这种情况下，在我们只能通过数值逼近下降的方向或者是Hessian矩阵，但这种计算代价非常大。
3. 由于Hessian矩阵通常很大，计算它的逆矩阵代价是非常大的，复杂度通常是

O(p3)。
以上三个缺陷使我们在实际应用中，很难计算精确的Hessian矩阵，甚至连数值逼近都是很困难的（由于计算代价比较大）。因此，该文章提出了SDM方法，用数据来学习下降的方向。下面两张图可以用来初步表示牛顿步和SDM两种方法的基本原理。

image_1bc9q0m4l8s7dhk130utud1bl213.png-96.5kB

3.人脸对齐的几个概念（简单介绍）

在介绍SDM之前，还要先简单提一下人脸识别中人脸对齐的基本原理和相关的关键词，因为该SDM方法主要是在人脸对齐方面进行应用。
人脸对齐（Face Alignment）基本原理：
基本概念：人脸识别（face recognizaton）按顺序可以大体上分为四个部分，即人脸检测（face detection),人脸对齐（face alignment），人脸校验（face verification）和人脸识别（face identification）。人脸检测就是在一张图片中找到人脸所处的位置，即将人脸圈出来，比如拍照时数码相机自动画出人脸。人脸对齐就是在已经检测到的人脸的基础上，自动找到人脸上的眼睛鼻子嘴和脸轮廓等标志性特征位置。人脸校验就是判断两张脸是不是同一个人。人脸识别就是给定一张脸，判断这张脸是谁。
本文研究其中的第二部分，人脸对齐。
人脸对齐中的几个关键词：
形状（shape）：形状就是人脸上的有特征的位置，如下图所示，每张图中所有黄点构成的图形就是该人脸的形状。
特征点（landmark）：形状由特征点组成，图中的每一个黄点就是一个特征点。

image_1bc9qc9jl1ap9a2q8e31nn39q19.png-387.7kB

人脸对齐的最终目的就是在已知的人脸方框（一般由人脸检测确定人脸的位置）上定位其准确地形状。
人脸对齐的算法主要分为两大类：基于优化的方法（Optimization-based method）和基于回归的方法（Regression-based method）。
SDM方法属于基于回归的方法。
基于回归的方法的基本原理：对于一张给定的人脸，给出一个初始的形状，通过不断地迭代，将初始形状回归到接近甚至等于真实形状的位置。

0

阅读全文

0 0