笔记 RASL: Robust Alignment by Sparse and Low-Rank Decomposition for Linearly Correlated Images
来源:互联网 发布:温长卿 知乎 编辑:程序博客网 时间:2024/06/05 15:39
Peng, Y., Ganesh, A., Wright, J., Xu, W., & Ma, Y. (2012). RASL: Robust alignment by sparse and low-rank decomposition for linearly correlated images. IEEE Transactions on Pattern Analysis and Machine Intelligence, 34(11), 2233-2246.
本文是这篇 PAMI 期刊论文的笔记,主要是对文中的理论方法进行展开详解。本人学术水平有限,文中如有错误之处,敬请指正。
摘要:此文研究的问题是同时对齐(配准)一批线性相关的图像,而排除一些破坏(如遮挡)。此文的方法在图像变换域里寻找一个最优集,使得变换之后的图像矩阵可以被分解为一个错误部分的稀疏矩阵,和一个恢复的对齐的低秩的矩阵。此文为了解决这样一个具有挑战性的优化问题,使用了一系列的凸规划,最小化稀疏矩阵的
如图所示,本文的方法是将一批相似度很高的图像(不仅是人脸)作为输入,首先进行平面的对齐(配准),然后通过本文的 RASL 算法,将它们分解为低秩部分(相似度非常高)和稀疏误差部分(图像之间差异值最大的部分)。
此论文并不是一项开山之作,而是在之前的研究基础之上的改进版本。首先介绍一下这个研究课题组的 leader: Prof. Yi Ma, Senior Member, IEEE, University of Illinois at Urbana-Champaign. 研究成果都展示在 这里 了,论文和代码都公开了,可以供感兴趣的读者下载,自行研究。
Robust Parameterized Component Analysis 1 算法虽然也拟合一个低阶模型,有效地减少了损坏和遮挡的影响。但是这是一个非凸优化问题,没有理论保证鲁棒性和收敛率。最近提出的 Rank-Sparsity 2, RPCA 3 秩最小化已经证明了它确实有可能通过凸优化方法,有效地恢复低秩矩阵。
要想看懂此文之前,还需要一点预备知识,可以学习 Alternating Direction Method 4,Singular Value Thresholding 5,Dual Method 6 和 Augmented Lagrange Multiplier (ALM) Method 7。这些方法思想都和很简单。
2 图像对齐通过矩阵的秩最小化
2.1 矩阵的秩作为衡量图像的相似度
假设我们有
那么这个矩阵
2.2 建模非对齐作为形变
图像的偏差使得在许多应用中存在困难。上面的低秩矩阵的模型,只要在有一点图像未对齐的情况下,就会失效。文中提到,由于图像的3D结构未知,假设图像的形变只在图像平面上。于是,可以将图像未对齐建模为形变。具体来说,如果
在大多数实际应用中,我们把形变建模为有限维度组
把上面两个模型结合起来:假设
有很小的秩,其中
2.3 建模损坏和遮挡作为大、稀疏的误差
因为图像之中会有一些部分被遮挡,或者损坏,但是由于这些误差出现的区域小,频率低,我们把它们建模为稀疏的误差。除此之外,图像中还有常见的噪声,但是此文没有过多考虑,只假设噪声是可忽略的。
用
其中
其中
在实际图像中,一般都会有小的加性噪声,上述问题略作修改
其中
3 迭代凸优化求解
3.1 凸松弛
上面的优化问题虽然很直观,但是矩阵的秩 rank 和
理论中考虑,参数
3.2 迭代线性化
问题求解的难度还在于约束
其中
因为这个线性近似只在局部有效,不能直接求解
RSAL 算法步骤:
INPUT: 图像
WHILE 没有收敛 DO // 其中收敛的条件是目标函数在连续两次迭代的改变量小于预先设定的阈值
Step 1: 计算关于形变参数
Step 2: 变形并归一化图像矩阵:
Step 3(内循环): 求解线性凸优化问题;
Step 4: 更新形变参数
END WHILE
OUTPUT: 输出
3.3 收敛性和最优性证明
涉及的内容太多,这里不做详细解释,可参考原论文。
3.4 増广 Lagrangian 乘子法
算法中主要的计算代价就是 Step 3,这是一个半正定的线性凸优化问题。此文使用快速的一阶方法,増广 Lagrangian 乘子法。首先定义
其中
直接最小化多个参数的 Lagrangian 函数很困难,那么采用近似求解的方式,即每一次分别最小化一个变量,而固定其他变量,
迭代的每一步都可以求出闭式解,计算的效率很高。为了更清楚的说明解,还要定义软阈值(soft-thresholding)或收缩(shrinkage)操作,
其中
RSAL 内循环:
INPUT:
WHILE 没有收敛 DO // 其中收敛的条件是
// * 中间3步的详细的推导在 Appendix *
END WHILE
OUTPUT: 输出最优解
其中
实验结果表明,
该算法收敛性非常好,速度也比此论文作者之前的方法 Accelerated proximal gradient (APG) 9 快 5~10 倍左右。
尽管増广 Lagrangian 乘子法的收敛性已经在优化的文献中都已经给出证明,但是没有证明它的近似方法(本文采用的迭代优化每一个变量)也能收敛。
困难就在于这里有三项变量在交替最小化,而 Alternating Direction Method of Multipliers 方法交替优化两项变量已经在优化文献中给出了证明。
然而 Yuan X. et al. 10 表明三项变量交替优化过程中收敛在实际上和理论上有差距,而且收敛速度比较慢。
总之,目前要严格证明此论文方法的收敛性还很困难。
3.5 实现细节
实验验证
知道了本论文的理论之后,去看实验已经没有什么难处了,本论文的实验有好几个,但是给人印象是没有很多与其它论文的定量对比结果。这里不再一一讲述。
Appendix
这是本人根据对论文的理解,自己推导了
其中
1. 求解 Ak+1 ,
求当梯度为 0 时,
证毕。
2. 求解 Ek+1 ,
求当梯度为 0 时,
证毕。
3. 求解 Δτk+1 ,
求当梯度为 0 时,
证毕。
- E. Cande`s, X. Li, Y. Ma, and J. Wright, “Robust Principal Component Analysis?” J. ACM, vol. 58, no. 3, pp. 1-37, 2011. ↩
- V. Chandrasekaran, S. Sanghavi, P. Parrilo, and A. Willsky,“Rank-Sparsity Incoherence for Matrix Decomposition,” SIAM J. Optimization, vol. 21, no. 2, pp. 572-596, 2011. ↩
- E. Cande`s, X. Li, Y. Ma, and J. Wright, “Robust Principal Component Analysis?” J. ACM, vol. 58, no. 3, pp. 1-37, 2011. ↩
- Yuan, Xiaoming, and Junfeng Yang. “Sparse and low-rank matrix decomposition via alternating direction methods.” preprint 12 (2009). ↩
- E. Cande`s, J. Cai, and T. Shen, “A Singular Value Thresholding Algorithm for Matrix Completion,” SIAM J. Optimization, vol. 20, no. 4, pp. 1956-1982, 2010. ↩
- Lin, Z., Ganesh, A., Wright, J., Wu, L., Chen, M., & Ma, Y. (2009). Fast convex optimization algorithms for exact recovery of a corrupted low-rank matrix. Computational Advances in Multi-Sensor Adaptive Processing (CAMSAP), 61. ↩
- Z. Lin, M. Chen, L. Wu, and Y. Ma, “The Augmented Lagrange Multiplier Method for Exact Recovery of Corrupted Low-Rank Matrices,” Technical Report UILU-ENG-09-2215, Univ. of Illinois at Urbana-Champaign, 2009. ↩
- Y. Ma, S. Soatto, J. Kosecka´, and S.S. Sastry, An Invitation to 3-D Vision. Springer, 2004. ↩
- K. Toh and S. Yun, “An Accelerated Proximal Gradient Algorithms for Nuclear Norm Regularized Least Squares Problems,”Pacific J. Optimization, vol. 6, pp. 615-640, 2010. ↩
- X. Yuan and M. Tao, “Recovering Low-Rank and Sparse Components of Matrices from Incomplete and Noisy Observations,”SIAM J. Optimization, vol. 21, no. 1, pp. 57-81, 2011. ↩
- 笔记 RASL: Robust Alignment by Sparse and Low-Rank Decomposition for Linearly Correlated Images
- LRSD: Low Rank and Sparse matrix Decomposition
- 笔记:Learning Robust and Discriminative Subspace With Low-Rank Constraints
- 笔记:Structure-Constrained Low-Rank and Partial Sparse Representation with Sample Selection for image
- 笔记:Deep Robust Encoder Through Locality Preserving Low-Rank Dictionary
- 论文笔记: HADAMARD PRODUCT FOR LOW-RANK BILINEAR POOLING
- 笔记:Learning Fast Low-Rank Projection for Image Classification
- 笔记:Semi-Supervised Low-Rank Representation for Image Classification
- 笔记:Self-Taught Low-Rank Coding for Visual Learning
- Robust PCA Low-rank(附matalb 代码)
- 《Vehicle Detection in High-Resolution Aerial Images via Sparse Representation and Superpixels》论文笔记
- 论文笔记-Augmented Lagrange Multiplier Method for Recovery of Low-Rank Matrices
- 论文笔记-Augmented Lagrange Multiplier Method for Recovery of Low-Rank Matrices
- Deeply learned face representations are sparse, selective, and robust
- Sparse Decomposition Toolbox
- Sparse Decomposition Toolbox
- Deep Alignment Network: A convolutional neural network for robust face alignment
- 人脸关键点:DAN-Deep Alignment Network: A convolutional neural network for robust face alignment
- 中软国际解放号:IT服务行业的“天猫”
- C++_构造函数和析构函数
- 我想好在取吧。
- 数据库连接池技术-转载
- android EventBus的使用
- 笔记 RASL: Robust Alignment by Sparse and Low-Rank Decomposition for Linearly Correlated Images
- Android 实现 zlib压缩与解压
- oracleClient和plsql的安装
- Spark的工作机制
- 自定义的Java对象转JSON串的方法
- js获取当前时间和获取前N天 格式:yyyy-MM-dd HH:mm:ss
- 实验题7.1: 编写一个程序algo7-1.cpp,实现二叉树的各种基本运算,并在此基础上设计一个程序Main.cpp完成如下功能(b为如下图所示的一棵二叉树)
- gulp 学习总结
- Read data 读请求数据流