匹配追踪算法（MP）简介

来源：互联网发布：知乎客户端 pc 编辑：程序博客网时间：2024/06/03 17:09

图像的稀疏表征

分割原始图像为若干个

n - - \sqrt \times n - - \sqrt

的块. 这些图像块就是样本集合中的单个样本

y=Rn. 在固定的字典上稀疏分解

y后，得到一个稀疏向量. 将所有的样本进行表征一户，可得原始图像的稀疏矩阵. 重建样本

y=Rn时，通过原子集合即字典

D={di}ki=1∈Rn×m(n<m)中少量元素进行线性组合即可：

y = D x

其中，x={x1,x2,⋯,xm}∈Rm是y在D上的分解系数，也称为稀疏系数.

字典矩阵中的各个列向量被称为原子（Atom）. 当字典矩阵中的行数小于甚至远小于列数时，即m⩽n，字典D是冗余的。所谓完备字典是指原子可以张成n纬欧式空间y=Rn. 如果在某一样本在一过完备字典上稀疏分解所得的稀疏矩阵含有大量的零元素，那么该样本就可以被稀疏表征，即具有稀疏性。一般用l0范数作为稀疏度量函数，图像的稀疏表征数学模型如下：

min x | | x | | 0, s . t . y = D x

稀疏表征不仅具有过完备性，还应该具有稀疏性。对于一个过完备字典D，为了可以分解出更合适且稀疏的稀疏表征，应当含有更多的原子。

在稀疏表征理论方面的研究主要可分为两个方面:字典的构建和稀疏编码.

稀疏编码的目标就是在满足一定的稀疏条件下，通过优化目标函数，获取信号的稀疏系数. 经典的算法有匹配追踪(Matching Pursuit，MP)、正交匹配追踪(Orthogonal Matching Pursuit，OMP)、基追踪(Basis Pursuit，BP)算法等.

MP算法是稀疏表征中用于稀疏求解的最基本方法之一. 我在学习过程中参考网上一些资料，觉得大部分写得比较理论化，看起来稍微吃力一些. 阅读了Koredianto Usman的Introduction to Matching Pursuit(MP)一文，我觉得这篇文章写得很不错，从实例出发，很好接. 这篇博文是我对该文章翻译的基础上而写的.

注：
1. 原文中有一些小错误，我在译文中进行了修改. 有对照原文阅读的同学，若发现有不一致，请不要奇怪.
2. 所有计算结果都保留两位小数.

问题提出

考虑下面一个简单例子：

给定稀疏信号

x = ⎛ ⎝ ⎜ - 1.2 10 ⎞ ⎠ ⎟

字典矩阵A为：

A = (- 0.707 0.707 0.8 0.6 0 - 1)

（注：原文中称A为measurement matrix）

所以，y=A⋅x=(1.65−0.25)

现在，给定y=(1.65−0.25)和A=(−0.7070.7070.80.60−1),

如何求得x呢？

匹配追踪

在上面的列子中A中的列向量称之为Basis（基）或者Atoms（原子）. 所以，我们有如下原子：

b 1 = (- 0.707 0.707) b 2 = (0.8 0.6) b 3 = (0 - 1)

因为A=[b1b2b3]，如果我们令x=[abc]，则A⋅x=a⋅b1+b⋅b2+c⋅b3.

A⋅x是原子b1，b2，b3的线性组合

A \cdot x = (- 0.707 0.707 0.8 0.6 0 - 1) \cdot ⎛ ⎝ ⎜ - 1.2 10 ⎞ ⎠ ⎟ = - 1.2 \cdot (- 0.707 0.707) + 1 \cdot (- 0.8 0.6) + 0 \cdot (0 - 1) = y = (- 1.65 0.25)

从上面的方程可以看出，b1对y值的贡献最大，然后是b2，最后是b3. 匹配追踪算法刚好逆方向进行计算：我们首先从b1，b2，b3中选出对y值贡献最大的，然后从差值（residual）中选出贡献次大的，以此类推.

而贡献值的计算通过内积（点积）进行计算，MP算法步骤如下：

选择对y值贡献最大的原子pi=maxj<bj,y>
计算差值ri=ri−1−pi⋅<ri−1,pi> （注：该公式在原文中稍微有点问题，这里做了修正. 对于r0=y）
选择剩余原子中与ri内积最大的
重复步骤2和3，直到差值小于给定的阈值（稀疏度）

下面进行实例计算：

首先，分别计算y和b1，b2，b3的内积：

< y, b 1 > = - 1.34, < y, b 2 > = 1.17, < y, b 3 > = 0.25

取绝对值以后，我们可以发现b1与y得到最大的内积值. 然后，在第一步中我们选择b1. 接下来计算差值：

r1=y−b1⋅<y,bi>=(1.65−0.25)−(−1.34)⋅(−0.7070.707)=(0.700.70)

接来下，计算差值和b2，b3的内积：

< r 1, b 2 > = 0.98 < r 1, b 3 > = - 0.70

取绝对值以后，b2对y值的贡献最大。

接下来，计算差值r2=r1−b2⋅<r1,b2>=(0.70.7)−(0.80.6)⋅0.98=(−0.080.11)

最后，计算r2与b3的内积：<r2,b3>=−0.11

所以，最后的三个稀疏稀疏是⎛⎝⎜−1.340.98−0.11⎞⎠⎟

这和准确的系数⎛⎝⎜−1.210⎞⎠⎟很接近

反酸回去，和给定的y也很接近.

A \cdot x = (- 0.707 0.707 0.8 0.6 0 - 1) \cdot ⎛ ⎝ ⎜ - 1.34 0.98 - 0.11 ⎞ ⎠ ⎟ = (1.73 - 0.25)

MP算法实质

从下面的图，我们可以很清楚地看到MP算法的实质：就是利用原子向量的线性运算去逐渐去逼近信号向量，经过不停地迭代，最后达到给定的稀疏度.

匹配追踪算法可以直接得到信号稀疏性的表达. 以贪婪迭代的方法选择D的列，使得在每次迭代的过程中所选择的列与当前冗余向量最大程度的相关.

数学上对MP算法的解释

阅读全文

0 0