Rob Fergus的Removing Camera Shake from a Single Photograph

来源:互联网 发布:淘宝店铺怎么上架商品 编辑:程序博客网 时间:2024/04/29 21:34

去模糊

图像模型:B=K*L+N   B为模糊图像,K为模糊核,L为清晰图,N为噪声 

P灰度模糊块

原理:清晰的图像满足重尾分布(heavy-tailed distributions):梯度的分布大部分在小的值,但是相比高斯分布来说,对梯度值较大的值有更大的可能性。

算法主要分为两步:1、根据输入图像估计模糊核,以由粗到精的方式避免局部极小值。2、利用估计的模糊核,采用标准的去卷积算法估计清晰图像。

首先用户需要提供四个输入:1、模糊图像B;2、模糊图像的一个矩形块;3、模糊核的大小上限值(像素);4、关于模糊核方向的初步猜测,除此之外,我们需要在处理之前将图像B转换到一个线性的色彩空间,利用伽玛校正(inverse gamma-correction),γ的值为2.2。根据用户指定的块,将原始图像的所有颜色通道联合一起产生灰度模糊块P。

模糊核的估计:

对于给定的灰度模糊块P,我们估计K和清晰图像块Lp。通过找到具有最高概率值的像素值,由对L的统计先验得到。既然数据统计是基于图像梯度而不是强度,我们对梯度域进行最优化,利用Lp和P的梯度值。因为卷积是一个线性操作,P的梯度值应该等于Lp和K的卷积,再加上噪声,我们假设噪声是方差为sigma²的高斯函数。

正如先前讨论的,Lp的先验梯度概率分布是一个C-零均值的混合高斯模型分布的(对第K个高斯分布来说,方差为VC,权值为πC)。我们使用稀疏先验概率P(K)表示模糊核,支持0值,并且要求所有值为正。特别地,模糊核的值的先验是D指数分布的混合(尺度因子λd和权值πd)。∝:正比于的关系


要找到模糊核K和清晰图像梯度使得上式中P最大。等价于解决一个最小二乘法问题,试图适应数据,同时最小化小梯度。尝试通过共轭梯度搜索但是失败。一个解释是MAP目标函数尝试最小化所有的梯度(甚至大的值),然而我们期望的自然的图像是有一些大的梯度值的。因此,算法产生了二值图像,因为实际上全部的梯度值为0.如果我们减小噪声的方差(因此增加在数据适应上的权值),那么算法会产生一个关于K的脉冲函数,恰好符合模糊图像,但是没有任何的去模糊。此外,我们发现MAP的目标函数会轻易受局部最小值的影响。

相反,我们的方法是接近于完整的后验分布P(K,LP|P),通过最大的边缘概率计算模糊核K。这种方法选择一个模糊核,与可能的清晰图像的分布最有可能,这样就避免了选择一个单一的“最佳”估计时产生的过度拟合。

为了有效地计算近似值,我们采用变分贝叶斯方法,通过计算q(K,Lp)近似P(K,LP|P)。在这采用 MISKIN和MACKAY,在Ensemble Learning for Blind Image Separation and Deconvolution中提到的方法,因式分解:q(k,lp)=q(k)q(lp)。对清晰图像梯度而言,近似值是高斯密度,当针对非负的模糊核元素时,是一个纠正的高斯。对每个清晰图像的梯度和模糊核元素的分布是以她们的均值和方差表示,存储在数组中。

对于噪声的方差是未知的,在估计过程中。gamma分布,倒方差法。

花费函数表示近似分布和真实的后验的距离(K-L距离),对...的期望。通过不断计算,直到花费函数的变化极小时,K的边缘分布的平均值作为左后的K的值。整个算法对于饱和像素是忽视的,不做处理。

这里C=D=4,参数的取值....

4.1.1

先前的算法受制于局部最小值,尤其对大的模糊核来说。因此,我们通过改变图像分辨率从粗到精的一个过程。在粗的层,模糊核为3*3。为了保证算法的正确开始,我们手动地指定最初的3*3模糊核到2个简单形式中的一种。接着到金字塔的每一层。收敛的K和LP上采样作为下一层的初始化。在最优尺度上,算法收敛到了模糊核K的全解析度。

如果模糊地厉害的话,那么模糊核的计算窗口应该较大。选择水平或垂直的

重建方法:泊松图像重建,Richardson-Lucy algorithm

R-L算法:

10次迭代。

清晰图像的参数事先获得,在priors文件夹内











一些概念:

1、混合高斯分布:混合高斯模型的基本思想是:对每一个像素,定义K个状态, 每个状态用一个高斯函数表示,这些状态一部分表示背景的像素值,其余部分则表示前景的像素值。

2、贝叶斯定理公式P(A|B)=P(B|A)*P(A)/P(B),其中P(A)为先验概率,P(A|B)为后验概率

3、重尾分布:大量的小抽样取值和少量的大抽样取值并存,在这些抽样数据集中,虽然大部分抽样取值是小的,但是对抽样的均值和方差起决定作用的是那些少量的大抽样取值,可见这些少量的大抽样取值是不可忽略的。

4、KL距离:表示相同事件空间里的两个概率分布的差异情况,当两个分布相同时,KL距离为0。D(P||Q)表示概率分布P和Q之间的KL距离。

假如一个字符发射器,随机发出0和1两种字符,真实发出概率分布为A,但实际不知道A的具体分布。现在通过观察,得到概率分布B与C。各个分布的具体情况如下:

A(0)=1/2,A(1)=1/2

B(0)=1/4,B(1)=3/4

C(0)=1/8,C(1)=7/8



4、RL重建算法

5、rectified gaussian:the rectified Gaussian distribution is a modification of theGaussian distribution when its negative elements are reset to 0. the rectified Gaussian distribution is a modification of theGaussian distribution when its negative elements are reset to 0. 负值置0

 

Appendix:

1、转到灰度图

2、gamma校正: obs_im = (double(obs_im).^(GAMMA_CORRECTION))/(256^(GAMMA_CORRECTION-1));

3、梯度运算:PX=P conv [1,-1]   PY=P conv[1,-1]t