Lucas–Kanade光流算法

来源:互联网 发布:jquery 1.10.2.js 编辑:程序博客网 时间:2024/05/18 00:19

来自 李杜 的 ZOL blog:

转自: http://blog.zol.com.cn/936/article_935964.html


作者:gnuhpc@gmail.com

简介:在计算机视觉中,Lucas–Kanade光流算法是一种两帧差分的光流估计算法。它由Bruce D. Lucas 和 Takeo Kanade提出。

光流的概念:(Optical flow or optic flow)
它是一种运动模式,这种运动模式指的是一个物体、表面、边缘在一个视角下由一个观察者(比如眼睛、摄像头等)和背景之间形成的明显移动。光流技术,如运动检测和图像分割,时间碰撞,运动补偿编码,三维立体视差,都是利用了这种边缘或表面运动的技术。

二维图像的移动相对于观察者而言是三维物体移动的在图像平面的投影。
有序的图像可以估计出二维图像的瞬时图像速率或离散图像转移。

光流算法:
它评估了两幅图像的之间的变形,它的基本假设是体素和图像像素守恒。它假设一个物体的颜色在前后两帧没有巨大而明显的变化。基于这个思路,我们可以得到图像约束方程。不同的光流算法解决了假定了不同附加条件的光流问题。

Lucas–Kanade算法:
这个算法是最常见,最流行的。它计算两帧在时间t 到t + δt之间每个每个像素点位置的移动。 由于它是基于图像信号的泰勒级数,这种方法称为差分,这就是对于空间和时间坐标使用偏导数。
图像约束方程可以写为I(x,y,z,t) = I(x + δx,y + δy,z + δz,t + δt)
I(x, y,z, t) 为在(x,y,z)位置的体素。
我们假设移动足够的小,那么对图像约束方程使用泰勒公式,我们可以得到:
I(x+\delta x,y+\delta y,z+\delta z,t+\delta t) = I(x,y,z,t) + \frac{\partial I}{\partial x}\delta x+\frac{\partial I}{\partial y}\delta y+\frac{\partial I}{\partial z}\delta z+\frac{\partial I}{\partial t}\delta t+H.O.T.

H.O.T. 指更高阶,在移动足够小的情况下可以忽略。从这个方程中我们可以得到:
\frac{\partial I}{\partial x}\delta x+\frac{\partial I}{\partial y}\delta y+\frac{\partial I}{\partial z}\delta z+\frac{\partial I}{\partial t}\delta t = 0
或者
\frac{\partial I}{\partial x}\frac{\delta x}{\delta t}+\frac{\partial I}{\partial y}\frac{\delta y}{\delta t}+\frac{\partial I}{\partial z}\frac{\delta z}{\delta t}+\frac{\partial I}{\partial t}\frac{\delta t}{\delta t} = 0
我们得到:

\frac{\partial I}{\partial x}V_x+\frac{\partial I}{\partial y}V_y+\frac{\partial I}{\partial z}V_z+\frac{\partial I}{\partial t} = 0
Vx,Vy,Vz 分别是I(x,y,z,t)的光流向量中x,y,z的组成。 \frac{\partial I}{\partial x}\frac{\partial I}{\partial y}\frac{\partial I}{\partial z} 和 \frac{\partial I}{\partial t}则是图像在(x,y,z,t)这一点向相应方向的差分
所以
IxVx + IyVy + IzVz = − It。
写做:
\nabla I^T\cdot\vec{V} = -I_t
这个方程有三个未知量,尚不能被解决,这也就是所谓光流算法的光圈问题。那么要找到光流向量则需要另一套解决的方案。而Lucas-Kanade算法是一个非迭代的算法:
假设流(Vx,Vy,Vz)在一个大小为m*m*m(m>1)的小窗中是一个常数,那么从像素1...nn = m3中可以得到下列一组方程:
I_{x_1} V_x + I_{y_1} V_y + I_{z_1} V_z = -I_{t_1}
I_{x_2} V_x + I_{y_2} V_y + I_{z_2} V_z = -I_{t_2}
\vdots
I_{x_n} V_x + I_{y_n} V_y + I_{z_n} V_z = -I_{t_n}
三个未知数但是有多于三个的方程,这个方程组自然是个超定方程,也就是说方程组内有冗余,方程组可以表示为:
\begin{bmatrix}<br/>I_{x_1} & I_{y_1} & I_{z_1}\\<br/>I_{x_2} & I_{y_2} & I_{z_2}\\<br/>\vdots  & \vdots  & \vdots\\<br/>I_{x_n} & I_{y_n} & I_{z_n}<br/>\end{bmatrix} <br/>\begin{bmatrix}<br/>V_x\\<br/>V_y\\<br/>V_z <br/>\end{bmatrix} <br/>=  <br/>\begin{bmatrix}<br/>-I_{t_1}\\ <br/>-I_{t_2}\\ <br/>\vdots \\<br/>-I_{t_n}<br/>\end{bmatrix}
记作:A\vec{v}=-b
为了解决这个超定问题,我们采用最小二乘法:
A^TA\vec{v}=A^T(-b) or
\vec{v}=(A^TA)^{-1}A^T(-b)
得到:
\begin{bmatrix}<br/>V_x\\<br/>V_y\\<br/>V_z <br/>\end{bmatrix} <br/>=<br/>\begin{bmatrix}<br/>\sum I_{x_i}^2      & \sum I_{x_i}I_{y_i} & \sum I_{x_i}I_{z_i} \\<br/>\sum I_{x_i}I_{y_i} & \sum I_{y_i}^2      & \sum I_{y_i}I_{z_i} \\<br/>\sum I_{x_i}I_{z_i} & \sum I_{y_i}I_{z_i} & \sum I_{z_i}^2  \\<br/>\end{bmatrix}^{-1}<br/>\begin{bmatrix}<br/>-\sum I_{x_i}I_{t_i} \\<br/>-\sum I_{y_i}I_{t_i} \\<br/>-\sum I_{z_i}I_{t_i}<br/>\end{bmatrix}
其中的求和是从1到n。
这也就是说寻找光流可以通过在四维上图像导数的分别累加得出。我们还需要一个权重函数W(i, j,k), i,j,k \in [1,m] 来突出窗口中心点的坐标。高斯函数做这项工作是非常合适的,
这个算法的不足在于它不能产生一个密度很高的流向量,例如在运动的边缘和黑大的同质区域中的微小移动方面流信息会很快的褪去。它的优点在于有噪声存在的鲁棒性还是可以的。
补充:opencv里实现的看上去蛮复杂,现在还不是太明白。其中LK经典算法也是迭代法,是由高斯迭代法解线性方程组进行迭代的。
参考文献:Lucas B and Kanade T. An Iterative Image Registration Technique with an Application to Stereo Vision. Proc. Of 7th International Joint Conference on Artificial Intelligence (IJCAI), pp.674-679.是81年发表的。
opencv中实现的是84年发表的算法,
参考文献:Bruce D. Lucas, "Generalized Image Matching by the Method of Differences," doctoral dissertation, tech. report , Robotics Institute, Carnegie Mellon University, July, 1984
这篇论文是收费的,一直都没下到还。
0 0
原创粉丝点击