Compressive Tracking(CT)

来源:互联网 发布:板式家具折单软件 编辑:程序博客网 时间:2024/06/05 02:12
前段时间学习了一下压缩跟踪算法,现在就自己学习的经验做一下总结,希望对大家的学习有一定的帮助。本文将分为三个部分作为讲解。

1.为什么要学习这个算法(也即是这个算法有什么优点)?

压缩跟踪算法具有简单、高效、实时性强的优点,同时很好的解决了对目标多姿态跟踪(多姿态包括当目标进行旋转,倾斜的时候对应的姿态)。

2。为什么CT算法具有这些优点?

原因很简单,因为CT算法是一种基于压缩感知(compressve sensing,CS)理论的跟踪算法。 CS理论是什么?这里我引用下zouxy09的博客中的定义 (http://blog.csdn.net/zouxy09/article/details/8118329) CS理论指出:只要信号是可压缩的或在某个变换域是稀疏的,那么就可以用一个与变换基不相关的观测矩阵将变换所得高维信号投影到一个低维空间上,然后通过求解一个优化问题就可以从这些少量的投影中以高概率重构出原信号,可以证明这样的投影包含了重构信号的足够信息。 这是个什么意思嘞?听着听着怎么感觉有点虚啊?没事,这里,我们可以参照下我前面写的PCA给样本数据降维原理,这里的CS理论也是用来降维。用来降维的算法在思想是有共性的: 首先,将样本进行一定的变换,将样本数据投影到一个可降维空间。对于可降维空间的寻找(这个由降维标准来决定),对于不同的算法,标准是不同的,用到的投影方法也不一样。例如,PCA算法就是要找一个坐标系(准确的说应该是空间,这里说坐标系,我们好理解一点),在这个坐标系下,对原始数据进行表示的时候,只有部分坐标较大,而大部分的坐标都非常小,这样为下一步通过舍弃掉较小的坐标,用较大坐标来近似表示原始数据实现降维做准备 然后,用对应的降维方法对变换后的数据进行降维。这里用到的方法是:用一个低维的矩阵(这里叫做观察矩阵)对数据进行处理,实现降维。 CS理论水有点深,这里不做过多的讨论。

3.具体实现

这里写图片描述
上面这个图片描述了压缩跟踪算法的具体实现原理。下面,将对他进行解读。 
我们从左往右来看。 
在第一幅图中,我们可以看到一个RxR的矩阵,这个矩阵表示原始图片,在原始图片上很多小的小方格,这些小方格表示实际的采样块(实际采样块的意思就是:我们以这些小方块内部的像素作为特征)。这些小方块的生成是随机的,因此对应有个概率,我们将这些概率作为一个权值,保存到一个m*1的列向量中,也即是上面图片中的第二项,将两项一乘积就得到了对原始图片的稀疏表示。 
那么问题来了,这些小矩阵块怎么形成的嘞? 
这里写图片描述这个公式是几个意思?刚开始,我看着也感觉头晕,为了说清楚这个问题,我在这里做以下说明: 
这里写图片描述 
计算一个特征就是算一次数学期望(这个属于概率论范畴,忘记了的可以回去查查相关资料) 
图中,大的黑色框表示原始图片,一种颜色代表一个特征,例如两个黄色矩形块表示一个特征,三个蓝色的矩形块也表示一个特征。每个特征对应的矩形块的个数是随机的,大小也是随机的。每个特征的特征值计算则是通过计算他们的数学期望。 
例如:现在我们计算黄色的特征对应的特征值。 
首先随机生成两个矩形框(每生成一个矩形框,对应的随机生成一个权值,权值大小为-1或者1,也即是权值要么为1,要么为-1)。 
然后在样本上对应于矩形框位置求积分图(积分图就是将矩形框内部的像素进行和运算,通俗一点,就是加起来),将积分图乘以对应的权值(就是上面生成的权值),再乘以这里写图片描述(由于这里随机生成的矩形框个数是2个,所以,对应的这里写图片描述这里写图片描述),然后再进行相加,就是对应的特征值。 
个人认为上面的部分就是理解的难点,其余的对照相关的博文就能看的懂。当然,为了文章的完整性,这里还是带一下。 
压缩跟踪算法中所采用的分类器为贝叶斯分类器,在经过随机测量矩阵的降维处理以后,获取得到对应的特征值,假定各个元素都是独立分布的。则分类器的分类标准为: 
这里写图片描述博文中是写成分数形式,个人认为写成减法形式,更加便于理解,我们可以理解为正样本的期望减去负样本的期望,这个值越大,那么对应的图片是目标的可能性就越大。(这个仅仅是个人的看法,只供参考,不代表原作者的想法)。 
其中,y (0,1)为分类样本标签,y的值0 ,1分别表示正样本和负样本,假定两类样本的先验条件相同,即 。Diaconis和Freedman证明了高维随机向量的随机投影几乎都是高斯分布的。因此,假定在分类器H(v)中的条件概率 和 也属于高斯分布,并且可以用下面四个参数来描述: 
这里写图片描述 

  4.具体的实施步骤可以描述如下 

当第t+1帧图片读入的时候,将第t帧图片中目标人脸的位置与大小作为基准,在其周围进行采样,生成n个检测框,然后对这n个检测框进行特征提取(采用的稀疏测量矩阵和步骤S1中的相同)。再使用第t帧初始化的贝叶斯分类器这些特征进行分类,分类得到的最大比例的窗口即为目标窗口。这样就获取到了新的目标窗口。

1 0