Real-time Compressive Tracking目标跟踪算法理解

来源：互联网发布：商品房销售额月度数据编辑：程序博客网时间：2024/05/22 14:54

作者个人主页：http://www4.comp.polyu.edu.hk/~cslzhang/CT/CT.htm
Real-time Compressive Tracking（CT）算法特点是实现非常简单，主要多一些积分运算，提取类似于haar-like这种特征，再通过简单的朴素贝叶斯分类器实现一个discriminative model。因此运算速度非常快，效果也挺不错的，但是相对于那些复杂的跟踪算法比如Struck、VTS、TLD等还是准确度低一些。

一、准备工作
1)随机映射
理想情况下，我们希望矩阵R保持所有原始信号之间的距离不变。JohnsonLindenstrauss引理指出，如果特征被投影到合适维度的随机子空间，那么向量空间中的点的距离以大概率保持不变。Baraniuk等人指出满足JohnsonLindenstrauss定理的随机矩阵也具有压缩感知中的限制等距性质。所以，如果随机矩阵R满足JohnsonLindenstrauss定理，当x是音频或图像这种压缩信号时，我们就很可能以很小的误差从v重建x。可以保证v保留了x几乎所有信息。这个强有力的理论支持促使我们通过低维随机映射来分析高维信号。在算法中，我们使用一个非常稀疏的矩阵，不仅满足JohnsonLindenstrauss定理，而且可以高效地计算以满足实时跟踪。

2随机测量矩阵
一个典型的满足限制等距性质的测量矩阵是随机高斯矩阵。然而，由于矩阵是稠密的，存储和计算负荷比较大。本文采用一个非常稀疏的随机测量矩阵，定义为：
这里写图片描述

Achlioptas证明了当s=2或3时，这种类型矩阵满足Johnson-Lindenstrauss定理。这种矩阵非常容易计算，仅需要均匀分布的随机生成器。当s=3时，三分之二的计算量是可以避免的。

二、算法介绍
下面这部分将详细的讲述跟踪算法。我们假定第一帧中的跟踪窗口已经确定。在接下来的每一帧中，从当前目标位置附近采得正样本，从距离目标中心较远处采得负样本用于更新分类器。为了预测下一帧中目标的位置，我们从目标中心位置附近采得样本，再找的具有分类器得分最大的一个作为跟踪结果。

)

1)有效降维
对每一个样本z，将其与一系列矩形滤波器卷积表示。
这里写图片描述

其中i和j分别是矩形滤波器的宽和高。然后将每一个滤波后的图像表示成列向量，再将他们联结成一个非常高维的多尺度图像特征向量。维度通常在十的六次方到十的十次方。我们采用一个非常稀疏的随机矩阵将x映射到低维空间向量v上。随机矩阵R只需离线计算一次，在整个跟踪过程保持不变，因此计算负荷比较小。在图2中，我们仅仅需要存储矩阵R中的非零项。

这里写图片描述

2)分析低维压缩特征
低维特征v中的每个分量是不同尺度下空间分布矩形特征的线性组合。由于测量矩阵的系数可能是正的或负的，压缩特征计算相对像素值差的方式非常类似于Haar-like特征。
这里写图片描述

3)分类器的构造与更新
对于每个样本z，它的低维表示是v。我们假定v中所有元素是独立分布的，并且用朴素贝叶斯分类器建模，
这里写图片描述

其中y是表示样本标签的二元变量，假定p(y=1)=p(y=0)。
Diaconis and Freedman指出高维随机向量的随机映射几乎都是高斯分布的。因此，分类器H中的条件分布被假定为具有四个参数的高斯分布，

这里写图片描述

4)下面是算法主要步骤的总结：
输入：视频第t帧序列
1.在上一帧目标中心周围选取样本，并提取低维特征。
2.通过分类器H找出具有最大分类得分的特征向量，其对应的目标位置作为跟踪结果。
3.采集正负样本集。
4.提取样本特征并更新分类器。
输出：跟踪结果和分类器参数

这里写图片描述

0 0