目标跟踪综述

来源:互联网 发布:注册域名几天可以交易 编辑:程序博客网 时间:2024/04/30 11:04
图像跟踪是一个不断发展的研究方向,新的方法不断产生,再加上其它学科的方法的引入,因此对于图像跟踪算法的分类没有确定的标准。对于所有的跟踪算法,需要解决两个关键问题:目标建模和目标定位[35]。以下根据目标建模所用的视觉特征和目标定位所用的方法对跟踪算法分类。
      1.据视觉特征分类:欲实现目标的准确定位需要以描述目标的视觉特征建立其表观模型。具有良好可分性的视觉特征,是实现对跟踪目标与视场背景精确分割与提取的关键,因此视觉特征的选择是实现鲁棒跟踪前提。若所选视觉特征具有较强可分性,即使简单的跟踪算法也能实现可靠跟踪。反之不然。常用的视觉特征分类如下:
        颜色:由于颜色特征具有较好的抗击平面旋转、非刚性变形以及部分遮挡的
能力,变形目标跟踪中表现出较强的鲁棒性,因此广泛的应用于视频跟踪的目标特征选择上。文献[56]中的基于颜色直方图跟踪算法(Color Histogram),采用Mean Shift算法实现对非刚性目标的鲁棒跟踪。此算法的不足表现在目标遮挡和相邻两帧出现较大的目标位移时,由于Mean Shift算法搜索区域局限于局部状态空间,此时会出现跟踪发散。为解决此问题,文献[57,58]中,由Perez等人和Nummiaro等人提出将颜色特征作为粒子滤波观测模型,实现了复杂环境下(目标遮挡)的可靠跟踪。此算法不足在于,当背景出现与目标颜色分布相似干扰物时,易造成粒子发散,因此Birchfield等人[39]提出空间-颜色直方图跟踪算法,充分利用像素点之间的空间关系而不局限于颜色分布,改善了跟踪性能。
       边缘:虽然颜色特征具有较好的抗目标形变的能力,但是缺乏对目标空间结构的描述,且对光照敏感。因此在光照变化频繁的跟踪视场下,常采用目标边缘特征。文献[40-44]将边缘信息作为目标可分性特征,从而实现可靠跟踪。由于颜色与边缘特征具有互补特性,因此将两种信息融合建立目标特征模型的算法,近年来引起研究者广泛关注[45-47]。上述基于边缘特征的跟踪算法存在计算耗时较长以及形状模型单一的问题,制约了跟踪算法的实时性及可靠性。因此文献[48-50]提出了基于边缘方位直方图特征的跟踪算法,此算法对光照变化不敏感且比单一轮廓边缘特征具有更丰富的信息。
      光流特征:光流特征通常是采用Lucak-Kande算法计算像素点光流的幅值和方向,文献[51]为利用光流实现人脸跟踪实例。由于光流法运算量较大很难满足实时性要求,并且光流法本身对光照变化和噪声敏感,都限制了光流法的实际应用。
       小波:由于金字塔可实现在不同角度、尺度上对图像进行描述的功能,这也是实现差分运动估计的基础[52,53]。
       局部特征描述子:图像的局部区域特征具有对光照、尺度、旋转的不变性。局部区域特征从局部区域内提取特征点,并以相应的描述子对其描述。文献[54,55]分别以局部二元模式和(SIFT)特征实现目标跟踪。
        空间与颜色融合:颜色特征描述目标全局颜色分布,属于全局信息,虽然具有一定的抗目标形变能力,但由于缺乏对像素间空间结构的描述易受到背景中相似颜色分布区域的干扰,文献[56,57]将空间信息与颜色直方图融合,作为目标特征取得了良好的跟踪效果。
       特征基(Eigen-Basis):将图像信息从高维空间映射到低维空间,图像在低维空间成为一个流形,通过一定的几何、统计工具可以提取和分析。PCA、LDA是图像跟踪领域构建子空间广泛采用的方法。特征跟踪(Eigen-Tracking)方法[18,58-61]以Karhunen-Loeve构建表征目标表观的特征基,再通过递增SVD实现对特征基的在线更新。文献[62]以局部线性嵌入流形LLE将跟踪问题映射到非线性低维流型空间去解决。
       模式分类:利用分类器将跟踪目标从背景中分割出来是以模式分类的方法解决视频跟踪问题。文献[64,65]同时强调目标与背景的重要性,通过特征评价算法建立对目标和背景具有良好可分性的的视觉特征实现跟踪。Avidan[65]以支持向量机SVM离线学习得到目标与背景特征,称为支持向量机跟踪算法(SVM-Tracking)。文献[67]利用集成学习将弱分类器(Adaboost方法训练得到弱分类器)组合成强分类器,由此强分类器实现对视频帧中目标与背景分类,即像素分类置信图(Confidence Map),由分类置信图的模式得到当前帧中目标位置,将输出的目标位置反馈,训练出新的强分类器以实现后续的分类。为克服上述文献中由于采用离线学习方法使得跟踪算法不满足实时性的问题,Grabner等人[68]提出了基于在线Adaboost训练分类器的跟踪算法。
2.依据目标定位所使用的方法分类:目标定位根据历史信息推理当前帧中目标位置信息的过程。依据目标定位方法对跟踪算法分类如下:
       概率跟踪方法:概率跟踪方法是采用Bayesian滤波理论解决状态估计问题在视频跟踪领域的应用,通过预测和修正过程采用一种递推方式实现时变状态的估计。表征目标位置信息的状态量通常由位置坐标、速度、尺度以及旋转角度构成,状态量通过状态转移模型向前推进即实现状态预测,通过最新观测值以及观测似然模型对状态预测置信度进行评价,从而对预测值做出修正。在模型线性(状态转移模型和观测模型)、系统噪声和观测噪声服从高斯分布时,Kalman滤波能给出Bayesian滤波最优解;对于非线性Bayesian滤波,扩展Kalman(EKF)以及无味Kalman(UKF) [69,70]给出了次优解。隐马尔科夫模型(HMM)[44]用于实现状态空间有限、离散情况下的状态估计。对于状态模型和观测模型均为非线性且噪声为非高斯,同时状态分布呈多模态,利用Monte Carlo(MC)方法通过采样估计目标状态后验分布,取得了良好的效果,其中以PF为代表的MC采样方法成为了研究热点。
      确定性跟踪方法:该类算法的基本思想是由目标检测或者手动设置方式获取目标模板,度量目标模板与备选目标位置的相识度称为评价函数。跟踪的过程,即将备选目标位置与目标模板匹配的过程。以最优化方法计算评价函数最大值,使得评价函数取得最大值时的备选目标位置判断为是目标在当前视频帧中的估计位置[36,56,71]。通常选择颜色直方图距离作为相识度评价函数。该类算法在一定场景下能实现快速可靠的跟踪,但是该类算法的可靠性是建立在目标模板在跟踪过程中不发生变化的假设之上,因此当目标表观模型改变,跟踪结果与实际目标位置会产生较大偏离甚至失跟。针对此问题,文献[72]提出实时更新目标表观直方图的方法,提高了确定性跟踪算法的鲁棒性。由于概率跟踪方法能够解决复杂背景下的目标状态估计,特别是以PF为代表的MC积分法实现对Bayesian滤波的近似已成为跟踪算法的主流。由于PF以一组随机加权样本近似Bayesian滤波,不受模型线性高斯假设的限制,PF已成为解决非线性非高斯模型下的状态估计问题的有力工具[38,41,42]。
原创粉丝点击