学习TLD一点心得

来源:互联网 发布:java什么是源代码 编辑:程序博客网 时间:2024/05/21 09:17

        最近一个多月来,一直在看Tracking-Learning-Detection(TLD)方面的论文 ,从TLD原作者ZK博士所有的论文,再到对TLD改进方面的论文,所看的论文不多,但还是说下自己陋见吧。

      TLD用于视频中运动目标的检测,主要是综合了对目标的跟踪、检测,以及在线学习这三种方法,组合构成了TLD框架。ZK博士的创新是将跟踪和检测通过在线学习机制有效地结合起来。

       Tracking部分:主要是对视频中的目标进行跟踪,作者利用LK光流法进行跟踪(PS:至今对LK光流法不解 ) 。

       Detection部分:对跟踪部分产生的结果进行检测。作者利用方差过滤器、fern过滤器、NN过滤器构成级联分类器对跟踪结果进行分类。

       Learning部分:这部分是作者对产生的跟踪结果和检测结果进行检测修正。利用P-N 约束,将假的正样本修改为真的负样本,将假的负样本修改为真的正样本。

       关于这方面的具体介绍在ZK博士的论文和网上都有很详细的介绍,初生牛犊在这就不说了。

      看了这些论文 ,对TLD有了大致的了解,现阶段大部分对TLD改进工作也主要是针对上面所说的跟踪和检测部分来进行的。

       就跟踪部分而言,主要的改进是在LK光流法、特征提取、漂移处理、以及跟踪机制等方面上进行改进。因为TLD中跟踪部分对光线变化,目标外形改变以及快速运动、背景区分上处理效果不是很理想(尽管实验结果很好)。

        就检测部分而言,主要改进还是在检测机制上地改进。TLD中的检测部分采用级联结构(这种结构很好,但是每一级所采用的过滤器有待改进),对正负样本进行分类,重新确定目标在视频帧中的位置(当然这个位置会与跟踪位置有所区别)。

       就学习部分而言,作者做得很巧妙,可以将判定正负样本的误差进行互补。学习部分自己本身也会有判断误差,但是这种可以控制在一定范围内,使得最后的学习效果比较好。关于这部分的改进,论文很少。

       当然,TLD目前对视频中单目标的跟踪效果比较好,要做到多目标的同时跟踪还需要更多的知识支持。

        说了很多废话,希望各位大神不吝赐教,各位大牛不要狂喷,放过我这个牛犊,多多交流。

        

0 0