学习TLD一点心得

来源：互联网发布：java什么是源代码编辑：程序博客网时间：2024/05/21 09:17

最近一个多月来，一直在看Tracking-Learning-Detection（TLD）方面的论文，从TLD原作者ZK博士所有的论文，再到对TLD改进方面的论文，所看的论文不多，但还是说下自己陋见吧。

TLD用于视频中运动目标的检测，主要是综合了对目标的跟踪、检测，以及在线学习这三种方法，组合构成了TLD框架。ZK博士的创新是将跟踪和检测通过在线学习机制有效地结合起来。

Tracking部分：主要是对视频中的目标进行跟踪，作者利用LK光流法进行跟踪（PS:至今对LK光流法不解）。

Detection部分：对跟踪部分产生的结果进行检测。作者利用方差过滤器、fern过滤器、NN过滤器构成级联分类器对跟踪结果进行分类。

Learning部分：这部分是作者对产生的跟踪结果和检测结果进行检测修正。利用P-N 约束，将假的正样本修改为真的负样本，将假的负样本修改为真的正样本。

关于这方面的具体介绍在ZK博士的论文和网上都有很详细的介绍，初生牛犊在这就不说了。

看了这些论文，对TLD有了大致的了解，现阶段大部分对TLD改进工作也主要是针对上面所说的跟踪和检测部分来进行的。

就跟踪部分而言，主要的改进是在LK光流法、特征提取、漂移处理、以及跟踪机制等方面上进行改进。因为TLD中跟踪部分对光线变化，目标外形改变以及快速运动、背景区分上处理效果不是很理想（尽管实验结果很好）。

就检测部分而言，主要改进还是在检测机制上地改进。TLD中的检测部分采用级联结构（这种结构很好，但是每一级所采用的过滤器有待改进），对正负样本进行分类，重新确定目标在视频帧中的位置（当然这个位置会与跟踪位置有所区别）。

就学习部分而言，作者做得很巧妙，可以将判定正负样本的误差进行互补。学习部分自己本身也会有判断误差，但是这种可以控制在一定范围内，使得最后的学习效果比较好。关于这部分的改进，论文很少。

当然，TLD目前对视频中单目标的跟踪效果比较好，要做到多目标的同时跟踪还需要更多的知识支持。

说了很多废话，希望各位大神不吝赐教，各位大牛不要狂喷，放过我这个牛犊，多多交流。

0 0