Ten Years of Pedestrian Detection,What Have We Learned? 知识笔记

来源：互联网发布：2017年网络热点话题编辑：程序博客网时间：2024/06/06 01:15

本文作者：Rodrigo Benenson Mohamed Omran Jan Hosang Bernt Schiele

以Caltech行人检测为基准分析了近十年广泛流通的具有标志性的40多种检测方法。

进行了对多种已经被广泛认可的研究方法的补充性的研究。

这种决策林达到了目前已知的最好的效果。（在具有挑战性的Caltech-USA dataset上）

简介：

行人检测是图像检测的一种特例。

“Viola&Jones variants（V-J变形）”

“HOG+SVM rigid templates（HOG+SVM精确模板）”

“deformable part detectors(DPM)（部分可变性探测器）”

“convolutional neural networks(ConvNets)（卷积神经网络）”都进行过行人检测。

本文的目的就是回顾近十年的40多种行人检测方法,量化出那些因素对于最终的检测结果具有最大的影响。

已知数据集的回顾：

INRIA：1、老 2、图片较少 3、有利于对于不同环境下的行人的高质量的注释（这也是为什么这个数据集通常作为训练集来使用的原因）。

图片是从视频里获得的，因此光照的变化也能作为一种额外的行人检测信息。

ETH & TUD-Brussels ：中等大小的视频集（video dataset）

Daimler ：缺少颜色通道，所以有的方法在此数据集上不能用。

ETH & TUD-Brussels 和 Daimler 提供了立体的信息。

Caltech-USA和KITTI是当前行人检测方面的主要基准。

检测方法年表2003V-J检测器被提出2005HOG检测器被提出2008DPM检测器被提出2009Caltech行人检测基准开始被使用了，对比了七种不同的检测器的性能，同一时间，FPPI开始被使用（原来是FPPW）2013有三分之一的检测方法被提出
结论：

这40多种检测方法其实能被分成三类：1.、DPM的变体(DPM) 2、深度网络（Deep Networks）(DN) 3、决策森林（Decision forests）(DF)

基于行的boosted决策森林（DF）在行人检测方面效果最好，最好的检测效果是执行在（1、INRIA数据集训练，Caltech数据集测试 2、Caltech数据集训练，Caltech数据集测试）

结论DPM、DN、DF
目前，这三种方法在行人检测方面都有优异的表现。
classifier
没有证据能表明是否存在哪种类型的分类器更适合行人检测。
也没有证据能表明非线性核心比线性核心更有意义。
HikSvm被认为近似于非线性核心（kernel），这种方法在FPPW评价方法上表现很好，而在FPPI上表现不好。
MultiFtrs，在给出足够多的特征值的情况下，Adaboost和线性SVN（linear SVM）在行人检测方面的表现粗略相同。
additional data
额外信息
（e.g.光照）有的探测器通过增加对其他额外数据（光照变化、图片立体信息、轨迹及其他来自其他传感器的信息）来提升探测器的表现。
在单通道图像上，使用额外数据会得到表现提升。

昨天半夜两点才睡觉，今天六点就得起来去学院顶着冷风给人大代表投票，现在头晕晕的，胃轻微犯恶心...

下午还有外教课，实在写不动了，周六来实验室继续整理吧...

上午被导师批评了，说我基础的东西都搞不懂...有点难过，是不是我太玻璃心了...

唔，算了不想了，遇到问题就解决问题呗，难过有什么用，不过真的好想哭啊。

学计算机好累啊，尽管还挺喜欢写代码的，但是还是觉得有点累...

不行，要坚持！！！加油！！！

2017/11/10

阅读全文

0 0