4个视频中行为识别的底层特征检测、描述及代码

来源：互联网发布：童年阴影知乎编辑：程序博客网时间：2024/05/01 16:02

1. 比较出名的是Ivan Laptev的 3D Harris，这是一个可执行文件，用起来比较方便，是Harris在3维空间的扩展，检测到特征点之后是用HOG和HOF进行表示。一共的特征维数是162维。点击这里进入下载界面。

2. P. Dollar的cuboids角点检测，方法大致是用1D的gabor进行滤波。检测到角点之后，作者的实验表明直接用cuboids里面的梯度作为表示，然后再进行降维。我认为这个方法的缺点是降维之前的维数太高，求协方差矩阵特征值所花费的时间比较多（一般降维前的特征都是上万维的）。但是这个算法的一个好处是可以控制每个视频提特征点的个数。所以现在这个特征用的人是最多的。代码需要给作者发邮件获取。

3. Alexander Klaser的3D HOG不需要进行特征点检测，是对视频进行稠密采样，提取3D HOG特征。点击这里下载。这种稠密采样的特征在UCF Sports这个数据库上面的效果很好。

4. Paul Scovanner 的3D SIFT，同样也是将图像中很火的SIFT扩展到3维情况。但是这个特征用的人相对较少。

点击这里下载。