4个视频中行为识别的底层特征检测、描述及代码

来源:互联网 发布:童年阴影知乎 编辑:程序博客网 时间:2024/05/01 16:02
1. 比较出名的是Ivan Laptev的 3D Harris,这是一个可执行文件,用起来比较方便,是Harris在3维空间的扩展,检测到特征点之后是用HOG和HOF进行表示。一共的特征维数是162维。点击这里进入下载界面。
几个视频中行为识别的底层特征及代码

2. P. Dollar的cuboids角点检测,方法大致是用1D的gabor进行滤波。检测到角点之后,作者的实验表明直接用cuboids里面的梯度作为表示,然后再进行降维。我认为这个方法的缺点是降维之前的维数太高,求协方差矩阵特征值所花费的时间比较多(一般降维前的特征都是上万维的)。但是这个算法的一个好处是可以控制每个视频提特征点的个数。所以现在这个特征用的人是最多的。代码需要给作者发邮件获取。
几个视频中行为识别的底层特征及代码

3. Alexander Klaser的3D HOG不需要进行特征点检测,是对视频进行稠密采样,提取3D HOG特征。点击这里下载。这种稠密采样的特征在UCF Sports这个数据库上面的效果很好。
几个视频中行为识别的底层特征及代码

4. Paul Scovanner 的3D SIFT,同样也是将图像中很火的SIFT扩展到3维情况。但是这个特征用的人相对较少。
点击这里下载。

原创粉丝点击