文献阅读笔记——Action Recognition with Stacked Fisher Vectors
来源:互联网 发布:音悦台点歌机加歌软件 编辑:程序博客网 时间:2024/05/24 04:39
转自:http://blog.csdn.net/breeze5428/article/details/39202887
本文由Xiaojiang Peng发表在计算机视觉顶级国际会议ECCV2014。由标题可以看出作者是利用分层的Fisher Vectors做行为识别。作者的动机是想将特征的维度做高。这种分层的做法近几年比较常见,如 ICRA 2014关于3d点云无监督特征的论文Unsupervised Feature Learning for 3D Scene Labeling,ICRA的这篇论文做了两层的Sparse Coding,在Sparse Coding的基础上做Sparse Coding。
本文框架
如图1所示,作者给出了本文基于Fisher Vectors的框架和传统的基于Fisher Vectors的框架不同。本文做了两层的Fisher Coding,在得到底层特征的Fisher Vectors后,在Fisher Vectors的基础上得到新的Fisher Vectors。第二层输出的Fisher Vectors即作者所称的 Stacked Fisher Vectors (SFV),在做分类时可直接将SFV导入分类器中。作者通过实验验证,将FV同SFV串联起来形成高维特征效果要比单独用FV或者SFV效果更好。小结下本段的意思,SFV是FV上的特征,即关于特征的特征,即中层特征。
本文算法
第一层Fisher Vectors 提取
提取第一层的目的是为第二层的Fisher Vectors提供原料。第一层Fisher Vectors 提取就是一般的Fisher Vectors向量提取过程。本文利用的底层特征是iDT。一般的步骤包括:(1)对data set中的iDT特征做PCA whitening;(2)GMM得到K1个高斯模型(3)得到当前图片的中各iDT特征的Fisher Vectors。得到iDT特征的Fisher Vectors后,从视频的W H L空间上各维度上以一定步长采样小方块,本文定义了12种尺度宽高时长的小方块。筛选出轨迹数量大于某一阈值的小方块,累加各小方块中的Fisher Vectors。每个小方块可以得到一个局部累加的Fisher Vector,这些
第二层 Fisher Vectors 提取
第二层的 Fisher Vectors 提取类似第一层,原料是第一层小方块对应的 Fisher Vectors 。 Fisher Vectors 维度较高,需要做降维,本文采用的是最大边缘降维法,具体见本文。
- 文献阅读笔记——Action Recognition with Stacked Fisher Vectors
- 文献阅读笔记——Action Recognition with Stacked Fisher Vectors
- Action Recognition with DTF + Fisher Vectors
- Action Recognition with Fisher Vectors(idt source codes)
- 行为识别笔记:Stacked Fisher Vector基本原理
- 行为识别阅读笔记(paper+code):Real-time Action Recognition with Enhanced Motion Vector CNNs
- 文献阅读笔记——Boosting VLAD with Supervised Dictionary Learning and High-Order Statistics
- "Action Recognition with Trajectory-Pooled Deep-Convolutional Descriptors"阅读小结
- Contextual Action Recognition with R*CNN-论文阅读
- Human Action Recognition Using a Modified Convolutional Neural Network(经典文献阅读)
- 【文献阅读】Stacked What-Where Auto-encoders -ICLR-2016
- Deep Joint Face Hallucination and Recognition——阅读笔记
- 文献阅读笔记——All about VLAD
- 文献阅读笔记——road segmention(一)
- [论文阅读]Rank Pooling for Action Recognition
- text-dependent speech emotion recognition 相关文献阅读
- [论文阅读笔记]Two-Stream Convolutional Networks for Action Recognition in Videos
- [论文阅读笔记]Two-Stream Convolutional Networks for Action Recognition in Videos
- ruby计算时间差
- Could not initialize class com.ali.unit.rule.Router
- Cgywin下安装SeismicUnix的步骤
- 程序源弃坑之路7(js软键盘)
- 【多线程-前台线程和后台线程】
- 文献阅读笔记——Action Recognition with Stacked Fisher Vectors
- 怎么用快启动U盘启动盘制作工具将U盘制作成一个多系统安装盘
- CAEAGLLayer
- 日志组件slf4j介绍及配置详解
- RecyclerView添加onItemClickListener更佳的解决方案
- 树莓派摄像头模块没有/dev/video0设备节点的问题
- apache-activemq(三)
- Eclipse中安装部署maven插件
- mac画图工具 OmniGraffle (三)基础绘图和模具