文章标题

来源:互联网 发布:树莓派3 有线网络配置 编辑:程序博客网 时间:2024/06/13 23:16

computer vision

“做Tracking, video, 和optimization的,可以看看控制论(Control theory)。控制科学对于动态系统(或者其它随时间变化的过程)的研究极为透彻。”

深度学习

1/深度学习在物体检测中的应用

“在ILSVRC2014 中,深度学习将mAP 大幅提高到43.933%。较有影响力的工作包括 RCNN[10],Overfeat[26],GoogLeNet[18],DeepID‐Net[27],network in network[28],VGG[29],和spatialpyramid pooling in deep CNN[30]。被广泛采用的基于深度学习的物体检测流程是在RCNN[10]中提出的。首先采用非深度学习的方法(例如selective search[31])提出候选区域,利用深度卷积网络从候选区域提取特征,然后利用支持向量机等线性分类器基于特征将区域分为物体和背景。DeepID‐Net[27]将这一流程进行了进一步的完善使得检测率有了大幅提升,并且对每一个环节的贡献做了详细的实验分析。此外深度卷积网络结构的设计也至关重要。如果一个网络结构提高提高 图像分类任务的准确性,通常也能使物体检测器的性能显著提升。”

2/深度学习在视频分析中的左右

描述视频的静态图像特征, 可以采用从ImageNet 上学习得到的深度模型;难点是如何描述动态特征。以往的视觉方法中,对动态特征的描述往往依赖于光流估计,对关键点的跟踪,和动态纹理。如何将这些信息体现在深度模型中是个难点。最直接的做法是将视频视为三维图像,直接应用卷积网络[38],在每一层学习三维滤波器。但是这一思路显然没有考虑到时间维和空间维的差异性。另外一种简单但更加有效的思路是通过预处理计算光流场,作为卷积网络的一个输入通道[39]。也有研究工作利用深度编码器(deep autoencoder)以非线性的方式提取动态纹理[40],而传统的方法大多采用线性动态系统建模。在一些最新的研究工作中[41],长短记忆网络(LSTM)正在受到广泛关注,它可以捕捉长期依赖性,对视频中复杂的动态建模。

http://valser.org/thread-274-1-1.html

0 0
原创粉丝点击