文章标题

来源：互联网发布：树莓派3 有线网络配置编辑：程序博客网时间：2024/06/13 23:16

computer vision

“做Tracking, video, 和optimization的，可以看看控制论(Control theory)。控制科学对于动态系统（或者其它随时间变化的过程）的研究极为透彻。”

深度学习

1/深度学习在物体检测中的应用

“在ILSVRC2014 中，深度学习将mAP 大幅提高到43.933%。较有影响力的工作包括 RCNN[10]，Overfeat[26]，GoogLeNet[18]，DeepID‐Net[27]，network in network[28]，VGG[29]，和spatialpyramid pooling in deep CNN[30]。被广泛采用的基于深度学习的物体检测流程是在RCNN[10]中提出的。首先采用非深度学习的方法（例如selective search[31]）提出候选区域，利用深度卷积网络从候选区域提取特征，然后利用支持向量机等线性分类器基于特征将区域分为物体和背景。DeepID‐Net[27]将这一流程进行了进一步的完善使得检测率有了大幅提升，并且对每一个环节的贡献做了详细的实验分析。此外深度卷积网络结构的设计也至关重要。如果一个网络结构提高提高图像分类任务的准确性，通常也能使物体检测器的性能显著提升。”

2/深度学习在视频分析中的左右

描述视频的静态图像特征，可以采用从ImageNet 上学习得到的深度模型；难点是如何描述动态特征。以往的视觉方法中，对动态特征的描述往往依赖于光流估计，对关键点的跟踪，和动态纹理。如何将这些信息体现在深度模型中是个难点。最直接的做法是将视频视为三维图像，直接应用卷积网络[38]，在每一层学习三维滤波器。但是这一思路显然没有考虑到时间维和空间维的差异性。另外一种简单但更加有效的思路是通过预处理计算光流场，作为卷积网络的一个输入通道[39]。也有研究工作利用深度编码器(deep autoencoder)以非线性的方式提取动态纹理[40]，而传统的方法大多采用线性动态系统建模。在一些最新的研究工作中[41]，长短记忆网络（LSTM）正在受到广泛关注，它可以捕捉长期依赖性，对视频中复杂的动态建模。

http://valser.org/thread-274-1-1.html

0 0