reinforcement learing for visual object detection - 阅读笔记
来源:互联网 发布:python 库安装过程 编辑:程序博客网 时间:2024/05/22 14:21
2016CVPR的文章,从结构上来看和一般的强化学习 似乎有一些不一样。
在给定一张图像的情况下(目标区域蕴含在当前图像中)我们需要从图像的子区块中找到和目标区块最接近的子区块。图像的子区块可以使用简单的bounding-box,也可以使用现在比较新的建议生成方法(我们仅对bounding-box的情况进行讨论,子区块的
选择方式并不影响算法效果)
reinforcement learing for visual object detection
检测流程
检测整体流程如图。从当前检测区域的状态描述
下面,我们将就流程中的每一个状态模块进行介绍。
当前状态St
当前状态
终止信号
终止信号是由当前搜索状态产生的,其表达式为:
而
其中,
这样设置状态描述的原因是为了取得在正确率和搜索复杂度之间的均衡。当搜索步长过高或者搜索区域满足条件时,程序都会释放终止信号。终止信号的将决定下一步要执行 动作的不同。
执行动作
终止动作
终止信号为1时即执行终止动作,终止动作将依据搜索的历史记录计算目标的包围盒(bounding box),并计算响应最高的搜索窗口及其信度。
修订动作
修订(fixate)动作被记为:
当系统判断搜索没有终止的时候,系统会从以往的搜索历史中(若该窗口曾经作为验证区域使用过,则重新选择)寻找信度最大的窗口
一旦选择了某个窗口作为验证区域,该区域会被用来决定一个下一步应该执行动作
有:
新的验证区域的中心将作为下一次搜索的中心
新的验证区域方差
所以新的分布定义为:
其中
所以:
交互与学习
每个迭代周期,系统会最终得到搜索的区域
在学习阶段,我们希望通过一系列的图像(记作
其中
第一个分支表示在未能搜索到目标且搜索动作未停止的时候获得和搜索区域相关的负reward
第二和第三组分支分布代表在终止信号出现寻找到目标和没有寻找到目标时候的reward
最终我们的优化目标在于:
结果分析
其他问题:
这些问题的详细表述在同一团队15年的论文【Multiple Instance Reinforcement Learning for Efficient Weakly-Supervised Detection in Images】中。
区域似然度的判别
判断各个区域是否存在内在的联系,从标注的角度来理解,其很难进行有效的数据标注。而且很多数据集并没有训练目标的ground truth。所以文章提出了采用眼动轨迹的方法来间接描述各个部分的似然度。根据实验,文献指出眼动仪的轨迹有30%的凝视数据刚好处于真实的目标区域中。文章希望利用这作为一个弱分类器的指标,得到画面到目标的似然度函数。
- reinforcement learing for visual object detection - 阅读笔记
- 《Focal Loss for Object Detection》阅读笔记
- 阅读笔记:Gated Bi-directional CNN for Object Detection
- Feature Pyramid Networks for Object Detection 阅读笔记
- 论文阅读-《Relation Networks for Object Detection》
- R-CNN:Region-based convolutional networks for accurate object detection and segmentation阅读笔记
- Rich featureHierarchies for accurate object detection and semantic segmentation 阅读笔记
- Beyond Skip Connections: Top-Down Modulation for Object Detection阅读笔记
- FeUdal Networks for Hierarchical Reinforcement Learning 阅读笔记
- Asynchronous Methods for Deep Reinforcement Learning 阅读笔记
- Reinforcement Learning for Relation Classification from Noisy Data阅读笔记
- Deep Reinforcement Learning for Dialogue Generation阅读笔记
- 论文阅读-《Focal Loss for Dense Object Detection》
- 论文阅读:Deep Neural Networks for Object Detection
- [论文阅读] Focal Loss for Dense Object Detection
- 论文阅读笔记:Object Detection Networks on Convolutional Feature Maps
- Tensorflow object detection API 源码阅读笔记:架构
- Tensorflow object detection API 源码阅读笔记:RPN
- android高亮引导页
- 复合类型的声明
- 天猫某个商品秒杀js精简
- MySQL学习之路_创建、使用库相关
- ubuntu 14.04 64位安装kinect V1驱动
- reinforcement learing for visual object detection - 阅读笔记
- 浅谈thinkPHP中利用缓存处理高并发的思路
- 关于Laravel数据库迁移的理解
- md5加密使用
- [Lintcode]Reverse Linked List II 翻转链表 II
- javascript中使用带有默认参数的自定义构造函数
- Android开发入门记录1——layout
- 打开桌面文件
- MapReduce Shuffle原理 与 Spark Shuffle原理