ROI Pooling层详解
来源:互联网 发布:淘宝怎样绑定手机号 编辑:程序博客网 时间:2024/06/09 19:12
ROI Pooling层详解
原文链接:https://blog.deepsense.ai/region-of-interest-pooling-explained/
目标检测typical architecture 通常可以分为两个阶段:
(1)region proposal:给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为region proposals或者 regions of interest(ROI)。
(2)final classification:确定上一阶段的每个region proposal是否属于目标一类或者背景。
这个architecture存在的一些问题是:
- 产生大量的region proposals 会导致performance problems,很难达到实时目标检测。
- 在处理速度方面是suboptimal。
- 无法做到end-to-end training。
这就是ROI pooling提出的根本原因。
ROI pooling层能实现training和testing的显著加速,并提高检测accuracy。该层有两个输入:
- 从具有多个卷积核池化的深度网络中获得的固定大小的feature maps;
- 一个表示所有ROI的N*5的矩阵,其中N表示ROI的数目。第一列表示图像index,其余四列表示其余的左上角和右下角坐标;
ROI pooling具体操作如下:
(1)根据输入image,将ROI映射到feature map对应位置;
(2)将映射后的区域划分为相同大小的sections(sections数量与输出的维度相同);
(3)对每个sections进行max pooling操作;
这样我们就可以从不同大小的方框得到固定大小的相应 的feature maps。值得一提的是,输出的feature maps的大小不取决于ROI和卷积feature maps大小。ROI pooling 最大的好处就在于极大地提高了处理速度。
ROI pooling example
考虑一个8*8大小的feature map,一个ROI,以及输出大小为2*2.
(1)输入的固定大小的feature map
(2)region proposal 投影之后位置(左上角,右下角坐标):(0,3),(7,8)。
(3)将其划分为(2*2)个sections(因为输出大小为2*2),我们可以得到:
(4)对每个section做max pooling,可以得到:
ROI pooling总结:
(1)用于目标检测任务;(2)允许我们对CNN中的feature map进行reuse;(3)可以显著加速training和testing速度;(4)允许end-to-end的形式训练目标检测系统。
阅读全文
0 0
- ROI Pooling层详解
- ROI Pooling层解析
- faster rcnn中的roi-pooling层
- RoI Pooling
- ROI Pooling
- ROI Pooling层解析_代码原理详细解释和存在目的
- 神经网络pooling层
- caffe之pooling层
- caffe之(二)pooling层
- CNN中pooling层的作用
- 【深度学习】caffe之pooling层
- caffe学习笔记24-Pooling层学习
- pooling层是如何反向传播的?
- CNN—pooling层的作用
- Pooling
- pooling
- ROI
- roi
- 6.16
- 【java】求1-10的和。
- 【Angular2】AnswerSheet组件设计
- 14 个你可能不知道的 JavaScript 调试技巧
- 侧滑菜单xml和代码
- ROI Pooling层详解
- HDU
- 链表相关练习题
- 简单实现断点续传+MVP+Retrofit+RxJava
- 简单的断点传送,不需理解,粘贴运行
- 通国轮廓进行抠图 掩膜
- F1
- ECS访问RDS超时504的解决方法
- Android Studio常见问题 -- AndroidManifest.xml 替换别名问题