目标检测--A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection

来源:互联网 发布:迅捷路由器的访客网络 编辑:程序博客网 时间:2024/05/22 03:28

A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
ECCV2016
https://github.com/zhaoweicai/mscnn

本文首先指出 Faster RCNN 在小目标检测存在的问题,分析其原因。随后提出本文的解决思路:1)在不同尺度特征图上进行候选区域提取,2)放大特征图用于检测

the MS-CNN achieves speeds of 10 fps on KITTI (1250×375) and 15 fps on Caltech (640×480) images

首先来看看 Faster-RCNN 中 RPN 存在的问题
RPN 是怎么提取候选区域的了?在一组固定的卷积特征图上滑动一组固定的滤波器
the RPN generates proposals of multiple scales by sliding a fixed set of filters over a fixed set of convolutional feature maps.

这就有一个不匹配的问题,物体尺度是变化的,但是滤波器感受野是固定的。导致小目标的检测效果尤其的差
This creates an inconsistency between the sizes of objects, which are variable, and filter receptive fields, which are fixed

这里写图片描述

我们针对目标检测提出了一个 unified multi-scale deep CNN, denoted the multi-scale CNN (MS-CNN),
主要包括两个部分: an object proposal network and an accurate detection network
3 Multi-scale Object Proposal Network
3.1 Multi-scale Detection
这里写图片描述
(a) 单个分类器,多尺度输入图像, 这种方法检测精度最高,计算量很大
(b) 多个分类器,单尺度输入图像,效率高点,精度差些
(c) 介于 (a)和 (b) 之间,若干分类器和若干尺度输入图像
(d) 合成多尺度特征图,单个分类器
(e) RCNN 中对候选区域多特征图归一化
(f) RPN 多个模板 anchor
(g) 本文的多尺度策略

本文的候选区域提取架构:
这里写图片描述
这么做的目的就是靠前的特征图可以检测小目标,靠后的特征图可以检测大目标

4 Object Detection Network 检测网络,这里用了一个反卷积的特征图放大
To the best of our knowledge, this is the first application of deconvolution to jointly improve the speed and accuracy of an object detector.

这里写图片描述
这个结构中有一个 context,就是候选区域外围的一圈,The context region is 1.5 times larger than the object region

5 Experimental Evaluation

这里写图片描述

KITTI benchmark test set
这里写图片描述

11

阅读全文
'); })();
0 0
原创粉丝点击
热门IT博客
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 兽兵卫忍风帖龙宝玉篇 簟字怎么读 簟怎么读 芙蓉簟 簟怎么读音 簟字怎么读音 枕簟溪堂冷欲秋 芙蓉簟 匪我思存 凉簟碧纱厨 玉簪花 玉簪的意思 玉簪花图片 玉簪拼音 玉簪记 玉簪的拼音 玉簪子 原笼玉簪 玉簪读音 玉簪基地 玉簪图片 紫玉簪 玉簪螺髻 玉簪怎么养 东北玉簪 白花玉簪 蓝玉簪龙胆 玉簪属 盆栽玉簪 战国玉簪 玉簪的读音 玉簪堵住铃口 玉簪堵住铃口道具控制 奶奶的玉簪子阅读答案 玉簪花一般多少钱 玉簪花的养殖方法 玉簪什么意思 白玉簪 玉米煮多久 玉米煮 玉米收割机