slide2 The Generalized R-CNN Framework for Object Detection
来源:互联网 发布:单片机识别条形码 编辑:程序博客网 时间:2024/06/05 00:33
通用的R-CNN框架用于目标检测
R-CNN(基于区域的卷积神经网络)region-base convolutional neural network教程概述
覆盖的主题
- 目标检测介绍(非常简短)
- 通用的R-CNN框架
- 单阶段vs多阶段检测器&速度/精度折中
边界框目标检测
需要完成两个任务:
分类:指出目标是什么类别 回归:指出目标在什么位置(用边界框标出来)
检测器发展到现在已经做到怎么样了?
在COCO数据集上目标检测的平均精度(%)
过去(最好的准则,2012,DPM,5%)
早期(2015,faster R-CNN 基于AlexNet,15%)
深度学习方法将精度提升到了3倍
2015到2017年,通过深度学习方法的发展,精度又提高了3倍
稳定的进步
R-CNN(2014) SPP-net(2014)
Fast R-CNN(2015) Faster R-CNN(2015)
R-FCN(2016)
Feature Pyramid Networks+Faster R-CNN(2017) Mask R-CNN(2017)
R-CNN(基于区域的卷积神经网络)
第一步,对于每张输入图片,利用Selection search(选择性搜索),edge Boxes, MCG等现有的目标候选框产生算法,产生大概2000个候选框
对每个候选框(尺寸不一)所包含的图片区域,进行裁剪或弯曲,得到固定大小的候选框作为网络的输入(由于后面连接有全连接层,所以需要固定大小的输入,以得到固定大小的特征向量,送入全连接层)
对于固定大小的候选框输入,利用卷积神经网络前向传播,得到固定尺寸的特征表达
对于得到的固定尺寸的特征表达,利用1vs rest 支持向量机分类器进行分类
对每个候选框的位置进行回归,优化候选框的位置
R-CNN存在的问题:
计算量非常大,对于每个候选框,都需要进行一次网络前向传播和分类、回归运算,速度非常慢
通用的R-CNN框架
可分为两个部分:对于每幅图像的计算,对于产生的每个候选框的计算
对于每幅图像的计算,也就是利用图像产生候选框同时生成相应的特征图;对产生的候选框的计算,也就是对候选框进行分类和回归,判断目标类别及位置
把输入图像变换成特征表达
利用输入图像计算得到候选框
对于每个候选框,根据候选框的位置,可以根据输入图像计算得到的特征图得到该候选框的特征表达
对于得到的特征向量,利用多head操作执行特定任务(分类,回归,在mask rcnn中还可以是分割),这里面要用到multi-task损失函数。
由R-CNN到Fast R-CNN
轻量级的对于每个候选区域的计算,端到端的训练版本(SPP-net,利用空间金字塔池化,使得图像不用进行裁剪、扭曲操作)
- 利用全卷积网络提取特征
- 利用RoI池化层得到固定尺寸的输出
- 利用多层感知器进行分类和回归
阅读全文
0 0
- slide2 The Generalized R-CNN Framework for Object Detection
- Object Detection R-CNN
- Object Detection(2):Fast R-CNN
- R-CNN系列object detection方法概述
- 【object detection】R-cnn论文笔记
- Object Detection系列(一) R-CNN
- (R-CNN)Rich feature hierarchies for accurate object detection and semantic segmentation
- R-CNN(Rich feature hierarchies for accurate object detection and semantic segmentation)
- R-CNN论文笔记《Rich feature hierarchical for accurate object detection and semantic segmentation》
- Fast R-CNN: Fast Region-based Convolutional Networks for object detection
- Region-based Convolutional Networks for Accurate Object Detection and Segmentation----R-CNN论文笔记
- R-CNN: Rich feature hierarchies for accurate object detection and semantic segmentation
- 【转】R-CNN学习笔记2:Rich feature hierarchies for accurate object detection and semantic segmentation
- R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation(阅读)
- Fast R-CNN: Fast Region-based Convolutional Networks for object detection(阅读)
- R-CNN学习笔记2:Rich feature hierarchies for accurate object detection and semantic segmentation
- R-CNN:Region-based convolutional networks for accurate object detection and segmentation阅读笔记
- (R-CNN)Rich feature hierarchies for accurate object detection and semantic segmentation
- CodeForces
- JAVA多线程系列--Lock锁-ReentrantLock之Condition应用
- Zigzag Iterator ii
- 开发工具
- android 多文件多线程断点续传下载
- slide2 The Generalized R-CNN Framework for Object Detection
- STM32 时钟控制
- 三维计算机视觉(三)--点云分割
- jquery Select操作方法
- 一级列表MVP封装
- 6.4
- QT练习简单程序编辑
- java.lang.NoClassDefFoundError: okhttp3.Protocol[]
- JS破解不能'选取'和'复制'网站文字