【论文笔记】Region-based Convolutional Networks for Accurate Object Detection and Segmentation

来源:互联网 发布:数据分析 培训 编辑:程序博客网 时间:2024/06/05 04:23

《Region-based Convolutional Networks for Accurate Object Detection and Segmentation》是将卷积神经网络应用于物体检测的一篇经典文章。

整个识别过程可以用下面的一张图片来清晰的表示:

首先给定一张输入图像,采用selective search产生区域提名,因为区域提名的长宽比例不一样,将提取出的区域缩放为固定的大小和长宽比例以便于送入CNN模型进行运算。通过CNN运算后,得到一个特征向量,然后通过线性SVM来判断这个区域是否属于某个类别。



1.要想做检测,首先需要的是区域提名,文章中提到了很多种区域提名的方法:objectness [51], selective search [21], category-independent object proposals [52], constrained parametric min-cuts (CPMC) [22], multi-scale combinatorial grouping [35] 。 本文中用了selective search (J. Uijlings, K. van de Sande, T. Gevers, and A. Smeulders, “Selective search for object recognition,”IJCV, 2013 )作为区域提名的方法。通过该方法,对于每张图片可以产生大概2000个候选区域。

2.网络采用的是经典的AlexNet网络,文中称之为TorontoNet,其实是同一个网络。训练过程中,采用梯度下降法,在VOC和ILSVRC2013 两类数据集上分别进行训练,在网络的最后,不是采用softmax而是针对没一个类别单独的训练一个线性SVM。

0 0
原创粉丝点击