【论文笔记】Region-based Convolutional Networks for Accurate Object Detection and Segmentation

来源：互联网发布：数据分析培训编辑：程序博客网时间：2024/06/05 04:23

《Region-based Convolutional Networks for Accurate Object Detection and Segmentation》是将卷积神经网络应用于物体检测的一篇经典文章。

整个识别过程可以用下面的一张图片来清晰的表示：

首先给定一张输入图像，采用selective search产生区域提名，因为区域提名的长宽比例不一样，将提取出的区域缩放为固定的大小和长宽比例以便于送入CNN模型进行运算。通过CNN运算后，得到一个特征向量，然后通过线性SVM来判断这个区域是否属于某个类别。

1.要想做检测，首先需要的是区域提名，文章中提到了很多种区域提名的方法：objectness [51], selective search [21], category-independent object proposals [52], constrained parametric min-cuts (CPMC) [22], multi-scale combinatorial grouping [35] 。本文中用了selective search （J. Uijlings, K. van de Sande, T. Gevers, and A. Smeulders, “Selective search for object recognition,”IJCV, 2013 ）作为区域提名的方法。通过该方法，对于每张图片可以产生大概2000个候选区域。

2.网络采用的是经典的AlexNet网络，文中称之为TorontoNet，其实是同一个网络。训练过程中，采用梯度下降法，在VOC和ILSVRC2013 两类数据集上分别进行训练，在网络的最后，不是采用softmax而是针对没一个类别单独的训练一个线性SVM。

0 0