目标检测“A MultiPath Network for Object Detection”

来源:互联网 发布:elasticsearch python 编辑:程序博客网 时间:2024/05/27 21:50

对Fast-RCNN方法做了三个小的修改:(1)检测器能够访问多层特征,(2)foveal结构多尺度提取目标上下文信息,(3)在多个IOU下优化损失函数。网络的结构如下图所示;
这里写图片描述

Foveal结构
在目标识别时,上下文信息很重要,为了增加上下文信息,作者增加了4个裁切,即分别对proposal的视图放大1,1.5,2,4倍,每种情况使用ROI-池化生成特组图,接下来的流程共享相同的结构,之后将4个foveal分类器的输出特征串联成一个长向量,这个特征将用来分类和bbox回归。

损失函数
在多个IOU下的积分损失函数为:
这里写图片描述

在COO上的实验结果:
这里写图片描述

1 0