[论文笔记]A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection

来源:互联网 发布:计算机编程与维护 编辑:程序博客网 时间:2024/05/21 22:23

paper

一、论文思想

训练一个目标检测器,对遮挡和形变鲁棒,目前的主要方法是增加不同场景下的图像数据,但这些数据有时又特别少。作者提出使用对抗生成有遮挡或形变的样本,这些样本对检测器来说识别比较困难,使用这些困难的正样本训练可以增加检测器的鲁棒性。 使用对抗网络生成有遮挡和有形变的两种特征,分别对应网络ASDN和ASTN。使用对抗网络生成有遮挡和有形变的两种特征,分别对应网络ASDN和ASTN。

1.ASDN

FAST-RCNN中RoI-池化层之后的每个目标proposal卷积特征作为对抗网络的输入,给定一个目标的特征,ASDN尝试生成特征某些部分被dropout的掩码,导致检测器无法识别该物体。
ASDN网络初始化: 给定尺寸大小为d×d的特征图X,使用d3×d3的滑动窗,并将滑动窗位置映射到原图,将原图对应位置清零,生成新的特征向量,传入到分类层计算损失,选择具有最大损失的滑动窗,用这个窗口生成二值掩码M(滑动窗位置为1,其余位置为0),用n个目标proposal生成n对对抗网络的训练样本(x1,M1),…,(xn,Mn) ,使用二值交叉熵损失训练ASDN:
这里写图片描述

在前向传播过程中,首先使用ASDN在RoI-池化层之后生成特征掩码,然后使用重要性采样法生成二值掩码,使用该掩码将特征对应部位值清零,修改后的特征继续前向传播计算损失。这个过程生成了困难的特征,用于训练检测器。训练过程流程图如下所示:
这里写图片描述

2.ASTN

STN网络包含三部分:定位网络,网格生成器,采样器。定位网络估计出形变的参数(旋转角度、平移距离和缩放因子)。这三个参数作为后两部分的输入,输出是形变后的特征图。论文主要学习定位网络的三个参数。
ASTN: 主要关注特征旋转,定位网络包含三层全连接层,前两层是ImageNet预训练的fc6和fc7,训练过程与ASDN类似,ASTN对特征进行形变,使得ASTN将正样本识别成负样本。将特征图划分为4个block,每个block估计四个方向的旋转,增加了任务的复杂度。
两种对抗网络可以相结合,使得检测器更鲁棒,RoI-池化层提取的特征首先传入ASDN丢弃一些激活,之后使用ASTN对特征进行形变,如下图所示:
这里写图片描述
ASDN 与 ASTN 网络组合架构示意。首先创建遮挡蒙版,随后旋转路径以产生用于训练的例子。

二、训练

stage1:training a standard Fast-RCNN

./experiments/scripts/fast_rcnn_std.sh [GPU_ID] VGG16 pascal_voc

stage2:pre-training stage for the adversarial network

./experiments/scripts/fast_rcnn_adv_pretrain.sh [GPU_ID] VGG16 pascal_voc

stage3:copy the weights of the above two models to initialize the joint model

./copy_model.h

stage4: joint training of the detector and the adversarial network

./experiments/scripts/fast_rcnn_adv.sh [GPU_ID] VGG16 pascal_voc

三、代码解析

1.sigmod交叉熵

这里写图片描述
这里写图片描述
这里写图片描述
进一步可化简为:
这里写图片描述
这里写图片描述
对应本文中的代码是: adversarial-frcnn/lib/roi_data_layer/layer.py
这里写图片描述
代码解析:

1.注意绝对值使用的巧妙之处: * lZ = np.log(1+np.exp(-np.abs(f))) mask Lz对应化简公式的第二项,其中e的指数项x在两种情况下,均为非正,可以概括为代码中np.exp(-np.abs(f))
2.注意判断语句使用的巧妙之处: * ((f>0)-t)*f mask该项对应化简公式的第一项,对应caffe源码为:

这里写图片描述

四、参考链接

caffe网络可视化工具:http://ethereon.github.io/netscope/#/editor
交叉熵公式推导:http://caffecn.cn/?/question/25
交叉熵公式说明:http://blog.csdn.net/u014114990/article/details/47975739
论文代码:https://github.com/xiaolonw/adversarial-frcnn
关于作者 Edited by fangfang xiuhong
Contact GitHub API Training Shop Blog About
© 2017 GitHub, Inc. Terms Privacy Security Status Help

阅读全文
0 0