车辆检测“DAVE: A Unied Framework for Fast Vehicle Detection and Annotation”

来源：互联网发布：淘宝黑莓编辑：程序博客网时间：2024/06/05 17:26

检测车辆的同时对车辆进行属性标记，DAVE包括两个网络，一个快速proposal网络FVPN，和一个属性学习网络ALN，属性学习获取车辆的姿态，颜色和类型。DAVE实现的功能如下图所示：

这里写图片描述

快速车辆候选区域提取网络FVPN
FVPN是一个浅层全卷积网络，有三个卷积层，最大池化和ReLU与前两个卷积层相连，第三个卷积层分成3个1*1的卷积层分支，conv_fc_class输出正负卷积softmax概率，conv_fc_bbr表示正样本bbox坐标，conv_fc_konwledge学习由ALN提取的latent data-driven knowledge。每个分支使用的损失函数不同，conv_fc_class使用softmax损失，conv_fc_bbr使用smooth L1损失对bbox回归，conv_fc_konwledge使用cross entropy损失。

属性学习网络
基于GoogLeNet，增加了4个全卷积层，将其扩展成多属性学习模型。多任务网络使用四个softmax损失层优化，分别为是否为车辆，姿态，颜色和类型，损失函数为：
这里写图片描述

DAVE网络结构如下图所示：
这里写图片描述

网络训练
基于CompCars数据库对网络进行训练，ALN输入图像分辨率为224*224，FVPN输入分辨率为60*60，ALN的pool5/7*7_s1层的1024维特征用来监督FVPN中相同维度特征的学习（使用cross entropy损失）。

车辆proposal提取的实现
将10层图像金字塔输入到FVPN，将所有的热度图整合到一张proposal得分图上，过滤低阈值的亮斑，然后使用圆心扫描器扫描局部极值。将这些局部极大值作为proposal的中心，亮斑的bbox作为初步的proposa宽和高，放大1.5倍后输入到ALN。网络推理过程如下图所示：
这里写图片描述

0 0

车辆检测“DAVE: A Uni ed Framework for Fast Vehicle Detection and Annotation”

车辆检测“DAVE: A Unied Framework for Fast Vehicle Detection and Annotation”