车辆检测“DAVE: A Uni ed Framework for Fast Vehicle Detection and Annotation”

来源:互联网 发布:淘宝黑莓 编辑:程序博客网 时间:2024/06/05 17:26

检测车辆的同时对车辆进行属性标记,DAVE包括两个网络,一个快速proposal网络FVPN,和一个属性学习网络ALN,属性学习获取车辆的姿态,颜色和类型。DAVE实现的功能如下图所示:

这里写图片描述

快速车辆候选区域提取网络FVPN
FVPN是一个浅层全卷积网络,有三个卷积层,最大池化和ReLU与前两个卷积层相连,第三个卷积层分成3个1*1的卷积层分支,conv_fc_class输出正负卷积softmax概率,conv_fc_bbr表示正样本bbox坐标,conv_fc_konwledge学习由ALN提取的latent data-driven knowledge。每个分支使用的损失函数不同,conv_fc_class使用softmax损失,conv_fc_bbr使用smooth L1损失对bbox回归,conv_fc_konwledge使用cross entropy损失。

属性学习网络
基于GoogLeNet,增加了4个全卷积层,将其扩展成多属性学习模型。多任务网络使用四个softmax损失层优化,分别为是否为车辆,姿态,颜色和类型,损失函数为:
这里写图片描述

DAVE网络结构如下图所示:
这里写图片描述

网络训练
基于CompCars数据库对网络进行训练,ALN输入图像分辨率为224*224,FVPN输入分辨率为60*60,ALN的pool5/7*7_s1层的1024维特征用来监督FVPN中相同维度特征的学习(使用cross entropy损失)。

车辆proposal提取的实现
将10层图像金字塔输入到FVPN,将所有的热度图整合到一张proposal得分图上,过滤低阈值的亮斑,然后使用圆心扫描器扫描局部极值。将这些局部极大值作为proposal的中心,亮斑的bbox作为初步的proposa宽和高,放大1.5倍后输入到ALN。网络推理过程如下图所示:
这里写图片描述

0 0
原创粉丝点击