CV论文之Vehicle Classification using Transferable Deep Neural Network Features

来源：互联网发布：python 理解自然语言编辑：程序博客网时间：2024/05/08 17:11

这篇文章非常偏工程，本来不想写，但是既然看了看就还是写一下吧。一张图足以说明本文所有：

这里写图片描述

本文做了两件事情，车辆检测与车辆分类。数据集来自在道路上拍的视频，可以看作监控视频，那么就可以用传统方法提取前景和背景，把车辆找出来，具体是这么做的：
1. 用时域中值滤波计算背景；
2. 用背景减除获得前景；
3. 用中值滤波去噪；
4. 用自适应阈值方法确定前景与背景。
这样得到了可能存在车辆的前景图像，此外用连通域分析以及其他视觉上的差异，结合道路两边的标线定位，找出只含有整个车辆的前景图像。
分类只有两类，载客车和非载客车，方法是在Caffe框架上使用AlexNet，提取fc6和fc7作为一般图像特征表示，都是4096维的向量。训练网络用到迁移学习的思想，但是考虑到数据量悬殊大（100 vs 1,000,000），因此都不微调了，直接拿预训练好的AlexNet来提取高层特征。再用主成分分析（PCA）或线性判别分析（LDA）来降维，最后用支持向量机（SVM）来分类。
上面这些都没有什么意思，比较有意思的是求平均图像，就是对某一维特征fi（i∈{1, 2, …, 4096}）的值进行排序，取最大的一些值相应的图像，求出它们的均值。说明图像相应的特征包含了有相应语义含义的高级可视化信息，下面分别是对4个不同维度的特征求出的图像均值，是不是有点像前段时间很火的“平均脸”？

这里写图片描述

结果也没有什么意思，这里不列出了。

0 0