CV论文之Vehicle Classification using Transferable Deep Neural Network Features

来源:互联网 发布:python 理解 自然语言 编辑:程序博客网 时间:2024/05/08 17:11

这篇文章非常偏工程,本来不想写,但是既然看了看就还是写一下吧。一张图足以说明本文所有:

这里写图片描述

本文做了两件事情,车辆检测与车辆分类。数据集来自在道路上拍的视频,可以看作监控视频,那么就可以用传统方法提取前景和背景,把车辆找出来,具体是这么做的:
1. 用时域中值滤波计算背景;
2. 用背景减除获得前景;
3. 用中值滤波去噪;
4. 用自适应阈值方法确定前景与背景。
这样得到了可能存在车辆的前景图像,此外用连通域分析以及其他视觉上的差异,结合道路两边的标线定位,找出只含有整个车辆的前景图像。
分类只有两类,载客车和非载客车,方法是在Caffe框架上使用AlexNet,提取fc6和fc7作为一般图像特征表示,都是4096维的向量。训练网络用到迁移学习的思想,但是考虑到数据量悬殊大(100 vs 1,000,000),因此都不微调了,直接拿预训练好的AlexNet来提取高层特征。再用主成分分析(PCA)或线性判别分析(LDA)来降维,最后用支持向量机(SVM)来分类。
上面这些都没有什么意思,比较有意思的是求平均图像,就是对某一维特征fi(i∈{1, 2, …, 4096})的值进行排序,取最大的一些值相应的图像,求出它们的均值。说明图像相应的特征包含了有相应语义含义的高级可视化信息,下面分别是对4个不同维度的特征求出的图像均值,是不是有点像前段时间很火的“平均脸”?

这里写图片描述

结果也没有什么意思,这里不列出了。

0 0
原创粉丝点击