图像物体分类

来源:互联网 发布:拓扑排序算法c实现 编辑:程序博客网 时间:2024/05/16 01:21

对比图像分类五大方法:KNN、SVM、BPNN、CNN和迁移学习> 物体分类任务要求回答一张图像中是否包含某种物体,对图像进行特征描述是物体分类的主要研究内容,一般来说,物体分类算法通过手工特征或者特征学习方法对整个图像进行全局描述,然后使用分类器判断是否存在某类物体。

一、物体分类检测研究存在的困难


这里写图片描述

二、物体分类方法

近年来,物体分类方法多侧重于学习特征表达,典型的包括词包模型(Bag-of-Words)、深度学习模型。

1.基于词包模型的物体分类

词包模型最初产生于自然语言,通过建模文档中单词出现的频率来对文档进行描述与表达,。

1)底层特征提取

  • 基于兴趣点检测:通过某种准则选择具有明确定义的、局部纹理特征比较明显的像素点、边缘、角点、区块等,并且通常能够获得一定的几何不变性,从而可以在较小的开销下得到更有意义的表达。最常用的兴趣点检测算子有:Harris角点检测子、Fast算子、LOG、DOG……
  • 采用密集提取的方式:从图像中按固定的步长、尺度提取出大量的局部特征描述。常用的局部特征包括:SIFT、HOG、LBP……

2)特征编码

密集提取的底层特征中包含了大量的冗余与噪声,为提高特征表达的鲁棒性,需要使用一种特征变换算法对底层特征进行编码,从而获得更具区分性、更加鲁棒的特征表达。最简单的特征编码是向量量化编码,通过一种量化的思想,使用一个较小的特征集合(视觉词典)来对底层特征进行描述,达到特征压缩的目的。

3)特征汇聚

通过对编码后的特征,每一维都取其最大值或者平均值,得到一个紧致的特征向量作为图像的特征表达。

4)使用支持向量机等分类器进行分类

常用的分类器有支持向量机、K近邻、神经网络、随机森林等,基于在线学习的线性分类器可以处理大规模的数据。

2.深度学习模型

其基本思想是通过有监督或者无监督的方式学习层次化的特征表达,来对物体进行从底层到高层的描述,主流的深度学习模型包括自动编码器、受限玻尔兹曼机、深度信念网络、卷积神经网络、生物启发式模型等。

卷积神经网络主要包括卷积层和汇聚层,卷积层通过使用固定大小的滤波器与整个图像进行卷积,来模拟简单细胞;汇聚层则是一种降采样操作,通过取卷积得到的特征图中局部区块的最大值、平均值来达到降采样的目的,并在这个过程中获得一定的不变性,在网络的最后通常会增加若干全连通层和一个分类器,卷积神经网络中卷积层的滤波器是各个位置共享的,因而可以大大降低参数的规模,有效防止模型过于复杂。

参考文献:

图像分类与检测算法综述

对比图像分类五大方法:KNN、SVM、BPNN、CNN和迁移学习


8/31/2017 3:31:09 PM

作者:大表哥

版权归作者所有,转载请注明出处

原创粉丝点击