【深度学习】图像分类问题笔记

来源:互联网 发布:电视剧国防生知乎 编辑:程序博客网 时间:2024/03/29 13:21

困难和挑战

  • 视角变化(Viewpoint variation):同一个物体,摄像机可以从多个角度来展现。
  • 大小变化(Scale variation):物体可视的大小通常是会变化的(不仅是在图片中,在真实世界中大小也是变化的)。
  • 形变(Deformation):很多东西的形状并非一成不变,会有很大变化。
    遮挡(Occlusion):目标物体可能被挡住。有时候只有物体的一小部分(可以小到几个像素)是可见的。
  • 光照条件(Illumination conditions):在像素层面上,光照的影响非常大。
  • 背景干扰(Background clutter):物体可能混入背景之中,使之难以被辨认。
  • 类内差异(Intra-class variation):一类物体的个体之间的外形差异很大,比如椅子。这一类物体有许多不同的对象,每个都有自己的外形。

实现步骤

  1. 低维度特征提取
    常用的局部特征提取的方法有:SIFT HOG LBP
  2. 特征编码
    常用的特征编码的方法有:vector quantization, sparse coding, locality-constrained linear coding, Fisher vector encoding
  3. Spatial constraint
    注: spatial constraint 不会翻译,其解释如下:Spatial constraint or feature clustering is usually adopted after feature encoding for extracting the maximum or average of each dimension in the spatial domain. Pyramid feature matching–a popular feature clustering method–divides an image uniformly into patches and performs feature clustering in each patch.
  4. 图像分类
    常见的分类器有:支持向量机、随机森林

常用模型

图像分类算法常用CNN,具体的几个模型有:VGG, GoogleNet 和 ResNets

引用

http://book.paddlepaddle.org/index.html
https://zhuanlan.zhihu.com/p/20894041?refer=intelligentunit

原创粉丝点击