Linear Spatial Pyramid Matching using Sparse Coding for Image Classification (阅读)
来源:互联网 发布:java疯狂讲义第三版 编辑:程序博客网 时间:2024/06/04 18:29
论文和源码地址:http://www.ifp.illinois.edu/~jyang29/ScSPM.htm
先看下这个主页中的SPM和ScSPM的对比:
SPM的方法
ØStep 1: local descriptor extraction
ØStep 2:vector quantization (e.g.k-means)
ØStep 3:hierarchical average pooling
ØStep 4:nonlinear SVM
ScSPM的方法
ØStep 1: local descriptor extraction
ØStep 2:sparse coding (无监督词典)
ØStep 3:hierarchical max pooling(提取最大的稀疏系数)
ØStep 4:linear SVM
=====================================================================
首选是决策函数:
z是基于描述符编码的某种统计数据得到的特征向量。然后通过下面的z的求解需要用到聚类标识符U=[u1,…,uM]T,通过pooling function z=F(U)得到。
下面就是SC取代了VQ对SIFT特征进行编码的公式:
(采用的是固定V,优化u)而这样做的好处:1,SC约束宽松一些,因而有更低的重建误差;2,稀疏性可捕捉更显著的特征;3,图像块是稀疏信号
接下来就是用maxpooling function取代averaging function
文中说max这样做视觉特征好,并通过连结图像不同位置与不同分辨率的空间塔式表示得到特征向量z。
然后这张Ii的图像用Zi表示,看一下SPM kernel函数:
代入到决策函数中得到:
====================================================================
论文提到成功的3个点:
1、SC比VQ的quantization errors小;
2、sparse coding适合图像数据;
3、max pooling在局部信息方面的强大;
所以说成功还是取决于SC和Max部分,也就是这篇论文重点。
====================================================================
0 0
- Linear Spatial Pyramid Matching using Sparse Coding for Image Classification (阅读)
- Linear Spatial Pyramid Matching Using Sparse Coding for Image Classification 理解
- Linear Spatial Pyramid Matching Using Sparse Coding for Image Classification代码解
- 关于2009_CVPR_Linear spatial pyramid matching using sparse coding for image classification
- Locality-constrained Linear Coding for Image Classification(阅读)
- Spatial Pyramid Matching for Recognizing Natural Scene Categorie(阅读)
- 关于2010_CVPR_Locality-constrained Linear Coding for Image Classification
- Spatial Pyramid Matching 小结
- Spatial Pyramid Matching
- 初识 Spatial Pyramid Matching
- Spatial Pyramid Matching 小结
- Spatial Pyramid Matching
- Pyramid match kernel and spatial pyramid matching
- Are sparse representations really relevant for image classification?
- 空间金字塔匹配Spatial Pyramid Matching 小结
- SPM——Spatial Pyramid Matching
- spatial pyramid pooling(matching)方法的解释
- 关于2006_CVPR_Beyond Bags of Features Spatial Pyramid Matching for Recognizing Natural Scene Categorie
- mongodb shell浮点数转为整数 NumberInt()
- 2015年下半年信管中高级网络面授直播课程(30课时)
- Android studio java文件显示j爆红
- LeetCode(41) Single Number I 和 II
- MySQL主主复制+Keepalived 打造高可用MySQL集群
- Linear Spatial Pyramid Matching using Sparse Coding for Image Classification (阅读)
- C# c\s 自动化框架 问题解决记录
- OMNET4.6最新版本安装包下载
- 索引使用及索引失效总结
- 【深度学习】卷积神经网络(Convolutional Neural Networks)
- CIR,CBS,EBS,PIR,PBS傻傻分不清楚?看这里!----揭秘令牌桶
- 怎样才能把pdf文件转换成jpg
- 大数据企业
- asp.net中runat="server"的含义