SparseCoding(1)_金字塔匹配核函数(The Pyramid Match Kernel)
来源:互联网 发布:网络大电影审批 编辑:程序博客网 时间:2024/05/17 01:00
The Pyramid Match Kernel: Discriminative Classification with Sets of Image Features, 2005, ICCV
主要是对论文的翻译和总结。
这篇论文是Sparse Coding for Image Classification的一个源头(虽然这篇并未提及Sparse Coding)。这个专题会依次总结到目前最新的成果,形成一个系统的体系。
Introduction
众所周知,SVM是通过寻找特征空间中最优分类超平面进行分类。然而,很多情况下特征向量未必线性可分,这时则需要利用核函数机器将特征空间映射到更高的维度,使其线性可分。
任何线性方法,只要能通过核函数间接实现对输入空间的非线性变换,都可以采用核函数技巧进行非线性化。
如上图所示,原本的特征空间是二维非线性,但是通过核函数将其映射到三维空间中则可以找到最优分类超平面,使其线性可分。
而这篇论文最主要的贡献就是提出了一种基于隐式对应关系的核函数,解决了无序的、变长的向量集合的分类问题。这个核函数是正定的,并且实现起来很高效。
这个方法的主要思想是,将特征集合映射到多分辨率直方图中,然后利用加权直方图的交集进行比较,进而估计出特征集之间的最佳部分匹配的相似程度。
由于所有的输入集合都要转换为超分辨率直方图,故这个核被称为金字塔匹配核函数(The Pyramid Match Kernel)。
The Pyramid Match Kernel
考虑空间
特征提取函数
其中,
译注:文中这段话有点晦涩,举个例子:
假设一个20人的班级举行期末考试,其成绩分布在[0,100],且两两不同,成绩最相近的两个人相差
第二个直方图就是统计下列每个区间中的人数:
最后一个直方图就是统计下列每个区间中的人数:
这里假设每个直方图的区间都恰好把 [0,100]分开,这样,前一个直方图的区间数目则为后一个的二倍。
而两个直方图间的相似程度则可以用以下函数来衡量:
其中,
译注:举个例子
还是期末考试,同前,A班[51,55]内0人,[56,60]内1人;B班[51,55]内1人,[56,60]内0人。
显然,在size=5的直方图中,这两个区间并未配对(相等),但是在[50,60]这个bins中,A、B班都是1人,所以这个是新配对的。
注意公式(3)的下标是从0开始,这是因为i=-1时一定不存在相互匹配的点(根据定义,此时每个bins中只有一个点)。
核通过直方图交集函数
其中,
下图是该方法的一个例子:
直方图的交集高效地计算了两个集合中在给定的量化层次上形成匹配的点的数量,即落在同一个bin中的点的数量。为了计算第
其中,
在金字塔中,每一层新发生的匹配都被赋予基于直方图的bins的长度的权重:大的bins赋予更少的权重,小的bins赋予更大的权重。在第
根据(3)(4)(5)式,我们可以得到未归一化的金字塔匹配核函数:
其中,
其中,
为了缓解离散直方图带来的量化效应,可以将不同尺度的Pyramid Match Kernel值进行级联,并比较最终结果。那么就会得到多个超分辨率的级联直方图:
Partial Match Correspondences
由于该核函数允许集合的元素数目不等,所以该方法可以用于局部匹配,即将小的集合映射到大的集合的子集。但与之前不同的是,局部匹配只判定最相似的部分,而其余的部分将被忽略,其结果则为一种鲁棒的相似性测量。由于在图像的目标识别中,往往有不同的背景,也可能有噪声,物体的姿势也会有所不同,所以,上述性质是很实用的性质。
译注:有点类似于综艺节目中,去掉一个最低分去掉一个最高分,而将其他评委的分数进行均值来评定一个选手一样,即为局部匹配的思想。
当具有相同的基数时,直方图的交运算可以退化为
其中,
Efficiency
以下为论文中的实验部分
Approximate Partial Matchings
实验中,生成两个数据集,其中,每个数据集包含100个二维点集,其中点的坐标分布在[1,1000]。在第一个数据集中,每个点集所包含的点的数量相同(每个点集包含100个点),而在第二个数据集中,每个点集所包含的点的数量为[5,100]的随机数。
下图展示了实验的结果,其中,左图为第一个数据集的测试结果,右图为第二个数据集的测试结果。由于每个数据集中有100个点集,所以,将点集两两比较会比较10000次,而每次比较会计算这两个集合间的
从左图可以看出,
- SparseCoding(1)_金字塔匹配核函数(The Pyramid Match Kernel)
- SparseCoding(2)_空间金字塔匹配(Spatial Pyramid Matching, SPM)
- The Pyramid Match Kernel学习[1]
- The Pyramid Match Kernel学习[1]
- Pyramid match kernel and spatial pyramid matching
- Histogram intersection(直方图交叉核,Pyramid Match Kernel)
- Histogram intersection(直方图交叉核,Pyramid Match Kernel)
- Histogram intersection(直方图交叉核,Pyramid Match Kernel)
- Histogram intersection(直方图交叉核,Pyramid Match Kernel)
- Histogram intersection(直方图交叉核,Pyramid Match Kernel)
- Histogram intersection(直方图交叉核,Pyramid Match Kernel)
- Histogram intersection(直方图交叉核,Pyramid Match Kernel)
- Histogram intersection(直方图交叉核,Pyramid Match Kernel)
- 空间金字塔匹配Spatial Pyramid Matching 小结
- 智力金字塔( IQ Pyramid Games)
- Excel数据分析与业务建模_第四章_匹配函数MATCH(语法详解及应用实例)
- 金字塔(pyramid)与概视图(overview)
- 图像拉普拉斯金字塔融合(Laplacian Pyramid Blending)
- Bootstarp 基础 基本模版
- HadoopRDD 的生成过程解析
- Spark通过mapPartitions方式加载Json文件,提高文件加载速度
- 统一的分布式数据库和文件系统,及利用mysqlfs解决aliyun上做站的存储成本难题
- css媒体查询与导航栏
- SparseCoding(1)_金字塔匹配核函数(The Pyramid Match Kernel)
- openocd 下载程序到32开发板学习笔记
- Android学习之发送及接收广播及本地广播
- hibernate单表操作
- android webView setWebChromeClient and setWebClient
- 我想搞个网站
- android侧滑菜单整理(一)
- 【寒假任务】 洛谷1051 谁拿了最多奖学金
- Nexus 私服上传文件,并通过 Gradle 引用