最近邻搜索之乘积量化(Product Quantizer)理解(一)
来源:互联网 发布:mac分区不动了 编辑:程序博客网 时间:2024/06/15 02:29
简介
Product Quantizer是由Herv´e J´egou等人2011年在IEEEE上发表的论文《Product Quantization for Nearest Neighbor Search》中提出来的。它的提出是为了在内存和效率之间求得一个平衡,既保证图像索引结构需要的内存足够,又使得检索质量和速度比较好。对于任何基于固定维数特征的事物,它可以应用到其索引结构的建立及检索上。它属于ANN(approximate nearest neighbor)算法。与它相关的算法有E2LSH(Euclidean Locality-Sensitive Hashing), KD-trees,K-means。
主要思想
Product Quantizer翻译过来是乘积量化,从字面理解大概包括了两个过程特征的分组量化过程和类别的笛卡尔积过程。假设有一个数据集,那么K-means的做法就是给定类别数目K,目标函数是所有样本到类中心的距离和最小,迭代计算优化目标函数,得到K个类中心和每个样本所属的类别。目标函数不变,乘积量化的做法是:
(1)数据集为K个类别,每个样本以一个vector的形式表示,维数为d,将vector的各个分量分成m组。
(2)将所有vector的某组分量作为数据集,采用k-means算法得到个类中心,运行m次k-means算法,则每组都有
个类中心,记这
个类中心为一个集合。
(3)将上述得到的m个集合做笛卡尔积,就得到整个数据集的类中心了。
下图辅助理解。
其实只要联系欧式空间中点的笛卡尔积就很好理解了。
举个栗子
注:例子中示意图引用自Jae-Pil Heo的论文《Distance Encoded Product Quantization》
(转载请注明作者和出处:http://blog.csdn.net/CHIERYU 未经允许请勿用于商业用途)
- 最近邻搜索之乘积量化(Product Quantizer)理解(一)
- 最近邻搜索之乘积量化(Product Quantizer)
- 乘积量化( Product Quantization )近似最近邻搜索 分享
- 最近邻搜索值乘积量化(Product Quantization)
- 乘积量化(PQ)
- MachineLearning— (KNN)k Nearest Neighbor之最近邻法原理举例理解(一)
- 图像检索之乘积量化一
- 算法一 knn 中的 最近邻搜索
- 基础知识(六)KD-Tree快速最近邻搜索
- 最近邻(NNC)
- 最大乘积(Maximum Product,UVa 11059)
- 机器学习(一):k最近邻(kNN)算法
- x264 quantizer 量化相关 [学习笔记2]
- 近邻搜索之制高点树(VP-Tree)
- LeetCode OJ 之 Product of Array Except Self (除了自身的数组的乘积)
- K近邻分类算法与kdTree实现的伪代码(构造kdTree 和 kdTree上搜索最近邻)
- 02--机器学习之最近邻规则分类(KNN)
- 最近邻算法(KNN)
- Android IntentService的使用和源码分析
- IOS多线程系统学习之多线程的优势
- Android内核学习之Binder
- C语言笔记
- 几种常见排序算法的时间复杂度空间复杂度稳定性汇总表
- 最近邻搜索之乘积量化(Product Quantizer)理解(一)
- 中文分词之候选集的选取
- 数学与编程——统计与编程
- JAVA-迭代子模式简单实现
- 迭代器 iterator->second含义
- 几款强力压缩打包软件
- 理解MyGUI3.2.0及其Samples的运行实质
- android studio 更换包名
- 输入一个整数,输出该数二进制表示中1的个数。其中负数用补码表示。