程序博客网 > 软件架构师英文

高维数据的快速最近邻

来源：互联网发布：软件架构师英文编辑：程序博客网时间：2024/09/21 09:02

高维数据的快速最近邻算法FLANN

1. 简介

在计算机视觉和机器学习中，对于一个高维特征，找到训练数据中的最近邻计算代价是昂贵的。对于高维特征，目前来说最有效的方法是 the randomized k-d forest和the priority search k-means tree，而对于二值特征的匹配 multiple hierarchical clusteringtrees则比LSH方法更加有效。

目前来说，fast library for approximate nearest neighbors (FLANN)库可以较好地解决这些问题。

2. 快速近似NN匹配（FAST APPROXIMATE NN MATCHING）

2.1 随机k-d树算法（The Randomized k-d TreeAlgorithm）

a. Classick-d tree

找出数据集中方差最高的维度，利用这个维度的数值将数据划分为两个部分，对每个子集重复相同的过程。

参考http://www.cnblogs.com/eyeszjwang/articles/2429382.html。

b. Randomizedk-d tree

建立多棵随机k-d树，从具有最高方差的N_d维中随机选取若干维度，用来做划分。在对随机k-d森林进行搜索时候，所有的随机k-d树将共享一个优先队列。

增加树的数量能加快搜索速度，但由于内存负载的问题，树的数量只能控制在一定范围内，比如20，如果超过一定范围，那么搜索速度不会增加甚至会减慢。

2.2 优先搜索k-means树算法（The Priority Search K-MeansTree Algorithm）

随机k-d森林在许多情形下都很有效，但是对于需要高精度的情形，优先搜索k-means树更加有效。 K-means tree 利用了数据固有的结构信息，它根据数据的所有维度进行聚类，而随机k-d tree一次只利用了一个维度进行划分。

2.2.1 算法描述

算法1 建立优先搜索k-means tree:

(1) 建立一个层次化的k-means 树；

(2) 每个层次的聚类中心，作为树的节点；

(3) 当某个cluster内的点数量小于K时，那么这些数据节点将做为叶子节点。

算法2 在优先搜索k-means tree中进行搜索：

(1) 从根节点N开始检索；

(2) 如果是N叶子节点则将同层次的叶子节点都加入到搜索结果中，count += |N|；

(3) 如果N不是叶子节点，则将它的子节点与query Q比较，找出最近的那个节点Cq，同层次的其他节点加入到优先队列中；

(4) 对Cq节点进行递归搜索；

(5) 如果优先队列不为空且 count<L，那么从取优先队列的第一个元素赋值给N，然后重复步骤(1)。

聚类的个数K，也称为branching factor 是个非常主要的参数。

建树的时间复杂度 = O( ndKI ( log(n)/log(K) )) n为数据点的总个数，I为K-means的迭代次数。搜索的时间复杂度 = O( L/K * Kd * ( log(n)/(log(K) ) ) = O(Ld ( log(n)/(log(K) ) )。

2.3 层次聚类树（The Hierarchical ClusteringTree）

层次聚类树采用k-medoids的聚类方法，而不是k-means。即它的聚类中心总是输入数据的某个点，但是在本算法中，并没有像k-medoids聚类算法那样去最小化方差求聚类中心，而是直接从输入数据中随机选取聚类中心点，这样的方法在建立树时更加简单有效，同时又保持多棵树之间的独立性。

同时建立多棵树，在搜索阶段并行地搜索它们能大大提高搜索性能（归功于随机地选择聚类中心，而不需要多次迭代去获得更好的聚类中心）。建立多棵随机树的方法对k-d tree也十分有效，但对于k-means tree却不适用。

3. 参考文献

(1) ScalableNearest Neighbor Algorithms for High Dimensional Data. Marius Muja, Member,IEEE and David G. Lowe, Member, IEEE.

(2) OptimisedKD-trees for fast image descriptor matching. Chanop Silpa-Anan, Richard Hartley.

(3) FastMatching of Binary Features. Marius Muja and David G. Lowe.

from:http://blog.csdn.net/jinxueliu31/article/details/37768995

阅读全文

0 0

软件架构师英文

软件架构师英文

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子酥油的功效酥油的成分什么是酥油无水酥油和起酥油的区别液态酥油酥油茶的做法起酥油的危害酥油花by童子酥油茶的功效塔尔寺酥油花起酥油怎么用陈事by酥油饼幽灵境by酥油饼千层酥油饼做法误入正途酥油饼幽灵镜酥油饼什么是起酥油酥油的几种吃法酥油怎么制作酥油的功效与作用酥油做法大全酥油是什么做的如何制作酥油酥油简单吃法 suyou 甩不掉的超富男友酥油饼糖醋酥皮茄子香芋酥皮作品酥皮酥皮面包酥皮绿豆饼千层酥皮酥皮月饼的做法酥皮油酥皮点心的做法酥皮蛋糕酥皮烧饼酥皮豆沙饼的做法酥皮蛋挞的做法酥皮怎么做酥皮饼