一种空间数据挖掘方法——skyline查询

来源:互联网 发布:利拉德今年常规赛数据 编辑:程序博客网 时间:2024/06/07 18:48
Skyline Query最初是由Borzsonyi和Kossmann等人在2001年提出,

他们在论文中举了两个著名的例子。其中一个是纽约曼哈顿区天际线,在曼哈顿地区有许多高大漂亮的建筑,但是站在海岸线眺望时能够看到的建筑要么是离海岸线近的建筑,要么是比较高大的建筑,也就是那些无法被遮挡住的建筑才能被看到。这些建筑就构成了曼哈顿的轮廓天际线,英文称之为skyline,这也就是skyline名字的来源。
曼哈顿天际线
第二个例子是“Nassau旅馆”,假设去Nassau海滩旅游,大多数游客先肯定是想找离海滩近价格又便宜的旅馆,这个例子就是基于“价格便宜”和“离海滩近”两个目标。但是一般离海滩近的旅馆价格高一些,所以不会有一个确定的结果,只能返回一系列的结果供用户选择。这些旅馆的距离和价格都不比其他旅馆“差”,也就是返回值的点在同一价格上没有在距离上更近的点了。
酒店天际线查询
对应于前面的“遮挡”和“差”这个两个概念,Borzsony在论文中给出了支配(domination)的概念
给出一组n维空间数据集合U,U中任意两点P(p_1, p_2…p_n)和Q(q_1, q_2…q_n)。如果在所有维度上 p_i≤q_i,1≤i≤n,并且至少在某一维上 p_i≤q_i,1≤j≤n,则称点P支配点Q。
点支配

原创粉丝点击