SpatialHadoop中空间索引系列之(三)格网索引原理

来源:互联网 发布:域名投资人 编辑:程序博客网 时间:2024/05/29 00:32

      接着上一篇继续吧!!!!!!!!!!!!!!这一篇来描述下什么是空间格网索引。格网型空间索引的基本思想是将研究区域用横竖线条划分大小相等或不等的格网,记录每一个格网所包含的空间实体。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体,这样一来就大大地加速了空间索引的查询速度。

=========================================================================

    格网索引

    将研究区域用横竖线条划分大小相等和不等的格网,记录每一个格网所包含的空间实体;用户进行空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体。

    通常是把整个数据库数值空间划分成32×32(或64×64)的正方形网格,建立另一个倒排文件——栅格索引。 
    每一个网格在栅格索引中有一个索引条目(记录),在这个记录中登记所有位于或穿过该网格的物体的关键字。



    检索原理

第一阶段(RDBMS完成):
    接收SQL语句,获取空间过滤器的封装边界;
    检测空间过滤器的封装边界跨越的网格;
    到空间索引表中检索出封装边界所在网格内的要素;
第二阶段:
    几何过滤器的封装边界与第一阶段检索出的要素的边界相比较,找出具有重叠关系的要素;
第三阶段
    几何过滤器的坐标与第二阶段检索出的要素的边界比较,找出边界在几何过滤器内的要素;
第四阶段:
    几何过滤器的坐标与第三阶段检索出的要素的比较,找出最终在几何过滤器内的要素类;

    按格网法对空间数据进行索引时,所划分的格网数不能太多,否则,索引表本身太大而不利于数据的索引和检索。=============================================完!!!!!!!!

0 0