GIS基本理论之四:空间数据分析基本理论

来源:互联网 发布:js页面生成随机数 编辑:程序博客网 时间:2024/05/01 22:56

       GIS基本理论系列是在《地理信息系统原理和应用》读书报告基础上完成的,当作自己对GIS理论的一次复习回顾。 

 

1.     空间信息分析的内容包括哪些操作?有哪些功能?

空间信息分析通常是指GIS为用户提供的解决问题的方法。

空间信息分析的基本方法包括以下一些内容:

1)空间信息量算:质心计算、几何量算、形态量算等

2)空间信息分类:主成分分析(PCA)、层次分析(AHP) 、聚类分析、判别分析等

3)叠加分析:视觉信息复合;属性层叠合

4)网络分析:路径分析、地址匹配、资源分配、空间规划等

5)邻域()分析:缓冲区、泰森多边形、等值线、扩散等

6)空间统计分析:常规统计、空间自相关、回归、趋势分析、专家打分(加权)等

7)数据的插值:点的内插

下面分别描述:

空间数据的查询检索是GIS最基本的功能。用户可通过它,不仅能提取数据库中的既有信息,还能进一步获取很多派生的空间信息。空间数据查询检索:按一定的要求对GIS所描述的空间实体及其空间信息进行访问,检索出满足用户要求的空间实体及其相应的属性,并形成新的数据子集。

空间数据的多元复合、空间属性的多层叠加,是基于同一空间位置、区域,进行属性运算。GIS最主要的分析功能。空间数据叠合是以空间层次分析理论为基础,空间信息复合包括视觉信息复合(只是显示,不生成新数据层,较简单)和属性数据层叠合(生成新的数据层,复杂)

空间数据分类和统计分析的目的是简化复杂的事物,突出主要因素。空间数据分类包括单因素分类,即属性变量区间、组合;间接因素;地理区域;多因素分类,即主成分分析;聚类分析。多变量统计分析主要用于数据分类和综合评价。数据分类是GIS重要组成部分;综合评价是区划和规划的基础。常用统计分析方法包括:

1)常规统计分析:主要完成对数据集合的均值、总和、方差、频数、峰度系数等参数的统计分析。如:数学期望值、中数、众数;极差、离差、标准差、变差系数等。

2)空间自相关分析:空间自相关分析是认识空间分布特征、选择适宜的空间尺度来完成空间分析的最常用的方法。

3)回归分析:用于分析两组或多组变量之间的相关关系。有多种回归拟合,如线性回归、指数回归、对数回归、多元回归等

4)趋势分析:通过数学模型模拟地理特征的空间分布与时间过程,把地理要素时空分布的实测数据点之间的不足部分内插或预测出来

5)主组(成)分分析:亦称K-L变换,用作变量重组和筛选。地理问题往往涉及大量相互关联的自然和社会要素,众多的要素常常给分析带来很大困难,同时也增加了运算的复杂性。主成分分析法通过数理统计分析,将众多要素的信息压缩表达为若干具有代表性的合成变量,这就克服了变量选择时的冗余和相关,然后选择信息最丰富的少数因子进行各种聚类分析。

6)层次分析。在分析涉及大量相互关联、相互制约的复杂因素时,各因素对问题的分析有着不同程度的重要性,决定它们对目标的重要性序列对问题的分析十分重要。AHP方法把相互关联的要素按隶属关系划分为若干层次,请有经验的专家们对各层次各因素的相对重要性给出定量指标(专家打分),利用数学方法,综合众人意见给出各层次各要素的相对重要性权值,作为综合分析的基础。

7)聚类分析系统聚类是根据多种地学要素对地理实体划分类别的方法。对不同的要素划分类别往往反映不同目标的等级序列,如土地分等定级、水土流失强度分级等。

   系统聚类根据实体间的相似程度,逐步合并为若干类别,其相似程度由距离或相似系数定义,主要有欧氏距离、绝对值距离、马氏距离等、切比雪夫距离。

8)判别分析。判别分析与聚类分析同属分类问题,所不同的是,判别分析是根据理论与实践,预先确定出等级序列的因子标准,再将分析的地理实体安排到序列的合理位置上。对于诸如水土流失评价、土地适宜性评价等有一定理论根据的分类系统的定级问题比较适用。

网络分析的具体门类、对象、要求变化非常多。一般GIS只提供一些常用的分析方法,或提供、描述网络的数据模型,储存信息的数据库。

邻近分析是通过空间点周围的邻点,或某特定位置及方向范围内的某种性质的邻点,对其进行分析的一种方法。该方法涉及数据及其邻点之间相互关系。

 

2.     如何实现图形信息与属性信息的互动查询

由图(空间位置)查(检索)文(属性):大多数商品化GIS软件的查询功能都可完美地实现对空间实体的简单查找,如根据鼠标所指的空间位置,查找出该处的空间实体和空间范围(由若干个空间实体组成)以及它们的属性,并显示出该空间对象的属性列表,并可进行有关统计分析。

查询工作分两步:首先借助于空间索引,在空间数据库中快速检索出被选空间实体;然后,根据空间数据和属性数据的连接即可得到该空间实体的属性列表。

由文(属性)查(检索)图(空间位置、分布):属性条件查询 用户可以在图形中找出符合一定属性条件的空间对象,被选中的对象区域可以在原视图中高亮显示。

基于属性信息的查询操作主要是在属性数据库中完成的。大多数GIS软件都将属性信息存储在RDB中,而RDB又为我们提供了完备的数据索引方法及信息查询手段。几乎所有的关系数据库管理系统都支持标准 SQL

 

3.     图形空间的叠合分析包括哪些内容

空间数据的多元复合、空间属性的多层叠加,是基于同一空间位置、区域,进行属性运算。GIS最主要的分析功能。

空间数据叠合是以空间层次分析理论为基础。

空间信息复合包括视觉信息复合(只是显示,不生成新数据层,较简单)和属性数据层叠合(生成新的数据层,复杂)

第一,视觉信息复合。将同一地区的同一比例尺的不同含义的图像、地图进行叠合,从而获得更多的空间信息或改善视觉效果,以便用户直观地判断不同地理实体的空间关系。GIS中视觉复合通常有3类:

1)点、线和面状图之间的复合:通过点、线、面状图的复合,寻求特征信息在空间上的关联性。

2)专题图与数字高程图复合成立体专题图:主要是改善视觉效果。

3)遥感信息与专题图复合:影像地图再有IHS变换增强视觉效果、多元信息复合,地图可视化。

视觉复合只是改善了视觉效果,各属性层数据结构不变,也不生成新数据

第二,属性数据层叠合。将分散在不同层上的空间、属性信息按相同空间位置重叠在一起,进行图形运算和属性运算(关系运算),产生新的空间图形和属性(数据层)的过程。不仅产生视觉效果,更主要是形成新目标,其属性包含了参加叠合的多种属性,重新划分了数据的空间区域。叠合分析的目的是寻找和确定同时具有几种地理属性的地理要素的分析,或按照确定的地理指标,对叠合结果数据进行重新分类分级

 

4.     网络分析的内容包括哪些,影响因素有哪几种

网络分析的主要用途是:选择最佳路径;选择最佳布局中心的位置。所谓最佳路径是  指从始点到终点的最短距离或花费最少的路线;最佳布局中心位置是指各中心所覆盖范围内任一点到中心的距离最近或花费最小;网流量是指网络上从起点到终点的某个函数,如运输价格,运输时间等。网络上任意点都可以是起点或终点。其基本思想则在于人类活动总是趋向于按一定目标选择达到最佳效果的空间位置。这类问题在生产、社会、经济活动中不胜枚举,因此研究此类问题具有重大意义。

网络分析的基本方法有:

(1) 路径分析

 静态求最佳路径:由用户确定权值关系后,即给定每条弧段的属性,当需求最佳路径时,读出路径的相关属性,求最佳路径。

 动态分段技术:给定一条路径由多段联系组成,要求标注出这条路上的公里点或要求定位某一公路上的某一点,标注出某条路上从某一公里数到另一公里数的路段。

 N条最佳路径分析:确定起点、终点,求代价较小的几条路径,因为在实践中往往仅求出最佳路径并不能满足要求,可能因为某种因素不走最佳路径,而走近似最佳路径。

 最短路径:确定起点、终点和所要经过的中间点、中间连线,求最短路径。

 动态最佳路径分析:实际网络分析中权值是随着权值关系式变化的,而且可能会临时出现一些障碍点,所以往往需要动态地计算最佳路径。

(2) 地址匹配

    地址匹配实质是对地理位置的查询,它涉及到地址的编码。地址匹配与其它网络分析功能结合起来,可以满足实际工作中非常复杂的分析要求。所需输入的数据,包括地址表和含地址范围的街道网络及待查询地址的属性值。

    (3)资源分配

    资源分配网络模型由中心点(分配中心)及其状态属性和网络组成。分配有两种方式,一种是由分配中心向四周输出,另一种是由四周向中心集中。这种分配功能可以解决资源的有效流动和合理分配。其在地理网络中的应用与区位论中的中心地理论类似。在资源分配模型中,研究区可以是机能区,根据网络流的阻力等来研究中心的吸引区,为网络中的每一连接寻找最近的中心,以实现最佳的服务。还可以用来指定可能的区域。

资源分配模型可用来计算中心地的等时区、等交通距离区、等费用距离区等。可用来进行城镇中心、商业中心或港口等地的吸引范围分析,以用来寻找区域中最近的商业中心,进行各种区划和港口腹地的模拟等。

 

5.     缓冲区分析包括哪些内容,三种类型的缓冲区是如何建立的

缓冲区又称影响区或影响带,是指围绕地理要素的一定宽度的区域。缓冲区分析是用来确定不同地理要素的空间邻近性和接近程度的一类重要的空间操作。当考察发生在地理要素及其附近的活动的影响范围时,需要围绕地理要素生成缓冲区,进行缓冲区分析。如分析商场的市场区位、道路沿线的地价变化等。

点、线、面(区域)及多重缓冲区的算法原理:

1)点的缓冲区生成:以点为圆心,以一定距离为半径画圆。

2)线的缓冲区生成:分别对每一个顶点和每条边生成缓冲区,然后对这些缓冲区多边形进行叠合操作。

3)面的缓冲区生成:首先生成多边形周长的缓冲区(线缓冲区),然后与原始多边形进行叠合操作。多边形缓冲区有内外侧之分。

4)多重缓冲区生成:以不同的半径首先分别生成一定宽度的缓冲区,然后对不同半径的缓冲取进行叠合操作。

 

6.     什么是DTM,什么是DEM,二者有什么差别

数字地形模型(DTMDigital Terrain Model)是通过地表点集的空间坐标(x,y,z)及其属性数据表示地形表面特征的地学模型。在GIS中,DTM广泛地应用于各种线路、水利工程的选择、军事地形分析、土壤分析等。

DTM作为空间数据库的一种特定结构的数据集合,可以包括在GIS中,成为其核心部分。DTM提出的早,可以认为DTMGIS在概念上和方法上的萌芽。DTM是描述地表单元空间位置和地形属性分布的有序集合。是定义于二维区域上的一个有限项的向量系列。它以离散分布的平面点来模拟连点分布的地形。

由于DTM是地理空间定位的数字数据集合,凡涉及地理空间的地学领域中各种属性,如地价、土地权属、土壤类型、地貌特征、岩层深度及土地利用等与地形有关的信息,均可用DTM来描述。DTM可以是每三个坐标值为一组元的散点结构,也可以是由多项式或Fourier级数确定的曲面方程。

从测绘角度看,DTM是新一代地形图。数字化的地形图,由大量地面点空间坐标和地形属性数据组成,以数字形式描述地形地貌。用途不同,数据结构不同,一般均可变换成栅格数据形式。

DEMDTM的一个子集。实际上,DEMDTM中最基本的部分,它是对地球表面地形地貌的一种离散的数字表达。

数字高程模型DEM是表示区域D上的三维向量有限序列,数字高程模型既然是地理空间定位的数字数据集合,因此凡牵涉到地理空间定位,在研究过程中又依靠计算机系统支持的课题,一般都要建立数字高程模型。从这个角度看,建立数字高程模型是对地面特性进行空间描述的一种数字方法途径,数字高程模型的应用可遍及整个地学领域。

 

7.     DTM分析的因子有哪些,DTM的应用又有哪些

DTM的分析因子包括以下部分:

⑴坡度和坡向分析。

坡度定义为水平面和地形表面之间夹角的正切值;坡向为坡面法线在水平面上的投影与正北方向的夹角。

⑵地表粗糙度的计算。 

    地表粗糙度是反映地表的起伏变化和侵蚀程度的指标,一般定义为地表单元的曲面面积与其在水平面上的投影面积之比。

⑶地表曲率的计算

①地面剖面曲率计算

地面的剖面曲率(profile curvature)其实质是指地面坡度的变化率,可以通过计算地面坡度的坡度而求得。

②地面平面曲率计算

地面的平面曲率(plan curvature)是指地面坡度的变化率,可以通过计算地面坡向的坡度而求得。

数字地面模型具有定位、定量化优点,有着广泛的应用领域。可用于遥感影像地形畸变的自动校正,地球重力测量的自动校正,等高线、地形剖面、透视立体图及与地形有关的多种专题地图的自动绘制等;在工程勘测和规划方面,可用于公路、铁路、通讯线、输电线的选线和土方量算等:水利工程中的大坝和水库选址及设计,水库体积和容量的计算:电视塔、微波系统、军事制高点等地形选择,导航(包括导弹与飞机的导航)、覆盖区域视野范围的计算等。

DTM的具体应用包括以下内容:

⑴等高线绘制:等高线追踪与等高线光滑(插值)。

⑵立体透视图绘制:从数字高程模型绘制透视立体图是DEM的一个极其重要的应用。透视立体图能更好地反映地形的立体形态,与采用等高线表示地表形态变化有其自身独特的优点,非常直观,更接近人们的直观视觉。特别是随着计算机图形处理工作的增强以及屏幕显示系统的发展,使立体图形的制作具有更大的灵活性,人们可以根据不同的需要,对同一个地形形态做各种不同的立体显示。其基本处理过程为:透视变换、色调计算、隐藏面消除、图形输出等。

⑶地形剖面图绘制。

DTM的地形分析:尽管DTM的应用十分广泛,但地形分析是其基本应用,其他应用都可由此推演、扩展。从DEM中可以自动提取地形因子,如坡度、坡向、高程变异、地表粗糙度、曲面面积、体积、谷脊特征分析等。

 

8.     GIS的应用模型有哪些

GIS的应用模型包括以下几种:适宜性分析模型(叠加运算)、发展预测模型(动态模拟)、位址选择模型(空间区位-配置)。

先谈谈空间区位-配置信息模型。对于生产单位和服务企业来说,由于需求和供给两方面总是存在着空间上分布的差异性,因此,机构设施地理位置(Geographic location)的选择和确定对于它们的经济效益和自身的发展具有至关重要的影响作用。

机构设施位置的评价和优化,是通过对于一个设施或者一个设施网络的供给和需求两者之间的相互作用关系进行分析来实现其空间位置分布模式的优化。机构设施区位评价是对于现有服务设施的空间位置分布模式的评价,机构设施区位优化是对于其最佳位置的搜寻。

克理斯塔勒(Christaller)的中心地理论则为供给区位优化模式的理论研究和经验方法的应用提供了基础框架,这个理论中的市场区域规模是由供货和服务的范围决定的,需求和供给两者之间的关系是以距离最小化和利润最大化为基础建立的。

再谈谈空间决策信息模型。区划分析、土地利用规划、城镇区域发展规划、设施位置选择、资源开发和分配、环境管理等都是有关空间行为决策的问题。这些问题的解决方案是由决策者或问题领域的专家在专业领域知识和经验的启发下,在分析了大量地理信息(Georeferenced info.)的基础之上得到的。