同步直播(2):为什么要写这本书?

来源:互联网 发布:淘宝网图片显示不出来 编辑:程序博客网 时间:2024/05/02 17:15
同步直播空间度量以及统计的内容翻译。文章内容未做仔细修订,语句不通顺和错别字部分,会在以后不断的校正,此仅为beta版。



英文版权属于Esri。中文、解说、配图版权:虾神

————————我是分割线————————


为什么一直以来人们都没有更好的利用统计手段来进行空间分析呢?原因之一是统计毕竟是一种非常专业的技能——对于大部分人来说,都觉得得这种技能难以理解和应用。另外一个原因是因为在商业地理信息软件中,很少有统计工具可以直接使用。很多统计工具主要用于特定学科的学术研究,仅仅限定在一个特定的领域中。如果要进行统计分析,大部分使用者都不得不自己编写软件程序来执行他们所需要进行的分析。不过近来这种情况已经有了很大的改观,如CrimeStat和SpaceStat这样的专业空间分析软件包已经开始出现。而空间统计工具也开始被如SAS或者S+这样的综合统计软件所集成。而包括一些专业的地理信息系统软件,如ArcGIS也开始在他的分析工具中集成了空间统计工具箱。

(ArcGIS 10.4.1的空间统计工具箱截图,共计有6个工具集合31个空间统计工具)


虽然有这么工具,但是迄今为止大多数GIS的用户还没有意识到应该如何去利用它们。这也就是为什么我会写这本书。我们想向您——和那些对GIS感兴趣的用户,来介绍一些最常用的空间统计工具,并且说明这些工具如何在各个学科领域中的应用,这些学科涵盖了从犯罪分析到生物栖息地保护的应用。本书的最终目的是帮助你从地理信息系统数据库中提取更多的信息(可能你已经在这个上面投入了大量的时间和金钱),而不仅仅是创建一张地图,因为很多内容,仅靠一张地图并不太明显。


在本书中,我们将介绍空间统计能回答的一些问题。

要素的分布情况是怎么样的?

对数据进行统计可以用于描述一组要素的特征,包括要素的中心、聚集或者离散的程度以及方向性的分布趋势等。而对要素分布情况的研究,是对一段时间以来数据变化的跟踪——比如观察某种疾病的发病区域在几个月内是否发生了位移,当然,也可以用于比较两个或者多个要素组之间的特征。


该类要素的形成是由何种模式决定的?

我们可以使用统计信息来衡量该类数据是否具有特定的模式——以及该模式的置信度在哪个程度上。比如您发现某种疾病的爆发在特定地点形成了聚集的格局,那么很有可能在当地会有疾病的源头(如某个窝藏有受到了感染的蚊子的池塘)。

我们还可以标识要素中的属性值与空间分布的关联性。例如,我们通过计算得出学生的考试分数在城市中的聚集模式,例如同高分或者低分都出现了某种程度上的聚集,这就意味着教育资源或者其他资源在此区域内并不是均匀分布的。

聚集发生在什么地方?

找到具体事件的聚集区域,或者找到聚集的原因,这将有助于您需要针对其采取的行动以及采取什么样的行动。当流感爆发的时候,公共卫生部门必须立即采取行动,如通知人们流感集中爆发的区域在什么地方,然后可以尝试确定疫情爆发的源头——假如是从一所学校开始的,那么他们就会首先对儿童进行疫苗接种。

我们也可以通过统计的手段,通过要素的聚类趋势来识别相应人群的价值观。比如税务官员可以通过建立邻近分析的方法,来判定有黑人聚集区域的房产价格中位数。

第三个问题就是数据分布是简单的聚焦在一个图层上,还是涉及到两个或者多个图层。如果你可以确定你的要素或者要素中的哪些值之间的空间相关性的强度。比如公共卫生分析专家,可以通过城市经济发展以及人口统计数据来推算跨区域的婴儿健康情况。一旦确定了关系,就可以预测相关要素的属性值发生什么样的变化。

本书假设你具有少量或者更本没有统计学的专业知识,但是对GIS有一定的了解。书中出现于统计有相关的指数主要集中在以下四章:“理解数据分布”、“验证统计显著性”,“定义空间邻近和权重”以及“在地理数据上使用统计方法”。

本书的重点是利用统计统计来得到有意义的结果,而不是说明统计手段背后的数学道理。然而,有足够的背景知识,会让我们了解更多的工具背后的概念。

相较与本书中的内容,还有更多的空间统计工具和方法可用。包括很多适用于跨多个学科的GIS分析工具都在被业界所广泛使用。而且各行业的研究人员也在持续的改进现有的工具,并且开发新的产品,以期更好的研究地理现象的各种行为。这里我们介绍的工具都是当前已经发布了的最新版本(出版时候的最新版本)。在每一章节的末尾,列举引用的工具以及其他信息,这样可能对您有用。


本书范围之外的几个相关领域也值得探索。其中一个领域就是从一组简单的点数据推测出空间连续场数据(这属于地统计学的知识范畴)。地统计学也有很多的程序和工具,主要应用于研究空气、土壤、环境污染,以及石油和天然气勘测等。另一个领域就是涉及到个体要素的空间形状和形态特征——例如,通过比较面状要素的边界以识别区域特征。如一片森林的边界周长等。对面状要素的形状与形态的衡量,常被用于景观生态学和生物地理学中,来研究如潜在的野生动物栖息地和走廊。

还有一个相关的领域就是空间建模,这个领域囊括了从创建适应性模型到构建属于你自己的地理信息系统。空间建模是以研究各种预测人或者动物的行为的,以建立一套数学模型,这些数学模型可以对火灾、水灾这样的自然或者人为灾害(灾难)进行预测和分析。本书讨论的很多内容也被常常被纳入到空间建模中。

利用统计手段来进行地理分析,主要就是指使用数学方程对地理数据的特征、模式进行分析,并且得出结论的过程。这个过程其实很类似于在做与非空间数据的统计分析一样,虽然空间数据的统计分析要考虑很多其他的因素。




2 0
原创粉丝点击