(GIS可视化)热点分析原理及实现

来源:互联网 发布:ppt图表无法修改数据 编辑:程序博客网 时间:2024/05/17 10:57

这里写图片描述

1 Z值和P值

1.1 零假设

零假设(null hypothesis),有时候又称原假设,官方的解释是:指进行统计检验时预先建立的假设。

也就是说,你在检验你的结果之前,先对这些结果假设一个数值区间,这个区间一般是符合某种概率分布的情况,如果你的真实结果偏离了你设定的区间,就表示发生了小概率事件。既然有小概率事件,就说明两种可能:1,你的假设有错误;2,出现了异常值。

1.2 P值

p值(P-Value,Probability,Pr),代表的是概率。它是反映某一事件发生的可能性大小。

在空间相关性的分析中,p值表示所观测到的空间模式是由某一随机过程创建而成的概率。

比如你计算出来的p值是1,那就表示你用于计算的这份数据,100%是随机生成的了(当然,不可能是1的,0.5以上就也不得了)。如果是0.1,就表示只有10%的可能性是随机生成的结果。

1.3 Z值

那么z得分,就是标准差的倍数(有正负之分),比如z得分是+2.5,就表示你的数据计算出来,得到的结果是标准差的正2.5倍。反之,如果你算出来的是-2.5,那么就表示你的结果是标准差的负2.5倍。

Z值P值的衡量尺度

image

我们再来看一个新的概念:置信度:置信度代表了数据为随机生成的指数,比如置信度为90%,则数据有90%的可能是随机生成的。

上图可以看出,Z值和P值是有一定关系的。在正态分布的两端出现非常高或非常低(负值)的 z 得分,这些得分与非常小的 p 值关联。

下表显示了不同置信度下未经校正的临界 p 值和临界 z 得分。

2.热度分析

image

此工具用于识别具有统计显著性的高值(热点)和低值(冷点)的空间聚类。

不同于我们所说的 “热度图”,热度图只是单纯的按照数据某项属性的高低来衡量得分。而热度分析计算的是高值和低值的空间聚类。

此工具使用 z 得分、p 值和置信区间 (Gi_Bin) 为输入要素类中的每个要素创建一个新的输出要素类。

如果要素的 z 得分高且 p 值小,则表示有一个高值的空间聚类。

如果 z 得分低并为负数且 p 值小,则表示有一个低值的空间聚类。

z 得分越高(或越低),聚类程度就越大。如果 z 得分接近于零,则表示不存在明显的空间聚类。

3.案例

我们以邯郸市饭店分布为例。分析一下邯郸市饭店人均消费的高低值聚类情况。

image

优化的热点分析使用从输入数据特征中派生的参数来执行热点分析 (Getis-Ord Gi*) 工具。

例如,如果输入要素数据集包含事件点数据,则该工具会将事件点聚合到加权要素。通过使用加权要素的分布,此工具可确定适当的分析范围。

我们使用优化的热点分析工具。

image

选择Price为分析字段,工具自动为我们选择聚合方法。

下面为分析结果。

image

分析后的结果没有了之前数据表中的其他属性,我们为了更好的分析,将结果表作为目标表,初始表作为源表进行连接。这样我们在结果表中既能看到分析结果,又能看到原始信息。

我们查看低值聚类比较明显的几个地方:

image

image

再来看高值聚类的几个地方:

image

image

不难得出结论,在邯郸市的稽山新天地,罗城头,低值聚类比较明显,在新世纪,樱花新天地的高值聚类明显。

说明在邯郸市的商业区中,罗城头和稷山新天地的总体消费水平较低,樱花新天地的总体消费水平较高。

接下来我们使用插值对结果进行渲染,再在符号系统中选择合适的显示方式,我们就能得到一幅漂亮的结果图。

image

下面是封装好的工具模型。

image

0 0
原创粉丝点击