（GIS可视化）热点分析原理及实现

来源：互联网发布：ppt图表无法修改数据编辑：程序博客网时间：2024/05/17 10:57

这里写图片描述

1 Z值和P值

零假设（null hypothesis），有时候又称原假设，官方的解释是：指进行统计检验时预先建立的假设。

也就是说，你在检验你的结果之前，先对这些结果假设一个数值区间，这个区间一般是符合某种概率分布的情况，如果你的真实结果偏离了你设定的区间，就表示发生了小概率事件。既然有小概率事件，就说明两种可能：1，你的假设有错误；2，出现了异常值。

p值（P-Value，Probability，Pr），代表的是概率。它是反映某一事件发生的可能性大小。

在空间相关性的分析中，p值表示所观测到的空间模式是由某一随机过程创建而成的概率。

比如你计算出来的p值是1，那就表示你用于计算的这份数据，100%是随机生成的了（当然，不可能是1的，0.5以上就也不得了）。如果是0.1，就表示只有10%的可能性是随机生成的结果。

那么z得分，就是标准差的倍数（有正负之分），比如z得分是+2.5，就表示你的数据计算出来，得到的结果是标准差的正2.5倍。反之，如果你算出来的是-2.5,那么就表示你的结果是标准差的负2.5倍。

我们再来看一个新的概念：置信度：置信度代表了数据为随机生成的指数，比如置信度为90%，则数据有90%的可能是随机生成的。

上图可以看出，Z值和P值是有一定关系的。在正态分布的两端出现非常高或非常低（负值）的 z 得分，这些得分与非常小的 p 值关联。

下表显示了不同置信度下未经校正的临界 p 值和临界 z 得分。

此工具用于识别具有统计显著性的高值（热点）和低值（冷点）的空间聚类。

不同于我们所说的 “热度图”，热度图只是单纯的按照数据某项属性的高低来衡量得分。而热度分析计算的是高值和低值的空间聚类。

此工具使用 z 得分、p 值和置信区间 (Gi_Bin) 为输入要素类中的每个要素创建一个新的输出要素类。

如果要素的 z 得分高且 p 值小，则表示有一个高值的空间聚类。

如果 z 得分低并为负数且 p 值小，则表示有一个低值的空间聚类。

z 得分越高（或越低），聚类程度就越大。如果 z 得分接近于零，则表示不存在明显的空间聚类。

我们以邯郸市饭店分布为例。分析一下邯郸市饭店人均消费的高低值聚类情况。

优化的热点分析使用从输入数据特征中派生的参数来执行热点分析 (Getis-Ord Gi*) 工具。

例如，如果输入要素数据集包含事件点数据，则该工具会将事件点聚合到加权要素。通过使用加权要素的分布，此工具可确定适当的分析范围。

我们使用优化的热点分析工具。

选择Price为分析字段，工具自动为我们选择聚合方法。

下面为分析结果。

分析后的结果没有了之前数据表中的其他属性，我们为了更好的分析，将结果表作为目标表，初始表作为源表进行连接。这样我们在结果表中既能看到分析结果，又能看到原始信息。

我们查看低值聚类比较明显的几个地方：

再来看高值聚类的几个地方：

不难得出结论，在邯郸市的稽山新天地，罗城头，低值聚类比较明显，在新世纪，樱花新天地的高值聚类明显。

说明在邯郸市的商业区中，罗城头和稷山新天地的总体消费水平较低，樱花新天地的总体消费水平较高。

接下来我们使用插值对结果进行渲染，再在符号系统中选择合适的显示方式，我们就能得到一幅漂亮的结果图。

下面是封装好的工具模型。

0 0