20160509 GreenPlum2 使用及解答

来源:互联网 发布:知善恶树英文 编辑:程序博客网 时间:2024/05/17 23:55

1 登录GP:通过图形界面的GUI,pgAdmin III。

 

2 数据分布:Master节点本身不存储数据,所有的数据拆分保存到每一个节点上

   分布方式有两种:  

                               指定分布健时,按照分布健的Hash值分布数据为哈希分布,计算Hash值,通过这个值路由到特定的Segment节点,语法为distributed by,如果不指定分布健默认第一个字段为分布健

                                不指定分布健,数据随机分布到每一个节点为随机或平均分布。但是这样的缺点是执行SQL关联时,要将数据重分布性能很差,语法是distributed randomly

 

3 为什么查询出的结果是随机的?

   GP的数据是放在所有的Segment节点上的,查询的时候,Master的数据展现顺序是Master先接收的先展现,但是每个Segment的数据到达Master的顺序是随机的不是固定的,所以执行的查询结果是随机的。

0 0