greenplum4.2安装配置文档-手把手…
来源:互联网 发布:电影台词拼接软件 编辑:程序博客网 时间:2024/06/08 16:11
greenplum4.2安装配置
作者:数据库男
QQ:77113981
文档属性
属性
内容
客户名称
项目名称
文档主题
文档副标题
文档版本
1.0
文档日期
2013-8-20
文档状态
发布
作者
数据库男
文档变更
版本
修订日期
修订人
描述
目
1
1.1
1.2
2
2.1
2.2
2.3
2.4
3
3.1.1
3.1.2
3.1.3
3.1.4
3.2
3.2.1
3.2.2
3.2.3
3.3
3.3.1
3.3.2
3.4
3.5
3.6
3.6.1
3.6.2
3.6.3
3.7
3.7.1
3.7.2
3.7.3
3.7.4
3.7.5
3.7.6
3.7.7
4
4.1
4.2
5
5.1
5.2
5.3
5.4
6
7
7.1
7.1.1
7.1.2
7.2
7.2.1
7.2.2
8
1 文档说明
1.1 编写目的
通过Window
1.2 适用范围
对数据库和系统有一定基础,安装部署greenplum的人员。
2 简介
2.1 Greenplum架构
Greenplum是一种基于postgresql(开源数据库)的分布式数据库。其采用sharednothing架构(MPP-Massively Parallel Processing),主机,操作系统,内存,存储都是自我控制的,不存在共享。主要由masterhost,segmenthost,interconnect三大部分组成。
了解完Greenplum的架构后,对其工作流程也就相对简单了。因greenplum采用了MPP架构,其主要的优点是大规模的并行处理能力,应该把精力主要放在大规模存储与并行处理两个方面。
2.2 大规模存储
Greenplum数据库通过将数据分布到多个节点上来实现规模数据的存储。数据库的瓶颈经常发生在I/O方面,数据库的诸多性能问题最终总能归罪到I/O身上,久而久之,IO瓶颈成为了数据库性能的永恒的话题。
Greenplum采用分而治之的办法,将数据规律的分布到节点上,充分利用segment主机的IO能力,以此让系统达到最大的IO能力(主要是带宽)。
在greenplum中每个表都是分布在所有节点上的。Masterhost首先通过对表的某个或多个列进行hash运算,然后根据hash结果将表的数据分布到segmenthost中。整个过程中masterhost不存放任何用户数据,只是对客户端进行访问控制和存储表分布逻辑的元数据。
2.3 并行处理
Greenplum的并行处理主要体现在外部表并行装载,并行备份恢复与并行查询处理三个方面。数据仓库的主要精力一般集中在数据的装载和查询,数据的并行装载主要是在采用外部表或者web表方式,通常情况下通过gpfdist来实现。
Gpfdist程序能够以370MB/s装载text格式的文件和200MB/s装载CSV格式文件,ETL带宽为1GB的情况下,我们可以运行3个gpfdist程序装载text文件,或者运行5个gpfdist程序装载CSV格式文件。例如图例中采用了2个gpfdist程序进行数据装载。可以根据实际的环境通过配置postgresql.conf参数文件来优化装载性能。
查询性能的强弱往往由查询优化器的水平来决定,greenplum主节点负责解析SQL与生成执行计划。Greenplum的执行计划生成同样采用基于成本的方式,基于数据库是由诸多segment实例组成,在选择执行计划时主节点还要综合考虑节点间传送数据的代价。
2.4 工作原理:
在主节点上存在query dispatcher (QD)进程,该进程前期负责查询计划的创建和调度,segmentinstance返回结果后,该进程再进行聚合与向用户展示;segmenthost存在queryexecutor (QE)进程,该进程负责其它节点相互通信与执行QD调度的执行计划。
Greenplum最为一个严格的数据库系统,同样支持线性扩展,高可用性架构,数据与主机的容错机制,还有数据的分区与压缩功能。
========================================================================================
==本博所有内容均由数据库男本人实际工作环境或模拟操作过程,如有编辑错误或其他问题请和本==
==人留言或联系。发扬互联网精神,一起学习,共同努力,完成由专注到卓越的飞跃。?!?
==QQ:77113981
========================================================================================
- greenplum4.2安装配置文档-手把手…
- greenplum4.2安装配置文档-手把手…
- greenplum4.2安装配置文档-手把手…
- greenplum4.2集群手把手安装配置文档
- greenplum4.3的安装与配置
- centos6.6下安装GreenPlum4.3.5.2
- greenplum4.3.4单机安装
- Tomcat6.0的安装与配置(手把手教…
- sysbench工具手把手安装配置及使用…
- 《手把手博客搭建教程2—LAMP安装配置》
- 手把手介绍tomcat6.0安装与配置
- FFMPEG安装配置文档
- FFMPEG安装配置文档
- xCAT安装配置文档
- nmon安装配置文档
- zabbix安装配置文档
- Lustre安装配置文档
- saprouteer安装配置文档
- Number of Islands
- Golang环境搭建
- 预递增和后递增
- Mysql之Percona(1)最新版本5.6.10…
- 盘点3款原型工具的部件样式
- greenplum4.2安装配置文档-手把手…
- greenplum4.2集群手把手安装配置文档
- greenplum4.2安装配置文档-手把手…
- Android Activity生命周期分析
- greenplum4.2安装配置文档-手把手…
- 测试覆盖率工具:EclEmma
- oracle10G 32位数据库在win7…
- linux双机互信设置
- pandas之dataframe移动复制删除列