数据库系统体系结构(二)并行数据库

来源:互联网 发布:数据分析的目的是什么 编辑:程序博客网 时间:2024/06/01 09:27

一 并行系统概述:

(一)并行系统:通过并行的使用多个处理器和磁盘来提高处理速度和I/O速度。


(二)并行性的两个重要问题:

(1)加速比(speedup):是同一个任务在单处理器系统和并行处理器系统中运行消耗的时间的比率,用来衡量并行系统或程序并行化的性能和效果。

*通过增加并行度在更短时间内运行一个给定的任务。

*线性加速比:当较大系统拥有资源(处理器、磁盘等)是较小系统资源的N倍时,如果获得加速比为N,则称该并行系统实现线性加速比(linear speedup)。

(2)扩展比(scaleup):通过增加并行度来处理更大的任务。


(三)并行系统系统结构:

(1)共享内存:共享一个公共的主存储器。

1.优点:

*处理器之间通信效率极高,存放在共享内存中的数据可以被任何处理器访问。

*处理器可以通过向内存中写的办法来传递消息,比通信机制来传递信息要快很多。

2.缺点:

*规模不超过32或64个处理器,因为总线或互连网络会变成瓶颈。

(2)共享磁盘:共享一组公共的磁盘。

1.优点:

*存储器总线不是瓶颈。

*提供一定的容错性:一个处理器发生故障,其它处理器可以代替它的工作,因为数据库存储在磁盘上,而磁盘是所有处理器都可以访问的。

2.缺点:

*可扩展性有问题。

*处理器之间的通信要经过通信网络,速度会慢一些。

(3)无共享:

1.优点:

*更加扩展性,可以很容易支持大量处理器。

2.缺点:

*通信代价和非本地磁盘访问的代价比较高。


(四)数据库性能的度量:

(1)吞吐量(throughput):在给定时间段内所能完成任务的数量。

(2)响应时间(response time):单个任务从提交到完成所需时间。


二I/O并行:

(1)I/O并行:最简单形式通过将关系划分到多张磁盘上来缩减磁盘上对关系进行检索所需时间。

1.常用划分形式:水平划分。

*水平划分:关系中的元组划分或散列到多张磁盘上,使得每个元组驻留在一个磁盘上。

*垂直划分:通过关系的模式r进行分解来划分关系。(划分属性子集)。

(2)三种基本数据划分技术(水平划分):

1.轮转法。

2.散列划分法。

3.范围划分法。

(3)划分技术比较。

(4)偏斜处理。


三查询间并行。

四 查询内并行。

五 操作内并行。

六 操作间并行。

七 查询优化。


















原创粉丝点击