多维数据库

来源:互联网 发布:淘宝10元电话重置卷 编辑:程序博客网 时间:2024/04/28 05:30

多维数据集是立方体存储的,多维数据集分为度量值和纬度,度量值是用于统计用的数据,维度就是从哪方面来统计数据,比如说统计销售量,销售量就是度量值,然后我从哪几个方面来看这些销售量呢?比如说我看一个地区的销售量是多少,我就要从地区来统计销售量,地区就是维度.你可以想想立方体是怎么样的,每条边就是维度,然后立方体里面就是数据(度量值),维度越多,边就越多,数据越多立方体就越大.至于为什么多维比关系快早就证实了的一个不变的定理.

建立多维数据集的目的并不是为了比关系数据库查询快,你如果知道数据仓库是做什么的,就知道多维数据集到底是什么了,这里我给你说一下,随着企业信息化的发展,随着企业改变对数据的理解,诞生了数据仓库这个理念,数据仓库不是一门技术,是许多先进IT技术的集合,数据仓库的定义是什么呢?把企业所拥有的数据,不管是关系数据库,平面文件等异构数据源的数据集成到一起存储.为什么要集成到一起呢?因为数据之间是有联系的,你可以从数据中找到信息,从信息中到到知识.你通过什么工具来做这些事情呢?OLAP联机分析,ETL数据集成,数据挖掘,报表,分析工具.
总的来说建多维数据集的目的就是为了分析数据,查询速度的快慢是必须的,因为海量的数据摆在你面前,用关系数据库查1个小时出来,谁能忍受,当然必须要很快的查询速度,才能很好的分析数据.

 

多维数据库

  多维数据库(Multi DimensionalDatabase,MDD)可以简单地理解为:将数据存放在一个n维数组中,而不是像关系数据库那样以记录的形式存放。因此它存在大量稀疏矩阵,人们可以通过多维视图来观察数据。多维数据库增加了一个时间维,与关系数据库相比,它的优势在于可以提高数据处理速度,加快反应时间,提高查询效率。
  目前有两种MDD 的OLAP产品:基于多维数据库的MOLAP和基于关系数据库的ROLAP。ROLAP建立了一种新的体系,即星型结构。
  MDD并没有公认的多维模型,也没有像关系模型那样标准地取得数据的方法(如SQL、API等)。基于MDD的OLAP产品,依据决策支持的内容使用范围也有很大的不同。
  在低端,用户使用基于单用户或小型LAN的工具来观察多维数据。这些工具的功能性和实用性可能相当不错,但由于受到规模的限制,它们不具备OLAP的所有特性。这些工具使用超立方结构,将模型限制在n维形态。当模型足够大且稀疏数据没有控制好时,这种模型将会不堪一击。这些工具使用数据库的大小是以MB来计量的,而不是以GB计量的,因此只能进行只读操作,且具备有限的复杂计算。
  在高端,OLAP工具用4GL提供了完善的开发环境、统计分析、时间序列分析、财政报告、用户接口、多层体系结构、图表等许多其他功能。尽管不同的OLAP工具都使用了它们自己的多维数据库,但它们在不同程度上也利用了关系数据库作为存储媒体。因为关系数据库和OLAP工具同时在高端服务器上处理,所以速度和效率仍然很快。
  纯多维数据库引擎也被开发出来。尽管这些工具缺乏4GL及充分的开发环境,但却有比高端MDD工具所使用的数据库更为复杂的数据库。这些工具也具有统计分析、财务分析和时间序列分析等功能,并有自己的API,允许其对前端的开发环境开放。
  MDD能提供优良的查询性能。存储在MDD中的信息比在关系数据库中的信息具有更详细的索引,可以常驻内存。MDD的信息是以数组形式存放的,所以它可以在不影响索引的情况下更新数据。因此MDD非常适合于读写应用。

 

原创粉丝点击