第一章 维度建模初步

来源:互联网 发布:js下拉菜单点击事件 编辑:程序博客网 时间:2024/05/21 06:16

数据仓库必备要求

  1. 数据仓库必须使组织机构的信息变得容易存取。
  2. 数据仓库必须一致地展示组织机构的信息。
  3. 数据仓库必须具有广泛的适应性和便于修改。
  4. 数据仓库必须发挥安全堡垒作用以保护信息资产。
  5. 数据仓库必须在推进有效决策方面承担最基本的角色。
  6. 数据仓库为业务群体所接受的前提是被认定是成功的。

数据仓库的基本组成

这里写图片描述

操作型源系统

是获取行业事物的记录(形式的)操作型系统

数据聚集环节

一般包括存储环节和析取转换加载(ETL–Extract-Transformation-Load)的一组处理过程。
操作型源系统和数据展示环节之间的部分,都属于数据存储环节之列。

数据展示

数据展示环节是进行数据组织、存储并向用户、报表撰写和其他分析型应用提供直接查询操作的场所。
## 注意 ##

  • 数据应该以维度形式进行展示、存储和访问。

维度建模关键词

事实表

  • 事实表中最有用的事实是数字类型与可加型事实
  • 度量事实在理论上可以是文本形式的,不过这种情况很少出现。在大多数情况下,文本度量值可以是某种事物的描述并且取自某个离散列表的值。设计者应该力量将文本度量值转换成维度,原因在于维度能够与其他文本维度属性更有效的关联起来,并且小号少得多的空间。不能将冗余的文本信息存放在事实表内,除非文本对于事实表的每行来说都是唯一的,否则它应该归属到维度表中。真正的文本事实在数据仓库中很少出现,因为文本事实具有像自由文本内容那样的不可预见性内容,这几乎是不可能进行分析的。
  • 不能用代表什么也没有发生的零值来填充事实表,会使事实表变得稀疏。
  • 所有事实表有两个或者两个以上的外关键字(FK),用于连接到维度表中的主关键字。
  • 事实表本身通常也有由外关键字组成自己的主关键字,通常称之为复合或者链接关键字。可以说在维度模型中,具有一个复合关键字的表也是一个事实表,即每个表示多对多关系的表都是事实表,其他的都是维度表。

维度表

维度属性是查询约束条件、成组与报表标签生成的基本来源。数据仓库的能力直接与维度属性的质量和深度成正比。
维度表是进入事实表的入口,它最好的属性是文本的和离散的。