对数据仓库维度表的理解

来源:互联网 发布:东华软件 现金流 编辑:程序博客网 时间:2024/04/28 06:26
维度表是事实表不可分割的伴侣。通常包含有业务的文字描述。一般应该尽可能多地包括一些富有意义的文字性描述。对于一个维度表来说,包含50~100个属性的情况并不少见。倾向于将行数作的相当少(通常少于100万行),而将列数做的特别大。

        维度属性是查询约束条件、成组与报表标签生成的基本来源。维度表属性在数据仓库承担着一个重大角色。在许多时候,数据仓库不过是维度属性的体现而已。通常,数据仓库的能力直接与维度属性的质量和深度成正比。在提供详细的业务用语属性方面所花的时间越多,数据仓库就越好。在属性列值的给定方面所花的时间越多,数据仓库就越好。在保证属性列的质量方面所花的时间越多,数据仓库就越好。

        维度表是事实表的入口,丰富的维度属性给出了丰富的分析能力。维度给用户提供了使用数据仓库的接口。

        最好的属性是文本的和离散的。属性应该是真正的文字,而不是一些简写的编码符号。

        有时在设计数据仓库中并不能很确定,从数据生产源析取的一个数字型数据字段到底应该作为事实还是维度属性看待。通常,看这个字段是一个含有许多的取值并参与运算的度量值(当事实看待),还是一个多少变化不多并参与作为约束条件的离散取值描述(当维属性看待)。例如,一个产品的标准成本看来是其不变的属性,但由于可能经常改变,因而最终应该当作度量值事实来处理。俄而,也存在不能确定的情况。在这种情况下,按任何一种方式对该数据字段进行建模都可以,可以根据具体需求确定。

原创粉丝点击