关于数据仓库的分层

来源:互联网 发布:泉方pubmed数据库 编辑:程序博客网 时间:2024/05/22 00:08
分层我更倾向于是一种模块化,模块之间可能有层次关系,也可能没有。每个模块在数据方面要有一个标准和规范,以期达到其目标。

常见的划分
ODS(操作型数据存储):主要为了实现接入数据的(原样)暂存。
DWD\DW:DW层是为了实现数据的集成和标准化。这种集成可能有两种可能性:ER模型的集成和总线模型的集成;但是我觉得并不应该是非A既B的,在不同的业务上面可以选择不同的模型。这里面的数据应该是相对稳定的。
MID\DWS:MID层是为了实现ETL过程的加速,应该存储一些核心维度统计数据。这个层次应该做好重构的准备。
DM\APP:在里面存储数据产品的结果数据。
DIM:维度总线表,用来做多维分析的表头。