三个例子,让你看懂数据仓库多维数据模型的设计
来源:互联网 发布:网络电视浏览器下载 编辑:程序博客网 时间:2024/06/03 21:22
原文链接:https://yq.aliyun.com/articles/30942
一、概述
多维数据模型是最流行的数据仓库的数据模型,多维数据模型最典型的数据模式包括星型模式、雪花模式和事实星座模式,本文以实例方式展示三者的模式和区别。
二、星型模式(star schema)
星型模式的核心是一个大的中心表(事实表),一组小的附属表(维表)。星型模式示例如下所示:
三、雪花模式(snowflake schema)
雪花模式是星型模式的扩展,其中某些维表被规范化,进一步分解到附加表(维表)中。雪花模式示例如下图所示:
从图中我们可以看到地址表被进一步细分出了城市(city)维。supplier_type表被进一步细分出来supplier维。
四、事实星座模式(Fact Constellation)或星系模式(galaxy schema)
数据仓库由多个主题构成,包含多个事实表,而维表是公共的,可以共享,这种模式可以看做星型模式的汇集,因而称作星系模式或者事实星座模式。本模式示例如下图所示:
如上图所示,事实星座模式包含两个事实表:sales和shipping,二者共享维表。
五、总结
事实星座模式是数据仓库最长使用的数据模式,尤其是企业级数据仓库(EDW)。这也是数据仓库区别于数据集市的一个典型的特征,从根本上而言,数据仓库数据模型的模式更多是为了避免冗余和数据复用,套用现成的模式,是设计数据仓库最合理的选择。当然大数据技术体系下,数据仓库数据模型的设计,还是一个盲点,探索中。
最近在做大数据技术体系下的数据仓库模型设计,重温数据传统数据仓库的关键技术和数据模型,有感兴趣的可以一起讨论,共同学习。QQ群: 347018601
- 三个例子,让你看懂数据仓库多维数据模型的设计
- 三个例子,让你看懂数据仓库多维数据模型的设计
- 【数据仓库】【细节】三个例子,让你看懂数据仓库多维数据模型的设计
- 数据仓库多维数据模型设计
- 数据仓库的多维数据模型
- 数据仓库的多维数据模型
- 数据仓库的多维数据模型
- 数据仓库的多维数据模型
- 数据仓库多维数据模型研究及其设计方法
- 多维数据模型的设计
- 数据仓库_多维数据模型
- 数据仓库多维数据模型基本概念
- 数据仓库基础知识(二)- 多维数据模型
- 数据仓库介绍(五) - 多维数据模型
- 三个词,让你看懂马云、刘强东力推的“新零售”
- 关于数据仓库的数据模型
- 一张图一个例子让你看懂AOP
- 数据仓库多维数据模型-星型模型 和 雪花模型
- 云南之旅:随想+攻略
- 快速搭建搜索引擎。haystack + whoosh(Django)
- Python学习系列(一)配置环境
- 最小生成树--Prim算法
- 图形用户界面--窗口菜单
- 三个例子,让你看懂数据仓库多维数据模型的设计
- 【Scikit-Learn 中文文档】无监督学习: 寻求数据表示
- F-score is ill-defined and being set to 0.0 due to no predicted samples.
- BaiduOCR实现身份证,银行卡,机动车牌,图像审核等识别
- 定位
- 1139. First Contact (30) DFS
- 【Scikit-Learn 中文文档】把它们放在一起
- 数据结构-计算器点实现
- iOS 通过添加线程依赖和信号量结合实现一个复杂界面请求多个接口时按指定顺序执行