<学习笔记5>数据挖掘原理与运用-sql server2008 数据库

来源:互联网 发布:快乐星球电影知乎 编辑:程序博客网 时间:2024/05/22 10:43

2016/10/26

第十三章

挖掘OLAP立方体


理解星型模式和雪花模式

星型模式中间是事实表,周围是事实表中各个属性的维表。雪花模式周围是查找表。


理解维和层次。

通常我们理解的维:时间维,空间维等等,层次,省,市,区。这就是层次。在OLAP这里,维的概念似乎更广泛些,比如客户维是一张客户表,表中有各种属性,包括:性别,年龄,姓名这样。层次也是维的某个属性的层次。比如我们会说客户维中的地理层次。

度量和度量组。

度量=值。度量组=OLAP中度量及其相关属性的组合。


处理立方体步骤:维处理。立方体处理。


这里其实出现一个概念叫“聚集”。有点抽象。什么叫聚集??


由于聚集的规模会随聚集数呈指数膨胀,因此一般都会指定最优聚集,再根据这些聚集派生出其他聚集。

比如可以通过每月产量的聚集派生出季度和年产量的聚集。


analysis services 为区提供三种存储模式:1、多维OLAP(MOLAP)。2、关系OLAP(ROLAP)。3、混合OLAP。(HOLAP)


MDX

前面我们纠结很久的mdx与dmx中的mdx终于出现了。他的意思是“多维表达式”。语法遵循select ...from ...where。


清单13-1使用时发现没有OLAP立方体。是什么时候建立的?怎么建立的?


立方体聚集最常用sum。也有min,max,count,average。

计算度量:从其他度量派生出来的度量。


统一维度模型:UDM。

这里有很多概念已经搞混了。事例维,嵌套维,层次,表列嵌,套表键,嵌套键...等等一系列。很遗憾我也没能从网络上找到相关的学习资料,如他人写的相关的csdn博客资料。不过也有一个好处,就由我来开篇吧。接着我会先通篇浏览完这本书,然后重新开始对每一个疑点进行整理。




0 0