[转]数据挖掘学习之数据立方体计算方法

来源:互联网 发布:谷歌输入法for linux 编辑:程序博客网 时间:2024/06/05 18:35

术语解释:
1. 物化视图(Materialized View)在9i以前的版本叫做快照(SNAPSHOT),从9i开始改名叫做物化视图。它是用于预先计算并保存表连接或聚集等耗时较多的操作的结果,这样,在执行查询时,就可以避免进行这些耗时的操作,从而快速的得到结果。物化视图有很多方面和索引很相似:使用物化视图的目的是为了提高查询性能;物化视图对应用透明,增加和删除物化视图不会影响应用程序中SQL 语句的正确性和有效性;物化视图需要占用存储空间;当基表发生变化时,物化视图也应当刷新。
2. 联机分析处理(OLAP)系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持.
3. 冰山立方体、紧凑数据立方体、高维数据立方体、近似计算、流式数据立方体


1996 年, Gray 等人首次提出了数据立方体( data cube) [1] 的概念, 从此基于数据立方体的计算方法一直是数据仓库和OLAP 领域研究者所关注的热点问题。

虽然从理论上讲, 所有的聚集查询能够通过原始数据计算获得, 但是面对大量的数据, 进行聚集计算的代价是相当昂贵的, 因此需要考虑一定的策略数据. 立方体的计算是在存储空间、响应查询时间和数据更新维护消耗等几个主要因素之间寻求有效的折衷.


[1] Gray J, Bosworth A, Layman A, et al . Data cube: A relat ional aggregation operator generalizing group-by, cross-tab, and sub-totals// Proc. of the 12th IEEE Intl. Conf. on Data Engineering. Vienna, 1996: 152-159

0 0
原创粉丝点击