数据仓库

来源:互联网 发布:linux命令日志文件 编辑:程序博客网 时间:2024/06/07 11:48

1、什么是数据仓库(Data Warehouse,可简写为DW或DWH

一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合。

2、数据仓库的特点

数据仓库是面向主题的;操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题域进行组织。主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。

数据仓库是集成的,数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出数据仓库的核心工具数据仓库的核心工具来,进行加工与集成,统一与综合之后才能进入数据仓库。

数据仓库是一种思想,只要能作为数据存储的媒介都可以搭建数据仓库,不局限技术,不局限格式,可以是关系数据库oracle,mysql等,也可以非结构化数据库 hive等,也可以是excel,txt文本。

3、数据库与数据仓库的差别


4、数据仓库的用途

1)数据仓库系统提供了标准的报表和图表展示功能,数据仓库内的数据来源于不同的业务处理系统,而数据仓库系统展示的数据是整个企业的数据集成,数据仓库的作用就是利用这些最宝贵的业务数据作出最明智的商业决策。
2)数据仓库支持多维分析。多维分析通过把一个实体的属性定义成维度,使用户能方便地从多个角度汇总、计算数据,增强了数据的分析处理能力,通过对不同维度数据的比较和分析,增强了信息处理能力。多维分析是数据仓库系统在决策分析过程中非常有用的一个功能。
3)数据仓库是数据挖掘技术的关键和基础。数据挖掘技术是在已有数据的基础上,帮助用户理解现有的信息,并且在当前信息的基础上,对未来的企业状况作出预测,在数据仓库的基础上进行数据挖掘,可以针对整个企业的发展状况和未来前景作出较为完整、合理、准确的分析和预测。