数据仓库基础

来源:互联网 发布:java培训后工资多少 编辑:程序博客网 时间:2024/06/06 08:26

数据字典

  • 一个手动或自动存储数据元的定义和数据的文档,指一组对数据流程图中数据流、数据文件、数据项及处理逻辑进行定义描述的表格

主题库

  • 主题是在较高的层次上将企业信息系统中的数据进行综合、归类和分析的一个抽象概念,每一个主题基本上对应一个宏观的分析领域

联机事务处理系统(OLTP)

  • 生产系统,事件驱动、面向需求,比如银行存储系统就是一个典型的OLTP系统,在使用过程中积累大量数据,关系型数据库提出后是现在应用的主流
  • 特点:1.响应时间要求高;2.用户数量庞大,主要是操作人员;3.数据库各种操作基于索引进行

联机分析处理系统(OLAP)

  • 处于数据仓库的信息处理过程,数据仓库的用户接口部分,数据驱动、面向分析的,跨部门、面向主题
  • 特点:1.数据来源于生产系统;2.时间要求合理;3.用户人员少,主要是业务人员、管理员

数据仓库特点

  • 面向主题、集成的、随时间变化的、信息相对稳定的数据集合
  • 面向主题:数据仓库内的信息按照主题形式划分,不是像业务支持系统一样按照业务功能划分;分析和明确企业所涵盖的业务范围,对企业的业务高毒性概括描述,把密切相关的业务对象归类,没有统一标准
  • 数据集成:数据仓库中的信息不是从各个业务系统中简单取出来,而是一系列加工整理汇总过程,消除数据源不一致性(保证企业数据全局一致性),(使用数据映射)
  • 随时间变化变化:数据仓库的信息并不只是反映企业当前信息,而是记录从过去某一时点的各个阶段的信息,数据仓库可以反映用户状态变化过程以及分析变化原因
  • 数据相对稳定:数据一旦进入数据仓库以后,很少进行修改,更多的是进行查询,通常需要定期加载和刷新
原创粉丝点击