四种数据ETL模式
来源:互联网 发布:淘宝店铺怎么注销掉 编辑:程序博客网 时间:2024/06/01 08:32
完全刷新:数据仓库数据表中只包括最新的数据,每次加载均删除原有数据,然后完全加载最新的源数据。这种模式下,数据抽取程序抽取源数据中的所有记录,在加载前,将目标数据表清空,然后加载所有记录。为提高删除数据的速度,一般是采用Truncate清空数据表。(该方法在数据仓库中用的比较普遍,一般不含有时间戳的维表都使用此方法。)
镜像增量:源数据中的记录定期更新,但记录中包括记录时间字段,源数据中保存了数据历史的记录,ETL可以通过记录时间将增量数据从源数据抽取出来以附加的方式加载到数据仓库中,数据的历史记录也会被保留在数据仓库中。
事件增量:每一个记录是一个新的事件,相互之间没有必然的联系,新记录不是对原有记录数值的变更,记录包括时间字段,可以通过时间字段将新增数据抽取出来加载到数据库中。
镜像比较:数据仓库数据具有生效日期字段以保存数据的历史信息,而源数据不保留历史并且每天都可能被更新。因此,只能将新的镜像数据与上次加载的数据的镜像进行比较,找出变更部分,更新历史数据被更新记录的生效终止日期,并添加变更后的数据。大多数源数据中需保存历史信息的维表
- 四种数据ETL模式
- 四种数据ETL模式
- 四种数据ETL模式
- 四种数据ETL模式
- 四种数据ETL模式
- 四种数据库ETL模式
- javascript四种数据类型
- Tokyo Cabinet 的四种数据结构
- Tokyo Cabinet 的四种数据结构
- 发现微软有四种数据库
- 四种数据库访问技术
- oracle(4)四种数据类型
- Tokyo Cabinet 的四种数据结构
- Hibernate的四种数据加载方式
- 对比iOS中的四种数据存储
- 对比iOS中的四种数据存储
- 对比iOS中的四种数据存储
- 对比iOS中的四种数据存储
- gdb的脚本使用 -- gdbinit
- 如何获取数据表中的中间数据,例如17-20条数据
- 驱动终于跑起来了,做实验
- Q-Kevin的编程随笔(一)
- 狗屁之道,大道如水
- 四种数据ETL模式
- GDI+淡入淡出
- 更深层次分析一道试题——指针内存分配
- Windows XP 下建立PPPoE宽带连接的方法
- Eclipse中连接Mysql数据库
- Silverlight 利用Tag在TextBox绑定中传递参数
- 软件开发与项目管理易理——简单项目管理
- vs2010中的MSBuild输出warning MSB8012问题
- Tutorial 1: Creating Web Services in Eclipse (Bottom Up)[转]