关于数据仓库 —lookup表的一点看法
来源:互联网 发布:淘宝卖家如何上传照片 编辑:程序博客网 时间:2024/05/20 03:46
原创于2007年03月21日,2009年10月15日迁移至此。
对于搞数据仓库的人来说,面试的时候总会问及到lookup表的概念。。。。。。
对于搞数据仓库的人来说,面试的时候总会问及到lookup表的概念,这个概念一开始对我而言也是很莫名其妙的;明明基础表和事实表的一个关联就可以完成的事情需要什么lookup表。
通常的做法
SELECT A.ID,SUM(Measure1) as Measure1,SUM(Measure2) as Measure2 FROM table_original A,table_dimension B
WHERE A.ID = B.ID
为了严谨起见,我们的处理最多是加以NULL值或者未匹配键值的处理
SELECT -- A.ID,B.ID, -- the transformed field names ID
DECODE(NVL(A.ID,-2),-2,-2, DECODE(NVL(B.ID,-1),-1,-1,B.ID)) AS ID,
SUM(CASE A.Measure1>0 AND A.Measure1<100 THEN Measure1 ELSE 0 END
) Measure1,
SUM(CASE A.Measure2>0 AND A.Measure2<100 THEN Measure2 ELSE 0 END
) Measure2,
FROM table_original A,table_dimension B
WHERE A.ID = B.ID(+)
GROUP BY DECODE(NVL(B.ID,-2),-2,-2, DECODE(NVL(B.ID,-1),-1,-1,B.ID))
但是对于老外来说,为了严谨起见,把维度做为历史处理的轨迹进行保存,主要是全记录处理方式其中包括版本号方式、时戳方式、标志方式(具体处理方式参看数据仓库系列文章);所以必须增加一个代理主键,以记录和替代原来不断变化的内容,从而保存原主键信息的变化轨迹。主键的变化导致与原事实表关联过程中的脱节,必须使用新的外键代理原来的外键值。同时主键的变化导致在与事实表关联过程的变化,当然我们也可以使用复杂的视图和函数方式寻找到相应的外键值;但是对于老外来说宁愿用最简单的方式,图形化的操作和最直观的方式进行处理,毕竟数据库、数据仓库、ETL图形工具全部都是由老外发明的。实现的原理其实很简单:
SQLServer2005 SSIS实现的一个实例
- 关于数据仓库 —lookup表的一点看法
- 关于linb的一点看法
- 关于跳槽的一点看法
- 关于新技术的一点看法
- 一点关于Ares的看法
- 关于Velocity的一点看法
- 关于积累的一点看法
- 关于积累的一点看法
- 关于中国教育的一点看法
- 关于MFC的一点看法
- 关于技术交流的一点看法
- 关于积累的一点看法
- 关于积累的一点看法
- 关于积累的一点看法
- 关于学习的一点看法
- 关于MVC的一点看法
- 关于html的一点看法
- 关于MVP的一点小小的看法
- AjaxPro使用
- 自动备份SQL2000/Mysql的批处理文件
- Strcpy和Strncpy的区别
- ETL和EAI比较
- WebPart(SharePoint)中如何使用自定义的Javascript和css样式
- 关于数据仓库 —lookup表的一点看法
- ORACLE学习笔记 索引和约束
- 小虎队 - 情难枕
- 浅析firmware完整生存和使用流程
- 希尔排序(C语言)
- 关于数据仓库-Inmon-企业信息工厂(CIF)概览
- 使用PostgreSQL的五大顾虑之个个击破
- EIDcenter 与金山毒霸设计软件视觉包装
- 关于数据仓库的数据模型