数据仓库建设_关系型数据库存储_调度(1)

来源:互联网 发布:东莞软件检测机构 编辑:程序博客网 时间:2024/06/08 19:50

  序

  博客重新开张了,欢迎新老读者光临。

  因为自己也是一个数据仓库技术群的群主,经常会遇到有人问,有没有数据仓库的视频,有没有数据仓库的相关资料,还有更夸张的,直接说,“想做架构师,有哪些资料”;所以近期会在博客中新开一个“闲扯”板块,分享自己对类似问题的看法。

  闲话少说,书接上回偷笑

  一、数据仓库的数据从哪里来

  1.数据仓库产生数据吗?

  数据仓库本身是不产生数据的,当然了,可能有人会说,如果数据仓库不产生数据,那报表是什么?从哪来的?然后,这时候会再跳出一个人来说(我天朝确实人多哈),报表那是数据仓库加工产生的
  上面的一段话,我划分为两个问题,首先来说第一个。现在普遍见到的数据仓库的应用,可能就是报表了,各种日报、周报、月报、季度。。。还有银行的年终结转之类的。其实,如果只是做这些报表,还真可惜做数据仓库花那么多人力、物力了。我想说,这个数据确实在各种业务系统中没有的,但我个人也并不认为这就是数据仓库产生数据,包括人们常说的数据挖掘和数据分析的结果。我觉得这些就是目前的数据情况的总结,或者数据规律的深度利用,数据仓库技术+数据科学技术,本身就是发现数据中的数据,或者比较常见的一句话“挖掘数据金矿“。
  以上这些工作如果我们用excel存数据+数据分析处理或者用纸+笔+计算器也能做同样的事情,我觉得这时候应该就没人说是纸和笔产生了数据吧,不然,那只能是作者凭空编了。
  然后再来说报表是数据仓库加工产生的。在这里单独说这个问题,我只是想说,数据仓库里面做的事很多,我会依照自己的理解一一介绍,但我实在不想用加工这个词。报表我将它定义为,数据仓库数据应用的一种。这是一种相互的情况,在数据仓库中已经存储了按照良好模型组织的数据,新增一个日报时,就是对数据仓库数据的一个应用;反过来,在数据仓库还很薄弱的时候,由业务需求驱动,需要优先考虑某些报表,这时可以作为数据的应用建设方向。
  至于加工这个词,确实听很多人和很多项目中提起,我遇到的情况大多都是贴源设计的系统,关于帖源系统后期我会重点来说明。

  2.数据从哪来

  以上的观点仅个人看法,欢迎善意技术交流,钻牛角尖的大侠就放过我吧,有空我还想养养鱼,遛遛鸟呢。数据从哪来,2015-04-2更新。欢迎大家加我的技术群或者关注我的博客,索取”追剧课程表“
0 0
原创粉丝点击