数据仓库建设

来源:互联网 发布:高中英语听力训练软件 编辑:程序博客网 时间:2024/04/28 06:51

       数据仓库的建设需要经历的事情,需要经过一个混乱期,为了简单的需求来无休止的进行原有模型的扩充,直到模型已经不成为模型,是所有的需求堆积的结果。经过一个混乱期之后,会设想进行一次数据的整体规划,需求的整体规划,此时按照模型的方法来进行数据的二次重构,并考虑使用行业通用的解决方案来进行数据仓库的建设,比如说进行新的etl流程的改写,从最原始的存储过程来过渡到业界使用的跨平台的数据抽取,转换过程,当然,进行这样一个过程,是需要技术和人力的投入,在这个过程中,主要进行数据流模型的部署,但穿插着却是有隐含危险因素的数据初始化问题,这个过程丝毫不比前面的数据模型的实现难度低一点,在整个模型重构的过程中,会碰到很多意想不到的问题,包括数据的问题,流程的问题,这个时候采取的策略最好也是出现一个问题,解决一个问题,因为在前期进行整个数据的监控或者问题的预知,难度很大,出现的问题,可以为后期提供整个的数据质量解决方案提供参考。

       经过数据模型的重构,接下来数据解决方案已经有一定的规模,好多的需求已经在前期的精心建模下得到了解决,这个时候为了无缝的迁移到新系统,需要对以前的各种报表或者需求进行迁移。当水到渠成的时候,此时数据质量以及元数据方面的,或者更好的解决方案的探索就可以提到日程了,对数据质量有个全面的认识,不仅是因为在建模的过程中出现了很多问题把这个需求推向了桌面,更是为了好的质量服务提供了前提,一个好的数据仓库系统,数据质量是衡量的标准,与此同时,基于元数据的影响分析可以与数据质量相辅相成。

       数据仓库的完善,需要的是耐心,需要的循序渐进,需要的是利用现有的资源做现有的事情,每件事情都不能做到完整和完美,但是需要提供一个持续改进的思路,需要一个完整的思路来支持数据仓库的发展,并需要一个美好的向往,和切实可行并且具有前瞻性的目标来引领整个数据仓库建设的前进。

      没有最好,只有更好,说明现阶段没有达到最后目标,说明路径的需找往往是崎岖不平的,也说明现在还是有缺陷的,不要被眼前的问题麻木,不要被前行的坎坷难倒,是一个数据仓库的建设思想,也似一个人的成长轨迹。

原创粉丝点击