Data WareHouse Base

来源:互联网 发布:日k线叠加周k线源码 编辑:程序博客网 时间:2024/04/28 01:39

                                                                          Data WareHouse Base
                                                   数据仓库基础知识

投资计算机系统的目的

    现代化的企业没有自己的计算机系统是难以想象的。银行依靠计算机系统实现货币电子化,并实现与其他银行间快速清算,帮助重要客户实现托付等业务。保险公司依靠计算机系统实现承保、理赔的电子化,并且能够及时准确了解到发生的重大赔案和重要客户动态。所有已经或准备投资计算机系统的企业,都会部一个问题:“建立计算机系统的最终目的是什么?”。回答可能多种多样,但是有一个最主要的目的,也是最终目的肯定是“让企业赚到更多的钱”。所以,计算机系统是否成功或者是否值得投资,最主要的衡量标准应该是“投资回报”。

成功计算机系统的三个阶段

    成功的计算机系统都应该有三个阶段“构造基础设施、优化系统性能、实现信息价值。每个阶段有不同的投资回报方式。

    构造基础设施阶段,也就是建立OLTP系统,主要目的是让大量的事务电子化。比如银行的通存通兑储蓄系统,该阶段使用权前台操作人员从繁重的手工操作中解放了出来,并搜集了大量的原始数据,这些数据对今后企业的发展是一笔宝贵的财富。此阶段最大受益人是前台操作人员。

    优化系统性能阶段,其实是保护第一阶段投资的行为。因为随着业务系统的运行,系统性能、安全性、可靠性都受到来自各方面的挑战,优化系统的性能就是解决诸如性能不稳定、系统受非法攻击等情况,这些情况若得不到及时解决,随时可能造成灾难性后果。此阶段最大受益人是计算机系统维护人员;

    实现信息价值,也就是充分利用已有数据,挖掘数据中潜在的信息价值,为企业决策提供决策上的帮助。所以,此阶段最大受益人是决策者。

如何实现信息价值

    几乎所有行业都面对着激烈的竞争,正确及时的决策是企业生存与发展的最重要环节。越来越多的企业认识到,只有靠充分利用、发掘其现有数据,才能实现更大的效益。日常的业务应用生成了大量的数据,这些数据若用于决策支持则会带来显著的附加值。若再加上行为分析报告、独立的市场调查、评测结果和顾问评估等外来数据时,上述处理过程产生的效益可进一步增强。数据仓库正是汇总这些信息的基础,进而支持数据发掘、多维数据分析等当今尖端技术和传统的查询及报表功能。这些对于在当今激烈的竞争中保持领先是至关重要的。调查研究表明,大多数企业并不缺少数据,而是受阻于过量的冗余数据和数据不一致;而且它们变得越来越难于访问、管理和用于决策支持;其数据量正以成倍的速度增长。这样,信息中心面临着不断增长的决策支持的需求,但是,开发应用变得越来越复杂和耗费人力。那么怎样把大量的数据转换成可靠的、商用的信息以便于决策支持呢?数据仓库正广泛地被公认为是最好的解决方案。

什么是数据仓库

    建立数据仓库的目的,是把企业的内部数据和外部数据进行有效的集成,为企业的各层决策、分析人员使用。企业内部数据是指通过业务系统收集到的数据,这些数据可能分布在不同的硬件、数据库、网络环境中,为不同的业务部门服务。比如对一个制造业用户来说,可能有生产数据、销售数据、财务数据、市场数据、人事数据等等,所有这些数据从结构上看,是相对独立的,是不利于企业决策者进行全面分析和查询的。如果我们针对决策者的需求,对这引起数据进行结构上的重组,按更方便决策分析的角度去设计,并且充分考虑今后的扩展性与外部数据的接口,会对企业的宝贵资源-数据,实现真正的信息价值。

    对数据仓库中信息的使用,不同层次的用户有不同的使用风格。比如:

    主管信息系统(EIS):提供界面丰富,定制容易的决策分析,主要适合企业的高层决策者使用。
    联机分析处理(OLAP):灵活丰富的多维分析与查询,可以从不同的角度去分析企业的运作情况,并对未来进行预测。主要适合于企业的中层领导和业务分析人员。
    限席查询(Ad Hoc Query):提供从多个角度的灵活查询。适合于业务分析人员。
    灵活报表(Reporting):提供灵活报表的设计。适合于制作报表的人员。

什么是数据仓库处理

    数据仓库不同于数据库。数据库是一种通用的平台,用来管理企业的数据;而数据仓库是一种概念,在此概念下进行的构造过程,我们叫它数据仓库处理。所以,数据仓库不是花钱可以购买的现成产品(而数据库是),它是一个建立的过程。

    数据仓库处理包括许多方面的内容,我们可以把它们分成:

    数据准备:
    充分了解决策需求;
    按数据仓库方法设计数据仓库结构;
    业务系统数据向数据仓库结构中进行移动(复制、抽取、清洗…);
    数据仓库数据向小规模数据集市的数据复制和分布;

    数据展现:
    面向高层决策者的主管信息系统(EIS);
    面向决策分析者的联机分析系统(OLAP);
    为各层决策者服务的即席查询系统(Ad Hoc);
    为报表服务的灵活报表系统(Reporting);
    数据展现采用多种灵活的方式,比如客户/服务器模式或浏览器模式。

过程管理

    数据仓库的建立需要很好的过程管理和方法。我们把数据仓库的建立作为过程(Process)来看待,而不是作为工程(Project)看待。作为过程看待,主要基于几方面考虑:

    适应业务发展:企业在市场环境中可能经常需要进行机构、产品、市场的调整,从而导致决策者决策模式的变化。对于数据仓库的建立过程来说,就是产生了新的需求。

    适应技术的发展:计算机技术发展迅速,新技术不断出现,如何在数据仓库建立过程中保证技术不落后,保护原有的技术投资,最佳方式就是采用面向过程的方法:自上而下的总体设计;自下而上的实施。

数据仓库的投资回报(ROI)

    应用数据仓库技术,改善企业决策支持模式,并取得最大的投资回报,已经成为大多数成功企业的共识。具调查,幸福500中已经有85%的企业建成或正在建立数据仓库,数据仓库与Internet一样,正在成为最快的IT增长点。1996年,全球企业在数据仓库上的投资达到16.8亿美元,并且每年以19.1%的速度增长。据IDC调查,数据仓库的平均投资回报率在401%。

原创粉丝点击