新一代商业智能

来源:互联网 发布:网页登录源码 编辑:程序博客网 时间:2024/05/01 17:39

在适当的时候将适当的信息交给适当的人:从一开始,这句话就成为商业智能(BI)的最高境界。但是如今,关于 BI 和数据仓库(DW)社区如何实现那个目标的各种因素正在变化。当数据的来源、类型和绝对数量不断增长的时候,什么才是适当的信息?谁应该拥有这种信息——谁不应该拥有这种信息?当业务流程涉及需要跨越全球协作的多个用户和系统时,什么才是“适当的时候”?

  答案是不确定的,也就是说,企业满足 BI 的定义目标的方式也必须是变化的。信息技术必须支持而不是阻碍业务敏捷性。在经历了因合并和收购、新的产品线、新的供应商关系、遵从规章制度的压力以及整个新用户群(和他们的设备)的合并而产生的 IT 挑战之后,很多信息管理人员和 DBA 认识到,BI 和 DW 系统不能一成不变。

  信息本身也很少是静态的;它是一种流体,将战略、计划和洞察力与行动连接到一起。数据和信息必须允许(企业内外的)人和过程协调决策和执行,以完成共同的、总体的目标。良好的信息流可以为企业省钱。而一旦信息不畅通,企业运营的成本就会上升。

  因此,说起现在和将来的信息需求,用“动态”一词描述 BI 和 DW 社区面临的挑战比较合适。公司在试图将 BI 和 DW 实现从传统的有限历史数据基础上的查询和报告,转变为支持对信息和洞察力的更积极的应用以使企业不断进步和革新时,需要面对一连串的挑战,IBM 的动态数据仓库策略着眼于公司的信息随需应变(Information On Demand),正好可以解决这样的挑战。动态数据仓库使 BI 和 DW 重新定位,着重响应对数据和信息的时间敏感的要求,而不是传统的管理和移动。

  “数年前,数据仓库需要通过大量处理才能得出滞后的材料,例如每周或每月的报表,”IBM Business Intelligence Solutions 的副总裁 Karen Parrish 说道,“现在,人们希望对他们所面对的趋势和方向有一个全面的理解——使 BI 成为日常企业运营中的一部分。”传统数据仓库不能真正处理这一点。我们需要一个更好的平衡点来实现全新的服务级别。

  当企业开始依赖于数据和信息来运行关键业务流程和争取竞争优势时,对动态信息交付的需要经常出现且与日俱增,这要求类似于在线事务处理系统的可用性和可靠性服务级别。而且,BI 和 DW 系统必须更深入地与事务处理和其他应用功能集成,以使关键参与者注意到企业事件的重要性,尤其是可能表明客户行为中出现舞弊或预料外的变化的异常情况或其他不期望出现的行为。然后,企业可以在事务或事件触发业务流程当中某些花费较高或不可逆转的行为,例如产品的制造和发货,非法地将钱从一个账户转移到另一个账户,或者有损客户关系的行为之前,快速做出响应。为此,正如 Parrish 指出的,DW 系统,包括数据集市和运营数据存储,必须平衡很多类型的查询和工作负载,而不仅仅是那些支持在不影响运营的情况下完成的传统分析的查询和工作负载。

  DW:信息流的中心

  动态数据仓库战略将来自 IBM 的软件、服务器和存储技术等对于前沿信息管理所必需的非常关键的资产整合起来,前沿信息管理包括在适当的上下文中交付集成的、高质量的数据,建立元数据,管理主数据,以及为从多种关于客户、产品或其他感兴趣的对象的(结构化或非结构化)源获得的“事实”创建单个的视图或版本。

  结构化和非结构化信息。OmniFind 是 IBM 最近为搜索、文本分析和数据可视化而引入的解决方案,它为搜索和分析结构化和非结构化数据源提供了嵌入式工具。OmniFind 使用户可以立即使用来自所有相关数据源的信息,而不仅仅是存储在传统数据库中的那部分信息。基于事实的决策是 BI 的一个关键目标,只有当决策者掌握了所有必要的“事实”——包括来自非结构化数据源的信息——并且能够理解他们所看到的信息的意义时,这个目标才能实现。

  面向业务流程。BI、分析与业务流程管理(BPM)、内容管理和工作流之间更紧密的集成对于业务敏捷性和有效性也非常关键。为了取得更好的企业绩效,很好地实现提高客户满意度等目标,企业不仅需要综合来自很多地方的信息,还必须能够将跨业务功能的系统、应用程序和工作流链接起来。换句话说,企业需要变得平稳地面向流程,而不要被分散的部门和独立的应用程序弄得支离破碎。

  动态数据仓库将 IBM 的 FileNet BPM 和 WebSphere BPM 合为一体,使企业能够应用 BI 和 DW 在流程执行和活动监控过程中生成的,而不仅仅是通过事后分析生成的“智慧”。因此,动态数据仓库可以支持不断改进和优化这样一个封闭循环的业务流程管理(BPM)目标。

  特定于行业的模型。最后,动态数据仓库对于模型驱动的 BI 很重要,模型驱动的 BI 进一步使用户可以在无需关心数据转换、数据聚合和模式集成等技术细节的情况下使用业务模型和场景。IBM 的 Rational Data Architect 将 BI 和 DW 与企业数据建模和方法学链接起来;IBM 的银行、零售和其他行业的数据模型越来越多地基于 XML,它们使公司可以应用最佳实践,以便将精力放在不同点上,更有效地与使用类似实践和行业标准的业务伙伴(以及管理者)协作,通常还可以用更少的时间获得更丰富的 BI 和 DW 功能。

  BPM、SOA 和 BI。从一个更高的建模级别来驱动系统对于面向服务架构(SOA)也至关重要,因为 SOA 就是要使松散耦合的、可重用的服务在网络中协作。对于 SOA,公司需要抽象的模型和架构,以便将精力集中在总体目标上,而不是迷失在服务集成和定义的细节中。通过业务流程执行语言(BPEL)和其他新兴标准的实现,SOA 和 BPM 走到了一起。BPM 可以推动 SOA,而 SOA 则可以用一种更简单、更标准的方式解决集成。但是这个凳子还有第三条腿:BI 和分析。动态数据仓库对于提供这个关键的方面,以及支持提供 BI、分析和其他数据丰富的成分的 Web 服务将非常重要。

  让 BI 加速

  基于(通常是)关系数据的历史分析的传统 BI 和 DW 系统对于企业,尤其是较长时期的战略分析来说一直有着不可估量的价值,而且也将继续如此。然而,在某种程度上,大多数 BI 和 DW 所具有的集中于历史的、孤立的性质,是由过去 15 年来开发大型决策支持系统时所在的环境——即根据当时的计算能力、内存、存储和数据库系统容量等技术和成本方面的约束而定制的环境——而造成的。企业还勉强地让用户进行可能降低事务系统的性能和可靠性的查询;然而,与此同时,DW 项目不得不使用它们仅有的资源,即起初购买并部署的用于运行运营性 OLTP 系统的内存、CPU 和存储。

  如今,很多约束已不复存在,或者有了很大的变化。OLTP 仍然是关键业务,但是 BI 和 DW 同样也是关键业务。如果信息够强大,那么决策者越早获得知识,他们就越强大、越有竞争力,他们的企业也就越强大、越有竞争力。通过使用集成的数据挖掘——例如 DB2 9 Data Warehouse Edition 的一个组件Intelligent Miner,预测分析可以使用近实时数据,并帮助企业用户观察事务,以维护与最好的、最有利可图的客户之间的关系。市场营销功能可以很快地(而不是在几星期或者几个月之后)评测活动和促销投资的效果,以便在更短的销售周期内评测活动和促销的影响,从而增加市场营销过程中的收益,减少浪费。呼叫中心可以优化事务,使服务代表可以利用交叉销售和向上销售的机会,因为他们更了解客户。及时的数据可以使零售、制造和供应链企业变得更敏捷,从而避免当客户口味突然改变时仍然将“到货即损(dead on arrival)”的产品投放到市场。

  当然,减少数据到来与可以基于它生成报告和进行分析之间的延迟还只成功了一半。另一半是无论信息基于历史数据源还是实时数据源,增加整个企业的用户有效地理解和应用知识的速度。传递过时的、粗劣拼凑的电子表格是不能获得理想效果的。有了对战略的理解之后,企业用户还需要一些工具,以便根据对他们的活动和与企业的关系的完整的、最新的认识来改进日常决策、管理即时责任和解决客户问题。

  一种新兴的解决方案是“运营性”BI,这种解决方案将 BI 放入到企业运营中,强调绩效管理和对业务流程的监控。在 2005 Ventana Research 调查中,62% 的回答者认为“运营绩效管理”——评测和监控企业运营活动和流程——“非常重要”。提高效率,管理或减少成本,以及增加对如何提高收益的关注,这是运营性 BI 的三个主要驱动因素。运营性 BI 的第一步通常是“向大众”提供预先构建的、参数化的报告。更高级的实现则将 BI 嵌入到基于角色的仪表板界面中,并采用活动监视和个性化报警;然而,Ventana Research 研究表明,运营用户还希望拥有即时查询和分析能力。换句话说,底层 BI 和 DW 基础设施所支持的仪表板的任务是增加数据的速度和全面性。

  混合工作负载:最后再次聚拢

  由于有时候拥有成百上千需要访问数据集市和数据仓库的运营用户,企业在使 BI 加速的过程中面临着新的障碍:支持更多用户、更多查询和更多样的分析需要所导致的惊人的成本和复杂性。如果增加专门的数据集市和数据仓库,又需要对它们进行设计、配置和管理,还是会给 IT 带来新的负担。有些企业转而使用新的、开箱前已预先配置好的 DW 工具;然而,虽然这些工具可以减少一些 IT 负担,并削减相关的部门管理人员,但是它们会导致数据质量的恶化以及集成问题,而企业恰好是想通过合并数据集市来解决这些问题。

  通过动态数据仓库的方法,IBM 使企业得以使用一种更好的平台,这种平台可以处理参数化战术报告和查询,以及较复杂的、涉及多个数据库表和异构数据源的更具战略性的分析性查询。虽然这种 DW “混合工作负载”支持正在引起那些关心激增的数据集市的企业的兴趣,但 IBM 一直考虑“混合”,以包括 OLTP。

  虽然过去 15 年来 DW成长迅速,IBM 仍未忽视其最终目标:一个可以同时支持决策支持的 OLTP 的系统。DB2 9,IBM 动态数据仓库解决方案背后的核心底层技术,采用了包括自调优、查询优化、分区、高可用性和管理特性在内的多种技术来处理这两种环境。将这两种混合的最终工作负载放在一起,可以迎合很多企业的合并计划——但是可能更重要的是,它可以为将分析嵌入到事务处理系统中乃至使业务模型驱动的分析应用程序能够推动基于 SOA 的运营系统的部署打下基础。

  DW 与 IBM Balanced Warehouse

  支持混合的工作负载,这听起来不错,但是就目前大型 DW 系统的配置、调优、查询、可伸缩性和复杂性而言,这可能吗?当企业在通过 BI 和借助绩效管理获得的更好的运营布局来寻求竞争优势时,面向批处理(batch-oriented)的报告的日子很快就要过去了。

  IBM 的解决方案是 Balanced Warehouse(曾被称作 Balanced Configuration Unit 或 BCU),它是一个预先配置的单元,组合了硬件(处理器、I/O、内存和存储)和软件(DB2 Data Warehouse Edition,特别是它的分区功能)。Balanced Warehouse 为客户提供一个集成的系统,这个系统可以针对根据规模(数据量)和所需的软件工具与特性定义的数据仓库级别进行设置。通过使用 DB2 的大规模并行处理(MPP)和不共享(shared-nothing)架构选项,BCU 成为一个个的“块”,这些块可以叠加,以扩大系统规模。(请参阅第 22 页的侧边栏,那里有一个使用 BCU 概念构建的、曾获奖的企业数据仓库的例子。)除了新的系统,已有的系统也可以利用 BCU 方法。

  和 DW 工具一样,Balanced Warehouse 可以减轻 IT 的负担,同时也减轻那些需要扩展 BI 和 DW,但是又关心主要技术基础设施工作的企业的负担,在传统 DW 环境中,这些工作可能使开发周期延长数个月乃至数年。IBM关键的不同之处在于处理混合工作负载的灵活性,当然还有在调优用于 DW 环境的一些组件,包括 ETL 和数据集成软件方面的长时间的经验。

  BI 和 DW 不再是 OLTP 系统的继子,不再需要与运营需求争夺时间、预算和注意力。随着它的流行,当它向外延伸到运营用户,融合不同类型的数据,以及成为基于角色的仪表板(与 BPM 系统相交的门户)的一部分的时候,BI 的多样性得到了增长。DW 系统的架构师和经理需要为将来“老样子”比以往少得多的情况做准备。系统将需要活力;但是,这种敏捷性必须以合理的成本、用合理的时间来取得。IBM 的动态数据仓库解决方案支持混合工作负载环境和运营性 BI,它可以为不远的将来打下基础。

  在真实的世界中

  Gibbs 对于他的信息风险工作采取与其他工作相同的态度:“我们相信并希望职员们会遵守规则,但是我们不能依赖于这种信任。我们都愿意省点儿事,但是不行。安排人员(或技术)来确保数据治理过程的执行,这样,工作才可能正常进行。”

 

来源:http://www.businessanalysis.cn/x/html/27/n-627.html

原创粉丝点击