解读商业智能之二 - 商业智能的组成部分

来源:互联网 发布:逻辑回归算法知乎 编辑:程序博客网 时间:2024/04/28 19:02

解读商业智能之二 - 商业智能的组成部分

知道了什么是商业智能(商务智能),我们来看一下商业智能/商务智能包括什么,搭建一个商业智能系统需要哪些工具/技术。

一般地讲商业智能包括以下的部分(不同的体系,划分的方法可能有些差别,但本质相同)。

*ETL:即数据的抽取/转换/加载。也就是将原来不同形式、分布在不同地方的数据,转换到一个整理好、统一的存放数据的地方(数据仓库)。

ETL可以通过专门的工具来实现,也可以通过任何编程或类似的技术来实现。

*数据仓库:一个标准的定义是:数据仓库是一个面向主题、集成、时变、非易失的数据集合,是支持管理部门的决策过程。详细可以参见:http://www.ithao123.com/datawarehouse/0003.html。

简单地说,数据仓库就是储存数据的地方。它既可能是原始的业务数据库,也可能是另外生成的。既可能是标准的关系型数据库,也可能是包括了一些特定面向分析特性的专门产品。

*查询:找出所需要的数据。由于需求的多样性和复杂程度的差异,查询可能是最简单的从一张表中找出”所有姓张的人”,到基于非常复杂的条件、对关系非常复杂的数据进行查找和生成复杂的结果。

*报表分析:以预先定义好的或随时定义的形式查看结果和分析数据。将人工或自动查询出来的数据,以所需要的形式(包括进行各种计算、比较,生成各种展现格式,生成各种图表等)展现给用户,甚至让用户可以进一步逐层深入钻取这些数据,乃至灵活地按照各种需求进行新的分析并查看其结果。

在这个领域,报表已经由原来狭义的做好固定报表发展为灵活地按业务要求随时制作各种报表、进行各种分析和数据研究处理。

*OLAP分析:多维数据分析,从多个不同的角度立体地同时对数据进行分析。理解OLAP分析,最简单的例子是Excel中的数据透视表。

需要指出的是,OLAP有广义与狭义之分,广义的OLAP是相对OLTP而言,可以说包括了查询、报表分析、OLAP分析和数据挖掘,但真正大家所讲的实际是狭义的OLAP,即多维数据分析。

OLAP分析一般讲应该是通过建模和建立立方体(CUBE)来实现,但现在也有一些简单的OLAP工具可以不建模即进行小数据量、低复杂度的分析(EXCEL的数据透视表即是一例)。

* 数据挖掘:一种在大型数据库中寻找你感兴趣或是有价值信息的过程。相比于上面几个部分,数据挖掘是最不确定的。如果理解它与查询的区别,似乎是数据如果容易查出来,就是查询。如果费很大劲才能找出来,就是挖掘。

上面这若干部分,并不是每一部分都必不可少,而是要根据应用的实际情况,具体问题具体分析。一般地讲,数据仓库(这里是广义的,其中相当一部分情况就是指标准的关系型数据库)和查询报表分析是必不可少的,而其他一些功能则视应用的需要可能有不同程度的应用。

除了上面所讲的这些实质性、技术性的组成部分外,与商业智能相关的还有很多应用层面的概念,如EPM(企业绩效管理)、DashBoard(仪表盘)、预警、决策支持等等。这些概念在应用上有很大意义,也有一些相关的辅助技术,但本质上还是基于上述的几个组成部分。

从上面的解读我们可以看到,商业智能既不神秘,也不简单。

不神秘,是指即使你简单地拿一个数据库,需要的话做几个视图或用存储过程转换一下数据,写个程序让用户可以查数据,写些程序或用个免费报表工具把报表做出来,用EXCEL做一下OLAP分析,也完全可以称得上是一个商业智能应用。

但另一方面,随着数据量和复杂性的增大,随着用户功能的增强,上述每一项功能都可能非常复杂,都有各个领域功能非常强大的产品来实现。

还有一点要指出的,与ERP有很大的差别,商业智能的各个组成部分之间的独立性非常强,因为里面的数据是标准化的。你完全可以用 Informatica做ETL,用ORACLE做数据仓库,用润乾做查询与报表分析,用Cognos做OLAP分析,从而在各个领域都达到较佳的效果。

本文链接:解读商业智能之二 - 商业智能的组成部分
转载请注明出处:商业智能BLOG-DinosBoy  
原创粉丝点击