偶遇BI

来源:互联网 发布:淘宝网中年女装40岁 编辑:程序博客网 时间:2024/04/27 23:07

偶遇BI
    BI(Business Intelligence,商业智能)这个词之前听的很多,一直都感觉很神秘,也没有去弄清它到底是个什么。最近由于种种原因吧,开始走近这个神秘的家伙。
    第一堂BI培训课,讲师就讲了个我在学校的时候就已经听烂了的案例:沃尔玛的啤酒和尿布。在我印象中,老师们从很多角度分析过这个案例,但是没有一个人提起过BI这个词语。我也曾想过,沃尔玛是怎么找到它们之间的关系的呢?我很快就给出了答案,分析销售数据。至于怎么样分析,用什么工具分析的,我就没有仔细考虑过了。今天才知道,原来这是BI的杰作。讲到这里脑子里就浮现出众多大片中的影像,一堆看不懂的代码在显示屏上滚动,然后出现一个惊人的结果。在回过神儿来后,又是那个问题,他们是怎么分析出来的。这个时候我想到的是我在大学时候旁听过的一个课程叫做数学建模。沃尔玛的分析师们应该不会仅仅只是group by一下,sum一下,看个简单的线条图就得出了啤酒和尿布的关系,应该是应用了什么数学模型,让分析更加准确。就好像课堂上老师用数学模型计算证明了全球军备竞赛不会无休止的进行下去一样神奇。不过这些都只是我的猜测,BI是不是这样做的,还有待进一步学习啊!
    BI培训中讲师还展示了一个杜邦分析动态图表,当你变动一个指标时,跟他相关的指标都会变化,据介绍是用Bussiness Object做的。这个东西让我想起了之前做过的一些东西,当领导问,如果我们在这里多投入一些会有什么影响呢?这个时候就比较悲剧了,有很多方案很多图表能说明问题,但都比较死,无法很快看到变化结果,所以动态的还是高科技啊!那又要进一步问了,杜邦分析是有一套算法的,他只适用于某一大类问题,那那些不同领域中的众多指标或者指数之间的关系又要怎么去寻找呢?我想还是要根据大量的数据进行分析建模,建立一个数学模型。数学真是个好东西啊!
    不过讲师之后讲的东西和我的思路没有什么联系,提也没有提到我想的这些。随后讲师讲了BI的体系结构,不过我个人认为这只是一种划分方式,说明了我们现在使用的BI是怎样工作的。
    数据获取部分:这个部分主要是说BI数据来源,毕竟BI不是业务系统,作为分析系统,自然需要大量的数据。BI的数据来源于日常使用的各种业务系统积累起来的数据,例如:ERP、财务、销售等等业务系统。但是这些数据显得会比较零散,也不是每个东西我们都能用上的,所以我们要对数据进行抽取、清洗、转换也就是常说的ETL过程。那么这些数据整理后的数据放在哪儿呢?
    数据存储部分:为了存放数据我们要建立数据仓库。数据仓库的建立是个复杂的工程,也是很关键的地方。不是我这个还没入门的人能说清楚的。它要有面向主题的设计,要有统一的数据接口,要有一定的数据缓存区,把数据放进仓库,还要建立分析模型,建立数据集市等等一系列工作。好啦,现在我们就当有数据啦。那就要进行分析啦!
    数据访问部分:这个时候就是对数据使用的时候,根据业务系统的经验,如果数据仓库设计的不好,这个时候是很痛苦的。这个时候也是各种专题分析、报表、数据挖掘大显身手的时候。不过话有说回来,人还是很重要的,就算给了把这些都交给了决策者,要是决策者什么都看不出来,那也是白费。所以想想,能找出啤酒和尿布关系,并且提住来的人,真是厉害啊!
    最后,讲师将了些BI的相关厂商和产品。几个覆盖BI全部领域的厂商:
    IBM产品:DB2,Cognos,spss,Datastage......
    SAP产品:Business Object,sybase......
    Oracle产品:Oracle,Hyperion......
    Microsoft产品:SQL Server
    还有数据集成领域的Informatica,数据仓库领域的Teradata,数据挖掘领域的SAS,还有国内的用友BQ,奥威智动的Power-BI和润乾报表。看看来看去这里都没有开源的,后来看到了pentaho,spagoBI,openI,jaspersoft......就先记下来吧,以后肯定用的着。

原创粉丝点击