BI架构“双节棍”(转)
来源:互联网 发布:中国企业经济信息数据 编辑:程序博客网 时间:2024/04/30 09:39
“架构师”的蹿红彰显了软件架构的重要性。同样,BI系统也需要架构。为了得到一个清晰而又合理的结构,架构师需要首先将BI系统分成若干模块,然后把系统用户进行细分,以明确架构的真正需求到底是什么。
刚开始接触软件工程的时候,知道其中一个步骤叫做“总体设计”,做这项工作的人就叫“软件设计师”。当时觉得这个名称比软件开发工程师酷多了。到了现在,又开始流行“架构师”(Architect),这个名称听起来比软件设计师又酷了几分。
如今,如果你偶尔遇到一个年轻人,也就是二十出头、三十不到的样子,却客客气气地给你递上一张注明“数据仓库资深架构师”的名片,这个时候,你千万不要诧异。说来也不奇怪, BI在国内刚发展起来没几年,在这个领域干个四五年就足以混个资深的名头了。
不过,话说回来,拿着“资深架构师”的名头去忽悠是一回事,但架构师究竟该干什么,架构设计究竟怎么进行,如何架构一个BI系统?的确是需要认真研究一番的!
第一截:模块
BI系统(或者说数据仓库系统)也同样需要架构,它作为一种软件系统,是符合一般架构原则的。首先,我们来看看架构设计中包括哪些内容。
架构的重点是描述系统的结构,以及它们之间的关联、交互接口。
BI系统可以划分成业务模型、元数据、数据质量、接口平台、报表集市、指标库等若干模块。可以看出,在这里,这些模块的命名都是静态的名词,而不是动词(例如业务建模、数据质量管理等)。之所以如此,是因为这是在描述系统的结构而非功能。
具体来讲,业务模型是存放业务数据的结构,可以再往下细分,并有不同的分层方法。例如可以分成ODS、EDW、DM等层,也有的会根据业务复杂度或数据量考虑,舍弃ODS层。业务模型是支撑业务分析需求的,例如报表、仪表盘、OLAP、专题应用等。
元数据为整个系统数据的形态和数据流动的过程起到支撑作用,也就是说,数据从源头开始,到最终用户眼前,其来龙去脉,每个环节的状态都需要掌握。还有人将它比喻成模块之间的黏合剂,但我更愿意将它称作是“数据”之间的黏合剂,因为模块之间自有它们的交互接口规格来黏合。
数据质量模块为衡量数据源质量、ETL过程处理质量提供支撑。接口平台是处于源系统和数据仓库系统之间的玩意儿,作用在于可以更方便地明确界定双方职责。当然,通常有很多系统似乎并不大愿意将职责搞得过于明确了,倒宁愿糊涂一些。糊涂一些的好处在于一开始省了好多事,但在以后扯皮的事情就多了。
此外,报表集市为报表应用提供支持,指标库为绩效管理需求提供支持。其实,这两者还可以归入业务模型一类,因为它们都是服务于分析需求的。
第二截:需求
之所以分成若干模块,是为了让架构清晰,降低这些模块之间的耦合,这符合“分离变化”的原则。那么,这一架构到底是否合理呢?还得看这个架构面临的需求到底是什么。做好这一步,就需要把系统的用户分为两大类角色:一是系统运营角色,他们对系统的正常运行、维护负责;二是业务分析角色,他们需要从这个系统得到数据分析的功能。
显然,第二种角色的分析数据来源都将来自业务模型模块,而第一种角色将从剩余模块中满足自己的需要,而不直接和业务模型这个模块打交道。
在架构设计中,重点应该放在如何满足系统管理用户的需求上面,而与具体业务关系不大,这种架构应该是半通用的。之所以是半通用,是因为在系统功能上面, BI项目大同小异,而在业务需求上面,架构只需要对客户的业务、分析需求分成几个大类,例如按行业为业务模型分类,按OLAP、报表来为分析应用分类,不需要太过细致。
下面,让我们来看看系统运营角色的需求。
首先,我们可以把这类角色再细分成两类:一是开发设计及实施者。之所以将开发者作为系统的用户,是因为数据仓库项目应该看作一个过程,而不是产品,因此在开发阶段,其架构最重要的用户就是开发者,当然要为之提供便利。 二是系统管理员。系统交付之后,如何监控系统运行、发现数据质量问题、应付新的分析需求等,当然都是系统管理员的分内之事。
那么,对于开发实施人员,他需要进行系统部署、ETL的开发调试、质量的稽核;对于设计人员,则需要进行模型的变更、系统调优、系统一致性分析等;而系统管理员则需要监控ETL过程、监控系统运行、响应系统警报、接口数据管理等。这些都可以看作是用例。
这些用例就是架构设计的“需求”,如何满足它们,并且保持良好的体系和清晰的结构,能够易于维护且能够满足日后肯定会增加的业务需求等等,这些都需要架构师们仔细斟酌。
最后,看一下分析人员的需求。举个例子来讲,某销售总监说:“我需要了解近半年来东区和西区的销售量、收入、成本对比”,这可以算是一个用例。对这个需求,架构师该如何做呢?正确做法是,在架构中不能考虑东区、西区这些业务概念,那样就太过于细致,而是应当将这种需求抽象成一种分析应用,例如 “即席查询”。如此,架构师所着重考虑的事情就是如何满足这一类需求,而非这一个需求。
架构设计四项原则
1 架构设计主要以面向系统运营用户为主;
2 架构设计的内容主要包括:系统功能需求、分析需求分类;支持这两者的后台结构,对结构进行粗略划分,以让其内部能够保持简单的交互方式;
3 架构设计中不要包含过于细致的业务术语(除非为了说明方便),要尽可能保持架构的复用;
4 如果架构设计确实包含不能被其他项目复用的地方,将这部分独立出去。
BI架构“双截棍”简表 | ||||
第一截 | 第二截 | |||
模块 | 需求(用户分类) | |||
业务模型、元数据、数据质量、接口平台、报表集市、指标库等 | 系统运营用户 | 业务分析用户 | ||
开发设计者 | 开发实施者 | 系统管理者 | 从一个需求到一类需求 | |
模型变更、系统调优 | 系统部署、质量稽核 | 监控系统、响应警报 |
- BI架构“双节棍”(转)
- BI架构
- 商业智能(BI)架构
- BI部门架构
- 简单的BI架构
- 提升BI架构
- DW/BI 架构层次
- 微软BI架构图
- BI的架构模型
- BI应用架构图
- BI基本架构和ETL的个人理解(转)
- 如何架构一个BI系统
- 如何架构一个BI系统
- 微软BI系统架构设计
- 微软BI系统架构设计
- 基于hadoop的BI架构
- 微软BI系统架构设计(一)
- 微软BI系统架构设计(二)
- 微软BI架构设计(三)
- 字符,字节和编码
- 史上暴强暴笑校园笑话
- 盗版用户,你们没资格指责微软
- c#数据库连接
- BI架构“双节棍”(转)
- 修改 EFI EDK2 的logo
- IP层网络数据抓包实现方法收藏
- 用Windows Live Writer写CSDN博客(改进版)
- 几款黑客常用小工具的使用说明
- HMT360:物流专用RFID手机(1维/2维条码/RFID/GPS/GSM/GPRS/WiFi/蓝牙)
- 2410 nand flash启动机制
- 草根站长盈利新四种方式
- 条码,简单报表,发票打印C#源程序(V1.0.0.4)