1、BI概述

来源:互联网 发布:mac上的翻墙工具 编辑:程序博客网 时间:2024/06/06 00:03

BI概述

 

1          什么是BI

BI(Business Intelligence,商业智能),通过大规模的采集相关数据,然后进行清洗、提取并加载到数据仓库中,再进行多维建模与数据挖掘分析,最终来辅助商业决策的制定。

 

2          BI相关名词

2.1         OLTP与OLAP

2.1.1    OLTP(onlinetransaction process,在线事务处理系统),是基于事务进行处理的系统,该系统的主要功能是进行业务处理,保证公司业务的正常进行,比如销售系统、财务系统等等

2.1.2    OLAP(onlineanalysis process,在线分析系统),是基于数据的分析系统,该系统的主要功能是对数据进行分析,然后为公司的决策提供数据支撑,简单的比如各种报表系统等等

 

2.2         原始数据与数据源

2.2.1    原始数据:未经处理过的数据,如商品记录、销售记录等

2.2.2    数据源:数据源包括但不限于OLTP系统产生的数据,它是各种进入OLAP系统前的数据的统称

 

2.3         ETL与SSIS

2.3.1    ETL(extract-transform-load,提取-转换-加载),ETL是数据源到OLAP系统的一个过程,它将数据进行提取、转换清洗、最终加载到目标(数据仓库)的一个过程

2.3.2    SSIS(SQL SERVERINTEGRATION SERVICE,微软集成服务),是微软提供的ETL工具,可以通过该工具进行数据的提取、转换清洗、然后加载到目标

 

2.4         DW、维度与事实

2.4.1    DW(datawarehouse,数据仓库),是OLAP系统的基础,也是ETL的目标,它存储了分析所需的所有数据,它由维度表和事实表组成

2.4.2    维度(dimension),维度是对事实的描述,比如“小明2009年1月1日购买了一个iphone,花了5000元”,这里我们可以简单的提取出三个维度,分别是人、时间、商品,三个维度的值分别是小明、2009年1月1日、iphone

2.4.3    事实(fact),是一个度量,上面的例子中“一个”iphone和“5000元”就称为事实

 

2.5         CUBE与SSAS

2.5.1    CUBE(数据立方体),我们称为多维数据集,它由事实与维度构成,多维数据集从多个角度(或者说维度)上对事实进行描述,以便我们可以从多个维度对事实进行观察(也称之为透视)

2.5.2    SSAS(SQL SERVERANALYSIS SERVICE,微软分析服务),是微软提供的用于建立多维数据集和进行数据挖掘的工具。它以数据仓库为基础,可以进行多维模型和数据挖掘模型的建立。

 

2.6         数据透视、MDX与SSRS

2.6.1    数据透视,对多维数据的查看我们称为数据透视

2.6.2    MDX(Multi DimensionalExpressions,多维表达式),是用于对CUBE数据进行查询的表达式

2.6.3    SSRS(SQL SERVERREPORT SERVICE,微软报表服务),是微软提供的用于对多维数据进行展示的工具

 

3          BI流程

 

 

 

0 0