数据仓库数据挖掘——商业智能概述

来源:互联网 发布:沈阳淘宝网店推广培训 编辑:程序博客网 时间:2024/04/30 16:58


商业智能(简称:BI)这一概念最早是有Gartner公司于1996年提出   

               定义:是对商业信息的搜集、管理和分析过程,目的是使企业的各级决策者获得知识或洞察力,促使他们做出对企业更有利的决策

               

               从作用上说:BI好比数据炼油厂

               从形态上说:BI实际上是帮助企业提高决策能力和云因更努力的概念、方法、过程以及软件的集合。

               从技术上说:主要包括数据仓库、联机分析处理、数据挖掘三大技术,还包括数据展现、绩效管理、指标管理以及躯体用于统计和分析商业数据的先进的信息技术

               

               商业智能功能:客户关系管理、经营分析、战略决策支持、绩效管理、产品创新和推广、异常处理

               当前典型应用:

                                      一、零售业:预测、营销、产品销售模式

                                      二、保险业:理赔分析、顾客利润率分析、客户价值分析、客户划分、风险分析

                                      三、金融和证券业:顾客利润率分析、信用管理

                                      四、制造业:市场营销、预测、采购分析

                                      五、电信业商业智能应用:客户管理、客户发展分析、业务量分析、收入分析、营销管理分析、市场竞争分析、服务质量分析、大客户分析、欠费和动态

                                                                                      防欺诈行为分析、代理商及渠道分析。

               未来CIO(Chief Information Officer)首席信息官们最先考虑实施的信息化项目,排在首位的是商业智能(37.2%),位列信息存储和灾难恢复系统

          (33.5%)、客户关系管理(29.8%)和网络安全系统(28.7%)之前。

               商业智能要向平台化发展:

                                      商业智能(BI)要向平台化发展

                                      将外部信息以BI服务方式提供,正和到公司内部BI应用程序中

                                      加强对非结构话数据的管理

                                      提高实时性

                                      将群众决策与现有的BI相结合

               BI开发过程:

               

                             数据-信息-知识-决策

               数据仓库技术:

                               定义:是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持

                                           管理决策(Decision Making Support)。

                               组成:数据仓库系统有数据仓库(DW)、仓库管理和分析工具三部分组成。

                               模型:大多数数据仓库都采用“星型模型”。

                                           星型模型是由“事实表”(大表)以及多个“维表”(小表)所组成

                                           事实表:存放大量关于企业的事实数据(数量数据)

                                           维表:存放描述性数据,维表是围绕事实表建立的较小的表

                                           除星型模型外,常见的数据仓库模型还有雪花、星网、3NF等

                                           

                                           数据集市:

                                                           根据数据的来源不同,数据集市可分为:从属数据集市、独立数据集市

                                           

                               过程:ETL

                                           数据仓库的数据获取需要经过抽取(Extration)、转换(Transform)、装载(Load)三个过程,即ETL过程

                                           ETL占有数据仓库开发过程的70%工作量

               联机分析处理(OLAP)技术:

                               联机分析处理又称多为分析,OLAP基本思想是从多方面和多角度以多维的形式来观察企业的状态、了解企业的变化、辅助决策。

                               技术核心:“维”这个概念,OLAP可以说是多为数据分析工具的集合

                               多维数据模型的存储形式:MOLAP(multi-dimensional OLAP,多维OLAP)、ROLAP(relation OLAP,关系OLAP)、WOLAP(Web OLAP)、

                                                                               HOLAP(hybrid OLAP,混合OLAP)


                              OLAP的多维分析:
                              在多维结构上进行切片、切块、钻取等操作。OLAP的典型应用,通过商业活动变化的查询发现问题,经过追踪查询找出问题出现的原因,达到辅助决策的作

                              用。


                              数据挖掘:
                              数据挖掘使用聚类(如神经网络聚类)、分类(如决策树分类)、预测、关联分析等带有探索性的建模功能。任务在于从海量数据中寻找不平常的且有用的商

                              业运作模型。
                              数据挖掘的任务包括关联分析、时序模式、聚类、分类、预测等。其中包含的典型算法有Aporior关联分析算法、 K-Mean聚类算法、ID3决策树分类算法、贝叶

                              斯分类算法等。


1 0
原创粉丝点击