SAP BW中的数据挖掘

来源：互联网发布：ubuntu如何安装vim 编辑：程序博客网时间：2024/05/21 22:53

SAP BW中的数据挖掘

SAP BW 全称 Business Information Warehouse，处于SAP Netweaver整体架构当中的Information Integration这一层，与之并列的还有主数据管理（Master Data Management）和知识管理（Knowledge Management），这一块所谓的Information Integration，就是从企业的底层数据到最高表现层之间的一层分析的部分。但是它又不完全是在进行分析，因为这一层本身，也包含了数据仓库（Data Warehousing），商务智能平台（BI Platform），商务智能表现（BI Suite）三个细的层次。

BW的最底层，Data Warehousing，这一层里面主要完成：ETL流程（Extraction，Transformation，Loading），数据仓库管理和商业建模三大工作。其中的ETL流程，通过各种途径和方法，把种类繁多的元数据加载后进行处理，清洗，从而转化为系统所需的数据，加载到数据仓库中，便于以后某些的需要。ETL是BW中既基础又关键的一步。之后的数据仓库管理，则将这些数据根据种类，划分成主数据，PSA，ODS Objects等不同的类型，加以管理。商业建模则是数据仓库中比较难很快掌握的内容，这块内容，基本上是和客户的需求紧密联系，并根据需求建立合适高效的模型。

BI Platform位于第二层，是BW中偏重逻辑处理的一部分，它把数据仓库的数据，按照需求进行各种计算，规划和进一步的细致的处理，这一层更多地是对数据进行统一的处理和基本的封装。在这一层里面，完成的内容有business calculations, planning and forecasts, exception scanning, alerting, query pre-calculation, caching, background printing和data mining等。主要的产品有OLAP，metadata management，data mining，Analysis process designer and BPS（Business Planning and Simulation）。
BI Suite是第三大部分，它主要是对BI Platform的结果进行再加工，主要的工作就是对BI Platform出来的内容加入一些商务智能的要素，比如Query的多样化选择，自动报表的生成，多维度的数据分析，信息发布，公开的面向第三方的分析接口和具体的Web页面体现。有了以这一部分，sap的BW才显得更为更为专业。

通过上面对SAP BW简单的概述，我们可以知道数据挖掘这部分属于BI Platform，因此在进行数据挖掘工作之前就要先在数据仓库中抽取到我们需要的数据，下面就从数据建立开始来说明如何完成数据挖掘工作。

流程描述如下：

1、先建InfoArea，相当于是一个区域。目的是告诉SAP，我在BW系统中圈定一片地方使用。

2、再建InfoObject Catalogs 就是规划区域。相当是把这个区域规划几块，并且规划这几部分是用来做什么的。通常来说我们会规划两种，一种：characteristics ；一种：key figures 。所以就有两目录（相当两个类型房间）:一种CHAR类型，一种KEY FIGURE类型。

3、建立InfoObject，相当于用来存放物品的小箱子，SAP BW中InfoObject通常有两类，characteristics和key figures。

4、分别建立characteristics和key figures类型的InfoObject：前者是用于放char类型的东西，此类物品多指属性等，比如客户号，客户名字，区域代码等等；后者主要是放key figus类型的东西，此类物品多是可量化的东西，比如销售量，金额等。

5、开始数据挖掘。如果是为了ETL之后的步骤就不同了，但是本文只是针对数据挖掘。因此通过建立characteristics类型的InfoObject，我们已经有了特性表，便可以进行挖掘工作了。整体步骤如下，在后面的叙述中将有截图等具体操作展示。

a) 在数据仓库中收集数据，在本文中我们将数据放在InfoObject中，也就是说InfoObject的内容就是我们要分析的数据。

b) 创建数据挖掘模型，此处的挖掘模型要根据收集的数据以及我们挖掘的目的来选择。

c) 设置模型参数，这些参数就是用于数据挖掘的值。

d) 对挖掘模型进行训练。

具体的截图操作如下：

1. 用800登录SAP后，tcode输入rsa1进入数据仓库工作台：建模位置。（tcode在下图有标注）

tcode

在左侧目录下单击“信息提供者”后，右键单击右侧页面的“信息提供者”，选择“创建信息范围…”

3. 输入InfoArea的名称及描述

点击即可看到新建的InfoArea在此页面的最下端。

4. 创建InfoObject Catalogs

点击左侧一排按钮中的并找到刚才新建的InfoArea。右键选择Create InfoObject catalog…

5. 输入InfoObject Catalog名字及描述后如下图所示。

6. 点击进入下图。

点击检查新建的InfoObject Catalog是否有效，有效后点击激活此新建的InfoObject Catalog。可在右侧看到实际状态。

上面建的catalog是为char类型的InfoObject建的，下面为key figure类型的InfoObject建立catalog。方法同上。

两个catalog都激活后即可看到InfoArea下面有新建的项目。

7. 创建characteristics的InfoObject

选择InfoObject Catalog-SD:characteristics，并右键单击选择Create InfoObject….

创建属性

所有属性建好后，如下图所示

8. 填充数据

选中特性表，右键选择“维护主数据”

点击即可编辑该表的数据，数据录入后结果如下图

以上建好需要的特征表，并录入了待分析的数据，下面开始数据挖掘工作。

在tcode中输入rsdmwb,可以看到SAP的数据挖掘方法。具体的算法思路在此不赘述。

1. 现在继续前面的工作，开始数据挖掘。

首先，创建数据挖掘模型，此处用聚类算法

在弹出的对话框中输入模型名称等

2. 系统进入创建（修改）数据模型的工作界面。

对数据模型设计完成之后，该模型还不可以用，需要进行训练。

3. 通过事务代码rsanwb进入分析进程设计器工作界面

右键点击创建

4. 创建数据源

设置数据源属性，该数据源就是我们之前所选择的表

5. 可以通过右键选择“显示节点数据”和“显示基本统计”查看选择的表数据

6. 创建筛选器

将拖入工作区进行设置，如本文是对出生年月进行筛选。设置为1942至2000年间的。

7. 创建目标节点，注意此处是选择数据目标中的“培训簇模型”

8. 设置目标节点

将目标节点的模型选择为刚刚建立需要训练的聚类模型。

并用箭头连接前面的筛选器

9. 设置箭头属性

将目标结构与源结构一一对应即可

10. 完成

检查无问题后激活，激活后点击执行按钮，开始训练模型

11. 查看结果

可通过查看

进入之前建立的模型后

点击可看到结果