数据仓库的开发流程

来源:互联网 发布:摇钱树软件 编辑:程序博客网 时间:2024/06/05 06:44
数据仓库系统是一种解决问题的过程,而不是一个可以买到的现成产品。不同企业会有不同的数据仓库。企业人员往往不懂如何建立和利用数据仓库,发挥其决策支持的作用,而数据仓库公司人员又不懂业务,不知道建立哪些决策主题,从数据源中抽取哪些数据。这需要双方互相沟通,共同协商开发数据仓库,因此是一个不断往复前进的过程。开发数据仓库的流程包括以下几步:

启动工程 
建立开发数据仓库工程的目标及制定工程计划。计划包括数据范围、提供者、技术设备、资源、技能、组员培训、责任、方式方法、工程跟踪及详细工程调度等。 

建立技术环境
选择实现数据仓库的软硬件资源,包括开发平台、DBMS、网络通信、开发工具、终端访问工具及建立服务水平目标(关于可用性、装载、维护及查询性能)等。 

确定主题进行数据建模
根据决策需求确定主题,选择数据源,对数据仓库的数据组织进行逻辑结构设计。 

设计数据仓库中的数据库 
基于用户的需求,着重于某个主题,开发数据仓库中数据的物理存储结构,即设计多维数据结构的事实表和维表。 

数据转换程序 
实现从源系统中抽取数据、清理数据、一致性格式化数据、综合数据、装载数据等过程的设计和编码。 

管理元数据
定义元数据,即表示、定义数据的意义及系统各组成部件之间的关系。元数据包括关键字、属性、数据描述、物理数据结构、源数据结构、映射及转换规则、综合算法、代码、缺省值、安全要求、变化及数据时限等。 

开发用户决策的数据分析工具
建立结构化的决策支持查询,实现和使用数据仓库的数据分析工具,包括优化查询工具、统计分析工具、C/S工具、OLAP工具及数据采掘工具等,通过分析工具实现决策支持需求。数据采掘是帮助用户发现数据内部未知的、潜在的关系,以及他们之间存在的趋向。因此,数据采掘在决策支持、市场策略和金融预测等方面都有广泛的应用。 

管理数据仓库环境
数据仓库必须像其他系统一样进行管理,包括质量检测、管理决策支持工具及应用程序,并定期进行数据更新,使数据仓库正常运行。

原创粉丝点击