ODI学习笔记

来源:互联网 发布:学软装要会什么软件 编辑:程序博客网 时间:2024/05/26 22:05

ETL (数据仓库技术)

ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

什么是资料库

ODI资料库可安装在任何支持ANSIISO89的数据库中。资料库分两种:

1、MasterRepository,保存企业所有IT资源的Topology,保存项目和数据模型的安全信息、版本信息,供ODI图形模块等使用。通常创建一个即可。MasterRepository要尽可能独立存储,单独的Instance,或单独的Schema。

2、WorkRepository,保存项目和数据模型,供ODI图形模块等使用。可创建多个。一个WorkRepository只能连接一个 MasterRepository。一个Schema只能存储一个WorkRepository,不过MasterRepository倒可与其安装在同 一Schema。

Oracle实验室已验证通过的数据库有:HypersonicSQL、IBMDB2UDB、IBMDB2/400、Informix、 MicrosoftSQLServer、Oracle、SybaseASAnywhere、SybaseASEnterprise、SybaseASIQ 等。

什么是Topology

TopologyManager主要用来管理下面5类任务,并将信息存储在主资料库中,供所有模块共享使用。

1、物理体系结构,定义各种技术及其数据服务器、物理架构、物理代理。

2、逻辑体系结构,定义各种技术及其关联的逻辑架构、逻辑代理。

3、上下文,用来连接物理架构和逻辑架构。

4、语言,不同技术所能采用的语言特性。

5、资料库,包含主资料库及其附属的工作资料库。

原创粉丝点击