powerCenter开发流程

来源:互联网 发布:淘宝上买的刀怎么开刃 编辑:程序博客网 时间:2024/05/20 16:42

    Informatica是基于元数据驱动的,所有的元数据都保存在Repository(知识库)中,该知识库可以创建在所有主流数据库当中,充分体现了它元数据的开放性。

    Repository Server用来管理所有客户端以及Informatica Server跟Repository的交互, 并且一个Repository Server可以管理多个Repository,而Repository Server可为每个Repository分配一个Repository Agent来处理所对有元数据操作的响应。

    Informatica Server是实际处理ETL任务的后台服务,它是基于内存运行、高效的ETL服务,不需要产生任何的代码,每次执行任务之前都会从Repository中读取最新的ETL规则。

    Informatica的客户端提供了无编码、完全图形化的设计和管理调度界面,可实现快速开发和部署。  

    一个基本的ETL任务设计和部署的大致步骤如下:


   (1) 使用Designer客户端,获取源数据表的元数据。


  (2) 使用Designer客户端,获取目标数据表的元数据。


  (3) 使用Designer客户端,设计一个Mapping,其中就是源->目标的ETL规则。



  (4) 使用Workflow Manager客户端,针对上面实现的Mapping,实例化为一个Session,为其指定实际的数据源、目标连接,以及其他属性。


  (5) 使用Workflow Manager客户端,创建一个Workflow,其中包含上述的Session以及其他的Task,在Workflow中可实现复杂的流程控制。


  (6) 运行上述Workflow,使用Workflow Monitor客户端,监测最终的任务运行结果。


   ETL工具最近用的是Informatica PowerCenter 8.1.1。总体来说,Informaitca有四个开发管理组件,初学者可能不知道如何下手,所以关键先要了解PowerCenter的开发流程。
  
0 0
原创粉丝点击