DRDS到ODPS数据迁移指南

来源:互联网 发布:java游戏培训 编辑:程序博客网 时间:2024/06/05 14:27

点击查看全文


数据同步节点任务是阿里云大数据平台对外提供的稳定高效、弹性伸缩的数据同步云服务。DRDS到ODPS数据迁移采用CDP的方式同步数据。

开始DRDS到ODPS数据迁移

1. 创建源和目标库表结构

初次在同步数据前需要在源库和目标库创建好相应的表结构。

2.  配置数据源

2.1源数据源配置-DRDS

 
 1.登录Base管控台,单击顶部菜单栏中的项目管理,并选择相应的项目。

f1809906b4e7675c2e2cca4ef19a655bb600365b

2.进入数据源配置,单击新增数据源。


bde2d0fcf4f93d2de8fd566c851d132aa58a3566
3. 在新建数据源弹出框中,选择数据源类型为DRDS;

565a63c6c4d37b4da4b75cc4ed7c0ba726abf437

配置项说明(上图中带*的都必须输入相应的信息):

l  数据源名称:由英文字母、数字、下划线组成且需以字符或下划线开头,长度不超过60个字符。

l  数据源描述:对数据源进行简单描述,不得超过80个字符。

l  数据源类型:当前选择的数据源类型DRDS。

l  jdbcUrl:JDBC连接信息,格式为:jdbc://mysql://serverIP:Port/database。

l  用户名/密码:DRDS库对应的用户名和密码。

4. 单击测试连通性

5. 测试连通性通过后,单击确定

 

2.2目标数据源配置-ODPS


1.登录Base管控台,单击顶部菜单栏中的项目管理,并选择相应的项目。

308b62f5d0286a636c54b82b0032a47c033ac7f8
2. 进入数据源配置,单击新增数据源

 9770f8da9c1da60a61795ef930465c730466d334

3. 在新建数据源弹出框中,选择数据源类型为 ODPS。

0de746652b8d4b6f70c98952c5e18a066e728460

配置项说明(上图中带*的都必须输入相应的信息):

l  数据源名称:由英文字母、数字、下划线组成且需以字符或下划线开头,长度不超过60个字符。

l  数据源描述:对数据源进行简单描述,不得超过80个字符。

l  数据源类型:当前选择的数据源类型ODPS。

l  ODPS Endpoint:默认只读。从系统配置中自动读取。

l  ODPS项目名称与计算引擎配置中的ODPS项目名称相同。

l  AccessID/AceessKey访问密钥 AccessKeyAK 相当于登录密码。

4. 单击测试连通性。

5. 测试连通性通过后,单击确定。

3.创建同步任务

1.   新建数据同步节点,如下图所示:

f6ce9cad3a84c0fc050823e3a9d029e40b3cf678


  新建任务配置项说明(*项都需要输入或选择):

  名称起一个好识别的名称,符合命名规则即可;

  任务类型为工作流任务可一次性调度或周期调度,节点任务只能是周期调度;

  类型:选择数据同步;

  选择目录:根据任务开发,选择您所使用的文件夹中要同步的任务。

 

2.      
选择数据来源和目标

0b395783cd7406cf94e46dee2ad4e241255611a3

其中:数据来源指的是数据源,数据流向指的是目标数据源。

3. 字段配置


当源表和目标表结构一致时源和目标表字段默认是一一对应的关系,不用做任何设置。如下图所示:

d9ffa056f53b36c2020701859395cf69e4daffd8

4.抽取控制和加载控制

    抽取控制

  全量迁移数据过滤为空,增量同步时需要增加时间过滤条件。

    加载控制

   清理规则需要根据数据要求配置,默认是写入前清理已有数据。

写入前清理已有数据写入前保留已有数据

 5.流量与出错控制

 作业速率上限是指数据同步作业可能达到的最高速率,其最终实际速率受网络环境、数据库配置等影响。

4.任务调度


   新建任务创建好保存后,



点击查看全文