DRDS到ODPS数据迁移指南

数据同步节点任务是阿里云大数据平台对外提供的稳定高效、弹性伸缩的数据同步云服务。DRDS到ODPS数据迁移采用CDP的方式同步数据。

开始DRDS到ODPS数据迁移

1. 创建源和目标库表结构

初次在同步数据前需要在源库和目标库创建好相应的表结构。

2.  配置数据源

2.1源数据源配置-DRDS

 
 1.登录Base管控台,单击顶部菜单栏中的项目管理,并选择相应的项目。

2.进入数据源配置,单击新增数据源。


3. 在新建数据源弹出框中,选择数据源类型为DRDS;


配置项说明(上图中带*的都必须输入相应的信息):

l  数据源名称:由英文字母、数字、下划线组成且需以字符或下划线开头,长度不超过60个字符。

l  数据源描述:对数据源进行简单描述,不得超过80个字符。

l  数据源类型:当前选择的数据源类型DRDS。

l  jdbcUrl:JDBC连接信息,格式为:jdbc://mysql://serverIP:Port/database。

l  用户名/密码:DRDS库对应的用户名和密码。

4. 单击测试连通性

5. 测试连通性通过后,单击确定

 

2.2目标数据源配置-ODPS

1.登录Base管控台,单击顶部菜单栏中的项目管理,并选择相应的项目。


2. 进入数据源配置,单击新增数据源

 

3. 在新建数据源弹出框中,选择数据源类型为 ODPS。


配置项说明(上图中带*的都必须输入相应的信息):

l  数据源名称:由英文字母、数字、下划线组成且需以字符或下划线开头,长度不超过60个字符。

l  数据源描述:对数据源进行简单描述,不得超过80个字符。

l  数据源类型:当前选择的数据源类型ODPS。

l  ODPS Endpoint:默认只读。从系统配置中自动读取。

l  ODPS项目名称:与计算引擎配置中的ODPS项目名称相同。

l  AccessID/AceessKey访问密钥 AccessKey(AK) 相当于登录密码。

4. 单击测试连通性。

5. 测试连通性通过后,单击确定。

3.创建同步任务

1.   新建数据同步节点,如下图所示:

  新建任务配置项说明(带*项都需要输入或选择):

  名称:
起一个好识别的名称,符合命名规则即可;

  任务类型为工作流任务可一次性调度或周期调度,节点任务只能是周期调度;

  类型:选择数据同步;

  选择目录:根据任务开发,选择您所使用的文件夹中要同步的任务。

 

2.     

选择数据来源和目标

其中:数据来源指的是数据源,数据流向指的是目标数据源。

3. 字段配置

当源表和目标表结构一致时源和目标表字段默认是一一对应的关系,不用做任何设置。如下图所示:

4.抽取控制和加载控制

•   
抽取控制

  全量迁移数据过滤为空,增量同步时需要增加时间过滤条件。

•   
加载控制

   清理规则需要根据数据要求配置,默认是写入前清理已有数据。

写入前清理已有数据写入前保留已有数据

 5.流量与出错控制

 作业速率上限是指数据同步作业可能达到的最高速率,其最终实际速率受网络环境、数据库配置等影响。

4.任务调度

   新建任务创建好保存后,会默认产生一个周期调度任务,默认的时间是每天晚上00:00执行。客户也可根据实际的同步场景进行时间调整配置。下图所示是默认的配置:

 

默认的依赖属性:

  

  依赖属性中可以配置任务的上游依赖,表示即使当前任务的实例已经到定时时间,也必须等待上游任务的实例运行完毕才会触发运行。

  如果没有配置上游任务,则当前任务默认由项目本身触发运行,故在调度系统中,该任务的上游默认为
project_start 任务。每一个项目中默认会创建一个 project_start 任务作为根任务。

5.运行及日志排查

5.1测试运行

1.单击工作流页面中的测试运行按钮,如下图所示:

 2. 根据跳转页面的提示,单击确认运行

3.单击前往运维中心查看任务运行状态和运行日志,如下图所示:


说明:

测试运行是手动触发任务执行,任务调度的时间到了,就自动运行,无视实例的上游依赖关系。

若测试运行只需要运行一次,测试运行完成后需要在调度状态前打勾暂停掉此任务。

 

 

时间: 2024-09-11 01:54:16

DRDS到ODPS数据迁移指南的相关文章

ODPS数据迁移指南

1. 背景调研 1.1 ODPS源与目的集群 调研项 内容 ODPS源集群版本 ODPS目的集群版本 ODPS源与目的是否在一个集群/可使用相同账号 ODPS源集群AccessKeyId ODPS源集群AccessKeySecret ODPS目的集群AccessKeyId ODPS目的集群AccessKeyIdSecret 1.2 预迁移数据统计 所属Project 表名 大小 是否要迁移增量 Project1 Table1 Desc查看表大小 2. 工具选择与方案确定 目前有四种方式可用于OD

ODPS到ODPS数据迁移指南

1.工具选择与方案确定 目前,有两种方式可用于专有云环境下的从MaxCompute到MaxCompute整体数据迁移. (1)使用DataX工具进行迁移,迁移所需的作业配置文件及运行脚本,可用DataX批量配置工具来生成: (2)通过大数据开发套件(DataIDE)- 数据开发进行迁移,这种方式可选择界面向导模式逐步配置,操作简单容易上手: 2.具体实施 2.1使用DataX工具  这种场景需要先从源MaxCompute中导出元数据DDL,在目标MaxCompute中初始化表,然后借助DataX

DRDS向ADS数据迁移指南

1 CDP简介 数据同步节点任务是阿里云大数据平台对外提供的稳定高效.弹性伸缩的数据同步云服务.用户利用数据同步节点可以轻松地实现DRDS到ADS的数据同步.使用CDP将DRDS数据同步至ADS前需要在目标端创建相应的表结构,同步数据的具体操作如下: 2配置数据源 2.1增加DRDS数据源 1.登录Base管控台,单击顶部菜单栏中的项目管理,并选择相应的项目. 2. 进入数据源配置,单击新增数据源. 3. 在新建数据源弹出框中,选择数据源类型为 DRDS. 4. 配置 DRDS 数据源的各个信息

ODPS到ADS数据迁移指南

数据同步节点任务是阿里云大数据平台对外提供的稳定高效.弹性伸缩的数据同步云服务.ODPS到ADS数据迁移采用CDP的方式同步数据. 1.     创建源和目标库表结构 初次在同步数据前需要在源库和目标库创建好相应的表结构. 2.     配置数据源 2.1源数据源配置-ODPS 1.登录Base管控台,单击顶部菜单栏中的项目管理,并选择相应的项目.   2.进入数据源配置,单击新增数据源. 3. 在新建数据源弹出框中,选择数据源类型为ODPS;   配置项说明(上图中带*的都必须

MaxCompute跨Region数据迁移指导手册

概述 大数据计算服务(MaxCompute,原名ODPS)是一种快速.完全托管的 GB/TB/PB 级数据仓库解决方案.MaxCompute 为用户提供了完善的数据导入导出方案以及多种经典的分布式计算模型,能够更快速的解决海量数据计算问题,有效降低企业成本,并保障数据安全. 随着MaxCompute的多Region部署,一些用户可能需要把MaxCompute的应用从老的Region上迁移到和自己的业务系统相同的Region上来,从而在数据传输上获得更好的性能并减少数据传输费用.本指导手册主要聚焦

PgSQL · 最佳实践 · 云上的数据迁移

title: PgSQL · 最佳实践 · 云上的数据迁移 author: 义从 背景 大多数使用云产品作为 IT 解决方案的客户同时使用多款云产品是一个普遍现象. 用户在多款云产品之间转移数据成为一个基础的需求. 例如 1. 用户把线下机房中的 Oracle 数据库中的数据 迁移到云上 RDS PPAS 中. 2. 使用 RDS MYSQL 做为数据库支撑交易型业务场景,同时使用 HybridDB for PostgreSQL 作数据仓库解决方案. 3. 把 ODPS 中的大量数据导入到 Hy

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具

背景 08年左右,阿里巴巴开始尝试MySQL的相关研究,并开发了基于MySQL分库分表技术的相关产品,Cobar/TDDL(目前为阿里云DRDS产品),解决了单机Oracle无法满足的扩展性问题,当时也掀起一股去IOE项目的浪潮,愚公这项目因此而诞生,其要解决的目标就是帮助用户完成从Oracle数据迁移到MySQL上,完成去IOE的第一步. 项目介绍 名称: yugong 译意: 愚公移山 语言: 纯java开发 定位: 数据库迁移 (目前主要支持oracle -> mysql/DRDS) 项目

CRP升级到RDC,迁移指南

有问题,或者疑问,请使用钉钉扫码联系. 我已经了解RDC,可以直接跳转至迁移指南 开发同学,您好!感谢两年来在CRP上的陪伴.为了给您提供更好的服务,我们推出了企业级一站式研发协同平台RDC.RDC基于阿里巴巴十余年的内部研发协同平台经验,结合阿里云生态,为您提供项目管理.代码托管.构建发布和系统运维,等端到端的研发协同体验. 在提供CRP所有能力的前提下,RDC在多个方面进行了增强,比如: 作为阿里云的一方产品,RDC提供更好的SLA. 提供构建缓存,加速您的构建. 实验室提供包括单元测试.集

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

免费开通大数据服务:https://www.aliyun.com/product/odps  想用阿里云数加·大数据计算服务(MaxCompute),但是现在数据还在hadoop上,怎么办? 大数据计算服务(MaxCompute) 快速.完全托管的TB/PB级数据仓库解决方案,向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全. 了解更多   别烦恼,跟着我们走,来一次MaxCompute零基础数据迁移之旅-Let'