数据传输服务DTS(Data Transmission Service)支持将自建Oracle迁移至云原生数据仓库AnalyticDB PostgreSQL版,帮助您构建实时数仓。

前提条件

  • 自建Oracle数据库的版本为9i、10g、11g、12c、18c或19c版本。
  • 自建Oracle数据库已开启ARCHIVELOG(归档模式),设置合理的归档日志保持周期且归档日志能够被访问,详情请参见ARCHIVELOG
  • 自建Oracle数据库已开启Supplemental Logging,且已开启supplemental_log_data_pk,supplemental_log_data_ui,详情请参见Supplemental Logging
  • 已创建目标AnalyticDB PostgreSQL实例,如未创建请参见创建实例

注意事项

类型 说明
源库限制
  • 带宽要求:源库所属的服务器需具备足够出口带宽,否则将影响数据迁移速率。
  • 如自建Oracle为RAC架构,仅支持作为具有公网IP的自建库接入,不支持其他接入方式(例如ECS、专线、VPN网关、智能接入网关等)。
  • 迁移对象要求:
    • 待迁移的表需具备主键或唯一约束,且字段具有唯一性,否则可能会导致目标数据库中出现重复数据。
    • 如果您的自建Oracle版本为12c及以上,待迁移表的名称长度需不超过30个字节。
    • 如迁移对象为表级别,且需进行编辑(如表列名映射),则单次迁移任务仅支持迁移至多1000张表。当超出数量限制,任务提交后会显示请求报错,此时建议您拆分待迁移的表,分批配置任务,或者调用DTS OpenAPI配置任务。
  • 如需进行增量迁移,Redo Log、Archive Log:
    • 需开启。
    • 如为增量迁移任务,DTS要求源数据库的Redo Log、Archive Log保存24小时以上,如为全量迁移和增量迁移任务,DTS要求源数据库的Redo Log、Archive Log至少保留7天以上(您可在全量迁移完成后将Redo Log、Archive Log保存时间设置为24小时以上),否则DTS可能因无法获取Redo Log、Archive Log而导致任务失败,极端情况下甚至可能会导致数据不一致或丢失。由于您所设置的Redo Log、Archive Log保存时间低于DTS要求的时间进而导致的问题,不在DTS的SLA保障范围内。

  • 源库的操作限制:
    • 在库表结构迁移和全量迁移阶段,请勿执行库或表结构变更的DDL操作,否则数据迁移任务失败。
    • 如仅执行全量数据迁移,请勿向源实例中写入新的数据,否则会导致源和目标数据不一致。为实时保持数据一致性,建议选择结构迁移、全量数据迁移和增量数据迁移。
其他限制
  • 执行数据迁移前需评估源库和目标库的性能,同时建议业务低峰期执行数据迁移。否则全量数据迁移时DTS占用源和目标库一定读写资源,可能会导致数据库的负载上升。
  • 由于全量数据迁移会并发执行INSERT操作,导致目标数据库的表产生碎片,因此全量迁移完成后目标数据库的表存储空间会比源实例的表存储空间大。
  • DTS会尝试恢复七天之内迁移失败任务。因此业务切换至目标实例前,请务必结束或释放该任务,或者将DTS访问目标实例账号的写权限用revoke命令回收掉。避免该任务被自动恢复后,源端数据覆盖目标实例的数据。

费用说明

迁移类型 链路配置费用 公网流量费用
结构迁移和全量数据迁移 不收费。 通过公网将数据迁移出阿里云时将收费,详情请参见产品定价
增量数据迁移 收费,详情请参见产品定价

迁移类型说明

迁移类型 说明
结构迁移 DTS将源库中待迁移对象的结构定义迁移到目标AnalyticDB PostgreSQL实例。目前DTS支持的对象包括:table、index、constraint、function、sequence和view。
警告
  • 此场景属于异构数据库间的数据迁移,DTS在执行结构迁移时数据类型无法完全对应,请谨慎评估数据类型的映射关系对业务的影响,详情请参见异构数据库间的数据类型映射关系
  • 不兼容触发器。建议您删除源库的触发器,以避免因触发器而导致数据不一致的问题。详情请参见源库存在触发器时如何配置同步作业
  • 对于分区表,DTS会丢弃分区定义,您需要在目标库自行定义。
全量数据迁移 DTS将源库中待迁移对象的存量数据全部迁移至目标AnalyticDB PostgreSQL实例。
增量数据迁移 DTS在全量数据迁移的基础上轮询并捕获自建Oracle数据库产生的redo log,将自建Oracle数据库的增量更新数据实时迁移至目标AnalyticDB PostgreSQL实例。

通过增量数据迁移可以实现在自建应用不停服的情况下,平滑地完成数据迁移。

支持增量迁移的SQL操作

操作类型 SQL操作语句
DML INSERT、UPDATE、DELETE
DDL ADD COLUMN

数据类型映射关系

详情请参见异构数据库间的数据类型映射关系

准备工作

登录待迁移的Oracle数据库,创建用于采集数据的账号并授权。

说明 如您已创建包含下述权限的账号,可跳过本步骤。
数据库 结构迁移 全量迁移 增量数据迁移
自建Oracle数据库 schema的owner权限 schema的owner权限 DBA
AnalyticDB PostgreSQL实例 待迁入数据库的写权限

数据库账号创建及授权方法:

  • 自建Oracle数据库请参见CREATE USERGRANT
  • 目标AnalyticDB PostgreSQL实例的初始账号满足权限要求,创建方式,请参见创建数据库账号
    说明 您也可以填入具备RDS_SUPERUSER权限的账号,创建方法请参见用户权限管理
注意 如需迁移增量数据,且不允许授予DBA权限,您需要按照如下方法开启归档和补充日志,并为Oracle数据库账号授予更精细化的权限。

  1. 开启归档和补充日志。
    日志类型 开启步骤
    归档日志 执行如下命令,开启归档日志:
    shutdown immediate;
    startup mount;
    alter database archivelog;
    alter database open;
    archive log list;
    补充日志 按业务需求,选择开启库级别补充日志或者表级别补充日志:
    说明 开启库级别补充日志,则DTS任务运行更为稳定;开启表级别补充日志,则更节约源Oracle数据库的磁盘空间。
    • 开启库级别补充日志
      1. 打开最小补充日志:
        alter database add supplemental log data;
      2. 开启库级主键、唯一键补充日志:
        alter database add supplemental log data (primary key,unique index) columns;
    • 开启表级补充日志
      1. 打开最小补充日志:
        alter database add supplemental log data;
      2. 开启表级补充日志(两者选其一) :
        • 开启表级别主键补充日志
          alter table table_name add supplemental log data (primary key) columns;
        • 开启表级别全字段补充日志
          alter table tb_name add supplemental log data (all) columns ;
  2. 为Oracle数据库账号授予更精细化的权限。
    #创建数据库账号(以rdsdt_dtsacct为例)并进行授权
    create user rdsdt_dtsacct IDENTIFIED BY rdsdt_dtsacct;
    grant create session to rdsdt_dtsacct;
    grant connect to rdsdt_dtsacct;
    grant resource to rdsdt_dtsacct;
    grant execute on sys.dbms_logmnr to rdsdt_dtsacct;
    grant select on V_$LOGMNR_LOGS to rdsdt_dtsacct;
    grant select on  all_objects to rdsdt_dtsacct;
    grant select on  all_tab_cols to rdsdt_dtsacct;
    grant select on  dba_registry to rdsdt_dtsacct;
    grant select any table to rdsdt_dtsacct;
    grant select any transaction to rdsdt_dtsacct;
    -- v$log privileges
    grant select on v_$log to rdsdt_dtsacct;
    -- v$logfile privileges
    grant select on v_$logfile to rdsdt_dtsacct;
    -- v$archived_log privileges
    grant select on v_$archived_log to rdsdt_dtsacct;
    -- v$parameter privileges
    grant select on v_$parameter to rdsdt_dtsacct;
    -- v$database privileges
    grant select on v_$database to rdsdt_dtsacct;
    -- v$active_instances privileges
    grant select on v_$active_instances to rdsdt_dtsacct;
    -- v$instance privileges
    grant select on v_$instance to rdsdt_dtsacct;
    -- v$logmnr_contents privileges
    grant select on v_$logmnr_contents to rdsdt_dtsacct;
    -- system tables
    grant select on sys.USER$ to rdsdt_dtsacct;
    grant select on SYS.OBJ$ to rdsdt_dtsacct;
    grant select on SYS.COL$ to rdsdt_dtsacct;
    grant select on SYS.IND$ to rdsdt_dtsacct;
    grant select on SYS.ICOL$ to rdsdt_dtsacct;
    grant select on SYS.CDEF$ to rdsdt_dtsacct;
    grant select on SYS.CCOL$ to rdsdt_dtsacct;
    grant select on SYS.TABPART$ to rdsdt_dtsacct;
    grant select on SYS.TABSUBPART$ to rdsdt_dtsacct;
    grant select on SYS.TABCOMPART$ to rdsdt_dtsacct;
    #切换至PDB,创建数据库账号(以rdsdt_dtsacct为例)并进行授权
    ALTER SESSION SET container = ORCLPDB1;
    create user rdsdt_dtsacct IDENTIFIED BY rdsdt_dtsacct;
    grant create  session to rdsdt_dtsacct;
    grant connect  to rdsdt_dtsacct;
    grant resource to rdsdt_dtsacct;
    grant execute on sys.dbms_logmnr to rdsdt_dtsacct;
    grant select on  all_objects to rdsdt_dtsacct;
    grant select on  all_tab_cols to rdsdt_dtsacct;
    grant select on  dba_registry to rdsdt_dtsacct;
    grant select any table to rdsdt_dtsacct;
    grant select any transaction to rdsdt_dtsacct;
    -- v$log privileges
    grant select on v_$log to rdsdt_dtsacct;
    -- v$logfile privileges
    grant select on v_$logfile to rdsdt_dtsacct;
    -- v$archived_log privileges
    grant select on v_$archived_log to rdsdt_dtsacct;
    -- v$parameter privileges
    grant select on v_$parameter to rdsdt_dtsacct;
    -- v$database privileges
    grant select on v_$database to rdsdt_dtsacct;
    -- v$active_instances privileges
    grant select on v_$active_instances to rdsdt_dtsacct;
    -- v$instance privileges
    grant select on v_$instance to rdsdt_dtsacct;
    -- v$logmnr_contents privileges
    grant select on v_$logmnr_contents to rdsdt_dtsacct;
    grant select on sys.USER$ to rdsdt_dtsacct;
    grant select on SYS.OBJ$ to rdsdt_dtsacct;
    grant select on SYS.COL$ to rdsdt_dtsacct;
    grant select on SYS.IND$ to rdsdt_dtsacct;
    grant select on SYS.ICOL$ to rdsdt_dtsacct;
    grant select on SYS.CDEF$ to rdsdt_dtsacct;
    grant select on SYS.CCOL$ to rdsdt_dtsacct;
    grant select on SYS.TABPART$ to rdsdt_dtsacct;
    grant select on SYS.TABSUBPART$ to rdsdt_dtsacct;
    grant select on SYS.TABCOMPART$ to rdsdt_dtsacct;
    -- V$PDBS privileges
    grant select on V_$PDBS to rdsdt_dtsacct;
    
    #切换至CDB,并在如下两种方式选其一,进行账号创建并授权
    ALTER SESSION SET container = CDB$ROOT;
    方式一:创建C##开头的全局账号(以C##rdsdt_dtsacct为例)并进行授权(如使用方式一,则您需要提工单,联系DTS团队配合修改部分参数。提交工单地址,见下方。)
    create user C##rdsdt_dtsacct IDENTIFIED BY rdsdt_dtsacct;
    grant create session to C##rdsdt_dtsacct;
    grant connect to C##rdsdt_dtsacct;
    grant resource to C##rdsdt_dtsacct;
    grant select on v_$logmnr_contents to rdsdt_dtsacct;
    grant LOGMINING to C##rdsdt_dtsacct;
    grant EXECUTE_CATALOG_ROLE to C##rdsdt_dtsacct;
    grant execute on sys.dbms_logmnr to C##rdsdt_dtsacct;
    方式二:创建数据库账号(以rdsdt_dtsacct为例)并进行授权(如使用方式二,则您需修改Oracle数据库的默认参数。)
    alter session set "_ORACLE_SCRIPT"=true;
    create user rdsdt_dtsacct IDENTIFIED BY rdsdt_dtsacct;
    grant create session to rdsdt_dtsacct;
    grant connect to rdsdt_dtsacct;
    grant select on v_$logmnr_contents to rdsdt_dtsacct;
    grant LOGMINING TO rdsdt_dtsacct;
    grant EXECUTE_CATALOG_ROLE to rdsdt_dtsacct;
    grant execute on sys.dbms_logmnr to rdsdt_dtsacct;
    #创建数据库账号(以rdsdt_dtsacct为例)并进行授权
    create user rdsdt_dtsacct IDENTIFIED BY rdsdt_dtsacct;
    grant create  session to rdsdt_dtsacct;
    grant connect  to rdsdt_dtsacct;
    grant resource to rdsdt_dtsacct;
    grant select on V_$LOGMNR_LOGS to rdsdt_dtsacct;
    grant select on  all_objects to rdsdt_dtsacct;
    grant select on  all_tab_cols to rdsdt_dtsacct;
    grant select on  dba_registry to rdsdt_dtsacct;
    grant select any table to rdsdt_dtsacct;
    grant select any transaction to rdsdt_dtsacct;
    -- v$log privileges
    grant select on v_$log to rdsdt_dtsacct;
    -- v$logfile privileges
    grant select on v_$logfile to rdsdt_dtsacct;
    -- v$archived_log privileges
    grant select on v_$archived_log to rdsdt_dtsacct;
    -- v$parameter privileges
    grant select on v_$parameter to rdsdt_dtsacct;
    -- v$database privileges
    grant select on v_$database to rdsdt_dtsacct;
    -- v$active_instances privileges
    grant select on v_$active_instances to rdsdt_dtsacct;
    -- v$instance privileges
    grant select on v_$instance to rdsdt_dtsacct;
    -- v$logmnr_contents privileges
    grant select on v_$logmnr_contents to rdsdt_dtsacct;
    grant select on sys.USER$ to rdsdt_dtsacct;
    grant select on SYS.OBJ$ to rdsdt_dtsacct;
    grant select on SYS.COL$ to rdsdt_dtsacct;
    grant select on SYS.IND$ to rdsdt_dtsacct;
    grant select on SYS.ICOL$ to rdsdt_dtsacct;
    grant select on SYS.CDEF$ to rdsdt_dtsacct;
    grant select on SYS.CCOL$ to rdsdt_dtsacct;
    grant select on SYS.TABPART$ to rdsdt_dtsacct;
    grant select on SYS.TABSUBPART$ to rdsdt_dtsacct;
    grant select on SYS.TABCOMPART$ to rdsdt_dtsacct;
    grant LOGMINING TO rdsdt_dtsacct;
    grant EXECUTE_CATALOG_ROLE to rdsdt_dtsacct;
    grant execute on sys.dbms_logmnr to rdsdt_dtsacct;
    说明 当Oracle数据库为12c~19c(租户式),且切换至CBD,如需创建C##开头的全局账号,则您需要提交工单,联系DTS团队配合修改部分参数。

操作步骤

  1. 进入新版DTS迁移任务的列表页面
    说明 您也可以登录DMS数据管理服务。在顶部菜单栏中,选择传输与加工(DTS) > 数据迁移
  2. 在页面左上角,选择迁移实例所属地域。
    地域
  3. 单击创建任务,配置源库及目标库信息。
    警告 选择源和目标实例后,建议您仔细阅读页面上方显示的使用限制,以成功创建并执行迁移任务。
    源目库信息
    类别 配置 说明
    任务名称

    DTS会自动生成一个任务名称,建议配置具有业务意义的名称(无唯一性要求),便于后续识别。

    源库信息 数据库类型 选择Oracle
    接入方式 根据源库的部署位置进行选择,本文以有公网IP的自建数据库为例介绍配置流程。
    说明 当自建数据库为其他实例类型时,您还需要执行相应的准备工作,详情请参见准备工作概览
    实例地区 选择源Oracle数据库所属地域。
    主机名或IP地址 填入自建Oracle数据库的访问地址。
    端口 填入自建Oracle数据库的服务端口,默认为1521
    说明 本案例中,该服务端口需开放至公网。
    Oracle类型
    • 非RAC实例:选择该项后,您还需要填写SID信息。
    • RAC或PDB实例:选择该项后,您还需要填写ServiceName信息。
    本案例选择为非RAC实例
    数据库账号 填入源Oracle数据库的账号,权限要求请参见准备工作
    数据库密码

    填入该数据库账号对应的密码。

    目标库信息 数据库类型 选择AnalyticDB PostgreSQL
    接入方式 选择阿里云实例
    实例地区 选择目标AnalyticDB PostgreSQL实例所属地域。
    实例ID 选择目标AnalyticDB PostgreSQL实例ID。
    数据库名称 填入目标AnalyticDB PostgreSQL实例中迁移对象所属数据库的名称。
    数据库账号 填入目标AnalyticDB PostgreSQL实例的数据库账号,权限要求请参见准备工作
    数据库密码

    填入该数据库账号对应的密码。

  4. 如果您的自建数据库具备白名单安全设置,您需要复制弹跳框中的DTS服务器IP地址,并加入自建数据库的白名单安全设置中。然后单击测试连接以进入下一步
  5. 配置任务对象及高级配置。
    • 基础配置基础配置
      配置 说明
      任务步骤
      • 如果只需要进行全量迁移,请同时勾选库表结构迁移全量迁移
      • 如果需要进行不停机迁移,请同时勾选库表结构迁移全量迁移增量迁移
      说明 如果未选择增量迁移,为保障数据一致性,数据迁移期间请勿在源实例中写入新的数据。
      目标已存在表的处理模式
      • 预检查并报错拦截:检查目标数据库中是否有同名的表。如果目标数据库中没有同名的表,则通过该检查项目;如果目标数据库中有同名的表,则在预检查阶段提示错误,数据迁移任务不会被启动。
        说明 如果目标库中同名的表不方便删除或重命名,您可以更改该表在目标库中的名称,请参见库表列名映射
      • 忽略报错并继续执行:跳过目标数据库中是否有同名表的检查项。
        警告 选择为忽略报错并继续执行,可能导致数据不一致,给业务带来风险,例如:
        • 表结构一致的情况下,在目标库遇到与源库主键的值相同的记录,则会保留目标库中的该条记录,即源库中的该条记录不会迁移至目标库中。
        • 表结构不一致的情况下,可能导致只能迁移部分列的数据或迁移失败。
      迁移对象

      迁移对象框中单击待迁移的对象,然后单击向右小箭头将其移动到已选择对象框。

      说明 迁移对象选择的粒度为库、表、列。若选择的迁移对象为表或列,其他对象(如视图、触发器、存储过程)不会被迁移至目标库。
      映射名称更改
      • 如需更改单个迁移对象在目标实例中的名称,请在右击已选择对象中的迁移对象,设置方式,请参见库表列名单个映射
      • 如需批量更改迁移对象在目标实例中的名称,请单击已选择对象方框右上方的批量编辑设置方式,请参见库表列名批量映射
      说明 如果使用了对象名映射功能,可能会导致依赖这个对象的其他对象迁移失败。
      过滤待迁移数据

      支持设置条件过滤数据,详情请参见通过SQL条件过滤任务数据

      增量迁移的SQL操作 选择增量迁移DDL和DML操作,请右击已选择对象中的迁移对象,在弹跳框中选择所需增量迁移的DDL和DML操作。支持的操作,请参见支持增量迁移的SQL操作
    • 高级配置高级配置(无dmsddl、又库表字段)
      配置 说明
      设置告警
      是否设置告警,当迁移失败或延迟超过阈值后,将通知告警联系人。
      • 不设置:不设置告警。
      • 设置:设置告警,您还需要设置告警阈值和告警联系人。
      源、目标库无法连接重试时间
      默认重试120分钟,您也可以在取值范围(10~1440分钟)内自定义重试时间,建议设置30分钟以上。如果DTS在设置的时间内重新连接上源、目标库,迁移任务将自动恢复。否则,迁移任务将失败。
      说明
      • 针对同源或者同目标的多个DTS实例,如DTS实例A和DTS实例B,设置网络重试时间时A设置30分钟,B设置60分钟,则重试时间以低的30分钟为准。
      • 由于连接重试期间,DTS将收取任务运行费用,建议您根据业务需要自定义重试时间,或者在源和目标库实例释放后尽快释放DTS实例。
  6. 设置待迁移的表在目标AnalyticDB PostgreSQL中的主键列和分布键信息。
    adbpg设置主键和分布键
  7. 上述配置完成后,单击页面右下角的预检查并启动
    说明
    • 在迁移任务正式启动之前,会先进行预检查。只有预检查通过后,才能成功启动迁移任务。
    • 如果预检查失败,单击具体检查项后的提示,查看失败详情。
      • 您可以根据提示修复后重新进行预检查。
      • 如无需修复告警检测项,您也可以选择确认屏蔽忽略告警项并重新进行预检查,跳过告警检测项重新进行预检查。
  8. 预检查通过率显示为100%时,单击下一步购买
  9. 配置完成后,阅读并勾选《数据传输(按量付费)服务条款》
  10. 单击购买并启动,迁移任务正式开始,您可在任务列表查看具体进度。