本文介绍如何使用数据传输服务DTS(Data Transmission Service),将自建PostgreSQL增量迁移至MyBase PostgreSQL。DTS支持结构迁移、全量数据迁移和增量数据迁移,同时使用这三种迁移类型可以实现在自建应用不停服的情况下,平滑地完成迁移上云。
前提条件
- 已创建源数据库自建PostgreSQL和目标实例MyBase PostgreSQL。目标实例RDS PostgreSQL的创建方式,详情请参见创建MyBase PostgreSQL实例(已停止新购)。说明 为保障兼容性,建议目标实例的数据库版本与自建PostgreSQL的数据库版本相同。
- 目标实例的可用存储空间须大于自建PostgreSQL数据库占用的存储空间。
注意事项
- 在库表结构迁移过程中,DTS会将源数据库中的外键迁移到目标数据库。
- 在全量迁移和增量迁移过程中,DTS会以Session级别暂时禁用约束检查以及外键级联操作。若任务运行时源库存在级联更新、删除操作,可能会导致数据不一致。
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
迁移类型说明
- 库表结构迁移
DTS将源库中迁移对象的结构定义迁移到目标库。
- 全量迁移
DTS在全量迁移的基础上,将源库的增量更新数据迁移到目标库中。通过增量数据迁移可以实现在自建应用不停机的情况下,平滑地完成数据迁移。
- 增量迁移
DTS在全量迁移的基础上,将源库的增量更新数据迁移到目标库中。通过增量数据迁移可以实现在自建应用不停机的情况下,平滑地完成数据迁移。
费用说明
迁移类型 | 链路配置费用 | 公网流量费用 |
---|---|---|
结构迁移和全量数据迁移 | 不收费。 | 通过公网将数据迁移出阿里云时将收费,详情请参见计费概述。 |
增量数据迁移 | 收费,详情请参见计费概述。 |
支持增量迁移的SQL操作
操作类型 | SQL操作语句 |
---|---|
DML | INSERT、UPDATE、DELETE |
数据库账号的权限要求
数据库 | 结构迁移 | 全量迁移 | 增量迁移 |
---|---|---|---|
自建PostgreSQL数据库 | pg_catalog的usage权限 | 迁移对象的select权限 | superuser |
专属集群MyBase for PostgreSQL实例 | 迁移对象的create、usage权限 | schema的owner权限 | schema的owner权限 |
数据库账号创建及授权方法:
- 自建PostgreSQL数据库请参见CREATE USER和GRANT语法。
- MyBase PostgreSQL实例请参见创建数据库账号。
准备工作
- 登录自建PostgreSQL所属的服务器。
- 修改配置文件postgresql.conf,将配置文件中的
wal_level
设置为logical
。说明 如果不需要增量数据迁移,可跳过本步骤。 - 将DTS的IP地址加入至自建PostgreSQL的配置文件pg_hba.conf中。您只需添加目标数据库所在区域对应的DTS IP地址段,详情请参见迁移、同步或订阅本地数据库时需添加的IP白名单。说明 关于该配置文件的设置请参见pg_hba.conf文件。如果您已将信任地址配置为
0.0.0.0/0
(如下图所示),可跳过本步骤。 - 可选:在源库中创建触发器和函数来捕获DDL信息实现DDL操作的同步,详情请参见通过触发器和函数实现PostgreSQL的DDL增量迁移。说明 如果无需同步DDL操作,可跳过本步骤。
操作步骤
- 登录新版DTS迁移任务的列表页面。说明 您也可以登录DMS数据管理服务。在顶部菜单栏中,选择 。
- 在页面左上角,选择迁移实例所属地域。
- 单击创建任务,配置源库及目标库信息。警告 选择源和目标实例后,建议您仔细阅读页面上方显示的使用限制,以成功创建并执行迁移任务。
类别 配置 说明 无 任务名称 DTS会自动生成一个任务名称,建议配置具有业务意义的名称(无唯一性要求),便于后续识别。
源库信息 选择已有的实例 您可以按实际需求,选择是否使用已有实例。 - 如使用已有实例,数据库信息将自动填入,您无需重复输入。
- 如不使用已有实例,您需要输入下方的数据库信息。
数据库类型 选择PostgreSQL。 接入方式 根据源库的部署位置进行选择,本文以云企业网CEN为例介绍配置流程。 说明 当源实例为自建数据库时,您还需要执行相应的准备工作,详情请参见准备工作概览。实例地区 选择自建PostgreSQL数据库所属地域。 云企业网实例ID 选择自建PostgreSQL数据库所属云企业网的实例ID。 已和源库互联的VPC网络 选择与自建PostgreSQL数据库互联的VPC网络。 IP地址 填入自建PostgreSQL数据库的服务器IP地址。 端口 填入自建PostgreSQL数据库的服务端口,默认为5432。 数据库名称 填入自建PostgreSQL中迁移对象所属数据库的名称。 数据库账号 填入自建PostgreSQL的数据库账号,权限要求,请参见数据库账号的权限要求。 数据库密码 填入该数据库账号对应的密码。
将连接信息保存为模板 单击将连接信息保存为模板并在弹跳框中设置连接名称,可将该实例的连接信息保存为模板,便于下次自动传入。 说明 建议连接名称配置为具有业务意义的名称(无唯一性要求),便于后续识别。目标库信息 选择已有的实例 您可以按实际需求,选择是否使用已有实例。 - 如使用已有实例,数据库信息将自动填入,您无需重复输入。
- 如不使用已有实例,您需要输入下方的数据库信息。
数据库类型 选择PostgreSQL。 接入方式 选择阿里云实例。 实例地区 选择目标MyBase PostgreSQL实例所属地域。 实例ID 选择目标MyBase PostgreSQL实例ID。 数据库名称 填入目标MyBase PostgreSQL实例中迁移对象所属数据库的名称。 数据库账号 填入目标MyBase PostgreSQL实例的数据库账号,权限要求,请参见数据库账号的权限要求。 数据库密码 填入该数据库账号对应的密码。
- 配置完成后,单击页面下方的测试连接以进行下一步。警告
- 如果源或目标数据库是阿里云数据库实例(例如RDS MySQL、云数据库MongoDB版等)或ECS上的自建数据库,DTS会自动将对应地区DTS服务的IP地址添加到阿里云数据库实例的白名单或ECS的安全规则中,您无需手动添加,请参见DTS服务器的IP地址段;如果源或目标数据库是IDC自建数据库或其他云数据库,则需要您手动添加对应地区DTS服务的IP地址,以允许来自DTS服务器的访问。
- 上述场景中,DTS自动添加或您手动添加DTS服务的公网IP地址段可能会存在安全风险,一旦使用本产品代表您已理解和确认其中可能存在的安全风险,并且需要您做好基本的安全防护,包括但不限于加强账号密码强度防范、限制各网段开放的端口号、内部各API使用鉴权方式通信、定期检查并限制不需要的网段,或者使用通过内网(专线/VPN网关/智能网关)的方式接入。
- DTS任务完成或释放后,建议您手动删除添加的DTS服务的IP地址。在阿里云数据库实例的白名单或ECS的安全规则中,您需要删除名称包含
dts
的IP白名单分组;在IDC自建数据库或其他云数据库,您需要删除的DTS服务的IP地址,请参见DTS服务器的IP地址段。
- 配置任务对象及高级配置。
- 基础配置
配置 说明 迁移类型 - 如果只需要进行全量迁移,请同时选中库表结构迁移和全量迁移。
- 如果需要进行不停机迁移,请同时选中库表结构迁移、全量迁移和增量迁移。
说明 如果未选择增量迁移,为保障数据一致性,数据迁移期间请勿在源实例中写入新的数据。目标已存在表的处理模式 预检查并报错拦截:检查目标数据库中是否有同名的表。如果目标数据库中没有同名的表,则通过该检查项目;如果目标数据库中有同名的表,则在预检查阶段提示错误,数据迁移任务不会被启动。
说明 如果目标库中同名的表不方便删除或重命名,您可以更改该表在目标库中的名称,请参见库表列名映射。- 忽略报错并继续执行:跳过目标数据库中是否有同名表的检查项。 警告 选择为忽略报错并继续执行,可能导致数据不一致,给业务带来风险,例如:
- 表结构一致的情况下,在目标库遇到与源库主键的值相同的记录,则会保留目标库中的该条记录,即源库中的该条记录不会迁移至目标库中。
- 表结构不一致的情况下,可能导致只能迁移部分列的数据或迁移失败。
同步对象 在源库对象框中单击待迁移的对象,然后单击
将其移动到已选择对象框。
说明 迁移对象选择的粒度为schema、表、列。若选择的迁移对象为表或列,其他对象(如视图、触发器、存储过程)不会被迁移至目标库。映射名称更改 过滤待迁移数据 支持设置条件过滤数据,详情请参见通过SQL条件过滤任务数据。
增量迁移的SQL操作 选择增量迁移SQL操作,请右击已选择对象中的迁移对象,在弹跳框中选择所需增量迁移的SQL操作。支持的操作,请参见支持增量迁移的SQL操作。 - 高级配置
配置 说明 设置告警 是否设置告警,当迁移失败或延迟超过阈值后,将通知告警联系人。- 不设置:不设置告警。
- 设置:设置告警,您还需要设置告警阈值和告警联系人。更多信息,请参见在配置任务过程中配置监控报警。
目标库对象名称大小写策略 您可以配置目标实例中迁移对象的库名、表名和列名的英文大小写策略。默认情况下选择DTS默认策略,您也可以选择与源库、目标库默认策略保持一致。更多信息,请参见目标库对象名称大小写策略。
源、目标库无法连接重试时间 在迁移任务启动后,若源库或目标库连接失败则DTS会报错,并会立即进行持续的重试连接,默认重试720分钟,您也可以在取值范围(10~1440分钟)内自定义重试时间,建议设置30分钟以上。如果DTS在设置的时间内重新连接上源、目标库,迁移任务将自动恢复。否则,迁移任务将失败。说明- 针对同源或者同目标的多个DTS实例,网络重试时间以后创建任务的设置为准。
- 由于连接重试期间,DTS将收取任务运行费用,建议您根据业务需要自定义重试时间,或者在源和目标库实例释放后尽快释放DTS实例。
- 基础配置
- 上述配置完成后,单击页面下方的下一步保存任务并预检查。 说明
- 在迁移任务正式启动之前,会先进行预检查。只有预检查通过后,才能成功启动迁移任务。
- 如果预检查失败,请单击失败检查项后的查看详情,并根据提示修复后重新进行预检查。
- 如果预检查产生警告:
- 对于不可以忽略的检查项,请单击失败检查项后的查看详情,并根据提示修复后重新进行预检查。
- 对于可以忽略无需修复的检查项,您可以依次单击点击确认告警详情、确认屏蔽、确定、重新进行预检查,跳过告警检查项重新进行预检查。如果选择屏蔽告警检查项,可能会导致数据不一致等问题,给业务带来风险。
- 预检查通过率显示为100%时,单击下一步购买。
- 在购买页面,选择数据迁移实例的链路规格,详细说明请参见下表。
类别 参数 说明 信息配置 链路规格 DTS为您提供了不同性能的迁移规格,迁移链路规格的不同会影响迁移速率,您可以根据业务场景进行选择,详情请参见数据迁移链路规格说明。
- 配置完成后,阅读并选中《数据传输(按量付费)服务条款》。
- 单击购买并启动,迁移任务正式开始,您可在数据迁移界面查看具体进度。