数据传输服务DTS(Data Transmission Service)支持Redis集群间的单向同步,适用于数据迁移、异地多活、数据异地容灾等多种应用场景。本文以自建Redis集群同步至阿里云Redis集群实例为例,介绍数据同步作业的配置流程。
从阿里云Redis集群实例同步至自建Redis集群的操作步骤与本文类似,您需要根据实际的业务场景配置同步的源和目标实例信息。
警告 完成数据同步作业的配置后,请勿变更源数据库或目标数据库的架构类型(例如将主从架构变更为集群架构),否则会导致数据同步失败。
前提条件
- 自建Redis数据库的版本为2.8、3.0、3.2、4.0或5.0版本。
说明 目标阿里云Redis集群实例支持的版本为2.8、4.0或5.0版本,如需跨版本同步(仅支持从低版本同步到高版本),请提前确认兼容性。例如创建按量付费的Redis集群实例来测试,测试完成后可将该实例释放或转为包年包月。
- 目标阿里云Redis集群实例的存储空间需大于源Redis数据库已使用的存储空间。
- 源Redis集群的每个节点必须能够执行
psync
命令,且连接的密码一致。
注意事项
- DTS在执行全量数据初始化时将占用源库和目标库一定的资源,可能会导致数据库服务器负载上升。如果数据库业务量较大或服务器规格较低,可能会加重数据库压力,甚至导致数据库服务不可用。建议您在执行数据同步前谨慎评估,在业务低峰期执行数据同步。
- 为保障同步链路稳定性,建议将配置文件redis.conf中
repl-backlog-size
参数的值适当调大。 - 为保障同步质量,DTS会在源Redis数据库中插入一个key:DTS_REDIS_TIMESTAMP_HEARTBEAT,用于记录更新时间点。
- 请勿在源集群中执行
FLUSHDB
和FLUSHALL
命令,否则将导致源和目标的数据不一致。 - 如果目标库的数据逐出策略(
maxmemory-policy
)配置为noeviction
以外的值,可能导致目标库的数据与源库不一致。关于数据逐出策略详情,请参见Redis数据逐出策略介绍。 - 如果源库中的某些Key使用了过期(expire)策略,由于可能存在Key已过期但未被及时删除的情况,所以在目标库中查看到的Key数量(例如通过info命令查看)会比源库的Key数量少。
说明 源和目标库中,未设置过期策略或未过期的Key数量是一致的。
支持的同步拓扑
- 一对一单向同步
- 一对多单向同步
- 级联单向同步
关于各类同步拓扑的介绍及注意事项,请参见数据同步拓扑介绍。
支持的同步命令
- APPEND
- BITOP、BLPOP、BRPOP、BRPOPLPUSH
- DECR、DECRBY、DEL
- EVAL、EVALSHA、EXEC、EXPIRE、EXPIREAT
- GEOADD、GETSET
- HDEL、HINCRBY、HINCRBYFLOAT、HMSET、HSET、HSETNX
- INCR、INCRBY、INCRBYFLOAT
- LINSERT、LPOP、LPUSH、LPUSHX、LREM、LSET、LTRIM
- MOVE、MSET、MSETNX、MULTI
- PERSIST、PEXPIRE、PEXPIREAT、PFADD、PFMERGE、PSETEX、PUBLISH
- RENAME、RENAMENX、RESTORE、RPOP、RPOPLPUSH、RPUSH、RPUSHX
- SADD、SDIFFSTORE、SELECT、SET、SETBIT、SETEX、SETNX、SETRANGE、SINTERSTORE、SMOVE、SPOP、SREM、SUNIONSTORE
- ZADD、ZINCRBY、ZINTERSTORE、ZREM、ZREMRANGEBYLEX、ZUNIONSTORE、ZREMRANGEBYRANK、ZREMRANGEBYSCORE
- SWAPDB、UNLINK(仅当源端Redis实例的版本为4.0时支持)
说明
- 对于通过EVAL或者EVALSHA调用Lua脚本,在增量数据同步时,由于目标端在执行脚本时不会明确返回执行结果,DTS无法确保该类型脚本能够执行成功。
- 对于List,由于DTS在调用sync或psync进行重传时,不会对目标端已有的数据进行清空,可能导致出现重复数据。
操作步骤
- 购买数据同步作业。
说明 购买时,源实例和目标实例均选择为Redis。
- 登录数据传输控制台。
- 在左侧导航栏,单击数据同步。
- 在同步作业列表页面顶部,选择同步的目标实例所属地域。
- 定位至已购买的数据同步实例,单击配置同步链路。
- 配置数据同步的源实例及目标实例信息。
类别 配置 说明 无 同步作业名称 DTS会自动生成一个同步作业名称,建议配置具有业务意义的名称(无唯一性要求),便于后续识别。 源实例信息 实例类型 选择ECS上的自建数据库。您可以根据源库部署位置,选择ECS上的自建数据库或通过专线/VPN网关/智能网关接入的自建数据库。 本文以ECS上的自建数据库为例介绍配置流程,当自建Redis数据库为其他实例类型时,配置流程与该案例类似。
实例地区 购买数据同步实例时选择的源实例地域,不可变更。 ECS实例ID 选择自建Redis集群中任一节点的Master所在的ECS实例ID。 数据库类型 固定为Redis。 实例模式 选择集群版。 端口 填入自建Redis集群中任一节点的Master的服务端口,本案例填入7000。 数据库密码 填入连接自建Redis数据库的密码。 说明 非必填项,如果没有设置密码可以不填。目标实例信息 实例类型 选择Redis实例。 实例地区 购买数据同步实例时选择的目标实例地域,不可变更。 实例ID 选择目标阿里云Redis集群实例ID。 数据库密码 填入目标阿里云Redis集群实例的密码。 说明 数据库密码格式为<user>:<password>。例如,Redis实例自定义的用户名为admin,密码为Rp829dlwa,则此处填入的数据库密码为admin:Rp829dlwa。 - 单击页面右下角的授权白名单并进入下一步。
说明 此步骤会将DTS服务器的IP地址,自动添加到源ECS实例的内网入方向规则和目标阿里云Redis集群实例的白名单中,用于保障DTS服务器能够正常连接源ECS实例和目标阿里云Redis集群。
- 配置目标已存在表的处理模式和同步对象。
配置 说明 目标已存在表的处理模式 - 预检查并报错拦截:检查目标库是否为空。如果待同步的目标库为空,则通过该检查项目;如果不为空,则在预检查阶段提示错误,数据同步作业不会被启动。
- 忽略报错并继续执行:跳过目标库是否为空的检查项。
警告 选择为忽略报错并继续执行后,如果在同步过程中遇到目标库中的Key与源库中的Key相同,会将源库的数据覆盖写入目标库中,请谨慎选择。
同步对象 - 在源库对象框中单击待同步的数据库,然后单击
将其移动到已选择对象框。
- 同步对象的选择粒度为库,暂不支持Key粒度的选择。
映射名称更改 如需更改同步对象在目标实例中的名称,请使用对象名映射功能,详情请参见库表列映射。
源表DMS_ONLINE_DDL过程中是否复制临时表到目标库 如源库使用数据管理DMS(Data Management Service)执行Online DDL变更,您可以选择是否同步Online DDL变更产生的临时表数据。- 是:同步Online DDL变更产生的临时表数据。
说明 Online DDL变更产生的临时表数据过大,可能会导致同步任务延迟。
- 否:不同步Online DDL变更产生的临时表数据,只同步源库的原始DDL数据。
说明 该方案会导致目标库锁表。
源、目标库无法连接重试时间 当源、目标库无法连接时,DTS默认重试720分钟(即12小时),您也可以自定义重试时间。如果DTS在设置的时间内重新连接上源、目标库,同步任务将自动恢复。否则,同步任务将失败。说明 由于连接重试期间,DTS将收取任务运行费用,建议您根据业务需要自定义重试时间,或者在源和目标库实例释放后尽快释放DTS实例。 - 上述配置完成后单击页面右下角的下一步。
- 配置同步初始化选项,当前固定为包含全量数据+增量数据。
- 上述配置完成后,单击页面右下角的预检查并启动。
说明
- 在同步作业正式启动之前,会先进行预检查。只有预检查通过后,才能成功启动同步作业。
- 如果预检查失败,单击具体检查项后的
,查看失败详情。
- 您可以根据提示修复后重新进行预检查。
- 如无需修复告警检测项,您也可以选择确认屏蔽、忽略告警项并重新进行预检查,跳过告警检测项重新进行预检查。
- 在预检查对话框中显示预检查通过后,关闭预检查对话框,同步作业将正式开始。
- 等待同步作业的链路初始化完成,直至处于同步中状态。说明 您可以在数据同步页面,查看数据同步作业的状态。