DTS产品已接入云监控平台,通过对重要的监控指标设置报警规则,让您在第一时间得知指标数据发生异常,帮您迅速定位处理故障。
背景信息
云监控平台目前支持的监控项为延迟信息和任务状态:
监控项目 |
说明 |
配置入口 |
延迟信息 |
监控增量数据迁移延迟信息,当迁移延迟、同步延迟或订阅延迟的时间超过设定值时(单位为毫秒),触发报警规则。 |
阈值报警 |
任务状态 |
监控任务的状态,当任务的状态为异常或恢复时,触发报警规则。
|
事件报警 |
设置阈值报警
- 登录云监控控制台。
- 在左侧导航栏,单击。
- 在阈值报警页签中,单击创建报警规则。
- 设置报警规则信息。
- 设置关联资源。

配置 |
说明 |
产品 |
根据待监控的DTS实例类型,在下拉列表中选择:
- 数据传输服务 DTS(Migration):数据迁移实例。
- 数据传输服务 DTS(Change_tracking):数据订阅实例。
- 数据传输服务 DTS(Synchronization):数据同步实例。
说明 您也可以在文本框中输入dts来过滤,可快速查找到目标产品。
|
资源范围 |
根据业务需求,在下拉列表中选择:
- 全部资源:表示该规则作用在用户名下对应产品的全部实例上。
说明 报警的资源最多为1000个,超过该值可能导致无法发送报警信息,建议您使用应用分组按业务划分资源后再设置报警。
- 实例:表示该规则只作用在某个具体实例上,此时您还需要选择目标实例。
|
实例 |
在下拉列表中,选择目标实例(可选择多个)。 |
- 设置报警规则。

配置 |
说明 |
规则名称 |
填入报警规则的名称。 |
规则描述 |
报警规则的主体,定义在监控数据满足指定条件时,触发报警规则。
本案例中,云监控会每隔5分钟检查一次5分钟内的迁移延迟监控项的值是否满足平均值大于等于20秒的规则,如果连续三个周期的检查结果都达到您设置的规则,则触发报警。
|
通道沉默周期 |
报警发生后如果未恢复正常,间隔多久重新发送一次报警通知。 |
生效时间 |
报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。 |
- 设置通知方式。

配置 |
说明 |
通知对象 |
在左侧的联系人通知组区域框中,单击目标通知组,然后单击 图标将其移动至已选组区域框。
|
报警级别 |
固定为邮件+钉钉机器人。
|
弹性伸缩 |
选中弹性伸缩后,您还需要选择对应的弹性伸缩规则,云监控会在报警发生时触发相应的伸缩规则。
|
日志服务 |
选中日志服务后,您还需要选择对应的日志服务,云监控会在报警信息写入到日志服务。
|
邮件主题 |
当选择资源范围为实例时,您还可以配置邮件主题信息,默认为产品名称+监控项名称+实例ID。
|
邮件备注 |
填入自定义的报警邮件补充信息,发送的报警邮件通知中会附带您的备注信息。 |
报警回调 |
填入公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。配置方法请参见使用报警回调。
|
- 单击确认。
设置事件报警
- 登录云监控控制台。
- 在左侧导航栏,单击。
- 单击事件报警页签,然后单击创建事件报警。
- 设置报警规则信息。
参数 |
说明 |
报警规则名称 |
填入报警规则的名称。 |
事件类型 |
选择为系统事件。
|
产品类型 |
选择数据传输。
|
事件类型 |
保持默认的全部类型。
|
事件等级 |
保持默认的全部级别。
|
事件名称 |
在下拉框中选择事件名称,目前支持数据迁移、数据同步和数据订阅任务的异常和恢复事件。 |
资源范围 |
选择为全部资源或应用分组,选择为应用分组时,您还需要指定目标分组信息。
|
报警方式 |
选择报警通知方式,相关参数说明请参见设置阈值报警步骤4中的设置通知方式。
|
- 单击确定。