DTS产品已接入云监控平台,通过对重要的监控指标设置报警规则,让您在第一时间得知指标数据发生异常,帮您迅速定位处理故障。

背景信息

云监控平台目前支持的监控项为延迟信息和任务状态:
监控项目 说明 配置入口
延迟信息 监控DTS任务的延迟信息,当迁移延迟、同步延迟或订阅延迟的时间超过设定值时(单位为毫秒),触发报警规则。 阈值报警
任务状态 监控任务的状态,当任务的状态为异常恢复时,触发报警规则。 事件报警

设置阈值报警

  1. 登录云监控控制台
  2. 在左侧导航栏,单击报警服务 > 报警规则
  3. 阈值报警页签中,单击创建报警规则
  4. 设置报警规则信息。
    1. 设置关联资源。
      设置关联资源
      配置 说明
      产品 根据待监控的DTS实例类型,在下拉列表中选择:
      • 数据传输服务 DTS(Migration):数据迁移实例。
      • 数据传输服务 DTS(Change_tracking):数据订阅实例。
      • 数据传输服务 DTS(Synchronization):数据同步实例。
      说明 您也可以在文本框中输入DTS来过滤,可快速查找到目标产品。
      资源范围 根据业务需求,在下拉列表中选择:
      • 全部资源:表示该规则作用在用户名下对应产品的全部实例上。
        说明 报警的资源最多为1000个,超过该值可能导致无法发送报警信息,建议您使用应用分组按业务划分资源后再设置报警。
      • 实例:表示该规则只作用在特定实例上,此时您还需要选择目标实例。
      实例 在下拉列表中,选择目标实例(可选择多个)。
    2. 设置报警规则。
      设置云监控报警规则
      配置 说明
      规则名称 填入报警规则的名称。
      规则描述 报警规则的主体,定义在监控数据满足指定条件时,触发报警规则。

      本案例中,云监控会每隔5分钟检查一次5分钟内的迁移延迟监控项的值是否满足平均值大于等于20秒个规则,如果连续三个周期的检查结果都达到您设置的规则,则触发报警。

      通道沉默周期 报警发生后如果未恢复正常,间隔多久重新发送一次报警通知。
      生效时间 报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
    3. 设置通知方式。
      设置通知方式
      配置 说明
      通知对象 在左侧的联系人通知组区域框中,单击目标通知组,然后单击向右箭头图标将其移动至已选组区域框。
      说明 如您尚未在云监控中创建报警联系人,请参见报警人和报警联系组
      报警级别

      固定为邮件+钉钉机器人

      弹性伸缩 选中弹性伸缩后,您还需要选择对应的弹性伸缩规则,云监控会在报警发生时触发相应的伸缩规则。
      日志服务 选中日志服务后,您需要选择对应的地域、Project和Logstore,报警信息会被写入相应的日志服务Logstore。
      邮件主题 当选择资源范围实例时,您还可以配置邮件主题信息,默认为产品名称+监控项名称+实例ID。
      邮件备注 填入自定义的报警邮件补充信息,发送的报警邮件通知中会附带您的备注信息。
      报警回调 填入公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。配置方法请参见使用报警回调
    4. 单击确认

设置事件报警

  1. 登录云监控控制台
  2. 在左侧导航栏,单击报警服务 > 报警规则
  3. 单击事件报警页签,然后单击创建事件报警
  4. 设置报警规则信息。
    参数 说明
    报警规则名称 填入报警规则的名称。
    事件类型 选择为系统事件
    产品类型 选择数据传输
    事件类型 保持默认的全部类型
    事件等级 保持默认的全部级别
    事件名称 在下拉框中选择事件名称,目前支持数据迁移、数据同步和数据订阅任务的异常和恢复事件。
    资源范围 选择为全部资源应用分组,选择为应用分组时,您还需要指定目标分组信息。
    报警方式 选择报警通知方式,相关参数说明请参见设置阈值报警步骤4中的设置通知方式。
  5. 单击确定