为监控任务创建报警可在满足报警条件时通过邮件、短信、钉钉等渠道实时报警,主动帮助您发现异常。本文将分别以一个实例介绍创建应用监控报警、前端监控报警和Prometheus监控报警的方法。

说明 目前公有云已不支持使用旧版报警功能,您可以使用新版告警管理功能创建告警规则。更多信息,请参见以下链接。

前提条件

确保您已成功创建一个监控任务和管理联系人分组,请参见以下文档:

创建应用监控报警

若需为应用监控任务创建一个JVM-GC次数同比报警,具体操作步骤如下:

  1. 登录ARMS控制台,在左侧导航栏中选择报警管理 > 报警策略管理
  2. 报警规则和历史页面的右上角单击创建报警 > 应用监控报警
  3. 在弹出的创建报警对话框中输入所有必填信息,完成后单击保存

    根据页面提示配置如下参数:

    创建报警
    1. 填写报警名称,例如:JVM-GC次数同比报警。
    2. 应用站点栏选择您已创建的监控任务。
    3. 类型栏选择监控指标的类型,例如:JVM监控。
    4. 设置维度为遍历。
    5. 设置报警规则。
      1. 选择同时满足下述规则
      2. 编辑报警规则,例如:N=5时JVM_FullGC累计次数的平均值与上小时同比上升100% 时则报警。
        说明 若需设置多条报警规则,单击报警规则右侧的加号(+),即可编辑第二条报警规则。
    6. 选择通知方式。例如:选择邮件。
    7. 设置通知对象。在全部联系组框中单击联系人分组的名称,该联系人分组出现在已选联系组框中,则设置成功。

创建前端监控报警

若需为前端监控任务创建一个页面指标JS错误率和JS错误数报警,具体操作步骤如下:

  1. 在控制台左侧导航栏中选择报警管理 > 报警策略管理

  2. 报警规则和历史页面的右上角单击创建报警 > 前端监控报警

  3. 在弹出的创建报警对话框中输入所有必填信息,完成后单击保存

    根据页面提示配置如下参数:

    创建前端报警
    1. 填写报警名称,例如:页面指标报警。
    2. 应用站点栏选择您已创建的监控任务。
    3. 类型栏选择监控指标的类型,例如:页面指标。
    4. 设置维度为遍历。
    5. 设置报警规则。
      1. 选择同时满足下述规则
      2. 编辑报警规则,例如:N=10时JS错误率的平均值大于等于20时则报警。
      3. 单击报警规则右侧的加号(+),编辑第二条报警规则,例如:N=10时JS错误数的总和大于等于20时则报警。
    6. 选择通知方式,例如:选择短信和邮件。
    7. 设置通知对象。在全部联系组中单击联系人分组的名称,该联系人分组出现在已选联系组中,则设置成功。

创建Prometheus监控报警

若需为Prometheus监控任务创建一个网络接收压力报警,具体操作步骤如下:

  1. 在控制台左侧导航栏中选择报警管理 > 报警策略管理

  2. 报警规则和历史页面的右上角单击创建报警 > Prometheus

  3. 创建报警对话框中输入所有必填信息,完成后单击 保存

    根据页面提示配置如下参数:

    创建Prometheus监控报警
    1. 填写报警名称,例如:网络接收压力报警。
    2. 选择要创建报警的Prometheus监控对应的集群
    3. 选择类型grafana
    4. 选择要监控的具体大盘图表
    5. 设置报警规则。
      1. 选择同时满足下述规则
      2. 编辑报警规则,例如:N=5时网络接收数据字节(MB)的平均值大于等于3时则报警。
        说明 一个Grafana图表中可能有A、B、C三条曲线数据,您可设置监控其中的一条线。
      3. PromQL输入框中编辑或重新输入PromQL语句。
        重要 PromQL语句中包含的 $符号会导致报错,您需要删除包含 $符号的语句中 =左右两边的参数及 =。例如:将 sum (rate (container_network_receive_bytes_total{instance=~"^$HostIp.*"}[1m]))修改为 sum (rate (container_network_receive_bytes_total[1m]))
    6. 选择通知方式,例如:选择短信。
    7. 设置通知对象。在全部联系组中单击联系人分组的名称,该联系人分组出现在已选联系组中,即设置成功。

新版说明

新版创建告警规则的操作如下: