告警管理的发送测试事件功能可以帮助您验证集成是否创建成功。本文以自定义集成为例,介绍如何发送测试事件到目标集成。

演示场景

假设存在以下场景:

面对即将到来的大型活动,某公司运维人员需要对服务器进行监控。当服务器接入ARMS告警管理后,运维人员通过发送测试事件验证接入是否成功。

测试事件场景:

当服务器内存使用率大于80%,发送告警通知,通知中包含以下信息:
  • 服务器所在机房
  • 服务器ID
  • 服务器IP
  • 服务器名称
  • 当前内存使用率

步骤一:创建自定义集成

  1. 登录ARMS控制台
  2. 在左侧导航栏选择告警管理 > 集成
  3. 集成页面的支持集成区域单击自定义集成
  4. 添加集成配置向导页面,进行以下配置:
    1. 基本信息向导页输入集成名称,然后单击下一步
      此处示例名称为服务器集成
    2. 告警源配置向导页根据需求配置自动恢复告警事件的时间和事件重定义字段,然后单击保存
      说明
      • 事件重定义字段只能用变量和字符组成的jsonPath格式。
      • 单击向导页底部的+添加扩展字段可以自定义新的告警事件字段。
      自定义集成告警源配置
      参数 说明
      告警源配置
      自动恢复告警事件 相同名称和等级的告警,在设置的时间内的多次上报会被合并为一条告警。当一条告警超过设置的时间后不再产生,则该告警状态自动变为已解决。
      事件重定义
      告警样本值 监控指标的触发值。
      告警等级 设置告警等级的映射字段。默认映射如下:
      • critical:P1
      • error:P2
      • warning:P3
      • page:P4
      开始时间 事件开始时间的时间戳。
      告警描述 告警事件的详细信息,用于告警通知。最多支持15000字符。
      对象类型 告警事件的对象类型,例如:主机。
      告警类型 告警事件的来源,集成类型。
      告警名称 自定义告警的名称。
      事件对象 事件对象的名称,最多支持512个字符。例如:主机test_10.101.1.1。
      事件地址 事件详细信息地址。
      结束时间 事件结束时间的时间戳。

      此处以添加以下字段为例,您可以根据实际需求自定义需要的字段信息。

      字段类型 字段 说明
      默认字段 告警名称 告警的名称。 $.alertname
      告警描述 告警事件的详细信息,用于告警通知。 $.message
      告警样本值 此处是指内存当前使用率。 $.value
      扩展字段 vm_id 服务器ID。 $.vm_id
      vm_ip 服务器IP。 $.vm_ip
      idc_id 机房ID。 $.idc_id
      vm_name 服务器名称。 $.vm_name

步骤二:发送测试事件

  1. 登录ARMS控制台
  2. 在左侧导航栏选择告警管理 > 告警事件历史
  3. 事件列表页面单击发送测试事件
  4. 发送测试事件对话框,选择集成名称服务器集成
  5. 事件内容的文本框内输入测试事件的字段取值。

    假设此时A机房的No.01服务器(ip:192.168.2.13,id:i-123)当前内存使用率为82.14%。

    那么可以输入以下内容:

    {
    "message": "{{$labels.idc_id}}机房的 {{$labels.vm_name}}服务器(ip:{{$labels.vm_ip}}, id: {{$labels.vm_id}})当前内存使用率为{{$value | humanizePercentage}},大于80%,触发告警。",
    "vm_name": "No.01",
    "vm_id":"i-123",
    "vm_ip": "192.168.2.13",
    "value":"0.8214",
    "idc_id":"A",
    "alertname":"内存使用率大于80%"
    }
  6. 单击确认
    出现上传成功!时,表示测试事件已发送成功,发送测试事件结果

步骤三:查看收到的测试事件

  1. 登录ARMS控制台
  2. 在左侧导航栏选择告警管理 > 告警事件历史
    事件列表页面的未恢复事件页签查看发送的测试事件。测试事件列表
  3. 单击测试事件的名称,可以查看事件各字段的详细信息。
    测试事件的详情