云监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍创建和调试系统事件报警规则的方法。

背景信息

云监控支持的事件类型和云产品如下表所示。
事件类型说明支持的云产品
系统事件云监控为您提供各云产品系统事件的统一查询入口,使您及时得知各云产品的运行状态,并接收报警通知。支持的云产品和系统事件
自定义事件您可以通过云监控的自定义事件上报接口,将目标云产品的异常事件上报到云监控,使您及时得知该云产品的运行状态,并接收报警通知。云监控支持的所有云产品。

创建系统事件报警规则

  1. 登录云监控控制台
  2. 在左侧导航栏,单击应用分组
  3. 应用分组页签,单击目标应用分组名称链接。
  4. 在目标应用分组的左侧导航栏,单击系统事件
  5. 单击事件报警规则页签。
  6. 单击创建报警规则
  7. 创建/修改事件报警面板,设置系统事件的报警规则参数。
    参数说明
    报警规则名称事件报警规则的名称。
    产品类型事件报警规则的云产品类型。云监控支持的云产品,请参见云产品系统事件
    事件类型事件报警规则的事件类型。每个云产品支持的事件类型,请参见云产品系统事件
    事件等级事件报警规则的事件等级。每个云产品支持的事件等级,请参见云产品系统事件
    事件名称事件报警规则的事件名称。每个云产品支持的事件名称,请参见云产品系统事件
    关键词过滤报警规则的过滤关键词。取值:
    • 满足包含上面任何一个关键词:当事件内容中包含任何一个关键词时,云监控会发送报警通知。
    • 满足不包含上面任何一个关键词:当事件内容中不包含任何一个关键词时,云监控会发送报警通知。
    说明 关于如何查看事件内容,请参见查看系统事件
    SQL FilterSQL过滤语句。

    支持andor的条件筛选,例如:Warn and i-hp368focau7dp0hw****,表示当事件内容中包含实例i-hp368focau7dp0hw****和报警级别Warn时,云监控才会发送报警通知。

    联系人组事件报警规则的报警联系人组。
    通知方式事件报警的级别和通知方式。取值:
    • Critical(邮件+WebHook)
    • Warning(邮件+WebHook)
    • Info(邮件+WebHook)
    消息服务队列事件报警投递到消息服务的指定队列。
    函数计算事件报警投递到函数计算的指定函数。
    URL回调

    公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用系统事件报警回调

    当您需要测试报警回调地址的连通性时,可以执行以下操作。
    1. 单击回调地址正后方的测试
      WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
      说明 您还可以设置Webhook的回调模板类型语言,再次单击测试,获取对应的测试结果详情。
    2. 单击关闭
    日志服务事件报警投递到日志服务的指定日志库。
    通道沉默周期报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

    某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。

  8. 单击确定

调试系统事件报警规则

说明 您只能调试系统事件的报警规则,且该规则必须关联指定的云服务和事件名称。
  1. 登录云监控控制台
  2. 在左侧导航栏,单击应用分组
  3. 应用分组页签,单击目标应用分组名称链接。
  4. 在目标应用分组的左侧导航栏,单击系统事件
  5. 单击事件报警规则页签。
  6. 单击目标报警规则对应操作列的调试
  7. 创建事件调试面板,选择待调试事件。
  8. 内容(JSON格式)区域,显示该事件内容,您可以根据实际环境修改其实例ID等信息。
  9. 单击确定
    云监控根据内容发送一个报警事件,触发报警规则。

相关操作

事件报警规则页签,单击目标规则对应操作列的修改禁用启用删除,对系统事件的报警规则执行相关操作。