告警监控规则触发告警后,日志服务会根据告警策略进一步处理告警信息,包括合并、抑制和静默告警。 本文介绍创建告警策略的操作步骤。

操作步骤

  1. 登录日志服务控制台
  2. 进入告警策略页面。
    1. 在Project列表区域,单击目标Project。
    2. 在左侧导航栏中,单击告警
    3. 选择告警管理 > 告警策略
  3. 告警策略页签中,单击添加
  4. 添加策略对话框中,配置如下参数,并单击确认
    参数 描述
    ID 告警策略ID,不可重复。
    名称 告警策略的名称。
    继承策略 选择父级告警策略。

    选择父级告警策略后,日志服务会优先执行父级告警策略,再执行本告警策略。一般用于继承静默策略。

    路由合并策略 当系统产生大量重复的告警时,通过合并策略可将这些告警合并为一个告警进行通知。更多操作,请参见路由合并策略
    抑制策略 通过抑制策略,可阻止由某告警引发的其他告警进行通知。更多操作,请参见抑制策略
    静默策略 在静默时间内,符合条件的告警,不会进行告警通知。更多操作,请参见静默策略

路由合并策略

当系统产生大量重复的告警时,通过合并策略可将这些告警合并为一个告警进行通知。您可以在日志服务提供的图形化界面中配置条件分组合并规则,制定一条路由合并策略。

配置说明

  1. 路由合并策略页签中,单击条件图标。
  2. 配置判断条件。
    条件
  3. 配置合并告警的规则。
    分组合并
    参数 说明
    合并基准 配置合并告警的基准。
    • 按告警源规则+所有标签:由相同告警规则触发的告警,且其标签相同时,合并为一组进行告警通知。
    • 按告警源规则:由相同告警规则触发的告警合并为一组,进行告警通知。
    • 按告警源项目:属于同一Project下的告警合并为一组,进行告警通知。
    • 按告警源项目+严重度:属于同一Project下的告警,且其严重度相同时,合并为一组进行告警通知。
    • 按告警源项目+所有标签:属于同一Project下的告警,且其标签相同时,合并为一组进行告警通知。
    • 自定义:自定义选择阿里云账号ID、告警监控规则ID、告警标题等属性进行合并。
    行动策略 选择目标行动策略。
    说明 您可以在此处绑定行动策略,也可以在创建告警规则时绑定行动策略。
    • 如果您在此处选择动态行动策略,则以创建告警规则时绑定的行动策略为准。
    • 如果您在此处选择除动态行动策略之外的其他行动策略,则以此处绑定的行动策略为准。
    首次等待 配置首次等待时间。建议设置为秒级别。

    对告警进行分组后,日志服务会在首次等待时间后发送第一次告警通知。

    分组等待 配置分组等待时间。建议设置为分钟级别。

    日志服务根据分组等待时间进行一次分组检查。

    重复等待 配置重复等待时间。建议设置为小时级别。

    如果分组内的告警数据没有变化,则日志服务会在重复等待时间后才发送一次告警通知。

  4. 单击条件合并告警对话框对应的结束 图标,结束配置。

配置示例

如果env标签为prd,按照告警源项目合并,执行SLS内置行动策略;如果env标签为test,按照告警规则合并,执行test行动策略。

路由合并策略

抑制策略

通过抑制策略,可阻止由某告警引发的其他告警进行通知。您可以在日志服务提供的图形化界面中配置条件抑制告警规则,制定一条抑制策略。

配置说明

  1. 抑制策略页签中,单击条件图标。
  2. 配置判断条件。
    条件2
  3. 配置抑制条件。
    抑制条件
  4. 单击条件抑制告警对话框对应的结束 图标,结束配置。

配置示例

告警标题匹配k8s、严重度为严重、状态取值为触发告警的告警会抑制cluster_id标签为k8s、严重度小于严重的告警进行通知。

抑制示例

静默策略

在静默时间内,符合条件的告警,不会触发告警通知。您可以在日志服务提供的图形化界面中配置条件静默时间,制定一条静默策略。

配置说明

  1. 静默策略页签中,单击条件图标。
  2. 配置判断条件。
    条件3
  3. 配置静默时间。
    静默时间
  4. 单击条件静默时间对话框对应的结束 图标,结束配置。

配置示例

符合告警严重度为中,监控规则所属项目的名称包含test-project,标签expired为true等条件的告警,静默1个小时;否则没有owner标签的告警持续静默。

静默示例