在创建Kubernetes监控告警规则后,当告警被触发时,系统会以您指定的通知方式向告警联系人或钉群发送告警信息,以便您及时采取必要的解决措施。

创建告警规则

  1. 登录ARMS控制台
  2. 在左侧导航栏单击Kubernetes监控
  3. 在顶部菜单栏,选择地域。
  4. Kubernetes监控页面,单击Kubernetes集群名称。
  5. 在左侧导航栏单击报警配置
  6. K8s监控告警规则列表页面右上角,单击创建K8s监控告警规则
  7. 创建K8s监控告警规则页面,完成填写所有必填信息,然后单击保存
    参数 说明 示例
    告警名称 自定义的Kubernetes监控告警名称。 错误数大于0
    告警分组 Kubernetes监控默认告警分组为Kubernetes监控,且无法修改。 Kubernetes监控
    告警指标 产生告警的指标。Kubernetes监控支持的告警指标请参见Kubernetes监控告警指标 错误数
    告警条件 设置告警指标对应的告警触发阈值。 当错误数大于0次时,发送告警。
    筛选条件 设置当前配置的告警规则所适用的Kubernetes集群范围,即所有符合筛选条件的Kubernetes集群资源满足此条告警规则时,均会产生告警。

    不同告警指标支持筛选的资源维度不同,请根据实际选择的告警指标设置筛选条件。

    可选筛选条件包括:
    • 遍历:告警规则适用于当前维度下的所有资源。筛选条件默认为遍历。
    • 等于:选择该条件后,需继续选择各维度的参数值。所创建的告警规则将仅适用于所选资源。每个维度不支持同时选择多个参数值。
    • 不等于:选择该条件后,需继续选择各维度的参数值。所创建的告警规则将适用于除所选资源之外的其他资源。每个维度不支持同时选择多个参数值。
    • 正则匹配:选择该条件后,按需选择正则表达式匹配相应的资源。所创建的告警规则将适用于符合该正则表达式的所有资源。
    • 正则不匹配:选择该条件后,按需选择正则表达式匹配相应的资源。所创建的告警规则将过滤符合该正则表达式的所有资源。
    说明 完成筛选条件设置后,会弹出数据预览区域。
    • 协议:遍历
    • 命名空间:遍历
    • 类型:遍历
    • 名称:遍历
    • 请求内容:遍历
    数据预览 数据预览区域展示告警条件对应的PromQL语句,并以时序曲线的形式展示相应的告警设置和所选资源的实际指标。

    默认仅展示首个资源的告警数据,您可以在该区域的筛选框中选择目标资源以及时间区间进行数据展示。

    说明
    • 告警阈值将会以一条红色直线的形式显示在时序曲线中,满足告警阈值的时序曲线显示为深红色,不满足告警阈值的时序曲线显示为蓝色。
    • 将鼠标悬浮于时序曲线上,可以查看对应时间点的资源详情。
    • 在时序曲线上选中一段时间,可以查看对应时间段的时序曲线。
    持续时间 需持续满足告警条件的时长,才会触发告警。例如,若持续时间设置为1分钟,则表示连续1分钟均满足告警条件时,才会触发告警。 1
    告警等级 自定义告警等级。默认告警等级为默认,告警严重程度从默认、P4、P3、P2、P1逐级上升。 默认
    告警内容 用户收到的告警信息。Kubernetes监控告警会根据选择的告警指标显示对应的默认告警内容,您也可以使用Go template语法在告警内容中自定义告警参数变量。 协议:{{$labels.protocol}} / 命名空间: {{$labels.namespace}} / Kind: {{$labels.type}} / name: {{$labels.name}} / 请求内容:{{$labels.content_key}},错误数超过阈值, 当前值{{ printf "%.2f" $value }}
    高级设置
    快速指定通知策略
    • 不指定通知规则:若选择此选项,当完成创建告警规则后,您可以在通知策略页面新建通知策略并指定分派规则和分派条件(如告警规则名称等)来匹配该告警规则。当该告警规则被触发产生告警事件后,告警信息会被发送给通知策略中指定的联系人。更多信息,请参见通知策略
    • 指定通知规则发送告警:告警被触发时,ARMS通过指定通知策略的通知方式发送告警信息。您可以选择已有的通知策略,也可以新建一个通知策略。更多信息,请参见通知策略
    不指定通知规则
    标签 设置告警标签,设置的标签可用作通知策略分派规则的选项。
    注释 设置告警的注释。

管理告警规则

K8s监控告警规则列表页面上,您可以对告警规则执行启动、停止、编辑、删除、查看告警详情等操作。

  1. 登录ARMS控制台
  2. 在左侧导航栏单击Kubernetes监控
  3. 在顶部菜单栏,选择地域。
  4. Kubernetes监控页面,单击Kubernetes集群名称。
  5. 在左侧导航栏单击报警配置
  6. K8s监控告警规则列表页面的操作列中,按需对目标告警规则采取以下操作:
    Kubernetes监控告警列表
    • 如需编辑告警规则,请单击编辑,在编辑K8s监控告警规则页面中编辑告警规则,并单击保存
    • 如需删除告警规则,请单击删除,并在提示对话框中单击确认
    • 如需启动已停止的告警规则,请单击启动,并在提示对话框中单击确认
    • 如需停止已启动的告警规则,请单击停止,并在提示对话框中单击确认
    • 如需查看告警事件历史,请单击告警历史,在告警事件历史页面上查看相关记录。