全部产品
Search
文档中心

容器服务 Kubernetes 版 ACK:设置组件监控告警

更新时间:Feb 28, 2024

您可以通过应用实时监控服务中的Prometheus监控设置Knative组件的监控指标。本文介绍如何设置Knative组件监控告警信息。

前提条件

Knative组件及采集指标

Knative组件

Knative组件采集指标

knative-serving:

  • activator:负责启动和暂停Knative服务的实例。

  • autoscaler:根据负载自动调整Knative服务的实例数量。

  • autoscaler-hpa:根据水平自动扩展器 (Horizontal Pod Autoscaler) 的指标来调整Knative服务的实例数量。

  • controller-webhook:用于处理Knative服务控制器的Webhook。

  • 组件当前可用的实例数量。

  • 组件使用的CPU资源。

  • 组件使用的Memory资源。

knative-eventing:

  • eventing-controller:负责协调和处理事件。

  • eventing-webhook:用于处理事件Webhook请求的组件。

步骤一:安装Prometheus监控组件

方式一:创建集群时开启

在创建集群的组件配置页面,选中使用阿里云可观测监控 Prometheus 版。具体操作,请参见创建Kubernetes托管版集群

image.png

说明
  • 在创建集群时,系统默认选中使用阿里云可观测监控 Prometheus 版

  • 集群创建完成,系统将自动配置阿里云Prometheus监控服务。

方式二:在已有集群中开启

  1. 登录容器服务管理控制台,在左侧导航栏选择集群

  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择运维管理 > Prometheus 监控

  3. Prometheus监控页面,单击开始安装

    控制台会自动安装组件、检查监控大盘。安装完成后,单击各个页签查看相应监控数据。

(可选)步骤二:查看Pod监控信息

在进行报警策略设置前,您可以预先查看Pod相关监控信息。

  1. 登录Prometheus控制台

  2. 在页面顶部,选择所创建集群的所在地域。

  3. 在左侧导航栏单击实例列表,进入可观测监控 Prometheus 版的实例列表页面。

  4. 实例列表区域,单击目标实例,然后在实例详情页面的左侧导航栏,单击大盘列表,然后在大盘列表页面,单击目标大盘的名称,即可在浏览器新窗口中打开对应的监控仪表板,并查看Pod的CPU、Memory以及Pod个数。

步骤三:新建通知策略

您需要先在通知策略页面创建自定义通知策略。当告警触发时,告警中心会根据配置的通知策略对产生的告警事件进行分派、处理并发送通知。具体操作,请参见通知策略

步骤四:设置组件告警规则

  1. 登录Prometheus控制台

  2. 在左侧导航栏,单击告警规则列表,然后在页面顶部,选择所创建集群的所在地域。

  3. Prometheus告警规则页面左上角,单击创建Prometheus告警规则

    您可以通过静态阈值自定义PromQL创建Prometheus告警规则。具体操作,请参见Prometheus告警规则

  4. 单击完成,规则即可生效。