alicloud-monitor-controller是阿里云容器服务Kubernetes版提供对接云监控的系统组件。本文介绍alicloud-monitor-controller组件的信息、使用说明和变更记录。

组件介绍

alicloud-monitor-controller是阿里云容器服务Kubernetes版提供对接云监控的系统组件。当创建、变更、删除应用的时候,alicloud-monitor-controller会自动同步应用元数据到云监控,从而实现应用的容器监控。此外alicloud-monitor-controller还提供设置报警模板的功能,开发者可以通过控制台开启该功能。

使用说明

关于alicloud-monitor-controller组件的使用,请参见容器服务报警管理

变更记录

2023年02月

版本号镜像地址变更时间变更内容变更影响
v1.8.0-7c28347-aliyunregistry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.8.0-7c28347-aliyun2023年02月24日
  • ACK报警中心通知方式支持钉钉、企业微信、飞书机器人。
  • 支持默认审计报警规则。
此次升级不会对业务造成影响。

2022年07月

版本号镜像地址变更时间变更内容变更影响
v1.6.5-2c5c836-aliyunregistry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.6.5-2c5c836-aliyun2022年07月07日
  • 支持阿里云内网环境。
  • 修复镜像安全漏洞。
  • 修复网络问题导致的规则同步失败问题。
  • 修复同步阿里云Prometheus报警规则逻辑。
此次升级不会对业务造成影响。

2022年04月

版本号镜像地址变更时间变更内容变更影响
v1.6.1-aa20856-aliyun registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.6.1-aa20856-aliyun2022年04月15日
  • 支持阿里云Prometheus默认报警规则,如集群核心组件、集群Workload异常等报警规则。
  • 支持集群节点操作系统内核宕机默认报警规则。
  • 支持无公网访问权限的集群环境。
此次升级不会对业务造成影响。

2022年03月

版本号镜像地址变更时间变更内容变更影响
v1.5.15-ed0a4c72-aliyun registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.15-ed0a4c72-aliyun 2022年03月02日
  • 修复某些情况下,无法同步报警规则的问题。
  • 修复组件镜像安全漏洞。
此次升级不会对业务造成影响。

2021年11月

版本号镜像地址变更时间变更内容变更影响
v1.5.13-6990db0e-aliyunregistry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.13-6990db0e-aliyun2021年11月04日支持容器服务报警中心集群基础资源默认报警能力。此次升级不会对业务造成影响。

2021年08月

版本号镜像地址变更时间变更内容变更影响
v1.5.12-f7aedb4a-aliyunregistry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.12-f7aedb4a-aliyun2021年08月23日优化容器服务报警配置能力。此次升级不会对业务造成影响。
v1.5.10-a75e4ee2-aliyunregistry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.10-a75e4ee2-aliyun2021年08月19日优化容器服务报警配置能力。此次升级不会对业务造成影响。

2021年04月

版本号镜像地址变更时间变更内容变更影响
v1.5.7-e1d5de8a-aliyunregistry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.7-e1d5de8a-aliyun2021年04月23日支持容器服务事件报警能力,可通过CRD方式配置容器服务事件报警。此次升级不会对业务造成影响。

2020年07月

版本号镜像地址变更时间变更内容变更影响
v1.4.0-49ff2362-aliyunregistry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.4.0-49ff2362-aliyun2020年07月24日
  • 支持采集Windows节点池与Linux节点池混合部署场景。
  • 支持调整多档位的弹性灵敏度,目前支持15s、20s、30s、60s四个档位。
  • 修复应用滚动更新时HPA误弹的问题。
此次升级不会对业务造成影响。

问题诊断

云监控无应用分组

请按照以下方式进行预检查:
  • 检查kube-system命名空间下alicloud-monitor-controller的Pod是否正常运行。
  • 检查组件版本,如果组件的版本与当前最新的版本存在差异,建议升级组件版本。
  • 检查组件对应的日志,查看是否存在网络超时、SDK调用报错等问题。

按上述说明检查后,没有发现问题,请按照以下工单模板提交工单

工单模板
  1. 是否已更新至最新版本。

  2. 组件日志是否存在SDK调用流控等异常问题,如存在异常请删除Pod。

    未发现,重启未恢复

  3. 工单内附完整alicloud-monitor-controller日志。

    上传日志详情压缩包

云监控应用分组无数据

请按照以下方式进行预检查。

检查应用分组中实例名称是否与应用的Pod名称相对应:
  • 如果实例名称异常,请按照上述云监控无应用分组的检查方法进行检查。
  • 如果实例名称正常,则检查kube-system命名空间下的metrics-server的Pod是否正常运行,检查日志是否正常稳定输出。如果日志中出现Successful write 164190 bytes metrics to monitor server,则表明日志正常稳定输出。

按上述说明检查后,没有发现问题,请按照以下工单模板提交工单

工单模板
  1. 检查分组中实例的名称是否与应用的Pod一致。

  2. 检查kube-system下的metrics-server组件是否可以正确输出日志。

  3. 提供集群ID,应用名称,Pod名称。