容器服务ACK提供集群巡检功能。您可以扫描集群运行状况,发现集群中存在的潜在风险,例如云资源配额余量、Kubernetes集群关键资源水位等。本文介绍如何使用集群巡检功能防范集群中的潜在风险。

前提条件

配置集群巡检

重要 使用集群巡检功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。
  1. 登录容器服务管理控制台,在左侧导航栏中选择集群
  2. 集群列表页面中,单击目标集群名称或者目标集群右侧操作列下的详情
  3. 在集群管理页面左侧导航栏中,选择巡检和诊断 > 集群巡检,然后在集群巡检页面巡检规则区域,单击添加
  4. 配置定时巡检规则面板中,设置相应的时区定时规则,仔细检查后选中我已知晓并同意,然后单击保存配置

    如果您已配置定时巡检规则,可以在集群巡检页面的巡检规则区域,单击删除,在确认删除对话框单击确定。删除已有规则后,集群将不再巡检,您也可以重新配置新的规则。

    说明 您也可以在集群巡检页面的检查报告列表区域,单击执行巡检检查,手动巡检集群。

    集群定时巡检配置完成后,将按照指定的时间巡检集群。

查看集群巡检结果

  1. 登录容器服务管理控制台
  2. 在控制台左侧导航栏中,单击集群
  3. 集群列表页面中,单击目标集群名称或者目标集群右侧操作列下的详情
  4. 在集群管理页左侧导航栏中,选择巡检和诊断 > 集群巡检
  5. 集群巡检页面检查报告列表区域,单击目标检查报告操作列下方的查看详情

    检查报告页面可以查看巡检结果的详细信息,包括风险等级、风险项名称、异常影响及解决方案。关于集群巡检的常见风险预警及修复方案的更多信息,请参见集群巡检预警参考

    检查报告页面单击正常,然后单击全部风险,可以查看巡检到的全部风险详细内容。