资源画像 - 容器服务 Kubernetes 版 ACK

ACK为K8s原生的工作负载提供了资源画像的能力，通过对资源使用量历史数据的分析，实现了容器粒度的资源规格推荐，可以有效简化为容器配置Request和Limit的复杂度。本文介绍如何通过控制台和命令行使用资源画像功能。

前提条件及注意事项

仅支持ACK Pro版集群。具体操作，请参见创建ACK Pro版集群。
已安装ack-koordinator（原ack-slo-manager）。具体操作，请参见ack-koordinator。
目前资源画像控制台已在成本套件中开放公测，可直接访问使用。
为了确保画像结果的准确性，建议您在开启工作负载的资源画像后最少观察等待1天以上，以便累积充足的数据。

费用说明

ack-koordinator组件本身的安装和使用是免费的，不过需要注意的是，在以下场景中可能产生额外的费用：

ack-koordinator是非托管组件，安装后将占用Worker节点资源。您可以在安装组件时配置各模块的资源申请量。
ack-koordinator默认会将资源画像、精细化调度等功能的监控指标以Prometheus的格式对外透出。若您配置组件时开启了ACK-Koordinator开启Prometheus监控指标选项并使用了阿里云Prometheus服务，这些指标将被视为自定义指标并产生相应费用。具体费用取决于您的集群规模和应用数量等因素。建议您在启用此功能前，仔细阅读阿里云Prometheus计费说明，了解自定义指标的免费额度和收费策略。您可以通过账单和用量查询，监控和管理您的资源使用情况。

使用限制

组件	版本要求
Kubernetes	≥v1.18
metrics-server	≥v0.3.8
ack-koordinator（ack-slo-manager）	≥v0.7.1
Helm版本	≥v3.0

重要

当您使用的容器运行时为Containerd，且节点加入集群的时间早于2022年01月19日14:00点，您需要重新加入节点或升级到最新版本的K8s。关于升级集群的具体操作，请参见升级ACK集群。

资源画像介绍

Kubernetes为容器资源管理提供了资源请求（Request）的资源语义描述。当容器指定Request时，调度器会将其与节点的资源容量（Allocatable）进行匹配，决定Pod应该被分配到哪个节点。容器的Request一般基于人工经验填写，管理员会参考容器的历史利用率情况、应用的压测表现，并根据线上运行情况的反馈持续调整。

但基于人工经验的资源规格配置模式存在以下局限性：

为了保障线上应用的稳定性，管理员通常会预留相当数量的资源Buffer来应对上下游链路的负载波动，容器的Request配置会远高于其实际的资源利用率，导致集群资源利用率过低，造成大量资源浪费。
当集群分配率较高时，为了提升集群资源利用率，管理员会主动缩小Request配置，协调更多的资源容量。该操作会提升容器的部署密度，当应用流量上涨时会影响集群的稳定性。

针对以上问题，ack-koordinator提供资源画像能力，实现容器粒度的资源规格推荐，降低容器配置的复杂度。ACK通过控制台提供了相应功能，便于应用管理员快速分析应用资源规格的合理性，按需进行资源规格配置的变更。同时，ACK还提供命令行的访问方式，支持通过CRD直接对应用资源画像进行管理。

通过控制台使用资源画像

步骤一：安装资源画像

登录容器服务管理控制台，在左侧导航栏选择集群。
在集群列表页面，单击目标集群名称，然后在左侧导航栏，选择成本套件 > 成本优化。
在成本优化页面，单击资源画像页签，然后在资源画像区域，按照页面提示开启功能。
- 组件安装或升级：按照页面提示安装或升级ack-koordinator组件。首次使用时，需要安装ack-koordinator组件。
  说明
  当前的ack-koordinator版本<0.7.0时，需进行迁移和升级。具体操作，请参见将ack-koordinator从应用市场迁移至组件中心。
- 画像配置：首次使用时，在安装或升级完成后，您可以勾选启用默认配置控制资源画像的开启范围（推荐使用），也可后续在控制台中单击画像配置进行调整。
单击开启画像，进入资源画像页面。

步骤二：资源画像策略管理

登录容器服务管理控制台，在左侧导航栏选择集群。
在集群列表页面，单击目标集群名称，然后在左侧导航栏，选择成本套件 > 成本优化。

在成本优化页面，单击资源画像页签，然后单击画像配置。

画像配置分为全量配置和自定义配置两种模式，资源画像组件安装过程中推荐的默认配置为全量配置模式。您可以在此对配置模式和配置参数进行修改，并单击确定生效。

全量配置模式（推荐）

全量配置模式将为所有工作负载开启资源画像，默认排除arms-prom和kube-system两个系统命名空间。

配置项	说明	取值范围
排除的命名空间	不开启资源画像的命名空间，一般为系统组件对应的命名空间。最终开启范围为命名空间和负载类型的交集。	当前集群内已经存在的命名空间，支持多选，默认值为kube-system和arms-prom。
开启的负载类型	开启资源画像的负载类型范围。最终开启范围为命名空间和负载类型的交集。	支持K8s原生的三类工作负载，包括Deployment、StatefulSet和DaemonsSet，支持多选。
CPU/内存资源消耗冗余	生成资源画像参考的安全冗余水位，详见下文描述。	要求为非负数，提供三档常用的冗余度70%、50%、30%。

自定义配置模式

自定义配置模式仅开启一部分命名空间的工作负载，若您的集群规模较大（例如1000节点以上），或仅需试用开启一部分工作负载，可以通过自定义配置模式按需指定。

配置项	说明	取值范围
开启的命名空间	开启资源画像的命名空间，最终开启范围为命名空间和负载类型的交集。	当前集群内已经存在的命名空间，支持多选。
负载类型	开启资源画像的负载类型范围，最终开启范围为命名空间和负载类型的交集。	支持K8s原生的三类工作负载，包括Deployment、StatefulSet和DaemonsSet，支持多选。
CPU/内存资源消耗冗余	生成资源画像参考的安全冗余水位，详见下文描述。	要求为非负数，提供三档常用的冗余度（70%、50%、30%）。

资源消耗冗余：管理员在评估应用业务容量时（例如QPS），通常不会将物理资源使用到100%。这既包括超线程等物理资源的局限性，也包括应用自身需要保留部分资源以应对高峰时段的负载请求。当画像值与原始资源请求的差距超过安全冗余时，会提示降配建议，具体算法参见应用画像概览部分中有关画像建议的说明。资源冗余

步骤三：查看应用画像概览

资源画像的策略配置完成后，您可以在资源画像页面查看各工作负载的资源画像情况。

为提高画像结果准确性，首次使用时系统将提示需要至少累积24小时的数据。

画像总体概览以及各列的详细说明如下表所示。

说明

下表中，“-”代表不涉及。

列名	含义	取值说明	是否支持字段筛选
工作负载名称	对应工作负载的名字（Name）。	-	支持。可在菜单栏顶部按名称进行精确查找。
命名空间	对应工作负载的名字（Namespace）	-	支持。默认筛选条件中不包括kube-system命名空间。
工作负载类型	对应工作负载的类型。	包括Deployment、DaemonSet和StatefulSet三种类型。	支持。默认筛选条件为全部。
CPU请求	工作负载Pod的CPU资源申请量（Request）。	-	不支持。
内存请求	工作负载Pod的内存资源申请量。	-	不支持。
画像数据状态	工作负载资源画像。	收集中：资源画像刚创建，累积的数据较少，首次使用时建议至少等待一天以上，确保工作负载稳定运行一段时间，完整覆盖了流量的波峰波谷之后再使用。正常：资源画像结果已经生成。工作负载已删除：对应的工作负载已经删除，画像结果将在保留一段时间后自动删除。	不支持。
CPU画像、内存画像	资源画像针对工作负载原始的资源请求量给出的规格（Request）调整建议，建议参考了资源画像值、原始资源请求量（Request）以及画像策略配置的资源消耗冗余，详见下文描述。	包括升配、降配、以及保持三种。对应的百分比为偏差幅度。计算公式为Abs（画像值-请求值） / 请求值。	支持，默认筛选条件包括升配和降配。
创建时间	画像结果的创建时间。	-	不支持。
资源变配	评估画像结果和改配建议后，单击资源变配进行资源的升降配置。更多信息，请参见下文的步骤五：变更应用资源规格。	-	不支持。

ACK资源画像会为工作负载的每个容器资源规格生成画像值，通过对比画像值（Recommend）、原始资源请求量（Request），以及画像配置的资源消耗冗余（Buffer）。资源画像控制台会为工作负载生成操作的提示，例如对资源请求提高或降低（即升配或降配）。若工作负载有多个容器，则会提示偏差幅度最大的容器，具体计算原理如下。

画像值（Recommend）大于原始资源请求量（Request）：表示容器长期处于资源超用状态（使用量大于申请量），存在稳定性风险，应及时提高资源规格，控制台提示“建议升配”。

画像值（Recommend）小于原始资源请求量（Request）：表示容器可能有一定程度的资源浪费，可以降低资源规格，需要结合画像配置的资源消耗冗余进行判断，详情如下：
1. 根据画像值和配置的资源消耗冗余，计算目标资源规格（Target）：Target = Recommend * (1 + Buffer)
2. 计算目标资源规格（Target）与原始资源请求量（Request）的偏离程度（Degree）：Degree = 1 - Request / Target
3. 根据画像值以及偏离程度（Degree）的水位，生成CPU和内存建议的提示操作，若偏离程度（Degree）的绝对值小于0.1，则提示建议降配信息
针对其他情况，资源画像为应用资源规格建议的提示为保持，表示可以暂时不调整。

步骤四：查看应用画像详情

在资源画像页面，单击工作负载名称，进入对应的画像详情页面。

详情页包括三部分功能：工作负载基本信息、各容器的画像详情资源曲线、针对应用进行资源规格变更窗口。应用画像详情

如上图所示，以CPU为例，画像详情资源曲线中各项指标的含义如下。

曲线名称	含义
cpu limit	容器的CPU资源限制值。
cpu request	容器的CPU资源请求值。
cpu recommend	容器的CPU资源画像值。
cpu usage（average）	对应工作负载内，各容器副本CPU使用量的平均值。
cpu usage（max）	对应工作负载内，各容器副本CPU使用量的最大值。

步骤五：变更应用资源规格

在应用画像详情页面底部的资源变配区域，根据画像生成的画像值修改各容器的资源规格。

各列含义如下：资源变更

配置项	含义
当前所需资源	容器当前填写的资源请求量（Request）。
当前限制资源	容器当前填写的资源限制量（Limit）。
画像值	资源画像为容器生成的画像值，可作为资源请求量（Request）的参考值。
安全冗余	资源画像策略管理中配置的安全冗余，可作为目标所需资源的参考值，例如在画像值的基础上累加冗余系数（如上图4.28 * 1.3 = 5.6）。
目标所需资源	容器资源请求量（Request）计划调整的目标值。
目标限制资源	容器资源限制量（Limit）计划调整的目标值。注意，若工作负载使用了CPU拓扑感知调度，CPU资源的限制需要配置为整数。

配置完成后，单击提交，将执行资源规格更新操作并自动跳转到工作负载详情页。
资源规格更新后，控制器会对工作负载进行滚动更新并重新创建Pod。

通过命令行使用资源画像

步骤一：启用资源画像

使用以下YAML内容，创建recommendation-profile.yaml文件，开启工作负载的资源规格画像。

创建RecommendationProfile CRD，可以开启工作负载的资源画像，并获取容器的资源规格画像数据。RecommendationProfile CRD支持通过命名空间（Namespace）以及工作负载类型控制开启范围，开启范围为二者的交集。

apiVersion: autoscaling.alibabacloud.com/v1alpha1
kind: RecommendationProfile
metadata:
  # 对象名称，nonNamespaced类型不需指定命名空间。
  name: profile-demo
spec:
  # 开启资源画像的工作负载类型。
  controllerKind:
  - Deployment
  # 开启资源画像的命名空间范围。
  enabledNamespaces:
  - default

各项配置字段含义如下：

参数	类型	说明
`metadata.name`	String	表示对象的名称。若RecommendationProfile为nonNamespaced类型，则无需指定命名空间。
`spec.controllerKind`	String	表示开启资源画像的工作负载类型。支持的工作负载类型包括Deployment 、StatefulSet和DaemonSet。
`spec.enabledNamespaces`	String	表示开启资源画像的命名空间范围。

执行以下命令，为目标应用开启资源画像。
```
kubectl apply -f recommender-profile.yaml
```

使用以下YAML内容，创建cpu-load-gen.yaml文件。

apiVersion: apps/v1
kind: Deployment
metadata:
  name: cpu-load-gen
  labels:
    app: cpu-load-gen
spec:
  replicas: 2
  selector:
    matchLabels:
      app: cpu-load-gen-selector
  template:
    metadata:
      labels:
        app: cpu-load-gen-selector
    spec:
      containers:
      - name: cpu-load-gen
        image: registry.cn-zhangjiakou.aliyuncs.com/acs/slo-test-cpu-load-gen:v0.1
        command: ["cpu_load_gen.sh"]
        imagePullPolicy: Always
        resources:
          requests:
            cpu: 8 # 该应用的CPU请求资源为8核。
            memory: "1Gi"
          limits:
            cpu: 12
            memory: "2Gi"

执行以下命令，通过安装cpu-load-gen.yaml部署cpu-load-gen应用。
```
kubectl apply -f cpu-load-gen.yaml
```

执行以下命令，获取资源规格画像结果。

kubectl get recommendations -l \
  "alpha.alibabacloud.com/recommendation-workload-apiVersion=apps-v1, \
  alpha.alibabacloud.com/recommendation-workload-kind=Deployment, \
  alpha.alibabacloud.com/recommendation-workload-name=cpu-load-gen" -o yaml

说明

为了确保画像结果的准确性，建议您最少等待1天以上，以便累积充足的数据。

ack-koordinator为每个开启资源画像的工作负载生成对应的资源规格画像，并将结果保存在Recommendation CRD中。名为cpu-load-gen.yaml的工作负载资源规格画像结果示例如下。

apiVersion: autoscaling.alibabacloud.com/v1alpha1
kind: Recommendation
metadata:
  labels:
    alpha.alibabacloud.com/recommendation-workload-apiVersion: app-v1
    alpha.alibabacloud.com/recommendation-workload-kind: Deployment
    alpha.alibabacloud.com/recommendation-workload-name: cpu-load-gen
  name: f20ac0b3-dc7f-4f47-b3d9-bd91f906****
  namespace: recommender-demo
spec:
  workloadRef:
    apiVersion: apps/v1
    kind: Deployment
    name: cpu-load-gen
status:
  recommendResources:
    containerRecommendations:
    - containerName: cpu-load-gen
      target:
        cpu: 4742m
        memory: 262144k
      originalTarget: # 表示资源画像算法的中间结果，不建议直接使用。
       # ...

为了便于检索，Recommendation和工作负载的Namespace一致，同时在Label中保存了工作负载的API Version、类型以及名称，格式如下表所示。

Label Key	说明	示例
alpha.alibabacloud.com/recommendation-workload-apiVersion	工作负载的API Version，由K8s的Label规范约束，正斜线（/）将被替换为短划线（-）。	app-v1（替换前为app/v1）
alpha.alibabacloud.com/recommendation-workload-kind	对应的工作负载类型，例如Deployment、StatefulSet等。	Deployment
alpha.alibabacloud.com/recommendation-workload-name	工作负载名称，由K8s的Label规范约束，长度不能超过63个字符。	cpu-load-gen

各容器的资源规格画像结果保存在status.recommendResources.containerRecommendations中，各字段含义如下表所示。

字段名称	含义	格式	示例
`containerName`	表示容器名称。	string	cpu-load-gen
`target`	表示资源规格画像结果，包括CPU和Memory两个维度。	map[ResourceName]resource.Quantity	cpu: 4742mmemory: 262144k
`originalTarget`	表示资源规格画像算法的中间结果，不建议直接使用。若您有特殊需求，请提交工单。	-	-

说明

单个Pod画像的CPU最小值为0.025核，内存的最小值为250 MB。

通过对比目标应用（cpu-load-gen.yaml）中声明的资源规格和本步骤画像检测结果，以CPU为例，可以发现该容器的Request申请过大。您可以通过调小Request来节省集群资源容量。

类别	原始资源规格	资源画像规格
CPU	8核	4.742核

步骤二：（可选）通过Prometheus查看结果

ack-koordinator为资源画像结果提供了Prometheus查询接口，您可以通过ACK提供的Prometheus监控直接查看。

如果您首次使用该功能的大盘，请确保资源画像大盘已经升级到最新版本。关于升级的具体操作，请参见相关操作。
通过ACK控制台Prometheus监控查看资源画像结果的具体操作如下：
1. 登录容器服务管理控制台，在左侧导航栏选择集群。
2. 在集群列表页面，单击目标集群名称，然后在左侧导航栏，选择运维管理 > Prometheus监控。
3. 在Prometheus监控页面，选择成本分析/资源优化 > 资源画像。
  在资源画像页签，查看详细数据，包括容器的规格（Request）、容器实际的资源使用量（Usage）以及容器的资源规格画像值（Recommend）。更多信息，请参见阿里云Prometheus监控。

如果您自建了Prometheus监控，请参考以下监控项来配置大盘。

#指定工作负载中容器的CPU资源规格画像。
slo_manager_recommender_recommendation_workload_target{exported_namespace="$namespace", workload_name="$workload", container_name="$container", resource="cpu"}
#指定工作负载中容器的Memory资源规格画像。
slo_manager_recommender_recommendation_workload_target{exported_namespace="$namespace", workload_name="$workload", container_name="$container", resource="memory"}

FAQ

资源画像的算法原理是什么？

资源画像算法涉及一套多维度的数据模型，算法原理可以总结为以下几点：

资源画像算法会持续不断地收集容器的资源使用数据，取CPU和内存的聚合统计值生产画像结果。
针对时间这一因素进行了优化，在聚合统计时，较新的数据采样点会拥有更高的权重。
算法参考了容器出现OOM等运行状态信息，可以进一步提高画像值的准确性。

资源画像对应用的类型有什么要求？

适合于在线服务类应用使用。

目前资源画像的结果优先考虑满足容器的资源需求，确保可以覆盖绝大部分数据样本。不过对于离线应用来说，这种批处理类型的任务更加关注整体的吞吐，可以接受一定程度的资源竞争，以提高集群资源的整体利用率，画像结果对于离线应用来说会显得有些保守。此外，对于关键的系统组件，通常以“主备”的形式部署多个副本，处于“备份”角色的副本长期处于闲置状态，这些副本的资源用量样本也会对画像算法产生一定程度的干扰。针对以上场景，请对画像结果按需加工后再使用，后续您可持续关注资源画像的产品动态。

是否可以直接使用画像值来设置容器的Request和Limit？

需要结合业务自身特点来判断，资源画像提供的结果是对应用当前资源需求情况的总结，管理员应结合应用自身特性，在画像值的基础之上加工后使用，例如考虑留有一定的容量来应对流量高峰，或是做“同城双活”的无缝切换，都需要留有一定数量的资源冗余；或者应用对资源较为敏感，无法在宿主机负载较高时平稳运行，也需要在画像值的基础上调高规格。

自建Prometheus如何查看资源画像监控指标？

参见步骤二：（可选）通过Prometheus查看结果，在环境中配置Grafana监控大盘。

如何清理资源画像结果和规则？

资源画像结果和规则分别保存在Recommendation和RecommendationProfile两个CRD中，执行以下命令删除所有资源画像结果和规则。

# 删除所有资源画像结果。
kubectl delete recommendation -A --all

# 删除所有资源画像规则。
kubectl delete recommendationprofile -A --all