Container Compute Service (ACS)已整合至ACK One註冊叢集,您可以通過ACK One註冊叢集快速使用ACS提供的容器算力。本文介紹ACK One註冊叢集如何接入ACS算力。
ACK One註冊叢集對接方式
Container Compute Service (ACS)是以Kubernetes為使用者介面的Container Service產品,提供符合容器規範的算力資源。ACS的Kubernetes管控和容器算力分層設計,為Kubernetes提供一種層次化的解決方案:ACS的計算資源層負責底層Pod容器資源的調度和分配,而Kubernetes則在此基礎上負載業務負載管理,例如管理Deployment、Service、StatefulSet、CronJob等。
ACS容器算力可以通過虛擬節點(Virtual Node)的形式接入到Kubernetes叢集中,使得叢集可以輕鬆獲得極大的彈效能力,而不必受限於叢集的節點計算容量。ACS在接管Pod容器底層基礎設施的管理工作後,Kubernetes不再需要直接負責單個Pod的放置、啟動等工作,也不再需要關心底層虛擬機器的資源情況,通過ACS即可確保Pod需要的資源隨時可用。
在ACK One註冊叢集中,需要先通過組件中心安裝ack-virtual-node組件,以便部署虛擬節點並建立ACS Pod。當叢集需要擴容時,可以直接在虛擬節點下按需建立ACS Pod,無需規劃節點的計算容量,且ACS Pod與叢集中真實節點上的Pod之間網路互連。為了更有效地利用資源、縮短擴容時間並降低成本,建議將部分長時間運行且流量彈性變化的業務負載調度至虛擬節點。隨著業務流量的減少,可以迅速釋放虛擬節點上的Pod,以減少使用成本。虛擬節點上的Pod均基於ACS運行在安全隔離的容器運行環境中,每個Pod對應一個ACS執行個體。更多資訊,請參見註冊叢集概述。
前提條件
建立ACK One註冊叢集並接入資料中心或者其他雲廠商的Kubernetes叢集(建議版本為1.24及以上)。具體操作,請參見建立註冊叢集。
已安裝ACK Virtual Node組件,且組件版本為2.13.0及以上。具體操作,請參見為ack-virtual-node組件配置RAM許可權及安裝ack-virtual-node組件。
ACK One註冊叢集使用ACS CPU算力樣本
ACK Virtual Node組件安裝或升級到2.13.0及以上版本後,將同時支援ACS和ECI兩種算力。
在Pod調度到虛擬節點的情境中,如果沒有指定為ACS的算力類型,則預設會優先使用ECI彈性執行個體。
ACK使用ACS CPU算力可以通過以下步驟實現:
通過NodeSelector、親和性和反親和性、ResourcePolicy和配置標籤
alibabacloud.com/acs: true等調度方式將Pod調度到虛擬節點。具體步驟,請參見節點親和性調度。通過標籤(alibabacloud.com/compute-class:計算類型)指定建立ACS Pod的執行個體類型。關於ACS執行個體類型的介紹,請參見ACS Pod執行個體概述。
具體操作步驟如下:
部署Deployment。
NodeSelector
執行以下命令,查看虛擬節點的標籤。命令中的
virtual-kubelet-cn-shanghai-l請按實際內容修改。kubectl get node virtual-kubelet-cn-shanghai-l -oyaml預期輸出:
apiVersion: v1 kind: Node metadata: labels: beta.kubernetes.io/arch: amd64 beta.kubernetes.io/os: linux kubernetes.io/arch: amd64 kubernetes.io/hostname: virtual-kubelet-cn-shanghai-l kubernetes.io/os: linux kubernetes.io/role: agent service.alibabacloud.com/exclude-node: "true" topology.diskplugin.csi.alibabacloud.com/zone: cn-shanghai-l topology.kubernetes.io/region: cn-shanghai topology.kubernetes.io/zone: cn-shanghai-l type: virtual-kubelet # 所有虛擬節點都存在該標籤,可以使用該標籤實現Pod定向調度到虛擬節點。 name: virtual-kubelet-cn-shanghai-l spec: taints: - effect: NoSchedule key: virtual-kubelet.io/provider value: alibabacloud使用以下YAML內容建立nginx.yaml,部署2個Pod。
apiVersion: apps/v1 kind: Deployment metadata: name: nginx labels: app: nginx spec: replicas: 2 selector: matchLabels: app: nginx template: metadata: name: nginx labels: app: nginx alibabacloud.com/compute-class: general-purpose # 配置ACS Pod的算力類型,未配置預設general-purpose alibabacloud.com/compute-qos: default # 配置ACS Pod的算力品質,未配置預設default spec: nodeSelector: type: virtual-kubelet #定向調度到虛擬節點 tolerations: - key: "virtual-kubelet.io/provider" # 容忍虛擬節點的汙點 operator: "Exists" effect: "NoSchedule" containers: - name: nginx image: mirrors-ssl.aliyuncs.com/nginx:stable-alpine ports: - containerPort: 80 protocol: TCP resources: limits: cpu: 2 requests: cpu: 2建立應用Nginx並查看部署結果。
執行以下命令,建立Nginx應用。
kubectl apply -f nginx.yaml執行以下命令,查看部署結果。
kubectl get pods -o wide預期輸出:
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES nginx-54bcbc9b66-**** 1/1 Running 0 3m29s 192.168.XX.XXX virtual-kubelet-cn-shanghai-l <none> <none> nginx-54bcbc9b66-**** 1/1 Running 0 3m29s 192.168.XX.XXX virtual-kubelet-cn-shanghai-l <none> <none>可以看到,這兩個Pod通過
nodeSelector被調度到label為type=virtual-kubelet的節點上。
標籤調度
使用以下內容,建立nginx.yaml。
apiVersion: apps/v1 kind: Deployment metadata: name: nginx labels: app: nginx spec: replicas: 2 selector: matchLabels: app: nginx template: metadata: labels: app: nginx alibabacloud.com/acs: "true" # 配置使用ACS算力 alibabacloud.com/compute-class: general-purpose # 配置ACS Pod的算力類型,未配置預設general-purpose alibabacloud.com/compute-qos: default # 配置ACS Pod的算力品質,未配置預設default spec: containers: - name: nginx image: mirrors-ssl.aliyuncs.com/nginx:stable-alpine ports: - containerPort: 80 protocol: TCP resources: limits: cpu: 2 requests: cpu: 2執行以下命令,建立Nginx應用。
kubectl apply -f nginx.yaml執行以下命令,查看部署結果。
kubectl get pods -o wide預期輸出:
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES nginx-54bcbc9b66-**** 1/1 Running 0 3m29s 192.168.XX.XXX virtual-kubelet-cn-shanghai-l <none> <none> nginx-54bcbc9b66-**** 1/1 Running 0 3m29s 192.168.XX.XXX virtual-kubelet-cn-shanghai-l <none> <none>可以看到,這兩個Pod通過
nodeSelector被調度到label為type=virtual-kubelet的節點上。
執行以下命令,查看Nginx Pod詳情。
kubectl describe pod nginx-54bcbc9b66-****預期輸出:
Annotations: ProviderCreate: done alibabacloud.com/instance-id: acs-uf6008giwgjxlvn***** alibabacloud.com/pod-ephemeral-storage: 30Gi alibabacloud.com/pod-use-spec: 2-2Gi kubernetes.io/pod-stream-port: 10250 network.alibabacloud.com/enable-dns-cache: false topology.kubernetes.io/region: cn-shanghai輸出的Pod內容中存在註解
alibabacloud.com/instance-id: acs-uf6008giwgjxlvn*****則可確認該Pod為ACS Pod執行個體。
ACK One註冊叢集使用ACS GPU算力樣本
與ACS CPU算力的主要鏈路和使用流程相同,但使用ACS GPU算力還需要確保調度相關的組件版本符合預期,並進行一些額外的配置。
開通方式
目前在ACK One註冊叢集使用ACS GPU算力處於邀測階段,請提交工單申請。
使用方法
...
labels:
# label中聲明acs GPU資源需求
alibabacloud.com/compute-class: gpu #如為GPU類型,固定gpu即可
alibabacloud.com/compute-qos: default #計算qos類型,含義與普通acs算力相同
alibabacloud.com/gpu-model-series: example-model # GPU卡型,請按照實際情況替換,例如T4
...關於ACS的算力類型和算力品質,請參見計算類型與算力品質的對應關係。
關於
gpu-model-series的可選卡型,請參見GPU型號說明。
NodeSelector
使用以下樣本內容,建立GPU負載。
apiVersion: apps/v1 kind: Deployment metadata: name: dep-node-selector-demo labels: app: node-selector-demo spec: replicas: 1 selector: matchLabels: app: node-selector-demo template: metadata: labels: app: node-selector-demo # acs屬性 alibabacloud.com/compute-class: gpu alibabacloud.com/compute-qos: default alibabacloud.com/gpu-model-series: example-model # GPU卡型,請按照實際情況替換,例如T4 spec: # 指定vk的標籤 nodeSelector: type: virtual-kubelet # 容忍vk的taint tolerations: - key: "virtual-kubelet.io/provider" # 容忍虛擬節點的汙點 operator: "Exists" effect: "NoSchedule" containers: - name: node-selector-demo image: registry-cn-hangzhou.ack.aliyuncs.com/acs/stress:v1.0.4 command: - "sleep" - "1000h" resources: limits: cpu: 1 memory: 1Gi nvidia.com/gpu: "1" requests: cpu: 1 memory: 1Gi nvidia.com/gpu: "1"執行以下命令,查看GPU負載運行狀態。
kubectl get pod node-selector-demo-9cdf7bbf9-s**** -oyaml預期輸出:
phase: Running resources: limits: #other resources nvidia.com/gpu: "1" requests: #other resources nvidia.com/gpu: "1"
標籤調度
使用以下樣本內容,建立GPU負載。
apiVersion: apps/v1 kind: Deployment metadata: name: dep-node-selector-demo labels: app: node-selector-demo spec: replicas: 1 selector: matchLabels: app: node-selector-demo template: metadata: labels: app: node-selector-demo # acs屬性 alibabacloud.com/acs: "true" # 配置使用ACS算力 alibabacloud.com/compute-class: gpu alibabacloud.com/compute-qos: default alibabacloud.com/gpu-model-series: example-model # GPU卡型,請按照實際情況替換,例如T4 spec: containers: - name: node-selector-demo image: registry-cn-hangzhou.ack.aliyuncs.com/acs/stress:v1.0.4 command: - "sleep" - "1000h" resources: limits: cpu: 1 memory: 1Gi nvidia.com/gpu: "1" requests: cpu: 1 memory: 1Gi nvidia.com/gpu: "1"執行以下命令,查看GPU負載運行狀態。
kubectl get pod node-selector-demo-9cdf7bbf9-s**** -oyaml預期輸出:
phase: Running resources: limits: #other resources nvidia.com/gpu: "1" requests: #other resources nvidia.com/gpu: "1"