ACK提供了節點池功能對節點進行分組管理。節點池是具有相同屬性(例如執行個體規格、作業系統、標籤和汙點等)的一組節點的邏輯集合。一個叢集中可以建立多個不同配置和類型的節點池。您可以建立節點池,實現對節點進行統一的營運和管理。
建議您在建立節點池前,先參見節點池瞭解節點池的基本資料、使用情境、相關功能、涉及的計費等資訊。
操作入口
您可以在目的地組群的節點池頁面進行節點池的相關操作,包括建立、編輯、刪除、查看等。
登入Container Service管理主控台,在左側導覽列選擇叢集列表。
在叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇。
建立節點池
您可以在控制台完成節點池的配置,包括基本配置、網路設定、儲存配置等。部分配置項(尤其是節點池可用性相關和網路相關的配置)在建立後不支援調整,請參見下文重點關注。建立節點池的過程中不會影響其他已有節點池內節點和業務的運行。
除控制台外,ACK還支援通過API和Terraform方式建立節點池,請參見CreateClusterNodePool - 建立節點池、通過Terraform建立具備自動調整功能的節點池。
-
在節點池頁面,單擊建立節點池,然後在建立節點池對話方塊,完成建立節點池的配置項。
節點池建立完成以後,支援在編輯節點池頁面修改配置項。如下表所示,是否支援修改代表節點池建立後對應的配置項是否支援修改,
代表不支援修改,
代表支援修改。基本配置
配置項
說明
是否支援修改
節點池名稱
自訂節點池名稱。
✓
加密計算
說明-
當前僅白名單使用者可以配置加密計算,請提交工單申請。
-
僅容器運行時選擇為containerd時,需配置該參數。
是否開啟加密計算。加密計算是為有強安全訴求的使用者提供基於硬體加密技術的雲原生一站式機密計算容器平台,可以協助您保護資料使用(計算)過程中的安全性、完整性和機密性,同時簡化可信或機密應用的開發、交付和管理成本。更多資訊,請參見ACK-TEE機密計算。
✗
容器運行時
如何選型,請參見containerd、安全沙箱、Docker運行時的對比。
containerd(推薦):社區標準,支援1.20及以上版本。
安全沙箱:提供基於輕量級虛擬化技術的強隔離環境。使用流程及限制,詳見建立和管理安全沙箱節點池。
Docker(停止支援):僅支援1.22及以下版本,目前已不支援建立。
✗
擴縮容模式
✓
託管配置
ACK目前提供三種託管配置,可在不同程度上啟用節點池的自動化營運能力。
-
智能託管:開啟智能託管後,ACK 將自動根據工作負載按需動態擴縮容,同時 ACK 將負責作業系統版本升級、軟體版本升級、安全性漏洞修複等營運職責。
僅支援在開啟了智能託管模式的叢集中建立。
-
託管節點池:按需勾選所需的自動化營運能力,以及執行自動化營運任務的叢集維護視窗。
-
不開啟:不使用自動化營運能力,手動營運節點和節點池。
如需瞭解不同託管配置的差異及注意事項,請參見託管配置能力對比及注意事項。
網路設定
配置項
說明
是否支援修改
網路設定
專用網路
預設選擇叢集VPC,節點池建立完成後不可更改。
雲資源及計費說明:
VPC✗
交換器
節點池擴縮容時,根據擴縮容策略在選擇的vSwitch可用性區域下擴縮節點。為保障高可用,建議選擇2個及以上不同可用性區域。
如需建立vSwitch,請參見建立和管理交換器。
✓
執行個體和鏡像配置
配置項
說明
是否支援修改
付費類型
節點池擴容節點時預設採用的付費類型。
按量付費:可按需啟用和釋放。
包年包月:需配置購買時間長度以及自動續約。
搶佔式執行個體:目前僅支援具有保護期的搶佔式執行個體。需同時配置單台執行個體上限價格。
當指定執行個體規格的即時價格低於單台執行個體的最高出價時,執行個體將成功建立。保護期(1小時)過後,系統將每5分鐘檢查一次執行個體規格的即時價格與庫存。若市場價格高於出價或庫存不足,搶佔式執行個體將被釋放。使用建議,請參見搶佔式執行個體節點池最佳實務。
為保證節點池統一,不支援將按量付費、包年包月節點池修改為搶佔式執行個體節點池,反之亦然。
重要修改節點池的付費類型僅對擴容的新節點生效,不會改變節點池內已有節點的付費類型。如果您期望修改節點池中已有節點的付費類型,請參見隨用隨付轉訂用帳戶。
✓
執行個體相關的配置項
節點池擴容時,會從配置的ECS執行個體規格類型系列中分配。為提高擴容成功率,請選擇多個可用性區域下的多種執行個體規格,避免規格不可用或庫存不足。具體擴容的執行個體規格由配置的擴縮容策略決定。
為確保業務穩定性和資源調度的準確性,請勿在同一個節點池中混合使用GPU和非GPU執行個體規格。
可通過以下兩種方式配置擴容時使用的執行個體規格:
具體規格:根據vCPU、記憶體、規格類型系列、架構等維度指定具體的執行個體規格。
泛化配置:根據屬性(vCPU、記憶體等)選擇待使用或需排除的執行個體規格列表,進一步提升擴容成功率。請參見使用指定執行個體屬性配置節點池。
可參考控制台的彈性強度建議來配置,或在節點池建立後查看節點池彈性強度。
關於ACK不支援的執行個體規格及節點配置建議,請參見ECS執行個體規格配置建議。
✓
作業系統
雲市場鏡像處於灰階發布中。
節點池擴容節點時預設採用的作業系統鏡像。
公用鏡像:使用Alibaba Cloud Linux 3容器最佳化版、ContainerOS、Alibaba Cloud Linux 3、Ubuntu、Windows等作業系統的公用鏡像。鏡像詳情、cgroup版本情況及使用限制請參見作業系統。
自訂鏡像:使用自訂動作系統鏡像,詳細資料請參見如何基於建立好的ECS執行個體建立自訂鏡像,並使用該鏡像建立節點?。
後續如需升級或更換作業系統,請參見更換作業系統。
Alibaba Cloud Linux 2、CentOS 7已停止維護,請使用支援中的作業系統,推薦使用Alibaba Cloud Linux 3容器最佳化版、ContainerOS。
✓
安全強化
建立節點時,ACK會應用選擇的安全基準策略。
不開啟:不對ECS執行個體進行安全強化。
等保加固:阿里雲為Alibaba Cloud Linux等保2.0三級版鏡像提供了符合等保合規要求的基準檢查標準和掃描工具。在確保原生鏡像相容性和效能的同時,進行了等保合規適配,滿足《GB/T22239-2019資訊安全技術網路安全等級保護基本要求》,詳情請參見ACK等保加固使用說明。
但在此模式下,Root使用者無法通過SSH遠程登入。您可以通過ECS控制台通過VNC串連執行個體,並建立一個支援SSH登入的普通使用者。
阿里雲 OS 加固:僅支援Alibaba Cloud Linux 2或Alibaba Cloud Linux 3。
✗
登入方式
選擇等保加固時,僅支援設定密碼。
ContainerOS僅支援設定密鑰或建立後設定。如需使用密鑰,配置金鑰組後需啟動營運容器後才能使用,具體操作請參見營運ContainerOS節點。
建立節點時,ACK會將指定的密鑰或密碼預置到執行個體中。
建立時設定:
設定密鑰:阿里雲SSH金鑰組是一種安全便捷的登入認證方式,由公開金鑰和私密金鑰組成,僅支援Linux執行個體。
請同時配置登入名稱(root或ecs-user)和所需的金鑰組。
設定密碼:配置登入名稱(root或ecs-user)和密碼。
建立後設定:執行個體建立完成後,自行綁定金鑰組或重設執行個體密碼,請參見綁定SSH金鑰組和重設執行個體登入密碼。
✓
儲存配置
配置項
說明
是否支援修改
系統硬碟
根據業務需求選擇雲端硬碟類型,包括ESSD AutoPL、ESSD雲端硬碟、ESSD Entry以及上一代雲端硬碟(SSD雲端硬碟和高效雲端硬碟),配置容量和IOPS等。
可用系統硬碟類型取決於所選的執行個體規格類型系列。未展示的雲端硬碟類型即為不支援使用。
支援選擇配置更多系統硬碟類型,配置與系統硬碟不同的磁碟類型,提高擴容成功率。建立節點時,ACK將根據指定的磁碟類型順序,選擇第一個匹配的類型。
雲資源及計費說明:
ECSBlock Storage✓
數據盤
根據業務需求選擇雲端硬碟類型,包括ESSD AutoPL、ESSD雲端硬碟、ESSD Entry以及上一代雲端硬碟(SSD雲端硬碟和高效雲端硬碟),配置容量和IOPS等。
可用資料盤類型取決於所選的執行個體規格類型系列。未展示的雲端硬碟類型即為不支援使用。
掛載資料盤時,所有雲端硬碟類型均支援加密。選擇密鑰時,阿里雲預設使用服務密鑰(Default Service CMK)進行加密;您也可以選擇在KMS服務中預先建立的自訂密鑰(BYOK)進行加密。
節點建立過程中,將自動格式化最後一塊資料盤,並將
/var/lib/container掛載到該資料盤,將/var/lib/kubelet、/var/lib/containerd掛載到/var/lib/container。如需自訂掛載目錄,請調整資料盤的初始化配置,最多可選擇一塊資料盤作為容器運行時佔用目錄,詳情請參見ACK節點池中資料盤可以自訂目錄掛載嗎?
在需要容器鏡像加速、大模型快速載入等情境下,還可以使用快照建立資料盤,提升系統的響應速度和處理能力。
您可以選擇配置更多數據盤類型,配置與數據盤不同的磁碟類型,提高擴容成功率。建立節點時,ACK將根據指定的磁碟類型順序,選擇第一個匹配的類型。
一台ECS執行個體最多可掛載64塊資料盤,不同執行個體規格支援掛載的最多雲端硬碟數量不同。對於執行個體規格支援掛載的雲端硬碟數量上限,可以通過DescribeInstanceTypes介面查詢(DiskQuantity)。
雲資源及計費說明:
ECSBlock Storage✓
執行個體數量
配置項
說明
是否支援修改
期望節點數
節點池應該維持的總節點數量。建議至少配置2個節點,以確保叢集組件正常運行。您可以通過調整期望節點數,達到擴容或縮容節點池的目的,請參見擴縮容節點池。
如無需建立節點,可填寫為0,後續再手動調整或添加已有節點。
✓
進階配置
展開進階選項(選填),配置節點擴縮容策略、資源群組、ECS標籤、汙點等資訊。
-
-
單擊確認配置。
您可以在確認配置頁面的左下角單擊同等代碼,產生當前節點池配置對應的Terraform或SDK樣本參數。
節點池列表中節點池狀態顯示初始化中時,表明節點池正在建立;顯示為已啟用時,表明建立成功。
編輯節點池
建立節點池後,ACK叢集支援通過控制台調整部分節點池配置,例如節點池所在的虛擬交換器、付費類型、執行個體規格、系統硬碟及啟用或停用Auto Scaling等。您可以參見建立節點池的配置項說明瞭解支援更新的配置項。
節點池編輯過程中,不會影響節點池內已有節點和業務的運行。節點池配置更新後,後續節點池中新增的節點都將預設使用該配置。
-
節點池配置更新後,除特殊說明情境外(例如同步更新存量節點的 ECS 標籤、同步更新存量節點的標籤(Labels)及汙點(Taints)),不會修改節點池已有節點的配置,僅作用於新增節點。
-
切換節點池的擴縮容模式時:
-
由手動切換為自動:即開啟自動調整,需同步設定最小和最大執行個體數。
-
由自動切換為手動:即關閉自動調整,最小執行個體數將設定為0,最大執行個體數將設定為2000。期望節點數將自動設定為節點池當前的節點數量。
-
-
更新節點池配置需參見本步驟來實現。如通過其他方式對節點進行了更改,節點池升級時這些更改會被覆蓋。
-
在節點池列表頁面中,單擊目標節點池所在行操作列的編輯。
-
在編輯節點池頁面,編輯節點池的配置項,並按照頁面提示完成配置。
在節點池頁面,如果節點池狀態顯示更新中,則說明節點池正在變更中。變更完成後,狀態顯示為已啟用。
查看節點池
您可以查看節點池的基本資料、監控資訊,以及節點池中的全部節點資訊和節點伸縮活動的記錄。
單擊目標節點池名稱,查看以下資訊。
-
基本資料頁簽:展示叢集資訊、節點池資訊、節點配置資訊。如果叢集已開啟自動Auto Scaling,還將展示自動Auto Scaling的配置資訊。
-
監控頁簽:整合了阿里雲Prometheus服務,展示節點池的資源水位情況,包括CPU或記憶體使用量情況、磁碟使用方式、節點CPU或記憶體平均使用率等。
-
節點管理頁簽:當前節點池中的全部節點列表,支援對節點進行移除、營運、排水、調度等操作。單擊匯出可以通過CSV檔案匯出節點的各項資訊。
-
伸縮活動頁簽:最近節點執行個體伸縮活動記錄,包括伸縮後的執行個體數量、伸縮活動描述等。伸縮活動失敗時,您可以查看失敗的原因。關於擴縮容失敗常見錯誤碼,請參見手動擴縮容節點池。
刪除節點池
不同計費規則的執行個體釋放規則不同,請參見下文使用標準的操作刪除節點池中的節點。刪除節點池前,請確認該節點池是否設定了期望節點數,這將直接影響節點的釋允許存取為。
|
節點池 |
釋放規則 |
|
已開啟期望節點數的節點池 |
|
|
未開啟期望節點數的節點池 |
-
(可選)單擊目標節點池名稱,在基本資料頁簽中檢查是否配置了期望節點數。如果未啟用,期望節點數欄位會顯示為-。
-
在目標節點池右側的操作列,單擊
>刪除,仔細閱讀彈出資訊,確認無誤後,單擊確定。重要節點系統硬碟和資料盤的生命週期與節點綁定。當節點被釋放時,雲端硬碟會隨之釋放,盤內的所有資料將永久丟失且無法恢複。對於需要持久化儲存的資料,請使用持久化儲存卷(PersistentVolume, PV) 進行管理,實現儲存資料與節點生命週期的解耦,保障資料安全。
相關操作
節點池啟用完成後,您可以在節點池列表地區,按需進行以下操作。
|
介面詞 |
說明 |
相關文檔 |
|
同步節點池 |
節點資訊異常時,同步節點池的資料資訊。 |
無 |
|
詳情 |
節點池配置詳情。 |
無 |
|
擴縮容 |
|
|
|
編輯 |
調整節點池的配置,例如節點池所在的虛擬交換器、託管節點池配置、付費類型、執行個體規格、啟用或停用Auto Scaling等。 |
參見上文的編輯節點池 |
|
監控 |
整合了阿里雲Prometheus服務,展示節點池的資源水位情況,包括CPU或記憶體使用量情況、磁碟使用方式、節點CPU或記憶體平均使用率等。 |
參見上文的查看節點池 |
|
添加已有節點 |
如購買ECS執行個體後需將其添加到ACK叢集中作為Worker節點,或移除Worker節點後需重新加入節點池,可以使用添加已有節點的功能。此功能存在一些使用限制和注意事項,請參見文檔瞭解。 |
|
|
配置登入方式 |
設定節點的登入方式,支援通行金鑰和密碼兩種方式。 |
參見前文的執行個體和鏡像配置 |
|
託管配置 |
開啟節點池的自動化營運能力,包括節點故障自動回復、kubelet和運行時自動升級、OS CVE自動修複等。 |
參見前文的基本配置 |
|
複製 |
基於現有節點池配置,複製一個相同配置的節點池。 |
無 |
|
刪除 |
刪除不再使用的節點池,以減少不必要的資源浪費。節點池是否開啟期望節點數以及節點的計費模式會影響節點釋放的行為。 |
參見上文的刪除節點池 |
|
Kubelet 配置 |
在節點池維度自訂節點的kubelet參數配置,調整節點行為,例如整叢集資源預留以調配資源用量等。 |
|
|
Containerd 配置 |
在節點池維度自訂節點的containerd參數配置。例如,您可以給指定鏡像倉庫同時配置多個Mirror倉庫,或者指定跳過某個鏡像倉庫的安全性憑證的驗證。 |
|
|
OS 配置 |
在節點池維度自訂節點的OS參數配置,以調優系統效能。 |
|
|
Kubelet 升級 |
升級節點池中節點的kubelet版本和containerd版本。 |
|
|
更換作業系統 |
更換節點作業系統類型,或升級作業系統的版本。 |
|
|
修複 CVE(OS) |
執行CVE漏洞的批量修複,提升叢集的穩定性、安全性、合規性。部分CVE漏洞的修複需要通過重啟節點來實現,請參見文檔瞭解功能說明及注意事項。 |
|
|
節點恢複 |
當託管節點池中的節點發生異常時,ACK會自動發起故障節點的恢複操作,使節點保持正常運行(部分複雜的節點故障可能仍然需要手動修複)。關於ACK提供的檢查項及具體的恢複行為請參見文檔瞭解。 |
託管配置能力對比
|
託管配置 |
不開啟 |
託管節點池 |
智能託管 |
|
|
節點池配置 |
執行個體規格 |
手動設定 |
手動設定 |
可配置,支援按規格類型智能推薦 |
|
付費類型 |
手動設定 |
手動設定 |
僅支援隨用隨付 |
|
|
作業系統 |
手動設定 |
手動設定 |
僅支援容器最佳化作業系統 ContainerOS |
|
|
系統硬碟 |
手動設定 |
手動設定 |
預設推薦配置,20Gi |
|
|
資料盤 |
手動設定 |
手動設定 |
一塊資料盤用於 ContainerOS 作業系統的臨時儲存,大小可配置 |
|
|
自動擴縮容 |
可選開啟,手動設定 |
可選開啟,手動設定 |
內建開啟節點即時彈性 ,可手動設定 |
|
|
ECS系統事件自動響應 |
不支援 |
已內建開啟 |
已內建開啟 |
|
|
節點自愈 |
不支援 |
可選開啟,手動設定 |
已內建開啟 |
|
|
kubelet和containerd自動升級 |
通過自動升級叢集手動設定 |
已內建開啟 |
||
|
OS CVE漏洞自動修複 |
不支援 |
可選開啟,手動設定 |
已內建開啟 |
|
-
節點池開啟智能託管後,將根據您的工作負載需求動態擴縮容節點,預設最大支援擴容至 50 節點,您可以通過節點池的擴縮容功能修改最大執行個體數。
-
節點池開啟智能託管後,ACK 將負責作業系統版本升級、軟體版本升級、安全性漏洞修複等營運職責,涉及軟體版本升級、軟體配置修改、重啟、排水驅逐等操作。請避免對節點池中 ECS 節點進行手動營運,例如重啟、資料盤掛載、登入節點修改配置等,以避免自動化策略衝突影響。請您合理設定工作負載的副本數、PreStop 優雅下線策略、PodDisruptionBudget 策略等,以確保節點可排空營運且無業務中斷影響。
-
節點池開啟智能託管後,ACK 將基於採用不可變根檔案系統的作業系統 ContainerOS 提升節點安全性,請避免使用節點系統路徑儲存(如 HostPath),推薦使用 PVC 作為持久化儲存。
-
節點池開啟智能託管後,暫不支援 Arm、GPU、本地碟等執行個體規格,ACK 已為您推薦預設的執行個體規格類型,可以滿足大多數情境下的應用需求,您也可以在控制台根據實際業務情境調整。建議設定足夠數量的執行個體規格,以提升節點池的彈性強度,避免擴容失敗。
-
智能託管模式旨在提供自動化、智能化的Kubernetes叢集營運功能,在部分情境下,您仍需要履行一部分義務。詳情請參見責任共擔模型。
常見問題
如何基於建立好的ECS執行個體建立自訂鏡像,並使用該鏡像建立節點?
您可以在建立ECS執行個體後,根據業務需要自訂該執行個體(如安裝軟體、部署應用環境等),並為更新後的執行個體建立自訂鏡像。使用該鏡像建立的新執行個體,會包含您已配置的自訂項,省去您重複自訂執行個體的時間。
-
登入ECS執行個體,執行以下命令,刪除指定的檔案。關於如何登入執行個體,請參見使用Workbench登入Linux執行個體。
chattr -i /etc/acknode/nodeconfig-* rm -rf /etc/acknode systemctl disable ack-reconfig rm -rf /etc/systemd/system/ack-reconfig.service rm -rf /usr/local/bin/reconfig.sh rm -rf /var/lib/cloud systemctl stop kubelet systemctl disable kubelet rm -rf /etc/systemd/system/kubelet.service rm -rf /etc/systemd/system/kubelet.service.d/10-kubeadm.conf -
基於ECS執行個體建立自訂鏡像。相關注意事項和具體操作步驟,請參見使用執行個體建立自訂鏡像。
-
配置節點池,選擇作業系統類型為自訂鏡像,並參見前文說明完成節點池的建立。
相關文檔
-
當不再需要某節點繼續工作時,請按照標準化操作將節點移除,請參見移除節點。
-
ACK需要佔用一定的節點資源來為kube組件和system進程預留資源,請參見節點資源預留策略。
-
當叢集的容量規劃無法滿足應用Pod調度時,您可以啟用節點伸縮自動擴縮節點資源,請參見節點伸縮。
-
單Worker節點支援的最大Pod數受網路外掛程式類型影響,在大部分情境下不支援變更。如需提升可用的Pod數量,需通過節點池擴容、執行個體規格提升、重建叢集並重新規劃Pod網段等手段,具體操作請參見調整可使用的節點Pod數量。