ACK提供了節點池功能對節點進行分組管理。節點池是具有相同屬性(例如執行個體規格、作業系統、標籤和汙點等)的一組節點的邏輯集合。一個叢集中可以建立多個不同配置和類型的節點池。節點池的配置包含節點的屬性,例如節點執行個體規格、可用性區域、作業系統、標籤和汙點等。您可以建立節點池,並在節點池維度對節點進行統一的營運和管理。
建議您在建立節點池前,先參見節點池概述瞭解節點池的基本資料、使用情境、相關功能、涉及的計費等資訊。
操作入口
您可以在目的地組群的節點池頁面進行節點池的相關操作,包括建立、編輯、刪除、查看等。
登入Container Service管理主控台,在左側導覽列選擇叢集。
在叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇。
建立節點池
您可以在控制台完成節點池的配置,包括基本配置、網路設定、儲存配置等。部分配置項(尤其是節點池可用性相關和網路相關的配置)在建立後不支援調整,請參見下文重點關注。建立節點池的過程中不會影響其他已有節點池內節點和業務的運行。
除控制台外,ACK還支援通過API和Terraform方式建立節點池,請參見CreateClusterNodePool - 建立節點池、通過Terraform建立具備自動調整功能的節點池。
在節點池頁面,單擊建立節點池,然後在建立節點池對話方塊,完成建立節點池的配置項。
節點池建立完成以後,支援在編輯節點池頁面修改配置項。如下表所示,是否支援修改代表節點池建立後對應的配置項是否支援修改,
代表不支援修改,
代表支援修改,不涉及代表配置項僅在建立節點池時展示。基本配置
配置項
說明
是否支援修改
節點池名稱
自訂的節點池名稱。
不涉及
地區
預設選擇當前叢集所在地區,且不可更改。

加密計算
說明當前僅白名單使用者可以配置加密計算,請提交工單申請。
僅容器運行時選擇為containerd時,需配置該參數。
是否開啟加密計算。加密計算是為有強安全訴求的使用者提供基於硬體加密技術的雲原生一站式機密計算容器平台,可以協助您保護資料使用(計算)過程中的安全性、完整性和機密性,同時簡化可信或機密應用的開發、交付和管理成本。更多資訊,請參見ACK-TEE機密計算介紹。
不涉及
容器運行時
根據叢集Kubernetes版本選擇容器運行時。如何選型,請參見containerd、安全沙箱、Docker運行時的對比。
containerd(推薦):支援所有版本的叢集。
安全沙箱:支援1.31及以下版本的叢集。
Docker(已停止支援):支援1.22及以下版本的叢集。

託管節點池相關配置
託管節點池
ACK將在維護視窗期內執行託管節點池的自動化營運操作,例如kubelet升級、運行時升級、OS CVE漏洞自動修複等。您可以單擊設定,配置具體的維護策略。

自愈規則
需開啟託管節點池。
勾選後,節點NotReady時,系統會嘗試自動重啟相關組件來修複故障節點,並在重啟前執行排水。

自動升級規則
需開啟託管節點池。
勾選後,系統會在有可用的kubelet版本時自動升級到該版本。更多資訊,請參見升級節點池。

自動修複 CVE(OS)
需開啟託管節點池。
可配置自動修複漏洞的層級,包括高危、中危、低危漏洞。更多資訊,請參見開啟節點池節點故障自動回復、修複節點池作業系統CVE漏洞。
有些漏洞修複完成後需要重啟伺服器來使其修複生效。開啟必要時重啟節點以修複 CVE 漏洞後,ACK會按需自動重啟節點;未開啟時,需在修複完成後手動重啟節點。

叢集維護視窗
需開啟託管節點池。
託管節點池將在維護視窗進行自動化升級,例如節點池鏡像升級、運行時升級、Kubernetes版本等。
單擊設定,在叢集維護視窗對話方塊,設定維護周期、維護起始時間以及維護時間長度,然後單擊確定。

擴容模式
支援手動擴容和自動調整兩種擴容方式,根據業務需求和策略自動調整計算資源,節省叢集成本。

網路設定
配置項
說明
是否支援修改
網路設定
專用網路
預設選擇叢集VPC,節點池建立完成後不可更改。

交換器
節點池的擴縮容將根據擴縮容策略,在選擇的虛擬交換器可用性區域下彈出節點。您可以在已有虛擬交換器列表中,根據可用性區域選擇交換器。
如果沒有您需要的交換器,可以單擊建立虛擬交換器建立。具體操作,請參見建立和管理交換器。

執行個體和鏡像配置
配置項
說明
是否支援修改
付費類型
節點池擴容ECS執行個體時預設採用的付費類型,支援隨用隨付、訂用帳戶和搶佔式執行個體。
訂用帳戶:需配置購買時間長度以及自動續約。
搶佔式執行個體:目前僅支援具有保護期的搶佔式執行個體。需同時配置單台執行個體上限價格。
當指定執行個體規格的即時市場價格低於單台執行個體上限價格時,能成功建立搶佔式執行個體。超過保護期後(1小時),每5分鐘檢測一次執行個體規格的即時市場價格和庫存。如果某一時刻的市場價格高於出價或執行個體規格庫存不足,搶佔式執行個體會被釋放。使用方式,請參見搶佔式執行個體Auto Scaling最佳實務。
為保證節點池統一,隨用隨付、訂用帳戶節點池與搶佔式執行個體節點池之間不支援轉換。例如,對於建立節點池時選擇付費類型為隨用隨付或訂用帳戶的節點池,編輯節點池時不展示搶佔式執行個體;反之亦然。
重要修改節點池的付費類型僅對擴容的新節點生效,不會改變節點池內已有節點的付費類型。如果您期望修改節點池中已有節點的付費類型,請參見隨用隨付轉訂用帳戶。
為保證節點池的統一,不支援隨用隨付、訂用帳戶節點池修改為搶佔式執行個體節點池;也不支援搶佔式執行個體節點池修改為隨用隨付、訂用帳戶節點池。

執行個體相關的配置項
根據執行個體規格或屬性選擇Worker節點池使用的ECS執行個體,可通過vCPU、記憶體、規格類型系列、架構等屬性篩選所需的執行個體規格類型系列。您可以參見ECS執行個體規格配置建議擷取節點的配置建議。
節點池擴容時,將從選中的執行個體規格中擴容。具體擴容到的執行個體規格取決於節點池擴縮容策略。選擇的執行個體規格越多,節點池成功彈出節點的機率越大。
由於執行個體規格不可用或庫存不足,導致節點池彈出節點失敗時,可以嘗試添加更多執行個體規格。您可以參照控制台的彈性強度建議添加執行個體規格,也可以建立節點池後查看節點池彈性強度。
如果您選擇的執行個體均為GPU伺服器,您可以按需開啟共用 GPU 調度。更多資訊,請參見共用GPU調度概述。

作業系統
雲市場鏡像處於灰階發布中。
公用鏡像:Container Service for Kubernetes提供的ContainerOS、Alibaba Cloud Linux 3、Ubuntu、Windows等作業系統的公用鏡像。詳細資料請參見作業系統。
自訂鏡像:使用自訂動作系統鏡像,詳細資料請參見如何基於建立好的ECS執行個體建立自訂鏡像,並使用該鏡像建立節點?。
說明修改節點池系統鏡像時,僅影響新增節點,不會修改節點池已有節點的系統鏡像。已有節點的系統鏡像升級,請參見升級節點池。
為保證節點池內節點系統鏡像的統一,修改節點池鏡像時,僅允許修改為同類型鏡像的最新版本,不支援更改鏡像類型。

安全強化
為叢集開啟安全強化。建立完成後,加固方案不支援轉換。
不開啟:對ECS執行個體不進行安全強化。
等保加固:阿里雲為Alibaba Cloud Linux 2和Alibaba Cloud Linux 3等保2.0三級版鏡像提供等保合規的基準檢查標準和掃描程式。等保加固在保障原生鏡像相容性和效能的基礎上進行了等保合規適配,使其滿足國家資訊安全部發布的《GB/T22239-2019資訊安全技術網路安全等級保護基本要求》。更多資訊,請參見ACK等保加固使用說明。
重要等保加固會禁止Root使用者通過SSH遠程登入。您可通過ECS控制台使用VNC方式登入系統建立可使用SSH的普通使用者。具體操作,請參見使用VNC登入執行個體。
阿里雲 OS 加固:僅當系統鏡像選擇Alibaba Cloud Linux 2或Alibaba Cloud Linux 3時,可為節點開啟阿里雲OS加固。
不涉及
登入方式
選擇等保加固時,僅支援設定密碼。
支援設定密鑰、設定密碼和建立後設定。
建立時設定:
設定密鑰:阿里雲SSH金鑰組是一種安全便捷的登入認證方式,由公開金鑰和私密金鑰組成,僅支援Linux執行個體。
請同步配置登入名稱(root登入或ecs-user登入)和所需的金鑰組。
設定密碼:密碼限制為8~30個字元,且必須同時包含大寫字母、小寫字母、數字和特殊符號。
請同步配置登入名稱(root登入或ecs-user登入)和密碼。
建立後設定:在執行個體建立完成後,自行綁定金鑰組或者重設執行個體密碼。具體操作,請參見綁定SSH金鑰組和重設執行個體登入密碼。
不涉及
登入名稱
當登入方式選擇設定密鑰或者設定密碼時,需按需選擇以root登入還是以ecs-user登入。
不涉及
儲存配置
配置項
說明
是否支援修改
系統硬碟
支援ESSD AutoPL、ESSD雲端硬碟、ESSD Entry、SSD雲端硬碟和高效雲端硬碟。系統硬碟可選的類型與選擇的執行個體規格類型系列相關。如果雲端硬碟類型下拉式清單沒有顯示的雲端硬碟類型,代表不支援該雲端硬碟類型。
您可以選擇配置更多系統硬碟類型,配置與系統硬碟不同的磁碟類型,提高擴容成功率。建立執行個體時,系統將根據指定的磁碟類型順序,選擇第一個匹配的磁碟類型用於建立執行個體。

資料盤
支援ESSD AutoPL、ESSD雲端硬碟、ESSD Entry以及上一代雲端硬碟(SSD雲端硬碟和高效雲端硬碟)。資料盤可選的類型與選擇的執行個體規格類型系列相關。如果雲端硬碟類型下拉式清單沒有顯示的雲端硬碟類型,代表不支援該雲端硬碟類型。
掛載資料盤時,所有雲端硬碟類型均支援加密。選擇密鑰時,阿里雲預設使用服務密鑰(Default Service CMK)進行加密,您也可以選擇事先在KMS服務中建立好的自訂密鑰(BYOK)為該雲端硬碟進行加密。
在需要容器鏡像加速、大模型快速載入等情境下,您還可以使用快照建立資料盤,提升系統的響應速度和處理能力。
每個節點上需有一塊資料盤被掛載到
/var/lib/container(/var/lib/kubelet、/var/lib/containerd將掛載到/var/lib/container目錄下)。對於節點上的其他資料盤,您可以進行初始化設定,自訂其掛載目錄。使用說明,請參見ACK節點池中資料盤可以自訂目錄掛載嗎?
說明一台ECS執行個體最多可掛載64塊資料盤,不同執行個體規格支援掛載的雲端硬碟數量上限不同。執行個體規格支援掛載的雲端硬碟數量上限,可以通過DescribeInstanceTypes介面查詢(DiskQuantity)。


執行個體數量
配置項
說明
是否支援修改
期望節點數
節點池應該維持的總節點數量,建議至少配置2個節點,以確保叢集組件正常運行。您可以通過調整期望節點數,達到擴容或縮容節點池的目的,請參見擴縮容節點池。
如無需建立節點,可填寫為0,後續再手動調整,增加節點數。

進階配置
展開進階選項(選填),配置節點擴縮容策略、資源群組、ECS標籤、汙點等資訊。
單擊確認配置。
在節點池列表,如果節點池狀態顯示初始化中,表明節點池正在建立。建立完成後,狀態顯示為已啟用。
編輯節點池
建立節點池後,ACK叢集支援通過控制台調整部分節點池配置,例如節點池所在的虛擬交換器、付費類型、執行個體規格、系統硬碟及啟用或停用Auto Scaling等。您可以參見建立節點池的配置項說明瞭解支援更新的配置項。
節點池編輯過程中,不會影響節點池內已有節點和業務的運行。
節點池配置更新後,除特殊說明情境外(例如同步更新存量節點的 ECS 標籤、同步更新存量節點的標籤(Labels)及汙點(Taints)),不會修改節點池已有節點的配置,僅作用於新增節點。
節點池配置更新後,後續節點池中新增的節點都將預設使用該配置。
在節點池列表頁面中,單擊目標節點池所在行操作列的編輯。
在編輯節點池頁面,編輯節點池的配置項,並按照頁面提示完成配置。
在節點池頁面,如果節點池狀態顯示更新中,則說明節點池正在變更中。變更完成後,狀態顯示為已啟用。
查看節點池
您可以查看節點池的基本資料、監控資訊,以及節點池中的全部節點資訊和節點伸縮活動的記錄。
單擊目標節點池名稱,查看以下資訊。
基本資料頁簽:展示叢集資訊、節點池資訊、節點配置資訊。如果叢集已開啟自動Auto Scaling,還將展示自動Auto Scaling的配置資訊。
監控頁簽:整合了阿里雲Prometheus服務,展示節點池的資源水位情況,包括CPU或記憶體使用量情況、磁碟使用方式、節點CPU或記憶體平均使用率等。
節點管理頁簽:當前節點池中的全部節點列表,支援對節點進行移除、營運、排水、調度等操作。單擊匯出可以通過CSV檔案匯出節點的各項資訊。
伸縮活動頁簽:最近節點執行個體伸縮活動記錄,包括伸縮後的執行個體數量、伸縮活動描述等。伸縮活動失敗時,您可以查看失敗的原因。關於擴縮容失敗常見錯誤碼,請參見手動擴縮容節點池。
刪除節點池
不同計費規則的執行個體釋放規則不同,請參見下文使用標準的操作刪除節點池中的節點。在刪除節點池前,請確認該節點池是否設定了期望節點數,這將直接影響節點的釋允許存取為。
節點池 | 釋放規則 |
已開啟期望節點數的節點池 | |
未開啟期望節點數的節點池 |
(可選)單擊目標節點池名稱,在基本資料頁簽中檢查是否配置了期望節點數。如果未啟用,期望節點數欄位會顯示為-。
在目標節點池右側的操作列,單擊更多>刪除,仔細閱讀彈出資訊,確認無誤後,單擊確定。
相關操作
節點池啟用完成後,您可以在節點池列表地區,單擊更多,按需進行以下操作。
介面詞 | 說明 | 相關文檔 |
同步節點池 | 節點資訊異常時,同步節點池的資料資訊。 | 無 |
詳情 | 節點池配置詳情。 | 無 |
編輯 | 調整節點池的配置,例如節點池所在的虛擬交換器、託管節點池配置、付費類型、執行個體規格、啟用或停用Auto Scaling等。 | 參見上文的編輯節點池 |
監控 | 整合了阿里雲Prometheus服務,展示節點池的資源水位情況,包括CPU或記憶體使用量情況、磁碟使用方式、節點CPU或記憶體平均使用率等。 | 參見上文的查看節點池 |
擴縮容 | 支援手動擴容和自動調整兩種擴容方式,根據業務需求和策略自動調整計算資源,節省叢集成本。 | |
配置登入方式 | 設定節點的登入方式,支援通行金鑰和密碼兩種方式。 | 參見前文的執行個體和鏡像配置 |
開啟託管 | 開啟節點池的自動化營運能力,包括節點故障自動回復、kubelet和運行時自動升級、OS CVE自動修複等。 | 參見前文的基本配置 |
添加已有節點 | 如購買ECS執行個體後需將其添加到ACK叢集中作為Worker節點,或移除Worker節點後需重新加入節點池,可以使用添加已有節點的功能。此功能存在一些使用限制和注意事項,請參見文檔瞭解。 | |
複製 | 基於現有節點池配置,複製一個相同配置的節點池。 | 無 |
節點恢複 | 當託管節點池中的節點發生異常時,ACK會自動發起故障節點的恢複操作,使節點保持正常運行(部分複雜的節點故障可能仍然需要手動修複)。關於ACK提供的檢查項及具體的恢複行為請參見文檔瞭解。 | |
修複 CVE(OS) | 執行CVE漏洞的批量修複,提升叢集的穩定性、安全性、合規性。部分CVE漏洞的修複需要通過重啟節點來實現,請參見文檔瞭解功能說明及注意事項。 | |
Kubelet 配置 | 在節點池維度自訂節點的kubelet參數配置,調整節點行為,例如整叢集資源預留以調配資源用量等。強烈不建議您通過黑屏操作自行定義控制台不支援的kubelet參數。 | |
OS 配置 | 在節點池維度自訂節點的OS參數配置,以調優系統效能。強烈不建議您通過黑屏操作自行定義控制台不支援的OS參數。 | |
更換作業系統 | 更換節點作業系統類型,或升級作業系統的版本。 | 無 |
Kubelet 升級 | 升級節點池中節點的kubelet版本和containerd版本。 | |
刪除 | 刪除不再使用的節點池,以減少不必要的資源浪費。節點池是否開啟期望節點數以及節點的計費模式會影響節點釋放的行為。 | 參見上文的刪除節點池 |
常見問題
如何基於建立好的ECS執行個體建立自訂鏡像,並使用該鏡像建立節點?
您可以在建立ECS執行個體後,根據業務需要自訂該執行個體(如安裝軟體、部署應用環境等),並為更新後的執行個體建立自訂鏡像。使用該鏡像建立的新執行個體,會包含您已配置的自訂項,省去您重複自訂執行個體的時間。
登入ECS執行個體,執行以下命令,刪除指定的檔案。關於如何登入執行個體,請參見使用Workbench工具以SSH協議登入Linux執行個體。
chattr -i /etc/acknode/nodeconfig-* rm -rf /etc/acknode systemctl disable ack-reconfig rm -rf /etc/systemd/system/ack-reconfig.service rm -rf /usr/local/bin/reconfig.sh rm -rf /var/lib/cloud基於ECS執行個體建立自訂鏡像。相關注意事項和具體操作步驟,請參見使用執行個體建立自訂鏡像。
配置節點池,選擇作業系統類型為自訂鏡像,並參見前文說明完成節點池的建立。
相關文檔
當不再需要某節點繼續工作時,請按照標準化操作將節點移除,請參見移除節點。
ACK需要佔用一定的節點資源來為kube組件和system進程預留資源,請參見節點資源預留策略。
當叢集的容量規劃無法滿足應用Pod調度時,您可以啟用節點伸縮自動擴縮節點資源,請參見節點伸縮概述。
單Worker節點支援的最大Pod數受網路外掛程式類型影響,在大部分情境下不支援變更。如需提升可用的Pod數量,需通過節點池擴容、執行個體規格提升、重建叢集並重新規劃Pod網段等手段,具體操作請參見調整可使用的節點Pod數量。