ACK叢集會定期發布新的作業系統鏡像版本,帶來新的功能特性、功能最佳化和缺陷修複,請及時升級節點池的作業系統鏡像版本。您也可以按需切換作業系統類型,例如將已經停止維護(EOL)的作業系統更換為支援中的作業系統。
您可以參見作業系統鏡像發布記錄瞭解ACK支援的作業系統類型、作業系統鏡像最新版本,以及部分作業系統的使用限制。
注意事項
本操作會通過替換節點系統硬碟(替盤升級)的方式分批次更新作業系統。請勿在系統硬碟中儲存重要資料,或提前做好備份工作,資料盤在升級過程中則不受影響。請在業務低峰期進行。
通過替盤方式升級節點時,ACK會進行節點排水操作,遵循Pod Disruption Budget(PDB)的前提下將節點上的Pod驅逐至其他可用節點。為確保服務高可用性,建議您採用多副本部署策略,將工作負載分散在多個節點上,同時為關鍵業務配置PDB,控制同時中斷的Pod數量。
節點排水的預設逾時時間為30分鐘。如果在逾時時間內未能完成Pod遷移,ACK將終止本次升級以確保業務穩定性。
通過替盤方式升級節點時,ACK將按照節點池當前的配置(例如節點登入方式、標籤、汙點、作業系統鏡像、運行時版本)重新初始化節點。正常情況下,更新節點池配置需通過編輯節點池來實現。如您通過其他方式對節點進行了更改,升級時這些更改會被覆蓋。
如果節點中的Pod引用了HostPath,且該HostPath指向系統硬碟,替盤升級後HostPath目錄中資料會丟失。
如果您對叢集有過配置更改,例如開啟了SWAP分區、曾通過黑屏操作修改kubelet配置或運行時配置等,叢集升級過程有可能失敗,或自訂配置可能會被覆蓋。
ACK部分作業系統預設使用cgroup v2。關於cgroup v2的注意事項,請參見cgroup版本說明。
如果您的節點為游離節點,即未被節點池管理的Worker節點,需參見遷移游離節點至節點池完成遷移。
在ContainerOS 3.4.0中已將系統硬碟調整為全唯讀模式,需綁定一塊資料盤以保證系統正常啟動。因此,升級至3.4及以上版本(其他版本不受影響)時,需參見以下流程。
如果您的節點池通過指定版本號碼自訂節點GPU驅動版本或通過OSS URL自訂節點GPU驅動,在進行作業系統鏡像升級時,可能存在作業系統與驅動版本不相容情況。請參見ACK支援的NVIDIA驅動版本列表選擇最新驅動。
操作步驟
您可以參見如下步驟更新作業系統鏡像至最新版本或更換作業系統類型。為避免相容性風險,建議先進行前置檢查掃描。
登入Container Service管理主控台,在左側導覽列選擇叢集列表。
在叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇。
在節點池列表的操作列,選擇目標節點池對應的
> 更換作業系統。單擊前置檢查,提前掃描更換作業系統鏡像可能存在的風險,並查看檢查結果。
結果正常:升級檢查成功,繼續後續操作。
結果異常:不影響當前叢集的運行及叢集狀態。請參見推薦的解決方案進行修複。
前置檢查通過後,按照如下內容進行配置,然後單擊開始更換。
配置項
說明
目標版本
選擇所需更換的目標鏡像及對應版本。
目前的版本
當前使用的作業系統版本。
更新節點
指定待更換作業系統的節點(選擇所有節點或部分節點)。
忽略警告層級檢查項
前置檢查結果中存在節點池層級的警告項(如節點池中存在 Pod 使用了指向系統硬碟的 HostPath)時,是否忽略該項繼續升級。
批量更換策略
每批次執行最多節點數
系統會根據設定的最大並行數依次對節點進行更新。
自動暫停策略
在節點更換作業系統過程中的暫停策略。
每批次間隔時間
自動暫停策略為不暫停時,可選擇每個更新批次之間是否需要時間間隔或間隔的時間長度。可選範圍為5~120分鐘。
自動快照
當前升級方式為替盤升級,若節點系統硬碟上有重要業務資料,建議在更新作業系統前為節點建立快照,以便進行資料的備份和恢複。使用快照將產生快照計費。升級後若快照無需使用,請及時刪除快照。
重要更換作業系統時,為避免OS帶來的非相容風險,建議您查看作業系統鏡像發布記錄。
相關文檔
關於如何升級節點池的kubelet和容器運行時版本,請參見升級節點池。
關於替盤升級的流程說明和升級邏輯,請參見參考資訊:原地升級和替盤升級。