為了提升叢集的穩定性,建議您將ACK NPD(ack-node-problem-detector)組件升級到1.2.8版本以上。
背景資訊
低於v1.2.8版本的ack-node-problem-detector組件會預設開啟檔案系統控制代碼巡檢項(check_fd),check_fd的進程在讀取大核心資料時,會觸發部分作業系統核心版本缺陷,可能會造成殭屍進程堆積、甚至宕機的風險。
升級組件
-
為避免低版本組件可能導致的問題,滿足核心版本條件的叢集,請升級ack-node-problem-detector組件至1.2.8版本以上,即可預設停止檔案系統控制代碼巡檢項(check_fd),避免讀取大核心資料。ack-node-problem-detector組件升級資訊,請參見ack-node-problem-detector。
-
修複核心缺陷。更多資訊,請參見 Alibaba Cloud Linux 2系統的ECS執行個體中Page Fault異常導致系統宕機。
登入Container Service管理主控台,在左側導覽列選擇叢集列表。
在叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,單擊組件管理。
-
在組件管理頁面的日誌與監控頁簽下,單擊ack-node-problem-detector右下方的升級。
說明若ack-node-problem-detector面板上無升級按鈕,說明當前組件已是最新版本,無需升級。
-
在彈出提示框中,單擊確定。