全部產品
Search
文件中心

Container Compute Service:使用叢集診斷

更新時間:Dec 11, 2024

阿里雲容器計算服務ACS使用容器智能營運平台提供一鍵故障診斷能力,包括Pod診斷、Service診斷、Ingress診斷,可以輔助您定位叢集中出現的問題。本文介紹如何在ACS叢集中使用叢集診斷功能。

診斷功能介紹

容器智能營運平台提供的診斷功能如下表所示。

診斷項

說明

Pod診斷

診斷K8s Pod狀態異常相關的問題,例如Pod啟動失敗,Pod頻繁重啟等 。

Service診斷

診斷Service相關的問題,例如Service配置、資源配額、例外狀況事件資訊等。

Ingress診斷

診斷Ingress相關的流量配置等問題。

配置故障診斷

重要

使用故障診斷功能時,系統將在您的叢集上執行資料擷取程式並收集檢查結果。採集的資訊包括系統版本、負載、容器組件等運行狀態及系統日誌中嚴重錯誤資訊。資料擷取程式不會採集您的商務資訊及敏感性資料。

配置Pod診斷與配置Service、Ingress等診斷操作類似。這裡以配置Pod診斷為例,介紹如何配置故障診斷功能。

  1. 登入容器計算服務控制台,在左側導覽列選擇叢集。

  2. 叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇巡檢和診斷 > 故障診斷,並按照對話方塊提示進行授權。

  3. 故障診斷頁面,單擊Pod診斷

  4. Pod診斷頁面,單擊診斷

  5. 選擇Pod面板,選擇Pod命名空間Pod名稱,仔細閱讀注意事項後選中我已知曉並同意,然後單擊發起診斷

    說明

    您可以根據頁面提示查看診斷進展。診斷完成後,診斷頁面將顯示診斷結果和診斷項,供您查看異常原因並修複問題。

看診斷結果

故障診斷頁面診斷列表的操作列,單擊目標診斷報告對應的診斷詳情,在診斷詳情頁面查看詳細診斷結果。

說明

根據叢集配置,具體檢查項可能稍有不同。實際結果請以診斷頁面結果為準。

診斷項

對應的檢查項狀態

說明

Pod診斷

  • 正常正常:無需處理。

  • 警告警告:需要確認,引起叢集異常的情況需要處理。

  • 異常異常:儘快處理,避免叢集無法正常工作。

  • 未知未知:未正常完成檢查或結果未知。

Pod診斷套件括PodClusterComponent檢查項。通過Pod狀態、叢集組件狀態綜合判定Pod異常原因。在診斷詳情頁面,可以看到Pod的診斷結果、修複建議及具體的診斷項列表。

滑鼠懸浮在檢查項右側詳情表徵圖.png表徵圖上,即可查看檢查項說明。

如果有異常或警告類的檢查項,會顯示在待處理頁簽中。

檢查項狀態為異常時,可以在目標檢查項右側狀態中的查看詳情的Tips中查看異常。

Service診斷

Service診斷套件括ServiceResourceQuotas檢查項。通過檢查CLB計費類型、認證、配額、異常Event等檢查項判定Service異常原因。

滑鼠懸浮在檢查項右側詳情表徵圖.png表徵圖上,即可查看檢查項說明。

如果有異常或警告類的檢查項,會顯示在待處理頁簽中。

檢查項狀態為異常時,可以在目標檢查項右側狀態中的查看詳情的Tips中查看異常。

Ingress診斷

Ingress診斷套件括IngressAddonSLB檢查項。通過Ingress狀態、Ingress外掛程式狀態和SLB狀態綜合判定Ingress異常原因。

滑鼠懸浮在檢查項右側詳情表徵圖.png表徵圖上,即可查看檢查項說明。

如果有異常或警告類的檢查項,會顯示在待處理頁簽中。

檢查項狀態為異常時,可以在目標檢查項右側狀態中的查看詳情的Tips中查看異常。