阿里雲容器計算服務ACS使用容器智能營運平台提供一鍵故障診斷能力,包括Pod診斷、Service診斷、Ingress診斷,可以輔助您定位叢集中出現的問題。本文介紹如何在ACS叢集中使用叢集診斷功能。
診斷功能介紹
容器智能營運平台提供的診斷功能如下表所示。
診斷項 | 說明 |
診斷K8s Pod狀態異常相關的問題,例如Pod啟動失敗,Pod頻繁重啟等 。 | |
診斷Service相關的問題,例如Service配置、資源配額、例外狀況事件資訊等。 | |
診斷Ingress相關的流量配置等問題。 |
配置故障診斷
使用故障診斷功能時,系統將在您的叢集上執行資料擷取程式並收集檢查結果。採集的資訊包括系統版本、負載、容器組件等運行狀態及系統日誌中嚴重錯誤資訊。資料擷取程式不會採集您的商務資訊及敏感性資料。
配置Pod診斷與配置Service、Ingress等診斷操作類似。這裡以配置Pod診斷為例,介紹如何配置故障診斷功能。
登入容器計算服務控制台,在左側導覽列選擇叢集。
在叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇,並按照對話方塊提示進行授權。
在故障診斷頁面,單擊Pod診斷。
在Pod診斷頁面,單擊診斷。
在選擇Pod面板,選擇Pod命名空間和Pod名稱,仔細閱讀注意事項後選中我已知曉並同意,然後單擊發起診斷。
說明您可以根據頁面提示查看診斷進展。診斷完成後,診斷頁面將顯示診斷結果和診斷項,供您查看異常原因並修複問題。
看診斷結果
在故障診斷頁面診斷列表的操作列,單擊目標診斷報告對應的診斷詳情,在診斷詳情頁面查看詳細診斷結果。
根據叢集配置,具體檢查項可能稍有不同。實際結果請以診斷頁面結果為準。
診斷項 | 對應的檢查項狀態 | 說明 |
Pod診斷 |
| Pod診斷套件括Pod、ClusterComponent檢查項。通過Pod狀態、叢集組件狀態綜合判定Pod異常原因。在診斷詳情頁面,可以看到Pod的診斷結果、修複建議及具體的診斷項列表。 滑鼠懸浮在檢查項右側 如果有異常或警告類的檢查項,會顯示在待處理頁簽中。 檢查項狀態為異常時,可以在目標檢查項右側狀態中的查看詳情的Tips中查看異常。 |
Service診斷 | Service診斷套件括Service和ResourceQuotas檢查項。通過檢查CLB計費類型、認證、配額、異常Event等檢查項判定Service異常原因。 滑鼠懸浮在檢查項右側 如果有異常或警告類的檢查項,會顯示在待處理頁簽中。 檢查項狀態為異常時,可以在目標檢查項右側狀態中的查看詳情的Tips中查看異常。 | |
Ingress診斷 | Ingress診斷套件括Ingress、Addon、SLB檢查項。通過Ingress狀態、Ingress外掛程式狀態和SLB狀態綜合判定Ingress異常原因。 滑鼠懸浮在檢查項右側 如果有異常或警告類的檢查項,會顯示在待處理頁簽中。 檢查項狀態為異常時,可以在目標檢查項右側狀態中的查看詳情的Tips中查看異常。 |