全部產品
Search
文件中心

Container Service for Kubernetes:使用叢集巡檢

更新時間:Jul 11, 2025

容器智能營運平台提供叢集巡檢功能,支援掃描叢集健全狀態,發現叢集中存在的潛在風險並提供對應的解決方案,例如雲資源配額餘量、Kubernetes叢集關鍵資源水位等檢查。

操作步驟

在使用叢集巡檢功能前,請確保叢集處於正常運行狀態。叢集巡檢僅保留最近7天的結果。

Container Service管理主控台的叢集列表,查看目的地組群的叢集狀態是否處於運行中
重要

使用叢集巡檢功能時,系統將在您的叢集中執行資料擷取程式並收集檢查結果。採集的資訊包括系統版本、負載、運行時、kubelet等運行狀態及系統日誌中嚴重錯誤資訊。資料擷取程式不會採集您的商務資訊及敏感性資料。

  1. 登入Container Service管理主控台,在左側導覽列選擇叢集列表

  2. 叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇巡檢和診斷 > 叢集巡檢

  3. 叢集巡檢頁面的巡檢規則地區,單擊添加

  4. 配置定時巡檢規則面板,設定相應的時區定時規則(每天),仔細確認叢集資訊和注意事項後,按照頁面提示儲存配置。

    叢集定時巡檢配置完成後,將按照指定的時間巡檢叢集。您也可以在叢集巡檢頁面的檢查報告列表地區,單擊執行巡檢檢查,手動巡檢叢集。

  5. 巡檢完成後,在叢集巡檢頁面的檢查報告列表地區右側的操作列,單擊目標檢查報告右側的查看詳情

    • 叢集巡檢會按照觸發風險的程度分為低危、中危和高危,並高亮顯示。

    • 巡檢檢查報告包含風險層級、風險項名稱、異常影響及解決方案。您可以參見控制台指引瞭解並解決問題。

相關操作

訂閱巡檢報告

叢集巡檢支援訂閱巡檢結果。您可以在叢集巡檢頁面的訂閱巡檢報告地區,訪問智能顧問控制台,配置訂閱巡檢報告。

管理巡檢規則

叢集定時巡檢配置完成後,您可以在巡檢規則地區進行以下操作。

  • 單擊編輯,設定新的巡檢規則。

  • 單擊刪除,刪除無需使用的巡檢規則。規則刪除後,叢集將不再按此規則巡檢。

相關文檔

  • 叢集檢查功能支援在叢集升級、遷移等操作前執行檢查,確認叢集是否符合要求。

  • 叢集診斷功能支援節點診斷、Pod診斷、Service診斷、Ingress診斷、記憶體診斷、網路診斷等功能,輔助定位叢集問題。