容器智能營運平台提供叢集巡檢功能,支援掃描叢集健全狀態,發現叢集中存在的潛在風險並提供對應的解決方案,例如雲資源配額餘量、Kubernetes叢集關鍵資源水位等檢查。
操作步驟
在使用叢集巡檢功能前,請確保叢集處於正常運行狀態。叢集巡檢僅保留最近7天的結果。
在Container Service管理主控台的叢集列表,查看目的地組群的叢集狀態是否處於運行中。
重要
使用叢集巡檢功能時,系統將在您的叢集中執行資料擷取程式並收集檢查結果。採集的資訊包括系統版本、負載、運行時、kubelet等運行狀態及系統日誌中嚴重錯誤資訊。資料擷取程式不會採集您的商務資訊及敏感性資料。
登入Container Service管理主控台,在左側導覽列選擇叢集列表。
在叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇。
在叢集巡檢頁面的巡檢規則地區,單擊添加。
在配置定時巡檢規則面板,設定相應的時區和定時規則(每天),仔細確認叢集資訊和注意事項後,按照頁面提示儲存配置。
叢集定時巡檢配置完成後,將按照指定的時間巡檢叢集。您也可以在叢集巡檢頁面的檢查報告列表地區,單擊執行巡檢檢查,手動巡檢叢集。
巡檢完成後,在叢集巡檢頁面的檢查報告列表地區右側的操作列,單擊目標檢查報告右側的查看詳情。
叢集巡檢會按照觸發風險的程度分為低危、中危和高危,並高亮顯示。
巡檢檢查報告包含風險層級、風險項名稱、異常影響及解決方案。您可以參見控制台指引瞭解並解決問題。
相關操作
訂閱巡檢報告
叢集巡檢支援訂閱巡檢結果。您可以在叢集巡檢頁面的訂閱巡檢報告地區,訪問智能顧問控制台,配置訂閱巡檢報告。
管理巡檢規則
叢集定時巡檢配置完成後,您可以在巡檢規則地區進行以下操作。
單擊編輯,設定新的巡檢規則。
單擊刪除,刪除無需使用的巡檢規則。規則刪除後,叢集將不再按此規則巡檢。