ACK相容阿里雲可觀測產品,例如CloudMonitor、阿里雲Prometheus等,並提供豐富的叢集監控組件,協助您全面觀測叢集健康情況,提前識別並響應問題。本文介紹ACK叢集的全鏈路監控解決方案,包括基礎資源、應用、叢集、事件、控制面組件、網路以及核心層容器監控。
叢集可觀測功能
下表介紹ACK叢集可觀測功能的各個模組及其對應監控能力。
功能模組 | 功能描述 | 文檔連結 | 相關組件 |
基礎資源監控 | 通過CloudMonitorKubernetes監控或Prometheus監控功能,您可以查看並監控CPU、記憶體、網路等基礎資源的使用方式及健康狀態,提供警示提醒和關鍵計量監控,確保叢集的穩定運行。 | ||
ack-prometheus-operator | |||
應用監控 | 基於阿里雲ARMS,通過安裝ack-onepilot,實現容器應用的拓撲分析、介面與事務監控、調用鏈追蹤和效能瓶頸檢測。 | ||
叢集監控 | 阿里雲應用監控 eBPF 版為支援無侵入方式擷取容器效能資料,快速定位Pod問題,並自動關聯至相關服務和控制器工作負載,縮短問題發現時間。 | ||
事件監控 | 結合使用NPD和SLS的Kubernetes事件中心,實現即時監控和通知系統狀態,診斷並轉換節點異常為事件,支援閉環警示和離線通知。 | ||
控制面組件監控 | 通過Prometheus和Grafana即時監控關鍵控制面組件(如API Server、etcd、kube-scheduler、kube-controller-manager),支援最佳化訪問和自建Prometheus配置。 | ||
etcd | |||
網路監控 | 整合IngressLog Service,支援Ingress Dashboard與ARMS聯動排查,提供CoreDNS監控和問題解析。在Terway叢集中,實現網路流量和業務拓撲的可視化展示,從而實現容器網路和服務可觀測性。 | ||
核心層容器監控 | 在作業系統核心層進行容器監控的方法,為叢集提供獨特的核心層監控和可觀測能力,助力容器化部署和遷移。 |