全部產品
Search
文件中心

Container Service for Kubernetes:監控管理

更新時間:Feb 22, 2025

ACK相容阿里雲可觀測產品,例如CloudMonitor、阿里雲Prometheus等,並提供豐富的叢集監控組件,協助您全面觀測叢集健康情況,提前識別並響應問題。本文介紹ACK叢集的全鏈路監控解決方案,包括基礎資源、應用、叢集、事件、控制面組件、網路以及核心層容器監控。

叢集可觀測功能

下表介紹ACK叢集可觀測功能的各個模組及其對應監控能力。

功能模組

功能描述

文檔連結

相關組件

基礎資源監控

通過CloudMonitorKubernetes監控或Prometheus監控功能,您可以查看並監控CPU、記憶體、網路等基礎資源的使用方式及健康狀態,提供警示提醒和關鍵計量監控,確保叢集的穩定運行。

基礎資源監控

metrics-server

使用阿里雲Prometheus監控

ack-arms-prometheus

開源Prometheus監控

ack-prometheus-operator

應用監控

基於阿里雲ARMS,通過安裝ack-onepilot,實現容器應用的拓撲分析、介面與事務監控、調用鏈追蹤和效能瓶頸檢測。

Java應用監控

ack-onepilot

Python應用監控

Golang應用監控

叢集監控

阿里雲應用監控 eBPF 版為支援無侵入方式擷取容器效能資料,快速定位Pod問題,並自動關聯至相關服務和控制器工作負載,縮短問題發現時間。

叢集拓撲監控

ack-arms-cmonitor

事件監控

結合使用NPD和SLS的Kubernetes事件中心,實現即時監控和通知系統狀態,診斷並轉換節點異常為事件,支援閉環警示和離線通知。

事件監控

ack-node-problem-detector

控制面組件監控

通過Prometheus和Grafana即時監控關鍵控制面組件(如API Serveretcdkube-schedulerkube-controller-manager),支援最佳化訪問和自建Prometheus配置。

查看叢集控制面組件監控大盤

API Server

kube-controller-manager

cloud-controller-manager

kube-scheduler

etcd

網路監控

整合IngressLog Service,支援Ingress Dashboard與ARMS聯動排查,提供CoreDNS監控和問題解析。在Terway叢集中,實現網路流量和業務拓撲的可視化展示,從而實現容器網路和服務可觀測性。

Ingress Dashboard監控

Nginx Ingress Controller

CoreDNS組件監控

CoreDNS

使用ACKTerway和CiliumHubble實現網路可觀測性

Terway網路外掛程式

核心層容器監控

在作業系統核心層進行容器監控的方法,為叢集提供獨特的核心層監控和可觀測能力,助力容器化部署和遷移。

SysOM核心層容器監控

ack-sysom-monitor