Container Service for Kubernetes (ACK) は、CloudMonitor や Managed Service for Prometheus などの Alibaba Cloud の可観測性サービスとの統合を提供します。ACK は、クラスターの正常性状態を包括的に監視するのに役立つさまざまなクラスター監視コンポーネントを提供します。これらのコンポーネントを使用して、潜在的な問題を検出し、それらの問題に対応できます。このトピックでは、基本リソース、アプリケーション、クラスター、イベント、コントロールプレーンコンポーネント、ネットワーク、およびカーネルレベルのコンテナ監視を網羅する、ACK が提供するエンドツーエンドの監視ソリューションについて説明します。
クラスターの可観測性
次の表に、ACK のクラスター可観測性機能によって提供される監視モジュールを示します。
モジュール | 説明 | 参照 | コンポーネント |
基本リソースの監視 | このモジュールでは、CloudMonitor の Kubernetes 監視機能または Prometheus モニタリングを有効にして、CPU、メモリ、ネットワークリソースなどのクラスター内の基本リソースの使用状況と正常性状態を監視し、主要なメトリックに基づいてアラート通知を有効にすることができます。これにより、クラスターの安定性が向上します。 | ||
ack-prometheus-operator | |||
アプリケーションの監視 | このモジュールは、Application Real-Time Monitoring Service (ARMS) と ack-onepilot コンポーネントを使用して、コンテナ化アプリケーションのトポロジー分析、API およびイベント監視、トレース、およびパフォーマンスボトルネックチェックを有効にします。 | ||
クラスターの監視 | このモジュールは、Application Monitoring eBPF Edition を使用して、コード侵入なしでコンテナのパフォーマンスデータを取得し、ポッドの問題を特定し、問題に関連するサービスとコントローラーワークロードを自動的に特定します。これにより、トラブルシューティングの効率が向上します。 | ||
イベントの監視 | このモジュールは、Node Problem Detector (NPD) と Kubernetes イベントセンター機能を使用して、リアルタイム監視とアラート通知を有効にします。このモジュールは、ノードを診断し、ノードの例外に基づいてイベントを生成し、アラートの閉ループ管理とオフラインアラート通知をサポートします。 | ||
コントロールプレーンコンポーネントの監視 | このモジュールは、Prometheus と Grafana を使用して、API サーバー、etcd、kube-scheduler、kube-controller-manager などのコントロールプレーンコンポーネントをリアルタイムで監視します。このモジュールを使用して、コントロールプレーンコンポーネントへのアクセスを最適化し、セルフマネージド Prometheus システムを構成できます。 | ||
etcd | |||
ネットワークの監視 | このモジュールは、Ingress Dashboard と ARMS に基づいて Ingress 監視用の Simple Log Service を統合します。このモジュールは、CoreDNS の監視とトラブルシューティングを提供します。さらに、このモジュールは、Terway を使用するクラスター内のネットワークトラフィックとビジネストポロジーを視覚化し、コンテナネットワークとコンテナ化アプリケーションの可観測性を実現します。 | ||
カーネルレベルのコンテナ監視 | このモジュールは、OS カーネルレベルのコンテナ監視を提供し、System Observer Monitoring (SysOM) に基づいて OS カーネルレベルでコンテナを監視できるようにします。これにより、コンテナ化アプリケーションのデプロイと移行が容易になります。 |