ACK オブザーバビリティシステムの各レイヤーと対応する機能 - Container Service for Kubernetes

インフラストラクチャ、コンテナ、アプリケーション、ビジネスの 4 つのレイヤーで Container Service for Kubernetes (ACK) クラスターを監視します。

ACK のオブザーバビリティ

ACK のオブザーバビリティアーキテクチャは、下から上にインフラストラクチャ、コンテナパフォーマンス、アプリケーションパフォーマンス、ビジネスの 4 つのレイヤーで構成されています。

以降のセクションでは、各レイヤーについて説明します。

インフラストラクチャのオブザーバビリティ

Pod とノードのリソースプール、トポロジー関係、ホストとネットワークプラグインのパフォーマンスなど、ACK クラスターの基盤となるリソースを監視します。

ソリューション	説明	シナリオ	参照
可視化されたアーキテクチャの検出	ACK のワークロードはノードベースのリソースプールで実行されるため、Pod のトレースやトポロジー関係を追跡することは困難です。 ACK の Kubernetes 監視は、Extended Berkeley Packet Filter (eBPF) と Managed Service for Prometheus を統合し、非侵入的なネットワークおよびアーキテクチャの認識により、エンドツーエンドのメトリクス収集とトレーシングを実現します。	すべてのシナリオ。ノードと Pod 間のネットワークトラフィック。 TCP および HTTP 接続、DNS 名前解決など、レイヤー 4 以上の Pod 間トラフィック。	「[非推奨] クラスターのトポロジー監視」をご参照ください。
カーネルレベルのコンテナ監視	ACK は、System Observer Monitoring (SysOM) に基づくカーネルレベルのコンテナ監視を提供し、コンテナ化されたアプリケーションのデプロイ、移行、監視を支援します。	すべてのシナリオ。	「SysOM カーネルレベルのコンテナ監視」をご参照ください。
インフラストラクチャメトリクスの収集	ACK クラスターの CPU、メモリ、ネットワークリソースの使用状況を監視します。	すべてのシナリオ。	「[非推奨] 基本リソース監視」をご参照ください。

コンテナパフォーマンスのオブザーバビリティ

クラスター、コンテナ、コンポーネントのパフォーマンスメトリクスを監視し、クラスターイベントを検出します。

クラスターとコンテナのパフォーマンスメトリクスの収集

ソリューション	説明	シナリオ	参照
Cloud Monitor と ACK の統合	ACK はクラスターとコンテナのパフォーマンスメトリクスを監視し、ACK コンソールに統合された可視化機能を提供します。	カスタムコンテナのパフォーマンスメトリクスやオブザーバビリティなど、限定的なシナリオ。	「[非推奨] 基本リソース監視」をご参照ください。
Managed Service for Prometheus	オープンソースの Prometheus エコシステムと互換性のあるフルマネージドの監視サービスです。自己管理の監視インフラストラクチャを必要とせず、幅広いコンポーネントに対応したすぐに使えるダッシュボードを提供します。推奨します。	マイクロサービス、コンポーネントのメトリクス収集、高度なオブザーバビリティのカスタマイズなど、すべてのシナリオ。	「Managed Service for Prometheus への接続と設定」をご参照ください。
オープンソースの Prometheus	ACK コンソールのマーケットプレイスで利用可能です。	マイクロサービス (Service Mesh)、コンポーネントのメトリクス収集、高度なオブザーバビリティのカスタマイズなど、すべてのシナリオ。	「オープンソース Prometheus 監視」をご参照ください。

クラスターとコンテナのイベント監視

ソリューション	説明	シナリオ	参照
イベント監視	リソース監視を補完し、リアルタイムのイベントキャプチャによりクラスターの異常を診断します。Simple Log Service (SLS) を推奨します。	すべてのシナリオ。	「イベント監視の概要」をご参照ください。

アプリケーションパフォーマンスのオブザーバビリティ

アプリケーションのメトリクス、トレーシング、ロギングをカバーします。たとえば、ACK にデプロイされた Java アプリケーションのスレッド数を監視できます。

ソリューション	説明	シナリオ	参照
Java アプリケーションを監視するための非侵入型 APM	Application Real-Time Monitoring Service (ARMS) は、ACK 内の Java アプリケーションに非侵入型の APM を提供します。ARMS アドオンをインストールすると、障害のあるインターフェイスや低速なインターフェイスの特定、パラメーターの調整、メモリリークの検出、パフォーマンスのボトルネックの特定が可能になります。推奨します。	Java アプリケーションの監視。非侵入型。	「Java アプリケーション監視」をご参照ください。
コードインストルメンテーションによる APM	Tracing Analysis は、トレースマッピング、リクエストカウント、トポロジーの可視化、依存関係分析により、分散アーキテクチャのパフォーマンスボトルネックを診断します。OpenTracing、OpenTelemetry、およびさまざまなオープンソース SDK をサポートしています。	マイクロサービス (Service Mesh) や多言語アプリケーションを含むすべてのシナリオ。OpenTelemetry 準拠。コードインストルメンテーションが必要です。	「ASM での分散トレーシングの有効化」をご参照ください。
コードインストルメンテーションによる APM	OpenTelemetry 向けマネージドサービスは、分散アプリケーションを開発するための一連のツールを提供します。ご利用のマイクロサービスからトレースデータを収集し、リアルタイムで集約することで、パフォーマンスボトルネックの特定、トレースのマッピング、リクエストのカウント、トレースのトポロジーの表示、分散アーキテクチャにおけるアプリケーションの依存関係の分析を支援します。これにより、マイクロサービスの開発と診断の効率が向上します。	OpenTracing 準拠。Jaeger や Zipkin などのプラットフォーム、および Java、PHP、Go、Python、Node.js、.NET、C++、Ruby、Swift などの言語をサポートしています。	「Tracing Analysis OpenTelemetry Edition とは」および「統合ガイド」をご参照ください。

ビジネスのオブザーバビリティ

ページビュー (PV) やユニークビジター (UV) などのビジネスレベルの統計を追跡し、ACK にデプロイされたアプリケーションのコスト監査をサポートします。

ソリューション	説明	シナリオ	参照
カスタムのロギングと監視	アプリケーションログのコンテンツと形式をカスタマイズし、SLS でログを収集し、ビジネス監視やシステム監査用のダッシュボードを設定します。推奨します。	トラフィック監視、コスト監査、注文トレンド分析など、すべてのシナリオ。	「SLS を使用したコンテナからのログデータ収集」をご参照ください。
Managed Service for Grafana によるカスタムダッシュボード	Managed Service for Grafana は、O&M フリーのランタイム環境を備えたクラウドネイティブの可視化プラットフォームです。データベース、Message Queue、Prometheus、SLS などの Alibaba Cloud サービスからデータを取り込み、きめ細かな監視ダッシュボードを提供します。サーバーや更新を管理することなく、組み込みのセキュリティと高可用性のもとで、メトリクス、ログ、トレースを分析します。	すべてのシナリオ。リアルタイムの PV および UV 監視など、ビジネスニーズに合わせてダッシュボードを設定できます。	「Managed Service for Grafana とは」をご参照ください。
ARMS Browser Monitoring によるビジネストラフィックと正常性の監視	ページの読み込み速度、JS エラーの安定性、API コールの成功率を追跡することで、Web アプリケーション、Weex、ミニプログラムを監視します。	フロントエンドの JavaScript アプリケーション。	「ARMS Browser Monitoring とは」をご参照ください。

参照

ログ監視：「ログ管理」、「SLS を使用したコンテナからのログデータ収集」、および「Kubernetes と SLS 用の Log4jAppender の設定」。
メトリクス：「Java アプリケーション監視」、「[非推奨] クラスターのトポロジー監視」、および「イベント監視」。
監視サービスとダッシュボード：「Managed Service for Prometheus への接続と設定」、「Ingress ダッシュボード」、「CoreDNS コンポーネントの監視」、「PromQL を使用した Prometheus 監視データのクエリ」、および「SysOM カーネルレベルのコンテナ監視」。