このトピックでは、Managed Service for Prometheus を使用して Kubernetes イベントを監視し、ダッシュボードを表示し、アラートルールを設定する方法について説明します。イベント監視は、Kubernetes が提供する監視方法です。適時性、正確性、シナリオの点でリソース監視よりも改善されています。ノード問題検出器 (NPD) を Simple Log Service の Kubernetes イベントセンターと共に使用してクラスタイベントをシンクし、NPD を設定してクラスタを診断し、エラーイベントをシンクに送信できます。クラスタイベントは、DingTalk、Simple Log Service、EventBridge にシンクできます。これにより、クラスタの異常や問題をリアルタイムで監視できます。
前提条件
Managed Service for Prometheus がアクティブ化されていること。詳細については、請求の概要 を参照してください。
ACK クラスタが作成されていること。詳細については、ACK マネージドクラスタの作成 を参照してください。
Alibaba Cloud Resource Center がアクティブ化されていること。詳細については、Resource Center のアクティブ化 を参照してください。
ステップ 1: Kubernetes イベントを設定する
Managed Service for Prometheus コンソール にログインします。左側のナビゲーションペインで、統合センター をクリックします。
Kubernetes イベント をクリックします。表示されるパネルで、ACK クラスタを選択し、プロンプトに従ってパラメータを設定します。
説明Kubernetes イベントの統合には 1 ~ 2 分かかります。統合が完了するまで、ダッシュボードデータは使用できません。
ステップ 2: ダッシュボードを表示する
Managed Service for Prometheus は、コンテナの概要、コアコンポーネント、ノード、ポッドなどの監視の詳細を表示するために、複数の組み込みダッシュボードを提供します。これらのダッシュボードは、Container Service for Kubernetes、Application Real-Time Monitoring Service、または Managed Service for Prometheus コンソールで表示できます。ダッシュボードを表示するには、次の手順を実行します。
Managed Service for Prometheus コンソール にログインします。左側のナビゲーションペインで、統合管理 をクリックします。
統合管理 ページで、ダッシュボードのクエリ タブをクリックします。ダッシュボードを表示するコンテナを選択します。

ステップ 3: アラートを設定する
Managed Service for Prometheus コンソール にログインします。左側のナビゲーションペインで、統合管理 をクリックします。
統合管理 ページで、統合環境 タブをクリックします。コンテナサービス タブで、ACK クラスタの名前をクリックします。
コンポーネント管理 タブで、アラートルールセクションの組み込みアラートルールを表示します。

組み込みアラートルールは、アラート通知を送信せずにアラートイベントを生成します。アラートルールの通知方法を設定する場合は、[アクション] 列の 編集 をクリックします。
Prometheus アラートルールの編集ページで、カスタムアラートしきい値、期間、アラートコンテンツを設定できます。詳細については、Prometheus インスタンスのアラートルールを作成する を参照してください。

メトリクス
メトリクス | 測定 | 説明 |
eventer_events_error_total | COUNTER | エラーイベントの数。 |
eventer_events_normal_total | COUNTER | 正常なイベントの数。 |
eventer_events_warning_total | COUNTER | 例外イベントの数。 |
eventer_exporter_duration_milliseconds | SUMMARY | イベントのエクスポートに費やされたミリ秒数。 |
eventer_manager_last_time_seconds | GAUGE | 最後の eventer housekeep の Unix タイムスタンプ(秒単位)。 |
eventer_scraper_duration_milliseconds | SUMMARY | イベントのスクレイピングに費やされたミリ秒数。 |
eventer_scraper_events_total_number | COUNTER | イベントの総数。 |
eventer_scraper_last_time_seconds | GAUGE | 最後のイベントの Unix タイムスタンプ(秒単位)。 |