アラート条件を満たしてもアラートがトリガーされない場合のトラブルシューティング - Cloud Monitor (CMS)

対応するメトリック値が指定されたしきい値に達してもアラートがトリガーされない場合は、このトピックで説明する操作を実行して問題のトラブルシューティングを行います。

背景情報

各アラート条件は、メトリック、アラートレベル、期間、およびしきい値を含む式です。メトリックの期間は、2つの連続するデータポイント間の間隔とメトリック値の集計期間を示します。たとえば、メトリックの期間が60秒の場合、データポイントは60秒ごとに生成されます。メトリック値は、過去60秒間のモニタリングデータに基づいて計算された集計値です。アラートルールの検出期間は、期間によって決まります。マルチメトリック式に複数のピリオドが含まれている場合、最短ピリオドが優先されます。

説明

集計方法は、メトリックに基づいて異なります。詳細については、「付録1: メトリック」をご参照ください。 [TimeSeries Metrics] ページで、特定のクラウドサービスの [統計] 列を表示できます。アラートルールに設定されているStatisticsパラメーターの値が、対応するメトリックのStatisticsパラメーターの値でない場合、アラートルールのステータスは正常であり、アラートは生成されません。
各メトリックの期間は異なります。詳細については、「付録1: メトリック」をご参照ください。特定のクラウドサービスの [最小期間] 列は、[TimeSeries Metrics] ページで表示できます。

手順

この例では、Elastic Compute Service (ECS) インスタンスのCPU使用率メトリックの最大値は、3つの連続した期間で90% 以上です。

CPU使用率メトリックのモニタリングデータ、特に最大値と期間を表示します。
他のクラウドサービスのモニタリングデータを表示する方法の詳細については、「モニタリングデータの表示」をご参照ください。
1. CloudMonitorコンソールにログインします。
2. 左側のナビゲーションウィンドウで、[ホストモニタリング] をクリックします。
3. [ホストモニタリング] ページで、管理するホストを見つけ、[操作] 列のホスト名または [モニタリングチャート] をクリックします。
  [基本モニタリング] タブで、CPU使用率メトリックのモニタリングチャートを表示し、最大値と期間を確認します。
CPU使用率メトリックの最新のしきい値トリガーアラートルールを表示し、アラート条件が満たされているかどうかを確認します。
1. 左側のナビゲーションウィンドウで、[アラーム] > [アラームルール] を選択します。
2. [アラートルール] ページで、表示するアラートルールを見つけ、[操作] 列の [詳細] をクリックします。
  [詳細] タブで、しきい値と期間、有効時間、アラートステータス、および関連するリソースを含むアラート条件を表示します。 ECSインスタンスのCPU使用率メトリックの最大値が3つの連続した期間で90% 以上である場合、アラート条件が満たされます。アラートステータスが正常で、アラートルールが有効であることを確認します。
ECSインスタンスがブラックリストに追加されているかどうかを確認します。
左側のナビゲーションウィンドウで、アラート > アラートブラックリストを選択します。
[アラートブラックリスト] ページで、ECSインスタンスがブラックリストに追加されているかどうかを確認します。

説明

Container Service for Kubernetes (ACK) のアラートルールの指定されたミュート期間は、アラートルール内のすべての関連リソースに適用されます。たとえば、ミュート期間を24時間に設定します。この場合、別のポッドが指定されたアラート条件を満たしていても、Cloud Monitorはポッドがアラートをトリガーしてから24時間以内にアラート通知を1つだけ送信します。ポッドによってトリガーされるアラートのレベルが変更されると、CloudMonitorはアラート通知を送信します。

Cloud Monitor:対応するメトリック値が指定されたアラート条件を満たしたときにアラートがトリガーされない場合はどうすればよいですか。

背景情報

手順

関連ドキュメント