回復通知機能を使用して、監視対象オブジェクトが回復するかどうかを確認できます。 復旧通知機能を有効にすると、監視対象オブジェクトが復旧すると、Log Serviceは復旧通知を送信します。

たとえば、アラートモニタリングルールは、各ホストのCPUメトリックを監視するために作成されます。 ホストの CPU 使用率が 95% を超えた場合、アラートがトリガーされます。 そして、CPU使用率が95% 以下に低下した場合には、復旧通知を送信する。 次の図は、設定を示しています。 アラートモニタリングルールのパラメーターの詳細については、「ログに対するアラートモニタリングルールの作成」をご参照ください。

回復通知
  • クエリ統計: * | select promql_query_range('cpu_util') from metrics limit 1000を指定します。

    このクエリ文を使用して、各ホストの CPU 使用率を計算します。

  • グループ評価: [自動タグ] を選択します。

    時系列データのクエリと分析結果を自動的にグループ化することを指定します。

  • トリガー条件: [data matches the expression] を選択し、value > 95を入力し、[Severity: High] を選択します。

    クエリおよび分析結果のvalueフィールドが95より大きい場合、高重大度のアラートがトリガーされます。

  • 注釈の追加: アラートのタイトルや説明などの注釈を指定します。 注釈で ${host} などのフィールド変数を参照できます。 詳細については、「ラベルと注釈」をご参照ください。
  • リカバリ通知: リカバリ通知をオンにします。

    回復通知は特別なアラート通知です。 回復通知では、アラートステータスは解決済みです。 通常のアラート通知では、アラートステータスは発火です。 たとえば、アラートモニタリングルールで回復通知機能が有効化されている場合、 前回のチェックでアラートがトリガーされ、現在のチェックでトリガー条件が満たされていない場合、リカバリ通知が送信されます。

Log Service は、アラート通知の形式で回復通知を送信します。 リカバリ通知では、[アラートステータス] フィールドに [解決済み] が表示されます。