アラート管理システムがルート統合ポリシーの条件に一致するアラートを受信した場合、アラートは統合され、マージセットにグループ化されます。 ルート統合ポリシーに基づくアラートの抑制、停止、または重複除去が行われた後、マージセットは通知管理システムに送信されます。
ルート統合ポリシーの設定
アラートは、統合条件、アクションポリシー、グループ待機間隔、グループ間隔、および繰り返し間隔に基づいて統合されます。 条件が同じである場合のみ、アラートは 1 つのマージセットに統合されます。
たとえば、サービスがホスト 1 とホスト 2 にデプロイされている場合を考えます。 ホスト 1 とホスト 2 で、CPU 使用率の上昇アラートが 20:00 および 20:01 から 1 分ごとにトリガーされています。 アラート通知の送信時間を遅らせたい場合は、アラートポリシーを作成し、サービス名に基づいてアラートを統合できます。 ポリシーを作成すると、1 番目と 2 番目のアラート通知の送信後、同じアラートモニタリングルールによってトリガーされるアラートは後で通知されます。

統合条件
タイプ | 説明 |
---|---|
組み込みの統合条件 |
Log Service は、以下の組み込みの統合条件を提供します。
|
カスタム統合条件 |
統合条件をカスタマイズして、アラートの属性とラベルに基づいてアラートを統合できます。
|
- 例
- [統合条件] パラメーターを [カスタム] に設定します。
- [アラート属性] パラメーターを [アラートプロジェクト] に設定します。
- [アラートラベル] パラメーターを [カスタム] に設定します。
- [カスタムラベル] パラメーターを [env,service] に設定します。
- [アクションポリシー] パラメーターを [Log Service 組み込みアクションポリシー] に設定します。
- [グループ待機時間] パラメーターを [30 秒] に設定します。
- アラートインシデント
//アラート A { "alert_name": "Alert1", "project": "Project1", "labels": { "env": "test", "service": "service1" } } //アラート B { "alert_name": "Alert2", "project": "Project1", "labels": { "env": "prod", "service": "service2" } } //アラート C { "alert_name": "Alert3", "project": "Project1", "labels": { "env": "test", "service": "service1" } } //アラート D { "alert_name": "Alert4", "project": "Project1", "labels": { "env": "prod", "service": "service2" } }
- 結果
アラート A とアラート C は、1 つのマージセットにグループ化されます。 アラート B とアラート D は、別のマージセットにグループ化されます。
アクションポリシー
アクションポリシーは、アラート通知の送信方法を指定します。 アクションポリシーの設定は、[アクションポリシー] タブで表示および変更できます。 詳細については、「アクションポリシーの作成」をご参照ください。
Log Service では、動的アクションポリシーを設定することもできます。 [ルート統合] タブで [動的アクションポリシー] を選択し、アラートモニタリングルールを設定する際にアクションポリシーを指定すると、アラート通知が送信されます。 アラート通知は、アラートモニタリングルールの設定時に指定したアクションポリシーに基づいて送信されます。 詳細については、「動的アクションポリシー」をご参照ください。
グループ待機時間、グループ間隔、および繰り返し間隔
パラメーター | 説明 |
---|---|
グループ待機時間 | マージセットの作成後、最初のアラート通知を送信するまで待機する間隔を指定します。 アラートストームを防ぐために、単位は [秒] に設定することを推奨します。 |
グループ待機時間 | マージセット内のデータが変更されてから、アラート通知が送信されるまで待機する間隔を指定します。 単位は [分] に設定することを推奨します。 単位を [秒] に設定して、アラート通知をすぐに受信することもできます。
新しいアラートがマージセットに追加されるか、アラートステータスが変更されると、アラートデータは変更されます。 |
繰り返し間隔 | マージセット内のデータが送信されてから、アラート通知が送信されるまで待機する間隔は変わりません。 単位は [時間] に設定することを推奨します。
アラートのタイトルや内容など、アラート属性が変更されても、アラートデータは変更されません。 新しいアラートがマージセットに追加されるか、アラートステータスが変更されると、アラートデータは変更されます。 注 アクションポリシーを設定する際に動的アクションポリシーを指定する場合、このパラメーターの設定は不要です。 デフォルトでは、アラートモニタリングルールを設定する際に指定した繰り返し間隔が使用されます。
|
- シナリオ 1: グループ待機期間中は、アラート A のみトリガーされます。
グループ待機時間を 5 秒と仮定します。 グループ間隔は 1 分です。 繰り返し間隔は 4 時間です。 下図に、2 つのアラートの例を示しています。 オレンジ色の記号はアラート A を示し、青い記号はアラート B を示します。
- アラート A は 00:00:00 にトリガーされ、同時にマージセットが作成されました。 しかし、グループ待機時間が指定されているため、アラート通知はすぐには送信されません。
- 00:00:05 にグループ待機時間に達すると、Log Service は最初のアラート通知を送信します。
- 最初の通知が送信された後、システムは指定されたグループ間隔に基づいてマージセット内のデータを定期的にチェックします。 アラート B は、最初のグループ間隔内にマージセットにグループ化されます。 そのため、2 番目の通知は 00 :01:05 に送信されます。
- 次に、システムは指定されたグループ待機時間に基づいてマージセット内のデータを確認し、マージセットに存在するアラート A およびアラート B のみを検出します。 この場合、3番目の通知は指定された繰り返し間隔に達した 04:01:05 にのみ送信されます。
- シナリオ 2: アラート A とアラート B が、グループ待機時間内にトリガーされました。
グループ待機時間を 5 秒と仮定します。 グループ間隔は 1 分です。 繰り返し間隔は 4 時間です。 下図に、2 つのアラートの例を示しています。 オレンジ色の記号はアラート A を示し、青い記号はアラート B を示します。
- アラート A とアラート B が 00 :00:00 から 00:00:05 の間にトリガーされ、マージセットが作成されました。 しかし、グループ待機時間が指定されているため、アラート通知はすぐには送信されません。
- 00:00:05 にグループ待機時間に達すると、Log Service は最初のアラート通知を送信します。
- 最初の通知が送信された後、システムは指定されたグループ間隔に基づいてマージセット内のデータを定期的にチェックします。 システムは、マージセット内の、00:00:05 から 04:01:05までのアラート A およびアラート B のみを検出します。 この場合、3番目の通知は指定された繰り返し間隔に達した 04:01:05 にのみ送信されます。