このトピックでは、Simple Log Service のアラート監視ルールに関するよくある質問 (FAQ) への回答を提供します。
アラートの重大度を動的に設定できますか?
はい。アラートルールを設定する際に、条件を指定してアラートの重大度を動的に設定できます。詳細については、「アラートの重大度レベルを指定する」をご参照ください。
データなしアラート通知を受信できますか?
はい。アラートルールを設定する際に、データなしアラートをオンにして、アラートの重大度を指定できます。詳細については、「データなしアラート」をご参照ください。
Simple Log Service はアラート回復通知を送信できますか?
はい。アラートルールを設定する際に回復通知をオンにすると、Simple Log Service がクリアされたアラートの回復通知を送信できるようになります。詳細については、「回復通知を設定する」をご参照ください。
1 つのアラートルールで複数のアラートをトリガーできますか?
はい。アラートルールを設定する際に、グループ評価設定を設定できます。詳細については、「グループ評価機能を使用する」をご参照ください。
アラートルールを一時停止できますか?
[アラートルール] ページで、アラートルールの [アクション] 列の [無効化] をクリックします。
RAM ユーザーを使用してアラートを管理する場合、必要な権限を RAM ユーザーに付与するにはどうすればよいですか?
RAM ユーザーを使用してアラートを管理するには、事前に必要な権限を RAM ユーザーに付与する必要があります。詳細については、「RAM ユーザーにアラートを管理するための権限を付与する」をご参照ください。
アラート監視ルールを作成するときに「アラート数が上限を超えています」というエラーが発生した場合はどうすればよいですか?
アラート監視ルールを作成するときに アラート数が上限を超えています というエラーが発生した場合は、現在のプロジェクトのアラート監視ルールの最大数に達しています。デフォルトでは、プロジェクトごとに最大 100 個のアラート監視ルールを作成できます。チケットを送信する ことで、プロジェクトの最大制限を引き上げることができます。
1 つのプロジェクトにおけるアラート監視ルールの最大数は 200 まで増やすことができます。さらにアラート監視ルールを作成する場合は、次の方法を使用します。
プロジェクトから不要になったアラート監視ルールを削除します。
ログを異なるプロジェクトに保存して、1 つのプロジェクトのアラート監視ルールの数を減らします。
たとえば、サービス A から収集されたログを Project1 に保存し、サービス B から収集されたログを Project2 に保存できます。その後、プロジェクトでアラート監視ルールを作成できます。
類似のアラート監視ルールをマージします。
たとえば、Logstore 内のデータを監視するために 1 つのアラート監視ルールのみを作成できます。アラート監視ルールでグループ評価パラメーターを設定して、複数のグループのデータを同時に監視できます。詳細については、「グループ評価機能を使用する」をご参照ください。
データ変換機能またはスケジュール SQL 機能を使用してデータを Logstore に保存し、アラート監視ルールを作成します。詳細については、「データ変換の概要」または「スケジュール SQL」をご参照ください。
たとえば、複数の Logstore に保存されているエラーログを監視する場合、すべてのエラーログを 1 つの Logstore に保存してから、その Logstore のアラート監視ルールを作成できます。
キーワードに基づいてアラート監視ルールを設定するにはどうすればよいですか?
Simple Log Service がログを収集した後、Simple Log Service のアラートシステムを使用して、ログ内の特定のキーワードに基づいてアラート監視ルールを設定できます。詳細については、「ログキーワードに基づいてアラートを設定する」をご参照ください。
フィールドの異なる値を監視するにはどうすればよいですか?
グループ評価機能を使用して、特定のフィールドの値がアラート監視ルールの指定されたトリガー条件を満たしているかどうかを確認できます。フィールドをラベルとして指定してデータをグループ化できます。各グループのデータは、アラートトリガー条件に基づいて評価されます。詳細については、「グループ評価機能を使用する」をご参照ください。
この例では、複数のサーバーのメトリックデータが Metricstore に保存されています。サーバーの CPU 使用率 (cpu_util) が 95% を超えると、アラートがトリガーされ、Simple Log Service はサーバーごとにアラート通知を送信します。この場合、グループ評価機能を使用できます。
指定したトリガー条件の 1 つだけが有効になるのはなぜですか?
クエリと分析の結果は、指定されたトリガー条件に基づいて順番に評価されます。クエリと分析の結果の 1 つが最初の評価条件を満たすと、指定した他の評価条件はスキップされます。「トリガー条件」フィールドの「重大度」パラメーターを設定する際は、最初の評価条件として最も高い重大度レベルを指定することをお勧めします。詳細については、「アラートの重大度レベルを指定する」をご参照ください。
アラートの欠落や誤検知が発生するのはなぜですか?
アラートの欠落: たとえば、エラーログの数が 10 を超えると、アラートがトリガーされます。ただし、指定された時間範囲内でエラーログの数が 10 を超えていても、Logstore の検索と分析ページでログをクエリしてもアラートはトリガーされません。
誤検知: たとえば、クエリ/秒 (QPS) が 100 未満の場合、アラートがトリガーされます。ただし、指定された時間範囲内で QPS が 100 を超えていても、Logstore の検索と分析ページでログをクエリするとアラートがトリガーされます。
ほとんどの場合、アラートの欠落または誤検知は、データがログストアに書き込まれる時間と、データをクエリできる時間との間に待機時間が存在するために発生します。アラート監視ルールでクエリ文の時間範囲を相対時間に設定すると、クエリ結果が不正確になる可能性があります。アラートの欠落と誤検知を防ぐために、アラート監視ルールで指定されたクエリ文の時間範囲を延長するか、時間範囲を時間フレームに設定することをお勧めします。詳細については、「モニタリングの適時性」をご参照ください。
「アラート履歴」チャートの「アラートをトリガー」列に「true」と表示され、「原因」列に「通知しきい値に達していません」と表示されるのはなぜですか?
[アラート履歴統計] ダッシュボードの [アラート履歴] チャートの [アラートをトリガー] 列に「true」と表示され、[原因] 列に「通知しきい値に達していません」と表示される場合は、「連続トリガーのしきい値」パラメーターが指定されていますが、連続トリガーの数が指定されたしきい値に達していません。たとえば、[連続トリガーのしきい値] パラメーターを 3 に設定した場合、指定されたトリガー条件が 3 つの連続したチェック期間で満たされた場合にのみアラートがトリガーされます。
