このトピックでは、Simple Log Service のアラート監視ルールに関するよくある質問 (FAQ) について説明します。
アラートの重要度を動的に設定できますか?
はい、できます。アラートルールを設定する際に、条件を指定してアラートの重要度を動的に設定できます。詳細については、「アラートの重要度の設定」をご参照ください。
データなしアラートの通知を受信できますか?
はい、できます。アラートルールを設定する際に、データなしアラート機能を有効にし、アラートの重要度を指定できます。詳細については、「データなしアラート」をご参照ください。
アラートの自動回復はサポートされていますか?
はい、サポートされています。アラートルールを設定する際に、アラートの自動回復機能を有効にできます。詳細については、「回復通知の設定」をご参照ください。
1 つのアラート監視ルールで異なる宛先に通知を送信できますか?
はい、できます。アラート監視ルールを設定する際に、グループごとの評価機能を有効にできます。詳細については、「グループごとの評価の設定」をご参照ください。
アラート監視ルールを一時的に無効にできますか?
はい、できます。[アラートルール] ページで、操作列の [無効化] をクリックします。
RAM ユーザーにアラートを管理する権限を付与する方法
Resource Access Management (RAM) ユーザーがアラートを管理できるようにするには、事前に必要な権限を付与する必要があります。詳細については、「RAM ユーザーへのアラート管理権限の付与」をご参照ください。
アラート監視ルールを作成するときに「アラート数が上限を超えています」というエラーが発生した場合はどうすればよいですか?
アラート監視ルールの作成時に Alert count exceeds the maximum limit エラーが発生した場合、プロジェクト内のアラート監視ルールの数が上限である 100 を超えていることを示します。クォータを増やすには、「リソースクォータの管理」をご参照ください。
プロジェクト内のアラート監視ルールの最大数は 200 まで増やすことができます。さらに多くのアラート監視ルールを作成するには、次の最適化メソッドを検討してください。
プロジェクトから不要になったアラート監視ルールを削除します。
異なるプロジェクトでログを収集し、単一プロジェクト内のアラート監視ルールの数を減らします。
たとえば、サービス A のログを Project1 に、サービス B のログを Project2 に収集します。その後、異なるプロジェクトでアラート監視ルールを作成します。
類似のアラート監視ルールを統合します。
たとえば、同じ Logstore 内のデータを監視する場合、アラート監視ルールを 1 つだけ作成できます。グループごとの評価機能を使用して、単一のルールで複数のターゲットを監視します。詳細については、「グループごとの評価の設定」をご参照ください。
データ変換またはスケジュールクエリ (Scheduled SQL) を使用して、アラート監視ルールを作成する前にデータを単一の Logstore に統合します。
たとえば、複数の Logstore からエラーログを監視したい場合、すべてのエラーログを単一の Logstore に統合し、その Logstore に対して 1 つのアラート監視ルールを作成できます。
キーワードに基づくアラートの設定方法
Simple Log Service でログを収集した後、そのアラート監視システムを使用して、ログのキーワードに基づいたアラートを設定できます。詳細については、「ログキーワードに基づくアラートの設定」をご参照ください。
異なるオブジェクトの監視方法
アラート条件として特定のフィールドを監視したいが、そのフィールドのすべての可能な値がわからない場合は、グループごとの評価機能を使用します。そのフィールドをタグとして使用してデータをグループ化します。各グループは、アラートのトリガー条件に対して個別に評価されます。詳細については、「グループごとの評価の設定」をご参照ください。
たとえば、複数のサーバーからのメトリックデータを Metricstore に保存しているとします。CPU 使用率 (cpu_util) が 95% を超えるサーバーごとに個別のアラートを Simple Log Service から送信したい場合、グループごとの評価を使用します。
複数のトリガー条件のうち 1 つしか有効にならない理由
クエリと分析の結果は、リストされている順序でトリガー条件と照合されます。結果がいずれかの条件に一致すると、後続の条件はチェックされません。したがって、トリガー条件の重要度を設定する際は、最も高い重要度から最も低い重要度の順に設定してください。詳細については、「アラートの重要度の設定」をご参照ください。
アラートの欠落や誤検知が発生するのはなぜですか?
アラートの欠落:エラーログの数が 10 を超えた場合にトリガーされるようにアラートが設定されています。しかし、Logstore のクエリ・分析ページでクエリを実行すると、指定した期間内にエラーログの数が 10 を超えているにもかかわらず、アラートがトリガーされません。
誤検知:1 秒あたりのクエリ数 (QPS) が 100 未満の場合にトリガーされるようにアラートが設定されています。しかし、Logstore のクエリ・分析ページでクエリを実行すると、指定した期間内に QPS が 100 を超えているにもかかわらず、アラートがトリガーされます。
アラートの欠落や誤検知は、通常、データが Logstore に書き込まれてからクエリ可能になるまでのレイテンシーが原因で発生します。アラート監視ルールのクエリ時間範囲が相対時間に設定されている場合、アラートのクエリ結果が不正確になることがあります。これらの問題を回避するには、アラート監視ルールのクエリ時間範囲を広げるか、クエリ時間範囲を固定の時間枠に設定します。詳細については、「監視の適時性」をご参照ください。
[アラート履歴] チャートで [アラートのトリガー] が true で、理由が「通知しきい値に達していません」と表示される場合の対処方法
[アラート履歴統計] ダッシュボードの [アラート履歴] チャートで、[アラートのトリガー] 列が true であり、[原因] 列が「通知しきい値に達していません」と表示されている場合、アラートルールで連続トリガーしきい値を設定しており、現在のトリガーがまだこのしきい値に達していないことを意味します。たとえば、[連続トリガーしきい値] を 3 に設定した場合、トリガー条件が 3 回連続で満たされた後にのみアラートが送信されます。
