すべてのプロダクト
Search
ドキュメントセンター

Application Real-Time Monitoring Service:動的しきい値を設定する

最終更新日:Mar 03, 2025

応答時間 (RT) や 1 秒あたりのクエリ数 (QPS) など、正常な状態でも値が変動するメトリックの異常を検出し、アラートを設定するには、異なる期間で動的しきい値を有効にすることをお勧めします。動的しきい値に基づく異常検出は、主にトレンドが安定しているメトリックを監視するために使用されます。指定されたしきい値を超えると、システムは例外イベントを生成します。

シナリオ

  • アプリケーションパフォーマンス監視: Web サイトまたはサービスの主要なメトリック (応答時間やリクエスト速度など) を監視します。サービスの応答時間が突然動的しきい値を超えると、システムはすぐに例外警告を発行します。これにより、Web サイト管理者は問題を迅速に特定して解決できます。

  • サーバーリソースの最適化: サーバーの CPU 使用率とメモリ使用量を監視します。サーバーのリソース使用量が継続的に動的しきい値を超えると、システムは自動的に例外イベントを生成します。これにより、システムクラッシュを防ぐために、リソース割り当てをタイムリーに調整できます。

  • アプリケーション接続プールの分析: クエリの速度や同時接続数などの主要なメトリックを監視します。スレッドの一部のメトリックが動的しきい値を超えると、システムは自動的に例外イベントをトリガーして、プログラムのパフォーマンスをタイムリーに最適化します。

  • マイクロサービスモデルの監視: 各マイクロサービスのリソース使用量と応答パフォーマンスを監視します。マイクロサービス間の相互作用と依存関係は複雑です。動的しきい値を使用すると、マイクロサービスで例外が発生した場合、問題を迅速に特定して、マイクロサービス全体の安定性を確保できます。

例:

Web サイトの通常のページビューは、10:00 から 18:00 までは 1,000 を超えているとします。22:00 から 06:00 までにページビューが 1,000 を超えている場合、Web サイトが攻撃されている可能性があります。この場合、ページビューの予想データ範囲は時間とともに変化します。静的しきい値 1000 を設定すると、日中にページビューが 1000 未満になったときにアラート通知を受信できます。ただし、夜間に Web サイトが攻撃された場合、アラートはトリガーされません。この場合、動的しきい値を使用してデータ範囲をインテリジェントに更新し、異常を検出できます。

前提条件

監視対象のアプリケーションのデータは、Managed Service for OpenTelemetry に報告されます。詳細については、統合ガイド を参照してください。

手順

  1. ARMS コンソール にログオンします。

  2. 左側のナビゲーションペインで、アプリケーション監視 > アプリケーション監視アラートルール を選択します。

  3. アプリケーション監視アラートルール ページで、アラートルールの作成 > Managed Service For Opentelemetry アラートルール を選択します。

  4. [アラートルールの作成] ページで、アラートルール名を入力し、アラート検出タイプパラメーターにインターバル検出を選択します。

  5. アラート連絡先セクションで、ビジネス要件に基づいてアプリケーション、メトリックタイプ、およびフィルター条件を指定します。

    パラメーター

    説明

    アプリケーションの選択

    監視するアプリケーション。動的しきい値に基づく異常検出では、1 つのアプリケーションのみを選択できます。

    メトリックタイプ

    検出するメトリックのタイプ。詳細については、アラートルールメトリック を参照してください。

    メトリックを選択すると、システムは自動的に上下のしきい値境界を計算し、メトリックをリアルタイムでレンダリングします。アラート条件セクションでメトリックのトレンドをプレビューできます。

    説明
    • アラート条件およびフィルター条件パラメーターの有効な値は、メトリックタイプパラメーターの値によって異なります。

    • 初期レンダリングには約 2 ~ 4 秒かかります。

    • 上下のしきい値境界の計算方法の詳細については、このトピックのしきい値の計算セクションを参照してください。

    フィルター条件

    アラートが生成されるメトリックをフィルタリングするために使用される方法。これは、監視範囲を絞り込むのに役立ちます。

    有効な値:

    • トラバース: 指定されたメトリックタイプのすべての値をトラバースし、アラート通知でアラートをトリガーするメトリック値を表示します。

    • ディメンションなし: 指定されたメトリックタイプのすべての値を集計し、アラート通知に合計を表示します。

    • =: 指定されたメトリックタイプの値をフィルタリングし、アラート通知に指定されたメトリック値のデータのみを表示します。

    • !=: 指定されたメトリックタイプの値をフィルタリングし、アラート通知に指定されたメトリック値と等しくないメトリック値のデータのみを表示します。

    • 含む: 指定されたメトリックタイプの値をフィルタリングし、アラート通知に指定された値を含むメトリック値のデータのみを表示します。

    • 含まない: 指定されたメトリックの値をフィルタリングし、アラート通知に指定された値を含まないメトリック値のデータのみを表示します。

    • 正規表現に一致: 指定されたメトリックの値をフィルタリングし、アラート通知に指定された正規表現に一致するメトリック値のデータのみを表示します。

    image.png

  6. アラートルールセクションで、アラート条件パラメーターを設定します。

    パラメーター

    説明

    アラートトリガーモード

    有効な値: 単一条件。

    アラート条件

    アラート条件。次の要素が必要です。

    • 過去 X 分: 監視の期間。最大値: 60。

    • データ: 監視するデータ。呼び出し回数や応答時間など、さまざまなデータ型を指定できます。

    • 計算方法: データを計算するために使用される方法。メトリックとデータ型に基づいて、平均値、最大値、最小値などのさまざまな計算方法を指定できます。

    • 比較方法: 計算されたデータを比較して異常を見つけるために使用される方法。有効な値:

      • 動的しきい値の範囲外: 指定された期間中に上下のしきい値境界を自動的に計算します。データポイントが範囲外にある場合、データは異常であり、アラートがトリガーされます。

      • 動的しきい値の最大値より大きい: 指定された期間中に上下のしきい値境界を自動的に計算します。データポイントが上限より大きい場合、データは異常であり、アラートがトリガーされます。

      • 動的しきい値の最小値より小さい: 指定された期間中に上下のしきい値境界を自動的に計算します。データポイントが下限より小さい場合、データは異常であり、アラートがトリガーされます。

    • アラートレベル: アラートの重大度。有効な値: P1、P2、P3、および P4。

    データプレビューセクションでは、青色はデータポイントを表し、緑色は許容されるデータ範囲を指定します。

    許容範囲

    許容値はデータ範囲を決定します。許容値が高いほどデータ範囲が広く、アラートがトリガーされる可能性が低くなります。許容値が低いほどデータ範囲が狭く、アラートがトリガーされやすくなります。

    アラート量の予測

    指定された期間内にトリガーされるアラートの予測数を確認できます。数値をクリックして、過去の時点でアラートをトリガーすると予想されるデータをクエリすることもできます。

    アラートルールを作成または変更するたびに、アラート予測機能を使用することをお勧めします。この機能は、検出アルゴリズムを使用して履歴データを分析し、指定された期間内のアラート数を予測します。その後、予測結果に基づいてしきい値を調整できます。詳細については、このトピックのアラート量の予測セクションを参照してください。

  7. アラート通知セクションと高度なアラート設定セクションのパラメーターを設定します。

    パラメーター

    説明

    アラート通知

    シンプルモード

    • 通知オブジェクト: 通知オブジェクトを作成します。詳細については、通知オブジェクトを参照してください。

    • 通知期間: アラート通知を送信する期間を指定します。

    • 通知を再送信するかどうか:

      • エスカレーションポリシーを使用しない場合、アラート通知はアラートがクリアされる前に一度だけ送信されます。

      • 繰り返し通知が必要な場合は、アラート通知を再送信する間隔を指定します。アラート通知は、アラートがクリアされるまで、指定された間隔で継続的に送信されます。

    標準モード

    通知ポリシー:

    • 通知ポリシーを指定しない: アラートがトリガーされても、通知は送信されません。通知は、通知ポリシーの一致ルールがトリガーされた場合にのみ送信されます。

    • 通知ポリシーを指定する: Application Real-Time Monitoring Service (ARMS) は、通知ポリシーで指定された通知方法を使用して通知を送信します。既存の通知ポリシーを選択するか、通知ポリシーを作成できます。詳細については、通知ポリシーの作成と管理 を参照してください。

    高度なアラート設定

    データなし

    このパラメーターは、データなし、異常な複合メトリック、異常な期間比較結果などのデータ異常を修正するために使用されます。データ異常を修正できる場合、アラートデータは自動的に 0 または 1 に変更されるか、アラートはトリガーされません。

    詳細については、用語 を参照してください。

  8. 保存 をクリックします。

しきい値の計算

ARMS の動的しきい値は、主に Prophet アルゴリズムに基づいて開発されています。動的しきい値が有効になると、ARMS は過去 7 日間の履歴データを 24 時間ごとに分析し、傾向と季節性を抽出し、次の 24 時間の予測データのトレンドチャートを描画します。同時に、メトリックの変動に基づいて予想データ範囲が計算されます。動的しきい値を設定すると、アルゴリズムによって計算された上下の境界をプレビューできます。次の図では、青色はデータポイントを表し、緑色は許容されるデータ範囲を指定します。image.png

静的しきい値とは異なり、動的しきい値は、メトリックの予想データ範囲が時間とともに変化する場合でも、アラートルールを手動で編集して更新する必要はありません。これは、ARMS が 1 日に 1 回メトリックのトレンドを分析し、翌日の上下の境界のみを予測するためです。

アラート量の予測

アラート量の予測機能は、アルゴリズムを使用して履歴データを分析し、履歴アラートが発生した時刻を表示し、指定された期間内のアラート数を予測します。この機能は、静的しきい値を設定したり、動的しきい値のアラート感度を向上させたりするのに役立ちます。

実装

ARMS は過去 24 時間のメトリックデータに基づいて、メトリックの各しきい値を超えた回数を計算し、将来のアラート量を予測します。さらに、ARMS は、各しきい値を超えた具体的な時刻を含むメトリックの詳細を提供します。ビジネス要件に基づいてしきい値を調整できます。