応答時間 (RT) や 1 秒あたりのクエリ数 (QPS) のように、正常な状態でも値が変動するメトリックの異常を検知し、アラートを設定するには、時間帯ごとに動的しきい値を有効にすることを推奨します。動的しきい値に基づく異常検知は、主に傾向が安定しているメトリックの監視に使用されます。指定されたしきい値を超えた場合、システムは例外イベントを生成します。
利用シーン
アプリケーションパフォーマンス監視:ウェブサイトやサービスの応答時間やリクエスト速度などの主要メトリックを監視します。サービスの応答時間が突然、動的しきい値を超えた場合、システムは即座に例外警告を発行します。これにより、ウェブサイト管理者は問題を迅速に特定して解決できます。
サーバーリソースの最適化:サーバーの CPU 使用率とメモリ使用量を監視します。サーバーのリソース使用量が継続的に動的しきい値を超えた場合、システムは自動的に例外イベントを生成します。これにより、リソース割り当てをタイムリーに調整し、システムクラッシュを防ぐことができます。
アプリケーション接続プールの分析:クエリ速度や同時接続数などの主要メトリックを監視します。スレッドの一部のメトリックが動的しきい値を超えた場合、システムは自動的に例外イベントをトリガーし、プログラムのパフォーマンスをタイムリーに最適化します。
マイクロサービスモデルの監視:各マイクロサービスのリソース使用量と応答パフォーマンスを監視します。マイクロサービス間の相互作用と依存関係は複雑です。動的しきい値を使用すると、あるマイクロサービスで例外が発生した場合に、問題を迅速に特定し、マイクロサービス全体の安定性を確保できます。
例:
あるウェブサイトの通常のページビューが 10:00 から 18:00 の間は 1,000 を超えるとします。もし 22:00 から 06:00 の間もページビューが 1,000 を超え続ける場合、そのウェブサイトは攻撃を受けている可能性があります。この場合、ページビューの期待されるデータ範囲は時間とともに変化します。静的しきい値として 1000 を設定すると、日中にページビューが 1000 未満になった場合にアラート通知を受け取ることができます。しかし、夜間にウェブサイトが攻撃された場合、アラートはトリガーされません。このような状況では、動的しきい値を使用してデータ範囲をインテリジェントに更新し、異常を検知できます。
前提条件
ご利用のアプリケーションが Application Monitoring eBPF Edition で監視されていること。詳細については、「Application Monitoring eBPF Edition へのアプリケーションの接続」および「手動での Application Monitoring eBPF Edition へのアプリケーションの接続」をご参照ください。
レンジ検知の設定
ARMS コンソールにログインします。左側のナビゲーションウィンドウで、 を選択します。
[アラートルール] ページで、[eBPF アプリケーションリアルタイム監視アラートルールの作成] をクリックします。
[EBPF アラートルール用のアプリケーションリアルタイム監視の作成] ページで、カスタムの [アラート名] を入力し、[アラート検知タイプ] を [レンジ検知] に設定します。
説明しきい値検知の設定については、「しきい値検知」をご参照ください。
[アラートオブジェクト] セクションで、目的のパラメーターを選択できます。
パラメーター
説明
アラートアプリケーション
監視対象のアプリケーションを選択します。現在、レンジ検知は単一のアプリケーションに対するアラート設定のみをサポートしています。
メトリックタイプ
監視対象のメトリックのタイプを選択します。詳細については、「アラートルールメトリックの説明」をご参照ください。
メトリックタイプを選択すると、システムはリアルタイムで上限と下限を自動的に計算してレンダリングします。[アラート条件] セクションでメトリックの傾向をプレビューできます。
説明[アラートルール] と [フィルター条件] の条件付きフィールドは、[メトリックタイプ] によって異なります。
初回のレンダリングには約 2~4 秒かかります。
上限と下限の計算方法については、「しきい値範囲の計算方法」をご参照ください。
フィルター条件
メトリックをさらにフィルタリングして、監視範囲を絞り込みます。
アラートメトリックのディメンション:
[トラバース]:アラートコンテンツには、実際にアラートをトリガーしたディメンションが表示されます。
[ディメンションなし]:アラートコンテンツには、このディメンションのすべての値の合計が表示されます。
=:アラートコンテンツには、現在設定されているディメンションの値のみが表示されます。
!=:アラートコンテンツには、設定されたディメンションと等しくない値のみが表示されます。
[次を含む]:アラートコンテンツには、設定されたディメンションを含む値のみが表示されます。
[次を含まない]:アラートコンテンツには、設定されたディメンションを含まない値のみが表示されます。
[正規表現一致]:アラートコンテンツには、設定されたディメンションの正規表現に一致する値のみが表示されます。
[アラートルール] セクションで、[アラート条件] を設定します。
パラメーター
説明
アラートトリガーモード
レンジ検知は、単一の条件によるトリガーのみをサポートします。複数のトリガーモードの組み合わせはサポートしていません。
アラート条件
具体的なアラート条件を設定します。これには以下の要素が含まれます:
過去 X 分間:監視時間範囲を選択します。最大 60 分まで選択できます。
メトリックメジャー:メトリックの定量化可能なデータまたは値を指します。測定方法は、呼び出し回数や呼び出し応答時間など、メトリックタイプによって異なります。
集計メソッド:平均、最大、最小など、メトリックデータに対して実行される計算です。これもメトリックとメジャーに依存します。
比較メソッド:計算されたデータを比較して異常点を見つけます。レンジ検知には 3 つの比較メソッドがあります:
動的しきい値の範囲外:システムは現在の時間の上限と下限を自動的に計算します。データポイントが上限または下限の外側にある場合、異常と見なされ、アラートがトリガーされます。
動的しきい値の上限外:システムは現在の時間の上限と下限を自動的に計算します。データポイントが上限の外側にある場合、異常と見なされ、アラートがトリガーされます。
動的しきい値の下限外:システムは現在の時間の上限と下限を自動的に計算します。データポイントが下限の外側にある場合、異常と見なされ、アラートがトリガーされます。
アラートレベル:アラートレベルを P1 から P4 まで設定します。これらは異なる深刻度レベルを表します。
データプレビューエリアでは、青い線が実際のデータポイントを表し、緑色のエリアが上限と下限の範囲を表します。
[アラート通知] パラメーターと [高度なアラート設定] セクションのパラメーターを設定します。
パラメーター
説明
通知ポリシー
このフィールドは、[アラート通知] が [標準モード] に設定されている場合にのみ表示されます。有効な値:
[通知ポリシーを指定しない]:アラートがトリガーされても、通知は送信されません。通知は、通知ポリシーのマッチングルールがトリガーされた場合にのみ送信されます。
通知ポリシーを指定する:通知ポリシーを指定すると、ARMS はその通知ポリシーで指定された通知方法で通知を送信します。既存の通知ポリシーを選択するか、新しい通知ポリシーを作成できます。詳細については、「通知ポリシーの作成と管理」をご参照ください。
[高度なアラート設定]
[データなし]
このパラメーターは、データの欠落、複合メトリックの異常、期間比較結果の異常など、データの異常を修正するために使用されます。データの異常が修正可能な場合、データは自動的に 0 または 1 に変更されるか、アラートはトリガーされません。
詳細については、「用語」をご参照ください。
[保存] をクリックします。
しきい値の計算
ARMS の動的しきい値は、主に Prophet アルゴリズムに基づいて開発されています。動的しきい値を有効にすると、ARMS は 24 時間ごとに過去 7 日間の既存データを分析し、傾向と季節性を抽出して、次の 24 時間の予測データのトレンドチャートを描画します。同時に、メトリックの変動に基づいて期待されるデータ範囲が計算されます。動的しきい値を設定する際に、アルゴリズムによって計算された上限と下限をプレビューできます。
静的しきい値とは異なり、動的しきい値は、メトリックの期待されるデータ範囲が時間とともに変化しても、アラートルールを手動で編集して更新する必要がありません。これは、ARMS が 1 日に 1 回メトリックの傾向を分析し、翌日の上限と下限のみを予測するためです。
アラート数の予測
アラート数の予測機能は、アルゴリズムを使用して既存データを分析し、過去のアラートが発生した時間を表示し、指定された期間内のアラート数を予測します。この機能は、静的しきい値の設定や、動的しきい値のアラート秘密度の向上に役立ちます。
実装
ARMS は、過去 24 時間のメトリックデータに基づいて、メトリックの各しきい値が超過した回数を計算し、将来のアラート数を予測します。さらに、ARMS は、各しきい値が超過した特定の時間を含むメトリックの詳細を提供します。ビジネス要件に基づいてしきい値を調整できます。
アラートルールがトリガーされた後、「アラートイベント履歴の表示」ができます。
アラート通知を受け取った後、「アラート送信履歴の表示」ができます。