すべてのプロダクト
Search
ドキュメントセンター

Managed Service for OpenTelemetry:アラート ルールの作成

最終更新日:Mar 05, 2025

Managed Service for OpenTelemetry では、アラート ルールを作成できます。アラートがトリガーされると、システムはアラート ルールで指定された通知方法に基づいて、連絡先グループにアラート通知を送信します。このようにして、アラートにできるだけ早く対応できます。

前提条件

説明

Alibaba Cloud は、旧バージョンのアラート機能をサポートしなくなりました。新しいアラート管理機能を使用してアラート ルールを作成できます。詳細については、以下のトピックを参照してください。

連絡先が作成されます。連絡先グループのみをアラートの通知受信者として設定できます。

背景情報

デフォルトでは、アラート通知は次のルールに基づいて送信されます。

  • 短期間に大量のアラート通知を受信しないように、システムは 24 時間以内に繰り返されるアラートに対して 1 つのメッセージのみを送信します。

  • 5 分以内に繰り返されるアラートが生成されない場合、システムは回復メールを送信して、アラートがクリアされたことを通知します。

  • 回復メールが送信されると、システムはアラート ステータスをリセットします。このアラートが再度トリガーされた場合は、新しいアラートとして扱われます。

アラート コントロールは、データセットにデータを表示する方法です。アラート コントロールを作成すると、アラート コントロールの基礎となるデータを格納するためのデータセットも作成されます。

説明

新しいアラートは 10 分以内に有効になります。アラート チェックには 1 ~ 3 分かかる場合があります。

アラート ルールの作成

期間比較で Java Virtual Machine-Garbage Collection (JVM-GC) 回数に関するアプリケーション監視タスクのアラートを作成するには、次の手順を実行します。

  1. Managed Service for OpenTelemetry コンソールにログオンします。

  2. 左側のナビゲーション ペインで、アラート履歴 > アラート ルールと履歴を選択します。

  3. アラーム ポリシーページで、右上隅にあるアラームの作成をクリックします。

  4. アラームの作成ダイアログ ボックスで、必要なパラメータを設定し、保存をクリックします。

    1. アラーム名パラメータを指定します。この例では、「アプリケーション呼び出し統計」と入力します。

    2. アプリケーション サイトドロップダウン リストからアプリケーションを選択し。

    3. タイプドロップダウン リストからメトリック タイプを選択します。たとえば、Invocation_Statisticを選択できます。

    4. ディメンションパラメータをトラバースに設定します。

    5. アラート ルールパラメータを次のすべての条件を満たすに設定します。

    6. 過去 N 分パラメータを指定して、アラート ルールを設定します。たとえば、過去 5 分間の平均エラー率が 100% 以上の場合、アラートがトリガーされます。

      説明

      アラート ルールを追加するには、加号图标過去 N 分パラメータの横にあるアイコンをクリックします。

    7. 通知モードパラメータを設定します。たとえば、「メール」を選択できます。

    8. 通知受信者パラメータを指定します。連絡先グループリストで、連絡先グループの名前をクリックします。連絡先グループが選択済みグループリストに表示されている場合、設定は成功です。

    链路追踪报警

パラメーターの説明

次の表は、アラームの作成 ダイアログボックスのパラメーターについて説明しています。

创建报警对话框

パラメーター

意味

説明

アプリケーションサイト

アラートルールが作成される監視タスク。

ドロップダウンリストから監視タスクを選択します。

ディメンション

指定されたメトリック(データセット)のディメンション。[なし]、[=]、または[トラバース]を選択できます。

  • [なし]を選択すると、アラートコンテンツにはこのディメンションのすべての値の合計が表示されます。

  • [=]を選択した場合は、特定の値を入力する必要があります。

  • [トラバース]を選択すると、アラートコンテンツには、実際にアラートをトリガーしたディメンションコンテンツが表示されます。

過去N分

システムは、過去N分間のメトリック値がトリガー条件を満たしているかどうかを確認します。

Nの有効な値:1~60。

通知モード

有効な値:メール、SMS、Ding Ding Robot、Webhook。

複数の通知方法を選択できます。DingTalkチャットボットアラートの設定方法の詳細については、DingTalkチャットボットのwebhook URLを取得するを参照してください。

アラーム抑制期間

アラーム抑制期間をオンまたはオフにできます。デフォルトでは、アラーム抑制期間はオンになっています。

  • アラーム抑制期間をオンにする:データがトリガーされた状態のままの場合、2番目のアラート通知は、最初のアラートがトリガーされてから24時間後に送信されます。データが復旧した場合、システムはデータ復旧通知を送信し、アラートをクリアします。データがアラートをもう一度トリガーした場合、システムはアラート通知を再度送信します。

  • アラーム抑制期間をオフにする:アラートが継続的にトリガーされた場合、システムは1分ごとにアラート通知を送信します。

アラームの重大度

有効な値:警告、エラー、致命的。

該当なし

通知時間

アラート通知を送信できる時間範囲。この時間範囲外ではアラート通知は送信されませんが、アラートイベントは記録されます。

アラートイベントレコードの表示方法の詳細については、アラートを管理するを参照してください。

通知内容

アラート通知のカスタムコンテンツ。

デフォルトのテンプレートを編集できます。テンプレートでは、$AlarmName、$AlarmFilter、$AlarmTime、および$AlarmContent変数を指定する必要があります。残りのコンテンツはカスタマイズできます。その他の変数はサポートされていません。

複雑な一般パラメーターの説明: 前期比

  • 分単位の比較: たとえば、βは過去N分間のデータを示し、αは過去2N分からN分までの間に生成されたデータを示します。分単位の比較は、βとαを比較したときの増加率または減少率です。データは、平均値、合計値、最大値、または最小値です。Day-on-day Growth or Decline

  • 時間単位の分単位比較: たとえば、βは過去N分間のデータを示し、αは前の時間の過去N分間に生成されたデータを示します。時間単位の分単位比較は、βとαを比較したときの増加率または減少率です。Growth or Decline

  • 日単位の分単位比較: たとえば、βは過去N分間のデータを示し、αは前日の同じ時刻の過去N分間に生成されたデータを示します。日単位の分単位比較は、βとαを比較したときの増加率または減少率です。Growth or Decline

複雑な一般パラメータの説明: アラームデータ修正

アラームデータ修正パラメータは、0を設定、1を設定、またはNullを設定(トリガーしない)に設定できます。このパラメータを使用すると、データなし、複合メトリックの異常、前期間比の異常など、データの異常を修正できます。

  • 0で埋める: チェックされた値を0に修正します。

  • 1で埋める: チェックされた値を1に修正します。

  • Nullを設定(トリガーしない): アラートをトリガーしません。

シナリオ:

  • 異常1: データなし

    ユーザーAは、アラート機能を使用してページビューを監視したいと考えています。ユーザーAがブラウザ監視アラートを作成するとき、ユーザーAは、過去5分間のページビューの合計が10以下の場合にアラートがトリガーされるように指定します。ページにアクセスがない場合、データは報告されず、アラート通知は送信されません。この問題を解決するために、ユーザーAはアラームデータ修正ポリシーパラメータに0で埋めるを選択できます。データが受信されない場合、システムはゼロのデータレコードが受信されたと判断します。これはアラートルールで指定された条件を満たし、アラート通知が送信されます。

  • 異常2: 前期間比の異常

    ユーザーCは、アラート機能を使用してノードのCPU使用率を監視したいと考えています。ユーザーCがアプリケーション監視アラートを作成するとき、ユーザーCは、過去3分間のノードの平均CPU使用率が前の監視期間と比較して100%減少した場合にアラートがトリガーされるように指定します。過去N分間にCPUに障害が発生した場合、システムは前期間比の比較結果の計算に使用されるαを取得できません。この場合、比較結果は存在しません。アラート通知は送信されません。この問題を解決するために、ユーザーCはアラームデータ修正ポリシーパラメータに1で埋めるを選択できます。αが取得されない場合、システムは前期間比の比較結果が100%の減少であると判断します。これはアラートルールで指定された条件を満たし、アラート通知が送信されます。

次のステップ

アラート管理でアラートレコードをクエリおよび削除できます。