Managed Service for OpenTelemetry では、アラート ルールを作成できます。アラートがトリガーされると、システムはアラート ルールで指定された通知方法に基づいて、連絡先グループにアラート通知を送信します。このようにして、アラートにできるだけ早く対応できます。
前提条件
Alibaba Cloud は、旧バージョンのアラート機能をサポートしなくなりました。新しいアラート管理機能を使用してアラート ルールを作成できます。詳細については、以下のトピックを参照してください。
連絡先が作成されます。連絡先グループのみをアラートの通知受信者として設定できます。
背景情報
デフォルトでは、アラート通知は次のルールに基づいて送信されます。
短期間に大量のアラート通知を受信しないように、システムは 24 時間以内に繰り返されるアラートに対して 1 つのメッセージのみを送信します。
5 分以内に繰り返されるアラートが生成されない場合、システムは回復メールを送信して、アラートがクリアされたことを通知します。
回復メールが送信されると、システムはアラート ステータスをリセットします。このアラートが再度トリガーされた場合は、新しいアラートとして扱われます。
アラート コントロールは、データセットにデータを表示する方法です。アラート コントロールを作成すると、アラート コントロールの基礎となるデータを格納するためのデータセットも作成されます。
新しいアラートは 10 分以内に有効になります。アラート チェックには 1 ~ 3 分かかる場合があります。
アラート ルールの作成
期間比較で Java Virtual Machine-Garbage Collection (JVM-GC) 回数に関するアプリケーション監視タスクのアラートを作成するには、次の手順を実行します。
左側のナビゲーション ペインで、を選択します。
アラーム ポリシーページで、右上隅にあるアラームの作成をクリックします。
アラームの作成ダイアログ ボックスで、必要なパラメータを設定し、保存をクリックします。
アラーム名パラメータを指定します。この例では、「アプリケーション呼び出し統計」と入力します。
アプリケーション サイトドロップダウン リストからアプリケーションを選択し。
タイプドロップダウン リストからメトリック タイプを選択します。たとえば、Invocation_Statisticを選択できます。
ディメンションパラメータをトラバースに設定します。
アラート ルールパラメータを次のすべての条件を満たすに設定します。
過去 N 分パラメータを指定して、アラート ルールを設定します。たとえば、過去 5 分間の平均エラー率が 100% 以上の場合、アラートがトリガーされます。
説明アラート ルールを追加するには、
過去 N 分パラメータの横にあるアイコンをクリックします。通知モードパラメータを設定します。たとえば、「メール」を選択できます。
通知受信者パラメータを指定します。連絡先グループリストで、連絡先グループの名前をクリックします。連絡先グループが選択済みグループリストに表示されている場合、設定は成功です。

パラメーターの説明
次の表は、アラームの作成 ダイアログボックスのパラメーターについて説明しています。

パラメーター | 意味 | 説明 |
アプリケーションサイト | アラートルールが作成される監視タスク。 | ドロップダウンリストから監視タスクを選択します。 |
ディメンション | 指定されたメトリック(データセット)のディメンション。[なし]、[=]、または[トラバース]を選択できます。 |
|
過去N分 | システムは、過去N分間のメトリック値がトリガー条件を満たしているかどうかを確認します。 | Nの有効な値:1~60。 |
通知モード | 有効な値:メール、SMS、Ding Ding Robot、Webhook。 | 複数の通知方法を選択できます。DingTalkチャットボットアラートの設定方法の詳細については、DingTalkチャットボットのwebhook URLを取得するを参照してください。 |
アラーム抑制期間 | アラーム抑制期間をオンまたはオフにできます。デフォルトでは、アラーム抑制期間はオンになっています。 |
|
アラームの重大度 | 有効な値:警告、エラー、致命的。 | 該当なし |
通知時間 | アラート通知を送信できる時間範囲。この時間範囲外ではアラート通知は送信されませんが、アラートイベントは記録されます。 | アラートイベントレコードの表示方法の詳細については、アラートを管理するを参照してください。 |
通知内容 | アラート通知のカスタムコンテンツ。 | デフォルトのテンプレートを編集できます。テンプレートでは、$AlarmName、$AlarmFilter、$AlarmTime、および$AlarmContent変数を指定する必要があります。残りのコンテンツはカスタマイズできます。その他の変数はサポートされていません。 |
複雑な一般パラメーターの説明: 前期比
分単位の比較: たとえば、βは過去N分間のデータを示し、αは過去2N分からN分までの間に生成されたデータを示します。分単位の比較は、βとαを比較したときの増加率または減少率です。データは、平均値、合計値、最大値、または最小値です。
時間単位の分単位比較: たとえば、βは過去N分間のデータを示し、αは前の時間の過去N分間に生成されたデータを示します。時間単位の分単位比較は、βとαを比較したときの増加率または減少率です。
日単位の分単位比較: たとえば、βは過去N分間のデータを示し、αは前日の同じ時刻の過去N分間に生成されたデータを示します。日単位の分単位比較は、βとαを比較したときの増加率または減少率です。
複雑な一般パラメータの説明: アラームデータ修正
アラームデータ修正パラメータは、0を設定、1を設定、またはNullを設定(トリガーしない)に設定できます。このパラメータを使用すると、データなし、複合メトリックの異常、前期間比の異常など、データの異常を修正できます。
0で埋める: チェックされた値を0に修正します。
1で埋める: チェックされた値を1に修正します。
Nullを設定(トリガーしない): アラートをトリガーしません。
シナリオ:
異常1: データなし
ユーザーAは、アラート機能を使用してページビューを監視したいと考えています。ユーザーAがブラウザ監視アラートを作成するとき、ユーザーAは、過去5分間のページビューの合計が10以下の場合にアラートがトリガーされるように指定します。ページにアクセスがない場合、データは報告されず、アラート通知は送信されません。この問題を解決するために、ユーザーAはアラームデータ修正ポリシーパラメータに0で埋めるを選択できます。データが受信されない場合、システムはゼロのデータレコードが受信されたと判断します。これはアラートルールで指定された条件を満たし、アラート通知が送信されます。
異常2: 前期間比の異常
ユーザーCは、アラート機能を使用してノードのCPU使用率を監視したいと考えています。ユーザーCがアプリケーション監視アラートを作成するとき、ユーザーCは、過去3分間のノードの平均CPU使用率が前の監視期間と比較して100%減少した場合にアラートがトリガーされるように指定します。過去N分間にCPUに障害が発生した場合、システムは前期間比の比較結果の計算に使用されるαを取得できません。この場合、比較結果は存在しません。アラート通知は送信されません。この問題を解決するために、ユーザーCはアラームデータ修正ポリシーパラメータに1で埋めるを選択できます。αが取得されない場合、システムは前期間比の比較結果が100%の減少であると判断します。これはアラートルールで指定された条件を満たし、アラート通知が送信されます。
次のステップ
アラート管理でアラートレコードをクエリおよび削除できます。