CloudMonitor は Alibaba Cloud サービス全体のメトリックを追跡し、しきい値を超えるとアラートを発生させます。これらのアラートを Application Real-Time Monitoring Service (ARMS) のアラート管理に統合することで、サービス全体のアラートのトリアージ、重複排除、通知ルーティングを一元管理できます。
仕組み
CloudMonitor アラートは Webhook を介して ARMS に到達します。
統合を作成すると、ARMS は一意の Webhook URL を生成します。
CloudMonitor は、ルールがトリガーまたはクリアされるたびに、その URL にアラートイベントを送信します。
ARMS は、受信したフィールドを独自のアラートスキーマにマッピングし、イベントを重複排除し、ポリシーに基づいて通知をルーティングします。
設定された自動回復期間内にアラートイベントが再度トリガーされない場合、ARMS は自動的にそれをクリアします。
アラートをアラート管理に統合しない場合、ソースシステムは自身の処理能力に基づいてアラートを処理します。
統合方法の選択
| 方法 | 最適なケース | 仕組み |
|---|---|---|
| サービスレベルの統合 | 1 つ以上の CloudMonitor サービスからのすべてのアラートを一度にキャプチャする場合 | ARMS は、選択されたサービス配下にあるすべてのアラートルールのコールバック URL を自動的に書き換えます |
| ルールレベルの統合 | 特定のアラートルールを選択的にルーティングする場合 | ARMS の Webhook URL を個々の CloudMonitor アラートルールに手動で貼り付けます |
前提条件
開始する前に、ARMS コンソールと CloudMonitor コンソールの両方にアクセスできる Alibaba Cloud アカウントがあることを確認してください。
サービスレベルの統合の作成
ARMS コンソールの左側のナビゲーションウィンドウで、[アラート管理] > [統合] を選択します。
[アラート統合] タブで、[CloudMonitor] をクリックします。
ダイアログボックスで、次の設定項目を構成します。
統合の [名前] と [説明]。
[自動回復時間]:この期間内にアラートイベントが再度トリガーされない場合、ARMS は自動的にイベントをクリアします。
[アラートイベントが有効なサービス] セクションの [すべてのサービス] リストには、ご利用のアカウントで利用可能なすべての CloudMonitor サービスが表示されます。統合したいアラートを持つサービスを選択し、
アイコンをクリックして選択済みリストに移動させ、[保存] をクリックします。説明 このステップにより、ARMS は選択されたサービスのアラートルールをすべてスキャンし、そのコールバック URL をhttps://alerts.aliyuncs.com/api/v1/cm/callback/{{token}}に書き換えます。ここで、{{token}}はこの統合のために自動的に生成されるキーです。
保存後、新しい統合が [アラート統合] タブに表示されます。

特定のアラートルールの統合
特定のアラートルールは、既存の CloudMonitor 統合にのみ追加できます。まだ作成していない場合は、まず統合を作成してください。
[統合] ページの [アラート統合] タブで、対象の CloudMonitor 統合を見つけ、その URL をコピーします。
CloudMonitor コンソールにログインします。
左側のナビゲーションウィンドウで、[アラート] > [アラートルール] を選択します。
変更するアラートルールを見つけ、[操作] 列の [変更] をクリックします。
[アラートルールの作成] パネルで、[詳細設定] に移動し、統合 URL を [アラートコールバック] フィールドに貼り付けます。
[OK] をクリックします。
選択されたアラートルールは、イベントを ARMS 統合に送信するようになります。
フィールドマッピングの設定
アラート管理は、Grafana アラートソースと ARMS アラートイベント間のフィールドマッピングを提供します。[統合の編集] ページでフィールド間のマッピングを追加または変更することもできます。マッピングをカスタマイズするには、統合を編集します。
テストデータの送信
[アラート統合] タブで、統合を見つけ、[操作] 列の [編集] をクリックします。
[イベントマッピング] セクションで、[テストデータの送信] をクリックします。
アラートコンテンツを JSON 形式で貼り付け、[送信] をクリックします。
メッセージ「アップロードされました。イベントは生成されません。元のデータに基づいてマッピングを設定してください。」が表示された場合、フィールドはまだマッピングされていません。マッピング設定時の参考として、生のペイロードが左側のパネルに表示されます。
「アップロードされました。」というメッセージが表示された場合、データは正常にマッピングされ、[アラート イベント履歴]ページで利用可能になります。詳細については、「過去のアラート イベントを表示する」をご参照ください。
[無効化] をクリックして、テストデータダイアログを閉じます。
フィールドマッピングのセットアップ
[イベントマッピング] セクションで:
左側のパネルで、データレコードをクリックしてそのフィールドを表示します。
右側のパネルで、ソースフィールドを ARMS アラートフィールドにマッピングします。各フィールドの横にあるマッピングアイコンをクリックして、マッピング方法を選択します。
方法 説明 Direct ソースフィールドを ARMS フィールドに直接マップします Series 複数のソースフィールドをデリミタで連結し、その結果を ARMS フィールドにマップします。デリミタとして使用できるのは特殊文字のみです。 Conditional 指定された条件が満たされた場合にのみ、ソースフィールドを ARMS フィールドにマップします Mapping table ソースの重大度値を ARMS の重大度レベルにマップします
ARMS アラートフィールドのリファレンス
| フィールド | 説明 |
|---|---|
alertname | カスタムアラート名 |
severity | 深刻度レベル。[直接] マッピング方法を使用する必要があります。 |
message | 通知コンテンツとして使用されるアラートの説明。最大 15,000 文字。 |
value | サンプルメトリック値 |
imageUrl | Grafana メトリックの折れ線グラフの URL |
check | チェック項目 (例:CPU、JVM、アプリケーションクラッシュ、デプロイメント) |
source | アラートソース |
class | イベントをトリガーするオブジェクトタイプ (例:ホスト) |
service | ソースサービス (例:ログインサービス) |
startat | イベント開始タイムスタンプ |
endat | イベント終了タイムスタンプ |
generatorUrl | イベント詳細へのリンク URL |
バッチ処理の有効化 (任意)
アラートデータに配列ノードが含まれている場合、それをバッチ処理のルートノードとして指定します。配列内の各要素は、個別のイベントとして処理されます。
[ルートノードの選択] セクションで、[バッチ処理を使用] を選択し、配列ノードを選択します。
イベントの重複排除の設定
重複排除は、指定されたフィールドで同じ値を共有する複数のイベントを単一のアラート通知にマージします。これにより、繰り返しのアラートによるノイズが削減されます。
[統合の詳細] ページの [イベントの重複排除] セクションで、重複排除に使用するフィールドを選択します。
[重複排除テスト] をクリックして、履歴イベントがどのようにグループ化されるかをプレビューします。
説明 [イベントマッピング] セクションでアップロードされた最新の 10 件のデータレコードに対してテストが実行されます。重複排除は、クリアされていないイベントにのみ適用されます。[保存] をクリックします。
アラートイベント詳細の表示
ARMS コンソールの左側のナビゲーションウィンドウで、[アラート管理] > [アラートイベント履歴] を選択します。
アラートイベント名をクリックして、その詳細を表示します。詳細については、「過去のアラートイベントの表示」をご参照ください。
既存の統合へのサービスの追加
[統合] ページで、CloudMonitor 統合を見つけ、[操作] 列で [その他] > [プロダクトの選択] を選択します。
追加のサービスを選択し、
アイコンをクリックしてから、[保存] をクリックします。
統合の管理
[アラート統合] タブでは、以下の操作が可能です。
| アクション | 手順 |
|---|---|
| 詳細の表示 | 統合の行をクリックして [統合詳細] ページを開きます。 |
| キーの更新 | [その他] > [キーの更新] を選択し、[OK] をクリックします。キーが更新された後、監視対象サービスを統合に再度追加する必要があります。詳細については、「既存の統合へのサービスの追加」をご参照ください。 |
| 編集 | [操作] 列の [編集] をクリックし、[統合詳細] ページで設定を変更して、[保存] をクリックします。 |
| 有効化/無効化 | [操作] 列で [無効化] または [有効化] をクリックします。 |
| 削除 | [操作] 列の [削除] をクリックし、次に [OK] をクリックします。 |
| イベント処理フローの追加 | [操作] 列の [イベント処理フローの追加] をクリックします。詳細については、「イベント処理フローの操作」をご参照ください。 |
| 通知ポリシーの作成 | [その他] > [通知ポリシーの作成] を選択します。詳細については、「通知ポリシーの作成と管理」をご参照ください。 |
次のステップ
通知ポリシーを設定して、ARMS がアラート通知を生成およびルーティングする方法を定義します。詳細については、「通知ポリシーの作成と管理」をご参照ください。
送信済みアラートを確認するには、[アラート送信履歴] ページに移動してください。詳細については、「過去のアラートを表示する」をご参照ください。