アラートルール - Cloud Monitor - Alibaba Cloud ドキュメントセンター

アラートルールを作成して、特定のアプリケーションを監視します。ルールがトリガーされると、システムはアラートイベントを生成します。その後、アラート連絡先、チャットボット、カスタム Webhook、アクション連携などの通知受信者にアラート通知を送信します。この通知により、必要なアクションを実行するように促されます。

前提条件

監視タイプに基づいて、アラートを作成する監視対象を作成済みであること。
アラートの通知受信者を作成済みであること。

アラートルールの作成

CloudMonitor 2.0 コンソールにログインします。左側のナビゲーションウィンドウで、[すべての機能] > [アラートセンター] を選択します。
[アラートセンター] ページで、[アラート管理] > [アラートルール] を選択します。
[アラートルール] ページで、[アラートルールの作成] をクリックします。

[アラートルールの作成] パネルで、アラートルールのパラメーターを設定します。

[ルール名]：アラートルールのカスタム名を入力します。

[監視タイプ]：アラートルールに必要な監視タイプを選択します。

Prometheus 向けマネージドサービス

パラメーター	説明
データソースタイプ	ターゲット監視タイプのデータソース。
リージョン	データソースのリージョン。
Prometheus インスタンス	選択したターゲットインスタンスに基づいてアラートルールを設定します。
[検出条件の定義方法]	[カスタム PromQL]：要件に基づいて [PromQL のカスタマイズ] クエリ構文を使用できます。詳細については、「PromQL 関数の使用例」をご参照ください。
[検出条件の定義方法]	[事前定義メトリックに基づく設定]：メトリックグループ: メトリックグループを選択します。メトリック: メトリックを選択します。 [検出条件]：比較演算子とカウントを指定して検出条件を設定します。 PromQL プレビュー: 定義済みメトリックの PromQL 文をプレビューします。
重大度	アラートルールの重大度を設定します。 [P1]：緊急 P2: エラー [P3]：警告 P4：通常
期間	アラートの期間を設定します。
[アラート検出期間]	アラート検出期間の時間を設定します。
[データ完了後の検出]	検出方法を選択します。
コンテンツ	Go テンプレート構文を使用して、アラートメッセージの内容をカスタマイズします。例： `Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Container: {{$labels.container}} CPU usage {{$labels.metrics_params_opt_label_value}} {{$labels.metrics_params_value}}%, Current value {{ printf "%.2f" $value }}%`

アプリケーションモニタリング

パラメーター	説明
データソースタイプ	ターゲットのモニタリングタイプのデータソースタイプ。
リージョン	データソースのリージョン。
アプリケーション	アラートルールを設定するアプリケーションインスタンスを選択します。
メトリックグループ	アプリケーションメトリックのグループを選択します。
API 名	API の一致方式を選択します。たとえば、[すべて]、[等しい]、[等しくない]、[正規表現一致]、[正規表現不一致]、[ディメンションなし] などです。
API 呼び出しタイプ
検出条件メソッド	単一条件: [直近] `N` [分]、呼び出しタイプ、計算メソッドを設定し、比較オペレーターを選択します。 [クリティカル]、[エラー]、[警告]、および [正常] の各レベルの値を設定します。 PromQL プレビュー: 事前定義されたメトリックの PromQL 文をプレビューします。複数条件: [複数アラートトリガールール]：アラートルールをトリガーする条件を選択します。[いずれかの条件を満たす] または [すべての条件を満たす] を選択できます。 [検出条件 1]：単一条件のパラメーター設定をご参照ください。 [検出条件の追加]：必要に応じて検出条件を追加します。 [重大度レベル]：必要に応じて重大度レベルを選択します。[P1: 緊急]、[P2: エラー]、[P3: 警告]、[P4: 情報] が含まれます。
[アラート検出期間]	アラート検出期間の時間を設定します。
[検出判定の説明]	カスタム検出判定の内容をプレビューします。

リアルユーザーモニタリング

パラメーター	説明
データソースタイプ	ターゲットの監視タイプのデータソースタイプです。
リージョン	データソースのリージョンです。
アプリケーション	アラートルールを設定するアプリケーションインスタンスを選択します。
メトリックグループ	アプリケーションメトリックグループを選択します。[例外監視]、[無応答監視]、[リソース監視]、[ページ監視] が含まれます。
フィルター条件	選択した [メトリックグループ] に基づいて、さまざまな事前定義パラメーターが利用可能です。入力値の一致方式を選択できます。たとえば、[すべて]、[等しい]、[等しくない]、[含む]、[含まない]、[正規表現一致]、[正規表現不一致]、[ディメンションなし] などです。
検出条件方式	上記の [アプリケーション監視] をご参照ください。
[アラート検出期間]	アラート検出期間の時間を設定します。
[検出判定の説明]	カスタム検出判定の内容をプレビューします。

大規模言語モデル (LLM) オブザーバビリティ

パラメーター	説明
データソースタイプ	Prometheus ログ
リージョン	データソースのリージョン。
アプリケーション	アラートルールを設定するアプリケーションインスタンスを選択します。
メトリックグループ	アプリケーションメトリックグループを選択します。[例外監視]、[無応答監視]、[リソース監視]、[ページ監視] が含まれます。
フィルター条件	選択した [メトリックグループ] に基づいて、さまざまな事前定義パラメーターが利用可能です。入力値の一致方式を選択できます。たとえば、[すべて]、[等しい]、[等しくない]、[含む]、[含まない]、[正規表現一致]、[正規表現不一致]、[ディメンションなし] などです。
検出条件方式	上記の [アプリケーション監視] をご参照ください。
[アラート検出期間]	アラート検出期間の時間を設定します。
[検出判定の説明]	カスタム検出判定の内容をプレビューします。

CloudMonitor Basic

パラメータ	説明
製品	アラートルールを作成する対象のクラウドプロダクトを選択します。
リソース範囲	選択したクラウドプロダクトのリソース範囲を設定します。[すべてのリソース]、[アプリケーショングループ]、[インスタンス] が含まれます。
メトリックタイプ	必要に応じてアラートルールのメトリックタイプを設定します。 [シンプルメトリック]：[メトリック] を設定し、そのしきい値とアラートレベル (緊急、警告、情報) を設定します。各レベルの期間としきい値を設定します。 [複合メトリック]：異なるアラートレベルを選択し、複数のメトリックを組み合わせます。 [複数メトリックのアラート説明]：複数の異なるメトリックを追加し、しきい値条件を設定します。説明複数メトリックのアラートルールを設定する場合、ターゲットリソースには各メトリックのデータが必要です。条件が満たされた後にのみアラートがトリガーされます。たとえば、複数メトリックのアラートルールにパブリックネットワークのメトリックが含まれているが、ECS ホストにパブリック IP アドレスが設定されていない場合、アラートはトリガーされません。 [複数メトリックの関係]：異なる条件を持つメトリックを追加した後、論理演算子を設定できます。たとえば、すべての条件が満たされたとき、またはいずれかの条件が満たされたときにアラートをトリガーするなどです。 [式]：まず、[アラートレベル] を選択します。次に、[アラート式] と [アラートしきい値のトリガー回数] を設定します。
[データなしの処理方法]	データがない場合の処理方法を選択します。 [処理しない] [データなしアラートを送信] [回復済みと見なす]

[ハイブリッドクラウド監視]：カスタムの [メトリックリポジトリ] を選択します。後続の設定については、このドキュメントの Managed Service for Prometheus 監視タイプのパラメーター説明をご参照ください。
[Synthetic Monitoring]：このドキュメントの Managed Service for Prometheus 監視タイプのパラメーター説明をご参照ください。
[Container Insight]、[ECS Insight]、[RDS Insight]、[AI Infra Service Insight]、または [Redis Insight]：このドキュメントの Managed Service for Prometheus 監視タイプのパラメーター説明をご参照ください。

ログ監査

パラメータ	説明
テンプレートを選択	[ActionTrail]：必要に応じて ActionTrail テンプレートを選択します。 [ホスト監査]：必要に応じてホスト監査テンプレートを選択します。
[クエリ統計]	単一クエリ: ログ関連情報を設定して単一クエリを実行します。 [セット操作]：セット操作の方法を設定します。複数のリソースグループを追加できます。
検出判定	必要に応じて複数の条件を追加します。データの一致方式と重大度レベルを設定します。
重大度レベル	必要に応じて、[クリティカル]、[エラー]、[警告]、[通常] などのアラートレベルを選択します。
連続発生回数	アラートをトリガーするために条件を満たす必要がある連続回数を設定します。
[アラート検出期間]	アラート検出のカスタム期間を設定します。

[Simple Log Service]：このドキュメントのログ監査監視タイプのパラメーター説明をご参照ください。

[アラート情報] を設定します。
1. [内容]：アラート情報をカスタマイズします。
2. [ラベル] と [アノテーション]：アラートルールのラベルとアノテーションを設定します。各ラベルまたはアノテーションは、タグ名とタグ値で構成されます。
[アラート通知] を設定します。
1. 通知受信者: アラートがトリガーされたときにアラート情報を受信するには、[連絡先]、[連絡先グループ]、[DingTalk]、[WeCom]、[Lark]、[Slack]、または [カスタム Webhook] などの通知受信者を 1 つ以上選択します。
2. [ARMS アラート管理への連携]：[はい] または [いいえ] を選択します。
  説明
  アラートイベントはデフォルトで ARMS オペレーションセンターに送信されます。ARMS オペレーションセンターでアラート通知を設定できます。
3. [アクション連携]：Simple Log Service、軽量メッセージキュー、Function Compute、および PagerDuty や Webhook などのサードパーティサービスなど、後続のアラート処理を行う特定のクラウドプロダクトまたはサードパーティサービスを選択します。
4. [ミュート期間]：アラートが解決されない場合にアラート通知を再送信する間隔。有効な値は、1、5、10、15、30、50 分、および 1、3、6、12、24 時間です。
  説明
  たとえば、[ミュート期間] を 12 時間 に設定した場合、アラートが解決されないと、CloudMonitor は 12 時間後にアラート通知を再送信します。
5. [有効期間]：アラートルールがアクティブな期間。アラート通知は有効期間中にのみ送信されます。
  説明
  - アラートルールが有効期間外の場合、アラート通知は送信されません。ただし、アラートはアラート履歴に記録されます。
  - 有効期間は 24 時間以内で設定でき、日をまたぐこともできます。たとえば、期間を 23:00 から翌日の 01:00 までに設定できます。

アラートルールの管理

[アラートルール] ページでは、アラートルールの検索、編集、削除ができます：

検索：次のパラメーターを使用してアラートルールのリストをフィルターします：
- [監視タイプ]
- [ルール名]
- [ルール ID]
- アラートステータス
- [有効/無効]
その他のフィルター：[その他のフィルター] をクリックします。[タグの追加] および [通知受信者の追加] フィルターを使用して検索することもできます。
編集：編集するアラートルールを見つけ、[操作] 列の [編集] をクリックし、ダイアログボックスで情報を変更してから [OK] をクリックします。
削除：削除するアラートルールを見つけ、[操作] 列の [削除] をクリックします。