アラートルールを作成して、特定のアプリケーションを監視します。ルールがトリガーされると、システムはアラートイベントを生成します。その後、アラート連絡先、チャットボット、カスタム Webhook、アクション連携などの通知受信者にアラート通知を送信します。この通知により、必要なアクションを実行するように促されます。
前提条件
監視タイプに基づいて、アラートを作成する監視対象を作成済みであること。
アラートの 通知受信者 を作成済みであること。
アラートルールの作成
CloudMonitor 2.0 コンソールにログインします。左側のナビゲーションウィンドウで、 を選択します。
[アラートセンター] ページで、 を選択します。
[アラートルール] ページで、[アラートルールの作成] をクリックします。
[アラートルールの作成] パネルで、アラートルールのパラメーターを設定します。
[ルール名]:アラートルールのカスタム名を入力します。
[監視タイプ]:アラートルールに必要な監視タイプを選択します。
Prometheus 向けマネージドサービス
パラメーター
説明
データソースタイプ
ターゲット監視タイプのデータソース。
リージョン
データソースのリージョン。
Prometheus インスタンス
選択したターゲットインスタンスに基づいてアラートルールを設定します。
[検出条件の定義方法]
[カスタム PromQL]:要件に基づいて [PromQL のカスタマイズ] クエリ構文を使用できます。詳細については、「PromQL 関数の使用例」をご参照ください。
[事前定義メトリックに基づく設定]:
メトリックグループ: メトリックグループを選択します。
メトリック: メトリックを選択します。
[検出条件]:比較演算子とカウントを指定して検出条件を設定します。
PromQL プレビュー: 定義済みメトリックの PromQL 文をプレビューします。
重大度
アラートルールの重大度を設定します。
[P1]:緊急
P2: エラー
[P3]:警告
P4:通常
期間
アラートの期間を設定します。
[アラート検出期間]
アラート検出期間の時間を設定します。
[データ完了後の検出]
検出方法を選択します。
コンテンツ
Go テンプレート構文を使用して、アラートメッセージの内容をカスタマイズします。例: Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Container: {{$labels.container}} CPU usage {{$labels.metrics_params_opt_label_value}} {{$labels.metrics_params_value}}%, Current value {{ printf "%.2f" $value }}%
アプリケーションモニタリング
パラメーター
説明
データソースタイプ
ターゲットのモニタリングタイプのデータソースタイプ。
リージョン
データソースのリージョン。
アプリケーション
アラートルールを設定するアプリケーションインスタンスを選択します。
メトリックグループ
アプリケーションメトリックのグループを選択します。
API 名
API の一致方式を選択します。たとえば、[すべて]、[等しい]、[等しくない]、[正規表現一致]、[正規表現不一致]、[ディメンションなし] などです。
API 呼び出しタイプ
検出条件メソッド
単一条件:
[直近]
N[分]、呼び出しタイプ、計算メソッドを設定し、比較オペレーターを選択します。[クリティカル]、[エラー]、[警告]、および [正常] の各レベルの値を設定します。
PromQL プレビュー: 事前定義されたメトリックの PromQL 文をプレビューします。
複数条件:
[複数アラートトリガールール]:アラートルールをトリガーする条件を選択します。[いずれかの条件を満たす] または [すべての条件を満たす] を選択できます。
[検出条件 1]:単一条件のパラメーター設定をご参照ください。
[検出条件の追加]:必要に応じて検出条件を追加します。
[重大度レベル]:必要に応じて重大度レベルを選択します。[P1: 緊急]、[P2: エラー]、[P3: 警告]、[P4: 情報] が含まれます。
[アラート検出期間]
アラート検出期間の時間を設定します。
[検出判定の説明]
カスタム検出判定の内容をプレビューします。
リアルユーザーモニタリング
パラメーター
説明
データソースタイプ
ターゲットの監視タイプのデータソースタイプです。
リージョン
データソースのリージョンです。
アプリケーション
アラートルールを設定するアプリケーションインスタンスを選択します。
メトリックグループ
アプリケーションメトリックグループを選択します。[例外監視]、[無応答監視]、[リソース監視]、[ページ監視] が含まれます。
フィルター条件
選択した [メトリックグループ] に基づいて、さまざまな事前定義パラメーターが利用可能です。入力値の一致方式を選択できます。たとえば、[すべて]、[等しい]、[等しくない]、[含む]、[含まない]、[正規表現一致]、[正規表現不一致]、[ディメンションなし] などです。
検出条件方式
上記の [アプリケーション監視] をご参照ください。
[アラート検出期間]
アラート検出期間の時間を設定します。
[検出判定の説明]
カスタム検出判定の内容をプレビューします。
大規模言語モデル (LLM) オブザーバビリティ
パラメーター
説明
データソースタイプ
Prometheus
ログ
リージョン
データソースのリージョン。
アプリケーション
アラートルールを設定するアプリケーションインスタンスを選択します。
メトリックグループ
アプリケーションメトリックグループを選択します。[例外監視]、[無応答監視]、[リソース監視]、[ページ監視] が含まれます。
フィルター条件
選択した [メトリックグループ] に基づいて、さまざまな事前定義パラメーターが利用可能です。入力値の一致方式を選択できます。たとえば、[すべて]、[等しい]、[等しくない]、[含む]、[含まない]、[正規表現一致]、[正規表現不一致]、[ディメンションなし] などです。
検出条件方式
上記の [アプリケーション監視] をご参照ください。
[アラート検出期間]
アラート検出期間の時間を設定します。
[検出判定の説明]
カスタム検出判定の内容をプレビューします。
CloudMonitor Basic
パラメータ
説明
製品
アラートルールを作成する対象のクラウドプロダクトを選択します。
リソース範囲
選択したクラウドプロダクトのリソース範囲を設定します。[すべてのリソース]、[アプリケーショングループ]、[インスタンス] が含まれます。
メトリックタイプ
必要に応じてアラートルールのメトリックタイプを設定します。
[シンプルメトリック]:[メトリック] を設定し、そのしきい値とアラートレベル (緊急、警告、情報) を設定します。各レベルの期間としきい値を設定します。
[複合メトリック]:異なるアラートレベルを選択し、複数のメトリックを組み合わせます。
[複数メトリックのアラート説明]:複数の異なるメトリックを追加し、しきい値条件を設定します。
説明複数メトリックのアラートルールを設定する場合、ターゲットリソースには各メトリックのデータが必要です。条件が満たされた後にのみアラートがトリガーされます。たとえば、複数メトリックのアラートルールにパブリックネットワークのメトリックが含まれているが、ECS ホストにパブリック IP アドレスが設定されていない場合、アラートはトリガーされません。
[複数メトリックの関係]:異なる条件を持つメトリックを追加した後、論理演算子を設定できます。たとえば、すべての条件が満たされたとき、またはいずれかの条件が満たされたときにアラートをトリガーするなどです。
[式]:まず、[アラートレベル] を選択します。次に、[アラート式] と [アラートしきい値のトリガー回数] を設定します。
[データなしの処理方法]
データがない場合の処理方法を選択します。
[処理しない]
[データなしアラートを送信]
[回復済みと見なす]
[ハイブリッドクラウド監視]:カスタムの [メトリックリポジトリ] を選択します。後続の設定については、このドキュメントの Managed Service for Prometheus 監視タイプのパラメーター説明をご参照ください。
[Synthetic Monitoring]:このドキュメントの Managed Service for Prometheus 監視タイプのパラメーター説明をご参照ください。
[Container Insight]、[ECS Insight]、[RDS Insight]、[AI Infra Service Insight]、または [Redis Insight]:このドキュメントの Managed Service for Prometheus 監視タイプのパラメーター説明をご参照ください。
ログ監査
パラメータ
説明
テンプレートを選択
[ActionTrail]:必要に応じて ActionTrail テンプレートを選択します。
[ホスト監査]:必要に応じてホスト監査テンプレートを選択します。
[クエリ統計]
単一クエリ: ログ関連情報を設定して単一クエリを実行します。
[セット操作]:セット操作の方法を設定します。複数のリソースグループを追加できます。
検出判定
必要に応じて複数の条件を追加します。データの一致方式と重大度レベルを設定します。
重大度レベル
必要に応じて、[クリティカル]、[エラー]、[警告]、[通常] などのアラートレベルを選択します。
連続発生回数
アラートをトリガーするために条件を満たす必要がある連続回数を設定します。
[アラート検出期間]
アラート検出のカスタム期間を設定します。
[Simple Log Service]:このドキュメントのログ監査監視タイプのパラメーター説明をご参照ください。
[アラート情報] を設定します。
[内容]:アラート情報をカスタマイズします。
[ラベル] と [アノテーション]:アラートルールのラベルとアノテーションを設定します。各ラベルまたはアノテーションは、タグ名とタグ値で構成されます。
[アラート通知] を設定します。
通知受信者: アラートがトリガーされたときにアラート情報を受信するには、[連絡先]、[連絡先グループ]、[DingTalk]、[WeCom]、[Lark]、[Slack]、または [カスタム Webhook] などの通知受信者を 1 つ以上選択します。
[ARMS アラート管理への連携]:[はい] または [いいえ] を選択します。
説明アラートイベントはデフォルトで ARMS オペレーションセンターに送信されます。ARMS オペレーションセンターでアラート通知を設定できます。
[アクション連携]:Simple Log Service、軽量メッセージキュー、Function Compute、および PagerDuty や Webhook などのサードパーティサービスなど、後続のアラート処理を行う特定のクラウドプロダクトまたはサードパーティサービスを選択します。
[ミュート期間]:アラートが解決されない場合にアラート通知を再送信する間隔。有効な値は、1、5、10、15、30、50 分、および 1、3、6、12、24 時間です。
説明たとえば、[ミュート期間] を 12 時間 に設定した場合、アラートが解決されないと、CloudMonitor は 12 時間後にアラート通知を再送信します。
[有効期間]:アラートルールがアクティブな期間。アラート通知は有効期間中にのみ送信されます。
説明アラートルールが有効期間外の場合、アラート通知は送信されません。ただし、アラートはアラート履歴に記録されます。
有効期間は 24 時間以内で設定でき、日をまたぐこともできます。たとえば、期間を 23:00 から翌日の 01:00 までに設定できます。
アラートルールの管理
[アラートルール] ページでは、アラートルールの検索、編集、削除ができます:
検索:次のパラメーターを使用してアラートルールのリストをフィルターします:
[監視タイプ]
[ルール名]
[ルール ID]
アラートステータス
[有効/無効]
その他のフィルター:[その他のフィルター] をクリックします。[タグの追加] および [通知受信者の追加] フィルターを使用して検索することもできます。
編集:編集するアラートルールを見つけ、[操作] 列の [編集] をクリックし、ダイアログボックスで情報を変更してから [OK] をクリックします。
削除:削除するアラートルールを見つけ、[操作] 列の
[削除] をクリックします。