CloudOps Orchestration Service (OOS) を使用すると、クラウドサービスのメトリックに対するしきい値アラートによってトリガーされる運用保守タスクを作成できます。モニタリング対象のクラウドリソースのメトリックが指定のしきい値に達すると、OOS は指定されたテンプレートを実行して、アラートベースの運用保守を実行します。これらのタスクは、キャンセルされるまで継続的に実行され、アラートを監視します。たとえば、ディスク使用率が 80% を超えた場合にログディレクトリをクリアする運用保守タスクを作成できます。
サポートされているメトリックの詳細については、「Alibaba Cloud サービスの主要メトリック」をご参照ください。
アラート運用保守タスクを作成するには、次の手順を実行します:
アラートルールの設定
テンプレートの選択
アラートトリガーのテンプレートパラメーターの設定
アラートルールの設定
フィールド | 必須 | 説明 |
プロダクトタイプ | はい | ドロップダウンリストからプロダクトを選択します。1 つのみ選択できます。 |
ルールの説明 | はい | しきい値アラートのルールです。 |
ミュート期間 | いいえ | モニタリングデータが継続的にアラートのしきい値を超えた場合、各ミュート期間中にアラートは 1 回だけトリガーされます。デフォルトの期間は 1 日です。 |
有効期間 | いいえ | アラートルールが有効な時間範囲です。デフォルトでは、ルールは終日有効です。 |
アラート対象リソース | はい | 説明 注意:次の 3 つの方法のいずれかを使用してリソースを選択しない場合、ルールはアカウント内のすべてのリソースに適用されます。
|
しきい値アラートルールには、次のフィールドが含まれます:
メトリック名
モニタリングデータの集計期間
統計期間の数
統計メソッド
比較演算子
しきい値

テンプレートの選択
アラート発生時に実行するテンプレートを選択します。
アラートトリガーのテンプレートパラメーターの設定
テンプレートパラメーターには、静的な値を入力するか、アラートメッセージからパラメーターを選択できます。静的パラメーターを使用する場合、テンプレートは常にそれらの値で実行されます。アラートメッセージからパラメーターを選択する場合、jq 式を構成してメッセージからフィールドを抽出できます。
アラートメッセージからフィールドを抽出するには、ドル記号 ($) で始まり、jq 式を追加します。たとえば、次のコードは、ECS インスタンスの cpu_total メトリックのアラートメッセージのフォーマットを示しています:
{
"Average": 50.15, // 平均
"Maximum": 50.75, // 最大
"Minimum": 49.75, // 最小
"curLevel": "INFO", // 現在のレベル
"instanceId": "i-bp1gn7od******qh5r12", // インスタンスID
"ruleName": "alarmtrigger-130920******0047-exec-de81413d******71b537", // ルール名
"timestamp": 1575970560000, // タイムスタンプ
"userId": "130920******0047" // ユーザーID
}アラートをトリガーしたインスタンスの ID を抽出するには、式 $.instanceId を使用します。
アラートメッセージからは、次の静的フィールドを抽出できます:
抽出式 | 説明 | 値の例 |
$.timestamp | アラートのタイムスタンプ (ミリ秒単位)。 | 1575970560000 |
$.curLevel | アラートレベル。 | INFO |
$.userId | Alibaba Cloud アカウントの ID。 | 130920**0047 |
$.dimensionFieldName | モニタリングディメンションの値です。`dimensionFieldName` をメトリックディメンションフィールドの名前に置き換えます。たとえば、ECS インスタンスの CPU は `instanceId` ディメンションによってモニタリングされます。 | 該当なし |
アラートメッセージからパラメーターを選択する例:

静的パラメーターの設定方法は、通常のテンプレートパラメーターの設定方法と同じです。
注意事項:
静的パラメーター (静的構成):これらのパラメーターはタスク作成時に手動で指定され、実行中に変更されません。タスクがこれらのパラメーターを使用する場合、常に事前に定義されたリソースに対して操作を行い、アラートをトリガーした特定のインスタンスを識別することはできません。
アラートメッセージパラメーター (動的パラメーター):これらは、CloudMonitor イベントの
resourceIdやinstanceIdフィールドなど、アラートイベントのメッセージ内容から自動的に抽出されます。これらは、現在のアラートに関連する実際のリソースを正確に反映します。
タスクがアラートメッセージからリソース ID を動的に取得する代わりに静的パラメーターを使用すると、運用保守タスクが間違ったオブジェクトに対して操作を行う可能性があります。これにより、アラートをトリガーしたリソースが処理されない原因となることがあります。