CloudOps Orchestration Service (OOS) memungkinkan Anda membuat tugas O&M yang dipicu oleh peringatan ambang batas untuk metrik layanan cloud. Ketika metrik dari sumber daya cloud yang dipantau mencapai ambang batas tertentu, OOS mengeksekusi templat yang ditentukan untuk menjalankan operasi O&M berbasis peringatan. Tugas-tugas ini berjalan terus-menerus dan memantau peringatan hingga Anda membatalkannya. Sebagai contoh, Anda dapat membuat tugas O&M untuk membersihkan direktori log ketika pemanfaatan disk melebihi 80%.
Untuk informasi lebih lanjut mengenai metrik yang didukung, lihat Metrik utama layanan Alibaba Cloud.
Untuk membuat tugas O&M berbasis peringatan, lakukan langkah-langkah berikut:
Tetapkan aturan peringatan
Pilih templat
Tetapkan parameter templat untuk pemicu peringatan
Tetapkan aturan peringatan
Field | Diperlukan | Deskripsi |
Jenis produk | Ya | Pilih produk dari daftar drop-down. Anda hanya dapat memilih satu produk. |
Deskripsi aturan | Ya | Aturan untuk peringatan ambang batas. |
Mute for | Tidak | Jika data pemantauan terus-menerus melebihi ambang batas peringatan, peringatan hanya dipicu sekali dalam setiap periode bisu. Periode default adalah satu hari. |
Effective period | Tidak | Rentang waktu saat aturan peringatan berlaku. Secara default, aturan berlaku sepanjang hari. |
Resources to alert on | Ya | Catatan Jika Anda tidak memilih sumber daya menggunakan salah satu dari tiga metode berikut, aturan akan berlaku untuk semua sumber daya dalam akun Anda.
|
Aturan peringatan ambang batas mencakup bidang-bidang berikut:
Nama metrik
Aggregation period for monitoring data
Number of statistical periods
Statistical method
Operator perbandingan
Ambang batas

Pilih templat
Pilih templat yang akan dieksekusi saat terjadi peringatan.
Tetapkan parameter templat untuk pemicu peringatan
Untuk parameter templat, Anda dapat memasukkan nilai statis atau memilih parameter dari pesan peringatan. Jika Anda menggunakan parameter statis, templat selalu dieksekusi dengan nilai tersebut. Jika Anda memilih parameter dari pesan peringatan, Anda dapat mengonfigurasi ekspresi jq untuk mengekstraksi bidang dari pesan tersebut.
Untuk mengekstraksi bidang dari pesan peringatan, mulailah dengan tanda dolar ($) dan tambahkan ekspresi jq. Sebagai contoh, kode berikut menunjukkan format pesan peringatan untuk metrik cpu_total dari sebuah Instance ECS:
{
"Average": 50.15,
"Maximum": 50.75,
"Minimum": 49.75,
"curLevel": "INFO",
"instanceId": "i-bp1gn7od******qh5r12",
"ruleName": "alarmtrigger-130920******0047-exec-de81413d******71b537",
"timestamp": 1575970560000,
"userId": "130920******0047"
}Untuk mengekstraksi ID instans yang memicu peringatan, gunakan ekspresi $.instanceId.
Bidang statis berikut dapat diekstraksi dari pesan peringatan:
Ekspresi ekstraksi | Deskripsi | Contoh nilai |
$.timestamp | Timestamp peringatan, dalam milidetik. | 1575970560000 |
$.curLevel | Tingkat peringatan. | INFO |
$.userId | ID akun Alibaba Cloud. | 130920**0047 |
$.dimensionFieldName | Nilai dimensi pemantauan. Ganti `dimensionFieldName` dengan nama field dimensi metrik. Misalnya, CPU Instance ECS dipantau berdasarkan dimensi `instanceId`. Anda dapat menggunakan | N/A |
Contoh pemilihan parameter dari pesan peringatan:

Metode penyetelan parameter statis sama seperti penyetelan parameter templat biasa.
Catatan:
Parameter statis (konfigurasi statis): Parameter ini ditentukan secara manual saat Anda membuat tugas dan tidak berubah selama eksekusi. Jika tugas menggunakan parameter ini, tugas tersebut selalu beroperasi pada sumber daya yang telah ditentukan sebelumnya dan tidak dapat mengidentifikasi instans spesifik yang memicu peringatan.
Parameter pesan peringatan (parameter dinamis): Parameter ini diekstraksi secara otomatis dari konten pesan event peringatan, seperti field
resourceIddaninstanceIddalam event CloudMonitor. Parameter ini secara akurat mencerminkan sumber daya aktual yang terkait dengan peringatan saat ini.
Jika tugas menggunakan parameter statis alih-alih mendapatkan identitas sumber daya secara dinamis dari pesan peringatan, tugas O&M tersebut mungkin beroperasi pada objek yang salah. Hal ini dapat menyebabkan sumber daya yang memicu peringatan tidak diproses.