Application Real-Time Monitoring Service (ARMS) Manajemen Peringatan menyediakan fitur seperti konvergensi peringatan, pemberitahuan peringatan, dan eskalasi otomatis untuk membantu Anda mengidentifikasi dan menangani peringatan secara efisien. Topik ini menjelaskan arsitektur dan manfaat dari Manajemen Peringatan.
Informasi latar belakang
Serverless App Engine (SAE) terintegrasi dengan layanan sub Manajemen Peringatan ARMS. Layanan sub Manajemen Peringatan baru dari ARMS hanya tersedia untuk Akun Alibaba Cloud yang mengaktifkan SAE setelah pukul 00:00 pada 30 April 2021.
Arsitektur
Manajemen Peringatan mencakup modul berikut: manajemen integrasi, manajemen peristiwa peringatan, manajemen kebijakan notifikasi, penanganan peringatan kolaboratif, dan analisis penanganan peringatan.
Manajemen integrasi
Manajemen Peringatan menyediakan dua jenis integrasi: integrasi peringatan default dan integrasi layanan pihak ketiga.
Integrasi peringatan default
Anda dapat mengintegrasikan Manajemen Peringatan dengan peringatan dari layanan sub ARMS, seperti Pemantauan Aplikasi, Pemantauan Browser, Managed Service for Prometheus, dan Pemantauan Sintetis. Anda dapat menggunakan integrasi peringatan default untuk memeriksa apakah data pemantauan mengandung kesalahan berdasarkan tugas periodik. Jika data pemantauan mengandung kesalahan, peristiwa peringatan yang sesuai dilaporkan ke Pusat Manajemen Peristiwa.
Integrasi layanan pihak ketiga
Anda dapat mengintegrasikan Manajemen Peringatan dengan sumber peringatan pihak ketiga melalui pengaturan sederhana. Ini adalah solusi satu atap untuk menangani peringatan yang dihasilkan oleh pusat data lokal atau mesin virtual di ARMS. Jika sebuah peringatan dilaporkan dari sumber peringatan pihak ketiga ke Manajemen Peringatan, sebuah peristiwa peringatan dibuat. Peristiwa peringatan memiliki batasan berikut:
Struktur Data dari Peristiwa Peringatan
Struktur data dari peristiwa peringatan ARMS mirip dengan struktur data dari templat notifikasi AlertManager open source. Struktur data mencakup bidang-bidang berikut:
Label: metadata dari peringatan. Sekumpulan label secara unik mengidentifikasi sebuah peristiwa peringatan. Peristiwa peringatan dengan label yang sama dikompresi menjadi satu peristiwa. Contoh:
"alertname: nama peringatan".Anotasi: Informasi tambahan dari peringatan. Anotasi bukan metadata. Contoh:
"message: isi peringatan".StartsAt: waktu mulai dari peringatan.
EndsAt: waktu berakhirnya peringatan.
GeneratorUrl: URL dari peristiwa peringatan.
Perbedaan antara Label dan Anotasi
Sekumpulan label menentukan sebuah peristiwa peringatan. Jika sebuah label berubah, peristiwa peringatan baru akan dihasilkan.
Contoh:
{ "hostname":"Host", "alertname":"Penggunaan CPU terlalu tinggi","ip":"192.168.0.3"}. Kumpulan label tersebut menentukan peringatan bahwa penggunaan CPU host (alamat IP: 192.168.0.3) terlalu tinggi. Jika label ip berubah menjadi{"ip":"192.168.0.4"}, peringatan baru akan dihasilkan. Peringatan baru tersebut menunjukkan bahwa penggunaan CPU host (alamat IP: 192.168.0.4) terlalu tinggi. Perubahan anotasi tidak mempengaruhi peristiwa peringatan. Jika peristiwa peringatan dengan label yang sama memiliki anotasi yang berbeda, itu berarti sebuah peringatan dilaporkan beberapa kali.Perubahan anotasi tidak mempengaruhi peristiwa peringatan. Jika peristiwa peringatan dengan label yang sama memiliki anotasi yang berbeda, itu berarti sebuah peringatan dilaporkan beberapa kali.
Contoh:
Jika anotasi
{"value":"85","message":"Penggunaan CPU host (alamat IP: 192.168.0.3) adalah 85%, lebih tinggi dari nilai ambang 80%."}berubah menjadi{"value":"86","message":"Penggunaan CPU host (alamat IP: 192.168.0.3) adalah 86%, lebih tinggi dari nilai ambang 80%."}, tidak ada peringatan baru yang dihasilkan. Peristiwa peringatan tersebut dianggap sebagai peringatan yang dilaporkan dua kali.
Anda dapat mengonfigurasi bidang deduplikasi sebagai label untuk sebuah integrasi. Jika integrasi melaporkan sebuah peringatan, Manajemen Peringatan mengidentifikasi peristiwa peringatan unik hanya berdasarkan bidang deduplikasi. Jika Anda tidak mengonfigurasi bidang deduplikasi, Manajemen Peringatan menggunakan semua label untuk mengidentifikasi peristiwa peringatan unik.
Manajemen peristiwa peringatan
Modul manajemen peristiwa peringatan menyediakan metode berikut untuk memproses peristiwa peringatan:
Gunakan alur pemrosesan peristiwa untuk mengatur prosedur sederhana dan memproses peristiwa peringatan yang dilaporkan oleh sumber peringatan. Ini memenuhi kebutuhan spesifik Anda dalam penanganan peristiwa di berbagai skenario.
Deduplikasi, kompresi, denoise, dan senyapkan peringatan yang dilaporkan oleh sumber peringatan. Ini mengonvergen peringatan dan mengurangi badai peringatan.
Kompresi peristiwa
Secara default, modul manajemen peristiwa peringatan mengompresi peristiwa berdasarkan label atau waktu.
Kompresi Peristiwa Berbasis Label
Saat ARMS mengirimkan notifikasi peringatan kepada kontak, peristiwa peringatan dikompresi berdasarkan pengaturan pengelompokan peristiwa yang ditentukan dalam kebijakan notifikasi. Jika beberapa peristiwa peringatan mengandung label yang sama, peristiwa tersebut secara otomatis dikompresi menjadi satu peristiwa peringatan. Dalam gambar berikut, peristiwa peringatan dikompresi berdasarkan dua label.
Kompresi Peristiwa Berbasis Waktu
Setiap peristiwa peringatan berisi waktu mulai dan waktu berakhir dari peringatan. Untuk peristiwa peringatan dengan label yang sama, jika waktu mulai dan waktu berakhir dari peristiwa peringatan tersebut tumpang tindih, peristiwa peringatan tersebut dikompresi menjadi satu peristiwa peringatan. Waktu mulai dan waktu berakhir dari peristiwa peringatan yang dihasilkan adalah gabungan dari waktu mulai dan waktu berakhir dari peristiwa peringatan.
Manajemen kebijakan notifikasi
Anda dapat mengonfigurasi kondisi dalam kebijakan notifikasi dengan cara yang sama seperti Anda mengonfigurasi aturan langganan. Jika sebuah peristiwa peringatan memenuhi kondisi yang ditentukan, ARMS mengirimkan notifikasi peringatan berdasarkan kebijakan notifikasi.
Gambar berikut menunjukkan hubungan antara alur penanganan peristiwa, peristiwa, dan kebijakan notifikasi.
Penanganan peringatan kolaboratif
Anda dapat mengonfigurasi beberapa kebijakan kolaborasi. Kemudian, Anda dapat menangani peringatan di Konsol ARMS, DingTalk, WeCom, dan Lark. Anda juga dapat mengonfigurasi sinkronisasi pesan grup, manajemen penjadwalan, dan kebijakan eskalasi. Dengan cara ini, kontak dalam tim dapat bekerja sama untuk menangani peringatan. Gambar berikut menunjukkan cara menangani peringatan secara kolaboratif. 
Manfaat
Jika Anda menerapkan layanan Anda di Alibaba Cloud dan menggunakan ARMS untuk memantau layanan Anda, Anda dapat menggunakan Manajemen Peringatan untuk menangani peringatan. Manajemen Peringatan meningkatkan efisiensi O&M dengan cara berikut:
Peringatan dapat diglobalisasi.
Anda dapat mengglobalisasi templat aturan peringatan untuk mengonfigurasi peringatan untuk peristiwa global.
Anda dapat mengglobalisasi kontak dan kebijakan notifikasi dengan mengonfigurasi pengaturan sederhana.
CatatanAnda tidak dapat mengirimkan notifikasi peringatan melalui telepon di situs Internasional.
Peristiwa dikumpulkan dari berbagai layanan pemantauan untuk efisiensi manajemen yang lebih tinggi.
Anda dapat mengintegrasikan Manajemen Peringatan dengan layanan pemantauan umum Alibaba Cloud. Anda juga dapat mengintegrasikan Manajemen Peringatan dengan layanan pemantauan pihak ketiga untuk manajemen terpusat.
Manajemen Peringatan menyediakan kemampuan penanganan peristiwa peringatan yang stabil. Anda dapat menangani peristiwa peringatan 24/7.
Manajemen Peringatan memastikan latensi rendah untuk menangani sejumlah besar peristiwa peringatan.
Anda dapat mengirimkan notifikasi peringatan kepada kontak secara tepat waktu.
Anda dapat mengonfigurasi kebijakan notifikasi dan mengompresi peristiwa peringatan. Ini mengurangi beban kerja O&M.
Anda dapat memilih satu atau lebih metode notifikasi berdasarkan urgensi peringatan. Misalnya, Anda dapat mengirimkan notifikasi peringatan kepada kontak melalui email, SMS, panggilan telepon, atau DingTalk untuk mengingatkan kontak untuk menangani peringatan.
Anda dapat mengonfigurasi kebijakan eskalasi untuk mengirimkan notifikasi kepada kontak beberapa kali jika peringatan tetap tidak ditangani dalam jangka waktu yang lama.
Peringatan dapat dikelola dengan cara yang efisien.
Kontak dapat menggunakan DingTalk untuk menangani peringatan kapan saja.
Peringatan menggunakan format umum, yang memungkinkan kontak untuk lebih baik menganalisis peringatan.
Banyak kontak dapat bekerja sama melalui DingTalk untuk menangani peringatan.
Statistik tentang peringatan dikumpulkan secara real-time untuk menganalisis bagaimana peringatan ditangani. Ini memungkinkan Anda menangani peringatan dengan cara yang lebih efisien.