Alert OpsCenter adalah platform manajemen peringatan dan operasi berbasis bisnis. Platform ini memungkinkan Anda menambahkan peringatan dari platform pemantauan pihak ketiga seperti Zabbix dan Prometheus, serta peringatan yang dihasilkan oleh Simple Log Service ke dalam sebuah bisnis. Dengan demikian, Anda dapat mengelola peringatan secara terpadu, mengirimkan notifikasi peringatan, dan meningkatkan efisiensi operasional. Topik ini menjelaskan arsitektur dan fitur Alert OpsCenter.
Arsitektur
Simple Log Service Alert OpsCenter memungkinkan pengelolaan peringatan berdasarkan bisnis. Setiap bisnis mencakup pipeline lengkap yang dimulai dari lapisan sumber daya hingga manajemen insiden.

Lapisan sumber daya: mencakup sumber daya komputasi, penyimpanan, dan jaringan, seperti host, mesin virtual, Server Load Balancer (SLB), aplikasi Java, dan aplikasi Go.
Lapisan metrik: mencakup data deret waktu, data log, dan data jejak. Metrik ini menunjukkan status kesehatan setiap sumber daya.
Lapisan pemantauan: memungkinkan pembuatan aturan pemantauan peringatan untuk memantau metrik menggunakan alat seperti Zabbix, Prometheus, sistem pemantauan peringatan Simple Log Service, dan fitur inspeksi cerdas Simple Log Service. Contohnya, Anda dapat memantau pemanfaatan CPU tinggi atau lonjakan tajam dalam lalu lintas jaringan.
Lapisan visualisasi: menyediakan laporan visual untuk menampilkan status peringatan berbagai sumber daya, seperti tren jumlah peringatan yang dipicu, status penanganan peringatan, dan status notifikasi peringatan.
Notifikasi peringatan: Saat peringatan dipicu, Simple Log Service mengirimkan notifikasi berdasarkan kebijakan tindakan tertentu. Notifikasi dapat dikirim kepada pengguna melalui SMS, panggilan suara, DingTalk, webhook kustom, EventBridge, dan Function Compute. Sebelum pengiriman, Anda dapat menggunakan kebijakan peringatan untuk denoise peringatan.
Manajemen insiden: Setelah peringatan dikirim ke sistem manajemen peringatan, peringatan tersebut digabungkan menjadi set berbeda berdasarkan kebijakan konsolidasi rute. Insiden dibuat otomatis untuk setiap set. Insinyur O&M dapat mengelola insiden peringatan dengan mengubah statusnya menjadi diselesaikan, dikonfirmasi, atau diabaikan, serta menentukan penanganannya.
Fitur
Alert OpsCenter menyediakan fitur-fitur berikut:
Integrasi sumber peringatan: Sumber peringatan mencakup sumber daya Log Business dan sumber peringatan pihak ketiga. Berikut adalah metode integrasi yang dapat digunakan:
Sumber peringatan vertikal
Anda dapat mengintegrasikan sumber peringatan berdasarkan penyebaran teknis. Misalnya, jika Anda menggunakan sumber daya dari lapisan akses, komputasi, dan penyimpanan, Anda dapat menambahkannya ke dalam sebuah bisnis untuk pengelolaan terpadu.
Sumber peringatan horizontal
Anda dapat mengintegrasikan sumber peringatan berdasarkan kebutuhan O&M. Misalnya, tim O&M database dapat mengelola semua instance RDS dengan menambahkan data dari instance tersebut ke dalam sebuah bisnis untuk pengelolaan terpadu.
Sumber peringatan pihak ketiga
Perusahaan yang memiliki satu atau lebih platform pemantauan, seperti Zabbix dan Prometheus, dapat menambahkan data peringatan dari platform tersebut ke dalam sebuah bisnis untuk pengelolaan terpadu.
Kebijakan bisnis: Alert OpsCenter memungkinkan konfigurasi kebijakan bisnis untuk menggabungkan, menekan, atau membungkam peringatan. Kebijakan ini mendukung tiga mode konfigurasi: Aktifkan, Nonaktifkan, dan Campuran.
Aktifkan
Dalam mode Aktifkan, kebijakan peringatan dan kebijakan tindakan yang dikonfigurasikan untuk bisnis diterapkan. Jika sumber peringatan terkait dengan kebijakan yang tersedia di Alert Center, kebijakan tersebut dinonaktifkan.
Nonaktifkan
Dalam mode Nonaktifkan, kebijakan peringatan dan kebijakan tindakan yang dikonfigurasikan untuk bisnis tidak diterapkan. Jika sumber peringatan terkait dengan kebijakan yang tersedia di Alert Center, kebijakan tersebut diaktifkan.
Campuran
Jika sumber peringatan terkait dengan kebijakan yang tersedia di Alert Center, baik kebijakan tersebut maupun kebijakan yang dikonfigurasikan untuk bisnis akan diaktifkan.
Manajemen insiden: Anda dapat mengubah status insiden menjadi dikonfirmasi, diabaikan, atau diselesaikan, serta menentukan penanganannya.
Dashboard Status Peringatan: Alert OpsCenter menyediakan dashboard Alert Status yang menampilkan status sumber peringatan, detail peringatan yang dipicu, dan status peringatan dalam sebuah bisnis.
Dashboard pemecahan masalah: Alert OpsCenter menyediakan dashboard pemecahan masalah yang mencakup Global Alert Pipeline Center, Global Alert Rule Center, Global Alert Troubleshooting Center, dan Pub Alert Center. Dashboard ini menampilkan informasi tentang peringatan.