Alibaba Cloud Prometheus memungkinkan Anda menentukan kondisi dalam aturan peringatan untuk memantau metrik. Jika kondisi terpenuhi, acara peringatan akan dihasilkan. Anda dapat mengonfigurasi kebijakan notifikasi untuk mengirim pemberitahuan melalui pesan teks, email, panggilan telepon, DingTalk chatbot, WeCom chatbot, atau webhook.
Prasyarat
Sebuah instance Prometheus telah dibuat di Managed Service for Prometheus. Untuk informasi lebih lanjut, lihat topik-topik berikut:
Pergi ke halaman Buat Aturan Peringatan Prometheus
Masuk ke Konsol ARMS.
Di panel navigasi sisi kiri, pilih .
Di halaman Prometheus Alert Rules, klik Create Prometheus Alert Rule.
Gunakan metrik preset untuk membuat aturan peringatan
ARMS menyediakan berbagai metrik preset. Anda dapat memilih metrik preset dan mengonfigurasi aturan peringatan untuk metrik tersebut.
Di halaman Create Prometheus Alert Rule, konfigurasikan parameter-parameter berikut. Tabel berikut menjelaskan parameter-parameter tersebut.
Parameter
Deskripsi
Contoh
Nama Aturan Peringatan
Masukkan nama aturan peringatan.
Cluster produksi - pemanfaatan CPU kontainer alert
Jenis Pemeriksaan
Pilih Ambang Batas Statis.
Ambang Batas Statis
Instance Prometheus
Pilih instance Prometheus.
Cluster produksi
Grup Kontak Peringatan
Pilih grup kontak peringatan.
Grup kontak peringatan yang didukung oleh instance Prometheus bervariasi berdasarkan jenis instance Prometheus.
Beban Kubernetes
Metrik Peringatan
Pilih metrik. Grup kontak peringatan yang berbeda menyediakan metrik yang berbeda.
Pemanfaatan CPU kontainer
Kondisi Peringatan
Tentukan kondisi berdasarkan mana acara peringatan dihasilkan.
Jika pemanfaatan CPU kontainer
lebih besardari 80%, acara peringatan dihasilkan.Kondisi Filter
Tentukan ruang lingkup yang berlaku untuk aturan peringatan. Jika suatu sumber daya memenuhi baik kondisi filter maupun kondisi peringatan, acara peringatan dihasilkan.
Jenis-jenis kondisi filter berikut didukung:
Traverse: Aturan peringatan berlaku untuk semua sumber daya di instance Prometheus saat ini. Secara default, Traverse dipilih.
Equal: Jika Anda memilih kondisi filter ini, Anda harus memasukkan nama sumber daya. Aturan peringatan hanya berlaku untuk sumber daya yang ditentukan. Anda tidak dapat menentukan beberapa sumber daya pada saat yang sama.
Not Equal: Jika Anda memilih kondisi filter ini, Anda harus memasukkan nama sumber daya. Aturan peringatan berlaku untuk sumber daya selain sumber daya yang ditentukan. Anda tidak dapat menentukan beberapa sumber daya pada saat yang sama.
Regex match: Jika Anda memilih kondisi filter ini, Anda harus memasukkan ekspresi reguler untuk mencocokkan nama sumber daya. Aturan peringatan yang Anda buat menggunakan template berlaku untuk semua sumber daya yang cocok dengan ekspresi reguler.
Regex not match: Jika Anda memilih kondisi filter ini, Anda harus memasukkan ekspresi reguler untuk mencocokkan nama sumber daya. Aturan peringatan berlaku untuk sumber daya yang tidak cocok dengan ekspresi reguler.
CatatanSetelah Anda mengatur kondisi filter, bagian Data Preview muncul.
Pertahankan kondisi filter dalam 300 karakter.
Traverse
Pratinjau Data
Data Preview menampilkan pernyataan PromQL yang sesuai dengan kondisi peringatan. Bagian ini juga menampilkan nilai-nilai metrik yang ditentukan dalam grafik deret waktu.
Secara default, hanya nilai-nilai real-time dari satu sumber daya yang ditampilkan. Anda dapat menentukan kondisi filter untuk melihat nilai-nilai metrik dari sumber daya yang berbeda dalam rentang waktu yang berbeda.
CatatanAmbang batas dalam grafik deret waktu diwakili oleh garis merah. Bagian kurva yang memenuhi kondisi peringatan ditampilkan dalam warna merah tua, dan bagian kurva yang tidak memenuhi kondisi peringatan ditampilkan dalam warna biru.
Anda dapat memindahkan pointer di atas kurva untuk melihat detail sumber daya pada titik waktu tertentu.
Anda juga dapat memilih periode waktu pada kurva deret waktu untuk melihat kurva deret waktu periode waktu yang dipilih.
Tidak ada
Durasi
Jika kondisi peringatan terpenuhi, acara peringatan dihasilkan: Jika titik data mencapai ambang batas, acara peringatan dihasilkan.
Jika kondisi peringatan terus terpenuhi selama N menit, acara peringatan dihasilkan: Acara peringatan hanya dihasilkan jika durasi pencapaian ambang batas lebih besar dari atau sama dengan N menit.
1
Tingkat Peringatan
Tentukan tingkat peringatan. Nilai default: Default. Nilai valid: Default, P4, P3, P2, dan P1. Default menunjukkan tingkat keparahan terendah, sedangkan P1 menunjukkan tingkat keparahan tertinggi.
Default
Pesan Peringatan
Tentukan pesan peringatan yang ingin Anda kirim ke pengguna akhir. Anda dapat menentukan variabel kustom dalam pesan peringatan berdasarkan sintaks template Go.
Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Kontainer: {{$labels.container}} Pemanfaatan CPU: {{$labels.metrics_params_opt_label_value}} {{$labels.metrics_params_value}}%. Nilai saat ini: {{ printf "%.2f" $value }}%
Notifikasi Peringatan
Simple Mode: Anda perlu mengatur Notification Objects, Notification Period, dan Whether to Resend Notifications.
Standard Mode:
Jangan Tentukan Kebijakan Notifikasi: Jika Anda memilih opsi ini, Anda dapat membuat kebijakan notifikasi di halaman Notification Policy setelah Anda membuat aturan peringatan. Di halaman Kebijakan Notifikasi, Anda dapat menentukan aturan pencocokan dan kondisi pencocokan. Misalnya, Anda dapat menentukan nama aturan peringatan sebagai kondisi pencocokan. Saat aturan peringatan dipicu, acara peringatan dihasilkan dan notifikasi peringatan dikirim ke kontak atau grup kontak yang ditentukan dalam kebijakan notifikasi. Untuk informasi lebih lanjut, lihat Buat dan kelola kebijakan notifikasi.
Anda juga dapat memilih kebijakan notifikasi dari daftar drop-down. ARMS secara otomatis menambahkan aturan pencocokan ke kebijakan notifikasi yang dipilih dan menentukan ID aturan peringatan sebagai kondisi pencocokan. Nama aturan peringatan ditampilkan di halaman Kebijakan Notifikasi. Dengan cara ini, acara peringatan yang dihasilkan berdasarkan aturan peringatan dapat dicocokkan oleh kebijakan notifikasi yang dipilih.
PentingSetelah Anda memilih kebijakan notifikasi, acara peringatan yang dihasilkan berdasarkan aturan peringatan dapat dicocokkan oleh kebijakan notifikasi dan peringatan dapat dihasilkan. Acara peringatan juga dapat dicocokkan oleh kebijakan notifikasi lain yang menggunakan pencocokan fuzzy, dan peringatan dapat dihasilkan. Satu atau lebih acara peringatan dapat dicocokkan oleh satu atau lebih kebijakan notifikasi.
Jangan Tentukan Kebijakan Notifikasi
Advanced Settings
Siklus Pemeriksaan Peringatan
Aturan peringatan dipicu setiap N menit untuk memeriksa apakah kondisi peringatan terpenuhi. Nilai default: 1. Nilai minimum: 1.
1
Periksa setelah data lengkap
Ya
Tidak
Ya
Tag
Tentukan tag untuk aturan peringatan. Tag yang ditentukan dapat digunakan untuk mencocokkan kebijakan notifikasi.
Tidak ada
Annotasi
Tentukan anotasi untuk aturan peringatan.
Tidak ada
Klik Save. Di halaman Aturan Peringatan Prometheus, periksa status aturan peringatan.
Jika Automatic Interruption muncul di kolom Status, modifikasi aturan peringatan sesuai petunjuk dan klik Start di kolom Tindakan. Di pesan yang muncul, klik OK. Jika masalah tetap ada setelah Anda menerapkan solusi sebelumnya, hubungi dukungan teknis (ID DingTalk: d9j_rg9e4062f).
Aturan peringatan mungkin dihentikan secara otomatis karena alasan-alasan berikut:
Jumlah hasil yang di-query oleh aturan peringatan melebihi 1.500.
Tidak ada objek notifikasi yang dikonfigurasi.
Instance Prometheus di-uninstall atau tidak tersedia.
Gunakan pernyataan PromQL kustom untuk membuat aturan peringatan
Untuk memantau metrik selain metrik preset, Anda dapat menggunakan pernyataan PromQL kustom untuk membuat aturan peringatan.
Di halaman Create Prometheus Alert Rule, konfigurasikan parameter-parameter berikut. Tabel berikut menjelaskan parameter-parameter tersebut.
Parameter
Deskripsi
Contoh
Nama Aturan Peringatan
Masukkan nama aturan peringatan.
Pemanfaatan CPU pod melebihi 8%
Jenis Pemeriksaan
Pilih PromQL Kustom.
PromQL Kustom
Instance Prometheus
Pilih instance Prometheus.
Tidak ada
Grup Kontak Peringatan Referensi
Pilih grup kontak peringatan.
Grup kontak peringatan yang didukung oleh instance Prometheus bervariasi berdasarkan jenis instance Prometheus.
Beban Kubernetes
Metrik Referensi
Opsional. Daftar drop-down Metrik Referensi menampilkan metrik umum. Setelah Anda memilih metrik, pernyataan PromQL dari metrik tersebut ditampilkan di bidang Pernyataan PromQL Kustom. Anda dapat memodifikasi pernyataan tersebut sesuai dengan kebutuhan bisnis Anda.
Nilai-nilai dalam daftar drop-down Metrik Referensi bervariasi berdasarkan jenis instance Prometheus.
Peringatan penggunaan disk pod
Pernyataan PromQL Kustom
Masukkan pernyataan PromQL.
Namespace: {{$labels.namespace}}/Pod: {{$labels.pod_name}} / Pemanfaatan disk {{$labels.device}} melebihi 90%. Nilai saat ini: {{ printf "%.2f" $value }}%max(container_fs_usage_bytes{pod!="", namespace!="arms-prom",namespace!="monitoring"}) by (pod_name, namespace, device)/max(container_fs_limit_bytes{pod!=""}) by (pod_name,namespace, device) * 100 > 90
Pratinjau Data
Data Preview menampilkan pernyataan PromQL yang sesuai dengan kondisi peringatan. Bagian ini juga menampilkan nilai-nilai metrik yang ditentukan dalam grafik deret waktu.
Secara default, hanya nilai-nilai real-time dari satu sumber daya yang ditampilkan. Anda dapat menentukan kondisi filter untuk melihat nilai-nilai metrik dari sumber daya yang berbeda dalam rentang waktu yang berbeda.
CatatanAnda dapat memindahkan pointer di atas kurva untuk melihat detail sumber daya pada titik waktu tertentu.
Anda juga dapat memilih periode waktu pada kurva deret waktu untuk melihat kurva deret waktu periode waktu yang dipilih.
Tidak ada
Durasi
Jika kondisi peringatan terpenuhi, acara peringatan dihasilkan: Jika titik data mencapai ambang batas, acara peringatan dihasilkan.
Jika kondisi peringatan terus terpenuhi selama N menit, acara peringatan dihasilkan: Acara peringatan hanya dihasilkan jika durasi pencapaian ambang batas lebih besar dari atau sama dengan N menit.
1
Tingkat Peringatan
Tentukan tingkat peringatan. Nilai default: Default. Nilai valid: Default, P4, P3, P2, dan P1. Default menunjukkan tingkat keparahan terendah, sedangkan P1 menunjukkan tingkat keparahan tertinggi.
Default
Pesan Peringatan
Tentukan pesan peringatan yang ingin Anda kirim ke pengguna akhir. Anda dapat menentukan variabel kustom dalam pesan peringatan berdasarkan sintaks template Go.
Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Pemanfaatan disk {{$labels.device}} melebihi 90%. Nilai saat ini: {{ printf "%.2f" $value }}%
Notifikasi Peringatan
Simple Mode: Anda perlu mengatur Notification Objects, Notification Period, dan Whether to Resend Notifications.
Standard Mode:
Jangan Tentukan Kebijakan Notifikasi: Jika Anda memilih opsi ini, Anda dapat membuat kebijakan notifikasi di halaman Notification Policy setelah Anda membuat aturan peringatan. Di halaman Kebijakan Notifikasi, Anda dapat menentukan aturan pencocokan dan kondisi pencocokan. Misalnya, Anda dapat menentukan nama aturan peringatan sebagai kondisi pencocokan. Saat aturan peringatan dipicu, acara peringatan dihasilkan dan notifikasi peringatan dikirim ke kontak atau grup kontak yang ditentukan dalam kebijakan notifikasi. Untuk informasi lebih lanjut, lihat Buat dan kelola kebijakan notifikasi.
Anda juga dapat memilih kebijakan notifikasi dari daftar drop-down. ARMS secara otomatis menambahkan aturan pencocokan ke kebijakan notifikasi yang dipilih dan menentukan ID aturan peringatan sebagai kondisi pencocokan. Nama aturan peringatan ditampilkan di halaman Kebijakan Notifikasi. Dengan cara ini, acara peringatan yang dihasilkan berdasarkan aturan peringatan dapat dicocokkan oleh kebijakan notifikasi yang dipilih.
PentingSetelah Anda memilih kebijakan notifikasi, acara peringatan yang dihasilkan berdasarkan aturan peringatan dapat dicocokkan oleh kebijakan notifikasi dan peringatan dapat dihasilkan. Acara peringatan juga dapat dicocokkan oleh kebijakan notifikasi lain yang menggunakan pencocokan fuzzy, dan peringatan dapat dihasilkan. Satu atau lebih acara peringatan dapat dicocokkan oleh satu atau lebih kebijakan notifikasi.
Jangan Tentukan Kebijakan Notifikasi
Pengaturan Lanjutan
Siklus Pemeriksaan Peringatan
Aturan peringatan dipicu setiap N menit untuk memeriksa apakah kondisi peringatan terpenuhi. Nilai default: 1. Nilai minimum: 1.
1
Periksa setelah data lengkap
Ya
Tidak
Ya
Tag
Tentukan tag untuk aturan peringatan. Tag yang ditentukan dapat digunakan untuk mencocokkan kebijakan notifikasi.
Tidak ada
Anotasi
Tentukan anotasi untuk aturan peringatan.
Tidak ada
Klik Save. Di halaman Prometheus, periksa status aturan peringatan.
Jika Automatic Interruption muncul di kolom Status, modifikasi aturan peringatan sesuai petunjuk dan klik Start di kolom Tindakan. Di pesan yang muncul, klik OK. Jika masalah tetap ada setelah Anda menerapkan solusi sebelumnya, hubungi dukungan teknis (ID DingTalk: d9j_rg9e4062f).
Aturan peringatan mungkin dihentikan secara otomatis karena alasan-alasan berikut:
Jumlah hasil yang di-query oleh aturan peringatan melebihi 1.500.
Tidak ada objek notifikasi yang dikonfigurasi.
Instance Prometheus di-uninstall atau tidak tersedia.
Kelola aturan peringatan
Untuk aturan peringatan yang dibuat di halaman View Alert Rules di konsol Managed Service for Prometheus, termasuk aturan ambang batas statis dan PromQL kustom, Anda dapat mengedit, menghapus, menyalin, memulai, dan menghentikan mereka, serta melihat acara peringatan historis.
Untuk aturan peringatan yang dihasilkan di konsol layanan Alibaba Cloud lainnya, Anda dapat melihat acara peringatan historis dan kembali ke daftar aturan peringatan layanan cloud.