全部产品
Search
文档中心

Application Real-Time Monitoring Service:Buat aturan peringatan untuk instance Prometheus

更新时间:Jul 22, 2025

Alibaba Cloud Prometheus memungkinkan Anda menentukan kondisi dalam aturan peringatan untuk memantau metrik. Jika kondisi terpenuhi, acara peringatan akan dihasilkan. Anda dapat mengonfigurasi kebijakan notifikasi untuk mengirim pemberitahuan melalui pesan teks, email, panggilan telepon, DingTalk chatbot, WeCom chatbot, atau webhook.

Prasyarat

Sebuah instance Prometheus telah dibuat di Managed Service for Prometheus. Untuk informasi lebih lanjut, lihat topik-topik berikut:

Pergi ke halaman Buat Aturan Peringatan Prometheus

  1. Masuk ke Konsol ARMS.

  2. Di panel navigasi sisi kiri, pilih Managed Service for Prometheus > Prometheus Alert Rules.

  3. Di halaman Prometheus Alert Rules, klik Create Prometheus Alert Rule.

Gunakan metrik preset untuk membuat aturan peringatan

ARMS menyediakan berbagai metrik preset. Anda dapat memilih metrik preset dan mengonfigurasi aturan peringatan untuk metrik tersebut.

  1. Di halaman Create Prometheus Alert Rule, konfigurasikan parameter-parameter berikut. Tabel berikut menjelaskan parameter-parameter tersebut.

    Parameter

    Deskripsi

    Contoh

    Nama Aturan Peringatan

    Masukkan nama aturan peringatan.

    Cluster produksi - pemanfaatan CPU kontainer alert

    Jenis Pemeriksaan

    Pilih Ambang Batas Statis.

    Ambang Batas Statis

    Instance Prometheus

    Pilih instance Prometheus.

    Cluster produksi

    Grup Kontak Peringatan

    Pilih grup kontak peringatan.

    Grup kontak peringatan yang didukung oleh instance Prometheus bervariasi berdasarkan jenis instance Prometheus.

    Beban Kubernetes

    Metrik Peringatan

    Pilih metrik. Grup kontak peringatan yang berbeda menyediakan metrik yang berbeda.

    Pemanfaatan CPU kontainer

    Kondisi Peringatan

    Tentukan kondisi berdasarkan mana acara peringatan dihasilkan.

    Jika pemanfaatan CPU kontainer lebih besar dari 80%, acara peringatan dihasilkan.

    Kondisi Filter

    Tentukan ruang lingkup yang berlaku untuk aturan peringatan. Jika suatu sumber daya memenuhi baik kondisi filter maupun kondisi peringatan, acara peringatan dihasilkan.

    Jenis-jenis kondisi filter berikut didukung:

    • Traverse: Aturan peringatan berlaku untuk semua sumber daya di instance Prometheus saat ini. Secara default, Traverse dipilih.

    • Equal: Jika Anda memilih kondisi filter ini, Anda harus memasukkan nama sumber daya. Aturan peringatan hanya berlaku untuk sumber daya yang ditentukan. Anda tidak dapat menentukan beberapa sumber daya pada saat yang sama.

    • Not Equal: Jika Anda memilih kondisi filter ini, Anda harus memasukkan nama sumber daya. Aturan peringatan berlaku untuk sumber daya selain sumber daya yang ditentukan. Anda tidak dapat menentukan beberapa sumber daya pada saat yang sama.

    • Regex match: Jika Anda memilih kondisi filter ini, Anda harus memasukkan ekspresi reguler untuk mencocokkan nama sumber daya. Aturan peringatan yang Anda buat menggunakan template berlaku untuk semua sumber daya yang cocok dengan ekspresi reguler.

    • Regex not match: Jika Anda memilih kondisi filter ini, Anda harus memasukkan ekspresi reguler untuk mencocokkan nama sumber daya. Aturan peringatan berlaku untuk sumber daya yang tidak cocok dengan ekspresi reguler.

    Catatan
    • Setelah Anda mengatur kondisi filter, bagian Data Preview muncul.

    • Pertahankan kondisi filter dalam 300 karakter.

    Traverse

    Pratinjau Data

    Data Preview menampilkan pernyataan PromQL yang sesuai dengan kondisi peringatan. Bagian ini juga menampilkan nilai-nilai metrik yang ditentukan dalam grafik deret waktu.

    Secara default, hanya nilai-nilai real-time dari satu sumber daya yang ditampilkan. Anda dapat menentukan kondisi filter untuk melihat nilai-nilai metrik dari sumber daya yang berbeda dalam rentang waktu yang berbeda.

    Catatan
    • Ambang batas dalam grafik deret waktu diwakili oleh garis merah. Bagian kurva yang memenuhi kondisi peringatan ditampilkan dalam warna merah tua, dan bagian kurva yang tidak memenuhi kondisi peringatan ditampilkan dalam warna biru.

    • Anda dapat memindahkan pointer di atas kurva untuk melihat detail sumber daya pada titik waktu tertentu.

    • Anda juga dapat memilih periode waktu pada kurva deret waktu untuk melihat kurva deret waktu periode waktu yang dipilih.

    Tidak ada

    Durasi

    • Jika kondisi peringatan terpenuhi, acara peringatan dihasilkan: Jika titik data mencapai ambang batas, acara peringatan dihasilkan.

    • Jika kondisi peringatan terus terpenuhi selama N menit, acara peringatan dihasilkan: Acara peringatan hanya dihasilkan jika durasi pencapaian ambang batas lebih besar dari atau sama dengan N menit.

    1

    Tingkat Peringatan

    Tentukan tingkat peringatan. Nilai default: Default. Nilai valid: Default, P4, P3, P2, dan P1. Default menunjukkan tingkat keparahan terendah, sedangkan P1 menunjukkan tingkat keparahan tertinggi.

    Default

    Pesan Peringatan

    Tentukan pesan peringatan yang ingin Anda kirim ke pengguna akhir. Anda dapat menentukan variabel kustom dalam pesan peringatan berdasarkan sintaks template Go.

    Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Kontainer: {{$labels.container}} Pemanfaatan CPU: {{$labels.metrics_params_opt_label_value}} {{$labels.metrics_params_value}}%. Nilai saat ini: {{ printf "%.2f" $value }}%

    Notifikasi Peringatan

    • Simple Mode: Anda perlu mengatur Notification Objects, Notification Period, dan Whether to Resend Notifications.

    • Standard Mode:

      • Jangan Tentukan Kebijakan Notifikasi: Jika Anda memilih opsi ini, Anda dapat membuat kebijakan notifikasi di halaman Notification Policy setelah Anda membuat aturan peringatan. Di halaman Kebijakan Notifikasi, Anda dapat menentukan aturan pencocokan dan kondisi pencocokan. Misalnya, Anda dapat menentukan nama aturan peringatan sebagai kondisi pencocokan. Saat aturan peringatan dipicu, acara peringatan dihasilkan dan notifikasi peringatan dikirim ke kontak atau grup kontak yang ditentukan dalam kebijakan notifikasi. Untuk informasi lebih lanjut, lihat Buat dan kelola kebijakan notifikasi.

      • Anda juga dapat memilih kebijakan notifikasi dari daftar drop-down. ARMS secara otomatis menambahkan aturan pencocokan ke kebijakan notifikasi yang dipilih dan menentukan ID aturan peringatan sebagai kondisi pencocokan. Nama aturan peringatan ditampilkan di halaman Kebijakan Notifikasi. Dengan cara ini, acara peringatan yang dihasilkan berdasarkan aturan peringatan dapat dicocokkan oleh kebijakan notifikasi yang dipilih.

      Penting

      Setelah Anda memilih kebijakan notifikasi, acara peringatan yang dihasilkan berdasarkan aturan peringatan dapat dicocokkan oleh kebijakan notifikasi dan peringatan dapat dihasilkan. Acara peringatan juga dapat dicocokkan oleh kebijakan notifikasi lain yang menggunakan pencocokan fuzzy, dan peringatan dapat dihasilkan. Satu atau lebih acara peringatan dapat dicocokkan oleh satu atau lebih kebijakan notifikasi.

    Jangan Tentukan Kebijakan Notifikasi

    Advanced Settings

    Siklus Pemeriksaan Peringatan

    Aturan peringatan dipicu setiap N menit untuk memeriksa apakah kondisi peringatan terpenuhi. Nilai default: 1. Nilai minimum: 1.

    1

    Periksa setelah data lengkap

    • Ya

    • Tidak

    Ya

    Tag

    Tentukan tag untuk aturan peringatan. Tag yang ditentukan dapat digunakan untuk mencocokkan kebijakan notifikasi.

    Tidak ada

    Annotasi

    Tentukan anotasi untuk aturan peringatan.

    Tidak ada

  2. Klik Save. Di halaman Aturan Peringatan Prometheus, periksa status aturan peringatan.

    Jika Automatic Interruption muncul di kolom Status, modifikasi aturan peringatan sesuai petunjuk dan klik Start di kolom Tindakan. Di pesan yang muncul, klik OK. Jika masalah tetap ada setelah Anda menerapkan solusi sebelumnya, hubungi dukungan teknis (ID DingTalk: d9j_rg9e4062f).

    Aturan peringatan mungkin dihentikan secara otomatis karena alasan-alasan berikut:

    • Jumlah hasil yang di-query oleh aturan peringatan melebihi 1.500.

    • Tidak ada objek notifikasi yang dikonfigurasi.

    • Instance Prometheus di-uninstall atau tidak tersedia.

Gunakan pernyataan PromQL kustom untuk membuat aturan peringatan

Untuk memantau metrik selain metrik preset, Anda dapat menggunakan pernyataan PromQL kustom untuk membuat aturan peringatan.

  1. Di halaman Create Prometheus Alert Rule, konfigurasikan parameter-parameter berikut. Tabel berikut menjelaskan parameter-parameter tersebut.

    Parameter

    Deskripsi

    Contoh

    Nama Aturan Peringatan

    Masukkan nama aturan peringatan.

    Pemanfaatan CPU pod melebihi 8%

    Jenis Pemeriksaan

    Pilih PromQL Kustom.

    PromQL Kustom

    Instance Prometheus

    Pilih instance Prometheus.

    Tidak ada

    Grup Kontak Peringatan Referensi

    Pilih grup kontak peringatan.

    Grup kontak peringatan yang didukung oleh instance Prometheus bervariasi berdasarkan jenis instance Prometheus.

    Beban Kubernetes

    Metrik Referensi

    Opsional. Daftar drop-down Metrik Referensi menampilkan metrik umum. Setelah Anda memilih metrik, pernyataan PromQL dari metrik tersebut ditampilkan di bidang Pernyataan PromQL Kustom. Anda dapat memodifikasi pernyataan tersebut sesuai dengan kebutuhan bisnis Anda.

    Nilai-nilai dalam daftar drop-down Metrik Referensi bervariasi berdasarkan jenis instance Prometheus.

    Peringatan penggunaan disk pod

    Pernyataan PromQL Kustom

    Masukkan pernyataan PromQL.

    Namespace: {{$labels.namespace}}/Pod: {{$labels.pod_name}} / Pemanfaatan disk {{$labels.device}} melebihi 90%. Nilai saat ini: {{ printf "%.2f" $value }}%max(container_fs_usage_bytes{pod!="", namespace!="arms-prom",namespace!="monitoring"}) by (pod_name, namespace, device)/max(container_fs_limit_bytes{pod!=""}) by (pod_name,namespace, device) * 100 > 90

    Pratinjau Data

    Data Preview menampilkan pernyataan PromQL yang sesuai dengan kondisi peringatan. Bagian ini juga menampilkan nilai-nilai metrik yang ditentukan dalam grafik deret waktu.

    Secara default, hanya nilai-nilai real-time dari satu sumber daya yang ditampilkan. Anda dapat menentukan kondisi filter untuk melihat nilai-nilai metrik dari sumber daya yang berbeda dalam rentang waktu yang berbeda.

    Catatan
    • Anda dapat memindahkan pointer di atas kurva untuk melihat detail sumber daya pada titik waktu tertentu.

    • Anda juga dapat memilih periode waktu pada kurva deret waktu untuk melihat kurva deret waktu periode waktu yang dipilih.

    Tidak ada

    Durasi

    • Jika kondisi peringatan terpenuhi, acara peringatan dihasilkan: Jika titik data mencapai ambang batas, acara peringatan dihasilkan.

    • Jika kondisi peringatan terus terpenuhi selama N menit, acara peringatan dihasilkan: Acara peringatan hanya dihasilkan jika durasi pencapaian ambang batas lebih besar dari atau sama dengan N menit.

    1

    Tingkat Peringatan

    Tentukan tingkat peringatan. Nilai default: Default. Nilai valid: Default, P4, P3, P2, dan P1. Default menunjukkan tingkat keparahan terendah, sedangkan P1 menunjukkan tingkat keparahan tertinggi.

    Default

    Pesan Peringatan

    Tentukan pesan peringatan yang ingin Anda kirim ke pengguna akhir. Anda dapat menentukan variabel kustom dalam pesan peringatan berdasarkan sintaks template Go.

    Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Pemanfaatan disk {{$labels.device}} melebihi 90%. Nilai saat ini: {{ printf "%.2f" $value }}%

    Notifikasi Peringatan

    • Simple Mode: Anda perlu mengatur Notification Objects, Notification Period, dan Whether to Resend Notifications.

    • Standard Mode:

      • Jangan Tentukan Kebijakan Notifikasi: Jika Anda memilih opsi ini, Anda dapat membuat kebijakan notifikasi di halaman Notification Policy setelah Anda membuat aturan peringatan. Di halaman Kebijakan Notifikasi, Anda dapat menentukan aturan pencocokan dan kondisi pencocokan. Misalnya, Anda dapat menentukan nama aturan peringatan sebagai kondisi pencocokan. Saat aturan peringatan dipicu, acara peringatan dihasilkan dan notifikasi peringatan dikirim ke kontak atau grup kontak yang ditentukan dalam kebijakan notifikasi. Untuk informasi lebih lanjut, lihat Buat dan kelola kebijakan notifikasi.

      • Anda juga dapat memilih kebijakan notifikasi dari daftar drop-down. ARMS secara otomatis menambahkan aturan pencocokan ke kebijakan notifikasi yang dipilih dan menentukan ID aturan peringatan sebagai kondisi pencocokan. Nama aturan peringatan ditampilkan di halaman Kebijakan Notifikasi. Dengan cara ini, acara peringatan yang dihasilkan berdasarkan aturan peringatan dapat dicocokkan oleh kebijakan notifikasi yang dipilih.

      Penting

      Setelah Anda memilih kebijakan notifikasi, acara peringatan yang dihasilkan berdasarkan aturan peringatan dapat dicocokkan oleh kebijakan notifikasi dan peringatan dapat dihasilkan. Acara peringatan juga dapat dicocokkan oleh kebijakan notifikasi lain yang menggunakan pencocokan fuzzy, dan peringatan dapat dihasilkan. Satu atau lebih acara peringatan dapat dicocokkan oleh satu atau lebih kebijakan notifikasi.

    Jangan Tentukan Kebijakan Notifikasi

    Pengaturan Lanjutan

    Siklus Pemeriksaan Peringatan

    Aturan peringatan dipicu setiap N menit untuk memeriksa apakah kondisi peringatan terpenuhi. Nilai default: 1. Nilai minimum: 1.

    1

    Periksa setelah data lengkap

    • Ya

    • Tidak

    Ya

    Tag

    Tentukan tag untuk aturan peringatan. Tag yang ditentukan dapat digunakan untuk mencocokkan kebijakan notifikasi.

    Tidak ada

    Anotasi

    Tentukan anotasi untuk aturan peringatan.

    Tidak ada

  2. Klik Save. Di halaman Prometheus, periksa status aturan peringatan.

    Jika Automatic Interruption muncul di kolom Status, modifikasi aturan peringatan sesuai petunjuk dan klik Start di kolom Tindakan. Di pesan yang muncul, klik OK. Jika masalah tetap ada setelah Anda menerapkan solusi sebelumnya, hubungi dukungan teknis (ID DingTalk: d9j_rg9e4062f).

    Aturan peringatan mungkin dihentikan secara otomatis karena alasan-alasan berikut:

    • Jumlah hasil yang di-query oleh aturan peringatan melebihi 1.500.

    • Tidak ada objek notifikasi yang dikonfigurasi.

    • Instance Prometheus di-uninstall atau tidak tersedia.

Kelola aturan peringatan

  • Untuk aturan peringatan yang dibuat di halaman View Alert Rules di konsol Managed Service for Prometheus, termasuk aturan ambang batas statis dan PromQL kustom, Anda dapat mengedit, menghapus, menyalin, memulai, dan menghentikan mereka, serta melihat acara peringatan historis.

  • Untuk aturan peringatan yang dihasilkan di konsol layanan Alibaba Cloud lainnya, Anda dapat melihat acara peringatan historis dan kembali ke daftar aturan peringatan layanan cloud.