ApsaraMQ for RocketMQ menyediakan fitur dasbor serta fitur pemantauan dan peringatan. Anda dapat menggunakan fitur-fitur ini untuk memantau status broker dan metrik penting di setiap tahap perpesanan. Selain itu, Anda dapat mengonfigurasi aturan peringatan untuk menerima laporan pengecualian secepat mungkin. Topik ini menjelaskan cara menggunakan fitur dasbor dan pemantauan dari ApsaraMQ for RocketMQ untuk mengelola titik kegagalan dalam ApsaraMQ for RocketMQ, memberikan solusi untuk operasi rutin dan pemecahan masalah.
Implementasi
Masalah inti
Berikut adalah masalah inti dalam pemecahan masalah:
Bagaimana cara mengirimkan peringatan dan melaporkan pengecualian layanan.
Bagaimana cara dengan cepat menemukan pengecualian.
Solusi
Indikator seperti metrik dan jejak yang disediakan oleh ApsaraMQ for RocketMQ mencakup informasi status di setiap tahap perpesanan, throughput broker, dan sumber daya ApsaraMQ for RocketMQ. Metrik secara umum dapat dibagi menjadi kategori berikut:
Metrik Tingkat-1: Kami merekomendasikan penggunaan metrik yang dapat mengukur operasi bisnis sebagai metrik tingkat-1. Pengecualian dalam metrik ini menunjukkan masalah dalam sistem bisnis. Dalam banyak kasus, metrik ini dapat digunakan sebagai metrik pemantauan dan peringatan.
Sebagai contoh, jika pembatasan instans dipicu karena transaksi per detik (TPS) melebihi batas spesifikasi, Anda dapat menggunakan TPS sebagai metrik pemantauan dan membuat aturan peringatan untuk mencegah pembatasan instans secara efektif.
Metrik Tingkat-2: Kami merekomendasikan penggunaan metrik yang dapat digunakan untuk menemukan titik kegagalan sebagai metrik tingkat-2.
Sebagai contoh, pesan yang terakumulasi menunjukkan bahwa titik kegagalan telah terjadi selama konsumsi pesan. Tingkat keberhasilan pengiriman pesan menunjukkan apakah pengecualian terjadi selama pengiriman pesan.
Metrik Tingkat-3: Metrik ini dapat digunakan untuk menganalisis lebih lanjut metrik tingkat-2. Metrik tingkat-3 membantu mengidentifikasi penyebab perubahan dalam metrik tingkat-2.
Solusi untuk pengecualian konsumsi

Gunakan metrik ConsumerLagLatencyPerGidTopic, yang menunjukkan waktu tunda untuk pemrosesan pesan, sebagai metrik pemantauan dan buat aturan peringatan. Untuk informasi lebih lanjut, lihat Pemantauan dan Peringatan.
Metrik ini menunjukkan status kesehatan sistem konsumsi dan dapat memengaruhi tingkat dampak bisnis. Metrik ini memberikan lebih banyak informasi daripada jumlah pesan yang terakumulasi.
Jika jumlah pesan sedikit, akumulasi pesan mungkin tidak memicu peringatan meskipun terjadi masalah.
Jika jumlah pesan besar, akumulasi pesan mungkin menghasilkan peringatan palsu.
Jika jumlah pesan sangat fluktuatif, Anda tidak dapat mengonfigurasi ambang batas peringatan untuk akumulasi pesan dengan akurat.
Periksa apakah metrik rocketmq_process_time, yang menunjukkan waktu yang dikonsumsi untuk pemrosesan pesan, dan metrik rocketmq_process_time_count{invocation_status="success"/invocation_status="success | failure"}, yang menunjukkan tingkat keberhasilan pemrosesan pesan, normal. Ini membantu memeriksa apakah pengecualian terjadi pada klien konsumen.
Tingkat keberhasilan pemrosesan pesan dihitung menggunakan rumus berikut: Tingkat keberhasilan pemrosesan pesan = Jumlah kali pesan berhasil diproses / (Jumlah kali pesan gagal diproses + Jumlah kali pesan berhasil diproses).
Anda dapat pergi ke halaman Dasbor di konsol ApsaraMQ for RocketMQ untuk melihat statistik metrik sebelumnya. Untuk informasi tentang dasbor, lihat Dasbor.
Identifikasi penyebab spesifik berdasarkan logika bisnis atau tren perubahan metrik. Sebagai contoh, jika durasi pemrosesan pesan menjadi lebih lama, Anda dapat memeriksa apakah memori dan CPU layanan konsumen kelebihan beban. Atau, Anda dapat memeriksa status operasi logika bisnis hilir yang bergantung pada logika konsumsi untuk analisis lebih lanjut.
Solusi untuk pengecualian produksi

Periksa apakah metrik rocketmq_send_cost_time_count{invocation_status="success"/invocation_status="success | failure"}, yang menunjukkan tingkat keberhasilan pengiriman pesan, normal. Tingkat ini dihitung menggunakan rumus berikut: Tingkat keberhasilan pengiriman pesan = Jumlah kali pesan berhasil dikirim / (Jumlah kali pesan gagal dikirim + Jumlah kali pesan berhasil dikirim).
Anda dapat pergi ke halaman Dasbor di konsol ApsaraMQ for RocketMQ untuk melihat statistik metrik sebelumnya. Untuk informasi tentang dasbor, lihat Dasbor.
Periksa apakah jaringan normal atau apakah kegagalan transmisi jangka pendek disebabkan oleh restart broker.