ApsaraMQ for RocketMQ menyediakan dasbor untuk statistik data real-time yang memanfaatkan kemampuan penyimpanan dan visualisasi metrik dari Alibaba Cloud ARMS Managed Service for Prometheus dan Grafana. Fitur ini membantu Anda mengumpulkan dan memantau metrik secara terpusat dari berbagai dimensi guna memahami status operasional bisnis dengan cepat. Topik ini menjelaskan skenario, penagihan, metrik, dan penggunaan dasbor.
Skenario
Skenario 1: Konsumsi pesan online tidak normal, dan pesan tidak diproses tepat waktu. Anda perlu menerima peringatan dan segera mengidentifikasi akar masalahnya.
Skenario 2: Status beberapa pesanan online tidak normal. Anda perlu memverifikasi apakah pesan dikirim dengan benar melalui tautan pesan yang sesuai.
Skenario 3: Anda perlu menganalisis tren lalu lintas pesan, karakteristik distribusi, atau volume pesan untuk analisis dan perencanaan tren bisnis.
Skenario 4: Anda perlu melihat dan menganalisis topologi dependensi aplikasi hulu dan hilir untuk peningkatan atau optimalisasi arsitektur.
Prasyarat
Buat peran terkait layanan.
Nama peran: AliyunServiceRoleForOns
Nama kebijakan: AliyunServiceRolePolicyForOns
Izin: Mengizinkan ApsaraMQ for RocketMQ menggunakan peran ini untuk mengakses layanan Alibaba Cloud lainnya, seperti CloudMonitor dan ARMS, guna mengimplementasikan fitur pemantauan, peringatan, dan dasbor.
Untuk informasi selengkapnya, lihat Peran Terkait Layanan.
Penagihan
Metrik dasbor untuk ApsaraMQ for RocketMQ merupakan metrik dasar dalam ARMS Managed Service for Prometheus. Metrik dasar tidak dikenai biaya. Oleh karena itu, fitur dasbor juga gratis.
Untuk informasi selengkapnya, lihat Metrik dan Bayar Sesuai Pemakaian.
Konsep
Sebelum melihat metrik dasbor, Anda perlu memahami konsep berikut terkait akumulasi pesan.
Gambar berikut menunjukkan status pesan dalam antrian topik tertentu.

ApsaraMQ for RocketMQ mengumpulkan statistik jumlah pesan dan waktu yang dibutuhkan pada berbagai tahap pemrosesan. Metrik ini secara langsung mencerminkan laju pemrosesan pesan dan backlog dalam antrian. Dengan memantau metrik ini, Anda dapat menentukan apakah konsumsi layanan Anda tidak normal. Bagian berikut menjelaskan makna metrik ini dan rumus yang digunakan untuk menghitungnya:
Kategori | Metrik | Definisi | Rumus Perhitungan |
Metrik jumlah pesan | Pesan inflight | Pesan yang sedang diproses oleh klien konsumen, tetapi klien belum mengembalikan hasil konsumsi. | Offset pesan terakhir yang ditarik - Offset pesan terakhir yang dikirimkan |
Pesan siap | Pesan yang siap di server ApsaraMQ for RocketMQ. Pesan tersebut terlihat oleh konsumen dan tersedia untuk dikonsumsi. | Offset pesan maksimum - Offset pesan terakhir yang ditarik | |
Lag konsumen | Jumlah total pesan yang belum diproses. | Jumlah pesan inflight + Jumlah pesan siap | |
Metrik durasi pesan | Waktu siap pesan siap |
| Tidak berlaku |
Waktu antrian pesan siap | Usia pesan siap paling awal. Nilai ini menunjukkan seberapa cepat konsumen menarik pesan. | Waktu saat ini dikurangi waktu siap pesan siap paling awal | |
Waktu lag konsumen | Waktu yang berlalu sejak pesan tertua yang menunggu respons menjadi siap. Nilai ini menunjukkan seberapa cepat konsumen memproses pesan. | Waktu saat ini - Waktu siap pesan tertua yang menunggu respons |
Detail metrik
Dasbor ApsaraMQ for RocketMQ menyediakan metrik berikut:
Produsen: Lihat metrik untuk topik, seperti jumlah pesan yang dikirim, tingkat keberhasilan pengiriman, dan latensi pengiriman.
Konsumen: Lihat metrik terkait langganan kelompok ke topik tertentu, seperti volume konsumsi, tingkat keberhasilan konsumsi, dan akumulasi pesan.
Ikhtisar Top 20 Instans: Lihat topik atau kelompok teratas 20 berdasarkan nilai metrik tertentu dalam suatu instans.
Metrik penagihan: Lihat metrik untuk instans, seperti TPS pesan, panggilan API, dan ukuran rata-rata pesan. Metrik ini dapat digunakan sebagai referensi untuk memperkirakan item penagihan.
Periode pengumpulan semua metrik adalah 1 menit. ApsaraMQ for RocketMQ mendukung kueri data hingga 15 hari terakhir. Rentang waktu maksimum untuk satu kueri adalah 24 jam.
Produsen
Metrik | Deskripsi |
Message Production Rate | Laju produksi pesan dan laju pemanggilan API untuk produksi pesan pada suatu topik. Unit:
|
Peak Message Production Rate | Laju produksi pesan maksimum. Unit: pesan/detik. |
Total Messages Produced | Jumlah total pesan yang diproduksi dalam instans tertentu. Unit: pesan. |
Message Production Call Success Rate | Tingkat keberhasilan produksi pesan untuk suatu topik. |
Message Production Call Latency | Latensi produksi pesan untuk suatu topik. Unit: ms. |
Konsumen
Metrik | Deskripsi |
Average Consumption Success Rate | Tingkat keberhasilan konsumsi untuk semua pesan dalam instans tertentu. |
Accumulated Messages (Ready + Inflight) | Jumlah total pesan terakumulasi dalam instans tertentu, termasuk pesan siap dan inflight. Unit: pesan. |
Inflight Messages | Jumlah pesan yang sedang diproses oleh klien konsumen tetapi belum mengembalikan respons keberhasilan. Unit: pesan. |
Ready Messages | Jumlah pesan yang siap di server ApsaraMQ for RocketMQ dan dapat dikonsumsi. Metrik ini mencerminkan skala pesan yang belum diproses oleh konsumen. Unit: pesan. |
Ready Message Queue Time | Selisih waktu antara waktu saat ini dan waktu siap pesan siap paling awal. Metrik ini mencerminkan latensi pesan yang belum diproses dan merupakan ukuran penting untuk layanan yang sensitif terhadap waktu. Nilai metrik dalam ikhtisar mewakili waktu antrian pesan siap rata-rata untuk instans tersebut. Nilai metrik dalam grafik tertentu mewakili waktu antrian pesan siap untuk kelompok tertentu yang berlangganan ke topik tertentu. Unit: ms. |
Message Consumption Rate | Laju kelompok dalam mengonsumsi pesan. Unit: pesan/detik |
Peak Message Consumption Rate | Laju konsumsi pesan maksimum. Unit: pesan/detik |
Total Messages Consumed | Jumlah total pesan yang dikonsumsi dalam instans tertentu. Unit: pesan. |
Consumption Accumulation | Jumlah pesan terakumulasi untuk suatu kelompok, termasuk pesan siap dan inflight. Unit: pesan. |
Message Processing Latency | Waktu yang dibutuhkan kelompok untuk memproses pesan, dari awal konsumsi hingga selesai. Unit: ms. |
Consumer Local Wait Time | Waktu yang dibutuhkan untuk memproses pesan setelah pesan tiba di klien konsumen. Unit: ms. |
Consumption Success Rate | Tingkat keberhasilan konsumsi pesan. |
Consumer Client Access Protocol Ratio | Rasio pesan yang dikonsumsi berdasarkan jenis protokol. |
Ikhtisar Top 20 Instans
Metrik | Deskripsi |
Top 20 Topics by Message Production Rate | Top 20 topik dengan laju produksi pesan tertinggi. Unit: pesan/detik. |
Top 20 GroupIDs by Message Consumption Rate | Top 20 kelompok dengan laju konsumsi pesan tertinggi. Unit: pesan/detik. |
Top 20 GroupIDs by Number of Ready Messages | Top 20 kelompok dengan jumlah pesan siap terbanyak. Unit: pesan. |
Top 20 GroupIDs by Ready Message Queue Time | Top 20 kelompok dengan waktu antrian pesan siap terlama. Unit: ms. |
Top 20 GroupIDs by Number of Accumulated Messages (Ready + Inflight) | Top 20 kelompok dengan jumlah pesan terakumulasi terbanyak. Unit: pesan. |
Top 20 GroupIDs by Number of Inflight Messages | Top 20 kelompok dengan jumlah pesan inflight terbanyak. Unit: pesan. |
Top 20 GroupIDs by Consumption Processing Latency | Top 20 kelompok dengan latensi pemrosesan konsumsi terlama. Unit: ms. |
Top 20 GroupIDs by Consumer Local Wait Time | Top 20 kelompok dengan waktu tunggu lokal konsumen terlama. Unit: ms. |
Top 20 Topics by Message Production Call Failure Rate | Top 20 topik dengan tingkat kegagalan produksi pesan tertinggi. |
Top 20 GroupIDs by Message Consumption Failure Rate | Top 20 kelompok dengan tingkat kegagalan konsumsi pesan tertinggi. |
Metrik penagihan
Nilai metrik penagihan berikut mencakup pengali untuk pesan besar dan fitur lanjutan.
Pengali pesan besar: Satuan pengukuran adalah 4 KB. Misalnya, jika Anda mengirim pesan 16 KB, jumlah panggilan API dihitung sebagai 16 KB / 4 KB = 4.
Pengali fitur lanjutan: Jumlah panggilan API untuk pesan dengan fitur lanjutan, seperti pesan terurut, terjadwal, tertunda, dan transaksional, adalah lima kali jumlah panggilan API untuk pesan normal.
Metrik | Deskripsi |
Peak Production TPS | TPS produksi pesan maksimum. Metrik ini dapat digunakan sebagai referensi untuk memperkirakan spesifikasi TPS puncak dalam item penagihan instans. Unit: panggilan/detik. |
Peak Consumption TPS | TPS konsumsi pesan maksimum. Metrik ini dapat digunakan sebagai referensi untuk memperkirakan spesifikasi TPS puncak dalam item penagihan instans. Unit: panggilan/detik. |
Peak TPS | Nilai maksimum dari jumlah TPS produksi pesan dan TPS konsumsi pesan. Metrik ini dapat digunakan sebagai referensi untuk memperkirakan spesifikasi TPS puncak dalam item penagihan instans. Unit: panggilan/detik. |
Total API Calls | Jumlah total panggilan API. Metrik ini dapat digunakan sebagai referensi untuk memperkirakan jumlah panggilan API dalam item penagihan instans. Unit: panggilan. |
Average Message Size | Ukuran rata-rata semua pesan yang diproduksi. Unit: byte. |
Production And Consumption TPS | Jumlah TPS produksi pesan dan TPS konsumsi pesan. Unit: panggilan/detik. |
Daily API Calls | Jumlah total harian panggilan API untuk produksi dan konsumsi pesan. Unit: panggilan. |
Detail Metrik
Saat menghitung metrik terkait TPS pesan, jumlah pesan yang dikirim dan diterima, atau jumlah total pesan, satuan dasarnya adalah pesan normal 4 KB. Pengali untuk ukuran pesan dan jenis pesan lanjutan diterapkan pada satuan dasar ini.
Tabel berikut menjelaskan bidang-bidang dalam metrik.
Bidang | Nilai |
Jenis metrik | Gauge: Metrik yang nilainya dapat naik atau turun. Nilainya merepresentasikan pengukuran instan dari objek statistik. Contohnya, TPS panggilan API. |
Label |
|
Metrik sisi server
Jenis metrik | Nama metrik | Unit | Deskripsi | Label |
Gauge | rocketmq_instance_requests_threshold | count/s | Ambang batas pengendalian aliran instans. |
|
Gauge | rocketmq_instance_requests_max | count/s | TPS maksimum instans per menit. Permintaan yang dikendalikan alirannya tidak termasuk. Aturan: Nilai maksimum di antara 60 sampel TPS yang diambil dalam 1 menit. |
|
Metrik produsen
Jenis metrik | Nama metrik | Unit | Deskripsi | Label |
Gauge | rocketmq_producer_requests (commercialCount, panggilan yang dapat ditagih) | count | Jumlah panggilan API terkait pengiriman pesan. |
|
Gauge | rocketmq_producer_messages | message | Jumlah pesan yang dikirim. |
|
Gauge | rocketmq_producer_message_size_bytes | byte | Total ukuran pesan yang dikirim. |
|
Gauge | rocketmq_producer_send_success_rate | % | Tingkat keberhasilan pengiriman. |
|
Gauge | rocketmq_producer_failure_api_calls | count | Jumlah panggilan API gagal untuk pengiriman pesan. |
|
Gauge | rocketmq_producer_send_rt_milliseconds_avg | ms | Latensi rata-rata pengiriman pesan. |
|
Gauge | rocketmq_producer_send_rt_milliseconds_min | ms | Latensi minimum pengiriman pesan. |
|
Gauge | rocketmq_producer_send_rt_milliseconds_max | ms | Latensi maksimum pengiriman pesan. |
|
Gauge | rocketmq_producer_send_rt_milliseconds_p95 | ms | Latensi P95 pengiriman pesan. |
|
Gauge | rocketmq_producer_send_rt_milliseconds_p99 | ms | Latensi P99 pengiriman pesan. |
|
Metrik konsumen
Jenis metrik | Nama metrik | Unit | Deskripsi | Label |
Gauge | rocketmq_consumer_requests | count | Jumlah panggilan API terkait konsumsi pesan. |
|
Gauge | rocketmq_consumer_send_back_requests | count | Jumlah panggilan API untuk mengembalikan pesan yang gagal dikonsumsi. |
|
Gauge | rocketmq_consumer_send_back_messages | message | Pesan yang gagal dikonsumsi dan dikembalikan oleh konsumen. |
|
Gauge | rocketmq_consumer_messages | message | Jumlah pesan yang dikonsumsi. |
|
Gauge | rocketmq_consumer_message_size_bytes | byte | Ukuran pesan yang dikonsumsi (diakumulasikan selama satu menit). |
|
Gauge | rocketmq_consumer_ready_and_inflight_messages | message | Lag konsumsi pesan (termasuk pesan siap dan inflight). |
|
Gauge | rocketmq_consumer_ready_messages | message | Jumlah pesan siap. Akumulasi aktual: maxOffset - lastPullOffset |
|
Gauge | rocketmq_consumer_inflight_messages | message | Jumlah pesan inflight. Aturan: lastPullOffset - committedOffset |
|
Gauge | rocketmq_consumer_queue_time_milliseconds | ms | Waktu antrian pesan. |
|
Gauge | rocketmq_consumer_message_await_time_milliseconds_avg | ms | Rata-rata waktu pesan menunggu sumber daya pemrosesan di klien konsumen. |
|
Gauge | rocketmq_consumer_message_await_time_milliseconds_min | ms | Waktu minimum pesan menunggu sumber daya pemrosesan di klien konsumen. |
|
Gauge | rocketmq_consumer_message_await_time_milliseconds_max | ms | Waktu maksimum pesan menunggu sumber daya pemrosesan di klien konsumen. |
|
Gauge | rocketmq_consumer_message_await_time_milliseconds_p95 | ms | Waktu P95 pesan menunggu sumber daya pemrosesan di klien konsumen. |
|
Gauge | rocketmq_consumer_message_await_time_milliseconds_p99 | ms | Waktu P99 pesan menunggu sumber daya pemrosesan di klien konsumen. |
|
Gauge | rocketmq_consumer_message_process_time_milliseconds_avg | ms | Rata-rata latensi pemrosesan pesan untuk konsumen. |
|
Gauge | rocketmq_consumer_message_process_time_milliseconds_min | ms | Latensi pemrosesan pesan minimum untuk konsumen. |
|
Gauge | rocketmq_consumer_message_process_time_milliseconds_max | ms | Latensi pemrosesan pesan maksimum untuk konsumen. |
|
Gauge | rocketmq_consumer_message_process_time_milliseconds_p95 | ms | Latensi pemrosesan pesan P95 untuk konsumen. |
|
Gauge | rocketmq_consumer_message_process_time_milliseconds_p99 | ms | Latensi pemrosesan pesan P99 untuk konsumen. |
|
Gauge | rocketmq_consumer_consume_success_rate | % | Tingkat keberhasilan konsumsi pesan. |
|
Gauge | rocketmq_consumer_failure_api_calls | count | Jumlah panggilan API gagal untuk konsumsi. |
|
Gauge | rocketmq_consumer_to_dlq_messages | message | Jumlah pesan yang dikirim ke antrian pesan gagal (DLQ). |
|
Lihat dasbor
Masuk ke Konsol ApsaraMQ for RocketMQ. Di panel navigasi sebelah kiri, klik Instances.
Di bilah navigasi atas, pilih wilayah, misalnya China (Hangzhou). Di halaman Instans, klik nama instans yang ingin Anda kelola.
Gunakan salah satu metode berikut untuk melihat dasbor.
Halaman Instance Details: Di halaman Instance Details, klik tab Dashboard.
Halaman Dashboard: Di panel navigasi sebelah kiri, klik Dashboard.
Halaman Topic Details: Di panel navigasi sebelah kiri, klik Topics. Di daftar topik, klik nama topik target. Di halaman Topic Details, klik tab Dashboard.
Halaman Group Details: Di panel navigasi sebelah kiri, klik Groups. Di daftar grup, klik nama grup target. Kemudian, di halaman Group Details, klik tab Dashboard.
FAQ Dasbor
Bagaimana cara mendapatkan data metrik dasbor?
Masuk ke Konsol ARMS dengan akun Alibaba Cloud Anda.
Di panel navigasi sebelah kiri, klik Integration Center.
Di halaman Integration Center, masukkan
RocketMQdi kotak pencarian dan klik ikon pencarian.Dalam hasil pencarian, pilih layanan Alibaba Cloud yang ingin Anda integrasikan, misalnya Alibaba Cloud RocketMQ (4.0) Service. Untuk informasi selengkapnya, lihat Langkah 1: Integrasikan data pemantauan layanan Alibaba Cloud.
Setelah integrasi berhasil, klik Provisioning di panel navigasi sebelah kiri.
Di daftar Cloud Service Area Environment, klik nama lingkungan target untuk membuka halaman detailnya.
Di tab Component Management, di bagian Basic Information, klik wilayah Prometheus Instance.
Di tab Settings, Anda dapat menemukan berbagai metode akses data.
Bagaimana cara mengintegrasikan data metrik dasbor ke Grafana yang dikelola sendiri?
Semua data metrik untuk ApsaraMQ for RocketMQ disimpan di Managed Service for Prometheus Anda. Ikuti langkah-langkah dalam Bagaimana cara mendapatkan data metrik dasbor? untuk menghubungkan ke layanan Alibaba Cloud dan mengambil nama lingkungan serta alamat API HTTP. Anda kemudian dapat menggunakan API tersebut untuk mengintegrasikan data metrik dasbor ApsaraMQ for RocketMQ ke Grafana yang dikelola sendiri. Untuk informasi selengkapnya, lihat Integrasikan data Prometheus ke Grafana atau aplikasi yang dikelola sendiri menggunakan alamat API HTTP.
Bagaimana cara memahami TPS rata-rata dan TPS maksimum suatu instans?
TPS rata-rata = Total permintaan dalam 1 menit / 60 detik
TPS maksimum: Dalam periode statistik 1 menit, nilai TPS diambil sampelnya sekali per detik. TPS maksimum adalah nilai tertinggi dari 60 sampel tersebut.
Contoh:
Asumsikan suatu instans menghasilkan 60 pesan dalam 1 menit. Semua pesan merupakan pesan normal dan masing-masing berukuran 4 KB. Laju produksi instans tersebut adalah 60 pesan per menit.
TPS rata-rata instans = 60 panggilan / 60 detik = 1 panggilan per detik
TPS maksimum instans dihitung sebagai berikut:
Jika 60 pesan dikirim pada detik pertama, nilai TPS setiap detik dalam menit tersebut adalah 60, 0, 0, ..., 0.
TPS maksimum instans = 60 panggilan per detik.
Jika 40 pesan dikirim pada detik pertama dan 20 pesan dikirim pada detik kedua, nilai TPS setiap detik dalam menit tersebut adalah 40, 20, 0, 0, ..., 0.
TPS maksimum instans = 40 panggilan per detik.