Nacos Monitoring Center - Microservices Engine - Alibaba Cloud Documentation Center

Pusat Pemantauan menyediakan wawasan mengenai status operasional dan metrik kinerja engine MSE Nacos Anda. Fitur ini membantu Anda mengidentifikasi potensi masalah dan bottleneck, menerapkan strategi optimasi, serta meningkatkan stabilitas dan keandalan engine guna meminimalkan risiko gangguan sistem. Topik ini menjelaskan cara melihat data pemantauan tersebut.

Prasyarat

MSE telah diaktifkan.
Engine Nacos telah dibuat dan versinya 2.0.4 atau lebih baru.

Aktifkan dasbor pemantauan Grafana

Edisi Dasar

Untuk engine Edisi Dasar, dasbor pemantauan Grafana yang baru akan diaktifkan secara otomatis saat Anda melakukan upgrade ke Edisi Profesional. Untuk informasi selengkapnya, lihat Upgrade versi engine Nacos.

Edisi Profesional

Jika engine Anda adalah Edisi Profesional versi 2.0.3 atau lebih lama, buka halaman Observation Analysis di Konsol, klik Upgrade Monitoring, lalu ikuti petunjuk dalam kotak dialog Upgrade Monitoring untuk mengaktifkan dasbor pemantauan Grafana yang baru.

Dasbor pemantauan Grafana yang baru

Jika Anda telah mengaktifkan dasbor pemantauan Grafana, versi barunya menyediakan cakupan metrik pemantauan yang lebih luas.

Masuk ke Konsol MSE dan pilih Wilayah di bilah navigasi atas.
Di panel navigasi kiri, pilih Microservices Registry > Instances.
Di halaman Instances, klik nama instans target Anda.
Di panel navigasi kiri, pilih Monitoring Center.
Catatan
- Secara default, dasbor menampilkan data dari 15 menit terakhir. Anda dapat memilih rentang waktu lain atau menentukan rentang waktu kustom dari daftar drop-down di pojok kanan atas.
- Arahkan kursor ke titik data pada grafik untuk melihat data node tertentu pada waktu tersebut dengan granularitas per menit.
- Klik ikon Refresh di pojok kanan atas untuk memperbarui data pemantauan.
- Di tab Overview, Anda dapat melihat informasi berikut:
  - Di bagian Overview, lihat metrik seperti Number of nodes, Number of configurations, Number of service providers, Queries per Second, Operations per Second, dan Number of Connections.
  - Di bagian Usage Watermark, lihat configuration usage, service provider usage, dan connection usage.
  Catatan
  Jika Anda menggunakan client Eureka, metrik terkait koneksi di tab Overview tidak dapat dikumpulkan karena client Eureka menggunakan koneksi singkat.
- Klik tab Registry Monitoring untuk melihat metrik seperti Number of services, Number of service providers, Number of service subscribers, Registry TPS, Registry QPS, Registry Write RT, dan Registry Read RT. TPS adalah singkatan dari transactions per second, QPS adalah singkatan dari queries per second, dan RT adalah singkatan dari response time.
  Catatan
  
  Versi Nacos 2.0.4 dan yang lebih baru menyediakan empat layanan internal untuk penemuan alamat melalui protokol Application Configuration Management (ACM). Oleh karena itu, nilai Number of services dan Number of service providers pada grafik pemantauan lebih tinggi empat angka dibandingkan jumlah aktual. Perilaku ini merupakan hal yang diharapkan.
  
  Jika Anda menggunakan client Eureka, jumlah subscriber layanan tidak dapat dikumpulkan karena client Eureka menggunakan kueri polling alih-alih langganan (subscription).
- Klik tab Configuration Center Monitoring untuk melihat metrik seperti Number of configurations, Number of configuration listeners, Configuration Center TPS, Configuration Center QPS, Configuration Center Write RT, dan Configuration Center Read RT.
  
  Catatan
  Di dasbor Monitoring Center, Configuration Center Monitoring merepresentasikan QPS kueri konfigurasi (queries per second) — yaitu jumlah permintaan baca konfigurasi yang diproses per detik — bukan metrik pemrosesan transaksi independen. Anda dapat menggabungkan metrik ini dengan jumlah permintaan HTTP untuk menilai beban keseluruhan pada pusat konfigurasi. Data pemantauan baik real-time maupun historis tersedia di tab ini.
- Klik tab Push Monitoring untuk melihat metrik seperti Service Push Success Rate, service push latency, Service Push TPS, dan empty push ratio.
  
  Catatan
  Client Eureka menggunakan kueri polling yang tidak memicu fungsionalitas push Nacos. Akibatnya, metrik terkait push tidak dapat dikumpulkan.
- Klik tab Connection Monitoring untuk melihat metrik seperti Number of Client Versions dan Number of long-lived connections.
  
  Catatan
  Karena client Eureka menggunakan koneksi singkat, metrik di tab Connection Monitoring tidak dapat dikumpulkan.
- Klik tab JVM Monitoring untuk melihat metrik Java Virtual Machine (JVM) seperti Young GC Time, Young GC Count, Full GC Time, Full GC Count, dan Heap Memory Usage. GC adalah singkatan dari garbage collection.
- Klik tab Resource Monitoring untuk melihat metrik sumber daya seperti inbound traffic, outbound traffic, Memory Usage, CPU Usage, Number of nodes, dan system load.
- Klik tab TopN Monitoring untuk melihat informasi berikut:
  - Di bagian Service TopN Dashboard, Anda dapat melihat Top N service providers, Top N service subscribers, dan Top N IP Push Failures.
  - Di bagian Configuration TopN Dashboard, Anda dapat melihat Top N configuration changes dan Top N configuration listeners.
(Opsional) Untuk fitur observabilitas lanjutan, klik Import to Grafana Expert Edition di pojok kanan atas. Aksi ini akan mengarahkan Anda ke Konsol Grafana, tempat Anda dapat menjelajahi kemampuan dasbor multi-penyewa yang andal.
(Opsional) Untuk menyematkan halaman pemantauan engine, klik Open <Monitoring Name> in New Window di pojok kanan atas guna mendapatkan URL langsungnya. <Monitoring Name> merepresentasikan nama monitor saat ini.

Misalnya, di tab Registry Monitoring, klik Open Registry Monitoring in New Window di pojok kanan atas untuk membuka halaman pemantauan registri di tab browser baru.

Dasbor lama

Jika Anda belum mengaktifkan dasbor pemantauan Grafana, Anda masih dapat menggunakan dasbor lama. Namun, kami menyarankan untuk melakukan upgrade ke dasbor Grafana yang baru agar dapat mengakses kumpulan metrik yang lebih lengkap. Untuk petunjuknya, lihat Aktifkan dasbor pemantauan Grafana.

Masuk ke Konsol MSE dan pilih Wilayah di bilah navigasi atas.
Di panel navigasi kiri, pilih Microservices Registry > Instances.
Di halaman Instances, klik nama instans target Anda.
Di panel navigasi kiri, klik Observation Analysis.
Di halaman Observation Analysis, klik tab Monitor untuk melihat metrik seperti Number of services, Number of service providers, dan Average Response Time of Service Write API (ms).
Catatan
- Secara default, dasbor menampilkan data dari 30 menit terakhir. Anda dapat memilih rentang waktu lain, seperti Last 30 minutes, Last 1 hour, Last 6 hours, dan Last 24 hours, atau menentukan rentang waktu kustom.
- Data pemantauan untuk ketiga node dalam engine ditampilkan dalam warna berbeda. Anda dapat mengklik nama node di bawah grafik untuk menampilkan atau menyembunyikan datanya. Setidaknya satu node harus tetap terlihat di grafik.
- Arahkan kursor ke titik data pada grafik untuk melihat data ketiga node pada waktu tertentu dengan granularitas per menit.
- Klik ikon Refresh di pojok kanan atas untuk memperbarui data pemantauan.

FAQ

T: Redis RT yang ditampilkan di Monitoring Center sangat tinggi (misalnya, 3.759 detik). Apakah nilai ini akurat?

Dalam kebanyakan kasus, nilai Redis RT yang tidak biasa tinggi di dasbor pemantauan merupakan artefak tampilan yang disebabkan oleh metode pengambilan sampel, bukan waktu respons Redis yang sebenarnya. Untuk memverifikasi waktu respons Redis yang sebenarnya, periksa log permintaan instans Anda. Gunakan waktu respons yang tercatat dalam log permintaan sebagai referensi resmi untuk Redis RT.

T: Terdapat event restart node atau failover dalam data pemantauan, tetapi trafik bisnis saya tidak terpengaruh. Apa penyebabnya?

Ketika terjadi anomali pada infrastruktur dasar instans MSE, sistem dapat memicu operasi failover, restart, atau migrasi pada satu node. Kejadian ini tercermin sebagai indikator anomali atau peringatan dalam data pemantauan. Karena engine MSE Nacos secara default menggunakan penerapan kluster multi-node (3 node secara default), failover pada satu node merupakan bagian dari mekanisme ketersediaan tinggi yang normal dan biasanya tidak memengaruhi ketersediaan bisnis secara keseluruhan.