All Products
Search
Document Center

Microservices Engine:Pusat Pemantauan

Last Updated:Mar 11, 2026

Saat engine Nacos Anda menangani pendaftaran layanan, distribusi konfigurasi, dan notifikasi push dalam skala besar, Anda memerlukan visibilitas real-time terhadap bottleneck kinerja, batas kapasitas, dan kesehatan infrastruktur. Pusat Pemantauan di Microservices Engine (MSE) menyediakan dasbor terpadu yang melacak metrik-metrik ini dalam delapan kategori, sehingga Anda dapat mendeteksi anomali dan menyelesaikan masalah sebelum memengaruhi layanan Anda.

Prasyarat

Sebelum memulai, pastikan Anda telah memiliki:

Pilih dasbor

MSE menyediakan dua dasbor pemantauan. Dasbor Grafana direkomendasikan karena mencakup jauh lebih banyak metrik.

DasborCakupan metrikRentang waktu defaultDirekomendasikan untuk
Grafana dashboard8 kategori metrik di tab khusus15 menit terakhirSemua pengguna pada Edisi Profesional
Legacy dashboard3 metrik dasar (jumlah layanan, jumlah provider, RT write)30 menit terakhirPengguna yang belum melakukan upgrade

Jika engine Anda masih menggunakan legacy dashboard, upgrade ke dasbor Grafana untuk observabilitas penuh.

Aktifkan dasbor Grafana

Engine Edisi Dasar

Dasbor Grafana diaktifkan secara otomatis setelah Anda meng-upgrade engine ke Edisi Profesional. Untuk informasi selengkapnya, lihat Upgrade versi Nacos.

Engine Edisi Profesional (versi 2.0.3 atau lebih lama)

Jika engine Anda menjalankan versi 2.0.3 atau lebih lama, aktifkan dasbor Grafana secara manual:

  1. Login ke Konsol MSE dan pilih wilayah di bilah navigasi atas.

  2. Di panel navigasi kiri, pilih Microservices Registry > Instances.

  3. Klik nama instans target.

  4. Di panel navigasi kiri, klik Observation Analysis.

  5. Klik Upgrade Monitoring Dashboard dan ikuti petunjuk di layar.

    Upgrade Monitoring Dashboard

Setelah upgrade selesai, halaman Monitoring Center menjadi tersedia.

Gunakan dasbor Grafana

Dasbor Grafana mengorganisasi metrik ke dalam tab-tab yang dirancang untuk tujuan tertentu. Mulailah dari tab Overview untuk mendeteksi anomali, lalu telusuri tab spesifik untuk menginvestigasi akar permasalahan.

Tujuan investigasiMulai di sini
Pemeriksaan kesehatan cepatOverview dan Top N Monitoring
Masalah registri layananRegistry Monitoring dan Push monitoring
Masalah konfigurasiConfiguration center monitoring
Masalah infrastrukturJVM Monitoring dan Resource Monitoring
Masalah koneksiNumber of connections monitoring

Buka Pusat Pemantauan

  1. Login ke Konsol MSE dan pilih wilayah di bilah navigasi atas.

  2. Di panel navigasi kiri, pilih Microservices Registry > Instances.

  3. Di halaman Instances, klik nama instans target.

  4. Di panel navigasi kiri, klik Monitoring Center.

Kontrol dasbor

  • Rentang waktu: Jendela pemantauan default adalah 15 menit terakhir. Untuk mengubahnya, klik pemilih rentang waktu di pojok kanan atas dan pilih rentang preset atau kustom.

  • Granularitas data: Arahkan kursor ke titik mana pun pada grafik untuk melihat nilai metrik per node pada saat tersebut, akurat hingga menit.

  • Refresh: Klik ikon Refresh di pojok kanan atas untuk memuat ulang data saat ini.

Tab Overview

Tab Overview memberikan ringkasan tingkat tinggi mengenai kesehatan engine Anda. Gunakan sebagai titik awal selama pemeriksaan rutin dan triase insiden.

Ikhtisar

MetrikApa yang diukurYang perlu diperhatikan
Number of nodesTotal node engine dalam klusterPenurunan mendadak mengindikasikan kegagalan node. Verifikasi bahwa jumlahnya sesuai dengan ukuran kluster yang diharapkan.
Number of configurationsTotal entri konfigurasi yang dikelola oleh enginePerubahan tak terduga mungkin mengindikasikan pembaruan konfigurasi tanpa izin.
Number of service providersTotal instans provider layanan terdaftarPenurunan mendadak menunjukkan instans provider sedang deregistrasi, yang mungkin mengarah pada masalah penerapan atau kegagalan jaringan.
Queries per secondThroughput permintaan baca (QPS)Lonjakan melebihi garis dasar Anda mungkin mengindikasikan lonjakan traffic. Penurunan ke nol mungkin mengindikasikan ketidaktersediaan engine.
Operations per secondThroughput permintaan tulis (TPS)Lonjakan berkelanjutan mungkin mengindikasikan pembaruan batch atau client yang tidak terkendali.
Number of connectionsKoneksi client aktif ke engineBandingkan dengan garis dasar. Penurunan mendadak mungkin mengindikasikan partisi jaringan.

Bagian Tingkat Penggunaan

MetricUkuran yang diukurYang perlu diperhatikan
Configuration number using water levelJumlah konfigurasi sebagai persentase dari kapasitas engineNilai mendekati 100% menunjukkan bahwa engine hampir mencapai batas kapasitasnya. Lakukan peningkatan spesifikasi engine sebelum terjadi saturasi.
Service Provider Water LevelJumlah service provider sebagai persentase dari kapasitas engineSama seperti di atas. Rencanakan peningkatan kapasitas jika penggunaan secara konsisten tinggi.
Connection using water levelJumlah koneksi sebagai persentase dari kapasitas engineSama seperti di atas. Penggunaan koneksi yang tinggi dapat menyebabkan klien baru gagal terhubung.
Catatan

Klien Eureka hanya mendukung koneksi singkat, sehingga jumlah koneksi tidak dilaporkan untuk aplikasi berbasis Eureka.

Tab Registry Monitoring

Tab Registry Monitoring melacak kinerja pendaftaran dan penemuan layanan. Gunakan untuk mendiagnosis penemuan layanan lambat, kegagalan pendaftaran, atau masalah kapasitas.

MetrikApa yang diukurYang perlu diperhatikan
Number of servicesTotal layanan terdaftarPenurunan mendadak mengindikasikan layanan deregistrasi secara tak terduga.
Number of Service ProvidersTotal instans provider layananBandingkan dengan ukuran penerapan yang diharapkan. Ketidaksesuaian mengindikasikan kegagalan pendaftaran.
Number of service subscribersTotal instans subscriber layananPeningkatan cepat mungkin mengindikasikan badai subscriber akibat klien yang salah konfigurasi.
Registration Center TPSTransaksi tulis per detik untuk operasi pendaftaranLonjakan berkelanjutan disertai kenaikan RT tulis mengindikasikan konflik sumber daya.
Registration Center QPSPermintaan baca per detik untuk operasi penemuanLonjakan di sini berkorelasi dengan peningkatan permintaan penemuan layanan dari penerapan baru atau event scaling.
Registration Center Write RTWaktu respons rata-rata untuk operasi tulisLatensi tulis yang meningkat perlu diinvestigasi. Periksa tab Resource Monitoring dan JVM Monitoring untuk mengidentifikasi bottleneck.
Registration Center Read RTWaktu respons rata-rata untuk operasi bacaSama seperti RT tulis. Latensi baca yang meningkat mungkin mengindikasikan beban meningkat atau tekanan pengumpulan sampah.
Catatan

Nacos 2.0.4 dan versi lebih baru menyertakan empat layanan bawaan untuk penemuan alamat menggunakan protokol Diamond (Application Configuration Management). Jumlah layanan dan jumlah provider yang ditampilkan di sini adalah nilai aktual ditambah 4.

Catatan

Klien Eureka tidak mendukung langganan layanan dan menggunakan polling query sebagai gantinya. Jumlah subscriber layanan tidak dilaporkan untuk aplikasi berbasis Eureka.

Tab configuration center monitoring

Tab Configuration center monitoring melacak kinerja manajemen konfigurasi. Gunakan untuk menginvestigasi push konfigurasi lambat, akumulasi listener, atau bottleneck tulis.

MetrikApa yang diukurYang perlu diperhatikan
Number of configurationsTotal entri konfigurasiPerubahan mendadak mungkin mengindikasikan impor batch atau penghapusan tidak sengaja.
Configure the number of listenersTotal listener konfigurasi di semua entriLonjakan biasanya berkorelasi dengan rollout penerapan batch. Jumlah listener tinggi yang berkelanjutan meningkatkan overhead push.
Configuration Center TPSTransaksi tulis per detik untuk perubahan konfigurasiLonjakan disertai kenaikan RT tulis mengindikasikan engine berada di bawah tekanan tulis.
Configuration Center QPSPermintaan baca per detik untuk pencarian konfigurasiQPS tinggi mungkin mengindikasikan klien melakukan polling terlalu agresif daripada menggunakan pembaruan berbasis push.
Configuration Center Write RTWaktu respons rata-rata untuk penulisan konfigurasiNilai sehat berada di kisaran milidetik rendah. Nilai yang meningkat mengindikasikan konflik sumber daya.
Configuration Center Read RTWaktu respons rata-rata untuk pembacaan konfigurasiSama seperti RT tulis.

Tab Push monitoring

Tab Push monitoring melacak seberapa efektif engine mendorong notifikasi perubahan layanan ke subscriber. Pipeline push yang sehat sangat penting untuk responsivitas penemuan layanan.

MetrikApa yang diukurYang perlu diperhatikan
Service Push Success RatePersentase notifikasi push yang berhasil dikirimTingkat di bawah 100% perlu segera diinvestigasi. Periksa tab Number of connections monitoring untuk masalah konektivitas dan verifikasi bahwa subscriber dapat dijangkau.
Time-consuming service pushLatensi rata-rata per notifikasi pushLatensi yang meningkat mungkin mengindikasikan kemacetan jaringan atau klien subscriber yang kelebihan beban.
Service Push TPSNotifikasi push yang dikirim per detikBerkorelasi dengan event penerapan atau scaling. Lonjakan berkelanjutan tanpa event yang sesuai mungkin mengindikasikan badai push.
Service Empty ProportionPersentase push dengan daftar layanan kosongProporsi bukan nol mungkin mengindikasikan layanan deregistrasi secara tak terduga. Periksa tab Registry Monitoring untuk memastikan jumlah provider.
Catatan

Klien Eureka menggunakan polling query daripada notifikasi berbasis push, sehingga metrik push tidak tersedia untuk aplikasi berbasis Eureka.

Tab Number of connections monitoring

Tab Number of connections monitoring melacak konektivitas klien ke engine. Gunakan untuk mendiagnosis putusnya koneksi, inkonsistensi versi, dan masalah jaringan.

MetrikApa yang diukurYang perlu diperhatikan
Number of client versionsDistribusi versi klien Nacos yang terhubung ke engineBeberapa versi lama mungkin mengindikasikan penerapan tidak konsisten. Standarisasi versi klien untuk menghindari masalah kompatibilitas.
Number of Long LinksKoneksi persisten (panjang) aktif antara klien dan enginePenurunan mungkin mengindikasikan masalah jaringan atau kegagalan di sisi klien. Bandingkan dengan tab Resource Monitoring untuk memeriksa anomali lalu lintas jaringan.
Catatan

Klien Eureka hanya mendukung koneksi singkat, sehingga metrik koneksi tidak dilaporkan untuk aplikasi berbasis Eureka.

Tab JVM Monitoring

Tab JVM Monitoring menampilkan metrik pengumpulan sampah (GC) dan memori untuk Java Virtual Machine (JVM) engine. Gunakan untuk mendiagnosis lonjakan latensi akibat tekanan GC atau kehabisan memori.

MetrikApa yang diukurYang perlu diperhatikan
Young GC TimeTotal waktu yang dihabiskan untuk pengumpulan sampah generasi mudaPeningkatan berkelanjutan berkorelasi dengan laju alokasi objek yang lebih tinggi.
Young GC TimesJumlah event GC generasi mudaGC muda yang sering adalah normal di bawah beban, tetapi peningkatan mendadak mungkin mengindikasikan kebocoran memori atau lonjakan traffic.
Full GC timeTotal waktu yang dihabiskan untuk pengumpulan sampah penuhSetiap full GC menyebabkan jeda stop-the-world. Event full GC yang sering secara langsung meningkatkan waktu respons.
Full GC TimesJumlah event full GCSetiap full GC menyebabkan jeda stop-the-world. Event full GC yang sering secara langsung meningkatkan waktu respons. Jika metrik ini konsisten tinggi, pertimbangkan untuk meningkatkan spesifikasi engine.
Heap Memory UsagePersentase penggunaan memori heapPenggunaan memori heap tinggi meningkatkan frekuensi GC dan waktu respons. Pertimbangkan untuk meningkatkan spesifikasi engine jika penggunaan tetap tinggi.

Tab Resource Monitoring

Tab Resource Monitoring menyediakan metrik tingkat infrastruktur untuk node engine. Gunakan untuk menentukan apakah masalah kinerja disebabkan oleh kendala sumber daya.

MetrikApa yang diukurYang perlu diperhatikan
Inlet flowLalu lintas jaringan masukLonjakan mendadak mungkin mengarah pada lonjakan traffic.
Outlet flowLalu lintas jaringan keluarBerkorelasi dengan push TPS. Lalu lintas keluar tinggi dengan tingkat keberhasilan push rendah mungkin mengindikasikan saturasi jaringan.
Memory UsageUtilisasi memori sistemPenggunaan tinggi yang berkelanjutan mengindikasikan engine mungkin perlu peningkatan spesifikasi.
CPU UsageUtilisasi CPUPenggunaan tinggi yang berkelanjutan mengindikasikan engine mungkin perlu peningkatan spesifikasi.
Number of nodesJumlah node saat ini dalam klusterPenurunan mengindikasikan kegagalan node.
Load IndicatorRata-rata beban sistemRata-rata beban tinggi relatif terhadap jumlah core CPU mengindikasikan engine mungkin kelebihan beban.

Tab Top N Monitoring

Tab Top N Monitoring menyoroti layanan dan konfigurasi paling aktif. Gunakan untuk mengidentifikasi hotspot yang mengonsumsi sumber daya secara tidak proporsional.

Service Top N Dashboard

MetrikApa yang diukurYang perlu diperhatikan
Number of service providers TopNLayanan dengan instans provider terbanyakJika satu layanan mendominasi, evaluasi apakah layanan tersebut perlu dipecah menjadi layanan yang lebih kecil.
Number of service subscribers TopNLayanan dengan instans subscriber terbanyakSubscriber berlebihan pada satu layanan meningkatkan overhead push.
IP Push Failure Times TopNIP klien dengan kegagalan notifikasi push terbanyakIP yang berulang mungkin mengindikasikan klien tertentu dengan masalah jaringan atau konfigurasi.

Configure TopN Dashboard

MetrikApa yang diukurYang perlu diperhatikan
Number of Configuration Changes TopNKonfigurasi dengan perubahan paling seringPerubahan sering pada satu konfigurasi mungkin mengindikasikan pipeline otomatisasi yang salah konfigurasi.
Configure the number of listeners TopNKonfigurasi dengan listener terbanyakKonfigurasi dengan listener berlebihan meningkatkan overhead push. Pertimbangkan untuk membagi konfigurasi jika memungkinkan.

Fitur lanjutan

Integrasi Managed Service for Grafana

Untuk observabilitas lanjutan, klik Using Grafana Expert Edition di pojok kanan atas untuk membuka konsol Managed Service for Grafana. Ini menyediakan dasbor Grafana multi-tenant dengan opsi visualisasi dan peringatan tambahan.

Embed Halaman Pemantauan

Untuk menyematkan tab pemantauan tertentu di dasbor atau portal eksternal, klik Open in New Window XX (di mana XX adalah nama tab) di pojok kanan atas. Ini membuka tab dalam halaman mandiri dengan URL yang dapat dibagikan.

Contohnya, di tab Registry Monitoring, klik Open in New Window Registry Monitoring untuk membuka tampilan pemantauan registri di tab browser terpisah.

Gunakan legacy dashboard

Jika dasbor Grafana belum diaktifkan, legacy dashboard menyediakan kumpulan metrik terbatas. Untuk mengakses kemampuan pemantauan lengkap, upgrade ke dasbor Grafana.

  1. Login ke Konsol MSE dan pilih wilayah di bilah navigasi atas.

  2. Di panel navigasi kiri, pilih Microservices Registry > Instances.

  3. Di halaman Instances, klik nama instans target.

  4. Di panel navigasi kiri, klik Observation Analysis.

  5. Klik tab Monitoring. Metrik berikut ditampilkan:

    MetrikApa yang diukur
    Number of servicesTotal layanan terdaftar
    Number of service providersTotal instans provider layanan
    Average response time (RT) of the service write interface (ms)Latensi tulis rata-rata dalam milidetik

Kontrol dasbor lama:

  • Rentang waktu: Jendela pemantauan default adalah 30 menit terakhir. Opsi preset meliputi Last 30 minutes, Last 1 hour, Last 6 hours, dan Last 24 hours. Rentang waktu kustom juga didukung.

  • Filtering node: Data pemantauan tiga node dalam engine ditampilkan dengan warna berbeda. Klik nama node di legenda grafik untuk menampilkan atau menyembunyikan data node tersebut. Setidaknya satu node harus tetap terlihat.

  • Granularitas data: Arahkan kursor ke titik mana pun pada grafik untuk melihat nilai metrik ketiga node pada saat tersebut, akurat hingga menit.

  • Refresh: Klik ikon Refresh di pojok kanan atas untuk memuat ulang data saat ini.