Pusat Insiden di konsol Microservices Engine (MSE) mengumpulkan data peristiwa yang dihasilkan oleh Microservices Registry, Microservices Governance, dan gateway berbasis cloud-native. Anda dapat melihat perubahan peristiwa dari semua sumber daya yang dikelola di MSE serta menyelesaikan masalah berdasarkan peristiwa abnormal. Topik ini menjelaskan peristiwa yang mungkin terjadi di MSE dan memberikan saran penanganan untuk setiap peristiwa.
Peristiwa Nacos
Kode Peristiwa | Nama Peristiwa | Tingkat Keparahan Peristiwa | Nama Peristiwa CloudMonitor | Deskripsi dan Dampak Peristiwa | Saran Penanganan Peristiwa |
Nacos:TPSRateLimit | Pembatasan TPS Klien Nacos | Warning | Nacos:TPSRateLimit:Normal | Ketika klien mengakses mesin Nacos, transaksi per detik (TPS) terlalu tinggi. Untuk memastikan operasi stabil mesin Nacos, sistem akan segera melakukan pembatasan pada permintaan. Dalam hal ini, instance Nacos berada dalam mode pemantauan. Ketika ambang batas TPS tercapai, permintaan berikutnya masih diizinkan. | Tingkatkan konfigurasi instance atau tambahkan node, dan periksa apakah TPS tinggi disebabkan oleh penggunaan yang salah. Misalnya, operasi API Nacos dipanggil secara berulang atau klien Nacos dibuat beberapa kali. |
Kritis | Nacos:TPSRateLimit:Executing | Ketika klien mengakses mesin Nacos, TPS terlalu tinggi. Untuk memastikan operasi stabil mesin Nacos, sistem melakukan pembatasan pada permintaan. Ketika ambang batas TPS tercapai, permintaan berikutnya ditolak. | Tingkatkan konfigurasi instance atau tambahkan node, dan periksa apakah TPS tinggi disebabkan oleh penggunaan yang salah. Misalnya, operasi API Nacos dipanggil secara berulang atau klien Nacos dibuat beberapa kali. | ||
Nacos:ConfigCapLimit | Pembatasan Konfigurasi Nacos | Peringatan | Nacos:ConfigCapLimit:Normal | Jumlah konfigurasi dalam instance Nacos melebihi batas atas default 10.000. Sistem akan segera melakukan pembatasan pada konfigurasi baru. Dalam hal ini, instance Nacos berada dalam mode pemantauan. Konfigurasi baru masih dapat dibuat dan dirilis. | Hapus konfigurasi yang tidak digunakan sesegera mungkin dan periksa apakah sejumlah besar konfigurasi dirilis secara otomatis oleh aplikasi. |
Kritis | Nacos:ConfigCapLimit:Executing | Jumlah konfigurasi default dalam instance Nacos melebihi 10.000, dan sistem tidak lagi mengizinkan pengguna untuk membuat konfigurasi. Akibatnya, konfigurasi baru tidak dapat dirilis. | Hapus konfigurasi yang tidak digunakan sesegera mungkin dan periksa apakah sejumlah besar konfigurasi dirilis secara otomatis oleh aplikasi. | ||
Nacos:ServiceCapLimit | Pembatasan Layanan Nacos | Peringatan | Nacos:ServiceCapLimit:Normal | Sejumlah besar layanan terdaftar, dan batas penyimpanan atas telah tercapai. Untuk memastikan operasi stabil mesin Nacos, sistem akan segera melakukan pembatasan pada pendaftaran layanan. Dalam hal ini, instance Nacos berada dalam mode pemantauan. Layanan baru atau penyedia layanan masih dapat didaftarkan dengan instance Nacos. | Tingkatkan konfigurasi instance atau tambahkan node, dan periksa apakah publikasi layanan tidak valid terjadi, publikasi layanan berulang terjadi, atau klien Nacos dibuat beberapa kali. |
Kritis | Nacos:ServiceCapLimit:Executing | Sejumlah besar layanan terdaftar, dan batas penyimpanan atas telah tercapai. Untuk memastikan operasi stabil mesin Nacos, sistem tidak lagi mengizinkan pendaftaran layanan. Akibatnya, layanan baru atau penyedia layanan tidak dapat didaftarkan dengan mesin Nacos. | Tingkatkan konfigurasi instance atau tambahkan node, dan periksa apakah publikasi layanan tidak valid terjadi, publikasi layanan berulang terjadi, atau klien Nacos dibuat beberapa kali. | ||
Nacos:ConnectionCapLimit | Pembatasan Koneksi Nacos | Peringatan | Nacos:ConnectionCapLimit:Normal | Jumlah klien yang terhubung ke mesin Nacos mencapai batas atas instance. Untuk memastikan operasi stabil mesin Nacos, sistem akan segera melakukan pembatasan pada koneksi baru. Dalam hal ini, instance Nacos berada dalam mode pemantauan. Klien Nacos baru masih dapat terhubung ke mesin Nacos. | Tingkatkan konfigurasi instance atau tambahkan node, dan periksa apakah penggunaan yang salah ada. Misalnya, klien Nacos dibuat beberapa kali, atau kebocoran koneksi terjadi karena klien Nacos diaktifkan. |
Kritis | Nacos:ConnectionCapLimit:Executing | Jumlah klien yang terhubung ke mesin Nacos mencapai batas atas instance. Untuk memastikan operasi stabil mesin Nacos, sistem tidak lagi mengizinkan pembentukan koneksi baru. Akibatnya, klien Nacos baru tidak dapat terhubung ke mesin Nacos. | Tingkatkan konfigurasi instance atau tambahkan node, dan periksa apakah penggunaan yang salah ada. Misalnya, klien Nacos dibuat beberapa kali, atau kebocoran koneksi terjadi karena klien Nacos diaktifkan. | ||
Nacos:ParametersIllegalDenied | Parameter Permintaan Tidak Valid untuk Instance Nacos | Peringatan | Nacos:ParametersIllegalDenied:Normal | Parameter permintaan yang dikirim oleh klien ke instance Nacos tidak valid. Server akan segera menolak parameter yang tidak valid. Dalam hal ini, instance Nacos berada dalam mode pemantauan. Hasil normal masih dapat dikembalikan. | Periksa apakah parameter permintaan klien valid. |
Kritis | Nacos:ParametersIllegalDenied:Executing | Parameter permintaan yang dikirim oleh klien ke instance Nacos tidak valid. Server menolak parameter yang tidak valid dan mengembalikan kode kesalahan. | Periksa apakah parameter permintaan klien valid. | ||
Nacos:CPUAlert | Beban CPU Terlalu Tinggi di Instance Nacos | Warning | Nacos:CPUAlert:Executing | Beban CPU instance Nacos terlalu tinggi dan instance tersebut kelebihan beban. Hal ini dapat menyebabkan respons lambat atau bahkan tidak ada respons terhadap permintaan berikutnya. | Tingkatkan konfigurasi instance atau tambahkan node instance, dan periksa apakah beban CPU tinggi disebabkan oleh penggunaan instance yang tidak tepat. |
Nacos:MemoryAlert | Penggunaan Memori Terlalu Tinggi di Instance Nacos | Warning | Nacos:MemoryAlert:Executing | Penggunaan memori instance Nacos terlalu tinggi, yang dapat menyebabkan out of memory (OOM) killer berjalan. Hal ini dapat menyebabkan node instance Nacos restart. | Tingkatkan konfigurasi instance. |
Nacos:FullGc | Full GCs Instance Nacos | Warning | Nacos:FullGc:Executing | Kapasitas instance Nacos menjadi tidak mencukupi karena seringnya full garbage collections (GCs). Hal ini dapat menyebabkan respons lambat atau bahkan tidak ada respons terhadap permintaan berikutnya. | Tingkatkan konfigurasi instance atau tambahkan node instance, dan periksa apakah kapasitas tidak mencukupi karena penggunaan instance yang tidak tepat. |
Nacos:TooManyConfigAlert | Konfigurasi Berlebihan untuk Instance Nacos | Warning | Nacos:TooManyConfigAlert | Jumlah konfigurasi yang Anda coba buat untuk instance Nacos melebihi 10.000. Konfigurasi tambahan tidak dapat dibuat. Konfigurasi baru mungkin gagal dirilis. | Hapus konfigurasi yang tidak diperlukan. |
Nacos:TooManyConfigLongPolling | Polling Panjang Berlebihan Dikonfigurasikan untuk Instance Nacos | Warning | Nacos:TooManyConfigLongPolling | Jumlah pendengar yang dikonfigurasikan untuk instance Nacos terlalu besar, yang mengakibatkan masalah overload. Full GCs mungkin sering dipicu, yang dapat menyebabkan respons lambat atau bahkan tidak ada respons terhadap permintaan berikutnya. | Tingkatkan konfigurasi instance atau tambahkan node instance, dan periksa apakah kapasitas tidak mencukupi karena penggunaan instance yang tidak tepat. |
Nacos:ProviderDropTooFast | Penurunan Mendadak Penyedia Layanan pada Instance Nacos | Warning | Nacos:ProviderDropTooFast:Executing | Jumlah penyedia layanan yang terdaftar dengan instance Nacos saat ini berkurang lebih dari 50% dibandingkan 3 menit yang lalu. Ketika peristiwa ini dihasilkan, layanan upstream mungkin gagal mengidentifikasi penyedia layanan downstream. | Periksa apakah sejumlah besar aplikasi gagal atau terjadi kegagalan jaringan. Jika peristiwa dihasilkan karena rilis yang diharapkan dari sejumlah besar aplikasi, Anda dapat mengabaikan peristiwa tersebut. |
Peristiwa Zookeeper
Kode Peristiwa | Nama Peristiwa | Tingkat Keparahan Peristiwa | Nama Peristiwa CloudMonitor | Deskripsi dan Dampak Peristiwa | Saran Penanganan Peristiwa |
ZooKeeper:ExceedEphemeralLimit | Node Ephemeral yang Dibuat oleh Sesi Tunggal di ZooKeeper Melebihi Batas (Batas = 2000) | Critical | ZooKeeper:ExceedEphemeralLimit | Jumlah node ephemeral yang dibuat oleh sesi tunggal terlalu besar. Hal ini dapat menyebabkan kegagalan menambahkan node ephemeral ke sesi. |
|
ZooKeeper:FullGc | Full GCs Instance ZooKeeper | Warning | ZooKeeper:CMSGc:Executing | Full GCs memakan waktu lama. Hal ini dapat meningkatkan latensi pemrosesan dan menyebabkan timeout respons. Akibatnya, node instance ZooKeeper pulih dari kegagalan dan restart. |
|
ZooKeeper:CPUAlert | Beban CPU Terlalu Tinggi di Instance ZooKeeper | Warning | ZooKeeper:CPUAlert:Executing | Beban CPU terlalu tinggi. Hal ini dapat meningkatkan latensi pemrosesan dan menyebabkan timeout respons. Akibatnya, node instance ZooKeeper pulih dari kegagalan dan restart. | Peristiwa ini dihasilkan karena kapasitas tidak mencukupi. Jika peristiwa ini berlanjut, kami sarankan Anda menambahkan node ke instance. |
Peristiwa Gateway Berbasis Cloud-Native
Kode Peristiwa | Nama Peristiwa | Tingkat Keparahan Peristiwa | Nama Peristiwa CloudMonitor | Deskripsi dan Dampak Peristiwa | Saran Penanganan Peristiwa |
Gateway:ElasticScaleOut | Penskalaan Elastis Keluar Gateway Berbasis Cloud-Native | Warning | Gateway:ElasticScaleOut:Failed | Ketika operasi penskalaan elastis keluar dilakukan pada gateway berbasis cloud-native, gateway berbasis cloud-native menghasilkan peristiwa ini berdasarkan status penskalaan keluar. | Tangani peristiwa berdasarkan detail peristiwa di konsol. |
Info | Gateway:ElasticScaleOut:Executing | Catat informasi peristiwa jika diperlukan. | |||
Info | Gateway:ElasticScaleOut:Executed | Catat informasi peristiwa jika diperlukan. | |||
Gateway:ElasticScaleIn | Penskalaan Elastis Masuk Gateway Berbasis Cloud-Native | Warning | Gateway:ElasticScaleIn:Failed | Ketika operasi penskalaan elastis masuk dilakukan pada gateway berbasis cloud-native, gateway berbasis cloud-native menghasilkan peristiwa ini berdasarkan status penskalaan masuk. | Tangani peristiwa berdasarkan detail peristiwa di konsol. |
Info | Gateway:ElasticScaleIn:Executing | Catat informasi peristiwa jika diperlukan. | |||
Info | Gateway:ElasticScaleIn:Executed | Catat informasi peristiwa jika diperlukan. | |||
Gateway:ElasticOpen | Aktifkan Penskalaan Elastis Keluar Gateway Berbasis Cloud-Native | Warning | Gateway:ElasticOpen:Failed | Ketika Anda mencoba mengaktifkan penskalaan elastis keluar, gateway berbasis cloud-native menghasilkan peristiwa ini berdasarkan hasil pengaktifan. | Tangani peristiwa berdasarkan detail peristiwa di konsol. |
Info | Gateway:ElasticOpen:Executed | Catat informasi peristiwa jika diperlukan. | |||
Gateway:ElasticClose | Nonaktifkan Penskalaan Elastis Keluar Gateway Berbasis Cloud-Native | Warning | Gateway:ElasticClose:Failed | Ketika Anda mencoba menonaktifkan penskalaan elastis keluar, gateway berbasis cloud-native menghasilkan peristiwa ini berdasarkan hasil penonaktifan. | Tangani peristiwa berdasarkan detail peristiwa di konsol. |
Info | Gateway:ElasticClose:Executed | Catat informasi acara jika diperlukan. | |||
Gateway:ElasticStrategyUpdate | Pembaruan Kebijakan Elastisitas Gateway Berbasis Cloud-Native | Warning | Gateway:ElasticStrategyUpdate:Failed | Ketika penskalaan elastis keluar diaktifkan, gateway berbasis cloud-native memperbarui kebijakan penskalaan elastis keluar dan menghasilkan peristiwa ini berdasarkan hasil pembaruan. | Tangani peristiwa berdasarkan detail peristiwa di konsol. |
Info | Gateway:ElasticStrategyUpdate:Executed | Catat informasi peristiwa jika diperlukan. |
Tata Kelola Layanan Mikro
Kode Peristiwa | Nama Peristiwa | Tingkat Keparahan Peristiwa | Nama Peristiwa CloudMonitor | Deskripsi dan Dampak Peristiwa | Saran Penanganan Peristiwa |
Governance:FlowTrafficBlock | Aturan Pembatasan Dipicu untuk Aplikasi | Warning | Governance:FlowTrafficBlock:Executing | Peristiwa ini dihasilkan ketika aturan pembatasan antarmuka yang dikonfigurasikan untuk aplikasi yang diaktifkan dengan Tata Kelola Layanan Mikro dipicu. | Trafik burst terjadi pada antarmuka. Kami sarankan Anda terus memantau trafik. |
Governance:CircleBreakerTrafficBlock | Aturan Pemutusan Sirkuit Dipicu untuk Aplikasi | Warning | Governance:CircleBreakerTrafficBlock:Executing | Peristiwa ini dihasilkan ketika aturan pemutusan sirkuit yang dikonfigurasikan untuk aplikasi yang diaktifkan dengan Tata Kelola Layanan Mikro dipicu. | Jika performa antarmuka downstream tidak stabil, seperti panggilan lambat dan layanan abnormal, kami sarankan Anda memeriksa dependensi antarmuka downstream. |
Governance:ParamsTrafficBlock | Aturan Perlindungan Parameter Hotspot Dipicu untuk Aplikasi | Warning | Governance:ParamsTrafficBlock:Executing | Peristiwa ini dihasilkan ketika aturan perlindungan parameter hotspot yang dikonfigurasikan untuk aplikasi yang diaktifkan dengan Tata Kelola Layanan Mikro dipicu. | Jika parameter hotspot dipanggil, kami sarankan Anda melakukan pra-pengambilan data yang relevan. |
Governance:GracefulShutdown | Penutupan Anggun Layanan Mikro | Info | Governance:GracefulShutdown | Peristiwa ini dihasilkan ketika aplikasi layanan mikro ditutup dengan anggun. Setelah Tata Kelola Layanan Mikro diaktifkan untuk aplikasi, fitur penutupan anggun secara otomatis diaktifkan. | Catat informasi peristiwa jika diperlukan. |
Governance:RegistrationFinish | Pendaftaran Layanan Mikro Selesai | Info | Governance:RegistrationFinish | Peristiwa ini dihasilkan ketika aplikasi layanan mikro didaftarkan dan dimulai setelah fitur startup anggun diaktifkan. | Catat informasi peristiwa jika diperlukan. |
Governance:WarmupStart | Pra-pengambilan Layanan Mikro Dimulai | Info | Governance:WarmupStart | Peristiwa ini dihasilkan ketika instance baru dari aplikasi yang diaktifkan dengan Tata Kelola Layanan Mikro mulai pra-pengambilan trafik setelah fitur startup anggun diaktifkan. | Catat informasi peristiwa jika diperlukan. |
Governance:WarmupEnd | Pra-pengambilan Layanan Mikro Selesai | Info | Governance:WarmupEnd | Peristiwa ini dihasilkan ketika trafik dari instance baru aplikasi yang diaktifkan dengan Tata Kelola Layanan Mikro sepenuhnya di-pra-pengambilan setelah fitur startup anggun diaktifkan. | Catat informasi peristiwa jika diperlukan. |
Governance:ReadinessFinish | Aplikasi Layanan Mikro Lulus Pemeriksaan Kesiapan Kubernetes | Info | Governance:ReadinessFinish | Peristiwa ini dihasilkan ketika pemeriksaan kesiapan Kubernetes selesai untuk aplikasi yang diaktifkan dengan Tata Kelola Layanan Mikro setelah fitur startup anggun diaktifkan. | Catat informasi peristiwa jika diperlukan. |
Governance:GracefulShutdown | Nonaktifkan Layanan Mikro Secara Manual | Info | Governance:GracefulShutdown | Peristiwa ini dihasilkan ketika instance aplikasi dimatikan secara manual di halaman Detail Node Tata Kelola Layanan Mikro dan operasi tersebut berlaku. | Catat informasi peristiwa jika diperlukan. |
Governance:RegistrationFinish | Aktifkan Layanan Mikro Secara Manual | Info | Governance:RegistrationFinish | Peristiwa ini dihasilkan ketika instance aplikasi diaktifkan secara manual di halaman Detail Node Tata Kelola Layanan Mikro dan operasi tersebut berlaku. | Catat informasi peristiwa jika diperlukan. |
Governance:ApplicationStop | Penutupan Aplikasi Layanan Mikro | Info | Governance:ApplicationStop | Peristiwa ini dihasilkan ketika proses penutupan anggun sepenuhnya dilakukan pada aplikasi yang diaktifkan dengan Tata Kelola Layanan Mikro setelah fitur penutupan anggun diaktifkan dan sebelum aplikasi berhenti. | Catat informasi peristiwa jika diperlukan. |