Manajemen performa aplikasi - Application Monitoring - Application Real-Time Monitoring Service

Pemantauan Aplikasi, sebuah Layanan sub dari Application Real-Time Monitoring Service (ARMS), adalah solusi application performance management (APM) yang memberikan visibilitas penuh terhadap kesehatan, kinerja, dan dependensi aplikasi Anda tanpa perubahan kode.

Setelah menginstal Agen ARMS, Pemantauan Aplikasi secara otomatis menginstrumen aplikasi Anda untuk menangkap jejak (traces), mendeteksi bottleneck, menampilkan error, dan memulihkan parameter permintaan secara real time. Baik Anda perlu mengidentifikasi kueri database yang lambat maupun melacak permintaan yang gagal di seluruh layanan terdistribusi, Pemantauan Aplikasi menyediakan data untuk mendiagnosis dan menyelesaikan masalah dengan cepat.

Cara kerja

Instal Agen ARMS — Agen meningkatkan bytecode dalam lingkungan runtime aplikasi Anda tanpa memerlukan perubahan pada kode bisnis.
Temukan dependensi secara otomatis — Agen mendeteksi layanan hulu dan hilir, middleware (MySQL, Redis, RocketMQ), serta panggilan framework (Spring Cloud, Dubbo) untuk membangun topologi aplikasi yang lengkap.
Kumpulkan metrik dan jejak — Jumlah panggilan antarmuka, waktu respons, error, dan exception secara otomatis ditangkap untuk semua framework HTTP dan RPC.
Analisis dan beri peringatan — Tinjau jejak, diagnosis kueri lambat, dapatkan analisis akar masalah dari algoritma cerdas, dan terima peringatan melalui lebih dari 50 aturan preset.

Aplikasi yang dideploy di Container Service for Kubernetes (ACK) atau pada Elastic Compute Service (ECS) dapat secara otomatis diinjeksikan ke pusat integrasi ARMS—tanpa perlu instalasi agen manual.

Kemampuan utama

Topologi aplikasi

Agen ARMS secara otomatis menemukan cara layanan Anda saling terhubung dan berinteraksi. Agen ini menangkap jejak aplikasi yang menggunakan framework RPC dan HTTP (seperti Spring Cloud dan Dubbo), lalu memvisualisasikan peta topologi yang mencakup dependensi hulu dan hilir di seluruh stack aplikasi Anda, termasuk middleware umum seperti MySQL, Redis, dan RocketMQ.

Gunakan peta topologi untuk:

Mengidentifikasi layanan hilir yang menyebabkan lonjakan latensi
Mendeteksi pola panggilan abnormal antar layanan
Memahami jalur permintaan lengkap sebelum debugging

Pemantauan antarmuka

Pemantauan Aplikasi secara otomatis menemukan dan memantau framework HTTP dan RPC dalam kode Anda. Untuk setiap antarmuka, sistem mengumpulkan empat metrik inti:

Jumlah panggilan — Volume permintaan dari waktu ke waktu
Waktu respons — Latensi per antarmuka
Jumlah error — Permintaan yang gagal
Jumlah exception — Exception yang tidak ditangani

Gabungkan pemantauan antarmuka dengan tampilan jejak untuk mengikuti satu permintaan dari awal hingga akhir dan mengisolasi antarmuka spesifik yang menyebabkan masalah kinerja.

Analisis jejak

Filter dan agregasi jejak secara real time menggunakan beberapa dimensi. Analisis jejak membantu Anda menjawab pertanyaan seperti:

Panggilan lambat mana yang melebihi ambang batas latensi tertentu, dan kapan terjadinya?
Bagaimana distribusi permintaan abnormal di berbagai mesin?
Bagaimana perubahan traffic dari pelanggan VIP dari waktu ke waktu?

Analisis SQL lambat

Untuk database relasional (MySQL, PostgreSQL) dan Database NoSQL (Redis, MongoDB), analisis SQL lambat mengidentifikasi kueri yang menurunkan kinerja transaksi. Gunakan fitur ini untuk mendeteksi transaksi lambat dan menyelidiki lebih dalam ke kueri spesifik yang menyebabkan masalah tersebut.

Insight cerdas

Saat waktu respons melonjak atau laju error meningkat tajam, insight cerdas secara otomatis menyelidiki masalah tersebut menggunakan data aplikasi historis dan algoritma cerdas. Fitur ini menyediakan:

Analisis akar masalah — Mengidentifikasi sumber kemungkinan masalah
Saran tindakan — Merekomendasikan langkah-langkah untuk menyelesaikannya
Langganan peringatan — Memberi notifikasi secara proaktif sehingga Anda dapat merespons sebelum pengguna terdampak

Profil berkelanjutan

Profil berkelanjutan mendiagnosis penggunaan CPU dan Penggunaan memori pada level metode, kelas, dan nomor baris—dengan overhead kinerja minimal. Gunakan data profil untuk:

Mengoptimalkan jalur kode hot guna mengurangi latensi
Mengidentifikasi metode yang intensif memori untuk menurunkan biaya resource
Meningkatkan throughput dengan menghilangkan operasi yang tidak efisien

Peringatan

ARMS menyediakan lebih dari 50 aturan peringatan preset yang mencakup metrik JVM, Host, dan antarmuka. Sesuaikan dan gabungkan aturan sesuai kebutuhan operasional Anda. Melalui Layanan sub Alert Management, konfigurasikan:

Konvergensi peringatan — Kurangi kebisingan dengan mengelompokkan peringatan terkait
Notifikasi — Arahkan peringatan ke tim yang tepat melalui channel pilihan Anda
Eskalasi — Secara otomatis eskalasi peringatan yang belum terselesaikan
Pemrosesan kolaboratif — Koordinasikan respons Insiden lintas tim

Integrasi OpenTelemetry dan open-source

Pemantauan Aplikasi mengikuti spesifikasi OpenTelemetry, memungkinkan korelasi jejak lintas berbagai bahasa dan tumpukan teknologi heterogen. Metrik aplikasi disimpan dalam instans Managed Service for Prometheus di bawah Akun Alibaba Cloud Anda. Dasbor Grafana default sudah tersedia langsung, dan Anda dapat membuat dasbor kustom menggunakan Prometheus Query Language (PromQL).