Halaman ini mencantumkan metrik CloudMonitor yang tersedia untuk instans set replika ApsaraDB for MongoDB. Gunakan metrik tersebut untuk mengonfigurasi aturan alert dan memantau kesehatan instans.
Sebelum memulai
Saat memanggil operasi API CloudMonitor, atur parameter berikut:
Namespace:
acs_mongodbPeriod: kelipatan bilangan bulat dari 60. Nilai default:
60. Satuan: detik.
Semua metrik memiliki Dimensions (userId, instanceId, role) dan Statistics (Maximum, Minimum, Average) yang sama.
Dimensions
Setiap metrik mendukung dimensi berikut untuk memfilter data CloudMonitor:
| Dimension | Description |
|---|---|
userId | Memfilter data untuk Akun Alibaba Cloud tertentu. |
instanceId | Memfilter data untuk instans set replika tertentu. |
role | Memfilter data berdasarkan role node. Gunakan dimensi ini untuk memantau node primary dan secondary secara terpisah. |
Metrik pemanfaatan sumber daya
| Metric in alert rules | Indicator | Unit | MetricName | Description |
|---|---|---|---|---|
| Pemanfaatan CPU | cpu_usage | % | CPUUtilization | Pantau untuk mendeteksi beban CPU tinggi yang berkelanjutan yang dapat menurunkan performa kueri. |
| Penggunaan memori | mem_usage | % | MemoryUtilization | Pantau untuk mengidentifikasi tekanan memori yang dapat menyebabkan peningkatan I/O disk atau kondisi OOM. |
| Penggunaan disk | disk_usage | % | DiskUtilization | Pantau untuk mencegah instans kehabisan disk space dan menjadi tidak tersedia. |
| Pemanfaatan IOPS | iops_usage | % | IOPSUtilization | Pantau untuk mendeteksi saat throughput disk mendekati batas yang disediakan. |
| Ukuran disk yang ditempati oleh data | data_size | Byte | DataDiskAmount | Pantau untuk melacak pertumbuhan data dan merencanakan penskalaan kapasitas. |
| Ukuran disk yang ditempati oleh instans | ins_size | Byte | InstanceDiskAmount | Pantau untuk memahami total konsumsi disk instans yang mencakup data, log, dan indeks. |
| Ukuran disk yang ditempati oleh log | log_size | Byte | LogDiskAmount | Pantau untuk mendeteksi pertumbuhan log abnormal yang disebabkan oleh error replikasi atau beban write yang tinggi. |
Metrik koneksi
| Metric in alert rules | Indicator | Unit | MetricName | Description |
|---|---|---|---|---|
| Jumlah koneksi yang digunakan | current_conn | Count | ConnectionAmount | Pantau untuk menentukan apakah batas koneksi saat ini cukup untuk workload Anda. |
| Pemanfaatan koneksi | conn_usage | % | ConnectionUtilization | Pantau untuk mendeteksi saat instans mendekati jumlah koneksi maksimumnya. |
Metrik traffic
| Metric in alert rules | Indicator | Unit | MetricName | Description |
|---|---|---|---|---|
| Lalu lintas masuk internal | bytes_in | Byte | IntranetIn | Pantau untuk melacak laju ingesti data dan mendeteksi lonjakan traffic yang tidak terduga. |
| Lalu lintas keluar internal | bytes_out | Byte | IntranetOut | Pantau untuk melacak egress data dan mengidentifikasi workload yang banyak membaca atau pola akses data panas. |
Metrik operasi
QPS adalah jumlah dari keenam jenis operasi: insert, delete, update, query, getmore, dan command.
| Metric in alert rules | Indicator | Unit | MetricName | Description |
|---|---|---|---|---|
| Kueri per detik (QPS) | insert+delete+update+query+getmore+command | Count/s | QPS | Pantau throughput keseluruhan. Lonjakan atau penurunan mendadak dapat mengindikasikan perubahan workload atau insiden. |
| Jumlah permintaan | num_requests | Count | NumberRequests | Pantau volume permintaan total untuk memahami beban kumulatif pada instans. |
| Jumlah operasi insert | insert | Count/s | OpInsert | Pantau untuk melacak beban write. Gabungkan dengan metrik update dan delete untuk menganalisis rasio baca/tulis. |
| Jumlah operasi kueri | query | Count/s | OpQuery | Pantau untuk mengidentifikasi workload yang banyak melakukan kueri yang mungkin memperoleh manfaat dari optimasi indeks. |
| Jumlah operasi update | update | Count/s | OpUpdate | Pantau bersama insert dan delete untuk memahami pola mutasi. |
| Jumlah operasi delete | delete | Count/s | OpDelete | Pantau lonjakan penghapusan yang tidak terduga yang mungkin mengindikasikan bug aplikasi atau masalah pada pipa data. |
| Jumlah operasi getMore | getmore | Count/s | OpGetmore | Pantau untuk mendeteksi workload yang banyak menggunakan cursor yang dapat menghabiskan memori pada set hasil besar. |
| Jumlah operasi command | command | Count/s | OpCommand | Pantau untuk melacak command administratif dan agregasi yang dapat memengaruhi performa keseluruhan. |
Metrik replikasi
| Metric in alert rules | Indicator | Unit | MetricName | Description |
|---|---|---|---|---|
| Replication lag | repl_lag | Seconds | ReplicationLag | Pantau untuk mendeteksi saat node secondary tertinggal dari primary. Lag tinggi dapat mengindikasikan masalah replikasi yang perlu diselidiki. |