Anda dapat memantau status dan beban kuota sumber daya melalui berbagai metrik serta mengonfigurasi aturan peringatan dan notifikasi yang fleksibel untuk melacak penggunaan sumber daya secara real time. Ketika suatu metrik, seperti utilisasi CPU, melebihi ambang batas tertentu, sistem akan mengirimkan pemberitahuan peringatan. Artikel ini menjelaskan cara menggunakan CloudMonitor dan ARMS untuk melihat data pemantauan, mengonfigurasi pemberitahuan peringatan, dan berlangganan metrik.
Prasyarat
Untuk memantau kuota sumber daya atau membuat peringatan terkait kuota tersebut, Anda harus terlebih dahulu membuat kuota tersebut. Untuk informasi selengkapnya, lihat Pengenalan kuota sumber daya.
Metrik
PAI-Quota menyediakan metrik kinerja utama untuk sumber daya GPU, CPU, memori, disk, dan jaringan. Anda dapat melihat metrik ini berdasarkan kuota atau berdasarkan node. Untuk daftar lengkap dan deskripsi detail semua metrik, lihat metrik PAI-Quota.
Berdasarkan kuota
Metric | Description |
GPU compute utilization (by quota) | Utilisasi komputasi GPU untuk kuota sumber daya yang ditentukan. |
GPU memory utilization (by quota) | Utilisasi memori GPU untuk kuota sumber daya yang ditentukan. |
Scheduled GPUs (by quota) | Jumlah GPU yang dijadwalkan untuk kuota sumber daya yang ditentukan. |
Total GPUs (by quota) | Jumlah total GPU untuk kuota sumber daya yang ditentukan. |
GPU power consumption (by quota) | Konsumsi daya GPU untuk kuota sumber daya yang ditentukan. |
Scheduled CPU cores (by quota) | Jumlah core CPU yang dijadwalkan untuk kuota sumber daya yang ditentukan. |
Total CPU cores (by quota) | Jumlah total core CPU untuk kuota sumber daya yang ditentukan. |
CPU utilization (by quota) | Utilisasi CPU untuk kuota sumber daya yang ditentukan. |
Memory usage (by quota) | Penggunaan memori untuk kuota sumber daya yang ditentukan. |
Untuk metrik lainnya, lihat metrik PAI-Quota. | |
Berdasarkan node
Metric | Description |
GPU compute utilization (by node) | Utilisasi komputasi GPU untuk node yang ditentukan. |
GPU memory utilization (by node) | Utilisasi memori GPU untuk node yang ditentukan. |
Scheduled GPUs (by node) | Jumlah GPU yang dijadwalkan untuk node yang ditentukan. |
Total GPUs (by node) | Jumlah total GPU untuk node yang ditentukan. |
GPU power consumption (by node) | Konsumsi daya GPU untuk node yang ditentukan. |
Scheduled CPU cores (by node) | Jumlah core CPU yang dijadwalkan untuk node yang ditentukan. |
Total CPU cores (by node) | Jumlah total core CPU untuk node yang ditentukan. |
CPU utilization (by node) | Utilisasi CPU untuk node yang ditentukan. |
Memory usage (by node) | Penggunaan memori untuk node yang ditentukan. |
Untuk metrik lainnya, lihat metrik PAI-Quota. | |
Lihat dasbor pemantauan
Login ke Konsol PAI. Pada halaman detail kuota sumber daya, klik tab Monitoring untuk melihat informasi pemantauannya.

Halaman pemantauan menampilkan metrik berdasarkan kuota dan berdasarkan node, mencakup penggunaan GPU, CPU, memori, jaringan, dan disk. (Catatan: Data pemantauan disimpan selama 30 hari.)
Klik More untuk memilih metrik utama sesuai kebutuhan bisnis Anda. Anda dapat menyeret dan meletakkan metrik untuk mengubah urutannya, sehingga dapat fokus pada data inti dan membuat perbandingan yang dipersonalisasi.
Grafik pemantauan memungkinkan Anda memperbesar area yang dipilih, membatalkan tindakan zoom terakhir, mengatur ulang tampilan ke kondisi awal, serta mengunduh data grafik.

Sinkronisasi Grafik: Jika diaktifkan, zoom akan disinkronkan di semua grafik, sehingga memudahkan perbandingan antar beberapa tampilan.

Anda dapat menyesuaikan jumlah grafik yang ditampilkan per baris.
Gunakan CloudMonitor
CloudMonitor adalah layanan yang memantau resource Alibaba Cloud dan aplikasi internet. Layanan ini menyediakan solusi pemantauan siap pakai dan terpadu bagi perusahaan. Anda dapat login ke Konsol CloudMonitor untuk melihat data pemantauan PAI-Quota dan mengatur pemberitahuan peringatan. CloudMonitor juga menyediakan API yang memungkinkan Anda berlangganan data metrik serta membangun sistem dan dasbor pemantauan sendiri. Untuk informasi selengkapnya, lihat Apa itu CloudMonitor?.
Penagihan
Penggunaan CloudMonitor dapat dikenai biaya. Untuk informasi penagihan selengkapnya, lihat penagihan CloudMonitor.
Lihat data pemantauan
-
Login ke Konsol Cloud Monitor.
-
Di panel navigasi sebelah kiri, pilih .
Pada halaman Cloud Service Monitoring, pilih PAI-Quota. Di kotak pencarian, pilih atau masukkan nama kuota sumber daya. Grafik pemantauan yang sesuai akan ditampilkan di bawah.
Anda dapat melakukan operasi berikut pada grafik pemantauan:
Alihkan dimensi pemantauan: Anda dapat melihat metrik berdasarkan kuota dan berdasarkan node.

Ubah rentang waktu:

Perbesar: Klik ikon zoom
di pojok kanan atas grafik untuk melihat tampilan detail data pemantauannya.
Konfigurasi aturan peringatan
Gunakan fitur peringatan untuk memantau penggunaan sumber daya dalam kuota sumber daya Anda dan mengonfigurasi aturan peringatan yang fleksibel. Jika penggunaan sumber daya berfluktuasi dan melebihi ambang batas yang dikonfigurasi, sistem akan mengirimkan pemberitahuan peringatan. Ikuti langkah-langkah berikut untuk mengonfigurasi pemberitahuan peringatan di Konsol CloudMonitor:
Langkah 1: Konfigurasi kontak peringatan
-
Login ke Konsol Cloud Monitor.
-
Di panel navigasi sebelah kiri, pilih .
Pada tab Alert Contacts, klik Create Alert Contact, masukkan nama kontak, nomor telepon, alamat email, atau URL webhook, lalu klik OK.
Pada tab Alert Contact Group, klik Create Alert Contact Group, masukkan nama grup dan tambahkan kontak peringatan yang sudah ada ke dalam grup tersebut, lalu klik OK.
Langkah 2: Konfigurasi aturan peringatan
-
Di panel navigasi sebelah kiri Konsol CloudMonitor, pilih Cloud Service Monitoring.
Pada halaman Cloud Service Monitoring, cari dan buka PAI-Quota.

Pada halaman PAI-Quota, pilih wilayah tempat layanan Anda berada, lalu klik Create Alert Rule.
Pada panel Create Alert Rule, konfigurasi parameter berikut lalu klik OK.
Parameter
Description
Product
Nama layanan yang dikelola oleh CloudMonitor. Pilih PAI-Quota.
Resource scope
Cakupan aturan peringatan. Opsi yang tersedia: All Resources, Application Group, dan Instances.
All Resources: Peringatan dikirim jika ada resource apa pun yang memenuhi kondisi aturan.
Instances: Pilih kuota sumber daya spesifik (Associated Resources) yang akan diterapkan aturan ini. Peringatan hanya dipicu ketika satu atau beberapa instans yang dipilih memenuhi kondisi peringatan.
Rule description
Kondisi yang memicu peringatan. Peringatan dikirim saat data pemantauan memenuhi kondisi ini. Untuk informasi tentang cara mengonfigurasi aturan peringatan, lihat Buat aturan peringatan.
Mute for
Interval pengiriman ulang notifikasi untuk peringatan yang belum terselesaikan.
Effective period
Periode waktu saat aturan peringatan aktif. Sistem hanya memeriksa data pemantauan untuk kondisi peringatan selama periode ini.
Alert contact group
Grup kontak yang menerima notifikasi peringatan. Pilih grup yang telah memiliki kontak peringatan yang ditetapkan.
Tag
Pasangan kunci-nilai yang digunakan untuk memberi tag aturan peringatan.
Pada halaman PAI-Quota, klik View Alert Rules untuk melihat detail aturan peringatan yang telah dibuat, riwayat peringatan, serta mengubah aturan.
Anda juga dapat menggunakan operasi API untuk mengonfigurasi pemberitahuan peringatan. Operasi ini memungkinkan Anda melihat riwayat peringatan, mengelola templat peringatan, serta mengonfigurasi aturan dan kontak peringatan. Untuk informasi selengkapnya, lihat Referensi API CloudMonitor: Peringatan.
Berlangganan metrik
CloudMonitor menyediakan layanan API komprehensif yang memungkinkan Anda berlangganan metrik kuota sumber daya. Anda dapat menggunakan layanan ini untuk membangun sistem dan dasbor pemantauan sendiri. Untuk informasi selengkapnya, lihat Referensi API Pemantauan Layanan Cloud.
|
CloudMonitor API |
Overview |
|
Menanyakan data pemantauan terbaru dari suatu metrik. |
|
|
Menanyakan data pemantauan suatu metrik untuk layanan cloud. |
|
|
Menanyakan data pemantauan suatu metrik untuk layanan cloud. |
|
|
Menanyakan detail metrik yang tersedia di CloudMonitor. |
|
|
Menanyakan layanan cloud yang mendukung metrik deret waktu di CloudMonitor. |
|
|
Menanyakan data pemantauan terbaru suatu metrik untuk layanan cloud, diurutkan berdasarkan nilai. |
Contoh berikut menunjukkan cara menggunakan operasi API DescribeMetricList untuk menanyakan data metrik.
Buka halaman metrik PAI-Quota.
Pada baris metrik target, pilih Actions > Get Metric Data.

Di OpenAPI Explorer, konfigurasi parameter kunci berikut dan biarkan parameter lainnya pada pengaturan default. Untuk informasi lebih lanjut tentang parameter, lihat DescribeMetricList.
Parameter
Description
Namespace
Tetapkan nilai ini ke
acs_pai_quota.MetricName
Nama metrik yang akan ditanyakan. Contohnya,
QUOTA_CPU_REQUEST.StartTime
Awal rentang waktu untuk kueri. Contohnya, 2024-05-15 00:00:00.
EndTime
Akhir rentang waktu untuk kueri. Contohnya, 2024-05-28 00:00:00.
CatatanRentang waktu antara StartTime dan EndTime tidak boleh melebihi 31 hari.
Setelah mengonfigurasi parameter, klik Initiate Call untuk melihat data metrik dalam rentang waktu yang ditentukan.
Gunakan ARMS
Application Real-Time Monitoring Service (ARMS) adalah platform observabilitas native Alibaba Cloud. Dengan ARMS, Anda dapat membuat dasbor Grafana kustom untuk PAI-Quota dan mengonfigurasi aturan peringatan Prometheus untuk memantau data metriknya. Untuk informasi selengkapnya, lihat Apa itu ARMS?.
Penagihan
Penggunaan ARMS dapat dikenai biaya. Untuk informasi penagihan selengkapnya, lihat penagihan ARMS.
Integrasikan data pemantauan
Ikuti langkah-langkah berikut:
-
Login ke Konsol ARMS.
Di panel navigasi sebelah kiri, klik Integration Center.
Pada halaman Integration Center, klik tab Artificial Intelligence di sebelah kiri, lalu klik Alibaba Cloud PAI-Quota Service.

(Opsional) Pada panel yang muncul, Anda dapat melihat pratinjau dasbor pemantauan serta meninjau metrik yang dikumpulkan dan templat aturan peringatan.
Preview
Klik tab Preview untuk melihat dasbor metrik.

Collect metrics
Klik tab Collect Metrics untuk melihat daftar metrik yang dikumpulkan.

Alert rule template
Klik tab Alert Rule Template untuk melihat templat aturan peringatan yang telah ditentukan.

Pada tab Start integration, konfigurasi parameter berikut lalu klik OK.
Parameter
Description
Select region for data storage
Pilih wilayah tempat Anda ingin menyimpan data.
Integration name
Konfigurasikan nama integrasi untuk layanan sesuai petunjuk di konsol.
Integrasi data pemantauan PAI-Quota memerlukan waktu sekitar 1 hingga 2 menit.
Setelah integrasi selesai, Anda dapat mengklik Integration Management untuk melihat detail lingkungan yang telah diintegrasikan.
Lihat dasbor Grafana
Login ke Konsol ARMS. Di panel navigasi sebelah kiri, pilih Integration Management. Pada tab Integrated Environments > Cloud Service Environment, klik nama lingkungan tersebut.
Pada tab Component Management, klik Dashboard di bagian Addon Type untuk melihat dasbor Grafana bawaan.

Klik nama dasbor untuk melihat dasbor pemantauan.

Konfigurasi Prometheus alerts
Anda dapat mengonfigurasi peringatan pemantauan menggunakan Prometheus. Ikuti langkah-langkah berikut:
Login ke Konsol ARMS. Di panel navigasi sebelah kiri, pilih Integration Management. Pada tab Integrated Environments > Cloud Service Environment, klik nama lingkungan tersebut.
Pada halaman Component Management, klik Alert Rule di bagian Addon Type untuk melihat aturan peringatan bawaan.

Aturan peringatan bawaan menghasilkan event peringatan tetapi tidak mengirimkan notifikasi. Anda dapat mengonfigurasi notifikasi agar dikirim ke email atau platform lain dengan salah satu dari dua metode berikut:
Konfigurasikan kebijakan notifikasi untuk menentukan aturan pencocokan event peringatan. Saat aturan dipicu, sistem akan mengirimkan peringatan ke kontak yang ditentukan menggunakan metode pilihan Anda. Untuk informasi selengkapnya, lihat Kebijakan notifikasi.
Edit aturan peringatan untuk mengonfigurasi metode notifikasinya.

Pada halaman pengeditan aturan peringatan Prometheus, Anda juga dapat menyesuaikan kondisi peringatan, durasi, konten, dan notifikasi. Untuk informasi konfigurasi detail, lihat Buat aturan peringatan Prometheus.