Setelah menginstal CloudMonitor pada instance Elastic Compute Service (ECS) yang dioptimalkan untuk komputasi dengan akselerasi GPU, CloudMonitor akan mengumpulkan metrik GPU. Anda juga dapat membuat aturan peringatan untuk metrik tersebut. Jika nilai suatu metrik memenuhi kondisi tertentu, peringatan akan dipicu dan CloudMonitor akan mengirimkan notifikasi. Hal ini membantu Anda memantau status metrik secara real-time.
Prasyarat
Instance ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU telah dibuat, dan driver GPU yang diperlukan telah diinstal pada instance tersebut. Untuk informasi lebih lanjut, lihat Buat instance kontainer elastis dengan akselerasi GPU.
CatatanJika Anda menginstal agen CloudMonitor sebelum menginstal driver GPU, Anda harus memulai ulang agen CloudMonitor. Untuk informasi lebih lanjut tentang cara memulai ulang agen CloudMonitor, lihat Bagaimana cara saya memulai ulang agen CloudMonitor untuk C++?
Agen CloudMonitor telah diinstal pada instance ECS. Untuk informasi lebih lanjut, lihat Instal dan uninstall agen CloudMonitor untuk C++.
Metrik GPU
Anda dapat melihat metrik GPU berdasarkan GPU, instance, dan grup aplikasi. Tabel berikut mencantumkan metrik GPU.
Metrik | Satuan | MetricName | Dimensi |
(Agent)gpu_decoder_utilization | % | gpu_decoder_utilization | userId, instanceId, dan gpuId |
(Agent)gpu_encoder_utilization | % | gpu_encoder_utilization | userId, instanceId, dan gpuId |
(Agent)gpu_gpu_temperature | °C | gpu_gpu_temperature | userId, instanceId, dan gpuId |
(Agent)gpu_gpu_usedutilization | % | gpu_gpu_usedutilization | userId, instanceId, dan gpuId |
(Agent)gpu_memory_freespace | Byte | gpu_memory_freespace | userId, instanceId, dan gpuId |
(Agent)gpu_memory_freeutilization | % | gpu_memory_freeutilization | userId, instanceId, dan gpuId |
(Agent)gpu_memory_userdspace | Byte | gpu_memory_usedspace | userId, instanceId, dan gpuId |
(Agent)gpu_memory_usedutilization | % | gpu_memory_usedutilization | userId, instanceId, dan gpuId |
(Agent)gpu_power_readings_power_draw | W | gpu_power_readings_power_draw | userId, instanceId, dan gpuId |
Lihat data metrik GPU di konsol CloudMonitor
Masuk ke Konsol Pemantauan Cloud.
Di panel navigasi sisi kiri, pilih .
Di halaman Host Monitoring, klik nama host atau pilih Monitoring Charts di kolom Actions dari host.
Klik tab GPU Monitoring.
Di tab GPUMonitor, lihat grafik pemantauan untuk metrik GPU.
Anda dapat melihat metrik GPU dari host. Anda juga dapat mengonfigurasi aturan peringatan untuk metrik GPU tertentu dan melihat peringatan. Untuk informasi lebih lanjut, lihat Langkah 2: Buat aturan peringatan untuk host dan Langkah 3: Lihat peringatan host.