全部产品
Search
文档中心

Cloud Monitor:Pemantauan GPU

更新时间:Jul 06, 2025

Setelah menginstal CloudMonitor pada instance Elastic Compute Service (ECS) yang dioptimalkan untuk komputasi dengan akselerasi GPU, CloudMonitor akan mengumpulkan metrik GPU. Anda juga dapat membuat aturan peringatan untuk metrik tersebut. Jika nilai suatu metrik memenuhi kondisi tertentu, peringatan akan dipicu dan CloudMonitor akan mengirimkan notifikasi. Hal ini membantu Anda memantau status metrik secara real-time.

Prasyarat

Metrik GPU

Anda dapat melihat metrik GPU berdasarkan GPU, instance, dan grup aplikasi. Tabel berikut mencantumkan metrik GPU.

Metrik

Satuan

MetricName

Dimensi

(Agent)gpu_decoder_utilization

%

gpu_decoder_utilization

userId, instanceId, dan gpuId

(Agent)gpu_encoder_utilization

%

gpu_encoder_utilization

userId, instanceId, dan gpuId

(Agent)gpu_gpu_temperature

°C

gpu_gpu_temperature

userId, instanceId, dan gpuId

(Agent)gpu_gpu_usedutilization

%

gpu_gpu_usedutilization

userId, instanceId, dan gpuId

(Agent)gpu_memory_freespace

Byte

gpu_memory_freespace

userId, instanceId, dan gpuId

(Agent)gpu_memory_freeutilization

%

gpu_memory_freeutilization

userId, instanceId, dan gpuId

(Agent)gpu_memory_userdspace

Byte

gpu_memory_usedspace

userId, instanceId, dan gpuId

(Agent)gpu_memory_usedutilization

%

gpu_memory_usedutilization

userId, instanceId, dan gpuId

(Agent)gpu_power_readings_power_draw

W

gpu_power_readings_power_draw

userId, instanceId, dan gpuId

Lihat data metrik GPU di konsol CloudMonitor

  1. Masuk ke Konsol Pemantauan Cloud.

  2. Di panel navigasi sisi kiri, pilih Cloud Resource Monitoring > Host Monitoring.

  3. Di halaman Host Monitoring, klik nama host atau pilih Monitoring Charts di kolom Actions dari host.

  4. Klik tab GPU Monitoring.

    Di tab GPUMonitor, lihat grafik pemantauan untuk metrik GPU.

    Anda dapat melihat metrik GPU dari host. Anda juga dapat mengonfigurasi aturan peringatan untuk metrik GPU tertentu dan melihat peringatan. Untuk informasi lebih lanjut, lihat Langkah 2: Buat aturan peringatan untuk host dan Langkah 3: Lihat peringatan host.

Referensi