全部产品
Search
文档中心

云监控:GPU监控

更新时间:Apr 21, 2023

本文为您介绍如何通过云监控控制台和API查询GPU监控数据。

前提条件

GPU监控项说明

您可以从GPU、实例和应用分组维度查看GPU相关监控项。GPU的监控项如下表所示。
监控项单位MetricNameDimensions
(Agent)GPU维度解码器使用率%gpu_decoder_utilizationuserId、instanceId、gpuId
(Agent)GPU维度编码器使用率%gpu_encoder_utilizationuserId、instanceId、gpuId
(Agent)GPU维度GPU温度gpu_gpu_temperatureuserId、instanceId、gpuId
(Agent)GPU维度GPU使用率%gpu_gpu_usedutilizationuserId、instanceId、gpuId
(Agent)GPU维度显存空闲量Bytegpu_memory_freespaceuserId、instanceId、gpuId
(Agent)GPU维度显存空闲率%gpu_memory_freeutilizationuserId、instanceId、gpuId
(Agent)GPU维度显存使用量Bytegpu_memory_userdspaceuserId、instanceId、gpuId
(Agent)GPU维度显存使用率%gpu_memory_usedutilizationuserId、instanceId、gpuId
(Agent)GPU维度GPU功率Wgpu_power_readings_power_drawuserId、instanceId、gpuId

通过云监控控制台查看GPU的监控数据

  1. 登录云监控控制台
  2. 在左侧导航栏,单击主机监控
  3. 主机监控页面,单击目标主机的实例名称链接,或单击目标主机对应操作列的监控图表
  4. 单击GPU监控页签。
    GPU监控页签,查看GPU相关监控图表。

通过API查看GPU的监控数据

通过DescribeMetricList接口查询GPU监控数据。更多信息,DescribeMetricList
说明 Namespace取值为acs_ecs_dashboardMetricNameDimensions的取值,请参见GPU监控项说明