本文为您介绍如何通过云监控控制台和API查询GPU监控数据。

前提条件

GPU监控项说明

您可以从GPU、实例和应用分组维度查看GPU相关监控项。GPU的监控项如下表所示。
监控项 单位 MetricName Dimensions
(Agent)GPU维度解码器使用率 % gpu_decoder_utilization userId、instanceId、gpuId
(Agent)GPU维度编码器使用率 % gpu_encoder_utilization userId、instanceId、gpuId
(Agent)GPU维度GPU温度 gpu_gpu_temperature userId、instanceId、gpuId
(Agent)GPU维度GPU使用率 % gpu_gpu_usedutilization userId、instanceId、gpuId
(Agent)GPU维度显存空闲量 Byte gpu_memory_freespace userId、instanceId、gpuId
(Agent)GPU维度显存空闲率 % gpu_memory_freeutilization userId、instanceId、gpuId
(Agent)GPU维度显存使用量 Byte gpu_memory_userdspace userId、instanceId、gpuId
(Agent)GPU维度显存使用率 % gpu_memory_usedutilization userId、instanceId、gpuId
(Agent)GPU维度GPU功率 W gpu_power_readings_power_draw userId、instanceId、gpuId

通过云监控控制台查看GPU的监控数据

  1. 登录云监控控制台
  2. 在左侧导航栏,单击主机监控
  3. 主机监控页面,单击目标主机的实例名称链接,或单击目标主机对应操作列的监控图表图标。
  4. 单击GPU监控页签。
    GPU监控页签,查看GPU相关监控图表。

通过API查看GPU的监控数据

通过DescribeMetricList接口查询GPU监控数据。更多信息,DescribeMetricList
说明 Namespace取值为acs_ecs_dashboardMetricNameDimensions的取值,请参见GPU监控项说明