本文为您介绍如何通过云监控控制台和API查询GPU监控数据。
前提条件
- 请确保您已在云服务器ECS上创建GPU计算型实例,且已安装GPU驱动。具体操作,请参见创建未配备驱动的GPU实例。说明 如果您先安装云监控插件,再安装GPU驱动,则需要重启云监控插件。关于如何重新云监控插件,请参见如何重启云监控C++版本插件?。
- 请确保您已在云服务器ECS上安装云监控插件。具体操作,请参见安装和卸载C++版本插件。
- 请确保您已添加监控图表,且包含GPU的监控项。具体操作,请参见添加监控图表。
GPU监控项说明
您可以从GPU、实例和应用分组维度查看GPU相关监控项。GPU的监控项如下表所示。
监控项 | 单位 | MetricName | Dimensions |
(Agent)GPU维度解码器使用率 | % | gpu_decoder_utilization | userId、instanceId、gpuId |
(Agent)GPU维度编码器使用率 | % | gpu_encoder_utilization | userId、instanceId、gpuId |
(Agent)GPU维度GPU温度 | ℃ | gpu_gpu_temperature | userId、instanceId、gpuId |
(Agent)GPU维度GPU使用率 | % | gpu_gpu_usedutilization | userId、instanceId、gpuId |
(Agent)GPU维度显存空闲量 | Byte | gpu_memory_freespace | userId、instanceId、gpuId |
(Agent)GPU维度显存空闲率 | % | gpu_memory_freeutilization | userId、instanceId、gpuId |
(Agent)GPU维度显存使用量 | Byte | gpu_memory_userdspace | userId、instanceId、gpuId |
(Agent)GPU维度显存使用率 | % | gpu_memory_usedutilization | userId、instanceId、gpuId |
(Agent)GPU维度GPU功率 | W | gpu_power_readings_power_draw | userId、instanceId、gpuId |
通过云监控控制台查看GPU的监控数据
- 登录云监控控制台。
- 在左侧导航栏,单击主机监控。
- 在主机监控页面,单击目标主机的实例名称链接,或单击目标主机对应操作列的监控图表。
- 单击GPU监控页签。在GPU监控页签,查看GPU相关监控图表。
通过API查看GPU的监控数据
通过DescribeMetricList接口查询GPU监控数据。更多信息,DescribeMetricList。