全部产品
Search
文档中心

容器服务 Kubernetes 版 ACK:使用GPU实例

更新时间:Jan 10, 2024

ECI GPU实例内置了显卡设备驱动及CUDA驱动,因此运行ECI GPU实例只需使用内置了CUDA Toolkit等软件的基础镜像即可,无需关心驱动安装。本文介绍如何使用ECI GPU实例。

背景信息

当前ECI GPU支持的驱动版本为NVIDIA 460.73.01,可支持的CUDA Toolkit版本为11.2。关于CUDA Toolkit的更多信息,请参见NVIDIA CUDA

ECI支持通过指定ECS GPU规格来创建ECI GPU实例。支持的ECS GPU规格如下所示:

  • GPU计算型实例规格族gn6v(NVIDIA V100),例如:ecs.gn6v-c8g1.2xlarge。

  • GPU计算型实例规格族gn6i(NVIDIA T4),例如:ecs.gn6i-c4g1.xlarge。

  • GPU计算型实例规格族gn5(NVIDIA P100),例如:ecs.gn5-c4g1.xlarge。

  • GPU计算型实例规格族gn5i(NVIDIA P4),例如:ecs.gn5i-c2g1.large。

关于完整的ECS GPU规格定义,请参见实例规格族

使用方法

在Pod定义中增加annotations: k8s.aliyun.com/eci-use-specs,具体示例如下。

  • 在Pod的metadata中添加指定规格的annotations

    说明

    请按照实际使用量选择合适的ECS GPU规格,如果resources中使用的GPU数比规格小很多,则会造成资源浪费。

  • 在Container的resources中声明GPU资源。

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-gpu-demo
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
      annotations:
        k8s.aliyun.com/eci-use-specs: ecs.gn5i-c4g1.xlarge
    spec:
      containers:
      - name: nginx
        image: registry-vpc.cn-beijing.aliyuncs.com/eci_open/nginx:1.15.10
        resources:
            limits:
              nvidia.com/gpu: '1'
        ports:
        - containerPort: 80

相关文档

如需使用AMD实例,请参见使用AMD实例