All Products
Search
Document Center

Elastic Container Instance:Buat pod dengan tipe GPU tertentu

Last Updated:Mar 21, 2026

Pelajari cara membuat Pod Elastic Container Instance (ECI) dengan tipe instans Elastic Compute Service (ECS) GPU tertentu dan mengubah versi driver GPU.

Spesifikasi instans

Tipe instans yang dipercepat GPU cocok untuk skenario seperti pembelajaran mendalam dan pengeditan gambar. Anda dapat menjalankan image Docker untuk GPU secara langsung pada instans ECI yang dipercepat GPU. Driver kartu grafis NVIDIA telah dipra-instal di setiap instans. Versi driver dan CUDA yang didukung bervariasi tergantung pada tipe instans GPU.

Catatan

Keluarga instans gn8ia dan gn8is dalam tabel berikut hanya tersedia di beberapa wilayah di luar Tiongkok. Untuk menggunakan keluarga instans ini, hubungi tim penjualan Alibaba Cloud.

Kategori

Keluarga instans GPU

Versi driver dan CUDA

vGPU-accelerated instance family

sgn7i-vws

GRID 470, CUDA 11.4 (default)

vgn7i-vws

vgn6i-vws

GPU-accelerated compute-optimized instance family

gn7e

  • Tesla 470, CUDA 11.4 (default)

  • Tesla 535, CUDA 12.2

  • Tesla 550, CUDA 12.4

gn7i

gn7s

gn7

gn6v

gn6e

gn6i

gn5i

gn5

gn8ia

  • Tesla 535, CUDA 12.2 (default)

  • Tesla 550, CUDA 12.2

gn8is

Penting

Mulai 17 Maret 2025, tentukan hanya nomor versi utama untuk driver GPU, misalnya 535, bukan nomor versi lengkap seperti 535.161.08. Instans yang dibuat akan menggunakan driver dengan versi utama yang ditentukan, tetapi versi minornya mungkin diperbarui. Ketika driver versi lama tidak lagi dipublikasikan, versi yang lebih baru akan digunakan secara otomatis untuk membuat instans. Periode dukungan untuk versi driver mengikuti dukungan resmi dari NVIDIA. Untuk informasi selengkapnya, lihat NVIDIA Driver Documentation.

Riwayat pembaruan driver GPU

Waktu pembaruan

Deskripsi pembaruan

Maret 2025

  • Driver GRID 470 diperbarui ke 470.239.06.

  • Driver Tesla 470 diperbarui ke 470.256.02, driver Tesla 535 diperbarui ke 535.230.02, dan driver Tesla 550 diperbarui ke 550.127.08.

  • Driver Tesla 525 tidak lagi didukung. Jika Anda menentukan driver ini, sistem akan kembali ke versi 535.

Untuk informasi selengkapnya tentang tipe instans ECS, lihat topik berikut:

Konfigurasi

Untuk menentukan tipe instans GPU, tambahkan anotasi k8s.aliyun.com/eci-use-specs ke metadata Pod. Setelah menentukan tipe instans, Anda harus mendeklarasikan sumber daya GPU yang diperlukan untuk setiap kontainer dengan menambahkan bidang nvidia.com/gpu di bawah resources.limits.

Penting
  • Bidang nvidia.com/gpu menentukan jumlah GPU yang diperlukan oleh kontainer. Nilai ini wajib ditetapkan saat membuat Pod GPU; jika tidak, Pod tidak akan berhasil dimulai.

  • Secara default, beberapa kontainer dapat berbagi GPU. Saat mengonfigurasi Pod, pastikan jumlah GPU yang diminta oleh satu kontainer tidak melebihi jumlah GPU yang tersedia pada tipe instans yang ditentukan.

Berikut adalah contoh konfigurasi:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: test
  labels:
    app: test
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      name: nginx-test
      labels:
        app: nginx
        alibabacloud.com/eci: "true" 
      annotations:
        k8s.aliyun.com/eci-use-specs: "ecs.gn6i-c4g1.xlarge,ecs.gn6i-c8g1.2xlarge"  # Tentukan hingga lima tipe instans ECS GPU yang didukung.
    spec:
      containers:
      - name: nginx
        image: registry.cn-shanghai.aliyuncs.com/eci_open/nginx:1.14.2
        resources:
            limits:
              nvidia.com/gpu: "1"    # Jumlah GPU yang diperlukan oleh kontainer nginx. GPU dibagi secara default.
        ports:
        - containerPort: 80
      - name: busybox
        image: registry.cn-shanghai.aliyuncs.com/eci_open/busybox:1.30
        command: ["sleep"]
        args: ["999999"]
        resources:
            limits:
              nvidia.com/gpu: "1"    # Jumlah GPU yang diperlukan oleh kontainer busybox. GPU dibagi secara default.

Secara default, ECI secara otomatis menginstal driver dan versi CUDA yang didukung berdasarkan tipe instans yang dipercepat GPU yang Anda tentukan. Jika workload Anda memerlukan driver dan versi CUDA tertentu, gunakan anotasi k8s.aliyun.com/eci-gpu-driver-version untuk menentukannya.

Sebagai contoh, ketika Anda menentukan tipe instans ecs.gn6i-c4g1.xlarge, sistem menginstal driver Tesla 550 dengan CUDA 12.4 secara default. Anda dapat beralih ke driver Tesla 535 dengan CUDA 12.2 dengan menambahkan anotasi k8s.aliyun.com/eci-gpu-driver-version: tesla=535. Berikut adalah contoh YAML:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: test
  labels:
    app: test
spec:
  replicas: 1
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      name: nginx-test
      labels:
        app: nginx
        alibabacloud.com/eci: "true" 
      annotations:
        k8s.aliyun.com/eci-use-specs: ecs.gn6i-c4g1.xlarge      # Tentukan tipe instans GPU yang mendukung penggantian versi driver.
        k8s.aliyun.com/eci-gpu-driver-version: tesla=535  # Tentukan versi driver GPU.
    spec:
      containers:
      - name: nginx
        image: registry.cn-shanghai.aliyuncs.com/eci_open/nginx:1.14.2
        resources:
            limits:
              nvidia.com/gpu: "1"    # Jumlah GPU yang diperlukan oleh kontainer.