全部產品
Search
文件中心

Elastic Container Instance:指定GPU規格建立執行個體

更新時間:Mar 22, 2025

本文介紹如何指定ECS GPU規格建立一個ECI執行個體。

規格說明

GPU規格含有GPU計算卡,適用於深度學習、影像處理等情境。GPU對應的Docker鏡像可以直接運行在ECI GPU執行個體上。執行個體內已預裝NVIDIA顯卡裝置驅動,不同GPU規格支援安裝的驅動和CUDA版本不同。

說明

下表中的gn8ia和gn8is目前僅支援海外等部分地區,如有需求,請聯絡阿里雲銷售人員。

規格類型

GPU規格類型系列

驅動和CUDA版本

GPU虛擬化型執行個體規格類型系列

sgn7i-vws

GRID 470,CUDA 11.4(預設安裝)

vgn7i-vws

vgn6i-vws

GPU計算型執行個體規格類型系列

gn7e

  • Tesla 470,CUDA 11.4(預設安裝)

  • Tesla 535,CUDA 12.2

  • Tesla 550,CUDA 12.4

gn7i

gn7s

gn7

gn6v

gn6e

gn6i

gn5i

gn5

gn8ia

  • Tesla 535,CUDA 12.2(預設安裝)

  • Tesla 550,CUDA 12.2

gn8is

重要

自2025年3月17日開始。指定GPU驅動版本不再使用完整版本號碼(如535.161.08),而是只使用大版本號碼(如535),實際建立出的執行個體的驅動版本可能會在保證大版本號碼不變的情況下更新小版本號碼,較老的驅動下線後會自動使用更高版本驅動建立。特定版本驅動的支援時間與NVIDIA官方對該驅動的支援時間一致,具體請參見NVIDIA Driver Documentation

GPU驅動更新記錄

更新時間

更新說明

2025年3月

  • GRID 470驅動更新為470.239.06。

  • Tesla 470驅動更新為470.256.02,Tesla 535驅動更新為535.230.02,Tesla550驅動更新為550.127.08。

  • Tesla 525驅動不再支援,指定該驅動將回退到535版本。

關於ECS規格的詳細資料,請參見:

配置說明

建立GPU執行個體時,在指定GPU規格的基礎上,容器內還需要指定GPU個數。

重要
  • 如果執行個體指定使用GPU規格,但容器內沒有指定GPU個數,則執行個體啟動會報錯。

  • 預設情況下,多個容器可以共用使用GPU,配置時需確保單個容器內配置的GPU個數不超過指定的GPU規格所具備的GPU個數。

OpenAPI

調用CreateContainerGroup介面建立ECI執行個體時,在通過InstanceType參數指定ECS GPU執行個體規格的基礎上,必須通過容器屬性中的GPU參數指定容器使用的GPU個數。相關參數說明如下表所示。更多資訊,請參見CreateContainerGroup

名稱

類型

樣本值

描述

InstanceType

String

ecs.gn6v-c8g1.2xlarge

指定ECS GPU執行個體規格。

支援指定多個規格(單次最多5個),各規格之間用半形逗號(,)進行分隔。

Container.N.Gpu

Integer

1

指定容器使用的GPU個數。

說明

您也可以調用UpdateContainerGroup更新GPU執行個體中各容器使用的GPU個數。更多資訊,請參見UpdateContainerGroup

預設情況下,ECI GPU執行個體會根據指定的GPU規格自動安裝支援的驅動和CUDA版本。在一些情境中,您可能需要在不同的ECI GPU執行個體負載中依賴不同的驅動和CUDA版本,此時,您可以通過GpuDriverVersion參數來指定驅動版本。

名稱

類型

樣本值

描述

GpuDriverVersion

string

tesla=535

指定GPU驅動版本。

說明

僅部分規格支援切換GPU驅動版本。具體請參見規格說明

控制台

通過Elastic Container Instance控制台建立GPU執行個體時,GPU相關配置如下:

  1. 容器組配置地區單擊指定規格頁簽,然後選擇GPU規格。

    指定GPU.png

  2. 在各個容器的進階配置中,設定容器使用的GPU個數。

    容器GPU.png