ACS は複数の GPU ファミリーをサポートしています。クラスター内で alibabacloud.com/gpu-model-series ラベルを使用して GPU ファミリーを指定してください。異なる GPU ファミリーは、それぞれ異なるユースケースに適しています。具体的な要件に基づいてインスタンスファミリーを選択できます。
GU8TF
コンピュート GPU です。
GPU あたり 96 GB のメモリと FP8 データ形式のネイティブサポートを備えています。700 億パラメーター以上のモデルに対するシングルノード推論に最適です。
8 基すべての GPU 間に高速 NVLink 相互接続を提供し、小~中規模のモデルトレーニングに適しています。1.6 Tbps のリモートダイレクトメモリアクセス (RDMA) 相互接続により、ノード間通信が高速化されます。
次の表は、このコンピュート GPU を使用する Pod の利用可能なリソース構成を示しています。
GPU | vCPU | メモリ (GiB) | メモリ増分 (GiB) | ストレージ (GiB) |
1 (96 GB) | 2 | 2–16 | 1 | 30–256 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–128 | 1 | ||
22 | 22, 32, 64, 128 | N/A | ||
2 (96 GB) | 16 | 16–128 | 1 | 30–512 |
32 | 32, 64, 128, 230 | N/A | ||
46 | 64, 128, 230 | N/A | ||
4 (96 GB) | 32 | 32, 64, 128, 256 | N/A | 30–1,024 |
64 | 64, 128, 256, 460 | N/A | ||
92 | 128, 256, 460 | N/A | ||
8 (96 GB) | 64 | 64, 128, 256, 512 | N/A | 30–2,048 |
128 | 128, 256, 512, 920 | N/A | ||
184 | 256, 512, 920 | N/A |
GU8TEF
コンピュート GPU です。
GPU メモリ 141 GB を備え、FP8 浮動小数点形式をサポートしています。マルチ GPU 構成では、DeepSeek R1 用のシングルノード推論が可能です。
8 基の GPU 間に NVLink 相互接続を提供し、小~中規模のモデルトレーニングに適しています。1.6 Tbps の高速 RDMA 相互接続により、ノード間通信が高速化されます。
このコンピュート GPU の Pod 仕様は以下のとおりです。
GPU | vCPU | メモリ (GiB) | メモリ増分 (GiB) | ストレージ (GiB) |
1 (141 GB) | 2 | 2–16 | 1 | 30–768 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–128 | 1 | ||
22 | 22, 32, 64, 128, 225 | N/A | ||
2 (141 GB) | 16 | 16–128 | 1 | 30–1,536 |
32 | 32, 64, 128, 256 | N/A | ||
46 | 64, 128, 256, 450 | N/A | ||
4 (141 GB) | 32 | 32, 64, 128, 256 | N/A | 30–3,072 |
64 | 64, 128, 256, 512 | N/A | ||
92 | 128, 256, 512, 900 | N/A | ||
8 (141 GB) | 64 | 64, 128, 256, 512 | N/A | 30–6,144 |
128 | 128, 256, 512, 1,024 | N/A | ||
184 | 256, 512, 1,024, 1,800 | N/A |
L20 (GN8IS)
このファミリーはコンピュート GPU を提供します。
TensorRT、FP8 浮動小数点形式、GPU 間のピアツーピア (P2P) 通信などの一般的なアクセラレーション機能をサポートしています。
GPU あたり 48 GB の GPU メモリを備え、マルチ GPU 構成で 700 億パラメーター以上のモデルに対するシングルノード推論を実現します。
次の表は、このファミリーの Pod で利用可能なリソース構成を示しています。
GPU | vCPU | メモリ (GiB) | メモリ増分 (GiB) | ストレージ (GiB) |
1 (48 GB) | 2 | 2–16 | 1 | 30–256 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–120 | 1 | ||
2 (48 GB) | 16 | 16–128 | 1 | 30–512 |
32 | 32, 64, 128, 230 | N/A | ||
4 (48 GB) | 32 | 32, 64, 128, 256 | N/A | 30–1,024 |
64 | 64, 128, 256, 460 | N/A | ||
8 (48 GB) | 64 | 64, 128, 256, 512 | N/A | 30–2,048 |
128 | 128, 256, 512, 920 | N/A |
L20X (GX8SF)
コンピュート GPU です。
GPU あたり 141 GB のメモリを備え、マルチ GPU 構成で大規模モデルのシングルノード推論を実現します。
8 基すべての GPU 間に NVLink 相互接続を備え、大規模なモデルトレーニングおよび推論に最適です。3.2 Tbps の高速 RDMA 相互接続により、ノード間通信が高速化されます。
次の表は、この GPU の Pod 仕様を示しています。
GPU | vCPU | メモリ (GiB) | メモリ増分 (GiB) | ストレージ (GiB) |
8 (141 GB) | 184 | 1,800 | N/A | 30–6,144 |
P16EN
P16EN は GPU コンピュートカードです。
GPU あたり 96 GB のビデオメモリを備え、FP16 浮動小数点形式をサポートしています。マルチ GPU 構成により、DeepSeek R1 などのモデルに対するシングルノード推論が可能です。
16 基すべての GPU 間に 700 GB/s の高速相互接続を提供し、小~中規模のモデルトレーニングに最適です。1.6 Tbps の高速 RDMA 相互接続により、ノード間通信が高速化されます。
この GPU カードの Pod 仕様制約は以下のとおりです。
GPU | vCPU | メモリ (GiB) | メモリ増分 (GiB) | ストレージ |
1 (96 GB) | 2 | 2–16 | 1 | 30–384 GB |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
2 (96 GB) | 4 | 4–32 | 1 | 30–768 GB |
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
16 | 16–128 | 1 | ||
22 | 32, 64, 128, 225 | N/A | ||
4 (96 GB) | 8 | 8–64 | 1 | 30–1536 GB |
16 | 16–128 | 1 | ||
32 | 32, 64, 128, 256 | N/A | ||
46 | 64, 128, 256, 450 | N/A | ||
8 (96 GB) | 16 | 16–128 | 1 | 30–3072 GB |
32 | 32, 64, 128, 256 | N/A | ||
64 | 64, 128, 256, 512 | N/A | ||
92 | 128, 256, 512, 900 | N/A | ||
16 (96 GB) | 32 | 32, 64, 128, 256 | N/A | 30–6144 GB |
64 | 64, 128, 256, 512 | N/A | ||
128 | 128, 256, 512, 1,024 | N/A | ||
184 | 256, 512, 1,024, 1,800 | N/A |
T4
T4 は GPU コンピュートカードです。
Turing アーキテクチャを採用しており、各 GPU は 16 GB の GPU メモリと 320 GB/s のメモリ帯域幅を備えています。
可変精度 Tensor コアにより、最大 65 TFLOPS (FP16)、130 TOPS (INT8)、260 TOPS (INT4) を実現します。
この GPU の Pod リソース制約は以下のとおりです。
インスタンスファミリー | GPU | vCPU | メモリ (GiB) | メモリ増分 (GiB) | ストレージ (GiB) |
シングルノードファミリー | 1 (16 GB GPU メモリ) | 2 | 2–8 | 1 | 30–1536 |
4 | 4–16 | 1 | |||
6 | 6–24 | 1 | |||
8 | 8–32 | 1 | |||
10 | 10–40 | 1 | |||
12 | 12–48 | 1 | |||
14 | 14–56 | 1 | |||
16 | 16–64 | 1 | |||
24 | 24, 48, 90 | N/A | |||
2 (16 GB GPU メモリ) | 16 | 16–64 | 1 | ||
24 | 24, 48, 96 | N/A | |||
32 | 32, 64, 128 | N/A | |||
48 | 48, 96, 180 | N/A |
A10
GPU です。
Ampere アーキテクチャを採用しており、各 GPU は 24 GB のメモリを備え、RTX や TensorRT などの一般的なアクセラレーション機能をサポートしています。
この GPU の Pod リソース制約は以下のとおりです。
GPU | vCPU | メモリ (GiB) | メモリ増分 (GiB) | ストレージ (GiB) |
1 (24 GB) | 2 | 2–8 | 1 | 30–256 |
4 | 4–16 | 1 | ||
6 | 6–24 | 1 | ||
8 | 8–32 | 1 | ||
10 | 10–40 | 1 | ||
12 | 12–48 | 1 | ||
14 | 14–56 | 1 | ||
16 | 16–60 | 1 | ||
2 (24 GB x 2) | 16 | 16–64 | N/A | 30–512 |
32 | 32, 64, 120 | N/A | ||
4 (24 GB x 4) | 32 | 32, 64, 128 | N/A | 30–1,024 |
64 | 64, 128, 240 | N/A | ||
8 (24 GB x 8) | 64 | 64, 128, 256 | N/A | 30–2,048 |
128 | 128, 256, 480 | N/A |
G28Ti
GPU カードです。
GPU あたり 11 GB の GPU メモリを備え、TensorRT や CUDA などの一般的なアクセラレーション機能をサポートしています。また、GPU 間の NVLink および P2P 通信もサポートしています。
次の表は、この GPU カードの Pod 仕様を示しています。
GPU | vCPU | メモリ (GiB) | メモリステップサイズ (GiB) | ストレージ (GiB) |
1 (11 GB GPU メモリ) | 2 | 2–8 | 1 | 30–1536 |
4 | 4–16 | 1 | ||
6 | 6–24 | 1 | ||
8 | 8–32 | 1 | ||
10 | 10–40 | 1 | ||
12 | 12–48 | 1 |
G49E
G49E は GPU コンピュートカードです。
各 GPU は 48 GB の GPU メモリを備え、RTX や TensorRT などの一般的なアクセラレーション機能をサポートしており、GPU 間のピアツーピア (P2P) 通信を有効にします。
次の表は、この GPU カードの Pod 仕様を詳しく示しています。
GPU | vCPU | メモリ (GiB) | メモリ増分 (GiB) | ストレージ (GiB) |
1 (48 GB VRAM) | 2 | 2–16 | 1 | 30–256 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–120 | 1 | ||
2 (48 GB VRAM それぞれ) | 16 | 16–128 | 1 | 30–512 |
32 | 32, 64, 128, 230 | N/A | ||
4 (48 GB VRAM それぞれ) | 32 | 32, 64, 128, 256 | N/A | 30–1,024 |
64 | 64, 128, 256, 460 | N/A | ||
8 (48 GB VRAM それぞれ) | 64 | 64, 128, 256, 512 | N/A | 30–2,048 |
128 | 128, 256, 512, 920 | N/A |
G59
GPU です。
各 GPU は 32 GB の GPU メモリを備え、RTX や TensorRT などのアクセラレーション機能をサポートしており、GPU 間のピアツーピア (P2P) 通信を有効にします。
次の表は、この GPU の Pod 仕様制約を示しています。
GPU | vCPU | メモリ (GiB) | メモリステップサイズ (GiB) | ストレージ (GiB) |
1 (32 GB ビデオメモリ) | 2 | 2–16 | 1 | 30–256 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–128 | 1 | ||
22 | 22, 32, 64, 128 | N/A | ||
2 (GPU あたり 32 GB ビデオメモリ) | 16 | 16–128 | 1 | 30~512 |
32 | 32, 64, 128, 256 | N/A | ||
46 | 64, 128, 256, 360 | N/A | ||
4 (GPU あたり 32 GB ビデオメモリ) | 32 | 32, 64, 128, 256 | N/A | 30~1024 |
64 | 64, 128, 256, 512 | N/A | ||
92 | 128, 256, 512, 720 | N/A | ||
8 (GPU あたり 32 GB ビデオメモリ) | 64 | 64, 128, 256, 512 | N/A | 30~2048 |
128 | 128, 256, 512, 1024 | N/A | ||
184 | 256, 512, 1024, 1440 | N/A |
L20N
L20N は GPU コンピュートカードです。
最新の Blackwell アーキテクチャ、高周波数 CPU、大容量メモリを特徴としています。
自動運転やエンボディッドインテリジェンスのトレーニング、大規模モデル推論、映画・アニメーションレンダリング、メタバースアプリケーション、クラウドゲーミングなど、さまざまなシナリオでのコスト効率の高い GPU アクセラレーションに最適です。
この GPU カードをサポートする Pod の仕様は以下のとおりです。
GPU | vCPU | メモリ (GiB) | メモリステップサイズ (GiB) | ストレージ (GiB) |
1 (48 GB ビデオメモリ) | 2 | 2–16 | 1 | 30–2,048 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–128 | 1 | ||
32 | 32, 64, 128, 256 | N/A | ||
2 (それぞれ 48 GB) | 16 | 16–128 | 1 | |
32 | 32, 64, 128, 256 | N/A | ||
64 | 64, 128, 256, 512 | N/A | ||
4 (それぞれ 48 GB) | 32 | 32, 64, 128, 256 | N/A | |
64 | 64, 128, 256, 512 | N/A | ||
128 | 128, 256, 512, 1024 | N/A | ||
8 (それぞれ 48 GB) | 64 | 64, 128, 256, 512 | N/A | |
128 | 128, 256, 512, 1024 | N/A | ||
256 | 256, 512, 1024, 2048 | N/A |
L20NE
GPU カードです。
高周波数 CPU、大容量メモリ、最新の Blackwell アーキテクチャを採用したプロフェッショナルグラフィックスカードを備えています。
自動運転、エンボディッドインテリジェンスのトレーニング、大規模モデル推論、映画・アニメーションレンダリング、メタバース、クラウドゲーミングなどの GPU アクセラレーションワークロードに対して、コスト効率の高い GPU クラウドサービスを提供します。
利用可能な Pod 仕様は以下のとおりです。
GPU | vCPU | メモリ (GiB) | メモリ増分 (GiB) | ストレージ (GiB) |
1 (72 GB GPU メモリ) | 2 | 2–16 | 1 | 30–2,048 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–128 | 1 | ||
32 | 32, 64, 128, または 256 | N/A | ||
2 (それぞれ 72 GB GPU メモリ) | 16 | 16–128 | 1 | |
32 | 32, 64, 128, または 256 | N/A | ||
64 | 64, 128, 256, または 512 | N/A | ||
4 (それぞれ 72 GB GPU メモリ) | 32 | 32, 64, 128, または 256 | N/A | |
64 | 64, 128, 256, または 512 | N/A | ||
128 | 128, 256, 512, または 1,024 | N/A | ||
8 (それぞれ 72 GB GPU メモリ) | 64 | 64, 128, 256, または 512 | N/A | |
128 | 128, 256, 512, または 1,024 | N/A | ||
256 | 256, 512, 1,024, または 2,048 | N/A |