すべてのプロダクト
Search
ドキュメントセンター

Container Compute Service:ACS GPU の概要

最終更新日:Apr 24, 2026

Alibaba Cloud Container Compute Service (ACS) は、ヘテロジニアスコンピューティングリソースの統一的なスケジューリングをサポートします。サーバーレスリソースモデルにより、ACS はヘテロジニアスコンピューティングクラスターの管理を簡素化します。このドキュメントでは、ACS で利用可能な GPU リソースと使用パターンについて概説します。

ACS GPU の一般的なワークフロー

ACS は、データ前処理、モデルトレーニングから推論デプロイメントまでのライフサイクル全体をカバーする、AI ワークロード向けの非常に弾力的でコスト効率の高いソリューションを提供します。サーバーレスアーキテクチャのオンデマンド使用とオートスケーリングの特徴を、強力な GPU コンピューティング能力と組み合わせることで、開発者やデータサイエンティストは、基盤となるリソース管理ではなく、ビジネスロジックとアルゴリズムの革新に集中できます。

  1. データ前処理段階: 大規模なデータセットのクレンジング、変換、拡張を含むタスクには、サーバーレス CPU の並列処理能力を利用できます。多数の CPU インスタンスをオンデマンドで起動して、計算を高速化できます。タスクが完了すると、リソースは直ちに解放されるため、アイドル時間に対する支払いは発生しません。このアプローチは、周期的またはバースト的なデータバッチ処理に非常に効率的であり、データ準備サイクルを大幅に短縮します。

  2. モデルトレーニング段階: コンピューティング集約型のモデルトレーニングフェーズでは、サーバーレス GPU を使用して、モデルサイズと収束速度の要件に基づいて、必要な仕様の GPU インスタンスを柔軟に選択できます。トレーニングジョブの正確な持続時間に対して、秒単位の精度で課金されます。これにより、従来のセットアップで一般的だったアイドル状態の GPU サーバーのコストが不要になり、実験的なチューニングや反復トレーニングに最適です。

    モデルトレーニングワークロードにおけるリソースの確実性と柔軟性を確保するには、GPU-HPN キャパシティ予約 を使用します。

  3. 推論デプロイメント段階: モデルのトレーニング後、オンライン推論サービスとしてシームレスにデプロイできます。ACS のサーバーレスアーキテクチャは、リアルタイムのリクエストトラフィックに基づいて GPU インスタンスを数秒で自動的にスケーリングし、インスタンスをゼロにスケールダウンすることも可能です。そのため、トラフィックがない場合、リソースコストは発生しません。この極めて高い弾力性は、画像認識や Natural Language Processing など、変動が激しい、またはバースト的なトラフィックパターンを持つ AI アプリケーションに最適です。これにより、高いサービス可用性を確保しつつ、コスト削減を最大化します。

ACS のサーバーレス GPU を使用すると、単一のプラットフォームで AI ワークフロー全体を効率的に管理し、リソース割り当てとコストを最適化して、AI アプリケーションの開発とデプロイを加速できます。

image

サポートされる GPU タイプ

GPU タイプ

メモリ

GPU 数

RDMA サポート

GU8TF

96 GB

1/2/4/8

はい

GU8TEF

141 GB

1/2/4/8

はい

L20 (GN8IS)

48 GB

1/2/4/8

いいえ

L20X (GX8SF)

141 GB

8

はい

P16EN

96 GB

1/2/4/8/16

はい

T4

16 GB

1/2

いいえ

A10

24 GB

1/2/4/8

いいえ

G28Ti

11 GB

1

いいえ

G49E

48 GB

1/2/4/8

いいえ

G59

32 GB

1/2/4/8

いいえ

L20N

48 GB

1/2/4/8

いいえ

L20NE

72 GB

1/2/4/8

いいえ

GPU の仕様に関する詳細については、「ACS でサポートされる GPU インスタンスファミリー」をご参照ください。

GPU のアベイラビリティゾーン

アベイラビリティゾーン

サポートされる GPU タイプ

cn-wulanchabu-a

GU8TF, L20, G49E

cn-wulanchabu-b

G59

中国 (ウランチャブ) ゾーン C

P16EN

cn-wulanchabu-d

P16EN, L20NE

中国 (北京) ゾーン D

GU8TF, GU8TEF, P16EN

中国 (北京) ゾーン H

G28Ti

中国 (北京) ゾーン I

A10, G28Ti, L20N

中国 (北京) ゾーン L

L20, G49E, G59, L20NE

中国 (上海) ゾーン E

G59, G28Ti

中国 (上海) ゾーン F

GU8TF, GU8TEF, P16EN

中国 (上海) ゾーン L

L20, G49E, T4, G28Ti

中国 (上海) ゾーン N

L20, L20N

cn-shanghai-o

P16EN

cn-hangzhou-b

GU8TF, L20, G49E, P16EN, G59

中国 (杭州) ゾーン I

T4

中国 (深セン) ゾーン C

L20

中国 (深セン) ゾーン D

GU8TEF, G49E, G59

中国 (深セン) ゾーン E

T4

中国 (香港) ゾーン D

GU8TEF

ap-southeast-1

GU8TF, L20, L20X

eu-central-1-a

L20

eu-central-1-c

GU8TEF

me-east-1-a

GU8TEF

米国 (バージニア) ゾーン A

A10, L20

米国 (バージニア) ゾーン B

A10, L20

ACS GPU のキャパシティ予約

ACS GPU 対応クラスタータイプ

ACS GPU のリソーススケジューリング

ACS GPU のモニタリング

ACS GPU のトラブルシューティング

GPU-HPN ノード障害の監視と回復