すべてのプロダクト
Search
ドキュメントセンター

Container Compute Service:ACS GPU の概要

最終更新日:Nov 09, 2025

Alibaba Cloud Container Compute Service (ACS) は、異種コンピューティングリソースの統一されたスケジューリングを提供し、サーバーレス方式で使用できます。これにより、異種コンピューティング向けの Kubernetes クラスターの運用および保守 (O&M) が簡素化されます。このトピックでは、ACS で異種コンピューティングリソースを使用する方法について説明します。

典型的な ACS GPU ワークフロー

ACS は、データの前処理やモデルのトレーニングから推論のデプロイメントまで、ライフサイクル全体をカバーする AI ワークロード向けに、非常に弾力的でコスト効率の高いソリューションを提供します。ACS は、サーバーレスアーキテクチャのオンデマンドおよび自動スケーリング機能と、強力な GPU コンピューティングを組み合わせています。これにより、開発者とデータサイエンティストは、基盤となるリソースの管理ではなく、ビジネスロジックとアルゴリズムの革新に集中できます。

  1. データ前処理段階: 大規模なデータセットのクリーニング、変換、拡張などのタスクには、サーバーレス CPU の並列処理機能を使用できます。オンデマンドで多数の CPU インスタンスを起動して、計算を高速化できます。タスクが完了すると、リソースはすぐに解放されるため、アイドル時間に対して料金を支払う必要はありません。このアプローチは、定期的またはバースト的なバッチ処理タスクに非常に効率的であり、データ準備サイクルを大幅に短縮します。

  2. モデルトレーニング段階: 計算集約的なモデルトレーニング段階では、Serverless GPU を使用すると、モデルサイズと必要な収束速度に基づいて GPU インスタンスを柔軟に選択できます。トレーニングタスクの課金は、秒単位の実際の実行時間に基づいています。これにより、従来の設定で一般的だったアイドル状態の GPU サーバーのコストが不要になり、実験的なパラメーターチューニングや反復的なトレーニングに最適です。

    リソースの確実性と柔軟性を必要とするモデルトレーニングワークロードには、GPU-HPN 容量予約ソリューションを使用して GPU リソースを予約できます。

  3. 推論デプロイメント段階: モデルをトレーニングした後、オンライン推論サービスとしてシームレスにデプロイできます。ACS サーバーレスアーキテクチャは、リアルタイムのトラフィックに基づいて数秒以内に GPU インスタンスを自動的にスケールインまたはスケールアウトし、ゼロインスタンスにスケールダウンすることもできます。これは、トラフィックがない場合、リソースコストが発生しないことを意味します。この高度な弾力性は、画像認識や Natural Language Processing など、トラフィックが変動したり、ピーク時とオフピーク時が明確に分かれている AI アプリケーションに最適です。これにより、サービスの可用性を高めながら、コスト削減を最大化できます。

ACS Serverless GPU は、AI ワークフロー全体を効率的に管理するための、統一されたシームレスなプラットフォームを提供します。オンデマンドのリソース割り当てとコストの最適化を可能にし、AI アプリケーションの開発とデプロイメントを加速します。

image

ACS でサポートされている GPU カードタイプ

GPU カードタイプ

GPU メモリ

サポートされている GPU カード数

RDMA サポート

GU8TF

96 GB

1/2/4/8

はい

GU8TEF

141 GB

1/2/4/8

はい

L20 (GN8IS)

48 GB

1/2/4/8

いいえ

L20X (GX8SF)

141 GB

8

はい

P16EN

96 GB

1/2/4/8/16

はい

G49E

48 GB

1/2/4/8

いいえ

T4

16 GB

1/2

いいえ

A10

24 GB

1/2/4/8

いいえ

G59

32 GB

1/2/4/8

いいえ

GPU カードタイプの詳細については、「ACS でサポートされている GPU インスタンスファミリー」をご参照ください。

ACS GPU リソースをサポートするゾーン

ゾーン

サポートされている GPU カードタイプ

cn-wulanchabu-a

GU8TF, L20, G49E

cn-wulanchabu-b

G59

cn-wulanchabu-c

P16EN

cn-beijing-d

GU8TF, GU8TEF, P16EN

cn-beijing-i

A10

cn-beijing-l

L20, G49E, G59

cn-shanghai-e

G59

cn-shanghai-f

GU8TF, GU8TEF, P16EN

cn-shanghai-l

L20, G49E, T4

cn-shanghai-n

L20

cn-shanghai-o

P16EN

cn-hangzhou-b

GU8TF, L20, G49E, P16EN, G59

cn-hangzhou-i

T4

cn-shenzhen-c

L20

cn-shenzhen-d

GU8TEF, G49E, G59

cn-shenzhen-e

T4

cn-hongkong-d

GU8TEF

ap-southeast-1

GU8TF, L20, L20X

ACS GPU 容量予約

ACS GPU 計算能力をサポートするクラスタータイプ

ACS GPU リソーススケジューリング

ACS GPU モニタリング

ACS GPU のトラブルシューティング

GPU-HPN ノードの障害のモニターと回復