ACS GPU の概要 - Container Compute Service - Alibaba Cloud ドキュメントセンター

Alibaba Cloud Container Compute Service (ACS) は、ヘテロジニアスコンピューティングリソースの統一的なスケジューリングをサポートします。サーバーレスリソースモデルにより、ACS はヘテロジニアスコンピューティングクラスターの管理を簡素化します。このドキュメントでは、ACS で利用可能な GPU リソースと使用パターンについて概説します。

ACS GPU の一般的なワークフロー

ACS は、データ前処理、モデルトレーニングから推論デプロイメントまでのライフサイクル全体をカバーする、AI ワークロード向けの非常に弾力的でコスト効率の高いソリューションを提供します。サーバーレスアーキテクチャのオンデマンド使用とオートスケーリングの特徴を、強力な GPU コンピューティング能力と組み合わせることで、開発者やデータサイエンティストは、基盤となるリソース管理ではなく、ビジネスロジックとアルゴリズムの革新に集中できます。

データ前処理段階： 大規模なデータセットのクレンジング、変換、拡張を含むタスクには、サーバーレス CPU の並列処理能力を利用できます。多数の CPU インスタンスをオンデマンドで起動して、計算を高速化できます。タスクが完了すると、リソースは直ちに解放されるため、アイドル時間に対する支払いは発生しません。このアプローチは、周期的またはバースト的なデータバッチ処理に非常に効率的であり、データ準備サイクルを大幅に短縮します。
モデルトレーニング段階： コンピューティング集約型のモデルトレーニングフェーズでは、サーバーレス GPU を使用して、モデルサイズと収束速度の要件に基づいて、必要な仕様の GPU インスタンスを柔軟に選択できます。トレーニングジョブの正確な持続時間に対して、秒単位の精度で課金されます。これにより、従来のセットアップで一般的だったアイドル状態の GPU サーバーのコストが不要になり、実験的なチューニングや反復トレーニングに最適です。
モデルトレーニングワークロードにおけるリソースの確実性と柔軟性を確保するには、GPU-HPN キャパシティ予約を使用します。
推論デプロイメント段階： モデルのトレーニング後、オンライン推論サービスとしてシームレスにデプロイできます。ACS のサーバーレスアーキテクチャは、リアルタイムのリクエストトラフィックに基づいて GPU インスタンスを数秒で自動的にスケーリングし、インスタンスをゼロにスケールダウンすることも可能です。そのため、トラフィックがない場合、リソースコストは発生しません。この極めて高い弾力性は、画像認識や Natural Language Processing など、変動が激しい、またはバースト的なトラフィックパターンを持つ AI アプリケーションに最適です。これにより、高いサービス可用性を確保しつつ、コスト削減を最大化します。

ACS のサーバーレス GPU を使用すると、単一のプラットフォームで AI ワークフロー全体を効率的に管理し、リソース割り当てとコストを最適化して、AI アプリケーションの開発とデプロイを加速できます。

サポートされる GPU タイプ

GPU タイプ	メモリ	GPU 数	RDMA サポート
GU8TF	96 GB	1/2/4/8	はい
GU8TEF	141 GB	1/2/4/8	はい
L20 (GN8IS)	48 GB	1/2/4/8	いいえ
L20X (GX8SF)	141 GB	8	はい
P16EN	96 GB	1/2/4/8/16	はい
T4	16 GB	1/2	いいえ
A10	24 GB	1/2/4/8	いいえ
G28Ti	11 GB	1	いいえ
G49E	48 GB	1/2/4/8	いいえ
G59	32 GB	1/2/4/8	いいえ
L20N	48 GB	1/2/4/8	いいえ
L20NE	72 GB	1/2/4/8	いいえ

GPU の仕様に関する詳細については、「ACS でサポートされる GPU インスタンスファミリー」をご参照ください。

GPU のアベイラビリティゾーン

アベイラビリティゾーン	サポートされる GPU タイプ
cn-wulanchabu-a	GU8TF, L20, G49E
cn-wulanchabu-b	G59
中国 (ウランチャブ) ゾーン C	P16EN
cn-wulanchabu-d	P16EN, L20NE
中国 (北京) ゾーン D	GU8TF, GU8TEF, P16EN
中国 (北京) ゾーン H	G28Ti
中国 (北京) ゾーン I	A10, G28Ti, L20N
中国 (北京) ゾーン L	L20, G49E, G59, L20NE
中国 (上海) ゾーン E	G59, G28Ti
中国 (上海) ゾーン F	GU8TF, GU8TEF, P16EN
中国 (上海) ゾーン L	L20, G49E, T4, G28Ti
中国 (上海) ゾーン N	L20, L20N
cn-shanghai-o	P16EN
cn-hangzhou-b	GU8TF, L20, G49E, P16EN, G59
中国 (杭州) ゾーン I	T4
中国 (深セン) ゾーン C	L20
中国 (深セン) ゾーン D	GU8TEF, G49E, G59
中国 (深セン) ゾーン E	T4
中国 (香港) ゾーン D	GU8TEF
ap-southeast-1	GU8TF, L20, L20X
eu-central-1-a	L20
eu-central-1-c	GU8TEF
me-east-1-a	GU8TEF
米国 (バージニア) ゾーン A	A10, L20
米国 (バージニア) ゾーン B	A10, L20

Container Compute Service:ACS GPU の概要

ACS GPU の一般的なワークフロー

サポートされる GPU タイプ

GPU のアベイラビリティゾーン

ACS GPU のキャパシティ予約

ACS GPU 対応クラスタータイプ

ACS GPU のリソーススケジューリング

ACS GPU のモニタリング

ACS GPU のトラブルシューティング