Alibaba Cloud Container Compute Service (ACS) は、ヘテロジニアスコンピューティングリソースの統一的なスケジューリングをサポートします。サーバーレスリソースモデルにより、ACS はヘテロジニアスコンピューティングクラスターの管理を簡素化します。このドキュメントでは、ACS で利用可能な GPU リソースと使用パターンについて概説します。
ACS GPU の一般的なワークフロー
ACS は、データ前処理、モデルトレーニングから推論デプロイメントまでのライフサイクル全体をカバーする、AI ワークロード向けの非常に弾力的でコスト効率の高いソリューションを提供します。サーバーレスアーキテクチャのオンデマンド使用とオートスケーリングの特徴を、強力な GPU コンピューティング能力と組み合わせることで、開発者やデータサイエンティストは、基盤となるリソース管理ではなく、ビジネスロジックとアルゴリズムの革新に集中できます。
データ前処理段階: 大規模なデータセットのクレンジング、変換、拡張を含むタスクには、サーバーレス CPU の並列処理能力を利用できます。多数の CPU インスタンスをオンデマンドで起動して、計算を高速化できます。タスクが完了すると、リソースは直ちに解放されるため、アイドル時間に対する支払いは発生しません。このアプローチは、周期的またはバースト的なデータバッチ処理に非常に効率的であり、データ準備サイクルを大幅に短縮します。
モデルトレーニング段階: コンピューティング集約型のモデルトレーニングフェーズでは、サーバーレス GPU を使用して、モデルサイズと収束速度の要件に基づいて、必要な仕様の GPU インスタンスを柔軟に選択できます。トレーニングジョブの正確な持続時間に対して、秒単位の精度で課金されます。これにより、従来のセットアップで一般的だったアイドル状態の GPU サーバーのコストが不要になり、実験的なチューニングや反復トレーニングに最適です。
モデルトレーニングワークロードにおけるリソースの確実性と柔軟性を確保するには、GPU-HPN キャパシティ予約 を使用します。
推論デプロイメント段階: モデルのトレーニング後、オンライン推論サービスとしてシームレスにデプロイできます。ACS のサーバーレスアーキテクチャは、リアルタイムのリクエストトラフィックに基づいて GPU インスタンスを数秒で自動的にスケーリングし、インスタンスをゼロにスケールダウンすることも可能です。そのため、トラフィックがない場合、リソースコストは発生しません。この極めて高い弾力性は、画像認識や Natural Language Processing など、変動が激しい、またはバースト的なトラフィックパターンを持つ AI アプリケーションに最適です。これにより、高いサービス可用性を確保しつつ、コスト削減を最大化します。
ACS のサーバーレス GPU を使用すると、単一のプラットフォームで AI ワークフロー全体を効率的に管理し、リソース割り当てとコストを最適化して、AI アプリケーションの開発とデプロイを加速できます。

サポートされる GPU タイプ
GPU タイプ | メモリ | GPU 数 | RDMA サポート |
96 GB | 1/2/4/8 | はい | |
141 GB | 1/2/4/8 | はい | |
48 GB | 1/2/4/8 | いいえ | |
141 GB | 8 | はい | |
96 GB | 1/2/4/8/16 | はい | |
16 GB | 1/2 | いいえ | |
24 GB | 1/2/4/8 | いいえ | |
11 GB | 1 | いいえ | |
48 GB | 1/2/4/8 | いいえ | |
32 GB | 1/2/4/8 | いいえ | |
48 GB | 1/2/4/8 | いいえ | |
72 GB | 1/2/4/8 | いいえ |
GPU の仕様に関する詳細については、「ACS でサポートされる GPU インスタンスファミリー」をご参照ください。
GPU のアベイラビリティゾーン
アベイラビリティゾーン | サポートされる GPU タイプ |
cn-wulanchabu-a | GU8TF, L20, G49E |
cn-wulanchabu-b | G59 |
中国 (ウランチャブ) ゾーン C | P16EN |
cn-wulanchabu-d | P16EN, L20NE |
中国 (北京) ゾーン D | GU8TF, GU8TEF, P16EN |
中国 (北京) ゾーン H | G28Ti |
中国 (北京) ゾーン I | A10, G28Ti, L20N |
中国 (北京) ゾーン L | L20, G49E, G59, L20NE |
中国 (上海) ゾーン E | G59, G28Ti |
中国 (上海) ゾーン F | GU8TF, GU8TEF, P16EN |
中国 (上海) ゾーン L | L20, G49E, T4, G28Ti |
中国 (上海) ゾーン N | L20, L20N |
cn-shanghai-o | P16EN |
cn-hangzhou-b | GU8TF, L20, G49E, P16EN, G59 |
中国 (杭州) ゾーン I | T4 |
中国 (深セン) ゾーン C | L20 |
中国 (深セン) ゾーン D | GU8TEF, G49E, G59 |
中国 (深セン) ゾーン E | T4 |
中国 (香港) ゾーン D | GU8TEF |
ap-southeast-1 | GU8TF, L20, L20X |
eu-central-1-a | L20 |
eu-central-1-c | GU8TEF |
me-east-1-a | GU8TEF |
米国 (バージニア) ゾーン A | A10, L20 |
米国 (バージニア) ゾーン B | A10, L20 |