EAS は、テストから本番環境まで、さまざまなシナリオに対応するために、3 つのリソースタイプ (パブリックリソース、EAS リソースグループ、リソースクォータ) を提供します。このトピックでは、各リソースタイプの特徴と、最適なオプションを選択する方法について説明します。
リソースタイプの比較
|
リソースタイプ |
シナリオ |
課金 |
特徴の比較 |
|
|
テストや、専用リソースグループと組み合わせることでトラフィックが変動するサービスに最適です。 |
|
|
||
|
専用リソースグループ |
高いセキュリティや専用リソースを必要とするワークロードに推奨されます。また、希少なリソースタイプを事前に予約するためにも使用できます。 |
|
|
|
|
仮想リソースグループ |
パブリックリソース、リソースクォータ、専用リソースグループなど、複数のリソースタイプを組み合わせた論理的なグループです。 |
課金は、スケジューリングされ使用されたリソースに基づきます。 |
|
|
|
リソースクォータ |
現在、Lingjun リソースのみがサポートされています。 |
|
|
|
リソースタイプの選択方法
ユースケースに応じて適切なリソースタイプを選択してください:
テストおよび開発シナリオ
-
推奨: パブリックリソース
-
理由: 従量課金制で初期投資が不要なため、トラフィックが予測不能なテスト環境に最適です。
-
注意: ピーク時にはリソースが不足する可能性があります。詳細については、「パブリックリソースが不足した場合の対処法」をご参照ください。
本番環境 - 安定したワークロード
-
推奨: 専用リソースグループ
-
理由: 安定したパフォーマンスを実現する専用リソースを提供し、高可用性シナリオに最適です。
-
コスト: サブスクリプションをサポートしており、コストを削減できます。
本番環境 - 変動するトラフィック
-
推奨: 仮想リソースグループ (専用リソースグループとパブリックリソースの組み合わせ)
-
理由: 専用リソースがベースラインを提供し、パブリックリソースがトラフィックスパイクに対応することで、最適なコスト効率を実現します。
-
設定のヒント: スケジューリング優先度を設定して、まず専用リソースを使用し、トラフィックのピーク時には自動的にパブリックリソースにスケールアウトするようにします。
特別なハードウェア要件
-
推奨: リソースクォータ (Lingjun リソース)
-
理由: 特定の高性能ハードウェアリソースへのアクセスを提供します。
-
ユースケース: 大規模なモデルトレーニングおよび推論シナリオ。
高度な機能
リソースを設定した後、以下の高度な機能を使用してリソース使用率を最適化できます:
-
GPU スライシング: 単一の GPU の計算能力とメモリを分割し、複数のサービスインスタンスで共有します。これにより、GPU 使用率が向上し、デプロイコストが削減されます。専用リソースグループと Lingjun リソースの両方で利用できます。
-
マルチノード分散推論: 単一のサービスインスタンスを複数のマシンにまたがってデプロイし、単一ノードのハードウェア制限を克服します。これにより、DeepSeek 671B などの超大規模モデルのデプロイと運用が可能になります。
よくある質問
「EAS よくある質問」をご参照ください。
関連トピック
-
EAS がエンドツーエンドのモデル開発とデプロイをどのようにサポートするかについては、「EAS の概要」をご参照ください。
-
リソースグループから Simple Log Service (SLS) にログを送信する方法については、「リソースグループのログサービスの設定」をご参照ください。