Lingjun AI 計算リソースまたは汎用コンピューティングリソースを購入した後、リソースの階層管理と隔離利用のためにリソースクォータを作成します。リソースクォータを使用すると、さまざまなチームやプロジェクトのリソース使用量の上限を制御し、AI の開発と推論のためにワークスペースにバインドできます。
前提条件
リソースクォータを作成する前に、次の前提条件を満たしている必要があります。
-
Lingjun AI 計算リソースまたは汎用コンピューティングリソースを購入済みであること。
-
(Lingjun AI 計算リソースクォータのみ) VPC、vSwitch、およびセキュリティグループを作成済みであること。
リソースクォータの追加
Platform for AI (PAI) は、ネットワーク設定 (VPC、vSwitch、セキュリティグループ) が必要な Lingjun AI 計算リソースクォータと、ネットワーク設定が不要な汎用コンピューティングリソースクォータの 2 種類のリソースクォータをサポートしています。
リソースクォータを作成する際、リソースプール内の専用リソースグループからリソースを割り当ててルートクォータを作成するか、既存のリソースクォータからリソースを割り当てて子クォータを作成することができます。
Lingjun AI 計算リソースの場合、ノード間の高速ネットワーク接続を確保するために、すべてのノードで同じ hz 識別子を使用する必要があります。
次の手順に従ってください。
-
PAI コンソールにログインし、[AI コンピューティングリソース] > [リソースクォータ] ページに移動します。
-
Lingjun Intelligent Computing resources タブまたは General Computing Resources タブで、Add Resource Quota をクリックします。
-
基本情報を設定します。
-
Name:リソースクォータの名前を入力します。
-
Associate Workspace (オプション):このクォータに関連付けるワークスペースを選択します。これにより、そのワークスペースでクォータを使用できるようになります。
説明ここでワークスペースを関連付けない場合でも、後でリソースクォータの詳細ページでバインドできます。
-
-
クォータリソース情報を設定します。
-
Source Type を選択します。次のタイプがサポートされています。
-
Dedicated Resource Group:リソースプールからリソースグループを選択します。 システムは、このグループからリソースを割り当ててルートクォータを作成します。
-
Existing Resource Quota:既存のリソースクォータからリソースを割り当てて、子クォータを作成します。
親クォータと子クォータの関係についての詳細は、「リソースクォータ (Quota)」をご参照ください。
-
-
ドロップダウンリストから、既存の専用リソースグループまたはリソースクォータを選択します。
-
Add をクリックし、既存のリソースクォータまたは専用リソースグループから Nodes / Instance Type を選択します。
-
-
スケジューリング情報を設定します。
-
Scheduling Policy:計算リソースの使用率を向上させるためのスケジューリングポリシーを選択します。次のポリシーがサポートされています。
-
インテリジェント
-
バランス
-
トラバーサル
-
FIFO
各スケジューリングポリシーの仕組みについては、「スケジューリングポリシー」をご参照ください。
-
-
Child-level Preemption (オプション):有効にすると、リソースが不足している場合に、現在のリソースクォータでキューに入っているタスクが、その子クォータで実行中のタスクをプリエンプトできます。詳細については、「子レベルのプリエンプションを有効にする」をご参照ください。
-
Self-level Preemption (オプション):有効にすると、リソースが不足している場合に、現在のリソースクォータでキューに入っているタスクが、同じレベルの他のクォータで実行中のタスクをプリエンプトできます。詳細については、「同一レベルのプリエンプションを有効にする」をご参照ください。
-
Idle Sharing:デフォルトで有効になっています。これにより、アイドル状態のタスクが、同じレベルおよび子クォータの利用可能なリソースを使用できます。
-
-
(Lingjun AI 計算リソースクォータのみ) ネットワーク情報を設定します。
リソースクォータ内のインスタンスが指定された VPC ネットワークリソースにアクセスできるように、ネットワーク設定を構成します。
-
VPC:既存の VPC を選択します。
-
Security Group:既存のセキュリティグループを選択します。
-
vSwitch:既存の vSwitch を選択します。
-
Default Internet Gateway (任意): インターネットにアクセスする必要がある場合は、このスイッチを有効にして、NAT Gateway と EIP を選択します。
-
-
OK をクリックします。
リソースクォータを作成すると、リソースクォータのリストに表示されます。

リソースクォータの使用
リソースクォータを作成した後、ワークスペースにバインドし、AI の開発と推論に適したイメージを選択する必要があります。
ワークスペースへのバインド
AI の開発と推論にリソースクォータを使用する前に、ワークスペースにバインドする必要があります。次の手順に従ってください。
リソースクォータの作成時にすでにワークスペースを関連付けている場合は、この手順をスキップできます。
-
[リソースクォータ (Quota)] ページで、リソースクォータの名前をクリックします。
-
Overview タブの Basic Information セクションで、ワークスペースの横にある
アイコンをクリックして、関連付けられたワークスペースを追加または変更します。
リソースクォータをワークスペースにバインドした後、ワークスペースの詳細内の [スケジューリング設定] ページでその使用ポリシーを設定することもできます。詳細については、「ワークスペーススケジューリングセンター」をご参照ください。
イメージの選択
PAI Lingjun リソースクォータを分散トレーニング (分散学習コンテナ (DLC)) に使用する場合、サーバー、ネットワーク、ドライバー、トレーニングフレームワークなどのソフトウェアとハードウェアの連携が必要になります。そのため、PAI の公式イメージを使用するか、それらをベースにイメージをビルドすることを推奨します。
独自のイメージを使用する場合、Lingjun AI 計算リソースの高性能を最大限に活用するために、ドライバー、フレームワーク、およびソフトウェアのバージョンを整合させるための追加作業が必要になる場合があります。