Platform for AI (PAI) は、複数レベルのクォータ機能を提供しており、コンピューティングリソースを階層に分割して柔軟な管理と割り当てが可能です。また、同一レベルまたは子レベルのプリエンプションを有効にすることで、クォータに送信されたジョブが同一レベルまたは子レベルのクォータからコンピューティングリソースをプリエンプションし、リソース使用率を最大化できます。
クォータ階層
PAI では、組織構造に基づいてコンピューティングリソースを親レベルと子レベルのクォータに分割できます。これにより、クォータツリーとして知られるツリー状の階層が作成され、より柔軟できめ細かいリソース管理と割り当てが可能になります。この階層モデルは、リソース管理をビジネスニーズに合わせ、リソース使用の効率と柔軟性を向上させます。
上の図に示すように、コンピューティングリソースは 3 階層に分割されています:
ルート | クォータは親レベルのクォータです。Quota-1、Quota-2、... Quota-n はその子レベルのクォータであり、同一レベルにあります。
Quota-1 は Quota-1.1 と Quota-1.2 の親レベルのクォータです。Quota-1.1 と Quota-1.2 は Quota-1 の子レベルのクォータであり、同一レベルにあります。Quota-2 から Quota-n までも同様の構造が適用されます。
組織やプロジェクトに基づいてクォータを分割して使用することで、ジョブとリソースをより適切に管理できます。リソース競合が発生する期間中、複数レベルのクォータ構造を作成し、プリエンプションポリシーを有効にすることで、リソース使用率を最大化できます:
利用シーン:優先度の高いジョブを実行する必要があるが、割り当てられたクォータ (例:Quota-1、Quota-2、または Quota-n) の利用可能なリソースが不足している場合。
仕組み:システムは、同一レベルの他のクォータからコンピューティングリソースをプリエンプションし、重要なジョブに必要なリソースを提供します。
例:Quota-1 に対して同一レベルのプリエンプションを有効にすると、このクォータ内のキューにあるジョブは、リソースが制約されている場合に、同一レベルのクォータで実行中のジョブからリソースをプリエンプションできます。
利用シーン:親レベルのクォータのリソースがジョブに対して不足している場合。
仕組み:システムは、子レベルのクォータのジョブからコンピューティングリソースを回収し、重要な親レベルのジョブを実行します。
例:Quota-1 に対して子レベルのプリエンプションを有効にすると、Quota-1 に送信されたジョブは、コンピューティングリソースが不足している場合に、Quota-1.1 および Quota-1.2 からリソースをプリエンプションできます。
同一レベルのプリエンプションの有効化
操作手順
クォータを作成または編集する際に、同一レベルのプリエンプションを有効にします。
このクォータに複数のジョブが送信された場合、システムは以下のポリシーを使用して、同一レベルのクォータからコンピューティングリソースをプリエンプションします:
プリエンプションポリシー | 説明 |
高優先度 | 同一レベルのクォータからコンピューティングリソースをプリエンプションできるジョブの優先度。有効な値:[1,9]。単一選択または範囲による選択をサポートします。数値が大きいほど優先度が高くなります。 |
低プリエンプション優先度 | コンピューティングリソースをプリエンプションされる可能性のあるジョブの優先度。有効な値:[1,9]。単一選択または範囲による選択をサポートします。数値が大きいほど優先度が高くなります。 説明 低プリエンプション優先度は、高優先度よりも低く設定する必要があります。 |
プリエンプション可能なモジュール | 現在のクォータのリソースが不足している場合に、システムがリソースをプリエンプションできる同一レベルのクォータ内のモジュールを指定します。サポートされているモジュールには、Deep Learning Containers (DLC)、Data Science Workshop (DSW)、Elastic Algorithm Service (EAS) が含まれます。 |
例
設定:
以下図のようにプリエンプションポリシーを設定します:

High Priority:6 から 9 の範囲に設定します。
Low Preemption Priority:単一の値 4 に設定します。
プリエンプション可能なモジュール:DLC と DSW を選択します。
結果:
優先度が 6 から 9 のジョブがこのクォータに送信され、コンピューティングリソースが不足している場合、システムは同一レベルのクォータにある優先度 4 の DLC または DSW ジョブからコンピューティングリソースをプリエンプションできます。
子レベルのプリエンプションの有効化
操作手順
クォータを作成または編集する際に、子レベルのプリエンプションを有効にします。
親レベルのクォータに送信されたジョブに対してリソースが不足している場合、システムは子レベルのクォータのジョブからリソースを回収します。このプロセスは、以下の表で説明するポリシー設定によって管理され、親レベルのジョブの実行を保証します。
プリエンプションポリシー | 説明 |
プリエンプション可能な優先度 | 子レベルのクォータでプリエンプション可能なジョブの優先度。有効な値は 1 から 9 の範囲です。数値が大きいほど優先度が高くなります。 |
プリエンプション可能なモジュール | 親レベルのクォータのリソースが不足している場合に、システムがリソースをプリエンプションできる子レベルのクォータ内のモジュールを指定します。サポートされているモジュールには、DLC、DSW、EAS が含まれます。 |
例
設定:
以下図のようにプリエンプションポリシーを設定します:

プリエンプション可能な優先度:1 から 3 の範囲に設定します。
プリエンプション可能なモジュール:DLC と DSW を選択します。
結果:
ジョブが親レベルのクォータに送信され、そのコンピューティングリソースが不足している場合、システムはどの子レベルのクォータからでも、優先度が 1 から 3 の DLC または DSW ジョブからリソースをプリエンプションできます。
関連ドキュメント
サブスクリプションクォータで作成された分散トレーニング (DLC) のジョブは、アイドルリソースを使用できます。詳細については、「アイドルリソースの使用」をご参照ください。