クォータのプリエンプションポリシー - Platform For AI - Alibaba Cloud ドキュメントセンター

Platform for AI (PAI) は複数レベルのクォータを提供します。これにより、計算リソースをさまざまなレベルに分割して、柔軟な管理と割り当てを行うことができます。子レベルまたは自己レベルのプリエンプション機能を有効にすることで、現在のリソースクォータで実行されているジョブが、同じレベルまたは子レベルのクォータで実行されているジョブの計算リソースをプリエンプトできるようにすることができます。このようにして、計算リソースを最大限に活用できます。

クォータレベル

PAI では、企業の組織構造に基づいて、計算リソースを親子レベルのクォータに分割できます。次の図は、ツリー状構造の計算リソースのクォータを示しています。これにより、計算リソースを柔軟かつ詳細に管理および割り当てることができます。階層構造により、リソース管理が企業の実際の要件に沿ったものになり、リソース活用の効率と柔軟性が向上します。

計算リソースは、前の図に示すように、3 つのレベルに分割されます。

ルートクォータは親レベルのクォータであり、Quota-1、Quota-2、...、Quota-n はルートクォータの子レベルのクォータです。子レベルのクォータは、同じレベルのクォータと見なされます。
Quota-1 は Quota-1.1 と Quota-1.2 の親レベルのクォータです。Quota-1.1 と Quota-1.2 は Quota-1 の子レベルのクォータです。子レベルのクォータは、同じレベルのクォータと見なされます。同じルールが Quota-2、...、Quota-n にも適用されます。

組織またはプロジェクトに基づいてクォータを分割および使用して、ジョブとリソースをより効率的に管理できます。リソースが不足している場合は、複数レベルのクォータを作成し、プロダクトで提供されるプリエンプションポリシーを有効にして、リソースの利用率を最大化できます。

自己レベルのプリエンプションを有効にする:
- シナリオ: Quota-1、Quota-2、Quota-n など、同じレベルのクォータを使用して作成されたジョブを優先的に実行する必要があり、リソースが不足しています。
- 処理メカニズム: システムは、柔軟なリソーススケジューリングメカニズムを提供して、同じレベルの計算リソースをスケジュールします。これにより、主要なジョブで計算リソースを使用できるようになります。
- 例：Quota-1 に対してクォータ内の計算能力のプリエンプションを有効にすると、リソースが不足している場合に、キュー内のジョブが同じリソースクォータ内の実行中のジョブからリソースをプリエンプトできるようになります。
子レベルのプリエンプションを有効にする:
- シナリオ: 同じレベルのクォータが不足しており、ジョブの要件を満たすことができません。
- 処理メカニズム: システムは、柔軟なリソーススケジューリングメカニズムを提供して、子レベルの計算リソースをスケジュールします。これにより、主要なジョブで計算リソースを使用できるようになります。
- 例: Quota-1 に対して子レベルのプリエンプションを有効にします。Quota-1 を使用してジョブを作成し、計算リソースが不足している場合、Quota-1.1 と Quota-1.2 のリソースをプリエンプトできます。

自己レベルのプリエンプションを有効にする

手順

クォータを作成または変更するときに、自己レベルのプリエンプションを有効にします。

同じレベルのクォータで複数のジョブが同時に実行されている場合、システムは最適なプリエンプションポリシーに基づいて現在のレベルで計算リソースを割り当てます。次の表に、プリエンプション構成を示します。

プリエンプションポリシー	説明
高優先度	現在のレベルで計算リソースをプリエンプトするジョブが優先的に実行されます。有効値: 1 ～ 9。単一選択または範囲を選択できます。数値が大きいほど優先度が高くなります。数値が小さいほど優先度が低くなります。
低プリエンプション優先度	計算リソースがプリエンプトされるジョブが優先的に実行されます。有効値: 1 ～ 9。単一選択または範囲を選択できます。数値が大きいほど優先度が高くなります。数値が小さいほど優先度が低くなります。説明低プリエンプション優先度の値は、高優先度の値よりも小さくなければなりません。
プリエンプト可能なモジュール	クォータの計算リソースが不足している場合、システムは、同じレベルのクォータで実行されているモジュール (Deep Learning Containers (DLC)、Data Science Workshop (DSW)、Elastic Algorithm Service (EAS) モジュールなど) の計算リソースをプリエンプトできます。

例

プリエンプション構成:
次の図は、プリエンプション構成を示しています。
- [高優先度]: 値を 6 ～ 9 に設定します。
- [低プリエンプション優先度]: 単一選択を選択し、値を 4 に設定します。
- プリエンプティブルモジュール: DLC と DSW を選択します。
効果:
このクォータを使用して作成されたジョブの優先度が 6 ～ 9 で、計算リソースが不足している場合、システムは、同じレベルのクォータを使用する優先度 4 の DLC または DSW モジュールの計算リソースをプリエンプトできます。

子レベルのプリエンプションを有効にする

手順

クォータを作成または変更するときに、子レベルのプリエンプションを有効にします。親レベルのクォータでジョブが実行されていて、計算リソースが不足している場合、システムは最適なプリエンプションポリシーに基づいて、ジョブが実行されている子レベルのクォータの計算リソースを再利用します。これにより、親レベルのクォータで実行されているジョブの実行が保証されます。次の表に、プリエンプション構成を示します。

プリエンプションポリシー	説明
プリエンプト可能な優先度	計算リソースがプリエンプトされ、子レベルのクォータを使用して作成されたジョブの優先度。有効値: 1 ～ 9。範囲を指定できます。数値が大きいほど優先度が高くなります。数値が小さいほど優先度が低くなります。
プリエンプト可能なモジュール	親レベルのクォータの計算リソースが不足している場合、システムは、子レベルのクォータで実行されているモジュール (DLC、DSW、EAS モジュールなど) の計算リソースをプリエンプトできます。

手順

プリエンプション構成:
次の図は、プリエンプション構成を示しています。
- [プリエンプト可能な優先度]: 値を 1 ～ 3 に設定します。
- [プリエンプト可能なモジュール]: DLC と DSW を選択します。
効果:
親レベルのクォータを使用してジョブが作成され、計算リソースが不足している場合、システムは、子レベルのクォータを使用する優先度 1 ～ 3 の DLC または DSW モジュールの計算リソースをプリエンプトできます。

参照

DLC でサブスクリプションクォータを使用してトレーニングジョブを送信するときに、アイドルリソースを使用できます。詳細については、「アイドルリソースを使用する」をご参照ください。