親子クォータの作成、スケーリング、リストと詳細の表示によって、リソースクォータを管理できます。
Lingjun AI 計算リソースを使用する場合、高速ネットワーク接続を有効にするために、すべてのノードが同じ HZ 識別子を共有していることを確認してください。
親子クォータの作成
[リソースクォータ] ページで、親と子のリソースクォータを作成します。作成後、これらのクォータはツリー構造 (QuotaTree と呼ばれます) を形成し、より柔軟で詳細なリソース管理と割り当てを可能にします。親子関係の図については、「特徴量」をご参照ください。
親リソースクォータの作成: Add Resource Quota をクリックして、ルートリソースクォータを作成します。詳細については、「クラウドネイティブリソースクォータ」をご参照ください。
子レベルのリソースクォータの作成: 新しいリソースクォータを追加するか、既存のリソースクォータの Actions 列にある New Child-level Resource Quota をクリックします。

クォータの調整
リソースクォータを作成した後、ジョブの要件に応じてそのサイズを調整し、コストを効果的に管理できます。
[リソースクォータ] ページで、対象のリソースクォータを見つけ、Actions 列の Scale をクリックします。Source または Nodes/Instance Type を調整することで、リソースクォータをスケーリングできます。
スケールアップ: 新しいソースや仕様を追加するか、既存のものを調整して、クォータの利用可能なリソースを増やします。
スケールダウン: 関連する仕様のノード数を減らすか、特定の仕様を削除して、アイドルリソースを解放します。

クォータリストの表示
[リソースクォータ] ページで、Lingjun Intelligent Computing resources または General Computing Resources タブに切り替えて、ご利用のリソースクォータを表示します。
リストには、各リソースクォータの基本情報 (名前、タイプ、関連ワークスペース、ステータス、リソース量 (GPU カード数、CPU コア、メモリなど)) が表示されます。以下の操作を実行できます:
リソースクォータのフィルター: [名前/ID] または [ステータス] でクォータをフィルターできます。
リソース量によるソート: CPU、メモリ、または GPU リソースの合計量または割り当て済み量でソートして、リソースの分布と使用量を確認します。
クォータ詳細の表示
[リソースクォータ] ページで、Lingjun Intelligent Computing resources または General Computing Resources タブに切り替え、リソースクォータ名をクリックして詳細を表示します。以下のタブで詳細の表示と構成の変更ができます:
概要

リソースクォータ詳細ページの Overview タブで、構成の表示と更新ができます:
Basic Information: リソースクォータ名、ID、関連ワークスペースが含まれます。
編集アイコン
をクリックして、Resource Quota Name、関連ワークスペース、Tag を更新します。ワークスペースを関連付けた後、ワークスペース名をクリックしてその詳細ページに移動できます。その後、そのワークスペースで AI 開発にリソースクォータを使用できます。
Resource Information: リソースクォータが属するリソースグループ、およびその親子クォータが含まれます。親子リソースクォータの関係に関する詳細については、「親子クォータの作成」セクションの図をご参照ください。リソース名をクリックすると、その詳細が表示されます。
Network Information: VPC、セキュリティグループ、NAT Gateway などのネットワークリソースに関連するクォータ制限を表示します。この情報を構成することで、リソースクォータのネットワーク範囲を制御し、リソースが安全に割り当てられるようにします。
Scheduling Information: リソースクォータのスケジューリング情報を表示します。このページで更新できます。
Scheduling Policy: ニーズに合ったスケジューリングポリシーを選択して、ジョブのデキュー効率とリソース使用率を向上させます。スケジューリングポリシーの設定方法については、「スケジューリングポリシー」をご参照ください。
Child-level Preemption&Self-level Preemption: リソースが不足している場合、現在のリソースクォータのキュー内のジョブが、その子レベルまたは自己レベルのクォータで実行中のジョブをプリエンプトできるようにします。自己レベルと子レベルのリソースクォータの関係、およびプリエンプションポリシーの設定方法の詳細については、「プリエンプションポリシー」をご参照ください。
Idle Sharing: デフォルトで有効になっています。これにより、アイドル状態のジョブが現在のクォータとその子クォータのリソースを使用できます。
Resource Change History: 作成、スケーリング、削除操作の履歴を表示します。履歴には、変更タイプ、開始者、ステータス、ターゲット仕様などの詳細が含まれます。
Advanced Information:
Enable Local Cache: Lingjun AI 計算リソースクォータの場合、この機能を有効にしてノードのローカルキャッシュを使用できます。これにより、繰り返しデータアクセスする際のデータ転送オーバーヘッドが削減されます。詳細については、「Lingjun AI 計算リソースのローカルキャッシュアクセラレーション」をご参照ください。
ノード

リソースクォータ詳細ページの Nodes タブで、クォータのノード情報を表示および管理します:
ノード詳細: Node Specification、Dedicated Resource Group Name/ID、リソースの In Use と Total 量 (GPU Type、Number of GPUs、CPU Cores など)、ゾーン (AZ)、高速ネットワーク相互接続ゾーン (HZ)、およびノード上に作成された Tasks と Instances が含まれます。
ジョブとインスタンスの詳細: 対象ノードの Tasks と Instances 列で、対応する番号をクリックして、特定のジョブとインスタンスの詳細を表示します。
ノードのフィルター: ノードステータスまたは注文ステータスでノードをフィルターしたり、リソース量でソートしたりできます。
HZ (高速ネットワーク相互接続ゾーン): Lingjun AI 計算リソースを含むシナリオでは、HZ は基盤となる計算リソースが配置されている高速ネットワークリージョンを示します。同じ HZ 識別子を持つリソースは、高速ネットワークを介して通信できます。
Node Status: 次のステータスがサポートされています:
Ready: 計算ノードが利用可能であることを示します。
Not Ready: 計算ノードが初期化中であることを示します。
Scheduling Disabled: ノードがスケジュールできないことを示します。考えられる原因は次のとおりです:
Stopped by User: ユーザーがノードのスケジューリングを手動で無効にしました。
Expired: ノードのサブスクリプションが期限切れになりました。
回復中: ノードは回復プロセス中です。このノードでジョブが実行されている場合は、回復プロセスを中断しないように、速やかに停止してください。
不明: 原因は不明です。サポートが必要な場合は、アカウントマネージャーにお問い合わせください。
ノードの管理:
ノードのスケジューリングの停止/開始: 対象ノードの Actions 列で、Stop Scheduling または Start Scheduling をクリックして、そのノードでのリソーススケジューリングを一時停止または再開します。
ノードのクリア: 対象ノードの Actions 列で、Clear Node をクリックして、そのノード上のすべてのジョブ (DSW、DLC、または EAS ジョブを含む) を終了します。
ジョブ

リソースクォータ詳細ページの Job タブで、クォータのジョブ情報を表示します。このページには、Queuing と Dequeued のジョブのリソース使用量が表示され、ジョブステータス、リソースクォータ、インスタンス情報、GPU カード数、CPU コア、メモリサイズなどの主要メトリクスが含まれます。
ジョブのフィルター: [タイプ] または [ジョブステータス] でフィルターします。
詳細の表示: ジョブ名、リソースクォータ名、またはワークスペース名をクリックして、対応する詳細ページに移動します。
現在のクォータ内のジョブをフィルター: [現在のリソースクォータを表示] スイッチを有効にすると、このクォータ内で作成されたジョブのみが表示されます。
ユーザー

リソースクォータ詳細ページの User タブで、クォータ内のユーザーごとのリソース使用量を表示します。これには、GPU カード数、CPU コア、メモリサイズ、ジョブ数などの主要メトリクスが含まれます。
現在のクォータのユーザーをフィルター: [現在のリソースクォータのユーザーを表示] スイッチを有効にすると、子クォータではなく、このクォータに直接ジョブを送信したユーザーのみが表示されます。
ジョブ詳細の表示: ユーザーの Number of Tasks 列で、Details をクリックして、そのユーザーが送信したジョブを表示します。次のジョブリストページで、ジョブ名をクリックしてその詳細を表示できます。
モニタリング
リソースクォータ詳細ページの Monitoring タブで、クォータのモニタリング情報を表示します。
GPU 計算能力ヒートマップ (リアルタイム使用率)、リソースレベル、ジョブステータスの分布が表示されます。

クォータとノードの 2 つの観点からモニタリング情報を表示できます。これには、CPU、メモリ、ディスク、ネットワーク、GPU のメトリクスが含まれます。メトリクスの詳細、および CloudMonitor と ARMS を使用したデータの表示、アラートの設定、メトリクスのサブスクライブ方法については、「リソースクォータのモニタリングとアラート」をご参照ください。

トポロジー
リソースクォータ詳細ページの Topology タブで、クォータのトポロジーを表示します。2 つのビューが利用可能です:
リソースビュー: 現在のクォータとその子クォータの CPU、メモリ、GPU リソースの割り当てを表示します。

ジョブビュー: 現在のクォータとその子クォータで作成されたジョブの総数と、ステータス別のジョブの内訳を表示します。

クォータの削除
Resource Quota ページで、Actions 列の Delete をクリックして、未使用のリソースクォータを削除できます。リソースクォータを削除する前に、ワークスペースとの関連付けを解除する必要があります。詳細については、「概要」をご参照ください。
