作成したリソースクォータを管理できます。たとえば、親子リソースクォータの追加、リソースクォータのスケールアップまたはスケールダウン、リソースクォータリストと詳細の表示ができます。
Lingjun リソースの場合、すべてのノードが同じ周波数であることを確認して、ノード間の高速ネットワーク接続を確保してください。
親子クォータの作成
リソースクォータ ページで、次の手順に従って親リソースクォータと子リソースクォータを作成します。作成後、リソースクォータはツリー構造(QuotaTree)を形成し、柔軟で細かいリソース管理と割り当てを実現します。親子関係図の詳細については、「機能」をご参照ください。
親リソースクォータの作成: [新規リソースクォータ] をクリックして、ルートリソースクォータを作成します。詳細については、「クラウドネイティブリソースクォータ」をご参照ください。
子リソースクォータの作成: 新しいリソースクォータを作成するか、既存のリソースクォータを見つけて、[アクション] 列の [新規子レベルリソースクォータ] をクリックします。

クォータのスケーリング
リソースクォータを作成した後、効果的なコスト管理のためにそのサイズを調整できます。
リソースクォータ ページで、管理するリソースクォータを見つけ、[アクション] 列の [スケール] をクリックします。表示されたページで、[ソース] パラメーターと [ノード/仕様] パラメーターを変更して、リソースクォータをスケールアップまたはスケールダウンします。
スケールアップ: リソースのソースまたは仕様を追加または調整して、リソースクォータで使用可能なリソースを増やします。
スケールダウン: 関連付けられたリソース仕様のノード数を減らすか、特定のリソース仕様を削除して、アイドル状態のリソースを解放します。

クォータリストの表示
リソースクォータ ページで、[インテリジェントコンピューティング Lingjun リソース] タブまたは [汎用コンピューティングリソース] タブに移動して、作成されたリソースクォータを表示します。
リストには、名前、タイプ、関連付けられたワークスペース、ステータス、リソース量(GPU カード、CPU コア、メモリを含む)など、リソースクォータに関する基本情報が表示されます。次の操作を実行できます。
リソースクォータのフィルタリング: [名前/ID] または [ステータス] でリソースクォータをフィルタリングできます。
リソース量でソート: スケジュールされたリソース量と合計リソース量を表示し、CPU、メモリ、または GPU リソースの合計とスケジュールされた量でソートして、リソースの配布と使用状況を把握できます。
クォータ詳細の表示
リソースクォータ ページで、[インテリジェントコンピューティング Lingjun リソース] タブまたは [汎用コンピューティングリソース] タブに移動し、リソースクォータ名をクリックして詳細を表示します。次のディメンションからリソースクォータの詳細を表示し、構成を変更できます。
概要
詳細ページで、[概要] タブに移動して、関連する構成を表示および更新します:
基本情報: リソースクォータ名、ID、および関連付けられたワークスペースが含まれます。
をクリックして、リソースクォータ名、関連付けられたワークスペース、および タグ を更新します。ワークスペースにバインドした後、ワークスペース名をクリックして詳細ページに移動し、ワークスペースで AI 開発にリソースクォータを使用します。
リソース情報: リソースグループ、親リソースクォータ、および子リソースクォータが含まれます。親リソースクォータと子リソースクォータの違いと関係については、「親子クォータの作成」セクションの図を参照してください。リソース名をクリックして、詳細のターゲットページに移動します。
ネットワーク情報: 仮想プライベートクラウド ( VPC )、セキュリティグループ、NAT ゲートウェイなど、ネットワークリソースクォータの制限が表示されます。ネットワーク情報を構成して、リソースクォータのネットワーク層の使用範囲を制御し、合理的で安全なリソース割り当てを確保します。
スケジューリング情報: リソースクォータに関連するスケジューリング情報が表示され、このページでの構成の更新がサポートされます。
スケジューリングポリシー: 実装原則に基づいて適切なスケジューリングポリシーを選択して、キュー効率とコンピューティングリソースの利用率を向上させます。スケジューリングポリシーの構成の詳細については、「スケジューリングポリシー」をご参照ください。
子レベルプリエンプション & 自己レベルプリエンプション: リソースが限られている場合、現在のリソースクォータでキューに入れられたタスクが、子レベルまたは自己レベルのリソースクォータで実行中のタスクをプリエンプションできるようにします。自己レベルと子レベルのリソースクォータの関係、およびプリエンプションポリシーの構成方法の詳細については、「プリエンプションポリシー」をご参照ください。
アイドルスケジューリング: デフォルトで有効になっており、自己レベルと子レベルのクォータのリソースをアイドルタスクで使用できることを示します。
リソース変更履歴: 作成、スケーリング、削除操作のレコードを表示します。レコードには、変更タイプ、開始者、ステータス、ターゲット仕様の詳細が表示されます。
詳細情報:
ローカルキャッシュ: Lingjun リソースクォータの場合、このスイッチを有効にして、ノードのローカルディスクデータキャッシュ機能を使用できます。この機能は、繰り返しデータ転送のオーバーヘッドを効果的に削減します。詳細については、「Lingjun AI コンピューティングサービスのローカルキャッシュアクセラレーション」をご参照ください。
ノード

詳細ページで、[ノード] タブに移動して、リソースクォータのノード情報を表示および管理します。
ノード詳細: ノード仕様、専用リソースグループ名、リソース使用量と合計量 (GPU カードタイプ、GPU カード数、CPU コアを含む)、利用可能ゾーン (az)、高速ネットワーク相互接続ゾーン (hz)、およびノードを使用して作成されたタスク数とインスタンス数が含まれます。
タスクとインスタンスの詳細: ターゲットノードの [タスク数] 列と [インスタンス数] 列で、対応する番号をクリックして、特定のタスクとインスタンスの詳細を表示します。
ノードのフィルタリング: ノードステータスまたは注文ステータスでフィルタリングし、リソース量でソートできます。
hz: Lingjun AI コンピューティングサービスのシナリオでは、hz は、基盤となる計算リソースが配置されている高速ネットワークエリアを示します。同じ hz 値を持つリソースは、高速ネットワークを介して相互に通信できます。
ノードステータス: ステータスの説明は次のとおりです。
準備完了: コンピューティングノードは使用可能です。
準備未完了: コンピューティングノードは初期化されています。
スケジューリング無効: ノードをスケジュールできません。問題のトラブルシューティングを行うには、次の操作を実行します。
ユーザーによって停止: ノードはユーザーによって手動でスケジューリングが停止されています。
期限切れ: ノードの注文の期限が切れました。
回復中: ノードは回復プロセス中です。このノードで実行中のタスクがある場合は、通常の回復プロセスを確実にするために、すぐに停止してください。
不明: その他の理由については、アカウントマネージャーにお問い合わせください。
ノードの管理:
スケジューリングの停止/開始: ターゲットノードを見つけて、[アクション] 列の [スケジューリングの停止] または [スケジューリングの開始] をクリックして、ノードのリソース使用を一時停止または有効にします。
ノードのクリア: ターゲットノードを見つけて、[アクション] 列の [ノードのクリア] をクリックして、ノードに作成されたすべてのタスク ( DSW 、DLC 、または EAS を含む) をクリアします。
ジョブ

詳細ページで、[ジョブ] タブに移動して、クォータタスク情報を表示します。ページには、[キューイング済み] タスクと [キュー解除済み] タスクのリソース使用状況が表示されます。これには、タスクステータス、使用されたリソースクォータ、インスタンス情報、GPU カード数、CPU コア、メモリサイズが含まれます。
タスクのフィルタリング: [タイプ] または [タスクステータス] でフィルタリングできます。
詳細の表示: タスク名、リソースクォータ名、またはワークスペース名をクリックして、詳細のターゲットページに移動します。
現在のリソースクォータタスクのフィルタリング: [現在のリソースクォータを表示] をオンにすると、現在のリソースクォータを使用して作成されたタスクがフィルタリングされます。
ユーザー

詳細ページで、[ユーザー] タブに移動して、クォータ内のユーザーによるリソース使用状況を表示します。これには、GPU カード数、CPU コア、メモリサイズ、タスクボリュームが含まれます。
現在のリソースクォータユーザーのフィルタリング: [現在のリソースクォータユーザーを表示] をオンにすると、子レベルのリソースクォータにタスクを送信したユーザーを除外して、現在のリソースクォータにタスクを送信したユーザーのみが表示されます。
タスク詳細の表示: ターゲットユーザーを見つけて、[タスク数] 列の [詳細] をクリックして、そのユーザーが送信したタスクを表示します。タスク情報ページでタスク名をクリックして、詳細のターゲットタスクページに移動することもできます。
モニタリング
詳細ページで、[モニタリング] タブに移動して、クォータモニタリング情報を表示します。
GPU 計算能力ヒートマップ (リアルタイム使用状況)、リソース使用レベル、タスクステータス分布を表示できます。

クォータとノードの両方のディメンションからモニタリング情報を表示できます。これには、CPU、メモリ、ディスク、ネットワーク、GPU モニタリングメトリクスが含まれます。モニタリングメトリクス、および CloudMonitor と ARMS を介してモニタリングデータを表示し、モニタリングアラートを構成し、モニタリングメトリクスをサブスクライブする方法の詳細については、「クォータのモニタリングとアラート」をご参照ください。

トポロジー
詳細ページで、[トポロジー] タブに移動して、クォータトポロジー情報を表示します。次の 2 つのリソーストポロジー構造がサポートされています。
リソースビュー: 現在のレベルと子レベルのリソースクォータの CPU、メモリ、GPU リソースの割り当てを表示します。

タスクビュー: 現在のレベルと子レベルのリソースクォータを介して作成されたタスクの総数、および各ステータスのタスクの数を表示します。

クォータの削除
[リソースクォータ] ページで、[アクション] 列の [削除] をクリックして、使用されなくなったリソースクォータを削除できます。リソースクォータがワークスペースにバインドされている場合は、削除する前にバインドを解除してください。詳細については、「概要」をご参照ください。
