全部產品
Search
文件中心

Platform For AI:管理資源配額

更新時間:Sep 19, 2025

您可以對已建立的資源配額進行管理操作,包括新增父子級資源配額、擴縮容資源配額、查看資源配額列表及詳情等。

重要

靈駿智算資源,為確保多個節點之間可以高網聯通, 請您確認使用的節點hz編號相同。

建立父子Quota

資源配額頁面,參考以下操作建立父、子級資源配額。建立完成後,資源配額將形成樹形結構(簡稱QuotaTree),從而實現更靈活和精細的資源管理和分配。關於父子級關係圖介紹,請參見功能介紹

  • 建立父級資源配額:單擊新增資源配額,建立根資源配額。詳情請參見雲原生資源配額

  • 建立子級資源配額:通過新增資源配額,或在已有資源配額操作列下,單擊新增子級資源配額,為資源配額新增子級資源配額。

image

Quota擴縮容

資源配額建立完成後,您可以根據任務需求調整其規模,以實現有效成本管理。image

資源配額(Quota)頁面中,單擊目標資源配額操作列下的擴縮容,通過調整來源節點/規格實現資源配額的擴縮容。

  • 擴容:新增或調整資源的來源或規格,為資源配額增加可用資源。

  • 縮容:減少已關聯資源規格的節點數或刪除某些資源規格,釋放閑置資源。

image

查看Quota列表

資源配額頁面中,切換到靈駿智算資源通用計算資源頁簽,分別查看已建立的資源配額列表。image

列表展示資源配額的基礎資訊,包括名稱、類型、所屬工作空間、狀態以及資源量(包括GPU卡數、CPU核心數、記憶體)等資訊。您可以執行以下操作:

  • 篩選資源配額:支援通過名稱/ID狀態過濾資源配額。

  • 按資源量排序:支援查看資源調度量和總量,並按CPU、記憶體或GPU的資源總量和調度量進行排序,以瞭解資源分布和使用方式。

查看Quota詳情

資源配額頁面,切換到靈駿智算資源通用計算資源頁簽,單擊資源配額名稱查看詳情。支援從以下維度查看資源配額詳情並並進行配置變更:

概覽

image

在資源配額詳情頁面,切換到概覽頁簽查看並更新相關配置:

  • 基本資料:包括資源配額名稱、ID以及所屬工作空間等。

    • 單擊image按鈕,更新資源配額名稱歸屬的工作空間以及標籤等。

    • 綁定工作空間後,單擊工作空間名稱即可跳轉至詳情頁面,並在工作空間中使用該資源配額進行AI開發。

  • 資源資訊:包括資源配額所屬的資源群組、父級資源配額及子級資源配額等資訊。如需瞭解父子級資源配額的區別及其關係,請參見建立父子Quota章節中的關係圖。單擊相應資源名稱,可跳轉至目標頁面查看詳情。

  • 網路資訊:用於展示與網路資源相關的配額限制,包括專用網路、安全性群組、NAT Gateway等。通過配置網路資訊來控制資源配額在網路層面的使用範圍,確保資源分派的合理性和安全性。

  • 調度資訊:用於展示與資源配額相關的調度資訊,並支援在該頁面進行配置更新。

    • 調度策略:根據調度策略的實現原理選擇合適的調度策略,提高出隊效率和算力資源的利用率。如何配置調度策略,請參見調度策略

    • 子級算力搶佔 & 本級算力搶佔:在資源緊張時,允許當前資源配額上的排隊任務搶佔子級或本級資源配額上已啟動並執行任務。關於本級與子級資源配額的關係以及搶佔策略的配置方法,請參見搶佔策略

    • 閑時共用:預設開啟,表示本級和子級Quota的資源可以被閑時任務使用。

  • 資源變更歷史:支援查看建立、擴縮容及刪除的操作記錄。記錄中將展示變更類型、發起人、狀態及變更的目標規格等詳細資料。

  • 進階資訊

    • 本機快取:靈駿智算資源配額可以開啟該開關,使用節點本地碟資料緩衝功能,其能夠有效減少重複資料轉送的開銷。詳情請參見靈駿智算本機快取加速

節點

image

在資源配額詳情頁面,切換到節點頁簽,查看和管理資源配額的節點資訊:

  • 節點詳情:包括節點規格所屬專有資源群組名稱、資源佔用量總量(包括GPU卡型GPU卡數CPU核心數等),可用性區域az、高網互聯區hz,以及使用節點建立的任務數執行個體數等。

    • 任務和執行個體詳情:在目標節點任務數執行個體數列,單擊相應的數字,即可查看具體的任務和執行個體詳情。

    • 篩選節點:支援按節點狀態或訂單狀態進行篩選,也可按資源量進行排序。

    • hz(高網互聯區): 靈駿智算情境下,hz表示底層計算資源所在高網地區。相同hz編號的資源之間可以享受高網通訊。

  • 節點狀態:相關狀態說明如下:

    • 已就緒:表示算力節點可用。

    • 未就緒: 表示算力節點進行中初始化等操作。

    • 禁止調度: 表示節點目前無法調度。具體原因如下:

      • 使用者停止調度:使用者手動操作停止調度, 節點無法使用。

      • 已到期:節點訂單到期,無法使用。

      • 自愈中:節點自愈過程中,如果該節點上存在正在啟動並執行任務,請及時停止,以保障節點自愈的正常推進。

      • 未知:其他原因,請聯絡您的商務經理。

  • 管理節點:

    • 停止/啟動調度節點:單擊目標節點操作列下的停止調度啟動調度,即可暫停或啟用該節點的資源使用。

    • 清空節點:單擊目標節點操作列下的清空節點,即可清空該節點上建立的任務(包括DSW、DLC或EAS)。

任務

image

在資源配額詳情頁面,切換到任務頁簽,查看Quota任務資訊,頁面展示排隊中已出隊兩類任務的資源使用方式,包括任務狀態、使用的資源配額、執行個體資訊、GPU卡數、CPU核心數及記憶體大小等關鍵計量。

  • 過濾任務:支援按類型任務狀態進行過濾。

  • 查看詳情:單擊相應的任務名稱、資源配額名稱或工作空間名稱,可跳轉至目標頁面查看詳情。

  • 篩選當前資源配額任務:開啟只看當前資源配額開關,可篩選出使用當前資源配額建立的任務。

使用者

image

在資源配額詳情頁面,切換到使用者頁簽,查看Quota內使用者的資源使用方式,包括GPU卡數、CPU核心數、記憶體大小及任務量等關鍵計量。

  • 篩選當前資源配額使用者:開啟只看當前資源配額的使用者開關,只查看提交任務到當前資源配額的使用者,不包括提交任務到子級資源配額的使用者。

  • 查看任務詳情:單擊目標使用者任務數列下的詳情,查看該使用者提交的任務。您也可以在任務資訊頁面單擊任務名稱,跳轉到目標任務頁面查看詳情。

監控

在資源配額詳情頁面,切換到監控頁簽,查看Quota的監控資訊。

  • 支援展示GPU算力熱力圖(即時使用率)、資源水位和任務狀態分布情況。image

  • 支援從Quota和節點兩個維度查看監控資訊,涵蓋CPU、記憶體、磁碟、網路以及GPU的監控指標。關於監控指標的詳細說明,以及如何通過CloudMonitorARMS,查看監控資料、配置監控警示通知、訂閱監控指標,請參見資源配額監控與警示image

拓撲

在資源配額詳情頁面,切換到拓撲頁簽,查看Quota的拓撲資訊,支援以下兩種資源拓撲結構展示:

  • 資源檢視:展示本級及子級資源配額在CPU、記憶體與GPU資源上的分配情況。image

  • 任務檢視:展示通過本級及子級資源配額建立的總任務數,以及每種任務狀態下的任務數量。image

刪除Quota

您可以在資源配額(Quota)頁面,單擊操作列下的刪除,移除不再使用的資源配額。若該資源配額已被工作空間綁定,請先解除綁定,再進行刪除,詳情請參見概覽

image