PAI提供了多級資源配額(Quota)能力,支援您將PAI算力資源按層級進行劃分,以便靈活管理和分配資源。此外,您可以啟用本級或子級算力搶佔功能,允許在當前資源配額中提交的任務搶佔同級或子級資源配額的算力資源,從而充分利用算力資源。
資源配額(Quota)層級說明
PAI支援將算力資源按照企業組織架構的層級劃分為父子級資源配額,形成如下圖所示的樹狀結構(簡稱QuotaTree),以實現更靈活和精細的資源管理和分配。這種層級劃分不僅使資源管理更加符合企業的實際需求,還提高了資源使用的效率和靈活性。
如上圖所示,將算力資源拆分為了三級。其中:
Root | Quota是父級,Quota-1、Quota-2...Quota-n是其子級且互為同級。
Quota-1是Quota-1.1和Quota-1.2的父級,而Quota-1.1和Quota-1.2互為同級且是Quota-1的子級。Quota-2到Quota-n也遵循同樣的結構。
您可以基於組織或專案來劃分和使用資源配額(Quota),從而更好地管理和使用各自的任務及資源。當資源緊張時,您可以構建多級資源配額(Quota),開啟產品提供的搶佔策略,實現資源的最大利用率:
適用情境:當使用同級資源配額(例如Quota-1、Quota-2或Quota-n)建立的任務需要優先執行且資源緊張時。
處理機制:系統將通過靈活的資源調度機制,從同級資源配額中調度算力資源,確保關鍵任務能夠獲得所需的計算資源。
樣本:為Quota-1開啟本級算力搶佔,資源緊張時,允許當前資源配額上的排隊任務搶佔本級已啟動並執行任務的資源。
適用情境:當同級資源配額緊缺,不能滿足任務需求時。
處理機制:系統將通過靈活的資源調度機制,從子級資源配額中調度算力資源,確保關鍵任務能夠獲得所需的計算資源。
樣本:為Quota-1開啟子級算力搶佔,當使用該資源配額建立的任務算力不足時,可以搶佔Quota-1.1和Quota-1.2的資源。
開啟本級算力搶佔
操作方法
在建立或編輯資源配額時,為資源配額開啟本級算力搶佔。
當多個任務同時提交到該資源配額時,系統將依據最優策略來分配搶佔當前層級的計算資源,具體策略說明如下:
搶佔策略 | 描述 |
高優先順序 | 支援搶佔本級算力資源的任務執行優先順序。取值範圍:[1,9],支援單選或按範圍選擇。其中數字越大表示優先順序越高,數字越小表示優先順序越低。 |
搶佔低優先順序 | 支援被搶佔算力資源的任務執行優先順序。取值範圍:[1,9],支援單選或按範圍選擇。其中數字越大表示優先順序越高,數字越小表示優先順序越低。 說明 設定的搶佔低優先順序需小於設定的高優先順序。 |
可被搶佔模組 | 當資源配額的算力資源不足時,系統支援搶佔同級資源配額下指定模組的算力資源,包括DLC、DSW或EAS模組。 |
使用樣本
搶佔配置:
按照下圖設定搶佔配置:

高優先順序:按範圍,設定為6~9。
搶佔低優先順序:按單選,設定為4。
可被搶佔模組:選擇DLC和DSW。
效果:
當使用該資源配額建立的任務優先順序為6~9且算力資源不足時,系統可以搶佔同級資源配額下,優先順序為4的DLC或DSW模組的算力資源。
開啟子級算力搶佔
操作方法
在建立或編輯資源配額時,為資源配額開啟子級算力搶佔。
當使用父級資源配額提交任務且算力資源不足時,系統會按照最優策略回收子級Quota中正在啟動並執行任務的算力資源,以保障父級資源配額任務的運行。具體策略說明如下:
搶佔策略 | 描述 |
可被搶佔優先順序 | 支援被搶佔的使用子級資源配額建立的任務執行優先順序。取值範圍:[1,9],支援按範圍進行選擇。其中數字越大表示優先順序越高,數字越小表示優先順序越低。 |
可被搶佔模組 | 當父級資源配額的算力資源不足時,系統支援搶佔使用子級資源配額建立的指定模組的算力資源,包括DLC、DSW或EAS模組。 |
使用樣本
搶佔配置:
按照下圖設定搶佔配置:

可被搶佔優先順序:設定為1~3。
可被搶佔模組:選擇DLC和DSW。
效果:
當使用父級資源配額建立任務且算力資源不足時,系統可以搶佔使用子級資源配額建立的,優先順序為1~3的DLC或DSW模組的算力資源。
相關文檔
使用預付費資源配額(Quota)建立的分布式訓練(DLC)任務支援使用閑時資源,詳情請參見使用閑時資源。