對於節點為ECS執行個體的叢集,在E-HPC Portal上,您可以通過submitter提交作業。本文介紹如何通過submitter提交作業。
前提條件
叢集狀態處於運行中。
準備工作
提交作業前,您需要準備好作業檔案,並上傳到E-HPC叢集中。
E-HPC Portal支援以下方式上傳作業檔案:
通過資料管理功能:支援直接在叢集檔案夾下建立並編輯作業檔案,或者從本地上傳作業檔案到叢集,也可以從OSS Bucket中下載檔案到叢集。
通過遠端連線功能:在右上方單擊
表徵圖可以遠端連線叢集,然後執行命令建立作業檔案。
操作步驟
開啟並登入E-HPC Portal。
具體操作,請參見登入E-HPC Portal。
在頂部導覽列,選擇任務管理。
在頁面上方,單擊submitter。
在建立作業頁面,填寫以下作業資訊。
說明如果後續需要重複提交相同的作業,可以在配置完作業資訊後,單擊另存新檔模板,將當前配置資訊儲存為模板。在下一次提交作業時,可以在頁面左側選擇模板。
基本參數
參數
說明
使用者名稱稱
如果您的叢集類型為SLURM,並且以root使用者登入E-HPC Portal,則您可以選擇以root或者其他指定的普通使用者身份提交作業。
重要指定非root使用者時,請確保目標使用者已登入並使用E-HPC Portal提交過作業任務。
作業名稱
作業的名稱。
如果需要自動下載解壓作業檔案,解壓目錄也將以作業名稱進行命名。
輸入檔案
作業的輸入檔案。請先輸入命令列標記(例如
-input),然後選擇輸入檔案(例如/home/testuser/in.txt)。輸出檔案
作業的輸出檔案。請先輸入命令列標記(例如
-output),然後輸入輸出檔案的路徑(例如/home/testuser/out.txt)。作業隊列
運行作業的隊列。
如果計算節點已加入到指定隊列中,則必須將作業提交到對應的隊列,否則作業會執行失敗;如果計算節點沒有排入佇列,則預設將作業提交到調度器所在的預設隊列中。
執行命令
向調度器提交的作業執行命令,可以是指令檔,也可以是一段命令文本。您可以通過以下三種方式提交:
線上編輯
本地檔案
上傳檔案
說明如果指令檔可執行,可以填寫相對路徑,如
./job.pbs。如果指令檔沒有可執行許可權,則需要填寫執行命令,如:
/opt/mpi/bin/mpirun /home/test/job.pbs。
優先順序
作業啟動並執行優先順序。取值範圍為0~9,取值越大,優先順序越高。
如果叢集的調度原則設定為根據優先順序調度,高優先順序的作業會被優先調度運行。
計算節點數
用來運行此作業的計算節點數。
任務數
每個計算節點運行此作業使用的任務數,即進程數。
線程數
每個任務所使用的線程數。預設為空白,表示線程數為1。
Gpu數
每個計算節點運行此作業使用的GPU數。配置該參數時請確保計算節點為GPU執行個體。
進階參數
參數
說明
MPI效能剖析
選擇是否開啟MPI效能剖析。
最大記憶體
每個計算節點運行此作業可使用的最大記憶體。預設為空白,表示不限制記憶體大小。格式為
數量+單位,例如1GB,200MB等。最大執行時間
作業最長已耗用時間,逾時作業將執行失敗,預設為空白,表示不限制已耗用時間。例如1小時可填寫
01:00:00。記錄檔
作業相關日誌的儲存路徑,確保擁有可寫入權限的路徑,預設按照調度器行為輸出檔案。
添加環境變數
根據需要添加環境變數。
單擊提交作業。
後續步驟
提交作業後,您可以在任務管理頁面下方查詢作業。具體操作,請參見查詢作業。