全部產品
Search
文件中心

Elastic High Performance Computing:通過submitter提交作業

更新時間:Apr 24, 2025

對於節點為ECS執行個體的叢集,在E-HPC Portal上,您可以通過submitter提交作業。本文介紹如何通過submitter提交作業。

前提條件

叢集狀態處於運行中

準備工作

提交作業前,您需要準備好作業檔案,並上傳到E-HPC叢集中。

E-HPC Portal支援以下方式上傳作業檔案:

  • 通過資料管理功能:支援直接在叢集檔案夾下建立並編輯作業檔案,或者從本地上傳作業檔案到叢集,也可以從OSS Bucket中下載檔案到叢集。

  • 通過遠端連線功能:在右上方單擊串連.png表徵圖可以遠端連線叢集,然後執行命令建立作業檔案。

操作步驟

  1. 開啟並登入E-HPC Portal。

    具體操作,請參見登入E-HPC Portal

  2. 在頂部導覽列,選擇任務管理

  3. 在頁面上方,單擊submitter

  4. 建立作業頁面,填寫以下作業資訊。

    說明

    如果後續需要重複提交相同的作業,可以在配置完作業資訊後,單擊另存新檔模板,將當前配置資訊儲存為模板。在下一次提交作業時,可以在頁面左側選擇模板。

    • 基本參數

      參數

      說明

      使用者名稱稱

      如果您的叢集類型為SLURM,並且以root使用者登入E-HPC Portal,則您可以選擇以root或者其他指定的普通使用者身份提交作業。

      重要

      指定非root使用者時,請確保目標使用者已登入並使用E-HPC Portal提交過作業任務。

      作業名稱

      作業的名稱。

      如果需要自動下載解壓作業檔案,解壓目錄也將以作業名稱進行命名。

      輸入檔案

      作業的輸入檔案。請先輸入命令列標記(例如-input),然後選擇輸入檔案(例如/home/testuser/in.txt)。

      輸出檔案

      作業的輸出檔案。請先輸入命令列標記(例如-output),然後輸入輸出檔案的路徑(例如/home/testuser/out.txt)。

      作業隊列

      運行作業的隊列。

      如果計算節點已加入到指定隊列中,則必須將作業提交到對應的隊列,否則作業會執行失敗;如果計算節點沒有排入佇列,則預設將作業提交到調度器所在的預設隊列中。

      執行命令

      向調度器提交的作業執行命令,可以是指令檔,也可以是一段命令文本。您可以通過以下三種方式提交:

      • 線上編輯

      • 本地檔案

      • 上傳檔案

      說明
      • 如果指令檔可執行,可以填寫相對路徑,如./job.pbs

      • 如果指令檔沒有可執行許可權,則需要填寫執行命令,如:/opt/mpi/bin/mpirun /home/test/job.pbs

      優先順序

      作業啟動並執行優先順序。取值範圍為0~9,取值越大,優先順序越高。

      如果叢集的調度原則設定為根據優先順序調度,高優先順序的作業會被優先調度運行。

      計算節點數

      用來運行此作業的計算節點數。

      任務數

      每個計算節點運行此作業使用的任務數,即進程數。

      線程數

      每個任務所使用的線程數。預設為空白,表示線程數為1。

      Gpu數

      每個計算節點運行此作業使用的GPU數。配置該參數時請確保計算節點為GPU執行個體。

    • 進階參數

      參數

      說明

      MPI效能剖析

      選擇是否開啟MPI效能剖析。

      最大記憶體

      每個計算節點運行此作業可使用的最大記憶體。預設為空白,表示不限制記憶體大小。格式為數量+單位,例如1GB,200MB等。

      最大執行時間

      作業最長已耗用時間,逾時作業將執行失敗,預設為空白,表示不限制已耗用時間。例如1小時可填寫01:00:00

      記錄檔

      作業相關日誌的儲存路徑,確保擁有可寫入權限的路徑,預設按照調度器行為輸出檔案。

      添加環境變數

      根據需要添加環境變數。

  5. 單擊提交作業

後續步驟

提交作業後,您可以在任務管理頁面下方查詢作業。具體操作,請參見查詢作業