本文介紹E-HPC Instant計算服務的使用流程,協助您快速上手使用E-HPC Instant計算服務。
前提條件
使用流程
步驟一:添加應用
E-HPC公用應用中提供了業界主流的科學計算應用、編譯器執行階段程式庫、MPI通訊庫等軟體。如果公用應用列表中沒有您需要的應用和版本,您需要添加應用。
-
登入Instant 計算服務控制台-我的鏡像,單擊添加鏡像。
-
設定鏡像資訊,單擊確定。
-
鏡像類型:
-
虛擬機器鏡像:包含完整作業系統和程式的獨立單元。
-
容器鏡像:僅包含運行特定程式所需的最小環境。
-
-
鏡像:若選擇虛擬機器鏡像,則從下拉式清單中選擇相應的鏡像。若選擇容器鏡像,則需填寫容器鏡像的地址。
-
步驟二:建立作業
-
單擊已上傳的應用下的使用。
系統會自動跳轉到建立作業頁面,並預設選擇該應用。您也可以在Instant 計算服務控制台-作業列表頁面,單擊创建作业。
-
在建立作業頁面,完成以下參數配置。
-
作業資訊
參數項
是否必選
說明
作業名稱
是
填寫作業任務的名稱。需滿足以下條件:
-
長度為2~64個字元。
-
必須以英文字母開頭。
-
僅支援使用英文字母、數字和短劃線(-)。
地區
是
選擇作業執行所在的地區,以便最佳化網路延遲和成本。
調度策略
是
選擇運行作業的調度策略,當前僅支援標準型調度策略。
說明如需使用經濟型調度策略,請提交工單申請。
網路及可用區
是
選擇專用網路和交換器後,E-HPC Instant計算服務會自動為作業執行節點掛載網卡,確保與您的資料存放區(NAS)之間的網路互動。
安全性群組
是
選擇安全性群組後,E-HPC Instant計算服務會自動為作業執行節點添加安全性群組。
單節點Elastic IP Address
否
開啟此功能後,節點將自動申請並分配Elastic IP Address,從而確保節點能夠通過互連網進行訪問。
重要啟用Elastic IP Address會產生額外費用,建議您根據實際需要決定是否啟用單節點Elastic IP Address。
標籤
否
選擇一個或多個標籤,便於後續的資源搜尋和成本分析。更多資訊,請參見標籤。
-
-
任務詳情
參數項
是否必選
說明
計算環境
是
選擇運行作業所需的計算環境。包括以下兩種:
-
雲端服務器
-
容器
應用
是
選擇作業任務啟動並執行具體應用,即鏡像環境。
運行模式
是
選擇執行作業任務的模式,分為以下兩種模式:
-
批次工作:執行使用者命令後自動釋放節點。
-
後台服務:支援長時間運行,需手動刪除作業後才釋放節點。
前處理指令碼
否
填寫在作業開始運行之前需要執行的指令碼命令。
執行命令
條件必選
在作業節點上啟動並執行具體命令或指令碼,當運行模式為批次工作時必選。
-
Linux應用:必須為以
#!開頭,並且後面添加執行程式,例如#!/bin/bash。 -
Windows應用:命令首行必須為
[powershell]或[bat]。
執行節點數
是
設定執行作業任務所需的節點總數。
-
-
任務資源
參數項
是否必選
說明
單節點核數
是
根據業務需求選擇每個執行節點所需的CPU核心數和記憶體大小。
說明單節點的CPU核心數與記憶體大小必須符合固定比例。更多資訊,請參見使用限制。
單節點記憶體大小
是
單節點計算儲存空間
是
所選儲存資源的大小應大於應用鏡像的大小,並且:
-
應用為系統應用時,儲存空間≥40 GiB。
-
應用為個人應用時,儲存空間≥20 GiB。
-
-
訪問外部儲存
參數項
說明
掛載目錄
輸入掛載目錄。
类型
當前僅支援通用型NAS。
檔案系統和挂载点
選擇要掛載的檔案系統ID和掛載點,請確保該檔案系統還有可用的掛載點餘量。
檔案系統目錄
輸入要掛載的檔案系統目錄。
掛載選項
選擇掛載協議。
-
更多設定
參數項
說明
登入密碼
當您需要遠程登入節點時,需要設定登入密碼和確認密碼。
說明僅當計算環境為雲伺服器時才能設定密碼。
確認密碼
資源調度限制
支援以下兩種調度方式:
-
無:支援在指定的VPC下調度資源。
-
僅在指定交換器下:建立的執行節點在指定的交換器下。
-
-
-
參數配置完成後,單擊頁面下方的创建作业。
步驟三:查看作業運行詳情
-
建立完成後,已建立的作業將出現在作業列表中。您可以通過標籤、狀態和時間篩選需要查看的作業。
-
單擊作業ID/名稱列下的目標作業ID或操作列下的查看詳情。
-
在作業詳情頁面,您可以查看作業的基礎資訊、任務運行情況和各個執行節點的狀態。
-
基本資料:展示了作業ID、作業狀態、資源分派策略等基本資料。
-
執行節點情況:展示了運行作業的執行節點情況,包括總執行任務數、運行中任務數、已完成任務數和已終止任務數。
-
任務運行情況:展示了任務個數、任務狀態、運行任務的節點資源等。
-
-
查看作業的運行情況。
-
監控資料:包括CPU利用率、記憶體利用率和磁碟使用率。
-
作業記錄:包括前處理指令碼(PrologScript)和執行命令(Script)的作業記錄。
-
遠程登入:出現異常情況時,您可以登入到執行節點上,排查具體問題。
-