Elastic High Performance Computing (E-HPC) クラスタでノードとして Elastic Compute Service (ECS) インスタンスを使用している場合は、サブミッターを使用して E-HPC ポータルでクラスタにジョブを投入できます。このトピックでは、サブミッターを使用して E-HPC ポータルでジョブを投入する方法について説明します。
前提条件
クラスタが [実行中] 状態であること。
開始前の準備
ジョブファイルを準備し、クラスタにアップロードします。
E-HPC ポータルでは、次のアップロード方法がサポートされています。
データ管理モジュールを使用する: クラスタフォルダでジョブファイルを作成および編集したり、ローカルファイルをクラスタにアップロードしたり、Object Storage Service (OSS) バケットからファイルをクラスタにダウンロードしたりできます。
クラスタに接続してファイルを作成する: E-HPC ポータルの右上隅にある
アイコンをクリックしてクラスタに接続し、コマンドを実行してジョブファイルを作成できます。
手順
E-HPC ポータルにログインします。
詳細については、「E-HPC ポータルへのログイン」をご参照ください。
上部のナビゲーションバーで、[タスク管理] をクリックします。
ページの上部で、[サブミッター] をクリックします。
[ジョブの作成] ページで、次のパラメータを指定します。
説明同じジョブを繰り返し投入する場合は、パラメータを設定した後、[テンプレートとして保存] をクリックします。これにより、後でジョブを投入する際に、ページの左側にあるテンプレートを選択して簡単に行うことができます。
基本パラメータ
パラメータ
説明
ユーザー名
クラスタが Slurm クラスタで、ルートユーザーとして E-HPC ポータルにログインしている場合は、ルートユーザーまたは特定の一般ユーザーとしてジョブを投入できます。
重要ルート以外のユーザーを指定する場合は、そのユーザーが E-HPC ポータルにログインしてジョブを投入したことがあることを確認してください。
ジョブ名
ジョブの名前。
ジョブファイルを自動的にダウンロードして展開する必要がある場合は、展開ディレクトリにジョブ名と同じ名前が付けられます。
入力ファイル
ジョブの入力ファイル。コマンドラインタグ(例:
-input)を入力し、入力ファイル(例:/home/testuser/in.txt)を選択します。出力ファイル
ジョブの出力ファイル。コマンドラインタグ(例:
-output)を入力し、出力ファイルのパス(例:/home/testuser/out.txt)を入力します。キュー
ジョブを実行するキュー。
クラスタの作成時にキューに計算ノードを追加した場合は、ジョブをそのキューに投入する必要があります。そうしないと、ジョブは実行に失敗します。キューに計算ノードを追加しなかった場合は、ジョブはスケジューラのデフォルトキューに投入されます。
コマンド
スケジューラに送信するジョブ実行コマンド。テキストコマンドまたはスクリプトファイルの相対パスを入力できます。 E-HPC ポータルでは、次の方法がサポートされています。
オンライン編集
オンプレミスファイル
アップロードされたファイル
説明スクリプトファイルが直接実行可能な場合は、相対パス(例:
./job.pbs)を指定できます。スクリプトファイルが実行可能でない場合は、実行コマンド(例:
/opt/mpi/bin/mpirun /home/test/job.pbs)を入力する必要があります。
優先度
ジョブの優先度。有効な値: 0 ~ 9。値が大きいほど、優先度が高くなります。
クラスタのスケジューリングポリシーを設定する際に、ジョブの優先度でジョブをスケジュールするように指定した場合、優先度の高いジョブが最初にスケジュールされて実行されます。
ノード数
ジョブの実行に使用する計算ノードの数。
タスク数
各計算ノードがジョブの実行に使用するタスクの数、つまりプロセスの数。
スレッド数
各タスクが使用するスレッドの数。このパラメータはデフォルトでは空のままです。これは、スレッド数が 1 であることを示します。
GPU 数
各計算ノードがジョブの実行に使用する GPU の数。このパラメータを指定する場合は、計算ノードが GPU インスタンスであることを確認してください。
詳細パラメータ
パラメータ
説明
MPI プロファイル
MPI パフォーマンスプロファイリングを有効にするかどうかを指定します。
最大メモリ
各計算ノードがジョブの実行に使用できる最大メモリ。このパラメータはデフォルトでは空のままです。これは、制限がないことを示します。値は
数量+単位形式です。例: 1GB または 200MB。最大ウォールタイム
ジョブの最大実行期間。指定された期間を超えると、ジョブは失敗します。このパラメータはデフォルトでは空のままです。これは、制限がないことを示します。例:
01:00:00(1 時間を示します)。標準出力パス
ジョブ関連のログが保存されるパス。パスに対する書き込み権限があることを確認してください。デフォルトでは、ログファイルはスケジューラの動作に基づいて出力されます。
環境変数
ビジネス要件に基づいて追加する環境変数。
[投入] をクリックします。
その他の操作
投入されたジョブは、タスク管理ページでクエリできます。詳細については、「ジョブのクエリ」をご参照ください。