標準の Elastic High Performance Computing(E-HPC)クラスターはクラウド環境にデプロイされ、Elastic Compute Service(ECS)インスタンスと共有ファイルシステムで構成されます。 ユーザーは、標準 E-HPC クラスターの可用性を独自に管理できます。 このトピックでは、E-HPC コンソールで標準クラスターを作成する方法について説明します。
背景情報
標準の E-HPC パブリッククラウドクラスターは、以下の部分で構成されています。
管理ノード。 ECS インスタンスは管理ノードとして機能し、スケジューラとドメインアカウントサービスがデプロイされてジョブのスケジュールとユーザー情報の管理を行います。
可変数の計算ノード。 各 ECS インスタンスは計算ノードとして機能します。 計算ノードはスケーラブルキューによって管理され、ジョブの実行に使用されます。
ログインノード。 ECS インスタンスはログインノードとして機能し、ログインアドオンがデプロイされ、Elastic IP Address(EIP)がバインドされてクラスターへのリモート接続を可能にします。
共有ファイルシステム。 NAS ファイルシステムまたは Cloud Parallel File Storage(CPFS)ファイルシステムがクラスターにアタッチされ、ジョブデータとアプリケーションデータを保存するために共有されます。
E-HPC クラスターを作成すると、システムは ECS インスタンスなどのリソースを自動的に作成し、料金が発生する場合があります。 詳細については、「課金概要」をご参照ください。
作成済みの E-HPC クラスター内のノードを管理する場合、必要な場合を除き、その目的で ECS コンソール を使用しないでください。 代わりに、E-HPC コンソール を使用してください。
E-HPC クラスターの詳細については、「概要」をご参照ください。
前提条件
E-HPC のサービスロールが作成されていること。 E-HPC コンソールに初めてログインすると、E-HPC のサービスロールを作成するように求められます。
VPC と vSwitch が作成されていること。 詳細については、「VPC の作成と管理」および「vSwitch の作成」をご参照ください。
Apsara File Storage NAS(NAS)がアクティブ化されていること。 NAS ファイルシステムとマウントポイントが作成されていること。 詳細については、「ファイルシステムの作成」および「マウントポイントの作成」をご参照ください。
クラスターを手動で作成する
手順 1:クラスターの作成ページに移動する
[クラスターの作成] ページに移動します。
手順 2:クラスターを構成する
[クラスターの構成] 手順で、クラスターのネットワーク、タイプ、およびスケジューラを構成します。
基本設定
パラメーター
説明
リージョン
クラスターを作成するリージョン。
ネットワークとアベイラビリティーゾーン
クラスターがデプロイされる VPC と、クラスターが属する vSwitch。
説明クラスター内のノードは、vSwitch 内の IP アドレスを使用します。 使用可能な IP アドレスの数がクラスターノードの数よりも多いことを確認してください。
セキュリティグループ
セキュリティグループは、クラスター内のノードのインバウンドトラフィックとアウトバウンドトラフィックを管理するために使用されます。 システムは、自動的に作成されるセキュリティグループのルールを自動的に作成し、クラスター内のノード間の通信を有効にします。
ビジネス要件に基づいて、セキュリティグループタイプを選択します。 基本セキュリティグループと高度なセキュリティグループの違いについては、「基本セキュリティグループと高度なセキュリティグループ」をご参照ください。
クラスタータイプを選択する
標準クラスターは、管理ノードと複数の計算ノードで構成されます。 クラスターのスケジューラタイプを選択し、管理ノードを構成する必要があります。
パラメーター
説明
シリーズ
Standard Edition を選択します。
デプロイメントモード
パブリッククラウドクラスター を選択します。
クラスタータイプ
クラスターのスケジューラタイプを選択します。Slurm、OpenPBS など、主要な HPC ジョブスケジューラがサポートされています。
管理ノード
スケジューラとドメインアカウントサービスがデプロイされる ECS インスタンス。 ビジネスシナリオとクラスターサイズに基づいて、管理ノードに適切なインスタンスタイプを選択します。
課金方法
管理ノードの支払い方法を指定します。 詳細については、「インスタンスタイプ」をご参照ください。
従量課金制:インスタンスの使用後、実際の使用量に基づいて支払います。 プリエンプティブルインスタンスはこの課金方法をサポートしていません。
サブスクリプション:インスタンスを使用する前に、月、または年単位でサブスクリプション料金を支払います。
インスタンスタイプ
ビジネス要件に基づいて、管理ノードのインスタンスタイプを選択します。 以下の項目は、さまざまなクラスターサイズに推奨される管理ノードインスタンスの仕様を示しています。
計算ノード数 ≤ 100:16 個以上の vCPU と 64 GiB 以上のメモリ
100 < 計算ノード数 ≤ 500:32 個以上の vCPU と 128 GiB 以上のメモリ
計算ノード数 > 500:64 個以上の vCPU と 256 以上のメモリ
イメージ
イメージタイプを選択した後、使用するイメージを選択できます。 異なるイメージは異なるオペレーティングシステムに適用されます。 システムは、選択したイメージに基づいてクラスターノードをデプロイします。
説明カスタムイメージを使用する場合は、次の制限事項に注意してください。
E-HPC は、CentOS イメージと、Alibaba Cloud イメージに基づいて作成されたカスタムイメージをサポートしています。 イメージをインポートするときは、[インポート後に確認] が選択されていることを確認してください。 そうしないと、E-HPC コンソールでイメージを識別できません。
別のクラスター用に生成された既存のイメージを使用することはできません。 そうしないと、現在のクラスターの作成後に計算ノードが予期どおりに実行されない場合があります。
カスタムイメージの yum リポジトリ構成を変更することはできません。 そうしないと、クラスターを作成またはスケールアウトできません。
カスタムイメージのマウントディレクトリを
/homeディレクトリまたは/optディレクトリにすることはできません。
ストレージ
管理ノードのシステムディスクの仕様と、管理ノードにデータディスクをアタッチするかどうかを指定します。 ディスクタイプとパフォーマンスレベルの詳細については、「ディスク」をご参照ください。
その他の設定
ハイパースレッディングを有効にするかどうかを指定します。 デフォルトでは、ハイパースレッディングは有効になっています。 ビジネスでより高いパフォーマンスが必要な場合は、ハイパースレッディングを無効にすることができます。
カスタムオプション
パラメーター
説明
スケジューラ
選択したクラスタータイプと構成済みの管理ノードイメージに基づいて、デプロイするスケジューラソフトウェアを選択します。
ドメインアカウント
クラスターで使用するドメインアカウントサービスを選択します。
ドメイン名解決
デフォルト値を使用します。
クラスター後処理スクリプト
計算ジョブの完了後に結果データを処理したり、後続の操作を実行したりするスクリプトを選択します。
クラスターノードの最大数
クラスターに含めることができるノードの最大数を指定します。 このパラメーターと「クラスターのコア数の最大数」パラメーターは、クラスターサイズを共同で制御します。
クラスターのコア数の最大数
クラスター内の計算ノードで使用できる vCPU の最大数を指定します。 このパラメーターと「クラスターノードの最大数」パラメーターは、クラスターサイズを共同で制御します。
クラスター削除保護
クラスターの削除保護機能を有効にするかどうかを指定します。 この機能が有効になっている場合、クラスターをリリースできません。 クラスターをリリースするには、最初にこの機能を無効にする必要があります。 この機能は、誤操作を防ぐのに役立ちます。
リソースグループ
リソースはグループで管理されます。 詳細については、「リソースグループ」をご参照ください。 デフォルトでは、E-HPC クラスターはデフォルトのリソースグループに属しています。 ビジネス要件に基づいて設定を変更できます。
手順 3:計算ノードとキューを構成する
[計算ノードとキュー] 手順で、クラスターのキューと計算ノードを構成します。
計算ノードはキューで管理されます。 ジョブを送信するときに、ジョブを送信するキューを指定できます。 各クラスターには、comp という名前のデフォルトキューがあります。 [さらにキューを追加] をクリックして、クラスターにさらにキューを作成できます。 各キューについて、次のパラメーターを構成する必要があります。
基本設定
パラメーター
説明
自動キュースケーリング
自動キュースケーリング を有効にするかどうかを指定します。 自動キュースケーリングをオンにした後、ビジネス要件に基づいて [自動拡張] または [自動縮小] を選択できます。
自動キュースケーリングを有効にすると、システムは構成またはリアルタイムの負荷に基づいて計算ノードを自動的に追加または削除します。
キュー計算ノード
キュー内のノードの初期数、最大数、および最小数を設定します。
自動キュースケーリングを有効にしない場合は、キュー内の計算ノードの初期数を構成します。
自動キュースケーリングを有効にする場合は、キュー内の計算ノードの最小数と最大数を構成します。
重要[最小ノード数] パラメーターにゼロ以外の値を指定すると、ノードがアイドル状態であっても、クラスターのスケールイン中に指定した値に基づいてキューはノード数を保持します。 キュー内のアイドルノードによるリソースの浪費と不要なコストを避けるために、[最小ノード数] パラメーターは慎重に指定することをお勧めします。
キューノード構成を選択する
自動キュースケーリングを有効にするか、[ノードの初期数] を 0 より大きい値に設定する場合は、システムがキューの計算ノードを作成できるように、次のパラメーターを構成する必要があります。
パラメーター
説明
ノード間相互接続
ノードを相互接続するモードを選択します。 有効な値:
VPCNetwork:計算ノードは Virtual Private Cloud(VPC)を介して相互に通信します。
eRDMANetwork:計算ノードのインスタンスタイプが eRDMA インターフェース(ERI)をサポートしている場合、計算ノードは eRDMA ネットワークを介して相互に通信します。
説明特定のインスタンスタイプの計算ノードのみが ERI をサポートしています。 詳細については、「概要」および「エンタープライズレベルインスタンスで eRDMA を構成する」をご参照ください。
プリセットノードプールの使用
作成済みの予約ノードプールを選択します。 システムは、プール内の未割り当ての予約ノードから IP アドレスとホスト名を自動的に選択して、計算ノードを作成します。
説明予約ノードプールを使用することで、スケールアウト時に事前に割り当てられたリソースをすばやく再利用できます。 詳細については、「クラスターで予約ノードプールを使用する」をご参照ください。
仮想スイッチ
ノードが使用する vSwitch を指定します。 システムは、使用可能な vSwitch CIDR ブロックから計算ノードに IP アドレスを自動的に割り当てます。
インスタンスタイプグループ
[インスタンスの追加] をクリックし、表示されるパネルでインスタンスタイプを選択します。
自動キュースケーリングを有効にしない場合は、1 つのインスタンスタイプのみを追加できます。 自動キュースケーリングを有効にする場合は、複数のインスタンスタイプを追加できます。
重要インベントリの問題によりインスタンスの作成に失敗した場合に備えて、複数の vSwitch とインスタンスタイプを代替として選択できます。 計算ノードを作成すると、システムは指定されたインスタンスタイプとゾーンの順序でノードを作成しようとします。 たとえば、システムは最初に、最初の vSwitch が存在するゾーンで、順番に指定したインスタンスタイプに基づいてノードを作成しようとします。 作成されたインスタンスの仕様は、インベントリによって異なる場合があります。
自動スケーリング
パラメーター
説明
スケーリングポリシー
供給優先戦略 のみサポートされています。 このポリシーは、仕様要件を満たす計算ノードが、構成された vSwitch の順序で指定されたゾーンに作成されることを示します。
単一拡張ノードの最大数
各スケールアウトまたはスケールインサイクルで追加または削除されるノードの数を指定します。 デフォルト値 0 は、数が無制限であることを示します。
計算ノードのコストを制御するために、このパラメーターを構成することをお勧めします。
ホスト名のプレフィックス
計算ノードのホスト名のプレフィックスを指定します。 プレフィックスは、異なるキューのノードを区別するために使用されます。
ホスト名のサフィックス
計算ノードのホスト名のサフィックスを指定します。 サフィックスは、異なるキューのノードを区別するために使用されます。
インスタンス RAM ロール
ノードに Resource Access Management(RAM)ロールをバインドして、ノードが Alibaba Cloud サービスにアクセスできるようにします。
デフォルトロール AliyunECSInstanceForEHPCRole を選択することをお勧めします。
手順 4:共有ファイルストレージを構成する
[共有ファイルストレージ] 手順で、クラスター内のノードによって共有されるストレージリソースを構成します。
デフォルトでは、構成されたファイルシステムは管理ノードの /home ディレクトリと /opt ディレクトリにマウントされ、共有ストレージディレクトリとして使用されます。 ファイルシステムを別のディレクトリにマウントする場合は、[さらにストレージを追加] をクリックします。 次の表にパラメーターを示します。
異なるファイルシステムディレクトリを /home と /opt にマウントすることはできません。
パラメーター | 説明 |
タイプ | マウントするファイルシステムのタイプ。 有効な値:
|
ファイルシステム | マウントするファイルシステムの ID とマウントポイント。 ファイルシステムに十分なマウントポイントがあることを確認してください。 |
ファイルシステムディレクトリ | マウントするファイルシステムのディレクトリ。 |
マウント構成 | マウントプロトコル。 |
手順 5:ソフトウェアとアドオンを構成する
[ソフトウェアとサービスコンポーネント] 手順で、クラスターにインストールするソフトウェアとアドオンを構成します。
[ソフトウェアの追加] をクリックします。 [ソフトウェアの追加] ダイアログボックスで、クラスターにインストールするソフトウェアアプリケーションを選択します。 E-HPC は、ビジネス要件に基づいてインストールできる、一般的に使用される HPC ソフトウェアアプリケーションを提供します。
[サービスコンポーネントの追加] をクリックします。 表示されるダイアログボックスで、サービスコンポーネントアドオンを選択し、アドオンパラメーターを構成します。
説明現在、ログインアドオンのみがサポートされています。
デフォルトでは、パブリッククラウドクラスターはログインアドオンで構成されており、インターネットからのリモート接続を可能にします。 次の表にアドオンパラメーターを示します。
カテゴリ
パラメーター
説明
ログインアドオンのカスタムパラメーター
SSH
クラスターが SSH を使用して接続されているときに使用されるポート番号、プロトコル、および許可された CIDR ブロックを設定します。
VNC
クラスターが VNC を使用して接続されているときに使用されるポート番号、プロトコル、および許可された CIDR ブロックを設定します。
CLIENT
クラスターがクライアントを使用して接続されているときに使用されるポート番号、プロトコル、および許可された CIDR ブロックを設定します。
アドオンデプロイメントリソース
EIP
ログインアドオンがデプロイされている ECS インスタンスに EIP をバインドして、クラスターをインターネット経由で接続できるようにします。 既存の EIP を選択するか、システムに EIP を作成させることができます。
ECS インスタンス
ログインアドオンがデプロイされている ECS インスタンスのインスタンスタイプを指定します。
手順 6:構成を確認する
[構成の確認] 手順で、クラスター構成を確認し、クラスターの名前とログイン資格情報を指定します。
パラメーター | 説明 |
クラスター名 | クラスターの名前。 クラスター名は、識別を容易にするために [クラスター] ページに表示されます。 |
クラスターパスワードなし | 管理ノードから切り替えたばかりの root ユーザーが計算ノードにパスワードなしでログインできるようにするかどうかを指定します。 重要 この機能を有効にすると、root ユーザーに対して一方向のパスワードなしログインモードが構成されます。 具体的には、root ユーザーは管理ノードからパスワードを入力せずにクラスター内のすべての計算ノードにログインできますが、その逆はできません。 この機能を使用する場合は注意してください。 |
ログイン資格情報 | クラスターへのログインに使用される資格情報。 カスタムパスワード のみサポートされています。 |
パスワードの設定 と パスワードの再入力 | クラスターへのログインに使用されるパスワード。 デフォルトでは、パスワードは root ユーザーがクラスター内のすべてのノードにログインするために使用されます。 |
サービス規約を読み、料金を確認し、[クラスターの作成] をクリックします。
テンプレートを使用してクラスターを作成する
E-HPC では、テンプレートを使用して複数のクラスターをすばやく作成できます。 テンプレートは、クラスターの作成に必要な基本パラメーターを定義します。 E-HPC が提供するテンプレートを使用するか、独自のテンプレートを作成できます。
組み込みテンプレートを使用してクラスターを作成する
[クラスターリスト] ページに移動します。
E-HPC コンソール にログインします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションウィンドウで、クラスター をクリックします。
[クラスター] ページで、[クラスターテンプレート] をクリックします。
表示されるダイアログボックスで、テンプレートを選択し、[クラスターの作成] をクリックします。

構成を確認し、クラスター名などの情報を入力します。
[構成の概要] セクションには、テンプレートで指定された構成が表示されます。 特定の構成の横にある [編集] をクリックして、ビジネス要件に基づいて構成を変更できます。
[設定の管理] セクションで、プロンプトに従って情報を補足します。
サービス規約を読み、料金を確認し、[クラスターの作成] をクリックします。
カスタムテンプレートを使用してクラスターを作成する
カスタムローカルテンプレートを作成します。
[クラスターリスト] ページに移動します。
E-HPC コンソール にログインします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションウィンドウで、クラスター をクリックします。
[クラスター] ページで、[クラスターテンプレート] をクリックします。
表示されるダイアログボックスで、[ローカルテンプレートのインポート] をクリックして、準備したテンプレートファイルをアップロードします。
[クラスターテンプレートの編集] ダイアログボックスで、情報を確認し、[テンプレートを確認して作成] をクリックします。
[クラスターの作成] ページで、構成を確認し、[クラスターの作成] をクリックします。
参照
クラスターを作成した後、クラスターにジョブを送信するには、クラスターユーザーを作成する必要があります。 詳細については、「ユーザーの管理」および「概要」をご参照ください。