Elastic High Performance Computing (E-HPC) は、クラスタのノードのスケールインとスケールアウトを最適化するのに役立つ予約済みノードプール機能を提供します。予約済みノードプールは、固定 IP アドレスとホスト名のマッピングがバインドされている事前構成済みノードを提供します。これにより、これらの事前割り当て済みのリソースを動的なスケールインとスケールアウトの際に迅速に再利用できるため、クラスタ管理の効率と運用の安定性が向上します。
リソース配信における予約済みノードプールの適用
次の図は、予約済みノードプールベースのリソース配信と通常のリソース配信の違いを示しています。
類似点
基本的に、どちらの方法も vSwitch からネットワークリソースを取得してノードをスケールアウトします。
スケーリングプロセス全体は変更されません。
相違点
予約済みノードプールベースの方法は、ランダムな IP アドレスを使用する代わりに、事前構成済みの IP アドレスとホスト名を使用します。
通常のリソース配信方法は、CIDR ブロックの使用状況に関する情報を提供しません。一方、予約済みノードプールベースの方法は、プール内のノードの使用状況を明確に示します。
前提条件
クラスタが [実行中] 状態である。
クラスタで予約済みノードプールを使用する
予約済みノードプールを作成する
[クラスタの詳細] ページに移動します。
E-HPC コンソール にログオンします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションウィンドウで、[クラスタ] をクリックします。
[クラスタリスト] ページで、管理するクラスタを見つけ、[クラスタ ID] をクリックします。
左側のナビゲーションウィンドウで、 を選択します。
[予約済みノードプール] をクリックします。[予約済みノードプールの管理] ページの [予約済みノードプールの追加] タブで、次のパラメータを構成します。
パラメータ
説明
名前
予約済みノードプールの名前を入力します。
説明予約済みノードプールで作成されたノードの命名形式は
<prefix>[index,3]<postfix>で、postfix は ADZone 名の設定をサポートしています。仮想スイッチ
予約済みノードプールが属する vSwitch。
ホスト名のプレフィックス
予約済みノードのホスト名のプレフィックス。
ホスト名のサフィックス
予約済みノードのホスト名のサフィックス。
プール容量
予約済みノードプールで許可されるノードの最大数は 500 です。
予約済みノードプール内のノード数は、関連付けられている vSwitch で使用可能な IP アドレスの数を超えることはできません。
[OK] をクリックします。
説明予約済みノードプールのプロパティの作成と更新には時間がかかります。
ListReservedNodePools操作を呼び出すことで、ノードプールの状態を確認できます。
予約済みノードプールを使用したリソース配信
以下のセクションでは、予約済みノードプールを使用してクラスタをスケールアウトする 2 つの方法、手動と自動について説明します。
スケールアウトで追加されるインスタンスの数が予約済みノードプールの容量を超える場合、配信は容量に基づいて実行されます。
予約済みノードプールを使用してクラスタをスケールアウトする
E-HPC コンソール にログオンし、[クラスタの詳細] ページに移動します。左側のナビゲーションツリーで、 を選択します。
[ノードの追加] をクリックします。[ノードの追加] ページで、次のパラメータを構成します。
基本設定
パラメータ
説明
宛先キュー
クラスタで作成したキューを選択します。
ノード
クラスタに追加するノード数を指定します。
ノードの構成
パラメータ
説明
ノードタイプの選択
[ノードの作成] のみ選択できます。
ノード間相互接続
ノード間のネットワーク接続モードを指定します。
VPC ネットワーク: ノードは VPC (Virtual Private Cloud) を介して通信します。
ERDMA ネットワーク: ノードが ERI をサポートするタイプを使用している場合、ノードは eRDMA (Elastic Remote Direct Memory Access) ネットワークを介して通信できます。
説明ERI をサポートしているのは一部のインスタンスタイプのみです。詳細については、「概要」および「エンタープライズレベルインスタンスで eRDMA を有効にする」をご参照ください。
予約済みノードプールを使用する
作成済みの予約済みノードプールを選択します。システムは、予約済みノードプール内の未割り当ての予約済みノードから IP アドレスとホスト名を自動的に選択して、計算ノードを作成します。
インスタンスタイプグループ
[インスタンスの追加] をクリックして、インスタンスタイプを選択します。
自動スケーリングを有効にしていない場合は、1 つのインスタンスタイプしか追加できません。自動スケーリングを有効にしている場合は、複数のインスタンスタイプを追加できます。
インスタンス RAM ロール
ノードが Alibaba Cloud サービスにアクセスできるように、RAM (Resource Access Management) ロールをノードにバインドします。
デフォルトロールの AliyunECSInstanceForEHPCRole を選択することをお勧めします。
[追加の確認] をクリックします。
説明クラスタ内のアプリケーションは、追加された計算ノードに自動的にインストールされ、計算ノードは自動的に初期化されます。既存の計算ノードは、これによる影響を受けません。
追加されたノードの状態は、ノードリストで確認できます。ノードの状態が [実行中] の場合、クラスタはスケールアウトされます。
予約済みノードプールを使用してキューを作成および構成する
予約済みノードプールとキューの関係:
1 つのクラスタに複数の予約済みノードプールを含めることができ、予約済みノードプールは 1 つのクラスタにのみ属することができます。
1 つのキューを 1 つの予約済みノードプールにバインドでき、予約済みノードプールは複数のキューで使用できます。
1 つの予約済みノードプールは 1 つの vSwitch に対応します。
E-HPC コンソール にログオンし、[クラスタの詳細] ページに移動します。左側のナビゲーションツリーで、 を選択します。
[キューの作成] をクリックします。[キューの作成] ページで、次のパラメータを構成します。
基本設定
パラメータ
説明
キュー名
キュー名を入力します。名前は次の要件を満たしている必要があります。
名前の長さは 1 ~ 15 文字です。
名前には、大文字、小文字、数字、アンダースコア(_) のうち 1 つ以上が含まれています。
自動キュースケーリング
[自動スケーリング] を有効にするかどうかを指定します。有効にした後、ビジネス要件に基づいて [自動拡張] と [自動縮小] を有効にするかどうかを選択できます。
自動キュースケーリングを有効にすると、システムは構成とリアルタイムのワークロードに基づいて計算ノードを自動的に追加または削除します。
キュー計算ノード
キュー内の計算ノード数を指定します。
[自動キュースケーリング] を有効にしていない場合は、キュー内の計算ノードの初期数を構成します。
[自動キュースケーリング] を有効にしている場合は、キュー内の計算ノードの最小数と最大数を構成します。
重要[最小ノード数] パラメータにゼロ以外の値を設定すると、キューは、クラスタのスケールイン時に指定した値に基づいてノード数を保持します。アイドル状態のノードは解放されません。キュー内のアイドル状態のノードによるリソースの浪費とコストの発生を避けるため、[最小ノード数] パラメータは慎重に指定することをお勧めします。
キューノード構成の選択
パラメータ
説明
ノード間相互接続
ノードを相互接続するモードを選択します。有効な値:
VPC: ノードは VPC を介して通信します。
eRDMA: ノードが ERI をサポートするタイプを使用している場合、ノードは eRDMA ネットワークを介して通信できます。
説明ERI をサポートしているのは一部のインスタンスタイプのみです。詳細については、「概要」および「エンタープライズレベルインスタンスで eRDMA を有効にする」をご参照ください。
予約済みノードプールを使用する
作成済みの予約済みノードプールを選択します。システムは、予約済みノードプール内の未割り当ての予約済みノードから IP アドレスとホスト名を自動的に選択して、計算ノードを作成します。
インスタンスタイプグループ
[インスタンスの追加] をクリックして、ノードタイプを選択します。
自動スケーリングを有効にしていない場合は、1 つのインスタンスタイプしか追加できません。自動スケーリングを有効にしている場合は、複数のインスタンスタイプを追加できます。
自動スケーリング
パラメーター
説明
スケーリング ポリシー
スケーリングポリシーを選択します。現在、[供給優先ポリシー] のみがサポートされています。これは、システムが指定されたゾーンの構成済み vSwitch の順序で、仕様要件を満たす計算ノードの作成を試みることを意味します。
[単一拡張ノードの最大数]
スケールアウトまたはスケールインごとに追加または削除されるノード数を指定します。 デフォルト値 0 は、数が無制限であることを指定します。
予算が限られている場合は、コストを制御するために予算に基づいてこのパラメーターを設定することをお勧めします。
インスタンス RAM ロール
ノードに RAM ロールをバインドして、ノードが Alibaba Cloud サービスにアクセスできるようにします。
デフォルトロールの AliyunECSInstanceForEHPCRole を選択することをお勧めします。
[保存] をクリックします。
キューリストページで、
アイコンをクリックしてページをリフレッシュします。キューが存在する場合、キューは作成されています。
予約済みノードプールの変更と削除
予約済みノードプールを変更する
[クラスタの詳細] ページに移動します。
E-HPC コンソール にログオンします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションウィンドウで、[クラスタ] をクリックします。
[クラスタリスト] ページで、管理するクラスタを見つけ、[クラスタ ID] をクリックします。
左側のナビゲーションウィンドウで、 を選択します。
[プリセットノードプール] をクリックします。 [プリセットノードプールの管理] ページで、変更するプールのタブで次のパラメーターを編集できます。
パラメーター
説明
[名前]
予約済みノードプールの名前を変更します。
[プール容量]
プール内の予約済みノードの数を変更します。 値を減らすと、対応する数の IP アドレスが解放されます。 値を増やすと、使用可能なすべての IP アドレスが使用されるまで、対応する数の IP アドレスがさらに使用されます。
[削除]
未割り当てまたは競合状態にある予約済みノードを削除できます。 ノードを削除するには、ノードリストの [削除] をクリックします。
[リストのダウンロード]
予約済みノードリストの CSV ファイルをダウンロードして、DNS またはスケジューラにバッチインポートできます。
[OK] をクリックします。
予約済みノードプールを削除する
[クラスタの詳細] ページに移動します。
E-HPC コンソール にログオンします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションウィンドウで、[クラスタ] をクリックします。
[クラスタリスト] ページで、管理するクラスタを見つけ、[クラスタ ID] をクリックします。
左側のナビゲーションウィンドウで、 を選択します。
[プリセットノードプール] をクリックします。 [プリセットノードプールの管理] ページで、[ノードプールの削除] ボタンをクリックして、ノードプールを削除します。
説明予約済みノードプール内のノードは、一度に最大 100 個まで削除できます。