Elastic High Performance Computing (E-HPC) では、異なるジョブを実行したり、異なるタスクを実行したりする計算ノードを異なるキューに追加することで管理できます。計算ノードをキューにグループ化することで、計算ノードをより柔軟にフィルタリングおよびスケジュールして、ジョブ実行効率を最適化できます。このトピックでは、キューの作成、キューの削除、キュー構成の編集など、キューを使用して計算ノードをグループ別に管理する方法について説明します。
キューはリソース監視における重要なディメンションです。 [監視] ページで、キューごとの計算ノードの全体的な負荷とパフォーマンスを表示できます。 詳細については、「監視情報の表示」をご参照ください。
前提条件
クラスタが [実行中] 状態であること。
[キューを削除] する場合、キューに計算ノードがないこと。
キューの作成
[クラスタの詳細] ページに移動します。
E-HPC コンソール にログオンします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションウィンドウで、[クラスタ] をクリックします。
[クラスタリスト] ページで、管理するクラスタを見つけ、[クラスタ ID] をクリックします。
左側のナビゲーションウィンドウで、 を選択します。
[キューの作成] をクリックします。 [キューの作成] ページで、必要に応じてパラメータを構成します。
次の表でパラメータについて説明します。
基本設定
パラメータ
説明
[キュー名]
キュー名を入力します。名前は次の要件を満たしている必要があります。
名前の長さは 1 ~ 15 文字です。
名前には、大文字(A ~ Z)、小文字(a ~ z)、数字(0 ~ 9)、アンダースコア(_)のいずれか 1 つ以上が含まれています。
[キューの自動スケーリング]
キューの [自動スケーリング] を有効にするかどうかを指定します。 キューの自動スケーリングをオンにすると、ビジネス要件に基づいて [自動拡張] と [自動縮小] を選択できます。
キューの自動スケーリングを有効にすると、システムは構成とリアルタイムのワークロードに基づいて計算ノードを自動的に追加または削除します。
[キュー計算ノード]
キュー内の計算ノード数を指定します。
キューの自動スケーリングを有効にしない場合は、キュー内の計算ノードの初期数を構成します。
キューの自動スケーリングを有効にする場合は、キュー内の計算ノードの最小数と最大数を構成します。
重要[最小ノード数] パラメータにゼロ以外の値を設定すると、クラスタのスケールイン時に指定した値に基づいて、キューはノード数を保持します。アイドル状態のノードは解放されません。キュー内のアイドル状態のノードによるリソースの浪費と不要なコストを防ぐため、[最小ノード数] パラメータは慎重に指定することをお勧めします。
キューノード構成の選択
[キューの自動スケーリング] を有効にするか、[ノードの初期数] を 0 より大きい値に設定する場合は、システムがキューの計算ノードを作成できるように、次のパラメータを構成する必要があります。
構成項目
説明
[ノード間相互接続]
ノードを相互接続するモードを選択します。有効な値:
[VPCNetwork]:計算ノードは仮想プライベートクラウド(VPC)を介して相互に通信します。
[eRDMANetwork]:計算ノードのインスタンスタイプが eRDMA インターフェース(ERI)をサポートしている場合、計算ノードは eRDMA ネットワークを介して相互に通信します。
説明特定のインスタンスタイプの計算ノードのみが ERI をサポートしています。詳細については、「概要」および「エンタープライズレベルインスタンスで eRDMA を有効にする」をご参照ください。
[仮想スイッチ]
ノードが使用する vSwitch を指定します。システムは、使用可能な vSwitch CIDR ブロックから計算ノードに IP アドレスを自動的に割り当てます。
[インスタンスタイプグループ]
[インスタンスの追加] をクリックし、表示されるパネルでインスタンスタイプを選択します。
[キューの自動スケーリング] を有効にしない場合は、インスタンスタイプを 1 つだけ追加できます。 [キューの自動スケーリング] を有効にする場合は、複数のインスタンスタイプを追加できます。
重要インベントリの問題によりインスタンスの作成に失敗した場合に備えて、複数の vSwitch とインスタンスタイプを代替として選択できます。計算ノードを作成する場合、システムは指定されたインスタンスタイプとゾーンの順序でノードを作成しようとします。たとえば、システムは最初に、最初の vSwitch が存在するゾーンで、順番に指定したインスタンスタイプに基づいてノードを作成しようとします。作成されたインスタンスの仕様は、インベントリによって異なる場合があります。
自動スケーリング
構成項目
説明
[スケーリングポリシー]
スケーリングポリシーを選択します。現在、[供給優先戦略] のみがサポートされています。このポリシーは、仕様要件を満たす計算ノードが、構成された vSwitch の順序で指定されたゾーンに作成されることを示します。
[単一拡張ノードの最大数]
スケールアウトまたはスケールインサイクルごとに追加または削除されるノード数を指定します。デフォルト値 0 は、数が無制限であることを指定します。
計算ノードのコストを制御するために、このパラメータを構成することをお勧めします。
[ホスト名のプレフィックス]
計算ノードのホスト名プレフィックスを指定します。プレフィックスは、異なるキューのノードを区別するために使用されます。
[ホスト名のサフィックス]
計算ノードのホスト名サフィックスを指定します。サフィックスは、異なるキューのノードを区別するために使用されます。
[インスタンス RAM ロール]
ノードが Alibaba Cloud サービスにアクセスできるように、Resource Access Management (RAM) ロールをノードにバインドします。
デフォルトロール AliyunECSInstanceForEHPCRole を選択することをお勧めします。
[保存] をクリックします。
アイコンをクリックしてキューリストを更新します。キューがリストに表示されたら、キューの作成は成功です。
キューの構成
進行中のビジネスへの影響を防ぐため、ビジネスがアイドル状態のときにキューを 構成 することをお勧めします。
[クラスタの詳細] ページに移動します。
E-HPC コンソール にログオンします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションウィンドウで、[クラスタ] をクリックします。
[クラスタリスト] ページで、管理するクラスタを見つけ、[クラスタ ID] をクリックします。
左側のナビゲーションウィンドウで、 を選択します。
管理するキューを見つけて、[アクション] 列の [編集] をクリックします。
[キューの編集] ページで、次の表に示すパラメータを構成します。
[基本設定]
パラメータ
説明
[キューの自動スケーリング]
[キューの自動スケーリング] はデフォルトでオフになっています。スイッチをオンにすると、ビジネス要件に基づいて [自動拡張] と [自動縮小] を選択できます。
説明キューの構成がクラスタのグローバル構成と異なる場合、キューの構成が優先されます。
[キュー計算ノード]
キュー内の計算ノード数の範囲。
[最小ノード数]:計算ノードの最小数は 0 ~ 1000 です。この値はスケールインの効果に影響を与える可能性があります。
[最大ノード数]:計算ノードの最大数は 0 ~ 5000 です。この値はスケールアウトの効果に影響を与える可能性があります。
重要[最小ノード数] パラメータにゼロ以外の値を設定すると、クラスタのスケールイン時に指定した値に基づいて、キューはノード数を保持します。アイドル状態のノードは解放されません。キュー内のアイドル状態のノードによるリソースの浪費と不要なコストを防ぐため、[最小ノード数] パラメータは慎重に指定することをお勧めします。
[キュー内のノードの最大数] は、[クラスタ内のノードの最大数] を超えることはできません。
キューノード構成の選択
[キューの自動スケーリング] を有効にするか、[ノードの初期数] を 0 より大きい値に設定する場合は、システムがキューの計算ノードを作成できるように、次のパラメータを構成する必要があります。
構成項目
説明
[ノード間相互接続]
ノードを相互接続するモードを選択します。有効な値:
[VPCNetwork]:計算ノードは仮想プライベートクラウド(VPC)を介して相互に通信します。
[eRDMANetwork]:計算ノードのインスタンスタイプが eRDMA インターフェース(ERI)をサポートしている場合、計算ノードは eRDMA ネットワークを介して相互に通信します。
説明特定のインスタンスタイプの計算ノードのみが ERI をサポートしています。詳細については、「概要」および「エンタープライズレベルインスタンスで eRDMA を有効にする」をご参照ください。
[仮想スイッチ]
ノードが使用する vSwitch を指定します。システムは、使用可能な vSwitch CIDR ブロックから計算ノードに IP アドレスを自動的に割り当てます。
[インスタンスタイプグループ]
[インスタンスの追加] をクリックし、表示されるパネルでインスタンスタイプを選択します。
[キューの自動スケーリング] を有効にしない場合は、インスタンスタイプを 1 つだけ追加できます。 [キューの自動スケーリング] を有効にする場合は、複数のインスタンスタイプを追加できます。
重要インベントリの問題によりインスタンスの作成に失敗した場合に備えて、複数の vSwitch とインスタンスタイプを代替として選択できます。計算ノードを作成する場合、システムは指定されたインスタンスタイプとゾーンの順序でノードを作成しようとします。たとえば、システムは最初に、最初の vSwitch が存在するゾーンで、順番に指定したインスタンスタイプに基づいてノードを作成しようとします。作成されたインスタンスの仕様は、インベントリによって異なる場合があります。
自動スケーリング
構成項目
説明
[スケーリングポリシー]
スケーリングポリシーを選択します。現在、[供給優先戦略] のみがサポートされています。このポリシーは、仕様要件を満たす計算ノードが、構成された vSwitch の順序で指定されたゾーンに作成されることを示します。
[単一拡張ノードの最大数]
スケールアウトまたはスケールインサイクルごとに追加または削除されるノード数を指定します。デフォルト値 0 は、数が無制限であることを指定します。
計算ノードのコストを制御するために、このパラメータを構成することをお勧めします。
[ホスト名のプレフィックス]
計算ノードのホスト名プレフィックスを指定します。プレフィックスは、異なるキューのノードを区別するために使用されます。
[ホスト名のサフィックス]
計算ノードのホスト名サフィックスを指定します。サフィックスは、異なるキューのノードを区別するために使用されます。
[インスタンス RAM ロール]
ノードが Alibaba Cloud サービスにアクセスできるように、Resource Access Management (RAM) ロールをノードにバインドします。
デフォルトロール AliyunECSInstanceForEHPCRole を選択することをお勧めします。
[保存] をクリックします。
アイコンをクリックしてキューリストを更新し、[自動スケーリング構成] 列の情報を確認します。情報が更新されたら、スケーリング構成の編集は成功です。
キューの削除
キューを削除する前に、キューに計算ノードがないことを確認してください。それ以外の場合、キューを削除することはできません。
進行中のビジネスへの影響を防ぐため、ビジネスがアイドル状態のときにキューを 削除 することをお勧めします。
[クラスタの詳細] ページに移動します。
E-HPC コンソール にログオンします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションウィンドウで、[クラスタ] をクリックします。
[クラスタリスト] ページで、管理するクラスタを見つけ、[クラスタ ID] をクリックします。
左側のナビゲーションウィンドウで、 を選択します。
次のいずれかの方法でキューを削除します。
単一のキューを削除するには、キューを見つけて、[アクション] 列の [削除] をクリックします。
複数のキューを一度に削除するには、キューを選択し、ページの下部にある [一括削除] をクリックします。
表示されるメッセージで、キュー情報を確認し、[OK] をクリックします。
アイコンをクリックしてキューリストを更新します。キューがリストに表示されなくなったら、キューの削除は成功です。