Elastic High Performance Computing (E-HPC) クラスタの計算ノードが不足している場合、または過剰な場合は、クラスタを手動でスケールアウトまたはスケールインするか、クラスタの Auto Scaling を構成できます。このトピックでは、E-HPC クラスタをスケールアウトおよびスケールインする方法について説明します。
手動スケーリング
E-HPC クラスタでは、手動スケーリングとは、基本的に計算ノードを手動で作成または削除することです。計算ノードの数を増やすことでクラスタをスケールアウトしたり、計算ノードの数を減らすことでクラスタをスケールインしたりできます。スケールアウトはクラスタの計算能力を向上させることができ、スケールインはリソースの無駄を削減したり、コストを節約したりできます。
手順と使用上の注意の詳細については、「ノードの管理」をご参照ください。
Auto Scaling
E-HPC は Auto Scaling 機能を提供します。クラスタ内のすべてのキューまたは特定のキューに対して Auto Scaling を構成できます。システムは、タスクの数とクラスタジョブの GPU の数に基づいて、キュー内の計算ノードの数を自動的に調整します。多数の計算タスクが送信されると、クラスタは計算ノードを自動的に追加してタスクの処理を高速化できます。タスクが存在しない場合、クラスタは計算ノードを自動的に削減して、エネルギーとリソースの消費を節約できます。 Auto Scaling により、E-HPC クラスタはさまざまなワークロードの変化により効率的に対応できるようになり、全体的なパフォーマンスとリソース使用率が向上します。
グローバル構成
クラスタの [グローバル構成] で、クラスタの Auto Scaling を有効にし、クラスタの最大ノード数と最大コア数を構成できます。
[クラスタリスト] ページに移動します。
E-HPC コンソール にログインします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションウィンドウで、[クラスタ] をクリックします。
[クラスタリスト] ページで、管理するクラスタを見つけ、[Auto Scaling] をクリックします。
[クラスタ Auto Scaling] ダイアログボックスで、[クラスタグローバル構成] セクションのパラメーターを構成します。
パラメーター
説明
Auto Scaling を有効にする
クラスタ内のすべてのキューに対して [Auto Grow] と [Auto Shrink] を有効にします。
説明キューの構成がクラスタのグローバル構成と異なる場合、キューの構成が優先されます。
スケールアウト待機時間
ジョブが送信されてから、システムがスケールアウト操作を開始するまでに必要な推定時間です。デフォルト値は 2 分です。
スケールイン待機時間
ノードがジョブリクエストを受信せずにアイドル状態を維持する時間のしきい値です。時間が経過すると、システムはノードのリソースを自動的に解放します。スケールインのデフォルトの待機時間は 4 分です。
クラスタノードの最大数
クラスタで作成できるノードの最大数です。
クラスタのコアの最大数
クラスタで作成できるコアの最大数です。
自動キュースケーリング
クラスタ内の各キューに対して Auto Scaling を構成できます。手順と使用上の注意の詳細については、「ノードの Auto Scaling の構成」をご参照ください。