ハイブリッドクラウドクラスターは、ご利用のオンプレミスのハイパフォーマンスコンピューティング (HPC) 環境を Alibaba Cloud に拡張し、既存のスケジューラやアカウント管理設定を置き換えることなく、コンピューティング集約型ジョブをクラウドノードにバースト実行できます。スケジューリングノードおよびドメインアカウントノードはデータセンター内に維持され、コンピュートノードはオンプレミスとクラウドの両方で動作します。
このトピックでは、Elastic High Performance Computing (E-HPC) でハイブリッドクラウドクラスターを作成し、クラウドコンピュートノードでスケールアウトする方法について説明します。
仕組み
ご利用のオンプレミスクラスターは、通常どおりジョブのスケジューリングを処理します。E-HPC はクラウドコンピュートノードをプロビジョニングし、それらを既存のスケジューラに登録するため、ジョブはオンプレミスノードとクラウドノードの間を透過的にフローします。スケジューラとクラウドノード間のすべてのトラフィックは、VPN Gateway、Cloud Enterprise Network (CEN)、または Express Connect によって提供される、ご利用のデータセンターと仮想プライベートクラウド (VPC) 間のネットワーク接続性を経由します。
必要に応じて、プロキシモード を有効にして、クラウド内にプロキシノードをデプロイできます。クラウドコンピュートノードが直接オンプレミスのスケジューリングノードに到達できない場合に、このオプションを使用してください。プロキシノードは、スケジューラとクラウド側との間の通信をリレーします。
前提条件
作業を開始する前に、以下の要件を満たしていることを確認してください。
VPC および vSwitch が存在すること。詳細については、「VPC の作成と管理」および「vSwitch の作成と管理」をご参照ください。
E-HPC のサービスリンクロールが存在すること。E-HPC コンソールに初めてログインすると、このロールの作成が求められます。
VPN Gateway、CEN インスタンス、または Express Connect 回線のいずれかを通じて、ご利用のデータセンターと Alibaba Cloud 間にネットワーク接続性が確保されていること。詳細については、「CEN インスタンスの作成」、「VPN Gateway の作成」、および「Express Connect 回線を使用した接続とは」をご参照ください。
オンプレミスクラスターの要件
ご利用のオンプレミスクラスターの管理ノードは、以下の要件を満たす必要があります。
オペレーティングシステム: CentOS 7.2、7.3、7.4、7.5、7.6、または 8.0
スケジューラ: Deadline、Portable Batch System (PBS) 18.1.1、Open Grid Scheduler (SGE)、またはカスタムスケジューラ
ご利用のクラスターが PBS または SGE を使用している場合、オペレーティングシステムは CentOS 7.x である必要があります。
アカウント管理: カスタムアカウント管理サービス
手順 1:ハイブリッドクラウドクラスターの作成
E-HPC コンソールにログインします。
上部ナビゲーションバーでリージョンを選択します。
上部ナビゲーションバーで クラスター をクリックします。
クラスター ページで、ハイブリッドクラスターの作成 をクリックします。
ハードウェア設定を構成します。
基本パラメーターを設定します。
パラメーター 説明 可用性ゾーン クラウドコンピュートノードがプロビジョニングされる可用性ゾーンです。 料金モデル クラウドコンピュートノードの支払い方法です。EIP や File Storage NAS ファイルシステムには適用されません。オプション:サブスクリプション(週単位、月単位、年単位)、従量課金(1 時間単位で課金)、または プリエンプティブルインスタンス(コストが低く、需要と供給に応じて価格が変動し、使用時間に基づいて課金)。詳細については、「ECS 支払い方法の概要」をご参照ください。 コンピュートノード クラウドコンピュートノードのインスタンスタイプです。クラスター全体のパフォーマンスはこの設定に依存します。 プロキシモード 有効にすると、オンプレミスのスケジューラとクラウドコンピュートノード間の通信をリレーするプロキシノードがクラウド内に作成されます。クラウドノードがスケジューリングノードに直接到達できない場合に、この機能を有効にしてください。 プロキシノード プロキシモード が有効な場合に必要な、プロキシノードのインスタンスタイプです。 詳細設定 を展開し、ネットワークおよびストレージパラメーターを設定します。
カテゴリ パラメーター 説明 ネットワーク構成 VPC および vSwitch クラスターが配置される VPC および vSwitch です。各リストの最初の VPC および vSwitch がデフォルトで選択されます。vSwitch にクラスターノードすべてに対応できる十分な IP アドレスが利用可能であることを確認してください。VPC の作成 および vSwitch の作成 (サブネット用) をクリックして、VPC および vSwitch を作成できます。詳細については、「VPC の作成と管理」および「vSwitch の作成と管理」をご参照ください。 セキュリティグループの作成 および セキュリティグループ名 セキュリティグループは自動的に作成され、無効化できません。新しいセキュリティグループの名前を入力してください。 ストレージ ストレージパス クラウドコンピュートノードへのストレージのマウント方法です。オプション:ファイルシステムをマウントしない、オンプレミスファイルシステムを使用、または クラウドファイルシステムを使用。 ローカルクラスターストレージマウントポイント オンプレミスストレージパス(オンプレミスファイルシステム用)です。 マウントパス ストレージがマウントされるクラウドノード上のパス(オンプレミスファイルシステム用)です。 ローカルパス クラスターにマウントするオンプレミスパス(オンプレミスファイルシステム用)です。 ディレクトリごとの構成 各フォルダごとに異なるファイルシステムをマウントするかどうか(クラウドファイルシステム用)です。 タイプ クラウドファイルシステムのタイプです。 ファイルシステム ID および マウントポイント 使用するファイルシステムおよびマウントターゲットです。各リストの最初の項目がデフォルトで選択されます。ファイルシステムの作成 または マウントポイントの作成 をクリックして、新しいものを作成できます。詳細については、「ファイルシステムの作成」および「マウントポイントの管理」をご参照ください。 マウント構成 汎用型 NAS ファイルシステムの場合、マウントプロトコルとして NFSv3 経由でマウント または NFSv4 経由でマウント を選択します。 リモートディレクトリ マウントするファイルシステムのリモートディレクトリです。
次へ をクリックします。
オンプレミスクラスター設定を構成します。
パラメーター 説明 イメージタイプ および イメージ クラウドコンピュートノード環境をセットアップするために使用するイメージタイプおよびイメージです。 スケジューラ ご利用のオンプレミスクラスターで使用されているスケジューラタイプです。 スケジューリングノード IP アドレス ご利用のオンプレミスクラスター内のスケジューリングノードの IP アドレスです。 スケジューリングノードホスト名 ご利用のオンプレミスクラスター内のスケジューリングノードのホスト名です。 アカウントシステム ご利用のオンプレミスクラスター内のスケジューリングノードのドメインアカウントサービスです。 ローカルクラスタードメイン名 ご利用のオンプレミスクラスターのドメイン名です。 アカウントノード IP アドレス ご利用のオンプレミスクラスター内のドメインアカウントノードの IP アドレスです。 アカウントノードホスト名 ご利用のオンプレミスクラスター内のドメインアカウントノードのホスト名です。 次へ をクリックします。
基本クラスター設定を構成します。
パラメーター 説明 クラスター名 クラスターページに表示される名前です。 ログインパスワード クラスターのログインノードへの SSH アクセス用パスワードです。ユーザー名は root です。プロキシモード が有効な場合は、オンプレミスクラスターの root パスワードを入力してください。 パスワードの再入力 パスワードを確認します。 構成リスト セクションで、すべての設定を確認します。Alibaba Cloud 国際サイト製品利用規約 を読み、同意したうえで、OK をクリックします。
検証: クラスター ページで、クラスターのステータスが 実行中 に変わるまで待ちます。これはクラスターが正常に作成されたことを示します。
手順 2:ハイブリッドクラウドクラスターのスケールアウト
新しく作成されたハイブリッドクラウドクラスターにはコンピュートノードが含まれていません。スケールアウトしてクラウドコンピュートノードを追加します。
スケールアウトする前に、ご利用のスケジューラがインストールされたカスタムイメージを準備してください。Deadline スケジューラまたはカスタムスケジューラの場合、イメージにスケジューラソフトウェアが含まれている必要があります。詳細については、「インスタンスからカスタムイメージを作成する」をご参照ください。
クラスター ページで、ご利用のクラスターを見つけ、サイズ変更 をクリックします。
サイズ変更 パネルで、基本構成を完了します。パラメーターの詳細については、「クラスターの手動スケールアウト」をご参照ください。以下の設定を行います。
イメージタイプ: カスタムイメージ を選択します。
イメージ: 事前に準備したカスタムイメージを選択します。
設定を確認します。Alibaba Cloud 国際サイト製品利用規約 を読み、同意したうえで、今すぐ購入 をクリックします。
検証: 左側のナビゲーションウィンドウで、Resource Management > ノード を選択します。クラスター ドロップダウンリストからご利用のクラスターを、ノードタイプ ドロップダウンリストから コンピュートノード を選択します。すべてのノードのステータスが 実行中 になった時点で、スケールアウトが完了します。