プロキシ ハイブリッドクラウドクラスターは、Open Grid Scheduler(SGE)スケジューラーと、既存のクラスターの管理ノードおよび計算ノードを利用します。既存のクラスターの計算ノードとは別に、新しいインスタンスを計算ノードとしてプロキシ ハイブリッドクラウドクラスターに追加することもできます。既存のクラスターは、クラウドまたはデータセンターにデプロイできます。このトピックでは、プロキシ ハイブリッドクラウドクラスターをデプロイする方法について説明します。
背景情報
多くの大規模ライフサイエンス企業が、大規模なハイパフォーマンスコンピューティングを実行するためにデータセンターをデプロイしています。しかし、データセンターの古い IT インフラストラクチャは、ライフサイエンスにおけるコンピューティング能力要件の急激な増加に対応できません。状況によっては、ライフサイエンス企業はデータセンターのリソースを使用し、クラウド上にハイパフォーマンスコンピューティングクラスターを構築する必要がある場合があります。このようなシナリオの要件を満たすために、Elastic High Performance Computing(E-HPC)は、クラウド全体のリソースを統一的かつ効率的に管理できるハイブリッドクラウドソリューションを提供します。クラウド リソースにより、E-HPC クラスターを柔軟にスケーリングできます。
ハイブリッドクラウドクラスターは、次のモードでデプロイできます。
マスターモード: 管理ノードはクラウド上の新しいクラスターに存在します。
プロキシモード: 管理ノードは既存のクラスターに存在します。
説明プロキシモードでは、既存のクラスターはデータセンターまたはクラウド上の別のリージョンに存在します。
前提条件
このトピックでは、データセンターに存在し、以下の仕様を持つクラスターを例として使用します。
管理ノード: 各管理ノードは 4 vCPU と 8 GiB のメモリを搭載しており、これはハイブリッドクラウドクラスターの最小構成です。各管理ノードのオペレーティングシステムは CentOS 7.6 です。
スケジューラー: SGE
ドメインアカウントサービス: ネットワーク情報サービス(NIS)
手順
このトピックには、次の操作が含まれています。
操作 | 説明 |
既存のクラスターと新しいハイブリッドクラウドクラスター間のネットワーク接続を確立し、ハイブリッドクラウドクラスターのセキュリティグループルールを構成します。 | |
プロキシ ハイブリッドクラウドクラスターを作成します。 | |
デフォルトでは、ハイブリッドクラウドクラスターにはクラウド上に計算ノードがありません。クラスターをスケールアウトする必要があります。 | |
リアルタイムのワークロードに基づいてクラスターに計算ノードを自動的に追加または削除するように、ハイブリッドクラウドクラスターの自動スケーリングを構成します。 | |
既存のクラスターのキューとハイブリッドクラウドクラスターのキューにテストジョブを送信して、ノードが想定どおりに実行されているかどうかを確認します。 |
手順 1: ネットワークを構成する
既存のクラスターとハイブリッドクラウドクラスター間のネットワーク接続を確立します。
シナリオに基づいて、ネットワーク接続を確立するためのソリューションを選択します。
既存のクラスターがデータセンターにデプロイされている場合は、Express Connect、Smart Access Gateway(SAG)、または VPN Gateway を使用して、クラウドとデータセンター間のネットワーク接続を確立できます。詳細については、以下のトピックをご参照ください。
Express Connect: Express Connect 回線を使用してデータセンターを VPC に接続する
SAG: SAG アプリケーションの使用を開始する
VPN Gateway: VPN ゲートウェイに関連付けられた IPsec-VPN 接続を構成する および 概要
既存のクラスターがクラウド上の別のリージョンにデプロイされている場合は、クラウドエンタープライズネットワーク(CEN)を使用して、2 つのリージョン間のネットワーク接続を確立できます。詳細については、「異なるアカウントの VPC を接続する」をご参照ください。
既存のクラスターのセキュリティグループにインバウンドルールを追加します。詳細については、「セキュリティグループルールを追加する」をご参照ください。
次のインバウンドルールを追加する必要があります。
ポリシー
プロトコル
ポート範囲
承認オブジェクト
説明
許可
カスタム TCP
6444
計算ノードが属する CIDR ブロック
SGE ポート。
許可
カスタム TCP
カスタム UDP
834, 835, 905, 111
計算ノードが属する CIDR ブロック
NIS ポート。
許可
カスタム TCP
22
0.0.0.0/0
デフォルトの E-HPC ポート。
許可
すべての ICMP(IPv4)
-1/-1
0.0.0.0/0
デフォルトの E-HPC ポート。
手順 2: E-HPC ハイブリッドクラウドクラスターを作成する
このセクションでは、この例で注意が必要な構成項目について説明します。その他のパラメーターの構成方法については、「ハイブリッドクラウドクラスターを作成する」をご参照ください。
E-HPC コンソール にログオンします。
[クラスター] ページで、[ハイブリッドクラスターの作成] をクリックします。
[ハードウェア構成] 手順で、ノード、ストレージ、およびネットワークを構成し、[次へ] をクリックします。
パラメーター
説明
例
アベイラビリティーゾーン
ハイブリッドクラウドクラスターが属するゾーン。
上海ゾーン L
プロキシモード
[プロキシモード] をオンにすると、ハイブリッドクラウドクラスターは既存のクラスターの管理ノードによって管理されます。既存のクラスターは、クラウドまたはデータセンターにデプロイできます。
オンにする
VPC と vSwitch
ハイブリッドクラウドクラスターが属する VPC と vSwitch。使用可能な IP アドレスの数がクラスターノードの数よりも大きいことを確認してください。
vpc-uf62yvldgikwaf2******
vsw-uf60uwjzu2um4ip******
セキュリティグループ
[セキュリティグループの作成] をオフにします。手順 1 で作成したセキュリティグループを選択します。
sg-test
ファイルシステム
クラスターノードにマウントするファイルシステムを選択します。有効な値: [クラウドファイルシステムを使用する]、[オンプレミス ファイルシステムを使用する]、[ファイルシステムをマウントしない]。
[クラウドファイルシステムを使用する]
ファイルシステム ID
[ファイルシステム] パラメーターを [クラウドファイルシステムを使用する] に設定した場合は、NAS ファイルシステムを選択する必要があります。
3ba2b4a*** (Capacity NFS)
マウントターゲット
[ファイルシステム] パラメーターを [クラウドファイルシステムを使用する] に設定した場合は、NAS ファイルシステムのマウントターゲットを選択する必要があります。
3ba2b4a***-ni**.cn-shanghai.nas.aliyuncs.com
[ソフトウェア構成] 手順で、イメージ、スケジューリングノード、およびアカウントノードを構成し、[次へ] をクリックします。
パラメーター
説明
例
イメージタイプ
イメージのタイプ。パブリックイメージ、カスタムイメージ など。
説明選択できるイメージタイプは、指定したリージョンと、現在の Alibaba Cloud アカウントに使用可能なイメージリソースがあるかどうかによって異なります。使用可能なすべてのイメージタイプはコンソールに表示されます。
パブリックイメージ
イメージ
イメージは、すべてのクラスターノードが必要とする情報を提供します。情報には、クラスターのオペレーティングシステム、プリインストールされたソフトウェア、デプロイされたビジネスまたはアプリケーションデータが含まれます。
CentOS_7.6_64
スケジューラー
ジョブをスケジュールするソフトウェア。値を sge に設定します。
sge
スケジューラーノードの IP アドレス
既存のクラスターの管理ノードの IP アドレス。
10.0.XX.XX
スケジューリングノードのホスト名
既存のクラスターの管理ノードのホスト名。
manager
アカウントシステム
既存のクラスターのドメインアカウントサービス。
nis
ローカルクラスターのドメイン名
既存のクラスターのドメイン名。
ehpc-hz-Gpxqdh****
アカウントノードの IP アドレス
既存のクラスターの管理ノードの IP アドレス。
10.0.XX.XX
アカウントノードのホスト名
既存のクラスターの管理ノードのホスト名。
manager
[基本構成] 手順で、クラスター名とログオンパスワードを入力します。
重要ログオンパスワードは、既存のクラスターの root パスワードと同じである必要があります。
[構成リスト] セクションで、構成を確認し、「Alibaba Cloud 国際ウェブサイト製品利用規約」を読み、選択して、[OK] をクリックします。
[クラスター] ページで、ハイブリッドクラウドクラスターが作成されているかどうかを確認します。
オプション。既存のクラスターの指定されたディレクトリをハイブリッドクラウドクラスターにマウントします。
サンプルコマンド:
mkdir -p /home-remote mount -t nfs -o vers=3,nolock,proto=tcp,noresvport 000ae4****-vmp**.cn-hangzhou.nas.aliyuncs.com:/ehpc-hz-GpQt5X****/home /home-remote // 既存のクラスターのディレクトリをハイブリッド クラウド クラスターにマウントする場合、ファイルを効率的にコピーできます。また、ハイブリッド クラウド クラスターの指定されたディレクトリを既存のクラスターにマウントすることもできます。既存のクラスターのディレクトリをハイブリッドクラウドクラスターにマウントする場合、ファイルを効率的にコピーできます。また、ハイブリッドクラウドクラスターの指定されたディレクトリを既存のクラスターにマウントすることもできます。
ハイブリッドクラウドクラスターのホームディレクトリを変更する場合は、元のホームディレクトリの credit ディレクトリをコピーし、新しいホームディレクトリに貼り付けて、新しいホームディレクトリに 755 の権限があるかどうかを確認します。サンプルコマンド:
CLUSTER_ID=`cat /root/ehpc.conf |grep -i clusterid |awk -F '=' '{print $2}'` cp /ehpcdata/${CLUSTER_ID}/home/master_nis_ready /home // (NIS) cp -rf /ehpcdata/${CLUSTER_ID}/home/ehpc_service /home // (LDAP)
手順 3: E-HPC ハイブリッドクラウドクラスターをスケールアウトする
デフォルトでは、ハイブリッドクラウドクラスターには計算ノードがありません。ハイブリッドクラウドクラスターに計算ノードを追加する必要があります。
[ノード] ページで、[新しいキュー] をクリックします。
ハイブリッドクラウドクラスターのノードと既存のクラスターのノードを区別するために、ハイブリッドクラウドクラスターのキューを作成します。詳細については、「キューを管理する」をご参照ください。
[クラスター] ページで、ハイブリッドクラウドクラスターを見つけて、[サイズ変更] をクリックします。
[ノードの作成] タブで、ノード情報を構成し、[今すぐ購入] をクリックします。
次の表にパラメーターを示します。
パラメーター
説明
例
アベイラビリティーゾーン
追加する計算ノードのゾーン。ハイブリッドクラウドクラスターが属するゾーンから計算ノードを選択することをお勧めします。
上海ゾーン L
vSwitch
計算ノードを追加する vSwitch のゾーン。ハイブリッドクラウドクラスターが属する vSwitch を選択することをお勧めします。 vSwitch の CIDR ブロックが既存のクラスターからのアクセスを許可していることを確認してください。
vsw-uf60uwjzu2um4ip******
キュー
計算ノードを追加するキュー。異なるキューを区別するために、新しいキューを選択します。
new
ホスト名のプレフィックス
追加する計算ノードの一意のホスト名プレフィックス。プレフィックスは、追加する計算ノードと既存のクラスターの計算ノードを区別するために使用されます。
new-compute
手順 4: 自動スケーリングを構成する
E-HPC クラスターは自動スケーリング機能をサポートしています。リアルタイムのワークロードに基づいてクラスターに計算ノードを自動的に追加または削除するように、ハイブリッドクラウドクラスターの自動スケーリングを構成できます。詳細については、「自動スケーリングを構成する」をご参照ください。

ユーザー管理機能を使用する場合は、[ユーザー] ページの [クラスターユーザーの同期] をクリックして、ユーザーが更新されているかどうかを確認します。
手順 5: テストジョブを送信する
既存のクラスターの計算ノードが存在するキューと、ハイブリッドクラウドクラスターの計算ノードが存在するキューにテストジョブを送信します。サンプルテストスクリプト qsub.sge:
#!/bin/bash
#$ -cwd // 現在のパス。
#$ -N test1 // ジョブの名前。
#$ -q hybridcloudq // ハイブリッド クラウド クラスターの計算ノードが存在するキュー。
#$ -pe smp 2 // コア数。
#$ -l vf=1g // メモリサイズ。
#$ -o /home/xiaofan // stdout ログが保存されるパス。
#$ -e /home/xiaofan // stderr ログが保存されるパス。
sleep 10
ping -c 10 localhost
echo "demo complete."