すべてのプロダクト
Search
ドキュメントセンター

Elastic High Performance Computing:プロキシモードでハイブリッドクラウドクラスターをデプロイする

最終更新日:Jan 11, 2025

プロキシ ハイブリッドクラウドクラスターは、Open Grid Scheduler(SGE)スケジューラーと、既存のクラスターの管理ノードおよび計算ノードを利用します。既存のクラスターの計算ノードとは別に、新しいインスタンスを計算ノードとしてプロキシ ハイブリッドクラウドクラスターに追加することもできます。既存のクラスターは、クラウドまたはデータセンターにデプロイできます。このトピックでは、プロキシ ハイブリッドクラウドクラスターをデプロイする方法について説明します。

背景情報

多くの大規模ライフサイエンス企業が、大規模なハイパフォーマンスコンピューティングを実行するためにデータセンターをデプロイしています。しかし、データセンターの古い IT インフラストラクチャは、ライフサイエンスにおけるコンピューティング能力要件の急激な増加に対応できません。状況によっては、ライフサイエンス企業はデータセンターのリソースを使用し、クラウド上にハイパフォーマンスコンピューティングクラスターを構築する必要がある場合があります。このようなシナリオの要件を満たすために、Elastic High Performance Computing(E-HPC)は、クラウド全体のリソースを統一的かつ効率的に管理できるハイブリッドクラウドソリューションを提供します。クラウド リソースにより、E-HPC クラスターを柔軟にスケーリングできます。

ハイブリッドクラウドクラスターは、次のモードでデプロイできます。

  • マスターモード: 管理ノードはクラウド上の新しいクラスターに存在します。

  • プロキシモード: 管理ノードは既存のクラスターに存在します。

    説明

    プロキシモードでは、既存のクラスターはデータセンターまたはクラウド上の別のリージョンに存在します。

前提条件

このトピックでは、データセンターに存在し、以下の仕様を持つクラスターを例として使用します。

  • 管理ノード: 各管理ノードは 4 vCPU と 8 GiB のメモリを搭載しており、これはハイブリッドクラウドクラスターの最小構成です。各管理ノードのオペレーティングシステムは CentOS 7.6 です。

  • スケジューラー: SGE

  • ドメインアカウントサービス: ネットワーク情報サービス(NIS)

手順

このトピックには、次の操作が含まれています。

操作

説明

手順 1: ネットワークを構成する

既存のクラスターと新しいハイブリッドクラウドクラスター間のネットワーク接続を確立し、ハイブリッドクラウドクラスターのセキュリティグループルールを構成します。

手順 2: E-HPC ハイブリッドクラウドクラスターを作成する

プロキシ ハイブリッドクラウドクラスターを作成します。

手順 3: E-HPC ハイブリッドクラウドクラスターをスケールアウトする

デフォルトでは、ハイブリッドクラウドクラスターにはクラウド上に計算ノードがありません。クラスターをスケールアウトする必要があります。

手順 4: 自動スケーリングを構成する

リアルタイムのワークロードに基づいてクラスターに計算ノードを自動的に追加または削除するように、ハイブリッドクラウドクラスターの自動スケーリングを構成します。

手順 5: テストジョブを送信する

既存のクラスターのキューとハイブリッドクラウドクラスターのキューにテストジョブを送信して、ノードが想定どおりに実行されているかどうかを確認します。

手順 1: ネットワークを構成する

  1. 既存のクラスターとハイブリッドクラウドクラスター間のネットワーク接続を確立します。

    シナリオに基づいて、ネットワーク接続を確立するためのソリューションを選択します。

  2. 既存のクラスターのセキュリティグループにインバウンドルールを追加します。詳細については、「セキュリティグループルールを追加する」をご参照ください。

    次のインバウンドルールを追加する必要があります。

    ポリシー

    プロトコル

    ポート範囲

    承認オブジェクト

    説明

    許可

    カスタム TCP

    6444

    計算ノードが属する CIDR ブロック

    SGE ポート。

    許可

    • カスタム TCP

    • カスタム UDP

    834, 835, 905, 111

    計算ノードが属する CIDR ブロック

    NIS ポート。

    許可

    カスタム TCP

    22

    0.0.0.0/0

    デフォルトの E-HPC ポート。

    許可

    すべての ICMP(IPv4)

    -1/-1

    0.0.0.0/0

    デフォルトの E-HPC ポート。

手順 2: E-HPC ハイブリッドクラウドクラスターを作成する

このセクションでは、この例で注意が必要な構成項目について説明します。その他のパラメーターの構成方法については、「ハイブリッドクラウドクラスターを作成する」をご参照ください。

  1. E-HPC コンソール にログオンします。

  2. [クラスター] ページで、[ハイブリッドクラスターの作成] をクリックします。

  3. [ハードウェア構成] 手順で、ノード、ストレージ、およびネットワークを構成し、[次へ] をクリックします。

    パラメーター

    説明

    アベイラビリティーゾーン

    ハイブリッドクラウドクラスターが属するゾーン。

    上海ゾーン L

    プロキシモード

    [プロキシモード] をオンにすると、ハイブリッドクラウドクラスターは既存のクラスターの管理ノードによって管理されます。既存のクラスターは、クラウドまたはデータセンターにデプロイできます。

    オンにする

    VPC と vSwitch

    ハイブリッドクラウドクラスターが属する VPC と vSwitch。使用可能な IP アドレスの数がクラスターノードの数よりも大きいことを確認してください。

    • vpc-uf62yvldgikwaf2******

    • vsw-uf60uwjzu2um4ip******

    セキュリティグループ

    [セキュリティグループの作成] をオフにします。手順 1 で作成したセキュリティグループを選択します。

    sg-test

    ファイルシステム

    クラスターノードにマウントするファイルシステムを選択します。有効な値: [クラウドファイルシステムを使用する]、[オンプレミス ファイルシステムを使用する]、[ファイルシステムをマウントしない]。

    [クラウドファイルシステムを使用する]

    ファイルシステム ID

    [ファイルシステム] パラメーターを [クラウドファイルシステムを使用する] に設定した場合は、NAS ファイルシステムを選択する必要があります。

    3ba2b4a*** (Capacity NFS)

    マウントターゲット

    [ファイルシステム] パラメーターを [クラウドファイルシステムを使用する] に設定した場合は、NAS ファイルシステムのマウントターゲットを選択する必要があります。

    3ba2b4a***-ni**.cn-shanghai.nas.aliyuncs.com

  4. [ソフトウェア構成] 手順で、イメージ、スケジューリングノード、およびアカウントノードを構成し、[次へ] をクリックします。

    パラメーター

    説明

    イメージタイプ

    イメージのタイプ。パブリックイメージ、カスタムイメージ など。

    説明

    選択できるイメージタイプは、指定したリージョンと、現在の Alibaba Cloud アカウントに使用可能なイメージリソースがあるかどうかによって異なります。使用可能なすべてのイメージタイプはコンソールに表示されます。

    パブリックイメージ

    イメージ

    イメージは、すべてのクラスターノードが必要とする情報を提供します。情報には、クラスターのオペレーティングシステム、プリインストールされたソフトウェア、デプロイされたビジネスまたはアプリケーションデータが含まれます。

    CentOS_7.6_64

    スケジューラー

    ジョブをスケジュールするソフトウェア。値を sge に設定します。

    sge

    スケジューラーノードの IP アドレス

    既存のクラスターの管理ノードの IP アドレス。

    10.0.XX.XX

    スケジューリングノードのホスト名

    既存のクラスターの管理ノードのホスト名。

    manager

    アカウントシステム

    既存のクラスターのドメインアカウントサービス。

    nis

    ローカルクラスターのドメイン名

    既存のクラスターのドメイン名。

    ehpc-hz-Gpxqdh****

    アカウントノードの IP アドレス

    既存のクラスターの管理ノードの IP アドレス。

    10.0.XX.XX

    アカウントノードのホスト名

    既存のクラスターの管理ノードのホスト名。

    manager

  5. [基本構成] 手順で、クラスター名とログオンパスワードを入力します。

    重要

    ログオンパスワードは、既存のクラスターの root パスワードと同じである必要があります。

  6. [構成リスト] セクションで、構成を確認し、「Alibaba Cloud 国際ウェブサイト製品利用規約」を読み、選択して、[OK] をクリックします。

    [クラスター] ページで、ハイブリッドクラウドクラスターが作成されているかどうかを確認します。

  7. オプション。既存のクラスターの指定されたディレクトリをハイブリッドクラウドクラスターにマウントします。

    サンプルコマンド:

    mkdir -p /home-remote
    mount -t nfs -o vers=3,nolock,proto=tcp,noresvport 000ae4****-vmp**.cn-hangzhou.nas.aliyuncs.com:/ehpc-hz-GpQt5X****/home /home-remote
    // 既存のクラスターのディレクトリをハイブリッド クラウド クラスターにマウントする場合、ファイルを効率的にコピーできます。また、ハイブリッド クラウド クラスターの指定されたディレクトリを既存のクラスターにマウントすることもできます。
    

    既存のクラスターのディレクトリをハイブリッドクラウドクラスターにマウントする場合、ファイルを効率的にコピーできます。また、ハイブリッドクラウドクラスターの指定されたディレクトリを既存のクラスターにマウントすることもできます。

    ハイブリッドクラウドクラスターのホームディレクトリを変更する場合は、元のホームディレクトリの credit ディレクトリをコピーし、新しいホームディレクトリに貼り付けて、新しいホームディレクトリに 755 の権限があるかどうかを確認します。サンプルコマンド:

    CLUSTER_ID=`cat /root/ehpc.conf |grep -i clusterid |awk -F '=' '{print $2}'`
    cp /ehpcdata/${CLUSTER_ID}/home/master_nis_ready  /home  // (NIS)
    cp -rf /ehpcdata/${CLUSTER_ID}/home/ehpc_service  /home  // (LDAP)
    

手順 3: E-HPC ハイブリッドクラウドクラスターをスケールアウトする

デフォルトでは、ハイブリッドクラウドクラスターには計算ノードがありません。ハイブリッドクラウドクラスターに計算ノードを追加する必要があります。

  1. [ノード] ページで、[新しいキュー] をクリックします。

    ハイブリッドクラウドクラスターのノードと既存のクラスターのノードを区別するために、ハイブリッドクラウドクラスターのキューを作成します。詳細については、「キューを管理する」をご参照ください。

  2. [クラスター] ページで、ハイブリッドクラウドクラスターを見つけて、[サイズ変更] をクリックします。

  3. [ノードの作成] タブで、ノード情報を構成し、[今すぐ購入] をクリックします。

    次の表にパラメーターを示します。

    パラメーター

    説明

    アベイラビリティーゾーン

    追加する計算ノードのゾーン。ハイブリッドクラウドクラスターが属するゾーンから計算ノードを選択することをお勧めします。

    上海ゾーン L

    vSwitch

    計算ノードを追加する vSwitch のゾーン。ハイブリッドクラウドクラスターが属する vSwitch を選択することをお勧めします。 vSwitch の CIDR ブロックが既存のクラスターからのアクセスを許可していることを確認してください。

    vsw-uf60uwjzu2um4ip******

    キュー

    計算ノードを追加するキュー。異なるキューを区別するために、新しいキューを選択します。

    new

    ホスト名のプレフィックス

    追加する計算ノードの一意のホスト名プレフィックス。プレフィックスは、追加する計算ノードと既存のクラスターの計算ノードを区別するために使用されます。

    new-compute

手順 4: 自動スケーリングを構成する

E-HPC クラスターは自動スケーリング機能をサポートしています。リアルタイムのワークロードに基づいてクラスターに計算ノードを自動的に追加または削除するように、ハイブリッドクラウドクラスターの自動スケーリングを構成できます。詳細については、「自動スケーリングを構成する」をご参照ください。

混合云最佳实践4

重要

ユーザー管理機能を使用する場合は、[ユーザー] ページの [クラスターユーザーの同期] をクリックして、ユーザーが更新されているかどうかを確認します。

手順 5: テストジョブを送信する

既存のクラスターの計算ノードが存在するキューと、ハイブリッドクラウドクラスターの計算ノードが存在するキューにテストジョブを送信します。サンプルテストスクリプト qsub.sge:

#!/bin/bash

#$ -cwd              // 現在のパス。
#$ -N test1          // ジョブの名前。
#$ -q hybridcloudq   // ハイブリッド クラウド クラスターの計算ノードが存在するキュー。
#$ -pe smp 2         // コア数。
#$ -l vf=1g          // メモリサイズ。
#$ -o /home/xiaofan  // stdout ログが保存されるパス。
#$ -e /home/xiaofan  // stderr ログが保存されるパス。

sleep 10
ping -c 10 localhost
echo "demo complete."