ゲートウェイクラスタを使用して、負荷を分散し、データセキュリティのためにクラスタを分離できます。 また、ゲートウェイクラスタを使用して、E-MapReduce(EMR)クラスタにジョブを送信することもできます。 このトピックでは、EMR コンソールでゲートウェイクラスタを作成する方法について説明します。
2022 年 12 月 19 日 17:00(UTC + 08:00)以降に初めて EMR クラスタを作成する場合、Hadoop クラスタまたは Kafka クラスタを作成することはできません。
前提条件
EMR コンソールで Hadoop クラスタまたは Kafka クラスタが作成されています。 詳細については、「クラスタを作成する」をご参照ください。
2022 年 12 月 19 日 17:00(UTC + 08:00)以降に Hadoop クラスタまたは Kafka クラスタを作成できるのは、Alibaba Cloud アカウントを使用して、2022 年 12 月 19 日 17:00(UTC + 08:00)以前に Hadoop クラスタまたは Kafka クラスタが作成されている場合のみです。
制限事項
このトピックは、Hadoop クラスタと Kafka クラスタにのみ適用されます。 DataLake、オンライン分析処理(OLAP)、または Dataflow クラスタにゲートウェイをデプロイする方法については、「ゲートウェイノード」をご参照ください。
手順
EMR コンソールにログインします。
[EMR On ECS] ページで、目的のクラスタを見つけ、[クラスタ ID/名前] 列でクラスタの名前をクリックします。
[基本情報] タブの右上で、[すべての操作]>[ゲートウェイの作成] を選択します。
表示されたページで、パラメータを設定します。
セクション
パラメータ
説明
関連付けの設定
リージョン
ゲートウェイクラスタの地理的な場所。
リソースグループ
ゲートウェイクラスタが属するリソースグループ。
リソースグループを作成するには、[リソースグループの作成] をクリックします。 詳細については、「リソースグループを作成する」をご参照ください。
関連付けられたクラスタ
ゲートウェイクラスタに関連付ける EMR クラスタ。 指定したリージョンで EMR クラスタを選択します。 関連付けられたクラスタは、次の要件を満たしている必要があります。
クラスタのステータスは [実行中] です。
クラスタは Hadoop クラスタまたは Kafka クラスタです。
説明デフォルトでは、関連付けられたクラスタを選択すると、関連付けられたクラスタの VPC(Virtual Private Cloud)がゲートウェイクラスタに選択されます。 新旧両方のバージョンの EMR コンソールで作成された EMR クラスタをクラスタゲートウェイに関連付けることができます。
基本設定
課金方法
サブスクリプション:クラスタの料金を支払った後にのみ、クラスタを使用できます。
従量課金:クラスタを使用した後に、クラスタの料金を支払うことができます。 システムは、クラスタの稼働時間に基づいてクラスタに課金します。 1 時間単位で課金されます。 短期テストジョブまたは動的にスケジュールされたジョブには、従量課金制クラスタを使用することをお勧めします。
ゾーン
関連付けられたクラスタが存在するゾーン。
vSwitch
指定したゾーンのクラスタで使用される vSwitch。
デフォルトセキュリティグループ
関連付けられたクラスタが属するセキュリティグループ。
パブリックネットワーク IP の割り当て
ゲートウェイクラスタに Elastic IP アドレス(EIP)を割り当てるかどうかを指定します。
ノードグループ
インスタンスタイプ:現在のリージョンで使用可能なインスタンスタイプ。 詳細については、「インスタンスファミリ」をご参照ください。
システムディスク:ゲートウェイクラスタで使用させたいシステムディスクのタイプ。 システムディスクは、Ultra ディスク、標準 SSD、ESSD に分類されます。 ゲートウェイクラスタの作成に使用できるシステムディスクのタイプは、選択したリージョンとインスタンスタイプによって異なります。 デフォルトでは、システムディスクは、システムディスクを使用するクラスタと共にリリースされます。
ビジネス要件に基づいてシステムディスクのサイズを指定します。 有効な値:60 ~ 500。 単位:GiB。
データディスク:ゲートウェイクラスタで使用させたいデータディスクのタイプ。 データディスクは、Ultra ディスク、標準 SSD、ESSD に分類されます。 ゲートウェイクラスタの作成に使用できるデータディスクのタイプは、選択したリージョンとインスタンスタイプによって異なります。 デフォルトでは、データディスクは、データディスクを使用するクラスタと共にリリースされます。
ビジネス要件に基づいて各データディスクのサイズを指定します。 有効な値:40 ~ 32768。 単位:GiB。
インスタンス:作成する Elastic Compute Service(ECS)インスタンスの数を指定します。 デフォルト値:1。
クラスタ名
ゲートウェイクラスタの名前。 名前の長さは 1 ~ 64 文字で、使用できる文字は英字、数字、ハイフン(-)、アンダースコア(_)のみです。
ID 資格情報
ゲートウェイクラスタのすべてのノードにログインするために使用される ID 資格情報。
パスワード:ゲートウェイクラスタにログインするために使用されるパスワードを指定します。 パスワードは 8 ~ 30 文字で、大文字、小文字、数字、特殊文字を含める必要があります。
パスワードには、次の特殊文字を含めることができます。
! @ # $ % ^ & *
キーペア:ゲートウェイクラスタにログインするために使用されるキーペアを選択します。 キーペアが存在しない場合は、[キーペアの作成] をクリックして ECS コンソールの [SSH キーペア] ページに移動し、キーペアを作成します。
.pem 秘密鍵ファイルは安全に保管してください。 ゲートウェイクラスタを作成すると、公開鍵が ECS インスタンスに自動的にバインドされます。 SSH を使用してゲートウェイクラスタにログインする場合は、秘密鍵ファイルに秘密鍵を入力する必要があります。
詳細設定
ECS アプリケーションロール
クラスタで実行されているアプリケーションが他の Alibaba Cloud サービスにアクセスできるようにする Resource Access Management(RAM)ロール。 デフォルトの RAM ロールを使用します。 デフォルト値:AliyunECSInstanceForEMRRole。
ブートストラップ操作
オプション。 クラスタが起動する前にカスタムスクリプトを実行するようにブートストラップ操作を設定できます。
タグ
オプション。 クラスタの作成時にタグペアを追加したり、クラスタの作成後にタグペアを追加したりできます。 詳細については、「タグの管理と使用」をご参照ください。
データディスクの暗号化
オプション。 データディスクの暗号化は、クラスタの作成時にのみ有効にできます。 詳細については、「データディスクの暗号化を有効にする」をご参照ください。
[作成] をクリックして注文の料金を支払います。
ゲートウェイクラスタが作成されると、ゲートウェイクラスタの [ステータス] 列の値が [作成中] から [アイドル] に変わります。