E-MapReduce(EMR)クラスターを作成した後、[データプラットフォーム] タブでプロジェクトを作成できます。その後、プロジェクトでジョブを編集し、ワークフローをスケジュールできます。また、クラスターをプロジェクトに関連付け、プロジェクトメンバーを追加し、プロジェクトのグローバル変数を構成することもできます。
前提条件
EMR クラスターが作成されていること。詳細については、「クラスターの作成」をご参照ください。
制限事項
Alibaba Cloud アカウントのみを使用して、プロジェクトの作成、プロジェクトメンバーの追加、クラスターとプロジェクトの関連付けを行うことができます。 RAM ユーザーを使用して EMR コンソールにログオンすると、[プロジェクトの作成] ボタンと、[ユーザー] ページと [クラスター設定] ページは使用できません。
プロジェクトの作成
- [データプラットフォーム] タブに移動します。
- Alibaba Cloud アカウントを使用して、Alibaba Cloud EMR コンソール にログオンします。
- 上部のナビゲーションバーで、クラスターが存在するリージョンを選択し、ビジネス要件に基づいてリソースグループを選択します。
- [データプラットフォーム] タブをクリックします。Alibaba Cloud アカウントを使用している場合は、アカウント内のすべてのプロジェクトを表示できます。 RAM ユーザーを使用している場合は、開発権限を持っているプロジェクトのみを表示できます。 Alibaba Cloud アカウントを使用して、RAM ユーザーに開発権限を付与できます。詳細については、「RAM ユーザーの管理」をご参照ください。
- [プロジェクト] セクションの右上隅にある [プロジェクトの作成] をクリックします。
- [プロジェクトの作成] ダイアログボックスで、[プロジェクト名] と [プロジェクトの説明] を構成し、[リソースグループの選択] ドロップダウンリストから既存のリソースグループを選択します。説明 リソースグループを選択しない場合、プロジェクトはデフォルトのリソースグループに追加されます。リソースグループの使用方法の詳細については、「リソースグループの使用」をご参照ください。
- [作成] をクリックします。[プロジェクト] セクションで、作成したプロジェクトを表示および管理できます。
プロジェクトの基本情報の表示
- [データプラットフォーム] タブに移動します。
- Alibaba Cloud アカウントを使用して、Alibaba Cloud EMR コンソール にログオンします。
- 上部のナビゲーションバーで、クラスターが存在するリージョンを選択し、ビジネス要件に基づいてリソースグループを選択します。
- [データプラットフォーム] タブをクリックします。
- [プロジェクト] タブに移動します。
- [プロジェクト] セクションで、プロジェクトの ID をクリックします。
- [プロジェクト] タブをクリックします。
- プロジェクトの基本情報を表示します。[基本情報] ページで、プロジェクト名、作成時刻、説明、プロジェクトを作成したユーザーなど、プロジェクトに関する以下の情報を表示できます。
一般情報の構成
EMR コンソールのデータプラットフォームで実行されるジョブの権限を管理する場合は、[一般構成] ページでセキュリティモードを有効にすることをお勧めします。
セキュリティモードを有効にした後、[ユーザー] ページでジョブの送信に使用する EMR ユーザーアカウントを追加する必要があります。詳細については、「ユーザーアカウントの管理」をご参照ください。 Alibaba Cloud アカウントを使用して EMR コンソールにログオンし、セキュリティモードが有効になっているプロジェクトでジョブを送信すると、ジョブはデフォルトで hadoop ユーザーによって実行されます。 RAM ユーザーを使用して EMR コンソールにログオンし、セキュリティモードが有効になっているプロジェクトでジョブを送信すると、ジョブはデフォルトで RAM ユーザーと同じ名前の EMR ユーザーアカウントによって実行されます。
- [データプラットフォーム] タブに移動します。
- Alibaba Cloud アカウントを使用して、Alibaba Cloud EMR コンソール にログオンします。
- 上部のナビゲーションバーで、クラスターが存在するリージョンを選択し、ビジネス要件に基づいてリソースグループを選択します。
- [データプラットフォーム] タブをクリックします。
- [プロジェクト] タブに移動します。
- [プロジェクト] セクションで、プロジェクトの ID をクリックします。
- [プロジェクト] タブをクリックします。
- [セキュリティモード] を構成します。
- 左側のナビゲーションペインで、[一般構成] をクリックします。
- ビジネス要件に基づいて、[セキュリティモード] をオンまたはオフにします。重要 セキュリティモードを有効にした後、Shell ジョブと Hive ジョブをプロジェクトで実行することはできません。
RAM ユーザーの管理
RAM ユーザーにプロジェクト開発権限を追加または取り消すには、次の手順を実行します。
- [データプラットフォーム] タブに移動します。
- Alibaba Cloud アカウントを使用して、Alibaba Cloud EMR コンソール にログオンします。
- 上部のナビゲーションバーで、クラスターが存在するリージョンを選択し、ビジネス要件に基づいてリソースグループを選択します。
- [データプラットフォーム] タブをクリックします。
- [プロジェクト] タブに移動します。
- [プロジェクト] セクションで、プロジェクトの ID をクリックします。
- [プロジェクト] タブをクリックします。
- 左側のナビゲーションペインで、[ユーザー] をクリックします。
- [ユーザー] ページで、ビジネス要件に基づいてユーザーを追加または削除します。
- RAM ユーザーを追加します。
- [ユーザー] ページの右上隅にある [ユーザーの追加] をクリックします。
- [ユーザーの追加] ダイアログボックスで、追加する RAM ユーザーを選択し、[追加] をクリックします。 [ユーザー] ページで、追加された RAM ユーザーに関する情報を表示できます。説明 追加された RAM ユーザーはプロジェクトのメンバーになり、プロジェクト内のジョブとワークフローを表示および開発する権限が付与されます。
- RAM ユーザーを削除します。
[ユーザー] ページで、削除する RAM ユーザーを見つけ、[アクション] 列の [削除] をクリックします。
- RAM ユーザーを追加します。
クラスターリソースの構成
プロジェクトのクラスターリソースを構成するには、次の手順を実行します。これにより、プロジェクト内のジョブは、プロジェクトに関連付けられているクラスターで実行できます。
- [データプラットフォーム] タブに移動します。
- Alibaba Cloud アカウントを使用して、Alibaba Cloud EMR コンソール にログオンします。
- 上部のナビゲーションバーで、クラスターが存在するリージョンを選択し、ビジネス要件に基づいてリソースグループを選択します。
- [データプラットフォーム] タブをクリックします。
- [プロジェクト] タブに移動します。
- [プロジェクト] セクションで、プロジェクトの ID をクリックします。
- [プロジェクト] タブをクリックします。
- 左側のナビゲーションペインで、[クラスター設定] をクリックします。
- [クラスター設定] ページで、次の操作を実行します。
- クラスターをプロジェクトに関連付けます。
- 右上隅の [クラスターの追加] をクリックします。
- [クラスターの追加] ダイアログボックスで、リソースグループとクラスターを選択します。
[クラスターの追加] ダイアログボックスで、[クラスターの選択] ドロップダウンリストから、購入したサブスクリプションまたは従量課金制クラスターを選択します。クラスターテンプレートを使用して作成されたクラスターはサポートされていません。
- [OK] をクリックします。
[クラスター設定] ページで、関連付けられたクラスターに関する情報を表示できます。
- クラスター構成を変更します。
- 構成を変更するクラスターを見つけ、[アクション] 列の [構成の変更] をクリックします。
- [構成の変更] ダイアログボックスで、次の表に示すパラメーターを構成します。
パラメーター 説明 デフォルトのジョブ送信ユーザー プロジェクト内の関連付けられたクラスターにジョブを送信するデフォルトのユーザー。デフォルト値は hadoop です。デフォルトユーザーは一意です。 デフォルトのジョブ送信キュー プロジェクトでジョブが送信されるデフォルトのキュー。デフォルト値:default。 ジョブ送信ユーザーホワイトリスト プロジェクト内のジョブを関連付けられたクラスターに送信できるユーザー。複数のユーザーはコンマ(,)で区切ります。 ジョブ送信キューホワイトリスト プロジェクトでジョブを送信できるキュー。複数のキューはコンマ(,)で区切ります。 クライアントホワイトリスト ジョブを送信できるクライアントを指定します。既存の EMR クラスターのマスターノード、または EMR クラスターに関連付けられているゲートウェイクラスターのノードを選択できます。 ECS インスタンスにデプロイされたセルフマネージドゲートウェイクラスターはサポートされていません。 - [OK] をクリックします。
- プロジェクトからクラスターの関連付けを解除します。
[クラスター設定] ページで、関連付けを解除するクラスターを見つけ、[アクション] 列の [削除] をクリックします。
- クラスターをプロジェクトに関連付けます。
変数の定義
プロジェクトレベルのカスタム変数を構成するには、次の手順を実行します。これは、プロジェクト内のジョブのグローバル変数として使用できます。
- [データプラットフォーム] タブに移動します。
- Alibaba Cloud アカウントを使用して、Alibaba Cloud EMR コンソール にログオンします。
- 上部のナビゲーションバーで、クラスターが存在するリージョンを選択し、ビジネス要件に基づいてリソースグループを選択します。
- [データプラットフォーム] タブをクリックします。
- [プロジェクト] タブに移動します。
- [プロジェクト] セクションで、プロジェクトの ID をクリックします。
- [プロジェクト] タブをクリックします。
- 左側のナビゲーションペインで、[カスタム変数] をクリックします。
- [カスタム変数] ページで、ビジネス要件に基づいてカスタム変数を追加または削除できます。
- カスタム変数を追加します。
- 右上隅の [追加] をクリックします。
- [カスタム変数の追加] ダイアログボックスで、[変数名] と [値] を構成し、変数の値を暗号化するかどうかを指定します。値を暗号化する場合は、[パスワードとして設定] をオンにします。 変数は、ジョブで
${VariableName}
の形式で呼び出されます。たとえば、ENV_ABC という名前の変数が追加され、変数の値が 12345 で、[パスワードとして設定] がオンになっていないとします。この例では、次の内容のジョブが実行されます。echo ${ENV_ABC}
次の出力が返されます。12345
変数の構成の効果は、次のスクリプトを実行するのと同じです。export ENV_ABC=12345
- [OK] をクリックします。
[カスタム変数] ページで、追加された変数に関する情報を表示できます。
- カスタム変数を削除します。
[カスタム変数] ページで、削除するカスタム変数を見つけ、[アクション] 列の [削除] をクリックします。
- カスタム変数を追加します。