すべてのプロダクト
Search
ドキュメントセンター

E-MapReduce:ノードカテゴリ

最終更新日:Jan 11, 2025

E-MapReduce(EMR)クラスターは、マスター、コア、タスクの 3 つのカテゴリのノードで構成されます。

3 つのカテゴリのノードは、異なるプロセスを実行して異なるタスクを完了します。
  • マスターノード: Hadoop HDFS の NameNode プロセスと Hadoop YARN の ResourceManager プロセスを実行します。
  • コアノード: Hadoop HDFS の DataNode プロセスと Hadoop YARN の NodeManager プロセスを実行します。
  • タスクノード: Hadoop YARN の NodeManager プロセスを実行し、計算のみを実行します。
クラスターを作成する前に、各ノードカテゴリの Elastic Compute Service(ECS)インスタンスの仕様を決定する必要があります。同じカテゴリのインスタンスは同じグループに属します。クラスターを作成した後、コアノードグループまたはタスクノードグループに ECS インスタンスを追加して、クラスターをスケールアウトできます。
説明 EMR V3.2.0 以降では、クラスターはタスクノードをサポートしています。

マスターノード

マスターノードには、Hadoop YARN の ResourceManager など、クラスターサービスの管理コンポーネントがデプロイされています。

Web UI にアクセスして、クラスター内のサービスの実行状況を表示できます。クラスターでジョブをテストまたは実行するには、マスターノードに接続し、コマンドラインでジョブを送信します。マスターノードへの接続方法の詳細については、クラスターへのログオンをご参照ください。

コアノード

クラスター内のコアノードは、マスターノードによって管理されます。コアノードは、Hadoop HDFS の DataNode プロセスを実行して、クラスターのすべてのデータを保存します。また、Hadoop YARN の NodeManager などのコンピューティングサービスプロセスを実行して、コンピューティングタスクを実行します。

データストレージとコンピューティングワークロードの増加に対応するために、クラスターの実行に影響を与えることなく、いつでもコアノードをスケールアウトできます。コアノードは、異なるストレージメディアを使用してデータを保存できます。詳細については、ローカルディスクおよびブロックストレージの概要をご参照ください。

タスクノード

タスクノードは、コンピューティングタスクのみを実行します。HDFS データの保存には使用できません。クラスターのコアノードが十分なコンピューティング能力を提供している場合、タスクノードは必要ありません。クラスター内のコアノードのコンピューティング能力が不足した場合、いつでもクラスターにタスクノードを追加できます。これらのタスクノードで Hadoop MapReduce タスクと Spark Executor を実行して、追加のコンピューティング能力を提供できます。

タスクノードは、クラスターの実行に影響を与えることなく、いつでもクラスターに追加または削除できます。