すべてのプロダクト
Search
ドキュメントセンター

E-MapReduce:用語

最終更新日:Jan 11, 2025

このトピックでは、E-MapReduce(EMR)Serverless Spark の用語について説明し、サービスの理解を深めるのに役立ちます。

用語

説明

ワークスペース

ワークスペースは、ビジネス開発の基本単位です。 ワークスペースは、ジョブ、コンピューティングリソース、および権限のコレクションであり、他のワークスペースのジョブ、コンピューティングリソース、および権限から分離されています。

リソースキュー

EMR Serverless Spark は、コンピューティングリソースを測定するための基本単位としてコンピューティングユニット(CU)を使用します。 CU の詳細については、課金 をご参照ください。

Spark コンピューティングノードがドライバーかエグゼキューターかに関係なく、vCore とメモリの構成に基づいて、ノードに 1 つ以上の CU を割り当てることができます。 EMR Serverless Spark は、各コンピューティングノードに最小 20 GiB、最大 160 GiB のローカルストレージスペースを提供します。 ジョブで消費できる CU の数は、ジョブの計算の複雑さと関連データの分散によって異なります。 ジョブリストで、ジョブ実行によって消費された CU の数を確認できます。

セッションリソース

セッションリソースは、EMR Serverless Spark ワークスペースで使用可能な Spark セッションです。 セッションはキューにデプロイして、SQL ステートメントとノートブック環境の実行に必要な基本リソースを提供できます。 セッションでは、関連付けられているエンジンバージョンとキューを変更し、ビジネス要件に基づいて Spark パラメーターを変更できます。

公開

変更中のドラフトファイルがジョブのスケジュールに影響を与えないようにするには、ファイルの変更が完了した後、ドラフトファイルを公開する必要があります。 ドラフトファイルを公開すると、開発環境と本番環境を分離できます。

ジョブ実行

ジョブオーケストレーションシステムでは、ワークフローが実行されるたびにジョブ実行 ID が生成されます。

ワークフロー

ワークフローは、一連のジョブで構成される秩序だったプロセスです。 ワークフロー内のジョブは相互に依存しており、特定の順序で実行されます。

ユーザー

ユーザーは、アクセス制御で使用される用語です。 RAM ユーザーをワークスペースのメンバーとして追加し、ワークスペース内のジョブとリソースを管理するために必要な権限を RAM ユーザーに付与できます。

ロール

ロールは、アクセス制御で使用される用語です。 1 人のユーザーが複数のロールを担うことができます。 複数のユーザーが同じロールを担うことができます。 ロールに権限を付与すると、このロールを担うすべてのユーザーが同じ権限を持つことになります。