このトピックでは、E-MapReduce(EMR)Serverless Spark の用語について説明し、サービスの理解を深めるのに役立ちます。
用語 | 説明 |
ワークスペース | ワークスペースは、ビジネス開発の基本単位です。 ワークスペースは、ジョブ、コンピューティングリソース、および権限のコレクションであり、他のワークスペースのジョブ、コンピューティングリソース、および権限から分離されています。 |
リソースキュー | EMR Serverless Spark は、コンピューティングリソースを測定するための基本単位としてコンピューティングユニット(CU)を使用します。 CU の詳細については、課金 をご参照ください。 Spark コンピューティングノードがドライバーかエグゼキューターかに関係なく、vCore とメモリの構成に基づいて、ノードに 1 つ以上の CU を割り当てることができます。 EMR Serverless Spark は、各コンピューティングノードに最小 20 GiB、最大 160 GiB のローカルストレージスペースを提供します。 ジョブで消費できる CU の数は、ジョブの計算の複雑さと関連データの分散によって異なります。 ジョブリストで、ジョブ実行によって消費された CU の数を確認できます。 |
セッションリソース | セッションリソースは、EMR Serverless Spark ワークスペースで使用可能な Spark セッションです。 セッションはキューにデプロイして、SQL ステートメントとノートブック環境の実行に必要な基本リソースを提供できます。 セッションでは、関連付けられているエンジンバージョンとキューを変更し、ビジネス要件に基づいて Spark パラメーターを変更できます。 |
公開 | 変更中のドラフトファイルがジョブのスケジュールに影響を与えないようにするには、ファイルの変更が完了した後、ドラフトファイルを公開する必要があります。 ドラフトファイルを公開すると、開発環境と本番環境を分離できます。 |
ジョブ実行 | ジョブオーケストレーションシステムでは、ワークフローが実行されるたびにジョブ実行 ID が生成されます。 |
ワークフロー | ワークフローは、一連のジョブで構成される秩序だったプロセスです。 ワークフロー内のジョブは相互に依存しており、特定の順序で実行されます。 |
ユーザー | ユーザーは、アクセス制御で使用される用語です。 RAM ユーザーをワークスペースのメンバーとして追加し、ワークスペース内のジョブとリソースを管理するために必要な権限を RAM ユーザーに付与できます。 |
ロール | ロールは、アクセス制御で使用される用語です。 1 人のユーザーが複数のロールを担うことができます。 複数のユーザーが同じロールを担うことができます。 ロールに権限を付与すると、このロールを担うすべてのユーザーが同じ権限を持つことになります。 |