このトピックでは、E-MapReduce(EMR)Serverless Spark でサポートされているカスタムパラメーターについて説明し、実行時環境を柔軟に構成し、ジョブのパフォーマンスを最適化する方法を説明します。
パラメーター | 説明 | シナリオ |
spark.emr.serverless.user.defined.jars | アップロードされた JAR パッケージを EMR Serverless Spark のドライバーとエグゼキュータの ClassPath に追加します。
| バッチ ジョブを開発し、spark-submit または Airflow Serverless Spark Operator を使用して Spark タスクを送信するか、セッションを作成します。 |
spark.emr.serverless.fusion | Livy を使用して開始されたセッションまたはバッチジョブに対して Fusion エンジンを有効にするかどうかを指定します。有効な値:
| ジョブまたはセッションの Spark 構成に基づいて、Fusion エンジンを有効にするかどうかを決定できます。 |
spark.emr.serverless.environmentId | ランタイム環境 ID。計算リソースのランタイム環境を構成するために使用されます。 | Airflow または spark-submit を使用して Spark ジョブを送信します。 デフォルトでは、サードパーティの依存関係ライブラリがインストールされています。 詳細については、「ランタイム環境の管理」をご参照ください。 |
spark.emr.serverless.network.service.name | ネットワーク接続名。計算リソースが EMR Serverless Spark を他の仮想プライベートクラウド (VPC) のデータソースに接続するように構成するために使用されます。 | 他の VPC のデータ ソースに EMR Serverless Spark がアクセスできるようにします。 |
spark.emr.serverless.excludedModules | EMR Serverless Spark の組み込みライブラリを削除します。
| 通常、カスタム JAR パッケージを使用する必要があるシナリオで使用されます。 EMR Serverless Spark コンソール、spark-submit、バッチジョブ、Airflow Serverless Spark Operator、Kyuubi、または Livy を介して Spark ジョブを送信する場合、またはセッションを作成する場合は、組み込みライブラリを削除します。 |
spark.emr.serverless.kyuu bi.engine.queue | ワークスペースキュー名。Kyuubi によって開始された Spark アプリケーションのキューを構成するために使用されます。 | このパラメーターは、Kyuubi 構成セクションで設定するか、接続を確立するときに JDBC URL で指定できます。 |
spark.emr.serverless.templateId | ワークスペーステンプレートを Spark アプリケーションのデフォルト構成として使用します。 templateId を取得するには、 に移動します。 | このパラメーターは、Spark Submit ツールを使用する場合にのみサポートされます。 |