EMR Serverless Spark は、`spark-submit` コマンドラインパラメーターをサポートしています。この機能により、タスク実行が簡素化されます。本トピックでは、Spark Submit 開発を素早く開始できるよう、具体的な手順例を紹介します。
前提条件
ワークスペースが作成済みです。詳細については、「ワークスペース管理」をご参照ください。
業務アプリケーションの開発が事前に完了しており、JAR パッケージが準備済みです。
操作手順
ステップ 1:JAR パッケージの作成
本クイックスタートでは、Spark Submit タスクへの理解を迅速に深められるよう、プロジェクトファイルおよびテスト用 JAR パッケージを提供しています。以下の手順でダウンロードし、後続の操作にご利用ください。
spark-examples_2.12-3.5.2.jar をクリックして、テスト用 JAR パッケージをダウンロードします。
spark-examples_2.12-3.5.2.jar は、Spark が提供するシンプルなサンプルであり、円周率 (π) の値を計算します。このパッケージを使用するには、データベースエンジンバージョン `esr-4.x` を指定する必要があります。データベースエンジンバージョン `esr-5.x` を使用する場合は、本トピックでの検証用に spark-examples_2.13-4.0.1.jar をダウンロードしてください。
ステップ 2:JAR パッケージを OSS にアップロード
本例では、`spark-examples_2.12-3.5.2.jar` を OSS にアップロードします。アップロード手順については、「シンプルアップロード」をご参照ください。
ステップ 3:タスクの作成と実行
EMR Serverless Spark ページの左側ナビゲーションウィンドウで、データ開発 をクリックします。
開発 タブで、
アイコンをクリックします。タスク名を入力します。タイプを に設定し、OK をクリックします。
右上隅からキューを選択します。
キューの追加手順については、「リソースキューの管理」をご参照ください。
新規タスクエディターで、以下のパラメーターを設定します。その他のパラメーターは変更せず、そのまま使用します。その後、実行 をクリックします。
パラメーター
説明
スクリプト
Spark Submit スクリプトを入力します。
以下のコードはサンプルです:
--class org.apache.spark.examples.SparkPi \ --conf spark.executor.memory=2g \ oss://<YourBucket>/spark-examples_2.12-3.5.2.jar下部の 実行記録 セクションで、[Actions] 列の Log Exploration をクリックします。
Log Exploration タブで、関連するログ情報を確認します。

ステップ 4:タスクの公開
公開済みのタスクは、ワークフロー内のノードとして利用できます。
タスクが正常に実行された後、右側の 公開 をクリックします。
公開ダイアログボックスで、リリースノートを入力し、OK をクリックします。
(オプション) ステップ 5: Spark UI の表示
タスクが正常に実行された後、Spark UI で実行詳細を確認できます。
左側のナビゲーションウィンドウで、ジョブ履歴 をクリックします。
アプリケーション ページで、対象タスクの [Actions] 列より Spark UI をクリックします。
Spark UI ページが自動で開きます。そこでタスクの詳細情報を確認できます。
参考資料
タスクを公開した後、ワークフロー内でスケジュール実行できます。詳細については、「ワークフローの管理」をご参照ください。タスクのオーケストレーションおよび開発の完全な例については、「SparkSQL 開発のクイックスタート」をご参照ください。