EMR Serverless Spark は、`spark-submit` コマンドラインパラメーターと互換性があり、タスク実行を簡素化します。このトピックでは、Spark Submit 開発の例を示して、開始に役立てます。
前提条件
ワークスペースを作成済みであること。詳細については、「ワークスペース管理」をご参照ください。
ビジネスアプリケーションを開発し、JAR パッケージをビルド済みであること。
手順
ステップ 1: JAR パッケージを開発する
このクイックスタートは、Spark Submit タスクに慣れるのに役立ちます。プロジェクトファイルとテスト用の JAR パッケージが提供されており、ダウンロードして次のステップで使用できます。
テスト JAR パッケージをダウンロードするには、spark-examples_2.12-3.3.1.jar をクリックします。
JAR パッケージは、円周率 (π) の値を計算するために使用される Spark の簡単な例です。
ステップ 2: JAR パッケージを OSS にアップロードする
この例では、spark-examples_2.12-3.3.1.jar パッケージをアップロードします。アップロード操作の詳細については、「単純なアップロード」をご参照ください。
ステップ 3: ジョブを開発して実行する
EMR Serverless Spark ページで、左側のナビゲーションウィンドウの [データ開発] をクリックします。
[開発] タブで、
アイコンをクリックします。名前を入力し、タイプに を選択してから、[OK] をクリックします。
右上隅で、キューを選択します。
キューの追加方法の詳細については、「リソースキューの管理」をご参照ください。
ジョブ開発パネルで、次の情報を設定します。他のパラメーターを設定する必要はありません。次に、[実行] をクリックします。
パラメーター
説明
スクリプト
spark-submit スクリプト。
次のサンプルコードは、spark-submit スクリプトの例を示しています。
--class org.apache.spark.examples.SparkPi \ --conf spark.executor.memory=2g \ oss://<YourBucket>/spark-examples_2.12-3.3.1.jar下の [実行記録] エリアで、ジョブのアクション列にある Log Exploration をクリックします。
Log Exploration タブで、ログ情報を表示できます。

ステップ 4: ジョブを公開する
公開されたジョブは、ワークフローのノードとして使用できます。
ジョブが正常に実行されたら、右側の [公開] をクリックします。
ジョブの公開ダイアログボックスで、必要な情報を入力し、[OK] をクリックします。
(オプション) ステップ 5: Spark UI を表示する
ジョブが正常に実行された後、Spark UI でそのステータスを表示できます。
左側のナビゲーションウィンドウで、[ジョブ履歴] をクリックします。
[アプリケーション] ページで、ターゲットジョブのアクション列にある [Spark UI] をクリックします。
Spark UI ページが開き、ジョブの詳細を表示できます。
参考
ジョブが公開されると、ワークフローのスケジューリングに使用できます。詳細については、「ワークフローの管理」をご参照ください。完全なジョブオーケストレーション開発プロセスの例については、「SparkSQL 開発クイックスタート」をご参照ください。