このトピックでは、Spark Streamingジョブを構成する方法について説明します。
前提条件
- プロジェクトが作成されていること。詳細については、プロジェクトの管理をご参照ください。
- 必要なすべてのリソースと処理対象のデータが取得されていること。
手順
- データプラットフォームタブに移動します。
- Alibaba Cloudアカウントを使用して、Alibaba Cloud EMRコンソールにログインします。
- 上部のナビゲーションバーで、クラスターが存在するリージョンを選択し、ビジネス要件に基づいてリソースグループを選択します。
- [データプラットフォーム] タブをクリックします。
- 表示されるページの [プロジェクト] セクションで、管理するプロジェクトを見つけ、[アクション] 列の [ジョブの編集] をクリックします。
- Spark Streamingジョブを作成します。
- 左側の [ジョブの編集] ペインで、操作を実行するフォルダーを右クリックし、[ジョブの作成] を選択します。
- [ジョブの作成] ダイアログボックスで、[名前] と [説明] を指定し、Spark Streaming[ジョブの種類] ドロップダウンリストから を選択します。
- [OK] をクリックします。
- ジョブの内容を編集します。
- [コンテンツ] フィールドに、ジョブの送信に必要なコマンドラインパラメーターを構成します。次のコマンド構文を使用して、Spark Streamingジョブを送信できます。
spark-submit [options] --class [MainClass] xxx.jar args次の例では、[名前] が SlsStreaming に設定されたジョブを使用して、[コンテンツ] の値を示します。--master yarn-client --driver-memory 7G --executor-memory 5G --executor-cores 1 --num-executors 32 --class com.aliyun.emr.checklist.benchmark.SlsStreaming emr-checklist_2.10-0.1.0.jar <project> <logstore> <accessKey> <secretKey>重要- ジョブがJARパッケージとしてオブジェクトストレージサービス(OSS)に保存されている場合は、ossref://xxx/.../xxx.jar ディレクトリを使用してJARパッケージを参照できます。
- ページの下部にある [+ OSSパスを入力] をクリックします。[OSSファイル] ダイアログボックスで、[ファイルプレフィックス] を [OSSREF] に設定し、[ファイルパス] を指定します。システムは、OSSのSpark Streamingスクリプトのパスを完成させます。
- [保存] をクリックします。
- [コンテンツ] フィールドに、ジョブの送信に必要なコマンドラインパラメーターを構成します。