このページでは、Fink ジョブの設定方法について説明します。
始める前に
- プロジェクトが作成されている必要があります。 詳細は、「ワークフロープロジェクトの管理」をご参照ください。
- JAR ファイル、データファイル、これらのリソースのストレージパスなど、処理に必要なリソースとデータが用意されている必要があります。
手順
- Alibaba Cloud アカウントを使用して E-MapReduce (EMR) コンソール にログインし、[クラスター管理]タブを開きます。
- [データプラットフォーム] タブを選択して [プロジェクト] セクションを表示します。
- 目的とするジョブの横にある [ワークフロー] をクリックします。 左側のナビゲーションウィンドウで、[ジョブの編集] を選択します。
- [ジョブの編集] タブの左側でフォルダを右クリックし [ジョブの作成] を選択します。
注 リストから [Create Subfolder]、[Rename Folder]、[Delete Folder] を選択することもできます。
- [ジョブの作成] ダイアログボックスで、[名前] と [説明] を入力し、[ジョブタイプ] ドロップダウンリストから [Flink] を選択します。
- 設定が完了したら、[OK]をクリックして新しいジョブを作成します。
- ジョブを作成した後、ジョブコンテンツを指定する必要があります。
以下は ジョブコンテンツ の例です。
run ossref://path/to/oss/of/WordCount.jar --input /path/to/some/text/data --output /path/to/result
重要 ジョブが OSS に JAR ファイルとして保存されている場合、次のエンドポイントを例として使用して JAR ファイルを参照できます:ossref://<a directory name>/.../<a file name>.jar [OSS パス] をクリックして OSS から JAR ファイルを選びます。 Spark Streaming ジョブを含む JAR ファイルのフルパスがジョブコンテンツに追加されます。
デフォルトの OSS プロトコルを ossref プロトコルに変更しなければなりません。
EMR コンソールで Flink ジョブを送信する場合、次の形式のコマンドを使用します。
- 上記のパラメータを設定した後、[保存] をクリックして Flink ジョブの設定を完了します。