HiveSQL、SparkSQL、および Shell の3 種類のアドホッククエリのみがサポートされています。 アドホッククエリ文を実行すると、ログとクエリページの下部にログとクエリの結果が表示されます。
ジョブの作成
ジョブの編集ページでジョブを実行して [詳細] をクリックすると、このジョブの操作ログと実行ログが表示される詳細ページに移動します。 アドホッククエリとジョブはさまざまな場所で使用されます。 アドホッククエリは通常データアナリストによって使用されます。また、アドホッククエリを実装するためのツールとして SQL を使用する必要があります。
- Alibaba Cloud E-MapReduce コンソールにログインします。
- [データプラットフォーム] タブをクリックしてプロジェクトページに移動します。
- ターゲットプロジェクトの隣にある[ワークフローの設計] をクリックしてジョブの編集ページに移動します。
- 左側のナビゲーションウィンドウで、[クエリ] タブをクリックしてクエリページに移動します。
- 左側のナビゲーションウィンドウで、必要に応じてフォルダを右クリックして [新規ジョブ]を選択します。
- [新規ジョブ] ダイアログボックスで、ジョブの名前と説明を入力して、ジョブのタイプを選択します。
ジョブが作成されたら、ジョブのタイプは変更されません。
- [OK] をクリックします。
注 フォルダを右クリックすることで、フォルダをリネームおよび削除し、サブフォルダを新規作成します。
ジョブの開発
- ジョブの基本的な設定
右上隅で、[ジョブの設定] をクリックします。 [ジョブの設定] ダイアログボックスが表示されます。
- リソースファイルについては、ジョブの実行が依存するJAR パッケージまたは UDF などのリソースを追加する場合は、これらのファイルを OSS にアップロードする必要があります。 リソースを選択して、選択したリソースをジョブで使用します。
- パラメーター設定では、ジョブで使用される変数の値を指定します。 コード内で変数を使用します。 形式は ${variable name} です。 右側にあるプラスアイコン (+) をクリックしてキーとバリューのペアを追加します。キーは変数の名前で、一方バリューは変数の値です。予定時刻に従って時間変数をカスタマイズします。
ルールは以下のとおりです。
- yyyy は年を表します (4 桁の形式)。
- MM は月を表します。
- dd は日を表します。
- HH 24 は時を表します。 12 時間制を使用する場合は、hh と表示されます。
- mm は分を表します。
- ss は秒を表します。
-
時間変数は yyyy を含む任意の時間の組み合わせです。 プラス記号 (+) を使用して時間を進め、マイナス記号を使用して (-) 時間を遅らせます。 たとえは、 ${yyyy-MM-dd} が現在の日付を表す場合は、次のように設定します。
- 現在から 1 年後は ${yyyy+1y} または ${yyyy-MM-dd hh:mm:ss+1y} です。
- 現在から 3 か月後は ${yyyyMM+3m} または ${hh:mm:ss yyyy-MM-dd+3m} です。
- 5 日後は ${yyyyMMdd-5d} または ${hh:mm:ss yyyy-MM-dd-5d} です。
- ジョブの詳細設定
詳細設定を構成するには、[詳細] タブをクリックしてジョブの設定ページに移動します。
- [モード] は YARN と LOCAL を含むジョブの実行モードです。 YARN モードでは、ジョブはランチャーによって YARN に送信されます。 LOCAL モードでは、 ジョブは割り当てられたホストで直接実行されます。
- [スケジューリングパラメーター] では、YARN キュー、CPU、メモリ、および Hadoop ユーザーなどのジョブ構成を設定します。 このパラメーターを設定しない場合は、ジョブによって Hadoop クラスターのデフォルト値が採用されます。
ジョブの実行
ジョブが開発および設定されたら、右上隅の [実行] をクリックしてジョブを実行します。
ログの表示
ジョブが実行されたら、クエリページの下部の [ログ] タブに実行中のログを表示します。