定期実行するオフラインタスクを実行するには、そのスケジューリングプロパティを定義します。これには、スケジューリング周期、スケジューリング依存関係、およびスケジューリングパラメーターが含まれます。本トピックでは、オフラインタスクのプロパティとスケジューリングについて説明します。
重要事項
システムは、スケジューリングタイプが「定期タスク」に設定されたオフラインコンピューティングタスクのみに対して、スケジューリング構成をサポートしています。
依存関係とは、2 つのノード間の実行順序を定義するものです。上流ノードのステータスは、下流ノードの実行ステータスに影響を与えます。
依存関係を構成すると、システムは下流ノードを以下のようにスケジュールします。まず、上流ノードが正常に完了するまで待機します。その後、下流ノードのスケジュール時刻が到来したかどうかを確認します。
スケジュール時刻より前にスケジューリング構成を送信した場合、その構成はスケジュール時刻以降に有効になります。スケジュール時刻を過ぎてから依存関係を構成した場合、システムは 1 日後にインスタンスを作成します。
スケジューリング構成は、タスクがスケジュール通りに実行される際に使用されるプロパティのみを定義します。この構成を適用するには、タスクを本番環境に公開してください。
スケジュール時刻は、予期される実行時刻を定義します。実際の実行時刻は、上流ノードのステータスに依存します。タスク実行条件の詳細については、「インスタンス実行診断」をご参照ください。
オフラインタスクのプロパティへのアクセス
Dataphin のホームページの上部メニューバーで、開発 > データ開発 をクリックします。
開発 ページの上部メニューバーで、プロジェクト をクリックします。
左側のナビゲーションウィンドウで、データ処理 > コンピュートジョブ を選択します。コンピュートジョブ の一覧から、対象のジョブ名をクリックします。
タスクタブで、右側の プロパティ をクリックして、プロパティ パネルを開きます。
オフラインタスクのプロパティ構成
オフラインタスクのプロパティページで、以下の表を用いてタスクの基本情報およびスケジューリングプロパティを構成します。
構成項目 | 説明 |
タスク名、ID、ノードタイプ、開発オーナー、O&M オーナー、および説明を含みます。
| |
タスク実行に割り当てる CPU およびメモリリソースです。 説明 この設定は、Python、Shell、MaxCompute 上の Spark、Yarn 上の Spark、MaxCompute 上の MapReduce、Yarn 上の MapReduce のタスクにのみ適用されます。 | |
Python 第三者パッケージ | インポートする Python 第三者パッケージを選択します。 説明
|
Databricks Connect | Databricks Connect を有効化した後、開発 httpPath (クラスター) および 本番 httpPath (クラスター) を選択します。Bais プロジェクトの場合は、本番 httpPath (クラスター) のみを構成します。 開発または本番プロジェクトのコンピュートソースに関連付けられた Databricks クラスターで、あらかじめ構成済みの汎用コンピュートを任意に選択できます。HTTP Path は、 説明 Databricks Connect は、プロジェクトのコンピュートソースエンジンタイプが Databricks であり、Python バージョンが 3.11 の場合にのみサポートされます。 |
ノードのスケジューリング時に使用されるパラメーターを定義します。Dataphin では、組み込みパラメーターおよびカスタムパラメーターが提供されており、実行時に動的なパラメーター割り当てが可能です。 説明 ノードコード内で変数を定義している場合、ここで値を割り当ててください。変数が定義されていない場合は、この手順をスキップします。 | |
本番環境において、タスクが定期実行される方法を定義します。
| |
タスクの上流および下流の依存関係を定義します。依存関係により、実行順序が保証されます。すなわち、下流ノードは上流ノードが正常終了した後にのみ開始されます。これにより、有効なビジネスデータが適切なタイミングで配信されることを保証します。依存関係は、自動解析機能で迅速に設定することも、手動で追加することもできます。 | |
失敗したタスク実行に対するタイムアウト期間およびリトライポリシーを定義します。これにより、長時間実行されるタスクによるリソース浪費を防止し、信頼性を向上させます。 | |
コンピュートタスクに使用するリソースグループを選択します。システムは、このグループのリソースをタスクのスケジューリング時に使用します。 |
次のステップ
タスクプロパティの構成後、タスクを送信して本番環境に公開します。その後、本番環境で関連する O&M 操作を実行します。詳細については、「オペレーションセンター」をご参照ください。