オフラインタスクを定期的なスケジュールで実行するには、スケジューリングプロパティを構成する必要があります。これらのプロパティには、スケジューリング周期、依存関係、パラメーターが含まれます。このトピックでは、オフラインタスクのプロパティとスケジューリングプロセスについて説明します。
注意事項
スケジューリング構成は、スケジューリングタイプが [定期タスク] に設定されているオフラインコンピューティングタスクでのみサポートされます。
依存関係は、2 つのノード間の実行順序を定義します。上流ノードのステータスは、その下流ノードの実行ステータスに影響します。
依存関係を持つノードの場合、スケジューリングルールは次のとおりです。下流ノードは、その上流ノードの実行が完了した後にのみスケジュールできます。その後、システムは構成された時間に基づいて下流ノードを実行するかどうかを決定します。
スケジュールされた時間より前に送信されたスケジューリング構成は、次回のスケジュールされた実行時に有効になります。スケジュールされた時間より後に依存関係を構成した場合、対応するインスタンスは翌日まで生成されません。
スケジューリング構成は、タスクの実行時のプロパティを定義します。この構成に基づいてスケジュールされるようにするには、タスクを本番環境に公開する必要があります。
スケジュール時間は、タスクの期待される実行時間です。実際の実行時間は、上流タスクの実行ステータスによって決まります。タスクの実行条件の詳細については、「インスタンスの実行診断」をご参照ください。
オフラインタスクのプロパティへのアクセス
Dataphin のホームページで、トップメニューバーから [開発] > [データ開発] を選択します。
[開発] ページで、トップメニューバーから [プロジェクト] を選択します。
左側のナビゲーションウィンドウで、[データ処理] > [スクリプトタスク] を選択します。[スクリプトタスク] リストで、対象タスクの名前をクリックします。
タスクのタブで、右側の [プロパティ] をクリックして [プロパティ] パネルを開きます。
オフラインタスクのプロパティ構成
オフラインタスクのプロパティページで、次の表の説明に従って、タスクの基本情報とスケジューリングプロパティを構成します。
構成項目 | 説明 |
タスク名、ID、ノードタイプ、開発オーナー、運用保守オーナー、説明が含まれます。
| |
現在のタスクを実行するために割り当てられた CPU およびメモリリソースです。 説明 この構成は、Python、Shell、Spark on MaxCompute、Spark on Yarn、MapReduce on MaxCompute、MapReduce on Yarn のタイプのコンピューティングタスクでのみサポートされます。 | |
Python サードパーティパッケージ | インポートする Python サードパーティパッケージを選択します。 説明
|
ノードのスケジューリングに使用されるパラメーターを定義します。Dataphin は、組み込みパラメーターを提供し、カスタムパラメーターをサポートしています。これにより、スケジューリング中にパラメーター値を動的に割り当てることができます。 説明 ノードコードで変数を定義した場合は、ここでそれらに値を割り当てる必要があります。変数が定義されていない場合は、この項目を構成する必要はありません。 | |
本番環境でタスクを定期的にスケジュールする方法を定義します。
| |
タスクの上流および下流の依存関係を定義します。依存関係により、ノードが順序正しくスケジュールされることが保証されます。下流ノードは、その上流ノードが正常に実行された後にのみ開始されます。これにより、有効なビジネスデータのタイムリーな出力が保証されます。自動解析を使用してノードの依存関係を迅速に設定したり、手動で追加したりすることができます。 | |
タスクのタイムアウトと、失敗したタスクの再実行ポリシーを定義します。これにより、長時間実行されるタスクによるリソースの無駄を防ぎ、タスク実行の信頼性を向上させます。 | |
コンピューティングタスクのリソースグループを選択します。タスクは、このグループのリソースを使用してスケジューリングされます。 |
次のステップ
タスクのプロパティを設定した後、タスクを本番環境に送信して公開します。その後、本番環境でタスクの O&M 操作を実行できます。詳細については、「オペレーションセンター」をご参照ください。