定期タスクのデータバックフィル機能を使用すると、指定された既存データタイムスタンプ内のデータをリフレッシュできます。定期タスクが開発されて公開されると、構成されたスケジュールに従って実行されます。特定の期間に定期タスクを実行したり、既存の時間範囲のデータをリフレッシュしたりするには、データバックフィル機能を使用できます。ノードで使用されるスケジューリングパラメーターは、データバックフィル用に選択されたビジネス時間に基づいて、対応する値に自動的に置き換えられます。このトピックでは、定期タスクのデータバックフィルを実行する方法について説明します。
シナリオ
データバックフィル機能は、一般的に次のシナリオで使用されます。
新しく開発された定期タスクは、翌日からしかスケジュールできません。既存パーティションデータをすぐに表示するには、データバックフィル操作を実行できます。
アップストリームの依存タスクが再実行されるか、データがバックフィルされると、既存データ パーティションデータがリフレッシュされます。データバックフィル機能を使用して、ダウンストリームタスクの既存データ パーティションデータをリフレッシュできます。
過去のビジネスデータは不完全なため、定期的にリフレッシュする必要があります。
データバックフィルモード
オペレーションセンターのデータバックフィル機能は、現在のタスク自体、またはその下流タスクとともにデータをバックフィルすることをサポートしています。詳細は次のとおりです。
[現在のタスクのバックフィル]: 現在のタスクでデータバックフィル操作を実行することを指します。これは、次のシナリオに適しています。
子孫ノードを更新せずに、現在のノードのデータをリフレッシュできます。
現在のタスクの計算ロジックが変更された場合は、最初に現在のタスクでデータバックフィルを実行して計算ロジックの正確性を検証してから、ダウンストリームタスクのデータをリフレッシュできます。
[現在のタスクとアップストリーム/ダウンストリームタスクのバックフィル]: 現在のタスクとそのアップストリーム/ダウンストリームタスクをリフレッシュすることを指し、トレースデータ全体をリフレッシュする必要があるシナリオに適しています。
データバックフィル操作のエントリ
Dataphin ホームページの上部メニューバーで、[開発] > [タスク O&M] を選択します。
左側のナビゲーションウィンドウで、[タスク O&M] > [定期タスク] を選択します。
上部ナビゲーションバーで、本番環境または開発環境を選択します。
[統合とコンピューティングタスク] または [モデリングタスク] タブで、対象のタスクの [アクション] 列の
アイコンをクリックし、[データバックフィル] を選択し、次に [現在のタスクをバックフィル] または [現在およびダウンストリームのタスクをバックフィル] を選択します。説明データバックフィル操作は、定期タスクの DAG グラフでも実行できます。詳細については、「定期タスクの DAG グラフ」をご参照ください。
現在のタスクのデータをバックフィルする
[データバックフィル - 現在のタスクをバックフィル] ダイアログボックスで、データバックフィルタスクを構成します。
ステップ 1: データバックフィルの構成
パラメーター
説明
基本情報
データバックフィルインスタンス名
システムは、ノード名_実行日_インスタンス番号の形式で名前を自動的に生成します。手動で変更することもできます。
データバックフィル実行時間
データバックフィルインスタンス全体のスケジューリングが開始される時間です。[今すぐ実行] または [カスタム] を選択できます。
[すぐに実行]:構成が完了すると、データバックフィルインスタンスがすぐに生成され、データバックフィルタスクが実行されます。
[カスタム]:データバックフィルインスタンスが実行される特定の時間をカスタマイズできます。データバックフィルインスタンスは、カスタマイズされた時間にスケジュールを開始します。
システムタイムゾーン(ユーザーセンターのタイムゾーン)がスケジューリングタイムゾーンと異なる場合、システムはシステムタイムゾーンとスケジューリングタイムゾーンの両方を表示します。実行時間を選択すると、システムは対応するスケジューリングタイムゾーンの時間を自動的に計算します。
説明カスタム実行時間は、現在の時刻より後でなければなりません。
カスタム実行時間を設定した後、[データタイムスタンプ] をカスタム日付までの日付に設定できます。
定期的にスケジュールされたデータバックフィルタスクは、スケジュールされた実行時間の前日の 23:00 に保留中のインスタンスを生成します。
データタイムスタンプ
データバックフィルを実行する必要があるデータタイムスタンプ範囲を選択します(構成されたスケジューリングタイムゾーンに従って計算されます)。タスクのスケジューリングサイクルに基づいてデータタイムスタンプを構成します。詳細については、以下のトピックをご参照ください。
日次、週次、または月次のスケジューリングサイクルのタスクの場合、[範囲別]、[サイクル別]、および [カスタム] データタイムスタンプを選択できます。各オプションのアプリケーションシナリオは次のとおりです。
[範囲別]: 複数の連続したデータタイムスタンプのデータをリフレッシュする必要があるシナリオに適しています。開始時刻と終了時刻を選択する必要があります。期間は 1 年を超えることはできません。
説明1 日だけデータバックフィルを実行する必要がある場合は、開始時刻と終了時刻に同じ日付を選択できます。
[周期別]: 複数の連続したデータタイムスタンプ内の特定の曜日または月の日付のデータをリフレッシュするために使用されます。まず、時間範囲を選択する必要があります。期間は 1 年を超えることはできません。
[週次]:連続期間内の選択された曜日をリフレッシュします。
[月次]:連続期間内の各月の選択された日付をリフレッシュします。
説明月末とは、各月の最終日を指します。
[カスタム]: 複数の非連続的なデータタイムスタンプのデータをリフレッシュする必要があるシナリオに適しています。
1900-01-01から現在までのデータタイムスタンプを手動で入力できます。フォーマットはYYYY-MM-DDである必要があります。複数のデータタイムスタンプのデータをリフレッシュするには、改行で区切ります。
時間ごとまたは分ごとのスケジューリングサイクルのタスクの場合、最初にデータタイムスタンプを選択してから、分単位で正確なデータバックフィル時間範囲を選択する必要があります。これにより、データバックフィルのデータタイムスタンプと時間範囲が定義されます。
フィールドの選択
モデリングタスクのデータバックフィルを実行している場合は、データバックフィルのフィールドを選択する必要があります。詳細については、以下のトピックをご参照ください。
プライマリキーまたはソーステーブルが変更された場合、データの整合性と正確性を確保するために、テーブル全体のデータバックフィルモードのみがサポートされます。
プライマリキーまたはソーステーブルが変更されていない場合は、フルテーブルデータバックフィルモードまたは指定フィールドデータバックフィルモードを選択できます。
[テーブル全体]:データテーブルのすべてのフィールドでデータバックフィルが必要なシナリオに適しています。
説明これには、登録済みのフィールドは含まれません。
[指定されたフィールド]:データバックフィルのフィールドをカスタマイズする必要があるシナリオに適しています。データバックフィルフィールドを選択すると、選択したフィールドと同じマテリアライズノード内のフィールドとシステムで必要なフィールドが自動的に選択されます。次のルールが適用されます。
選択したフィールドと同じマテリアライズノード内のフィールド。
システム実装で必要なフィールド(変更されたメトリックのスケジューリングサイクルがリフレッシュされてもマテリアライズが変更されない場合など)。
タスク実行時間
単一ノードインスタンスの実行時間です。[スケジュールされたインスタンスの実行時間を無視] または [スケジュールされたインスタンスの実行時間を待機] を選択できます。
[スケジュールされたインスタンスの実行時間を無視]: デフォルトで選択されています。インスタンスの実行条件に対して、スケジュールされた実行時間はチェックされません。
[スケジュールされたインスタンスの実行時間を待機]: インスタンスのすべての実行条件に対して、スケジュールされた実行時間を満たす必要があります。
その他の設定
単一インスタンスのデータバックフィル
論理ファクトテーブルのみを選択できます。
単一のデータバックフィルインスタンスを介して、このイベント論理ファクトテーブルの選択したすべての日付(範囲内)のデータを更新できます。通常の複数インスタンス同時データバックフィルと比較して、これにより計算リソースを節約し、データバックフィル時間を大幅に短縮できます。
同時グループ数
同時実行グループの数は、同時に実行されるデータバックフィルプロセスの数を制御するために使用されます。同時実行グループの数を選択できます。システムは、最小 1 グループ、最大 12 グループの同時実行をサポートしています。
データタイムスタンプの時間範囲が同時実行グループの数よりも短い場合、実際の並列グループの数はデータタイムスタンプの日数になります。
データタイムスタンプの時間範囲が同時実行グループの数よりも大きい場合、直列実行と並列実行の両方がある可能性があります。同じグループ内のインスタンスはデータタイムスタンプの順に実行されますが、異なるグループ内のインスタンスは並列に実行されます。たとえば、データタイムスタンプが 1 月 11 日から 1 月 13 日で、同時実行グループの数が 2 の場合、1 月 11 日と 1 月 12 日が 1 つのグループを形成し、1 月 13 日が別のグループを形成します。 1 月 11 日と 1 月 13 日のインスタンスは同時に実行を開始しますが、1 月 12 日のインスタンスは 1 月 11 日のインスタンスが完了した後に実行を開始します。
説明選択したノード間にエポックをまたぐ依存関係がある場合、同時実行はサポートされません。
データバックフィルの順序
ビジネス時間に基づいて昇順または降順でデータバックフィルを実行することを選択できます。
説明選択したノード間にサイクル間の依存関係または自己依存関係がある場合、データタイムスタンプの降順でのデータバックフィルはサポートされません。
一時停止中のスケジュールタスクのインスタンス
一時停止されたスケジュール済みタスクによって生成されたデータバックフィルインスタンスの実行ステータスを構成します。
[実行を一時停止(データバックフィルプロセスをブロックする可能性があります)]:これは、一時停止されたタスクによって生成されたすべてのデータバックフィルインスタンスの実行が一時停止されることを意味し、ダウンストリームインスタンスが正常に実行されるのをブロックします。
説明これは、現在のタスクもそのダウンストリームタスクも実行する必要がないシナリオに適しています。
[ドライラン]:ドライランが選択されている場合、選択された一時停止されたタスクによって生成されたデータバックフィルインスタンスは、ドライランモードで直接成功します。
説明これは、現在のタスクを実行する必要がないが、ダウンストリームタスクをスケジューリング構成に従って正常に実行する必要があるシナリオに適しています。
[正常に実行]:一時停止されたタスクによって生成されたすべてのデータバックフィルインスタンスは正常に実行されます。
説明これは、ノードがスケジューリングを一時停止するように設定されているが、選択されたデータバックフィルデータタイムスタンプで正常に実行する必要があるシナリオに適しています。
ドライラン定期タスクのインスタンス
ドライランのスケジュール済みタスクによって生成されたデータバックフィルインスタンスの実行ステータスを構成します。
[ドライラン]:ドライランが選択されている場合、選択されたドライランのスケジュール済みタスクによって生成されたデータバックフィルインスタンスは、ドライランモードで直接成功します。
[正常に実行]:ドライランタスクによって生成されたすべてのデータバックフィルインスタンスは正常に実行されます。
一時スケジュールリソースグループの指定
カスタムリソースグループ機能を有効にしている場合は、一時的なリソース消費ニーズを満たすために、このデータバックフィル操作のための一時リソースグループを指定できます。詳細については、「リソースグループの概要」をご参照ください。 一時スケジュールリソースグループが指定されていない場合は、各タスクに構成されたタスクスケジュールリソースグループがスケジューリングと実行に使用されます。
説明構成されたリソースグループは、アプリケーションシナリオに バッチ操作が含まれるリソースグループの選択のみをサポートします。
現在のタスクのバックフィル(モデリングタスク)はこの構成をサポートしていません。
ステップ 2: 推奨フィールドを選択する
モデリングタスクの [指定されたフィールド] に関連フィールドがある場合、[推奨フィールドの選択] ステップで、データバックフィル用のオプションの関連フィールドをまとめて選択できます。推奨される関連付けの理由には、[計算ロジックの変更]、[計算ロジックが変更されたプライマリテーブルのプライマリキー]、および [プライマリテーブルのプライマリキーが変更された場合の子テーブルのプライマリキー] などがあります。
[計算ロジックが変更されたフィールド]:フィールドの現在の計算ロジックは、選択したデータタイムスタンプ内の既存データ パーティションの計算ロジックとは異なり、フィールドの計算ロジックが変更されたことを意味します。このようなフィールドはデータバックフィルに含めることができます。
[計算ロジックが変更されたプライマリテーブルのプライマリキー]:親子次元テーブルのプライマリテーブルのプライマリキーの計算ロジックが、選択したデータタイムスタンプ範囲内で変更されました。プライマリテーブルのプライマリキーフィールドは、データバックフィルに含めることができます。
[プライマリテーブルのプライマリキーが変更された子テーブルのプライマリキー]:親子次元テーブルのプライマリテーブルのプライマリキーの計算ロジックが、選択したデータタイムスタンプ範囲内で変更されました(子テーブルの出力に影響します)。子テーブルのプライマリキーフィールドは、データバックフィルに含めることができます。
[OK] をクリックして、現在のタスクのデータバックフィル操作を完了します。
現在のタスクとアップストリーム/ダウンストリームタスクのデータをバックフィルする
[データバックフィル - 現在のタスクとダウンストリームタスクのバックフィル] ダイアログボックスで、データバックフィルタスクを構成します。
ステップ 1: 基本情報の構成
パラメーター
説明
データバックフィルインスタンス名
システムは、ノード名_実行日_インスタンス番号の形式で名前を自動的に生成します。手動で変更することもできます。
データバックフィル実行時間
データバックフィルインスタンス全体のスケジューリングが開始される時間です。[今すぐ実行] または [カスタム] を選択できます。
[すぐに実行]:構成が完了すると、データバックフィルインスタンスがすぐに生成され、データバックフィルタスクが実行されます。
[カスタム]: データバックフィルインスタンスが実行される特定の時間をカスタマイズできます。データバックフィルインスタンスは、カスタマイズされた時間にスケジューリングを開始します。
システムタイムゾーン(ユーザーセンターのタイムゾーン)がスケジューリングタイムゾーンと異なる場合、システムはシステムタイムゾーンとスケジューリングタイムゾーンの両方を表示します。実行時間を選択すると、システムは対応するスケジューリングタイムゾーンの時間を自動的に計算します。
説明カスタム実行時間は、現在の時刻より後でなければなりません。
カスタム実行時間を設定した後、[データタイムスタンプ] をカスタム日付までの日付に設定できます。
定期的にスケジュールされたデータバックフィルタスクは、スケジュールされた実行時間の前日の 23:00 に保留中のインスタンスを生成します。
データタイムスタンプ
データバックフィルを実行する必要があるデータタイムスタンプ範囲を選択します(構成されたスケジューリングタイムゾーンに従って計算されます)。タスクのスケジューリングサイクルに基づいてデータタイムスタンプを構成します。詳細については、以下のトピックをご参照ください。
日次、週次、月次のスケジューリングサイクルのタスクの場合、[範囲別]、[サイクル別]、および [カスタム] データタイムスタンプを選択できます。各オプションのアプリケーションシナリオは次のとおりです。
[範囲別]:複数の連続するデータタイムスタンプのデータをリフレッシュする必要があるシナリオに適しています。
説明1 日だけデータバックフィルを実行する必要がある場合は、開始時刻と終了時刻に同じ日付を選択できます。
[サイクル別]:複数の連続するデータタイムスタンプ内の特定の曜日または特定の日付のデータをリフレッシュするために使用されます。
[週次]:連続期間内の選択された曜日をリフレッシュします。
[月次]:連続期間内の各月の選択された日付をリフレッシュします。
説明月末とは、各月の最終日を指します。
[カスタム]: 複数の非連続的なデータタイムスタンプのデータをリフレッシュする必要があるシナリオに適しています。
YYYY-MM-DDの形式でデータタイムスタンプを手動で入力できます。複数のデータタイムスタンプのデータをリフレッシュするには、改行で区切ります。
時間ごとまたは分ごとのスケジューリングサイクルのタスクの場合、最初にデータタイムスタンプを選択してから、分単位で正確なデータバックフィル時間範囲を選択する必要があります。これにより、データバックフィルのデータタイムスタンプと時間範囲が定義されます。
フィールドを選択
モデリングタスクのデータバックフィルを実行している場合は、データバックフィルのフィールドを選択する必要があります。詳細については、以下のトピックをご参照ください。
プライマリキーまたはソーステーブルが変更された場合、データの整合性と正確性を確保するために、テーブル全体のデータバックフィルモードのみがサポートされます。
プライマリキーまたはソーステーブルが変更されていない場合は、テーブル全体のデータバックフィルモードまたは指定されたフィールドのデータバックフィルモードを選択できます。
[テーブル全体]:データテーブルのすべてのフィールドでデータバックフィルが必要なシナリオに適しています。
[指定されたフィールド]:データバックフィルのフィールドをカスタマイズする必要があるシナリオに適しています。データバックフィルフィールドを選択すると、選択したフィールドと同じマテリアライズノード内のフィールドとシステムで必要なフィールドが自動的に選択されます。次のルールが適用されます。
選択したフィールドと同じマテリアライズノード内のフィールド。
システム実装で必要なフィールド(変更されたメトリックのスケジューリングサイクルがリフレッシュされてもマテリアライズが変更されない場合など)。
タスク実行時間
単一ノードインスタンスの実行時間です。[定期インスタンスの実行時間を無視] または [定期インスタンスの実行時間を待機] を選択できます。
定期インスタンスの実行時間を無視:このオプションはデフォルトで選択されています。インスタンスの実行条件に対して、スケジュールされた実行時間はチェックされません。
定期インスタンスの実行時間を待機:インスタンスのすべての実行条件に対して、スケジュールされた実行時間を満たす必要があります。
ステップ 2: 推奨フィールドを選択する
モデリングタスクの [指定されたフィールド] に関連付けられたフィールドがある場合は、[推奨フィールドの選択] ステップで、データバックフィル用にオプションの関連付けられたフィールドを一緒に選択できます。推奨される関連付けの理由は、計算ロジックが変更された、計算ロジックが変更されたプライマリテーブルのプライマリキー、およびプライマリテーブルのプライマリキーが変更された子テーブルのプライマリキー子テーブルのプライマリキー (プライマリテーブルのプライマリキーが変更された場合)です。
[計算ロジックが変更されたフィールド]:フィールドの現在の計算ロジックは、選択したデータタイムスタンプ内の既存データ パーティションの計算ロジックとは異なり、フィールドの計算ロジックが変更されたことを意味します。このようなフィールドはデータバックフィルに含めることができます。
[計算ロジックが変更されたプライマリテーブルのプライマリキー]:親子次元テーブルのプライマリテーブルのプライマリキーの計算ロジックが、選択したデータタイムスタンプ範囲内で変更されました。プライマリテーブルのプライマリキーフィールドは、データバックフィルに含めることができます。
[プライマリテーブルのプライマリキーが変更された子テーブルのプライマリキー]:親子次元テーブルのプライマリテーブルのプライマリキーの計算ロジックが、選択したデータタイムスタンプ範囲内で変更されました(子テーブルの出力に影響します)。子テーブルのプライマリキーフィールドは、データバックフィルに含めることができます。
データバックフィルの構成
データバックフィル範囲 [リストモード] [一括モード]: リストモードと一括モードを使用して、データバックフィルが必要なアップストリームタスクとダウンストリームタスクを選択できます。
重要ノード間パラメーター関連の指示: ノードを選択する場合は、ノードがノード間パラメーターを参照するすべてのアップストリームノードを選択することをお勧めします。ダウンストリーム(Down) ノードがアップストリーム (Up) ノードからノード間出力パラメーターを参照する場合、同じデータバックフィルインスタンスでアップストリーム (Up) ノードを選択せずにダウンストリーム (Down) ノードでデータバックフィル操作を実行すると、ダウンストリーム (Down) ノードのノード間入力パラメーターは、アップストリーム (Up) ノードの最新 N 日の実行レコードから値を取得します。実行レコードがない場合、または N 日を超える場合は、デフォルト値が使用されます。最新 N 日 (N) のデフォルトは15 日ですが、変更される可能性があります。アップストリーム (Up) ノードとダウンストリーム (Down) ノードの両方を選択することをお勧めします。詳細については、「パラメーターの構成とノードパラメーターの使用」をご参照ください。
リストモード
すべてのレベルのアップストリームタスクとダウンストリームタスクに適しており、タスクの依存関係は 1 ~ 10 レベルまたはすべてのレベルからすばやく選択できます。リストには最大 2000 ノードを表示できます。この制限を超える場合は、一括モードを選択してください。リストの
アイコンをクリックして、ノードタイプ、プロジェクト、および O&M 所有者でノードをフィルタリングすることもできます。説明開始タスクが論理テーブルの場合、下流タスクの表示範囲は、データバックフィル用に選択された論理テーブルフィールドによって異なります。
アップストリームタスクとダウンストリームタスクの表示範囲には、現在のテーブルの選択されたフィールドのすべてのアップストリームタスクとダウンストリームタスクが含まれます。これには、関連する必須フィールドが含まれますが、関連する推奨フィールドは含まれません。
一時停止タスクと下流タスクのフィルター:
デフォルトで選択されています。選択すると、リストには、一時停止されたスケジューリングとそのすべてのダウンストリームノードが指定されたレベルおよびフィルタリング条件で表示されなくなり、すでに選択されている一時停止されたタスクもキャンセルされます。
論理テーブルの場合、一時停止されたフィールドが含まれていると、フィルタリングされます。依存関係のダウンストリームリストで一時停止としてマークされている論理テーブルのフィールドのすべてのダウンストリームタスクもフィルタリングされます。
説明ダウンストリームの論理テーブルフィールドは、全体としてデータバックフィルにのみ選択でき、一時停止されたフィールドを個別にフィルタリングすることはできません。
一括モード
リストモードが子孫ノードの選択要件を満たさない場合、たとえば、ノードが多すぎる場合や、特定のノードをバッチで選択する必要がある場合は、一括モードを選択できます。一括モードは、フィルター条件に基づいて選択された範囲内で現在のノードから下方向にノードを検索し、それらの依存関係に基づいてオーケストレーションします。このモードは、グローバルなデータバックフィルが必要なシナリオに適しています。一括モードは、次のフィルターパラメーターもサポートしています。
カバー範囲:次のいずれかのオプションを使用して範囲を指定します:[プロジェクトを指定]、[ノード出力名を指定]、[現在のノードのすべての子孫ノード]、[レベル 1 の子ノードとそのすべての子孫を指定]、[エンドポイントを指定]、[ノード名を指定]、[ノード ID を指定]、[開始点を指定]、[現在のノードのすべての先祖ノードと子孫ノード]、または [現在のノードのすべての先祖ノード]。
[プロジェクトの指定]:プロジェクトを指定してデータバックフィル範囲を指定します。
[ノード出力名の指定]:ノード出力名を入力してデータバックフィル範囲を指定します。複数のノードを入力する場合は、改行を使用して区切ります。最大 1000 個のノードを入力できます。
現在のノードのすべての [ダウンストリーム]/[アップストリーム]: 現在のノードのすべてのアップストリーム/ダウンストリームノードのデータをバックフィルします。
[レベル 1 の子ノードとそのすべてのダウンストリームを指定]:現在のノードのいくつかのレベル 1 の子ノードとそのすべてのダウンストリームノードのデータをバックフィルします。
[エンドポイントの指定]:開始点から終了点までのチェーン上のすべてのノードのデータをバックフィルします。開始点はデフォルトで現在のノードになり、変更できません。複数のエンドポイントノードを選択できます。
[開始点の指定]: 開始点からエンドポイントまでのチェーン上のすべてのノードのデータをバックフィルします。エンドポイントはデフォルトで現在のノードになり、変更できません。複数の開始点ノードを選択できます。
ノード名を指定/ノード ID を指定:指定された名前または ID を持つ現在のノードの子孫ノードのデータをバックフィルします。複数のエントリは改行で区切ります。最大 5,000 エントリまで入力できます。ノード名が複数のタスクに対応する場合、プロンプトで [データバックフィルノードを選択] をクリックします。[重複するノード名を持つノード] ダイアログボックスで、正しいノードを選択して、どのノードがデータバックフィルを必要とするかを確認します。
説明選択したエンドポイントノードが始点のダウンストリームノードでない場合、データバックフィルは、開始点と終了点の 2 つの独立したノードでのみ実行されます。
エンドポイントは [ID/ノード名] で検索でき、検索範囲は現在のテナント内のすべてのノードをカバーします。
論理テーブルタスクのエンドポイントは、テーブル全体(すべてのフィールド)の選択のみをサポートします。
[現在のノードのすべてのアップストリームとダウンストリーム]: 現在のノードのすべてのアップストリームノードとダウンストリームノードのデータをバックフィルします。
[選択範囲内を除外]:カバレッジ範囲から除外する[ノード出力名] または [ノード名] を指定します。 [一時停止されたノードとそのダウンストリームを除外] は、リストモードの [一時停止されたノードとそのダウンストリームをフィルタリング] と同様に、デフォルトで選択されています。
説明選択範囲内の特定のタスクを除外した後、データバックフィルインスタンスの DAG グラフに独立したタスクノードが表示される場合があります。
これは、1 つのダウンストリームタスクノードのみにデータバックフィルが必要なシナリオに適しています。
選択されたノードリスト:一括モードでは、[選択したノードリストを表示] をクリックしてデータバックフィル用のノードを確認したり、[選択したノードリストをエクスポート] をクリックしてリストをローカルの
csvファイルとしてエクスポートしたりできます。
その他の構成
パラメーター
説明
同時グループ数
同時実行グループの数は、同時に実行されるデータバックフィルプロセスの数を制御するために使用されます。同時実行グループの数を選択できます。システムは、最小 1 グループ、最大 12 グループの同時実行をサポートしています。
データタイムスタンプの時間範囲が同時実行グループの数よりも短い場合、実際の並列グループの数はデータタイムスタンプの日数になります。
データタイムスタンプの時間範囲が同時実行グループの数よりも大きい場合、直列実行と並列実行の両方がある可能性があります。同じグループ内のインスタンスはデータタイムスタンプの順に実行されますが、異なるグループ内のインスタンスは並列に実行されます。たとえば、データタイムスタンプが 1 月 11 日から 1 月 13 日で、同時実行グループの数が 2 の場合、1 月 11 日と 1 月 12 日が 1 つのグループを形成し、1 月 13 日が別のグループを形成します。 1 月 11 日と 1 月 13 日のインスタンスは同時に実行を開始しますが、1 月 12 日のインスタンスは 1 月 11 日のインスタンスが完了した後に実行を開始します。
説明選択したノード間にサイクル間の依存関係がある場合、同時実行はサポートされません。
データバックフィル順序
ビジネス時間に基づいて昇順または降順でデータバックフィルを実行することを選択できます。
説明選択したノード間にサイクル間の依存関係がある場合、データタイムスタンプの降順でのデータバックフィルはサポートされません。
このノードをドライラン
このタスクをドライランする必要があるかどうかを選択します。
[はい]:現在のタスクに対応するデータバックフィルインスタンスはドライランモードで実行されます。つまり、タスクを実際に実行せずにこのタスクがスケジュールされると、直接成功が返されます。
説明これは、現在のノードでデータバックフィルが不要であるが、現在のノードから選択されたダウンストリームノードでデータバックフィルが必要なシナリオに適しています。
[いいえ]: このノードは通常どおり実行されます。
スケジュール済みタスクインスタンスの一時停止
一時停止されたスケジュール済みタスクによって生成されたデータバックフィルインスタンスの実行ステータスを構成します。
[実行を一時停止(データバックフィルプロセスをブロックする可能性があります)]:これは、一時停止されたタスクによって生成されたすべてのデータバックフィルインスタンスの実行が一時停止されることを意味し、ダウンストリームインスタンスが正常に実行されるのをブロックします。
説明これは、現在のタスクもそのダウンストリームタスクも実行する必要がないシナリオに適しています。
[ドライラン]:ドライランが選択されている場合、選択された一時停止されたタスクによって生成されたデータバックフィルインスタンスは、ドライランモードで直接成功します。
説明これは、現在のタスクを実行する必要がないが、ダウンストリームタスクをスケジューリング構成に従って正常に実行する必要があるシナリオに適しています。
[正常に実行]:一時停止されたタスクによって生成されたすべてのデータバックフィルインスタンスは正常に実行されます。
説明これは、ノードがスケジューリングを一時停止するように設定されているが、選択されたデータバックフィルデータタイムスタンプで正常に実行する必要があるシナリオに適しています。
[ドライランのスケジュール済みタスクのインスタンス]
ドライランのスケジュール済みタスクによって生成されたデータバックフィルインスタンスの実行ステータスを構成します。
[ドライラン]:ドライランが選択されている場合、選択されたドライランのスケジュール済みタスクによって生成されたデータバックフィルインスタンスは、ドライランモードで直接成功します。
[正常に実行]:ドライランタスクによって生成されたすべてのデータバックフィルインスタンスは正常に実行されます。
時間単位の影響範囲
これらが時間ごとまたは分ごとのタスクである場合は、有効範囲も構成する必要があります。
[日次/週次/月次のスケジュール済みタスクに影響を与えない(選択時に実行)]:これは、ダウンストリームタスクが時間範囲の選択の影響を受けず、すべて実行されることを意味します。
[日次/週次/月次のスケジュール済みタスクは、スケジュールされた実行時間が選択された時間範囲内にある場合にのみ実行される]:これは、ダウンストリームタスクが時間範囲の影響を受け、スケジュールされた実行時間が選択された時間範囲内にある場合にのみ実行されることを意味します。
一時スケジュールリソースグループの指定
カスタムリソースグループ機能を有効にしている場合は、一時的なリソース消費ニーズを満たすために、このデータバックフィル操作のための一時リソースグループを指定できます。詳細については、「リソースグループの概要」をご参照ください。 一時スケジュールリソースグループが指定されていない場合は、各タスクに構成されたタスクスケジュールリソースグループがスケジューリングと実行に使用されます。
説明構成されたリソースグループは、アプリケーションシナリオに バッチ操作が含まれるリソースグループの選択のみをサポートします。
[OK] をクリックして、現在およびダウンストリームタスクのデータバックフィル操作を完了します。
次のステップ
データバックフィル操作を送信した後、実行ログの表示、ノードコードの表示、インスタンス実行の停止など、データバックフィルインスタンスの操作管理を実行できます。詳細については、「データバックフィルインスタンス O&M の概要」をご参照ください。