すべてのプロダクト
Search
ドキュメントセンター

Dataphin:定期タスクのデータバックフィル

最終更新日:Jul 08, 2025

定期タスクのデータバックフィル機能を使用すると、指定された既存データ タイムスタンプ内のデータをリフレッシュできます。定期タスクが開発および公開されると、構成されたスケジュールに従って実行されます。特定の期間に定期タスクを実行したり、既存データ の時間範囲のデータをリフレッシュしたりする必要がある場合は、データバックフィル機能を使用できます。ノードで使用されるスケジューリングパラメーターは、データバックフィルに選択されたビジネス時間に基づいて、対応する値に自動的に置き換えられます。このトピックでは、定期タスクのデータバックフィルを実行する方法について説明します。

シナリオ

データバックフィル機能は、一般的に次のシナリオで使用されます。

  • 新しく開発された定期タスクは、翌日以降にのみスケジュールできます。既存データ パーティションデータをすぐに表示する必要がある場合は、データバックフィル操作を実行できます。

  • アップストリームの依存タスクが再実行されるか、データがバックフィルされると、既存データ パーティションデータがリフレッシュされます。データバックフィル機能を使用して、ダウンストリームタスクの既存データ パーティションデータをリフレッシュできます。

  • 既存データ のビジネスデータが欠落していて、定期的にリフレッシュする必要がある場合。

データバックフィルモード

現在、オペレーションセンターのデータバックフィル機能は、現在のタスクと、現在のタスクとそのアップストリームおよびダウンストリームタスクのデータバックフィルをサポートしています。詳細については、以下のトピックをご参照ください。

  • [現在のタスクのバックフィル]: 現在のタスクでデータバックフィル操作を実行することを指します。これは、次のシナリオに適しています。

    • ダウンストリームノードデータを更新せずに、現在のノードのデータをリフレッシュする必要がある場合。

    • 現在のタスクの計算ロジックが変更された場合は、最初に現在のタスクでデータバックフィルを実行して計算ロジックの正確性を検証してから、ダウンストリームタスクのデータをリフレッシュできます。

  • [現在のタスクとアップストリーム/ダウンストリームタスクのバックフィル]: 現在のタスクとそのアップストリーム/ダウンストリームタスクをリフレッシュすることを指し、トレースデータ全体をリフレッシュする必要があるシナリオに適しています。

データバックフィル操作のエントリ

  1. Dataphin ホームページの上部メニューバーで、[開発] > [タスク O&M] を選択します。

  2. 左側のナビゲーションウィンドウで、[タスク O&M] > [定期タスク] を選択します。

  3. 上部ナビゲーションバーで、本番環境または開発環境を選択します。

  4. [統合およびコンピューティングタスク] または [モデリングタスク] タブで、対象のタスクの [データバックフィル] 列にある [アクション] image アイコンをクリックし、[現在のタスクをバックフィル] または [現在および上流/下流タスクをバックフィル] を選択します。

    説明

    データバックフィル操作は、定期タスクの DAG グラフでも実行できます。詳細については、「定期タスクの DAG グラフ」をご参照ください。

現在のタスクのデータをバックフィルする

  1. [データバックフィル - 現在のタスクをバックフィル] ダイアログボックスで、データバックフィルタスクを構成します。

    1. ステップ 1: データバックフィルの構成

      パラメーター

      説明

      基本情報

      [データバックフィルインスタンス名]

      システムは、ノード名_実行日_インスタンス番号の形式で名前を自動的に生成します。手動で変更することもできます。

      [実行時間]

      [すぐに実行] または [カスタム] 実行をサポートします。

      • [すぐに実行]:構成が完了すると、データバックフィルインスタンスがすぐに生成され、データバックフィルタスクが実行されます。

      • [カスタム]:データバックフィルインスタンスが実行される特定の時間をカスタマイズできます。データバックフィルインスタンスは、カスタマイズされた時間にスケジュールを開始します。

        システムタイムゾーン(ユーザーセンターのタイムゾーン)がスケジューリングタイムゾーンと異なる場合、システムはシステムタイムゾーンとスケジューリングタイムゾーンの両方を表示します。実行時間を選択すると、システムは対応するスケジューリングタイムゾーンの時間を自動的に計算します。

      説明
      • カスタム実行時間は、現在の時刻より後である必要があります。

      • カスタム実行時間を構成した後、[データタイムスタンプ] は、遅くともカスタム日付の当日まで選択できます。

      • 定期的にスケジュールされたデータバックフィルタスクは、スケジュールされた実行時間の前日の 23:00 に保留中のインスタンスを生成します。

      [データタイムスタンプ]

      データバックフィルを実行する必要があるデータタイムスタンプ範囲を選択します(構成されたスケジューリングタイムゾーンに従って計算されます)。タスクのスケジューリングサイクルに基づいてデータタイムスタンプを構成します。詳細については、以下のトピックをご参照ください。

      • 日次、週次、または月次のスケジューリングサイクルのタスクの場合、[範囲別][サイクル別]、および [カスタム] データタイムスタンプを選択できます。各オプションのアプリケーションシナリオは次のとおりです。

        • [範囲別]:複数の連続するデータタイムスタンプのデータをリフレッシュする必要があるシナリオに適しています。

          説明

          1 日だけデータバックフィルを実行する必要がある場合は、開始時刻と終了時刻に同じ日付を選択できます。

        • [サイクル別]:複数の連続するデータタイムスタンプ内の特定の曜日または特定の日付のデータをリフレッシュするために使用されます。

          • [週次]:連続期間内の選択された曜日をリフレッシュします。

          • [月次]:連続期間内の各月の選択された日付をリフレッシュします。

            説明

            月末とは、各月の最終日を指します。

        • [カスタム]: 複数の連続していないデータタイムスタンプのデータをリフレッシュする必要があるシナリオに適しています。YYYY-MM-DD の形式でデータタイムスタンプを手動で入力できます。複数のデータタイムスタンプのデータをリフレッシュする必要がある場合は、改行で区切ります。

      • 時間ごとまたは分ごとのスケジューリングサイクルのタスクの場合、最初にデータタイムスタンプを選択してから、分単位で正確なデータバックフィル時間範囲を選択する必要があります。これにより、データバックフィルのデータタイムスタンプと時間範囲が定義されます。

      [フィールドの選択]

      モデリングタスクのデータバックフィルを実行している場合は、データバックフィルのフィールドを選択する必要があります。詳細については、以下のトピックをご参照ください。

      • プライマリキーまたはソーステーブルが変更された場合、データの整合性と正確性を確保するために、テーブル全体のデータバックフィルモードのみがサポートされます。

      • プライマリキーまたはソーステーブルが変更されていない場合は、フルテーブルデータバックフィルモードまたは指定フィールドデータバックフィルモードを選択できます。

        • [テーブル全体]:データテーブルのすべてのフィールドでデータバックフィルが必要なシナリオに適しています。

          説明

          これには、登録済みのフィールドは含まれません。

        • [指定されたフィールド]:データバックフィルのフィールドをカスタマイズする必要があるシナリオに適しています。データバックフィルフィールドを選択すると、選択したフィールドと同じマテリアライズノード内のフィールドとシステムで必要なフィールドが自動的に選択されます。次のルールが適用されます。

          • 選択したフィールドと同じマテリアライズノード内のフィールド。

          • システム実装で必要なフィールド(変更されたメトリックのスケジューリングサイクルがリフレッシュされてもマテリアライズが変更されない場合など)。

      [その他の構成]

      [単一インスタンスデータバックフィル]

      論理ファクトテーブルのみを選択できます。

      単一のデータバックフィルインスタンスを介して、このイベント論理ファクトテーブルの選択したすべての日付(範囲内)のデータを更新できます。通常の複数インスタンス同時データバックフィルと比較して、これにより計算リソースを節約し、データバックフィル時間を大幅に短縮できます。

      [同時実行グループの数]

      同時実行グループの数は、同時に実行されるデータバックフィルプロセスの数を制御するために使用されます。同時実行グループの数を選択できます。システムは、最小 1 グループ、最大 12 グループの同時実行をサポートしています。

      • データタイムスタンプの時間範囲が同時実行グループの数よりも短い場合、実際の並列グループの数はデータタイムスタンプの日数になります。

      • データタイムスタンプの時間範囲が同時実行グループの数よりも大きい場合、直列実行と並列実行の両方がある可能性があります。同じグループ内のインスタンスはデータタイムスタンプの順に実行されますが、異なるグループ内のインスタンスは並列に実行されます。たとえば、データタイムスタンプが 1 月 11 日から 1 月 13 日で、同時実行グループの数が 2 の場合、1 月 11 日と 1 月 12 日が 1 つのグループを形成し、1 月 13 日が別のグループを形成します。 1 月 11 日と 1 月 13 日のインスタンスは同時に実行を開始しますが、1 月 12 日のインスタンスは 1 月 11 日のインスタンスが完了した後に実行を開始します。

        説明

        選択したノード間にエポックをまたぐ依存関係がある場合、同時実行はサポートされません。

      [データバックフィル順序]

      ビジネス時間に基づいて昇順または降順でデータバックフィルを実行することを選択できます。

      説明

      選択したノード間にサイクル間の依存関係または自己依存関係がある場合、データタイムスタンプの降順でのデータバックフィルはサポートされません。

      [一時停止されたスケジュール済みタスクのインスタンス]

      一時停止されたスケジュール済みタスクによって生成されたデータバックフィルインスタンスの実行ステータスを構成します。

      • [実行を一時停止(データバックフィルプロセスをブロックする可能性があります)]:これは、一時停止されたタスクによって生成されたすべてのデータバックフィルインスタンスの実行が一時停止されることを意味し、ダウンストリームインスタンスが正常に実行されるのをブロックします。

        説明

        これは、現在のタスクもそのダウンストリームタスクも実行する必要がないシナリオに適しています。

      • [ドライラン]:ドライランが選択されている場合、選択された一時停止されたタスクによって生成されたデータバックフィルインスタンスは、ドライランモードで直接成功します。

        説明

        これは、現在のタスクを実行する必要がないが、ダウンストリームタスクをスケジューリング構成に従って正常に実行する必要があるシナリオに適しています。

      • [正常に実行]:一時停止されたタスクによって生成されたすべてのデータバックフィルインスタンスは正常に実行されます。

        説明

        これは、ノードがスケジューリングを一時停止するように設定されているが、選択されたデータバックフィルデータタイムスタンプで正常に実行する必要があるシナリオに適しています。

      [ドライランのスケジュール済みタスクのインスタンス]

      ドライランのスケジュール済みタスクによって生成されたデータバックフィルインスタンスの実行ステータスを構成します。

      [ドライラン]:ドライランが選択されている場合、選択されたドライランのスケジュール済みタスクによって生成されたデータバックフィルインスタンスは、ドライランモードで直接成功します。

      [正常に実行]:ドライランタスクによって生成されたすべてのデータバックフィルインスタンスは正常に実行されます。

      [一時スケジュールリソースグループを指定]

      カスタムリソースグループ機能を有効にしている場合は、一時的なリソース消費ニーズを満たすために、このデータバックフィル操作のための一時リソースグループを指定できます。詳細については、「リソースグループの概要」をご参照ください。 一時スケジュールリソースグループが指定されていない場合は、各タスクに構成されたタスクスケジュールリソースグループがスケジューリングと実行に使用されます。

      説明
      • 構成されたリソースグループは、アプリケーションシナリオに バッチ操作が含まれるリソースグループの選択のみをサポートします。

      • 現在のタスクのバックフィル(モデリングタスク)はこの構成をサポートしていません。

    2. ステップ 2: 推奨フィールドを選択する

      モデリングタスクの [指定されたフィールド] に関連付けられたフィールドがある場合は、[推奨フィールドの選択] ステップで、データバックフィル用にオプションの関連付けられたフィールドを一緒に選択できます。推奨される関連付けの理由は、計算ロジックが変更された計算ロジックが変更されたプライマリテーブルのプライマリキー、およびプライマリテーブルのプライマリキーが変更された子テーブルのプライマリキー(オプション) 既存のメディア ファイルを移行します。です。

      • [計算ロジックが変更されたフィールド]:フィールドの現在の計算ロジックは、選択したデータタイムスタンプ内の既存データ パーティションの計算ロジックとは異なり、フィールドの計算ロジックが変更されたことを意味します。このようなフィールドはデータバックフィルに含めることができます。

      • [計算ロジックが変更されたプライマリテーブルのプライマリキー]:親子次元テーブルのプライマリテーブルのプライマリキーの計算ロジックが、選択したデータタイムスタンプ範囲内で変更されました。プライマリテーブルのプライマリキーフィールドは、データバックフィルに含めることができます。

      • [プライマリテーブルのプライマリキーが変更された子テーブルのプライマリキー]:親子次元テーブルのプライマリテーブルのプライマリキーの計算ロジックが、選択したデータタイムスタンプ範囲内で変更されました(子テーブルの出力に影響します)。子テーブルのプライマリキーフィールドは、データバックフィルに含めることができます。

  2. [OK] をクリックして、現在のタスクのデータバックフィル操作を完了します。

現在のタスクとアップストリーム/ダウンストリームタスクのデータをバックフィルする

  1. [データバックフィル - 現在のタスクとダウンストリームタスクのバックフィル] ダイアログボックスで、データバックフィルタスクを構成します。

    1. ステップ 1: 基本情報の構成

      パラメーター

      説明

      [データバックフィルインスタンス名]

      システムは、ノード名_実行日_インスタンス番号の形式で名前を自動的に生成します。手動で変更することもできます。

      [実行時間]

      [すぐに実行] または [カスタム] 実行をサポートします。

      • [すぐに実行]:構成が完了すると、データバックフィルインスタンスがすぐに生成され、データバックフィルタスクが実行されます。

      • [カスタム]: データバックフィルインスタンスが実行される特定の時間をカスタマイズできます。データバックフィルインスタンスは、カスタマイズされた時間にスケジューリングを開始します。

        システムタイムゾーン(ユーザーセンターのタイムゾーン)がスケジューリングタイムゾーンと異なる場合、システムはシステムタイムゾーンとスケジューリングタイムゾーンの両方を表示します。実行時間を選択すると、システムは対応するスケジューリングタイムゾーンの時間を自動的に計算します。

      説明
      • カスタム実行時間は、現在の時刻より後である必要があります。

      • カスタム実行時間を構成した後、[データタイムスタンプ] は、遅くともカスタム日付の当日まで選択できます。

      • 定期的にスケジュールされたデータバックフィルタスクは、スケジュールされた実行時間の前日の 23:00 に保留中のインスタンスを生成します。

      [データタイムスタンプ]

      データバックフィルを実行する必要があるデータタイムスタンプ範囲を選択します(構成されたスケジューリングタイムゾーンに従って計算されます)。タスクのスケジューリングサイクルに基づいてデータタイムスタンプを構成します。詳細については、以下のトピックをご参照ください。

      • 日次、週次、月次のスケジューリングサイクルのタスクの場合、[範囲別][サイクル別]、および [カスタム] データタイムスタンプを選択できます。各オプションのアプリケーションシナリオは次のとおりです。

        • [範囲別]:複数の連続するデータタイムスタンプのデータをリフレッシュする必要があるシナリオに適しています。

          説明

          1 日だけデータバックフィルを実行する必要がある場合は、開始時刻と終了時刻に同じ日付を選択できます。

        • [サイクル別]:複数の連続するデータタイムスタンプ内の特定の曜日または特定の日付のデータをリフレッシュするために使用されます。

          • [週次]:連続期間内の選択された曜日をリフレッシュします。

          • [月次]:連続期間内の各月の選択された日付をリフレッシュします。

            説明

            月末とは、各月の最終日を指します。

        • [カスタム]: 複数の連続していないデータタイムスタンプのデータをリフレッシュする必要があるシナリオに適しています。YYYY-MM-DD の形式でデータタイムスタンプを手動で入力できます。複数のデータタイムスタンプのデータをリフレッシュする必要がある場合は、改行で区切ります。

      • 時間ごとまたは分ごとのスケジューリングサイクルのタスクの場合、最初にデータタイムスタンプを選択してから、分単位で正確なデータバックフィル時間範囲を選択する必要があります。これにより、データバックフィルのデータタイムスタンプと時間範囲が定義されます。

      [フィールドの選択]

      モデリングタスクのデータバックフィルを実行している場合は、データバックフィルのフィールドを選択する必要があります。詳細については、以下のトピックをご参照ください。

      • プライマリキーまたはソーステーブルが変更された場合、データの整合性と正確性を確保するために、テーブル全体のデータバックフィルモードのみがサポートされます。

      • プライマリキーまたはソーステーブルが変更されていない場合は、テーブル全体のデータバックフィルモードまたは指定されたフィールドのデータバックフィルモードを選択できます。

        • [テーブル全体]:データテーブルのすべてのフィールドでデータバックフィルが必要なシナリオに適しています。

        • [指定されたフィールド]:データバックフィルのフィールドをカスタマイズする必要があるシナリオに適しています。データバックフィルフィールドを選択すると、選択したフィールドと同じマテリアライズノード内のフィールドとシステムで必要なフィールドが自動的に選択されます。次のルールが適用されます。

          • 選択したフィールドと同じマテリアライズノード内のフィールド。

          • システム実装で必要なフィールド(変更されたメトリックのスケジューリングサイクルがリフレッシュされてもマテリアライズが変更されない場合など)。

    2. ステップ 2: 推奨フィールドを選択する

      モデリングタスクの [指定されたフィールド] に関連付けられたフィールドがある場合は、[推奨フィールドの選択] ステップで、データバックフィル用にオプションの関連付けられたフィールドを一緒に選択できます。推奨される関連付けの理由は、計算ロジックが変更された計算ロジックが変更されたプライマリテーブルのプライマリキー、およびプライマリテーブルのプライマリキーが変更された子テーブルのプライマリキー子テーブルのプライマリキー (プライマリテーブルのプライマリキーが変更された場合)です。

      • [計算ロジックが変更されたフィールド]:フィールドの現在の計算ロジックは、選択したデータタイムスタンプ内の既存データ パーティションの計算ロジックとは異なり、フィールドの計算ロジックが変更されたことを意味します。このようなフィールドはデータバックフィルに含めることができます。

      • [計算ロジックが変更されたプライマリテーブルのプライマリキー]:親子次元テーブルのプライマリテーブルのプライマリキーの計算ロジックが、選択したデータタイムスタンプ範囲内で変更されました。プライマリテーブルのプライマリキーフィールドは、データバックフィルに含めることができます。

      • [プライマリテーブルのプライマリキーが変更された子テーブルのプライマリキー]:親子次元テーブルのプライマリテーブルのプライマリキーの計算ロジックが、選択したデータタイムスタンプ範囲内で変更されました(子テーブルの出力に影響します)。子テーブルのプライマリキーフィールドは、データバックフィルに含めることができます。

    3. データバックフィルの構成

      データバックフィル範囲 [リストモード] [一括モード]: リストモードと一括モードを使用して、データバックフィルが必要なアップストリームタスクとダウンストリームタスクを選択できます。

      重要

      ノード間パラメーター関連の指示: ノードを選択する場合は、ノードがノード間パラメーターを参照するすべてのアップストリームノードを選択することをお勧めします。ダウンストリーム(Down) ノードがアップストリーム (Up) ノードからノード間出力パラメーターを参照する場合、同じデータバックフィルインスタンスでアップストリーム (Up) ノードを選択せずにダウンストリーム (Down) ノードでデータバックフィル操作を実行すると、ダウンストリーム (Down) ノードのノード間入力パラメーターは、アップストリーム (Up) ノードの最新 N 日の実行レコードから値を取得します。実行レコードがない場合、または N 日を超える場合は、デフォルト値が使用されます。最新 N 日 (N) のデフォルトは15 日ですが、変更される可能性があります。アップストリーム (Up) ノードとダウンストリーム (Down) ノードの両方を選択することをお勧めします。詳細については、「パラメーターの構成とノードパラメーターの使用」をご参照ください。

      リストモード

      すべてのレベルのアップストリームタスクとダウンストリームタスクに適しており、タスクの依存関係は 1 ~ 10 レベルまたはすべてのレベルからすばやく選択できます。リストには最大 2000 ノードを表示できます。この制限を超える場合は、一括モードを選択してください。リストの image アイコンをクリックして、ノードタイププロジェクト、および O&M 所有者でノードをフィルタリングすることもできます。

      説明
      • 開始タスクが論理テーブルの場合、下流タスクの表示範囲は、データバックフィル用に選択された論理テーブルフィールドによって異なります。

      • アップストリームタスクとダウンストリームタスクの表示範囲には、現在のテーブルの選択されたフィールドのすべてのアップストリームタスクとダウンストリームタスクが含まれます。これには、関連する必須フィールドが含まれますが、関連する推奨フィールドは含まれません。

      [一時停止されたタスクとその下流をフィルタリング]:

      • デフォルトで選択されています。選択すると、リストには、一時停止されたスケジューリングとそのすべてのダウンストリームノードが指定されたレベルおよびフィルタリング条件で表示されなくなり、すでに選択されている一時停止されたタスクもキャンセルされます。

      • 論理テーブルの場合、一時停止されたフィールドが含まれていると、フィルタリングされます。依存関係のダウンストリームリストで一時停止としてマークされている論理テーブルのフィールドのすべてのダウンストリームタスクもフィルタリングされます。

        説明

        ダウンストリームの論理テーブルフィールドは、全体としてデータバックフィルにのみ選択でき、一時停止されたフィールドを個別にフィルタリングすることはできません。

      一括モード

      リストモードではダウンストリームノードを選択するための要件を満たせない場合(たとえば、ノードが多すぎる場合、または特定の特定のノードを一括選択する必要がある場合)、一括モードを選択できます。一括モードでは、フィルタリング条件に従って現在のノードから下方向に選択された範囲内のタスクが検索され、依存関係に基づいて配置されます。これは、グローバルデータバックフィルが必要なシナリオに適しています。一括モードでは、次のフィルタリングパラメーターもサポートされています。

      • [カバレッジ範囲]: [プロジェクトの指定][ノード出力名の指定][現在のノードのすべてのダウンストリーム][レベル 1 の子ノードとそのすべてのダウンストリームを指定][エンドポイントの指定][ノード名の指定][開始点の指定][現在のノードのすべてのアップストリームとダウンストリーム][現在のノードのすべてのアップストリーム] を使用して範囲を指定できます。

        • [プロジェクトの指定]:プロジェクトを指定してデータバックフィル範囲を指定します。

        • [ノード出力名の指定]:ノード出力名を入力してデータバックフィル範囲を指定します。複数のノードを入力する場合は、改行を使用して区切ります。最大 1000 個のノードを入力できます。

        • 現在のノードのすべての [ダウンストリーム]/[アップストリーム]: 現在のノードのすべてのアップストリーム/ダウンストリームノードのデータをバックフィルします。

        • [レベル 1 の子ノードとそのすべてのダウンストリームを指定]:現在のノードのいくつかのレベル 1 の子ノードとそのすべてのダウンストリームノードのデータをバックフィルします。

        • [エンドポイントの指定]:開始点から終了点までのチェーン上のすべてのノードのデータをバックフィルします。開始点はデフォルトで現在のノードになり、変更できません。複数のエンドポイントノードを選択できます。

        • [開始点の指定]: 開始点からエンドポイントまでのチェーン上のすべてのノードのデータをバックフィルします。エンドポイントはデフォルトで現在のノードになり、変更できません。複数の開始点ノードを選択できます。

        • [ノード名の指定]:現在のノードのダウンストリームにある、指定されたノード名のデータをバックフィルします。複数のノードは改行で区切り、最大 5000 文字まで入力できます。ノード名が複数のタスクに対応している場合は、プロンプトメッセージの [データバックフィルノードを選択] をクリックできます。 [ノード名が重複しているノード] ダイアログボックスで、対応するノードを選択して、どのノードでデータバックフィルが必要かを確認します。

          説明
          • 選択したエンドポイントノードが始点のダウンストリームノードでない場合、データバックフィルは、開始点と終了点の 2 つの独立したノードでのみ実行されます。

          • エンドポイントは [ID/ノード名] で検索でき、検索範囲は現在のテナント内のすべてのノードをカバーします。

          • 論理テーブルタスクのエンドポイントは、テーブル全体(すべてのフィールド)の選択のみをサポートします。

        • [現在のノードのすべてのアップストリームとダウンストリーム]: 現在のノードのすべてのアップストリームノードとダウンストリームノードのデータをバックフィルします。

      • [選択範囲内を除外]:カバレッジ範囲から除外する[ノード出力名] または [ノード名] を指定します。 [一時停止されたノードとそのダウンストリームを除外] は、リストモードの [一時停止されたノードとそのダウンストリームをフィルタリング] と同様に、デフォルトで選択されています。

        説明
        • 選択範囲内の特定のタスクを除外した後、データバックフィルインスタンスの DAG グラフに独立したタスクノードが表示される場合があります。

        • これは、1 つのダウンストリームタスクノードのみにデータバックフィルが必要なシナリオに適しています。

      • 一括モードでは、[選択済みノードリスト] [選択済みノードのリストを表示] でデータバックフィルノードを確認するか、[選択済みノードリストをエクスポート] をクリックして csv 形式のローカルファイルとしてエクスポートできます。

    4. その他の構成

      パラメーター

      説明

      [同時実行グループの数]

      同時実行グループの数は、同時に実行されるデータバックフィルプロセスの数を制御するために使用されます。同時実行グループの数を選択できます。システムは、最小 1 グループ、最大 12 グループの同時実行をサポートしています。

      • データタイムスタンプの時間範囲が同時実行グループの数よりも短い場合、実際の並列グループの数はデータタイムスタンプの日数になります。

      • データタイムスタンプの時間範囲が同時実行グループの数よりも大きい場合、直列実行と並列実行の両方がある可能性があります。同じグループ内のインスタンスはデータタイムスタンプの順に実行されますが、異なるグループ内のインスタンスは並列に実行されます。たとえば、データタイムスタンプが 1 月 11 日から 1 月 13 日で、同時実行グループの数が 2 の場合、1 月 11 日と 1 月 12 日が 1 つのグループを形成し、1 月 13 日が別のグループを形成します。 1 月 11 日と 1 月 13 日のインスタンスは同時に実行を開始しますが、1 月 12 日のインスタンスは 1 月 11 日のインスタンスが完了した後に実行を開始します。

        説明

        選択したノード間にサイクル間の依存関係がある場合、同時実行はサポートされません。

      [データバックフィル順序]

      ビジネス時間に基づいて昇順または降順でデータバックフィルを実行することを選択できます。

      説明

      選択したノード間にサイクル間の依存関係がある場合、データタイムスタンプの降順でのデータバックフィルはサポートされません。

      [このノードをドライラン]

      このタスクをドライランする必要があるかどうかを選択します。

      • [はい]:現在のタスクに対応するデータバックフィルインスタンスはドライランモードで実行されます。つまり、タスクを実際に実行せずにこのタスクがスケジュールされると、直接成功が返されます。

        説明

        これは、現在のノードでデータバックフィルが不要であるが、現在のノードから選択されたダウンストリームノードでデータバックフィルが必要なシナリオに適しています。

      • [いいえ]: このノードは通常どおり実行されます。

      [一時停止されたスケジュール済みタスクのインスタンス]

      一時停止されたスケジュール済みタスクによって生成されたデータバックフィルインスタンスの実行ステータスを構成します。

      • [実行を一時停止(データバックフィルプロセスをブロックする可能性があります)]:これは、一時停止されたタスクによって生成されたすべてのデータバックフィルインスタンスの実行が一時停止されることを意味し、ダウンストリームインスタンスが正常に実行されるのをブロックします。

        説明

        これは、現在のタスクもそのダウンストリームタスクも実行する必要がないシナリオに適しています。

      • [ドライラン]:ドライランが選択されている場合、選択された一時停止されたタスクによって生成されたデータバックフィルインスタンスは、ドライランモードで直接成功します。

        説明

        これは、現在のタスクを実行する必要がないが、ダウンストリームタスクをスケジューリング構成に従って正常に実行する必要があるシナリオに適しています。

      • [正常に実行]:一時停止されたタスクによって生成されたすべてのデータバックフィルインスタンスは正常に実行されます。

        説明

        これは、ノードがスケジューリングを一時停止するように設定されているが、選択されたデータバックフィルデータタイムスタンプで正常に実行する必要があるシナリオに適しています。

      [ドライランのスケジュール済みタスクのインスタンス]

      ドライランのスケジュール済みタスクによって生成されたデータバックフィルインスタンスの実行ステータスを構成します。

      • [ドライラン]:ドライランが選択されている場合、選択されたドライランのスケジュール済みタスクによって生成されたデータバックフィルインスタンスは、ドライランモードで直接成功します。

      • [正常に実行]:ドライランタスクによって生成されたすべてのデータバックフィルインスタンスは正常に実行されます。

      [時間範囲の影響範囲]

      これらが時間ごとまたは分ごとのタスクである場合は、有効範囲も構成する必要があります。

      • [日次/週次/月次のスケジュール済みタスクに影響を与えない(選択時に実行)]:これは、ダウンストリームタスクが時間範囲の選択の影響を受けず、すべて実行されることを意味します。

      • [日次/週次/月次のスケジュール済みタスクは、スケジュールされた実行時間が選択された時間範囲内にある場合にのみ実行される]:これは、ダウンストリームタスクが時間範囲の影響を受け、スケジュールされた実行時間が選択された時間範囲内にある場合にのみ実行されることを意味します。

      [一時スケジュールリソースグループを指定]

      カスタムリソースグループ機能を有効にしている場合は、一時的なリソース消費ニーズを満たすために、このデータバックフィル操作のための一時リソースグループを指定できます。詳細については、「リソースグループの概要」をご参照ください。 一時スケジュールリソースグループが指定されていない場合は、各タスクに構成されたタスクスケジュールリソースグループがスケジューリングと実行に使用されます。

      説明

      構成されたリソースグループは、アプリケーションシナリオに バッチ操作が含まれるリソースグループの選択のみをサポートします。

    5. [OK] をクリックして、現在およびダウンストリームタスクのデータバックフィル操作を完了します。

次のステップ

データバックフィル操作を送信した後、実行ログの表示、ノードコードの表示、インスタンス実行の停止など、データバックフィルインスタンスの操作管理を実行できます。詳細については、「データバックフィルインスタンス O&M の概要」をご参照ください。