すべてのプロダクト
Search
ドキュメントセンター

DataWorks:データバックフィルインスタンスの管理

最終更新日:Mar 19, 2026

データバックフィルを実行すると、コード内のスケジューリングパラメーターは、選択した Data Timestamp に基づいて特定の値に自動的に置き換えられます。これにより、コードは正しいパーティションにデータを書き込めるようになります。ターゲットとなるパーティションと実行ロジックは、ノードのコードによって決まります。

権限

データバックフィルワークフロー内のすべてのノードに対する Action 権限が必要です。いずれかのノードに対する権限がない場合、以下の結果が発生します。

  • ターゲットノードに対する権限がない場合ルートノードまたはその子孫ノードのいずれかに対する Action 権限がない場合、データバックフィルは実行できません

  • 中間ノードに対する権限がない場合:中間ノード (その先祖ノードと子孫ノードの両方がバックフィル範囲内にあることを意味します) に対する権限がない場合、システムはそのノードでドライランを実行します。

    • ドライランの動作:ノードが開始されると、実際の計算ロジックは実行されません。代わりに、すぐに 成功 ステータスを返し、その子孫ノードがトリガーされるようにします。

    • 警告:中間ノードでの ドライラン は実際のデータを生成しません。これにより、入力が不足しているために子孫ノードが失敗したり、不正な出力を生成したりする可能性があります。注意して進めてください

注意事項

データバックフィル操作の安定性と予測可能性を確保するために、以下の実行ルールをよくお読みください。

インスタンスのライフサイクルとログ保持
  • インスタンスのクリーンアップデータバックフィルインスタンス手動で削除できません。プラットフォームは作成後約 30 日で自動的に削除します。ノードを実行する必要がなくなった場合は、インスタンスを フリーズ して、そのスケジューリングを停止できます。

  • 保持ポリシー:インスタンスとログの保持期間は、リソースグループのタイプによって異なります。

    リソースグループタイプ

    インスタンス保持ポリシー

    ログ保持ポリシー

    スケジューリング用の共有リソースグループ

    30 日

    7 日

    スケジューリング用の専用リソースグループ

    30 日

    30 日

    サーバーレスリソースグループ

    30 日

    30 日

  • 大規模ログのクリーンアップ:完了したインスタンスについては、プラットフォームは 3 MB を超える実行ログを定期的に消去します。

インスタンスの実行ルール
  • 厳密な日次依存関係:データバックフィルは、データタイムスタンプに基づいてシリアルに実行されます。特定日のインスタンスは、前日のすべてのインスタンスが成功するまで開始されません。いずれかのインスタンスが失敗すると、それ以降の日付のすべてのインスタンスがブロックされます。

  • 時間単位および分単位ノードの同時実行:特定日にノードのすべてのインスタンスのデータをバックフィルする場合、ノードの 自己依存 プロパティによって実行方法が決まります。

    • 自己依存が設定されていない場合:その日内のすべてのインスタンス (例:00:00、01:00) は、それぞれの先祖ノードの依存関係が満たされている限り、並列で実行できます。

    • 自己依存が設定されている場合:その日内のすべてのインスタンスはシリアルに実行されます。たとえば、01:00 のインスタンスは、00:00 のインスタンスが成功するのを待ってから実行されます。

  • 定期実行インスタンスとの競合:定期的なスケジュールを保護するため、定期実行インスタンスはデータバックフィルインスタンスよりも高い優先度を持ちます。両方のタイプのインスタンスが同時に実行されるようにスケジュールされている場合、手動でデータバックフィルインスタンスを停止する必要がある場合があります。

  • ブラックリストに登録されたノードの処理:ブラックリスト上のノードがデータバックフィルワークフローの中間ノードである場合、そのノードは ドライラン を実行します。これは、その子孫ノードのデータ出力に影響を与える可能性があります。

スケジューリングリソースと優先度
  • リソース設定:多数のデータバックフィルインスタンスや高度な並列処理は、大量のスケジューリングリソースを消費する可能性があり、定期実行インスタンスの通常の操作に影響を与える可能性があります。ニーズに基づいてリソースを設定してください。

  • 優先度ダウングレードポリシー:コアな操作を保護するため、プラットフォームはバックフィルの データタイムスタンプ に基づいてノードの優先度を動的に調整します。

    • 前日 (T-1) のデータをバックフィルする場合:ノードの優先度は変更されず、それが属するベースラインの優先度によって決定されます。

    • 履歴データ (T-2 以前) をバックフィルする場合:ノードの優先度は、次のルールに従って自動的にダウングレードされます。

      • 優先度 7 と 8 は 3 にダウングレードされます。

      • 優先度 5 と 3 は 2 にダウングレードされます。

      • 優先度 1 は変更されません

データバックフィルタスクの作成

ステップ 1:データバックフィルページへ移動

  1. オペレーションセンターページに移動します。

    DataWorks コンソールにログインします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションウィンドウで、データ開発と O&M > オペレーションセンターを選択します。表示されたページで、ドロップダウンリストから目的のワークスペースを選択し、[オペレーションセンターへ移動] をクリックします。

  2. 左側のナビゲーションウィンドウで、O&M Assistant > データバックフィル を選択して、データバックフィル ページに移動します。

説明

特定の定期実行ノードのデータをバックフィルするには、Auto Triggered Task O&M > 定期ノード ページに移動し、そのノードの 操作 列にある [データバックフィル] をクリックすることもできます。

ステップ 2:データバックフィルタスクの作成

データバックフィル ページで、Create Data Backfill Task をクリックし、必要に応じてパラメーターを設定します。

  1. 基本 基本情報を設定します。

    プラットフォームは データバックフィルタスク の名前を自動的に生成します。必要に応じて名前を変更できます。

  2. データバックフィル用のノードを選択します。

    操作権限のあるノードを選択するには、次のいずれかの方法を使用できます:Manually SelectSelect by LinkSelect by Workspace、または Specify Task and All Descendant Tasks。設定パラメーターは各方法で異なります。

    手動で選択

    1 つ以上のノードをルートノードとして選択し、その子孫ノードを選択してデータバックフィルの範囲を定義します。この方法は、以前の 現在のノード現在および子孫ノード、および 詳細モード のバックフィルオプションと互換性があります。

    次の表にパラメーターを示します。

    パラメーター

    説明

    [ノード選択方法]

    Manually Select を選択します。

    [ルートノードの追加]

    名前または ID でルートノードを検索して追加します。Batch Add をクリックし、リソースグループスケジューリング周期ワークスペース などの条件を指定して、一度に複数のルートノードを追加することもできます。

    説明

    メンバーであるワークスペースからのみノードを選択できます。

    [選択されたルートノード]

    データをバックフィルするノードです。このリストには、追加されたルートノードが表示されます。バックフィルに含める子孫ノードを選択できます。

    説明
    • 依存関係レベルで子孫ノードをフィルターできます。ルートノード の直接の子孫ノードは第 1 レベルです。

    • 1 回のデータバックフィルの最大ルートノード数は 500 です。ノードの総数 (ルートノードとその子孫ノード) の最大値は 2,000 (または 中国 (北京) および 中国 (杭州) リージョンでは 3,000) です。

    • ノードに最大同時実行インスタンス数が設定されている場合、データバックフィルインスタンスはこの制限の対象となり、同時実行クォータを定期実行インスタンスと共有します。

    Task Blacklist

    ノードがデータバックフィルを必要としない場合は、ブラックリスト に追加します。ブラックリストに登録されたノードは操作から除外されます。

    説明
    • ブラックリスト に追加できるのはルートノードのみです。ルートノード の子孫ノードがデータバックフィルを必要としない場合は、[選択されたルートノード] リストから削除します。

    • ブラックリストに登録されたノードがワークフローの中間ノードである場合 (つまり、その先祖ノードと子孫ノードがバックフィルの一部である場合)、ドライラン を実行します。これにより、子孫ノードは実行できますが、データが不正確になる可能性があります。

    リンクで選択

    開始ノードと 1 つ以上の終了ノードを選択します。システムは依存関係を自動的に分析し、開始ノードと終了ノードの間のすべてのノードをデータバックフィル範囲に含めます。

    次の表にパラメーターを示します。

    パラメーター

    説明

    [ノード選択方法]

    Select by Link を選択します。

    [ノードの選択]

    名前または ID で検索して、開始ノードと 1 つ以上の終了ノードを追加します。プラットフォームは、開始ノードの直接または間接の子孫ノードであり、終了ノードの直接または間接の先祖ノードである中間ノードを分析します。

    中間ノード

    プラットフォームが開始ノードと終了ノードに基づいて自動的に識別した中間ノードのリストです。

    説明

    リストには最大 2,000 ノードが表示されます。この制限を超えるノードは表示されませんが、実行には含まれます。

    Task Blacklist

    ノードがデータバックフィルを必要としない場合は、ブラックリスト に追加します。ブラックリストに登録されたノードは操作から除外されます。

    説明

    ブラックリストに登録されたノードがワークフローの中間ノードである場合 (つまり、その先祖ノードと子孫ノードがバックフィルの一部である場合)、ドライラン を実行します。これにより、子孫ノードは実行できますが、データが不正確になる可能性があります。

    ワークスペースで選択

    ルートノード を選択し、その子孫ノードのワークスペースに基づいてデータバックフィル範囲を定義します。

    説明
    • 元の 大規模ノードモード データバックフィルソリューションと互換性があります。

    • この方法では ブラックリスト の設定はサポートされていません。

    次の表にパラメーターを示します。

    パラメーター

    説明

    [ノード選択方法]

    Select by Workspace を選択します。

    [ルートノードの追加]

    名前または ID でルートノードを検索して追加します。プラットフォームは、ルートノード の子孫ノードが配置されているワークスペース内のノードのデータをバックフィルします。

    説明

    メンバーであるワークスペースからのみノードを選択できます。

    [ルートノードを含める]

    このデータバックフィルに ルートノード を含めるかどうかを指定します。

    [データバックフィル用のワークスペース]

    ルートノード の子孫ノードが配置されているワークスペースに基づいて、バックフィルしたいノードを含むワークスペースを選択します。

    説明
    • 現在のリージョンの DataWorks ワークスペースのみを選択できます。

    • ワークスペースを選択すると、デフォルトでその中のすべてのノードのデータがバックフィルされます。必要に応じて ホワイトリストブラックリスト をカスタマイズできます。

    Add to Whitelist

    データバックフィルが必要で、選択したワークスペースにない追加のノードを指定します。

    Task Blacklist

    選択したワークスペース内で、データバックフィルから除外すべきノードを指定します。

    ノードと子孫を指定

    ルートノード を選択すると、プラットフォームはそのノードとすべての子孫ノードをデータバックフィル範囲に自動的に含めます。

    重要

    データバックフィルタスク の実行が開始された後にのみ、トリガーされたノードの全範囲を確認できます。このオプションは注意して使用してください。

    次の表にパラメーターを示します。

    パラメーター

    説明

    [ノード選択方法]

    Specify Task and All Descendant Tasks を選択します。

    [ルートノードの追加]

    名前または ID でルートノードを検索して追加します。プラットフォームは、ルートノード とそのすべての子孫ノードのデータをバックフィルします。

    説明
    • メンバーであるワークスペースからのみノードを選択できます。

    • 選択した ルートノード に子孫ノードがない場合、タスクを送信するとその ルートノード のデータのみがバックフィルされます。

    Task Blacklist

    ノードがデータバックフィルを必要としない場合は、ブラックリスト に追加します。ブラックリストに登録されたノードは操作から除外されます。

    説明

    ブラックリストに登録されたノードがワークフローの中間ノードである場合 (つまり、その先祖ノードと子孫ノードがバックフィルの一部である場合)、ドライラン を実行します。これにより、子孫ノードは実行できますが、データが不正確になる可能性があります。

    1. データバックフィルの実行ポリシーを設定します。

      データバックフィルタスクの実行時間、グループ実行、アラートトリガー、使用するリソースグループなどの設定を必要に応じて構成します。

      次の表にパラメーターを示します。

      パラメーター

      説明

      データタイムスタンプ

      データをバックフィルしたいデータタイムスタンプを指定します。日付は 手動入力AI による生成、または 一括入力 の方法で指定できます。

      システムは、選択した日付とオプションに基づいて異なる実行ポリシーを使用します。

      シナリオ 1:履歴データのバックフィル (データタイムスタンプ < 現在の日付)

      これは最も一般的なデータバックフィルのシナリオです。現在の日付より前のデータタイムスタンプを選択すると、システムは即座にその履歴日付のインスタンスを作成して実行し、過去のデータを再処理および再計算します。

      • ユースケース:履歴データのエラー修正や欠損データのバックフィル。

      • 実行方法即時実行

      シナリオ 2:将来のタスクのスケジュール (データタイムスタンプ > 現在の日付)

      将来のデータタイムスタンプを選択し、特別なオプションを選択しない場合、その将来の日付に対して 1 回限りのスケジュールタスクが作成されます。

      • ユースケース:特定の既知の将来の日付に対して 1 回限りのタスク実行を事前にスケジュールする。

      • 実行方法スケジュール実行。インスタンスが作成され、待機状態になります。対応するデータタイムスタンプが来ると、スケジューリング設定に基づいて自動的に実行されます。

      シナリオ 3:将来の時刻にスケジュールされたインスタンスを即時実行 (「今すぐ実行」を選択)

      タイミングが現在のインスタンスよりも大きいインスタントデータ生成インスタンス。 オプションは高度な設定です。データタイムスタンプが現在の日付より後である場合、またはデータタイムスタンプが T-1 で、タスクに現在時刻より後の時刻にスケジュールされたインスタンスが含まれている場合に、システムはこのオプションを表示します。このオプションを選択すると、将来の時刻にスケジュールされたインスタンスは、スケジュールされた時刻を待たずに即座に実行されます。

      • ユースケース:将来の日付のインスタンスを予定より早く実行し、データ移行やテストのために特定のパーティションにデータを準備する、または T-1 データの時間単位または分単位のインスタンスでまだスケジュール時刻に達していないものを即座に実行する。

      • 実行方法選択後すぐに実行

      • 例 1 (将来のデータのバックフィル):現在の日付が 2024-03-12 です。あなたは 2024-03-17 のデータをバックフィルすることを選択し、[現在時刻以降に実行予定のデータバックフィルインスタンスを今すぐ実行] を選択します。タスクインスタンスは 2024-03-12すぐに開始されますが、実行時には 2024-03-17 をデータタイムスタンプパラメーターとして使用し、これがデータパーティションに影響します。

      • 例 2 (T-1 データのバックフィル):現在の時刻が 2024-03-12 14:30 です。あなたは 2024-03-11 (T-1) のデータをバックフィルすることを選択します。タスクは時間単位で実行されるようにスケジュールされています。オプションを選択しない場合、15:00、16:00、および 14:30 以降の他の時刻にスケジュールされたインスタンスは、それぞれのスケジュールされた時刻まで待機する必要があります。[現在時刻以降に実行予定のデータバックフィルインスタンスを今すぐ実行] を選択すると、すべてのインスタンスが即座に実行されます。

      説明
      • データタイムスタンプの概念:オフラインコンピューティングでは、タスクは通常、現在の日 (T) に前日 (T-1) のデータを処理します。データバックフィル機能を使用すると、指定されたデータタイムスタンプのインスタンスを生成することにより、タスクがどの日付のデータを処理するかを正確に制御できます。

      • 複数の時間範囲:連続していない複数の日付のデータをバックフィルするには、[追加] をクリックして複数の時間範囲を設定します。

      • リソース計画:1 回のデータバックフィル操作に過度に長い時間範囲を設定しないでください。多数のデータバックフィルインスタンスはスケジューリングリソースを消費し、定期的な自動トリガータスクの実行に影響を与える可能性があります。

      [周期の指定]

      選択したタスクが実行できる時間範囲を指定します。インスタンスは、そのスケジュールされた時刻がこの時間範囲内にある場合にのみ生成および実行されます。この機能を使用して、時間単位または分単位でスケジュールされたタスクのインスタンスを特定の周期内でのみ実行できます。つまり、その周期のデータのみをバックフィルします。デフォルト値は 00:00-23:59 です。

      説明
      • タスクのスケジュールされた時刻がこの時間範囲外の場合、タスクのインスタンスは生成されません。より長いスケジューリング周期のタスクがより短い周期のタスクに依存している場合 (たとえば、日次タスクが時間単位タスクに依存している場合)、孤立インスタンスが生成され、タスクの実行がブロックされる可能性があります。

      • このパラメーターは、時間単位または分単位でスケジュールされたタスクの特定の周期のデータをバックフィルする必要がある場合にのみ変更してください。

      Run by Group

      複数のデータタイムスタンプのデータをバックフィルする場合、データバックフィルタスクの同時実行のためのグループ数を指定できます。有効な値は次のとおりです。

      • Yes:プラットフォームは、指定されたグループ数に基づいてデータタイムスタンプを分割します。その後、プラットフォームはグループ化の結果に基づいて複数のデータバックフィルバッチを生成し、同時に実行します。

      • いいえ:データバックフィルインスタンスは、データタイムスタンプの順にシリアルに実行されます。データバックフィルインスタンスは、前のインスタンスが完了した後にのみ実行されます。

        説明

        特定の日付の時間単位または分単位のタスクのインスタンスがグループで同時に実行されるかどうかは、タスクに自己依存が設定されているかどうかによって異なります。

      グループ数は 2 から 10 の範囲で指定できます。次のシナリオでは、複数のインスタンスがグループで同時に実行される方法について説明します。

      • データタイムスタンプ範囲の日数がグループ数より少ない場合、タスクはグループで同時に実行されます。

        たとえば、データタイムスタンプ範囲が 1 月 11 日から 1 月 13 日で、グループ数が 4 の場合、各データタイムスタンプに対して 1 つずつ、合計 3 つのデータバックフィルインスタンスのみが生成されます。3 つのインスタンスはグループで同時に実行されます。

      • データタイムスタンプ範囲の日数がグループ数より多い場合、プラットフォームはデータタイムスタンプの Order に基づいて、タスクをシリアルと並列の両方で実行します。

        たとえば、データタイムスタンプ範囲が 1 月 11 日から 1 月 13 日で、グループ数が 2 の場合、2 つのデータバックフィルインスタンスが生成されます。1 つのインスタンスには 2 つのデータタイムスタンプが含まれ、これらの 2 つのデータタイムスタンプのタスクはシリアルに実行されます。2 つのデータバックフィルインスタンスは並列で実行されます。

      Alert for Data Backfill

      このデータバックフィル操作がアラートをトリガーするかどうかを指定します。

      • Yes:トリガー条件が満たされた場合にアラートがトリガーされます。

      • いいえ:このデータバックフィル操作はアラートをトリガーしません。

      Trigger Condition

      このパラメーターは、Alert for Data BackfillYes に設定した場合にのみ使用できます。アラートのトリガー条件を設定します。

      • Alert on Failure or Success:データバックフィルタスクが成功したか失敗したかに関わらず、アラートがトリガーされます。

      • Alert on Success:データバックフィルタスクが成功した場合にのみアラートがトリガーされます。

      • Alert on Failure:データバックフィルタスクが失敗した場合にのみアラートがトリガーされます。

      Alert Notification Method

      このパラメーターは、Alert for Data BackfillYes に設定した場合にのみ使用できます。Text Message and Email[SMS]、または [メール] でアラートを受信することを選択できます。アラートの受信者は、データバックフィルを開始したユーザーです。

      説明

      Check Contact Information をクリックして、受信者の携帯電話番号またはメールアドレスが登録されているかどうかを確認します。登録されていない場合は、「アラート連絡先の表示と設定」をご参照ください。

      Order

      Ascending by Business Date または Descending by Business Date でデータをバックフィルするかどうかを選択します。

      [スケジューリング用のリソースグループ]

      データバックフィルインスタンスの実行に使用するリソースグループを指定します。

      • [タスク設定に従う]:定期実行インスタンスに元々設定されていたリソースグループを使用して、データバックフィルインスタンスを実行します。

      • Specify Resource Group for Scheduling:指定されたリソースグループを使用してデータバックフィルインスタンスを実行します。これにより、データバックフィルインスタンスと定期実行インスタンス間のリソース競合を防ぎます。

      説明
      • リソースグループにネットワーク接続があることを確認してください。そうでない場合、タスクが失敗する可能性があります。指定されたリソースグループが関連するワークスペースにバインドされていない場合、元の定期実行インスタンスのリソースグループが使用されます。

      • サーバーレスリソースグループまたはスケジューリング用の専用リソースグループを使用してください。タスクが高い同時実行性で実行され、ずらすことができない場合、これらのリソースグループは専用の計算リソースを提供し、高速で安定したデータ転送を保証します。

      実行期間

      生成されたデータバックフィルタスクが実行できる期間を指定します。

      • [タスク設定に従う]:データバックフィルインスタンスをスケジュールされた時刻に実行します。

      • Specify Time Period:データバックフィルタスクがトリガーされる特定の期間を設定します。バックフィルするデータの量に基づいて、合理的な実行期間を設定します。

        説明

        実行中でないタスクは、この期間が終了した後は開始されません。すでに実行中のタスクは、期間が終了しても完了するまで実行を続けます。

      コンピューティングリソース

      現在、データバックフィルの計算リソースとして設定できるのは、EMR と Serverless Spark の計算リソースのみです。

      マップされた計算リソースが存在し、利用可能であることを確認してください。そうでない場合、タスクのスケジューリングに影響が出る可能性があります。

  3. データバックフィルタスクの検証ポリシーを設定します。

    この設定は、データバックフィルの検証が失敗した場合にタスクを停止するかどうかを決定します。プラットフォームは、データバックフィルタスクの基本情報と潜在的なリスクを次のようにチェックします。

    • 基本情報:データバックフィル内のタスク数、生成されるインスタンス数、およびノードループ、孤立ノード、または権限のないインスタンスなどの問題が存在するかどうか。

    • リスク検出ノードループ孤立ノードをチェックします。これらの問題はタスクの異常な実行を引き起こします。チェックが失敗した場合にデータバックフィルタスクを停止するように設定できます。

  4. [送信] をクリックします。データバックフィルタスクが作成されます。

ステップ 3:データバックフィルタスクの実行

問題が検出されなければ、データバックフィルタスク は設定された時刻に自動的に実行されます。

データバックフィルタスク は、次のいずれかの条件が真である場合、実行できません。

  • データバックフィルタスク の検証チェックが有効になっており、チェックが失敗した場合。詳細については、「データバックフィルタスクの作成」のステップ 4 をご参照ください。

  • データバックフィル 操作の拡張プログラムチェックが有効になっており、チェックが失敗した場合。詳細については、「拡張プログラムの概要」をご参照ください。

データバックフィルインスタンスの管理

データバックフィルインスタンスの検索

左側のナビゲーションウィンドウで、O&M Assistant > データバックフィル を選択して、データバックフィル ページに移動します。

image

データバックフィル ページの右側で、検索を展開する をクリックします。遡及インスタンス名実行ステータスノードタイプ などの条件でインスタンスをフィルターできます。また、実行中の複数のデータバックフィルインスタンスをバッチで迅速に停止することもできます。

データバックフィルインスタンスのステータスの表示

image

このエリアでは、データバックフィルインスタンスに関する情報を表示できます。これには以下が含まれます。

  • [タスク名]:データバックフィルインスタンスの名前を表示します。インスタンス名の前にある Expand アイコンをクリックすると、その実行日、実行ステータス、含まれるノード、およびそれらの実行詳細が表示されます。

  • Check Statusデータバックフィルインスタンスの検証ステータスです。

  • [実行ステータス]:インスタンスのステータスです。たとえば、成功失敗リソース待機中トリガー待機中などがあります。ステータスに基づいて問題をトラブルシューティングできます。

  • Nodesデータバックフィルインスタンス内のノードの数です。

  • [データタイムスタンプ]データバックフィルインスタンスが実行される日付です。

  • [最大同時実行インスタンス数]:ノードに設定された最大同時実行インスタンス数を表示します。値は無制限または 1 から 10,000 までの特定の数値です。この設定は、同じノードのインスタンスが同時に実行できる数を制限し、クォータは定期実行インスタンス、データバックフィルインスタンス、およびテストインスタンス間で共有されます。

  • View Task Analysis Results:生成されると推定されるインスタンス数、実行日、およびリスク検証結果を表示して、ブロッキングの問題をタイムリーに解決します。image

  • [操作]:データバックフィルインスタンスに対して、[停止]Batch RerunReuseなどの操作を実行します。

    操作

    説明

    [停止]

    Running 状態のデータバックフィルインスタンスのバッチを停止します。この操作を実行すると、インスタンスのステータスは [失敗] に設定されます。

    説明

    [未実行][成功]、または [失敗] 状態のインスタンスは停止できません。

    Batch Rerun

    データバックフィルインスタンスをバッチで再実行します。

    説明
    • [成功] または [失敗] 状態のインスタンスのみを再実行できます。

    • 一括再実行は、選択したすべてのインスタンスを依存関係を考慮せずに同時に即座に再実行します。インスタンスを正しい依存関係の順序で実行するには、ダウンストリームで再実行 操作を使用するか、新しい [データバックフィル] タスクを作成します。

    Reuse

    以前の データバックフィルタスク のノードセットを再利用して、同じノードで新しいタスクを迅速に作成します。

データバックフィルノードの管理

image

このエリアでは、データバックフィルインスタンスに含まれる個々のノードに関する情報を表示できます。これには以下が含まれます。

  • 名前:ノード名をクリックして詳細を表示します。

  • [スケジューリング時刻]:ノードのスケジュールされた実行時刻です。

  • 実行時間の開始:ノードが実行を開始した時刻です。

  • [終了時刻]:ノードが実行を終了した時刻です。

  • [実行時間]:ノードの実行時間です。

  • [操作]:個々のノードに対して、Dagダイアグラム の表示、またはノードの [停止]再実行 の選択などの操作を実行します。

    操作

    説明

    Dagダイアグラム

    ノードの有向非巡回グラフ (DAG) を表示し、その祖先ノードおよび子孫ノードを分析します。詳細については、「DAG 機能の概要」をご参照ください。

    停止

    Running 状態のノードを停止します。この操作を実行すると、ノードのステータスは [失敗] になります。

    説明
    • 未実行成功、または 失敗 状態のノードは停止できません。

    • この操作により、対象インスタンスが失敗状態となり、その子孫ノードの実行がブロックされます。潜在的なリスクを十分に理解したうえで、慎重に実行してください。

    再実行

    対象ノードを再実行します。

    説明

    成功 または 失敗 状態のノードのみ、再実行できます。

    もっと

    ダウンストリームで再実行

    対象ノードの子孫ノードを再実行します。

    成功として設定

    このノードのステータスを手動で 成功 に設定します。

    フリーズ

    現在のノードを フリーズ 状態に設定し、スケジューリングを停止します。

    説明

    リソース待機中スケジューリング時刻待機中、または Running 状態のノードはフリーズできません。

    復元 (解凍)

    フリーズ状態のノードについて、スケジューリングを再開します。

    系統を見る

    ノードのデータ系譜グラフを表示します。

1 つ以上のノードを選択し、[停止] または 再実行 をクリックして、バッチで停止または再実行します。

インスタンスのステータス

ステータスタイプ

ステータスアイコン

成功

1

未実行

2

失敗

3

実行中

4

待機中

5

凍結

6

よくある質問