すべてのプロダクト
Search
ドキュメントセンター

DataWorks:データバックフィルインスタンスの O&M

最終更新日:Dec 05, 2025

過去または未来の期間のデータをバックフィルして、対応する時間ベースのパーティションにデータを書き込むことができます。データバックフィル中、コード内のスケジューリングパラメーターは、選択されたデータタイムスタンプに基づいて特定の値に自動的に置き換えられます。その後、業務コードは対応する時間のデータを指定されたパーティションに書き込みます。宛先のパーティションは、タスクコードのロジックと内容によって決定されます。

権限の制限

データバックフィルのワークフロー内のすべてのノードに対する操作権限が必要です。いずれかのノードに対する権限がない場合、以下の結果が発生します:

  • 直接のターゲットノードに対する権限がない場合:ルートノードまたはいずれかの子孫ノードに対する操作権限がない場合、データバックフィルは実行できません

  • 中間ノードに対する権限がない場合:権限のないノードがデータバックフィルプロセスの中間ノードである場合 (つまり、その上流と下流の依存関係が両方ともバックフィルの範囲内にある場合)、システムはそのノードでドライランを実行します。

    • ドライランの説明:ノードが開始された後、実際の計算ロジックを実行せず、すぐに「成功」ステータスを返して、子孫ノードがトリガーされるようにします。

    • リスク警告:中間ノードでのドライランは実際のデータを生成しません。これにより、入力がないために子孫ノードが異常な出力を生成したり、失敗したりする可能性があります。注意して進めてください

注意事項

データバックフィル操作の安定性と予測可能性を確保するために、以下の実行ルールをよくお読みください。

I. インスタンスのライフサイクルとログの保持
  • インスタンスのクリーンアップ:データバックフィルインスタンスは手動で削除できません。プラットフォームは作成から約 30 日後に自動的にクリーンアップします。タスクを実行する必要がなくなった場合は、インスタンスをフリーズしてスケジューリングを停止できます。

  • 保持ポリシー:インスタンスとログの保持期間はリソースグループによって異なります。

    リソースグループタイプ

    インスタンス保持ポリシー

    ログ保持ポリシー

    スケジューリング用の共有リソースグループ

    30 日

    7 日

    スケジューリング用の専用リソースグループ

    30 日

    30 日

    サーバーレスリソースグループ

    30 日

    30 日

  • 大容量ログのクリーンアップ:完了したインスタンスについて、プラットフォームは毎日 3 MB を超える実行ログを定期的にクリーンアップします。

II. インスタンス実行ルール
  • 厳密な日次依存関係:データバックフィルは、データタイムスタンプに基づいて順次実行されます。翌日のインスタンスは、前日のすべてのインスタンスが成功した後にのみ開始されます。いずれかのインスタンスが失敗した場合、後続の日付のすべてのタスクがブロックされます。

  • 時間単位および分単位タスクの同時実行動作:特定の日付のすべてのインスタンスに対してデータをバックフィルする場合、実行方法はタスクの自己依存プロパティによって決まります:

    • 自己依存が設定されていない場合:それぞれの上流依存関係が満たされている限り、00:00 や 01:00 などの日内のすべてのインスタンスはグループで実行することが許可されます。

    • 自己依存が設定されている場合:日内のすべてのインスタンスは厳密な順次実行で実行されます。例えば、01:00 のインスタンスは、00:00 のインスタンスが成功するのを待ってから実行されます。

  • 定期インスタンスとの競合:定期的なスケジューリングを確保するため、定期インスタンスはデータバックフィルインスタンスよりも高い優先度を持ちます。両方が同時に実行されている場合は、手動でデータバックフィルインスタンスを停止する必要があります。

  • ブラックリストに登録されたノードの処理:ブラックリストに登録されたノードがデータバックフィルワークフローの中間ノードである場合、そのノードもドライランを実行し、子孫ノードのデータ出力に影響を与える可能性があります。

III. スケジューリングリソースと優先度
  • リソースの合理的な設定:データバックフィルインスタンスが多すぎる、または並列度が高すぎると、大量のスケジューリングリソースを消費し、定期タスクの正常な運用に影響を与える可能性があります。必要に応じてリソースを設定する必要があります。

  • 優先度低下ポリシー:コアビジネスの運用を保護するため、プラットフォームは、バックフィルのデータタイムスタンプに基づいてタスクの優先度を動的に調整します:

    • 前日 (T-1) のデータのバックフィル:タスクの優先度は変更されず、タスクが属するベースラインの優先度によって決定されます。

    • 履歴データ (T-2 以前) のバックフィル:タスクの優先度は、以下のルールに従って自動的に低下します:

      • 元の優先度 7 または 8 → 3 に低下

      • 元の優先度 5 または 3 → 2 に低下

      • 元の優先度 1 → 変更なし

データバックフィルタスクの作成

ステップ 1:データバックフィルページへの移動

  1. オペレーションセンターページに移動します。

    DataWorks コンソールにログインします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションウィンドウで、[データ開発と O&M] > [オペレーションセンター] を選択します。表示されたページで、ドロップダウンリストから目的のワークスペースを選択し、[オペレーションセンターへ] をクリックします。

  2. 左側のナビゲーションウィンドウで、[O&M アシスタント] > [データバックフィル] をクリックします。

説明

定期タスクのデータをバックフィルするには、[定期タスク O&M] > [定期タスク] ページで対応するタスクの [データバックフィル] をクリックすることもできます。

ステップ 2:データバックフィルタスクの作成

[データバックフィル] ページで、[データバックフィルタスクの作成] をクリックし、必要に応じてパラメーターを設定します。

  1. 設定 [基本情報]。

    プラットフォームは、デフォルトのフォーマットでデータバックフィル名を自動的に生成します。必要に応じて名前を変更できます。

  2. データをバックフィルするノードを選択します。

    操作権限を持つタスクのデータを、[手動で選択][リンクで選択][ワークスペースで選択][タスクとすべての子孫タスクを指定] のいずれかの方法を使用してバックフィルできます。選択したタスクに基づいて、データをバックフィルする他のタスクを選択することもできます。設定パラメーターは各方法で異なります。

    手動で選択

    1 つ以上のノードをルートノードとして選択し、そのルートノードの子孫ノードをこのデータバックフィルの範囲として選択します。この方法は、元の現在のノード現在のノードと子孫ノード、および詳細モードのデータバックフィルソリューションと互換性があります。

    次の表にパラメーターを示します。

    パラメーター

    説明

    タスク選択方法

    [手動で選択] を選択します。

    [ルートタスクの検索]

    名前または ID でルートタスクを検索して追加できます。また、[一括追加] をクリックし、リソースグループ、スケジューリングサイクル、ワークスペースなどの条件を指定して、一度に複数のルートタスクを追加することもできます。

    説明

    メンバーであるワークスペースのノードのみを選択できます。

    [選択されたデータバックフィル]

    データをバックフィルするノード。リストには追加されたルートノードが表示されます。ルートノードに基づいて、データをバックフィルする子孫ノードを選択できます。

    説明
    • 依存関係のレベルに基づいて子孫ノードをフィルターできます。ルートノードの直接の子孫ノードはデフォルトで第 1 レベルであり、以下同様です。

    • 同時にデータをバックフィルできるルートノードの最大数は 500 です。ノードの総数 (ルートノードとその子孫ノード) の最大値は 2,000 (中国 (北京) および中国 (杭州) リージョンでは 3,000) です。

    タスクブラックリスト

    ノードがデータバックフィルを必要としない場合は、ブラックリストに追加します。ブラックリスト内のノードは、このデータバックフィルには含まれません。

    説明
    • ブラックリストにはルートタスクのみを追加できます。ルートタスクの子タスクにデータバックフィルが不要な場合は、[選択されたデータバックフィルリスト] から削除してください。

    • ブラックリストに登録されたノードがこのデータバックフィルの中間ノードである場合 (つまり、その上流と下流の依存関係がバックフィルの範囲内にある場合)、ノードはドライランを実行して子孫ノードが実行できるようにします。ドライランは、実際には実行せずにすぐに成功ステータスを返します。ただし、これにより子孫ノードのデータ出力が異常になる可能性があります。

    リンクで選択

    開始ノードと 1 つ以上の終了ノードを選択します。自動分析により、開始ノードと終了ノードの間のすべてのノード (開始ノードと終了ノードを含む) が、このデータバックフィルの範囲に含まれます。

    次の表にパラメーターを示します。

    パラメーター

    説明

    タスク選択方法

    [リンクで] を選択します。

    [タスクの検索]

    名前または ID で検索して、開始ノードと 1 つ以上の終了ノードを追加します。プラットフォームは、開始ノードと終了ノードに基づいて中間ノードを分析します。中間ノードは、開始ノードの直接または間接の子孫であり、終了ノードの直接または間接の先祖です。

    中級タスク

    プラットフォームが開始ノードと終了ノードに基づいて自動的に分析した中間ノードのリスト。

    説明

    リストには 2,000 ノードのみが表示されます。この制限を超えるノードは表示されませんが、正常に実行されます。

    タスクブラックリスト

    ノードがデータバックフィルを必要としない場合は、ブラックリストに追加します。ブラックリスト内のノードは、このデータバックフィルには含まれません。

    説明

    ブラックリストに登録されたノードがこのデータバックフィルの中間ノードである場合 (つまり、その上流と下流の依存関係がバックフィルの範囲内にある場合)、ノードはドライランを実行して子孫ノードが実行できるようにします。ドライランは、実際には実行せずにすぐに成功ステータスを返します。ただし、これにより子孫ノードのデータ出力が異常になる可能性があります。

    ワークスペースで選択

    ノードをルートノードとして選択し、子孫ノードが配置されているワークスペースに基づいて、このデータバックフィルの範囲を決定します。この方法は、元の大規模ノードモードのデータバックフィルソリューションと互換性があります。

    説明
    • この方法は、元の [大規模ノードモード] のデータバックフィルソリューションと互換性があります。

    • ノードブラックリストの設定はサポートされていません。

    次の表にパラメーターを示します。

    パラメーター

    説明

    [タスク選択方法]

    [ワークスペース別] を選択します。

    [ルートタスクの検索]

    名前または ID でルートノードを検索して追加します。プラットフォームは、ルートノードの子孫ノードが配置されているワークスペース内のノードのデータをバックフィルします。

    説明

    メンバーであるワークスペースのノードのみを選択できます。

    ルートノードを含める

    このデータバックフィルにルートノードを含めるかどうかを定義します。

    [データバックフィル用のワークスペース]

    ルートノードの子孫ノードが配置されているワークスペースに基づいて、どのワークスペースのノードのデータをバックフィルする必要があるかを選択します。

    説明
    • データバックフィル操作には、現在のリージョンの DataWorks ワークスペースのみを選択できます。

    • ワークスペースを選択すると、デフォルトでワークスペース内のすべてのノードのデータがバックフィルされます。必要に応じて、データバックフィルのブラックリストとホワイトリストをカスタマイズできます。

    タスクホワイトリスト

    選択したワークスペースに含まれるノードに加えて、データバックフィルが引き続き必要なノード。

    タスクブラックリスト

    選択したワークスペース内でデータバックフィルが不要なノード。

    タスクとすべての子孫を指定

    ルートノードを選択すると、プラットフォームは自動的にそのノードとすべての子孫ノードを分析し、このデータバックフィルの範囲に含めます。

    重要

    トリガーされたノードは、データバックフィルタスクの実行中にのみ表示されます。注意して使用してください。

    次の表にパラメーターを示します。

    パラメーター

    説明

    タスク選択方法

    [タスクとすべての子孫タスクを指定] を選択します。

    ルートタスク検索

    名前または ID でルートノードを検索して追加します。プラットフォームは、ルートノードとすべての子孫ノードのデータをバックフィルします。

    説明
    • メンバーであるワークスペースのノードのみを選択できます。

    • 選択したルートノードに子孫ノードがない場合、データバックフィルタスクが送信された後、現在のルートノードのデータのみがバックフィルされます。

    タスクブラックリスト

    ノードがデータバックフィルを必要としない場合は、ブラックリストに追加します。ブラックリスト内のノードは、このデータバックフィルには含まれません。

    説明

    ブラックリストに登録されたノードがこのデータバックフィルの中間ノードである場合 (つまり、その上流と下流の依存関係がバックフィルの範囲内にある場合)、ノードはドライランを実行して子孫ノードが実行できるようにします。ドライランは、実際には実行せずにすぐに成功ステータスを返します。ただし、これにより子孫ノードのデータ出力が異常になる可能性があります。

    1. データバックフィル実行ポリシーを設定します。

      実行時間、グループで実行するかどうか、アラートをトリガーするかどうか、データバックフィルタスクに使用するリソースグループなどの情報を、必要に応じて設定します。

      次の表にパラメーターを示します。

      パラメーター

      説明

      データタイムスタンプ

      データをバックフィルするデータタイムスタンプを指定できます。システムは、選択した日付とオプションに基づいて異なる実行ポリシーを採用します:

      シナリオ 1:履歴データのバックフィル (データタイムスタンプ < 現在の日付)

      これは最も一般的なデータバックフィルシナリオです。選択したデータタイムスタンプが今日より前の場合、システムはすぐにその履歴日付のタスクインスタンスを作成して実行し、過去のデータを遡って再計算します。

      • ユースケース:履歴データのエラー修正、欠損データのバックフィル。

      • 実行方法すぐに実行

      シナリオ 2:将来のタスクのスケジュール (データタイムスタンプ > 現在の日付)

      将来のデータタイムスタンプを選択し、特別なオプションを選択しない場合、これは将来の 1 回限りのスケジュールされたタスクを作成します。

      • ユースケース:既知の将来の日付に対して 1 回限りのタスク実行を事前にスケジュールする。

      • 実行方法スケジュールされた時刻に実行。インスタンスが作成され、待機状態になります。対応するデータタイムスタンプが来ると、タスク自身のスケジューリング設定に従って自動的に実行されます。

      シナリオ 3:将来のタスクの事前実行 (データタイムスタンプ > 現在の日付、かつ「すぐに実行」を選択)

      [将来スケジュールされたデータバックフィルインスタンスをすぐに実行] は、将来実行されるようにスケジュールされているインスタンスをすぐに開始できる高度なオプションです。タスクの実行時間は現在ですが、処理するビジネスロジックとデータパーティションは将来の日付のものです。

      • ユースケース:将来の日付のタスクロジックを事前に検証する、またはデータ移行やテストのために特定のパーティションにデータを準備する。

      • 実行方法選択後すぐに実行

      • :現在の日付が 2024-03-12 であるとします。2024-03-17 のデータをバックフィルすることを選択し、[現在時刻より後のスケジュール時刻を持つデータバックフィルインスタンスをすぐに実行] オプションを選択します。すると、タスクインスタンスは 2024-03-12すぐに開始されますが、実行時に使用するデータタイムスタンプパラメーター (例えば、データパーティションを決定するため) は 2024-03-17 です。

      説明
      • データタイムスタンプの概念:オフラインコンピューティングでは、タスクは通常、今日 (T) に昨日 (T-1) のデータを処理します。データバックフィル機能を使用すると、特定の「データタイムスタンプ」のインスタンスを生成することで、タスクがどの日付のデータを処理するかを正確に制御できます。

      • 複数の時間範囲:連続していない複数の日付のデータをバックフィルするには、[追加] をクリックして複数の時間範囲を設定します。

      • リソース計画:単一のデータバックフィルは長期間にわたるべきではありません。多くのデータバックフィルインスタンスはスケジューリングリソースを消費し、通常の定期タスクの運用に影響を与える可能性があります。

      時間範囲

      選択したタスクを実行する必要がある期間を指定します。スケジューリング時間が期間内にあるインスタンスが生成され、実行されます。このパラメーターを設定して、時間または分単位でスケジュールされたタスクが指定された期間のデータのみをバックフィルできるようにすることができます。デフォルト値:00:00 から 23:59

      説明
      • スケジューリング時間が期間内にないインスタンスは生成されません。より長いサイクルのタスクがより短いサイクルのタスクに依存している場合 (例えば、日次タスクが時間単位タスクに依存している場合)、孤立インスタンスが生成され、タスクの実行がブロックされる可能性があります。

      • このパラメーターは、時間単位または分単位でスケジュールされたタスクが特定の期間のデータをバックフィルする必要がある場合にのみ変更してください。

      グループ実行

      複数のデータタイムスタンプのデータをバックフィルする場合、いくつかのグループを指定してデータバックフィルタスクを同時に実行できます。値は次のとおりです:

      • [はい]:プラットフォームは、指定されたグループ数に基づいて複数のデータバックフィルバッチを生成し、バッチをグループで同時に実行します。

      • [いいえ]:データバックフィルインスタンスは、データタイムスタンプの順に順次実行され、新しいインスタンスは前のインスタンスが完了した後にのみ開始されます。

        説明

        時間または分単位でスケジュールされたタスクの特定の日付のデータをバックフィルする場合、タスクのインスタンスがグループで同時に実行されるかどうかは、タスクに自己依存が設定されているかどうかによって異なります。

      2〜10 の範囲でグループ数を指定できます。複数のインスタンスがグループで同時に実行される方法については、以下で説明します:

      • データタイムスタンプの時間範囲がグループ数より少ない場合、タスクはグループで同時に実行されます。

        たとえば、データタイムスタンプが 1 月 11 日から 1 月 13 日で、グループ数が 4 の場合、各データタイムスタンプに対して 1 つずつ、合計 3 つのデータバックフィルインスタンスのみが生成されます。3 つのインスタンスはグループで同時に実行されます。

      • データタイムスタンプの数がグループ数より多い場合、プラットフォームはデータタイムスタンプの [順序] に基づいて、直列タスクと並列タスクの組み合わせを実行します。

        たとえば、データタイムスタンプが 1 月 11 日から 1 月 13 日で、グループ数を 2 に設定した場合、2 つのデータバックフィルインスタンスが生成され、並行して実行されます。これらのインスタンスの 1 つには 2 つのデータタイムスタンプが含まれており、これらのタイムスタンプに対応するタスクは順次実行されます。

      データバックフィルアラート

      このデータバックフィル操作がアラートをトリガーするかどうかを設定します。

      • [はい]:トリガー条件が満たされた場合、データバックフィルのアラートが生成されます。

      • [いいえ]:このデータバックフィルはアラートをトリガーしません。

      トリガー条件

      [データバックフィルのアラート][はい] に設定されている場合にのみ、アラートのトリガー条件を指定できます:

      • [失敗または成功時にアラート]:データバックフィルが成功したか失敗したかに関係なく、アラートが生成されます。

      • [成功時にアラート]:データバックフィルが成功した場合にアラートが生成されます。

      • [失敗時にアラート]:データバックフィルが失敗した場合にアラートが生成されます。

      アラート通知方法

      [データバックフィルのアラート][はい] に設定されている場合にのみ、[テキストメッセージとメール][テキストメッセージ]、または [メール] でアラートを受信するように選択できます。アラートの受信者は、データバックフィルの開始者です。

      説明

      [連絡先情報の確認] をクリックして、アラート連絡先の携帯電話番号またはメールアドレスが登録されているかどうかを確認できます。登録されていない場合は、「アラート連絡先の表示と設定」を参照して情報を設定できます。

      注文

      データバックフィルの順序として [業務日付で昇順] または [業務日付で降順] を選択します。

      [スケジューリング用のリソースグループ]

      データバックフィルインスタンスを実行するために使用するリソースグループを指定します。

      • [タスク設定に従う]:定期タスクに設定されたリソースグループを使用して、データバックフィルインスタンスを実行します。

      • [スケジューリングリソースグループを指定]:指定されたリソースグループを使用してデータバックフィルインスタンスを実行します。これにより、データバックフィルインスタンスが定期インスタンスとリソースを競合するのを防ぎます。

      説明
      • リソースグループにネットワーク接続があることを確認してください。そうでない場合、タスクが失敗する可能性があります。指定されたリソースグループが関連するワークスペースにアタッチされていない場合、定期タスクの元のリソースグループが使用されます。

      • タスクが高い同時実行性で実行され、ずらすことができない場合に高速で安定したデータ転送を保証するために、専用の計算リソースグループを提供するサーバーレスリソースグループまたはスケジューリング用の専用リソースグループの使用を推奨します。

      [実行期間]

      今回生成されたデータバックフィルタスクがいつ実行されるかを指定します。

      • [タスク設定に従う]:データバックフィルインスタンスは、そのスケジュールされた時刻に実行されます。

      • [期間を指定]:データバックフィルタスクは、指定された期間内にのみ実行されるようにトリガーされます。データバックフィルが必要なタスクの数に基づいて、適切な実行期間を設定します。

        説明

        この期間を超えて非実行状態にあるタスクは実行されません。この期間を超えて実行状態にあるタスクは、実行を継続します。

      コンピューティングリソース

      現在、データバックフィルの計算リソースとして設定できるのは、EMR と Serverless Spark の計算リソースのみです。

      マップされた計算リソースが存在し、アクティブであることを確認してください。そうでない場合、タスクのスケジューリングに影響が出る可能性があります。

  3. データバックフィルタスク検証ポリシーを設定します。

    これは、データバックフィルの検証が失敗した場合にタスクの実行を停止するかどうかを設定するために使用されます。プラットフォームは、このデータバックフィルタスクの基本情報と潜在的なリスクを次のようにチェックします:

    • 基本情報:このデータバックフィルに関与するノードの数、生成されるインスタンスの数、およびノードループ、孤立ノード、または権限のないインスタンスなどの状況があるかどうか。

    • リスク検出タスク依存関係のループ孤立ノードをチェックします。これらのいずれかにより、タスクが異常に実行される可能性があります。チェックが失敗した場合にデータバックフィルタスクを終了するオプションを設定できます。

  4. [送信] をクリックします。データバックフィルタスクが作成されます。

ステップ 3:データバックフィルタスクの実行

データバックフィルタスクに設定された実行時間に達し、異常が見つからない場合、データバックフィルタスクは自動的にトリガーされて実行されます。

次の条件が満たされる場合、データバックフィルタスクは実行されません:

  • データバックフィルタスクの検証機能が有効になっており、検証が失敗した場合。詳細については、「ステップ 2:データバックフィルタスクの作成」をご参照ください。

  • データバックフィル操作に対して拡張チェックが有効になっている場合、チェックが失敗するとタスクの実行がブロックされます。詳細については、「拡張プログラムの概要」をご参照ください。

データバックフィルインスタンスの管理

データバックフィルインスタンスのクエリ

左側のナビゲーションウィンドウで、[O&M アシスタント] > [データバックフィル] をクリックします。

image

[データバックフィル] ページの右側で、[検索を展開] をクリックし、[データバックフィル名][ステータス][タスクタイプ] などのフィルター条件を指定してインスタンスを検索します。実行中の複数のデータバックフィルタスクを一度に終了することもできます。

データバックフィルインスタンスのステータスの表示

image

この領域では、データバックフィルインスタンスに関する情報を表示できます。これには以下が含まれます:

  • [タスク名]:データバックフィルインスタンスの名前。インスタンス名の横にある Expand アイコンをクリックすると、その実行日、実行ステータス、および含まれるノードとその実行詳細を表示できます。

  • チェックステータス: 現在のデータバックフィルインスタンスのチェックステータスです。

  • [実行ステータス]:データバックフィルインスタンスのステータス。有効な値は、成功、実行失敗、リソース待機中、および保留中です。異常なステータスに基づいて問題をトラブルシューティングできます。

  • [ノード]:データバックフィルインスタンス内のノードの数。

  • [データタイムスタンプ]:データバックフィルインスタンスが実行される日付。

  • [タスク分析結果] の表示:生成されるインスタンスの推定数、実行日、およびリスクチェックの結果を表示して、ブロックされたタスクを迅速に処理できます。image

  • [アクション]:データバックフィルインスタンスに対して [一括停止][一括再実行][再利用] などの操作を実行できます。

    操作名

    説明

    [一括停止]

    [実行中] 状態のデータバックフィルインスタンスを一括で停止できます。この操作を実行すると、対応するインスタンスは [失敗] 状態に設定されます。

    説明

    [未実行][成功]、または [失敗] ステータスのインスタンスは停止できません。

    [一括再実行]

    データバックフィルインスタンスを一括で再実行します。

    説明
    • [成功] または [失敗] 状態のインスタンスのみ再実行できます。

    • この操作を実行すると、選択したデータバックフィルインスタンスが同時にすぐに再実行されます。インスタンス間のスケジューリング依存関係は考慮されません。データバックフィルインスタンスを順次再実行したい場合は、[子孫ノードを再実行] を選択するか、[データバックフィル] 操作を再度実行します。

    再利用

    以前のデータバックフィル操作のノードセットを再利用することを選択でき、データをバックフィルするノードを迅速に選択できます。

データバックフィルタスクの管理

image

この領域では、データバックフィルインスタンスに含まれるノードに関する情報を表示できます。これには以下が含まれます:

  • [名前]:ノード名をクリックしてノード詳細ページを開き、より多くのノード情報を表示します。

  • [スケジューリング時間]:ノードタスクのスケジュールされた実行時間。

  • [実行開始時間]:ノードタスクが実行を開始した時間。

  • [終了時間]:ノードタスクが実行を終了した時間。

  • [実行時間]:ノードタスクが実行された時間の長さ。

  • [アクション][DAG] を表示したり、データバックフィルノードタスクを [停止] または [再実行] したりできます。

    操作名

    説明

    DAG

    タスクの DAG を表示して、タスクの先祖タスクと子孫タスクを特定します。詳細については、「付録:DAG で提供される機能の使用」をご参照ください。

    停止

    [実行中] 状態のノードを停止できます。この操作を実行すると、ノードのステータスは [失敗] に設定されます。

    説明
    • [未実行][成功]、または [失敗] 状態のノードは停止できません。

    • この操作はインスタンスを失敗させ、その子孫ノードの実行をブロックします。リスクを認識し、注意して進めてください。

    [再実行]

    ターゲットノードタスクを再実行します。

    説明

    ステータスが「成功」または「失敗」のノードのみを再実行できます。

    その他

    [子孫ノードを再実行]

    ターゲットノードタスクの子孫ノードを再実行します。

    [ステータスを成功に設定]

    このノードタスクのステータスを「成功」に設定します。

    凍結

    現在のノードを一時停止 (フリーズ) 状態に設定し、そのスケジューリングを停止します。

    説明

    [リソース待機中][スケジューリング時間待機中]、または [実行中] 状態のタスクはフリーズできません。実行中状態には、ノードコードが実行中であるか、データ品質チェックが進行中である場合が含まれます。

    再開 (復元)

    一時停止 (フリーズ) されたノードのスケジューリングを再開します。

    リネージの表示

    ノードのデータリネージグラフを表示します。

1 つ以上のタスクノードを選択し、[停止] または [再実行] をクリックして、それらを一括で停止または再実行できます。

インスタンスのステータスの説明

ステータスの種類

ステータスアイコン

成功ステータス

1

未実行ステータス

2

失敗ステータス

3

実行中ステータス

4

待機中ステータス

5

フリーズ状態

6

よくある質問