すべてのプロダクト
Search
ドキュメントセンター

Data Management:データの埋め戻し

最終更新日:Aug 19, 2024

データバックフィル機能を使用すると、タスクフローの公開バージョンに基づいて、特定の時点または時間範囲に対して1つ以上のタスクフローインスタンスを生成できます。 タスクフローインスタンスは、タスクフローの実行時レコードである。 このトピックでは、タスクフローのデータをバックフィルする方法について説明します。

シナリオ

  • eコマース企業は、収益やコンバージョン率など、複数の時間範囲で行われるプロモーション活動の影響を分析したいと考えています。

    例えば、電子商取引会社は、2023年8月7日から2023年8月14日まで、および2023年8月17日から年8月24日までに行われたプロモーション活動の効果を分析したいと考えている。 会社は、単一インスタンスSQLノードで時間変数startTimeおよびendTimeを使用して、時間範囲を指定できます。 次に、会社は、データバックフィル操作を構成し、分析のためにデータをバックフィルするために、プロモーション活動の開始時間を選択することができる。

    説明

    この例では、startTime変数は、プロモーションアクティビティの開始時間を表すために使用され、endTime変数は、プロモーションアクティビティの終了時間を表すために使用される。

  • eコマース会社によって収集されたレポートデータが正しくないため、修正する必要があります。

    たとえば、2023年8月28日に、電子商取引会社は、2023年8月17日に収集された製品のレポートデータが正しくなく、再生成する必要があることを発見します。 会社は、データバックフィル機能を使用して正しいレポートデータを取得できます。

手順

  1. DMSコンソールV5.0 にログインします。

  2. 上部のナビゲーションバーで、DTS > データ开発 > タスクオーケストレーション を選択します。

    説明

    DMSコンソールをシンプルモードで使用している場合は、左上隅の2023-01-28_15-57-17.pngアイコンの上にポインターを移動し、[すべての機能] > [DTS] > [データ開発] > [タスクオーケストレーション] を選択します。

  3. ページの下部で、[タスクフロー] セクションでタスクフローの名前をクリックします。 タスクフロー編集ページが表示されます。

  4. ページの右上隅にある [O&Mに移動] をクリックします。

  5. [公開済みタスク] タブで、管理するタスクフローのバージョンを見つけ、[操作] 列の [データのバックアップ] をクリックします。

  6. データバックフィルのパラメーターを設定します。

    1. データをバックフィルする時間を選択します。 時刻の精度は、秒単位です。 特定の時点または時間範囲に対してデータのバックフィルを実行できます。

      説明
      • 時間範囲のデータをバックフィルする場合、実行できるノードインスタンスの数は無制限です。

      • 時間範囲内で実行されるタスクフロー内のタスクは、連続的に実行される。 タスクは、次の営業時間に実行する前に、前の営業時間に正常に実行されている必要があります。

      • 時間範囲内で実行されているタスクフローを停止するには、オペレーションセンターに移動し、[インスタンス管理] をクリックします。 [インスタンス管理] ページで、停止するタスクフローを選択し、[停止] をクリックします。 指定した業務時間にタスクの実行に失敗した場合、タスクフローは自動的に停止します。

    2. データをバックフィルするタスクノードを選択します。

  7. [確認]をクリックします。

    データバックフィル操作の操作ログを表示する場合は、タスクフロー編集ページの右上隅にある [O&Mに移動] をクリックします。 [実行履歴] タブで、[スケジューリングトリガー] をクリックします。 データバックフィル操作を見つけて、[操作] 列の [ログの表示] をクリックします。