すべてのプロダクト
Search
ドキュメントセンター

Dataphin:カスタムデータリネージ構成

最終更新日:Mar 06, 2025

Dataphin は、SQL タイプのコンピューティングタスクと論理テーブルタスクのデータリネージ情報の自動解析をサポートしています。非 SQL コンピューティングタスクの場合、データリネージ情報をカスタム構成して、データリネージチェーンを完成させることができます。このトピックでは、非 SQL タスクのデータリネージの構成をカスタマイズする方法について説明します。

制限事項

  • 非 SQL タイプのコンピューティングタスクのデータリネージのカスタム構成のみをサポートします。

  • 最大 20 のデータリネージグループを構成でき、それぞれ最大 5 つの入力と出力を設定できます。

データリネージ構成の説明

  • データリネージグループとデータリネージ: 各タスクには、複数のデータリネージグループを構成できます。データリネージグループ内の各入力と出力は 1 対 1 で対応してデータリネージ関係を確立し、データリネージグループは互いに独立しています。各入力と出力の構成は、テーブルレベルとフィールドレベルのデータリネージを同時に生成します。

    たとえば、入力テーブル 1 がテーブル A からフィールド a を選択し、入力テーブル 2 がテーブル B からフィールド b を選択し、出力テーブルがテーブル C からフィールド c と d を選択する場合、次のデータリネージ関係が生成されます。

    • テーブルレベルのデータリネージ: テーブル A → テーブル C; テーブル B → テーブル C。

    • フィールドレベルのデータリネージ: テーブル A.a → テーブル C.c; テーブル B.b → テーブル C.c; テーブル A.a → テーブル C.d; テーブル B.b → テーブル C.d。

  • 入力テーブルと出力テーブルの環境設定をサポートしています。 [自動] に設定すると、送信時と公開時に環境パラメーターが自動的に置き換えられ、対応する開発環境と本番環境のデータリネージが生成されます。

  • タスクが送信または公開されると、システムは既存のデータソーステーブルのデータリネージを解析します。タスクが再送信または再公開されると、データリネージは最新バージョンに更新されます。

データリネージの構成

  1. Dataphin ホームページで、トップメニューバーから [開発] > [データ開発] を選択します。

  2. [開発] ページで、トップ メニューバーから [プロジェクト] を選択します(開発-本番モードでは、環境を選択する必要があります)。

  3. 左側のナビゲーションウィンドウで、[データ処理] > [スクリプトタスク] を選択します。

  4. コンピューティングタスクリストでターゲットのコンピューティングタスクをクリックして、そのタブを開きます。

  5. 右側のサイドバーで [リネージ] をクリックして、[リネージ構成] パネルを開きます。

  6. [リネージ構成] パネルで、[+ リネージグループを追加] をクリックして、入力テーブルと出力テーブルを構成します。

    • 入力テーブルの構成

      1. データリネージ グループ エリアで、[入力テーブル ダイアログ ボックス] を開くには 入力テーブルの構成 をクリックし、パラメーターを構成します。

        パラメータ

        説明

        環境

        入力テーブルと出力テーブルが属する環境。[自動][開発]、または [本番] を選択できます。

        • 環境が [自動] に設定されている場合、コード内でスペース変数 ${プロジェクト名/セクション名} を使用してテーブルを参照するのと同じです。選択可能な範囲は、開発環境のテーブルです。タスクが正常に送信されると、変数は開発環境テーブルに置き換えられ、データリネージが解析されます。正常に公開されると、対応する本番環境テーブルに自動的に置き換えられ、データリネージが解析されます。対応する本番テーブルが存在しない場合、送信と公開はブロックされませんが、本番データリネージは解析できません。

        • 環境が [開発] または [本番] に設定されている場合、送信時と公開時に変数の置き換えは行われず、構成が優先されます。

        入力テーブル

        サポートされているデータテーブルタイプは次のとおりです。物理テーブル、物理ビュー、論理ディメンションテーブル、論理ファクトテーブル、論理集計テーブル、論理タグテーブル、論理ビュー。

        選択範囲

        • [テーブル全体]: 送信時と公開時に、対応するテーブルのすべてのフィールドに基づいてデータリネージ関係が生成されます。

          説明

          データリネージは、タスクが正常に送信および公開されたときにのみ更新されます。入力テーブルと出力テーブルの構造に対する後続の変更は、データリネージの更新を自動的にトリガーしません。

        • [指定したフィールド]: ビジネスニーズに応じて、対応するテーブルで指定したフィールドを選択します。

      2. [確認] をクリックして、入力テーブルの構成を完了します。

    • 出力テーブルの構成

      1. データリネージ グループ エリアで、[出力テーブル ダイアログ ボックス] を開くには 出力テーブルの構成 をクリックし、関連パラメーターを構成します。

        出力テーブルのパラメータは、入力テーブルのパラメータと同じです。

      2. [確認] をクリックして、出力テーブルの構成を完了します。

  7. 各データリネージグループの入力テーブルと出力テーブルを構成した後、[リネージ構成] パネルで [確認] をクリックして、データリネージ構成を完了します。

データリネージの送信と公開

  1. データリネージの構成が完了したら、コード編集領域の上にある [送信] をクリックします。

  2. [送信ログ] ダイアログボックスで、[確認して送信] をクリックします。

  3. [送信ログ][オブジェクト存在チェック] ステップ中に、システムはデータリネージ構成で参照されている入力テーブル、出力テーブル、およびフィールドが存在するかどうかを確認します。

    説明
    • データリネージ構成は、送信ステージ中にのみオブジェクトチェックを実行します。公開環境では追加のチェックは実行されません。

    • タスクが送信されると、システムは開発環境のテーブルとフィールドのデータリネージ関係を解析します。公開されると、本番環境の関係を解析します。1 回のタスク送信または公開では、最大 100,000 件のデータリネージ関係の解析がサポートされます。これを超えると、記録されず、アセットディレクトリに表示されません。

データリネージの表示

タスクが送信および公開されると、カスタム構成されたテーブルレベルおよびフィールドレベルのデータリネージ関係をデータテーブルの製品ページで表示できます。詳細については、「参照ドキュメント」をご参照ください。