Dataphin は、SQL タイプのコンピューティングタスクと論理テーブルタスクのデータリネージ情報の自動解析をサポートしています。非 SQL コンピューティングタスクの場合、データリネージ情報をカスタム構成して、データリネージチェーンを完成させることができます。このトピックでは、非 SQL タスクのデータリネージの構成をカスタマイズする方法について説明します。
制限事項
非 SQL タイプのコンピューティングタスクのデータリネージのカスタム構成のみをサポートします。
最大 20 のデータリネージグループを構成でき、それぞれ最大 5 つの入力と出力を設定できます。
データリネージ構成の説明
データリネージグループとデータリネージ: 各タスクには、複数のデータリネージグループを構成できます。データリネージグループ内の各入力と出力は 1 対 1 で対応してデータリネージ関係を確立し、データリネージグループは互いに独立しています。各入力と出力の構成は、テーブルレベルとフィールドレベルのデータリネージを同時に生成します。
たとえば、入力テーブル 1 がテーブル A からフィールド a を選択し、入力テーブル 2 がテーブル B からフィールド b を選択し、出力テーブルがテーブル C からフィールド c と d を選択する場合、次のデータリネージ関係が生成されます。
テーブルレベルのデータリネージ: テーブル A → テーブル C; テーブル B → テーブル C。
フィールドレベルのデータリネージ: テーブル A.a → テーブル C.c; テーブル B.b → テーブル C.c; テーブル A.a → テーブル C.d; テーブル B.b → テーブル C.d。
入力テーブルと出力テーブルの環境設定をサポートしています。 [自動] に設定すると、送信時と公開時に環境パラメーターが自動的に置き換えられ、対応する開発環境と本番環境のデータリネージが生成されます。
タスクが送信または公開されると、システムは既存のデータソーステーブルのデータリネージを解析します。タスクが再送信または再公開されると、データリネージは最新バージョンに更新されます。
データリネージの構成
Dataphin ホームページで、トップメニューバーから [開発] > [データ開発] を選択します。
[開発] ページで、トップ メニューバーから [プロジェクト] を選択します(開発-本番モードでは、環境を選択する必要があります)。
左側のナビゲーションウィンドウで、[データ処理] > [スクリプトタスク] を選択します。
コンピューティングタスクリストでターゲットのコンピューティングタスクをクリックして、そのタブを開きます。
右側のサイドバーで [リネージ] をクリックして、[リネージ構成] パネルを開きます。
[リネージ構成] パネルで、[+ リネージグループを追加] をクリックして、入力テーブルと出力テーブルを構成します。
入力テーブルの構成
データリネージ グループ エリアで、[入力テーブル ダイアログ ボックス] を開くには 入力テーブルの構成 をクリックし、パラメーターを構成します。
パラメータ
説明
環境
入力テーブルと出力テーブルが属する環境。[自動]、[開発]、または [本番] を選択できます。
環境が [自動] に設定されている場合、コード内でスペース変数 ${プロジェクト名/セクション名} を使用してテーブルを参照するのと同じです。選択可能な範囲は、開発環境のテーブルです。タスクが正常に送信されると、変数は開発環境テーブルに置き換えられ、データリネージが解析されます。正常に公開されると、対応する本番環境テーブルに自動的に置き換えられ、データリネージが解析されます。対応する本番テーブルが存在しない場合、送信と公開はブロックされませんが、本番データリネージは解析できません。
環境が [開発] または [本番] に設定されている場合、送信時と公開時に変数の置き換えは行われず、構成が優先されます。
入力テーブル
サポートされているデータテーブルタイプは次のとおりです。物理テーブル、物理ビュー、論理ディメンションテーブル、論理ファクトテーブル、論理集計テーブル、論理タグテーブル、論理ビュー。
選択範囲
[テーブル全体]: 送信時と公開時に、対応するテーブルのすべてのフィールドに基づいてデータリネージ関係が生成されます。
説明データリネージは、タスクが正常に送信および公開されたときにのみ更新されます。入力テーブルと出力テーブルの構造に対する後続の変更は、データリネージの更新を自動的にトリガーしません。
[指定したフィールド]: ビジネスニーズに応じて、対応するテーブルで指定したフィールドを選択します。
[確認] をクリックして、入力テーブルの構成を完了します。
出力テーブルの構成
データリネージ グループ エリアで、[出力テーブル ダイアログ ボックス] を開くには 出力テーブルの構成 をクリックし、関連パラメーターを構成します。
出力テーブルのパラメータは、入力テーブルのパラメータと同じです。
[確認] をクリックして、出力テーブルの構成を完了します。
各データリネージグループの入力テーブルと出力テーブルを構成した後、[リネージ構成] パネルで [確認] をクリックして、データリネージ構成を完了します。
データリネージの送信と公開
データリネージの構成が完了したら、コード編集領域の上にある [送信] をクリックします。
[送信ログ] ダイアログボックスで、[確認して送信] をクリックします。
[送信ログ] の [オブジェクト存在チェック] ステップ中に、システムはデータリネージ構成で参照されている入力テーブル、出力テーブル、およびフィールドが存在するかどうかを確認します。
説明データリネージ構成は、送信ステージ中にのみオブジェクトチェックを実行します。公開環境では追加のチェックは実行されません。
タスクが送信されると、システムは開発環境のテーブルとフィールドのデータリネージ関係を解析します。公開されると、本番環境の関係を解析します。1 回のタスク送信または公開では、最大 100,000 件のデータリネージ関係の解析がサポートされます。これを超えると、記録されず、アセットディレクトリに表示されません。
データリネージの表示
タスクが送信および公開されると、カスタム構成されたテーブルレベルおよびフィールドレベルのデータリネージ関係をデータテーブルの製品ページで表示できます。詳細については、「参照ドキュメント」をご参照ください。