すべてのプロダクト
Search
ドキュメントセンター

Dataphin:Dataphin テーブル品質ルールの作成

最終更新日:Apr 01, 2026

Dataphin を使用すると、データテーブルの品質ルールを作成して、データ品質を検証し、テーブルをより効果的に監視できます。このトピックでは、Dataphin テーブルの品質ルールを構成する方法について説明します。

前提条件

品質ルールを構成する前に、監視対象を追加する必要があります。手順については、「監視対象の追加」または「」をご参照ください。

権限

  • スーパー管理者、品質管理者、[品質ルール] [管理] 権限を持つカスタムグローバルロール、およびテーブルが存在するプロジェクトに対して[プロジェクト品質管理] [品質ルール管理] 権限を持つカスタムプロジェクトロールは、品質ルールのスケジューリング、アラート機能、例外アーカイブテーブル、およびスコアリング重みを設定できます。

  • 品質所有者は、所有する監視対象の品質ルールのスケジューリング、アラート、例外アーカイブテーブル、およびスコアリング重みを構成できます。

  • 品質オーナーおよび一般ユーザは、Dataphin テーブルに対する読み取り権限を必要とします。これらの権限をリクエストするには、「テーブル権限のリクエスト、更新、または解放」をご参照ください。

  • サポートされる操作はオブジェクトタイプによって異なります。 詳細については、「品質ルールの操作権限」をご参照ください。

品質ルール構成手順

品質ルールは、[カスタム構成] および [標準から] の 2 つの構成方法をサポートしています(この方法では、データ標準モジュールを有効化する必要があります)。

  • カスタム設定は、組み込みまたはカスタムの品質ルールテンプレートを使用して迅速にルールを作成し、柔軟なモニタリング要件を満たすためにカスタム SQL をサポートします。

  • [標準から] は、現在のアセットにマッピングされているデータ標準で設定済みの品質ルールを参照して、標準の制約をより効果的に適用します。

検証ルールリファレンス

品質ルールが [ソフトルール] をトリガーすると、Dataphin はアラートを送信し、問題を迅速に検出して修正できます。[強制ルール] をトリガーすると、Dataphin はテーブルへの書き込みタスクを停止し、ダーティデータがダウンストリームに流れるのを防ぎます。Dataphin はアラートも送信し、問題を迅速に検出して修正できます。

試行実行と実行の違い

試行実行と実行は、実行方法と結果表示が異なります。[試行実行] は、品質ルールの一回実行をシミュレートして、その正確性と動作をテストします。試行実行の結果は品質レポートには表示されません。[実行] は、スケジュール時刻に品質ルールをチェックします。実行結果は品質レポートに表示されるため、表示および分析できます。

品質ルールの構成

  1. Dataphin で、メニューバーの [ガバナンス][Data Quality] をクリックします。

  2. 左側のナビゲーションウィンドウで、[品質ルール] をクリックします。[Dataphin テーブル] ページで、対象オブジェクトの名前をクリックして、[品質ルールの詳細] ページを開きます。ここで品質ルールを設定します。

    • カスタム設定

      1. データテーブル上の [Create Quality Rule] にマウスを上に移動して、[Custom Configuration] を選択します。または、[Create Quality Rule] をクリックして、[Create Quality Rule] ダイアログボックスを開きます。

      2. [品質ルールの作成] ダイアログボックスで、パラメーターを設定します。

        [パラメーター]

        [説明]

        基本情報

        ルール名

        品質ルールの名前です。最大 256 文字。

        ルールの強度

        [ソフト ルール][ストロング ルール] に対応しています。

        • [弱いルール]: 「弱いルール」を選択すると、検証に失敗した場合に Dataphin からアラートが送信されますが、ダウンストリームのタスクノードはブロックされません。

        • 強ルール: [強ルール] を選択した場合、検証に失敗すると Dataphin はアラートを送信します。また、(コードチェックのスケジューリングやタスクによってトリガーされるスケジューリングなどの) 下流タスクが存在する場合、それらもブロックします。これにより、ダーティデータの拡散を防ぎます。下流タスクが存在しない場合 (定期的な品質スケジューリングなど)、Dataphin はアラートの送信のみ行います。

        説明

        品質ルールの説明です。最大 128 文字。

        設定方法

        • [テンプレート作成]: よく使われるシステムテンプレートまたはカスタムビジネステンプレートを使用して、品質ルールを迅速に作成できます。

          • システムテンプレート:組み込みパラメーターは設定可能です。一般的なルールの作成に最適です。

          • [カスタムテンプレート]: 事前定義されたパラメーターは設定不要です。ビジネスロジックを含むルールに最適です。

        • SQL: SQL を使用して柔軟な品質モニタリングルールを定義します。複雑なシナリオに最適です。

        ルールテンプレート

        ドロップダウンリストからルール テンプレートを選択します: [完全性][一意性][適時性][有効性][一貫性][安定性]、または [SQL]

        • 完全性[Null 値検証][空文字列検証] を含みます。

        • [一意性]: [一意性検証][フィールド グループ数検証]、および[重複値数検証]を含みます。

        • 適時性式による時間比較時間間隔の比較、および2 つのテーブル間の時間間隔の比較が含まれます。

        • 有効性: 列形式の検証列長の検証列値ドメインの検証参照テーブルの検証、および標準参照テーブルの検証(Data Standard モジュールが必要)を含みます。

        • 一貫性[列の値の一貫性検証][列の統計的な一貫性検証][単一フィールドのビジネスロジックの一貫性チェック][2 つのテーブルの列の値の一貫性検証][2 つのテーブルの列の統計的な一貫性検証][2 つのテーブルの列の処理ロジックの一貫性検証]、および [クロスソースの列の統計的な一貫性検証] を含みます。

        • [安定性]: [テーブル安定性検証][テーブル変動性検証][列安定性検証]、および[列変動性検証]を含みます。

        • SQL: カスタム統計検証 および カスタム詳細値検証 を含みます。

        詳細については、「テンプレートタイプ」をご参照ください。

        ルールタイプ

        ルールタイプはテンプレートによって異なります。これはテンプレートの基本プロパティであり、説明とフィルタリングに使用できます。

        監視粒度

        このオプションは、[カスタム SQL] を選択した場合にのみ表示されます。[テーブル全体] を選択するか、特定の [フィールド] を指定して監視します。

        テンプレート設定

        テンプレート情報

        このセクションには、選択したテンプレートの構成情報が表示されます。この情報を変更するには、[クオリティルールテンプレート]に移動します。

        ルール構成

        ルール設定

        ルール構成は、選択したテンプレートに基づいて変化します。詳細については、「テーブルパラメーター構成」をご参照ください。「」をご参照ください。

        特別な構成には以下が含まれます。

        • 検証テーブルのデータフィルタリング: デフォルトではオフです。有効にすると、検証テーブルにフィルター条件、パーティションフィルター、または一般的なデータフィルターを設定できます。これらのフィルターは、検証 SQL に直接追加されます。検証テーブルでパーティションフィルタリングが必要な場合は、スケジューリング構成でパーティションフィルター式を設定することをお勧めします。設定後、品質レポートにはパーティションレベルでデータが表示されます。

        • 一貫性/2 テーブルフィールド統計値一貫性チェック または 一貫性/クロスソース 2 テーブルフィールド統計値一貫性チェック テンプレートを選択すると、[比較テーブルデータフィルタリング] を有効にできます。有効にすると、比較テーブルに対してフィルター条件、パーティションフィルター、または一般データフィルターを設定できます。これらのフィルターは、検証 SQL に直接追加されます。

        検証構成

        ルールの検証

        • 品質ルール検証後、Dataphin は結果を例外検証設定と比較します。結果が基準を満たしている場合、検証は失敗します。その後、Dataphin はアラートおよびその他のフォローアップアクションをトリガーします。

        • 例外検証で利用可能なメトリックは、テンプレートと構成によって異なります。AND/OR 条件を使用できます。3つ未満の条件を使用することを推奨します。

        詳細については、「検証設定」をご参照ください。

        アーカイブ設定

        異常アーカイブ

        デフォルト設定は[オフ]です。有効にすると、異常データをファイルまたはテーブルにアーカイブできます。品質検証後、アーカイブされた異常データをダウンロードして分析できます。

        • [アーカイブモード] は、[例外フィールドのみアーカイブ] および [完全レコードをアーカイブ] をサポートしています。

          • アーカイブ例外フィールドのみ: 監視対象フィールドのみをアーカイブします。単一のフィールドが例外データを完全に識別する場合にこれを使用します。

          • 完全なレコードのアーカイブ: 例外データを含む完全なレコードをアーカイブします。例外データを特定するために完全なレコードが必要な場合に使用します。

            説明

            完全レコードをアーカイブすると、データ量が大幅に増加します。ほとんどの場合、[例外フィールドのみアーカイブ] を使用することを推奨します。

        • [アーカイブ先][デフォルトのファイルサーバー][例外データ用のアーカイブテーブル] をサポートしています。 例外アーカイブテーブルを作成していない場合は、[例外アーカイブテーブルの管理] をクリックして作成します。 詳細については、「例外アーカイブテーブルの追加」をご参照ください。

          • デフォルトファイルサーバ: Dataphin がデプロイされたときに設定されたシステムファイルサーバです。[検証レコード]-[検証詳細] ページから例外データを直接ダウンロードするか、デフォルトファイルサーバに直接アクセスできます。デフォルトファイルサーバを使用する場合、Dataphin は検証ごとに最大 100 件の例外レコードをアーカイブします。これは small データの検証に最適です。

          • [例外データ用アーカイブテーブル]: さらに多くの例外データを保存したり、分析のために異なる検証から得られた例外データをグループ化したりする場合は、カスタム アーカイブテーブルを作成します。各品質ルールは、実行ごとに最大 10,000 件の例外レコードを保存できます。検証レコードページから例外データをすばやくダウンロードできます。または、アーカイブテーブルに直接アクセスして、そのライフサイクルを管理できます。これにより、より高い柔軟性が得られます。

            説明
            • Dataphin は、この実行のすべてのルールからすべての例外データをダウンロードします。ダウンロードサイズは 10,000 レコードに制限されます。より多くのデータを表示するには、カスタム例外アーカイブテーブルにアーカイブして直接アクセスします。

            • 例外アーカイブテーブルは、特定のフォーマット要件を満たす必要があります。これを満たさないと、書き込みエラーが発生する可能性があります。詳細については、「例外アーカイブテーブルの追加」をご参照ください。

        ビジネス属性構成

        属性情報

        ビジネス属性入力ルールは、品質ルール属性構成に依存します。たとえば、担当部署のフィールドは列挙 (複数選択) タイプを使用します。有効な値には、ビッグデータ部門、ビジネス部門、およびテクノロジー部門が含まれます。したがって、品質ルールを作成するとき、このフィールドは複数選択ドロップダウンとして表示されます。有効な値は、ビッグデータ部門、ビジネス部門、およびテクノロジー部門です。

        ルール所有者のフィールドはカスタム入力を使用します。最大長は 256 文字です。したがって、品質ルールを作成するとき、最大 256 文字を入力できます。

        属性フィールドが [範囲] 入力メソッドを使用する場合、次のように構成します。

        範囲: 有効な値が連続した数値または日付の場合に使用します。 [>][>=][<]、または [<=] から選択します。 属性設定オプションの詳細については、「品質ルール属性の作成と管理」をご参照ください。

        スケジューリング属性構成

        スケジューリング方法

        既存のスケジュールを選択します。スケジューリング方法をまだ決定していない場合は、まず品質ルールを作成し、後でスケジューリングを設定してください。新しいスケジュールを作成するには、「スケジュールの作成」をご参照ください。

        品質スコア構成

        スコアリング方法

        品質検証ステータスとデータコンプライアンス比率のいずれかを選択します。

        • [品質検証ステータス]:最新の成功した検証の検証ステータスに基づいてスコアを付けます。合格 = 100 ポイント。失敗 = 0 ポイント。

        • [データコンプライアンス比率]:最新の成功した検証における正常データの比率をスコアとして使用します。たとえば、データフォーマットの有効性が 80% の場合、品質スコアは 80 です。

        すべてのルールテンプレートが両方のスコアリング方法をサポートしているわけではありません。[品質検証ステータス] のみをサポートするテンプレートは次のとおりです。

        • 一意性ルール下のフィールドグループ数検証とフィールド重複値数検証。

        • 一貫性ルール下の単一テーブルフィールド統計値一貫性チェックとクロスソース2テーブルフィールド統計値一貫性チェック。

        • すべての安定性ルール。

        • カスタム SQL ルール下のカスタム統計メトリック検証。

        品質スコアの重み

        監視対象の品質スコアを計算する際の品質ルールの重みです。1 から 10 までの整数を選択します。

      3. [OK] をクリックして、カスタムルール構成を完了します。

        [SQL プレビュー] をクリックして、現在の構成を前回保存した構成と比較します。これにより、SQL の変更内容を確認できます。

        説明
        • 必須フィールドが不完全な場合、SQL プレビューは利用できません。

        • 左側には最後に保存された構成の SQL プレビューが表示されます。存在しない場合、空白です。右側には現在の構成の SQL プレビューが表示されます。

  • 参照データ標準のモニタリング

    1. データテーブル上で 品質ルールの作成 にカーソルを合わせ、標準から作成 を選択します。

    2. 標準から作成 ダイアログボックスで、リファレンス対象のデータ標準ルールを選択します。有効性 (Validity)、一意性 (Uniqueness)、完全性 (Completeness)、安定性 (Stability) のいずれかでフィルターを適用するか、オブジェクト名で検索します。

      参照データ標準ルールのダイアログボックスでは、ルール名を変更したり、アクティブ状態を切り替えたりできます。関連付けられた標準の横にあるアイコンをクリックすると、標準の詳細をご確認いただけます。また、[操作] 列の image アイコンをクリックすると、品質ルールの内容をご確認いただけます。

      説明

      リファレンス登録後は、ルールの詳細を編集できません。スケジューリングの設定およびルールの強度の変更は可能です。

    3. 選択したルールを追加 をクリックして、データ標準ルールのリファレンス登録を完了します。

ルール設定一覧

品質ルールを作成すると、ルール構成リストでそのルールを表示、編集、試行、実行、または削除できます。

イメージ

リージョン

説明

フィルターおよび検索エリア

オブジェクト名またはルール名で素早く検索できます。

ルールタイプ、ルールテンプレート、ルール強度、トライアル実行ステータス、有効ステータス、またはルールソースでフィルターをかけられます。

説明

ビジネス属性が検索可能およびフィルター可能として設定され、かつ有効化されている場合、その属性で検索またはフィルターを行うことができます。

リストエリア

ルール構成リストには、「オブジェクトタイプ/名称」「ルール名/ID」「トライアル実行ステータス」「有効ステータス」「ルールタイプ」「ルールテンプレート」「ルール強度」「スケジュールタイプ」「関連ナレッジベースドキュメント」が表示されます。更新ボタンの左側にある image アイコンをクリックすると、リストに表示する項目を選択できます。

  • ルールがデータ標準ルールを参照している場合、ルール名の隣にある image アイコンをクリックして、標準の詳細情報を確認できます。

  • ルールが R&D フィールド標準を適用している場合、ルール名に image アイコンが表示されます。

  • 有効ステータス:ルールを有効化する前に、必ずトライアル実行を実施することを推奨します。トライアル実行に合格したルールのみを有効化してください。これにより、不具合のあるルールによる本番タスクのブロックを回避できます。

    • 有効な状態では、ルールはスケジュール時刻に自動的に実行されます。

    • 無効な状態では、ルールは自動的には実行されませんが、手動で実行可能です。

  • 関連ナレッジベースドキュメント詳細を表示 をクリックすると、関連付けられたナレッジベース情報(テーブル名、検証対象、ルール、関連ナレッジベースドキュメントなど)を確認できます。ナレッジベース項目は、検索・表示・編集・削除が可能です。詳細については、「ナレッジベースの表示」をご参照ください。

操作エリア

表示、クローン作成、編集、トライアル実行、実行、スケジュール構成、ナレッジベースドキュメントの関連付け、品質スコア構成、削除などの操作を実行できます。

  • 表示:ルール構成の詳細を表示します。

  • クローン作成:ルールをすばやくコピーします。

  • 編集:編集後は、再度トライアル実行を実施してください。編集可能なフィールドはルールタイプによって異なります。詳細については、「品質ルールの編集」をご参照ください。

  • トライアル実行既存のスケジュール または カスタム検証範囲 を選択して、ルールのトライアル実行を実施します。トライアル実行後に、image アイコンをクリックし、トライアル実行ログの表示 を選択します。

  • 実行既存のスケジュール または カスタム検証範囲 を選択して、ルールを実行します。実行後は、品質記録 で結果を確認できます。

  • スケジュール構成:ダイアログボックス内で、スケジュールタイプでフィルターをかけたり、スケジュール名で検索したりできます。また、スケジュールの編集も可能です。

  • ナレッジベースドキュメントの関連付け:関連付け後は、品質ルールおよびガバナンスワークスペースで関連ナレッジを確認できます。未関連付けのナレッジベースを選択してください。新規作成については、「ナレッジベースの作成と管理」をご参照ください。

  • 品質スコア構成:スコアリング方式および品質スコア重みを変更します。

    重要

    品質スコア重みは、監視対象の品質スコアに影響を与えます。変更には十分ご注意ください。

  • 削除:この品質ルールを削除すると、当該オブジェクト配下のすべてのルールが削除されます。この操作は元に戻せません。実行には十分ご注意ください。

一括操作エリア

トライアル実行、実行、スケジュール構成、有効化、無効化、ビジネス属性の更新、ナレッジベースドキュメントの関連付け、品質スコア構成、ルールのエクスポート、削除などの一括操作を実行できます。

  • トライアル実行既存のスケジュール または カスタム検証範囲 を選択して、複数のルールを一括でトライアル実行します。トライアル実行後に、image アイコンをクリックし、トライアル実行ログの表示 を選択します。

  • 実行既存のスケジュール または カスタム検証範囲 を選択して、複数のルールを一括で実行します。実行後は、品質記録 で結果を確認できます。

    説明

    一括実行時は、同じパーティションを持つテーブルを選択してください。パーティション情報は実行に直接渡されます。パーティションが異なる場合、エラーが発生する可能性があります。

  • スケジュール構成:ダイアログボックス内で、スケジュールタイプでフィルターをかけたり、スケジュール名で検索したりできます。複数の品質ルールに適用可能なスケジュールを構成するために、スケジュールを編集できます。ただし、品質ルール一覧で編集可能なルールのみ編集可能です。

  • 有効化:一括で有効化すると、選択されたルールはスケジュール時刻に自動的に実行されます。ただし、品質ルール一覧で編集可能なルールのみ有効化可能です。

  • 無効化:一括で無効化すると、選択されたルールは自動的には実行されませんが、手動で実行可能です。ただし、品質ルール一覧で編集可能なルールのみ無効化可能です。

  • ビジネス属性の更新:ビジネス属性フィールドが単一選択または複数選択の場合、一括更新がサポートされます。

    • 複数選択フィールドでは、値の追加または置き換えが可能です。

    • 単一選択フィールドでは、値の置き換えのみ可能です。

  • ナレッジベースドキュメントの関連付け:関連付け後は、品質ルールおよびガバナンスワークスペースで関連ナレッジを確認できます。監視対象に対して、ナレッジベースを一括で構成できます。新規作成については、「ナレッジベースの作成と管理」をご参照ください。

  • 品質スコア構成:複数のルールについて、スコアリング方式および品質スコア重みを変更します。

    重要

    品質スコア重みは、監視対象の品質スコアに影響を与えます。変更には十分ご注意ください。

  • ルールのエクスポート:現在の監視対象に対する、閲覧権限を持つカスタム SQL 品質ルールをエクスポートします。

  • 削除:複数の品質ルールオブジェクトを削除します。この操作は元に戻せません。実行には十分ご注意ください。編集権限を持つルールのみ削除可能です。

スケジュールの作成

説明
  • ルールのスケジューリングを構成する場合、既存のスケジュール (テーブルごとに最大 20) から迅速に選択できます。

  • 単一のルールに最大 10 のスケジュールを構成できます。

  • 同一のスケジュールは自動的に重複排除されます。

  • 現在のテーブルが Hologres パーティションテーブルである場合、固定タスクトリガースケジューリングを使用します。

  • 検証範囲は品質検証ステートメントのフィルター条件になります。各検証の範囲を制御し、ダウンストリーム品質レポートの基本単位として機能します。品質レポートは検証範囲レベルでデータを表示します。

  1. 品質ルールの詳細」ページで、「スケジュール設定」タブをクリックします。次に、「スケジュールの作成」をクリックして、「スケジュールの作成」ダイアログボックスを開きます。

  2. [スケジュールの作成] ダイアログボックスで、パラメーターを設定します。

    [パラメーター]

    [説明]

    スケジュール名

    カスタムスケジュール名です。最大 64 文字。

    スケジュールタイプ

    [Recurrency Triggered]」、「[Data Update Triggered]」、または「[Task Triggered]」のいずれかを選択します。

    • 定期的トリガー: スケジュール時刻に品質チェックを実行します。出力時間が固定されているデータに最適です。

      • 繰り返し: 品質ルールの実行では計算リソースを使用します。一度に多くのルールを同時に実行すると、本番タスクに影響を及ぼす可能性があるため、避けてください。繰り返しタイプには、[日][週][月][時間]、および[分]が含まれます。

        ルールはシステムタイムゾーン (ユーザーセンタータイムゾーン) で実行されます。両方のゾーンが一致しない限り、スケジューリングタイムゾーン ([管理センター] > [システム設定] > [基本設定] で設定) は使用されません。

      • 推奨時間を入力: 「推奨時間を入力」をクリックします。Dataphin は、現在のテーブルの出力タスクの平均完了時間に基づいて時間を推奨します。

    • [データ更新がトリガーされた]: 各コードタスクの実行が、現在のテーブルの検証範囲を更新するかどうかを解析します。不規則な変更タスクまたは重大なモニタリング要件があるテーブルに最適です。

      説明

      タスクによって更新されたパーティションを選択することを推奨します (非パーティション化テーブルはテーブル全体を検証します)。Dataphin は検証のためにすべてのデータ変更を自動検出します。これにより、変更を見逃すのを避けることができます。

    • タスクトリガー: 指定されたタスクの完了後または完了前に品質ルールを実行します。サポートされているタスクタイプには、Engine SQL、オフラインパイプライン、Python、Shell、Virtual、DataX、Spark_jar、Hive_MR、およびデータベース SQL ノードが含まれます。変更タスクが固定されているテーブルに最適です。

      説明

      固定タスクトリガースケジューリングは本番環境タスクのみをサポートします。強制ルールを設定し、スケジューリングタスクが失敗した場合、本番タスクに影響する可能性があります。ビジネスニーズに基づいて慎重に進めてください。

      • [トリガーのタイミング]: 品質チェックを実行するタイミングを選択します。オプションには、[すべてのタスクが成功した後にトリガー][各タスクが成功した後にトリガー]、および[各タスクの実行前にトリガー]があります。

      • タスクのトリガー:プロジェクト管理者または O&M システムロールは、本番プロジェクトからタスクノードを選択できます。 ノードの出力名で検索するか、推奨タスクまたはすべてのタスクから選択します。

        • 推奨タスク: 現在のテーブルが出力テーブルであるリネージタスクを表示します。また、ノード出力名が、モジュール名またはプロジェクト名にテーブル名を加えたものと等しいタスクも表示します。これは、[アセットカタログ - アセット詳細 - 出力情報] の範囲と一致します。

        • すべてのタスク: 現在のユーザーがO&M権限を持つすべての本番タスクを表示します。

          説明
          • [すべてのタスクが成功した後にトリガー] を選択した場合、同じスケジューリングサイクルを持つタスクを選択します。異なるサイクルはルール実行と品質レポート生成を遅らせる可能性があります。

          • [各タスクが実行される前にトリガー] を選択した場合、推奨タスクは現在のテーブルが入力であるリネージタスクを表示します。

    スケジュール条件

    デフォルトでオフです。有効にすると、Dataphin はスケジューリング前に条件が満たされているかチェックします。条件が満たされている場合にのみスケジューリングが発生します。そうでない場合、Dataphin はこのスケジュールをスキップします。

    • [営業日付]/[実行日]: [定期実行トリガー](時間指定スケジューリングではサポートされていません)、[データ更新トリガー]、および[タスク実行トリガー]で使用できます。 [標準カレンダー] または [カスタムカレンダー] を選択します。 カスタムカレンダーの設定については、「パブリックカレンダーの作成」をご参照ください。

      • [標準カレンダー] を選択した場合、オプションには [月][週][日付] が含まれます。下のイメージをご参照ください。

        image

      • [カスタムカレンダー]」を選択すると、「[日付タイプ]」と「[タグ]」のオプションが表示されます。以下の画像をご参照ください。

        image

    • インスタンスタイプ[データ更新トリガー][タスクトリガー] で使用可能です。[定期インスタンス][データバックフィルインスタンス]、または [ワンタイムインスタンス] を選択します。以下の図をご参照ください。

      image

    説明
    • 少なくとも 1 つのルールを設定してください。ルールを追加するには、[+ ルールを追加] をクリックします。

    • 最大 10 のスケジュール条件を構成します。

    • スケジュール条件間の関係を AND または OR として設定します。

    [検証範囲]

    [時間指定スケジューリング] または [固定タスクトリガースケジューリング] の場合、[カスタム検証範囲] を指定できます。[データ更新トリガースケジューリング] の場合、[ジョブによって更新されたパーティション] を指定できます。

    検証範囲をカスタマイズします。

    • 更新されたパーティション: 検証タスクがパーティションを更新すると、Dataphin はそのパーティションをタスクに使用します。

      説明
      • 動的パーティションシナリオでは、Dataphin はパーティションの解析に失敗する可能性があります。品質検証は行われません。

      • 変動性検証ルール (例: パーティションサイズ、行数、フィールド統計) は明示的なパーティションを必要とします。これらはタスク更新パーティション検証範囲をサポートしません。

      • データ更新が発生した場合、非パーティション化テーブルはテーブル全体を検証します。

    • [カスタム検証範囲]:Dataphin がパーティションを解析できないシナリオでこれを使用します。ビジネス日付または実行日付式を使用して検証範囲を指定します。

      • 検証範囲の式: 編集可能なテキスト付きのドロップダウンです。ds='${yyyyMMdd}' のように範囲を直接入力します。または、組み込みの式を選択して変更することもできます。組み込みの式については、「組み込みパーティションフィルター式」をご参照ください。

        説明
        • and または or を使用して複数の条件を結合します。例: province="Zhejiang" and ds<=${yyyyMMdd}.

        • 品質ルールでフィルター条件を構成した場合、それらは AND を使用して検証範囲式と結合されます。検証中に両方の条件が適用されます。

        • 検証範囲式は全表スキャンをサポートします。

          :全表スキャンは大量のリソースを消費します。一部のシステムはそれらをサポートしません。全表スキャンを避けるためにパーティションフィルター式を使用することを推奨します。

      • 検証範囲予算: デフォルトは今日の営業日です。

  3. [OK] をクリックしてスケジュールの構成を完了します。

スケジュール構成リスト

スケジュールを作成した後、スケジュール構成リストで表示、編集、クローン、または削除できます。

image

セクション

説明

フィルターおよび検索エリア

スケジュール名で素早く検索できます。

定期実行トリガーデータ更新トリガー、またはタスク実行トリガーでフィルターできます。

一覧表示エリア

スケジュール名スケジュールタイプ最終更新者、および最終更新日時を表示します。

操作エリア

スケジュールの編集、クローン作成、または削除が可能です。

  • 編集:既存のスケジュール情報を変更します。

    重要

    このスケジュールを使用しているすべてのルールが更新されます。操作には十分ご注意ください。

  • クローン:スケジュール構成をすばやくコピーします。

  • 削除:ルールから参照されているスケジュールは削除できません。

アラートの構成

異なるルールに異なるアラート方法を構成して、アラートを区別します。たとえば、強制ルール例外には電話アラートを使用し、ソフトルール例外には SMS アラートを使用します。ルールが複数のアラート構成に一致する場合、アラート優先度ポリシーを設定します。

説明

監視対象ごとに最大 20 のアラート構成を作成できます。

  1. 品質ルールの詳細」ページで、「アラート設定」タブをクリックします。次に、「アラート設定の作成」をクリックして、「アラート設定の作成」ダイアログボックスを開きます。

  2. [アラート設定の作成]」ダイアログボックスで、パラメーターを設定します。

    [パラメーター]

    [説明]

    スコープ

    [すべてのルール][すべての強力なルール][すべての弱いルール]、または [カスタム] を選択します。

    説明
    • 監視対象ごとに、[すべてのルール]、[すべての強制ルール]、および [すべてのソフトルール] のそれぞれに対して1つのアラートを構成できます。新しいルールはルール強度に基づいてアラートに一致します。アラートを変更するには、既存の構成を編集します。

    • カスタム範囲は、現在の監視対象から最大 200 のルールをサポートします。

    アラート設定名

    名前は監視対象ごとに一意である必要があります。最大 256 文字。

    アラート受信者

    アラート受信者とアラート方法を構成します。少なくとも1つの受信者と1つの方法を選択します。

    • アラート受信者:カスタム、オンコールスケジュール、または品質オーナーから選択します。

      最大5つのカスタム受信者を構成できます。最大3つのオンコールスケジュールを構成できます。

    • アラート方法: 電話、メール、ショートメッセージ、 DingTalk、 Lark、 WeCom、またはカスタムチャンネルから選択します。これらの方法は [チャンネル設定] で管理します。

  3. アラート設定を完了するには、[OK] をクリックします。

アラート構成リスト

アラートを構成した後、アラート構成リストでソート、編集、または削除できます。

image

[番号]

[説明]

① [ソートエリア]

ルールが複数のアラート構成に一致する場合、アラート優先度ポリシーを設定します。

  • 最初に一致したアラート設定が有効: 最初に一致したアラート設定のみが有効になります。その他は無視されます。既存のアラートをソートできます。[ルールソート] をクリックします。アラート設定名の前にある image.png アイコンをドラッグします。または、「アクション」列のアイコンをクリックします。アイコンは左から順に、「一番上に固定」と「一番下に固定」です。ソート後、[ソート完了] をクリックします。

    image

  • [すべてのアラート設定が有効になります]:リスト内のすべてのアラートは、現在の監視対象の下にある品質ルールに適用されます。

    例:複数のアラートを構成し、このオプションを選択した場合、Dataphin はアラート方法 + アラート受信者 + アラートルールでアラートをマージします。特殊なケース:アラート受信者が同じで、アラート方法がカスタムと品質所有者の場合、Dataphin はアラートメッセージをマージします。

    説明

    オンコールスケジュールはアラートマージをサポートしません。

② [リストエリア]

アラート構成名、範囲、受信者、およびアラート方法を表示します。

[スコープ]: カスタムアラートの場合、オブジェクトおよびルールの名前を表示します。ルールが削除された場合、名前は表示されません。アラート設定を更新することを推奨します。

③ [操作エリア]

アラートを編集または削除します。

  • 編集: 既存のアラート情報を変更します。受信者またはメソッドを変更する場合は、ビジネスアラートの見逃しを防ぐため、影響を受ける人に速やかに通知してください。

  • 削除: 削除後、一致するルールのアラートは停止します。慎重に実行してください。

例外アーカイブテーブルの追加

例外アーカイブテーブルは、品質ルール検証例外のレコードを保存します。

  1. [品質ルールの詳細] ページで、[アーカイブ] タブをクリックします。次に [+ 例外アーカイブテーブルの追加] をクリックして [例外アーカイブテーブルの追加] ダイアログボックスを開きます。

  2. [例外アーカイブテーブルの追加] ダイアログボックスで、パラメーターを設定します。

    [メソッド] は、[テーブルの作成] および [既存のテーブルの選択] をサポートします。これらの方法では、特別な品質検証フィールドが追加されます。例外データは元のデータテーブルに書き込まれません。

    • テーブルの作成: テーブル名をカスタマイズします。デフォルトは current_table_name_exception_data です。テーブルは、アーカイブテーブルと同じプロジェクトまたはモジュール内に配置する必要があります。作成後、Dataphin は同じデータベースまたはデータソースにテーブルを作成します。使用できる文字は、英字、数字、アンダースコア (_)、ピリオド (.) で、最大 128 文字です。

      • 監視対象テーブルが物理テーブルの場合、Dataphin は同じプロジェクトにアーカイブテーブルを作成します。

      • 監視対象テーブルが論理ディメンションテーブルまたは論理ファクトテーブルの場合、Dataphin はデフォルトで同じプロジェクトにアーカイブテーブルを作成します。projectA.table_name のように、同じモジュール内のプロジェクトを指定することもできます。

      • 監視対象テーブルが論理集計テーブルの場合、アーカイブテーブル名に同じモジュール内のプロジェクトを指定します。そうでない場合、Dataphin は監視対象テーブルのモジュール下のプロジェクトに作成します。

      • アーカイブテーブルには、品質監視テーブルのすべてのフィールドと検証フィールドを含める必要があります。スクリプトフォーマット:

        create table current_table_name_exception_data
         (dataphin_quality_tenant_id      varchar(64)   comment 'テナント ID' , 
          dataphin_quality_rule_id        varchar(64)   comment '品質ルール ID', 
          dataphin_quality_rule_name      varchar(256)  comment '品質ルール名', 
          dataphin_quality_column_name    varchar(1024) comment '検証フィールド名', 
          dataphin_quality_watch_task_id  varchar(128)  comment '監視対象タスク ID', 
          dataphin_quality_rule_task_id   varchar(64)   comment 'ルールタスク ID', 
          dataphin_quality_validate_time  varchar(64)   comment '品質検証時間', 
          dataphin_quality_archive_mode   varchar(32)   comment '例外アーカイブモード: ONLY_ERROR_FIELD/FULL_RECORD', 
          dataphin_quality_error_data     string        comment '例外データ', 
          ljba_id                         bigint        comment  'ljba_プライマリキー', 
          ljb_id                          bigint        comment  'ljb_プライマリキー', 
          col_tinyint                     tinyint       comment 'フィールドタイプ: TINYINT (小文字)',
          col_tinyint_02                  tinyint       comment '2',
          col_smallint                    smallint      comment 'フィールドタイプ: SMALLINT (小文字)',
          col_smallint_02                 smallint      comment '4',
          col_int                         int           comment 'フィールドタイプ: INT (小文字)',
          col_int_02                      int           comment '6',
          col_bigint                      bigint        comment 'フィールドタイプ: BIGINT (小文字)',
          col_bigint_02                   bigint        comment '8',
          col_float                       float         comment 'フィールドタイプ: FLOAT (小文字)',
          col_float_02                    float         comment '10',
          col_double                      double        comment 'フィールドタイプ: DOUBLE (小文字)',
          col_double_02                   double        comment '11',
          col_decimal                     decimal(38,18) comment 'フィールドタイプ: DECIMAL(38,18) (小文字)',
          col_decimal_02                  decimal(38,18) comment '12',
          col_varchar                     varchar(500)   comment 'フィールドタイプ: VARCHAR(500) (小文字)',
          col_varchar_02                  varchar(500)   comment '13',
          col_char                        char(10)       comment 'フィールドタイプ: CHAR(10) (小文字)',
          col_char_02                     char(10)       comment '14',
          col_string                      string         comment 'フィールドタイプ: STRING (小文字)',
          col_string_02                   string         comment '15',
          col_date                        date           comment 'フィールドタイプ: DATE (小文字)',
          col_date_02                     date           comment '16',
          col_datetime                    datetime       comment 'フィールドタイプ: DATETIME (小文字)',
          col_datetime_02                 datetime       comment '17',
          col_timestmap                   timestamp      comment 'フィールドタイプ: TIMESTAMP (小文字)',
          col_timestmap_02                timestamp      comment '18',
          col_boolean                     boolean        comment 'フィールドタイプ: BOOLEAN (小文字)',
          col_boolean_02                  boolean        comment '19',
          col_binary                      binary         comment 'フィールドタイプ: BINARY (小文字)',
          col_binary_02                   binary         comment '20',
          col_array                       array<int>     comment 'フィールドタイプ: ARRAY<int> (小文字)',
          col_array_02                    array<string>  comment '21',
          col_map                         map<string,string>  comment 'フィールドタイプ: MAP<string, string> (小文字)',
          col_map_02                      map<string,int>     comment '22',
          ds                              string              comment '日付パーティション, yyyyMMdd'
         ) 
        partitioned by 
        (dataphin_quality_validate_date string comment '検証日付 (パーティションフィールド)');
    • [既存のテーブルを選択]: 同じプロジェクトまたはデータソースからテーブルを選択します。アーカイブテーブルには、品質モニタリングテーブルおよび検証フィールドのすべてのフィールドが含まれている必要があります。CREATE TABLE 文を表示するには、[例外アーカイブテーブル DDL の表示] をクリックします。スクリプト形式:

      create table current_table_name_exception_data
       (dataphin_quality_tenant_id      varchar(64)   comment 'テナント ID' , 
        dataphin_quality_rule_id        varchar(64)   comment '品質ルール ID', 
        dataphin_quality_rule_name      varchar(256)  comment '品質ルール名', 
        dataphin_quality_column_name    varchar(1024) comment '検証フィールド名', 
        dataphin_quality_watch_task_id  varchar(128)  comment '監視対象タスク ID', 
        dataphin_quality_rule_task_id   varchar(64)   comment 'ルールタスク ID', 
        dataphin_quality_validate_time  varchar(64)   comment '品質検証時間', 
        dataphin_quality_archive_mode   varchar(32)   comment '例外アーカイブモード: ONLY_ERROR_FIELD/FULL_RECORD', 
        dataphin_quality_error_data     string        comment '例外データ', 
        ljba_id                         bigint        comment  'ljba_プライマリキー', 
        ljb_id                          bigint        comment  'ljb_プライマリキー', 
        col_tinyint                     tinyint       comment 'フィールドタイプ: TINYINT (小文字)',
        col_tinyint_02                  tinyint       comment '2',
        col_smallint                    smallint      comment 'フィールドタイプ: SMALLINT (小文字)',
        col_smallint_02                 smallint      comment '4',
        col_int                         int           comment 'フィールドタイプ: INT (小文字)',
        col_int_02                      int           comment '6',
        col_bigint                      bigint        comment 'フィールドタイプ: BIGINT (小文字)',
        col_bigint_02                   bigint        comment '8',
        col_float                       float         comment 'フィールドタイプ: FLOAT (小文字)',
        col_float_02                    float         comment '10',
        col_double                      double        comment 'フィールドタイプ: DOUBLE (小文字)',
        col_double_02                   double        comment '11',
        col_decimal                     decimal(38,18) comment 'フィールドタイプ: DECIMAL(38,18) (小文字)',
        col_decimal_02                  decimal(38,18) comment '12',
        col_varchar                     varchar(500)   comment 'フィールドタイプ: VARCHAR(500) (小文字)',
        col_varchar_02                  varchar(500)   comment '13',
        col_char                        char(10)       comment 'フィールドタイプ: CHAR(10) (小文字)',
        col_char_02                     char(10)       comment '14',
        col_string                      string         comment 'フィールドタイプ: STRING (小文字)',
        col_string_02                   string         comment '15',
        col_date                        date           comment 'フィールドタイプ: DATE (小文字)',
        col_date_02                     date           comment '16',
        col_datetime                    datetime       comment 'フィールドタイプ: DATETIME (小文字)',
        col_datetime_02                 datetime       comment '17',
        col_timestmap                   timestamp      comment 'フィールドタイプ: TIMESTAMP (小文字)',
        col_timestmap_02                timestamp      comment '18',
        col_boolean                     boolean        comment 'フィールドタイプ: BOOLEAN (小文字)',
        col_boolean_02                  boolean        comment '19',
        col_binary                      binary         comment 'フィールドタイプ: BINARY (小文字)',
        col_binary_02                   binary         comment '20',
        col_array                       array<int>     comment 'フィールドタイプ: ARRAY<int> (小文字)',
        col_array_02                    array<string>  comment '21',
        col_map                         map<string,string>  comment 'フィールドタイプ: MAP<string, string> (小文字)',
        col_map_02                      map<string,int>     comment '22',
        ds                              string              comment '日付パーティション, yyyyMMdd'
       ) 
      partitioned by 
      (dataphin_quality_validate_date string comment '検証日付 (パーティションフィールド)');
  3. [OK] をクリックして、例外アーカイブテーブルの追加を完了します。

    [作成後に自動的にアクティブなアーカイブテーブルとして設定] を選択すると、今後の品質ルール作成用のデフォルトのアーカイブテーブルとして設定されます。

異常アーカイブ済みテーブルのリストの表示

追加後、最初のテーブルがアクティブアーカイブテーブルになります。アーカイブテーブル名をクリックしてスキーマを表示します。他のテーブルをアクティブとして設定したり、削除したりすることもできます。

  • [アクティブなアーカイブテーブルとして設定]: テーブルをアクティブに設定すると、この監視対象の下にあるカスタム例外アーカイブテーブルを使用するすべての品質ルールが、例外データをこのテーブルにアーカイブします。

  • [削除]: 例外アーカイブテーブルへの参照のみを削除します。テーブル自体は削除されません。必要に応じて、後で再追加できます。

品質レポートの表示

[品質レポート] をクリックして、現在の品質ルールに関する[ルール検証概要] および [ルール検証詳細] を確認します。

  • 例外結果、パーティション時間、またはルール名やオブジェクト名のキーワードで検証詳細を迅速にフィルターします。

  • 検証詳細リストで、[操作] 列の image アイコンをクリックしてルール検証詳細を表示します。

  • 検証詳細リストで、[操作] 列の image アイコンをクリックして実行ログを表示します。

品質ルール権限管理の構成

  1. [権限管理]」をクリックします。「[詳細の表示]」を設定して、検証レコード、品質ルールの詳細、および品質レポートを表示できるユーザーを指定します。

    [詳細表示]: [すべてのメンバー] または [プロジェクト品質管理権限を持つメンバー] を選択します。

  2. [OK] をクリックして、権限管理の構成を完了します。

次のステップ

品質ルール構成が完了したら、Dataphin テーブルルールリストページで表示できます。 詳細については、「監視対象オブジェクトリストの表示、」をご参照ください。