すべてのプロダクト
Search
ドキュメントセンター

DataWorks:データ品質をモニタリングするためのルールの構成

最終更新日:Mar 26, 2026

スケジューリングノードが dwd_log_info_di_emr テーブルにデータを書き込んだ後、ダウンストリームのノードが実行される前に、空のパーティションなどのデータ品質の問題を検出したい場合があります。本トピックでは、dwd_log_info_di_emr テーブルに対してモニターと強制ルールを構成し、スケジュールされた各実行時に自動的に品質チェックがトリガーされるようにする手順を説明します。チェックに失敗した場合はアラートが発信され、子孫ノードの実行がブロックされます。

前提条件

作業を開始する前に、以下の要件を満たしていることを確認してください。

  • データの同期および処理が完了していること。詳細については、「データの同期」および「データ処理」をご参照ください。

ステップ 1:テーブル単位での構成ページへの移動

  1. Data Quality ページに移動します。DataWorks コンソール にログインします。上部のナビゲーションバーで目的のリージョンを選択し、左側のナビゲーションウィンドウで Data Governance > Data Quality を選択します。表示されたページでドロップダウンリストから目的のワークスペースを選択し、[Data Quality へ移動] をクリックします。

  2. テーブル単位での構成ページに移動します。Data Quality ページの左側ナビゲーションウィンドウで、[ルールの構成] > [テーブル単位での構成] を選択します。「テーブル単位での構成」ページで、dwd_log_info_di_emr テーブルを検索します。

    • 「接続」セクションで、E-MapReduce を選択します。

    • ページ右側で追加のフィルター条件を指定して、対象テーブルを特定します。

  3. 検索結果で、dwd_log_info_di_emr の **[操作]** 列にある [ルール管理] をクリックします。「テーブル品質の詳細」ページが表示されます。

ステップ 2:モニターの構成

モニターは、チェック対象のデータ範囲(パーティション)とチェックのトリガー方法を定義します。本番環境で dwd_log_info_di_emr にデータを書き込むスケジューリングノードが完了するたびに、モニターが実行されるように設定します。

  1. [モニター] タブで、[モニターの作成] をクリックします。

  2. 以下のパラメーターを構成します。

    パラメーター説明
    データ範囲dt=$[yyyymmdd-1]パーティションフィルターです。モニター実行時、この式に一致するパーティション(本例では前日のパーティション)がチェックされます。
    モニタリングルール(空白のまま)ステップ 3 で別途構成します。
    トリガー方法本番環境でのノードスケジューリングによるトリガーdwd_log_info_di_emr ノードが完了するとすぐにモニターが実行されます。中に作成された dwd_log_info_di_emrデータ処理 ノードを選択します。
    モニターのパラメーター一覧については、「単一テーブルのモニタリングルールの構成」をご参照ください。

ステップ 3:モニタリングルールの構成

dwd_log_info_di_emr テーブルは、ods_raw_log_d_emr からのデータを処理します。ダウンストリームノードの実行前に空のパーティションを検出するため、行数が 0 より大きいことを検証する強制ルールを作成します。

強制ルール は、チェックに失敗した場合に子孫ノードをブロックし、アラートをトリガーします。

ルールを作成するには、次の手順を実行します。

  1. [ルール管理] タブの [モニターパースペクティブ] セクションで、raw_log_number_of_table_rows_not_0 モニターを選択し、[ルールの作成] をクリックします。[ルールの作成] パネルが表示されます。

    image

  2. [システムテンプレート] タブで、「テーブルが空でない」を検索し、[使用] をクリックします。「テーブルが空でない」ルールは、パーティションに少なくとも 1 行のデータが含まれているかをチェックします。先祖ノードがパーティションにデータを書き込んだかどうかを直接検出できるため、本シナリオに適しています。行数が 0 の場合、ルールは失敗します。パネル右側で、[重要度]強制ルール に設定します。

    この設定により、dwd_log_info_di_emr の行数が 0 の場合、アラートがトリガーされ、子孫ノードの実行がブロックされます。

    image

  3. [決定] をクリックします。

    他のルールパラメーターについて詳しくは、「単一テーブルのモニタリングルールの設定」をご参照ください。

ステップ 4:テスト実行

モニターが本番稼働する前に、ルール構成を検証するためのテストを実行します。モニターに関連付けられたすべてのルールを作成した後に、テスト実行を行ってください。

image
  1. [テスト実行] をクリックします。[テスト実行] ダイアログボックスが表示されます。

  2. [テスト実行] ダイアログボックスで、[スケジューリング時間] パラメーターを設定し、[テスト実行] をクリックします。

  3. テスト実行が完了したら、[詳細の表示] をクリックして結果を確認します。

    image

ステップ 5:モニターのサブスクリプション

アラート通知をサブスクライブすると、データセキュリティ、データの安定性、およびデータ生成の適時性を確保できます。

  1. [ルール管理] タブで、[アラートサブスクリプション] をクリックします。[アラートサブスクリプション] ダイアログボックスで、通知方法と受信者を選択し、[保存] をクリックします。

    image

  2. サブスクリプションを表示または変更するには、左側のナビゲーションウィンドウで [品質 O&M] > [モニター] を選択します。「モニター」ページで、[マイサブスクリプション] をクリックします。

次のステップ

データ処理が完了したら、DataAnalysis を使用してダッシュボード上にデータを可視化します。詳細については、「ダッシュボード上でのデータの可視化」をご参照ください。