すべてのプロダクト
Search
ドキュメントセンター

DataWorks:品質モニタリング

最終更新日:Feb 05, 2026

DataWorks のデータ品質モニタリングノードでは、監視ルールを設定することで、さまざまなデータソースから取得したテーブルのデータ品質を監視できます。たとえば、これらのルールを使用して「不正データ」を検出できます。また、カスタムスケジューリングポリシーを定義し、データ検証タスクを定期的に実行することも可能です。本トピックでは、データ品質モニタリングノードの使用方法について説明します。

背景情報

DataWorks のデータ品質機能は、ソースデータの変化を検出し、ETL(Extract、Transform、Load)プロセス中に生成される不正データを特定するのに役立ちます。また、問題のあるタスクを自動的にブロックし、不適切なデータが後続の処理に伝播するのを防ぎます。これにより、タスクの出力結果が期待通りとなり、ビジネス運用への影響を回避できます。さらに、トラブルシューティングおよびタスクの再実行に要する時間とコストを大幅に削減できます。詳細については、「Data Quality」をご参照ください。

制限事項

  • 監視対象としてサポートされるテーブルの種類には、MaxCompute、E-MapReduce、Hologres、CDH Hive、AnalyticDB for PostgreSQL、AnalyticDB for MySQL、StarRocks があります。

  • 以下の条件を満たすテーブルのみを監視できます。

    • 監視対象テーブルは、ノードが属するワークスペースにバインドされたデータソースに所属している必要があります。

    • 各ノードで監視できるテーブルは 1 つだけですが、そのテーブルに対して複数の監視ルールを設定できます。監視範囲はテーブルの種類によって異なります。

      • 非パーティションテーブルの場合、デフォルトでテーブル全体が監視対象となります。

      • パーティションテーブルの場合、パーティション式を使用して監視対象のパーティションを指定する必要があります。

      説明

      複数のテーブルを監視する必要がある場合は、各テーブルごとに個別のノードを作成してください。

  • 以下の操作上の制限が適用されます。

    • DataStudio で作成したデータ品質監視ルールは、DataStudio 内でのみ実行、変更、公開が可能です。これらのルールは Data Quality モジュールで閲覧できますが、そこでスケジュール実行をトリガーしたり、管理操作を実行したりすることはできません。

    • データ品質モニタリングノードの監視ルールを変更してノードを公開すると、元の監視ルールが上書きされます。

前提条件

  • コンピューティングリソースをバインドし、そのリソース内で監視対象のテーブルを作成済みである必要があります。

    データ品質モニタリングタスクを実行する前に、監視対象のテーブルを作成する必要があります。詳細については、「コンピューティングリソースの関連付け」および「ノード開発」をご参照ください。

  • リソースグループを作成しました。

    データ品質モニタリングノードの実行には、Serverless リソースグループのみを使用できます。詳細については、「リソースグループ管理」をご参照ください。

  • (任意:RAM ユーザーの場合に必須)タスク開発用の RAM ユーザーが対応するワークスペースに追加され、Developer または Workspace Administrator のロールが割り当てられている必要があります。なお、Workspace Administrator ロールは広範な権限を持つため、慎重に付与してください。メンバーの追加および権限の付与に関する詳細については、「ワークスペースへのメンバー追加」をご参照ください。

ステップ 1:品質モニタリングノードの作成

  1. DataWorks コンソールの ワークスペース ページに移動します。上部ナビゲーションバーから、目的のリージョンを選択します。目的のワークスペースを見つけ、操作 列の ショートカット > Data Studio を選択します。

  2. 左側のナビゲーションウィンドウで image をクリックして DataStudio に移動します。ビジネスフロー の右側にある image をクリックし、ノードの作成 > データ品質 > 品質モニタリング を選択します。画面上の指示に従って、ノードのパスおよび名前を入力し、ノードを作成します。

ステップ 2:データ品質監視ルールの構成

1. テーブルの選択

データ品質モニタリングノードの構成ページで、テーブルの追加 をクリックします。テーブルの追加 ダイアログボックスで、監視対象のテーブルを選択します。「詳細」フィルターを使用すると、テーブルを素早く見つけられます。image

説明

テーブルが表示されない場合は、「マイデータ」に移動して、該当テーブルを検索・管理してください。

2. データ範囲の指定

  • 非パーティションテーブルの場合、デフォルトでテーブル全体が監視対象となります。このステップはスキップできます。

  • パーティションテーブルの場合、監視対象の特定のパーティションを選択する必要があります。式内に スケジューリングパラメーター を使用できます。パーティション式が正しく評価されることを確認するには、プレビュー をクリックします。

3. データ品質監視ルールの構成

新規ルールを作成するか、既存のルールをインポートできます。デフォルトでは、構成済みのすべてのルールが有効になります。

説明
  • データ品質モニタリングノードは、コパイロットルール推奨 機能をサポートしており、テーブル情報に基づいて品質ルールを知的に生成します。これらの推奨内容は、必要に応じて承認または拒否できます。

  • DataWorks コパイロット コードプログラミングアシスタント 機能は、一部のリージョンでパブリックプレビュー中です。ご利用のリージョンでこの機能が利用できない場合は、以下に記載する手順に従って、手動でルールを作成またはインポートしてください。

  • ルールの作成

    ルールの作成 をクリックして、テンプレートまたはカスタム SQL に基づくデータ品質監視ルールを作成します。以下でそれぞれの方法について説明します。

    システムテンプレート

    プラットフォームには、さまざまな組み込み監視ルールが提供されています。これらのテンプレートを使用すると、データ品質監視ルールを迅速に作成できます。以下の図は、このプロセスを示しています。

    説明

    あるいは、左側のシステムテンプレート一覧からルールテンプレートを検索し、+ 使用 をクリックしてルールを作成することもできます。

    image

    システムルールテンプレートのパラメーター

    パラメーター

    説明

    ルール名

    監視ルールの名称です。

    テンプレート

    テーブルに対して実行するルール検証の種類を定義します。

    Data Quality では、すぐに使用可能なテーブルレベルおよびフィールドレベルの組み込みルールテンプレートが多数提供されています。詳細については、「組み込みルールテンプレートの表示」をご参照ください。

    説明

    平均値、合計値、最小値、最大値の各タイプのフィールドレベル監視ルールは、数値型フィールドに対してのみ設定できます。

    ルール範囲

    ルールの適用範囲です。テーブルレベルの監視ルールの場合、適用範囲はデフォルトで現在のテーブルとなります。フィールドレベルの監視ルールの場合、適用範囲は特定のフィールドとなります。

    比較方法

    テーブルデータが期待通りかどうかをチェックするためにルールで使用される比較方法です。

    • 手動設定:ビジネス要件に応じて、データ出力結果と期待値との比較方法を設定できます。

      異なるルールテンプレートに対して異なる比較方法を選択できます。DataWorks コンソールで、各ルールテンプレートがサポートする比較方法を確認できます。

      • 数値結果の場合、数値結果を固定値(期待値)と比較できます。サポートされる比較方法は、以下のとおりです:「より大きい」、「以上」、「等しい」、「等しくない」、「より小さい」、「以下」。ビジネス要件に応じて、正常なデータ範囲(通常しきい値)および異常なデータ範囲(赤色しきい値)を設定できます。

      • 変動結果については、変動結果を変動範囲と比較できます。以下の比較方法がサポートされています:絶対値上昇、および下降。ビジネス要件に応じて、正常データ範囲(正常しきい値)を設定できます。また、異常な偏差の程度に応じて、データ出力例外(オレンジしきい値)および予期しないデータ出力(赤しきい値)を定義することもできます。

    • インテリジェント動的しきい値: このオプションを選択した場合、変動しきい値や期待値を手動で設定する必要はありません。 システムはインテリジェントアルゴリズムに基づいて、適切なきい値を自動的に決定します。 異常なデータが検出された場合、アラートがただちにトリガーされるか、関連タスクがただちにブロックされます。 比較方法パラメーターがインテリジェント動的しきい値に設定されている場合、重要度パラメーターを設定できます。

      説明

      インテリジェント動的しきい値の比較方法は、カスタム SQL 文、カスタム範囲、または 動的しきい値 に基づいて構成した監視ルールのみがサポートします。

    監視しきい値

    • 比較方法 パラメーターを 手動設定 に設定した場合、通常しきい値 および 赤色しきい値 パラメーターを構成できます。

      • 通常しきい値:データ品質チェック結果が指定された条件を満たす場合、データ出力は期待通りです。

      • 赤色しきい値:データ品質チェック結果が指定された条件を満たす場合、データ出力は期待通りではありません。

    • 構成するルールが インテリジェント動的しきい値 の場合、オレンジ色しきい値 を構成する必要があります。

      • オレンジ色しきい値:データ品質チェック結果が指定された条件を満たす場合、データは異常ですが、ビジネス運用には影響しません。

    問題データの保持

    監視ルールが有効であり、ルールに基づくデータ品質チェックが失敗した場合、システムは自動的に問題データを格納するテーブルを作成します。

    重要
    • 「問題データの保持」パラメーターは、MaxCompute および Hologres のテーブルで使用できます。

    • 「問題データの保持」パラメーターは、Data Quality の特定の監視ルールでのみ使用できます。

    • 監視ルールを 無効化 した場合、問題データは保存されません。

    ステータス

    本番環境でルールを 有効化 するか 無効化 するかを指定します。

    重要

    ルールを 無効化 した場合、テスト実行をトリガーしたり、関連するスケジューリングノードによってトリガーされたりすることはありません。

    重要度

    ルールがビジネスにおいて果たす役割の強さです。

    • 「強」ルールは重要なルールです。パラメーターを「強」ルールに設定し、重大しきい値を超えた場合、モニターに関連付けられたスケジューリングノードはデフォルトでブロックされます。

    • 「弱」ルールは通常のルールです。パラメーターを「弱」ルールに設定し、重大しきい値を超えた場合、モニターに関連付けられたスケジューリングノードはデフォルトでブロックされません。

    構成ソース

    ルール構成のソースです。デフォルト値は Data Quality です。

    説明

    ルールに追加の説明を記述できます。

    カスタムテンプレート

    この方法を使用する前に、まず Data Quality > ルール資産 > ルールテンプレート に移動してカスタムルールテンプレートを作成する必要があります。その後、このテンプレートを使用してデータ品質監視ルールを作成できます。詳細については、「カスタムルールテンプレートの作成および管理」をご参照ください。

    以下の図は、カスタムテンプレートに基づくデータ品質ルールの作成方法を示しています。

    説明

    あるいは、左側のカスタムテンプレート一覧からカスタムルールテンプレートを検索し、+ 使用 をクリックしてルールを作成することもできます。

    image

    カスタムルールテンプレートのパラメーター

    以下の表では、カスタムルールテンプレートに基づくルールに固有のパラメーターのみを説明します。その他のパラメーターについては、組み込みルールテンプレートに基づくルールの構成パラメーターをご参照ください。

    パラメーター

    説明

    FLAG パラメーター

    ルール内の SQL 文を実行する前に実行する SET 文です。

    SQL

    完全なチェックロジックを決定する SQL 文です。返される結果は数値で、1 行 1 列である必要があります。

    カスタム SQL 文では、パーティションフィルター式を角括弧 [ ] で囲んでください。例:

    SELECT count(*) FROM ${tableName} WHERE ds=$[yyyymmdd];
    説明
    • この文では、${tableName} 変数の値は、監視ルールを構成するテーブルの名前に動的に置き換えられます。

    • パーティションフィルター式の構成方法については、本トピックの「付録 2:組み込みパーティションフィルター式」セクションをご参照ください。

    • テーブルに対して モニター を作成済みの場合、モニター構成時に データ範囲 パラメーターで指定したテーブルパーティションの設定は、このパラメーターを構成した後に無効になります。ルールは、SQL 文の WHERE 句の設定に基づいてチェック対象のテーブルパーティションを決定します。

    カスタム SQL

    この方法では、テーブル向けのカスタムデータ品質検証ロジックを定義できます。

    image

    カスタム SQL のパラメーター

    ここでは、カスタム SQL に固有のパラメーターのみを示します。その他のパラメーターの説明については、システムルールテンプレートのパラメーター説明をご参照ください。

    パラメーター

    説明

    FLAG パラメーター

    ルール内の SQL 文を実行する前に実行する SET 文です。

    SQL

    完全なチェックロジックを決定する SQL 文です。返される結果は数値で、1 行 1 列である必要があります。

    カスタム SQL 文では、パーティションフィルター式を角括弧 [ ] で囲んでください。例:

    SELECT count(*) FROM <table_name> WHERE ds=$[yyyymmdd];
    説明
    • <table_name> は、監視ルールを構成するテーブルの名前に必ず置き換えてください。SQL 文が監視対象のテーブルを決定します。

    • パーティションフィルター式の構成方法については、本トピックの「付録 2:組み込みパーティションフィルター式」セクションをご参照ください。

    • テーブルに対して モニター を作成済みの場合、モニター構成時に データ範囲 パラメーターで指定したテーブルパーティションの設定は、このパラメーターを構成した後に無効になります。ルールは、SQL 文の WHERE 句の設定に基づいてチェック対象のテーブルパーティションを決定します。

  • 既存ルールのインポート

    対象テーブル向けに、Data Quality モジュールで既に監視ルールを作成済みの場合は、それらをインポートしてルールを迅速に複製できます。ルールが存在しない場合は、まず Data Quality モジュールでルールを作成する必要があります。詳細については、「ルールの構成:テーブル単位(単一テーブル)」をご参照ください。

    説明

    この方法では、複数のルールを一度にインポートし、テーブルレベルまたはフィールドレベルで構成できます。

    ルールのインポート をクリックします。その後、ルール ID または名前、ルールテンプレート、関連する範囲(テーブル全体または特定のテーブルフィールド)で検索し、インポートするルールを選択できます。

    image

説明

データ品質モニタリングノード を公開した後、その監視ルールの詳細を Data Quality モジュールで確認できます。ただし、Data Quality モジュールからはこれらのルールを変更または削除することはできません。

4. 実行時リソースの構成

品質ルールチェックを実行するために必要な実行時リソースを選択します。これらのリソースは、監視タスクが実行されるデータソースを決定します。デフォルトでは、監視対象のテーブルが含まれるデータソースと同じものが選択されます。

説明

異なるデータソースを選択する場合は、そのデータソースがテーブルに対する必要なアクセス権限を持っていることを確認してください。

ステップ 3:アラート処理ポリシーの構成

ノード構成ページの 品質モニタリングハンドラー セクションで、データ品質チェックによってトリガーされるアラートの処理ポリシーおよびサブスクリプション方法を構成できます。

アラートカテゴリ

アラートカテゴリ

説明

強ルールのチェック失敗

  • および は、ルールの重要度を示します。

  • 赤色異常:データ検証メトリックが異常品質の赤色しきい値範囲に達しています。この範囲は、通常、データ検証が期待通りではなく、後続のビジネス運用に深刻な影響を与えることを意味します。

  • オレンジ色異常:データ検証メトリックが異常品質のオレンジ色しきい値範囲に達しています。この範囲は、通常、データ検証が異常ですが、後続のビジネス運用には影響しないことを意味します。

  • Check Failed:検証タスクの実行に失敗しました。たとえば、監視対象のパーティションが生成されていない、または監視に使用する SQL スクリプトの実行に失敗したなどが原因です。

強ルールの赤色アラート

強ルールのオレンジ色アラート

弱ルールのチェック失敗

弱ルールの赤色アラート

弱ルールのオレンジ色アラート

アラート処理ポリシー

ルールチェックによってトリガーされるアラートの処理ポリシーを構成できます。

  • 継続:このポリシーでは、特定のアラート(たとえば、強ルールからの重大アラート)が検出された場合に、現在のノードを停止して失敗状態にするようシステムを構成できます。

    説明
    • 現在のノードが失敗した場合、後続ノードは実行されません。これにより、プロダクションパイプラインがブロックされ、問題のあるデータが伝播するのを防ぎます。

    • このポリシーでは、複数のアラートカテゴリをチェックするよう構成できます。

    • このポリシーは、アラートがダウンストリームタスクをブロックする必要がある重大な問題を示す場合に通常使用されます。

  • 無視:アラートを無視し、後続ノードの実行を継続させます。

アラートサブスクリプション方法

メールなどの通知方法を構成して、アラート通知を受信できます。アラートがトリガーされると、プラットフォームは指定されたチャネルを通じて通知を送信し、問題を迅速に検出して対応できるようにします。

説明

プラットフォームでは、UI によって異なる通知方法がサポートされています。サポートされる方法には、以下のようなものがあります。

  • メール、メールおよび SMS、電話による通知の場合、受信者として現在のアカウント配下のユーザーのみを選択できます。これらのユーザーの連絡先情報が正しいことを確認してください。詳細については、「アラート連絡先の表示および設定」をご参照ください。

  • その他の方法の場合、通知を受信するために Webhook URL を入力する必要があります。URL の取得方法については、「Webhook URL の取得」をご参照ください。

ステップ 4:タスクのスケジューリング構成

ノードタスクをスケジュール実行する必要がある場合は、ノード構成ページの右側にある プロパティ をクリックします。ビジネス要件に応じて、ノードのスケジューリング情報を構成します。詳細については、「ノードのスケジューリング構成」をご参照ください。

ステップ 5:タスクのデバッグ

タスクが期待通りに実行されることを確認するために、以下のデバッグ操作を実行できます。

  1. (任意)スケジューリング用のリソースグループを選択し、カスタムパラメーターに値を割り当てます。

    • データ品質モニタリングノードの右側で、Run Configuration をクリックし、デバッグ実行用の スケジューリングリソースグループ を構成します。

    • タスクでスケジューリングパラメーターを使用する場合、パラメーター セクションで変数に値を割り当てることができます。パラメーター割り当てのロジックについては、「タスクデバッグプロセス」をご参照ください。

  2. タスクを保存して実行します。

    タスクを保存するには、上部ツールバーの image アイコンをクリックします。タスクを実行するには、image アイコンをクリックします。

    タスクの実行が完了したら、ノード構成ページの下部で結果を確認できます。実行に失敗した場合は、エラーメッセージに基づいてトラブルシューティングを行えます。

ステップ 6:タスクの公開

ノードタスクを構成した後、それを公開する必要があります。公開後、ノードはスケジューリング構成に基づいて定期的に実行されます。

説明

データ品質モニタリングノードを公開すると、構成済みの品質ルールも同時に公開されます。

  1. 上部ツールバーの image アイコンをクリックしてノードを 保存 します。

  2. 上部ツールバーの image アイコンをクリックしてノードを 公開 します。

ノードの公開方法については、「ノードおよびワークフローのデプロイメント」をご参照ください。

次のステップ

  • タスクの O&M:タスクを公開すると、ノードのスケジューリング構成に基づいて定期的に実行されます。ノード構成ページの右上隅にある O&M をクリックして O&M センターに移動できます。そこでは、定期タスクのスケジューリングおよび実行ステータス(ノードステータスおよびトリガーされたルールの詳細を含む)を確認できます。詳細については、「定期タスクの管理」をご参照ください。

  • データ品質:データ品質モニタリングルールを公開した後、Data Quality モジュールに移動してその詳細を確認することもできます。ただし、そこではルールの変更や削除などの管理操作は実行できません。詳細については、「Data Quality」をご参照ください。