すべてのプロダクト
Search
ドキュメントセンター

DataWorks:データ品質: エンドツーエンドのデータ品質監視

最終更新日:Jan 11, 2025

DataWorks データ品質は、エンドツーエンドのデータ品質監視サービスです。 35 の組み込みテーブルレベルおよびフィールドレベルのデータ品質監視テンプレートを提供し、カスタムデータ品質監視テンプレートを作成できます。

DataWorks データ品質を使用すると、ソースデータの変更や、抽出、変換、ロード (ETL) プロセス中に生成されるダーティデータを早期に検出するための監視ルールを作成できます。 データ品質は、ダーティデータを含むノードの実行をブロックし、ダーティデータが子孫ノードに拡散するのを効果的に阻止します。
説明 ETL は、ソースから宛先にデータを抽出し、変換し、ロードするプロセスです。

データ品質は、データセット内のデータを監視し、MaxCompute テーブルと DataHub トピックを監視できます。 オフラインの MaxCompute データが変更されると、データ品質はそのデータをチェックし、そのデータを使用するノードをブロックします。 これにより、ダウンストリームデータがダーティデータの影響を受けるのを防ぎます。 さらに、データ品質では、チェック結果の履歴を管理できるため、データ品質を分析および評価できます。 詳細については、「データ品質の概要」をご参照ください。

データ品質は、次の問題の解決に役立ちます:
  • 頻繁なデータベースの変更
  • 頻繁なビジネスの変更
  • データ定義
  • ビジネスシステムのダーティデータ
  • システムインタラクションによって発生するデータ品質の問題
  • データリビジョンによって発生する問題
  • データウェアハウスのデータ品質の問題