DataWorks データ品質は、エンドツーエンドのデータ品質監視サービスです。 35 の組み込みテーブルレベルおよびフィールドレベルのデータ品質監視テンプレートを提供し、カスタムデータ品質監視テンプレートを作成できます。
DataWorks データ品質を使用すると、ソースデータの変更や、抽出、変換、ロード (ETL) プロセス中に生成されるダーティデータを早期に検出するための監視ルールを作成できます。 データ品質は、ダーティデータを含むノードの実行をブロックし、ダーティデータが子孫ノードに拡散するのを効果的に阻止します。
説明 ETL は、ソースから宛先にデータを抽出し、変換し、ロードするプロセスです。
データ品質は、データセット内のデータを監視し、MaxCompute テーブルと DataHub トピックを監視できます。 オフラインの MaxCompute データが変更されると、データ品質はそのデータをチェックし、そのデータを使用するノードをブロックします。 これにより、ダウンストリームデータがダーティデータの影響を受けるのを防ぎます。 さらに、データ品質では、チェック結果の履歴を管理できるため、データ品質を分析および評価できます。 詳細については、「データ品質の概要」をご参照ください。
データ品質は、次の問題の解決に役立ちます:
- 頻繁なデータベースの変更
- 頻繁なビジネスの変更
- データ定義
- ビジネスシステムのダーティデータ
- システムインタラクションによって発生するデータ品質の問題
- データリビジョンによって発生する問題
- データウェアハウスのデータ品質の問題