DataWorks を使用してデータモデリングを行う際、データウェアハウスアーキテクトまたはモデリングチームのメンバーは、データウェアハウス計画ページでアーキテクチャを定義できます。これには、データウェアハウスの階層化、ビジネスカテゴリ、データドメイン、ビジネスプロセス、データマート、および主題領域の設計が含まれます。設計が完了すると、これらの要素は、モデルを管理するための構造化された階層型でドメイン駆動型のアプローチを提供します。
計画の概要
データモデリングを開始する前に、データウェアハウスアーキテクトは、データ開発チームおよびモデル設計チームと協力して、ビジネスとデータを包括的に分析し、全体的なデータ構造を定義する必要があります。データウェアハウス計画の段階では、モデルの階層型およびドメインベースの管理を可能にするために、以下のコア設計を完了する必要があります。
[ビジネスカテゴリ] は、E コマースや金融などの複雑なビジネスシナリオにおける垂直方向の区分です。
[データドメイン] と [ビジネスプロセス] は、主要なビジネスワークフローの抽象化です。
[データマート] と [主題領域] は、特定のビジネスシナリオにおけるデータ集約を表します。
データウェアハウスのレイヤリング: データウェアハウスの論理的なレイヤリングで、運用データストア (ODS)、ディメンションレイヤー (DIM)、データウェアハウス詳細 (DWD)、データウェアハウス要約 (DWS)、およびアプリケーションデータサービス (ADS)を含みます。
ビジネス視点での計画
ビジネスカテゴリ、データドメイン、およびデータマートは、ビジネス駆動型の管理フレームワークを形成します。このフレームワークは、データ所有権 (ビジネスカテゴリ) の分割、コアビジネスアクティビティ (データドメイン) の定義、およびシナリオベースのデータサービス (データマート) の整理により、データ生成から消費までの完全なバリューチェーンを作成します。データウェアハウスの階層化は、このフレームワークをサポートする技術駆動型のデータ処理パイプラインです。これは、これらのレイヤー全体でデータを生データからサービス対応状態に洗練します。
Business Category: ビジネスの最高レベルの区分です。例としては、E コマース、金融、リテールなどの実際の業務部門があります。
Data Domain: ビジネスプロセスを抽象化、洗練、グループ化する高レベルのデータ分類標準です。データは通常、ビジネスタイプ、データソース、データ目的など、複数の要因に基づいてドメインに分割されます。単一のデータドメインは、複数のビジネスカテゴリに適用できます。たとえば、トランザクションドメインは、E コマースと金融の両方のビジネスカテゴリでトランザクションシナリオにサービスを提供できます。
Business Process: データドメイン内の特定のビジネスアクティビティです。たとえば、トランザクションドメインには、注文の発注や支払いなどのビジネスプロセスを含めることができます。データドメインには複数のビジネスプロセスを含めることができます。
Data Mart: 運用プラットフォームマートなど、特定のビジネスシナリオ向けのデータエンドポイントです。
Subject Area: 製品分析やユーザー行動など、分析視点に基づいてデータマートをトピックに分割する方法です。データマートには複数の主題領域を含めることができます。
技術視点での計画
DataWorks は、ほとんどの開発ニーズに適した、デフォルトの業界標準の 5 層データウェアハウス アーキテクチャ(ODS、DIM、DWD、DWS、および ADS)を提供します。また、特定のビジネス要件に合わせて、Data Layer モジュールでカスタム レイヤーを設計することもできます。
レイヤーグループ | データウェアハウスレイヤー | 略称 | 説明 | モデルタイプ | メトリックタイプ |
Data Import Layer | Operational Data Store | ODS | ソースシステムと同一のスキーマで生データを受信・処理します。 | ソーステーブル | - |
Common Layer | Dimension Layer | DIM | エンタープライズ全体で一貫性のあるディメンションテーブルを構築します。 | ディメンションテーブル、ディメンション | アトミックメトリック |
Data Warehouse Detail | DWD | 詳細データ用のファクトテーブルをワイドテーブルとして構築します。 | ファクトテーブル | アトミックメトリック | |
Data Warehouse Summary | DWS | 一般的な粒度で集計メトリックを構築します。 | 集計テーブル | アトミックメトリック、コンポジットメトリック、導出メトリック | |
Application Layer | Application Data Service | ADS | カスタム統計メトリックを格納します。 | アプリケーションテーブル、ディメンションテーブル、ディメンション | コンポジットメトリック、導出メトリック |
データウェアハウスの階層化は、データウェアハウス計画における重要な技術管理手法です。これは、すべてのビジネスカテゴリ、データドメイン、およびデータマートにまたがるデータウェアハウス全体の垂直構造を作成します。各レイヤーは、これらのビジネスカテゴリとデータドメイン、またはデータマートにマッピングされます。
実装の推奨事項
カスタム計画と設計
特定の企業要件を満たし、データウェアハウス計画をカスタマイズする必要がある場合は、まずビジネス目標を定義し (例: 「メンバー成長分析」はメンバードメインに属します)、次に技術ソリューションを設計します (例: DWD メンバーファクトテーブルを設計します)。
ビジネスカテゴリ、データドメイン、およびデータマートを計画します。
5層アーキテクチャに基づいてテーブルストレージレイヤーを設計します。
チェッカーを使用して、各レイヤーの命名を標準化します。
複雑な企業向けに、アーキテクチャを再利用するために、モデリング スペース を有効化します。