ビジネスが拡大するにつれて、データは指数関数的に増加します。これにより、一貫性のない標準を持つ膨大で複雑なデータセットが生じ、データ管理が大きな課題となります。DataWorks のインテリジェントデータモデリングサービスは、煩雑で複雑な大規模データを構造化された方法で整理し、企業データの価値を最大化するのに役立ちます。
前提条件
インテリジェントデータモデリングは、DataWorks の付加価値サービスです。この機能を使用する前に、このサービスをアクティブ化する必要があります。異なるエディションと課金基準の詳細については、「インテリジェントデータモデリングの課金」をご参照ください。
データモデリングは、PC の Chrome 69 以降でのみサポートされています。
制限事項
インテリジェントデータモデリングを使用するための権限は、DataWorks ワークスペース内のロールによって異なります。
モデル詳細の表示: Visitor、スペース管理者、Model Designer、Project Owner を含む DataWorks ワークスペースのすべてのロールが、データモデルを表示できます。
モデル情報の編集: スペース管理者、Development Personnel、O&M Personnel、または Model Designer ロールを持つユーザーのみがデータモデルを編集できます。
データモデルの公開: データモデルを公開できるのは、スペース管理者 ロールまたは O&M Personnel ロールを持つユーザーのみです。
これらの操作を実行するには、対象ユーザーに必要なロールを付与します。権限を付与する方法の詳細については、「ワークスペース内のモジュールに対する権限の管理」をご参照ください。
概要
DataWorks のデータモデリングは、データウェアハウス計画、データ標準の確立、ディメンショナルモデリング、およびデータメトリクスの定義をサポートしています。DataWorks のデータモデリングを使用することで、設計したディメンションテーブル、ファクトテーブル、および集計テーブルをコンピュートエンジンに具現化し、さらなるアプリケーションに活用できます。

Data Warehouse Planning
DataWorks を使用してデータモデリングを行う場合、データウェアハウス計画ページでデータレイヤー、ビジネスカテゴリ、データドメイン、サブジェクトエリア、およびビジネスプロセスを設計できます。
Data Layer
ビジネスおよびデータシナリオに基づいて、データウェアハウスのデータレイヤーを設計できます。DataWorks は、業界で一般的なデフォルトの5層アーキテクチャを提供しています。
Operational Data Store (ODS)
Data Warehouse Detail (DWD)
Data Warehouse Summary (DWS)
Application Data Service (ADS)
Dimension (DIM)
ビジネスニーズを満たすために、他のデータレイヤーを作成することもできます。データレイヤーを作成する方法については、「カスタムデータレイヤーの作成」をご参照ください。
Business Category
ビジネスが複雑で、異なるビジネスタイプが自身のデータを迅速に特定する方法を必要とする場合、異なるビジネスカテゴリを定義できます。その後、モデリング中にこれらのカテゴリを対応するディメンションテーブルとファクトテーブルに関連付けることができます。ビジネスカテゴリを作成する方法については、「ビジネスカテゴリ」をご参照ください。
Data Domain
データドメインは、高レベルのデータ分類標準です。これは、抽象化および洗練されたビジネスプロセスのコレクションであり、ビジネスユーザーが大規模なデータセットから関連データを迅速に特定するのに役立ちます。
データドメインはビジネス分析のために設計されています。各データドメインは、調達、サプライチェーン、人事、またはEコマースなどのマクロレベルの分析領域に対応します。データアーキテクトやモデリングチームメンバーのような統一されたチームまたは個人が、データドメインを管理および定義する必要があります。これらのデザイナーは、ビジネスプロセスを適切に解釈および抽象化するために、ビジネスに対する深い理解を持っている必要があります。DataWorks でデータドメインを計画および構築する方法については、「データドメイン」をご参照ください。
Business Process
ビジネスプロセスは、ビジネスアクティビティフローを記述します。たとえば、Eコマースでは、カートへの商品の追加、注文、および支払いがそれぞれビジネスプロセスになり得ます。一般的なユースケースはファネル分析であり、購入ジャーニーは商品の閲覧、カートへの追加、注文、支払い、受領確認などのステップに分解されます。各段階での注文数を追跡することで、ファネル全体で「注文数」メトリックを分析できます。DataWorks でビジネスプロセスを作成する方法については、「ビジネスプロセス」をご参照ください。
データマート
データマートは、特定のビジネスカテゴリの詳細なビジネステーマを定義します。サブジェクトエリアを使用して、異なる分析視点からデータをパーティション分割し、最終的にビジネスアプリケーションと統計分析に役立ちます。例としては、運用プラットフォームのデータマートがあります。詳細については、「データマート」をご参照ください。
サブジェクトエリア
サブジェクトエリアは、異なる分析視点に基づいてデータマートを分割するために使用されます。これは、密接に関連するデータテーマのコレクションです。ビジネスフォーカスに基づいて、これらのテーマを異なるサブジェクトエリアにグループ化できます。たとえば、Eコマースにおける一般的なサブジェクトエリアには、トランザクション、メンバー、およびプロダクトが含まれます。詳細については、「サブジェクトエリア」をご参照ください。
Data Standard
DataWorks のデータモデリングでは、モデリングを開始する前にデータ標準を定義したり、時間の経過とともにビジネスプラクティスからデータ標準を開発したりできます。ルックアップテーブル、測定単位、フィールド標準、および命名辞書を標準化することで、モデリングおよびアプリケーション中のデータ処理の一貫性を確保できます。
たとえば、登録テーブルとログインテーブルの2つのテーブルを考えてみましょう。登録テーブルにはuser_idという名前のフィールドにメンバー ID が保存され、ログインテーブルには同じ情報がuseridという名前のフィールドに保存されています。これを解決するには、メンバー ID の統一されたフィールド標準を作成できます。この標準は、データ処理用のルックアップテーブルを指定し、フィールドプロパティ (データの型、長さ、デフォルト値など) を定義し、測定単位を設定できます。このフィールド標準が作成されると、将来のすべてのモデルでメンバー ID フィールドに関連付けることができ、すべてのテーブル間での一貫性が確保されます。
DataWorks でフィールド標準を作成する方法については、「フィールド標準」をご参照ください。
Dimensional Modeling
DataWorks のデータモデリングの理念は、ディメンショナルモデリングの原則に従います。ディメンショナルモデリング機能を使用してデータウェアハウスを設計する場合:
Dimension Table
ビジネスのデータドメイン計画に基づいて、データ分析のための潜在的なディメンションを抽出し、それらとその属性をディメンションテーブルに保存できます。たとえば、Eコマースデータ分析では、注文ディメンション (注文 ID、作成時間、購入者 ID、販売者 ID など)、ユーザーディメンション (性別、生年月日)、プロダクトディメンション (プロダクト ID、名前、発売時間) などが役立つディメンションと属性です。注文、ユーザー、およびプロダクトのディメンションテーブルを作成でき、ディメンション属性はテーブルのフィールドとして保存されます。その後、これらのテーブルをデータウェアハウスにデプロイし、ETL ジョブを使用してテーブル定義に従って実際のディメンションデータを保存することで、ビジネスアナリストがすぐに利用できるようにすることができます。
Fact Table
ビジネスプロセス計画に従って、各プロセス中に生成されるファクトデータを特定および整理し、これらのフィールドをファクトテーブルに保存できます。たとえば、「注文」ビジネスプロセスの場合、このプロセス中に生成されたデータ (注文 ID、作成時間、プロダクト ID、数量、金額など) を記録するための対応するファクトテーブルを作成できます。その後、これらのファクトテーブルをデータウェアハウスにデプロイし、ETL ジョブを使用してテーブル定義に従って実際のデータを統合および保存することで、ビジネス分析にアクセス可能にすることができます。
Aggregate Table
ビジネス分析のニーズとデータウェアハウスレイヤーに基づいて、詳細なファクトデータとディメンションデータを集計テーブルに事前集計できます。その後のデータ分析では、より粒度の高いファクトテーブルとディメンションテーブルではなく、集計テーブルを直接クエリできます。
Application Table
アプリケーションテーブルは、特定のビジネスシナリオのために設計されており、同じ期間とディメンションを共有する複数のアトミックメトリックと派生メトリックを整理します。これは、ビジネスクエリ、OLAP 分析、およびデータ分布の基盤として機能します。ビジネスアプリケーションのニーズに基づいてアプリケーションテーブルを設計できます。
Reverse Modeling
リバースモデリングは、主に他のツールによって生成されたモデルを DataWorks のディメンショナルモデリングモジュールにインポートするために使用されます。たとえば、既存のモデルがあり、DataWorks のインテリジェントモデリングに切り替えたい場合、リバースモデリング機能を使用できます。この機能は既存のモデルを迅速にインポートし、それらを再モデリングするのにかかる相当な時間と労力を節約します。
ディメンションテーブル、ファクトテーブル、および集計テーブルを作成する方法については、「論理モデルの作成:ディメンションテーブル」、「論理モデルの作成:ファクトテーブル」、「論理モデルの作成:集計テーブル」、および「論理モデルの作成:アプリケーションテーブル」をご参照ください。リバースモデリングの詳細については、「リバースモデリング:物理テーブルのリバース」をご参照ください。
Data Metrics
DataWorks のデータモデリングは、統一されたメトリックシステムを構築できるデータメトリック機能を提供します。
メトリックシステムは、Atomic Metric、Modifier、Period、およびDerived Metricで構成されています。
Atomic Metric:ビジネスプロセスに基づいたメジャー。たとえば、「支払い」プロセスにおける「支払い金額」などです。
Modifier:メトリックの範囲を制限する修飾子。たとえば、「支払い金額」統計を「マタニティおよびベビー用品」に制限するなどです。
Period:メトリックの期間または時点。たとえば、「過去7日間」で計算される「支払い金額」を指定するなどです。
Derived Metric:アトミックメトリック、修飾子、および期間の組み合わせ。たとえば、「過去7日間のマタニティおよびベビー用品の合計支払い金額」などです。
メトリックシステムを作成する方法については、「データメトリクス」をご参照ください。
データモデリングの重要性
大規模データの標準化された管理
ビジネスが大きくなるほど、データ構造はより複雑になります。ビジネスが成長するにつれて、データ量は急速に増加します。このデータを構造化された秩序ある方法で管理および保存することは、すべての企業にとっての課題です。
データサイロの解消と接続性の実現
データが異なる業務部門や部署によって個別に管理されると、データサイロが形成されます。これにより、意思決定者が全社的なデータの明確かつ迅速な概要を把握することが妨げられます。これらのデータサイロを解消することは、企業データ管理における主要な課題です。
柔軟な統合のための統一されたデータ標準
同じデータに対する異なる記述は、管理の困難さ、コンテンツの重複、および不正確な結果につながります。既存のシステムアーキテクチャを中断することなく統一されたデータ標準を確立することは、アップストリームおよびダウンストリームサービスとの柔軟な統合を可能にする鍵です。
データ価値とビジネス利益の最大化
効果的なデータモデリングにより、企業データを最大限に活用し、その価値を最大化し、ビジネスにより効率的なデータサービスを提供できます。