集計テーブルは、単一のデータドメイン内の複数の派生メトリクスから得られる統計データを、一貫した期間と共有ディメンションを使用して整理します。ビジネス上のクエリ、OLAP 分析、データ分布をサポートします。このトピックでは、集計テーブルの作成方法について説明します。
仕組み
集計テーブルは、データドメイン内の複数の派生メトリクスを、期間および関連ディメンションを用いて集約します。これらの関連ディメンション、期間、派生メトリクスから、レポート作成や分析に用いるための統計フィールドが集計テーブル内に生成されます。
前提条件
データ層が作成済みであること。データ層を定義することで、同様の機能を持つテーブルを単一のレイヤーにまとめ、アクセスを容易にできます。集計テーブルは通常、データウェアハウスサマリー (DWS) 層に配置され、特定の統計粒度 (ディメンションやディメンションの組み合わせなど) の下で複数の派生メトリクスを集約・出力し、その後のビジネスクエリやデータ分布をサポートします。ビジネスニーズに応じて、集計テーブルを他のデータ層に配置することも可能です。データ層の作成方法の詳細については、「データウェアハウス層の定義」をご参照ください。
データドメインが作成済みであること。集計テーブルは、モデリング対象のビジネスプロセスを定義する Data Domain に基づいています。詳細については、「データドメイン」をご参照ください。
統計データの時間範囲を定義する期間が作成済みであること。
集計テーブルの作成
データモデリングページに移動します。
DataWorks コンソールにログインします。上部のナビゲーションバーで、対象のリージョンを選択します。左側のナビゲーションウィンドウで、 を選択します。表示されたページで、ドロップダウンリストから対象のワークスペースを選択し、[データモデリングへ] をクリックします。
[Data Modeling]ページの上部メニューバーで、Dimensional Modelingをクリックして、Dimensional Modelingページに移動します。
集計テーブルを作成します。
「Dimensional Modeling」ページで、「
」アイコンにマウスを合わせ、「」をクリックします。集計テーブルの基本情報を設定します。

パラメーター
説明
例
Data Layer
集計テーブルのデータ層です。デフォルトでは、Common Layer の DWS レイヤーが選択されています。ビジネスニーズに基づいて、集計テーブルを他のデータ層に配置することもできます。データレイヤーの作成方法の詳細については、「データウェアハウスレイヤーを定義する」をご参照ください。
DWS
Business Category
業務カテゴリを選択します。詳細については、「業務カテゴリ」をご参照ください。
販売
Data Domain
集計テーブルのデータドメイン。集約された統計データの主題を決定します。詳細については、「データドメイン」をご参照ください。
説明各集計テーブルは、1 つのデータドメインにのみ属することができます。
取引
Granularity
既存のディメンションを選択します。ディメンションの作成方法については、「概念モデルの作成:ディメンション」をご参照ください。
注文タイプ
Period
集約された統計データの時間範囲 (例:過去 1 日、過去 1 週間) 。
既存の期間から選択する必要があります。ニーズを満たす既存の期間がない場合は、新しく作成できます。詳細については、「期間」をご参照ください。
1w (過去 7 日間)
[修飾子]
統計データのビジネス範囲。
既存の修飾子から選択する必要があります。ニーズを満たす既存の修飾子がない場合は、新しく作成できます。詳細については、「修飾子」をご参照ください。
オンラインストア
Naming Rule
テーブルの命名規則を適用するためのチェッカーを選択します。データウェアハウス計画時にデータ層で作成したチェッカーを選択できます。詳細については、「データ層チェッカーの設定」および「チェッカーの使用」をご参照ください。
-
[テーブル名]
集計テーブルの名前。命名規則が設定されている場合、テーブル名はその規則に従う必要があります。
dws_trade_buyer_subpay_1d[表示名]
テーブルの表示名。
購入者取引分割払い集計テーブル
Lifecycle
テーブルのライフサイクル (日数) 。
90 日
所有者
集計テーブルのオーナー。デフォルトでは、テーブルを作成したユーザーになります。
-
Description
テーブルの説明。
-
左上隅にある Save をクリックします。
テーブルへのフィールドの追加
テーブルにフィールドを追加するには、Shortcut Mode または Script Mode を使用できます。Shortcut Mode では、以下のインポート方法を使用できます:
Import from Table/View: コンピュートエンジン内の既存の物理テーブルまたはビューからフィールドをインポートします。 [既存のテーブル/ビューの検索] ドロップダウンリストから、フィールドをインポートするテーブルまたはビューを検索して選択します。
説明サポートされているのは、MaxCompute、Hologres、または E-MapReduce (EMR) Hive エンジンのテーブルまたはビューのみです。
Import from Metrics: データメトリクスからメトリクスを選択して、モデルフィールドとして追加します。
ショートカットモード: テーブル/ビューからインポート
Shortcut Mode セクションで、Import from Table/View の横にある Expand をクリックします。
「[既存のテーブル/ビューの検索]」検索ボックスに名前を入力して、対応するテーブルまたはビューを検索および選択します。テーブルまたはビューを選択すると、そのすべてのフィールド、または一部のフィールドをインポートできます。
説明あいまい一致がサポートされています。キーワードを入力して、名前にそのキーワードを含むすべてのテーブルまたはビューを検索できます。
本番環境のテーブルのみを検索できます。開発環境のテーブルはサポートされていません。
アイコンは、すべてのフィールドをインポートします。
アイコンは、選択したフィールドをインポートします。
一部のフィールドをインポートする場合、選択したテーブルのフィールドが表示されたダイアログボックスが開きます。追加するフィールドを選択し、Import をクリックします。
インポートされたフィールドのField Display Nameが空の場合、プロンプトに従ってフィールドの説明を入力できます。
ショートカットモード: メトリクスからインポート

「Shortcut Mode」セクションで、「Quick Import」を「Import from Metrics」の横でクリックします。
ダイアログボックスが開き、提出済みのすべての Derived Metric および Composite Metric が表示されます。これらのメトリックを選択して、集計テーブルのフィールドとして追加できます。
ダイアログボックスの下部にあるImportをクリックします。
スクリプトモード
FML 文を使用して、フィールド、関連付け、パーティションを作成することもできます。詳細については、「スクリプトモードでのモデリング」をご参照ください。
Script Modeでは、コードを使用してモデルを定義できます。 Script Modeをクリックすると、構成に基づいて自動生成されたモデリング言語を含むダイアログボックスが開きます。 ダイアログボックスでモデル情報を変更できます。 完了したら、OK をクリックします。
フィールド情報の設定
モデルにフィールドを追加した後、Associated Field、Redundant Field、およびAssociated Granularity/Metricなどのプロパティを設定できます。
フィールドプロパティを設定します。
デフォルトでは、フィールドリストには、Field Name、[タイプ]、Field Display Name、Description、Primary Key、[空でない]、Measurement Unit、および Actions などの基本的なプロパティが表示されます。フィールドリストの右上隅にある Field Display Settings をクリックすると、表示するフィールドプロパティを選択し、必要に応じて変更できます。
フィールドを[フィールド標準]に関連付けます。
フィールドをフィールド標準に関連付けることで、その内容と値の範囲を標準化できます。
[フィールド標準] は、意味は同じでもフィールド名が異なるデータを一元的に管理し、値の範囲、測定単位などを定義します。
Redundant Field を設定します。
ディメンションモデリングの従来のスタースキーマでは、ストレージ消費を削減するために、ディメンションはディメンションテーブルに格納され、ファクトテーブルの外部キーを介してアクセスされます。DataWorks のスマートデータモデリングでは、頻繁に使用されるフィールド (ユーザー ID や一般的な分析ディメンションなど) を冗長フィールドとして追加できます。このアプローチにより、クエリのパフォーマンスが向上し、データ取得が簡素化され、テーブル結合が削減されます。
フィールドのActions 列で、Redundant Field をクリックして、そのフィールドの関連フィールドを設定します。

[関連付けタイプ]を設定します。
各フィールドの Association Type を設定して、集計テーブルおよびアプリケーションテーブルにおけるその値の統計的タイプを指定できます。利用可能なタイプは、Statistical Granularity、Derived/Composite Metric、および Atomic Metric です。
Statistical Granularity: フィールドをディメンションテーブルおよびそのディメンションテーブル内のフィールド(例: プロダクトディメンションやセラー ディメンション)に関連付けます。
Derived/Composite Metric:フィールドで集計される統計値のメトリックを指定します。たとえば、過去 7 日間の Freshippo アプリで発注された注文の支払総額などです。
Atomic Metric: フィールドに集計される統計値のアトミックメトリクスを指定します。たとえば、注文の支払額です。
説明テーブルからインポートされたフィールドやスクリプトモードで追加されたフィールドには、デフォルトの関連タイプがありません。これらのフィールドには手動で関連タイプを設定できます。
関連付けタイプを設定した後、フィールドリストの右上隅にあるField Associationセクションで、関連付けられたオブジェクトを指定できます。
構成を完了したら、左上隅のSaveをクリックします。
次のステップ
テーブルを作成した後、そのフィールド管理、関連付け、およびパーティション設定を行い、対応する環境にテーブルを公開します。詳細については、次のトピックをご参照ください。