すべてのプロダクト
Search
ドキュメントセンター

Dataphin:論理テーブルのマテリアライズ構成のディメンションとファクト

最終更新日:Feb 06, 2025

マテリアライズ構成は、論理ディメンションテーブルと論理ファクトテーブルのライフサイクル、パーティションフィールド、およびカスタムパラメーターを設定するために使用されます。 これにより、マテリアライズテーブルの数とこれらのテーブル内のフィールド分散を手動で指定できるようになり、自動生成モデルのデータクエリパフォーマンスとリソース効率が向上します。 このトピックでは、論理ディメンションテーブルと論理ファクトテーブルのマテリアライズパラメーターを構成する手順の概要を説明します。

前提条件

プライマリキーを持つ論理ディメンションテーブルまたは論理ファクトテーブルが必要です。

手順

  1. 詳細については、「参照ドキュメント」をご参照ください。また、[データ開発] ページに移動します。

  2. [データ開発] ページで、以下の図の手順に従って [マテリアライズ構成] パネルにアクセスします。

    [開発] プロジェクトまたは [基本][data_distill] 以外)プロジェクトに属しており、それがお客様のデータ開発スペースである場合、プロジェクトスペースを選択する必要はありません。

    物化配置

  3. [マテリアライズ構成] パネルで、次のようにパラメーターを設定します。

    領域

    説明

    [パーティションとライフサイクル]

    • [派生指標パーティション]: 定期スナップショットファクトテーブル、累積スナップショットファクトテーブル、および標準論理ディメンションテーブルにのみ適用されます。

    • [最大パーティション (MAX_PT)]: 最大パーティションは、最新の完全スナップショットデータを保持します。 派生指標の計算に最大パーティションを使用すると、ライフサイクルを短縮し、ストレージリソースを節約できます。

    • [データタイムスタンプ (bizdate)]: データタイムスタンプパーティションを使用して派生指標を計算すると、データの整合性が強化されますが、これらの計算のために履歴パーティションを保持する必要があります。

    • [ライフサイクル]: ストレージライフサイクルを定義します。最大 36500 日です。 このしきい値以上の値は、自動的に永続ストレージに変換されます(36500 日として表示されます)。

      システムは、[7][14][30][365] 日など、ストレージライフサイクルのクイック選択を提供します。

    [分散キー]

    StarRocks コンピュートエンジンの場合、分散キーを構成します。 カーディナリティが高く、クエリ条件で頻繁に使用されるフィールドを選択してください。理想的には 3 つ以下のフィールドです。 分散キーの順序は、ストレージとクエリの効率に影響します。

    説明

    論理テーブルにプライマリキーがある場合、それは自動的にデフォルトの分散キー(重複キー)として機能します。

    [カスタムマテリアライズ]

    これを有効にすると、マテリアライズテーブルの数やそれらの中のフィールド分散など、マテリアライズ構成を調整できます。

    説明

    注: カスタムマテリアライズが有効になっている場合、新しいフィールドを追加するには、マテリアライズテーブルで手動で指定する必要があります。

    カスタムマテリアライズ構成を有効にした後、次の手順に従ってマテリアライズポリシーを定義します。

    1. (オプション) マテリアライズ構成ダイアログで、迅速なセットアップのために [初期化ポリシー] を選択します。

      クイック初期化オプションには次のポリシーが含まれますが、手動調整も可能です。

      • [単一マテリアライズテーブル]: すべてのフィールドを 1 つのマテリアライズテーブルに統合します。

      • [バランス行ポリシー]: マテリアライズテーブルを生産間隔に基づいてセグメント化することにより、生産時間とクエリパフォーマンスのバランスを取ります。

      • [生産ラインポリシー]: システムのデフォルトの初期化ポリシーに従います。

      重要

      注意: 初期化ポリシーを変更すると、以下の構成がリセットされます。 慎重に行ってください。

    2. 移动 アイコンをクリックして、展開されたマテリアライズテーブルに割り当てるフィールドを追加し、[OK] をクリックします。

      • [フィルター] を使用して、目的のマテリアライズテーブルをすばやく選択します。

      • 新しいマテリアライズテーブルに追加するには、[マテリアライズテーブルの追加] をクリックします。

      構成後:

      • [マテリアライズ結果] には、[割り当てられたフィールド][マテリアライズテーブルの数]、および [割り当てるフィールド] が表示されます。

      • [マテリアライズ構成の表示] をクリックして、構成の詳細を表示します。

      • [本番環境マテリアライズ比較] をクリックして、本番環境マテリアライズを現在の編集ポリシーと比較します。

        • [マテリアライズコスト] 比較では、[マテリアライズテーブルの数][冗長ストレージフィールドの数]、および [ダウンストリームクエリアソシエーションの数] の違いが強調表示され、[現在のポリシー][生産ラインポリシー] の間の絶対変化値が示されます。

          説明

          [冗長ストレージフィールド] という用語は、複数のマテリアライズテーブルに格納されているフィールドの数を指します。 [ダウンストリームクエリアソシエーション] は、論理テーブルの直接のダウンストリーム参照に基づくアソシエーションの数を示します。

        • [フィールド生産時間] 比較では、[現在のポリシー][生産ラインポリシー] の下での各フィールドの生産時間の絶対変化がマークされます。

          説明

          生産ラインのフィールド生産時間は過去 7 日間の平均であり、現在のポリシーの時間は計算値です。

    [高度なマテリアライズ構成]

    Dataphin システムに現在リンクされているコンピュートエンジンの属性に合わせたカスタムパラメーターを定義します。 詳細については、「参照ドキュメント」をご参照ください。

  4. 完了するには、[OK] をクリックします。