マテリアライズ構成は、論理ディメンションテーブルと論理ファクトテーブルのライフサイクル、パーティションフィールド、およびカスタムパラメーターを設定するために使用されます。 これにより、マテリアライズテーブルの数とこれらのテーブル内のフィールド分散を手動で指定できるようになり、自動生成モデルのデータクエリパフォーマンスとリソース効率が向上します。 このトピックでは、論理ディメンションテーブルと論理ファクトテーブルのマテリアライズパラメーターを構成する手順の概要を説明します。
前提条件
プライマリキーを持つ論理ディメンションテーブルまたは論理ファクトテーブルが必要です。
手順
詳細については、「参照ドキュメント」をご参照ください。また、[データ開発] ページに移動します。
[データ開発] ページで、以下の図の手順に従って [マテリアライズ構成] パネルにアクセスします。
[開発] プロジェクトまたは [基本]([data_distill] 以外)プロジェクトに属しており、それがお客様のデータ開発スペースである場合、プロジェクトスペースを選択する必要はありません。

[マテリアライズ構成] パネルで、次のようにパラメーターを設定します。
領域
説明
[パーティションとライフサイクル]
[派生指標パーティション]: 定期スナップショットファクトテーブル、累積スナップショットファクトテーブル、および標準論理ディメンションテーブルにのみ適用されます。
[最大パーティション (MAX_PT)]: 最大パーティションは、最新の完全スナップショットデータを保持します。 派生指標の計算に最大パーティションを使用すると、ライフサイクルを短縮し、ストレージリソースを節約できます。
[データタイムスタンプ (bizdate)]: データタイムスタンプパーティションを使用して派生指標を計算すると、データの整合性が強化されますが、これらの計算のために履歴パーティションを保持する必要があります。
[ライフサイクル]: ストレージライフサイクルを定義します。最大 36500 日です。 このしきい値以上の値は、自動的に永続ストレージに変換されます(36500 日として表示されます)。
システムは、[7]、[14]、[30]、[365] 日など、ストレージライフサイクルのクイック選択を提供します。
[分散キー]
StarRocks コンピュートエンジンの場合、分散キーを構成します。 カーディナリティが高く、クエリ条件で頻繁に使用されるフィールドを選択してください。理想的には 3 つ以下のフィールドです。 分散キーの順序は、ストレージとクエリの効率に影響します。
説明論理テーブルにプライマリキーがある場合、それは自動的にデフォルトの分散キー(重複キー)として機能します。
[カスタムマテリアライズ]
これを有効にすると、マテリアライズテーブルの数やそれらの中のフィールド分散など、マテリアライズ構成を調整できます。
説明注: カスタムマテリアライズが有効になっている場合、新しいフィールドを追加するには、マテリアライズテーブルで手動で指定する必要があります。
カスタムマテリアライズ構成を有効にした後、次の手順に従ってマテリアライズポリシーを定義します。
(オプション) マテリアライズ構成ダイアログで、迅速なセットアップのために [初期化ポリシー] を選択します。
クイック初期化オプションには次のポリシーが含まれますが、手動調整も可能です。
[単一マテリアライズテーブル]: すべてのフィールドを 1 つのマテリアライズテーブルに統合します。
[バランス行ポリシー]: マテリアライズテーブルを生産間隔に基づいてセグメント化することにより、生産時間とクエリパフォーマンスのバランスを取ります。
[生産ラインポリシー]: システムのデフォルトの初期化ポリシーに従います。
重要注意: 初期化ポリシーを変更すると、以下の構成がリセットされます。 慎重に行ってください。
アイコンをクリックして、展開されたマテリアライズテーブルに割り当てるフィールドを追加し、[OK] をクリックします。[フィルター] を使用して、目的のマテリアライズテーブルをすばやく選択します。
新しいマテリアライズテーブルに追加するには、[マテリアライズテーブルの追加] をクリックします。
構成後:
[マテリアライズ結果] には、[割り当てられたフィールド]、[マテリアライズテーブルの数]、および [割り当てるフィールド] が表示されます。
[マテリアライズ構成の表示] をクリックして、構成の詳細を表示します。
[本番環境マテリアライズ比較] をクリックして、本番環境マテリアライズを現在の編集ポリシーと比較します。
[マテリアライズコスト] 比較では、[マテリアライズテーブルの数]、[冗長ストレージフィールドの数]、および [ダウンストリームクエリアソシエーションの数] の違いが強調表示され、[現在のポリシー] と [生産ラインポリシー] の間の絶対変化値が示されます。
説明[冗長ストレージフィールド] という用語は、複数のマテリアライズテーブルに格納されているフィールドの数を指します。 [ダウンストリームクエリアソシエーション] は、論理テーブルの直接のダウンストリーム参照に基づくアソシエーションの数を示します。
[フィールド生産時間] 比較では、[現在のポリシー] と [生産ラインポリシー] の下での各フィールドの生産時間の絶対変化がマークされます。
説明生産ラインのフィールド生産時間は過去 7 日間の平均であり、現在のポリシーの時間は計算値です。
[高度なマテリアライズ構成]
Dataphin システムに現在リンクされているコンピュートエンジンの属性に合わせたカスタムパラメーターを定義します。 詳細については、「参照ドキュメント」をご参照ください。
完了するには、[OK] をクリックします。