このトピックでは、DataStudioを使用して数回クリックするだけでMaxComputeデータをHologresにインポートする方法について説明します。
前提条件
HologresデータソースがDataWorksワークスペースに追加され、DataStudioに関連付けられています。 詳細については、「Hologresインスタンスをワークスペースに関連付ける」をご参照ください。
背景情報
DataStudioでは、[数回クリックするだけでmaxcomputeデータをインポートする] ことができます。 MaxComputeデータをインポートし、インポートされたデータに対して視覚的にクエリを実行できます。 この方法は、データクエリ用の外部テーブルを作成する方法よりも優れたパフォーマンスを提供します。
SQLステートメントを実行してMaxComputeデータをインポートすることもできます。 詳細については、「SQLステートメントを実行してMaxComputeからHologresにデータをインポートする」をご参照ください。
手順
[maxcomputeからのデータ同期] ノードを作成します。
DataStudioページに移動します。
DataWorksコンソール にログインします。 上部のナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションペインで、 を選択します。 表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[データ開発に移動] をクリックします。
[datastudio] ページの左側のナビゲーションペインで、
アイコンをクリックして [スケジュール済みワークフロー] ペインに移動します。スケジュール済みワークフローペインの上部ツールバーで、ポインターを [作成] の上に移動し、[ノードの作成] > [hologres] > [maxcomputeからのデータ同期] を選択します。
[ノードの作成] ダイアログボックスで、[エンジンインスタンス]、[パス]、[名前] パラメーターを設定し、[確認] をクリックします。
ノードの設定タブで、パラメーターを設定します。 次の表にパラメーターを示します。
セクション
パラメーター
説明
MaxComputeソーステーブルの選択
宛先名
DataStudioに関連付けられているHologresデータソースの名前。
宛先データベース
Hologresインスタンス内のデータベースの名前。
外部テーブルのソース
既存の外部テーブル
MaxComputeデータをマッピングするために使用される外部テーブルがHologresに存在します。
外部テーブルの作成
外部テーブルは存在しません。 外部テーブルを作成する必要があります。
外部スキーマ
MaxComputeテーブルをマッピングする外部テーブルが存在するスキーマの名前。
このパラメーターは、[外部テーブルのソース] パラメーターを [既存の外部テーブル] に設定した場合に利用できます。
外部テーブル名
MaxComputeテーブルをマッピングする外部テーブルの名前。
このパラメーターは、[外部テーブルのソース] パラメーターを [既存の外部テーブル] に設定した場合に利用できます。
外部サーバー
Hologresインスタンスが作成されると、odps_serverという名前のサーバーが自動的に作成され、使用できます。 詳細については、「postgres_fdw」をご参照ください。
このパラメーターは、[外部テーブルのソース] パラメーターを [外部テーブルの作成] に設定した場合に利用できます。
MaxComputeプロジェクト
データをインポートするMaxComputeプロジェクトの名前。
このパラメーターは、[外部テーブルのソース] パラメーターを [外部テーブルの作成] に設定した場合に利用できます。
MaxComputeテーブル名
データをインポートするMaxComputeテーブルの名前。
このパラメーターは、[外部テーブルのソース] パラメーターを [外部テーブルの作成] に設定した場合に利用できます。
宛先テーブル設定
宛先スキーマ
宛先テーブルが属するスキーマの名前。
ターゲットテーブル
データをインポートする宛先Hologresテーブルの名前。 同じ名前のHologresテーブルが既に存在する場合、MaxComputeからのデータ同期ノードが実行されると、元のテーブルとそのデータは自動的に削除されます。
宛先テーブルの説明
データをインポートする宛先Hologresテーブルの説明。
データインポート用のGUCパラメーターの設定
GUCパラメーター
MaxComputeからHologresにデータをインポートする前に設定する必要があるGrand Unified Configuration (GUC) パラメーター。 HologresでサポートされているGUCパラメーターの詳細については、「GUCパラメーター」をご参照ください。 その他のSQLステートメントはサポートされていません。
同期設定
同期フィールド
インポートするMaxComputeテーブルのフィールド。 フィールドの一部またはすべてを選択できます。
パーティション設定
インポートするパーティションフィールド。 Hologresは1レベルのパーティションのみをサポートします。
複数レベルのパーティションを含むMaxComputeテーブルからデータをインポートする場合、宛先テーブルにはMaxComputeテーブルのレベル 1 パーティションフィールドを指定する必要があります。 MaxComputeテーブルの他のパーティションフィールドは、宛先テーブルの共通フィールドにマッピングされます。
インデックス設定
宛先テーブルに作成するインデックス。 インデックスの作成方法の詳細については、「CREATE TABLE」をご参照ください。
SQLスクリプト
SQLスクリプト
データ同期ノードの実行時に実行する必要があるSQLステートメント。
ノード設定タブで、
アイコンをクリックして設定を保存します。ノード設定タブで、
アイコンをクリックして同期ノードを実行し、MaxComputeデータをインポートします。同期されたMaxComputeテーブルデータを表示します。
DataStudioページの左側のナビゲーションペインで、
アイコンをクリックして [ワークスペーステーブル] ペインに移動します。宛先Hologresテーブルをダブルクリックして、テーブル設定タブに移動します。
説明宛先テーブルが [ワークスペーステーブル] ペインに表示されない場合は、データマップでHologresメタデータを収集する必要があります。 詳細については、「データマップ (ベータ版)」をご参照ください。
オプション。 定期的なスケジューリングを設定します。
ノードの設定タブの右側のナビゲーションペインで [プロパティ] をクリックして、ノードのスケジューリングプロパティを設定します。 詳細については、「基本プロパティの設定」をご参照ください。
ノード設定タブで、上部ツールバーの
アイコンをクリックしてノードを保存します。上部ツールバーの
アイコンをクリックして、ノードをコミットします。[ノードのコミット] ダイアログボックスで、[変更の説明] フィールドに説明を入力し、[OK] をクリックします。