HoloWeb は、Object Storage Service (OSS) データのワンクリック同期をサポートしています。ビジュアルインターフェイスを使用して、OSS テーブルから Hologres の内部テーブルにデータを迅速にインポートしてクエリを実行できます。この方法は、外部テーブルを作成してデータを直接クエリするよりも、優れたクエリパフォーマンスを提供します。
前提条件
-
インスタンスにログイン済みであること。詳細については、「インスタンスへのログイン」をご参照ください。
-
外部サーバーを作成済みであること。詳細については、「外部サーバーの作成」をご参照ください。
操作手順
Hologres 管理コンソールにログインします。
上部のナビゲーションバーで、リージョンを選択します。
左側のナビゲーションウィンドウで、[HoloWeb へ移動] をクリックします。
-
ターゲットデータベースにログインした後、Metadata Management > OSS Data Lake Acceleration > One-click OSS Data Import の順にクリックし、One-click Data Import from OSS Data Lake ページに移動します。
-
Create OSS Data Import Task タスクのパラメーターを設定します。[SQL スクリプト] セクションには、設定に対応する SQL 文が自動的に表示されます。
カテゴリ
パラメーター名
説明
インスタンスの選択
インスタンス名
ログインしているインスタンスの名前。
DLF ソーステーブル
サーバー名
作成した外部サーバーの名前。
データベース名
インポートする OSS データを含む Data Lake Formation (DLF) データベースの名前。
テーブル名
インポートする OSS テーブルの名前。
Hologres ターゲットテーブル
データベース名
Hologres のターゲットデータベースの名前。
スキーマ名
デフォルト値は public です。ドロップダウンリストから、権限を持つ別のスキーマを選択できます。
テーブル名
新しい Hologres 内部テーブルの名前。
テーブルを手動で作成する必要はありません。ソース DLF テーブル名を入力すると、システムは自動的に Hologres 内部テーブルに同じ名前を設定します。テーブル名は変更できます。
同じ名前の内部テーブルが既に存在する場合:
-
非パーティションテーブルの場合:タスクの実行時に、元のテーブルとそのデータは削除され、再作成されます。
-
パーティションテーブルの場合:元のテーブルとそのデータは削除されません。パーティション値に基づいて新しい子パーティションテーブルが作成され、データが挿入されます。DLF テーブルのスキーマが既存の内部テーブルと異なる場合、エラーが発生します。
ターゲットテーブルの説明
新しい Hologres 内部テーブルの説明。変更可能です。
パラメーター設定
GUC パラメーター
設定する Grand Unified Configuration (GUC) パラメーター。
通常、これらのパラメーターを入力して、タスクの読み書きの同時実行性を制御する必要があります。フォーマットは
set <GUC>=<values>;です。複数の GUC パラメーターを設定するには、それぞれを新しい行に入力します。インポート設定
フィールド
インポートする DLF テーブルのフィールド。
一部またはすべてのフィールドをインポートできます。
パーティション設定
-
Partition Field:パーティションフィールドを選択します。
-
Data Timestamp:DLF テーブルが日付でパーティション化されている場合、特定のパーティション日付を選択できます。システムは指定された日付のデータを Hologres テーブルにインポートします。
インデックス設定
-
Storage Mode:
-
Column-oriented Storage:さまざまな複雑なクエリに適しています。
-
Row-oriented Storage:プライマリキーに基づくポイントクエリとスキャンに適しています。
-
Row-column Storage:オンライン分析処理 (OLAP) の複雑な分析、高同時実行ポイントクエリ、プライマリキーに基づかないポイントクエリなど、さまざまなシナリオに適しています。
ストレージモードを指定しない場合、システムはデフォルトで列ストアモードを使用します。
詳細については、「テーブルストレージフォーマット:列ストア、行ストア、および列と行のストア」をご参照ください。
-
-
Data Lifecycle:テーブルデータの有効期間 (TTL)。デフォルトは 永続 ストレージです。TTL を指定した場合、指定された期間内にデータが変更されていなければ、TTL の有効期限が切れた後、DPI エンジンがデータを削除します。
-
Binlog:テーブルのバイナリロギングを有効にするかどうかを指定します。詳細については、「Hologres バイナリログのサブスクライブ」をご参照ください。
説明Hologres V0.9 以降では、テーブルレベルでのバイナリロギング機能がサポートされています。
-
Lifecycle of Binary Logs:バイナリログの TTL (秒単位)。デフォルトは 30 日 (2,592,000 秒) です。詳細については、「Hologres バイナリログのサブスクライブ」をご参照ください。
これらの設定を完了した後、DLF テーブルからインポートするフィールドのプロパティを設定できます。これらのプロパティには、分布列、セグメント列、クラスター列、辞書エンコーディング列、ビットマップ列が含まれます。
-
-
ページの右上隅にある Submit をクリックします。その後、One-click OSS Data Import ページでデータインポートタスクの実行詳細を表示できます。
-
(オプション) インポートタスクの [操作] 列で、タスクの 詳細 の表示、Rerun、Delete、または Execution History の表示ができます。
OSS データのクエリ
OSS データインポートタスクが正常に実行されると、Hologres は自動的に内部テーブルを作成します。Hologres で次の SQL 文を実行してデータをクエリします:
SELECT * FROM <tablename>;
この文の tablename は、OSS データインポートタスクを作成したときに指定した Hologres 内部テーブルの名前です。