このトピックでは、OpenSearch Retrieval Engine Editionインスタンスでテーブルを追加する際に、Data Lake Formation(DLF)データソースを使用する方法について説明します。
前提条件
DLFについて理解していること。
DLFにカタログ、データベース、テーブルが作成されていること。これらはデータ同期の設定時に使用されます。
DLFデータソースの追加
OpenSearch Retrieval Engine Editionコンソールにログインします。左側のナビゲーションペインで、[インスタンス] をクリックします。[インスタンス] ページで、目的のインスタンスを見つけ、そのIDをクリックします。インスタンスの詳細ページで、左側のナビゲーションペインのテーブル管理をクリックします。表示されるページで、テーブルの追加をクリックします。
[テーブルの基本情報] ステップで、パラメータを設定し、次へをクリックします。
パラメータ:
テーブル名:テーブルの名前。カスタムテーブル名を入力できます。
データシャード:データシャードの数。数は256以下の正の整数である必要があります。Searcherワーカーの数の3倍を超えない数を指定することをお勧めします。
データ更新用リソース数:データ更新に使用されるリソースの数。デフォルトでは、テーブルごとにデータ更新用の2つのリソースの無料枠が提供されます。各リソースは4 vCPUと8 GBのメモリで構成されています。無料枠を超えるリソースについては課金されます。
[データ同期] ステップで、次のパラメータを設定してデータソースを追加し、[チェック] をクリックしてデータソース情報を確認します。チェックに合格したら、次へをクリックします。
フルデータソース:DLFを選択します。
カタログID:アクセスするDLFカタログのID。
データベース:カタログ内のデータベースの名前。
データテーブル:データベース内のテーブルの名前。
説明既存のインスタンスにDLFデータソースを使用する場合は、まずインスタンスのオフラインバージョンをアップグレードする必要があります。
Paimonタイプのカタログのみがサポートされています。
Paimonのプライマリキーテーブルの場合、テーブルへのデータの追加、テーブルからのデータの削除、テーブル内のデータの変更とクエリを実行できます。Paimonの追加専用テーブルの場合、テーブルにデータを追加することのみ可能です。データの変更やテーブルからのデータの削除は許可されていません。
[インデックススキーマ] ステップで、パラメータを設定します。フォームモードまたは開発者モードを使用できます。設定後、[次へ] をクリックします。
作成を確認します。その後、システムは設定されたテーブルを自動的に作成します。テーブルの作成の進捗状況は、[変更履歴] ページで確認できます。テーブルが[使用中] 状態になったら、[クエリテスト] ページでクエリテストを実行できます。
注意事項
DLFのPaimonテーブルに新しいデータが書き込まれると、OpenSearchは新しいデータに基づいてリアルタイムでインデックスを自動的に作成します。APIを呼び出してPaimonテーブルに手動でデータを書き込むと、データの不整合が発生する可能性があります。したがって、注意して進めてください。