すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:DLFデータソース

最終更新日:Dec 28, 2024

このトピックでは、OpenSearch Retrieval Engine Editionインスタンスでテーブルを追加する際に、Data Lake Formation(DLF)データソースを使用する方法について説明します。

前提条件

  • DLFについて理解していること。

  • DLFにカタログデータベーステーブルが作成されていること。これらはデータ同期の設定時に使用されます。

DLFデータソースの追加

  1. OpenSearch Retrieval Engine Editionコンソールにログインします。左側のナビゲーションペインで、[インスタンス] をクリックします。[インスタンス] ページで、目的のインスタンスを見つけ、そのIDをクリックします。インスタンスの詳細ページで、左側のナビゲーションペインのテーブル管理をクリックします。表示されるページで、テーブルの追加をクリックします。

  2. [テーブルの基本情報] ステップで、パラメータを設定し、次へをクリックします。imageパラメータ

  • テーブル名:テーブルの名前。カスタムテーブル名を入力できます。

  • データシャード:データシャードの数。数は256以下の正の整数である必要があります。Searcherワーカーの数の3倍を超えない数を指定することをお勧めします。

  • データ更新用リソース数:データ更新に使用されるリソースの数。デフォルトでは、テーブルごとにデータ更新用の2つのリソースの無料枠が提供されます。各リソースは4 vCPUと8 GBのメモリで構成されています。無料枠を超えるリソースについては課金されます。

  1. [データ同期] ステップで、次のパラメータを設定してデータソースを追加し、[チェック] をクリックしてデータソース情報を確認します。チェックに合格したら、次へをクリックします。

    dlf数据校验.png

  • フルデータソース:DLFを選択します。

  • カタログID:アクセスするDLFカタログのID。

  • データベース:カタログ内のデータベースの名前。

  • データテーブル:データベース内のテーブルの名前。

    説明
    • 既存のインスタンスにDLFデータソースを使用する場合は、まずインスタンスのオフラインバージョンをアップグレードする必要があります。

    • Paimonタイプのカタログのみがサポートされています。

    • Paimonのプライマリキーテーブルの場合、テーブルへのデータの追加、テーブルからのデータの削除、テーブル内のデータの変更とクエリを実行できます。Paimonの追加専用テーブルの場合、テーブルにデータを追加することのみ可能です。データの変更やテーブルからのデータの削除は許可されていません。

  1. [インデックススキーマ] ステップで、パラメータを設定します。フォームモードまたは開発者モードを使用できます。設定後、[次へ] をクリックします。

    召回引擎dlf索引结构cn.png

  2. 作成を確認します。その後、システムは設定されたテーブルを自動的に作成します。テーブルの作成の進捗状況は、[変更履歴] ページで確認できます。テーブルが[使用中] 状態になったら、[クエリテスト] ページでクエリテストを実行できます。

注意事項

DLFのPaimonテーブルに新しいデータが書き込まれると、OpenSearchは新しいデータに基づいてリアルタイムでインデックスを自動的に作成します。APIを呼び出してPaimonテーブルに手動でデータを書き込むと、データの不整合が発生する可能性があります。したがって、注意して進めてください。