すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:ベクトルインデックスのベストプラクティス

最終更新日:Dec 28, 2024

このドキュメントでは、既存のOpenSearch検索エンジン版インスタンス内でのベクトルインデックスの設定について概説し、ベクトルクエリによるデータ取得のためのSDKの使用方法を説明します。

OpenSearch検索エンジン版インスタンスを購入する

詳細については、OpenSearch検索エンジン版インスタンスの購入を参照してください。

テーブルを設定する

新しいインスタンスを購入すると、製品ページでステータスが「設定保留中」と表示されます。購入したクエリノードとデータノードの数と仕様に一致する空のクラスターが自動的にデプロイされます。検索を開始する前に、クラスターのテーブル基本情報> データ同期> インデックススキーマ> インデックス再構築を設定します。

  1. テーブル基本情報を設定するには、テーブル名をカスタマイズし、シャード数を決定し、データ更新リソース数を指定します。

説明
  • テーブルのシャード数は256に制限されており、インスタンスのデータノード数の3倍を超えないようにすることをお勧めします。

  • デフォルトでは、2つの無料のデータ更新リソースが提供されます。この数を超えると、n-2として計算される料金が発生します。ここで、nは単一テーブルの合計データ更新リソースを表します。

  1. データ同期では、MaxComputeデータソースAPIプッシュデータソースオブジェクトストレージサービス (OSS)などのサポートされているタイプを含むフルデータソースを設定します。MaxComputeを例にとると、「データソースを追加」を選択し、タイプとして「MaxCompute」を選択し、プロジェクト、accesskeyID、accesskeySecret、テーブル、パーティションキーを入力し、「自動インデックス再構築」を有効にすることを検討します。

  1. データソースの設定が完了したら、インデックススキーマの設定に進みます。

3.1. フィールドを定義します。少なくともプライマリキーフィールドベクトルフィールドの2つが必要です(後者は複数値の浮動小数点型として設定する必要があります)。

カテゴリを持つベクトルを含めるには、カテゴリフィールドを追加します。これは、単一値または複数値の整数型のいずれかに設定する必要があります。

プロパティとフィールドコンテンツの圧縮:

  • 属性フィールドの場合は、圧縮するオプションがあります。フォームモードでは、非圧縮と圧縮のいずれかを選択します。開発者モードでは、no_compressorまたはfile_compressorのいずれかを選択します。

  • フィールドコンテンツの場合は、圧縮を適用するかどうかを決定します。デフォルトでは、非圧縮のままです。複数値型とSTRING型はデフォルトでuniq圧縮を使用し、単一値の数値型はequal圧縮を使用します。