OpenSearch Vector Search Edition は、さまざまなデータクエリメソッドをサポートしており、多様なクエリ要件に対応できます。
ハイブリッドクエリ: ハイブリッドクエリは、テキストとベクターに基づいて実行され、構造化データと非構造化データの両方を利用して、クエリ結果の精度を高めます。
ベクターには、密ベクターと疎ベクターが含まれます。ベクターの全体スコアは、密ベクターの距離と疎ベクターの距離の合計に基づいて計算されます。ユークリッド距離(SquareEuclidean)の場合、ベクター間の距離が近いほど、ベクターの類似度は高くなります。
テキストの全体スコアは、キーワードの一致度によって決まります。一致度が高いほど、テキストのスコアは高くなります。最終的な総合スコアは、ベクタースコアとテキストスコアの合計です。ベクタースコアが小さく、テキストスコアが大きいことが望ましいです。総合スコアが大きいほど、ドキュメントの関連性が高くなります。 OpenSearch Vector Search Edition では、重みを設定して、ベクタースコアとテキストスコアのバランスをとることができます。たとえば、ベクタースコアの重みを減らし、テキストスコアの重みを増やすことで、より良い検索効果を得ることができます。
ベクターベースのクエリ: 生成されたベクターデータを Vector Search Edition インスタンスにインポートし、ベクターベースのクエリを実行できます。
単一ドキュメントに対する複数ベクターベースのクエリ: ドキュメントのベクターフィールドに複数のベクターを格納して、データクエリを実行できます。
マルチクエリ: 複数のクエリリクエストを一度に送信できます。これにより、クエリの効率と応答速度が向上します。
予測ベースのクエリ: Vector Search Edition の組み込みベクトル化モデルを使用してテキストとイメージをベクターに変換した後、テキストまたはイメージを使用して予測ベースのクエリを実行できます。
プライマリキーベースのクエリ: ドキュメントは、一意の識別子に基づいて識別できます。これにより、効率的なデータアクセスが保証されます。
フィルター式: フィルター条件を指定して、ドキュメントをフィルタリングできます。これにより、データフィルタリングが向上します。
転置インデックス: 転置インデックスは、全文クエリを高速化し、ドキュメントをすばやく識別し、クエリのパフォーマンスを向上させるのに役立ちます。