ベクター アナライザは、データを高次元ベクターに変換し、OpenSearch が類似検索を実行できるようにします。OpenSearch では、データのインデックスへの登録方法に応じて、2 種類のアナライザが提供されます。
業界別アナライザ — E コマースおよび教育向けテンプレートで使用します。入力フィールドの型は TEXT である必要があります。
汎用アナライザ — 排他的アプリケーションで使用します。事前に計算済みのベクターをユーザー側で提供します。入力フィールドの型は DOUBLE_ARRAY 型(倍精度浮動小数点配列)である必要があります。
アナライザの選択
| アナライザ | 寸法 | フィールド型 | 利用可能対象 |
|---|---|---|---|
| E コマース ベクター アナライザ(汎用) | 128 | TEXT | E コマース業界テンプレート |
| 教育 ベクター アナライザ(汎用) | 128 | TEXT | 教育業界テンプレート |
| 教育 ベクター アナライザ(K–12) | 256 | TEXT | 教育業界テンプレート |
| 64 ディメンション ベクター アナライザ(汎用) | 64 | DOUBLE_ARRAY | 排他的アプリケーション |
| 128 ディメンション ベクター アナライザ(汎用) | 128 | DOUBLE_ARRAY | 排他的アプリケーション |
| 256 ディメンション ベクター アナライザ(汎用) | 256 | DOUBLE_ARRAY | 排他的アプリケーション |
| 512 ディメンション ベクター アナライザ(汎用) | 512 | DOUBLE_ARRAY | 排他的アプリケーション |
選択ガイド:
E コマースまたは教育業界テンプレートを使用する場合? 対応する業界別アナライザをご利用ください。入力フィールドの型は TEXT である必要があります。
排他的アプリケーション(業界テンプレートなし)を使用する場合? 汎用アナライザのいずれかをご利用ください。インデックス登録前に、ソースデータをベクターに変換し、DOUBLE_ARRAY 型のフィールドに格納してください。要件に合致するディメンション数を選択します。
E コマース ベクター アナライザ(汎用)
128 ディメンションのアナライザで、E コマース検索に最適化されています。ほとんどの E コマース検索シナリオに対応します。
制限事項:
TEXT 型のフィールドにのみ適用可能です。
E コマース業界テンプレートでのみ利用可能です。
教育 ベクター アナライザ(汎用)
128 ディメンションのアナライザで、一般的な教育検索シナリオに最適化されています。
制限事項:
TEXT 型のフィールドにのみ適用可能です。
教育業界テンプレートでのみ利用可能です。
教育 ベクター アナライザ(K–12)
256 ディメンションのアナライザで、幼稚園から高校までの K–12 教育コンテンツに最適化されています。K–12 向けの質問検索を目的として設計されています。
制限事項:
TEXT 型のフィールドにのみ適用可能です。
教育業界テンプレートでのみ利用可能です。
汎用ベクター アナライザ(64、128、256、512 ディメンション)
排他的アプリケーション向けに提供される 4 種類のアナライザで、それぞれ異なるディメンション数(64、128、256、512)に対応しています。業界テンプレートを使用しないアプリケーションでご利用ください。
インデックス登録前に、ソースデータをベクターに変換し、DOUBLE_ARRAY 型のフィールドに格納してください。
制限事項:
DOUBLE_ARRAY 型のフィールドにのみ適用可能です。
排他的アプリケーションでのみ利用可能です。
手動によるデータ変換が必要です:インデックス登録前に、データをベクターに変換し、DOUBLE_ARRAY 型のフィールドに格納してください。