テーブルを作成する際に、「インデックススキーマ」ステップでベクトルインデックスの詳細構成を設定できます。このトピックでは、ベクトルインデックスの詳細構成のパラメーターについて説明します。
テーブルを作成する際は、「インデックススキーマ」ステップでインデックススキーマを構成します。
次の図は、詳細構成のパラメーターを示しています。

次の表にパラメーターを示します。
パラメーター | 有効な値 | 説明 |
ベクトル次元 | 該当なし | ベクトルの特徴または属性の数。ベクトル次元パラメーターは、ベクトルが表現できる情報と特徴の複雑さを指定します。ベクトルモデルによって生成されたベクトルに基づいて、ベクトル次元パラメーターを構成する必要があります。 |
距離タイプ |
| SquareEuclidean スコアが小さいほど、関連性が高くなります。 InnerProduct スコアが大きいほど、関連性が高くなります。 コサインスコアは [-1, 1] の範囲です。値 -1 は、2 つのベクターが反対方向にあり、類似性が最も低いことを示します。値 1 は、2 つのベクターが同じ方向にあり、類似性が最も高いことを示します。 |
ベクトルインデックスアルゴリズム |
| ベクトルインデックスアルゴリズム。詳細については、ベクトルの概要を参照してください。 説明 DiskANN アルゴリズムは、データノードの仕様ファミリが SSD の場合にのみサポートされます。 |
リアルタイムインデックス |
| リアルタイムインデックス機能を有効にするかどうかを指定します。このパラメーターを true に設定すると、リアルタイムインデックス機能が有効になります。OpenSearch Vector Search Editionインスタンスは、API操作を呼び出すことによってプッシュするリアルタイムデータのインデックスを構築します。その後、リアルタイムでデータをクエリできます。 |
リアルタイムインデックスパラメーター | {"proxima.oswg.streamer.segment_size":2048} | リアルタイムインデックスのパラメーター。デフォルト値を使用することをお勧めします。 |
インデックス取得パラメーター | 該当なし | リアルタイム取得のパラメーター。ベクトルインデックスアルゴリズムに基づいてこのパラメーターを構成する必要があります。詳細については、以下のトピックを参照してください。 |
ベクトル区切り文字 | カスタマイズ可能 | ベクトル取得中に次元を区切るために使用される区切り文字。たとえば、vector:'1.05066,0.15610,0.156145...' では、カンマ (,) が区切り文字として使用されます。 |
線形構築のしきい値 | デフォルト値: 5000 | 順番にインデックスを作成しない操作のしきい値。値 5000 は、ドキュメント数が 5,000 未満の場合、インデックスが順番に作成されることを指定します。 |
無効なベクトルデータを無視する |
| 無効なベクトルデータを無視するかどうかを指定します。このパラメーターを true に設定すると、ベクトル次元が無効でベクトルデータが空の場合、システムはフルまたはバッチ増分データのインデックスを想定どおりに作成します。 |