すべてのプロダクト
Search
ドキュメントセンター

:Proxima Builder

最終更新日:Dec 28, 2024

LinearBuilder

パラメーター

タイプ

デフォルト値

説明

proxima.linear.builder.column_major_order

string

false

インデックスの構築時にインデックスの特徴をどのようにソートするかを指定します。有効な値:false および true。false:インデックスの特徴が行ごとにソートされることを示します。true:インデックスの特徴が列ごとにソートされることを示します。

QcBuilder

パラメーター

タイプ

デフォルト値

説明

proxima.qc.builder.train_sample_count

uint32

0

トレーニングデータの量。このパラメーターの値を 0 に設定すると、ドキュメントのすべてのデータがトレーニングデータとして指定されます。

proxima.qc.builder.thread_count

uint32

0

使用できるスレッド数。このパラメーターの値を 0 に設定すると、使用できるスレッド数は、OpenSearch Vector Search Edition の CPU コア数と同じになります。

proxima.qc.builder.centroid_count

string

オプション

クラスターに使用するセントロイドの数。階層型クラスターがサポートされています。アスタリスク (*) で階層型クラスターのレベルを区切ります。

1 つのレベルを含む階層型クラスターのサンプル値:1000。

2 つのレベルを含む階層型クラスターのサンプル値:100*100。

2 つのレベルを含む階層型クラスターのセントロイドの数を指定する場合、最初のレベルには 2 番目のレベルよりも多くのセントロイドを指定することをお勧めします。これにより、最初のレベルに少ない数のセントロイドを指定した場合よりも優れた結果が得られます。最初のレベルで取得できる経験値ポイントは、2 番目のレベルの 10 倍です。

セントロイドの数を指定しない場合、システムは適切なセントロイドの数を自動的に推測します。システムがセントロイドの数を自動的に推測できるようにすることをお勧めします。

proxima.qc.builder.cluster_class

string

OptKmeansCluster

クラスタリング方法。詳細については、Proxima Cluster パラメーターを参照してください。

proxima.qc.builder.cluster_auto_tuning

bool

false

セントロイドの数を自動的に変更するかどうかを指定します。

proxima.qc.builder.cluster_params_in_level_

IndexParams

-

クラスタリング方法の設定に必要なパラメーター。詳細については、Proxima Cluster パラメーターを参照してください。

各レベルのパラメーターを最初のレベルから指定する必要があります。

最初のレベルのサンプル値:proxima.qc.builder.cluster_params_in_level_1。

proxima.qc.builder.optimizer_class

string

HcBuilder

分類の精度を向上させるためにセントロイドに使用するビルダーオプティマイザーのタイプ。ビルダーオプティマイザーのタイプによって、オンラインシナリオで候補セントロイドのクエリを実行するサーチャーオプティマイザーのタイプが決まります。たとえば、パラメーター値を HcBuilder に設定すると、オンラインシナリオで候補セントロイドをクエリするために HcSearcher が使用されます。有効な値:HcBuilder、HnswBuilder、SsgBuilder、および LinearBuilder。

proxima.qc.builder.optimizer_params

IndexParams

-

proxima.qc.builder.optimizer_class パラメーターの値に基づいて設定されるビルダーオプティマイザーとサーチャーオプティマイザーのパラメーターとパラメーター値。たとえば、proxima.qc.builder.optimizer_class パラメーターの値を HnswBuilder に設定した場合、次のサンプルコードを参照してパラメーターとパラメーター値を指定できます。

proxima.hnsw.builder.max_neighbor_count: 100 proxima.hnsw.searcher.max_scan_ratio: 0.1

proxima.qc.builder.converter_class

string

-

Measure パラメーターの値を InnerProduct に設定すると、自動エンジン変換が実行され、OpenSearch Vector Search Edition は L2 ノルムを使用してドキュメントを検索します。

proxima.qc.builder.converter_params

IndexParams

-

proxima.qc.builder.converter_class を初期化するためのパラメーター。

proxima.qc.builder.quantizer_class

string

-

量子化器。デフォルトでは、システムは量子化器を使用しません。このパラメーターの有効な値は、Int8QuantizerConverter、HalfFloatConverter、および DoubleBitConverter です。ほとんどの場合、このパラメーターに値を指定すると、パフォーマンスが向上し、インデックスのサイズが削減されます。ただし、特定のシナリオでは検索損失が発生する可能性があります。

proxima.qc.builder.quantizer_params

IndexParams

-

proxima.qc.builder.quantizer_class パラメーターを使用して指定する量子化器のパラメーターとパラメーター値。

proxima.qc.builder.optimizer_quantizer_class

string

-

セントロイドの量子化を実行するために使用される量子化器の名前。

proxima.qc.builder.optimizer_quantizer_params

IndexParams

-

proxima.qc.builder.optimizer_quantizer_class パラメーターを使用して指定する量子化器のパラメーターとパラメーター値。

proxima.qc.builder.quantize_by_centroid

bool

False

proxima.qc.builder.quantizer_class パラメーターに値を指定した場合に、セントロイドに基づいて量子化を実行するかどうかを指定します。proxima.qc.builder.quantize_by_centroid パラメーターは、proxima.qc.builder.quantizer_class の値を Int8QuantizerConverter に設定した場合にのみ有効になります。

proxima.qc.builder.store_original_features

bool

False

生の特徴を保持するかどうかを指定します。proxima.qc.builder.quantizer_class に値を指定すると、IndexProvider は量子化が実行される特徴を取得します。生の特徴を取得するには、proxima.qc.builder.store_original_features の値を True に設定します。

HnswSearcher

パラメーター

タイプ

デフォルト値

説明

proxima.hnsw.builder.max_neighbor_count

uint32

100

グラフ内のノードの最大近傍数。値が大きいほど、グラフの接続性が良好であることを示します。それに対応して、構築コストとインデックスサイズも増加します。

proxima.hnsw.builder.efconstruction

uint32

500

グラフの構築時にスキャンできる近傍領域のサイズ。値が大きいほど、オフライングラフ構築の品質が高く、インデックス構築が遅いことを示します。最初に値を 400 に設定することをお勧めします。

proxima.hnsw.builder.thread_count

uint32

0

使用できるスレッド数。このパラメーターの値を 0 に設定すると、使用できるスレッド数は、OpenSearch Vector Search Edition の CPU コア数と同じになります。