LinearBuilder
パラメーター | タイプ | デフォルト値 | 説明 |
proxima.linear.builder.column_major_order | string | false | インデックスの構築時にインデックスの特徴をどのようにソートするかを指定します。有効な値:false および true。false:インデックスの特徴が行ごとにソートされることを示します。true:インデックスの特徴が列ごとにソートされることを示します。 |
QcBuilder
パラメーター | タイプ | デフォルト値 | 説明 |
proxima.qc.builder.train_sample_count | uint32 | 0 | トレーニングデータの量。このパラメーターの値を 0 に設定すると、ドキュメントのすべてのデータがトレーニングデータとして指定されます。 |
proxima.qc.builder.thread_count | uint32 | 0 | 使用できるスレッド数。このパラメーターの値を 0 に設定すると、使用できるスレッド数は、OpenSearch Vector Search Edition の CPU コア数と同じになります。 |
proxima.qc.builder.centroid_count | string | オプション | クラスターに使用するセントロイドの数。階層型クラスターがサポートされています。アスタリスク (*) で階層型クラスターのレベルを区切ります。 1 つのレベルを含む階層型クラスターのサンプル値:1000。 2 つのレベルを含む階層型クラスターのサンプル値:100*100。 2 つのレベルを含む階層型クラスターのセントロイドの数を指定する場合、最初のレベルには 2 番目のレベルよりも多くのセントロイドを指定することをお勧めします。これにより、最初のレベルに少ない数のセントロイドを指定した場合よりも優れた結果が得られます。最初のレベルで取得できる経験値ポイントは、2 番目のレベルの 10 倍です。 セントロイドの数を指定しない場合、システムは適切なセントロイドの数を自動的に推測します。システムがセントロイドの数を自動的に推測できるようにすることをお勧めします。 |
proxima.qc.builder.cluster_class | string | OptKmeansCluster | クラスタリング方法。詳細については、Proxima Cluster パラメーターを参照してください。 |
proxima.qc.builder.cluster_auto_tuning | bool | false | セントロイドの数を自動的に変更するかどうかを指定します。 |
proxima.qc.builder.cluster_params_in_level_ | IndexParams | - | クラスタリング方法の設定に必要なパラメーター。詳細については、Proxima Cluster パラメーターを参照してください。 各レベルのパラメーターを最初のレベルから指定する必要があります。 最初のレベルのサンプル値:proxima.qc.builder.cluster_params_in_level_1。 |
proxima.qc.builder.optimizer_class | string | HcBuilder | 分類の精度を向上させるためにセントロイドに使用するビルダーオプティマイザーのタイプ。ビルダーオプティマイザーのタイプによって、オンラインシナリオで候補セントロイドのクエリを実行するサーチャーオプティマイザーのタイプが決まります。たとえば、パラメーター値を HcBuilder に設定すると、オンラインシナリオで候補セントロイドをクエリするために HcSearcher が使用されます。有効な値:HcBuilder、HnswBuilder、SsgBuilder、および LinearBuilder。 |
proxima.qc.builder.optimizer_params | IndexParams | - | proxima.qc.builder.optimizer_class パラメーターの値に基づいて設定されるビルダーオプティマイザーとサーチャーオプティマイザーのパラメーターとパラメーター値。たとえば、proxima.qc.builder.optimizer_class パラメーターの値を HnswBuilder に設定した場合、次のサンプルコードを参照してパラメーターとパラメーター値を指定できます。 proxima.hnsw.builder.max_neighbor_count: 100 proxima.hnsw.searcher.max_scan_ratio: 0.1 |
proxima.qc.builder.converter_class | string | - | Measure パラメーターの値を InnerProduct に設定すると、自動エンジン変換が実行され、OpenSearch Vector Search Edition は L2 ノルムを使用してドキュメントを検索します。 |
proxima.qc.builder.converter_params | IndexParams | - | proxima.qc.builder.converter_class を初期化するためのパラメーター。 |
proxima.qc.builder.quantizer_class | string | - | 量子化器。デフォルトでは、システムは量子化器を使用しません。このパラメーターの有効な値は、Int8QuantizerConverter、HalfFloatConverter、および DoubleBitConverter です。ほとんどの場合、このパラメーターに値を指定すると、パフォーマンスが向上し、インデックスのサイズが削減されます。ただし、特定のシナリオでは検索損失が発生する可能性があります。 |
proxima.qc.builder.quantizer_params | IndexParams | - | proxima.qc.builder.quantizer_class パラメーターを使用して指定する量子化器のパラメーターとパラメーター値。 |
proxima.qc.builder.optimizer_quantizer_class | string | - | セントロイドの量子化を実行するために使用される量子化器の名前。 |
proxima.qc.builder.optimizer_quantizer_params | IndexParams | - | proxima.qc.builder.optimizer_quantizer_class パラメーターを使用して指定する量子化器のパラメーターとパラメーター値。 |
proxima.qc.builder.quantize_by_centroid | bool | False | proxima.qc.builder.quantizer_class パラメーターに値を指定した場合に、セントロイドに基づいて量子化を実行するかどうかを指定します。proxima.qc.builder.quantize_by_centroid パラメーターは、proxima.qc.builder.quantizer_class の値を Int8QuantizerConverter に設定した場合にのみ有効になります。 |
proxima.qc.builder.store_original_features | bool | False | 生の特徴を保持するかどうかを指定します。proxima.qc.builder.quantizer_class に値を指定すると、IndexProvider は量子化が実行される特徴を取得します。生の特徴を取得するには、proxima.qc.builder.store_original_features の値を True に設定します。 |
HnswSearcher
パラメーター | タイプ | デフォルト値 | 説明 |
proxima.hnsw.builder.max_neighbor_count | uint32 | 100 | グラフ内のノードの最大近傍数。値が大きいほど、グラフの接続性が良好であることを示します。それに対応して、構築コストとインデックスサイズも増加します。 |
proxima.hnsw.builder.efconstruction | uint32 | 500 | グラフの構築時にスキャンできる近傍領域のサイズ。値が大きいほど、オフライングラフ構築の品質が高く、インデックス構築が遅いことを示します。最初に値を 400 に設定することをお勧めします。 |
proxima.hnsw.builder.thread_count | uint32 | 0 | 使用できるスレッド数。このパラメーターの値を 0 に設定すると、使用できるスレッド数は、OpenSearch Vector Search Edition の CPU コア数と同じになります。 |