QcBuilder
パラメーター | タイプ | デフォルト値 | 説明 |
qc.builder.train_sample_count | uint32 | 0 | トレーニングデータの量。このパラメーターを 0 に設定すると、ドキュメントのすべてのデータがトレーニングデータとして指定されます。 |
qc.builder.thread_count | uint32 | 0 | 使用できるスレッド数。このパラメーターを 0 に設定すると、使用できるスレッド数は、OpenSearch Retrieval Engine Edition インスタンスの CPU コア数と同じになります。 |
qc.builder.centroid_count | string | オプション | クラスタに使用するセントロイドの数。階層型クラスタがサポートされています。アスタリスク (*) で階層型クラスタのレベルを区切ります。 1 つのレベルを含む階層型クラスタのサンプル値: 1000 2 つのレベルを含む階層型クラスタのサンプル値: 100*100 2 つのレベルを含む階層型クラスタのセントロイド数を指定する場合、最初のレベルのセントロイド数を 2 番目のレベルよりも多く指定することをお勧めします。これにより、最初のレベルのセントロイド数を 2 番目のレベルよりも少なく指定した場合よりも優れた結果が得られます。最初のレベルで取得できる経験値は、2 番目のレベルの 10 倍です。 セントロイド数を指定しない場合、システムは適切なセントロイド数を自動的に推測します。セントロイド数をシステムが自動的に推測するようにすることをお勧めします。 |
qc.builder.quantizer_class | string | - | 量子化器。デフォルトでは、システムは量子化器を使用しません。有効な値: Int8QuantizerConverter、HalfFloatConverter、DoubleBitConverter。ほとんどの場合、量子化器を指定すると、パフォーマンスが向上し、インデックスのサイズが縮小されます。ただし、特定のシナリオでは検索損失が発生する可能性があります。 |
qc.builder.quantize_by_centroid | bool | False | qc.builder.quantizer_class パラメーターに値を指定した場合に、セントロイドに基づいて量子化を実行するかどうかを指定します。 qc.builder.quantize_by_centroid パラメーターは、qc.builder.quantizer_class パラメーターを Int8QuantizerConverter に設定した場合にのみ有効になります。 |
QcSearcher
パラメーター | タイプ | デフォルト値 | 説明 |
qc.searcher.scan_ratio | float | 0.01 | 検索中にスキャンできるドキュメントの全ドキュメントに対する最大比率。このパラメーターは、次の式に基づいて max_scan_num パラメーターの値を計算するために使用されます。max_scan_num パラメーターの値 = ドキュメントの総数 × qc.searcher.scan_ratio パラメーターの値。 |
qc.searcher.brute_force_threshold | int | 1000 | 線形検索のしきい値。ドキュメントの総数がこのしきい値未満の場合、線形検索が実行されます。 |