すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:量子化クラスタリング構成

最終更新日:Dec 28, 2024

QcBuilder

パラメーター

タイプ

デフォルト値

説明

qc.builder.train_sample_count

uint32

0

トレーニングデータの量。このパラメーターを 0 に設定すると、ドキュメントのすべてのデータがトレーニングデータとして指定されます。

qc.builder.thread_count

uint32

0

使用できるスレッド数。このパラメーターを 0 に設定すると、使用できるスレッド数は、OpenSearch Retrieval Engine Edition インスタンスの CPU コア数と同じになります。

qc.builder.centroid_count

string

オプション

クラスタに使用するセントロイドの数。階層型クラスタがサポートされています。アスタリスク (*) で階層型クラスタのレベルを区切ります。

1 つのレベルを含む階層型クラスタのサンプル値: 1000

2 つのレベルを含む階層型クラスタのサンプル値: 100*100

2 つのレベルを含む階層型クラスタのセントロイド数を指定する場合、最初のレベルのセントロイド数を 2 番目のレベルよりも多く指定することをお勧めします。これにより、最初のレベルのセントロイド数を 2 番目のレベルよりも少なく指定した場合よりも優れた結果が得られます。最初のレベルで取得できる経験値は、2 番目のレベルの 10 倍です。

セントロイド数を指定しない場合、システムは適切なセントロイド数を自動的に推測します。セントロイド数をシステムが自動的に推測するようにすることをお勧めします。

qc.builder.quantizer_class

string

-

量子化器。デフォルトでは、システムは量子化器を使用しません。有効な値: Int8QuantizerConverter、HalfFloatConverter、DoubleBitConverter。ほとんどの場合、量子化器を指定すると、パフォーマンスが向上し、インデックスのサイズが縮小されます。ただし、特定のシナリオでは検索損失が発生する可能性があります。

qc.builder.quantize_by_centroid

bool

False

qc.builder.quantizer_class パラメーターに値を指定した場合に、セントロイドに基づいて量子化を実行するかどうかを指定します。 qc.builder.quantize_by_centroid パラメーターは、qc.builder.quantizer_class パラメーターを Int8QuantizerConverter に設定した場合にのみ有効になります。

QcSearcher

パラメーター

タイプ

デフォルト値

説明

qc.searcher.scan_ratio

float

0.01

検索中にスキャンできるドキュメントの全ドキュメントに対する最大比率。このパラメーターは、次の式に基づいて max_scan_num パラメーターの値を計算するために使用されます。max_scan_num パラメーターの値 = ドキュメントの総数 × qc.searcher.scan_ratio パラメーターの値。

qc.searcher.brute_force_threshold

int

1000

線形検索のしきい値。ドキュメントの総数がこのしきい値未満の場合、線形検索が実行されます。