LinearSearcher
パラメーター | 型 | デフォルト値 | 説明 |
proxima.linear.searcher.read_block_size | uint32 | 1024*1024 | 検索中に一度に読み取ることができるメモリのサイズです。約 1 MB のメモリを読み取ることができます。小さい値を設定すると、1 秒あたりのクエリ数 (QPS) が減少します。大きい値を設定すると、メモリ使用量が高くなります。1024*1024 に設定することをお勧めします。 |
QcSearcher
パラメーター | 型 | デフォルト値 | 説明 |
proxima.qc.searcher.scan_ratio | float | 0.01 | 検索中にスキャンできるドキュメントの全ドキュメントに対する最大比率です。このパラメーターは、max_scan_num パラメーターの値を計算するために使用されます。この値は、次の式を使用して計算されます。max_scan_num パラメーターの値 = ドキュメントの総数 × proxima.qc.searcher.scan_ratio パラメーターの値。 |
proxima.qc.searcher.optimizer_params | IndexParams | 空 | ビルダーを指定するときに指定されたオプティマイザーに対応するオンライン検索パラメーターです。たとえば、オフラインビルドフェーズでオプティマイザーを HnswBuilder として指定した場合、HnswSearcher に対応する次の検索パラメーターを指定できます。 proxima.hnsw.searcher.max_scan_ratio: 0.1 |
proxima.qc.searcher.brute_force_threshold | int | 1000 | しきい値です。ドキュメントの総数がこのしきい値より小さい場合、線形検索が実行されます。 |
HnswSearcher
パラメーター | 型 | デフォルト値 | 説明 |
proxima.hnsw.searcher.ef | uint32 | 500 | 検索精度です。値が大きいほど、スキャンされるドキュメントの数が増え、再現率が高くなります。 |
proxima.hnsw.searcher.max_scan_ratio | float | 0.1f | 検索中にスキャンできるドキュメントの全ドキュメントに対する最大比率です。たとえば、現在のインデックスに 1,000,000 件のドキュメントが存在し、このパラメーターが 0.1 に設定されている場合、検索中に最大 100,000 件のドキュメントがスキャンされます。proxima.hnsw.searcher.ef パラメーターの値が早期に収束した場合、スキャンされるドキュメントは 100,000 件未満になります。 |
proxima.general.searcher.scan_count | uint32 | 10000 | 検索中にスキャンできるドキュメントの最大数です。 |