このトピックでは、QGraph アルゴリズムのビルド パラメーターと検索パラメーターを構成する方法について説明します。
QGraph インデックス ビルド パラメーター
パラメーター名 | タイプ | デフォルト値 | 説明 |
proxima.hnsw.builder.max_neighbor_count | uint32 | 100 | グラフ内のノードの最大近傍数を指定します。この値が大きいほど、グラフの接続性が向上します。ただし、グラフ構築のコストとインデックス サイズも増加します。 |
proxima.hnsw.builder.efconstruction | uint32 | 500 | グラフ構築中の近傍スキャン エリアのサイズを制御します。この値が大きいほど、オフライン グラフの品質は向上しますが、インデックスの構築は遅くなります。 400 の構成から始めることをお勧めします。 |
proxima.hnsw.builder.thread_count | uint32 | 0 | 構築中に開くスレッドの数。 0 に設定すると、CPU コアの数を使用します。 |
proxima.qgraph.builder.quantizer_class | string | None | 量子化オプションには、Int4QuantizerConverter、Int8QuantizerConverter、HalfFloatConverter が含まれます。一般に、整数ビットが小さいほど、インデックスが小さく、パフォーマンスが高くなりますが、再現率は低くなります。基盤となる CPU 命令セットの問題により、int16 量子化のパフォーマンスと再現率は、量子化されていない場合とほぼ同じです。 |
QGraph インデックス検索パラメーター
パラメーター名 | タイプ | デフォルト値 | 説明 |
proxima.hnsw.searcher.ef | uint32 | 500 | オンライン検索中にスキャンされる最近傍の数。値が大きいほど取得率は向上しますが、取得パフォーマンスは低下します。値を [ 100, 1000 ] の範囲に設定することをお勧めします。 |
proxima.hnsw.searcher.max_scan_ratio | float | None | オンライン検索中にスキャンされるポイントの割合。値が大きいほど取得率は向上しますが、取得パフォーマンスは低下します。 |
proxima.hnsw.searcher.brute_force_threshold | uint32 | None | オンライン検索中にスキャンされるポイントの最小数。このパラメーターの値がシャード内のドキュメント数を超えると、検索はブルートフォースになります。 |