HNSW のインデックス構築パラメーター
パラメーター | タイプ | デフォルト値 | 説明 |
proxima.hnsw.builder.max_neighbor_count | uint32 | 100 | グラフ内のノードの最大近傍数。値が大きいほど、グラフの接続性が向上します。それに伴い、グラフ構築コストとインデックスサイズも増加します。 |
proxima.hnsw.builder.efconstruction | uint32 | 500 | グラフの構築時にスキャンできる近傍領域のサイズ。値が大きいほど、オフライングラフ構築の品質は向上しますが、インデックス構築速度は低下します。初めての場合は、値を 400 に設定することをお勧めします。 |
proxima.hnsw.builder.thread_count | uint32 | 0 | 使用できるスレッド数。このパラメーターの値を 0 に設定すると、使用できるスレッド数は、OpenSearch Vector Search Edition の CPU コア数と同じになります。 |
HNSW の検索パラメーター
パラメーター名 | タイプ | デフォルト値 | 説明 |
proxima.hnsw.searcher.ef | uint32 | 500 | オンライン検索中にスキャンされる最近傍の数。値が大きいほど、検索率は向上しますが、検索パフォーマンスは低下します。値を [100,1000] の範囲に設定することをお勧めします。 |
proxima.hnsw.searcher.max_scan_ratio | float | なし | オンライン検索中にスキャンされるポイントの割合。値が大きいほど、検索率は向上しますが、検索パフォーマンスは低下します。 |
proxima.hnsw.searcher.brute_force_threshold | uint32 | なし | オンライン検索中にスキャンされるポイントの最小数。このパラメーターの値がシャード内のドキュメント数を超えると、検索はブルートフォースになります。 |