DiskANN は、超大規模データセットの処理専用に設計されたディスクベースの近似最近傍探索技術です。 Vamana グラフアルゴリズムを使用してデータをディスクに保存し、限られたメモリ条件下で効率的なベクター インデックス作成と取得を維持します。
DiskANN インデックス構築パラメーター
パラメーター | 型 | 説明 |
proxima.diskann.builder.pq_dimension_scale | Int | PQ 量子化のスケール。 PQ 次元 = ベクトル次元 / pq_dimension_scale。 デフォルト値:8。 |
proxima.diskann.builder.max_degree | Int | DiskANN グラフ内のノードの出力ノードの最大数。 値が大きいほどグラフの精度は向上しますが、グラフの構築時間が長くなります。 |
proxima.diskann.builder.list_size | Int | DiskANN グラフ構築中のエッジ選択の候補セットのサイズ。 値が大きいほどグラフの精度は向上しますが、グラフの構築時間が長くなります。 |
proxima.diskann.builder.thread_count | Int | インデックス構築のスレッド数。 |
DiskANN インデックス検索パラメーター
パラメーター | 型 | 説明 |
proxima.diskann.searcher.list_size | Int | 結果候補セットのサイズ。 値が大きいほど再現率は高くなりますが、クエリ時間が長くなります。 |
proxima.diskann.searcher.io_limit | Int | 単一クエリに対するディスク I/O 制限。 最大 io_limit ディスク読み取り操作が実行されます。 これは主に Vamana グラフウォークの数に影響します。 値が大きいほど再現率と I/O 操作の数が増加し、クエリ時間が長くなります。 |
proxima.diskann.searcher.beam_search_width | Int | 並列 I/O 操作の数。 |