Parameter pembuatan indeks untuk HNSW
Parameter | Tipe | Nilai default | Deskripsi |
proxima.hnsw.builder.max_neighbor_count | uint32 | 100 | Jumlah maksimum tetangga untuk sebuah node dalam graf. Nilai yang lebih besar menunjukkan konektivitas graf yang lebih baik. Sebagai konsekuensinya, biaya pembuatan graf dan ukuran indeks juga meningkat. |
proxima.hnsw.builder.efconstruction | uint32 | 500 | Ukuran area tetangga yang dapat dipindai saat graf sedang dibangun. Nilai yang lebih besar menunjukkan kualitas pembuatan graf offline yang lebih tinggi tetapi kecepatan pembuatan indeks lebih rendah. Kami merekomendasikan Anda mengatur nilai ini menjadi 400 untuk pertama kali. |
proxima.hnsw.builder.thread_count | uint32 | 0 | Jumlah thread yang dapat digunakan. Jika Anda mengatur nilai parameter ini ke 0, jumlah thread yang dapat digunakan sama dengan jumlah core CPU dari OpenSearch Vector Search Edition. |
Parameter pencarian untuk HNSW
Nama parameter | Tipe | Nilai default | Deskripsi |
proxima.hnsw.searcher.ef | uint32 | 500 | Jumlah tetangga terdekat yang dipindai selama pencarian online. Nilai besar meningkatkan rasio pengambilan tetapi memperlambat kinerja pengambilan. Kami merekomendasikan Anda mengatur nilai ini dalam rentang [100,1000]. |
proxima.hnsw.searcher.max_scan_ratio | float | Tidak ada | Proporsi titik yang dipindai selama pencarian online. Nilai besar meningkatkan rasio pengambilan tetapi memperlambat kinerja pengambilan. |
proxima.hnsw.searcher.brute_force_threshold | uint32 | Tidak ada | Jumlah minimum titik yang dipindai selama pencarian online. Jika nilai parameter ini melebihi jumlah dokumen dalam shard, pencarian menjadi brute force. |