DiskANN adalah teknologi pencarian tetangga terdekat aproksimatif berbasis disk yang dirancang untuk memproses dataset berskala sangat besar. Teknologi ini menggunakan algoritma graf Vamana untuk menyimpan data di disk, sambil mempertahankan pengindeksan vektor dan pengambilan yang efisien dalam kondisi memori terbatas.
Parameter pembuatan indeks DiskANN
Parameter | Tipe | Deskripsi |
proxima.diskann.builder.pq_dimension_scale | Int | Skala untuk Kuantisasi PQ. Dimensi PQ = dimensi vektor/pq_dimension_scale. Nilai default: 8. |
proxima.diskann.builder.max_degree | Int | Jumlah maksimum node keluaran untuk sebuah node dalam graf DiskANN. Nilai yang lebih besar menghasilkan graf yang lebih akurat tetapi meningkatkan waktu pembuatan graf. |
proxima.diskann.builder.list_size | Int | Ukuran set kandidat untuk pemilihan tepi selama pembuatan graf DiskANN. Nilai yang lebih besar menghasilkan graf yang lebih akurat tetapi meningkatkan waktu pembuatan graf. |
proxima.diskann.builder.thread_count | Int | Jumlah thread untuk pembuatan indeks. |
Parameter pencarian indeks DiskANN
Parameter | Tipe | Deskripsi |
proxima.diskann.searcher.list_size | Int | Ukuran set kandidat hasil. Nilai yang lebih besar menghasilkan recall yang lebih tinggi tetapi meningkatkan waktu query. |
proxima.diskann.searcher.io_limit | Int | Batas I/O disk untuk satu query. Maksimal io_limit operasi baca disk akan dilakukan. Ini terutama memengaruhi jumlah perjalanan graf Vamana. Nilai yang lebih besar menghasilkan recall yang lebih tinggi dan lebih banyak operasi I/O, yang meningkatkan waktu query. |
proxima.diskann.searcher.beam_search_width | Int | Jumlah operasi I/O paralel. |