All Products
Search
Document Center

OpenSearch:Konfigurasi DiskANN

Last Updated:Jul 11, 2025

DiskANN adalah teknologi pencarian tetangga terdekat aproksimatif berbasis disk yang dirancang untuk memproses dataset berskala sangat besar. Teknologi ini menggunakan algoritma graf Vamana untuk menyimpan data di disk, sambil mempertahankan pengindeksan vektor dan pengambilan yang efisien dalam kondisi memori terbatas.

Parameter pembuatan indeks DiskANN

Parameter

Tipe

Deskripsi

proxima.diskann.builder.pq_dimension_scale

Int

Skala untuk Kuantisasi PQ. Dimensi PQ = dimensi vektor/pq_dimension_scale. Nilai default: 8.

proxima.diskann.builder.max_degree

Int

Jumlah maksimum node keluaran untuk sebuah node dalam graf DiskANN. Nilai yang lebih besar menghasilkan graf yang lebih akurat tetapi meningkatkan waktu pembuatan graf.

proxima.diskann.builder.list_size

Int

Ukuran set kandidat untuk pemilihan tepi selama pembuatan graf DiskANN. Nilai yang lebih besar menghasilkan graf yang lebih akurat tetapi meningkatkan waktu pembuatan graf.

proxima.diskann.builder.thread_count

Int

Jumlah thread untuk pembuatan indeks.

Parameter pencarian indeks DiskANN

Parameter

Tipe

Deskripsi

proxima.diskann.searcher.list_size

Int

Ukuran set kandidat hasil. Nilai yang lebih besar menghasilkan recall yang lebih tinggi tetapi meningkatkan waktu query.

proxima.diskann.searcher.io_limit

Int

Batas I/O disk untuk satu query. Maksimal io_limit operasi baca disk akan dilakukan. Ini terutama memengaruhi jumlah perjalanan graf Vamana. Nilai yang lebih besar menghasilkan recall yang lebih tinggi dan lebih banyak operasi I/O, yang meningkatkan waktu query.

proxima.diskann.searcher.beam_search_width

Int

Jumlah operasi I/O paralel.