LinearBuilder
Parameter | Tipe | Nilai default | Deskripsi |
proxima.linear.builder.column_major_order | string | false | Menentukan cara mengurutkan fitur dari indeks saat indeks sedang dibangun. Nilai yang valid: false dan true. false: menunjukkan bahwa fitur dari indeks diurutkan baris demi baris. true: menunjukkan bahwa fitur dari indeks diurutkan kolom demi kolom. |
QcBuilder
Parameter | Tipe | Nilai default | Deskripsi |
proxima.qc.builder.train_sample_count | uint32 | 0 | Jumlah data pelatihan. Jika Anda menetapkan nilai parameter ini ke 0, semua data dokumen ditentukan sebagai data pelatihan. |
proxima.qc.builder.thread_count | uint32 | 0 | Jumlah thread yang dapat digunakan. Jika Anda menetapkan nilai parameter ini ke 0, jumlah thread yang dapat digunakan sama dengan jumlah core CPU OpenSearch Vector Search Edition. |
proxima.qc.builder.centroid_count | string | Opsional | Jumlah centroid yang ingin Anda gunakan untuk kluster. Kluster hierarki didukung. Pisahkan tingkat kluster hierarki dengan tanda bintang (*). Contoh nilai untuk kluster hierarki dengan satu tingkat: 1000. Contoh nilai untuk kluster hierarki dengan dua tingkat: 100*100. Jika Anda ingin menentukan jumlah centroid untuk kluster hierarki dengan dua tingkat, kami sarankan Anda menentukan lebih banyak centroid untuk tingkat pertama daripada tingkat kedua. Ini memastikan hasil yang lebih baik daripada hasil yang diperoleh ketika Anda menentukan jumlah centroid yang lebih kecil untuk tingkat pertama. Poin pengalaman yang dapat diperoleh di tingkat pertama adalah 10 kali lipat dari yang ada di tingkat kedua. Jika Anda tidak menentukan jumlah centroid, sistem secara otomatis menyimpulkan jumlah centroid yang sesuai. Kami sarankan Anda membiarkan sistem secara otomatis menyimpulkan jumlah centroid. |
proxima.qc.builder.cluster_class | string | OptKmeansCluster | Metode pengelompokan. Untuk informasi lebih lanjut, lihat Parameter Kluster Proxima. |
proxima.qc.builder.cluster_auto_tuning | bool | false | Menentukan apakah akan secara otomatis mengubah jumlah centroid. |
proxima.qc.builder.cluster_params_in_level_ | IndexParams | - | Parameter yang diperlukan untuk mengonfigurasi metode pengelompokan. Untuk informasi lebih lanjut, lihat Parameter Kluster Proxima. Anda harus menentukan parameter untuk setiap tingkat dan mulai dari tingkat pertama. Contoh nilai untuk tingkat pertama: proxima.qc.builder.cluster_params_in_level_1. |
proxima.qc.builder.optimizer_class | string | HcBuilder | Jenis optimizer pembangun yang ingin Anda gunakan untuk centroid untuk meningkatkan presisi klasifikasi. Jenis optimizer pembangun menentukan jenis optimizer pencari yang digunakan untuk melakukan query terhadap centroid calon dalam skenario online. Sebagai contoh, jika Anda menetapkan nilai parameter menjadi HcBuilder, HcSearcher digunakan untuk menanyakan centroid calon dalam skenario online. Nilai yang valid: HcBuilder, HnswBuilder, SsgBuilder, dan LinearBuilder. |
proxima.qc.builder.optimizer_params | IndexParams | - | Parameter dan nilai parameter untuk optimizer pembangun dan optimizer pencari yang dikonfigurasi berdasarkan nilai parameter proxima.qc.builder.optimizer_class. Sebagai contoh, jika Anda menetapkan nilai parameter proxima.qc.builder.optimizer_class menjadi HnswBuilder, Anda dapat merujuk pada kode sampel berikut untuk menentukan parameter dan nilai parameter: proxima.hnsw.builder.max_neighbor_count: 100 proxima.hnsw.searcher.max_scan_ratio: 0.1 |
proxima.qc.builder.converter_class | string | - | Jika Anda menetapkan nilai Parameter Ukur menjadi InnerProduct, konversi mesin otomatis dilakukan dan OpenSearch Vector Search Edition menggunakan norma L2 untuk mencari dokumen. |
proxima.qc.builder.converter_params | IndexParams | - | Parameter untuk menginisialisasi proxima.qc.builder.converter_class. |
proxima.qc.builder.quantizer_class | string | - | Kuantizer. Secara default, sistem tidak menggunakan kuantizer. Nilai yang valid untuk parameter ini adalah Int8QuantizerConverter, HalfFloatConverter, dan DoubleBitConverter. Dalam kebanyakan kasus, jika Anda menentukan nilai untuk parameter ini, performa akan meningkat dan ukuran indeks akan berkurang. Namun, kerugian pengambilan mungkin terjadi dalam skenario tertentu. |
proxima.qc.builder.quantizer_params | IndexParams | - | Parameter dan nilai parameter untuk kuantizer yang Anda tentukan dengan menggunakan parameter proxima.qc.builder.quantizer_class. |
proxima.qc.builder.optimizer_quantizer_class | string | - | Nama kuantizer yang digunakan untuk melakukan kuantisasi pada centroid. |
proxima.qc.builder.optimizer_quantizer_params | IndexParams | - | Parameter dan nilai parameter untuk kuantizer yang Anda tentukan dengan menggunakan parameter proxima.qc.builder.optimizer_quantizer_class. |
proxima.qc.builder.quantize_by_centroid | bool | False | Menentukan apakah akan melakukan kuantisasi berdasarkan centroid jika Anda menentukan nilai untuk parameter proxima.qc.builder.quantizer_class. Parameter proxima.qc.builder.quantize_by_centroid hanya berlaku ketika Anda menetapkan nilai proxima.qc.builder.quantizer_class menjadi Int8QuantizerConverter. |
proxima.qc.builder.store_original_features | bool | False | Menentukan apakah akan menyimpan fitur mentah. Jika Anda menentukan nilai untuk proxima.qc.builder.quantizer_class, IndexProvider mendapatkan fitur yang telah dilakukan kuantisasi. Untuk mendapatkan fitur mentah, tetapkan nilai proxima.qc.builder.store_original_features menjadi True. |
HnswSearcher
Parameter | Tipe | Nilai default | Deskripsi |
proxima.hnsw.builder.max_neighbor_count | uint32 | 100 | Jumlah maksimum tetangga untuk sebuah node dalam graf. Nilai yang lebih besar menunjukkan konektivitas graf yang lebih baik. Secara bersamaan, biaya pembangunan dan ukuran indeks juga meningkat. |
proxima.hnsw.builder.efconstruction | uint32 | 500 | Ukuran area tetangga yang dapat dipindai saat graf sedang dibangun. Nilai yang lebih besar menunjukkan kualitas pembangunan graf offline yang lebih tinggi dan pembangunan indeks yang lebih lambat. Kami sarankan Anda menetapkan nilai ini ke 400 untuk pertama kalinya. |
proxima.hnsw.builder.thread_count | uint32 | 0 | Jumlah thread yang dapat digunakan. Jika Anda menetapkan nilai parameter ini ke 0, jumlah thread yang dapat digunakan sama dengan jumlah core CPU OpenSearch Vector Search Edition. |