Kueri data - OpenSearch

OpenSearch Vector Search Edition mendukung berbagai metode kueri data untuk memenuhi kebutuhan kueri yang berbeda.

Kueri hibrida: Kueri ini dilakukan berdasarkan teks dan vektor, memanfaatkan data terstruktur dan tidak terstruktur untuk meningkatkan akurasi hasil.
Vektor mencakup vektor padat dan vektor jarang. Skor keseluruhan vektor dihitung berdasarkan jumlah jarak vektor padat dan jarak vektor jarang. Dalam kasus Jarak Euclidean (SquareEuclidean), semakin dekat jarak antara vektor, semakin tinggi kemiripannya.
Skor keseluruhan teks ditentukan oleh tingkat kecocokan kata kunci. Semakin tinggi tingkat kecocokan, semakin tinggi skor teks. Skor komprehensif akhir adalah jumlah dari skor vektor dan skor teks. Skor vektor kecil dan skor teks besar lebih disukai. Semakin besar skor komprehensif, semakin tinggi relevansi dokumen. OpenSearch Vector Search Edition memungkinkan Anda mengonfigurasi bobot untuk menyeimbangkan pengaruh skor vektor dan skor teks. Sebagai contoh, Anda dapat mengurangi bobot skor vektor dan meningkatkan bobot skor teks untuk mencapai hasil pencarian yang lebih baik.
Kueri berbasis vektor: Anda dapat mengimpor data vektor yang dihasilkan ke dalam instance Vector Search Edition dan melakukan kueri berbasis vektor.
Kueri berbasis multi-vektor untuk satu dokumen: Anda dapat menyimpan beberapa vektor dalam bidang vektor dokumen untuk kueri data.
Multi-kueri: Anda dapat mengirim beberapa permintaan kueri sekaligus, meningkatkan efisiensi kueri dan kecepatan respons.
Kueri berbasis prediksi: Setelah mengonversi teks dan gambar menjadi vektor menggunakan model vektorisasi bawaan Vector Search Edition, Anda dapat menggunakan teks atau gambar untuk melakukan kueri berbasis prediksi.
Kueri berbasis kunci utama: Dokumen dapat diidentifikasi berdasarkan pengenal unik, memastikan akses data yang efisien.
Ekspresi filter: Anda dapat menentukan kondisi filter untuk menyaring dokumen, meningkatkan penyaringan data.
Indeks terbalik: Indeks terbalik dapat membantu mempercepat kueri teks penuh, dengan cepat mengidentifikasi dokumen, dan meningkatkan kinerja kueri.