Penilaian niat berdasarkan kata kunci dalam query pencarian menentukan apakah hasil pencarian memenuhi persyaratan. Query Planner adalah fitur yang digunakan untuk memahami maksud query di OpenSearch. Query Planner melakukan analisis cerdas pada query pencarian, menulis ulang query tersebut, dan mengirimkannya ke mesin pencari. Selanjutnya, mesin pencari mengambil serta mengurutkan data berdasarkan query pencarian. Anda dapat menggunakan fitur-fitur berikut untuk analisis query: konfigurasi sinonim, penyaringan stop word, koreksi ejaan, analisis bobot istilah, dan prediksi kategori. Selain itu, Anda dapat menggunakan fitur pengenalan entitas bernama (NER) dalam skenario E-commerce. Bagian berikut menjelaskan fitur analisis query dan menunjukkan cara melakukan analisis query dalam skenario E-commerce.
Penyaringan Stop Word
Kata-kata tanpa makna dalam query pencarian disaring berdasarkan kamus stop word bawaan. Kata-kata tanpa makna adalah kata-kata yang muncul dengan frekuensi tinggi tetapi tidak memengaruhi hasil pencarian, seperti tanda baca dan partikel modal.
Koreksi Ejaan
Jika query pencarian yang dimasukkan mengandung kesalahan ejaan, hasil pencarian mungkin tidak sesuai harapan atau bahkan tidak ada hasil yang dikembalikan. Untuk menyelesaikan masalah ini, OpenSearch memeriksa ejaan dari query pencarian yang dimasukkan. Fitur koreksi ejaan dalam analisis query OpenSearch memperbaiki kesalahan ejaan yang terkandung dalam query pencarian dan menghasilkan query baru dengan kesalahan yang diperbaiki. Kemudian, OpenSearch menentukan apakah akan menggunakan query baru tersebut untuk pencarian berdasarkan kredibilitas koreksi ejaan.
Analisis Bobot Istilah
Fitur analisis bobot istilah mengevaluasi pentingnya setiap istilah dalam query pencarian dan mengkuantifikasinya sebagai bobot. OpenSearch mungkin tidak menggunakan istilah dengan bobot rendah untuk mengambil dokumen. Hal ini membantu meningkatkan jumlah dokumen yang diambil. Jika query pencarian yang dimasukkan mengandung istilah dengan bobot rendah dan istilah tersebut terlibat dalam proses pengambilan dokumen, hanya sejumlah kecil dokumen yang mungkin diambil berdasarkan query pencarian tersebut.
Konfigurasi Sinonim
Query pencarian yang dimasukkan mungkin memiliki sinonim yang membawa arti yang sama. Misalnya, ketika mencari telepon Apple, konten terkait iPhone juga dapat diambil dan ditampilkan dalam hasil pencarian. Dalam kehidupan nyata, banyak sinonim yang membawa arti yang sama mungkin ada. Query pencarian tunggal yang dimasukkan mungkin tidak mencerminkan semua sinonimnya. Kemampuan untuk mengidentifikasi sinonim dan melakukan pencarian berdasarkan sinonim sangat penting untuk meningkatkan laju pengambilan. Fitur konfigurasi sinonim OpenSearch mengambil dokumen berdasarkan sinonim dari query pencarian, sehingga meningkatkan jumlah dokumen yang diambil.
NER
Fitur NER mengenali entitas semantik dengan makna spesifik dalam query pencarian. Fitur analisis query menulis ulang klausa query berdasarkan bobot kategori entitas yang diidentifikasi untuk memastikan bahwa dokumen yang diambil memenuhi harapan. OpenSearch menulis ulang klausa query berdasarkan prioritas entitas. Entitas dengan prioritas lebih tinggi digunakan untuk mengambil dokumen, sedangkan entitas dengan prioritas lebih rendah tidak memengaruhi pengambilan tetapi memengaruhi pengurutan.
Contoh melakukan analisis query dalam skenario E-commerce
Sebagai contoh, query pencarian berikut digunakan:Yang Mi Gaya Sama Nike Gaun Slim Pengiriman-gratis.. Contoh berikut menunjukkan klausa query yang belum dianalisis:
query=(default:'Yang Mi' AND default:'Gaya Sama' AND default:'Nike' AND default:'Slim' AND default:'Dr' AND default:'ass' AND default:'es' AND default:'Pengiriman-gratis' AND default:'.')Setelah penyaringan stop word, klausa query berikut diperoleh:
query=(default:'Yang Mi' AND default:'Gaya Sama' AND default:'Nike' AND default:'Slim' AND default:'Dr' AND default:'ass' AND default:'es' AND default:'Pengiriman-gratis')
// Setelah penyaringan stop word, tanda baca dalam query pencarian disaring.Setelah koreksi ejaan, klausa query berikut diperoleh:
query=(default:'Yang Mi' AND default:'Gaya Sama' AND default:'Nike' AND default:'Slim' AND default:'Gaun' AND default:'Pengiriman-gratis')
// Dalam contoh ini, istilah "Drasses" dengan kesalahan ejaan dalam query pencarian diperbaiki.Setelah analisis bobot istilah, klausa query berikut diperoleh:
query1=(default:'Yang Mi' AND default:'Gaya Sama' AND default:'Nike' AND default:'Slim' AND default:'Gaun' RANK default:'Pengiriman-gratis')
query2=(default:'Yang Mi' RANK default:'Slim' RANK default:'Pengiriman-gratis' RANK default:'Gaya Sama' RANK default:'Nike' RANK default:'Gaun')
// Setelah analisis bobot istilah, istilah "Pengiriman-gratis" dengan bobot lebih rendah tidak terlibat dalam proses pengambilan. Jika tidak ada hasil yang dikembalikan berdasarkan query1, mesin pencari secara otomatis memicu pencarian lagi dan mengembalikan hasil berdasarkan query2. Dengan cara ini, hasil dapat dikembalikan.Setelah konfigurasi sinonim, klausa query berikut diperoleh:
query1=(default:'Yang Mi' AND default:'Gaya Sama' AND ((default:'Nike') OR (default:'nike')) AND default:'Slim' AND default:'Gaun' RANK default:'Pengiriman-gratis')
query2=(default:'Yang Mi' RANK ((default:'Nike') OR (default:'nike')) RANK default:'Slim' RANK default:'Pengiriman-gratis' RANK default:'Gaya Sama' RANK default:'Gaun')
// Dalam contoh ini, "nike" ditambahkan sebagai sinonim untuk "Nike" setelah konfigurasi sinonim. Jika tidak ada hasil yang dikembalikan berdasarkan query1, mesin pencari secara otomatis memicu pencarian lagi dan mengembalikan hasil berdasarkan query2. Dengan cara ini, hasil dapat dikembalikan.Setelah NER, klausa query berikut diperoleh:
query1=(default:'Yang Mi' AND ((default:'Nike') OR (default:'nike')) AND default:'Slim' AND default:'Gaun' RANK default:'Pengiriman-gratis' RANK default:'Gaya Sama')
query2=(((default:'Nike') OR (default:'nike')) AND default:'Gaun' RANK default:'Slim' RANK default:'Pengiriman-gratis' RANK default:'Gaya Sama' RANK default:'Yang Mi')
// Hasil NER berikut diperoleh: Yang Mi (nama) Gaya Sama (akhiran) Nike atau nike (merek) Slim (elemen gaya) Gaun (kategori) Pengiriman-gratis (pemasaran).
Entitas dengan prioritas lebih tinggi digunakan untuk mengambil dokumen, sedangkan entitas dengan prioritas lebih rendah tidak memengaruhi pengambilan tetapi memengaruhi pengurutan. Jika tidak ada hasil yang dikembalikan berdasarkan query1,
mesin pencari secara otomatis memicu pencarian lagi dan mengembalikan hasil berdasarkan query2. Dengan cara ini, hasil dapat dikembalikan.Konfigurasikan fitur analisis query di konsol
Langkah 1: Masuk ke konsol OpenSearch. Di panel navigasi di sebelah kiri, pilih Pusat Algoritma Pencarian > Konfigurasi Pengambilan. Di halaman Konfigurasi Pengambilan, klik Konfigurasi Aturan Analisis Query di panel sebelah kiri. Di halaman Konfigurasi Aturan Analisis Query, klik Buat untuk membuat aturan analisis query.
Langkah 2: Di panel Tambah Aturan, konfigurasikan parameter sesuai kebutuhan, seperti parameter Nama Aturan, Rentang Indeks, Jenis Industri, dan parameter Fitur yang Diaktifkan. Anda dapat mengatur parameter Fitur yang Diaktifkan ke beberapa nilai.
Langkah 3: Setelah membuat aturan, lakukan tes pencarian. Setelah mengonfirmasi bahwa proses analisis query benar, atur aturan sebagai aturan default dan terapkan aturan ke query online.
Di halaman Konfigurasi Aturan Analisis Query, klik Orientasi Indeks dan atur aturan sebagai aturan default.