Named Entity Recognition (NER) mengidentifikasi peran semantik setiap kata dalam kueri pencarian—seperti merek, kategori produk, gaya, atau istilah pemasaran—lalu menggunakan peran tersebut untuk menulis ulang klausa kueri guna menghasilkan hasil yang lebih relevan. NER hanya tersedia untuk aplikasi pencarian E-commerce.
Sebagai contoh, untuk kueri Nike Slim Dresses Delivery-free, NER menghasilkan:
| Term | Entity category |
|---|---|
| Nike | Brand |
| Slim | Element |
| Dresses | Category |
| Delivery-free | Marketing |
Analisis query kemudian menulis ulang klausa sehingga Dresses (entitas Category berprioritas tinggi) menjadi dasar pengambilan, Nike dan Slim mempersempit hasilnya, sedangkan Delivery-free hanya memengaruhi peringkat.
Cara NER menulis ulang kueri
NER memberikan tingkat prioritas pada setiap entitas yang teridentifikasi dan menggunakan tingkat tersebut untuk menghasilkan klausa kueri yang ditulis ulang.
Tingkat Prioritas Entitas
| Priority | Effect on retrieval |
|---|---|
| High | Entitas selalu digunakan untuk mengambil dokumen |
| Medium | Entitas mungkin digunakan tergantung pada proses penulisan ulang dan keberadaan entitas berprioritas tinggi |
| Low | Entitas tidak pernah digunakan untuk mengambil dokumen; hanya memengaruhi peringkat |
Analisis query menulis ulang sebuah klausa paling banyak dua kali. Penulisan ulang pertama lebih presisi, sedangkan yang kedua memperluas recall jika hasil pertama terlalu sedikit.
Aturan Penulisan Ulang
Entitas berprioritas tinggi selalu disertakan dalam pengambilan.
Entitas dengan prioritas rendah dikeluarkan dari pengambilan pada kedua tahap tersebut.
Entitas berprioritas menengah mengikuti aturan berikut (prioritas menurun sesuai urutan konfigurasi):
Jika klausa berisi entitas berprioritas tinggi, entitas berprioritas menengah disertakan dalam penulisan ulang pertama tetapi dikecualikan dari yang kedua.
Jika klausa tidak berisi entitas berprioritas tinggi, entitas berprioritas menengah disertakan dalam penulisan ulang pertama; hanya entitas dengan prioritas tertinggi yang digunakan dalam penulisan ulang kedua.
Jika klausa hanya berisi entitas berprioritas tinggi, atau hanya entitas berprioritas menengah dan rendah, analisis query menghasilkan satu penulisan ulang saja, bukan dua.
Jika klausa hanya berisi entitas berprioritas rendah atau tidak ada entitas berprioritas tinggi maupun menengah, NER tidak menulis ulang klausa tersebut.
Contoh
Contoh-contoh berikut menggunakan konfigurasi prioritas ini:
High: Category
Medium: Brand, Material, Element, Style, ColorContoh 1 — Prioritas Tinggi dan Menengah Hadir
Input: query=default:'Yang Mi Same-style Nike Slim Dresses Delivery-free'
NER result: Yang Mi (Name), Same-style (Suffix), Nike (Brand), Slim (Element),
Dresses (Category), Delivery-free (Marketing)
First rewrite: query=default:'Nike' AND default:'Slim' AND default:'Dresses'
RANK default:'Yang Mi' RANK default:'Delivery-free' RANK default:'Same-style'
Second rewrite: query=default:'Dresses'
RANK default:'Yang Mi' RANK default:'Nike' RANK default:'Delivery-free'
RANK default:'Same-style' RANK default:'Slim'Contoh 2 — Hanya Prioritas Tinggi dan Rendah
Input: query=default:'Dresses Delivery-free'
NER result: Dresses (Category), Delivery-free (Marketing)
Single rewrite: query=default:'Dresses' RANK default:'Delivery-free'Contoh 3 — Hanya Prioritas Tinggi
Input: query=default:'Dresses'
NER result: Dresses (Category)
Single rewrite: query=default:'Dresses'Contoh 4 — Hanya Prioritas Menengah dan Rendah
Input: query=default:'Nike Slim Delivery-free'
NER result: Nike (Brand), Slim (Element), Delivery-free (Marketing)
First rewrite: query=default:'Nike' AND default:'Slim' RANK default:'Delivery-free'
Second rewrite: query=default:'Nike' RANK default:'Slim' RANK default:'Delivery-free'Contoh 5 — Tidak Ada Penulisan Ulang
Input: query=default:'Yang Mi Same-style Delivery-free'
NER result: Yang Mi (Name), Same-style (Suffix), Delivery-free (Marketing)
Result: No rewrite. All entities have low priority; NER is not applied.NER dan prediksi kategori
Prediksi kategori menggunakan bobot entitas untuk menentukan kategori produk yang paling cocok dengan kueri pencarian. Untuk kueri panjang, NER meningkatkan akurasi prediksi dengan menghapus entitas yang tidak relevan langsung dengan jenis produk sebelum menjalankan prediksi. Kategori entitas berikut dipertahankan:
Category
People
Season
Element
Style
Contoh
Untuk hasil NER Yang Mi (Name), Same-style (Suffix), Spring (Season), Slim (Element), Dresses (Category), OpenSearch menjalankan prediksi kategori terhadap kombinasi berikut secara berurutan:
Spring Slim Dresses
Spring Dresses
Slim Dresses
DressesKategori entitas
NER mendukung 36 kategori entitas untuk teks E-commerce:
Common, Material, Style, Element, Color, Brand, Function, Size, Quality, Scenario, People, Suit, Season, Model, New-release, Series, Marketing, Region, Name, Entertainment, Organization, Movie, Game, Number, Unit, Category, New-word, Adjective, Proper-noun, Category-modifier, Symbol, Prefix, Suffix, Gift, Negative, Agent
Konfigurasi NER
Prasyarat
Sebelum memulai, pastikan Anda telah memiliki:
Aplikasi OpenSearch Industry Algorithm Edition
Akses ke OpenSearch console
Buat aturan analisis query dengan NER
Masuk ke OpenSearch console. Di panel navigasi kiri, klik Retrieval Configuration. Pada halaman Basic Configuration, klik Query Analysis Rule Configuration di panel kiri. Pilih aplikasi serta versi online atau offline aplikasi tersebut, lalu klik Create.

Di panel Create Rule, masukkan nama aturan, tentukan rentang indeks, atur Industry Type ke Enhanced Query Analysis for E-commerce, pilih Entity Recognition, lalu klik OK.
Di bagian Entity Priorities, Anda dapat menambah atau menghapus kategori entitas. Secara default, kamus bawaan untuk NER digunakan. Jika kategori entitas tertentu yang diidentifikasi berdasarkan kamus bawaan tidak valid, tentukan kamus intervensi sebagai gantinya.

Jalankan uji pencarian untuk memvalidasi aturan tersebut. Periksa hasil pencarian dan proses analisis query:



Setelah memastikan proses analisis query sudah benar, klik Index Orientation pada halaman Query Analysis Rule Configuration dan tetapkan aturan tersebut sebagai aturan analisis query default.

Verifikasi aturan analisis query default.

Kamus intervensi untuk NER
Makna entitas bervariasi di berbagai skenario bisnis. Gunakan kamus intervensi untuk menyesuaikan NER dalam dua cara:
Menyesuaikan hasil NER
Menyesuaikan prioritas kategori entitas
Jika hasil NER tidak sesuai harapan, buat kamus intervensi dan konfigurasikan untuk aturan analisis query tersebut. Untuk detailnya, lihat Intervention dictionaries for NER.