Ikhtisar
Analisis merupakan fitur dasar namun penting dalam mesin pencari. Hasil analisis secara langsung memengaruhi performa pencarian. Makna sebuah frase bervariasi tergantung pada skenario bisnis dan konteks yang berbeda. Oleh karena itu, hasil analisis yang diharapkan akan berubah sesuai dengan skenario bisnis tertentu. Selain penganalisis dasar yang berlaku untuk semua industri, OpenSearch menyediakan penganalisis spesifik industri, seperti penganalisis teks untuk industri E-commerce.
Untuk memenuhi kebutuhan bisnis yang beragam, OpenSearch memungkinkan Anda membuat penganalisis kustom menggunakan penganalisis bawaan dan entri intervensi. Anda dapat memilih penganalisis saat mengonfigurasi bidang indeks untuk aplikasi. Dengan cara ini, OpenSearch dapat menyesuaikan proses analisis selama pengindeksan dan pencarian guna memastikan hasil pencarian sesuai dengan harapan Anda.
Entri intervensi
Anda dapat mengelola entri intervensi menggunakan fitur analisis sekunder.
Jika Anda mengaktifkan analisis sekunder, teks dalam hasil penganalisis kustom asli akan dibagi lagi menjadi segmen. Jika Anda menonaktifkan analisis sekunder, hasil penganalisis kustom asli dipertahankan.
Sebagai contoh, entri adalah "开放搜索" dan penganalisis umum untuk teks Cina digunakan. Gambar berikut menunjukkan hasil dengan analisis sekunder diaktifkan.

Gambar berikut menunjukkan hasil dengan analisis sekunder dinonaktifkan.

Catatan penggunaan
Entri dalam penganalisis kustom mencakup semua entri untuk jenis penganalisis yang ditentukan serta entri yang ditambahkan secara manual ke penganalisis. Entri yang ditambahkan secara manual memiliki prioritas lebih tinggi daripada entri untuk jenis penganalisis yang ditentukan.
Hingga 20 penganalisis kustom dapat dibuat di konsol OpenSearch baru.
Penganalisis kustom dapat berisi hingga 1.000 entri intervensi.
Panjang kunci setiap entri tidak boleh melebihi 10 karakter, dan panjang nilai setiap entri tidak boleh melebihi 32 karakter. Setiap karakter bisa berupa karakter Cina atau huruf.
Kunci dan nilai entri tidak boleh mengandung huruf kapital, karakter lebar penuh, atau tanda baca Cina.
Kunci dan nilai entri intervensi untuk analisis berbasis semantik harus sama setelah spasi dalam nilai dihapus. Contoh entri:
Kuncinya adalah "不正确的词条", dan nilainya adalah "错误 的 词条". Kuncinya adalah "正确的词条", dan nilainya adalah "正确 的 词条".Entri pertama tidak valid karena kuncinya tidak sama dengan nilai setelah spasi dihapus.
Kunci entri tidak boleh mengandung spasi. Contoh entri:
Kuncinya adalah "不正确 词条", dan nilainya adalah "不 正确 词条". Kuncinya adalah "正确词条", dan nilainya adalah "正确 词条".Entri pertama tidak valid karena kuncinya mengandung spasi.
Kunci entri tidak boleh menjadi bagian dari nilai entri lain dalam kamus intervensi yang sama. Contoh entri:
Kuncinya adalah "自定义分词器", dan nilainya adalah "自定义 分词器". Kuncinya adalah 分词器. Kuncinya adalah 分词.Entri kedua tidak valid karena kuncinya "分词器" merupakan bagian dari nilai entri pertama. Entri ketiga valid.
Membuat dan menggunakan penganalisis kustom
Proses
1. Buat penganalisis kustom. 2. Modifikasi versi offline aplikasi. 3. Lakukan pengindeksan ulang. 4. Gunakan penganalisis kustom.
Prosedur
1. Masuk ke konsol OpenSearch. Di panel navigasi sebelah kiri, pilih Pusat Algoritma Pencarian > Konfigurasi Pengambilan. Di halaman Konfigurasi Dasar, klik Manajemen Penganalisis di panel sebelah kiri. Di halaman Manajemen Penganalisis, klik Buat di tab Penganalisis Teks.

2. Di panel Buat Penganalisis, masukkan nama penganalisis, pilih jenis penganalisis, pilih penganalisis, lalu klik Simpan.

3. Di tab Penganalisis Teks, temukan penganalisis kustom yang telah dibuat dan klik Kelola Entri di kolom Tindakan. Di halaman Kelola Entri, klik Tambah. Di panel Tambah Entri Intervensi, konfigurasikan parameter Kueri Pencarian dan Hasil Analisis, serta aktifkan Analisis Sekunder. Dalam contoh ini, frasa "糯米" digunakan.

Catatan: Pisahkan istilah dengan spasi. Contoh: Kuncinya adalah "糯米", dan nilainya adalah "糯 米".
4. Jalankan tes analisis untuk memeriksa hasil analisis setelah entri intervensi yang ditambahkan mulai berlaku.

Masukkan 糯米 di bidang Teks Uji.

Gambar berikut menunjukkan hasil analisis dari beberapa penganalisis kustom.

5. Setelah tes analisis selesai, pergi ke halaman Konfigurasi Dasar untuk memodifikasi versi offline aplikasi.

Catatan: OpenSearch menghasilkan versi offline untuk aplikasi berdasarkan pengaturan yang dimodifikasi untuk versi online aplikasi. Jika Anda memodifikasi aplikasi offline, aplikasi online tidak terpengaruh.
6. Di bagian Daftar Bidang Indeks, temukan indeks yang ingin dikonfigurasi dengan penganalisis kustom dan pilih penganalisis kustom dari daftar drop-down di kolom Metode Analisis.

7. Tunggu hingga penganalisis kustom mulai berlaku setelah pengindeksan ulang.

Hasil Pencarian Penganalisis Kustom
Sebagai contoh, Anda menggunakan penganalisis umum untuk teks Cina, tetapi dokumen yang berisi "糯米", "小米", atau "大米" tidak dapat ditemukan saat Anda mencari "米".
Dalam kasus ini, Anda dapat melakukan operasi sebelumnya untuk membuat penganalisis kustom bernama test_zw. Setelah Anda memodifikasi skema aplikasi tempat penganalisis kustom dikonfigurasikan dan melakukan pengindeksan ulang, dokumen dapat ditemukan sesuai harapan, seperti yang ditunjukkan pada gambar berikut.
Catatan Penggunaan
Konsol OpenSearch baru memungkinkan Anda menambahkan entri intervensi ke penganalisis kustom yang ada. Jika Anda menambahkan entri intervensi ke penganalisis kustom yang digunakan oleh aplikasi, entri intervensi tersebut mulai berlaku hanya setelah pengindeksan ulang dilakukan. Jika Anda ingin entri intervensi mulai berlaku secepat mungkin, Anda dapat memperbarui dokumen yang hasil analisisnya tidak sesuai harapan untuk memicu pengindeksan ulang.
Kunci entri dalam penganalisis kustom tidak boleh melebihi 10 karakter panjangnya.
Kunci entri dalam penganalisis kustom tidak boleh mengandung huruf kapital, karakter lebar penuh, atau tanda baca Cina.
Nilai entri dalam penganalisis kustom tidak boleh mengandung huruf kapital, karakter lebar penuh, atau tanda baca Cina.
Jika Anda menonaktifkan analisis sekunder, OpenSearch tidak akan membagi istilah yang dihasilkan pertama kali. Sebaliknya, OpenSearch akan membagi istilah lebih lanjut.
Hanya aplikasi Edisi Peningkatan Spesifik Industri yang dapat menggunakan penganalisis kustom yang dibuat berdasarkan penganalisis umum untuk teks dari industri E-commerce.
Anda tidak dapat menghapus penganalisis kustom yang digunakan oleh aplikasi.