Ikhtisar
Analyzer Teks Tiongkok Tujuan Umum (chn_standard) memecah teks berdasarkan semantik Tiongkok dan cocok untuk semua industri di seluruh jaringan. Unit pencarian merupakan granularitas minimum yang digunakan dalam analisis teks. Analyzer ini menggunakan unit pencarian untuk analisis teks serta mendukung analisis ekstensi. Sebagai contoh, jika nilai suatu bidang dalam dokumen adalah "菊花茶", hasil analisisnya adalah "菊花 茶 花茶", di mana "花茶" adalah istilah ekstensi dari "茶".
Contoh:
Konten asli: 菊花茶
Hasil analisis: 菊花 茶 花茶Campur tangan dalam analisis teks
Untuk mencampuri hasil analisis yang dihasilkan oleh Analyzer Teks Tiongkok Tujuan Umum, modifikasi kamus chn_standard.dict dalam pengaturan lanjutan, lalu publikasikan versi termodifikasi sebagai versi baru. Entri intervensi adalah entri dengan granularitas sedang. Mesin mengonversi entri intervensi menjadi unit pencarian saat melakukan pencarian. Sebagai contoh, jika Anda menambahkan "搜索引擎" sebagai entri intervensi ke dalam kamus, ketika pengguna mencari "搜索引擎", mesin menemukan kecocokan dalam kamus dan mengonversi entri tersebut menjadi istilah-istilah berikut: "搜索" dan "引擎".
Catatan penggunaan
Analyzer ini hanya berlaku untuk bidang dengan tipe data TEXT. Untuk menggunakannya, atur analyzer ke chn_standard saat mengonfigurasi skema.