Ikhtisar
Pencarian kabur digunakan ketika maksud pencarian tidak jelas. Dalam pencarian ini, sistem mengambil dokumen yang relevan dengan kueri dalam mode pencocokan kabur. Jika kueri berupa ejaan pinyin lengkap atau akronim pinyin dari karakter Cina tertentu dalam dokumen, atau jika kueri terkandung dalam dokumen, dokumen tersebut dianggap relevan. Pencarian kabur dapat menghasilkan banyak dokumen yang tidak diinginkan karena sistem tidak dapat mengidentifikasi maksud pencarian secara tepat. Kami menyarankan penggunaan pencarian kabur sesuai dengan skenario bisnis aktual.
Tindakan pencegahan
Analisis pencarian kabur hanya berlaku untuk bidang bertipe SHORT_TEXT.
Dalam kebanyakan kasus, Anda dapat menggunakan tanda kutip tunggal (' ') untuk melaksanakan pencarian kabur. Bagian berikut menjelaskan situasi spesifik di mana tanda kutip ganda (" ") diperlukan.
Skema
Pencarian kabur cocok digunakan ketika maksud pencarian tidak jelas atau Anda ingin meningkatkan jumlah dokumen dalam hasil pencarian. Berikut adalah beberapa skenario pencarian kabur:
Pencarian Pinyin
Deskripsi: Dalam skenario ini, Anda dapat menggunakan kueri dalam bentuk ejaan pinyin lengkap atau singkatan pinyin untuk mengambil dokumen berisi karakter Cina.
Contoh:
Dokumen: 开放搜索
Kueri pencarian: "kai", "kaifang", "sousuo", "kaifangsousuo", "k", "kf", "ss", dan "kfss"
Semua kueri pencarian ini dapat digunakan untuk mengambil dokumen.Catatan Penggunaan:
Tanda kutip ganda (" ") digunakan dalam pencarian pinyin.
Jika Anda ingin karakter Cina yang ditentukan dalam kueri pencarian muncul secara berturut-turut dalam dokumen yang diambil, Anda dapat menyertakan kueri pencarian dalam tanda kutip ganda (" "). Dalam kebanyakan kasus, karakter Cina yang ditentukan dalam bentuk ejaan pinyin lengkap atau singkatan pinyin dalam kueri pencarian diharapkan berturut-turut dalam dokumen yang diambil. Misalnya, jika kueri pencarian adalah "kfss", "开放搜索" diharapkan terkandung dalam dokumen yang diambil. Oleh karena itu, kami menyarankan Anda menyertakan kueri pencarian dalam tanda kutip ganda (" ") untuk pencarian pinyin.
Pencarian Awalan
Deskripsi: Dalam skenario ini, Anda dapat mencari konten yang diawali oleh kueri tertentu.
Contoh:
# Dalam pencarian awalan, tanda sisip (^) digunakan sebagai pengenal awalan. Jika nomor ponsel yang diawali dengan "138" diharapkan dikembalikan,
kueri pencarian dapat dalam format "^138". Perhatikan bahwa tanda kutip ganda (" ") diperlukan.Catatan Penggunaan:
Pencarian awalan tidak mendukung karakter Cina.
Dalam pencarian awalan, Anda harus menyertakan kueri pencarian dalam tanda kutip ganda (" ").
Pencarian Akhiran
Deskripsi: Dalam skenario ini, Anda dapat mencari konten yang diakhiri oleh kueri tertentu.
Contoh:
# Dalam pencarian akhiran, tanda dolar ($) digunakan sebagai pengenal akhiran. Jika nomor ponsel yang diakhiri dengan "9527" diharapkan dikembalikan,
kueri pencarian dapat dalam format "9527$". Perhatikan bahwa tanda kutip ganda (" ") diperlukan.Catatan Penggunaan:
Pencarian akhiran tidak mendukung karakter Cina.
Dalam pencarian akhiran, Anda harus menyertakan kueri pencarian dalam tanda kutip ganda (" ").
Pencarian Karakter atau Kata Tunggal
Deskripsi: Dalam skenario ini, Anda dapat mencari konten tertentu dengan menentukan kueri dalam bentuk karakter atau kata tunggal. Jenis pencarian ini cocok untuk memperoleh lebih banyak dokumen tetapi hasilnya mungkin kurang akurat.
Contoh:
# Dokumen: '开放搜索 open search'
Klausa kueri: query=default:'放' or query=default:'o'. Kedua klausa kueri tersebut dapat digunakan untuk mengambil dokumen.Pencarian Frasa
Deskripsi: Dalam skenario ini, kueri harus disertakan dalam tanda kutip ganda (" "). Hanya dokumen yang mengandung string huruf dan angka berurutan dalam kueri yang akan diambil.
Contoh:
# Klausa kueri 1: query=default:"OpenSearch"
Dalam hal ini, hanya dokumen yang mengandung "xxxOpenSearchxxx" yang dapat diambil. Dokumen yang mengandung "xxxSearchOpenxxx" tidak dapat diambil.
# Klausa kueri 2: query=default:"HUAWEIP"
Dalam hal ini, dokumen yang mengandung "HUAWEIP20" tidak dapat diambil. Ini karena "HUAWEIP20" tidak terkandung dalam klausa kueri sebagai string huruf dan angka berturut-turut. Jika Anda ingin menggunakan klausa kueri ini untuk mendapatkan dokumen yang mengandung "HUAWEIP20", sertakan kueri pencarian dalam tanda kutip tunggal (' ').
Catatan Penggunaan:
Dalam pencarian frasa, kueri harus disertakan dalam tanda kutip ganda (" ").
Pencarian frasa membantu meningkatkan akurasi hasil dan mengurangi jumlah dokumen yang diambil, tetapi jenis pencarian ini memerlukan lebih banyak sumber daya. Disarankan menggunakan analis teks Cina serbaguna dalam pencarian frasa.
Pencarian kabur cocok jika maksud pencarian tidak jelas atau Anda ingin lebih banyak dokumen dikembalikan dalam hasil pencarian. Kecuali untuk pencarian pinyin, pencarian awalan, pencarian akhiran, dan pencarian frasa, Anda harus menyertakan kueri pencarian dalam tanda kutip tunggal (' ').
Batasan
Untuk menggunakan fitur pencarian kabur, saat membuat aplikasi, Anda harus menetapkan bidang yang digunakan untuk pencarian kabur sebagai tipe SHORT_TEXT dan menentukan analis untuk pencarian kabur. Secara default, dokumen hasil pencarian kabur diurutkan berdasarkan urutan istilah yang cocok dalam nilai bidang. Misalnya, jika Anda menggunakan bidang judul untuk pencarian kabur, dokumen doc1 yang berisi "开放搜索" akan diurutkan sebelum dokumen doc2 yang berisi "喜欢使用开放搜索" jika kueri adalah "kfss". Perhatikan aturan berikut saat melaksanakan pencarian kabur:
Anda tidak dapat melakukan pencarian awalan atau akhiran untuk kueri yang mengandung karakter Cina. Kueri yang hanya mengandung huruf, angka, dan pinyin didukung.
Tanda baca dalam nilai bidang tipe SHORT_TEXT disaring.
Setelah tanda baca disaring dari bidang tipe SHORT_TEXT, hingga 100 byte dari nilai bidang dapat dipertahankan. Bagian yang berlebih dibuang.
Anda dapat membuat model saran drop-down berdasarkan bidang tipe SHORT_TEXT.
Anda tidak dapat menggunakan fitur analisis kueri untuk indeks yang dibuat berdasarkan bidang tipe SHORT_TEXT.
Jika hanya analis pencarian kabur yang digunakan untuk bidang tipe SHORT_TEXT dalam pembuatan indeks, karakter lebar penuh diubah menjadi karakter setengah lebar dalam ringkasan hasil pencarian. Untuk mencegah konversi, gunakan analis bahasa Cina untuk membuat indeks.
Dalam ringkasan hasil pencarian, huruf, angka, dan pinyin tidak dapat disorot dengan warna merah.