Penganalisis kata kunci
Perkenalan: Penganalisis ini tidak membagi teks menjadi istilah. Cocok untuk pencarian tepat, seperti tag, kata kunci, string yang diproses secara keseluruhan, dan angka.
Catatan: Penganalisis ini berlaku untuk bidang bertipe LITERAL, ARRAY, dan INT.
Contoh:
Jika nilai suatu bidang adalah "菊花茶" dalam dokumen dan penganalisis kata kunci diaktifkan, dokumen tersebut hanya dapat diambil ketika pengguna mencari "菊花茶".
Penganalisis umum untuk bahasa Tiongkok
Perkenalan: Penganalisis ini membagi teks berdasarkan unit pencarian sesuai dengan semantik Tiongkok. Merupakan penganalisis umum yang cocok untuk sebagian besar industri dan bersifat spesifik industri.
Catatan: Penganalisis ini berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Contoh:
Jika nilai suatu bidang adalah "菊花茶" dalam dokumen dan penganalisis umum untuk bahasa Tiongkok diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "菊花茶", "菊花", "茶", atau "花茶".
Penganalisis e-commerce untuk bahasa Tiongkok
Perkenalan: Penganalisis ini dirancang untuk industri e-commerce.
Catatan: Penganalisis ini berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Contoh:
Jika nilai suatu bidang adalah "大宝SOD蜜" dalam dokumen dan penganalisis e-commerce untuk bahasa Tiongkok diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "大宝", "sod", "sod蜜", "SOD蜜", atau "蜜".
Penganalisis karakter tunggal untuk bahasa Tiongkok
Perkenalan: Penganalisis ini membagi teks menjadi karakter Tiongkok dan kata-kata. Cocok untuk pencarian non-semantik Tiongkok, seperti nama penulis atau nama toko.
Catatan: Penganalisis ini berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Contoh:
Jika nilai suatu bidang adalah "菊花茶" dalam dokumen dan penganalisis karakter tunggal untuk bahasa Tiongkok diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "菊花茶", "菊花", "茶", "花茶", "菊", "花", atau "菊茶".
Penganalisis kabur
Perkenalan: Penganalisis ini mendukung pencarian berdasarkan pinyin, awalan/akhiran, serta huruf tunggal. Teks Tiongkok tidak mendukung pencarian awalan/akhiran, tetapi huruf, angka, dan pinyin mendukungnya. Penganalisis ini hanya mendukung bidang berukuran maksimal 100 byte. Untuk informasi lebih lanjut, lihat Pencarian Kabur.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe SHORT_TEXT.
Contoh:
Jika nilai suatu bidang adalah "菊花茶" dalam dokumen dan penganalisis kabur diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "菊花茶", "菊花", "茶", "花茶", "菊", "花", "菊茶", "ju", "juhua", "juhuacha", "j", "jh", atau "jhc".
Jika nilai suatu bidang adalah nomor ponsel "138****5678" dalam dokumen dan penganalisis kabur diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "^138" atau "5678$." "^138" menginstruksikan sistem untuk mencari semua nomor yang dimulai dengan "138". "5678$" menginstruksikan sistem untuk mencari semua nomor yang diakhiri dengan "5678".
Jika nilai suatu bidang adalah "OpenSearch" dalam dokumen dan penganalisis kabur diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari huruf tunggal yang terkandung dalam nilai tersebut atau kombinasi huruf-huruf tersebut.
Penganalisis derivasi kata untuk bahasa Inggris
Perkenalan: Penganalisis ini menurunkan setiap kata bahasa Inggris ke bentuk dasarnya. Cocok untuk pencarian berbasis semantik bahasa Inggris.
Catatan: Penganalisis ini berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Contoh:
Jika nilai suatu bidang adalah "英文分词器 english analyzer" dalam dokumen dan penganalisis derivasi kata untuk bahasa Inggris diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "英文分词器", "english", "analyz", "analyzer", "analyzers", "analyze", "analyzed", atau "analyzing".
Perhatikan bahwa penganalisis teks bahasa Inggris menganalisis karakter Tiongkok berturut-turut sebagai satu kata.Penganalisis kata tanpa derivasi untuk bahasa Inggris
Perkenalan: Penganalisis ini membagi teks berdasarkan spasi dan tanda baca. Cocok untuk pencarian non-semantik bahasa Inggris, seperti judul buku atau nama penulis.
Catatan: Penganalisis ini berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Contoh:
Jika nilai suatu bidang adalah "英文分词器 english analyzer" dalam dokumen dan penganalisis kata tanpa derivasi untuk bahasa Inggris diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "英文分词器", "english", atau "analyzer".
Perhatikan bahwa penganalisis teks bahasa Inggris menganalisis karakter Tiongkok berturut-turut sebagai satu kata.Penganalisis untuk analisis rinci untuk bahasa Inggris
Perkenalan: Penganalisis ini membagi teks berdasarkan unit pencarian sesuai dengan semantik bahasa Inggris. Merupakan penganalisis umum untuk analisis teks bahasa Inggris di industri umum.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Penganalisis ini bersifat spesifik aplikasi eksklusif.
Contoh:
Jika nilai suatu bidang adalah "dataprocess" dalam dokumen dan penganalisis untuk analisis rinci untuk bahasa Inggris diaktifkan, hasil analisisnya adalah "data process". Dalam hal ini, dokumen tersebut dapat diambil ketika pengguna mencari "dataprocess", "data process", "data", atau "process".
Penganalisis ejaan pinyin lengkap
Perkenalan: Penganalisis ini memungkinkan pengguna mencari karakter Tiongkok dalam teks pendek menggunakan ejaan pinyin lengkap atau huruf pertama dari ejaan pinyin singkat. Cocok untuk pencarian berbasis ejaan pinyin lengkap atau singkat, seperti nama film atau nama penulis.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe SHORT_TEXT.
Contoh:
Jika nilai suatu bidang adalah "大内密探007" dalam dokumen dan penganalisis ejaan pinyin lengkap diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "d", "dn", "dnm", "dnmt", "dnmt007", "da", "danei", "daneimi", atau "daneimitan". Dokumen tersebut tidak dapat diambil ketika pengguna mencari "an" atau "anei".
Penganalisis ejaan pinyin singkat
Perkenalan: Penganalisis ini memungkinkan pengguna mencari karakter Tiongkok dalam teks pendek menggunakan huruf dari ejaan pinyin singkat. Cocok untuk pencarian berbasis ejaan pinyin singkat, seperti nama film atau nama penulis.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe SHORT_TEXT.
Contoh:
Jika nilai suatu bidang adalah "大内密探007" dalam dokumen dan penganalisis ejaan pinyin singkat diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "d", "dn", "dnm", "dnmt", "dnmt0", "damt007", "m", "mt", "mt007", atau "007".
Penganalisis sederhana
Perkenalan: Penganalisis ini memberikan kontrol penuh atas pencarian. Cocok untuk skenario khusus di mana penganalisis bawaan lainnya tidak dapat memenuhi persyaratan. Dalam dokumen dan kueri, karakter tab (\t) digunakan untuk memisahkan istilah dalam nilai bidang dan kueri pencarian. Pastikan nilai bidang dan kueri dibagi dengan cara yang sama; jika tidak, dokumen tidak dapat diambil.
Catatan: Penganalisis ini berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Contoh:
Jika nilai suatu bidang adalah "菊\t花茶\thao" dalam dokumen dan penganalisis sederhana diaktifkan, dokumen tersebut hanya dapat diambil ketika pengguna mencari "菊", "花茶", "菊\t花茶", "花茶\thao", "菊\thao", atau "菊\t花茶\thao".
Penganalisis nilai numerik
Perkenalan: Penganalisis ini cocok untuk pencarian berdasarkan interval waktu atau rentang nilai numerik.
Catatan: Penganalisis ini berlaku untuk bidang bertipe INT dan TIMESTAMP.
Contoh:
query=default:'开放搜索' AND index:[number1,number2]
// Dalam contoh ini, index adalah nama indeks tempat penganalisis nilai numerik dikonfigurasikan.
Penganalisis lokasi geografis
Perkenalan: Penganalisis ini cocok untuk pencarian berdasarkan lokasi geografis.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe GEO_POINT.
Contoh:
query=spatial_index:'circle(116.5806 39.99624, 1000)'
// Meminta lokasi geografis dalam lingkaran yang radiusnya bisa beberapa kilometer.Penganalisis konten IT
Perkenalan: Penganalisis ini dirancang untuk konten teknis di industri IT. Dibandingkan dengan penganalisis umum, penganalisis ini membagi teks terkait IT dengan cara yang berbeda.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Contoh:
Konten asli: c++数组使用注意事项
Penganalisis umum: c ++数组使用注意事项
Penganalisis konten IT: c++数组使用注意事项Penganalisis umum untuk E-commerce untuk bahasa Tiongkok
Perkenalan: Penganalisis ini cocok untuk skenario industri e-commerce dan bersifat spesifik industri. Dengan pengalaman industri yang terakumulasi selama bertahun-tahun dan teknologi Natural Language Processing dari Akademi DAMO, OpenSearch menyediakan kemampuan analisis kueri yang didedikasikan untuk industri e-commerce.
Catatan Penggunaan:
Penganalisis ini hanya berlaku untuk teks bertipe TEXT.
Penganalisis ini spesifik untuk aplikasi eksklusif Edisi Khusus Industri untuk E-commerce.
Contoh:
Konten asli: 小金管遮瑕膏
Penganalisis umum: 小金管遮瑕膏
Penganalisis umum untuk E-commerce untuk bahasa Tiongkok: 小金管 遮瑕 膏Penganalisis umum untuk bahasa Thai
Perkenalan: Penganalisis ini membagi teks Thai berdasarkan unit pencarian. Merupakan penganalisis umum yang berlaku untuk analisis teks Thai di industri umum.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Penganalisis ini bersifat spesifik untuk aplikasi eksklusif.
Contoh:
Jika nilai suatu bidang adalah "แหล่งดึงดูดนักท่องเที่ยว" dalam dokumen dan penganalisis umum untuk bahasa Thai diaktifkan, hasil analisisnya adalah "แหล่ง ดึง ดูด นักท่องเที่ยว". Dalam hal ini, dokumen tersebut dapat diambil ketika pengguna mencari "นักท่องเที่ยว" atau "แหล่งดึงดูดนักท่องเที่ยว".
Penganalisis untuk E-commerce untuk bahasa Thai
Perkenalan: Penganalisis ini berlaku untuk analisis teks Thai di industri e-commerce.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Penganalisis ini bersifat spesifik untuk aplikasi eksklusif.
Contoh:
Jika nilai suatu bidang adalah "หน้าจอโทรศัพท์" dalam dokumen dan penganalisis untuk E-commerce untuk bahasa Thai diaktifkan, hasil analisisnya adalah "น้าจอ โทรศัพท์". Dalam hal ini, dokumen tersebut dapat diambil ketika pengguna mencari "หน้าจอโทรศัพท์", "หน้าจอ", atau "โทรศัพท์".Penganalisis umum untuk bahasa Vietnam
Perkenalan: Penganalisis ini berlaku untuk analisis teks Vietnam di industri umum.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Penganalisis ini spesifik untuk aplikasi eksklusif.
Penganalisis umum untuk Gaming
Perkenalan: Penganalisis ini berlaku untuk industri gaming.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Penganalisis ini bersifat spesifik untuk aplikasi eksklusif Edisi Khusus Industri untuk Gaming.
Contoh:
Jika nilai suatu bidang adalah "原神装备" dalam dokumen dan penganalisis umum untuk gaming diaktifkan, hasil analisisnya adalah "原神 装备". Dalam hal ini, dokumen tersebut dapat diambil ketika pengguna mencari "原神装备", "原神", atau "装备".Penganalisis umum untuk E-commerce untuk bahasa Inggris
Perkenalan: Penganalisis ini berlaku untuk industri e-commerce dalam skenario bahasa Inggris.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe TEXT.
Penganalisis ini spesifik untuk aplikasi eksklusif Edisi Khusus Industri untuk E-commerce.
Penganalisis karakter untuk bahasa Tiongkok
Perkenalan: Penganalisis ini membagi teks berdasarkan karakter Tiongkok, angka, huruf bahasa Inggris, dan tanda baca. Cocok untuk pencarian non-semantik Tiongkok.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Penganalisis ini bersifat spesifik untuk aplikasi eksklusif.
Contoh:
Jika nilai suatu bidang adalah "开放搜索OpenSearch123" dalam dokumen dan penganalisis karakter untuk bahasa Tiongkok diaktifkan, dokumen tersebut dapat diambil ketika pengguna mencari "开", "放", "搜", "索", "O", "p", "e", "n", "S", "e", "a", "r", "c", "h", atau ".".
Penganalisis kustom untuk teks
Perkenalan: Penganalisis ini menggabungkan penganalisis spesifik industri (seperti penganalisis umum, penganalisis e-commerce, atau penganalisis nama orang) dengan entri intervensi kustom. Untuk informasi lebih lanjut, lihat Penganalisis Kustom.
Catatan: Penganalisis ini hanya berlaku untuk bidang bertipe TEXT dan SHORT_TEXT.
Pengujian penganalisis
Anda dapat menguji penganalisis spesifik industri atau penganalisis kustom untuk memeriksa hasil analisisnya. Masuk ke konsol OpenSearch. Di panel navigasi sebelah kiri, pilih Pusat Algoritma Pencarian > Konfigurasi Pengambilan. Di halaman Konfigurasi Dasar, klik Manajemen Penganalisis di panel sebelah kiri. Di halaman Manajemen Penganalisis, temukan penganalisis yang ingin Anda uji dan klik Uji Analisis Kata di kolom Tindakan. Lihat gambar berikut.

Skenario
Dalam skenario pencarian berbasis semantik Tiongkok, gunakan penganalisis umum untuk bahasa Tiongkok atau penganalisis E-commerce untuk bahasa Tiongkok.
Dalam skenario pencarian teks Tiongkok pendek atau pencarian non-semantik Tiongkok tanpa penyortiran ketat, gunakan penganalisis karakter tunggal untuk bahasa Tiongkok untuk meningkatkan jumlah dokumen yang dapat diambil.
Dalam skenario pencarian berbasis pinyin, gunakan penganalisis kabur.
Dalam skenario pencarian bahasa Inggris, gunakan penganalisis derivasi kata untuk bahasa Inggris.
Dalam beberapa skenario, gabungkan penganalisis berbasis semantik untuk bahasa Tiongkok dan penganalisis karakter tunggal untuk bahasa Tiongkok untuk mendapatkan hasil pencarian yang lebih baik. Contoh kueri: query=title_index:'菊花茶' OR sws_title_index:'菊花茶'. Ekspresi sortir halus: text_relevance(title)*5+field_proximity(sws_title). Konfigurasi ini memungkinkan pengguna mengambil semua dokumen yang mengandung "xx菊xx花xx茶xx". Selain itu, dokumen yang mengandung "菊花茶" diurutkan pertama.
Catatan penggunaan
Bidang dengan tipe berikut dapat dikonfigurasikan sebagai bidang indeks:
INT, INT_ARRAY, TEXT, SHORT_TEXT, LITERAL, LITERAL_ARRAY, TIMESTAMP, dan GEO_POINT
Bidang dengan tipe berikut tidak dapat dikonfigurasikan sebagai bidang indeks:
FLOAT, FLOAT_ARRAY, DOUBLE, dan DOUBLE_ARRAY
Jika ringkasan hasil pencarian dikonfigurasikan untuk bidang bertipe TEXT, beberapa istilah dalam unit pencarian ekstensi, seperti "菊花茶", tidak ditambahkan ke tag HTML untuk penyorotan.
Penganalisis karakter tunggal untuk bahasa Tiongkok menganggap angka atau kata bahasa Inggris sebagai karakter tunggal. Misalnya, jika dokumen berisi bidang dengan nilai "hello word" dan penganalisis karakter tunggal untuk bahasa Tiongkok diaktifkan, dokumen tersebut dapat diambil saat pengguna mencari "hello." Namun, dokumen tersebut tidak dapat diambil saat pengguna mencari "he". Untuk memungkinkan sistem mengembalikan dokumen saat pengguna mencari bagian dari kata bahasa Inggris, gunakan penganalisis kabur.
Secara default, kunci utama tabel utama dalam skema aplikasi diatur sebagai bidang indeks, dengan nama bidang indeks adalah id. Anda tidak dapat memodifikasi bidang indeks ini.