Pengelolaan Instans
Istilah | Deskripsi |
Instance | Instans adalah sekumpulan konfigurasi data, seperti skema sumber data, skema indeks, dan atribut data. Sebuah instans berfungsi sebagai layanan pencarian. |
dokumen | Dokumen adalah unit pencarian data terstruktur. Dokumen dapat berisi satu atau lebih bidang dan harus memiliki bidang kunci utama. OpenSearch mengidentifikasi dokumen unik berdasarkan nilai bidang kunci utama. Jika dokumen baru memiliki nilai kunci utama yang sama dengan dokumen yang ada, dokumen yang ada akan ditimpa oleh yang baru. |
bidang | Bidang adalah komponen dari sebuah dokumen. Bidang terdiri dari nama bidang dan nilai bidang. |
plug-in | Untuk membantu Anda memproses data selama impor data, OpenSearch menyediakan berbagai plug-in pemrosesan data bawaan. Anda dapat memilih untuk menggunakan plug-in ini saat mendefinisikan skema atau mengonfigurasi sumber data untuk aplikasi. |
data sumber | Data asli yang akan didorong ke OpenSearch. Data ini berisi satu atau lebih bidang sumber. |
bidang sumber | Bidang sumber adalah unit terkecil dari data sumber. Bidang sumber terdiri dari nama bidang dan nilai bidang. Untuk informasi lebih lanjut tentang tipe data yang didukung, lihat Skema aplikasi dan skema indeks. |
indeks | Indeks adalah struktur data yang digunakan untuk mempercepat pengambilan data. Anda dapat membuat beberapa indeks untuk satu instans. |
indeks komposit | Anda dapat membuat indeks komposit pada beberapa bidang bertipe teks seperti TEXT atau SHORT_TEXT. Misalnya, jika Anda perlu membuat layanan pencarian forum yang mendukung pencarian berbasis judul dan pencarian komprehensif berdasarkan judul dan isi, Anda dapat membuat indeks title_search pada judul dan indeks komposit default pada judul dan isi. Dengan cara ini, pencarian berbasis judul diimplementasikan berdasarkan indeks title_search. Pencarian komprehensif berdasarkan judul dan isi diimplementasikan berdasarkan indeks komposit default. |
bidang indeks | Bidang indeks dapat digunakan dalam klausa query. Untuk mengimplementasikan pengambilan data berperforma tinggi, Anda harus mendefinisikan bidang indeks. |
bidang atribut | Bidang atribut dapat digunakan dalam klausa FILTER, SORT, AGGREGATE, dan DISTINCT dari query untuk mengimplementasikan fitur seperti penyaringan dan statistik. |
bidang tampilan default | Bidang tampilan default ditampilkan dalam hasil pencarian. Anda dapat menggunakan fetch_fields, yang merupakan parameter API, untuk menentukan bidang yang akan dikembalikan untuk setiap permintaan pencarian. Perhatikan bahwa jika Anda mengatur parameter fetch_fields dalam program Anda, konfigurasi bidang tampilan default diabaikan dan bidang yang ditentukan oleh parameter fetch_fields ditampilkan dalam hasil pencarian. Jika Anda tidak mengatur parameter fetch_fields dalam program Anda, bidang tampilan default ditampilkan dalam hasil pencarian. |
tokenisasi | Fitur ini digunakan untuk memecah kalimat dalam dokumen menjadi token. Jika tipe data bidang adalah TEXT, sistem memecah kalimat menjadi token yang bermakna. Jika tipe data bidang adalah SHORT_TEXT, sistem memecah kalimat menjadi karakter Cina tunggal. Contohnya, jika tipe data adalah TEXT, "浙江大学" dipecah menjadi dua token "浙江" dan "大学". Jika tipe data adalah SHORT_TEXT, "浙江大学" diubah menjadi empat karakter Cina tunggal "浙", "江", "大", dan "学". |
term | Term adalah token atau sekumpulan token setelah tokenisasi. |
pembuatan indeks | Setelah tokenisasi, indeks dibuat berdasarkan term. Ini memungkinkan OpenSearch untuk menemukan dokumen tertentu berdasarkan permintaan pencarian dengan cepat. Mesin pencari dapat membangun dua jenis daftar terhubung: indeks terbalik dan indeks maju. |
indeks terbalik | Indeks terbalik adalah daftar terhubung yang memetakan term ke lokasi mereka dalam sekumpulan dokumen. Indeks terbalik digunakan dalam klausa query. Contoh: term1->doc1,doc2,doc3 dan term2->doc1,doc2. |
indeks maju | Indeks maju adalah daftar terhubung yang memetakan dokumen ke bidang. Indeks maju digunakan dalam klausa FILTER. Indeks maju kurang efisien daripada indeks terbalik. Contoh: doc1->id,type,create_time. |
pengambilan | Setelah dokumen didorong ke OpenSearch, nilai bidang dalam dokumen diubah menjadi term individu berdasarkan kata kunci query. OpenSearch mencari indeks terbalik yang dibangun berdasarkan term untuk menemukan dokumen yang cocok. |
jumlah pengambilan | Jumlah dokumen yang diambil. |
Sinkronisasi Data
Istilah | Deskripsi |
sumber data | Sumber data yang akan didorong. OpenSearch saat ini mendukung sinkronisasi data dari ApsaraDB for RDS, MaxCompute, dan PolarDB. |
pengindeksan ulang | Fitur ini mengindeks ulang data. Pengindeksan diperlukan setelah Anda mengonfigurasi atau memodifikasi skema aplikasi dan sumber data. |
Pengelolaan Kuota
Istilah | Deskripsi |
kapasitas dokumen | Ukuran kumulatif total dokumen tabel dalam sebuah instans. Ukuran kumulatif dihitung berdasarkan nilai bidang. Setiap nilai bidang dikonversi ke string untuk menghitung ukuran kumulatif. |
QPS | Jumlah query per detik. |
LCU | Unit komputasi logis (LCU) adalah unit yang digunakan untuk mengukur kemampuan komputasi layanan pencarian. LCU menunjukkan kemampuan komputasi 10 millicores dalam kluster pencarian. Millicore adalah unit sumber daya CPU. Setiap millicore adalah seperseribu dari satu core. |
skalabilitas | Anda dapat dengan cepat meningkatkan atau menurunkan konfigurasi instans berdasarkan kebutuhan bisnis Anda. Spesifikasi kecil berlaku segera. Perubahan jenis instans, seperti konversi dari instans dibagi ke instans eksklusif, hanya berlaku setelah perubahan disetujui. |
Pencarian
Istilah | Deskripsi |
ekspresi pengurutan | Ekspresi pengurutan adalah ekspresi yang dapat Anda tulis untuk mengontrol pengurutan hasil pencarian. Anda dapat menggunakan operasi matematika dasar, fungsi matematika, dan fungsi bawaan untuk menulis ekspresi pengurutan. |
ekspresi pengurutan kasar | Hasil pencarian pertama kali diurutkan menggunakan ekspresi pengurutan kasar. Sistem menghitung skor kecocokan dokumen berdasarkan ekspresi pengurutan kasar dan mengurutkan dokumen berdasarkan skor yang dihitung. |
ekspresi pengurutan halus | Sistem memilih N hasil teratas yang diurutkan berdasarkan pengurutan kasar dan menghitung skor kecocokan hasil secara lebih presisi menggunakan ekspresi pengurutan halus. Kemudian, sistem mengurutkan hasil berdasarkan skor yang dihitung. |
ringkasan hasil pencarian | Secara umum, panjang konten teks cukup panjang. Untuk membantu pengguna memahami isi utama dokumen, hanya sebagian konten dokumen yang ditampilkan dalam hasil pencarian. |
analisis query | Saat ini, fitur seperti sinonim, koreksi ejaan, kata henti, dan bobot term didukung. Sistem dapat mengidentifikasi maksud pencarian. |