Indeks pencarian mendukung kueri data multidimensi dan analisis statistik dalam skenario data besar berdasarkan indeks terbalik dan penyimpanan kolom. Topik ini menjelaskan cara menggunakan fitur indeks pencarian dengan Tablestore SDK untuk Python.
Kelola indeks
Tabel berikut menunjukkan operasi manajemen yang didukung oleh indeks pencarian.
Operasi | Deskripsi |
Buat indeks pencarian untuk tabel data. | |
Kueri indeks pencarian yang dibuat untuk sebuah tabel. | |
Perbarui waktu hidup (TTL) dari indeks pencarian. | |
Kueri deskripsi indeks pencarian, termasuk informasi tentang bidang dalam indeks pencarian dan konfigurasi indeks pencarian. | |
Hapus indeks pencarian yang tidak lagi Anda butuhkan. | |
Hapus data historis atau perpanjang periode retensi data dalam indeks pencarian berdasarkan kebutuhan bisnis. |
Tipe data
Selain tipe data dasar seperti Long, Double, Boolean, Keyword, Text, Date, Geopoint, dan Vector, indeks pencarian mendukung dua tipe data khusus: Array dan Nested. Untuk informasi lebih lanjut, lihat Tipe Data.
Kueri data
Tabel berikut menunjukkan jenis kueri yang didukung oleh indeks pencarian. Pilih jenis kueri sesuai dengan kebutuhan bisnis Anda.
Fitur | Jenis kueri | Deskripsi |
Kueri dasar | Kueri ini cocok dengan semua baris dalam tabel untuk menanyakan jumlah total baris dalam tabel atau mengembalikan beberapa baris acak. | |
Kueri ini menggunakan kecocokan tepat untuk mengambil data dari tabel data. Kueri tepat mirip dengan kueri berbasis pencocokan string. | ||
Kueri ini memungkinkan Anda menentukan beberapa kata kunci untuk mencari baris yang cocok dengan setidaknya satu dari kata kunci tersebut. Baris data dikembalikan jika nilai kolom cocok dengan setidaknya satu dari kata kunci. Kueri terms dapat digunakan dengan cara yang sama seperti operator IN dalam Pernyataan SQL. | ||
Kueri ini mengambil data yang berisi awalan tertentu dari tabel data. | ||
Kueri ini mengambil data yang berada dalam rentang tertentu. | ||
Kueri ini mengambil data yang cocok dengan string yang berisi karakter wildcard. | ||
Kueri ini juga disebut kueri NULL atau kueri nilai NULL, yang digunakan dalam data jarang untuk menentukan apakah kolom dari suatu baris ada. | ||
Kueri ini merangkum set hasil berdasarkan kolom tertentu untuk menampilkan data dari tipe yang ditentukan hanya sekali dalam hasil yang dikembalikan, memastikan keragaman tipe hasil. | ||
Kueri geo diklasifikasikan menjadi jenis-jenis berikut: kueri jarak geo, kueri kotak pembatas geo, dan kueri poligon geo.
| ||
Kueri ini mengambil data dalam baris anak dari bidang nested. | ||
Pemrosesan data | Anda dapat menentukan metode pengurutan sebelumnya saat membuat indeks pencarian atau menentukan metode pengurutan saat menggunakan indeks pencarian untuk mengkueri data. Dengan cara ini, baris yang memenuhi kondisi kueri dikembalikan berdasarkan urutan yang telah Anda tentukan sebelumnya atau spesifikasikan. Jika respons mencakup sejumlah besar baris, Anda dapat menemukan data dengan mengonfigurasi parameter limit dan offset atau dengan menggunakan token. | |
Anda dapat melakukan operasi agregasi untuk mendapatkan nilai minimum, maksimum, jumlah, rata-rata, hitungan dan hitungan distinct dari baris, statistik persentil, dan baris dalam setiap grup. Anda juga dapat melakukan operasi agregasi untuk mengelompokkan hasil berdasarkan nilai bidang, rentang, lokasi geografis, filter, histogram, atau histogram tanggal, dan melakukan kueri nested. Anda dapat melakukan beberapa operasi agregasi untuk kueri kompleks. | ||
Kueri berdasarkan kombinasi kondisi subkueri | Kueri ini mengambil data dari tabel data berdasarkan kombinasi subkueri. Tablestore mengembalikan baris yang cocok dengan subkueri. | |
Pencarian teks lengkap | Kueri ini menggunakan kecocokan perkiraan untuk mengambil data dari tabel data. | |
Kueri ini mirip dengan kueri match, kecuali bahwa kueri match phrase mengevaluasi posisi token. Baris memenuhi kondisi kueri hanya jika urutan dan posisi token dalam baris cocok dengan urutan dan posisi yang ditentukan. | ||
Anda dapat mengonfigurasi parameter sorotan untuk menyorot string kueri dalam segmen baris yang memenuhi kondisi kueri. | ||
Pencarian vektor | Anda dapat menggunakan fitur kueri vektor tetangga terdekat (KNN) untuk melakukan pencarian tetangga terdekat perkiraan berdasarkan vektor. Dengan cara ini, Anda dapat menemukan item data yang memiliki kesamaan tertinggi dengan vektor yang ingin Anda kueri dalam dataset berskala besar. |
Ekspor data
Jika tidak ada persyaratan tertentu mengenai urutan hasil kueri, Anda dapat menggunakan fitur pemindaian paralel untuk mendapatkan hasil kueri secara efisien. Untuk informasi lebih lanjut, lihat Pemindaian Paralel.