Sebelum membuat indeks pencarian, Anda harus memahami tipe data yang didukung oleh indeks pencarian serta pemetaan antara tipe data tersebut dan tipe data yang didukung oleh tabel data tempat indeks pencarian dibuat.
Tipe data yang didukung
Indeks pencarian mendukung tipe data dasar seperti Long, Double, Boolean, Keyword, Text, Date, Geopoint, dan Vector, serta tipe data khusus seperti Array dan Nested, dan kolom virtual.
Tipe data dasar
Indeks pencarian mendukung tipe data dasar berikut: Long, Double, Boolean, Keyword, Text, Date, Geopoint, dan Vector. Tabel berikut menjelaskan tipe data dasar tersebut.
Tipe data dasar | Deskripsi |
Long | Bilangan bulat panjang 64-bit. |
Double | Bilangan floating-point presisi ganda 64-bit. |
Boolean | Nilai Boolean. |
Keyword | String yang tidak dapat di-tokenisasi. |
Text | String atau teks yang dapat di-tokenisasi. Untuk informasi lebih lanjut, lihat Tokenisasi. |
Date | Tipe data Date. Anda dapat menentukan format data dari tipe Date. Untuk informasi lebih lanjut, lihat Tipe data Date. |
Geopoint | Pasangan koordinat lokasi geografis dalam format |
Vector | Tipe Vector. Nilai dari field bertipe Vector adalah string dalam format array Float32. Panjang array sama dengan jumlah dimensi dari field tersebut. Sebagai contoh, jumlah dimensi dari string vektor |
Tipe Array dan Nested
Selain tipe data dasar seperti Long, Double, Boolean, Keyword, Text, Date, Geopoint, dan Vector, indeks pencarian juga mendukung dua tipe data khusus: Array dan Nested. Tipe data Array cocok untuk menyimpan kumpulan data dengan tipe yang sama, sedangkan tipe data Nested mirip dengan tipe data JSON dan cocok untuk menyimpan data dengan struktur hierarkis. Untuk informasi lebih lanjut, lihat Tipe Data Array dan Nested.
Tipe Array
Tipe Nested
Kolom virtual
Anda dapat menggunakan fitur kolom virtual dari indeks pencarian untuk mengquery field baru dan data dari tipe field baru tanpa perlu memodifikasi skema penyimpanan dan data dalam tabel Tablestore. Untuk informasi lebih lanjut, lihat Kolom Virtual.
Anda dapat mengonfigurasi metode tokenisasi yang berbeda untuk field Text yang dipetakan ke field yang sama dalam sebuah tabel.
Sebuah kolom String tunggal dapat dipetakan ke beberapa kolom Text dalam indeks pencarian. Kolom Text yang berbeda menggunakan metode tokenisasi yang berbeda untuk memenuhi berbagai kebutuhan bisnis.
Akselerasi Query
Anda tidak perlu membersihkan data atau membuat ulang skema tabel. Cukup petakan kolom yang diperlukan dari tabel ke kolom dalam indeks pencarian. Tipe kolom dapat berbeda antara tabel dan indeks pencarian. Sebagai contoh, Anda dapat memetakan tipe numerik ke tipe Keyword untuk meningkatkan performa kueri tepat, dan memetakan tipe String ke tipe numerik untuk meningkatkan performa kueri rentang.
Pemetaan tipe data
Nilai sebuah field dalam indeks pencarian adalah nilai dari field dengan nama yang sama dalam tabel data tempat indeks pencarian dibuat. Tipe data dari kedua nilai tersebut harus cocok. Tabel berikut menjelaskan aturan kecocokan.
Tipe data field dalam indeks pencarian | Tipe data field dalam tabel data |
Long | Integer |
Long Array | String |
Double | Double |
Double Array | String |
Boolean | Boolean |
Boolean Array | String |
Keyword | String |
Keyword Array | String |
Text | String |
Date | Integer dan String |
Date Array | String |
Geopoint | String |
Geopoint Array | String |
Vector | String |
Nested | String |