Informasi latar belakang
Data yang Anda unggah ke OpenSearch pertama kali disimpan dalam tabel data offline. Untuk mempermudah pengunggahan data, OpenSearch memungkinkan Anda membuat tabel data dengan beberapa bidang sesuai kebutuhan bisnis Anda dan menyediakan plugin pemrosesan data. Jika Anda membuat beberapa tabel data, Anda harus menentukan bidang yang digunakan untuk menggabungkan tabel-tabel tersebut. Setelah data diproses, tabel-tabel tersebut digabungkan menjadi tabel indeks. Tabel indeks mendefinisikan atribut pencarian dan dapat digunakan oleh mesin pencari untuk membangun indeks dan mencari data.
Bidang dalam tabel data
Anda dapat menggunakan tabel data untuk mengimpor data ke OpenSearch. Setiap plugin pemrosesan data hanya dapat memproses jenis bidang tertentu. Untuk informasi lebih lanjut tentang batasan nilai bidang, lihat bagian "Batasan pada Bidang" dari topik Batasan. Jika nilai bidang tidak berada dalam rentang nilai yang ditentukan, kesalahan overflow akan terjadi atau nilai tersebut akan dipotong. Pastikan memilih tipe bidang yang tepat.
Tipe bidang | Deskripsi |
INT | Bilangan bulat 64-bit. |
INT_ARRAY | Array bilangan bulat 64-bit. |
FLOAT | Bilangan titik mengambang. |
FLOAT_ARRAY | Array bilangan titik mengambang. |
DOUBLE | Bilangan titik mengambang. |
DOUBLE_ARRAY | Array bilangan titik mengambang. |
LITERAL | Konstanta string yang hanya mendukung pencocokan tepat. |
LITERAL_ARRAY | Array konstanta string. Elemen tunggal dalam array konstanta string hanya mendukung pencocokan tepat. |
SHORT_TEXT | Teks pendek. Nilai dari tipe ini tidak boleh melebihi 100 byte panjangnya. Tipe bidang ini mendukung beberapa metode analisis. |
TEXT | Teks panjang. Tipe bidang ini mendukung beberapa metode analisis. |
TIMESTAMP | Bilangan bulat tak bertanda 64-bit. Tipe bidang ini menunjukkan timestamp. |
GEO_POINT | Konstanta string. Tipe bidang ini menunjukkan pasangan lintang dan bujur dalam format "Nilai Lintang Nilai Bujur". |
Catatan tentang Bidang Cadangan:
Nama bidang berikut dicadangkan dan tidak dapat digunakan sebagai nama bidang Anda sendiri: service_id, ops_app_name, inter_timestamp, index_name, pk, ops_version, ha_reserved_timestamp, dan summary.
Catatan tentang Bidang Tipe Array:
Setelah Anda membuat bidang tipe array dalam aplikasi, Anda dapat memetakan bidang tersebut ke bidang tipe VARCHAR atau STRING dalam sumber data. Selain itu, Anda dapat menggunakan plugin pemrosesan data untuk memproses bidang tersebut. Untuk informasi lebih lanjut, lihat Gunakan Plugin Pemrosesan Data.
Jika Anda menggunakan API OpenSearch atau SDK OpenSearch untuk mengunggah bidang tipe array, unggah bidang tersebut sebagai array bukan sebagai string. Contoh: String[] literal_array = {"Alibaba Cloud","OpenSearch"};
Catatan tentang Bidang Tipe Timestamp:
Bidang tipe INT dan TIMESTAMP dapat dipetakan ke bidang tipe DATETIME atau TIMESTAMP dalam sumber data. Nilai-nilai bidang secara otomatis dikonversi menjadi jumlah milidetik. Anda dapat menggunakan fungsi range untuk mengambil hasil pencarian berdasarkan rentang waktu. Untuk informasi lebih lanjut, lihat Pencarian Rentang.
Tipe bidang yang didukung dalam sumber data
Sumber data | Tipe bidang yang didukung |
ApsaraDB RDS | TINYINT, SMALLINT, INTEGER, BIGINT, FLOAT, REAL, DOUBLE, NUMERIC, DECIMAL, TIME, DATE, TIMESTAMP, dan VARCHAR |
PolarDB | TINYINT, SMALLINT, INTEGER, BIGINT, FLOAT, REAL, DOUBLE, NUMERIC, DECIMAL, TIME, DATE, TIMESTAMP, dan VARCHAR |
MaxCompute | BIGINT, DOUBLE, BOOLEAN, DATETIME, STRING, DECIMAL, MAP, ARRAY, TINYINT, SMALLINT, INT, FLOAT, CHAR, VARCHAR, DATE, TIMESTAMP, BINARY, INTERVAL_DAY_TIME, INTERVAL_YEAR_MONTH, dan STRUCT |
Pemetaan antara tipe bidang di OpenSearch dan tipe bidang dalam sumber data
Tipe bidang di OpenSearch | Tipe bidang di ApsaraDB RDS | Tipe bidang di PolarDB | Tipe bidang di MaxCompute |
INT | BIGINT, TINYINT, SMALLINT, dan INTEGER | BIGINT, TINYINT, SMALLINT, dan INTEGER | BIGINT, TINYINT, SMALLINT, dan INT |
INT_ARRAY | Tipe string seperti VARCHAR dan STRING. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. | Tipe string seperti VARCHAR dan STRING. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. | Tipe string seperti VARCHAR dan STRING. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. |
FLOAT | FLOAT, NUMERIC, dan DECIMAL | FLOAT, NUMERIC, dan DECIMAL | FLOAT dan DECIMAL |
FLOAT_ARRAY | Tipe string seperti VARCHAR dan STRING. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. | Tipe string seperti VARCHAR dan STRING. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. | Tipe string seperti VARCHAR dan STRING. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. |
DOUBLE | DOUBLE, NUMERIC, dan DECIMAL | DOUBLE, NUMERIC, dan DECIMAL | DOUBLE dan DECIMAL |
DOUBLE_ARRAY | Tipe string seperti VARCHAR. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. | Tipe string seperti VARCHAR. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. | Tipe string seperti VARCHAR dan STRING. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. |
LITERAL | Tipe string seperti VARCHAR. | Tipe string seperti VARCHAR. | Tipe string seperti VARCHAR dan STRING. |
LITERAL_ARRAY | Tipe string seperti VARCHAR. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. | Tipe string seperti VARCHAR. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. | Tipe string seperti VARCHAR dan STRING. Tipe bidang ini harus dikonversi menggunakan plugin pemrosesan data MultiValueSpliter. |
SHORT_TEXT | Tipe string seperti VARCHAR. | Tipe string seperti VARCHAR. | Tipe string seperti VARCHAR dan STRING. |
TEXT | Tipe string seperti VARCHAR. | Tipe string seperti VARCHAR. | Tipe string seperti VARCHAR dan STRING. |
TIMESTAMP | DATETIME dan TIMESTAMP | DATETIME dan TIMESTAMP | DATETIME dan TIMESTAMP |
GEO_POINT | Tipe string seperti VARCHAR. | Tipe string seperti VARCHAR. | String seperti VARCHAR dan STRING dalam format lon lat. lon menentukan bujur, dan lat menentukan lintang. Kedua nilai bujur dan lintang harus bertipe DOUBLE dan dipisahkan oleh karakter spasi. Nilai valid parameter lon: [-180, 180]. Nilai valid parameter lat: [-90,90]. |
Jika bidang dalam sumber data bertipe FLOAT atau DOUBLE, kami sarankan Anda mengubah tipe bidang menjadi DECIMAL. Jika tidak, presisi data mungkin terganggu.
Buat skema aplikasi
OpenSearch memungkinkan Anda membuat skema aplikasi dengan salah satu metode berikut:
Konfigurasikan sumber data. Untuk informasi lebih lanjut, lihat Konfigurasikan Sumber Data ApsaraDB RDS for MySQL, Konfigurasikan Sumber Data MaxCompute, dan Konfigurasikan Sumber Data PolarDB for MySQL.
Buat skema aplikasi secara manual.
Gunakan template. Untuk informasi lebih lanjut, lihat Migrasikan Aplikasi.
Unggah file. Untuk informasi lebih lanjut, lihat Buat Skema Aplikasi dengan Mengunggah File.