Topik ini menjelaskan konfigurasi indeks vektor pada instance edisi mesin pencari OpenSearch yang sudah ada dan menunjukkan cara menggunakan SDK untuk mengambil data melalui kueri vektor.
Beli instance edisi mesin pencari OpenSearch
Untuk informasi lebih lanjut, lihat Beli instance edisi mesin pencari OpenSearch.
Konfigurasikan tabel
Setelah membeli instance baru, statusnya akan muncul sebagai "Menunggu konfigurasi" di halaman produk. Kluster kosong sesuai dengan jumlah dan spesifikasi node query serta data yang dibeli akan diterapkan secara otomatis. Sebelum memulai pencarian, konfigurasikan Informasi Dasar Tabel > Sinkronisasi Data > Skema Indeks > Pembuatan Ulang Indeks dari kluster tersebut.
Untuk menyiapkan informasi dasar tabel, atur Nama Tabel, tentukan Jumlah Shard, dan tetapkan Jumlah Sumber Daya Pembaruan Data.
Jumlah shard maksimum untuk sebuah tabel adalah 256, dan disarankan tidak melebihi tiga kali jumlah node data dalam instance.
Secara default, dua sumber daya pembaruan data gratis disediakan. Melebihi angka ini akan dikenakan biaya sebesar n-2, di mana n adalah total sumber daya pembaruan data untuk satu tabel.
Untuk sinkronisasi data, konfigurasikan sumber data penuh, termasuk jenis yang didukung seperti sumber data MaxCompute, sumber data API, Object Storage Service (OSS), dan sumber data Data Lake Formation (DLF). Menggunakan MaxCompute sebagai contoh, pilih "Tambah Sumber Data," pilih "MaxCompute" sebagai tipe, masukkan proyek, accesskeyID, accesskeySecret, Tabel, kunci partisi, serta pertimbangkan untuk mengaktifkan pengindeksan ulang otomatis.
Setelah berhasil mengonfigurasi sumber data, lanjutkan dengan menyiapkan Skema Indeks.
Tentukan bidang, minimal dua bidang wajib: Bidang Kunci Utama dan Bidang Vektor (yang terakhir harus dikonfigurasikan sebagai tipe float multi-nilai).
Untuk menyertakan vektor dengan kategori, tambahkan bidang kategori, yang harus ditetapkan sebagai tipe integer bernilai tunggal atau multi-nilai.
Kompresi Konten Properti dan Bidang:
Untuk bidang atribut, Anda dapat memilih untuk mengompresinya. Dalam mode formulir, pilih antara tidak terkompresi dan terkompresi; dalam mode pengembang, pilih antara no_compressor atau file_compressor.
Untuk konten bidang, tentukan apakah kompresi akan diterapkan. Secara default, tetap tidak terkompresi. Tipe multi-nilai dan STRING menggunakan kompresi uniq secara default, sedangkan tipe numerik bernilai tunggal menggunakan kompresi equal.