全部产品
Search
文档中心

OpenSearch:Memulai untuk skenario umum

更新时间:Jul 06, 2025

Membeli instance

Untuk informasi lebih lanjut, lihat Membeli instance OpenSearch Vector Search Edition.

Mengonfigurasi instance

Di halaman detail instance yang dibeli, Anda dapat melihat bahwa instance berada dalam status Pending Configuration. Sistem secara otomatis menyebarkan instance kosong berdasarkan jumlah dan spesifikasi Query Result Searcher (QRS) workers dan Searcher workers yang Anda beli. Sebelum menggunakan instance untuk pencarian, lakukan langkah-langkah berikut: mengonfigurasi tabel, menambahkan sumber data, mengonfigurasi bidang, mengonfigurasi skema indeks, dan melakukan reindexing untuk instance tersebut.

image.png

1. Mengonfigurasi informasi dasar tabel

Di panel kiri pada halaman detail instance, klik Manajemen Tabel. Di halaman Manajemen Tabel, klik Tambah Tabel. Pada langkah Informasi Dasar Tabel di wizard Pembuatan, konfigurasikan parameter Nama Tabel, Data Shards, Jumlah Sumber Daya untuk Pembaruan Data, dan Template Skenario, lalu klik Berikutnya.

image.png

Parameter:

  • Nama Tabel: Nama tabel yang dapat disesuaikan.

  • Data Shards: Jumlah shard data dalam tabel. Jika membuat beberapa tabel indeks dalam instance OpenSearch, pastikan tabel indeks memiliki jumlah shard yang sama atau setidaknya satu tabel indeks memiliki satu shard dan tabel lainnya memiliki jumlah shard yang sama.

  • Jumlah Sumber Daya untuk Pembaruan Data: Jumlah sumber daya yang digunakan untuk pembaruan data. Secara default, OpenSearch memberikan kuota gratis dua sumber daya untuk pembaruan data untuk setiap sumber data dalam instance OpenSearch Vector Search Edition. Setiap sumber daya terdiri dari 4 inti CPU dan 8 GB memori. Biaya akan dikenakan untuk sumber daya yang melebihi kuota gratis. Untuk informasi lebih lanjut, lihat Billing overview of OpenSearch Vector Search Edition.

  • Template Skenario: Template yang digunakan untuk membuat tabel. Nilai valid: Common Template, Vector: Image Search, dan Vector: Semantic Search for Text.

2. Menambahkan sumber data

Pada langkah Sinkronisasi Data, tambahkan sumber data. Anda dapat menambahkan sumber data MaxCompute atau sumber data API. Dalam contoh ini, MaxCompute + API dipilih sebagai Full Data Source. Konfigurasikan parameter Project, AccessKey, AccessKey Secret, Table, dan Partition Key, atur parameter Reindexing Otomatis ke Ya atau Tidak, lalu klik Periksa. Jika informasi sumber data lolos pemeriksaan, klik Berikutnya.

image.png

3. Mengonfigurasi bidang

OpenSearch menyediakan bidang preset yang relevan berdasarkan template skenario yang Anda pilih dan secara otomatis mengimpor semua bidang dari sumber data ke daftar bidang.

image.png

Pada langkah Konfigurasi Bidang, konfigurasikan bidang. Anda harus mengonfigurasi setidaknya dua bidang: bidang kunci utama dan bidang vektor. Bidang vektor harus didefinisikan sebagai bidang multi-nilai bertipe FLOAT.

image.png

Jika perlu membangun indeks vektor berdasarkan kategori, Anda dapat menambahkan bidang kategori antara bidang kunci utama dan bidang vektor.

Catatan:

  • Bidang kunci utama dan bidang vektor wajib. Untuk bidang kunci utama, atur parameter Tipe ke INT atau STRING dan pilih opsi di kolom Kunci Utama. Untuk bidang vektor, atur parameter Tipe ke FLOAT dan pilih kotak centang di kolom Bidang Vektor.

  • Secara default, bidang vektor adalah bidang multi-nilai bertipe FLOAT, dengan beberapa nilai dipisahkan oleh delimeter HA3 (^]). Delimeter ini dikodekan sebagai \x1D dalam format UTF. Anda juga dapat memasukkan delimeter multi-nilai kustom.

  • Saat mengonfigurasi indeks vektor, tentukan bidang dalam urutan bidang kunci utama, bidang namespace, dan bidang vektor. Bidang namespace bersifat opsional. Gambar di atas menunjukkan contohnya.

4. Mengonfigurasi skema indeks

Indeks vektor

OpenSearch secara otomatis membuat indeks untuk bidang kunci utama dan bidang vektor. Nama indeks sama dengan nama bidang. Anda hanya perlu mengonfigurasi indeks vektor di konsol OpenSearch.

image.png

Anda harus mengonfigurasi parameter secara terpisah untuk konfigurasi lanjutan indeks vektor. Untuk informasi lebih lanjut, lihat Konfigurasi umum indeks vektor.

Catatan
  • Bidang kunci utama dan bidang vektor wajib. Bidang namespace bersifat opsional dan dapat dibiarkan kosong.

  • Anda hanya dapat mengonfigurasi tiga bidang tetap untuk parameter Fields Contained dan tidak dapat menambahkan bidang.

  • Sistem secara otomatis mengonfigurasi parameter untuk indeks vektor. Jika tidak memiliki persyaratan khusus, klik Berikutnya untuk menyelesaikan konfigurasi.

  • Bidang Namespace: Jika versi mesin instance adalah vector_service_1.0.2 atau lebih lama, bidang namespace tidak boleh bertipe STRING. Jika versi mesin instance adalah vector_service_1.0.2 atau lebih baru, tidak ada batasan yang diberlakukan pada tipe bidang.

5. Konfirmasi pembuatan

Pada langkah Konfirmasi, klik Konfirmasi.

image.png

image.png

6. Lihat riwayat perubahan

Di panel kiri pada halaman detail instance, klik Riwayat Perubahan. Di tab Perubahan Sumber Data pada halaman yang muncul, Anda dapat melihat semua finite-state machines (FSMs) terkait proses pembuatan tabel, pembuatan indeks, dan pelaksanaan reindexing untuk data lengkap. Setelah mesin pencari dibangun, Anda dapat menjalankan pengujian query di instance.

7. Jalankan pengujian query

Contoh query

{
  "vector": [0.0019676427,0.005902928,0.021644069,0.21644068,0.12199384,0.043288138,0.007870571,0.0,0.08460863,0.041320495,0.043288138,0.035417568,0.011805856,0.055093993,0.12592913,0.017708784,0.021644069,0.0019676427,0.0,0.0,0.0019676427,0.078705706,0.1987319,0.041320495,0.039352853,0.0039352854,0.007870571,0.0039352854,0.0039352854,0.017708784,0.035417568,0.06886749,0.0019676427,0.0019676427,0.013773498,0.049191065,0.2125054,0.22824654,0.123961486,0.0039352854,0.0,0.0,0.021644069,0.14560555,0.078705706,0.1987319,0.22824654,0.005902928,0.064932205,0.0019676427,0.0019676427,0.021644069,0.027546996,0.035417568,0.22824654,0.22824654,0.1337997,0.023611711,0.009838213,0.007870571,0.0039352854,0.0039352854,0.017708784,0.20069954,0.033449925,0.005902928,0.019676426,0.035417568,0.015741142,0.029514639,0.13183205,0.123961486,0.029514639,0.0,0.027546996,0.22824654,0.15741141,0.0,0.0039352854,0.043288138,0.18889369,0.072802775,0.055093993,0.17315255,0.08460863,0.0019676427,0.007870571,0.035417568,0.22824654,0.10034977,0.009838213,0.021644069,0.062964566,0.027546996,0.015741142,0.04525578,0.086576276,0.033449925,0.023611711,0.017708784,0.0,0.0,0.03738521,0.072802775,0.16724962,0.035417568,0.031482283,0.20463483,0.043288138,0.011805856,0.0039352854,0.051158708,0.023611711,0.11412327,0.13183205,0.16134669,0.049191065,0.023611711,0.0039352854,0.0039352854,0.049191065,0.035417568,0.015741142,0.0039352854,0.03738521,0.08264099,0.094446845,0.021644069],
  "topK": 10,
  "includeVector": true
}
  • vector: Vektor yang akan diquery.

  • topK: Dokumen top K yang akan diquery.

  • includeVector: Menentukan apakah akan mengembalikan informasi vektor dalam dokumen.

Hasil contoh

image.png

Untuk informasi lebih lanjut tentang sintaks query, lihat bagian "Sintaks" dari topik ini.

Sintaks

Menggunakan SDK untuk menjalankan query berbasis vektor

  • Gunakan SDK untuk menjalankan query berbasis vektor atau query berbasis kunci utama. Untuk informasi lebih lanjut, lihat Query data.

  • Gunakan SDK untuk mengunggah atau menghapus dokumen. Untuk informasi lebih lanjut, lihat Perbarui data.