All Products
Search
Document Center

OpenSearch:Alat analisis pengambilan kustom

Last Updated:Apr 01, 2026

Alat analisis bawaan dirancang untuk teks umum, tetapi konten spesifik domain—seperti nama produk e-dagang, istilah gaming, atau tanya jawab pendidikan—sering menghasilkan pencarian yang kurang akurat karena alat tersebut tidak memahami kosakata khas Anda. OpenSearch Edisi Algoritma Industri memungkinkan Anda melatih alat analisis teks kustom berdasarkan data aplikasi Anda sendiri guna menutup kesenjangan ini. Sistem secara otomatis mengekstraksi data yang telah tersedia, mempelajari kosakata dan polanya, lalu menghasilkan model pengambilan yang disesuaikan dengan domain Anda. Setelah dilatih, Anda dapat mengaitkan model tersebut ke alat analisis kustom dan menerapkannya pada indeks Anda.

Model pengambilan yang disesuaikan dikenai biaya berdasarkan kapasitas penyimpanan, sumber daya komputasi, dan pelatihan model. Untuk detailnya, lihat Ikhtisar penagihan.

Cara kerja

Pelatihan dan penerapan model pengambilan yang disesuaikan mencakup tiga tahap:

  1. Create and train a model — Konfigurasikan parameter model dan mulai pelatihan. Sistem secara otomatis mengekstraksi data dari aplikasi target tanpa memerlukan impor data manual.

  2. Create a custom analyzer — Bungkus model yang telah dilatih dalam alat analisis teks agar dapat diterapkan pada indeks.

  3. Configure the custom analyzer — Terapkan alat analisis tersebut ke bidang indeks melalui perubahan offline, lalu bangun ulang indeks.

Batasan

BatasanDetail
Tipe instansHanya tersedia untuk instans Industry Algorithm Edition - Dedicated Cluster
Jumlah model per instansMaksimal 5 model pengambilan yang disesuaikan
Cakupan aplikasiModel terikat pada aplikasi tertentu dan tidak dapat dibagikan lintas aplikasi
Tipe alat analisisHanya alat analisis teks yang dapat dikustomisasi

Prasyarat

Sebelum memulai, pastikan Anda memiliki:

  • Instans Industry Algorithm Edition - Dedicated Cluster

Create and train a model

  1. Di panel navigasi kiri, pilih Search Algorithm Center > Retrieval Configuration. Di panel kiri, klik Tailored Retrieval Models.

  2. Pilih aplikasi eksklusif tempat Anda ingin membuat model, lalu klik Create.

    image

  3. Konfigurasikan parameter berikut, lalu klik Submit.

    ParameterDescription
    Model nameNama untuk model tersebut. Tidak dapat diubah setelah model dibuat.
    Model typeTipe model tailored retrieval.
    Basic analyzerAlat analisis spesifik industri yang digunakan sebagai titik awal. Lihat Basic analyzer options.
    Training fieldsBidang yang digunakan untuk melatih model. Hanya bidang dengan tipe data SHORT TEXT dan TEXT yang didukung.
    Normalization(Opsional) Normalisasi teks yang diterapkan hanya saat kueri. Tidak memengaruhi konten bidang yang disimpan. Lihat Normalization options.

    image

  4. Setelah model dibuat, statusnya secara default menjadi Unavailable. Di halaman Tailored Retrieval Models, klik Train di kolom Actions.

    Catatan

    Pelatihan biasanya memakan waktu satu atau dua hari kerja. Anda dapat melatih ulang model beberapa kali—setiap pelatihan yang selesai akan menambahkan versi baru di bagian Training History, dengan nomor versi bertambah 1.

    image

Opsi Basic analyzer

Pilih salah satu alat analisis industri bawaan berikut dari daftar drop-down Basic analyzer:

  • Chinese - General Analyzer

  • Chinese - E-commerce Analyzer

  • IT - Content Analyzer

  • Industry - General Analyzer for Gaming

  • Industry - Analyzer for Educational Q&A Search

  • Industry - IT Content Analysis

  • Industry - General Analyzer for E-commerce

Opsi Normalization

Parameter Normalization hanya menerapkan transformasi saat kueri dan tidak mengubah konten bidang yang disimpan. Pilih satu atau beberapa opsi berikut:

OpsiEfek
Uppercase to LowercaseMengonversi istilah kueri menjadi huruf kecil sebelum pencocokan
Traditional to Simplified ChineseMengonversi karakter Tionghoa tradisional dalam kueri menjadi bentuk sederhana
Full-width to Half-width CharactersMenormalisasi karakter alfanumerik full-width dalam kueri

Create a custom analyzer

Setelah model selesai dilatih dan berstatus Available, buat alat analisis kustom yang membungkus model tersebut.

  1. Di panel navigasi kiri, pilih Search Algorithm Center > Retrieval Configuration. Di panel kiri, klik Analyzer Management.

  2. Di tab Text Analyzer, klik Create.

    image

  3. Di panel yang muncul, masukkan nama, atur tipe alat analisis ke Tailored Model Analyzer, pilih instans mesin HA3 Anda, lalu pilih model pengambilan yang telah Anda buat. Klik Save.

    image

  4. Setelah disimpan, uji alat analisis tersebut untuk memverifikasi bahwa analisis kata menghasilkan hasil yang diharapkan. Anda juga dapat mengelola entri untuk alat analisis tersebut.

    image

Configure the custom analyzer

Terapkan alat analisis kustom ke bidang indeks melalui perubahan offline.

  1. Di panel navigasi kiri, pilih Instance Management > HA3 Engine. Temukan aplikasi Anda dan klik Details di kolom Actions. Di halaman detail, klik Modify Offline Application.

    image

  2. Pada langkah Index Schema, temukan indeks target. Di kolom Analysis method, pilih alat analisis kustom yang telah Anda konfigurasikan dan pilih versi model yang akan digunakan.

    image

  3. Selesaikan perubahan offline dan tunggu hingga indeks dibangun ulang.

    image

  4. Setelah indeks dibangun ulang, uji model pengambilan yang disesuaikan di halaman Search Test.

Manage tailored retrieval models

Tailored Retrieval Models page

image

Halaman Tailored Retrieval Models mencantumkan semua model beserta informasi berikut: nama model, tipe model, status model, waktu mulai pelatihan terakhir, dan status versi terbaru. Status model adalah Available atau Unavailable.

Dari kolom Actions, Anda dapat:

ActionDescription
DetailsLihat halaman detail model.
Train / RetrainMulai proses pelatihan baru. Tombol Retrain tidak tersedia selama versi terbaru berada dalam status Training.
DeleteHapus model. Model yang dirujuk oleh indeks tidak dapat dihapus.

Model details page

Halaman detail model terdiri dari tiga bagian:

BagianIsiDapat diedit
Informasi dasarWaktu pembuatan, status model, waktu mulai pelatihan terakhir, status versi terbaruTidak
Informasi konfigurasiAlat analisis dasar, bidang pelatihan, dan pengaturan normalisasi yang ditentukan saat pembuatan modelTidak
Riwayat pelatihanNomor versi, konfigurasi, status, waktu mulai dan akhir pelatihan, serta indeks yang mereferensikan model. Dari bagian ini, Anda dapat menguji efek model dan membandingkan hasil lintas versi dalam kasus khas, lalu mengunduh perbandingan tersebut.
image

Langkah selanjutnya