Alat analisis bawaan dirancang untuk teks umum, tetapi konten spesifik domain—seperti nama produk e-dagang, istilah gaming, atau tanya jawab pendidikan—sering menghasilkan pencarian yang kurang akurat karena alat tersebut tidak memahami kosakata khas Anda. OpenSearch Edisi Algoritma Industri memungkinkan Anda melatih alat analisis teks kustom berdasarkan data aplikasi Anda sendiri guna menutup kesenjangan ini. Sistem secara otomatis mengekstraksi data yang telah tersedia, mempelajari kosakata dan polanya, lalu menghasilkan model pengambilan yang disesuaikan dengan domain Anda. Setelah dilatih, Anda dapat mengaitkan model tersebut ke alat analisis kustom dan menerapkannya pada indeks Anda.
Model pengambilan yang disesuaikan dikenai biaya berdasarkan kapasitas penyimpanan, sumber daya komputasi, dan pelatihan model. Untuk detailnya, lihat Ikhtisar penagihan.
Cara kerja
Pelatihan dan penerapan model pengambilan yang disesuaikan mencakup tiga tahap:
Create and train a model — Konfigurasikan parameter model dan mulai pelatihan. Sistem secara otomatis mengekstraksi data dari aplikasi target tanpa memerlukan impor data manual.
Create a custom analyzer — Bungkus model yang telah dilatih dalam alat analisis teks agar dapat diterapkan pada indeks.
Configure the custom analyzer — Terapkan alat analisis tersebut ke bidang indeks melalui perubahan offline, lalu bangun ulang indeks.
Batasan
| Batasan | Detail |
|---|---|
| Tipe instans | Hanya tersedia untuk instans Industry Algorithm Edition - Dedicated Cluster |
| Jumlah model per instans | Maksimal 5 model pengambilan yang disesuaikan |
| Cakupan aplikasi | Model terikat pada aplikasi tertentu dan tidak dapat dibagikan lintas aplikasi |
| Tipe alat analisis | Hanya alat analisis teks yang dapat dikustomisasi |
Prasyarat
Sebelum memulai, pastikan Anda memiliki:
Instans Industry Algorithm Edition - Dedicated Cluster
Create and train a model
Di panel navigasi kiri, pilih Search Algorithm Center > Retrieval Configuration. Di panel kiri, klik Tailored Retrieval Models.
Pilih aplikasi eksklusif tempat Anda ingin membuat model, lalu klik Create.

Konfigurasikan parameter berikut, lalu klik Submit.
Parameter Description Model name Nama untuk model tersebut. Tidak dapat diubah setelah model dibuat. Model type Tipe model tailored retrieval. Basic analyzer Alat analisis spesifik industri yang digunakan sebagai titik awal. Lihat Basic analyzer options. Training fields Bidang yang digunakan untuk melatih model. Hanya bidang dengan tipe data SHORT TEXT dan TEXT yang didukung. Normalization (Opsional) Normalisasi teks yang diterapkan hanya saat kueri. Tidak memengaruhi konten bidang yang disimpan. Lihat Normalization options. 
Setelah model dibuat, statusnya secara default menjadi Unavailable. Di halaman Tailored Retrieval Models, klik Train di kolom Actions.
CatatanPelatihan biasanya memakan waktu satu atau dua hari kerja. Anda dapat melatih ulang model beberapa kali—setiap pelatihan yang selesai akan menambahkan versi baru di bagian Training History, dengan nomor versi bertambah 1.

Opsi Basic analyzer
Pilih salah satu alat analisis industri bawaan berikut dari daftar drop-down Basic analyzer:
Chinese - General Analyzer
Chinese - E-commerce Analyzer
IT - Content Analyzer
Industry - General Analyzer for Gaming
Industry - Analyzer for Educational Q&A Search
Industry - IT Content Analysis
Industry - General Analyzer for E-commerce
Opsi Normalization
Parameter Normalization hanya menerapkan transformasi saat kueri dan tidak mengubah konten bidang yang disimpan. Pilih satu atau beberapa opsi berikut:
| Opsi | Efek |
|---|---|
| Uppercase to Lowercase | Mengonversi istilah kueri menjadi huruf kecil sebelum pencocokan |
| Traditional to Simplified Chinese | Mengonversi karakter Tionghoa tradisional dalam kueri menjadi bentuk sederhana |
| Full-width to Half-width Characters | Menormalisasi karakter alfanumerik full-width dalam kueri |
Create a custom analyzer
Setelah model selesai dilatih dan berstatus Available, buat alat analisis kustom yang membungkus model tersebut.
Di panel navigasi kiri, pilih Search Algorithm Center > Retrieval Configuration. Di panel kiri, klik Analyzer Management.
Di tab Text Analyzer, klik Create.

Di panel yang muncul, masukkan nama, atur tipe alat analisis ke Tailored Model Analyzer, pilih instans mesin HA3 Anda, lalu pilih model pengambilan yang telah Anda buat. Klik Save.

Setelah disimpan, uji alat analisis tersebut untuk memverifikasi bahwa analisis kata menghasilkan hasil yang diharapkan. Anda juga dapat mengelola entri untuk alat analisis tersebut.

Configure the custom analyzer
Terapkan alat analisis kustom ke bidang indeks melalui perubahan offline.
Di panel navigasi kiri, pilih Instance Management > HA3 Engine. Temukan aplikasi Anda dan klik Details di kolom Actions. Di halaman detail, klik Modify Offline Application.

Pada langkah Index Schema, temukan indeks target. Di kolom Analysis method, pilih alat analisis kustom yang telah Anda konfigurasikan dan pilih versi model yang akan digunakan.

Selesaikan perubahan offline dan tunggu hingga indeks dibangun ulang.

Setelah indeks dibangun ulang, uji model pengambilan yang disesuaikan di halaman Search Test.
Manage tailored retrieval models
Tailored Retrieval Models page

Halaman Tailored Retrieval Models mencantumkan semua model beserta informasi berikut: nama model, tipe model, status model, waktu mulai pelatihan terakhir, dan status versi terbaru. Status model adalah Available atau Unavailable.
Dari kolom Actions, Anda dapat:
| Action | Description |
|---|---|
| Details | Lihat halaman detail model. |
| Train / Retrain | Mulai proses pelatihan baru. Tombol Retrain tidak tersedia selama versi terbaru berada dalam status Training. |
| Delete | Hapus model. Model yang dirujuk oleh indeks tidak dapat dihapus. |
Model details page
Halaman detail model terdiri dari tiga bagian:
| Bagian | Isi | Dapat diedit |
|---|---|---|
| Informasi dasar | Waktu pembuatan, status model, waktu mulai pelatihan terakhir, status versi terbaru | Tidak |
| Informasi konfigurasi | Alat analisis dasar, bidang pelatihan, dan pengaturan normalisasi yang ditentukan saat pembuatan model | Tidak |
| Riwayat pelatihan | Nomor versi, konfigurasi, status, waktu mulai dan akhir pelatihan, serta indeks yang mereferensikan model. Dari bagian ini, Anda dapat menguji efek model dan membandingkan hasil lintas versi dalam kasus khas, lalu mengunduh perbandingan tersebut. | — |

Langkah selanjutnya
Custom text analyzers — Kelola entri dan sesuaikan alat analisis kustom Anda.
Run search tests — Validasi kualitas pengambilan setelah menerapkan alat analisis pada indeks.
Billing overview — Pahami cara penagihan model pengambilan yang disesuaikan.