全部产品
Search
文档中心

OpenSearch:Penyesuaian Layanan

更新时间:Nov 05, 2025

Penyesuaian model memungkinkan Anda meningkatkan performa model embedding teks menggunakan data bisnis Anda. Anda juga dapat melatih model reduksi dimensionalitas embedding kustom dengan data embedding yang disediakan. Dalam skenario bisnis umum, pertama-tama vektorisasi teks atau kueri menggunakan model embedding. Kemudian, gunakan model reduksi dimensionalitas embedding untuk mengurangi dimensi embedding.

Informasi Latar Belakang

Dalam skenario pencarian cerdas dan generasi berbasis pengambilan data (RAG), performa model embedding sangat penting bagi hasil bisnis. Namun, efektivitas model tujuan umum di domain tertentu sering kali dibatasi oleh cakupan data pelatihan mereka. Untuk meningkatkan performa pengambilan, Anda dapat menyetel ulang model tujuan umum dengan data bisnis Anda. Sementara itu, dimensi model embedding terus bertambah, menyebabkan peningkatan signifikan dalam biaya penyimpanan dan komputasi untuk vektorisasi data berskala besar. Oleh karena itu, Platform Terbuka AI Search menyediakan layanan reduksi dimensionalitas embedding. Layanan ini menggunakan model kustom untuk mengonversi vektor berdimensi tinggi menjadi vektor berdimensi lebih rendah, menghemat biaya tanpa secara signifikan mengurangi performa vektorisasi.

Penyesuaian layanan reduksi dimensionalitas embedding

  1. Di Platform Terbuka AI Search Konsol, pilih Model Service > Model Customization, lalu klik Create.

    Jika Anda menggunakan akun RAM untuk membuat model, mengubah konfigurasi, melihat detail model, atau melakukan operasi lainnya, Anda harus memberikan izin operasi layanan model yang diperlukan kepada akun RAM terlebih dahulu.

  2. Di halaman Model Customization, konfigurasikan parameter berikut:

    Parameter

    Deskripsi

    Nama Model

    Nama model yang akan digunakan saat Anda memanggil layanan reduksi dimensionalitas embedding.

    Tipe Model

    Tipe model yang akan dilatih. Pilih Vector Dimensionality Reduction (embedding-dim-reduction).

    Model Dasar

    Model dasar yang digunakan untuk pelatihan, seperti ops-embedding-dim-reduction-001.

    Sumber Data

    maxCompute atau oss

    MaxCompute

    Parameter

    Deskripsi

    Sumber Data

    MaxCompute

    Wilayah

    Wilayah tempat proyek MaxCompute berada.

    Nama Proyek

    Nama proyek di MaxCompute.

    ID AccessKey

    ID AccessKey dari akun Alibaba Cloud atau Pengguna RAM yang memiliki izin untuk membaca dan menulis ke MaxCompute.

    Anda dapat pergi ke halaman Manajemen AccessKey untuk mendapatkan ID AccessKey.

    Rahasia

    Rahasia AccessKey yang sesuai dengan ID AccessKey.

    Nama Tabel

    Nama tabel yang menyimpan data pelatihan di MaxCompute.

    Partisi Tabel

    Informasi partisi tabel.

    Bidang Pelatihan

    Anda harus memberikan izin Grant GetTableFields (untuk mengambil skema tabel MaxCompute) kepada Pengguna RAM yang digunakan untuk membaca dan menulis skema tabel MaxCompute. Ini memungkinkan Anda memilih bidang kunci utama dan bidang embedding tipe String. Dimensi bidang embedding harus berkisar antara 1024 hingga 4096.

    OSS

    Parameter

    Deskripsi

    Sumber Data

    OSS

    Wilayah

    Wilayah tempat Bucket OSS berada.

    Bucket OSS

    Nama Bucket OSS.

    Data Dokumen

    Data di OSS yang digunakan untuk pelatihan.

    Endpoint OSS

    Dibuat setelah Anda menyelesaikan konfigurasi sebelumnya.

  3. Klik OK. Di kotak dialog yang muncul, klik Create and Train. Model kemudian diproses sebelumnya, dan pelatihan dimulai setelah pra-pemrosesan selesai.

    Jika Anda klik Confirm Creation, model ditambahkan ke daftar penyesuaian model dengan status To Be Trained dan dapat dilatih nanti.

    Di daftar model, model dengan status Active telah menyelesaikan pelatihan dan dapat dipanggil. Klik Experience untuk menguji model embedding yang disetel ulang.

Penyesuaian layanan embedding teks

  1. Di Platform Terbuka AI Search Konsol, pilih Model Service > Model Customization, lalu klik Create.

    Jika Anda menggunakan Pengguna RAM untuk melakukan operasi seperti membuat model, mengubah konfigurasi, atau melihat detail model, Anda harus memberikan izin yang diperlukan untuk layanan model kepada Pengguna RAM terlebih dahulu.

  2. Di halaman Model Customization, konfigurasikan parameter berikut:

    Parameter

    Deskripsi

    Nama Model

    Menawarkan penyesuaian.

    Tipe Model

    Tipe model yang akan dilatih. Pilih Text Embedding (text-embedding).

    Model Dasar

    Model dasar yang digunakan untuk pelatihan, seperti ops-text-embedding-001.

    Reduksi Dimensionalitas

    Jika Anda mengaktifkan opsi ini, pelatihan reduksi dimensionalitas embedding dilakukan pada saat yang sama.

    Model Dasar untuk Reduksi

    Model yang digunakan untuk reduksi dimensionalitas. Parameter ini tersedia hanya ketika Anda mengaktifkan reduksi dimensionalitas embedding.

    Sumber Data

    maxCompute atau oss

    MaxCompute

    Parameter

    Deskripsi

    Sumber Data

    MaxCompute.

    Wilayah

    Wilayah tempat proyek MaxCompute berada.

    Nama Proyek

    Nama proyek di MaxCompute.

    ID AccessKey

    ID AccessKey dari akun Alibaba Cloud atau Pengguna RAM yang memiliki izin untuk membaca dan menulis ke MaxCompute.

    Anda dapat pergi ke halaman Manajemen AccessKey untuk mendapatkan ID AccessKey.

    Rahasia

    Rahasia AccessKey yang sesuai dengan ID AccessKey.

    Nama Tabel

    Nama tabel yang menyimpan data pelatihan di MaxCompute.

    Partisi Tabel

    Informasi partisi tabel.

    Bidang Pelatihan

    Anda harus memberikan izin GetTableFields (untuk mengambil skema tabel MaxCompute) kepada Pengguna RAM yang digunakan untuk membaca dan menulis skema tabel MaxCompute. Ini memungkinkan Anda memilih bidang kunci utama dan data teks tipe String.

    query-doc pair

    Untuk informasi lebih lanjut, lihat data sampel di konsol.

    OSS

    Parameter

    Deskripsi

    Sumber Data

    OSS

    Wilayah

    Wilayah tempat Bucket OSS berada.

    Bucket OSS

    Nama Bucket OSS.

    Data Dokumen

    Data di OSS yang digunakan untuk pelatihan.

    query-doc pair

    Untuk informasi lebih lanjut, lihat data sampel di konsol.

    Endpoint OSS

    Dibuat oleh sistem setelah Anda menyelesaikan konfigurasi sebelumnya.

  3. Klik OK. Di kotak dialog yang muncul, klik Create and Train. Model mulai pra-pemrosesan, dan pelatihan dimulai setelah pra-pemrosesan selesai.

    Setelah Anda klik Confirm Creation, model muncul di daftar penyesuaian model dengan status To Be Trained. Anda dapat memulai pelatihan di waktu lain.

    Di daftar model, model dengan status Active telah menyelesaikan pelatihan dan dapat disebarluaskan.

Pemanggilan Layanan

Ketika layanan model memenuhi persyaratan Anda, Anda dapat memanggil layanan tersebut menggunakan API. Untuk informasi lebih lanjut, lihat embedding API Layanan Reduksi Dimensionalitas dan API Layanan Penyebaran Kustom.