Deploy model vektor & reranking siap produksi untuk pencarian AI - OpenSearch

Anda dapat menerapkan model dari AI Search Open Platform, ModelScope, dan model kustom untuk menyediakan layanan inferensi dengan konkurensi lebih tinggi dan latensi lebih rendah.

Daftar model

Kategori model	Nama model	Sumber model
Vektorisasi teks	OpenSearch Text Vectorization Service-001: Menyediakan layanan vektorisasi teks multibahasa (40+), dengan panjang teks input maksimum 300 token dan dimensi vektor output 1.536. OpenSearch General Text Vectorization Service-002: Menyediakan layanan vektorisasi teks multibahasa (100+), dengan panjang teks input maksimum 8.192 token dan dimensi vektor output 1.024. OpenSearch Text Vectorization Service-Chinese-001: Menyediakan layanan vektorisasi teks Cina, dengan panjang teks input maksimum 1.024 token dan dimensi vektor output 768. OpenSearch Text Vectorization Service-English-001: Menyediakan layanan vektorisasi teks Inggris, dengan panjang teks input maksimum 512 token dan dimensi vektor output 768. Untuk pemanggilan model, lihat: Vektor teks.	AI Search Open Platform
	Model Representasi Teks Universal Multibahasa GTE Model Vektor Teks Umum Multibahasa GTE: Panjang token konteks maksimum 8.192, mendukung lebih dari 70 bahasa.	ModelScope
	Model vektorisasi teks yang dilatih secara mandiri dalam Penyesuaian model.	Penyesuaian model
Penyusunan ulang	Model Penyusunan Ulang BGE: Menyediakan layanan penilaian dokumen berdasarkan model BGE. Dapat menilai dokumen dari tinggi ke rendah berdasarkan relevansi antara kueri dan isi dokumen, serta mengeluarkan hasil penilaian yang sesuai. Mendukung Cina dan Inggris, dengan panjang token input maksimum 512 (Panjang Query + Doc). Model Penyusunan Ulang Mandiri OpenSearch: Dilatih dengan dataset multi-industri, menyediakan layanan penyusunan ulang berkualitas tinggi yang dapat menilai dokumen dari tinggi ke rendah berdasarkan relevansi semantik antara Query dan DOC. Mendukung Cina dan Inggris, dengan panjang token input maksimum 512 (Panjang Query + doc). Untuk pemanggilan model, lihat: Layanan peringkat.	AI Search Open Platform
Vektor multimodal	Model Vektor Multimodal CLIP-Cina-Inggris: Mendukung pencarian gambar melalui teks dan pencarian teks melalui gambar. Model Vektor Multimodal CLIP-Cina-Inggris-Besar: Mendukung pencarian gambar melalui teks dan pencarian teks melalui gambar.	ModelScope

Menerapkan layanan

Di Konsol AI Search Open Platform, pilih Model Service > Service Deployment, lalu klik Deploy Service.
Jika Anda menggunakan akun RAM untuk membuat, memodifikasi, atau melihat detail layanan, Anda perlu memberikan izin operasi terkait kepada akun RAM untuk Model Service-Service Deployment terlebih dahulu.
Di halaman Deploy Service, konfigurasikan nama layanan, wilayah penyebaran, dan informasi lainnya.
- Wilayah penyebaran yang saat ini didukung adalah Jerman (Frankfurt).
- Tipe Sumber Daya: Jenis untuk penerapan model.
- Perkiraan Harga: Biaya penerapan model.
Klik Deploy, dan sistem mulai menerapkan layanan. Deskripsi status layanan:
- Deploying: Sistem sedang menerapkan layanan, layanan sementara tidak tersedia. Di daftar layanan, klik Manage untuk melihat detail layanan atau klik Delete untuk menghapus tugas.
- Normal: Menunjukkan penerapan berhasil. Di daftar layanan, Anda dapat klik Manage untuk melihat detail layanan. Di halaman detail layanan, Anda dapat menggunakan Change Configuration untuk memodifikasi konfigurasi sumber daya layanan. Di daftar layanan, Anda dapat klik Delete untuk menghapus layanan.
- Deployment Failed: Lihat detail penerapan, terapkan ulang, atau hapus tugas penerapan.

Lihat informasi pemanggilan layanan

Masuk ke Konsol AI Search Open Platform, pilih Model Service > Service Deployment, dan klik Manage di daftar layanan.

ID Layanan: Parameter ini diperlukan saat memanggil layanan melalui SDK.
API publik dan privat: Anda dapat memilih untuk memanggil layanan model melalui alamat publik atau privat.
Token: Kredensial untuk pemanggilan layanan. Dibagi menjadi Token jaringan publik dan Token jaringan privat. Saat memanggil layanan melalui alamat publik atau privat, Anda perlu mengisi Token yang sesuai.
API-KEY: Digunakan untuk otentikasi identitas saat memanggil layanan melalui API-KEY.

Uji layanan

Saat menguji layanan model menggunakan perintah curl, Anda perlu menyediakan informasi API-KEY dan Token.

Jalankan kode berikut untuk memanggil model vektorisasi teks guna menyematkan konten input "Ilmu pengetahuan dan teknologi adalah kekuatan produktif utama" dan "dokumentasi produk opensearch":

curl -X POST \
     -H "Content-Type: application/json" \
     -H "Authorization: Bearer Your-API-KEY" \
     -H "Token: NjU0ZDkzYjUwZTQ1NDI1OGRiN2ExMmFmNjQxMDYyN2M5*******==" \
     "http://default-0fm.platform-cn-hangzhou.opensearch.aliyuncs.com/v3/openapi/deployments/******_1zj19x_1yc/predict" \
     -d '{
           "input": [
             "Ilmu pengetahuan dan teknologi adalah kekuatan produktif utama",
             "dokumentasi produk opensearch"
           ],
           "input_type": "query",
           "dimension" : 567 # Hanya efektif saat menerapkan model kustom dengan pengurangan dimensional vektor diaktifkan, dan dimensi tidak boleh lebih besar dari dimensi model dasar
         }'

Hasil tanggapan yang benar:

{
  "embeddings": [
    {
      "index": 0,
      "embedding": [
        -0.028656005859375,
        0.0218963623046875,
        -0.04168701171875,
        -0.0440673828125,
        0.02142333984375,
        0.012345678901234568,
        ...
        0.0009876543210987654
      ]
    }
  ]
}

Panggil layanan melalui SDK

Setelah pengujian, lihat contoh pemanggilan Python SDK berikut untuk mengintegrasikan SDK ke dalam sistem bisnis Anda guna melakukan pemanggilan layanan.

import json

from alibabacloud_tea_openapi.models import Config
from alibabacloud_searchplat20240529.client import Client
from alibabacloud_searchplat20240529.models import GetPredictionRequest
from alibabacloud_searchplat20240529.models import GetPredictionHeaders
from alibabacloud_tea_util import models as util_models

if __name__ == '__main__':
    config = Config(bearer_token="API-KEY",
                    # konfigurasi endpoint untuk entri permintaan terpadu, hapus http:// atau https://
                    endpoint="default-xxx.platform-cn-shanghai.opensearch.aliyuncs.com",
                    # protokol mendukung HTTPS dan HTTP
                    protocol="http")
    client = Client(config=config)

    # --------------- Parameter body permintaan ---------------
    request = GetPredictionRequest().from_map({"body":{"input_type": "document", "input": ["search", "test"]}})

    headers = GetPredictionHeaders(token="xxxxxxxxYjIyNjNjMjc2MTU1MTQ3MmI0ZmQ3OGQ0ZjJlMxxxxxxxx==")

    runtime = util_models.RuntimeOptions()

    # deploymentId: ID penerapan
    response = client.get_prediction_with_options("ID Layanan dari layanan yang diterapkan" ,request, headers, runtime)
    print(response)