Service Plaza mengumpulkan semua layanan dari Platform AI Search Terbuka. Anda dapat mengakses Service Plaza untuk melihat detail berbagai layanan tanpa harus masuk ke Akun Alibaba Cloud.
Prosedur
Kunjungi Service Plaza untuk melihat berbagai layanan yang disediakan oleh Platform AI Search Terbuka.
Kategori Layanan
Deskripsi
Penguraian konten dokumen
Layanan penguraian dokumen umum yang mengekstraksi struktur hierarki logis seperti judul dan paragraf dari dokumen tidak terstruktur (teks, tabel, gambar, dll.) dan mengeluarkannya dalam format terstruktur.
Penguraian konten gambar
Layanan pemahaman konten gambar menggunakan LLM multi-modal untuk mengurai dan memahami konten gambar serta melakukan pengenalan teks. Teks yang diurai dapat digunakan untuk skenario pencarian gambar dan tanya-jawab.
Layanan pengenalan teks OCR pada gambar. Teks yang dikenali dapat digunakan untuk skenario pencarian gambar dan tanya-jawab.
Pemotongan dokumen
Menyediakan layanan pemotongan teks umum, mendukung pemotongan data terstruktur dalam format HTML, Markdown, dan TXT berdasarkan paragraf dokumen, semantik teks, atau aturan tertentu. Juga mendukung ekstraksi kode, gambar, dan tabel dari dokumen dalam format teks kaya.
Vektorisasi teks
OpenSearch layanan vektorisasi teks-001: Menyediakan layanan penyematan teks multibahasa (40+) dengan panjang teks input maksimum 300 token dan dimensi vektor output 1536.
OpenSearch layanan vektorisasi teks universal-002: Menyediakan layanan penyematan teks multibahasa (100+) dengan panjang teks input maksimum 8192 token dan dimensi vektor output 1024.
OpenSearch layanan vektorisasi teks-Bahasa Mandarin-001: Menyediakan layanan penyematan teks Bahasa Mandarin dengan panjang teks input maksimum 1024 token dan dimensi vektor output 768.
OpenSearch layanan vektorisasi teks-Bahasa Inggris-001: Menyediakan layanan penyematan teks Bahasa Inggris dengan panjang teks input maksimum 512 token dan dimensi vektor output 768.
GTE text embedding-multilingual-base: Layanan penyematan teks multibahasa (70+) dengan panjang teks input maksimum 8192 dan dimensi vektor output 768.
Qwen3 text embedding-0.6B: Seri Qwen3 layanan penyematan teks multibahasa (100+) dengan panjang input maksimum 32k dan dimensi vektor output yang dapat disesuaikan dari 32 hingga 1024, dengan 0.6B parameter.
Vektor Multimodal
M2-Encoder-model vektor multimodal: Layanan bilingual Cina-Inggris berbasis 6 miliar pasangan gambar-teks (3 miliar data Cina dan 3 miliar data Inggris) berdasarkan BM-6B. Model ini mendukung pencarian lintas modal antara teks dan gambar (termasuk pencarian teks untuk gambar dan pencarian gambar untuk teks), serta tugas klasifikasi gambar.
M2-Encoder-Large-model vektor multimodal: Layanan bilingual Cina-Inggris dengan jumlah parameter lebih besar yaitu 1B (1 miliar parameter) dibandingkan model M2-Encoder, memberikan kemampuan ekspresi dan performa yang lebih kuat dalam pemrosesan tugas multimodal.
Vektorisasi teks jarang
Ubah data teks menjadi representasi vektor jarang. Vektor jarang memerlukan ruang penyimpanan lebih sedikit dan biasanya digunakan untuk merepresentasikan kata kunci dan informasi frekuensi istilah. Gunakan bersama vektor padat untuk pencarian hibrida guna meningkatkan efektivitas pencarian.
OpenSearch layanan vektorisasi teks jarang: Menyediakan layanan vektorisasi teks multibahasa (100+) dengan panjang teks input maksimum 8192 token.
Analisis query
Berdasarkan kemampuan LLM dan NLP, dapat melakukan pengenalan maksud, perluasan pertanyaan serupa, dan pemrosesan NL2SQL pada query pengguna, secara efektif meningkatkan efektivitas pencarian dan tanya-jawab dalam skenario RAG.
Layanan analisis query umum yang menggunakan LLM untuk memahami query input pengguna dan memperluas pertanyaan serupa.
Layanan pengurutan
Model penataan ulang BGE: Menyediakan layanan penilaian dokumen berdasarkan model BGE. Dapat menata ulang dokumen berdasarkan relevansi antara query dan konten dokumen, dari skor tinggi ke rendah, dan mengeluarkan hasil penilaian yang sesuai. Mendukung bahasa Cina dan Inggris dengan panjang token input maksimum 512 (Query + Panjang Dok).
OpenSearch pengurutan teks: Dilatih dengan dataset multi-industri, menyediakan layanan pengurutan ulang berkualitas tinggi yang dapat menata ulang dokumen berdasarkan relevansi semantik dengan query dari tinggi ke rendah. Mendukung bahasa Cina dan Inggris dengan panjang token input maksimum 512 (Query + panjang dok).
Qwen3-Pengurutan-0.6B: Seri Qwen3 layanan pengurutan dokumen mendukung 100+ bahasa, dengan panjang token input maksimum 32k (Query + panjang dok) dan 0.6B parameter.
Pengenalan suara
Layanan pengenalan suara 001: Menyediakan kemampuan suara-ke-teks yang dapat dengan cepat mengonversi konten suara dalam video atau audio menjadi teks terstruktur. Layanan ini mendukung beberapa bahasa.
Video Snapshot
Layanan snap tem video 001: Menyediakan kemampuan ekstraksi konten video yang dapat menangkap keyframe dari video. Dikombinasikan dengan layanan embedding multimodal atau kemampuan penguraian gambar, memungkinkan pencarian lintas modal.
Model besar
Qwen3-235B-A22B: Generasi baru model LLM Qwen. Berdasarkan pelatihan ekstensif, Qwen3 telah membuat terobosan dalam penalaran, pengikutan instruksi, kemampuan Agent, dan dukungan multibahasa. Mendukung lebih dari 100 bahasa dan dialek, dengan kemampuan pemahaman, penalaran, dan generasi multibahasa yang kuat.
OpenSearch-Qwen-Turbo: Menggunakan qwen-turbo sebagai model dasar, dengan fine-tuning model supervisi, peningkatan augmentasi pengambilan, dan pengurangan bahaya.
Qwen-Turbo: Model paling cepat dan hemat biaya dalam seri Qwen, cocok untuk tugas sederhana. Untuk informasi lebih lanjut, lihat Qwen-Turbo.
Qwen-Plus: Seimbang dalam kemampuan, dengan efektivitas penalaran, biaya, dan kecepatan antara Qwen-Max dan Qwen-Turbo, cocok untuk tugas yang cukup kompleks. Untuk informasi lebih lanjut, lihat Qwen-Plus.
Qwen-Max: Model dengan performa terbaik dalam seri Qwen, cocok untuk tugas kompleks, multi-langkah. Untuk informasi lebih lanjut, lihat Qwen-Max.
Model pemikiran mendalam QwQ: Model penalaran QwQ yang dilatih berdasarkan model Qwen2.5-32B, secara signifikan meningkatkan kemampuan penalaran model melalui pembelajaran penguatan.
DeepSeek-R1: Model bahasa besar yang berfokus pada tugas penalaran kompleks, dengan performa luar biasa dalam pemahaman instruksi kompleks dan akurasi hasil.
DeepSeek-V3: Model MoE dengan performa luar biasa dalam teks panjang, kode, matematika, ensiklopedia, dan kemampuan bahasa Cina.
DeepSeek-R1-distill-qwen-7b: Model yang disempurnakan pada Qwen-7B menggunakan sampel pelatihan yang dihasilkan oleh DeepSeek-R1 berdasarkan teknologi penyulingan pengetahuan.
DeepSeek-R1-distill-qwen-14b: Model yang disempurnakan pada Qwen-14B menggunakan sampel pelatihan yang dihasilkan oleh DeepSeek-R1 berdasarkan teknologi penyulingan pengetahuan.
Pencarian Internet
Selama proses pencarian, ketika basis pengetahuan pribadi tidak dapat memberikan jawaban yang sesuai, Anda dapat memperluas pencarian ke Internet untuk mendapatkan lebih banyak informasi, melengkapi basis pengetahuan pribadi, dan menggabungkannya dengan model bahasa besar untuk memberikan jawaban yang lebih kaya.
Klik View Details di pojok kiri bawah kartu layanan untuk melihat Service Name, Service ID, Service Introduction, dan Charging method.
Klik Experience di pojok kanan bawah kartu layanan untuk menuju ke Experience Center, di mana Anda dapat menguji layanan dan melihat pratinjau efeknya. Untuk informasi lebih lanjut, lihat Pusat Pengalaman.