Model text embedding mengonversi data teks menjadi vektor numerik untuk tugas-tugas lanjutan, seperti pencarian semantik, rekomendasi, pengelompokan, dan kategorisasi.
Ikhtisar model
Singapura
Model | Dimensi penyematan | Ukuran batch | Maks token per batch (Catatan) | Harga (Juta token input) | Bahasa yang didukung | Kuota gratis(Catatan) |
text-embedding-v4 Bagian dari seri Qwen3-Embedding | 2.048, 1.536, 1.024 (default), 768, 512, 256, 128, 64 | 10 | 8.192 | $0,07 | Bahasa Tionghoa, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, Rusia, dan lebih dari 100 bahasa utama lainnya | 1 juta token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
text-embedding-v3 | 1.024 (default), 768, 512 | Bahasa Tionghoa, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, Rusia, dan lebih dari 50 bahasa utama lainnya | 500.000 token Masa berlaku: 90 hari setelah Anda mengaktifkan Model Studio |
Beijing
Model | Dimensi penyematan | Ukuran batch | Maks token per batch | Harga (Juta token input) | Bahasa yang didukung |
text-embedding-v4 Bagian dari seri Qwen3-Embedding | 2.048, 1.536, 1.024 (bawaan), 768, 512, 256, 128, 64 | 10 | 8.192 | $0,072 | Bahasa Tionghoa, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, Rusia, dan lebih dari 100 bahasa utama lainnya serta berbagai bahasa pemrograman |
Untuk batas laju model, lihat Batas laju.
Persiapan
Jika Anda sudah terbiasa dengan ekosistem OpenAI, Anda dapat menggunakan API yang kompatibel dengan OpenAI untuk migrasi cepat. API DashScope menyediakan fitur eksklusif tambahan. Pilih API yang paling sesuai dengan kebutuhan Anda.
Anda harus mendapatkan Kunci API dan menyetel Kunci API sebagai Variabel lingkungan. Jika Anda menggunakan SDK untuk melakukan panggilan, Anda juga harus menginstal SDK DashScope.
Kompatibel dengan OpenAI
base_url untuk SDK:
Singapura: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
Tiongkok (Beijing): https://dashscope.aliyuncs.com/compatible-mode/v1
titik akhir untuk HTTP:
Singapura: POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/embeddings
Tiongkok (Beijing): POST https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
Isi permintaan | String inputPythonJavacurlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings Daftar string inputPythonJavacurlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings File inputPythonJavacurlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings Ganti 'texts_to_embedding.txt' dengan nama file atau jalur Anda. |
model Model yang akan dipanggil. Pilih nama model dari tabel Ikhtisar model. | |
input Teks input yang akan diproses. Nilainya dapat berupa string, array string, atau file: Jika input berupa string, panjang maksimumnya adalah 8.192 token. Jika input berupa daftar string atau file, maksimal berisi 10 item (baris), dengan masing-masing item (baris) maksimal 8.192 token. | |
dimensions Dimensi penyematan. Nilainya harus salah satu dari berikut: 2048 (hanya untuk text-embedding-v4), 1536 (hanya untuk text-embedding-v4), 1024, 768, 512, 256, 128, atau 64. Nilai default adalah 1024. | |
encoding_format Format penyematan yang dikembalikan. Hanya format |
Objek respons | Respons suksesRespons kesalahan |
data Data keluaran untuk tugas tersebut. | |
model Model yang dipanggil. | |
object string Jenis data yang dikembalikan oleh panggilan. Nilai default adalah list. | |
usage | |
id string ID permintaan unik. Anda dapat menggunakan ID ini untuk melacak dan memecahkan masalah permintaan. |
DashScope
base_url untuk SDK:
Singapura: https://dashscope-intl.aliyuncs.com/api/v1
Tiongkok (Beijing): https://dashscope.aliyuncs.com/api/v1
Titik akhir untuk HTTP:
Singapura: POST https://dashscope-intl.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
Tiongkok (Beijing): POST https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
Isi permintaan | String inputPythonJavacurlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding Daftar string inputPythonJavacurlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding File inputPythonJavacurlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding Ganti 'texts_to_embedding.txt' dengan nama file atau jalur Anda. |
model Model yang akan dipanggil. Pilih nama model dari tabel Ikhtisar model. | |
input Teks input yang akan diproses. Nilainya dapat berupa string, array string, atau file: Input string dapat berisi maksimal 8.192 token. Daftar string atau file dapat berisi maksimal 10 item (baris), dan setiap item (baris) dapat berisi maksimal 8.192 token. | |
text_type Vektor teks dapat digunakan untuk tugas lanjutan seperti pengambilan, pengelompokan, dan kategorisasi. Untuk tugas asimetris seperti pengambilan, kami merekomendasikan agar Anda membedakan antara kueri dan dokumen untuk mencapai hasil yang lebih baik. Untuk tugas simetris seperti pengelompokan dan kategorisasi, Anda dapat menggunakan nilai default | |
dimension Dimensi penyematan. Nilainya harus salah satu dari berikut: 2048 (hanya untuk text-embedding-v4), 1536 (hanya untuk text-embedding-v4), 1024, 768, 512, 256, 128, atau 64. Nilai default adalah 1024. | |
output_type Menentukan apakah akan mengeluarkan representasi vektor jarang. Parameter ini hanya berlaku untuk model text-embedding-v3 dan text-embedding-v4. Nilai yang valid adalah dense, sparse, dan dense&sparse. Nilai default adalah dense, yang hanya mengembalikan vektor padat. | |
instruct Deskripsi tugas kustom. Parameter ini hanya berlaku saat Anda menggunakan model |
Objek respons | Respons suksesRespons kesalahan |
status_code Kode status. Nilai 200 menunjukkan permintaan berhasil. | |
request_id ID permintaan unik. Anda dapat menggunakan ID ini untuk melacak dan memecahkan masalah permintaan. | |
code Jika permintaan gagal, parameter ini menunjukkan kode kesalahan. Jika permintaan berhasil, parameter ini kosong. | |
message Jika permintaan gagal, parameter ini menunjukkan pesan kesalahan detail. Jika permintaan berhasil, parameter ini kosong. | |
output Data keluaran untuk tugas tersebut. | |
usage |
Kode kesalahan
Jika pemanggilan model gagal dan pesan kesalahan dikembalikan, lihat Pesan kesalahan.