Model penyematan teks tujuan umum mengonversi data teks menjadi vektor numerik untuk tugas-tugas downstream seperti pencarian semantik, rekomendasi, pengelompokan, dan kategorisasi.
Ikhtisar model
Singapura
|
Model |
Dimensi penyematan |
Jumlah Maksimum Baris |
Maks token per baris (Catatan) |
Harga (per juta token input) |
Bahasa yang didukung |
Kuota gratis (Catatan) |
|
text-embedding-v4 Bagian dari seri Qwen3-Embedding |
2.048, 1.536, 1.024 (default), 768, 512, 256, 128, 64 |
10 |
8.192 |
$0,07 |
Bahasa Tionghoa, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, Rusia, dan lebih dari 100 bahasa utama lainnya |
1 juta token Berlaku: 90 hari setelah Anda mengaktifkan Model Studio |
|
text-embedding-v3 |
1.024 (default), 768, 512 |
Bahasa Tionghoa, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, Rusia, dan lebih dari 50 bahasa utama lainnya |
500.000 token Berlaku: 90 hari setelah Anda mengaktifkan Model Studio |
Beijing
|
Model |
Dimensi penyematan |
Jumlah maksimum baris |
Maks token per baris |
Harga (per juta token input) |
Bahasa yang didukung |
|
text-embedding-v4 Bagian dari seri Qwen3-Embedding |
2.048, 1.536, 1.024 (default), 768, 512, 256, 128, 64 |
10 |
8.192 |
$0,072 |
Bahasa Tionghoa, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, Rusia, dan lebih dari 100 bahasa utama lainnya serta berbagai bahasa pemrograman |
Tiongkok (Hong Kong)
|
Model |
Dimensi penyematan |
Jumlah maksimum baris |
Token maksimum per baris |
Harga (per juta token input) |
Bahasa yang didukung |
|
text-embedding-v4 Bagian dari seri Qwen3-Embedding |
2.048, 1.536, 1.024 (default), 768, 512, 256, 128, 64 |
10 |
8.192 |
$0,07 |
Bahasa Tionghoa, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, Rusia, dan lebih dari 100 bahasa utama lainnya serta berbagai bahasa pemrograman |
Untuk informasi tentang batas laju model, lihat Pembatasan laju.
Prasyarat
Jika Anda terbiasa dengan ekosistem OpenAI, Anda dapat menggunakan API kompatibel OpenAI untuk migrasi cepat. API DashScope menyediakan fitur unik tambahan. Pilih API yang paling sesuai dengan kebutuhan Anda.
Dapatkan Kunci API dan ekspor Kunci API sebagai variabel lingkungan. Jika Anda menggunakan SDK untuk melakukan panggilan, instal SDK DashScope.
Kompatibel dengan OpenAI
base_url untuk dikonfigurasi pada panggilan SDK:
-
Singapura: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
-
Tiongkok (Beijing): https://dashscope.aliyuncs.com/compatible-mode/v1
-
Tiongkok (Hong Kong): https://cn-hongkong.dashscope.aliyuncs.com/compatible-mode/v1
Titik akhir untuk dikonfigurasi pada panggilan HTTP:
-
Singapura: POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/embeddings
-
Tiongkok (Beijing): POST https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
-
Tiongkok (Hong Kong): POST https://cn-hongkong.dashscope.aliyuncs.com/compatible-mode/v1/embeddings
Badan permintaan |
String inputPython
Java
curlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
Daftar string inputPython
Java
curlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
File inputPython
Java
curlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings Pastikan untuk mengganti 'texts_to_embedding.txt' dengan nama file atau jalur Anda.
|
|
model Nama model yang akan dipanggil. Pilih nama model dari tabel Ikhtisar model. |
|
|
input Teks yang akan diproses. Teks dapat berupa string, array string, atau file. seperti dijelaskan di bawah ini: Ketika input berupa string, mendukung hingga 8.192 token. Ketika input berupa daftar string atau file, mendukung hingga 10 item (baris), dengan setiap item (baris) mendukung hingga 8.192 token. |
|
|
dimensions Jumlah dimensi untuk vektor output. Nilainya harus 2.048 (hanya untuk |
|
|
encoding_format Menentukan format penyematan yang dikembalikan. Hanya |
Objek respons |
Respons sukses
Respons kesalahan
|
|
data Informasi output dari tugas. |
|
|
model Nama model yang digunakan dalam panggilan ini. |
|
|
object string Jenis data yang dikembalikan. Nilai default adalah `list`. |
|
|
usage |
|
|
id string Identifikasi permintaan unik. Anda dapat menggunakan identifikasi ini untuk pelacakan permintaan dan troubleshooting. |
DashScope
base_url untuk dikonfigurasi pada panggilan SDK:
-
Singapura: https://dashscope-intl.aliyuncs.com/api/v1
-
Tiongkok (Beijing): https://dashscope.aliyuncs.com/api/v1
-
Tiongkok (Hong Kong): https://cn-hongkong.dashscope.aliyuncs.com/api/v1
Titik akhir untuk dikonfigurasi pada panggilan HTTP:
-
Singapura: POST https://dashscope-intl.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
-
Tiongkok (Beijing): POST https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
-
Tiongkok (Hong Kong): POST https://cn-hongkong.dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
Badan permintaan |
String inputPython
Java
curlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
Daftar string inputPython
Java
curlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
File inputPython
Java
curlJika Anda menggunakan model di wilayah Tiongkok (Beijing), gunakan Kunci API untuk wilayah tersebut dan ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding Pastikan untuk mengganti 'texts_to_embedding.txt' dengan nama file atau jalur Anda.
|
|
model Model yang akan dipanggil. Pilih nama model dari tabel Ikhtisar model. |
|
|
input Teks yang akan diproses. Teks dapat berupa string, array string, atau file. seperti dijelaskan di bawah ini: Input string dapat berisi hingga 8.192 token. Daftar string atau file dapat berisi hingga 10 item atau baris, dengan setiap item atau baris dibatasi hingga 8.192 token. |
|
|
text_type Jika Anda melakukan panggilan melalui HTTP, letakkan text_type dalam objek `parameters`. Setelah Anda mengonversi teks menjadi vektor, Anda dapat menggunakan vektor tersebut untuk tugas-tugas downstream seperti pengambilan, pengelompokan, dan kategorisasi. Untuk tugas asimetris seperti pengambilan, kami merekomendasikan agar Anda membedakan antara teks kueri (`query`) dan teks dokumen (`document`) untuk mencapai hasil yang lebih baik. Untuk tugas simetris seperti pengindeksan, pengelompokan, dan kategorisasi, Anda dapat menggunakan nilai default |
|
|
dimension Jika Anda melakukan panggilan melalui HTTP, letakkan dimension dalam objek `parameters`. Jumlah dimensi untuk vektor output. Nilainya harus 2.048 (hanya `text-embedding-v4`), 1.536 (hanya `text-embedding-v4`), 1.024, 768, 512, 256, 128, atau 64. Nilai default adalah 1.024. |
|
|
output_type Jika Anda melakukan panggilan melalui HTTP, letakkan output_type dalam objek `parameters`. Menentukan apakah akan mengeluarkan representasi vektor jarang. Parameter ini hanya berlaku untuk model |
|
|
instruct Anda dapat menambahkan instruksi tugas kustom untuk membimbing model dalam memahami maksud kueri. Jika Anda menulis instruksi dalam bahasa Inggris, Anda dapat mengharapkan peningkatan performa sebesar 1% hingga 5%. |
Objek respons |
Respons sukses
Respons kesalahan
|
|
status_code Kode status yang menunjukkan hasil permintaan. Misalnya, kode status 200 menunjukkan bahwa permintaan berhasil. |
|
|
request_id Identifikasi permintaan unik. Anda dapat menggunakan identifikasi ini untuk pelacakan permintaan dan troubleshooting. |
|
|
code Kode kesalahan yang dikembalikan jika permintaan gagal. Parameter ini kosong jika permintaan berhasil. |
|
|
message Pesan kesalahan rinci yang dikembalikan jika permintaan gagal. Parameter ini kosong jika permintaan berhasil. |
|
|
output Informasi output dari tugas. |
|
|
usage |
Kode kesalahan
Jika panggilan model gagal dan kesalahan dikembalikan, lihat Pesan kesalahan untuk solusi.