Model unggulan
Global
Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Flagship models |
Ideal untuk tugas kompleks. Model paling kuat. |
Keseimbangan antara performa, kecepatan, dan biaya. |
Ideal untuk pekerjaan simple. Cepat dan berbiaya rendah. |
Model kode unggulan yang unggul dalam pemanggilan tool dan interaksi lingkungan. |
Max context window (Tokens) | 262.144 | 1.000.000 | 1.000.000 | 1.000.000 |
Min input cost (Million tokens) | $1,2 | $0,4 | $0,05 | $0,3 |
Min output cost (Million tokens) | $6 | $1,2 | $0,4 | $1,5 |
International
Dalam mode penyebaran International, titik akses dan penyimpanan data berlokasi di wilayah Singapore, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Mainland China).
Flagship models |
Ideal untuk tugas kompleks. Model paling kuat. |
Keseimbangan antara performa, kecepatan, dan biaya. |
Ideal untuk pekerjaan simple. Cepat dan berbiaya rendah. |
Model kode unggulan yang unggul dalam pemanggilan tool dan interaksi lingkungan. |
Max context window (Tokens) | 262.144 | 1.000.000 | 1.000.000 | 1.000.000 |
Min input cost (Million tokens) | $1,2 | $0,4 | $0,05 | $0,3 |
Min output cost (Million tokens) | $6 | $1,2 | $0,4 | $1,5 |
US
Dalam mode penyebaran US, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dibatasi hanya di wilayah AS.
Flagship models |
Keseimbangan antara performa, kecepatan, dan biaya. |
Ideal untuk pekerjaan simple. Cepat dan berbiaya rendah. |
Max context window (Tokens) | 1.000.000 | 1.000.000 |
Min input cost (Million tokens) | $0,4 | $0,05 |
Min output cost (Million tokens) | $1,2 | $0,4 |
Mainland China
Dalam mode penyebaran Mainland China, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Mainland China.
Flagship models |
Ideal untuk tugas kompleks. Model paling kuat. |
Keseimbangan antara performa, kecepatan, dan biaya. |
Ideal untuk pekerjaan simple. Cepat dan berbiaya rendah. |
Model kode unggulan yang unggul dalam pemanggilan tool dan interaksi lingkungan. |
Max context window (Tokens) | 262.144 | 1.000.000 | 1.000.000 | 1.000.000 |
Min input cost (Million tokens) | $0,459 | $0,115 | $0,022 | $0,144 |
Min output cost (Million tokens) | $1,836 | $0,287 | $0,216 | $0,574 |
Tinjauan model
Global
Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Kategori | Subkategori | Deskripsi |
Text generation | Model bahasa besar Qwen: Model komersial (Qwen-Max, Qwen-Plus, Qwen-Flash), model open source (Qwen3) | |
Model pemahaman visual Qwen-VL | ||
Image generation |
| |
| ||
Video generation | Menghasilkan video berkualitas tinggi dengan berbagai gaya dari satu kalimat. | |
First-frame-to-video: Menggunakan gambar input sebagai frame pertama dan menghasilkan video berdasarkan prompt. | ||
Reference-to-video: Menghasilkan video yang mempertahankan konsistensi karakter menggunakan prompt serta penampilan dan suara dari video input. |
International
Dalam mode penyebaran International, titik akses dan penyimpanan data berlokasi di wilayah Singapore, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Mainland China).
Kategori | Subkategori | Deskripsi |
Text generation | Model bahasa besar Qwen: Model komersial (Qwen-Max, Qwen-Plus, Qwen-Flash), model open source (Qwen3, Qwen2.5) | |
Model pemahaman visual Qwen-VL, model penalaran visual QVQ, model omni-modal Qwen-Omni, dan model multi-modal real-time Qwen-Omni-Realtime | ||
Image generation |
| |
| ||
Speech synthesis and recognition | Qwen speech synthesis dan Qwen realtime speech synthesis dapat digunakan untuk text-to-speech dalam skenario seperti layanan pelanggan suara cerdas, buku audio, navigasi dalam mobil, dan bimbingan belajar. | |
Qwen realtime speech recognition, Qwen audio file recognition, Qwen3-LiveTranslate-Flash-Realtime, dan Fun-ASR speech recognition dapat melakukan speech-to-text untuk skenario seperti catatan rapat real-time, keterangan siaran langsung real-time, dan layanan pelanggan telepon. | ||
Video generation | Menghasilkan video berkualitas tinggi dengan berbagai gaya dari satu kalimat. | |
| ||
Reference-to-video: Menghasilkan video yang mempertahankan konsistensi karakter menggunakan prompt serta penampilan dan suara dari video input. | ||
General video editing: Melakukan berbagai tugas pengeditan video berdasarkan input teks, gambar, dan video. Misalnya, dapat menghasilkan video baru dengan mengekstraksi fitur gerakan dari video input dan menggabungkannya dengan prompt. | ||
Embedding | Mengonversi teks menjadi sekumpulan angka yang merepresentasikan teks tersebut. Cocok untuk tugas pencarian, pengelompokan, rekomendasi, dan klasifikasi. |
US
Dalam mode penyebaran US, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dibatasi hanya di wilayah AS.
Kategori | Subkategori | Deskripsi |
Text generation | Model bahasa besar Qwen: Model komersial (Qwen-Plus, Qwen-Flash) | |
Model pemahaman visual Qwen-VL | ||
Video generation | Menghasilkan video berkualitas tinggi dengan berbagai gaya dari satu kalimat. | |
First-frame-to-video: Menggunakan gambar input sebagai frame pertama dan menghasilkan video berdasarkan prompt. | ||
Speech recognition | Qwen audio file recognition dapat melakukan speech-to-text untuk skenario seperti transkripsi rapat dan pemberian keterangan siaran langsung. |
Mainland China
Dalam mode penyebaran Mainland China, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Mainland China.
Kategori | Model | Deskripsi |
Text generation | ||
Model pemahaman visual Qwen-VL, model penalaran visual QVQ, dan model omni-modal Qwen-Omni | ||
Code model, Mathematical model, Translation model, Data mining model, Research model, Intention recognition model, Role-playing model | ||
Image generation |
| |
Model tujuan umum:
Model lainnya: Qwen Image Translation, OutfitAnyone | ||
Speech synthesis and recognition | Qwen speech synthesis, Qwen realtime speech synthesis, dan CosyVoice speech synthesis mengonversi teks menjadi ucapan untuk skenario seperti layanan pelanggan berbasis suara, buku audio, navigasi dalam mobil, dan bimbingan belajar. | |
Qwen realtime speech recognition, Qwen audio file recognition, Fun-ASR speech recognition, dan Paraformer speech recognition mengonversi ucapan menjadi teks untuk skenario seperti transkripsi rapat real-time, pemberian keterangan siaran langsung real-time, dan panggilan layanan pelanggan. | ||
Video editing and generation | Menghasilkan video berkualitas tinggi dengan berbagai gaya dari satu kalimat. | |
| ||
Reference-to-video: Menghasilkan video yang mempertahankan konsistensi karakter menggunakan prompt serta penampilan dan suara dari video input. | ||
| ||
Vector | Mengonversi teks menjadi sekumpulan angka yang merepresentasikan teks tersebut. Digunakan untuk pencarian, pengelompokan, rekomendasi, dan klasifikasi. | |
Mengonversi teks, gambar, dan ucapan menjadi sekumpulan angka. Digunakan untuk klasifikasi audio dan video, klasifikasi gambar, serta pengambilan gambar-teks. |
Generasi teks - Qwen
Berikut ini adalah model komersial Qwen. Dibandingkan dengan versi open-source, model komersial menawarkan kemampuan dan peningkatan terbaru.
Ukuran parameter model komersial tidak diungkapkan.
Setiap model diperbarui secara berkala. Untuk menggunakan versi tetap, Anda dapat memilih versi snapshot. Versi snapshot biasanya dipertahankan selama satu bulan setelah rilis versi snapshot berikutnya.
Kami merekomendasikan penggunaan versi stable atau latest untuk mendapatkan kondisi pembatasan laju yang lebih longgar.
Qwen-Max
Model dengan performa terbaik dalam seri Qwen, cocok untuk tugas kompleks multi-langkah. Penggunaan | Referensi API | Coba online
Global
Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maks | Biaya input | Biaya output | Kuota gratis |
(Token) | (1.000 token) | ||||||||
qwen3-max Memiliki kemampuan yang sama dengan qwen3-max-2025-09-23. Cache konteks memenuhi syarat untuk diskon | Stable | Hanya non-thinking | 262.144 | 258.048 | - | 65.536 | Harga bertingkat, lihat deskripsi di bawah tabel. | Tidak ada | |
qwen3-max-2025-09-23 | Snapshot | Hanya non-thinking | |||||||
qwen3-max-preview Cache konteks tersedia dengan diskon. | Preview | Thinking | 81.920 | 32.768 | |||||
Non-thinking | - | 65.536 | |||||||
Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Token input per permintaan | Harga input (Juta token) | Harga output (Juta token) Rantai-pikiran + Jawaban |
0 < Token ≤ 32K | $1,2 | $6 |
32K < Token ≤ 128K | $2,4 | $12 |
128K < Token ≤ 252K | $3 | $15 |
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maksimum | Biaya input | Biaya output | Kuota gratis |
(Token) | (1.000 token) | ||||||||
qwen3-max Memiliki kemampuan yang sama dengan qwen3-max-2025-09-23. Pemanggilan batch: Setengah harga | Stable | Hanya non-thinking | 262.144 | 258.048 | - | 65.536 | Harga bertingkat, lihat deskripsi di bawah tabel. | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. | |
qwen3-max-2025-09-23 | Snapshot | Hanya non-thinking | |||||||
qwen3-max-preview | Preview | Thinking | 81.920 | 32.768 | |||||
Non-thinking | - | 65.536 | |||||||
Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Token input per permintaan | Harga input (Juta token) qwen3-max dan qwen3-max-preview mendukung cache konteks. | Harga output (Juta token) |
0 < Token ≤ 32K | $1,2 | $6 |
32K < Token ≤ 128K | $2,4 | $12 |
128K < Token ≤ 252K | $3 | $15 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maks | Biaya input | Biaya output |
(Token) | (1.000 token) | |||||||
qwen3-max Memiliki kemampuan yang sama dengan qwen3-max-2025-09-23. Pemanggilan batch tersedia dengan diskon 50%. | Stable | Hanya non-thinking | 262.144 | 258.048 | - | 65.536 | Harga bertingkat, lihat deskripsi di bawah tabel. | |
qwen3-max-2025-09-23 | Snapshot | Hanya non-thinking | ||||||
qwen3-max-preview | Preview | Thinking | 81.920 | 32.768 | ||||
Non-thinking | - | 65.536 | ||||||
Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Model | Token input per permintaan | Harga input (Juta token) | Harga output (Juta token) Rantai-pikiran + Jawaban |
qwen3-max Pemanggilan batch dengan diskon 50% Cache konteks memenuhi syarat untuk diskon. | 0 < Token ≤ 32K | $0,459 | $1,836 |
32K < Token ≤ 128K | $0,918 | $3,672 | |
128K < Token ≤ 252K | $1,377 | $5,508 | |
qwen3-max-2025-09-23 | 0 < Token ≤ 32K | $0,861 | $3,441 |
32K < Token ≤ 128K | $1,434 | $5,735 | |
128K < Token ≤ 252K | $2,151 | $8,602 | |
qwen3-max-preview cache konteks memenuhi syarat untuk diskon. | 0 < Token ≤ 32K | $0,861 | $3.441 |
32K < Token ≤ 128K | $1,434 | $5,735 | |
128K < Token ≤ 252K | $2,151 | $8,602 |
Mode thinking dari model qwen3-max-preview secara signifikan meningkatkan kemampuan inferensinya secara keseluruhan, terutama untuk pemrograman agen, penalaran akal sehat, dan tugas-tugas yang berkaitan dengan matematika, sains, serta pengetahuan umum.
Qwen-Plus
Model yang menyeimbangkan performa inferensi, biaya, dan kecepatan antara Qwen-Max dan Qwen-Flash, cocok untuk tugas yang cukup kompleks. Penggunaan | Referensi API | Coba online | Pemikiran mendalam
Global
Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Model | Versi | Jendela konteks | Input maks | Output maksimum | Biaya input | Biaya output |
(Token) | (Juta token) | |||||
qwen-plus Memiliki kemampuan yang sama dengan qwen-plus-2025-07-28. Bagian dari seri Qwen3. | Stable | 1.000.000 | Mode thinking 995.904 Non-Thinking Mode 997.952 | 32.768 Rantai-pikiran maks: 81.920 | Harga bertingkat, lihat deskripsi di bawah tabel. | |
qwen-plus-2025-12-01 Bagian dari seri Qwen3. | Snapshot | Mode Berpikir 995.904 Mode non-thinking 997.952 | ||||
qwen-plus-2025-09-11 Bagian dari seri Qwen3. | ||||||
qwen-plus-2025-07-28 Bagian dari seri Qwen3. | ||||||
Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-plus mendukung cache konteks.
Token masukan per permintaan | Harga input (Juta token) | Mode | Harga output (Juta token) |
0 < Token ≤ 256K | $0,4 | Mode non-thinking | $1,2 |
Mode thinking | $4 | ||
256K < Token ≤ 1M | $1,2 | Mode non-thinking | $3,6 |
Mode thinking | $12 |
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output | Kuota gratis |
(Token) | (Juta token) | ||||||
qwen-plus Memiliki kemampuan yang sama dengan qwen-plus-2025-07-28. Bagian dari seri Qwen3. | Stable | 1.000.000 | Mode thinking 995.904 Non-Thinking Mode 997.952 | 32.768 Rantai-pikiran maks: 81.920 | Harga bertingkat, lihat deskripsi di bawah tabel. | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. | |
qwen-plus-latest Memiliki kemampuan yang sama dengan qwen-plus-2025-12-01. Bagian dari seri Qwen3. | Latest | Mode berpikir 995.904 Mode tanpa berpikir 997.952 | |||||
qwen-plus-2025-12-01 Bagian dari seri Qwen3. | Snapshot | Mode thinking 995.904 Non-thinking mode 997.952 | |||||
qwen-plus-2025-09-11 Bagian dari seri Qwen3. | |||||||
qwen-plus-2025-07-28 Juga dikenal sebagai qwen-plus-0728. Bagian dari seri Qwen3. | |||||||
qwen-plus-2025-07-14 Juga dikenal sebagai qwen-plus-0714. Bagian dari seri Qwen3. | 131.072 | Mode thinking 98.304 Non-thinking mode 129.024 | 16.384 Rantai-pikiran maks: 38.912 | $0,4 | Mode thinking $4 Mode non-thinking $1,2 | ||
qwen-plus-2025-04-28 Juga dikenal sebagai qwen-plus-0428. Bagian dari seri Qwen3. | |||||||
qwen-plus-2025-01-25 Juga dikenal sebagai qwen-plus-0125. | 129.024 | 8.192 | $1,2 | ||||
qwen-plus, qwen-plus-latest, qwen-plus-2025-12-01, qwen-plus-2025-09-11, dan qwen-plus-2025-07-28 menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Input tokens per request | Harga input (Juta token) | Mode | Harga output (Juta token) |
0 < Token ≤ 256K | $0,4 | Mode non-thinking | $1,2 |
Mode thinking | $4 | ||
256K < Token ≤ 1M | $1,2 | Mode non-thinking | $3,6 |
Mode thinking | $12 |
AS
Dalam mode penyebaran AS, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dibatasi hanya untuk Amerika Serikat.
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output | Kuota gratis |
(Token) | (Juta token) | ||||||
qwen-plus-us Memiliki kemampuan yang sama dengan qwen-plus-2025-12-01-us. Bagian dari seri Qwen3. | Stable | 1.000.000 | Mode Berpikir 995.904 Mode non-thinking 997.952 | 32.768 Rantai-pikiran maks: 81.920 | Harga bertingkat, lihat deskripsi di bawah tabel. | Tidak ada | |
qwen-plus-2025-12-01-us Bagian dari seri Qwen3. | Snapshot | Mode berpikir 995.904 Non-thinking mode 997.952 | |||||
Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-plus-us mendukung cache konteks.
Token input per permintaan | Harga input (Juta token) | Mode | Harga output (Juta token) |
0 < Token ≤ 256K | $0,4 | Mode non-thinking | $1,2 |
Mode Berpikir | $4 | ||
256K < Token ≤ 1M | $1,2 | Mode non-thinking | $3,6 |
Mode thinking | $12 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output |
(Token) | (Juta token) | |||||
qwen-plus Memiliki kemampuan yang sama dengan qwen-plus-2025-07-28. Bagian dari seri Qwen3. | Stable | 1.000.000 | Mode thinking 995.904 Mode Tanpa Berpikir 997.952 | 32.768 Rantai-pikiran maks: 81.920 | Harga bertingkat, lihat deskripsi di bawah tabel. | |
qwen-plus-latest Memiliki kemampuan yang sama dengan qwen-plus-2025-12-01. Bagian dari seri Qwen3. | Latest | Mode berpikir 995.904 Mode Tanpa Berpikir 997.952 | ||||
qwen-plus-2025-12-01 Bagian dari seri Qwen3. | Snapshot | Mode thinking 995.904 Mode Tanpa Berpikir 997.952 | ||||
qwen-plus-2025-09-11 Bagian dari seri Qwen3. | ||||||
qwen-plus-2025-07-28 Juga dikenal sebagai qwen-plus-0728. Bagian dari seri Qwen3. | ||||||
qwen-plus-2025-07-14 Juga dikenal sebagai qwen-plus-0714. Bagian dari seri Qwen3. | 131.072 | Mode thinking 98.304 Non-thinking Mode 129.024 | 16.384 Rantai-pikiran maks: 38.912 | $0,115 | Mode berpikir $1,147 Mode tanpa berpikir $0,287 | |
qwen-plus-2025-04-28 Juga dikenal sebagai qwen-plus-0428. Bagian dari seri Qwen3. | ||||||
qwen-plus, qwen-plus-latest, qwen-plus-2025-12-01, qwen-plus-2025-09-11, dan qwen-plus-2025-07-28 menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Token input per permintaan | Harga input (Juta token) | Mode | Harga output (Juta token) |
0 < Token ≤ 128K | $0,115 | Mode non-thinking | $0,287 |
Mode thinking | $1,147 | ||
128K < Token ≤ 256K | $0,345 | Mode non-thinking | $2,868 |
Mode Berpikir | $3.441 | ||
256K < Token ≤ 1M | $0,689 | Mode non-thinking | $6,881 |
Mode thinking | $9,175 |
Model-model ini mendukung mode thinking dan non-thinking. Anda dapat beralih antar mode menggunakan parameter enable_thinking. Selain itu, kemampuan model-model ini telah ditingkatkan secara signifikan:
Kemampuan inferensi: Dalam evaluasi untuk matematika, kode, dan penalaran logis, model-model ini secara signifikan melampaui QwQ dan model non-thinking dengan ukuran serupa, mencapai tingkat teratas di industri untuk skalanya.
Kemampuan preferensi manusia: Kemampuan seperti penulisan kreatif, asumsi peran, percakapan multi-putaran, dan pemahaman instruksi telah ditingkatkan secara besar-besaran. Kemampuan umumnya secara signifikan melebihi model dengan ukuran serupa.
Kemampuan agen: Model-model ini mencapai performa terdepan di industri baik dalam mode thinking maupun non-thinking, memungkinkan pemanggilan alat yang presisi.
Kemampuan multibahasa: Mendukung lebih dari 100 bahasa dan dialek, dengan peningkatan signifikan dalam terjemahan multibahasa, pemahaman instruksi, dan penalaran akal sehat.
Format balasan: Versi ini memperbaiki masalah format balasan dari versi sebelumnya, seperti format Markdown abnormal, pemotongan di tengah, dan output boxed yang salah.
Untuk model-model ini, jika tidak ada proses berpikir yang dihasilkan saat mode thinking diaktifkan, Anda akan dikenakan harga mode non-thinking.
Qwen-Flash
Model tercepat dan paling hemat biaya dalam seri Qwen, cocok untuk tugas sederhana. Qwen-Flash menggunakan model harga bertingkat fleksibel yang lebih hemat biaya daripada Qwen-Turbo. Penggunaan | Referensi API | Coba online | Mode thinking
Global
Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Model | Versi | Mode | Jendela konteks | Input maks | Max chain-of-thought | Output maks | Biaya input | Biaya output Chain-of-thought + Output |
(Token) | (1.000 token) | |||||||
qwen-flash Memiliki kemampuan yang sama dengan qwen-flash-2025-07-28. Bagian dari seri Qwen3. | Stable | Thinking | 1.000.000 | 995.904 | 81.920 | 32.768 | Harga bertingkat, lihat deskripsi di bawah tabel. | |
Non-thinking | 997.952 | - | ||||||
qwen-flash-2025-07-28 Bagian dari seri Qwen3. | Snapshot | Thinking | 995.904 | 81.920 | ||||
Non-thinking | 997.952 | - | ||||||
Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-flash mendukung cache konteks.
Token input per permintaan | Harga input (Juta token) | Harga output (Juta token) |
0 < Token ≤ 256K | $0,05 | $0,4 |
256K < Token ≤ 1M | $0,25 | $2 |
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maks | Biaya input | Biaya output Rantai-pikiran + Output | Kuota gratis |
(Token) | (1.000 token) | ||||||||
qwen-flash Memiliki kemampuan yang sama dengan qwen-flash-2025-07-28. Bagian dari seri Qwen3. Pemanggilan batch dengan diskon 50% | Stable | Thinking | 1.000.000 | 995.904 | 81.920 | 32.768 | Harga bertingkat, lihat deskripsi di bawah tabel. | 1 juta token masing-masing. Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. | |
Non-thinking | 997.952 | - | |||||||
qwen-flash-2025-07-28 Bagian dari seri Qwen3. | Snapshot | Thinking | 995.904 | 81.920 | |||||
Non-thinking | 997.952 | - | |||||||
Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-flash mendukung cache konteks dan pemanggilan batch.
Token masukan per permintaan | Harga input (Juta token) | Harga output (Juta token) |
0 < Token ≤ 256K | $0,05 | $0,4 |
256K < Token ≤ 1M | $0,25 | $2 |
AS
Dalam mode penyebaran AS, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dibatasi hanya untuk Amerika Serikat.
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maks | Biaya input | Biaya output Rantai-pikiran + Output | Kuota gratis |
(Token) | (1.000 token) | ||||||||
qwen-flash-us Memiliki kemampuan yang sama dengan qwen-flash-2025-07-28-us. Bagian dari seri Qwen3. | Stable | Thinking | 1.000.000 | 995.904 | 81.920 | 32.768 | Harga bertingkat, lihat deskripsi di bawah tabel. | Tidak ada | |
Non-thinking | 997.952 | - | |||||||
qwen-flash-2025-07-28-us Bagian dari seri Qwen3. | Snapshot | Thinking | 995.904 | 81.920 | |||||
Non-thinking | 997.952 | - | |||||||
Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Input tokens per request | Harga input (Juta token) | Harga output (Juta token) |
0 < Token ≤ 256K | $0,05 | $0,4 |
256K < Token ≤ 1M | $0,25 | $2 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maks | Biaya input | Biaya output Rantai-pikiran + Output |
(Token) | (1.000 token) | |||||||
qwen-flash Memiliki kemampuan yang sama dengan qwen-flash-2025-07-28. Bagian dari seri Qwen3. | Stable | Thinking | 1.000.000 | 995.904 | 81.920 | 32.768 | Harga bertingkat, lihat deskripsi di bawah tabel. | |
Non-thinking | 997.952 | - | ||||||
qwen-flash-2025-07-28 Bagian dari seri Qwen3. | Snapshot | Thinking | 995.904 | 81.920 | ||||
Non-thinking | 997.952 | - | ||||||
Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-flash mendukung cache konteks.
Token input per permintaan | Harga input (Juta token) | Harga output (Juta token) |
0 < Token ≤ 128K | $0,022 | $0,216 |
128K < Token ≤ 256K | $0,087 | $0,861 |
256K < Token ≤ 1M | $0,173 | $1,721 |
Qwen-Turbo
Qwen-Turbo tidak lagi diperbarui. Kami merekomendasikan menggunakan Qwen-Flash sebagai gantinya. Qwen-Flash menggunakan model harga bertingkat yang lebih hemat biaya dan fleksibel. Penggunaan | Referensi API | Coba online | Pemikiran mendalam
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output | Kuota gratis |
(Token) | (Juta token) | ||||||
qwen-turbo Memiliki kemampuan yang sama dengan qwen-turbo-2025-04-28. Bagian dari seri Qwen3. | Stable | Mode berpikir 131.072 Non-thinking mode 1.000.000 | Mode thinking 98.304 Non-thinking mode 1.000.000 | 16.384 Rantai-pikiran maks: 38.912 | $0,05 Diskon 50% untuk pemanggilan batch. | Mode thinking: $0,5 Mode non-thinking: $0,2 Diskon 50% untuk pemanggilan batch. | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
qwen-turbo-latest Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru. Bagian dari seri Qwen3. | Latest | $0,05 | Mode thinking: $0,5 Mode non-thinking: $0,2 | ||||
qwen-turbo-2025-04-28 Juga dikenal sebagai qwen-turbo-0428. Bagian dari seri Qwen3. | Snapshot | ||||||
qwen-turbo-2024-11-01 Juga dikenal sebagai qwen-turbo-1101. | 1.000.000 | 1.000.000 | 8.192 | $0,2 | |||
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Jendela konteks | Input maks | Output Maksimum | Biaya input | Biaya output |
(Token) | (Juta token) | |||||
qwen-turbo Memiliki kemampuan yang sama dengan qwen-turbo-2025-04-28. Bagian dari seri Qwen3. | Stable | Mode Berpikir 131.072 Non-Thinking Mode 1.000.000 | Mode berpikir 98.304 Mode tanpa berpikir 1.000.000 | 16.384 Rantai-pikiran maks: 38.912 | $0,044 | Mode berpikir $0,431 Mode tanpa pemikiran $0,087 |
qwen-turbo-latest Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru. Bagian dari seri Qwen3. | Latest | |||||
qwen-turbo-2025-07-15 Juga dikenal sebagai qwen-turbo-0715. Bagian dari seri Qwen3. | Snapshot | |||||
qwen-turbo-2025-04-28 Juga dikenal sebagai qwen-turbo-0428. Bagian dari seri Qwen3. | ||||||
QwQ
Model inferensi QwQ dilatih berdasarkan model Qwen2.5 dan menggunakan Pembelajaran Penguatan untuk secara signifikan meningkatkan kemampuan inferensinya. Metrik inti model ini untuk matematika dan kode (seperti AIME 24/25 dan LiveCodeBench) serta beberapa metrik umum (seperti IFEval dan LiveBench) setara dengan DeepSeek-R1 versi lengkap. Penggunaan
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Versi | Jendela konteks | Input maks | Rantai-pikiran maks | Respons maks | Biaya input | Biaya output | Kuota gratis |
(Token) | (Juta token) | |||||||
qwq-plus | Stable | 131.072 | 98.304 | 32.768 | 8.192 | $0,8 | $2,4 | 1 juta token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Jendela konteks | Input maks | Maximum Chain-of-Thought | Respons maks | Biaya input | Biaya output |
(Token) | (Juta token) | ||||||
qwq-plus Memiliki kemampuan yang sama dengan qwq-plus-2025-03-05. | Stable | 131.072 | 98.304 | 32.768 | 8.192 | $0,230 | $0,574 |
qwq-plus-latest Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru. | Latest | ||||||
qwq-plus-2025-03-05 Juga dikenal sebagai qwq-plus-0305. | Snapshot | ||||||
Qwen-Long
Model ini memiliki jendela konteks terpanjang dalam seri Qwen, menawarkan keseimbangan antara kemampuan dan biaya. Cocok untuk tugas seperti analisis teks panjang, ekstraksi informasi, ringkasan, klasifikasi, dan pelabelan. Penggunaan | Coba online
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output |
(Token) | (Juta token) | |||||
qwen-long-latest Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru. | Stable | 10.000.000 | 10.000.000 | 32.768 | $0,072 | $0,287 |
qwen-long-2025-01-25 Juga dikenal sebagai qwen-long-0125. | Snapshot | |||||
Qwen-Omni
Model Qwen-Omni dapat menerima kombinasi input dalam berbagai modalitas seperti teks, gambar, audio, dan video, serta menghasilkan balasan dalam format teks atau ucapan. Model ini menawarkan berbagai suara ekspresif yang sangat mirip manusia dan mendukung output ucapan dalam berbagai bahasa dan dialek. Model ini dapat digunakan dalam skenario seperti pengenalan visual, analisis emosi, dan pelatihan edukatif dalam obrolan audio dan video. Penggunaan | Referensi API
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maks | Kuota gratis |
(Token) | |||||||
qwen3-omni-flash Memiliki kemampuan yang sama dengan qwen3-omni-flash-2025-12-01. | Stable | Mode thinking | 65.536 | 16.384 | 32.768 | 16.384 | 1 juta token masing-masing (tanpa memandang modalitas) Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
Mode non-thinking | 49.152 | - | |||||
qwen3-omni-flash-2025-12-01 | Snapshot | Mode Berpikir | 65.536 | 16.384 | 32.768 | 16.384 | |
Mode non-thinking | 49.152 | - | |||||
qwen3-omni-flash-2025-09-15 Juga dikenal sebagai qwen3-omni-flash-0915. | Snapshot | Mode thinking | 65.536 | 16.384 | 32.768 | 16.384 | |
Mode non-thinking | 49.152 | - | |||||
Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output. Penagihan sama untuk mode thinking dan non-thinking. Output audio tidak didukung dalam mode thinking.
|
|
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maks | Kuota gratis |
(Token) | |||||||
qwen3-omni-flash Menawarkan kemampuan yang sama dengan qwen3-omni-flash-2025-12-01. | Stable | Mode thinking | 65.536 | 16.384 | 32.768 | 16.384 | Tidak ada kuota gratis |
Mode non-thinking | 49.152 | - | |||||
qwen3-omni-flash-2025-12-01 | Snapshot | Mode Berpikir | 65.536 | 16.384 | 32.768 | 16.384 | |
Mode non-thinking | 49.152 | - | |||||
qwen3-omni-flash-2025-09-15 Juga dikenal sebagai qwen3-omni-flash-0915. | Snapshot | Mode thinking | 65.536 | 16.384 | 32.768 | 16.384 | |
Mode non-thinking | 49.152 | - | |||||
Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output. Penagihan sama untuk mode thinking dan non-thinking. Output audio tidak didukung dalam mode thinking.
|
|
Kami merekomendasikan memulai dengan model Qwen3-Omni-Flash. Dibandingkan dengan Qwen-Omni-Turbo yang tidak lagi diperbarui, kemampuan model ini telah ditingkatkan secara signifikan:
Ini adalah model hibrida yang mendukung mode thinking dan non-thinking. Anda dapat beralih antar mode menggunakan parameter
enable_thinking. Secara default, mode thinking dinonaktifkan.Output audio tidak didukung dalam mode thinking. Dalam mode non-thinking, untuk output audio model ini:
Jumlah suara yang didukung untuk qwen3-omni-flash-2025-12-01 telah meningkat menjadi 49. Untuk qwen3-omni-flash-2025-09-15 dan qwen3-omni-flash, jumlah suara yang didukung telah meningkat menjadi 17. Sebagai perbandingan, Qwen-Omni-Turbo hanya mendukung 4 suara.
Jumlah bahasa yang didukung telah meningkat menjadi 10. Sebagai perbandingan, Qwen-Omni-Turbo hanya mendukung 2 bahasa.
Qwen-Omni-Realtime
Dibandingkan dengan Qwen-Omni, model ini mendukung input audio streaming dan memiliki fitur Voice Activity Detection (VAD) bawaan yang secara otomatis mendeteksi awal dan akhir ucapan pengguna. Penggunaan | Event klien | Server-side events
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Versi | Jendela konteks | Input maks | Output maksimum | Kuota gratis |
(Token) | |||||
qwen3-omni-flash-realtime Menawarkan kemampuan yang sama dengan qwen3-omni-flash-realtime-2025-12-01. | Stable | 65.536 | 49.152 | 16.384 | 1 juta token masing-masing (tanpa memandang modalitas). Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
qwen3-omni-flash-realtime-2025-12-01 | Snapshot | ||||
qwen3-omni-flash-realtime-2025-09-15 | |||||
Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:
|
|
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Jendela konteks | Input maks | Keluaran Maksimum | Kuota gratis |
(Token) | |||||
qwen3-omni-flash-realtime Model ini memiliki kemampuan yang sama dengan qwen3-omni-flash-realtime-2025-12-01. | Stable | 65.536 | 49.152 | 16.384 | Tidak ada kuota gratis |
qwen3-omni-flash-realtime-2025-12-01 | Snapshot | ||||
qwen3-omni-flash-realtime-2025-09-15 | |||||
Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:
|
|
Kami merekomendasikan memulai dengan model Qwen3-Omni-Flash-Realtime. Dibandingkan dengan Qwen-Omni-Turbo-Realtime yang tidak lagi diperbarui, kemampuan model ini telah ditingkatkan secara signifikan. Untuk output audio model ini:
Jumlah suara yang didukung untuk qwen3-omni-flash-realtime-2025-12-01 telah meningkat menjadi 49. Untuk qwen3-omni-flash-realtime-2025-09-15 dan qwen3-omni-realtime-flash, jumlah suara yang didukung telah meningkat menjadi 17. Sebagai perbandingan, Qwen-Omni-Turbo-Realtime hanya mendukung 4 suara.
Jumlah bahasa yang didukung telah meningkat menjadi 10. Sebagai perbandingan, Qwen-Omni-Turbo-Realtime hanya mendukung 2 bahasa.
QVQ
QVQ adalah model penalaran visual yang mendukung input visual dan output rantai-pikiran. Model ini menunjukkan kemampuan yang ditingkatkan dalam matematika, pemrograman, analisis visual, kreasi, dan tugas umum lainnya. Penggunaan | Coba online
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Versi | Jendela konteks | Input maks | Rantai-pikiran maks | Respons Maksimum | Biaya input | Biaya output | Kuota gratis |
(Token) | (Juta token) | |||||||
qvq-max Memiliki kemampuan yang sama dengan qvq-max-2025-03-25. | Stable | 131.072 | 106.496 Maks 16.384 token per gambar. | 16.384 | 8.192 | $1,2 | $4,8 | 1 juta token per model Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
qvq-max-latest Memiliki kemampuan yang sama dengan versi snapshot terbaru. | Latest | |||||||
qvq-max-2025-03-25 Juga dikenal sebagai qvq-max-0325. | Snapshot | |||||||
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Jendela konteks | Input maks | Rantai-pikiran maks | Respons Maksimum | Biaya input | Biaya Keluaran |
(Token) | (Juta token) | ||||||
qvq-max Model ini menawarkan kemampuan penalaran visual dan pemahaman instruksi yang lebih unggul dibandingkan qvq-plus, serta dioptimalkan untuk menangani tugas kompleks. Model ini saat ini memiliki kemampuan yang setara dengan qvq-max-2025-03-25. | Stable | 131.072 | 106.496 Maksimum 16.384 token per gambar. | 16.384 | 8.192 | $1,147 | $4,588 |
qvq-max-latest Model ini selalu memiliki kemampuan yang setara dengan versi snapshot terbarunya. | Latest | ||||||
qvq-max-2025-05-15 Juga dikenal sebagai qvq-max-0515. | Snapshot | ||||||
qvq-max-2025-03-25 Juga dikenal sebagai qvq-max-0325. | |||||||
qvq-plus Model ini saat ini memiliki kemampuan yang setara dengan qvq-plus-2025-05-15. | Stable | $0,287 | $0,717 | ||||
qvq-plus-latest Model ini selalu memiliki kemampuan yang setara dengan versi snapshot terbarunya. | Latest | ||||||
qvq-plus-2025-05-15 Juga dikenal sebagai qvq-plus-0515. | Snapshot | ||||||
Qwen-VL
Qwen-VL adalah model generasi teks dengan kemampuan pemahaman visual (gambar). Model ini dapat melakukan OCR, ringkasan, dan penalaran. Misalnya, model ini dapat mengekstraksi atribut dari foto produk atau menyelesaikan soal berdasarkan diagram dalam latihan.Penggunaan | Referensi API | Coba online
Model Qwen-VL ditagih berdasarkan jumlah total token input dan output. Untuk informasi lebih lanjut tentang aturan perhitungan token gambar, lihat Pemahaman visual.
Global
Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia), dan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran Maksimum | Output maks | Biaya input | Biaya output Rantai-pikiran dan output |
(Token) | (Juta token) | |||||||
qwen3-vl-plus Menyediakan kemampuan yang sama dengan qwen3-vl-plus-2025-09-23 | Stable | Thinking | 262.144 | 258.048 Maks 16.384 per gambar | 81.920 | 32.768 | Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat deskripsi di bawah tabel. | |
Non-thinking | 260.096 Maks 16.384 per gambar | - | ||||||
qwen3-vl-plus-2025-09-23 | Snapshot | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | ||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | ||||||
qwen3-vl-flash Menyediakan kemampuan yang sama dengan qwen3-vl-flash-2025-10-15 | Stable | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | ||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | ||||||
qwen3-vl-flash-2025-10-15 | Snapshot | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | ||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | ||||||
Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input untuk setiap permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.
Seri qwen3-vl-plus
Token masukan per permintaan | Harga input (per juta token) | Harga output (per juta token) |
0 < Token ≤ 32K | $0,2 | $1,6 |
> 32K hingga 128K | $0,3 | $2,4 |
128 KB < Token ≤ 256 KB | $0,6 | $4,8 |
Seri qwen3-vl-flash
Token input per permintaan | Harga input (per juta token) | Harga output (per juta token) |
0 < token ≤ 32K | $0,05 | $0,4 |
32K < token ≤ 128K | $0,075 | $0,6 |
128K < token ≤ 256K | $0,12 | $0,96 |
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura, dan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maks | Biaya input | Biaya output Rantai-pikiran dan output | Kuota gratis |
(Token) | (Juta token) | ||||||||
qwen3-vl-plus Secara fungsional setara dengan qwen3-vl-plus-2025-09-23 | Stable | Thinking | 262.144 | 258.048 Maks 16.384 per gambar | 81.920 | 32.768 | Harga bertingkat berlaku. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel ini. | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio | |
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
qwen3-vl-plus-2025-12-19 | Snapshot | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | |||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
qwen3-vl-plus-2025-09-23 | Snapshot | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | |||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
qwen3-vl-flash Secara fungsional setara dengan qwen3-vl-flash-2025-10-15 | Stable | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | |||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
qwen3-vl-flash-2025-10-15 | Snapshot | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | |||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input untuk setiap permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.
Seri qwen3-vl-plus
Ukuran Permintaan (token) | Harga Input (per 1 juta token) | Harga Output (per 1 juta token) |
0 < Token ≤ 32K | $0,2 | $1,6 |
32K < Token ≤ 128K | $0,3 | $2,4 |
128K < Token ≤ 256K | $0,6 | $4,8 |
Seri qwen3-vl-flash
Token input per permintaan | Harga input (per juta token) | Harga output (per juta token) |
0 < Token ≤ 32 KB | $0,05 | $0,4 |
32 K < Token ≤ 128 K | $0,075 | $0,6 |
128 K < Token ≤ 256 K | $0,12 | $0,96 |
AS
Dalam mode penyebaran AS, titik akhir dan penyimpanan data berlokasi di Wilayah AS (Virginia), dan sumber daya komputasi inferensi dibatasi hanya untuk Amerika Serikat.
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran Maksimum | Output maks | Biaya input | Biaya output Termasuk rantai-pikiran dan output |
(Token) | (Juta token) | |||||||
qwen3-vl-flash-us Menyediakan kemampuan yang sama dengan qwen3-vl-flash-2025-10-15-us | Stable | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | 32.768 | Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat deskripsi di bawah tabel. | ||
Non-thinking | 260.096 Maks 16.384 per gambar | - | ||||||
qwen3-vl-flash-2025-10-15-us | Snapshot | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | ||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | ||||||
Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input untuk setiap permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking. Model qwen3-vl-flash-us mendukung cache konteks.
Token input per permintaan | Harga input (per juta token) | Harga output (per juta token) |
0 < Token ≤ 32K | $0,05 | $0,4 |
32K < Token ≤ 128K | $0,075 | $0,6 |
128K < Token ≤ 256K | $0,12 | $0,96 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Mode | Jendela konteks | Input maksimum | Rantai-pikiran maks | Output maks | Biaya input | Biaya output | Kuota gratis |
(Token) | (Juta token) | ||||||||
qwen3-vl-plus Saat ini menawarkan kemampuan yang sama dengan qwen3-vl-plus-2025-09-23 | Stable | Thinking | 262.144 | 258.048 Maks 16.384 per gambar | 81.920 | 32.768 | Harga bertingkat berlaku. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel. | Tidak ada kuota gratis | |
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
qwen3-vl-plus-2025-12-19 | Snapshot | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | |||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
qwen3-vl-plus-2025-09-23 | Snapshot | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | |||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
qwen3-vl-flash Saat ini menawarkan kemampuan yang sama dengan qwen3-vl-flash-2025-10-15 | Stable | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | |||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
qwen3-vl-flash-2025-10-15 | Snapshot | Thinking | 258.048 Maks 16.384 per gambar | 81.920 | |||||
Non-thinking | 260.096 Maks 16.384 per gambar | - | |||||||
Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input untuk setiap permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.
Seri qwen3-vl-plus
Token input per permintaan | Harga input (Juta token) | Harga output (Juta token) |
0 < token ≤ 32K | $0,143 | $1,434 |
32K < token ≤ 128K | $0,215 | $2,15 |
128K < token ≤ 256K | $0,43 | $4,301 |
Seri qwen3-vl-flash
Token input per permintaan | Harga input (per juta token) | Harga output (per juta token) |
0 < token ≤ 32K | $0,022 | $0,215 |
32K < token ≤ 128K | $0,043 | $0,43 |
128K < token ≤ 256K | $0,086 | $0,859 |
Qwen-OCR
Model Qwen-OCR dirancang khusus untuk ekstraksi teks. Dibandingkan dengan model Qwen-VL, model ini berfokus pada ekstraksi teks dari gambar dokumen, tabel, soal ujian, dan teks tulisan tangan. Model ini dapat mengenali berbagai bahasa, termasuk Inggris, Prancis, Jepang, Korea, Jerman, Rusia, dan Italia. Penggunaan | Referensi API | Coba online
Global
Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Model | Versi | Jendela konteks | Input maks | Output maks | Harga input | Harga output |
(Token) | (Juta token) | |||||
qwen-vl-ocr Menawarkan kemampuan yang sama dengan qwen-vl-ocr-2025-11-20. | Stable | 34.096 | 30.000 Maks 30.000 per gambar. | 4.096 | $0,07 | $0,16 |
qwen-vl-ocr-2025-11-20 Juga dikenal sebagai qwen-vl-ocr-1120. Arsitektur Qwen3-VL secara signifikan meningkatkan penguraian dokumen dan pelokalisasi teks. | Snapshot | 38.192 | 8.192 | |||
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Version | Context window | Max input | Max output | Input price | Output price | Free quota |
(Tokens) | (Juta token) | ||||||
qwen-vl-ocr | Stable | 34.096 | 30.000 Maksimal 30.000 per gambar | 4.096 | $0,72 | $0,72 | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
qwen-vl-ocr-2025-11-20 Juga dikenal sebagai qwen-vl-ocr-1120. Berdasarkan arsitektur Qwen3-VL, model ini secara signifikan meningkatkan kemampuan parsing dokumen dan lokalisasi teks. | Snapshot | 38.192 | 8.192 | $0,07 | $0,16 | ||
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Version | Context window (tokens) | Max input (tokens) | Max output (tokens) | Unit price | Output Unit Price | Kuota gratis |
Tokens | Per 1 juta tokens | ||||||
qwen-vl-ocr Setara dengan qwen-vl-ocr-2025-08-28. | Stable | 34.096 | 30.000 Maksimal 30.000 per gambar. | 4.096 | $0,717 | $0,717 | Tidak ada kuota gratis |
qwen-vl-ocr-latest Selalu setara dengan versi terbaru. | Latest | 38.192 | 8.192 | $0,043 | $0,072 | ||
qwen-vl-ocr-2025-11-20 Juga dikenal sebagai qwen-vl-ocr-1120. Model ini berbasis arsitektur Qwen3-VL dan memberikan peningkatan signifikan dalam penguraian dokumen dan lokalisasi teks. | Snapshot | ||||||
qwen-vl-ocr-2025-08-28 Juga dikenal sebagai qwen-vl-ocr-0828. | 34.096 | 4.096 | $0,717 | $0,717 | |||
qwen-vl-ocr-2025-04-13 Juga dikenal sebagai qwen-vl-ocr-0413. | |||||||
qwen-vl-ocr-2024-10-28 Juga dikenal sebagai qwen-vl-ocr-1028. | |||||||
Qwen-Math
Model Qwen-Math adalah model bahasa yang dirancang khusus untuk menyelesaikan soal matematika. Penggunaan | Referensi API | Coba online
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Jendela konteks | Input maksimum | Output maksimum | Biaya input | Biaya output |
(Tokens) | (Juta token) | |||||
qwen-math-plus Menyediakan kemampuan yang sama dengan qwen-math-plus-2024-09-19. | Stable | 4.096 | 3.072 | 3.072 | $0,574 | $1,721 |
qwen-math-plus-latest Selalu menyediakan kemampuan yang sama dengan versi snapshot terbaru. | Latest | |||||
qwen-math-plus-2024-09-19 Juga dikenal sebagai qwen-math-plus-0919. | Snapshot | |||||
qwen-math-plus-2024-08-16 Juga dikenal sebagai qwen-math-plus-0816. | ||||||
qwen-math-turbo Menyediakan kemampuan yang sama dengan qwen-math-turbo-2024-09-19. | Stable | $0,287 | $0,861 | |||
qwen-math-turbo-latest Selalu menyediakan kemampuan yang sama dengan versi snapshot terbaru. | Latest | |||||
qwen-math-turbo-2024-09-19 Juga dikenal sebagai qwen-math-turbo-0919. | Snapshot | |||||
Qwen-Coder
Ini adalah model kode Qwen. Seri Qwen3-Coder-Plus terbaru adalah model generasi kode berbasis Qwen3. Model ini memiliki kemampuan agen pemrograman yang kuat, unggul dalam pemanggilan alat dan interaksi lingkungan, serta dapat melakukan pemrograman otonom. Model ini memiliki kemampuan pengkodean dan tujuan umum yang sangat baik. Penggunaan | Referensi API | Coba online
Global
Dalam mode penyebaran global, titik akhir dan penyimpanan data berlokasi di Wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output |
(Token) | (Juta token) | |||||
qwen3-coder-plus Saat ini merupakan alias untuk qwen3-coder-plus-2025-09-23. | Stable | 1.000.000 | 997.952 | 65.536 | Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat deskripsi di bawah tabel ini. | |
qwen3-coder-plus-2025-09-23 | Snapshot | |||||
qwen3-coder-plus-2025-07-22 | Snapshot | |||||
qwen3-coder-flash Saat ini merupakan alias untuk qwen3-coder-flash-2025-07-28. | Stable | |||||
qwen3-coder-flash-2025-07-28 | Snapshot | |||||
Model-model di atas menggunakan penagihan bertingkat berdasarkan token input per permintaan.
Seri qwen3-coder-plus
Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. qwen3-coder-plus mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga.
Token masukan per permintaan | Harga input (per juta token) | Harga output (per juta token) |
0 < token ≤ 32K | $1 | $5 |
32K < token ≤ 128K | $1,8 | $9 |
128K < token ≤ 256K | $3 | $15 |
256K < token ≤ 1M | $6 | $60 |
Seri qwen3-coder-flash
Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. qwen3-coder-flash mendukung cache konteks. Teks input yang menghasilkan hit cache ditagih sebesar 20% dari harga.
Jumlah token input | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
0 < Token ≤ 32K | $0,3 | $1,5 |
32K < Token ≤ 128K | $0,5 | $2,5 |
128K < Token ≤ 256K | $0,8 | $4 |
256K < Token ≤ 1M | $1,6 | $9,6 |
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura, dan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output | Kuota gratis |
(Token) | (Juta token) | ||||||
qwen3-coder-plus Kemampuan yang sama dengan qwen3-coder-plus-2025-09-23 | Stable | 1.000.000 | 997.952 | 65.536 | Harga bertingkat. Lihat deskripsi di bawah tabel. | 1 juta token input dan 1 juta token output Masa berlaku: 90 hari setelah Anda mengaktifkan Model Studio | |
qwen3-coder-plus-2025-09-23 | Snapshot | ||||||
qwen3-coder-plus-2025-07-22 | Snapshot | ||||||
qwen3-coder-flash Kemampuan yang sama dengan qwen3-coder-flash-2025-07-28 | Stable | ||||||
qwen3-coder-flash-2025-07-28 | Snapshot | ||||||
Model-model di atas menggunakan harga bertingkat berdasarkan token input per permintaan.
Seri qwen3-coder-plus
Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. qwen3-coder-plus mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga, dan teks input yang menghasilkan hit cache eksplisit ditagih sebesar 10% dari harga.
Ukuran Permintaan (Token Input) | Harga Input (per 1 Juta Token) | Harga Output (per 1 Juta Token) |
0 < token ≤ 32K | $1 | $5 |
32K < token ≤ 128K | $1,8 | $9 |
128K < token ≤ 256K | $3 | $15 |
256K < token ≤ 1M | $6 | $60 |
Seri qwen3-coder-flash
Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. qwen3-coder-flash mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga, dan teks input yang menghasilkan hit cache eksplisit ditagih sebesar 10% dari harga.
Token masukan per permintaan | Harga input (per juta token) | Harga output (per juta token) |
0 < token ≤ 32K | $0,3 | $1,5 |
32K < token ≤ 128K | $0,5 | $2,5 |
128K < token ≤ 256K | $0,8 | $4 |
256K < token ≤ 1M | $1,6 | $9,6 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output |
(Token) | (Juta token) | |||||
qwen3-coder-plus Setara dengan qwen3-coder-plus-2025-09-23. | Stable | 1.000.000 | 997.952 | 65.536 | Harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah. | |
qwen3-coder-plus-2025-09-23 | Snapshot | |||||
qwen3-coder-plus-2025-07-22 | Snapshot | |||||
qwen3-coder-flash Setara dengan qwen3-coder-flash-2025-07-28. | Stable | |||||
qwen3-coder-flash-2025-07-28 | Snapshot | |||||
Model-model di atas menggunakan harga bertingkat berdasarkan token input per permintaan.
Seri qwen3-coder-plus
Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. qwen3-coder-plus mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga satuan, sedangkan teks input yang menghasilkan hit cache eksplisit ditagih sebesar 10% dari harga satuan.
Token masukan per permintaan | Harga input (per juta token) | Harga output (per juta token) |
Hingga 32K | $0,574 | $2,294 |
Lebih dari 32K hingga 128K | $0,861 | 3.441 |
Lebih dari 128K hingga 256K | $1,434 | $5,735 |
Lebih dari 256K hingga 1M | $2,868 | $28,671 |
Seri qwen3-coder-flash
Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. qwen3-coder-flash mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga satuan, sedangkan teks input yang menghasilkan hit cache eksplisit ditagih sebesar 10% dari harga satuan.
Token input per permintaan | Harga input (per juta token) | Harga output (per juta token) |
Hingga 32K | $0,144 | $0,574 |
Lebih dari 32K hingga 128K | $0,216 | $0,861 |
128K < Token ≤ 256K | $0,359 | $1,434 |
Lebih dari 256K hingga 1M | $0,717 | $3,584 |
Qwen-MT
Model terjemahan besar unggulan ini, yang sepenuhnya ditingkatkan berdasarkan Qwen 3, mendukung terjemahan antara 92 bahasa, termasuk Tionghoa, Inggris, Jepang, Korea, Prancis, Spanyol, Jerman, Thailand, Indonesia, Vietnam, dan Arab. Performa dan kualitas terjemahan model ini telah ditingkatkan secara komprehensif. Model ini menyediakan kemampuan penyesuaian terminologi, retensi format, dan prompting berbasis domain yang lebih stabil, sehingga terjemahannya lebih akurat dan alami. Penggunaan
Global
Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Model | Jendela konteks | Input Maksimum | Output maks | Biaya input | Biaya output |
(Token) | (Juta token) | ||||
qwen-mt-plus Bagian dari Qwen3-MT | 16.384 | 8.192 | 8.192 | $2,46 | $7,37 |
qwen-mt-flash Bagian dari Qwen3-MT | $0,16 | $0,49 | |||
qwen-mt-lite Bagian dari Qwen3-MT | $0,12 | $0,36 | |||
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Jendela Konteks (token) | Input Maks (token) | Output Maks (token) | Biaya Input | Biaya Output | Kuota Gratis |
Token | per 1 juta token | |||||
qwen-mt-plus Bagian dari Qwen3-MT | 16.384 | 8.192 | 8.192 | $2,46 | $7,37 | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
qwen-mt-flash Bagian dari Qwen3-MT | $0,16 | $0,49 | ||||
qwen-mt-lite Bagian dari Qwen3-MT | $0,12 | $0,36 | ||||
qwen-mt-turbo Bagian dari Qwen3-MT | $0,16 | $0,49 | ||||
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Context window (tokens) | Max input (tokens) | Max output (tokens) | Input Cost | Output costs |
Number of tokens | (Million tokens) | ||||
qwen-mt-plus Bagian dari Qwen3-MT | 16.384 | 8.192 | 8.192 | $0,259 | $0,775 |
qwen-mt-flash Bagian dari Qwen3-MT | $0,101 | $0,280 | |||
qwen-mt-lite Bagian dari Qwen3-MT | $0,086 | $0,229 | |||
qwen-mt-turbo Bagian dari Qwen3-MT | $0,101 | $0,280 | |||
Model penambangan data Qwen
Model penambangan data Qwen mengekstraksi informasi terstruktur dari dokumen untuk digunakan dalam anotasi data dan moderasi konten. Penggunaan | Referensi API
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.
Model | Jendela Konteks | Input Maks | Output Maks | Biaya Input | Biaya Output | Kuota Gratis |
(Token) | (Juta token) | |||||
qwen-doc-turbo | 262.144 | 253.952 | 32.768 | $0,087 | $0,144 | Tidak ada kuota gratis |
Model riset mendalam Qwen
Model riset mendalam Qwen memecah masalah kompleks, melakukan penalaran dan analisis menggunakan pencarian internet, serta menghasilkan laporan riset. Penggunaan | Referensi API
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.
Model | Jendela Konteks | Input Maks | Output Maks | Biaya Input | Biaya Output |
(Token) | (1.000 token) | ||||
qwen-deep-research | 1.000.000 | 997.952 | 32.768 | $0,007742 | $0,023367 |
Generasi teks - Qwen - Open source
Pada nama model, xxb menunjukkan ukuran parameter. Misalnya, qwen2-72b-instruct menunjukkan ukuran parameter sebesar 72 miliar (72B).
Model Studio mendukung pemanggilan versi open-source Qwen. Anda tidak perlu melakukan deployment model secara lokal. Untuk versi open-source, kami merekomendasikan penggunaan model Qwen3 dan Qwen2.5.
Qwen3
Model qwen3-next-80b-a3b-thinking, yang dirilis pada September 2025, hanya mendukung mode thinking. Model ini memiliki kemampuan mengikuti instruksi yang lebih baik dan memberikan ringkasan yang lebih ringkas dibandingkan qwen3-235b-a22b-thinking-2507.
Model qwen3-next-80b-a3b-instruct, yang dirilis pada September 2025, hanya mendukung mode non-thinking. Model ini memiliki peningkatan kemampuan pemahaman bahasa Mandarin, penalaran logis, dan generasi teks dibandingkan qwen3-235b-a22b-instruct-2507.
Model qwen3-235b-a22b-thinking-2507 dan qwen3-30b-a3b-thinking-2507, yang dirilis pada Juli 2025, hanya mendukung mode thinking. Keduanya merupakan versi peningkatan dari qwen3-235b-a22b (mode thinking) dan qwen3-30b-a3b (mode thinking).
Model qwen3-235b-a22b-instruct-2507 dan qwen3-30b-a3b-instruct-2507, yang dirilis pada Juli 2025, hanya mendukung mode non-thinking. Keduanya merupakan versi peningkatan dari qwen3-235b-a22b (mode non-thinking) dan qwen3-30b-a3b (mode non-thinking).
Model Qwen3, yang dirilis pada April 2025, mendukung kedua mode thinking dan non-thinking. Gunakan parameter enable_thinking untuk beralih antar mode. Model Qwen3 juga memiliki peningkatan kemampuan signifikan:
Kemampuan penalaran: Dalam evaluasi matematika, kode, dan penalaran logis, model ini secara signifikan melampaui QwQ dan model non-thinking dengan ukuran yang sama, mencapai performa terbaik di industri sesuai skalanya.
Penyelarasan preferensi manusia: Kemampuan dalam penulisan kreatif, role-playing, percakapan multi-putaran, dan mengikuti instruksi mengalami peningkatan besar. Kemampuan umum model ini secara signifikan melampaui model lain dengan ukuran yang sama.
Kemampuan agen: Model ini mencapai performa terdepan di industri baik dalam mode thinking maupun non-thinking, serta dapat memanggil alat eksternal secara akurat.
Kemampuan multibahasa: Model ini mendukung lebih dari 100 bahasa dan dialek. Terdapat peningkatan signifikan dalam terjemahan multibahasa, pemahaman instruksi, dan penalaran berbasis akal sehat.
Perbaikan format respons: Model ini memperbaiki masalah format respons dari versi sebelumnya, seperti format Markdown yang tidak normal, pemotongan respons di tengah, dan output boxed yang salah.
Model Qwen3 open source yang dirilis pada April 2025 tidak mendukung output non-streaming dalam mode thinking.
Jika model Qwen3 open source berada dalam mode thinking tetapi tidak menghasilkan chain-of-thought, maka akan ditagih dengan tarif mode non-thinking.
Mode thinking | Mode non-thinking | Penggunaan
Global
Dalam mode deployment global, titik akhir dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Model | Mode | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost | Free quota |
(Tokens) | (Juta token) | |||||||
qwen3-next-80b-a3b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | 32.768 | $0,15 | $1,2 | Tidak ada kuota gratis |
qwen3-next-80b-a3b-instruct | Non-thinking only | 129.024 | - | |||||
qwen3-235b-a22b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,23 | $2,3 | |||
qwen3-235b-a22b-instruct-2507 | Non-thinking only | 129.024 | - | $0,92 | ||||
qwen3-30b-a3b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,2 | $2,4 | |||
qwen3-30b-a3b-instruct-2507 | Non-thinking only | 129.024 | - | $0,8 | ||||
qwen3-235b-a22b | Non-thinking | 129.024 | - | 16.384 | $0,7 | $2,8 | ||
Thinking | 98.304 | 38.912 | $8,4 | |||||
qwen3-32b | Non-thinking | 129.024 | - | $0,16 | $0,64 | |||
Thinking | 98.304 | 38.912 | ||||||
qwen3-30b-a3b | Non-thinking | 129.024 | - | $0,2 | $0,8 | |||
Thinking | 98.304 | 38.912 | $2,4 | |||||
qwen3-14b | Non-thinking | 129.024 | - | 8.192 | $0,35 | $1,4 | ||
Thinking | 98.304 | 38.912 | $4,2 | |||||
qwen3-8b | Non-thinking | 129.024 | - | $0,18 | $0,7 | |||
Thinking | 98.304 | 38.912 | $2,1 | |||||
Internasional
Dalam mode deployment internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Mode | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost | Free quota |
(Tokens) | (Million tokens) | |||||||
qwen3-next-80b-a3b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | 32.768 | $0,15 | $1,2 | 1 juta token per model Berlaku selama 90 hari setelah mengaktifkan Model Studio |
qwen3-next-80b-a3b-instruct | Non-thinking only | 129.024 | - | |||||
qwen3-235b-a22b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,23 | $2,3 | |||
qwen3-235b-a22b-instruct-2507 | Non-thinking only | 129.024 | - | $0,92 | ||||
qwen3-30b-a3b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,2 | $2,4 | |||
qwen3-30b-a3b-instruct-2507 | Non-thinking only | 129.024 | - | $0,8 | ||||
qwen3-235b-a22b Model ini dan model berikutnya dirilis pada April 2025. | Non-thinking | 129.024 | - | 16.384 | $0,7 | $2,8 | ||
Thinking | 98.304 | 38.912 | $8,4 | |||||
qwen3-32b | Non-thinking | 129.024 | - | $0,16 | $0,64 | |||
Thinking | 98.304 | 38.912 | ||||||
qwen3-30b-a3b | Non-thinking | 129.024 | - | $0,2 | $0,8 | |||
Thinking | 98.304 | 38.912 | $2,4 | |||||
qwen3-14b | Non-thinking | 129.024 | - | 8.192 | $0,35 | $1,4 | ||
Thinking | 98.304 | 38.912 | $4,2 | |||||
qwen3-8b | Non-thinking | 129.024 | - | $0,18 | $0,7 | |||
Thinking | 98.304 | 38.912 | $2,1 | |||||
qwen3-4b | Non-thinking | 129.024 | - | $0,11 | $0,42 | |||
Thinking | 98.304 | 38.912 | $1,26 | |||||
qwen3-1.7b | Non-thinking | 32.768 | 30.720 | - | $0,42 | |||
Thinking | 28.672 | Jumlah nilai dan input tidak boleh melebihi 30.720. | $1,26 | |||||
qwen3-0.6b | Non-thinking | 30.720 | - | $0,42 | ||||
Thinking | 28.672 | Total input tidak boleh melebihi 30.720. | $1,26 | |||||
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, Titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, sedangkan sumber daya komputasi untuk inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Mode | Context window | Max input | Max chain-of-thought | Max Response | Input cost | Output cost | Free quota |
(Tokens) | (Juta token) | |||||||
qwen3-next-80b-a3b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | 32.768 | $0,144 | $1,434 | Tidak ada kuota gratis |
qwen3-next-80b-a3b-instruct | Non-thinking only | 129.024 | - | $0,574 | ||||
qwen3-235b-a22b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,287 | $2,868 | |||
qwen3-235b-a22b-instruct-2507 | Non-thinking only | 129.024 | - | $1,147 | ||||
qwen3-30b-a3b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,108 | $1,076 | |||
qwen3-30b-a3b-instruct-2507 | Non-thinking only | 129.024 | - | $0,431 | ||||
qwen3-235b-a22b | Non-thinking | 129.024 | - | 16.384 | $0,287 | $1,147 | ||
Thinking | 98.304 | 38.912 | $2,868 | |||||
qwen3-32b | Non-thinking | 129.024 | - | $0,287 | $1,147 | |||
Thinking | 98.304 | 38.912 | $2,868 | |||||
qwen3-30b-a3b | Non-thinking | 129.024 | - | $0,108 | $0,431 | |||
Thinking | 98.304 | 38.912 | $1,076 | |||||
qwen3-14b | Non-thinking | 129.024 | - | 8.192 | $0,144 | $0,574 | ||
Thinking | 98.304 | 38.912 | $1,434 | |||||
qwen3-8b | Non-thinking | 129.024 | - | $0,072 | $0,287 | |||
Thinking | 98.304 | 38.912 | $0,717 | |||||
qwen3-4b | Non-thinking | 129.024 | - | $0,044 | $0,173 | |||
Thinking | 98.304 | 38.912 | $0,431 | |||||
qwen3-1.7b | Non-thinking | 32.768 | 30.720 | - | $0,173 | |||
Thinking | 28.672 | Jumlah tidak boleh melebihi 30.720 | $0,431 | |||||
qwen3-0.6b | Non-thinking | 30.720 | - | $0,173 | ||||
Thinking | 28.672 | Jumlah tidak boleh melebihi 30.720 | $0,431 | |||||
QwQ - Open source
Model penalaran QwQ dilatih berdasarkan Qwen2.5-32B. Pembelajaran penguatan (reinforcement learning) telah meningkatkan kemampuan inferensinya secara signifikan. Metrik inti untuk matematika dan kode (AIME 24/25, LiveCodeBench) serta beberapa metrik umum (IFEval, LiveBench) setara dengan versi full-power DeepSeek-R1. Semua metrik tersebut secara signifikan melampaui DeepSeek-R1-Distill-Qwen-32B yang juga berbasis Qwen2.5-32B. Penggunaan | Referensi API
Hanya mode deployment Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi terbatas di Tiongkok Daratan.
Model | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost |
(Token) | (Juta token) | |||||
qwq-32b | 131.072 | 98.304 | 32.768 | 8.192 | $0,287 | $0,861 |
QwQ-Preview
Model qwq-32b-preview adalah model riset eksperimental yang dikembangkan oleh tim Qwen pada tahun 2024. Model ini berfokus pada peningkatan kemampuan penalaran AI, terutama dalam matematika dan pemrograman. Untuk informasi lebih lanjut mengenai keterbatasan model qwq-32b-preview, lihat blog resmi QwQ. Penggunaan | Referensi API | Coba online
Hanya mode deployment Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi terbatas di Tiongkok Daratan.
Model | Context window | Max input | Max output | Input cost | Output cost |
(Token) | (Juta token) | ||||
qwq-32b-preview | 32.768 | 30.720 | 16.384 | $0,287 | $0,861 |
Qwen2.5
QVQ
Model qvq-72b-preview adalah model riset eksperimental yang dikembangkan oleh tim Qwen. Model ini berfokus pada peningkatan kemampuan penalaran visual, terutama dalam penalaran matematika. Untuk informasi lebih lanjut mengenai keterbatasan model qvq-72b-preview, lihat blog resmi QVQ.Penggunaan | Referensi API
Untuk membuat model mengeluarkan proses berpikirnya sebelum jawaban akhir, Anda dapat menggunakan versi komersial model QVQ.
Hanya mode deployment Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi terbatas di Tiongkok Daratan.
Model | Context window | Max input | Max output | Input cost | Output cost |
(Token) | (Juta token) | ||||
qvq-72b-preview | 32.768 | 16.384 Maksimal 16.384 token per gambar | 16.384 | $1,721 | $5,161 |
Qwen-Omni
Ini adalah model besar multimodal baru untuk pemahaman dan generasi, yang dilatih berdasarkan Qwen2.5. Model ini mendukung input teks, gambar, suara, dan video, serta dapat menghasilkan teks dan suara secara bersamaan dalam aliran (stream). Kecepatan pemahaman konten multimodalnya mengalami peningkatan signifikan.Penggunaan | Referensi API
Internasional
Dalam mode deployment internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Context window | Max input | Max output | Kuota gratis |
(Token) | ||||
qwen2.5-omni-7b | 32.768 | 30.720 | 2.048 | 1 juta token (tanpa memandang modalitas) Berlaku selama 90 hari setelah mengaktifkan Model Studio. |
Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:
|
|
Tiongkok Daratan
Dalam mode penyebaran di Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di Wilayah Beijing, sedangkan sumber daya komputasi Inferensi terbatas pada Tiongkok Daratan.
Model | Context window | Max input | Max output |
(Token) | |||
qwen2.5-omni-7b | 32.768 | 30.720 | 2.048 |
Aturan penagihan untuk input dan output adalah sebagai berikut:
|
|
Qwen3-Omni-Captioner
Qwen3-Omni-Captioner adalah model open-source berbasis Qwen3-Omni. Tanpa prompt apa pun, model ini secara otomatis menghasilkan deskripsi yang akurat dan komprehensif untuk audio kompleks, seperti ucapan, suara latar, musik, dan efek suara. Model ini dapat mengidentifikasi emosi pembicara, elemen musik (seperti gaya dan instrumen), serta informasi sensitif, sehingga cocok untuk aplikasi seperti analisis konten audio, audit keamanan, pengenalan maksud, dan penyuntingan audio. Penggunaan | Referensi API
Internasional
Dalam mode deployment internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Context window | Max input | Max output | Input cost | Output cost | Kuota gratis |
(token) | (Juta token) | |||||
qwen3-omni-30b-a3b-captioner | 65.536 | 32.768 | 32.768 | $3,81 | $3,06 | 1 juta token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, Titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, sedangkan sumber daya komputasi untuk inferensi model terbatas pada wilayah Tiongkok Daratan.
Model | Jendela konteks (token) | Max input (token) | Max output (token) | Input cost | Output Cost | Kuota gratis |
Token | Per juta token | |||||
qwen3-omni-30b-a3b-captioner | 65.536 | 32.768 | 32.768 | $2,265 | $1,821 | Tidak tersedia kuota gratis. |
Qwen-VL
Ini adalah versi open-source Qwen-VL dari Alibaba Cloud. Penggunaan | Referensi API
Model Qwen3-VL menawarkan peningkatan signifikan dibandingkan Qwen2.5-VL:
Interaksi agen: Model ini mengoperasikan antarmuka komputer dan ponsel dengan mengenali elemen Graphical User Interface (GUI), memahami fitur, dan memanggil alat untuk menjalankan tugas. Model ini mencapai performa terbaik dalam evaluasi seperti OS World.
Enkode visual: Model ini menghasilkan kode dari gambar atau video. Anda dapat menggunakannya untuk membuat kode HTML, CSS, dan JS dari file desain atau tangkapan layar website.
Kecerdasan spasial: Model ini mendukung penentuan posisi 2D dan 3D. Model ini secara akurat menentukan orientasi objek, perubahan perspektif, dan hubungan oklusi.
Pemahaman video panjang: Model ini memahami konten video hingga durasi 20 menit. Model ini dapat menentukan momen spesifik dengan presisi tingkat detik.
Pemikiran mendalam: Model ini memiliki kemampuan pemikiran mendalam. Model ini unggul dalam menangkap detail dan menganalisis sebab-akibat. Model ini mencapai performa terbaik dalam evaluasi seperti MathVista dan MMMU.
OCR: Model ini mendukung 33 bahasa. Model ini berkinerja lebih stabil dalam skenario dengan pencahayaan kompleks, efek buram, atau kemiringan. Model ini secara signifikan meningkatkan akurasi pengenalan untuk karakter langka, naskah kuno, dan istilah teknis.
Global
Dalam mode deployment global, titik akhir dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Model | Mode | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost Chain-of-thought + Outputs |
(Tokens) | (Million tokens) | ||||||
qwen3-vl-235b-a22b-thinking | Thinking only | 126.976 | 81.920 | $0,4 | $4 | ||
qwen3-vl-235b-a22b-instruct | Non-thinking only | 129.024 | - | $1,6 | |||
qwen3-vl-32b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | 32.768 | $0,16 | $0,64 |
qwen3-vl-32b-instruct | Non-thinking only | 129.024 | - | ||||
qwen3-vl-30b-a3b-thinking | Thinking only | 126.976 | 81.920 | $0,2 | $2,4 | ||
qwen3-vl-30b-a3b-instruct | Non-thinking only | 129.024 | - | $0,8 | |||
qwen3-vl-8b-thinking | Thinking only | 126.976 | 81.920 | $0,18 | $2,1 | ||
qwen3-vl-8b-instruct | Non-thinking only | 129.024 | - | $0,7 | |||
Internasional
Dalam mode deployment internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model |
Mode |
Context window |
Max input |
Max chain-of-thought |
Max Response |
Input cost |
Biaya Keluaran Chain-of-thought + Outputs |
Kuota Gratis |
Tokens |
Harga ($ per juta token) |
|||||||
qwen3-vl-235b-a22b-thinking |
Thinking only |
126.976 |
81.920 |
$0,4 |
$4 |
1 juta token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
||
qwen3-vl-235b-a22b-instruct |
Non-thinking only |
129.024 |
- |
$1,6 |
||||
qwen3-vl-32b-thinking |
Mode Berpikir |
131.072 |
126.976 |
81.920 |
32.768 |
$0,16 |
$0,64 |
|
qwen3-vl-32b-instruct |
Non-thinking only |
129.024 |
- |
|||||
qwen3-vl-30b-a3b-thinking |
Thinking only |
126.976 |
81.920 |
$0,2 |
$2,4 |
|||
qwen3-vl-30b-a3b-instruct |
Inferensi langsung saja |
129.024 |
- |
$0,8 |
||||
qwen3-vl-8b-thinking |
Thinking only |
126.976 |
81.920 |
$0,18 |
$2,1 |
|||
qwen3-vl-8b-instruct |
Inferensi standar saja |
129.024 |
- |
$0,7 |
||||
Tiongkok Daratan
Dalam mode deployment Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Model | Mode | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost Chain-of-thought + Outputs | Free quota |
(Tokens) | (Juta token) | |||||||
qwen3-vl-235b-a22b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | $0,287 | $2,867 | Tidak ada kuota gratis | |
qwen3-vl-235b-a22b-instruct | Instruct mode only | 129.024 | - | $1,147 | ||||
qwen3-vl-32b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | 32.768 | $0,287 | $2,868 | |
qwen3-vl-32b-instruct | Instruct mode only | 129.024 | - | $1,147 | ||||
qwen3-vl-30b-a3b-thinking | Thinking only | 126.976 | 81.920 | $0,108 | $1,076 | |||
qwen3-vl-30b-a3b-instruct | Instruct mode only | 129.024 | - | $0,431 | ||||
qwen3-vl-8b-thinking | Thinking only | 126.976 | 81.920 | $0,072 | $0,717 | |||
qwen3-vl-8b-instruct | Instruct mode only | 129.024 | - | $0,287 | ||||
Qwen-Math
Ini adalah model bahasa yang dibangun di atas model Qwen dan dikhususkan untuk menyelesaikan permasalahan matematika. Qwen2.5-Math mendukung Bahasa Mandarin dan Bahasa Inggris serta mengintegrasikan beberapa metode penalaran, seperti Chain of Thought (CoT), Program of Thought (PoT), dan Tool-Integrated Reasoning (TIR). Penggunaan | Referensi API | Coba secara online
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.
Model | Konteks | Input maksimum | Output maksimum | Biaya input | Biaya output |
(token) | (juta token) | ||||
qwen2.5-math-72b-instruct | 4.096 | 3.072 | 3.072 | $0,574 | $1.721 |
qwen2.5-math-7b-instruct | $0,144 | $0,287 | |||
qwen2.5-math-1.5b-instruct | Gratis untuk waktu terbatas | ||||
Qwen-Coder
Qwen-Coder adalah model kode open-source dari seri Qwen. Seri terbaru Qwen3-Coder memiliki kemampuan coding agent yang kuat. Model ini unggul dalam tool calling, interaksi lingkungan, dan pemrograman otonom. Model ini menggabungkan keterampilan coding yang luar biasa dengan kemampuan serbaguna. Penggunaan | Referensi API
Global
Dalam mode penyebaran global, titik akhir dan penyimpanan data berlokasi di Wilayah US (Virginia), serta sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
qwen3-coder-480b-a35b-instruct | 262.144 | 204.800 | 65.536 | Berlaku harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel ini. | |
qwen3-coder-30b-a3b-instruct | |||||
Model qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Model | Input tokens per request | Input cost (Million tokens) | Output cost (Million tokens) |
qwen3-coder-480b-a35b-instruct | 0 < tokens ≤ 32K | $1,50 | $7,50 |
32K < tokens ≤ 128K | $2,70 | $13,50 | |
128K < tokens ≤ 200K | $4,50 | $22,50 | |
qwen3-coder-30b-a3b-instruct | 0 < tokens ≤ 32K | $0,45 | $2,25 |
32K < tokens ≤ 128K | $0,75 | $3,75 | |
128K < tokens ≤ 200K | $1,2 | $6 |
International
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia, kecuali Tiongkok Daratan.
Model | Context window | Max input | Max output | Input cost | Output cost | Free quota |
(Tokens) | ||||||
qwen3-coder-480b-a35b-instruct | 262.144 | 204.800 | 65.536 | Berlaku harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel ini. | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. | |
qwen3-coder-30b-a3b-instruct | ||||||
Model qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Model | Input tokens per request | Input cost (Million tokens) | Output cost (Million tokens) |
qwen3-coder-480b-a35b-instruct | 0 < tokens ≤ 32K | $1,5 | $7,5 |
32K < tokens ≤ 128K | $2,7 | $13,5 | |
128K < tokens ≤ 200K | $4,5 | $22,5 | |
qwen3-coder-30b-a3b-instruct | 0 < tokens ≤ 32K | $0,45 | $2,25 |
32K < tokens ≤ 128K | $0,75 | $3,75 | |
128K < tokens ≤ 200K | $1,2 | $6 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
qwen3-coder-480b-a35b-instruct | 262.144 | 204.800 | 65.536 | Harga bertingkat. Lihat catatan di bawah tabel ini. | |
qwen3-coder-30b-a3b-instruct | |||||
qwen2.5-coder-32b-instruct | 131.072 | 129.024 | 8.192 | $0,287 | $0,861 |
qwen2.5-coder-14b-instruct | |||||
qwen2.5-coder-7b-instruct | $0,144 | $0,287 | |||
qwen2.5-coder-3b-instruct | 32.768 | 30.720 | Uji coba gratis untuk waktu terbatas | ||
qwen2.5-coder-1,5b-instruct | |||||
qwen2.5-coder-0,5b-instruct | |||||
Model qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Model | Input tokens per request | Input price (Million tokens) | Output price (Million tokens) |
qwen3-coder-480b-a35b-instruct | 0 < tokens ≤ 32K | $0,861 | $3,441 |
32K < tokens ≤ 128K | $1,291 | $5,161 | |
128K < tokens ≤ 200K | $2,151 | $8,602 | |
qwen3-coder-30b-a3b-instruct | 0 < tokens ≤ 32K | $0,216 | $0,861 |
32K < tokens ≤ 128K | $0,323 | $1,291 | |
128K < tokens ≤ 200K | $0,538 | $2,151 |
Generasi teks - Pihak ketiga
DeepSeek
DeepSeek adalah model bahasa besar dari DeepSeek AI. Referensi API | Coba secara online
Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.
Model | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost |
(Tokens) | (Million tokens) | |||||
deepseek-v3.2 Versi penuh 685B Diskon Context cache | 131.072 | 98.304 | 32.768 | 65.536 | $0,287 | $0,431 |
deepseek-v3.2-exp Versi penuh 685B | ||||||
deepseek-v3.1 Versi penuh 685B | $0,574 | $1,721 | ||||
deepseek-r1 Versi penuh 685B Batch separuh harga | 16.384 | $2,294 | ||||
deepseek-r1-0528 Versi penuh 685B | ||||||
deepseek-v3 Versi penuh 671B Batch separuh harga | 131.072 | N/A | $0,287 | $1,147 | ||
deepseek-r1-distill-qwen-1.5b Berdasarkan Qwen2.5-Math-1.5B | 32.768 | 32.768 | 16.384 | 16.384 | Uji coba gratis untuk waktu terbatas | |
deepseek-r1-distill-qwen-7b Berdasarkan Qwen2.5-Math-7B | $0,072 | $0,144 | ||||
deepseek-r1-distill-qwen-14b Berdasarkan Qwen2.5-14B | $0,144 | $0,431 | ||||
deepseek-r1-distill-qwen-32b Berdasarkan Qwen2.5-32B | $0,287 | $0,861 | ||||
deepseek-r1-distill-llama-8b Berdasarkan Llama-3.1-8B | Uji coba gratis untuk waktu terbatas | |||||
deepseek-r1-distill-llama-70b Berdasarkan Llama-3.3-70B | ||||||
Kimi
Kimi-K2 adalah model bahasa besar yang diluncurkan oleh Moonshot AI. Model ini memiliki kemampuan coding dan pemanggilan tool yang sangat baik. Penggunaan | Coba secara online
Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.
Model | Context window | Max input | Max CoT | Max response | Input price | Output price |
(tokens) | (per 1M tokens) | |||||
kimi-k2-thinking | 262.144 | 229.376 | 32.768 | 16.384 | $0,574 | $2,294 |
Moonshot-Kimi-K2-Instruct | 131.072 | 131.072 | - | 8.192 | $0,574 | $2,294 |
GLM
Model seri GLM adalah model penalaran hibrida dari Zhipu AI yang dirancang untuk agen dan mendukung dua mode: thinking dan non-thinking. GLM
Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.
Model | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost |
(Tokens) | (Million tokens) | |||||
glm-4.7 | 202,752 | 169,984 | 32,768 | 16,384 | Harga bertingkat, lihat tabel di bawah. | |
glm-4.6 | ||||||
Model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.
Model | Input tokens per request | Input cost (Million tokens) | Output cost (Million tokens) |
glm-4.7 | 0<Token<=32K | $0,431 | $2,007 |
32K<Token<=166K | $0,574 | $2,294 | |
glm-4.6 | 0<Token<=32K | $0,431 | $2,007 |
32K<Token<=166K | $0,574 | $2,294 |
Model-model tersebut bukan layanan pihak ketiga yang terintegrasi, melainkan dideploy pada server Model Studio.
Model GLM memiliki harga yang sama baik dalam mode thinking maupun non-thinking.
Image generation
Qwen-Image
Model teks-ke-gambar Qwen unggul dalam rendering teks kompleks, terutama dalam bahasa Tiongkok dan Inggris. Referensi API
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Harga satuan | Kuota gratis |
qwen-image-max Saat ini memiliki kemampuan yang sama dengan qwen-image-max-2025-12-30. | $0,075/gambar | Kuota gratis: 100 gambar untuk setiap model Berlaku selama 90 hari setelah mengaktifkan Model Studio. |
qwen-image-max-2025-12-30 | $0,075/gambar | |
qwen-image-plus Saat ini memiliki kemampuan yang sama dengan qwen-image. | $0,03/gambar | |
qwen-image-plus-2026-01-09 | $0,03/gambar | |
qwen-image | $0,035/gambar |
Tiongkok Daratan
Di Tiongkok Daratan dalam mode penyebaran, titik akses dan penyimpanan data berlokasi di Wilayah Beijing, sedangkan sumber daya komputasi inferensi terbatas pada Tiongkok Daratan.
Model | Harga satuan | Kuota gratis |
qwen-image-max Saat ini memiliki kemampuan yang sama dengan qwen-image-max-2025-12-30 | $0,071677/image | Tidak ada kuota gratis |
qwen-image-max-2025-12-30 | $0,071677/image | |
qwen-image-plus Saat ini memiliki kemampuan yang sama dengan qwen-image | $0,028671/image | |
qwen-image-plus-2026-01-09 | $0,028671/image | |
qwen-image | $0,035/image |
Prompt masukan | Gambar output |
Poster bergaya healing yang digambar tangan, menampilkan tiga anak anjing bermain bola di atas rumput hijau yang subur, dilengkapi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun tebal berwarna biru. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Sebuah balon ucapan menambah kesan ceria dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, terdapat teks tambahan: “We get to play ball with our friends again!” Palet warna didominasi hijau dan biru segar, dengan aksen merah muda dan kuning cerah untuk memperkuat suasana riang khas anak-anak. |
|
Qwen-Image-Edit
Model pengeditan gambar Qwen mendukung pengeditan teks yang presisi dalam bahasa Tiongkok dan Inggris. Model ini juga mendukung operasi seperti penyesuaian warna, peningkatan detail, style transfer, penambahan atau penghapusan objek, serta perubahan posisi dan aksi. Fitur-fitur ini memungkinkan pengeditan kompleks terhadap gambar dan teks. Referensi API
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Harga satuan | Kuota gratis |
qwen-image-edit-max Saat ini memiliki kemampuan yang sama dengan qwen-image-edit-plus-2026-01-16 | $0,075/gambar | Kuota gratis: 100 gambar untuk setiap model Berlaku selama 90 hari setelah mengaktifkan Model Studio |
qwen-image-edit-max-2026-01-16 | $0,075/gambar | |
qwen-image-edit-plus Saat ini memiliki kemampuan yang sama dengan qwen-image-edit-plus-2025-10-30 | $0,03/gambar | |
qwen-image-edit-plus-2025-12-15 | $0,03/gambar | |
qwen-image-edit-plus-2025-10-30 | $0,03/gambar | |
qwen-image-edit | $0,045/gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Harga satuan | Kuota gratis |
qwen-image-edit-max Saat ini memiliki kemampuan yang sama dengan qwen-image-edit-plus-2026-01-16 | $0,071677/gambar | Tidak ada kuota gratis |
qwen-image-edit-max-2026-01-16 | $0,071677/gambar | |
qwen-image-edit-plus Saat ini memiliki kemampuan yang sama dengan qwen-image-edit-plus-2025-10-30 | $0,028671/gambar | |
qwen-image-edit-plus-2025-12-15 | $0,028671/gambar | |
qwen-image-edit-plus-2025-10-30 | $0,028671/gambar | |
qwen-image-edit | $0,043/gambar |
Gambar asli |
Buat orang tersebut membungkuk dan memegang kaki depan anjing. |
Gambar asli |
Ubah teks pada balok huruf dari 'HEALTH INSURANCE' menjadi 'Tomorrow will be better'. |
Gambar asli |
Ubah kemeja berpola titik menjadi kemeja biru muda. |
Gambar asli |
Ubah latar belakang menjadi Antarktika. |
Gambar asli |
Buat foto profil bergaya kartun dari orang tersebut. |
Gambar asli |
Hapus rambut dari piring makan malam. |
Qwen-MT-Image
Model terjemahan gambar Qwen mendukung penerjemahan teks dari gambar dalam 11 bahasa ke bahasa Tiongkok atau Inggris. Model ini secara akurat mempertahankan tata letak dan informasi konten asli, serta menyediakan fitur kustom seperti definisi kata kunci, penyaringan kata sensitif, dan deteksi entitas gambar. Referensi API
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Harga satuan | Kuota gratis |
qwen-mt-image | $0,000431/gambar | Tidak ada kuota gratis |
Gambar Asli |
Bahasa Jepang |
Bahasa Portugis |
Bahasa Arab |
Tongyi - text-to-Image - Z-Image
Tongyi - text-to-image - Z-Image adalah model ringan yang secara cepat menghasilkan gambar berkualitas tinggi. Model ini mendukung rendering teks dalam bahasa Tiongkok dan Inggris, pemahaman semantik kompleks, berbagai gaya, serta resolusi dan rasio aspek ganda. Referensi API
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Harga satuan | Kuota gratis (Catatan) Berlaku selama 90 hari setelah mengaktifkan Model Studio |
z-image-turbo | Ekstensi prompt dinonaktifkan ( Ekstensi prompt diaktifkan ( | 100 gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Harga satuan | Kuota gratis |
z-image-turbo | Ekstensi prompt dinonaktifkan ( Ekstensi prompt diaktifkan ( | Tidak ada kuota gratis |
Prompt input | Gambar output |
Foto seorang wanita muda stylish berambut pendek hitam yang berdiri percaya diri di depan dinding mural bergaya kartun penuh warna. Ia mengenakan outfit serba hitam: jaket bomber puff dengan kerah berkerut, celana cargo pendek, stoking jaring ikan, dan sepatu bot Doc Martens hitam tebal, dilengkapi rantai emas yang menjuntai dari pinggangnya. Latar belakang terdiri atas empat panel bergaya komik penuh warna: satu bertuliskan “GRAND STAGE” yang menampilkan sepatu sneakers dan botol Gatorade; panel lain menampilkan sneakers Nike hijau dan sepotong pizza; panel ketiga bertuliskan “HARAJUKU st” dengan sepatu-sepatu melayang; serta panel keempat menunjukkan seekor tikus biru sedang menaiki skateboard dengan teks “Takeshita WELCOME.” Warna dominan cerah mencakup kuning, teal, oranye, merah muda, dan hijau. Balon ucapan, pola halftone, serta karakter-karakter lucu memperkuat estetika seni jalanan urban. Pencahayaan siang hari menerangi seluruh adegan secara merata, dengan lantai ubin putih di bawah kakinya. Komposisi potret tubuh penuh ini terpusat, postur sedikit miring, dan subjek menatap langsung ke kamera. Gambar memiliki detail tinggi, fokus tajam, serta framing dinamis. |
|
Wan text-to-image
Model teks-ke-gambar Wan menghasilkan gambar berkualitas tinggi dari teks. Referensi API | Coba online
Global
Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah AS (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Model | Deskripsi | Harga satuan | Kuota gratis (Catatan) Berlaku selama 90 hari setelah mengaktifkan Model Studio |
wan2.6-t2i | Wan 2.6. Mendukung antarmuka sinkron baru dan memungkinkan Anda memilih dimensi secara bebas dalam batasan total area piksel dan rasio aspek. | $0,03/gambar | Tidak ada kuota gratis |
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Deskripsi | Harga satuan | Kuota gratis (Catatan) Berlaku selama 90 hari setelah mengaktifkan Model Studio |
wan2.6-t2i | Wan 2.6. Mendukung antarmuka sinkron baru dan memungkinkan pemilihan dimensi secara bebas dalam batasan total area piksel dan rasio aspek. | $0,03/gambar | 50 gambar |
wan2.5-t2i-preview | Pratinjau Wan 2.5. Menghapus batasan panjang sisi tunggal dan memungkinkan pemilihan dimensi secara bebas dalam batasan total area piksel dan rasio aspek. | $0,03/gambar | 50 gambar |
wan2.2-t2i-plus | Edisi Profesional Wan 2.2. Ditingkatkan secara menyeluruh dalam kreativitas, stabilitas, dan tekstur realistis. | $0,05/gambar | 100 gambar |
wan2.2-t2i-flash | Edisi Flash Wan 2.2. Ditingkatkan secara menyeluruh dalam kreativitas, stabilitas, dan tekstur realistis. | $0,025/gambar | 100 gambar |
wan2.1-t2i-plus | Edisi Profesional Wan 2.1. Mendukung berbagai gaya dan menghasilkan gambar dengan detail yang kaya. | $0,05/gambar | 200 gambar |
wan2.1-t2i-turbo | Edisi Turbo Wan 2.1. Mendukung berbagai gaya dan menawarkan kecepatan generasi yang cepat. | $0,025/gambar | 200 gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Deskripsi | Harga satuan | Kuota gratis (Catatan) Berlaku selama 90 hari setelah mengaktifkan Model Studio |
wan2.6-t2i | Wan 2.6. Mendukung antarmuka sinkron baru dan memungkinkan pemilihan dimensi secara bebas dalam batasan total area piksel dan rasio aspek. | $0,028671/gambar | Tidak ada kuota gratis |
wan2.5-t2i-preview | Pratinjau Wan 2.5. Menghapus batasan panjang sisi tunggal dan memungkinkan pemilihan dimensi secara bebas dalam batasan total area piksel dan rasio aspek. | $0,028671/gambar | Tidak ada kuota gratis |
wan2.2-t2i-plus | Edisi Profesional Wan 2.2. Ditingkatkan sepenuhnya dalam kreativitas, stabilitas, dan tekstur realistis. | $0,02007/gambar | Tidak ada kuota gratis |
wan2.2-t2i-flash | Edisi Flash Wan 2.2. Ditingkatkan sepenuhnya dalam kreativitas, stabilitas, dan tekstur realistis. | $0,028671/gambar | Tidak ada kuota gratis |
wanx2.1-t2i-plus | Edisi Profesional Wan 2.1. Mendukung berbagai gaya dan menghasilkan gambar dengan detail kaya. | $0,028671/gambar | Tidak ada kuota gratis |
wanx2.1-t2i-turbo | Edisi Turbo Wan 2.1. Mendukung berbagai gaya dan menawarkan kecepatan generasi cepat. | $0,020070/gambar | Tidak ada kuota gratis |
wanx2.0-t2i-turbo | Edisi Turbo Wan 2.0. Unggul dalam potret bertekstur dan desain kreatif serta hemat biaya. | $0,005735/gambar | Tidak ada kuota gratis |
Prompt input | Gambar output |
Sebuah Santa Claus dari felt jarum yang memegang hadiah dan kucing putih yang berdiri di sampingnya, dengan latar belakang hadiah-hadiah berwarna-warni dan tanaman hijau, menciptakan adegan yang lucu, hangat, dan nyaman. |
|
Wan2.6 image generation and editing
Model generasi gambar Wan2.6 mendukung pengeditan gambar dan dapat menghasilkan output yang berisi teks dan gambar untuk memenuhi berbagai kebutuhan generasi dan integrasi. Referensi API.
Global
Dalam mode penyebaran Global, titik akses dan penyimpanan data berada di wilayah AS (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Model | Harga Satuan | Kuota Gratis |
wan2.6-image | $0,03/gambar | Tidak ada kuota gratis |
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berada di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Harga satuan | Kuota gratis (Catatan) Berlaku selama 90 hari setelah mengaktifkan Model Studio |
wan2.6-image | $0,03/gambar | 50 gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi Inferensi terbatas pada wilayah Tiongkok Daratan.
Model | Harga satuan | Kuota gratis |
wan2.6-image | $0,028671/gambar | Tidak ada kuota gratis |
Wan general image editing 2.5
Model pengeditan gambar umum Wan2.5 mendukung pengeditan gambar yang konsisten terhadap entitas dan fusi multi-gambar. Model ini menerima teks, satu gambar, atau beberapa gambar sebagai input. Referensi API.
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Harga satuan | Kuota gratis (Catatan) Berlaku selama 90 hari setelah mengaktifkan Model Studio |
wan2.5-i2i-preview | $0,03/gambar | 50 unit |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Harga satuan | Kuota gratis |
wan2.5-i2i-preview | $0,028671/gambar | Tidak ada kuota gratis |
Fitur | Contoh input | Gambar output |
Pengeditan gambar tunggal |
|
Ubah gaun bermotif bunga menjadi gaun panjang bergaya vintage berbahan renda dengan detail bordir indah pada kerah dan manset. |
Fusi multi-gambar |
|
Tempatkan jam alarm dari Gambar 1 di samping vas di atas meja makan pada Gambar 2. |
Wan general image editing 2.1
Model Wan2.1 general image editing melakukan berbagai pengeditan gambar dengan instruksi yang simple. Model ini cocok untuk skenario seperti outpainting, penghapusan watermark, style transfer, restorasi gambar, dan peningkatan kualitas gambar. Penggunaan | Referensi API
Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir (endpoint) dan penyimpanan data berlokasi di Wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.
Model | Harga Satuan | Kuota Gratis |
wanx2.1-imageedit | $0,020070 per gambar | Tidak ada kuota gratis |
Model general image editing saat ini mendukung fitur-fitur berikut:
Fitur Model | Gambar Masukan | Prompt Masukan | Gambar Keluaran |
Stylisasi Global |
| French picture book style. |
|
Stylisasi Lokal |
| Change the house to a wooden plank style. |
|
Pengeditan Berbasis Instruksi |
| Change the girl's hair to red. |
|
Inpainting | Gambar masukan
Gambar dengan masker (area putih menunjukkan masker)
| A ceramic rabbit holding a ceramic flower. | Gambar keluaran
|
Penghapusan Watermark Teks |
| Remove the text from the image. |
|
Outpainting |
| A green fairy. |
|
Super-resolusi Gambar | Gambar buram
| Image super-resolution. | Gambar jernih
|
Pewarnaan Gambar |
| Blue background, yellow leaves. |
|
Line Art ke Gambar |
| A living room in a minimalist Nordic style. |
|
Gambar Placeholder |
| A cartoon character cautiously peeks out, spying on a brilliant blue gem inside the room. |
|
OutfitAnyone
Dibandingkan dengan versi dasar, model OutfitAnyone-Plus menawarkan peningkatan dalam definisi gambar, detail tekstur pakaian, dan restorasi logo. Namun, proses pembuatan gambarnya memakan waktu lebih lama dan cocok untuk skenario yang tidak sensitif terhadap waktu. Referensi API | Coba secara online
Penguraian gambar OutfitAnyone mendukung penguraian gambar model dan pakaian, yang dapat digunakan untuk pra-pemrosesan dan post-processing gambar OutfitAnyone. Referensi API
Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.
Model | Deskripsi | Contoh input | Contoh keluaran |
aitryon-plus | OutfitAnyone-Plus |
|
|
aitryon-parsing-v1 | Penguraian gambar OutfitAnyone |
Harga OutfitAnyone
Layanan | Model | Harga Satuan | Diskon | Tingkat |
OutfitAnyone - Plus | aitryon-plus | $0,071677/gambar | Tidak ada | Tidak ada |
OutfitAnyone - Penguraian gambar | aitryon-parsing-v1 | $0,000574/gambar | Tidak ada | Tidak ada |
Generasi video - Wan
Teks-ke-video
Model teks-ke-video Wan menghasilkan video dari satu kalimat. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba online
Global
Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Model | Deskripsi | Harga satuan | Kuota gratis |
wan2.6-t2v | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | 720P: $0,1/detik 1080P: $0,15/detik | Tidak ada kuota gratis |
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Deskripsi | Harga satuan | Kuota gratis (Klaim) Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
wan2.6-t2v | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | 720P: $0,10/detik 1080P: $0,15/detik | 50 detik |
wan2.5-t2v-preview | Pratinjau Wan 2.5. Mendukung voiceover otomatis dan impor file audio kustom. | 480p: $0,05/detik 720p: $0,10/detik 1080p: $0,15/detik | 50 detik |
wan2.2-t2v-plus | Edisi Profesional Wan 2.2. Menawarkan peningkatan signifikan pada detail gambar dan stabilitas gerakan. | 480p: $0,02/detik 1080p: $0,10/detik | 50 detik |
wan2.1-t2v-turbo | Edisi Turbo Wan 2.1. Menyediakan kecepatan generasi cepat dengan performa seimbang. | $0,036/detik | 200 detik |
wan2.1-t2v-plus | Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya dan gambar berkualitas tinggi. | $0,10/detik | 200 detik |
AS
Dalam mode penyebaran AS, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi terbatas hanya di AS.
Model | Deskripsi | Harga satuan | Kuota gratis |
wan2.6-t2v-us | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | 720P: $0,1/detik 1080P: $0,15/detik | Tidak ada kuota gratis |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Deskripsi | Harga satuan | Kuota gratis |
wan2.6-t2v | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | 720P: $0,086012/detik 1080P: 0,143353/detik | Tidak ada kuota gratis |
wan2.5-t2v-preview | Pratinjau Wan 2.5. Mendukung voiceover otomatis dan impor file audio kustom. | 480p: $0,043006/detik 720p: $0,086012/detik 1080p: $0,143353/detik | Tidak ada kuota gratis |
wan2.2-t2v-plus | Edisi Profesional Wan 2.2. Menawarkan peningkatan signifikan pada detail gambar dan stabilitas gerakan. | 480p: $0,02007/detik 1080p: $0,100347/detik | Tidak ada kuota gratis |
wanx2.1-t2v-turbo | Generasi lebih cepat dengan performa seimbang. | $0,034405/detik | Tidak ada kuota gratis |
wanx2.1-t2v-plus | Menghasilkan detail lebih kaya dan kualitas gambar lebih tinggi. | $0,100347/detik | Tidak ada kuota gratis |
Gambar-ke-video - frame pertama
Model gambar-ke-video Wan menggunakan gambar input sebagai frame pertama video. Selanjutnya, model ini menghasilkan sisa video berdasarkan prompt. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba online
Global
Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Model | Deskripsi | Harga satuan | Kuota gratis |
wan2.6-i2v | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | 720P: $0,1/detik 1080P: $0,15/detik | Tidak ada kuota gratis |
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Deskripsi | Harga satuan | Kuota gratis (Catatan) Masa berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
wan2.6-i2v-flash | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | Output video dengan audio
Output video tanpa audio
| 50 detik |
wan2.6-i2v | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | 720P: $0,10/detik 1080P: $0,15/detik | 50 detik |
wan2.5-i2v-preview | Pratinjau Wan 2.5. Mendukung dubbing otomatis dan unggah file audio kustom. | 480P: $0,05/detik 720P: $0,10/detik 1080P: $0,15/detik | 50 detik |
wan2.2-i2v-flash | Edisi Flash Wan 2.2. Menawarkan kecepatan generasi sangat cepat dengan peningkatan signifikan pada detail visual dan stabilitas gerakan. | 480P: $0,015/detik 720P: $0,036/detik | 50 detik |
wan2.2-i2v-plus | Edisi Profesional Wan 2.2. Memberikan peningkatan signifikan pada detail visual dan stabilitas gerakan. | 480P: $0,02/detik 1080P: $0,10/detik | 50 detik |
wan2.1-i2v-turbo | Edisi Turbo Wan 2.1. Menawarkan kecepatan generasi cepat dengan performa seimbang. | $0,036/detik | 200 detik |
wan2.1-i2v-plus | Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya dan visual bertekstur berkualitas tinggi. | $0,10/detik | 200 detik |
AS
Dalam mode penyebaran AS, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi terbatas hanya di AS.
Model | Deskripsi | Harga satuan | Kuota gratis |
wan2.6-i2v-us | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | 720P: $0,1/detik 1080P: $0,15/detik | Tidak ada kuota gratis |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Deskripsi | Harga satuan | Kuota gratis |
wan2.6-i2v-flash | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | Output video dengan audio
Output video tanpa audio
| Tidak ada kuota gratis |
wan2.6-i2v | Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom. | 720P: $0,086012/detik 1080P: $0,143353/detik | Tidak ada kuota gratis |
wan2.5-i2v-preview | Pratinjau Wan 2.5. Mendukung dubbing otomatis dan unggah file audio kustom. | 480P: $0,043006/detik 720P: $0,086012/detik 1080P: $0,143353/detik | Tidak ada kuota gratis |
wan2.2-i2v-plus | Edisi Profesional Wan 2.2. Memberikan peningkatan signifikan pada detail visual dan stabilitas gerakan. | 480P: $0,02007/detik 1080P: $0,100347/detik | Tidak ada kuota gratis |
wanx2.1-i2v-turbo | Edisi Turbo Wan 2.1. Menawarkan kecepatan generasi cepat dengan performa seimbang. | $0,034405/detik | Tidak ada kuota gratis |
wanx2.1-i2v-plus | Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya dan visual bertekstur berkualitas tinggi. | $0,100347/detik | Tidak ada kuota gratis |
Gambar-ke-video - frame pertama dan terakhir
Model video frame-pertama-dan-terakhir Wan menghasilkan video dinamis yang mulus dari prompt. Anda hanya perlu menyediakan gambar frame pertama dan terakhir. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba online
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Harga satuan | Kuota gratis (Catatan) Masa berlaku: 90 hari setelah Anda mengaktifkan Model Studio |
wan2.2-kf2v-flash | 480P: USD0,015/detik 720P: USD0,036/detik 1080P: USD0,07/detik | 50 detik |
wan2.1-kf2v-plus | USD0,10/detik | 200 detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Harga satuan | Kuota gratis (Catatan) |
wan2.2-kf2v-flash | 480P: $0,014335/detik 720P: $0,028671/detik 1080P: $0,068809/detik | Tidak ada kuota gratis |
wanx2.1-kf2v-plus | $0,100347/detik | Tidak ada kuota gratis |
Contoh input | Video output | ||
Frame pertama | Frame terakhir | Prompt | |
|
| Dengan gaya realistis, kamera dimulai dari ketinggian mata seekor kucing hitam kecil yang menatap langit, lalu perlahan bergerak ke atas hingga menghasilkan bidikan dari atas yang memfokuskan pada mata penuh rasa ingin tahu si kucing. | |
Referensi-ke-video
Model referensi-ke-video Wan menggunakan penampilan karakter dan suara dari video input serta prompt untuk menghasilkan video baru yang menjaga konsistensi karakter. Referensi API
Aturan penagihan: Video input dan output keduanya ditagih per detik. Pekerjaan yang gagal tidak dikenai biaya dan tidak mengurangi kuota gratis.
Durasi tagih video input tidak melebihi 5 detik. Untuk informasi selengkapnya, lihat Penagihan dan batas laju.
Durasi tagih video output adalah durasi dalam detik dari video yang berhasil dihasilkan.
Global
Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.
Model | Harga input | Harga output | Kuota gratis (Catatan) |
wan2.6-r2v | 720P: $0,086012/detik 1080P: $0,143353/detik | 720P: $0,1/detik 1080P: $0,15/detik | Tidak ada kuota gratis |
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Harga input | Harga output | Kuota gratis (Catatan) |
wan2.6-r2v | 720P: USD 0,10/detik 1080P: USD 0,15/detik | 720P: USD 0,10/detik 1080P: USD 0,15/detik | 50 detik Masa berlaku: 90 hari setelah Anda mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Harga input | Harga output | Kuota gratis (Catatan) |
wan2.6-r2v | 720P: $0,086012/detik 1080P: $0,143353/detik | 720P: $0,086012/detik 1080P: $0,143353/detik | Tidak ada kuota gratis |
Pengeditan video umum
Model pengeditan video umum Wan mendukung input multimodal, termasuk teks, gambar, dan video. Model ini dapat melakukan tugas generasi dan pengeditan video umum. Referensi API | Coba online
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Harga satuan | Kuota gratis (Catatan) |
wan2.1-vace-plus | $0,1/detik | 50 detik Masa berlaku: Berlaku selama 90 hari setelah aktivasi Model Studio. |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Harga satuan | Kuota gratis (Catatan) |
wanx2.1-vace-plus | $0,100347/detik | Tidak ada kuota gratis |
Model pengeditan video umum mendukung fitur-fitur berikut:
Fitur | Gambar referensi input | Prompt Masukan | Video output |
Referensi multi-gambar | Gambar referensi 1 (entitas referensi)
Gambar referensi 2 (latar belakang referensi)
| Dalam video, seorang gadis berjalan anggun keluar dari hutan kuno yang berkabut. Langkahnya ringan, dan kamera menangkap setiap gerakan lincahnya. Saat ia berhenti dan memandang sekeliling ke hutan yang rindang, senyum kejutan dan sukacita merekah di wajahnya. Adegan ini, yang membeku dalam interaksi antara cahaya dan bayangan, merekam pertemuannya yang indah dengan alam. | Video output |
Pengecatan ulang video | Video menampilkan mobil bergaya steampunk berwarna hitam yang dikemudikan oleh seorang pria. Mobil tersebut dihiasi roda gigi dan pipa tembaga, dengan latar belakang pabrik permen bertenaga uap serta elemen retro yang menciptakan suasana vintage dan menyenangkan. | ||
Pengeditan lokal | Video input Gambar mask input (area putih menunjukkan area pengeditan)
| Video menampilkan kafe Prancis bergaya Paris tempat seekor singa berjas dengan elegan menyesap kopi. Ia memegang cangkir dengan satu tangan dan menyesap pelan sambil menunjukkan ekspresi santai. Kafe tersebut didekorasi dengan selera tinggi, menggunakan warna lembut dan pencahayaan hangat yang menerangi area tempat singa tersebut berada. | Konten di area pengeditan dimodifikasi berdasarkan prompt. |
Ekstensi video | Klip pertama input (1 detik) | Seekor anjing yang mengenakan kacamata hitam sedang berseluncur di jalan, dalam gaya kartun 3D. | Video hasil ekstensi (5 detik) |
Video outpainting | Seorang wanita elegan bersemangat memainkan biola, dengan orkestra simfoni lengkap di belakangnya. |
Wan - manusia digital
Fitur ini menghasilkan video orang yang tampak alami saat berbicara, bernyanyi, atau tampil, berdasarkan satu gambar karakter dan file audio. Untuk menggunakan fitur ini, Anda dapat memanggil model-model berikut secara berurutan. Deteksi gambar wan2.2-s2v | Generasi video wan2.2-s2v
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Deskripsi | Harga satuan |
wan2.2-s2v-detect | Memeriksa apakah gambar input memenuhi persyaratan, seperti resolusi yang cukup, hanya terdapat satu orang, dan tampilan wajah depan. | $0,000574/gambar |
wan2.2-s2v | Menghasilkan video dinamis seseorang berdasarkan gambar yang valid dan klip audio. | 480p: $0,071677/detik 720p: $0,129018/detik |
Contoh input | Video output |
Audio input: |
Wan - gambar animasi
Tersedia dalam mode standar dan profesional. Model ini mentransfer tindakan dan ekspresi dari video referensi ke gambar karakter, menghasilkan video yang menganimasikan karakter dari gambar tersebut. Referensi API.
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Layanan | Deskripsi | Harga satuan | Kuota gratis (Lihat) |
wan2.2-animate-move | Mode standar | Layanan hemat biaya dengan kecepatan generasi cepat, cocok untuk kebutuhan dasar seperti demo animasi sederhana. | $0,12/detik | Total durasi untuk kedua pola adalah 50 detik. |
Mode profesional | Memberikan kelancaran animasi tinggi dan transisi alami untuk tindakan serta ekspresi, menghasilkan output yang menyerupai video live-action. | $0,18/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Layanan | Deskripsi | Harga satuan | Kuota gratis (Lihat) |
wan2.2-animate-move | Mode standar | Generasi cepat, ideal untuk kebutuhan dasar seperti demo animasi sederhana, serta hemat biaya. | $0,06/detik | Tidak ada kuota gratis |
Mode profesional | Menyediakan animasi berkualitas tinggi dan lancar dengan transisi alami untuk tindakan dan ekspresi, menghasilkan output yang menyerupai video live-action. | $0,09/detik |
Gambar Karakter | Video Referensi | Video Standar | Video Output (Professional Mode) |
|
Wan - penukaran karakter video
Tersedia dalam mode standar dan profesional. Model ini mengganti karakter utama dalam video dengan karakter dari gambar. Model ini mempertahankan adegan, pencahayaan, dan rona video asli. Referensi API.
Internasional
Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).
Model | Layanan | Deskripsi | Harga satuan | Kuota gratis (Lihat) |
wan2.2-animate-mix | Mode standar | Menghasilkan animasi dengan cepat, ideal untuk kebutuhan dasar seperti demo sederhana, serta sangat hemat biaya. | $0,18/detik | Durasi gabungan kedua layanan adalah 50 detik. |
Mode profesional | Menghasilkan animasi sangat lancar dengan transisi alami untuk tindakan dan ekspresi, menghasilkan output yang sangat menyerupai video live-action. | $0,26/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Layanan | Deskripsi | Harga satuan | Kuota gratis (Lihat) |
wan2.2-animate-mix | Mode standar | Menghasilkan animasi dengan cepat, ideal untuk kebutuhan dasar seperti demo sederhana, serta sangat hemat biaya. | $0,09/detik | Tidak ada kuota gratis |
Mode profesional | Menghasilkan animasi sangat lancar dengan transisi alami untuk tindakan dan ekspresi, menghasilkan kualitas yang sangat menyerupai video live-action. | $0,13/detik |
Gambar Karakter | Video Referensi | Standard video output | Video Output Profesional |
|
AnimateAnyone
Fitur ini menghasilkan video gerakan karakter berdasarkan gambar karakter dan templat gerakan. Untuk menggunakan fitur ini, Anda dapat memanggil ketiga model berikut secara berurutan. Detail API deteksi gambar AnimateAnyone | Generasi templat gerakan AnimateAnyone | Detail API generasi video AnimateAnyone
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Deskripsi | Harga satuan |
animate-anyone-detect-gen2 | Mendeteksi apakah gambar input memenuhi persyaratan. | $0,000574/gambar |
animate-anyone-template-gen2 | Mengekstraksi gerakan karakter dari video dan menghasilkan templat gerakan. | $0,011469/detik |
animate-anyone-gen2 | Menghasilkan video aksi karakter dari gambar karakter dan templat aksi. |
Input: Gambar Karakter | Input: Video Gerakan | Output (Dihasilkan dari Latar Belakang Gambar) | Output (Dihasilkan dari Latar Belakang Video) |
|
Contoh di atas dihasilkan oleh Aplikasi Tongyi, yang mengintegrasikan AnimateAnyone.
Konten yang dihasilkan oleh model AnimateAnyone hanya berupa video dan tidak termasuk audio.
EMO
Fitur ini menghasilkan video potret dinamis berdasarkan gambar potret dan file audio suara manusia. Untuk menggunakan fitur ini, Anda dapat memanggil model-model berikut secara berurutan. Deteksi gambar EMO | Generasi video EMO
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Deskripsi | Harga satuan |
emo-detect-v1 | Mendeteksi apakah gambar input memenuhi spesifikasi yang ditentukan. Model ini dapat dipanggil langsung tanpa deployment. | $0,000574/gambar |
emo-v1 | Menghasilkan video potret dinamis. Model ini dapat dipanggil langsung tanpa deployment. |
|
Input: Gambar potret dan file audio suara manusia | Output: Video potret dinamis |
Potret:
Audio suara manusia: Lihat video di sebelah kanan. | Video karakter: Tingkat gaya: aktif ("style_level": "active") |
LivePortrait
Model ini menghasilkan video potret dinamis secara cepat dan efisien berdasarkan gambar potret dan file audio suara manusia. Dibandingkan dengan model EMO, model ini menghasilkan video lebih cepat dan dengan biaya lebih rendah, tetapi kualitasnya tidak sebaik EMO. Untuk menggunakan fitur ini, Anda dapat memanggil dua model berikut secara berurutan. Deteksi gambar LivePortrait | Generasi video LivePortrait
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Deskripsi | Harga Satuan |
liveportrait-detect | Mendeteksi apakah gambar input memenuhi persyaratan. | $0,000574/gambar |
liveportrait | Menghasilkan video potret dinamis. | $0,002868/detik |
Input: Gambar potret dan audio suara | Output: Video potret animasi |
Gambar potret:
Audio suara: Diambil dari video di sebelah kanan. | Video potret: |
Emoji
Fitur ini menghasilkan video wajah dinamis berdasarkan gambar wajah dan templat gerakan wajah preset. Kemampuan ini dapat digunakan untuk skenario seperti membuat emoji dan menghasilkan materi video. Untuk menggunakan fitur ini, Anda dapat memanggil model-model berikut secara berurutan. Deteksi gambar Emoji | Generasi video Emoji
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Deskripsi | Harga satuan |
emoji-detect-v1 | Mendeteksi apakah gambar input memenuhi persyaratan tertentu. | $0,000574/gambar |
emoji-v1 | Menghasilkan emoji kustom berdasarkan gambar potret dan templat emoji yang ditentukan. | $0,011469/detik |
Input: Gambar potret | Output: Video potret dinamis |
| Parameter untuk templat emoji "Happy": ("input.driven_id": "mengwa_kaixin") |
VideoRetalk
Fitur ini menghasilkan video di mana gerakan bibir karakter sesuai dengan audio input, berdasarkan video karakter dan file audio suara manusia. Untuk menggunakan fitur ini, Anda dapat memanggil model berikut. Referensi API
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Deskripsi | Harga satuan |
videoretalk | Menyinkronkan gerakan bibir karakter dengan audio input untuk menghasilkan video baru. | $0,011469/detik |
Transformasi gaya video
Model ini menghasilkan video dalam gaya berbeda yang sesuai dengan deskripsi semantik dari teks input pengguna, atau mengubah gaya video input pengguna. Referensi API
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Description | Unit price | |
video-style-transform | Mengubah video input menjadi gaya seperti komik Jepang dan komik Amerika. | 720P | $0.071677/second |
540P | $0.028671/second | ||
Video masukan | Video output (gaya Manga) |
Sintesis suara (teks-ke-ucapan)
Sintesis suara Qwen
Fitur ini mendukung input teks campuran multibahasa dan menyediakan output audio streaming. Penggunaan | Referensi API
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Version | Price | Maximum input characters | Supported languages | Free quota (Catatan) |
qwen3-tts-flash Kemampuan yang sama dengan qwen3-tts-flash-2025-09-18. | Stable | $0,10 per 10.000 karakter | 600 | Bahasa Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | 2.000 karakter jika Anda mengaktifkan Model Studio sebelum pukul 00.00 pada 13 November 2025. 10.000 karakter jika Anda mengaktifkan Model Studio pada atau setelah pukul 00.00 pada 13 November 2025. Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
qwen3-tts-flash-2025-11-27 | Snapshot | 10.000 karakter Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. | |||
qwen3-tts-flash-2025-09-18 | Snapshot | 2.000 karakter jika Anda mengaktifkan Model Studio sebelum pukul 00.00 pada 13 November 2025. 10.000 karakter jika Anda mengaktifkan Model Studio pada atau setelah pukul 00.00 pada 13 November 2025. Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:
Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.
Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Qwen3-TTS-Flash
Model | Versi | Harga | Karakter input maks | Bahasa yang didukung | Kuota gratis (Catatan) |
qwen3-tts-flash Kemampuan yang setara dengan qwen3-tts-flash-2025-09-18. | Stable | $0,114682/10.000 karakter | 600 | Bahasa Tionghoa (Mandarin, Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | Tidak ada kuota gratis |
qwen3-tts-flash-2025-11-27 | Snapshot | ||||
qwen3-tts-flash-2025-09-18 | Snapshot |
Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:
Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.
Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.
Qwen-TTS
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output | Kuota gratis (Catatan) |
(Token) | (per 1.000 token) | ||||||
qwen-tts Model ini memiliki kemampuan yang sama dengan qwen-tts-2025-04-10. | Stable | 8.192 | 512 | 7.680 | $0,230 | $1,434 | Tidak ada kuota gratis |
qwen-tts-latest Model ini selalu memiliki kemampuan yang sama dengan versi snapshot terbaru. | Latest | ||||||
qwen-tts-2025-05-22 | Snapshot | ||||||
qwen-tts-2025-04-10 | |||||||
Audio dikonversi ke token dengan laju 50 token per detik. Klip audio yang durasinya kurang dari 1 detik ditagih sebagai 50 token.
Sintesis suara real-time Qwen
Fitur ini mendukung input teks streaming dan output audio streaming. Fitur ini secara otomatis menyesuaikan laju ucapan berdasarkan konten teks dan tanda baca. Penggunaan | Referensi API
Qwen3-TTS-VD-Realtime mendukung sintesis suara real-time dengan suara voice design, tetapi tidak mendukung suara default.
Qwen3-TTS-VC-Realtime mendukung sintesis suara real-time dengan suara cloned voices, tetapi tidak mendukung suara default.
Qwen3-TTS-Flash-Realtime dan Qwen-TTS-Realtime hanya mendukung suara default dan tidak mendukung suara cloned maupun designed.
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Qwen3-TTS-VD-Realtime
Model | Versi | Harga | Bahasa yang Didukung | Kuota Gratis (Catatan) |
qwen3-tts-vd-realtime-2025-12-16 | Snapshot | $0,143353/10.000 karakter | Bahasa Tionghoa, Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | 10.000 karakter Masa berlaku: Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:
Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.
Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.
Qwen3-TTS-VC-Realtime
Model | Versi | Harga | Bahasa yang Didukung | Kuota Gratis (Catatan) |
qwen3-tts-vc-realtime-2025-11-27 | Snapshot | $0,13/10.000 karakter | Bahasa Tionghoa, Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | 10.000 karakter Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:
Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.
Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.
Qwen3-TTS-Flash-Realtime
Model | Version | Price | Supported languages | Free quota (Catatan) |
qwen3-tts-flash-realtime Model ini memiliki kemampuan yang sama dengan qwen3-tts-flash-realtime-2025-09-18. | Stable | $0,13/10.000 karakter | Bahasa Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | Jika Anda mengaktifkan Model Studio sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter Jika Anda mengaktifkan Model Studio pada atau setelah pukul 00.00 pada 13 November 2025: 10.000 karakter Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
qwen3-tts-flash-realtime-2025-11-27 | Snapshot | 10.000 karakter Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio | ||
qwen3-tts-flash-realtime-2025-09-18 | Snapshot | Jika Anda mengaktifkan Model Studio sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter Jika Anda mengaktifkan Model Studio pada atau setelah pukul 00.00 pada 13 November 2025: 10.000 karakter Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:
Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.
Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Qwen3-TTS-VD-Realtime
Model | Versi | Harga | Bahasa yang Didukung | Kuota Gratis (Catatan) |
qwen3-tts-vd-realtime-2025-12-16 | Snapshot | $0,143353 per 10.000 karakter | Bahasa Tionghoa, Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | Tidak ada kuota gratis |
Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:
Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.
Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.
Qwen3-TTS-VC-Realtime
Model | Versi | Harga | Bahasa yang Didukung | Kuota gratis (Catatan) |
qwen3-tts-vc-realtime-2025-11-27 | Snapshot | $0,143353/10.000 karakter | Bahasa Tionghoa, Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | Tidak ada kuota gratis |
Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:
Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.
Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.
Qwen3-TTS-Flash-Realtime
Model | Versi | Harga | Bahasa yang didukung | Kuota gratis (Catatan) |
qwen3-tts-flash-realtime Fungsional identik dengan qwen3-tts-flash-realtime-2025-09-18. | Stable | $0,143353/10.000 karakter | Bahasa Tionghoa (Mandarin, Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | Tidak ada kuota gratis |
qwen3-tts-flash-realtime-2025-11-27 | Snapshot | |||
qwen3-tts-flash-realtime-2025-09-18 | Snapshot |
Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:
Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.
Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.
Qwen-TTS-Realtime
Model | Versi | Jendela konteks | Input maks | Output Maksimum | Biaya input | Biaya output | Bahasa yang didukung | Kuota gratis (Catatan) |
(Token) | (per 1.000 token) | |||||||
qwen-tts-realtime Model ini memiliki kemampuan yang sama dengan qwen-tts-realtime-2025-07-15. | Stable | 8.192 | 512 | 7.680 | $0,345 | $1,721 | Bahasa Tionghoa, Inggris | Tidak ada kuota gratis |
qwen-tts-realtime-latest Model ini memiliki kemampuan yang sama dengan qwen-tts-realtime-2025-07-15. | Latest | Bahasa Tionghoa, Inggris | ||||||
qwen-tts-realtime-2025-07-15 | Snapshot | Bahasa Tionghoa, Inggris | ||||||
Audio dikonversi ke token dengan laju 50 token per detik. Klip audio yang durasinya kurang dari 1 detik ditagih sebagai 50 token.
Kloning suara Qwen
Kloning suara menggunakan model untuk ekstraksi fitur guna mengkloning suara tanpa pelatihan. Anda dapat memberikan rekaman audio selama 10 hingga 20 detik saja untuk menghasilkan suara kustom yang sangat mirip dan terdengar alami. Penggunaan | Referensi API
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Harga | Kuota gratis (Catatan) |
qwen-voice-enrollment | $0,01/suara | 1.000 suara Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Harga | Kuota gratis (Catatan) |
qwen-voice-enrollment | $0,01/suara | Tidak ada kuota gratis |
Desain suara Qwen
Desain suara menghasilkan suara kustom dari deskripsi teks. Fitur ini mendukung definisi fitur suara multibahasa dan multidimensi. Fitur ini cocok untuk berbagai aplikasi, seperti pengisi suara iklan, pembuatan karakter, dan pembuatan konten audio. Penggunaan | Referensi API
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Harga | Kuota gratis (Catatan) |
qwen-voice-design | $0,20 per suara | 10 timbre Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Harga | Kuota gratis (Catatan) |
qwen-voice-design | $0,20 per suara | Tidak ada kuota gratis |
Sintesis suara CosyVoice
CosyVoice adalah model sintesis suara generatif generasi berikutnya dari Tongyi Lab. Dibangun di atas model bahasa pre-train skala besar, CosyVoice mengintegrasikan pemahaman teks dan generasi suara secara mendalam serta mendukung sintesis teks-ke-ucapan streaming real-time. Penggunaan | Referensi API
Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Harga | Kuota gratis (Catatan) |
cosyvoice-v3-plus | $0,286706 per 10.000 karakter | Tidak ada kuota gratis |
cosyvoice-v3-flash | $0,14335 per 10.000 karakter | |
cosyvoice-v2 | $0,286706 per 10.000 karakter |
Perhitungan karakter dilakukan sebagai berikut: Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter. Karakter lainnya, seperti huruf, angka, Kana Jepang, dan Hangul Korea, dihitung sebagai 1 karakter. Konten dalam tag SSML tidak dikenai biaya.
Speech recognition (speech-to-text) dan translation (speech-to-translation)
Qwen3-LiveTranslate-Flash
Qwen3-LiveTranslate-Flash-Realtime
Qwen3-LiveTranslate-Flash-Realtime adalah model multibahasa untuk terjemahan audio dan video real-time. Model ini mengenali 18 bahasa dan menyediakan terjemahan audio real-time dalam 10 bahasa.
Fitur utama:
Dukungan multibahasa: Mendukung 18 bahasa dan 6 dialek Tiongkok, termasuk Tiongkok, Inggris, Prancis, Jerman, Rusia, Jepang, dan Korea. Model ini juga mendukung dialek seperti Mandarin, Kanton, dan Sichuan.
Peningkatan berbasis visi: Menggunakan konten visual untuk meningkatkan akurasi terjemahan. Model ini menganalisis petunjuk visual, seperti gerakan bibir, tindakan, dan teks pada layar, guna meningkatkan akurasi terjemahan di lingkungan bising atau ketika ucapan ambigu.
Latensi 3 detik: Mencapai latensi interpretasi simultan serendah 3 detik.
Interpretasi simultan tanpa kehilangan kualitas: Mengatasi masalah urutan kata lintas bahasa menggunakan teknologi prediksi unit semantik. Kualitas terjemahan real-time setara dengan terjemahan offline.
Suara alami: Menghasilkan suara yang natural dan menyerupai manusia. Model ini secara otomatis menyesuaikan nada dan emosi berdasarkan konten audio sumber.
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Versi | Context window | Max input | Max output | Kuota gratis |
(Tokens) | |||||
qwen3-livetranslate-flash-realtime Model ini memiliki kemampuan yang sama dengan qwen3-livetranslate-flash-realtime-2025-09-22. | Stable | 53.248 | 49.152 | 4.096 | 1 juta token untuk setiap versi Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
qwen3-livetranslate-flash-realtime-2025-09-22 | Snapshot | ||||
Setelah kuota gratis habis, penagihan untuk input dan output dihitung sebagai berikut:
|
|
Perhitungan token:
Audio: Setiap detik audio input atau output mengonsumsi 12,5 token.
Image: Setiap input 28 × 28 piksel mengonsumsi 0,5 token.
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Versi | Context window | Max input | Max output | Kuota gratis (Catatan) |
(Tokens) | |||||
qwen3-livetranslate-flash-realtime Model ini memiliki kemampuan yang sama dengan qwen3-livetranslate-flash-realtime-2025-09-22. | Stable | 53.248 | 49.152 | 4.096 | Tidak ada kuota gratis |
qwen3-livetranslate-flash-realtime-2025-09-22 | Snapshot | ||||
Penagihan untuk input dan output dihitung sebagai berikut:
|
|
Perhitungan token:
Audio: Setiap detik audio input atau output mengonsumsi 12,5 token.
Image: Setiap input 28 × 28 piksel mengonsumsi 0,5 token.
Pengenalan file audio Qwen
Berdasarkan model dasar multimodal Qwen, fitur ini mendukung pengenalan multibahasa, pengenalan nyanyian, dan penolakan noise. Penggunaan | Referensi API
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Qwen3-ASR-Flash-Filetrans
Model | Versi | Bahasa yang didukung | Laju sampel yang didukung | Harga | Kuota gratis (Catatan) |
qwen3-asr-flash-filetrans Menyediakan kemampuan yang sama dengan qwen3-asr-flash-filetrans-2025-11-17. | Stable | Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia | Apa saja | $0,000035/detik | 36.000 detik (10 jam) Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
qwen3-asr-flash-filetrans-2025-11-17 | Snapshot |
Qwen3-ASR-Flash
Model | Versi | Bahasa yang didukung | Laju sampel yang didukung | Harga satuan | Kuota gratis (Catatan) |
qwen3-asr-flash Memiliki kemampuan yang sama dengan qwen3-asr-flash-2025-09-08. | Stable | Tiongkok (Mandarin, Sichuan, Minnan, Wu, Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia | Apa saja | $0,000035/detik | 36.000 detik (10 jam) Masa berlaku: Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
qwen3-asr-flash-2025-09-08 | Snapshot |
AS
Dalam mode penyebaran AS, titik akhir dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi dibatasi hanya di Amerika Serikat.
Model | Versi | Bahasa yang Didukung | Laju Sampel yang Didukung | Harga | Kuota Gratis (Catatan) |
qwen3-asr-flash-us Model ini menyediakan kemampuan yang sama dengan qwen3-asr-flash-2025-09-08-us. | Stable | Tiongkok (Mandarin, Sichuan, Minnan, Wu, Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia | Apa saja | $0,000035/detik | Tidak ada kuota gratis |
qwen3-asr-flash-2025-09-08-us | Snapshot |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Qwen3-ASR-Flash-Filetrans
Model | Versi | Bahasa yang didukung | Laju sampel yang didukung | Harga | Kuota gratis (Catatan) |
qwen3-asr-flash-filetrans Ekuivalen saat ini: qwen3-asr-flash-filetrans-2025-11-17 | Stable | Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia | Apa saja | $0,000032/detik | Tidak ada kuota gratis |
qwen3-asr-flash-filetrans-2025-11-17 | Snapshot |
Qwen3-ASR-Flash
Model | Versi | Bahasa yang Didukung | Laju Sampel yang Didukung | Harga | Kuota Gratis (Catatan) |
qwen3-asr-flash Fungsional identik dengan qwen3-asr-flash-2025-09-08. | Stable | Tiongkok (Mandarin, Sichuan, Minnan, Wu, Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia | Apa saja | $0,000032/detik | Tidak ada kuota gratis |
qwen3-asr-flash-2025-09-08 | Snapshot |
Pengenalan ucapan real-time Qwen
Model pengenalan ucapan real-time Qwen menyediakan deteksi bahasa otomatis. Model ini mendeteksi 11 jenis ucapan dan mentranskripsi audio secara akurat di lingkungan kompleks. Penggunaan | Referensi API
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Versi | Bahasa yang didukung | Laju sampel yang didukung | Harga | Kuota gratis (Catatan) |
qwen3-asr-flash-realtime Memiliki kemampuan yang sama dengan qwen3-asr-flash-realtime-2025-10-27. | Stable | Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia | 8 kHz, 16 kHz | $0,00009/detik | 36.000 detik (10 jam) Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
qwen3-asr-flash-realtime-2025-10-27 | Snapshot |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Versi | Bahasa yang didukung | Laju sampel yang didukung | Harga | Kuota gratis (Catatan) |
qwen3-asr-flash-realtime Model ini memiliki kemampuan yang setara dengan qwen3-asr-flash-realtime-2025-10-27. | Stable | Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia | 8 kHz, 16 kHz | $0,000047/detik | Tidak ada kuota gratis |
qwen3-asr-flash-realtime-2025-10-27 | Snapshot |
Pengenalan ucapan Paraformer
Paraformer adalah model pengenalan ucapan dari Tongyi Lab. Model ini tersedia dalam dua versi: pengenalan file audio dan pengenalan ucapan real-time.
Pengenalan file audio
Hanya mendukung mode penyebaran Tiongkok Daratan. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Bahasa yang Didukung | Laju Sampel yang Didukung | Skenario | Format Audio yang Didukung | Harga | Kuota gratis (Catatan) |
paraformer-v2 | Tiongkok (Mandarin, Kanton, Wu, Minnan, Timur Laut, Gansu, Guizhou, Henan, Hubei, Hunan, Ningxia, Shanxi, Shaanxi, Shandong, Sichuan, Tianjin, Jiangxi, Yunnan, Shanghai), Inggris, Jepang, Korea, Jerman, Prancis, Rusia | Apa saja | Live stream | aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, wmv | $0,000012/detik | Tidak ada kuota gratis |
paraformer-8k-v2 | Tiongkok (Mandarin) | 8 kHz | Panggilan telepon |
Pengenalan ucapan real-time
Hanya mendukung mode penyebaran Tiongkok Daratan. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Bahasa yang Didukung | Laju Sampel yang Didukung | Skenario | Format Audio yang Didukung | Harga | Kuota gratis (Catatan) |
paraformer-realtime-v2 | Tiongkok (Mandarin, Kanton, Wu, Minnan, Timur Laut, Gansu, Guizhou, Henan, Hubei, Hunan, Ningxia, Shanxi, Shaanxi, Shandong, Sichuan, Tianjin, Jiangxi, Yunnan, dan Shanghai), Inggris, Jepang, Korea, Jerman, Prancis, dan Rusia Anda dapat beralih di antara beberapa bahasa. | Apa saja | Streaming video langsung dan konferensi | pcm, wav, mp3, opus, speex, aac, amr | $0,000035/detik | Tidak ada kuota gratis |
paraformer-realtime-8k-v2 | Tiongkok (Mandarin) | 8 kHz | Pusat panggilan dan lainnya |
Pengenalan ucapan Fun-ASR
Fun-ASR adalah model pengenalan ucapan dari seri Tongyi Fun. Model ini tersedia dalam dua versi: pengenalan file audio dan pengenalan ucapan real-time.
Pengenalan file audio
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Version | Bahasa yang didukung | Laju sampel yang didukung | Skenario | Format audio yang didukung | Harga | Kuota gratis (Catatan) |
fun-asr Kemampuannya sama dengan fun-asr-2025-11-07. | Stable | Bahasa Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, dan Jin), aksen Mandarin dari wilayah seperti Zhongyuan, Barat Daya, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Timur Laut, Beijing, Hong Kong, dan Taiwan (termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia), bahasa Inggris, dan bahasa Jepang | Apa saja | Live stream, panggilan telepon, interpretasi konferensi, dan lainnya | aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, dan wmv | $0,000035/detik | 36.000 detik (10 jam) Berlaku selama 90 hari |
fun-asr-2025-11-07 Dibandingkan dengan fun-asr-2025-08-25, versi ini dioptimalkan untuk VAD jarak jauh guna meningkatkan akurasi pengenalan. | Snapshot | ||||||
fun-asr-2025-08-25 | Bahasa Tiongkok (Mandarin), bahasa Inggris | ||||||
fun-asr-mtl Kemampuannya sama dengan fun-asr-mtl-2025-08-25. | Stable | Bahasa Tiongkok (Mandarin dan Kanton), bahasa Inggris, Jepang, Korea, Vietnam, Indonesia, Thailand, Melayu, Filipina, Arab, Hindi, Bulgaria, Kroasia, Ceko, Denmark, Belanda, Estonia, Finlandia, Yunani, Hongaria, Irlandia, Latvia, Lituania, Malta, Polandia, Portugis, Rumania, Slowakia, Slovenia, dan Swedia | |||||
fun-asr-mtl-2025-08-25 | Snapshot |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Versi | Bahasa yang didukung | Laju sampel yang didukung | Skenario | Format audio yang didukung | Harga | Kuota gratis (Catatan) |
fun-asr Kemampuan yang sama dengan fun-asr-2025-11-07. | Stable | Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, dan Jin), aksen Mandarin dari wilayah seperti Zhongyuan, Barat Daya, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Timur Laut, Beijing, Hong Kong, dan Taiwan (termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia), Inggris, dan Jepang | Apa saja | Live stream, panggilan telepon, interpretasi konferensi, dan lainnya | aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, dan wmv | $0,000032/detik | Tidak ada kuota gratis |
fun-asr-2025-11-07 Dibandingkan dengan fun-asr-2025-08-25, versi ini dioptimalkan untuk VAD jarak jauh guna meningkatkan akurasi pengenalan. | Snapshot | ||||||
fun-asr-2025-08-25 | Tiongkok (Mandarin), Inggris | ||||||
fun-asr-mtl Kemampuan yang sama dengan fun-asr-mtl-2025-08-25. | Stable | Tiongkok (Mandarin dan Kanton), Inggris, Jepang, Korea, Vietnam, Indonesia, Thailand, Melayu, Filipina, Arab, Hindi, Bulgaria, Kroasia, Ceko, Denmark, Belanda, Estonia, Finlandia, Yunani, Hongaria, Irlandia, Latvia, Lithuania, Malta, Polandia, Portugis, Rumania, Slowakia, Slovenia, dan Swedia | |||||
fun-asr-mtl-2025-08-25 | Snapshot |
Pengenalan ucapan real-time
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Versi | Bahasa yang didukung | Laju sampel yang didukung | Skenario | Format audio yang didukung | Harga | Kuota gratis (Catatan) |
fun-asr-realtime Kemampuan model ini sama dengan fun-asr-realtime-2025-11-07. | Stable | Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, dan Jin), Inggris, dan Jepang. Model ini juga mendukung aksen Mandarin dari wilayah seperti Zhongyuan, Barat Daya, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Timur Laut, Beijing, Hong Kong, dan Taiwan. Selain itu, model ini mendukung aksen dari wilayah seperti Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia. | 16 kHz | Streaming video langsung, konferensi video, pusat panggilan, dan lainnya | pcm, wav, mp3, opus, speex, aac, dan amr | $0,00009/detik | 36.000 detik (10 jam) Berlaku selama 90 hari. |
fun-asr-realtime-2025-11-07 | Snapshot |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Version | Supported languages | Supported sample rates | Scenarios | Supported audio formats | Price | Free quota (Note) |
fun-asr-realtime Model ini memiliki kemampuan yang sama dengan fun-asr-realtime-2025-11-07. | Stable | Bahasa Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, dan Jin), Inggris, dan Jepang. Model ini juga mendukung aksen Mandarin dari wilayah seperti Zhongyuan, Southwest, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Northeast, Beijing, Hong Kong, dan Taiwan. Selain itu, model ini mendukung aksen dari wilayah seperti Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia. | 16 kHz | Live video streaming, video conferences, call centers, dan lainnya | pcm, wav, mp3, opus, speex, aac, dan amr | $0.000047/second | Tidak ada kuota gratis |
fun-asr-realtime-2025-11-07 Dibandingkan dengan fun-asr-realtime-2025-09-15, versi ini dioptimalkan untuk VAD jarak jauh guna meningkatkan akurasi pengenalan. | Snapshot | ||||||
fun-asr-realtime-2025-09-15 | Bahasa Tiongkok (Mandarin), Inggris |
Penyematan teks
Model penyematan teks mengonversi teks menjadi representasi numerik untuk tugas-tugas seperti pencarian, pengelompokan, rekomendasi, dan klasifikasi. Penagihan untuk model-model ini didasarkan pada jumlah token input. Referensi API
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapore. Sumber daya komputasi inferensi dijadwalkan secara global, tidak termasuk Tiongkok Daratan.
Model | Embedding dimensions | Batch size | Max tokens per batch (Catatan) | Supported languages | Harga (Juta input token) | Free quota (Catatan) |
text-embedding-v4 Bagian dari seri Qwen3-Embedding | 2.048, 1.536, 1.024 (default), 768, 512, 256, 128, atau 64 | 10 | 8.192 | Lebih dari 100 bahasa utama, seperti Chinese, English, Spanish, French, Portuguese, Indonesian, Japanese, Korean, German, dan Russian, serta berbagai bahasa pemrograman | $0,07 | 1 juta token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
text-embedding-v3 | 1.024 (default), 768, atau 512 | 10 | 8.192 | Lebih dari 50 bahasa, seperti Chinese, English, Spanish, French, Portuguese, Indonesian, Japanese, Korean, German, dan Russian | 500.000 token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Beijing. Sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.
Model | Dimensi penyematan | Ukuran batch | Token maks per batch (Catatan) | Bahasa yang didukung | Harga (Juta token input) | Kuota gratis |
text-embedding-v4 Bagian dari seri Qwen3-Embedding Batch separuh harga | 2.048, 1.536, 1.024 (default), 768, 512, 256, 128, atau 64 | 10 | 8.192 | Lebih dari 100 bahasa utama, termasuk Tiongkok, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, dan Rusia, serta berbagai bahasa pemrograman | $0,072 | Tidak ada kuota gratis |
Ukuran batch adalah jumlah maksimum teks yang dapat diproses dalam satu panggilan API. Misalnya, ukuran batch untuk text-embedding-v4 adalah 10. Artinya, satu permintaan dapat membuat vektor hingga 10 teks, dan setiap teks tidak boleh melebihi 8.192 token. Batasan ini berlaku untuk:
Input array string: Array dapat berisi hingga 10 elemen.
Input file: File teks dapat berisi hingga 10 baris teks.
Multimodal embedding
Model multimodal embedding mengonversi teks, gambar, dan video menjadi vektor bilangan titik mengambang. Model ini cocok untuk aplikasi seperti klasifikasi video, klasifikasi gambar, dan pengambilan gambar-teks. Referensi API
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapore. Sumber daya komputasi inferensi dijadwalkan secara global, tidak termasuk Tiongkok Daratan.
Model | Jenis data | Dimensi embedding | Harga satuan (per juta token input) | Kuota gratis (Catatan) |
tongyi-embedding-vision-plus | float(32) | 1.152 | $0,09 | 1 juta token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
tongyi-embedding-vision-flash | float(32) | 768 | Gambar/Video: $0,03 Teks: $0,09 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Beijing. Sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Jenis data | Dimensi embedding | Harga (per 1.000 token input) | Kuota gratis (Catatan) |
multimodal-embedding-v1 | float(32) | 1.024 | Uji coba gratis | Tanpa batas token |
Text rerank
Fitur ini biasanya digunakan untuk semantic retrieval. Diberikan sebuah kueri, fitur ini mengurutkan daftar dokumen kandidat dalam urutan menurun berdasarkan relevansi semantiknya. Referensi API
Internasional
Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapore. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.
Model | Jumlah Maksimum Dokumen | Token Input Maksimum per Item | Token Input Maksimum | Bahasa yang Didukung | Harga (per juta token input) |
qwen3-rerank | 500 | 4.000 | 30.000 | Lebih dari 100 bahasa utama, seperti Tionghoa, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, dan Rusia | $0,1 |
Token input maksimum per item: Setiap kueri atau dokumen dibatasi hingga 4.000 token. Input yang melebihi batas ini akan dipotong.
Jumlah maksimum dokumen: Setiap permintaan dibatasi hingga 500 dokumen.
Token input maksimum: Jumlah total token untuk semua kueri dan dokumen dalam satu permintaan dibatasi hingga 30.000.
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Beijing. Sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.
Model | Jumlah Maksimum Dokumen | Token Input Maksimum per Item | Token Input Maksimum | Bahasa yang Didukung | Harga (per Juta Token Input) |
gte-rerank-v2 | 500 | 4.000 | 30.000 | Lebih dari 50 bahasa, termasuk Tionghoa, Inggris, Jepang, Korea, Thailand, Spanyol, Prancis, Portugis, Jerman, Indonesia, dan Arab | $0,115 |
Token input maksimum per item: Setiap kueri atau dokumen dibatasi hingga 4.000 token. Input yang melebihi batas ini akan dipotong.
Jumlah maksimum dokumen: Setiap permintaan dibatasi hingga 500 dokumen.
Token input maksimum: Jumlah total token untuk semua kueri dan dokumen dalam satu permintaan dibatasi hingga 30.000.
Domain specific
Intent recognition
Model pengenalan maksud Qwen dapat mengurai maksud pengguna secara cepat dan akurat dalam hitungan milidetik serta memilih alat yang sesuai untuk menyelesaikan masalah pengguna. Referensi API | Penggunaan
Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
tongyi-intent-detect-v3 | 8.192 | 8.192 | 1.024 | $0,058 | $0,144 |
Role playing
Model role-playing Qwen sangat ideal untuk skenario yang memerlukan percakapan menyerupai manusia, seperti interaksi sosial virtual, NPC dalam game, replikasi karakter IP, perangkat keras, mainan, dan sistem dalam kendaraan. Dibandingkan model Qwen lainnya, model ini menawarkan kemampuan yang lebih baik dalam hal kesetiaan karakter, perkembangan percakapan, dan kemampuan mendengarkan secara empatik. Penggunaan
International
Dalam international deployment mode, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, kecuali Mainland China.
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
qwen-plus-character-ja | 8.192 | 7.680 | 512 | $0,5 | $1,4 |
Mainland China
Dalam deployment mode Mainland China, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
qwen-plus-character | 32.768 | 32.000 | 4.096 | $0,115 | $0,287 |

























































