Model unggulan
Internasional (Singapura)
Model unggulan |
Ideal untuk tugas kompleks. Model paling kuat. |
Keseimbangan antara performa, kecepatan, dan biaya. |
Ideal untuk pekerjaan sederhana. Cepat dan hemat biaya. |
Model kode yang sangat baik, unggul dalam pemanggilan alat dan interaksi lingkungan. |
Jendela konteks maksimum (Token) | 262,144 | 1,000,000 | 1,000,000 | 1,000,000 |
Harga input minimum (Juta token) | $1.2 | $0.4 | $0.05 | $0.3 |
Harga output minimum (Juta token) | $6 | $1.2 | $0.4 | $1.5 |
Tiongkok daratan (Beijing)
Model unggulan |
Ideal untuk tugas kompleks. Model paling kuat. |
Keseimbangan antara performa, kecepatan, dan biaya. |
Ideal untuk pekerjaan sederhana. Cepat dan hemat biaya. |
Model kode yang sangat baik, unggul dalam pemanggilan alat dan interaksi lingkungan. |
Jendela konteks maksimum (Token) | 262,144 | 1,000,000 | 1,000,000 | 1,000,000 |
Harga input minimum (Juta token) | $0.459 | $0.115 | $0.022 | $0.144 |
Harga output minimum (Juta token) | $1.836 | $0.287 | $0.216 | $0.574 |
Ikhtisar model
Internasional (Singapura)
Kategori | Subkategori | Deskripsi |
Generasi teks | Model bahasa besar Qwen: model komersial (Qwen-Max, Qwen-Plus, Qwen-Flash), model open-source (Qwen3, Qwen2.5) | |
Model pemahaman visual Qwen-VL, model penalaran visual QVQ, model omni-modal Qwen-Omni, dan model multi-modal real-time Qwen-Omni-Realtime | ||
Generasi gambar |
| |
| ||
Sintesis dan pengenalan ucapan | Qwen-TTS dan Qwen-TTS-Realtime dapat digunakan untuk teks-ke-ucapan dalam skenario seperti layanan pelanggan suara cerdas, buku audio, navigasi dalam mobil, dan bimbingan pendidikan. | |
Qwen-ASR-Realtime, Qwen-ASR, Qwen3-LiveTranslate-Flash-Realtime dan Fun-ASR dapat melakukan ucapan-ke-teks untuk skenario seperti catatan rapat real-time, keterangan siaran langsung real-time, dan layanan pelanggan telepon. | ||
Generasi video | Menghasilkan video berkualitas tinggi dengan gaya kaya dari satu kalimat. | |
| ||
Pengeditan video tujuan umum: Melakukan berbagai tugas pengeditan video berdasarkan input teks, gambar, dan video. Misalnya, dapat menghasilkan video baru dengan mengekstraksi fitur gerakan dari video input dan menggabungkannya dengan prompt. | ||
Embedding | Mengubah teks menjadi sekumpulan angka yang merepresentasikan teks tersebut. Cocok untuk tugas pencarian, pengelompokan, rekomendasi, dan klasifikasi. |
Tiongkok daratan (Beijing)
Kategori | Subkategori | Deskripsi |
Generasi teks | ||
Model pemahaman visual Qwen-VL, model penalaran visual QVQ, dan model omni-modal Qwen-Omni | ||
Model kode, Model matematika, Model terjemahan, Model penambangan data, Model riset, Model pengenalan maksud, Model role-playing | ||
Generasi gambar |
| |
Model tujuan umum:
Model lainnya: Terjemahan Gambar Qwen, OutfitAnyone | ||
Sintesis dan pengenalan ucapan | Qwen-TTS, Qwen-TTS-Realtime, dan CosyVoice mengubah teks menjadi ucapan untuk skenario seperti layanan pelanggan berbasis suara, buku audio, navigasi dalam mobil, dan bimbingan pendidikan. | |
Qwen-ASR-Realtime, Qwen-ASR, Fun-ASR, dan Paraformer mengubah ucapan menjadi teks untuk skenario seperti transkripsi rapat real-time, keterangan siaran langsung real-time, dan panggilan layanan pelanggan. | ||
Pengeditan dan generasi video | Menghasilkan video berkualitas tinggi dengan gaya kaya dari satu kalimat. | |
| ||
| ||
Embedding | Mengubah teks menjadi sekumpulan angka yang merepresentasikan teks tersebut. Digunakan untuk pencarian, pengelompokan, rekomendasi, dan klasifikasi. | |
Mengubah teks, gambar, dan ucapan menjadi sekumpulan angka. Digunakan untuk klasifikasi audio dan video, klasifikasi gambar, dan pengambilan gambar-teks. |
Generasi teks - Qwen
Berikut adalah model komersial Qwen. Dibandingkan dengan versi open-source, model komersial menawarkan kemampuan dan peningkatan terbaru.
Ukuran parameter model komersial tidak diungkapkan.
Setiap model diperbarui secara berkala. Untuk menggunakan versi tetap, Anda dapat memilih versi snapshot. Versi snapshot biasanya dipertahankan selama satu bulan setelah rilis versi snapshot berikutnya.
Kami merekomendasikan agar Anda menggunakan versi stabil atau terbaru untuk kondisi pembatasan laju yang lebih longgar.
Qwen-Max
Model dengan performa terbaik dalam seri Qwen, cocok untuk tugas kompleks multi-langkah. Penggunaan | Referensi API | Coba online
Internasional (Singapura)
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Keluaran Maksimum | Biaya input | Biaya output | Kuota gratis |
(Token) | (Juta token) | ||||||||
qwen3-max Saat ini memiliki kemampuan yang sama dengan qwen3-max-2025-09-23 Pemanggilan batch separuh harga | Stabil | Hanya non-thinking | 262,144 | 258,048 | - | 65,536 | Harga bertingkat, lihat deskripsi di bawah. | 1 juta token masing-masing Berlaku selama 90 hari setelah aktivasi | |
qwen3-max-2025-09-23 | Snapshot | Hanya non-thinking | |||||||
qwen3-max-preview | Pratinjau | Thinking | 81,920 | 32,768 | |||||
Non-thinking | - | 65,536 | |||||||
Penagihan untuk model yang tercantum di atas bertingkat berdasarkan jumlah token input per permintaan.
Token input per permintaan | Harga input (Juta token) qwen3-max dan qwen3-max-preview mendukung cache konteks. | Harga output (Juta token) |
0 < Token ≤ 32K | $1.2 | $6 |
32K < Token ≤ 128K | $2.4 | $12 |
128K < Token ≤ 252K | $3 | $15 |
Tiongkok daratan (Beijing)
Model | Versi | Mode | Jendela konteks | Input maks | Rantai-pikiran maks | Output maksimum | Biaya input | Biaya output |
(Token) | (Juta token) | |||||||
qwen3-max Saat ini memiliki kemampuan yang sama dengan qwen3-max-2025-09-23 Pemanggilan batch separuh harga | Stabil | Hanya non-thinking | 262,144 | 258,048 | - | 65,536 | Harga bertingkat, lihat deskripsi di bawah. | |
qwen3-max-2025-09-23 | Snapshot | Hanya non-thinking | ||||||
qwen3-max-preview | Pratinjau | Thinking | 81,920 | 32,768 | ||||
Non-thinking | - | 65,536 | ||||||
Penagihan untuk model yang tercantum di atas bertingkat berdasarkan jumlah token input per permintaan.
Model | Token input per permintaan | Harga input (Juta token) | Harga output (Juta token) Rantai-pikiran + respons |
qwen3-max panggilan batch separuh harga Diskon cache konteks | 0 < Token ≤ 32K | $0.459 | $1.836 |
32K < Token ≤ 128K | $0.918 | $3.672 | |
128K < Token ≤ 252K | $1.377 | $5.508 | |
qwen3-max-2025-09-23 | 0 < Token ≤ 32K | $0.861 | $3.441 |
32K < Token ≤ 128K | $1.434 | $5.735 | |
128K < Token ≤ 252K | $2.151 | $8.602 | |
qwen3-max-preview Diskon cache konteks | 0 < Token ≤ 32K | $0.861 | $3.441 |
32K < Token ≤ 128K | $1.434 | $5.735 | |
128K < Token ≤ 252K | $2.151 | $8.602 |
Mode thinking dari qwen3-max-preview secara signifikan meningkatkan kemampuan inferensi secara keseluruhan dan unggul dalam pemrograman agen, penalaran akal sehat, matematika, sains, dan tugas umum.
Qwen-Plus
Model seimbang yang menawarkan performa, biaya, dan kecepatan antara Qwen-Max dan Qwen-Flash. Cocok untuk tugas yang cukup kompleks. Penggunaan | Referensi API | Coba online | Penalaran mendalam
Internasional (Singapura)
Model | Versi | Jendela konteks | Input maks | Output maks | Biaya input | Biaya output | Kuota gratis |
(Token) | (Juta token) | ||||||
qwen-plus Saat ini memiliki kemampuan yang sama dengan qwen-plus-2025-07-28 Bagian dari seri Qwen3 | Stabil | 1,000,000 | Mode berpikir 995,904 Mode tanpa pemikiran 997,952 Nilai default adalah 262,144. Anda dapat menyesuaikan nilai ini menggunakan parameter max_input_tokens. | 32,768 Rantai-pikiran maks: 81,920 | Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat catatan di bawah tabel. | 1 juta token untuk input dan output masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. | |
qwen-plus-latest Saat ini memiliki kemampuan yang sama dengan qwen-plus-2025-07-28 Bagian dari seri Qwen3 | Terbaru | Mode thinking 995,904 Mode tanpa berpikir 997,952 | |||||
qwen-plus-2025-09-11 Bagian dari seri Qwen3. | Snapshot | Mode Berpikir 995,904 Mode Tanpa Berpikir 997,952 | |||||
qwen-plus-2025-07-28 juga dikenal sebagai qwen-plus-0728 Bagian dari seri Qwen3 | |||||||
qwen-plus-2025-07-14 juga dikenal sebagai qwen-plus-0714 Bagian dari seri Qwen3 | 131,072 | Mode thinking 98,304 Mode tanpa pemikiran 129,024 | 16,384 Rantai-pikiran maks: 38,912 | $0.4 | Mode thinking $4 Mode non-thinking $1.2 | ||
qwen-plus-2025-04-28 juga dikenal sebagai qwen-plus-0428 Bagian dari seri Qwen3 | |||||||
qwen-plus-2025-01-25 juga dikenal sebagai qwen-plus-0125 | 129,024 | 8,192 | $1.2 | ||||
Penagihan untuk qwen-plus, qwen-plus-latest, qwen-plus-2025-09-11, dan qwen-plus-2025-07-28 bertingkat berdasarkan jumlah token input per permintaan.
Token input per permintaan | Harga input (Juta token) | Mode | Harga output (Juta token) |
0 < Token ≤ 256K | $0.4 | Mode non-thinking | $1.2 |
Mode thinking | $4 | ||
256K < Token ≤ 1M | $1.2 | Mode non-thinking | $3.6 |
Mode thinking | $12 |
Tiongkok daratan (Beijing)
Model | Versi | Jendela konteks | Input Maksimum | Output maks | Biaya input | Biaya output |
(Token) | (Juta token) | |||||
qwen-plus Saat ini memiliki kemampuan yang sama dengan qwen-plus-2025-07-28 Bagian dari seri Qwen3 | Stabil | 1,000,000 | Mode thinking 995,904 Mode Tanpa Berpikir 997,952 Nilai default adalah 131,072. Anda dapat menyesuaikan nilai ini menggunakan parameter max_input_tokens. | 32,768 Rantai-pikiran maks: 81,920 | Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat catatan di bawah tabel. | |
qwen-plus-latest Saat ini memiliki kemampuan yang sama dengan qwen-plus-2025-07-28 Bagian dari seri Qwen3 | Terbaru | Mode berpikir 995,904 Non-Thinking Mode 997,952 | ||||
qwen-plus-2025-09-11 Bagian dari seri Qwen3 | Snapshot | Mode berpikir 995,904 Mode Tanpa Berpikir 997,952 | ||||
qwen-plus-2025-07-28 juga dikenal sebagai qwen-plus-0728 Bagian dari seri Qwen3 | ||||||
qwen-plus-2025-07-14 juga dikenal sebagai qwen-plus-0714 Bagian dari seri Qwen3 | 131,072 | Mode berpikir 98,304 Mode tanpa berpikir 129,024 | 16,384 Rantai-pikiran maks: 38,912 | $0.115 | Mode berpikir $1.147 Non-thinking mode $0.287 | |
qwen-plus-2025-04-28 juga dikenal sebagai qwen-plus-0428 Bagian dari seri Qwen3 | ||||||
Penagihan untuk qwen-plus, qwen-plus-latest, qwen-plus-2025-09-11, dan qwen-plus-2025-07-28 bertingkat berdasarkan jumlah token input per permintaan.
Token input per permintaan | Harga input (Juta token) | Mode | Harga output (Juta token) |
0 < Token ≤ 128K | $0.115 | Mode non-thinking | $0.287 |
Mode thinking | $1.147 | ||
128K < Token ≤ 256K | $0.345 | Mode non-thinking | $2.868 |
Mode thinking | $3.441 | ||
256K < Token ≤ 1M | $0.689 | Mode non-thinking | $6.881 |
Mode thinking | $9.175 |
Model-model ini mendukung mode thinking dan non-thinking. Anda dapat beralih di antara keduanya menggunakan parameter enable_thinking. Selain itu, kemampuan model ditingkatkan secara signifikan:
Kemampuan penalaran: Dalam evaluasi untuk matematika, kode, dan penalaran logis, model ini secara signifikan melampaui QwQ dan model lain dengan ukuran serupa tanpa mode penalaran. Model ini mencapai performa tingkat atas di industri untuk model sekelasnya.
Penyelarasan preferensi manusia: Model ini menunjukkan peningkatan signifikan dalam penulisan kreatif, asumsi peran, percakapan multi-putaran, dan mengikuti instruksi. Kemampuan umumnya jauh lebih baik dibandingkan model lain dengan ukuran serupa.
Kemampuan agen: Model ini mencapai performa terdepan di industri dalam mode thinking maupun non-thinking dan dapat memanggil alat eksternal secara akurat.
Kemampuan multibahasa: Model ini mendukung lebih dari 100 bahasa dan dialek. Kemampuannya dalam terjemahan multibahasa, pemahaman instruksi, dan penalaran akal sehat ditingkatkan secara signifikan.
Format respons: Versi ini memperbaiki masalah format respons dari versi sebelumnya, seperti format Markdown yang salah, pemotongan prematur, dan output kotak yang tidak tepat.
Untuk model yang tercantum di atas, jika Anda mengaktifkan mode thinking tetapi proses berpikir tidak dihasilkan, Anda akan dikenakan biaya berdasarkan harga untuk mode non-thinking.
Qwen-Flash
Model tercepat dan paling hemat biaya dalam seri Qwen, ideal untuk pekerjaan sederhana. Qwen-Flash menawarkan harga berjenjang yang fleksibel, sehingga lebih hemat biaya dibandingkan Qwen-Turbo. Penggunaan | Referensi API | Coba secara online | Mode berpikir
Internasional (Singapura)
Model | Version | Mode | Context window | Max input | Max chain-of-thought | Max output | Input cost | Output cost Chain-of-thought + Outputs | Free quota |
(Tokens) | (1,000 tokens) | ||||||||
qwen-flash Kemampuan sama dengan qwen-flash-2025-07-28 Bagian dari seri Qwen3. Batch calls dikenai biaya separuh dari harga standar. | Stable | Thinking | 1.000.000 | 995.904 | 81.920 | 32.768 | Harga berjenjang. Lihat penjelasan di bawah tabel. | 1 juta token masing-masing Berlaku selama 90 hari setelah mengaktifkan Alibaba Cloud Model Studio. | |
Non-thinking | 997.952 | - | |||||||
qwen-flash-2025-07-28 Bagian dari seri Qwen3. | Snapshot | Thinking | 995.904 | 81.920 | |||||
Non-thinking | 997.952 | - | |||||||
Penagihan untuk model yang tercantum di atas diterapkan secara berjenjang berdasarkan jumlah input token per request. qwen-flash mendukung context cache dan batch calls.
Input tokens per request | Input price (Million tokens) | Output price (Million tokens) |
0< Tokens ≤256K | $0,05 | $0,4 |
256K< Tokens ≤1M | Rp0,25 | $2 |
Wilayah Tiongkok Daratan (Beijing)
Model | Version | Mode | Context window | Max input | Max chain-of-thought | Max output | Input cost | Output cost Chain-of-thought + Outputs |
(Tokens) | (1,000 tokens) | |||||||
qwen-flash Kemampuan sama dengan qwen-flash-2025-07-28 Bagian dari seri Qwen3 | Stable | Thinking | 1.000.000 | 995.904 | 81.920 | 32.768 | Harga berjenjang. Lihat penjelasan di bawah tabel. | |
Non-thinking | 997.952 | - | ||||||
qwen-flash-2025-07-28 Bagian dari seri Qwen3 | Snapshot | Thinking | 995.904 | 81.920 | ||||
Non-thinking | 997.952 | - | ||||||
Penagihan untuk model yang tercantum di atas diterapkan secara berjenjang berdasarkan jumlah input token per request. qwen-flash mendukung context cache.
Input tokens per request | Input price (Million tokens) | Output price (Million tokens) |
0< Tokens ≤128K | $0,022 | $0,216 |
128K< Tokens ≤256K | $0,087 | $0,861 |
256K< Tokens ≤1M | $0,173 | $1,721 |
Qwen-Turbo
Qwen-Turbo tidak akan lagi menerima pembaruan. Kami menyarankan Anda menggantinya dengan Qwen-Flash. Qwen-Flash menggunakan model harga tiered yang fleksibel, sehingga menawarkan struktur harga yang lebih granular. Penggunaan | Referensi API | Coba secara online | Deep thinking
Internasional (Singapura)
Model | Version | Context window | Max input | Max output | Input cost | Output cost | Free quota |
(Tokens) | (Million tokens) | ||||||
qwen-turbo Saat ini memiliki kemampuan yang sama dengan qwen-turbo-2025-04-28 Bagian dari seri Qwen3 | Stable | Thinking mode 131.072 Non-thinking mode 1.000.000 | Thinking mode 98.304 Non-thinking mode 1.000.000 | 16.384 Max chain-of-thought adalah 38.912 | $0,05 Batch calls setengah harga | Thinking mode: $0,5 Non-thinking mode: $0,2 Batch calls setengah harga | 1 juta token untuk masing-masing Masa berlaku: 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
qwen-turbo-latest Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru Bagian dari seri Qwen3 | Latest | $0,05 | Thinking mode: $0,5 Non-thinking mode: $0,2 | ||||
qwen-turbo-2025-04-28 Juga dikenal sebagai qwen-turbo-0428 Bagian dari seri Qwen3 | Snapshot | ||||||
qwen-turbo-2024-11-01 Juga dikenal sebagai qwen-turbo-1101 | 1.000.000 | 1.000.000 | 8.192 | $0,2 | |||
Tiongkok Daratan (Beijing)
Model | Version | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | |||||
qwen-turbo Saat ini memiliki kemampuan yang sama dengan qwen-turbo-2025-04-28 Bagian dari seri Qwen3 | Stable | Thinking mode 131.072 Non-thinking mode 1.000.000 | Thinking mode 98.304 Non-thinking mode 1.000.000 | 16.384 Max chain-of-thought adalah 38.912 | $0,044 | Thinking mode $0,431 Non-thinking mode $0,087 |
qwen-turbo-latest Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru Bagian dari seri Qwen3 | Latest | |||||
qwen-turbo-2025-07-15 Juga dikenal sebagai qwen-turbo-0715 Bagian dari seri Qwen3 | Snapshot | |||||
qwen-turbo-2025-04-28 Juga dikenal sebagai qwen-turbo-0428 Bagian dari seri Qwen3 | ||||||
QwQ
Model penalaran QwQ dilatih berdasarkan model Qwen2.5 dan menggunakan Pembelajaran Penguatan untuk meningkatkan kemampuan penalarannya secara signifikan. Metrik inti model ini untuk matematika dan kode, seperti AIME 24/25 dan LiveCodeBench, serta beberapa metrik umum, seperti IFEval dan LiveBench, setara dengan versi performa penuh DeepSeek-R1. Penggunaan
Singapura
Model | Version | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost | Free quota |
(Tokens) | (Million tokens) | |||||||
qwq-plus | Stable | 131.072 | 98.304 | 32.768 | 8.192 | $0,8 | $2,4 | 1 juta token Masa berlaku: Dalam waktu 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio. |
China Daratan (Beijing)
Model | Version | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||||
qwq-plus Kemampuan yang sama dengan qwq-plus-2025-03-05. | Stable | 131.072 | 98.304 | 32,768 | 8.192 | $0,230 | $0,574 |
qwq-plus-latest Selalu memiliki kemampuan yang sama dengan versi Snapshot terbaru. | Latest | ||||||
qwq-plus-2025-03-05 Juga dikenal sebagai qwq-plus-0305. | Snapshot | ||||||
Qwen-Long
Model Qwen-Long memiliki jendela konteks terpanjang di seri Qwen. Model ini menawarkan performa yang seimbang dengan biaya rendah. Model ini ideal untuk tugas-tugas seperti analisis teks panjang, ekstraksi informasi, peringkasan, klasifikasi, dan penandaan. Penggunaan | Coba online
China (Beijing)
Model | Version | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | |||||
qwen-long-latest Selalu sesuai dengan kemampuan versi snapshot terbaru. | Stable | 10.000.000 | 10.000.000 | 8.192 | $0,072 | $0,287 |
qwen-long-2025-01-25 Juga dikenal sebagai qwen-long-0125. | Snapshot | |||||
Qwen-Omni
Model Qwen-Omni menerima input gabungan dari berbagai modalitas, seperti teks, citra, audio, dan video, serta menghasilkan tanggapan dalam format teks atau ucapan. Model ini menyediakan berbagai suara ekspresif yang menyerupai manusia dan mendukung output audio dalam berbagai bahasa dan dialek. Anda dapat menggunakannya dalam skenario obrolan audio dan video, seperti untuk pengenalan visual, analisis sentimen, serta pendidikan dan pelatihan. Penggunaan | Referensi API
Singapura
Model | Version | Mode | Context window | Max input | Max chain-of-thought | Max output | Kuota gratis |
(Tokens) | |||||||
qwen3-omni-flash Saat ini memiliki kemampuan yang sama dengan qwen3-omni-flash-2025-09-15 | Stable | Thinking mode | 65.536 | 16.384 | 32.768 | 16.384 | 1 juta token masing-masing (modality-agnostic) Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
Non-thinking mode | 49.152 | - | |||||
qwen3-omni-flash-2025-09-15 Juga dikenal sebagai qwen3-omni-flash-0915 | Snapshot | Thinking mode | 65.536 | 16.384 | 32.768 | 16.384 | |
Non-thinking mode | 49.152 | - | |||||
Setelah kuota gratis Anda habis, aturan penagihan berikut berlaku untuk input dan output. Penagihan sama untuk mode thinking maupun non-thinking. Output audio tidak didukung dalam thinking mode.
|
|
Daratan Tiongkok (Beijing)
Model | Version | Mode | Context window | Max input | Max chain-of-thought | Max output | Kuota gratis |
(Tokens) | |||||||
qwen3-omni-flash Saat ini memiliki kemampuan yang sama dengan qwen3-omni-flash-2025-09-15. | Stable | Thinking mode | 65.536 | 16.384 | 32.768 | 16.384 | Tidak ada kuota gratis |
Non-thinking mode | 49,152 | - | |||||
qwen3-omni-flash-2025-09-15 Juga dikenal sebagai qwen3-omni-flash-0915. | Snapshot | Thinking mode | 65.536 | 16.384 | 32.768 | 16.384 | |
Non-thinking mode | 49.152 | - | |||||
Setelah kuota gratis Anda habis, input dan output ditagih sesuai aturan berikut. Penagihan sama untuk mode thinking maupun non-thinking. Output audio tidak didukung dalam thinking mode.
|
|
Model Qwen3-Omni-Flash menawarkan peningkatan signifikan dibandingkan Qwen-Omni-Turbo, yang tidak lagi diperbarui:
Ini adalah model hybrid thinking yang mendukung mode thinking dan non-thinking. Anda dapat beralih antar mode menggunakan parameter
enable_thinking. Secara default, mode thinking dinonaktifkan.Output audio tidak didukung dalam thinking mode. Dalam non-thinking mode, output audio dari model memiliki fitur-fitur berikut:
Mendukung 17 suara, meningkat dari 4 suara yang didukung oleh Qwen-Omni-Turbo.
Mendukung 10 bahasa, meningkat dari 2 bahasa yang didukung oleh Qwen-Omni-Turbo.
Qwen-Omni-Realtime
Dibandingkan dengan Qwen Omni, model-model ini mendukung input aliran audio. Model ini memiliki fitur Voice Activity Detection (VAD) bawaan yang secara otomatis mendeteksi awal dan akhir ucapan pengguna. Penggunaan | Event klien | Event server
Internasional (Singapura)
Model | Version | Context window | Max input | Max output | Kuota gratis |
(Tokens) | |||||
qwen3-omni-flash-realtime Setara dengan qwen3-omni-flash-realtime-2025-09-15 | Stable | 65.536 | 49.152 | 16.384 | 1 juta token masing-masing, terlepas dari modalitas Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio |
qwen3-omni-flash-realtime-2025-09-15 | Snapshot | ||||
Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:
|
|
Tiongkok Daratan (Beijing)
Model | Version | Context window | Max input | Max output | Kuota gratis |
(Tokens) | |||||
qwen3-omni-flash-realtime Setara dengan qwen3-omni-flash-realtime-2025-09-15 | Stable | 65.536 | 49.152 | 16.384 | Tidak ada kuota gratis |
qwen3-omni-flash-realtime-2025-09-15 | Snapshot | ||||
Aturan penagihan berikut berlaku untuk input dan output:
|
|
Model Qwen3-Omni-Flash-Realtime direkomendasikan. Model ini menawarkan kemampuan yang jauh lebih baik dibandingkan Qwen-Omni-Turbo-Realtime, yang tidak akan lagi diperbarui. Untuk output audio dari model:
Model ini mendukung 17 voice. Qwen-Omni-Turbo-Realtime hanya mendukung 4.
Model ini mendukung 10 bahasa. Qwen-Omni-Turbo-Realtime hanya mendukung 2.
QVQ
QVQ adalah model penalaran visual yang mendukung input visual dan output rantai-pikiran. Model ini menghadirkan performa unggul dalam bidang matematika, pemrograman, analisis visual, tugas kreatif, serta tugas umum. Penggunaan | Coba secara online
Internasional (Singapura)
Model | Version | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost | Free quota |
(Tokens) | (Million tokens) | |||||||
qvq-max Setara dengan qvq-max-2025-03-25. | Stable | 131.072 | 106.496 Maksimum 16.384 token untuk satu citra. | 16.384 | 8.192 | $1,2 | $4,8 | 1 juta token masing-masing. Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio. |
qvq-max-latest Selalu setara dengan versi snapshot terbaru. | Latest | |||||||
qvq-max-2025-03-25 Juga dikenal sebagai qvq-max-0325. | Snapshot | |||||||
China Daratan (Beijing)
Model | Version | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||||
qvq-max Menawarkan kemampuan penalaran visual dan pemahaman instruksi yang lebih kuat dibandingkan qvq-plus, memberikan performa optimal untuk tugas yang lebih kompleks. Memiliki kemampuan yang sama dengan qvq-max-2025-03-25. | Stable | 131.072 | 106.496 Maksimum 16.384 untuk satu citra. | 16.384 | 8.192 | $1,147 | $4,588 |
qvq-max-latest Selalu memiliki kemampuan yang sama dengan versi Snapshot terbaru. | Latest | ||||||
qvq-max-2025-05-15 Juga dikenal sebagai qvq-max-0515. | Snapshot | ||||||
qvq-max-2025-03-25 Juga dikenal sebagai qvq-max-0325. | |||||||
qvq-plus Memiliki kemampuan yang sama dengan qvq-plus-2025-05-15. | Stable | $0,287 | $0,717 | ||||
qvq-plus-latest Selalu memiliki kemampuan yang sama dengan versi Snapshot terbaru. | Latest | ||||||
qvq-plus-2025-05-15 Juga dikenal sebagai qvq-plus-0515. | Snapshot | ||||||
Qwen-VL
Qwen-VL adalah model generasi teks dengan kemampuan pemahaman visual (citra). Model ini tidak hanya melakukan Optical Character Recognition (OCR), tetapi juga menyediakan ringkasan dan penalaran lebih lanjut, seperti mengekstraksi properti dari foto produk atau menyelesaikan masalah yang ditampilkan dalam diagram. Penggunaan | Referensi API | Coba secara online
Model Qwen-VL ditagih berdasarkan jumlah total token input dan output. Untuk informasi lebih lanjut mengenai cara perhitungan token citra, lihat Pemahaman visual.
Internasional (Singapura)
Model | Version | Mode | Context window | Max input | Max chain-of-thought | Max output | Input cost | Output cost (Chain-of-thought + Output) | Free quota |
(Tokens) | (Million tokens) | ||||||||
qwen3-vl-plus Kemampuan yang sama dengan qwen3-vl-plus-2025-09-23 | Stable | thinking | 262.144 | 258.048 Maksimum 16.384 token per citra | 81.920 | 32.768 | Harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel. | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio. | |
non-thinking | 260.096 Maksimum 16.384 token per citra | - | |||||||
qwen3-vl-plus-2025-09-23 | Snapshot | thinking | 258.048 Maksimum 16.384 token per citra | 81.920 | |||||
non-thinking | 260.096 Maksimum 16.384 token per citra | - | |||||||
qwen3-vl-flash Kemampuan yang sama dengan qwen3-vl-flash-2025-10-15 | Stable | thinking | 258.048 Maksimum 16.384 token per citra | 81.920 | |||||
non-thinking | 260.096 Maksimum 16.384 token per citra | - | |||||||
qwen3-vl-flash-2025-10-15 | Snapshot | thinking | 258.048 Maksimum 16.384 token per citra | 81.920 | |||||
non-thinking | 260.096 Maksimum 16.384 token per citra | - | |||||||
Model-model yang tercantum di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.
Seri qwen3-vl-plus
Input tokens per request | Input price (Million tokens) | Output price (Million tokens) |
0 < Tokens ≤ 32K | Rp0,20 | $1,60 |
32K < Tokens ≤ 128K | Rp0,30 | $2,40 |
128K < Tokens ≤ 256K | $0,60 | $4,80 |
Seri qwen3-vl-flash
Input tokens per request | Input price (Million tokens) | Output price (Million tokens) |
0 < Tokens ≤ 32K | $0,05 | $0,40 |
32K < Tokens ≤ 128K | $0,075 | Rp0,60 |
128K < Tokens ≤ 256K | $0,12 | $0,96 |
Tiongkok Daratan (Beijing)
Model | Version | Mode | Context window | Max input | Max chain-of-thought | Max output | Input cost | Output cost | Free quota |
(Tokens) | (Million tokens) | ||||||||
qwen3-vl-plus Kemampuan yang sama dengan qwen3-vl-plus-2025-09-23 | Stable | thinking | 262.144 | 258.048 Maksimum 16.384 token per citra | 81.920 | 32.768 | Harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel. | Tidak ada kuota gratis | |
non-thinking | 260.096 Maksimum 16.384 token per citra | - | |||||||
qwen3-vl-plus-2025-09-23 | Snapshot | thinking | 258.048 Maksimum 16.384 token per citra | 81.920 | |||||
non-thinking | 260.096 Maksimum 16.384 token per citra | - | |||||||
qwen3-vl-flash Kemampuan yang sama dengan qwen3-vl-flash-2025-10-15 | Stable | thinking | 258.048 Maksimum 16.384 token per citra | 81.920 | |||||
non-thinking | 260.096 Maksimum 16.384 token per citra | - | |||||||
qwen3-vl-flash-2025-10-15 | Snapshot | thinking | 258.048 Maksimum 16.384 token per citra | 81.920 | |||||
non-thinking | 260.096 Maksimum 16.384 token per citra | - | |||||||
Model-model yang tercantum di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.
Seri qwen3-vl-plus
Input tokens per request | Input price (Million tokens) | Output price (Million tokens) |
0 < Tokens ≤ 32K | $0,143353 | $1,433525 |
32K < Tokens ≤ 128K | $0,215029 | $2,150288 |
128K < Tokens ≤ 256K | $0,430058 | $4,300576 |
Seri qwen3-vl-flash
Input tokens per request | Input price (per 1M tokens) | Output price (per 1M tokens) |
0 < Tokens ≤ 32K | $0,022 | $0,215 |
32K < Tokens ≤ 128K | $0,043 | $0,43 |
128K < Tokens ≤ 256K | $0,086 | $0,859 |
Qwen-OCR
Model Qwen-OCR dirancang untuk ekstraksi teks. Dibandingkan dengan model Qwen-VL, model ini mengkhususkan diri dalam mengekstraksi teks dari citra dokumen, tabel, lembar ujian, dan tulisan tangan. Model ini dapat mengenali beberapa bahasa, seperti Inggris, Prancis, Jepang, Korea, Jerman, Rusia, dan Italia. Penggunaan | Referensi API | Coba secara online
Internasional (Singapura)
Model | Version | Context window | Max input | Max output | Input cost | Output cost | Kuota gratis |
(Tokens) | (Juta token) | ||||||
qwen-vl-ocr | Stable | 34.096 | 30.000 Hingga 30.000 per citra | 4.096 | $0,72 | $0,72 | 1 juta token masing-masing Berlaku selama 90 hari setelah aktivasi. |
qwen-vl-ocr-2025-11-20 Juga dikenal sebagai qwen-vl-ocr-1120 Berdasarkan Qwen3-VL. Secara signifikan meningkatkan penguraian dokumen dan pelokalan teks. | Snapshot | 38.192 | 8.192 | $0,07 | $0,16 | ||
China Daratan (Beijing)
Model | Version | Context window | Max input | Max output | Input cost | Output cost | Kuota gratis |
(Tokens) | (Juta token) | ||||||
qwen-vl-ocr Saat ini memiliki kemampuan yang sama dengan qwen-vl-ocr-2025-08-28 | Stable | 34.096 | 30.000 Hingga 30.000 per citra | 4.096 | $0,717 | $0,717 | Tidak ada kuota gratis |
qwen-vl-ocr-latest Selalu memiliki kemampuan yang sama dengan Snapshot terbaru | Latest | 38.192 | 8.192 | $0,043 | $0,072 | ||
qwen-vl-ocr-2025-11-20 Juga dikenal sebagai qwen-vl-ocr-1120 Berdasarkan Qwen3-VL. Secara signifikan meningkatkan penguraian dokumen dan lokalisasi teks. | Snapshot | ||||||
qwen-vl-ocr-2025-08-28 Juga dikenal sebagai qwen-vl-ocr-0828 | 34.096 | 4.096 | $0,717 | $0,717 | |||
qwen-vl-ocr-2025-04-13 Juga dikenal sebagai qwen-vl-ocr-0413 | |||||||
qwen-vl-ocr-2024-10-28 Juga dikenal sebagai qwen-vl-ocr-1028 | |||||||
Qwen-Math
Qwen-Math adalah model bahasa yang dirancang untuk menyelesaikan soal matematika. Penggunaan | Referensi API | Coba secara online
Model ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Versi | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | |||||
qwen-math-plus Kemampuan yang sama dengan qwen-math-plus-2024-09-19. | Stable | 4.096 | 3.072 | 3.072 | $0,574 | $1,721 |
qwen-math-plus-latest Kemampuan yang sama dengan Snapshot terbaru. | Latest | |||||
qwen-math-plus-2024-09-19 Juga dikenal sebagai qwen-math-plus-0919. | Snapshot | |||||
qwen-math-plus-2024-08-16 Juga dikenal sebagai qwen-math-plus-0816. | ||||||
qwen-math-turbo Kemampuan yang sama dengan qwen-math-turbo-2024-09-19. | Stable | $0,287 | $0,861 | |||
qwen-math-turbo-latest Kemampuan yang sama dengan Snapshot terbaru. | Latest | |||||
qwen-math-turbo-2024-09-19 Juga dikenal sebagai qwen-math-turbo-0919. | Snapshot | |||||
Qwen-Coder
Model seri Qwen3-Coder-Plus terbaru adalah model generasi kode Qwen yang dibangun di atas Qwen3. Model ini merupakan agen pemrograman yang andal, unggul dalam pemanggilan tool dan interaksi lingkungan. Model-model ini dapat memprogram secara otonom serta menyediakan kemampuan coding dan serbaguna yang luar biasa. Penggunaan | Referensi API | Coba online
Internasional (Singapura)
Model | Version | Context window | Max input | Max output | Input cost (Million tokens) | Output cost (Million tokens) | Free quota |
Tokens | Per million tokens | ||||||
qwen3-coder-plus Saat ini setara dengan qwen3-coder-plus-2025-07-22 | Stable | 1.000.000 | 997.952 | 65.536 | Harga bertingkat. Lihat penjelasan di bawah tabel. | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio | |
qwen3-coder-plus-2025-09-23 | Snapshot | ||||||
qwen3-coder-plus-2025-07-22 | Snapshot | ||||||
qwen3-coder-flash Saat ini setara dengan qwen3-coder-flash-2025-07-28 | Stable | ||||||
qwen3-coder-flash-2025-07-28 | Snapshot | ||||||
Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input per permintaan.
seri qwen3-coder-plus
Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. Model qwen3-coder-plus mendukung context cache. Teks input yang mengenai implicit cache ditagih sebesar 20% dari harga satuan. Teks input yang mengenai explicit cache ditagih sebesar 10% dari harga satuan.
Input tokens per request | Input cost (Million tokens) | Output cost (Million tokens) |
0 < Tokens ≤ 32K | $1 | $5 |
32K < Tokens ≤ 128K | $1,8 | $9 |
128K < Tokens ≤ 256K | $3 | $15 |
256K < Tokens ≤ 1M | $6 | $60 |
seri qwen3-coder-flash
Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. Model qwen3-coder-flash mendukung context cache. Teks input yang mengenai implicit cache ditagih sebesar 20% dari harga satuan. Teks input yang mengenai explicit cache ditagih sebesar 10% dari harga satuan.
Input tokens per request | Input cost (Million tokens) | Output cost (Million tokens) |
0 < Tokens ≤ 32K | $0,3 | $1,5 |
32K < Tokens ≤ 128K | $0,5 | $2,5 |
128K < Tokens ≤ 256K | $0,8 | $4 |
256K < Tokens ≤ 1M | $1,6 | $9,6 |
China Daratan (Beijing)
Model | Version | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | |||||
qwen3-coder-plus Menyediakan fungsionalitas yang sama dengan qwen3-coder-plus-2025-07-22. | Stable | 1.000.000 | 997.952 | 65.536 | Harga bertingkat. Lihat penjelasan di bawah tabel. | |
qwen3-coder-plus-2025-09-23 | Snapshot | |||||
qwen3-coder-plus-2025-07-22 | Snapshot | |||||
qwen3-coder-flash Saat ini merupakan alias untuk qwen3-coder-flash-2025-07-28. | Stable | |||||
qwen3-coder-flash-2025-07-28 | Snapshot | |||||
Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input per permintaan.
seri qwen3-coder-plus
Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. Model qwen3-coder-plus mendukung context cache. Teks input yang mengenai implicit cache ditagih sebesar 20% dari harga satuan. Teks input yang mengenai explicit cache ditagih sebesar 10% dari harga satuan.
Input tokens per request | Input cost (Million tokens) | Output cost (Million tokens) |
0 < Tokens ≤ 32K | $0,574 | $2,294 |
32K < Tokens ≤ 128K | $0,861 | $3,441 |
128K < Tokens ≤ 256K | $1,434 | $5,735 |
256K < Tokens ≤ 1M | $2,868 | $28,671 |
seri qwen3-coder-flash
Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. Model qwen3-coder-flash mendukung context cache. Teks input yang mengenai implicit cache ditagih sebesar 20% dari harga satuan. Teks input yang mengenai explicit cache ditagih sebesar 10% dari harga satuan.
Input tokens per request | Input cost (Million tokens) | Output cost (Million tokens) |
0 < Tokens ≤ 32K | $0,144 | $0,574 |
32K < Tokens ≤ 128K | $0,216 | $0,861 |
128K < Tokens ≤ 256K | $0,359 | $1,434 |
256K < Tokens ≤ 1M | $0,717 | $3,584 |
Qwen-MT
Model terjemahan besar andalan ini merupakan peningkatan komprehensif dari Qwen 3. Model ini mendukung terjemahan antara 92 bahasa, termasuk Tiongkok, Inggris, Jepang, Korea, Prancis, Spanyol, Jerman, Thailand, Indonesia, Vietnam, dan Arab. Performa serta kualitas terjemahannya mengalami peningkatan signifikan. Model ini menyediakan dukungan yang lebih baik untuk glosarium kustom, retensi format, dan prompt spesifik domain, sehingga menghasilkan terjemahan yang lebih akurat dan alami. Penggunaan.
Internasional (Singapura)
Model | Context window | Max input | Max output | Input cost | Output cost | Free quota |
(Tokens) | (Million tokens) | |||||
qwen-mt-plus Bagian dari Qwen3-MT | 16.384 | 8.192 | 8.192 | Rp2,46 | $7,37 | 1 juta token per model Kadaluarsa 90 hari setelah mengaktifkan Alibaba Cloud Model Studio. |
qwen-mt-flash Bagian dari Qwen3-MT | $0,16 | Rp0,49 | ||||
qwen-mt-turbo Bagian dari Qwen3-MT | $0,16 | $0,49 | ||||
Tiongkok Daratan (Beijing)
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
qwen-mt-plus Bagian dari Qwen3-MT | 16.384 | 8.192 | 8.192 | $0,259 | $0,775 |
qwen-mt-flash Bagian dari Qwen3-MT | $0,101 | $0,280 | |||
qwen-mt-turbo Bagian dari Qwen3-MT | $0,101 | Rp0,280 | |||
Model penambangan data Qwen
Model penambangan data Qwen mengekstraksi informasi terstruktur dari dokumen untuk digunakan dalam domain seperti Anotasi data dan moderasi konten. Penggunaan | Referensi API
Hanya tersedia di Wilayah Tiongkok (Beijing).
Model | Context window | Max input | Max output | Input cost | Output cost | Kuota gratis |
(Tokens) | (Juta token) | |||||
qwen-doc-turbo | 131.072 | 129.024 | 8.192 | $0,087 | Rp0,144 | Tidak ada kuota gratis |
Qwen deep research model
Model Qwen deep research memecah masalah kompleks, melakukan inferensi dan analisis menggunakan pencarian web, serta menghasilkan laporan penelitian. Usage | API reference
Hanya tersedia di Wilayah Tiongkok (Beijing).
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Per 1.000 tokens) | ||||
qwen-deep-research | 1.000.000 | 997.952 | 32.768 | $0,007742 | $0,023367 |
Generasi teks - Versi open-source Qwen
Pada nama model, xxb menunjukkan ukuran parameter. Sebagai contoh, qwen2-72b-instruct menunjukkan ukuran parameter sebesar 72 miliar (72B).
Alibaba Cloud Model Studio mendukung pemanggilan versi open-source Qwen. Anda tidak perlu melakukan deployment model secara lokal. Untuk versi open-source, kami merekomendasikan penggunaan model Qwen3 dan Qwen2.5.
Qwen3
qwen3-next-80b-a3b-thinking, dirilis pada September 2025, hanya mendukung mode thinking. Dibandingkan dengan qwen3-235b-a22b-thinking-2507, model ini menawarkan peningkatan kemampuan mengikuti instruksi dan ringkasan yang lebih ringkas.
qwen3-next-80b-a3b-instruct, dirilis pada September 2025, hanya mendukung mode non-thinking. Model ini menawarkan peningkatan pemahaman bahasa Mandarin, penalaran logis, dan kemampuan generasi teks dibandingkan dengan qwen3-235b-a22b-instruct-2507.
Model qwen3-235b-a22b-thinking-2507 dan qwen3-30b-a3b-thinking-2507, yang dirilis pada Juli 2025, hanya mendukung mode thinking. Keduanya merupakan versi peningkatan dari qwen3-235b-a22b (mode thinking) dan qwen3-30b-a3b (mode thinking).
Model qwen3-235b-a22b-instruct-2507 dan qwen3-30b-a3b-instruct-2507, yang dirilis pada Juli 2025, hanya mendukung mode non-thinking. Keduanya merupakan versi peningkatan dari qwen3-235b-a22b (mode non-thinking) dan qwen3-30b-a3b (mode non-thinking).
Model Qwen3, yang dirilis pada April 2025, mendukung kedua mode thinking dan non-thinking. Anda dapat beralih antar mode menggunakan parameter enable_thinking. Model Qwen3 juga menampilkan peningkatan kemampuan signifikan:
Kemampuan inferensi: Dalam evaluasi untuk matematika, kode, dan penalaran logis, model ini secara signifikan melampaui QwQ dan model non-reasoning lainnya dengan skala serupa. Performanya termasuk kelas atas di industri untuk model dengan skala tersebut.
Penyelarasan preferensi manusia: Model ini menunjukkan peningkatan besar dalam penulisan kreatif, asumsi peran, percakapan multi-putaran, dan kepatuhan terhadap instruksi. Kemampuan umumnya jauh lebih baik dibandingkan model lain dengan skala serupa.
Kemampuan agen: Model ini memberikan performa terdepan di industri baik dalam mode thinking maupun non-thinking, serta mampu melakukan pemanggilan alat eksternal secara presisi.
Kemampuan multibahasa: Model ini mendukung lebih dari 100 bahasa dan dialek. Terdapat peningkatan signifikan dalam terjemahan multibahasa, pemahaman instruksi, dan penalaran akal sehat.
Perbaikan format respons: Pembaruan ini memperbaiki masalah format respons dari versi sebelumnya, seperti Markdown yang salah, respons terpotong, dan output boxed yang tidak tepat.
Model open-source Qwen3 yang dirilis pada April 2025 tidak mendukung output non-streaming dalam mode thinking.
Jika model open-source Qwen3 berada dalam mode thinking tetapi tidak menghasilkan proses berpikir, maka akan ditagih dengan tarif mode non-thinking.
Mode thinking | Mode non-thinking | Penggunaan
Internasional (Singapura)
Model | Mode | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost | Free quota |
(Tokens) | (Juta token) | |||||||
qwen3-next-80b-a3b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | 32.768 | $0,15 | $1,2 | 1 juta token Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
qwen3-next-80b-a3b-instruct | Non-thinking only | 129.024 | - | |||||
qwen3-235b-a22b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,23 | $2,3 | |||
qwen3-235b-a22b-instruct-2507 | Non-thinking only | 129.024 | - | $0,92 | ||||
qwen3-30b-a3b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,2 | $2,4 | |||
qwen3-30b-a3b-instruct-2507 | Non-thinking only | 129.024 | - | $0,8 | ||||
qwen3-235b-a22b Model ini dan model berikutnya dirilis pada April 2025. | Non-thinking mode | 129.024 | - | 16.384 | $0,7 | $2,8 | ||
Thinking mode | 98.304 | 38.912 | $8,4 | |||||
qwen3-32b | Non-thinking mode | 129.024 | - | $0,16 | $0,64 | |||
Thinking mode | 98.304 | 38.912 | ||||||
qwen3-30b-a3b | Non-thinking mode | 129.024 | - | $0,2 | $0,8 | |||
Thinking mode | 98.304 | 38.912 | $2,4 | |||||
qwen3-14b | Non-thinking mode | 129.024 | - | 8.192 | $0,35 | $1,4 | ||
Thinking mode | 98.304 | 38.912 | $4,2 | |||||
qwen3-8b | Non-thinking mode | 129.024 | - | $0,18 | $0,7 | |||
Thinking mode | 98.304 | 38.912 | $2,1 | |||||
qwen3-4b | Non-thinking mode | 129.024 | - | $0,11 | $0,42 | |||
Thinking mode | 98.304 | 38.912 | $1,26 | |||||
qwen3-1.7b | Non-thinking mode | 32.768 | 30.720 | - | $0,42 | |||
Thinking mode | 28.672 | Total nilai tidak boleh melebihi 30.720. | $1,26 | |||||
qwen3-0.6b | Non-thinking mode | 30.720 | - | $0,42 | ||||
Thinking mode | 28.672 | Total nilai dan input tidak boleh melebihi 30.720. | $1,26 | |||||
China Daratan (Beijing)
Model | Mode | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||||
qwen3-next-80b-a3b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | 32.768 | $0,144 | $1,434 |
qwen3-next-80b-a3b-instruct | Non-thinking only | 129.024 | - | $0,574 | |||
qwen3-235b-a22b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,287 | $2,868 | ||
qwen3-235b-a22b-instruct-2507 | Non-thinking only | 129.024 | - | $1,147 | |||
qwen3-30b-a3b-thinking-2507 | Thinking only | 126.976 | 81.920 | $0,108 | $1,076 | ||
qwen3-30b-a3b-instruct-2507 | Non-thinking only | 129.024 | - | $0,431 | |||
qwen3-235b-a22b | Non-thinking | 129.024 | - | 16.384 | $0,287 | $1,147 | |
Thinking | 98.304 | 38.912 | $2,868 | ||||
qwen3-32b | Non-thinking | 129.024 | - | $0,287 | $1,147 | ||
Thinking | 98.304 | 38.912 | $2,868 | ||||
qwen3-30b-a3b | Non-thinking | 129.024 | - | $0,108 | $0,431 | ||
Thinking | 98.304 | 38.912 | $1,076 | ||||
qwen3-14b | Non-thinking | 129.024 | - | 8.192 | $0,144 | $0,574 | |
Thinking | 98.304 | 38.912 | $1,434 | ||||
qwen3-8b | Non-thinking | 129.024 | - | $0,072 | $0,287 | ||
Thinking | 98.304 | 38.912 | $0,717 | ||||
qwen3-4b | Non-thinking | 129.024 | - | $0,044 | $0,173 | ||
Thinking | 98.304 | 38.912 | $0,431 | ||||
qwen3-1.7b | Non-thinking | 32.768 | 30.720 | - | $0,173 | ||
Thinking | 28.672 | Jumlah token input dan chain-of-thought tidak boleh melebihi 30.720. | $0,431 | ||||
qwen3-0.6b | Non-thinking | 30.720 | - | $0,173 | |||
Thinking | 28.672 | Jumlah token input dan chain-of-thought tidak boleh melebihi 30.720. | $0,431 | ||||
QwQ-Open-source
Model reasoning QwQ yang dilatih pada Qwen2.5-32B. Pembelajaran penguatan (reinforcement learning) telah meningkatkan secara signifikan kemampuan inferensinya. Metrik inti untuk matematika dan kode (AIME 24/25, LiveCodeBench) serta beberapa metrik umum (IFEval, LiveBench) setara dengan versi full-power DeepSeek-R1. Semua metrik secara signifikan melampaui DeepSeek-R1-Distill-Qwen-32B yang juga berbasis Qwen2.5-32B. Penggunaan | Referensi API
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Context window | Max input | Max chain-of-thought | Max output | Input price | Output price |
(Tokens) | (Juta token) | |||||
qwq-32b | 131.072 | 98.304 | 32.768 | 8.192 | $0,287 | $0,861 |
QwQ-Preview
Model qwq-32b-preview adalah model riset eksperimental yang dikembangkan oleh tim Qwen pada tahun 2024. Model ini berfokus pada peningkatan kemampuan penalaran AI, terutama dalam matematika dan pemrograman. Untuk informasi lebih lanjut mengenai keterbatasan model qwq-32b-preview, lihat blog resmi QwQ. Penggunaan | Referensi API | Coba online
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Juta token) | ||||
qwq-32b-preview | 32.768 | 30.720 | 16.384 | $0,287 | $0,861 |
Qwen2.5
QVQ
Model qvq-72b-preview adalah model riset eksperimental yang dikembangkan oleh tim Qwen. Model ini berfokus pada peningkatan kemampuan penalaran visual, terutama dalam penalaran matematika. Untuk informasi lebih lanjut mengenai keterbatasan model qvq-72b-preview, lihat blog resmi QVQ. Penggunaan | Referensi API
Untuk membuat model menghasilkan proses berpikir sebelum jawaban akhir, Anda dapat menggunakan versi komersial model QVQ.
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Context window | Max input | Max output | Input Cost | Output cost |
Tokens | Per juta token | ||||
qvq-72b-preview | 32.768 | 16.384 Maksimum 16.384 token per citra | 16.384 | $1,721 | $5,161 |
Qwen-Omni
Ini adalah model besar multimodal baru untuk pemahaman dan generasi, yang dilatih pada Qwen2.5. Model ini mendukung input teks, citra, ucapan, dan video, serta dapat menghasilkan teks dan ucapan secara bersamaan dalam aliran. Kecepatan pemahaman konten multimodal meningkat secara signifikan. Penggunaan | Referensi API
Internasional (Singapura)
Model | Context window | Max input | Max output | Free quota |
(Tokens) | ||||
qwen2.5-omni-7b | 32.768 | 30.720 | 2.048 | 1 juta token (tanpa memandang modalitas) Berlaku selama 90 hari setelah mengaktifkan Alibaba Cloud Model Studio. |
Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:
|
|
China Daratan (Beijing)
Model | Context window | Max input | Max output |
(Tokens) | |||
qwen2.5-omni-7b | 32.768 | 30.720 | 2.048 |
Aturan penagihan untuk input dan output adalah sebagai berikut:
|
|
Qwen3-Omni-Captioner
Qwen3-Omni-Captioner adalah model open-source berbasis Qwen3-Omni. Tanpa prompt apa pun, model ini secara otomatis menghasilkan deskripsi yang akurat dan komprehensif untuk audio kompleks, termasuk ucapan, suara latar, musik, dan efek suara. Model ini dapat mengidentifikasi emosi pembicara, elemen musikal (seperti gaya dan instrumen), serta informasi sensitif, sehingga cocok untuk aplikasi seperti analisis konten audio, audit keamanan, pengenalan maksud, dan penyuntingan audio. Penggunaan | Referensi API
Model ini hanya tersedia di wilayah Singapura.
Model | Context window | Max input | Max output | Input cost | Output cost | Free quota |
(Tokens) | (Juta token) | |||||
qwen3-omni-30b-a3b-captioner | 65.536 | 32.768 | 32.768 | $3,81 | $3,06 | 1 juta token Masa berlaku: 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
Qwen-VL
Ini adalah versi open-source Qwen-VL dari Alibaba Cloud. Penggunaan | Referensi API
Model Qwen3-VL menawarkan peningkatan signifikan dibandingkan Qwen2.5-VL:
Interaksi agen: Model ini mengoperasikan antarmuka komputer dan ponsel, mendeteksi elemen antarmuka pengguna grafis (GUI), memahami fitur, dan memanggil tool untuk menjalankan tugas. Model ini mencapai performa kelas atas dalam evaluasi seperti OS World.
Pengkodean visual: Model ini menghasilkan kode dari citra atau video. Anda dapat menggunakan fitur ini untuk membuat kode HTML, CSS, dan JS dari rancangan atau tangkapan layar website.
Kecerdasan spasial: Model ini mendukung penentuan posisi 2D dan 3D serta secara akurat menentukan orientasi objek, perubahan perspektif, dan hubungan oklusi.
Pemahaman video panjang: Model ini memahami konten video hingga durasi 20 menit dan dapat menentukan momen spesifik dengan akurasi tingkat detik.
Penalaran mendalam: Model ini unggul dalam menangkap detail dan menganalisis sebab-akibat, mencapai performa kelas atas dalam evaluasi seperti MathVista dan MMMU.
OCR: Model ini mendukung 33 bahasa dan menunjukkan stabilitas lebih baik dalam skenario dengan pencahayaan kompleks, efek buram, atau kemiringan. Model ini juga meningkatkan secara signifikan akurasi pengenalan karakter langka, naskah kuno, dan istilah teknis.
Internasional (Singapura)
Model | Mode | Context window | Max input | Max chain-of-thought | Max response | Input cost | Biaya Keluaran CoT + response | Free quota |
(Tokens) | (Juta token) | |||||||
qwen3-vl-235b-a22b-thinking | Thinking only | 126.976 | 81.920 | $0,4 | $4 | 1 juta token masing-masing Berlaku selama 90 hari setelah Model Studio diaktifkan. | ||
qwen3-vl-235b-a22b-instruct | Non-thinking only | 129.024 | - | $1,6 | ||||
qwen3-vl-32b-thinking | Hanya pemikiran | 131.072 | 126,976 | 81.920 | 32,768 | Rp0,16 | $0,64 | |
qwen3-vl-32b-instruct | Non-thinking only | 129.024 | - | |||||
qwen3-vl-30b-a3b-thinking | Hanya berpikir | 126.976 | 81.920 | $0,2 | $2,4 | |||
qwen3-vl-30b-a3b-instruct | Non-thinking only | 129.024 | - | $0,8 | ||||
qwen3-vl-8b-thinking | Pemikiran saja | 126.976 | 81.920 | $0,18 | $2,1 | |||
qwen3-vl-8b-instruct | Non-thinking only | 129.024 | - | $0,7 | ||||
China Daratan (Beijing)
Model | Mode | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost CoT + response | Free quota |
(Tokens) | (Juta token) | |||||||
qwen3-vl-235b-a22b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | $0,286705 | $2,867051 | Tidak ada kuota gratis | |
qwen3-vl-235b-a22b-instruct | Non-thinking only | 129.024 | - | $1,146820 | ||||
qwen3-vl-32b-thinking | Thinking only | 131.072 | 126.976 | 81.920 | 32.768 | $0,287 | $2,868 | |
qwen3-vl-32b-instruct | Non-thinking only | 129.024 | - | $1,147 | ||||
qwen3-vl-30b-a3b-thinking | Thinking only | 126.976 | 81.920 | $0,108 | $1,076 | |||
qwen3-vl-30b-a3b-instruct | Non-thinking only | 129.024 | - | $0,431 | ||||
qwen3-vl-8b-thinking | Thinking only | 126.976 | 81.920 | $0,072 | $0,717 | |||
qwen3-vl-8b-instruct | Non-thinking only | 129.024 | - | $0,287 | ||||
Qwen-Math
Ini adalah model bahasa yang dibangun di atas model Qwen dan dikhususkan untuk menyelesaikan permasalahan matematika. Qwen2.5-Math mendukung Chinese dan English serta mengintegrasikan beberapa metode penalaran, termasuk Chain of Thought (CoT), Program of Thought (PoT), dan Tool-Integrated Reasoning (TIR). Penggunaan | Referensi API | Coba secara online
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
qwen2.5-math-72b-instruct | 4.096 | 3.072 | 3.072 | $0,574 | $1.721 |
qwen2.5-math-7b-instruct | $0,144 | $0,287 | |||
qwen2.5-math-1.5b-instruct | Gratis untuk waktu terbatas | ||||
Qwen-Coder
Qwen-Coder adalah model kode open source dari Qwen. Seri terbaru Qwen3-Coder memiliki kemampuan Coding Agent yang kuat. Model ini unggul dalam pemanggilan alat (tool calling), interaksi lingkungan, dan pemrograman otonom. Model ini menggabungkan keterampilan coding yang luar biasa dengan kemampuan serbaguna. Penggunaan | Referensi API
Internasional (Singapura)
Model | Context window | Max input | Max output | Input cost | Output cost | Free quota |
Token count | ||||||
qwen3-coder-480b-a35b-instruct | 262.144 | 204.800 | 65.536 | Harga bertingkat. Lihat penjelasan di bawah tabel. | 1 juta token masing-masing Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio. | |
qwen3-coder-30b-a3b-instruct | ||||||
Penagihan untuk qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct diterapkan secara bertingkat berdasarkan jumlah input token per permintaan.
Model | Input tokens per request | Input cost (Million tokens) | Output cost (Million tokens) |
qwen3-coder-480b-a35b-instruct | 0 < Tokens ≤ 32K | $1,50 | $7,50 |
32K < Tokens ≤ 128K | $2,70 | $13,50 | |
128K < Tokens ≤ 200K | $4,50 | $22,50 | |
qwen3-coder-30b-a3b-instruct | 0 < Tokens ≤ 32K | $0,45 | $2,25 |
32K < Tokens ≤ 128K | $0,75 | $3,75 | |
128K < Tokens ≤ 200K | $1,20 | Rp6,00 |
Tiongkok Daratan (Beijing)
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
qwen3-coder-480b-a35b-instruct | 262.144 | 204.800 | 65.536 | Harga bertingkat. Lihat penjelasan di bawah. | |
qwen3-coder-30b-a3b-instruct | |||||
qwen2.5-coder-32b-instruct | 131.072 | 129.024 | 8.192 | $0,287 | $0,861 |
qwen2.5-coder-14b-instruct | |||||
qwen2.5-coder-7b-instruct | $0,144 | $0,287 | |||
qwen2.5-coder-3b-instruct | 32,768 | 30.720 | Uji coba gratis berbatas waktu | ||
qwen2.5-coder-1.5b-instruct | |||||
qwen2.5-coder-0.5b-instruct | |||||
Penagihan untuk qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct diterapkan secara bertingkat berdasarkan jumlah input token per permintaan.
Model | Input tokens per request | Input cost (Million tokens) | Output cost (Million tokens) |
qwen3-coder-480b-a35b-instruct | 0 < Tokens ≤ 32K | $0,861 | $3,441 |
32K < Tokens ≤ 128K | $1,291 | $5,161 | |
128K < Tokens ≤ 200K | $2,151 | $8.602 | |
qwen3-coder-30b-a3b-instruct | 0 < Tokens ≤ 32K | $0,216 | $0,861 |
32K < Tokens ≤ 128K | $0,323 | $1,291 | |
128K < Tokens ≤ 200K | $0,538 | $2,151 |
Generasi teks - Model pihak ketiga
DeepSeek
DeepSeek adalah model bahasa besar yang diluncurkan oleh DeepSeek AI. Referensi API | Coba secara online
Fitur ini hanya tersedia di Wilayah Tiongkok (Beijing).
Model | Context window | Max input | Max chain-of-thought | Max response | Input cost | Output cost |
(Tokens) | (Million tokens) | |||||
deepseek-v3.2-exp Versi full-power 685B | 131.072 | 98.304 | 32.768 | 65.536 | $0,287 | $0,431 |
deepseek-v3.1 Versi full-power 685B | $0,574 | $1,721 | ||||
deepseek-r1 Versi full-power 685B | 16.384 | $2,294 | ||||
deepseek-r1-0528 Versi full-power 685B | ||||||
deepseek-v3 Versi full-power 671B | 131.072 | Not applicable | $0,287 | $1,147 | ||
deepseek-r1-distill-qwen-1.5b Berdasarkan Qwen2.5-Math-1.5B | 32.768 | 32.768 | 16.384 | 16.384 | Limited-time free trial | |
deepseek-r1-distill-qwen-7b Berdasarkan Qwen2.5-Math-7B | $0,072 | $0,144 | ||||
deepseek-r1-distill-qwen-14b Berdasarkan Qwen2.5-14B | $0,144 | $0,431 | ||||
deepseek-r1-distill-qwen-32b Berdasarkan Qwen2.5-32B | $0,287 | $0,861 | ||||
deepseek-r1-distill-llama-8b Berdasarkan Llama-3.1-8B | Limited-time free trial | |||||
deepseek-r1-distill-llama-70b Berdasarkan Llama-3.3-70B | ||||||
Kimi
Kimi-K2 adalah model Mixture of Experts (MoE) open-source pertama di Tiongkok dengan parameter triliunan. Model ini disediakan oleh Moonshot AI, mengaktifkan 32 miliar parameter, serta memiliki kemampuan coding dan tool-calling yang sangat baik. Penggunaan | Coba secara online
Fitur ini hanya tersedia di Wilayah Tiongkok (Beijing).
Model | Context window | Max input | Max chain-of-thought | Max response | Input price | Output price |
(Tokens) | (Million tokens) | |||||
kimi-k2-thinking | 262.144 | 229.376 | 32.768 | 16.384 | $0,574 | $2,294 |
Moonshot-Kimi-K2-Instruct | 131.072 | 131.072 | - | 8.192 | $0,574 | $2,294 |
Image generation
Qwen text-to-image
Model Qwen text-to-image unggul dalam complex text rendering, terutama untuk teks berbahasa Tiongkok dan Inggris.Saat ini, qwen-image-plus memiliki kemampuan yang sama dengan qwen-image, tetapi qwen-image-plus memiliki harga lebih rendah.API reference
International (Singapore)
Model | Unit price | Free quota |
qwen-image-plus | $0,03/image | Free quota: 100 citra untuk setiap model Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio. |
qwen-image | $0,035/image |
Mainland China (Beijing)
Model | Unit price | Free quota |
qwen-image-plus | $0,028671/image | No free quota |
qwen-image | $0,035/image |
Input prompt | Output image |
Poster bergaya healing yang digambar tangan menampilkan tiga anak anjing sedang bermain bola di atas rumput hijau yang subur, dilengkapi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun tebal berwarna biru. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Sebuah balon ucapan menambah kesan lucu dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, terdapat teks tambahan: “We get to play ball with our friends again!” Palet warna didominasi hijau segar dan biru, dengan aksen merah muda dan kuning cerah untuk memperkuat suasana ceria khas anak-anak. |
|
Qwen image editing
Model Qwen image editing mendukung pengeditan teks yang presisi dalam bahasa Tiongkok dan Inggris. Model ini juga mendukung operasi seperti penyesuaian warna, peningkatan detail, style transfer, penambahan atau penghapusan objek, serta perubahan posisi dan aksi. Fitur-fitur ini memungkinkan pengeditan kompleks terhadap citra dan teks. API reference
International (Singapore)
Model | Unit price | Free quota |
qwen-image-edit-plus | $0.03/image | Free quota: 100 citra untuk setiap model Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio. |
qwen-image-edit-plus-2025-10-30 | $0.03/image | |
qwen-image-edit | $0.045/image |
Mainland China (Beijing)
Model | Unit price | Free quota |
qwen-image-edit-plus | $0.028671/image | No free quota |
qwen-image-edit-plus-2025-10-30 | $0.028671/image | |
qwen-image-edit | $0.043/image |
Original image |
Buat orang tersebut berdiri dan membungkuk untuk memegang kaki depan anjing. |
Original image |
Ganti teks 'HEALTH INSURANCE' pada balok huruf dengan '明天会更好'. |
Original image |
Ganti kemeja bergaris putus-putus dengan kemeja biru muda. |
Original image |
Ubah latar belakang menjadi Antarktika. |
Original image |
Hasilkan gambar profil bergaya kartun dari orang tersebut. |
Original image |
Hapus rambut dari piring makan. |
Qwen image translation
Model Qwen image translation mendukung penerjemahan teks dari citra dalam 11 bahasa ke bahasa Tiongkok atau Inggris. Model ini secara akurat mempertahankan tata letak asli dan informasi konten, serta menyediakan fitur khusus seperti term definition, sensitive word filtering, dan image entity detection. API reference
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Harga Satuan | Kuota Gratis |
qwen-mt-image | $0,000431/gambar | Tidak ada kuota gratis |
Original image |
Japanese |
Portuguese |
Arabic |
Wan text-to-image
Model Wan text-to-image menghasilkan citra eksquisit dari teks. API reference | Try it online
International (Singapore)
Model | Description | Unit price | Free quota(Note) Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio. |
wan2.5-t2i-preview | Wan 2.5 preview. Batas panjang sisi tunggal dihapus; Anda dapat memilih dimensi secara bebas dalam batasan area piksel total dan rasio aspek. | $0.03/image | 50 citra |
wan2.2-t2i-plus | Wan 2.2 Professional Edition. Ditingkatkan secara menyeluruh dalam kreativitas, stabilitas, dan tekstur realistis. | $0.05/image | 100 citra |
wan2.2-t2i-flash | Wan 2.2 Flash Edition. Ditingkatkan secara menyeluruh dalam kreativitas, stabilitas, dan tekstur realistis. | $0.025/image | 100 citra |
wan2.1-t2i-plus | Wan 2.1 Professional Edition. Mendukung multiple styles dan menghasilkan citra dengan detail yang kaya. | $0.05/image | 200 citra |
wan2.1-t2i-turbo | Wan 2.1 Turbo Edition. Mendukung multiple styles serta menawarkan kecepatan generasi yang cepat. | $0.025/image | 200 citra |
Mainland China (Beijing)
Model | Description | Unit price | Free quota(Note) Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio. |
wan2.5-t2i-preview | Wan 2.5 preview. Batas panjang sisi tunggal dihapus; Anda dapat memilih dimensi secara bebas dalam batasan area piksel total dan rasio aspek. | $0.028671/image | No free quota |
wan2.2-t2i-plus | Wan 2.2 Professional Edition. Ditingkatkan sepenuhnya dalam kreativitas, stabilitas, dan tekstur realistis. | $0.02007/image | No free quota |
wan2.2-t2i-flash | Wan 2.2 Flash Edition. Ditingkatkan sepenuhnya dalam kreativitas, stabilitas, dan tekstur realistis. | $0.028671/image | No free quota |
wanx2.1-t2i-plus | Wan 2.1 Professional Edition. Mendukung multiple styles dan menghasilkan citra dengan detail kaya. | $0.028671/image | No free quota |
wanx2.1-t2i-turbo | Wan 2.1 Turbo Edition. Mendukung multiple styles dan menawarkan kecepatan generasi cepat. | $0.020070/image | No free quota |
wanx2.0-t2i-turbo | Wan 2.0 Turbo Edition. Unggul dalam potret bertekstur dan desain kreatif serta hemat biaya. | $0.005735/image | No free quota |
Input prompt | Output image |
Seorang Santa Claus yang dibuat dengan teknik needle-felting sedang memegang hadiah dan seekor kucing putih berdiri di sampingnya, dengan latar belakang hadiah-hadiah berwarna-warni dan tanaman hijau, menciptakan adegan yang lucu, hangat, dan nyaman. |
|
Wan2.5 general image editing
Model Wan2.5 General Image Editing mendukung pengeditan citra yang konsisten terhadap entitas dan fusi multi-citra. Model ini menerima teks, satu citra, atau beberapa citra sebagai input. API reference
International (Singapore)
Model | Unit price | Free quota(Note) Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio. |
wan2.5-i2i-preview | $0,03/image | 50 citra |
Mainland China (Beijing)
Model | Harga per unit | Kuota gratis |
wan2.5-i2i-preview | $0,028671/gambar | Tidak ada kuota gratis |
Feature | Input example | Output image |
Single-image editing |
|
Ubah gaun bermotif bunga menjadi gaun panjang bergaya vintage berbahan renda dengan detail bordir indah pada kerah dan manset. |
Multi-image fusion |
|
Tempatkan jam alarm dari Citra 1 di samping vas di atas meja makan pada Citra 2. |
Wan2.1 general image editing
Model Wan2.1 general image editing melakukan berbagai pengeditan citra berdasarkan instruksi sederhana. Model ini cocok untuk skenario seperti outpainting, penghapusan watermark, style transfer, restorasi citra, dan peningkatan kualitas citra. Penggunaan | Referensi API
Fitur ini hanya tersedia di Wilayah China (Beijing).
Model | Harga satuan | Kuota gratis |
wanx2.1-imageedit | $0,020070 per citra | Tidak ada kuota gratis |
Model general image editing saat ini mendukung fitur-fitur berikut:
Fitur | Citra Masukan | Input prompt | Citra Keluaran |
Global stylization |
| Convert to a French picture book style. |
|
Local stylization |
| Change the house to a wooden plank style. |
|
Instruction-based editing |
| Change the girl's hair to red. |
|
Inpainting | Input image
Masked image (The white area is the mask)
| A ceramic rabbit holding a ceramic flower. | Output image
|
Text watermark removal |
| Remove the text from the image. |
|
Outpainting |
| A green fairy. |
|
Image super-resolution | Blurry image
| Image super-resolution. | Clear image
|
Image colorization |
| Blue background, yellow leaves. |
|
Line art to image |
| A living room in a minimalist Nordic style. |
|
Placeholder Image |
| A cartoon character cautiously peeks out, spying on a brilliant blue gem inside the room. |
|
OutfitAnyone
Dibandingkan dengan versi dasar, model OutfitAnyone-Plus menawarkan peningkatan dalam definisi citra, detail tekstur pakaian, dan restorasi logo. Namun, proses pembuatan citranya membutuhkan waktu lebih lama sehingga cocok untuk skenario yang tidak sensitif terhadap waktu. Referensi API | Coba secara online
OutfitAnyone-Image Parsing mendukung penguraian citra model dan pakaian, yang dapat digunakan untuk pra-pemrosesan dan post-processing citra OutfitAnyone. Referensi API
Fitur ini hanya tersedia di wilayah China (Beijing).
Model | Deskripsi | Input Contoh | Output Contoh |
aitryon-plus | OutfitAnyone-Plus |
|
|
aitryon-parsing-v1 | OutfitAnyone-Image Parsing |
Harga OutfitAnyone
Layanan Model | Model | Harga Satuan | Diskon | Tingkat |
OutfitAnyone-Plus | aitryon-plus | $0,071677/citra | None | None |
OutfitAnyone-Image Parsing | aitryon-parsing-v1 | $0,000574/citra | None | None |
Generasi video - Wan
Teks-ke-video
Model teks-ke-video Wan menghasilkan video dari satu kalimat, menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba secara online
Internasional (Singapura)
Model | Deskripsi | Harga satuan | Kuota gratis (Klaim) Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
wan2.5-t2v-preview | Pratinjau Wan 2.5. Mendukung narasi otomatis dan input file audio kustom. | 480p: USD0,05/detik 720p: USD0,10/detik 1080p: USD0,15/detik | 50 detik |
wan2.2-t2v-plus | Edisi Profesional Wan 2.2. Detail citra dan stabilitas gerakan meningkat signifikan. | 480p: USD0,02/detik 1080p: USD0,10/detik | 50 detik |
wan2.1-t2v-turbo | Edisi Turbo Wan 2.1. Kecepatan generasi cepat dan performa seimbang. | USD0,036/detik | 200 detik |
wan2.1-t2v-plus | Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya dan citra berkualitas lebih tinggi. | USD0,10/detik | 200 detik |
Tiongkok Daratan (Beijing)
Model | Deskripsi | Harga satuan | Kuota gratis |
wan2.5-t2v-preview | Pratinjau Wan 2.5. Mendukung narasi otomatis dan input file audio kustom. | 480p: $0,043006/detik 720p: $0,086012/detik 1080p: $0,143353/detik | Tidak ada kuota gratis |
wan2.2-t2v-plus | Edisi Profesional Wan 2.2. Detail citra dan stabilitas gerakan meningkat signifikan. | 480p: $0,02007/detik 1080p: $0,100347/detik | Tidak ada kuota gratis |
wanx2.1-t2v-turbo | Kecepatan generasi lebih cepat dengan performa seimbang. | $0,034405/detik | Tidak ada kuota gratis |
wanx2.1-t2v-plus | Menghasilkan detail lebih kaya dan citra berkualitas lebih tinggi. | $0,100347/detik | Tidak ada kuota gratis |
Contoh input | Video output (wan2.5) |
Prompt input: Diambil dari sudut rendah dalam medium close-up, dengan nuansa hangat, pencahayaan campuran (lampu meja menyatu dengan cahaya mendung dari jendela), pencahayaan samping, serta komposisi sentral. Di sebuah kantor detektif klasik, rak buku kayu penuh dengan arsip kasus lama dan asbak. Lampu meja hijau menerangi berkas kasus yang terbuka di tengah meja. Seekor rubah mengenakan mantel trench cokelat tua dan fedora abu-abu muda duduk di kursi kulit, bulunya merah menyala, ekornya terletak ringan di tepi kursi, dan jarinya perlahan membalik halaman-halaman menguning. Di luar, hujan gerimis turun di bawah langit biru, meninggalkan jejak-jejak melengkung di kaca. Perlahan ia mengangkat kepalanya, telinganya bergerak sedikit, matanya yang kuning kecoklatan menatap langsung ke kamera, dan mulutnya bergerak jelas saat berbicara dengan suara halus nan sinis: 'Kasus ini dingin, lebih dingin daripada ikan di musim dingin. Tapi setiap ayam punya rahasia, dan saya, untuk satu hal, berniat menemukannya.' Audio masukan: |
Citra-ke-video – berdasarkan frame pertama
Model citra-ke-video Wan menggunakan citra input sebagai frame pertama video, lalu menghasilkan sisa video berdasarkan prompt. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba secara online
Internasional (Singapura)
Model | Deskripsi | Harga satuan | Kuota gratis (Catatan) Masa berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
wan2.5-i2v-preview | Pratinjau Wan 2.5. Mendukung dubbing otomatis dan unggah file audio kustom. | 480P: $0,05/detik 720P: $0,10/detik 1080P: $0,15/detik | 50 detik |
wan2.2-i2v-flash | Edisi Flash Wan 2.2. Memberikan kecepatan generasi sangat cepat dengan peningkatan signifikan pada detail visual dan stabilitas gerakan. | 480P: $0,015/detik 720P: $0,036/detik | 50 detik |
wan2.2-i2v-plus | Edisi Profesional Wan 2.2. Memberikan peningkatan signifikan pada detail visual dan stabilitas gerakan. | 480P: $0,02/detik 1080P: $0,10/detik | 50 detik |
wan2.1-i2v-turbo | Edisi Turbo Wan 2.1. Menawarkan kecepatan generasi cepat dengan performa seimbang. | $0,036/detik | 200 detik |
wan2.1-i2v-plus | Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya serta visual berkualitas tinggi dan bertekstur. | $0,10/detik | 200 detik |
Tiongkok Daratan (Beijing)
Model | Deskripsi | Harga satuan | Kuota gratis |
wan2.5-i2v-preview | Pratinjau Wan 2.5. Mendukung dubbing otomatis dan unggah file audio kustom. | 480P: $0,043006/detik 720P: $0,086012/detik 1080P: $0,143353/detik | Tidak ada kuota gratis |
wan2.2-i2v-plus | Edisi Profesional Wan 2.2. Memberikan peningkatan signifikan pada detail visual dan stabilitas gerakan. | 480P: $0,02007/detik 1080P: $0,100347/detik | Tidak ada kuota gratis |
wanx2.1-i2v-turbo | Edisi Turbo Wan 2.1. Menawarkan kecepatan generasi cepat dengan performa seimbang. | $0,034405/detik | Tidak ada kuota gratis |
wanx2.1-i2v-plus | Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya serta visual berkualitas tinggi dan bertekstur. | $0,100347/detik | Tidak ada kuota gratis |
Citra frame pertama dan audio input | Video output (wan2.5) |
Audio masukan: | |
Prompt input: Adegan seni fantasi urban. Karakter seni grafiti dinamis: seorang anak laki-laki yang dilukis dengan cat semprot hidup dari dinding beton. Ia menyanyikan lagu rap berbahasa Inggris dengan tempo sangat cepat sambil mengambil pose rapper energik klasik. Latar adegan berada di bawah jembatan kereta perkotaan pada malam hari, dengan pencahayaan dari satu lampu jalan yang menciptakan suasana sinematik penuh energi tinggi dan detail luar biasa. Audio video sepenuhnya terdiri dari rap-nya, tanpa dialog atau kebisingan lainnya. | |
Citra-ke-video – berdasarkan frame pertama dan terakhir
Model Wan untuk frame pertama dan terakhir menghasilkan video dinamis yang mulus dari prompt. Anda hanya perlu menyediakan citra frame pertama dan terakhir. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba secara online
Internasional (Singapura)
Model | Harga satuan | Kuota gratis (Catatan) |
wan2.1-kf2v-plus | $0,10/detik | 200 detik Masa berlaku: 90 hari sejak Anda mengaktifkan Model Studio |
Tiongkok Daratan (Beijing)
Model | Harga satuan | Kuota gratis (Catatan) |
wanx2.1-kf2v-plus | $0,100347/detik | Tidak ada kuota gratis |
Contoh input | Video keluaran | ||
Frame pertama | Frame terakhir | Prompt | |
|
| Dengan gaya realistis, kamera dimulai sejajar mata dengan seekor kucing hitam kecil yang menatap langit penuh rasa ingin tahu, lalu perlahan bergerak ke atas hingga berakhir pada bidikan dari atas yang memfokuskan pada matanya yang penuh rasa ingin tahu. | |
Pengeditan video umum
Model pengeditan video terpadu Wan mendukung input multimodal, termasuk teks, citra, dan video, serta mampu melakukan berbagai tugas generasi dan pengeditan video umum. Referensi API | Coba secara online
Internasional (Singapura)
Model | Harga satuan | Kuota gratis (Catatan) |
wan2.1-vace-plus | $0,1/detik | 50 detik Masa berlaku: Berlaku selama 90 hari setelah aktivasi Model Studio. |
Tiongkok Daratan (Beijing)
Model | Harga satuan | Kuota gratis (Catatan) |
wanx2.1-vace-plus | $0,100347/detik | Tidak ada kuota gratis |
Model pengeditan video terpadu mendukung fitur-fitur berikut:
Fitur | Citra referensi input | Masukkan prompt | Video keluaran |
Referensi multi-citra | Citra referensi 1 (entitas referensi)
Citra referensi 2 (latar belakang referensi)
| Dalam video, seorang gadis berjalan anggun keluar dari hutan kuno yang berkabut. Langkahnya ringan, dan kamera menangkap setiap gerakan lincahnya. Saat ia berhenti dan memandang sekeliling ke hutan yang rindang, senyum terkejut dan gembira merekah di wajahnya. Adegan ini, membeku dalam interaksi antara cahaya dan bayangan, merekam pertemuannya yang indah dengan alam. | Video output |
Pelukisan ulang video | Video menampilkan sebuah mobil bergaya steampunk berwarna hitam yang dikemudikan seorang pria. Mobil tersebut dihiasi roda gigi dan pipa tembaga, dengan latar belakang pabrik permen berbasis uap serta elemen retro yang menciptakan suasana vintage yang menyenangkan. | ||
Pengeditan lokal | Video input Citra mask input (area putih menunjukkan area pengeditan)
| Video menampilkan kafe Prancis bergaya Paris tempat seekor singa berjas dengan elegan menyesap kopi. Ia memegang cangkir dengan satu tangan dan menyesap pelan sambil menampilkan ekspresi santai. Kafe tersebut didekorasi dengan selera tinggi, menggunakan warna lembut dan pencahayaan hangat yang menerangi area tempat singa tersebut berada. | Konten di area pengeditan dimodifikasi berdasarkan prompt. |
Ekstensi video | Klip pertama input (1 detik) | Seekor anjing yang mengenakan kacamata hitam sedang berseluncur di jalan dengan skateboard, dalam gaya kartun 3D. | Video output yang diperpanjang (5 detik) |
Video outpainting | Seorang wanita elegan sedang bersemangat memainkan biola, dengan orkestra simfoni lengkap di belakangnya. |
Wan – manusia digital
Fitur ini menghasilkan video orang yang tampak alami sedang berbicara, bernyanyi, atau tampil, berdasarkan satu citra karakter dan file audio. Untuk menggunakan fitur ini, panggil model-model berikut secara berurutan: Deteksi citra wan2.2-s2v | Generasi video wan2.2-s2v.
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Deskripsi | Harga satuan |
wan2.2-s2v-detect | Memeriksa apakah citra input memenuhi persyaratan, seperti resolusi tinggi, hanya satu orang, dan pandangan depan. | $0,000574/citra |
wan2.2-s2v | Menghasilkan video dinamis seseorang dari citra yang valid dan klip audio. | 480P: $0,071677/detik 720P: $0,129018/detik |
Contoh input | Video keluaran |
Audio Input: |
Wan – animasi citra
Tersedia dalam mode standar dan profesional. Model ini mentransfer gerakan dan ekspresi dari video referensi ke citra karakter, menghasilkan video yang menganimasikan karakter dari citra tersebut. Referensi API.
Internasional (Singapura)
Model | Layanan | Deskripsi | Harga satuan | Kuota gratis (Lihat) |
wan2.2-animate-move | Mode standar | Kecepatan generasi cepat, memenuhi kebutuhan dasar seperti demo animasi sederhana, serta hemat biaya. | $0,12/detik | Kedua layanan berbagi kuota gratis 50 detik. |
Mode profesional | Kelancaran animasi tinggi dengan transisi gerakan dan ekspresi yang alami, menghasilkan kualitas menyerupai video live-action. | $0,18/detik |
Tiongkok Daratan (Beijing)
Model | Layanan | Deskripsi | Harga satuan | Kuota gratis (Lihat) |
wan2.2-animate-move | Mode standar | Kecepatan generasi cepat, memenuhi kebutuhan dasar seperti demo animasi sederhana, serta hemat biaya. | $0,06/detik | Tidak ada kuota gratis |
Mode profesional | Kelancaran animasi tinggi dengan transisi alami untuk gerakan dan ekspresi, menghasilkan kualitas yang menyerupai video live-action. | $0,09/detik |
Citra karakter | Video referensi | Video output (standar) | Video output (profesional) |
|
Wan – penukaran wajah video
Tersedia dalam mode standar dan profesional. Model ini mengganti karakter utama dalam video dengan karakter dari citra, sekaligus mempertahankan adegan, pencahayaan, dan rona video asli. Referensi API.
Internasional (Singapura)
Model | Layanan | Deskripsi | Harga satuan | Kuota gratis (Lihat) |
wan2.2-animate-mix | Mode standar | Menghasilkan animasi dengan cepat, ideal untuk kebutuhan dasar seperti demo sederhana, serta sangat hemat biaya. | $0,18/detik | Kedua layanan berbagi kuota gratis sebesar 50 detik. |
Mode profesional | Menghasilkan animasi sangat lancar dengan transisi alami untuk gerakan dan ekspresi, menghasilkan kualitas yang sangat mirip dengan video live-action. | $0,26/detik |
Tiongkok Daratan (Beijing)
Model | Layanan | Deskripsi | Harga satuan | Kuota gratis (Lihat) |
wan2.2-animate-mix | Mode standar | Menghasilkan animasi dengan cepat, ideal untuk kebutuhan dasar seperti demo sederhana, serta sangat hemat biaya. | $0,09/detik | Tidak ada kuota gratis |
Mode profesional | Menghasilkan animasi sangat lancar dengan transisi alami untuk gerakan dan ekspresi, menghasilkan kualitas yang sangat mirip dengan video live-action. | $0,13/detik |
Citra karakter | Video referensi | Video output (standar) | Video output (profesional) |
|
AnimateAnyone
Fitur ini menghasilkan video gerakan karakter berdasarkan citra karakter dan templat gerakan. Untuk menggunakan fitur ini, panggil ketiga model berikut secara berurutan: Detail API deteksi citra AnimateAnyone | Generasi templat gerakan AnimateAnyone | Detail API generasi video AnimateAnyone.
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Deskripsi | Harga satuan |
animate-anyone-detect-gen2 | Mendeteksi apakah citra input memenuhi spesifikasi yang ditentukan. | $0,000574/citra |
animate-anyone-template-gen2 | Menambang gerakan karakter dari video dan menghasilkan templat gerakan. | $0,011469/detik |
animate-anyone-gen2 | Menghasilkan video gerakan karakter berdasarkan citra karakter dan templat gerakan. |
Input: Citra karakter | Input: Motion video | Output (latar belakang citra) | Output (latar belakang video) |
|
Contoh di atas dihasilkan oleh Tongyi App, yang mengintegrasikan AnimateAnyone.
Konten yang dihasilkan oleh model AnimateAnyone hanya berupa video dan tidak termasuk audio.
EMO
Fitur ini menghasilkan video potret dinamis berdasarkan citra potret dan file audio suara manusia. Untuk menggunakan fitur ini, panggil model-model berikut secara berurutan: Deteksi citra EMO | Generasi video EMO.
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Deskripsi | Harga satuan |
emo-detect-v1 | Mendeteksi apakah citra input memenuhi spesifikasi yang ditentukan. Model ini dapat dipanggil langsung tanpa penerapan. | $0,000574/citra |
emo-v1 | Menghasilkan video potret dinamis. Model ini dapat dipanggil langsung tanpa penerapan. |
|
Input: Citra potret dan file audio suara manusia | Output: Video potret dinamis |
Potret:
Audio suara manusia: Lihat video di sebelah kanan. | Video karakter: Intensitas gaya aksi: aktif (style_level: "active") |
LivePortrait
Ini adalah model ringan yang dengan cepat menghasilkan video potret dinamis berdasarkan citra potret dan file audio suara manusia. Dibandingkan dengan model EMO, model ini menghasilkan video lebih cepat dan dengan biaya lebih rendah, tetapi kualitasnya tidak sebaik EMO. Untuk menggunakan fitur ini, panggil dua model berikut secara berurutan: Deteksi citra LivePortrait | Generasi video LivePortrait.
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Deskripsi | Harga satuan |
liveportrait-detect | Mendeteksi apakah citra input memenuhi persyaratan. | $0,000574/citra |
liveportrait | Menghasilkan video potret dinamis. | $0,002868/detik |
Input: Citra potret dan file audio suara | Output: Video potret animasi |
Citra potret:
Audio suara: Diambil dari video di sebelah kanan. | Video potret: |
Emoji
Fitur ini menghasilkan video wajah dinamis berdasarkan citra wajah dan templat gerakan wajah preset. Kemampuan ini dapat digunakan untuk skenario seperti pembuatan emoji dan pembuatan materi video. Untuk menggunakan fitur ini, panggil model-model berikut secara berurutan: Deteksi citra Emoji | Generasi video Emoji.
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Deskripsi | Harga satuan |
emoji-detect-v1 | Mendeteksi apakah citra input memenuhi persyaratan yang ditentukan. | $0,000574/citra |
emoji-v1 | Menghasilkan emoji karakter berdasarkan citra potret dan templat emoji tertentu. | $0,011469/detik |
Masukan: Citra potret | Output: Video potret dinamis |
| Parameter templat untuk emoji "senang": ("input.driven_id": "mengwa_kaixin") |
VideoRetalk
Fitur ini menghasilkan video di mana gerakan bibir karakter sesuai dengan audio input, berdasarkan video karakter dan file audio suara manusia. Untuk menggunakan fitur ini, panggil model berikut: Referensi API.
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Deskripsi | Harga satuan |
videoretalk | Menghasilkan video baru dengan gerakan bibir karakter yang disinkronkan dengan audio input. | $0,011469/detik |
Style transfer video
Model ini mendukung pembuatan video dalam berbagai gaya yang sesuai dengan deskripsi semantik dari teks input pengguna, atau mengubah gaya video input pengguna. Referensi API.
Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).
Model | Deskripsi | Harga satuan | |
video-style-transform | Mengubah video input menjadi gaya manga Jepang atau komik Amerika. | 720p | $0,071677/detik |
540p | $0,028671/detik | ||
Input video | Video output (gaya manga Jepang) |
Sintesis suara (teks-ke-ucapan)
Qwen-TTS
Qwen-TTS adalah model sintesis suara dari seri Qwen yang mendukung input teks dalam bahasa Mandarin, Inggris, maupun campuran keduanya, serta mengalirkan output audio secara streaming. Penggunaan | Referensi API
Internasional (Singapura)
Model | Versi | Harga satuan | Karakter input maksimum | Bahasa yang didukung | Kuota gratis (Catatan) |
qwen3-tts-flash Kemampuannya setara dengan qwen3-tts-flash-2025-09-18 | Stable | $0,1/10.000 karakter | 600 | Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | Jika Anda mengaktifkan Alibaba Cloud Model Studio sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter Jika Anda mengaktifkan Alibaba Cloud Model Studio pada atau setelah pukul 00.00 pada 13 November 2025: 10.000 karakter Masa berlaku: Dalam waktu 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
qwen3-tts-flash-2025-09-18 | Snapshot |
Penagihan Qwen3-TTS didasarkan pada jumlah karakter input dengan aturan sebagai berikut:
1 karakter Mandarin = 2 karakter
1 huruf Inggris, 1 tanda baca, atau 1 spasi = 1 karakter
Daratan Tiongkok (Beijing)
Qwen3-TTS
Model | Versi | Harga satuan | Karakter input maksimum | Bahasa yang didukung |
qwen3-tts-flash Kemampuannya setara dengan qwen3-tts-flash-2025-09-18. | Stable | $0,114682/10.000 karakter | 600 | Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis |
qwen3-tts-flash-2025-09-18 | Snapshot |
Penagihan Qwen3-TTS didasarkan pada jumlah karakter input dengan aturan sebagai berikut:
1 karakter Mandarin = 2 karakter
1 huruf Inggris, 1 tanda baca, atau 1 spasi = 1 karakter
Qwen-TTS
Model | Versi | Jendela konteks | Input maksimum | Output maksimum | Biaya input | Biaya output |
(Token) | (Ribu token) | |||||
qwen-tts Kemampuannya sama dengan qwen-tts-2025-04-10 | Stable | 8.192 | 512 | 7.680 | $0,230 | $1,434 |
qwen-tts-latest Kemampuannya selalu sama dengan versi snapshot terbaru | Latest | |||||
qwen-tts-2025-05-22 | Snapshot | |||||
qwen-tts-2025-04-10 | ||||||
Audio dikonversi ke token dengan laju 50 token per detik. Audio berdurasi kurang dari 1 detik ditagih sebagai 50 token.
Qwen-TTS-Realtime
Berdasarkan Qwen-TTS, model ini mendukung input teks streaming dan dapat menyesuaikan laju ucapan berdasarkan konten teks serta tanda baca. Model ini mendukung input teks dalam bahasa Mandarin, Inggris, maupun campuran keduanya, serta mengalirkan output audio secara streaming. Penggunaan
Internasional (Singapura)
Model | Versi | Harga satuan | Bahasa yang didukung | Kuota gratis (Catatan) |
qwen3-tts-flash-realtime Kemampuan saat ini setara dengan qwen3-tts-flash-realtime-2025-09-18 | Stable | $0,13 per 10.000 karakter | Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis | Jika Anda mengaktifkan Alibaba Cloud Model Studio sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter Jika Anda mengaktifkan Alibaba Cloud Model Studio pada atau setelah pukul 00.00 pada 13 November 2025: 10.000 karakter Masa berlaku: Dalam waktu 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
qwen3-tts-flash-realtime-2025-09-18 | Snapshot |
Penagihan Qwen3-TTS didasarkan pada jumlah karakter input dengan aturan sebagai berikut:
1 karakter Mandarin = 2 karakter
1 huruf Inggris, 1 tanda baca, atau 1 spasi = 1 karakter
Daratan Tiongkok (Beijing)
Qwen3-TTS Realtime
Model | Versi | Harga satuan | Bahasa yang didukung |
qwen3-tts-flash-realtime Kemampuan saat ini setara dengan qwen3-tts-flash-realtime-2025-09-18. | Stable | $0,143353 per 10.000 karakter | Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis |
qwen3-tts-flash-realtime-2025-09-18 | Snapshot |
Penagihan Qwen3-TTS didasarkan pada jumlah karakter input dengan aturan sebagai berikut:
1 karakter Mandarin = 2 karakter
1 huruf Inggris, 1 tanda baca, atau 1 spasi = 1 karakter
Qwen-TTS Realtime
Model | Versi | Jendela konteks | Input maksimum | Output maksimum | Biaya input | Biaya output | Bahasa yang didukung |
(Token) | (Ribu token) | ||||||
qwen-tts-realtime Kemampuan saat ini setara dengan qwen-tts-realtime-2025-07-15. | Stable | 8.192 | 512 | 7.680 | $0,345 | $1,721 | Mandarin, Inggris |
qwen-tts-realtime-latest Kemampuan saat ini setara dengan qwen-tts-realtime-2025-07-15. | Latest | Mandarin, Inggris | |||||
qwen-tts-realtime-2025-07-15 | Snapshot | Mandarin, Inggris | |||||
Aturan konversi audio ke token: 1 detik audio setara dengan 50 token. Audio berdurasi kurang dari 1 detik ditagih sebagai 50 token.
CosyVoice
CosyVoice adalah model sintesis suara generatif skala besar generasi baru dari Qwen Lab yang mengintegrasikan pemahaman teks dan pembangkitan suara berdasarkan model bahasa skala besar yang telah melalui proses pre-train. Model ini mendukung sintesis teks-ke-ucapan secara real-time dan streaming. Penggunaan | Coba online | Python SDK
Fitur ini hanya tersedia di Wilayah China (Beijing).
Model | Harga |
cosyvoice-v2 | $0,286706 per 10.000 karakter |
Setiap karakter Mandarin dihitung sebagai dua karakter, sedangkan setiap huruf Inggris, tanda baca, dan spasi dihitung sebagai satu karakter.
Speech recognition and translation (speech-to-text)
Qwen3-LiveTranslate-Flash-Realtime
Qwen3-LiveTranslate-Flash-Realtime adalah model terjemahan audio dan video multibahasa secara real-time yang mendukung pengenalan 18 bahasa dan penerjemahan ke dalam 10 bahasa target dalam bentuk audio secara real-time.
Fitur utama:
Dukungan multibahasa: Mendukung 18 bahasa, termasuk Tiongkok, Inggris, Prancis, Jerman, Rusia, Jepang, dan Korea, serta 6 dialek Tiongkok seperti Mandarin, Kanton, dan Sichuan.
Peningkatan visual: Meningkatkan akurasi terjemahan dengan memanfaatkan konten visual. Model ini menganalisis gerakan bibir, aksi, dan teks pada layar untuk meningkatkan kualitas terjemahan di lingkungan bising atau untuk kata-kata yang memiliki banyak makna.
Latensi rendah: Mencapai latensi interpretasi simultan serendah 3 detik.
Interpretasi simultan tanpa kehilangan kualitas: Menggunakan teknologi prediksi unit semantik untuk mengatasi masalah urutan kata lintas bahasa, sehingga kualitas terjemahan real-time hampir setara dengan terjemahan offline.
Suara alami: Menghasilkan ucapan menyerupai manusia dengan suara yang alami, menyesuaikan nada dan emosi berdasarkan konten audio sumber.
Model ini hanya tersedia di wilayah Singapura.
Model | Version | Context window | Max input | Max output | Free quota |
(Tokens) | |||||
qwen3-livetranslate-flash-realtime Kemampuannya setara dengan qwen3-livetranslate-flash-realtime-2025-09-22. | Stable | 53.248 | 49.152 | 4.096 | 1 juta token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
qwen3-livetranslate-flash-realtime-2025-09-22 | Snapshot | ||||
Setelah kuota gratis habis, input dan output akan dikenai biaya sebagai berikut:
|
|
Qwen-ASR
Dibangun di atas model dasar multi-modal Qwen, model ini mendukung fitur-fitur seperti pengenalan multibahasa, pengenalan nyanyian, dan penolakan noise.Usage
International (Singapore)
Model | Version | Supported languages | Supported sample rates | Unit price | Free quota (Note) |
qwen3-asr-flash Saat ini merupakan alias untuk qwen3-asr-flash-2025-09-08 | Stable version | Tiongkok (termasuk Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, dan Spanyol | 16 kHz | $0,000035/detik | 36.000 detik (10 jam) Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
qwen3-asr-flash-2025-09-08 | Snapshot version |
Mainland China (Beijing)
Model | Version | Supported languages | Supported sample rates | Unit price |
qwen3-asr-flash Alias untuk qwen3-asr-flash-2025-09-08 | Stable version | Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, dan Spanyol | 16 kHz | $0,000032/detik |
qwen3-asr-flash-2025-09-08 | Snapshot version |
Qwen-ASR-Realtime
Model pengenalan suara real-time Qwen dilengkapi fitur deteksi bahasa otomatis dan mampu mendeteksi 11 bahasa serta mentranskripsi audio secara akurat di lingkungan kompleks.Usage | API reference
International (Singapore)
Model | Version | Supported languages | Supported sample rates | Unit price | Free quota (Note) |
qwen3-asr-flash-realtime Saat ini setara dengan qwen3-asr-flash-realtime-2025-10-27 | Stable | Tiongkok (Mandarin, Sichuan, Minnan, Wu), Kanton, Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Türkiye, Ukraina, Vietnam | 8 kHz, 16 kHz | $0,000090/detik | 36.000 detik (10 jam) Masa berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio |
qwen3-asr-flash-realtime-2025-10-27 | Snapshot |
Mainland China (Beijing)
Model | Version | Supported languages | Supported sample rates | Unit price |
qwen3-asr-flash-realtime Saat ini setara dengan qwen3-asr-flash-realtime-2025-10-27. | Stable | Tiongkok (Mandarin, Sichuan, Minnan, Wu), Kanton, Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Türkiye, Ukraina, Vietnam | 8 kHz, 16 kHz | $0,000047/detik |
qwen3-asr-flash-realtime-2025-10-27 | Snapshot |
Paraformer
Paraformer adalah model pengenalan suara dari Tongyi Lab yang tersedia dalam dua versi: pengenalan file audio dan pengenalan suara real-time.
Audio file recognition
Fitur ini hanya tersedia di wilayah Mainland China (Beijing).
Model | Supported languages | Supported sample rates | Scenarios | Supported audio formats | Unit price |
paraformer-v2 | Tiongkok (Mandarin, Kanton, Wu, Minnan, Timur Laut, Gansu, Guizhou, Henan, Hubei, Hunan, Ningxia, Shanxi, Shaanxi, Shandong, Sichuan, Tianjin, Jiangxi, Yunnan, Shanghainese), Inggris, Jepang, Korea, Jerman, Prancis, Rusia | Any | ApsaraVideo Live | aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, wmv | $0,000012/detik |
paraformer-8k-v2 | Tiongkok (Mandarin) | 8 kHz | Phone calls |
Real-time speech recognition
Fitur ini hanya tersedia di wilayah Mainland China (Beijing).
Model | Bahasa yang didukung | Laju sampel yang didukung | Skenario | Format audio yang didukung | Harga satuan |
paraformer-realtime-v2 | Chinese (Mandarin, Cantonese, Wu, Minnan, Northeastern, Gansu, Guizhou, Henan, Hubei, Hunan, Ningxia, Shanxi, Shaanxi, Shandong, Sichuan, Tianjin, Jiangxi, Yunnan, Shanghainese), English, Japanese, Korean, German, French, Russian Mendukung peralihan antar multiple bahasa. | Any | ApsaraVideo Live, konferensi, dan lainnya | pcm, wav, mp3, opus, speex, aac, amr | $0.000035/second |
paraformer-realtime-8k-v2 | 8 kHz | Call center dan lainnya |
Fun-ASR
Fun-ASR adalah model pengenalan suara dari Tongyi Bailin yang tersedia dalam dua versi: pengenalan file audio dan pengenalan suara real-time.
Audio file recognition
International (Singapore)
Model | Version | Supported languages | Supported sample rates | Scenarios | Supported audio formats | Unit price | Free quota (Note) |
fun-asr Saat ini setara dengan fun-asr-2025-11-07. | Stable | Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, Jin; serta aksen Mandarin dari wilayah seperti Zhongyuan, Southwest, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Northeast, Beijing, dan Hong Kong/Taiwan, termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia), Inggris, Jepang | Any | ApsaraVideo Live, phone calls, conference interpretation, and more | aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, wmv | $0,000035/detik | 36.000 detik (10 jam) Masa berlaku: 90 hari |
fun-asr-2025-11-07 Dibandingkan dengan fun-asr-2025-08-25, versi ini dioptimalkan untuk Voice Activity Detection (VAD) jarak jauh guna meningkatkan akurasi pengenalan. | Snapshot | ||||||
fun-asr-2025-08-25 | Tiongkok (Mandarin), Inggris |
Mainland China (Beijing)
Model | Version | Supported languages | Supported sample rates | Scenarios | Supported audio formats | Unit price |
fun-asr Saat ini setara dengan fun-asr-2025-11-07 | Stable | Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, Jin; serta aksen Mandarin dari wilayah seperti Zhongyuan, Southwest, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Northeast, Beijing, dan Hong Kong/Taiwan, termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia), Inggris, Jepang | Any | ApsaraVideo Live, panggilan telepon, interpretasi konferensi, dan lainnya | aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, wmv | $0,000032/detik |
fun-asr-2025-11-07 Dibandingkan dengan fun-asr-2025-08-25, versi ini dioptimalkan untuk Voice Activity Detection (VAD) jarak jauh guna meningkatkan akurasi pengenalan. | Snapshot | |||||
fun-asr-2025-08-25 | Tiongkok (Mandarin), Inggris | |||||
fun-asr-mtl Saat ini setara dengan fun-asr-mtl-2025-08-25 | Stable | Tiongkok (Mandarin, Kanton), Inggris, Jepang, Thailand, Vietnam, Indonesia | ||||
fun-asr-mtl-2025-08-25 | Snapshot |
Real-time speech recognition
Fitur ini hanya tersedia di wilayah Mainland China (Beijing).
Model | Version | Supported languages | Supported sample rates | Scenarios | Supported audio formats | Unit price |
fun-asr-realtime Saat ini setara dengan fun-asr-realtime-2025-11-07 | Stable | Bahasa Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, Jin), serta aksen Mandarin dari berbagai wilayah seperti Zhongyuan, Southwest, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Northeast, Beijing, dan Hong Kong/Taiwan—termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia—serta bahasa Inggris dan Jepang | 16 kHz | ApsaraVideo Live, konferensi, pusat panggilan, dan lainnya | pcm, wav, mp3, opus, speex, aac, amr | $0,000047/detik |
fun-asr-realtime-2025-11-07 Dibandingkan dengan fun-asr-realtime-2025-09-15, versi ini dioptimalkan untuk Voice Activity Detection (VAD) jarak jauh guna meningkatkan akurasi pengenalan. | Snapshot | |||||
fun-asr-realtime-2025-09-15 | Bahasa Tiongkok (Mandarin), Inggris |
Penyematan teks
Model penyematan teks mengonversi teks menjadi representasi numerik untuk mendukung berbagai tugas, seperti pencarian, pengelompokan, rekomendasi, dan klasifikasi. Penagihan untuk model-model ini didasarkan pada jumlah token input. Referensi API
Internasional (Singapura)
Model | Embedding dimension | Batch size | Maximum tokens per row | Supported languages | Price (Million input tokens) | Free Quota |
text-embedding-v4 Pos ini merupakan bagian dari seri Qwen3-Embedding. | 2.048, 1.536, 1.024 (default), 768, 512, 256, 128, atau 64 | 10 | 8.192 | Lebih dari 100 bahasa, termasuk Chinese, English, Spanish, French, Portuguese, Indonesian, Japanese, Korean, German, dan Russian, serta berbagai bahasa pemrograman | $0,07 | 1.000.000 token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
text-embedding-v3 | 1.024 (default), 768, atau 512 | 10 | 8.192 | Lebih dari 50 bahasa, seperti Chinese, English, Spanish, French, Portuguese, Indonesian, Japanese, Korean, German, dan Russian | 500.000 token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
Tiongkok Daratan (Beijing)
Model | Dimensi penyematan | Ukuran batch | Maksimum token per baris | Bahasa yang didukung | Harga (Juta token input) | Kuota gratis |
text-embedding-v4 Pos ini merupakan bagian dari seri Qwen3-Embedding. | 2.048, 1.536, 1.024 (default), 768, 512, 256, 128, atau 64 | 10 | 8.192 | Tiongkok, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, Rusia, lebih dari 100 bahasa utama lainnya, serta berbagai bahasa pemrograman | $0,072 | Tidak ada kuota gratis |
Multimodal embedding
Model multimodal embedding mengonversi data seperti teks, citra, dan video menjadi vektor bilangan titik mengambang, memungkinkan aplikasi seperti klasifikasi video, klasifikasi citra, dan pengambilan citra-teks. Referensi API
Internasional (Singapura)
Model | Format data | Dimensi embedding | Harga satuan (per juta token input) | Kuota gratis (Lihat) |
tongyi-embedding-vision-plus | float(32) | 1.152 | $0,09 | 1.000.000 token Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio. |
tongyi-embedding-vision-flash | float(32) | 768 | Citra/Video: $0,03 Teks: $0,09 |
Tiongkok Daratan (Beijing)
Model | Tipe data | Dimensi embedding | Harga satuan (per 1.000 token input) | Kuota gratis (Catatan) |
multimodal-embedding-v1 | float(32) | 1.024 | Uji coba gratis | Tidak ada batas kuota token |
Text rerank
Fitur ini biasanya digunakan untuk semantic retrieval. Diberikan sebuah kueri, fitur ini mengurutkan daftar dokumen kandidat dalam urutan menurun berdasarkan relevansi semantiknya. Referensi API.
Fitur ini hanya tersedia di wilayah China (Beijing).
Model | Maximum number of documents | Max input tokens per item | Max input tokens | Supported languages | Price (Million input tokens) |
gte-rerank-v2 | 500 | 4.000 | 30.000 | Lebih dari 50 bahasa, termasuk Chinese, English, Japanese, Korean, Thai, Spanish, French, Portuguese, German, Indonesian, dan Arabic | $0,115 |
Max input tokens per item: Setiap kueri atau dokumen dibatasi hingga 4.000 token. Input yang melebihi batas ini akan dipotong.
Maximum number of documents: Setiap permintaan dibatasi hingga 500 dokumen.
Max input tokens: Jumlah total token untuk semua kueri dan dokumen dalam satu permintaan dibatasi hingga 30.000.
Domain-specific
Intent recognition
Model pengenalan maksud Qwen mampu mengurai maksud pengguna secara cepat dan akurat dalam hitungan milidetik serta memilih alat yang tepat untuk menyelesaikan masalah pengguna. Referensi API | Penggunaan
Fitur ini hanya tersedia di Wilayah China (Beijing).
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
tongyi-intent-detect-v3 | 8.192 | 8.192 | 1.024 | $0,058 | $0,144 |
Role-playing
Model role-playing Qwen sangat ideal untuk skenario yang memerlukan percakapan menyerupai manusia, seperti interaksi sosial virtual, NPC game, replikasi karakter IP, perangkat keras, mainan, dan sistem dalam kendaraan. Model ini menawarkan kemampuan unggul dalam kesetiaan karakter, perkembangan percakapan, dan pendengaran empatik dibandingkan model Qwen lainnya. Penggunaan
International (Singapore)
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
qwen-plus-character-ja | 8.192 | 7.680 | 512 | $0,5 | $1,4 |
Mainland China (Beijing)
Model | Context window | Max input | Max output | Input cost | Output cost |
(Tokens) | (Million tokens) | ||||
qwen-plus-character | 32.768 | 32.000 | 4.096 | $0,115 | $0,287 |

























































