Generasi teks - Qwen
Qwen-Max
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Faktor yang memengaruhi penagihan: Jika suatu model mendukung Batch Invocation, baik token input maupun token output dikenai biaya sebesar 50% dari harga inferensi real-time. Jika suatu model mendukung Context Caching, hanya token input yang memenuhi syarat untuk diskon. Kedua diskon tersebut tidak dapat diterapkan secara bersamaan.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons | Kuota gratis (Catatan) |
qwen3-max Pemanggilan batch diskon 50% Cache konteks diskon | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 | 1 juta token masing-masing Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
32K<Token≤128K | $2,4 | $12 | |||
128K<Token≤252K | $3 | $15 | |||
qwen3-max-2026-01-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 | |
32K<Token≤128K | $2,4 | $12 | |||
128K<Token≤252K | $3 | $15 | |||
qwen3-max-2025-09-23 | Tanpa pemikiran sama sekali | 0<Token≤32K | $1,2 | $6 | |
32K<Token≤128K | $2,4 | $12 | |||
128K<Token≤252K | $3 | $15 | |||
qwen3-max-preview Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 | |
32K<Token≤128K | $2,4 | $12 | |||
128K<Token≤252K | $3 | $15 |
Model lainnya
Model | Mode | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-max Pemanggilan batch diskon 50% | Non-thinking only | Tidak ada penetapan harga bertingkat | $1,6 | $6,4 | 1 juta token masing-masing |
qwen-max-latest | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $1,6 | $6,4 | |
qwen-max-2025-01-25 | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $1,6 | $6,4 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-max Diskon cache konteks | Hanya tidak berpikir | 0<Token≤32K | $0,359 | $1,434 |
32K<Token≤128K | $0,574 | $2,294 | ||
128K<Token≤252K | $1,004 | $4,014 | ||
qwen3-max-2025-09-23 | Hanya tidak berpikir | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,434 | $5,735 | ||
128K<Token≤252K | $2,151 | $8,602 | ||
qwen3-max-preview Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,434 | $5,735 | ||
128K<Token≤252K | $2,151 | $8,602 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-max Pemanggilan batch diskon 50% Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,359 | $1,434 |
32K<Token≤128K | $0,574 | $2,294 | ||
128K<Token≤252K | $1,004 | $4,014 | ||
qwen3-max-2026-01-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,359 | $1,434 |
32K<Token≤128K | $0,574 | $2,294 | ||
128K<Token≤252K | $1,004 | $4,014 | ||
qwen3-max-2025-09-23 | Hanya tidak berpikir | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,434 | $5,735 | ||
128K<Token≤252K | $2,151 | $8,602 | ||
qwen3-max-preview Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1.434 | $5,735 | ||
128K<Token≤252K | $2,151 | $8,602 |
Model lainnya
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-max | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $0,345 | $1,377 |
qwen-max-latest | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $0,345 | $1,377 |
qwen-max-2025-01-25 | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $0,345 | $1,377 |
qwen-max-2024-09-19 | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $2,868 | $8,602 |
Tiongkok (Hong Kong)
Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), sedangkan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok (Hong Kong).
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-max Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 |
32K<Token≤128K | $2,4 | $12 | ||
128K<Token≤252K | $3 | $15 | ||
qwen3-max-2026-01-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 |
32K<Token≤128K | $2,4 | $12 | ||
128K<Token≤252K | $3 | $15 |
UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dibatasi hanya di UE.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-max Pemanggilan batch diskon 50% Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 |
32K<Token≤128K | $2,4 | $12 | ||
128K<Token≤252K | $3 | $15 | ||
qwen3-max-2026-01-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 |
32K<Token≤128K | $2,4 | $12 | ||
128K<Token≤252K | $3 | $15 |
Qwen-Plus
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | |
Non-thinking mode | Mode berpikir (CoT + respons) | ||||
qwen3.5-plus | 0<Token≤256K | $0,4 | $2,4 | $2,4 | 1 juta token masing-masing |
256K<Token≤1M | $0,5 | $3 | $3 | ||
qwen3.5-plus-2026-02-15 | 0<Token≤256K | $0,4 | $2,4 | $2,4 | |
256K<Token≤1M | $0,5 | $3 | $3 | ||
qwen-plus | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-latest | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-2025-12-01 | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-2025-09-11 | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-2025-07-28 | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-2025-07-14 | Tidak ada penetapan harga bertingkat | $0,4 | $1,2 | $4 | |
qwen-plus-2025-04-28 | Tidak ada penetapan harga bertingkat | $0,4 | $1,2 | $4 | |
qwen-plus-2025-01-25 | Tidak ada penetapan harga bertingkat | $0,4 | $1,2 | - | |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Mode tidak berpikir | Mode berpikir (CoT + respons) | |||
qwen3.5-plus | 0<Token≤128K | $0,115 | $0,688 | $0,688 |
128K<Token≤256K | $0,287 | $1,72 | $1,72 | |
256K<Token≤1M | $0,573 | $3,44 | $3,44 | |
qwen3.5-plus-2026-02-15 | 0<Token≤128K | $0,115 | $0,688 | $0,688 |
128K<Token≤256K | $0,287 | $1,72 | $1,72 | |
256K<Token≤1M | $0,573 | $3,44 | $3,44 | |
qwen-plus | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-12-01 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-09-11 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-07-28 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi model dibatasi hanya di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Non-thinking mode | Mode berpikir (CoT + tanggapan) | |||
qwen-plus-us | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
qwen-plus-2025-12-01-us | 0<Token≤256K | $0,4 | $1.2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Non-thinking mode | Mode berpikir (CoT + respons) | |||
qwen3.5-plus | 0<Token≤128K | $0,115 | $0,688 | $0,688 |
128K<Token≤256K | $0,287 | $1,72 | $1,72 | |
256K<Token≤1M | $0,573 | $3,44 | $3,44 | |
qwen3.5-plus-2026-02-15 | 0<Token≤128K | $0,115 | $0,688 | $0,688 |
128K<Token≤256K | $0,287 | $1,72 | $1,72 | |
256K<Token≤1M | $0,573 | $3,44 | $3,44 | |
qwen-plus | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-latest | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6.881 | $9,175 | |
qwen-plus-2025-12-01 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-09-11 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-07-28 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-07-14 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 | $1,147 |
qwen-plus-2025-04-28 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 | $1,147 |
Model lainnya
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-plus-2025-01-25 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 |
qwen-plus-2025-01-12 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 |
qwen-plus-2024-12-20 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 |
Tiongkok (Hong Kong)
Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), sedangkan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok (Hong Kong).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Mode tidak berpikir | Mode berpikir (CoT + respons) | |||
qwen-plus | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
qwen-plus-2025-12-01 | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dibatasi hanya di UE.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Tidak berpikir | Berpikir (CoT + respons) | |||
qwen-plus | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
qwen-plus-2025-12-01 | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
Qwen-Flash
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Faktor yang memengaruhi penagihan: Jika suatu model mendukung Batch Invocation, baik token input maupun token output dikenai biaya sebesar 50% dari harga inferensi real-time. Jika suatu model mendukung Context Caching, hanya token input yang memenuhi syarat untuk diskon. Kedua diskon tersebut tidak dapat diterapkan secara bersamaan.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen3.5-flash Pemanggilan batch diskon 50% Diskon cache konteks | 0<Token≤1M | $0,1 | $0,4 | 1 juta token masing-masing |
qwen3.5-flash-2026-02-23 | 0<Token≤1M | $0,1 | $0,4 | |
qwen-flash Pemanggilan batch diskon 50% Diskon cache konteks | 0<Token≤256K | $0,05 | $0,4 | |
256K<Token≤1M | $0,25 | $2 | ||
qwen-flash-2025-07-28 | 0<Token≤256K | $0,05 | $0,4 | |
256K<Token≤1M | $0,25 | $2 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3.5-flash | 0<Token≤128K | $0,029 | $0,287 |
128K<Token≤256K | $0,115 | Rp1.147 | |
256K<Token≤1M | $0,172 | $1,72 | |
qwen3.5-flash-2026-02-23 | 0<Token≤128K | $0,029 | $0,287 |
128K<Token≤256K | $0,115 | $1,147 | |
256K<Token≤1M | $0,172 | $1,72 | |
qwen-flash Diskon cache konteks | 0<Token≤128K | $0,022 | $0,216 |
128K<Token≤256K | $0,087 | $0,861 | |
256K<Token≤1M | $0,173 | $1,721 | |
qwen-flash-2025-07-28 | 0<Token≤128K | $0,022 | $0,216 |
128K<Token≤256K | $0,087 | $0,861 | |
256K<Token≤1M | $0,173 | $1,721 |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi model dibatasi hanya di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-flash | 0<Token≤256K | $0,05 | $0,4 |
256K<Token≤1M | $0,25 | $2 | |
qwen-flash-2025-07-28 | 0<Token≤256K | $0,05 | $0,4 |
256K<Token≤1M | $0,25 | $2 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3.5-flash | 0<Token≤128K | $0,029 | $0,287 |
128K<Token≤256K | $0,115 | $1,147 | |
256K<Token≤1M | $0,172 | $1,72 | |
qwen3.5-flash-2026-02-23 | 0<Token≤128K | $0,029 | $0,287 |
128K<Token≤256K | $0,115 | $1,147 | |
256K<Token≤1M | $0,172 | $1,72 | |
qwen-flash Diskon cache konteks | 0<Token≤128K | $0,022 | $0,216 |
128K<Token≤256K | $0,087 | $0,861 | |
256K<Token≤1M | $0,173 | $1,721 | |
qwen-flash-2025-07-28 | 0<Token≤128K | $0,022 | $0,216 |
128K<Token≤256K | $0,087 | $0,861 | |
256K<Token≤1M | $0,173 | $1,721 |
Tiongkok (Hong Kong)
Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), sedangkan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok (Hong Kong).
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3.5-flash Diskon cache konteks | 0<Token≤1M | $0,1 | $0,4 |
qwen3.5-flash-2026-02-23 | 0<Token≤1M | $0,1 | $0,4 |
UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dibatasi hanya di UE.
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3.5-flash Diskon cache konteks | 0<Token≤1M | $0,1 | $0,4 |
qwen3.5-flash-2026-02-23 | 0<Token≤1M | $0,1 | $0,4 |
Qwen-Turbo
Qwen-Turbo tidak akan diperbarui lagi. Kami merekomendasikan Qwen-Flash sebagai penggantinya.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Untuk model yang mendukung Batch Invocation, harga satuan untuk token input dan token output ditagih sebesar 50% dari harga inferensi real-time.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | |
Non-thinking mode | Mode berpikir (CoT + respons) | |||
qwen-turbo Pemanggilan batch diskon 50% | $0,05 | $0,2 | $0,5 | 1 juta token masing-masing |
qwen-turbo-latest | $0,05 | $0,2 | $0,5 | |
qwen-turbo-2025-04-28 | $0,05 | $0,2 | $0,5 | |
Model lainnya
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-turbo-2024-11-01 | $0,05 | $0,2 | 1 juta token masing-masing |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Non-thinking mode | Mode berpikir (CoT + respons) | ||
qwen-turbo | $0,044 | $0,087 | $0,431 |
qwen-turbo-latest | $0,044 | $0,087 | $0,431 |
qwen-turbo-2025-07-15 | $0,044 | $0,087 | $0,431 |
qwen-turbo-2025-04-28 | $0,044 | $0,087 | $0,431 |
QwQ
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwq-plus | $0,8 | $2,4 | 1 juta token |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwq-plus | $0,230 | $0,574 |
qwq-plus-latest | $0,230 | $0,574 |
qwq-plus-2025-03-05 | $0,230 | $0,574 |
Qwen-Long
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-long-latest | $0,072 | $0,287 | Tidak ada kuota gratis |
qwen-long-2025-01-25 | $0,072 | $0,287 |
Qwen-Omni
Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token berdasarkan modalitas berbeda, lihat Penagihan dan pembatasan laju.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||||
Input: Text | Input: Audio | Input: Image/Video | Output: Text Input teks biasa | Output: Text Input multimodal | Output: Text+Audio Hanya audio yang dikenai tagihan | |||
qwen3-omni-flash | Thinking and non-thinking | $0,43 | $3,81 | $0,78 | $1,66 | $3,06 | $15,11 | 1 juta token masing-masing (tidak tergantung pada modalitas) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-omni-flash-2025-12-01 | Thinking and non-thinking | $0,43 | $3,81 | $0,78 | $1,66 | $3,06 | $15,11 | |
qwen3-omni-flash-2025-09-15 | Thinking and non-thinking | $0,43 | $3,81 | $0,78 | $1,66 | $3,06 | $15,11 | |
More models
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||||
Input: Text | Input: Audio | Input: Image/Video | Output: Text Plain text input | Output: Text Multimodal input | Output: Text+Audio Only audio is billed | ||
qwen-omni-turbo | $0.07 | $4.44 | $0.21 | $0.27 | $0.63 | $8.89 | 1 juta token masing-masing (tidak tergantung pada modalitas) Berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen-omni-turbo-latest | $0.07 | $4.44 | $0.21 | $0.27 | $0.63 | $8.89 | |
qwen-omni-turbo-2025-03-26 | $0.07 | $4.44 | $0.21 | $0.27 | $0.63 | $8.89 | |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi untuk inferensi model dibatasi hanya untuk Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||||
Input: Text | Input: Audio Bagian audio ditagih secara terpisah | Input: Image/Video | Output: Text Input teks biasa | Output: Text Input multimodal | Output: Text+Audio Hanya audio yang ditagih | ||
qwen3-omni-flash | Thinking and non-thinking | $0,258 | $2,265 | $0,473 | $0,989 | $1,821 | $8.974 |
qwen3-omni-flash-2025-12-01 | Thinking and non-thinking | $0,258 | $2,265 | $0,473 | $0,989 | $1,821 | $8,974 |
qwen3-omni-flash-2025-09-15 | Thinking and non-thinking | $0,258 | $2,265 | $0,473 | $0,989 | $1,821 | $8,974 |
Model lainnya
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||||
Input: Text | Input: Audio Bagian audio ditagih secara terpisah | Input: Image/Video | Output: Text Input teks biasa | Output: Text Input multimodal | Output: Text+Audio Hanya audio yang ditagih | |
qwen-omni-turbo | $0,058 | $3,584 | $0,216 | $0,230 | $0,646 | $7,168 |
qwen-omni-turbo-latest | $0,058 | $3,584 | $0,216 | $0,230 | $0,646 | $7,168 |
qwen-omni-turbo-2025-03-26 | $0,058 | $3,584 | $0,216 | $0,230 | $0,646 | $7,168 |
qwen-omni-turbo-2025-01-19 | $0,058 | $3,584 | $0,216 | $0,230 | $0,646 | $7,168 |
Qwen-Omni-Realtime
Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan penghitungan token pada berbagai modalities, lihat Billing and rate limiting.
International
Dalam mode penyebaran International, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||||
Input: Text | Input: Audio Bagian audio ditagih secara terpisah | Input: Image | Output: Text Input teks biasa | Output: Text Input multimodal | Output: Text+Audio Hanya audio yang ditagih | ||
qwen3-omni-flash-realtime | $0,52 | $4,57 | $0,94 | $1,99 | $3,67 | $18,13 | 1 juta token masing-masing (tidak tergantung modality) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-omni-flash-realtime-2025-12-01 | $0,52 | $4,57 | $0,94 | $1,99 | $3,67 | $18,13 | |
qwen3-omni-flash-2025-09-15-realtime | $0,52 | $4,57 | $0,94 | $1,99 | $3,67 | $18,13 | |
qwen-omni-turbo-realtime | $0,270 | $4,440 | $0,840 | $1,070 | $2,520 | $8.890 | |
qwen-omni-turbo-realtime-latest | $0,270 | $4,440 | $0,840 | $1,070 | $2,520 | $8,890 | |
qwen-omni-turbo-realtime-2025-05-08 | $0,270 | $4,440 | $0,840 | $1,070 | $2,520 | $8.890 | |
Chinese Mainland
Dalam mode penyebaran Chinese Mainland, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok daratan.
Mode penyebaran Chinese Mainland tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||||
Input: Text | Input: Audio Bagian audio ditagih secara terpisah | Input: Image | Output: Text Input teks biasa | Output: Text Input multimodal | Output: Text+Audio Hanya audio yang ditagih | |
qwen3-omni-flash-realtime | $0,315 | $2,709 | $0,559 | $1,19 | $2,179 | $10,766 |
qwen3-omni-flash-realtime-2025-12-01 | $0,315 | $2,709 | $0,559 | $1,19 | $2,179 | $10,766 |
qwen3-omni-flash-realtime-2025-09-15 | $0,315 | $2,709 | $0,559 | $1,19 | $2,179 | $10,766 |
qwen-omni-turbo-realtime | $0,230 | $3,584 | $0,861 | $0,918 | $2,581 | $7,168 |
qwen-omni-turbo-realtime-latest | $0,230 | $3,584 | $0,861 | $0,918 | $2,581 | $7,168 |
qwen-omni-turbo-realtime-2025-05-08 | $0,230 | $3,584 | $0,861 | $0,918 | $2,581 | $7,168 |
QVQ
Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token pada berbagai modalities, lihat Billing and rate limiting.
Internasional
Dalam International deployment mode, endpoint dan penyimpanan data berlokasi di Singapore region, sedangkan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qvq-max | $1,2 | $4,8 | masing-masing 1 juta token |
qvq-max-latest | $1,2 | $4,8 | |
qvq-max-2025-03-25 | $1,2 | $4,8 |
Tiongkok Daratan
Dalam Chinese Mainland deployment mode, endpoint dan penyimpanan data berlokasi di Beijing region, dan sumber daya komputasi untuk inferensi model dibatasi hanya di Tiongkok daratan.
Mode penyebaran Tiongkok daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qvq-max | $1,147 | $4,588 |
qvq-max-latest | $1,147 | $4,588 |
qvq-max-2025-05-15 | $1,147 | $4,588 |
qvq-max-2025-03-25 | $1,147 | $4,588 |
qvq-plus | $0,287 | $0,717 |
qvq-plus-latest | $0,287 | $0,717 |
qvq-plus-2025-05-15 | $0,287 | $0,717 |
Qwen-VL
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di Wilayah Singapura, sedangkan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + response | Kuota gratis (Catatan) |
qwen3-vl-plus Diskon Context cache | Thinking and non-thinking | 0<Token≤32K | $0,2 | $1,6 | 1 juta token masing-masing |
32K<Token≤128K | $0,3 | $2,4 | |||
128K<Token≤256K | $0,6 | $4,8 | |||
qwen3-vl-plus-2025-12-19 | Thinking and non-thinking | 0<Token≤32K | $0,2 | $1,6 | |
32K<Token≤128K | $0,3 | $2,4 | |||
128K<Token≤256K | $0,6 | $4,8 | |||
qwen3-vl-plus-2025-09-23 | Thinking and non-thinking | 0<Token≤32K | $0,2 | $1,6 | |
32K<Token≤128K | $0,3 | $2,4 | |||
128K<Token≤256K | $0,6 | $4,8 | |||
qwen3-vl-flash Context cache diskon | Thinking and non-thinking | 0<Token≤32K | $0,05 | $0,4 | |
32K<Token≤128K | $0,075 | $0,6 | |||
128K<Token≤256K | $0,12 | $0,96 | |||
qwen3-vl-flash-2026-01-22 | Thinking and non-thinking | 0<Token≤32K | $0,05 | $0,4 | |
32K<Token≤128K | $0,075 | $0,6 | |||
128K<Token≤256K | $0,12 | $0,96 | |||
qwen3-vl-flash-2025-10-15 | Thinking and non-thinking | 0<Token≤32K | $0,05 | $0,4 | |
32K<Token≤128K | $0,075 | $0,6 | |||
128K<Token≤256K | $0,12 | $0,96 |
Model lainnya
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-vl-max Diskon Context cache | Tidak ada penetapan harga bertingkat | $0,8 | $3,2 | 1 juta token masing-masing Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen-vl-max-latest | Tidak ada penetapan harga bertingkat | $0,8 | $3,2 | |
qwen-vl-max-2025-08-13 | Tidak ada penetapan harga bertingkat | $0,8 | $3,2 | |
qwen-vl-max-2025-04-08 | Tidak ada penetapan harga bertingkat | $0,8 | $3,2 | |
qwen-vl-plus Diskon Context cache | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 | |
qwen-vl-plus-latest | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 | |
qwen-vl-plus-2025-08-15 | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 | |
qwen-vl-plus-2025-05-07 | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 | |
qwen-vl-plus-2025-01-25 | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di Wilayah AS (Virginia) atau Wilayah Jerman (Frankfurt), dan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + response |
qwen3-vl-plus Diskon Context cache | Thinking and non-thinking | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-plus-2025-09-23 | Thinking and non-thinking | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-flash Diskon Context cache | Thinking and non-thinking | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 | ||
qwen3-vl-flash-2025-10-15 | Thinking and non-thinking | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di Wilayah AS (Virginia), dan sumber daya komputasi untuk inferensi model dibatasi hanya di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + response |
qwen3-vl-flash-us Cache konteks diskon | Thinking and non-thinking | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 | ||
qwen3-vl-flash-2026-01-22-us | Thinking and non-thinking | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 | ||
qwen3-vl-flash-2025-10-15-us | Thinking and non-thinking | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi untuk inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + response |
qwen3-vl-plus Diskon Context cache | Thinking and non-thinking | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-plus-2025-12-19 | Thinking and non-thinking | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-plus-2025-09-23 | Thinking and non-thinking | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-flash Diskon Context cache | Thinking and non-thinking | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 | ||
qwen3-vl-flash-2026-01-22 | Thinking and non-thinking | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 | ||
qwen3-vl-flash-2025-10-15 | Thinking and non-thinking | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 |
Model lainnya
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-vl-max Diskon Context cache | Tidak ada penetapan harga bertingkat | $0,23 | $0,574 |
qwen-vl-max-latest | Tidak ada penetapan harga bertingkat | $0,23 | $0,574 |
qwen-vl-max-2025-08-13 | Tidak ada penetapan harga bertingkat | $0,23 | $0,574 |
qwen-vl-max-2025-04-08 | Tidak ada penetapan harga bertingkat | $0,431 | $1,291 |
qwen-vl-max-2025-04-02 | Tidak ada penetapan harga bertingkat | $0,431 | $1,291 |
qwen-vl-max-2025-01-25 | Tidak ada penetapan harga bertingkat | $0,431 | $1,291 |
qwen-vl-max-2024-12-30 | Tidak ada penetapan harga bertingkat | $0,431 | $1,291 |
qwen-vl-max-2024-11-19 | Tidak ada penetapan harga bertingkat | $0,431 | $1,291 |
qwen-vl-plus Diskon Context cache | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 |
qwen-vl-plus-latest | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 |
qwen-vl-plus-2025-08-15 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 |
qwen-vl-plus-2025-07-10 | Tidak ada penetapan harga bertingkat | $0,022 | $0,216 |
qwen-vl-plus-2025-05-07 | Tidak ada penetapan harga bertingkat | $0,216 | $0,646 |
qwen-vl-plus-2025-01-25 | Tidak ada penetapan harga bertingkat | $0,216 | $0,646 |
qwen-vl-plus-2025-01-02 | Tidak ada penetapan harga bertingkat | $0,216 | $0,646 |
Tiongkok (Hong Kong)
Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), dan sumber daya komputasi untuk inferensi model dibatasi hanya di Tiongkok (Hong Kong).
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + response |
qwen3-vl-plus Diskon Context cache | Thinking and non-thinking | 0<Token≤32K | $0,2 | $1,6 |
32K<Token≤128K | $0,3 | $2,4 | ||
128K<Token≤256K | $0,6 | $4,8 | ||
qwen3-vl-plus-2025-12-19 | Thinking and non-thinking | 0<Token≤32K | $0,2 | $1,6 |
32K<Token≤128K | $0,3 | $2,4 | ||
128K<Token≤256K | $0,6 | $4,8 |
Dalam mode penyebaran Tiongkok (Hong Kong), titik akhir dan penyimpanan data berlokasi di Tiongkok (Hong Kong), dan sumber daya komputasi untuk inferensi model dibatasi hanya di Tiongkok (Hong Kong).UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), dan sumber daya komputasi untuk inferensi model dibatasi hanya di UE.
Model | Mode | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + response |
qwen3-vl-plus Diskon Context cache | Thinking and non-thinking | 0<Token≤32K | $0,2 | $1,6 |
32K<Token≤128K | $0,3 | $2,4 | ||
128K<Token≤256K | $0,6 | $4,8 | ||
qwen3-vl-plus-2025-12-19 | Thinking and non-thinking | 0<Token≤32K | $0,2 | $1,6 |
32K<Token≤128K | $0,3 | $2,4 | ||
128K<Token≤256K | $0,6 | $4,8 | ||
qwen3-vl-flash Diskon Context cache | Thinking and non-thinking | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 | ||
qwen3-vl-flash-2025-10-15 | Thinking and non-thinking | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 |
Qwen-OCR
Metode: Anda dikenai biaya berdasarkan jumlah token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-vl-ocr | $0,07 | $0,16 | masing-masing 1 juta token |
qwen-vl-ocr-2025-11-20 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-vl-ocr | $0,043 | $0,072 |
qwen-vl-ocr-2025-11-20 | $0,043 | $0,072 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi untuk inferensi model dibatasi hanya di Tiongkok daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-vl-ocr | $0,717 | $0,717 |
qwen-vl-ocr-latest | $0,043 | $0,072 |
qwen-vl-ocr-2025-11-20 | ||
qwen-vl-ocr-2025-08-28 | $0,717 | $0,717 |
qwen-vl-ocr-2025-04-13 | ||
qwen-vl-ocr-2024-10-28 |
Qwen-Math
Hanya mode penyebaran Tiongkok daratan yang didukung. Endpoint dan penyimpanan data berlokasi di Wilayah Beijing, serta sumber daya komputasi untuk inferensi model dibatasi hanya untuk Tiongkok daratan.
Metode: Anda dikenai biaya berdasarkan jumlah token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-math-plus | $0,574 | $1,721 | Tidak ada kuota gratis |
qwen-math-plus-latest | $0,574 | $1,721 | |
qwen-math-plus-2024-09-19 | $0,574 | $1,721 | |
qwen-math-plus-2024-08-16 | $0,574 | $1,721 | |
qwen-math-turbo | $0,287 | $0,861 | |
qwen-math-turbo-latest | $0,287 | $0,861 | |
qwen-math-turbo-2024-09-19 | $0,287 | $0,861 |
Qwen-Coder
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Faktor yang memengaruhi penagihan: Jika suatu model mendukung Context Caching, diskon hanya berlaku untuk token input.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di Wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-coder-plus Diskon Context cache | 0<Token≤32K | $1 | $5 | 1 juta token masing-masing |
32K<Token≤128K | $1,8 | $9 | ||
128K<Token≤256K | $3 | $15 | ||
256K<Token≤1M | $6 | $60 | ||
qwen3-coder-plus-2025-09-23 | 0<Token≤32K | $1 | $5 | |
32K<Token≤128K | $1,8 | $9 | ||
128K<Token≤256K | $3 | $15 | ||
256K<Token≤1M | $6 | $60 | ||
qwen3-coder-plus-2025-07-22 | 0<Token≤32K | $1 | $5 | |
32K<Token≤128K | $1,8 | $9 | ||
128K<Token≤256K | $3 | $15 | ||
256K<Token≤1M | $6 | $60 | ||
qwen3-coder-flash | 0<Token≤32K | $0,3 | $1,5 | |
32K<Token≤128K | $0,5 | $2,5 | ||
128K<Token≤256K | $0,8 | $4 | ||
256K<Token≤1M | $1,6 | $9,6 | ||
qwen3-coder-flash-2025-07-28 | 0<Token≤32K | $0,3 | $1,5 | |
32K<Token≤128K | $0,5 | $2,5 | ||
128K<Token≤256K | $0,8 | $4 | ||
256K<Token≤1M | $1,6 | $9,6 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di Wilayah AS (Virginia) atau Wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-plus Diskon Context cache | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28,671 | |
qwen3-coder-plus-2025-09-23 | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28,671 | |
qwen3-coder-plus-2025-07-22 | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28,671 | |
qwen3-coder-flash Diskon Context cache | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
256K<Token≤1M | $0,717 | $3,584 | |
qwen3-coder-flash-2025-07-28 | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
256K<Token≤1M | $0,717 | $3,584 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Seri qwen3-coder
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-plus Context cache diskon | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28.671 | |
qwen3-coder-plus-2025-09-23 | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28,671 | |
qwen3-coder-plus-2025-07-22 | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28,671 | |
qwen3-coder-flash | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
256K<Token≤1M | $0,717 | $3,584 | |
qwen3-coder-flash-2025-07-28 | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
256K<Token≤1M | $0,717 | $3,584 |
Seri qwen-coder sebelumnya
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-coder-plus | Tidak ada penetapan harga bertingkat | $0,502 | $1,004 |
qwen-coder-plus-latest | Tidak ada penetapan harga bertingkat | $0,502 | $1,004 |
qwen-coder-plus-2024-11-06 | Tidak ada penetapan harga bertingkat | $0,502 | $1.004 |
qwen-coder-turbo | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
qwen-coder-turbo-latest | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
qwen-coder-turbo-2024-09-19 | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), dan sumber daya komputasi inferensi model dibatasi hanya di wilayah UE.
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-next | 0<Token≤32K | $0,3 | $1,5 |
32K<Token≤128K | $0,5 | $2,5 | |
128K<Token≤256K | $0,8 | $4 |
Qwen-MT
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model dibatasi hanya di Amerika Serikat.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-mt-plus | $2,46 | $7,37 | 1 juta token masing-masing |
qwen-mt-flash | $0,16 | $0,49 | |
qwen-mt-lite | $0,12 | $0,36 | |
qwen-mt-turbo | $0,16 | $0,49 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-mt-plus | $0,259 | $0,775 |
qwen-mt-flash | $0,101 | $0,280 |
qwen-mt-lite | $0,086 | $0,229 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-mt-plus | $0,259 | $0,775 |
qwen-mt-flash | $0,101 | $0,280 |
qwen-mt-lite | $0,086 | $0,229 |
qwen-mt-turbo | $0,101 | $0,280 |
Qwen penambangan data
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-doc-turbo | $0,087 | $0,144 | Tidak ada kuota gratis |
Qwen riset mendalam
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-deep-research | $7,742 | $23,367 | Tidak ada kuota gratis |
Generasi teks - Qwen - Sumber terbuka
Qwen3.5
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Tidak berpikir | Berpikir (CoT + respons) | |||
qwen3.5-397b-a17b | 0<Token≤128K | $0,172 | $1,032 | $1,032 |
128K<Token≤256K | $0,43 | $2,58 | $2,58 | |
qwen3.5-122b-a10b | 0<Token≤128K | $0,115 | $0,917 | $0,917 |
128K<Token≤256K | $0,287 | $2,294 | $2,294 | |
qwen3.5-27b | 0<Token≤128K | $0,086 | $0,688 | $0,688 |
128K<Token≤256K | $0,258 | $2,064 | $2,064 | |
qwen3.5-35b-a3b | 0<Token≤128K | $0,057 | $0,459 | $0,459 |
128K<Token≤256K | $0,229 | $1,835 | $1,835 | |
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | |
Tidak berpikir | Berpikir (CoT + respons) | ||||
qwen3.5-397b-a17b | 0<Token≤256K | $0,6 | $3,6 | $3,6 | 1 juta token masing-masing |
qwen3.5-122b-a10b | 0<Token≤256K | $0,4 | $3,2 | $3,2 | |
qwen3.5-27b | 0<Token≤256K | $0,3 | $2,4 | $2,4 | |
qwen3.5-35b-a3b | 0<Token≤256K | $0,25 | $2 | $2 | |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Tidak berpikir | Berpikir (CoT + respons) | |||
qwen3.5-397b-a17b | 0<Token≤128K | $0,172 | $1,032 | $1,032 |
128K<Token≤256K | $0,43 | $2,58 | $2,58 | |
qwen3.5-122b-a10b | 0<Token≤128K | $0,115 | $0,917 | $0,917 |
128K<Token≤256K | $0,287 | $2,294 | $2,294 | |
qwen3.5-27b | 0<Token≤128K | $0,086 | $0,688 | $0,688 |
128K<Token≤256K | $0,258 | $2,064 | $2,064 | |
qwen3.5-35b-a3b | 0<Token≤128K | $0,057 | $0,459 | $0,459 |
128K<Token≤256K | $0,229 | $1,835 | $1,835 | |
Qwen3
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | |
Mode tidak berpikir | Mode berpikir | ||||
qwen3-next-80b-a3b-thinking | Hanya berpikir | $0,15 | - | $1,2 | 1 juta token masing-masing |
qwen3-next-80b-a3b-instruct | Hanya tidak berpikir | $0,15 | $1,2 | - | |
qwen3-235b-a22b-thinking-2507 | Hanya berpikir | $0,23 | - | $2,3 | |
qwen3-235b-a22b-instruct-2507 | Tanpa pemikiran sama sekali | $0,23 | $0,92 | - | |
qwen3-30b-a3b-thinking-2507 | Hanya berpikir | $0,2 | - | $2,4 | |
qwen3-30b-a3b-instruct-2507 | Tanpa pemikiran sama sekali | $0,2 | $0,8 | - | |
qwen3-235b-a22b | Berpikir dan tidak berpikir | $0,7 | $2,8 | $8,4 | |
qwen3-32b | Berpikir dan tidak berpikir | $0,16 | $0,64 | $0,64 | |
qwen3-30b-a3b | Berpikir dan tidak berpikir | $0,2 | $0,8 | $2,4 | |
qwen3-14b | Berpikir dan tidak berpikir | $0,35 | $1,4 | $4,2 | |
qwen3-8b | Berpikir dan tidak berpikir | $0,18 | $0,7 | $2,1 | |
qwen3-4b | Berpikir dan tidak berpikir | $0,11 | $0,42 | $1,26 | |
qwen3-1.7b | Berpikir dan tidak berpikir | $0,11 | $0,42 | $1,26 | |
qwen3-0.6b | Berpikir dan tidak berpikir | $0,11 | $0,42 | $1,26 | |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Mode tidak berpikir | Mode berpikir (CoT + respons) | |||
qwen3-next-80b-a3b-thinking | Hanya berpikir | $0,144 | - | $1,434 |
qwen3-next-80b-a3b-instruct | Hanya tidak berpikir | $0,144 | $0,574 | - |
qwen3-235b-a22b-thinking-2507 | Hanya berpikir | $0,287 | - | $2,3 |
qwen3-235b-a22b-instruct-2507 | Hanya tidak berpikir | $0,287 | $0,92 | - |
qwen3-30b-a3b-thinking-2507 | Hanya berpikir | $0,108 | - | $1,076 |
qwen3-30b-a3b-instruct-2507 | Hanya tidak berpikir | $0,108 | $0,431 | - |
qwen3-235b-a22b | Berpikir dan tidak berpikir | $0,287 | $1,147 | $2,868 |
qwen3-32b | Berpikir dan tidak berpikir | $0,287 | $0,64 | $0,64 |
qwen3-30b-a3b | Berpikir dan tidak berpikir | $0,108 | $0,431 | $1,076 |
qwen3-14b | Berpikir dan tidak berpikir | $0,144 | $0,574 | $1,434 |
qwen3-8b | Berpikir dan tidak berpikir | $0,072 | $0,287 | $0,717 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Non-thinking mode | Mode berpikir (CoT + respons) | |||
qwen3-next-80b-a3b-thinking | Hanya berpikir | $0,144 | - | $1,434 |
qwen3-next-80b-a3b-instruct | Hanya tidak berpikir | $0,144 | $0,574 | - |
qwen3-235b-a22b-thinking-2507 | Hanya berpikir | $0,287 | - | $2,868 |
qwen3-235b-a22b-instruct-2507 | Hanya tidak berpikir | $0,287 | $1,147 | - |
qwen3-30b-a3b-thinking-2507 | Hanya berpikir | $0,108 | - | $1,076 |
qwen3-30b-a3b-instruct-2507 | Non-thinking only | $0,108 | $0,431 | - |
qwen3-235b-a22b | Berpikir dan tidak berpikir | $0,287 | $1,147 | $2,868 |
qwen3-32b | Berpikir dan tidak berpikir | $0,287 | $1,147 | $2,868 |
qwen3-30b-a3b | Berpikir dan tidak berpikir | $0,108 | $0,431 | $1,076 |
qwen3-14b | Berpikir dan tidak berpikir | $0,144 | $0,574 | $1,434 |
qwen3-8b | Berpikir dan tidak berpikir | $0,072 | $0,287 | $0,717 |
qwen3-4b | Berpikir dan tidak berpikir | $0,044 | $0,173 | $0,431 |
qwen3-1.7b | Berpikir dan tidak berpikir | $0,044 | $0,173 | $0,431 |
qwen3-0.6b | Berpikir dan tidak berpikir | $0,044 | $0,173 | $0,431 |
QwQ - Sumber terbuka
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwq-32b | $0,287 | $0,861 | Tidak ada kuota gratis |
QwQ-Preview
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwq-32b-preview | $0,287 | $0,861 | Tidak ada kuota gratis |
Qwen2.5
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen2.5-14b-instruct-1m | $0,805 | $3,22 | 1 juta token masing-masing |
qwen2.5-7b-instruct-1m | $0,368 | $1,47 | |
qwen2.5-72b-instruct | $1,4 | $5,6 | |
qwen2.5-32b-instruct | $0,7 | $2,8 | |
qwen2.5-14b-instruct | $0,35 | $1,4 | |
qwen2.5-7b-instruct | $0,175 | $0,7 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen2.5-14b-instruct-1m | $0,144 | $0,431 |
qwen2.5-7b-instruct-1m | $0,072 | $0,144 |
qwen2.5-72b-instruct | $0,574 | $1,721 |
qwen2.5-32b-instruct | $0,287 | $0,861 |
qwen2.5-14b-instruct | $0,144 | $0,431 |
qwen2.5-7b-instruct | $0,072 | $0,144 |
qwen2.5-3b-instruct | $0,044 | $0,130 |
qwen2.5-1.5b-instruct | Gratis untuk waktu terbatas | |
qwen2.5-0.5b-instruct | ||
QVQ
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qvq-72b-preview | $1,721 | $5.161 | Tidak ada kuota gratis |
Qwen-Omni
Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token berdasarkan modalitas berbeda, lihat Penagihan dan pembatasan laju.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||||
Input: Teks | Input: Audio | Input: Gambar/Video | Output: Teks Input teks biasa | Output: Text Input multimodal | Output: Teks+Audio Hanya audio yang dikenai biaya | ||
qwen2.5-omni-7b | $0,10 | $6,76 | $0,28 | $0,40 | $0,84 | $13,51 | 1 juta token (terlepas dari modalitas) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||||
Input: Teks | Input: Audio | Input: Gambar/Video | Output: Teks Input teks biasa | Output: Teks Input multimodal | Output: Teks+Audio Hanya audio yang dikenai biaya | |
qwen2.5-omni-7b | $0,087 | $5,448 | $0,287 | $0,345 | $0,861 | $10,895 |
Qwen3-Omni-Captioner
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-omni-30b-a3b-captioner | $3,81 | $3,06 | 1 juta token |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-omni-30b-a3b-captioner | $2,265 | $1,821 |
Qwen-VL
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons | Kuota gratis (Catatan) |
qwen3-vl-235b-a22b-thinking | Hanya berpikir | $0,4 | $4 | 1 juta token masing-masing |
qwen3-vl-235b-a22b-instruct | Hanya tidak berpikir | $0,4 | $1,6 | |
qwen3-vl-32b-thinking | Hanya berpikir | $0,16 | $0,64 | |
qwen3-vl-32b-instruct | Tanpa pemikiran sama sekali | $0,16 | $0,64 | |
qwen3-vl-30b-a3b-thinking | Hanya berpikir | $0,2 | $2,4 | |
qwen3-vl-30b-a3b-instruct | Hanya non-thinking | $0,2 | $0,8 | |
qwen3-vl-8b-thinking | Hanya berpikir | $0,18 | $2,1 | |
qwen3-vl-8b-instruct | Hanya non-thinking | $0,18 | $0,7 |
Model lainnya
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen2.5-vl-72b-instruct | $2,8 | $8,4 | 1 juta token masing-masing |
qwen2.5-vl-32b-instruct | $1,4 | $4,2 | |
qwen2.5-vl-7b-instruct | $0,35 | $1,05 | |
qwen2.5-vl-3b-instruct | $0,21 | $0,63 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-vl-235b-a22b-thinking | Hanya berpikir | $0,287 | $2,867 |
qwen3-vl-235b-a22b-instruct | Tanpa pemikiran sama sekali | $0,287 | $1,147 |
qwen3-vl-32b-thinking | Hanya berpikir | $0,16 | $0,64 |
qwen3-vl-32b-instruct | Hanya tidak berpikir | $0,16 | $0,64 |
qwen3-vl-30b-a3b-thinking | Hanya berpikir | $0,108 | $1,075 |
qwen3-vl-30b-a3b-instruct | Hanya tidak berpikir | $0,108 | $0,43 |
qwen3-vl-8b-thinking | Hanya berpikir | $0,072 | $0,717 |
qwen3-vl-8b-instruct | Hanya tidak berpikir | $0,072 | $0,287 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-vl-235b-a22b-thinking | Hanya berpikir | $0,287 | $2,8677 |
qwen3-vl-235b-a22b-instruct | Hanya tidak berpikir | $0,287 | $1,147 |
qwen3-vl-32b-thinking | Hanya berpikir | $0,287 | $2,868 |
qwen3-vl-32b-instruct | Hanya tidak berpikir | $0,287 | $1,147 |
qwen3-vl-30b-a3b-thinking | Hanya berpikir | $0,108 | $1,076 |
qwen3-vl-30b-a3b-instruct | Hanya tidak berpikir | $0,108 | $0,431 |
qwen3-vl-8b-thinking | Hanya berpikir | $0,072 | $0,717 |
qwen3-vl-8b-instruct | Hanya tidak berpikir | $0,072 | $0,287 |
Model lainnya
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen2.5-vl-72b-instruct | $2,294 | $6.881 |
qwen2.5-vl-32b-instruct | $1,147 | $3,441 |
qwen2.5-vl-7b-instruct | $0,287 | $0,717 |
qwen2.5-vl-3b-instruct | $0,173 | $0,517 |
qwen2-vl-72b-instruct | $2.294 | $6.881 |
qwen2-vl-7b-instruct | Gratis untuk waktu terbatas | |
qwen2-vl-2b-instruct | ||
Qwen-Math
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen2.5-math-72b-instruct | $0,574 | $1,721 | Tidak ada kuota gratis |
qwen2.5-math-7b-instruct | $0,144 | $0,287 | |
qwen2.5-math-1.5b-instruct | Gratis untuk waktu terbatas | ||
Qwen-Coder
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di tingkat global (kecuali Tiongkok Daratan).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-coder-next | 0<Token≤32K | $0,3 | $1,5 | 1 juta token masing-masing |
32K<Token≤128K | $0,5 | $2,5 | ||
128K<Token≤256K | $0,8 | $4 | ||
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $1,5 | $7,5 | |
32K<Token≤128K | $2,7 | $13,5 | ||
128K<Token≤200K | $4,5 | $22,5 | ||
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0,45 | $2,25 | |
32K<Token≤128K | $0,75 | $3,75 | ||
128K<Token≤200K | $1,2 | $6 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,291 | $5,161 | |
128K<Token≤200K | $2,151 | $8,602 | |
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0,216 | $0,861 |
32K<Token≤128K | $0,323 | $1,291 | |
128K<Token≤200K | $0,538 | $2,151 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-next | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,291 | $5,161 | |
128K<Token≤200K | $2,151 | $8,602 | |
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0,216 | $0,861 |
32K<Token≤128K | $0,323 | $1,291 | |
128K<Token≤200K | $0,538 | $2,151 | |
qwen2.5-coder-32b-instruct | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
qwen2.5-coder-14b-instruct | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
qwen2.5-coder-7b-instruct | Tidak ada penetapan harga bertingkat | $0,144 | $0,287 |
qwen2.5-coder-3b-instruct | Tidak ada penetapan harga bertingkat | Gratis untuk waktu terbatas | |
qwen2.5-coder-1.5b-instruct | Tidak ada penetapan harga bertingkat | ||
qwen2.5-coder-0.5b-instruct | Tidak ada penetapan harga bertingkat | ||
Generasi teks - Pihak ketiga
DeepSeek
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
deepseek-v3.2 | $0,287 | $0,431 | Tidak ada kuota gratis |
deepseek-v3.2-exp | $0,287 | $0,431 | |
deepseek-v3.1 | $0,574 | $1,721 | |
deepseek-r1 | $0,574 | $2,294 | |
deepseek-r1-0528 | $0,574 | $2,294 | |
deepseek-v3 | $0,287 | $1,147 | |
deepseek-r1-distill-qwen-1.5b | Gratis untuk waktu terbatas | ||
deepseek-r1-distill-qwen-7b | $0,072 | $0,144 | Tidak ada kuota gratis |
deepseek-r1-distill-qwen-14b | $0,144 | $0,431 | |
deepseek-r1-distill-qwen-32b | $0,287 | $0,861 | |
deepseek-r1-distill-llama-8b | Gratis untuk waktu terbatas | ||
deepseek-r1-distill-llama-70b | Gratis untuk waktu terbatas | ||
Kimi
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
kimi-k2.5 | $0,574 | $3,011 | |
kimi-k2-thinking | $0,574 | $2,294 | Tidak ada kuota gratis |
Moonshot-Kimi-K2-Instruct | $0,574 | $2,294 |
MiniMax
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Mode | Harga input (per 1 juta token) | Token output (per 1 juta token) CoT + respons |
MiniMax-M2.5 | Hanya berpikir | $0,304 | $1,213 |
GLM
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT dan respons |
glm-5 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,573 | $2,58 |
32K<Token≤166K | $0,86 | $3,154 | ||
glm-4.7 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,431 | $2,007 |
32K<Token≤166K | $0,574 | $2,294 | ||
glm-4.6 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,431 | $2.007 |
32K<Token≤166K | $0,574 | $2,294 |
Generasi gambar
Metode: Anda dikenai biaya hanya untuk jumlah gambar yang berhasil dihasilkan.
Rumus: Biaya = Harga per gambar × Jumlah gambar yang dihasilkan.
Detail:
Biaya tidak bergantung pada resolusi atau rasio aspek gambar keluaran.
Permintaan yang gagal tidak dikenai biaya maupun mengurangi kuota gratis.
Qwen-Image
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
qwen-image-2.0-pro | $0,075/gambar | 100 gambar masing-masing |
qwen-image-2.0-pro-2026-03-03 | $0,075/gambar | |
qwen-image-2.0 | $0,035/gambar | |
qwen-image-2.0-2026-03-03 | $0,035/gambar | |
qwen-image-max | $0,075/gambar | |
qwen-image-max-2025-12-30 | $0,075/gambar | |
qwen-image-plus | $0,03/gambar | |
qwen-image-plus-2026-01-09 | $0,03/gambar | |
qwen-image | $0,035/gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
qwen-image-2.0-pro | $0,071676/gambar |
qwen-image-2.0-pro-2026-03-03 | $0,071676/gambar |
qwen-image-2.0 | $0,028671/gambar |
qwen-image-2.0-2026-03-03 | $0,028671/gambar |
qwen-image-max | $0,071677/gambar |
qwen-image-max-2025-12-30 | $0,071677/gambar |
qwen-image-plus | $0,028671/gambar |
qwen-image-plus-2026-01-09 | $0,028671/gambar |
qwen-image | $0,035/gambar |
Qwen-Image-Edit
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
qwen-image-2.0-pro | $0,075/gambar | 100 gambar masing-masing |
qwen-image-2.0-pro-2026-03-03 | $0,075/gambar | |
qwen-image-2.0 | $0,035/gambar | |
qwen-image-2.0-2026-03-03 | $0,035/gambar | |
qwen-image-edit-max | $0,075/gambar | |
qwen-image-edit-max-2026-01-16 | $0,075/gambar | |
qwen-image-edit-plus | $0,03/gambar | |
qwen-image-edit-plus-2025-12-15 | $0,03/gambar | |
qwen-image-edit-plus-2025-10-30 | $0,03/gambar | |
qwen-image-edit | $0,045/gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
qwen-image-2.0-pro | $0,071676/gambar |
qwen-image-2.0-pro-2026-03-03 | $0,071676/gambar |
qwen-image-2.0 | $0,028671/gambar |
qwen-image-2.0-2026-03-03 | $0,028671/gambar |
qwen-image-edit-max | $0,071677/gambar |
qwen-image-edit-max-2026-01-16 | $0,071677/gambar |
qwen-image-edit-plus | $0,028671/gambar |
qwen-image-edit-plus-2025-12-15 | $0,028671/gambar |
qwen-image-edit-plus-2025-10-30 | $0,028671/gambar |
qwen-image-edit | $0,043/gambar |
Qwen-MT-Image
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi gambar.
Model | Harga output | Kuota gratis (Catatan) |
qwen-mt-image | $0,000431/gambar | Tidak ada kuota gratis |
Generasi teks-ke-gambar - Z-Image
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
z-image-turbo | Prompt rewriting disabled ( Prompt rewriting enabled ( | 100 gambar Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
z-image-turbo | Penulisan ulang prompt dinonaktifkan ( Penulisan ulang prompt diaktifkan ( |
Wan teks-ke-gambar
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
wan2.6-t2i | $0,03/gambar | 50 gambar |
wan2.5-t2i-preview | $0,03/gambar | 50 gambar |
wan2.2-t2i-plus | $0,05/gambar | 100 gambar |
wan2.2-t2i-flash | $0,025/gambar | 100 gambar |
wan2.1-t2i-plus | $0,05/gambar | 200 gambar |
wan2.1-t2i-turbo | $0,025/gambar | 200 gambar |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Harga output |
wan2.6-t2i | $0,028671/gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
wan2.6-t2i | $0,028671/gambar |
wan2.5-t2i-preview | $0,028671/gambar |
wan2.2-t2i-plus | $0,020070/gambar |
wan2.2-t2i-flash | $0,028671/gambar |
wanx2.1-t2i-plus | $0,028671/gambar |
wanx2.1-t2i-turbo | $0,020070/gambar |
wanx2.0-t2i-turbo | $0,005735/gambar |
Wan generasi dan pengeditan gambar
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
wan2.6-image | $0,03/gambar | 50 gambar |
Global
Model Global (Virginia) tidak memiliki kuota gratis.
Model | Harga output |
wan2.6-image | $0,028671/gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
wan2.6-image | $0,028671/gambar |
Wan pengeditan gambar umum
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Layanan | Model | Harga output | Kuota gratis (Catatan) |
Pengeditan gambar umum 2.5 | wan2.5-i2i-preview | $0,03/gambar | 50 gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Layanan | Model | Harga output |
Pengeditan gambar umum 2.5 | wan2.5-i2i-preview | $0,028671/gambar |
Pengeditan gambar umum 2.1 | wanx2.1-imageedit | $0,020070/gambar |
OutfitAnyone
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
aitryon-plus: Biaya hanya dikenakan pada output. Untuk aturan penagihan, lihat Generasi gambar.
aitryon-parsing-v1: Biaya hanya dikenakan pada input. Penagihan berdasarkan jumlah gambar input. Permintaan yang gagal tidak dikenai biaya.
Layanan | Model | Harga | Kuota gratis (Catatan) |
OutfitAnyone - Plus | aitryon-plus | $0,071677/gambar | Tidak ada kuota gratis |
OutfitAnyone - Parsing gambar | aitryon-parsing-v1 | $0,000574/gambar |
Generasi video
Metode: Anda dikenai biaya hanya untuk durasi video (detik) dari video yang berhasil dihasilkan.
Rumus: Biaya = Harga per detik × Durasi video (detik).
Detail:
Beberapa model menggunakan penetapan harga berbasis resolusi, di mana harga bervariasi berdasarkan resolusi (480p/720p/1080p).
Beberapa model menggunakan penetapan harga berbasis mode, di mana harga bervariasi berdasarkan mode video (Standar/Edisi Profesional).
Beberapa model menggunakan penetapan harga berbasis rasio aspek, di mana harga bervariasi berdasarkan rasio aspek (1:1/3:4).
Beberapa model menggunakan penetapan harga seragam, yang tidak bergantung pada resolusi, mode, atau rasio aspek.
Permintaan yang gagal tidak dikenai biaya maupun mengurangi kuota gratis.
Wan - teks-ke-video
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Resolusi video output | Harga output | Kuota gratis (Catatan) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
wan2.6-t2v | 720P | $0,10/detik | 50 detik |
1080P | $0,15/detik | ||
wan2.5-t2v-preview | 480P | $0,05/detik | 50 detik |
720P | $0,10/detik | ||
1080P | $0,15/detik | ||
wan2.2-t2v-plus | 480P | $0,02/detik | 50 detik |
1080P | $0,10/detik | ||
wan2.1-t2v-turbo | 480P | $0,036/detik | 200 detik |
720P | $0,036/detik | ||
wan2.1-t2v-plus | 720P | $0,10/detik | 200 detik |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.6-t2v | 720P | $0,086012/detik |
1080P | $0,143353/detik |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model dibatasi hanya di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.6-t2v-us | 720P | $0,1/detik |
1080P | $0,15/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.6-t2v | 720P | $0,086012/detik |
1080P | $0,143353/detik | |
wan2.5-t2v-preview | 480P | $0,043006/detik |
720P | $0,086012/detik | |
1080P | $0,143353/detik | |
wan2.2-t2v-plus | 480P | $0,02007/detik |
1080P | $0,100347/detik | |
wanx2.1-t2v-turbo | 480P | $0,034405/detik |
720P | $0,034405/detik | |
wanx2.1-t2v-plus | 720P | $0,100347/detik |
Wan - image-to-video - first fame
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Jenis video output | Resolusi video output | Harga output | Kuota gratis (Catatan) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
wan2.6-i2v-flash | Video dengan audio
| 720P | $0,05/detik | 50 detik |
1080P | $0,075/detik | |||
Video tanpa audio
| 720P | $0,025/detik | ||
1080P | $0,0375/detik | |||
wan2.6-i2v | Video dengan audio | 720P | $0,10/detik | 50 detik |
1080P | $0,15/detik | |||
wan2.5-i2v-preview | Video dengan audio | 480P | $0,05/detik | 50 detik |
720P | $0,10/detik | |||
1080P | $0,15/detik | |||
wan2.2-i2v-flash | Video tanpa audio | 480P | $0,015/detik | 50 detik |
720P | $0,036/detik | |||
wan2.2-i2v-plus | Video tanpa audio | 480P | $0,02/detik | 50 detik |
1080P | $0,10/detik | |||
wan2.1-t2v-turbo | Video tanpa audio | 480P | $0,036/detik | 200 detik |
720P | $0,036/detik | |||
wan2.1-t2v-plus | Video tanpa audio | 720P | $0,10/detik | 200 detik |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.6-i2v | 720P | $0,086012/detik |
1080P | $0,143353/detik |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model dibatasi hanya di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Output Video Resolution | Harga output |
wan2.6-i2v-us | 720P | $0,1/detik |
1080P | $0,15/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Jenis video output | Resolusi video output | Harga output |
wan2.6-i2v-flash | Video dengan audio
| 720P | $0,043006/detik |
1080P | $0,071676/detik | ||
Video tanpa audio
| 720P | $0,021503/detik | |
1080P | $0,035838/detik | ||
wan2.6-i2v | Video dengan audio | 720P | $0,086012/detik |
1080P | $0,143353/detik | ||
wan2.5-i2v-preview | Video dengan audio | 480P | $0,043006/detik |
720P | $0,086012/detik | ||
1080P | $0,143353/detik | ||
wan2.2-i2v-plus | Video tanpa audio | 480P | $0,02007/detik |
1080P | $0,100347/detik | ||
wanx2.1-t2v-turbo | Video tanpa audio | 480P | $0,034405/detik |
720P | $0,034405/detik | ||
wanx2.1-t2v-plus | Video tanpa audio | 720P | $0,100347/detik |
Wan - gambar-ke-video - frame pertama dan terakhir
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Resolusi video output | Harga output | Kuota gratis (Catatan) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
wan2.2-kf2v-flash | 480P | $0,015/detik | 50 detik |
720P | $0,036/detik | ||
1080P | $0,07/detik | ||
wan2.1-kf2v-plus | 720P | $0,10/detik | 200 detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.2-kf2v-flash | 480P | $0,014335/detik |
720P | $0,028671/detik | |
1080P | $0,068809/detik | |
wanx2.1-kf2v-plus | 720P | $0,100347/detik |
Wan - referensi-ke-video
Aturan penagihan: Biaya dikenakan untuk video input dan output berdasarkan durasi video dalam detik. Generasi yang gagal tidak dikenai biaya dan tidak mengurangi kuota gratis.
Rumus: Durasi yang ditagih = durasi video input (maksimal 5 detik) + durasi video output.
Video input dikenai biaya maksimal 5 detik. Untuk aturan spesifik, lihat Wan - referensi-ke-video.
Video output dikenai biaya berdasarkan jumlah detik dari video yang berhasil dihasilkan.
Deskripsi penetapan harga: Harga satuan ditentukan oleh tingkat resolusi dan opsi audio, terlepas dari resolusi atau audio pada video input.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Spesifikasi output | Resolusi output | Harga input & output | Kuota gratis (Catatan) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
wan.6-r2v-flash | Video dengan audio
| 720P | $0,05/detik | 50 detik |
1080P | $0,075/detik | |||
Video tanpa audio
| 720P | $0,025/second | ||
1080P | $0,0375/detik | |||
wan2.6-r2v | Video dengan audio | 720P | $0,10/detik | 50 detik |
1080P | $0,15/detik |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia) atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Spesifikasi output | Resolusi output | Harga input & output |
wan2.6-r2v | Video dengan audio | 720P | $0,086012/detik |
1080P | $0,143353/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Spesifikasi output | Resolusi output | Harga input & output |
wan.6-r2v-flash | Video dengan audio
| 720P | $0,043006/detik |
1080P | $0,071676/second | ||
Video tanpa audio
| 720P | $0,021503/detik | |
1080P | $0,035838/detik | ||
wan2.6-r2v | Video dengan audio | 720P | $0,086012/detik |
1080P | $0,143353/detik |
Wan - pengeditan video umum
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Resolusi video output | Harga output | Kuota gratis (Catatan) |
wan2.1-vace-plus | 720P | $0,10/detik | 50 detik Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wanx2.1-vace-plus | 720P | $0,100347/detik |
Wan - manusia digital
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
wan2.2-s2v-detect: Biaya hanya dikenakan pada input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, terlepas dari keberhasilan deteksinya.
wan2.2-s2v: Biaya hanya dikenakan pada output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Layanan | Model | Harga | Kuota gratis (Catatan) |
Deteksi gambar | wan2.2-s2v-detect | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi video | wan2.2-s2v | Video output:
|
Wan - gambar-ke-aksi
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Video Output Mode | Harga output | Kuota gratis (Catatan) |
wan2.2-animate-move | Mode Standar | $0,12/detik | 50 detik Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Mode Profesional | $0,18/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode video output | Harga output |
wan2.2-animate-move | Mode Standar | $0,06/detik |
Mode Profesional | $0,09/detik |
Wan - pertukaran karakter video
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Video Output Mode | Harga output | Kuota gratis (Catatan) |
wan2.2-animate-mix | Mode Standar | $0,18/detik | 50 detik Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Mode Profesional | $0,26/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Output Video Mode | Harga output |
wan2.2-animate-mix | Mode Standar | $0,09/detik |
Mode Profesional | $0,13/detik |
AnimateAnyone
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
animate-anyone-detect-gen2: Biaya hanya dikenakan pada input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, terlepas dari keberhasilan deteksinya.
animate-anyone-template-gen2: Biaya hanya dikenakan pada output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
animate-anyone-gen2: Biaya hanya dikenakan pada output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Layanan | Model | Harga | Kuota gratis (Catatan) |
Deteksi gambar | animate-anyone-detect-gen2 | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi templat aksi | animate-anyone-template-gen2 | Video output: $0,011469/detik | |
Generasi video | animate-anyone-gen2 | Video output: $0,011469/detik |
EMO
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
emo-detect-v1: Biaya hanya dikenakan pada input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, terlepas dari keberhasilan deteksinya.
emo-v1: Biaya hanya dikenakan pada output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Layanan | Model | Harga | Kuota gratis (Catatan) |
Deteksi gambar | emo-detect-v1 | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi video | emo-v1 | Video output:
|
LivePortrait
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
liveportrait-detect: Biaya hanya dikenakan pada input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, terlepas dari keberhasilan deteksinya.
liveportrait: Biaya hanya dikenakan pada output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Layanan | Model | Harga | Kuota gratis (Catatan) |
Deteksi gambar | liveportrait-detect | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi video | liveportrait | Video output: $0,002868/detik |
Emoji
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
emoji-detect-v1: Biaya hanya dikenakan pada input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, terlepas dari keberhasilan deteksinya.
emoji-v1: Biaya hanya dikenakan pada output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Layanan | Model | Harga | Kuota gratis (Catatan) |
Deteksi gambar | emoji-detect-v1 | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi video | emoji-v1 | Video output: $0,011469/detik |
VideoRetalk
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi video.
Model | Harga output | Kuota gratis (Catatan) |
videoretalk | $0,011469/detik | Tidak ada kuota gratis |
Transformasi gaya video
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Hanya output yang dikenai biaya. Untuk aturan selengkapnya, lihat Generasi video.
Model | Resolusi video output | Harga output | Kuota gratis (Catatan) |
video-style-transform | 540P | $0,028671/detik | Tidak ada kuota gratis |
720P | $0,071677/detik |
Sintesis ucapan (teks-ke-ucapan)
Qwen-TTS
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Qwen3-TTS-Instruct-Flash
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-instruct-flash | $0,115 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-instruct-flash-2026-01-26 | $0,115 |
Qwen3-TTS-VD
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-vd-2026-01-26 | $0,115 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Qwen3-TTS-VC
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-vc-2026-01-22 | $0,115 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Qwen3-TTS-Flash
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-flash | $0,1 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-flash-2025-11-27 | $0,1 | |
qwen3-tts-flash-2025-09-18 | $0,1 | Model Studio diaktifkan sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter Diaktifkan setelah pukul 00:00 tanggal 13 November 2025: 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Qwen3-TTS-Instruct-Flash
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output (per 10 ribu karakter) |
qwen3-tts-instruct-flash | $0,115 | Tidak dikenai biaya |
qwen3-tts-instruct-flash-2026-01-26 | $0,115 | Tidak dikenai biaya |
Qwen3-TTS-VD
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output (per 10 ribu karakter) |
qwen3-tts-vd-2026-01-26 | $0,115 | Tidak dikenai biaya |
Qwen3-TTS-VC
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output (per 10 ribu karakter) |
qwen3-tts-vc-2026-01-22 | $0,115 | Tidak dikenai biaya |
Qwen3-TTS-Flash
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output (per 10 ribu karakter) |
qwen3-tts-flash | $0,114682 | Tidak dikenai biaya |
qwen3-tts-flash-2025-11-27 | $0,114682 | Tidak dikenai biaya |
qwen3-tts-flash-2025-09-18 | $0,114682 | Tidak dikenai biaya |
Qwen-TTS
Aturan penagihan: Biaya dihitung per token input dan output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-tts-flash | $0,23 | $1,434 |
qwen-tts-latest | $0,23 | $1,434 |
qwen-tts-2025-05-22 | $0,23 | $1,434 |
qwen-tts-2025-04-10 | $0,23 | $1,434 |
Qwen-TTS-Realtime
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Qwen3-TTS-Instruct-Flash-Realtime
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Kuota gratis (Catatan) |
qwen3-tts-instruct-flash-realtime | $0,143 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-instruct-flash-realtime-2026-01-22 | $0,143 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Qwen3-TTS-VD-Realtime
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Kuota gratis (Catatan) |
qwen3-tts-vd-realtime-2026-01-15 | $0,143353 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-vd-realtime-2025-12-16 | $0,143353 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Qwen3-TTS-VC-Realtime
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Kuota gratis (Catatan) |
qwen3-tts-vc-realtime-2026-01-15 | $0,13 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-vc-realtime-2025-11-27 |
Qwen3-TTS-Flash-Realtime
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Kuota gratis (Catatan) |
qwen3-tts-flash-realtime | $0,13 | Model Studio diaktifkan sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter Model Studio diaktifkan setelah pukul 00.00 pada 13 November 2025: 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-flash-realtime-2025-11-27 | $0,13 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-flash-realtime-2025-09-18 | $0,13 | Model Studio diaktifkan sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter Model Studio diaktifkan setelah pukul 00.00 pada 13 November 2025: 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi untuk inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Qwen3-TTS-Instruct-Flash-Realtime
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Harga output |
qwen3-tts-instruct-flash-realtime | $0,143 | Tidak dikenai biaya |
qwen3-tts-instruct-flash-realtime-2026-01-22 | $0,143 | Tidak dikenai biaya |
Qwen3-TTS-VD-Realtime
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Harga output |
qwen3-tts-vd-realtime-2026-01-15 | $0,143353 | Tidak dikenai biaya |
qwen3-tts-vd-realtime-2025-12-16 | $0,143353 | Tidak dikenai biaya |
Qwen3-TTS-VC-Realtime
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Harga output |
qwen3-tts-vc-realtime-2026-01-15 | $0,143353 | Tidak dikenai biaya |
qwen3-tts-vc-realtime-2025-11-27 |
Qwen3-TTS-Flash-Realtime
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Harga output |
qwen3-tts-flash-realtime | $0,143353 | Tidak dikenai biaya |
qwen3-tts-flash-realtime-2025-11-27 | $0,143353 | Tidak dikenai biaya |
qwen3-tts-flash-realtime-2025-09-18 | $0,143353 | Tidak dikenai biaya |
Qwen-TTS-Realtime
Aturan penagihan: Biaya dihitung per token input dan output.
Model | Harga input (per 1 juta token) | Harga Input (per 1 juta token) |
qwen-tts-realtime | $0,345 | $1,721 |
qwen-tts-realtime-latest | $0,345 | $1,721 |
qwen-tts-realtime-2025-07-15 | $0,345 | $1,721 |
Qwen-TTS voice cloning
Aturan penagihan: Biaya dikenakan berdasarkan jumlah voice baru yang dibuat.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga (per voice) | Kuota gratis (Catatan) |
qwen-voice-enrollment | $0.01 | 1000 voice/akun |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi untuk inferensi model hanya tersedia di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga (per suara) |
qwen-voice-enrollment | $0.01 |
Desain voice Qwen-TTS
Aturan penagihan: Biaya dikenakan berdasarkan jumlah voice baru yang dibuat.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di Wilayah Singapura, sedangkan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga (per voice) | Kuota gratis (Catatan) |
qwen-voice-design | $0,2 | 10 suara per akun |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi untuk inferensi model terbatas hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga (per suara) |
qwen-voice-design | $0,2 |
CosyVoice
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Kuota gratis (Catatan) |
cosyvoice-v3-plus | $0,26 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
cosyvoice-v3-flash | $0,13 |
Tiongkok Daratan
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Aturan penagihan: Biaya dikenakan per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10K karakter) | Kuota gratis (Catatan) |
cosyvoice-v3.5-plus | $0,22 | Tidak ada kuota gratis |
cosyvoice-v3.5-flash | $0,116 | |
cosyvoice-v3-plus | $0,286706 | |
cosyvoice-v3-flash | $0,14335 | |
cosyvoice-v2 | $0,286706 |
Speech recognition (speech-to-text) dan translation (speech-to-translation)
Qwen3-LiveTranslate-Flash-Realtime
Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token pada berbagai modalities, lihat Billing.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||
Input: Audio | Input: Image | Output: Text | Output: Audio | ||
qwen3-livetranslate-flash-realtime | $10 | $1,3 | $10 | $38 | masing-masing 1 juta token |
qwen3-livetranslate-flash-realtime-2025-09-22 | $10 | $1,3 | $10 | $38 | |
Tiongkok daratan
Dalam mode penyebaran Tiongkok daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok daratan.
Mode penyebaran Tiongkok daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||
Input: Audio | Input: Image | Output: Text | Output: Audio | |
qwen3-livetranslate-flash-realtime | $9,175 | $1,147 | $9,175 | $34,405 |
qwen3-livetranslate-flash-realtime-2025-09-22 | $9,175 | $1,147 | $9,175 | $34,405 |
Qwen-ASR
Aturan penagihan: Biaya dikenakan per detik durasi audio input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input | Kuota gratis (Catatan) |
qwen3-asr-flash-filetrans | $0,000035/detik | 36.000 detik (10 jam) |
qwen3-asr-flash-filetrans-2025-11-17 | ||
qwen3-asr-flash | ||
qwen3-asr-flash-2025-09-08 |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model dibatasi hanya di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Harga input |
qwen3-asr-flash-us | $0,000035/detik |
qwen3-asr-flash-2025-09-08-us |
Tiongkok daratan
Dalam mode penyebaran Tiongkok daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok daratan.
Mode penyebaran Tiongkok daratan tidak memiliki kuota gratis.
Model | Harga input |
qwen3-asr-flash-filetrans | $0,000032/detik |
qwen3-asr-flash-filetrans-2025-11-17 | |
qwen3-asr-flash | |
qwen3-asr-flash-2025-09-08 |
Qwen-ASR-Realtime
Aturan penagihan: Biaya dikenakan per detik durasi audio input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input | Kuota gratis (Catatan) |
qwen3-asr-flash-realtime | $0,000090/detik | 36.000 detik (10 jam) |
qwen3-asr-flash-realtime-2026-02-10 | $0,000090/detik | |
qwen3-asr-flash-realtime-2025-10-27 | $0,000090/detik |
Tiongkok daratan
Dalam mode penyebaran Tiongkok daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok daratan.
Mode penyebaran Tiongkok daratan tidak memiliki kuota gratis.
Model | Harga input |
qwen3-asr-flash-realtime | $0,000047/detik |
qwen3-asr-flash-realtime-2026-02-10 | |
qwen3-asr-flash-realtime-2025-10-27 |
Fun-ASR
Pengenalan file audio
Aturan penagihan: Biaya dikenakan per detik durasi audio input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input | Kuota gratis (Catatan) |
fun-asr | $0,000035/detik | 36.000 detik (10 jam) |
fun-asr-2025-11-07 | ||
fun-asr-2025-08-25 | ||
fun-asr-mtl | ||
fun-asr-mtl-2025-08-25 |
Tiongkok daratan
Dalam mode penyebaran Tiongkok daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok daratan.
Mode penyebaran Tiongkok daratan tidak memiliki kuota gratis.
Model | Harga input |
fun-asr | $0,000032/detik |
fun-asr-2025-11-07 | |
fun-asr-2025-08-25 | |
fun-asr-mtl | |
fun-asr-mtl-2025-08-25 |
Pengenalan ucapan real-time
Aturan penagihan: Biaya dikenakan per detik durasi audio input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input | Kuota gratis (Catatan) |
fun-asr-realtime | $0,00009/detik | 36.000 detik (10 jam) Berlaku selama 90 hari |
fun-asr-realtime-2025-11-07 |
Tiongkok daratan
Dalam mode penyebaran Tiongkok daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok daratan.
Mode penyebaran Tiongkok daratan tidak memiliki kuota gratis.
Model | Harga input |
fun-asr-realtime | $0,000047/detik |
fun-asr-realtime-2026-02-28 | |
fun-asr-realtime-2025-11-07 | |
fun-asr-realtime-2025-09-15 | |
fun-asr-flash-8k-realtime | $0,000032/detik |
fun-asr-flash-8k-realtime-2026-01-28 |
Paraformer
Pengenalan file audio
Hanya mode penyebaran Tiongkok daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok daratan.
Aturan penagihan: Biaya dikenakan per detik durasi audio input. Output tidak dikenai biaya.
Model | Harga input |
paraformer-v2 | $0,000012/detik |
paraformer-8k-v2 |
Pengenalan ucapan real-time
Hanya mode penyebaran Tiongkok daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya di Tiongkok daratan.
Aturan penagihan: Biaya dikenakan per detik durasi audio input. Output tidak dikenai biaya.
Model | Harga input | Kuota gratis (Catatan) |
paraformer-realtime-v2 | $0,000035/detik | Tidak ada kuota gratis |
paraformer-realtime-8k-v2 |
Text embedding
Aturan penagihan: Biaya dikenakan per token input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di Wilayah Singapura, sedangkan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Kuota gratis (Catatan) |
text-embedding-v4 | $0,07 | 1 juta token |
text-embedding-v3 | $0,07 | 500.000 token |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi untuk inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak menyediakan kuota gratis.
Model | Harga input (per 1 juta token) |
text-embedding-v4 | $0,072 |
Tiongkok (Hong Kong)
Model | Harga input (per 1 juta token) | Kuota gratis(Catatan) |
text-embedding-v4 | $0,07 | masing-masing 1 juta token |
Multimodal embedding
Aturan penagihan: Biaya dikenakan per token input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di Wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token input) | Kuota gratis (Catatan) |
tongyi-embedding-vision-plus | $0,09 | 1 juta token Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
tongyi-embedding-vision-flash | Gambar/Video: $0,03 Teks: $0,09 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.
Model | Harga input (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-vl-embedding | Gambar/Video: $0,258 Teks: $0,1 | Tidak ada kuota gratis |
multimodal-embedding-v1 | Uji coba gratis |
Text rerank
Aturan penagihan: Biaya dikenakan per token input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi untuk inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-rerank | $0,1 | 1 juta token Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi untuk inferensi model dibatasi hanya di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak menyediakan kuota gratis.
Model | Harga input (per 1 juta token) |
gte-rerank-v2 | $0,115 |
Domain specific
Intent recognition
Hanya mode penyebaran Tiongkok daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok daratan.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
tongyi-intent-detect-v3 | $0,058 | $0,144 | Tidak ada kuota gratis |
Role playing
Metode: Anda dikenai biaya berdasarkan jumlah token input dan token output.
International
Dalam mode penyebaran International, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-plus-character | $0,5 | $1,4 | Tidak ada kuota gratis |
qwen-flash-character | $0,05 | $0,4 | |
qwen-plus-character-ja | $0,5 | $1,4 |
Chinese Mainland
Dalam mode penyebaran Tiongkok daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok daratan.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-plus-character | $0,115 | $0,287 | Tidak ada kuota gratis |