Generasi teks - Qwen
Qwen-Max
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Faktor yang memengaruhi penagihan: Jika suatu model mendukung Batch Invocation, token input dan output-nya dikenai biaya sebesar 50% dari harga inferensi real-time. Jika suatu model mendukung Context Caching, hanya token input yang memenuhi syarat untuk diskon. Kedua diskon tersebut tidak dapat diterapkan secara bersamaan.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons | Kuota gratis (Catatan) |
qwen3-max Pemanggilan batch diskon 50% Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 | 1 juta token masing-masing Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
32K<Token≤128K | $2,4 | $12 | |||
128K<Token≤252K | $3 | $15 | |||
qwen3-max-2026-01-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 | |
32K<Token≤128K | $2,4 | $12 | |||
128K<Token≤252K | $3 | $15 | |||
qwen3-max-2025-09-23 | Hanya tidak berpikir | 0<Token≤32K | $1,2 | $6 | |
32K<Token≤128K | $2,4 | $12 | |||
128K<Token≤252K | $3 | $15 | |||
qwen3-max-preview Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 | |
32K<Token≤128K | $2,4 | $12 | |||
128K<Token≤252K | $3 | $15 |
Model lainnya
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-max Pemanggilan batch diskon 50% | Tanpa pemikiran sama sekali | Tidak ada penetapan harga bertingkat | $1,6 | $6,4 | 1 juta token masing-masing |
qwen-max-latest | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $1,6 | $6,4 | |
qwen-max-2025-01-25 | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $1,6 | $6,4 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-max Diskon cache konteks | Hanya tidak berpikir | 0<Token≤32K | $0,359 | $1,434 |
32K<Token≤128K | $0,574 | $2,294 | ||
128K<Token≤252K | $1,004 | $4,014 | ||
qwen3-max-2025-09-23 | Hanya tidak berpikir | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,434 | $5,735 | ||
128K<Token≤252K | $2,151 | $8,602 | ||
qwen3-max-preview Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,434 | $5,735 | ||
128K<Token≤252K | $2,151 | $8,602 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-max Pemanggilan batch diskon 50% Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,359 | $1,434 |
32K<Token≤128K | $0,574 | $2,294 | ||
128K<Token≤252K | $1,004 | $4,014 | ||
qwen3-max-2026-01-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,359 | $1,434 |
32K<Token≤128K | $0,574 | Rp2.294 | ||
128K<Token≤252K | $1,004 | $4,014 | ||
qwen3-max-2025-09-23 | Hanya tidak berpikir | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,434 | $5,735 | ||
128K<Token≤252K | $2,151 | $8,602 | ||
qwen3-max-preview Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,434 | $5,735 | ||
128K<Token≤252K | $2,151 | $8,602 |
Model lainnya
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-max | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $0,345 | $1,377 |
qwen-max-latest | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $0,345 | $1,377 |
qwen-max-2025-01-25 | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $0,345 | $1,377 |
qwen-max-2024-09-19 | Hanya tidak berpikir | Tidak ada penetapan harga bertingkat | $2,868 | $8,602 |
Tiongkok (Hong Kong)
Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).
Model | Mode | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-max Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 |
32K<Token≤128K | $2,4 | $12 | ||
128K<Token≤252K | $3 | $15 | ||
qwen3-max-2026-01-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 |
32K<Token≤128K | $2,4 | $12 | ||
128K<Token≤252K | $3 | $15 |
UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model terbatas di UE.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-max Pemanggilan batch diskon 50% Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 |
32K<Token≤128K | $2,4 | $12 | ||
128K<Token≤252K | $3 | $15 | ||
qwen3-max-2026-01-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $1,2 | $6 |
32K<Token≤128K | $2,4 | $12 | ||
128K<Token≤252K | $3 | $15 |
Qwen-Plus
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | |
Mode tidak berpikir | Mode berpikir (CoT + respons) | ||||
qwen3.5-plus | 0<Token≤256K | $0,4 | $2,4 | $2,4 | 1 juta token masing-masing |
256K<Token≤1M | $0,5 | $3 | $3 | ||
qwen3.5-plus-2026-02-15 | 0<Token≤256K | $0,4 | $2,4 | $2,4 | |
256K<Token≤1M | $0,5 | $3 | $3 | ||
qwen-plus | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-latest | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-2025-12-01 | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-2025-09-11 | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-2025-07-28 | 0<Token≤256K | $0,4 | $1,2 | $4 | |
256K<Token≤1M | $1,2 | $3,6 | $12 | ||
qwen-plus-2025-07-14 | Tidak ada penetapan harga bertingkat | $0,4 | $1,2 | $4 | |
qwen-plus-2025-04-28 | Tidak ada penetapan harga bertingkat | $0,4 | $1,2 | $4 | |
qwen-plus-2025-01-25 | Tidak ada penetapan harga bertingkat | $0,4 | $1,2 | - | |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Non-thinking mode | Mode berpikir (CoT + respons) | |||
qwen3.5-plus | 0<Token≤128K | $0,115 | $0,688 | $0,688 |
128K<Token≤256K | $0,287 | $1,72 | $1,72 | |
256K<Token≤1M | $0,573 | $3,44 | $3,44 | |
qwen3.5-plus-2026-02-15 | 0<Token≤128K | $0,115 | $0,688 | $0,688 |
128K<Token≤256K | $0,287 | $1,72 | $1,72 | |
256K<Token≤1M | $0,573 | $3,44 | $3,44 | |
qwen-plus | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-12-01 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-09-11 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-07-28 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi model terbatas di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Non-thinking mode | Mode berpikir (CoT + tanggapan) | |||
qwen-plus-us | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
qwen-plus-2025-12-01-us | 0<Token≤256K | $0.4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Mode tidak berpikir | Mode berpikir (CoT + respons) | |||
qwen3.5-plus | 0<Token≤128K | $0,115 | $0,688 | $0,688 |
128K<Token≤256K | $0,287 | $1,72 | $1,72 | |
256K<Token≤1M | $0,573 | $3,44 | $3,44 | |
qwen3.5-plus-2026-02-15 | 0<Token≤128K | $0,115 | $0,688 | $0,688 |
128K<Token≤256K | $0,287 | $1,72 | $1,72 | |
256K<Token≤1M | $0,573 | $3,44 | $3,44 | |
qwen-plus | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-latest | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-12-01 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6,881 | $9,175 | |
qwen-plus-2025-09-11 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6.881 | $9,175 | |
qwen-plus-2025-07-28 | 0<Token≤128K | $0,115 | $0,287 | $1,147 |
128K<Token≤256K | $0,345 | $2,868 | $3,441 | |
256K<Token≤1M | $0,689 | $6.881 | $9,175 | |
qwen-plus-2025-07-14 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 | $1,147 |
qwen-plus-2025-04-28 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 | $1,147 |
Model lainnya
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-plus-2025-01-25 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 |
qwen-plus-2025-01-12 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 |
qwen-plus-2024-12-20 | Tidak ada penetapan harga bertingkat | $0,115 | $0,287 |
Tiongkok (Hong Kong)
Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Mode tidak berpikir | Mode berpikir (CoT + respons) | |||
qwen-plus | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
qwen-plus-2025-12-01 | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model terbatas di UE.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Tidak berpikir | Berpikir (CoT + respons) | |||
qwen-plus | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
qwen-plus-2025-12-01 | 0<Token≤256K | $0,4 | $1,2 | $4 |
256K<Token≤1M | $1,2 | $3,6 | $12 | |
Qwen-Flash
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Faktor yang memengaruhi penagihan: Jika suatu model mendukung Batch Invocation, token input dan output-nya dikenai biaya sebesar 50% dari harga inferensi real-time. Jika suatu model mendukung Context Caching, hanya token input yang memenuhi syarat untuk diskon. Kedua diskon tersebut tidak dapat diterapkan secara bersamaan.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen3.5-flash Pemanggilan batch diskon 50% Diskon cache konteks | 0<Token≤1M | $0,1 | $0,4 | 1 juta token masing-masing |
qwen3.5-flash-2026-02-23 | 0<Token≤1M | $0,1 | $0,4 | |
qwen-flash Pemanggilan batch diskon 50% Diskon cache konteks | 0<Token≤256K | $0,05 | $0,4 | |
256K<Token≤1M | $0,25 | $2 | ||
qwen-flash-2025-07-28 | 0<Token≤256K | $0,05 | $0,4 | |
256K<Token≤1M | $0,25 | $2 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3.5-flash | 0<Token≤128K | $0,029 | $0,287 |
128K<Token≤256K | $0,115 | $1,147 | |
256K<Token≤1M | $0,172 | $1,72 | |
qwen3.5-flash-2026-02-23 | 0<Token≤128K | $0,029 | $0,287 |
128K<Token≤256K | $0,115 | $1,147 | |
256K<Token≤1M | $0,172 | $1,72 | |
qwen-flash Diskon cache konteks | 0<Token≤128K | $0,022 | $0,216 |
128K<Token≤256K | $0,087 | $0,861 | |
256K<Token≤1M | $0,173 | $1,721 | |
qwen-flash-2025-07-28 | 0<Token≤128K | $0,022 | $0,216 |
128K<Token≤256K | $0,087 | $0,861 | |
256K<Token≤1M | $0,173 | $1,721 |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi model terbatas di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-flash | 0<Token≤256K | $0,05 | $0,4 |
256K<Token≤1M | $0,25 | $2 | |
qwen-flash-2025-07-28 | 0<Token≤256K | $0,05 | $0,4 |
256K<Token≤1M | $0,25 | $2 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3.5-flash | 0<Token≤128K | $0,029 | $0,287 |
128K<Token≤256K | $0,115 | $1,147 | |
256K<Token≤1M | $0,172 | $1,72 | |
qwen3.5-flash-2026-02-23 | 0<Token≤128K | $0,029 | $0,287 |
128K<Token≤256K | $0,115 | $1,147 | |
256K<Token≤1M | $0,172 | $1,72 | |
qwen-flash Diskon cache konteks | 0<Token≤128K | $0,022 | $0,216 |
128K<Token≤256K | $0,087 | $0,861 | |
256K<Token≤1M | $0,173 | $1,721 | |
qwen-flash-2025-07-28 | 0<Token≤128K | $0,022 | $0,216 |
128K<Token≤256K | $0,087 | $0,861 | |
256K<Token≤1M | $0,173 | $1,721 |
Tiongkok (Hong Kong)
Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3.5-flash Diskon cache konteks | 0<Token≤1M | $0,1 | $0,4 |
qwen3.5-flash-2026-02-23 | 0<Token≤1M | $0,1 | $0,4 |
UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model terbatas di UE.
Model | Token masukan per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3.5-flash Diskon cache konteks | 0<Token≤1M | $0,1 | $0,4 |
qwen3.5-flash-2026-02-23 | 0<Token≤1M | $0,1 | $0,4 |
Qwen-Turbo
Qwen-Turbo tidak akan diperbarui lagi. Kami merekomendasikan Qwen-Flash sebagai penggantinya.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Untuk model yang mendukung Batch Invocation, harga satuan untuk token input dan output ditagih sebesar 50% dari harga inferensi real-time.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | |
Mode tidak berpikir | Mode berpikir (CoT + respons) | |||
qwen-turbo Pemanggilan batch diskon 50% | $0,05 | $0,2 | $0,5 | 1 juta token masing-masing |
qwen-turbo-latest | $0,05 | $0,2 | $0,5 | |
qwen-turbo-2025-04-28 | $0,05 | $0,2 | $0,5 | |
Model lainnya
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-turbo-2024-11-01 | $0,05 | $0,2 | 1 juta token masing-masing |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Non-thinking mode | Mode berpikir (CoT + respons) | ||
qwen-turbo | $0,044 | $0,087 | $0,431 |
qwen-turbo-latest | $0,044 | $0,087 | $0,431 |
qwen-turbo-2025-07-15 | $0,044 | $0,087 | $0,431 |
qwen-turbo-2025-04-28 | $0,044 | $0,087 | $0,431 |
QwQ
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwq-plus | $0,8 | $2,4 | 1 juta token |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwq-plus | $0,230 | $0,574 |
qwq-plus-latest | $0,230 | $0,574 |
qwq-plus-2025-03-05 | $0,230 | $0,574 |
Qwen-Long
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-long-latest | $0,072 | $0,287 | Tidak ada kuota gratis |
qwen-long-2025-01-25 | $0,072 | $0,287 |
Qwen-Omni
Aturan penagihan: Biaya dihitung berdasarkan token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan dan pembatasan laju.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||||
Input: Teks | Input: Audio | Input: Gambar/Video | Output: Teks Teks biasa sebagai input | Output: Teks Input multimodal | Output: Teks+Audio Hanya audio yang dikenai biaya | |||
qwen3-omni-flash | Berpikir dan tidak berpikir | $0,43 | $3,81 | $0,78 | $1,66 | $3,06 | $15,11 | 1 juta token masing-masing (tanpa memandang modalitas) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-omni-flash-2025-12-01 | Berpikir dan tidak berpikir | $0,43 | $3,81 | $0,78 | $1,66 | $3,06 | $15,11 | |
qwen3-omni-flash-2025-09-15 | Berpikir dan tidak berpikir | $0,43 | $3,81 | $0,78 | $1,66 | $3,06 | $15,11 | |
Model lainnya
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||||
Input: Teks | Input: Audio | Input: Gambar/Video | Output: Teks Teks biasa sebagai input | Output: Teks Input multimodal | Output: Teks+Audio Hanya audio yang dikenai biaya | ||
qwen-omni-turbo | $0,07 | $4,44 | $0,21 | $0,27 | $0,63 | $8,89 | 1 juta token masing-masing (tanpa memandang modalitas) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen-omni-turbo-latest | $0,07 | $4,44 | $0,21 | $0,27 | $0,63 | $8,89 | |
qwen-omni-turbo-2025-03-26 | $0,07 | $4,44 | $0,21 | $0,27 | $0,63 | $8,89 | |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||||
Input: Teks | Input: Audio Bagian audio ditagih secara terpisah | Input: Gambar/Video | Output: Teks Teks biasa sebagai input | Output: Teks Input multimodal | Output: Teks+Audio Hanya audio yang dikenai biaya | ||
qwen3-omni-flash | Berpikir dan tidak berpikir | $0,258 | $2,265 | $0,473 | $0,989 | $1,821 | $8.974 |
qwen3-omni-flash-2025-12-01 | Berpikir dan tidak berpikir | $0,258 | $2,265 | $0,473 | $0,989 | $1,821 | $8,974 |
qwen3-omni-flash-2025-09-15 | Berpikir dan tidak berpikir | $0,258 | $2,265 | $0,473 | $0,989 | $1,821 | $8,974 |
Model lainnya
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||||
Input: Teks | Input: Audio Bagian audio ditagih secara terpisah | Input: Gambar/Video | Output: Teks Teks biasa sebagai input | Output: Teks Input multimodal | Output: Teks+Audio Hanya audio yang dikenai biaya | |
qwen-omni-turbo | $0,058 | $3,584 | $0,216 | $0,230 | $0,646 | $7,168 |
qwen-omni-turbo-latest | $0,058 | $3,584 | $0,216 | $0,230 | $0,646 | $7,168 |
qwen-omni-turbo-2025-03-26 | $0,058 | $3,584 | $0,216 | $0,230 | $0,646 | $7,168 |
qwen-omni-turbo-2025-01-19 | $0,058 | $3,584 | $0,216 | $0,230 | $0,646 | $7,168 |
Qwen-Omni-Realtime
Aturan penagihan: Biaya dihitung berdasarkan token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan dan pembatasan laju.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||||
Input: Teks | Input: Audio Bagian audio ditagih secara terpisah | Input: Gambar | Output: Teks Teks biasa sebagai input | Output: Teks Input multimodal | Output: Teks+Audio Hanya audio yang dikenai biaya | ||
qwen3-omni-flash-realtime | $0,52 | $4,57 | $0,94 | $1,99 | $3,67 | $18,13 | 1 juta token masing-masing (tanpa memandang modalitas) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-omni-flash-realtime-2025-12-01 | $0,52 | $4,57 | $0,94 | $1,99 | $3,67 | $18,13 | |
qwen3-omni-flash-2025-09-15-realtime | $0,52 | $4,57 | $0,94 | $1,99 | $3,67 | $18,13 | |
qwen-omni-turbo-realtime | $0,270 | $4,440 | $0,840 | $1,070 | $2,520 | $8.890 | |
qwen-omni-turbo-realtime-latest | $0,270 | $4,440 | $0,840 | $1,070 | $2,520 | $8.890 | |
qwen-omni-turbo-realtime-2025-05-08 | $0,270 | $4,440 | $0,840 | $1,070 | $2,520 | $8.890 | |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||||
Input: Teks | Input: Audio Bagian audio ditagih secara terpisah | Input: Gambar | Output: Teks Teks biasa sebagai input | Output: Text Input multimodal | Output: Teks+Audio Hanya audio yang dikenai biaya | |
qwen3-omni-flash-realtime | $0,315 | $2,709 | $0,559 | $1,19 | $2,179 | $10,766 |
qwen3-omni-flash-realtime-2025-12-01 | $0,315 | $2,709 | $0,559 | $1,19 | $2,179 | $10,766 |
qwen3-omni-flash-realtime-2025-09-15 | $0,315 | $2,709 | $0,559 | $1,19 | $2,179 | $10,766 |
qwen-omni-turbo-realtime | $0,230 | $3,584 | $0,861 | $0,918 | $2,581 | $7,168 |
qwen-omni-turbo-realtime-latest | $0,230 | $3,584 | $0,861 | $0,918 | $2,581 | Rp7.168 |
qwen-omni-turbo-realtime-2025-05-08 | $0,230 | $3,584 | $0,861 | $0,918 | $2,581 | $7,168 |
QVQ
Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan dan pembatasan laju.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qvq-max | $1,2 | $4,8 | 1 juta token masing-masing |
qvq-max-latest | $1,2 | $4,8 | |
qvq-max-2025-03-25 | $1,2 | $4,8 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qvq-max | $1,147 | $4,588 |
qvq-max-latest | $1,147 | $4,588 |
qvq-max-2025-05-15 | $1,147 | $4,588 |
qvq-max-2025-03-25 | $1,147 | $4,588 |
qvq-plus | $0,287 | $0,717 |
qvq-plus-latest | $0,287 | $0,717 |
qvq-plus-2025-05-15 | $0,287 | $0,717 |
Qwen-VL
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Token masukan per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons | Kuota gratis (Catatan) |
qwen3-vl-plus Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,2 | $1,6 | 1 juta token masing-masing |
32K<Token≤128K | $0,3 | $2,4 | |||
128K<Token≤256K | $0,6 | $4,8 | |||
qwen3-vl-plus-2025-12-19 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,2 | $1,6 | |
32K<Token≤128K | $0,3 | $2,4 | |||
128K<Token≤256K | $0,6 | $4,8 | |||
qwen3-vl-plus-2025-09-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,2 | $1,6 | |
32K<Token≤128K | $0,3 | $2,4 | |||
128K<Token≤256K | $0,6 | $4,8 | |||
qwen3-vl-flash Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,05 | $0,4 | |
32K<Token≤128K | $0,075 | $0,6 | |||
128K<Token≤256K | $0,12 | $0,96 | |||
qwen3-vl-flash-2026-01-22 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,05 | $0,4 | |
32K<Token≤128K | $0,075 | $0,6 | |||
128K<Token≤256K | $0,12 | $0,96 | |||
qwen3-vl-flash-2025-10-15 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,05 | $0,4 | |
32K<Token≤128K | $0,075 | $0,6 | |||
128K<Token≤256K | $0,12 | $0,96 |
Model lainnya
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-vl-max Diskon cache konteks | Tidak ada penetapan harga bertingkat | $0,8 | $3,2 | 1 juta token masing-masing Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen-vl-max-latest | Tidak ada penetapan harga bertingkat | $0,8 | $3,2 | |
qwen-vl-max-2025-08-13 | Tidak ada penetapan harga bertingkat | $0,8 | $3,2 | |
qwen-vl-max-2025-04-08 | Tidak ada penetapan harga bertingkat | $0,8 | $3,2 | |
qwen-vl-plus Diskon cache konteks | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 | |
qwen-vl-plus-latest | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 | |
qwen-vl-plus-2025-08-15 | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 | |
qwen-vl-plus-2025-05-07 | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 | |
qwen-vl-plus-2025-01-25 | Tidak ada penetapan harga bertingkat | $0,21 | $0,63 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-vl-plus Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-plus-2025-09-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-flash Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 | ||
qwen3-vl-flash-2025-10-15 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Mode | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-vl-flash-us Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 | ||
qwen3-vl-flash-2026-01-22-us | Berpikir dan tidak berpikir | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 | ||
qwen3-vl-flash-2025-10-15-us | Berpikir dan tidak berpikir | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-vl-plus Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-plus-2025-12-19 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-plus-2025-09-23 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,143 | $1,434 |
32K<Token≤128K | $0,215 | $2,15 | ||
128K<Token≤256K | $0,43 | $4,301 | ||
qwen3-vl-flash Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 | ||
qwen3-vl-flash-2026-01-22 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 | ||
qwen3-vl-flash-2025-10-15 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,022 | $0,215 |
32K<Token≤128K | $0,043 | $0,43 | ||
128K<Token≤256K | $0,086 | $0,859 |
Model lainnya
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-vl-max Context cache discount | Tidak ada harga bertingkat | $0.23 | $0.574 |
qwen-vl-max-latest | Tidak ada harga bertingkat | $0.23 | $0.574 |
qwen-vl-max-2025-08-13 | Tidak ada harga bertingkat | $0.23 | $0.574 |
qwen-vl-max-2025-04-08 | Tidak ada harga bertingkat | $0.431 | $1.291 |
qwen-vl-max-2025-04-02 | Tidak ada harga bertingkat | $0.431 | $1.291 |
qwen-vl-max-2025-01-25 | Tidak ada harga bertingkat | $0.431 | $1.291 |
qwen-vl-max-2024-12-30 | Tidak ada harga bertingkat | $0.431 | $1.291 |
qwen-vl-max-2024-11-19 | Tidak ada harga bertingkat | $0.431 | $1.291 |
qwen-vl-plus Context cache discount | Tidak ada harga bertingkat | $0.115 | $0.287 |
qwen-vl-plus-latest | Tidak ada harga bertingkat | $0.115 | $0.287 |
qwen-vl-plus-2025-08-15 | Tidak ada harga bertingkat | $0.115 | $0.287 |
qwen-vl-plus-2025-07-10 | Tidak ada harga bertingkat | $0.022 | $0.216 |
qwen-vl-plus-2025-05-07 | Tidak ada harga bertingkat | $0.216 | $0.646 |
qwen-vl-plus-2025-01-25 | Tidak ada harga bertingkat | $0.216 | $0.646 |
qwen-vl-plus-2025-01-02 | Tidak ada harga bertingkat | $0.216 | $0.646 |
Tiongkok (Hong Kong)
Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), dan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-vl-plus Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,2 | $1,6 |
32K<Token≤128K | $0,3 | $2,4 | ||
128K<Token≤256K | $0,6 | $4,8 | ||
qwen3-vl-plus-2025-12-19 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,2 | $1,6 |
32K<Token≤128K | $0,3 | $2,4 | ||
128K<Token≤256K | $0,6 | $4,8 |
Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), dan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), dan sumber daya komputasi inferensi model terbatas di UE.
Model | Mode | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-vl-plus Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,2 | $1,6 |
32K<Token≤128K | $0,3 | $2,4 | ||
128K<Token≤256K | $0,6 | $4,8 | ||
qwen3-vl-plus-2025-12-19 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,2 | $1,6 |
32K<Token≤128K | $0,3 | $2,4 | ||
128K<Token≤256K | $0,6 | $4,8 | ||
qwen3-vl-flash Diskon cache konteks | Berpikir dan tidak berpikir | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 | ||
qwen3-vl-flash-2025-10-15 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,05 | $0,4 |
32K<Token≤128K | $0,075 | $0,6 | ||
128K<Token≤256K | $0,12 | $0,96 |
Qwen-OCR
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-vl-ocr | $0,07 | $0,16 | 1 juta token masing-masing |
qwen-vl-ocr-2025-11-20 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-vl-ocr | $0,043 | $0,072 |
qwen-vl-ocr-2025-11-20 | $0,043 | $0,072 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-vl-ocr | $0,717 | $0,717 |
qwen-vl-ocr-latest | $0,043 | $0,072 |
qwen-vl-ocr-2025-11-20 | ||
qwen-vl-ocr-2025-08-28 | $0,717 | $0,717 |
qwen-vl-ocr-2025-04-13 | ||
qwen-vl-ocr-2024-10-28 |
Qwen-Math
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-math-plus | $0,574 | $1,721 | Tidak ada kuota gratis |
qwen-math-plus-latest | $0,574 | $1,721 | |
qwen-math-plus-2024-09-19 | $0,574 | $1,721 | |
qwen-math-plus-2024-08-16 | $0,574 | $1,721 | |
qwen-math-turbo | $0,287 | $0,861 | |
qwen-math-turbo-latest | $0,287 | $0,861 | |
qwen-math-turbo-2024-09-19 | $0,287 | $0,861 |
Qwen-Coder
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Faktor yang memengaruhi penagihan: Jika suatu model mendukung Context Caching, diskon hanya berlaku untuk token input.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-coder-plus Diskon cache konteks | 0<Token≤32K | $1 | $5 | 1 juta token masing-masing |
32K<Token≤128K | $1,8 | $9 | ||
128K<Token≤256K | $3 | $15 | ||
256K<Token≤1M | $6 | $60 | ||
qwen3-coder-plus-2025-09-23 | 0<Token≤32K | $1 | $5 | |
32K<Token≤128K | $1,8 | $9 | ||
128K<Token≤256K | $3 | $15 | ||
256K<Token≤1M | $6 | $60 | ||
qwen3-coder-plus-2025-07-22 | 0<Token≤32K | $1 | $5 | |
32K<Token≤128K | $1,8 | $9 | ||
128K<Token≤256K | $3 | $15 | ||
256K<Token≤1M | $6 | $60 | ||
qwen3-coder-flash | 0<Token≤32K | $0,3 | $1,5 | |
32K<Token≤128K | $0,5 | $2,5 | ||
128K<Token≤256K | $0,8 | $4 | ||
256K<Token≤1M | $1,6 | $9,6 | ||
qwen3-coder-flash-2025-07-28 | 0<Token≤32K | $0,3 | $1,5 | |
32K<Token≤128K | $0,5 | $2,5 | ||
128K<Token≤256K | $0,8 | $4 | ||
256K<Token≤1M | $1,6 | $9,6 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-plus Diskon cache konteks | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28,671 | |
qwen3-coder-plus-2025-09-23 | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28,671 | |
qwen3-coder-plus-2025-07-22 | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28,671 | |
qwen3-coder-flash Diskon cache konteks | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
256K<Token≤1M | $0,717 | $3,584 | |
qwen3-coder-flash-2025-07-28 | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
256K<Token≤1M | $0,717 | $3,584 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
seri qwen3-coder
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-plus Diskon cache konteks | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28.671 | |
qwen3-coder-plus-2025-09-23 | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28.671 | |
qwen3-coder-plus-2025-07-22 | 0<Token≤32K | $0,574 | $2,294 |
32K<Token≤128K | $0,861 | $3,441 | |
128K<Token≤256K | $1,434 | $5,735 | |
256K<Token≤1M | $2,868 | $28,671 | |
qwen3-coder-flash | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
256K<Token≤1M | $0,717 | $3,584 | |
qwen3-coder-flash-2025-07-28 | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
256K<Token≤1M | $0,717 | $3,584 |
Seri qwen-coder sebelumnya
Model | Input tokens per request | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-coder-plus | Tidak ada penetapan harga bertingkat | $0,502 | $1,004 |
qwen-coder-plus-latest | Tidak ada penetapan harga bertingkat | $0,502 | $1,004 |
qwen-coder-plus-2024-11-06 | Tidak ada penetapan harga bertingkat | $0,502 | $1.004 |
qwen-coder-turbo | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
qwen-coder-turbo-latest | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
qwen-coder-turbo-2024-09-19 | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
UE
Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), dan sumber daya komputasi inferensi model terbatas di UE.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-next | 0<Token≤32K | $0,3 | $1,5 |
32K<Token≤128K | $0,5 | $2,5 | |
128K<Token≤256K | $0,8 | $4 |
Qwen-MT
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-mt-plus | $2,46 | $7,37 | 1 juta token masing-masing |
qwen-mt-flash | $0,16 | $0,49 | |
qwen-mt-lite | $0,12 | $0,36 | |
qwen-mt-turbo | $0,16 | $0,49 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-mt-plus | $0,259 | $0,775 |
qwen-mt-flash | $0,101 | $0,280 |
qwen-mt-lite | $0,086 | $0,229 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-mt-plus | $0,259 | $0,775 |
qwen-mt-flash | $0,101 | $0,280 |
qwen-mt-lite | $0,086 | $0,229 |
qwen-mt-turbo | $0,101 | $0,280 |
Qwen data mining
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-doc-turbo | $0,087 | $0,144 | Tidak ada kuota gratis |
Qwen deep research
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-deep-research | $7,742 | $23,367 | Tidak ada kuota gratis |
Generasi teks - Qwen - Sumber terbuka
Qwen3.5
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Tidak berpikir | Berpikir (CoT + respons) | |||
qwen3.5-397b-a17b | 0<Token≤128K | $0,172 | $1,032 | $1,032 |
128K<Token≤256K | $0,43 | $2,58 | $2,58 | |
qwen3.5-122b-a10b | 0<Token≤128K | $0,115 | $0,917 | $0,917 |
128K<Token≤256K | $0,287 | $2,294 | $2,294 | |
qwen3.5-27b | 0<Token≤128K | $0,086 | $0,688 | $0,688 |
128K<Token≤256K | $0,258 | $2,064 | $2,064 | |
qwen3.5-35b-a3b | 0<Token≤128K | $0,057 | $0,459 | $0,459 |
128K<Token≤256K | $0,229 | $1,835 | $1,835 | |
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Token masukan per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | |
Tidak berpikir | Berpikir (CoT + respons) | ||||
qwen3.5-397b-a17b | 0<Token≤256K | $0,6 | $3,6 | $3,6 | 1 juta token masing-masing |
qwen3.5-122b-a10b | 0<Token≤256K | $0,4 | $3,2 | $3,2 | |
qwen3.5-27b | 0<Token≤256K | $0,3 | $2,4 | $2,4 | |
qwen3.5-35b-a3b | 0<Token≤256K | $0,25 | $2 | $2 | |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Non-thinking | Berpikir (CoT + respons) | |||
qwen3.5-397b-a17b | 0<Token≤128K | $0,172 | $1,032 | Rp1.032 |
128K<Token≤256K | $0,43 | $2,58 | $2,58 | |
qwen3.5-122b-a10b | 0<Token≤128K | $0,115 | $0,917 | $0,917 |
128K<Token≤256K | $0,287 | $2,294 | $2,294 | |
qwen3.5-27b | 0<Token≤128K | $0,086 | $0,688 | $0,688 |
128K<Token≤256K | $0,258 | $2.064 | $2.064 | |
qwen3.5-35b-a3b | 0<Token≤128K | $0,057 | $0,459 | $0,459 |
128K<Token≤256K | $0,229 | $1,835 | $1,835 | |
Qwen3
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | |
Mode tidak berpikir | Mode berpikir | ||||
qwen3-next-80b-a3b-thinking | Hanya berpikir | $0,15 | - | $1,2 | 1 juta token masing-masing |
qwen3-next-80b-a3b-instruct | Hanya tidak berpikir | $0,15 | $1,2 | - | |
qwen3-235b-a22b-thinking-2507 | Hanya berpikir | $0,23 | - | $2,3 | |
qwen3-235b-a22b-instruct-2507 | Hanya tidak berpikir | $0,23 | $0,92 | - | |
qwen3-30b-a3b-thinking-2507 | Hanya berpikir | $0,2 | - | $2,4 | |
qwen3-30b-a3b-instruct-2507 | Hanya tidak berpikir | $0,2 | $0,8 | - | |
qwen3-235b-a22b | Berpikir dan tidak berpikir | $0,7 | $2,8 | $8,4 | |
qwen3-32b | Berpikir dan tidak berpikir | $0,16 | $0,64 | $0,64 | |
qwen3-30b-a3b | Berpikir dan tidak berpikir | $0,2 | $0,8 | $2,4 | |
qwen3-14b | Berpikir dan tidak berpikir | $0,35 | $1,4 | $4,2 | |
qwen3-8b | Berpikir dan tidak berpikir | $0,18 | $0,7 | $2,1 | |
qwen3-4b | Berpikir dan tidak berpikir | $0,11 | $0,42 | $1,26 | |
qwen3-1,7b | Berpikir dan tidak berpikir | $0,11 | $0,42 | $1,26 | |
qwen3-0,6b | Berpikir dan tidak berpikir | $0,11 | $0,42 | $1,26 | |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Mode tanpa berpikir | Mode berpikir (CoT + respons) | |||
qwen3-next-80b-a3b-thinking | Hanya berpikir | $0,144 | - | $1,434 |
qwen3-next-80b-a3b-instruct | Tanpa pemikiran sama sekali | $0,144 | $0,574 | - |
qwen3-235b-a22b-thinking-2507 | Hanya berpikir | $0,287 | - | $2,3 |
qwen3-235b-a22b-instruct-2507 | Tanpa pemikiran sama sekali | $0,287 | $0,92 | - |
qwen3-30b-a3b-thinking-2507 | Hanya berpikir | $0,108 | - | $1,076 |
qwen3-30b-a3b-instruct-2507 | Hanya tidak berpikir | $0,108 | $0,431 | - |
qwen3-235b-a22b | Berpikir dan tidak berpikir | $0,287 | $1,147 | $2,868 |
qwen3-32b | Berpikir dan tidak berpikir | $0,287 | $0,64 | $0,64 |
qwen3-30b-a3b | Berpikir dan tidak berpikir | $0,108 | $0,431 | $1,076 |
qwen3-14b | Berpikir dan tidak berpikir | $0,144 | $0,574 | $1,434 |
qwen3-8b | Berpikir dan tidak berpikir | $0,072 | $0,287 | $0,717 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) | |
Mode tidak berpikir | Mode berpikir (CoT + respons) | |||
qwen3-next-80b-a3b-thinking | Hanya berpikir | $0,144 | - | $1,434 |
qwen3-next-80b-a3b-instruct | Hanya tidak berpikir | $0,144 | $0,574 | - |
qwen3-235b-a22b-thinking-2507 | Hanya berpikir | $0,287 | - | $2,868 |
qwen3-235b-a22b-instruct-2507 | Hanya tidak berpikir | $0,287 | $1,147 | - |
qwen3-30b-a3b-thinking-2507 | Hanya berpikir | $0,108 | - | $1,076 |
qwen3-30b-a3b-instruct-2507 | Hanya tidak berpikir | $0,108 | $0,431 | - |
qwen3-235b-a22b | Berpikir dan tidak berpikir | $0,287 | $1,147 | $2,868 |
qwen3-32b | Berpikir dan tidak berpikir | $0,287 | $1,147 | $2,868 |
qwen3-30b-a3b | Berpikir dan tidak berpikir | $0,108 | $0,431 | $1,076 |
qwen3-14b | Berpikir dan tidak berpikir | $0,144 | $0,574 | $1,434 |
qwen3-8b | Berpikir dan tidak berpikir | $0,072 | $0,287 | $0,717 |
qwen3-4b | Berpikir dan tidak berpikir | $0,044 | $0,173 | $0,431 |
qwen3-1,7b | Berpikir dan tidak berpikir | $0,044 | $0,173 | $0,431 |
qwen3-0,6b | Berpikir dan tidak berpikir | $0,044 | $0,173 | $0,431 |
QwQ - Sumber terbuka
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwq-32b | $0,287 | $0,861 | Tidak ada kuota gratis |
QwQ-Preview
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwq-32b-preview | $0,287 | $0,861 | Tidak ada kuota gratis |
Qwen2.5
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen2.5-14b-instruct-1m | $0,805 | $3,22 | 1 juta token masing-masing |
qwen2.5-7b-instruct-1m | $0,368 | $1,47 | |
qwen2.5-72b-instruct | $1,4 | $5,6 | |
qwen2.5-32b-instruct | $0,7 | $2,8 | |
qwen2.5-14b-instruct | $0,35 | $1,4 | |
qwen2.5-7b-instruct | $0,175 | $0,7 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen2.5-14b-instruct-1m | $0,144 | $0,431 |
qwen2.5-7b-instruct-1m | $0,072 | $0,144 |
qwen2.5-72b-instruct | $0,574 | $1,721 |
qwen2.5-32b-instruct | $0,287 | $0,861 |
qwen2.5-14b-instruct | $0,144 | $0,431 |
qwen2.5-7b-instruct | $0,072 | $0,144 |
qwen2.5-3b-instruct | $0,044 | $0,130 |
qwen2.5-1,5b-instruct | Gratis untuk waktu terbatas | |
qwen2.5-0,5b-instruct | ||
QVQ
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qvq-72b-preview | $1,721 | $5.161 | Tidak ada kuota gratis |
Qwen-Omni
Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan dan pembatasan laju.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||||
Input: Teks | Input: Audio | Input: Gambar/Video | Output: Teks Teks biasa sebagai input | Output: Teks Input multimodal | Keluaran: Teks + Audio Hanya audio yang dikenai biaya | ||
qwen2.5-omni-7b | $0,10 | $6,76 | $0,28 | $0,40 | $0,84 | $13,51 | 1 juta token (tanpa memandang modalitas) Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||||
Input: Teks | Input: Audio | Input: Gambar/Video | Output: Teks Teks biasa sebagai input | Output: Teks Input multimodal | Output: Teks+Audio Hanya audio yang dikenai biaya | |
qwen2.5-omni-7b | $0,087 | $5,448 | $0,287 | $0,345 | $0,861 | $10,895 |
Qwen3-Omni-Captioner
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-omni-30b-a3b-captioner | $3,81 | $3,06 | 1 juta token |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-omni-30b-a3b-captioner | $2,265 | $1,821 |
Qwen-VL
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + tanggapan | Kuota gratis (Catatan) |
qwen3-vl-235b-a22b-thinking | Hanya berpikir | $0,4 | $4 | 1 juta token masing-masing |
qwen3-vl-235b-a22b-instruct | Hanya tidak berpikir | $0,4 | $1,6 | |
qwen3-vl-32b-thinking | Hanya berpikir | $0,16 | $0,64 | |
qwen3-vl-32b-instruct | Hanya non-thinking | $0,16 | $0,64 | |
qwen3-vl-30b-a3b-thinking | Hanya berpikir | $0,2 | $2,4 | |
qwen3-vl-30b-a3b-instruct | Hanya tidak berpikir | $0,2 | $0,8 | |
qwen3-vl-8b-thinking | Hanya berpikir | $0,18 | $2,1 | |
qwen3-vl-8b-instruct | Hanya tidak berpikir | $0,18 | $0,7 |
Model lainnya
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen2.5-vl-72b-instruct | $2,8 | $8,4 | 1 juta token masing-masing |
qwen2.5-vl-32b-instruct | $1,4 | $4,2 | |
qwen2.5-vl-7b-instruct | $0,35 | $1,05 | |
qwen2.5-vl-3b-instruct | $0,21 | $0,63 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-vl-235b-a22b-thinking | Hanya berpikir | $0,287 | $2,867 |
qwen3-vl-235b-a22b-instruct | Hanya tidak berpikir | $0,287 | $1,147 |
qwen3-vl-32b-thinking | Hanya berpikir | $0,16 | $0,64 |
qwen3-vl-32b-instruct | Tanpa pemikiran sama sekali | $0,16 | $0,64 |
qwen3-vl-30b-a3b-thinking | Hanya berpikir | $0,108 | $1,075 |
qwen3-vl-30b-a3b-instruct | Tanpa pemikiran sama sekali | $0,108 | $0,43 |
qwen3-vl-8b-thinking | Hanya berpikir | $0,072 | $0,717 |
qwen3-vl-8b-instruct | Tanpa pemikiran sama sekali | $0,072 | $0,287 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Mode | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT + respons |
qwen3-vl-235b-a22b-thinking | Hanya berpikir | $0,287 | $2,8677 |
qwen3-vl-235b-a22b-instruct | Hanya tidak berpikir | $0,287 | $1,147 |
qwen3-vl-32b-thinking | Hanya berpikir | $0,287 | $2,868 |
qwen3-vl-32b-instruct | Hanya Tanpa Berpikir | $0,287 | $1,147 |
qwen3-vl-30b-a3b-thinking | Hanya berpikir | $0,108 | $1,076 |
qwen3-vl-30b-a3b-instruct | Hanya tidak berpikir | $0,108 | $0,431 |
qwen3-vl-8b-thinking | Hanya berpikir | $0,072 | $0,717 |
qwen3-vl-8b-instruct | Hanya non-thinking | $0,072 | $0,287 |
Model lainnya
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen2.5-vl-72b-instruct | $2,294 | $6,881 |
qwen2.5-vl-32b-instruct | $1,147 | $3,441 |
qwen2.5-vl-7b-instruct | $0,287 | $0,717 |
qwen2.5-vl-3b-instruct | $0,173 | $0,517 |
qwen2-vl-72b-instruct | $2,294 | $6,881 |
qwen2-vl-7b-instruct | Gratis untuk waktu terbatas | |
qwen2-vl-2b-instruct | ||
Qwen-Math
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen2.5-math-72b-instruct | $0,574 | $1,721 | Tidak ada kuota gratis |
qwen2.5-math-7b-instruct | $0,144 | $0,287 | |
qwen2.5-math-1,5b-instruct | Gratis untuk waktu terbatas | ||
Qwen-Coder
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-coder-next | 0<Token≤32K | $0,3 | $1,5 | 1 juta token masing-masing |
32K<Token≤128K | $0,5 | $2,5 | ||
128K<Token≤256K | $0,8 | $4 | ||
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $1,5 | $7,5 | |
32K<Token≤128K | $2,7 | $13,5 | ||
128K<Token≤200K | $4,5 | $22,5 | ||
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0,45 | $2,25 | |
32K<Token≤128K | $0,75 | $3,75 | ||
128K<Token≤200K | $1,2 | $6 |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,291 | $5,161 | |
128K<Token≤200K | $2,151 | $8,602 | |
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0,216 | $0,861 |
32K<Token≤128K | $0,323 | $1,291 | |
128K<Token≤200K | $0,538 | $2,151 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen3-coder-next | 0<Token≤32K | $0,144 | $0,574 |
32K<Token≤128K | $0,216 | $0,861 | |
128K<Token≤256K | $0,359 | $1,434 | |
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $0,861 | $3,441 |
32K<Token≤128K | $1,291 | $5,161 | |
128K<Token≤200K | $2,151 | $8,602 | |
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0,216 | $0,861 |
32K<Token≤128K | $0,323 | $1.291 | |
128K<Token≤200K | $0,538 | $2,151 | |
qwen2.5-coder-32b-instruct | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
qwen2.5-coder-14b-instruct | Tidak ada penetapan harga bertingkat | $0,287 | $0,861 |
qwen2.5-coder-7b-instruct | Tidak ada penetapan harga bertingkat | $0,144 | $0,287 |
qwen2.5-coder-3b-instruct | Tidak ada penetapan harga bertingkat | Gratis untuk waktu terbatas | |
qwen2.5-coder-1.5b-instruct | Tidak ada penetapan harga bertingkat | ||
qwen2.5-coder-0,5b-instruct | Tidak ada penetapan harga bertingkat | ||
Generasi teks - Pihak ketiga
DeepSeek
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
deepseek-v3.2 | $0,287 | $0,431 | Tidak ada kuota gratis |
deepseek-v3.2-exp | $0,287 | $0,431 | |
deepseek-v3.1 | $0,574 | $1,721 | |
deepseek-r1 | $0,574 | $2,294 | |
deepseek-r1-0528 | $0,574 | $2,294 | |
deepseek-v3 | $0,287 | $1,147 | |
deepseek-r1-distill-qwen-1.5b | Gratis untuk waktu terbatas | ||
deepseek-r1-distill-qwen-7b | $0,072 | $0,144 | Tidak ada kuota gratis |
deepseek-r1-distill-qwen-14b | $0,144 | $0,431 | |
deepseek-r1-distill-qwen-32b | $0,287 | $0,861 | |
deepseek-r1-distill-llama-8b | Gratis untuk waktu terbatas | ||
deepseek-r1-distill-llama-70b | Gratis untuk waktu terbatas | ||
Kimi
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
kimi-k2.5 | $0,574 | $3,011 | |
kimi-k2-thinking | $0,574 | $2,294 | Tidak ada kuota gratis |
Moonshot-Kimi-K2-Instruct | $0,574 | $2,294 |
MiniMax
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Mode | Harga input (per 1 juta token) | Token output (per 1 juta token) CoT + tanggapan |
MiniMax-M2.5 | Hanya berpikir | $0,304 | $1,213 |
GLM
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Model | Mode | Token input per permintaan | Harga input (per 1 juta token) | Harga output (per 1 juta token) CoT dan respons |
glm-5 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,573 | $2,58 |
32K<Token≤166K | $0,86 | $3,154 | ||
glm-4.7 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,431 | $2,007 |
32K<Token≤166K | $0,574 | $2,294 | ||
glm-4.6 | Berpikir dan tidak berpikir | 0<Token≤32K | $0,431 | $2,007 |
32K<Token≤166K | $0,574 | $2,294 |
Generasi gambar
Metode: Anda hanya dikenai biaya berdasarkan jumlah gambar yang berhasil dihasilkan.
Rumus: Biaya = Harga per gambar × Jumlah gambar yang dihasilkan.
Detail:
Biaya bersifat independen dari resolusi atau rasio aspek gambar keluaran.
Permintaan yang gagal tidak menimbulkan biaya atau menghabiskan kuota gratis.
Qwen-Image
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
qwen-image-2.0-pro | $0,075/gambar | 100 gambar masing-masing |
qwen-image-2.0-pro-2026-03-03 | $0,075/gambar | |
qwen-image-2.0 | $0,035/gambar | |
qwen-image-2.0-2026-03-03 | $0,035/gambar | |
qwen-image-max | $0,075/gambar | |
qwen-image-max-2025-12-30 | $0,075/gambar | |
qwen-image-plus | $0,03/gambar | |
qwen-image-plus-2026-01-09 | $0,03/gambar | |
qwen-image | $0,035/gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
qwen-image-2.0-pro | $0,071676/gambar |
qwen-image-2.0-pro-2026-03-03 | $0,071676/gambar |
qwen-image-2.0 | $0,028671/gambar |
qwen-image-2.0-2026-03-03 | $0,028671/gambar |
qwen-image-max | $0,071677/gambar |
qwen-image-max-2025-12-30 | $0,071677/gambar |
qwen-image-plus | $0,028671/gambar |
qwen-image-plus-2026-01-09 | $0,028671/gambar |
qwen-image | $0,035/gambar |
Qwen-Image-Edit
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
qwen-image-2.0-pro | $0,075/gambar | 100 gambar masing-masing |
qwen-image-2.0-pro-2026-03-03 | $0,075/gambar | |
qwen-image-2.0 | $0,035/gambar | |
qwen-image-2.0-2026-03-03 | $0,035/gambar | |
qwen-image-edit-max | $0,075/gambar | |
qwen-image-edit-max-2026-01-16 | $0,075/gambar | |
qwen-image-edit-plus | $0,03/gambar | |
qwen-image-edit-plus-2025-12-15 | $0,03/gambar | |
qwen-image-edit-plus-2025-10-30 | $0,03/gambar | |
qwen-image-edit | $0,045/gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
qwen-image-2.0-pro | $0,071676/gambar |
qwen-image-2.0-pro-2026-03-03 | $0,071676/gambar |
qwen-image-2.0 | $0,028671/gambar |
qwen-image-2.0-2026-03-03 | $0,028671/gambar |
qwen-image-edit-max | $0,071677/gambar |
qwen-image-edit-max-2026-01-16 | $0,071677/gambar |
qwen-image-edit-plus | $0,028671/gambar |
qwen-image-edit-plus-2025-12-15 | $0,028671/gambar |
qwen-image-edit-plus-2025-10-30 | $0,028671/gambar |
qwen-image-edit | $0,043/gambar |
Qwen-MT-Image
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.
Model | Harga output | Kuota gratis (Catatan) |
qwen-mt-image | $0,000431/gambar | Tidak ada kuota gratis |
Generasi teks-ke-gambar - Z-Image
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
z-image-turbo | Penulisan ulang prompt dinonaktifkan ( Penulisan ulang prompt diaktifkan ( | 100 gambar Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
z-image-turbo | Penulisan ulang prompt dinonaktifkan ( Penulisan ulang prompt diaktifkan ( |
Wan teks-ke-gambar
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
wan2.6-t2i | $0,03/gambar | 50 gambar |
wan2.5-t2i-preview | $0,03/gambar | 50 gambar |
wan2.2-t2i-plus | $0,05/gambar | 100 gambar |
wan2.2-t2i-flash | $0,025/gambar | 100 gambar |
wan2.1-t2i-plus | $0,05/gambar | 200 gambar |
wan2.1-t2i-turbo | $0,025/gambar | 200 gambar |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Harga output |
wan2.6-t2i | $0,028671/gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
wan2.6-t2i | $0,028671/gambar |
wan2.5-t2i-preview | $0,028671/gambar |
wan2.2-t2i-plus | $0,020070/gambar |
wan2.2-t2i-flash | $0,028671/gambar |
wanx2.1-t2i-plus | $0,028671/gambar |
wanx2.1-t2i-turbo | $0,020070/gambar |
wanx2.0-t2i-turbo | $0,005735/gambar |
Wan generasi dan pengeditan gambar
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga output | Kuota gratis (Catatan) |
wan2.6-image | $0,03/gambar | 50 gambar |
Global
Model Global (Virginia) tidak memiliki kuota gratis.
Model | Harga output |
wan2.6-image | $0,028671/gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga output |
wan2.6-image | $0,028671/gambar |
Wan pengeditan gambar umum
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Layanan | Model | Harga output | Kuota gratis (Catatan) |
Pengeditan gambar umum 2.5 | wan2.5-i2i-preview | $0,03/gambar | 50 gambar |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Layanan | Model | Harga output |
Pengeditan gambar umum 2.5 | wan2.5-i2i-preview | $0,028671/gambar |
Pengeditan gambar umum 2.1 | wanx2.1-imageedit | $0,020070/gambar |
OutfitAnyone
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
aitryon-plus: Biaya hanya berlaku untuk output. Untuk aturan penagihan, lihat Generasi gambar.
aitryon-parsing-v1: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar input. Permintaan yang gagal tidak dikenai biaya.
Layanan | Model | Harga | Kuota gratis (Catatan) |
OutfitAnyone - Plus | aitryon-plus | $0,071677/gambar | Tidak ada kuota gratis |
OutfitAnyone - Parsing gambar | aitryon-parsing-v1 | $0,000574/gambar |
Generasi video
Metode: Anda hanya dikenai biaya berdasarkan durasi video (detik) dari video yang berhasil dihasilkan.
Rumus: Biaya = Harga per detik × Durasi video (detik).
Detail:
Beberapa model menggunakan penetapan harga berbasis resolusi, di mana harga bervariasi berdasarkan resolusi (480p/720p/1080p).
Beberapa model menggunakan penetapan harga berbasis mode, di mana harga bervariasi berdasarkan mode video (Standar/Edisi Profesional).
Beberapa model menggunakan penetapan harga berbasis rasio aspek, di mana harga bervariasi berdasarkan rasio aspek (1:1/3:4).
Beberapa model menggunakan penetapan harga seragam, yang bersifat independen dari resolusi, mode, atau rasio aspek.
Permintaan yang gagal tidak menimbulkan biaya atau menghabiskan kuota gratis.
Wan - teks-ke-video
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Resolusi video output | Harga output | Kuota gratis (Catatan) Berlaku: 90 hari setelah mengaktifkan Model Studio |
wan2.6-t2v | 720P | $0,10/detik | 50 detik |
1080P | $0,15/detik | ||
wan2.5-t2v-preview | 480P | $0,05/detik | 50 detik |
720P | $0,10/detik | ||
1080P | $0,15/detik | ||
wan2.2-t2v-plus | 480P | $0,02/detik | 50 detik |
1080P | $0,10/detik | ||
wan2.1-t2v-turbo | 480P | $0,036/detik | 200 detik |
720P | $0,036/detik | ||
wan2.1-t2v-plus | 720P | $0,10/detik | 200 detik |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.6-t2v | 720P | $0,086012/detik |
1080P | $0,143353/detik |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.6-t2v-us | 720P | $0,1/detik |
1080P | $0,15/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.6-t2v | 720P | $0,086012/detik |
1080P | $0,143353/detik | |
wan2.5-t2v-preview | 480P | $0,043006/detik |
720P | $0,086012/detik | |
1080P | $0,143353/detik | |
wan2.2-t2v-plus | 480P | $0,02007/detik |
1080P | $0,100347/detik | |
wanx2.1-t2v-turbo | 480P | $0,034405/detik |
720P | $0,034405/detik | |
wanx2.1-t2v-plus | 720P | $0,100347/second |
Wan - image-to-video - debut pertama
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Jenis video output | Resolusi video output | Harga output | Kuota gratis (Catatan) Berlaku: 90 hari setelah mengaktifkan Model Studio |
wan2.6-i2v-flash | Video dengan audio
| 720P | $0,05/detik | 50 detik |
1080P | $0,075/detik | |||
Video tanpa audio
| 720P | $0,025/detik | ||
1080P | $0,0375/detik | |||
wan2.6-i2v | Video dengan audio | 720P | $0,10/detik | 50 detik |
1080P | $0,15/detik | |||
wan2.5-i2v-preview | Video dengan audio | 480P | $0,05/detik | 50 detik |
720P | $0,10/second | |||
1080P | $0,15/detik | |||
wan2.2-i2v-flash | Video tanpa audio | 480P | $0,015/detik | 50 detik |
720P | $0,036/detik | |||
wan2.2-i2v-plus | Video tanpa audio | 480P | $0,02/detik | 50 detik |
1080P | $0,10/detik | |||
wan2.1-t2v-turbo | Video tanpa audio | 480P | $0,036/detik | 200 detik |
720P | $0,036/detik | |||
wan2.1-t2v-plus | Video tanpa audio | 720P | $0,10/detik | 200 detik |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.6-i2v | 720P | $0,086012/detik |
1080P | $0,143353/detik |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wan2.6-i2v-us | 720P | $0,1/detik |
1080P | $0,15/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Jenis video output | Resolusi video output | Harga output |
wan2.6-i2v-flash | Video dengan audio
| 720P | $0,043006/detik |
1080P | $0,071676/detik | ||
Video tanpa audio
| 720P | $0,021503/detik | |
1080P | $0,035838/detik | ||
wan2.6-i2v | Video dengan audio | 720P | $0,086012/detik |
1080P | $0,143353/detik | ||
wan2.5-i2v-preview | Video dengan audio | 480P | $0,043006/detik |
720P | $0,086012/detik | ||
1080P | $0,143353/detik | ||
wan2.2-i2v-plus | Video tanpa audio | 480P | $0,02007/detik |
1080P | $0,100347/detik | ||
wanx2.1-t2v-turbo | Video tanpa audio | 480P | $0,034405/detik |
720P | $0,034405/detik | ||
wanx2.1-t2v-plus | Video tanpa audio | 720P | $0,100347/detik |
Wan - gambar-ke-video - frame pertama dan terakhir
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Resolusi video output | Harga output | Kuota gratis (Catatan) Berlaku: 90 hari setelah mengaktifkan Model Studio |
wan2.2-kf2v-flash | 480P | $0,015/detik | 50 detik |
720P | $0,036/detik | ||
1080P | $0,07/detik | ||
wan2.1-kf2v-plus | 720P | $0,10/detik | 200 detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Output Video Resolution | Harga output |
wan2.2-kf2v-flash | 480P | $0.014335/detik |
720P | $0,028671/detik | |
1080P | $0,068809/detik | |
wanx2.1-kf2v-plus | 720P | $0,100347/detik |
Wan - referensi-ke-video
Aturan penagihan: Biaya berlaku untuk video input dan output berdasarkan durasi video dalam detik. Generasi yang gagal tidak dikenai biaya dan tidak menghabiskan kuota gratis.
Rumus: Durasi yang ditagih = durasi video input (maksimal 5 detik) + durasi video output.
Video input dikenai biaya maksimal 5 detik. Untuk aturan spesifik, lihat Wan - referensi-ke-video.
Video output dikenai biaya berdasarkan jumlah detik dari video yang berhasil dihasilkan.
Deskripsi penetapan harga: Harga satuan ditentukan oleh tingkat resolusi dan opsi audio, tanpa memandang resolusi atau audio pada video input.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Spesifikasi output | Resolusi output | Harga input & output | Kuota gratis (Catatan) Berlaku: 90 hari setelah mengaktifkan Model Studio |
wan.6-r2v-flash | Video dengan audio
| 720P | $0,05/detik | 50 detik |
1080P | $0,075/detik | |||
Video tanpa audio
| 720P | $0,025/detik | ||
1080P | $0,0375/detik | |||
wan2.6-r2v | Video dengan audio | 720P | $0,10/detik | 50 detik |
1080P | $0,15/detik |
Global
Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.
Mode penyebaran Global tidak memiliki kuota gratis.
Model | Spesifikasi output | Resolusi output | Harga input & output |
wan2.6-r2v | Video dengan audio | 720P | $0,086012/detik |
1080P | $0,143353/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Spesifikasi output | Resolusi output | Harga input & output |
wan.6-r2v-flash | Video dengan audio
| 720P | $0,043006/detik |
1080P | $0,071676/detik | ||
Video tanpa audio
| 720P | $0,021503/detik | |
1080P | $0,035838/detik | ||
wan2.6-r2v | Video dengan audio | 720P | $0,086012/detik |
1080P | $0,143353/detik |
Wan - pengeditan video umum
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Resolusi video output | Harga output | Kuota gratis (Catatan) |
wan2.1-vace-plus | 720P | $0,10/detik | 50 detik Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Resolusi video output | Harga output |
wanx2.1-vace-plus | 720P | $0,100347/detik |
Wan - manusia digital
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
wan2.2-s2v-detect: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.
wan2.2-s2v: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Service | Model | Price | Kuota gratis (Catatan) |
Deteksi gambar | wan2.2-s2v-detect | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi video | wan2.2-s2v | Video output:
|
Wan - gambar-ke-aksi
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Output video mode | Harga output | Kuota gratis (Catatan) |
wan2.2-animate-move | Mode Standar | $0,12/detik | 50 detik Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Mode Profesional | $0,18/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Output video mode | Harga output |
wan2.2-animate-move | Mode Standar | $0,06/detik |
Mode Profesional | $0,09/detik |
Wan - Penukaran karakter video
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Output video mode | Harga output | Kuota gratis (Catatan) |
wan2.2-animate-mix | Mode Standar | $0,18/detik | 50 detik Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Mode Profesional | $0,26/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Output video mode | Harga output |
wan2.2-animate-mix | Mode Standar | $0,09/detik |
Mode Profesional | $0,13/detik |
AnimateAnyone
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
animate-anyone-detect-gen2: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.
animate-anyone-template-gen2: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
animate-anyone-gen2: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Layanan | Model | Harga | Kuota gratis (Catatan) |
Deteksi gambar | animate-anyone-detect-gen2 | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi templat aksi | animate-anyone-template-gen2 | Video output: $0,011469/detik | |
Generasi video | animate-anyone-gen2 | Video output: $0,011469/detik |
EMO
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
emo-detect-v1: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.
emo-v1: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Layanan | Model | Harga | Kuota gratis (Catatan) |
Deteksi gambar | emo-detect-v1 | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi video | emo-v1 | Video output:
|
LivePortrait
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
liveportrait-detect: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.
liveportrait: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Layanan | Model | Harga | Kuota gratis (Catatan) |
Deteksi gambar | liveportrait-detect | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi video | liveportrait | Video output: $0,002868/detik |
Emoji
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
emoji-detect-v1: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.
emoji-v1: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.
Layanan | Model | Harga | Kuota gratis (Catatan) |
Deteksi gambar | emoji-detect-v1 | Gambar input: $0,000574/gambar | Tidak ada kuota gratis |
Generasi video | emoji-v1 | Video output: $0,011469/detik |
VideoRetalk
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.
Model | Harga output | Kuota gratis (Catatan) |
videoretalk | $0,011469/detik | Tidak ada kuota gratis |
Transformasi gaya video
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.
Model | Resolusi video output | Harga output | Kuota gratis (Catatan) |
video-style-transform | 540P | $0,028671/detik | Tidak ada kuota gratis |
720P | $0,071677/detik |
Sintesis ucapan (teks-ke-ucapan)
Qwen-TTS
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Qwen3-TTS-Instruct-Flash
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-instruct-flash | $0,115 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-instruct-flash-2026-01-26 | $0,115 |
Qwen3-TTS-VD
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-vd-2026-01-26 | $0,115 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Qwen3-TTS-VC
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-vc-2026-01-22 | $0,115 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Qwen3-TTS-Flash
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-flash | $0,1 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-flash-2025-11-27 | $0,1 | |
qwen3-tts-flash-2025-09-18 | $0,1 | Model Studio diaktifkan sebelum pukul 00:00 tanggal 13 November 2025: 2.000 karakter Model Studio diaktifkan setelah pukul 00:00 tanggal 13 November 2025: 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Qwen3-TTS-Instruct-Flash
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output (per 10 ribu karakter) |
qwen3-tts-instruct-flash | $0,115 | Tidak dikenai biaya |
qwen3-tts-instruct-flash-2026-01-26 | $0,115 | Tidak dikenai biaya |
Qwen3-TTS-VD
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output (per 10 ribu karakter) |
qwen3-tts-vd-2026-01-26 | $0,115 | Tidak dikenai biaya |
Qwen3-TTS-VC
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output (per 10 ribu karakter) |
qwen3-tts-vc-2026-01-22 | $0,115 | Tidak dikenai biaya |
Qwen3-TTS-Flash
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output (per 10 ribu karakter) |
qwen3-tts-flash | $0,114682 | Tidak dikenai biaya |
qwen3-tts-flash-2025-11-27 | $0,114682 | Tidak dikenai biaya |
qwen3-tts-flash-2025-09-18 | $0,114682 | Tidak dikenai biaya |
Qwen-TTS
Aturan penagihan: Biaya dihitung per token input dan output.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) |
qwen-tts-flash | $0,23 | $1,434 |
qwen-tts-latest | $0,23 | $1,434 |
qwen-tts-2025-05-22 | $0,23 | $1,434 |
qwen-tts-2025-04-10 | $0,23 | $1,434 |
Qwen-TTS-Realtime
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Qwen3-TTS-Instruct-Flash-Realtime
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-instruct-flash-realtime | $0,143 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-instruct-flash-realtime-2026-01-22 | $0,143 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Qwen3-TTS-VD-Realtime
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-vd-realtime-2026-01-15 | $0,143353 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-vd-realtime-2025-12-16 | $0,143353 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Qwen3-TTS-VC-Realtime
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-vc-realtime-2026-01-15 | $0,13 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-vc-realtime-2025-11-27 |
Qwen3-TTS-Flash-Realtime
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
qwen3-tts-flash-realtime | $0,13 | Model Studio diaktifkan sebelum pukul 00:00 tanggal 13 November 2025: 2.000 karakter Model Studio diaktifkan setelah pukul 00:00 tanggal 13 November 2025: 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-flash-realtime-2025-11-27 | $0,13 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
qwen3-tts-flash-realtime-2025-09-18 | $0,13 | Model Studio diaktifkan sebelum pukul 00:00 tanggal 13 November 2025: 2.000 karakter Model Studio diaktifkan setelah pukul 00:00 tanggal 13 November 2025: 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Qwen3-TTS-Instruct-Flash-Realtime
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output |
qwen3-tts-instruct-flash-realtime | $0,143 | Tidak dikenai biaya |
qwen3-tts-instruct-flash-realtime-2026-01-22 | $0,143 | Tidak dikenai biaya |
Qwen3-TTS-VD-Realtime
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output |
qwen3-tts-vd-realtime-2026-01-15 | $0,143353 | Tidak dikenai biaya |
qwen3-tts-vd-realtime-2025-12-16 | $0,143353 | Tidak dikenai biaya |
Qwen3-TTS-VC-Realtime
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output |
qwen3-tts-vc-realtime-2026-01-15 | $0,143353 | Tidak dikenai biaya |
qwen3-tts-vc-realtime-2025-11-27 |
Qwen3-TTS-Flash-Realtime
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Harga output |
qwen3-tts-flash-realtime | $0,143353 | Tidak dikenai biaya |
qwen3-tts-flash-realtime-2025-11-27 | $0,143353 | Tidak dikenai biaya |
qwen3-tts-flash-realtime-2025-09-18 | $0,143353 | Tidak dikenai biaya |
Qwen-TTS-Realtime
Aturan penagihan: Biaya dihitung per token input dan output.
Model | Harga input (per 1 juta token) | Harga input (per 1 juta token) |
qwen-tts-realtime | $0,345 | $1,721 |
qwen-tts-realtime-latest | $0,345 | $1.721 |
qwen-tts-realtime-2025-07-15 | $0,345 | $1,721 |
Qwen-TTS kloning suara
Aturan penagihan: Biaya berlaku untuk jumlah suara baru yang dibuat.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga (per suara) | Kuota gratis (Catatan) |
qwen-voice-enrollment | $0,01 | 1.000 suara/akun |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga (per suara) |
qwen-voice-enrollment | $0,01 |
Qwen-TTS desain suara
Aturan penagihan: Biaya berlaku untuk jumlah suara baru yang dibuat.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga (per suara) | Kuota gratis (Catatan) |
qwen-voice-design | $0,2 | 10 suara/akun |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga (per suara) |
qwen-voice-design | $0,2 |
CosyVoice
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
cosyvoice-v3-plus | $0,26 | 10.000 karakter Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
cosyvoice-v3-flash | $0,13 |
Tiongkok Daratan
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.
Model | Harga input (per 10 ribu karakter) | Kuota gratis (Catatan) |
cosyvoice-v3.5-plus | $0,22 | Tidak ada kuota gratis |
cosyvoice-v3.5-flash | $0,116 | |
cosyvoice-v3-plus | $0,286706 | |
cosyvoice-v3-flash | $0,14335 | |
cosyvoice-v2 | $0,286706 |
Rekognisi ucapan (ucapan-ke-teks) dan terjemahan (ucapan-ke-terjemahan)
Qwen3-LiveTranslate-Flash-Realtime
Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) | ||
Input: Audio | Input: Gambar | Output: Teks | Output: Audio | ||
qwen3-livetranslate-flash-realtime | $10 | $1,3 | $10 | $38 | 1 juta token masing-masing |
qwen3-livetranslate-flash-realtime-2025-09-22 | $10 | $1,3 | $10 | $38 | |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | ||
Input: Audio | Input: Gambar | Output: Teks | Output: Audio | |
qwen3-livetranslate-flash-realtime | $9,175 | $1,147 | $9,175 | $34,405 |
qwen3-livetranslate-flash-realtime-2025-09-22 | $9,175 | $1,147 | $9,175 | $34,405 |
Qwen-ASR
Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input | Kuota gratis (Catatan) |
qwen3-asr-flash-filetrans | $0,000035/detik | 36.000 detik (10 jam) |
qwen3-asr-flash-filetrans-2025-11-17 | ||
qwen3-asr-flash | ||
qwen3-asr-flash-2025-09-08 |
AS
Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.
Mode penyebaran AS tidak memiliki kuota gratis.
Model | Harga input |
qwen3-asr-flash-us | $0,000035/detik |
qwen3-asr-flash-2025-09-08-us |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input |
qwen3-asr-flash-filetrans | $0,000032/detik |
qwen3-asr-flash-filetrans-2025-11-17 | |
qwen3-asr-flash | |
qwen3-asr-flash-2025-09-08 |
Qwen-ASR-Realtime
Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input | Kuota gratis (Catatan) |
qwen3-asr-flash-realtime | $0,000090/detik | 36.000 detik (10 jam) |
qwen3-asr-flash-realtime-2026-02-10 | $0,000090/detik | |
qwen3-asr-flash-realtime-2025-10-27 | $0,000090/detik |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input |
qwen3-asr-flash-realtime | $0,000047/detik |
qwen3-asr-flash-realtime-2026-02-10 | |
qwen3-asr-flash-realtime-2025-10-27 |
Fun-ASR
Rekognisi file audio
Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input | Kuota gratis (Catatan) |
fun-asr | $0,000035/detik | 36.000 detik (10 jam) |
fun-asr-2025-11-07 | ||
fun-asr-2025-08-25 | ||
fun-asr-mtl | ||
fun-asr-mtl-2025-08-25 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input |
fun-asr | $0,000032/detik |
fun-asr-2025-11-07 | |
fun-asr-2025-08-25 | |
fun-asr-mtl | |
fun-asr-mtl-2025-08-25 |
Rekognisi ucapan real-time
Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input | Kuota gratis (Catatan) |
fun-asr-realtime | $0,00009/detik | 36.000 detik (10 jam) Valid selama 90 hari |
fun-asr-realtime-2025-11-07 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input |
fun-asr-realtime | $0,000047/detik |
fun-asr-realtime-2026-02-28 | |
fun-asr-realtime-2025-11-07 | |
fun-asr-realtime-2025-09-15 | |
fun-asr-flash-8k-realtime | $0,000032/detik |
fun-asr-flash-8k-realtime-2026-01-28 |
Paraformer
Rekognisi file audio
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.
Model | Harga input |
paraformer-v2 | $0,000012/detik |
paraformer-8k-v2 |
Rekognisi ucapan real-time
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.
Model | Harga input | Kuota gratis (Catatan) |
paraformer-realtime-v2 | $0,000035/detik | Tidak ada kuota gratis |
paraformer-realtime-8k-v2 |
Embedding teks
Aturan penagihan: Biaya berlaku per token input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Kuota gratis (Catatan) |
text-embedding-v4 | $0,07 | 1 juta token |
text-embedding-v3 | $0,07 | 500.000 token |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) |
text-embedding-v4 | $0,072 |
Tiongkok (Hong Kong)
Model | Harga input (per 1 juta token) | Kuota gratis(Catatan) |
text-embedding-v4 | $0,07 | 1 juta token masing-masing |
Embedding multimodal
Aturan penagihan: Biaya berlaku per token input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (Juta token input) | Kuota gratis (Catatan) |
tongyi-embedding-vision-plus | $0,09 | 1 juta token Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
tongyi-embedding-vision-flash | Gambar/Video: $0,03 Teks: $0,09 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Model | Harga input (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-vl-embedding | Gambar/Video: $0,258 Teks: $0,1 | Tidak ada kuota gratis |
multimodal-embedding-v1 | Uji coba gratis |
Pengurutan Ulang Teks
Aturan penagihan: Biaya berlaku per token input. Output tidak dikenai biaya.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Kuota gratis (Catatan) |
qwen3-rerank | $0,1 | 1 juta token Masa berlaku: 90 hari setelah mengaktifkan Model Studio |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.
Model | Harga input (per 1 juta token) |
gte-rerank-v2 | $0,115 |
Spesifik domain
Pengenalan niat
Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
tongyi-intent-detect-v3 | $0,058 | $0,144 | Tidak ada kuota gratis |
Bermain peran
Metode: Anda dikenai biaya berdasarkan token input dan token output.
Internasional
Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-plus-character | $0,5 | $1,4 | Tidak ada kuota gratis |
qwen-flash-character | $0,05 | $0,4 | |
qwen-plus-character-ja | $0,5 | $1,4 |
Tiongkok Daratan
Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.
Model | Harga input (per 1 juta token) | Harga output (per 1 juta token) | Kuota gratis (Catatan) |
qwen-plus-character | $0,115 | $0,287 | Tidak ada kuota gratis |