All Products
Search
Document Center

Alibaba Cloud Model Studio:Harga pemanggilan model

Last Updated:Mar 24, 2026

Generasi teks - Qwen

Qwen-Max

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Faktor yang memengaruhi penagihan: Jika suatu model mendukung Batch Invocation, token input dan output-nya dikenai biaya sebesar 50% dari harga inferensi real-time. Jika suatu model mendukung Context Caching, hanya token input yang memenuhi syarat untuk diskon. Kedua diskon tersebut tidak dapat diterapkan secara bersamaan.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Mode

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

Kuota gratis (Catatan)

qwen3-max

Pemanggilan batch diskon 50%
Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$1,2

$6

1 juta token masing-masing

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

32K<Token≤128K

$2,4

$12

128K<Token≤252K

$3

$15

qwen3-max-2026-01-23

Berpikir dan tidak berpikir

0<Token≤32K

$1,2

$6

32K<Token≤128K

$2,4

$12

128K<Token≤252K

$3

$15

qwen3-max-2025-09-23

Hanya tidak berpikir

0<Token≤32K

$1,2

$6

32K<Token≤128K

$2,4

$12

128K<Token≤252K

$3

$15

qwen3-max-preview

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$1,2

$6

32K<Token≤128K

$2,4

$12

128K<Token≤252K

$3

$15

Model lainnya

Model

Mode

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-max

Pemanggilan batch diskon 50%

Tanpa pemikiran sama sekali

Tidak ada penetapan harga bertingkat

$1,6

$6,4

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen-max-latest

Hanya tidak berpikir

Tidak ada penetapan harga bertingkat

$1,6

$6,4

qwen-max-2025-01-25

Hanya tidak berpikir

Tidak ada penetapan harga bertingkat

$1,6

$6,4

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Mode

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-max

Diskon cache konteks

Hanya tidak berpikir

0<Token≤32K

$0,359

$1,434

32K<Token≤128K

$0,574

$2,294

128K<Token≤252K

$1,004

$4,014

qwen3-max-2025-09-23

Hanya tidak berpikir

0<Token≤32K

$0,861

$3,441

32K<Token≤128K

$1,434

$5,735

128K<Token≤252K

$2,151

$8,602

qwen3-max-preview

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,861

$3,441

32K<Token≤128K

$1,434

$5,735

128K<Token≤252K

$2,151

$8,602

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Mode

Input tokens per request

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-max

Pemanggilan batch diskon 50%
Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,359

$1,434

32K<Token≤128K

$0,574

$2,294

128K<Token≤252K

$1,004

$4,014

qwen3-max-2026-01-23

Berpikir dan tidak berpikir

0<Token≤32K

$0,359

$1,434

32K<Token≤128K

$0,574

Rp2.294

128K<Token≤252K

$1,004

$4,014

qwen3-max-2025-09-23

Hanya tidak berpikir

0<Token≤32K

$0,861

$3,441

32K<Token≤128K

$1,434

$5,735

128K<Token≤252K

$2,151

$8,602

qwen3-max-preview

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,861

$3,441

32K<Token≤128K

$1,434

$5,735

128K<Token≤252K

$2,151

$8,602

Model lainnya

Model

Mode

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-max

Hanya tidak berpikir

Tidak ada penetapan harga bertingkat

$0,345

$1,377

qwen-max-latest

Hanya tidak berpikir

Tidak ada penetapan harga bertingkat

$0,345

$1,377

qwen-max-2025-01-25

Hanya tidak berpikir

Tidak ada penetapan harga bertingkat

$0,345

$1,377

qwen-max-2024-09-19

Hanya tidak berpikir

Tidak ada penetapan harga bertingkat

$2,868

$8,602

Tiongkok (Hong Kong)

Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).

Model

Mode

Input tokens per request

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-max

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$1,2

$6

32K<Token≤128K

$2,4

$12

128K<Token≤252K

$3

$15

qwen3-max-2026-01-23

Berpikir dan tidak berpikir

0<Token≤32K

$1,2

$6

32K<Token≤128K

$2,4

$12

128K<Token≤252K

$3

$15

UE

Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model terbatas di UE.

Model

Mode

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-max

Pemanggilan batch diskon 50%
Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$1,2

$6

32K<Token≤128K

$2,4

$12

128K<Token≤252K

$3

$15

qwen3-max-2026-01-23

Berpikir dan tidak berpikir

0<Token≤32K

$1,2

$6

32K<Token≤128K

$2,4

$12

128K<Token≤252K

$3

$15

Qwen-Plus

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

Mode tidak berpikir

Mode berpikir (CoT + respons)

qwen3.5-plus

0<Token≤256K

$0,4

$2,4

$2,4

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

256K<Token≤1M

$0,5

$3

$3

qwen3.5-plus-2026-02-15

0<Token≤256K

$0,4

$2,4

$2,4

256K<Token≤1M

$0,5

$3

$3

qwen-plus

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

qwen-plus-latest

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

qwen-plus-2025-12-01

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

qwen-plus-2025-09-11

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

qwen-plus-2025-07-28

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

qwen-plus-2025-07-14

Tidak ada penetapan harga bertingkat

$0,4

$1,2

$4

qwen-plus-2025-04-28

Tidak ada penetapan harga bertingkat

$0,4

$1,2

$4

qwen-plus-2025-01-25

Tidak ada penetapan harga bertingkat

$0,4

$1,2

-

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Input tokens per request

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Non-thinking mode

Mode berpikir (CoT + respons)

qwen3.5-plus

0<Token≤128K

$0,115

$0,688

$0,688

128K<Token≤256K

$0,287

$1,72

$1,72

256K<Token≤1M

$0,573

$3,44

$3,44

qwen3.5-plus-2026-02-15

0<Token≤128K

$0,115

$0,688

$0,688

128K<Token≤256K

$0,287

$1,72

$1,72

256K<Token≤1M

$0,573

$3,44

$3,44

qwen-plus

0<Token≤128K

$0,115

$0,287

$1,147

128K<Token≤256K

$0,345

$2,868

$3,441

256K<Token≤1M

$0,689

$6,881

$9,175

qwen-plus-2025-12-01

0<Token≤128K

$0,115

$0,287

$1,147

128K<Token≤256K

$0,345

$2,868

$3,441

256K<Token≤1M

$0,689

$6,881

$9,175

qwen-plus-2025-09-11

0<Token≤128K

$0,115

$0,287

$1,147

128K<Token≤256K

$0,345

$2,868

$3,441

256K<Token≤1M

$0,689

$6,881

$9,175

qwen-plus-2025-07-28

0<Token≤128K

$0,115

$0,287

$1,147

128K<Token≤256K

$0,345

$2,868

$3,441

256K<Token≤1M

$0,689

$6,881

$9,175

AS

Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi model terbatas di Amerika Serikat.

Catatan

Mode penyebaran AS tidak memiliki kuota gratis.

Model

Input tokens per request

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Non-thinking mode

Mode berpikir (CoT + tanggapan)

qwen-plus-us

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

qwen-plus-2025-12-01-us

0<Token≤256K

$0.4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Mode tidak berpikir

Mode berpikir (CoT + respons)

qwen3.5-plus

0<Token≤128K

$0,115

$0,688

$0,688

128K<Token≤256K

$0,287

$1,72

$1,72

256K<Token≤1M

$0,573

$3,44

$3,44

qwen3.5-plus-2026-02-15

0<Token≤128K

$0,115

$0,688

$0,688

128K<Token≤256K

$0,287

$1,72

$1,72

256K<Token≤1M

$0,573

$3,44

$3,44

qwen-plus

0<Token≤128K

$0,115

$0,287

$1,147

128K<Token≤256K

$0,345

$2,868

$3,441

256K<Token≤1M

$0,689

$6,881

$9,175

qwen-plus-latest

0<Token≤128K

$0,115

$0,287

$1,147

128K<Token≤256K

$0,345

$2,868

$3,441

256K<Token≤1M

$0,689

$6,881

$9,175

qwen-plus-2025-12-01

0<Token≤128K

$0,115

$0,287

$1,147

128K<Token≤256K

$0,345

$2,868

$3,441

256K<Token≤1M

$0,689

$6,881

$9,175

qwen-plus-2025-09-11

0<Token≤128K

$0,115

$0,287

$1,147

128K<Token≤256K

$0,345

$2,868

$3,441

256K<Token≤1M

$0,689

$6.881

$9,175

qwen-plus-2025-07-28

0<Token≤128K

$0,115

$0,287

$1,147

128K<Token≤256K

$0,345

$2,868

$3,441

256K<Token≤1M

$0,689

$6.881

$9,175

qwen-plus-2025-07-14

Tidak ada penetapan harga bertingkat

$0,115

$0,287

$1,147

qwen-plus-2025-04-28

Tidak ada penetapan harga bertingkat

$0,115

$0,287

$1,147

Model lainnya

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-plus-2025-01-25

Tidak ada penetapan harga bertingkat

$0,115

$0,287

qwen-plus-2025-01-12

Tidak ada penetapan harga bertingkat

$0,115

$0,287

qwen-plus-2024-12-20

Tidak ada penetapan harga bertingkat

$0,115

$0,287

Tiongkok (Hong Kong)

Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Mode tidak berpikir

Mode berpikir (CoT + respons)

qwen-plus

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

qwen-plus-2025-12-01

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

UE

Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model terbatas di UE.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Tidak berpikir

Berpikir (CoT + respons)

qwen-plus

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

qwen-plus-2025-12-01

0<Token≤256K

$0,4

$1,2

$4

256K<Token≤1M

$1,2

$3,6

$12

Qwen-Flash

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Faktor yang memengaruhi penagihan: Jika suatu model mendukung Batch Invocation, token input dan output-nya dikenai biaya sebesar 50% dari harga inferensi real-time. Jika suatu model mendukung Context Caching, hanya token input yang memenuhi syarat untuk diskon. Kedua diskon tersebut tidak dapat diterapkan secara bersamaan.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen3.5-flash

Pemanggilan batch diskon 50%
Diskon cache konteks

0<Token≤1M

$0,1

$0,4

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3.5-flash-2026-02-23

0<Token≤1M

$0,1

$0,4

qwen-flash

Pemanggilan batch diskon 50%
Diskon cache konteks

0<Token≤256K

$0,05

$0,4

256K<Token≤1M

$0,25

$2

qwen-flash-2025-07-28

0<Token≤256K

$0,05

$0,4

256K<Token≤1M

$0,25

$2

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3.5-flash

0<Token≤128K

$0,029

$0,287

128K<Token≤256K

$0,115

$1,147

256K<Token≤1M

$0,172

$1,72

qwen3.5-flash-2026-02-23

0<Token≤128K

$0,029

$0,287

128K<Token≤256K

$0,115

$1,147

256K<Token≤1M

$0,172

$1,72

qwen-flash

Diskon cache konteks

0<Token≤128K

$0,022

$0,216

128K<Token≤256K

$0,087

$0,861

256K<Token≤1M

$0,173

$1,721

qwen-flash-2025-07-28

0<Token≤128K

$0,022

$0,216

128K<Token≤256K

$0,087

$0,861

256K<Token≤1M

$0,173

$1,721

AS

Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi model terbatas di Amerika Serikat.

Catatan

Mode penyebaran AS tidak memiliki kuota gratis.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-flash

0<Token≤256K

$0,05

$0,4

256K<Token≤1M

$0,25

$2

qwen-flash-2025-07-28

0<Token≤256K

$0,05

$0,4

256K<Token≤1M

$0,25

$2

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3.5-flash

0<Token≤128K

$0,029

$0,287

128K<Token≤256K

$0,115

$1,147

256K<Token≤1M

$0,172

$1,72

qwen3.5-flash-2026-02-23

0<Token≤128K

$0,029

$0,287

128K<Token≤256K

$0,115

$1,147

256K<Token≤1M

$0,172

$1,72

qwen-flash

Diskon cache konteks

0<Token≤128K

$0,022

$0,216

128K<Token≤256K

$0,087

$0,861

256K<Token≤1M

$0,173

$1,721

qwen-flash-2025-07-28

0<Token≤128K

$0,022

$0,216

128K<Token≤256K

$0,087

$0,861

256K<Token≤1M

$0,173

$1,721

Tiongkok (Hong Kong)

Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3.5-flash

Diskon cache konteks

0<Token≤1M

$0,1

$0,4

qwen3.5-flash-2026-02-23

0<Token≤1M

$0,1

$0,4

UE

Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), sedangkan sumber daya komputasi inferensi model terbatas di UE.

Model

Token masukan per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3.5-flash

Diskon cache konteks

0<Token≤1M

$0,1

$0,4

qwen3.5-flash-2026-02-23

0<Token≤1M

$0,1

$0,4

Qwen-Turbo

Catatan

Qwen-Turbo tidak akan diperbarui lagi. Kami merekomendasikan Qwen-Flash sebagai penggantinya.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Untuk model yang mendukung Batch Invocation, harga satuan untuk token input dan output ditagih sebesar 50% dari harga inferensi real-time.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

Mode tidak berpikir

Mode berpikir (CoT + respons)

qwen-turbo

Pemanggilan batch diskon 50%

$0,05

$0,2

$0,5

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen-turbo-latest

$0,05

$0,2

$0,5

qwen-turbo-2025-04-28

$0,05

$0,2

$0,5

Model lainnya

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-turbo-2024-11-01

$0,05

$0,2

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Non-thinking mode

Mode berpikir (CoT + respons)

qwen-turbo

$0,044

$0,087

$0,431

qwen-turbo-latest

$0,044

$0,087

$0,431

qwen-turbo-2025-07-15

$0,044

$0,087

$0,431

qwen-turbo-2025-04-28

$0,044

$0,087

$0,431

QwQ

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwq-plus

$0,8

$2,4

1 juta token
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwq-plus

$0,230

$0,574

qwq-plus-latest

$0,230

$0,574

qwq-plus-2025-03-05

$0,230

$0,574

Qwen-Long

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-long-latest

$0,072

$0,287

Tidak ada kuota gratis

qwen-long-2025-01-25

$0,072

$0,287

Qwen-Omni

Aturan penagihan: Biaya dihitung berdasarkan token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan dan pembatasan laju.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Mode

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

Input: Teks

Input: Audio

Input: Gambar/Video

Output: Teks

Teks biasa sebagai input

Output: Teks

Input multimodal

Output: Teks+Audio

Hanya audio yang dikenai biaya

qwen3-omni-flash

Berpikir dan tidak berpikir

$0,43

$3,81

$0,78

$1,66

$3,06

$15,11

1 juta token masing-masing (tanpa memandang modalitas)

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-omni-flash-2025-12-01

Berpikir dan tidak berpikir

$0,43

$3,81

$0,78

$1,66

$3,06

$15,11

qwen3-omni-flash-2025-09-15

Berpikir dan tidak berpikir

$0,43

$3,81

$0,78

$1,66

$3,06

$15,11

Model lainnya

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

Input: Teks

Input: Audio

Input: Gambar/Video

Output: Teks

Teks biasa sebagai input

Output: Teks

Input multimodal

Output: Teks+Audio

Hanya audio yang dikenai biaya

qwen-omni-turbo

$0,07

$4,44

$0,21

$0,27

$0,63

$8,89

1 juta token masing-masing (tanpa memandang modalitas)

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen-omni-turbo-latest

$0,07

$4,44

$0,21

$0,27

$0,63

$8,89

qwen-omni-turbo-2025-03-26

$0,07

$4,44

$0,21

$0,27

$0,63

$8,89

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Mode

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Input: Teks

Input: Audio

Bagian audio ditagih secara terpisah

Input: Gambar/Video

Output: Teks

Teks biasa sebagai input

Output: Teks

Input multimodal

Output: Teks+Audio

Hanya audio yang dikenai biaya

qwen3-omni-flash

Berpikir dan tidak berpikir

$0,258

$2,265

$0,473

$0,989

$1,821

$8.974

qwen3-omni-flash-2025-12-01

Berpikir dan tidak berpikir

$0,258

$2,265

$0,473

$0,989

$1,821

$8,974

qwen3-omni-flash-2025-09-15

Berpikir dan tidak berpikir

$0,258

$2,265

$0,473

$0,989

$1,821

$8,974

Model lainnya

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Input: Teks

Input: Audio

Bagian audio ditagih secara terpisah

Input: Gambar/Video

Output: Teks

Teks biasa sebagai input

Output: Teks

Input multimodal

Output: Teks+Audio

Hanya audio yang dikenai biaya

qwen-omni-turbo

$0,058

$3,584

$0,216

$0,230

$0,646

$7,168

qwen-omni-turbo-latest

$0,058

$3,584

$0,216

$0,230

$0,646

$7,168

qwen-omni-turbo-2025-03-26

$0,058

$3,584

$0,216

$0,230

$0,646

$7,168

qwen-omni-turbo-2025-01-19

$0,058

$3,584

$0,216

$0,230

$0,646

$7,168

Qwen-Omni-Realtime

Aturan penagihan: Biaya dihitung berdasarkan token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan dan pembatasan laju.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

Input: Teks

Input: Audio

Bagian audio ditagih secara terpisah

Input: Gambar

Output: Teks

Teks biasa sebagai input

Output: Teks

Input multimodal

Output: Teks+Audio

Hanya audio yang dikenai biaya

qwen3-omni-flash-realtime

$0,52

$4,57

$0,94

$1,99

$3,67

$18,13

1 juta token masing-masing (tanpa memandang modalitas)

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-omni-flash-realtime-2025-12-01

$0,52

$4,57

$0,94

$1,99

$3,67

$18,13

qwen3-omni-flash-2025-09-15-realtime

$0,52

$4,57

$0,94

$1,99

$3,67

$18,13

qwen-omni-turbo-realtime

$0,270

$4,440

$0,840

$1,070

$2,520

$8.890

qwen-omni-turbo-realtime-latest

$0,270

$4,440

$0,840

$1,070

$2,520

$8.890

qwen-omni-turbo-realtime-2025-05-08

$0,270

$4,440

$0,840

$1,070

$2,520

$8.890

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Input: Teks

Input: Audio

Bagian audio ditagih secara terpisah

Input: Gambar

Output: Teks

Teks biasa sebagai input

Output: Text

Input multimodal

Output: Teks+Audio

Hanya audio yang dikenai biaya

qwen3-omni-flash-realtime

$0,315

$2,709

$0,559

$1,19

$2,179

$10,766

qwen3-omni-flash-realtime-2025-12-01

$0,315

$2,709

$0,559

$1,19

$2,179

$10,766

qwen3-omni-flash-realtime-2025-09-15

$0,315

$2,709

$0,559

$1,19

$2,179

$10,766

qwen-omni-turbo-realtime

$0,230

$3,584

$0,861

$0,918

$2,581

$7,168

qwen-omni-turbo-realtime-latest

$0,230

$3,584

$0,861

$0,918

$2,581

Rp7.168

qwen-omni-turbo-realtime-2025-05-08

$0,230

$3,584

$0,861

$0,918

$2,581

$7,168

QVQ

Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan dan pembatasan laju.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qvq-max

$1,2

$4,8

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qvq-max-latest

$1,2

$4,8

qvq-max-2025-03-25

$1,2

$4,8

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qvq-max

$1,147

$4,588

qvq-max-latest

$1,147

$4,588

qvq-max-2025-05-15

$1,147

$4,588

qvq-max-2025-03-25

$1,147

$4,588

qvq-plus

$0,287

$0,717

qvq-plus-latest

$0,287

$0,717

qvq-plus-2025-05-15

$0,287

$0,717

Qwen-VL

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Mode

Token masukan per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

Kuota gratis (Catatan)

qwen3-vl-plus

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,2

$1,6

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

32K<Token≤128K

$0,3

$2,4

128K<Token≤256K

$0,6

$4,8

qwen3-vl-plus-2025-12-19

Berpikir dan tidak berpikir

0<Token≤32K

$0,2

$1,6

32K<Token≤128K

$0,3

$2,4

128K<Token≤256K

$0,6

$4,8

qwen3-vl-plus-2025-09-23

Berpikir dan tidak berpikir

0<Token≤32K

$0,2

$1,6

32K<Token≤128K

$0,3

$2,4

128K<Token≤256K

$0,6

$4,8

qwen3-vl-flash

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,05

$0,4

32K<Token≤128K

$0,075

$0,6

128K<Token≤256K

$0,12

$0,96

qwen3-vl-flash-2026-01-22

Berpikir dan tidak berpikir

0<Token≤32K

$0,05

$0,4

32K<Token≤128K

$0,075

$0,6

128K<Token≤256K

$0,12

$0,96

qwen3-vl-flash-2025-10-15

Berpikir dan tidak berpikir

0<Token≤32K

$0,05

$0,4

32K<Token≤128K

$0,075

$0,6

128K<Token≤256K

$0,12

$0,96

Model lainnya

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-vl-max

Diskon cache konteks

Tidak ada penetapan harga bertingkat

$0,8

$3,2

1 juta token masing-masing

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen-vl-max-latest

Tidak ada penetapan harga bertingkat

$0,8

$3,2

qwen-vl-max-2025-08-13

Tidak ada penetapan harga bertingkat

$0,8

$3,2

qwen-vl-max-2025-04-08

Tidak ada penetapan harga bertingkat

$0,8

$3,2

qwen-vl-plus

Diskon cache konteks

Tidak ada penetapan harga bertingkat

$0,21

$0,63

qwen-vl-plus-latest

Tidak ada penetapan harga bertingkat

$0,21

$0,63

qwen-vl-plus-2025-08-15

Tidak ada penetapan harga bertingkat

$0,21

$0,63

qwen-vl-plus-2025-05-07

Tidak ada penetapan harga bertingkat

$0,21

$0,63

qwen-vl-plus-2025-01-25

Tidak ada penetapan harga bertingkat

$0,21

$0,63

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Mode

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-vl-plus

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,143

$1,434

32K<Token≤128K

$0,215

$2,15

128K<Token≤256K

$0,43

$4,301

qwen3-vl-plus-2025-09-23

Berpikir dan tidak berpikir

0<Token≤32K

$0,143

$1,434

32K<Token≤128K

$0,215

$2,15

128K<Token≤256K

$0,43

$4,301

qwen3-vl-flash

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,022

$0,215

32K<Token≤128K

$0,043

$0,43

128K<Token≤256K

$0,086

$0,859

qwen3-vl-flash-2025-10-15

Berpikir dan tidak berpikir

0<Token≤32K

$0,022

$0,215

32K<Token≤128K

$0,043

$0,43

128K<Token≤256K

$0,086

$0,859

AS

Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.

Catatan

Mode penyebaran AS tidak memiliki kuota gratis.

Model

Mode

Input tokens per request

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-vl-flash-us

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,05

$0,4

32K<Token≤128K

$0,075

$0,6

128K<Token≤256K

$0,12

$0,96

qwen3-vl-flash-2026-01-22-us

Berpikir dan tidak berpikir

0<Token≤32K

$0,05

$0,4

32K<Token≤128K

$0,075

$0,6

128K<Token≤256K

$0,12

$0,96

qwen3-vl-flash-2025-10-15-us

Berpikir dan tidak berpikir

0<Token≤32K

$0,05

$0,4

32K<Token≤128K

$0,075

$0,6

128K<Token≤256K

$0,12

$0,96

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Mode

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-vl-plus

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,143

$1,434

32K<Token≤128K

$0,215

$2,15

128K<Token≤256K

$0,43

$4,301

qwen3-vl-plus-2025-12-19

Berpikir dan tidak berpikir

0<Token≤32K

$0,143

$1,434

32K<Token≤128K

$0,215

$2,15

128K<Token≤256K

$0,43

$4,301

qwen3-vl-plus-2025-09-23

Berpikir dan tidak berpikir

0<Token≤32K

$0,143

$1,434

32K<Token≤128K

$0,215

$2,15

128K<Token≤256K

$0,43

$4,301

qwen3-vl-flash

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,022

$0,215

32K<Token≤128K

$0,043

$0,43

128K<Token≤256K

$0,086

$0,859

qwen3-vl-flash-2026-01-22

Berpikir dan tidak berpikir

0<Token≤32K

$0,022

$0,215

32K<Token≤128K

$0,043

$0,43

128K<Token≤256K

$0,086

$0,859

qwen3-vl-flash-2025-10-15

Berpikir dan tidak berpikir

0<Token≤32K

$0,022

$0,215

32K<Token≤128K

$0,043

$0,43

128K<Token≤256K

$0,086

$0,859

Model lainnya

Model

Input tokens per request

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-vl-max

Context cache discount

Tidak ada harga bertingkat

$0.23

$0.574

qwen-vl-max-latest

Tidak ada harga bertingkat

$0.23

$0.574

qwen-vl-max-2025-08-13

Tidak ada harga bertingkat

$0.23

$0.574

qwen-vl-max-2025-04-08

Tidak ada harga bertingkat

$0.431

$1.291

qwen-vl-max-2025-04-02

Tidak ada harga bertingkat

$0.431

$1.291

qwen-vl-max-2025-01-25

Tidak ada harga bertingkat

$0.431

$1.291

qwen-vl-max-2024-12-30

Tidak ada harga bertingkat

$0.431

$1.291

qwen-vl-max-2024-11-19

Tidak ada harga bertingkat

$0.431

$1.291

qwen-vl-plus

Context cache discount

Tidak ada harga bertingkat

$0.115

$0.287

qwen-vl-plus-latest

Tidak ada harga bertingkat

$0.115

$0.287

qwen-vl-plus-2025-08-15

Tidak ada harga bertingkat

$0.115

$0.287

qwen-vl-plus-2025-07-10

Tidak ada harga bertingkat

$0.022

$0.216

qwen-vl-plus-2025-05-07

Tidak ada harga bertingkat

$0.216

$0.646

qwen-vl-plus-2025-01-25

Tidak ada harga bertingkat

$0.216

$0.646

qwen-vl-plus-2025-01-02

Tidak ada harga bertingkat

$0.216

$0.646

Tiongkok (Hong Kong)

Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), dan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).

Model

Mode

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-vl-plus

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,2

$1,6

32K<Token≤128K

$0,3

$2,4

128K<Token≤256K

$0,6

$4,8

qwen3-vl-plus-2025-12-19

Berpikir dan tidak berpikir

0<Token≤32K

$0,2

$1,6

32K<Token≤128K

$0,3

$2,4

128K<Token≤256K

$0,6

$4,8

Dalam mode penyebaran Tiongkok (Hong Kong), endpoint dan penyimpanan data berlokasi di Tiongkok (Hong Kong), dan sumber daya komputasi inferensi model terbatas di Tiongkok (Hong Kong).UE

Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), dan sumber daya komputasi inferensi model terbatas di UE.

Model

Mode

Input tokens per request

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-vl-plus

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,2

$1,6

32K<Token≤128K

$0,3

$2,4

128K<Token≤256K

$0,6

$4,8

qwen3-vl-plus-2025-12-19

Berpikir dan tidak berpikir

0<Token≤32K

$0,2

$1,6

32K<Token≤128K

$0,3

$2,4

128K<Token≤256K

$0,6

$4,8

qwen3-vl-flash

Diskon cache konteks

Berpikir dan tidak berpikir

0<Token≤32K

$0,05

$0,4

32K<Token≤128K

$0,075

$0,6

128K<Token≤256K

$0,12

$0,96

qwen3-vl-flash-2025-10-15

Berpikir dan tidak berpikir

0<Token≤32K

$0,05

$0,4

32K<Token≤128K

$0,075

$0,6

128K<Token≤256K

$0,12

$0,96

Qwen-OCR

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-vl-ocr

$0,07

$0,16

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen-vl-ocr-2025-11-20

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-vl-ocr

$0,043

$0,072

qwen-vl-ocr-2025-11-20

$0,043

$0,072

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-vl-ocr

$0,717

$0,717

qwen-vl-ocr-latest

$0,043

$0,072

qwen-vl-ocr-2025-11-20

qwen-vl-ocr-2025-08-28

$0,717

$0,717

qwen-vl-ocr-2025-04-13

qwen-vl-ocr-2024-10-28

Qwen-Math

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-math-plus

$0,574

$1,721

Tidak ada kuota gratis

qwen-math-plus-latest

$0,574

$1,721

qwen-math-plus-2024-09-19

$0,574

$1,721

qwen-math-plus-2024-08-16

$0,574

$1,721

qwen-math-turbo

$0,287

$0,861

qwen-math-turbo-latest

$0,287

$0,861

qwen-math-turbo-2024-09-19

$0,287

$0,861

Qwen-Coder

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Faktor yang memengaruhi penagihan: Jika suatu model mendukung Context Caching, diskon hanya berlaku untuk token input.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen3-coder-plus

Diskon cache konteks

0<Token≤32K

$1

$5

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

32K<Token≤128K

$1,8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-plus-2025-09-23

0<Token≤32K

$1

$5

32K<Token≤128K

$1,8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-plus-2025-07-22

0<Token≤32K

$1

$5

32K<Token≤128K

$1,8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-flash

0<Token≤32K

$0,3

$1,5

32K<Token≤128K

$0,5

$2,5

128K<Token≤256K

$0,8

$4

256K<Token≤1M

$1,6

$9,6

qwen3-coder-flash-2025-07-28

0<Token≤32K

$0,3

$1,5

32K<Token≤128K

$0,5

$2,5

128K<Token≤256K

$0,8

$4

256K<Token≤1M

$1,6

$9,6

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3-coder-plus

Diskon cache konteks

0<Token≤32K

$0,574

$2,294

32K<Token≤128K

$0,861

$3,441

128K<Token≤256K

$1,434

$5,735

256K<Token≤1M

$2,868

$28,671

qwen3-coder-plus-2025-09-23

0<Token≤32K

$0,574

$2,294

32K<Token≤128K

$0,861

$3,441

128K<Token≤256K

$1,434

$5,735

256K<Token≤1M

$2,868

$28,671

qwen3-coder-plus-2025-07-22

0<Token≤32K

$0,574

$2,294

32K<Token≤128K

$0,861

$3,441

128K<Token≤256K

$1,434

$5,735

256K<Token≤1M

$2,868

$28,671

qwen3-coder-flash

Diskon cache konteks

0<Token≤32K

$0,144

$0,574

32K<Token≤128K

$0,216

$0,861

128K<Token≤256K

$0,359

$1,434

256K<Token≤1M

$0,717

$3,584

qwen3-coder-flash-2025-07-28

0<Token≤32K

$0,144

$0,574

32K<Token≤128K

$0,216

$0,861

128K<Token≤256K

$0,359

$1,434

256K<Token≤1M

$0,717

$3,584

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

seri qwen3-coder

Model

Input tokens per request

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3-coder-plus

Diskon cache konteks

0<Token≤32K

$0,574

$2,294

32K<Token≤128K

$0,861

$3,441

128K<Token≤256K

$1,434

$5,735

256K<Token≤1M

$2,868

$28.671

qwen3-coder-plus-2025-09-23

0<Token≤32K

$0,574

$2,294

32K<Token≤128K

$0,861

$3,441

128K<Token≤256K

$1,434

$5,735

256K<Token≤1M

$2,868

$28.671

qwen3-coder-plus-2025-07-22

0<Token≤32K

$0,574

$2,294

32K<Token≤128K

$0,861

$3,441

128K<Token≤256K

$1,434

$5,735

256K<Token≤1M

$2,868

$28,671

qwen3-coder-flash

0<Token≤32K

$0,144

$0,574

32K<Token≤128K

$0,216

$0,861

128K<Token≤256K

$0,359

$1,434

256K<Token≤1M

$0,717

$3,584

qwen3-coder-flash-2025-07-28

0<Token≤32K

$0,144

$0,574

32K<Token≤128K

$0,216

$0,861

128K<Token≤256K

$0,359

$1,434

256K<Token≤1M

$0,717

$3,584

Seri qwen-coder sebelumnya

Model

Input tokens per request

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-coder-plus

Tidak ada penetapan harga bertingkat

$0,502

$1,004

qwen-coder-plus-latest

Tidak ada penetapan harga bertingkat

$0,502

$1,004

qwen-coder-plus-2024-11-06

Tidak ada penetapan harga bertingkat

$0,502

$1.004

qwen-coder-turbo

Tidak ada penetapan harga bertingkat

$0,287

$0,861

qwen-coder-turbo-latest

Tidak ada penetapan harga bertingkat

$0,287

$0,861

qwen-coder-turbo-2024-09-19

Tidak ada penetapan harga bertingkat

$0,287

$0,861

UE

Dalam mode penyebaran UE, endpoint dan penyimpanan data berlokasi di Jerman (Frankfurt), dan sumber daya komputasi inferensi model terbatas di UE.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3-coder-next

0<Token≤32K

$0,3

$1,5

32K<Token≤128K

$0,5

$2,5

128K<Token≤256K

$0,8

$4

Qwen-MT

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-mt-plus

$2,46

$7,37

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen-mt-flash

$0,16

$0,49

qwen-mt-lite

$0,12

$0,36

qwen-mt-turbo

$0,16

$0,49

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-mt-plus

$0,259

$0,775

qwen-mt-flash

$0,101

$0,280

qwen-mt-lite

$0,086

$0,229

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-mt-plus

$0,259

$0,775

qwen-mt-flash

$0,101

$0,280

qwen-mt-lite

$0,086

$0,229

qwen-mt-turbo

$0,101

$0,280

Qwen data mining

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-doc-turbo

$0,087

$0,144

Tidak ada kuota gratis

Qwen deep research

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-deep-research

$7,742

$23,367

Tidak ada kuota gratis

Generasi teks - Qwen - Sumber terbuka

Qwen3.5

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Tidak berpikir

Berpikir (CoT + respons)

qwen3.5-397b-a17b

0<Token≤128K

$0,172

$1,032

$1,032

128K<Token≤256K

$0,43

$2,58

$2,58

qwen3.5-122b-a10b

0<Token≤128K

$0,115

$0,917

$0,917

128K<Token≤256K

$0,287

$2,294

$2,294

qwen3.5-27b

0<Token≤128K

$0,086

$0,688

$0,688

128K<Token≤256K

$0,258

$2,064

$2,064

qwen3.5-35b-a3b

0<Token≤128K

$0,057

$0,459

$0,459

128K<Token≤256K

$0,229

$1,835

$1,835

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Token masukan per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

Tidak berpikir

Berpikir (CoT + respons)

qwen3.5-397b-a17b

0<Token≤256K

$0,6

$3,6

$3,6

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3.5-122b-a10b

0<Token≤256K

$0,4

$3,2

$3,2

qwen3.5-27b

0<Token≤256K

$0,3

$2,4

$2,4

qwen3.5-35b-a3b

0<Token≤256K

$0,25

$2

$2

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Non-thinking

Berpikir (CoT + respons)

qwen3.5-397b-a17b

0<Token≤128K

$0,172

$1,032

Rp1.032

128K<Token≤256K

$0,43

$2,58

$2,58

qwen3.5-122b-a10b

0<Token≤128K

$0,115

$0,917

$0,917

128K<Token≤256K

$0,287

$2,294

$2,294

qwen3.5-27b

0<Token≤128K

$0,086

$0,688

$0,688

128K<Token≤256K

$0,258

$2.064

$2.064

qwen3.5-35b-a3b

0<Token≤128K

$0,057

$0,459

$0,459

128K<Token≤256K

$0,229

$1,835

$1,835

Qwen3

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Mode

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

Mode tidak berpikir

Mode berpikir

qwen3-next-80b-a3b-thinking

Hanya berpikir

$0,15

-

$1,2

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-next-80b-a3b-instruct

Hanya tidak berpikir

$0,15

$1,2

-

qwen3-235b-a22b-thinking-2507

Hanya berpikir

$0,23

-

$2,3

qwen3-235b-a22b-instruct-2507

Hanya tidak berpikir

$0,23

$0,92

-

qwen3-30b-a3b-thinking-2507

Hanya berpikir

$0,2

-

$2,4

qwen3-30b-a3b-instruct-2507

Hanya tidak berpikir

$0,2

$0,8

-

qwen3-235b-a22b

Berpikir dan tidak berpikir

$0,7

$2,8

$8,4

qwen3-32b

Berpikir dan tidak berpikir

$0,16

$0,64

$0,64

qwen3-30b-a3b

Berpikir dan tidak berpikir

$0,2

$0,8

$2,4

qwen3-14b

Berpikir dan tidak berpikir

$0,35

$1,4

$4,2

qwen3-8b

Berpikir dan tidak berpikir

$0,18

$0,7

$2,1

qwen3-4b

Berpikir dan tidak berpikir

$0,11

$0,42

$1,26

qwen3-1,7b

Berpikir dan tidak berpikir

$0,11

$0,42

$1,26

qwen3-0,6b

Berpikir dan tidak berpikir

$0,11

$0,42

$1,26

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Mode

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Mode tanpa berpikir

Mode berpikir (CoT + respons)

qwen3-next-80b-a3b-thinking

Hanya berpikir

$0,144

-

$1,434

qwen3-next-80b-a3b-instruct

Tanpa pemikiran sama sekali

$0,144

$0,574

-

qwen3-235b-a22b-thinking-2507

Hanya berpikir

$0,287

-

$2,3

qwen3-235b-a22b-instruct-2507

Tanpa pemikiran sama sekali

$0,287

$0,92

-

qwen3-30b-a3b-thinking-2507

Hanya berpikir

$0,108

-

$1,076

qwen3-30b-a3b-instruct-2507

Hanya tidak berpikir

$0,108

$0,431

-

qwen3-235b-a22b

Berpikir dan tidak berpikir

$0,287

$1,147

$2,868

qwen3-32b

Berpikir dan tidak berpikir

$0,287

$0,64

$0,64

qwen3-30b-a3b

Berpikir dan tidak berpikir

$0,108

$0,431

$1,076

qwen3-14b

Berpikir dan tidak berpikir

$0,144

$0,574

$1,434

qwen3-8b

Berpikir dan tidak berpikir

$0,072

$0,287

$0,717

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Mode

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Mode tidak berpikir

Mode berpikir (CoT + respons)

qwen3-next-80b-a3b-thinking

Hanya berpikir

$0,144

-

$1,434

qwen3-next-80b-a3b-instruct

Hanya tidak berpikir

$0,144

$0,574

-

qwen3-235b-a22b-thinking-2507

Hanya berpikir

$0,287

-

$2,868

qwen3-235b-a22b-instruct-2507

Hanya tidak berpikir

$0,287

$1,147

-

qwen3-30b-a3b-thinking-2507

Hanya berpikir

$0,108

-

$1,076

qwen3-30b-a3b-instruct-2507

Hanya tidak berpikir

$0,108

$0,431

-

qwen3-235b-a22b

Berpikir dan tidak berpikir

$0,287

$1,147

$2,868

qwen3-32b

Berpikir dan tidak berpikir

$0,287

$1,147

$2,868

qwen3-30b-a3b

Berpikir dan tidak berpikir

$0,108

$0,431

$1,076

qwen3-14b

Berpikir dan tidak berpikir

$0,144

$0,574

$1,434

qwen3-8b

Berpikir dan tidak berpikir

$0,072

$0,287

$0,717

qwen3-4b

Berpikir dan tidak berpikir

$0,044

$0,173

$0,431

qwen3-1,7b

Berpikir dan tidak berpikir

$0,044

$0,173

$0,431

qwen3-0,6b

Berpikir dan tidak berpikir

$0,044

$0,173

$0,431

QwQ - Sumber terbuka

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwq-32b

$0,287

$0,861

Tidak ada kuota gratis

QwQ-Preview

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwq-32b-preview

$0,287

$0,861

Tidak ada kuota gratis

Qwen2.5

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen2.5-14b-instruct-1m

$0,805

$3,22

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen2.5-7b-instruct-1m

$0,368

$1,47

qwen2.5-72b-instruct

$1,4

$5,6

qwen2.5-32b-instruct

$0,7

$2,8

qwen2.5-14b-instruct

$0,35

$1,4

qwen2.5-7b-instruct

$0,175

$0,7

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen2.5-14b-instruct-1m

$0,144

$0,431

qwen2.5-7b-instruct-1m

$0,072

$0,144

qwen2.5-72b-instruct

$0,574

$1,721

qwen2.5-32b-instruct

$0,287

$0,861

qwen2.5-14b-instruct

$0,144

$0,431

qwen2.5-7b-instruct

$0,072

$0,144

qwen2.5-3b-instruct

$0,044

$0,130

qwen2.5-1,5b-instruct

Gratis untuk waktu terbatas

qwen2.5-0,5b-instruct

QVQ

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qvq-72b-preview

$1,721

$5.161

Tidak ada kuota gratis

Qwen-Omni

Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan dan pembatasan laju.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

Input: Teks

Input: Audio

Input: Gambar/Video

Output: Teks

Teks biasa sebagai input

Output: Teks

Input multimodal

Keluaran: Teks + Audio

Hanya audio yang dikenai biaya

qwen2.5-omni-7b

$0,10

$6,76

$0,28

$0,40

$0,84

$13,51

1 juta token (tanpa memandang modalitas)

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Input: Teks

Input: Audio

Input: Gambar/Video

Output: Teks

Teks biasa sebagai input

Output: Teks

Input multimodal

Output: Teks+Audio

Hanya audio yang dikenai biaya

qwen2.5-omni-7b

$0,087

$5,448

$0,287

$0,345

$0,861

$10,895

Qwen3-Omni-Captioner

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen3-omni-30b-a3b-captioner

$3,81

$3,06

1 juta token
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3-omni-30b-a3b-captioner

$2,265

$1,821

Qwen-VL

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Mode

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + tanggapan

Kuota gratis (Catatan)

qwen3-vl-235b-a22b-thinking

Hanya berpikir

$0,4

$4

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-vl-235b-a22b-instruct

Hanya tidak berpikir

$0,4

$1,6

qwen3-vl-32b-thinking

Hanya berpikir

$0,16

$0,64

qwen3-vl-32b-instruct

Hanya non-thinking

$0,16

$0,64

qwen3-vl-30b-a3b-thinking

Hanya berpikir

$0,2

$2,4

qwen3-vl-30b-a3b-instruct

Hanya tidak berpikir

$0,2

$0,8

qwen3-vl-8b-thinking

Hanya berpikir

$0,18

$2,1

qwen3-vl-8b-instruct

Hanya tidak berpikir

$0,18

$0,7

Model lainnya

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen2.5-vl-72b-instruct

$2,8

$8,4

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen2.5-vl-32b-instruct

$1,4

$4,2

qwen2.5-vl-7b-instruct

$0,35

$1,05

qwen2.5-vl-3b-instruct

$0,21

$0,63

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Mode

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-vl-235b-a22b-thinking

Hanya berpikir

$0,287

$2,867

qwen3-vl-235b-a22b-instruct

Hanya tidak berpikir

$0,287

$1,147

qwen3-vl-32b-thinking

Hanya berpikir

$0,16

$0,64

qwen3-vl-32b-instruct

Tanpa pemikiran sama sekali

$0,16

$0,64

qwen3-vl-30b-a3b-thinking

Hanya berpikir

$0,108

$1,075

qwen3-vl-30b-a3b-instruct

Tanpa pemikiran sama sekali

$0,108

$0,43

qwen3-vl-8b-thinking

Hanya berpikir

$0,072

$0,717

qwen3-vl-8b-instruct

Tanpa pemikiran sama sekali

$0,072

$0,287

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Mode

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT + respons

qwen3-vl-235b-a22b-thinking

Hanya berpikir

$0,287

$2,8677

qwen3-vl-235b-a22b-instruct

Hanya tidak berpikir

$0,287

$1,147

qwen3-vl-32b-thinking

Hanya berpikir

$0,287

$2,868

qwen3-vl-32b-instruct

Hanya Tanpa Berpikir

$0,287

$1,147

qwen3-vl-30b-a3b-thinking

Hanya berpikir

$0,108

$1,076

qwen3-vl-30b-a3b-instruct

Hanya tidak berpikir

$0,108

$0,431

qwen3-vl-8b-thinking

Hanya berpikir

$0,072

$0,717

qwen3-vl-8b-instruct

Hanya non-thinking

$0,072

$0,287

Model lainnya

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen2.5-vl-72b-instruct

$2,294

$6,881

qwen2.5-vl-32b-instruct

$1,147

$3,441

qwen2.5-vl-7b-instruct

$0,287

$0,717

qwen2.5-vl-3b-instruct

$0,173

$0,517

qwen2-vl-72b-instruct

$2,294

$6,881

qwen2-vl-7b-instruct

Gratis untuk waktu terbatas

qwen2-vl-2b-instruct

Qwen-Math

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen2.5-math-72b-instruct

$0,574

$1,721

Tidak ada kuota gratis

qwen2.5-math-7b-instruct

$0,144

$0,287

qwen2.5-math-1,5b-instruct

Gratis untuk waktu terbatas

Qwen-Coder

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen3-coder-next

0<Token≤32K

$0,3

$1,5

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

32K<Token≤128K

$0,5

$2,5

128K<Token≤256K

$0,8

$4

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$1,5

$7,5

32K<Token≤128K

$2,7

$13,5

128K<Token≤200K

$4,5

$22,5

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0,45

$2,25

32K<Token≤128K

$0,75

$3,75

128K<Token≤200K

$1,2

$6

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$0,861

$3,441

32K<Token≤128K

$1,291

$5,161

128K<Token≤200K

$2,151

$8,602

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0,216

$0,861

32K<Token≤128K

$0,323

$1,291

128K<Token≤200K

$0,538

$2,151

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen3-coder-next

0<Token≤32K

$0,144

$0,574

32K<Token≤128K

$0,216

$0,861

128K<Token≤256K

$0,359

$1,434

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$0,861

$3,441

32K<Token≤128K

$1,291

$5,161

128K<Token≤200K

$2,151

$8,602

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0,216

$0,861

32K<Token≤128K

$0,323

$1.291

128K<Token≤200K

$0,538

$2,151

qwen2.5-coder-32b-instruct

Tidak ada penetapan harga bertingkat

$0,287

$0,861

qwen2.5-coder-14b-instruct

Tidak ada penetapan harga bertingkat

$0,287

$0,861

qwen2.5-coder-7b-instruct

Tidak ada penetapan harga bertingkat

$0,144

$0,287

qwen2.5-coder-3b-instruct

Tidak ada penetapan harga bertingkat

Gratis untuk waktu terbatas

qwen2.5-coder-1.5b-instruct

Tidak ada penetapan harga bertingkat

qwen2.5-coder-0,5b-instruct

Tidak ada penetapan harga bertingkat

Generasi teks - Pihak ketiga

DeepSeek

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

deepseek-v3.2

$0,287

$0,431

Tidak ada kuota gratis

deepseek-v3.2-exp

$0,287

$0,431

deepseek-v3.1

$0,574

$1,721

deepseek-r1

$0,574

$2,294

deepseek-r1-0528

$0,574

$2,294

deepseek-v3

$0,287

$1,147

deepseek-r1-distill-qwen-1.5b

Gratis untuk waktu terbatas

deepseek-r1-distill-qwen-7b

$0,072

$0,144

Tidak ada kuota gratis

deepseek-r1-distill-qwen-14b

$0,144

$0,431

deepseek-r1-distill-qwen-32b

$0,287

$0,861

deepseek-r1-distill-llama-8b

Gratis untuk waktu terbatas

deepseek-r1-distill-llama-70b

Gratis untuk waktu terbatas

Kimi

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

kimi-k2.5

$0,574

$3,011

kimi-k2-thinking

$0,574

$2,294

Tidak ada kuota gratis

Moonshot-Kimi-K2-Instruct

$0,574

$2,294

MiniMax

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Mode

Harga input (per 1 juta token)

Token output (per 1 juta token)

CoT + tanggapan

MiniMax-M2.5

Hanya berpikir

$0,304

$1,213

GLM

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Model

Mode

Token input per permintaan

Harga input (per 1 juta token)

Harga output (per 1 juta token)

CoT dan respons

glm-5

Berpikir dan tidak berpikir

0<Token≤32K

$0,573

$2,58

32K<Token≤166K

$0,86

$3,154

glm-4.7

Berpikir dan tidak berpikir

0<Token≤32K

$0,431

$2,007

32K<Token≤166K

$0,574

$2,294

glm-4.6

Berpikir dan tidak berpikir

0<Token≤32K

$0,431

$2,007

32K<Token≤166K

$0,574

$2,294

Generasi gambar

Metode: Anda hanya dikenai biaya berdasarkan jumlah gambar yang berhasil dihasilkan.

Rumus: Biaya = Harga per gambar × Jumlah gambar yang dihasilkan.

Detail:

  • Biaya bersifat independen dari resolusi atau rasio aspek gambar keluaran.

  • Permintaan yang gagal tidak menimbulkan biaya atau menghabiskan kuota gratis.

Contoh penagihan: Kegagalan parsial dalam generasi gambar

Asumsikan harga per gambar adalah $0,10/gambar. Jika Anda meminta 4 gambar dan hanya 3 yang berhasil dihasilkan, Anda hanya akan dikenai biaya untuk 3 gambar tersebut.

  • Jumlah yang ditagih: 3 gambar.

  • Perhitungan biaya: 0,1 × 3 = $0,3.

Qwen-Image

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga output

Kuota gratis (Catatan)

qwen-image-2.0-pro

$0,075/gambar

100 gambar masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen-image-2.0-pro-2026-03-03

$0,075/gambar

qwen-image-2.0

$0,035/gambar

qwen-image-2.0-2026-03-03

$0,035/gambar

qwen-image-max

$0,075/gambar

qwen-image-max-2025-12-30

$0,075/gambar

qwen-image-plus

$0,03/gambar

qwen-image-plus-2026-01-09

$0,03/gambar

qwen-image

$0,035/gambar

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga output

qwen-image-2.0-pro

$0,071676/gambar

qwen-image-2.0-pro-2026-03-03

$0,071676/gambar

qwen-image-2.0

$0,028671/gambar

qwen-image-2.0-2026-03-03

$0,028671/gambar

qwen-image-max

$0,071677/gambar

qwen-image-max-2025-12-30

$0,071677/gambar

qwen-image-plus

$0,028671/gambar

qwen-image-plus-2026-01-09

$0,028671/gambar

qwen-image

$0,035/gambar

Qwen-Image-Edit

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga output

Kuota gratis (Catatan)

qwen-image-2.0-pro

$0,075/gambar

100 gambar masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen-image-2.0-pro-2026-03-03

$0,075/gambar

qwen-image-2.0

$0,035/gambar

qwen-image-2.0-2026-03-03

$0,035/gambar

qwen-image-edit-max

$0,075/gambar

qwen-image-edit-max-2026-01-16

$0,075/gambar

qwen-image-edit-plus

$0,03/gambar

qwen-image-edit-plus-2025-12-15

$0,03/gambar

qwen-image-edit-plus-2025-10-30

$0,03/gambar

qwen-image-edit

$0,045/gambar

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga output

qwen-image-2.0-pro

$0,071676/gambar

qwen-image-2.0-pro-2026-03-03

$0,071676/gambar

qwen-image-2.0

$0,028671/gambar

qwen-image-2.0-2026-03-03

$0,028671/gambar

qwen-image-edit-max

$0,071677/gambar

qwen-image-edit-max-2026-01-16

$0,071677/gambar

qwen-image-edit-plus

$0,028671/gambar

qwen-image-edit-plus-2025-12-15

$0,028671/gambar

qwen-image-edit-plus-2025-10-30

$0,028671/gambar

qwen-image-edit

$0,043/gambar

Qwen-MT-Image

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.

Model

Harga output

Kuota gratis (Catatan)

qwen-mt-image

$0,000431/gambar

Tidak ada kuota gratis

Generasi teks-ke-gambar - Z-Image

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga output

Kuota gratis (Catatan)

z-image-turbo

Penulisan ulang prompt dinonaktifkan (prompt_extend=false) : $0,015/gambar

Penulisan ulang prompt diaktifkan (prompt_extend=true) : $0,03/gambar

100 gambar

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga output

z-image-turbo

Penulisan ulang prompt dinonaktifkan (prompt_extend=false) : $0,01434/gambar

Penulisan ulang prompt diaktifkan (prompt_extend=true) : $0,02868/gambar

Wan teks-ke-gambar

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga output

Kuota gratis (Catatan)

wan2.6-t2i

$0,03/gambar

50 gambar

wan2.5-t2i-preview

$0,03/gambar

50 gambar

wan2.2-t2i-plus

$0,05/gambar

100 gambar

wan2.2-t2i-flash

$0,025/gambar

100 gambar

wan2.1-t2i-plus

$0,05/gambar

200 gambar

wan2.1-t2i-turbo

$0,025/gambar

200 gambar

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Harga output

wan2.6-t2i

$0,028671/gambar

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga output

wan2.6-t2i

$0,028671/gambar

wan2.5-t2i-preview

$0,028671/gambar

wan2.2-t2i-plus

$0,020070/gambar

wan2.2-t2i-flash

$0,028671/gambar

wanx2.1-t2i-plus

$0,028671/gambar

wanx2.1-t2i-turbo

$0,020070/gambar

wanx2.0-t2i-turbo

$0,005735/gambar

Wan generasi dan pengeditan gambar

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga output

Kuota gratis (Catatan)

wan2.6-image

$0,03/gambar

50 gambar
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Global

Catatan

Model Global (Virginia) tidak memiliki kuota gratis.

Model

Harga output

wan2.6-image

$0,028671/gambar

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga output

wan2.6-image

$0,028671/gambar

Wan pengeditan gambar umum

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi gambar.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Layanan

Model

Harga output

Kuota gratis (Catatan)

Pengeditan gambar umum 2.5

wan2.5-i2i-preview

$0,03/gambar

50 gambar
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Layanan

Model

Harga output

Pengeditan gambar umum 2.5

wan2.5-i2i-preview

$0,028671/gambar

Pengeditan gambar umum 2.1

wanx2.1-imageedit

$0,020070/gambar

OutfitAnyone

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

  • aitryon-plus: Biaya hanya berlaku untuk output. Untuk aturan penagihan, lihat Generasi gambar.

  • aitryon-parsing-v1: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar input. Permintaan yang gagal tidak dikenai biaya.

Layanan

Model

Harga

Kuota gratis (Catatan)

OutfitAnyone - Plus

aitryon-plus

$0,071677/gambar

Tidak ada kuota gratis

OutfitAnyone - Parsing gambar

aitryon-parsing-v1

$0,000574/gambar

Generasi video

Metode: Anda hanya dikenai biaya berdasarkan durasi video (detik) dari video yang berhasil dihasilkan.

Rumus: Biaya = Harga per detik × Durasi video (detik).

Detail:

  • Beberapa model menggunakan penetapan harga berbasis resolusi, di mana harga bervariasi berdasarkan resolusi (480p/720p/1080p).

  • Beberapa model menggunakan penetapan harga berbasis mode, di mana harga bervariasi berdasarkan mode video (Standar/Edisi Profesional).

  • Beberapa model menggunakan penetapan harga berbasis rasio aspek, di mana harga bervariasi berdasarkan rasio aspek (1:1/3:4).

  • Beberapa model menggunakan penetapan harga seragam, yang bersifat independen dari resolusi, mode, atau rasio aspek.

  • Permintaan yang gagal tidak menimbulkan biaya atau menghabiskan kuota gratis.

Wan - teks-ke-video

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Resolusi video output

Harga output

Kuota gratis (Catatan)

Berlaku: 90 hari setelah mengaktifkan Model Studio

wan2.6-t2v

720P

$0,10/detik

50 detik

1080P

$0,15/detik

wan2.5-t2v-preview

480P

$0,05/detik

50 detik

720P

$0,10/detik

1080P

$0,15/detik

wan2.2-t2v-plus

480P

$0,02/detik

50 detik

1080P

$0,10/detik

wan2.1-t2v-turbo

480P

$0,036/detik

200 detik

720P

$0,036/detik

wan2.1-t2v-plus

720P

$0,10/detik

200 detik

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Resolusi video output

Harga output

wan2.6-t2v

720P

$0,086012/detik

1080P

$0,143353/detik

AS

Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.

Catatan

Mode penyebaran AS tidak memiliki kuota gratis.

Model

Resolusi video output

Harga output

wan2.6-t2v-us

720P

$0,1/detik

1080P

$0,15/detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Resolusi video output

Harga output

wan2.6-t2v

720P

$0,086012/detik

1080P

$0,143353/detik

wan2.5-t2v-preview

480P

$0,043006/detik

720P

$0,086012/detik

1080P

$0,143353/detik

wan2.2-t2v-plus

480P

$0,02007/detik

1080P

$0,100347/detik

wanx2.1-t2v-turbo

480P

$0,034405/detik

720P

$0,034405/detik

wanx2.1-t2v-plus

720P

$0,100347/second

Wan - image-to-video - debut pertama

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Jenis video output

Resolusi video output

Harga output

Kuota gratis (Catatan)

Berlaku: 90 hari setelah mengaktifkan Model Studio

wan2.6-i2v-flash

Video dengan audio

audio=true

720P

$0,05/detik

50 detik

1080P

$0,075/detik

Video tanpa audio

audio=false

720P

$0,025/detik

1080P

$0,0375/detik

wan2.6-i2v

Video dengan audio

720P

$0,10/detik

50 detik

1080P

$0,15/detik

wan2.5-i2v-preview

Video dengan audio

480P

$0,05/detik

50 detik

720P

$0,10/second

1080P

$0,15/detik

wan2.2-i2v-flash

Video tanpa audio

480P

$0,015/detik

50 detik

720P

$0,036/detik

wan2.2-i2v-plus

Video tanpa audio

480P

$0,02/detik

50 detik

1080P

$0,10/detik

wan2.1-t2v-turbo

Video tanpa audio

480P

$0,036/detik

200 detik

720P

$0,036/detik

wan2.1-t2v-plus

Video tanpa audio

720P

$0,10/detik

200 detik

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Resolusi video output

Harga output

wan2.6-i2v

720P

$0,086012/detik

1080P

$0,143353/detik

AS

Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.

Catatan

Mode penyebaran AS tidak memiliki kuota gratis.

Model

Resolusi video output

Harga output

wan2.6-i2v-us

720P

$0,1/detik

1080P

$0,15/detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Jenis video output

Resolusi video output

Harga output

wan2.6-i2v-flash

Video dengan audio

audio=true

720P

$0,043006/detik

1080P

$0,071676/detik

Video tanpa audio

audio=false

720P

$0,021503/detik

1080P

$0,035838/detik

wan2.6-i2v

Video dengan audio

720P

$0,086012/detik

1080P

$0,143353/detik

wan2.5-i2v-preview

Video dengan audio

480P

$0,043006/detik

720P

$0,086012/detik

1080P

$0,143353/detik

wan2.2-i2v-plus

Video tanpa audio

480P

$0,02007/detik

1080P

$0,100347/detik

wanx2.1-t2v-turbo

Video tanpa audio

480P

$0,034405/detik

720P

$0,034405/detik

wanx2.1-t2v-plus

Video tanpa audio

720P

$0,100347/detik

Wan - gambar-ke-video - frame pertama dan terakhir

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Resolusi video output

Harga output

Kuota gratis (Catatan)

Berlaku: 90 hari setelah mengaktifkan Model Studio

wan2.2-kf2v-flash

480P

$0,015/detik

50 detik

720P

$0,036/detik

1080P

$0,07/detik

wan2.1-kf2v-plus

720P

$0,10/detik

200 detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Output Video Resolution

Harga output

wan2.2-kf2v-flash

480P

$0.014335/detik

720P

$0,028671/detik

1080P

$0,068809/detik

wanx2.1-kf2v-plus

720P

$0,100347/detik

Wan - referensi-ke-video

Aturan penagihan: Biaya berlaku untuk video input dan output berdasarkan durasi video dalam detik. Generasi yang gagal tidak dikenai biaya dan tidak menghabiskan kuota gratis.

  • Rumus: Durasi yang ditagih = durasi video input (maksimal 5 detik) + durasi video output.

    • Video input dikenai biaya maksimal 5 detik. Untuk aturan spesifik, lihat Wan - referensi-ke-video.

    • Video output dikenai biaya berdasarkan jumlah detik dari video yang berhasil dihasilkan.

  • Deskripsi penetapan harga: Harga satuan ditentukan oleh tingkat resolusi dan opsi audio, tanpa memandang resolusi atau audio pada video input.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Spesifikasi output

Resolusi output

Harga input & output

Kuota gratis (Catatan)

Berlaku: 90 hari setelah mengaktifkan Model Studio

wan.6-r2v-flash

Video dengan audio

audio=true

720P

$0,05/detik

50 detik

1080P

$0,075/detik

Video tanpa audio

audio=false

720P

$0,025/detik

1080P

$0,0375/detik

wan2.6-r2v

Video dengan audio

720P

$0,10/detik

50 detik

1080P

$0,15/detik

Global

Dalam mode penyebaran Global, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia)atau wilayah Jerman (Frankfurt), dan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Catatan

Mode penyebaran Global tidak memiliki kuota gratis.

Model

Spesifikasi output

Resolusi output

Harga input & output

wan2.6-r2v

Video dengan audio

720P

$0,086012/detik

1080P

$0,143353/detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Spesifikasi output

Resolusi output

Harga input & output

wan.6-r2v-flash

Video dengan audio

audio=true

720P

$0,043006/detik

1080P

$0,071676/detik

Video tanpa audio

audio=false

720P

$0,021503/detik

1080P

$0,035838/detik

wan2.6-r2v

Video dengan audio

720P

$0,086012/detik

1080P

$0,143353/detik

Wan - pengeditan video umum

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Resolusi video output

Harga output

Kuota gratis (Catatan)

wan2.1-vace-plus

720P

$0,10/detik

50 detik

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Resolusi video output

Harga output

wanx2.1-vace-plus

720P

$0,100347/detik

Wan - manusia digital

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

  • wan2.2-s2v-detect: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.

  • wan2.2-s2v: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.

Service

Model

Price

Kuota gratis (Catatan)

Deteksi gambar

wan2.2-s2v-detect

Gambar input: $0,000574/gambar

Tidak ada kuota gratis

Generasi video

wan2.2-s2v

Video output:

  • 480P: $0,071677/detik

  • 720P: $0,129018/detik

Wan - gambar-ke-aksi

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Output video mode

Harga output

Kuota gratis (Catatan)

wan2.2-animate-move

Mode Standar Wan - std

$0,12/detik

50 detik

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Mode Profesional Wan - pro

$0,18/detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Output video mode

Harga output

wan2.2-animate-move

Mode Standar Wan - std

$0,06/detik

Mode Profesional Wan - pro

$0,09/detik

Wan - Penukaran karakter video

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Output video mode

Harga output

Kuota gratis (Catatan)

wan2.2-animate-mix

Mode Standar Wan - std

$0,18/detik

50 detik

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Mode Profesional Wan - pro

$0,26/detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Output video mode

Harga output

wan2.2-animate-mix

Mode Standar Wan - std

$0,09/detik

Mode Profesional Wan - pro

$0,13/detik

AnimateAnyone

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

  • animate-anyone-detect-gen2: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.

  • animate-anyone-template-gen2: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.

  • animate-anyone-gen2: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.

Layanan

Model

Harga

Kuota gratis (Catatan)

Deteksi gambar

animate-anyone-detect-gen2

Gambar input: $0,000574/gambar

Tidak ada kuota gratis

Generasi templat aksi

animate-anyone-template-gen2

Video output: $0,011469/detik

Generasi video

animate-anyone-gen2

Video output: $0,011469/detik

EMO

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

  • emo-detect-v1: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.

  • emo-v1: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.

Layanan

Model

Harga

Kuota gratis (Catatan)

Deteksi gambar

emo-detect-v1

Gambar input: $0,000574/gambar

Tidak ada kuota gratis

Generasi video

emo-v1

Video output:

  • Rasio aspek 1:1: $0,011469/detik

  • Rasio aspek 3:4: $0,022937/detik

LivePortrait

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

  • liveportrait-detect: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.

  • liveportrait: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.

Layanan

Model

Harga

Kuota gratis (Catatan)

Deteksi gambar

liveportrait-detect

Gambar input: $0,000574/gambar

Tidak ada kuota gratis

Generasi video

liveportrait

Video output: $0,002868/detik

Emoji

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

  • emoji-detect-v1: Biaya hanya berlaku untuk input. Penagihan berdasarkan jumlah gambar yang terdeteksi. Setiap gambar input dikenai biaya sekali, tanpa memandang keberhasilan deteksi.

  • emoji-v1: Biaya hanya berlaku untuk output. Penagihan berdasarkan durasi video yang berhasil dihasilkan dalam detik. Untuk aturan penagihan, lihat Generasi video.

Layanan

Model

Harga

Kuota gratis (Catatan)

Deteksi gambar

emoji-detect-v1

Gambar input: $0,000574/gambar

Tidak ada kuota gratis

Generasi video

emoji-v1

Video output: $0,011469/detik

VideoRetalk

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.

Model

Harga output

Kuota gratis (Catatan)

videoretalk

$0,011469/detik

Tidak ada kuota gratis

Transformasi gaya video

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Hanya output yang dikenai biaya. Untuk aturan, lihat Generasi video.

Model

Resolusi video output

Harga output

Kuota gratis (Catatan)

video-style-transform

540P

$0,028671/detik

Tidak ada kuota gratis

720P

$0,071677/detik

Sintesis ucapan (teks-ke-ucapan)

Qwen-TTS

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Qwen3-TTS-Instruct-Flash

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

qwen3-tts-instruct-flash

$0,115

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-tts-instruct-flash-2026-01-26

$0,115

Qwen3-TTS-VD

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

qwen3-tts-vd-2026-01-26

$0,115

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Qwen3-TTS-VC

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

qwen3-tts-vc-2026-01-22

$0,115

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Qwen3-TTS-Flash

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

qwen3-tts-flash

$0,1

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-tts-flash-2025-11-27

$0,1

qwen3-tts-flash-2025-09-18

$0,1

Model Studio diaktifkan sebelum pukul 00:00 tanggal 13 November 2025: 2.000 karakter

Model Studio diaktifkan setelah pukul 00:00 tanggal 13 November 2025: 10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Qwen3-TTS-Instruct-Flash

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Harga output (per 10 ribu karakter)

qwen3-tts-instruct-flash

$0,115

Tidak dikenai biaya

qwen3-tts-instruct-flash-2026-01-26

$0,115

Tidak dikenai biaya

Qwen3-TTS-VD

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Harga output (per 10 ribu karakter)

qwen3-tts-vd-2026-01-26

$0,115

Tidak dikenai biaya

Qwen3-TTS-VC

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Harga output (per 10 ribu karakter)

qwen3-tts-vc-2026-01-22

$0,115

Tidak dikenai biaya

Qwen3-TTS-Flash

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Harga output (per 10 ribu karakter)

qwen3-tts-flash

$0,114682

Tidak dikenai biaya

qwen3-tts-flash-2025-11-27

$0,114682

Tidak dikenai biaya

qwen3-tts-flash-2025-09-18

$0,114682

Tidak dikenai biaya

Qwen-TTS

Aturan penagihan: Biaya dihitung per token input dan output.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

qwen-tts-flash

$0,23

$1,434

qwen-tts-latest

$0,23

$1,434

qwen-tts-2025-05-22

$0,23

$1,434

qwen-tts-2025-04-10

$0,23

$1,434

Qwen-TTS-Realtime

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Qwen3-TTS-Instruct-Flash-Realtime

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

qwen3-tts-instruct-flash-realtime

$0,143

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-tts-instruct-flash-realtime-2026-01-22

$0,143

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Qwen3-TTS-VD-Realtime

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

qwen3-tts-vd-realtime-2026-01-15

$0,143353

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-tts-vd-realtime-2025-12-16

$0,143353

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Qwen3-TTS-VC-Realtime

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

qwen3-tts-vc-realtime-2026-01-15

$0,13

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-tts-vc-realtime-2025-11-27

Qwen3-TTS-Flash-Realtime

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

qwen3-tts-flash-realtime

$0,13

Model Studio diaktifkan sebelum pukul 00:00 tanggal 13 November 2025: 2.000 karakter

Model Studio diaktifkan setelah pukul 00:00 tanggal 13 November 2025: 10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-tts-flash-realtime-2025-11-27

$0,13

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-tts-flash-realtime-2025-09-18

$0,13

Model Studio diaktifkan sebelum pukul 00:00 tanggal 13 November 2025: 2.000 karakter

Model Studio diaktifkan setelah pukul 00:00 tanggal 13 November 2025: 10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Qwen3-TTS-Instruct-Flash-Realtime

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Harga output

qwen3-tts-instruct-flash-realtime

$0,143

Tidak dikenai biaya

qwen3-tts-instruct-flash-realtime-2026-01-22

$0,143

Tidak dikenai biaya

Qwen3-TTS-VD-Realtime

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Harga output

qwen3-tts-vd-realtime-2026-01-15

$0,143353

Tidak dikenai biaya

qwen3-tts-vd-realtime-2025-12-16

$0,143353

Tidak dikenai biaya

Qwen3-TTS-VC-Realtime

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Harga output

qwen3-tts-vc-realtime-2026-01-15

$0,143353

Tidak dikenai biaya

qwen3-tts-vc-realtime-2025-11-27

Qwen3-TTS-Flash-Realtime

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Harga output

qwen3-tts-flash-realtime

$0,143353

Tidak dikenai biaya

qwen3-tts-flash-realtime-2025-11-27

$0,143353

Tidak dikenai biaya

qwen3-tts-flash-realtime-2025-09-18

$0,143353

Tidak dikenai biaya

Qwen-TTS-Realtime

Aturan penagihan: Biaya dihitung per token input dan output.

Model

Harga input (per 1 juta token)

Harga input (per 1 juta token)

qwen-tts-realtime

$0,345

$1,721

qwen-tts-realtime-latest

$0,345

$1.721

qwen-tts-realtime-2025-07-15

$0,345

$1,721

Qwen-TTS kloning suara

Aturan penagihan: Biaya berlaku untuk jumlah suara baru yang dibuat.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga (per suara)

Kuota gratis (Catatan)

qwen-voice-enrollment

$0,01

1.000 suara/akun

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga (per suara)

qwen-voice-enrollment

$0,01

Qwen-TTS desain suara

Aturan penagihan: Biaya berlaku untuk jumlah suara baru yang dibuat.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga (per suara)

Kuota gratis (Catatan)

qwen-voice-design

$0,2

10 suara/akun

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga (per suara)

qwen-voice-design

$0,2

CosyVoice

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

cosyvoice-v3-plus

$0,26

10.000 karakter

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

cosyvoice-v3-flash

$0,13

Tiongkok Daratan

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Aturan penagihan: Biaya berlaku per karakter teks input. Output tidak dikenai biaya.

Model

Harga input (per 10 ribu karakter)

Kuota gratis (Catatan)

cosyvoice-v3.5-plus

$0,22

Tidak ada kuota gratis

cosyvoice-v3.5-flash

$0,116

cosyvoice-v3-plus

$0,286706

cosyvoice-v3-flash

$0,14335

cosyvoice-v2

$0,286706

Rekognisi ucapan (ucapan-ke-teks) dan terjemahan (ucapan-ke-terjemahan)

Qwen3-LiveTranslate-Flash-Realtime

Aturan penagihan: Biaya dihitung per token input dan output. Untuk aturan perhitungan token pada modalitas berbeda, lihat Penagihan.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

Input: Audio

Input: Gambar

Output: Teks

Output: Audio

qwen3-livetranslate-flash-realtime

$10

$1,3

$10

$38

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-livetranslate-flash-realtime-2025-09-22

$10

$1,3

$10

$38

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Input: Audio

Input: Gambar

Output: Teks

Output: Audio

qwen3-livetranslate-flash-realtime

$9,175

$1,147

$9,175

$34,405

qwen3-livetranslate-flash-realtime-2025-09-22

$9,175

$1,147

$9,175

$34,405

Qwen-ASR

Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input

Kuota gratis (Catatan)

qwen3-asr-flash-filetrans

$0,000035/detik

36.000 detik (10 jam)
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-asr-flash-filetrans-2025-11-17

qwen3-asr-flash

qwen3-asr-flash-2025-09-08

AS

Dalam mode penyebaran AS, endpoint dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi model terbatas di Amerika Serikat.

Catatan

Mode penyebaran AS tidak memiliki kuota gratis.

Model

Harga input

qwen3-asr-flash-us

$0,000035/detik

qwen3-asr-flash-2025-09-08-us

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input

qwen3-asr-flash-filetrans

$0,000032/detik

qwen3-asr-flash-filetrans-2025-11-17

qwen3-asr-flash

qwen3-asr-flash-2025-09-08

Qwen-ASR-Realtime

Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input

Kuota gratis (Catatan)

qwen3-asr-flash-realtime

$0,000090/detik

36.000 detik (10 jam)
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

qwen3-asr-flash-realtime-2026-02-10

$0,000090/detik

qwen3-asr-flash-realtime-2025-10-27

$0,000090/detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input

qwen3-asr-flash-realtime

$0,000047/detik

qwen3-asr-flash-realtime-2026-02-10

qwen3-asr-flash-realtime-2025-10-27

Fun-ASR

Rekognisi file audio

Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input

Kuota gratis (Catatan)

fun-asr

$0,000035/detik

36.000 detik (10 jam)
Berlaku selama 90 hari

fun-asr-2025-11-07

fun-asr-2025-08-25

fun-asr-mtl

fun-asr-mtl-2025-08-25

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input

fun-asr

$0,000032/detik

fun-asr-2025-11-07

fun-asr-2025-08-25

fun-asr-mtl

fun-asr-mtl-2025-08-25

Rekognisi ucapan real-time

Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input

Kuota gratis (Catatan)

fun-asr-realtime

$0,00009/detik

36.000 detik (10 jam)

Valid selama 90 hari

fun-asr-realtime-2025-11-07

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input

fun-asr-realtime

$0,000047/detik

fun-asr-realtime-2026-02-28

fun-asr-realtime-2025-11-07

fun-asr-realtime-2025-09-15

fun-asr-flash-8k-realtime

$0,000032/detik

fun-asr-flash-8k-realtime-2026-01-28

Paraformer

Rekognisi file audio

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.

Model

Harga input

paraformer-v2

$0,000012/detik

paraformer-8k-v2

Rekognisi ucapan real-time

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Aturan penagihan: Biaya berlaku per detik durasi audio input. Output tidak dikenai biaya.

Model

Harga input

Kuota gratis (Catatan)

paraformer-realtime-v2

$0,000035/detik

Tidak ada kuota gratis

paraformer-realtime-8k-v2

Embedding teks

Aturan penagihan: Biaya berlaku per token input. Output tidak dikenai biaya.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Kuota gratis (Catatan)

text-embedding-v4

$0,07

1 juta token
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

text-embedding-v3

$0,07

500.000 token
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

text-embedding-v4

$0,072

Tiongkok (Hong Kong)

Model

Harga input (per 1 juta token)

Kuota gratis(Catatan)

text-embedding-v4

$0,07

1 juta token masing-masing
Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Embedding multimodal

Aturan penagihan: Biaya berlaku per token input. Output tidak dikenai biaya.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (Juta token input)

Kuota gratis (Catatan)

tongyi-embedding-vision-plus

$0,09

1 juta token

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

tongyi-embedding-vision-flash

Gambar/Video: $0,03

Teks: $0,09

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Model

Harga input (per 1 juta token)

Kuota gratis (Catatan)

qwen3-vl-embedding

Gambar/Video: $0,258

Teks: $0,1

Tidak ada kuota gratis

multimodal-embedding-v1

Uji coba gratis

Pengurutan Ulang Teks

Aturan penagihan: Biaya berlaku per token input. Output tidak dikenai biaya.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Kuota gratis (Catatan)

qwen3-rerank

$0,1

1 juta token

Masa berlaku: 90 hari setelah mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Catatan

Mode penyebaran Tiongkok Daratan tidak memiliki kuota gratis.

Model

Harga input (per 1 juta token)

gte-rerank-v2

$0,115

Spesifik domain

Pengenalan niat

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model dibatasi di Tiongkok Daratan.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

tongyi-intent-detect-v3

$0,058

$0,144

Tidak ada kuota gratis

Bermain peran

Metode: Anda dikenai biaya berdasarkan token input dan token output.

Internasional

Dalam mode penyebaran Internasional, endpoint dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok daratan).

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-plus-character

$0,5

$1,4

Tidak ada kuota gratis

qwen-flash-character

$0,05

$0,4

qwen-plus-character-ja

$0,5

$1,4

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, endpoint dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Model

Harga input (per 1 juta token)

Harga output (per 1 juta token)

Kuota gratis (Catatan)

qwen-plus-character

$0,115

$0,287

Tidak ada kuota gratis