全部产品
Search
文档中心

Alibaba Cloud Model Studio:Daftar model

更新时间:Jan 24, 2026

Model unggulan

Global

Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Flagship models

通义new Qwen-Max

Ideal untuk tugas kompleks. Model paling kuat.

通义new Qwen-Plus

Keseimbangan antara performa, kecepatan, dan biaya.

通义new Qwen-Flash

Ideal untuk pekerjaan simple. Cepat dan berbiaya rendah.

通义new Qwen-Coder

Model kode unggulan yang unggul dalam pemanggilan tool dan interaksi lingkungan.

Max context window

(Tokens)

262.144

1.000.000

1.000.000

1.000.000

Min input cost

(Million tokens)

$1,2

$0,4

$0,05

$0,3

Min output cost

(Million tokens)

$6

$1,2

$0,4

$1,5

International

Dalam mode penyebaran International, titik akses dan penyimpanan data berlokasi di wilayah Singapore, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Mainland China).

Flagship models

通义new Qwen-Max

Ideal untuk tugas kompleks. Model paling kuat.

通义new Qwen-Plus

Keseimbangan antara performa, kecepatan, dan biaya.

通义new Qwen-Flash

Ideal untuk pekerjaan simple. Cepat dan berbiaya rendah.

通义new Qwen-Coder

Model kode unggulan yang unggul dalam pemanggilan tool dan interaksi lingkungan.

Max context window

(Tokens)

262.144

1.000.000

1.000.000

1.000.000

Min input cost

(Million tokens)

$1,2

$0,4

$0,05

$0,3

Min output cost

(Million tokens)

$6

$1,2

$0,4

$1,5

US

Dalam mode penyebaran US, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dibatasi hanya di wilayah AS.

Flagship models

通义new Qwen-Plus

Keseimbangan antara performa, kecepatan, dan biaya.

通义new Qwen-Flash

Ideal untuk pekerjaan simple. Cepat dan berbiaya rendah.

Max context window

(Tokens)

1.000.000

1.000.000

Min input cost

(Million tokens)

$0,4

$0,05

Min output cost

(Million tokens)

$1,2

$0,4

Mainland China

Dalam mode penyebaran Mainland China, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Mainland China.

Flagship models

通义new Qwen-Max

Ideal untuk tugas kompleks. Model paling kuat.

通义new Qwen-Plus

Keseimbangan antara performa, kecepatan, dan biaya.

通义new Qwen-Flash

Ideal untuk pekerjaan simple. Cepat dan berbiaya rendah.

通义new Qwen-Coder

Model kode unggulan yang unggul dalam pemanggilan tool dan interaksi lingkungan.

Max context window

(Tokens)

262.144

1.000.000

1.000.000

1.000.000

Min input cost

(Million tokens)

$0,459

$0,115

$0,022

$0,144

Min output cost

(Million tokens)

$1,836

$0,287

$0,216

$0,574

Tinjauan model

Global

Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Kategori

Subkategori

Deskripsi

Text generation

General-purpose large language models

Model bahasa besar Qwen: Model komersial (Qwen-Max, Qwen-Plus, Qwen-Flash), model open source (Qwen3)

Multimodal models

Model pemahaman visual Qwen-VL

Domain-specific models

Code model, Translation model

Image generation

Text-to-image

Image editing

  • Wan image editing: Mendukung skenario seperti fusi multi-gambar, style transfer, object detection, restorasi gambar, dan penghapusan watermark. Seri model: Wan2.6.

Video generation

Text-to-video

Menghasilkan video berkualitas tinggi dengan berbagai gaya dari satu kalimat.

Image-to-video

First-frame-to-video: Menggunakan gambar input sebagai frame pertama dan menghasilkan video berdasarkan prompt.

Video-to-video

Reference-to-video: Menghasilkan video yang mempertahankan konsistensi karakter menggunakan prompt serta penampilan dan suara dari video input.

International

Dalam mode penyebaran International, titik akses dan penyimpanan data berlokasi di wilayah Singapore, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Mainland China).

Kategori

Subkategori

Deskripsi

Text generation

General-purpose large language models

Model bahasa besar Qwen: Model komersial (Qwen-Max, Qwen-Plus, Qwen-Flash), model open source (Qwen3, Qwen2.5)

Multimodal models

Model pemahaman visual Qwen-VL, model penalaran visual QVQ, model omni-modal Qwen-Omni, dan model multi-modal real-time Qwen-Omni-Realtime

Domain-specific models

Code model, Translation model, Role-playing model

Image generation

Text-to-image

  • Qwen-Image: Unggul dalam menangani instruksi kompleks, rendering teks dalam bahasa Tiongkok dan Inggris, serta menghasilkan gambar fotorealistis berdefinisi tinggi. Mendukung pemilihan model berbeda berdasarkan kebutuhan efisiensi dan kualitas.

  • Wan text-to-image:

  • Tongyi - text-to-Image - Z-Image: Model text-to-image ringan yang cepat menghasilkan gambar berkualitas tinggi serta mendukung rendering bilingual dalam bahasa Tiongkok dan Inggris, pemahaman semantik kompleks, dan berbagai gaya serta tema.

Image editing

  • Qwen-Image-Edit: Mendukung prompt dalam bahasa Tiongkok dan Inggris, memungkinkan operasi pengeditan gambar dan teks kompleks seperti style transfer, modifikasi teks, dan pengeditan objek. Juga mendukung fusi multi-gambar dan dapat diadaptasi untuk berbagai skenario aplikasi industri.

  • Wan image editing: Mendukung skenario seperti fusi multi-gambar, style transfer, object detection, restorasi gambar, dan penghapusan watermark. Seri model meliputi: Wan2.6, Wan2.5.

Speech synthesis and recognition

Speech synthesis (text-to-speech)

Qwen speech synthesis dan Qwen realtime speech synthesis dapat digunakan untuk text-to-speech dalam skenario seperti layanan pelanggan suara cerdas, buku audio, navigasi dalam mobil, dan bimbingan belajar.

Speech recognition and translation

Qwen realtime speech recognition, Qwen audio file recognition, Qwen3-LiveTranslate-Flash-Realtime, dan Fun-ASR speech recognition dapat melakukan speech-to-text untuk skenario seperti catatan rapat real-time, keterangan siaran langsung real-time, dan layanan pelanggan telepon.

Video generation

Text-to-video

Menghasilkan video berkualitas tinggi dengan berbagai gaya dari satu kalimat.

Image-to-video

  • First-frame-to-video: Menggunakan gambar input sebagai frame pertama dan menghasilkan video berdasarkan prompt.

  • First-and-last-frame-to-video: Menghasilkan video yang halus dan dinamis berdasarkan frame pertama dan terakhir yang diberikan serta prompt.

  • Multi-image-to-video: Menghasilkan video dengan merujuk pada entitas atau latar belakang dalam satu atau beberapa gambar input, dikombinasikan dengan prompt.

Video-to-video

Reference-to-video: Menghasilkan video yang mempertahankan konsistensi karakter menggunakan prompt serta penampilan dan suara dari video input.

General video editing

General video editing: Melakukan berbagai tugas pengeditan video berdasarkan input teks, gambar, dan video. Misalnya, dapat menghasilkan video baru dengan mengekstraksi fitur gerakan dari video input dan menggabungkannya dengan prompt.

Embedding

Text embedding

Mengonversi teks menjadi sekumpulan angka yang merepresentasikan teks tersebut. Cocok untuk tugas pencarian, pengelompokan, rekomendasi, dan klasifikasi.

US

Dalam mode penyebaran US, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dibatasi hanya di wilayah AS.

Kategori

Subkategori

Deskripsi

Text generation

General-purpose large language models

Model bahasa besar Qwen: Model komersial (Qwen-Plus, Qwen-Flash)

Multimodal models

Model pemahaman visual Qwen-VL

Video generation

Text-to-video

Menghasilkan video berkualitas tinggi dengan berbagai gaya dari satu kalimat.

Image-to-video

First-frame-to-video: Menggunakan gambar input sebagai frame pertama dan menghasilkan video berdasarkan prompt.

Speech recognition

Speech recognition

Qwen audio file recognition dapat melakukan speech-to-text untuk skenario seperti transkripsi rapat dan pemberian keterangan siaran langsung.

Mainland China

Dalam mode penyebaran Mainland China, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Mainland China.

Kategori

Model

Deskripsi

Text generation

General-purpose large language models

Multimodal models

Model pemahaman visual Qwen-VL, model penalaran visual QVQ, dan model omni-modal Qwen-Omni

Domain-specific models

Code model, Mathematical model, Translation model, Data mining model, Research model, Intention recognition model, Role-playing model

Image generation

Text-to-image

  • Qwen-Image: Unggul dalam menangani instruksi kompleks, rendering teks dalam bahasa Tiongkok dan Inggris, serta menghasilkan gambar fotorealistis berdefinisi tinggi. Mendukung pemilihan model berbeda berdasarkan kebutuhan efisiensi dan kualitas.

  • Wan text-to-image:

  • Tongyi - text-to-Image - Z-Image: Model text-to-image ringan yang cepat menghasilkan gambar berkualitas tinggi serta mendukung rendering bilingual dalam bahasa Tiongkok dan Inggris, pemahaman semantik kompleks, dan berbagai gaya serta tema.

Image editing

Model tujuan umum:

  • Qwen-Image-Edit: Mendukung prompt dalam bahasa Tiongkok dan Inggris, memungkinkan operasi pengeditan gambar dan teks kompleks seperti style transfer, modifikasi teks, dan pengeditan objek. Juga mendukung fusi multi-gambar dan dapat diadaptasi untuk berbagai skenario aplikasi industri.

  • Wan image editing: Mendukung skenario seperti fusi multi-gambar, style transfer, object detection, restorasi gambar, dan penghapusan watermark. Seri model meliputi: Wan2.6, Wan2.5, Wan2.1.

Model lainnya: Qwen Image Translation, OutfitAnyone

Speech synthesis and recognition

Speech synthesis (text-to-speech)

Qwen speech synthesis, Qwen realtime speech synthesis, dan CosyVoice speech synthesis mengonversi teks menjadi ucapan untuk skenario seperti layanan pelanggan berbasis suara, buku audio, navigasi dalam mobil, dan bimbingan belajar.

Speech recognition and translation

Qwen realtime speech recognition, Qwen audio file recognition, Fun-ASR speech recognition, dan Paraformer speech recognition mengonversi ucapan menjadi teks untuk skenario seperti transkripsi rapat real-time, pemberian keterangan siaran langsung real-time, dan panggilan layanan pelanggan.

Video editing and generation

Text-to-video

Menghasilkan video berkualitas tinggi dengan berbagai gaya dari satu kalimat.

Image-to-video

  • First-frame-to-video: Menghasilkan video dari gambar awal dan prompt.

  • First-and-last-frame-to-video: Menghasilkan video dengan transisi alami berdasarkan gambar frame pertama dan terakhir serta prompt.

  • Multi-image-to-video: Menghasilkan video dari satu atau beberapa gambar dan prompt teks, berdasarkan entitas atau latar belakang dalam gambar sumber.

  • Generasi video tari: AnimateAnyone menghasilkan video tari dari gambar karakter dan video aksi.

  • Gambar + audio untuk menghasilkan video lip-sync

    • Wan - digital human menghasilkan video dari gambar dan audio seseorang. Menyediakan rentang gerakan yang luas dan alami, mendukung berbagai ukuran frame seperti full-body, half-body, dan portrait, serta cocok untuk skenario seperti bernyanyi dan pertunjukan.

    • EMO menggunakan gambar dan audio seseorang untuk menghasilkan video dengan lip-sync dan ekspresi wajah yang sangat ekspresif. Mendukung bidikan portrait dan half-body serta ideal untuk skenario close-up.

    • LivePortrait menggunakan gambar portrait dan file audio, ideal untuk skenario narasi suara.

  • Generasi video emoji: Emoji menghasilkan video emoji wajah dari gambar wajah dan templat dinamis wajah yang telah ditentukan.

Video-to-video

Reference-to-video: Menghasilkan video yang mempertahankan konsistensi karakter menggunakan prompt serta penampilan dan suara dari video input.

General-purpose video editing

  • General video editing: Melakukan berbagai tugas pengeditan video berdasarkan prompt teks, gambar, dan video. Misalnya, Anda dapat menghasilkan video baru dengan mengekstraksi fitur gerakan dari video input dan menggabungkannya dengan prompt teks.

  • Lip-sync video: VideoRetalk menggunakan video dan audio seseorang, ideal untuk skenario seperti produksi video pendek dan terjemahan video.

  • Style transfer video: Video style transform mengubah video menjadi berbagai gaya, seperti manga Jepang dan komik Amerika.

Vector

Text embedding

Mengonversi teks menjadi sekumpulan angka yang merepresentasikan teks tersebut. Digunakan untuk pencarian, pengelompokan, rekomendasi, dan klasifikasi.

Multimodal embedding

Mengonversi teks, gambar, dan ucapan menjadi sekumpulan angka. Digunakan untuk klasifikasi audio dan video, klasifikasi gambar, serta pengambilan gambar-teks.

Generasi teks - Qwen

Berikut ini adalah model komersial Qwen. Dibandingkan dengan versi open-source, model komersial menawarkan kemampuan dan peningkatan terbaru.

Ukuran parameter model komersial tidak diungkapkan.
Setiap model diperbarui secara berkala. Untuk menggunakan versi tetap, Anda dapat memilih versi snapshot. Versi snapshot biasanya dipertahankan selama satu bulan setelah rilis versi snapshot berikutnya.
Kami merekomendasikan penggunaan versi stable atau latest untuk mendapatkan kondisi pembatasan laju yang lebih longgar.

Qwen-Max

Model dengan performa terbaik dalam seri Qwen, cocok untuk tugas kompleks multi-langkah. Penggunaan | Referensi API | Coba online

Global

Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(1.000 token)

qwen3-max

Memiliki kemampuan yang sama dengan qwen3-max-2025-09-23.
Cache konteks memenuhi syarat untuk diskon

Stable

Hanya non-thinking

262.144

258.048

-

65.536

Harga bertingkat, lihat deskripsi di bawah tabel.

Tidak ada

qwen3-max-2025-09-23

Snapshot

Hanya non-thinking

qwen3-max-preview

Cache konteks tersedia dengan diskon.

Preview

Thinking

81.920

32.768

Non-thinking

-

65.536

Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Token input per permintaan

Harga input (Juta token)

Harga output (Juta token)

Rantai-pikiran + Jawaban

0 < Token ≤ 32K

$1,2

$6

32K < Token ≤ 128K

$2,4

$12

128K < Token ≤ 252K

$3

$15

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maksimum

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(1.000 token)

qwen3-max

Memiliki kemampuan yang sama dengan qwen3-max-2025-09-23.
Pemanggilan batch: Setengah harga

Stable

Hanya non-thinking

262.144

258.048

-

65.536

Harga bertingkat, lihat deskripsi di bawah tabel.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen3-max-2025-09-23

Snapshot

Hanya non-thinking

qwen3-max-preview

Preview

Thinking

81.920

32.768

Non-thinking

-

65.536

Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Token input per permintaan

Harga input (Juta token)

qwen3-max dan qwen3-max-preview mendukung cache konteks.

Harga output (Juta token)

0 < Token ≤ 32K

$1,2

$6

32K < Token ≤ 128K

$2,4

$12

128K < Token ≤ 252K

$3

$15

Model lainnya

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen-max

Memiliki kemampuan yang sama dengan qwen-max-2025-01-25.

Stable

32.768

30.720

8.192

$1,6

Diskon 50% untuk pemanggilan batch.

$6,4

Diskon 50% untuk pemanggilan batch.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-max-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.

Latest

$1,6

$6,4

qwen-max-2025-01-25

Juga dikenal sebagai qwen-max-0125, Qwen2.5-Max

Snapshot

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maks

Biaya input

Biaya output

(Token)

(1.000 token)

qwen3-max

Memiliki kemampuan yang sama dengan qwen3-max-2025-09-23.
Pemanggilan batch tersedia dengan diskon 50%.

Stable

Hanya non-thinking

262.144

258.048

-

65.536

Harga bertingkat, lihat deskripsi di bawah tabel.

qwen3-max-2025-09-23

Snapshot

Hanya non-thinking

qwen3-max-preview

Preview

Thinking

81.920

32.768

Non-thinking

-

65.536

Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Model

Token input per permintaan

Harga input (Juta token)

Harga output (Juta token)

Rantai-pikiran + Jawaban

qwen3-max

Pemanggilan batch dengan diskon 50%
Cache konteks memenuhi syarat untuk diskon.

0 < Token ≤ 32K

$0,459

$1,836

32K < Token ≤ 128K

$0,918

$3,672

128K < Token ≤ 252K

$1,377

$5,508

qwen3-max-2025-09-23

0 < Token ≤ 32K

$0,861

$3,441

32K < Token ≤ 128K

$1,434

$5,735

128K < Token ≤ 252K

$2,151

$8,602

qwen3-max-preview

cache konteks memenuhi syarat untuk diskon.

0 < Token ≤ 32K

$0,861

$3.441

32K < Token ≤ 128K

$1,434

$5,735

128K < Token ≤ 252K

$2,151

$8,602

Model lainnya

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

(Token)

(Juta token)

qwen-max

Memiliki kemampuan yang sama dengan qwen-max-2024-09-19.

Stable

32.768

30.720

8.192

$0,345

$1,377

qwen-max-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.

Latest

131.072

129.024

qwen-max-2025-01-25

Juga dikenal sebagai qwen-max-0125, Qwen2.5-Max

Snapshot

qwen-max-2024-09-19

Juga dikenal sebagai qwen-max-0919.

32.768

30.720

$2,868

$8,602

Mode thinking dari model qwen3-max-preview secara signifikan meningkatkan kemampuan inferensinya secara keseluruhan, terutama untuk pemrograman agen, penalaran akal sehat, dan tugas-tugas yang berkaitan dengan matematika, sains, serta pengetahuan umum.

Qwen-Plus

Model yang menyeimbangkan performa inferensi, biaya, dan kecepatan antara Qwen-Max dan Qwen-Flash, cocok untuk tugas yang cukup kompleks. Penggunaan | Referensi API | Coba online | Pemikiran mendalam

Global

Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Model

Versi

Jendela konteks

Input maks

Output maksimum

Biaya input

Biaya output

(Token)

(Juta token)

qwen-plus

Memiliki kemampuan yang sama dengan qwen-plus-2025-07-28.
Bagian dari seri Qwen3.

Stable

1.000.000

Mode thinking

995.904

Non-Thinking Mode

997.952

32.768

Rantai-pikiran maks: 81.920

Harga bertingkat, lihat deskripsi di bawah tabel.

qwen-plus-2025-12-01

Bagian dari seri Qwen3.

Snapshot

Mode Berpikir

995.904

Mode non-thinking

997.952

qwen-plus-2025-09-11

Bagian dari seri Qwen3.

qwen-plus-2025-07-28

Bagian dari seri Qwen3.

Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-plus mendukung cache konteks.

Token masukan per permintaan

Harga input (Juta token)

Mode

Harga output (Juta token)

0 < Token ≤ 256K

$0,4

Mode non-thinking

$1,2

Mode thinking

$4

256K < Token ≤ 1M

$1,2

Mode non-thinking

$3,6

Mode thinking

$12

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen-plus

Memiliki kemampuan yang sama dengan qwen-plus-2025-07-28.
Bagian dari seri Qwen3.

Stable

1.000.000

Mode thinking

995.904

Non-Thinking Mode

997.952

32.768

Rantai-pikiran maks: 81.920

Harga bertingkat, lihat deskripsi di bawah tabel.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-plus-latest

Memiliki kemampuan yang sama dengan qwen-plus-2025-12-01.
Bagian dari seri Qwen3.

Latest

Mode berpikir

995.904

Mode tanpa berpikir

997.952

qwen-plus-2025-12-01

Bagian dari seri Qwen3.

Snapshot

Mode thinking

995.904

Non-thinking mode

997.952

qwen-plus-2025-09-11

Bagian dari seri Qwen3.

qwen-plus-2025-07-28

Juga dikenal sebagai qwen-plus-0728.
Bagian dari seri Qwen3.

qwen-plus-2025-07-14

Juga dikenal sebagai qwen-plus-0714.
Bagian dari seri Qwen3.

131.072

Mode thinking

98.304

Non-thinking mode

129.024

16.384

Rantai-pikiran maks: 38.912

$0,4

Mode thinking

$4

Mode non-thinking

$1,2

qwen-plus-2025-04-28

Juga dikenal sebagai qwen-plus-0428.
Bagian dari seri Qwen3.

qwen-plus-2025-01-25

Juga dikenal sebagai qwen-plus-0125.

129.024

8.192

$1,2

qwen-plus, qwen-plus-latest, qwen-plus-2025-12-01, qwen-plus-2025-09-11, dan qwen-plus-2025-07-28 menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Input tokens per request

Harga input (Juta token)

Mode

Harga output (Juta token)

0 < Token ≤ 256K

$0,4

Mode non-thinking

$1,2

Mode thinking

$4

256K < Token ≤ 1M

$1,2

Mode non-thinking

$3,6

Mode thinking

$12

AS

Dalam mode penyebaran AS, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dibatasi hanya untuk Amerika Serikat.

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen-plus-us

Memiliki kemampuan yang sama dengan qwen-plus-2025-12-01-us.
Bagian dari seri Qwen3.

Stable

1.000.000

Mode Berpikir

995.904

Mode non-thinking

997.952

32.768

Rantai-pikiran maks: 81.920

Harga bertingkat, lihat deskripsi di bawah tabel.

Tidak ada

qwen-plus-2025-12-01-us

Bagian dari seri Qwen3.

Snapshot

Mode berpikir

995.904

Non-thinking mode

997.952

Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-plus-us mendukung cache konteks.

Token input per permintaan

Harga input (Juta token)

Mode

Harga output (Juta token)

0 < Token ≤ 256K

$0,4

Mode non-thinking

$1,2

Mode Berpikir

$4

256K < Token ≤ 1M

$1,2

Mode non-thinking

$3,6

Mode thinking

$12

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

(Token)

(Juta token)

qwen-plus

Memiliki kemampuan yang sama dengan qwen-plus-2025-07-28.
Bagian dari seri Qwen3.

Stable

1.000.000

Mode thinking

995.904

Mode Tanpa Berpikir

997.952

32.768

Rantai-pikiran maks: 81.920

Harga bertingkat, lihat deskripsi di bawah tabel.

qwen-plus-latest

Memiliki kemampuan yang sama dengan qwen-plus-2025-12-01.
Bagian dari seri Qwen3.

Latest

Mode berpikir

995.904

Mode Tanpa Berpikir

997.952

qwen-plus-2025-12-01

Bagian dari seri Qwen3.

Snapshot

Mode thinking

995.904

Mode Tanpa Berpikir

997.952

qwen-plus-2025-09-11

Bagian dari seri Qwen3.

qwen-plus-2025-07-28

Juga dikenal sebagai qwen-plus-0728.
Bagian dari seri Qwen3.

qwen-plus-2025-07-14

Juga dikenal sebagai qwen-plus-0714.
Bagian dari seri Qwen3.

131.072

Mode thinking

98.304

Non-thinking Mode

129.024

16.384

Rantai-pikiran maks: 38.912

$0,115

Mode berpikir

$1,147

Mode tanpa berpikir

$0,287

qwen-plus-2025-04-28

Juga dikenal sebagai qwen-plus-0428.
Bagian dari seri Qwen3.

qwen-plus, qwen-plus-latest, qwen-plus-2025-12-01, qwen-plus-2025-09-11, dan qwen-plus-2025-07-28 menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Token input per permintaan

Harga input (Juta token)

Mode

Harga output (Juta token)

0 < Token ≤ 128K

$0,115

Mode non-thinking

$0,287

Mode thinking

$1,147

128K < Token ≤ 256K

$0,345

Mode non-thinking

$2,868

Mode Berpikir

$3.441

256K < Token ≤ 1M

$0,689

Mode non-thinking

$6,881

Mode thinking

$9,175

Model-model ini mendukung mode thinking dan non-thinking. Anda dapat beralih antar mode menggunakan parameter enable_thinking. Selain itu, kemampuan model-model ini telah ditingkatkan secara signifikan:

  1. Kemampuan inferensi: Dalam evaluasi untuk matematika, kode, dan penalaran logis, model-model ini secara signifikan melampaui QwQ dan model non-thinking dengan ukuran serupa, mencapai tingkat teratas di industri untuk skalanya.

  2. Kemampuan preferensi manusia: Kemampuan seperti penulisan kreatif, asumsi peran, percakapan multi-putaran, dan pemahaman instruksi telah ditingkatkan secara besar-besaran. Kemampuan umumnya secara signifikan melebihi model dengan ukuran serupa.

  3. Kemampuan agen: Model-model ini mencapai performa terdepan di industri baik dalam mode thinking maupun non-thinking, memungkinkan pemanggilan alat yang presisi.

  4. Kemampuan multibahasa: Mendukung lebih dari 100 bahasa dan dialek, dengan peningkatan signifikan dalam terjemahan multibahasa, pemahaman instruksi, dan penalaran akal sehat.

  5. Format balasan: Versi ini memperbaiki masalah format balasan dari versi sebelumnya, seperti format Markdown abnormal, pemotongan di tengah, dan output boxed yang salah.

Untuk model-model ini, jika tidak ada proses berpikir yang dihasilkan saat mode thinking diaktifkan, Anda akan dikenakan harga mode non-thinking.

Model lainnya

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

(Token)

(Juta token)

qwen-plus-2025-01-25

Juga dikenal sebagai qwen-plus-0125.

Snapshot

131.072

129.024

8.192

$0,115

$0,287

qwen-plus-2025-01-12

Juga dikenal sebagai qwen-plus-0112.

qwen-plus-2024-12-20

Juga dikenal sebagai qwen-plus-1220.

qwen-plus-2024-11-27

Juga dikenal sebagai qwen-plus-1127.

qwen-plus-2024-11-25

Juga dikenal sebagai qwen-plus-1125.

qwen-plus-2024-09-19

Juga dikenal sebagai qwen-plus-0919.

qwen-plus-2024-08-06

Juga dikenal sebagai qwen-plus-0806.

128.000

$0,574

$1,721

Qwen-Flash

Model tercepat dan paling hemat biaya dalam seri Qwen, cocok untuk tugas sederhana. Qwen-Flash menggunakan model harga bertingkat fleksibel yang lebih hemat biaya daripada Qwen-Turbo. Penggunaan | Referensi API | Coba online | Mode thinking

Global

Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Model

Versi

Mode

Jendela konteks

Input maks

Max chain-of-thought

Output maks

Biaya input

Biaya output

Chain-of-thought + Output

(Token)

(1.000 token)

qwen-flash

Memiliki kemampuan yang sama dengan qwen-flash-2025-07-28.
Bagian dari seri Qwen3.

Stable

Thinking

1.000.000

995.904

81.920

32.768

Harga bertingkat, lihat deskripsi di bawah tabel.

Non-thinking

997.952

-

qwen-flash-2025-07-28

Bagian dari seri Qwen3.

Snapshot

Thinking

995.904

81.920

Non-thinking

997.952

-

Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-flash mendukung cache konteks.

Token input per permintaan

Harga input (Juta token)

Harga output (Juta token)

0 < Token ≤ 256K

$0,05

$0,4

256K < Token ≤ 1M

$0,25

$2

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maks

Biaya input

Biaya output

Rantai-pikiran + Output

Kuota gratis

(Catatan)

(Token)

(1.000 token)

qwen-flash

Memiliki kemampuan yang sama dengan qwen-flash-2025-07-28.
Bagian dari seri Qwen3.
Pemanggilan batch dengan diskon 50%

Stable

Thinking

1.000.000

995.904

81.920

32.768

Harga bertingkat, lihat deskripsi di bawah tabel.

1 juta token masing-masing.

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

Non-thinking

997.952

-

qwen-flash-2025-07-28

Bagian dari seri Qwen3.

Snapshot

Thinking

995.904

81.920

Non-thinking

997.952

-

Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-flash mendukung cache konteks dan pemanggilan batch.

Token masukan per permintaan

Harga input (Juta token)

Harga output (Juta token)

0 < Token ≤ 256K

$0,05

$0,4

256K < Token ≤ 1M

$0,25

$2

AS

Dalam mode penyebaran AS, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dibatasi hanya untuk Amerika Serikat.

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maks

Biaya input

Biaya output

Rantai-pikiran + Output

Kuota gratis

(Catatan)

(Token)

(1.000 token)

qwen-flash-us

Memiliki kemampuan yang sama dengan qwen-flash-2025-07-28-us.
Bagian dari seri Qwen3.

Stable

Thinking

1.000.000

995.904

81.920

32.768

Harga bertingkat, lihat deskripsi di bawah tabel.

Tidak ada

Non-thinking

997.952

-

qwen-flash-2025-07-28-us

Bagian dari seri Qwen3.

Snapshot

Thinking

995.904

81.920

Non-thinking

997.952

-

Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Input tokens per request

Harga input (Juta token)

Harga output (Juta token)

0 < Token ≤ 256K

$0,05

$0,4

256K < Token ≤ 1M

$0,25

$2

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maks

Biaya input

Biaya output

Rantai-pikiran + Output

(Token)

(1.000 token)

qwen-flash

Memiliki kemampuan yang sama dengan qwen-flash-2025-07-28.
Bagian dari seri Qwen3.

Stable

Thinking

1.000.000

995.904

81.920

32.768

Harga bertingkat, lihat deskripsi di bawah tabel.

Non-thinking

997.952

-

qwen-flash-2025-07-28

Bagian dari seri Qwen3.

Snapshot

Thinking

995.904

81.920

Non-thinking

997.952

-

Model-model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. qwen-flash mendukung cache konteks.

Token input per permintaan

Harga input (Juta token)

Harga output (Juta token)

0 < Token ≤ 128K

$0,022

$0,216

128K < Token ≤ 256K

$0,087

$0,861

256K < Token ≤ 1M

$0,173

$1,721

Qwen-Turbo

Qwen-Turbo tidak lagi diperbarui. Kami merekomendasikan menggunakan Qwen-Flash sebagai gantinya. Qwen-Flash menggunakan model harga bertingkat yang lebih hemat biaya dan fleksibel. Penggunaan | Referensi API | Coba online | Pemikiran mendalam

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen-turbo

Memiliki kemampuan yang sama dengan qwen-turbo-2025-04-28.
Bagian dari seri Qwen3.

Stable

Mode berpikir

131.072

Non-thinking mode

1.000.000

Mode thinking

98.304

Non-thinking mode

1.000.000

16.384

Rantai-pikiran maks: 38.912

$0,05

Diskon 50% untuk pemanggilan batch.

Mode thinking: $0,5

Mode non-thinking: $0,2

Diskon 50% untuk pemanggilan batch.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-turbo-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.
Bagian dari seri Qwen3.

Latest

$0,05

Mode thinking: $0,5

Mode non-thinking: $0,2

qwen-turbo-2025-04-28

Juga dikenal sebagai qwen-turbo-0428.
Bagian dari seri Qwen3.

Snapshot

qwen-turbo-2024-11-01

Juga dikenal sebagai qwen-turbo-1101.

1.000.000

1.000.000

8.192

$0,2

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Jendela konteks

Input maks

Output Maksimum

Biaya input

Biaya output

(Token)

(Juta token)

qwen-turbo

Memiliki kemampuan yang sama dengan qwen-turbo-2025-04-28.
Bagian dari seri Qwen3.

Stable

Mode Berpikir

131.072

Non-Thinking Mode

1.000.000

Mode berpikir

98.304

Mode tanpa berpikir

1.000.000

16.384

Rantai-pikiran maks: 38.912

$0,044

Mode berpikir

$0,431

Mode tanpa pemikiran

$0,087

qwen-turbo-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.
Bagian dari seri Qwen3.

Latest

qwen-turbo-2025-07-15

Juga dikenal sebagai qwen-turbo-0715.
Bagian dari seri Qwen3.

Snapshot

qwen-turbo-2025-04-28

Juga dikenal sebagai qwen-turbo-0428.
Bagian dari seri Qwen3.

QwQ

Model inferensi QwQ dilatih berdasarkan model Qwen2.5 dan menggunakan Pembelajaran Penguatan untuk secara signifikan meningkatkan kemampuan inferensinya. Metrik inti model ini untuk matematika dan kode (seperti AIME 24/25 dan LiveCodeBench) serta beberapa metrik umum (seperti IFEval dan LiveBench) setara dengan DeepSeek-R1 versi lengkap. Penggunaan

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Versi

Jendela konteks

Input maks

Rantai-pikiran maks

Respons maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwq-plus

Stable

131.072

98.304

32.768

8.192

$0,8

$2,4

1 juta token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Jendela konteks

Input maks

Maximum Chain-of-Thought

Respons maks

Biaya input

Biaya output

(Token)

(Juta token)

qwq-plus

Memiliki kemampuan yang sama dengan qwq-plus-2025-03-05.

Stable

131.072

98.304

32.768

8.192

$0,230

$0,574

qwq-plus-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.

Latest

qwq-plus-2025-03-05

Juga dikenal sebagai qwq-plus-0305.

Snapshot

Qwen-Long

Model ini memiliki jendela konteks terpanjang dalam seri Qwen, menawarkan keseimbangan antara kemampuan dan biaya. Cocok untuk tugas seperti analisis teks panjang, ekstraksi informasi, ringkasan, klasifikasi, dan pelabelan. Penggunaan | Coba online

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

(Token)

(Juta token)

qwen-long-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.

Stable

10.000.000

10.000.000

32.768

$0,072

$0,287

qwen-long-2025-01-25

Juga dikenal sebagai qwen-long-0125.

Snapshot

Qwen-Omni

Model Qwen-Omni dapat menerima kombinasi input dalam berbagai modalitas seperti teks, gambar, audio, dan video, serta menghasilkan balasan dalam format teks atau ucapan. Model ini menawarkan berbagai suara ekspresif yang sangat mirip manusia dan mendukung output ucapan dalam berbagai bahasa dan dialek. Model ini dapat digunakan dalam skenario seperti pengenalan visual, analisis emosi, dan pelatihan edukatif dalam obrolan audio dan video. Penggunaan | Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maks

Kuota gratis

(Catatan)

(Token)

qwen3-omni-flash

Memiliki kemampuan yang sama dengan qwen3-omni-flash-2025-12-01.

Stable

Mode thinking

65.536

16.384

32.768

16.384

1 juta token masing-masing (tanpa memandang modalitas)

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

Mode non-thinking

49.152

-

qwen3-omni-flash-2025-12-01

Snapshot

Mode Berpikir

65.536

16.384

32.768

16.384

Mode non-thinking

49.152

-

qwen3-omni-flash-2025-09-15

Juga dikenal sebagai qwen3-omni-flash-0915.

Snapshot

Mode thinking

65.536

16.384

32.768

16.384

Mode non-thinking

49.152

-

Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output. Penagihan sama untuk mode thinking dan non-thinking. Output audio tidak didukung dalam mode thinking.

Input

Harga (Juta token)

Teks

$0,43

Audio

$3,81

Gambar/Video

$0,78

Output

Harga (Juta token)

Teks

$1,66 (untuk input teks saja)

$3,06 (untuk input yang mencakup gambar, video, atau audio)

Teks + Audio

Tidak berlaku dalam mode thinking.

$15,11 (audio)

Teks output tidak ditagih.

Model lainnya

Model

Versi

Jendela konteks

Input maks

Output maks

Kuota gratis

(Catatan)

(Token)

qwen-omni-turbo

Menawarkan kemampuan yang sama dengan qwen-omni-turbo-2025-03-26.

Stable

32.768

30.720

2.048

1 juta token masing-masing (tanpa memandang modalitas)

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-omni-turbo-latest

Selalu disinkronkan dengan versi snapshot terbaru.
Kemampuan identik

Latest

qwen-omni-turbo-2025-03-26

Juga dikenal sebagai qwen-omni-turbo-0326.

Snapshot

Setelah kuota gratis untuk model komersial habis, aturan penagihan berikut berlaku untuk input dan output:

Input

Harga (Juta token)

Teks

$0,07

Audio

$4,44

Gambar/Video

$0,21

Output

Harga (Juta token)

Teks

$0,27 (ketika input hanya berisi teks)

$0,63 (ketika input berisi gambar, video, atau audio)

Teks + Audio

$8,89 (audio)

Teks output tidak ditagih.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maks

Kuota gratis

(Catatan)

(Token)

qwen3-omni-flash

Menawarkan kemampuan yang sama dengan qwen3-omni-flash-2025-12-01.

Stable

Mode thinking

65.536

16.384

32.768

16.384

Tidak ada kuota gratis

Mode non-thinking

49.152

-

qwen3-omni-flash-2025-12-01

Snapshot

Mode Berpikir

65.536

16.384

32.768

16.384

Mode non-thinking

49.152

-

qwen3-omni-flash-2025-09-15

Juga dikenal sebagai qwen3-omni-flash-0915.

Snapshot

Mode thinking

65.536

16.384

32.768

16.384

Mode non-thinking

49.152

-

Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output. Penagihan sama untuk mode thinking dan non-thinking. Output audio tidak didukung dalam mode thinking.

Input

Harga (Juta token)

Teks

$0,258

Audio

$2,265

Gambar/Video

$0,473

Output

Harga (Juta token)

Teks

$0,989 (jika input hanya teks)

$1,821 (jika input mencakup gambar, video, atau audio)

Teks + Audio

Tidak berlaku dalam mode thinking.

$8,974 (audio)

Teks output tidak ditagih.

Model lainnya

Model

Versi

Jendela konteks

Input maks

Output maks

Kuota gratis

(Catatan)

(Token)

qwen-omni-turbo

Menyediakan kemampuan yang sama dengan qwen-omni-turbo-2025-03-26.

Stable

32.768

30.720

2.048

Tidak ada kuota gratis

qwen-omni-turbo-latest

Sesuai dengan versi snapshot terbaru.
Kemampuan identik

Latest

qwen-omni-turbo-2025-03-26

Juga dikenal sebagai qwen-omni-turbo-0326.

Snapshot

qwen-omni-turbo-2025-01-19

Juga dikenal sebagai qwen-omni-turbo-0119.

Aturan penagihan berikut berlaku untuk input dan output:

Input

Harga (Juta token)

Teks

$0,058

Audio

$3,584

Gambar/Video

$0,216

Output

Harga (Juta token)

Teks

$0,230 (jika input hanya berisi teks)

$0,646 (jika input berisi gambar, audio, atau video)

Teks + Audio

$7,168 (audio)

Bagian teks dari output tidak ditagih.

Contoh: Jika sebuah permintaan berisi 1.000 token teks dan 1.000 token gambar sebagai input, serta menghasilkan 1.000 token teks dan 1.000 token audio sebagai output, total biayanya adalah $0,000058 (input teks) + $0,000216 (input gambar) + $0,007168 (output audio) = $0,007442.

Kami merekomendasikan memulai dengan model Qwen3-Omni-Flash. Dibandingkan dengan Qwen-Omni-Turbo yang tidak lagi diperbarui, kemampuan model ini telah ditingkatkan secara signifikan:

  • Ini adalah model hibrida yang mendukung mode thinking dan non-thinking. Anda dapat beralih antar mode menggunakan parameter enable_thinking. Secara default, mode thinking dinonaktifkan.

  • Output audio tidak didukung dalam mode thinking. Dalam mode non-thinking, untuk output audio model ini:

    • Jumlah suara yang didukung untuk qwen3-omni-flash-2025-12-01 telah meningkat menjadi 49. Untuk qwen3-omni-flash-2025-09-15 dan qwen3-omni-flash, jumlah suara yang didukung telah meningkat menjadi 17. Sebagai perbandingan, Qwen-Omni-Turbo hanya mendukung 4 suara.

    • Jumlah bahasa yang didukung telah meningkat menjadi 10. Sebagai perbandingan, Qwen-Omni-Turbo hanya mendukung 2 bahasa.

Qwen-Omni-Realtime

Dibandingkan dengan Qwen-Omni, model ini mendukung input audio streaming dan memiliki fitur Voice Activity Detection (VAD) bawaan yang secara otomatis mendeteksi awal dan akhir ucapan pengguna. Penggunaan | Event klien | Server-side events

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Versi

Jendela konteks

Input maks

Output maksimum

Kuota gratis

(Catatan)

(Token)

qwen3-omni-flash-realtime

Menawarkan kemampuan yang sama dengan qwen3-omni-flash-realtime-2025-12-01.

Stable

65.536

49.152

16.384

1 juta token masing-masing (tanpa memandang modalitas).

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen3-omni-flash-realtime-2025-12-01

Snapshot

qwen3-omni-flash-realtime-2025-09-15

Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:

Input

Harga (Juta token)

Teks

$0,52

Audio

$4,57

Gambar

$0,94

Output

Harga (Juta token)

Teks

$1,99 (untuk input teks saja)

$3,67 (untuk input dengan gambar atau audio)

Teks + Audio

$18,13 (untuk komponen audio)

Komponen teks dari output tidak ditagih.

Model lainnya

Model

Versi

Jendela konteks

Input maks

Output maks

Kuota gratis

(Catatan)

(Token)

qwen-omni-turbo-realtime

Setara dengan qwen-omni-turbo-realtime-2025-05-08.

Stable

32.768

30.720

2.048

1 juta token masing-masing, tanpa memandang modalitas.

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-omni-turbo-realtime-latest

Selalu setara dengan versi snapshot terbaru.

Latest

qwen-omni-turbo-realtime-2025-05-08

Snapshot

Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:

Input

Harga (Juta token)

Teks

$0,270

Audio

$4,440

Gambar

$0,840

Output

Harga (Juta token)

Teks

$1,070 (jika input hanya teks)

$2,520 (jika input mencakup gambar atau audio)

Teks + Audio

$8,890 (untuk komponen audio)

Komponen teks tidak ditagih.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Jendela konteks

Input maks

Keluaran Maksimum

Kuota gratis

(Catatan)

(Token)

qwen3-omni-flash-realtime

Model ini memiliki kemampuan yang sama dengan qwen3-omni-flash-realtime-2025-12-01.

Stable

65.536

49.152

16.384

Tidak ada kuota gratis

qwen3-omni-flash-realtime-2025-12-01

Snapshot

qwen3-omni-flash-realtime-2025-09-15

Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:

Input

Harga (Juta token)

Teks

$0,315

Audio

$2,709

Gambar

$0,559

Output

Harga (Juta token)

Teks

$1,19 (untuk input teks saja)

$2,179 (untuk input yang berisi gambar atau audio)

Teks + Audio

$10,766 (audio)

Teks output tidak ditagih.

Model lainnya

Model

Versi

Jendela konteks

Input maks

Output maks

Kuota gratis

(Catatan)

(Token)

qwen-omni-turbo-realtime

Menawarkan kemampuan yang setara dengan qwen-omni-turbo-2025-05-08.

Stable

32.768

30.720

2.048

Tidak ada kuota gratis

qwen-omni-turbo-realtime-latest

Selalu menawarkan kemampuan yang setara dengan versi snapshot terbaru.

Latest

qwen-omni-turbo-realtime-2025-05-08

Snapshot

Aturan penagihan berikut berlaku untuk input dan output:

Input

Harga (Juta token)

Teks

$0,230

Audio

$3,584

Gambar

$0,861

Output

Harga (Juta token)

Teks

$0,918 (ketika input hanya berisi teks)

$2,581 (ketika input berisi gambar atau audio)

Teks + Audio

$7,168 (untuk audio)

Bagian teks tidak ditagih.

Kami merekomendasikan memulai dengan model Qwen3-Omni-Flash-Realtime. Dibandingkan dengan Qwen-Omni-Turbo-Realtime yang tidak lagi diperbarui, kemampuan model ini telah ditingkatkan secara signifikan. Untuk output audio model ini:

  • Jumlah suara yang didukung untuk qwen3-omni-flash-realtime-2025-12-01 telah meningkat menjadi 49. Untuk qwen3-omni-flash-realtime-2025-09-15 dan qwen3-omni-realtime-flash, jumlah suara yang didukung telah meningkat menjadi 17. Sebagai perbandingan, Qwen-Omni-Turbo-Realtime hanya mendukung 4 suara.

  • Jumlah bahasa yang didukung telah meningkat menjadi 10. Sebagai perbandingan, Qwen-Omni-Turbo-Realtime hanya mendukung 2 bahasa.

QVQ

QVQ adalah model penalaran visual yang mendukung input visual dan output rantai-pikiran. Model ini menunjukkan kemampuan yang ditingkatkan dalam matematika, pemrograman, analisis visual, kreasi, dan tugas umum lainnya. Penggunaan | Coba online

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Versi

Jendela konteks

Input maks

Rantai-pikiran maks

Respons Maksimum

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qvq-max

Memiliki kemampuan yang sama dengan qvq-max-2025-03-25.

Stable

131.072

106.496

Maks 16.384 token per gambar.

16.384

8.192

$1,2

$4,8

1 juta token per model

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qvq-max-latest

Memiliki kemampuan yang sama dengan versi snapshot terbaru.

Latest

qvq-max-2025-03-25

Juga dikenal sebagai qvq-max-0325.

Snapshot

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Jendela konteks

Input maks

Rantai-pikiran maks

Respons Maksimum

Biaya input

Biaya Keluaran

(Token)

(Juta token)

qvq-max

Model ini menawarkan kemampuan penalaran visual dan pemahaman instruksi yang lebih unggul dibandingkan qvq-plus, serta dioptimalkan untuk menangani tugas kompleks.
Model ini saat ini memiliki kemampuan yang setara dengan qvq-max-2025-03-25.

Stable

131.072

106.496

Maksimum 16.384 token per gambar.

16.384

8.192

$1,147

$4,588

qvq-max-latest

Model ini selalu memiliki kemampuan yang setara dengan versi snapshot terbarunya.

Latest

qvq-max-2025-05-15

Juga dikenal sebagai qvq-max-0515.

Snapshot

qvq-max-2025-03-25

Juga dikenal sebagai qvq-max-0325.

qvq-plus

Model ini saat ini memiliki kemampuan yang setara dengan qvq-plus-2025-05-15.

Stable

$0,287

$0,717

qvq-plus-latest

Model ini selalu memiliki kemampuan yang setara dengan versi snapshot terbarunya.

Latest

qvq-plus-2025-05-15

Juga dikenal sebagai qvq-plus-0515.

Snapshot

Qwen-VL

Qwen-VL adalah model generasi teks dengan kemampuan pemahaman visual (gambar). Model ini dapat melakukan OCR, ringkasan, dan penalaran. Misalnya, model ini dapat mengekstraksi atribut dari foto produk atau menyelesaikan soal berdasarkan diagram dalam latihan.Penggunaan | Referensi API | Coba online

Model Qwen-VL ditagih berdasarkan jumlah total token input dan output. Untuk informasi lebih lanjut tentang aturan perhitungan token gambar, lihat Pemahaman visual.

Global

Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia), dan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran Maksimum

Output maks

Biaya input

Biaya output

Rantai-pikiran dan output

(Token)

(Juta token)

qwen3-vl-plus

Menyediakan kemampuan yang sama dengan qwen3-vl-plus-2025-09-23

Stable

Thinking

262.144

258.048

Maks 16.384 per gambar

81.920

32.768

Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat deskripsi di bawah tabel.

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-plus-2025-09-23

Snapshot

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-flash

Menyediakan kemampuan yang sama dengan qwen3-vl-flash-2025-10-15

Stable

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-flash-2025-10-15

Snapshot

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input untuk setiap permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.

Seri qwen3-vl-plus

Token masukan per permintaan

Harga input (per juta token)

Harga output (per juta token)

0 < Token ≤ 32K

$0,2

$1,6

> 32K hingga 128K

$0,3

$2,4

128 KB < Token ≤ 256 KB

$0,6

$4,8

Seri qwen3-vl-flash

Token input per permintaan

Harga input (per juta token)

Harga output (per juta token)

0 < token ≤ 32K

$0,05

$0,4

32K < token ≤ 128K

$0,075

$0,6

128K < token ≤ 256K

$0,12

$0,96

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura, dan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maks

Biaya input

Biaya output

Rantai-pikiran dan output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen3-vl-plus

Secara fungsional setara dengan qwen3-vl-plus-2025-09-23

Stable

Thinking

262.144

258.048

Maks 16.384 per gambar

81.920

32.768

Harga bertingkat berlaku. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel ini.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-plus-2025-12-19

Snapshot

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-plus-2025-09-23

Snapshot

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-flash

Secara fungsional setara dengan qwen3-vl-flash-2025-10-15

Stable

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-flash-2025-10-15

Snapshot

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input untuk setiap permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.

Seri qwen3-vl-plus

Ukuran Permintaan (token)

Harga Input (per 1 juta token)

Harga Output (per 1 juta token)

0 < Token ≤ 32K

$0,2

$1,6

32K < Token ≤ 128K

$0,3

$2,4

128K < Token ≤ 256K

$0,6

$4,8

Seri qwen3-vl-flash

Token input per permintaan

Harga input (per juta token)

Harga output (per juta token)

0 < Token ≤ 32 KB

$0,05

$0,4

32 K < Token ≤ 128 K

$0,075

$0,6

128 K < Token ≤ 256 K

$0,12

$0,96

Model lainnya

Qwen-VL-Max

Qwen-VL-Max menawarkan performa yang lebih baik daripada Qwen-VL-Plus. Model-model berikut semuanya merupakan bagian dari seri Qwen2.5-VL.

Model

Version

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen-vl-max

Model ini merupakan peningkatan dari qwen-vl-plus, dengan kemampuan penalaran visual dan pemahaman instruksi yang ditingkatkan untuk performa optimal pada tugas-tugas kompleks.
Saat ini menyediakan kemampuan yang sama dengan qwen-vl-max-2025-08-13.

Stable

131.072

129.024

Maksimum 16.384 per gambar

8.192

$0,8

Batch calls harganya separuh.

$3,2

Batch calls harganya separuh.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-vl-max-latest

Versi ini selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.

Latest

$0,8

$3,2

qwen-vl-max-2025-08-13

Juga dikenal sebagai qwen-vl-max-0813.
Versi ini menampilkan peningkatan komprehensif pada metrik pemahaman visual, dengan peningkatan signifikan di bidang seperti matematika, penalaran, pengenalan objek, dan pemrosesan multibahasa.

Snapshot

qwen-vl-max-2025-04-08

Juga dikenal sebagai qwen-vl-max-0408.
Sebagai bagian dari seri Qwen2.5-VL, model ini memperluas context window menjadi 128k token dan menawarkan peningkatan signifikan pada kemampuan matematika dan penalaran.
Qwen-VL-Plus

Model Qwen-VL-Plus menawarkan keseimbangan antara performa dan biaya. Model-model berikut semuanya merupakan bagian dari seri Qwen2.5-VL.

Model

Versi

Jendela konteks

Input maks

Output maksimum

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen-vl-plus

Saat ini menyediakan kemampuan yang sama dengan qwen-vl-plus-2025-08-15.

Stable

131.072

129.024

Maks 16.384 per gambar.

8.192

$0,21

Pemanggilan batch separuh harga.

$0,63

Pemanggilan batch separuh harga.

Masing-masing menyediakan 1 juta token.

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-vl-plus-latest

Selalu menyediakan kemampuan yang sama dengan versi snapshot terbaru.

Latest

$0,21

$0,63

qwen-vl-plus-2025-08-15

Juga dikenal sebagai qwen-vl-plus-0815.
Menampilkan peningkatan signifikan dalam pengenalan objek, pelokalisasi, dan pemrosesan multibahasa.

Snapshot

qwen-vl-plus-2025-05-07

Juga dikenal sebagai qwen-vl-plus-0507.
Menampilkan pemahaman matematika, penalaran, dan konten video pengawasan yang jauh lebih baik.

qwen-vl-plus-2025-01-25

Juga dikenal sebagai qwen-vl-plus-0125.
Sebagai bagian dari seri Qwen2.5-VL, model ini memperluas jendela konteks hingga 128k token dan secara signifikan meningkatkan pemahaman gambar dan video.

AS

Dalam mode penyebaran AS, titik akhir dan penyimpanan data berlokasi di Wilayah AS (Virginia), dan sumber daya komputasi inferensi dibatasi hanya untuk Amerika Serikat.

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran Maksimum

Output maks

Biaya input

Biaya output

Termasuk rantai-pikiran dan output

(Token)

(Juta token)

qwen3-vl-flash-us

Menyediakan kemampuan yang sama dengan qwen3-vl-flash-2025-10-15-us

Stable

Thinking

258.048

Maks 16.384 per gambar

81.920

32.768

Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat deskripsi di bawah tabel.

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-flash-2025-10-15-us

Snapshot

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input untuk setiap permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking. Model qwen3-vl-flash-us mendukung cache konteks.

Token input per permintaan

Harga input (per juta token)

Harga output (per juta token)

0 < Token ≤ 32K

$0,05

$0,4

32K < Token ≤ 128K

$0,075

$0,6

128K < Token ≤ 256K

$0,12

$0,96

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Mode

Jendela konteks

Input maksimum

Rantai-pikiran maks

Output maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen3-vl-plus

Saat ini menawarkan kemampuan yang sama dengan qwen3-vl-plus-2025-09-23

Stable

Thinking

262.144

258.048

Maks 16.384 per gambar

81.920

32.768

Harga bertingkat berlaku. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel.

Tidak ada kuota gratis

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-plus-2025-12-19

Snapshot

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-plus-2025-09-23

Snapshot

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-flash

Saat ini menawarkan kemampuan yang sama dengan qwen3-vl-flash-2025-10-15

Stable

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

qwen3-vl-flash-2025-10-15

Snapshot

Thinking

258.048

Maks 16.384 per gambar

81.920

Non-thinking

260.096

Maks 16.384 per gambar

-

Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input untuk setiap permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.

Seri qwen3-vl-plus

Token input per permintaan

Harga input (Juta token)

Harga output (Juta token)

0 < token ≤ 32K

$0,143

$1,434

32K < token ≤ 128K

$0,215

$2,15

128K < token ≤ 256K

$0,43

$4,301

Seri qwen3-vl-flash

Token input per permintaan

Harga input (per juta token)

Harga output (per juta token)

0 < token ≤ 32K

$0,022

$0,215

32K < token ≤ 128K

$0,043

$0,43

128K < token ≤ 256K

$0,086

$0,859

Model lainnya

Seri Qwen-VL-Max
Model seperti qwen-vl-max-2025-01-25 dan yang lebih baru merupakan bagian dari seri Qwen2.5-VL.

Model

Versi

Jendela Konteks

Input Maks

Output Maks

Biaya Input

Biaya Output

(Token)

(Juta Token)

qwen-vl-max

Menawarkan kemampuan penalaran visual dan pemahaman instruksi yang lebih baik dibandingkan qwen-vl-plus, memberikan performa optimal untuk tugas yang lebih kompleks.
Menyediakan kemampuan yang sama dengan qwen-vl-max-2025-08-13.

Stable

131.072

129.024

Maks 16.384 per gambar.

8.192

$0,23

$0,574

qwen-vl-max-latest

Model ini selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.

Latest

qwen-vl-max-2025-08-13

Juga dikenal sebagai qwen-vl-max-0813.
Memberikan peningkatan komprehensif pada pemahaman visual, dengan peningkatan signifikan dalam matematika, penalaran, pengenalan objek, dan pemrosesan multibahasa.

Snapshot

qwen-vl-max-2025-04-08

Juga dikenal sebagai qwen-vl-max-0408.
Menambah kemampuan matematika dan penalaran.

$0,431

$1,291

qwen-vl-max-2025-04-02

Juga dikenal sebagai qwen-vl-max-0402.
Secara signifikan meningkatkan akurasi dalam menyelesaikan soal matematika kompleks.

qwen-vl-max-2025-01-25

Juga dikenal sebagai qwen-vl-max-0125.

Ditingkatkan ke seri Qwen2.5-VL. Versi ini memperluas jendela konteks hingga 128k token dan secara signifikan meningkatkan kemampuan pemahaman gambar dan video.

qwen-vl-max-2024-12-30

Juga dikenal sebagai qwen-vl-max-1230.

32.768

30.720

Maks 16.384 per gambar.

2.048

$0,431

$1,291

qwen-vl-max-2024-11-19

Juga dikenal sebagai qwen-vl-max-1119.

qwen-vl-max-2024-10-30

Juga dikenal sebagai qwen-vl-max-1030.

$2,868

qwen-vl-max-2024-08-09

Juga dikenal sebagai qwen-vl-max-0809.
Seri Qwen-VL-Plus
Model seperti qwen-vl-plus-2025-01-25 dan yang lebih baru merupakan bagian dari seri Qwen2.5-VL.

Model

Versi

Jendela Konteks

Input Maks

Output Maks

Biaya Input

Biaya Output

(Token)

(Juta token)

qwen-vl-plus

Menyediakan kemampuan yang sama dengan qwen-vl-plus-2025-08-15.

Stable

131.072

129.024

Maks 16.384 per gambar.

8.192

$0,115

$0,287

qwen-vl-plus-latest

Selalu menyediakan kemampuan yang sama dengan versi snapshot terbaru.

Latest

qwen-vl-plus-2025-08-15

Juga dikenal sebagai qwen-vl-plus-0815.
Memberikan peningkatan signifikan dalam pengenalan objek, pelokalisasi, dan pemrosesan multibahasa.

Snapshot

qwen-vl-plus-2025-07-10

Juga dikenal sebagai qwen-vl-plus-0710.
Memberikan pemahaman yang lebih baik terhadap konten video pengawasan.

32.768

30.720

Maks 16.384 per gambar.

$0,022

$0,216

qwen-vl-plus-2025-05-07

Juga dikenal sebagai qwen-vl-plus-0507.
Memberikan pemahaman matematika, penalaran, dan konten video pengawasan yang jauh lebih baik.

131.072

129.024

Maks 16.384 per gambar.

$0,216

$0,646

qwen-vl-plus-2025-01-25

Juga dikenal sebagai qwen-vl-plus-0125.

Ditingkatkan ke seri Qwen2.5-VL. Versi ini memperluas konteks hingga 128K dan secara signifikan meningkatkan pemahaman gambar dan video.

qwen-vl-plus-2025-01-02

Juga dikenal sebagai qwen-vl-plus-0102.

32.768

30.720

Maks 16.384 per gambar.

2.048

qwen-vl-plus-2024-08-09

Juga dikenal sebagai qwen-vl-plus-0809.

Qwen-OCR

Model Qwen-OCR dirancang khusus untuk ekstraksi teks. Dibandingkan dengan model Qwen-VL, model ini berfokus pada ekstraksi teks dari gambar dokumen, tabel, soal ujian, dan teks tulisan tangan. Model ini dapat mengenali berbagai bahasa, termasuk Inggris, Prancis, Jepang, Korea, Jerman, Rusia, dan Italia. Penggunaan | Referensi API | Coba online

Global

Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Model

Versi

Jendela konteks

Input maks

Output maks

Harga input

Harga output

(Token)

(Juta token)

qwen-vl-ocr

Menawarkan kemampuan yang sama dengan qwen-vl-ocr-2025-11-20.

Stable

34.096

30.000

Maks 30.000 per gambar.

4.096

$0,07

$0,16

qwen-vl-ocr-2025-11-20

Juga dikenal sebagai qwen-vl-ocr-1120.
Arsitektur Qwen3-VL secara signifikan meningkatkan penguraian dokumen dan pelokalisasi teks.

Snapshot

38.192

8.192

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Version

Context window

Max input

Max output

Input price

Output price

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen-vl-ocr

Stable

34.096

30.000

Maksimal 30.000 per gambar

4.096

$0,72

$0,72

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-vl-ocr-2025-11-20

Juga dikenal sebagai qwen-vl-ocr-1120.
Berdasarkan arsitektur Qwen3-VL, model ini secara signifikan meningkatkan kemampuan parsing dokumen dan lokalisasi teks.

Snapshot

38.192

8.192

$0,07

$0,16

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Version

Context window (tokens)

Max input (tokens)

Max output (tokens)

Unit price

Output Unit Price

Kuota gratis

(Catatan)

Tokens

Per 1 juta tokens

qwen-vl-ocr

Setara dengan qwen-vl-ocr-2025-08-28.

Stable

34.096

30.000

Maksimal 30.000 per gambar.

4.096

$0,717

$0,717

Tidak ada kuota gratis

qwen-vl-ocr-latest

Selalu setara dengan versi terbaru.

Latest

38.192

8.192

$0,043

$0,072

qwen-vl-ocr-2025-11-20

Juga dikenal sebagai qwen-vl-ocr-1120.
Model ini berbasis arsitektur Qwen3-VL dan memberikan peningkatan signifikan dalam penguraian dokumen dan lokalisasi teks.

Snapshot

qwen-vl-ocr-2025-08-28

Juga dikenal sebagai qwen-vl-ocr-0828.

34.096

4.096

$0,717

$0,717

qwen-vl-ocr-2025-04-13

Juga dikenal sebagai qwen-vl-ocr-0413.

qwen-vl-ocr-2024-10-28

Juga dikenal sebagai qwen-vl-ocr-1028.

Qwen-Math

Model Qwen-Math adalah model bahasa yang dirancang khusus untuk menyelesaikan soal matematika. Penggunaan | Referensi API | Coba online

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Jendela konteks

Input maksimum

Output maksimum

Biaya input

Biaya output

(Tokens)

(Juta token)

qwen-math-plus

Menyediakan kemampuan yang sama dengan qwen-math-plus-2024-09-19.

Stable

4.096

3.072

3.072

$0,574

$1,721

qwen-math-plus-latest

Selalu menyediakan kemampuan yang sama dengan versi snapshot terbaru.

Latest

qwen-math-plus-2024-09-19

Juga dikenal sebagai qwen-math-plus-0919.

Snapshot

qwen-math-plus-2024-08-16

Juga dikenal sebagai qwen-math-plus-0816.

qwen-math-turbo

Menyediakan kemampuan yang sama dengan qwen-math-turbo-2024-09-19.

Stable

$0,287

$0,861

qwen-math-turbo-latest

Selalu menyediakan kemampuan yang sama dengan versi snapshot terbaru.

Latest

qwen-math-turbo-2024-09-19

Juga dikenal sebagai qwen-math-turbo-0919.

Snapshot

Qwen-Coder

Ini adalah model kode Qwen. Seri Qwen3-Coder-Plus terbaru adalah model generasi kode berbasis Qwen3. Model ini memiliki kemampuan agen pemrograman yang kuat, unggul dalam pemanggilan alat dan interaksi lingkungan, serta dapat melakukan pemrograman otonom. Model ini memiliki kemampuan pengkodean dan tujuan umum yang sangat baik. Penggunaan | Referensi API | Coba online

Global

Dalam mode penyebaran global, titik akhir dan penyimpanan data berlokasi di Wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

(Token)

(Juta token)

qwen3-coder-plus

Saat ini merupakan alias untuk qwen3-coder-plus-2025-09-23.

Stable

1.000.000

997.952

65.536

Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat deskripsi di bawah tabel ini.

qwen3-coder-plus-2025-09-23

Snapshot

qwen3-coder-plus-2025-07-22

Snapshot

qwen3-coder-flash

Saat ini merupakan alias untuk qwen3-coder-flash-2025-07-28.

Stable

qwen3-coder-flash-2025-07-28

Snapshot

Model-model di atas menggunakan penagihan bertingkat berdasarkan token input per permintaan.

Seri qwen3-coder-plus

Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. qwen3-coder-plus mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga.

Token masukan per permintaan

Harga input (per juta token)

Harga output (per juta token)

0 < token ≤ 32K

$1

$5

32K < token ≤ 128K

$1,8

$9

128K < token ≤ 256K

$3

$15

256K < token ≤ 1M

$6

$60

Seri qwen3-coder-flash

Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. qwen3-coder-flash mendukung cache konteks. Teks input yang menghasilkan hit cache ditagih sebesar 20% dari harga.

Jumlah token input

Harga input (per 1 juta token)

Harga output (per 1 juta token)

0 < Token ≤ 32K

$0,3

$1,5

32K < Token ≤ 128K

$0,5

$2,5

128K < Token ≤ 256K

$0,8

$4

256K < Token ≤ 1M

$1,6

$9,6

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura, dan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen3-coder-plus

Kemampuan yang sama dengan qwen3-coder-plus-2025-09-23

Stable

1.000.000

997.952

65.536

Harga bertingkat. Lihat deskripsi di bawah tabel.

1 juta token input dan 1 juta token output

Masa berlaku: 90 hari setelah Anda mengaktifkan Model Studio

qwen3-coder-plus-2025-09-23

Snapshot

qwen3-coder-plus-2025-07-22

Snapshot

qwen3-coder-flash

Kemampuan yang sama dengan qwen3-coder-flash-2025-07-28

Stable

qwen3-coder-flash-2025-07-28

Snapshot

Model-model di atas menggunakan harga bertingkat berdasarkan token input per permintaan.

Seri qwen3-coder-plus

Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. qwen3-coder-plus mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga, dan teks input yang menghasilkan hit cache eksplisit ditagih sebesar 10% dari harga.

Ukuran Permintaan (Token Input)

Harga Input (per 1 Juta Token)

Harga Output (per 1 Juta Token)

0 < token ≤ 32K

$1

$5

32K < token ≤ 128K

$1,8

$9

128K < token ≤ 256K

$3

$15

256K < token ≤ 1M

$6

$60

Seri qwen3-coder-flash

Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. qwen3-coder-flash mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga, dan teks input yang menghasilkan hit cache eksplisit ditagih sebesar 10% dari harga.

Token masukan per permintaan

Harga input (per juta token)

Harga output (per juta token)

0 < token ≤ 32K

$0,3

$1,5

32K < token ≤ 128K

$0,5

$2,5

128K < token ≤ 256K

$0,8

$4

256K < token ≤ 1M

$1,6

$9,6

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

(Token)

(Juta token)

qwen3-coder-plus

Setara dengan qwen3-coder-plus-2025-09-23.

Stable

1.000.000

997.952

65.536

Harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah.

qwen3-coder-plus-2025-09-23

Snapshot

qwen3-coder-plus-2025-07-22

Snapshot

qwen3-coder-flash

Setara dengan qwen3-coder-flash-2025-07-28.

Stable

qwen3-coder-flash-2025-07-28

Snapshot

Model-model di atas menggunakan harga bertingkat berdasarkan token input per permintaan.

Seri qwen3-coder-plus

Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. qwen3-coder-plus mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga satuan, sedangkan teks input yang menghasilkan hit cache eksplisit ditagih sebesar 10% dari harga satuan.

Token masukan per permintaan

Harga input (per juta token)

Harga output (per juta token)

Hingga 32K

$0,574

$2,294

Lebih dari 32K hingga 128K

$0,861

3.441

Lebih dari 128K hingga 256K

$1,434

$5,735

Lebih dari 256K hingga 1M

$2,868

$28,671

Seri qwen3-coder-flash

Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. qwen3-coder-flash mendukung cache konteks. Teks input yang menghasilkan hit cache implisit ditagih sebesar 20% dari harga satuan, sedangkan teks input yang menghasilkan hit cache eksplisit ditagih sebesar 10% dari harga satuan.

Token input per permintaan

Harga input (per juta token)

Harga output (per juta token)

Hingga 32K

$0,144

$0,574

Lebih dari 32K hingga 128K

$0,216

$0,861

128K < Token ≤ 256K

$0,359

$1,434

Lebih dari 256K hingga 1M

$0,717

$3,584

Model lainnya

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

(Token)

(Juta token)

qwen-coder-plus

Menyediakan kemampuan yang sama dengan qwen-coder-plus-2024-11-06.

Stable

131.072

129.024

8.192

$0,502

$1,004

qwen-coder-plus-latest

Menyediakan kemampuan yang sama dengan versi snapshot terbaru qwen-coder-plus.

Latest

qwen-coder-plus-2024-11-06

Juga dikenal sebagai qwen-coder-plus-1106.

Snapshot

qwen-coder-turbo

Menyediakan kemampuan yang sama dengan qwen-coder-turbo-2024-09-19.

Stable

131.072

129.024

8.192

$0,287

$0,861

qwen-coder-turbo-latest

Menyediakan kemampuan yang sama dengan versi snapshot terbaru qwen-coder-turbo.

Latest

qwen-coder-turbo-2024-09-19

Juga dikenal sebagai qwen-coder-turbo-0919.

Snapshot

Qwen-MT

Model terjemahan besar unggulan ini, yang sepenuhnya ditingkatkan berdasarkan Qwen 3, mendukung terjemahan antara 92 bahasa, termasuk Tionghoa, Inggris, Jepang, Korea, Prancis, Spanyol, Jerman, Thailand, Indonesia, Vietnam, dan Arab. Performa dan kualitas terjemahan model ini telah ditingkatkan secara komprehensif. Model ini menyediakan kemampuan penyesuaian terminologi, retensi format, dan prompting berbasis domain yang lebih stabil, sehingga terjemahannya lebih akurat dan alami. Penggunaan

Global

Dalam mode penyebaran global, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah AS (Virginia). Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Model

Jendela konteks

Input Maksimum

Output maks

Biaya input

Biaya output

(Token)

(Juta token)

qwen-mt-plus

Bagian dari Qwen3-MT

16.384

8.192

8.192

$2,46

$7,37

qwen-mt-flash

Bagian dari Qwen3-MT

$0,16

$0,49

qwen-mt-lite

Bagian dari Qwen3-MT

$0,12

$0,36

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Jendela Konteks (token)

Input Maks (token)

Output Maks (token)

Biaya Input

Biaya Output

Kuota Gratis

Deskripsi aturan

Token

per 1 juta token

qwen-mt-plus

Bagian dari Qwen3-MT

16.384

8.192

8.192

$2,46

$7,37

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-mt-flash

Bagian dari Qwen3-MT

$0,16

$0,49

qwen-mt-lite

Bagian dari Qwen3-MT

$0,12

$0,36

qwen-mt-turbo

Bagian dari Qwen3-MT

$0,16

$0,49

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data keduanya berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Context window (tokens)

Max input (tokens)

Max output (tokens)

Input Cost

Output costs

Number of tokens

(Million tokens)

qwen-mt-plus

Bagian dari Qwen3-MT

16.384

8.192

8.192

$0,259

$0,775

qwen-mt-flash

Bagian dari Qwen3-MT

$0,101

$0,280

qwen-mt-lite

Bagian dari Qwen3-MT

$0,086

$0,229

qwen-mt-turbo

Bagian dari Qwen3-MT

$0,101

$0,280

Model penambangan data Qwen

Model penambangan data Qwen mengekstraksi informasi terstruktur dari dokumen untuk digunakan dalam anotasi data dan moderasi konten. Penggunaan | Referensi API

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.

Model

Jendela Konteks

Input Maks

Output Maks

Biaya Input

Biaya Output

Kuota Gratis

(Token)

(Juta token)

qwen-doc-turbo

262.144

253.952

32.768

$0,087

$0,144

Tidak ada kuota gratis

Model riset mendalam Qwen

Model riset mendalam Qwen memecah masalah kompleks, melakukan penalaran dan analisis menggunakan pencarian internet, serta menghasilkan laporan riset. Penggunaan | Referensi API

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.

Model

Jendela Konteks

Input Maks

Output Maks

Biaya Input

Biaya Output

(Token)

(1.000 token)

qwen-deep-research

1.000.000

997.952

32.768

$0,007742

$0,023367

Generasi teks - Qwen - Open source

  • Pada nama model, xxb menunjukkan ukuran parameter. Misalnya, qwen2-72b-instruct menunjukkan ukuran parameter sebesar 72 miliar (72B).

  • Model Studio mendukung pemanggilan versi open-source Qwen. Anda tidak perlu melakukan deployment model secara lokal. Untuk versi open-source, kami merekomendasikan penggunaan model Qwen3 dan Qwen2.5.

Qwen3

Model qwen3-next-80b-a3b-thinking, yang dirilis pada September 2025, hanya mendukung mode thinking. Model ini memiliki kemampuan mengikuti instruksi yang lebih baik dan memberikan ringkasan yang lebih ringkas dibandingkan qwen3-235b-a22b-thinking-2507.

Model qwen3-next-80b-a3b-instruct, yang dirilis pada September 2025, hanya mendukung mode non-thinking. Model ini memiliki peningkatan kemampuan pemahaman bahasa Mandarin, penalaran logis, dan generasi teks dibandingkan qwen3-235b-a22b-instruct-2507.

Model qwen3-235b-a22b-thinking-2507 dan qwen3-30b-a3b-thinking-2507, yang dirilis pada Juli 2025, hanya mendukung mode thinking. Keduanya merupakan versi peningkatan dari qwen3-235b-a22b (mode thinking) dan qwen3-30b-a3b (mode thinking).

Model qwen3-235b-a22b-instruct-2507 dan qwen3-30b-a3b-instruct-2507, yang dirilis pada Juli 2025, hanya mendukung mode non-thinking. Keduanya merupakan versi peningkatan dari qwen3-235b-a22b (mode non-thinking) dan qwen3-30b-a3b (mode non-thinking).

Model Qwen3, yang dirilis pada April 2025, mendukung kedua mode thinking dan non-thinking. Gunakan parameter enable_thinking untuk beralih antar mode. Model Qwen3 juga memiliki peningkatan kemampuan signifikan:

  1. Kemampuan penalaran: Dalam evaluasi matematika, kode, dan penalaran logis, model ini secara signifikan melampaui QwQ dan model non-thinking dengan ukuran yang sama, mencapai performa terbaik di industri sesuai skalanya.

  2. Penyelarasan preferensi manusia: Kemampuan dalam penulisan kreatif, role-playing, percakapan multi-putaran, dan mengikuti instruksi mengalami peningkatan besar. Kemampuan umum model ini secara signifikan melampaui model lain dengan ukuran yang sama.

  3. Kemampuan agen: Model ini mencapai performa terdepan di industri baik dalam mode thinking maupun non-thinking, serta dapat memanggil alat eksternal secara akurat.

  4. Kemampuan multibahasa: Model ini mendukung lebih dari 100 bahasa dan dialek. Terdapat peningkatan signifikan dalam terjemahan multibahasa, pemahaman instruksi, dan penalaran berbasis akal sehat.

    Bahasa yang didukung

    English

    Simplified Chinese

    Traditional Chinese

    French

    Spanish

    Arabic. Ditulis dalam aksara Arab dan merupakan bahasa resmi di banyak negara Arab.

    Russian. Ditulis dalam aksara Cyrillic dan merupakan bahasa resmi di Rusia serta beberapa negara lain.

    Portuguese. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Portugal, Brasil, serta negara berbahasa Portugis lainnya.

    German. Ditulis dalam aksara Latin dan merupakan bahasa resmi di negara-negara seperti Jerman dan Austria.

    Italian. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Italia, San Marino, serta sebagian Swiss.

    Dutch. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Belanda, sebagian Belgia (Flanders), serta Suriname.

    Danish. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Denmark.

    Irish. Ditulis dalam aksara Latin dan merupakan salah satu bahasa resmi di Irlandia.

    Welsh. Ditulis dalam aksara Latin, digunakan di Wales, dan merupakan salah satu bahasa resminya.

    Finnish. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Finlandia.

    Icelandic. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Islandia.

    Swedish. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Swedia.

    Norwegian Nynorsk. Ditulis dalam aksara Latin dan merupakan salah satu dari dua standar tertulis resmi bahasa Norwegia.

    Norwegian Bokmål. Ditulis dalam aksara Latin dan merupakan salah satu dari dua standar tertulis resmi bahasa Norwegia.

    Japanese. Ditulis dalam aksara Jepang dan merupakan bahasa resmi di Jepang.

    Korean. Ditulis dalam Hangul dan merupakan bahasa resmi di Korea Selatan serta Korea Utara.

    Vietnamese. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Vietnam.

    Thai. Ditulis dalam aksara Thailand dan merupakan bahasa resmi di Thailand.

    Indonesian. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Indonesia.

    Malay. Ditulis dalam aksara Latin dan merupakan bahasa utama di beberapa negara, termasuk Malaysia.

    Burmese. Ditulis dalam aksara Burma dan merupakan bahasa resmi di Myanmar.

    Tagalog. Ditulis dalam aksara Latin dan merupakan salah satu bahasa utama di Filipina.

    Khmer. Ditulis dalam aksara Khmer dan merupakan bahasa resmi di Kamboja.

    Lao. Ditulis dalam aksara Lao dan merupakan bahasa resmi di Laos.

    Hindi. Ditulis dalam aksara Devanagari dan merupakan salah satu bahasa resmi di India.

    Bengali. Ditulis dalam aksara Bengali dan merupakan bahasa resmi di Bangladesh serta negara bagian West Bengal di India.

    Urdu. Ditulis dalam aksara Arab, merupakan bahasa resmi di Pakistan, dan juga diakui secara resmi di India.

    Nepali. Ditulis dalam aksara Devanagari dan merupakan bahasa resmi di Nepal.

    Hebrew. Ditulis dalam aksara Ibrani dan merupakan bahasa resmi di Israel.

    Turkish. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Türkiye serta Siprus Utara.

    Persian. Ditulis dalam aksara Arab dan merupakan bahasa resmi di negara-negara seperti Iran dan Tajikistan.

    Polish. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Polandia.

    Ukrainian. Ditulis dalam aksara Cyrillic dan merupakan bahasa resmi di Ukraina.

    Czech. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Republik Ceko.

    Romanian. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Rumania serta Moldova.

    Bulgarian. Ditulis dalam aksara Cyrillic dan merupakan bahasa resmi di Bulgaria.

    Slovak. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Slovakia.

    Hungarian. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Hongaria.

    Slovenian. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Slovenia.

    Latvian. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Latvia.

    Estonian. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Estonia.

    Lithuanian. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Lituania.

    Belarusian. Ditulis dalam aksara Cyrillic dan merupakan salah satu bahasa resmi di Belarus.

    Greek. Ditulis dalam alfabet Yunani dan merupakan bahasa resmi di Yunani serta Siprus.

    Croatian. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Kroasia.

    Macedonian. Ditulis dalam aksara Cyrillic dan merupakan bahasa resmi di Makedonia Utara.

    Maltese. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Malta.

    Serbian. Ditulis dalam aksara Cyrillic dan merupakan bahasa resmi di Serbia.

    Bosnian. Ditulis dalam aksara Latin dan merupakan salah satu bahasa resmi di Bosnia dan Herzegovina.

    Georgian. Ditulis dalam aksara Georgia dan merupakan bahasa resmi di Georgia.

    Armenian. Ditulis dalam alfabet Armenia dan merupakan bahasa resmi di Armenia.

    North Azerbaijani. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Azerbaijan.

    Kazakh. Ditulis dalam aksara Cyrillic dan merupakan bahasa resmi di Kazakhstan.

    Northern Uzbek. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Uzbekistan.

    Tajik. Ditulis dalam aksara Cyrillic dan merupakan bahasa resmi di Tajikistan.

    Swahili. Ditulis dalam aksara Latin dan merupakan lingua franca atau bahasa resmi di banyak negara Afrika Timur.

    Afrikaans. Ditulis dalam aksara Latin, merupakan bahasa resmi di Afrika Selatan, dan juga digunakan di Namibia.

    Cantonese. Ditulis dalam karakter Tionghoa Tradisional dan merupakan bahasa utama di Provinsi Guangdong, Hong Kong, serta Makau.

    Luxembourgish. Ditulis dalam aksara Latin, merupakan bahasa resmi di Luksemburg, dan juga digunakan di sebagian Jerman.

    Limburgish. Ditulis dalam aksara Latin dan terutama digunakan di Belanda, Belgia, serta sebagian Jerman.

    Catalan. Ditulis dalam aksara Latin, merupakan bahasa resmi di Catalonia, dan juga digunakan di wilayah lain di Spanyol.

    Galician. Ditulis dalam aksara Latin dan merupakan bahasa resmi di wilayah Galicia, Spanyol.

    Asturian. Ditulis dalam aksara Latin dan terutama digunakan di wilayah Asturias, Spanyol.

    Basque. Ditulis dalam aksara Latin, merupakan bahasa resmi di Komunitas Otonom Basque, Spanyol, dan juga digunakan di wilayah lain Negara Basque di Spanyol serta Prancis.

    Occitan. Ditulis dalam aksara Latin dan terutama digunakan di Prancis Selatan.

    Venetian. Ditulis dalam aksara Latin dan terutama digunakan di wilayah Venesia, Italia.

    Sardinian. Ditulis dalam aksara Latin dan merupakan bahasa yang diakui secara resmi di pulau Sardinia, Italia.

    Sicilian. Ditulis dalam aksara Latin dan terutama digunakan di pulau Sisilia, Italia.

    Friulian. Ditulis dalam aksara Latin dan terutama digunakan di Friuli-Venezia Giulia, Italia.

    Lombard. Ditulis dalam aksara Latin dan terutama digunakan di wilayah Lombardia, Italia.

    Ligurian. Ditulis dalam aksara Latin dan terutama digunakan di wilayah Liguria, Italia.

    Faroese. Ditulis dalam aksara Latin dan merupakan bahasa resmi di Kepulauan Faroe.

    Tosk Albanian. Ditulis dalam aksara Latin dan merupakan dialek selatan bahasa Albania.

    Silesian. Ditulis dalam aksara Latin dan terutama digunakan di Polandia.

    Bashkir. Ditulis dalam aksara Cyrillic dan merupakan bahasa resmi di Bashkortostan, Rusia.

    Tatar. Ditulis dalam aksara Cyrillic dan merupakan bahasa resmi di Tatarstan, Rusia.

    Mesopotamian Arabic. Ditulis dalam aksara Arab dan terutama digunakan di Irak.

    Najdi Arabic. Ditulis dalam aksara Arab dan terutama digunakan di wilayah Najd, Arab Saudi.

    Egyptian Arabic. Ditulis dalam aksara Arab dan terutama digunakan di Mesir.

    Levantine Arabic. Ditulis dalam aksara Arab dan terutama digunakan di Suriah serta Lebanon.

    Ta'izzi-Adeni Arabic. Ditulis dalam aksara Arab dan terutama digunakan di Yaman serta wilayah Hadhramaut di Arab Saudi.

    Dari. Ditulis dalam aksara Arab dan merupakan salah satu bahasa resmi di Afghanistan.

    Tunisian Arabic. Ditulis dalam aksara Arab dan terutama digunakan di Tunisia.

    Moroccan Arabic. Ditulis dalam aksara Arab dan terutama digunakan di Maroko.

    Kabuverdianu. Ditulis dalam aksara Latin dan terutama digunakan di Tanjung Verde.

    Tok Pisin. Ditulis dalam aksara Latin dan merupakan lingua franca utama di Papua Nugini.

    Eastern Yiddish. Ditulis dalam aksara Ibrani dan terutama digunakan di komunitas Yahudi.

    Sindhi. Ditulis dalam aksara Arab dan merupakan bahasa resmi di provinsi Sindh, Pakistan.

    Sinhala. Ditulis dalam aksara Sinhala dan merupakan salah satu bahasa resmi di Sri Lanka.

    Telugu. Ditulis dalam aksara Telugu dan merupakan bahasa resmi di negara bagian Andhra Pradesh serta Telangana, India.

    Punjabi. Ditulis dalam aksara Gurmukhi dan merupakan bahasa resmi di negara bagian Punjab, India.

    Tamil. Ditulis dalam aksara Tamil dan merupakan bahasa resmi di negara bagian Tamil Nadu, India, serta di Sri Lanka.

    Gujarati. Ditulis dalam aksara Gujarati dan merupakan bahasa resmi di negara bagian Gujarat, India.

    Malayalam. Ditulis dalam aksara Malayalam dan merupakan bahasa resmi di negara bagian Kerala, India.

    Marathi. Ditulis dalam aksara Devanagari dan merupakan bahasa resmi di negara bagian Maharashtra, India.

    Kannada. Ditulis dalam aksara Kannada dan merupakan bahasa resmi di negara bagian Karnataka, India.

    Magahi. Ditulis dalam aksara Devanagari dan terutama digunakan di negara bagian Bihar, India.

    Oriya. Ditulis dalam aksara Odia dan merupakan bahasa resmi di negara bagian Odisha, India.

    Awadhi. Ditulis dalam aksara Devanagari dan terutama digunakan di negara bagian Uttar Pradesh, India.

    Maithili. Ditulis dalam aksara Devanagari, digunakan di negara bagian Bihar, India, serta dataran Terai di Nepal, dan merupakan bahasa terjadwal di India.

    Assamese. Ditulis dalam aksara Bengali dan merupakan bahasa resmi di negara bagian Assam, India.

    Chhattisgarhi. Ditulis dalam aksara Devanagari dan terutama digunakan di negara bagian Chhattisgarh, India.

    Bhojpuri. Ditulis dalam aksara Devanagari dan digunakan di sebagian India serta Nepal.

    Minangkabau. Ditulis dalam aksara Latin dan terutama digunakan di pulau Sumatra, Indonesia.

    Balinese. Ditulis dalam aksara Latin dan terutama digunakan di pulau Bali, Indonesia.

    Javanese. Ditulis dalam aksara Latin, meskipun aksara Jawa juga umum digunakan. Bahasa ini banyak digunakan di pulau Jawa, Indonesia.

    Banjar. Ditulis dalam aksara Latin dan terutama digunakan di pulau Kalimantan, Indonesia.

    Sundanese. Ditulis dalam aksara Latin, meskipun aksara Sunda juga digunakan secara tradisional. Bahasa ini terutama digunakan di bagian barat Jawa, Indonesia.

    Cebuano. Ditulis dalam aksara Latin dan terutama digunakan di wilayah Cebu, Filipina.

    Pangasinan. Ditulis dalam aksara Latin dan terutama digunakan di provinsi Pangasinan, Filipina.

    Iloko. Ditulis dalam aksara Latin dan terutama digunakan di Filipina.

    Waray (Filipina). Ditulis dalam aksara Latin dan terutama digunakan di Filipina.

    Haitian. Ditulis dalam aksara Latin dan merupakan salah satu bahasa resmi di Haiti.

    Papiamento. Ditulis dalam aksara Latin dan terutama digunakan di wilayah Karibia seperti Aruba dan Curaçao.

  5. Perbaikan format respons: Model ini memperbaiki masalah format respons dari versi sebelumnya, seperti format Markdown yang tidak normal, pemotongan respons di tengah, dan output boxed yang salah.

Model Qwen3 open source yang dirilis pada April 2025 tidak mendukung output non-streaming dalam mode thinking.
Jika model Qwen3 open source berada dalam mode thinking tetapi tidak menghasilkan chain-of-thought, maka akan ditagih dengan tarif mode non-thinking.

Mode thinking | Mode non-thinking | Penggunaan

Global

Dalam mode deployment global, titik akhir dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Model

Mode

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen3-next-80b-a3b-thinking

Thinking only

131.072

126.976

81.920

32.768

$0,15

$1,2

Tidak ada kuota gratis

qwen3-next-80b-a3b-instruct

Non-thinking only

129.024

-

qwen3-235b-a22b-thinking-2507

Thinking only

126.976

81.920

$0,23

$2,3

qwen3-235b-a22b-instruct-2507

Non-thinking only

129.024

-

$0,92

qwen3-30b-a3b-thinking-2507

Thinking only

126.976

81.920

$0,2

$2,4

qwen3-30b-a3b-instruct-2507

Non-thinking only

129.024

-

$0,8

qwen3-235b-a22b

Non-thinking

129.024

-

16.384

$0,7

$2,8

Thinking

98.304

38.912

$8,4

qwen3-32b

Non-thinking

129.024

-

$0,16

$0,64

Thinking

98.304

38.912

qwen3-30b-a3b

Non-thinking

129.024

-

$0,2

$0,8

Thinking

98.304

38.912

$2,4

qwen3-14b

Non-thinking

129.024

-

8.192

$0,35

$1,4

Thinking

98.304

38.912

$4,2

qwen3-8b

Non-thinking

129.024

-

$0,18

$0,7

Thinking

98.304

38.912

$2,1

Internasional

Dalam mode deployment internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Mode

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Million tokens)

qwen3-next-80b-a3b-thinking

Thinking only

131.072

126.976

81.920

32.768

$0,15

$1,2

1 juta token per model

Berlaku selama 90 hari setelah mengaktifkan Model Studio

qwen3-next-80b-a3b-instruct

Non-thinking only

129.024

-

qwen3-235b-a22b-thinking-2507

Thinking only

126.976

81.920

$0,23

$2,3

qwen3-235b-a22b-instruct-2507

Non-thinking only

129.024

-

$0,92

qwen3-30b-a3b-thinking-2507

Thinking only

126.976

81.920

$0,2

$2,4

qwen3-30b-a3b-instruct-2507

Non-thinking only

129.024

-

$0,8

qwen3-235b-a22b

Model ini dan model berikutnya dirilis pada April 2025.

Non-thinking

129.024

-

16.384

$0,7

$2,8

Thinking

98.304

38.912

$8,4

qwen3-32b

Non-thinking

129.024

-

$0,16

$0,64

Thinking

98.304

38.912

qwen3-30b-a3b

Non-thinking

129.024

-

$0,2

$0,8

Thinking

98.304

38.912

$2,4

qwen3-14b

Non-thinking

129.024

-

8.192

$0,35

$1,4

Thinking

98.304

38.912

$4,2

qwen3-8b

Non-thinking

129.024

-

$0,18

$0,7

Thinking

98.304

38.912

$2,1

qwen3-4b

Non-thinking

129.024

-

$0,11

$0,42

Thinking

98.304

38.912

$1,26

qwen3-1.7b

Non-thinking

32.768

30.720

-

$0,42

Thinking

28.672

Jumlah nilai dan input tidak boleh melebihi 30.720.

$1,26

qwen3-0.6b

Non-thinking

30.720

-

$0,42

Thinking

28.672

Total input tidak boleh melebihi 30.720.

$1,26

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, Titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, sedangkan sumber daya komputasi untuk inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Mode

Context window

Max input

Max chain-of-thought

Max Response

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen3-next-80b-a3b-thinking

Thinking only

131.072

126.976

81.920

32.768

$0,144

$1,434

Tidak ada kuota gratis

qwen3-next-80b-a3b-instruct

Non-thinking only

129.024

-

$0,574

qwen3-235b-a22b-thinking-2507

Thinking only

126.976

81.920

$0,287

$2,868

qwen3-235b-a22b-instruct-2507

Non-thinking only

129.024

-

$1,147

qwen3-30b-a3b-thinking-2507

Thinking only

126.976

81.920

$0,108

$1,076

qwen3-30b-a3b-instruct-2507

Non-thinking only

129.024

-

$0,431

qwen3-235b-a22b

Non-thinking

129.024

-

16.384

$0,287

$1,147

Thinking

98.304

38.912

$2,868

qwen3-32b

Non-thinking

129.024

-

$0,287

$1,147

Thinking

98.304

38.912

$2,868

qwen3-30b-a3b

Non-thinking

129.024

-

$0,108

$0,431

Thinking

98.304

38.912

$1,076

qwen3-14b

Non-thinking

129.024

-

8.192

$0,144

$0,574

Thinking

98.304

38.912

$1,434

qwen3-8b

Non-thinking

129.024

-

$0,072

$0,287

Thinking

98.304

38.912

$0,717

qwen3-4b

Non-thinking

129.024

-

$0,044

$0,173

Thinking

98.304

38.912

$0,431

qwen3-1.7b

Non-thinking

32.768

30.720

-

$0,173

Thinking

28.672

Jumlah tidak boleh melebihi 30.720

$0,431

qwen3-0.6b

Non-thinking

30.720

-

$0,173

Thinking

28.672

Jumlah tidak boleh melebihi 30.720

$0,431

QwQ - Open source

Model penalaran QwQ dilatih berdasarkan Qwen2.5-32B. Pembelajaran penguatan (reinforcement learning) telah meningkatkan kemampuan inferensinya secara signifikan. Metrik inti untuk matematika dan kode (AIME 24/25, LiveCodeBench) serta beberapa metrik umum (IFEval, LiveBench) setara dengan versi full-power DeepSeek-R1. Semua metrik tersebut secara signifikan melampaui DeepSeek-R1-Distill-Qwen-32B yang juga berbasis Qwen2.5-32B. Penggunaan | Referensi API

Catatan

Hanya mode deployment Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi terbatas di Tiongkok Daratan.

Model

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

(Token)

(Juta token)

qwq-32b

131.072

98.304

32.768

8.192

$0,287

$0,861

QwQ-Preview

Model qwq-32b-preview adalah model riset eksperimental yang dikembangkan oleh tim Qwen pada tahun 2024. Model ini berfokus pada peningkatan kemampuan penalaran AI, terutama dalam matematika dan pemrograman. Untuk informasi lebih lanjut mengenai keterbatasan model qwq-32b-preview, lihat blog resmi QwQ. Penggunaan | Referensi API | Coba online

Catatan

Hanya mode deployment Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi terbatas di Tiongkok Daratan.

Model

Context window

Max input

Max output

Input cost

Output cost

(Token)

(Juta token)

qwq-32b-preview

32.768

30.720

16.384

$0,287

$0,861

Qwen2.5

Qwen2.5 adalah rangkaian model bahasa besar Qwen yang mencakup model bahasa dasar dan model yang telah disesuaikan dengan instruksi, dengan ukuran parameter mulai dari 7 miliar hingga 72 miliar. Qwen2.5 mencakup peningkatan berikut dibandingkan Qwen2:

  • Model ini telah menjalani pre-train pada dataset skala besar terbaru kami, yang berisi hingga 18 triliun token.

  • Pre-training dengan model ahli khusus telah meningkatkan pengetahuan model secara signifikan dan sangat meningkatkan kemampuan pemrograman serta matematikanya.

  • Model ini menunjukkan peningkatan signifikan dalam mengikuti instruksi, menghasilkan teks panjang (lebih dari 8K token), memahami data terstruktur (seperti tabel), dan menghasilkan output terstruktur (terutama JSON). Model ini juga lebih tangguh terhadap berbagai prompt sistem, yang meningkatkan implementasi role-playing dan pengaturan kondisional untuk chatbot.

  • Model ini mendukung lebih dari 29 bahasa, termasuk Mandarin, Inggris, Prancis, Spanyol, Portugis, Jerman, Italia, Rusia, Jepang, Korea, Vietnam, Thailand, dan Arab.

PenggunaanReferensi APICoba online

Internasional

Dalam mode deployment internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Tokens)

(Million tokens)

qwen2.5-14b-instruct-1m

1.008.192

1.000.000

8.192

$0,805

$3,22

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen2.5-7b-instruct-1m

$0,368

$1,47

qwen2.5-72b-instruct

131.072

129.024

$1,4

$5,6

qwen2.5-32b-instruct

$0,7

$2,8

qwen2.5-14b-instruct

$0,35

$1,4

qwen2.5-7b-instruct

$0,175

$0,7

Tiongkok Daratan

Dalam mode deployment Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi terbatas di Tiongkok Daratan.

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen2.5-14b-instruct-1m

1.000.000

1.000.000

8.192

$0,144

$0,431

qwen2.5-7b-instruct-1m

$0,072

$0,144

qwen2.5-72b-instruct

131.072

129.024

$0,574

$1,721

qwen2.5-32b-instruct

$0,287

$0,861

qwen2.5-14b-instruct

$0,144

$0,431

qwen2.5-7b-instruct

$0,072

$0,144

qwen2.5-3b-instruct

32.768

30.720

$0,044

$0,130

qwen2.5-1.5b-instruct

Gratis untuk waktu terbatas

qwen2.5-0.5b-instruct

QVQ

Model qvq-72b-preview adalah model riset eksperimental yang dikembangkan oleh tim Qwen. Model ini berfokus pada peningkatan kemampuan penalaran visual, terutama dalam penalaran matematika. Untuk informasi lebih lanjut mengenai keterbatasan model qvq-72b-preview, lihat blog resmi QVQ.Penggunaan | Referensi API

Untuk membuat model mengeluarkan proses berpikirnya sebelum jawaban akhir, Anda dapat menggunakan versi komersial model QVQ.
Catatan

Hanya mode deployment Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi terbatas di Tiongkok Daratan.

Model

Context window

Max input

Max output

Input cost

Output cost

(Token)

(Juta token)

qvq-72b-preview

32.768

16.384

Maksimal 16.384 token per gambar

16.384

$1,721

$5,161

Qwen-Omni

Ini adalah model besar multimodal baru untuk pemahaman dan generasi, yang dilatih berdasarkan Qwen2.5. Model ini mendukung input teks, gambar, suara, dan video, serta dapat menghasilkan teks dan suara secara bersamaan dalam aliran (stream). Kecepatan pemahaman konten multimodalnya mengalami peningkatan signifikan.Penggunaan | Referensi API

Internasional

Dalam mode deployment internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Context window

Max input

Max output

Kuota gratis

(Catatan)

(Token)

qwen2.5-omni-7b

32.768

30.720

2.048

1 juta token (tanpa memandang modalitas)

Berlaku selama 90 hari setelah mengaktifkan Model Studio.

Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:

Input

Harga (Juta token)

Text

$0,10

Audio

$6,76

Image/Video

$0,28

Output

Harga (Juta token)

Text

$0,40 (jika input hanya berisi teks)

$0,84 (jika input berisi gambar, audio, atau video)

Text+Audio

$13,51 (untuk komponen audio)

Bagian teks dari output tidak ditagih.

Tiongkok Daratan

Dalam mode penyebaran di Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di Wilayah Beijing, sedangkan sumber daya komputasi Inferensi terbatas pada Tiongkok Daratan.

Model

Context window

Max input

Max output

(Token)

qwen2.5-omni-7b

32.768

30.720

2.048

Aturan penagihan untuk input dan output adalah sebagai berikut:

Input

Harga (Juta token)

Text

$0,087

Audio

$5,448

Image/Video

$0,287

Output

Harga (Juta token)

Text

$0,345 (untuk input teks saja)

$0,861 (jika input mencakup gambar, audio, atau video)

Text+Audio

$10,895 (untuk bagian audio)

Bagian teks dari output tidak ditagih.

Qwen3-Omni-Captioner

Qwen3-Omni-Captioner adalah model open-source berbasis Qwen3-Omni. Tanpa prompt apa pun, model ini secara otomatis menghasilkan deskripsi yang akurat dan komprehensif untuk audio kompleks, seperti ucapan, suara latar, musik, dan efek suara. Model ini dapat mengidentifikasi emosi pembicara, elemen musik (seperti gaya dan instrumen), serta informasi sensitif, sehingga cocok untuk aplikasi seperti analisis konten audio, audit keamanan, pengenalan maksud, dan penyuntingan audio. Penggunaan | Referensi API

Internasional

Dalam mode deployment internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Context window

Max input

Max output

Input cost

Output cost

Kuota gratis

(Catatan)

(token)

(Juta token)

qwen3-omni-30b-a3b-captioner

65.536

32.768

32.768

$3,81

$3,06

1 juta token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, Titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, sedangkan sumber daya komputasi untuk inferensi model terbatas pada wilayah Tiongkok Daratan.

Model

Jendela konteks (token)

Max input (token)

Max output (token)

Input cost

Output Cost

Kuota gratis

(Catatan)

Token

Per juta token

qwen3-omni-30b-a3b-captioner

65.536

32.768

32.768

$2,265

$1,821

Tidak tersedia kuota gratis.

Qwen-VL

Ini adalah versi open-source Qwen-VL dari Alibaba Cloud. Penggunaan | Referensi API

Model Qwen3-VL menawarkan peningkatan signifikan dibandingkan Qwen2.5-VL:

  • Interaksi agen: Model ini mengoperasikan antarmuka komputer dan ponsel dengan mengenali elemen Graphical User Interface (GUI), memahami fitur, dan memanggil alat untuk menjalankan tugas. Model ini mencapai performa terbaik dalam evaluasi seperti OS World.

  • Enkode visual: Model ini menghasilkan kode dari gambar atau video. Anda dapat menggunakannya untuk membuat kode HTML, CSS, dan JS dari file desain atau tangkapan layar website.

  • Kecerdasan spasial: Model ini mendukung penentuan posisi 2D dan 3D. Model ini secara akurat menentukan orientasi objek, perubahan perspektif, dan hubungan oklusi.

  • Pemahaman video panjang: Model ini memahami konten video hingga durasi 20 menit. Model ini dapat menentukan momen spesifik dengan presisi tingkat detik.

  • Pemikiran mendalam: Model ini memiliki kemampuan pemikiran mendalam. Model ini unggul dalam menangkap detail dan menganalisis sebab-akibat. Model ini mencapai performa terbaik dalam evaluasi seperti MathVista dan MMMU.

  • OCR: Model ini mendukung 33 bahasa. Model ini berkinerja lebih stabil dalam skenario dengan pencahayaan kompleks, efek buram, atau kemiringan. Model ini secara signifikan meningkatkan akurasi pengenalan untuk karakter langka, naskah kuno, dan istilah teknis.

    Bahasa yang didukung

    33 bahasa yang didukung adalah Mandarin, Jepang, Korea, Indonesia, Vietnam, Thailand, Inggris, Prancis, Jerman, Rusia, Portugis, Spanyol, Italia, Swedia, Denmark, Ceko, Norwegia, Belanda, Finlandia, Turki, Polandia, Swahili, Rumania, Serbia, Yunani, Kazakh, Uzbek, Cebuano, Arab, Urdu, Persia, Hindi/Devanagari, dan Ibrani.

Global

Dalam mode deployment global, titik akhir dan penyimpanan data berlokasi di wilayah AS (Virginia), sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Model

Mode

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

Chain-of-thought + Outputs

(Tokens)

(Million tokens)

qwen3-vl-235b-a22b-thinking

Thinking only

126.976

81.920

$0,4

$4

qwen3-vl-235b-a22b-instruct

Non-thinking only

129.024

-

$1,6

qwen3-vl-32b-thinking

Thinking only

131.072

126.976

81.920

32.768

$0,16

$0,64

qwen3-vl-32b-instruct

Non-thinking only

129.024

-

qwen3-vl-30b-a3b-thinking

Thinking only

126.976

81.920

$0,2

$2,4

qwen3-vl-30b-a3b-instruct

Non-thinking only

129.024

-

$0,8

qwen3-vl-8b-thinking

Thinking only

126.976

81.920

$0,18

$2,1

qwen3-vl-8b-instruct

Non-thinking only

129.024

-

$0,7

Internasional

Dalam mode deployment internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura, sedangkan sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Mode

Context window

Max input

Max chain-of-thought

Max Response

Input cost

Biaya Keluaran

Chain-of-thought + Outputs

Kuota Gratis

(Catatan)

Tokens

Harga ($ per juta token)

qwen3-vl-235b-a22b-thinking

Thinking only

126.976

81.920

$0,4

$4

1 juta token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

qwen3-vl-235b-a22b-instruct

Non-thinking only

129.024

-

$1,6

qwen3-vl-32b-thinking

Mode Berpikir

131.072

126.976

81.920

32.768

$0,16

$0,64

qwen3-vl-32b-instruct

Non-thinking only

129.024

-

qwen3-vl-30b-a3b-thinking

Thinking only

126.976

81.920

$0,2

$2,4

qwen3-vl-30b-a3b-instruct

Inferensi langsung saja

129.024

-

$0,8

qwen3-vl-8b-thinking

Thinking only

126.976

81.920

$0,18

$2,1

qwen3-vl-8b-instruct

Inferensi standar saja

129.024

-

$0,7

Model lainnya

Model

Context window

Max input

Max output

Input cost

Output cost

Kuota gratis

(Catatan)

(Token)

($ per juta token)

qwen2.5-vl-72b-instruct

131.072

129.024

Maksimal 16.384 token per gambar

8.192

$2,8

$8,4

1 juta token per model

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen2.5-vl-32b-instruct

$1,4

$4,2

qwen2.5-vl-7b-instruct

$0,35

$1,05

qwen2.5-vl-3b-instruct

$0,21

$0,63

Tiongkok Daratan

Dalam mode deployment Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi inferensi model terbatas di Tiongkok Daratan.

Model

Mode

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

Chain-of-thought + Outputs

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen3-vl-235b-a22b-thinking

Thinking only

131.072

126.976

81.920

$0,287

$2,867

Tidak ada kuota gratis

qwen3-vl-235b-a22b-instruct

Instruct mode only

129.024

-

$1,147

qwen3-vl-32b-thinking

Thinking only

131.072

126.976

81.920

32.768

$0,287

$2,868

qwen3-vl-32b-instruct

Instruct mode only

129.024

-

$1,147

qwen3-vl-30b-a3b-thinking

Thinking only

126.976

81.920

$0,108

$1,076

qwen3-vl-30b-a3b-instruct

Instruct mode only

129.024

-

$0,431

qwen3-vl-8b-thinking

Thinking only

126.976

81.920

$0,072

$0,717

qwen3-vl-8b-instruct

Instruct mode only

129.024

-

$0,287

Model lainnya

Model

Context window

Max input

Max output

Input cost

Output cost

Kuota gratis

(Catatan)

(Token)

($ per juta token)

qwen2.5-vl-72b-instruct

131.072

129.024

Maksimal 16.384 token per gambar

8.192

$2,294

$6,881

Tidak ada kuota gratis

qwen2.5-vl-32b-instruct

Rp1.147,00

$3,441

qwen2.5-vl-7b-instruct

$0,287

$0,717

qwen2.5-vl-3b-instruct

$0,173

$0,517

qwen2-vl-72b-instruct

32.768

30.720

Maksimal 16.384 per grafik.

2.048

$2,294

$6,881

Qwen-Math

Ini adalah model bahasa yang dibangun di atas model Qwen dan dikhususkan untuk menyelesaikan permasalahan matematika. Qwen2.5-Math mendukung Bahasa Mandarin dan Bahasa Inggris serta mengintegrasikan beberapa metode penalaran, seperti Chain of Thought (CoT), Program of Thought (PoT), dan Tool-Integrated Reasoning (TIR). Penggunaan | Referensi API | Coba secara online

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Tiongkok Daratan.

Model

Konteks

Input maksimum

Output maksimum

Biaya input

Biaya output

(token)

(juta token)

qwen2.5-math-72b-instruct

4.096

3.072

3.072

$0,574

$1.721

qwen2.5-math-7b-instruct

$0,144

$0,287

qwen2.5-math-1.5b-instruct

Gratis untuk waktu terbatas

Qwen-Coder

Qwen-Coder adalah model kode open-source dari seri Qwen. Seri terbaru Qwen3-Coder memiliki kemampuan coding agent yang kuat. Model ini unggul dalam tool calling, interaksi lingkungan, dan pemrograman otonom. Model ini menggabungkan keterampilan coding yang luar biasa dengan kemampuan serbaguna. Penggunaan | Referensi API

Global

Dalam mode penyebaran global, titik akhir dan penyimpanan data berlokasi di Wilayah US (Virginia), serta sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia.

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen3-coder-480b-a35b-instruct

262.144

204.800

65.536

Berlaku harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel ini.

qwen3-coder-30b-a3b-instruct

Model qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Model

Input tokens per request

Input cost (Million tokens)

Output cost (Million tokens)

qwen3-coder-480b-a35b-instruct

0 < tokens ≤ 32K

$1,50

$7,50

32K < tokens ≤ 128K

$2,70

$13,50

128K < tokens ≤ 200K

$4,50

$22,50

qwen3-coder-30b-a3b-instruct

0 < tokens ≤ 32K

$0,45

$2,25

32K < tokens ≤ 128K

$0,75

$3,75

128K < tokens ≤ 200K

$1,2

$6

International

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi model dijadwalkan secara dinamis di seluruh dunia, kecuali Tiongkok Daratan.

Model

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

qwen3-coder-480b-a35b-instruct

262.144

204.800

65.536

Berlaku harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel ini.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen3-coder-30b-a3b-instruct

Model qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Model

Input tokens per request

Input cost (Million tokens)

Output cost (Million tokens)

qwen3-coder-480b-a35b-instruct

0 < tokens ≤ 32K

$1,5

$7,5

32K < tokens ≤ 128K

$2,7

$13,5

128K < tokens ≤ 200K

$4,5

$22,5

qwen3-coder-30b-a3b-instruct

0 < tokens ≤ 32K

$0,45

$2,25

32K < tokens ≤ 128K

$0,75

$3,75

128K < tokens ≤ 200K

$1,2

$6

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi model dibatasi hanya untuk Tiongkok Daratan.

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen3-coder-480b-a35b-instruct

262.144

204.800

65.536

Harga bertingkat. Lihat catatan di bawah tabel ini.

qwen3-coder-30b-a3b-instruct

qwen2.5-coder-32b-instruct

131.072

129.024

8.192

$0,287

$0,861

qwen2.5-coder-14b-instruct

qwen2.5-coder-7b-instruct

$0,144

$0,287

qwen2.5-coder-3b-instruct

32.768

30.720

Uji coba gratis untuk waktu terbatas

qwen2.5-coder-1,5b-instruct

qwen2.5-coder-0,5b-instruct

Model qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Model

Input tokens per request

Input price (Million tokens)

Output price (Million tokens)

qwen3-coder-480b-a35b-instruct

0 < tokens ≤ 32K

$0,861

$3,441

32K < tokens ≤ 128K

$1,291

$5,161

128K < tokens ≤ 200K

$2,151

$8,602

qwen3-coder-30b-a3b-instruct

0 < tokens ≤ 32K

$0,216

$0,861

32K < tokens ≤ 128K

$0,323

$1,291

128K < tokens ≤ 200K

$0,538

$2,151

Generasi teks - Pihak ketiga

DeepSeek

DeepSeek adalah model bahasa besar dari DeepSeek AI. Referensi API | Coba secara online

Catatan

Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.

Model

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

(Tokens)

(Million tokens)

deepseek-v3.2

Versi penuh 685B
Diskon Context cache

131.072

98.304

32.768

65.536

$0,287

$0,431

deepseek-v3.2-exp

Versi penuh 685B

deepseek-v3.1

Versi penuh 685B

$0,574

$1,721

deepseek-r1

Versi penuh 685B
Batch separuh harga

16.384

$2,294

deepseek-r1-0528

Versi penuh 685B

deepseek-v3

Versi penuh 671B
Batch separuh harga

131.072

N/A

$0,287

$1,147

deepseek-r1-distill-qwen-1.5b

Berdasarkan Qwen2.5-Math-1.5B

32.768

32.768

16.384

16.384

Uji coba gratis untuk waktu terbatas

deepseek-r1-distill-qwen-7b

Berdasarkan Qwen2.5-Math-7B

$0,072

$0,144

deepseek-r1-distill-qwen-14b

Berdasarkan Qwen2.5-14B

$0,144

$0,431

deepseek-r1-distill-qwen-32b

Berdasarkan Qwen2.5-32B

$0,287

$0,861

deepseek-r1-distill-llama-8b

Berdasarkan Llama-3.1-8B

Uji coba gratis untuk waktu terbatas

deepseek-r1-distill-llama-70b

Berdasarkan Llama-3.3-70B

Kimi

Kimi-K2 adalah model bahasa besar yang diluncurkan oleh Moonshot AI. Model ini memiliki kemampuan coding dan pemanggilan tool yang sangat baik. Penggunaan | Coba secara online

Catatan

Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.

Model

Context window

Max input

Max CoT

Max response

Input price

Output price

(tokens)

(per 1M tokens)

kimi-k2-thinking

262.144

229.376

32.768

16.384

$0,574

$2,294

Moonshot-Kimi-K2-Instruct

131.072

131.072

-

8.192

$0,574

$2,294

GLM

Model seri GLM adalah model penalaran hibrida dari Zhipu AI yang dirancang untuk agen dan mendukung dua mode: thinking dan non-thinking. GLM

Catatan

Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.

Model

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

(Tokens)

(Million tokens)

glm-4.7

202,752

169,984

32,768

16,384

Harga bertingkat, lihat tabel di bawah.

glm-4.6

Model di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan.

Model

Input tokens per request

Input cost (Million tokens)

Output cost (Million tokens)

glm-4.7

0<Token<=32K

$0,431

$2,007

32K<Token<=166K

$0,574

$2,294

glm-4.6

0<Token<=32K

$0,431

$2,007

32K<Token<=166K

$0,574

$2,294

Model-model tersebut bukan layanan pihak ketiga yang terintegrasi, melainkan dideploy pada server Model Studio.
Model GLM memiliki harga yang sama baik dalam mode thinking maupun non-thinking.

Image generation

Qwen-Image

Model teks-ke-gambar Qwen unggul dalam rendering teks kompleks, terutama dalam bahasa Tiongkok dan Inggris. Referensi API

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Harga satuan

Kuota gratis

qwen-image-max

Saat ini memiliki kemampuan yang sama dengan qwen-image-max-2025-12-30.

$0,075/gambar

Kuota gratis: 100 gambar untuk setiap model

Berlaku selama 90 hari setelah mengaktifkan Model Studio.

qwen-image-max-2025-12-30

$0,075/gambar

qwen-image-plus

Saat ini memiliki kemampuan yang sama dengan qwen-image.

$0,03/gambar

qwen-image-plus-2026-01-09

$0,03/gambar

qwen-image

$0,035/gambar

Tiongkok Daratan

Di Tiongkok Daratan dalam mode penyebaran, titik akses dan penyimpanan data berlokasi di Wilayah Beijing, sedangkan sumber daya komputasi inferensi terbatas pada Tiongkok Daratan.

Model

Harga satuan

Kuota gratis

qwen-image-max

Saat ini memiliki kemampuan yang sama dengan qwen-image-max-2025-12-30

$0,071677/image

Tidak ada kuota gratis

qwen-image-max-2025-12-30

$0,071677/image

qwen-image-plus

Saat ini memiliki kemampuan yang sama dengan qwen-image

$0,028671/image

qwen-image-plus-2026-01-09

$0,028671/image

qwen-image

$0,035/image

Prompt masukan

Gambar output

Poster bergaya healing yang digambar tangan, menampilkan tiga anak anjing bermain bola di atas rumput hijau yang subur, dilengkapi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun tebal berwarna biru. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Sebuah balon ucapan menambah kesan ceria dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, terdapat teks tambahan: “We get to play ball with our friends again!” Palet warna didominasi hijau dan biru segar, dengan aksen merah muda dan kuning cerah untuk memperkuat suasana riang khas anak-anak.

image

Qwen-Image-Edit

Model pengeditan gambar Qwen mendukung pengeditan teks yang presisi dalam bahasa Tiongkok dan Inggris. Model ini juga mendukung operasi seperti penyesuaian warna, peningkatan detail, style transfer, penambahan atau penghapusan objek, serta perubahan posisi dan aksi. Fitur-fitur ini memungkinkan pengeditan kompleks terhadap gambar dan teks. Referensi API

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Harga satuan

Kuota gratis

qwen-image-edit-max

Saat ini memiliki kemampuan yang sama dengan qwen-image-edit-plus-2026-01-16

$0,075/gambar

Kuota gratis: 100 gambar untuk setiap model

Berlaku selama 90 hari setelah mengaktifkan Model Studio

qwen-image-edit-max-2026-01-16

$0,075/gambar

qwen-image-edit-plus

Saat ini memiliki kemampuan yang sama dengan qwen-image-edit-plus-2025-10-30

$0,03/gambar

qwen-image-edit-plus-2025-12-15

$0,03/gambar

qwen-image-edit-plus-2025-10-30

$0,03/gambar

qwen-image-edit

$0,045/gambar

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Harga satuan

Kuota gratis

qwen-image-edit-max

Saat ini memiliki kemampuan yang sama dengan qwen-image-edit-plus-2026-01-16

$0,071677/gambar

Tidak ada kuota gratis

qwen-image-edit-max-2026-01-16

$0,071677/gambar

qwen-image-edit-plus

Saat ini memiliki kemampuan yang sama dengan qwen-image-edit-plus-2025-10-30

$0,028671/gambar

qwen-image-edit-plus-2025-12-15

$0,028671/gambar

qwen-image-edit-plus-2025-10-30

$0,028671/gambar

qwen-image-edit

$0,043/gambar

dog_and_girl (1)

Gambar asli

狗修改图

Buat orang tersebut membungkuk dan memegang kaki depan anjing.

image

Gambar asli

image

Ubah teks pada balok huruf dari 'HEALTH INSURANCE' menjadi 'Tomorrow will be better'.

5

Gambar asli

5out

Ubah kemeja berpola titik menjadi kemeja biru muda.

6

Gambar asli

6out

Ubah latar belakang menjadi Antarktika.

7

Gambar asli

7out

Buat foto profil bergaya kartun dari orang tersebut.

image

Gambar asli

image

Hapus rambut dari piring makan malam.

Qwen-MT-Image

Model terjemahan gambar Qwen mendukung penerjemahan teks dari gambar dalam 11 bahasa ke bahasa Tiongkok atau Inggris. Model ini secara akurat mempertahankan tata letak dan informasi konten asli, serta menyediakan fitur kustom seperti definisi kata kunci, penyaringan kata sensitif, dan deteksi entitas gambar. Referensi API

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Harga satuan

Kuota gratis

qwen-mt-image

$0,000431/gambar

Tidak ada kuota gratis

en

Gambar Asli

ja

Bahasa Jepang

es

Bahasa Portugis

ar

Bahasa Arab

Tongyi - text-to-Image - Z-Image

Tongyi - text-to-image - Z-Image adalah model ringan yang secara cepat menghasilkan gambar berkualitas tinggi. Model ini mendukung rendering teks dalam bahasa Tiongkok dan Inggris, pemahaman semantik kompleks, berbagai gaya, serta resolusi dan rasio aspek ganda. Referensi API

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Harga satuan

Kuota gratis (Catatan)

Berlaku selama 90 hari setelah mengaktifkan Model Studio

z-image-turbo

Ekstensi prompt dinonaktifkan (prompt_extend=false): $0,015/gambar

Ekstensi prompt diaktifkan (prompt_extend=true): $0,03/gambar

100 gambar

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Harga satuan

Kuota gratis

z-image-turbo

Ekstensi prompt dinonaktifkan (prompt_extend=false): $0,01434/gambar

Ekstensi prompt diaktifkan (prompt_extend=true): $0,02868/gambar

Tidak ada kuota gratis

Prompt input

Gambar output

Foto seorang wanita muda stylish berambut pendek hitam yang berdiri percaya diri di depan dinding mural bergaya kartun penuh warna. Ia mengenakan outfit serba hitam: jaket bomber puff dengan kerah berkerut, celana cargo pendek, stoking jaring ikan, dan sepatu bot Doc Martens hitam tebal, dilengkapi rantai emas yang menjuntai dari pinggangnya. Latar belakang terdiri atas empat panel bergaya komik penuh warna: satu bertuliskan “GRAND STAGE” yang menampilkan sepatu sneakers dan botol Gatorade; panel lain menampilkan sneakers Nike hijau dan sepotong pizza; panel ketiga bertuliskan “HARAJUKU st” dengan sepatu-sepatu melayang; serta panel keempat menunjukkan seekor tikus biru sedang menaiki skateboard dengan teks “Takeshita WELCOME.” Warna dominan cerah mencakup kuning, teal, oranye, merah muda, dan hijau. Balon ucapan, pola halftone, serta karakter-karakter lucu memperkuat estetika seni jalanan urban. Pencahayaan siang hari menerangi seluruh adegan secara merata, dengan lantai ubin putih di bawah kakinya. Komposisi potret tubuh penuh ini terpusat, postur sedikit miring, dan subjek menatap langsung ke kamera. Gambar memiliki detail tinggi, fokus tajam, serta framing dinamis.

b16c8008-83c1-4c80-ae22-786a2299bec3-1-转换自-png

Wan text-to-image

Model teks-ke-gambar Wan menghasilkan gambar berkualitas tinggi dari teks. Referensi API | Coba online

Global

Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah AS (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Model

Deskripsi

Harga satuan

Kuota gratis (Catatan)

Berlaku selama 90 hari setelah mengaktifkan Model Studio

wan2.6-t2i Recommended

Wan 2.6. Mendukung antarmuka sinkron baru dan memungkinkan Anda memilih dimensi secara bebas dalam batasan total area piksel dan rasio aspek.

$0,03/gambar

Tidak ada kuota gratis

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Deskripsi

Harga satuan

Kuota gratis (Catatan)

Berlaku selama 90 hari setelah mengaktifkan Model Studio

wan2.6-t2i Recommended

Wan 2.6. Mendukung antarmuka sinkron baru dan memungkinkan pemilihan dimensi secara bebas dalam batasan total area piksel dan rasio aspek.

$0,03/gambar

50 gambar

wan2.5-t2i-preview Recommended

Pratinjau Wan 2.5. Menghapus batasan panjang sisi tunggal dan memungkinkan pemilihan dimensi secara bebas dalam batasan total area piksel dan rasio aspek.

$0,03/gambar

50 gambar

wan2.2-t2i-plus

Edisi Profesional Wan 2.2. Ditingkatkan secara menyeluruh dalam kreativitas, stabilitas, dan tekstur realistis.

$0,05/gambar

100 gambar

wan2.2-t2i-flash

Edisi Flash Wan 2.2. Ditingkatkan secara menyeluruh dalam kreativitas, stabilitas, dan tekstur realistis.

$0,025/gambar

100 gambar

wan2.1-t2i-plus

Edisi Profesional Wan 2.1. Mendukung berbagai gaya dan menghasilkan gambar dengan detail yang kaya.

$0,05/gambar

200 gambar

wan2.1-t2i-turbo

Edisi Turbo Wan 2.1. Mendukung berbagai gaya dan menawarkan kecepatan generasi yang cepat.

$0,025/gambar

200 gambar

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Deskripsi

Harga satuan

Kuota gratis (Catatan)

Berlaku selama 90 hari setelah mengaktifkan Model Studio

wan2.6-t2i Recommended

Wan 2.6. Mendukung antarmuka sinkron baru dan memungkinkan pemilihan dimensi secara bebas dalam batasan total area piksel dan rasio aspek.

$0,028671/gambar

Tidak ada kuota gratis

wan2.5-t2i-preview Recommended

Pratinjau Wan 2.5. Menghapus batasan panjang sisi tunggal dan memungkinkan pemilihan dimensi secara bebas dalam batasan total area piksel dan rasio aspek.

$0,028671/gambar

Tidak ada kuota gratis

wan2.2-t2i-plus

Edisi Profesional Wan 2.2. Ditingkatkan sepenuhnya dalam kreativitas, stabilitas, dan tekstur realistis.

$0,02007/gambar

Tidak ada kuota gratis

wan2.2-t2i-flash

Edisi Flash Wan 2.2. Ditingkatkan sepenuhnya dalam kreativitas, stabilitas, dan tekstur realistis.

$0,028671/gambar

Tidak ada kuota gratis

wanx2.1-t2i-plus

Edisi Profesional Wan 2.1. Mendukung berbagai gaya dan menghasilkan gambar dengan detail kaya.

$0,028671/gambar

Tidak ada kuota gratis

wanx2.1-t2i-turbo

Edisi Turbo Wan 2.1. Mendukung berbagai gaya dan menawarkan kecepatan generasi cepat.

$0,020070/gambar

Tidak ada kuota gratis

wanx2.0-t2i-turbo

Edisi Turbo Wan 2.0. Unggul dalam potret bertekstur dan desain kreatif serta hemat biaya.

$0,005735/gambar

Tidak ada kuota gratis

Prompt input

Gambar output

Sebuah Santa Claus dari felt jarum yang memegang hadiah dan kucing putih yang berdiri di sampingnya, dengan latar belakang hadiah-hadiah berwarna-warni dan tanaman hijau, menciptakan adegan yang lucu, hangat, dan nyaman.

image

Wan2.6 image generation and editing

Model generasi gambar Wan2.6 mendukung pengeditan gambar dan dapat menghasilkan output yang berisi teks dan gambar untuk memenuhi berbagai kebutuhan generasi dan integrasi. Referensi API.

Global

Dalam mode penyebaran Global, titik akses dan penyimpanan data berada di wilayah AS (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Model

Harga Satuan

Kuota Gratis

wan2.6-image

$0,03/gambar

Tidak ada kuota gratis

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berada di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Harga satuan

Kuota gratis (Catatan)

Berlaku selama 90 hari setelah mengaktifkan Model Studio

wan2.6-image

$0,03/gambar

50 gambar

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, sedangkan sumber daya komputasi Inferensi terbatas pada wilayah Tiongkok Daratan.

Model

Harga satuan

Kuota gratis

wan2.6-image

$0,028671/gambar

Tidak ada kuota gratis

Wan general image editing 2.5

Model pengeditan gambar umum Wan2.5 mendukung pengeditan gambar yang konsisten terhadap entitas dan fusi multi-gambar. Model ini menerima teks, satu gambar, atau beberapa gambar sebagai input. Referensi API.

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Harga satuan

Kuota gratis (Catatan)

Berlaku selama 90 hari setelah mengaktifkan Model Studio

wan2.5-i2i-preview

$0,03/gambar

50 unit

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Harga satuan

Kuota gratis

wan2.5-i2i-preview

$0,028671/gambar

Tidak ada kuota gratis

Fitur

Contoh input

Gambar output

Pengeditan gambar tunggal

damotest2023_Portrait_photography_outdoors_fashionable_beauty_409ae3c1-19e8-4515-8e50-b3c9072e1282_2-转换自-png

a26b226d-f044-4e95-a41c-d1c0d301c30b-转换自-png

Ubah gaun bermotif bunga menjadi gaun panjang bergaya vintage berbahan renda dengan detail bordir indah pada kerah dan manset.

Fusi multi-gambar

image

p1028883

Tempatkan jam alarm dari Gambar 1 di samping vas di atas meja makan pada Gambar 2.

Wan general image editing 2.1

Model Wan2.1 general image editing melakukan berbagai pengeditan gambar dengan instruksi yang simple. Model ini cocok untuk skenario seperti outpainting, penghapusan watermark, style transfer, restorasi gambar, dan peningkatan kualitas gambar. PenggunaanReferensi API

Catatan

Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir (endpoint) dan penyimpanan data berlokasi di Wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.

Model

Harga Satuan

Kuota Gratis

wanx2.1-imageedit

$0,020070 per gambar

Tidak ada kuota gratis

Model general image editing saat ini mendukung fitur-fitur berikut:

Fitur Model

Gambar Masukan

Prompt Masukan

Gambar Keluaran

Stylisasi Global

image

French picture book style.

image

Stylisasi Lokal

image

Change the house to a wooden plank style.

image

Pengeditan Berbasis Instruksi

image

Change the girl's hair to red.

image

Inpainting

Gambar masukan

image

Gambar dengan masker (area putih menunjukkan masker)

image

A ceramic rabbit holding a ceramic flower.

Gambar keluaran

image

Penghapusan Watermark Teks

image

Remove the text from the image.

image

Outpainting

20250319105917

A green fairy.

image

Super-resolusi Gambar

Gambar buram

image

Image super-resolution.

Gambar jernih

image

Pewarnaan Gambar

image

Blue background, yellow leaves.

image

Line Art ke Gambar

image

A living room in a minimalist Nordic style.

image

Gambar Placeholder

image

A cartoon character cautiously peeks out, spying on a brilliant blue gem inside the room.

image

OutfitAnyone

  • Dibandingkan dengan versi dasar, model OutfitAnyone-Plus menawarkan peningkatan dalam definisi gambar, detail tekstur pakaian, dan restorasi logo. Namun, proses pembuatan gambarnya memakan waktu lebih lama dan cocok untuk skenario yang tidak sensitif terhadap waktu. Referensi API | Coba secara online

  • Penguraian gambar OutfitAnyone mendukung penguraian gambar model dan pakaian, yang dapat digunakan untuk pra-pemrosesan dan post-processing gambar OutfitAnyone. Referensi API

Catatan

Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.

Model

Deskripsi

Contoh input

Contoh keluaran

aitryon-plus

OutfitAnyone-Plus

output26

output29

aitryon-parsing-v1

Penguraian gambar OutfitAnyone

Harga OutfitAnyone

Layanan

Model

Harga Satuan

Diskon

Tingkat

OutfitAnyone - Plus

aitryon-plus

$0,071677/gambar

Tidak ada

Tidak ada

OutfitAnyone - Penguraian gambar

aitryon-parsing-v1

$0,000574/gambar

Tidak ada

Tidak ada

Generasi video - Wan

Teks-ke-video

Model teks-ke-video Wan menghasilkan video dari satu kalimat. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba online

Global

Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Model

Deskripsi

Harga satuan

Kuota gratis

wan2.6-t2v Recommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

720P: $0,1/detik

1080P: $0,15/detik

Tidak ada kuota gratis

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Deskripsi

Harga satuan

Kuota gratis (Klaim)

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

wan2.6-t2v Recommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

720P: $0,10/detik

1080P: $0,15/detik

50 detik

wan2.5-t2v-preview Recommended

Pratinjau Wan 2.5. Mendukung voiceover otomatis dan impor file audio kustom.

480p: $0,05/detik

720p: $0,10/detik

1080p: $0,15/detik

50 detik

wan2.2-t2v-plus

Edisi Profesional Wan 2.2. Menawarkan peningkatan signifikan pada detail gambar dan stabilitas gerakan.

480p: $0,02/detik

1080p: $0,10/detik

50 detik

wan2.1-t2v-turbo

Edisi Turbo Wan 2.1. Menyediakan kecepatan generasi cepat dengan performa seimbang.

$0,036/detik

200 detik

wan2.1-t2v-plus

Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya dan gambar berkualitas tinggi.

$0,10/detik

200 detik

AS

Dalam mode penyebaran AS, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi terbatas hanya di AS.

Model

Deskripsi

Harga satuan

Kuota gratis

wan2.6-t2v-us Recommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

720P: $0,1/detik

1080P: $0,15/detik

Tidak ada kuota gratis

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Deskripsi

Harga satuan

Kuota gratis

wan2.6-t2v REcommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

720P: $0,086012/detik

1080P: 0,143353/detik

Tidak ada kuota gratis

wan2.5-t2v-preview Recommended

Pratinjau Wan 2.5. Mendukung voiceover otomatis dan impor file audio kustom.

480p: $0,043006/detik

720p: $0,086012/detik

1080p: $0,143353/detik

Tidak ada kuota gratis

wan2.2-t2v-plus

Edisi Profesional Wan 2.2. Menawarkan peningkatan signifikan pada detail gambar dan stabilitas gerakan.

480p: $0,02007/detik

1080p: $0,100347/detik

Tidak ada kuota gratis

wanx2.1-t2v-turbo

Generasi lebih cepat dengan performa seimbang.

$0,034405/detik

Tidak ada kuota gratis

wanx2.1-t2v-plus

Menghasilkan detail lebih kaya dan kualitas gambar lebih tinggi.

$0,100347/detik

Tidak ada kuota gratis

Gambar-ke-video - frame pertama

Model gambar-ke-video Wan menggunakan gambar input sebagai frame pertama video. Selanjutnya, model ini menghasilkan sisa video berdasarkan prompt. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba online

Global

Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Model

Deskripsi

Harga satuan

Kuota gratis

wan2.6-i2v Recommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

720P: $0,1/detik

1080P: $0,15/detik

Tidak ada kuota gratis

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Deskripsi

Harga satuan

Kuota gratis (Catatan)

Masa berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

wan2.6-i2v-flash Recommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

Output video dengan audio audio=true:

  • 720P: $0,05/detik

  • 1080P: $0,075/detik

Output video tanpa audio audio=false:

  • 720P: $0,025/detik

  • 1080P: $0,0375/detik

50 detik

wan2.6-i2v Recommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

720P: $0,10/detik

1080P: $0,15/detik

50 detik

wan2.5-i2v-preview

Pratinjau Wan 2.5. Mendukung dubbing otomatis dan unggah file audio kustom.

480P: $0,05/detik

720P: $0,10/detik

1080P: $0,15/detik

50 detik

wan2.2-i2v-flash

Edisi Flash Wan 2.2. Menawarkan kecepatan generasi sangat cepat dengan peningkatan signifikan pada detail visual dan stabilitas gerakan.

480P: $0,015/detik

720P: $0,036/detik

50 detik

wan2.2-i2v-plus

Edisi Profesional Wan 2.2. Memberikan peningkatan signifikan pada detail visual dan stabilitas gerakan.

480P: $0,02/detik

1080P: $0,10/detik

50 detik

wan2.1-i2v-turbo

Edisi Turbo Wan 2.1. Menawarkan kecepatan generasi cepat dengan performa seimbang.

$0,036/detik

200 detik

wan2.1-i2v-plus

Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya dan visual bertekstur berkualitas tinggi.

$0,10/detik

200 detik

AS

Dalam mode penyebaran AS, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi terbatas hanya di AS.

Model

Deskripsi

Harga satuan

Kuota gratis

wan2.6-i2v-us Recommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

720P: $0,1/detik

1080P: $0,15/detik

Tidak ada kuota gratis

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Deskripsi

Harga satuan

Kuota gratis

wan2.6-i2v-flash Recommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

Output video dengan audio audio=true:

  • 720P: $0,043006/detik

  • 1080P: $0,071676/detik

Output video tanpa audio audio=false:

  • 720P: $0,021503/detik

  • 1080P: $0,035838/detik

Tidak ada kuota gratis

wan2.6-i2v Recommended

Wan 2.6. Memperkenalkan fitur narasi multi-shot serta mendukung voiceover otomatis dan impor file audio kustom.

720P: $0,086012/detik

1080P: $0,143353/detik

Tidak ada kuota gratis

wan2.5-i2v-preview

Pratinjau Wan 2.5. Mendukung dubbing otomatis dan unggah file audio kustom.

480P: $0,043006/detik

720P: $0,086012/detik

1080P: $0,143353/detik

Tidak ada kuota gratis

wan2.2-i2v-plus

Edisi Profesional Wan 2.2. Memberikan peningkatan signifikan pada detail visual dan stabilitas gerakan.

480P: $0,02007/detik

1080P: $0,100347/detik

Tidak ada kuota gratis

wanx2.1-i2v-turbo

Edisi Turbo Wan 2.1. Menawarkan kecepatan generasi cepat dengan performa seimbang.

$0,034405/detik

Tidak ada kuota gratis

wanx2.1-i2v-plus

Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya dan visual bertekstur berkualitas tinggi.

$0,100347/detik

Tidak ada kuota gratis

Gambar-ke-video - frame pertama dan terakhir

Model video frame-pertama-dan-terakhir Wan menghasilkan video dinamis yang mulus dari prompt. Anda hanya perlu menyediakan gambar frame pertama dan terakhir. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba online

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Harga satuan

Kuota gratis (Catatan)

Masa berlaku: 90 hari setelah Anda mengaktifkan Model Studio

wan2.2-kf2v-flash

480P: USD0,015/detik

720P: USD0,036/detik

1080P: USD0,07/detik

50 detik

wan2.1-kf2v-plus

USD0,10/detik

200 detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Harga satuan

Kuota gratis (Catatan)

wan2.2-kf2v-flash

480P: $0,014335/detik

720P: $0,028671/detik

1080P: $0,068809/detik

Tidak ada kuota gratis

wanx2.1-kf2v-plus

$0,100347/detik

Tidak ada kuota gratis

Contoh input

Video output

Frame pertama

Frame terakhir

Prompt

first_frame

last_frame

Dengan gaya realistis, kamera dimulai dari ketinggian mata seekor kucing hitam kecil yang menatap langit, lalu perlahan bergerak ke atas hingga menghasilkan bidikan dari atas yang memfokuskan pada mata penuh rasa ingin tahu si kucing.

Referensi-ke-video

Model referensi-ke-video Wan menggunakan penampilan karakter dan suara dari video input serta prompt untuk menghasilkan video baru yang menjaga konsistensi karakter. Referensi API

Aturan penagihan: Video input dan output keduanya ditagih per detik. Pekerjaan yang gagal tidak dikenai biaya dan tidak mengurangi kuota gratis.

  • Durasi tagih video input tidak melebihi 5 detik. Untuk informasi selengkapnya, lihat Penagihan dan batas laju.

  • Durasi tagih video output adalah durasi dalam detik dari video yang berhasil dihasilkan.

Global

Dalam mode penyebaran Global, titik akses dan penyimpanan data berlokasi di wilayah US (Virginia), serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia.

Model

Harga input

Harga output

Kuota gratis (Catatan)

wan2.6-r2v

720P: $0,086012/detik

1080P: $0,143353/detik

720P: $0,1/detik

1080P: $0,15/detik

Tidak ada kuota gratis

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Harga input

Harga output

Kuota gratis (Catatan)

wan2.6-r2v

720P: USD 0,10/detik

1080P: USD 0,15/detik

720P: USD 0,10/detik

1080P: USD 0,15/detik

50 detik

Masa berlaku: 90 hari setelah Anda mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Harga input

Harga output

Kuota gratis (Catatan)

wan2.6-r2v

720P: $0,086012/detik

1080P: $0,143353/detik

720P: $0,086012/detik

1080P: $0,143353/detik

Tidak ada kuota gratis

Pengeditan video umum

Model pengeditan video umum Wan mendukung input multimodal, termasuk teks, gambar, dan video. Model ini dapat melakukan tugas generasi dan pengeditan video umum. Referensi API | Coba online

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Harga satuan

Kuota gratis (Catatan)

wan2.1-vace-plus

$0,1/detik

50 detik

Masa berlaku: Berlaku selama 90 hari setelah aktivasi Model Studio.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Harga satuan

Kuota gratis (Catatan)

wanx2.1-vace-plus

$0,100347/detik

Tidak ada kuota gratis

Model pengeditan video umum mendukung fitur-fitur berikut:

Fitur

Gambar referensi input

Prompt Masukan

Video output

Referensi multi-gambar

Gambar referensi 1 (entitas referensi)

image

Gambar referensi 2 (latar belakang referensi)

image

Dalam video, seorang gadis berjalan anggun keluar dari hutan kuno yang berkabut. Langkahnya ringan, dan kamera menangkap setiap gerakan lincahnya. Saat ia berhenti dan memandang sekeliling ke hutan yang rindang, senyum kejutan dan sukacita merekah di wajahnya. Adegan ini, yang membeku dalam interaksi antara cahaya dan bayangan, merekam pertemuannya yang indah dengan alam.

Video output

Pengecatan ulang video

Video menampilkan mobil bergaya steampunk berwarna hitam yang dikemudikan oleh seorang pria. Mobil tersebut dihiasi roda gigi dan pipa tembaga, dengan latar belakang pabrik permen bertenaga uap serta elemen retro yang menciptakan suasana vintage dan menyenangkan.

Pengeditan lokal

Video input

Gambar mask input (area putih menunjukkan area pengeditan)

mask

Video menampilkan kafe Prancis bergaya Paris tempat seekor singa berjas dengan elegan menyesap kopi. Ia memegang cangkir dengan satu tangan dan menyesap pelan sambil menunjukkan ekspresi santai. Kafe tersebut didekorasi dengan selera tinggi, menggunakan warna lembut dan pencahayaan hangat yang menerangi area tempat singa tersebut berada.

Konten di area pengeditan dimodifikasi berdasarkan prompt.

Ekstensi video

Klip pertama input (1 detik)

Seekor anjing yang mengenakan kacamata hitam sedang berseluncur di jalan, dalam gaya kartun 3D.

Video hasil ekstensi (5 detik)

Video outpainting

Seorang wanita elegan bersemangat memainkan biola, dengan orkestra simfoni lengkap di belakangnya.

Wan - manusia digital

Fitur ini menghasilkan video orang yang tampak alami saat berbicara, bernyanyi, atau tampil, berdasarkan satu gambar karakter dan file audio. Untuk menggunakan fitur ini, Anda dapat memanggil model-model berikut secara berurutan. Deteksi gambar wan2.2-s2v | Generasi video wan2.2-s2v

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Deskripsi

Harga satuan

wan2.2-s2v-detect

Memeriksa apakah gambar input memenuhi persyaratan, seperti resolusi yang cukup, hanya terdapat satu orang, dan tampilan wajah depan.

$0,000574/gambar

wan2.2-s2v

Menghasilkan video dinamis seseorang berdasarkan gambar yang valid dan klip audio.

480p: $0,071677/detik

720p: $0,129018/detik

Contoh input

Video output

p1001125-转换自-jpeg

Audio input:

Wan - gambar animasi

Tersedia dalam mode standar dan profesional. Model ini mentransfer tindakan dan ekspresi dari video referensi ke gambar karakter, menghasilkan video yang menganimasikan karakter dari gambar tersebut. Referensi API.

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Layanan

Deskripsi

Harga satuan

Kuota gratis (Lihat)

wan2.2-animate-move

Mode standar wan-std

Layanan hemat biaya dengan kecepatan generasi cepat, cocok untuk kebutuhan dasar seperti demo animasi sederhana.

$0,12/detik

Total durasi untuk kedua pola adalah 50 detik.

Mode profesional wan-pro

Memberikan kelancaran animasi tinggi dan transisi alami untuk tindakan serta ekspresi, menghasilkan output yang menyerupai video live-action.

$0,18/detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Layanan

Deskripsi

Harga satuan

Kuota gratis (Lihat)

wan2.2-animate-move

Mode standar wan-std

Generasi cepat, ideal untuk kebutuhan dasar seperti demo animasi sederhana, serta hemat biaya.

$0,06/detik

Tidak ada kuota gratis

Mode profesional wan-pro

Menyediakan animasi berkualitas tinggi dan lancar dengan transisi alami untuk tindakan dan ekspresi, menghasilkan output yang menyerupai video live-action.

$0,09/detik

Gambar Karakter

Video Referensi

Video Standar

Video Output (Professional Mode)

move_input_image

Wan - penukaran karakter video

Tersedia dalam mode standar dan profesional. Model ini mengganti karakter utama dalam video dengan karakter dari gambar. Model ini mempertahankan adegan, pencahayaan, dan rona video asli. Referensi API.

Internasional

Dalam mode penyebaran Internasional, titik akses dan penyimpanan data berlokasi di wilayah Singapura, serta sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia (tidak termasuk Tiongkok Daratan).

Model

Layanan

Deskripsi

Harga satuan

Kuota gratis (Lihat)

wan2.2-animate-mix

Mode standar wan-std

Menghasilkan animasi dengan cepat, ideal untuk kebutuhan dasar seperti demo sederhana, serta sangat hemat biaya.

$0,18/detik

Durasi gabungan kedua layanan adalah 50 detik.

Mode profesional wan-pro

Menghasilkan animasi sangat lancar dengan transisi alami untuk tindakan dan ekspresi, menghasilkan output yang sangat menyerupai video live-action.

$0,26/detik

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akses dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Layanan

Deskripsi

Harga satuan

Kuota gratis (Lihat)

wan2.2-animate-mix

Mode standar wan-std

Menghasilkan animasi dengan cepat, ideal untuk kebutuhan dasar seperti demo sederhana, serta sangat hemat biaya.

$0,09/detik

Tidak ada kuota gratis

Mode profesional wan-pro

Menghasilkan animasi sangat lancar dengan transisi alami untuk tindakan dan ekspresi, menghasilkan kualitas yang sangat menyerupai video live-action.

$0,13/detik

Gambar Karakter

Video Referensi

Standard video output

Video Output Profesional

mix_input_image

AnimateAnyone

Fitur ini menghasilkan video gerakan karakter berdasarkan gambar karakter dan templat gerakan. Untuk menggunakan fitur ini, Anda dapat memanggil ketiga model berikut secara berurutan. Detail API deteksi gambar AnimateAnyone | Generasi templat gerakan AnimateAnyone | Detail API generasi video AnimateAnyone

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Deskripsi

Harga satuan

animate-anyone-detect-gen2

Mendeteksi apakah gambar input memenuhi persyaratan.

$0,000574/gambar

animate-anyone-template-gen2

Mengekstraksi gerakan karakter dari video dan menghasilkan templat gerakan.

$0,011469/detik

animate-anyone-gen2

Menghasilkan video aksi karakter dari gambar karakter dan templat aksi.

Input: Gambar Karakter

Input: Video Gerakan

Output (Dihasilkan dari Latar Belakang Gambar)

Output (Dihasilkan dari Latar Belakang Video)

04-9_16

Catatan
  • Contoh di atas dihasilkan oleh Aplikasi Tongyi, yang mengintegrasikan AnimateAnyone.

  • Konten yang dihasilkan oleh model AnimateAnyone hanya berupa video dan tidak termasuk audio.

EMO

Fitur ini menghasilkan video potret dinamis berdasarkan gambar potret dan file audio suara manusia. Untuk menggunakan fitur ini, Anda dapat memanggil model-model berikut secara berurutan. Deteksi gambar EMO | Generasi video EMO

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Deskripsi

Harga satuan

emo-detect-v1

Mendeteksi apakah gambar input memenuhi spesifikasi yang ditentukan. Model ini dapat dipanggil langsung tanpa deployment.

$0,000574/gambar

emo-v1

Menghasilkan video potret dinamis. Model ini dapat dipanggil langsung tanpa deployment.

  • Video rasio aspek 1:1: $0,011469/detik

  • Video rasio aspek 3:4: $0,022937/detik

Input: Gambar potret dan file audio suara manusia

Output: Video potret dinamis

Potret:

上春山

Audio suara manusia: Lihat video di sebelah kanan.

Video karakter:

Tingkat gaya: aktif ("style_level": "active")

LivePortrait

Model ini menghasilkan video potret dinamis secara cepat dan efisien berdasarkan gambar potret dan file audio suara manusia. Dibandingkan dengan model EMO, model ini menghasilkan video lebih cepat dan dengan biaya lebih rendah, tetapi kualitasnya tidak sebaik EMO. Untuk menggunakan fitur ini, Anda dapat memanggil dua model berikut secara berurutan. Deteksi gambar LivePortrait | Generasi video LivePortrait

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Deskripsi

Harga Satuan

liveportrait-detect

Mendeteksi apakah gambar input memenuhi persyaratan.

$0,000574/gambar

liveportrait

Menghasilkan video potret dinamis.

$0,002868/detik

Input: Gambar potret dan audio suara

Output: Video potret animasi

Gambar potret:

Emoji男孩

Audio suara: Diambil dari video di sebelah kanan.

Video potret:

Emoji

Fitur ini menghasilkan video wajah dinamis berdasarkan gambar wajah dan templat gerakan wajah preset. Kemampuan ini dapat digunakan untuk skenario seperti membuat emoji dan menghasilkan materi video. Untuk menggunakan fitur ini, Anda dapat memanggil model-model berikut secara berurutan. Deteksi gambar Emoji | Generasi video Emoji

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Deskripsi

Harga satuan

emoji-detect-v1

Mendeteksi apakah gambar input memenuhi persyaratan tertentu.

$0,000574/gambar

emoji-v1

Menghasilkan emoji kustom berdasarkan gambar potret dan templat emoji yang ditentukan.

$0,011469/detik

Input: Gambar potret

Output: Video potret dinamis

image.png

Parameter untuk templat emoji "Happy": ("input.driven_id": "mengwa_kaixin")

VideoRetalk

Fitur ini menghasilkan video di mana gerakan bibir karakter sesuai dengan audio input, berdasarkan video karakter dan file audio suara manusia. Untuk menggunakan fitur ini, Anda dapat memanggil model berikut. Referensi API

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Deskripsi

Harga satuan

videoretalk

Menyinkronkan gerakan bibir karakter dengan audio input untuk menghasilkan video baru.

$0,011469/detik

Transformasi gaya video

Model ini menghasilkan video dalam gaya berbeda yang sesuai dengan deskripsi semantik dari teks input pengguna, atau mengubah gaya video input pengguna. Referensi API

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, serta sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Description

Unit price

video-style-transform

Mengubah video input menjadi gaya seperti komik Jepang dan komik Amerika.

720P

$0.071677/second

540P

$0.028671/second

Video masukan

Video output (gaya Manga)

Sintesis suara (teks-ke-ucapan)

Sintesis suara Qwen

Fitur ini mendukung input teks campuran multibahasa dan menyediakan output audio streaming. Penggunaan | Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Version

Price

Maximum input characters

Supported languages

Free quota (Catatan)

qwen3-tts-flash

Kemampuan yang sama dengan qwen3-tts-flash-2025-09-18.

Stable

$0,10 per 10.000 karakter

600

Bahasa Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

2.000 karakter jika Anda mengaktifkan Model Studio sebelum pukul 00.00 pada 13 November 2025.

10.000 karakter jika Anda mengaktifkan Model Studio pada atau setelah pukul 00.00 pada 13 November 2025.

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen3-tts-flash-2025-11-27

Snapshot

10.000 karakter

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen3-tts-flash-2025-09-18

Snapshot

2.000 karakter jika Anda mengaktifkan Model Studio sebelum pukul 00.00 pada 13 November 2025.

10.000 karakter jika Anda mengaktifkan Model Studio pada atau setelah pukul 00.00 pada 13 November 2025.

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:

  • Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.

  • Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Qwen3-TTS-Flash

Model

Versi

Harga

Karakter input maks

Bahasa yang didukung

Kuota gratis (Catatan)

qwen3-tts-flash

Kemampuan yang setara dengan qwen3-tts-flash-2025-09-18.

Stable

$0,114682/10.000 karakter

600

Bahasa Tionghoa (Mandarin, Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

Tidak ada kuota gratis

qwen3-tts-flash-2025-11-27

Snapshot

qwen3-tts-flash-2025-09-18

Snapshot

Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:

  • Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.

  • Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.

Qwen-TTS

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

Kuota gratis (Catatan)

(Token)

(per 1.000 token)

qwen-tts

Model ini memiliki kemampuan yang sama dengan qwen-tts-2025-04-10.

Stable

8.192

512

7.680

$0,230

$1,434

Tidak ada kuota gratis

qwen-tts-latest

Model ini selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.

Latest

qwen-tts-2025-05-22

Snapshot

qwen-tts-2025-04-10

Audio dikonversi ke token dengan laju 50 token per detik. Klip audio yang durasinya kurang dari 1 detik ditagih sebagai 50 token.

Sintesis suara real-time Qwen

Fitur ini mendukung input teks streaming dan output audio streaming. Fitur ini secara otomatis menyesuaikan laju ucapan berdasarkan konten teks dan tanda baca. Penggunaan | Referensi API

Qwen3-TTS-VD-Realtime mendukung sintesis suara real-time dengan suara voice design, tetapi tidak mendukung suara default.

Qwen3-TTS-VC-Realtime mendukung sintesis suara real-time dengan suara cloned voices, tetapi tidak mendukung suara default.

Qwen3-TTS-Flash-Realtime dan Qwen-TTS-Realtime hanya mendukung suara default dan tidak mendukung suara cloned maupun designed.

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Qwen3-TTS-VD-Realtime

Model

Versi

Harga

Bahasa yang Didukung

Kuota Gratis (Catatan)

qwen3-tts-vd-realtime-2025-12-16

Snapshot

$0,143353/10.000 karakter

Bahasa Tionghoa, Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

10.000 karakter

Masa berlaku: Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:

  • Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.

  • Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.

Qwen3-TTS-VC-Realtime

Model

Versi

Harga

Bahasa yang Didukung

Kuota Gratis (Catatan)

qwen3-tts-vc-realtime-2025-11-27

Snapshot

$0,13/10.000 karakter

Bahasa Tionghoa, Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

10.000 karakter

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:

  • Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.

  • Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.

Qwen3-TTS-Flash-Realtime

Model

Version

Price

Supported languages

Free quota (Catatan)

qwen3-tts-flash-realtime

Model ini memiliki kemampuan yang sama dengan qwen3-tts-flash-realtime-2025-09-18.

Stable

$0,13/10.000 karakter

Bahasa Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

Jika Anda mengaktifkan Model Studio sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter

Jika Anda mengaktifkan Model Studio pada atau setelah pukul 00.00 pada 13 November 2025: 10.000 karakter

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

qwen3-tts-flash-realtime-2025-11-27

Snapshot

10.000 karakter

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

qwen3-tts-flash-realtime-2025-09-18

Snapshot

Jika Anda mengaktifkan Model Studio sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter

Jika Anda mengaktifkan Model Studio pada atau setelah pukul 00.00 pada 13 November 2025: 10.000 karakter

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:

  • Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.

  • Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Qwen3-TTS-VD-Realtime

Model

Versi

Harga

Bahasa yang Didukung

Kuota Gratis (Catatan)

qwen3-tts-vd-realtime-2025-12-16

Snapshot

$0,143353 per 10.000 karakter

Bahasa Tionghoa, Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

Tidak ada kuota gratis

Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:

  • Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.

  • Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.

Qwen3-TTS-VC-Realtime

Model

Versi

Harga

Bahasa yang Didukung

Kuota gratis (Catatan)

qwen3-tts-vc-realtime-2025-11-27

Snapshot

$0,143353/10.000 karakter

Bahasa Tionghoa, Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

Tidak ada kuota gratis

Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:

  • Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.

  • Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.

Qwen3-TTS-Flash-Realtime

Model

Versi

Harga

Bahasa yang didukung

Kuota gratis (Catatan)

qwen3-tts-flash-realtime

Fungsional identik dengan qwen3-tts-flash-realtime-2025-09-18.

Stable

$0,143353/10.000 karakter

Bahasa Tionghoa (Mandarin, Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

Tidak ada kuota gratis

qwen3-tts-flash-realtime-2025-11-27

Snapshot

qwen3-tts-flash-realtime-2025-09-18

Snapshot

Tagihan dihitung berdasarkan jumlah karakter input. Aturan perhitungannya sebagai berikut:

  • Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter.

  • Karakter lainnya, seperti huruf Latin, tanda baca, atau spasi, dihitung sebagai 1 karakter.

Qwen-TTS-Realtime

Model

Versi

Jendela konteks

Input maks

Output Maksimum

Biaya input

Biaya output

Bahasa yang didukung

Kuota gratis (Catatan)

(Token)

(per 1.000 token)

qwen-tts-realtime

Model ini memiliki kemampuan yang sama dengan qwen-tts-realtime-2025-07-15.

Stable

8.192

512

7.680

$0,345

$1,721

Bahasa Tionghoa, Inggris

Tidak ada kuota gratis

qwen-tts-realtime-latest

Model ini memiliki kemampuan yang sama dengan qwen-tts-realtime-2025-07-15.

Latest

Bahasa Tionghoa, Inggris

qwen-tts-realtime-2025-07-15

Snapshot

Bahasa Tionghoa, Inggris

Audio dikonversi ke token dengan laju 50 token per detik. Klip audio yang durasinya kurang dari 1 detik ditagih sebagai 50 token.

Kloning suara Qwen

Kloning suara menggunakan model untuk ekstraksi fitur guna mengkloning suara tanpa pelatihan. Anda dapat memberikan rekaman audio selama 10 hingga 20 detik saja untuk menghasilkan suara kustom yang sangat mirip dan terdengar alami. Penggunaan | Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Harga

Kuota gratis (Catatan)

qwen-voice-enrollment

$0,01/suara

1.000 suara

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Harga

Kuota gratis (Catatan)

qwen-voice-enrollment

$0,01/suara

Tidak ada kuota gratis

Desain suara Qwen

Desain suara menghasilkan suara kustom dari deskripsi teks. Fitur ini mendukung definisi fitur suara multibahasa dan multidimensi. Fitur ini cocok untuk berbagai aplikasi, seperti pengisi suara iklan, pembuatan karakter, dan pembuatan konten audio. Penggunaan | Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Harga

Kuota gratis (Catatan)

qwen-voice-design

$0,20 per suara

10 timbre

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Harga

Kuota gratis (Catatan)

qwen-voice-design

$0,20 per suara

Tidak ada kuota gratis

Sintesis suara CosyVoice

CosyVoice adalah model sintesis suara generatif generasi berikutnya dari Tongyi Lab. Dibangun di atas model bahasa pre-train skala besar, CosyVoice mengintegrasikan pemahaman teks dan generasi suara secara mendalam serta mendukung sintesis teks-ke-ucapan streaming real-time. Penggunaan | Referensi API

Catatan

Hanya mode penyebaran Tiongkok Daratan yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Harga

Kuota gratis (Catatan)

cosyvoice-v3-plus

$0,286706 per 10.000 karakter

Tidak ada kuota gratis

cosyvoice-v3-flash

$0,14335 per 10.000 karakter

cosyvoice-v2

$0,286706 per 10.000 karakter

Perhitungan karakter dilakukan sebagai berikut: Setiap karakter Tionghoa, termasuk Tionghoa sederhana dan tradisional, Kanji Jepang, serta Hanja Korea, dihitung sebagai 2 karakter. Karakter lainnya, seperti huruf, angka, Kana Jepang, dan Hangul Korea, dihitung sebagai 1 karakter. Konten dalam tag SSML tidak dikenai biaya.

Speech recognition (speech-to-text) dan translation (speech-to-translation)

Qwen3-LiveTranslate-Flash

Qwen3-LiveTranslate-Flash-Realtime

Qwen3-LiveTranslate-Flash-Realtime adalah model multibahasa untuk terjemahan audio dan video real-time. Model ini mengenali 18 bahasa dan menyediakan terjemahan audio real-time dalam 10 bahasa.

Fitur utama:

  • Dukungan multibahasa: Mendukung 18 bahasa dan 6 dialek Tiongkok, termasuk Tiongkok, Inggris, Prancis, Jerman, Rusia, Jepang, dan Korea. Model ini juga mendukung dialek seperti Mandarin, Kanton, dan Sichuan.

  • Peningkatan berbasis visi: Menggunakan konten visual untuk meningkatkan akurasi terjemahan. Model ini menganalisis petunjuk visual, seperti gerakan bibir, tindakan, dan teks pada layar, guna meningkatkan akurasi terjemahan di lingkungan bising atau ketika ucapan ambigu.

  • Latensi 3 detik: Mencapai latensi interpretasi simultan serendah 3 detik.

  • Interpretasi simultan tanpa kehilangan kualitas: Mengatasi masalah urutan kata lintas bahasa menggunakan teknologi prediksi unit semantik. Kualitas terjemahan real-time setara dengan terjemahan offline.

  • Suara alami: Menghasilkan suara yang natural dan menyerupai manusia. Model ini secara otomatis menyesuaikan nada dan emosi berdasarkan konten audio sumber.

Penggunaan | Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Versi

Context window

Max input

Max output

Kuota gratis

(Catatan)

(Tokens)

qwen3-livetranslate-flash-realtime

Model ini memiliki kemampuan yang sama dengan qwen3-livetranslate-flash-realtime-2025-09-22.

Stable

53.248

49.152

4.096

1 juta token untuk setiap versi

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

qwen3-livetranslate-flash-realtime-2025-09-22

Snapshot

Setelah kuota gratis habis, penagihan untuk input dan output dihitung sebagai berikut:

Billing Item

Harga (per juta token)

Input: Audio

$10

Input: Image

$1,3

Billing Items for Output

Harga (per juta token)

Text

$10

Audio

$38

Perhitungan token:

  • Audio: Setiap detik audio input atau output mengonsumsi 12,5 token.

  • Image: Setiap input 28 × 28 piksel mengonsumsi 0,5 token.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Versi

Context window

Max input

Max output

Kuota gratis (Catatan)

(Tokens)

qwen3-livetranslate-flash-realtime

Model ini memiliki kemampuan yang sama dengan qwen3-livetranslate-flash-realtime-2025-09-22.

Stable

53.248

49.152

4.096

Tidak ada kuota gratis

qwen3-livetranslate-flash-realtime-2025-09-22

Snapshot

Penagihan untuk input dan output dihitung sebagai berikut:

Billing Item Input

Harga (per juta token)

Input: Audio

9.175,00

Input image

$1,147

Billable Items for Output

Harga (per juta token)

Text

Rp9.175,00

Audio

$34,405

Perhitungan token:

  • Audio: Setiap detik audio input atau output mengonsumsi 12,5 token.

  • Image: Setiap input 28 × 28 piksel mengonsumsi 0,5 token.

Pengenalan file audio Qwen

Berdasarkan model dasar multimodal Qwen, fitur ini mendukung pengenalan multibahasa, pengenalan nyanyian, dan penolakan noise. Penggunaan | Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Qwen3-ASR-Flash-Filetrans

Model

Versi

Bahasa yang didukung

Laju sampel yang didukung

Harga

Kuota gratis (Catatan)

qwen3-asr-flash-filetrans

Menyediakan kemampuan yang sama dengan qwen3-asr-flash-filetrans-2025-11-17.

Stable

Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia

Apa saja

$0,000035/detik

36.000 detik (10 jam)

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen3-asr-flash-filetrans-2025-11-17

Snapshot

Qwen3-ASR-Flash

Model

Versi

Bahasa yang didukung

Laju sampel yang didukung

Harga satuan

Kuota gratis (Catatan)

qwen3-asr-flash

Memiliki kemampuan yang sama dengan qwen3-asr-flash-2025-09-08.

Stable

Tiongkok (Mandarin, Sichuan, Minnan, Wu, Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia

Apa saja

$0,000035/detik

36.000 detik (10 jam)

Masa berlaku: Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen3-asr-flash-2025-09-08

Snapshot

AS

Dalam mode penyebaran AS, titik akhir dan penyimpanan data berlokasi di wilayah AS (Virginia), dan sumber daya komputasi inferensi dibatasi hanya di Amerika Serikat.

Model

Versi

Bahasa yang Didukung

Laju Sampel yang Didukung

Harga

Kuota Gratis (Catatan)

qwen3-asr-flash-us

Model ini menyediakan kemampuan yang sama dengan qwen3-asr-flash-2025-09-08-us.

Stable

Tiongkok (Mandarin, Sichuan, Minnan, Wu, Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia

Apa saja

$0,000035/detik

Tidak ada kuota gratis

qwen3-asr-flash-2025-09-08-us

Snapshot

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Qwen3-ASR-Flash-Filetrans

Model

Versi

Bahasa yang didukung

Laju sampel yang didukung

Harga

Kuota gratis (Catatan)

qwen3-asr-flash-filetrans

Ekuivalen saat ini: qwen3-asr-flash-filetrans-2025-11-17

Stable

Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia

Apa saja

$0,000032/detik

Tidak ada kuota gratis

qwen3-asr-flash-filetrans-2025-11-17

Snapshot

Qwen3-ASR-Flash

Model

Versi

Bahasa yang Didukung

Laju Sampel yang Didukung

Harga

Kuota Gratis (Catatan)

qwen3-asr-flash

Fungsional identik dengan qwen3-asr-flash-2025-09-08.

Stable

Tiongkok (Mandarin, Sichuan, Minnan, Wu, Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia

Apa saja

$0,000032/detik

Tidak ada kuota gratis

qwen3-asr-flash-2025-09-08

Snapshot

Pengenalan ucapan real-time Qwen

Model pengenalan ucapan real-time Qwen menyediakan deteksi bahasa otomatis. Model ini mendeteksi 11 jenis ucapan dan mentranskripsi audio secara akurat di lingkungan kompleks. Penggunaan | Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Versi

Bahasa yang didukung

Laju sampel yang didukung

Harga

Kuota gratis (Catatan)

qwen3-asr-flash-realtime

Memiliki kemampuan yang sama dengan qwen3-asr-flash-realtime-2025-10-27.

Stable

Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia

8 kHz, 16 kHz

$0,00009/detik

36.000 detik (10 jam)

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

qwen3-asr-flash-realtime-2025-10-27

Snapshot

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Versi

Bahasa yang didukung

Laju sampel yang didukung

Harga

Kuota gratis (Catatan)

qwen3-asr-flash-realtime

Model ini memiliki kemampuan yang setara dengan qwen3-asr-flash-realtime-2025-10-27.

Stable

Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Turki, Ukraina, Vietnam, Ceko, Denmark, Filipina, Finlandia, Islandia, Melayu, Norwegia, Polandia, dan Swedia

8 kHz, 16 kHz

$0,000047/detik

Tidak ada kuota gratis

qwen3-asr-flash-realtime-2025-10-27

Snapshot

Pengenalan ucapan Paraformer

Paraformer adalah model pengenalan ucapan dari Tongyi Lab. Model ini tersedia dalam dua versi: pengenalan file audio dan pengenalan ucapan real-time.

Pengenalan file audio

Penggunaan | Referensi API

Catatan

Hanya mendukung mode penyebaran Tiongkok Daratan. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Bahasa yang Didukung

Laju Sampel yang Didukung

Skenario

Format Audio yang Didukung

Harga

Kuota gratis (Catatan)

paraformer-v2

Tiongkok (Mandarin, Kanton, Wu, Minnan, Timur Laut, Gansu, Guizhou, Henan, Hubei, Hunan, Ningxia, Shanxi, Shaanxi, Shandong, Sichuan, Tianjin, Jiangxi, Yunnan, Shanghai), Inggris, Jepang, Korea, Jerman, Prancis, Rusia

Apa saja

Live stream

aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, wmv

$0,000012/detik

Tidak ada kuota gratis

paraformer-8k-v2

Tiongkok (Mandarin)

8 kHz

Panggilan telepon

Pengenalan ucapan real-time

Penggunaan | Referensi API

Catatan

Hanya mendukung mode penyebaran Tiongkok Daratan. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Bahasa yang Didukung

Laju Sampel yang Didukung

Skenario

Format Audio yang Didukung

Harga

Kuota gratis (Catatan)

paraformer-realtime-v2

Tiongkok (Mandarin, Kanton, Wu, Minnan, Timur Laut, Gansu, Guizhou, Henan, Hubei, Hunan, Ningxia, Shanxi, Shaanxi, Shandong, Sichuan, Tianjin, Jiangxi, Yunnan, dan Shanghai), Inggris, Jepang, Korea, Jerman, Prancis, dan Rusia

Anda dapat beralih di antara beberapa bahasa.

Apa saja

Streaming video langsung dan konferensi

pcm, wav, mp3, opus, speex, aac, amr

$0,000035/detik

Tidak ada kuota gratis

paraformer-realtime-8k-v2

Tiongkok (Mandarin)

8 kHz

Pusat panggilan dan lainnya

Pengenalan ucapan Fun-ASR

Fun-ASR adalah model pengenalan ucapan dari seri Tongyi Fun. Model ini tersedia dalam dua versi: pengenalan file audio dan pengenalan ucapan real-time.

Pengenalan file audio

Penggunaan | Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Version

Bahasa yang didukung

Laju sampel yang didukung

Skenario

Format audio yang didukung

Harga

Kuota gratis (Catatan)

fun-asr

Kemampuannya sama dengan fun-asr-2025-11-07.

Stable

Bahasa Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, dan Jin), aksen Mandarin dari wilayah seperti Zhongyuan, Barat Daya, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Timur Laut, Beijing, Hong Kong, dan Taiwan (termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia), bahasa Inggris, dan bahasa Jepang

Apa saja

Live stream, panggilan telepon, interpretasi konferensi, dan lainnya

aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, dan wmv

$0,000035/detik

36.000 detik (10 jam)

Berlaku selama 90 hari

fun-asr-2025-11-07

Dibandingkan dengan fun-asr-2025-08-25, versi ini dioptimalkan untuk VAD jarak jauh guna meningkatkan akurasi pengenalan.

Snapshot

fun-asr-2025-08-25

Bahasa Tiongkok (Mandarin), bahasa Inggris

fun-asr-mtl

Kemampuannya sama dengan fun-asr-mtl-2025-08-25.

Stable

Bahasa Tiongkok (Mandarin dan Kanton), bahasa Inggris, Jepang, Korea, Vietnam, Indonesia, Thailand, Melayu, Filipina, Arab, Hindi, Bulgaria, Kroasia, Ceko, Denmark, Belanda, Estonia, Finlandia, Yunani, Hongaria, Irlandia, Latvia, Lituania, Malta, Polandia, Portugis, Rumania, Slowakia, Slovenia, dan Swedia

fun-asr-mtl-2025-08-25

Snapshot

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Versi

Bahasa yang didukung

Laju sampel yang didukung

Skenario

Format audio yang didukung

Harga

Kuota gratis (Catatan)

fun-asr

Kemampuan yang sama dengan fun-asr-2025-11-07.

Stable

Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, dan Jin), aksen Mandarin dari wilayah seperti Zhongyuan, Barat Daya, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Timur Laut, Beijing, Hong Kong, dan Taiwan (termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia), Inggris, dan Jepang

Apa saja

Live stream, panggilan telepon, interpretasi konferensi, dan lainnya

aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, dan wmv

$0,000032/detik

Tidak ada kuota gratis

fun-asr-2025-11-07

Dibandingkan dengan fun-asr-2025-08-25, versi ini dioptimalkan untuk VAD jarak jauh guna meningkatkan akurasi pengenalan.

Snapshot

fun-asr-2025-08-25

Tiongkok (Mandarin), Inggris

fun-asr-mtl

Kemampuan yang sama dengan fun-asr-mtl-2025-08-25.

Stable

Tiongkok (Mandarin dan Kanton), Inggris, Jepang, Korea, Vietnam, Indonesia, Thailand, Melayu, Filipina, Arab, Hindi, Bulgaria, Kroasia, Ceko, Denmark, Belanda, Estonia, Finlandia, Yunani, Hongaria, Irlandia, Latvia, Lithuania, Malta, Polandia, Portugis, Rumania, Slowakia, Slovenia, dan Swedia

fun-asr-mtl-2025-08-25

Snapshot

Pengenalan ucapan real-time

Penggunaan | Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Versi

Bahasa yang didukung

Laju sampel yang didukung

Skenario

Format audio yang didukung

Harga

Kuota gratis (Catatan)

fun-asr-realtime

Kemampuan model ini sama dengan fun-asr-realtime-2025-11-07.

Stable

Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, dan Jin), Inggris, dan Jepang. Model ini juga mendukung aksen Mandarin dari wilayah seperti Zhongyuan, Barat Daya, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Timur Laut, Beijing, Hong Kong, dan Taiwan. Selain itu, model ini mendukung aksen dari wilayah seperti Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia.

16 kHz

Streaming video langsung, konferensi video, pusat panggilan, dan lainnya

pcm, wav, mp3, opus, speex, aac, dan amr

$0,00009/detik

36.000 detik (10 jam)

Berlaku selama 90 hari.

fun-asr-realtime-2025-11-07

Snapshot

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Tiongkok (Beijing), dan sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Version

Supported languages

Supported sample rates

Scenarios

Supported audio formats

Price

Free quota (Note)

fun-asr-realtime

Model ini memiliki kemampuan yang sama dengan fun-asr-realtime-2025-11-07.

Stable

Bahasa Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, dan Jin), Inggris, dan Jepang. Model ini juga mendukung aksen Mandarin dari wilayah seperti Zhongyuan, Southwest, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Northeast, Beijing, Hong Kong, dan Taiwan. Selain itu, model ini mendukung aksen dari wilayah seperti Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia.

16 kHz

Live video streaming, video conferences, call centers, dan lainnya

pcm, wav, mp3, opus, speex, aac, dan amr

$0.000047/second

Tidak ada kuota gratis

fun-asr-realtime-2025-11-07

Dibandingkan dengan fun-asr-realtime-2025-09-15, versi ini dioptimalkan untuk VAD jarak jauh guna meningkatkan akurasi pengenalan.

Snapshot

fun-asr-realtime-2025-09-15

Bahasa Tiongkok (Mandarin), Inggris

Penyematan teks

Model penyematan teks mengonversi teks menjadi representasi numerik untuk tugas-tugas seperti pencarian, pengelompokan, rekomendasi, dan klasifikasi. Penagihan untuk model-model ini didasarkan pada jumlah token input. Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapore. Sumber daya komputasi inferensi dijadwalkan secara global, tidak termasuk Tiongkok Daratan.

Model

Embedding dimensions

Batch size

Max tokens per batch (Catatan)

Supported languages

Harga

(Juta input token)

Free quota

(Catatan)

text-embedding-v4

Bagian dari seri Qwen3-Embedding

2.048, 1.536, 1.024 (default), 768, 512, 256, 128, atau 64

10

8.192

Lebih dari 100 bahasa utama, seperti Chinese, English, Spanish, French, Portuguese, Indonesian, Japanese, Korean, German, dan Russian, serta berbagai bahasa pemrograman

$0,07

1 juta token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

text-embedding-v3

1.024 (default), 768, atau 512

10

8.192

Lebih dari 50 bahasa, seperti Chinese, English, Spanish, French, Portuguese, Indonesian, Japanese, Korean, German, dan Russian

500.000 token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Beijing. Sumber daya komputasi inferensi dibatasi hanya di Tiongkok Daratan.

Model

Dimensi penyematan

Ukuran batch

Token maks per batch (Catatan)

Bahasa yang didukung

Harga

(Juta token input)

Kuota gratis

(Catatan)

text-embedding-v4

Bagian dari seri Qwen3-Embedding
Batch separuh harga

2.048, 1.536, 1.024 (default), 768, 512, 256, 128, atau 64

10

8.192

Lebih dari 100 bahasa utama, termasuk Tiongkok, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, dan Rusia, serta berbagai bahasa pemrograman

$0,072

Tidak ada kuota gratis

Catatan

Ukuran batch adalah jumlah maksimum teks yang dapat diproses dalam satu panggilan API. Misalnya, ukuran batch untuk text-embedding-v4 adalah 10. Artinya, satu permintaan dapat membuat vektor hingga 10 teks, dan setiap teks tidak boleh melebihi 8.192 token. Batasan ini berlaku untuk:

  • Input array string: Array dapat berisi hingga 10 elemen.

  • Input file: File teks dapat berisi hingga 10 baris teks.

Multimodal embedding

Model multimodal embedding mengonversi teks, gambar, dan video menjadi vektor bilangan titik mengambang. Model ini cocok untuk aplikasi seperti klasifikasi video, klasifikasi gambar, dan pengambilan gambar-teks. Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapore. Sumber daya komputasi inferensi dijadwalkan secara global, tidak termasuk Tiongkok Daratan.

Model

Jenis data

Dimensi embedding

Harga satuan (per juta token input)

Kuota gratis (Catatan)

tongyi-embedding-vision-plus

float(32)

1.152

$0,09

1 juta token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

tongyi-embedding-vision-flash

float(32)

768

Gambar/Video: $0,03

Teks: $0,09

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Beijing. Sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Jenis data

Dimensi embedding

Harga (per 1.000 token input)

Kuota gratis (Catatan)

multimodal-embedding-v1

float(32)

1.024

Uji coba gratis

Tanpa batas token

Text rerank

Fitur ini biasanya digunakan untuk semantic retrieval. Diberikan sebuah kueri, fitur ini mengurutkan daftar dokumen kandidat dalam urutan menurun berdasarkan relevansi semantiknya. Referensi API

Internasional

Dalam mode penyebaran internasional, titik akhir dan penyimpanan data berlokasi di wilayah Singapore. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, tidak termasuk Tiongkok Daratan.

Model

Jumlah Maksimum Dokumen

Token Input Maksimum per Item

Token Input Maksimum

Bahasa yang Didukung

Harga (per juta token input)

qwen3-rerank

500

4.000

30.000

Lebih dari 100 bahasa utama, seperti Tionghoa, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, dan Rusia

$0,1

  • Token input maksimum per item: Setiap kueri atau dokumen dibatasi hingga 4.000 token. Input yang melebihi batas ini akan dipotong.

  • Jumlah maksimum dokumen: Setiap permintaan dibatasi hingga 500 dokumen.

  • Token input maksimum: Jumlah total token untuk semua kueri dan dokumen dalam satu permintaan dibatasi hingga 30.000.

Tiongkok Daratan

Dalam mode penyebaran Tiongkok Daratan, titik akhir dan penyimpanan data berlokasi di wilayah Beijing. Sumber daya komputasi inferensi terbatas hanya di Tiongkok Daratan.

Model

Jumlah Maksimum Dokumen

Token Input Maksimum per Item

Token Input Maksimum

Bahasa yang Didukung

Harga (per Juta Token Input)

gte-rerank-v2

500

4.000

30.000

Lebih dari 50 bahasa, termasuk Tionghoa, Inggris, Jepang, Korea, Thailand, Spanyol, Prancis, Portugis, Jerman, Indonesia, dan Arab

$0,115

  • Token input maksimum per item: Setiap kueri atau dokumen dibatasi hingga 4.000 token. Input yang melebihi batas ini akan dipotong.

  • Jumlah maksimum dokumen: Setiap permintaan dibatasi hingga 500 dokumen.

  • Token input maksimum: Jumlah total token untuk semua kueri dan dokumen dalam satu permintaan dibatasi hingga 30.000.

Domain specific

Intent recognition

Model pengenalan maksud Qwen dapat mengurai maksud pengguna secara cepat dan akurat dalam hitungan milidetik serta memilih alat yang sesuai untuk menyelesaikan masalah pengguna. Referensi API | Penggunaan

Catatan

Hanya mode penyebaran Mainland China yang didukung. Dalam mode ini, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing, dan sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

tongyi-intent-detect-v3

8.192

8.192

1.024

$0,058

$0,144

Role playing

Model role-playing Qwen sangat ideal untuk skenario yang memerlukan percakapan menyerupai manusia, seperti interaksi sosial virtual, NPC dalam game, replikasi karakter IP, perangkat keras, mainan, dan sistem dalam kendaraan. Dibandingkan model Qwen lainnya, model ini menawarkan kemampuan yang lebih baik dalam hal kesetiaan karakter, perkembangan percakapan, dan kemampuan mendengarkan secara empatik. Penggunaan

International

Dalam international deployment mode, titik akhir dan penyimpanan data berlokasi di Wilayah Singapura. Sumber daya komputasi inferensi dijadwalkan secara dinamis di seluruh dunia, kecuali Mainland China.

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-plus-character-ja

8.192

7.680

512

$0,5

$1,4

Mainland China

Dalam deployment mode Mainland China, titik akhir dan penyimpanan data berlokasi di Wilayah Beijing. Sumber daya komputasi inferensi dibatasi hanya untuk Mainland China.

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-plus-character

32.768

32.000

4.096

$0,115

$0,287

Model yang Telah Dipensiunkan

Dipensiunkan pada 20 Agustus 2025

Qwen2

Model open-source Qwen2 dari Alibaba Cloud. Penggunaan | Referensi API | Coba secara online

Model

Context window

Max input

Max output

Input cost

Output cost

Alternative models

(Tokens)

(Million tokens)

qwen2-72b-instruct

131.072

128.000

6.144

Gratis untuk waktu terbatas

Qwen3, DeepSeek, Kimi, dan lainnya

qwen2-57b-a14b-instruct

65.536

63.488

qwen2-7b-instruct

131.072

128.000

Qwen1.5

Model open-source Qwen1.5 dari Alibaba Cloud. Penggunaan | Referensi API | Coba secara online

Model

Context window

Max input

Max output

Input cost

Output cost

Alternative models

(Tokens)

(Juta token)

qwen1.5-110b-chat

8.000

6.000

2.000

Gratis untuk waktu terbatas

Qwen3, DeepSeek, Kimi, dan lainnya

qwen1.5-72b-chat

qwen1.5-32b-chat

qwen1.5-14b-chat

qwen1.5-7b-chat