全部产品
Search
文档中心

Alibaba Cloud Model Studio:Model

更新时间:Nov 28, 2025

Model unggulan

Internasional (Singapura)

Model unggulan

通义new Qwen-Max

Ideal untuk tugas kompleks. Model paling kuat.

通义new Qwen-Plus

Keseimbangan antara performa, kecepatan, dan biaya.

通义new Qwen-Flash

Ideal untuk pekerjaan sederhana. Cepat dan hemat biaya.

通义new Qwen-Coder

Model kode yang sangat baik, unggul dalam pemanggilan alat dan interaksi lingkungan.

Jendela konteks maksimum

(Token)

262,144

1,000,000

1,000,000

1,000,000

Harga input minimum

(Juta token)

$1.2

$0.4

$0.05

$0.3

Harga output minimum

(Juta token)

$6

$1.2

$0.4

$1.5

Tiongkok daratan (Beijing)

Model unggulan

通义new Qwen-Max

Ideal untuk tugas kompleks. Model paling kuat.

通义new Qwen-Plus

Keseimbangan antara performa, kecepatan, dan biaya.

通义new Qwen-Flash

Ideal untuk pekerjaan sederhana. Cepat dan hemat biaya.

通义new Qwen-Coder

Model kode yang sangat baik, unggul dalam pemanggilan alat dan interaksi lingkungan.

Jendela konteks maksimum

(Token)

262,144

1,000,000

1,000,000

1,000,000

Harga input minimum

(Juta token)

$0.459

$0.115

$0.022

$0.144

Harga output minimum

(Juta token)

$1.836

$0.287

$0.216

$0.574

Ikhtisar model

Internasional (Singapura)

Kategori

Subkategori

Deskripsi

Generasi teks

Model bahasa besar tujuan umum

Model bahasa besar Qwen: model komersial (Qwen-Max, Qwen-Plus, Qwen-Flash), model open-source (Qwen3, Qwen2.5)

Model multimodal

Model pemahaman visual Qwen-VL, model penalaran visual QVQ, model omni-modal Qwen-Omni, dan model multi-modal real-time Qwen-Omni-Realtime

Model spesifik domain

Model coder, Model terjemahan, Model role-playing

Generasi gambar

Teks-ke-gambar

Pengeditan gambar

  • Qwen pengeditan gambar: Mendukung prompt Tiongkok dan Inggris serta memungkinkan Anda melakukan operasi pengeditan gambar dan teks kompleks seperti style transfer, modifikasi teks, dan pengeditan objek.

  • Wan pengeditan gambar: Menghasilkan atau mengedit gambar. Fitur ini cocok untuk membuat foto ID, gambar utama e-dagang, foto model, dan potret dalam berbagai gaya (seperti kartun, gaya Tiongkok, dan anime). Fitur ini juga dapat digunakan untuk matting gambar, menghasilkan latar belakang, memodifikasi elemen gambar, dan lainnya.

Sintesis dan pengenalan ucapan

Sintesis ucapan (teks-ke-ucapan)

Qwen-TTS dan Qwen-TTS-Realtime dapat digunakan untuk teks-ke-ucapan dalam skenario seperti layanan pelanggan suara cerdas, buku audio, navigasi dalam mobil, dan bimbingan pendidikan.

Pengenalan dan terjemahan ucapan

Qwen-ASR-Realtime, Qwen-ASR, Qwen3-LiveTranslate-Flash-Realtime dan Fun-ASR dapat melakukan ucapan-ke-teks untuk skenario seperti catatan rapat real-time, keterangan siaran langsung real-time, dan layanan pelanggan telepon.

Generasi video

Teks-ke-video

Menghasilkan video berkualitas tinggi dengan gaya kaya dari satu kalimat.

Gambar-ke-video

  • Frame-pertama-ke-video: Menggunakan gambar input sebagai frame pertama dan menghasilkan video berdasarkan prompt.

  • Frame-pertama-dan-terakhir-ke-video: Menghasilkan video dinamis dan lancar berdasarkan frame pertama dan terakhir yang disediakan serta prompt.

  • Multi-gambar-ke-video: Menghasilkan video dengan merujuk pada entitas atau latar belakang dalam satu atau beberapa gambar input, dikombinasikan dengan prompt.

Pengeditan video tujuan umum

Pengeditan video tujuan umum: Melakukan berbagai tugas pengeditan video berdasarkan input teks, gambar, dan video. Misalnya, dapat menghasilkan video baru dengan mengekstraksi fitur gerakan dari video input dan menggabungkannya dengan prompt.

Embedding

Text embedding

Mengubah teks menjadi sekumpulan angka yang merepresentasikan teks tersebut. Cocok untuk tugas pencarian, pengelompokan, rekomendasi, dan klasifikasi.

Tiongkok daratan (Beijing)

Kategori

Subkategori

Deskripsi

Generasi teks

Model bahasa besar tujuan umum

Model multimodal

Model pemahaman visual Qwen-VL, model penalaran visual QVQ, dan model omni-modal Qwen-Omni

Model spesifik domain

Model kode, Model matematika, Model terjemahan, Model penambangan data, Model riset, Model pengenalan maksud, Model role-playing

Generasi gambar

Teks-ke-gambar

  • Qwen teks-ke-gambar: Unggul dalam rendering teks kompleks, terutama untuk teks Tiongkok dan Inggris.

  • Wan teks-ke-gambar: Cocok untuk menghasilkan foto sertifikat, gambar utama e-dagang, foto model, dan potret dalam berbagai gaya (seperti kartun, gaya Tiongkok, dan gaya anime).

Pengeditan gambar

Model tujuan umum:

  • Qwen pengeditan gambar: Mendukung prompt Tiongkok dan Inggris untuk operasi pengeditan gambar dan teks kompleks, seperti style transfer, modifikasi teks, dan pengeditan objek.

  • Wan pengeditan gambar: Menghasilkan atau mengedit gambar. Anda dapat membuat foto sertifikat, gambar utama E-dagang, foto model, dan potret dalam berbagai gaya, seperti kartun, gaya Tiongkok, dan anime. Anda juga dapat menghapus latar belakang, menghasilkan latar belakang, dan mengubah elemen gambar.

Model lainnya: Terjemahan Gambar Qwen, OutfitAnyone

Sintesis dan pengenalan ucapan

Sintesis ucapan (teks-ke-ucapan)

Qwen-TTS, Qwen-TTS-Realtime, dan CosyVoice mengubah teks menjadi ucapan untuk skenario seperti layanan pelanggan berbasis suara, buku audio, navigasi dalam mobil, dan bimbingan pendidikan.

Pengenalan dan terjemahan ucapan

Qwen-ASR-Realtime, Qwen-ASR, Fun-ASR, dan Paraformer mengubah ucapan menjadi teks untuk skenario seperti transkripsi rapat real-time, keterangan siaran langsung real-time, dan panggilan layanan pelanggan.

Pengeditan dan generasi video

Teks-ke-video

Menghasilkan video berkualitas tinggi dengan gaya kaya dari satu kalimat.

Gambar-ke-video

  • Frame-pertama-ke-video: Menghasilkan video dari gambar awal dan prompt.

  • Frame-pertama-dan-terakhir-ke-video: Menghasilkan video dengan transisi alami berdasarkan gambar frame pertama dan terakhir serta prompt.

  • Multi-gambar-ke-video: Menghasilkan video dari satu atau lebih gambar dan prompt teks, berdasarkan entitas atau latar belakang dalam gambar sumber.

  • Generasi video tari: AnimateAnyone menghasilkan video tari dari gambar karakter dan video aksi.

  • Gambar + audio untuk menghasilkan video sinkronisasi bibir

    • Manusia digital Wan menghasilkan video dari gambar dan audio seseorang. Menyediakan rentang gerakan yang luas dan alami, mendukung berbagai ukuran frame seperti full-body, half-body, dan portrait, serta cocok untuk skenario seperti bernyanyi dan pertunjukan.

    • EMO menggunakan gambar dan audio seseorang untuk menghasilkan video dengan sinkronisasi bibir dan ekspresi wajah yang sangat ekspresif. Mendukung bidikan portrait dan half-body serta ideal untuk skenario close-up.

    • LivePortrait menggunakan gambar portrait dan file audio serta ideal untuk skenario narasi suara.

  • Generasi video emoji: Emoji menghasilkan video emoji wajah dari gambar wajah dan template dinamis wajah yang telah ditentukan.

Pengeditan video tujuan umum

  • Pengeditan video umum: Melakukan berbagai tugas pengeditan video berdasarkan prompt teks, gambar, dan video. Misalnya, Anda dapat menghasilkan video baru dengan mengekstraksi fitur gerakan dari video input dan menggabungkannya dengan prompt teks.

  • Sinkronisasi bibir video: VideoRetalk menggunakan video dan audio seseorang serta ideal untuk skenario seperti produksi video pendek dan terjemahan video.

  • Style transfer video: Video Style Repainting mengubah video menjadi berbagai gaya, seperti manga Jepang dan komik Amerika.

Embedding

Text embedding

Mengubah teks menjadi sekumpulan angka yang merepresentasikan teks tersebut. Digunakan untuk pencarian, pengelompokan, rekomendasi, dan klasifikasi.

Multimodal embedding

Mengubah teks, gambar, dan ucapan menjadi sekumpulan angka. Digunakan untuk klasifikasi audio dan video, klasifikasi gambar, dan pengambilan gambar-teks.

Generasi teks - Qwen

Berikut adalah model komersial Qwen. Dibandingkan dengan versi open-source, model komersial menawarkan kemampuan dan peningkatan terbaru.

Ukuran parameter model komersial tidak diungkapkan.
Setiap model diperbarui secara berkala. Untuk menggunakan versi tetap, Anda dapat memilih versi snapshot. Versi snapshot biasanya dipertahankan selama satu bulan setelah rilis versi snapshot berikutnya.
Kami merekomendasikan agar Anda menggunakan versi stabil atau terbaru untuk kondisi pembatasan laju yang lebih longgar.

Qwen-Max

Model dengan performa terbaik dalam seri Qwen, cocok untuk tugas kompleks multi-langkah. Penggunaan | Referensi API | Coba online

Internasional (Singapura)

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Keluaran Maksimum

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen3-max

Saat ini memiliki kemampuan yang sama dengan qwen3-max-2025-09-23
Pemanggilan batch separuh harga

Stabil

Hanya non-thinking

262,144

258,048

-

65,536

Harga bertingkat, lihat deskripsi di bawah.

1 juta token masing-masing

Berlaku selama 90 hari setelah aktivasi

qwen3-max-2025-09-23

Snapshot

Hanya non-thinking

qwen3-max-preview

Pratinjau

Thinking

81,920

32,768

Non-thinking

-

65,536

Penagihan untuk model yang tercantum di atas bertingkat berdasarkan jumlah token input per permintaan.

Token input per permintaan

Harga input (Juta token)

qwen3-max dan qwen3-max-preview mendukung cache konteks.

Harga output (Juta token)

0 < Token ≤ 32K

$1.2

$6

32K < Token ≤ 128K

$2.4

$12

128K < Token ≤ 252K

$3

$15

Model lainnya

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen-max

Saat ini memiliki kemampuan yang sama dengan qwen-max-2025-01-25

Stabil

32,768

30,720

8,192

$1.6

Panggilan batch separuh harga.

$6.4

Panggilan batch separuh harga.

1 juta token untuk input dan output masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-max-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru

Terbaru

$1.6

$6.4

qwen-max-2025-01-25

juga dikenal sebagai qwen-max-0125 atau Qwen2.5-Max

Snapshot

Tiongkok daratan (Beijing)

Model

Versi

Mode

Jendela konteks

Input maks

Rantai-pikiran maks

Output maksimum

Biaya input

Biaya output

(Token)

(Juta token)

qwen3-max

Saat ini memiliki kemampuan yang sama dengan qwen3-max-2025-09-23
Pemanggilan batch separuh harga

Stabil

Hanya non-thinking

262,144

258,048

-

65,536

Harga bertingkat, lihat deskripsi di bawah.

qwen3-max-2025-09-23

Snapshot

Hanya non-thinking

qwen3-max-preview

Pratinjau

Thinking

81,920

32,768

Non-thinking

-

65,536

Penagihan untuk model yang tercantum di atas bertingkat berdasarkan jumlah token input per permintaan.

Model

Token input per permintaan

Harga input (Juta token)

Harga output (Juta token)

Rantai-pikiran + respons

qwen3-max

panggilan batch separuh harga
Diskon cache konteks

0 < Token ≤ 32K

$0.459

$1.836

32K < Token ≤ 128K

$0.918

$3.672

128K < Token ≤ 252K

$1.377

$5.508

qwen3-max-2025-09-23

0 < Token ≤ 32K

$0.861

$3.441

32K < Token ≤ 128K

$1.434

$5.735

128K < Token ≤ 252K

$2.151

$8.602

qwen3-max-preview

Diskon cache konteks

0 < Token ≤ 32K

$0.861

$3.441

32K < Token ≤ 128K

$1.434

$5.735

128K < Token ≤ 252K

$2.151

$8.602

Model lainnya

Model

Versi

Jendela konteks

Input maks

Keluaran Maksimum

Biaya input

Biaya output

(Token)

(Juta token)

qwen-max

Saat ini memiliki kemampuan yang sama dengan qwen-max-2024-09-19

Stabil

32,768

30,720

8,192

$0.345

$1.377

qwen-max-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru

Terbaru

131,072

129,024

qwen-max-2025-01-25

juga dikenal sebagai qwen-max-0125 atau Qwen2.5-Max

Snapshot

qwen-max-2024-09-19

juga dikenal sebagai qwen-max-0919

32,768

30,720

$2.868

$8.602

qwen-max-2024-04-28

juga dikenal sebagai qwen-max-0428

Snapshot

8,000

6,000

2,000

CNY 0.04

CNY 0.12

qwen-max-2024-04-03

juga dikenal sebagai qwen-max-0403
Mode thinking dari qwen3-max-preview secara signifikan meningkatkan kemampuan inferensi secara keseluruhan dan unggul dalam pemrograman agen, penalaran akal sehat, matematika, sains, dan tugas umum.

Qwen-Plus

Model seimbang yang menawarkan performa, biaya, dan kecepatan antara Qwen-Max dan Qwen-Flash. Cocok untuk tugas yang cukup kompleks. Penggunaan | Referensi API | Coba online | Penalaran mendalam

Internasional (Singapura)

Model

Versi

Jendela konteks

Input maks

Output maks

Biaya input

Biaya output

Kuota gratis

(Catatan)

(Token)

(Juta token)

qwen-plus

Saat ini memiliki kemampuan yang sama dengan qwen-plus-2025-07-28
Bagian dari seri Qwen3

Stabil

1,000,000

Mode berpikir

995,904

Mode tanpa pemikiran

997,952

Nilai default adalah 262,144. Anda dapat menyesuaikan nilai ini menggunakan parameter max_input_tokens.

32,768

Rantai-pikiran maks: 81,920

Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat catatan di bawah tabel.

1 juta token untuk input dan output masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen-plus-latest

Saat ini memiliki kemampuan yang sama dengan qwen-plus-2025-07-28
Bagian dari seri Qwen3

Terbaru

Mode thinking

995,904

Mode tanpa berpikir

997,952

qwen-plus-2025-09-11

Bagian dari seri Qwen3.

Snapshot

Mode Berpikir

995,904

Mode Tanpa Berpikir

997,952

qwen-plus-2025-07-28

juga dikenal sebagai qwen-plus-0728
Bagian dari seri Qwen3

qwen-plus-2025-07-14

juga dikenal sebagai qwen-plus-0714
Bagian dari seri Qwen3

131,072

Mode thinking

98,304

Mode tanpa pemikiran

129,024

16,384

Rantai-pikiran maks: 38,912

$0.4

Mode thinking

$4

Mode non-thinking

$1.2

qwen-plus-2025-04-28

juga dikenal sebagai qwen-plus-0428
Bagian dari seri Qwen3

qwen-plus-2025-01-25

juga dikenal sebagai qwen-plus-0125

129,024

8,192

$1.2

Penagihan untuk qwen-plus, qwen-plus-latest, qwen-plus-2025-09-11, dan qwen-plus-2025-07-28 bertingkat berdasarkan jumlah token input per permintaan.

Token input per permintaan

Harga input (Juta token)

Mode

Harga output (Juta token)

0 < Token ≤ 256K

$0.4

Mode non-thinking

$1.2

Mode thinking

$4

256K < Token ≤ 1M

$1.2

Mode non-thinking

$3.6

Mode thinking

$12

Tiongkok daratan (Beijing)

Model

Versi

Jendela konteks

Input Maksimum

Output maks

Biaya input

Biaya output

(Token)

(Juta token)

qwen-plus

Saat ini memiliki kemampuan yang sama dengan qwen-plus-2025-07-28
Bagian dari seri Qwen3

Stabil

1,000,000

Mode thinking

995,904

Mode Tanpa Berpikir

997,952

Nilai default adalah 131,072. Anda dapat menyesuaikan nilai ini menggunakan parameter max_input_tokens.

32,768

Rantai-pikiran maks: 81,920

Harga bertingkat berlaku. Untuk informasi lebih lanjut, lihat catatan di bawah tabel.

qwen-plus-latest

Saat ini memiliki kemampuan yang sama dengan qwen-plus-2025-07-28
Bagian dari seri Qwen3

Terbaru

Mode berpikir

995,904

Non-Thinking Mode

997,952

qwen-plus-2025-09-11

Bagian dari seri Qwen3

Snapshot

Mode berpikir

995,904

Mode Tanpa Berpikir

997,952

qwen-plus-2025-07-28

juga dikenal sebagai qwen-plus-0728
Bagian dari seri Qwen3

qwen-plus-2025-07-14

juga dikenal sebagai qwen-plus-0714
Bagian dari seri Qwen3

131,072

Mode berpikir

98,304

Mode tanpa berpikir

129,024

16,384

Rantai-pikiran maks: 38,912

$0.115

Mode berpikir

$1.147

Non-thinking mode

$0.287

qwen-plus-2025-04-28

juga dikenal sebagai qwen-plus-0428
Bagian dari seri Qwen3

Penagihan untuk qwen-plus, qwen-plus-latest, qwen-plus-2025-09-11, dan qwen-plus-2025-07-28 bertingkat berdasarkan jumlah token input per permintaan.

Token input per permintaan

Harga input (Juta token)

Mode

Harga output (Juta token)

0 < Token ≤ 128K

$0.115

Mode non-thinking

$0.287

Mode thinking

$1.147

128K < Token ≤ 256K

$0.345

Mode non-thinking

$2.868

Mode thinking

$3.441

256K < Token ≤ 1M

$0.689

Mode non-thinking

$6.881

Mode thinking

$9.175

Model-model ini mendukung mode thinking dan non-thinking. Anda dapat beralih di antara keduanya menggunakan parameter enable_thinking. Selain itu, kemampuan model ditingkatkan secara signifikan:

  1. Kemampuan penalaran: Dalam evaluasi untuk matematika, kode, dan penalaran logis, model ini secara signifikan melampaui QwQ dan model lain dengan ukuran serupa tanpa mode penalaran. Model ini mencapai performa tingkat atas di industri untuk model sekelasnya.

  2. Penyelarasan preferensi manusia: Model ini menunjukkan peningkatan signifikan dalam penulisan kreatif, asumsi peran, percakapan multi-putaran, dan mengikuti instruksi. Kemampuan umumnya jauh lebih baik dibandingkan model lain dengan ukuran serupa.

  3. Kemampuan agen: Model ini mencapai performa terdepan di industri dalam mode thinking maupun non-thinking dan dapat memanggil alat eksternal secara akurat.

  4. Kemampuan multibahasa: Model ini mendukung lebih dari 100 bahasa dan dialek. Kemampuannya dalam terjemahan multibahasa, pemahaman instruksi, dan penalaran akal sehat ditingkatkan secara signifikan.

  5. Format respons: Versi ini memperbaiki masalah format respons dari versi sebelumnya, seperti format Markdown yang salah, pemotongan prematur, dan output kotak yang tidak tepat.

Untuk model yang tercantum di atas, jika Anda mengaktifkan mode thinking tetapi proses berpikir tidak dihasilkan, Anda akan dikenakan biaya berdasarkan harga untuk mode non-thinking.

Model lainnya

Model

Version

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-plus-2025-01-25

dikenal juga sebagai qwen-plus-0125

Snapshot

131.072

129.024

8.192

$0,115

$0,287

qwen-plus-2025-01-12

dikenal juga sebagai qwen-plus-0112

qwen-plus-2024-12-20

dikenal juga sebagai qwen-plus-1220

qwen-plus-2024-11-27

dikenal juga sebagai qwen-plus-1127

qwen-plus-2024-11-25

dikenal juga sebagai qwen-plus-1125

qwen-plus-2024-09-19

dikenal juga sebagai qwen-plus-0919

qwen-plus-2024-08-06

dikenal juga sebagai qwen-plus-0806

128.000

$0,574

$1,721

Qwen-Flash

Model tercepat dan paling hemat biaya dalam seri Qwen, ideal untuk pekerjaan sederhana. Qwen-Flash menawarkan harga berjenjang yang fleksibel, sehingga lebih hemat biaya dibandingkan Qwen-Turbo. Penggunaan | Referensi API | Coba secara online | Mode berpikir

Internasional (Singapura)

Model

Version

Mode

Context window

Max input

Max chain-of-thought

Max output

Input cost

Output cost

Chain-of-thought + Outputs

Free quota

(Catatan)

(Tokens)

(1,000 tokens)

qwen-flash

Kemampuan sama dengan qwen-flash-2025-07-28
Bagian dari seri Qwen3.
Batch calls dikenai biaya separuh dari harga standar.

Stable

Thinking

1.000.000

995.904

81.920

32.768

Harga berjenjang. Lihat penjelasan di bawah tabel.

1 juta token masing-masing

Berlaku selama 90 hari setelah mengaktifkan Alibaba Cloud Model Studio.

Non-thinking

997.952

-

qwen-flash-2025-07-28

Bagian dari seri Qwen3.

Snapshot

Thinking

995.904

81.920

Non-thinking

997.952

-

Penagihan untuk model yang tercantum di atas diterapkan secara berjenjang berdasarkan jumlah input token per request. qwen-flash mendukung context cache dan batch calls.

Input tokens per request

Input price (Million tokens)

Output price (Million tokens)

0< Tokens ≤256K

$0,05

$0,4

256K< Tokens ≤1M

Rp0,25

$2

Wilayah Tiongkok Daratan (Beijing)

Model

Version

Mode

Context window

Max input

Max chain-of-thought

Max output

Input cost

Output cost

Chain-of-thought + Outputs

(Tokens)

(1,000 tokens)

qwen-flash

Kemampuan sama dengan qwen-flash-2025-07-28
Bagian dari seri Qwen3

Stable

Thinking

1.000.000

995.904

81.920

32.768

Harga berjenjang. Lihat penjelasan di bawah tabel.

Non-thinking

997.952

-

qwen-flash-2025-07-28

Bagian dari seri Qwen3

Snapshot

Thinking

995.904

81.920

Non-thinking

997.952

-

Penagihan untuk model yang tercantum di atas diterapkan secara berjenjang berdasarkan jumlah input token per request. qwen-flash mendukung context cache.

Input tokens per request

Input price (Million tokens)

Output price (Million tokens)

0< Tokens ≤128K

$0,022

$0,216

128K< Tokens ≤256K

$0,087

$0,861

256K< Tokens ≤1M

$0,173

$1,721

Qwen-Turbo

Qwen-Turbo tidak akan lagi menerima pembaruan. Kami menyarankan Anda menggantinya dengan Qwen-Flash. Qwen-Flash menggunakan model harga tiered yang fleksibel, sehingga menawarkan struktur harga yang lebih granular. Penggunaan | Referensi API | Coba secara online | Deep thinking

Internasional (Singapura)

Model

Version

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Million tokens)

qwen-turbo

Saat ini memiliki kemampuan yang sama dengan qwen-turbo-2025-04-28
Bagian dari seri Qwen3

Stable

Thinking mode

131.072

Non-thinking mode

1.000.000

Thinking mode

98.304

Non-thinking mode

1.000.000

16.384

Max chain-of-thought adalah 38.912

$0,05

Batch calls setengah harga

Thinking mode: $0,5

Non-thinking mode: $0,2

Batch calls setengah harga

1 juta token untuk masing-masing

Masa berlaku: 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

qwen-turbo-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru
Bagian dari seri Qwen3

Latest

$0,05

Thinking mode: $0,5

Non-thinking mode: $0,2

qwen-turbo-2025-04-28

Juga dikenal sebagai qwen-turbo-0428
Bagian dari seri Qwen3

Snapshot

qwen-turbo-2024-11-01

Juga dikenal sebagai qwen-turbo-1101

1.000.000

1.000.000

8.192

$0,2

Tiongkok Daratan (Beijing)

Model

Version

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-turbo

Saat ini memiliki kemampuan yang sama dengan qwen-turbo-2025-04-28
Bagian dari seri Qwen3

Stable

Thinking mode

131.072

Non-thinking mode

1.000.000

Thinking mode

98.304

Non-thinking mode

1.000.000

16.384

Max chain-of-thought adalah 38.912

$0,044

Thinking mode

$0,431

Non-thinking mode

$0,087

qwen-turbo-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru
Bagian dari seri Qwen3

Latest

qwen-turbo-2025-07-15

Juga dikenal sebagai qwen-turbo-0715
Bagian dari seri Qwen3

Snapshot

qwen-turbo-2025-04-28

Juga dikenal sebagai qwen-turbo-0428
Bagian dari seri Qwen3

QwQ

Model penalaran QwQ dilatih berdasarkan model Qwen2.5 dan menggunakan Pembelajaran Penguatan untuk meningkatkan kemampuan penalarannya secara signifikan. Metrik inti model ini untuk matematika dan kode, seperti AIME 24/25 dan LiveCodeBench, serta beberapa metrik umum, seperti IFEval dan LiveBench, setara dengan versi performa penuh DeepSeek-R1. Penggunaan

Singapura

Model

Version

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Million tokens)

qwq-plus

Stable

131.072

98.304

32.768

8.192

$0,8

$2,4

1 juta token

Masa berlaku: Dalam waktu 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

China Daratan (Beijing)

Model

Version

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

(Tokens)

(Million tokens)

qwq-plus

Kemampuan yang sama dengan qwq-plus-2025-03-05.

Stable

131.072

98.304

32,768

8.192

$0,230

$0,574

qwq-plus-latest

Selalu memiliki kemampuan yang sama dengan versi Snapshot terbaru.

Latest

qwq-plus-2025-03-05

Juga dikenal sebagai qwq-plus-0305.

Snapshot

Qwen-Long

Model Qwen-Long memiliki jendela konteks terpanjang di seri Qwen. Model ini menawarkan performa yang seimbang dengan biaya rendah. Model ini ideal untuk tugas-tugas seperti analisis teks panjang, ekstraksi informasi, peringkasan, klasifikasi, dan penandaan. Penggunaan | Coba online

China (Beijing)

Model

Version

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-long-latest

Selalu sesuai dengan kemampuan versi snapshot terbaru.

Stable

10.000.000

10.000.000

8.192

$0,072

$0,287

qwen-long-2025-01-25

Juga dikenal sebagai qwen-long-0125.

Snapshot

Qwen-Omni

Model Qwen-Omni menerima input gabungan dari berbagai modalitas, seperti teks, citra, audio, dan video, serta menghasilkan tanggapan dalam format teks atau ucapan. Model ini menyediakan berbagai suara ekspresif yang menyerupai manusia dan mendukung output audio dalam berbagai bahasa dan dialek. Anda dapat menggunakannya dalam skenario obrolan audio dan video, seperti untuk pengenalan visual, analisis sentimen, serta pendidikan dan pelatihan. Penggunaan | Referensi API

Singapura

Model

Version

Mode

Context window

Max input

Max chain-of-thought

Max output

Kuota gratis

(Catatan)

(Tokens)

qwen3-omni-flash

Saat ini memiliki kemampuan yang sama dengan qwen3-omni-flash-2025-09-15

Stable

Thinking mode

65.536

16.384

32.768

16.384

1 juta token masing-masing (modality-agnostic)

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

Non-thinking mode

49.152

-

qwen3-omni-flash-2025-09-15

Juga dikenal sebagai qwen3-omni-flash-0915

Snapshot

Thinking mode

65.536

16.384

32.768

16.384

Non-thinking mode

49.152

-

Setelah kuota gratis Anda habis, aturan penagihan berikut berlaku untuk input dan output. Penagihan sama untuk mode thinking maupun non-thinking. Output audio tidak didukung dalam thinking mode.

Input

Harga satuan (Juta token)

Text

$0,43

Audio

$3,81

Image/Video

$0,78

Output

Harga satuan (Juta token)

Text

$1,66 (ketika input hanya berisi teks)

$3,06 (ketika input berisi citra, video, atau audio)

Text + Audio

Item ini tidak ditagih dalam thinking mode.

$15,11 (Audio)

Teks output tidak ditagih.

Model lainnya

Model

Version

Context window

Max input

Max output

Kuota gratis

(Catatan)

(Tokens)

qwen-omni-turbo

Versi ini memiliki kemampuan yang sama dengan qwen-omni-turbo-2025-03-26.

Stable

32.768

30.720

2.048

1 juta token masing-masing (modality-agnostic)

Berlaku selama 90 hari setelah mengaktifkan Model Studio.

qwen-omni-turbo-latest

Selalu mengarah ke versi Snapshot terbaru.
Kemampuan setara

Latest

qwen-omni-turbo-2025-03-26

Juga dikenal sebagai qwen-omni-turbo-0326.

Snapshot

Setelah kuota gratis Anda untuk commercial models habis, aturan penagihan berikut berlaku untuk input dan output:

Input

Harga satuan (Juta token)

Text

$0,07

Audio

$4,44

Image/Video

$0,21

Output

Harga satuan (Juta token)

Text

$0,27 (ketika input hanya berisi teks)

$0,63 (ketika input berisi citra, video, atau audio)

Text + Audio

$8,89 (Audio)

Bagian teks dari output tidak dikenai biaya.

Daratan Tiongkok (Beijing)

Model

Version

Mode

Context window

Max input

Max chain-of-thought

Max output

Kuota gratis

(Catatan)

(Tokens)

qwen3-omni-flash

Saat ini memiliki kemampuan yang sama dengan qwen3-omni-flash-2025-09-15.

Stable

Thinking mode

65.536

16.384

32.768

16.384

Tidak ada kuota gratis

Non-thinking mode

49,152

-

qwen3-omni-flash-2025-09-15

Juga dikenal sebagai qwen3-omni-flash-0915.

Snapshot

Thinking mode

65.536

16.384

32.768

16.384

Non-thinking mode

49.152

-

Setelah kuota gratis Anda habis, input dan output ditagih sesuai aturan berikut. Penagihan sama untuk mode thinking maupun non-thinking. Output audio tidak didukung dalam thinking mode.

Input

Harga satuan (Juta token)

Text

$0,258

Audio

$2,265

Image/Video

$0,473

Output

Harga satuan (Juta token)

Text

$0,989 (ketika input hanya berisi teks)

$1,821 (ketika input berisi citra, video, atau audio)

Text + audio

Item ini tidak ditagih dalam thinking mode.

$8,974 (audio)

Teks output tidak ditagih.

Model lainnya

Model

Version

Context window

Max input

Max output

Kuota gratis

(Catatan)

(Tokens)

qwen-omni-turbo

Model ini saat ini memiliki kemampuan yang sama dengan qwen-omni-turbo-2025-03-26.

Stable

32.768

30.720

2.048

Tidak ada kuota gratis

qwen-omni-turbo-latest

Selalu selaras dengan snapshot terbaru.
Kemampuan identik.

Latest

qwen-omni-turbo-2025-03-26

Juga dikenal sebagai qwen-omni-turbo-0326.

Snapshot

qwen-omni-turbo-2025-01-19

Juga dikenal sebagai qwen-omni-turbo-0119.

Input dan output ditagih sesuai aturan berikut:

Input

Harga satuan (Juta token)

Text

$0,058

Audio

$3,584

Image/Video

$0,216

Output

Harga satuan (Juta token)

Text

$0,230 (untuk input hanya teks)

$0,646 (ketika input mencakup citra, audio, atau video)

Text + audio

$7,168 (audio)

Teks output tidak ditagih.

Sebagai contoh, permintaan yang mencakup 1.000 token input teks, 1.000 token input citra, 1.000 token output teks, dan 1.000 token output audio dikenai biaya $0,000058 (input teks) + $0,000216 (input citra) + $0,007168 (output audio).

Model Qwen3-Omni-Flash menawarkan peningkatan signifikan dibandingkan Qwen-Omni-Turbo, yang tidak lagi diperbarui:

  • Ini adalah model hybrid thinking yang mendukung mode thinking dan non-thinking. Anda dapat beralih antar mode menggunakan parameter enable_thinking. Secara default, mode thinking dinonaktifkan.

  • Output audio tidak didukung dalam thinking mode. Dalam non-thinking mode, output audio dari model memiliki fitur-fitur berikut:

    • Mendukung 17 suara, meningkat dari 4 suara yang didukung oleh Qwen-Omni-Turbo.

    • Mendukung 10 bahasa, meningkat dari 2 bahasa yang didukung oleh Qwen-Omni-Turbo.

Qwen-Omni-Realtime

Dibandingkan dengan Qwen Omni, model-model ini mendukung input aliran audio. Model ini memiliki fitur Voice Activity Detection (VAD) bawaan yang secara otomatis mendeteksi awal dan akhir ucapan pengguna. Penggunaan | Event klien | Event server

Internasional (Singapura)

Model

Version

Context window

Max input

Max output

Kuota gratis

(Catatan)

(Tokens)

qwen3-omni-flash-realtime

Setara dengan qwen3-omni-flash-realtime-2025-09-15

Stable

65.536

49.152

16.384

1 juta token masing-masing, terlepas dari modalitas

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

qwen3-omni-flash-realtime-2025-09-15

Snapshot

Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:

Input

Harga satuan (Juta token)

Text

$0,52

Audio

$4,57

Image

$0,94

Output

Harga satuan (Juta token)

Text

$1,99 (ketika input hanya berisi teks)

$3,67 (ketika input berisi citra atau audio)

Text + Audio

$18,13 (audio)

Output teks tidak dikenai biaya.

Model lainnya

Model

Version

Context window

Max input

Max output

Kuota gratis

(Catatan)

(Tokens)

qwen-omni-turbo-realtime

Setara dengan qwen-omni-turbo-realtime-2025-05-08

Stable

32.768

30.720

2.048

1 juta token, terlepas dari modalitas

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio

qwen-omni-turbo-realtime-latest

Selalu setara dengan versi snapshot terbaru

Latest

qwen-omni-turbo-realtime-2025-05-08

Snapshot

Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:

Input

Harga satuan (Juta token)

Text

$0,270

Audio

$4,440

Image

$0,840

Output

Harga satuan (Juta token)

Text

$1,070 (untuk input hanya teks)

$2,520 (untuk input yang berisi citra atau audio)

Text + Audio

$8,890 (untuk output audio)

Output teks tidak dikenai biaya.

Tiongkok Daratan (Beijing)

Model

Version

Context window

Max input

Max output

Kuota gratis

(Catatan)

(Tokens)

qwen3-omni-flash-realtime

Setara dengan qwen3-omni-flash-realtime-2025-09-15

Stable

65.536

49.152

16.384

Tidak ada kuota gratis

qwen3-omni-flash-realtime-2025-09-15

Snapshot

Aturan penagihan berikut berlaku untuk input dan output:

Input

Harga satuan (Juta token)

Text

$0,315

Audio

$2,709

Image

$0,559

Output

Harga satuan (Juta token)

Text

$1,19 (ketika input hanya berisi teks)

$2,179 (ketika input berisi citra atau audio)

Text + audio

$10,766 (audio)

Output teks tidak dikenai biaya.

Model lainnya

Model

Version

Context window

Max input

Max output

Kuota gratis

(Catatan)

(Tokens)

qwen-omni-turbo-realtime

Setara dengan qwen-omni-turbo-2025-05-08

Stable

32.768

30.720

2.048

Tidak ada kuota gratis

qwen-omni-turbo-realtime-latest

Selalu setara dengan versi snapshot terbaru.

Latest

qwen-omni-turbo-realtime-2025-05-08

Snapshot

Aturan penagihan berikut berlaku untuk input dan output:

Input

Harga satuan (Juta token)

Text

$0,230

Audio

$3,584

Image

$0,861

Output

Harga satuan (Juta token)

Text

$0,918 (jika input hanya berisi teks)

$2,581 (jika input berisi citra atau audio)

Text + Audio

$7,168 (audio)

Output teks tidak dikenai biaya.

Model Qwen3-Omni-Flash-Realtime direkomendasikan. Model ini menawarkan kemampuan yang jauh lebih baik dibandingkan Qwen-Omni-Turbo-Realtime, yang tidak akan lagi diperbarui. Untuk output audio dari model:

  • Model ini mendukung 17 voice. Qwen-Omni-Turbo-Realtime hanya mendukung 4.

  • Model ini mendukung 10 bahasa. Qwen-Omni-Turbo-Realtime hanya mendukung 2.

QVQ

QVQ adalah model penalaran visual yang mendukung input visual dan output rantai-pikiran. Model ini menghadirkan performa unggul dalam bidang matematika, pemrograman, analisis visual, tugas kreatif, serta tugas umum. Penggunaan | Coba secara online

Internasional (Singapura)

Model

Version

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Million tokens)

qvq-max

Setara dengan qvq-max-2025-03-25.

Stable

131.072

106.496

Maksimum 16.384 token untuk satu citra.

16.384

8.192

$1,2

$4,8

1 juta token masing-masing.

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

qvq-max-latest

Selalu setara dengan versi snapshot terbaru.

Latest

qvq-max-2025-03-25

Juga dikenal sebagai qvq-max-0325.

Snapshot

China Daratan (Beijing)

Model

Version

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

(Tokens)

(Million tokens)

qvq-max

Menawarkan kemampuan penalaran visual dan pemahaman instruksi yang lebih kuat dibandingkan qvq-plus, memberikan performa optimal untuk tugas yang lebih kompleks.
Memiliki kemampuan yang sama dengan qvq-max-2025-03-25.

Stable

131.072

106.496

Maksimum 16.384 untuk satu citra.

16.384

8.192

$1,147

$4,588

qvq-max-latest

Selalu memiliki kemampuan yang sama dengan versi Snapshot terbaru.

Latest

qvq-max-2025-05-15

Juga dikenal sebagai qvq-max-0515.

Snapshot

qvq-max-2025-03-25

Juga dikenal sebagai qvq-max-0325.

qvq-plus

Memiliki kemampuan yang sama dengan qvq-plus-2025-05-15.

Stable

$0,287

$0,717

qvq-plus-latest

Selalu memiliki kemampuan yang sama dengan versi Snapshot terbaru.

Latest

qvq-plus-2025-05-15

Juga dikenal sebagai qvq-plus-0515.

Snapshot

Qwen-VL

Qwen-VL adalah model generasi teks dengan kemampuan pemahaman visual (citra). Model ini tidak hanya melakukan Optical Character Recognition (OCR), tetapi juga menyediakan ringkasan dan penalaran lebih lanjut, seperti mengekstraksi properti dari foto produk atau menyelesaikan masalah yang ditampilkan dalam diagram. Penggunaan | Referensi API | Coba secara online

Model Qwen-VL ditagih berdasarkan jumlah total token input dan output. Untuk informasi lebih lanjut mengenai cara perhitungan token citra, lihat Pemahaman visual.

Internasional (Singapura)

Model

Version

Mode

Context window

Max input

Max chain-of-thought

Max output

Input cost

Output cost

(Chain-of-thought + Output)

Free quota

(Catatan)

(Tokens)

(Million tokens)

qwen3-vl-plus

Kemampuan yang sama dengan qwen3-vl-plus-2025-09-23

Stable

thinking

262.144

258.048

Maksimum 16.384 token per citra

81.920

32.768

Harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

non-thinking

260.096

Maksimum 16.384 token per citra

-

qwen3-vl-plus-2025-09-23

Snapshot

thinking

258.048

Maksimum 16.384 token per citra

81.920

non-thinking

260.096

Maksimum 16.384 token per citra

-

qwen3-vl-flash

Kemampuan yang sama dengan qwen3-vl-flash-2025-10-15

Stable

thinking

258.048

Maksimum 16.384 token per citra

81.920

non-thinking

260.096

Maksimum 16.384 token per citra

-

qwen3-vl-flash-2025-10-15

Snapshot

thinking

258.048

Maksimum 16.384 token per citra

81.920

non-thinking

260.096

Maksimum 16.384 token per citra

-

Model-model yang tercantum di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.

Seri qwen3-vl-plus

Input tokens per request

Input price (Million tokens)

Output price (Million tokens)

0 < Tokens ≤ 32K

Rp0,20

$1,60

32K < Tokens ≤ 128K

Rp0,30

$2,40

128K < Tokens ≤ 256K

$0,60

$4,80

Seri qwen3-vl-flash

Input tokens per request

Input price (Million tokens)

Output price (Million tokens)

0 < Tokens ≤ 32K

$0,05

$0,40

32K < Tokens ≤ 128K

$0,075

Rp0,60

128K < Tokens ≤ 256K

$0,12

$0,96

Model lainnya

Qwen-VL-Max

Qwen-VL-Max memiliki performa lebih baik dibandingkan Qwen-VL-Plus. Model-model berikut termasuk dalam seri Qwen2.5-VL.

Model

Version

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Million tokens)

qwen-vl-max

Menawarkan kemampuan penalaran visual dan pemrosesan instruksi yang lebih baik dibandingkan qwen-vl-plus, serta memberikan performa optimal untuk tugas kompleks.
Kemampuan yang sama dengan qwen-vl-max-2025-08-13.

Stable

131.072

129.024

Maksimum 16.384 per citra.

8.192

$0,8

Harga separuh untuk panggilan batch

$3,2

Harga separuh untuk panggilan batch

1 juta token masing-masing.

Periode validitas adalah 90 hari setelah Model Studio diaktifkan.

qwen-vl-max-latest

Selalu menyediakan kemampuan yang sama dengan versi snapshot terbaru.

Latest

$0,8

$3,2

qwen-vl-max-2025-08-13

Juga dikenal sebagai qwen-vl-max-0813.
Memberikan peningkatan komprehensif dalam pemahaman visual, dengan kemampuan matematika, penalaran, deteksi objek, dan pemrosesan multibahasa yang jauh lebih baik.

Snapshot

qwen-vl-max-2025-04-08

Juga dikenal sebagai qwen-vl-max-0408.
Model seri Qwen2.5-VL dengan context window 128k yang diperluas serta kemampuan matematika dan penalaran yang jauh lebih baik.
Qwen-VL-Plus

Qwen-VL-Plus menawarkan keseimbangan antara performa dan biaya. Model-model berikut termasuk dalam seri Qwen2.5-VL.

Model

Version

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Million tokens)

qwen-vl-plus

Kemampuan yang sama dengan qwen-vl-plus-2025-08-15.

Stable

131.072

129.024

Maksimum 16.384 per citra.

8.192

$0,21

Harga separuh untuk panggilan batch

$0,63

Harga separuh untuk panggilan batch

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

qwen-vl-plus-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.

Terbaru

Rp0,21

Rp0,63

qwen-vl-plus-2025-08-15

Juga dikenal sebagai qwen-vl-plus-0815.
Menampilkan peningkatan signifikan dalam deteksi objek, lokalisasi, dan pemrosesan multibahasa.

Snapshot

qwen-vl-plus-2025-05-07

Juga dikenal sebagai qwen-vl-plus-0507.
Menampilkan pemahaman matematika, penalaran, dan konten video pengawasan yang jauh lebih baik.

qwen-vl-plus-2025-01-25

Juga dikenal sebagai qwen-vl-plus-0125.
Model seri Qwen2.5-VL dengan context window 128k yang diperluas serta pemahaman citra dan video yang jauh lebih baik.

Tiongkok Daratan (Beijing)

Model

Version

Mode

Context window

Max input

Max chain-of-thought

Max output

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Million tokens)

qwen3-vl-plus

Kemampuan yang sama dengan qwen3-vl-plus-2025-09-23

Stable

thinking

262.144

258.048

Maksimum 16.384 token per citra

81.920

32.768

Harga bertingkat. Untuk informasi selengkapnya, lihat deskripsi di bawah tabel.

Tidak ada kuota gratis

non-thinking

260.096

Maksimum 16.384 token per citra

-

qwen3-vl-plus-2025-09-23

Snapshot

thinking

258.048

Maksimum 16.384 token per citra

81.920

non-thinking

260.096

Maksimum 16.384 token per citra

-

qwen3-vl-flash

Kemampuan yang sama dengan qwen3-vl-flash-2025-10-15

Stable

thinking

258.048

Maksimum 16.384 token per citra

81.920

non-thinking

260.096

Maksimum 16.384 token per citra

-

qwen3-vl-flash-2025-10-15

Snapshot

thinking

258.048

Maksimum 16.384 token per citra

81.920

non-thinking

260.096

Maksimum 16.384 token per citra

-

Model-model yang tercantum di atas menggunakan harga bertingkat berdasarkan jumlah token input per permintaan. Harga input dan output sama untuk mode thinking maupun non-thinking.

Seri qwen3-vl-plus

Input tokens per request

Input price (Million tokens)

Output price (Million tokens)

0 < Tokens ≤ 32K

$0,143353

$1,433525

32K < Tokens ≤ 128K

$0,215029

$2,150288

128K < Tokens ≤ 256K

$0,430058

$4,300576

Seri qwen3-vl-flash

Input tokens per request

Input price (per 1M tokens)

Output price (per 1M tokens)

0 < Tokens ≤ 32K

$0,022

$0,215

32K < Tokens ≤ 128K

$0,043

$0,43

128K < Tokens ≤ 256K

$0,086

$0,859

Model lainnya

Seri Qwen-VL-Max
Model qwen-vl-max-2025-01-25 dan versi setelahnya termasuk dalam seri Qwen2.5-VL.

Model

Version

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-vl-max

Menawarkan kemampuan penalaran visual dan pemrosesan instruksi yang lebih baik dibandingkan qwen-vl-plus serta memberikan performa optimal untuk tugas kompleks.
Kemampuan yang sama dengan qwen-vl-max-2025-08-13.

Stable

131.072

129.024

Maksimum 16.384 per citra

8.192

$0,23

$0,574

qwen-vl-max-latest

Menyediakan kemampuan yang sama dengan versi snapshot terbaru.

Latest

qwen-vl-max-2025-08-13

Juga dikenal sebagai qwen-vl-max-0813.
Menampilkan peningkatan komprehensif dalam pemahaman visual serta kemampuan matematika, penalaran, deteksi objek, dan pemrosesan multibahasa yang jauh lebih baik.

Snapshot

qwen-vl-max-2025-04-08

Juga dikenal sebagai qwen-vl-max-0408.
Kemampuan matematika dan penalaran yang lebih baik.

$0,431

$1,291

qwen-vl-max-2025-04-02

Juga dikenal sebagai qwen-vl-max-0402.
Secara signifikan meningkatkan akurasi dalam menyelesaikan soal matematika kompleks.

qwen-vl-max-2025-01-25

Juga dikenal sebagai qwen-vl-max-0125.

Versi ini merupakan peningkatan seri Qwen2.5-VL, dengan context window yang diperluas menjadi 128k serta pemahaman citra dan video yang jauh lebih baik.

qwen-vl-max-2024-12-30

Juga dikenal sebagai qwen-vl-max-1230.

32.768

30.720

Maksimum 16.384 per citra

2.048

$0,431

$1,291

qwen-vl-max-2024-11-19

Juga dikenal sebagai qwen-vl-max-1119.

qwen-vl-max-2024-10-30

Juga dikenal sebagai qwen-vl-max-1030.

$2,868

qwen-vl-max-2024-08-09

Juga dikenal sebagai qwen-vl-max-0809.
Seri Qwen-VL-Plus
Model qwen-vl-plus-2025-01-25 dan versi setelahnya termasuk dalam seri Qwen2.5-VL.

Model

Version

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-vl-plus

Menawarkan kemampuan yang sama dengan qwen-vl-plus-2025-08-15.

Stable

131.072

129.024

Maksimum 16.384 token per citra.

8.192

$0,115

$0,287

qwen-vl-plus-latest

Selalu memiliki kemampuan yang sama dengan versi snapshot terbaru.

Latest

qwen-vl-plus-2025-08-15

Juga dikenal sebagai qwen-vl-plus-0815.
Memberikan peningkatan signifikan dalam deteksi objek, lokalisasi, dan pemrosesan multibahasa.

Snapshot

qwen-vl-plus-2025-07-10

Juga dikenal sebagai qwen-vl-plus-0710.
Lebih lanjut meningkatkan pemahaman konten dari video pengawasan.

32.768

30.720

Maksimum 16.384 token per citra.

$0,022

$0,216

qwen-vl-plus-2025-05-07

Juga dikenal sebagai qwen-vl-plus-0507.
Secara signifikan meningkatkan pemahaman matematika, penalaran, dan konten dari video pengawasan.

131.072

129.024

Maksimum 16.384 token per citra.

$0,216

$0,646

qwen-vl-plus-2025-01-25

Juga dikenal sebagai qwen-vl-plus-0125.

Merupakan peningkatan seri Qwen2.5-VL, memperluas context window menjadi 128K, serta secara signifikan meningkatkan pemahaman citra dan video.

qwen-vl-plus-2025-01-02

Juga dikenal sebagai qwen-vl-plus-0102.

32.768

30.720

Maksimum 16.384 token per citra.

2.048

qwen-vl-plus-2024-08-09

Juga dikenal sebagai qwen-vl-plus-0809.

Qwen-OCR

Model Qwen-OCR dirancang untuk ekstraksi teks. Dibandingkan dengan model Qwen-VL, model ini mengkhususkan diri dalam mengekstraksi teks dari citra dokumen, tabel, lembar ujian, dan tulisan tangan. Model ini dapat mengenali beberapa bahasa, seperti Inggris, Prancis, Jepang, Korea, Jerman, Rusia, dan Italia. Penggunaan | Referensi API | Coba secara online

Internasional (Singapura)

Model

Version

Context window

Max input

Max output

Input cost

Output cost

Kuota gratis

(Catatan)

(Tokens)

(Juta token)

qwen-vl-ocr

Stable

34.096

30.000

Hingga 30.000 per citra

4.096

$0,72

$0,72

1 juta token masing-masing

Berlaku selama 90 hari setelah aktivasi.

qwen-vl-ocr-2025-11-20

Juga dikenal sebagai qwen-vl-ocr-1120
Berdasarkan Qwen3-VL. Secara signifikan meningkatkan penguraian dokumen dan pelokalan teks.

Snapshot

38.192

8.192

$0,07

$0,16

China Daratan (Beijing)

Model

Version

Context window

Max input

Max output

Input cost

Output cost

Kuota gratis

(Catatan)

(Tokens)

(Juta token)

qwen-vl-ocr

Saat ini memiliki kemampuan yang sama dengan qwen-vl-ocr-2025-08-28

Stable

34.096

30.000

Hingga 30.000 per citra

4.096

$0,717

$0,717

Tidak ada kuota gratis

qwen-vl-ocr-latest

Selalu memiliki kemampuan yang sama dengan Snapshot terbaru

Latest

38.192

8.192

$0,043

$0,072

qwen-vl-ocr-2025-11-20

Juga dikenal sebagai qwen-vl-ocr-1120
Berdasarkan Qwen3-VL. Secara signifikan meningkatkan penguraian dokumen dan lokalisasi teks.

Snapshot

qwen-vl-ocr-2025-08-28

Juga dikenal sebagai qwen-vl-ocr-0828

34.096

4.096

$0,717

$0,717

qwen-vl-ocr-2025-04-13

Juga dikenal sebagai qwen-vl-ocr-0413

qwen-vl-ocr-2024-10-28

Juga dikenal sebagai qwen-vl-ocr-1028

Qwen-Math

Qwen-Math adalah model bahasa yang dirancang untuk menyelesaikan soal matematika. Penggunaan | Referensi API | Coba secara online

Catatan

Model ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Versi

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-math-plus

Kemampuan yang sama dengan qwen-math-plus-2024-09-19.

Stable

4.096

3.072

3.072

$0,574

$1,721

qwen-math-plus-latest

Kemampuan yang sama dengan Snapshot terbaru.

Latest

qwen-math-plus-2024-09-19

Juga dikenal sebagai qwen-math-plus-0919.

Snapshot

qwen-math-plus-2024-08-16

Juga dikenal sebagai qwen-math-plus-0816.

qwen-math-turbo

Kemampuan yang sama dengan qwen-math-turbo-2024-09-19.

Stable

$0,287

$0,861

qwen-math-turbo-latest

Kemampuan yang sama dengan Snapshot terbaru.

Latest

qwen-math-turbo-2024-09-19

Juga dikenal sebagai qwen-math-turbo-0919.

Snapshot

Qwen-Coder

Model seri Qwen3-Coder-Plus terbaru adalah model generasi kode Qwen yang dibangun di atas Qwen3. Model ini merupakan agen pemrograman yang andal, unggul dalam pemanggilan tool dan interaksi lingkungan. Model-model ini dapat memprogram secara otonom serta menyediakan kemampuan coding dan serbaguna yang luar biasa. Penggunaan | Referensi API | Coba online

Internasional (Singapura)

Model

Version

Context window

Max input

Max output

Input cost (Million tokens)

Output cost (Million tokens)

Free quota

(Catatan)

Tokens

Per million tokens

qwen3-coder-plus

Saat ini setara dengan qwen3-coder-plus-2025-07-22

Stable

1.000.000

997.952

65.536

Harga bertingkat. Lihat penjelasan di bawah tabel.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

qwen3-coder-plus-2025-09-23

Snapshot

qwen3-coder-plus-2025-07-22

Snapshot

qwen3-coder-flash

Saat ini setara dengan qwen3-coder-flash-2025-07-28

Stable

qwen3-coder-flash-2025-07-28

Snapshot

Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input per permintaan.

seri qwen3-coder-plus

Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. Model qwen3-coder-plus mendukung context cache. Teks input yang mengenai implicit cache ditagih sebesar 20% dari harga satuan. Teks input yang mengenai explicit cache ditagih sebesar 10% dari harga satuan.

Input tokens per request

Input cost (Million tokens)

Output cost (Million tokens)

0 < Tokens ≤ 32K

$1

$5

32K < Tokens ≤ 128K

$1,8

$9

128K < Tokens ≤ 256K

$3

$15

256K < Tokens ≤ 1M

$6

$60

seri qwen3-coder-flash

Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. Model qwen3-coder-flash mendukung context cache. Teks input yang mengenai implicit cache ditagih sebesar 20% dari harga satuan. Teks input yang mengenai explicit cache ditagih sebesar 10% dari harga satuan.

Input tokens per request

Input cost (Million tokens)

Output cost (Million tokens)

0 < Tokens ≤ 32K

$0,3

$1,5

32K < Tokens ≤ 128K

$0,5

$2,5

128K < Tokens ≤ 256K

$0,8

$4

256K < Tokens ≤ 1M

$1,6

$9,6

China Daratan (Beijing)

Model

Version

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen3-coder-plus

Menyediakan fungsionalitas yang sama dengan qwen3-coder-plus-2025-07-22.

Stable

1.000.000

997.952

65.536

Harga bertingkat. Lihat penjelasan di bawah tabel.

qwen3-coder-plus-2025-09-23

Snapshot

qwen3-coder-plus-2025-07-22

Snapshot

qwen3-coder-flash

Saat ini merupakan alias untuk qwen3-coder-flash-2025-07-28.

Stable

qwen3-coder-flash-2025-07-28

Snapshot

Model-model ini menggunakan penagihan bertingkat berdasarkan jumlah token input per permintaan.

seri qwen3-coder-plus

Harga untuk qwen3-coder-plus, qwen3-coder-plus-2025-09-23, dan qwen3-coder-plus-2025-07-22 adalah sebagai berikut. Model qwen3-coder-plus mendukung context cache. Teks input yang mengenai implicit cache ditagih sebesar 20% dari harga satuan. Teks input yang mengenai explicit cache ditagih sebesar 10% dari harga satuan.

Input tokens per request

Input cost (Million tokens)

Output cost (Million tokens)

0 < Tokens ≤ 32K

$0,574

$2,294

32K < Tokens ≤ 128K

$0,861

$3,441

128K < Tokens ≤ 256K

$1,434

$5,735

256K < Tokens ≤ 1M

$2,868

$28,671

seri qwen3-coder-flash

Harga untuk qwen3-coder-flash dan qwen3-coder-flash-2025-07-28 adalah sebagai berikut. Model qwen3-coder-flash mendukung context cache. Teks input yang mengenai implicit cache ditagih sebesar 20% dari harga satuan. Teks input yang mengenai explicit cache ditagih sebesar 10% dari harga satuan.

Input tokens per request

Input cost (Million tokens)

Output cost (Million tokens)

0 < Tokens ≤ 32K

$0,144

$0,574

32K < Tokens ≤ 128K

$0,216

$0,861

128K < Tokens ≤ 256K

$0,359

$1,434

256K < Tokens ≤ 1M

$0,717

$3,584

Model lainnya

Model

Version

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-coder-plus

Fungsionalitas yang sama dengan qwen-coder-plus-2024-11-06

Stable

131.072

129.024

8.192

$0,502

$1,004

qwen-coder-plus-latest

Fungsionalitas yang sama dengan versi snapshot terbaru qwen-coder-plus

Latest

qwen-coder-plus-2024-11-06

Juga dikenal sebagai qwen-coder-plus-1106

Snapshot

qwen-coder-turbo

Fungsionalitas yang sama dengan qwen-coder-turbo-2024-09-19

Stable

131.072

129.024

8.192

$0,287

$0,861

qwen-coder-turbo-latest

Fungsionalitas yang sama dengan versi snapshot terbaru qwen-coder-turbo

Latest

qwen-coder-turbo-2024-09-19

Juga dikenal sebagai qwen-coder-turbo-0919

Snapshot

Qwen-MT

Model terjemahan besar andalan ini merupakan peningkatan komprehensif dari Qwen 3. Model ini mendukung terjemahan antara 92 bahasa, termasuk Tiongkok, Inggris, Jepang, Korea, Prancis, Spanyol, Jerman, Thailand, Indonesia, Vietnam, dan Arab. Performa serta kualitas terjemahannya mengalami peningkatan signifikan. Model ini menyediakan dukungan yang lebih baik untuk glosarium kustom, retensi format, dan prompt spesifik domain, sehingga menghasilkan terjemahan yang lebih akurat dan alami. Penggunaan.

Internasional (Singapura)

Model

Context window

Max input

Max output

Input cost

Output cost

Free quota

Lihat aturan

(Tokens)

(Million tokens)

qwen-mt-plus

Bagian dari Qwen3-MT

16.384

8.192

8.192

Rp2,46

$7,37

1 juta token per model

Kadaluarsa 90 hari setelah mengaktifkan Alibaba Cloud Model Studio.

qwen-mt-flash

Bagian dari Qwen3-MT

$0,16

Rp0,49

qwen-mt-turbo

Bagian dari Qwen3-MT

$0,16

$0,49

Tiongkok Daratan (Beijing)

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-mt-plus

Bagian dari Qwen3-MT

16.384

8.192

8.192

$0,259

$0,775

qwen-mt-flash

Bagian dari Qwen3-MT

$0,101

$0,280

qwen-mt-turbo

Bagian dari Qwen3-MT

$0,101

Rp0,280

Model penambangan data Qwen

Model penambangan data Qwen mengekstraksi informasi terstruktur dari dokumen untuk digunakan dalam domain seperti Anotasi data dan moderasi konten. Penggunaan | Referensi API

Catatan

Hanya tersedia di Wilayah Tiongkok (Beijing).

Model

Context window

Max input

Max output

Input cost

Output cost

Kuota gratis

(Tokens)

(Juta token)

qwen-doc-turbo

131.072

129.024

8.192

$0,087

Rp0,144

Tidak ada kuota gratis

Qwen deep research model

Model Qwen deep research memecah masalah kompleks, melakukan inferensi dan analisis menggunakan pencarian web, serta menghasilkan laporan penelitian. Usage | API reference

Catatan

Hanya tersedia di Wilayah Tiongkok (Beijing).

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Per 1.000 tokens)

qwen-deep-research

1.000.000

997.952

32.768

$0,007742

$0,023367

Generasi teks - Versi open-source Qwen

  • Pada nama model, xxb menunjukkan ukuran parameter. Sebagai contoh, qwen2-72b-instruct menunjukkan ukuran parameter sebesar 72 miliar (72B).

  • Alibaba Cloud Model Studio mendukung pemanggilan versi open-source Qwen. Anda tidak perlu melakukan deployment model secara lokal. Untuk versi open-source, kami merekomendasikan penggunaan model Qwen3 dan Qwen2.5.

Qwen3

qwen3-next-80b-a3b-thinking, dirilis pada September 2025, hanya mendukung mode thinking. Dibandingkan dengan qwen3-235b-a22b-thinking-2507, model ini menawarkan peningkatan kemampuan mengikuti instruksi dan ringkasan yang lebih ringkas.

qwen3-next-80b-a3b-instruct, dirilis pada September 2025, hanya mendukung mode non-thinking. Model ini menawarkan peningkatan pemahaman bahasa Mandarin, penalaran logis, dan kemampuan generasi teks dibandingkan dengan qwen3-235b-a22b-instruct-2507.

Model qwen3-235b-a22b-thinking-2507 dan qwen3-30b-a3b-thinking-2507, yang dirilis pada Juli 2025, hanya mendukung mode thinking. Keduanya merupakan versi peningkatan dari qwen3-235b-a22b (mode thinking) dan qwen3-30b-a3b (mode thinking).

Model qwen3-235b-a22b-instruct-2507 dan qwen3-30b-a3b-instruct-2507, yang dirilis pada Juli 2025, hanya mendukung mode non-thinking. Keduanya merupakan versi peningkatan dari qwen3-235b-a22b (mode non-thinking) dan qwen3-30b-a3b (mode non-thinking).

Model Qwen3, yang dirilis pada April 2025, mendukung kedua mode thinking dan non-thinking. Anda dapat beralih antar mode menggunakan parameter enable_thinking. Model Qwen3 juga menampilkan peningkatan kemampuan signifikan:

  1. Kemampuan inferensi: Dalam evaluasi untuk matematika, kode, dan penalaran logis, model ini secara signifikan melampaui QwQ dan model non-reasoning lainnya dengan skala serupa. Performanya termasuk kelas atas di industri untuk model dengan skala tersebut.

  2. Penyelarasan preferensi manusia: Model ini menunjukkan peningkatan besar dalam penulisan kreatif, asumsi peran, percakapan multi-putaran, dan kepatuhan terhadap instruksi. Kemampuan umumnya jauh lebih baik dibandingkan model lain dengan skala serupa.

  3. Kemampuan agen: Model ini memberikan performa terdepan di industri baik dalam mode thinking maupun non-thinking, serta mampu melakukan pemanggilan alat eksternal secara presisi.

  4. Kemampuan multibahasa: Model ini mendukung lebih dari 100 bahasa dan dialek. Terdapat peningkatan signifikan dalam terjemahan multibahasa, pemahaman instruksi, dan penalaran akal sehat.

    Bahasa yang didukung

    English

    Simplified Chinese

    Traditional Chinese

    French

    Spanish

    Arabic. Menggunakan aksara Arab dan merupakan bahasa resmi di banyak negara Arab.

    Russian. Menggunakan aksara Cyrillic dan merupakan bahasa resmi di Rusia serta beberapa negara lainnya.

    Portuguese. Menggunakan aksara Latin dan merupakan bahasa resmi di Portugal, Brasil, serta negara-negara berbahasa Portugis lainnya.

    German. Menggunakan aksara Latin dan merupakan bahasa resmi di negara-negara seperti Jerman dan Austria.

    Italian. Menggunakan aksara Latin dan merupakan bahasa resmi di Italia, San Marino, serta sebagian wilayah Swiss.

    Dutch. Menggunakan aksara Latin dan merupakan bahasa resmi di Belanda, sebagian wilayah Belgia (Flanders), serta Suriname.

    Danish. Menggunakan aksara Latin dan merupakan bahasa resmi di Denmark.

    Irish. Menggunakan aksara Latin dan merupakan salah satu bahasa resmi di Irlandia.

    Welsh. Menggunakan aksara Latin dan merupakan salah satu bahasa resmi di Wales.

    Finnish. Menggunakan aksara Latin dan merupakan bahasa resmi di Finlandia.

    Icelandic. Menggunakan aksara Latin dan merupakan bahasa resmi di Islandia.

    Swedish. Menggunakan aksara Latin dan merupakan bahasa resmi di Swedia.

    Norwegian Nynorsk. Menggunakan aksara Latin dan merupakan salah satu dari dua standar tertulis resmi bahasa Norwegia, digunakan bersama Norwegian Bokmål.

    Norwegian Bokmål. Menggunakan aksara Latin dan merupakan standar tertulis resmi bahasa Norwegia yang lebih umum digunakan.

    Japanese. Menggunakan aksara Jepang dan merupakan bahasa resmi di Jepang.

    Korean. Menggunakan Hangul dan merupakan bahasa resmi di Korea Selatan serta Korea Utara.

    Vietnamese. Menggunakan aksara Latin dan merupakan bahasa resmi di Vietnam.

    Thai. Menggunakan aksara Thailand dan merupakan bahasa resmi di Thailand.

    Indonesian. Menggunakan aksara Latin dan merupakan bahasa resmi di Indonesia.

    Malay. Menggunakan aksara Latin dan merupakan bahasa utama di Malaysia serta beberapa negara lainnya.

    Burmese. Menggunakan aksara Myanmar dan merupakan bahasa resmi di Myanmar.

    Tagalog. Menggunakan aksara Latin dan merupakan salah satu bahasa utama di Filipina.

    Khmer. Menggunakan aksara Khmer dan merupakan bahasa resmi di Kamboja.

    Lao. Menggunakan aksara Lao dan merupakan bahasa resmi di Laos.

    Hindi. Menggunakan aksara Devanagari dan merupakan salah satu bahasa resmi di India.

    Bengali. Menggunakan aksara Bengali dan merupakan bahasa resmi di Bangladesh serta negara bagian West Bengal di India.

    Urdu. Menggunakan aksara Arab, merupakan bahasa resmi di Pakistan, dan juga dituturkan di India.

    Nepali. Menggunakan aksara Devanagari dan merupakan bahasa resmi di Nepal.

    Hebrew. Menggunakan aksara Ibrani dan merupakan bahasa resmi di Israel.

    Turkish. Menggunakan aksara Latin dan merupakan bahasa resmi di Türkiye serta Siprus Utara.

    Persian. Menggunakan aksara Arab dan merupakan bahasa resmi di negara-negara seperti Iran dan Tajikistan.

    Polish. Menggunakan aksara Latin dan merupakan bahasa resmi di Polandia.

    Ukrainian. Menggunakan aksara Cyrillic dan merupakan bahasa resmi di Ukraina.

    Czech. Menggunakan aksara Latin dan merupakan bahasa resmi di Republik Ceko.

    Romanian. Menggunakan aksara Latin dan merupakan bahasa resmi di Rumania serta Moldova.

    Bulgarian. Menggunakan aksara Cyrillic dan merupakan bahasa resmi di Bulgaria.

    Slovak. Menggunakan aksara Latin dan merupakan bahasa resmi di Slovakia.

    Hungarian. Menggunakan aksara Latin dan merupakan bahasa resmi di Hongaria.

    Slovenian. Menggunakan aksara Latin dan merupakan bahasa resmi di Slovenia.

    Latvian. Menggunakan aksara Latin dan merupakan bahasa resmi di Latvia.

    Estonian. Menggunakan aksara Latin dan merupakan bahasa resmi di Estonia.

    Lithuanian. Menggunakan aksara Latin dan merupakan bahasa resmi di Lituania.

    Belarusian. Menggunakan aksara Cyrillic dan merupakan salah satu bahasa resmi di Belarus.

    Greek. Menggunakan alfabet Yunani dan merupakan bahasa resmi di Yunani serta Siprus.

    Croatian. Menggunakan aksara Latin dan merupakan bahasa resmi di Kroasia.

    Macedonian. Menggunakan aksara Cyrillic dan merupakan bahasa resmi di North Macedonia.

    Maltese. Menggunakan aksara Latin dan merupakan bahasa resmi di Malta.

    Serbian. Menggunakan aksara Cyrillic dan merupakan bahasa resmi di Serbia.

    Bosnian. Menggunakan aksara Latin dan merupakan salah satu bahasa resmi di Bosnia dan Herzegovina.

    Georgian. Menggunakan aksara Georgia dan merupakan bahasa resmi di Georgia.

    Armenian. Menggunakan alfabet Armenia dan merupakan bahasa resmi di Armenia.

    North Azerbaijani. Menggunakan aksara Latin dan merupakan bahasa resmi di Azerbaijan.

    Kazakh. Menggunakan aksara Cyrillic dan merupakan bahasa resmi di Kazakhstan.

    Northern Uzbek. Menggunakan aksara Latin dan merupakan bahasa resmi di Uzbekistan.

    Tajik. Menggunakan aksara Cyrillic dan merupakan bahasa resmi di Tajikistan.

    Swahili. Menggunakan aksara Latin dan merupakan bahasa pengantar atau bahasa resmi di banyak negara Afrika Timur.

    Afrikaans. Menggunakan aksara Latin dan terutama dituturkan di Afrika Selatan serta Namibia.

    Cantonese. Menggunakan aksara Tionghoa Tradisional dan merupakan bahasa utama yang dituturkan di Provinsi Guangdong, Hong Kong, serta Makau.

    Luxembourgish. Menggunakan aksara Latin dan merupakan bahasa resmi di Luksemburg. Bahasa ini juga dituturkan di sebagian wilayah Jerman.

    Limburgish. Menggunakan aksara Latin dan terutama dituturkan di Belanda, Belgia, serta sebagian wilayah Jerman.

    Catalan. Menggunakan aksara Latin dan dituturkan di Catalonia serta wilayah lain di Spanyol.

    Galician. Menggunakan aksara Latin dan terutama dituturkan di wilayah Galicia, Spanyol.

    Asturian. Menggunakan aksara Latin dan terutama dituturkan di wilayah Asturias, Spanyol.

    Basque. Menggunakan aksara Latin. Merupakan bahasa resmi di Komunitas Otonom Basque di Spanyol dan terutama dituturkan di seluruh wilayah Basque di Spanyol serta Prancis.

    Occitan. Menggunakan aksara Latin dan terutama dituturkan di wilayah selatan Prancis.

    Venetian. Menggunakan aksara Latin dan terutama dituturkan di wilayah Veneto, Italia.

    Sardinian. Menggunakan aksara Latin dan terutama dituturkan di pulau Sardinia, Italia.

    Sicilian. Menggunakan aksara Latin dan terutama dituturkan di pulau Sisilia, Italia.

    Friulian. Menggunakan aksara Latin dan terutama dituturkan di Friuli-Venezia Giulia, Italia.

    Lombard. Menggunakan aksara Latin dan terutama dituturkan di wilayah Lombardia, Italia.

    Ligurian. Menggunakan aksara Latin dan terutama dituturkan di wilayah Liguria, Italia.

    Faroese. Menggunakan aksara Latin dan merupakan bahasa resmi di Kepulauan Faroe.

    Tosk Albanian. Menggunakan aksara Latin dan merupakan dialek selatan bahasa Albania.

    Silesian. Menggunakan aksara Latin dan terutama dituturkan di Polandia.

    Bashkir. Menggunakan aksara Cyrillic dan terutama dituturkan di Bashkortostan, Rusia.

    Tatar. Menggunakan aksara Cyrillic dan terutama dituturkan di Tatarstan, Rusia.

    Mesopotamian Arabic. Menggunakan aksara Arab dan terutama dituturkan di Irak.

    Najdi Arabic. Menggunakan aksara Arab dan terutama dituturkan di wilayah Najd, Arab Saudi.

    Egyptian Arabic. Menggunakan aksara Arab dan terutama dituturkan di Mesir.

    Levantine Arabic. Menggunakan aksara Arab dan terutama dituturkan di Suriah serta Lebanon.

    Ta'izzi-Adeni Arabic. Menggunakan aksara Arab dan terutama dituturkan di Yaman serta wilayah Hadhramaut di Arab Saudi.

    Dari. Menggunakan aksara Arab dan merupakan salah satu bahasa resmi di Afghanistan.

    Tunisian Arabic. Menggunakan aksara Arab dan terutama dituturkan di Tunisia.

    Moroccan Arabic. Menggunakan aksara Arab dan terutama dituturkan di Maroko.

    Kabuverdianu. Menggunakan aksara Latin dan terutama dituturkan di Tanjung Verde.

    Tok Pisin. Menggunakan aksara Latin dan merupakan salah satu bahasa pengantar utama di Papua Nugini.

    Eastern Yiddish. Menggunakan aksara Ibrani dan terutama dituturkan di komunitas Yahudi.

    Sindhi. Menggunakan aksara Arab dan merupakan bahasa resmi di provinsi Sindh, Pakistan.

    Sinhala. Menggunakan aksara Sinhala dan merupakan salah satu bahasa resmi di Sri Lanka.

    Telugu. Menggunakan aksara Telugu dan merupakan bahasa resmi di negara bagian Andhra Pradesh serta Telangana di India.

    Punjabi. Menggunakan aksara Gurmukhi, dituturkan di negara bagian Punjab, India, serta merupakan bahasa resmi di India.

    Tamil. Menggunakan aksara Tamil dan merupakan bahasa resmi di negara bagian Tamil Nadu, India, serta di Sri Lanka.

    Gujarati. Menggunakan aksara Gujarati dan merupakan bahasa resmi di negara bagian Gujarat, India.

    Malayalam. Menggunakan aksara Malayalam dan merupakan bahasa resmi di negara bagian Kerala, India.

    Marathi. Menggunakan aksara Devanagari dan merupakan bahasa resmi di negara bagian Maharashtra, India.

    Kannada. Menggunakan aksara Kannada dan merupakan bahasa resmi di negara bagian Karnataka, India.

    Magahi. Menggunakan aksara Devanagari dan terutama dituturkan di negara bagian Bihar, India.

    Oriya. Menggunakan aksara Odia dan merupakan salah satu bahasa resmi di negara bagian Odisha, India.

    Awadhi. Menggunakan aksara Devanagari dan terutama dituturkan di negara bagian Uttar Pradesh, India.

    Maithili. Menggunakan aksara Devanagari, dituturkan di negara bagian Bihar, India, serta dataran Terai di Nepal, dan merupakan bahasa resmi di India.

    Assamese. Menggunakan aksara Bengali dan merupakan bahasa resmi di negara bagian Assam, India.

    Chhattisgarhi. Menggunakan aksara Devanagari dan terutama dituturkan di negara bagian Chhattisgarh, India.

    Bhojpuri. Menggunakan aksara Devanagari dan dituturkan di sebagian wilayah India serta Nepal.

    Minangkabau. Menggunakan aksara Latin dan terutama dituturkan di pulau Sumatra, Indonesia.

    Balinese. Menggunakan aksara Latin dan terutama dituturkan di pulau Bali, Indonesia.

    Javanese. Menggunakan aksara Latin, meskipun aksara Jawa juga secara tradisional digunakan. Bahasa ini banyak dituturkan di pulau Jawa, Indonesia.

    Banjar. Menggunakan aksara Latin dan terutama dituturkan di pulau Kalimantan, Indonesia.

    Sundanese. Menggunakan aksara Latin, meskipun aksara Sunda juga secara tradisional digunakan. Bahasa ini terutama dituturkan di bagian barat pulau Jawa, Indonesia.

    Cebuano. Menggunakan aksara Latin dan terutama dituturkan di wilayah Cebu, Filipina.

    Pangasinan. Menggunakan aksara Latin dan terutama dituturkan di provinsi Pangasinan, Filipina.

    Iloko. Menggunakan aksara Latin dan terutama dituturkan di Filipina.

    Waray (Philippines). Menggunakan aksara Latin dan terutama dituturkan di Filipina.

    Haitian Creole. Menggunakan aksara Latin dan merupakan salah satu bahasa resmi di Haiti.

    Papiamento. Menggunakan aksara Latin dan terutama dituturkan di wilayah Karibia seperti Aruba dan Curaçao.

  5. Perbaikan format respons: Pembaruan ini memperbaiki masalah format respons dari versi sebelumnya, seperti Markdown yang salah, respons terpotong, dan output boxed yang tidak tepat.

Model open-source Qwen3 yang dirilis pada April 2025 tidak mendukung output non-streaming dalam mode thinking.
Jika model open-source Qwen3 berada dalam mode thinking tetapi tidak menghasilkan proses berpikir, maka akan ditagih dengan tarif mode non-thinking.

Mode thinking | Mode non-thinking | Penggunaan

Internasional (Singapura)

Model

Mode

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen3-next-80b-a3b-thinking

Thinking only

131.072

126.976

81.920

32.768

$0,15

$1,2

1 juta token

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

qwen3-next-80b-a3b-instruct

Non-thinking only

129.024

-

qwen3-235b-a22b-thinking-2507

Thinking only

126.976

81.920

$0,23

$2,3

qwen3-235b-a22b-instruct-2507

Non-thinking only

129.024

-

$0,92

qwen3-30b-a3b-thinking-2507

Thinking only

126.976

81.920

$0,2

$2,4

qwen3-30b-a3b-instruct-2507

Non-thinking only

129.024

-

$0,8

qwen3-235b-a22b

Model ini dan model berikutnya dirilis pada April 2025.

Non-thinking mode

129.024

-

16.384

$0,7

$2,8

Thinking mode

98.304

38.912

$8,4

qwen3-32b

Non-thinking mode

129.024

-

$0,16

$0,64

Thinking mode

98.304

38.912

qwen3-30b-a3b

Non-thinking mode

129.024

-

$0,2

$0,8

Thinking mode

98.304

38.912

$2,4

qwen3-14b

Non-thinking mode

129.024

-

8.192

$0,35

$1,4

Thinking mode

98.304

38.912

$4,2

qwen3-8b

Non-thinking mode

129.024

-

$0,18

$0,7

Thinking mode

98.304

38.912

$2,1

qwen3-4b

Non-thinking mode

129.024

-

$0,11

$0,42

Thinking mode

98.304

38.912

$1,26

qwen3-1.7b

Non-thinking mode

32.768

30.720

-

$0,42

Thinking mode

28.672

Total nilai tidak boleh melebihi 30.720.

$1,26

qwen3-0.6b

Non-thinking mode

30.720

-

$0,42

Thinking mode

28.672

Total nilai dan input tidak boleh melebihi 30.720.

$1,26

China Daratan (Beijing)

Model

Mode

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

(Tokens)

(Million tokens)

qwen3-next-80b-a3b-thinking

Thinking only

131.072

126.976

81.920

32.768

$0,144

$1,434

qwen3-next-80b-a3b-instruct

Non-thinking only

129.024

-

$0,574

qwen3-235b-a22b-thinking-2507

Thinking only

126.976

81.920

$0,287

$2,868

qwen3-235b-a22b-instruct-2507

Non-thinking only

129.024

-

$1,147

qwen3-30b-a3b-thinking-2507

Thinking only

126.976

81.920

$0,108

$1,076

qwen3-30b-a3b-instruct-2507

Non-thinking only

129.024

-

$0,431

qwen3-235b-a22b

Non-thinking

129.024

-

16.384

$0,287

$1,147

Thinking

98.304

38.912

$2,868

qwen3-32b

Non-thinking

129.024

-

$0,287

$1,147

Thinking

98.304

38.912

$2,868

qwen3-30b-a3b

Non-thinking

129.024

-

$0,108

$0,431

Thinking

98.304

38.912

$1,076

qwen3-14b

Non-thinking

129.024

-

8.192

$0,144

$0,574

Thinking

98.304

38.912

$1,434

qwen3-8b

Non-thinking

129.024

-

$0,072

$0,287

Thinking

98.304

38.912

$0,717

qwen3-4b

Non-thinking

129.024

-

$0,044

$0,173

Thinking

98.304

38.912

$0,431

qwen3-1.7b

Non-thinking

32.768

30.720

-

$0,173

Thinking

28.672

Jumlah token input dan chain-of-thought tidak boleh melebihi 30.720.

$0,431

qwen3-0.6b

Non-thinking

30.720

-

$0,173

Thinking

28.672

Jumlah token input dan chain-of-thought tidak boleh melebihi 30.720.

$0,431

QwQ-Open-source

Model reasoning QwQ yang dilatih pada Qwen2.5-32B. Pembelajaran penguatan (reinforcement learning) telah meningkatkan secara signifikan kemampuan inferensinya. Metrik inti untuk matematika dan kode (AIME 24/25, LiveCodeBench) serta beberapa metrik umum (IFEval, LiveBench) setara dengan versi full-power DeepSeek-R1. Semua metrik secara signifikan melampaui DeepSeek-R1-Distill-Qwen-32B yang juga berbasis Qwen2.5-32B. Penggunaan | Referensi API

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Context window

Max input

Max chain-of-thought

Max output

Input price

Output price

(Tokens)

(Juta token)

qwq-32b

131.072

98.304

32.768

8.192

$0,287

$0,861

QwQ-Preview

Model qwq-32b-preview adalah model riset eksperimental yang dikembangkan oleh tim Qwen pada tahun 2024. Model ini berfokus pada peningkatan kemampuan penalaran AI, terutama dalam matematika dan pemrograman. Untuk informasi lebih lanjut mengenai keterbatasan model qwq-32b-preview, lihat blog resmi QwQ. Penggunaan | Referensi API | Coba online

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Juta token)

qwq-32b-preview

32.768

30.720

16.384

$0,287

$0,861

Qwen2.5

Qwen2.5 adalah rangkaian model bahasa besar Qwen. Untuk Qwen2.5, kami telah merilis serangkaian model bahasa dasar dan model bahasa yang telah disesuaikan dengan instruksi, dengan ukuran parameter mulai dari 7 miliar hingga 72 miliar. Qwen2.5 mencakup peningkatan berikut dibandingkan Qwen2:

  • Model ini telah menjalani pre-train pada dataset skala besar terbaru kami, yang berisi hingga 18 triliun token.

  • Model pakar khusus kami di bidang-bidang ini telah meningkatkan secara signifikan pengetahuan model dan sangat meningkatkan kemampuan coding dan matematika.

  • Model ini menunjukkan peningkatan signifikan dalam mengikuti instruksi, menghasilkan teks panjang (lebih dari 8K token), memahami data terstruktur (seperti tabel), dan menghasilkan output terstruktur (terutama JSON). Model ini juga lebih tangguh terhadap keragaman prompt sistem, yang meningkatkan implementasi role-play dan pengaturan kondisional untuk chatbot.

  • Model ini mendukung lebih dari 29 bahasa, termasuk Mandarin, Inggris, Prancis, Spanyol, Portugis, Jerman, Italia, Rusia, Jepang, Korea, Vietnam, Thailand, dan Arab.

PenggunaanReferensi APICoba online

Internasional (Singapura)

Model

Context window

Max input

Max output

Input price

Output price

Free quota

(Tokens)

(Million tokens)

qwen2.5-14b-instruct-1m

1.008.192

1.000.000

8.192

$0,805

$3,22

1 juta token input dan 1 juta token output

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

qwen2.5-7b-instruct-1m

$0,368

$1,47

qwen2.5-72b-instruct

131.072

129.024

$1,40

$5,60

qwen2.5-32b-instruct

$0,70

$2,80

qwen2.5-14b-instruct

$0,35

$1,40

Qwen2.5-7B-Instruct

$0,175

$0,700

China Daratan (Beijing)

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen2.5-14b-instruct-1m

1.000.000

1.000.000

8.192

$0,144

$0,431

qwen2.5-7b-instruct-1m

$0,072

$0,144

qwen2.5-72b-instruct

131.072

129.024

$0,574

$1,721

qwen2.5-32b-instruct

$0,287

$0,861

qwen2.5-14b-instruct

$0,144

$0,431

qwen2.5-7b-instruct

$0,072

$0,144

qwen2.5-3b-instruct

32.768

30.720

$0,044

$0,130

qwen2.5-1.5b-instruct

Gratis untuk waktu terbatas

qwen2.5-0.5b-instruct

QVQ

Model qvq-72b-preview adalah model riset eksperimental yang dikembangkan oleh tim Qwen. Model ini berfokus pada peningkatan kemampuan penalaran visual, terutama dalam penalaran matematika. Untuk informasi lebih lanjut mengenai keterbatasan model qvq-72b-preview, lihat blog resmi QVQ. Penggunaan | Referensi API

Untuk membuat model menghasilkan proses berpikir sebelum jawaban akhir, Anda dapat menggunakan versi komersial model QVQ.
Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Context window

Max input

Max output

Input Cost

Output cost

Tokens

Per juta token

qvq-72b-preview

32.768

16.384

Maksimum 16.384 token per citra

16.384

$1,721

$5,161

Qwen-Omni

Ini adalah model besar multimodal baru untuk pemahaman dan generasi, yang dilatih pada Qwen2.5. Model ini mendukung input teks, citra, ucapan, dan video, serta dapat menghasilkan teks dan ucapan secara bersamaan dalam aliran. Kecepatan pemahaman konten multimodal meningkat secara signifikan. Penggunaan | Referensi API

Internasional (Singapura)

Model

Context window

Max input

Max output

Free quota

(Catatan)

(Tokens)

qwen2.5-omni-7b

32.768

30.720

2.048

1 juta token (tanpa memandang modalitas)

Berlaku selama 90 hari setelah mengaktifkan Alibaba Cloud Model Studio.

Setelah kuota gratis habis, aturan penagihan berikut berlaku untuk input dan output:

Item masukan

Harga (Juta token)

Teks

$0,10

Audio

$6,76

Citra/Video

$0,28

Item keluaran

Harga (Juta token)

Teks

$0,40 (jika input hanya berisi teks)

$0,84 (jika input berisi citra, audio, atau video)

Teks dan audio

$13,51 (untuk komponen audio)

Bagian teks dari output tidak ditagih.

China Daratan (Beijing)

Model

Context window

Max input

Max output

(Tokens)

qwen2.5-omni-7b

32.768

30.720

2.048

Aturan penagihan untuk input dan output adalah sebagai berikut:

Input

Harga (Juta token)

Teks

$0,087

Audio

$5,448

Citra atau video

$0,287

Output

Harga (Juta token)

Teks

$0,345 (jika input hanya teks)

$0,861 (jika input mencakup citra, audio, atau video)

Teks dan audio

$10,895 (untuk bagian audio)

Bagian teks dari output tidak ditagih.

Qwen3-Omni-Captioner

Qwen3-Omni-Captioner adalah model open-source berbasis Qwen3-Omni. Tanpa prompt apa pun, model ini secara otomatis menghasilkan deskripsi yang akurat dan komprehensif untuk audio kompleks, termasuk ucapan, suara latar, musik, dan efek suara. Model ini dapat mengidentifikasi emosi pembicara, elemen musikal (seperti gaya dan instrumen), serta informasi sensitif, sehingga cocok untuk aplikasi seperti analisis konten audio, audit keamanan, pengenalan maksud, dan penyuntingan audio. Penggunaan | Referensi API

Catatan

Model ini hanya tersedia di wilayah Singapura.

Model

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen3-omni-30b-a3b-captioner

65.536

32.768

32.768

$3,81

$3,06

1 juta token

Masa berlaku: 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

Qwen-VL

Ini adalah versi open-source Qwen-VL dari Alibaba Cloud. Penggunaan | Referensi API

Model Qwen3-VL menawarkan peningkatan signifikan dibandingkan Qwen2.5-VL:

  • Interaksi agen: Model ini mengoperasikan antarmuka komputer dan ponsel, mendeteksi elemen antarmuka pengguna grafis (GUI), memahami fitur, dan memanggil tool untuk menjalankan tugas. Model ini mencapai performa kelas atas dalam evaluasi seperti OS World.

  • Pengkodean visual: Model ini menghasilkan kode dari citra atau video. Anda dapat menggunakan fitur ini untuk membuat kode HTML, CSS, dan JS dari rancangan atau tangkapan layar website.

  • Kecerdasan spasial: Model ini mendukung penentuan posisi 2D dan 3D serta secara akurat menentukan orientasi objek, perubahan perspektif, dan hubungan oklusi.

  • Pemahaman video panjang: Model ini memahami konten video hingga durasi 20 menit dan dapat menentukan momen spesifik dengan akurasi tingkat detik.

  • Penalaran mendalam: Model ini unggul dalam menangkap detail dan menganalisis sebab-akibat, mencapai performa kelas atas dalam evaluasi seperti MathVista dan MMMU.

  • OCR: Model ini mendukung 33 bahasa dan menunjukkan stabilitas lebih baik dalam skenario dengan pencahayaan kompleks, efek buram, atau kemiringan. Model ini juga meningkatkan secara signifikan akurasi pengenalan karakter langka, naskah kuno, dan istilah teknis.

    Bahasa yang didukung

    Model ini mendukung 33 bahasa berikut: Mandarin, Jepang, Korea, Indonesia, Vietnam, Thailand, Inggris, Prancis, Jerman, Rusia, Portugis, Spanyol, Italia, Swedia, Denmark, Ceko, Norwegia, Belanda, Finlandia, Türkiye, Polandia, Swahili, Rumania, Serbia, Yunani, Kazakh, Uzbek, Cebuano, Arab, Urdu, Persia, Hindi/Devanagari, dan Ibrani.

Internasional (Singapura)

Model

Mode

Context window

Max input

Max chain-of-thought

Max response

Input cost

Biaya Keluaran

CoT + response

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen3-vl-235b-a22b-thinking

Thinking only

126.976

81.920

$0,4

$4

1 juta token masing-masing

Berlaku selama 90 hari setelah Model Studio diaktifkan.

qwen3-vl-235b-a22b-instruct

Non-thinking only

129.024

-

$1,6

qwen3-vl-32b-thinking

Hanya pemikiran

131.072

126,976

81.920

32,768

Rp0,16

$0,64

qwen3-vl-32b-instruct

Non-thinking only

129.024

-

qwen3-vl-30b-a3b-thinking

Hanya berpikir

126.976

81.920

$0,2

$2,4

qwen3-vl-30b-a3b-instruct

Non-thinking only

129.024

-

$0,8

qwen3-vl-8b-thinking

Pemikiran saja

126.976

81.920

$0,18

$2,1

qwen3-vl-8b-instruct

Non-thinking only

129.024

-

$0,7

Model lainnya

Model

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen2.5-vl-72b-instruct

131.072

129.024

Maksimum 16.384 per citra

8.192

$2,8

$8,4

1 juta token

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

qwen2.5-vl-32b-instruct

$1,4

$4,2

qwen2.5-vl-7b-instruct

Rp0,35

$1,05

qwen2.5-vl-3b-instruct

$0,21

$0,63

China Daratan (Beijing)

Model

Mode

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

CoT + response

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen3-vl-235b-a22b-thinking

Thinking only

131.072

126.976

81.920

$0,286705

$2,867051

Tidak ada kuota gratis

qwen3-vl-235b-a22b-instruct

Non-thinking only

129.024

-

$1,146820

qwen3-vl-32b-thinking

Thinking only

131.072

126.976

81.920

32.768

$0,287

$2,868

qwen3-vl-32b-instruct

Non-thinking only

129.024

-

$1,147

qwen3-vl-30b-a3b-thinking

Thinking only

126.976

81.920

$0,108

$1,076

qwen3-vl-30b-a3b-instruct

Non-thinking only

129.024

-

$0,431

qwen3-vl-8b-thinking

Thinking only

126.976

81.920

$0,072

$0,717

qwen3-vl-8b-instruct

Non-thinking only

129.024

-

$0,287

Model lainnya

Model

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Catatan)

(Tokens)

(Juta token)

qwen2.5-vl-72b-instruct

131.072

129.024

Maksimum 16.384 per citra

8.192

$2,294

$6,881

Tidak ada kuota gratis

qwen2.5-vl-32b-instruct

$1,147

$3,441

qwen2.5-vl-7b-instruct

$0,287

$0,717

qwen2.5-vl-3b-instruct

$0,173

$0,517

qwen2-vl-72b-instruct

32.768

30.720

Maksimum 16.384 per citra

2.048

Rp2.294,00

$6,881

Qwen-Math

Ini adalah model bahasa yang dibangun di atas model Qwen dan dikhususkan untuk menyelesaikan permasalahan matematika. Qwen2.5-Math mendukung Chinese dan English serta mengintegrasikan beberapa metode penalaran, termasuk Chain of Thought (CoT), Program of Thought (PoT), dan Tool-Integrated Reasoning (TIR). Penggunaan | Referensi API | Coba secara online

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen2.5-math-72b-instruct

4.096

3.072

3.072

$0,574

$1.721

qwen2.5-math-7b-instruct

$0,144

$0,287

qwen2.5-math-1.5b-instruct

Gratis untuk waktu terbatas

Qwen-Coder

Qwen-Coder adalah model kode open source dari Qwen. Seri terbaru Qwen3-Coder memiliki kemampuan Coding Agent yang kuat. Model ini unggul dalam pemanggilan alat (tool calling), interaksi lingkungan, dan pemrograman otonom. Model ini menggabungkan keterampilan coding yang luar biasa dengan kemampuan serbaguna. Penggunaan | Referensi API

Internasional (Singapura)

Model

Context window

Max input

Max output

Input cost

Output cost

Free quota

(Catatan)

Token count

qwen3-coder-480b-a35b-instruct

262.144

204.800

65.536

Harga bertingkat. Lihat penjelasan di bawah tabel.

1 juta token masing-masing

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

qwen3-coder-30b-a3b-instruct

Penagihan untuk qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct diterapkan secara bertingkat berdasarkan jumlah input token per permintaan.

Model

Input tokens per request

Input cost (Million tokens)

Output cost (Million tokens)

qwen3-coder-480b-a35b-instruct

0 < Tokens ≤ 32K

$1,50

$7,50

32K < Tokens ≤ 128K

$2,70

$13,50

128K < Tokens ≤ 200K

$4,50

$22,50

qwen3-coder-30b-a3b-instruct

0 < Tokens ≤ 32K

$0,45

$2,25

32K < Tokens ≤ 128K

$0,75

$3,75

128K < Tokens ≤ 200K

$1,20

Rp6,00

Tiongkok Daratan (Beijing)

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen3-coder-480b-a35b-instruct

262.144

204.800

65.536

Harga bertingkat. Lihat penjelasan di bawah.

qwen3-coder-30b-a3b-instruct

qwen2.5-coder-32b-instruct

131.072

129.024

8.192

$0,287

$0,861

qwen2.5-coder-14b-instruct

qwen2.5-coder-7b-instruct

$0,144

$0,287

qwen2.5-coder-3b-instruct

32,768

30.720

Uji coba gratis berbatas waktu

qwen2.5-coder-1.5b-instruct

qwen2.5-coder-0.5b-instruct

Penagihan untuk qwen3-coder-480b-a35b-instruct dan qwen3-coder-30b-a3b-instruct diterapkan secara bertingkat berdasarkan jumlah input token per permintaan.

Model

Input tokens per request

Input cost (Million tokens)

Output cost (Million tokens)

qwen3-coder-480b-a35b-instruct

0 < Tokens ≤ 32K

$0,861

$3,441

32K < Tokens ≤ 128K

$1,291

$5,161

128K < Tokens ≤ 200K

$2,151

$8.602

qwen3-coder-30b-a3b-instruct

0 < Tokens ≤ 32K

$0,216

$0,861

32K < Tokens ≤ 128K

$0,323

$1,291

128K < Tokens ≤ 200K

$0,538

$2,151

Generasi teks - Model pihak ketiga

DeepSeek

DeepSeek adalah model bahasa besar yang diluncurkan oleh DeepSeek AI. Referensi API | Coba secara online

Catatan

Fitur ini hanya tersedia di Wilayah Tiongkok (Beijing).

Model

Context window

Max input

Max chain-of-thought

Max response

Input cost

Output cost

(Tokens)

(Million tokens)

deepseek-v3.2-exp

Versi full-power 685B

131.072

98.304

32.768

65.536

$0,287

$0,431

deepseek-v3.1

Versi full-power 685B

$0,574

$1,721

deepseek-r1

Versi full-power 685B

16.384

$2,294

deepseek-r1-0528

Versi full-power 685B

deepseek-v3

Versi full-power 671B

131.072

Not applicable

$0,287

$1,147

deepseek-r1-distill-qwen-1.5b

Berdasarkan Qwen2.5-Math-1.5B

32.768

32.768

16.384

16.384

Limited-time free trial

deepseek-r1-distill-qwen-7b

Berdasarkan Qwen2.5-Math-7B

$0,072

$0,144

deepseek-r1-distill-qwen-14b

Berdasarkan Qwen2.5-14B

$0,144

$0,431

deepseek-r1-distill-qwen-32b

Berdasarkan Qwen2.5-32B

$0,287

$0,861

deepseek-r1-distill-llama-8b

Berdasarkan Llama-3.1-8B

Limited-time free trial

deepseek-r1-distill-llama-70b

Berdasarkan Llama-3.3-70B

Kimi

Kimi-K2 adalah model Mixture of Experts (MoE) open-source pertama di Tiongkok dengan parameter triliunan. Model ini disediakan oleh Moonshot AI, mengaktifkan 32 miliar parameter, serta memiliki kemampuan coding dan tool-calling yang sangat baik. Penggunaan | Coba secara online

Catatan

Fitur ini hanya tersedia di Wilayah Tiongkok (Beijing).

Model

Context window

Max input

Max chain-of-thought

Max response

Input price

Output price

(Tokens)

(Million tokens)

kimi-k2-thinking

262.144

229.376

32.768

16.384

$0,574

$2,294

Moonshot-Kimi-K2-Instruct

131.072

131.072

-

8.192

$0,574

$2,294

Image generation

Qwen text-to-image

Model Qwen text-to-image unggul dalam complex text rendering, terutama untuk teks berbahasa Tiongkok dan Inggris.Saat ini, qwen-image-plus memiliki kemampuan yang sama dengan qwen-image, tetapi qwen-image-plus memiliki harga lebih rendah.API reference

International (Singapore)

Model

Unit price

Free quota

qwen-image-plus

$0,03/image

Free quota: 100 citra untuk setiap model

Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

qwen-image

$0,035/image

Mainland China (Beijing)

Model

Unit price

Free quota

qwen-image-plus

$0,028671/image

No free quota

qwen-image

$0,035/image

Input prompt

Output image

Poster bergaya healing yang digambar tangan menampilkan tiga anak anjing sedang bermain bola di atas rumput hijau yang subur, dilengkapi elemen dekoratif seperti burung dan bintang. Judul utama “Come Play Ball!” ditampilkan mencolok di bagian atas dengan font kartun tebal berwarna biru. Di bawahnya, subjudul “Come [Show Off Your Skills]!” muncul dalam font hijau. Sebuah balon ucapan menambah kesan lucu dengan teks: “Hehe, watch me amaze my little friends next!” Di bagian bawah, terdapat teks tambahan: “We get to play ball with our friends again!” Palet warna didominasi hijau segar dan biru, dengan aksen merah muda dan kuning cerah untuk memperkuat suasana ceria khas anak-anak.

image

Qwen image editing

Model Qwen image editing mendukung pengeditan teks yang presisi dalam bahasa Tiongkok dan Inggris. Model ini juga mendukung operasi seperti penyesuaian warna, peningkatan detail, style transfer, penambahan atau penghapusan objek, serta perubahan posisi dan aksi. Fitur-fitur ini memungkinkan pengeditan kompleks terhadap citra dan teks. API reference

International (Singapore)

Model

Unit price

Free quota

qwen-image-edit-plus

$0.03/image

Free quota: 100 citra untuk setiap model

Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

qwen-image-edit-plus-2025-10-30

$0.03/image

qwen-image-edit

$0.045/image

Mainland China (Beijing)

Model

Unit price

Free quota

qwen-image-edit-plus

$0.028671/image

No free quota

qwen-image-edit-plus-2025-10-30

$0.028671/image

qwen-image-edit

$0.043/image

dog_and_girl (1)

Original image

狗修改图

Buat orang tersebut berdiri dan membungkuk untuk memegang kaki depan anjing.

image

Original image

image

Ganti teks 'HEALTH INSURANCE' pada balok huruf dengan '明天会更好'.

5

Original image

5out

Ganti kemeja bergaris putus-putus dengan kemeja biru muda.

6

Original image

6out

Ubah latar belakang menjadi Antarktika.

7

Original image

7out

Hasilkan gambar profil bergaya kartun dari orang tersebut.

image

Original image

image

Hapus rambut dari piring makan.

Qwen image translation

Model Qwen image translation mendukung penerjemahan teks dari citra dalam 11 bahasa ke bahasa Tiongkok atau Inggris. Model ini secara akurat mempertahankan tata letak asli dan informasi konten, serta menyediakan fitur khusus seperti term definition, sensitive word filtering, dan image entity detection. API reference

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Harga Satuan

Kuota Gratis

qwen-mt-image

$0,000431/gambar

Tidak ada kuota gratis

en

Original image

ja

Japanese

es

Portuguese

ar

Arabic

Wan text-to-image

Model Wan text-to-image menghasilkan citra eksquisit dari teks. API reference | Try it online

International (Singapore)

Model

Description

Unit price

Free quota(Note)

Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

wan2.5-t2i-preview Recommended

Wan 2.5 preview. Batas panjang sisi tunggal dihapus; Anda dapat memilih dimensi secara bebas dalam batasan area piksel total dan rasio aspek.

$0.03/image

50 citra

wan2.2-t2i-plus Recommended

Wan 2.2 Professional Edition. Ditingkatkan secara menyeluruh dalam kreativitas, stabilitas, dan tekstur realistis.

$0.05/image

100 citra

wan2.2-t2i-flash Recommended

Wan 2.2 Flash Edition. Ditingkatkan secara menyeluruh dalam kreativitas, stabilitas, dan tekstur realistis.

$0.025/image

100 citra

wan2.1-t2i-plus

Wan 2.1 Professional Edition. Mendukung multiple styles dan menghasilkan citra dengan detail yang kaya.

$0.05/image

200 citra

wan2.1-t2i-turbo

Wan 2.1 Turbo Edition. Mendukung multiple styles serta menawarkan kecepatan generasi yang cepat.

$0.025/image

200 citra

Mainland China (Beijing)

Model

Description

Unit price

Free quota(Note)

Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

wan2.5-t2i-preview Recommended

Wan 2.5 preview. Batas panjang sisi tunggal dihapus; Anda dapat memilih dimensi secara bebas dalam batasan area piksel total dan rasio aspek.

$0.028671/image

No free quota

wan2.2-t2i-plus Recommended

Wan 2.2 Professional Edition. Ditingkatkan sepenuhnya dalam kreativitas, stabilitas, dan tekstur realistis.

$0.02007/image

No free quota

wan2.2-t2i-flash Recommended

Wan 2.2 Flash Edition. Ditingkatkan sepenuhnya dalam kreativitas, stabilitas, dan tekstur realistis.

$0.028671/image

No free quota

wanx2.1-t2i-plus

Wan 2.1 Professional Edition. Mendukung multiple styles dan menghasilkan citra dengan detail kaya.

$0.028671/image

No free quota

wanx2.1-t2i-turbo

Wan 2.1 Turbo Edition. Mendukung multiple styles dan menawarkan kecepatan generasi cepat.

$0.020070/image

No free quota

wanx2.0-t2i-turbo

Wan 2.0 Turbo Edition. Unggul dalam potret bertekstur dan desain kreatif serta hemat biaya.

$0.005735/image

No free quota

Input prompt

Output image

Seorang Santa Claus yang dibuat dengan teknik needle-felting sedang memegang hadiah dan seekor kucing putih berdiri di sampingnya, dengan latar belakang hadiah-hadiah berwarna-warni dan tanaman hijau, menciptakan adegan yang lucu, hangat, dan nyaman.

image

Wan2.5 general image editing

Model Wan2.5 General Image Editing mendukung pengeditan citra yang konsisten terhadap entitas dan fusi multi-citra. Model ini menerima teks, satu citra, atau beberapa citra sebagai input. API reference

International (Singapore)

Model

Unit price

Free quota(Note)

Periode berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio.

wan2.5-i2i-preview

$0,03/image

50 citra

Mainland China (Beijing)

Model

Harga per unit

Kuota gratis

wan2.5-i2i-preview

$0,028671/gambar

Tidak ada kuota gratis

Feature

Input example

Output image

Single-image editing

damotest2023_Portrait_photography_outdoors_fashionable_beauty_409ae3c1-19e8-4515-8e50-b3c9072e1282_2-转换自-png

a26b226d-f044-4e95-a41c-d1c0d301c30b-转换自-png

Ubah gaun bermotif bunga menjadi gaun panjang bergaya vintage berbahan renda dengan detail bordir indah pada kerah dan manset.

Multi-image fusion

image

p1028883

Tempatkan jam alarm dari Citra 1 di samping vas di atas meja makan pada Citra 2.

Wan2.1 general image editing

Model Wan2.1 general image editing melakukan berbagai pengeditan citra berdasarkan instruksi sederhana. Model ini cocok untuk skenario seperti outpainting, penghapusan watermark, style transfer, restorasi citra, dan peningkatan kualitas citra. PenggunaanReferensi API

Catatan

Fitur ini hanya tersedia di Wilayah China (Beijing).

Model

Harga satuan

Kuota gratis

wanx2.1-imageedit

$0,020070 per citra

Tidak ada kuota gratis

Model general image editing saat ini mendukung fitur-fitur berikut:

Fitur

Citra Masukan

Input prompt

Citra Keluaran

Global stylization

image

Convert to a French picture book style.

image

Local stylization

image

Change the house to a wooden plank style.

image

Instruction-based editing

image

Change the girl's hair to red.

image

Inpainting

Input image

image

Masked image (The white area is the mask)

image

A ceramic rabbit holding a ceramic flower.

Output image

image

Text watermark removal

image

Remove the text from the image.

image

Outpainting

20250319105917

A green fairy.

image

Image super-resolution

Blurry image

image

Image super-resolution.

Clear image

image

Image colorization

image

Blue background, yellow leaves.

image

Line art to image

image

A living room in a minimalist Nordic style.

image

Placeholder Image

image

A cartoon character cautiously peeks out, spying on a brilliant blue gem inside the room.

image

OutfitAnyone

  • Dibandingkan dengan versi dasar, model OutfitAnyone-Plus menawarkan peningkatan dalam definisi citra, detail tekstur pakaian, dan restorasi logo. Namun, proses pembuatan citranya membutuhkan waktu lebih lama sehingga cocok untuk skenario yang tidak sensitif terhadap waktu. Referensi API | Coba secara online

  • OutfitAnyone-Image Parsing mendukung penguraian citra model dan pakaian, yang dapat digunakan untuk pra-pemrosesan dan post-processing citra OutfitAnyone. Referensi API

Catatan

Fitur ini hanya tersedia di wilayah China (Beijing).

Model

Deskripsi

Input Contoh

Output Contoh

aitryon-plus

OutfitAnyone-Plus

output26

output29

aitryon-parsing-v1

OutfitAnyone-Image Parsing

Harga OutfitAnyone

Layanan Model

Model

Harga Satuan

Diskon

Tingkat

OutfitAnyone-Plus

aitryon-plus

$0,071677/citra

None

None

OutfitAnyone-Image Parsing

aitryon-parsing-v1

$0,000574/citra

None

None

Generasi video - Wan

Teks-ke-video

Model teks-ke-video Wan menghasilkan video dari satu kalimat, menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba secara online

Internasional (Singapura)

Model

Deskripsi

Harga satuan

Kuota gratis (Klaim)

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

wan2.5-t2v-preview Disarankan

Pratinjau Wan 2.5. Mendukung narasi otomatis dan input file audio kustom.

480p: USD0,05/detik

720p: USD0,10/detik

1080p: USD0,15/detik

50 detik

wan2.2-t2v-plus Disarankan

Edisi Profesional Wan 2.2. Detail citra dan stabilitas gerakan meningkat signifikan.

480p: USD0,02/detik

1080p: USD0,10/detik

50 detik

wan2.1-t2v-turbo

Edisi Turbo Wan 2.1. Kecepatan generasi cepat dan performa seimbang.

USD0,036/detik

200 detik

wan2.1-t2v-plus

Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya dan citra berkualitas lebih tinggi.

USD0,10/detik

200 detik

Tiongkok Daratan (Beijing)

Model

Deskripsi

Harga satuan

Kuota gratis

wan2.5-t2v-preview Disarankan

Pratinjau Wan 2.5. Mendukung narasi otomatis dan input file audio kustom.

480p: $0,043006/detik

720p: $0,086012/detik

1080p: $0,143353/detik

Tidak ada kuota gratis

wan2.2-t2v-plus Disarankan

Edisi Profesional Wan 2.2. Detail citra dan stabilitas gerakan meningkat signifikan.

480p: $0,02007/detik

1080p: $0,100347/detik

Tidak ada kuota gratis

wanx2.1-t2v-turbo

Kecepatan generasi lebih cepat dengan performa seimbang.

$0,034405/detik

Tidak ada kuota gratis

wanx2.1-t2v-plus

Menghasilkan detail lebih kaya dan citra berkualitas lebih tinggi.

$0,100347/detik

Tidak ada kuota gratis

Contoh input

Video output (wan2.5)

Prompt input: Diambil dari sudut rendah dalam medium close-up, dengan nuansa hangat, pencahayaan campuran (lampu meja menyatu dengan cahaya mendung dari jendela), pencahayaan samping, serta komposisi sentral. Di sebuah kantor detektif klasik, rak buku kayu penuh dengan arsip kasus lama dan asbak. Lampu meja hijau menerangi berkas kasus yang terbuka di tengah meja. Seekor rubah mengenakan mantel trench cokelat tua dan fedora abu-abu muda duduk di kursi kulit, bulunya merah menyala, ekornya terletak ringan di tepi kursi, dan jarinya perlahan membalik halaman-halaman menguning. Di luar, hujan gerimis turun di bawah langit biru, meninggalkan jejak-jejak melengkung di kaca. Perlahan ia mengangkat kepalanya, telinganya bergerak sedikit, matanya yang kuning kecoklatan menatap langsung ke kamera, dan mulutnya bergerak jelas saat berbicara dengan suara halus nan sinis: 'Kasus ini dingin, lebih dingin daripada ikan di musim dingin. Tapi setiap ayam punya rahasia, dan saya, untuk satu hal, berniat menemukannya.'

Audio masukan:

Citra-ke-video – berdasarkan frame pertama

Model citra-ke-video Wan menggunakan citra input sebagai frame pertama video, lalu menghasilkan sisa video berdasarkan prompt. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba secara online

Internasional (Singapura)

Model

Deskripsi

Harga satuan

Kuota gratis (Catatan)

Masa berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

wan2.5-i2v-preview Disarankan

Pratinjau Wan 2.5. Mendukung dubbing otomatis dan unggah file audio kustom.

480P: $0,05/detik

720P: $0,10/detik

1080P: $0,15/detik

50 detik

wan2.2-i2v-flash Disarankan

Edisi Flash Wan 2.2. Memberikan kecepatan generasi sangat cepat dengan peningkatan signifikan pada detail visual dan stabilitas gerakan.

480P: $0,015/detik

720P: $0,036/detik

50 detik

wan2.2-i2v-plus Disarankan

Edisi Profesional Wan 2.2. Memberikan peningkatan signifikan pada detail visual dan stabilitas gerakan.

480P: $0,02/detik

1080P: $0,10/detik

50 detik

wan2.1-i2v-turbo

Edisi Turbo Wan 2.1. Menawarkan kecepatan generasi cepat dengan performa seimbang.

$0,036/detik

200 detik

wan2.1-i2v-plus

Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya serta visual berkualitas tinggi dan bertekstur.

$0,10/detik

200 detik

Tiongkok Daratan (Beijing)

Model

Deskripsi

Harga satuan

Kuota gratis

wan2.5-i2v-preview Disarankan

Pratinjau Wan 2.5. Mendukung dubbing otomatis dan unggah file audio kustom.

480P: $0,043006/detik

720P: $0,086012/detik

1080P: $0,143353/detik

Tidak ada kuota gratis

wan2.2-i2v-plus Disarankan

Edisi Profesional Wan 2.2. Memberikan peningkatan signifikan pada detail visual dan stabilitas gerakan.

480P: $0,02007/detik

1080P: $0,100347/detik

Tidak ada kuota gratis

wanx2.1-i2v-turbo

Edisi Turbo Wan 2.1. Menawarkan kecepatan generasi cepat dengan performa seimbang.

$0,034405/detik

Tidak ada kuota gratis

wanx2.1-i2v-plus

Edisi Profesional Wan 2.1. Menghasilkan detail yang kaya serta visual berkualitas tinggi dan bertekstur.

$0,100347/detik

Tidak ada kuota gratis

Citra frame pertama dan audio input

Video output (wan2.5)

rap-转换自-png

Audio masukan:

Prompt input: Adegan seni fantasi urban. Karakter seni grafiti dinamis: seorang anak laki-laki yang dilukis dengan cat semprot hidup dari dinding beton. Ia menyanyikan lagu rap berbahasa Inggris dengan tempo sangat cepat sambil mengambil pose rapper energik klasik. Latar adegan berada di bawah jembatan kereta perkotaan pada malam hari, dengan pencahayaan dari satu lampu jalan yang menciptakan suasana sinematik penuh energi tinggi dan detail luar biasa. Audio video sepenuhnya terdiri dari rap-nya, tanpa dialog atau kebisingan lainnya.

Citra-ke-video – berdasarkan frame pertama dan terakhir

Model Wan untuk frame pertama dan terakhir menghasilkan video dinamis yang mulus dari prompt. Anda hanya perlu menyediakan citra frame pertama dan terakhir. Videonya menampilkan gaya artistik yang kaya dan kualitas sinematik. Referensi API | Coba secara online

Internasional (Singapura)

Model

Harga satuan

Kuota gratis (Catatan)

wan2.1-kf2v-plus

$0,10/detik

200 detik

Masa berlaku: 90 hari sejak Anda mengaktifkan Model Studio

Tiongkok Daratan (Beijing)

Model

Harga satuan

Kuota gratis (Catatan)

wanx2.1-kf2v-plus

$0,100347/detik

Tidak ada kuota gratis

Contoh input

Video keluaran

Frame pertama

Frame terakhir

Prompt

first_frame

last_frame

Dengan gaya realistis, kamera dimulai sejajar mata dengan seekor kucing hitam kecil yang menatap langit penuh rasa ingin tahu, lalu perlahan bergerak ke atas hingga berakhir pada bidikan dari atas yang memfokuskan pada matanya yang penuh rasa ingin tahu.

Pengeditan video umum

Model pengeditan video terpadu Wan mendukung input multimodal, termasuk teks, citra, dan video, serta mampu melakukan berbagai tugas generasi dan pengeditan video umum. Referensi API | Coba secara online

Internasional (Singapura)

Model

Harga satuan

Kuota gratis (Catatan)

wan2.1-vace-plus

$0,1/detik

50 detik

Masa berlaku: Berlaku selama 90 hari setelah aktivasi Model Studio.

Tiongkok Daratan (Beijing)

Model

Harga satuan

Kuota gratis (Catatan)

wanx2.1-vace-plus

$0,100347/detik

Tidak ada kuota gratis

Model pengeditan video terpadu mendukung fitur-fitur berikut:

Fitur

Citra referensi input

Masukkan prompt

Video keluaran

Referensi multi-citra

Citra referensi 1 (entitas referensi)

image

Citra referensi 2 (latar belakang referensi)

image

Dalam video, seorang gadis berjalan anggun keluar dari hutan kuno yang berkabut. Langkahnya ringan, dan kamera menangkap setiap gerakan lincahnya. Saat ia berhenti dan memandang sekeliling ke hutan yang rindang, senyum terkejut dan gembira merekah di wajahnya. Adegan ini, membeku dalam interaksi antara cahaya dan bayangan, merekam pertemuannya yang indah dengan alam.

Video output

Pelukisan ulang video

Video menampilkan sebuah mobil bergaya steampunk berwarna hitam yang dikemudikan seorang pria. Mobil tersebut dihiasi roda gigi dan pipa tembaga, dengan latar belakang pabrik permen berbasis uap serta elemen retro yang menciptakan suasana vintage yang menyenangkan.

Pengeditan lokal

Video input

Citra mask input (area putih menunjukkan area pengeditan)

mask

Video menampilkan kafe Prancis bergaya Paris tempat seekor singa berjas dengan elegan menyesap kopi. Ia memegang cangkir dengan satu tangan dan menyesap pelan sambil menampilkan ekspresi santai. Kafe tersebut didekorasi dengan selera tinggi, menggunakan warna lembut dan pencahayaan hangat yang menerangi area tempat singa tersebut berada.

Konten di area pengeditan dimodifikasi berdasarkan prompt.

Ekstensi video

Klip pertama input (1 detik)

Seekor anjing yang mengenakan kacamata hitam sedang berseluncur di jalan dengan skateboard, dalam gaya kartun 3D.

Video output yang diperpanjang (5 detik)

Video outpainting

Seorang wanita elegan sedang bersemangat memainkan biola, dengan orkestra simfoni lengkap di belakangnya.

Wan – manusia digital

Fitur ini menghasilkan video orang yang tampak alami sedang berbicara, bernyanyi, atau tampil, berdasarkan satu citra karakter dan file audio. Untuk menggunakan fitur ini, panggil model-model berikut secara berurutan: Deteksi citra wan2.2-s2v | Generasi video wan2.2-s2v.

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Deskripsi

Harga satuan

wan2.2-s2v-detect

Memeriksa apakah citra input memenuhi persyaratan, seperti resolusi tinggi, hanya satu orang, dan pandangan depan.

$0,000574/citra

wan2.2-s2v

Menghasilkan video dinamis seseorang dari citra yang valid dan klip audio.

480P: $0,071677/detik

720P: $0,129018/detik

Contoh input

Video keluaran

p1001125-转换自-jpeg

Audio Input:

Wan – animasi citra

Tersedia dalam mode standar dan profesional. Model ini mentransfer gerakan dan ekspresi dari video referensi ke citra karakter, menghasilkan video yang menganimasikan karakter dari citra tersebut. Referensi API.

Internasional (Singapura)

Model

Layanan

Deskripsi

Harga satuan

Kuota gratis (Lihat)

wan2.2-animate-move

Mode standar wan-std

Kecepatan generasi cepat, memenuhi kebutuhan dasar seperti demo animasi sederhana, serta hemat biaya.

$0,12/detik

Kedua layanan berbagi kuota gratis 50 detik.

Mode profesional wan-pro

Kelancaran animasi tinggi dengan transisi gerakan dan ekspresi yang alami, menghasilkan kualitas menyerupai video live-action.

$0,18/detik

Tiongkok Daratan (Beijing)

Model

Layanan

Deskripsi

Harga satuan

Kuota gratis (Lihat)

wan2.2-animate-move

Mode standar wan-std

Kecepatan generasi cepat, memenuhi kebutuhan dasar seperti demo animasi sederhana, serta hemat biaya.

$0,06/detik

Tidak ada kuota gratis

Mode profesional wan-pro

Kelancaran animasi tinggi dengan transisi alami untuk gerakan dan ekspresi, menghasilkan kualitas yang menyerupai video live-action.

$0,09/detik

Citra karakter

Video referensi

Video output (standar)

Video output (profesional)

move_input_image

Wan – penukaran wajah video

Tersedia dalam mode standar dan profesional. Model ini mengganti karakter utama dalam video dengan karakter dari citra, sekaligus mempertahankan adegan, pencahayaan, dan rona video asli. Referensi API.

Internasional (Singapura)

Model

Layanan

Deskripsi

Harga satuan

Kuota gratis (Lihat)

wan2.2-animate-mix

Mode standar wan-std

Menghasilkan animasi dengan cepat, ideal untuk kebutuhan dasar seperti demo sederhana, serta sangat hemat biaya.

$0,18/detik

Kedua layanan berbagi kuota gratis sebesar 50 detik.

Mode profesional wan-pro

Menghasilkan animasi sangat lancar dengan transisi alami untuk gerakan dan ekspresi, menghasilkan kualitas yang sangat mirip dengan video live-action.

$0,26/detik

Tiongkok Daratan (Beijing)

Model

Layanan

Deskripsi

Harga satuan

Kuota gratis (Lihat)

wan2.2-animate-mix

Mode standar wan-std

Menghasilkan animasi dengan cepat, ideal untuk kebutuhan dasar seperti demo sederhana, serta sangat hemat biaya.

$0,09/detik

Tidak ada kuota gratis

Mode profesional wan-pro

Menghasilkan animasi sangat lancar dengan transisi alami untuk gerakan dan ekspresi, menghasilkan kualitas yang sangat mirip dengan video live-action.

$0,13/detik

Citra karakter

Video referensi

Video output (standar)

Video output (profesional)

mix_input_image

AnimateAnyone

Fitur ini menghasilkan video gerakan karakter berdasarkan citra karakter dan templat gerakan. Untuk menggunakan fitur ini, panggil ketiga model berikut secara berurutan: Detail API deteksi citra AnimateAnyone | Generasi templat gerakan AnimateAnyone | Detail API generasi video AnimateAnyone.

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Deskripsi

Harga satuan

animate-anyone-detect-gen2

Mendeteksi apakah citra input memenuhi spesifikasi yang ditentukan.

$0,000574/citra

animate-anyone-template-gen2

Menambang gerakan karakter dari video dan menghasilkan templat gerakan.

$0,011469/detik

animate-anyone-gen2

Menghasilkan video gerakan karakter berdasarkan citra karakter dan templat gerakan.

Input: Citra karakter

Input: Motion video

Output (latar belakang citra)

Output (latar belakang video)

04-9_16

Catatan
  • Contoh di atas dihasilkan oleh Tongyi App, yang mengintegrasikan AnimateAnyone.

  • Konten yang dihasilkan oleh model AnimateAnyone hanya berupa video dan tidak termasuk audio.

EMO

Fitur ini menghasilkan video potret dinamis berdasarkan citra potret dan file audio suara manusia. Untuk menggunakan fitur ini, panggil model-model berikut secara berurutan: Deteksi citra EMO | Generasi video EMO.

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Deskripsi

Harga satuan

emo-detect-v1

Mendeteksi apakah citra input memenuhi spesifikasi yang ditentukan. Model ini dapat dipanggil langsung tanpa penerapan.

$0,000574/citra

emo-v1

Menghasilkan video potret dinamis. Model ini dapat dipanggil langsung tanpa penerapan.

  • Video rasio aspek 1:1: $0,011469/detik

  • Video rasio aspek 3:4: $0,022937/detik

Input: Citra potret dan file audio suara manusia

Output: Video potret dinamis

Potret:

上春山

Audio suara manusia: Lihat video di sebelah kanan.

Video karakter:

Intensitas gaya aksi: aktif (style_level: "active")

LivePortrait

Ini adalah model ringan yang dengan cepat menghasilkan video potret dinamis berdasarkan citra potret dan file audio suara manusia. Dibandingkan dengan model EMO, model ini menghasilkan video lebih cepat dan dengan biaya lebih rendah, tetapi kualitasnya tidak sebaik EMO. Untuk menggunakan fitur ini, panggil dua model berikut secara berurutan: Deteksi citra LivePortrait | Generasi video LivePortrait.

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Deskripsi

Harga satuan

liveportrait-detect

Mendeteksi apakah citra input memenuhi persyaratan.

$0,000574/citra

liveportrait

Menghasilkan video potret dinamis.

$0,002868/detik

Input: Citra potret dan file audio suara

Output: Video potret animasi

Citra potret:

Emoji男孩

Audio suara: Diambil dari video di sebelah kanan.

Video potret:

Emoji

Fitur ini menghasilkan video wajah dinamis berdasarkan citra wajah dan templat gerakan wajah preset. Kemampuan ini dapat digunakan untuk skenario seperti pembuatan emoji dan pembuatan materi video. Untuk menggunakan fitur ini, panggil model-model berikut secara berurutan: Deteksi citra Emoji | Generasi video Emoji.

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Deskripsi

Harga satuan

emoji-detect-v1

Mendeteksi apakah citra input memenuhi persyaratan yang ditentukan.

$0,000574/citra

emoji-v1

Menghasilkan emoji karakter berdasarkan citra potret dan templat emoji tertentu.

$0,011469/detik

Masukan: Citra potret

Output: Video potret dinamis

image.png

Parameter templat untuk emoji "senang": ("input.driven_id": "mengwa_kaixin")

VideoRetalk

Fitur ini menghasilkan video di mana gerakan bibir karakter sesuai dengan audio input, berdasarkan video karakter dan file audio suara manusia. Untuk menggunakan fitur ini, panggil model berikut: Referensi API.

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Deskripsi

Harga satuan

videoretalk

Menghasilkan video baru dengan gerakan bibir karakter yang disinkronkan dengan audio input.

$0,011469/detik

Style transfer video

Model ini mendukung pembuatan video dalam berbagai gaya yang sesuai dengan deskripsi semantik dari teks input pengguna, atau mengubah gaya video input pengguna. Referensi API.

Catatan

Fitur ini hanya tersedia di wilayah Tiongkok (Beijing).

Model

Deskripsi

Harga satuan

video-style-transform

Mengubah video input menjadi gaya manga Jepang atau komik Amerika.

720p

$0,071677/detik

540p

$0,028671/detik

Input video

Video output (gaya manga Jepang)

Sintesis suara (teks-ke-ucapan)

Qwen-TTS

Qwen-TTS adalah model sintesis suara dari seri Qwen yang mendukung input teks dalam bahasa Mandarin, Inggris, maupun campuran keduanya, serta mengalirkan output audio secara streaming. Penggunaan | Referensi API

Internasional (Singapura)

Model

Versi

Harga satuan

Karakter input maksimum

Bahasa yang didukung

Kuota gratis (Catatan)

qwen3-tts-flash

Kemampuannya setara dengan qwen3-tts-flash-2025-09-18

Stable

$0,1/10.000 karakter

600

Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

Jika Anda mengaktifkan Alibaba Cloud Model Studio sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter

Jika Anda mengaktifkan Alibaba Cloud Model Studio pada atau setelah pukul 00.00 pada 13 November 2025: 10.000 karakter

Masa berlaku: Dalam waktu 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

qwen3-tts-flash-2025-09-18

Snapshot

Penagihan Qwen3-TTS didasarkan pada jumlah karakter input dengan aturan sebagai berikut:

  • 1 karakter Mandarin = 2 karakter

  • 1 huruf Inggris, 1 tanda baca, atau 1 spasi = 1 karakter

Daratan Tiongkok (Beijing)

Qwen3-TTS

Model

Versi

Harga satuan

Karakter input maksimum

Bahasa yang didukung

qwen3-tts-flash

Kemampuannya setara dengan qwen3-tts-flash-2025-09-18.

Stable

$0,114682/10.000 karakter

600

Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

qwen3-tts-flash-2025-09-18

Snapshot

Penagihan Qwen3-TTS didasarkan pada jumlah karakter input dengan aturan sebagai berikut:

  • 1 karakter Mandarin = 2 karakter

  • 1 huruf Inggris, 1 tanda baca, atau 1 spasi = 1 karakter

Qwen-TTS

Model

Versi

Jendela konteks

Input maksimum

Output maksimum

Biaya input

Biaya output

(Token)

(Ribu token)

qwen-tts

Kemampuannya sama dengan qwen-tts-2025-04-10

Stable

8.192

512

7.680

$0,230

$1,434

qwen-tts-latest

Kemampuannya selalu sama dengan versi snapshot terbaru

Latest

qwen-tts-2025-05-22

Snapshot

qwen-tts-2025-04-10

Audio dikonversi ke token dengan laju 50 token per detik. Audio berdurasi kurang dari 1 detik ditagih sebagai 50 token.

Qwen-TTS-Realtime

Berdasarkan Qwen-TTS, model ini mendukung input teks streaming dan dapat menyesuaikan laju ucapan berdasarkan konten teks serta tanda baca. Model ini mendukung input teks dalam bahasa Mandarin, Inggris, maupun campuran keduanya, serta mengalirkan output audio secara streaming. Penggunaan

Internasional (Singapura)

Model

Versi

Harga satuan

Bahasa yang didukung

Kuota gratis (Catatan)

qwen3-tts-flash-realtime

Kemampuan saat ini setara dengan qwen3-tts-flash-realtime-2025-09-18

Stable

$0,13 per 10.000 karakter

Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

Jika Anda mengaktifkan Alibaba Cloud Model Studio sebelum pukul 00.00 pada 13 November 2025: 2.000 karakter

Jika Anda mengaktifkan Alibaba Cloud Model Studio pada atau setelah pukul 00.00 pada 13 November 2025: 10.000 karakter

Masa berlaku: Dalam waktu 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

qwen3-tts-flash-realtime-2025-09-18

Snapshot

Penagihan Qwen3-TTS didasarkan pada jumlah karakter input dengan aturan sebagai berikut:

  • 1 karakter Mandarin = 2 karakter

  • 1 huruf Inggris, 1 tanda baca, atau 1 spasi = 1 karakter

Daratan Tiongkok (Beijing)

Qwen3-TTS Realtime

Model

Versi

Harga satuan

Bahasa yang didukung

qwen3-tts-flash-realtime

Kemampuan saat ini setara dengan qwen3-tts-flash-realtime-2025-09-18.

Stable

$0,143353 per 10.000 karakter

Mandarin (Beijing, Shanghai, Sichuan, Nanjing, Shaanxi, Minnan, Tianjin, Kanton), Inggris, Spanyol, Rusia, Italia, Prancis, Korea, Jepang, Jerman, Portugis

qwen3-tts-flash-realtime-2025-09-18

Snapshot

Penagihan Qwen3-TTS didasarkan pada jumlah karakter input dengan aturan sebagai berikut:

  • 1 karakter Mandarin = 2 karakter

  • 1 huruf Inggris, 1 tanda baca, atau 1 spasi = 1 karakter

Qwen-TTS Realtime

Model

Versi

Jendela konteks

Input maksimum

Output maksimum

Biaya input

Biaya output

Bahasa yang didukung

(Token)

(Ribu token)

qwen-tts-realtime

Kemampuan saat ini setara dengan qwen-tts-realtime-2025-07-15.

Stable

8.192

512

7.680

$0,345

$1,721

Mandarin, Inggris

qwen-tts-realtime-latest

Kemampuan saat ini setara dengan qwen-tts-realtime-2025-07-15.

Latest

Mandarin, Inggris

qwen-tts-realtime-2025-07-15

Snapshot

Mandarin, Inggris

Aturan konversi audio ke token: 1 detik audio setara dengan 50 token. Audio berdurasi kurang dari 1 detik ditagih sebagai 50 token.

CosyVoice

CosyVoice adalah model sintesis suara generatif skala besar generasi baru dari Qwen Lab yang mengintegrasikan pemahaman teks dan pembangkitan suara berdasarkan model bahasa skala besar yang telah melalui proses pre-train. Model ini mendukung sintesis teks-ke-ucapan secara real-time dan streaming. Penggunaan | Coba online | Python SDK

Catatan

Fitur ini hanya tersedia di Wilayah China (Beijing).

Model

Harga

cosyvoice-v2

$0,286706 per 10.000 karakter

Setiap karakter Mandarin dihitung sebagai dua karakter, sedangkan setiap huruf Inggris, tanda baca, dan spasi dihitung sebagai satu karakter.

Speech recognition and translation (speech-to-text)

Qwen3-LiveTranslate-Flash-Realtime

Qwen3-LiveTranslate-Flash-Realtime adalah model terjemahan audio dan video multibahasa secara real-time yang mendukung pengenalan 18 bahasa dan penerjemahan ke dalam 10 bahasa target dalam bentuk audio secara real-time.

Fitur utama:

  • Dukungan multibahasa: Mendukung 18 bahasa, termasuk Tiongkok, Inggris, Prancis, Jerman, Rusia, Jepang, dan Korea, serta 6 dialek Tiongkok seperti Mandarin, Kanton, dan Sichuan.

  • Peningkatan visual: Meningkatkan akurasi terjemahan dengan memanfaatkan konten visual. Model ini menganalisis gerakan bibir, aksi, dan teks pada layar untuk meningkatkan kualitas terjemahan di lingkungan bising atau untuk kata-kata yang memiliki banyak makna.

  • Latensi rendah: Mencapai latensi interpretasi simultan serendah 3 detik.

  • Interpretasi simultan tanpa kehilangan kualitas: Menggunakan teknologi prediksi unit semantik untuk mengatasi masalah urutan kata lintas bahasa, sehingga kualitas terjemahan real-time hampir setara dengan terjemahan offline.

  • Suara alami: Menghasilkan ucapan menyerupai manusia dengan suara yang alami, menyesuaikan nada dan emosi berdasarkan konten audio sumber.

Usage

Catatan

Model ini hanya tersedia di wilayah Singapura.

Model

Version

Context window

Max input

Max output

Free quota

(Note)

(Tokens)

qwen3-livetranslate-flash-realtime

Kemampuannya setara dengan qwen3-livetranslate-flash-realtime-2025-09-22.

Stable

53.248

49.152

4.096

1 juta token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

qwen3-livetranslate-flash-realtime-2025-09-22

Snapshot

Setelah kuota gratis habis, input dan output akan dikenai biaya sebagai berikut:

Input

Price

Audio

$10

Image

$1,3

Output

Price

Text

$10

Audio

$38

Qwen-ASR

Dibangun di atas model dasar multi-modal Qwen, model ini mendukung fitur-fitur seperti pengenalan multibahasa, pengenalan nyanyian, dan penolakan noise.Usage

International (Singapore)

Model

Version

Supported languages

Supported sample rates

Unit price

Free quota (Note)

qwen3-asr-flash

Saat ini merupakan alias untuk qwen3-asr-flash-2025-09-08

Stable version

Tiongkok (termasuk Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, dan Spanyol

16 kHz

$0,000035/detik

36.000 detik (10 jam)

Berlaku selama 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

qwen3-asr-flash-2025-09-08

Snapshot version

Mainland China (Beijing)

Model

Version

Supported languages

Supported sample rates

Unit price

qwen3-asr-flash

Alias untuk qwen3-asr-flash-2025-09-08

Stable version

Tiongkok (Mandarin, Sichuan, Minnan, Wu, dan Kanton), Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, dan Spanyol

16 kHz

$0,000032/detik

qwen3-asr-flash-2025-09-08

Snapshot version

Qwen-ASR-Realtime

Model pengenalan suara real-time Qwen dilengkapi fitur deteksi bahasa otomatis dan mampu mendeteksi 11 bahasa serta mentranskripsi audio secara akurat di lingkungan kompleks.Usage | API reference

International (Singapore)

Model

Version

Supported languages

Supported sample rates

Unit price

Free quota (Note)

qwen3-asr-flash-realtime

Saat ini setara dengan qwen3-asr-flash-realtime-2025-10-27

Stable

Tiongkok (Mandarin, Sichuan, Minnan, Wu), Kanton, Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Türkiye, Ukraina, Vietnam

8 kHz, 16 kHz

$0,000090/detik

36.000 detik (10 jam)

Masa berlaku: Dalam 90 hari setelah Anda mengaktifkan Alibaba Cloud Model Studio

qwen3-asr-flash-realtime-2025-10-27

Snapshot

Mainland China (Beijing)

Model

Version

Supported languages

Supported sample rates

Unit price

qwen3-asr-flash-realtime

Saat ini setara dengan qwen3-asr-flash-realtime-2025-10-27.

Stable

Tiongkok (Mandarin, Sichuan, Minnan, Wu), Kanton, Inggris, Jepang, Jerman, Korea, Rusia, Prancis, Portugis, Arab, Italia, Spanyol, Hindi, Indonesia, Thailand, Türkiye, Ukraina, Vietnam

8 kHz, 16 kHz

$0,000047/detik

qwen3-asr-flash-realtime-2025-10-27

Snapshot

Paraformer

Paraformer adalah model pengenalan suara dari Tongyi Lab yang tersedia dalam dua versi: pengenalan file audio dan pengenalan suara real-time.

Audio file recognition

Usage | API reference

Catatan

Fitur ini hanya tersedia di wilayah Mainland China (Beijing).

Model

Supported languages

Supported sample rates

Scenarios

Supported audio formats

Unit price

paraformer-v2

Tiongkok (Mandarin, Kanton, Wu, Minnan, Timur Laut, Gansu, Guizhou, Henan, Hubei, Hunan, Ningxia, Shanxi, Shaanxi, Shandong, Sichuan, Tianjin, Jiangxi, Yunnan, Shanghainese), Inggris, Jepang, Korea, Jerman, Prancis, Rusia

Any

ApsaraVideo Live

aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, wmv

$0,000012/detik

paraformer-8k-v2

Tiongkok (Mandarin)

8 kHz

Phone calls

Real-time speech recognition

Usage | API reference

Catatan

Fitur ini hanya tersedia di wilayah Mainland China (Beijing).

Model

Bahasa yang didukung

Laju sampel yang didukung

Skenario

Format audio yang didukung

Harga satuan

paraformer-realtime-v2

Chinese (Mandarin, Cantonese, Wu, Minnan, Northeastern, Gansu, Guizhou, Henan, Hubei, Hunan, Ningxia, Shanxi, Shaanxi, Shandong, Sichuan, Tianjin, Jiangxi, Yunnan, Shanghainese), English, Japanese, Korean, German, French, Russian

Mendukung peralihan antar multiple bahasa.

Any

ApsaraVideo Live, konferensi, dan lainnya

pcm, wav, mp3, opus, speex, aac, amr

$0.000035/second

paraformer-realtime-8k-v2

8 kHz

Call center dan lainnya

Fun-ASR

Fun-ASR adalah model pengenalan suara dari Tongyi Bailin yang tersedia dalam dua versi: pengenalan file audio dan pengenalan suara real-time.

Audio file recognition

Usage | API reference

International (Singapore)

Model

Version

Supported languages

Supported sample rates

Scenarios

Supported audio formats

Unit price

Free quota (Note)

fun-asr

Saat ini setara dengan fun-asr-2025-11-07.

Stable

Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, Jin; serta aksen Mandarin dari wilayah seperti Zhongyuan, Southwest, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Northeast, Beijing, dan Hong Kong/Taiwan, termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia), Inggris, Jepang

Any

ApsaraVideo Live, phone calls, conference interpretation, and more

aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, wmv

$0,000035/detik

36.000 detik (10 jam)

Masa berlaku: 90 hari

fun-asr-2025-11-07

Dibandingkan dengan fun-asr-2025-08-25, versi ini dioptimalkan untuk Voice Activity Detection (VAD) jarak jauh guna meningkatkan akurasi pengenalan.

Snapshot

fun-asr-2025-08-25

Tiongkok (Mandarin), Inggris

Mainland China (Beijing)

Model

Version

Supported languages

Supported sample rates

Scenarios

Supported audio formats

Unit price

fun-asr

Saat ini setara dengan fun-asr-2025-11-07

Stable

Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, Jin; serta aksen Mandarin dari wilayah seperti Zhongyuan, Southwest, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Northeast, Beijing, dan Hong Kong/Taiwan, termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia), Inggris, Jepang

Any

ApsaraVideo Live, panggilan telepon, interpretasi konferensi, dan lainnya

aac, amr, avi, flac, flv, m4a, mkv, mov, mp3, mp4, mpeg, ogg, opus, wav, webm, wma, wmv

$0,000032/detik

fun-asr-2025-11-07

Dibandingkan dengan fun-asr-2025-08-25, versi ini dioptimalkan untuk Voice Activity Detection (VAD) jarak jauh guna meningkatkan akurasi pengenalan.

Snapshot

fun-asr-2025-08-25

Tiongkok (Mandarin), Inggris

fun-asr-mtl

Saat ini setara dengan fun-asr-mtl-2025-08-25

Stable

Tiongkok (Mandarin, Kanton), Inggris, Jepang, Thailand, Vietnam, Indonesia

fun-asr-mtl-2025-08-25

Snapshot

Real-time speech recognition

Usage | API reference

Catatan

Fitur ini hanya tersedia di wilayah Mainland China (Beijing).

Model

Version

Supported languages

Supported sample rates

Scenarios

Supported audio formats

Unit price

fun-asr-realtime

Saat ini setara dengan fun-asr-realtime-2025-11-07

Stable

Bahasa Tiongkok (Mandarin, Kanton, Wu, Minnan, Hakka, Gan, Xiang, Jin), serta aksen Mandarin dari berbagai wilayah seperti Zhongyuan, Southwest, Ji-Lu, Jianghuai, Lan-Yin, Jiao-Liao, Northeast, Beijing, dan Hong Kong/Taiwan—termasuk aksen dari Henan, Shaanxi, Hubei, Sichuan, Chongqing, Yunnan, Guizhou, Guangdong, Guangxi, Hebei, Tianjin, Shandong, Anhui, Nanjing, Jiangsu, Hangzhou, Gansu, dan Ningxia—serta bahasa Inggris dan Jepang

16 kHz

ApsaraVideo Live, konferensi, pusat panggilan, dan lainnya

pcm, wav, mp3, opus, speex, aac, amr

$0,000047/detik

fun-asr-realtime-2025-11-07

Dibandingkan dengan fun-asr-realtime-2025-09-15, versi ini dioptimalkan untuk Voice Activity Detection (VAD) jarak jauh guna meningkatkan akurasi pengenalan.

Snapshot

fun-asr-realtime-2025-09-15

Bahasa Tiongkok (Mandarin), Inggris

Penyematan teks

Model penyematan teks mengonversi teks menjadi representasi numerik untuk mendukung berbagai tugas, seperti pencarian, pengelompokan, rekomendasi, dan klasifikasi. Penagihan untuk model-model ini didasarkan pada jumlah token input. Referensi API

Internasional (Singapura)

Model

Embedding dimension

Batch size

Maximum tokens per row

Supported languages

Price

(Million input tokens)

Free Quota

Note

text-embedding-v4

Pos ini merupakan bagian dari seri Qwen3-Embedding.

2.048, 1.536, 1.024 (default), 768, 512, 256, 128, atau 64

10

8.192

Lebih dari 100 bahasa, termasuk Chinese, English, Spanish, French, Portuguese, Indonesian, Japanese, Korean, German, dan Russian, serta berbagai bahasa pemrograman

$0,07

1.000.000 token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

text-embedding-v3

1.024 (default), 768, atau 512

10

8.192

Lebih dari 50 bahasa, seperti Chinese, English, Spanish, French, Portuguese, Indonesian, Japanese, Korean, German, dan Russian

500.000 token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

Tiongkok Daratan (Beijing)

Model

Dimensi penyematan

Ukuran batch

Maksimum token per baris

Bahasa yang didukung

Harga

(Juta token input)

Kuota gratis

(Catatan)

text-embedding-v4

Pos ini merupakan bagian dari seri Qwen3-Embedding.

2.048, 1.536, 1.024 (default), 768, 512, 256, 128, atau 64

10

8.192

Tiongkok, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, Rusia, lebih dari 100 bahasa utama lainnya, serta berbagai bahasa pemrograman

$0,072

Tidak ada kuota gratis

Multimodal embedding

Model multimodal embedding mengonversi data seperti teks, citra, dan video menjadi vektor bilangan titik mengambang, memungkinkan aplikasi seperti klasifikasi video, klasifikasi citra, dan pengambilan citra-teks. Referensi API

Internasional (Singapura)

Model

Format data

Dimensi embedding

Harga satuan (per juta token input)

Kuota gratis (Lihat)

tongyi-embedding-vision-plus

float(32)

1.152

$0,09

1.000.000 token

Berlaku selama 90 hari setelah Anda mengaktifkan Model Studio.

tongyi-embedding-vision-flash

float(32)

768

Citra/Video: $0,03

Teks: $0,09

Tiongkok Daratan (Beijing)

Model

Tipe data

Dimensi embedding

Harga satuan (per 1.000 token input)

Kuota gratis (Catatan)

multimodal-embedding-v1

float(32)

1.024

Uji coba gratis

Tidak ada batas kuota token

Text rerank

Fitur ini biasanya digunakan untuk semantic retrieval. Diberikan sebuah kueri, fitur ini mengurutkan daftar dokumen kandidat dalam urutan menurun berdasarkan relevansi semantiknya. Referensi API.

Catatan

Fitur ini hanya tersedia di wilayah China (Beijing).

Model

Maximum number of documents

Max input tokens per item

Max input tokens

Supported languages

Price (Million input tokens)

gte-rerank-v2

500

4.000

30.000

Lebih dari 50 bahasa, termasuk Chinese, English, Japanese, Korean, Thai, Spanish, French, Portuguese, German, Indonesian, dan Arabic

$0,115

  • Max input tokens per item: Setiap kueri atau dokumen dibatasi hingga 4.000 token. Input yang melebihi batas ini akan dipotong.

  • Maximum number of documents: Setiap permintaan dibatasi hingga 500 dokumen.

  • Max input tokens: Jumlah total token untuk semua kueri dan dokumen dalam satu permintaan dibatasi hingga 30.000.

Domain-specific

Intent recognition

Model pengenalan maksud Qwen mampu mengurai maksud pengguna secara cepat dan akurat dalam hitungan milidetik serta memilih alat yang tepat untuk menyelesaikan masalah pengguna. Referensi API | Penggunaan

Catatan

Fitur ini hanya tersedia di Wilayah China (Beijing).

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

tongyi-intent-detect-v3

8.192

8.192

1.024

$0,058

$0,144

Role-playing

Model role-playing Qwen sangat ideal untuk skenario yang memerlukan percakapan menyerupai manusia, seperti interaksi sosial virtual, NPC game, replikasi karakter IP, perangkat keras, mainan, dan sistem dalam kendaraan. Model ini menawarkan kemampuan unggul dalam kesetiaan karakter, perkembangan percakapan, dan pendengaran empatik dibandingkan model Qwen lainnya. Penggunaan

International (Singapore)

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-plus-character-ja

8.192

7.680

512

$0,5

$1,4

Mainland China (Beijing)

Model

Context window

Max input

Max output

Input cost

Output cost

(Tokens)

(Million tokens)

qwen-plus-character

32.768

32.000

4.096

$0,115

$0,287

Model yang Telah Dipensiunkan

Dipensiunkan pada 20 Agustus 2025

Qwen2

Ini adalah model open-source Qwen2 dari Alibaba Cloud. Penggunaan | Referensi API | Coba secara online

Model

Context window

Max input

Max output

Input price

Output price

Alternative models

(tokens)

(Million tokens)

qwen2-72b-instruct

131.072

128.000

6.144

Gratis untuk waktu terbatas

Qwen3, DeepSeek, Kimi, dan lainnya

qwen2-57b-a14b-instruct

65.536

63.488

qwen2-7b-instruct

131.072

128.000

Qwen1.5

Ini adalah model open-source Qwen1.5 dari Alibaba Cloud. Penggunaan | Referensi API | Coba secara online

Model

Context window

Max input

Max output

Input price

Output price

Alternative models

Tokens

(Million tokens)

qwen1.5-110b-chat

8.000

6.000

2.000

Gratis untuk waktu terbatas

Qwen3, DeepSeek, Kimi, dan lainnya

qwen1.5-72b-chat

qwen1.5-32b-chat

qwen1.5-14b-chat

qwen1.5-7b-chat