All Products
Search
Document Center

Alibaba Cloud Model Studio:Harga pelatihan dan penerapan model

Last Updated:Mar 19, 2026

Topik ini menjelaskan aturan penagihan dan harga untuk pelatihan serta penerapan model di Alibaba Cloud Model Studio.

Penagihan pelatihan

Model generasi teks – Qwen

Catatan

Untuk alur kerja pelatihan, lihat Penyempurnaan model Qwen. Setelah pelatihan selesai, terapkan model baru sebelum mengevaluasi atau memanggilnya.

Metode

Ditagih berdasarkan token pelatihan

Rumus

Biaya pelatihan model = (Total token dalam data pelatihan + Total token dalam data pelatihan campuran) × Jumlah epoch × Harga satuan pelatihan (Unit penagihan minimum: 1 token)

Lihat perkiraan biaya pelatihan di bagian bawah konsol pelatihan model, lalu klik Computing Details untuk melihat total jumlah token pelatihan, jumlah epoch, dan harga satuan pelatihan.

Harga satuan untuk pelatihan

Tabel berikut mencantumkan harga satuan untuk pelatihan model pra-latih. Harga satuan untuk pelatihan model kustom sama dengan model pra-latih yang sesuai.

Qwen

Layanan

Kode

Harga

Qwen3-32B

qwen3-32b

$0,008/1.000 token

Qwen3-14B

qwen3-14b

$0,0016/1.000 token

Qwen-VL

Layanan

Kode

Harga

Qwen3-VL-8B-Instruct

qwen3-vl-8b-instruct

$0,002/1.000 token

Qwen3-VL-8B-Thinking

qwen3-vl-8b-thinking

$0,002/1.000 token

Model generasi video – Wan

Catatan

Untuk alur kerja pelatihan, lihat Penyempurnaan model. Setelah pelatihan selesai, terapkan model baru sebelum memanggilnya.

Metode

Ditagih berdasarkan token pelatihan

Rumus

Biaya pelatihan model = Total token pelatihan × Harga satuan pelatihan (Unit penagihan: per 1.000 token)

Rumus untuk total token pelatihan

Di mana:

  • N: Jumlah total video dalam set pelatihan.

  • max_pixels: hiperparameter yang ditentukan selama pelatihan, merepresentasikan jumlah maksimum piksel untuk video (dikonfigurasi saat membuat pekerjaan fine-tuning).

  • n_epochs: hiperparameter yang ditentukan selama pelatihan, merepresentasikan jumlah putaran (dikonfigurasi saat membuat pekerjaan fine-tuning).

  • Aturan perhitungan durasi penagihan untuk satu video: Pertama, bulatkan durasi video asli (dalam detik) ke bilangan bulat terdekat, lalu tentukan nilai akhir berdasarkan batasan model.

    • model wan2.6: Billing duration=min(10, rounded duration), artinya satu video ditagih maksimal 10 detik.

    • model wan2.5: Billing duration=min(10, rounded duration), artinya satu video ditagih maksimal 10 detik.

    • model wan2.2: Billing duration=min(5, rounded duration), artinya satu video ditagih maksimal 5 detik.

Model

Kode

Harga pelatihan (per 1K token)

Image-to-video (frame pertama)

wan2.6-i2v

$0,08

wan2.5-i2v-preview

$0,05

wan2.2-i2v-flash

$0,03

Image-to-video (frame pertama dan terakhir)

wan2.2-kf2v-flash

$0,03

Contoh penagihan

Anggap Anda melakukan fine-tuning pada model wan2.5. Set pelatihan berisi dua video: 3,4 detik dan 11,5 detik. Parameter yang digunakan adalah max_pixels = 36.864 dan n_epochs = 400. Harga satuan pelatihan adalah $0,05 per 1.000 token.

  • Perhitungan durasi:

    • Video 1: 3,4 detik dibulatkan menjadi 3. Durasi yang ditagih: min(10, 3) = 3 detik.

    • Video 2: 11,5 detik dibulatkan menjadi 11. Durasi yang ditagih: min(10, 11) = 10 detik.

    • Total durasi yang ditagih: 3 + 10 = 13 detik.

  • Total token pelatihan = 13 × (36864 / 1024) × 400 = 187.200 = 187,2 ribu token.

  • Biaya pelatihan model = 187,2 × 0,05 = $9,36.

Penagihan penerapan

Model generasi teks: Qwen

Penagihan berdasarkan durasi penggunaan (PTU)

Biaya = Durasi penggunaan × (Harga satuan TPM input per menit (TPM) × TPM input + Harga satuan TPM output per menit × TPM output)

  • Pesanan langganan langsung berlaku dan berakhir pukul 23.59 pada hari N (pesanan yang dilakukan setelah pukul 22.00 diperpanjang hingga hari N+1).

  • Setelah pesanan langganan berakhir, layanan berhenti setelah periode tenggang 2 jam. Sumber daya disimpan selama 14 jam sebelum dilepas.

  • Pesanan langganan tidak dapat dihentikan lebih awal.

  • Untuk bayar sesuai penggunaan, jika akun Anda memiliki pembayaran tertunda, sumber daya yang diterapkan tetap aktif dan terus ditagih selama 24 jam sebelum dilepas secara otomatis.

Jika input melebihi batas token maksimum atau kuota TPM yang dibeli, panggilan secara otomatis beralih ke bayar sesuai penggunaan. Performa mungkin menurun, batas laju ruang kerja berlaku, dan biaya mengikuti tarif standar bayar sesuai penggunaan.

  • Dalam kasus ini, header respons API menyertakan: x-dashscope-ptu-overflow:true.

  • Lihat statistik TPM: Pemantauan (Beijing).

Model

Tipe

Jendela konteks

(Token input + output)

Jumlah maksimum token input

Bayar sesuai penggunaan - per jam

Langganan - harian

Input (per 10k TPM)

Output (per 1k TPM)

Input (per 10k TPM)

Output (per 1k TPM)

Qwen3-Max-2025-09-23

Instruct

128.000

128.000

$1,11

$0,45

$13,32

$5,40

Qwen-Plus-2025-12-01

Instruct

$0,28

$0,07

$3,36

$0,84

Thinking

$0,28

$3,36

Qwen-Flash-2025-07-28

Instruct/Thinking

$0,06

$0,06

$0,72

$0,72

Qwen3-VL-Plus-2025-09-23

Instruct/Thinking

$0,35

$0,35

$4,20

$4,20

DeepSeek-v3.2

Instruct/Thinking

64.000

$1,04

$0,16

$12,48

$1,92

Tipe model:

  • Instruct: Model berjalan dalam mode non-thinking setelah penerapan.

  • Thinking: Model berjalan dalam mode thinking setelah penerapan.

FAQ

T: Kapan penagihan penerapan model dimulai?

J: Penagihan dimulai ketika status model berubah menjadi Running. Tidak ada biaya selama status Deploying, Overdue Payment, atau Deployment Failed.

T: Apakah saya dikenai biaya jika membatalkan pekerjaan pelatihan?

J: Ya. Jika Anda membatalkan pelatihan secara manual, Anda akan dikenai biaya untuk semua token yang telah diproses sebelum pembatalan. Pekerjaan pelatihan yang terganggu karena kesalahan sistem atau penyebab non-pengguna tidak dikenai biaya.

T: Bagaimana cara melihat statistik pemanggilan untuk model yang diterapkan?

J: Kunjungi halaman Pemantauan Model (Singapura), Pemantauan Model (Virginia), atau Pemantauan Model (Beijing).