Cara memeriksa harga pelatihan dan penerapan model - Alibaba Cloud Model Studio

Topik ini menjelaskan aturan penagihan dan harga untuk pelatihan serta penerapan model di Alibaba Cloud Model Studio.

Penagihan pelatihan

Model generasi teks – Qwen

Catatan

Untuk alur kerja pelatihan, lihat Fine-tune Qwen. Setelah pelatihan selesai, terapkan model baru sebelum mengevaluasi atau memanggilnya.

Metode

Ditagih berdasarkan token pelatihan

Rumus

Biaya pelatihan model = (Total token dalam data pelatihan + Total token dalam data pelatihan campuran) × Jumlah epoch × Harga satuan pelatihan (Unit penagihan minimum: 1 token)

Lihat estimasi biaya pelatihan di bagian bawah konsol pelatihan model, lalu klik Computing Details untuk melihat total jumlah token pelatihan, jumlah epoch, dan harga satuan pelatihan.

Harga satuan untuk pelatihan

Tabel berikut mencantumkan harga satuan untuk melatih model pra-latih. Harga satuan untuk melatih model kustom sama dengan model pra-latih yang sesuai.

Qwen

Layanan	Kode	Harga
Qwen3-32B	qwen3-32b	$0,008/1.000 token
Qwen3-14B	qwen3-14b	$0,0016/1.000 token

Qwen-VL

Layanan	Kode	Harga
Qwen3-VL-8B-Instruct	qwen3-vl-8b-instruct	$0,002/1.000 token
Qwen3-VL-8B-Thinking	qwen3-vl-8b-thinking	$0,002/1.000 token

Model generasi gambar – Wan

Catatan

Untuk alur kerja pelatihan, lihat Fine-tune model generasi gambar. Setelah pelatihan selesai, terapkan model baru sebelum memanggilnya.

Metode	Ditagih berdasarkan token pelatihan
Rumus	Biaya pelatihan model = Total token pelatihan × Harga satuan pelatihan (Unit penagihan: per 1.000 token)

Rumus untuk total token pelatihan

$T r ainin g T o k e n s T o t a l \approx ma x_s t e p s \times L_{s t e p}$

Di mana:

max_steps: Hiperparameter yang ditentukan selama pelatihan, merepresentasikan jumlah maksimum langkah pelatihan (dikonfigurasi saat membuat pekerjaan fine-tuning).
L_step: Konsumsi token per langkah. Rumusnya:

$L_{s t e p} = i \in ba t c h \sum L_{i t e m}^{(i)} \leq L_{ma x}$

L_step kira-kira sama dengan L_max. L_max ditentukan oleh max_token_length dan generation_type, seperti yang ditunjukkan di bawah ini:

generation_type	max_token_length	L_max
t2i (text-to-image)	1k	12.800
t2i (text-to-image)	2k	23.220
i2i (image-to-image)	1k	23.220
i2i (image-to-image)	2k	32.000

Catatan

Rumus di atas memberikan perkiraan. Penagihan aktual didasarkan pada bidang usage yang dikembalikan oleh sistem.

Model	Kode	Harga pelatihan (per 1K token)
Wan image generation	wan2.7-image-pro	$0,015
Wan image generation	wan2.7-image	$0,015

Contoh penagihan

Misalkan Anda melakukan fine-tuning model wan2.7-image-pro untuk t2i. Parameter: max_steps = 200, max_token_length = "1k", dan harga pelatihan adalah $0,015 per 1.000 token:

Dari tabel: L_max = 12.800 (generation_type=t2i, max_token_length=1k), L_step ≈ L_max = 12.800
Total token pelatihan ≈ 200 × 12.800 = 2.560.000 = 2.560 ribu token
Biaya pelatihan model ≈ 2.560 × 0,015 = $38,4

Model generasi video – Wan

Catatan

Untuk alur kerja pelatihan, lihat Fine-tuning model generasi video. Setelah pelatihan selesai, terapkan model baru sebelum memanggilnya.

Metode	Ditagih berdasarkan token pelatihan
Rumus	Biaya pelatihan model = Total token pelatihan × Harga satuan pelatihan (Unit penagihan: per 1.000 token)

Rumus untuk total token pelatihan

$T r ainin g T o k e n s T o t a l = (i = 1 \sum N billing duration of video_{i}) \times \frac{ma x _ p i x e l s}{1024} \times n_e p oc h s$

Di mana:

N: Jumlah total video dalam set pelatihan.
max_pixels: Hiperparameter yang ditentukan selama pelatihan, merepresentasikan jumlah maksimum piksel untuk video (dikonfigurasi saat membuat pekerjaan fine-tuning).
n_epochs: Hiperparameter yang ditentukan selama pelatihan, merepresentasikan jumlah putaran (dikonfigurasi saat membuat pekerjaan fine-tuning).
- Konversi antara n_epochs dan steps adalah: steps = n_epochs × ⌈dataset_size / batch_size⌉, yaitu, n_epochs = steps / ⌈dataset_size / batch_size⌉.
- Jika set data hanya berisi 1 sampel dan batch_size = 1, maka n_epochs = steps. Kami merekomendasikan total minimal 800 langkah.
Aturan perhitungan durasi penagihan untuk satu video: Pertama, bulatkan durasi video asli (dalam detik) ke bilangan bulat terdekat, lalu tentukan nilai akhir berdasarkan batasan model.
- model wan2.7: Durasi penagihan=min(10, durasi yang dibulatkan), artinya satu video ditagih maksimal 10 detik.
- model wan2.6: Durasi penagihan=min(10, durasi yang dibulatkan), artinya satu video ditagih maksimal 10 detik.
- model wan2.5: Durasi penagihan=min(10, durasi yang dibulatkan), artinya satu video ditagih maksimal 10 detik.
- model wan2.2: Durasi penagihan=min(5, durasi yang dibulatkan), artinya satu video ditagih maksimal 5 detik.

Model	Kode	Harga pelatihan (per 1K token)
Image-to-video (frame pertama)	wan2.7-i2v	$0,3
	wan2.6-i2v	$0,08
	wan2.5-i2v-preview	$0,05
	wan2.2-i2v-flash	$0,03
Image-to-video (frame pertama dan terakhir)	wan2.2-kf2v-flash	$0,03

Contoh penagihan

Estimasi biaya wan2.7-i2v (data tunggal)

Asumsikan set pelatihan berisi 1 video dengan durasi 10 detik. Dengan batch_size = 1 (direkomendasikan), n_epochs = steps / ⌈1(dataset_size) / 1(batch_size)⌉ = steps.

Harga satuan pelatihan = $0,3/ribu token. Ambil max_pixels = 36864 dan n_epochs = 800 sebagai contoh:

Total token pelatihan = 10 × (36864 / 1024) × 800 = 288.000 = 288 ribu token
Biaya pelatihan model = 288 × $0,3 = $86,4

max_pixels	Langkah umum	n_epochs	Token estimasi	Biaya estimasi (USD)
36864	800	800	288.000	$86,4
	1.000	1.000	360.000	$108
	2.000	2.000	720.000	$216
65536	800	800	512.000	$153,6
	1.000	1.000	640.000	$192
	2.000	2.000	1.280.000	$384
102400	800	800	800.000	$240
	1.000	1.000	1.000.000	$300
	2.000	2.000	2.000.000	$600

Estimasi biaya wan2.7-i2v (data ganda)

Asumsikan set pelatihan berisi 2 video dengan durasi 3,4 detik dan 11,5 detik. Parameter: max_pixels = 36864, n_epochs = 800. Harga satuan pelatihan = $0,3/ribu token:

Perhitungan durasi:
- Video 1: 3,4 detik dibulatkan menjadi 3. Durasi tagihan = min(10, 3) = 3.
- Video 2: 11,5 detik dibulatkan menjadi 11. Durasi tagihan = min(10, 11) = 10.
- Total durasi tagihan = 3 + 10 = 13 detik.
Total token pelatihan = 13 × (36864/1024) × 800 = 374.400 = 374,4 ribu token.
Biaya pelatihan model = 374,4 × 0,3 = $112,32.

Estimasi biaya wan2.5-i2v-preview (data ganda)

Misalkan Anda melakukan fine-tuning model wan2.5. Set pelatihan berisi dua video: 3,4 detik dan 11,5 detik. Parameter: max_pixels = 36864 dan n_epochs = 400. Harga satuan pelatihan adalah $0,05 per 1.000 token.

Perhitungan durasi:
- Video 1: 3,4 detik dibulatkan menjadi 3. Durasi tagihan: min(10, 3) = 3 detik.
- Video 2: 11,5 detik dibulatkan menjadi 11. Durasi tagihan: min(10, 11) = 10 detik.
- Total durasi tagihan: 3 + 10 = 13 detik.
Total token pelatihan = 13 × (36864 / 1024) × 400 = 187.200 = 187,2 ribu token.
Biaya pelatihan model = 187,2 × 0,05 = $9,36.

Penagihan Penyebaran

Model generasi teks: Qwen

Penagihan berbasis waktu (Provisioned Throughput)

Biaya = Durasi Penggunaan × (Harga Satuan TPM Input × TPM Input + Harga Satuan TPM Output × TPM Output)

Untuk metode bayar sesuai penggunaan, penggunaan ditagih per jam, dan harga satuan didasarkan pada tarif per jam dalam tabel di bawah. Untuk metode langganan, penggunaan ditagih per hari, dan harga satuan didasarkan pada tarif harian dalam tabel di bawah.

Pesanan langganan berlaku segera setelah pembayaran. Langganan N hari berlaku hingga pukul 23.59 pada hari ke-N. Jika pesanan dilakukan setelah pukul 22.00, tanggal kedaluwarsa diperpanjang satu hari secara otomatis.
Setelah pesanan langganan kedaluwarsa, layanan dihentikan setelah periode tenggang 2 jam. Setelah layanan dihentikan, sumber daya dipertahankan selama 14 jam lalu dilepas.
Pesanan langganan tidak dapat dihentikan lebih awal.
Untuk metode bayar sesuai penggunaan, jika akun Anda memiliki pembayaran tertunda, sumber daya yang diterapkan dipertahankan dan terus ditagih selama 24 jam, di mana layanan tetap tersedia. Setelah 24 jam, sistem menghentikan penagihan, dan penerapan model memasuki status tertunda. Sumber daya dasar dihapus, tetapi tugas penerapan model dipertahankan. Setelah Anda melunasi jumlah tertunda, sistem mengalokasikan ulang sumber daya, memulihkan layanan, dan melanjutkan penagihan. Untuk menghentikan biaya, Anda harus menghapus tugas penerapan model. Penagihan berhenti setelah tugas berhasil dihapus.

Jika input model melebihi token input maksimum atau TPM yang dibeli, panggilan secara otomatis beralih ke mode bayar sesuai penggunaan untuk model saat ini. Dalam kasus ini, kinerja inferensi mungkin menurun dan akan tunduk pada pengendalian trafik publik model snapshot saat ini di ruang kerja. Biaya dikenakan berdasarkan standar pemanggilan model (bayar sesuai penggunaan).

Dalam kasus ini, panggilan API mengembalikan header yang berisi x-dashscope-ptu-overflow:true.
Untuk melihat statistik TPM, buka Pemantauan Model.

Untuk aturan pengembalian dana spesifik untuk skenario skala-masuk (menurunkan spesifikasi), lihat Aturan pengembalian dana untuk menurunkan spesifikasi.

Singapura

Qwen

Nama model	Kode model	Maks token input	Input Pay-As-You-Go Per 10k TPM/jam	Bayar sesuai penggunaan output Per 1k TPM/jam	Input Langganan Per 10k TPM/hari	Langganan output Per 1k TPM/hari
Qwen3.7-Max-2026-05-20	qwen3.7-max-2026-05-20	256K	$6	$1,8	$72	$21,6
Qwen3.7-Plus-2026-05-26	qwen3.7-plus-2026-05-26	256K	$0,96	$0,384	$11,52	$4,608

Qwen3.6-Plus-2026-04-02	qwen3.6-plus-2026-04-02	128K	$1,2	$0,72	$14,4	$8,64

Qwen3.5-Plus-2026-04-20	qwen3.5-plus-2026-04-20	128K	$0,96	$0,576	$11,52	$6,912

DeepSeek

Nama model	Kode model	Maksimum token input	Bayar sesuai penggunaan input Per 10k TPM/jam	Bayar sesuai penggunaan output Per 1k TPM/jam	Langganan input Per 10k TPM/hari	Output Langganan Per 1k TPM/hari
DeepSeek-v4-Flash	deepseek-v4-flash	256K	$0,72	$0,144	$8,64	$1,728
DeepSeek-v4-Pro	deepseek-v4-pro	256K	$8,64	$1,728	$103,68	$20,736
DeepSeek-v3.2	deepseek-v3.2	64K	$2,05	$0,616	$24,62	$7,387

Qwen-VL

Nama model

Kode model

Maksimum token input

Bayar sesuai penggunaan input

Per 10k TPM/jam

Output Pay-as-you-go

Per 1k TPM/jam

Langganan input

Per 10k TPM/hari

Keluaran Subskripsi

Per 1k TPM/hari

Qwen3-VL-Plus-2025-09-23

qwen3-vl-plus-2025-09-23

128K

$0,48

$0,384

$5,76

$4,608

Model lainnya

Nama model

Kode model

Maksimum token input

Bayar sesuai penggunaan input

Per 10k TPM/jam

Pay-as-you-go Output

Per 1k TPM/jam

Input Langganan

Per 10k TPM/hari

Keluaran Langganan

Per 1k TPM/hari

GLM-5.1

glm-5.1

64K

$5,04

$1,584

$64,8

$19,008

China (Beijing)

Qwen

Nama model	Kode model	Maksimum token input	Bayar sesuai penggunaan input Per 10k TPM/jam	Bayar sesuai penggunaan output Per 1k TPM/jam	Input Langganan Per 10k TPM/hari	Keluaran Langganan Per 1k TPM/hari
Qwen3.7-Max-2026-05-20	qwen3.7-max-2026-05-20	256K	$3,96	$1,188	$47,53	$14,258
Qwen3.7-Plus-2026-05-26	qwen3.7-plus-2026-05-26	256K	$0,66	$0,264	$7,92	$3,168

Qwen3.6-Plus-2026-04-02	qwen3.6-plus-2026-04-02	128K	$0,67	$0,397	$7,93	$4,753

Qwen3.5-Plus-2026-04-20	qwen3.5-plus-2026-04-20	128K	$0,26	$0,16	$3,17	$1,9

Qwen3-Max-2025-09-23	qwen3-max-2025-09-23	128K	$1,11	$0,45	$13,32	$5,4

Qwen-Flash-2025-07-28	qwen-flash-2025-07-28	128K	$0,06	$0,06	$0,72	$0,72
Qwen-Plus-2025-12-01	qwen-plus-2025-12-01	128K	$0,28	Mode non-thinking: $0,07 Mode thinking: $0,28	$3,36	Mode non-thinking: $0,84 Mode thinking: $3,36

DeepSeek

Nama model	Kode model	Token input maksimum	Pay-As-You-Go Input Per 10k TPM/jam	Bayar sesuai penggunaan output Per 1k TPM/jam	Masukan Langganan Per 10k TPM/hari	Keluaran Subskripsi Per 1k TPM/hari
DeepSeek-v4-Flash	deepseek-v4-flash	256K	$0,5	$0,099	$5,94	$1,188
DeepSeek-v4-Pro	deepseek-v4-pro	256K	$5,94	$1,188	$71,3	$14,26
DeepSeek-v3.2	deepseek-v3.2	64K	$1,04	$0,16	$12,48	$1,92
DeepSeek-v3	deepseek-v3	64K	$0,99	$0,396	$11,9	$4,75

Qwen-VL

Nama model

Kode model

Token input maks

Bayar sesuai penggunaan input

Per 10k TPM/jam

Pay-As-You-Go Output

Per 1k TPM/jam

Input Langganan

Per 10k TPM/hari

Output Subskripsi

Per 1k TPM/hari

Qwen3-VL-Plus-2025-09-23

qwen3-vl-plus-2025-09-23

128K

$0,35

$4,2

Model lainnya

Nama model

Kode model

Maksimum token masukan

Bayar sesuai penggunaan input

Per 10k TPM/jam

Output Pay-As-You-Go

Per 1k TPM/jam

Input Langganan

Per 10k TPM/hari

Keluaran Subskripsi

Per 1k TPM/hari

GLM-5.1

glm-5.1

64K

$2,97

$1,19

$35,65

$14,26

Penagihan berbasis waktu (Model Unit)

Biaya = Durasi Penggunaan (jam) × Jumlah Model Unit × Harga Model Unit

Untuk metode bayar sesuai penggunaan, "Harga Model Unit" adalah "Harga per Jam" dari tabel di bawah. Untuk metode langganan bulanan, rumusnya: Jumlah Bulan × Jumlah Model Unit × Harga Bulanan.

Untuk langganan, jika Anda berhenti berlangganan dalam bulan pertama, harga satuan harian (≈ harga satuan bulanan / 30) dikenakan dengan tarif 1,2 kali lipat dari tarif standar. Penggunaan kurang dari satu hari ditagih sebagai satu hari penuh.

Catatan

Untuk metode bayar sesuai penggunaan Model Unit, sumber daya daya komputasi dialokasikan berdasarkan prinsip siapa cepat dia dapat. Pengembalian dana penuh diberikan jika pembelian tidak berhasil.

Singapura

Generasi teks

Nama model	Kode model	Spesifikasi unit model	Harga per jam ($) Unit penagihan minimum: menit	Harga bulanan ($) Unit penagihan minimum: hari
Qwen3.6-Plus-2026-04-02	qwen3.6-plus-2026-04-02	MU1 x 8	$88	$41.832

Qwen3.5-39B-A17B	qwen3.5-397b-a17b	MU2 x 8	$112	$52.392
Qwen3.5-35B-A3B	qwen3.5-35b-a3b	MU2 x 8	$112	$52.392

Qwen3-32B	qwen3-32b	MU1 x 4	$44	$20.916
Qwen3-32B	qwen3-32b	MU2 x 8	$112	$52.392
Qwen3-14B	qwen3-14b	MU1 x 4	$44	$20.916

GLM-5.1	glm-5.1	MU2 x 8	$112	$52.392

DeepSeek-V4-Flash	deepseek-v4-flash	MU1 x 8	$88	$41.832

Multimodal

Nama model

Kode model

Spesifikasi unit model

Harga per jam ($)

Unit penagihan minimum: menit

Harga bulanan ($)

Unit penagihan minimum: hari

Qwen3-VL-32B-Instruct

qwen3-vl-32b-instruct

MU2 x 8

$112

$52.392

Qwen3-VL-8B-Instruct

qwen3-vl-8b-instruct

MU1 x 2

$22

$10.458

Jenis model:

Instruct - Model yang diterapkan melakukan inferensi dalam mode non-thinking.

China (Beijing)

Generasi teks

Qwen

Nama model	Kode model	Spesifikasi unit model	Harga per jam ($) Unit penagihan minimum: menit	Harga bulanan ($) Unit penagihan minimum: hari
Qwen3.7-Plus-2026-05-26	qwen3.7-plus-2026-05-26	MU3 x 8	$150,72	$72.577,152

Qwen3.6-35B-A3B	qwen3.6-35b-a3b	MU8 x 1	$6,464	$3.080,477
Qwen3.6-35B-A3B	qwen3.6-35b-a3b	MU9 x 1	$7,014	$3.383,024
Qwen3.6-27B	qwen3.6-27b	MU9 x 1	$7,014	$3.383,024
Qwen3.6-Flash-2026-04-16	qwen3.6-flash-2026-04-16	MU1 x 2	$14.852	$7.183,564
Qwen3.6-Plus-2026-04-02	qwen3.6-plus-2026-04-02	MU1 x 8	$59,408	$28.734,256

Qwen3.5-397B-A17B	qwen3.5-397b-a17b	MU2 x 8	$69.312	$33.044,72
		MU3 x 8	$150,72	$72.577,152
		MU6 x 16	$55.008	$26.599,92
Qwen3.5-122B-A10B	qwen3.5-122b-a10b	MU1 x 4	$29,704	$14.367,128
		MU2 x 8	$69,312	$33.044,72
		MU6 x 16	$55,008	$26.599,92
		MU9 x 2	$14,028	$6.766,048
Qwen3.5-35B-A3B	qwen3.5-35b-a3b	MU1 x 2	$14,852	$7.183,564
		MU2 x 8	$69.312	$33.044,72
		MU8 x 1	$6.464	$3.080,477
		MU9 x 1	$7,014	$3.383,024
Qwen3.5-27B	qwen3.5-27b	MU9 x 1	$7.014	$3.383,024
Qwen3.5-9B	qwen3.5-9b	MU8 x 1	$6,464	$3.080,477
Qwen3.5-9B	qwen3.5-9b	MU9 x 1	$7,014	$3.383,024
Qwen3.5-Flash-2026-02-23	qwen3.5-flash-2026-02-23	MU1 x 2	$14,852	$7.183,564
Qwen3.5-Plus-2026-02-15	qwen3.5-plus-2026-02-15	MU1 x 8	$59.408	$28.734,256
Qwen3.5-Plus-2026-02-15	qwen3.5-plus-2026-02-15	MU3 x 8	$150,72	$72.577,152

Qwen3-235B-A22B-Instruct	qwen3-235b-a22b-instruct-2507	MU1 x 4	$29,704	$14.367,128
Qwen3-235B-A22B-Instruct	qwen3-235b-a22b-instruct-2507	MU2 x 8	$69,312	$33.044,72
Qwen3-Next-80B-A3B-Instruct	qwen3-next-80b-a3b-instruct	MU1 x 2	$14,852	$7.183,564
Qwen3-32B	qwen3-32b	MU1 x 4	$29,704	$14.367,128
Qwen3-32B	qwen3-32b	MU6 x 4	$13,752	$6.649,98
Qwen3-30B-A3B	qwen3-30b-a3b	MU9 x 2	$14,028	$6.766,048
Qwen3-30B-A3B-Instruct-2507	qwen3-30b-a3b-instruct-2507	MU1 x 4	$29,704	$14.367,128
Qwen3-30B-A3B-Instruct-2507	qwen3-30b-a3b-instruct-2507	MU2 x 8	$69,312	$33.044,72
Qwen3-8B	qwen3-8b	MU1 x 2	$14,852	$7.183,564
		MU2 x 2	$17.328	$8.261,18
		MU5 x 1	$2,888	$1.394,329
Qwen3-4B	qwen3-4b	MU1 x 2	$14.852	$7.183,564
Qwen3-4B	qwen3-4b	MU5 x 1	$2,888	$1.394,329
Qwen3-1.7B	qwen3-1.7b	MU1 x 2	$14.852	$7.183,564
Qwen3-1.7B	qwen3-1.7b	MU5 x 1	$2.888	$1.394,329
Qwen3-Max-2025-09-23	qwen3-max-2025-09-23	MU2 x 8	$69.312	$33.044,72
Qwen3-Max-2025-09-23	qwen3-max-2025-09-23	MU3 x 8	$150,72	$72.577,152

Qwen2.5-72B	qwen2.5-72b-instruct	MU1 x 4	$29,704	$14.367,128
Qwen2.5-32B	qwen2.5-32b-instruct	MU1 x 4	$29,704	$14.367,128
Qwen2.5-14B	qwen2.5-14b-instruct	MU1 x 2	$14.852	$7.183,564
Qwen2.5-7B	qwen2.5-7b-instruct	MU1 x 2	$14,852	$7.183,564
Qwen2.5-7B	qwen2.5-7b-instruct	MU5 x 1	$2,888	$1.394,329
Qwen2.5-3B-Instruct	qwen2.5-3b-instruct	MU5 x 1	$2,888	$1.394,329

Qwen-Flash-2025-07-28	qwen-flash-2025-07-28	MU1 x 4	$29,704	$14.367,128
Qwen-Plus-2025-07-28	qwen-plus-2025-07-28	MU1 x 4	$29,704	$14.367,128
Qwen-Plus-2025-12-01	qwen-plus-2025-12-01	MU1 x 4	$29.704	$14.367,128

GLM

Nama model	Kode model	Spesifikasi unit model	Harga per jam ($) Unit penagihan minimum: menit	Harga bulanan ($) Unit penagihan minimum: hari
GLM-5.1	glm-5.1	MU2 x 8	$69,312	$33.044,72
		MU3 x 8	$150,72	$72.577,152
		MU6 x 16	$55,008	$26.599,92
GLM-5	glm-5	MU3 x 8	$150,72	$72.577,152
GLM-4.7	glm-4.7	MU6 x 16	$55,008	$26.599,92

DeepSeek

Nama model

Kode model

Spesifikasi unit model

Harga per jam ($)

Unit penagihan minimum: menit

Harga bulanan ($)

Unit penagihan minimum: hari

DeepSeek-V4-Flash

deepseek-v4-flash

MU1 x 8

$59.408

$28.734,256

DeepSeek-V3.2

deepseek-v3.2

MU2 x 8

$69.312

$33.044,72

Model lainnya

Nama model	Kode model	Spesifikasi unit model	Harga per jam ($) Unit penagihan minimum: menit	Harga bulanan ($) Unit penagihan minimum: hari
MiniMax-M2.5	MiniMax-M2.5	MU1 x 8	$59,408	$28.734,256

Kimi-K2.5	kimi-k2.5	MU2 x 8	$69.312	$33.044,72

Multimodal

Qwen-VL

Nama model	Kode model	Spesifikasi unit model	Harga per jam ($) Unit penagihan minimum: menit	Harga bulanan ($) Unit penagihan minimum: hari
Qwen3-VL-235B-A22B-Instruct	qwen3-vl-235b-a22b-instruct	MU1 x 4	$29,704	$14.367,128
Qwen3-VL-235B-A22B-Thinking	qwen3-vl-235b-a22b-thinking	MU1 x 4	$29,704	$14.367,128
Qwen3-VL-32B-Instruct	qwen3-vl-32b-instruct	MU2 x 8	$69,312	$33.044,72
Qwen3-VL-8B-Instruct	qwen3-vl-8b-instruct	MU1 x 2	$14,852	$7.183,564
Qwen3-VL-Flash-2025-10-15	qwen3-vl-flash-2025-10-15	MU1 x 4	$29,704	$14.367,128
Qwen3-VL-Plus-2025-09-23	qwen3-vl-plus-2025-09-23	MU1 x 4	$29.704	$14.367,128

Qwen-VL-Max-2025-08-13	qwen-vl-max-2025-08-13	MU6 x 4	$13,752	$6.649,98
Qwen-VL-OCR-2025-11-20	qwen-vl-ocr-2025-11-20	MU6 x 4	$13,752	$6.649,98

Qwen Omni

Nama model	Kode model	Spesifikasi unit model	Harga per jam ($) Unit penagihan minimum: menit	Harga bulanan ($) Unit penagihan minimum: hari
Qwen3.5-Omni-Flash	qwen3.5-omni-flash	MU8 x 1	$6.464	$3.080,477
Qwen3.5-Omni-Flash	qwen3.5-omni-flash	MU9 x 1	$7,014	$3.383,024
Qwen3.5-Omni-Plus	qwen3.5-omni-plus	MU9 x 8	$56,112	$27.064,192

Jenis model:

Instruct - Model yang diterapkan melakukan inferensi dalam mode non-thinking.
Thinking - Model yang diterapkan melakukan inferensi dalam mode thinking.

Berdasarkan penggunaan token model

Biaya = Jumlah Token Input × Harga Satuan Input + Jumlah Token Output × Harga Satuan Output (Unit penagihan minimum: 1 token)

Penagihan berdasarkan penggunaan token model hanya didukung setelah Anda menyelesaikan Supervised Fine-Tuning (SFT) untuk model dasar berikut dan Anda telah mendapatkan model kustom.

Singapura

Model dasar

Kode model

Input

$/1k token

Output

$/1k token

Qwen3-14B

qwen3-14b

$0,00035

Mode non-thinking: $0,0014

Mode thinking: $0,0042

Model generasi gambar – Wan

Penerapan gratis. Pemanggilan ditagih dengan tarif standar model dasar fine-tuned. Untuk alur kerja pelatihan, lihat Fine-tune model generasi gambar.

ID Model	Harga Penerapan & Pemanggilan LoRA
wan2.7-image-pro	$0,075/gambar
wan2.7-image	$0,03/gambar

FAQ

T: Kapan penagihan untuk penerapan model dimulai?

J: Penagihan dimulai ketika status model berubah menjadi Running. Tidak ada biaya yang dikenakan selama status Deploying, Overdue Payment, atau Deployment Failed.

T: Apakah saya dikenai biaya jika membatalkan pekerjaan pelatihan?

J: Ya. Jika Anda membatalkan pelatihan secara manual, Anda dikenai biaya untuk semua token yang diproses sebelum pembatalan. Pekerjaan pelatihan yang terganggu oleh kesalahan sistem atau penyebab non-pengguna tidak dikenai biaya.

T: Bagaimana cara melihat statistik pemanggilan untuk model yang diterapkan?

J: Kunjungi halaman Pemantauan Model (Singapura), Pemantauan Model (Virginia), atau Pemantauan Model (Beijing).