Saat Anda mengaktifkan Alibaba Cloud Model Studio (Wilayah Singapura) untuk pertama kalinya, Anda secara otomatis menerima kuota gratis untuk setiap model.
Kuota gratis hanya tersedia untuk model di wilayah Singapore. Wilayah lain tidak memiliki kuota gratis.
Aturan
Periode validitas
Kuota gratis untuk pengguna baru biasanya berlaku selama 30 hingga 90 hari, terhitung sejak tanggal Anda mengaktifkan Alibaba Cloud Model Studio atau permintaan model Anda disetujui. Penggunaan layanan inferensi model setelah periode validitas berakhir atau kuota gratis habis akan dikenai biaya.
Mulai dari 03:00 UTC pada 8 September 2025, kuota gratis untuk pengguna baru yang mengaktifkan Alibaba Cloud Model Studio untuk pertama kalinya akan berlaku selama 90 hari. Pengguna yang telah mengaktifkan layanan sebelum tanggal tersebut tidak terpengaruh. Untuk informasi lebih lanjut, lihat Perubahan periode validitas kuota gratis pengguna baru.
Lingkup
Kuota gratis untuk pengguna baru hanya mencakup biaya untuk inferensi model real-time (panggilan). Kuota ini tidak mencakup biaya untuk Batch calls, context cache.
Catatan
Akun Alibaba Cloud dan Pengguna RAM-nya berbagi kuota gratis yang sama.
Sebagai contoh, total kuota gratis untuk qwen-max adalah 1.000.000 token. Jika akun Alibaba Cloud menggunakan 100.000 token dan Pengguna RAM menggunakan 200.000 token, sisa kuota gratis untuk qwen-max adalah 700.000 token.
Mendapatkan kuota gratis
Buka Alibaba Cloud Model Studio - Wilayah Singapura. Setelah Anda membaca dan menyetujui Ketentuan Layanan, Alibaba Cloud Model Studio akan diaktifkan secara otomatis dan Anda menerima kuota inferensi gratis. Kuota gratis hanya tersedia untuk wilayah Singapura. Wilayah lain tidak memiliki kuota gratis.
Jika Ketentuan Layanan tidak muncul, hal ini menunjukkan bahwa Anda telah mengaktifkan Alibaba Cloud Model Studio dan menerima kuota gratis.
Lihat sisa kuota
Setelah Anda mengaktifkan Alibaba Cloud Model Studio, buka halaman Model List (Singapura) di Konsol. Klik model target untuk melihat sisa kuota pada halaman detail model.
Seperti yang ditunjukkan pada gambar berikut, 24.098/1.000.000 menunjukkan bahwa masih tersisa 24.098 token dari total 1.000.000 token.

Gunakan kuota
Panggilan real-time ke Large Language Models (LLMs) di (Wilayah Singapura) secara otomatis menggunakan kuota gratis Anda. Untuk informasi lebih lanjut, lihat Memulai Alibaba Cloud Model Studio.
Penangguhan saat kuota gratis habis
Secara default, Anda akan dikenai biaya atas penggunaan setelah kuota gratis Anda habis. Jika Anda mengaktifkan fitur kuota gratis saja, Anda tidak dapat melakukan panggilan setelah kuota habis. Error `AllocationQuota.FreeTierOnly` akan dikembalikan. Fitur ini mencegah Anda dikenai biaya tambahan.
Cara mengaktifkan
Sebagai contoh, pada halaman detail Qwen3-Coder-Plus (Wilayah Singapura), aktifkan sakelar Free quota only.

Jika sakelar tidak ditampilkan untuk model tersebut, kuota gratis model tersebut telah habis atau kedaluwarsa, atau model tersebut tidak menyediakan kuota gratis.
Cara menonaktifkan
Fitur ini dinonaktifkan secara default. Jika Anda telah mengaktifkan fitur Free quota only, Anda hanya dapat menonaktifkannya setelah Konsol menunjukkan bahwa kuota gratis telah habis.
Kuota gratis yang ditampilkan di Konsol diperbarui setiap jam dan bukan data real-time.
FAQ
Apakah ada notifikasi saat kuota gratis habis?
Notifikasi saat ini tidak didukung.
Apa yang terjadi ketika kuota gratis habis?
Jika Anda tidak mengaktifkan fitur Free quota only, panggilan model yang sedang berlangsung tidak akan terganggu dan akan diselesaikan meskipun kuota gratis telah habis. Token yang melebihi kuota gratis akan ditagih berdasarkan biaya input/output yang ditentukan dalam Model List. Biaya yang timbul akan secara otomatis dipotong dari saldo akun Alibaba Cloud Anda berdasarkan skema bayar sesuai penggunaan. Hal ini dapat menyebabkan pembayaran tertunda pada akun Anda.
Jika akun Anda memiliki pembayaran tertunda, Anda tidak dapat memanggil model lain, bahkan jika model tersebut masih memiliki kuota gratis.
Sebelum memanggil model, periksa kuota gratis model tersebut dan gunakan budget management.
Mengapa saya dikenai biaya?
Kemungkinan penyebabnya sebagai berikut:
Anda menggunakan model yang tidak memiliki kuota gratis. Misalnya, kuota gratis untuk model qwen-max dan qwen-max-latest tidak dibagi bersama.
Kuota gratis tidak mencakup biaya untuk panggilan OpenAI compatible-Batch.
Data kuota gratis di Konsol diperbarui setiap jam. Oleh karena itu, Konsol mungkin masih menunjukkan sisa kuota gratis meskipun kuota tersebut telah habis, sehingga mengakibatkan biaya. Anda dapat memeriksa status kuota gratis terbaru lagi nanti.
Untuk mengonfirmasi rincian penagihan Anda, lihat Bagaimana cara memeriksa model mana yang dikenai biaya? dan Bagaimana cara melihat catatan panggilan model?.
Bagaimana cara memeriksa model mana yang dikenai biaya?
Sekitar satu jam setelah panggilan model, buka halaman Bill Details. Pilih Billing Cycle. Kemudian, atur Product Detail menjadi Model Studio LLM Inference dan klik Search. Di kolom Instance ID, Anda dapat melihat model yang dikenai biaya.

Bagaimana cara melihat catatan panggilan model?
Satu jam setelah Anda memanggil model, buka halaman Model Observation (Singapore atau Beijing). Atur kondisi kueri, seperti rentang waktu dan ruang kerja. Kemudian, di area Models, temukan model target lalu klik Monitor di kolom Actions untuk melihat statistik panggilan model. Untuk informasi selengkapnya, lihat dokumen Model Observation.
Data diperbarui setiap jam. Selama periode puncak, mungkin terjadi latensi hingga satu jam.

Bagaimana cara menghindari biaya?
Setelah kuota gratis habis, biaya akan secara otomatis dipotong dari saldo akun Alibaba Cloud Anda. Anda dapat mencegah biaya tak terduga dengan cara berikut:
Buka halaman API-Key (Singapura) atau API-Key (Beijing) Alibaba Cloud Model Studio dan hapus semua Kunci API. Setelah Anda menghapus Kunci API, Anda tidak dapat lagi memanggil model di Model Studio melalui API, sehingga mencegah biaya tambahan.

Atur peringatan batas pengeluaran. Anda akan menerima email notifikasi jika pengeluaran Anda pada bulan berjalan melebihi ambang batas peringatan.

Saya masih memiliki sisa kuota. Mengapa panggilan gagal?
Periksa apakah Akun Alibaba Cloud Anda memiliki pembayaran tertunda. Jika akun Anda memiliki pembayaran tertunda, Anda tidak dapat memanggil model, meskipun model tersebut masih memiliki kuota gratis.
Mengapa saya tidak dapat melihat kuota gratis dan periode validitasnya?
Jika kolom Free Quota menampilkan No Free Quota, atau jika area Free Quota tidak ditampilkan, hal ini menunjukkan bahwa kuota gratis untuk model di akun Anda telah kedaluwarsa.
Wilayah Beijing tidak memiliki kuota gratis.
