Topik ini menjelaskan cara menanyakan detail penagihan, menganalisis tagihan, dan menghentikan penagihan.
Query Billing Details
Coding Plan tidak menghasilkan tagihan pay-as-you-go. Anda dapat melihat penggunaan paket Anda di halaman atau halaman Coding Plan.
Billing Cycle
Sistem hanya menghasilkan tagihan setelah terjadi panggilan API aktual.
Inferensi large language model (LLM): Tagihan dihasilkan per menit.
Layanan lain (inferensi batch, pelatihan model, basis pengetahuan, dll.): Tagihan dihasilkan per jam.
Pembuatan tagihan mungkin mengalami keterlambatan. Misalnya, tagihan inferensi LLM biasanya muncul 2–10 menit setelah panggilan. Selama periode trafik puncak, gunakan waktu pembuatan tagihan akhir sistem sebagai acuan.
1. Query Inference Costs for a Specific Model
Untuk memeriksa biaya inferensi model tertentu seperti qwen-plus, ikuti langkah-langkah berikut:
Di halaman Detailed Bill, pilih Siklus Penagihan.
Pilih Product Detail sebagai ModelStudio LLM Inference, lalu klik Search.
Di kolom Instance ID, temukan semua instans yang terkait dengan qwen-plus.
Jumlahkan nilai Payable Amount untuk instans-instans tersebut. Jumlah ini merupakan total biaya inferensi untuk model tersebut pada bulan yang dipilih.

2. Query the total cost of Alibaba Cloud Model Studio service
Untuk melihat tren pengeluaran keseluruhan Model Studio atau jenis layanan tertentu, gunakan fitur analisis biaya.
3. Query Token Usage in Detailed Bills
Di halaman Billing Details, buka tab Detailed Bill. Atur statistik Billing Item, lalu ekspor tagihan. Penggunaan token muncul dalam file yang diekspor.

Analyze Billing Details
Mulai 7 September 2024, Alibaba Cloud Model Studio mendukung verifikasi lebih granular untuk tagihan inferensi, penerapan, dan pelatihan LLM. Anda dapat melihat biaya berdasarkan API Key ID, workspace ID, nama model, jenis input/output, dan saluran pemanggilan.
1. Download the Bill
Di halaman Detailed Bill, pilih billing cycle.
Pilih Product sebagai Alibaba Cloud Model Studio, lalu klik Search.
Di pojok kanan atas daftar tagihan, klik ikon Export Bill (CSV) untuk mengunduh tagihan ke perangkat lokal Anda.
Buka file tersebut dan cari kolom Instance ID. Verifikasi entri menggunakan aturan di bawah ini.
2. Interpret Key Fields
Kolom “Instance ID”: Kolom ini berisi beberapa segmen, biasanya dipisahkan oleh titik koma (;).
Contoh:
text_token;llm-xxx;qwen-max;output_token;appIni merepresentasikan
billing type;workspace ID;model name;input/output type;invocation channel.
3. Data Traceability and Terminology
Menanyakan API Key: Salin
API Key IDdari tagihan. Buka halaman Model Studio API Key Management untuk menemukan nama kunci yang sesuai.Menanyakan workspace: Salin
workspace IDdari tagihan. Buka halaman Workspace Management untuk mengonfirmasi ID tersebut.Definisi saluran pemanggilan:
app: Model dipanggil dari aplikasi (kode).bmp: Model dipanggil dari Model Experience di console.assistant-api: Model dipanggil melalui Assistant API.
Stop Billing (Disable Services)
Jika Anda tidak lagi membutuhkan layanan Model Studio, hentikan penagihan untuk menghindari biaya tambahan.
1. Cancel Coding Plan Subscription
Coding Plan adalah produk langganan bulanan. Layanan ini berhenti secara otomatis saat masa berlaku habis. Tidak perlu pembatalan manual. Untuk menonaktifkan perpanjangan otomatis, buka halaman atau halaman Coding Plan dan matikan perpanjangan otomatis.
2. Stop Model Inference
Tindakan: Hentikan penggunaan fitur terkait. Misalnya, berhenti menggunakan console Alibaba Cloud Model Studio untuk pengalaman model dan hentikan semua panggilan API dalam kode Anda.
Rekomendasi: Untuk mencegah panggilan tidak disengaja, buka console Alibaba Cloud Model Studio. Di pojok kanan atas, pilih wilayah target Anda. Lalu buka halaman API Key dan hapus semua kunci API yang telah dibuat.

3. Stop Model Training
Tindakan: Tidak ada biaya yang dikenakan jika tidak ada pekerjaan pelatihan yang sedang berjalan.
FAQ
Q: Mengapa saya tidak bisa melihat tagihan segera setelah memanggil model?
A: Kemungkinan penyebabnya:
Keterlambatan penagihan: Tagihan inferensi LLM dihasilkan per menit. Biasanya muncul 2–10 menit setelah panggilan. Layanan lain (inferensi batch, pelatihan model, basis pengetahuan, dll.) menghasilkan tagihan per jam. Selama trafik puncak, keterlambatan mungkin terjadi. Gunakan waktu pembuatan tagihan aktual sistem sebagai acuan.
Anda menggunakan model non-komersial (pratinjau publik atau pratinjau undangan): Model-model ini tidak menghasilkan tagihan.
Q: Apakah penagihan pay-as-you-go bersifat real-time?
A: Tidak. Penagihan pay-as-you-go Alibaba Cloud menggunakan model “cadangan awal + penyelesaian bulanan”. Sistem terlebih dahulu membekukan sebagian saldo Anda. Di akhir setiap siklus penagihan (awal bulan berikutnya), sistem menghasilkan tagihan akhir dan memotong jumlah tersebut.
Q: Di mana saya dapat melihat jumlah dan statistik pemanggilan model?
A: Buka console Alibaba Cloud Model Studio. Di pojok kanan atas, pilih wilayah target Anda. Lalu buka halaman Model Monitoring untuk melihat statistik pemanggilan model.

