Cara mengkueri tagihan inferensi model, mengalokasikan biaya, menyelesaikan pembayaran tertunda, dan menghentikan penagihan - Alibaba Cloud Model Studio

Topik ini menjelaskan cara mengkueri detail penagihan, menganalisis tagihan, dan menghentikan penagihan.

Query bills

Tagihan hanya dibuat setelah panggilan selesai. Tagihan untuk model inference dibuat dengan granularitas per menit, biasanya dalam waktu 2 hingga 10 menit. Tagihan untuk layanan seperti batch inference, model training, dan knowledge base dibuat setiap jam. Selama jam sibuk, waktu yang ditampilkan di sistem dianggap sebagai waktu penagihan akhir.

Cost overview

Login ke Konsol Model Studio. Klik tab Dashboard di bagian atas. Pada panel navigasi kiri, pilih Usage & Billing > Cost overview, lalu pilih billing month.

Halaman ini hanya menampilkan biaya untuk model inference. Untuk melihat biaya layanan seperti model training dan knowledge base, lihat Billing Details.

Lihat total konsumsi dan rinciannya: Bagian atas halaman menunjukkan Total amount untuk bulan tersebut, yang dipecah menjadi Subscription (seperti Token Plan dan Coding Plan) dan Bill (untuk panggilan model dan pelatihan berbasis pay-as-you-go). Klik View details pada kartu Subscription atau Bill untuk melihat rincian biaya. Grafik Bill trend di bawah hanya menampilkan jumlah pay-as-you-go dan tidak termasuk biaya langganan prabayar. Saat melihat data bulan berjalan, jumlah Bill biasanya diperbarui terlebih dahulu, sedangkan grafik Bill trend mungkin sedikit tertunda.
Kueri biaya berdasarkan model atau API Key: Pada bagian Bill trend, pilih model target dari daftar drop-down Model atau filter berdasarkan API Key ID, lalu beralih ke tampilan List. Kolom Payable amount pada tampilan List menunjukkan total biaya bulanan kumulatif untuk item yang dipilih.
Bandingkan tren pengeluaran: Atur Grouping ke Category dan bandingkan tren pengeluaran untuk model inference dan training berdasarkan basis Daily atau Monthly.
Atur notifikasi tagihan: Pada kartu Bill, klik Edit di samping Bill alert. Pada panel Usage limit & alerts, aktifkan batas bulanan, atur ambang batas, dan konfigurasi notifikasi email. Anda akan diberi tahu saat pengeluaran mencapai ambang batas tersebut. Hal ini membantu Anda menghindari gangguan layanan akibat pembayaran tertunda.

Billing details

Tagihan untuk inferensi dan training model skala besar dapat dipecah untuk ditinjau berdasarkan API Key ID, workspace ID, model name, input/output type, invocation channel.

1. Download the bill

Pada halaman Billing Details, pilih billing period.
Pilih Product sebagai Alibaba Cloud Model Studio, lalu klik Search.
Di pojok kanan atas daftar tagihan, klik Export Bill CSV untuk mengunduh tagihan.
Buka file tersebut, temukan kolom Instance ID, dan interpretasikan menggunakan aturan yang dijelaskan pada bagian berikutnya.

2. Interpret key fields

Kolom "Instance ID" berisi beberapa informasi yang dipisahkan oleh titik koma (;).

Contoh: text_token;llm-xxx;qwen-max;output_token;app
Ini merepresentasikan informasi berikut secara berurutan: billing type;workspace ID;model name;input/output type;invocation channel

3. Data traceability and terms

Kueri API Key: Salin ApiKeyID dari tagihan Anda dan buka halaman Model Studio API Key Management untuk menemukan nama kunci yang sesuai.
Kueri workspace: Salin workspace ID dari tagihan Anda. Buka halaman Workspaces untuk mengidentifikasi workspace spesifik tersebut.
Deskripsi invocation channel:
- app: Panggilan yang dilakukan dari aplikasi (melalui kode).
- bmp: Panggilan yang dilakukan dari Playground di konsol.
- assistant-api: Panggilan yang dilakukan melalui Assistant API.

Stop billing

Jika Anda tidak lagi menggunakan Model Studio, ikuti petunjuk di bawah ini untuk menghentikan layanan terkait dan mencegah biaya tambahan.

Hentikan model inference: Hentikan panggilan API dari kode Anda dan hentikan penggunaan Playground di konsol untuk mencegah biaya tambahan. Untuk mencegah panggilan tidak disengaja, Anda dapat menghapus kunci Anda pada halaman API-KEY.
Hentikan model training: Anda tidak dikenai biaya selama tidak ada tugas pelatihan model yang sedang berjalan.
Batalkan langganan Coding Plan: Coding Plan adalah produk langganan bulanan yang secara otomatis berhenti di akhir periode langganan. Pembatalan di tengah periode dan pengembalian dana tidak didukung. Jika Anda telah mengaktifkan perpanjangan otomatis, nonaktifkan fitur tersebut pada halaman Coding Plan.
Batalkan langganan Token Plan Team Edition: Pada halaman My Subscriptions di Konsol Token Plan, Anda dapat membatalkan kursi yang belum digunakan, dan dana akan dikembalikan ke akun pembayaran asal. Jika Anda tidak ingin memperbarui langganan, nonaktifkan perpanjangan otomatis.

FAQ

Mengapa saya tidak dapat menemukan tagihan setelah memanggil model?

Penyebab:

Latensi penagihan: Tagihan inferensi model diagregasi per menit dan biasanya muncul 2 hingga 10 menit setelah panggilan. Tagihan untuk batch inference, model training, dan knowledge base diagregasi setiap jam. Pembuatan tagihan mungkin semakin tertunda selama jam sibuk.
Penggunaan model non-komersial: Model dalam pratinjau publik atau pengujian undangan saja tidak menghasilkan catatan penagihan.

Solusi: Tunggu hingga interval penagihan berlalu, lalu periksa kembali.

Mengapa model yang sama memiliki beberapa entri dalam tagihan saya?

Penyebab: Model yang sama ditagih secara terpisah berdasarkan jenis penagihan (seperti token input, token output, atau cache hits) dan saluran pemanggilan (seperti panggilan API atau pengalaman konsol). Misalnya, satu panggilan API ke qwen3.6-plus menghasilkan dua entri: satu untuk "token input" dan satu untuk "token output".

Solusi: Gunakan kolom Instance ID di Billing Details untuk memahami rincian setiap item baris.

Banyak entri tagihan bernama "Large Model Text Consumption". Bagaimana cara mengidentifikasi model untuk setiap entri?

Penyebab: Kolom "Billable Item" pada tagihan diberi label seragam "Large Model Text Consumption" dan tidak menampilkan nama model spesifik.

Solusi: Periksa kolom Instance ID (Billing Granularity) pada halaman Billing Details. Kolom ini berupa string yang dipisahkan titik koma. Bagian string yang langsung mengikuti workspace ID (seperti llm-xxx) adalah nama modelnya. Misalnya, dalam 12xxx;llm-xxx;qwen3.6-plus;context_0-128k_input_token;bmp;0, modelnya adalah qwen3.6-plus.

Di mana saya dapat melihat jumlah panggilan model dan statistiknya?

Buka Konsol Alibaba Cloud Model Studio, pilih wilayah target di pojok kanan atas. Klik tab Dashboard di bagian atas. Pada panel navigasi kiri, pilih Usage & Billing > Model usage.

Apakah bayar sesuai penggunaan ditagih secara real time?

Tidak. Alibaba Cloud menggunakan model "cadangan dan penyelesaian bulanan" untuk penagihan bayar sesuai penggunaan. Sistem mencadangkan sejumlah dana dari saldo tersedia Anda untuk menutupi penggunaan, lalu membuat tagihan akhir dan memotong biaya aktual di akhir siklus penagihan (awal bulan berikutnya).

Mengapa saya memiliki pembayaran tertunda meskipun hampir tidak menggunakan layanan?

Alasan: Fitur tambahan Model Studio, seperti web search, ditagih secara terpisah (pascabayar) berdasarkan jumlah panggilan dan ditagihkan terpisah dari biaya inferensi model. Bahkan jika Anda belum aktif menggunakan konsol baru-baru ini, jika parameter enable_search diaktifkan dalam aplikasi atau kode yang Anda buat sebelumnya, biaya web search tetap dikenakan untuk setiap panggilan.

Solusi:

Di Billing Details, filter untuk Alibaba Cloud Model Studio dan periksa kolom Instance ID (Billing Granularity) untuk mengidentifikasi nama model dan saluran pemanggilan yang menimbulkan biaya tersebut.
Periksa apakah enable_search diaktifkan dalam kode aplikasi atau konfigurasi aplikasi Model Studio Anda. Jika Anda tidak lagi membutuhkan web search, atur parameter ini ke false atau hapus parameter tersebut.
Jika Anda telah menghentikan semua panggilan tetapi masih dikenai biaya, periksa apakah kunci API atau aplikasi lain masih berjalan. Anda dapat menemukan dan menghapus kunci yang tidak digunakan pada halaman API Key Management.