Biaya ruang kerja EMR Serverless Spark terdiri dari dua komponen: sumber daya komputasi dan panggilan model. EMR Serverless Spark mendukung berbagai metode penagihan, seperti bayar sesuai penggunaan dan langganan. Memahami logika penagihan serta cara memperkirakan penggunaan untuk setiap item penagihan membantu Anda merencanakan biaya secara efektif.
Komposisi Penagihan
Komponen penagihan ruang kerja EMR Serverless Spark dan metode penagihan yang didukung adalah sebagai berikut:
Metode Penagihan
EMR Serverless Spark mendukung metode penagihan berikut:
Billing method | Description |
Bayar setelah penggunaan. Sistem menagih Anda setiap jam (pada awal setiap jam, UTC+8) berdasarkan penggunaan resource aktual di ruang kerja. Gunakan metode ini jika workload Anda sering berubah. | |
Bayar sebelum penggunaan. Anda melakukan pembayaran di muka untuk durasi tetap saat pembelian. Sistem menghitung harga per siklus penagihan berdasarkan durasi langganan. Gunakan metode ini jika penggunaan resource Anda stabil dalam jangka panjang dan anggaran Anda sudah ditentukan dengan jelas. | |
Tambahkan sumber daya komputasi elastis ke konfigurasi langganan Anda. Pendekatan ini menggabungkan fleksibilitas bayar sesuai penggunaan dengan efisiensi biaya dari langganan. | |
Beli paket sumber daya dengan diskon di muka. Saat penagihan, penggunaan terlebih dahulu dikurangkan dari paket sumber daya Anda. Anda hanya membayar dengan tarif bayar sesuai penggunaan untuk penggunaan yang melebihi kuota paket. Gunakan metode ini jika workload Anda relatif stabil. | |
Ditagih berdasarkan penggunaan Token aktual dari model AI Center bawaan di ruang kerja. |
Detail Item Penagihan
Computing Resources
Anda ditagih untuk sumber daya komputasi berdasarkan paket langganan atau penggunaan aktual dengan metode bayar sesuai penggunaan. Satuan pengukurannya adalah CU.
1 CU = 1 vCPU + 4 GiB memory. Ini merupakan satuan dasar daya komputasi untuk ruang kerja EMR Serverless Spark. Penggunaan CU untuk suatu tugas komputasi bergantung pada volume data yang diproses, kompleksitas komputasi, distribusi data, dan apakah Anda mengaktifkan Fusion engine. Mengaktifkan Fusion engine tidak menambah biaya sumber daya dan biasanya mengurangi waktu proses pekerjaan lebih dari 30%.
Jika rasio vCPU-memori Anda kurang dari 1:4, lihat promosi CU EMR Serverless Spark untuk detail konversinya.
Tabel berikut menunjukkan kapasitas pemrosesan 1 CU.
Processing scenario | Processing capacity (Java Runtime) | Processing capacity (Fusion engine) |
Pemrosesan data sederhana, seperti filtering dan scrubbing. | 1 CU memproses sekitar 2.000.000 catatan per detik. | 1 CU memproses sekitar 5.000.000 catatan per detik. |
Pemrosesan data kompleks, seperti agregasi, join, dan operasi string. | 1 CU memproses sekitar 700.000 catatan per detik. | 1 CU memproses sekitar 2.000.000 catatan per detik. |
Model Calls
Anda ditagih untuk panggilan model berdasarkan penggunaan aktual layanan model AI Center bawaan. Satuan pengukurannya adalah ribuan Token.
Estimasi penggunaan Token adalah sebagai berikut: • 1 karakter Tionghoa ≈ 1,5–2 Token • 1 huruf Inggris ≈ 0,25 Token • 1 kata Inggris ≈ 1,3 Token
Alibaba Cloud Model Studio: ≈ 4–5 TokenHello World: ≈ 2 Token
Sebagai contoh, dalam skenario penyamaran data, Anda memproses 1.000 catatan teks dalam satu Batch. Berikut adalah contoh Pernyataan SQL:
select
ai_query (
concat(
'Mask the following text according to these rules:
1. Chinese names: Detect all Chinese names (2–4 characters). Keep the first and last characters. Replace middle characters with `*`.
2. Mobile phone numbers: Detect Chinese mainland mobile numbers (11 digits, starting with 1). Keep the first 3 and last 4 digits. Replace the middle 4 digits with `****`.
3. Physical addresses: Detect specific physical address information, such as province, city, district, street, and building number. Keep only the province, city, and district (county) levels. Replace all detailed street, building number, and community names after the district/county level with `***`.
Output requirements:
Return only the following three lines. Do not include explanations, original text, or other content:
Name: [result]
Mobile: [result]
Address: [result]',
user_info
)
)AS masked_text
from
user_tbl
;Sebagai contoh, nilai user_info dapat berupa: “Mr. Li Si tinggal di No. xxx, Jalan Moumou, Taman Teknologi Tinggi Zhangjiang, Area Baru Pudong, Shanghai. Nomor ponselnya adalah 159********.”
Estimasi penggunaan Token untuk satu catatan adalah sebagai berikut:
Estimated Token usage | |
user_info input data | ≈ 60 |
prompt | ≈ 200 |
output data | ≈ 50 |
Estimasi penggunaan Token untuk 10.000 catatan adalah sebagai berikut:
Estimated usage | Calculation formula | |
Input Tokens (estimated) | ≈ 2.600 ribu Token | (60 + 200) Tokens/record × 10.000 records |
Output Tokens (estimated) | ≈ 500 ribu Token | 50 Tokens/record × 10.000 records |