Model penagihan dan kontrol biaya EMR Serverless Spark - E-MapReduce

Biaya ruang kerja EMR Serverless Spark terdiri dari dua komponen: sumber daya komputasi dan panggilan model. EMR Serverless Spark mendukung berbagai metode penagihan, seperti bayar sesuai penggunaan dan langganan. Memahami logika penagihan serta cara memperkirakan penggunaan untuk setiap item penagihan membantu Anda merencanakan biaya secara efektif.

Komposisi Penagihan

Komponen penagihan ruang kerja EMR Serverless Spark dan metode penagihan yang didukung adalah sebagai berikut:

Metode Penagihan

EMR Serverless Spark mendukung metode penagihan berikut:

Billing method	Description
Computing resources (pay-as-you-go)	Bayar setelah penggunaan. Sistem menagih Anda setiap jam (pada awal setiap jam, UTC+8) berdasarkan penggunaan resource aktual di ruang kerja. Gunakan metode ini jika workload Anda sering berubah.
Computing resources (subscription)	Bayar sebelum penggunaan. Anda melakukan pembayaran di muka untuk durasi tetap saat pembelian. Sistem menghitung harga per siklus penagihan berdasarkan durasi langganan. Gunakan metode ini jika penggunaan resource Anda stabil dalam jangka panjang dan anggaran Anda sudah ditentukan dengan jelas.
Computing resources (hybrid billing)	Tambahkan sumber daya komputasi elastis ke konfigurasi langganan Anda. Pendekatan ini menggabungkan fleksibilitas bayar sesuai penggunaan dengan efisiensi biaya dari langganan.
Computing resources (resource plan)	Beli paket sumber daya dengan diskon di muka. Saat penagihan, penggunaan terlebih dahulu dikurangkan dari paket sumber daya Anda. Anda hanya membayar dengan tarif bayar sesuai penggunaan untuk penggunaan yang melebihi kuota paket. Gunakan metode ini jika workload Anda relatif stabil.
Model calls (pay-as-you-go)	Ditagih berdasarkan penggunaan Token aktual dari model AI Center bawaan di ruang kerja.

Detail Item Penagihan

Computing Resources

Anda ditagih untuk sumber daya komputasi berdasarkan paket langganan atau penggunaan aktual dengan metode bayar sesuai penggunaan. Satuan pengukurannya adalah CU.

1 CU = 1 vCPU + 4 GiB memory. Ini merupakan satuan dasar daya komputasi untuk ruang kerja EMR Serverless Spark. Penggunaan CU untuk suatu tugas komputasi bergantung pada volume data yang diproses, kompleksitas komputasi, distribusi data, dan apakah Anda mengaktifkan Fusion engine. Mengaktifkan Fusion engine tidak menambah biaya sumber daya dan biasanya mengurangi waktu proses pekerjaan lebih dari 30%.

Jika rasio vCPU-memori Anda kurang dari 1:4, lihat promosi CU EMR Serverless Spark untuk detail konversinya.

Tabel berikut menunjukkan kapasitas pemrosesan 1 CU.

Processing scenario	Processing capacity (Java Runtime)	Processing capacity (Fusion engine)
Pemrosesan data sederhana, seperti filtering dan scrubbing.	1 CU memproses sekitar 2.000.000 catatan per detik.	1 CU memproses sekitar 5.000.000 catatan per detik.
Pemrosesan data kompleks, seperti agregasi, join, dan operasi string.	1 CU memproses sekitar 700.000 catatan per detik.	1 CU memproses sekitar 2.000.000 catatan per detik.

Model Calls

Anda ditagih untuk panggilan model berdasarkan penggunaan aktual layanan model AI Center bawaan. Satuan pengukurannya adalah ribuan Token.

Estimasi penggunaan Token adalah sebagai berikut: • 1 karakter Tionghoa ≈ 1,5–2 Token • 1 huruf Inggris ≈ 0,25 Token • 1 kata Inggris ≈ 1,3 Token

Alibaba Cloud Model Studio: ≈ 4–5 Token
Hello World: ≈ 2 Token

Sebagai contoh, dalam skenario penyamaran data, Anda memproses 1.000 catatan teks dalam satu Batch. Berikut adalah contoh Pernyataan SQL:

select
  ai_query (
    concat(
      'Mask the following text according to these rules:
      1. Chinese names: Detect all Chinese names (2–4 characters). Keep the first and last characters. Replace middle characters with `*`.
      2. Mobile phone numbers: Detect Chinese mainland mobile numbers (11 digits, starting with 1). Keep the first 3 and last 4 digits. Replace the middle 4 digits with `****`.
      3. Physical addresses: Detect specific physical address information, such as province, city, district, street, and building number. Keep only the province, city, and district (county) levels. Replace all detailed street, building number, and community names after the district/county level with `***`.
      Output requirements:
      Return only the following three lines. Do not include explanations, original text, or other content:
      Name: [result]
      Mobile: [result]
      Address: [result]',
      user_info
    )
  )AS masked_text
from
  user_tbl
;

Sebagai contoh, nilai user_info dapat berupa: “Mr. Li Si tinggal di No. xxx, Jalan Moumou, Taman Teknologi Tinggi Zhangjiang, Area Baru Pudong, Shanghai. Nomor ponselnya adalah 159********.”

Estimasi penggunaan Token untuk satu catatan adalah sebagai berikut:

	Estimated Token usage
user_info input data	≈ 60
prompt	≈ 200
output data	≈ 50

Estimasi penggunaan Token untuk 10.000 catatan adalah sebagai berikut:

	Estimated usage	Calculation formula
Input Tokens (estimated)	≈ 2.600 ribu Token	(60 + 200) Tokens/record × 10.000 records
Output Tokens (estimated)	≈ 500 ribu Token	50 Tokens/record × 10.000 records