EMR Serverless Spark 料金モデルとコスト管理 - EMR

EMR Serverless Spark ワークスペースのコストは、コンピューティングリソースとモデル呼び出しの 2 つの部分で構成されます。EMR Serverless Spark は、従量課金やサブスクリプションなど、複数の課金方法をサポートしています。各課金項目の課金ロジックと使用量の見積もり方法を理解することで、コストを効果的に計画できます。

課金の構成

EMR Serverless Spark ワークスペースの課金コンポーネントとサポートされている課金方法は次のとおりです：

課金方法

EMR Serverless Spark は、次の課金方法をサポートしています：

課金方法	説明
コンピューティングリソース (従量課金)	後払いです。システムは、ワークスペースでの実際のリソース使用量に基づいて、1 時間ごと (UTC+08:00 の毎正時) に請求します。ワークロードが頻繁に変動する場合にこの方法を使用します。
コンピューティングリソース (サブスクリプション)	前払いです。購入時に一定期間分を前払いします。システムは、サブスクリプション期間に基づいて課金サイクルごとの価格を計算します。リソース使用量が安定的で長期的であり、予算が明確に定義されている場合にこの方法を使用します。
コンピューティングリソース (ハイブリッド課金)	サブスクリプション設定に弾性コンピューティングリソースを追加します。これにより、従量課金の柔軟性とサブスクリプションのコスト効率を組み合わせることができます。
コンピューティングリソース (リソースプラン)	割引されたリソースプランを事前に購入します。課金時、使用量はまずリソースプランから差し引かれます。プランを超えた使用量に対してのみ、従量課金料金を支払います。ワークロードが比較的安定している場合にこの方法を使用します。
モデル呼び出し (従量課金)	ワークスペース内の組み込み AI センターモデルの実際のトークン使用量に基づいて課金されます。

課金項目の詳細

コンピューティングリソース

コンピューティングリソースは、サブスクリプションプランまたは実際の従量課金使用量に基づいて課金されます。測定単位は CU です。

1 CU = 1 vCPU + 4 GiB メモリ。これは、EMR Serverless Spark ワークスペースのコンピューティング能力の基本単位です。コンピューティングタスクの CU 使用量は、処理されるデータ量、計算の複雑さ、データ分散、および Fusion エンジンを有効にするかどうかによって異なります。Fusion エンジンを有効にしても、リソースコストは増加しません。通常、ジョブのランタイムが 30% 以上削減されます。

vCPU 対メモリ比が 1:4 未満の場合は、変換の詳細について「EMR Serverless Spark CU プロモーション」をご参照ください。

次の表に、1 CU の処理能力を示します。

処理シナリオ	処理能力 (Java ランタイム)	処理能力 (Fusion エンジン)
フィルタリングやスクラビングなどの単純なデータ処理。	1 CU で 1 秒あたり約 2,000,000 レコードを処理します。	1 CU で 1 秒あたり約 5,000,000 レコードを処理します。
集約、結合、文字列操作などの複雑なデータ処理。	1 CU で 1 秒あたり約 700,000 レコードを処理します。	1 CU で 1 秒あたり約 2,000,000 レコードを処理します。

モデル呼び出し

組み込みの AI Center モデルサービスの実際の使用量に基づいて、モデルの呼び出しに対して請求されます。測定単位は 1,000 トークンです。

トークン使用量は、以下のように推定されます： • 1 漢字 ≈ 1.5～2 トークン • 1 英字 ≈ 0.25 トークン • 1 英単語 ≈ 1.3 トークン

Alibaba Cloud Model Studio: ≈ 4～5 トークン
Hello World: ≈ 2 トークン

たとえば、データマスキングシナリオでは、1,000 件のテキストレコードをバッチで処理します。以下は SQL ステートメントの例です：

select
  ai_query (
    concat(
      'Mask the following text according to these rules:
      1. Chinese names: Detect all Chinese names (2–4 characters). Keep the first and last characters. Replace middle characters with `*`.
      2. Mobile phone numbers: Detect Chinese mainland mobile numbers (11 digits, starting with 1). Keep the first 3 and last 4 digits. Replace the middle 4 digits with `****`.
      3. Physical addresses: Detect specific physical address information, such as province, city, district, street, and building number. Keep only the province, city, and district (county) levels. Replace all detailed street, building number, and community names after the district/county level with `***`.
      Output requirements:
      Return only the following three lines. Do not include explanations, original text, or other content:
      Name: [result]
      Mobile: [result]
      Address: [result]',
      user_info
    )
  )AS masked_text
from
  user_tbl
;

たとえば、user_info の値は次のようになります：「李四 (リー・スー) 氏は上海市浦東新区張江ハイテクパーク某某路 xxx 号に住んでいます。携帯電話番号は 159******** です。」

1 レコードあたりの推定トークン使用量は次のとおりです：

	推定トークン使用量
user_info 入力データ	≈ 60
プロンプト	≈ 200
出力データ	≈ 50

10,000 レコードの推定トークン使用量は次のとおりです：

	推定使用量	計算式
入力トークン (推定)	約 2,600 千トークン	(60 + 200) トークン/レコード × 10,000 レコード
出力トークン (推定)	約 500 千トークン	50 トークン/レコード × 10,000 レコード