EMR Serverless Spark の課金方法、コスト、および使用量の見積もり - E-MapReduce

EMR Serverless Spark のコストは、ワークスペースとキャッシュクラスターに分かれており、コンピューティングリソース、モデルの呼び出し、キャッシュリソースの 3 つの課金項目があります。従量課金やサブスクリプションなど、複数の課金方法が利用可能です。このトピックでは、各課金項目と使用量の見積もり方法について説明します。

課金の構成

次の図は、コストの内訳を示しています。

課金方法

EMR Serverless Spark では、次の課金方法が利用できます：

課金方法	説明
コンピューティングリソース (従量課金)	後払いです。実際のリソース使用量に基づき、1 時間ごと (毎正時、UTC+8) に課金されます。変動のあるワークロードに適しています。
コンピューティングリソース (サブスクリプション)	前払いです。固定期間分を前払いします。料金は、サブスクリプション期間に基づき、請求期間ごとに計算されます。予算が予測可能で安定した長期的なワークロードに適しています。
コンピューティングリソース (ハイブリッド課金)	サブスクリプションにエラスティックコンピューティングリソースを追加します。従量課金の柔軟性とサブスクリプションのコスト効率を両立します。
コンピューティングリソース (リソースプラン)	割引価格のリソースプランを事前に購入します。使用量はまずプランから差し引かれ、超過分は従量課金レートで請求されます。比較的安定したワークロードに適しています。
モデルの呼び出し (従量課金)	ワークスペース内の組み込み AI Center モデルの実際のトークン使用量に基づいて課金されます。
データキャッシュ (従量課金)	後払いです。割り当てられたキャッシュクォータと使用期間に基づき、1 時間ごと (毎正時、UTC+8) に課金されます。より高速なデータ読み込みを必要とする Serverless Spark ジョブに適しています。

課金項目の詳細

コンピューティングリソース

コンピューティングリソースは、サブスクリプションプランまたは実際の従量課金の利用量に基づいて課金されます。測定単位は CU です。

1 CU = 1 vCPU + 4 GiB メモリで、EMR Serverless Spark の基本的なコンピューティングユニットです。CU の使用量は、データ量、計算の複雑さ、データ分散、および Fusion Engine を有効にするかどうかによって異なります。Fusion Engine はコストを増加させることはなく、通常、ジョブの実行時間を 30% 以上削減します。

vCPU とメモリの比率が 1:4 未満の場合の CU 変換については、「EMR Serverless Spark CU プロモーション」ページをご参照ください。

1 CU の処理能力：

処理シナリオ	処理能力 (Java ランタイム)	処理能力 (Fusion Engine)
フィルタリングやスクラビングなどの単純なデータ処理。	1 CU で 1 秒あたり約 2,000,000 レコードを処理します。	1 CU で 1 秒あたり約 5,000,000 レコードを処理します。
集計、結合、文字列操作などの複雑なデータ処理。	1 CU で 1 秒あたり約 700,000 レコードを処理します。	1 CU で 1 秒あたり約 2,000,000 レコードを処理します。

モデルの呼び出し

モデルの呼び出しは、組み込みの AI Center モデルサービスの実際の使用量に基づき、1,000 トークン単位で課金されます。

トークンの見積もり： • 中国語の文字 1 文字 ≈ 1.5–2 トークン • 英字 1 文字 ≈ 0.25 トークン • 英単語 1 語 ≈ 1.3 トークン

Alibaba Cloud Model Studio： ≈ 4–5 トークン
Hello World： ≈ 2 トークン

たとえば、バッチ処理で 1,000 件のテキストレコードをマスキングするには、次の SQL を使用します：

select
  ai_query (
    concat(
      '次のルールに従って、以下のテキストをマスキングしてください：
      1. 中国語の名前：すべての中国語の名前 (2〜4 文字) を検出してください。最初と最後の文字は保持して、中間の文字を `*` に置き換えてください。
      2. 携帯電話番号：中国本土の携帯電話番号 (11 桁、1 で始まる) を検出してください。最初の 3 桁と最後の 4 桁は保持して、中間の 4 桁を `****` に置き換えてください。
      3. 物理アドレス：省、市、区、通り、建物番号などの特定の物理アドレス情報を検出してください。省、市、区 (県) レベルのみを保持してください。区/県レベルより後の詳細な通り、建物番号、コミュニティ名はすべて `***` に置き換えてください。
      出力要件：
      次の 3 行のみを返してください。説明、元のテキスト、その他のコンテンツは含めないでください：
      名前: [result]
      携帯電話: [result]
      住所: [result]',
      user_info
    )
  )AS masked_text
from
  user_tbl
;

たとえば、user_info の値は「田中一郎様は上海市浦東新区張江ハイテクパーク某々路 xxx 号に住んでいます。携帯電話番号は 159******** です。」のようになります。

1 レコードあたりの推定トークン使用量は次のとおりです：

	推定トークン使用量
user_info 入力データ	≈ 60
プロンプト	≈ 200
出力データ	≈ 50

10,000 レコードの推定トークン使用量：

	推定使用量	計算式
入力トークン (推定)	≈ 260 万トークン	(60 + 200) トークン/レコード × 10,000 レコード
出力トークン (推定)	≈ 50 万トークン	50 トークン/レコード × 10,000 レコード

キャッシュクラスター

キャッシュクラスターは、割り当てられたキャッシュクォータと使用期間に基づき、GB 単位で課金されます。課金ルール、請求サイクル、リージョン別の料金については、「データキャッシュ (従量課金)」をご参照ください。