このトピックでは、E-MapReduce(EMR)Serverless Spark の課金項目と計算リソースに関する情報を説明します。
課金項目
EMR Serverless Spark の課金項目は計算リソースです。従量課金制に基づいて、計算リソースの実際の使用量に対して課金されます。単位は計算ユニット(CU)です。計算リソースプランを使用して、計算リソースの実際の使用量に対して発生した料金を相殺できます。
計算リソース
CU
CU は、EMR Serverless Spark ワークスペースの計算能力の基本単位であり、分単位で課金されます。 CU の単価は、EMR Serverless Spark ワークスペースの CPU アーキテクチャとゾーンの高可用性属性によって異なります。デフォルトでは、Intel x86 アーキテクチャとシングルゾーンが使用されます。 CU の単価は、リージョンによっても異なります。
測定方法
CU は、Serverless Spark の基盤となるシステムの CPU 計算能力を反映します。計算タスクで消費される CU の数は、タスクによって処理される実際のデータ量、計算の複雑さ、データの分散、およびFusion エンジンを有効にするかどうかによって異なります。高速化のために Fusion エンジンを有効にした場合、追加のリソース料金は発生しませんが、ほとんどの場合、ジョブの実行に必要な時間が 30% 以上短縮され、費用対効果が高くなります。ビジネス規模と処理するデータ量に基づいて、購入する必要がある CU の数を推定できます。デフォルトでは、1 CU は 1 CPU コアと 4 GiB のメモリに相当します。 CPU コアとメモリの比率が 1:4 でない場合は、CU のプロモーション割引に基づいて CU の数を計算できます。詳細については、「CU のプロモーション割引に関するお知らせ」をご参照ください。
次の表に、1 CU の処理能力を示します。
シナリオ | 処理能力(Java ランタイム) | 処理能力(Fusion エンジン) |
フィルタリングやクレンジングなどの単純なデータ処理 | 1 CU は、1 秒あたり約 2,000,000 件のデータレコードを処理できます。 | 1 CU は、1 秒あたり約 5,000,000 件のデータレコードを処理できます。 |
集計、結合、文字列関連の操作などの複雑なデータ処理 | 1 CU は、1 秒あたり約 700,000 件のデータレコードを処理できます。 | 1 CU は、1 秒あたり約 2,000,000 件のデータレコードを処理できます。 |