モデル呼び出し（従量課金） - E-MapReduce - Alibaba Cloud ドキュメントセンター

従量課金は、サービスの利用後に料金を支払う課金方法です。料金は、ワークスペース内の AI センターに内蔵されたモデルのトークン使用量に基づいて計算されます。

説明

AI センターは現在無料トライアル期間中です。商用課金は 2026 年 4 月 8 日より開始予定です。詳細については、「EMR Serverless Spark AI センターの商用化に関するお知らせ」をご参照ください。

従量課金の詳細

項目

説明

課金ルール

課金は、ワークスペース内の AI センターに内蔵されたモデルサービスのトークン使用量に基づき、1 時間ごとの課金サイクルで計算されます。内蔵モデルごとに課金ルールが異なります：

qwen-plus：入力トークンおよび出力トークンの両方に対して課金されます。
text-embedding-v4：入力トークンのみに対して課金され、出力トークンは課金対象外です。

モデル呼び出しの料金は、以下の式で計算されます：入力トークン使用量 × 入力単位価格 + 出力トークン使用量 × 出力単位価格

例：中国 (杭州) リージョンで `ai_query()` を 10,000 回呼び出した場合、各呼び出しの入力トークン数が 260、出力トークン数が 50 であるとき、料金は以下のとおりです：0.00096 × 260 × 10000 ÷ 1000 + 0.0024 × 50 × 10000 ÷ 1000 = 3.696 CNY。

説明

トークン使用量の概算方法については、「課金対象項目および課金方法」の「モデル呼び出し」セクションをご参照ください。

課金サイクル

料金は、UTC + 08:00 毎時（毎正時）に計算されます。各計算後に新しい課金サイクルが開始します。各課金サイクル終了時に、システムが請求書を生成し、ご利用アカウントから料金を自動的に差し引きます。実際のリソース消費と請求書に反映されるデータの間に遅延が生じる場合があります。詳細については、「請求書の使い方」をご参照ください。

リージョン別単位価格

qwen-plus

リージョン名	1 リクエストあたりの入力トークン範囲	入力単位価格（USD / 1,000 トークン）	出力単位価格（USD / 1,000 トークン）
中国 (北京) 中国 (上海) 中国 (杭州) 中国 (深セン)	0 < トークン ≤ 128K	0.000138	0.000344
	128K < トークン ≤ 256K	0.000414	0.003442
	256K < トークン ≤ 1M	0.000827	0.008257
中国 (香港) シンガポールドイツ (フランクフルト) 米国 (バージニア) 米国 (シリコンバレー) 日本 (東京) インドネシア (ジャカルタ) メキシコ	0 < トークン ≤ 256K	0.000480	0.001440
	256K < トークン ≤ 1M	0.001440	0.004320

text-embedding-v4

リージョン名	入力単位価格（USD / 1,000 トークン）
中国 (北京) 中国 (上海) 中国 (杭州) 中国 (深セン)	0.000086
中国 (香港) シンガポールドイツ (フランクフルト) 米国 (バージニア) 米国 (シリコンバレー) 日本 (東京) インドネシア (ジャカルタ) メキシコ	0.000084