従量課金は、サービスの利用後に料金を支払う課金方法です。料金は、ワークスペース内の AI センターに内蔵されたモデルのトークン使用量に基づいて計算されます。
AI センターは現在無料トライアル期間中です。商用課金は 2026 年 4 月 8 日より開始予定です。詳細については、「EMR Serverless Spark AI センターの商用化に関するお知らせ」をご参照ください。
従量課金の詳細
項目 | 説明 |
課金ルール | 課金は、ワークスペース内の AI センターに内蔵されたモデルサービスのトークン使用量に基づき、1 時間ごとの課金サイクルで計算されます。内蔵モデルごとに課金ルールが異なります:
モデル呼び出しの料金は、以下の式で計算されます:入力トークン使用量 × 入力単位価格 + 出力トークン使用量 × 出力単位価格 例:中国 (杭州) リージョンで `ai_query()` を 10,000 回呼び出した場合、各呼び出しの入力トークン数が 260、出力トークン数が 50 であるとき、料金は以下のとおりです: 説明 トークン使用量の概算方法については、「課金対象項目および課金方法」の「モデル呼び出し」セクションをご参照ください。 |
課金サイクル | 料金は、UTC + 08:00 毎時(毎正時)に計算されます。各計算後に新しい課金サイクルが開始します。各課金サイクル終了時に、システムが請求書を生成し、ご利用アカウントから料金を自動的に差し引きます。実際のリソース消費と請求書に反映されるデータの間に遅延が生じる場合があります。詳細については、「請求書の使い方」をご参照ください。 |
リージョン別単位価格
qwen-plus
リージョン名 | 1 リクエストあたりの入力トークン範囲 | 入力単位価格(USD / 1,000 トークン) | 出力単位価格(USD / 1,000 トークン) |
| 0 < トークン ≤ 128K | 0.000138 | 0.000344 |
128K < トークン ≤ 256K | 0.000414 | 0.003442 | |
256K < トークン ≤ 1M | 0.000827 | 0.008257 | |
| 0 < トークン ≤ 256K | 0.000480 | 0.001440 |
256K < トークン ≤ 1M | 0.001440 | 0.004320 |
text-embedding-v4
リージョン名 | 入力単位価格(USD / 1,000 トークン) |
| 0.000086 |
| 0.000084 |