すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:モデルのトレーニングおよびデプロイの課金

最終更新日:Mar 19, 2026

本トピックでは、Alibaba Cloud Model Studio におけるモデルトレーニングおよびモデルデプロイの課金ルールと料金について説明します。

トレーニング課金

テキスト生成モデル — Qwen

説明

トレーニングワークフローについては、「」および「Qwen モデルファインチューニング」をご参照ください。トレーニングが完了したら、評価または呼び出しを行う前に、新しいモデルをデプロイしてください。

方法

トレーニングトークン数で課金

計算式

モデルトレーニング料金 = (トレーニングデータ内のトークン総数 + 混合トレーニングデータ内のトークン総数)× エポック数 × トレーニング単位価格(最小課金単位:1 トークン)

モデルトレーニングコンソールの下部に推定トレーニング料金が表示されます。Computing Details をクリックすると、トレーニングトークン総数、エポック数、およびトレーニング単位価格を確認できます。

トレーニング単位価格

以下の表は、事前学習済みモデルのトレーニング単位価格を示しています。カスタムモデルのトレーニング単位価格は、対応する事前学習済みモデルと同一です。

Qwen

サービス

コード

料金

Qwen3-32B

qwen3-32b

1,000 トークンあたり $0.008

Qwen3-14B

qwen3-14b

1,000 トークンあたり $0.0016

Qwen-VL

サービス

コード

料金

Qwen3-VL-8B-Instruct

qwen3-vl-8b-instruct

1,000 トークンあたり $0.002

Qwen3-VL-8B-Thinking

qwen3-vl-8b-thinking

1,000 トークンあたり $0.002

動画生成モデル — Wan

説明

トレーニングワークフローについては、「モデルファインチューニング」をご参照ください。トレーニングが完了したら、呼び出しを行う前に、新しいモデルをデプロイしてください。

方法

トレーニングトークン数で課金

計算式

モデルトレーニング料金 = トレーニングトークン総数 × トレーニング単位価格(課金単位:1,000 トークンごと)

トレーニングトークン総数の計算式

以下に示すとおり:

  • N:トレーニングセット内の動画の総数

  • max_pixels:トレーニング時に指定されるハイパーパラメーターであり、動画の最大ピクセル数を表します(ファインチューニングジョブ作成時に設定)

  • n_epochs:トレーニング時に指定されるハイパーパラメーターであり、ループ回数を表します(ファインチューニングジョブ作成時に設定)

  • 単一動画の課金持続時間算出規則:まず、元の動画持続時間(秒単位)を最も近い整数に四捨五入し、その後、モデルの制限に基づいて最終値を決定します。

    • wan2.6 モデル:課金持続時間 = min(10, 四捨五入後の持続時間)(単一動画の課金上限は 10 秒)

    • wan2.5 モデル:課金持続時間 = min(10, 四捨五入後の持続時間)(単一動画の課金上限は 10 秒)

    • wan2.2 モデル:課金持続時間 = min(5, 四捨五入後の持続時間)(単一動画の課金上限は 5 秒)

モデル

コード

トレーニング料金(1,000 トークンあたり)

イメージから動画へ(最初のフレーム)

wan2.6-i2v

$0.08

wan2.5-i2v-preview

$0.05

wan2.2-i2v-flash

$0.03

イメージから動画へ(最初と最後のフレーム)

wan2.2-kf2v-flash

$0.03

課金例

wan2.5 モデルのファインチューニングを行います。トレーニングセットには 3.4 秒および 11.5 秒の動画が 2 本含まれています。パラメーターは max_pixels = 36864、n_epochs = 400、トレーニング単位価格は 1,000 トークンあたり $0.05 です。

  • 持続時間の計算:

    • 動画 1:3.4 秒 → 四捨五入して 3 秒。課金対象持続時間 = min(10, 3) = 3 秒

    • 動画 2:11.5 秒 → 四捨五入して 11 秒。課金対象持続時間 = min(10, 11) = 10 秒

    • 課金対象持続時間の合計 = 3 + 10 = 13 秒

  • トレーニングトークン総数 = 13 × (36864 / 1024) × 400 = 187,200(187.2 千トークン)

  • モデルトレーニング料金 = 187.2 × 0.05 = $9.36

デプロイメント課金

テキスト生成モデル:Qwen

使用持続時間による課金(PTU)

料金 = 使用持続時間 × (入力トークン毎分(TPM)単位価格 × 入力 TPM + 出力 TPM 単位価格 × 出力 TPM)

  • サブスクリプション注文は即時有効となり、N 日の 23:59 に有効期限が切れます(22:00 以降に注文した場合は N+1 日まで延長されます)。

  • サブスクリプション注文の有効期限が切れた後、2 時間の猶予期間を経てサービスが停止します。リソースは 14 時間保持された後、解放されます。

  • サブスクリプション注文は途中解約できません。

  • 従量課金の場合、アカウントに支払い遅延があると、デプロイされたリソースは引き続きアクティブな状態で 24 時間課金され、その後自動的に解放されます。

入力が最大トークン制限または購入済み TPM クォータを超えると、呼び出しは自動的に従量課金に切り替わります。パフォーマンスが低下し、ワークスペースのレート制限が適用され、料金は標準の従量課金料金に準拠します。

  • この場合、API のレスポンスヘッダーには x-dashscope-ptu-overflow:true が含まれます。

  • TPM 統計情報の確認先:モニタリング(北京)

モデル

タイプ

コンテキストウィンドウ

(入力+出力トークン)

最大入力トークン数

従量課金 - 時間単位

サブスクリプション - 日単位

入力(10,000 TPM あたり)

出力(1,000 TPM あたり)

入力(10,000 TPM あたり)

出力(1,000 TPM あたり)

Qwen3-Max-2025-09-23

Instruct

128,000

128,000

$1.11

$0.45

$13.32

$5.40

Qwen-Plus-2025-12-01

Instruct

$0.28

$0.07

$3.36

$0.84

Thinking

$0.28

$3.36

Qwen-Flash-2025-07-28

Instruct/Thinking

$0.06

$0.06

$0.72

$0.72

Qwen3-VL-Plus-2025-09-23

Instruct/Thinking

$0.35

$0.35

$4.20

$4.20

DeepSeek-v3.2

Instruct/Thinking

64,000

$1.04

$0.16

$12.48

$1.92

モデルタイプ:

  • Instruct:デプロイ後にノンシンキングモードで実行されます。

  • Thinking:デプロイ後に思考モードで実行されます。

よくある質問

Q: モデルデプロイの課金はいつから始まりますか?

A: モデルのステータスが実行中に変更された時点で課金が開始されます。デプロイ中支払い遅延、またはデプロイ失敗の状態では課金されません。

Q: トレーニングジョブをキャンセルした場合も課金されますか?

A: はい。手動でトレーニングをキャンセルした場合、キャンセル前に処理されたすべてのトークンに対して課金されます。システムエラーやその他のユーザー以外の原因で中断されたトレーニングジョブについては課金されません。

Q: デプロイ済みモデルの呼び出し統計情報をどのように確認できますか?

A: モデルモニタリング(シンガポール)モデルモニタリング(バージニア)、またはモデルモニタリング(北京)ページをご覧ください。