モデルトレーニングとデプロイの料金の確認方法 - Alibaba Cloud Model Studio

このトピックでは、Alibaba Cloud Model Studio でのモデルトレーニングとモデルデプロイの課金ルールと料金について説明します。

トレーニングの課金

テキスト生成モデル – Qwen

説明

トレーニングワークフローについては、「」または「Qwen のファインチューニング」をご参照ください。トレーニング完了後、新しいモデルをデプロイしてから評価または呼び出しを行ってください。

方式

トレーニングトークンによる課金

計算式

モデルトレーニング料金 = (トレーニングデータの合計トークン数 + 混合トレーニングデータの合計トークン数) × エポック数 × トレーニング単価 (最小課金単位：1 トークン)

モデルトレーニングコンソールの下部でトレーニング料金の見積もりを確認し、Computing Details をクリックして、トレーニングの合計トークン数、エポック数、トレーニング単価を表示します。

トレーニング単価

以下の表は、事前学習済みモデルのトレーニング単価を示しています。カスタムモデルのトレーニング単価は、対応する事前学習済みモデルの単価と一致します。

Qwen

サービス	コード	料金
Qwen3-32B	qwen3-32b	$0.008/1,000 トークン
Qwen3-14B	qwen3-14b	$0.0016/1,000 トークン

Qwen-VL

サービス	コード	料金
Qwen3-VL-8B-Instruct	qwen3-vl-8b-instruct	$0.002/1,000 トークン
Qwen3-VL-8B-Thinking	qwen3-vl-8b-thinking	$0.002/1,000 トークン

画像生成モデル – Wan

説明

トレーニングワークフローについては、「画像生成モデルのファインチューニング」をご参照ください。トレーニング完了後、新しいモデルをデプロイしてから呼び出してください。

方式	トレーニングトークンによる課金
計算式	モデルトレーニング料金 = 合計トレーニングトークン数 × トレーニング単価 (課金単位：1,000 トークンごと)

合計トレーニングトークン数の計算式

$T r ainin g T o k e n s T o t a l \approx ma x_s t e p s \times L_{s t e p}$

ここで：

max_steps：トレーニング中に指定されるハイパーパラメーターで、最大トレーニングステップ数を表します (ファインチューニングジョブの作成時に構成)。
L_step：ステップごとのトークン消費量です。計算式は次のとおりです：

$L_{s t e p} = i \in ba t c h \sum L_{i t e m}^{(i)} \leq L_{ma x}$

L_step は L_max とほぼ等しくなります。L_max は、以下に示すように max_token_length と generation_type によって決まります：

generation_type	max_token_length	L_max
t2i (Text-to-Image)	1k	12,800
t2i (Text-to-Image)	2k	23,220
i2i (Image-to-Image)	1k	23,220
i2i (Image-to-Image)	2k	32,000

説明

上記の計算式は概算です。実際の課金は、システムから返される usage フィールドに基づきます。

モデル	コード	トレーニング料金 (1K トークンあたり)
Wan 画像生成	wan2.7-image-pro	$0.015
Wan 画像生成	wan2.7-image	$0.015

課金例

wan2.7-image-pro モデルを t2i 用にファインチューニングするとします。パラメーターは max_steps = 200、max_token_length = "1k"、トレーニング料金は 1,000 トークンあたり $0.015 です：

表から：L_max = 12,800 (generation_type=t2i, max_token_length=1k)、L_step ≈ L_max = 12,800
合計トレーニングトークン数 ≈ 200 × 12800 = 2560000 = 2560 千トークン
モデルトレーニング料金 ≈ 2560 × 0.015 = $38.4

動画生成モデル – Wan

説明

トレーニングワークフローについては、「動画生成モデルのファインチューニング」をご参照ください。トレーニング完了後、新しいモデルをデプロイしてから呼び出してください。

方式	トレーニングトークンによる課金
計算式	モデルトレーニング料金 = 合計トレーニングトークン数 × トレーニング単価 (課金単位：1,000 トークンごと)

合計トレーニングトークン数の計算式

$T r ainin g T o k e n s T o t a l = (i = 1 \sum N billing duration of video_{i}) \times \frac{ma x _ p i x e l s}{1024} \times n_e p oc h s$

ここで：

N：トレーニングセット内の動画の総数。
max_pixels：トレーニング中に指定されるハイパーパラメーターで、動画の最大ピクセル数を表します (ファインチューニングジョブの作成時に構成)。
n_epochs：トレーニング中に指定されるハイパーパラメーターで、ループ数を表します (ファインチューニングジョブの作成時に構成)。
- n_epochs と steps の変換は次のとおりです：steps = n_epochs × ⌈dataset_size / batch_size⌉、つまり n_epochs = steps / ⌈dataset_size / batch_size⌉。
- データセットにサンプルが 1 つしかなく、batch_size = 1 の場合、n_epochs = steps となります。合計で少なくとも 800 ステップを推奨します。
単一動画の課金期間の計算ルール：まず、元の動画の期間 (秒) を最も近い整数に四捨五入し、次にモデルの制限に基づいて最終的な値を決定します。
- wan2.7 モデル：課金期間=min(10, 四捨五入された期間)、つまり単一の動画は最大 10 秒間課金されます。
- wan2.6 モデル：課金期間=min(10, 四捨五入された期間)、つまり単一の動画は最大 10 秒間課金されます。
- wan2.5 モデル：課金期間=min(10, 四捨五入された期間)、つまり単一の動画は最大 10 秒間課金されます。
- wan2.2 モデル：課金期間=min(5, 四捨五入された期間)、つまり単一の動画は最大 5 秒間課金されます。

モデル	コード	トレーニング料金 (1K トークンあたり)
Image-to-video (初フレーム)	wan2.7-i2v	$0.3
	wan2.6-i2v	$0.08
	wan2.5-i2v-preview	$0.05
	wan2.2-i2v-flash	$0.03
Image-to-video (初フレームと最終フレーム)	wan2.2-kf2v-flash	$0.03

課金例

wan2.7-i2v コスト見積もり (単一データ)

トレーニングセットに 10 秒の動画が 1 つ含まれていると仮定します。batch_size = 1 (推奨) の場合、n_epochs = steps / ⌈1(dataset_size) / 1(batch_size)⌉ = steps となります。

トレーニング単価 = $0.3/千トークン。max_pixels = 36864、n_epochs = 800 を例にとります：

合計トレーニングトークン数 = 10 × (36864 / 1024) × 800 = 288,000 = 288 千トークン
モデルトレーニング料金 = 288 × $0.3 = $86.4

max_pixels	共通のステップ	n_epochs	推定トークン数	推定コスト (USD)
36864	800	800	288,000	$86.4
	1,000	1,000	360,000	$108
	2,000	2,000	720,000	$216
65536	800	800	512,000	$153.6
	1,000	1,000	640,000	$192
	2,000	2,000	1,280,000	$384
102400	800	800	800,000	$240
	1,000	1,000	1,000,000	$300
	2,000	2,000	2,000,000	$600

wan2.7-i2v コスト見積もり (複数データ)

トレーニングセットに 3.4 秒と 11.5 秒の動画が 2 つ含まれていると仮定します。パラメーター：max_pixels = 36864、n_epochs = 800。トレーニング単価 = $0.3/千トークン：

期間の計算：
- 動画 1：3.4 秒は 3 に四捨五入されます。課金期間 = min(10, 3) = 3。
- 動画 2：11.5 秒は 11 に四捨五入されます。課金期間 = min(10, 11) = 10。
- 合計課金期間 = 3 + 10 = 13 秒。
合計トレーニングトークン数 = 13 × (36864/1024) × 800 = 374,400 = 374.4 千トークン。
モデルトレーニング料金 = 374.4 × 0.3 = $112.32。

wan2.5-i2v-preview コスト見積もり (複数データ)

wan2.5 モデルをファインチューニングするとします。トレーニングセットには、3.4 秒と 11.5 秒の 2 つの動画が含まれています。パラメーターは max_pixels = 36864、n_epochs = 400 です。単位トレーニング料金は 1,000 トークンあたり $0.05 です。

期間の計算：
- 動画 1：3.4 秒は 3 に四捨五入されます。課金期間：min(10, 3) = 3 秒。
- 動画 2：11.5 秒は 11 に四捨五入されます。課金期間：min(10, 11) = 10 秒。
- 合計課金期間：3 + 10 = 13 秒。
合計トレーニングトークン数 = 13 × (36864 / 1024) × 400 = 187,200 = 187.2 千トークン。
モデルトレーニング料金 = 187.2 × 0.05 = $9.36。

デプロイの課金

テキスト生成モデル：Qwen

時間ベースの課金 (プロビジョニング済みスループット)

コスト = 使用期間 × (入力 TPM 単価 × 入力 TPM + 出力 TPM 単価 × 出力 TPM)

従量課金方式の場合、使用量は時間単位で課金され、単価は以下の表の時間料金に基づきます。サブスクリプション方式の場合、使用量は日単位で課金され、単価は以下の表の日額料金に基づきます。

サブスクリプションの注文は支払い後すぐに有効になります。N 日間のサブスクリプションは、N 日目の 23:59 まで有効です。注文が 22:00 以降に行われた場合、有効期限は自動的に 1 日延長されます。
サブスクリプションの注文が期限切れになると、2 時間の猶予期間の後にサービスは停止されます。サービス停止後、リソースは 14 時間保持され、その後リリースされます。
サブスクリプションの注文は早期に終了することはできません。
従量課金方式の場合、アカウントに支払い遅延がある場合、デプロイされたリソースは 24 時間保持され、課金が継続されます。この間、サービスは利用可能です。24 時間後、システムは課金を停止し、モデルデプロイは支払い遅延状態になります。基盤となるリソースは削除されますが、モデルデプロイタスクは保持されます。遅延額を支払うと、システムはリソースを再割り当てし、サービスを復元して課金を再開します。料金の発生を停止するには、モデルデプロイタスクを削除する必要があります。タスクが正常に削除されると、課金は停止します。

モデルの入力が最大入力トークンまたは購入した TPM を超えた場合、呼び出しは現在のモデルの従量課金モードに自動的に切り替わります。この場合、推論パフォーマンスが低下し、ワークスペース内の現在のスナップショットモデルのパブリックトラフィック制御の対象となる可能性があります。コストは、モデル呼び出し (従量課金) の基準に基づいて請求されます。

この場合、API 呼び出しは x-dashscope-ptu-overflow:true を含むヘッダーを返します。
TPM 統計を表示するには、モデル監視ページに移動します。

スケールインシナリオ (スペックダウン) の具体的な返金ルールについては、「スペックダウンの返金ルール」をご参照ください。

シンガポール

Qwen

モデル名	モデルコード	最大入力トークン	従量課金入力 10k TPM/時間あたり	従量課金出力 1k TPM/時間あたり	サブスクリプション入力 10k TPM/日あたり	サブスクリプション出力 1k TPM/日あたり
Qwen3.7-Max-2026-05-20	qwen3.7-max-2026-05-20	256K	$6	$1.8	$72	$21.6
Qwen3.7-Plus-2026-05-26	qwen3.7-plus-2026-05-26	256K	$0.96	$0.384	$11.52	$4.608

Qwen3.6-Plus-2026-04-02	qwen3.6-plus-2026-04-02	128K	$1.2	$0.72	$14.4	$8.64

Qwen3.5-Plus-2026-04-20	qwen3.5-plus-2026-04-20	128K	$0.96	$0.576	$11.52	$6.912

DeepSeek

モデル名	モデルコード	最大入力トークン	従量課金入力 10k TPM/時間あたり	従量課金出力 1k TPM/時間あたり	サブスクリプション入力 10k TPM/日あたり	サブスクリプション出力 1k TPM/日あたり
DeepSeek-v4-Flash	deepseek-v4-flash	256K	$0.72	$0.144	$8.64	$1.728
DeepSeek-v4-Pro	deepseek-v4-pro	256K	$8.64	$1.728	$103.68	$20.736
DeepSeek-v3.2	deepseek-v3.2	64K	$2.05	$0.616	$24.62	$7.387

Qwen-VL

モデル名

モデルコード

最大入力トークン

従量課金入力

10k TPM/時間あたり

従量課金出力

1k TPM/時間あたり

サブスクリプション入力

10k TPM/日あたり

サブスクリプション出力

1k TPM/日あたり

Qwen3-VL-Plus-2025-09-23

qwen3-vl-plus-2025-09-23

128K

$0.48

$0.384

$5.76

$4.608

その他のモデル

モデル名

モデルコード

最大入力トークン

従量課金入力

10k TPM/時間あたり

従量課金出力

1k TPM/時間あたり

サブスクリプション入力

10k TPM/日あたり

サブスクリプション出力

1k TPM/日あたり

GLM-5.1

glm-5.1

64K

$5.04

$1.584

$64.8

$19.008

中国 (北京)

Qwen

モデル名	モデルコード	最大入力トークン	従量課金入力 10k TPM/時間あたり	従量課金出力 1k TPM/時間あたり	サブスクリプション入力 10k TPM/日あたり	サブスクリプション出力 1k TPM/日あたり
Qwen3.7-Max-2026-05-20	qwen3.7-max-2026-05-20	256K	$3.96	$1.188	$47.53	$14.258
Qwen3.7-Plus-2026-05-26	qwen3.7-plus-2026-05-26	256K	$0.66	$0.264	$7.92	$3.168

Qwen3.6-Plus-2026-04-02	qwen3.6-plus-2026-04-02	128K	$0.67	$0.397	$7.93	$4.753

Qwen3.5-Plus-2026-04-20	qwen3.5-plus-2026-04-20	128K	$0.26	$0.16	$3.17	$1.9

Qwen3-Max-2025-09-23	qwen3-max-2025-09-23	128K	$1.11	$0.45	$13.32	$5.4

Qwen-Flash-2025-07-28	qwen-flash-2025-07-28	128K	$0.06	$0.06	$0.72	$0.72
Qwen-Plus-2025-12-01	qwen-plus-2025-12-01	128K	$0.28	ノンシンキングモード：$0.07 思考モード：$0.28	$3.36	ノンシンキングモード：$0.84 思考モード：$3.36

DeepSeek

モデル名	モデルコード	最大入力トークン	従量課金入力 10k TPM/時間あたり	従量課金出力 1k TPM/時間あたり	サブスクリプション入力 10k TPM/日あたり	サブスクリプション出力 1k TPM/日あたり
DeepSeek-v4-Flash	deepseek-v4-flash	256K	$0.5	$0.099	$5.94	$1.188
DeepSeek-v4-Pro	deepseek-v4-pro	256K	$5.94	$1.188	$71.3	$14.26
DeepSeek-v3.2	deepseek-v3.2	64K	$1.04	$0.16	$12.48	$1.92
DeepSeek-v3	deepseek-v3	64K	$0.99	$0.396	$11.9	$4.75

Qwen-VL

モデル名

モデルコード

最大入力トークン

従量課金入力

10k TPM/時間あたり

従量課金出力

1k TPM/時間あたり

サブスクリプション入力

10k TPM/日あたり

サブスクリプション出力

1k TPM/日あたり

Qwen3-VL-Plus-2025-09-23

qwen3-vl-plus-2025-09-23

128K

$0.35

$4.2

その他のモデル

モデル名

モデルコード

最大入力トークン

従量課金入力

10k TPM/時間あたり

従量課金出力

1k TPM/時間あたり

サブスクリプション入力

10k TPM/日あたり

サブスクリプション出力

1k TPM/日あたり

GLM-5.1

glm-5.1

64K

$2.97

$1.19

$35.65

$14.26

時間ベースの課金 (モデルユニット)

コスト = 使用期間 (時間) × モデルユニット数 × モデルユニット価格

従量課金方式の場合、「モデルユニット価格」は以下の表の「時間料金」です。月額サブスクリプション方式の場合、計算式は次のとおりです：月数 × モデルユニット数 × 月額料金。

サブスクリプションの場合、最初の 1 か月以内に登録を解除すると、日割り単価 (≈ 月額単価 / 30) が標準料金の 1.2 倍で請求されます。1 日未満の使用は 1 日として請求されます。

説明

モデルユニットの従量課金方式では、コンピューティング能力リソースは先着順で割り当てられます。購入に失敗した場合は全額返金されます。

シンガポール

テキスト生成

モデル名	モデルコード	モデルユニット仕様	時間料金 ($) 最小課金単位：分	月額料金 ($) 最小課金単位：日
Qwen3.6-Plus-2026-04-02	qwen3.6-plus-2026-04-02	MU1 x 8	$88	$41,832

Qwen3.5-39B-A17B	qwen3.5-397b-a17b	MU2 x 8	$112	$52,392
Qwen3.5-35B-A3B	qwen3.5-35b-a3b	MU2 x 8	$112	$52,392

Qwen3-32B	qwen3-32b	MU1 x 4	$44	$20,916
Qwen3-32B	qwen3-32b	MU2 x 8	$112	$52,392
Qwen3-14B	qwen3-14b	MU1 x 4	$44	$20,916

GLM-5.1	glm-5.1	MU2 x 8	$112	$52,392

DeepSeek-V4-Flash	deepseek-v4-flash	MU1 x 8	$88	$41,832

マルチモーダル

モデル名

モデルコード

モデルユニット仕様

時間料金 ($)

最小課金単位：分

月額料金 ($)

最小課金単位：日

Qwen3-VL-32B-Instruct

qwen3-vl-32b-instruct

MU2 x 8

$112

$52,392

Qwen3-VL-8B-Instruct

qwen3-vl-8b-instruct

MU1 x 2

$22

$10,458

モデルタイプ：

Instruct - デプロイされたモデルはノンシンキングモードで推論を実行します。

中国 (北京)

テキスト生成

Qwen

モデル名	モデルコード	モデルユニット仕様	時間料金 ($) 最小課金単位：分	月額料金 ($) 最小課金単位：日
Qwen3.7-Plus-2026-05-26	qwen3.7-plus-2026-05-26	MU3 x 8	$150.72	$72,577.152

Qwen3.6-35B-A3B	qwen3.6-35b-a3b	MU8 x 1	$6.464	$3,080.477
Qwen3.6-35B-A3B	qwen3.6-35b-a3b	MU9 x 1	$7.014	$3,383.024
Qwen3.6-27B	qwen3.6-27b	MU9 x 1	$7.014	$3,383.024
Qwen3.6-Flash-2026-04-16	qwen3.6-flash-2026-04-16	MU1 x 2	$14.852	$7,183.564
Qwen3.6-Plus-2026-04-02	qwen3.6-plus-2026-04-02	MU1 x 8	$59.408	$28,734.256

Qwen3.5-397B-A17B	qwen3.5-397b-a17b	MU2 x 8	$69.312	$33,044.72
		MU3 x 8	$150.72	$72,577.152
		MU6 x 16	$55.008	$26,599.92
Qwen3.5-122B-A10B	qwen3.5-122b-a10b	MU1 x 4	$29.704	$14,367.128
		MU2 x 8	$69.312	$33,044.72
		MU6 x 16	$55.008	$26,599.92
		MU9 x 2	$14.028	$6,766.048
Qwen3.5-35B-A3B	qwen3.5-35b-a3b	MU1 x 2	$14.852	$7,183.564
		MU2 x 8	$69.312	$33,044.72
		MU8 x 1	$6.464	$3,080.477
		MU9 x 1	$7.014	$3,383.024
Qwen3.5-27B	qwen3.5-27b	MU9 x 1	$7.014	$3,383.024
Qwen3.5-9B	qwen3.5-9b	MU8 x 1	$6.464	$3,080.477
Qwen3.5-9B	qwen3.5-9b	MU9 x 1	$7.014	$3,383.024
Qwen3.5-Flash-2026-02-23	qwen3.5-flash-2026-02-23	MU1 x 2	$14.852	$7,183.564
Qwen3.5-Plus-2026-02-15	qwen3.5-plus-2026-02-15	MU1 x 8	$59.408	$28,734.256
Qwen3.5-Plus-2026-02-15	qwen3.5-plus-2026-02-15	MU3 x 8	$150.72	$72,577.152

Qwen3-235B-A22B-Instruct	qwen3-235b-a22b-instruct-2507	MU1 x 4	$29.704	$14,367.128
Qwen3-235B-A22B-Instruct	qwen3-235b-a22b-instruct-2507	MU2 x 8	$69.312	$33,044.72
Qwen3-Next-80B-A3B-Instruct	qwen3-next-80b-a3b-instruct	MU1 x 2	$14.852	$7,183.564
Qwen3-32B	qwen3-32b	MU1 x 4	$29.704	$14,367.128
Qwen3-32B	qwen3-32b	MU6 x 4	$13.752	$6,649.98
Qwen3-30B-A3B	qwen3-30b-a3b	MU9 x 2	$14.028	$6,766.048
Qwen3-30B-A3B-Instruct-2507	qwen3-30b-a3b-instruct-2507	MU1 x 4	$29.704	$14,367.128
Qwen3-30B-A3B-Instruct-2507	qwen3-30b-a3b-instruct-2507	MU2 x 8	$69.312	$33,044.72
Qwen3-8B	qwen3-8b	MU1 x 2	$14.852	$7,183.564
		MU2 x 2	$17.328	$8,261.18
		MU5 x 1	$2.888	$1,394.329
Qwen3-4B	qwen3-4b	MU1 x 2	$14.852	$7,183.564
Qwen3-4B	qwen3-4b	MU5 x 1	$2.888	$1,394.329
Qwen3-1.7B	qwen3-1.7b	MU1 x 2	$14.852	$7,183.564
Qwen3-1.7B	qwen3-1.7b	MU5 x 1	$2.888	$1,394.329
Qwen3-Max-2025-09-23	qwen3-max-2025-09-23	MU2 x 8	$69.312	$33,044.72
Qwen3-Max-2025-09-23	qwen3-max-2025-09-23	MU3 x 8	$150.72	$72,577.152

Qwen2.5-72B	qwen2.5-72b-instruct	MU1 x 4	$29.704	$14,367.128
Qwen2.5-32B	qwen2.5-32b-instruct	MU1 x 4	$29.704	$14,367.128
Qwen2.5-14B	qwen2.5-14b-instruct	MU1 x 2	$14.852	$7,183.564
Qwen2.5-7B	qwen2.5-7b-instruct	MU1 x 2	$14.852	$7,183.564
Qwen2.5-7B	qwen2.5-7b-instruct	MU5 x 1	$2.888	$1,394.329
Qwen2.5-3B-Instruct	qwen2.5-3b-instruct	MU5 x 1	$2.888	$1,394.329

Qwen-Flash-2025-07-28	qwen-flash-2025-07-28	MU1 x 4	$29.704	$14,367.128
Qwen-Plus-2025-07-28	qwen-plus-2025-07-28	MU1 x 4	$29.704	$14,367.128
Qwen-Plus-2025-12-01	qwen-plus-2025-12-01	MU1 x 4	$29.704	$14,367.128

GLM

モデル名	モデルコード	モデルユニット仕様	時間料金 ($) 最小課金単位：分	月額料金 ($) 最小課金単位：日
GLM-5.1	glm-5.1	MU2 x 8	$69.312	$33,044.72
		MU3 x 8	$150.72	$72,577.152
		MU6 x 16	$55.008	$26,599.92
GLM-5	glm-5	MU3 x 8	$150.72	$72,577.152
GLM-4.7	glm-4.7	MU6 x 16	$55.008	$26,599.92

DeepSeek

モデル名

モデルコード

モデルユニット仕様

時間料金 ($)

最小課金単位：分

月額料金 ($)

最小課金単位：日

DeepSeek-V4-Flash

deepseek-v4-flash

MU1 x 8

$59.408

$28,734.256

DeepSeek-V3.2

deepseek-v3.2

MU2 x 8

$69.312

$33,044.72

その他のモデル

モデル名	モデルコード	モデルユニット仕様	時間料金 ($) 最小課金単位：分	月額料金 ($) 最小課金単位：日
MiniMax-M2.5	MiniMax-M2.5	MU1 x 8	$59.408	$28,734.256

Kimi-K2.5	kimi-k2.5	MU2 x 8	$69.312	$33,044.72

マルチモーダル

Qwen-VL

モデル名	モデルコード	モデルユニット仕様	時間料金 ($) 最小課金単位：分	月額料金 ($) 最小課金単位：日
Qwen3-VL-235B-A22B-Instruct	qwen3-vl-235b-a22b-instruct	MU1 x 4	$29.704	$14,367.128
Qwen3-VL-235B-A22B-Thinking	qwen3-vl-235b-a22b-thinking	MU1 x 4	$29.704	$14,367.128
Qwen3-VL-32B-Instruct	qwen3-vl-32b-instruct	MU2 x 8	$69.312	$33,044.72
Qwen3-VL-8B-Instruct	qwen3-vl-8b-instruct	MU1 x 2	$14.852	$7,183.564
Qwen3-VL-Flash-2025-10-15	qwen3-vl-flash-2025-10-15	MU1 x 4	$29.704	$14,367.128
Qwen3-VL-Plus-2025-09-23	qwen3-vl-plus-2025-09-23	MU1 x 4	$29.704	$14,367.128

Qwen-VL-Max-2025-08-13	qwen-vl-max-2025-08-13	MU6 x 4	$13.752	$6,649.98
Qwen-VL-OCR-2025-11-20	qwen-vl-ocr-2025-11-20	MU6 x 4	$13.752	$6,649.98

Qwen Omni

モデル名	モデルコード	モデルユニット仕様	時間料金 ($) 最小課金単位：分	月額料金 ($) 最小課金単位：日
Qwen3.5-Omni-Flash	qwen3.5-omni-flash	MU8 x 1	$6.464	$3,080.477
Qwen3.5-Omni-Flash	qwen3.5-omni-flash	MU9 x 1	$7.014	$3,383.024
Qwen3.5-Omni-Plus	qwen3.5-omni-plus	MU9 x 8	$56.112	$27,064.192

モデルタイプ：

Instruct - デプロイされたモデルはノンシンキングモードで推論を実行します。
Thinking - デプロイされたモデルは思考モードで推論を実行します。

モデル別トークン使用量

コスト = 入力トークン数 × 入力単価 + 出力トークン数 × 出力単価 (最小課金単位：1 トークン)

モデルトークン使用量による課金は、以下の基盤モデルに対して教師ありファインチューニング (SFT) を完了し、カスタムモデルを取得した後にのみサポートされます。

シンガポール

基盤モデル

モデルコード

入力

$/1k トークン

出力

$/1k トークン

Qwen3-14B

qwen3-14b

$0.00035

ノンシンキングモード：$0.0014

思考モード：$0.0042

画像生成モデル – Wan

デプロイは無料です。呼び出しは、ファインチューニングされたベースモデルの標準料金で課金されます。トレーニングワークフローについては、「画像生成モデルのファインチューニング」をご参照ください。

モデル ID	LoRA デプロイと呼び出し料金
wan2.7-image-pro	$0.075/画像
wan2.7-image	$0.03/画像

よくある質問

Q：モデルデプロイの課金はいつ開始されますか？

A：モデルのステータスが実行中に変わると課金が開始されます。デプロイ中、支払い遅延、またはデプロイ失敗の間は料金は発生しません。

Q：トレーニングジョブをキャンセルした場合、料金は発生しますか？

A：はい。手動でトレーニングをキャンセルした場合、キャンセル前に処理されたすべてのトークンに対して課金されます。システムエラーやその他のユーザー起因でない原因で中断されたトレーニングジョブは課金されません。

Q：デプロイされたモデルの呼び出し統計を表示するにはどうすればよいですか？

A：モデル監視 (シンガポール)、モデル監視 (バージニア)、またはモデル監視 (北京)ページにアクセスしてください。