主力モデル
国際
国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンにあります。推論コンピューティングリソースは、中国本土を除き、全世界で動的にスケジュールされます。
Qwen3.5-Plus は、テキスト、画像、動画の入力をサポートしています。そのテキストパフォーマンスは Qwen3-Max に匹敵しますが、より高速でコスト効率に優れています。また、そのマルチモーダル機能は Qwen3-VL シリーズを大幅に上回ります。
主力モデル |
複雑なタスクに最適、最も高性能 |
パフォーマンス、速度、コストのバランスが取れたモデル |
単純なタスクに最適、高速かつコスト効率が高い |
最大コンテキストウィンドウ (トークン) | 262,144 | 1,000,000 | 1,000,000 |
最小入力価格 (100 万トークンあたり) | $1.2 | $0.4 | $0.1 |
最小出力価格 (100 万トークンあたり) | $6 | $2.4 | $0.4 |
グローバル
グローバルデプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンにあります。推論コンピューティングリソースは全世界で動的にスケジュールされます。
Qwen3.5-Plus は、テキスト、画像、動画の入力をサポートしています。そのテキストパフォーマンスは Qwen3-Max に匹敵しますが、より高速でコスト効率に優れています。また、そのマルチモーダル機能は Qwen3-VL シリーズを大幅に上回ります。
主力モデル |
複雑なタスクに最適、最も高性能 |
パフォーマンス、速度、コストのバランスが取れたモデル |
単純なタスクに最適、高速かつコスト効率が高い |
最大コンテキストウィンドウ (トークン) | 262,144 | 1,000,000 | 1,000,000 |
最小入力価格 (100 万トークンあたり) | $0.359 | $0.115 | $0.029 |
最小出力価格 (100 万トークンあたり) | $1.434 | $0.688 | $0.287 |
米国
米国デプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンにあります。推論コンピューティングリソースは米国内に限定されます。
主力モデル |
パフォーマンス、速度、コストのバランスが取れたモデル |
単純なタスクに最適、高速かつコスト効率が高い |
最大コンテキストウィンドウ (トークン) | 1,000,000 | 1,000,000 |
最小入力価格 (100 万トークンあたり) | $0.4 | $0.05 |
最小出力価格 (100 万トークンあたり) | $1.2 | $0.4 |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンにあります。推論コンピューティングリソースは中国本土に限定されます。
Qwen3.5-Plus は、テキスト、画像、動画の入力をサポートしています。そのテキストパフォーマンスは Qwen3-Max に匹敵しますが、より高速でコスト効率に優れています。また、そのマルチモーダル機能は Qwen3-VL シリーズを大幅に上回ります。
主力モデル |
複雑なタスクに最適、最も高性能 |
パフォーマンス、速度、コストのバランスが取れたモデル |
単純なタスクに最適、高速かつコスト効率が高い |
最大コンテキストウィンドウ (トークン) | 262,144 | 1,000,000 | 1,000,000 |
最小入力価格 (100 万トークンあたり) | $0.359 | $0.115 | $0.029 |
最小出力価格 (100 万トークンあたり) | $1.434 | $0.688 | $0.287 |
モデル概要
国際
国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンにあり、モデル推論の計算リソースは中国本土を除く全世界で動的にスケジュールされます。
カテゴリ | サブカテゴリ | 説明 |
テキスト生成 | Qwen 大規模言語モデル: | |
視覚理解モデル (Qwen-Plus、Qwen-VL、QVQ)、オムニモーダルモデル Qwen-Omni、およびリアルタイムマルチモーダルモデル Qwen-Omni-Realtime | ||
画像生成 |
| |
音声合成と認識 | Qwen 音声合成 と Qwen リアルタイム音声合成 は、音声合成を可能にし、インテリジェント音声カスタマーサービス、オーディオブック、車載ナビゲーション、教育指導などのシナリオに適しています。 | |
Qwen リアルタイム ASR、Qwen 音声ファイル ASR、Qwen3-LiveTranslate-Flash-Realtime、および Fun-ASR は、音声テキスト変換を可能にし、リアルタイム会議の文字起こし、リアルタイムライブストリーミングキャプション、電話カスタマーサービスなどのシナリオに適しています。 | ||
動画生成 | 1 文から動画を生成し、豊かなスタイルと精細な画質を特徴とします。 | |
| ||
リファレンス動画: 入力動画または画像のキャラクターの外見、入力動画の声、およびテキストプロンプトを参照して、パフォーマンス動画を生成します。 | ||
一般動画編集: 入力されたテキスト、画像、動画に基づいて、さまざまな動画編集タスクを実行できます。たとえば、入力動画からモーション特徴量を抽出し、プロンプトを使用して新しい動画を生成します。 | ||
埋め込み | テキストをテキストを表す数値のセットに変換し、検索、クラスタリング、推奨、分類タスクに適しています。 |
グローバル
グローバルデプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンにあり、モデル推論の計算リソースは全世界で動的にスケジュールされます。
カテゴリ | サブカテゴリ | 説明 |
テキスト生成 | Qwen 大規模言語モデル:
| |
視覚理解モデル Qwen-VL | ||
画像生成 |
| |
動画生成 | 1 文から動画を生成し、豊かなスタイルと精細な画質を特徴とします。 | |
Image-to-Video – 最初のフレーム: 入力画像を最初のフレームとして使用し、プロンプトに基づいて動画を生成します。 | ||
リファレンス動画: 入力動画または画像のキャラクターの外見、入力動画の声、およびテキストプロンプトを参照して、パフォーマンス動画を生成します。 |
米国
米国デプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンにあり、モデル推論の計算リソースは米国内に限定されます。
カテゴリ | サブカテゴリ | 説明 |
テキスト生成 | Qwen 大規模言語モデル: 商用 (Qwen-Plus、Qwen-Flash) | |
視覚理解モデル Qwen-VL | ||
動画生成 | 1 文から動画を生成し、豊かなスタイルと精細な画質を特徴とします。 | |
最初のフレームから動画へ: 入力画像を最初のフレームとして使用し、プロンプトに基づいて動画を生成します。 | ||
音声認識 | Qwen 音声ファイル認識 は、音声テキスト変換を可能にし、会議の議事録やライブキャプションなどのシナリオに適しています。 |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンにあり、モデル推論の計算リソースは中国本土に限定されます。
カテゴリ | サブカテゴリ | 説明 |
テキスト生成 | ||
画像生成 |
| |
汎用モデル:
その他のモデル: Qwen 画像翻訳、OutfitAnyone | ||
音声合成と認識 | Qwen 音声合成、Qwen リアルタイム音声合成、および CosyVoice 音声合成 は、音声テキスト変換をサポートし、インテリジェント音声カスタマーサービス、オーディオブック、車載ナビゲーション、教育指導などのシナリオに適しています。 | |
Qwen リアルタイム音声認識、Qwen 音声ファイル文字起こし、Fun-ASR 音声認識、および Paraformer 音声認識 は、音声をテキストに変換し、リアルタイム会議の文字起こし、リアルタイムライブストリーミングキャプション、コールセンターサービスなどのシナリオに適しています。 | ||
動画編集と生成 | 1 文から動画を生成し、豊かなスタイルと精細な画質を特徴とします。 | |
| ||
リファレンス動画: 入力動画または画像のキャラクターの外見、入力動画の声、およびテキストプロンプトを参照して、パフォーマンス動画を生成します。 | ||
| ||
埋め込み | テキストをテキストを表す数値のセットに変換し、検索、クラスタリング、推奨、分類などに使用します。 | |
テキスト、画像、音声を数値のセットに変換し、音声/動画分類、画像分類、画像テキスト検索などに使用します。 |
テキスト生成 – Qwen
このセクションでは、Qwen モデルの商用版について説明します。オープンソース版と比較して、商用モデルは最新の機能と改善点を提供します。
商用モデルのパラメーター数は非公開です。
モデルは定期的に更新されます。固定バージョンを使用するには、スナップショット版を選択してください。スナップショット版は、次期スナップショット版がリリースされてから 1 か月間、通常はメンテナンスされます。
安定版または最新版の使用を推奨します。これらのバージョンは、レート制限の条件がより緩和されています。
Qwen-Max
Qwen シリーズで最も強力なモデルであり、複雑で多段階のタスクに最適です。利用方法 | 思考モード | API リファレンス | オンラインで試す
国際
「国際デプロイモード」では、エンドポイントおよびデータストレージはいずれも シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力トークン数 |
入力コスト |
出力コスト CoT + 出力 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||||
|
qwen3-max 現在のバージョン:qwen3-max-2026-01-23 Qwen3 シリーズに属します 組み込みツールの呼び出し |
Stable |
思考モード |
262,144 |
258,048 |
81,920 |
32,768 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
各モデル 100 万トークン Model Studio の有効化後 90 日間有効 |
|
|
非思考 |
- |
65,536 |
|||||||
|
qwen3-max-2026-01-23 思考モード(別名:Qwen3-Max-Thinking Qwen3 シリーズに属します 組み込みツールの呼び出し |
Snapshot |
思考モード |
81,920 |
32,768 |
|||||
|
非思考 |
- |
65,536 |
|||||||
|
qwen3-max-2025-09-23 Qwen3 シリーズに属します |
Snapshot |
ノンシンキングモードのみ |
|||||||
|
qwen3-max-preview Qwen3 シリーズに属します |
Preview |
思考モード |
81,920 |
32,768 |
|||||
|
ノンシンキングモード |
- |
65,536 |
|||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) qwen3-max および qwen3-max-preview は コンテキストキャッシュ をサポートしています。 |
出力コスト(100 万トークンあたり) |
|
0<トークン≤32K |
$1.2 |
$6 |
|
32K<トークン≤128K |
$2.4 |
$12 |
|
128K<トークン≤252K |
$3 |
$15 |
グローバル
「グローバルデプロイモード」では、エンドポイントおよびデータストレージはいずれも 米国(バージニア)リージョン に配置されます。モデル推論の計算リソースは、世界中で動的にスケジュールされます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力トークン数 |
Max CoT |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||||
|
qwen3-max 現在のバージョン:qwen3-max-2025-09-23 コンテキストキャッシュ の割引が適用可能です |
Stable |
ノンシンキングモードのみ |
262,144 |
258,048 |
- |
65,536 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
なし |
|
|
qwen3-max-2025-09-23 |
Snapshot |
ノンシンキングのみ |
|||||||
|
qwen3-max-preview コンテキストキャッシュ の割引が適用可能です |
Preview |
考え中 |
81,920 |
32,768 |
|||||
|
ノンシンキングモード |
- |
65,536 |
|||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
|
モデル |
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) CoT + 応答 |
|
qwen3-max バッチ呼び出し は半額です コンテキストキャッシュ の割引が適用可能です |
0<トークン≤32K |
$0.359 |
$1.434 |
|
32K<トークン≤128K |
$0.574 |
$2.294 |
|
|
128K<トークン≤252K |
$1.004 |
$4.014 |
|
|
qwen3-max-2026-01-23 |
0<トークン≤32K |
$0.359 |
$1.434 |
|
32K<トークン≤128K |
$0.574 |
$2.294 |
|
|
128K<トークン≤252K |
$1.004 |
$4.014 |
|
|
qwen3-max-2025-09-23 |
0<トークン≤32K |
$0.861 |
$3.441 |
|
32K<トークン≤128K |
$1.434 |
$5.735 |
|
|
128K<トークン≤252K |
$2.151 |
$8.602 |
|
|
qwen3-max-preview コンテキストキャッシュ の割引が適用可能です |
0<トークン≤32K |
$0.861 |
$3.441 |
|
32K<トークン≤128K |
$1.434 |
$5.735 |
|
|
128K<トークン≤252K |
$2.151 |
$8.602 |
中国本土
「中国本土デプロイモード」では、エンドポイントおよびデータストレージはいずれも 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力トークン数 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwen3-max 現在のバージョン:qwen3-max-2026-01-23 Qwen3 シリーズに属します 組み込みツールの呼び出し |
Stable |
思考モード |
262,144 |
258,048 |
81,920 |
32,768 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
|
|
ノンシンキングモード |
- |
65,536 |
||||||
|
qwen3-max-2026-01-23 思考モード(別名:Qwen3-Max-Thinking Qwen3 シリーズに属します 組み込みツールの呼び出し |
Snapshot |
思考モード |
81,920 |
32,768 |
||||
|
非思考 |
- |
65,536 |
||||||
|
qwen3-max-2025-09-23 Qwen3 シリーズに属します |
Snapshot |
ノンシンキングモードのみ |
||||||
|
qwen3-max-preview Qwen3 シリーズに属します |
Preview |
思考 |
81,920 |
32,768 |
||||
|
ノンシンキングモード |
- |
65,536 |
||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
|
モデル |
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) CoT + 応答 |
|
qwen3-max バッチ呼び出し 半額 コンテキストキャッシュ の割引が適用可能です |
0<トークン≤32K |
$0.359 |
$1.434 |
|
32K<トークン≤128K |
$0.574 |
$2.294 |
|
|
128K<トークン≤252K |
$1.004 |
$4.014 |
|
|
qwen3-max-2026-01-23 |
0<トークン≤32K |
$0.359 |
$1.434 |
|
32K<トークン≤128K |
$0.574 |
$2.294 |
|
|
128K<トークン≤252K |
$1.004 |
$4.014 |
|
|
qwen3-max-2025-09-23 |
0<トークン≤32K |
$0.861 |
$3.441 |
|
32K<トークン≤128K |
$1.434 |
$5.735 |
|
|
128K<トークン≤252K |
$2.151 |
$8.602 |
|
|
qwen3-max-preview コンテキストキャッシュ の割引が適用可能です |
0<トークン≤32K |
$0.861 |
$3.441 |
|
32K<トークン≤128K |
$1.434 |
$5.735 |
|
|
128K<トークン≤252K |
$2.151 |
$8.602 |
中国(香港)
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力トークン数 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||||
|
qwen3-max 現在のバージョン:qwen3-max-2026-01-23 Qwen3 シリーズに属します 組み込みツールの呼び出し |
Stable |
思考中 |
262,144 |
258,048 |
81,920 |
32,768 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
各モデル 100 万トークン Model Studio の有効化後 90 日間有効 |
|
|
ノンシンキングモード |
- |
65,536 |
|||||||
|
qwen3-max-2026-01-23 思考モード(別名:Qwen3-Max-Thinking Qwen3 シリーズに属します 組み込みツールの呼び出し |
Snapshot |
思考モード |
81,920 |
32,768 |
|||||
|
ノンシンキングモード |
- |
65,536 |
|||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) qwen3-max および qwen3-max-preview は コンテキストキャッシュ をサポートしています。 |
出力コスト(100 万トークンあたり) |
|
0<トークン≤32K |
$1.2 |
$6 |
|
32K<トークン≤128K |
$2.4 |
$12 |
|
128K<トークン≤252K |
$3 |
$15 |
qwen3-max-2026-01-23 思考モード:2025 年 9 月 23 日のスナップショットと比較して、思考モードとノンシンキングモードを効果的に統合し、モデル全体のパフォーマンスを大幅に向上させています。思考モードでは、Web 検索、Web 抽出、コードインタープリターの 3 つのツールを統合することで、複雑な問題に対する推論精度を高めています。
qwen3-max、qwen3-max-2026-01-23、および qwen3-max-2025-09-23 モデルは、検索エージェントをネイティブにサポートしています。詳細については、「Web 検索」をご参照ください。
Qwen-Plus
Qwen-Plus は、Qwen-Max と Qwen-Flash の間で推論性能、コスト、および速度のバランスを取ったモデルであり、中程度の複雑さを持つタスクに最適です。
利用方法 | 思考モード | API リファレンス | オンラインで試す
Qwen3.5 Plus は、テキスト、画像、および動画の入力をサポートします。テキスト処理タスクにおいては Qwen3 Max と同等の性能を発揮し、より低いコストで優れたパフォーマンスを実現します。マルチモーダル機能では、Qwen3 VL シリーズと比較して大幅な改善が見られます。
国際
「国際デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
[最大出力] |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||
|
qwen3.5-plus 現在のバージョン:qwen3.5-plus-2026-02-15 デフォルトで思考モードが有効です |
Stable |
1,000,000 |
思考モード 983,616 ノンシンキングモード 991,808 |
65,536 最大 CoT:81,920 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
各モデル 100 万トークン Model Studio の有効化後 90 日間有効 |
|
|
qwen3.5-plus-2026-02-15 デフォルトで思考モードが有効です |
Snapshot |
思考モード 983,616 ノンシンキングモード 991,808 |
65,536 最大 CoT:81,920 |
||||
|
qwen-plus 現在のバージョン:qwen-plus-2025-12-01 Qwen3 シリーズに属します バッチ呼び出し は半額です |
Stable |
思考モード 995,904 ノンシンキングモード 997,952 |
32,768 最大 CoT:81,920 |
||||
|
qwen-plus-latest 現在のバージョン:qwen-plus-2025-12-01 Qwen3 シリーズに属します |
Latest |
思考モード 995,904 ノンシンキングモード 997,952 |
|||||
|
qwen-plus-2025-12-01 Qwen3 シリーズに属します |
Snapshot |
思考モード 995,904 ノンシンキングモード 997,952 |
|||||
|
qwen-plus-2025-09-11 Qwen3 シリーズに属します |
|||||||
|
qwen-plus-2025-07-28 別名:qwen-plus-0728 Qwen3 シリーズに属します |
|||||||
|
qwen-plus-2025-07-14 別名:qwen-plus-0714 Qwen3 シリーズに属します |
131,072 |
思考モード 98,304 ノンシンキングモード 129,024 |
16,384 最大 CoT:38,912 |
$0.4 |
思考モード $4 ノンシンキングモード $1.2 |
||
|
qwen-plus-2025-04-28 別名:qwen-plus-0428 Qwen3 シリーズに属します |
|||||||
|
qwen-plus-2025-01-25 別名:qwen-plus-0125 |
129,024 |
8,192 |
$1.2 |
||||
qwen3.5-plus、qwen3.5-plus-2026-02-15、qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11、および qwen-plus-2025-07-28 は、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
Qwen3.5-Plus
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤256K |
$0.4 |
$2.4 |
|
256K<トークン≤1M |
$0.5 |
$3 |
Qwen-Plus
|
リクエストごとの入力トークン数 |
モード |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤256K |
ノンシンキングモード |
$0.4 |
$1.2 |
|
思考モード |
$4 |
||
|
256K<トークン≤1M |
ノンシンキングモード |
$1.2 |
$3.6 |
|
思考モード |
$12 |
グローバル
「グローバルデプロイモード」では、エンドポイントおよびデータストレージは 米国(バージニア)リージョン に配置されます。推論の計算リソースは、世界中で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen3.5-plus 現在のバージョン:qwen3.5-plus-2026-02-15 デフォルトで思考モードが有効です |
Stable |
1,000,000 |
思考モード 983,616 ノンシンキングモード 991,808 |
65,536 最大 CoT:81,920 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
|
|
qwen3.5-plus-2026-02-15 デフォルトで思考モードが有効です |
Snapshot |
思考モード 983,616 ノンシンキングモード 991,808 |
65,536 最大 CoT:81,920 |
|||
|
qwen-plus 現在のバージョン:qwen-plus-2025-12-01 Qwen3 シリーズに属します |
Stable |
思考モード 995,904 ノンシンキングモード 997,952 |
32,768 最大 CoT:81,920 |
|||
|
qwen-plus-2025-12-01 Qwen3 シリーズに属します |
Snapshot |
思考モード 995,904 ノンシンキングモード 997,952 |
||||
|
qwen-plus-2025-09-11 Qwen3 シリーズに属します |
||||||
|
qwen-plus-2025-07-28 別名:qwen-plus-0728 Qwen3 シリーズに属します |
||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
Qwen3.5-Plus
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤128K |
$0.115 |
$0.688 |
|
128K≤トークン≤256K |
$0.287 |
$1.72 |
|
256K<トークン≤1M |
$0.573 |
$3.44 |
Qwen-Plus
qwen-plus、qwen-plus-2025-12-01、qwen-plus-2025-09-11、qwen-plus-2025-07-28
|
リクエストごとの入力トークン数 |
モード |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤128K |
ノンシンキングモード |
$0.115 |
$0.287 |
|
思考モード |
$1.147 |
||
|
128K<トークン≤256K |
ノンシンキングモード |
$0.345 |
$2.868 |
|
思考モード |
$3.441 |
||
|
256K<トークン≤1M |
ノンシンキングモード |
$0.689 |
$6.881 |
|
思考モード |
$9.175 |
米国
「米国デプロイモード」では、エンドポイントおよびデータストレージは 米国(バージニア)リージョン に配置されます。推論の計算リソースは、米国内に限定されます。
|
モデル |
バージョン |
コンテキスト ウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||
|
qwen-plus-us 現在のバージョン:qwen-plus-2025-12-01-us Qwen3 シリーズに属します |
Stable |
1,000,000 |
思考モード 995,904 ノンシンキングモード 997,952 |
32,768 最大 CoT:81,920 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
なし
|
|
|
qwen-plus-2025-12-01-us Qwen3 シリーズに属します |
Snapshot |
思考モード 995,904 ノンシンキングモード 997,952 |
|||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。qwen-plus-us は コンテキストキャッシュ をサポートしています。
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
モード |
出力コスト(100 万トークンあたり) |
|
0<トークン≤256K |
$0.4 |
ノンシンキングモード |
$1.2 |
|
思考モード |
$4 |
||
|
256K<トークン≤1M |
$1.2 |
ノンシンキングモード |
$3.6 |
|
思考モード |
$12 |
中国本土
「中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。推論の計算リソースは、中国本土内に限定されます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen3.5-plus 現在のバージョン:qwen3.5-plus-2026-02-15 デフォルトで思考モードが有効です バッチ呼び出し は半額です |
Stable |
1,000,000 |
思考モード 983,616 ノンシンキングモード 991,808 |
65,536 最大 CoT:81,920 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
|
|
qwen3.5-plus-2026-02-15 デフォルトで思考モードが有効です |
Snapshot |
思考モード 983,616 ノンシンキングモード 991,808 |
65,536 最大 CoT:81,920 |
|||
|
qwen-plus 現在のバージョン:qwen-plus-2025-12-01 Qwen3 シリーズに属します バッチ呼び出し は半額です |
Stable |
思考モード 995,904 ノンシンキングモード 997,952 |
32,768 最大 CoT:81,920 |
|||
|
qwen-plus-latest 現在のバージョン:qwen-plus-2025-12-01 Qwen3 シリーズの一部 バッチ呼び出し は半額です |
Latest |
思考モード 995,904 ノンシンキングモード 997,952 |
||||
|
qwen-plus-2025-12-01 Qwen3 シリーズに属します |
Snapshot |
思考モード 995,904 ノンシンキングモード 997,952 |
||||
|
qwen-plus-2025-09-11 Qwen3 シリーズの一部 |
||||||
|
qwen-plus-2025-07-28 別名:qwen-plus-0728 Qwen3 シリーズの一部 |
||||||
|
qwen-plus-2025-07-14 別名:qwen-plus-0714 Qwen3 シリーズの一部 |
131,072 |
思考モード 98,304 ノンシンキングモード 129,024 |
16,384 最大 CoT:38,912 |
$0.115 |
思考モード $1.147 ノンシンキングモード $0.287 |
|
|
qwen-plus-2025-04-28 別名:qwen-plus-0428 Qwen3 シリーズに属します |
||||||
qwen3.5-plus、qwen3.5-plus-2026-02-15、qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11、および qwen-plus-2025-07-28 は、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
Qwen3.5-Plus
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤128K |
$0.115 |
$0.688 |
|
128K≤トークン≤256K |
$0.287 |
$1.72 |
|
256K<トークン≤1M |
$0.573 |
$3.44 |
Qwen-Plus
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
モード |
出力コスト(100 万トークンあたり) |
|
0<トークン≤128K |
$0.115 |
ノンシンキングモード |
$0.287 |
|
思考モード |
$1.147 |
||
|
128K<トークン≤256K |
$0.345 |
ノンシンキングモード |
$2.868 |
|
思考モード |
$3.441 |
||
|
256K<トークン≤1M |
$0.689 |
ノンシンキングモード |
$6.881 |
|
思考モード |
$9.175 |
上記のモデルは、思考モードおよびノンシンキングモードの両方をサポートしています。モードの切り替えには、enable_thinking パラメーターを使用してください。上記のモデルにおいて、思考モードが有効化されているにもかかわらず思考プロセスが出力されない場合は、ノンシンキングモードの価格で課金されます。
中国(香港)
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen-plus 現在のバージョン:qwen-plus-2025-12-01 Qwen3 シリーズに属します |
Stable |
1,000,000 |
思考 995,904 ノンシンキング 997,952 |
32,768 最大 CoT:81,920 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
|
|
qwen-plus-2025-12-01 Qwen3 シリーズに属します |
Snapshot |
|||||
qwen-plus-2025-12-01 モデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
|
リクエストごとの入力トークン数 |
モード |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤256K |
ノンシンキングモード |
$0.4 |
$1.2 |
|
思考モード |
$4 |
||
|
256K<トークン≤1M |
ノンシンキングモード |
$1.2 |
$3.6 |
|
思考モード |
$12 |
Qwen-Flash
Qwen シリーズで最も高速かつコスト効率の高いモデルであり、シンプルなタスクに最適です。Qwen-Flash は柔軟な段階的価格設定を採用しており、Qwen-Turbo よりもコスト効率が優れています。利用方法 | API リファレンス | オンラインで試す | 思考モード
国際
「国際デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力トークン数 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT + 応答 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||||
|
qwen3.5-flash 現在のバージョン:qwen3.5-flash-2026-02-23 デフォルトで思考モードが有効です |
Stable |
思考 |
1,000,000 |
983,616 |
81,920 |
65,536 |
$0.1 |
$0.4 |
各モデル 100 万トークン Model Studio の有効化後 90 日間有効 |
|
ノンシンキング |
991,808 |
- |
|||||||
|
qwen3.5-flash-2026-02-23 デフォルトで思考モードが有効です |
Snapshot |
思考 |
983,616 |
81,920 |
|||||
|
ノンシンキング |
991,808 |
- |
|||||||
|
qwen-flash 現在のバージョン:qwen-flash-2025-07-28 Qwen3 シリーズに属します バッチ呼び出し は半額です |
Stable |
思考 |
995,904 |
81,920 |
32,768 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
|||
|
ノンシンキング |
997,952 |
- |
|||||||
|
qwen-flash-2025-07-28 Qwen3 シリーズに属します |
Snapshot |
思考 |
995,904 |
81,920 |
|||||
|
ノンシンキング |
997,952 |
- |
|||||||
qwen-flash および qwen-flash-2025-07-28 の段階的価格設定
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤256K |
$0.05 |
$0.4 |
|
256K<トークン≤1M |
$0.25 |
$2 |
グローバル
「グローバルデプロイモード」では、エンドポイントおよびデータストレージは 米国(バージニア)リージョン に配置されます。推論の計算リソースは、世界中で動的にスケジュールされます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT + 応答 |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwen3.5-flash 現在のバージョン:qwen3.5-flash-2026-02-23 デフォルトで思考モードが有効です |
Stable |
思考 |
1,000,000 |
983,616 |
81,920 |
65,536 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
|
|
ノンシンキング |
991,808 |
- |
||||||
|
qwen3.5-flash-2026-02-23 デフォルトで思考モードが有効です |
Snapshot |
思考 |
983,616 |
81,920 |
||||
|
ノンシンキング |
991,808 |
- |
||||||
|
qwen-flash 現在のバージョン:qwen-flash-2025-07-28 Qwen3 シリーズに属します |
Stable |
思考 |
995,904 |
81,920 |
32,768 |
|||
|
ノンシンキング |
997,952 |
- |
||||||
|
qwen-flash-2025-07-28 Qwen3 シリーズに属します |
Snapshot |
思考 |
995,904 |
81,920 |
||||
|
ノンシンキング |
997,952 |
- |
||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。qwen-flash は コンテキストキャッシュ をサポートしています。
qwen3.5-flash および qwen3.5-flash-2026-02-23 の段階的価格設定
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤128K |
$0.029 |
$0.287 |
|
128K<トークン≤256K |
$0.115 |
$1.147 |
|
256K<トークン≤1M |
$0.172 |
$1.72 |
qwen-flash および qwen-flash-2025-07-28 の段階的価格設定
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤128K |
$0.022 |
$0.216 |
|
128K<トークン≤256K |
$0.087 |
$0.861 |
|
256K<トークン≤1M |
$0.173 |
$1.721 |
米国
「米国デプロイモード」では、エンドポイントおよびデータストレージは 米国(バージニア)リージョン に配置されます。推論の計算リソースは、米国内に限定されます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT + 応答 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||||
|
qwen-flash-us 現在のバージョン:qwen-flash-2025-07-28-us Qwen3 シリーズに属します |
Stable |
思考 |
1,000,000 |
995,904 |
81,920 |
32,768 |
段階的価格設定です。詳細については、以下の表をご参照ください。 |
なし |
|
|
ノンシンキング |
997,952 |
- |
|||||||
|
qwen-flash-2025-07-28-us Qwen3 シリーズに属します |
Snapshot |
思考 |
995,904 |
81,920 |
|||||
|
ノンシンキング |
997,952 |
- |
|||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤256K |
$0.05 |
$0.4 |
|
256K<トークン≤1M |
$0.25 |
$2 |
中国本土
「中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。推論の計算リソースは、中国本土内に限定されます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT + 応答 |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwen3.5-flash 現在のバージョン:qwen3.5-flash-2026-02-23 デフォルトで思考モードが有効です バッチ呼び出し は半額です |
安定 | 思考中 |
1,000,000 |
983,616 |
81,920 |
65,536 |
段階的料金体系。以下の詳細をご確認ください。 |
|
|
ノンシンキング |
991,808 |
- |
||||||
|
qwen3.5-flash-2026-02-23 デフォルトで思考モードが有効です |
Snapshot |
思考 |
983,616 |
81,920 |
||||
|
ノンシンキング |
991,808 |
- |
||||||
|
qwen-flash 現在のバージョン:qwen-flash-2025-07-28 Qwen3 シリーズに属します バッチ呼び出し は半額です |
Stable |
思考 |
995,904 |
81,920 |
32,768 |
|||
|
ノンシンキング |
997,952 |
- |
||||||
|
qwen-flash-2025-07-28 Qwen3 シリーズに属します |
Snapshot |
思考 |
995,904 |
81,920 |
||||
|
ノンシンキング |
997,952 |
- |
||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。qwen3.5-flash は コンテキストキャッシュ および バッチ呼び出し をサポートしています。
qwen3.5-flash および qwen3.5-flash-2026-02-23 の段階的価格設定
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤128K |
$0.029 |
$0.287 |
|
128K<トークン≤256K |
$0.115 |
$1.147 |
|
256K<トークン≤1M |
$0.172 |
$1.72 |
qwen-flash および qwen-flash-2025-07-28 の段階的価格設定
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0<トークン≤128K |
$0.022 |
$0.216 |
|
128K<トークン≤256K |
$0.087 |
$0.861 |
|
256K<トークン≤1M |
$0.173 |
$1.721 |
中国(香港)
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力トークン数 |
最大 CoT |
最大出力トークン数 |
入力コスト |
出力コスト CoT + 出力 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||||
|
qwen3.5-flash 現在のバージョン:qwen3.5-flash-2026-02-23 デフォルトで思考モードが有効です |
Stable |
思考 |
1,000,000 |
983,616 |
81,920 |
65,536 |
$0.1 |
$0.4 |
各モデル 100 万トークン Model Studio の有効化後 90 日間有効 |
|
ノンシンキング |
991,808 |
- |
|||||||
|
qwen3.5-flash-2026-02-23 デフォルトで思考モードが有効です |
Snapshot |
思考 |
983,616 |
81,920 |
|||||
|
ノンシンキング |
991,808 |
- |
|||||||
Qwen-Turbo
Qwen-Turbo は今後更新されません。代わりに Qwen-Flash を使用してください。Qwen-Flash は、よりコスト効率の高い課金方式である柔軟な段階的価格設定を採用しています。利用方法 | API リファレンス | オンラインで試す | 思考モード
国際
「国際デプロイモード」では、エンドポイントおよびデータストレージはいずれも シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力トークン数 |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||
|
qwen-turbo 現在のバージョン:qwen-turbo-2025-04-28 Qwen3 シリーズに属します バッチ呼び出し は半額です |
Stable |
思考 131,072 ノンシンキングモード 1,000,000 |
思考 98,304 ノンシンキングモード 1,000,000 |
16,384 最大 CoT:38,912 |
$0.05 |
思考モード:$0.5 ノンシンキングモード:$0.2 |
各モデル 100 万トークン Model Studio の有効化後 90 日間有効 |
|
qwen-turbo-latest 常に最新のスナップショットです Qwen3 シリーズに属します |
Latest |
$0.05 |
思考モード:$0.5 ノンシンキングモード:$0.2 |
||||
|
qwen-turbo-2025-04-28 別名:qwen-turbo-0428 Qwen3 シリーズに属します |
Snapshot |
||||||
|
qwen-turbo-2024-11-01 別名:qwen-turbo-1101 |
1,000,000 |
1,000,000 |
8,192 |
$0.2 |
|||
中国本土
「中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen-turbo 現在のバージョン:qwen-turbo-2025-04-28 Qwen3 シリーズに属します |
Stable |
思考 131,072 ノンシンキングモード 1,000,000 |
思考 98,304 ノンシンキングモード 1,000,000 |
16,384 最大 CoT:38,912 |
$0.044 |
思考 $0.431 ノンシンキングモード $0.087 |
|
qwen-turbo-latest 常に最新のスナップショットです Qwen3 シリーズに属します |
Latest |
|||||
|
qwen-turbo-2025-07-15 別名:qwen-turbo-0715 Qwen3 シリーズに属します |
Snapshot |
|||||
|
qwen-turbo-2025-04-28 別名:qwen-turbo-0428 Qwen3 シリーズに属します |
||||||
QwQ
QwQ は Qwen2.5 ベースで訓練された推論モデルであり、強化学習により大幅に強化されています。AIME 24/25 や LiveCodeBench などの主要な評価指標において、フルキャパシティの DeepSeek-R1 と同等のパフォーマンスを達成し、IFEval や LiveBench などの汎用ベンチマークでも優れた結果を示します。利用方法
国際
「国際デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大応答 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwq-plus |
Stable |
131,072 |
98,304 |
32,768 |
8,192 |
$0.8 |
$2.4 |
100万トークン Model Studio の有効化後 90 日間有効 |
中国本土
「中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大応答 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
||||||
|
qwq-plus 現在のバージョン:qwq-plus-2025-03-05 バッチ呼び出し は半額です |
Stable |
131,072 |
98,304 |
32,768 |
8,192 |
$0.230 |
$0.574 |
|
qwq-plus-latest 常に最新のスナップショットです |
Latest |
||||||
|
qwq-plus-2025-03-05 別名:qwq-plus-0305 |
Snapshot |
||||||
Qwen-Long
この Qwen シリーズのモデルは、最長のコンテキストウィンドウ、バランスの取れた機能、および低コストを特徴としており、長文分析、情報抽出、要約、分類タスクに最適です。利用方法 | オンラインで試す
サポートされるのは 中国本土デプロイモード のみです。このモードでは、エンドポイントおよびデータストレージは 北京リージョン に配置され、推論の計算リソースは中国本土内に限定されます。
|
モデル | バージョン |
コンテキスト ウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen-long-latest 常に最新のスナップショットです バッチ呼び出し は半額です |
安定 | 10,000,000 |
10,000,000 |
32,768 |
$0.072 |
$0.287 |
|
qwen-long-2025-01-25 別名:qwen-long-0125 |
Snapshot |
|||||
Qwen-Omni
Qwen-Omni は、テキスト、画像、音声、動画などのマルチモーダル入力を受付けるモデルであり、テキストまたは音声の応答を生成します。複数の表現豊かな人間のような音声オプションを提供し、多言語および方言の音声出力もサポートしています。これにより、視覚認識、感情検知、教育など、オーディオビジュアルチャットのシナリオに最適です。利用方法 | API リファレンス
国際
「国際デプロイモード」では、エンドポイントおよびデータストレージはいずれも シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
無料クォータ |
|
(トークン) |
|||||||
|
qwen3-omni-flash このモデルは、 qwen3-omni-flash-2025-12-01。 |
Stable |
思考 |
65,536 |
16,384 |
32,768 |
16,384 |
100万トークン(モダリティを問わず) Model Studio の有効化後 90 日間有効 |
|
ノンシンキング |
49,152 |
- |
|||||
|
qwen3-omni-flash-2025-12-01 |
Snapshot |
思考 |
65,536 |
16,384 |
32,768 |
16,384 |
|
|
ノンシンキング |
49,152 |
- |
|||||
|
qwen3-omni-flash-2025-09-15 別名:qwen3-omni-flash-0915 |
Snapshot |
思考 |
65,536 |
16,384 |
32,768 |
16,384 |
|
|
ノンシンキング |
49,152 |
- |
|||||
無料クォータが使用済みの場合、入力および出力は以下の通り課金されます。思考モードおよびノンシンキングモードの価格は同一です。思考モードでは音声出力はサポートされていません。
|
|
中国本土
「中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
無料クォータ |
|
(トークン) |
|||||||
|
qwen3-omni-flash 現在のバージョン:qwen3-omni-flash-2025-12-01 |
Stable |
思考 |
65,536 |
16,384 |
32,768 |
16,384 |
無料クォータなし |
|
ノンシンキング |
49,152 |
- |
|||||
|
qwen3-omni-flash-2025-12-01 |
Snapshot |
思考 |
65,536 |
16,384 |
32,768 |
16,384 |
|
|
ノンシンキング |
49,152 |
- |
|||||
|
qwen3-omni-flash-2025-09-15 別名:qwen3-omni-flash-0915 |
Snapshot |
思考 |
65,536 |
16,384 |
32,768 |
16,384 |
|
|
ノンシンキング |
49,152 |
- |
|||||
無料クォータが使用済みの場合、入力および出力は以下の通り課金されます。思考モードおよびノンシンキングモードの価格は同一です。思考モードでは音声出力はサポートされていません。
|
|
Qwen3-Omni-Flash モデルは、更新されていない Qwen-Omni-Turbo モデルと比較して大幅な機能向上が見られるため、こちらをご利用ください。
-
思考モードとノンシンキングモードの両方をサポートするハイブリッド思考モデルです。
enable_thinkingパラメーターを使用してモードを切り替えてください。デフォルトでは思考モードは無効です。 -
思考モードでは音声出力はサポートされていません。ノンシンキングモードでの音声出力については、以下の通りです:
-
qwen3-omni-flash-2025-12-01 は最大 49 種類の音声をサポートし、qwen3-omni-flash-2025-09-15 および qwen3-omni-flash は最大 17 種類の音声をサポートします。一方、Qwen-Omni-Turbo は 4 種類のみです。
-
最大 10 言語をサポートしますが、Qwen-Omni-Turbo は 2 言語のみです。
-
Qwen-Omni-Realtime
Qwen-Omni と比較して、Qwen-Omni-Realtime はストリーミング音声入力をサポートし、組み込みの音声活動検出(VAD)機能により、ユーザーの発話開始および終了を自動的に検出できます。利用方法 | クライアントイベント | サーバーイベント
国際
「国際デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力トークン数 |
最大出力 |
無料クォータ |
|
(トークン) |
|||||
|
qwen3-omni-flash-realtime 現在のバージョン:qwen3-omni-flash-realtime-2025-12-01。 |
Stable |
65,536 |
49,152 |
16,384 |
100万トークン(モダリティを問わず) Model Studio の有効化後 90 日間有効 |
|
qwen3-omni-flash-realtime-2025-12-01 |
Snapshot |
||||
|
qwen3-omni-flash-realtime-2025-09-15 |
|||||
無料クォータが使用済みの場合、入力および出力は以下の通り課金されます:
|
|
中国本土
「中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。
|
モデル | バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
無料クォータ |
|
(トークン) |
|||||
|
qwen3-omni-flash-realtime このモデルは現在、qwen3-omni-flash-realtime-2025-12-01 です。 |
Stable |
65,536 |
49,152 |
16,384 |
無料クォータなし |
|
qwen3-omni-flash-realtime-2025-12-01 |
Snapshot |
||||
|
qwen3-omni-flash-realtime-2025-09-15 |
|||||
無料クォータが使用済みの場合、入力および出力は以下の通り課金されます:
|
|
Qwen3-Omni-Flash-Realtime モデルを Qwen-Omni-Turbo-Realtime の代わりにご利用ください。Qwen-Omni-Turbo-Realtime は今後更新されません。Qwen3-Omni-Flash-Realtime は大幅な機能向上を実現しています。音声出力について:
-
qwen3-omni-flash-realtime-2025-12-01 は 49 種類の音声をサポートします。qwen3-omni-flash-realtime-2025-09-15 および qwen3-omni-realtime-flash は 17 種類の音声をサポートします。一方、Qwen-Omni-Turbo-Realtime は 4 種類のみです。
-
10 言語をサポートしますが、Qwen-Omni-Turbo-Realtime は 2 言語のみです。
QVQ
QVQ は、視覚入力と CoT 出力をサポートする視覚的推論モデルです。数学、プログラミング、視覚分析、創作、および一般的なタスクにおいて、より強力な能力を発揮します。使い方 | オンラインで試す
国際
国際デプロイモードでは、エンドポイントとデータストレージは両方ともシンガポールリージョンにあります。モデルの推論に使われる計算リソースは、世界中 (中国本土を除く) で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大応答 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qvq-max 現在 qvq-max-2025-03-25 です。 |
安定版 |
131,072 |
106,496 イメージあたり最大: 16,384 |
16,384 |
8,192 |
$1.2 |
$4.8 |
各 100 万入力トークン Model Studio を有効化してから 90 日間有効 |
|
qvq-max-latest 常に最新のスナップショットです。 |
最新版 |
|||||||
|
qvq-max-2025-03-25 qvq-max-0325 とも呼ばれます。 |
スナップショット |
|||||||
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは両方とも北京リージョンにあります。モデルの推論に使われる計算リソースは、中国本土に限定されます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大応答 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
||||||
|
qvq-max qvq-plus よりも強力な視覚的推論能力と命令フォロー能力を提供し、より複雑なタスクで最適なパフォーマンスを発揮します。 現在 qvq-max-2025-03-25 です。 |
安定版 |
131,072 |
106,496 イメージあたり最大: 16,384 |
16,384 |
8,192 |
$1.147 |
$4.588 |
|
qvq-max-latest 常に最新のスナップショットです。 |
最新版 |
||||||
|
qvq-max-2025-05-15 qvq-max-0515 とも呼ばれます。 |
スナップショット |
||||||
|
qvq-max-2025-03-25 qvq-max-0325 とも呼ばれます。 |
|||||||
|
qvq-plus 現在 qvq-plus-2025-05-15 です。 |
安定版 |
$0.287 |
$0.717 |
||||
|
qvq-plus-latest 常に最新のスナップショットです。 |
最新版 |
||||||
|
qvq-plus-2025-05-15 qvq-plus-0515 とも呼ばれます。 |
スナップショット |
||||||
Qwen-VL
Qwen-VL は、視覚 (イメージ) 理解機能を備えたテキスト生成モデルです。OCR を実行し、さらに要約や推論を行うことができます。例えば、プロダクト写真から属性を抽出したり、演習図に基づいて問題を解決したりします。 使用方法 | API リファレンス | オンラインで試す
Qwen-VL モデルは、入力トークンと出力トークンの合計数に基づいて課金されます。イメージトークン計算ルールの詳細については、「視覚理解」をご参照ください。
インターナショナル
国際デプロイモードでは、アクセスポイントとデータストレージは両方とも シンガポール リージョン に配置されています。モデル推論計算リソースは、世界中 (中国本土を除く) で動的にスケジュールされます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT と出力 |
無料クォータ |
|
(トークン) |
(100万トークンあたり) |
||||||||
|
qwen3-vl-plus 現在、qwen3-vl-plus-2025-12-19 |
安定版 |
シンキング |
262,144 |
258,048 イメージあたりの最大: 16,384 |
81,920 |
32,768 |
段階的価格設定。詳細については以下をご参照ください。 |
入力トークン 100万、出力トークン 100万 Model Studio アクティベーション後90日間有効 |
|
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384 |
- |
|||||||
|
qwen3-vl-plus-2025-12-19 |
スナップショット |
シンキング |
258,048 イメージあたりの最大: 16,384 |
81,920 |
|||||
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384 |
- |
|||||||
|
qwen3-vl-plus-2025-09-23 |
スナップショット |
シンキング |
258,048 イメージあたりの最大: 16,384 |
81,920 |
|||||
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384 |
- |
|||||||
|
qwen3-vl-flash 現在、qwen3-vl-flash-2025-10-15 |
安定版 |
シンキング |
258,048 イメージあたりの最大: 16,384 |
81,920 |
|||||
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384 |
- |
|||||||
|
qwen3-vl-flash-2026-01-22 |
スナップショット |
シンキング |
258,048 イメージあたりの最大: 16,384 |
81,920 |
|||||
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384 |
- |
|||||||
|
qwen3-vl-flash-2025-10-15 |
スナップショット |
シンキング |
258,048 イメージあたりの最大: 16,384 |
81,920 |
|||||
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384 |
- |
|||||||
上記モデルは、現在のリクエストにおける入力トークン数に基づいて段階的価格設定を使用します。入力と出力の価格は、シンキングモードとノンシンキングモードで同じです。さらに、qwen3-vl-plus および qwen3-vl-flash モデルは コンテキストキャッシュをサポートしています。
qwen3-vl-plus シリーズ
|
リクエストあたりの入力トークン |
入力コスト (100万トークンあたり) |
出力コスト (100万トークンあたり) |
|
0 < Tokens ≤ 32K |
$0.2 |
$1.6 |
|
32K < Tokens ≤ 128K |
$0.3 |
$2.4 |
|
128K < Tokens ≤ 256K |
$0.6 |
$4.8 |
qwen3-vl-flash シリーズ
|
リクエストあたりの入力トークン |
入力コスト (100万トークンあたり) |
出力コスト (100万トークンあたり) |
|
0 < Tokens ≤ 32K |
$0.05 |
$0.40 |
|
32K < Tokens ≤ 128K |
$0.075 |
$0.6 |
|
128K < Tokens ≤ 256K |
$0.12 |
$0.96 |
グローバル
グローバルデプロイモードでは、アクセスポイントとデータストレージは両方とも 米国 (バージニア) リージョン に配置されています。モデル推論計算リソースは世界中で動的にスケジュールされます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT と出力 |
|
(トークン) |
(100万トークンあたり) |
|||||||
|
qwen3-vl-plus 現在、qwen3-vl-plus-2025-12-19。 |
安定版 |
シンキング |
262,144 |
258,048 イメージあたりの最大: 16,384。 |
81,920 |
32,768 |
段階的価格設定。詳細については以下をご参照ください。 |
|
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384。 |
- |
||||||
|
qwen3-vl-plus-2025-09-23 |
スナップショット |
シンキング |
258,048 イメージあたりの最大: 16,384。 |
81,920 |
||||
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384。 |
- |
||||||
|
qwen3-vl-flash 現在、qwen3-vl-flash-2025-10-15。 |
安定版 |
シンキング |
258,048 イメージあたりの最大: 16,384。 |
81,920 |
||||
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384。 |
- |
||||||
|
qwen3-vl-flash-2025-10-15 |
スナップショット |
シンキング |
258,048 イメージあたりの最大: 16,384。 |
81,920 |
||||
|
ノンシンキング |
260,096 イメージあたりの最大: 16,384。 |
- |
||||||
上記モデルは、現在のリクエストにおける入力トークン数に基づいて段階的価格設定を使用します。入力と出力の価格は、シンキングモードとノンシンキングモードで同じです。さらに、qwen3-vl-plus および qwen3-vl-flash モデルは コンテキストキャッシュをサポートしています。
qwen3-vl-plus シリーズ
|
リクエストあたりの入力トークン |
入力コスト (100万トークンあたり) |
出力コスト (100万トークンあたり) |
|
0 < Tokens ≤ 32K |
$0.143 |
$1.434 |
|
32K < Tokens ≤ 128K |
$0.215 |
$2.15 |
|
128K < Tokens ≤ 256K |
$0.43 |
$4.301 |
qwen3-vl-flash シリーズ
|
リクエストあたりの入力トークン |
入力コスト (100万トークンあたり) |
出力コスト (100万トークンあたり) |
|
0 < Tokens ≤ 32K |
$0.022 |
$0.215 |
|
32K < Tokens ≤ 128K |
$0.043 |
$0.43 |
|
128K < Tokens ≤ 256K |
$0.086 |
$0.859 |
米国
「米国デプロイモード」では、アクセスポイントおよびデータストレージの両方が米国 (バージニア) リージョンに配置されます。モデル推論用の計算リソースは、米国内でのみ利用可能です。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT + 出力 |
|
(トークン) |
(100万トークンあたり) |
|||||||
|
qwen3-vl-flash-us 現在は qwen3-vl-flash-2025-10-15-us |
安定版 |
シンキング |
262,144 |
258,048 イメージごとに最大 16,384 |
81,920 |
32,768 |
段階的価格設定。詳細については、下記をご参照ください。 |
|
|
ノンシンキング |
260,096 イメージごとに最大 16,384 |
― |
||||||
|
qwen3-vl-flash-2026-01-22-us |
スナップショット |
シンキング |
258,048 イメージごとに最大 16,384 |
81,920 |
||||
|
ノンシンキング |
260,096 イメージごとに最大 16,384 |
― |
||||||
|
qwen3-vl-flash-2025-10-15-us |
スナップショット |
シンキング |
258,048 イメージごとに最大 16,384 |
81,920 |
||||
|
ノンシンキング |
260,096 イメージごとに最大 16,384 |
― |
||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。シンキングモードおよびノンシンキングモードにおいて、入力および出力の価格は同一です。また、qwen3-vl-flash-us モデルはコンテキストキャッシュをサポートしています。
|
リクエストあたりの入力トークン数 |
入力コスト (100万トークンあたり) |
出力コスト (100万トークンあたり) |
|
0 < トークン数 ≤ 32K |
$0.05 |
$0.4 |
|
32K < トークン数 ≤ 128K |
$0.075 |
$0.6 |
|
128K < トークン数 ≤ 256K |
$0.12 |
$0.96 |
中国本土
中国本土デプロイモードでは、アクセスポイントおよびデータストレージの両方が中国 (北京)リージョン内に配置されます。モデル推論の計算リソースは、中国本土に限定されます。
|
モデル |
バージョン |
モード |
コンテキストウィンドウ(トークン数) |
最大入力(トークン数) |
最大 CoT |
最大出力(トークン数) |
入力コスト |
出力コスト |
無料クォータ |
|
トークン数 |
100 万トークンあたり |
||||||||
|
qwen3-vl-plus 現在のバージョン:qwen3-vl-plus-2025-12-19 バッチ呼び出しは半額で利用可能 |
Stable |
シンキングモード |
262,144 |
258,048 イメージごとの最大値:16,384 |
81,920 |
32,768 |
段階的価格設定。詳細については、以下をご参照ください。 |
無料クォータなし |
|
|
ノンシンキングモード |
260,096 イメージごとの最大値:16,384 |
― |
|||||||
|
qwen3-vl-plus-2025-12-19 |
Snapshot |
シンキングモード |
258,048 イメージごとの最大値:16,384 |
81,920 |
|||||
|
非思考 |
260,096 イメージごとの最大値:16,384 |
― |
|||||||
|
qwen3-vl-plus-2025-09-23 |
Snapshot |
シンキングモード |
258,048 イメージごとの最大値:16,384 |
81,920 |
|||||
|
ノンシンキングモード |
260,096 イメージごとの最大値:16,384 |
― |
|||||||
|
qwen3-vl-flash 現在のバージョン:qwen3-vl-flash-2025-10-15 バッチ呼び出しは半額で利用可能 |
Stable |
シンキングモード |
258,048 イメージごとの最大値:16,384 |
81,920 |
|||||
|
非思考 |
260,096 イメージごとの最大値:16,384 |
― |
|||||||
|
qwen3-vl-flash-2026-01-22 |
Snapshot |
シンキングモード |
258,048 イメージごとの最大値:16,384 |
81,920 |
|||||
|
ノンシンキングモード |
260,096 イメージごとの最大値:16,384 |
― |
|||||||
|
qwen3-vl-flash-2025-10-15 |
Snapshot |
シンキングモード |
258,048 イメージごとの最大値:16,384 |
81,920 |
|||||
|
ノンシンキングモード |
260,096 イメージごとの最大値:16,384 |
― |
|||||||
上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。シンキングモードおよびノンシンキングモードにおいて、入力および出力の価格は同一です。また、qwen3-vl-plus および qwen3-vl-flash モデルは、コンテキストキャッシュ をサポートしています。
qwen3-vl-plus シリーズ
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0 < トークン数 ≤ 32K |
$0.143 |
$1.434 |
|
32K < トークン数 ≤ 128K |
$0.215 |
$2.15 |
|
128K < トークン数 ≤ 256K |
$0.43 |
$4.301 |
qwen3-vl-flash シリーズ
|
リクエストごとの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
0 < トークン数 ≤ 32K |
$0.022 |
$0.215 |
|
32K < トークン数 ≤ 128K |
$0.043 |
$0.43 |
|
128K < トークン数 ≤ 256K |
$0.086 |
$0.859 |
中国 (香港)
|
モデル |
バージョン |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT + 出力 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||||
|
qwen3-vl-plus 現在のバージョン:qwen3-vl-plus-2025-12-19 |
Stable |
Thinking |
262,144 |
258,048 イメージごとに最大 16,384 |
81,920 |
32,768 |
段階的価格設定。詳細は下記をご参照ください。 |
各モデルにつき 100 万トークン Model Studio を有効化した日から 90 日間有効 |
|
|
ノンシンキング |
260,096 イメージごとに最大 16,384 |
― |
|||||||
|
qwen3-vl-plus-2025-12-19 |
Snapshot |
Thinking |
258,048 イメージごとに最大 16,384 |
81,920 |
|||||
|
ノンシンキング |
260,096 イメージごとに最大 16,384 |
― |
|||||||
上記のモデルは、現在のリクエストにおける入力トークン数に応じた段階的価格設定を採用しています。Thinking モードおよびノンシンキングモードでは、入力および出力の課金単価が同一です。
|
リクエストごとの入力トークン数 |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
0 < トークン ≤ 32K |
$0.2 |
$1.6 |
|
32K < トークン ≤ 128K |
$0.3 |
$2.4 |
|
128K < トークン ≤ 256K |
$0.6 |
$4.8 |
qwen3-vl-flash-2026-01-22 モデルは、思考モードおよびノンシンキングモードを効果的に統合しています。2025 年 10 月 15 日のスナップショットと比較して、モデル全体のパフォーマンスが大幅に向上しています。一般的な画像認識、セキュリティ、店舗点検、巡回点検、および写真に基づく問題解決などのビジネスシナリオにおいて、より高い推論精度を実現しています。
Qwen-OCR
Qwen-OCR は、テキスト抽出に特化したモデルです。Qwen-VL と比較して、ドキュメント、テーブル、試験問題、手書きなどのアイテムのイメージからのテキスト抽出に、より重点を置いています。英語、フランス語、日本語、韓国語、ドイツ語、ロシア語、イタリア語など、複数の言語を認識できます。使用方法 | API リファレンス | オンラインで試す
国際
国際デプロイモードでは、エンドポイントとデータストレージは両方ともシンガポールリージョンに配置されます。モデルの推論計算リソースは、世界中 (中国本土を除く) で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力価格 |
出力価格 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||
|
qwen-vl-ocr qwen-vl-ocr-2025-11-20 と同等です。 |
安定版 |
38,192 |
30,000 イメージあたりの最大値:30,000 |
8,192 |
$0.07 |
$0.16 |
100 万入力トークンと 100 万出力トークン Model Studio の有効化後 90 日間有効 |
|
qwen-vl-ocr-2025-11-20 qwen-vl-ocr-1120 としても知られています。 Qwen3-VL アーキテクチャをベースにしており、ドキュメント解析とテキストのローカライズ性能が大幅に向上しています。 |
スナップショット |
||||||
グローバル
グローバルデプロイモードでは、エンドポイントとデータストレージは両方とも米国 (バージニア) リージョンに配置されます。モデルの推論計算リソースは、世界中で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力価格 |
出力価格 |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen-vl-ocr qwen-vl-ocr-2025-11-20 と同等です。 |
安定版 |
38,192 |
30,000 イメージあたりの最大値:30,000 |
8,192 |
$0.043 |
$0.072 |
|
qwen-vl-ocr-2025-11-20 qwen-vl-ocr-1120 としても知られています。 Qwen3-VL アーキテクチャをベースにしており、ドキュメント解析とテキストのローカライズ性能が大幅に向上しています。 |
スナップショット |
|||||
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは両方とも北京リージョンに配置されます。モデルの推論計算リソースは、中国本土に限定されます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力価格 |
出力価格 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||
|
qwen-vl-ocr 現在は qwen-vl-ocr-2025-11-20 です。 バッチ呼び出しは半額で利用できます。 |
安定版 |
38,192 |
30,000 イメージあたりの最大値:30,000 |
8,192 |
$0.043 |
$0.072 |
無料クォータなし |
|
qwen-vl-ocr-latest 常に最新版 |
最新版 |
||||||
|
qwen-vl-ocr-2025-11-20 qwen-vl-ocr-1120 としても知られています。 Qwen3-VL アーキテクチャをベースにしており、ドキュメント解析とテキストのローカライズ性能が大幅に向上しています。 |
スナップショット |
||||||
|
qwen-vl-ocr-2025-08-28 qwen-vl-ocr-0828 としても知られています。 |
34,096 |
4,096 |
$0.717 |
$0.717 |
|||
|
qwen-vl-ocr-2025-04-13 qwen-vl-ocr-0413 としても知られています。 |
|||||||
|
qwen-vl-ocr-2024-10-28 qwen-vl-ocr-1028 としても知られています。 |
|||||||
Qwen-Math
Qwen-Math は、数学問題の解決に特化した言語モデルです。使用方法 | API リファレンス | オンラインで試す
中国本土デプロイモードのみがサポートされています。このモードでは、エンドポイントとデータストレージは北京リージョンに配置され、推論コンピューティングリソースは中国本土に限定されます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen-math-plus 現在: qwen-math-plus-2024-09-19 |
安定版 |
4,096 |
3,072 |
3,072 |
$0.574 |
$1.721 |
|
qwen-math-plus-latest 常に最新のスナップショット |
最新版 |
|||||
|
qwen-math-plus-2024-09-19 別名: qwen-math-plus-0919 |
スナップショット |
|||||
|
qwen-math-plus-2024-08-16 別名: qwen-math-plus-0816 |
||||||
|
qwen-math-turbo 現在: qwen-math-turbo-2024-09-19 |
安定版 |
$0.287 |
$0.861 |
|||
|
qwen-math-turbo-latest 常に最新のスナップショット |
最新版 |
|||||
|
qwen-math-turbo-2024-09-19 別名: qwen-math-turbo-0919 |
スナップショット |
|||||
Qwen-Coder
Qwen-Coder はコード生成モデルです。最新の Qwen3-Coder-Plus シリーズは Qwen3 をベースに構築されており、高度なコーディングエージェント機能を提供します。ツール呼び出し、環境インタラクション、自律プログラミングに優れており、強力なコーディング能力と汎用インテリジェンスを兼ね備えています。使用方法 | API リファレンス | オンラインで試す
国際
国際デプロイモードでは、エンドポイントとデータストレージは両方ともシンガポールリージョンにあります。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
||||||
|
qwen3-coder-plus 現在 qwen3-coder-plus-2025-09-23 |
安定版 |
1,000,000 |
997,952 |
65,536 |
料金は段階的価格設定です。詳細は表の下の注記をご参照ください。 |
各 100 万トークン 有効期間: Alibaba Cloud Model Studio を有効化してから 90 日間 |
|
|
qwen3-coder-plus-2025-09-23 |
スナップショット |
||||||
|
qwen3-coder-plus-2025-07-22 |
スナップショット |
||||||
|
qwen3-coder-flash 現在 qwen3-coder-flash-2025-07-28 |
安定版 |
||||||
|
qwen3-coder-flash-2025-07-28 |
スナップショット |
||||||
上記のモデルは、現在のリクエストの入力トークン数に基づいた段階的価格設定を使用します。
qwen3-coder-plus シリーズ
qwen3-coder-plus、qwen3-coder-plus-2025-09-23、および qwen3-coder-plus-2025-07-22 の料金は以下の通りです。qwen3-coder-plus はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で、明示的キャッシュにヒットした入力テキストは単価の 10% で請求されます。
|
リクエストあたりの入力トークン |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
0<Token≤32K |
$1 |
$5 |
|
32K < Tokens ≤ 128K |
$1.80 |
$9 |
|
128K < Tokens ≤ 256K |
$3 |
$15 |
|
256,000 < Tokens ≤ 1,000,000 |
$6 |
$60 |
qwen3-coder-flash シリーズ
qwen3-coder-flash および qwen3-coder-flash-2025-07-28 の料金は以下の通りです。qwen3-coder-flash はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で、明示的キャッシュにヒットした入力テキストは単価の 10% で請求されます。
|
リクエストあたりの入力トークン |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
最大 32,000 |
$0.30 |
$1.50 |
|
32K < Tokens ≤ 128K |
$0.50 |
$2.50 |
|
128K < Tokens ≤ 256K |
$0.80 |
$4.00 |
|
256,000 < Tokens ≤ 1,000,000 |
$1.6 |
$9.60 |
グローバル
グローバルデプロイモードでは、エンドポイントとデータストレージは両方とも米国 (バージニア) リージョンにあります。モデル推論の計算リソースは世界中で動的にスケジュールされます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen3-coder-plus 現在 qwen3-coder-plus-2025-09-23 |
安定版 |
1,000,000 |
997,952 |
65,536 |
料金は段階的価格設定です。詳細は表の下の注記をご参照ください。 |
|
|
qwen3-coder-plus-2025-09-23 |
スナップショット |
|||||
|
qwen3-coder-plus-2025-07-22 |
スナップショット |
|||||
|
qwen3-coder-flash 現在 qwen3-coder-flash-2025-07-28 |
安定版 |
|||||
|
qwen3-coder-flash-2025-07-28 |
スナップショット |
|||||
上記のモデルは、現在のリクエストの入力トークン数に基づいた段階的価格設定を使用します。
qwen3-coder-plus シリーズ
qwen3-coder-plus、qwen3-coder-plus-2025-09-23、および qwen3-coder-plus-2025-07-22 の料金は以下の通りです。qwen3-coder-plus はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で請求されます。
|
リクエストあたりの入力トークン |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
0<Token≤32K |
$0.574 |
$2.294 |
|
32K < Tokens ≤ 128K |
$0.861 |
$3.441 |
|
128K < Tokens ≤ 256K |
$1.434 |
$5.735 |
|
256K < Tokens ≤ 1M |
$2.868 |
$28.671 |
qwen3-coder-flash シリーズ
qwen3-coder-flash および qwen3-coder-flash-2025-07-28 の料金は以下の通りです。qwen3-coder-flash はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で請求されます。
|
リクエストあたりの入力トークン |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
0 < Token ≤ 32K |
$0.144 |
$0.574 |
|
32 K < Tokens ≤ 128 K |
$0.216 |
$0.861 |
|
128 K < Tokens ≤ 256 K |
$0.359 |
$1.434 |
|
256 K < Tokens ≤ 1 M |
$0.717 |
$3.584 |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは両方とも北京リージョンにあります。モデル推論の計算リソースは中国本土に限定されます。
|
モデル |
バージョン |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen3-coder-plus 現在 qwen3-coder-plus-2025-09-23 |
安定版 |
1,000,000 |
997,952 |
65,536 |
段階的価格設定です。詳細は以下をご参照ください。 |
|
|
qwen3-coder-plus-2025-09-23 |
スナップショット |
|||||
|
qwen3-coder-plus-2025-07-22 |
スナップショット |
|||||
|
qwen3-coder-flash 現在 qwen3-coder-flash-2025-07-28 |
安定版 |
|||||
|
qwen3-coder-flash-2025-07-28 |
スナップショット |
|||||
上記のモデルは、現在のリクエストの入力トークン数に基づいた段階的価格設定を使用します。
qwen3-coder-plus シリーズ
qwen3-coder-plus、qwen3-coder-plus-2025-09-23、および qwen3-coder-plus-2025-07-22 の料金は以下の通りです。qwen3-coder-plus はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で、明示的キャッシュにヒットした入力テキストは単価の 10% で請求されます。
|
リクエストあたりの入力トークン |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
0<Token≤32K |
$0.574 |
$2.294 |
|
32K < Tokens ≤ 128K |
$0.861 |
$3.441 |
|
128K < Tokens ≤ 256K |
$1.434 |
$5.735 |
|
256K < Tokens ≤ 1M |
$2.868 |
$28.671 |
qwen3-coder-flash シリーズ
qwen3-coder-flash および qwen3-coder-flash-2025-07-28 の料金は以下の通りです。qwen3-coder-flash はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で、明示的キャッシュにヒットした入力テキストは単価の 10% で請求されます。
|
リクエストあたりの入力トークン |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
0 < Token ≤ 32K |
$0.144 |
$0.574 |
|
32 K < Tokens ≤ 128 K |
$0.216 |
$0.861 |
|
128 K < Tokens ≤ 256 K |
$0.359 |
$1.434 |
|
256 K < Tokens ≤ 1 M |
$0.717 |
$3.584 |
Qwen-MT
Qwen-MT は、翻訳専用のフラッグシップ大規模言語モデル(LLM)であり、Qwen 3 から全面的にスペックアップされています。中国語、英語、日本語、韓国語、フランス語、スペイン語、ドイツ語、タイ語、インドネシア語、ベトナム語、アラビア語など、92 の言語間での翻訳をサポートします。モデルの性能および翻訳品質が包括的に向上しており、用語集のカスタマイズ安定性、フォーマット保持機能、ドメイン固有のプロンプト対応が強化され、より正確で自然な翻訳を実現します。利用方法
インターナショナル
インターナショナルデプロイモードでは、エンドポイントおよびデータストレージの両方が シンガポール リージョンに配置されます。モデル推論のコンピューティングリソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力課金額 |
出力課金額 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen-mt-plus Qwen3-MT の一部:Qwen3-MT |
16,384 |
8,192 |
8,192 |
$2.46 |
$7.37 |
100 万トークン Model Studio を有効化後 90 日間有効 |
|
qwen-mt-flash Qwen3-MT の一部:Qwen3-MT |
$0.16 |
$0.49 |
||||
|
qwen-mt-lite Qwen3-MT の一部:Qwen3-MT |
$0.12 |
$0.36 |
||||
|
qwen-mt-turbo Qwen3-MT の一部:Qwen3-MT |
$0.16 |
$0.49 |
||||
グローバル
グローバルデプロイモードでは、エンドポイントおよびデータストレージの両方が 米国 (バージニア) リージョンに配置されます。モデル推論のコンピューティングリソースは、世界中で動的にスケジュールされます。
|
モデル |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力課金額 |
|
(トークン) |
(100 万トークンあたり) |
||||
|
qwen-mt-plus Qwen3-MT の一部:Qwen3-MT |
16,384 |
8,192 |
8,192 |
$0.259 |
$0.775 |
|
qwen-mt-flash Qwen3-MT の一部:Qwen3-MT |
$0.101 |
$0.280 |
|||
|
qwen-mt-lite Qwen3-MT の一部:Qwen3-MT |
$0.086 |
$0.229 |
|||
中国本土
中国本土デプロイモードでは、エンドポイントおよびデータストレージの両方が 中国 (北京) リージョンに配置されます。モデル推論のコンピューティングリソースは、中国本土内に限定されます。
|
モデル |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力課金額 |
出力課金額 |
|
(トークン) |
(100 万トークンあたり) |
||||
|
qwen-mt-plus 所属 Qwen3-MT |
16,384 |
8,192 |
8,192 |
$0.259 |
$0.775 |
|
qwen-mt-flash 所属:Qwen3-MT |
$0.101 |
$0.280 |
|||
|
qwen-mt-lite 所属 Qwen3-MT |
$0.086 |
$0.229 |
|||
|
qwen-mt-turbo 所属:Qwen3-MT |
$0.101 |
$0.280 |
|||
Qwen-Doc
Qwen データマイニングモデルは、ドキュメントから構造化情報を抽出し、データアノテーション、コンテンツモデレーション、その他のアプリケーションに利用されます。 使用方法 | API リファレンス
中国本土デプロイモード のみがサポートされています。このモードでは、エンドポイントとデータストレージは 北京リージョン に配置され、推論コンピューティングリソースは中国本土に限定されます。
|
モデル |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100万トークンあたり) |
|||||
|
qwen-doc-turbo |
262,144 |
253,952 |
32,768 |
$0.087 |
$0.144 |
無料クォータなし |
Qwen-Deep-Research
Qwen ディープリサーチモデルは、複雑な問題を分解し、Web 検索を使用して推論と分析を実行し、調査レポートを生成できます。使用方法 | API リファレンス
唯一、中国本土デプロイモードがサポートされています。このモードでは、エンドポイントとデータストレージは北京リージョンに配置され、推論コンピューティングリソースは中国本土に限定されます。
|
モデル |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(1K トークンあたり) |
||||
|
qwen-deep-research |
1,000,000 |
997,952 |
32,768 |
$0.007742 |
$0.023367 |
テキスト生成 – Qwen – オープンソース
モデル名において、`xxb` はパラメーター規模を示します。たとえば、`qwen2-72b-instruct` は 720 億パラメーターを有します。
Model Studio では、オープンソースの Qwen モデルを呼び出すことが可能です。ローカルへのデプロイは不要です。オープンソースモデルについては、Qwen3 および Qwen2.5 の利用を推奨します。
Qwen3.5
テキスト、画像、動画の入力をサポートします。プレーンテキストタスクにおいては Qwen3 Max と同等の性能を発揮し、より低いコストで優れたパフォーマンスを実現します。マルチモーダル機能に関しては、Qwen3 VL シリーズを大幅に上回る改善が図られています。
|
モデル |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大応答 |
入力コスト |
出力コスト CoT + 応答 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwen3.5-397b-a17b 思考モードがデフォルトで有効化されています |
思考モード |
262,144 |
258,048 |
81,920 |
65,536 |
段階的価格設定。詳細は以下をご参照ください。 |
各モデル 100 万トークン Model Studio を有効化した日から 90 日間有効 国際版のみ |
|
|
非思考 |
260,096 |
- |
||||||
|
qwen3.5-122b-a10b 思考モードがデフォルトで有効化されています |
思考モード |
262,144 |
258,048 |
81,920 |
65,536 |
|||
|
非思考 |
260,096 |
- |
||||||
|
qwen3.5-27b 思考モードがデフォルトで有効化されています |
思考モード |
262,144 |
258,048 |
81,920 |
65,536 |
|||
|
ノンシンキングモード |
260,096 |
- |
||||||
|
qwen3.5-35b-a3b 思考モードがデフォルトで有効化されています |
思考モード |
262,144 |
258,048 |
81,920 |
65,536 |
|||
|
ノンシンキングモード |
260,096 |
- |
||||||
`qwen3.5-397b-a17b`、`qwen3.5-122b-a10b`、`qwen3.5-27b`、および `qwen3.5-35b-a3b` モデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。
国際
|
モデル |
リクエストあたりの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
qwen3.5-397b-a17b |
0<トークン≤256K |
$0.6 |
$3.6 |
|
qwen3.5-122b-a10b |
$0.4 |
$3.2 |
|
|
qwen3.5-27b |
$0.3 |
$2.4 |
|
|
qwen3.5-35b-a3b |
$0.25 |
$2 |
グローバル版
|
モデル |
リクエストあたりの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
qwen3.5-397b-a17b |
0<トークン≤128K |
$0.172 |
$1.032 |
|
128K<トークン≤256K |
$0.43 |
$2.58 |
|
|
qwen3.5-122b-a10b |
0<トークン≤128K |
$0.115 |
$0.917 |
|
128K<トークン≤256K |
$0.287 |
$2.294 |
|
|
qwen3.5-27b |
0<トークン≤128K |
$0.086 |
$0.688 |
|
128K<トークン≤256K |
$0.258 |
$2.064 |
|
|
qwen3.5-35b-a3b |
0<トークン≤128K |
$0.057 |
$0.459 |
|
128K<トークン≤256K |
$0.229 |
$1.835 |
中国本土
|
モデル |
リクエストあたりの入力トークン数 |
入力コスト(100 万トークンあたり) |
出力コスト(100 万トークンあたり) |
|
qwen3.5-397b-a17b |
0<トークン≤128K |
$0.172 |
$1.032 |
|
128K<トークン≤256K |
$0.43 |
$2.58 |
|
|
qwen3.5-122b-a10b |
0<トークン≤128K |
$0.115 |
$0.917 |
|
128K<トークン≤256K |
$0.287 |
$2.294 |
|
|
qwen3.5-27b |
0<トークン≤128K |
$0.086 |
$0.688 |
|
128K<トークン≤256K |
$0.258 |
$2.064 |
|
|
qwen3.5-35b-a3b |
0<トークン≤128K |
$0.057 |
$0.459 |
|
128K<トークン≤256K |
$0.229 |
$1.835 |
Qwen3
2025 年 9 月にリリースされた `qwen3-next-80b-a3b-thinking` モデルは、思考モードのみをサポートします。命令追従能力を向上させ、`qwen3-235b-a22b-thinking-2507` と比較して、より簡潔な要約応答を提供します。
2025 年 9 月にリリースされた `qwen3-next-80b-a3b-instruct` モデルは、ノンシンキングモードのみをサポートします。中国語理解、論理的推論、テキスト生成能力を、`qwen3-235b-a22b-instruct-2507` と比較して向上させています。
`qwen3-235b-a22b-thinking-2507` および `qwen3-30b-a3b-thinking-2507` モデルは、2025 年 7 月にリリースされ、いずれも思考モードのみをサポートします。これらは、それぞれ `qwen3-235b-a22b`(思考モード)および `qwen3-30b-a3b`(思考モード)のスペックアップ版です。
`qwen3-235b-a22b-instruct-2507` および `qwen3-30b-a3b-instruct-2507` モデルは、2025 年 7 月にリリースされ、いずれもノンシンキングモードのみをサポートします。これらは、それぞれ `qwen3-235b-a22b`(ノンシンキングモード)および `qwen3-30b-a3b`(ノンシンキングモード)のスペックアップ版です。
2025 年 4 月にリリースされた Qwen3 モデルは、思考モードおよびノンシンキングモードの両方をサポートします。`enable_thinking` パラメーターを使用することで、モードの切り替えが可能です。さらに、Qwen3 モデルは以下の分野で大幅な改善を実現しています:
-
推論能力:数学、コード、論理的推論に関する評価において、QwQ および同程度のサイズの非推論モデルを大幅に上回り、同規模モデルとしては業界トップクラスのパフォーマンスを達成します。
-
人間の好ましさとの整合性:クリエイティブライティング、ロールの引き受け、マルチターン対話、命令追従などの能力が大幅に強化されています。汎用的な能力は、同程度のサイズの他のモデルを大きく上回ります。
-
エージェント機能:思考モードおよびノンシンキングモードの両方で業界トップクラスのパフォーマンスを発揮し、外部ツールの正確な呼び出しを可能にします。
-
多言語対応:100 言語以上および方言に対応し、多言語翻訳、命令理解、常識的推論の分野で顕著な改善を実現します。
-
応答フォーマット:以前のバージョンで見られた、不適切な Markdown レンダリング、応答の途中切断、誤ったボックス形式の出力などの問題を修正しました。
2025 年 4 月にリリースされた Qwen3 オープンソースモデルは、思考モードにおいて非ストリーミング出力をサポートしません。
Qwen3 オープンソースモデルで思考モードを有効化した場合、出力に推論プロセスが表示されないときは、ノンシンキングモードの料金が適用されます。
思考モード | ノンシンキングモード | 利用方法
国際
「国際版デプロイモード」では、エンドポイントおよびデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwen3-next-80b-a3b-thinking |
思考モードのみ |
131,072 |
126,976 |
81,920 |
32,768 |
$0.15 |
$1.2 |
各モデル 100 万トークン Model Studio を有効化した日から 90 日間有効 |
|
qwen3-next-80b-a3b-instruct |
ノンシンキングモード |
129,024 |
- |
|||||
|
qwen3-235b-a22b-thinking-2507 |
思考モードのみ |
126,976 |
81,920 |
$0.23 |
$2.3 |
|||
|
qwen3-235b-a22b-instruct-2507 |
非思考 |
129,024 |
- |
$0.92 |
||||
|
qwen3-30b-a3b-thinking-2507 |
思考モードのみ |
126,976 |
81,920 |
$0.2 |
$2.4 |
|||
|
qwen3-30b-a3b-instruct-2507 |
ノンシンキングモード |
129,024 |
- |
$0.8 |
||||
|
qwen3-235b-a22b このモデルおよび以下のモデルは 2025 年 4 月にリリースされました。 |
ノンシンキングモード |
129,024 |
- |
16,384 |
$0.7 |
$2.8 |
||
|
思考モード |
98,304 |
38,912 |
$8.4 |
|||||
|
qwen3-32b |
非思考 |
129,024 |
- |
$0.16 |
$0.64 |
|||
|
思考モード |
98,304 |
38,912 |
||||||
|
qwen3-30b-a3b |
ノンシンキングモード |
129,024 |
- |
$0.2 |
$0.8 |
|||
|
思考モード |
98,304 |
38,912 |
$2.4 |
|||||
|
qwen3-14b |
ノンシンキングモード |
129,024 |
- |
8,192 |
$0.35 |
$1.4 |
||
|
思考モード |
98,304 |
38,912 |
$4.2 |
|||||
|
qwen3-8b |
非思考 |
129,024 |
- |
$0.18 |
$0.7 |
|||
|
思考モード |
98,304 |
38,912 |
$2.1 |
|||||
|
qwen3-4b |
ノンシンキングモード |
129,024 |
- |
$0.11 |
$0.42 |
|||
|
思考モード |
98,304 |
38,912 |
$1.26 |
|||||
|
qwen3-1.7b |
ノンシンキングモード |
32,768 |
30,720 |
- |
$0.42 |
|||
|
思考モード |
28,672 |
合計値は 30,720 を超えてはなりません。 |
$1.26 |
|||||
|
qwen3-0.6b |
非思考 |
30,720 |
- |
$0.42 |
||||
|
思考モード |
28,672 |
入力の合計は 30,720 を超えてはなりません。 |
$1.26 |
|||||
グローバル版
「グローバル版デプロイモード」では、エンドポイントおよびデータストレージの両方が米国(バージニア)リージョンに配置されます。モデル推論の計算リソースは、世界中で動的にスケジュールされます。
|
モデル |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwen3-next-80b-a3b-thinking |
思考モードのみ |
131,072 |
126,976 |
81,920 |
32,768 |
$0.144 |
$1.434 |
無料クォータなし |
|
qwen3-next-80b-a3b-instruct |
非思考のみ |
129,024 |
- |
$0.574 |
||||
|
qwen3-235b-a22b-thinking-2507 |
思考モードのみ |
126,976 |
81,920 |
$0.23 |
$2.3 |
|||
|
qwen3-235b-a22b-instruct-2507 |
ノンシンキングモードのみ |
129,024 |
- |
$0.92 |
||||
|
qwen3-30b-a3b-thinking-2507 |
思考のみ |
126,976 |
81,920 |
$0.108 |
$1.076 |
|||
|
qwen3-30b-a3b-instruct-2507 |
非思考のみ |
129,024 |
- |
$0.431 |
||||
|
qwen3-235b-a22b |
ノンシンキングモード |
129,024 |
- |
16,384 |
$0.287 |
$1.147 |
||
|
思考モード |
98,304 |
38,912 |
$2.868 |
|||||
|
qwen3-32b |
ノンシンキングモード |
129,024 |
- |
$0.16 |
$0.64 |
|||
|
思考モード |
98,304 |
38,912 |
||||||
|
qwen3-30b-a3b |
ノンシンキングモード |
129,024 |
- |
$0.108 |
$0.431 |
|||
|
思考モード |
98,304 |
38,912 |
$1.076 |
|||||
|
qwen3-14b |
ノン・シンキング |
129,024 |
- |
8,192 |
$0.144 |
$0.574 |
||
|
思考モード |
98,304 |
38,912 |
$1.434 |
|||||
|
qwen3-8b |
ノンシンキングモード |
129,024 |
- |
$0.072 |
$0.287 |
|||
|
思考モード |
98,304 |
38,912 |
$0.717 |
|||||
中国本土版
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージの両方が中国(北京)リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。
|
モデル |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwen3-next-80b-a3b-thinking |
思考モードのみ |
131,072 |
126,976 |
81,920 |
32,768 |
$0.144 |
$1.434 |
無料クォータなし |
|
qwen3-next-80b-a3b-instruct |
思考モードは利用できません。 |
129,024 |
- |
$0.574 |
||||
|
qwen3-235b-a22b-thinking-2507 |
思考モードのみ |
126,976 |
81,920 |
$0.287 |
$2.868 |
|||
|
qwen3-235b-a22b-instruct-2507 |
非思考 |
129,024 |
- |
$1.147 |
||||
|
qwen3-30b-a3b-thinking-2507 |
思考モードのみ |
126,976 |
81,920 |
$0.108 |
$1.076 |
|||
|
qwen3-30b-a3b-instruct-2507 |
ノンシンキングモード |
129,024 |
- |
$0.431 |
||||
|
qwen3-235b-a22b |
ノンシンキングモード |
129,024 |
- |
16,384 |
$0.287 |
$1.147 |
||
|
思考モード |
98,304 |
38,912 |
$2.868 |
|||||
|
qwen3-32b |
ノンシンキングモード |
129,024 |
- |
$0.287 |
$1.147 |
|||
|
思考モード |
98,304 |
38,912 |
$2.868 |
|||||
|
qwen3-30b-a3b |
ノンシンキングモード |
129,024 |
- |
$0.108 |
$0.431 |
|||
|
思考モード |
98,304 |
38,912 |
$1.076 |
|||||
|
qwen3-14b |
ノンシンキングモード |
129,024 |
- |
8,192 |
$0.144 |
$0.574 |
||
|
思考モード |
98,304 |
38,912 |
$1.434 |
|||||
|
qwen3-8b |
ノンシンキングモード |
129,024 |
- |
$0.072 |
$0.287 |
|||
|
思考モード |
98,304 |
38,912 |
$0.717 |
|||||
|
qwen3-4b |
ノンシンキングモード |
129,024 |
- |
$0.044 |
$0.173 |
|||
|
思考モード |
98,304 |
38,912 |
$0.431 |
|||||
|
qwen3-1.7b |
ノンシンキングモード |
32,768 |
30,720 |
- |
$0.173 |
|||
|
思考モード |
28,672 |
入力値の合計は 30,720 を超えてはなりません。 |
$0.431 |
|||||
|
qwen3-0.6b |
ノンシンキングモード |
30,720 |
- |
$0.173 |
||||
|
思考モード |
28,672 |
入力の合計は 30,720 を超えてはなりません。 |
$0.431 |
|||||
QwQ – オープンソース
QwQ は、Qwen2.5-32B を基にトレーニングされた推論モデルです。強化学習を活用して、推論能力を大幅に向上させています。数学およびコーディングのベンチマーク(AIME 24/25、LiveCodeBench)および汎用ベンチマーク(IFEval、LiveBench)といったコア指標は、フルサイズの DeepSeek-R1 モデルと同等です。また、Qwen2.5-32B を基にした別のモデルである DeepSeek-R1-Distill-Qwen-32B と比較しても、すべての指標で顕著に上回っています。利用方法 | API リファレンス
サポートされているのは中国本土版デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージは中国(北京)リージョンに配置され、推論の計算リソースは中国本土に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大出力 | 入力コスト | 出力コスト |
(トークン) | (100 万トークンあたり) | |||||
qwq-32b | 131,072 | 98,304 | 32,768 | 8,192 | $0.287 | $0.861 |
QwQ-Preview
`qwq-32b-preview` は Qwen チームが 2024 年に開発した実験的研究モデルです。特に数学およびプログラミング分野における AI 推論能力の強化に焦点を当てています。制限事項については、「QwQ 公式ブログ」をご参照ください。利用方法 | API リファレンス | オンラインで試す
サポートされているのは中国本土版デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージは中国(北京)リージョンに配置され、推論の計算リソースは中国本土に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力コスト | 出力コスト |
(トークン) | (100 万トークンあたり) | ||||
qwq-32b-preview | 32,768 | 30,720 | 16,384 | $0.287 | $0.861 |
Qwen2.5
QVQ
`qvq-72b-preview` は Qwen チームが開発した実験的研究モデルです。特に数学分野における視覚的推論の向上に焦点を当てています。制限事項については、「QVQ 公式ブログ」をご参照ください。利用方法 | API リファレンス
最終的な回答の前に推論プロセスを表示するには、商用 QVQ モデルをご利用ください。
サポートされているのは中国本土版デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージは中国(北京)リージョンに配置され、推論の計算リソースは中国本土に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力コスト | 出力コスト |
(トークン) | (100 万トークンあたり) | ||||
qvq-72b-preview | 32,768 | 16,384 画像 1 枚あたり最大 16,384 | 16,384 | $1.721 | $5.161 |
Qwen-Omni
これは Qwen2.5 を基盤とした新しいマルチモーダル理解・生成モデルです。テキスト、画像、音声、動画の入力をサポートします。ストリーミングモードでテキストと音声を同時に生成します。マルチモーダル理解速度が大幅に向上しています。利用方法 | API リファレンス
国際版
「国際版デプロイモード」では、エンドポイントおよびデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 無料クォータ |
(トークン) | ||||
qwen2.5-omni-7b | 32,768 | 30,720 | 2,048 | 100 万トークン(モダリティの区別なし) Model Studio を有効化した日から 90 日間有効 |
無料クォータの利用後は、以下のように課金されます。
|
|
中国本土
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージは中国(北京)リージョンに配置されます。モデル推論の計算リソースは中国本土に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 |
(トークン) | |||
qwen2.5-omni-7b | 32,768 | 30,720 | 2,048 |
入力および出力の課金ルールは以下のとおりです。
|
|
Qwen3-Omni-Captioner
Qwen3-Omni-Captioner は、Qwen3-Omni を基盤としたオープンソースモデルです。プロンプトを必要とせずに、環境音、音楽、効果音を含む複雑な音声に対して正確かつ包括的な説明を生成します。話者の感情、音楽要素(ジャンルや楽器など)、センシティブなコンテンツを検出します。ユースケースには、音声コンテンツ分析、セキュリティレビュー、インテント認識、音声編集などが含まれます。利用方法 | API リファレンス
国際版
「国際版デプロイモード」では、エンドポイントおよびデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen3-omni-30b-a3b-captioner |
65,536 |
32,768 |
32,768 |
$3.81 |
$3.06 |
100 万トークン Model Studio を有効化した日から 90 日間有効 |
中国本土
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージの両方が中国(北京)リージョンに配置されます。モデル推論の計算リソースは中国本土に限定されます。
|
モデル |
コンテキストウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||
|
qwen3-omni-30b-a3b-captioner |
65,536 |
32,768 |
32,768 |
$2.265 |
$1.821 |
無料クォータなし。 |
Qwen-VL
Alibaba Cloud の Qwen-VL オープンソースモデルです。利用方法 | API リファレンス
Qwen2.5-VL と比較して、Qwen3-VL は以下の点で大幅な改善を実現しています。
-
エージェントとのインタラクション:コンピューターまたはモバイル端末のインターフェイスを操作し、GUI 要素を認識してその機能を理解し、ツールを呼び出してタスクを実行できます。OS World などの評価において業界トップクラスのパフォーマンスを達成しています。
-
視覚的コーディング:画像または動画からコードを生成し、デザインモックアップ、ウェブサイトのスクリーンショットなどの入力から HTML、CSS、JavaScript コードを作成することをサポートします。
-
空間知能:2D および 3D の位置決めをサポートし、物体の向き、視点の変化、遮蔽関係を正確に判断します。
-
長尺動画の理解:最長 20 分間の動画コンテンツを理解でき、秒単位での正確なローカライズを提供します。
-
ディープシンキング:ディープシンキング機能を備え、微細な詳細の把握や因果関係の分析に優れ、MathVista や MMMU などの評価において業界トップクラスのパフォーマンスを達成しています。
-
OCR:言語サポートが 33 言語に拡張されました。複雑な照明、ぼかし、傾いたテキストなどのシナリオでも安定したパフォーマンスを発揮します。また、希少文字、古文書、専門用語の精度も大幅に向上しています。
国際版
「国際版デプロイモード」では、エンドポイントおよびデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT + 出力 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwen3-vl-235b-a22b-thinking |
思考モードのみ |
126,976 |
81,920 |
$0.4 |
$4 |
各モデル 100 万トークン Model Studio を有効化した日から 90 日間有効 |
||
|
qwen3-vl-235b-a22b-instruct |
ノンシンキングモード |
129,024 |
- |
$1.6 |
||||
|
qwen3-vl-32b-thinking |
思考モードのみ |
131,072 |
126,976 |
81,920 |
32,768 |
$0.16 |
$0.64 |
|
|
qwen3-vl-32b-instruct |
非思考のみ |
129,024 |
- |
|||||
|
qwen3-vl-30b-a3b-thinking |
思考モードのみ |
126,976 |
81,920 |
$0.2 |
$2.4 |
|||
|
qwen3-vl-30b-a3b-instruct |
ノンシンキングモード |
129,024 |
- |
$0.8 |
||||
|
qwen3-vl-8b-thinking |
思考モード |
126,976 |
81,920 |
$0.18 |
$2.1 |
|||
|
qwen3-vl-8b-instruct |
非思考 |
129,024 |
- |
$0.7 |
||||
グローバル版
「グローバル版デプロイモード」では、エンドポイントおよびデータストレージの両方が米国(バージニア)リージョンに配置されます。モデル推論の計算リソースは、世界中で動的にスケジュールされます。
|
モデル |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT + 出力 |
|
(トークン) |
(100 万トークンあたり) |
||||||
|
qwen3-vl-235b-a22b-thinking |
思考モードのみ |
126,976 |
81,920 |
$0.287 |
$2.867 |
||
|
qwen3-vl-235b-a22b-instruct |
ノンシンキングモードのみ |
129,024 |
- |
$1.147 |
|||
|
qwen3-vl-32b-thinking |
思考中のみ |
131,072 |
126,976 |
81,920 |
32,768 |
$0.16 |
$0.64 |
|
qwen3-vl-32b-instruct |
ノンシンキングモードのみ |
129,024 |
- |
||||
|
qwen3-vl-30b-a3b-thinking |
思考モードのみ |
126,976 |
81,920 |
$0.108 |
$1.076 |
||
|
qwen3-vl-30b-a3b-instruct |
ノンシンキングモードのみ |
129,024 |
- |
$0.431 |
|||
|
qwen3-vl-8b-thinking |
思考モードのみ |
126,976 |
81,920 |
$0.072 |
$0.717 |
||
|
qwen3-vl-8b-instruct |
ノンシンキングモードのみ |
129,024 |
- |
$0.287 |
|||
中国本土
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージの両方が中国(北京)リージョンに配置されます。モデル推論の計算リソースは中国本土に限定されます。
|
モデル |
モード |
コンテキストウィンドウ |
最大入力 |
最大 CoT |
最大出力 |
入力コスト |
出力コスト CoT + 出力 |
無料クォータ |
|
(トークン) |
(100 万トークンあたり) |
|||||||
|
qwen3-vl-235b-a22b-thinking |
思考モードのみ |
131,072 |
126,976 |
81,920 |
$0.287 |
$2.867 |
無料クォータなし |
|
|
qwen3-vl-235b-a22b-instruct |
ノンシンキングモードのみ |
129,024 |
- |
$1.147 |
||||
|
qwen3-vl-32b-thinking |
思考モードのみ |
131,072 |
126,976 |
81,920 |
32,768 |
$0.287 |
$2.868 |
|
|
qwen3-vl-32b-instruct |
ノンシンキングモードのみ |
129,024 |
- |
$1.147 |
||||
|
qwen3-vl-30b-a3b-thinking |
思考モードのみ |
126,976 |
81,920 |
$0.108 |
$1.076 |
|||
|
qwen3-vl-30b-a3b-instruct |
思考なしのみ |
129,024 |
- |
$0.431 |
||||
|
qwen3-vl-8b-thinking |
思考モードのみ |
126,976 |
81,920 |
$0.072 |
$0.717 |
|||
|
qwen3-vl-8b-instruct |
ノンシンキングモードのみ |
129,024 |
- |
$0.287 |
||||
Qwen-Math
Qwen を基盤とする言語モデルで、数学問題の解決に特化しています。Qwen2.5-Math は 中国語 および 英語 をサポートし、チェーン・オブ・ソート (CoT)、プログラム・オブ・ソート (PoT)、ツール統合型推論 (TIR) など複数の推論手法を統合しています。使用方法 | API リファレンス | オンラインで試す
サポートされているのは 中国本土デプロイモード のみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論用コンピューティングリソースも中国本土内に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力コスト | 出力コスト |
(トークン) | (100 万トークンあたり) | ||||
qwen2.5-math-72b-instruct | 4,096 | 3,072 | 3,072 | $0.574 | $1.721 |
qwen2.5-math-7b-instruct | $0.144 | $0.287 | |||
qwen2.5-math-1.5b-instruct | 期間限定無料 | ||||
Qwen-Coder
オープンソースの Qwen コードモデルです。最新の Qwen3-Coder シリーズは、コーディングエージェントタスク、特にツール呼び出しと環境とのインタラクションに優れており、強力な汎用能力を維持しながら自律プログラミングを可能にします。利用ガイド | API リファレンス
インターナショナル
インターナショナルデプロイモードでは、エンドポイントとデータストレージは両方ともシンガポールリージョンにあります。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
|
モデル |
Context ウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
無料クォータ |
|
(トークン数) |
||||||
|
qwen3-coder-next |
262,144 |
204,800 |
65,536 |
段階的価格設定です。詳細は表の下の注記をご参照ください。 |
各 100 万トークン Model Studio を有効化してから 90 日間有効 |
|
|
qwen3-coder-480b-a35b-instruct |
||||||
|
qwen3-coder-30b-a3b-instruct |
||||||
上記のモデルは、現在のリクエストの入力トークン数に基づく段階的価格設定を使用します。
|
モデル |
リクエストあたりの入力トークン数 |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
qwen3-coder-next |
0 < トークン ≤ 32K |
$0.3 |
$1.5 |
|
32K < トークン ≤ 128K |
$0.5 |
$2.5 |
|
|
128K < トークン ≤ 256K |
$0.8 |
$4 |
|
|
qwen3-coder-480b-a35b-instruct |
0 < トークン ≤ 32K |
$1.5 |
$7.5 |
|
32K < トークン ≤ 128K |
$2.7 |
$13.5 |
|
|
128K < トークン ≤ 200K |
$4.5 |
$22.5 |
|
|
qwen3-coder-30b-a3b-instruct |
0 < トークン ≤ 32K |
$0.45 |
$2.25 |
|
32K < トークン ≤ 128K |
$0.75 |
$3.75 |
|
|
128K < トークン ≤ 200K |
$1.2 |
$6 |
グローバル
グローバルデプロイモードでは、エンドポイントとデータストレージは両方とも米国 (バージニア) リージョンにあります。モデル推論の計算リソースは世界中で動的にスケジュールされます。
|
モデル |
Context ウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
||||
|
qwen3-coder-480b-a35b-instruct |
262,144 |
204,800 |
65,536 |
料金は段階的です。詳細は表の下の注記をご参照ください。 |
|
|
qwen3-coder-30b-a3b-instruct |
|||||
qwen3-coder-480b-a35b-instruct と qwen3-coder-30b-a3b-instruct は、現在のリクエストの入力トークン数に基づく段階的価格設定を使用します。
|
モデル |
リクエストあたりの入力トークン数 |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
qwen3-coder-480b-a35b-instruct |
0 < トークン ≤ 32K |
$0.861 |
$3.441 |
|
32K < トークン ≤ 128K |
$1.291 |
$5.161 |
|
|
128K < トークン ≤ 200K |
$2.151 |
$8.602 |
|
|
qwen3-coder-30b-a3b-instruct |
0 < トークン ≤ 32K |
$0.216 |
$0.861 |
|
32K < トークン ≤ 128K |
$0.323 |
$1.291 |
|
|
128K < トークン ≤ 200K |
$0.538 |
$2.151 |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは両方とも中国 (北京) リージョンにあります。モデル推論の計算リソースは中国本土に限定されます。
|
モデル |
Context ウィンドウ |
最大入力 |
最大出力 |
入力コスト |
出力コスト |
|
(トークン) |
(100 万トークンあたり) |
||||
|
qwen3-coder-next |
262,144 |
204,800 |
65,536 |
段階的価格設定です。詳細は表の下の説明をご参照ください。 |
|
|
qwen3-coder-480b-a35b-instruct |
|||||
|
qwen3-coder-30b-a3b-instruct |
|||||
上記のモデルは、現在のリクエストの入力トークン数に基づく段階的価格設定を使用します。
|
モデル |
リクエストあたりの入力トークン数 |
入力コスト (100 万トークンあたり) |
出力コスト (100 万トークンあたり) |
|
qwen3-coder-next |
0 < トークン ≤ 32K |
$0.144 |
$0.574 |
|
32K < トークン ≤ 128K |
$0.216 |
$0.861 |
|
|
128K < トークン ≤ 256K |
$0.359 |
$1.434 |
|
|
qwen3-coder-480b-a35b-instruct |
0 < トークン ≤ 32K |
$0.861 |
$3.441 |
|
32K < トークン ≤ 128K |
$1.291 |
$5.161 |
|
|
128K < トークン ≤ 200K |
$2.151 |
$8.602 |
|
|
qwen3-coder-30b-a3b-instruct |
0 < トークン ≤ 32K |
$0.216 |
$0.861 |
|
32K < トークン ≤ 128K |
$0.323 |
$1.291 |
|
|
128K < トークン ≤ 200K |
$0.538 |
$2.151 |
テキスト生成 – サードパーティ
DeepSeek
DeepSeek は DeepSeek 社が開発した大規模言語モデルです。API リファレンス | オンラインで試す
中国本土
「中国本土展開モード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置されます。推論の計算リソースは中国本土内に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大応答 | 入力コスト | 出力料金 |
(トークン) | (100 万トークンあたり) | |||||
deepseek-v3.2 685B パラメーター数 コンテキストキャッシュ の割引適用 バッチ呼び出し は半額 | 131,072 | 98,304 | 32,768 | 65,536 | $0.287 | $0.431 |
deepseek-v3.2-exp 685B パラメーター数 | ||||||
deepseek-v3.1 685B パラメーター数 | $0.574 | $1.721 | ||||
deepseek-r1 685B パラメーター数 バッチ呼び出し は半額 | 16,384 | $2.294 | ||||
deepseek-r1-0528 685B パラメーター数 | ||||||
deepseek-v3 671B パラメーター数 バッチ呼び出し は半額 | 131,072 | 該当なし | $0.287 | $1.147 | ||
deepseek-r1-distill-qwen-1.5b Qwen2.5-Math-1.5B をベース | 32,768 | 32,768 | 16,384 | 16,384 | 期間限定無料トライアル | |
deepseek-r1-distill-qwen-7b Qwen2.5-Math-7B をベース | $0.072 | $0.144 | ||||
deepseek-r1-distill-qwen-14b Qwen2.5-14B をベース | $0.144 | $0.431 | ||||
deepseek-r1-distill-qwen-32b Qwen2.5-32B をベース | $0.287 | $0.861 | ||||
deepseek-r1-distill-llama-8b Llama-3.1-8B をベース | 期間限定無料トライアル | |||||
deepseek-r1-distill-llama-70b Llama-3.3-70B をベース | ||||||
Kimi
Kimi-K2 は Moonshot AI 社が開発した大規模言語モデルであり、コーディングおよびツール呼び出しに優れています。利用方法 | オンラインで試す
サポートされているのは「中国本土展開モード」のみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論の計算リソースは中国本土内に限定されます。
モデル | モード | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大応答 | 入力料金 | 出力料金 |
(トークン) | (100 万トークンあたり) | ||||||
kimi-k2.5 | シンキング | 262,144 | 258,048 | 81,920 | 98,304 | $0.574 | $3.011 |
ノンシンキング | 262,144 | 260,096 | — | 98,304 | $0.574 | $3.011 | |
kimi-k2-thinking | シンキング | 262,144 | 229,376 | 32,768 | 16,384 | $0.574 | $2.294 |
Moonshot-Kimi-K2-Instruct | ノンシンキング | 131,072 | 131,072 | — | 8,192 | $0.574 | $2.294 |
MiniMax
MiniMax は MiniMax 社が開発した大規模言語モデルであり、複雑な実世界タスクの処理に特化しており、多言語コーディングおよびエージェントタスク処理を強みとしています。利用方法
サポートされているのは「中国本土展開モード」のみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論の計算リソースは中国本土内に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大 CoT + 応答 thinking_budget は非対応 | 入力料金 | 出力料金 |
(トークン) | (100 万トークンあたり) | ||||
MiniMax-M2.5 | 196,608 | 196,601 | 32,768 | $0.304 | $1.213 |
GLM
GLM モデルは、Zhipu AI 社がエージェント向けに設計したハイブリッド推論モデルであり、シンキングモードおよびノンシンキングモードの両方をサポートします。利用方法
サポートされているのは「中国本土展開モード」のみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論の計算リソースは中国本土内に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大出力 | 入力料金 | 出力料金 |
(トークン) | (100 万トークンあたり) | |||||
glm-5 | 202,752 | 202,752 | 32,768 | 16,384 | 段階的課金(下表参照) | |
glm-4.7 | 169,984 | |||||
glm-4.6 | ||||||
これらのモデルの料金は、リクエストごとの入力トークン数によって異なります。
モデル | リクエストごとの入力トークン数 | 入力料金 (100 万トークンあたり) | 出力料金 (100 万トークンあたり) |
glm-5 | 0 < トークン数 ≤ 32K | $0.573 | $2.58 |
32K < トークン数 ≤ 198K | $0.86 | $3.154 | |
glm-4.7 | 0 < トークン数 ≤ 32K | $0.431 | $2.007 |
32K < トークン数 ≤ 166K | $0.574 | $2.294 | |
glm-4.6 | 0 < トークン数 ≤ 32K | $0.431 | $2.007 |
32K < トークン数 ≤ 166K | $0.574 | $2.294 |
これらのモデルはサードパーティサービスではなく、Alibaba Cloud Model Studio のサーバー上で完全に実行されます。
GLM モデルでは、シンキングモードおよびノンシンキングモードのいずれでも同一の料金が適用されます。
画像生成
Qwen 画像生成
Qwen Text-to-Image モデルは、複雑なテキスト、特に中国語と英語のバイリンガルテキストのレンダリングに優れています。API リファレンス
国際
国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。
モデル | 単価 | 無料クォータ |
qwen-image-2.0-pro 現在、qwen-image-2.0-pro-2026-03-03 と同じ機能を持ちます | $0.075/画像 | 新規ユーザー向けの無料クォータ:各 100 画像 有効期間:Model Studio をアクティベートしてから 90 日以内 |
qwen-image-2.0-pro-2026-03-03 | $0.075/画像 | |
qwen-image-2.0 現在、qwen-image-2.0-2026-03-03 と同じ機能を持ちます | $0.035/画像 | |
qwen-image-2.0-2026-03-03 | $0.035/画像 | |
qwen-image-max 現在、qwen-image-max-2025-12-30 と同じ機能を持ちます | $0.075/画像 | |
qwen-image-max-2025-12-30 | $0.075/画像 | |
qwen-image-plus 現在、qwen-image と同じ機能を持ちます | $0.03/画像 | |
qwen-image-plus-2026-01-09 | $0.03/画像 | |
qwen-image | $0.035/画像 |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。
モデル | 単価 | 無料クォータ |
qwen-image-2.0-pro 現在、qwen-image-2.0-pro-2026-03-03 と同じ機能を持ちます | $0.071676/画像 | 無料クォータなし |
qwen-image-2.0-pro-2026-03-03 | $0.071676/画像 | |
qwen-image-2.0 現在、qwen-image-2.0-2026-03-03 と同じ機能を持ちます | $0.028671/画像 | |
qwen-image-2.0-2026-03-03 | $0.028671/画像 | |
qwen-image-max 現在、qwen-image-max-2025-12-30 と同じ機能を持ちます | $0.071677/画像 | |
qwen-image-max-2025-12-30 | $0.071677/画像 | |
qwen-image-plus 現在、qwen-image と同じ機能を持ちます | $0.028671/画像 | |
qwen-image-plus-2026-01-09 | $0.028671/画像 | |
qwen-image | $0.035/画像 |
入力プロンプト | 出力画像 |
緑豊かな芝生の上でボールで遊ぶ 3 匹の子犬をフィーチャーした、癒し系の手描きポスター。鳥や星などの装飾的な要素で飾られています。メインタイトル「Come Play Ball!」は、太字の青いカートゥーンフォントで上部に目立つように表示されています。その下に、サブタイトル「Come [Show Off Your Skills]!」が緑色のフォントで表示されています。吹き出しには「へへ、次は僕のすごいところを友達に見せてやる!」というテキストがあり、遊び心のある魅力を加えています。下部には、「また友達とボール遊びができるね!」という補足テキストが記載されています。カラーパレットは、新鮮な緑と青を中心に、明るいピンクと黄色のトーンでアクセントをつけ、陽気で子供らしい雰囲気を強調しています。 |
|
Qwen 画像編集
Qwen 画像編集モデルは、正確なバイリンガル (中国語-英語) テキスト編集、色補正、詳細強調、スタイル変換、オブジェクトの追加または削除、位置変更、モーション調整をサポートし、複雑な画像とテキストの複合編集を可能にします。API リファレンス
国際
国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。
モデル | 単価 | 無料クォータ |
qwen-image-2.0-pro 現在、qwen-image-2.0-pro-2026-03-03 と同じ機能を持ちます | $0.075/画像 | 新規ユーザー向けの無料クォータ:各 100 画像 有効期間:Model Studio をアクティベートしてから 90 日以内 |
qwen-image-2.0-pro-2026-03-03 | $0.075/画像 | |
qwen-image-2.0 現在、qwen-image-2.0-2026-03-03 と同じ機能を持ちます | $0.035/画像 | |
qwen-image-2.0-2026-03-03 | $0.035/画像 | |
qwen-image-edit-max 現在、qwen-image-edit-max-2026-01-16 と同じ機能を持ちます | $0.075/画像 | |
qwen-image-edit-max-2026-01-16 | $0.075/画像 | |
qwen-image-edit-plus 現在、qwen-image-edit-plus-2025-10-30 と同じ機能を持ちます | $0.03/画像 | |
qwen-image-edit-plus-2025-12-15 | $0.03/画像 | |
qwen-image-edit-plus-2025-10-30 | $0.03/画像 | |
qwen-image-edit | $0.045/画像 |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。
モデル | 単価 | 無料クォータ |
qwen-image-2.0-pro 現在、qwen-image-2.0-pro-2026-03-03 と同じ機能を持ちます | $0.071676/画像 | 無料クォータなし |
qwen-image-2.0-pro-2026-03-03 | $0.071676/画像 | |
qwen-image-2.0 現在、qwen-image-2.0-2026-03-03 と同じ機能を持ちます | $0.028671/画像 | |
qwen-image-2.0-2026-03-03 | $0.028671/画像 | |
qwen-image-edit-max 現在、qwen-image-edit-max-2026-01-16 と同じ機能を持ちます | $0.071677/画像 | |
qwen-image-edit-max-2026-01-16 | $0.071677/画像 | |
qwen-image-edit-plus 現在、qwen-image-edit-plus-2025-10-30 と同じ機能を持ちます | $0.028671/画像 | |
qwen-image-edit-plus-2025-12-15 | $0.028671/画像 | |
qwen-image-edit-plus-2025-10-30 | $0.028671/画像 | |
qwen-image-edit | $0.043/画像 |
元の画像 |
人物のポーズを、立ってかがみ、犬の前足を持つように変更します。 |
元の画像 |
積み木の「HEALTH INSURANCE」という文字を「明天会更好」に置き換えます。 |
元の画像 |
水玉模様のシャツを水色のシャツに置き換えます。 |
元の画像 |
背景を南極に変更します。 |
元の画像 |
人物のカートゥーンアバターを生成します。 |
元の画像 |
皿の上の髪の毛を取り除きます。 |
Qwen 画像翻訳
Qwen 画像翻訳モデルは、画像内のテキストを 11 の言語から中国語または英語に翻訳することをサポートします。元のレイアウトとコンテンツを正確に保持し、用語定義、禁止用語フィルタリング、主題検出などのカスタム機能を提供します。 API リファレンス
中国本土デプロイモードのみがサポートされています。このモードでは、エンドポイントとデータストレージは北京リージョンに配置され、推論計算リソースは中国本土に限定されます。
モデル | 単価 | 無料クォータ |
qwen-mt-image | $0.000431/画像 | 無料クォータなし |
元の画像 |
日本語 |
ポルトガル語 |
アラビア語 |
Z-Image
Tongyi - Text-to-Image - Z-Image は、高品質の画像を迅速に生成する軽量モデルです。このモデルは、中国語と英語のテキストレンダリング、複雑なセマンティック理解、さまざまなスタイル、複数の解像度とアスペクト比をサポートしています。API リファレンス
国際
国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。
モデル | 単価 | 無料クォータ (注意) Model Studio をアクティベートしてから 90 日間有効 |
z-image-turbo | プロンプト拡張無効 ( プロンプト拡張有効 ( | 100 画像 |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。
モデル | 単価 | 無料クォータ |
z-image-turbo | プロンプト拡張無効 ( プロンプト拡張有効 ( | 無料クォータなし |
|
入力プロンプト |
出力画像 |
|
鮮やかなカートゥーンスタイルの壁画の前に自信を持って立つ、黒い短髪のスタイリッシュな若い女性の写真。彼女は全身黒の服装:フリルの襟が付いたパフボンバージャケット、カーゴショーツ、網タイツ、そしてチャンキーな黒のドクターマーチンを着用し、腰からはゴールドのチェーンがぶら下がっています。背景には 4 つのカラフルなコミックスタイルのパネルがあります:1 つは「GRAND STAGE」と書かれ、スニーカーとゲータレードのボトルが含まれています。もう 1 つは緑のナイキスニーカーとピザのスライスを表示しています。3 つ目は「HARAJUKU st」と書かれ、浮遊する靴が描かれています。そして 4 つ目は「Takeshita WELCOME.」というテキストと共にスケートボードに乗る青いマウスが描かれています。主な明るい色は黄色、ティール、オレンジ、ピンク、緑です。吹き出し、ハーフトーンパターン、そして遊び心のあるキャラクターが、都会的なストリートアートの美学を高めています。昼光がシーンを均等に照らし、彼女の足元の地面は白いタイルの舗装です。全身ポートレート、中央構図、わずかに傾いた立ち姿、カメラへの直接の視線。高精細、シャープなフォーカス、ダイナミックなフレーミング。 |
|
Wan Text-to-Image
Wan Text-to-Image モデルは、簡単なテキストプロンプトから高品質の画像を生成します。API リファレンス | オンラインで試す
グローバル
グローバルデプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースは、グローバルに動的にスケジューリングされます。
モデル | 説明 | 単価 | 無料クォータ (注意) Model Studio をアクティベートしてから 90 日間有効 |
wan2.6-t2i | Wan 2.6。新しい同期インターフェイスをサポートし、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。 | $0.028671/画像 | 無料クォータなし |
国際
国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。
モデル | 説明 | 単価 | 無料クォータ (注意) Model Studio をアクティベートしてから 90 日間有効 |
wan2.6-t2i | Wan 2.6。新しい同期インターフェイスをサポートし、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。 | $0.03/画像 | 50 画像 |
wan2.5-t2i-preview | Wan 2.5 プレビュー。片側の長さ制限を撤廃し、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。 | $0.03/画像 | 50 画像 |
wan2.2-t2i-plus | Wan 2.2 Professional Edition。創造性、安定性、リアルな質感が完全にアップグレードされました。 | $0.05/画像 | 100 画像 |
wan2.2-t2i-flash | Wan 2.2 Flash Edition。創造性、安定性、リアルな質感が完全にアップグレードされました。 | $0.025/画像 | 100 画像 |
wan2.1-t2i-plus | Wan 2.1 Professional Edition。複数のスタイルをサポートし、豊かなディテールの画像を生成します。 | $0.05/画像 | 200 画像 |
wan2.1-t2i-turbo | Wan 2.1 Turbo Edition。複数のスタイルをサポートし、高速な生成速度を提供します。 | $0.025/画像 | 200 画像 |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。
モデル | 説明 | 単価 | 無料クォータ (注意) Model Studio をアクティベートしてから 90 日間有効 |
wan2.6-t2i | Wan 2.6。新しい同期インターフェイスをサポートし、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。 | $0.028671/画像 | 無料クォータなし |
wan2.5-t2i-preview | Wan 2.5 プレビュー。片側の長さ制限を撤廃し、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。 | $0.028671/画像 | 無料クォータなし |
wan2.2-t2i-plus | Wan 2.2 Professional Edition。創造性、安定性、リアルな質感が完全にアップグレードされました。 | $0.02007/画像 | 無料クォータなし |
wan2.2-t2i-flash | Wan 2.2 Flash Edition。創造性、安定性、リアルな質感が完全にアップグレードされました。 | $0.028671/画像 | 無料クォータなし |
wanx2.1-t2i-plus | Wan 2.1 Professional Edition。複数のスタイルをサポートし、豊かなディテールの画像を生成します。 | $0.028671/画像 | 無料クォータなし |
wanx2.1-t2i-turbo | Wan 2.1 Turbo Edition。複数のスタイルをサポートし、高速な生成速度を提供します。 | $0.020070/画像 | 無料クォータなし |
wanx2.0-t2i-turbo | Wan 2.0 Turbo Edition。質感のあるポートレートやクリエイティブなデザインに優れています。費用対効果が高いです。 | $0.005735/画像 | 無料クォータなし |
プロンプト | 生成された画像 |
ニードルフェルトのサンタがプレゼントを持ち、隣には白い猫が立っている。背景にはたくさんのカラフルなプレゼントが見える。シーンはかわいらしく、暖かく、居心地の良い雰囲気で、背景にはいくつかの緑の植物がある。 |
|
Wan 画像生成および編集 2.6
Wan 画像生成モデルは、画像編集とテキストと画像の混合出力をサポートし、多様な生成および統合ニーズに対応します。API リファレンス
グローバル
グローバルデプロイモードでは、エンドポイントとデータストレージの両方が米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースは、グローバルに動的にスケジューリングされます。
モデル | 単価 | 無料クォータ |
wan2.6-image | $0.028671/画像 | 無料クォータなし |
国際
国際デプロイモードでは、エンドポイントとデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。
モデル | 単価 | 無料クォータ (注意) Model Studio をアクティベートしてから 90 日間有効 |
wan2.6-image | $0.03/画像 | 50 画像 |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージの両方が北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。
モデル | 単価 | 無料クォータ |
wan2.6-image | $0.028671/画像 | 無料クォータなし |
Wan 一般画像編集 2.5
Wan 一般画像編集 2.5 は、テキスト、単一画像、または複数画像を使用した主題一貫性編集をサポートします。また、複数画像の融合作成も可能です。API リファレンス
国際
国際デプロイモードでは、エンドポイントとデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。
モデル | 単価 | 無料クォータ (注意) Model Studio をアクティベートしてから 90 日間有効 |
wan2.5-i2i-preview | $0.03/画像 | 50 ユニット |
中国本土
中国本土デプロイモードでは、エンドポイントとデータストレージの両方が北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。
モデル | 単価 | 無料クォータ |
wan2.5-i2i-preview | $0.028671/画像 | 無料クォータなし |
|
機能 |
入力例 |
出力画像 |
|
単一画像の編集 |
|
花柄のドレスを、襟と袖口に精巧な刺繍が施されたヴィンテージスタイルのレースのロングドレスに変更します。 |
|
複数画像の融合 |
|
画像 1 の目覚まし時計を、画像 2 のダイニングテーブルの花瓶の隣に置きます。 |
Wan 一般画像編集 2.1
Wan 一般画像編集モデルは、シンプルな命令を用いて多様な画像編集タスクを実行できます。利用シーンには、画像拡張、ウォーターマーク除去、スタイル変換、画像インペインティング、イメージエンハンスメントなどがあります。利用方法 | API リファレンス
サポートされているのは、中国本土デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論用のコンピューティングリソースも中国本土内に限定されます。
モデル | 単価 | 無料クォータ |
wanx2.1-imageedit | $0.020070 / イメージ | 無料クォータなし |
一般画像編集は、現在以下の機能をサポートしています:
機能 | 入力イメージ | プロンプト | 出力イメージ |
グローバルスタイル適用 |
| フランスの絵本スタイルに変換します。 |
|
ローカルスタイル適用 |
| 建物を木目調に変更します。 |
|
命令ベース編集 |
| 女の子の髪の色を赤に変更します。 |
|
ローカル再塗装 | 入力イメージ
マスク領域(白で示す)
| 陶器製のウサギが陶器製の花を手に持っています。 | 出力イメージ
|
テキストウォーターマーク除去 |
| イメージからテキストを除去します。 |
|
画像拡張 |
| 緑の妖精。 |
|
超解像 | ぼやけたイメージ
| 超解像を適用します。 | シャープなイメージ
|
画像着色 |
| 青いバックグラウンド、黄色い葉。 |
|
スケッチからイメージ生成 |
| 北欧風ミニマリストのリビングルーム。 |
|
参照イメージ |
| 部屋の中に輝く青い宝石を慎重に覗き込んでいるアニメキャラクター。 |
|
OutfitAnyone
OutfitAnyone Plus は、Basic Edition と比較して、画像の鮮明度、生地の質感表現、ロゴの再現精度を向上させますが、生成にやや時間がかかります。生成時間の制約が厳しくないシナリオに適しています。API リファレンス | オンラインで試す
OutfitAnyone image parsing は、モデル画像と衣装画像を分離します。AI による仮想試着(AI try-on)画像の前処理および後処理にご利用いただけます。API リファレンス
中国本土デプロイモードのみがサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京)リージョンに配置され、推論用のコンピューティングリソースも中国本土内に限定されます。
モデル | 説明 | サンプル入力 | サンプル出力 |
aitryon-plus | OutfitAnyone Plus |
|
|
aitryon-parsing-v1 | OutfitAnyone image parsing |
OutfitAnyone の単価
サービス | モデル | 単価 | 割引 | ティア |
OutfitAnyone Plus | aitryon-plus | $0.071677 / イメージ | なし | なし |
OutfitAnyone image parsing | aitryon-parsing-v1 | $0.000574 / イメージ | なし | なし |
ビデオ生成 – Wan
テキストからビデオ生成
Wan のテキストからビデオ生成モデルは、1 文のプロンプトからビデオを生成し、豊かなアートスタイルと映画のような品質を実現します。API リファレンス | オンラインで試す
グローバル
グローバルデプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースはグローバルに動的にスケジュールされます。
モデル | 説明 | 単価 | 無料クォータ |
wan2.6-t2v | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 720P: $0.086012/秒 1080P: $0.143353/秒 | 無料クォータなし |
インターナショナル
インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。
モデル | 説明 | 単価 | 無料クォータ (取得) Model Studio のアクティベート後 90 日間有効 |
wan2.6-t2v | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 720P: $0.10/秒 1080P: $0.15/秒 | 50 秒 |
wan2.5-t2v-preview | Wan 2.5 プレビュー版。自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 480P: $0.05/秒 720P: $0.10/秒 1080P: $0.15/秒 | 50 秒 |
wan2.2-t2v-plus | Wan 2.2 Professional Edition。画像のディテールと動作の安定性が大幅に向上しています。 | 480P: $0.02/秒 1080P: $0.10/秒 | 50 秒 |
wan2.1-t2v-turbo | Wan 2.1 Turbo Edition。高速な生成速度とバランスの取れたパフォーマンスを実現します。 | $0.036/秒 | 200 秒 |
wan2.1-t2v-plus | Wan 2.1 Professional Edition。豊かなディテールと高品質な映像を生成します。 | $0.10/秒 | 200 秒 |
米国
米国デプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースは米国内に限定されます。
モデル | 説明 | 単価 | 無料クォータ |
wan2.6-t2v-us | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 720P: $0.1/秒 1080P: $0.15/秒 | 無料クォータなし |
中国本土
中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。
モデル | 説明 | 単価 | 無料クォータ |
wan2.6-t2v | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 720P: $0.086012/秒 1080p: 0.143353 秒あたり | 無料クォータなし |
wan2.5-t2v-preview | Wan 2.5 プレビュー版。自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 480P: $0.043006/秒 720P: $0.086012/秒 1080P: $0.143353/秒 | 無料クォータなし |
wan2.2-t2v-plus | Wan 2.2 Professional Edition。画像のディテールと動作の安定性が大幅に向上しています。 | 480P: $0.02007/秒 1080P: $0.100347/秒 | 無料クォータなし |
wanx2.1-t2v-turbo | 高速な生成速度とバランスの取れたパフォーマンスを実現します。 | $0.034405/秒 | 無料クォータなし |
wanx2.1-t2v-plus | より豊かなディテールと高品質な映像を生成します。 | $0.100347/秒 | 無料クォータなし |
入力プロンプト | 出力ビデオ (wan2.6、マルチショットビデオ) |
低いアングルからのミディアム・クローズアップで、暖色系のトーン、混合照明(机上のランプの実用光と窓からの曇天光が混ざる)、サイドライティング、中央構図で撮影されています。クラシックな探偵事務所の中には、古い事件ファイルや灰皿が詰まった木製の本棚があります。緑色の机上のランプが机の中央に広げられた事件ファイルを照らしています。ダークブラウンのトレンチコートとライトグレーのフェドラを着用したキツネが革張りの椅子に座り、真紅の毛並みと尾を軽く机の端に預けて、指先でゆっくりと黄ばんだページをめくっています。外では青空の下、穏やかな小雨が降り、窓ガラスに蛇行する水筋を描いています。キツネはゆっくりと顔を上げ、耳をわずかにぴくつかせ、琥珀色の目でカメラをまっすぐ見つめ、口をはっきりと動かしながら滑らかで皮肉たっぷりの声でこう話します。「その事件は冷えていた。冬の魚よりも冷たくな。だが、どんなニワトリにも秘密はあるものだ。少なくとも私は、それを見つけようと思っていた」。 |
画像からビデオ生成 – 初期フレーム
Wan の画像からビデオ生成モデルは、入力画像を最初のフレームとして使用し、プロンプトに基づいてビデオを生成することで、豊かなアートスタイルと映画のような品質を実現します。API リファレンス | オンラインで試す
グローバル
グローバルデプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースはグローバルに動的にスケジュールされます。
モデル | 説明 | 単価 | 無料クォータ |
wan2.6-i2v | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 720P: $0.086012/秒 1080P: $0.143353/秒 | 無料クォータなし |
インターナショナル
インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。
モデル | 説明 | 単価 | 無料クォータ (注記) Model Studio のアクティベート後 90 日間有効 |
wan2.6-i2v-flash | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 音声付き出力ビデオ
音声なし出力ビデオ
| 50 秒 |
wan2.6-i2v | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 720P: $0.10/秒 1080P: $0.15/秒 | 50 秒 |
wan2.5-i2v-preview | Wan 2.5 プレビュー版。自動吹き替えおよびカスタム音声ファイルのアップロードをサポートします。 | 480P: $0.05/秒 720P: $0.10/秒 1080P: $0.15/秒 | 50 秒 |
wan2.2-i2v-flash | Wan 2.2 Flash Edition。非常に高速な生成速度と、視覚的ディテールおよび動作の安定性が大幅に向上しています。 | 480P: $0.015/秒 720P: $0.036/秒 | 50 秒 |
wan2.2-i2v-plus | Wan 2.2 Professional Edition。視覚的ディテールおよび動作の安定性が大幅に向上しています。 | 480P: $0.02/秒 1080P: $0.10/秒 | 50 秒 |
wan2.1-i2v-turbo | Wan 2.1 Turbo Edition。高速な生成速度とバランスの取れたパフォーマンスを実現します。 | $0.036/秒 | 200 秒 |
wan2.1-i2v-plus | Wan 2.1 Professional Edition。豊かなディテールを生成し、より高品質で質感豊かな映像を実現します。 | $0.10/秒 | 200 秒 |
米国
米国デプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースは米国内に限定されます。
モデル | 説明 | 単価 | 無料クォータ |
wan2.6-i2v-us | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 720P: $0.1/秒 1080P: $0.15/秒 | 無料クォータなし |
中国本土
中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。
モデル | 説明 | 単価 | 無料クォータ |
wan2.6-i2v-flash | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 音声付き出力ビデオ
音声なし出力ビデオ
| 無料クォータなし |
wan2.6-i2v | Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。 | 720P: $0.086012/秒 1080P: $0.143353/秒 | 無料クォータなし |
wan2.5-i2v-preview | Wan 2.5 プレビュー版。自動吹き替えおよびカスタム音声ファイルのアップロードをサポートします。 | 480P: $0.043006/秒 720P: $0.086012/秒 1080P: $0.143353/秒 | 無料クォータなし |
wan2.2-i2v-plus | Wan 2.2 Professional Edition。視覚的ディテールおよび動作の安定性が大幅に向上しています。 | 480P: $0.02007/秒 1080P: $0.100347/秒 | 無料クォータなし |
wanx2.1-i2v-turbo | Wan 2.1 Turbo Edition。高速な生成速度とバランスの取れたパフォーマンスを実現します。 | $0.034405/秒 | 無料クォータなし |
wanx2.1-i2v-plus | Wan 2.1 Professional Edition。豊かなディテールを生成し、より高品質で質感豊かな映像を実現します。 | $0.100347/秒 | 無料クォータなし |
入力プロンプト | 入力初期フレーム画像および音声 | 出力ビデオ (wan2.6、マルチショットビデオ) |
アーバンファンタジーアートのシーン。ダイナミックなグラフィティスタイルのキャラクター。コンクリートの壁にスプレーペイントされた少年が生き生きと動き出します。夜の都市部の鉄道橋の下で、彼は英語で高速ラップをしながら、クラシックでエネルギッシュなラッパーのポーズをとります。照明は街灯 1 基からのみ供給され、高エネルギーで驚くほど詳細な映画のような雰囲気を作り出します。ビデオの音声は完全に彼のラップのみで構成され、他の会話やノイズは含まれません。 |
入力音声: |
画像からビデオ生成 – 初期フレームと最終フレーム
Wan の初期フレームおよび最終フレームによるビデオ生成モデルは、入力される最初と最後の 2 つのフレームとプロンプトから、滑らかで流れるようなビデオを生成します。ビデオは豊かなアートスタイルと映画のような品質を備えています。API リファレンス | オンラインで試す
インターナショナル
インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。
モデル | 単価 | 無料クォータ (注記) Model Studio のアクティベート後 90 日間有効 |
wan2.2-kf2v-flash | 480P: $0.015/秒 720P: $0.036/秒 1080P: $0.07/秒 | 50 秒 |
wan2.1-kf2v-plus | $0.10/秒 | 200 秒 |
中国本土
中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。
モデル | 単価 | 無料クォータ (注記) |
wan2.2-kf2v-flash | 480P: $0.014335/秒 720P: $0.028671/秒 1080P: $0.068809/秒 | 無料クォータなし |
wanx2.1-kf2v-plus | $0.100347/秒 | 無料クォータなし |
入力例 | 出力ビデオ | ||
最初のフレーム | 最終フレーム | プロンプト | |
|
| 写実的スタイル。黒い子猫が空を不思議そうに見上げています。カメラは目の高さから始まり、徐々に子猫の好奇心あふれる視線を上から見下ろすように移動します。 | |
動画への参照
Wan のリファレンス動画モデルは、入力動画または画像からキャラクターの外見、入力動画から音声、およびテキストプロンプトを参照して、パフォーマンス動画を生成します。API リファレンス
課金ルール: 入力動画および出力動画の両方が動画秒数で課金されます。失敗したリクエストは課金されず、無料クォータも消費しません。
入力動画の課金対象時間は最大5 秒です。詳細については、「Wan リファレンス動画」をご参照ください。
出力動画の課金対象時間は、正常に生成された秒数と等しくなります。
グローバル
グローバルデプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースはグローバルに動的にスケジュールされます。
モデル | 出力動画タイプ | 入力および出力の単価 | 無料クォータ (注記) |
wan2.6-r2v | 音声付き動画 | 720P: $0.086012/秒 1080P: $0.143353/秒 | 無料クォータなし |
インターナショナル
インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。
モデル | 出力動画タイプ | 入力および出力の単価 | 無料クォータ (注記) |
wan2.6-r2v-flash | 音声付き動画
| 720P: $0.05/秒 1080P: $0.075/秒 | 50 秒 Model Studio のアクティベート後 90 日間有効 |
音声なし動画
| 720P: $0.025/秒 1080P: $0.0375/秒 | ||
wan2.6-r2v | 音声付き動画 | 720P: $0.10/秒 1080P: $0.15/秒 | 50 秒 Model Studio のアクティベート後 90 日間有効 |
中国本土
中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。
モデル | 出力動画タイプ | 入力および出力の単価 | 無料クォータ (注記) |
wan2.6-r2v-flash | 音声付き動画
| 720P: $0.043006/秒 1080P: $0.071676/秒 | 無料クォータなし |
音声なし動画
| 720P: $0.021503/秒 1080P: $0.035838/秒 | ||
wan2.6-r2v | 音声付き動画 | 720P: $0.086012/秒 1080P: $0.143353/秒 | 無料クォータなし |
汎用ビデオ編集
Wan の汎用ビデオ編集モデルは、テキスト、画像、ビデオなどのマルチモーダル入力をサポートし、ビデオ生成および一般的な編集タスクを実行します。API リファレンス | オンラインで試す
インターナショナル
インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。
モデル | 単価 | 無料クォータ (注記) |
wan2.1-vace-plus | $0.1/秒 | 50 秒 Model Studio のアクティベート後 90 日間有効 |
中国本土
中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。
モデル | 単価 | 無料クォータ (注記) |
wanx2.1-vace-plus | $0.100347/秒 | 無料クォータなし |
汎用ビデオ編集モデルは以下の機能をサポートします。
機能 | 入力リファレンス画像 | 入力プロンプト | 出力ビデオ |
複数画像リファレンス | リファレンス画像 1 (エンティティ用)
リファレンス画像 2 (背景用)
| このビデオでは、少女が霧に包まれた古代の森の奥深くから優雅に現れます。その足取りは軽やかで、カメラは彼女の機敏な動きをすべて捉えます。少女が立ち止まり、周囲の青々とした森を見渡すと、驚きと喜びに満ちた笑みを浮かべます。この瞬間は光と影の相互作用によって捉えられ、少女と自然との素晴らしい出会いが記録されます。 | 出力ビデオ |
ビデオ再スタイリング | このビデオは、歯車や銅管で装飾された蒸気パンク風の黒い車を紳士が運転している様子を示しています。背景はレトロ要素を備えた蒸気式のキャンディ工場で、ヴィンテージで遊び心のあるシーンを作り出しています。 | ||
局所編集 | 入力ビデオ 入力マスク画像 (白い領域が編集範囲を示します)
| このビデオは、パリ風のフランスカフェを示しており、スーツを着たライオンが優雅にコーヒーをすすっています。片方の手でコーヒーカップを持ち、満足げな表情で飲んでいます。カフェは洗練されたインテリアで、柔らかなトーンと暖かい照明がライオンのいるエリアを照らしています。 | プロンプトに基づいて編集領域のコンテンツが変更されます |
ビデオ拡張 | 入力初期ビデオセグメント (1 秒) | サングラスをかけた犬がストリートでスケートボードをする、3D カートゥーン。 | 出力拡張ビデオ (5 秒) |
ビデオアウトペインティング | 優雅な女性が情熱的にバイオリンを演奏しており、その背後にはフルサイズの交響楽団がいます。 |
Wan デジタルヒューマン
1 枚のポートレート画像と音声ファイルから、自然に話したり歌ったり演技したりする動画を生成できます。このモデルを使用するには、次のモデルを順番に呼び出してください。wan2.2-s2v 画像検出 | wan2.2-s2v ビデオ生成
中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。
モデル | 説明 | 単価 |
wan2.2-s2v-detect | 入力画像が鮮明さ、単一人物フレーミング、正面向きなどの要件を満たしているかをチェックします。 | $0.000574/画像 |
wan2.2-s2v | 検証済みの画像と音声クリップを使用して、人物の動的ビデオを生成します。 | 480P: $0.071677/秒 720P: $0.129018/秒 |
入力例 | 出力ビデオ |
音声入力: |
Wan image-to-action
このサービスは標準モードとプロフェッショナルモードを提供します。人物画像とリファレンス動画を使用して、動画の被写体の動作および表情を画像の被写体に転送し、動的なアクション動画を生成します。API リファレンス
インターナショナル
インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。
モデル | サービス | 説明 | 単価 | 無料クォータ 表示 |
wan2.2-animate-move | 標準モード | アニメーションをより高速に生成し、基本的なアニメーションデモなどの軽量な要件を満たします。コストパフォーマンスに優れています。 | $0.12/秒 | 両モード合わせて合計 50 秒 |
プロフェッショナルモード | アニメーションの滑らかさが向上し、動作と表情の間のトランジションが自然になります。実写撮影に近い仕上がりになります。 | $0.18/秒 |
中国本土
中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。
モデル | サービス | 説明 | 単価 | 無料クォータ 表示 |
wan2.2-animate-move | 標準モード | より高速な生成を提供します。基本的なアニメーションデモなどの軽量なニーズに適しており、コストパフォーマンスに優れています。 | $0.06/秒 | 無料クォータなし |
プロフェッショナルモード | アニメーションの滑らかさが向上し、動作と表情の間のトランジションが自然になり、実写撮影に近い仕上がりになります。 | $0.09/秒 |
ポートレート | リファレンス動画 | 出力動画 (標準モード) | 出力動画 (プロフェッショナルモード) |
|
Wan ビデオキャラクタースワップ
このサービスは標準モードとプロフェッショナルモードを提供します。入力画像の人物で動画の主被写体を置き換えながら、元のシーン、照明、カラートーンを保持します。API リファレンス
インターナショナル
インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。
モデル | サービス | 説明 | 単価 | 無料クォータ 表示 |
wan2.2-animate-mix | 標準モード | アニメーションをより高速に生成し、基本的なアニメーションデモなどの軽量なワークロードを満たします。コストパフォーマンスに優れています。 | $0.18/秒 | 両サービス合わせて合計 50 秒 |
プロフェッショナルモード | アニメーションの滑らかさが向上し、動作と表情の間のトランジションが自然になります。実写撮影により近い結果を生成します。 | $0.26/秒 |
中国本土
中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。
モデル | サービス | 説明 | 単価 | 無料クォータ 表示 |
wan2.2-animate-mix | 標準モード | より高速な生成を提供します。基本的なアニメーションデモなどの軽量なニーズに適しています。コスト効率に優れています。 | $0.09/秒 | 無料クォータなし |
プロフェッショナルモード | アニメーションの滑らかさが強化されます。動作と表情の間のトランジションが自然になります。実写撮影により近い結果を提供します。 | $0.13/秒 |
人物画像 | リファレンス動画 | 出力動画 (標準モード) | 出力動画 (プロフェッショナルモード) |
|
AnimateAnyone
このサービスは、人物画像とモーショントンプレートからアニメーション動画を生成します。このサービスを直接使用するには、次の 3 つのモデルを順番に呼び出してください。AnimateAnyone 画像検出 API の詳細 | AnimateAnyone モーショントンプレート生成 | AnimateAnyone ビデオ生成 API の詳細
中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。
モデル | 説明 | 単価 |
animate-anyone-detect-gen2 | 入力画像が要件を満たしているかをチェックします。 | $0.000574/画像 |
animate-anyone-template-gen2 | モーション動画からキャラクターの動作を取得し、アクションテンプレートを生成します。 | $0.011469/秒 |
animate-anyone-gen2 | キャラクター画像とアクションテンプレートからキャラクターのモーション動画を生成します。 |
入力画像 | アクション動画 | 画像背景付き出力 | 動画背景付き出力 |
|
上記の例は、AnimateAnyone を統合したアプリによって生成されました。
AnimateAnyone の出力は音声を含まず、ビデオフレームのみです。
EMO
このサービスは、ポートレート画像と人間の声の音声ファイルから動的なポートレート動画を生成します。このサービスを使用するには、次のモデルを順番に呼び出してください。EMO 画像検出 API リファレンス | EMO ビデオ生成 API リファレンス
中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。
モデル | 説明 | 単価 |
emo-detect-v1 | 入力画像が要件を満たしているかをチェックします。デプロイは不要で、直接呼び出すことができます。 | $0.000574/画像 |
emo-v1 | 動的なポートレート動画を生成します。デプロイは不要で、直接呼び出すことができます。 |
|
入力: ポートレート画像および人間の声の音声ファイル | 出力: 動的なポートレート動画 |
ポートレート画像:
人間の声の音声: 右側の動画を参照してください。 | ポートレート動画: アクションスタイルの強度設定を使用: アクティブ ("style_level": "active")。 |
LivePortrait
このサービスは、ポートレート画像と人間の声の音声ファイルから動的なポートレート動画を迅速かつ効率的に生成します。EMO と比較して、LivePortrait はより高速で低コストですが、視覚的品質は低くなります。このサービスを使用するには、次の 2 つのモデルを順番に呼び出してください。LivePortrait 画像検出 | LivePortrait ビデオ生成
中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。
モデル | 説明 | 単価 |
liveportrait-detect | 入力画像が要件を満たしているかをチェックします | $0.000574/画像 |
liveportrait | 動的なポートレート動画を生成します | $0.002868/秒 |
入力: ポートレート画像および音声ファイル | 出力: 動的なポートレート動画 |
ポートレート画像:
音声: 右側の動画を参照してください。 | ポートレート動画: |
Emoji
このサービスは、顔画像とプリセットの顔のモーションテンプレートからアニメーション顔動画を生成します。ユースケースには、絵文字の作成やビデオアセットの生成が含まれます。このサービスを使用するには、次のモデルを順番に呼び出してください。Emoji 画像検出 | Emoji ビデオ生成
中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。
モデル | 説明 | 単価 |
emoji-detect-v1 | 入力画像が要件を満たしているかをチェックします。 | $0.000574/画像 |
emoji-v1 | ポートレート画像と指定された絵文字テンプレートから一致する絵文字動画を生成します。 | $0.011469/秒 |
入力: ポートレート画像 | 出力: 動的なポートレート動画 |
| "Happy" 絵文字テンプレートシーケンス ("input.driven_id": "mengwa_kaixin") |
VideoRetalk
このサービスは、ソース動画と人間の声の音声ファイルから、話者の口の動きが入力音声に一致する新しい動画を生成します。このサービスを使用するには、次のモデルを呼び出してください。API リファレンス
中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。
モデル | 説明 | 単価 |
videoretalk | 入力音声に合わせて話者の口の動きを同期させた動画を生成します | $0.011469/秒 |
ビデオスタイル変換
このサービスは、ユーザーが提供するテキストに基づいて異なるスタイルの動画を生成するか、入力動画を再スタイリングします。API リファレンス
中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。
モデル | 説明 | 単価 | |
video-style-transform | 入力動画を日本漫画、アメリカンコミック、その他のアートスタイルに変換します。 | 720P | $0.071677/秒 |
540P | $0.028671/秒 | ||
入力動画 | 出力動画 (日本漫画) |
音声合成(テキスト・トゥ・スピーチ)
Qwen 音声合成
多言語混在のテキスト入力とストリーミング方式のオーディオ出力をサポートします。使用方法 | API リファレンス
国際
国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
Qwen3-TTS-Instruct-Flash
モデル | バージョン | 単価 | 最大入力文字数 | 無料クォータ (注) |
qwen3-tts-instruct-flash 現在、qwen3-tts-instruct-flash-2026-01-26。 | Stable | $0.115/10K 文字 | 600 | 10,000 文字 Model Studio を有効化した日から 90 日間有効 |
qwen3-tts-instruct-flash-2026-01-26 | Snapshot |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-VD
モデル | バージョン | 単価 | 最大入力文字数 | 無料クォータ (注) |
qwen3-tts-vd-2026-01-26 | Snapshot | $0.115/10,000 文字 | 600 | 10,000 文字 Model Studio を有効化した日から 90 日間有効 |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-VC
モデル | バージョン | 単価 | 最大入力文字数 | 無料クォータ (注) |
qwen3-tts-vc-2026-01-22 | Snapshot | $0.115/10K 文字 | 600 | 10,000 文字 Model Studio を有効化した日から 90 日間有効。 |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-Flash
モデル | バージョン | 単価 | 最大入力文字数 | 無料クォータ (注) |
qwen3-tts-flash 現在、qwen3-tts-flash-2025-11-27。 | Stable | $0.10/10,000 文字 | 600 | 10,000 文字 Model Studio を有効化した日から 90 日間有効 |
qwen3-tts-flash-2025-11-27 | Snapshot | |||
qwen3-tts-flash-2025-09-18 | Snapshot | 2025 年 11 月 13 日 00:00 以前に Alibaba Cloud Model Studio を有効化した場合:2,000 文字 2025 年 11 月 13 日 00:00 以降に Alibaba Cloud Model Studio を有効化した場合:10,000 文字 Model Studio を有効化した日から 90 日間有効。 |
対応言語:中国語(標準語、北京、上海、四川、南京、陝西、閩南、天津、広東)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
中国本土
中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。
Qwen3-TTS-Instruct-Flash
モデル | バージョン | 単価 | 最大入力文字数 | 無料クォータ (注) |
qwen3-tts-instruct-flash 現在、qwen3-tts-instruct-flash-2026-01-26。 | Stable | $0.115/10K 文字 | 600 | 無料クォータはありません。 |
qwen3-tts-instruct-flash-2026-01-26 | Snapshot |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-VD
モデル | バージョン | 単価 | 最大入力文字数 | 無料クォータ (注) |
qwen3-tts-vd-2026-01-26 | Snapshot | $0.115/10K 文字 | 600 | 無料クォータはありません。 |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-VC
モデル | バージョン | 単価 | 最大入力文字数 | 無料クォータ (注) |
qwen3-tts-vc-2026-01-22 | Snapshot | $0.115/10K 文字 | 600 | 無料クォータはありません。 |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-Flash
モデル | バージョン | 単価 | 最大入力文字数 | 無料クォータ (注) |
qwen3-tts-flash 現在、qwen3-tts-flash-2025-11-27。 | Stable | $0.114682/10,000 文字 | 600 | 無料クォータはありません。 |
qwen3-tts-flash-2025-11-27 | Snapshot | |||
qwen3-tts-flash-2025-09-18 | Snapshot |
対応言語:中国語(標準語、北京、上海、四川、南京、陝西、閩南、天津、広東)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen-TTS
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力コスト | 出力コスト | 無料クォータ (注) |
(トークン) | (1,000 トークンあたり) | ||||||
qwen-tts qwen-tts-2025-04-10 と同等の機能を提供します。 | Stable | 8,192 | 512 | 7,680 | $0.230 | $1.434 | 無料クォータはありません。 |
qwen-tts-latest 最新のスナップショットと同等の機能を提供します。 | Latest | ||||||
qwen-tts-2025-05-22 | Snapshot | ||||||
qwen-tts-2025-04-10 | |||||||
オーディオからトークンへの変換ルール:オーディオ 1 秒につき 50 トークンが生成されます。1 秒未満のオーディオは 50 トークンとして計算されます。
Qwen リアルタイム音声合成
ストリーミング方式のテキスト入力およびストリーミング方式のオーディオ出力をサポートします。テキストの内容および句読点に基づいて、自動的に話速を調整できます。使用方法 | API リファレンス
Qwen3-TTS-Instruct-Flash-Realtime は Qwen リアルタイム音声合成 をサポートし、デフォルト音声のみを使用できます。クローン音声およびカスタム音声には対応していません。
Qwen3-TTS-VD-Realtime は、Qwen 音声デザイン API リファレンス で提供される音声をリアルタイム音声合成に使用できますが、デフォルト音声には対応していません。
Qwen3-TTS-VC-Realtime は、Qwen 音声クローニング API リファレンス で提供される音声をリアルタイム音声合成に使用できますが、デフォルト音声には対応していません。
Qwen3-TTS-Flash-Realtime および Qwen-TTS-Realtime は、デフォルト音声のみを使用できます。クローン音声およびカスタム音声には対応していません。
国際版
国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
Qwen3-TTS-Instruct-Flash-Realtime
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-tts-instruct-flash-realtime 現在、qwen3-tts-instruct-flash-realtime-2026-01-22。 | Stable | $0.143/10K 文字 | 10,000 文字 Model Studio を有効化した日から 90 日間有効。 |
qwen3-tts-instruct-flash-realtime-2026-01-22 | Snapshot |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-VD-Realtime
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-tts-vd-realtime-2026-01-15 | Snapshot | $0.143353/10,000 文字 | 10,000 文字 Model Studio を有効化した日から 90 日間有効 |
qwen3-tts-vd-realtime-2025-12-16 | Snapshot |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-VC-Realtime
モデル | バージョン | 単価 | 無料クォータ(注) |
qwen3-tts-vc-realtime-2026-01-15 | Snapshot | $0.13/10K 文字 | 10,000 文字 Model Studio を有効化した日から 90 日間有効。 |
qwen3-tts-vc-realtime-2025-11-27 | Snapshot |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-Flash-Realtime
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-tts-flash-realtime 現在、qwen3-tts-flash-realtime-2025-11-27。 | Stable | $0.13/10,000 文字 | 10,000 文字 Model Studio を有効化した日から 90 日間有効 |
qwen3-tts-flash-realtime-2025-11-27 | Snapshot | ||
qwen3-tts-flash-realtime-2025-09-18 | Snapshot | 2025 年 11 月 13 日 00:00 以前に Alibaba Cloud Model Studio を有効化した場合:2,000 文字 2025 年 11 月 13 日 00:00 以降に Alibaba Cloud Model Studio を有効化した場合:10,000 文字 Model Studio を有効化した日から 90 日間有効 |
対応言語:中国語(標準語、北京、上海、四川、南京、陝西、閩南、天津、広東)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
中国本土
中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。
Qwen3-TTS-Instruct-Flash-Realtime
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-tts-instruct-flash-realtime 現在の機能は qwen3-tts-instruct-flash-realtime-2026-01-22 と一致します。 | Stable | $0.143/10,000 文字 | 無料クォータはありません |
qwen3-tts-instruct-flash-realtime-2026-01-22 | Snapshot |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-VD-Realtime
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-tts-vd-realtime-2026-01-15 | Snapshot | $0.143353/10,000 文字 | 無料クォータはありません |
qwen3-tts-vd-realtime-2025-12-16 | Snapshot |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-VC-Realtime
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-tts-vc-realtime-2026-01-15 | Snapshot | $0.143353/10,000 文字 | 無料クォータはありません。 |
qwen3-tts-vc-realtime-2025-11-27 | Snapshot |
対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen3-TTS-Flash-Realtime
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-tts-flash-realtime 現在、qwen3-tts-flash-realtime-2025-11-27。 | Stable | $0.143353/10,000 文字 | 無料クォータはありません。 |
qwen3-tts-flash-realtime-2025-11-27 | Snapshot | ||
qwen3-tts-flash-realtime-2025-09-18 | Snapshot |
対応言語:中国語(標準語、北京、上海、四川、南京、陝西、閩南、天津、広東)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語
文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。
中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字
その他の文字(英字、句読点、空白など)= 1 文字
Qwen-TTS-Realtime
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力コスト | 出力コスト | 対応言語 | 無料クォータ (注) |
(トークン) | (1,000 トークンあたり) | |||||||
qwen-tts-realtime 現在、qwen-tts-realtime-2025-07-15。 | Stable | 8,192 | 512 | 7,680 | $0.345 | $1.721 | 中国語、英語 | 無料クォータはありません。 |
qwen-tts-realtime-latest 現在、qwen-tts-realtime-2025-07-15。 | Latest | 中国語、英語 | ||||||
qwen-tts-realtime-2025-07-15 | Snapshot | 中国語、英語 | ||||||
オーディオからトークンへの変換ルール:オーディオ 1 秒につき 50 トークンが生成されます。1 秒未満のオーディオは 50 トークンとして計算されます。
Qwen 音声クローニング
音声クローニングでは、大規模モデルによる特徴抽出を活用し、トレーニングなしで音声をクローンできます。10~20 秒の音声を提供することで、非常に類似した自然なカスタム音声を生成できます。使用方法 | API リファレンス
国際
国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
モデル | 単価 | 無料クォータ (注) |
qwen-voice-enrollment | $0.01/音声 | 1,000 音声 Model Studio を有効化した日から 90 日間有効。 |
中国本土版
中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。
モデル | 単価 | 無料クォータ (注) |
qwen-voice-enrollment | $0.01/音声 | 無料クォータはありません。 |
Qwen 音声デザイン
音声デザインは、テキストによる説明からカスタム音声を生成します。多言語および多次元の音声特徴量定義をサポートしており、CM 吹き替え、キャラクター制作、音声コンテンツ制作などのアプリケーションに適しています。使用方法 | API リファレンス
国際版
国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
モデル | 単価 | 無料クォータ (注) |
qwen-voice-design | $0.2/音声 | 10 ボイス Model Studio を有効化した日から 90 日間有効。 |
中国本土
中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。
モデル | 単価 | 無料クォータ (注) |
qwen-voice-design | $0.20/音声 | 無料クォータはありません。 |
CosyVoice 音声合成
CosyVoice は、Alibaba Cloud が提供する次世代生成型音声合成モデルです。大規模事前学習言語モデルに基づき、テキスト理解と音声生成を深く統合しており、リアルタイムのストリーミング方式テキスト・トゥ・スピーチ合成をサポートします。使用方法 | API リファレンス
国際版
国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
モデル | 単価 | 無料クォータ (注) |
cosyvoice-v3-plus | $0.26/10K 文字 | 10,000 文字 Model Studio を有効化した日から 90 日間有効。 |
cosyvoice-v3-flash | $0.13/10K 文字 |
文字数算出ルール:中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)は 2 文字としてカウントされます。その他の文字(英字、数字、日本語/韓国語の仮名など)は 1 文字としてカウントされます。SSML タグの内容は課金対象外です。
中国本土版
中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。
モデル | 単価 | 無料クォータ (注) |
cosyvoice-v3.5-plus | $0.22/10K 文字 | 無料クォータはありません |
cosyvoice-v3.5-flash | $0.116/10K 文字 | |
cosyvoice-v3-plus | $0.286706/10K 文字 | |
cosyvoice-v3-flash | $0.14335/10K 文字 | |
cosyvoice-v2 | $0.286706/10K 文字 |
文字数算出ルール:中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)は 2 文字としてカウントされます。その他の文字(英字、数字、日本語/韓国語の仮名など)は 1 文字としてカウントされます。SSML タグの内容は課金対象外です。
音声認識(音声テキスト変換)および翻訳(音声翻訳)
Qwen3-LiveTranslate-Flash
Qwen3-LiveTranslate-Flash は、Qwen3-Omni アーキテクチャを基盤とする音声・動画翻訳モデルです。中国語、英語、ロシア語、フランス語など18言語間の翻訳をサポートします。このモデルは視覚的な文脈を活用して翻訳精度を向上させ、テキストおよび音声の両方を出力します。利用方法 | API リファレンス
国際版
「国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 無料クォータ (注) |
(トークン) | |||||
qwen3-livetranslate-flash 現在、qwen3-livetranslate-flash-2025-12-01。 | Stable | 53,248 | 49,152 | 4,096 | 各 100 万トークン Model Studio を有効化した日から 90 日間有効 |
qwen3-livetranslate-flash-2025-12-01 | Snapshot | ||||
入力および出力の課金ルールは以下のとおりです:
|
|
中国本土版
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 無料クォータ (注) |
(トークン) | |||||
qwen3-livetranslate-flash 現在、qwen3-livetranslate-flash-2025-12-01。 | Stable | 53,248 | 49,152 | 4,096 | 無料クォータはありません。 |
qwen3-livetranslate-flash-2025-12-01 | Snapshot | ||||
入力および出力の課金ルールは以下のとおりです:
|
|
Qwen3-LiveTranslate-Flash-Realtime
Qwen3-LiveTranslate-Flash-Realtime は、マルチリンガル対応のリアルタイム音声・動画翻訳モデルです。18言語の音声をリアルタイムで認識し、10言語へリアルタイムで音声翻訳できます。
主な特徴:
多言語対応:中国語、英語、フランス語、ドイツ語、ロシア語、日本語、韓国語など18言語および中国語の広東語、四川語、閩南語などの6つの方言に対応しています。
視覚的補強:映像コンテンツを活用して翻訳精度を向上させます。口の動き、動作、画面上のテキストを分析することで、騒音環境下や多義語の翻訳精度を高めます。
低遅延:同時通訳の遅延を最短 3 秒まで実現します。
高品質な同時通訳:意味単位予測技術を用いて、言語間の語順の違いに対応します。リアルタイム翻訳の品質はオフライン翻訳と同等です。
自然な音声:人間のような自然な音声を生成します。ソース音声の内容に応じてトーンや感情を自動調整します。
国際
「国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 無料クォータ |
(トークン) | |||||
qwen3-livetranslate-flash-realtime 現在、qwen3-livetranslate-flash-realtime-2025-09-22。 | Stable | 53,248 | 49,152 | 4,096 | 100 万トークン Model Studio を有効化した日から 90 日間有効。 |
qwen3-livetranslate-flash-realtime-2025-09-22 | Snapshot | ||||
無料クォータを使い切った後の入力および出力の課金ルールは以下のとおりです:
|
|
トークン算出ルール:
音声:入力または出力の音声 1 秒につき 12.5 トークンを消費します。
画像:28×28 ピクセルの入力ごとに 0.5 トークンを消費します。
中国本土
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 無料クォータ (注) |
(トークン) | |||||
qwen3-livetranslate-flash-realtime 現在、qwen3-livetranslate-flash-realtime-2025-09-22。 | Stable | 53,248 | 49,152 | 4,096 | 無料クォータはありません。 |
qwen3-livetranslate-flash-realtime-2025-09-22 | Snapshot | ||||
入力および出力の課金ルールは以下のとおりです:
|
|
トークン算出ルール:
音声:入力または出力の音声 1 秒につき 12.5 トークンを消費します。
画像:28×28 ピクセルの入力ごとに 0.5 トークンを消費します。
Qwen 音声ファイル認識
Qwen のマルチモーダル基盤モデルを基に構築された本モデルは、多言語認識、歌唱認識、ノイズ拒否などの機能をサポートします。利用方法 | API リファレンス
国際
「国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。
Qwen3-ASR-Flash-Filetrans
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-asr-flash-filetrans 現在、qwen3-asr-flash-filetrans-2025-11-17。 | Stable | $0.000035/秒 | 36,000 秒(10 時間) Model Studio を有効化した日から 90 日間有効。 |
qwen3-asr-flash-filetrans-2025-11-17 | Snapshot |
対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語
対応サンプルレート:任意
Qwen3-ASR-Flash
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-asr-flash 現在、qwen3-asr-flash-2025-09-08。 | Stable | 1 秒あたり $0.000035 | 36,000 秒(10 時間) Model Studio を有効化した日から 90 日間有効。 |
qwen3-asr-flash-2026-02-10 | Snapshot | ||
qwen3-asr-flash-2025-09-08 | Snapshot |
対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語
対応サンプルレート:任意
US
「米国版デプロイモード」では、エンドポイントおよびデータストレージが 米国 (バージニア) リージョン に配置されます。モデル推論の計算リソースは米国に限定されます。
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-asr-flash-us 現在、qwen3-asr-flash-2025-09-08-us。 | Stable | $0.000035/秒 | 無料クォータはありません。 |
qwen3-asr-flash-2025-09-08-us | Snapshot |
対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語
対応サンプルレート:任意
中国本土
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。
Qwen3-ASR-Flash-Filetrans
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-asr-flash-filetrans qwen3-asr-flash-filetrans-2025-11-17 と同等の機能を提供します。 | Stable | $0.000032/秒 | 無料クォータはありません。 |
qwen3-asr-flash-filetrans-2025-11-17 | Snapshot |
対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語
対応サンプルレート:任意
Qwen3-ASR-Flash
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-asr-flash 現在、qwen3-asr-flash-2025-09-08。 | Stable | $0.000032/秒 | 無料クォータはありません。 |
qwen3-asr-flash-2026-02-10 | Snapshot | ||
qwen3-asr-flash-2025-09-08 | Snapshot |
対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語
対応サンプルレート:任意
Qwen リアルタイム音声認識
Qwen リアルタイム音声認識は、自動言語検出機能を備えたモデルであり、11言語をサポートし、複雑な音声環境下でも正確な文字起こしが可能です。利用方法 | API リファレンス
国際
「国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルな地域で動的にスケジュールされます。
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-asr-flash-realtime 現在、qwen3-asr-flash-realtime-2025-10-27 | Stable | $0.00009/秒 | 36,000 秒(10 時間) Model Studio を有効化した日から 90 日間有効。 |
qwen3-asr-flash-realtime-2026-02-10 | Snapshot | ||
qwen3-asr-flash-realtime-2025-10-27 | Snapshot |
対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語
対応サンプルレート:8 kHz、16 kHz
中国本土
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土のみに限定されます。
モデル | バージョン | 単価 | 無料クォータ (注) |
qwen3-asr-flash-realtime 現在、qwen3-asr-flash-realtime-2025-10-27 | Stable | $0.000047/秒 | 無料クォータはありません |
qwen3-asr-flash-realtime-2026-02-10 | Snapshot | ||
qwen3-asr-flash-realtime-2025-10-27 | Snapshot |
対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語
対応サンプルレート:8 kHz、16 kHz
Paraformer 音声認識
Paraformer 音声認識には、録音ファイル認識およびリアルタイム音声認識の 2 種類のバージョンがあります。
録音ファイル認識
中国本土版デプロイモードのみがサポートされています。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置され、推論計算リソースは中国本土に限定されます。
モデル | 単価 | 無料クォータ (注) |
paraformer-v2 | $0.000012/秒 | 無料クォータはありません |
paraformer-8k-v2 |
対応言語:
paraformer-v2:中国語(標準語、広東語、呉語、閩南語、東北官話、甘粛話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陝西話、山東話、四川話、天津話、江西話、雲南話、上海話)、英語、日本語、韓国語、ドイツ語、フランス語、ロシア語
paraformer-8k-v2:中国語(標準語)
対応サンプルレート:
paraformer-v2:任意
paraformer-8k-v2:8 kHz
対応音声フォーマット:AAC、AMR、AVI、FLAC、FLV、M4A、MKV、MOV、MP3、MP4、MPEG、OGG、OPUS、WAV、WEBM、WMA、WMV
リアルタイム音声認識
中国本土版デプロイモードのみがサポートされています。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置され、推論計算リソースは中国本土に限定されます。
モデル | 単価 | 無料クォータ (注) |
paraformer-realtime-v2 | $0.000035/秒 | 無料クォータはありません |
paraformer-realtime-8k-v2 |
対応言語:
paraformer-realtime-v2:中国語(標準語、広東語、呉語、閩南語、東北官話、甘粛話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陝西話、山東話、四川話、天津話、江西話、雲南話、上海話)、英語、日本語、韓国語、ドイツ語、フランス語、ロシア語
paraformer-realtime-8k-v2:中国語(標準語)
対応サンプルレート:
paraformer-realtime-v2:任意
paraformer-realtime-8k-v2:8 kHz
対応音声フォーマット:PCM、WAV、MP3、OPUS、SPEEX、AAC、AMR
Fun-ASR 音声認識
Fun-ASR 音声認識には、音声ファイル認識およびリアルタイム音声認識の 2 種類のバージョンがあります。
音声ファイル認識
国際版
「国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルで動的にスケジュールされます。
モデル | バージョン | 単価 | 無料クォータ (注) |
fun-asr 現在、fun-asr-2025-11-07 | Stable | $0.000035/秒 | 36,000 秒(10 時間) 有効期間:90 日 |
fun-asr-2025-11-07 fun-asr-2025-08-25 より遠距離 VAD を改善し、精度を向上 | Snapshot | ||
fun-asr-2025-08-25 | |||
fun-asr-mtl 現在、fun-asr-mtl-2025-08-25 | Stable | ||
fun-asr-mtl-2025-08-25 | Snapshot |
対応言語:
fun-asr および fun-asr-2025-11-07:標準語、広東語、呉語、閩南語、客家語、贛語、湘語、晋語。また、中原官話、西南官話、冀魯官話、江淮官話、蘭銀官話、膠遼官話、東北官話、北京官話、香港・台湾地区の標準語アクセント(河南省、陝西省、湖北省、四川省、重慶市、雲南省、貴州省、広東省、広西チワン族自治区、河北省、天津市、山東省、安徽省、南京市、江蘇省、杭州市、甘粛省、寧夏回族自治区など)もサポート。さらに英語および日本語にも対応。
fun-asr-2025-08-25:標準語および英語。
fun-asr-mtl および fun-asr-mtl-2025-08-25:標準語、広東語、英語、日本語、韓国語、ベトナム語、インドネシア語、タイ語、マレー語、フィリピン語、アラビア語、ヒンディー語、ブルガリア語、クロアチア語、チェコ語、デンマーク語、オランダ語、エストニア語、フィンランド語、ギリシャ語、ハンガリー語、アイルランド語、ラトビア語、リトアニア語、マルタ語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スウェーデン語。
対応サンプルレート:任意
対応音声フォーマット:aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv
中国本土
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。
モデル | バージョン | 単価 | 無料クォータ (注) |
fun-asr 現在、fun-asr-2025-11-07 | Stable | $0.000032 / 秒 | 無料クォータはありません |
fun-asr-2025-11-07 fun-asr-2025-08-25 より遠距離 VAD を改善し、精度を向上 | Snapshot | ||
fun-asr-2025-08-25 | |||
fun-asr-mtl 現在、fun-asr-mtl-2025-08-25 | Stable | ||
fun-asr-mtl-2025-08-25 | Snapshot |
対応言語:
fun-asr および fun-asr-2025-11-07:標準語、広東語、呉語、閩南語、客家語、贛語、湘語、晋語。また、中原官話、西南官話、冀魯官話、江淮官話、蘭銀官話、膠遼官話、東北官話、北京官話、香港・台湾地区の標準語アクセント(河南省、陝西省、湖北省、四川省、重慶市、雲南省、貴州省、広東省、広西チワン族自治区、河北省、天津市、山東省、安徽省、南京市、江蘇省、杭州市、甘粛省、寧夏回族自治区など)もサポート。さらに英語および日本語にも対応。
fun-asr-2025-08-25:標準語および英語。
fun-asr-mtl および fun-asr-mtl-2025-08-25:標準語、広東語、英語、日本語、韓国語、ベトナム語、インドネシア語、タイ語、マレー語、フィリピン語、アラビア語、ヒンディー語、ブルガリア語、クロアチア語、チェコ語、デンマーク語、オランダ語、エストニア語、フィンランド語、ギリシャ語、ハンガリー語、アイルランド語、ラトビア語、リトアニア語、マルタ語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スウェーデン語。
対応サンプルレート:任意
対応音声フォーマット:aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv
リアルタイム音声認識
国際
「国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルで動的にスケジュールされます。
モデル | バージョン | 単価 | 無料クォータ (注) |
fun-asr-realtime 現在、fun-asr-realtime-2025-11-07 | Stable | $0.00009/秒 | 36,000 秒(10 時間) 有効期間:90 日 |
fun-asr-realtime-2025-11-07 | Snapshot |
対応言語:標準語、広東語、呉語、閩南語、客家語、贛語、湘語、晋語。また、中原官話、西南官話、冀魯官話、江淮官話、蘭銀官話、膠遼官話、東北官話、北京官話、香港・台湾地区の標準語アクセント(河南省、陝西省、湖北省、四川省、重慶市、雲南省、貴州省、広東省、広西チワン族自治区、河北省、天津市、山東省、安徽省、南京市、江蘇省、杭州市、甘粛省、寧夏回族自治区など)もサポート。さらに英語および日本語にも対応。
対応サンプルレート:16 kHz
対応音声フォーマット:pcm、wav、mp3、opus、speex、aac、amr
中国本土
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。
モデル | バージョン | 単価 | 無料クォータ (注) |
fun-asr-realtime 現在、fun-asr-realtime-2025-11-07 | Stable | $0.000047/秒 | 無料クォータはありません |
fun-asr-realtime-2026-02-28 | Snapshot | ||
fun-asr-realtime-2025-11-07 | Snapshot | ||
fun-asr-realtime-2025-09-15 | |||
fun-asr-flash-8k-realtime 現在、fun-asr-flash-8k-realtime-2026-01-28 | Stable | $0.000032/秒 | |
fun-asr-flash-8k-realtime-2026-01-28 | Snapshot |
対応言語:
fun-asr-realtime、fun-asr-realtime-2026-02-28、fun-asr-realtime-2025-11-07:中国語(標準語、広東語、呉語、閩南語、客家語、贛語、湘語、晋語。また、中原官話、西南官話、冀魯官話、江淮官話、蘭銀官話、膠遼官話、東北官話、北京官話、香港・台湾地区の標準語アクセント(河南省、陝西省、湖北省、四川省、重慶市、雲南省、貴州省、広東省、広西チワン族自治区、河北省、天津市、山東省、安徽省、南京市、江蘇省、杭州市、甘粛省、寧夏回族自治区など))、英語、日本語。
fun-asr-realtime-2025-09-15:中国語(標準語)、英語
対応サンプルレート:16 kHz
対応サンプルレート:
fun-asr-flash-8k-realtime および fun-asr-flash-8k-realtime-2026-01-28:8 kHz
その他のすべてのモデル:16 kHz
対応音声フォーマット:pcm、wav、mp3、opus、speex、aac、amr
テキスト埋め込み
テキスト埋め込みモデルは、テキストをその意味を表す数値ベクターに変換します。検索、クラスタリング、レコメンデーション、分類などのタスクをサポートします。課金は入力トークン数に基づきます。API リファレンス
国際
「国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルで動的にスケジュールされます。
モデル | 埋め込みディメンション | バッチサイズ | バッチあたり最大トークン数 | 対応言語 | 単価 (100 万トークンあたり) | 無料クォータ |
text-embedding-v4 「Qwen3-Embedding」シリーズの一部 | 2,048、1,536、1,024(デフォルト)、768、512、256、128、64 | 10 | 8,192 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、100 を超える主要言語および複数のプログラミング言語 | $0.07 | 100 万トークン Model Studio の有効化後 90 日間有効 |
text-embedding-v3 | 1,024(デフォルト)、768、512 | 10 | 8,192 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、50 を超える言語 | 50 万トークン Model Studio の有効化後 90 日間有効 |
中国本土版
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土内に限定されます。
モデル | 埋め込みディメンション | バッチサイズ | バッチあたり最大トークン数 | 対応言語 | 単価 (100 万トークンあたり) | 無料クォータ |
text-embedding-v4 「Qwen3-Embedding」シリーズの一部 バッチ呼び出しは半額 | 2,048、1,536、1,024(デフォルト)、768、512、256、128、64 | 10 | 8,192 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、100 を超える主要言語および複数のプログラミング言語 | $0.072 | 無料クォータなし |
中国 (香港)
モデル | 埋め込みディメンション | バッチサイズ | バッチあたり最大トークン数 | 対応言語 | 単価 (100 万トークンあたり) | 無料クォータ |
text-embedding-v4 Qwen3-Embedding シリーズの一部 | 2,048、1,536、1,024(デフォルト)、768、512、256、128、64 | 10 | 8,192 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、100 を超える主要言語および複数のプログラミング言語 | $0.07 | 100 万トークン Model Studio の有効化後 90 日間有効 |
バッチサイズとは、1 回の API 呼び出しで処理可能なテキストの最大数です。たとえば、text-embedding-v4 のバッチサイズは 10 であるため、1 回のリクエストで最大 10 件のテキストを送信でき、各テキストの長さは 8,192 トークンを超えてはなりません。この制限は以下の入力形式に適用されます。
文字列配列入力:配列には最大 10 個の要素を含めることができます。
ファイル入力:テキストファイルには最大 10 行を含めることができます。
マルチモーダル埋め込み
マルチモーダル埋め込みモデルは、テキスト、イメージ、または動画を浮動小数点ベクターに変換します。このモデルは、動画分類、画像分類、およびクロスモーダル取得をサポートします。関連 API
国際
国際展開モードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルで動的にスケジュールされます。
モデル | データ型 | 埋め込みディメンション | 単価(100万トークンあたり) | 無料クォータ (注) |
tongyi-embedding-vision-plus | float(32) | 1,152 | $0.09 | 100万トークン Model Studio の有効化から 90 日間有効 |
tongyi-embedding-vision-flash | float(32) | 768 | イメージまたは動画:$0.03 テキスト:$0.09 |
中国本土
中国本土デプロイモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置されます。モデル推論の計算リソースは、中国本土内に限定されます。
モデル | データ型 | 埋め込みディメンション | 単価(100万トークンあたり) |
qwen3-vl-embedding | float32 | 2560、2048、1536、1024、768、512、または 256 | イメージまたは動画:$0.258 テキスト:$0.10 |
multimodal-embedding-v1 | 1,024 | 無料トライアル |
再ランキング
クエリと候補テキスト(ドキュメント)のリストが与えられた場合、候補をクエリとの関連性に基づいて最も関連性が高いものから順に並べ替えます。API リファレンス
国際版
「国際版デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除くグローバル範囲で動的にスケジュールされます。
モデル | 最大ドキュメント数 | 1 行あたりの最大トークン数 | 最大入力トークン数 | 対応言語 | 単価(100 万トークンあたり) |
qwen3-rerank | 500 | 4,000 | 30,000 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、100 を超える主要言語 | $0.1 |
1 行あたりの最大トークン数:各クエリまたはドキュメントは最大 4,000 トークンまで含めることができます。この長さを超える入力は切り捨てられます。
最大ドキュメント数:1 回のリクエストあたり最大 500 ドキュメントまで処理可能です。
最大入力トークン数:すべてのクエリおよびドキュメントに含まれるトークン総数は、1 回のリクエストあたり 30,000 を超えてはなりません。
中国本土版
「中国本土版デプロイモード」では、エンドポイントおよびデータストレージは 中国 (北京) リージョンに配置されます。モデル推論用の計算リソースは中国本土内に限定されます。
モデル | 最大ドキュメント数 | 1 行あたりの最大トークン数 | 最大入力トークン数 | 対応言語 | 単価(100 万トークンあたり) |
qwen3-vl-rerank | 100 | 8,000 | 120,000 | 中国語、英語、日本語、韓国語、フランス語、ドイツ語など、33 言語 | 画像:$0.258 テキスト:$0.1 |
gte-rerank-v2 | 500 | 4,000 | 30,000 | 中国語、英語、日本語、韓国語、タイ語、スペイン語、フランス語、ポルトガル語、ドイツ語、インドネシア語、アラビア語など、50 を超える言語 | $0.115 |
1 行あたりの最大トークン数:各クエリまたはドキュメントは最大 4,000 トークンまで含めることができます。この長さを超える入力は切り捨てられます。
最大ドキュメント数:1 回のリクエストあたり最大 500 ドキュメントまで処理可能です。
最大入力トークン数:すべてのクエリおよびドキュメントに含まれるトークン総数は、1 回のリクエストあたり 30,000 を超えてはなりません。
ドメイン固有
意図の理解
意図の理解モデルは、100 ミリ秒未満でユーザーの意図を迅速かつ正確に解析し、ユーザーのリクエストを解決するための適切なツールを選択します。関連 API | 利用方法
サポートされているのは、中国本土デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論用の計算リソースは中国本土内に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力コスト | 出力コスト |
(トークン) | (100 万トークンあたり) | ||||
tongyi-intent-detect-v3 | 8,192 | 8,192 | 1,024 | $0.058 | $0.144 |
ロールプレイ
Qwen のロールの引き受けモデルは、仮想的な交流、ゲーム内の NPC、IP レプリケーション、ハードウェア・おもちゃ・車載システムなど、人間らしさを重視した対話シナリオ向けに設計されています。他の Qwen モデルと比較して、キャラクターの忠実度、トピックの進行性、共感的な傾聴能力が向上しています。利用方法
国際版
国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジュールされます。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力コスト | 出力コスト |
(トークン) | (100 万トークンあたり) | ||||
qwen-plus-character | 32,768 | 30,000 | 4,000 | $0.5 | $1.4 |
qwen-plus-character-ja | 8,192 | 7,680 | 512 | $0.5 | $1.4 |
中国本土版
「中国本土デプロイモード」では、エンドポイントおよびデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは中国本土に限定されます。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力コスト | 出力コスト |
(トークン) | (100 万トークンあたり) | ||||
qwen-plus-character | 32,768 | 32,000 | 4,096 | $0.115 | $0.287 |
非推奨モデル
2026 年 1 月 30 日に非推奨
カテゴリ | モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力コスト(100 万トークンあたり) | 出力コスト(100 万トークンあたり) | 代替 |
(トークン) | |||||||
Qwen-Plus | qwen-plus-2024-11-27 | 131,072 | 129,024 | 8,192 | $0.115 | $0.287 | qwen-plus-2025-12-01 |
qwen-plus-2024-11-25 | |||||||
qwen-plus-2024-09-19 | |||||||
qwen-plus-2024-08-06 | 128,000 | $0.574 | $1.721 | ||||
Qwen-Turbo | qwen-turbo-2024-09-19 | 131,072 | 129,023 | 8,192 | $0.044 | $0.087 | qwen-flash-2025-07-28 |
Qwen-VL | qwen-vl-max-2024-10-30 | 32,768 | 30,720 イメージごとに最大 16,384 | 2,048 | $2.868 | $2.868 | qwen3-vl-plus-2025-12-19 |
qwen-vl-max-2024-08-09 | |||||||
qwen-vl-plus-2024-08-09 | $0.216 | $0.646 | qwen3-vl-flash-2025-10-15 | ||||


























































