すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:モデルリスト

最終更新日:Mar 22, 2026

主力モデル

国際

国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンにあります。推論コンピューティングリソースは、中国本土を除き、全世界で動的にスケジュールされます。

Qwen3.5-Plus は、テキスト、画像、動画の入力をサポートしています。そのテキストパフォーマンスは Qwen3-Max に匹敵しますが、より高速でコスト効率に優れています。また、そのマルチモーダル機能は Qwen3-VL シリーズを大幅に上回ります。

主力モデル

new Qwen3-Max

複雑なタスクに最適、最も高性能

new Qwen3.5-Plus

パフォーマンス、速度、コストのバランスが取れたモデル

new Qwen3.5-Flash

単純なタスクに最適、高速かつコスト効率が高い

最大コンテキストウィンドウ

(トークン)

262,144

1,000,000

1,000,000

最小入力価格

(100 万トークンあたり)

$1.2

$0.4

$0.1

最小出力価格

(100 万トークンあたり)

$6

$2.4

$0.4

グローバル

グローバルデプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンにあります。推論コンピューティングリソースは全世界で動的にスケジュールされます。

Qwen3.5-Plus は、テキスト、画像、動画の入力をサポートしています。そのテキストパフォーマンスは Qwen3-Max に匹敵しますが、より高速でコスト効率に優れています。また、そのマルチモーダル機能は Qwen3-VL シリーズを大幅に上回ります。

主力モデル

new Qwen3-Max

複雑なタスクに最適、最も高性能

new Qwen3.5-Plus

パフォーマンス、速度、コストのバランスが取れたモデル

new Qwen3.5-Flash

単純なタスクに最適、高速かつコスト効率が高い

最大コンテキストウィンドウ

(トークン)

262,144

1,000,000

1,000,000

最小入力価格

(100 万トークンあたり)

$0.359

$0.115

$0.029

最小出力価格

(100 万トークンあたり)

$1.434

$0.688

$0.287

米国

米国デプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンにあります。推論コンピューティングリソースは米国内に限定されます。

主力モデル

new Qwen-Plus

パフォーマンス、速度、コストのバランスが取れたモデル

new Qwen-Flash

単純なタスクに最適、高速かつコスト効率が高い

最大コンテキストウィンドウ

(トークン)

1,000,000

1,000,000

最小入力価格

(100 万トークンあたり)

$0.4

$0.05

最小出力価格

(100 万トークンあたり)

$1.2

$0.4

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンにあります。推論コンピューティングリソースは中国本土に限定されます。

Qwen3.5-Plus は、テキスト、画像、動画の入力をサポートしています。そのテキストパフォーマンスは Qwen3-Max に匹敵しますが、より高速でコスト効率に優れています。また、そのマルチモーダル機能は Qwen3-VL シリーズを大幅に上回ります。

主力モデル

new Qwen3-Max

複雑なタスクに最適、最も高性能

new Qwen3.5-Plus

パフォーマンス、速度、コストのバランスが取れたモデル

new Qwen3.5-Flash

単純なタスクに最適、高速かつコスト効率が高い

最大コンテキストウィンドウ

(トークン)

262,144

1,000,000

1,000,000

最小入力価格

(100 万トークンあたり)

$0.359

$0.115

$0.029

最小出力価格

(100 万トークンあたり)

$1.434

$0.688

$0.287

モデル概要

国際

国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンにあり、モデル推論の計算リソースは中国本土を除く全世界で動的にスケジュールされます。

カテゴリ

サブカテゴリ

説明

テキスト生成

汎用大規模言語モデル

Qwen 大規模言語モデル:

マルチモーダルモデル

視覚理解モデル (Qwen-PlusQwen-VLQVQ)、オムニモーダルモデル Qwen-Omni、およびリアルタイムマルチモーダルモデル Qwen-Omni-Realtime

ドメインモデル

コーダーモデル翻訳モデルロールプレイングモデル

画像生成

Text-to-Image

  • Qwen 画像生成: 複雑な命令の処理、中国語と英語のテキストのレンダリング、高解像度のリアルな画像の生成に優れています。また、効率と品質の要件に基づいて異なるモデルを選択できます。

  • Wan Text-to-Image:

  • Z-Image: 高品質な画像を迅速に生成できる軽量な Text-to-Image モデルで、バイリンガルレンダリング (中国語と英語)、複雑なセマンティクス理解、複数の芸術的スタイルをサポートします。

画像編集

  • Qwen 画像編集: 中国語と英語のプロンプト入力をサポートし、スタイル変換、テキスト修正、オブジェクト編集などの複雑な画像テキスト編集操作を可能にします。また、複数画像の融合もサポートしており、さまざまな産業アプリケーションシナリオに適しています。

  • Wan 画像編集: 複数画像の融合、スタイル変換、オブジェクト検出、画像修復、ウォーターマーク除去などのシナリオに適しています。モデルシリーズには、Wan2.6Wan2.5 が含まれます。

音声合成と認識

音声合成 (Text-to-Speech)

Qwen 音声合成Qwen リアルタイム音声合成 は、音声合成を可能にし、インテリジェント音声カスタマーサービス、オーディオブック、車載ナビゲーション、教育指導などのシナリオに適しています。

音声認識と翻訳

Qwen リアルタイム ASRQwen 音声ファイル ASRQwen3-LiveTranslate-Flash-Realtime、および Fun-ASR は、音声テキスト変換を可能にし、リアルタイム会議の文字起こし、リアルタイムライブストリーミングキャプション、電話カスタマーサービスなどのシナリオに適しています。

動画生成

Text-to-Video

1 文から動画を生成し、豊かなスタイルと精細な画質を特徴とします。

Image-to-Video

  • 最初のフレームから動画へ: 入力画像を動画の最初のフレームとして使用し、プロンプトに基づいて動画を生成します。

  • 最初と最後のフレームから動画へ: 最初と最後のフレーム画像を提供するだけで、プロンプトに基づいて滑らかな動的動画を生成できます。

  • 複数画像の動画生成: 1 つ以上の画像をサポートし、画像内のエンティティまたは背景を参照し、プロンプトを使用して動画を生成します。

Video-to-Video

リファレンス動画: 入力動画または画像のキャラクターの外見、入力動画の声、およびテキストプロンプトを参照して、パフォーマンス動画を生成します。

汎用動画編集

一般動画編集: 入力されたテキスト、画像、動画に基づいて、さまざまな動画編集タスクを実行できます。たとえば、入力動画からモーション特徴量を抽出し、プロンプトを使用して新しい動画を生成します。

埋め込み

テキスト埋め込み

テキストをテキストを表す数値のセットに変換し、検索、クラスタリング、推奨、分類タスクに適しています。

グローバル

グローバルデプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンにあり、モデル推論の計算リソースは全世界で動的にスケジュールされます。

カテゴリ

サブカテゴリ

説明

テキスト生成

汎用大規模言語モデル

Qwen 大規模言語モデル:

マルチモーダルモデル

視覚理解モデル Qwen-VL

ドメインモデル

コーダーモデル翻訳モデル

画像生成

Text-to-Image

画像編集

  • Wan 画像編集: 複数画像の融合、スタイル変換、オブジェクト検出、画像修復、ウォーターマーク除去などのシナリオに適しています。モデルシリーズ: Wan2.6

動画生成

Text-to-Video

1 文から動画を生成し、豊かなスタイルと精細な画質を特徴とします。

Image-to-Video

Image-to-Video – 最初のフレーム: 入力画像を最初のフレームとして使用し、プロンプトに基づいて動画を生成します。

Video-to-Video

リファレンス動画: 入力動画または画像のキャラクターの外見、入力動画の声、およびテキストプロンプトを参照して、パフォーマンス動画を生成します。

米国

米国デプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンにあり、モデル推論の計算リソースは米国内に限定されます。

カテゴリ

サブカテゴリ

説明

テキスト生成

汎用大規模言語モデル

Qwen 大規模言語モデル: 商用 (Qwen-PlusQwen-Flash)

マルチモーダルモデル

視覚理解モデル Qwen-VL

動画生成

Text-to-Video

1 文から動画を生成し、豊かなスタイルと精細な画質を特徴とします。

Image-to-Video

最初のフレームから動画へ: 入力画像を最初のフレームとして使用し、プロンプトに基づいて動画を生成します。

音声認識

音声認識

Qwen 音声ファイル認識 は、音声テキスト変換を可能にし、会議の議事録やライブキャプションなどのシナリオに適しています。

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンにあり、モデル推論の計算リソースは中国本土に限定されます。

カテゴリ

サブカテゴリ

説明

テキスト生成

汎用大規模言語モデル

マルチモーダルモデル

視覚理解モデル (Qwen-PlusQwen-VL、および QVQ) およびオムニモーダルモデル Qwen-Omni

ドメインモデル

コーダーモデル数学モデル翻訳モデルデータマイニングモデル深層研究モデル意図認識モデルロールプレイングモデル

画像生成

Text-to-Image

  • Qwen 画像生成: 複雑な命令の処理、中国語と英語のテキストのレンダリング、高解像度のリアルな画像の生成に優れています。効率と品質の要件に基づいて異なるモデルを選択できます。

  • Wanx Text-to-Image:

  • Z-Image: 高品質な画像を迅速に生成できる軽量な Text-to-Image モデルで、バイリンガルレンダリング (中国語と英語)、複雑なセマンティクス理解、複数の芸術的スタイルをサポートします。

画像編集

汎用モデル:

  • Qwen 画像編集: 中国語と英語のプロンプト入力をサポートし、スタイル変換、テキスト修正、オブジェクト編集などの複雑な画像とテキストの編集操作を実行できます。また、複数画像の融合もサポートしており、さまざまな産業アプリケーションシナリオに適しています。

  • Wan 画像編集: 複数画像の融合、スタイル変換、オブジェクト検出、画像修復、ウォーターマーク除去などのシナリオをサポートします。モデルシリーズには、Wan2.6Wan2.5Wan2.1 が含まれます。

その他のモデル: Qwen 画像翻訳OutfitAnyone

音声合成と認識

音声合成 (Text-to-Speech)

Qwen 音声合成Qwen リアルタイム音声合成、および CosyVoice 音声合成 は、音声テキスト変換をサポートし、インテリジェント音声カスタマーサービス、オーディオブック、車載ナビゲーション、教育指導などのシナリオに適しています。

音声認識と翻訳

Qwen リアルタイム音声認識Qwen 音声ファイル文字起こしFun-ASR 音声認識、および Paraformer 音声認識 は、音声をテキストに変換し、リアルタイム会議の文字起こし、リアルタイムライブストリーミングキャプション、コールセンターサービスなどのシナリオに適しています。

動画編集と生成

Text-to-Video

1 文から動画を生成し、豊かなスタイルと精細な画質を特徴とします。

Image-to-Video

  • Image-to-Video – 最初のフレーム: 入力画像を最初のフレームとして、プロンプトに基づいて完全な動画を生成します。

  • Image-to-Video – 最初と最後のフレーム: 最初と最後のフレーム画像を提供し、プロンプトと組み合わせて自然なトランジションを持つ動画を生成します。

  • 複数画像から動画へ: 1 つ以上の入力画像からエンティティまたは背景に基づいて動画を生成し、プロンプトと組み合わせます。

  • 画像 + アクションテンプレートでダンス動画を生成: AnimateAnyone は、人物画像とアクション動画からダンス動画を生成します。

  • 画像 + 音声で口パク動画を生成

    • Wan デジタルヒューマン は、人物の画像と音声を使用して、大きく自然な動きを持つデジタルヒューマンを生成し、全身、半身、ポートレートのフレーミングオプションをサポートし、歌唱やパフォーマンスなどのシナリオに最適です。

    • EMO は、人物のポートレート画像と音声を使用して、優れた口パクと顔の表情機能を提供し、ポートレートと半身形式をサポートし、クローズアップのキャラクターシナリオに最適です。

    • LivePortrait は、人物の画像と音声を使用し、音声アナウンスシナリオに適しています。

  • 画像 + 絵文字テンプレートで絵文字ステッカー動画を生成: Emoji は、顔画像と事前設定された顔のアニメーションテンプレートに基づいて、顔の絵文字ステッカー動画を生成します。

Video-to-Video

リファレンス動画: 入力動画または画像のキャラクターの外見、入力動画の声、およびテキストプロンプトを参照して、パフォーマンス動画を生成します。

一般動画編集

  • 一般動画編集: 入力されたテキストプロンプト、画像、動画に基づいて、さまざまな動画編集タスクを実行できます。たとえば、入力動画からモーション特徴量を抽出し、プロンプトと組み合わせて新しい動画を生成できます。

  • 動画の口パク置換: VideoRetalk は、人物の動画と音声を使用し、ショート動画制作や動画翻訳などのシナリオに適しています。

  • 動画スタイル変換: 動画スタイル変換 は、動画を日本のアニメやアメリカンコミックなどのスタイルに変換できます。

埋め込み

テキスト埋め込み

テキストをテキストを表す数値のセットに変換し、検索、クラスタリング、推奨、分類などに使用します。

マルチモーダル埋め込み

テキスト、画像、音声を数値のセットに変換し、音声/動画分類、画像分類、画像テキスト検索などに使用します。

テキスト生成 – Qwen

このセクションでは、Qwen モデルの商用版について説明します。オープンソース版と比較して、商用モデルは最新の機能と改善点を提供します。

商用モデルのパラメーター数は非公開です。
モデルは定期的に更新されます。固定バージョンを使用するには、スナップショット版を選択してください。スナップショット版は、次期スナップショット版がリリースされてから 1 か月間、通常はメンテナンスされます。
安定版または最新版の使用を推奨します。これらのバージョンは、レート制限の条件がより緩和されています。

Qwen-Max

Qwen シリーズで最も強力なモデルであり、複雑で多段階のタスクに最適です。利用方法 | 思考モード | API リファレンス | オンラインで試す

国際

国際デプロイモード」では、エンドポイントおよびデータストレージはいずれも シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力トークン数

入力コスト

出力コスト

CoT + 出力

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-max

現在のバージョン:qwen3-max-2026-01-23
Qwen3 シリーズに属します
組み込みツールの呼び出し

Stable

思考モード

262,144

258,048

81,920

32,768

段階的価格設定です。詳細については、以下の表をご参照ください。

各モデル 100 万トークン

Model Studio の有効化後 90 日間有効

非思考

-

65,536

qwen3-max-2026-01-23

思考モード(別名:Qwen3-Max-Thinking
Qwen3 シリーズに属します
組み込みツールの呼び出し

Snapshot

思考モード

81,920

32,768

非思考

-

65,536

qwen3-max-2025-09-23

Qwen3 シリーズに属します

Snapshot

ノンシンキングモードのみ

qwen3-max-preview

Qwen3 シリーズに属します

Preview

思考モード

81,920

32,768

ノンシンキングモード

-

65,536

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

qwen3-max および qwen3-max-preview は コンテキストキャッシュ をサポートしています。

出力コスト(100 万トークンあたり)

0<トークン≤32K

$1.2

$6

32K<トークン≤128K

$2.4

$12

128K<トークン≤252K

$3

$15

その他のモデル

モデル

バージョン

コンテキストウィンドウ

最大入力トークン数

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen-max

現在のバージョン:qwen-max-2025-01-25
バッチ呼び出し は半額です

Stable

32,768

30,720

8,192

$1.6

$6.4

各モデル 100 万トークン

Model Studio の有効化後 90 日間有効

qwen-max-latest

常に最新のスナップショットです

Latest

$1.6

$6.4

qwen-max-2025-01-25

別名:qwen-max-0125、Qwen2.5-Max

Snapshot

グローバル

グローバルデプロイモード」では、エンドポイントおよびデータストレージはいずれも 米国(バージニア)リージョン に配置されます。モデル推論の計算リソースは、世界中で動的にスケジュールされます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力トークン数

Max CoT

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-max

現在のバージョン:qwen3-max-2025-09-23
コンテキストキャッシュ の割引が適用可能です

Stable

ノンシンキングモードのみ

262,144

258,048

-

65,536

段階的価格設定です。詳細については、以下の表をご参照ください。

なし

qwen3-max-2025-09-23

Snapshot

ノンシンキングのみ

qwen3-max-preview

コンテキストキャッシュ の割引が適用可能です

Preview

考え中

81,920

32,768

ノンシンキングモード

-

65,536

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

モデル

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

CoT + 応答

qwen3-max

バッチ呼び出し は半額です
コンテキストキャッシュ の割引が適用可能です

0<トークン≤32K

$0.359

$1.434

32K<トークン≤128K

$0.574

$2.294

128K<トークン≤252K

$1.004

$4.014

qwen3-max-2026-01-23

0<トークン≤32K

$0.359

$1.434

32K<トークン≤128K

$0.574

$2.294

128K<トークン≤252K

$1.004

$4.014

qwen3-max-2025-09-23

0<トークン≤32K

$0.861

$3.441

32K<トークン≤128K

$1.434

$5.735

128K<トークン≤252K

$2.151

$8.602

qwen3-max-preview

コンテキストキャッシュ の割引が適用可能です

0<トークン≤32K

$0.861

$3.441

32K<トークン≤128K

$1.434

$5.735

128K<トークン≤252K

$2.151

$8.602

中国本土

中国本土デプロイモード」では、エンドポイントおよびデータストレージはいずれも 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力トークン数

最大 CoT

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen3-max

現在のバージョン:qwen3-max-2026-01-23
Qwen3 シリーズに属します
組み込みツールの呼び出し

Stable

思考モード

262,144

258,048

81,920

32,768

段階的価格設定です。詳細については、以下の表をご参照ください。

ノンシンキングモード

-

65,536

qwen3-max-2026-01-23

思考モード(別名:Qwen3-Max-Thinking
Qwen3 シリーズに属します
組み込みツールの呼び出し

Snapshot

思考モード

81,920

32,768

非思考

-

65,536

qwen3-max-2025-09-23

Qwen3 シリーズに属します

Snapshot

ノンシンキングモードのみ

qwen3-max-preview

Qwen3 シリーズに属します

Preview

思考

81,920

32,768

ノンシンキングモード

-

65,536

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

モデル

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

CoT + 応答

qwen3-max

バッチ呼び出し 半額
コンテキストキャッシュ の割引が適用可能です

0<トークン≤32K

$0.359

$1.434

32K<トークン≤128K

$0.574

$2.294

128K<トークン≤252K

$1.004

$4.014

qwen3-max-2026-01-23

0<トークン≤32K

$0.359

$1.434

32K<トークン≤128K

$0.574

$2.294

128K<トークン≤252K

$1.004

$4.014

qwen3-max-2025-09-23

0<トークン≤32K

$0.861

$3.441

32K<トークン≤128K

$1.434

$5.735

128K<トークン≤252K

$2.151

$8.602

qwen3-max-preview

コンテキストキャッシュ の割引が適用可能です

0<トークン≤32K

$0.861

$3.441

32K<トークン≤128K

$1.434

$5.735

128K<トークン≤252K

$2.151

$8.602

その他のモデル

モデル

バージョン

コンテキストウィンドウ

最大入力トークン数

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen-max

現在のバージョン:qwen-max-2024-09-19
バッチ呼び出し は半額です

Stable

32,768

30,720

8,192

$0.345

$1.377

qwen-max-latest

常に最新のスナップショットです。
バッチ呼び出し は半額です

Latest

131,072

129,024

qwen-max-2025-01-25

別名:qwen-max-0125、Qwen2.5-Max

Snapshot

qwen-max-2024-09-19

別名:qwen-max-0919

32,768

30,720

$2.868

$8.602

中国(香港)

モデル

バージョン

モード

コンテキストウィンドウ

最大入力トークン数

最大 CoT

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-max

現在のバージョン:qwen3-max-2026-01-23
Qwen3 シリーズに属します
組み込みツールの呼び出し

Stable

思考中

262,144

258,048

81,920

32,768

段階的価格設定です。詳細については、以下の表をご参照ください。

各モデル 100 万トークン

Model Studio の有効化後 90 日間有効

ノンシンキングモード

-

65,536

qwen3-max-2026-01-23

思考モード(別名:Qwen3-Max-Thinking
Qwen3 シリーズに属します
組み込みツールの呼び出し

Snapshot

思考モード

81,920

32,768

ノンシンキングモード

-

65,536

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

qwen3-max および qwen3-max-preview は コンテキストキャッシュ をサポートしています。

出力コスト(100 万トークンあたり)

0<トークン≤32K

$1.2

$6

32K<トークン≤128K

$2.4

$12

128K<トークン≤252K

$3

$15

qwen3-max-2026-01-23 思考モード:2025 年 9 月 23 日のスナップショットと比較して、思考モードとノンシンキングモードを効果的に統合し、モデル全体のパフォーマンスを大幅に向上させています。思考モードでは、Web 検索、Web 抽出、コードインタープリターの 3 つのツールを統合することで、複雑な問題に対する推論精度を高めています。

qwen3-max、qwen3-max-2026-01-23、および qwen3-max-2025-09-23 モデルは、検索エージェントをネイティブにサポートしています。詳細については、「Web 検索」をご参照ください。

Qwen-Plus

Qwen-Plus は、Qwen-Max と Qwen-Flash の間で推論性能、コスト、および速度のバランスを取ったモデルであり、中程度の複雑さを持つタスクに最適です。

利用方法 | 思考モード | API リファレンス | オンラインで試す

Qwen3.5 Plus は、テキスト、画像、および動画の入力をサポートします。テキスト処理タスクにおいては Qwen3 Max と同等の性能を発揮し、より低いコストで優れたパフォーマンスを実現します。マルチモーダル機能では、Qwen3 VL シリーズと比較して大幅な改善が見られます。

国際

国際デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

[最大出力]

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3.5-plus

現在のバージョン:qwen3.5-plus-2026-02-15
デフォルトで思考モードが有効です

Stable

1,000,000

思考モード

983,616

ノンシンキングモード

991,808

65,536

最大 CoT:81,920

段階的価格設定です。詳細については、以下の表をご参照ください。

各モデル 100 万トークン

Model Studio の有効化後 90 日間有効

qwen3.5-plus-2026-02-15

デフォルトで思考モードが有効です

Snapshot

思考モード

983,616

ノンシンキングモード

991,808

65,536

最大 CoT:81,920

qwen-plus

現在のバージョン:qwen-plus-2025-12-01
Qwen3 シリーズに属します
バッチ呼び出し は半額です

Stable

思考モード

995,904

ノンシンキングモード

997,952

32,768

最大 CoT:81,920

qwen-plus-latest

現在のバージョン:qwen-plus-2025-12-01
Qwen3 シリーズに属します

Latest

思考モード

995,904

ノンシンキングモード

997,952

qwen-plus-2025-12-01

Qwen3 シリーズに属します

Snapshot

思考モード

995,904

ノンシンキングモード

997,952

qwen-plus-2025-09-11

Qwen3 シリーズに属します

qwen-plus-2025-07-28

別名:qwen-plus-0728
Qwen3 シリーズに属します

qwen-plus-2025-07-14

別名:qwen-plus-0714
Qwen3 シリーズに属します

131,072

思考モード

98,304

ノンシンキングモード

129,024

16,384

最大 CoT:38,912

$0.4

思考モード

$4

ノンシンキングモード

$1.2

qwen-plus-2025-04-28

別名:qwen-plus-0428
Qwen3 シリーズに属します

qwen-plus-2025-01-25

別名:qwen-plus-0125

129,024

8,192

$1.2

qwen3.5-plus、qwen3.5-plus-2026-02-15、qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11、および qwen-plus-2025-07-28 は、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

Qwen3.5-Plus

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤256K

$0.4

$2.4

256K<トークン≤1M

$0.5

$3

Qwen-Plus

リクエストごとの入力トークン数

モード

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤256K

ノンシンキングモード

$0.4

$1.2

思考モード

$4

256K<トークン≤1M

ノンシンキングモード

$1.2

$3.6

思考モード

$12

グローバル

グローバルデプロイモード」では、エンドポイントおよびデータストレージは 米国(バージニア)リージョン に配置されます。推論の計算リソースは、世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen3.5-plus

現在のバージョン:qwen3.5-plus-2026-02-15
デフォルトで思考モードが有効です

Stable

1,000,000

思考モード

983,616

ノンシンキングモード

991,808

65,536

最大 CoT:81,920

段階的価格設定です。詳細については、以下の表をご参照ください。

qwen3.5-plus-2026-02-15

デフォルトで思考モードが有効です

Snapshot

思考モード

983,616

ノンシンキングモード

991,808

65,536

最大 CoT:81,920

qwen-plus

現在のバージョン:qwen-plus-2025-12-01
Qwen3 シリーズに属します

Stable

思考モード

995,904

ノンシンキングモード

997,952

32,768

最大 CoT:81,920

qwen-plus-2025-12-01

Qwen3 シリーズに属します

Snapshot

思考モード

995,904

ノンシンキングモード

997,952

qwen-plus-2025-09-11

Qwen3 シリーズに属します

qwen-plus-2025-07-28

別名:qwen-plus-0728
Qwen3 シリーズに属します

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

Qwen3.5-Plus

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤128K

$0.115

$0.688

128K≤トークン≤256K

$0.287

$1.72

256K<トークン≤1M

$0.573

$3.44

Qwen-Plus

qwen-plus、qwen-plus-2025-12-01、qwen-plus-2025-09-11、qwen-plus-2025-07-28

リクエストごとの入力トークン数

モード

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤128K

ノンシンキングモード

$0.115

$0.287

思考モード

$1.147

128K<トークン≤256K

ノンシンキングモード

$0.345

$2.868

思考モード

$3.441

256K<トークン≤1M

ノンシンキングモード

$0.689

$6.881

思考モード

$9.175

米国

米国デプロイモード」では、エンドポイントおよびデータストレージは 米国(バージニア)リージョン に配置されます。推論の計算リソースは、米国内に限定されます。

モデル

バージョン

コンテキスト ウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen-plus-us

現在のバージョン:qwen-plus-2025-12-01-us
Qwen3 シリーズに属します

Stable

1,000,000

思考モード

995,904

ノンシンキングモード

997,952

32,768

最大 CoT:81,920

段階的価格設定です。詳細については、以下の表をご参照ください。

なし

qwen-plus-2025-12-01-us

Qwen3 シリーズに属します

Snapshot

思考モード

995,904

ノンシンキングモード

997,952

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。qwen-plus-us は コンテキストキャッシュ をサポートしています。

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

モード

出力コスト(100 万トークンあたり)

0<トークン≤256K

$0.4

ノンシンキングモード

$1.2

思考モード

$4

256K<トークン≤1M

$1.2

ノンシンキングモード

$3.6

思考モード

$12

中国本土

中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。推論の計算リソースは、中国本土内に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen3.5-plus

現在のバージョン:qwen3.5-plus-2026-02-15
デフォルトで思考モードが有効です
バッチ呼び出し は半額です

Stable

1,000,000

思考モード

983,616

ノンシンキングモード

991,808

65,536

最大 CoT:81,920

段階的価格設定です。詳細については、以下の表をご参照ください。

qwen3.5-plus-2026-02-15

デフォルトで思考モードが有効です

Snapshot

思考モード

983,616

ノンシンキングモード

991,808

65,536

最大 CoT:81,920

qwen-plus

現在のバージョン:qwen-plus-2025-12-01
Qwen3 シリーズに属します
バッチ呼び出し は半額です

Stable

思考モード

995,904

ノンシンキングモード

997,952

32,768

最大 CoT:81,920

qwen-plus-latest

現在のバージョン:qwen-plus-2025-12-01
Qwen3 シリーズの一部
バッチ呼び出し は半額です

Latest

思考モード

995,904

ノンシンキングモード

997,952

qwen-plus-2025-12-01

Qwen3 シリーズに属します

Snapshot

思考モード

995,904

ノンシンキングモード

997,952

qwen-plus-2025-09-11

Qwen3 シリーズの一部

qwen-plus-2025-07-28

別名:qwen-plus-0728
Qwen3 シリーズの一部

qwen-plus-2025-07-14

別名:qwen-plus-0714
Qwen3 シリーズの一部

131,072

思考モード

98,304

ノンシンキングモード

129,024

16,384

最大 CoT:38,912

$0.115

思考モード

$1.147

ノンシンキングモード

$0.287

qwen-plus-2025-04-28

別名:qwen-plus-0428
Qwen3 シリーズに属します

qwen3.5-plus、qwen3.5-plus-2026-02-15、qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11、および qwen-plus-2025-07-28 は、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

Qwen3.5-Plus

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤128K

$0.115

$0.688

128K≤トークン≤256K

$0.287

$1.72

256K<トークン≤1M

$0.573

$3.44

Qwen-Plus

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

モード

出力コスト(100 万トークンあたり)

0<トークン≤128K

$0.115

ノンシンキングモード

$0.287

思考モード

$1.147

128K<トークン≤256K

$0.345

ノンシンキングモード

$2.868

思考モード

$3.441

256K<トークン≤1M

$0.689

ノンシンキングモード

$6.881

思考モード

$9.175

上記のモデルは、思考モードおよびノンシンキングモードの両方をサポートしています。モードの切り替えには、enable_thinking パラメーターを使用してください。上記のモデルにおいて、思考モードが有効化されているにもかかわらず思考プロセスが出力されない場合は、ノンシンキングモードの価格で課金されます。

その他のモデル

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen-plus-2025-01-25

別名:qwen-plus-0125

Snapshot

131,072

129,024

8,192

$0.115

$0.287

qwen-plus-2025-01-12

別名:qwen-plus-0112

qwen-plus-2024-12-20

別名:qwen-plus-1220

中国(香港)

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen-plus

現在のバージョン:qwen-plus-2025-12-01
Qwen3 シリーズに属します

Stable

1,000,000

思考

995,904

ノンシンキング

997,952

32,768

最大 CoT:81,920

段階的価格設定です。詳細については、以下の表をご参照ください。

qwen-plus-2025-12-01

Qwen3 シリーズに属します

Snapshot

qwen-plus-2025-12-01 モデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

リクエストごとの入力トークン数

モード

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤256K

ノンシンキングモード

$0.4

$1.2

思考モード

$4

256K<トークン≤1M

ノンシンキングモード

$1.2

$3.6

思考モード

$12

Qwen-Flash

Qwen シリーズで最も高速かつコスト効率の高いモデルであり、シンプルなタスクに最適です。Qwen-Flash は柔軟な段階的価格設定を採用しており、Qwen-Turbo よりもコスト効率が優れています。利用方法 | API リファレンス | オンラインで試す | 思考モード

国際

国際デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力トークン数

最大 CoT

最大出力

入力コスト

出力コスト

CoT + 応答

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3.5-flash

現在のバージョン:qwen3.5-flash-2026-02-23
デフォルトで思考モードが有効です

Stable

思考

1,000,000

983,616

81,920

65,536

$0.1

$0.4

各モデル 100 万トークン

Model Studio の有効化後 90 日間有効

ノンシンキング

991,808

-

qwen3.5-flash-2026-02-23

デフォルトで思考モードが有効です

Snapshot

思考

983,616

81,920

ノンシンキング

991,808

-

qwen-flash

現在のバージョン:qwen-flash-2025-07-28
Qwen3 シリーズに属します
バッチ呼び出し は半額です

Stable

思考

995,904

81,920

32,768

段階的価格設定です。詳細については、以下の表をご参照ください。

ノンシンキング

997,952

-

qwen-flash-2025-07-28

Qwen3 シリーズに属します

Snapshot

思考

995,904

81,920

ノンシンキング

997,952

-

qwen-flash および qwen-flash-2025-07-28 の段階的価格設定

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤256K

$0.05

$0.4

256K<トークン≤1M

$0.25

$2

グローバル

グローバルデプロイモード」では、エンドポイントおよびデータストレージは 米国(バージニア)リージョン に配置されます。推論の計算リソースは、世界中で動的にスケジュールされます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT + 応答

(トークン)

(100 万トークンあたり)

qwen3.5-flash

現在のバージョン:qwen3.5-flash-2026-02-23
デフォルトで思考モードが有効です

Stable

思考

1,000,000

983,616

81,920

65,536

段階的価格設定です。詳細については、以下の表をご参照ください。

ノンシンキング

991,808

-

qwen3.5-flash-2026-02-23

デフォルトで思考モードが有効です

Snapshot

思考

983,616

81,920

ノンシンキング

991,808

-

qwen-flash

現在のバージョン:qwen-flash-2025-07-28
Qwen3 シリーズに属します

Stable

思考

995,904

81,920

32,768

ノンシンキング

997,952

-

qwen-flash-2025-07-28

Qwen3 シリーズに属します

Snapshot

思考

995,904

81,920

ノンシンキング

997,952

-

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。qwen-flash は コンテキストキャッシュ をサポートしています。

qwen3.5-flash および qwen3.5-flash-2026-02-23 の段階的価格設定

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤128K

$0.029

$0.287

128K<トークン≤256K

$0.115

$1.147

256K<トークン≤1M

$0.172

$1.72

qwen-flash および qwen-flash-2025-07-28 の段階的価格設定

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤128K

$0.022

$0.216

128K<トークン≤256K

$0.087

$0.861

256K<トークン≤1M

$0.173

$1.721

米国

米国デプロイモード」では、エンドポイントおよびデータストレージは 米国(バージニア)リージョン に配置されます。推論の計算リソースは、米国内に限定されます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT + 応答

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen-flash-us

現在のバージョン:qwen-flash-2025-07-28-us
Qwen3 シリーズに属します

Stable

思考

1,000,000

995,904

81,920

32,768

段階的価格設定です。詳細については、以下の表をご参照ください。

なし

ノンシンキング

997,952

-

qwen-flash-2025-07-28-us

Qwen3 シリーズに属します

Snapshot

思考

995,904

81,920

ノンシンキング

997,952

-

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤256K

$0.05

$0.4

256K<トークン≤1M

$0.25

$2

中国本土

中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。推論の計算リソースは、中国本土内に限定されます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT + 応答

(トークン)

(100 万トークンあたり)

qwen3.5-flash

現在のバージョン:qwen3.5-flash-2026-02-23
デフォルトで思考モードが有効です
バッチ呼び出し は半額です

安定

思考中

1,000,000

983,616

81,920

65,536

段階的料金体系。以下の詳細をご確認ください。

ノンシンキング

991,808

-

qwen3.5-flash-2026-02-23

デフォルトで思考モードが有効です

Snapshot

思考

983,616

81,920

ノンシンキング

991,808

-

qwen-flash

現在のバージョン:qwen-flash-2025-07-28
Qwen3 シリーズに属します
バッチ呼び出し は半額です

Stable

思考

995,904

81,920

32,768

ノンシンキング

997,952

-

qwen-flash-2025-07-28

Qwen3 シリーズに属します

Snapshot

思考

995,904

81,920

ノンシンキング

997,952

-

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。qwen3.5-flash は コンテキストキャッシュ および バッチ呼び出し をサポートしています。

qwen3.5-flash および qwen3.5-flash-2026-02-23 の段階的価格設定

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤128K

$0.029

$0.287

128K<トークン≤256K

$0.115

$1.147

256K<トークン≤1M

$0.172

$1.72

qwen-flash および qwen-flash-2025-07-28 の段階的価格設定

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0<トークン≤128K

$0.022

$0.216

128K<トークン≤256K

$0.087

$0.861

256K<トークン≤1M

$0.173

$1.721

中国(香港)

モデル

バージョン

モード

コンテキストウィンドウ

最大入力トークン数

最大 CoT

最大出力トークン数

入力コスト

出力コスト

CoT + 出力

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3.5-flash

現在のバージョン:qwen3.5-flash-2026-02-23
デフォルトで思考モードが有効です

Stable

思考

1,000,000

983,616

81,920

65,536

$0.1

$0.4

各モデル 100 万トークン

Model Studio の有効化後 90 日間有効

ノンシンキング

991,808

-

qwen3.5-flash-2026-02-23

デフォルトで思考モードが有効です

Snapshot

思考

983,616

81,920

ノンシンキング

991,808

-

Qwen-Turbo

Qwen-Turbo は今後更新されません。代わりに Qwen-Flash を使用してください。Qwen-Flash は、よりコスト効率の高い課金方式である柔軟な段階的価格設定を採用しています。利用方法 | API リファレンス | オンラインで試す | 思考モード

国際

国際デプロイモード」では、エンドポイントおよびデータストレージはいずれも シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力トークン数

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen-turbo

現在のバージョン:qwen-turbo-2025-04-28
Qwen3 シリーズに属します
バッチ呼び出し は半額です

Stable

思考

131,072

ノンシンキングモード

1,000,000

思考

98,304

ノンシンキングモード

1,000,000

16,384

最大 CoT:38,912

$0.05

思考モード:$0.5

ノンシンキングモード:$0.2

各モデル 100 万トークン

Model Studio の有効化後 90 日間有効

qwen-turbo-latest

常に最新のスナップショットです
Qwen3 シリーズに属します

Latest

$0.05

思考モード:$0.5

ノンシンキングモード:$0.2

qwen-turbo-2025-04-28

別名:qwen-turbo-0428
Qwen3 シリーズに属します

Snapshot

qwen-turbo-2024-11-01

別名:qwen-turbo-1101

1,000,000

1,000,000

8,192

$0.2

中国本土

中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen-turbo

現在のバージョン:qwen-turbo-2025-04-28
Qwen3 シリーズに属します

Stable

思考

131,072

ノンシンキングモード

1,000,000

思考

98,304

ノンシンキングモード

1,000,000

16,384

最大 CoT:38,912

$0.044

思考

$0.431

ノンシンキングモード

$0.087

qwen-turbo-latest

常に最新のスナップショットです
Qwen3 シリーズに属します

Latest

qwen-turbo-2025-07-15

別名:qwen-turbo-0715
Qwen3 シリーズに属します

Snapshot

qwen-turbo-2025-04-28

別名:qwen-turbo-0428
Qwen3 シリーズに属します

QwQ

QwQ は Qwen2.5 ベースで訓練された推論モデルであり、強化学習により大幅に強化されています。AIME 24/25 や LiveCodeBench などの主要な評価指標において、フルキャパシティの DeepSeek-R1 と同等のパフォーマンスを達成し、IFEval や LiveBench などの汎用ベンチマークでも優れた結果を示します。利用方法

国際

国際デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大 CoT

最大応答

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwq-plus

Stable

131,072

98,304

32,768

8,192

$0.8

$2.4

100万トークン

Model Studio の有効化後 90 日間有効

中国本土

中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大 CoT

最大応答

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwq-plus

現在のバージョン:qwq-plus-2025-03-05
バッチ呼び出し は半額です

Stable

131,072

98,304

32,768

8,192

$0.230

$0.574

qwq-plus-latest

常に最新のスナップショットです

Latest

qwq-plus-2025-03-05

別名:qwq-plus-0305

Snapshot

Qwen-Long

この Qwen シリーズのモデルは、最長のコンテキストウィンドウ、バランスの取れた機能、および低コストを特徴としており、長文分析、情報抽出、要約、分類タスクに最適です。利用方法 | オンラインで試す

説明

サポートされるのは 中国本土デプロイモード のみです。このモードでは、エンドポイントおよびデータストレージは 北京リージョン に配置され、推論の計算リソースは中国本土内に限定されます。

モデル

バージョン

コンテキスト ウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen-long-latest

常に最新のスナップショットです
バッチ呼び出し は半額です

安定

10,000,000

10,000,000

32,768

$0.072

$0.287

qwen-long-2025-01-25

別名:qwen-long-0125

Snapshot

Qwen-Omni

Qwen-Omni は、テキスト、画像、音声、動画などのマルチモーダル入力を受付けるモデルであり、テキストまたは音声の応答を生成します。複数の表現豊かな人間のような音声オプションを提供し、多言語および方言の音声出力もサポートしています。これにより、視覚認識、感情検知、教育など、オーディオビジュアルチャットのシナリオに最適です。利用方法 | API リファレンス

国際

国際デプロイモード」では、エンドポイントおよびデータストレージはいずれも シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

無料クォータ

(注)

(トークン)

qwen3-omni-flash

このモデルは、 qwen3-omni-flash-2025-12-01。

Stable

思考

65,536

16,384

32,768

16,384

100万トークン(モダリティを問わず)

Model Studio の有効化後 90 日間有効

ノンシンキング

49,152

-

qwen3-omni-flash-2025-12-01

Snapshot

思考

65,536

16,384

32,768

16,384

ノンシンキング

49,152

-

qwen3-omni-flash-2025-09-15

別名:qwen3-omni-flash-0915

Snapshot

思考

65,536

16,384

32,768

16,384

ノンシンキング

49,152

-

無料クォータが使用済みの場合、入力および出力は以下の通り課金されます。思考モードおよびノンシンキングモードの価格は同一です。思考モードでは音声出力はサポートされていません。

入力

単位価格(100 万トークンあたり)

テキスト

$0.43

音声

$3.81

画像/動画

$0.78

出力

単位価格(100 万トークンあたり)

テキスト

入力がテキストのみの場合:$1.66

入力に画像または動画、音声を含む場合:$3.06

テキスト+音声

この項目は思考モードでは課金されません。

$15.11(音声)

テキスト出力は課金されません。

その他のモデル

モデル

バージョン

コンテキストウィンドウ(トークン)

最大入力(トークン)

最大出力(トークン)

無料クォータ

(注)

(トークン)

qwen-omni-turbo

現在のスナップショット:qwen-omni-turbo-2025-03-26

Stable

32,768

30,720

2,048

各モデル 100 万トークン(モダリティを問わず)

Model Studio の有効化後 90 日間有効

qwen-omni-turbo-latest

常に最新のスナップショットを使用します。
同等の機能です。

Latest

qwen-omni-turbo-2025-03-26

別名:qwen-omni-turbo-0326

Snapshot

商用モデルの無料クォータ を使用した後は、以下のように課金されます:

課金対象項目

単位価格(100 万トークンあたり)

テキスト

$0.07

音声

$4.44

画像/動画

$0.21

出力

単位価格(100 万トークンあたり)

テキスト

入力がテキストのみの場合:$0.27

入力に画像、動画、または音声を含む場合:$0.63

テキスト+音声

$8.89(音声)

テキスト出力は課金されません。

中国本土

中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

無料クォータ

(注)

(トークン)

qwen3-omni-flash

現在のバージョン:qwen3-omni-flash-2025-12-01

Stable

思考

65,536

16,384

32,768

16,384

無料クォータなし

ノンシンキング

49,152

-

qwen3-omni-flash-2025-12-01

Snapshot

思考

65,536

16,384

32,768

16,384

ノンシンキング

49,152

-

qwen3-omni-flash-2025-09-15

別名:qwen3-omni-flash-0915

Snapshot

思考

65,536

16,384

32,768

16,384

ノンシンキング

49,152

-

無料クォータが使用済みの場合、入力および出力は以下の通り課金されます。思考モードおよびノンシンキングモードの価格は同一です。思考モードでは音声出力はサポートされていません。

入力課金項目

単位価格(100 万トークンあたり)

テキスト

$0.258

音声

2.265 米ドル

画像/動画

$0.473

課金出力

単位価格(100 万トークンあたり)

テキスト

入力がテキストのみの場合:$0.989

入力に画像、動画、または音声を含む場合:$1.821

テキスト+音声

この項目は思考モードでは課金されません。

$8.974(音声)

テキスト出力は課金されません。

その他のモデル

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

無料クォータ

(トークン)

qwen-omni-turbo

qwen-omni-turbo-2025-03-26 と同等の機能を提供します。

Stable

32,768

30,720

2,048

無料クォータなし

qwen-omni-turbo-latest

常に最新のスナップショットを使用します。
同等の機能です

Latest

qwen-omni-turbo-2025-03-26

別名:qwen-omni-turbo-0326

Snapshot

qwen-omni-turbo-2025-01-19

別名:qwen-omni-turbo-0119

入力および出力の課金ルールは以下の通りです:

課金項目

単位価格(100 万トークンあたり)

テキスト

$0.058

音声

$3.584

画像/動画

$0.216

出力

単位価格(100 万トークンあたり)

テキスト

入力がテキストのみの場合:$0.230

入力に画像、音声、または動画を含む場合:$0.646

テキスト+音声

$7.168(音声)

テキスト出力は課金されません。

課金例:入力として 1,000 文字のテキストトークンと 1,000 画像トークン、出力として 1,000 文字のテキストトークンと 1,000 音声トークンを生成するリクエストの場合、課金額は $0.000058(テキスト入力)+ $0.000216(画像入力)+ $0.007168(音声出力)となります。

Qwen3-Omni-Flash モデルは、更新されていない Qwen-Omni-Turbo モデルと比較して大幅な機能向上が見られるため、こちらをご利用ください。

  • 思考モードとノンシンキングモードの両方をサポートするハイブリッド思考モデルです。enable_thinking パラメーターを使用してモードを切り替えてください。デフォルトでは思考モードは無効です。

  • 思考モードでは音声出力はサポートされていません。ノンシンキングモードでの音声出力については、以下の通りです:

    • qwen3-omni-flash-2025-12-01 は最大 49 種類の音声をサポートし、qwen3-omni-flash-2025-09-15 および qwen3-omni-flash は最大 17 種類の音声をサポートします。一方、Qwen-Omni-Turbo は 4 種類のみです。

    • 最大 10 言語をサポートしますが、Qwen-Omni-Turbo は 2 言語のみです。

Qwen-Omni-Realtime

Qwen-Omni と比較して、Qwen-Omni-Realtime はストリーミング音声入力をサポートし、組み込みの音声活動検出(VAD)機能により、ユーザーの発話開始および終了を自動的に検出できます。利用方法 | クライアントイベント | サーバーイベント

国際

国際デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力トークン数

最大出力

無料クォータ

(注)

(トークン)

qwen3-omni-flash-realtime

現在のバージョン:qwen3-omni-flash-realtime-2025-12-01。

Stable

65,536

49,152

16,384

100万トークン(モダリティを問わず)

Model Studio の有効化後 90 日間有効

qwen3-omni-flash-realtime-2025-12-01

Snapshot

qwen3-omni-flash-realtime-2025-09-15

無料クォータが使用済みの場合、入力および出力は以下の通り課金されます:

入力

単位価格(100 万トークンあたり)

テキスト

$0.52

音声

$4.57

画像

$0.94

出力

単位価格(100 万トークンあたり)

テキスト

入力がテキストのみの場合:$1.99

入力に画像または音声を含む場合:$3.67

テキスト+音声

$18.13(音声)

テキスト出力は課金されません。

その他のモデル

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

無料クォータ

(注)

(トークン)

qwen-omni-turbo-realtime

現在のスナップショット:qwen-omni-turbo-realtime-2025-05-08

Stable

32,768

30,720

2,048

各 100万 トークン (モダリティにかかわらず)

Model Studio の有効化後 90 日間有効

qwen-omni-turbo-realtime-latest

常に最新のスナップショットです。

Latest

qwen-omni-turbo-realtime-2025-05-08

Snapshot

無料クォータが使用済みの場合、入力および出力は以下の通り課金されます:

入力課金項目

単位価格(100 万トークンあたり)

テキスト

$0.270

音声

$4.440

画像

$0.840

出力

単位価格(100 万トークンあたり)

テキスト

入力がテキストのみの場合:$1.070

入力に画像または音声を含む場合:$2.52

テキスト+音声

$8.890(音声)

テキスト部分の出力は課金されません。

中国本土

中国本土デプロイモード」では、エンドポイントおよびデータストレージは 北京リージョン に配置されます。モデル推論の計算リソースは、中国本土内に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

無料クォータ

(注)

(トークン)

qwen3-omni-flash-realtime

このモデルは現在、qwen3-omni-flash-realtime-2025-12-01 です。

Stable

65,536

49,152

16,384

無料クォータなし

qwen3-omni-flash-realtime-2025-12-01

Snapshot

qwen3-omni-flash-realtime-2025-09-15

無料クォータが使用済みの場合、入力および出力は以下の通り課金されます:

課金項目を指定してください

単位価格(100 万トークンあたり)

テキスト

$0.315

音声

$2.709

画像

$0.559

出力

単位価格(100 万トークンあたり)

テキスト

入力がテキストのみの場合:$1.19

入力に画像または音声を含む場合:$2.179

テキスト+音声

$10.766(音声)

テキスト部分は課金されません。

その他のモデル

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

無料クォータ

(注)

(トークン)

qwen-omni-turbo-realtime

このモデルは現在、qwen-omni-turbo-2025-05-08 のスナップショットです。

Stable

32,768

30,720

2,048

無料クォータなし

qwen-omni-turbo-realtime-latest

最新のスナップショットと同等の機能を常に提供します。

Latest

qwen-omni-turbo-realtime-2025-05-08

Snapshot

入力および出力の課金ルールは以下の通りです:

入力課金項目

単位価格(100 万トークンあたり)

テキスト

$0.230

音声

$3.584

画像

$0.861

出力

単位価格(100 万トークンあたり)

テキスト

テキストのみの入力の場合:$0.918

画像または音声を含む入力の場合:$2.581

テキスト+音声

$7.168(音声)

テキスト出力は課金されません。

Qwen3-Omni-Flash-Realtime モデルを Qwen-Omni-Turbo-Realtime の代わりにご利用ください。Qwen-Omni-Turbo-Realtime は今後更新されません。Qwen3-Omni-Flash-Realtime は大幅な機能向上を実現しています。音声出力について:

  • qwen3-omni-flash-realtime-2025-12-01 は 49 種類の音声をサポートします。qwen3-omni-flash-realtime-2025-09-15 および qwen3-omni-realtime-flash は 17 種類の音声をサポートします。一方、Qwen-Omni-Turbo-Realtime は 4 種類のみです。

  • 10 言語をサポートしますが、Qwen-Omni-Turbo-Realtime は 2 言語のみです。

QVQ

QVQ は、視覚入力と CoT 出力をサポートする視覚的推論モデルです。数学、プログラミング、視覚分析、創作、および一般的なタスクにおいて、より強力な能力を発揮します。使い方 | オンラインで試す

国際

国際デプロイモードでは、エンドポイントとデータストレージは両方ともシンガポールリージョンにあります。モデルの推論に使われる計算リソースは、世界中 (中国本土を除く) で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大 CoT

最大応答

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qvq-max

現在 qvq-max-2025-03-25 です。

安定版

131,072

106,496

イメージあたり最大: 16,384

16,384

8,192

$1.2

$4.8

各 100 万入力トークン

Model Studio を有効化してから 90 日間有効

qvq-max-latest

常に最新のスナップショットです。

最新版

qvq-max-2025-03-25

qvq-max-0325 とも呼ばれます。

スナップショット

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは両方とも北京リージョンにあります。モデルの推論に使われる計算リソースは、中国本土に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大 CoT

最大応答

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qvq-max

qvq-plus よりも強力な視覚的推論能力と命令フォロー能力を提供し、より複雑なタスクで最適なパフォーマンスを発揮します。
現在 qvq-max-2025-03-25 です。

安定版

131,072

106,496

イメージあたり最大: 16,384

16,384

8,192

$1.147

$4.588

qvq-max-latest

常に最新のスナップショットです。

最新版

qvq-max-2025-05-15

qvq-max-0515 とも呼ばれます。

スナップショット

qvq-max-2025-03-25

qvq-max-0325 とも呼ばれます。

qvq-plus

現在 qvq-plus-2025-05-15 です。

安定版

$0.287

$0.717

qvq-plus-latest

常に最新のスナップショットです。

最新版

qvq-plus-2025-05-15

qvq-plus-0515 とも呼ばれます。

スナップショット

Qwen-VL

Qwen-VL は、視覚 (イメージ) 理解機能を備えたテキスト生成モデルです。OCR を実行し、さらに要約や推論を行うことができます。例えば、プロダクト写真から属性を抽出したり、演習図に基づいて問題を解決したりします。 使用方法 | API リファレンス | オンラインで試す

Qwen-VL モデルは、入力トークンと出力トークンの合計数に基づいて課金されます。イメージトークン計算ルールの詳細については、「視覚理解」をご参照ください。

インターナショナル

国際デプロイモードでは、アクセスポイントとデータストレージは両方とも シンガポール リージョン に配置されています。モデル推論計算リソースは、世界中 (中国本土を除く) で動的にスケジュールされます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT と出力

無料クォータ

(注)

(トークン)

(100万トークンあたり)

qwen3-vl-plus

現在、qwen3-vl-plus-2025-12-19

安定版

シンキング

262,144

258,048

イメージあたりの最大: 16,384

81,920

32,768

段階的価格設定。詳細については以下をご参照ください。

入力トークン 100万、出力トークン 100万

Model Studio アクティベーション後90日間有効

ノンシンキング

260,096

イメージあたりの最大: 16,384

-

qwen3-vl-plus-2025-12-19

スナップショット

シンキング

258,048

イメージあたりの最大: 16,384

81,920

ノンシンキング

260,096

イメージあたりの最大: 16,384

-

qwen3-vl-plus-2025-09-23

スナップショット

シンキング

258,048

イメージあたりの最大: 16,384

81,920

ノンシンキング

260,096

イメージあたりの最大: 16,384

-

qwen3-vl-flash

現在、qwen3-vl-flash-2025-10-15

安定版

シンキング

258,048

イメージあたりの最大: 16,384

81,920

ノンシンキング

260,096

イメージあたりの最大: 16,384

-

qwen3-vl-flash-2026-01-22

スナップショット

シンキング

258,048

イメージあたりの最大: 16,384

81,920

ノンシンキング

260,096

イメージあたりの最大: 16,384

-

qwen3-vl-flash-2025-10-15

スナップショット

シンキング

258,048

イメージあたりの最大: 16,384

81,920

ノンシンキング

260,096

イメージあたりの最大: 16,384

-

上記モデルは、現在のリクエストにおける入力トークン数に基づいて段階的価格設定を使用します。入力と出力の価格は、シンキングモードとノンシンキングモードで同じです。さらに、qwen3-vl-plus および qwen3-vl-flash モデルは コンテキストキャッシュをサポートしています。

qwen3-vl-plus シリーズ

リクエストあたりの入力トークン

入力コスト (100万トークンあたり)

出力コスト (100万トークンあたり)

0 < Tokens ≤ 32K

$0.2

$1.6

32K < Tokens ≤ 128K

$0.3

$2.4

128K < Tokens ≤ 256K

$0.6

$4.8

qwen3-vl-flash シリーズ

リクエストあたりの入力トークン

入力コスト (100万トークンあたり)

出力コスト (100万トークンあたり)

0 < Tokens ≤ 32K

$0.05

$0.40

32K < Tokens ≤ 128K

$0.075

$0.6

128K < Tokens ≤ 256K

$0.12

$0.96

その他のモデル

Qwen-VL-Max
以下のすべてのモデルは Qwen2.5-VL シリーズに属し、qwen-vl-max モデルは コンテキストキャッシュをサポートしています。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100万トークンあたり)

qwen-vl-max

qwen-vl-plus と比較して、強化された視覚的推論と命令追従機能を提供し、より複雑なタスクで最適なパフォーマンスを実現します。
現在、qwen-vl-max-2025-08-13。

安定版

131,072

129,024

イメージあたりの最大: 16,384

8,192

$0.8

$3.2

入力トークン 100万、出力トークン 100万

Model Studio アクティベーション後90日間有効

qwen-vl-max-latest

常に最新のスナップショット。

最新

$0.8

$3.2

qwen-vl-max-2025-08-13

別名 qwen-vl-max-0813。
視覚理解メトリックが完全にアップグレードされ、数学、推論、オブジェクト認識、多言語処理の機能が大幅に強化されています。

スナップショット

qwen-vl-max-2025-04-08

別名 qwen-vl-max-0408。
Qwen2.5-VL シリーズの一部として、このモデルはコンテキストウィンドウを 128,000 トークンに拡張し、数学と推論機能を大幅に強化します。
Qwen-VL-Plus
以下のすべてのモデルは Qwen2.5-VL シリーズに属し、qwen-vl-plus モデルは コンテキストキャッシュをサポートしています。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100万トークンあたり)

qwen-vl-plus

現在、qwen-vl-plus-2025-08-15。

安定版

131,072

129,024

イメージあたりの最大: 16,384

8,192

$0.21

$0.63

それぞれ100万トークン

Model Studio アクティベーション後90日間有効

qwen-vl-plus-latest

常に最新のスナップショット。

最新

$0.21

$0.63

qwen-vl-plus-2025-08-15

別名 qwen-vl-plus-0815。
オブジェクト認識とローカライズ、および多言語処理機能が大幅に改善されています。

スナップショット

qwen-vl-plus-2025-05-07

別名 qwen-vl-plus-0507。
数学、推論、監視ビデオコンテンツ理解機能が大幅に改善されています。

qwen-vl-plus-2025-01-25

別名 qwen-vl-plus-0125。
Qwen2.5-VL シリーズの一部として、このモデルはコンテキストウィンドウを 128K トークンに拡張し、イメージおよびビデオ理解機能を大幅に強化します。

グローバル

グローバルデプロイモードでは、アクセスポイントとデータストレージは両方とも 米国 (バージニア) リージョン に配置されています。モデル推論計算リソースは世界中で動的にスケジュールされます。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT と出力

(トークン)

(100万トークンあたり)

qwen3-vl-plus

現在、qwen3-vl-plus-2025-12-19。

安定版

シンキング

262,144

258,048

イメージあたりの最大: 16,384。

81,920

32,768

段階的価格設定。詳細については以下をご参照ください。

ノンシンキング

260,096

イメージあたりの最大: 16,384。

-

qwen3-vl-plus-2025-09-23

スナップショット

シンキング

258,048

イメージあたりの最大: 16,384。

81,920

ノンシンキング

260,096

イメージあたりの最大: 16,384。

-

qwen3-vl-flash

現在、qwen3-vl-flash-2025-10-15。

安定版

シンキング

258,048

イメージあたりの最大: 16,384。

81,920

ノンシンキング

260,096

イメージあたりの最大: 16,384。

-

qwen3-vl-flash-2025-10-15

スナップショット

シンキング

258,048

イメージあたりの最大: 16,384。

81,920

ノンシンキング

260,096

イメージあたりの最大: 16,384。

-

上記モデルは、現在のリクエストにおける入力トークン数に基づいて段階的価格設定を使用します。入力と出力の価格は、シンキングモードとノンシンキングモードで同じです。さらに、qwen3-vl-plus および qwen3-vl-flash モデルは コンテキストキャッシュをサポートしています。

qwen3-vl-plus シリーズ

リクエストあたりの入力トークン

入力コスト (100万トークンあたり)

出力コスト (100万トークンあたり)

0 < Tokens ≤ 32K

$0.143

$1.434

32K < Tokens ≤ 128K

$0.215

$2.15

128K < Tokens ≤ 256K

$0.43

$4.301

qwen3-vl-flash シリーズ

リクエストあたりの入力トークン

入力コスト (100万トークンあたり)

出力コスト (100万トークンあたり)

0 < Tokens ≤ 32K

$0.022

$0.215

32K < Tokens ≤ 128K

$0.043

$0.43

128K < Tokens ≤ 256K

$0.086

$0.859

米国

米国デプロイモード」では、アクセスポイントおよびデータストレージの両方が米国 (バージニア) リージョンに配置されます。モデル推論用の計算リソースは、米国内でのみ利用可能です。

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT + 出力

(トークン)

(100万トークンあたり)

qwen3-vl-flash-us

現在は qwen3-vl-flash-2025-10-15-us

安定版

シンキング

262,144

258,048

イメージごとに最大 16,384

81,920

32,768

段階的価格設定。詳細については、下記をご参照ください。

ノンシンキング

260,096

イメージごとに最大 16,384

qwen3-vl-flash-2026-01-22-us

スナップショット

シンキング

258,048

イメージごとに最大 16,384

81,920

ノンシンキング

260,096

イメージごとに最大 16,384

qwen3-vl-flash-2025-10-15-us

スナップショット

シンキング

258,048

イメージごとに最大 16,384

81,920

ノンシンキング

260,096

イメージごとに最大 16,384

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。シンキングモードおよびノンシンキングモードにおいて、入力および出力の価格は同一です。また、qwen3-vl-flash-us モデルはコンテキストキャッシュをサポートしています。

リクエストあたりの入力トークン数

入力コスト (100万トークンあたり)

出力コスト (100万トークンあたり)

0 < トークン数 ≤ 32K

$0.05

$0.4

32K < トークン数 ≤ 128K

$0.075

$0.6

128K < トークン数 ≤ 256K

$0.12

$0.96

中国本土

中国本土デプロイモードでは、アクセスポイントおよびデータストレージの両方が中国 (北京)リージョン内に配置されます。モデル推論の計算リソースは、中国本土に限定されます。

モデル

バージョン

モード

コンテキストウィンドウ(トークン数)

最大入力(トークン数)

最大 CoT

最大出力(トークン数)

入力コスト

出力コスト

無料クォータ

(注)

トークン数

100 万トークンあたり

qwen3-vl-plus

現在のバージョン:qwen3-vl-plus-2025-12-19
バッチ呼び出しは半額で利用可能

Stable

シンキングモード

262,144

258,048

イメージごとの最大値:16,384

81,920

32,768

段階的価格設定。詳細については、以下をご参照ください。

無料クォータなし

ノンシンキングモード

260,096

イメージごとの最大値:16,384

qwen3-vl-plus-2025-12-19

Snapshot

シンキングモード

258,048

イメージごとの最大値:16,384

81,920

非思考

260,096

イメージごとの最大値:16,384

qwen3-vl-plus-2025-09-23

Snapshot

シンキングモード

258,048

イメージごとの最大値:16,384

81,920

ノンシンキングモード

260,096

イメージごとの最大値:16,384

qwen3-vl-flash

現在のバージョン:qwen3-vl-flash-2025-10-15
バッチ呼び出しは半額で利用可能

Stable

シンキングモード

258,048

イメージごとの最大値:16,384

81,920

非思考

260,096

イメージごとの最大値:16,384

qwen3-vl-flash-2026-01-22

Snapshot

シンキングモード

258,048

イメージごとの最大値:16,384

81,920

ノンシンキングモード

260,096

イメージごとの最大値:16,384

qwen3-vl-flash-2025-10-15

Snapshot

シンキングモード

258,048

イメージごとの最大値:16,384

81,920

ノンシンキングモード

260,096

イメージごとの最大値:16,384

上記のモデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。シンキングモードおよびノンシンキングモードにおいて、入力および出力の価格は同一です。また、qwen3-vl-plus および qwen3-vl-flash モデルは、コンテキストキャッシュ をサポートしています。

qwen3-vl-plus シリーズ

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0 < トークン数 ≤ 32K

$0.143

$1.434

32K < トークン数 ≤ 128K

$0.215

$2.15

128K < トークン数 ≤ 256K

$0.43

$4.301

qwen3-vl-flash シリーズ

リクエストごとの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

0 < トークン数 ≤ 32K

$0.022

$0.215

32K < トークン数 ≤ 128K

$0.043

$0.43

128K < トークン数 ≤ 256K

$0.086

$0.859

その他のモデル

Qwen-VL-Max シリーズ
qwen-vl-max-2025-01-25 以降に更新されたモデルはすべて Qwen2.5-VL シリーズに属します。qwen-vl-max モデルは コンテキストキャッシュ をサポートしています。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン数)

(100 万トークンあたり)

qwen-vl-max

qwen-vl-plus と比較して、視覚的推論および命令実行能力が強化されており、より複雑なタスクに対して最適なパフォーマンスを発揮します。
現在のバージョン:qwen-vl-max-2025-08-13。
バッチ呼び出しは半額で利用可能です。

Stable

131,072

129,024

イメージごとの最大値:16,384

8,192

$0.23

$0.574

qwen-vl-max-latest

常に最新のスナップショットを提供します。
バッチ呼び出しは半額で利用可能です。

Latest

qwen-vl-max-2025-08-13

別名:qwen-vl-max-0813。
視覚理解に関する評価指標が全面的にアップグレードされ、数学・推論・オブジェクト認識・多言語処理の各分野において、大幅な性能向上を実現しました。

Snapshot

qwen-vl-max-2025-04-08

別名:qwen-vl-max-0408。
数学および推論能力が強化されています。

$0.431

$1.291

qwen-vl-max-2025-04-02

別名:qwen-vl-max-0402。
複雑な数学問題の解決精度が大幅に向上しました。

qwen-vl-max-2025-01-25

別名:qwen-vl-max-0125。

Qwen2.5-VL シリーズへのアップグレードにより、コンテキストウィンドウが 128K トークンまで拡張され、画像および動画の理解能力が大幅に強化されました。

qwen-vl-max-2024-12-30

別名:qwen-vl-max-1230。

32,768

30,720

イメージごとの最大値:16,384

2,048

$0.431

$1.291

qwen-vl-max-2024-11-19

別名:qwen-vl-max-1119。
Qwen-VL-Plus シリーズ
qwen-vl-plus-2025-01-25Qwen2.5-VL シリーズに属し、qwen-vl-plus モデルは コンテキストキャッシュ をサポートしています。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン数)

(100 万トークンあたり)

qwen-vl-plus

現在のバージョン:qwen-vl-plus-2025-08-15。
バッチ呼び出しは半額で利用可能です。

Stable

131,072

129,024

イメージごとの最大値:16,384

8,192

$0.115

$0.287

qwen-vl-plus-latest

常に最新のスナップショットを提供します。
バッチ呼び出しは半額で利用可能です。

Latest

qwen-vl-plus-2025-08-15

別名:qwen-vl-plus-0815。
オブジェクト認識およびローカライズ、多言語処理能力が大幅に向上しました。

Snapshot

qwen-vl-plus-2025-07-10

別名:qwen-vl-plus-0710。
監視映像コンテンツの理解能力がさらに向上しました。

32,768

30,720

イメージごとの最大値:16,384

$0.022

$0.216

qwen-vl-plus-2025-05-07

別名:qwen-vl-plus-0507。
数学・推論・監視映像コンテンツの理解能力が大幅に向上しました。

131,072

129,024

イメージごとの最大値:16,384

$0.216

$0.646

qwen-vl-plus-2025-01-25

別名:qwen-vl-plus-0125。

Qwen2.5-VL シリーズへのアップグレードにより、コンテキストが 128K トークンまで拡張され、画像および動画の理解能力が大幅に強化されました。

qwen-vl-plus-2025-01-02

別名:qwen-vl-plus-0102。

32,768

30,720

イメージごとの最大値:16,384

2,048

中国 (香港)

モデル

バージョン

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT + 出力

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-vl-plus

現在のバージョン:qwen3-vl-plus-2025-12-19

Stable

Thinking

262,144

258,048

イメージごとに最大 16,384

81,920

32,768

段階的価格設定。詳細は下記をご参照ください。

各モデルにつき 100 万トークン

Model Studio を有効化した日から 90 日間有効

ノンシンキング

260,096

イメージごとに最大 16,384

qwen3-vl-plus-2025-12-19

Snapshot

Thinking

258,048

イメージごとに最大 16,384

81,920

ノンシンキング

260,096

イメージごとに最大 16,384

上記のモデルは、現在のリクエストにおける入力トークン数に応じた段階的価格設定を採用しています。Thinking モードおよびノンシンキングモードでは、入力および出力の課金単価が同一です。

リクエストごとの入力トークン数

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

0 < トークン ≤ 32K

$0.2

$1.6

32K < トークン ≤ 128K

$0.3

$2.4

128K < トークン ≤ 256K

$0.6

$4.8

qwen3-vl-flash-2026-01-22 モデルは、思考モードおよびノンシンキングモードを効果的に統合しています。2025 年 10 月 15 日のスナップショットと比較して、モデル全体のパフォーマンスが大幅に向上しています。一般的な画像認識、セキュリティ、店舗点検、巡回点検、および写真に基づく問題解決などのビジネスシナリオにおいて、より高い推論精度を実現しています。

Qwen-OCR

Qwen-OCR は、テキスト抽出に特化したモデルです。Qwen-VL と比較して、ドキュメント、テーブル、試験問題、手書きなどのアイテムのイメージからのテキスト抽出に、より重点を置いています。英語、フランス語、日本語、韓国語、ドイツ語、ロシア語、イタリア語など、複数の言語を認識できます。使用方法 | API リファレンス | オンラインで試す

国際

国際デプロイモードでは、エンドポイントとデータストレージは両方ともシンガポールリージョンに配置されます。モデルの推論計算リソースは、世界中 (中国本土を除く) で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力価格

出力価格

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen-vl-ocr

qwen-vl-ocr-2025-11-20 と同等です。

安定版

38,192

30,000

イメージあたりの最大値:30,000

8,192

$0.07

$0.16

100 万入力トークンと 100 万出力トークン

Model Studio の有効化後 90 日間有効

qwen-vl-ocr-2025-11-20

qwen-vl-ocr-1120 としても知られています。
Qwen3-VL アーキテクチャをベースにしており、ドキュメント解析とテキストのローカライズ性能が大幅に向上しています。

スナップショット

グローバル

グローバルデプロイモードでは、エンドポイントとデータストレージは両方とも米国 (バージニア) リージョンに配置されます。モデルの推論計算リソースは、世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力価格

出力価格

(トークン)

(100 万トークンあたり)

qwen-vl-ocr

qwen-vl-ocr-2025-11-20 と同等です。

安定版

38,192

30,000

イメージあたりの最大値:30,000

8,192

$0.043

$0.072

qwen-vl-ocr-2025-11-20

qwen-vl-ocr-1120 としても知られています。
Qwen3-VL アーキテクチャをベースにしており、ドキュメント解析とテキストのローカライズ性能が大幅に向上しています。

スナップショット

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは両方とも北京リージョンに配置されます。モデルの推論計算リソースは、中国本土に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力価格

出力価格

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen-vl-ocr

現在は qwen-vl-ocr-2025-11-20 です。
バッチ呼び出しは半額で利用できます。

安定版

38,192

30,000

イメージあたりの最大値:30,000

8,192

$0.043

$0.072

無料クォータなし

qwen-vl-ocr-latest

常に最新版

最新版

qwen-vl-ocr-2025-11-20

qwen-vl-ocr-1120 としても知られています。
Qwen3-VL アーキテクチャをベースにしており、ドキュメント解析とテキストのローカライズ性能が大幅に向上しています。

スナップショット

qwen-vl-ocr-2025-08-28

qwen-vl-ocr-0828 としても知られています。

34,096

4,096

$0.717

$0.717

qwen-vl-ocr-2025-04-13

qwen-vl-ocr-0413 としても知られています。

qwen-vl-ocr-2024-10-28

qwen-vl-ocr-1028 としても知られています。

Qwen-Math

Qwen-Math は、数学問題の解決に特化した言語モデルです。使用方法 | API リファレンス | オンラインで試す

説明

中国本土デプロイモードのみがサポートされています。このモードでは、エンドポイントとデータストレージは北京リージョンに配置され、推論コンピューティングリソースは中国本土に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen-math-plus

現在: qwen-math-plus-2024-09-19

安定版

4,096

3,072

3,072

$0.574

$1.721

qwen-math-plus-latest

常に最新のスナップショット

最新版

qwen-math-plus-2024-09-19

別名: qwen-math-plus-0919

スナップショット

qwen-math-plus-2024-08-16

別名: qwen-math-plus-0816

qwen-math-turbo

現在: qwen-math-turbo-2024-09-19

安定版

$0.287

$0.861

qwen-math-turbo-latest

常に最新のスナップショット

最新版

qwen-math-turbo-2024-09-19

別名: qwen-math-turbo-0919

スナップショット

Qwen-Coder

Qwen-Coder はコード生成モデルです。最新の Qwen3-Coder-Plus シリーズは Qwen3 をベースに構築されており、高度なコーディングエージェント機能を提供します。ツール呼び出し、環境インタラクション、自律プログラミングに優れており、強力なコーディング能力と汎用インテリジェンスを兼ね備えています。使用方法 | API リファレンス | オンラインで試す

国際

国際デプロイモードでは、エンドポイントとデータストレージは両方ともシンガポールリージョンにあります。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-coder-plus

現在 qwen3-coder-plus-2025-09-23

安定版

1,000,000

997,952

65,536

料金は段階的価格設定です。詳細は表の下の注記をご参照ください。

各 100 万トークン

有効期間: Alibaba Cloud Model Studio を有効化してから 90 日間

qwen3-coder-plus-2025-09-23

スナップショット

qwen3-coder-plus-2025-07-22

スナップショット

qwen3-coder-flash

現在 qwen3-coder-flash-2025-07-28

安定版

qwen3-coder-flash-2025-07-28

スナップショット

上記のモデルは、現在のリクエストの入力トークン数に基づいた段階的価格設定を使用します。

qwen3-coder-plus シリーズ

qwen3-coder-plus、qwen3-coder-plus-2025-09-23、および qwen3-coder-plus-2025-07-22 の料金は以下の通りです。qwen3-coder-plus はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で、明示的キャッシュにヒットした入力テキストは単価の 10% で請求されます。

リクエストあたりの入力トークン

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

0<Token≤32K

$1

$5

32K < Tokens ≤ 128K

$1.80

$9

128K < Tokens ≤ 256K

$3

$15

256,000 < Tokens ≤ 1,000,000

$6

$60

qwen3-coder-flash シリーズ

qwen3-coder-flash および qwen3-coder-flash-2025-07-28 の料金は以下の通りです。qwen3-coder-flash はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で、明示的キャッシュにヒットした入力テキストは単価の 10% で請求されます。

リクエストあたりの入力トークン

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

最大 32,000

$0.30

$1.50

32K < Tokens ≤ 128K

$0.50

$2.50

128K < Tokens ≤ 256K

$0.80

$4.00

256,000 < Tokens ≤ 1,000,000

$1.6

$9.60

グローバル

グローバルデプロイモードでは、エンドポイントとデータストレージは両方とも米国 (バージニア) リージョンにあります。モデル推論の計算リソースは世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen3-coder-plus

現在 qwen3-coder-plus-2025-09-23

安定版

1,000,000

997,952

65,536

料金は段階的価格設定です。詳細は表の下の注記をご参照ください。

qwen3-coder-plus-2025-09-23

スナップショット

qwen3-coder-plus-2025-07-22

スナップショット

qwen3-coder-flash

現在 qwen3-coder-flash-2025-07-28

安定版

qwen3-coder-flash-2025-07-28

スナップショット

上記のモデルは、現在のリクエストの入力トークン数に基づいた段階的価格設定を使用します。

qwen3-coder-plus シリーズ

qwen3-coder-plus、qwen3-coder-plus-2025-09-23、および qwen3-coder-plus-2025-07-22 の料金は以下の通りです。qwen3-coder-plus はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で請求されます。

リクエストあたりの入力トークン

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

0<Token≤32K

$0.574

$2.294

32K < Tokens ≤ 128K

$0.861

$3.441

128K < Tokens ≤ 256K

$1.434

$5.735

256K < Tokens ≤ 1M

$2.868

$28.671

qwen3-coder-flash シリーズ

qwen3-coder-flash および qwen3-coder-flash-2025-07-28 の料金は以下の通りです。qwen3-coder-flash はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で請求されます。

リクエストあたりの入力トークン

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

0 < Token ≤ 32K

$0.144

$0.574

32 K < Tokens ≤ 128 K

$0.216

$0.861

128 K < Tokens ≤ 256 K

$0.359

$1.434

256 K < Tokens ≤ 1 M

$0.717

$3.584

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは両方とも北京リージョンにあります。モデル推論の計算リソースは中国本土に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen3-coder-plus

現在 qwen3-coder-plus-2025-09-23

安定版

1,000,000

997,952

65,536

段階的価格設定です。詳細は以下をご参照ください。

qwen3-coder-plus-2025-09-23

スナップショット

qwen3-coder-plus-2025-07-22

スナップショット

qwen3-coder-flash

現在 qwen3-coder-flash-2025-07-28

安定版

qwen3-coder-flash-2025-07-28

スナップショット

上記のモデルは、現在のリクエストの入力トークン数に基づいた段階的価格設定を使用します。

qwen3-coder-plus シリーズ

qwen3-coder-plus、qwen3-coder-plus-2025-09-23、および qwen3-coder-plus-2025-07-22 の料金は以下の通りです。qwen3-coder-plus はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で、明示的キャッシュにヒットした入力テキストは単価の 10% で請求されます。

リクエストあたりの入力トークン

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

0<Token≤32K

$0.574

$2.294

32K < Tokens ≤ 128K

$0.861

$3.441

128K < Tokens ≤ 256K

$1.434

$5.735

256K < Tokens ≤ 1M

$2.868

$28.671

qwen3-coder-flash シリーズ

qwen3-coder-flash および qwen3-coder-flash-2025-07-28 の料金は以下の通りです。qwen3-coder-flash はコンテキストキャッシュをサポートしています。暗黙的キャッシュにヒットした入力テキストは単価の 20% で、明示的キャッシュにヒットした入力テキストは単価の 10% で請求されます。

リクエストあたりの入力トークン

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

0 < Token ≤ 32K

$0.144

$0.574

32 K < Tokens ≤ 128 K

$0.216

$0.861

128 K < Tokens ≤ 256 K

$0.359

$1.434

256 K < Tokens ≤ 1 M

$0.717

$3.584

その他のモデル

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen-coder-plus

qwen-coder-plus-2024-11-06 と同じ

安定版

131,072

129,024

8,192

$0.502

$1.004

qwen-coder-plus-latest

qwen-coder-plus の最新スナップショットと同じ

最新版

qwen-coder-plus-2024-11-06

qwen-coder-plus-1106 としても知られています

スナップショット

qwen-coder-turbo

qwen-coder-turbo-2024-09-19 と同じ

安定版

131,072

129,024

8,192

$0.287

$0.861

qwen-coder-turbo-latest

qwen-coder-turbo の最新スナップショットと同じ

最新版

qwen-coder-turbo-2024-09-19

qwen-coder-turbo-0919 としても知られています

スナップショット

Qwen-MT

Qwen-MT は、翻訳専用のフラッグシップ大規模言語モデル(LLM)であり、Qwen 3 から全面的にスペックアップされています。中国語、英語、日本語、韓国語、フランス語、スペイン語、ドイツ語、タイ語、インドネシア語、ベトナム語、アラビア語など、92 の言語間での翻訳をサポートします。モデルの性能および翻訳品質が包括的に向上しており、用語集のカスタマイズ安定性、フォーマット保持機能、ドメイン固有のプロンプト対応が強化され、より正確で自然な翻訳を実現します。利用方法

インターナショナル

インターナショナルデプロイモードでは、エンドポイントおよびデータストレージの両方が シンガポール リージョンに配置されます。モデル推論のコンピューティングリソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力課金額

出力課金額

無料クォータ

ルール説明

(トークン)

(100 万トークンあたり)

qwen-mt-plus

Qwen3-MT の一部:Qwen3-MT

16,384

8,192

8,192

$2.46

$7.37

100 万トークン

Model Studio を有効化後 90 日間有効

qwen-mt-flash

Qwen3-MT の一部:Qwen3-MT

$0.16

$0.49

qwen-mt-lite

Qwen3-MT の一部:Qwen3-MT

$0.12

$0.36

qwen-mt-turbo

Qwen3-MT の一部:Qwen3-MT

$0.16

$0.49

グローバル

グローバルデプロイモードでは、エンドポイントおよびデータストレージの両方が 米国 (バージニア) リージョンに配置されます。モデル推論のコンピューティングリソースは、世界中で動的にスケジュールされます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力課金額

(トークン)

(100 万トークンあたり)

qwen-mt-plus

Qwen3-MT の一部:Qwen3-MT

16,384

8,192

8,192

$0.259

$0.775

qwen-mt-flash

Qwen3-MT の一部:Qwen3-MT

$0.101

$0.280

qwen-mt-lite

Qwen3-MT の一部:Qwen3-MT

$0.086

$0.229

中国本土

中国本土デプロイモードでは、エンドポイントおよびデータストレージの両方が 中国 (北京) リージョンに配置されます。モデル推論のコンピューティングリソースは、中国本土内に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力課金額

出力課金額

(トークン)

(100 万トークンあたり)

qwen-mt-plus

所属 Qwen3-MT

16,384

8,192

8,192

$0.259

$0.775

qwen-mt-flash

所属:Qwen3-MT

$0.101

$0.280

qwen-mt-lite

所属 Qwen3-MT

$0.086

$0.229

qwen-mt-turbo

所属:Qwen3-MT

$0.101

$0.280

Qwen-Doc

Qwen データマイニングモデルは、ドキュメントから構造化情報を抽出し、データアノテーション、コンテンツモデレーション、その他のアプリケーションに利用されます。 使用方法 | API リファレンス

説明

中国本土デプロイモード のみがサポートされています。このモードでは、エンドポイントとデータストレージは 北京リージョン に配置され、推論コンピューティングリソースは中国本土に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(トークン)

(100万トークンあたり)

qwen-doc-turbo

262,144

253,952

32,768

$0.087

$0.144

無料クォータなし

Qwen-Deep-Research

Qwen ディープリサーチモデルは、複雑な問題を分解し、Web 検索を使用して推論と分析を実行し、調査レポートを生成できます。使用方法 | API リファレンス

説明

唯一、中国本土デプロイモードがサポートされています。このモードでは、エンドポイントとデータストレージは北京リージョンに配置され、推論コンピューティングリソースは中国本土に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(1K トークンあたり)

qwen-deep-research

1,000,000

997,952

32,768

$0.007742

$0.023367

テキスト生成 – Qwen – オープンソース

  • モデル名において、`xxb` はパラメーター規模を示します。たとえば、`qwen2-72b-instruct` は 720 億パラメーターを有します。

  • Model Studio では、オープンソースの Qwen モデルを呼び出すことが可能です。ローカルへのデプロイは不要です。オープンソースモデルについては、Qwen3 および Qwen2.5 の利用を推奨します。

Qwen3.5

テキスト、画像、動画の入力をサポートします。プレーンテキストタスクにおいては Qwen3 Max と同等の性能を発揮し、より低いコストで優れたパフォーマンスを実現します。マルチモーダル機能に関しては、Qwen3 VL シリーズを大幅に上回る改善が図られています。

モデル

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大応答

入力コスト

出力コスト

CoT + 応答

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3.5-397b-a17b

思考モードがデフォルトで有効化されています

思考モード

262,144

258,048

81,920

65,536

段階的価格設定。詳細は以下をご参照ください。

各モデル 100 万トークン

Model Studio を有効化した日から 90 日間有効

国際版のみ

非思考

260,096

-

qwen3.5-122b-a10b

思考モードがデフォルトで有効化されています

思考モード

262,144

258,048

81,920

65,536

非思考

260,096

-

qwen3.5-27b

思考モードがデフォルトで有効化されています

思考モード

262,144

258,048

81,920

65,536

ノンシンキングモード

260,096

-

qwen3.5-35b-a3b

思考モードがデフォルトで有効化されています

思考モード

262,144

258,048

81,920

65,536

ノンシンキングモード

260,096

-

`qwen3.5-397b-a17b`、`qwen3.5-122b-a10b`、`qwen3.5-27b`、および `qwen3.5-35b-a3b` モデルは、現在のリクエストにおける入力トークン数に基づく段階的価格設定を採用しています。

国際

モデル

リクエストあたりの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

qwen3.5-397b-a17b

0<トークン≤256K

$0.6

$3.6

qwen3.5-122b-a10b

$0.4

$3.2

qwen3.5-27b

$0.3

$2.4

qwen3.5-35b-a3b

$0.25

$2

グローバル版

モデル

リクエストあたりの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

qwen3.5-397b-a17b

0<トークン≤128K

$0.172

$1.032

128K<トークン≤256K

$0.43

$2.58

qwen3.5-122b-a10b

0<トークン≤128K

$0.115

$0.917

128K<トークン≤256K

$0.287

$2.294

qwen3.5-27b

0<トークン≤128K

$0.086

$0.688

128K<トークン≤256K

$0.258

$2.064

qwen3.5-35b-a3b

0<トークン≤128K

$0.057

$0.459

128K<トークン≤256K

$0.229

$1.835

中国本土

モデル

リクエストあたりの入力トークン数

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

qwen3.5-397b-a17b

0<トークン≤128K

$0.172

$1.032

128K<トークン≤256K

$0.43

$2.58

qwen3.5-122b-a10b

0<トークン≤128K

$0.115

$0.917

128K<トークン≤256K

$0.287

$2.294

qwen3.5-27b

0<トークン≤128K

$0.086

$0.688

128K<トークン≤256K

$0.258

$2.064

qwen3.5-35b-a3b

0<トークン≤128K

$0.057

$0.459

128K<トークン≤256K

$0.229

$1.835

Qwen3

2025 年 9 月にリリースされた `qwen3-next-80b-a3b-thinking` モデルは、思考モードのみをサポートします。命令追従能力を向上させ、`qwen3-235b-a22b-thinking-2507` と比較して、より簡潔な要約応答を提供します。

2025 年 9 月にリリースされた `qwen3-next-80b-a3b-instruct` モデルは、ノンシンキングモードのみをサポートします。中国語理解、論理的推論、テキスト生成能力を、`qwen3-235b-a22b-instruct-2507` と比較して向上させています。

`qwen3-235b-a22b-thinking-2507` および `qwen3-30b-a3b-thinking-2507` モデルは、2025 年 7 月にリリースされ、いずれも思考モードのみをサポートします。これらは、それぞれ `qwen3-235b-a22b`(思考モード)および `qwen3-30b-a3b`(思考モード)のスペックアップ版です。

`qwen3-235b-a22b-instruct-2507` および `qwen3-30b-a3b-instruct-2507` モデルは、2025 年 7 月にリリースされ、いずれもノンシンキングモードのみをサポートします。これらは、それぞれ `qwen3-235b-a22b`(ノンシンキングモード)および `qwen3-30b-a3b`(ノンシンキングモード)のスペックアップ版です。

2025 年 4 月にリリースされた Qwen3 モデルは、思考モードおよびノンシンキングモードの両方をサポートします。`enable_thinking` パラメーターを使用することで、モードの切り替えが可能です。さらに、Qwen3 モデルは以下の分野で大幅な改善を実現しています:

  1. 推論能力:数学、コード、論理的推論に関する評価において、QwQ および同程度のサイズの非推論モデルを大幅に上回り、同規模モデルとしては業界トップクラスのパフォーマンスを達成します。

  2. 人間の好ましさとの整合性:クリエイティブライティング、ロールの引き受け、マルチターン対話、命令追従などの能力が大幅に強化されています。汎用的な能力は、同程度のサイズの他のモデルを大きく上回ります。

  3. エージェント機能:思考モードおよびノンシンキングモードの両方で業界トップクラスのパフォーマンスを発揮し、外部ツールの正確な呼び出しを可能にします。

  4. 多言語対応:100 言語以上および方言に対応し、多言語翻訳、命令理解、常識的推論の分野で顕著な改善を実現します。

    対応言語

    英語

    簡体字中国語

    繁体字中国語

    フランス語

    スペイン語

    アラビア語はアラビア文字で記述され、多くのアラブ諸国の公用語です。

    ロシア語はキリル文字で記述され、ロシアおよびその他のいくつかの国の公用語です。

    ポルトガル語はラテン文字を使用し、ポルトガル、ブラジルおよびその他のポルトガル語圏諸国の公用語です。

    ドイツ語はラテン文字で記述され、ドイツ、オーストリアおよびその他の地域の公用語です。

    イタリア語はラテン文字を使用し、イタリア、サンマリノおよびスイスの一部の公用語です。

    オランダ語はラテン文字を使用し、オランダ、ベルギーのフランデレン地方およびスリナムの公用語です。

    デンマーク語はラテン文字を使用し、デンマークの公用語です。

    アイルランド語はラテン文字を使用し、アイルランドの公用語の一つです。

    ウェールズ語はラテン文字を使用し、ウェールズの公用語の一つです。

    フィンランド語はラテン文字を使用し、フィンランドの公用語です。

    アイスランド語はラテン文字で記述され、アイスランドの公用語です。

    スウェーデン語はラテン文字で記述され、スウェーデンの公用語です。

    ノルウェー語ニーノシュクはラテン文字で記述され、ノルウェーの二つの公式文書表記の一つであり、もう一つはボクマールです。

    ノルウェー語ボクマールは、ノルウェーの主要な文書表記の一つです。

    日本語は日本の公用語であり、日本語文字を使用します。

    韓国語はハングル文字で記述され、韓国および北朝鮮の公用語です。

    ベトナム語はラテン文字を使用し、ベトナムの公用語です。

    タイ語はタイ文字で記述され、タイの公用語です。

    インドネシア語はラテン文字を使用し、インドネシアの公用語です。

    マレー語はラテン文字を使用し、マレーシアおよび周辺地域の主要言語です。

    ビルマ語はビルマ文字で記述され、ミャンマーの公用語です。

    タガログ語はフィリピンの主要言語の一つであり、ラテン文字を使用します。

    クメール語はクメール文字で記述され、カンボジアの公用語です。

    ラオ語はラオ文字で記述され、ラオスの公用語です。

    ヒンディー語はデーヴァナーガリー文字を使用し、インドの公用語の一つです。

    ベンガル語はベンガル文字で記述され、バングラデシュおよびインド西ベンガル州の公用語です。

    ウルドゥー語はアラビア文字で記述され、パキスタンの公用語の一つです。また、インドでも話されています。

    ネパール語はデーヴァナーガリー文字で記述され、ネパールの公用語です。

    ヘブライ語はヘブライ文字で記述され、イスラエルの公用語です。

    トルコ語はラテン文字で記述され、トルコおよび北キプロスの公用語です。

    ペルシャ語はアラビア文字を使用し、イランやタジキスタンなどの国々の公用語です。

    ポーランド語はラテン文字を使用し、ポーランドの公用語です。

    ウクライナ語はキリル文字で記述され、ウクライナの公用語です。

    チェコ語はラテン文字を使用し、チェコ共和国の公用語です。

    ルーマニア語はラテン文字で記述され、ルーマニアおよびモルドバの公用語です。

    ブルガリア語はキリル文字で記述され、ブルガリアの公用語です。

    スロバキア語はラテン文字を使用し、スロバキアの公用語です。

    ハンガリー語はラテン文字を使用し、ハンガリーの公用語です。

    スロベニア語はラテン文字を使用し、スロベニアの公用語です。

    ラトビア語はラテン文字を使用し、ラトビアの公用語です。

    エストニア語はラテン文字を使用し、エストニアの公用語です。

    リトアニア語はラテン文字を使用し、リトアニアの公用語です。

    ベラルーシ語はキリル文字で記述され、ベラルーシの公用言語の一つです。

    ギリシャ語はギリシャ文字で記述され、ギリシャおよびキプロスの公用語です。

    クロアチア語はラテン文字を使用し、クロアチアの公用語です。

    マケドニア語は北マケドニアの公用語であり、キリル文字で記述されます。

    マルタ語はラテン文字を使用し、マルタの公用語です。

    セルビア語はキリル文字で記述され、セルビアの公用語です。

    ボスニア語はボスニア・ヘルツェゴビナの公用言語の一つであり、ラテン文字を使用します。

    ジョージア語はジョージアの公用語であり、ジョージア文字で記述されます。

    アルメニア語はアルメニア文字で記述され、アルメニアの公用語です。

    北アゼルバイジャン語はラテン文字を使用し、アゼルバイジャンの公用語です。

    カザフ語はキリル文字で記述され、カザフスタンの公用語です。

    北ウズベク語はラテン文字で記述され、ウズベキスタンの公用語です。

    タジク語はキリル文字で記述され、タジキスタンの公用語です。

    スワヒリ語はラテン文字を使用し、多くの東アフリカ諸国における共通語または公用語です。

    アフリカーンス語はラテン文字を使用し、主に南アフリカおよびナミビアで話されています。

    広東語は繁体字中国語で記述され、中国広東省、香港およびマカオの主要言語です。

    ルクセンブルク語はラテン文字を使用し、ルクセンブルクの公用語の一つです。また、ドイツの一部でも話されています。

    リンブルグ語はラテン文字で記述され、主にオランダ、ベルギーおよびドイツの一部で話されています。

    カタロニア語はラテン文字を使用し、スペインのカタルーニャ地方などで話されています。

    ガリシア語はラテン文字を使用し、主にスペインのガリシア地方で話されています。

    アストゥリアス語はラテン文字を使用し、主にスペインのアストゥリアス地方で話されています。

    バスク語はラテン文字を使用し、主にスペインおよびフランスのバスク地方で話されています。これは、スペインのバスク自治州の公用語の一つです。

    オック語はラテン文字を使用し、主にフランス南部で話されています。

    ヴェネト語は主にイタリアのヴェネト地方で話されており、ラテン文字を使用します。

    サルデーニャ語はラテン文字を使用し、主にイタリアのサルデーニャ島で話されています。

    シチリア語はラテン文字で記述され、主にイタリアのシチリア島で話されています。

    フリウリ語はラテン文字を使用し、主にイタリアのフリウリ=ヴェネツィア・ジュリア州で話されています。

    ロンバルディア語は主にイタリアのロンバルディア地方で話されており、ラテン文字を使用します。

    リグーリア語はラテン文字を使用し、主にイタリアのリグーリア地方で話されています。

    フェロー語はラテン文字で記述され、フェロー諸島の公用語の一つであり、主にそこで話されています。

    トスク・アルバニア語はラテン文字を使用し、アルバニア語の主な南部方言です。

    シレジア語はラテン文字を使用し、主にポーランドで話されています。

    バシキール語はキリル文字で記述され、主にロシアのバシコルトスタンで話されています。

    タタール語はキリル文字で記述され、主にロシアのタタールスタンで話されています。

    メソポタミア・アラビア語はアラビア文字で記述され、主にイラクで話されています。

    ナジュディ・アラビア語はアラビア文字を使用し、主にサウジアラビアのナジュド地方で話されています。

    エジプト・アラビア語はアラビア文字で記述され、主にエジプトで話されています。

    レヴァンティン・アラビア語はアラビア文字を使用し、主にシリアおよびレバノンで話されています。

    タイズィー=アデニ・アラビア語はセム語族の言語であり、アラビア文字で記述され、主にイエメンおよびサウジアラビアのハドラマウト地方で話されています。

    ダリ語はアラビア文字を使用し、アフガニスタンの公用語の一つです。

    チュニジア・アラビア語はアラビア文字で記述され、主にチュニジアで話されています。

    モロッコ・アラビア語はアラビア文字で記述され、主にモロッコで話されています。

    カブベルディアヌは主にカーボベルデで話されており、ラテン文字を使用します。

    トク・ピシンはパプアニューギニアの主要な共通語であり、ラテン文字を使用します。

    東部イディッシュ語はヘブライ文字で記述され、主にユダヤ系コミュニティで使用されています。

    シンディー語はアラビア文字で記述され、パキスタンのシンド州の公用語の一つです。

    シンハラ語はシンハラ文字で記述され、スリランカの公用語の一つです。

    テルグ語はテルグ文字で記述され、インドのアーンドラプラデーシュ州およびテランガーナ州の公用語の一つです。

    パンジャブ語はグルムキー文字で記述され、インドのパンジャブ州で話されており、インドの公用語の一つです。

    タミル語はタミル文字で記述され、インドのタミル・ナードゥ州およびスリランカの公用語の一つです。

    グジャラート語はグジャラート文字で記述され、インドのグジャラート州の公用語です。

    マラヤーラム語はマラヤーラム文字で記述され、インドのケーララ州の公用語の一つです。

    マラーティー語はデーヴァナーガリー文字で記述され、インドのマハーラーシュトラ州の公用語の一つです。

    カンナダ語はカンナダ文字で記述され、インドのカルナータカ州の公用語の一つです。

    マガヒー語はデーヴァナーガリー文字で記述され、主にインドのビハール州で話されています。

    オリヤ語はウルドゥー文字を使用し、インドのオディシャ州の公用語の一つです。

    アワディー語はデーヴァナーガリー文字で記述され、主にインドのウッタル・プラデーシュ州で話されています。

    マイティリー語はデーヴァナーガリー文字で記述され、インドの公用語の一つであり、インドのビハール州およびネパールのテライ平野で話されています。

    アッサム語はベンガル文字を使用し、インドのアッサム州の公用語の一つです。

    チャッティースガル語はデーヴァナーガリー文字で記述され、主にインドのチャッティースガル州で話されています。

    ボージュプリー語はデーヴァナーガリー文字を使用し、インドおよびネパールの一部で話されています。

    ミナンカバウ語はラテン文字で記述され、主にインドネシアのスマトラ島で話されています。

    バリ語はラテン文字で記述され、主にインドネシアのバリ島で話されています。

    ジャワ語はインドネシアのジャワ島で広く話されており、ラテン文字およびジャワ文字の両方で記述されます。

    バンジャール語はラテン文字で記述され、主にインドネシアのカリマンタン島で話されています。

    スンダ語はインドネシアの西ジャワで主に話されており、ラテン文字で記述されますが、伝統的にはスンダ文字が使用されていました。

    セブアノ語はラテン文字を使用し、主にフィリピンのセブ地方で話されています。

    パンガシナン語はラテン文字で記述され、主にフィリピンのパンガシナン州で話されています。

    イロコ語は主にフィリピンで話されており、ラテン文字を使用します。

    ワライ語はフィリピンの言語であり、ラテン文字を使用します。

    ハイチ・クレオール語はラテン文字を使用し、ハイチの公用語です。

    パピアメント語はラテン文字を使用し、アルバ、キュラソーなどのカリブ海地域で主に話されています。

  5. 応答フォーマット:以前のバージョンで見られた、不適切な Markdown レンダリング、応答の途中切断、誤ったボックス形式の出力などの問題を修正しました。

2025 年 4 月にリリースされた Qwen3 オープンソースモデルは、思考モードにおいて非ストリーミング出力をサポートしません。
Qwen3 オープンソースモデルで思考モードを有効化した場合、出力に推論プロセスが表示されないときは、ノンシンキングモードの料金が適用されます。

思考モード | ノンシンキングモード | 利用方法

国際

国際版デプロイモード」では、エンドポイントおよびデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-next-80b-a3b-thinking

思考モードのみ

131,072

126,976

81,920

32,768

$0.15

$1.2

各モデル 100 万トークン

Model Studio を有効化した日から 90 日間有効

qwen3-next-80b-a3b-instruct

ノンシンキングモード

129,024

-

qwen3-235b-a22b-thinking-2507

思考モードのみ

126,976

81,920

$0.23

$2.3

qwen3-235b-a22b-instruct-2507

非思考

129,024

-

$0.92

qwen3-30b-a3b-thinking-2507

思考モードのみ

126,976

81,920

$0.2

$2.4

qwen3-30b-a3b-instruct-2507

ノンシンキングモード

129,024

-

$0.8

qwen3-235b-a22b

このモデルおよび以下のモデルは 2025 年 4 月にリリースされました。

ノンシンキングモード

129,024

-

16,384

$0.7

$2.8

思考モード

98,304

38,912

$8.4

qwen3-32b

非思考

129,024

-

$0.16

$0.64

思考モード

98,304

38,912

qwen3-30b-a3b

ノンシンキングモード

129,024

-

$0.2

$0.8

思考モード

98,304

38,912

$2.4

qwen3-14b

ノンシンキングモード

129,024

-

8,192

$0.35

$1.4

思考モード

98,304

38,912

$4.2

qwen3-8b

非思考

129,024

-

$0.18

$0.7

思考モード

98,304

38,912

$2.1

qwen3-4b

ノンシンキングモード

129,024

-

$0.11

$0.42

思考モード

98,304

38,912

$1.26

qwen3-1.7b

ノンシンキングモード

32,768

30,720

-

$0.42

思考モード

28,672

合計値は 30,720 を超えてはなりません。

$1.26

qwen3-0.6b

非思考

30,720

-

$0.42

思考モード

28,672

入力の合計は 30,720 を超えてはなりません。

$1.26

グローバル版

グローバル版デプロイモード」では、エンドポイントおよびデータストレージの両方が米国(バージニア)リージョンに配置されます。モデル推論の計算リソースは、世界中で動的にスケジュールされます。

モデル

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-next-80b-a3b-thinking

思考モードのみ

131,072

126,976

81,920

32,768

$0.144

$1.434

無料クォータなし

qwen3-next-80b-a3b-instruct

非思考のみ

129,024

-

$0.574

qwen3-235b-a22b-thinking-2507

思考モードのみ

126,976

81,920

$0.23

$2.3

qwen3-235b-a22b-instruct-2507

ノンシンキングモードのみ

129,024

-

$0.92

qwen3-30b-a3b-thinking-2507

思考のみ

126,976

81,920

$0.108

$1.076

qwen3-30b-a3b-instruct-2507

非思考のみ

129,024

-

$0.431

qwen3-235b-a22b

ノンシンキングモード

129,024

-

16,384

$0.287

$1.147

思考モード

98,304

38,912

$2.868

qwen3-32b

ノンシンキングモード

129,024

-

$0.16

$0.64

思考モード

98,304

38,912

qwen3-30b-a3b

ノンシンキングモード

129,024

-

$0.108

$0.431

思考モード

98,304

38,912

$1.076

qwen3-14b

ノン・シンキング

129,024

-

8,192

$0.144

$0.574

思考モード

98,304

38,912

$1.434

qwen3-8b

ノンシンキングモード

129,024

-

$0.072

$0.287

思考モード

98,304

38,912

$0.717

中国本土版

中国本土版デプロイモード」では、エンドポイントおよびデータストレージの両方が中国(北京)リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。

モデル

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-next-80b-a3b-thinking

思考モードのみ

131,072

126,976

81,920

32,768

$0.144

$1.434

無料クォータなし

qwen3-next-80b-a3b-instruct

思考モードは利用できません。

129,024

-

$0.574

qwen3-235b-a22b-thinking-2507

思考モードのみ

126,976

81,920

$0.287

$2.868

qwen3-235b-a22b-instruct-2507

非思考

129,024

-

$1.147

qwen3-30b-a3b-thinking-2507

思考モードのみ

126,976

81,920

$0.108

$1.076

qwen3-30b-a3b-instruct-2507

ノンシンキングモード

129,024

-

$0.431

qwen3-235b-a22b

ノンシンキングモード

129,024

-

16,384

$0.287

$1.147

思考モード

98,304

38,912

$2.868

qwen3-32b

ノンシンキングモード

129,024

-

$0.287

$1.147

思考モード

98,304

38,912

$2.868

qwen3-30b-a3b

ノンシンキングモード

129,024

-

$0.108

$0.431

思考モード

98,304

38,912

$1.076

qwen3-14b

ノンシンキングモード

129,024

-

8,192

$0.144

$0.574

思考モード

98,304

38,912

$1.434

qwen3-8b

ノンシンキングモード

129,024

-

$0.072

$0.287

思考モード

98,304

38,912

$0.717

qwen3-4b

ノンシンキングモード

129,024

-

$0.044

$0.173

思考モード

98,304

38,912

$0.431

qwen3-1.7b

ノンシンキングモード

32,768

30,720

-

$0.173

思考モード

28,672

入力値の合計は 30,720 を超えてはなりません。

$0.431

qwen3-0.6b

ノンシンキングモード

30,720

-

$0.173

思考モード

28,672

入力の合計は 30,720 を超えてはなりません。

$0.431

QwQ – オープンソース

QwQ は、Qwen2.5-32B を基にトレーニングされた推論モデルです。強化学習を活用して、推論能力を大幅に向上させています。数学およびコーディングのベンチマーク(AIME 24/25、LiveCodeBench)および汎用ベンチマーク(IFEval、LiveBench)といったコア指標は、フルサイズの DeepSeek-R1 モデルと同等です。また、Qwen2.5-32B を基にした別のモデルである DeepSeek-R1-Distill-Qwen-32B と比較しても、すべての指標で顕著に上回っています。利用方法 | API リファレンス

説明

サポートされているのは中国本土版デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージは中国(北京)リージョンに配置され、推論の計算リソースは中国本土に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwq-32b

131,072

98,304

32,768

8,192

$0.287

$0.861

QwQ-Preview

`qwq-32b-preview` は Qwen チームが 2024 年に開発した実験的研究モデルです。特に数学およびプログラミング分野における AI 推論能力の強化に焦点を当てています。制限事項については、「QwQ 公式ブログ」をご参照ください。利用方法 | API リファレンス | オンラインで試す

説明

サポートされているのは中国本土版デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージは中国(北京)リージョンに配置され、推論の計算リソースは中国本土に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwq-32b-preview

32,768

30,720

16,384

$0.287

$0.861

Qwen2.5

Qwen2.5 は Qwen が提供する大規模言語モデルシリーズです。このシリーズには複数のベースモデルおよび命令チューニング済みモデルが含まれ、パラメーター数は 70 億から 720 億の範囲です。Qwen2 からの主な改善点は以下のとおりです。

  • 最新の大規模データセット(最大 18 兆トークン)で事前トレーニングされています。

  • ドメイン特化型のエキスパートモデルにより、知識が拡張され、コーディングおよび数学能力が大幅に向上しています。

  • 命令追従性、長文生成(8K トークン以上)、構造化データ(テーブルなど)の理解、構造化出力(特に JSON)の生成能力が向上しています。多様なシステムプロンプトへの堅牢な対応、ロールの引き受け、チャットボットの条件付き設定も強化されています。

  • 中国語、英語、フランス語、スペイン語、ポルトガル語、ドイツ語、イタリア語、ロシア語、日本語、韓国語、ベトナム語、タイ語、アラビア語など、29 言語以上をサポートしています。

利用方法 | API リファレンス | オンラインで試す

国際版

国際版デプロイモード」では、エンドポイントおよびデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(トークン)

(100 万トークンあたり)

qwen2.5-14b-instruct-1m

1,008,192

1,000,000

8,192

$0.805

$3.22

各モデル 100 万トークン

Model Studio を有効化した日から 90 日間有効

qwen2.5-7b-instruct-1m

$0.368

$1.47

qwen2.5-72b-instruct

131,072

129,024

$1.4

$5.6

qwen2.5-32b-instruct

$0.7

$2.8

qwen2.5-14b-instruct

$0.35

$1.4

qwen2.5-7b-instruct

$0.175

$0.7

中国本土

中国本土版デプロイモード」では、エンドポイントおよびデータストレージは中国(北京)リージョンに配置されます。モデル推論の計算リソースは中国本土に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen2.5-14b-instruct-1m

1,000,000

1,000,000

8,192

$0.144

$0.431

qwen2.5-7b-instruct-1m

$0.072

$0.144

qwen2.5-72b-instruct

131,072

129,024

$0.574

$1.721

qwen2.5-32b-instruct

$0.287

$0.861

qwen2.5-14b-instruct

$0.144

$0.431

qwen2.5-7b-instruct

$0.072

$0.144

qwen2.5-3b-instruct

32,768

30,720

$0.044

$0.130

qwen2.5-1.5b-instruct

期間限定無料

qwen2.5-0.5b-instruct

QVQ

`qvq-72b-preview` は Qwen チームが開発した実験的研究モデルです。特に数学分野における視覚的推論の向上に焦点を当てています。制限事項については、「QVQ 公式ブログ」をご参照ください。利用方法 | API リファレンス

最終的な回答の前に推論プロセスを表示するには、商用 QVQ モデルをご利用ください。
説明

サポートされているのは中国本土版デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージは中国(北京)リージョンに配置され、推論の計算リソースは中国本土に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qvq-72b-preview

32,768

16,384

画像 1 枚あたり最大 16,384

16,384

$1.721

$5.161

Qwen-Omni

これは Qwen2.5 を基盤とした新しいマルチモーダル理解・生成モデルです。テキスト、画像、音声、動画の入力をサポートします。ストリーミングモードでテキストと音声を同時に生成します。マルチモーダル理解速度が大幅に向上しています。利用方法 | API リファレンス

国際版

国際版デプロイモード」では、エンドポイントおよびデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

コンテキストウィンドウ

最大入力

最大出力

無料クォータ

(トークン)

qwen2.5-omni-7b

32,768

30,720

2,048

100 万トークン(モダリティの区別なし)

Model Studio を有効化した日から 90 日間有効

無料クォータの利用後は、以下のように課金されます。

入力

単価(100 万トークンあたり)

テキスト

$0.10

音声

$6.76

画像 / 動画

$0.28

出力

単価(100 万トークンあたり)

テキスト

$0.40(テキストのみの入力)

$0.84(画像、音声、または動画を含む入力)

テキスト + 音声

$13.51(音声)

テキスト出力は課金されません。

中国本土

中国本土版デプロイモード」では、エンドポイントおよびデータストレージは中国(北京)リージョンに配置されます。モデル推論の計算リソースは中国本土に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

(トークン)

qwen2.5-omni-7b

32,768

30,720

2,048

入力および出力の課金ルールは以下のとおりです。

入力

単価(100 万トークンあたり)

テキスト

$0.087

音声

$5.448

画像 / 動画

$0.287

出力

単価(100 万トークンあたり)

テキスト

$0.345(テキストのみの入力)

$0.861(画像、音声、または動画を含む入力)

テキスト + 音声

$10.895(音声)

テキスト出力は課金されません。

Qwen3-Omni-Captioner

Qwen3-Omni-Captioner は、Qwen3-Omni を基盤としたオープンソースモデルです。プロンプトを必要とせずに、環境音、音楽、効果音を含む複雑な音声に対して正確かつ包括的な説明を生成します。話者の感情、音楽要素(ジャンルや楽器など)、センシティブなコンテンツを検出します。ユースケースには、音声コンテンツ分析、セキュリティレビュー、インテント認識、音声編集などが含まれます。利用方法 | API リファレンス

国際版

国際版デプロイモード」では、エンドポイントおよびデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-omni-30b-a3b-captioner

65,536

32,768

32,768

$3.81

$3.06

100 万トークン

Model Studio を有効化した日から 90 日間有効

中国本土

中国本土版デプロイモード」では、エンドポイントおよびデータストレージの両方が中国(北京)リージョンに配置されます。モデル推論の計算リソースは中国本土に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-omni-30b-a3b-captioner

65,536

32,768

32,768

$2.265

$1.821

無料クォータなし。

Qwen-VL

Alibaba Cloud の Qwen-VL オープンソースモデルです。利用方法 | API リファレンス

Qwen2.5-VL と比較して、Qwen3-VL は以下の点で大幅な改善を実現しています。

  • エージェントとのインタラクション:コンピューターまたはモバイル端末のインターフェイスを操作し、GUI 要素を認識してその機能を理解し、ツールを呼び出してタスクを実行できます。OS World などの評価において業界トップクラスのパフォーマンスを達成しています。

  • 視覚的コーディング:画像または動画からコードを生成し、デザインモックアップ、ウェブサイトのスクリーンショットなどの入力から HTML、CSS、JavaScript コードを作成することをサポートします。

  • 空間知能:2D および 3D の位置決めをサポートし、物体の向き、視点の変化、遮蔽関係を正確に判断します。

  • 長尺動画の理解:最長 20 分間の動画コンテンツを理解でき、秒単位での正確なローカライズを提供します。

  • ディープシンキング:ディープシンキング機能を備え、微細な詳細の把握や因果関係の分析に優れ、MathVista や MMMU などの評価において業界トップクラスのパフォーマンスを達成しています。

  • OCR:言語サポートが 33 言語に拡張されました。複雑な照明、ぼかし、傾いたテキストなどのシナリオでも安定したパフォーマンスを発揮します。また、希少文字、古文書、専門用語の精度も大幅に向上しています。

    対応言語

    このモデルは以下の 33 言語をサポートしています:中国語、日本語、韓国語、インドネシア語、ベトナム語、タイ語、英語、フランス語、ドイツ語、ロシア語、ポルトガル語、スペイン語、イタリア語、スウェーデン語、デンマーク語、チェコ語、ノルウェー語、オランダ語、フィンランド語、トルコ語、ポーランド語、スワヒリ語、ルーマニア語、セルビア語、ギリシャ語、カザフ語、ウズベク語、セブアノ語、アラビア語、ウルドゥー語、ペルシア語、ヒンディー語/デーヴァナーガリー、ヘブライ語。

国際版

国際版デプロイモード」では、エンドポイントおよびデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT + 出力

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-vl-235b-a22b-thinking

思考モードのみ

126,976

81,920

$0.4

$4

各モデル 100 万トークン

Model Studio を有効化した日から 90 日間有効

qwen3-vl-235b-a22b-instruct

ノンシンキングモード

129,024

-

$1.6

qwen3-vl-32b-thinking

思考モードのみ

131,072

126,976

81,920

32,768

$0.16

$0.64

qwen3-vl-32b-instruct

非思考のみ

129,024

-

qwen3-vl-30b-a3b-thinking

思考モードのみ

126,976

81,920

$0.2

$2.4

qwen3-vl-30b-a3b-instruct

ノンシンキングモード

129,024

-

$0.8

qwen3-vl-8b-thinking

思考モード

126,976

81,920

$0.18

$2.1

qwen3-vl-8b-instruct

非思考

129,024

-

$0.7

その他のモデル

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen2.5-vl-72b-instruct

131,072

129,024

画像 1 枚あたり最大:16,384

8,192

$2.8

$8.4

各モデル 100 万トークン

Model Studio を有効化した日から 90 日間有効

qwen2.5-vl-32b-instruct

$1.4

$4.2

qwen2.5-vl-7b-instruct

$0.35

$1.05

qwen2.5-vl-3b-instruct

$0.21

$0.63

グローバル版

グローバル版デプロイモード」では、エンドポイントおよびデータストレージの両方が米国(バージニア)リージョンに配置されます。モデル推論の計算リソースは、世界中で動的にスケジュールされます。

モデル

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT + 出力

(トークン)

(100 万トークンあたり)

qwen3-vl-235b-a22b-thinking

思考モードのみ

126,976

81,920

$0.287

$2.867

qwen3-vl-235b-a22b-instruct

ノンシンキングモードのみ

129,024

-

$1.147

qwen3-vl-32b-thinking

思考中のみ

131,072

126,976

81,920

32,768

$0.16

$0.64

qwen3-vl-32b-instruct

ノンシンキングモードのみ

129,024

-

qwen3-vl-30b-a3b-thinking

思考モードのみ

126,976

81,920

$0.108

$1.076

qwen3-vl-30b-a3b-instruct

ノンシンキングモードのみ

129,024

-

$0.431

qwen3-vl-8b-thinking

思考モードのみ

126,976

81,920

$0.072

$0.717

qwen3-vl-8b-instruct

ノンシンキングモードのみ

129,024

-

$0.287

中国本土

中国本土版デプロイモード」では、エンドポイントおよびデータストレージの両方が中国(北京)リージョンに配置されます。モデル推論の計算リソースは中国本土に限定されます。

モデル

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力コスト

出力コスト

CoT + 出力

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen3-vl-235b-a22b-thinking

思考モードのみ

131,072

126,976

81,920

$0.287

$2.867

無料クォータなし

qwen3-vl-235b-a22b-instruct

ノンシンキングモードのみ

129,024

-

$1.147

qwen3-vl-32b-thinking

思考モードのみ

131,072

126,976

81,920

32,768

$0.287

$2.868

qwen3-vl-32b-instruct

ノンシンキングモードのみ

129,024

-

$1.147

qwen3-vl-30b-a3b-thinking

思考モードのみ

126,976

81,920

$0.108

$1.076

qwen3-vl-30b-a3b-instruct

思考なしのみ

129,024

-

$0.431

qwen3-vl-8b-thinking

思考モードのみ

126,976

81,920

$0.072

$0.717

qwen3-vl-8b-instruct

ノンシンキングモードのみ

129,024

-

$0.287

その他のモデル

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン)

(100 万トークンあたり)

qwen2.5-vl-72b-instruct

131,072

129,024

画像 1 枚あたり最大:16,384

8,192

$2.294

$6.881

無料クォータなし

qwen2.5-vl-32b-instruct

$1.147

$3.441

qwen2.5-vl-7b-instruct

$0.287

$0.717

qwen2.5-vl-3b-instruct

$0.173

$0.517

qwen2-vl-72b-instruct

32,768

30,720

画像 1 枚あたり最大:16,384

2,048

$2.294

$6.881

Qwen-Math

Qwen を基盤とする言語モデルで、数学問題の解決に特化しています。Qwen2.5-Math は 中国語 および 英語 をサポートし、チェーン・オブ・ソート (CoT)、プログラム・オブ・ソート (PoT)、ツール統合型推論 (TIR) など複数の推論手法を統合しています。使用方法 | API リファレンス | オンラインで試す

説明

サポートされているのは 中国本土デプロイモード のみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論用コンピューティングリソースも中国本土内に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen2.5-math-72b-instruct

4,096

3,072

3,072

$0.574

$1.721

qwen2.5-math-7b-instruct

$0.144

$0.287

qwen2.5-math-1.5b-instruct

期間限定無料

Qwen-Coder

オープンソースの Qwen コードモデルです。最新の Qwen3-Coder シリーズは、コーディングエージェントタスク、特にツール呼び出しと環境とのインタラクションに優れており、強力な汎用能力を維持しながら自律プログラミングを可能にします。利用ガイド | API リファレンス

インターナショナル

インターナショナルデプロイモードでは、エンドポイントとデータストレージは両方ともシンガポールリージョンにあります。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

Context ウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ

(注)

(トークン数)

qwen3-coder-next

262,144

204,800

65,536

段階的価格設定です。詳細は表の下の注記をご参照ください。

各 100 万トークン

Model Studio を有効化してから 90 日間有効

qwen3-coder-480b-a35b-instruct

qwen3-coder-30b-a3b-instruct

上記のモデルは、現在のリクエストの入力トークン数に基づく段階的価格設定を使用します。

モデル

リクエストあたりの入力トークン数

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

qwen3-coder-next

0 < トークン ≤ 32K

$0.3

$1.5

32K < トークン ≤ 128K

$0.5

$2.5

128K < トークン ≤ 256K

$0.8

$4

qwen3-coder-480b-a35b-instruct

0 < トークン ≤ 32K

$1.5

$7.5

32K < トークン ≤ 128K

$2.7

$13.5

128K < トークン ≤ 200K

$4.5

$22.5

qwen3-coder-30b-a3b-instruct

0 < トークン ≤ 32K

$0.45

$2.25

32K < トークン ≤ 128K

$0.75

$3.75

128K < トークン ≤ 200K

$1.2

$6

グローバル

グローバルデプロイモードでは、エンドポイントとデータストレージは両方とも米国 (バージニア) リージョンにあります。モデル推論の計算リソースは世界中で動的にスケジュールされます。

モデル

Context ウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen3-coder-480b-a35b-instruct

262,144

204,800

65,536

料金は段階的です。詳細は表の下の注記をご参照ください。

qwen3-coder-30b-a3b-instruct

qwen3-coder-480b-a35b-instruct と qwen3-coder-30b-a3b-instruct は、現在のリクエストの入力トークン数に基づく段階的価格設定を使用します。

モデル

リクエストあたりの入力トークン数

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

qwen3-coder-480b-a35b-instruct

0 < トークン ≤ 32K

$0.861

$3.441

32K < トークン ≤ 128K

$1.291

$5.161

128K < トークン ≤ 200K

$2.151

$8.602

qwen3-coder-30b-a3b-instruct

0 < トークン ≤ 32K

$0.216

$0.861

32K < トークン ≤ 128K

$0.323

$1.291

128K < トークン ≤ 200K

$0.538

$2.151

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは両方とも中国 (北京) リージョンにあります。モデル推論の計算リソースは中国本土に限定されます。

モデル

Context ウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen3-coder-next

262,144

204,800

65,536

段階的価格設定です。詳細は表の下の説明をご参照ください。

qwen3-coder-480b-a35b-instruct

qwen3-coder-30b-a3b-instruct

上記のモデルは、現在のリクエストの入力トークン数に基づく段階的価格設定を使用します。

モデル

リクエストあたりの入力トークン数

入力コスト (100 万トークンあたり)

出力コスト (100 万トークンあたり)

qwen3-coder-next

0 < トークン ≤ 32K

$0.144

$0.574

32K < トークン ≤ 128K

$0.216

$0.861

128K < トークン ≤ 256K

$0.359

$1.434

qwen3-coder-480b-a35b-instruct

0 < トークン ≤ 32K

$0.861

$3.441

32K < トークン ≤ 128K

$1.291

$5.161

128K < トークン ≤ 200K

$2.151

$8.602

qwen3-coder-30b-a3b-instruct

0 < トークン ≤ 32K

$0.216

$0.861

32K < トークン ≤ 128K

$0.323

$1.291

128K < トークン ≤ 200K

$0.538

$2.151

その他のモデル

モデル

Context ウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen2.5-coder-32b-instruct

131,072

129,024

8,192

$0.287

$0.861

qwen2.5-coder-14b-instruct

qwen2.5-coder-7b-instruct

$0.144

$0.287

qwen2.5-coder-3b-instruct

32,768

30,720

期間限定無料トライアル

qwen2.5-coder-1.5b-instruct

qwen2.5-coder-0.5b-instruct

テキスト生成 – サードパーティ

DeepSeek

DeepSeek は DeepSeek 社が開発した大規模言語モデルです。API リファレンス | オンラインで試す

中国本土

中国本土展開モード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置されます。推論の計算リソースは中国本土内に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大 CoT

最大応答

入力コスト

出力料金

(トークン)

(100 万トークンあたり)

deepseek-v3.2

685B パラメーター数
コンテキストキャッシュ の割引適用
バッチ呼び出し は半額

131,072

98,304

32,768

65,536

$0.287

$0.431

deepseek-v3.2-exp

685B パラメーター数

deepseek-v3.1

685B パラメーター数

$0.574

$1.721

deepseek-r1

685B パラメーター数
バッチ呼び出し は半額

16,384

$2.294

deepseek-r1-0528

685B パラメーター数

deepseek-v3

671B パラメーター数
バッチ呼び出し は半額

131,072

該当なし

$0.287

$1.147

deepseek-r1-distill-qwen-1.5b

Qwen2.5-Math-1.5B をベース

32,768

32,768

16,384

16,384

期間限定無料トライアル

deepseek-r1-distill-qwen-7b

Qwen2.5-Math-7B をベース

$0.072

$0.144

deepseek-r1-distill-qwen-14b

Qwen2.5-14B をベース

$0.144

$0.431

deepseek-r1-distill-qwen-32b

Qwen2.5-32B をベース

$0.287

$0.861

deepseek-r1-distill-llama-8b

Llama-3.1-8B をベース

期間限定無料トライアル

deepseek-r1-distill-llama-70b

Llama-3.3-70B をベース

Kimi

Kimi-K2 は Moonshot AI 社が開発した大規模言語モデルであり、コーディングおよびツール呼び出しに優れています。利用方法 | オンラインで試す

説明

サポートされているのは「中国本土展開モード」のみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論の計算リソースは中国本土内に限定されます。

モデル

モード

コンテキストウィンドウ

最大入力

最大 CoT

最大応答

入力料金

出力料金

(トークン)

(100 万トークンあたり)

kimi-k2.5

シンキング

262,144

258,048

81,920

98,304

$0.574

$3.011

ノンシンキング

262,144

260,096

98,304

$0.574

$3.011

kimi-k2-thinking

シンキング

262,144

229,376

32,768

16,384

$0.574

$2.294

Moonshot-Kimi-K2-Instruct

ノンシンキング

131,072

131,072

8,192

$0.574

$2.294

MiniMax

MiniMax は MiniMax 社が開発した大規模言語モデルであり、複雑な実世界タスクの処理に特化しており、多言語コーディングおよびエージェントタスク処理を強みとしています。利用方法

説明

サポートされているのは「中国本土展開モード」のみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論の計算リソースは中国本土内に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大 CoT + 応答

thinking_budget は非対応

入力料金

出力料金

(トークン)

(100 万トークンあたり)

MiniMax-M2.5

196,608

196,601

32,768

$0.304

$1.213

GLM

GLM モデルは、Zhipu AI 社がエージェント向けに設計したハイブリッド推論モデルであり、シンキングモードおよびノンシンキングモードの両方をサポートします。利用方法

説明

サポートされているのは「中国本土展開モード」のみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論の計算リソースは中国本土内に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大 CoT

最大出力

入力料金

出力料金

(トークン)

(100 万トークンあたり)

glm-5

202,752

202,752

32,768

16,384

段階的課金(下表参照)

glm-4.7

169,984

glm-4.6

これらのモデルの料金は、リクエストごとの入力トークン数によって異なります。

モデル

リクエストごとの入力トークン数

入力料金 (100 万トークンあたり)

出力料金 (100 万トークンあたり)

glm-5

0 < トークン数 ≤ 32K

$0.573

$2.58

32K < トークン数 ≤ 198K

$0.86

$3.154

glm-4.7

0 < トークン数 ≤ 32K

$0.431

$2.007

32K < トークン数 ≤ 166K

$0.574

$2.294

glm-4.6

0 < トークン数 ≤ 32K

$0.431

$2.007

32K < トークン数 ≤ 166K

$0.574

$2.294

これらのモデルはサードパーティサービスではなく、Alibaba Cloud Model Studio のサーバー上で完全に実行されます。
GLM モデルでは、シンキングモードおよびノンシンキングモードのいずれでも同一の料金が適用されます。

画像生成

Qwen 画像生成

Qwen Text-to-Image モデルは、複雑なテキスト、特に中国語と英語のバイリンガルテキストのレンダリングに優れています。API リファレンス

国際

国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。

モデル

単価

無料クォータ

qwen-image-2.0-pro

現在、qwen-image-2.0-pro-2026-03-03 と同じ機能を持ちます

$0.075/画像

新規ユーザー向けの無料クォータ:各 100 画像

有効期間:Model Studio をアクティベートしてから 90 日以内

qwen-image-2.0-pro-2026-03-03

$0.075/画像

qwen-image-2.0

現在、qwen-image-2.0-2026-03-03 と同じ機能を持ちます

$0.035/画像

qwen-image-2.0-2026-03-03

$0.035/画像

qwen-image-max

現在、qwen-image-max-2025-12-30 と同じ機能を持ちます

$0.075/画像

qwen-image-max-2025-12-30

$0.075/画像

qwen-image-plus

現在、qwen-image と同じ機能を持ちます

$0.03/画像

qwen-image-plus-2026-01-09

$0.03/画像

qwen-image

$0.035/画像

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。

モデル

単価

無料クォータ

qwen-image-2.0-pro

現在、qwen-image-2.0-pro-2026-03-03 と同じ機能を持ちます

$0.071676/画像

無料クォータなし

qwen-image-2.0-pro-2026-03-03

$0.071676/画像

qwen-image-2.0

現在、qwen-image-2.0-2026-03-03 と同じ機能を持ちます

$0.028671/画像

qwen-image-2.0-2026-03-03

$0.028671/画像

qwen-image-max

現在、qwen-image-max-2025-12-30 と同じ機能を持ちます

$0.071677/画像

qwen-image-max-2025-12-30

$0.071677/画像

qwen-image-plus

現在、qwen-image と同じ機能を持ちます

$0.028671/画像

qwen-image-plus-2026-01-09

$0.028671/画像

qwen-image

$0.035/画像

入力プロンプト

出力画像

緑豊かな芝生の上でボールで遊ぶ 3 匹の子犬をフィーチャーした、癒し系の手描きポスター。鳥や星などの装飾的な要素で飾られています。メインタイトル「Come Play Ball!」は、太字の青いカートゥーンフォントで上部に目立つように表示されています。その下に、サブタイトル「Come [Show Off Your Skills]!」が緑色のフォントで表示されています。吹き出しには「へへ、次は僕のすごいところを友達に見せてやる!」というテキストがあり、遊び心のある魅力を加えています。下部には、「また友達とボール遊びができるね!」という補足テキストが記載されています。カラーパレットは、新鮮な緑と青を中心に、明るいピンクと黄色のトーンでアクセントをつけ、陽気で子供らしい雰囲気を強調しています。

image

Qwen 画像編集

Qwen 画像編集モデルは、正確なバイリンガル (中国語-英語) テキスト編集、色補正、詳細強調、スタイル変換、オブジェクトの追加または削除、位置変更、モーション調整をサポートし、複雑な画像とテキストの複合編集を可能にします。API リファレンス

国際

国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。

モデル

単価

無料クォータ

qwen-image-2.0-pro

現在、qwen-image-2.0-pro-2026-03-03 と同じ機能を持ちます

$0.075/画像

新規ユーザー向けの無料クォータ:各 100 画像

有効期間:Model Studio をアクティベートしてから 90 日以内

qwen-image-2.0-pro-2026-03-03

$0.075/画像

qwen-image-2.0

現在、qwen-image-2.0-2026-03-03 と同じ機能を持ちます

$0.035/画像

qwen-image-2.0-2026-03-03

$0.035/画像

qwen-image-edit-max

現在、qwen-image-edit-max-2026-01-16 と同じ機能を持ちます

$0.075/画像

qwen-image-edit-max-2026-01-16

$0.075/画像

qwen-image-edit-plus

現在、qwen-image-edit-plus-2025-10-30 と同じ機能を持ちます

$0.03/画像

qwen-image-edit-plus-2025-12-15

$0.03/画像

qwen-image-edit-plus-2025-10-30

$0.03/画像

qwen-image-edit

$0.045/画像

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。

モデル

単価

無料クォータ

qwen-image-2.0-pro

現在、qwen-image-2.0-pro-2026-03-03 と同じ機能を持ちます

$0.071676/画像

無料クォータなし

qwen-image-2.0-pro-2026-03-03

$0.071676/画像

qwen-image-2.0

現在、qwen-image-2.0-2026-03-03 と同じ機能を持ちます

$0.028671/画像

qwen-image-2.0-2026-03-03

$0.028671/画像

qwen-image-edit-max

現在、qwen-image-edit-max-2026-01-16 と同じ機能を持ちます

$0.071677/画像

qwen-image-edit-max-2026-01-16

$0.071677/画像

qwen-image-edit-plus

現在、qwen-image-edit-plus-2025-10-30 と同じ機能を持ちます

$0.028671/画像

qwen-image-edit-plus-2025-12-15

$0.028671/画像

qwen-image-edit-plus-2025-10-30

$0.028671/画像

qwen-image-edit

$0.043/画像

dog_and_girl (1)

元の画像

狗修改图

人物のポーズを、立ってかがみ、犬の前足を持つように変更します。

image

元の画像

image

積み木の「HEALTH INSURANCE」という文字を「明天会更好」に置き換えます。

5

元の画像

5out

水玉模様のシャツを水色のシャツに置き換えます。

6

元の画像

6out

背景を南極に変更します。

7

元の画像

7out

人物のカートゥーンアバターを生成します。

image

元の画像

image

皿の上の髪の毛を取り除きます。

Qwen 画像翻訳

Qwen 画像翻訳モデルは、画像内のテキストを 11 の言語から中国語または英語に翻訳することをサポートします。元のレイアウトとコンテンツを正確に保持し、用語定義、禁止用語フィルタリング、主題検出などのカスタム機能を提供します。 API リファレンス

説明

中国本土デプロイモードのみがサポートされています。このモードでは、エンドポイントとデータストレージは北京リージョンに配置され、推論計算リソースは中国本土に限定されます。

モデル

単価

無料クォータ

qwen-mt-image

$0.000431/画像

無料クォータなし

en

元の画像

ja

日本語

es

ポルトガル語

ar

アラビア語

Z-Image

Tongyi - Text-to-Image - Z-Image は、高品質の画像を迅速に生成する軽量モデルです。このモデルは、中国語と英語のテキストレンダリング、複雑なセマンティック理解、さまざまなスタイル、複数の解像度とアスペクト比をサポートしています。API リファレンス

国際

国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。

モデル

単価

無料クォータ (注意)

Model Studio をアクティベートしてから 90 日間有効

z-image-turbo

プロンプト拡張無効 (prompt_extend=false):$0.015/画像

プロンプト拡張有効 (prompt_extend=true):$0.03/画像

100 画像

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。

モデル

単価

無料クォータ

z-image-turbo

プロンプト拡張無効 (prompt_extend=false):$0.01434/画像

プロンプト拡張有効 (prompt_extend=true):$0.02868/画像

無料クォータなし

入力プロンプト

出力画像

鮮やかなカートゥーンスタイルの壁画の前に自信を持って立つ、黒い短髪のスタイリッシュな若い女性の写真。彼女は全身黒の服装:フリルの襟が付いたパフボンバージャケット、カーゴショーツ、網タイツ、そしてチャンキーな黒のドクターマーチンを着用し、腰からはゴールドのチェーンがぶら下がっています。背景には 4 つのカラフルなコミックスタイルのパネルがあります:1 つは「GRAND STAGE」と書かれ、スニーカーとゲータレードのボトルが含まれています。もう 1 つは緑のナイキスニーカーとピザのスライスを表示しています。3 つ目は「HARAJUKU st」と書かれ、浮遊する靴が描かれています。そして 4 つ目は「Takeshita WELCOME.」というテキストと共にスケートボードに乗る青いマウスが描かれています。主な明るい色は黄色、ティール、オレンジ、ピンク、緑です。吹き出し、ハーフトーンパターン、そして遊び心のあるキャラクターが、都会的なストリートアートの美学を高めています。昼光がシーンを均等に照らし、彼女の足元の地面は白いタイルの舗装です。全身ポートレート、中央構図、わずかに傾いた立ち姿、カメラへの直接の視線。高精細、シャープなフォーカス、ダイナミックなフレーミング。

b16c8008-83c1-4c80-ae22-786a2299bec3-1-转换自-png

Wan Text-to-Image

Wan Text-to-Image モデルは、簡単なテキストプロンプトから高品質の画像を生成します。API リファレンス | オンラインで試す

グローバル

グローバルデプロイモードでは、エンドポイントとデータストレージは米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースは、グローバルに動的にスケジューリングされます。

モデル

説明

単価

無料クォータ (注意)

Model Studio をアクティベートしてから 90 日間有効

wan2.6-t2i 推奨

Wan 2.6。新しい同期インターフェイスをサポートし、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。

$0.028671/画像

無料クォータなし

国際

国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。

モデル

説明

単価

無料クォータ (注意)

Model Studio をアクティベートしてから 90 日間有効

wan2.6-t2i 推奨

Wan 2.6。新しい同期インターフェイスをサポートし、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。

$0.03/画像

50 画像

wan2.5-t2i-preview 推奨

Wan 2.5 プレビュー。片側の長さ制限を撤廃し、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。

$0.03/画像

50 画像

wan2.2-t2i-plus

Wan 2.2 Professional Edition。創造性、安定性、リアルな質感が完全にアップグレードされました。

$0.05/画像

100 画像

wan2.2-t2i-flash

Wan 2.2 Flash Edition。創造性、安定性、リアルな質感が完全にアップグレードされました。

$0.025/画像

100 画像

wan2.1-t2i-plus

Wan 2.1 Professional Edition。複数のスタイルをサポートし、豊かなディテールの画像を生成します。

$0.05/画像

200 画像

wan2.1-t2i-turbo

Wan 2.1 Turbo Edition。複数のスタイルをサポートし、高速な生成速度を提供します。

$0.025/画像

200 画像

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。

モデル

説明

単価

無料クォータ (注意)

Model Studio をアクティベートしてから 90 日間有効

wan2.6-t2i 推奨

Wan 2.6。新しい同期インターフェイスをサポートし、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。

$0.028671/画像

無料クォータなし

wan2.5-t2i-preview 推奨

Wan 2.5 プレビュー。片側の長さ制限を撤廃し、総ピクセル面積とアスペクト比の制約内でディメンションを自由に選択できます。

$0.028671/画像

無料クォータなし

wan2.2-t2i-plus

Wan 2.2 Professional Edition。創造性、安定性、リアルな質感が完全にアップグレードされました。

$0.02007/画像

無料クォータなし

wan2.2-t2i-flash

Wan 2.2 Flash Edition。創造性、安定性、リアルな質感が完全にアップグレードされました。

$0.028671/画像

無料クォータなし

wanx2.1-t2i-plus

Wan 2.1 Professional Edition。複数のスタイルをサポートし、豊かなディテールの画像を生成します。

$0.028671/画像

無料クォータなし

wanx2.1-t2i-turbo

Wan 2.1 Turbo Edition。複数のスタイルをサポートし、高速な生成速度を提供します。

$0.020070/画像

無料クォータなし

wanx2.0-t2i-turbo

Wan 2.0 Turbo Edition。質感のあるポートレートやクリエイティブなデザインに優れています。費用対効果が高いです。

$0.005735/画像

無料クォータなし

プロンプト

生成された画像

ニードルフェルトのサンタがプレゼントを持ち隣には白い猫が立っている。背景にはたくさんのカラフルなプレゼントが見える。シーンはかわいらしく、暖かく、居心地の良い雰囲気で、背景にはいくつかの緑の植物がある。

image

Wan 画像生成および編集 2.6

Wan 画像生成モデルは、画像編集とテキストと画像の混合出力をサポートし、多様な生成および統合ニーズに対応します。API リファレンス

グローバル

グローバルデプロイモードでは、エンドポイントとデータストレージの両方が米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースは、グローバルに動的にスケジューリングされます。

モデル

単価

無料クォータ

wan2.6-image

$0.028671/画像

無料クォータなし

国際

国際デプロイモードでは、エンドポイントとデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。

モデル

単価

無料クォータ (注意)

Model Studio をアクティベートしてから 90 日間有効

wan2.6-image

$0.03/画像

50 画像

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージの両方が北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。

モデル

単価

無料クォータ

wan2.6-image

$0.028671/画像

無料クォータなし

Wan 一般画像編集 2.5

Wan 一般画像編集 2.5 は、テキスト、単一画像、または複数画像を使用した主題一貫性編集をサポートします。また、複数画像の融合作成も可能です。API リファレンス

国際

国際デプロイモードでは、エンドポイントとデータストレージの両方がシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジューリングされます。

モデル

単価

無料クォータ (注意)

Model Studio をアクティベートしてから 90 日間有効

wan2.5-i2i-preview

$0.03/画像

50 ユニット

中国本土

中国本土デプロイモードでは、エンドポイントとデータストレージの両方が北京リージョンに配置されます。モデル推論の計算リソースは、中国本土に限定されます。

モデル

単価

無料クォータ

wan2.5-i2i-preview

$0.028671/画像

無料クォータなし

機能

入力例

出力画像

単一画像の編集

damotest2023_Portrait_photography_outdoors_fashionable_beauty_409ae3c1-19e8-4515-8e50-b3c9072e1282_2-转换自-png

a26b226d-f044-4e95-a41c-d1c0d301c30b-转换自-png

花柄のドレスを、襟と袖口に精巧な刺繍が施されたヴィンテージスタイルのレースのロングドレスに変更します。

複数画像の融合

image

p1028883

画像 1 の目覚まし時計を、画像 2 のダイニングテーブルの花瓶の隣に置きます。

Wan 一般画像編集 2.1

Wan 一般画像編集モデルは、シンプルな命令を用いて多様な画像編集タスクを実行できます。利用シーンには、画像拡張、ウォーターマーク除去、スタイル変換、画像インペインティング、イメージエンハンスメントなどがあります。利用方法 | API リファレンス

説明

サポートされているのは、中国本土デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論用のコンピューティングリソースも中国本土内に限定されます。

モデル

単価

無料クォータ

wanx2.1-imageedit

$0.020070 / イメージ

無料クォータなし

一般画像編集は、現在以下の機能をサポートしています:

機能

入力イメージ

プロンプト

出力イメージ

グローバルスタイル適用

image

フランスの絵本スタイルに変換します。

image

ローカルスタイル適用

image

建物を木目調に変更します。

image

命令ベース編集

image

女の子の髪の色を赤に変更します。

image

ローカル再塗装

入力イメージ

image

マスク領域(白で示す)

image

陶器製のウサギが陶器製の花を手に持っています。

出力イメージ

image

テキストウォーターマーク除去

image

イメージからテキストを除去します。

image

画像拡張

20250319105917

緑の妖精。

image

超解像

ぼやけたイメージ

image

超解像を適用します。

シャープなイメージ

image

画像着色

image

青いバックグラウンド、黄色い葉。

image

スケッチからイメージ生成

image

北欧風ミニマリストのリビングルーム。

image

参照イメージ

image

部屋の中に輝く青い宝石を慎重に覗き込んでいるアニメキャラクター。

image

OutfitAnyone

  • OutfitAnyone Plus は、Basic Edition と比較して、画像の鮮明度、生地の質感表現、ロゴの再現精度を向上させますが、生成にやや時間がかかります。生成時間の制約が厳しくないシナリオに適しています。API リファレンス | オンラインで試す

  • OutfitAnyone image parsing は、モデル画像と衣装画像を分離します。AI による仮想試着(AI try-on)画像の前処理および後処理にご利用いただけます。API リファレンス

説明

中国本土デプロイモードのみがサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京)リージョンに配置され、推論用のコンピューティングリソースも中国本土内に限定されます。

モデル

説明

サンプル入力

サンプル出力

aitryon-plus

OutfitAnyone Plus

output26

output29

aitryon-parsing-v1

OutfitAnyone image parsing

OutfitAnyone の単価

サービス

モデル

単価

割引

ティア

OutfitAnyone Plus

aitryon-plus

$0.071677 / イメージ

なし

なし

OutfitAnyone image parsing

aitryon-parsing-v1

$0.000574 / イメージ

なし

なし

ビデオ生成 – Wan

テキストからビデオ生成

Wan のテキストからビデオ生成モデルは、1 文のプロンプトからビデオを生成し、豊かなアートスタイルと映画のような品質を実現します。API リファレンス | オンラインで試す

グローバル

グローバルデプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースはグローバルに動的にスケジュールされます。

モデル

説明

単価

無料クォータ

wan2.6-t2v 推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

720P: $0.086012/秒

1080P: $0.143353/秒

無料クォータなし

インターナショナル

インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。

モデル

説明

単価

無料クォータ (取得)

Model Studio のアクティベート後 90 日間有効

wan2.6-t2v 推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

720P: $0.10/秒

1080P: $0.15/秒

50 秒

wan2.5-t2v-preview 推奨

Wan 2.5 プレビュー版。自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

480P: $0.05/秒

720P: $0.10/秒

1080P: $0.15/秒

50 秒

wan2.2-t2v-plus

Wan 2.2 Professional Edition。画像のディテールと動作の安定性が大幅に向上しています。

480P: $0.02/秒

1080P: $0.10/秒

50 秒

wan2.1-t2v-turbo

Wan 2.1 Turbo Edition。高速な生成速度とバランスの取れたパフォーマンスを実現します。

$0.036/秒

200 秒

wan2.1-t2v-plus

Wan 2.1 Professional Edition。豊かなディテールと高品質な映像を生成します。

$0.10/秒

200 秒

米国

米国デプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースは米国内に限定されます。

モデル

説明

単価

無料クォータ

wan2.6-t2v-us 推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

720P: $0.1/秒

1080P: $0.15/秒

無料クォータなし

中国本土

中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。

モデル

説明

単価

無料クォータ

wan2.6-t2v推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

720P: $0.086012/秒

1080p: 0.143353 秒あたり

無料クォータなし

wan2.5-t2v-preview推奨

Wan 2.5 プレビュー版。自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

480P: $0.043006/秒

720P: $0.086012/秒

1080P: $0.143353/秒

無料クォータなし

wan2.2-t2v-plus

Wan 2.2 Professional Edition。画像のディテールと動作の安定性が大幅に向上しています。

480P: $0.02007/秒

1080P: $0.100347/秒

無料クォータなし

wanx2.1-t2v-turbo

高速な生成速度とバランスの取れたパフォーマンスを実現します。

$0.034405/秒

無料クォータなし

wanx2.1-t2v-plus

より豊かなディテールと高品質な映像を生成します。

$0.100347/秒

無料クォータなし

入力プロンプト

出力ビデオ (wan2.6、マルチショットビデオ)

低いアングルからのミディアム・クローズアップで、暖色系のトーン、混合照明(机上のランプの実用光と窓からの曇天光が混ざる)、サイドライティング、中央構図で撮影されています。クラシックな探偵事務所の中には、古い事件ファイルや灰皿が詰まった木製の本棚があります。緑色の机上のランプが机の中央に広げられた事件ファイルを照らしています。ダークブラウンのトレンチコートとライトグレーのフェドラを着用したキツネが革張りの椅子に座り、真紅の毛並みと尾を軽く机の端に預けて、指先でゆっくりと黄ばんだページをめくっています。外では青空の下、穏やかな小雨が降り、窓ガラスに蛇行する水筋を描いています。キツネはゆっくりと顔を上げ、耳をわずかにぴくつかせ、琥珀色の目でカメラをまっすぐ見つめ、口をはっきりと動かしながら滑らかで皮肉たっぷりの声でこう話します。「その事件は冷えていた。冬の魚よりも冷たくな。だが、どんなニワトリにも秘密はあるものだ。少なくとも私は、それを見つけようと思っていた」

画像からビデオ生成 – 初期フレーム

Wan の画像からビデオ生成モデルは、入力画像を最初のフレームとして使用し、プロンプトに基づいてビデオを生成することで、豊かなアートスタイルと映画のような品質を実現します。API リファレンス | オンラインで試す

グローバル

グローバルデプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースはグローバルに動的にスケジュールされます。

モデル

説明

単価

無料クォータ

wan2.6-i2v 推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

720P: $0.086012/秒

1080P: $0.143353/秒

無料クォータなし

インターナショナル

インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。

モデル

説明

単価

無料クォータ (注記)

Model Studio のアクティベート後 90 日間有効

wan2.6-i2v-flash 推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

音声付き出力ビデオ audio=true:

  • 720P: $0.05/秒

  • 1080P: $0.075/秒

音声なし出力ビデオ audio=false:

  • 720P: $0.025/秒

  • 1080P: $0.0375/秒

50 秒

wan2.6-i2v 推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

720P: $0.10/秒

1080P: $0.15/秒

50 秒

wan2.5-i2v-preview 推奨

Wan 2.5 プレビュー版。自動吹き替えおよびカスタム音声ファイルのアップロードをサポートします。

480P: $0.05/秒

720P: $0.10/秒

1080P: $0.15/秒

50 秒

wan2.2-i2v-flash

Wan 2.2 Flash Edition。非常に高速な生成速度と、視覚的ディテールおよび動作の安定性が大幅に向上しています。

480P: $0.015/秒

720P: $0.036/秒

50 秒

wan2.2-i2v-plus

Wan 2.2 Professional Edition。視覚的ディテールおよび動作の安定性が大幅に向上しています。

480P: $0.02/秒

1080P: $0.10/秒

50 秒

wan2.1-i2v-turbo

Wan 2.1 Turbo Edition。高速な生成速度とバランスの取れたパフォーマンスを実現します。

$0.036/秒

200 秒

wan2.1-i2v-plus

Wan 2.1 Professional Edition。豊かなディテールを生成し、より高品質で質感豊かな映像を実現します。

$0.10/秒

200 秒

米国

米国デプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースは米国内に限定されます。

モデル

説明

単価

無料クォータ

wan2.6-i2v-us 推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

720P: $0.1/秒

1080P: $0.15/秒

無料クォータなし

中国本土

中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。

モデル

説明

単価

無料クォータ

wan2.6-i2v-flash 推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

音声付き出力ビデオ audio=true:

  • 720P: $0.043006/秒

  • 1080P: $0.071676/秒

音声なし出力ビデオ audio=false:

  • 720P: $0.021503/秒

  • 1080P: $0.035838/秒

無料クォータなし

wan2.6-i2v 推奨

Wan 2.6。マルチショットナラティブ機能を導入し、自動音声読み上げおよびカスタム音声ファイル入力をサポートします。

720P: $0.086012/秒

1080P: $0.143353/秒

無料クォータなし

wan2.5-i2v-preview

Wan 2.5 プレビュー版。自動吹き替えおよびカスタム音声ファイルのアップロードをサポートします。

480P: $0.043006/秒

720P: $0.086012/秒

1080P: $0.143353/秒

無料クォータなし

wan2.2-i2v-plus

Wan 2.2 Professional Edition。視覚的ディテールおよび動作の安定性が大幅に向上しています。

480P: $0.02007/秒

1080P: $0.100347/秒

無料クォータなし

wanx2.1-i2v-turbo

Wan 2.1 Turbo Edition。高速な生成速度とバランスの取れたパフォーマンスを実現します。

$0.034405/秒

無料クォータなし

wanx2.1-i2v-plus

Wan 2.1 Professional Edition。豊かなディテールを生成し、より高品質で質感豊かな映像を実現します。

$0.100347/秒

無料クォータなし

入力プロンプト

入力初期フレーム画像および音声

出力ビデオ (wan2.6、マルチショットビデオ)

アーバンファンタジーアートのシーン。ダイナミックなグラフィティスタイルのキャラクター。コンクリートの壁にスプレーペイントされた少年が生き生きと動き出します。夜の都市部の鉄道橋の下で、彼は英語で高速ラップをしながら、クラシックでエネルギッシュなラッパーのポーズをとります。照明は街灯 1 基からのみ供給され、高エネルギーで驚くほど詳細な映画のような雰囲気を作り出します。ビデオの音声は完全に彼のラップのみで構成され、他の会話やノイズは含まれません。

rap-转换自-png

入力音声:

画像からビデオ生成 – 初期フレームと最終フレーム

Wan の初期フレームおよび最終フレームによるビデオ生成モデルは、入力される最初と最後の 2 つのフレームとプロンプトから、滑らかで流れるようなビデオを生成します。ビデオは豊かなアートスタイルと映画のような品質を備えています。API リファレンス | オンラインで試す

インターナショナル

インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。

モデル

単価

無料クォータ (注記)

Model Studio のアクティベート後 90 日間有効

wan2.2-kf2v-flash

480P: $0.015/秒

720P: $0.036/秒

1080P: $0.07/秒

50 秒

wan2.1-kf2v-plus

$0.10/秒

200 秒

中国本土

中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。

モデル

単価

無料クォータ (注記)

wan2.2-kf2v-flash

480P: $0.014335/秒

720P: $0.028671/秒

1080P: $0.068809/秒

無料クォータなし

wanx2.1-kf2v-plus

$0.100347/秒

無料クォータなし

入力例

出力ビデオ

最初のフレーム

最終フレーム

プロンプト

first_frame

last_frame

写実的スタイル。黒い子猫が空を不思議そうに見上げています。カメラは目の高さから始まり、徐々に子猫の好奇心あふれる視線を上から見下ろすように移動します。

動画への参照

Wan のリファレンス動画モデルは、入力動画または画像からキャラクターの外見、入力動画から音声、およびテキストプロンプトを参照して、パフォーマンス動画を生成します。API リファレンス

課金ルール: 入力動画および出力動画の両方が動画秒数で課金されます。失敗したリクエストは課金されず、無料クォータも消費しません。

  • 入力動画の課金対象時間は最大5 秒です。詳細については、「Wan リファレンス動画」をご参照ください。

  • 出力動画の課金対象時間は、正常に生成された秒数と等しくなります。

グローバル

グローバルデプロイモードでは、エンドポイントおよびデータストレージが米国 (バージニア) リージョンに配置されます。モデル推論の計算リソースはグローバルに動的にスケジュールされます。

モデル

出力動画タイプ

入力および出力の単価

無料クォータ (注記)

wan2.6-r2v

音声付き動画

720P: $0.086012/秒

1080P: $0.143353/秒

無料クォータなし

インターナショナル

インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。

モデル

出力動画タイプ

入力および出力の単価

無料クォータ (注記)

wan2.6-r2v-flash 推奨

音声付き動画

audio=true

720P: $0.05/秒

1080P: $0.075/秒

50 秒

Model Studio のアクティベート後 90 日間有効

音声なし動画

audio=false

720P: $0.025/秒

1080P: $0.0375/秒

wan2.6-r2v

音声付き動画

720P: $0.10/秒

1080P: $0.15/秒

50 秒

Model Studio のアクティベート後 90 日間有効

中国本土

中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。

モデル

出力動画タイプ

入力および出力の単価

無料クォータ (注記)

wan2.6-r2v-flash 推奨

音声付き動画

audio=true

720P: $0.043006/秒

1080P: $0.071676/秒

無料クォータなし

音声なし動画

audio=false

720P: $0.021503/秒

1080P: $0.035838/秒

wan2.6-r2v

音声付き動画

720P: $0.086012/秒

1080P: $0.143353/秒

無料クォータなし

汎用ビデオ編集

Wan の汎用ビデオ編集モデルは、テキスト、画像、ビデオなどのマルチモーダル入力をサポートし、ビデオ生成および一般的な編集タスクを実行します。API リファレンス | オンラインで試す

インターナショナル

インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。

モデル

単価

無料クォータ (注記)

wan2.1-vace-plus

$0.1/秒

50 秒

Model Studio のアクティベート後 90 日間有効

中国本土

中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。

モデル

単価

無料クォータ (注記)

wanx2.1-vace-plus

$0.100347/秒

無料クォータなし

汎用ビデオ編集モデルは以下の機能をサポートします。

機能

入力リファレンス画像

入力プロンプト

出力ビデオ

複数画像リファレンス

リファレンス画像 1 (エンティティ用)

image

リファレンス画像 2 (背景用)

image

このビデオでは、少女が霧に包まれた古代の森の奥深くから優雅に現れます。その足取りは軽やかで、カメラは彼女の機敏な動きをすべて捉えます。少女が立ち止まり、周囲の青々とした森を見渡すと、驚きと喜びに満ちた笑みを浮かべます。この瞬間は光と影の相互作用によって捉えられ、少女と自然との素晴らしい出会いが記録されます。

出力ビデオ

ビデオ再スタイリング

このビデオは、歯車や銅管で装飾された蒸気パンク風の黒い車を紳士が運転している様子を示しています。背景はレトロ要素を備えた蒸気式のキャンディ工場で、ヴィンテージで遊び心のあるシーンを作り出しています。

局所編集

入力ビデオ

入力マスク画像 (白い領域が編集範囲を示します)

mask

このビデオは、パリ風のフランスカフェを示しており、スーツを着たライオンが優雅にコーヒーをすすっています。片方の手でコーヒーカップを持ち、満足げな表情で飲んでいます。カフェは洗練されたインテリアで、柔らかなトーンと暖かい照明がライオンのいるエリアを照らしています。

プロンプトに基づいて編集領域のコンテンツが変更されます

ビデオ拡張

入力初期ビデオセグメント (1 秒)

サングラスをかけた犬がストリートでスケートボードをする、3D カートゥーン。

出力拡張ビデオ (5 秒)

ビデオアウトペインティング

優雅な女性が情熱的にバイオリンを演奏しており、その背後にはフルサイズの交響楽団がいます

Wan デジタルヒューマン

1 枚のポートレート画像と音声ファイルから、自然に話したり歌ったり演技したりする動画を生成できます。このモデルを使用するには、次のモデルを順番に呼び出してください。wan2.2-s2v 画像検出 | wan2.2-s2v ビデオ生成

説明

中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。

モデル

説明

単価

wan2.2-s2v-detect

入力画像が鮮明さ、単一人物フレーミング、正面向きなどの要件を満たしているかをチェックします。

$0.000574/画像

wan2.2-s2v

検証済みの画像と音声クリップを使用して、人物の動的ビデオを生成します。

480P: $0.071677/秒

720P: $0.129018/秒

入力例

出力ビデオ

p1001125-转换自-jpeg

音声入力:

Wan image-to-action

このサービスは標準モードとプロフェッショナルモードを提供します。人物画像とリファレンス動画を使用して、動画の被写体の動作および表情を画像の被写体に転送し、動的なアクション動画を生成します。API リファレンス

インターナショナル

インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。

モデル

サービス

説明

単価

無料クォータ 表示

wan2.2-animate-move

標準モード wan-std

アニメーションをより高速に生成し、基本的なアニメーションデモなどの軽量な要件を満たします。コストパフォーマンスに優れています。

$0.12/秒

両モード合わせて合計 50 秒

プロフェッショナルモード wan-pro

アニメーションの滑らかさが向上し、動作と表情の間のトランジションが自然になります。実写撮影に近い仕上がりになります。

$0.18/秒

中国本土

中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。

モデル

サービス

説明

単価

無料クォータ 表示

wan2.2-animate-move

標準モード wan-std

より高速な生成を提供します。基本的なアニメーションデモなどの軽量なニーズに適しており、コストパフォーマンスに優れています。

$0.06/秒

無料クォータなし

プロフェッショナルモード wan-pro

アニメーションの滑らかさが向上し、動作と表情の間のトランジションが自然になり、実写撮影に近い仕上がりになります。

$0.09/秒

ポートレート

リファレンス動画

出力動画 (標準モード)

出力動画 (プロフェッショナルモード)

move_input_image

Wan ビデオキャラクタースワップ

このサービスは標準モードとプロフェッショナルモードを提供します。入力画像の人物で動画の主被写体を置き換えながら、元のシーン、照明、カラートーンを保持します。API リファレンス

インターナショナル

インターナショナルデプロイモードでは、エンドポイントおよびデータストレージがシンガポールリージョンに配置されます。モデル推論の計算リソースは中国本土を除くグローバルで動的にスケジュールされます。

モデル

サービス

説明

単価

無料クォータ 表示

wan2.2-animate-mix

標準モード wan-std

アニメーションをより高速に生成し、基本的なアニメーションデモなどの軽量なワークロードを満たします。コストパフォーマンスに優れています。

$0.18/秒

両サービス合わせて合計 50 秒

プロフェッショナルモード wan-pro

アニメーションの滑らかさが向上し、動作と表情の間のトランジションが自然になります。実写撮影により近い結果を生成します。

$0.26/秒

中国本土

中国本土デプロイモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置されます。モデル推論の計算リソースは中国本土内に限定されます。

モデル

サービス

説明

単価

無料クォータ 表示

wan2.2-animate-mix

標準モード wan-std

より高速な生成を提供します。基本的なアニメーションデモなどの軽量なニーズに適しています。コスト効率に優れています。

$0.09/秒

無料クォータなし

プロフェッショナルモード wan-pro

アニメーションの滑らかさが強化されます。動作と表情の間のトランジションが自然になります。実写撮影により近い結果を提供します。

$0.13/秒

人物画像

リファレンス動画

出力動画 (標準モード)

出力動画 (プロフェッショナルモード)

mix_input_image

AnimateAnyone

このサービスは、人物画像とモーショントンプレートからアニメーション動画を生成します。このサービスを直接使用するには、次の 3 つのモデルを順番に呼び出してください。AnimateAnyone 画像検出 API の詳細 | AnimateAnyone モーショントンプレート生成 | AnimateAnyone ビデオ生成 API の詳細

説明

中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。

モデル

説明

単価

animate-anyone-detect-gen2

入力画像が要件を満たしているかをチェックします。

$0.000574/画像

animate-anyone-template-gen2

モーション動画からキャラクターの動作を取得し、アクションテンプレートを生成します。

$0.011469/秒

animate-anyone-gen2

キャラクター画像とアクションテンプレートからキャラクターのモーション動画を生成します。

入力画像

アクション動画

画像背景付き出力

動画背景付き出力

04-9_16

説明
  • 上記の例は、AnimateAnyone を統合したアプリによって生成されました。

  • AnimateAnyone の出力は音声を含まず、ビデオフレームのみです。

EMO

このサービスは、ポートレート画像と人間の声の音声ファイルから動的なポートレート動画を生成します。このサービスを使用するには、次のモデルを順番に呼び出してください。EMO 画像検出 API リファレンス | EMO ビデオ生成 API リファレンス

説明

中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。

モデル

説明

単価

emo-detect-v1

入力画像が要件を満たしているかをチェックします。デプロイは不要で、直接呼び出すことができます。

$0.000574/画像

emo-v1

動的なポートレート動画を生成します。デプロイは不要で、直接呼び出すことができます。

  • 縦横比 1:1 の動画: $0.011469/秒

  • 縦横比 3:4 の動画: $0.022937/秒

入力: ポートレート画像および人間の声の音声ファイル

出力: 動的なポートレート動画

ポートレート画像:

上春山

人間の声の音声: 右側の動画を参照してください。

ポートレート動画:

アクションスタイルの強度設定を使用: アクティブ ("style_level": "active")。

LivePortrait

このサービスは、ポートレート画像と人間の声の音声ファイルから動的なポートレート動画を迅速かつ効率的に生成します。EMO と比較して、LivePortrait はより高速で低コストですが、視覚的品質は低くなります。このサービスを使用するには、次の 2 つのモデルを順番に呼び出してください。LivePortrait 画像検出 | LivePortrait ビデオ生成

説明

中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。

モデル

説明

単価

liveportrait-detect

入力画像が要件を満たしているかをチェックします

$0.000574/画像

liveportrait

動的なポートレート動画を生成します

$0.002868/秒

入力: ポートレート画像および音声ファイル

出力: 動的なポートレート動画

ポートレート画像:

Emoji男孩

音声: 右側の動画を参照してください。

ポートレート動画:

Emoji

このサービスは、顔画像とプリセットの顔のモーションテンプレートからアニメーション顔動画を生成します。ユースケースには、絵文字の作成やビデオアセットの生成が含まれます。このサービスを使用するには、次のモデルを順番に呼び出してください。Emoji 画像検出 | Emoji ビデオ生成

説明

中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。

モデル

説明

単価

emoji-detect-v1

入力画像が要件を満たしているかをチェックします。

$0.000574/画像

emoji-v1

ポートレート画像と指定された絵文字テンプレートから一致する絵文字動画を生成します。

$0.011469/秒

入力: ポートレート画像

出力: 動的なポートレート動画

image.png

"Happy" 絵文字テンプレートシーケンス ("input.driven_id": "mengwa_kaixin")

VideoRetalk

このサービスは、ソース動画と人間の声の音声ファイルから、話者の口の動きが入力音声に一致する新しい動画を生成します。このサービスを使用するには、次のモデルを呼び出してください。API リファレンス

説明

中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。

モデル

説明

単価

videoretalk

入力音声に合わせて話者の口の動きを同期させた動画を生成します

$0.011469/秒

ビデオスタイル変換

このサービスは、ユーザーが提供するテキストに基づいて異なるスタイルの動画を生成するか、入力動画を再スタイリングします。API リファレンス

説明

中国本土デプロイモードのみサポートされています。このモードでは、エンドポイントおよびデータストレージが中国 (北京) リージョンに配置され、推論計算リソースは中国本土内に限定されます。

モデル

説明

単価

video-style-transform

入力動画を日本漫画、アメリカンコミック、その他のアートスタイルに変換します。

720P

$0.071677/秒

540P

$0.028671/秒

入力動画

出力動画 (日本漫画)

音声合成(テキスト・トゥ・スピーチ)

Qwen 音声合成

多言語混在のテキスト入力とストリーミング方式のオーディオ出力をサポートします。使用方法 | API リファレンス

国際

国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

Qwen3-TTS-Instruct-Flash

モデル

バージョン

単価

最大入力文字数

無料クォータ (注)

qwen3-tts-instruct-flash

現在、qwen3-tts-instruct-flash-2026-01-26。

Stable

$0.115/10K 文字

600

10,000 文字

Model Studio を有効化した日から 90 日間有効

qwen3-tts-instruct-flash-2026-01-26

Snapshot

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-VD

モデル

バージョン

単価

最大入力文字数

無料クォータ (注)

qwen3-tts-vd-2026-01-26

Snapshot

$0.115/10,000 文字

600

10,000 文字

Model Studio を有効化した日から 90 日間有効

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-VC

モデル

バージョン

単価

最大入力文字数

無料クォータ (注)

qwen3-tts-vc-2026-01-22

Snapshot

$0.115/10K 文字

600

10,000 文字

Model Studio を有効化した日から 90 日間有効。

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-Flash

モデル

バージョン

単価

最大入力文字数

無料クォータ (注)

qwen3-tts-flash

現在、qwen3-tts-flash-2025-11-27。

Stable

$0.10/10,000 文字

600

10,000 文字

Model Studio を有効化した日から 90 日間有効

qwen3-tts-flash-2025-11-27

Snapshot

qwen3-tts-flash-2025-09-18

Snapshot

2025 年 11 月 13 日 00:00 以前に Alibaba Cloud Model Studio を有効化した場合:2,000 文字

2025 年 11 月 13 日 00:00 以降に Alibaba Cloud Model Studio を有効化した場合:10,000 文字

Model Studio を有効化した日から 90 日間有効。

  • 対応言語:中国語(標準語、北京、上海、四川、南京、陝西、閩南、天津、広東)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

中国本土

中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。

Qwen3-TTS-Instruct-Flash

モデル

バージョン

単価

最大入力文字数

無料クォータ (注)

qwen3-tts-instruct-flash

現在、qwen3-tts-instruct-flash-2026-01-26。

Stable

$0.115/10K 文字

600

無料クォータはありません。

qwen3-tts-instruct-flash-2026-01-26

Snapshot

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-VD

モデル

バージョン

単価

最大入力文字数

無料クォータ (注)

qwen3-tts-vd-2026-01-26

Snapshot

$0.115/10K 文字

600

無料クォータはありません。

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-VC

モデル

バージョン

単価

最大入力文字数

無料クォータ (注)

qwen3-tts-vc-2026-01-22

Snapshot

$0.115/10K 文字

600

無料クォータはありません。

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-Flash

モデル

バージョン

単価

最大入力文字数

無料クォータ (注)

qwen3-tts-flash

現在、qwen3-tts-flash-2025-11-27。

Stable

$0.114682/10,000 文字

600

無料クォータはありません。

qwen3-tts-flash-2025-11-27

Snapshot

qwen3-tts-flash-2025-09-18

Snapshot

  • 対応言語:中国語(標準語、北京、上海、四川、南京、陝西、閩南、天津、広東)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen-TTS

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

無料クォータ (注)

(トークン)

(1,000 トークンあたり)

qwen-tts

qwen-tts-2025-04-10 と同等の機能を提供します。

Stable

8,192

512

7,680

$0.230

$1.434

無料クォータはありません。

qwen-tts-latest

最新のスナップショットと同等の機能を提供します。

Latest

qwen-tts-2025-05-22

Snapshot

qwen-tts-2025-04-10

オーディオからトークンへの変換ルール:オーディオ 1 秒につき 50 トークンが生成されます。1 秒未満のオーディオは 50 トークンとして計算されます。

Qwen リアルタイム音声合成

ストリーミング方式のテキスト入力およびストリーミング方式のオーディオ出力をサポートします。テキストの内容および句読点に基づいて、自動的に話速を調整できます。使用方法 | API リファレンス

Qwen3-TTS-Instruct-Flash-Realtime は Qwen リアルタイム音声合成 をサポートし、デフォルト音声のみを使用できます。クローン音声およびカスタム音声には対応していません。

Qwen3-TTS-VD-Realtime は、Qwen 音声デザイン API リファレンス で提供される音声をリアルタイム音声合成に使用できますが、デフォルト音声には対応していません。

Qwen3-TTS-VC-Realtime は、Qwen 音声クローニング API リファレンス で提供される音声をリアルタイム音声合成に使用できますが、デフォルト音声には対応していません。

Qwen3-TTS-Flash-Realtime および Qwen-TTS-Realtime は、デフォルト音声のみを使用できます。クローン音声およびカスタム音声には対応していません。

国際版

国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

Qwen3-TTS-Instruct-Flash-Realtime

モデル

バージョン

単価

無料クォータ (注)

qwen3-tts-instruct-flash-realtime

現在、qwen3-tts-instruct-flash-realtime-2026-01-22。

Stable

$0.143/10K 文字

10,000 文字

Model Studio を有効化した日から 90 日間有効。

qwen3-tts-instruct-flash-realtime-2026-01-22

Snapshot

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-VD-Realtime

モデル

バージョン

単価

無料クォータ (注)

qwen3-tts-vd-realtime-2026-01-15

Snapshot

$0.143353/10,000 文字

10,000 文字

Model Studio を有効化した日から 90 日間有効

qwen3-tts-vd-realtime-2025-12-16

Snapshot

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-VC-Realtime

モデル

バージョン

単価

無料クォータ(注)

qwen3-tts-vc-realtime-2026-01-15

Snapshot

$0.13/10K 文字

10,000 文字

Model Studio を有効化した日から 90 日間有効。

qwen3-tts-vc-realtime-2025-11-27

Snapshot

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-Flash-Realtime

モデル

バージョン

単価

無料クォータ (注)

qwen3-tts-flash-realtime

現在、qwen3-tts-flash-realtime-2025-11-27。

Stable

$0.13/10,000 文字

10,000 文字

Model Studio を有効化した日から 90 日間有効

qwen3-tts-flash-realtime-2025-11-27

Snapshot

qwen3-tts-flash-realtime-2025-09-18

Snapshot

2025 年 11 月 13 日 00:00 以前に Alibaba Cloud Model Studio を有効化した場合:2,000 文字

2025 年 11 月 13 日 00:00 以降に Alibaba Cloud Model Studio を有効化した場合:10,000 文字

Model Studio を有効化した日から 90 日間有効

  • 対応言語:中国語(標準語、北京、上海、四川、南京、陝西、閩南、天津、広東)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

中国本土

中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。

Qwen3-TTS-Instruct-Flash-Realtime

モデル

バージョン

単価

無料クォータ (注)

qwen3-tts-instruct-flash-realtime

現在の機能は qwen3-tts-instruct-flash-realtime-2026-01-22 と一致します。

Stable

$0.143/10,000 文字

無料クォータはありません

qwen3-tts-instruct-flash-realtime-2026-01-22

Snapshot

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-VD-Realtime

モデル

バージョン

単価

無料クォータ (注)

qwen3-tts-vd-realtime-2026-01-15

Snapshot

$0.143353/10,000 文字

無料クォータはありません

qwen3-tts-vd-realtime-2025-12-16

Snapshot

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-VC-Realtime

モデル

バージョン

単価

無料クォータ (注)

qwen3-tts-vc-realtime-2026-01-15

Snapshot

$0.143353/10,000 文字

無料クォータはありません。

qwen3-tts-vc-realtime-2025-11-27

Snapshot

  • 対応言語:中国語(標準語)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen3-TTS-Flash-Realtime

モデル

バージョン

単価

無料クォータ (注)

qwen3-tts-flash-realtime

現在、qwen3-tts-flash-realtime-2025-11-27。

Stable

$0.143353/10,000 文字

無料クォータはありません。

qwen3-tts-flash-realtime-2025-11-27

Snapshot

qwen3-tts-flash-realtime-2025-09-18

Snapshot

  • 対応言語:中国語(標準語、北京、上海、四川、南京、陝西、閩南、天津、広東)、英語、スペイン語、ロシア語、イタリア語、フランス語、韓国語、日本語、ドイツ語、ポルトガル語

  • 文字数算出ルール:課金は入力文字数に基づきます。算出ルールは以下のとおりです。

    • 中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)= 2 文字

    • その他の文字(英字、句読点、空白など)= 1 文字

Qwen-TTS-Realtime

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

対応言語

無料クォータ (注)

(トークン)

(1,000 トークンあたり)

qwen-tts-realtime

現在、qwen-tts-realtime-2025-07-15。

Stable

8,192

512

7,680

$0.345

$1.721

中国語、英語

無料クォータはありません。

qwen-tts-realtime-latest

現在、qwen-tts-realtime-2025-07-15。

Latest

中国語、英語

qwen-tts-realtime-2025-07-15

Snapshot

中国語、英語

オーディオからトークンへの変換ルール:オーディオ 1 秒につき 50 トークンが生成されます。1 秒未満のオーディオは 50 トークンとして計算されます。

Qwen 音声クローニング

音声クローニングでは、大規模モデルによる特徴抽出を活用し、トレーニングなしで音声をクローンできます。10~20 秒の音声を提供することで、非常に類似した自然なカスタム音声を生成できます。使用方法 | API リファレンス

国際

国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

単価

無料クォータ (注)

qwen-voice-enrollment

$0.01/音声

1,000 音声

Model Studio を有効化した日から 90 日間有効。

中国本土版

中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。

モデル

単価

無料クォータ (注)

qwen-voice-enrollment

$0.01/音声

無料クォータはありません。

Qwen 音声デザイン

音声デザインは、テキストによる説明からカスタム音声を生成します。多言語および多次元の音声特徴量定義をサポートしており、CM 吹き替え、キャラクター制作、音声コンテンツ制作などのアプリケーションに適しています。使用方法 | API リファレンス

国際版

国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

単価

無料クォータ (注)

qwen-voice-design

$0.2/音声

10 ボイス

Model Studio を有効化した日から 90 日間有効。

中国本土

中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。

モデル

単価

無料クォータ (注)

qwen-voice-design

$0.20/音声

無料クォータはありません。

CosyVoice 音声合成

CosyVoice は、Alibaba Cloud が提供する次世代生成型音声合成モデルです。大規模事前学習言語モデルに基づき、テキスト理解と音声生成を深く統合しており、リアルタイムのストリーミング方式テキスト・トゥ・スピーチ合成をサポートします。使用方法 | API リファレンス

国際版

国際版デプロイモードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

単価

無料クォータ (注)

cosyvoice-v3-plus

$0.26/10K 文字

10,000 文字

Model Studio を有効化した日から 90 日間有効。

cosyvoice-v3-flash

$0.13/10K 文字

文字数算出ルール:中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)は 2 文字としてカウントされます。その他の文字(英字、数字、日本語/韓国語の仮名など)は 1 文字としてカウントされます。SSML タグの内容は課金対象外です。

中国本土版

中国本土版デプロイモードでは、エンドポイントおよびデータストレージが 北京リージョン に配置されます。モデル推論用の計算リソースは中国本土内に限定されます。

モデル

単価

無料クォータ (注)

cosyvoice-v3.5-plus

$0.22/10K 文字

無料クォータはありません

cosyvoice-v3.5-flash

$0.116/10K 文字

cosyvoice-v3-plus

$0.286706/10K 文字

cosyvoice-v3-flash

$0.14335/10K 文字

cosyvoice-v2

$0.286706/10K 文字

文字数算出ルール:中国語文字(簡体字/繁体字、日本語漢字、韓国語漢字を含む)は 2 文字としてカウントされます。その他の文字(英字、数字、日本語/韓国語の仮名など)は 1 文字としてカウントされます。SSML タグの内容は課金対象外です。

音声認識(音声テキスト変換)および翻訳(音声翻訳)

Qwen3-LiveTranslate-Flash

Qwen3-LiveTranslate-Flash は、Qwen3-Omni アーキテクチャを基盤とする音声・動画翻訳モデルです。中国語、英語、ロシア語、フランス語など18言語間の翻訳をサポートします。このモデルは視覚的な文脈を活用して翻訳精度を向上させ、テキストおよび音声の両方を出力します。利用方法 | API リファレンス

国際版

国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

無料クォータ (注)

(トークン)

qwen3-livetranslate-flash

現在、qwen3-livetranslate-flash-2025-12-01。

Stable

53,248

49,152

4,096

各 100 万トークン

Model Studio を有効化した日から 90 日間有効

qwen3-livetranslate-flash-2025-12-01

Snapshot

入力および出力の課金ルールは以下のとおりです:

入力

単価(100 万トークンあたり)

音声

$1.577

動画

音声部分は別途課金されます。

$0.631

出力

単価(100 万トークンあたり)

音声

$6.308

テキスト

$1.577

中国本土版

中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

無料クォータ (注)

(トークン)

qwen3-livetranslate-flash

現在、qwen3-livetranslate-flash-2025-12-01。

Stable

53,248

49,152

4,096

無料クォータはありません。

qwen3-livetranslate-flash-2025-12-01

Snapshot

入力および出力の課金ルールは以下のとおりです:

入力

単価(100 万トークンあたり)

音声

$1.434

動画

音声部分は別途課金されます。

$0.573

出力

単価(100 万トークンあたり)

音声

$5.734

テキスト

$1.434

Qwen3-LiveTranslate-Flash-Realtime

Qwen3-LiveTranslate-Flash-Realtime は、マルチリンガル対応のリアルタイム音声・動画翻訳モデルです。18言語の音声をリアルタイムで認識し、10言語へリアルタイムで音声翻訳できます。

主な特徴:

  • 多言語対応:中国語、英語、フランス語、ドイツ語、ロシア語、日本語、韓国語など18言語および中国語の広東語、四川語、閩南語などの6つの方言に対応しています。

  • 視覚的補強:映像コンテンツを活用して翻訳精度を向上させます。口の動き、動作、画面上のテキストを分析することで、騒音環境下や多義語の翻訳精度を高めます。

  • 低遅延:同時通訳の遅延を最短 3 秒まで実現します。

  • 高品質な同時通訳:意味単位予測技術を用いて、言語間の語順の違いに対応します。リアルタイム翻訳の品質はオフライン翻訳と同等です。

  • 自然な音声:人間のような自然な音声を生成します。ソース音声の内容に応じてトーンや感情を自動調整します。

利用方法 | API リファレンス

国際

国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

無料クォータ

(注)

(トークン)

qwen3-livetranslate-flash-realtime

現在、qwen3-livetranslate-flash-realtime-2025-09-22。

Stable

53,248

49,152

4,096

100 万トークン

Model Studio を有効化した日から 90 日間有効。

qwen3-livetranslate-flash-realtime-2025-09-22

Snapshot

無料クォータを使い切った後の入力および出力の課金ルールは以下のとおりです:

入力

単価(100 万トークンあたり)

音声

$10

画像

$1.3

出力

単価(100 万トークンあたり)

テキスト

$10

音声

$38

トークン算出ルール:

  • 音声:入力または出力の音声 1 秒につき 12.5 トークンを消費します。

  • 画像:28×28 ピクセルの入力ごとに 0.5 トークンを消費します。

中国本土

中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。

モデル

バージョン

コンテキストウィンドウ

最大入力

最大出力

無料クォータ (注)

(トークン)

qwen3-livetranslate-flash-realtime

現在、qwen3-livetranslate-flash-realtime-2025-09-22。

Stable

53,248

49,152

4,096

無料クォータはありません。

qwen3-livetranslate-flash-realtime-2025-09-22

Snapshot

入力および出力の課金ルールは以下のとおりです:

入力

単価(100 万トークンあたり)

音声

$9.175

画像

$1.147

出力

単価(100 万トークンあたり)

テキスト

$9.175

音声

$34.405

トークン算出ルール:

  • 音声:入力または出力の音声 1 秒につき 12.5 トークンを消費します。

  • 画像:28×28 ピクセルの入力ごとに 0.5 トークンを消費します。

Qwen 音声ファイル認識

Qwen のマルチモーダル基盤モデルを基に構築された本モデルは、多言語認識、歌唱認識、ノイズ拒否などの機能をサポートします。利用方法 | API リファレンス

国際

国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除く世界中で動的にスケジュールされます。

Qwen3-ASR-Flash-Filetrans

モデル

バージョン

単価

無料クォータ (注)

qwen3-asr-flash-filetrans

現在、qwen3-asr-flash-filetrans-2025-11-17。

Stable

$0.000035/秒

36,000 秒(10 時間)

Model Studio を有効化した日から 90 日間有効。

qwen3-asr-flash-filetrans-2025-11-17

Snapshot

  • 対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語

  • 対応サンプルレート:任意

Qwen3-ASR-Flash

モデル

バージョン

単価

無料クォータ (注)

qwen3-asr-flash

現在、qwen3-asr-flash-2025-09-08。

Stable

1 秒あたり $0.000035

36,000 秒(10 時間)

Model Studio を有効化した日から 90 日間有効。

qwen3-asr-flash-2026-02-10

Snapshot

qwen3-asr-flash-2025-09-08

Snapshot

  • 対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語

  • 対応サンプルレート:任意

US

米国版デプロイモード」では、エンドポイントおよびデータストレージが 米国 (バージニア) リージョン に配置されます。モデル推論の計算リソースは米国に限定されます。

モデル

バージョン

単価

無料クォータ (注)

qwen3-asr-flash-us

現在、qwen3-asr-flash-2025-09-08-us。

Stable

$0.000035/秒

無料クォータはありません。

qwen3-asr-flash-2025-09-08-us

Snapshot

  • 対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語

  • 対応サンプルレート:任意

中国本土

中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。

Qwen3-ASR-Flash-Filetrans

モデル

バージョン

単価

無料クォータ (注)

qwen3-asr-flash-filetrans

qwen3-asr-flash-filetrans-2025-11-17 と同等の機能を提供します。

Stable

$0.000032/秒

無料クォータはありません。

qwen3-asr-flash-filetrans-2025-11-17

Snapshot

  • 対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語

  • 対応サンプルレート:任意

Qwen3-ASR-Flash

モデル

バージョン

単価

無料クォータ (注)

qwen3-asr-flash

現在、qwen3-asr-flash-2025-09-08。

Stable

$0.000032/秒

無料クォータはありません。

qwen3-asr-flash-2026-02-10

Snapshot

qwen3-asr-flash-2025-09-08

Snapshot

  • 対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語

  • 対応サンプルレート:任意

Qwen リアルタイム音声認識

Qwen リアルタイム音声認識は、自動言語検出機能を備えたモデルであり、11言語をサポートし、複雑な音声環境下でも正確な文字起こしが可能です。利用方法 | API リファレンス

国際

国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルな地域で動的にスケジュールされます。

モデル

バージョン

単価

無料クォータ (注)

qwen3-asr-flash-realtime

現在、qwen3-asr-flash-realtime-2025-10-27

Stable

$0.00009/秒

36,000 秒(10 時間)

Model Studio を有効化した日から 90 日間有効。

qwen3-asr-flash-realtime-2026-02-10

Snapshot

qwen3-asr-flash-realtime-2025-10-27

Snapshot

  • 対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語

  • 対応サンプルレート:8 kHz、16 kHz

中国本土

中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土のみに限定されます。

モデル

バージョン

単価

無料クォータ (注)

qwen3-asr-flash-realtime

現在、qwen3-asr-flash-realtime-2025-10-27

Stable

$0.000047/秒

無料クォータはありません

qwen3-asr-flash-realtime-2026-02-10

Snapshot

qwen3-asr-flash-realtime-2025-10-27

Snapshot

  • 対応言語:中国語(標準語、四川語、閩南語、呉語、広東語)、英語、日本語、ドイツ語、韓国語、ロシア語、フランス語、ポルトガル語、アラビア語、イタリア語、スペイン語、ヒンディー語、インドネシア語、タイ語、トルコ語、ウクライナ語、ベトナム語、チェコ語、デンマーク語、フィリピン語、フィンランド語、アイスランド語、マレー語、ノルウェー語、ポーランド語、スウェーデン語

  • 対応サンプルレート:8 kHz、16 kHz

Paraformer 音声認識

Paraformer 音声認識には、録音ファイル認識およびリアルタイム音声認識の 2 種類のバージョンがあります。

録音ファイル認識

利用方法 | API リファレンス

説明

中国本土版デプロイモードのみがサポートされています。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置され、推論計算リソースは中国本土に限定されます。

モデル

単価

無料クォータ (注)

paraformer-v2

$0.000012/秒

無料クォータはありません

paraformer-8k-v2

  • 対応言語

    • paraformer-v2:中国語(標準語、広東語、呉語、閩南語、東北官話、甘粛話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陝西話、山東話、四川話、天津話、江西話、雲南話、上海話)、英語、日本語、韓国語、ドイツ語、フランス語、ロシア語

    • paraformer-8k-v2:中国語(標準語)

  • 対応サンプルレート

    • paraformer-v2:任意

    • paraformer-8k-v2:8 kHz

  • 対応音声フォーマット:AAC、AMR、AVI、FLAC、FLV、M4A、MKV、MOV、MP3、MP4、MPEG、OGG、OPUS、WAV、WEBM、WMA、WMV

リアルタイム音声認識

利用方法 | API リファレンス

説明

中国本土版デプロイモードのみがサポートされています。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置され、推論計算リソースは中国本土に限定されます。

モデル

単価

無料クォータ (注)

paraformer-realtime-v2

$0.000035/秒

無料クォータはありません

paraformer-realtime-8k-v2

  • 対応言語

    • paraformer-realtime-v2:中国語(標準語、広東語、呉語、閩南語、東北官話、甘粛話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陝西話、山東話、四川話、天津話、江西話、雲南話、上海話)、英語、日本語、韓国語、ドイツ語、フランス語、ロシア語

    • paraformer-realtime-8k-v2:中国語(標準語)

  • 対応サンプルレート

    • paraformer-realtime-v2:任意

    • paraformer-realtime-8k-v2:8 kHz

  • 対応音声フォーマット:PCM、WAV、MP3、OPUS、SPEEX、AAC、AMR

Fun-ASR 音声認識

Fun-ASR 音声認識には、音声ファイル認識およびリアルタイム音声認識の 2 種類のバージョンがあります。

音声ファイル認識

利用方法 | API リファレンス

国際版

国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルで動的にスケジュールされます。

モデル

バージョン

単価

無料クォータ (注)

fun-asr

現在、fun-asr-2025-11-07

Stable

$0.000035/秒

36,000 秒(10 時間)

有効期間:90 日

fun-asr-2025-11-07

fun-asr-2025-08-25 より遠距離 VAD を改善し、精度を向上

Snapshot

fun-asr-2025-08-25

fun-asr-mtl

現在、fun-asr-mtl-2025-08-25

Stable

fun-asr-mtl-2025-08-25

Snapshot

  • 対応言語

    • fun-asr および fun-asr-2025-11-07:標準語、広東語、呉語、閩南語、客家語、贛語、湘語、晋語。また、中原官話、西南官話、冀魯官話、江淮官話、蘭銀官話、膠遼官話、東北官話、北京官話、香港・台湾地区の標準語アクセント(河南省、陝西省、湖北省、四川省、重慶市、雲南省、貴州省、広東省、広西チワン族自治区、河北省、天津市、山東省、安徽省、南京市、江蘇省、杭州市、甘粛省、寧夏回族自治区など)もサポート。さらに英語および日本語にも対応。

    • fun-asr-2025-08-25:標準語および英語。

    • fun-asr-mtl および fun-asr-mtl-2025-08-25:標準語、広東語、英語、日本語、韓国語、ベトナム語、インドネシア語、タイ語、マレー語、フィリピン語、アラビア語、ヒンディー語、ブルガリア語、クロアチア語、チェコ語、デンマーク語、オランダ語、エストニア語、フィンランド語、ギリシャ語、ハンガリー語、アイルランド語、ラトビア語、リトアニア語、マルタ語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スウェーデン語。

  • 対応サンプルレート:任意

  • 対応音声フォーマット:aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv

中国本土

中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。

モデル

バージョン

単価

無料クォータ (注)

fun-asr

現在、fun-asr-2025-11-07

Stable

$0.000032 / 秒

無料クォータはありません

fun-asr-2025-11-07

fun-asr-2025-08-25 より遠距離 VAD を改善し、精度を向上

Snapshot

fun-asr-2025-08-25

fun-asr-mtl

現在、fun-asr-mtl-2025-08-25

Stable

fun-asr-mtl-2025-08-25

Snapshot

  • 対応言語

    • fun-asr および fun-asr-2025-11-07:標準語、広東語、呉語、閩南語、客家語、贛語、湘語、晋語。また、中原官話、西南官話、冀魯官話、江淮官話、蘭銀官話、膠遼官話、東北官話、北京官話、香港・台湾地区の標準語アクセント(河南省、陝西省、湖北省、四川省、重慶市、雲南省、貴州省、広東省、広西チワン族自治区、河北省、天津市、山東省、安徽省、南京市、江蘇省、杭州市、甘粛省、寧夏回族自治区など)もサポート。さらに英語および日本語にも対応。

    • fun-asr-2025-08-25:標準語および英語。

    • fun-asr-mtl および fun-asr-mtl-2025-08-25:標準語、広東語、英語、日本語、韓国語、ベトナム語、インドネシア語、タイ語、マレー語、フィリピン語、アラビア語、ヒンディー語、ブルガリア語、クロアチア語、チェコ語、デンマーク語、オランダ語、エストニア語、フィンランド語、ギリシャ語、ハンガリー語、アイルランド語、ラトビア語、リトアニア語、マルタ語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スウェーデン語。

  • 対応サンプルレート:任意

  • 対応音声フォーマット:aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv

リアルタイム音声認識

利用方法 | API リファレンス

国際

国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルで動的にスケジュールされます。

モデル

バージョン

単価

無料クォータ (注)

fun-asr-realtime

現在、fun-asr-realtime-2025-11-07

Stable

$0.00009/秒

36,000 秒(10 時間)

有効期間:90 日

fun-asr-realtime-2025-11-07

Snapshot

  • 対応言語:標準語、広東語、呉語、閩南語、客家語、贛語、湘語、晋語。また、中原官話、西南官話、冀魯官話、江淮官話、蘭銀官話、膠遼官話、東北官話、北京官話、香港・台湾地区の標準語アクセント(河南省、陝西省、湖北省、四川省、重慶市、雲南省、貴州省、広東省、広西チワン族自治区、河北省、天津市、山東省、安徽省、南京市、江蘇省、杭州市、甘粛省、寧夏回族自治区など)もサポート。さらに英語および日本語にも対応。

  • 対応サンプルレート:16 kHz

  • 対応音声フォーマット:pcm、wav、mp3、opus、speex、aac、amr

中国本土

中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土に限定されます。

モデル

バージョン

単価

無料クォータ (注)

fun-asr-realtime

現在、fun-asr-realtime-2025-11-07

Stable

$0.000047/秒

無料クォータはありません

fun-asr-realtime-2026-02-28

Snapshot

fun-asr-realtime-2025-11-07

Snapshot

fun-asr-realtime-2025-09-15

fun-asr-flash-8k-realtime

現在、fun-asr-flash-8k-realtime-2026-01-28

Stable

$0.000032/秒

fun-asr-flash-8k-realtime-2026-01-28

Snapshot

  • 対応言語

    • fun-asr-realtime、fun-asr-realtime-2026-02-28、fun-asr-realtime-2025-11-07:中国語(標準語、広東語、呉語、閩南語、客家語、贛語、湘語、晋語。また、中原官話、西南官話、冀魯官話、江淮官話、蘭銀官話、膠遼官話、東北官話、北京官話、香港・台湾地区の標準語アクセント(河南省、陝西省、湖北省、四川省、重慶市、雲南省、貴州省、広東省、広西チワン族自治区、河北省、天津市、山東省、安徽省、南京市、江蘇省、杭州市、甘粛省、寧夏回族自治区など))、英語、日本語。

    • fun-asr-realtime-2025-09-15:中国語(標準語)、英語

  • 対応サンプルレート:16 kHz

  • 対応サンプルレート

    • fun-asr-flash-8k-realtime および fun-asr-flash-8k-realtime-2026-01-28:8 kHz

    • その他のすべてのモデル:16 kHz

  • 対応音声フォーマット:pcm、wav、mp3、opus、speex、aac、amr

テキスト埋め込み

テキスト埋め込みモデルは、テキストをその意味を表す数値ベクターに変換します。検索、クラスタリング、レコメンデーション、分類などのタスクをサポートします。課金は入力トークン数に基づきます。API リファレンス

国際

国際版デプロイモード」では、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルで動的にスケジュールされます。

モデル

埋め込みディメンション

バッチサイズ

バッチあたり最大トークン数

対応言語

単価

(100 万トークンあたり)

無料クォータ

text-embedding-v4

Qwen3-Embedding」シリーズの一部

2,048、1,536、1,024(デフォルト)、768、512、256、128、64

10

8,192

中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、100 を超える主要言語および複数のプログラミング言語

$0.07

100 万トークン

Model Studio の有効化後 90 日間有効

text-embedding-v3

1,024(デフォルト)、768、512

10

8,192

中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、50 を超える言語

50 万トークン

Model Studio の有効化後 90 日間有効

中国本土版

中国本土版デプロイモード」では、エンドポイントおよびデータストレージが 中国 (北京) リージョン に配置されます。モデル推論の計算リソースは中国本土内に限定されます。

モデル

埋め込みディメンション

バッチサイズ

バッチあたり最大トークン数

対応言語

単価

(100 万トークンあたり)

無料クォータ

text-embedding-v4

Qwen3-Embedding」シリーズの一部
バッチ呼び出しは半額

2,048、1,536、1,024(デフォルト)、768、512、256、128、64

10

8,192

中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、100 を超える主要言語および複数のプログラミング言語

$0.072

無料クォータなし

中国 (香港)

モデル

埋め込みディメンション

バッチサイズ

バッチあたり最大トークン数

対応言語

単価

(100 万トークンあたり)

無料クォータ

text-embedding-v4

Qwen3-Embedding シリーズの一部

2,048、1,536、1,024(デフォルト)、768、512、256、128、64

10

8,192

中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、100 を超える主要言語および複数のプログラミング言語

$0.07

100 万トークン

Model Studio の有効化後 90 日間有効

説明

バッチサイズとは、1 回の API 呼び出しで処理可能なテキストの最大数です。たとえば、text-embedding-v4 のバッチサイズは 10 であるため、1 回のリクエストで最大 10 件のテキストを送信でき、各テキストの長さは 8,192 トークンを超えてはなりません。この制限は以下の入力形式に適用されます。

  • 文字列配列入力:配列には最大 10 個の要素を含めることができます。

  • ファイル入力:テキストファイルには最大 10 行を含めることができます。

マルチモーダル埋め込み

マルチモーダル埋め込みモデルは、テキスト、イメージ、または動画を浮動小数点ベクターに変換します。このモデルは、動画分類、画像分類、およびクロスモーダル取得をサポートします。関連 API

国際

国際展開モードでは、エンドポイントおよびデータストレージが シンガポールリージョン に配置されます。モデル推論の計算リソースは、中国本土を除くグローバルで動的にスケジュールされます。

モデル

データ型

埋め込みディメンション

単価(100万トークンあたり)

無料クォータ (注)

tongyi-embedding-vision-plus

float(32)

1,152

$0.09

100万トークン

Model Studio の有効化から 90 日間有効

tongyi-embedding-vision-flash

float(32)

768

イメージまたは動画:$0.03

テキスト:$0.09

中国本土

中国本土デプロイモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置されます。モデル推論の計算リソースは、中国本土内に限定されます。

モデル

データ型

埋め込みディメンション

単価(100万トークンあたり)

qwen3-vl-embedding

float32

2560、2048、1536、1024、768、512、または 256

イメージまたは動画:$0.258

テキスト:$0.10

multimodal-embedding-v1

1,024

無料トライアル

再ランキング

クエリと候補テキスト(ドキュメント)のリストが与えられた場合、候補をクエリとの関連性に基づいて最も関連性が高いものから順に並べ替えます。API リファレンス

国際版

国際版デプロイモード」では、エンドポイントおよびデータストレージは シンガポールリージョン に配置されます。モデル推論用の計算リソースは、中国本土を除くグローバル範囲で動的にスケジュールされます。

モデル

最大ドキュメント数

1 行あたりの最大トークン数

最大入力トークン数

対応言語

単価(100 万トークンあたり)

qwen3-rerank

500

4,000

30,000

中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など、100 を超える主要言語

$0.1

  • 1 行あたりの最大トークン数:各クエリまたはドキュメントは最大 4,000 トークンまで含めることができます。この長さを超える入力は切り捨てられます。

  • 最大ドキュメント数:1 回のリクエストあたり最大 500 ドキュメントまで処理可能です。

  • 最大入力トークン数:すべてのクエリおよびドキュメントに含まれるトークン総数は、1 回のリクエストあたり 30,000 を超えてはなりません。

中国本土版

中国本土版デプロイモード」では、エンドポイントおよびデータストレージは 中国 (北京) リージョンに配置されます。モデル推論用の計算リソースは中国本土内に限定されます。

モデル

最大ドキュメント数

1 行あたりの最大トークン数

最大入力トークン数

対応言語

単価(100 万トークンあたり)

qwen3-vl-rerank

100

8,000

120,000

中国語、英語、日本語、韓国語、フランス語、ドイツ語など、33 言語

画像:$0.258

テキスト:$0.1

gte-rerank-v2

500

4,000

30,000

中国語、英語、日本語、韓国語、タイ語、スペイン語、フランス語、ポルトガル語、ドイツ語、インドネシア語、アラビア語など、50 を超える言語

$0.115

  • 1 行あたりの最大トークン数:各クエリまたはドキュメントは最大 4,000 トークンまで含めることができます。この長さを超える入力は切り捨てられます。

  • 最大ドキュメント数:1 回のリクエストあたり最大 500 ドキュメントまで処理可能です。

  • 最大入力トークン数:すべてのクエリおよびドキュメントに含まれるトークン総数は、1 回のリクエストあたり 30,000 を超えてはなりません。

ドメイン固有

意図の理解

意図の理解モデルは、100 ミリ秒未満でユーザーの意図を迅速かつ正確に解析し、ユーザーのリクエストを解決するための適切なツールを選択します。関連 API | 利用方法

説明

サポートされているのは、中国本土デプロイモードのみです。このモードでは、エンドポイントおよびデータストレージが 中国 (北京) リージョンに配置され、推論用の計算リソースは中国本土内に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

tongyi-intent-detect-v3

8,192

8,192

1,024

$0.058

$0.144

ロールプレイ

Qwen のロールの引き受けモデルは、仮想的な交流、ゲーム内の NPC、IP レプリケーション、ハードウェア・おもちゃ・車載システムなど、人間らしさを重視した対話シナリオ向けに設計されています。他の Qwen モデルと比較して、キャラクターの忠実度、トピックの進行性、共感的な傾聴能力が向上しています。利用方法

国際版

国際デプロイモードでは、エンドポイントとデータストレージはシンガポールリージョンに配置されます。モデル推論の計算リソースは、中国本土を除き、グローバルに動的にスケジュールされます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen-plus-character

32,768

30,000

4,000

$0.5

$1.4

qwen-plus-character-ja

8,192

7,680

512

$0.5

$1.4

中国本土版

中国本土デプロイモード」では、エンドポイントおよびデータストレージは北京リージョンに配置されます。モデル推論の計算リソースは中国本土に限定されます。

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

(トークン)

(100 万トークンあたり)

qwen-plus-character

32,768

32,000

4,096

$0.115

$0.287

非推奨モデル

2026 年 1 月 30 日に非推奨

カテゴリ

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト(100 万トークンあたり)

出力コスト(100 万トークンあたり)

代替

(トークン)

Qwen-Plus

qwen-plus-2024-11-27

131,072

129,024

8,192

$0.115

$0.287

qwen-plus-2025-12-01

qwen-plus-2024-11-25

qwen-plus-2024-09-19

qwen-plus-2024-08-06

128,000

$0.574

$1.721

Qwen-Turbo

qwen-turbo-2024-09-19

131,072

129,023

8,192

$0.044

$0.087

qwen-flash-2025-07-28

Qwen-VL

qwen-vl-max-2024-10-30

32,768

30,720

イメージごとに最大 16,384

2,048

$2.868

$2.868

qwen3-vl-plus-2025-12-19

qwen-vl-max-2024-08-09

qwen-vl-plus-2024-08-09

$0.216

$0.646

qwen3-vl-flash-2025-10-15

2025年8月20日にリタイア

Qwen2

Alibaba Cloud が提供する Qwen2 オープンソースモデルです。使用方法 | API リファレンス | オンラインで試す

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

代替

(トークン)

(100 万トークンあたり)

qwen2-72b-instruct

131,072

128,000

6,144

期間限定無料

Qwen3、DeepSeek、Kimi など

qwen2-57b-a14b-instruct

65,536

63,488

qwen2-7b-instruct

131,072

128,000

Qwen1.5

Alibaba Cloud が提供する Qwen1.5 オープンソースモデルです。使用方法 | API リファレンス | オンラインで試す

モデル

コンテキストウィンドウ

最大入力

最大出力

入力コスト

出力コスト

代替モデル

(トークン)

(100 万トークンあたり)

qwen1.5-110b-chat

8,000

6,000

2,000

期間限定無料

Qwen3、DeepSeek、Kimi など

qwen1.5-72b-chat

qwen1.5-32b-chat

qwen1.5-14b-chat

qwen1.5-7b-chat