Qwen は、Alibaba Cloud によって開発された一連の大規模言語モデル(LLM)です。Qwen モデルは、画像動画などの自然言語データやマルチモーダルデータを理解・分析できます。幅広い分野やタスクでサービスや支援を提供します。最良の結果を得るには、明確で詳細な指示を入力してください。
モデルを試す
Playground(シンガポール リージョン または 北京 リージョン)で Qwen モデルを試すことができます。
シナリオ
Qwen は、強力な言語処理能力とマルチモーダルデータ処理能力を備えており、以下のような様々なアプリケーション シナリオに効率的でインテリジェントな言語サービスを提供します。
テキスト作成: ストーリー、公式文書、E メール、スクリプト、詩を作成します。
テキスト処理: テキストを洗練し、要約を抽出します。
プログラミング支援: コードを作成および最適化します。
翻訳サービス: 英語、日本語、フランス語、スペイン語など、様々な言語間でテキストを翻訳します。
対話シミュレーション: モデルに様々なロールを割り当て、インタラクティブな会話を実施します。
データの可視化: データを表現するチャートを作成します。
モデルリスト
シンガポール
商用モデル
テキスト生成 - Qwen
Qwen シリーズの商用モデルは、オープンソース版を上回る最新の機能と機能強化を誇ります。
テキスト生成 - Qwen
Qwen-Max は、Qwen モデルの中で最高の推論性能を提供し、特に複雑な複数ステップのタスクにおいて強みを発揮します。使用方法 | API リファレンス | オンラインで試す
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万 トークン) | ||||||
qwen-max qwen-max-2025-01-25 と同じパフォーマンス | 安定版 | 32,768 | 30,720 | 8,192 | $1.6 バッチ: 半額 | $6.4 バッチ: 半額 | それぞれ 100万 トークン 有効化後 180日間有効 |
qwen-max-latest 常に最新のスナップショットと同じパフォーマンス | 最新版 | $1.6 | $6.4 | ||||
qwen-max-2025-01-25 qwen-max-0125 または Qwen2.5-Max | スナップショット | ||||||
Qwen-Plus
Qwen-Plus は、パフォーマンス、速度、コストをバランス良く両立しており、中程度の複雑さのタスクに最適です。利用手順 | API リファレンス | オンラインで試す | ディープシンキング
モデル | バージョン | [コンテキスト ウィンドウ] | 最大入力 | 最大出力 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万トークン) | ||||||
qwen-plus qwen-plus-2025-04-28 と同じパフォーマンスです。 Qwen3 シリーズ。 | 安定 | 131,072 | 思考 98,304 非思考 129,024 | 16,384 最大 CoT 38,912 | $0.4 バッチ呼び出しの場合は半額です。 | 思考 $4 非思考 $1.2 バッチ呼び出しの場合は半額です。 | それぞれ 100 万トークン 有効化後 180 日間有効です。 |
qwen-plus-latest 最新のスナップショットと同じパフォーマンス Qwen3 シリーズ。 | 最新 | 1,000,000 | 思考 995,904 非思考 997,952 デフォルトは 129,024 です。 | 32,768 最大 CoT 81,920 | 段階的な価格設定です。表の下の説明を参照してください。 | ||
qwen-plus-2025-07-28 qwen-plus-0728 とも呼ばれます。 Qwen3 シリーズ。 | スナップショット | 思考中 995,904 非思考中 997,952 | |||||
qwen-plus-2025-07-14 qwen-plus-0714 とも呼ばれます。 Qwen3 シリーズ。 | 131,072 | 思考 98,304 非思考 129,024 | 16,384 最大 CoT 38,912 | $0.4 | 思考 $4 非思考 $1.2 | ||
qwen-plus-2025-04-28 qwen-plus-0428 とも呼ばれます。 Qwen3 シリーズ。 | |||||||
qwen-plus-2025-01-25 また qwen-plus-0125。 | 129,024 | 8,192 | $1.2 | ||||
qwen-plus-latest と qwen-plus-2025-07-28 には、各リクエストの入力トークン数に基づいた段階的価格設定が適用されます。
入力トークン数 | 入力価格(百万トークン) | モード | 出力価格(百万トークン) |
0-256K | $0.4 | 非思考 | $1.2 |
思考 | $4 | ||
256K-1M | $1.2 | 非思考 | $3.6 |
思考 | $12 |
qwen-plus-2025-07-28、qwen-plus-2025-07-14、qwen-plus-2025-04-28、qwen-plus-latest、および qwen-plus は、思考モードと非思考モードの両方をサポートしており、enable_thinking パラメーターを使用して両者を切り替えることができます。これに加えて、モデルの性能が大幅に強化されています:
推論能力: このモデルは、数学、コーディング、論理的推論の評価において、QwQ および同規模の非推論モデルを大幅に上回り、その規模で SOTA パフォーマンスに達しています。
人間のプリファレンス フォロー: 創造的なライティング、ロールプレイング、複数ターンの会話、および指示フォローの能力が大幅に向上し、同規模のモデルの一般的な能力を上回っています。
エージェント機能: このモデルは、思考モードと非思考モードの両方で業界をリードするレベルを実現し、正確な外部ツール呼び出しを可能にします。
多言語機能: このモデルは 100 を超える言語と方言をサポートし、多言語翻訳、指示理解、および常識推論能力が著しく向上しています。
応答形式の修正: 異常な Markdown、テキスト途中の切り捨て、誤ったボックス出力など、以前のバージョンの応答形式に関する以前の問題が修正されました。
Qwen-Flash
Qwen ファミリーの中で最も高速で費用対効果の高いモデルであり、軽量なタスクに最適です。Qwen Flash は、より経済的な課金のための柔軟な段階的価格設定構造を使用しています。使用方法 | API リファレンス | [オンラインで試す] | 思考モード
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万 トークン) | ||||||
qwen-flash qwen-flash-2025-07-28 と同じパフォーマンスです。 Qwen3 シリーズ。 バッチ呼び出しの場合は 50% オフ | 安定版 | 1,000,000 | 思考 995,904 非思考 997,952 | 32,768 最大 CoT 81,920 | 段階的価格設定。表の下の説明を参照してください。 | それぞれ 100万 トークン アクティベーション後 180日間有効 | |
qwen-flash-2025-07-28 qwen-flash-0728 とも呼ばれます | スナップショット | ||||||
qwen-flash と qwen-flash-2025-07-28 は、各リクエストのトークン数に基づいて段階的価格設定を使用します。qwen-flash は、コンテキスト キャッシュとバッチをサポートしています。
コンテキスト長 | 入力価格 (百万 トークン) | 出力価格 (百万 トークン) |
0-256K | $0.05 | $0.4 |
256K-1M | $0.25 | $2 |
Qwen-Turbo
Qwen-Turbo の更新は今後停止されます。代わりに、柔軟な段階的価格設定により、さらに費用対効果の高い課金が可能な Qwen-Flash を推奨します。利用手順 | API リファレンス | オンラインで試す | 詳細解説
名前 | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万 トークン) | ||||||
qwen-turbo qwen-turbo-2025-04-28 と同じパフォーマンス Qwen3 シリーズ | 安定 | 思考 131,072 非思考 1,000,000 | 思考 98,304 非思考 1,000,000 | 16,384 CoT:38,912 | $ 0.05 バッチ: 半額 | 思考: $ 0.5 非思考: $ 0.2 バッチ: 半額 | それぞれ 100万 トークン アクティベーション後 180日間有効 |
qwen-turbo-latest 常に最新のスナップショットと同じパフォーマンス Qwen3 シリーズ | 最新 | $ 0.05 | 思考: $ 0.5 非思考: $ 0.2 | ||||
qwen-turbo-2025-04-28 qwen-turbo-0428 とも呼ばれます Qwen3 シリーズ | スナップショット | ||||||
qwen-turbo-2024-11-01 qwen-turbo-1101 とも呼ばれます | 1,000,000 | 1,000,000 | 8,192 | $ 0.2 | |||
qwen-turbo-2025-04-28 と qwen-turbo は、思考モードと非思考モードの両方に対応しており、enable_thinking パラメーターで両モードを切り替えることができます。これに加えて、モデルの機能が大幅に強化されています:
推論能力: このモデルは、数学、コーディング、論理的推論の評価において、QwQ および同規模の非推論モデルを大幅に上回り、その規模で SOTA パフォーマンスに達しています。
人間のプリファレンス フォロー: 創造的なライティング、ロールプレイング、複数ターンの会話、および指示フォローの能力が大幅に向上し、同規模のモデルの一般的な能力を上回っています。
エージェント機能: このモデルは、思考モードと非思考モードの両方で業界をリードするレベルを実現し、正確な外部ツール呼び出しを可能にします。
多言語機能: このモデルは 100 を超える言語と方言をサポートし、多言語翻訳、指示理解、および常識推論能力が著しく向上しています。
応答形式の修正: 異常な Markdown、テキスト途中の切り捨て、誤ったボックス出力など、以前のバージョンの応答形式の問題が修正されました。
QwQ
QwQ 推論モデルは、Qwen 2.5 に基づいてトレーニングされており、強化学習によって推論能力が大幅に向上しています。コアとなる数学およびコーディングメトリック(AIME 24/25、LiveCodeBench)と一般的なメトリック(IFEval、LiveBenchなど)に対するパフォーマンスは、DeepSeek-R1 のレベルに達しています。使用方法
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大応答 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万トークン) | |||||||
qwq-plus | 安定 | 131,072 | 98,304 | 32,768 | 8,192 | $ 0.8 | $ 2.4 | 100 万トークン アクティベーション後 180 日間有効 |
Qwen-Omni
Qwen の新しいマルチモーダル理解および生成モデル。テキスト、画像、音声、動画入力をサポートし、テキストと音声を生成します。4 つの自然な音声オプションを提供します。使用方法 | API リファレンス
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 無料クォータ |
(トークン) | |||||
qwen-omni-turbo qwen-omni-turbo-2025-03-26 と同じパフォーマンス | 安定版 | 32,768 | 30,720 | 2,048 | それぞれ 100 万トークン (モダリティに関係なく) アクティベーション後 180 日間有効 |
qwen-omni-turbo-latest 常に最新のスナップショットと同じパフォーマンス | 最新版 | ||||
qwen-omni-turbo-2025-03-26 qwen-omni-turbo-0326 とも呼ばれます | スナップショット | ||||
無料クォータを使い果たした後、入力と出力の課金ルールは次のとおりです。
|
|
QVQ
QVQ は、視覚入力と思考の連鎖出力に対応した視覚的推論モデルです。数学、コーディング、視覚分析、創造性、および一般的なタスクにおいて優れた能力を発揮します。 使用方法
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大 CoT | 最大応答 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万 トークン) | |||||||
qvq-max 現在、qvq-max-2025-03-25 と同じパフォーマンスです。 | 安定 | 131,072 | 106,496 イメージごとに最大 16,384 | 16,384 | 8,192 | $ 1.2 | $ 4.8 | それぞれ 100万 トークン アクティベーション後 180日間有効 |
qvq-max-latest 常に最新のスナップショットと同じパフォーマンス | 最新 | |||||||
qvq-max-2025-03-25 qvq-max-0325 とも呼ばれます | スナップショット | |||||||
Qwen-VL
Qwen-VL は、画像を理解し処理できるテキスト生成モデルです。このモデルは OCR 操作を実行し、要約や推論などのさらなる機能を提供します。たとえば、写真からプロダクト属性を抽出したり、画像から問題を解決したりできます。 使用方法 | API リファレンス | オンラインで試す
Qwen-VL は、入力トークンと出力トークンの合計数に基づいて課金されます。
画像トークンの計算ルール:28 × 28 ピクセルごとに 1 トークンとしてカウントされます。各画像は少なくとも 4 トークンに変換されます。詳細については、「ビジュアル理解 (Qwen-VL)」をご参照ください。
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万トークン) | ||||||
qwen-vl-max qwen-vl-plus と比較して、視覚的推論と指示実行の機能が強化されています。複雑なタスクに最適です。 qwen-vl-max-2025-04-08 と同等の性能 | 安定版 | 131,072 | 129,024 画像ごとに最大 16,384 | 8,192 | $0.8 | $3.2 | それぞれ 100 万トークン アクティベーション後 180 日間有効 |
qwen-vl-max-latest 常に最新のスナップショットと同じ性能 | 最新版 | ||||||
qwen-vl-max-2025-04-08 qwen-vl-max-0408 とも呼ばれます Qwen2.5-VL シリーズ。128,000 のコンテキストウィンドウと強化された数学および推論機能を備えています。 | スナップショット | ||||||
qwen-vl-plus qwen-vl-plus-2025-05-07 と同等の性能 | 安定版 | 131,072 | 129,024 画像ごとに最大 16,384 | 8,192 | $0.21 | $0.63 | |
qwen-vl-plus-latest 常に最新のスナップショットと同じ性能 | 最新版 | ||||||
qwen-vl-plus-2025-05-07 qwen-vl-plus-0507 とも呼ばれます 数学、推論、および監視ビデオコンテンツの理解が大幅に強化されています。 | スナップショット | ||||||
qwen-vl-plus-2025-01-25 qwen-vl-plus-0125 とも呼ばれます Qwen2.5-VL シリーズ。128,000 のコンテキストウィンドウと強化された数学および推論機能を備えています。 | |||||||
Qwen-OCR
Qwen-OCR は、テキスト抽出に特化したモデルです。 Qwen-VL と比較して、ドキュメント、表、試験問題、手書きなど、画像からのテキスト抽出により重点を置いています。英語、フランス語、日本語、韓国語、ドイツ語、ロシア語、イタリア語など、複数の言語を検出できます。 使用方法 | API リファレンス | オンライン試用
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力 / 出力価格 | 無料クォータ |
(トークン) | (百万 トークン) | |||||
qwen-vl-ocr | 安定版 | 34,096 | 30,000 画像あたり 最大 30,000 | 4,096 | $0.72 | 100万 トークン 有効化後 180日間有効 |
Qwen-Coder
Qwen シリーズのコーダーモデルです。最新の Qwen3-Coder シリーズは Qwen3 をベースにしており、強力なコーディングエージェント機能を備えています。強力なコーディングエージェント機能を持ち、ツール呼び出しと環境インタラクションに優れ、自律プログラミングが可能です。優れたコーディング能力を発揮しながら、強力な汎用機能も維持しています。使用方法 | API リファレンス
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万トークン) | ||||||
qwen3-coder-plus qwen3-coder-plus-2025-07-22 と同じパフォーマンス | 安定版 | 1,000,000 | 997,952 | 65,536 | 段階的料金が使用されます。表の下の説明を参照してください。 | それぞれ 100 万トークン Model Studio をアクティブにしてから 180 日間有効 | |
qwen3-coder-plus-2025-07-22 | スナップショット | ||||||
qwen3-coder-flash qwen3-coder-flash-2025-07-28 と同じパフォーマンス | 安定版 | ||||||
qwen3-coder-flash-2025-07-28 | スナップショット | ||||||
上記のモデルは、各リクエストの入力トークン数に基づいて段階的課金を使用します。
qwen3-coder-plus
2025 年 7 月 24 日 16:00 から、qwen3-coder-plus モデルは期間限定割引で利用可能になります。入力トークンがキャッシュにヒットした場合、価格は 75% 割引されます。この割引により、入力トークンの標準価格の 10% の価格になります。詳細については、「Qwen3-Coder-Plus の期間限定割引」をご参照ください。 qwen3-coder-plus の割引価格は次のとおりです。
入力トークン数 | 入力価格 (百万トークン) | 出力価格 (百万トークン) | キャッシュされた入力トークンの価格 (百万トークン) |
0~32K | $1 | $5 | $0.1 (75% オフ $0.4) |
32K~128K | $1.8 | $9 | $0.18 (75% オフ $0.72) |
128K~256K | $3 | $15 | $0.3 (75% オフ $1.2) |
256K~1M | $6 | $60 | $0.6 (75% オフ $2.4) |
qwen3-coder-plus-2025-07-22
qwen3-coder-plus-2025-07-22 はコンテキストキャッシュをサポートしていません。価格は次のとおりです。
入力トークン数 | 入力価格 (百万トークン) | 出力価格 (百万トークン) |
0~32K | $1 | $5 |
32K~128K | $1.8 | $9 |
128K~256K | $3 | $15 |
256K~1M | $6 | $60 |
qwen3-coder-flash
qwen3-coder-flash の価格は次のとおりです。
入力トークン数 | 入力価格 (百万トークン) | 出力価格 (百万トークン) | キャッシュされた 入力トークン の価格 (百万トークン) |
0~32K | $0.3 | $1.5 | $0.08 |
32K~128K | $0.5 | $2.5 | $0.12 |
128K~256K | $0.8 | $4 | $0.2 |
256K~1M | $1.6 | $9.6 | $0.4 |
qwen3-coder-flash-2025-07-28
qwen3-coder-flash-2025-07-28 はコンテキストキャッシュをサポートしていません。価格は次のとおりです。
入力トークン数 | 入力価格 (百万トークン) | 出力価格 (百万トークン) |
0~32K | $0.3 | $1.5 |
32K~128K | $0.5 | $2.5 |
128K~256K | $0.8 | $4 |
256K~1M | $1.6 | $9.6 |
Qwen-MT
Qwen 3 をベースにアップグレードされた機械翻訳のための主力 LLM で、中国語、英語、日本語、韓国語、フランス語、スペイン語、ドイツ語、タイ語、インドネシア語、ベトナム語、アラビア語など 92 言語間の翻訳をサポートしています。モデルのパフォーマンスと翻訳品質が全面的にアップグレードされ、より安定した用語のカスタマイズ、フォーマットの保持、およびドメイン固有の機能が提供されます。使用方法
モデル | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万 トークン) | |||||
qwen-mt-plus | 4,096 | 2,048 | 2,048 | $ 2.46 | $ 7.37 | それぞれ 100万 トークン アクティベーション後 180日間有効 |
qwen-mt-turbo | $ 0.16 | $ 0.49 | ||||
オープンソースモデル
テキスト生成 - Qwen - オープンソース
モデル名において、「xxb」はパラメータスケールを示します。たとえば、「qwen2-72b-instruct」には 720 億のパラメータがあります。
Model Studio では、ローカルデプロイメントを必要とせずに、オープンソースの Qwen モデルを簡単に使用できます。オープンソースモデルの中で、Qwen3 と Qwen2.5 が最も推奨されています。
Qwen3
2025 年 7 月にリリースされた qwen3-235b-a22b-thinking-2507 は、思考モードのみをサポートし、qwen3-235b-a22b(思考モード)のアップグレードバージョンです。
2025 年 7 月にリリースされた qwen3-235b-a22b-instruct-2507 は、非思考モードのみをサポートし、qwen3-235b-a22b(非思考モード)のアップグレードバージョンです。
2025 年 7 月にリリースされた qwen3-30b-a3b-thinking-2507 は、思考モードのみをサポートし、qwen3-30b-a3b(思考モード)のアップグレードバージョンです。
2025 年 7 月にリリースされた qwen3-30b-a3b-instruct-2507 は、非思考モードのみをサポートし、qwen3-30b-a3b(非思考モード)のアップグレードバージョンです。
2025 年 4 月にリリースされた Qwen3 モデルは、思考モードと非思考モードの両方をサポートしており、enable_thinking パラメータを使用して 2 つのモードを切り替えることができます。これに加えて、モデルの機能が大幅に強化されました。
推論機能: モデルは、数学、コーディング、論理的推論の評価において、QwQ および同規模の非推論モデルを大幅に上回り、同規模で SOTA パフォーマンスに達しています。
人間のプリファレンスへの追従: 創造的なライティング、ロールプレイング、複数ターンの会話、指示への追従における能力が大幅に向上し、同規模のモデルの一般的な能力を上回っています。
エージェント機能: モデルは、思考モードと非思考モードの両方で業界をリードするレベルを実現し、正確な外部ツール呼び出しを可能にします。
多言語機能: モデルは 100 以上の言語と方言をサポートしており、多言語翻訳、指示の理解、常識的推論能力が著しく向上しています。
応答形式の修正:以前のバージョンでの応答形式の問題(異常な Markdown、テキスト途中の切り捨て、誤ったボックス出力など)が修正されました。
2025 年 4 月にリリースされたオープンソース Qwen3 モデルは、思考モードでの非ストリーム出力をサポートしていません。
オープンソース Qwen3 は、思考モードで思考プロセスを出力しない場合、非思考価格で課金されます。
モデル | モード | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大出力 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万トークン) | |||||||
qwen3-235b-a22b-thinking-2507 | 思考のみ | 131,072 | 126,976 | 81,920 | 32,768 | $ 0.7 | $ 8.4 | それぞれ 100 万トークン アクティベーション後 180 日間有効 |
qwen3-235b-a22b-instruct-2507 | 非思考のみ | 129,024 | - | $ 0.7 | $ 2.8 | それぞれ 100 万トークン アクティベーション後 180 日間有効 | ||
qwen3-30b-a3b-thinking-2507 | 思考のみ | 126,976 | 81,920 | $ 0.2 | $ 2.4 | |||
qwen3-30b-a3b-instruct-2507 | 非思考のみ | 129,024 | - | $ 0.8 | ||||
qwen3-235b-a22b これは以下のモデルは、2025 年 4 月に公開されています。 | 非思考 | 129,024 | - | 16,384 | $ 0.7 | $ 2.8 | ||
思考 | 98,304 | 38,912 | $ 8.4 | |||||
qwen3-32b | 非思考 | 129,024 | - | $ 2.8 | ||||
思考 | 98,304 | 38,912 | $ 8.4 | |||||
qwen3-30b-a3b | 非思考 | 129,024 | - | $ 0.2 | $ 0.8 | |||
思考 | 98,304 | 38,912 | $ 2.4 | |||||
qwen3-14b | 非思考 | 129,024 | - | 8,192 | $ 0.35 | $ 1.4 | ||
思考 | 98,304 | 38,912 | $ 4.2 | |||||
qwen3-8b | 非思考 | 129,024 | - | $ 0.18 | $ 0.7 | |||
思考 | 98,304 | 38,912 | $ 2.1 | |||||
qwen3-4b | 非思考 | 129,024 | - | $ 0.11 | $ 0.42 | |||
思考 | 98,304 | 38,912 | $ 1.26 | |||||
qwen3-1.7b | 非思考 | 32,768 | 30,720 | - | $ 0.42 | |||
思考 | 28,672 | 入力 + CoT は 30,720 を超えることはできません | $ 1.26 | |||||
qwen3-0.6b | 非思考 | 30,720 | - | $ 0.42 | ||||
思考 | 28,672 | 入力 + CoT は 30,720 を超えることはできません | $ 1.26 | |||||
Qwen2.5
Qwen2
Qwen1.5
Qwen-Omni - オープンソース
Qwen-Omni は、Qwen2.5 でトレーニングされたオムニモーダル理解および生成モデルです。テキスト、画像、音声、動画を迅速に理解できます。また、テキストと音声を同時にストリームで生成することもできます。 使用方法 | API リファレンス
モデル名 | コンテキスト長 | 最大入力 | 最大出力 | 無料クォータ |
(トークン数) | ||||
qwen2.5-omni-7b | 32,768 | 30,720 | 2,048 | 100 万トークン(モダリティに依存しない) Model Studio のアクティベーション後 180 日間有効。 |
無料クォータを使い果たした後、入力と出力の課金ルールは次のとおりです。
|
|
Qwen-VL - オープンソース
Qwen-VL のオープンソースバージョン。 使用方法 | API リファレンス
Qwen2.5-VL は、Qwen2-VL に対して以下の点が改善されています。
より豊かな世界の認識: Qwen2.5-VL は、花、鳥、魚、昆虫などの一般的なオブジェクトを認識するだけでなく、画像内のテキスト、チャート、アイコン、グラフィック、レイアウトを分析することも得意です。
長い動画の理解: Qwen2.5-VL は、最大 10 分の動画を理解できます。また、動画のセグメントを正確に特定してイベントを捉えることもできます。
視覚的な位置特定: Qwen2.5-VL は、バウンディングボックス(左上隅と右下隅の座標)またはポイント(バウンディングボックスの中心の座標)を生成することで、画像内のオブジェクトを正確に位置特定できます。これらの座標に対して安定した JSON 出力を提供できます。
構造化出力: Qwen2.5-VL は、請求書、フォーム、表などのデータの構造化出力をサポートしており、金融、ビジネスなどのシナリオに適しています。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 | 無料クォータ |
(トークン) | (百万トークン) | |||||
qwen2.5-vl-72b-instruct | 131,072 | 129,024 画像あたり最大 16,384 | 8,192 | $ 2.8 | $ 8.4 | それぞれ 1 億トークン アクティベーション後 180 日間有効 |
qwen2.5-vl-32b-instruct | $ 1.4 | $ 4.2 | ||||
qwen2.5-vl-7b-instruct | $ 0.35 | $ 1.05 | ||||
qwen2.5-vl-3b-instruct | $ 0.21 | $ 0.63 | ||||
北京
商用モデル
テキスト生成 - Qwen
Qwen シリーズの商用モデルは、オープンソース版よりも最新の機能と強化を誇っています。
各モデルは定期的に更新およびアップグレードされます。固定バージョンを使用するには、スナップショットバージョンを選択してください。スナップショットバージョンは、通常、次のスナップショットバージョンのリリース日から 1 か月間維持されます。
QwQ
Qwen2.5 に基づいてトレーニングされた QwQ 推論モデルは、強化学習によって推論能力が大幅に向上しました。コア数学およびコーディングメトリック(AIME 24/25、LiveCodeBench)と一般的なメトリック(IFEval、LiveBenchなど)に対するパフォーマンスは、DeepSeek-R1 のレベルに達しています。詳細については、「使用方法」をご参照ください。
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大応答 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | ||||||
qwq-plus 現在、qwq-plus-2025-03-05 と同じパフォーマンスです | 安定版 | 131,072 | 98,304 | 32,768 | 8,192 | $0.230 | $0.574 |
qwq-plus-latest 常に最新のスナップショットと同じパフォーマンスです | 最新版 | ||||||
qwq-plus-2025-03-05 qwq-plus-0305 とも呼ばれます | スナップショット | ||||||
Qwen-Max
Qwen-Max は、Qwen モデルの中で最高の推論パフォーマンスを提供し、特に複雑で複数ステップのタスクに適しています。詳細については、「使用方法」または「API リファレンス」をご参照ください。オンラインで試す
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | |||||
qwen-max 現在、qwen-max-2024-09-19 と同じパフォーマンスです | 安定版 | 32,768 | 30,720 | 8,192 | $0.345 | $1.377 |
qwen-max-latest 常に最新のスナップショットと同じパフォーマンスです | 最新版 | 131,072 | 129,024 | |||
qwen-max-2025-01-25 qwen-max-0125、Qwen2.5-Max | スナップショット | |||||
qwen-max-2024-09-19 qwen-max-0919 とも呼ばれます | 32,768 | 30,720 | $2.868 | $8.602 | ||
Qwen-Plus
Qwen-Plus は、パフォーマンス、速度、コストのバランスの取れた組み合わせを提供し、中程度の複雑さのタスクに最適です。
詳細については、「使用方法」または「API リファレンス」をご参照ください。オンラインで試す | 思考モード
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | |||||
qwen-plus 現在、qwen-plus-2025-04-28 と同じパフォーマンスです Qwen3 シリーズ | 安定版 | 131,072 | 思考 98,304 非思考 129,024 | 16,384 最大 CoT は 38,912 です | $0.115 | 思考 $1.147 非思考 $0.287 |
qwen-plus-latest 常に最新のスナップショットと同じパフォーマンスです Qwen3 シリーズ | 最新版 | 1,000,000 | 思考 995,904 非思考 997,952 デフォルトは 129,024 です。 max_input_tokens によって制御されます | 32,768 最大 CoT 81,920 | 段階的価格設定。表の下の説明を参照してください。 | |
qwen-plus-2025-07-28 qwen-plus-0728 とも呼ばれます Qwen3 シリーズ | スナップショット | 思考 995,904 非思考 997,952 | ||||
qwen-plus-2025-07-14 qwen-plus-0714 とも呼ばれます Qwen3 シリーズ | 131,072 | 思考 98,304 非思考 129,024 | 16,384 最大 CoT 38,912 | $0.115 | 思考 $1.147 非思考 $0.287 | |
qwen-plus-2025-04-28 qwen-plus-0428 とも呼ばれます Qwen3 シリーズ | ||||||
qwen-plus-2025-01-25 qwen-plus-0125 とも呼ばれます | 129,024 | 8,192 | $0.287 | |||
qwen-plus-2025-01-12 qwen-plus-0112 とも呼ばれます | ||||||
qwen-plus-2024-12-20 qwen-plus-1220 とも呼ばれます | ||||||
qwen-plus-2024-11-27 qwen-plus-1127 とも呼ばれます | ||||||
qwen-plus-2024-11-25 qwen-plus-1125 とも呼ばれます | ||||||
qwen-plus-2024-09-19 qwen-plus-0919 とも呼ばれます | ||||||
qwen-plus-2024-08-06 qwen-plus-0806 とも呼ばれます | 128,000 | $0.574 | $1.721 | |||
qwen-plus-latest と qwen-plus-2025-07-28 は、各リクエストの入力トークンに基づいて段階的価格設定を使用します。
入力トークン数 | 入力価格 (百万トークン) | モード | 出力価格 (百万トークン) |
0~128K | $0.115 | 非思考 | $0.287 |
思考 | $1.147 | ||
128K~256K | $0.345 | 非思考 | $2.868 |
思考 | $3.441 | ||
256K~1M | $0.689 | 非思考 | $6.881 |
思考 | $9.175 |
qwen-plus-2025-07-28、qwen-plus-2025-07-14、qwen-plus-2025-04-28、qwen-plus-latest、および qwen-plus は、思考モードと非思考モードの両方をサポートしており、enable_thinking パラメーターを使用して 2 つのモードを切り替えることができます。これに加えて、モデルの機能が大幅に強化されました。
推論能力:モデルは、数学、コーディング、論理的推論の評価において、QwQ および同規模の非推論モデルを大幅に上回り、その規模で SOTA パフォーマンスに達しました。
人間の好みの追従:クリエイティブライティング、ロールプレイング、複数ターンの会話、指示の追従における能力が大幅に向上し、同規模のモデルの一般的な能力を上回っています。
エージェント機能:モデルは、思考モードと非思考モードの両方で業界をリードするレベルを達成し、正確な外部ツール呼び出しを可能にします。
多言語機能:100 以上の言語と方言をサポートし、多言語翻訳、指示理解、常識推論能力が著しく向上しています。
応答形式の修正:以前のバージョンの応答形式の問題(異常な Markdown、テキスト途中の切り捨て、間違ったボックス出力など)が修正されました。
qwen-plus-2025-07-28、qwen-plus-2025-07-14、qwen-plus-2025-04-28、qwen-plus-latest、および qwen-plus モデルの場合、思考モードが有効になっているときに思考プロセスが出力されない場合、料金は非思考モードの価格に基づいて課金されます。
Qwen-Flash
Qwen-Flash は、Qwen シリーズの中で最も高速で低コストのモデルであり、単純なジョブに適しています。費用対効果の高い課金のために、柔軟な段階的価格設定モデルを使用しています。詳細については、「使用方法」または「API リファレンス」をご参照ください。深層思考
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大応答 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | ||||||
qwen-flash 現在、qwen-flash-2025-07-28 と同じパフォーマンスです Qwen3 シリーズ | 安定版 | 1,000,000 | 1,044,480 | 32,768 | 81,920 | 段階的価格設定。表の下の説明を参照してください | |
qwen-flash-2025-07-28 qwen-flash-0728 とも呼ばれます | スナップショット | ||||||
qwen-flash と qwen-flash-2025-07-28 は、各リクエストの入力トークン数に基づいて段階的価格設定を使用します。 qwen-flash は、コンテキストキャッシュをサポートしています。
コンテキストウィンドウ | キャッシュされた入力 (百万トークン) | 入力価格 (百万トークン) | 出力価格 (百万トークン) |
0~128K | $0.009 | $0.022 | $0.216 |
128K~256K | $0.035 | $0.087 | $0.861 |
256K~1M | $0.069 | $0.173 | $1.721 |
Qwen-Turbo
Qwen-Turbo は、高速かつ低コストであり、単純なタスクに適しています。詳細については、「使用方法」または「API リファレンス」をご参照ください。オンラインで試す | 思考モード
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | |||||
qwen-turbo 現在、qwen-turbo-2025-04-28 と同じパフォーマンスです Qwen3 シリーズ | 安定版 | 思考 131,072 非思考 1,000,000 | 思考 98,304 非思考 1,000,000 | 16,384 最大 CoT は 38,912 です | $0.044 | 思考 $0.431 非思考 $0.087 |
qwen-turbo-latest 常に最新のスナップショットと同じパフォーマンスです Qwen3 シリーズ | 最新版 | |||||
qwen-turbo-2025-07-15 qwen-turbo-0715 とも呼ばれます Qwen3 シリーズ | スナップショット | |||||
qwen-turbo-2025-04-28 qwen-turbo-0428 とも呼ばれます Qwen3 シリーズ | ||||||
qwen-turbo-2025-02-11 qwen-turbo-0211 とも呼ばれます | 1,000,000 | 1,000,000 | 8,192 | $0.087 | ||
qwen-turbo-2024-11-01 qwen-turbo-1101 とも呼ばれます | ||||||
qwen-turbo-2024-09-19 qwen-turbo-0919 とも呼ばれます | 131,072 | 129,024 | ||||
最新の qwen-turbo-2025-04-28、qwen-turbo-latest、および qwen-turbo モデルは、思考モードと非思考モードをサポートしており、enable_thinking パラメーターを使用して 2 つのモードを切り替えることができます。これに加えて、モデルの機能が大幅に強化されました。
推論能力:モデルは、数学、コーディング、論理的推論の評価において、QwQ および同規模の非推論モデルを大幅に上回り、その規模で SOTA パフォーマンスに達しました。
人間の好みの追従:クリエイティブライティング、ロールプレイング、複数ターンの会話、指示の追従における能力が大幅に向上し、同規模のモデルの一般的な能力を上回っています。
エージェント機能:モデルは、思考モードと非思考モードの両方で業界をリードするレベルを達成し、正確な外部ツール呼び出しを可能にします。
多言語機能:100 以上の言語と方言をサポートし、多言語翻訳、指示理解、常識推論能力が著しく向上しています。
応答形式の修正:以前のバージョンの応答形式の問題(異常な Markdown、テキスト途中の切り捨て、間違ったボックス出力など)が修正されました。
qwen-turbo-2025-04-28、qwen-turbo-latest、および qwen-turbo モデルの場合、思考モードが有効になっているときに思考プロセスが出力されない場合、料金は非思考モードの価格に基づいて課金されます。
Qwen-Long
Qwen シリーズの中で最も長いコンテキストウィンドウを持つモデルです。バランスの取れた機能と低コストを提供し、長文分析、情報抽出、要約、分類、タグ付けなどのタスクに適しています。使用方法 | オンラインで試す
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万 トークン) | |||||
qwen-long-latest 常に最新のスナップショットと同じパフォーマンス | 安定版 | 10,000,000 | 10,000,000 | 8,192 | $0.072 | $0.287 |
qwen-long-2025-01-25 qwen-long-0125 とも呼ばれます | スナップショット | |||||
Qwen-Omni
Qwen の新しいマルチモーダル理解および生成モデルです。テキスト、画像、音声、動画入力をサポートし、テキストと音声を生成します。4 つの自然な音声オプションを提供します。使用方法 | API リファレンス
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 |
(トークン) | ||||
qwen-omni-turbo 現在、qwen-omni-turbo-2025-03-26 と同じパフォーマンスです。 | 安定版 | 32,768 | 30,720 | 2,048 |
qwen-omni-turbo-latest 常に最新のスナップショットと同じパフォーマンスです。 | 最新版 | |||
qwen-omni-turbo-2025-03-26 qwen-omni-turbo-0326 とも呼ばれます | スナップショット | |||
qwen-omni-turbo-2025-01-19 qwen-omni-turbo-0119 とも呼ばれます | ||||
入力と出力の課金ルールは次のとおりです。
|
| ||||||||||||||
課金の例:リクエストで 1,000 トークンのテキストと 1,000 トークンの画像を入力し、1,000 トークンのテキストと 1,000 トークンの音声を生成します。このリクエストの費用は、$0.000058 (テキスト入力) + $0.000216 (画像入力) + $0.007168 (音声出力) = $0.007442 です。 | |||||||||||||||
Qwen-Omni-Realtime
モデルと価格と比較して、このモデルはストリーミング音声入力をサポートし、ユーザーの音声の開始と終了を自動的に検出する音声アクティビティ検出(VAD)機能を備えています。 使用方法
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 |
(トークン) | ||||
qwen-omni-turbo-realtime 現在 qwen-omni-turbo-2025-05-08 と同じパフォーマンス | 安定版 | 32,768 | 30,720 | 2,048 |
qwen-omni-turbo-realtime-latest 常に最新のスナップショットと同じパフォーマンス | 最新版 | |||
qwen-omni-turbo-realtime-2025-05-08 | スナップショット | |||
入力と出力の課金ルールは次のとおりです。
|
|
QVQ
QVQ は、視覚入力と連鎖的思考出力をサポートする視覚的推論モデルです。 数学、コーディング、視覚分析、創造性、および一般的なタスクにおいて、より強力な機能を発揮します。 使用方法 | オンラインで試す
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大 CoT | 最大応答 | 入力価格 | 出力価格 |
(トークン) | (百万 トークン) | ||||||
qvq-max qvq-plus と比較して、より強力な視覚的推論と指示追従機能を備えており、より複雑なタスクで最適なパフォーマンスを提供します。 現在、qvq-max-2025-03-25 と同じパフォーマンスです。 | 安定版 | 131,072 | 106,496 画像ごとに最大 16,384 | 16,384 | 8,192 | $ 1.147 | $ 4.588 |
qvq-max-latest 常に最新のスナップショットと同じパフォーマンス | 最新 | ||||||
qvq-max-2025-05-15 qvq-max-0515 とも呼ばれます | スナップショット | ||||||
qvq-max-2025-03-25 qvq-max-0325 とも呼ばれます | |||||||
qvq-plus 現在、qvq-plus-2025-05-15 と同じパフォーマンスです。 | 安定版 | $ 0.287 | $ 0.717 | ||||
qvq-plus-latest 常に最新のスナップショットと同じパフォーマンス | 最新 | ||||||
qvq-plus-2025-05-15 qvq-plus-0515 とも呼ばれます | スナップショット | ||||||
Qwen-VL
Qwen-VL は、画像を理解および処理できるテキスト生成モデルです。このモデルは OCR 操作を実行し、要約や推論などのさらなる機能を提供します。たとえば、写真から製品の属性を抽出したり、画像から問題を解決したりできます。使用方法 | API リファレンス | オンラインで試す
Qwen-VL は、入力トークンと出力トークンの合計数に基づいて課金されます。
画像トークンの計算ルール:28 × 28 ピクセルごとに 1 トークンとしてカウントされます。各画像は少なくとも 4 トークンに変換されます。詳細については、「ビジュアル理解 (Qwen-VL)」をご参照ください。
モデル | バージョン | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | |||||
qwen-vl-max qwen-vl-plus と比較して、視覚的推論と指示追従の機能が強化されています。複雑なタスクに最適です。 現在は qwen-vl-max-2025-04-08 と同等の性能です。 | 安定 | 131,072 | 129,024 画像ごとに最大 16,384 まで | 8,192 | $ 0.431 | $ 1.291 |
qwen-vl-max-latest 最新のスナップショットと同じパフォーマンス | 最新 | |||||
qwen-vl-max-2025-04-08 qwen-vl-max-0408 も同様です。 数学的推論機能が強化されました。 | スナップショット | $0.431 | $1.291 | |||
qwen-vl-max-2025-04-02 また qwen-vl-max-0402 複雑な数学の問題を解く精度が大幅に向上しました | ||||||
qwen-vl-max-2025-01-25 qwen-vl-max-0125 も Qwen2.5-VL シリーズにアップグレードされ、128,000 のコンテキストウィンドウと強化された数学および推論機能を備えています | ||||||
qwen-vl-max-2024-12-30 qwen-vl-max-1230 も同様です。 | 32,768 | 30,720 画像ごとに最大 16,384 まで | 2,048 | |||
qwen-vl-max-2024-11-19 qwen-vl-max-1119 も同様です。 | ||||||
qwen-vl-max-2024-10-30 qwen-vl-max-1030 も同様です。 | $2.868 | |||||
qwen-vl-max-2024-08-09 qwen-vl-max-0809 も同様です。 | ||||||
qwen-vl-plus 現在、qwen-vl-plus-2025-05-07 と同じパフォーマンスです | 安定 | 131,072 | 129,024 画像ごとに最大 16,384 | 8,192 | $ 0.216 | $ 0.646 |
qwen-vl-plus-latest 最新のスナップショットと同じパフォーマンス | 最新 | $0.216 | $0.646 | |||
qwen-vl-plus-2025-07-10 qwen-vl-plus-0710 も 監視ビデオコンテンツの理解をさらに向上 | 32,768 | 30,720 画像ごとに最大 16,384 | $0.022 | $0.216 | ||
qwen-vl-plus-2025-05-07 qwen-vl-plus-0507 も 監視ビデオコンテンツの数学、推論、および理解が大幅に向上 | スナップショット | 131,072 | 129,024 画像ごとに最大 16,384 | $0.216 | $0.646 | |
qwen-vl-plus-2025-01-25 また qwen-vl-plus-0125 Qwen2.5-VL シリーズにアップグレードされ、128,000 のコンテキストウィンドウと強化された数学および推論機能を備えています。 | ||||||
qwen-vl-plus-2025-01-02 qwen-vl-plus-0102 も同様です。 | 32,768 | 30,720 イメージあたり最大 16,384 | 2,048 | |||
qwen-vl-plus-2024-08-09 qwen-vl-plus-0809 も同様です。 | ||||||
Qwen-OCR
Qwen-OCR は、テキスト抽出に特化したモデルです。 Qwen-VL と比較して、ドキュメント、表、試験問題、手書きなど、画像からのテキスト抽出により重点を置いています。 英語、フランス語、日本語、韓国語、ドイツ語、ロシア語、イタリア語など、複数の言語を検出できます。 使用方法 | API リファレンス | オンライン試用
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力/出力価格 |
(トークン) | (百万 トークン) | ||||
qwen-vl-ocr 現在、 qwen-vl-ocr-2025-04-13 と同じパフォーマンスです。 | 安定版 | 34,096 | 30,000 画像ごとに最大 30,000 まで | 4,096 | $0.717 |
qwen-vl-ocr-latest 常に最新のスナップショットと同じパフォーマンスです。 | 最新版 | ||||
qwen-vl-ocr-2025-04-13 qwen-vl-ocr-0413 とも呼ばれます。 テキスト認識機能が大幅に向上し、6 つの OCR タスクが組み込まれており、カスタムプロンプトや画像回転補正などの機能が備わっています。 | スナップショット | ||||
qwen-vl-ocr-2024-10-28 qwen-vl-ocr-1028 とも呼ばれます。 | スナップショット | ||||
Qwen-Math
Qwen-Math モデルは、数学の問題を解くために特別に設計された言語モデルです。使用方法 | API リファレンス | オンラインで試す
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万 トークン) | |||||
qwen-math-plus 現在、qwen-math-plus-2024-09-19 と同じパフォーマンスです。 | 安定版 | 4,096 | 3,072 | 3,072 | $0.574 | $1.721 |
qwen-math-plus-latest 常に最新のスナップショットと同じパフォーマンスです。 | 最新版 | |||||
qwen-math-plus-2024-09-19 qwen-math-plus-0919 とも呼ばれます | スナップショット | |||||
qwen-math-plus-2024-08-16 qwen-math-plus-0816 とも呼ばれます | ||||||
qwen-math-turbo 現在、qwen-math-turbo-2024-09-19 と同じパフォーマンスです。 | 安定版 | $0.287 | $0.861 | |||
qwen-math-turbo-latest 常に最新のスナップショットと同じパフォーマンスです。 | 最新版 | |||||
qwen-math-turbo-2024-09-19 qwen-math-turbo-0919 とも呼ばれます | スナップショット | |||||
Qwen-Coder
Qwen シリーズのコーダーモデルです。最新の Qwen3-Coder シリーズは Qwen3 をベースにしており、強力なコーディングエージェント機能を誇ります。ツール呼び出しや環境との対話に優れ、自律的なプログラミングが可能です。卓越したコーディング能力を発揮する一方で、強力な汎用機能も維持しています。 使用方法 | API リファレンス | オンラインで試す
商用モデル
Qwen3-Coder
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万 トークン) | |||||
qwen3-coder-plus qwen3-coder-plus-2025-07-22 と同じパフォーマンス | 安定版 | 1,000,000 | 997,952 | 65,536 | 段階的価格設定が使用されます。表の下の説明を参照してください。 | |
qwen3-coder-plus-2025-07-22 | スナップショット | |||||
qwen3-coder-flash qwen3-coder-flash-2025-07-28 と同じパフォーマンス | 安定版 | |||||
qwen3-coder-flash-2025-07-28 | スナップショット | |||||
上記のモデルは、各リクエストの入力トークン数に基づいて段階的課金を使用します。
入力トークン数 | 入力価格 (百万 トークン) | 出力価格 (百万 トークン) | キャッシュされた 入力トークン の価格 (百万 トークン) |
0~32K | $0.574 | $2.294 | $0.23 |
32K~128K | $0.861 | $3.441 | $0.345 |
128K~256K | $1.434 | $5.735 | $0.574 |
256K~1M | $2.868 | $28.671 | $1.147 |
qwen3-coder-plus-2025-07-22 はコンテキスト キャッシュをサポートしていません。価格は次のとおりです。
入力トークン数 | 入力価格 (百万 トークン) | 出力価格 (百万 トークン) |
0~32K | $0.574 | $2.294 |
32K~128K | $0.861 | $3.441 |
128K~256K | $1.434 | $5.735 |
256K~1M | $2.868 | $28.671 |
qwen3-coder-flash の価格は次のとおりです。
入力トークン数 | 入力価格 (百万 トークン) | 出力価格 (百万 トークン) | キャッシュされた 入力トークン の価格 (百万 トークン) |
0~32K | $0.144 | $0.574 | $0.058 |
32K~128K | $0.216 | $0.861 | $0.087 |
128K~256K | $0.359 | $1.434 | $0.144 |
256K~1M | $0.717 | $3.584 | $0.287 |
qwen3-coder-flash-2025-07-28 はコンテキスト キャッシュをサポートしていません。価格は次のとおりです。
入力トークン数 | 入力価格 (百万 トークン) | 出力価格 (百万 トークン) |
0~32K | $0.144 | $0.574 |
32K~128K | $0.216 | $0.861 |
128K~256K | $0.359 | $1.434 |
256K~1M | $0.717 | $3.584 |
Qwen-Coder (以前のバージョン)
モデル | バージョン | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万 トークン) | |||||
qwen-coder-plus qwen-coder-plus-2024-11-06 と同じパフォーマンス | 安定版 | 131,072 | 129,024 | 8,192 | $0.502 | $1.004 |
qwen-coder-plus-latest qwen-coder-plus の最新スナップショットと同じパフォーマンス | 最新 | |||||
qwen-coder-plus-2024-11-06 qwen-coder-plus-1106 とも呼ばれます | スナップショット | |||||
qwen-coder-turbo qwen-coder-turbo-2024-09-19 と同じパフォーマンス | 安定版 | 131,072 | 129,024 | 8,192 | $0.287 | $0.861 |
qwen-coder-turbo-latest qwen-coder-turbo の最新スナップショットと同じパフォーマンス | 最新 | |||||
qwen-coder-turbo-2024-09-19 qwen-coder-turbo-0919 とも呼ばれます | スナップショット | |||||
Qwen-MT
Qwen 3 をベースにアップグレードされ、92 言語 (中国語、英語、日本語、韓国語、フランス語、スペイン語、ドイツ語、タイ語、インドネシア語、ベトナム語、アラビア語など) 間の翻訳をサポートする、機械翻訳向けのフラッグシップ LLM です。モデル性能と翻訳品質は全面的に向上し、より安定した用語カスタマイズ、フォーマット保持、ドメイン固有の機能を提供します。使用方法 | オンラインで試す
モデル | [コンテキスト ウィンドウ] | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | ||||
qwen-mt-plus Qwen3-MT | 4,096 | 2,048 | 2,048 | $0.259 | $0.775 |
qwen-mt-turbo Qwen3-MT | $0.101 | $0.280 | |||
オープンソースモデル
テキスト生成 - Qwen - オープンソース
モデル名において、「xxb」はパラメータスケールを示します。たとえば、「qwen2-72b-instruct」には 720億のパラメータがあります。
Model Studio では、ローカルデプロイメントを必要とせずに、オープンソースの Qwen モデルを簡単に使用できます。オープンソースモデルの中で、Qwen3 と Qwen2.5 が最も推奨されます。
Qwen3
2025年 7月にリリースされた qwen3-235b-a22b-thinking-2507 は、思考モードのみをサポートし、qwen3-235b-a22b(思考モード)のアップグレードバージョンです。
2025年 7月にリリースされた qwen3-235b-a22b-instruct-2507 は、非思考モードのみをサポートし、qwen3-235b-a22b(非思考モード)のアップグレードバージョンです。
2025年 7月にリリースされた qwen3-30b-a3b-thinking-2507 は、思考モードのみをサポートし、qwen3-30b-a3b(思考モード)のアップグレードバージョンです。
2025年 7月にリリースされた qwen3-30b-a3b-instruct-2507 は、非思考モードのみをサポートし、qwen3-30b-a3b(非思考モード)のアップグレードバージョンです。
2025年 4月にリリースされた Qwen3 モデルは、思考モードと非思考モードの両方をサポートしています。enable_thinking パラメータを使用して、2つのモードを切り替えることができます。さらに、Qwen3 モデルの機能が大幅に改善されました。
推論機能:このモデルは、数学、コーディング、論理的推論の評価において、QwQ および同規模の非推論モデルを大幅に上回り、同規模で SOTA パフォーマンスに達しています。
人間のプリファレンスへの追従:クリエイティブライティング、ロールプレイング、複数ターンの会話、指示への追従における能力が大幅に向上し、同規模のモデルの一般的な能力を上回っています。
エージェント機能:このモデルは、思考モードと非思考モードの両方で業界をリードするレベルを実現し、正確な外部ツール呼び出しを可能にします。
多言語機能:このモデルは 100以上の言語と方言をサポートしており、多言語翻訳、指示の理解、常識的推論能力が著しく向上しています。
応答フォーマットの修正:以前のバージョンの応答フォーマットの問題(異常な Markdown、テキスト途中の切り捨て、間違ったボックス出力など)が修正されました。
Qwen3 オープンソースモデルは、思考モードでの非ストリーミング出力をサポートしていません。
思考モード | 非思考モード | API リファレンス
モデル | モード | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大応答 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | ||||||
qwen3-235b-a22b-thinking-2507 | 思考のみ | 131,072 | 126,976 | 81,920 | 32,768 | $0.287 | $2.868 |
qwen3-235b-a22b-instruct-2507 | 非思考のみ | 129,024 | - | $1.147 | |||
qwen3-30b-a3b-thinking-2507 | 思考のみ | 126,976 | 81,920 | $0.108 | $1.076 | ||
qwen3-30b-a3b-instruct-2507 | 非思考のみ | 129,024 | - | $0.431 | |||
qwen3-235b-a22b | 非思考 | 129,024 | - | 16,384 | $0.287 | $1.147 | |
思考 | 98,304 | 38,912 | $2.868 | ||||
qwen3-32b | 非思考 | 129,024 | - | $0.287 | $1.147 | ||
思考 | 98,304 | 38,912 | $2.868 | ||||
qwen3-30b-a3b | 非思考 | 129,024 | - | $0.108 | $0.431 | ||
思考 | 98,304 | 38,912 | $1.076 | ||||
qwen3-14b | 非思考 | 129,024 | - | 8,192 | $0.144 | $0.574 | |
思考 | 98,304 | 38,912 | $1.434 | ||||
qwen3-8b | 非思考 | 129,024 | - | $0.072 | $0.287 | ||
思考 | 98,304 | 38,912 | $0.717 | ||||
qwen3-4b | 非思考 | 129,024 | - | $0.044 | $0.173 | ||
思考 | 98,304 | 38,912 | $0.431 | ||||
qwen3-1.7b | 非思考 | 32,768 | 30,720 | - | $0.173 | ||
思考 | 28,672 | 入力 + CoT は 30,720を超えることはできません | $0.431 | ||||
qwen3-0.6b | 非思考 | 30,720 | - | $0.173 | |||
思考 | 28,672 | 入力 + CoT は 30,720を超えることはできません | $0.431 | ||||
Qwen3 モデルの場合、思考モードが有効になっているときに思考プロセスが出力されない場合、料金は非思考モードの価格に基づいて課金されます。
QwQ - オープンソース
QwQ 推論モデルは、Qwen2.5-32B モデルに基づいてトレーニングされており、強化学習によって推論機能が大幅に改善されています。数学とコード(AIME 24/25 と LiveCodeBench)などのモデルのコアメトリック、およびいくつかの一般的なメトリック(IFEval や LiveBench など)は、DeepSeek-R2 のフルパワーバージョンのレベルに達しています。すべてのメトリックは、同じく Qwen2.5-32B に基づく DeepSeek-R1-Distill-Qwen-32B のメトリックを大幅に上回っています。 使用方法 | API リファレンス
モデル | コンテキストウィンドウ | 最大入力 | 最大 CoT | 最大応答 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | |||||
qwq-32b | 131,072 | 98,304 | 32,768 | 8,192 | $0.287 | $0.861 |
QwQ-Preview
qwq-32b-preview は、Qwen チームが 2024年に開発した実験的な研究モデルであり、AI 推論機能、特に数学とプログラミングの分野における機能強化に重点を置いています。 qwq-32b-preview モデルの制限事項の詳細については、「QwQ 公式ブログ」をご参照ください。 使用方法 | API リファレンス | オンラインで試す
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | ||||
qwq-32b-preview | 32,768 | 30,720 | 16,384 | $0.287 | $0.861 |
Qwen2.5
Qwen2.5 は、Qwen LLM のシリーズです。 Qwen2.5 では、70億から 720億のパラメータサイズを持つ一連のベースモデルとインストラクトモデルをリリースしました。 Qwen2.5 は、Qwen2 に対して以下の点が改善されています。
Qwen2.5 は、18兆トークンを含む最新のラージスケールデータセットで事前トレーニングされています。
特定分野のエキスパートモデルのおかげで、Qwen2.5 は知識が大幅に増加し、コーディングと数学の能力が大幅に向上しています。
Qwen2.5 は、指示への追従、長いテキスト(8K トークン以上)の生成、構造化データ(表など)の理解、構造化出力(特に JSON)の生成において大幅な改善を示しています。より多様なシステムプロンプトをサポートしており、チャットボットとしてのロールプレイングと条件設定が強化されています。
Qwen2.5 は、中国語、英語、フランス語、スペイン語、ポルトガル語、ドイツ語、イタリア語、ロシア語、日本語、韓国語、ベトナム語、タイ語、アラビア語など、29以上の言語をサポートしています。
使用方法 | API リファレンス | オンラインで試す
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | ||||
qwen2.5-14b-instruct-1m | 1,000,000 | 1,000,000 | 8,192 | $0.144 | $0.431 |
qwen2.5-7b-instruct-1m | $0.072 | $0.144 | |||
qwen2.5-72b-instruct | 131,072 | 129,024 | $0.574 | $1.721 | |
qwen2.5-32b-instruct | $0.287 | $0.861 | |||
qwen2.5-14b-instruct | $0.144 | $0.431 | |||
qwen2.5-7b-instruct | $0.072 | $0.144 | |||
qwen2.5-3b-instruct | 32,768 | 30,720 | $0.044 | $0.130 | |
qwen2.5-1.5b-instruct | 期間限定無料 | ||||
qwen2.5-0.5b-instruct | |||||
QVQ - オープンソース
qvq-72b-preview は、Qwen チームが開発した実験的な研究モデルであり、視覚的推論機能、特に数学的推論の分野における改善に重点を置いています。 qvq-72b-preview モデルの制限事項の詳細については、「QVQ 公式ブログ」をご参照ください。 使用方法 | API リファレンス
思考プロセスを回答の前に出力させたい場合は、商用 QVQ モデルを使用してください。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | ||||
qvq-72b-preview | 32,768 | 16,384 画像ごとに最大 16,384 | 16,384 | $ 1.721 | $ 5.161 |
Qwen-Omni - オープンソース
Qwen-Omni は、Qwen2.5 でトレーニングされたオムニモーダル理解および生成モデルです。テキスト、画像、音声、動画を迅速に理解できます。また、テキストと音声をストリームで同時に生成することもできます。使用方法 | API リファレンス
モデル | コンテキスト ウィンドウ | 最大入力 | 最大出力 |
(トークン) | |||
qwen2.5-omni-7b | 32,768 | 30,720 | 2,048 |
オープンソースモデルの入力と出力の課金ルールは次のとおりです。
|
| ||||||||||||||
課金の例: リクエストで 1,000 トークンのテキストと 1,000 トークンの画像を入力し、1,000 トークンのテキストと 1,000 トークンの音声を出力します。このリクエストの費用は、$0.000087 (テキスト入力) + $0.000287 (画像入力) + $0.010895 (音声出力) です。 | |||||||||||||||
Qwen-VL - オープンソース
Qwen-VL のオープンソースバージョン。使用方法 | API リファレンス
Qwen2.5-VL は、Qwen2-VL に対して以下の改善を行いました。
より豊かな世界の認識: Qwen2.5-VL は、花、鳥、魚、昆虫などの一般的なオブジェクトを認識するだけでなく、画像内のテキスト、チャート、アイコン、グラフィック、レイアウトを分析することも得意としています。
長い動画の理解: Qwen2.5-VL は、最大 10 分の動画を理解できます。また、動画のセグメントを特定してイベントを捉えることもできます。
視覚的な位置特定: Qwen2.5-VL は、バウンディングボックス(左上隅と右下隅の座標)またはポイント(バウンディングボックスの中心の座標)を生成することで、画像内のオブジェクトを正確に特定できます。これらの座標に対して安定した JSON 出力を提供できます。
構造化出力: Qwen2.5-VL は、請求書、フォーム、表などのデータの構造化出力をサポートしており、金融、ビジネスなどのシナリオに適しています。
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | ||||
qwen2.5-vl-72b-instruct | 131,072 | 129,024 画像ごとに最大 16,384 | 8,192 | $ 2.294 | $ 6.881 |
qwen2.5-vl-32b-instruct | $ 1.147 | $ 3.441 | |||
qwen2.5-vl-7b-instruct | $ 0.287 | $ 0.717 | |||
qwen2.5-vl-3b-instruct | $ 0.173 | $ 0.517 | |||
qwen2-vl-72b-instruct | 32,768 | 30,720 画像ごとに最大 16,384 | 2,048 | $ 2.294 | $ 6.881 |
qwen2-vl-7b-instruct | 32,000 | 30,000 画像ごとに最大 16,384 | 2,000 | 期間限定で無料 | |
qwen2-vl-2b-instruct | |||||
Qwen-Math - オープンソース
数学的問題解決に特化した Qwen モデルです。Qwen2.5-Math は、中国語と英語をサポートし、思考の連鎖 (CoT)、思考のプログラム (PoT)、ツール統合推論 (TIR) など、複数の推論方法を統合しています。使用方法 | API リファレンス | オンラインで試す
モデル | コンテキスト ウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万 トークン) | ||||
qwen2.5-math-72b-instruct | 4,096 | 3,072 | 3,072 | $ 0.574 | $ 1.721 |
qwen2.5-math-7b-instruct | $ 0.144 | $ 0.287 | |||
qwen2.5-math-1.5b-instruct | 期間限定 無料 | ||||
Qwen-Coder - オープンソース
Qwen シリーズのオープンソースコーダーモデルです。最新の qwen3-coder-480b-a35b-instruct は Qwen3 をベースとしています。強力なコーディングエージェント機能を備え、ツール呼び出しと環境インタラクションに優れ、自律プログラミングが可能です。卓越したコーディング能力を発揮する一方で、強力な汎用機能も維持しています。使用方法 | API リファレンス | オンラインで試す
オープンソースモデル
モデル | コンテキストウィンドウ | 最大入力 | 最大出力 | 入力価格 | 出力価格 |
(トークン) | (百万トークン) | ||||
qwen3-coder-480b-a35b-instruct | 262,144 | 204,800 | 65,536 | 段階的価格設定が使用されます。表の下の説明を参照してください。 | |
qwen3-coder-30b-a3b-instruct | |||||
qwen2.5-coder-32b-instruct | 131,072 | 129,024 | 8,192 | $0.287 | $0.861 |
qwen2.5-coder-14b-instruct | |||||
qwen2.5-coder-7b-instruct | $0.144 | $0.287 | |||
qwen2.5-coder-3b-instruct | 32,768 | 30,720 | 期間限定無料トライアル | ||
qwen2.5-coder-1.5b-instruct | |||||
qwen2.5-coder-0.5b-instruct | |||||
qwen3-coder-480b-a35b-instruct と qwen3-coder-30b-a3b-instruct は、各リクエストの入力トークン数に基づいて段階的課金を使用します。
モデル | 入力トークン数 | 入力価格 (百万トークン) | 出力価格 (百万トークン) |
qwen3-coder-480b-a35b-instruct | 0~32K | $0.861 | $3.441 |
32K~128K | $1.291 | $5.161 | |
128K~200K | $2.151 | $8.602 | |
qwen3-coder-30b-a3b-instruct | 0~32K | $0.216 | $0.861 |
32K~128K | $0.323 | $1.291 | |
128K~200K | $0.538 | $2.151 |
レート制限
モデルのレート制限の詳細については、「レート制限」をご参照ください。