Alibaba Cloud Model Studio は、Alibaba Cloud アカウントレベルでモデル呼び出しにレート制限を適用し、アカウント配下のすべての RAM ユーザー、ワークスペース、API キーの使用量を集計します。制限を超えるとリクエストは拒否されますが、通常は 1 分以内に自動的に回復します。
レート制限のルール
-
アカウントレベルのレート制限:レート制限はルートアカウントレベルで適用されます。アカウント配下のすべての RAM ユーザー、ワークスペース、API キーの使用量が合算されます。
-
モデル固有のレート制限:各モデルには独自のレート制限があります。詳細については、以下の表をご参照ください。
よくある質問
レート制限がトリガーされる原因
エラーメッセージに基づいてトリガーされたレート制限の種類を特定できます:
-
Requests rate limit exceededまたはYou exceeded your current requests list:これは、1 分あたりのリクエスト数 (RPM) の制限がトリガーされたことを示します。 -
Allocated quota exceededまたはYou exceeded your current quota:これは、1 分あたりのトークン数 (TPM) の制限がトリガーされたことを示します。 -
Request rate increased too quickly:短時間でリクエスト頻度が急増し、システムの安定性保護がトリガーされました。これは、呼び出しの総数が RPM または TPM の制限に達していない場合でも発生する可能性があります。 -
その他のエラーについては、「エラーコード」をご参照ください。
RPM と TPM に加えて、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) の秒単位レベルでレート制限が適用される場合があります。1 分あたりの呼び出し総数が制限を超えていなくても、短時間のリクエストのバーストによってレート制限がトリガーされる可能性があります。
モデル使用量の確認方法
モデルを呼び出してから 1 時間後に、モニタリング (シンガポール または 北京) ページに移動します。時間範囲やワークスペースなどのクエリ条件を設定します。次に、[モデル] エリアで対象のモデルを見つけ、[操作] 列の [モニター] をクリックして、モデルの呼び出し統計を表示します。詳細については、「モニタリング」ドキュメントをご参照ください。
データは 1 時間ごとに更新されます。ピーク時には、1 時間レベルの遅延が発生する場合があります。

レート制限からの回復時間
通常、回復は 1 分以内に完了します。その他のエラーが発生した場合は、「エラーコード」でトラブルシューティングをご参照ください。
レート制限を回避する方法
-
より高いレート制限を持つモデルの選択:安定版または最新バージョンは、古いスナップショットバージョンよりもレート制限が高くなっています。
-
呼び出し戦略の最適化
-
呼び出し頻度の削減:
Requests rate limit exceededまたはYou exceeded your current requests listエラーが発生した場合は、API の呼び出し頻度を下げてください。 -
トークン消費量の削減:
Allocated quota exceededまたはYou exceeded your current quotaエラーが発生した場合は、入力を短くするか、出力長を制限してください。 -
リクエストレートの平滑化:
Request rate increased too quicklyエラーが発生した場合は、均一スケジューリング、指数バックオフ、またはリクエストキューを使用してリクエストを均等に分散させ、突然のピークを回避してください。
-
-
バックアップモデルの追加
レート制限がトリガーされた場合、バックアップモデルに切り替えて生成を継続できます。これにより、失敗の確率を低減し、スループットを向上させることができます。以下のコードは、
qwen-plus-2025-07-28のレート制限がトリガーされた後、qwen-plus-2025-07-14で自動的にリトライします。 -
タスクの分割:長い会話や大きなドキュメントは、すぐに多くのトークンを消費する可能性があります。大きなバッチタスクをより小さなバッチに分割し、異なる時間に送信することができます。
-
バッチ推論の使用:リアルタイムの応答を必要としないタスクには、バッチ API を使用できます。バッチリクエストはリアルタイムのレート制限の対象外ですが、キューイングと処理時間を考慮する必要があります。
-
レート制限の引き上げ:デフォルトのレート制限が不十分な場合は、Model Studio コンソールの [レート制限の引き上げ] ページでモデルの一時的な TPM クォータを引き上げることができます。この引き上げはすぐに有効になります。詳細については、「一時的なレート制限の引き上げ」をご参照ください。
トークン使用量またはコストの管理方法
レート制限は単位時間あたりのリクエストレートを制限するだけで、累積使用量の上限を設定するものではありません。トークン使用量やコストを管理するには、以下の方法を使用します:
-
利用上限とコストアラートの設定:[請求] カードで [コストアラート] を設定し、月間の利用上限としきい値の通知を有効にします。しきい値に達すると通知され、過剰な支出を回避するのに役立ちます。詳細については、「請求書の照会とコストの管理」をご参照ください。
-
無料クォータを使い切った場合に停止を有効にする:無料クォータを提供するモデルの場合、[無料クォータを使い切った場合に停止] を有効にすると、無料クォータが使い果たされると自動的に呼び出しが停止し、追加料金の発生を防ぎます。詳細については、「無料クォータ」をご参照ください。
-
モデル使用量のモニタリング:各モデルのトークン使用量を定期的に確認し、異常な増加を早期に検出します。上記の「モデル使用量の確認方法」をご参照ください。
一時的なレート制限の引き上げ
デフォルトのレート制限が不十分な場合、Model Studio コンソールでモデルの一時的な TPM クォータを引き上げることができます。この引き上げはすぐに有効になり、30 日間有効です。有効期間が切れると、クォータは自動的にシステムのデフォルト値に戻ります。
この機能は現在、中国 (北京) およびシンガポールリージョンで利用可能です。
-
Model Studio コンソールにログインし、レート制限の引き上げ ページに移動します。
-
右上隅の[一時的なモデルレート制限の引き上げ]をクリックします。
-
表示されるダイアログボックスで、[モデル] を選択し、[トークンアカウント制限 (トークン/60秒)] に希望の値を入力します。ダイアログボックスには、現在のクォータと設定可能な最大値が表示されます。
-
[OK] をクリックします。引き上げられたクォータはすぐに有効になります。
クォータの引き上げが有効になった後、以下の方法で確認できます:
-
レート制限の引き上げ ページで、クォータが引き上げられたモデルとそれに対応するレート制限データをリストで表示します。
-
モデルリスト で、対応するモデルの詳細ページに移動し、更新されたレート制限データを表示します。
-
一時的にクォータを引き上げることができるモデルは、レート制限の引き上げ ページのダイアログボックスにリストされています。
-
すでにクォータが引き上げられているモデルに対して再度リクエストを送信すると、新しい申請と見なされ、有効期間は 30 日間にリセットされます。
-
実際のニーズに基づいてクォータをリクエストしてください。プロビジョニング済み容量が長期間にわたって実際の使用量を大幅に上回る場合、システムは事前の通知後にデフォルト値に復元することがあります。
テキスト生成 - Qwen
Qwen 言語モデル
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.7-max |
インターナショナル |
600 |
1,000,000 |
|
qwen3.7-max-2026-06-08 |
インターナショナル |
60 |
1,000,000 |
|
qwen3.7-max-2026-05-20 |
インターナショナル |
60 |
1,000,000 |
|
qwen3.7-max-preview |
インターナショナル |
600 |
1,000,000 |
|
qwen3.7-max-2026-05-17 |
インターナショナル |
600 |
1,000,000 |
|
qwen3.6-max-preview |
インターナショナル |
600 |
1,000,000 |
|
qwen3-max |
インターナショナル |
600 |
1,000,000 |
|
qwen3-max-2026-01-23 |
インターナショナル |
600 |
1,000,000 |
|
qwen3-max-2025-09-23 |
インターナショナル |
60 |
100,000 |
|
qwen3-max-preview |
インターナショナル |
600 |
1,000,000 |
|
qwen-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
インターナショナル |
600 |
1,000,000 |
|
qwen3.7-plus |
インターナショナル |
15,000 |
5,000,000 |
|
qwen3.7-plus-2026-05-26 |
インターナショナル |
60 |
1,000,000 |
|
qwen3.6-plus |
インターナショナル |
15,000 |
5,000,000 |
|
qwen3.6-plus-2026-04-02 |
インターナショナル |
60 |
1,000,000 |
|
qwen3.6-flash |
インターナショナル |
15,000 |
5,000,000 |
|
qwen3.6-flash-2026-04-16 |
インターナショナル |
60 |
1,000,000 |
|
qwen3.5-plus |
インターナショナル |
15,000 |
6,000,000 |
|
qwen3.5-plus-2026-04-20 |
インターナショナル |
600 |
1,000,000 |
|
qwen3.5-plus-2026-02-15 |
インターナショナル |
60 |
1,000,000 |
|
qwen-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
インターナショナル |
600 |
1,500,000 |
|
qwen-plus-latest |
インターナショナル |
600 |
1,000,000 |
|
qwen-plus-2025-12-01 |
インターナショナル |
120 |
1,000,000 |
|
qwen-plus-2025-09-11 |
インターナショナル |
120 |
1,000,000 |
|
qwen-plus-2025-07-28 |
インターナショナル |
60 |
100,000 |
|
qwen-plus-2025-07-14 (qwen-plus-0714) |
インターナショナル |
60 |
100,000 |
|
qwen-plus-2025-04-28 (qwen-plus-0428) |
インターナショナル |
60 |
1,000,000 |
|
qwen-plus-2025-01-25 (qwen-plus-0125) |
インターナショナル |
60 |
100,000 |
|
qwen3.5-flash |
インターナショナル |
15,000 |
5,000,000 |
|
qwen3.5-flash-2026-02-23 |
インターナショナル |
60 |
1,000,000 |
|
qwen-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
インターナショナル |
600 |
5,000,000 |
|
qwen-flash-2025-07-28 |
インターナショナル |
600 |
5,000,000 |
|
qwq-plus |
インターナショナル |
60 |
100,000 |
|
qwen-turbo レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
インターナショナル |
600 |
5,000,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.7-max |
グローバル |
30,000 |
5,000,000 |
|
qwen3.7-max-2026-06-08 |
グローバル |
600 |
1,000,000 |
|
qwen3.7-max-2026-05-20 |
グローバル |
600 |
1,000,000 |
|
qwen3-max |
グローバル |
600 |
1,000,000 |
|
qwen3-max-preview |
グローバル |
600 |
1,000,000 |
|
qwen3-max-2025-09-23 |
グローバル |
60 |
100,000 |
|
qwen3.7-plus |
グローバル |
30,000 |
5,000,000 |
|
qwen3.7-plus-2026-05-26 |
グローバル |
600 |
1,000,000 |
|
qwen3.6-plus |
グローバル |
30,000 |
5,000,000 |
|
qwen3.6-plus-2026-04-02 |
グローバル |
600 |
1,000,000 |
|
qwen3.6-flash |
グローバル |
15,000 |
5,000,000 |
|
qwen3.6-flash-2026-04-16 |
グローバル |
60 |
1,000,000 |
|
qwen3.5-plus |
グローバル |
30,000 |
5,000,000 |
|
qwen3.5-plus-2026-02-15 |
グローバル |
600 |
1,000,000 |
|
qwen-plus |
グローバル |
15,000 |
5,000,000 |
|
qwen-plus-us |
米国 |
600 |
1,000,000 |
|
qwen-plus-2025-12-01 |
グローバル |
60 |
1,000,000 |
|
qwen-plus-2025-09-11 |
グローバル |
60 |
1,000,000 |
|
qwen-plus-2025-07-28 |
グローバル |
60 |
1,000,000 |
|
qwen-plus-2025-12-01-us |
米国 |
60 |
1,000,000 |
|
qwen3.5-flash |
グローバル |
30,000 |
10,000,000 |
|
qwen3.5-flash-2026-02-23 |
グローバル |
600 |
1,000,000 |
|
qwen-flash |
グローバル |
15,000 |
10,000,000 |
|
qwen-flash-us |
米国 |
600 |
5,000,000 |
|
qwen-flash-2025-07-28 |
グローバル |
60 |
1,000,000 |
|
qwen-flash-2025-07-28-us |
米国 |
600 |
5,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.7-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
30,000 |
5,000,000 |
|
qwen3.7-max-2026-06-08 |
中国本土 |
600 |
1,000,000 |
|
qwen3.7-max-2026-05-20 |
中国本土 |
600 |
1,000,000 |
|
qwen3.6-max-preview |
中国本土 |
600 |
1,000,000 |
|
qwen3-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
30,000 |
5,000,000 |
|
qwen3-max-2026-01-23 |
中国本土 |
600 |
1,000,000 |
|
qwen3-max-2025-09-23 |
中国本土 |
60 |
100,000 |
|
qwen3-max-preview |
中国本土 |
600 |
1,000,000 |
|
qwen-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
1,200 |
1,000,000 |
|
qwen3.7-plus |
中国本土 |
30,000 |
5,000,000 |
|
qwen3.7-plus-2026-05-26 |
中国本土 |
600 |
1,000,000 |
|
qwen3.6-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
30,000 |
5,000,000 |
|
qwen3.6-plus-2026-04-02 |
中国本土 |
600 |
1,000,000 |
|
qwen3.6-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
30,000 |
10,000,000 |
|
qwen3.6-flash-2026-04-16 |
中国本土 |
600 |
1,000,000 |
|
qwen3.5-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
30,000 |
5,000,000 |
|
qwen3.5-plus-2026-04-20 |
中国本土 |
600 |
1,000,000 |
|
qwen3.5-plus-2026-02-15 |
中国本土 |
600 |
1,000,000 |
|
qwen-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
30,000 |
5,000,000 |
|
qwen-plus-latest レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
15,000 |
1,200,000 |
|
qwen-plus-2025-12-01 |
中国本土 |
120 |
1,000,000 |
|
qwen-plus-2025-09-11 |
中国本土 |
60 |
1,000,000 |
|
qwen-plus-2025-07-28 (qwen-plus-0728) |
中国本土 |
60 |
1,000,000 |
|
qwen-plus-2025-07-14 (qwen-plus-0714) |
中国本土 |
60 |
100,000 |
|
qwen-plus-2025-04-28 (qwen-plus-0428) |
中国本土 |
60 |
1,000,000 |
|
qwen-plus-2025-01-25 (qwen-plus-0125) |
中国本土 |
60 |
150,000 |
|
qwen-plus-2025-01-12 (qwen-plus-0112) |
中国本土 |
60 |
150,000 |
|
qwen-plus-2024-12-20 (qwen-plus-1220) |
中国本土 |
60 |
150,000 |
|
qwen3.5-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
30,000 |
10,000,000 |
|
qwen3.5-flash-2026-02-23 |
中国本土 |
600 |
1,000,000 |
|
qwen-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
30,000 |
10,000,000 |
|
qwen-flash-2025-07-28 |
中国本土 |
60 |
1,000,000 |
|
qwq-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
600 |
1,000,000 |
|
qwen-turbo |
中国本土 |
1,200 |
5,000,000 |
|
qwen-long-latest レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
1,200 |
60,000 |
|
qwen-long-2025-01-25 (qwen-long-0125) |
中国本土 |
3 |
7,500 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.7-max |
グローバル |
30,000 |
5,000,000 |
|
qwen3.7-max-2026-06-08 |
グローバル |
600 |
1,000,000 |
|
qwen3.7-max-2026-05-20 |
グローバル |
600 |
1,000,000 |
|
qwen3-max |
グローバル |
600 |
1,000,000 |
|
qwen3-max |
EU |
600 |
1,000,000 |
|
qwen3-max-preview |
グローバル |
600 |
1,000,000 |
|
qwen3-max-2026-01-23 |
EU |
600 |
1,000,000 |
|
qwen3-max-2025-09-23 |
グローバル |
60 |
100,000 |
|
qwen3.7-plus |
グローバル |
30,000 |
5,000,000 |
|
qwen3.7-plus-2026-05-26 |
グローバル |
600 |
1,000,000 |
|
qwen3.6-plus |
グローバル |
30,000 |
5,000,000 |
|
qwen3.6-plus-2026-04-02 |
グローバル |
600 |
1,000,000 |
|
qwen3.6-flash |
グローバル |
15,000 |
5,000,000 |
|
qwen3.6-flash-2026-04-16 |
グローバル |
60 |
1,000,000 |
|
qwen3.5-plus |
グローバル |
30,000 |
5,000,000 |
|
qwen3.5-plus-2026-02-15 |
グローバル |
600 |
1,000,000 |
|
qwen-plus |
グローバル |
15,000 |
5,000,000 |
|
qwen-plus |
EU |
600 |
1,000,000 |
|
qwen-plus-2025-12-01 |
グローバル |
60 |
1,000,000 |
|
qwen-plus-2025-12-01 |
EU |
120 |
1,000,000 |
|
qwen-plus-2025-09-11 |
グローバル |
60 |
1,000,000 |
|
qwen-plus-2025-07-28 |
グローバル |
60 |
1,000,000 |
|
qwen3.5-flash |
グローバル |
30,000 |
10,000,000 |
|
qwen3.5-flash |
EU |
30,000 |
10,000,000 |
|
qwen3.5-flash-2026-02-23 |
グローバル |
600 |
1,000,000 |
|
qwen3.5-flash-2026-02-23 |
EU |
600 |
1,000,000 |
|
qwen-flash |
グローバル |
15,000 |
10,000,000 |
|
qwen-flash-2025-07-28 |
グローバル |
60 |
1,000,000 |
香港 (中国)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-max |
香港 (中国) |
600 |
1,000,000 |
|
qwen3-max-2026-01-23 |
香港 (中国) |
600 |
1,000,000 |
|
qwen3.6-plus |
グローバル |
30,000 |
5,000,000 |
|
qwen3.6-flash |
グローバル |
15,000 |
5,000,000 |
|
qwen-plus |
香港 (中国) |
600 |
1,000,000 |
|
qwen-plus-2025-12-01 |
香港 (中国) |
120 |
1,000,000 |
|
qwen3.5-flash |
香港 (中国) |
15,000 |
5,000,000 |
|
qwen3.5-flash-2026-02-23 |
香港 (中国) |
60 |
1,000,000 |
Qwen-VL (視覚理解/Image-to-Text)
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-vl-plus |
インターナショナル |
1,200 |
1,000,000 |
|
qwen3-vl-plus-2025-12-19 |
インターナショナル |
60 |
100,000 |
|
qwen3-vl-plus-2025-09-23 |
インターナショナル |
120 |
1,000,000 |
|
qwen3-vl-flash |
インターナショナル |
1,200 |
1,000,000 |
|
qwen3-vl-flash-2026-01-22 |
インターナショナル |
60 |
100,000 |
|
qwen3-vl-flash-2025-10-15 |
インターナショナル |
120 |
1,000,000 |
|
qwen-vl-max |
インターナショナル |
1,200 |
1,000,000 |
|
qwen-vl-plus |
インターナショナル |
1,200 |
1,000,000 |
|
qvq-max |
インターナショナル |
60 |
100,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-vl-plus |
グローバル |
1,200 |
1,000,000 |
|
qwen3-vl-plus-2025-09-23 |
グローバル |
60 |
100,000 |
|
qwen3-vl-flash |
グローバル |
1,200 |
1,000,000 |
|
qwen3-vl-flash-us |
米国 |
1,200 |
1,000,000 |
|
qwen3-vl-flash-2025-10-15 |
グローバル |
60 |
100,000 |
|
qwen3-vl-flash-2026-01-22-us |
米国 |
120 |
1,000,000 |
|
qwen3-vl-flash-2025-10-15-us |
米国 |
120 |
1,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-vl-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
3,000 |
5,000,000 |
|
qwen3-vl-plus-2025-12-19 |
中国本土 |
60 |
100,000 |
|
qwen3-vl-plus-2025-09-23 |
中国本土 |
60 |
100,000 |
|
qwen3-vl-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
3,000 |
5,000,000 |
|
qwen3-vl-flash-2026-01-22 |
中国本土 |
60 |
100,000 |
|
qwen3-vl-flash-2025-10-15 |
中国本土 |
60 |
100,000 |
|
qwen-vl-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
1,200 |
1,000,000 |
|
qwen-vl-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
1,200 |
1,000,000 |
|
qvq-max |
中国本土 |
60 |
100,000 |
|
qvq-plus |
中国本土 |
60 |
100,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-vl-plus |
グローバル |
1,200 |
1,000,000 |
|
qwen3-vl-plus |
EU |
1,200 |
1,000,000 |
|
qwen3-vl-plus-2025-09-23 |
グローバル |
60 |
100,000 |
|
qwen3-vl-flash |
グローバル |
1,200 |
1,000,000 |
|
qwen3-vl-flash |
EU |
1,200 |
1,000,000 |
|
qwen3-vl-flash-2026-01-22 |
EU |
60 |
100,000 |
|
qwen3-vl-flash-2025-10-15 |
グローバル |
60 |
100,000 |
|
qwen3-vl-flash-2025-10-15 |
EU |
60 |
100,000 |
香港 (中国)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-vl-plus |
香港 (中国) |
1,200 |
1,000,000 |
|
qwen3-vl-plus-2025-12-19 |
香港 (中国) |
60 |
100,000 |
Qwen-Omni (オムニモーダル)
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.5-omni-flash |
インターナショナル |
60 |
100,000 |
|
qwen3.5-omni-flash-2026-03-15 |
インターナショナル |
60 |
100,000 |
|
qwen3.5-omni-plus |
インターナショナル |
60 |
100,000 |
|
qwen3.5-omni-plus-2026-03-15 |
インターナショナル |
60 |
100,000 |
|
qwen3-omni-flash |
インターナショナル |
60 |
100,000 |
|
qwen3-omni-flash-2025-12-01 |
インターナショナル |
60 |
100,000 |
|
qwen3-omni-flash-2025-09-15 |
インターナショナル |
60 |
100,000 |
|
qwen-omni-turbo |
インターナショナル |
60 |
100,000 |
|
qwen-omni-turbo-latest |
インターナショナル |
60 |
100,000 |
|
qwen-omni-turbo-2025-03-26 |
インターナショナル |
60 |
100,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.5-omni-flash |
中国本土 |
60 |
100,000 |
|
qwen3.5-omni-flash-2026-03-15 |
中国本土 |
60 |
100,000 |
|
qwen3.5-omni-plus |
中国本土 |
60 |
100,000 |
|
qwen3.5-omni-plus-2026-03-15 |
中国本土 |
60 |
100,000 |
|
qwen3-omni-flash |
中国本土 |
60 |
100,000 |
|
qwen3-omni-flash-2025-12-01 |
中国本土 |
60 |
100,000 |
|
qwen3-omni-flash-2025-09-15 |
中国本土 |
60 |
100,000 |
|
qwen-omni-turbo |
中国本土 |
60 |
100,000 |
|
qwen-omni-turbo-latest |
中国本土 |
60 |
100,000 |
|
qwen-omni-turbo-2025-03-26 (qwen-omni-turbo-0326) |
中国本土 |
60 |
100,000 |
|
qwen-omni-turbo-2025-01-19 (qwen-omni-turbo-0119) |
中国本土 |
60 |
100,000 |
Qwen-Omni-Realtime (リアルタイムマルチモーダル)
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.5-omni-plus-realtime |
インターナショナル |
60 |
100,000 |
|
qwen3.5-omni-plus-realtime-2026-03-15 |
インターナショナル |
60 |
100,000 |
|
qwen3.5-omni-flash-realtime |
インターナショナル |
60 |
100,000 |
|
qwen3.5-omni-flash-realtime-2026-03-15 |
インターナショナル |
60 |
100,000 |
|
qwen3-omni-flash-realtime |
インターナショナル |
60 |
100,000 |
|
qwen3-omni-flash-realtime-2025-12-01 |
インターナショナル |
60 |
100,000 |
|
qwen3-omni-flash-realtime-2025-09-15 |
インターナショナル |
60 |
100,000 |
|
qwen-omni-turbo-realtime |
インターナショナル |
60 |
10,000 |
|
qwen-omni-turbo-realtime-latest |
インターナショナル |
60 |
10,000 |
|
qwen-omni-turbo-realtime-2025-05-08 |
インターナショナル |
60 |
10,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.5-omni-plus-realtime |
中国本土 |
60 |
100,000 |
|
qwen3.5-omni-plus-realtime-2026-03-15 |
中国本土 |
60 |
100,000 |
|
qwen3.5-omni-flash-realtime |
中国本土 |
60 |
100,000 |
|
qwen3.5-omni-flash-realtime-2026-03-15 |
中国本土 |
60 |
100,000 |
|
qwen3-omni-flash-realtime |
中国本土 |
60 |
100,000 |
|
qwen3-omni-flash-realtime-2025-12-01 |
中国本土 |
60 |
100,000 |
|
qwen3-omni-flash-realtime-2025-09-15 |
中国本土 |
60 |
100,000 |
|
qwen-omni-turbo-realtime |
中国本土 |
60 |
100,000 |
|
qwen-omni-turbo-realtime-latest |
中国本土 |
60 |
100,000 |
|
qwen-omni-turbo-realtime-2025-05-08 |
中国本土 |
60 |
100,000 |
Qwen-OCR (テキスト抽出)
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-vl-ocr |
インターナショナル |
600 |
6,000,000 |
|
qwen-vl-ocr-2025-11-20 |
インターナショナル |
1,200 |
6,000,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-vl-ocr |
グローバル |
600 |
6,000,000 |
|
qwen-vl-ocr-2025-11-20 |
グローバル |
1,200 |
6,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.5-ocr |
中国本土 |
6,000 |
30,000,000 |
|
qwen-vl-ocr レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
600 |
6,000,000 |
|
qwen-vl-ocr-latest |
中国本土 |
1,200 |
6,000,000 |
|
qwen-vl-ocr-2025-11-20 |
中国本土 |
1,200 |
6,000,000 |
|
qwen-vl-ocr-2025-04-13 |
中国本土 |
600 |
6,000,000 |
|
qwen-vl-ocr-2024-10-28 |
中国本土 |
600 |
6,000,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-vl-ocr |
グローバル |
600 |
6,000,000 |
|
qwen-vl-ocr-2025-11-20 |
グローバル |
1,200 |
6,000,000 |
Qwen 数学モデル
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-math-plus |
中国本土 |
1,200 |
1,000,000 |
|
qwen-math-plus-latest |
中国本土 |
1,200 |
1,000,000 |
|
qwen-math-plus-2024-09-19 (qwen-math-plus-0919) |
中国本土 |
60 |
100,000 |
|
qwen-math-plus-2024-08-16 (qwen-math-plus-0816) |
中国本土 |
10 |
20,000 |
|
qwen-math-turbo |
中国本土 |
1200 |
1,000,000 |
Qwen-Coder
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-coder-plus |
インターナショナル |
2,400 |
2,000,000 |
|
qwen3-coder-plus-2025-09-23 |
インターナショナル |
600 |
1,000,000 |
|
qwen3-coder-plus-2025-07-22 |
インターナショナル |
60 |
1,000,000 |
|
qwen3-coder-flash |
インターナショナル |
600 |
5,000,000 |
|
qwen3-coder-flash-2025-07-28 |
インターナショナル |
600 |
5,000,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-coder-plus |
グローバル |
2,400 |
2,000,000 |
|
qwen3-coder-plus-2025-09-23 |
グローバル |
60 |
1,000,000 |
|
qwen3-coder-plus-2025-07-22 |
グローバル |
60 |
1,000,000 |
|
qwen3-coder-flash |
グローバル |
1,200 |
1,000,000 |
|
qwen3-coder-flash-2025-07-28 |
グローバル |
60 |
1,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-coder-plus |
中国本土 |
5,000 |
5,000,000 |
|
qwen3-coder-plus-2025-09-23 |
中国本土 |
60 |
1,000,000 |
|
qwen3-coder-plus-2025-07-22 |
中国本土 |
60 |
1,000,000 |
|
qwen3-coder-flash |
中国本土 |
5,000 |
5,000,000 |
|
qwen3-coder-flash-2025-07-28 |
中国本土 |
60 |
1,000,000 |
|
qwen-coder-plus |
中国本土 |
1,200 |
1,000,000 |
|
qwen-coder-turbo |
中国本土 |
1,200 |
1,000,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-coder-plus |
グローバル |
2,400 |
2,000,000 |
|
qwen3-coder-plus-2025-09-23 |
グローバル |
60 |
1,000,000 |
|
qwen3-coder-plus-2025-07-22 |
グローバル |
60 |
1,000,000 |
|
qwen3-coder-flash |
グローバル |
1,200 |
1,000,000 |
|
qwen3-coder-flash-2025-07-28 |
グローバル |
60 |
1,000,000 |
Qwen 翻訳モデル
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-mt-plus |
インターナショナル |
60 |
100,000 |
|
qwen-mt-flash |
インターナショナル |
60 |
100,000 |
|
qwen-mt-lite |
インターナショナル |
60 |
100,000 |
|
qwen-mt-turbo |
インターナショナル |
60 |
100,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-mt-plus |
グローバル |
60 |
25,000 |
|
qwen-mt-flash |
グローバル |
60 |
35,000 |
|
qwen-mt-lite |
グローバル |
60 |
100,000 |
|
qwen-mt-lite-us |
米国 |
60 |
100,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-mt-plus |
中国本土 |
60 |
25,000 |
|
qwen-mt-flash |
中国本土 |
60 |
35,000 |
|
qwen-mt-lite |
中国本土 |
60 |
100,000 |
|
qwen-mt-turbo |
中国本土 |
60 |
35,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-mt-plus |
グローバル |
60 |
25,000 |
|
qwen-mt-flash |
グローバル |
60 |
35,000 |
|
qwen-mt-lite |
グローバル |
60 |
100,000 |
Qwen データマイニングモデル
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-doc-turbo |
中国本土 |
600 |
3,000,000 |
Qwen ディープリサーチモデル
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-deep-research |
中国本土 |
120 |
1,200,000 |
テキスト生成 - Qwen - オープンソース
Qwen 言語モデルオープンソース
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.6-35b-a3b |
インターナショナル |
600 |
1,000,000 |
|
qwen3.6-27b |
インターナショナル |
600 |
1,000,000 |
|
qwen3.5-397b-a17b |
インターナショナル |
600 |
1,000,000 |
|
qwen3.5-122b-a10b |
インターナショナル |
600 |
1,000,000 |
|
qwen3.5-27b |
インターナショナル |
600 |
1,000,000 |
|
qwen3.5-35b-a3b |
インターナショナル |
600 |
5,000,000 |
|
qwen3-next-80b-a3b-thinking |
インターナショナル |
600 |
1,000,000 |
|
qwen3-next-80b-a3b-instruct |
インターナショナル |
600 |
1,000,000 |
|
qwen3-235b-a22b-thinking-2507 |
インターナショナル |
600 |
1,000,000 |
|
qwen3-235b-a22b-instruct-2507 |
インターナショナル |
600 |
1,000,000 |
|
qwen3-30b-a3b-thinking-2507 |
インターナショナル |
600 |
5,000,000 |
|
qwen3-30b-a3b-instruct-2507 |
インターナショナル |
600 |
5,000,000 |
|
qwen3-235b-a22b |
インターナショナル |
600 |
1,000,000 |
|
qwen3-32b |
インターナショナル |
600 |
1,000,000 |
|
qwen3-30b-a3b |
インターナショナル |
600 |
1,000,000 |
|
qwen3-14b |
インターナショナル |
600 |
1,000,000 |
|
qwen3-8b |
インターナショナル |
600 |
1,000,000 |
|
qwen3-4b |
インターナショナル |
600 |
1,000,000 |
|
qwen3-1.7b |
インターナショナル |
600 |
1,000,000 |
|
qwen3-0.6b |
インターナショナル |
600 |
1,000,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.5-397b-a17b |
グローバル |
600 |
1,000,000 |
|
qwen3.5-122b-a10b |
グローバル |
600 |
1,000,000 |
|
qwen3.5-27b |
グローバル |
600 |
1,000,000 |
|
qwen3.6-35b-a3b |
グローバル |
600 |
1,000,000 |
|
qwen3.5-35b-a3b |
グローバル |
600 |
1,000,000 |
|
qwen3-next-80b-a3b-thinking |
グローバル |
600 |
1,000,000 |
|
qwen3-next-80b-a3b-instruct |
グローバル |
600 |
1,000,000 |
|
qwen3-235b-a22b-thinking-2507 |
グローバル |
600 |
1,000,000 |
|
qwen3-235b-a22b-instruct-2507 |
グローバル |
600 |
1,000,000 |
|
qwen3-30b-a3b-thinking-2507 |
グローバル |
600 |
1,000,000 |
|
qwen3-30b-a3b-instruct-2507 |
グローバル |
600 |
1,000,000 |
|
qwen3-235b-a22b |
グローバル |
600 |
1,000,000 |
|
qwen3-30b-a3b |
グローバル |
600 |
1,000,000 |
|
qwen3-32b |
グローバル |
600 |
1,000,000 |
|
qwen3-14b |
グローバル |
600 |
1,000,000 |
|
qwen3-8b |
グローバル |
600 |
1,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.6-35b-a3b |
中国本土 |
600 |
1,000,000 |
|
qwen3.6-27b |
中国本土 |
600 |
1,000,000 |
|
qwen3.5-397b-a17b |
中国本土 |
600 |
1,000,000 |
|
qwen3.5-122b-a10b |
中国本土 |
600 |
1,000,000 |
|
qwen3.5-27b |
中国本土 |
600 |
1,000,000 |
|
qwen3.5-35b-a3b |
中国本土 |
600 |
1,000,000 |
|
qwen3-next-80b-a3b-thinking |
中国本土 |
600 |
1,000,000 |
|
qwen3-next-80b-a3b-instruct |
中国本土 |
600 |
1,000,000 |
|
qwen3-235b-a22b-thinking-2507 |
中国本土 |
600 |
1,000,000 |
|
qwen3-235b-a22b-instruct-2507 |
中国本土 |
600 |
1,000,000 |
|
qwen3-30b-a3b-thinking-2507 |
中国本土 |
600 |
1,000,000 |
|
qwen3-30b-a3b-instruct-2507 |
中国本土 |
600 |
1,000,000 |
|
qwen3-235b-a22b |
中国本土 |
600 |
1,000,000 |
|
qwen3-30b-a3b |
中国本土 |
600 |
1,000,000 |
|
qwen3-32b |
中国本土 |
2400 |
1,000,000 |
|
qwen3-14b |
中国本土 |
600 |
1,000,000 |
|
qwen3-8b |
中国本土 |
600 |
1,000,000 |
|
qwen3-4b |
中国本土 |
600 |
1,000,000 |
|
qwen3-1.7b |
中国本土 |
600 |
1,000,000 |
|
qwen3-0.6b |
中国本土 |
600 |
1,000,000 |
|
qwen2.5-3b-instruct |
中国本土 |
1,200 |
2,000,000 |
|
qwen2.5-1.5b-instruct |
中国本土 |
1,200 |
2,000,000 |
|
qwen2.5-0.5b-instruct |
中国本土 |
1,200 |
2,000,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3.5-397b-a17b |
グローバル |
600 |
1,000,000 |
|
qwen3.5-122b-a10b |
グローバル |
600 |
1,000,000 |
|
qwen3.5-27b |
グローバル |
600 |
1,000,000 |
|
qwen3.6-35b-a3b |
グローバル |
600 |
1,000,000 |
|
qwen3.5-35b-a3b |
グローバル |
600 |
1,000,000 |
|
qwen3-next-80b-a3b-thinking |
グローバル |
600 |
1,000,000 |
|
qwen3-next-80b-a3b-instruct |
グローバル |
600 |
1,000,000 |
|
qwen3-235b-a22b-thinking-2507 |
グローバル |
600 |
1,000,000 |
|
qwen3-235b-a22b-instruct-2507 |
グローバル |
600 |
1,000,000 |
|
qwen3-30b-a3b-thinking-2507 |
グローバル |
600 |
1,000,000 |
|
qwen3-30b-a3b-instruct-2507 |
グローバル |
600 |
1,000,000 |
|
qwen3-235b-a22b |
グローバル |
600 |
1,000,000 |
|
qwen3-30b-a3b |
グローバル |
600 |
1,000,000 |
|
qwen3-32b |
グローバル |
600 |
1,000,000 |
|
qwen3-14b |
グローバル |
600 |
1,000,000 |
|
qwen3-8b |
グローバル |
600 |
1,000,000 |
Qwen-VL (視覚理解/Image-to-Text)
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-vl-32b-thinking |
インターナショナル |
60 |
100,000 |
|
qwen3-vl-32b-instruct |
インターナショナル |
60 |
100,000 |
|
qwen3-vl-30b-a3b-thinking |
インターナショナル |
60 |
100,000 |
|
qwen3-vl-30b-a3b-instruct |
インターナショナル |
60 |
100,000 |
|
qwen3-vl-8b-thinking |
インターナショナル |
60 |
100,000 |
|
qwen3-vl-8b-instruct |
インターナショナル |
60 |
100,000 |
|
qwen3-vl-235b-a22b-thinking |
インターナショナル |
60 |
100,000 |
|
qwen3-vl-235b-a22b-instruct |
インターナショナル |
60 |
100,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-vl-235b-a22b-thinking |
グローバル |
60 |
100,000 |
|
qwen3-vl-235b-a22b-instruct |
グローバル |
60 |
100,000 |
|
qwen3-vl-32b-thinking |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-32b-instruct |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-30b-a3b-thinking |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-30b-a3b-instruct |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-8b-thinking |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-8b-instruct |
グローバル |
600 |
1,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-vl-32b-thinking |
中国本土 |
600 |
1,000,000 |
|
qwen3-vl-32b-instruct |
中国本土 |
600 |
1,000,000 |
|
qwen3-vl-30b-a3b-thinking |
中国本土 |
600 |
1,000,000 |
|
qwen3-vl-30b-a3b-instruct |
中国本土 |
600 |
1,000,000 |
|
qwen3-vl-8b-thinking |
中国本土 |
600 |
1,000,000 |
|
qwen3-vl-8b-instruct |
中国本土 |
600 |
1,000,000 |
|
qwen3-vl-235b-a22b-thinking |
中国本土 |
60 |
100,000 |
|
qwen3-vl-235b-a22b-instruct |
中国本土 |
60 |
100,000 |
|
qwen2-vl-72b-instruct |
中国本土 |
1,200 |
1,000,000 |
|
qwen2-vl-7b-instruct |
中国本土 |
1,200 |
1,000,000 |
|
qwen2-vl-2b-instruct |
中国本土 |
1,200 |
1,000,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-vl-235b-a22b-thinking |
グローバル |
60 |
100,000 |
|
qwen3-vl-235b-a22b-instruct |
グローバル |
60 |
100,000 |
|
qwen3-vl-32b-thinking |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-32b-instruct |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-30b-a3b-thinking |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-30b-a3b-instruct |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-8b-thinking |
グローバル |
600 |
1,000,000 |
|
qwen3-vl-8b-instruct |
グローバル |
600 |
1,000,000 |
Qwen3-Omni
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen2.5-omni-7b |
インターナショナル |
60 |
100,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen2.5-omni-7b |
中国本土 |
60 |
100,000 |
Qwen3-Omni-Captioner
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-omni-30b-a3b-captioner |
インターナショナル |
60 |
100,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-omni-30b-a3b-captioner |
中国本土 |
60 |
100,000 |
Qwen-Math
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
Qwen-Coder
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-coder-next |
インターナショナル |
600 |
1,000,000 |
|
qwen3-coder-480b-a35b-instruct |
インターナショナル |
600 |
1,000,000 |
|
qwen3-coder-30b-a3b-instruct |
インターナショナル |
600 |
1,000,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-coder-480b-a35b-instruct |
グローバル |
600 |
1,000,000 |
|
qwen3-coder-30b-a3b-instruct |
グローバル |
600 |
1,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-coder-next |
中国本土 |
600 |
1,000,000 |
|
qwen3-coder-480b-a35b-instruct |
中国本土 |
600 |
1,000,000 |
|
qwen3-coder-30b-a3b-instruct |
中国本土 |
600 |
1,000,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen3-coder-480b-a35b-instruct |
グローバル |
600 |
1,000,000 |
|
qwen3-coder-30b-a3b-instruct |
グローバル |
600 |
1,000,000 |
|
qwen3-coder-next |
EU |
600 |
1,000,000 |
テキスト生成 - サードパーティモデル
DeepSeek
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
deepseek-v4-pro |
インターナショナル |
10,000 |
1,200,000 |
|
deepseek-v4-flash |
インターナショナル |
10,000 |
1,200,000 |
|
deepseek-v3.2 |
インターナショナル |
10,000 |
1,200,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
deepseek-v4-pro |
グローバル |
15,000 |
1,200,000 |
|
deepseek-v4-flash |
グローバル |
15,000 |
1,200,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
deepseek-v4-pro |
中国本土 |
15,000 |
1,200,000 |
|
deepseek-v4-flash |
中国本土 |
15,000 |
1,200,000 |
|
deepseek-v3.2 レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
15,000 |
1,200,000 |
|
deepseek-v3.2-exp |
中国本土 |
15,000 |
1,200,000 |
|
deepseek-v3.1 |
中国本土 |
15,000 |
1,200,000 |
|
deepseek-r1-0528 |
中国本土 |
60 |
100,000 |
|
deepseek-r1 レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
15,000 |
1,200,000 |
|
deepseek-v3 レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
15,000 |
1,200,000 |
|
deepseek-r1-distill-qwen-7b |
中国本土 |
15,000 |
1,200,000 |
|
deepseek-r1-distill-qwen-14b |
中国本土 |
15,000 |
1,200,000 |
deepseek-r1-distill-qwen-32b |
中国本土 |
15,000 |
1,200,000 |
|
deepseek-r1-distill-qwen-1.5b |
中国本土 |
60 |
100,000 |
|
deepseek-r1-distill-llama-8b |
中国本土 |
60 |
100,000 |
|
deepseek-r1-distill-llama-70b |
中国本土 |
60 |
100,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
deepseek-v4-pro |
グローバル |
15,000 |
1,200,000 |
|
deepseek-v4-flash |
グローバル |
15,000 |
1,200,000 |
Kimi
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
kimi-k2.7-code |
中国本土 |
500 |
1,000,000 |
|
kimi-k2.6 |
中国本土 |
500 |
1,000,000 |
|
kimi-k2.5 |
中国本土 |
500 |
1,000,000 |
|
kimi-k2-thinking |
中国本土 |
500 |
1,000,000 |
|
Moonshot-Kimi-K2-Instruct |
中国本土 |
500 |
1,000,000 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
kimi-k2.7-code |
グローバル |
500 |
1,000,000 |
|
kimi-k2.5 |
グローバル |
500 |
1,000,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
kimi-k2.7-code |
グローバル |
500 |
1,000,000 |
|
kimi-k2.5 |
グローバル |
500 |
1,000,000 |
香港 (中国)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
kimi-k2.7-code |
グローバル |
500 |
1,000,000 |
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限 (いずれかの値を超過するとトリガーされます) 以下は 1 分あたりの制限です。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます |
||
|
kimi-k2.7-code |
インターナショナル |
500 |
1,000,000 |
MiniMax
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
MiniMax-M2.5 |
中国本土 |
500 |
1,000,000 |
GLM
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
glm-5.2 |
グローバル |
500 |
1,000,000 |
|
glm-5.1 |
グローバル |
500 |
1,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
glm-5.2 |
中国本土 |
500 |
1,000,000 |
|
glm-5.1 |
中国本土 |
500 |
1,000,000 |
|
glm-5 |
中国本土 |
500 |
1,000,000 |
|
glm-4.7 |
中国本土 |
500 |
1,000,000 |
|
glm-4.6 |
中国本土 |
60 |
1,000,000 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
glm-5.2 |
グローバル |
500 |
1,000,000 |
|
glm-5.1 |
グローバル |
500 |
1,000,000 |
シンガポール
|
モデル名 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
|
|
glm-5.1 |
500 |
1,000,000 |
香港 (中国)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
glm-5.2 |
グローバル |
500 |
1,000,000 |
画像生成
Qwen-Image
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API 呼び出し制限 |
同時実行タスク数 (同時実行数) |
||
|
qwen-image-2.0-pro |
インターナショナル |
2 回/分 |
同期 API には制限なし |
|
qwen-image-2.0-pro-2026-06-22 |
インターナショナル |
2 回/分 |
同期 API には制限なし |
|
qwen-image-2.0-pro-2026-04-22 |
インターナショナル |
2 回/分 |
同期 API には制限なし |
|
qwen-image-2.0-pro-2026-03-03 |
インターナショナル |
2 回/分 |
同期 API には制限なし |
|
qwen-image-2.0 |
インターナショナル |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-2.0-2026-03-03 |
インターナショナル |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-max |
インターナショナル |
2 回/分 |
同期 API には制限なし |
|
qwen-image-max-2025-12-30 |
インターナショナル |
2 回/分 |
同期 API には制限なし |
|
qwen-image-plus |
インターナショナル |
2 回/秒 |
同期 API には制限なし / 非同期 API には 2 |
|
qwen-image-plus-2026-01-09 |
インターナショナル |
2 回/秒 |
同期 API には制限なし |
|
qwen-image |
インターナショナル |
2 回/秒 |
同期 API には制限なし / 非同期 API には 2 |
|
qwen-image-edit-max |
インターナショナル |
2 回/分 |
同期 API には制限なし |
|
qwen-image-edit-max-2026-01-16 |
インターナショナル |
2 回/分 |
同期 API には制限なし |
|
qwen-image-edit-plus |
インターナショナル |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-edit-plus-2025-12-15 |
インターナショナル |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-edit-plus-2025-10-30 |
インターナショナル |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-edit |
インターナショナル |
2 回/秒 |
同期 API には制限なし |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API 呼び出し制限 |
同時実行タスク数 (同時実行数) |
||
|
qwen-image-2.0-pro |
中国本土 |
2 回/分 |
同期 API には制限なし |
|
qwen-image-2.0-pro-2026-06-22 |
中国本土 |
2 回/分 |
同期 API には制限なし |
|
qwen-image-2.0-pro-2026-04-22 |
中国本土 |
2 回/分 |
同期 API には制限なし |
|
qwen-image-2.0-pro-2026-03-03 |
中国本土 |
2 回/分 |
同期 API には制限なし |
|
qwen-image-2.0 |
中国本土 |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-2.0-2026-03-03 |
中国本土 |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-max |
中国本土 |
2 回/分 |
同期 API には制限なし |
|
qwen-image-max-2025-12-30 |
中国本土 |
2 回/分 |
同期 API には制限なし |
|
qwen-image-plus |
中国本土 |
2 回/秒 |
同期 API には制限なし / 非同期 API には 2 |
|
qwen-image-plus-2026-01-09 |
中国本土 |
2 回/秒 |
同期 API には制限なし |
|
qwen-image |
中国本土 |
2 回/秒 |
同期 API には制限なし / 非同期 API には 2 |
|
qwen-image-edit-max |
中国本土 |
2 回/分 |
同期 API には制限なし |
|
qwen-image-edit-max-2026-01-16 |
中国本土 |
2 回/分 |
同期 API には制限なし |
|
qwen-image-edit-plus |
中国本土 |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-edit-plus-2025-12-15 |
中国本土 |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-edit-plus-2025-10-30 |
中国本土 |
2 回/秒 |
同期 API には制限なし |
|
qwen-image-edit |
中国本土 |
2 回/秒 |
同期 API には制限なし |
|
qwen-mt-image |
中国本土 |
1 回/秒 |
2 |
Text-to-image - Z-Image
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
z-image-turbo |
インターナショナル |
2 |
同期 API には制限なし |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
z-image-turbo |
中国本土 |
2 |
同期 API には制限なし |
Wanxiang
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
wan2.7-image-pro |
インターナショナル |
5 |
5 |
|
wan2.7-image |
インターナショナル |
5 |
5 |
|
wan2.6-image |
インターナショナル |
5 |
5 |
|
wan2.6-t2i |
インターナショナル |
5 |
5 |
|
wan2.5-t2i-preview |
インターナショナル |
5 |
5 |
|
wan2.2-t2i-flash |
インターナショナル |
2 |
2 |
|
wan2.2-t2i-plus |
インターナショナル |
2 |
2 |
|
wan2.1-t2i-turbo |
インターナショナル |
2 |
2 |
|
wan2.1-t2i-plus |
インターナショナル |
2 |
2 |
|
wan2.5-i2i-preview |
インターナショナル |
5 |
5 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
wan2.6-t2i |
グローバル |
5 |
5 |
|
wan2.6-image |
グローバル |
5 |
5 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
wan2.7-image-pro |
中国本土 |
5 |
5 |
|
wan2.7-image |
中国本土 |
5 |
5 |
|
wan2.6-image |
中国本土 |
5 |
5 |
|
wan2.6-t2i |
中国本土 |
1 |
5 |
|
wan2.5-t2i-preview |
中国本土 |
5 |
5 |
|
wanx2.0-t2i-turbo |
中国本土 |
2 |
2 |
|
wanx2.1-t2i-turbo |
中国本土 |
2 |
2 |
|
wanx2.1-t2i-plus |
中国本土 |
2 |
2 |
|
wan2.2-t2i-flash |
中国本土 |
2 |
2 |
|
wan2.2-t2i-plus |
中国本土 |
2 |
2 |
|
wan2.5-i2i-preview |
中国本土 |
5 |
5 |
|
wanx2.1-imageedit |
中国本土 |
2 |
2 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
wan2.6-t2i |
グローバル |
5 |
5 |
|
wan2.6-image |
グローバル |
5 |
5 |
OutfitAnyone
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
ジョブ送信 API の RPS 制限 |
同時実行タスク数 |
||
|
aitryon-plus |
中国本土 |
10 |
5 |
|
aitryon-parsing-v1 |
中国本土 |
10 |
同期 API には制限なし |
動画生成
HappyHorse シリーズ
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
happyhorse-1.1-t2v |
インターナショナル |
10 |
5 |
|
happyhorse-1.1-i2v |
インターナショナル |
10 |
5 |
|
happyhorse-1.1-r2v |
インターナショナル |
10 |
5 |
|
happyhorse-1.0-t2v |
インターナショナル |
10 |
5 |
|
happyhorse-1.0-i2v |
インターナショナル |
10 |
5 |
|
happyhorse-1.0-r2v |
インターナショナル |
10 |
5 |
|
happyhorse-1.0-video-edit |
インターナショナル |
10 |
5 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
happyhorse-1.1-t2v |
グローバル |
10 |
5 |
|
happyhorse-1.1-i2v |
グローバル |
10 |
5 |
|
happyhorse-1.1-r2v |
グローバル |
10 |
5 |
|
happyhorse-1.0-t2v |
グローバル |
10 |
5 |
|
happyhorse-1.0-i2v |
グローバル |
10 |
5 |
|
happyhorse-1.0-r2v |
グローバル |
10 |
5 |
|
happyhorse-1.0-video-edit |
グローバル |
10 |
5 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
happyhorse-1.1-t2v |
中国本土 |
10 |
5 |
|
happyhorse-1.1-i2v |
中国本土 |
10 |
5 |
|
happyhorse-1.1-r2v |
中国本土 |
10 |
5 |
|
happyhorse-1.0-t2v |
中国本土 |
10 |
5 |
|
happyhorse-1.0-i2v |
中国本土 |
10 |
5 |
|
happyhorse-1.0-r2v |
中国本土 |
10 |
5 |
|
happyhorse-1.0-video-edit |
中国本土 |
10 |
5 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
happyhorse-1.1-t2v |
グローバル |
10 |
5 |
|
happyhorse-1.1-i2v |
グローバル |
10 |
5 |
|
happyhorse-1.1-r2v |
グローバル |
10 |
5 |
|
happyhorse-1.0-t2v |
グローバル |
10 |
5 |
|
happyhorse-1.0-i2v |
グローバル |
10 |
5 |
|
happyhorse-1.0-r2v |
グローバル |
10 |
5 |
|
happyhorse-1.0-video-edit |
グローバル |
10 |
5 |
香港 (中国)
|
モデル名 |
サービス提供範囲 |
レート制限 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
happyhorse-1.1-t2v |
グローバル |
10 |
5 |
|
happyhorse-1.1-i2v |
グローバル |
10 |
5 |
|
happyhorse-1.1-r2v |
グローバル |
10 |
5 |
Wanxiang シリーズ
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
wan2.7-t2v-2026-04-25 |
インターナショナル |
5 |
5 |
|
wan2.7-t2v |
インターナショナル |
5 |
5 |
|
wan2.6-t2v |
インターナショナル |
5 |
5 |
|
wan2.5-t2v-preview |
インターナショナル |
5 |
5 |
|
wan2.2-t2v-plus |
インターナショナル |
2 |
2 |
|
wan2.1-t2v-turbo |
インターナショナル |
2 |
2 |
|
wan2.1-t2v-plus |
インターナショナル |
2 |
2 |
|
wan2.7-i2v-2026-04-25 |
インターナショナル |
5 |
5 |
|
wan2.7-i2v |
インターナショナル |
5 |
5 |
|
wan2.6-i2v-flash |
インターナショナル |
5 |
5 |
|
wan2.6-i2v |
インターナショナル |
5 |
5 |
|
wan2.5-i2v-preview |
インターナショナル |
5 |
5 |
|
wan2.2-i2v-flash |
インターナショナル |
2 |
2 |
|
wan2.1-i2v-plus |
インターナショナル |
2 |
2 |
|
wan2.1-i2v-turbo |
インターナショナル |
2 |
2 |
|
wan2.2-i2v-plus |
インターナショナル |
2 |
2 |
|
wan2.2-kf2v-flash |
インターナショナル |
2 |
2 |
|
wan2.1-kf2v-plus |
インターナショナル |
1 |
2 |
|
wan2.1-vace-plus |
インターナショナル |
2 |
2 |
|
wan2.7-videoedit |
インターナショナル |
5 |
5 |
|
wan2.7-r2v |
インターナショナル |
5 |
5 |
|
wan2.6-r2v-flash |
インターナショナル |
5 |
5 |
|
wan2.6-r2v |
インターナショナル |
5 |
5 |
|
wan2.2-animate-move |
インターナショナル |
5 |
1 |
|
wan2.2-animate-mix |
インターナショナル |
5 |
1 |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
wan2.6-t2v |
グローバル |
5 |
5 |
|
wan2.6-i2v |
グローバル |
5 |
5 |
|
wan2.6-r2v |
グローバル |
5 |
5 |
|
wan2.6-t2v-us |
米国 |
5 |
5 |
|
wan2.6-i2v-us |
米国 |
5 |
5 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
wan2.7-t2v-2026-04-25 |
中国本土 |
5 |
5 |
|
wan2.7-t2v |
中国本土 |
5 |
5 |
|
wan2.6-t2v |
中国本土 |
5 |
5 |
|
wan2.5-t2v-preview |
中国本土 |
5 |
5 |
|
wan2.2-t2v-plus |
中国本土 |
2 |
2 |
|
wanx2.1-t2v-turbo |
中国本土 |
2 |
2 |
|
wanx2.1-t2v-plus |
中国本土 |
2 |
2 |
|
wan2.7-i2v-2026-04-25 |
中国本土 |
5 |
5 |
|
wan2.7-i2v |
中国本土 |
5 |
5 |
|
wan2.6-i2v-flash |
中国本土 |
5 |
5 |
|
wan2.6-i2v |
中国本土 |
5 |
5 |
|
wan2.5-i2v-preview |
中国本土 |
5 |
5 |
|
wan2.2-i2v-plus |
中国本土 |
2 |
2 |
|
wanx2.1-i2v-turbo |
中国本土 |
2 |
2 |
|
wanx2.1-i2v-plus |
中国本土 |
2 |
2 |
|
wan2.2-kf2v-flash |
中国本土 |
2 |
2 |
|
wanx2.1-kf2v-plus |
中国本土 |
2 |
2 |
|
wanx2.1-vace-plus |
中国本土 |
2 |
2 |
|
wan2.7-videoedit |
中国本土 |
5 |
5 |
|
wan2.7-r2v |
中国本土 |
5 |
5 |
|
wan2.6-r2v-flash |
中国本土 |
5 |
5 |
|
wan2.6-r2v |
中国本土 |
5 |
5 |
|
wan2.2-s2v-detect |
中国本土 |
5 |
同期 API には制限なし |
|
wan2.2-s2v |
中国本土 |
5 |
1 |
|
wan2.2-animate-move |
中国本土 |
5 |
1 |
|
wan2.2-animate-mix |
中国本土 |
5 |
1 |
ドイツ (フランクフルト)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
タスク送信 API の RPS 制限 |
同時実行タスク数 (同時実行数) |
||
|
wan2.6-t2v |
グローバル |
5 |
5 |
|
wan2.6-i2v |
グローバル |
5 |
5 |
|
wan2.6-r2v |
グローバル |
5 |
5 |
AnimateAnyone
中国 (北京)
|
モデル名 |
サービス提供範囲 |
タスク送信 API の RPS 制限 |
同時実行タスク数 |
|
animate-anyone-detect-gen2 |
中国本土 |
5 |
同期 API には制限なし |
|
animate-anyone-template-gen2 |
中国本土 |
5 |
1 一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。 |
|
animate-anyone-gen2 |
中国本土 |
5 |
1 一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。 |
EMO
中国 (北京)
|
モデル名 |
サービス提供範囲 |
タスク送信 API の RPS 制限 |
同時実行タスク数 |
|
emo-detect-v1 |
中国本土 |
5 |
同期 API には制限なし |
|
emo-v1 |
中国本土 |
5 |
1 一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。 |
LivePortrait
中国 (北京)
|
モデル名 |
サービス提供範囲 |
タスク送信 API の RPS 制限 |
同時実行タスク数 |
|
liveportrait-detect |
中国本土 |
5 |
同期 API には制限なし |
|
liveportrait |
中国本土 |
5 |
1 一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。 |
VideoRetalk
中国 (北京)
|
モデル名 |
サービス提供範囲 |
タスク送信 API の RPS 制限 |
同時実行タスク数 |
|
videoretalk |
中国本土 |
1 |
1 一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。 |
Emoji
中国 (北京)
|
モデル名 |
サービス提供範囲 |
タスク送信 API の RPS 制限 |
同時実行タスク数 |
|
emoji-detect-v1 |
中国本土 |
1 |
同期 API には制限なし |
|
emoji-v1 |
中国本土 |
1 |
1 一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。 |
動画スタイル変換
中国 (北京)
|
モデル名 |
サービス提供範囲 |
タスク送信 API の RPS 制限 |
同時実行タスク数 |
|
video-style-transform |
中国本土 |
20 |
2 一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。 |
音楽生成
中国 (北京)
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
fun-music-preview |
中国本土 |
180 |
|
fun-music-v1 |
中国本土 |
180 |
音声合成 (Text-to-Speech)
Qwen 音声合成
シンガポール
Qwen3-TTS-Instruct-Flash
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-instruct-flash |
インターナショナル |
180 |
|
qwen3-tts-instruct-flash-2026-01-26 |
インターナショナル |
180 |
Qwen3-TTS-VD
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-vd-2026-01-26 |
インターナショナル |
180 |
Qwen3-TTS-VC
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-vc-2026-01-22 |
インターナショナル |
180 |
Qwen3-TTS-Flash
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-flash |
インターナショナル |
180 |
|
qwen3-tts-flash-2025-11-27 |
インターナショナル |
180 |
|
qwen3-tts-flash-2025-09-18 |
インターナショナル |
10 |
中国 (北京)
Qwen3-TTS-Instruct-Flash
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-instruct-flash |
中国本土 |
180 |
|
qwen3-tts-instruct-flash-2026-01-26 |
中国本土 |
180 |
Qwen3-TTS-VD
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-vd-2026-01-26 |
中国本土 |
180 |
Qwen3-TTS-VC
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-vc-2026-01-22 |
中国本土 |
180 |
Qwen3-TTS-Flash
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-flash |
中国本土 |
180 |
|
qwen3-tts-flash-2025-11-27 |
中国本土 |
180 |
|
qwen3-tts-flash-2025-09-18 |
中国本土 |
10 |
Qwen-TTS
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む |
||
|
qwen-tts |
中国本土 |
10 |
100,000 |
|
qwen-tts-latest |
中国本土 |
||
|
qwen-tts-2025-05-22 |
中国本土 |
||
|
qwen-tts-2025-04-10 |
中国本土 |
||
Qwen リアルタイム音声合成
シンガポール
Qwen3-TTS-Instruct-Flash-Realtime
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-instruct-flash-realtime |
インターナショナル |
180 |
|
qwen3-tts-instruct-flash-realtime-2026-01-22 |
インターナショナル |
180 |
Qwen3-TTS-VD-Realtime
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-vd-realtime-2026-01-15 |
インターナショナル |
180 |
|
qwen3-tts-vd-realtime-2025-12-16 |
インターナショナル |
Qwen3-TTS-VC-Realtime
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-vc-realtime-2026-01-15 |
インターナショナル |
180 |
|
qwen3-tts-vc-realtime-2025-11-27 |
インターナショナル |
Qwen3-TTS-Flash-Realtime
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-flash-realtime |
インターナショナル |
180 |
|
qwen3-tts-flash-realtime-2025-11-27 |
インターナショナル |
180 |
|
qwen3-tts-flash-realtime-2025-09-18 |
インターナショナル |
10 |
中国 (北京)
Qwen3-TTS-Instruct-Flash-Realtime
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-instruct-flash-realtime |
中国本土 |
180 |
|
qwen3-tts-instruct-flash-realtime-2026-01-22 |
中国本土 |
180 |
Qwen3-TTS-VD-Realtime
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-vd-realtime-2026-01-15 |
中国本土 |
180 |
|
qwen3-tts-vd-realtime-2025-12-16 |
中国本土 |
Qwen3-TTS-VC-Realtime
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-vc-realtime-2026-01-15 |
中国本土 |
180 |
|
qwen3-tts-vc-realtime-2025-11-27 |
中国本土 |
Qwen3-TTS-Flash-Realtime
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-tts-flash-realtime |
中国本土 |
180 |
|
qwen3-tts-flash-realtime-2025-11-27 |
中国本土 |
180 |
|
qwen3-tts-flash-realtime-2025-09-18 |
中国本土 |
10 |
Qwen-TTS-Realtime
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む |
||
|
qwen-tts-realtime |
中国本土 |
10 |
100,000 |
|
qwen-tts-realtime-latest |
中国本土 |
||
|
qwen-tts-realtime-2025-07-15 |
中国本土 |
||
Qwen 音声クローニング
シンガポール
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen-voice-enrollment |
インターナショナル |
180 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen-voice-enrollment |
中国本土 |
180 |
Qwen 音声デザイン
シンガポール
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen-voice-design |
インターナショナル |
180 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen-voice-design |
中国本土 |
180 |
CosyVoice 音声合成
シンガポール
|
モデル名 |
サービス提供範囲 |
ジョブ送信 API RPS 制限 |
|
cosyvoice-v3-plus |
インターナショナル |
3 |
|
cosyvoice-v3-flash |
インターナショナル |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
ジョブ送信 API RPS 制限 |
|
cosyvoice-v3.5-plus |
中国本土 |
3 |
|
cosyvoice-v3.5-flash |
中国本土 |
|
|
cosyvoice-v3-plus |
中国本土 |
|
|
cosyvoice-v3-flash |
中国本土 |
|
|
cosyvoice-v2 |
中国本土 |
CosyVoice 音声クローニング/デザイン
CosyVoice 音声クローニングモデルは、単一のモデルと共有のレート制限クォータを共有します。
シンガポール
|
モデル名 |
サービス提供範囲 |
ジョブ送信 API RPS 制限 |
|
voice-enrollment |
インターナショナル |
10 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
ジョブ送信 API RPS 制限 |
|
voice-enrollment |
中国本土 |
10 |
音声認識 (音声テキスト変換) と翻訳 (指定言語への音声テキスト変換)
Qwen3-LiveTranslate-Flash
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む |
||
|
qwen3-livetranslate-flash |
インターナショナル |
100 |
100,000 |
|
qwen3-livetranslate-flash-2025-12-01 |
インターナショナル |
6,000 |
1,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む |
||
|
qwen3-livetranslate-flash |
中国本土 |
100 |
100,000 |
|
qwen3-livetranslate-flash-2025-12-01 |
中国本土 |
||
Qwen-LiveTranslate-Flash-Realtime
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む |
||
|
qwen3.5-livetranslate-flash-realtime |
インターナショナル |
10 |
100,000 |
|
qwen3.5-livetranslate-flash-realtime-2026-05-19 |
インターナショナル |
||
|
qwen3-livetranslate-flash-realtime |
インターナショナル |
||
|
qwen3-livetranslate-flash-realtime-2025-09-22 |
インターナショナル |
||
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む |
||
|
qwen3.5-livetranslate-flash-realtime |
中国本土 |
10 |
100,000 |
|
qwen3.5-livetranslate-flash-realtime-2026-05-19 |
中国本土 |
||
|
qwen3-livetranslate-flash-realtime |
中国本土 |
||
|
qwen3-livetranslate-flash-realtime-2025-09-22 |
中国本土 |
||
Qwen 音声ファイル認識
シンガポール
Qwen3-ASR-Flash-Filetrans
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-asr-flash-filetrans |
インターナショナル |
100 |
|
qwen3-asr-flash-filetrans-2025-11-17 |
インターナショナル |
Qwen3-ASR-Flash
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-asr-flash |
インターナショナル |
100 |
|
qwen3-asr-flash-2026-02-10 |
インターナショナル |
|
|
qwen3-asr-flash-2025-09-08 |
インターナショナル |
米国 (バージニア)
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-asr-flash-us |
米国 |
100 |
|
qwen3-asr-flash-2025-09-08-us |
米国 |
中国 (北京)
Qwen3-ASR-Flash-Filetrans
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-asr-flash-filetrans |
中国本土 |
100 |
|
qwen3-asr-flash-filetrans-2025-11-17 |
中国本土 |
Qwen3-ASR-Flash
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
qwen3-asr-flash |
中国本土 |
100 |
|
qwen3-asr-flash-2026-02-10 |
中国本土 |
|
|
qwen3-asr-flash-2025-09-08 |
中国本土 |
Qwen リアルタイム音声認識
シンガポール
|
モデル名 |
サービス提供範囲 |
1 秒あたりのリクエスト数 (RPS) |
|
qwen3-asr-flash-realtime |
インターナショナル |
20 |
|
qwen3-asr-flash-realtime-2026-02-10 |
インターナショナル |
|
|
qwen3-asr-flash-realtime-2025-10-27 |
インターナショナル |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
1 秒あたりのリクエスト数 (RPS) |
|
qwen3-asr-flash-realtime |
中国本土 |
20 |
|
qwen3-asr-flash-realtime-2026-02-10 |
中国本土 |
|
|
qwen3-asr-flash-realtime-2025-10-27 |
中国本土 |
Paraformer音声認識
中国 (北京)
|
モデル名 |
サービス提供範囲 |
ジョブ送信 API RPS 制限 |
|
paraformer-realtime-v2 |
中国本土 |
20 |
|
paraformer-realtime-8k-v2 |
中国本土 |
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
paraformer-v2 |
中国本土 |
1,200 |
|
モデル名 |
サービス提供範囲 |
ジョブ送信 API RPS 制限 |
同時処理タスク数 (同時実行数) |
|
paraformer-8k-v2 |
中国本土 |
20 |
100 |
Fun-ASR 音声ファイル認識
シンガポール
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
fun-asr |
インターナショナル |
600 |
|
fun-asr-2025-11-07 |
インターナショナル |
600 |
|
fun-asr-2025-08-25 |
インターナショナル |
600 |
|
fun-asr-mtl |
インターナショナル |
100 |
|
fun-asr-mtl-2025-08-25 |
インターナショナル |
100 |
|
fun-asr-flash-2026-06-15 |
インターナショナル |
600 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
1 分あたりのリクエスト数 (RPM) |
|
fun-asr |
中国本土 |
600 |
|
fun-asr-2025-11-07 |
中国本土 |
|
|
fun-asr-2025-08-25 |
中国本土 |
|
|
fun-asr-mtl |
中国本土 |
|
|
fun-asr-mtl-2025-08-25 |
中国本土 |
|
|
fun-asr-flash-2026-06-15 |
中国本土 |
Fun-ASR リアルタイム音声認識
シンガポール
|
モデル名 |
サービス提供範囲 |
ジョブ送信 API RPS 制限 |
|
fun-asr-realtime |
インターナショナル |
20 |
|
fun-asr-realtime-2025-11-07 |
インターナショナル |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
ジョブ送信 API RPS 制限 |
|
fun-asr-realtime |
中国本土 |
20 |
|
fun-asr-realtime-2026-02-28 |
中国本土 |
|
|
fun-asr-realtime-2025-11-07 |
中国本土 |
|
|
fun-asr-realtime-2025-09-15 |
中国本土 |
|
|
fun-asr-flash-8k-realtime |
中国本土 |
|
|
fun-asr-flash-8k-realtime-2026-01-28 |
中国本土 |
テキスト埋め込み
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM)/ジョブ数 入力トークンと出力トークンを含みます。 |
||
|
text-embedding-v4 |
インターナショナル |
1,800 |
1,000,000 |
|
text-embedding-v3 |
インターナショナル |
6,000 |
24,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
1 秒あたりのリクエスト数 (RPS) |
1 分あたりのトークン数 (TPM)/ジョブ数 入力トークンと出力トークンを含みます。 |
||
|
text-embedding-v4 レート制限は、バッチ API を使用したサービス呼び出しには適用されません。 |
中国本土 |
30 |
1,200,000 |
香港 (中国)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM)/ジョブ数 入力トークンと出力トークンを含みます。 |
||
|
text-embedding-v4 |
香港 (中国) |
1,800 |
1,000,000 |
マルチモーダル埋め込み
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンのみ。 |
||
|
tongyi-embedding-vision-plus |
インターナショナル |
600 |
200,000 |
|
tongyi-embedding-vision-flash |
インターナショナル |
600 |
200,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンのみ。 |
||
|
qwen3-vl-embedding |
中国本土 |
2,400 |
1,200,000 |
|
multimodal-embedding-v1 |
中国本土 |
120 |
100,000 |
ソートモデル
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンのみ。 |
||
|
qwen3-rerank |
インターナショナル |
5,400 |
5,000,000,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンのみ。 |
||
|
qwen3-vl-rerank |
中国本土 |
600 |
9,000,000 |
|
gte-rerank-v2 |
中国本土 |
5,040 |
4,980,000,000 |
業界
意図認識
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
tongyi-intent-detect-v3 |
中国本土 |
1,200 |
1,000,000 |
ロール想定
シンガポール
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-plus-character |
インターナショナル |
120 |
500,000 |
|
qwen-flash-character |
インターナショナル |
120 |
500,000 |
|
qwen-plus-character-ja |
インターナショナル |
120 |
500,000 |
中国 (北京)
|
モデル名 |
サービス提供範囲 |
レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。 |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
qwen-plus-character |
中国本土 |
120 |
500,000 |
|
qwen-flash-character |
中国本土 |
120 |
500,000 |
オフラインモデル
詳細については、「モデル非公開ポリシー」をご参照ください。
2026 年 1 月 30 日にオフライン
|
カテゴリ |
モデル名 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
Qwen-Plus |
qwen-plus-2024-11-27 |
0 |
0 |
|
qwen-plus-2024-11-25 |
|||
|
qwen-plus-2024-09-19 |
|||
|
qwen-plus-2024-08-06 |
|||
|
Qwen-Turbo |
qwen-turbo-2024-09-19 |
||
|
Qwen-VL |
qwen-vl-max-2024-10-30 |
||
|
qwen-vl-max-2024-08-09 |
|||
|
qwen-vl-plus-2024-08-09 |
|||
2025 年 8 月 20 日にオフライン
|
カテゴリ |
モデル名 |
レート制限条件 (いずれかの値を超過するとトリガーされます) |
|
|
1 分あたりのリクエスト数 (RPM) |
1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。 |
||
|
テキスト生成 - Qwen |
qwen2-72b-instruct |
0 |
0 |
|
qwen2-57b-a14b-instruct |
|||
|
qwen2-7b-instruct |
|||
|
qwen1.5-110b-chat |
|||
|
qwen1.5-72b-chat |
|||
|
qwen1.5-32b-chat |
|||
|
qwen1.5-14b-chat |
|||
|
qwen1.5-7b-chat |
|||