レート制限 - Alibaba Cloud Model Studio - Alibaba Cloud ドキュメントセンター

Alibaba Cloud Model Studio は、Alibaba Cloud アカウントレベルでモデル呼び出しにレート制限を適用し、アカウント配下のすべての RAM ユーザー、ワークスペース、API キーの使用量を集計します。制限を超えるとリクエストは拒否されますが、通常は 1 分以内に自動的に回復します。

レート制限のルール

アカウントレベルのレート制限：レート制限はルートアカウントレベルで適用されます。アカウント配下のすべての RAM ユーザー、ワークスペース、API キーの使用量が合算されます。
モデル固有のレート制限：各モデルには独自のレート制限があります。詳細については、以下の表をご参照ください。

よくある質問

レート制限がトリガーされる原因

エラーメッセージに基づいてトリガーされたレート制限の種類を特定できます：

Requests rate limit exceeded または You exceeded your current requests list：これは、1 分あたりのリクエスト数 (RPM) の制限がトリガーされたことを示します。
Allocated quota exceeded または You exceeded your current quota：これは、1 分あたりのトークン数 (TPM) の制限がトリガーされたことを示します。
Request rate increased too quickly：短時間でリクエスト頻度が急増し、システムの安定性保護がトリガーされました。これは、呼び出しの総数が RPM または TPM の制限に達していない場合でも発生する可能性があります。
その他のエラーについては、「エラーコード」をご参照ください。

RPM と TPM に加えて、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) の秒単位レベルでレート制限が適用される場合があります。1 分あたりの呼び出し総数が制限を超えていなくても、短時間のリクエストのバーストによってレート制限がトリガーされる可能性があります。

モデル使用量の確認方法

モデルを呼び出してから 1 時間後に、モニタリング (シンガポールまたは北京) ページに移動します。時間範囲やワークスペースなどのクエリ条件を設定します。次に、[モデル] エリアで対象のモデルを見つけ、[操作] 列の [モニター] をクリックして、モデルの呼び出し統計を表示します。詳細については、「モニタリング」ドキュメントをご参照ください。

データは 1 時間ごとに更新されます。ピーク時には、1 時間レベルの遅延が発生する場合があります。

レート制限からの回復時間

通常、回復は 1 分以内に完了します。その他のエラーが発生した場合は、「エラーコード」でトラブルシューティングをご参照ください。

レート制限を回避する方法

より高いレート制限を持つモデルの選択：安定版または最新バージョンは、古いスナップショットバージョンよりもレート制限が高くなっています。
呼び出し戦略の最適化
- 呼び出し頻度の削減：Requests rate limit exceeded または You exceeded your current requests list エラーが発生した場合は、API の呼び出し頻度を下げてください。
- トークン消費量の削減：Allocated quota exceeded または You exceeded your current quota エラーが発生した場合は、入力を短くするか、出力長を制限してください。
- リクエストレートの平滑化：Request rate increased too quickly エラーが発生した場合は、均一スケジューリング、指数バックオフ、またはリクエストキューを使用してリクエストを均等に分散させ、突然のピークを回避してください。

バックアップモデルの追加

レート制限がトリガーされた場合、バックアップモデルに切り替えて生成を継続できます。これにより、失敗の確率を低減し、スループットを向上させることができます。以下のコードは、qwen-plus-2025-07-28 のレート制限がトリガーされた後、qwen-plus-2025-07-14 で自動的にリトライします。

サンプルコード

import os
import asyncio
from openai import AsyncOpenAI, APIStatusError

# 設定
API_KEY = os.getenv("DASHSCOPE_API_KEY")
# プライマリモデル
MODEL = "qwen-plus-2025-07-28"
# バックアップモデル
BACKUP_MODEL = "qwen-plus-2025-07-14"
# テスト用の質問
QUESTION = "Who are you?"
# 同時実行数の設定
NUM_REQUESTS = 10

client = AsyncOpenAI(
    api_key=API_KEY,
    # 呼び出す際、{WorkspaceId} を実際のワークスペース ID に置き換えてください。
    base_url="https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1"
)

async def send_request(model):
    """単一のリクエストを送信します。"""
    try:
        await client.chat.completions.create(
            model=model,
            messages=[{"role": "user", "content": QUESTION}]
        )
        return True
    except APIStatusError as e:
        if e.status_code == 429:
            print(f"[Rate limit triggered] Model {model}")
            return False
        raise
    except Exception as e:
        print(f"[Request failed] Model {model}, Error: {e}")
        return False

async def task(i):
    # プライマリモデルを試します。
    if await send_request(MODEL):
        return True
    # レート制限された場合は、バックアップモデルを試します。
    return await send_request(BACKUP_MODEL)

async def main():
    results = await asyncio.gather(*(task(i) for i in range(NUM_REQUESTS)))
    print(f"Successful requests: {sum(results)}, Failed requests: {len(results) - sum(results)}")

if __name__ == "__main__":
    asyncio.run(main())

タスクの分割：長い会話や大きなドキュメントは、すぐに多くのトークンを消費する可能性があります。大きなバッチタスクをより小さなバッチに分割し、異なる時間に送信することができます。
バッチ推論の使用：リアルタイムの応答を必要としないタスクには、バッチ API を使用できます。バッチリクエストはリアルタイムのレート制限の対象外ですが、キューイングと処理時間を考慮する必要があります。
レート制限の引き上げ：デフォルトのレート制限が不十分な場合は、Model Studio コンソールの [レート制限の引き上げ] ページでモデルの一時的な TPM クォータを引き上げることができます。この引き上げはすぐに有効になります。詳細については、「一時的なレート制限の引き上げ」をご参照ください。

トークン使用量またはコストの管理方法

レート制限は単位時間あたりのリクエストレートを制限するだけで、累積使用量の上限を設定するものではありません。トークン使用量やコストを管理するには、以下の方法を使用します：

利用上限とコストアラートの設定：[請求] カードで [コストアラート] を設定し、月間の利用上限としきい値の通知を有効にします。しきい値に達すると通知され、過剰な支出を回避するのに役立ちます。詳細については、「請求書の照会とコストの管理」をご参照ください。
無料クォータを使い切った場合に停止を有効にする：無料クォータを提供するモデルの場合、[無料クォータを使い切った場合に停止] を有効にすると、無料クォータが使い果たされると自動的に呼び出しが停止し、追加料金の発生を防ぎます。詳細については、「無料クォータ」をご参照ください。
モデル使用量のモニタリング：各モデルのトークン使用量を定期的に確認し、異常な増加を早期に検出します。上記の「モデル使用量の確認方法」をご参照ください。

一時的なレート制限の引き上げ

デフォルトのレート制限が不十分な場合、Model Studio コンソールでモデルの一時的な TPM クォータを引き上げることができます。この引き上げはすぐに有効になり、30 日間有効です。有効期間が切れると、クォータは自動的にシステムのデフォルト値に戻ります。

この機能は現在、中国 (北京) およびシンガポールリージョンで利用可能です。

Model Studio コンソールにログインし、レート制限の引き上げページに移動します。
右上隅の[一時的なモデルレート制限の引き上げ]をクリックします。
表示されるダイアログボックスで、[モデル] を選択し、[トークンアカウント制限 (トークン/60秒)] に希望の値を入力します。ダイアログボックスには、現在のクォータと設定可能な最大値が表示されます。
[OK] をクリックします。引き上げられたクォータはすぐに有効になります。

クォータの引き上げが有効になった後、以下の方法で確認できます：

レート制限の引き上げページで、クォータが引き上げられたモデルとそれに対応するレート制限データをリストで表示します。
モデルリストで、対応するモデルの詳細ページに移動し、更新されたレート制限データを表示します。

説明

一時的にクォータを引き上げることができるモデルは、レート制限の引き上げページのダイアログボックスにリストされています。
すでにクォータが引き上げられているモデルに対して再度リクエストを送信すると、新しい申請と見なされ、有効期間は 30 日間にリセットされます。
実際のニーズに基づいてクォータをリクエストしてください。プロビジョニング済み容量が長期間にわたって実際の使用量を大幅に上回る場合、システムは事前の通知後にデフォルト値に復元することがあります。

テキスト生成 - Qwen

Qwen 言語モデル

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.7-max	インターナショナル	600	1,000,000
qwen3.7-max-2026-06-08	インターナショナル	60	1,000,000
qwen3.7-max-2026-05-20	インターナショナル	60	1,000,000
qwen3.7-max-preview	インターナショナル	600	1,000,000
qwen3.7-max-2026-05-17	インターナショナル	600	1,000,000
qwen3.6-max-preview	インターナショナル	600	1,000,000
qwen3-max	インターナショナル	600	1,000,000
qwen3-max-2026-01-23	インターナショナル	600	1,000,000
qwen3-max-2025-09-23	インターナショナル	60	100,000
qwen3-max-preview	インターナショナル	600	1,000,000
qwen-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	インターナショナル	600	1,000,000
qwen3.7-plus	インターナショナル	15,000	5,000,000
qwen3.7-plus-2026-05-26	インターナショナル	60	1,000,000
qwen3.6-plus	インターナショナル	15,000	5,000,000
qwen3.6-plus-2026-04-02	インターナショナル	60	1,000,000
qwen3.6-flash	インターナショナル	15,000	5,000,000
qwen3.6-flash-2026-04-16	インターナショナル	60	1,000,000
qwen3.5-plus	インターナショナル	15,000	6,000,000
qwen3.5-plus-2026-04-20	インターナショナル	600	1,000,000
qwen3.5-plus-2026-02-15	インターナショナル	60	1,000,000
qwen-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	インターナショナル	600	1,500,000
qwen-plus-latest	インターナショナル	600	1,000,000
qwen-plus-2025-12-01	インターナショナル	120	1,000,000
qwen-plus-2025-09-11	インターナショナル	120	1,000,000
qwen-plus-2025-07-28	インターナショナル	60	100,000
qwen-plus-2025-07-14 (qwen-plus-0714)	インターナショナル	60	100,000
qwen-plus-2025-04-28 (qwen-plus-0428)	インターナショナル	60	1,000,000
qwen-plus-2025-01-25 (qwen-plus-0125)	インターナショナル	60	100,000
qwen3.5-flash	インターナショナル	15,000	5,000,000
qwen3.5-flash-2026-02-23	インターナショナル	60	1,000,000
qwen-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	インターナショナル	600	5,000,000
qwen-flash-2025-07-28	インターナショナル	600	5,000,000
qwq-plus	インターナショナル	60	100,000
qwen-turbo レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	インターナショナル	600	5,000,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.7-max	グローバル	30,000	5,000,000
qwen3.7-max-2026-06-08	グローバル	600	1,000,000
qwen3.7-max-2026-05-20	グローバル	600	1,000,000
qwen3-max	グローバル	600	1,000,000
qwen3-max-preview	グローバル	600	1,000,000
qwen3-max-2025-09-23	グローバル	60	100,000
qwen3.7-plus	グローバル	30,000	5,000,000
qwen3.7-plus-2026-05-26	グローバル	600	1,000,000
qwen3.6-plus	グローバル	30,000	5,000,000
qwen3.6-plus-2026-04-02	グローバル	600	1,000,000
qwen3.6-flash	グローバル	15,000	5,000,000
qwen3.6-flash-2026-04-16	グローバル	60	1,000,000
qwen3.5-plus	グローバル	30,000	5,000,000
qwen3.5-plus-2026-02-15	グローバル	600	1,000,000
qwen-plus	グローバル	15,000	5,000,000
qwen-plus-us	米国	600	1,000,000
qwen-plus-2025-12-01	グローバル	60	1,000,000
qwen-plus-2025-09-11	グローバル	60	1,000,000
qwen-plus-2025-07-28	グローバル	60	1,000,000
qwen-plus-2025-12-01-us	米国	60	1,000,000
qwen3.5-flash	グローバル	30,000	10,000,000
qwen3.5-flash-2026-02-23	グローバル	600	1,000,000
qwen-flash	グローバル	15,000	10,000,000
qwen-flash-us	米国	600	5,000,000
qwen-flash-2025-07-28	グローバル	60	1,000,000
qwen-flash-2025-07-28-us	米国	600	5,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.7-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	30,000	5,000,000
qwen3.7-max-2026-06-08	中国本土	600	1,000,000
qwen3.7-max-2026-05-20	中国本土	600	1,000,000
qwen3.6-max-preview	中国本土	600	1,000,000
qwen3-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	30,000	5,000,000
qwen3-max-2026-01-23	中国本土	600	1,000,000
qwen3-max-2025-09-23	中国本土	60	100,000
qwen3-max-preview	中国本土	600	1,000,000
qwen-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	1,200	1,000,000
qwen3.7-plus	中国本土	30,000	5,000,000
qwen3.7-plus-2026-05-26	中国本土	600	1,000,000
qwen3.6-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	30,000	5,000,000
qwen3.6-plus-2026-04-02	中国本土	600	1,000,000
qwen3.6-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	30,000	10,000,000
qwen3.6-flash-2026-04-16	中国本土	600	1,000,000
qwen3.5-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	30,000	5,000,000
qwen3.5-plus-2026-04-20	中国本土	600	1,000,000
qwen3.5-plus-2026-02-15	中国本土	600	1,000,000
qwen-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	30,000	5,000,000
qwen-plus-latest レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	15,000	1,200,000
qwen-plus-2025-12-01	中国本土	120	1,000,000
qwen-plus-2025-09-11	中国本土	60	1,000,000
qwen-plus-2025-07-28 (qwen-plus-0728)	中国本土	60	1,000,000
qwen-plus-2025-07-14 (qwen-plus-0714)	中国本土	60	100,000
qwen-plus-2025-04-28 (qwen-plus-0428)	中国本土	60	1,000,000
qwen-plus-2025-01-25 (qwen-plus-0125)	中国本土	60	150,000
qwen-plus-2025-01-12 (qwen-plus-0112)	中国本土	60	150,000
qwen-plus-2024-12-20 (qwen-plus-1220)	中国本土	60	150,000
qwen3.5-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	30,000	10,000,000
qwen3.5-flash-2026-02-23	中国本土	600	1,000,000
qwen-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	30,000	10,000,000
qwen-flash-2025-07-28	中国本土	60	1,000,000
qwq-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	600	1,000,000
qwen-turbo	中国本土	1,200	5,000,000
qwen-long-latest レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	1,200	60,000
qwen-long-2025-01-25 (qwen-long-0125)	中国本土	3	7,500

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.7-max	グローバル	30,000	5,000,000
qwen3.7-max-2026-06-08	グローバル	600	1,000,000
qwen3.7-max-2026-05-20	グローバル	600	1,000,000
qwen3-max	グローバル	600	1,000,000
qwen3-max	EU	600	1,000,000
qwen3-max-preview	グローバル	600	1,000,000
qwen3-max-2026-01-23	EU	600	1,000,000
qwen3-max-2025-09-23	グローバル	60	100,000
qwen3.7-plus	グローバル	30,000	5,000,000
qwen3.7-plus-2026-05-26	グローバル	600	1,000,000
qwen3.6-plus	グローバル	30,000	5,000,000
qwen3.6-plus-2026-04-02	グローバル	600	1,000,000
qwen3.6-flash	グローバル	15,000	5,000,000
qwen3.6-flash-2026-04-16	グローバル	60	1,000,000
qwen3.5-plus	グローバル	30,000	5,000,000
qwen3.5-plus-2026-02-15	グローバル	600	1,000,000
qwen-plus	グローバル	15,000	5,000,000
qwen-plus	EU	600	1,000,000
qwen-plus-2025-12-01	グローバル	60	1,000,000
qwen-plus-2025-12-01	EU	120	1,000,000
qwen-plus-2025-09-11	グローバル	60	1,000,000
qwen-plus-2025-07-28	グローバル	60	1,000,000
qwen3.5-flash	グローバル	30,000	10,000,000
qwen3.5-flash	EU	30,000	10,000,000
qwen3.5-flash-2026-02-23	グローバル	600	1,000,000
qwen3.5-flash-2026-02-23	EU	600	1,000,000
qwen-flash	グローバル	15,000	10,000,000
qwen-flash-2025-07-28	グローバル	60	1,000,000

香港 (中国)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-max	香港 (中国)	600	1,000,000
qwen3-max-2026-01-23	香港 (中国)	600	1,000,000
qwen3.6-plus	グローバル	30,000	5,000,000
qwen3.6-flash	グローバル	15,000	5,000,000
qwen-plus	香港 (中国)	600	1,000,000
qwen-plus-2025-12-01	香港 (中国)	120	1,000,000
qwen3.5-flash	香港 (中国)	15,000	5,000,000
qwen3.5-flash-2026-02-23	香港 (中国)	60	1,000,000

日本 (東京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限です。サービスは、RPS (RPM/60) および TPS (TPM/60) で 1 秒あたりの制限を適用する場合もあります
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含む
qwen3.7-max	グローバル	30,000	5,000,000
qwen3.7-max-2026-05-20	グローバル	600	1,000,000
qwen3.7-plus	グローバル	30,000	5,000,000
qwen3.7-plus-2026-05-26	グローバル	600	1,000,000
qwen3.7-plus	日本	15,000	5,000,000
qwen3.7-plus-2026-05-26	日本	60	1,000,000
qwen3.6-plus	グローバル	30,000	5,000,000
qwen3.6-plus-2026-04-02	グローバル	600	1,000,000
qwen3.6-flash	グローバル	15,000	5,000,000
qwen3.6-flash-2026-04-16	グローバル	60	1,000,000

Qwen-VL (視覚理解/Image-to-Text)

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-vl-plus	インターナショナル	1,200	1,000,000
qwen3-vl-plus-2025-12-19	インターナショナル	60	100,000
qwen3-vl-plus-2025-09-23	インターナショナル	120	1,000,000
qwen3-vl-flash	インターナショナル	1,200	1,000,000
qwen3-vl-flash-2026-01-22	インターナショナル	60	100,000
qwen3-vl-flash-2025-10-15	インターナショナル	120	1,000,000
qwen-vl-max	インターナショナル	1,200	1,000,000
qwen-vl-plus	インターナショナル	1,200	1,000,000
qvq-max	インターナショナル	60	100,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-vl-plus	グローバル	1,200	1,000,000
qwen3-vl-plus-2025-09-23	グローバル	60	100,000
qwen3-vl-flash	グローバル	1,200	1,000,000
qwen3-vl-flash-us	米国	1,200	1,000,000
qwen3-vl-flash-2025-10-15	グローバル	60	100,000
qwen3-vl-flash-2026-01-22-us	米国	120	1,000,000
qwen3-vl-flash-2025-10-15-us	米国	120	1,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-vl-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	3,000	5,000,000
qwen3-vl-plus-2025-12-19	中国本土	60	100,000
qwen3-vl-plus-2025-09-23	中国本土	60	100,000
qwen3-vl-flash レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	3,000	5,000,000
qwen3-vl-flash-2026-01-22	中国本土	60	100,000
qwen3-vl-flash-2025-10-15	中国本土	60	100,000
qwen-vl-max レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	1,200	1,000,000
qwen-vl-plus レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	1,200	1,000,000
qvq-max	中国本土	60	100,000
qvq-plus	中国本土	60	100,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-vl-plus	グローバル	1,200	1,000,000
qwen3-vl-plus	EU	1,200	1,000,000
qwen3-vl-plus-2025-09-23	グローバル	60	100,000
qwen3-vl-flash	グローバル	1,200	1,000,000
qwen3-vl-flash	EU	1,200	1,000,000
qwen3-vl-flash-2026-01-22	EU	60	100,000
qwen3-vl-flash-2025-10-15	グローバル	60	100,000
qwen3-vl-flash-2025-10-15	EU	60	100,000

香港 (中国)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-vl-plus	香港 (中国)	1,200	1,000,000
qwen3-vl-plus-2025-12-19	香港 (中国)	60	100,000

Qwen-Omni (オムニモーダル)

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.5-omni-flash	インターナショナル	60	100,000
qwen3.5-omni-flash-2026-03-15	インターナショナル	60	100,000
qwen3.5-omni-plus	インターナショナル	60	100,000
qwen3.5-omni-plus-2026-03-15	インターナショナル	60	100,000
qwen3-omni-flash	インターナショナル	60	100,000
qwen3-omni-flash-2025-12-01	インターナショナル	60	100,000
qwen3-omni-flash-2025-09-15	インターナショナル	60	100,000
qwen-omni-turbo	インターナショナル	60	100,000
qwen-omni-turbo-latest	インターナショナル	60	100,000
qwen-omni-turbo-2025-03-26	インターナショナル	60	100,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.5-omni-flash	中国本土	60	100,000
qwen3.5-omni-flash-2026-03-15	中国本土	60	100,000
qwen3.5-omni-plus	中国本土	60	100,000
qwen3.5-omni-plus-2026-03-15	中国本土	60	100,000
qwen3-omni-flash	中国本土	60	100,000
qwen3-omni-flash-2025-12-01	中国本土	60	100,000
qwen3-omni-flash-2025-09-15	中国本土	60	100,000
qwen-omni-turbo	中国本土	60	100,000
qwen-omni-turbo-latest	中国本土	60	100,000
qwen-omni-turbo-2025-03-26 (qwen-omni-turbo-0326)	中国本土	60	100,000
qwen-omni-turbo-2025-01-19 (qwen-omni-turbo-0119)	中国本土	60	100,000

Qwen-Omni-Realtime (リアルタイムマルチモーダル)

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.5-omni-plus-realtime	インターナショナル	60	100,000
qwen3.5-omni-plus-realtime-2026-03-15	インターナショナル	60	100,000
qwen3.5-omni-flash-realtime	インターナショナル	60	100,000
qwen3.5-omni-flash-realtime-2026-03-15	インターナショナル	60	100,000
qwen3-omni-flash-realtime	インターナショナル	60	100,000
qwen3-omni-flash-realtime-2025-12-01	インターナショナル	60	100,000
qwen3-omni-flash-realtime-2025-09-15	インターナショナル	60	100,000
qwen-omni-turbo-realtime	インターナショナル	60	10,000
qwen-omni-turbo-realtime-latest	インターナショナル	60	10,000
qwen-omni-turbo-realtime-2025-05-08	インターナショナル	60	10,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.5-omni-plus-realtime	中国本土	60	100,000
qwen3.5-omni-plus-realtime-2026-03-15	中国本土	60	100,000
qwen3.5-omni-flash-realtime	中国本土	60	100,000
qwen3.5-omni-flash-realtime-2026-03-15	中国本土	60	100,000
qwen3-omni-flash-realtime	中国本土	60	100,000
qwen3-omni-flash-realtime-2025-12-01	中国本土	60	100,000
qwen3-omni-flash-realtime-2025-09-15	中国本土	60	100,000
qwen-omni-turbo-realtime	中国本土	60	100,000
qwen-omni-turbo-realtime-latest	中国本土	60	100,000
qwen-omni-turbo-realtime-2025-05-08	中国本土	60	100,000

Qwen-OCR (テキスト抽出)

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-vl-ocr	インターナショナル	600	6,000,000
qwen-vl-ocr-2025-11-20	インターナショナル	1,200	6,000,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-vl-ocr	グローバル	600	6,000,000
qwen-vl-ocr-2025-11-20	グローバル	1,200	6,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.5-ocr	中国本土	6,000	30,000,000
qwen-vl-ocr レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	600	6,000,000
qwen-vl-ocr-latest	中国本土	1,200	6,000,000
qwen-vl-ocr-2025-11-20	中国本土	1,200	6,000,000
qwen-vl-ocr-2025-04-13	中国本土	600	6,000,000
qwen-vl-ocr-2024-10-28	中国本土	600	6,000,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-vl-ocr	グローバル	600	6,000,000
qwen-vl-ocr-2025-11-20	グローバル	1,200	6,000,000

Qwen 数学モデル

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-math-plus	中国本土	1,200	1,000,000
qwen-math-plus-latest	中国本土	1,200	1,000,000
qwen-math-plus-2024-09-19 (qwen-math-plus-0919)	中国本土	60	100,000
qwen-math-plus-2024-08-16 (qwen-math-plus-0816)	中国本土	10	20,000
qwen-math-turbo	中国本土	1200	1,000,000

Qwen-Coder

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-coder-plus	インターナショナル	2,400	2,000,000
qwen3-coder-plus-2025-09-23	インターナショナル	600	1,000,000
qwen3-coder-plus-2025-07-22	インターナショナル	60	1,000,000
qwen3-coder-flash	インターナショナル	600	5,000,000
qwen3-coder-flash-2025-07-28	インターナショナル	600	5,000,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-coder-plus	グローバル	2,400	2,000,000
qwen3-coder-plus-2025-09-23	グローバル	60	1,000,000
qwen3-coder-plus-2025-07-22	グローバル	60	1,000,000
qwen3-coder-flash	グローバル	1,200	1,000,000
qwen3-coder-flash-2025-07-28	グローバル	60	1,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-coder-plus	中国本土	5,000	5,000,000
qwen3-coder-plus-2025-09-23	中国本土	60	1,000,000
qwen3-coder-plus-2025-07-22	中国本土	60	1,000,000
qwen3-coder-flash	中国本土	5,000	5,000,000
qwen3-coder-flash-2025-07-28	中国本土	60	1,000,000
qwen-coder-plus	中国本土	1,200	1,000,000
qwen-coder-turbo	中国本土	1,200	1,000,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-coder-plus	グローバル	2,400	2,000,000
qwen3-coder-plus-2025-09-23	グローバル	60	1,000,000
qwen3-coder-plus-2025-07-22	グローバル	60	1,000,000
qwen3-coder-flash	グローバル	1,200	1,000,000
qwen3-coder-flash-2025-07-28	グローバル	60	1,000,000

Qwen 翻訳モデル

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-mt-plus	インターナショナル	60	100,000
qwen-mt-flash	インターナショナル	60	100,000
qwen-mt-lite	インターナショナル	60	100,000
qwen-mt-turbo	インターナショナル	60	100,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-mt-plus	グローバル	60	25,000
qwen-mt-flash	グローバル	60	35,000
qwen-mt-lite	グローバル	60	100,000
qwen-mt-lite-us	米国	60	100,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-mt-plus	中国本土	60	25,000
qwen-mt-flash	中国本土	60	35,000
qwen-mt-lite	中国本土	60	100,000
qwen-mt-turbo	中国本土	60	35,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-mt-plus	グローバル	60	25,000
qwen-mt-flash	グローバル	60	35,000
qwen-mt-lite	グローバル	60	100,000

Qwen データマイニングモデル

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-doc-turbo

中国本土

600

3,000,000

Qwen ディープリサーチモデル

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-deep-research

中国本土

120

1,200,000

テキスト生成 - Qwen - オープンソース

Qwen 言語モデルオープンソース

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.6-35b-a3b	インターナショナル	600	1,000,000
qwen3.6-27b	インターナショナル	600	1,000,000
qwen3.5-397b-a17b	インターナショナル	600	1,000,000
qwen3.5-122b-a10b	インターナショナル	600	1,000,000
qwen3.5-27b	インターナショナル	600	1,000,000
qwen3.5-35b-a3b	インターナショナル	600	5,000,000
qwen3-next-80b-a3b-thinking	インターナショナル	600	1,000,000
qwen3-next-80b-a3b-instruct	インターナショナル	600	1,000,000
qwen3-235b-a22b-thinking-2507	インターナショナル	600	1,000,000
qwen3-235b-a22b-instruct-2507	インターナショナル	600	1,000,000
qwen3-30b-a3b-thinking-2507	インターナショナル	600	5,000,000
qwen3-30b-a3b-instruct-2507	インターナショナル	600	5,000,000
qwen3-235b-a22b	インターナショナル	600	1,000,000
qwen3-32b	インターナショナル	600	1,000,000
qwen3-30b-a3b	インターナショナル	600	1,000,000
qwen3-14b	インターナショナル	600	1,000,000
qwen3-8b	インターナショナル	600	1,000,000
qwen3-4b	インターナショナル	600	1,000,000
qwen3-1.7b	インターナショナル	600	1,000,000
qwen3-0.6b	インターナショナル	600	1,000,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.5-397b-a17b	グローバル	600	1,000,000
qwen3.5-122b-a10b	グローバル	600	1,000,000
qwen3.5-27b	グローバル	600	1,000,000
qwen3.6-35b-a3b	グローバル	600	1,000,000
qwen3.5-35b-a3b	グローバル	600	1,000,000
qwen3-next-80b-a3b-thinking	グローバル	600	1,000,000
qwen3-next-80b-a3b-instruct	グローバル	600	1,000,000
qwen3-235b-a22b-thinking-2507	グローバル	600	1,000,000
qwen3-235b-a22b-instruct-2507	グローバル	600	1,000,000
qwen3-30b-a3b-thinking-2507	グローバル	600	1,000,000
qwen3-30b-a3b-instruct-2507	グローバル	600	1,000,000
qwen3-235b-a22b	グローバル	600	1,000,000
qwen3-30b-a3b	グローバル	600	1,000,000
qwen3-32b	グローバル	600	1,000,000
qwen3-14b	グローバル	600	1,000,000
qwen3-8b	グローバル	600	1,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.6-35b-a3b	中国本土	600	1,000,000
qwen3.6-27b	中国本土	600	1,000,000
qwen3.5-397b-a17b	中国本土	600	1,000,000
qwen3.5-122b-a10b	中国本土	600	1,000,000
qwen3.5-27b	中国本土	600	1,000,000
qwen3.5-35b-a3b	中国本土	600	1,000,000
qwen3-next-80b-a3b-thinking	中国本土	600	1,000,000
qwen3-next-80b-a3b-instruct	中国本土	600	1,000,000
qwen3-235b-a22b-thinking-2507	中国本土	600	1,000,000
qwen3-235b-a22b-instruct-2507	中国本土	600	1,000,000
qwen3-30b-a3b-thinking-2507	中国本土	600	1,000,000
qwen3-30b-a3b-instruct-2507	中国本土	600	1,000,000
qwen3-235b-a22b	中国本土	600	1,000,000
qwen3-30b-a3b	中国本土	600	1,000,000
qwen3-32b	中国本土	2400	1,000,000
qwen3-14b	中国本土	600	1,000,000
qwen3-8b	中国本土	600	1,000,000
qwen3-4b	中国本土	600	1,000,000
qwen3-1.7b	中国本土	600	1,000,000
qwen3-0.6b	中国本土	600	1,000,000
qwen2.5-3b-instruct	中国本土	1,200	2,000,000
qwen2.5-1.5b-instruct	中国本土	1,200	2,000,000
qwen2.5-0.5b-instruct	中国本土	1,200	2,000,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3.5-397b-a17b	グローバル	600	1,000,000
qwen3.5-122b-a10b	グローバル	600	1,000,000
qwen3.5-27b	グローバル	600	1,000,000
qwen3.6-35b-a3b	グローバル	600	1,000,000
qwen3.5-35b-a3b	グローバル	600	1,000,000
qwen3-next-80b-a3b-thinking	グローバル	600	1,000,000
qwen3-next-80b-a3b-instruct	グローバル	600	1,000,000
qwen3-235b-a22b-thinking-2507	グローバル	600	1,000,000
qwen3-235b-a22b-instruct-2507	グローバル	600	1,000,000
qwen3-30b-a3b-thinking-2507	グローバル	600	1,000,000
qwen3-30b-a3b-instruct-2507	グローバル	600	1,000,000
qwen3-235b-a22b	グローバル	600	1,000,000
qwen3-30b-a3b	グローバル	600	1,000,000
qwen3-32b	グローバル	600	1,000,000
qwen3-14b	グローバル	600	1,000,000
qwen3-8b	グローバル	600	1,000,000

Qwen-VL (視覚理解/Image-to-Text)

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-vl-32b-thinking	インターナショナル	60	100,000
qwen3-vl-32b-instruct	インターナショナル	60	100,000
qwen3-vl-30b-a3b-thinking	インターナショナル	60	100,000
qwen3-vl-30b-a3b-instruct	インターナショナル	60	100,000
qwen3-vl-8b-thinking	インターナショナル	60	100,000
qwen3-vl-8b-instruct	インターナショナル	60	100,000
qwen3-vl-235b-a22b-thinking	インターナショナル	60	100,000
qwen3-vl-235b-a22b-instruct	インターナショナル	60	100,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-vl-235b-a22b-thinking	グローバル	60	100,000
qwen3-vl-235b-a22b-instruct	グローバル	60	100,000
qwen3-vl-32b-thinking	グローバル	600	1,000,000
qwen3-vl-32b-instruct	グローバル	600	1,000,000
qwen3-vl-30b-a3b-thinking	グローバル	600	1,000,000
qwen3-vl-30b-a3b-instruct	グローバル	600	1,000,000
qwen3-vl-8b-thinking	グローバル	600	1,000,000
qwen3-vl-8b-instruct	グローバル	600	1,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-vl-32b-thinking	中国本土	600	1,000,000
qwen3-vl-32b-instruct	中国本土	600	1,000,000
qwen3-vl-30b-a3b-thinking	中国本土	600	1,000,000
qwen3-vl-30b-a3b-instruct	中国本土	600	1,000,000
qwen3-vl-8b-thinking	中国本土	600	1,000,000
qwen3-vl-8b-instruct	中国本土	600	1,000,000
qwen3-vl-235b-a22b-thinking	中国本土	60	100,000
qwen3-vl-235b-a22b-instruct	中国本土	60	100,000
qwen2-vl-72b-instruct	中国本土	1,200	1,000,000
qwen2-vl-7b-instruct	中国本土	1,200	1,000,000
qwen2-vl-2b-instruct	中国本土	1,200	1,000,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-vl-235b-a22b-thinking	グローバル	60	100,000
qwen3-vl-235b-a22b-instruct	グローバル	60	100,000
qwen3-vl-32b-thinking	グローバル	600	1,000,000
qwen3-vl-32b-instruct	グローバル	600	1,000,000
qwen3-vl-30b-a3b-thinking	グローバル	600	1,000,000
qwen3-vl-30b-a3b-instruct	グローバル	600	1,000,000
qwen3-vl-8b-thinking	グローバル	600	1,000,000
qwen3-vl-8b-instruct	グローバル	600	1,000,000

Qwen3-Omni

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen2.5-omni-7b

インターナショナル

100,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen2.5-omni-7b

中国本土

100,000

Qwen3-Omni-Captioner

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-omni-30b-a3b-captioner

インターナショナル

100,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-omni-30b-a3b-captioner

中国本土

100,000

Qwen-Math

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

Qwen-Coder

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-coder-next	インターナショナル	600	1,000,000
qwen3-coder-480b-a35b-instruct	インターナショナル	600	1,000,000
qwen3-coder-30b-a3b-instruct	インターナショナル	600	1,000,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-coder-480b-a35b-instruct	グローバル	600	1,000,000
qwen3-coder-30b-a3b-instruct	グローバル	600	1,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-coder-next	中国本土	600	1,000,000
qwen3-coder-480b-a35b-instruct	中国本土	600	1,000,000
qwen3-coder-30b-a3b-instruct	中国本土	600	1,000,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen3-coder-480b-a35b-instruct	グローバル	600	1,000,000
qwen3-coder-30b-a3b-instruct	グローバル	600	1,000,000
qwen3-coder-next	EU	600	1,000,000

テキスト生成 - サードパーティモデル

DeepSeek

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
deepseek-v4-pro	インターナショナル	10,000	1,200,000
deepseek-v4-flash	インターナショナル	10,000	1,200,000
deepseek-v3.2	インターナショナル	10,000	1,200,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
deepseek-v4-pro	グローバル	15,000	1,200,000
deepseek-v4-flash	グローバル	15,000	1,200,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
deepseek-v4-pro	中国本土	15,000	1,200,000
deepseek-v4-flash	中国本土	15,000	1,200,000
deepseek-v3.2 レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	15,000	1,200,000
deepseek-v3.2-exp	中国本土	15,000	1,200,000
deepseek-v3.1	中国本土	15,000	1,200,000
deepseek-r1-0528	中国本土	60	100,000
deepseek-r1 レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	15,000	1,200,000
deepseek-v3 レート制限は、バッチ API を使用したサービス呼び出しには適用されません。	中国本土	15,000	1,200,000
deepseek-r1-distill-qwen-7b	中国本土	15,000	1,200,000
deepseek-r1-distill-qwen-14b	中国本土	15,000	1,200,000
deepseek-r1-distill-qwen-32b	中国本土	15,000	1,200,000
deepseek-r1-distill-qwen-1.5b	中国本土	60	100,000
deepseek-r1-distill-llama-8b	中国本土	60	100,000
deepseek-r1-distill-llama-70b	中国本土	60	100,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
deepseek-v4-pro	グローバル	15,000	1,200,000
deepseek-v4-flash	グローバル	15,000	1,200,000

日本 (東京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限です。サービスは、RPS (RPM/60) および TPS (TPM/60) で 1 秒あたりの制限を適用する場合もあります
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含む
deepseek-v4-pro	日本	10,000	1,200,000
deepseek-v4-flash	日本	10,000	1,200,000
deepseek-v4-pro	グローバル	15,000	1,200,000
deepseek-v4-flash	グローバル	15,000	1,200,000

Kimi

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
kimi-k2.7-code	中国本土	500	1,000,000
kimi-k2.6	中国本土	500	1,000,000
kimi-k2.5	中国本土	500	1,000,000
kimi-k2-thinking	中国本土	500	1,000,000
Moonshot-Kimi-K2-Instruct	中国本土	500	1,000,000

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
kimi-k2.7-code	グローバル	500	1,000,000
kimi-k2.5	グローバル	500	1,000,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
kimi-k2.7-code	グローバル	500	1,000,000
kimi-k2.5	グローバル	500	1,000,000

香港 (中国)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

kimi-k2.7-code

グローバル

500

1,000,000

日本 (東京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限です。サービスは、RPS (RPM/60) および TPS (TPM/60) で 1 秒あたりの制限を適用する場合もあります

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含む

kimi-k2.5

グローバル

500

1,000,000

シンガポール

モデル名

サービス提供範囲

レート制限 (いずれかの値を超過するとトリガーされます)

以下は 1 分あたりの制限です。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます

kimi-k2.7-code

インターナショナル

500

1,000,000

MiniMax

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

MiniMax-M2.5

中国本土

500

1,000,000

GLM

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
glm-5.2	グローバル	500	1,000,000
glm-5.1	グローバル	500	1,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
glm-5.2	中国本土	500	1,000,000
glm-5.1	中国本土	500	1,000,000
glm-5	中国本土	500	1,000,000
glm-4.7	中国本土	500	1,000,000
glm-4.6	中国本土	60	1,000,000

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
glm-5.2	グローバル	500	1,000,000
glm-5.1	グローバル	500	1,000,000

シンガポール

モデル名

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

glm-5.1

500

1,000,000

香港 (中国)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

glm-5.2

グローバル

500

1,000,000

日本 (東京)

モデル名

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限です。サービスは、RPS (RPM/60) および TPS (TPM/60) で 1 秒あたりの制限を適用する場合もあります

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含む

glm-5.1

500

1,000,000

画像生成

Qwen-Image

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API 呼び出し制限	同時実行タスク数 (同時実行数)
qwen-image-2.0-pro	インターナショナル	2 回/分	同期 API には制限なし
qwen-image-2.0-pro-2026-06-22	インターナショナル	2 回/分	同期 API には制限なし
qwen-image-2.0-pro-2026-04-22	インターナショナル	2 回/分	同期 API には制限なし
qwen-image-2.0-pro-2026-03-03	インターナショナル	2 回/分	同期 API には制限なし
qwen-image-2.0	インターナショナル	2 回/秒	同期 API には制限なし
qwen-image-2.0-2026-03-03	インターナショナル	2 回/秒	同期 API には制限なし
qwen-image-max	インターナショナル	2 回/分	同期 API には制限なし
qwen-image-max-2025-12-30	インターナショナル	2 回/分	同期 API には制限なし
qwen-image-plus	インターナショナル	2 回/秒	同期 API には制限なし / 非同期 API には 2
qwen-image-plus-2026-01-09	インターナショナル	2 回/秒	同期 API には制限なし
qwen-image	インターナショナル	2 回/秒	同期 API には制限なし / 非同期 API には 2
qwen-image-edit-max	インターナショナル	2 回/分	同期 API には制限なし
qwen-image-edit-max-2026-01-16	インターナショナル	2 回/分	同期 API には制限なし
qwen-image-edit-plus	インターナショナル	2 回/秒	同期 API には制限なし
qwen-image-edit-plus-2025-12-15	インターナショナル	2 回/秒	同期 API には制限なし
qwen-image-edit-plus-2025-10-30	インターナショナル	2 回/秒	同期 API には制限なし
qwen-image-edit	インターナショナル	2 回/秒	同期 API には制限なし

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API 呼び出し制限	同時実行タスク数 (同時実行数)
qwen-image-2.0-pro	中国本土	2 回/分	同期 API には制限なし
qwen-image-2.0-pro-2026-06-22	中国本土	2 回/分	同期 API には制限なし
qwen-image-2.0-pro-2026-04-22	中国本土	2 回/分	同期 API には制限なし
qwen-image-2.0-pro-2026-03-03	中国本土	2 回/分	同期 API には制限なし
qwen-image-2.0	中国本土	2 回/秒	同期 API には制限なし
qwen-image-2.0-2026-03-03	中国本土	2 回/秒	同期 API には制限なし
qwen-image-max	中国本土	2 回/分	同期 API には制限なし
qwen-image-max-2025-12-30	中国本土	2 回/分	同期 API には制限なし
qwen-image-plus	中国本土	2 回/秒	同期 API には制限なし / 非同期 API には 2
qwen-image-plus-2026-01-09	中国本土	2 回/秒	同期 API には制限なし
qwen-image	中国本土	2 回/秒	同期 API には制限なし / 非同期 API には 2
qwen-image-edit-max	中国本土	2 回/分	同期 API には制限なし
qwen-image-edit-max-2026-01-16	中国本土	2 回/分	同期 API には制限なし
qwen-image-edit-plus	中国本土	2 回/秒	同期 API には制限なし
qwen-image-edit-plus-2025-12-15	中国本土	2 回/秒	同期 API には制限なし
qwen-image-edit-plus-2025-10-30	中国本土	2 回/秒	同期 API には制限なし
qwen-image-edit	中国本土	2 回/秒	同期 API には制限なし
qwen-mt-image	中国本土	1 回/秒	2

Text-to-image - Z-Image

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
		タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
z-image-turbo	インターナショナル	2	同期 API には制限なし

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
		タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
z-image-turbo	中国本土	2	同期 API には制限なし

Wanxiang

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
wan2.7-image-pro	インターナショナル	5	5
wan2.7-image	インターナショナル	5	5
wan2.6-image	インターナショナル	5	5
wan2.6-t2i	インターナショナル	5	5
wan2.5-t2i-preview	インターナショナル	5	5
wan2.2-t2i-flash	インターナショナル	2	2
wan2.2-t2i-plus	インターナショナル	2	2
wan2.1-t2i-turbo	インターナショナル	2	2
wan2.1-t2i-plus	インターナショナル	2	2
wan2.5-i2i-preview	インターナショナル	5	5

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
wan2.6-t2i	グローバル	5	5
wan2.6-image	グローバル	5	5

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
wan2.7-image-pro	中国本土	5	5
wan2.7-image	中国本土	5	5
wan2.6-image	中国本土	5	5
wan2.6-t2i	中国本土	1	5
wan2.5-t2i-preview	中国本土	5	5
wanx2.0-t2i-turbo	中国本土	2	2
wanx2.1-t2i-turbo	中国本土	2	2
wanx2.1-t2i-plus	中国本土	2	2
wan2.2-t2i-flash	中国本土	2	2
wan2.2-t2i-plus	中国本土	2	2
wan2.5-i2i-preview	中国本土	5	5
wanx2.1-imageedit	中国本土	2	2

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
wan2.6-t2i	グローバル	5	5
wan2.6-image	グローバル	5	5

OutfitAnyone

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	ジョブ送信 API の RPS 制限	同時実行タスク数
aitryon-plus	中国本土	10	5
aitryon-parsing-v1	中国本土	10	同期 API には制限なし

動画生成

HappyHorse シリーズ

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
happyhorse-1.1-t2v	インターナショナル	10	5
happyhorse-1.1-i2v	インターナショナル	10	5
happyhorse-1.1-r2v	インターナショナル	10	5
happyhorse-1.0-t2v	インターナショナル	10	5
happyhorse-1.0-i2v	インターナショナル	10	5
happyhorse-1.0-r2v	インターナショナル	10	5
happyhorse-1.0-video-edit	インターナショナル	10	5

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
happyhorse-1.1-t2v	グローバル	10	5
happyhorse-1.1-i2v	グローバル	10	5
happyhorse-1.1-r2v	グローバル	10	5
happyhorse-1.0-t2v	グローバル	10	5
happyhorse-1.0-i2v	グローバル	10	5
happyhorse-1.0-r2v	グローバル	10	5
happyhorse-1.0-video-edit	グローバル	10	5

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
happyhorse-1.1-t2v	中国本土	10	5
happyhorse-1.1-i2v	中国本土	10	5
happyhorse-1.1-r2v	中国本土	10	5
happyhorse-1.0-t2v	中国本土	10	5
happyhorse-1.0-i2v	中国本土	10	5
happyhorse-1.0-r2v	中国本土	10	5
happyhorse-1.0-video-edit	中国本土	10	5

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
happyhorse-1.1-t2v	グローバル	10	5
happyhorse-1.1-i2v	グローバル	10	5
happyhorse-1.1-r2v	グローバル	10	5
happyhorse-1.0-t2v	グローバル	10	5
happyhorse-1.0-i2v	グローバル	10	5
happyhorse-1.0-r2v	グローバル	10	5
happyhorse-1.0-video-edit	グローバル	10	5

香港 (中国)

モデル名	サービス提供範囲	レート制限 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API RPS 制限	同時実行タスク数 (同時実行数)
happyhorse-1.1-t2v	グローバル	10	5
happyhorse-1.1-i2v	グローバル	10	5
happyhorse-1.1-r2v	グローバル	10	5

Wanxiang シリーズ

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
wan2.7-t2v-2026-04-25	インターナショナル	5	5
wan2.7-t2v	インターナショナル	5	5
wan2.6-t2v	インターナショナル	5	5
wan2.5-t2v-preview	インターナショナル	5	5
wan2.2-t2v-plus	インターナショナル	2	2
wan2.1-t2v-turbo	インターナショナル	2	2
wan2.1-t2v-plus	インターナショナル	2	2
wan2.7-i2v-2026-04-25	インターナショナル	5	5
wan2.7-i2v	インターナショナル	5	5
wan2.6-i2v-flash	インターナショナル	5	5
wan2.6-i2v	インターナショナル	5	5
wan2.5-i2v-preview	インターナショナル	5	5
wan2.2-i2v-flash	インターナショナル	2	2
wan2.1-i2v-plus	インターナショナル	2	2
wan2.1-i2v-turbo	インターナショナル	2	2
wan2.2-i2v-plus	インターナショナル	2	2
wan2.2-kf2v-flash	インターナショナル	2	2
wan2.1-kf2v-plus	インターナショナル	1	2
wan2.1-vace-plus	インターナショナル	2	2
wan2.7-videoedit	インターナショナル	5	5
wan2.7-r2v	インターナショナル	5	5
wan2.6-r2v-flash	インターナショナル	5	5
wan2.6-r2v	インターナショナル	5	5
wan2.2-animate-move	インターナショナル	5	1
wan2.2-animate-mix	インターナショナル	5	1

米国 (バージニア)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
wan2.6-t2v	グローバル	5	5
wan2.6-i2v	グローバル	5	5
wan2.6-r2v	グローバル	5	5
wan2.6-t2v-us	米国	5	5
wan2.6-i2v-us	米国	5	5

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
wan2.7-t2v-2026-04-25	中国本土	5	5
wan2.7-t2v	中国本土	5	5
wan2.6-t2v	中国本土	5	5
wan2.5-t2v-preview	中国本土	5	5
wan2.2-t2v-plus	中国本土	2	2
wanx2.1-t2v-turbo	中国本土	2	2
wanx2.1-t2v-plus	中国本土	2	2
wan2.7-i2v-2026-04-25	中国本土	5	5
wan2.7-i2v	中国本土	5	5
wan2.6-i2v-flash	中国本土	5	5
wan2.6-i2v	中国本土	5	5
wan2.5-i2v-preview	中国本土	5	5
wan2.2-i2v-plus	中国本土	2	2
wanx2.1-i2v-turbo	中国本土	2	2
wanx2.1-i2v-plus	中国本土	2	2
wan2.2-kf2v-flash	中国本土	2	2
wanx2.1-kf2v-plus	中国本土	2	2
wanx2.1-vace-plus	中国本土	2	2
wan2.7-videoedit	中国本土	5	5
wan2.7-r2v	中国本土	5	5
wan2.6-r2v-flash	中国本土	5	5
wan2.6-r2v	中国本土	5	5
wan2.2-s2v-detect	中国本土	5	同期 API には制限なし
wan2.2-s2v	中国本土	5	1
wan2.2-animate-move	中国本土	5	1
wan2.2-animate-mix	中国本土	5	1

ドイツ (フランクフルト)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます)
モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数 (同時実行数)
wan2.6-t2v	グローバル	5	5
wan2.6-i2v	グローバル	5	5
wan2.6-r2v	グローバル	5	5

AnimateAnyone

中国 (北京)

モデル名	サービス提供範囲	タスク送信 API の RPS 制限	同時実行タスク数
animate-anyone-detect-gen2	中国本土	5	同期 API には制限なし
animate-anyone-template-gen2	中国本土	5	1 一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。
animate-anyone-gen2	中国本土	5	1 一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

EMO

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

emo-detect-v1

中国本土

同期 API には制限なし

emo-v1

中国本土

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

LivePortrait

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

liveportrait-detect

中国本土

同期 API には制限なし

liveportrait

中国本土

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

VideoRetalk

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

videoretalk

中国本土

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

Emoji

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

emoji-detect-v1

中国本土

同期 API には制限なし

emoji-v1

中国本土

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

動画スタイル変換

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

video-style-transform

中国本土

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

音楽生成

中国 (北京)

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
fun-music-preview	中国本土	180
fun-music-v1	中国本土	180

音声合成 (Text-to-Speech)

Qwen 音声合成

シンガポール

Qwen3-TTS-Instruct-Flash

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-instruct-flash	インターナショナル	180
qwen3-tts-instruct-flash-2026-01-26	インターナショナル	180

Qwen3-TTS-VD

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-vd-2026-01-26	インターナショナル	180

Qwen3-TTS-VC

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-vc-2026-01-22	インターナショナル	180

Qwen3-TTS-Flash

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-flash	インターナショナル	180
qwen3-tts-flash-2025-11-27	インターナショナル	180
qwen3-tts-flash-2025-09-18	インターナショナル	10

中国 (北京)

Qwen3-TTS-Instruct-Flash

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-instruct-flash	中国本土	180
qwen3-tts-instruct-flash-2026-01-26	中国本土	180

Qwen3-TTS-VD

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-vd-2026-01-26	中国本土	180

Qwen3-TTS-VC

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-vc-2026-01-22	中国本土	180

Qwen3-TTS-Flash

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-flash	中国本土	180
qwen3-tts-flash-2025-11-27	中国本土	180
qwen3-tts-flash-2025-09-18	中国本土	10

Qwen-TTS

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります
		1 分あたりのリクエスト数 (RPM)	1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む
qwen-tts	中国本土	10	100,000
qwen-tts-latest	中国本土
qwen-tts-2025-05-22	中国本土
qwen-tts-2025-04-10	中国本土

Qwen リアルタイム音声合成

シンガポール

Qwen3-TTS-Instruct-Flash-Realtime

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-instruct-flash-realtime	インターナショナル	180
qwen3-tts-instruct-flash-realtime-2026-01-22	インターナショナル	180

Qwen3-TTS-VD-Realtime

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-vd-realtime-2026-01-15	インターナショナル	180
qwen3-tts-vd-realtime-2025-12-16	インターナショナル	180

Qwen3-TTS-VC-Realtime

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-vc-realtime-2026-01-15	インターナショナル	180
qwen3-tts-vc-realtime-2025-11-27	インターナショナル	180

Qwen3-TTS-Flash-Realtime

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-flash-realtime	インターナショナル	180
qwen3-tts-flash-realtime-2025-11-27	インターナショナル	180
qwen3-tts-flash-realtime-2025-09-18	インターナショナル	10

中国 (北京)

Qwen3-TTS-Instruct-Flash-Realtime

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-instruct-flash-realtime	中国本土	180
qwen3-tts-instruct-flash-realtime-2026-01-22	中国本土	180

Qwen3-TTS-VD-Realtime

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-vd-realtime-2026-01-15	中国本土	180
qwen3-tts-vd-realtime-2025-12-16	中国本土	180

Qwen3-TTS-VC-Realtime

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-vc-realtime-2026-01-15	中国本土	180
qwen3-tts-vc-realtime-2025-11-27	中国本土	180

Qwen3-TTS-Flash-Realtime

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-tts-flash-realtime	中国本土	180
qwen3-tts-flash-realtime-2025-11-27	中国本土	180
qwen3-tts-flash-realtime-2025-09-18	中国本土	10

Qwen-TTS-Realtime

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります
		1 分あたりのリクエスト数 (RPM)	1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む
qwen-tts-realtime	中国本土	10	100,000
qwen-tts-realtime-latest	中国本土
qwen-tts-realtime-2025-07-15	中国本土

Qwen 音声クローニング

シンガポール

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen-voice-enrollment	インターナショナル	180

中国 (北京)

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen-voice-enrollment	中国本土	180

Qwen 音声デザイン

シンガポール

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen-voice-design	インターナショナル	180

中国 (北京)

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen-voice-design	中国本土	180

CosyVoice 音声合成

シンガポール

モデル名	サービス提供範囲	ジョブ送信 API RPS 制限
cosyvoice-v3-plus	インターナショナル	3
cosyvoice-v3-flash	インターナショナル	3

中国 (北京)

モデル名	サービス提供範囲	ジョブ送信 API RPS 制限
cosyvoice-v3.5-plus	中国本土	3
cosyvoice-v3.5-flash	中国本土
cosyvoice-v3-plus	中国本土
cosyvoice-v3-flash	中国本土
cosyvoice-v2	中国本土

CosyVoice 音声クローニング/デザイン

CosyVoice 音声クローニングモデルは、単一のモデルと共有のレート制限クォータを共有します。

シンガポール

モデル名	サービス提供範囲	ジョブ送信 API RPS 制限
voice-enrollment	インターナショナル	10

中国 (北京)

モデル名	サービス提供範囲	ジョブ送信 API RPS 制限
voice-enrollment	中国本土	10

音声認識 (音声テキスト変換) と翻訳 (指定言語への音声テキスト変換)

Qwen3-LiveTranslate-Flash

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む
qwen3-livetranslate-flash	インターナショナル	100	100,000
qwen3-livetranslate-flash-2025-12-01	インターナショナル	6,000	1,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります
		1 分あたりのリクエスト数 (RPM)	1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む
qwen3-livetranslate-flash	中国本土	100	100,000
qwen3-livetranslate-flash-2025-12-01	中国本土

Qwen-LiveTranslate-Flash-Realtime

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります
		1 分あたりのリクエスト数 (RPM)	1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む
qwen3.5-livetranslate-flash-realtime	インターナショナル	10	100,000
qwen3.5-livetranslate-flash-realtime-2026-05-19	インターナショナル
qwen3-livetranslate-flash-realtime	インターナショナル
qwen3-livetranslate-flash-realtime-2025-09-22	インターナショナル

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます) 以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります
		1 分あたりのリクエスト数 (RPM)	1 分あたりの消費トークン数 (TPM) 入力トークンと出力トークンを含む
qwen3.5-livetranslate-flash-realtime	中国本土	10	100,000
qwen3.5-livetranslate-flash-realtime-2026-05-19	中国本土
qwen3-livetranslate-flash-realtime	中国本土
qwen3-livetranslate-flash-realtime-2025-09-22	中国本土

Qwen 音声ファイル認識

シンガポール

Qwen3-ASR-Flash-Filetrans

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-asr-flash-filetrans	インターナショナル	100
qwen3-asr-flash-filetrans-2025-11-17	インターナショナル	100

Qwen3-ASR-Flash

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-asr-flash	インターナショナル	100
qwen3-asr-flash-2026-02-10	インターナショナル
qwen3-asr-flash-2025-09-08	インターナショナル

米国 (バージニア)

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-asr-flash-us	米国	100
qwen3-asr-flash-2025-09-08-us	米国	100

中国 (北京)

Qwen3-ASR-Flash-Filetrans

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-asr-flash-filetrans	中国本土	100
qwen3-asr-flash-filetrans-2025-11-17	中国本土	100

Qwen3-ASR-Flash

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
qwen3-asr-flash	中国本土	100
qwen3-asr-flash-2026-02-10	中国本土
qwen3-asr-flash-2025-09-08	中国本土

Qwen リアルタイム音声認識

シンガポール

モデル名	サービス提供範囲	1 秒あたりのリクエスト数 (RPS)
qwen3-asr-flash-realtime	インターナショナル	20
qwen3-asr-flash-realtime-2026-02-10	インターナショナル
qwen3-asr-flash-realtime-2025-10-27	インターナショナル

中国 (北京)

モデル名	サービス提供範囲	1 秒あたりのリクエスト数 (RPS)
qwen3-asr-flash-realtime	中国本土	20
qwen3-asr-flash-realtime-2026-02-10	中国本土
qwen3-asr-flash-realtime-2025-10-27	中国本土

Paraformer音声認識

中国 (北京)

モデル名	サービス提供範囲	ジョブ送信 API RPS 制限
paraformer-realtime-v2	中国本土	20
paraformer-realtime-8k-v2	中国本土	20

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
paraformer-v2	中国本土	1,200

モデル名	サービス提供範囲	ジョブ送信 API RPS 制限	同時処理タスク数 (同時実行数)
paraformer-8k-v2	中国本土	20	100

Fun-ASR 音声ファイル認識

シンガポール

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
fun-asr	インターナショナル	600
fun-asr-2025-11-07	インターナショナル	600
fun-asr-2025-08-25	インターナショナル	600
fun-asr-mtl	インターナショナル	100
fun-asr-mtl-2025-08-25	インターナショナル	100
fun-asr-flash-2026-06-15	インターナショナル	600

中国 (北京)

モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)
fun-asr	中国本土	600
fun-asr-2025-11-07	中国本土
fun-asr-2025-08-25	中国本土
fun-asr-mtl	中国本土
fun-asr-mtl-2025-08-25	中国本土
fun-asr-flash-2026-06-15	中国本土

Fun-ASR リアルタイム音声認識

シンガポール

モデル名	サービス提供範囲	ジョブ送信 API RPS 制限
fun-asr-realtime	インターナショナル	20
fun-asr-realtime-2025-11-07	インターナショナル	20

中国 (北京)

モデル名	サービス提供範囲	ジョブ送信 API RPS 制限
fun-asr-realtime	中国本土	20
fun-asr-realtime-2026-02-28	中国本土
fun-asr-realtime-2025-11-07	中国本土
fun-asr-realtime-2025-09-15	中国本土
fun-asr-flash-8k-realtime	中国本土
fun-asr-flash-8k-realtime-2026-01-28	中国本土

テキスト埋め込み

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM)/ジョブ数入力トークンと出力トークンを含みます。
text-embedding-v4	インターナショナル	1,800	1,000,000
text-embedding-v3	インターナショナル	6,000	24,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

1 秒あたりのリクエスト数 (RPS)

1 分あたりのトークン数 (TPM)/ジョブ数

入力トークンと出力トークンを含みます。

text-embedding-v4

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

1,200,000

香港 (中国)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)/ジョブ数

入力トークンと出力トークンを含みます。

text-embedding-v4

香港 (中国)

1,800

1,000,000

マルチモーダル埋め込み

シンガポール

モデル名	サービス提供範囲	レート制限条件以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンのみ。
tongyi-embedding-vision-plus	インターナショナル	600	200,000
tongyi-embedding-vision-flash	インターナショナル	600	200,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンのみ。
qwen3-vl-embedding	中国本土	2,400	1,200,000
multimodal-embedding-v1	中国本土	120	100,000

ソートモデル

シンガポール

モデル名

サービス提供範囲

レート制限条件

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンのみ。

qwen3-rerank

インターナショナル

5,400

5,000,000,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンのみ。
qwen3-vl-rerank	中国本土	600	9,000,000
gte-rerank-v2	中国本土	5,040	4,980,000,000

業界

意図認識

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

tongyi-intent-detect-v3

中国本土

1,200

1,000,000

ロール想定

シンガポール

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-plus-character	インターナショナル	120	500,000
qwen-flash-character	インターナショナル	120	500,000
qwen-plus-character-ja	インターナショナル	120	500,000

中国 (北京)

モデル名	サービス提供範囲	レート制限条件 (いずれかの値を超過するとトリガーされます) 以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。
モデル名	サービス提供範囲	1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
qwen-plus-character	中国本土	120	500,000
qwen-flash-character	中国本土	120	500,000

オフラインモデル

詳細については、「モデル非公開ポリシー」をご参照ください。

2026 年 1 月 30 日にオフライン

カテゴリ	モデル名	レート制限条件 (いずれかの値を超過するとトリガーされます)
		1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
Qwen-Plus	qwen-plus-2024-11-27	0	0
	qwen-plus-2024-11-25
	qwen-plus-2024-09-19
	qwen-plus-2024-08-06
Qwen-Turbo	qwen-turbo-2024-09-19
Qwen-VL	qwen-vl-max-2024-10-30
	qwen-vl-max-2024-08-09
	qwen-vl-plus-2024-08-09

2025 年 8 月 20 日にオフライン

カテゴリ	モデル名	レート制限条件 (いずれかの値を超過するとトリガーされます)
		1 分あたりのリクエスト数 (RPM)	1 分あたりのトークン数 (TPM) 入力トークンと出力トークンを含みます。
テキスト生成 - Qwen	qwen2-72b-instruct	0	0
	qwen2-57b-a14b-instruct
	qwen2-7b-instruct
	qwen1.5-110b-chat
	qwen1.5-72b-chat
	qwen1.5-32b-chat
	qwen1.5-14b-chat
	qwen1.5-7b-chat