すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:レート制限

最終更新日:Jun 27, 2026

Alibaba Cloud Model Studio は、Alibaba Cloud アカウントレベルでモデル呼び出しにレート制限を適用し、アカウント配下のすべての RAM ユーザー、ワークスペース、API キーの使用量を集計します。制限を超えるとリクエストは拒否されますが、通常は 1 分以内に自動的に回復します。

レート制限のルール

  • アカウントレベルのレート制限:レート制限はルートアカウントレベルで適用されます。アカウント配下のすべての RAM ユーザー、ワークスペース、API キーの使用量が合算されます。

  • モデル固有のレート制限:各モデルには独自のレート制限があります。詳細については、以下の表をご参照ください。

よくある質問

レート制限がトリガーされる原因

エラーメッセージに基づいてトリガーされたレート制限の種類を特定できます:

  • Requests rate limit exceeded または You exceeded your current requests list:これは、1 分あたりのリクエスト数 (RPM) の制限がトリガーされたことを示します。

  • Allocated quota exceeded または You exceeded your current quota:これは、1 分あたりのトークン数 (TPM) の制限がトリガーされたことを示します。

  • Request rate increased too quickly:短時間でリクエスト頻度が急増し、システムの安定性保護がトリガーされました。これは、呼び出しの総数が RPM または TPM の制限に達していない場合でも発生する可能性があります。

  • その他のエラーについては、「エラーコード」をご参照ください。

RPM と TPM に加えて、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) の秒単位レベルでレート制限が適用される場合があります。1 分あたりの呼び出し総数が制限を超えていなくても、短時間のリクエストのバーストによってレート制限がトリガーされる可能性があります。

モデル使用量の確認方法

モデルを呼び出してから 1 時間後に、モニタリング (シンガポール または 北京) ページに移動します。時間範囲やワークスペースなどのクエリ条件を設定します。次に、[モデル] エリアで対象のモデルを見つけ、[操作] 列の [モニター] をクリックして、モデルの呼び出し統計を表示します。詳細については、「モニタリング」ドキュメントをご参照ください。

データは 1 時間ごとに更新されます。ピーク時には、1 時間レベルの遅延が発生する場合があります。

image

レート制限からの回復時間

通常、回復は 1 分以内に完了します。その他のエラーが発生した場合は、「エラーコード」でトラブルシューティングをご参照ください。

レート制限を回避する方法

  1. より高いレート制限を持つモデルの選択:安定版または最新バージョンは、古いスナップショットバージョンよりもレート制限が高くなっています。

  2. 呼び出し戦略の最適化

    • 呼び出し頻度の削減Requests rate limit exceeded または You exceeded your current requests list エラーが発生した場合は、API の呼び出し頻度を下げてください。

    • トークン消費量の削減Allocated quota exceeded または You exceeded your current quota エラーが発生した場合は、入力を短くするか、出力長を制限してください。

    • リクエストレートの平滑化Request rate increased too quickly エラーが発生した場合は、均一スケジューリング、指数バックオフ、またはリクエストキューを使用してリクエストを均等に分散させ、突然のピークを回避してください。

  3. バックアップモデルの追加

    レート制限がトリガーされた場合、バックアップモデルに切り替えて生成を継続できます。これにより、失敗の確率を低減し、スループットを向上させることができます。以下のコードは、qwen-plus-2025-07-28 のレート制限がトリガーされた後、qwen-plus-2025-07-14 で自動的にリトライします。

    サンプルコード

    import os
    import asyncio
    from openai import AsyncOpenAI, APIStatusError
    
    # 設定
    API_KEY = os.getenv("DASHSCOPE_API_KEY")
    # プライマリモデル
    MODEL = "qwen-plus-2025-07-28"
    # バックアップモデル
    BACKUP_MODEL = "qwen-plus-2025-07-14"
    # テスト用の質問
    QUESTION = "Who are you?"
    # 同時実行数の設定
    NUM_REQUESTS = 10
    
    client = AsyncOpenAI(
        api_key=API_KEY,
        # 呼び出す際、{WorkspaceId} を実際のワークスペース ID に置き換えてください。
        base_url="https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1"
    )
    
    async def send_request(model):
        """単一のリクエストを送信します。"""
        try:
            await client.chat.completions.create(
                model=model,
                messages=[{"role": "user", "content": QUESTION}]
            )
            return True
        except APIStatusError as e:
            if e.status_code == 429:
                print(f"[Rate limit triggered] Model {model}")
                return False
            raise
        except Exception as e:
            print(f"[Request failed] Model {model}, Error: {e}")
            return False
    
    async def task(i):
        # プライマリモデルを試します。
        if await send_request(MODEL):
            return True
        # レート制限された場合は、バックアップモデルを試します。
        return await send_request(BACKUP_MODEL)
    
    async def main():
        results = await asyncio.gather(*(task(i) for i in range(NUM_REQUESTS)))
        print(f"Successful requests: {sum(results)}, Failed requests: {len(results) - sum(results)}")
    
    if __name__ == "__main__":
        asyncio.run(main())
  4. タスクの分割:長い会話や大きなドキュメントは、すぐに多くのトークンを消費する可能性があります。大きなバッチタスクをより小さなバッチに分割し、異なる時間に送信することができます。

  5. バッチ推論の使用:リアルタイムの応答を必要としないタスクには、バッチ API を使用できます。バッチリクエストはリアルタイムのレート制限の対象外ですが、キューイングと処理時間を考慮する必要があります。

  6. レート制限の引き上げ:デフォルトのレート制限が不十分な場合は、Model Studio コンソールの [レート制限の引き上げ] ページでモデルの一時的な TPM クォータを引き上げることができます。この引き上げはすぐに有効になります。詳細については、「一時的なレート制限の引き上げ」をご参照ください。

トークン使用量またはコストの管理方法

レート制限は単位時間あたりのリクエストレートを制限するだけで、累積使用量の上限を設定するものではありません。トークン使用量やコストを管理するには、以下の方法を使用します:

  • 利用上限とコストアラートの設定[請求] カードで [コストアラート] を設定し、月間の利用上限としきい値の通知を有効にします。しきい値に達すると通知され、過剰な支出を回避するのに役立ちます。詳細については、「請求書の照会とコストの管理」をご参照ください。

  • 無料クォータを使い切った場合に停止を有効にする:無料クォータを提供するモデルの場合、[無料クォータを使い切った場合に停止] を有効にすると、無料クォータが使い果たされると自動的に呼び出しが停止し、追加料金の発生を防ぎます。詳細については、「無料クォータ」をご参照ください。

  • モデル使用量のモニタリング:各モデルのトークン使用量を定期的に確認し、異常な増加を早期に検出します。上記の「モデル使用量の確認方法」をご参照ください。

一時的なレート制限の引き上げ

デフォルトのレート制限が不十分な場合、Model Studio コンソールでモデルの一時的な TPM クォータを引き上げることができます。この引き上げはすぐに有効になり、30 日間有効です。有効期間が切れると、クォータは自動的にシステムのデフォルト値に戻ります。

この機能は現在、中国 (北京) およびシンガポールリージョンで利用可能です。

  1. Model Studio コンソールにログインし、レート制限の引き上げ ページに移動します。

  2. 右上隅の[一時的なモデルレート制限の引き上げ]をクリックします。

  3. 表示されるダイアログボックスで、[モデル] を選択し、[トークンアカウント制限 (トークン/60秒)] に希望の値を入力します。ダイアログボックスには、現在のクォータと設定可能な最大値が表示されます。

  4. [OK] をクリックします。引き上げられたクォータはすぐに有効になります。

クォータの引き上げが有効になった後、以下の方法で確認できます:

  • レート制限の引き上げ ページで、クォータが引き上げられたモデルとそれに対応するレート制限データをリストで表示します。

  • モデルリスト で、対応するモデルの詳細ページに移動し、更新されたレート制限データを表示します。

説明
  • 一時的にクォータを引き上げることができるモデルは、レート制限の引き上げ ページのダイアログボックスにリストされています。

  • すでにクォータが引き上げられているモデルに対して再度リクエストを送信すると、新しい申請と見なされ、有効期間は 30 日間にリセットされます。

  • 実際のニーズに基づいてクォータをリクエストしてください。プロビジョニング済み容量が長期間にわたって実際の使用量を大幅に上回る場合、システムは事前の通知後にデフォルト値に復元することがあります。

テキスト生成 - Qwen

Qwen 言語モデル

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.7-max

インターナショナル

600

1,000,000

qwen3.7-max-2026-06-08

インターナショナル

60

1,000,000

qwen3.7-max-2026-05-20

インターナショナル

60

1,000,000

qwen3.7-max-preview

インターナショナル

600

1,000,000

qwen3.7-max-2026-05-17

インターナショナル

600

1,000,000

qwen3.6-max-preview

インターナショナル

600

1,000,000

qwen3-max

インターナショナル

600

1,000,000

qwen3-max-2026-01-23

インターナショナル

600

1,000,000

qwen3-max-2025-09-23

インターナショナル

60

100,000

qwen3-max-preview

インターナショナル

600

1,000,000

qwen-max

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

インターナショナル

600

1,000,000

qwen3.7-plus

インターナショナル

15,000

5,000,000

qwen3.7-plus-2026-05-26

インターナショナル

60

1,000,000

qwen3.6-plus

インターナショナル

15,000

5,000,000

qwen3.6-plus-2026-04-02

インターナショナル

60

1,000,000

qwen3.6-flash

インターナショナル

15,000

5,000,000

qwen3.6-flash-2026-04-16

インターナショナル

60

1,000,000

qwen3.5-plus

インターナショナル

15,000

6,000,000

qwen3.5-plus-2026-04-20

インターナショナル

600

1,000,000

qwen3.5-plus-2026-02-15

インターナショナル

60

1,000,000

qwen-plus

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

インターナショナル

600

1,500,000

qwen-plus-latest

インターナショナル

600

1,000,000

qwen-plus-2025-12-01

インターナショナル

120

1,000,000

qwen-plus-2025-09-11

インターナショナル

120

1,000,000

qwen-plus-2025-07-28

インターナショナル

60

100,000

qwen-plus-2025-07-14

(qwen-plus-0714)

インターナショナル

60

100,000

qwen-plus-2025-04-28

(qwen-plus-0428)

インターナショナル

60

1,000,000

qwen-plus-2025-01-25

(qwen-plus-0125)

インターナショナル

60

100,000

qwen3.5-flash

インターナショナル

15,000

5,000,000

qwen3.5-flash-2026-02-23

インターナショナル

60

1,000,000

qwen-flash

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

インターナショナル

600

5,000,000

qwen-flash-2025-07-28

インターナショナル

600

5,000,000

qwq-plus

インターナショナル

60

100,000

qwen-turbo

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

インターナショナル

600

5,000,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.7-max

グローバル

30,000

5,000,000

qwen3.7-max-2026-06-08

グローバル

600

1,000,000

qwen3.7-max-2026-05-20

グローバル

600

1,000,000

qwen3-max

グローバル

600

1,000,000

qwen3-max-preview

グローバル

600

1,000,000

qwen3-max-2025-09-23

グローバル

60

100,000

qwen3.7-plus

グローバル

30,000

5,000,000

qwen3.7-plus-2026-05-26

グローバル

600

1,000,000

qwen3.6-plus

グローバル

30,000

5,000,000

qwen3.6-plus-2026-04-02

グローバル

600

1,000,000

qwen3.6-flash

グローバル

15,000

5,000,000

qwen3.6-flash-2026-04-16

グローバル

60

1,000,000

qwen3.5-plus

グローバル

30,000

5,000,000

qwen3.5-plus-2026-02-15

グローバル

600

1,000,000

qwen-plus

グローバル

15,000

5,000,000

qwen-plus-us

米国

600

1,000,000

qwen-plus-2025-12-01

グローバル

60

1,000,000

qwen-plus-2025-09-11

グローバル

60

1,000,000

qwen-plus-2025-07-28

グローバル

60

1,000,000

qwen-plus-2025-12-01-us

米国

60

1,000,000

qwen3.5-flash

グローバル

30,000

10,000,000

qwen3.5-flash-2026-02-23

グローバル

600

1,000,000

qwen-flash

グローバル

15,000

10,000,000

qwen-flash-us

米国

600

5,000,000

qwen-flash-2025-07-28

グローバル

60

1,000,000

qwen-flash-2025-07-28-us

米国

600

5,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.7-max

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

30,000

5,000,000

qwen3.7-max-2026-06-08

中国本土

600

1,000,000

qwen3.7-max-2026-05-20

中国本土

600

1,000,000

qwen3.6-max-preview

中国本土

600

1,000,000

qwen3-max

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

30,000

5,000,000

qwen3-max-2026-01-23

中国本土

600

1,000,000

qwen3-max-2025-09-23

中国本土

60

100,000

qwen3-max-preview

中国本土

600

1,000,000

qwen-max

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

1,200

1,000,000

qwen3.7-plus

中国本土

30,000

5,000,000

qwen3.7-plus-2026-05-26

中国本土

600

1,000,000

qwen3.6-plus

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

30,000

5,000,000

qwen3.6-plus-2026-04-02

中国本土

600

1,000,000

qwen3.6-flash

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

30,000

10,000,000

qwen3.6-flash-2026-04-16

中国本土

600

1,000,000

qwen3.5-plus

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

30,000

5,000,000

qwen3.5-plus-2026-04-20

中国本土

600

1,000,000

qwen3.5-plus-2026-02-15

中国本土

600

1,000,000

qwen-plus

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

30,000

5,000,000

qwen-plus-latest

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

15,000

1,200,000

qwen-plus-2025-12-01

中国本土

120

1,000,000

qwen-plus-2025-09-11

中国本土

60

1,000,000

qwen-plus-2025-07-28

(qwen-plus-0728)

中国本土

60

1,000,000

qwen-plus-2025-07-14

(qwen-plus-0714)

中国本土

60

100,000

qwen-plus-2025-04-28

(qwen-plus-0428)

中国本土

60

1,000,000

qwen-plus-2025-01-25

(qwen-plus-0125)

中国本土

60

150,000

qwen-plus-2025-01-12

(qwen-plus-0112)

中国本土

60

150,000

qwen-plus-2024-12-20

(qwen-plus-1220)

中国本土

60

150,000

qwen3.5-flash

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

30,000

10,000,000

qwen3.5-flash-2026-02-23

中国本土

600

1,000,000

qwen-flash

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

30,000

10,000,000

qwen-flash-2025-07-28

中国本土

60

1,000,000

qwq-plus

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

600

1,000,000

qwen-turbo

中国本土

1,200

5,000,000

qwen-long-latest

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

1,200

60,000

qwen-long-2025-01-25

(qwen-long-0125)

中国本土

3

7,500

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.7-max

グローバル

30,000

5,000,000

qwen3.7-max-2026-06-08

グローバル

600

1,000,000

qwen3.7-max-2026-05-20

グローバル

600

1,000,000

qwen3-max

グローバル

600

1,000,000

qwen3-max

EU

600

1,000,000

qwen3-max-preview

グローバル

600

1,000,000

qwen3-max-2026-01-23

EU

600

1,000,000

qwen3-max-2025-09-23

グローバル

60

100,000

qwen3.7-plus

グローバル

30,000

5,000,000

qwen3.7-plus-2026-05-26

グローバル

600

1,000,000

qwen3.6-plus

グローバル

30,000

5,000,000

qwen3.6-plus-2026-04-02

グローバル

600

1,000,000

qwen3.6-flash

グローバル

15,000

5,000,000

qwen3.6-flash-2026-04-16

グローバル

60

1,000,000

qwen3.5-plus

グローバル

30,000

5,000,000

qwen3.5-plus-2026-02-15

グローバル

600

1,000,000

qwen-plus

グローバル

15,000

5,000,000

qwen-plus

EU

600

1,000,000

qwen-plus-2025-12-01

グローバル

60

1,000,000

qwen-plus-2025-12-01

EU

120

1,000,000

qwen-plus-2025-09-11

グローバル

60

1,000,000

qwen-plus-2025-07-28

グローバル

60

1,000,000

qwen3.5-flash

グローバル

30,000

10,000,000

qwen3.5-flash

EU

30,000

10,000,000

qwen3.5-flash-2026-02-23

グローバル

600

1,000,000

qwen3.5-flash-2026-02-23

EU

600

1,000,000

qwen-flash

グローバル

15,000

10,000,000

qwen-flash-2025-07-28

グローバル

60

1,000,000

香港 (中国)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-max

香港 (中国)

600

1,000,000

qwen3-max-2026-01-23

香港 (中国)

600

1,000,000

qwen3.6-plus

グローバル

30,000

5,000,000

qwen3.6-flash

グローバル

15,000

5,000,000

qwen-plus

香港 (中国)

600

1,000,000

qwen-plus-2025-12-01

香港 (中国)

120

1,000,000

qwen3.5-flash

香港 (中国)

15,000

5,000,000

qwen3.5-flash-2026-02-23

香港 (中国)

60

1,000,000

日本 (東京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限です。サービスは、RPS (RPM/60) および TPS (TPM/60) で 1 秒あたりの制限を適用する場合もあります

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含む

qwen3.7-max

グローバル

30,000

5,000,000

qwen3.7-max-2026-05-20

グローバル

600

1,000,000

qwen3.7-plus

グローバル

30,000

5,000,000

qwen3.7-plus-2026-05-26

グローバル

600

1,000,000

qwen3.7-plus

日本

15,000

5,000,000

qwen3.7-plus-2026-05-26

日本

60

1,000,000

qwen3.6-plus

グローバル

30,000

5,000,000

qwen3.6-plus-2026-04-02

グローバル

600

1,000,000

qwen3.6-flash

グローバル

15,000

5,000,000

qwen3.6-flash-2026-04-16

グローバル

60

1,000,000

Qwen-VL (視覚理解/Image-to-Text)

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-vl-plus

インターナショナル

1,200

1,000,000

qwen3-vl-plus-2025-12-19

インターナショナル

60

100,000

qwen3-vl-plus-2025-09-23

インターナショナル

120

1,000,000

qwen3-vl-flash

インターナショナル

1,200

1,000,000

qwen3-vl-flash-2026-01-22

インターナショナル

60

100,000

qwen3-vl-flash-2025-10-15

インターナショナル

120

1,000,000

qwen-vl-max

インターナショナル

1,200

1,000,000

qwen-vl-plus

インターナショナル

1,200

1,000,000

qvq-max

インターナショナル

60

100,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-vl-plus

グローバル

1,200

1,000,000

qwen3-vl-plus-2025-09-23

グローバル

60

100,000

qwen3-vl-flash

グローバル

1,200

1,000,000

qwen3-vl-flash-us

米国

1,200

1,000,000

qwen3-vl-flash-2025-10-15

グローバル

60

100,000

qwen3-vl-flash-2026-01-22-us

米国

120

1,000,000

qwen3-vl-flash-2025-10-15-us

米国

120

1,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-vl-plus

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

3,000

5,000,000

qwen3-vl-plus-2025-12-19

中国本土

60

100,000

qwen3-vl-plus-2025-09-23

中国本土

60

100,000

qwen3-vl-flash

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

3,000

5,000,000

qwen3-vl-flash-2026-01-22

中国本土

60

100,000

qwen3-vl-flash-2025-10-15

中国本土

60

100,000

qwen-vl-max

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

1,200

1,000,000

qwen-vl-plus

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

1,200

1,000,000

qvq-max

中国本土

60

100,000

qvq-plus

中国本土

60

100,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-vl-plus

グローバル

1,200

1,000,000

qwen3-vl-plus

EU

1,200

1,000,000

qwen3-vl-plus-2025-09-23

グローバル

60

100,000

qwen3-vl-flash

グローバル

1,200

1,000,000

qwen3-vl-flash

EU

1,200

1,000,000

qwen3-vl-flash-2026-01-22

EU

60

100,000

qwen3-vl-flash-2025-10-15

グローバル

60

100,000

qwen3-vl-flash-2025-10-15

EU

60

100,000

香港 (中国)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-vl-plus

香港 (中国)

1,200

1,000,000

qwen3-vl-plus-2025-12-19

香港 (中国)

60

100,000

Qwen-Omni (オムニモーダル)

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.5-omni-flash

インターナショナル

60

100,000

qwen3.5-omni-flash-2026-03-15

インターナショナル

60

100,000

qwen3.5-omni-plus

インターナショナル

60

100,000

qwen3.5-omni-plus-2026-03-15

インターナショナル

60

100,000

qwen3-omni-flash

インターナショナル

60

100,000

qwen3-omni-flash-2025-12-01

インターナショナル

60

100,000

qwen3-omni-flash-2025-09-15

インターナショナル

60

100,000

qwen-omni-turbo

インターナショナル

60

100,000

qwen-omni-turbo-latest

インターナショナル

60

100,000

qwen-omni-turbo-2025-03-26

インターナショナル

60

100,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.5-omni-flash

中国本土

60

100,000

qwen3.5-omni-flash-2026-03-15

中国本土

60

100,000

qwen3.5-omni-plus

中国本土

60

100,000

qwen3.5-omni-plus-2026-03-15

中国本土

60

100,000

qwen3-omni-flash

中国本土

60

100,000

qwen3-omni-flash-2025-12-01

中国本土

60

100,000

qwen3-omni-flash-2025-09-15

中国本土

60

100,000

qwen-omni-turbo

中国本土

60

100,000

qwen-omni-turbo-latest

中国本土

60

100,000

qwen-omni-turbo-2025-03-26

(qwen-omni-turbo-0326)

中国本土

60

100,000

qwen-omni-turbo-2025-01-19

(qwen-omni-turbo-0119)

中国本土

60

100,000

Qwen-Omni-Realtime (リアルタイムマルチモーダル)

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.5-omni-plus-realtime

インターナショナル

60

100,000

qwen3.5-omni-plus-realtime-2026-03-15

インターナショナル

60

100,000

qwen3.5-omni-flash-realtime

インターナショナル

60

100,000

qwen3.5-omni-flash-realtime-2026-03-15

インターナショナル

60

100,000

qwen3-omni-flash-realtime

インターナショナル

60

100,000

qwen3-omni-flash-realtime-2025-12-01

インターナショナル

60

100,000

qwen3-omni-flash-realtime-2025-09-15

インターナショナル

60

100,000

qwen-omni-turbo-realtime

インターナショナル

60

10,000

qwen-omni-turbo-realtime-latest

インターナショナル

60

10,000

qwen-omni-turbo-realtime-2025-05-08

インターナショナル

60

10,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.5-omni-plus-realtime

中国本土

60

100,000

qwen3.5-omni-plus-realtime-2026-03-15

中国本土

60

100,000

qwen3.5-omni-flash-realtime

中国本土

60

100,000

qwen3.5-omni-flash-realtime-2026-03-15

中国本土

60

100,000

qwen3-omni-flash-realtime

中国本土

60

100,000

qwen3-omni-flash-realtime-2025-12-01

中国本土

60

100,000

qwen3-omni-flash-realtime-2025-09-15

中国本土

60

100,000

qwen-omni-turbo-realtime

中国本土

60

100,000

qwen-omni-turbo-realtime-latest

中国本土

60

100,000

qwen-omni-turbo-realtime-2025-05-08

中国本土

60

100,000

Qwen-OCR (テキスト抽出)

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-vl-ocr

インターナショナル

600

6,000,000

qwen-vl-ocr-2025-11-20

インターナショナル

1,200

6,000,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-vl-ocr

グローバル

600

6,000,000

qwen-vl-ocr-2025-11-20

グローバル

1,200

6,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.5-ocr

中国本土

6,000

30,000,000

qwen-vl-ocr

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

600

6,000,000

qwen-vl-ocr-latest

中国本土

1,200

6,000,000

qwen-vl-ocr-2025-11-20

中国本土

1,200

6,000,000

qwen-vl-ocr-2025-04-13

中国本土

600

6,000,000

qwen-vl-ocr-2024-10-28

中国本土

600

6,000,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-vl-ocr

グローバル

600

6,000,000

qwen-vl-ocr-2025-11-20

グローバル

1,200

6,000,000

Qwen 数学モデル

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-math-plus

中国本土

1,200

1,000,000

qwen-math-plus-latest

中国本土

1,200

1,000,000

qwen-math-plus-2024-09-19

(qwen-math-plus-0919)

中国本土

60

100,000

qwen-math-plus-2024-08-16

(qwen-math-plus-0816)

中国本土

10

20,000

qwen-math-turbo

中国本土

1200

1,000,000

Qwen-Coder

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-coder-plus

インターナショナル

2,400

2,000,000

qwen3-coder-plus-2025-09-23

インターナショナル

600

1,000,000

qwen3-coder-plus-2025-07-22

インターナショナル

60

1,000,000

qwen3-coder-flash

インターナショナル

600

5,000,000

qwen3-coder-flash-2025-07-28

インターナショナル

600

5,000,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-coder-plus

グローバル

2,400

2,000,000

qwen3-coder-plus-2025-09-23

グローバル

60

1,000,000

qwen3-coder-plus-2025-07-22

グローバル

60

1,000,000

qwen3-coder-flash

グローバル

1,200

1,000,000

qwen3-coder-flash-2025-07-28

グローバル

60

1,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-coder-plus

中国本土

5,000

5,000,000

qwen3-coder-plus-2025-09-23

中国本土

60

1,000,000

qwen3-coder-plus-2025-07-22

中国本土

60

1,000,000

qwen3-coder-flash

中国本土

5,000

5,000,000

qwen3-coder-flash-2025-07-28

中国本土

60

1,000,000

qwen-coder-plus

中国本土

1,200

1,000,000

qwen-coder-turbo

中国本土

1,200

1,000,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-coder-plus

グローバル

2,400

2,000,000

qwen3-coder-plus-2025-09-23

グローバル

60

1,000,000

qwen3-coder-plus-2025-07-22

グローバル

60

1,000,000

qwen3-coder-flash

グローバル

1,200

1,000,000

qwen3-coder-flash-2025-07-28

グローバル

60

1,000,000

Qwen 翻訳モデル

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-mt-plus

インターナショナル

60

100,000

qwen-mt-flash

インターナショナル

60

100,000

qwen-mt-lite

インターナショナル

60

100,000

qwen-mt-turbo

インターナショナル

60

100,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-mt-plus

グローバル

60

25,000

qwen-mt-flash

グローバル

60

35,000

qwen-mt-lite

グローバル

60

100,000

qwen-mt-lite-us

米国

60

100,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-mt-plus

中国本土

60

25,000

qwen-mt-flash

中国本土

60

35,000

qwen-mt-lite

中国本土

60

100,000

qwen-mt-turbo

中国本土

60

35,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-mt-plus

グローバル

60

25,000

qwen-mt-flash

グローバル

60

35,000

qwen-mt-lite

グローバル

60

100,000

Qwen データマイニングモデル

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-doc-turbo

中国本土

600

3,000,000

Qwen ディープリサーチモデル

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-deep-research

中国本土

120

1,200,000

テキスト生成 - Qwen - オープンソース

Qwen 言語モデルオープンソース

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.6-35b-a3b

インターナショナル

600

1,000,000

qwen3.6-27b

インターナショナル

600

1,000,000

qwen3.5-397b-a17b

インターナショナル

600

1,000,000

qwen3.5-122b-a10b

インターナショナル

600

1,000,000

qwen3.5-27b

インターナショナル

600

1,000,000

qwen3.5-35b-a3b

インターナショナル

600

5,000,000

qwen3-next-80b-a3b-thinking

インターナショナル

600

1,000,000

qwen3-next-80b-a3b-instruct

インターナショナル

600

1,000,000

qwen3-235b-a22b-thinking-2507

インターナショナル

600

1,000,000

qwen3-235b-a22b-instruct-2507

インターナショナル

600

1,000,000

qwen3-30b-a3b-thinking-2507

インターナショナル

600

5,000,000

qwen3-30b-a3b-instruct-2507

インターナショナル

600

5,000,000

qwen3-235b-a22b

インターナショナル

600

1,000,000

qwen3-32b

インターナショナル

600

1,000,000

qwen3-30b-a3b

インターナショナル

600

1,000,000

qwen3-14b

インターナショナル

600

1,000,000

qwen3-8b

インターナショナル

600

1,000,000

qwen3-4b

インターナショナル

600

1,000,000

qwen3-1.7b

インターナショナル

600

1,000,000

qwen3-0.6b

インターナショナル

600

1,000,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.5-397b-a17b

グローバル

600

1,000,000

qwen3.5-122b-a10b

グローバル

600

1,000,000

qwen3.5-27b

グローバル

600

1,000,000

qwen3.6-35b-a3b

グローバル

600

1,000,000

qwen3.5-35b-a3b

グローバル

600

1,000,000

qwen3-next-80b-a3b-thinking

グローバル

600

1,000,000

qwen3-next-80b-a3b-instruct

グローバル

600

1,000,000

qwen3-235b-a22b-thinking-2507

グローバル

600

1,000,000

qwen3-235b-a22b-instruct-2507

グローバル

600

1,000,000

qwen3-30b-a3b-thinking-2507

グローバル

600

1,000,000

qwen3-30b-a3b-instruct-2507

グローバル

600

1,000,000

qwen3-235b-a22b

グローバル

600

1,000,000

qwen3-30b-a3b

グローバル

600

1,000,000

qwen3-32b

グローバル

600

1,000,000

qwen3-14b

グローバル

600

1,000,000

qwen3-8b

グローバル

600

1,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.6-35b-a3b

中国本土

600

1,000,000

qwen3.6-27b

中国本土

600

1,000,000

qwen3.5-397b-a17b

中国本土

600

1,000,000

qwen3.5-122b-a10b

中国本土

600

1,000,000

qwen3.5-27b

中国本土

600

1,000,000

qwen3.5-35b-a3b

中国本土

600

1,000,000

qwen3-next-80b-a3b-thinking

中国本土

600

1,000,000

qwen3-next-80b-a3b-instruct

中国本土

600

1,000,000

qwen3-235b-a22b-thinking-2507

中国本土

600

1,000,000

qwen3-235b-a22b-instruct-2507

中国本土

600

1,000,000

qwen3-30b-a3b-thinking-2507

中国本土

600

1,000,000

qwen3-30b-a3b-instruct-2507

中国本土

600

1,000,000

qwen3-235b-a22b

中国本土

600

1,000,000

qwen3-30b-a3b

中国本土

600

1,000,000

qwen3-32b

中国本土

2400

1,000,000

qwen3-14b

中国本土

600

1,000,000

qwen3-8b

中国本土

600

1,000,000

qwen3-4b

中国本土

600

1,000,000

qwen3-1.7b

中国本土

600

1,000,000

qwen3-0.6b

中国本土

600

1,000,000

qwen2.5-3b-instruct

中国本土

1,200

2,000,000

qwen2.5-1.5b-instruct

中国本土

1,200

2,000,000

qwen2.5-0.5b-instruct

中国本土

1,200

2,000,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3.5-397b-a17b

グローバル

600

1,000,000

qwen3.5-122b-a10b

グローバル

600

1,000,000

qwen3.5-27b

グローバル

600

1,000,000

qwen3.6-35b-a3b

グローバル

600

1,000,000

qwen3.5-35b-a3b

グローバル

600

1,000,000

qwen3-next-80b-a3b-thinking

グローバル

600

1,000,000

qwen3-next-80b-a3b-instruct

グローバル

600

1,000,000

qwen3-235b-a22b-thinking-2507

グローバル

600

1,000,000

qwen3-235b-a22b-instruct-2507

グローバル

600

1,000,000

qwen3-30b-a3b-thinking-2507

グローバル

600

1,000,000

qwen3-30b-a3b-instruct-2507

グローバル

600

1,000,000

qwen3-235b-a22b

グローバル

600

1,000,000

qwen3-30b-a3b

グローバル

600

1,000,000

qwen3-32b

グローバル

600

1,000,000

qwen3-14b

グローバル

600

1,000,000

qwen3-8b

グローバル

600

1,000,000

Qwen-VL (視覚理解/Image-to-Text)

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-vl-32b-thinking

インターナショナル

60

100,000

qwen3-vl-32b-instruct

インターナショナル

60

100,000

qwen3-vl-30b-a3b-thinking

インターナショナル

60

100,000

qwen3-vl-30b-a3b-instruct

インターナショナル

60

100,000

qwen3-vl-8b-thinking

インターナショナル

60

100,000

qwen3-vl-8b-instruct

インターナショナル

60

100,000

qwen3-vl-235b-a22b-thinking

インターナショナル

60

100,000

qwen3-vl-235b-a22b-instruct

インターナショナル

60

100,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-vl-235b-a22b-thinking

グローバル

60

100,000

qwen3-vl-235b-a22b-instruct

グローバル

60

100,000

qwen3-vl-32b-thinking

グローバル

600

1,000,000

qwen3-vl-32b-instruct

グローバル

600

1,000,000

qwen3-vl-30b-a3b-thinking

グローバル

600

1,000,000

qwen3-vl-30b-a3b-instruct

グローバル

600

1,000,000

qwen3-vl-8b-thinking

グローバル

600

1,000,000

qwen3-vl-8b-instruct

グローバル

600

1,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-vl-32b-thinking

中国本土

600

1,000,000

qwen3-vl-32b-instruct

中国本土

600

1,000,000

qwen3-vl-30b-a3b-thinking

中国本土

600

1,000,000

qwen3-vl-30b-a3b-instruct

中国本土

600

1,000,000

qwen3-vl-8b-thinking

中国本土

600

1,000,000

qwen3-vl-8b-instruct

中国本土

600

1,000,000

qwen3-vl-235b-a22b-thinking

中国本土

60

100,000

qwen3-vl-235b-a22b-instruct

中国本土

60

100,000

qwen2-vl-72b-instruct

中国本土

1,200

1,000,000

qwen2-vl-7b-instruct

中国本土

1,200

1,000,000

qwen2-vl-2b-instruct

中国本土

1,200

1,000,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-vl-235b-a22b-thinking

グローバル

60

100,000

qwen3-vl-235b-a22b-instruct

グローバル

60

100,000

qwen3-vl-32b-thinking

グローバル

600

1,000,000

qwen3-vl-32b-instruct

グローバル

600

1,000,000

qwen3-vl-30b-a3b-thinking

グローバル

600

1,000,000

qwen3-vl-30b-a3b-instruct

グローバル

600

1,000,000

qwen3-vl-8b-thinking

グローバル

600

1,000,000

qwen3-vl-8b-instruct

グローバル

600

1,000,000

Qwen3-Omni

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen2.5-omni-7b

インターナショナル

60

100,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen2.5-omni-7b

中国本土

60

100,000

Qwen3-Omni-Captioner

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-omni-30b-a3b-captioner

インターナショナル

60

100,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-omni-30b-a3b-captioner

中国本土

60

100,000

Qwen-Math

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

Qwen-Coder

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-coder-next

インターナショナル

600

1,000,000

qwen3-coder-480b-a35b-instruct

インターナショナル

600

1,000,000

qwen3-coder-30b-a3b-instruct

インターナショナル

600

1,000,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-coder-480b-a35b-instruct

グローバル

600

1,000,000

qwen3-coder-30b-a3b-instruct

グローバル

600

1,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-coder-next

中国本土

600

1,000,000

qwen3-coder-480b-a35b-instruct

中国本土

600

1,000,000

qwen3-coder-30b-a3b-instruct

中国本土

600

1,000,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen3-coder-480b-a35b-instruct

グローバル

600

1,000,000

qwen3-coder-30b-a3b-instruct

グローバル

600

1,000,000

qwen3-coder-next

EU

600

1,000,000

テキスト生成 - サードパーティモデル

DeepSeek

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

deepseek-v4-pro

インターナショナル

10,000

1,200,000

deepseek-v4-flash

インターナショナル

10,000

1,200,000

deepseek-v3.2

インターナショナル

10,000

1,200,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

deepseek-v4-pro

グローバル

15,000

1,200,000

deepseek-v4-flash

グローバル

15,000

1,200,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

deepseek-v4-pro

中国本土

15,000

1,200,000

deepseek-v4-flash

中国本土

15,000

1,200,000

deepseek-v3.2

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

15,000

1,200,000

deepseek-v3.2-exp

中国本土

15,000

1,200,000

deepseek-v3.1

中国本土

15,000

1,200,000

deepseek-r1-0528

中国本土

60

100,000

deepseek-r1

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

15,000

1,200,000

deepseek-v3

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

15,000

1,200,000

deepseek-r1-distill-qwen-7b

中国本土

15,000

1,200,000

deepseek-r1-distill-qwen-14b

中国本土

15,000

1,200,000

deepseek-r1-distill-qwen-32b

中国本土

15,000

1,200,000

deepseek-r1-distill-qwen-1.5b

中国本土

60

100,000

deepseek-r1-distill-llama-8b

中国本土

60

100,000

deepseek-r1-distill-llama-70b

中国本土

60

100,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

deepseek-v4-pro

グローバル

15,000

1,200,000

deepseek-v4-flash

グローバル

15,000

1,200,000

日本 (東京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限です。サービスは、RPS (RPM/60) および TPS (TPM/60) で 1 秒あたりの制限を適用する場合もあります

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含む

deepseek-v4-pro

日本

10,000

1,200,000

deepseek-v4-flash

日本

10,000

1,200,000

deepseek-v4-pro

グローバル

15,000

1,200,000

deepseek-v4-flash

グローバル

15,000

1,200,000

Kimi

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

kimi-k2.7-code

中国本土

500

1,000,000

kimi-k2.6

中国本土

500

1,000,000

kimi-k2.5

中国本土

500

1,000,000

kimi-k2-thinking

中国本土

500

1,000,000

Moonshot-Kimi-K2-Instruct

中国本土

500

1,000,000

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

kimi-k2.7-code

グローバル

500

1,000,000

kimi-k2.5

グローバル

500

1,000,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

kimi-k2.7-code

グローバル

500

1,000,000

kimi-k2.5

グローバル

500

1,000,000

香港 (中国)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

kimi-k2.7-code

グローバル

500

1,000,000

日本 (東京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限です。サービスは、RPS (RPM/60) および TPS (TPM/60) で 1 秒あたりの制限を適用する場合もあります

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含む

kimi-k2.5

グローバル

500

1,000,000

シンガポール

モデル名

サービス提供範囲

レート制限 (いずれかの値を超過するとトリガーされます)

以下は 1 分あたりの制限です。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます

kimi-k2.7-code

インターナショナル

500

1,000,000

MiniMax

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

MiniMax-M2.5

中国本土

500

1,000,000

GLM

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

glm-5.2

グローバル

500

1,000,000

glm-5.1

グローバル

500

1,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

glm-5.2

中国本土

500

1,000,000

glm-5.1

中国本土

500

1,000,000

glm-5

中国本土

500

1,000,000

glm-4.7

中国本土

500

1,000,000

glm-4.6

中国本土

60

1,000,000

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

glm-5.2

グローバル

500

1,000,000

glm-5.1

グローバル

500

1,000,000

シンガポール

モデル名

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

glm-5.1

500

1,000,000

香港 (中国)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

glm-5.2

グローバル

500

1,000,000

日本 (東京)

モデル名

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限です。サービスは、RPS (RPM/60) および TPS (TPM/60) で 1 秒あたりの制限を適用する場合もあります

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含む

glm-5.1

500

1,000,000

画像生成

Qwen-Image

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API 呼び出し制限

同時実行タスク数 (同時実行数)

qwen-image-2.0-pro

インターナショナル

2 回/分

同期 API には制限なし

qwen-image-2.0-pro-2026-06-22

インターナショナル

2 回/分

同期 API には制限なし

qwen-image-2.0-pro-2026-04-22

インターナショナル

2 回/分

同期 API には制限なし

qwen-image-2.0-pro-2026-03-03

インターナショナル

2 回/分

同期 API には制限なし

qwen-image-2.0

インターナショナル

2 回/秒

同期 API には制限なし

qwen-image-2.0-2026-03-03

インターナショナル

2 回/秒

同期 API には制限なし

qwen-image-max

インターナショナル

2 回/分

同期 API には制限なし

qwen-image-max-2025-12-30

インターナショナル

2 回/分

同期 API には制限なし

qwen-image-plus

インターナショナル

2 回/秒

同期 API には制限なし / 非同期 API には 2

qwen-image-plus-2026-01-09

インターナショナル

2 回/秒

同期 API には制限なし

qwen-image

インターナショナル

2 回/秒

同期 API には制限なし / 非同期 API には 2

qwen-image-edit-max

インターナショナル

2 回/分

同期 API には制限なし

qwen-image-edit-max-2026-01-16

インターナショナル

2 回/分

同期 API には制限なし

qwen-image-edit-plus

インターナショナル

2 回/秒

同期 API には制限なし

qwen-image-edit-plus-2025-12-15

インターナショナル

2 回/秒

同期 API には制限なし

qwen-image-edit-plus-2025-10-30

インターナショナル

2 回/秒

同期 API には制限なし

qwen-image-edit

インターナショナル

2 回/秒

同期 API には制限なし

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API 呼び出し制限

同時実行タスク数 (同時実行数)

qwen-image-2.0-pro

中国本土

2 回/分

同期 API には制限なし

qwen-image-2.0-pro-2026-06-22

中国本土

2 回/分

同期 API には制限なし

qwen-image-2.0-pro-2026-04-22

中国本土

2 回/分

同期 API には制限なし

qwen-image-2.0-pro-2026-03-03

中国本土

2 回/分

同期 API には制限なし

qwen-image-2.0

中国本土

2 回/秒

同期 API には制限なし

qwen-image-2.0-2026-03-03

中国本土

2 回/秒

同期 API には制限なし

qwen-image-max

中国本土

2 回/分

同期 API には制限なし

qwen-image-max-2025-12-30

中国本土

2 回/分

同期 API には制限なし

qwen-image-plus

中国本土

2 回/秒

同期 API には制限なし / 非同期 API には 2

qwen-image-plus-2026-01-09

中国本土

2 回/秒

同期 API には制限なし

qwen-image

中国本土

2 回/秒

同期 API には制限なし / 非同期 API には 2

qwen-image-edit-max

中国本土

2 回/分

同期 API には制限なし

qwen-image-edit-max-2026-01-16

中国本土

2 回/分

同期 API には制限なし

qwen-image-edit-plus

中国本土

2 回/秒

同期 API には制限なし

qwen-image-edit-plus-2025-12-15

中国本土

2 回/秒

同期 API には制限なし

qwen-image-edit-plus-2025-10-30

中国本土

2 回/秒

同期 API には制限なし

qwen-image-edit

中国本土

2 回/秒

同期 API には制限なし

qwen-mt-image

中国本土

1 回/秒

2

Text-to-image - Z-Image

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

z-image-turbo

インターナショナル

2

同期 API には制限なし

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

z-image-turbo

中国本土

2

同期 API には制限なし

Wanxiang

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

wan2.7-image-pro

インターナショナル

5

5

wan2.7-image

インターナショナル

5

5

wan2.6-image

インターナショナル

5

5

wan2.6-t2i

インターナショナル

5

5

wan2.5-t2i-preview

インターナショナル

5

5

wan2.2-t2i-flash

インターナショナル

2

2

wan2.2-t2i-plus

インターナショナル

2

2

wan2.1-t2i-turbo

インターナショナル

2

2

wan2.1-t2i-plus

インターナショナル

2

2

wan2.5-i2i-preview

インターナショナル

5

5

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

wan2.6-t2i

グローバル

5

5

wan2.6-image

グローバル

5

5

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

wan2.7-image-pro

中国本土

5

5

wan2.7-image

中国本土

5

5

wan2.6-image

中国本土

5

5

wan2.6-t2i

中国本土

1

5

wan2.5-t2i-preview

中国本土

5

5

wanx2.0-t2i-turbo

中国本土

2

2

wanx2.1-t2i-turbo

中国本土

2

2

wanx2.1-t2i-plus

中国本土

2

2

wan2.2-t2i-flash

中国本土

2

2

wan2.2-t2i-plus

中国本土

2

2

wan2.5-i2i-preview

中国本土

5

5

wanx2.1-imageedit

中国本土

2

2

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

wan2.6-t2i

グローバル

5

5

wan2.6-image

グローバル

5

5

OutfitAnyone

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

ジョブ送信 API の RPS 制限

同時実行タスク数

aitryon-plus

中国本土

10

5

aitryon-parsing-v1

中国本土

10

同期 API には制限なし

動画生成

HappyHorse シリーズ

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

happyhorse-1.1-t2v

インターナショナル

10

5

happyhorse-1.1-i2v

インターナショナル

10

5

happyhorse-1.1-r2v

インターナショナル

10

5

happyhorse-1.0-t2v

インターナショナル

10

5

happyhorse-1.0-i2v

インターナショナル

10

5

happyhorse-1.0-r2v

インターナショナル

10

5

happyhorse-1.0-video-edit

インターナショナル

10

5

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

happyhorse-1.1-t2v

グローバル

10

5

happyhorse-1.1-i2v

グローバル

10

5

happyhorse-1.1-r2v

グローバル

10

5

happyhorse-1.0-t2v

グローバル

10

5

happyhorse-1.0-i2v

グローバル

10

5

happyhorse-1.0-r2v

グローバル

10

5

happyhorse-1.0-video-edit

グローバル

10

5

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

happyhorse-1.1-t2v

中国本土

10

5

happyhorse-1.1-i2v

中国本土

10

5

happyhorse-1.1-r2v

中国本土

10

5

happyhorse-1.0-t2v

中国本土

10

5

happyhorse-1.0-i2v

中国本土

10

5

happyhorse-1.0-r2v

中国本土

10

5

happyhorse-1.0-video-edit

中国本土

10

5

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

happyhorse-1.1-t2v

グローバル

10

5

happyhorse-1.1-i2v

グローバル

10

5

happyhorse-1.1-r2v

グローバル

10

5

happyhorse-1.0-t2v

グローバル

10

5

happyhorse-1.0-i2v

グローバル

10

5

happyhorse-1.0-r2v

グローバル

10

5

happyhorse-1.0-video-edit

グローバル

10

5

香港 (中国)

モデル名

サービス提供範囲

レート制限 (いずれかの値を超過するとトリガーされます)

タスク送信 API RPS 制限

同時実行タスク数 (同時実行数)

happyhorse-1.1-t2v

グローバル

10

5

happyhorse-1.1-i2v

グローバル

10

5

happyhorse-1.1-r2v

グローバル

10

5

Wanxiang シリーズ

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

wan2.7-t2v-2026-04-25

インターナショナル

5

5

wan2.7-t2v

インターナショナル

5

5

wan2.6-t2v

インターナショナル

5

5

wan2.5-t2v-preview

インターナショナル

5

5

wan2.2-t2v-plus

インターナショナル

2

2

wan2.1-t2v-turbo

インターナショナル

2

2

wan2.1-t2v-plus

インターナショナル

2

2

wan2.7-i2v-2026-04-25

インターナショナル

5

5

wan2.7-i2v

インターナショナル

5

5

wan2.6-i2v-flash

インターナショナル

5

5

wan2.6-i2v

インターナショナル

5

5

wan2.5-i2v-preview

インターナショナル

5

5

wan2.2-i2v-flash

インターナショナル

2

2

wan2.1-i2v-plus

インターナショナル

2

2

wan2.1-i2v-turbo

インターナショナル

2

2

wan2.2-i2v-plus

インターナショナル

2

2

wan2.2-kf2v-flash

インターナショナル

2

2

wan2.1-kf2v-plus

インターナショナル

1

2

wan2.1-vace-plus

インターナショナル

2

2

wan2.7-videoedit

インターナショナル

5

5

wan2.7-r2v

インターナショナル

5

5

wan2.6-r2v-flash

インターナショナル

5

5

wan2.6-r2v

インターナショナル

5

5

wan2.2-animate-move

インターナショナル

5

1

wan2.2-animate-mix

インターナショナル

5

1

米国 (バージニア)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

wan2.6-t2v

グローバル

5

5

wan2.6-i2v

グローバル

5

5

wan2.6-r2v

グローバル

5

5

wan2.6-t2v-us

米国

5

5

wan2.6-i2v-us

米国

5

5

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

wan2.7-t2v-2026-04-25

中国本土

5

5

wan2.7-t2v

中国本土

5

5

wan2.6-t2v

中国本土

5

5

wan2.5-t2v-preview

中国本土

5

5

wan2.2-t2v-plus

中国本土

2

2

wanx2.1-t2v-turbo

中国本土

2

2

wanx2.1-t2v-plus

中国本土

2

2

wan2.7-i2v-2026-04-25

中国本土

5

5

wan2.7-i2v

中国本土

5

5

wan2.6-i2v-flash

中国本土

5

5

wan2.6-i2v

中国本土

5

5

wan2.5-i2v-preview

中国本土

5

5

wan2.2-i2v-plus

中国本土

2

2

wanx2.1-i2v-turbo

中国本土

2

2

wanx2.1-i2v-plus

中国本土

2

2

wan2.2-kf2v-flash

中国本土

2

2

wanx2.1-kf2v-plus

中国本土

2

2

wanx2.1-vace-plus

中国本土

2

2

wan2.7-videoedit

中国本土

5

5

wan2.7-r2v

中国本土

5

5

wan2.6-r2v-flash

中国本土

5

5

wan2.6-r2v

中国本土

5

5

wan2.2-s2v-detect

中国本土

5

同期 API には制限なし

wan2.2-s2v

中国本土

5

1

wan2.2-animate-move

中国本土

5

1

wan2.2-animate-mix

中国本土

5

1

ドイツ (フランクフルト)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

タスク送信 API の RPS 制限

同時実行タスク数 (同時実行数)

wan2.6-t2v

グローバル

5

5

wan2.6-i2v

グローバル

5

5

wan2.6-r2v

グローバル

5

5

AnimateAnyone

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

animate-anyone-detect-gen2

中国本土

5

同期 API には制限なし

animate-anyone-template-gen2

中国本土

5

1

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

animate-anyone-gen2

中国本土

5

1

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

EMO

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

emo-detect-v1

中国本土

5

同期 API には制限なし

emo-v1

中国本土

5

1

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

LivePortrait

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

liveportrait-detect

中国本土

5

同期 API には制限なし

liveportrait

中国本土

5

1

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

VideoRetalk

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

videoretalk

中国本土

1

1

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

Emoji

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

emoji-detect-v1

中国本土

1

同期 API には制限なし

emoji-v1

中国本土

1

1

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

動画スタイル変換

中国 (北京)

モデル名

サービス提供範囲

タスク送信 API の RPS 制限

同時実行タスク数

video-style-transform

中国本土

20

2

一度に実行されるジョブは 1 つだけです。キュー内の他のジョブは待機状態になります。

音楽生成

中国 (北京)

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

fun-music-preview

中国本土

180

fun-music-v1

中国本土

180

音声合成 (Text-to-Speech)

Qwen 音声合成

シンガポール

Qwen3-TTS-Instruct-Flash

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-instruct-flash

インターナショナル

180

qwen3-tts-instruct-flash-2026-01-26

インターナショナル

180

Qwen3-TTS-VD

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-vd-2026-01-26

インターナショナル

180

Qwen3-TTS-VC

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-vc-2026-01-22

インターナショナル

180

Qwen3-TTS-Flash

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-flash

インターナショナル

180

qwen3-tts-flash-2025-11-27

インターナショナル

180

qwen3-tts-flash-2025-09-18

インターナショナル

10

中国 (北京)

Qwen3-TTS-Instruct-Flash

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-instruct-flash

中国本土

180

qwen3-tts-instruct-flash-2026-01-26

中国本土

180

Qwen3-TTS-VD

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-vd-2026-01-26

中国本土

180

Qwen3-TTS-VC

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-vc-2026-01-22

中国本土

180

Qwen3-TTS-Flash

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-flash

中国本土

180

qwen3-tts-flash-2025-11-27

中国本土

180

qwen3-tts-flash-2025-09-18

中国本土

10

Qwen-TTS

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります

1 分あたりのリクエスト数 (RPM)

1 分あたりの消費トークン数 (TPM)

入力トークンと出力トークンを含む

qwen-tts

中国本土

10

100,000

qwen-tts-latest

中国本土

qwen-tts-2025-05-22

中国本土

qwen-tts-2025-04-10

中国本土

Qwen リアルタイム音声合成

シンガポール

Qwen3-TTS-Instruct-Flash-Realtime

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-instruct-flash-realtime

インターナショナル

180

qwen3-tts-instruct-flash-realtime-2026-01-22

インターナショナル

180

Qwen3-TTS-VD-Realtime

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-vd-realtime-2026-01-15

インターナショナル

180

qwen3-tts-vd-realtime-2025-12-16

インターナショナル

Qwen3-TTS-VC-Realtime

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-vc-realtime-2026-01-15

インターナショナル

180

qwen3-tts-vc-realtime-2025-11-27

インターナショナル

Qwen3-TTS-Flash-Realtime

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-flash-realtime

インターナショナル

180

qwen3-tts-flash-realtime-2025-11-27

インターナショナル

180

qwen3-tts-flash-realtime-2025-09-18

インターナショナル

10

中国 (北京)

Qwen3-TTS-Instruct-Flash-Realtime

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-instruct-flash-realtime

中国本土

180

qwen3-tts-instruct-flash-realtime-2026-01-22

中国本土

180

Qwen3-TTS-VD-Realtime

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-vd-realtime-2026-01-15

中国本土

180

qwen3-tts-vd-realtime-2025-12-16

中国本土

Qwen3-TTS-VC-Realtime

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-vc-realtime-2026-01-15

中国本土

180

qwen3-tts-vc-realtime-2025-11-27

中国本土

Qwen3-TTS-Flash-Realtime

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-tts-flash-realtime

中国本土

180

qwen3-tts-flash-realtime-2025-11-27

中国本土

180

qwen3-tts-flash-realtime-2025-09-18

中国本土

10

Qwen-TTS-Realtime

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります

1 分あたりのリクエスト数 (RPM)

1 分あたりの消費トークン数 (TPM)

入力トークンと出力トークンを含む

qwen-tts-realtime

中国本土

10

100,000

qwen-tts-realtime-latest

中国本土

qwen-tts-realtime-2025-07-15

中国本土

Qwen 音声クローニング

シンガポール

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen-voice-enrollment

インターナショナル

180

中国 (北京)

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen-voice-enrollment

中国本土

180

Qwen 音声デザイン

シンガポール

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen-voice-design

インターナショナル

180

中国 (北京)

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen-voice-design

中国本土

180

CosyVoice 音声合成

シンガポール

モデル名

サービス提供範囲

ジョブ送信 API RPS 制限

cosyvoice-v3-plus

インターナショナル

3

cosyvoice-v3-flash

インターナショナル

中国 (北京)

モデル名

サービス提供範囲

ジョブ送信 API RPS 制限

cosyvoice-v3.5-plus

中国本土

3

cosyvoice-v3.5-flash

中国本土

cosyvoice-v3-plus

中国本土

cosyvoice-v3-flash

中国本土

cosyvoice-v2

中国本土

CosyVoice 音声クローニング/デザイン

CosyVoice 音声クローニングモデルは、単一のモデルと共有のレート制限クォータを共有します。

シンガポール

モデル名

サービス提供範囲

ジョブ送信 API RPS 制限

voice-enrollment

インターナショナル

10

中国 (北京)

モデル名

サービス提供範囲

ジョブ送信 API RPS 制限

voice-enrollment

中国本土

10

音声認識 (音声テキスト変換) と翻訳 (指定言語への音声テキスト変換)

Qwen3-LiveTranslate-Flash

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります

1 分あたりのリクエスト数 (RPM)

1 分あたりの消費トークン数 (TPM)

入力トークンと出力トークンを含む

qwen3-livetranslate-flash

インターナショナル

100

100,000

qwen3-livetranslate-flash-2025-12-01

インターナショナル

6,000

1,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります

1 分あたりのリクエスト数 (RPM)

1 分あたりの消費トークン数 (TPM)

入力トークンと出力トークンを含む

qwen3-livetranslate-flash

中国本土

100

100,000

qwen3-livetranslate-flash-2025-12-01

中国本土

Qwen-LiveTranslate-Flash-Realtime

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります

1 分あたりのリクエスト数 (RPM)

1 分あたりの消費トークン数 (TPM)

入力トークンと出力トークンを含む

qwen3.5-livetranslate-flash-realtime

インターナショナル

10

100,000

qwen3.5-livetranslate-flash-realtime-2026-05-19

インターナショナル

qwen3-livetranslate-flash-realtime

インターナショナル

qwen3-livetranslate-flash-realtime-2025-09-22

インターナショナル

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとレート制限がトリガーされます)

以下は 1 分あたりのレート制限条件です。サービスは、RPS (RPM/60) および TPS (TPM/60) の制限も適用する場合があります

1 分あたりのリクエスト数 (RPM)

1 分あたりの消費トークン数 (TPM)

入力トークンと出力トークンを含む

qwen3.5-livetranslate-flash-realtime

中国本土

10

100,000

qwen3.5-livetranslate-flash-realtime-2026-05-19

中国本土

qwen3-livetranslate-flash-realtime

中国本土

qwen3-livetranslate-flash-realtime-2025-09-22

中国本土

Qwen 音声ファイル認識

シンガポール

Qwen3-ASR-Flash-Filetrans

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-asr-flash-filetrans

インターナショナル

100

qwen3-asr-flash-filetrans-2025-11-17

インターナショナル

Qwen3-ASR-Flash

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-asr-flash

インターナショナル

100

qwen3-asr-flash-2026-02-10

インターナショナル

qwen3-asr-flash-2025-09-08

インターナショナル

米国 (バージニア)

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-asr-flash-us

米国

100

qwen3-asr-flash-2025-09-08-us

米国

中国 (北京)

Qwen3-ASR-Flash-Filetrans

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-asr-flash-filetrans

中国本土

100

qwen3-asr-flash-filetrans-2025-11-17

中国本土

Qwen3-ASR-Flash

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

qwen3-asr-flash

中国本土

100

qwen3-asr-flash-2026-02-10

中国本土

qwen3-asr-flash-2025-09-08

中国本土

Qwen リアルタイム音声認識

シンガポール

モデル名

サービス提供範囲

1 秒あたりのリクエスト数 (RPS)

qwen3-asr-flash-realtime

インターナショナル

20

qwen3-asr-flash-realtime-2026-02-10

インターナショナル

qwen3-asr-flash-realtime-2025-10-27

インターナショナル

中国 (北京)

モデル名

サービス提供範囲

1 秒あたりのリクエスト数 (RPS)

qwen3-asr-flash-realtime

中国本土

20

qwen3-asr-flash-realtime-2026-02-10

中国本土

qwen3-asr-flash-realtime-2025-10-27

中国本土

Paraformer音声認識

中国 (北京)

モデル名

サービス提供範囲

ジョブ送信 API RPS 制限

paraformer-realtime-v2

中国本土

20

paraformer-realtime-8k-v2

中国本土

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

paraformer-v2

中国本土

1,200

モデル名

サービス提供範囲

ジョブ送信 API RPS 制限

同時処理タスク数 (同時実行数)

paraformer-8k-v2

中国本土

20

100

Fun-ASR 音声ファイル認識

シンガポール

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

fun-asr

インターナショナル

600

fun-asr-2025-11-07

インターナショナル

600

fun-asr-2025-08-25

インターナショナル

600

fun-asr-mtl

インターナショナル

100

fun-asr-mtl-2025-08-25

インターナショナル

100

fun-asr-flash-2026-06-15

インターナショナル

600

中国 (北京)

モデル名

サービス提供範囲

1 分あたりのリクエスト数 (RPM)

fun-asr

中国本土

600

fun-asr-2025-11-07

中国本土

fun-asr-2025-08-25

中国本土

fun-asr-mtl

中国本土

fun-asr-mtl-2025-08-25

中国本土

fun-asr-flash-2026-06-15

中国本土

Fun-ASR リアルタイム音声認識

シンガポール

モデル名

サービス提供範囲

ジョブ送信 API RPS 制限

fun-asr-realtime

インターナショナル

20

fun-asr-realtime-2025-11-07

インターナショナル

中国 (北京)

モデル名

サービス提供範囲

ジョブ送信 API RPS 制限

fun-asr-realtime

中国本土

20

fun-asr-realtime-2026-02-28

中国本土

fun-asr-realtime-2025-11-07

中国本土

fun-asr-realtime-2025-09-15

中国本土

fun-asr-flash-8k-realtime

中国本土

fun-asr-flash-8k-realtime-2026-01-28

中国本土

テキスト埋め込み

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)/ジョブ数

入力トークンと出力トークンを含みます。

text-embedding-v4

インターナショナル

1,800

1,000,000

text-embedding-v3

インターナショナル

6,000

24,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

1 秒あたりのリクエスト数 (RPS)

1 分あたりのトークン数 (TPM)/ジョブ数

入力トークンと出力トークンを含みます。

text-embedding-v4

レート制限は、バッチ API を使用したサービス呼び出しには適用されません。

中国本土

30

1,200,000

香港 (中国)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)/ジョブ数

入力トークンと出力トークンを含みます。

text-embedding-v4

香港 (中国)

1,800

1,000,000

マルチモーダル埋め込み

シンガポール

モデル名

サービス提供範囲

レート制限条件

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンのみ。

tongyi-embedding-vision-plus

インターナショナル

600

200,000

tongyi-embedding-vision-flash

インターナショナル

600

200,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンのみ。

qwen3-vl-embedding

中国本土

2,400

1,200,000

multimodal-embedding-v1

中国本土

120

100,000

ソートモデル

シンガポール

モデル名

サービス提供範囲

レート制限条件

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンのみ。

qwen3-rerank

インターナショナル

5,400

5,000,000,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンのみ。

qwen3-vl-rerank

中国本土

600

9,000,000

gte-rerank-v2

中国本土

5,040

4,980,000,000

業界

意図認識

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

tongyi-intent-detect-v3

中国本土

1,200

1,000,000

ロール想定

シンガポール

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-plus-character

インターナショナル

120

500,000

qwen-flash-character

インターナショナル

120

500,000

qwen-plus-character-ja

インターナショナル

120

500,000

中国 (北京)

モデル名

サービス提供範囲

レート制限条件 (いずれかの値を超過するとトリガーされます)

以下の制限は 1 分あたりのものです。サービスは、1 秒あたりのリクエスト数 (RPS = RPM/60) および 1 秒あたりのトークン数 (TPS = TPM/60) に基づく制限も適用する場合があります。

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

qwen-plus-character

中国本土

120

500,000

qwen-flash-character

中国本土

120

500,000

オフラインモデル

詳細については、「モデル非公開ポリシー」をご参照ください。

2026 年 1 月 30 日にオフライン

カテゴリ

モデル名

レート制限条件 (いずれかの値を超過するとトリガーされます)

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

Qwen-Plus

qwen-plus-2024-11-27

0

0

qwen-plus-2024-11-25

qwen-plus-2024-09-19

qwen-plus-2024-08-06

Qwen-Turbo

qwen-turbo-2024-09-19

Qwen-VL

qwen-vl-max-2024-10-30

qwen-vl-max-2024-08-09

qwen-vl-plus-2024-08-09

2025 年 8 月 20 日にオフライン

カテゴリ

モデル名

レート制限条件 (いずれかの値を超過するとトリガーされます)

1 分あたりのリクエスト数 (RPM)

1 分あたりのトークン数 (TPM)

入力トークンと出力トークンを含みます。

テキスト生成 - Qwen

qwen2-72b-instruct

0

0

qwen2-57b-a14b-instruct

qwen2-7b-instruct

qwen1.5-110b-chat

qwen1.5-72b-chat

qwen1.5-32b-chat

qwen1.5-14b-chat

qwen1.5-7b-chat