すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:レート制限

最終更新日:Jul 10, 2025

モデルへの公平なアクセスを確保するために、Alibaba Cloud Model Studio はベースライン レート制限を実装しています。これらの制限はモデル固有であり、モデルが呼び出される Alibaba Cloud アカウントに関連付けられています。Alibaba Cloud アカウント内のすべての API キーを使用してモデルへの呼び出しの総数に基づいて調整が適用されます。アカウントが制限を超えた場合、API リクエストは調整のために失敗し、リクエスト頻度が制限を下回るまで待ってから再度呼び出す必要があります。

テキスト生成

Qwen

Qwen 言語モデル

名前

レート制限(いずれかの制限を超えた場合にトリガーされます)

1 分あたりのクエリ数(QPM)

1 分あたりの消費トークン数(TPM)

入力 + 出力

qwq-plus

60

100,000

qwen-max

600

1,000,000

qwen-max-latest

60

100,000

qwen-max-2025-01-25

(qwen-max-0125)

qwen-plus

600

1,000,000

qwen-plus-latest

60

100,000

qwen-plus-2025-04-28

(qwen-plus-0428)

qwen-plus-2025-01-25

(qwen-plus-0125)

qwen-turbo

600

5,000,000

qwen-turbo-latest

60

qwen-turbo-2025-04-28

(qwen-turbo-0428)

qwen-turbo-2024-11-01

(qwen-turbo-1101)

Qwen-VL(視覚的理解/画像からテキストへ)

名前

レート制限(いずれかの制限を超えた場合にトリガーされます)

1 分あたりのクエリ数(QPM)

1 分あたりの消費トークン数(TPM)

入力 + 出力

qvq-max

60

100,000

qvq-max-latest

qvq-max-2025-03-25

(qvq-max-0325)

qwen-vl-max

1,200

1,000,000

qwen-vl-max-latest

qwen-vl-max-2025-04-08

(qwen-vl-max-0408)

qwen-vl-plus

qwen-vl-plus-latest

qwen-vl-plus-2025-05-07

(qwen-vl-plus-0507)

120

qwen-vl-plus-2025-01-25

(qwen-vl-plus-0125)

1,200

Qwen-OCR(テキスト抽出)

名前

レート制限(いずれかの制限を超えた場合にトリガーされます)

1 分あたりのクエリ数(QPM)

1 分あたりに消費されるトークン数(TPM)

入力 + 出力

qwen-vl-ocr

10

2,000,000

オープンソース Qwen

オープンソース Qwen 言語モデル

名前

レート制限(いずれかの制限を超えた場合にトリガーされます)

1 分あたりのクエリ数(QPM)

1 分あたりの消費トークン数(TPM)

入力 + 出力

qwen3-235b-a22b

600

1,000,000

qwen3-32b

qwen3-30b-a3b

qwen3-14b

qwen3-8b

qwen3-4b

qwen3-1.7b

qwen3-0.6b

qwen2.5-14b-instruct-1m

60

1,000,000

qwen2.5-7b-instruct-1m

qwen2.5-72b-instruct

100,000

qwen2.5-32b-instruct

qwen2.5-14b-instruct

qwen2.5-7b-instruct

qwen2-72b-instruct廃止予定

60

150,000

qwen2-57b-a14b-instruct廃止予定

30,000

qwen2-7b-instruct廃止予定

qwen1.5-110b-chat廃止予定

10

20,000

qwen1.5-72b-chat廃止予定

120

200,000

qwen1.5-32b-chat廃止予定

10

20,000

qwen1.5-14b-chat廃止予定

120

200,000

qwen1.5-7b-chat廃止予定

オープンソース Qwen-VL(視覚的理解/画像からテキストへ)

名前

レート制限(いずれかの制限を超えた場合にトリガーされます)

1 分あたりのクエリ数(QPM)

1 分あたりの消費トークン数(TPM)

入力 + 出力

qwen2.5-vl-72b-instruct

60

100,000

qwen2.5-vl-32b-instruct

qwen2.5-vl-7b-instruct

qwen2.5-vl-3b-instruct

Qwen-Omni(マルチモーダル)

名前

レート制限(いずれかの制限を超えた場合にトリガーされます)

1 分あたりのクエリ数(QPM)

1 分あたりに消費されるトークン数(TPM)

入力 + 出力

qwen2.5-omni-7b

60

100,000

画像生成

Wan

名前

1 秒あたりのタスク送信数

同時タスク数

wan2.1-t2i-turbo

2

2

wan2.1-t2i-plus

動画生成

Wan

名前

1 秒あたりのタスク送信数

同時タスク数

wan2.1-t2v-turbo

2

2

wan2.1-t2v-plus

wan2.1-i2v-turbo

wan2.1-i2v-plus

wan2.1-kf2v-plus

wan2.1-vace-plus

埋め込みモデル

一般的なテキスト埋め込み

名前

レート制限(いずれかの制限を超えた場合にトリガーされます)

1 分あたりのクエリ数(QPM)

1 分あたりに消費されるトークン数(TPM)/ ジョブ数

入力 + 出力

text-embedding-v3

6,000

24,000,000