モデルへの公平なアクセスを確保するために、Alibaba Cloud Model Studio はベースライン レート制限を実装しています。これらの制限はモデル固有であり、モデルが呼び出される Alibaba Cloud アカウントに関連付けられています。Alibaba Cloud アカウント内のすべての API キーを使用してモデルへの呼び出しの総数に基づいて調整が適用されます。アカウントが制限を超えた場合、API リクエストは調整のために失敗し、リクエスト頻度が制限を下回るまで待ってから再度呼び出す必要があります。
テキスト生成
Qwen
Qwen 言語モデル
名前 | レート制限(いずれかの制限を超えた場合にトリガーされます) | |
1 分あたりのクエリ数(QPM) | 1 分あたりの消費トークン数(TPM) 入力 + 出力 | |
qwq-plus | 60 | 100,000 |
qwen-max | 600 | 1,000,000 |
qwen-max-latest | 60 | 100,000 |
qwen-max-2025-01-25 (qwen-max-0125) | ||
qwen-plus | 600 | 1,000,000 |
qwen-plus-latest | 60 | 100,000 |
qwen-plus-2025-04-28 (qwen-plus-0428) | ||
qwen-plus-2025-01-25 (qwen-plus-0125) | ||
qwen-turbo | 600 | 5,000,000 |
qwen-turbo-latest | 60 | |
qwen-turbo-2025-04-28 (qwen-turbo-0428) | ||
qwen-turbo-2024-11-01 (qwen-turbo-1101) |
Qwen-VL(視覚的理解/画像からテキストへ)
名前 | レート制限(いずれかの制限を超えた場合にトリガーされます) | |
1 分あたりのクエリ数(QPM) | 1 分あたりの消費トークン数(TPM) 入力 + 出力 | |
qvq-max | 60 | 100,000 |
qvq-max-latest | ||
qvq-max-2025-03-25 (qvq-max-0325) | ||
qwen-vl-max | 1,200 | 1,000,000 |
qwen-vl-max-latest | ||
qwen-vl-max-2025-04-08 (qwen-vl-max-0408) | ||
qwen-vl-plus | ||
qwen-vl-plus-latest | ||
qwen-vl-plus-2025-05-07 (qwen-vl-plus-0507) | 120 | |
qwen-vl-plus-2025-01-25 (qwen-vl-plus-0125) | 1,200 |
Qwen-OCR(テキスト抽出)
名前 | レート制限(いずれかの制限を超えた場合にトリガーされます) | |
1 分あたりのクエリ数(QPM) | 1 分あたりに消費されるトークン数(TPM) 入力 + 出力 | |
qwen-vl-ocr | 10 | 2,000,000 |
オープンソース Qwen
オープンソース Qwen 言語モデル
名前 | レート制限(いずれかの制限を超えた場合にトリガーされます) | |
1 分あたりのクエリ数(QPM) | 1 分あたりの消費トークン数(TPM) 入力 + 出力 | |
qwen3-235b-a22b | 600 | 1,000,000 |
qwen3-32b | ||
qwen3-30b-a3b | ||
qwen3-14b | ||
qwen3-8b | ||
qwen3-4b | ||
qwen3-1.7b | ||
qwen3-0.6b | ||
qwen2.5-14b-instruct-1m | 60 | 1,000,000 |
qwen2.5-7b-instruct-1m | ||
qwen2.5-72b-instruct | 100,000 | |
qwen2.5-32b-instruct | ||
qwen2.5-14b-instruct | ||
qwen2.5-7b-instruct | ||
qwen2-72b-instruct廃止予定 | 60 | 150,000 |
qwen2-57b-a14b-instruct廃止予定 | 30,000 | |
qwen2-7b-instruct廃止予定 | ||
qwen1.5-110b-chat廃止予定 | 10 | 20,000 |
qwen1.5-72b-chat廃止予定 | 120 | 200,000 |
qwen1.5-32b-chat廃止予定 | 10 | 20,000 |
qwen1.5-14b-chat廃止予定 | 120 | 200,000 |
qwen1.5-7b-chat廃止予定 |
オープンソース Qwen-VL(視覚的理解/画像からテキストへ)
名前 | レート制限(いずれかの制限を超えた場合にトリガーされます) | |
1 分あたりのクエリ数(QPM) | 1 分あたりの消費トークン数(TPM) 入力 + 出力 | |
qwen2.5-vl-72b-instruct | 60 | 100,000 |
qwen2.5-vl-32b-instruct | ||
qwen2.5-vl-7b-instruct | ||
qwen2.5-vl-3b-instruct |
Qwen-Omni(マルチモーダル)
名前 | レート制限(いずれかの制限を超えた場合にトリガーされます) | |
1 分あたりのクエリ数(QPM) | 1 分あたりに消費されるトークン数(TPM) 入力 + 出力 | |
qwen2.5-omni-7b | 60 | 100,000 |
画像生成
Wan
名前 | 1 秒あたりのタスク送信数 | 同時タスク数 |
wan2.1-t2i-turbo | 2 | 2 |
wan2.1-t2i-plus |
動画生成
Wan
名前 | 1 秒あたりのタスク送信数 | 同時タスク数 |
wan2.1-t2v-turbo | 2 | 2 |
wan2.1-t2v-plus | ||
wan2.1-i2v-turbo | ||
wan2.1-i2v-plus | ||
wan2.1-kf2v-plus | ||
wan2.1-vace-plus |
埋め込みモデル
一般的なテキスト埋め込み
名前 | レート制限(いずれかの制限を超えた場合にトリガーされます) | |
1 分あたりのクエリ数(QPM) | 1 分あたりに消費されるトークン数(TPM)/ ジョブ数 入力 + 出力 | |
text-embedding-v3 | 6,000 | 24,000,000 |