修改指定部署的限流設定。
前提條件
-
您已經閱讀了模型部署簡介和使用 API 進行模型部署的相關內容,掌握了模型部署的使用方法,並熟悉了在阿里雲百鍊平台上進行模型部署的基本步驟。
-
已配置百鍊的 API-KEY, 請參考擷取API Key。
修改部署的模型設定
說明
僅模型單元部署方式的部分模型支援修改設定 rpm 和 tpm。
地址
PUT https://dashscope-intl.aliyuncs.com/api/v1/deployments/{deployed_model}/update
請求樣本
通過以下命令可以修改指定部署的限流設定:
curl -X PUT "https://dashscope-intl.aliyuncs.com/api/v1/deployments/{deployed_model}/update" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"rpm_limit": 1000,
"tpm_limit": 200
}'
請求參數
|
參數 |
類型 |
傳參方式 |
必選 |
說明 |
|
deployed_model |
String |
path |
是 |
|
|
rpm_limit |
Number |
body |
至少填寫一個參數 |
Requests per minute,每分鐘請求數。 |
|
tpm_limit |
Number |
body |
Token per minute,每分鐘 Token 使用量。 |
響應樣本
命令執行完成後,返回如下結果:
{
"request_id": "1d121fd9-876c-40ad-bc40-a9e68ef3b986",
"output":
{
"deployed_model": "qwen-plus-2025-12-01-b6d61c71",
"gmt_create": "2026-01-07T13:52:44",
"gmt_modified": "2026-01-07T14:01:41",
"status": "PENDING",
"model_name": "qwen-plus-2025-12-01",
"base_model": "qwen-plus-2025-12-01",
"base_capacity": 4,
"capacity": 4,
"ready_capacity": 0,
"workspace_id": "llm-8v53e*******",
"charge_type": "post_paid",
"creator": "16542902******",
"modifier": "16542902********",
"plan": "mu",
"model_unit_spec": "MU1",
"enable_thinking": true,
"max_context_length": 1,
"rpm_limit": 1000,
"tpm_limit": 200
}
}
響應參數
請參考建立模型部署任務的響應參數。
異常響應
響應樣本
{
"request_id": "ca218d57-b91b-46b2-bd35-c41c6287bcf4",
"message": "Model: qwen-plus-20230703-cx7f not found!",
"code": "NotFound"
}
響應參數
|
欄位 |
類型 |
描述 |
|
request_id |
String |
本次請求的系統唯一碼。 |
|
code |
String |
錯誤碼。 |
|
message |
String |
錯誤資訊。 |
當請求出錯時,可能返回以下錯誤:
|
錯誤碼 |
錯誤資訊 |
錯誤原因 |
|
NotFound |
Model: xxx not found! |
|
|
Conflict |
Deployed model xxx already exists, please specify a suffix. |
建立部署任務時使用了已使用過的suffix。 |
|
InvalidParameter |
Invalid capacity (xx), capacity must be larger than or equal to 0 and multiples of 1 and less than 1000! |
建立/更新部署任務時指定了無效的算力單元數量。 |