全部產品
Search
文件中心

Alibaba Cloud Model Studio:修改部署限流

更新時間:Jun 06, 2026

修改指定部署的限流設定。

前提條件

修改部署的模型設定

說明

僅模型單元部署方式的部分模型支援修改設定 rpm 和 tpm。

地址

PUT https://dashscope-intl.aliyuncs.com/api/v1/deployments/{deployed_model}/update

請求樣本

通過以下命令可以修改指定部署的限流設定:

curl -X PUT "https://dashscope-intl.aliyuncs.com/api/v1/deployments/{deployed_model}/update" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "rpm_limit": 1000,
    "tpm_limit": 200
}'

請求參數

參數

類型

傳參方式

必選

說明

deployed_model

String

path

新模型的唯一標識,可通過建立部署列舉部署介面擷取。

rpm_limit

Number

body

至少填寫一個參數

Requests per minute,每分鐘請求數。

tpm_limit

Number

body

Token per minute,每分鐘 Token 使用量。

響應樣本

命令執行完成後,返回如下結果:

{
    "request_id": "1d121fd9-876c-40ad-bc40-a9e68ef3b986",
    "output":
    {
        "deployed_model": "qwen-plus-2025-12-01-b6d61c71",
        "gmt_create": "2026-01-07T13:52:44",
        "gmt_modified": "2026-01-07T14:01:41",
        "status": "PENDING",
        "model_name": "qwen-plus-2025-12-01",
        "base_model": "qwen-plus-2025-12-01",
        "base_capacity": 4,
        "capacity": 4,
        "ready_capacity": 0,
        "workspace_id": "llm-8v53e*******",
        "charge_type": "post_paid",
        "creator": "16542902******",
        "modifier": "16542902********",
        "plan": "mu",
        "model_unit_spec": "MU1",
        "enable_thinking": true,
        "max_context_length": 1,
        "rpm_limit": 1000,
        "tpm_limit": 200
    }
}

響應參數

請參考建立模型部署任務的響應參數。

異常響應

響應樣本

{
    "request_id": "ca218d57-b91b-46b2-bd35-c41c6287bcf4",
    "message": "Model: qwen-plus-20230703-cx7f not found!",
    "code": "NotFound"
}

響應參數

欄位

類型

描述

request_id

String

本次請求的系統唯一碼。

code

String

錯誤碼。

message

String

錯誤資訊。

當請求出錯時,可能返回以下錯誤:

錯誤碼

錯誤資訊

錯誤原因

NotFound

Model: xxx not found!

  • 建立部署任務時指定了不存在的模型。

  • 查詢/更新/刪除部署任務時指定了不存在的模型。

Conflict

Deployed model xxx already exists, please specify a suffix.

建立部署任務時使用了已使用過的suffix。

InvalidParameter

Invalid capacity (xx), capacity must be larger than or equal to 0 and multiples of 1 and less than 1000!

建立/更新部署任務時指定了無效的算力單元數量。