全部產品
Search
文件中心

Alibaba Cloud Model Studio:部署擴縮容

更新時間:Jun 06, 2026

對指定部署進行擴縮容操作。

前提條件

更新模型部署任務

通過更新操作調整專屬服務使用的資源單元數量。

地址

PUT https://dashscope-intl.aliyuncs.com/api/v1/deployments/{deployed_model}/scale

請求樣本

通過以下命令可以將指定的服務進行擴縮容:

curl --request PUT "https://dashscope-intl.aliyuncs.com/api/v1/deployments/emo-35b3f106-sample01/scale" \
    --header "Authorization: Bearer ${DASHSCOPE_API_KEY}" \
    --header 'Content-Type: application/json' \
    --data '{
                "capacity":2
            }'

請求參數

參數

類型

傳參方式

必選

說明

deployed_model

String

path

新模型的唯一標識,可通過建立部署列舉部署介面擷取。

capacity

Number

body

條件必選

"plan": "mu"時,可填寫該設定。

具體支援情況請參考:模型單元部署的功能支援情況

更新之後,模型所使用的資源單元。必須base_capacity的整數倍。

ptu_capacity

Object

body

條件必選

"plan": "ptu"時,可填寫該設定。

具體支援情況請參考:PTU部署的功能支援情況

當設定"plan": "ptu"時,該參數才生效。

範例:"ptu_capacity": { "input_tpm": 10000, "output_tpm": 1000 }

ptu_capacity.input_tpm

Number

body

所有模型支援,input token pre-minute,部署的模型每分鐘支援的最大輸入 Token 量。

ptu_capacity.output_tpm

Number

body

所有模型支援,output token pre-minute,部署的模型每分鐘支援的最大輸出 Token 量。

ptu_capacity.thinking_output_tpm

Number

body

部分模型支援,thinking output token pre-minute,部署的模型每分鐘支援的預置思考最大輸出 Token 量。

響應樣本

命令執行完成後,返回以下結果:

{
  "request_id": "6c6b7676-3fea-423b-bc26-c9e2337e1142",
  "output": {
    "deployed_model": "emo-35b3f106-sample01",
    "gmt_create": "2025-06-17T11:00:38",
    "gmt_modified": "2025-06-17T11:42:02.311",
    "status": "UPDATING",
    "model_name": "emo",
    "base_model": "emo",
    "base_capacity": 1,
    "capacity": 2,
    "ready_capacity": 1,
    "workspace_id": "llm-v71tlv3dezezp2en",
    "charge_type": "post_paid",
    "creator": "17580541***",
    "modifier": "17580541***"
  }
}

響應參數

請參考建立模型部署任務的響應參數。

異常響應

響應樣本

{
    "request_id": "ca218d57-b91b-46b2-bd35-c41c6287bcf4",
    "message": "Model: qwen-plus-20230703-cx7f not found!",
    "code": "NotFound"
}

響應參數

欄位

類型

描述

request_id

String

本次請求的系統唯一碼。

code

String

錯誤碼。

message

String

錯誤資訊。

當請求出錯時,可能返回以下錯誤:

錯誤碼

錯誤資訊

錯誤原因

NotFound

Model: xxx not found!

  • 建立部署任務時指定了不存在的模型。

  • 查詢/更新/刪除部署任務時指定了不存在的模型。

Conflict

Deployed model xxx already exists, please specify a suffix.

建立部署任務時使用了已使用過的suffix。

InvalidParameter

Invalid capacity (xx), capacity must be larger than or equal to 0 and multiples of 1 and less than 1000!

建立/更新部署任務時指定了無效的算力單元數量。