全部產品
Search
文件中心

Alibaba Cloud Model Studio:部署對象

更新時間:Jun 06, 2026

描述模型部署任務對象的屬性和結構。

當前模型部署 API 僅在新加坡 Region 開放。如您使用其他 Region,請通過該 Region 的百鍊控制台完成模型部署操作。

以下為部署任務的響應對象欄位定義。通過建立部署介面建立,可通過查詢部署詳情列舉部署介面擷取。

響應參數

參數

類型

說明

request_id

String

本次請求的ID。

output

Object

本次部署任務的詳細資料。

deployed_model

String

新模型的唯一標識。在發起模型調用請求時需要在SDK參數傳入。

gmt_create

String

建立部署任務的時間。

gmt_modified

String

修改部署任務的時間。

status

String

部署任務的狀態。

  • PENDING:正在建立部署任務。

  • UPDATING:正在更新部署任務。

  • RUNNING:部署任務正在運行,此時已部署的模型可以正常處理請求。

  • STOPPED:部署任務已經停止,此時的部署任務不會被計費。

  • DELETING:正在刪除部署任務。

  • FAILED:部署任務建立或更新失敗。

model_name

String

部署任務使用的模型名稱。

base_model

String

部署任務使用的模型對應的基本模型ID。

base_capacity

Number

基本模型運行所需的最小資源單元數量。

capacity

Number

部署任務使用的資源單元數量。

ready_capacity

Number

已就緒並可立即處理請求的資源單元數量。受限於資源初始化速度或硬體狀態。

workspace_id

String

部署任務所屬的業務空間ID。

charge_type

String

部署任務的計費方法。

post_paid:後付費。

creator

String

該部署任務建立人UID。

modifier

String

對該部署任務進行最後一次操作的帳號UID。

plan

String

部署任務的計費模式。(部分模式不顯示該參數)

模型单元部署方式響應

model_unit_spec

String

模型單元規格。

enable_thinking

Boolean

是否開啟思考模式,部分模型支援。

max_context_length

Number

最大上下文長度限制。

rpm_limit

String

Requests per minute,每分鐘請求數。

tpm_limit

Number

Token per minute,每分鐘 Token 使用量。

僅預置輸送量(ptu)部署方式響應

ptu_capacity

Object

當設定"plan": "ptu"時,該參數才生效。

範例:"ptu_capacity": { "input_tpm": 10000, "output_tpm": 1000 }

ptu_capacity.input_tpm

Number

所有模型支援,input token pre-minute,部署的模型每分鐘支援的最大輸入 Token 量。

ptu_capacity.output_tpm

Number

所有模型支援,output token pre-minute,部署的模型每分鐘支援的最大輸出 Token 量。

ptu_capacity.thinking_output_tpm

Number

部分模型支援,thinking output token pre-minute,部署的模型每分鐘支援的預置思考最大輸出 Token 量。