描述模型部署任務對象的屬性和結構。
當前模型部署 API 僅在新加坡 Region 開放。如您使用其他 Region,請通過該 Region 的百鍊控制台完成模型部署操作。
以下為部署任務的響應對象欄位定義。通過建立部署介面建立,可通過查詢部署詳情和列舉部署介面擷取。
響應參數
|
參數 |
類型 |
說明 |
|
request_id |
String |
本次請求的ID。 |
|
output |
Object |
本次部署任務的詳細資料。 |
|
deployed_model |
String |
新模型的唯一標識。在發起模型調用請求時需要在SDK參數傳入。 |
|
gmt_create |
String |
建立部署任務的時間。 |
|
gmt_modified |
String |
修改部署任務的時間。 |
|
status |
String |
部署任務的狀態。
|
|
model_name |
String |
部署任務使用的模型名稱。 |
|
base_model |
String |
部署任務使用的模型對應的基本模型ID。 |
|
base_capacity |
Number |
基本模型運行所需的最小資源單元數量。 |
|
capacity |
Number |
部署任務使用的資源單元數量。 |
|
ready_capacity |
Number |
已就緒並可立即處理請求的資源單元數量。受限於資源初始化速度或硬體狀態。 |
|
workspace_id |
String |
部署任務所屬的業務空間ID。 |
|
charge_type |
String |
部署任務的計費方法。
|
|
creator |
String |
該部署任務建立人UID。 |
|
modifier |
String |
對該部署任務進行最後一次操作的帳號UID。 |
|
plan |
String |
部署任務的計費模式。(部分模式不顯示該參數) |
|
僅模型单元部署方式響應 |
||
|
model_unit_spec |
String |
模型單元規格。 |
|
enable_thinking |
Boolean |
是否開啟思考模式,部分模型支援。 |
|
max_context_length |
Number |
最大上下文長度限制。 |
|
rpm_limit |
String |
Requests per minute,每分鐘請求數。 |
|
tpm_limit |
Number |
Token per minute,每分鐘 Token 使用量。 |
|
僅預置輸送量(ptu)部署方式響應 |
||
|
ptu_capacity |
Object |
當設定 範例: |
|
ptu_capacity.input_tpm |
Number |
所有模型支援,input token pre-minute,部署的模型每分鐘支援的最大輸入 Token 量。 |
|
ptu_capacity.output_tpm |
Number |
所有模型支援,output token pre-minute,部署的模型每分鐘支援的最大輸出 Token 量。 |
|
ptu_capacity.thinking_output_tpm |
Number |
部分模型支援,thinking output token pre-minute,部署的模型每分鐘支援的預置思考最大輸出 Token 量。 |