建立模型服務。
介面說明
調試
您可以在OpenAPI Explorer中直接運行該介面,免去您計算簽名的困擾。運行成功後,OpenAPI Explorer可以自動產生SDK程式碼範例。
調試
授權資訊
|
操作 |
存取層級 |
資源類型 |
條件關鍵字 |
關聯操作 |
|
gpdb:CreateModelService |
create |
*DBInstance
|
無 | 無 |
請求參數
|
名稱 |
類型 |
必填 |
描述 |
樣本值 |
| DBInstanceId |
string |
是 |
執行個體 ID。 說明
您可以調用 DescribeDBInstances 介面查看目標地區下所有的 AnalyticDB PostgreSQL 執行個體的執行個體 ID。 |
gp-xxxxxxxxx |
| ModelName |
string |
是 |
模型名稱。 |
Qwen3-Embedding-8B |
| Description |
string |
否 |
描述資訊。 |
test |
| SecurityIPList |
string |
否 |
IP 白名單。 127.0.0.1 表示禁止任何外部 IP 訪問,您可以在執行個體建立完成後調用 ModifySecurityIps 介面修改 IP 白名單。 |
127.0.0.1 |
| AiNodes |
array |
是 |
模型部署使用的 AINode 節點列表。 |
|
|
string |
否 |
AINode 節點名稱。 |
ai-xxxxxx |
|
| ModelParams |
object |
否 |
模型參數(待支援)。 |
暫未開放 |
| ResourceGroupId |
string |
否 |
執行個體當前所屬的資源群組 ID。如何擷取資源群組 ID,請參見查看資源群組基本資料。 |
rg-bp67acfmxazb4p**** |
| ClientToken |
string |
否 |
等冪性校正。更多資訊,請參見如何保證等冪性。 |
0c593ea1-3bea-11e9-b96b-88********** |
| Replicas |
integer |
否 |
模型服務副本數。 |
1 |
| InferenceEngine |
string |
否 |
推理引擎(當前僅支援 vllm)。 |
vllm |
| EnablePublicConnection |
boolean |
否 |
是否開啟公網 |
false |
返回參數
|
名稱 |
類型 |
描述 |
樣本值 |
|
object |
|||
| ModelServiceId |
string |
模型服務 ID。 |
ms-xxxxxxxxx |
| RequestId |
string |
請求 ID。 |
ABB39CC3-4488-4857-905D-2E4A051D0521 |
樣本
正常返回樣本
JSON格式
{
"ModelServiceId": "ms-xxxxxxxxx",
"RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521"
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
更多資訊,參考變更詳情。