服務部署完成後,您可以使用控制台的線上調試功能測試服務是否運行正常。它提供了圖形化介面,無需編寫任何代碼即可直接發送測試請求並查看返回結果。
如何線上調試
進入線上調試頁面。
登入PAI控制台,在頁面上方選擇目標地區,並在右側選擇目標工作空間,然後單擊進入EAS。
在推理服務頁簽,找到您想測試的服務,單擊目標服務操作列下的
>線上調試。
構造並發送請求 (關鍵步驟)。不同類型的模型,其API介面定義(尤其是URL路徑和請求體格式)千差萬別,請確保正確填寫請求參數。一個標準的請求包含以下要素:
要求方法 (Method):通常為
POST、GET。請求路徑(URL):線上調試已自動填滿基礎地址,需判斷是否需要拼接具體的介面路徑。路徑錯誤是導致
404 Not Found的最常見原因。要求標頭 (Headers):
AuthorizationToken 通常會自動填滿,無需修改。請求體 (Body):必須是符合介面要求、格式正確。格式錯誤是導致
400 Bad Request或500 Internal Server Error的主要原因。
使用樣本
以vLLM部署的Qwen2.5-7B-Instruct模型服務為例,測試其對話介面,參數如下:
請求方式(Method):POST
請求路徑(URL):
http://***********/v1/chat/completions(線上調試已自動填滿的URL後需添加/v1/chat/completions)請求體(Body):
{ "model": "Qwen2.5-7B-Instruct", "messages": [ { "role": "user", "content": "What is the captial of Canada?" } ] }
結果如下:

常見問題
如何確定正確的URL和請求體?
這完全取決於您部署的模型,可參見典型情境的請求構造。