サービスがデプロイされた後、コンソールのオンラインデバッグ機能を使用して、サービスが期待どおりに実行されるかどうかをテストできます。この機能はグラフィカルインターフェイスを提供し、コードを記述することなく、テストリクエストを送信して結果を表示できます。
オンラインでのデバッグ方法
オンラインデバッグページに移動します。
PAI コンソールにログインします。ページの上部でリージョンを選択します。次に、目的のワークスペースを選択し、[Elastic Algorithm Service (EAS)] をクリックします。
[推論サービス] タブで、テストするサービスを見つけ、[アクション] 列の
> [オンラインデバッグ] をクリックします。
リクエストの作成と送信 (重要なステップ)。API 操作の定義、特にリクエストの URI とリクエストボディのフォーマットは、モデルによって大きく異なります。リクエストパラメーターを正しく入力してください。標準的なリクエストには、次の要素が含まれます。
メソッド: 通常は
POSTまたはGETです。リクエストの URI (URL): ベースアドレスは、オンラインデバッグ用に自動的に入力されます。特定の API 操作パスを追加するかどうかを決定する必要があります。パスが正しくないことが、
404 Not Foundエラーの最も一般的な原因です。リクエストヘッダー (Headers):
Authorizationトークンは通常、自動的に入力されるため、変更する必要はありません。リクエストボディ (Body): リクエストボディは API 操作の要件に準拠し、正しいフォーマットである必要があります。フォーマットが正しくないことが、
400 Bad Requestまたは500 Internal Server Errorエラーの主な原因です。
使用例
この例では、vLLM を使用してデプロイされた Qwen2.5-7B-Instruct モデルサービスのチャット API 操作をテストする方法を示します。パラメーターは次のとおりです。
メソッド: POST
リクエストの URI (URL):
http://***********/v1/chat/completions(オンラインデバッグ用に自動的に入力される URL に/v1/chat/completionsを追加する必要があります。)リクエストボディ (Body):
{ "model": "Qwen2.5-7B-Instruct", "messages": [ { "role": "user", "content": "カナダの首都は何ですか?" } ] }
結果は次のとおりです。

よくある質問
Q: 正しい URL とリクエストボディを決定するにはどうすればよいですか?
正しい URL とリクエストボディは、デプロイしたモデルによって異なります。詳細については、「一般的なシナリオのリクエストを作成する」をご参照ください。
次のステップ
パフォーマンス評価: 自動サービスストレステスト機能を使用して、サービスのパフォーマンスを評価できます。
正式な呼び出し: サービスのパフォーマンスが要件を満たしたら、サービスを呼び出すことができます。詳細については、「サービスの呼び出しメソッド」をご参照ください。