本文介紹 Qwen-ASR 模型的輸入與輸出參數。可通過OpenAI 相容或DashScope協議調用 API。
使用者指南:模型介紹和選型請參見錄音檔案識別-千問。
模型接入方式
不同模型支援的接入方式不同,請根據下表選擇正確的方式進行整合。
|
模型 |
接入方式 |
|
千問3-ASR-Flash-Filetrans |
僅支援DashScope非同步呼叫方式 |
|
千問3-ASR-Flash |
OpenAI 相容
美國地區不支援OpenAI相容模式。
URL
國際
在國際部署模式下,存取點與資料存放區均位於新加坡地區,模型推理計算資源在全球範圍內動態調度(不含中國內地)。
HTTP請求地址:POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions
SDK調用配置的base_url:https://dashscope-intl.aliyuncs.com/compatible-mode/v1
中國內地
在中國內地部署模式下,存取點與資料存放區均位於北京地區,模型推理計算資源僅限於中國內地。
HTTP請求地址:POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
SDK調用配置的base_url:https://dashscope.aliyuncs.com/compatible-mode/v1
請求體 |
輸入內容:音頻檔案URLPython SDK
Node.js SDK
cURL通過System Message的
輸入內容:Base64編碼的音頻檔案可輸入Base64編碼資料(Data URL),格式為:
Python SDK樣本中用到的音頻檔案為:welcome.mp3。
Node.js SDK樣本中用到的音頻檔案為:welcome.mp3。
|
|
model 模型名稱。僅適用於千問3-ASR-Flash模型。 |
|
|
messages 訊息列表。 |
|
|
asr_options 用來指定某些功能是否啟用。
|
|
|
stream 是否以流式輸出方式回複。相關文檔:流式輸出 可選值:
推薦設定為 |
|
|
stream_options 流式輸出的配置項,僅在 |
返回體 |
非流式輸出
流式輸出
|
|
id 本次調用的唯一識別碼。 |
|
|
choices 模型的輸出資訊。 |
|
|
created 請求建立時的 Unix 時間戳記(秒)。 |
|
|
model 本次請求使用的模型。 |
|
|
object 始終為 |
|
|
usage 本次請求的Token消耗資訊。 |
DashScope同步調用
URL
國際
在國際部署模式下,存取點與資料存放區均位於新加坡地區,模型推理計算資源在全球範圍內動態調度(不含中國內地)。
HTTP請求地址:POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation
SDK調用配置的base_url:https://dashscope-intl.aliyuncs.com/api/v1
美國
在美國部署模式下,存取點與資料存放區均位於美國(維吉尼亞)地區,模型推理計算資源僅限於美國境內。
HTTP請求地址:POST https://dashscope-us.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation
SDK調用配置的base_url:https://dashscope-us.aliyuncs.com/api/v1
中國內地
在中國內地部署模式下,存取點與資料存放區均位於北京地區,模型推理計算資源僅限於中國內地。
HTTP請求地址:POST https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation
SDK調用配置的base_url:https://dashscope.aliyuncs.com/api/v1
請求體 |
千問3-ASR-Flash以下樣本為音頻 URL 識別;本地音頻檔案識別樣本請參見快速開始。 cURL
Java
Python
|
|
model 模型名稱。僅適用於千問3-ASR-Flash模型。 |
|
|
messages 訊息列表。 通過HTTP調用時,請將messages 放入 input 對象中。 |
|
|
asr_options 用來指定某些功能是否啟用。 僅千問3-ASR-Flash支援該參數。 |
返回體 |
千問3-ASR-Flash
|
|
request_id 本次調用的唯一識別碼。 Java SDK返回參數為requestId。 |
|
|
output 調用結果資訊。 |
|
|
usage 本次請求的Token消耗資訊。 |
DashScope非同步呼叫
流程說明
與OpenAI相容模式或DashScope同步調用(均為一次請求、立即返回結果)不同,非同步呼叫專為處理長音頻檔案或耗時較長的任務設計,該模式採用“提交-輪詢”的兩步式流程,避免了因長時間等待而導致的請求逾時:
-
第一步:提交任務
-
用戶端發起一個非同步處理請求。
-
伺服器驗證請求後,不會立即執行任務,而是返回一個唯一的
task_id,表示任務已成功建立。
-
-
第二步:擷取結果
-
用戶端使用擷取到的
task_id,通過輪詢方式反覆調用結果查詢介面。 -
當任務處理完成後,結果查詢介面將返回最終的識別結果。
-
您可以根據Integration Environment選擇使用SDK或直接調用RESTful API。
-
使用 SDK(範例程式碼請參見快速開始,請求參數請參見提交任務的請求體,返回結果請參見非同步呼叫識別結果說明)
SDK封裝了底層的API調用細節,提供了更便捷的編程體驗。
-
提交任務:調用
async_call()(Python) 或asyncCall()(Java) 方法提交任務。此方法將返回一個包含task_id的任務對象。 -
擷取結果:使用上一步返回的任務對象或
task_id,調用fetch()方法擷取結果。SDK內部會自動處理輪詢邏輯,直到任務完成或逾時。
-
-
2. 使用 RESTful API
直接調用HTTP介面提供了最大的靈活性。
提交任務
URL
國際
在國際部署模式下,存取點與資料存放區均位於新加坡地區,模型推理計算資源在全球範圍內動態調度(不含中國內地)。
HTTP請求地址:POST https://dashscope-intl.aliyuncs.com/api/v1/services/audio/asr/transcription
SDK調用配置的base_url:https://dashscope-intl.aliyuncs.com/api/v1
中國內地
在中國內地部署模式下,存取點與資料存放區均位於北京地區,模型推理計算資源僅限於中國內地。
HTTP請求地址:POST https://dashscope.aliyuncs.com/api/v1/services/audio/asr/transcription
SDK調用配置的base_url:https://dashscope.aliyuncs.com/api/v1
請求體 |
cURLJavaSDK樣本請參見快速開始。
PythonSDK樣本請參見快速開始。
|
|
model 模型名稱。僅適用於千問3-ASR-Flash-Filetrans模型。 |
|
|
input |
|
|
parameters |
返回體 |
|
|
request_id 本次調用的唯一識別碼。 |
|
|
output 調用結果資訊。 |
擷取任務執行結果
URL
國際
HTTP請求地址:GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id}
SDK調用配置的base_url:https://dashscope-intl.aliyuncs.com/api/v1
中國內地
SDK調用配置的base_url:https://dashscope.aliyuncs.com/api/v1
HTTP請求地址:GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}
請求體 |
cURLJavaSDK樣本請參見快速開始。
PythonSDK樣本請參見快速開始。
|
|
task_id 任務ID。將提交任務返回結果中的task_id作為參數傳入,查詢語音辨識結果。 |
返回體 |
RUNNING
SUCCEEDED
FAILED
|
|
request_id 本次調用的唯一識別碼。 |
|
|
output 調用結果資訊。 |
非同步呼叫識別結果說明 |
|
|
file_url 被識別的音頻檔案URL。 |
|
|
audio_info 被識別音頻檔案相關資訊。 |
|
|
transcripts 完整的識別結果清單,每個元素對應一條音軌的識別內容。 |