本文為您介紹語音合成-千問模型的輸入與輸出參數。
模型的使用方法請參見語音合成-千問。
請求體 |
非流式輸出PythonDashScope Python SDK中的
Java
curl
流式輸出PythonDashScope Python SDK中的
Java
curl
即時播放Base64 音訊方法請參見:語音合成-千問。 |
|
model 模型名稱,詳情請參見支援的模型。 |
|
|
text 要合成的文本,支援多語種混合輸入。千問-TTS模型最長輸入為512 Token。其他模型最長輸入為600字元。 |
|
|
voice 使用的音色,參見支援的系統音色。 |
|
|
language_type 指定合成音訊語種,預設為
|
|
|
instructions 設定指令,參見即時語音合成-千問。 預設值:無預設值,不設定不生效。 長度限制:長度不得超過 1600 Token。 支援語言:僅支援中文和英文。 適用範圍:該功能僅適用於千問3-TTS-Instruct-Flash-Realtime系列模型。 |
|
|
optimize_instructions 是否對 預設值:false。 行為說明:當設定為 true 時,系統將對 適用情境:推薦在追求高品質、精細化語音表達的情境下開啟。 依賴關係:此參數依賴於 適用範圍:該功能僅適用於千問3-TTS-Instruct-Flash系列模型。 |
|
|
stream 是否流式輸出回複。參數值:
該參數僅支援Python SDK。通過Java SDK實現流式輸出請通過 |
返回對象(流式與非流式輸出格式一致) |
千問3-TTS-Flash
千問-TTS
|
|
status_code HTTP狀態代碼。遵循 RFC 9110標準定義。例如: |
|
|
request_id 本次請求的唯一標識。可用於定位和排查問題。 |
|
|
code 請求失敗時展示錯誤碼(參見錯誤資訊)。 |
|
|
message 請求失敗時展示錯誤資訊(參見錯誤資訊)。 |
|
|
output 模型的輸出。 |
|
|
usage 本次請求的 Token 或字元消耗資訊。千問-TTS模型返回Token消耗資訊,千問3-TTS-Flash模型返回字元消耗資訊 |
|
|
request_id 本次請求的 ID。 |