本文为您介绍语音合成-千问模型的输入与输出参数。
模型的使用方法请参见语音合成-千问。
请求体 |
非流式输出PythonDashScope Python SDK中的
Java
curl
流式输出PythonDashScope Python SDK中的
Java
curl
实时播放Base64 音频的方法请参见:语音合成-千问。 |
|
model 模型名称,详情请参见支持的模型。 |
|
|
text 要合成的文本,支持多语种混合输入。千问-TTS模型最长输入为512 Token。其他模型最长输入为600字符。 |
|
|
voice 使用的音色,参见支持的系统音色。 |
|
|
language_type 指定合成音频的语种,默认为
|
|
|
instructions 设置指令,参见指令控制。 默认值:无默认值,不设置不生效。 长度限制:长度不得超过 1600 Token。 支持语言:仅支持中文和英文。 适用范围:该功能仅适用于千问3-TTS-Instruct-Flash-Realtime系列模型。 |
|
|
optimize_instructions 是否对 默认值:false。 行为说明:当设置为 true 时,系统将对 适用场景:推荐在追求高品质、精细化语音表达的场景下开启。 依赖关系:此参数依赖于 适用范围:该功能仅适用于千问3-TTS-Instruct-Flash系列模型。 |
|
|
stream 是否流式输出回复。参数值:
该参数仅支持Python SDK。通过Java SDK实现流式输出请通过 |
返回对象(流式与非流式输出格式一致) |
千问3-TTS-Flash
千问-TTS
|
|
status_code HTTP状态码。遵循 RFC 9110标准定义。例如: |
|
|
request_id 本次请求的唯一标识。可用于定位和排查问题。 |
|
|
code 请求失败时展示错误码(参见错误信息)。 |
|
|
message 请求失败时展示错误信息(参见错误信息)。 |
|
|
output 模型的输出。 |
|
|
usage 本次请求的 Token 或字符消耗信息。千问-TTS模型返回Token消耗信息,千问3-TTS-Flash模型返回字符消耗信息 |
|
|
request_id 本次请求的 ID。 |