本トピックでは、Qwen 音声合成モデルのリクエストおよびレスポンスパラメーターについて説明します。
モデルの使用方法: 音声合成 - Qwen
リクエストボディ | 非ストリーミング出力PythonDashScope Python SDK の Javacurlストリーミング出力PythonDashScope Python SDK の JavacurlBase64 エンコードされた音声のリアルタイム再生については、「音声合成 - Qwen」をご参照ください。 |
model モデル名。詳細については、「対応モデル」をご参照ください。 | |
text 音声合成を行うテキスト。多言語混在入力に対応しています。Qwen-TTS は最大 512 トークンの入力をサポートします。その他のモデルは最大 600 文字の入力をサポートします。 | |
voice 使用する音声。対応するシステム音声の一覧については、「対応システム音声」をご参照ください。 | |
language_type 合成音声の言語を指定します。デフォルト値は
| |
instructions 音声合成をガイドするための指示を提供します。「リアルタイム音声合成 - Qwen」をご参照ください。 デフォルト値:なし。このパラメーターは未設定の場合、効果がありません。 長さ制限:1600 トークンを超えてはなりません。 対応言語:中国語および英語のみ。 適用範囲:この機能は Qwen3-TTS-Instruct-Flash-Realtime モデルシリーズにのみ適用されます。 | |
optimize_instructions
デフォルト値:false。 動作:true に設定すると、システムは 利用シーン:高品質かつ細かいレベルでの音声表現が必要な場合に有効化します。 依存関係: 適用範囲:この機能は Qwen3-TTS-Instruct-Flash モデルシリーズにのみ適用されます。 | |
stream レスポンスをストリーミング出力します。有効な値:
このパラメーターは Python SDK のみでサポートされます。Java SDK でストリーミング出力を実現するには、 |
戻りオブジェクト(ストリーミング/非ストリーミング出力共通) | Qwen3-TTS-FlashQwen-TTS |
status_code HTTP ステータスコード。RFC 9110 の標準定義に準拠しています。RFC 9110 例: | |
request_id リクエストの固有 ID。問題の特定およびトラブルシューティングに使用します。 | |
code リクエスト失敗時のエラーコードを表示します(「エラーメッセージ」をご参照ください)。 | |
message リクエスト失敗時のエラーメッセージを表示します(「エラーメッセージ」をご参照ください)。 | |
output モデルの出力。 | |
usage 本リクエストにおけるトークンまたは文字数の消費情報を示します。Qwen-TTS はトークン消費情報を返します。Qwen3-TTS-Flash は文字数消費情報を返します。 | |
request_id 本リクエストの ID。 |