音声合成サービスは、入力テキストをバイナリオーディオデータに変換するために使用されます。
機能
パルス符号変調( PCM )、 WAV 、および MP3 を含む、次のオーディオコーディング形式をサポートしています。
話者の速度、イントネーション、音量を設定できます。
生成された音声の話者(さまざまな言語または方言の男性音声と女性音声を含む)を設定できます。
重要各中国語の文字または英単語の音素境界検出をサポートしています。音声合成サービスは、合成された音声内の各単語のタイムスタンプを生成します。このタイムスタンプは、音声内の各中国語の文字または英単語の時点を示します。タイムスタンプ情報は、リップシンクまたは吹き替えに使用できます。詳細については、「タイムスタンプ機能」をご参照ください。
名前
voice パラメーターの値
タイプ
シナリオ
対応言語
対応サンプリングレート( Hz )
各文字または単語の音素境界検出
備考
Xiaoyun
Xiaoyun
標準女性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K
いいえ
なし
Xiaogang
Xiaogang
標準男性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K
いいえ
なし
Ruoxi
Ruoxi
優しい女性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K/24K
いいえ
なし
Siqi
Siqi
優しい女性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K/24K
はい
なし
Sijia
Sijia
標準女性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K/24K
いいえ
なし
Sicheng
Sicheng
標準男性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K/24K
はい
なし
Aiqi
Aiqi
優しい女性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Aijia
Aijia
標準女性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Aicheng
Aicheng
標準男性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Aida
Aida
標準男性音声
すべてのシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Ning'er
Ninger
標準女性音声
すべてのシナリオ
中国語のみ
8K/16K/24K
いいえ
なし
Ruilin
Ruilin
標準女性音声
すべてのシナリオ
中国語のみ
8K/16K/24K
いいえ
なし
Siyue
Siyue
優しい女性音声
カスタマーサービス
中国語またはバイリンガル(中国語と英語)
8K/16K/24K
いいえ
なし
Aiya
Aiya
ハスキーな女性音声
カスタマーサービス
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Aixia
Aixia
愛想の良い女性音声
カスタマーサービス
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Aimei
Aimei
甘い女性音声
カスタマーサービス
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Aiyu
Aiyu
自然な女性音声
カスタマーサービス
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Aiyue
Aiyue
優しい女性音声
カスタマーサービス
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Aijing
Aijing
ハスキーな女性音声
カスタマーサービス
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
なし
Xiaomei
Xiaomei
甘い女性音声
カスタマーサービス
中国語またはバイリンガル(中国語と英語)
8K/16K/24K
いいえ
なし
Aina
Aina
浙江なまりの女性音声
カスタマーサービス
中国語のみ
8K/16K
はい
なし
Yina
Yina
浙江なまりの女性音声
カスタマーサービス
中国語のみ
8K/16K/24K
いいえ
なし
Sijing
Sijing
ハスキーな女性音声
カスタマーサービス
中国語のみ
8K/16K/24K
はい
なし
Sitong
Sitong
子供の声
子供の声が必要なシナリオ
中国語のみ
8K/16K/24K
いいえ
なし
Xiaobei
Xiaobei
少女の声
子供の声が必要なシナリオ
中国語のみ
8K/16K/24K
はい
なし
Aitong
Aitong
子供の声
子供の声が必要なシナリオ
中国語のみ
8K/16K
はい
なし
Aiwei
Aiwei
少女の声
子供の声が必要なシナリオ
中国語のみ
8K/16K
はい
なし
Aibao
Aibao
少女の声
子供の声が必要なシナリオ
中国語のみ
8K/16K
はい
なし
Harry
Harry
イギリス英語の男性音声
英語のみ
英語のみ
8K/16K
いいえ
なし
Abby
Abby
アメリカ英語の女性音声
英語のみ
英語のみ
8K/16K
いいえ
なし
Andy
Andy
アメリカ英語の男性音声
英語のみ
英語のみ
8K/16K
いいえ
なし
Eric
Eric
イギリス英語の男性音声
英語のみ
英語のみ
8K/16K
いいえ
なし
Emily
Emily
イギリス英語の女性音声
英語のみ
英語のみ
8K/16K
いいえ
なし
Luna
Luna
イギリス英語の女性音声
英語のみ
英語のみ
8K/16K
いいえ
なし
Luca
Luca
イギリス英語の男性音声
英語のみ
英語のみ
8K/16K
いいえ
なし
Wendy
Wendy
イギリス英語の女性音声
英語のみ
英語のみ
8K/16K/24K
いいえ
なし
William
William
イギリス英語の男性音声
英語のみ
英語のみ
8K/16K/24K
いいえ
なし
Olivia
Olivia
イギリス英語の女性音声
英語のみ
英語のみ
8K/16K/24K
いいえ
なし
Shanshan
Shanshan
広東語を話す女性の声
方言が使用されるシナリオ
広東語(簡体字)とバイリンガル(広東語と英語)
8K/16K/24K
いいえ
なし
Xiaoyue
Xiaoyue
四川なまりの女性音声
方言が使用されるシナリオ
中国語またはバイリンガル(中国語と英語)
8K/16K
いいえ
パブリックプレビュー中
Lydia
Lydia
バイリンガル(中国語と英語)の女性音声
英語のみ
英語のみ
8K/16K
いいえ
パブリックプレビュー中
Aishuo
Aishuo
自然な男性音声
カスタマーサービス
中国語またはバイリンガル(中国語と英語)
8K/16K
はい
パブリックプレビュー中
Qingqing
Qingqing
台湾語を話す女性の声
方言が使用されるシナリオ
中国語のみ
8K/16K
いいえ
パブリックプレビュー中
Cuijie
Cuijie
東北官話なまりの女性の声
方言が使用されるシナリオ
中国語のみ
8K/16K
いいえ
パブリックプレビュー中
Xiaoze
Xiaoze
強い湖南なまりの男性音声
方言が使用されるシナリオ
中国語のみ
8K/16K
はい
パブリックプレビュー中
制限
入力テキストは
UTF-8
エンコードである必要があります。入力テキストは最大 300 文字です。テキストに 300 文字を超える文字が含まれている場合、追加の文字は削除されます。
サービスアドレス
タイプ | 説明 | URL |
外部ネットワークからのアクセス | インターネット経由のすべてのクライアントから音声合成サービスにアクセスするには、この URL を使用できます。外部アクセス用の URL は、 SDK のデフォルト URL として指定されています。 | wss://nls-gateway-ap-southeast-1.aliyuncs.com/ws/v1 |
1. 認証を通過するためのトークンを提供する
クライアントからサーバーへの WebSocket 接続を確立し、認証を通過するためのトークンを提供します。トークンの取得方法の詳細については、「トークンの取得」をご参照ください。
2. 合成タスクを開始する
クライアントは音声合成を開始するためのリクエストを送信します。 SDK の SpeechSynthesizer オブジェクトの SET メソッドを使用して、リクエストパラメーターを設定できます。次の表に、リクエストパラメーターを示します。
パラメーター | タイプ | 必須 | 説明 |
appkey | 文字列 | はい | Intelligent Speech Interaction コンソールで作成されたプロジェクトの appkey 。 |
text | 文字列 | はい | 合成するテキスト。テキストは |
voice | 文字列 | いいえ | 使用する話者。デフォルト値: |
format | 文字列 | いいえ | オーディオコーディング形式。デフォルト値: pcm 。有効な値: pcm 、 wav 、および mp3 。 |
sample_rate | 整数 | いいえ | オーディオサンプリングレート。単位: Hz 。デフォルト値: 16000 。 |
volume | 整数 | いいえ | 話者の音量。値の範囲: 0 ~ 100 。デフォルト値: 50 。 |
speech_rate | 整数 | いいえ | 話者が話す速度。値の範囲: -500 ~ 500 。デフォルト値: 0 。 |
pitch_rate | 整数 | いいえ | 話者のイントネーション。値の範囲: -500 ~ 500 。デフォルト値: 0 。 |
3. 合成されたオーディオデータを受信する
サーバーは、合成されたオーディオデータをバイナリ形式で返します。クライアントは、 SDK を使用してオーディオデータを受信および処理します。
4. 合成タスクを完了する
合成タスクが完了すると、サーバーは通知メッセージを送信します。次の例は、サンプルの通知メッセージを示しています。
{
"header": {
"message_id": "05450bf69c53413f8d88aed1ee60****", // メッセージID
"task_id": "640bc797bb684bd6960185651307****", // タスクID
"namespace": "SpeechSynthesizer", // 名前空間
"name": "SynthesisCompleted", // 合成完了
"status": 20000000, // ステータスコード
"status_message": "GATEWAYSUCCESSSuccess." // ステータスメッセージ
}
}
デモでは、合成されたオーディオはファイルに保存されます。受信処理中に合成されたオーディオを再生する場合は、ストリーム再生を使用することをお勧めします。ストリーム再生モードでは、オーディオデータの受信中に合成されたオーディオを再生できます。これにより、オーディオを再生できるようになるまでの待ち時間が短縮されます。
ステータスコード
各レスポンスにはステータスコードが含まれています。次の表に、ステータスコードを示します。
一般的なエラー
ステータスコード | 原因 | 解決策 |
40000001 | クライアントが認証に失敗しました。 | クライアントが使用しているトークンが有効かどうか、または期限切れかどうかを確認します。 |
40000002 | リクエストが無効です。 | クライアントから送信されたリクエストが要件を満たしているかどうかを確認します。 |
403 | トークンが期限切れであるか、リクエストに無効なパラメーターが含まれています。 | クライアントで使用されているトークンが期限切れかどうかを確認します。次に、パラメーター値が有効かどうかを確認します。 |
40000004 | クライアントがタイムアウトしました。 | クライアントが 10 秒などの長時間サーバーにデータを送信しなかったかどうかを確認します。 |
40000005 | リクエスト数が上限を超えています。 | 同時接続数または 1 秒あたりのクエリ数( QPS )値が上限を超えているかどうかを確認します。同時接続数が上限を超えている場合は、Intelligent Speech Interaction をトライアル版から商用版にアップグレードすることをお勧めします。商用版を使用している場合は、同時実行性を高めるためにより多くのリソースを購入することをお勧めします。 |
40000000 | クライアントエラーが発生しました。これは、クライアントエラーのデフォルトのステータスコードです。 | エラーメッセージに基づいてエラーを解決するか、チケットを送信します。 |
50000000 | サーバーエラーが発生しました。これは、サーバーエラーのデフォルトのステータスコードです。 | ステータスコードがたまに返される場合は、無視します。ステータスコードが複数回返される場合は、チケットを送信します。 |
50000001 | 内部呼び出しエラーが発生しました。 | ステータスコードがたまに返される場合は、無視します。ステータスコードが複数回返される場合は、チケットを送信します。 |
ゲートウェイエラー
ステータスコード | 原因 | 解決策 |
40010001 | メソッドはサポートされていません。 | SDK を使用している場合は、チケットを送信します。 |
40010002 | 命令はサポートされていません。 | SDK を使用している場合は、チケットを送信します。 |
40010003 | 命令形式が無効です。 | SDK を使用している場合は、チケットを送信します。 |
40010004 | クライアントが予期せず切断されました。 | サーバーがリクエストされたタスクを完了する前にクライアントが切断されたかどうかを確認します。 |
40010005 | タスクステータスが無効です。 | タスクが現在の状態にあるときに命令がサポートされているかどうかを確認します。 |
構成エラー
ステータスコード | 原因 | 解決策 |
40020105 | アプリケーションが存在しません。 | appkey が正しいかどうか、またトークンと同じ Alibaba Cloud アカウントに属しているかどうかを確認します。 |
テキスト読み上げ( TTS )サービスエラー
ステータスコード | 原因 | 解決策 |
41020001 | 1 つ以上のパラメーターが無効です。 | 指定されたパラメーター値が有効かどうかを確認します。 |
51020001 | TTS サーバーエラーが発生しました。 | ステータスコードがたまに返される場合は、無視します。ステータスコードが複数回返される場合は、チケットを送信します。 |