すべてのプロダクト
Search
ドキュメントセンター

Intelligent Speech Interaction:音声合成の概要

最終更新日:Jan 12, 2025

音声合成サービスは、入力テキストをバイナリオーディオデータに変換するために使用されます。

機能

  • パルス符号変調( PCM )、 WAV 、および MP3 を含む、次のオーディオコーディング形式をサポートしています。

  • 話者の速度、イントネーション、音量を設定できます。

  • 生成された音声の話者(さまざまな言語または方言の男性音声と女性音声を含む)を設定できます。

    重要

    各中国語の文字または英単語の音素境界検出をサポートしています。音声合成サービスは、合成された音声内の各単語のタイムスタンプを生成します。このタイムスタンプは、音声内の各中国語の文字または英単語の時点を示します。タイムスタンプ情報は、リップシンクまたは吹き替えに使用できます。詳細については、「タイムスタンプ機能」をご参照ください。

    名前

    voice パラメーターの値

    タイプ

    シナリオ

    対応言語

    対応サンプリングレート( Hz )

    各文字または単語の音素境界検出

    備考

    Xiaoyun

    Xiaoyun

    標準女性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    いいえ

    なし

    Xiaogang

    Xiaogang

    標準男性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    いいえ

    なし

    Ruoxi

    Ruoxi

    優しい女性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K/24K

    いいえ

    なし

    Siqi

    Siqi

    優しい女性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K/24K

    はい

    なし

    Sijia

    Sijia

    標準女性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K/24K

    いいえ

    なし

    Sicheng

    Sicheng

    標準男性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K/24K

    はい

    なし

    Aiqi

    Aiqi

    優しい女性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Aijia

    Aijia

    標準女性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Aicheng

    Aicheng

    標準男性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Aida

    Aida

    標準男性音声

    すべてのシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Ning'er

    Ninger

    標準女性音声

    すべてのシナリオ

    中国語のみ

    8K/16K/24K

    いいえ

    なし

    Ruilin

    Ruilin

    標準女性音声

    すべてのシナリオ

    中国語のみ

    8K/16K/24K

    いいえ

    なし

    Siyue

    Siyue

    優しい女性音声

    カスタマーサービス

    中国語またはバイリンガル(中国語と英語)

    8K/16K/24K

    いいえ

    なし

    Aiya

    Aiya

    ハスキーな女性音声

    カスタマーサービス

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Aixia

    Aixia

    愛想の良い女性音声

    カスタマーサービス

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Aimei

    Aimei

    甘い女性音声

    カスタマーサービス

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Aiyu

    Aiyu

    自然な女性音声

    カスタマーサービス

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Aiyue

    Aiyue

    優しい女性音声

    カスタマーサービス

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Aijing

    Aijing

    ハスキーな女性音声

    カスタマーサービス

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    なし

    Xiaomei

    Xiaomei

    甘い女性音声

    カスタマーサービス

    中国語またはバイリンガル(中国語と英語)

    8K/16K/24K

    いいえ

    なし

    Aina

    Aina

    浙江なまりの女性音声

    カスタマーサービス

    中国語のみ

    8K/16K

    はい

    なし

    Yina

    Yina

    浙江なまりの女性音声

    カスタマーサービス

    中国語のみ

    8K/16K/24K

    いいえ

    なし

    Sijing

    Sijing

    ハスキーな女性音声

    カスタマーサービス

    中国語のみ

    8K/16K/24K

    はい

    なし

    Sitong

    Sitong

    子供の声

    子供の声が必要なシナリオ

    中国語のみ

    8K/16K/24K

    いいえ

    なし

    Xiaobei

    Xiaobei

    少女の声

    子供の声が必要なシナリオ

    中国語のみ

    8K/16K/24K

    はい

    なし

    Aitong

    Aitong

    子供の声

    子供の声が必要なシナリオ

    中国語のみ

    8K/16K

    はい

    なし

    Aiwei

    Aiwei

    少女の声

    子供の声が必要なシナリオ

    中国語のみ

    8K/16K

    はい

    なし

    Aibao

    Aibao

    少女の声

    子供の声が必要なシナリオ

    中国語のみ

    8K/16K

    はい

    なし

    Harry

    Harry

    イギリス英語の男性音声

    英語のみ

    英語のみ

    8K/16K

    いいえ

    なし

    Abby

    Abby

    アメリカ英語の女性音声

    英語のみ

    英語のみ

    8K/16K

    いいえ

    なし

    Andy

    Andy

    アメリカ英語の男性音声

    英語のみ

    英語のみ

    8K/16K

    いいえ

    なし

    Eric

    Eric

    イギリス英語の男性音声

    英語のみ

    英語のみ

    8K/16K

    いいえ

    なし

    Emily

    Emily

    イギリス英語の女性音声

    英語のみ

    英語のみ

    8K/16K

    いいえ

    なし

    Luna

    Luna

    イギリス英語の女性音声

    英語のみ

    英語のみ

    8K/16K

    いいえ

    なし

    Luca

    Luca

    イギリス英語の男性音声

    英語のみ

    英語のみ

    8K/16K

    いいえ

    なし

    Wendy

    Wendy

    イギリス英語の女性音声

    英語のみ

    英語のみ

    8K/16K/24K

    いいえ

    なし

    William

    William

    イギリス英語の男性音声

    英語のみ

    英語のみ

    8K/16K/24K

    いいえ

    なし

    Olivia

    Olivia

    イギリス英語の女性音声

    英語のみ

    英語のみ

    8K/16K/24K

    いいえ

    なし

    Shanshan

    Shanshan

    広東語を話す女性の声

    方言が使用されるシナリオ

    広東語(簡体字)とバイリンガル(広東語と英語)

    8K/16K/24K

    いいえ

    なし

    Xiaoyue

    Xiaoyue

    四川なまりの女性音声

    方言が使用されるシナリオ

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    いいえ

    パブリックプレビュー中

    Lydia

    Lydia

    バイリンガル(中国語と英語)の女性音声

    英語のみ

    英語のみ

    8K/16K

    いいえ

    パブリックプレビュー中

    Aishuo

    Aishuo

    自然な男性音声

    カスタマーサービス

    中国語またはバイリンガル(中国語と英語)

    8K/16K

    はい

    パブリックプレビュー中

    Qingqing

    Qingqing

    台湾語を話す女性の声

    方言が使用されるシナリオ

    中国語のみ

    8K/16K

    いいえ

    パブリックプレビュー中

    Cuijie

    Cuijie

    東北官話なまりの女性の声

    方言が使用されるシナリオ

    中国語のみ

    8K/16K

    いいえ

    パブリックプレビュー中

    Xiaoze

    Xiaoze

    強い湖南なまりの男性音声

    方言が使用されるシナリオ

    中国語のみ

    8K/16K

    はい

    パブリックプレビュー中

制限

  • 入力テキストは UTF-8 エンコードである必要があります。

  • 入力テキストは最大 300 文字です。テキストに 300 文字を超える文字が含まれている場合、追加の文字は削除されます。

サービスアドレス

タイプ

説明

URL

外部ネットワークからのアクセス

インターネット経由のすべてのクライアントから音声合成サービスにアクセスするには、この URL を使用できます。外部アクセス用の URL は、 SDK のデフォルト URL として指定されています。

wss://nls-gateway-ap-southeast-1.aliyuncs.com/ws/v1

1. 認証を通過するためのトークンを提供する

クライアントからサーバーへの WebSocket 接続を確立し、認証を通過するためのトークンを提供します。トークンの取得方法の詳細については、「トークンの取得」をご参照ください。

2. 合成タスクを開始する

クライアントは音声合成を開始するためのリクエストを送信します。 SDK の SpeechSynthesizer オブジェクトの SET メソッドを使用して、リクエストパラメーターを設定できます。次の表に、リクエストパラメーターを示します。

パラメーター

タイプ

必須

説明

appkey

文字列

はい

Intelligent Speech Interaction コンソールで作成されたプロジェクトの appkey 。

text

文字列

はい

合成するテキスト。テキストは UTF-8 エンコードである必要があります。テキストは最大 300 文字です。テキスト内の単語を区切るには、スペース文字を使用します。

voice

文字列

いいえ

使用する話者。デフォルト値: xiaoyun

format

文字列

いいえ

オーディオコーディング形式。デフォルト値: pcm 。有効な値: pcm 、 wav 、および mp3 。

sample_rate

整数

いいえ

オーディオサンプリングレート。単位: Hz 。デフォルト値: 16000 。

volume

整数

いいえ

話者の音量。値の範囲: 0 ~ 100 。デフォルト値: 50 。

speech_rate

整数

いいえ

話者が話す速度。値の範囲: -500 ~ 500 。デフォルト値: 0 。

pitch_rate

整数

いいえ

話者のイントネーション。値の範囲: -500 ~ 500 。デフォルト値: 0 。

3. 合成されたオーディオデータを受信する

サーバーは、合成されたオーディオデータをバイナリ形式で返します。クライアントは、 SDK を使用してオーディオデータを受信および処理します。

4. 合成タスクを完了する

合成タスクが完了すると、サーバーは通知メッセージを送信します。次の例は、サンプルの通知メッセージを示しています。

{
    "header": {
        "message_id": "05450bf69c53413f8d88aed1ee60****", // メッセージID
        "task_id": "640bc797bb684bd6960185651307****", // タスクID
        "namespace": "SpeechSynthesizer", // 名前空間
        "name": "SynthesisCompleted", // 合成完了
        "status": 20000000, // ステータスコード
        "status_message": "GATEWAYSUCCESSSuccess." // ステータスメッセージ
    }
}
説明

デモでは、合成されたオーディオはファイルに保存されます。受信処理中に合成されたオーディオを再生する場合は、ストリーム再生を使用することをお勧めします。ストリーム再生モードでは、オーディオデータの受信中に合成されたオーディオを再生できます。これにより、オーディオを再生できるようになるまでの待ち時間が短縮されます。

ステータスコード

各レスポンスにはステータスコードが含まれています。次の表に、ステータスコードを示します。

一般的なエラー

ステータスコード

原因

解決策

40000001

クライアントが認証に失敗しました。

クライアントが使用しているトークンが有効かどうか、または期限切れかどうかを確認します。

40000002

リクエストが無効です。

クライアントから送信されたリクエストが要件を満たしているかどうかを確認します。

403

トークンが期限切れであるか、リクエストに無効なパラメーターが含まれています。

クライアントで使用されているトークンが期限切れかどうかを確認します。次に、パラメーター値が有効かどうかを確認します。

40000004

クライアントがタイムアウトしました。

クライアントが 10 秒などの長時間サーバーにデータを送信しなかったかどうかを確認します。

40000005

リクエスト数が上限を超えています。

同時接続数または 1 秒あたりのクエリ数( QPS )値が上限を超えているかどうかを確認します。同時接続数が上限を超えている場合は、Intelligent Speech Interaction をトライアル版から商用版にアップグレードすることをお勧めします。商用版を使用している場合は、同時実行性を高めるためにより多くのリソースを購入することをお勧めします。

40000000

クライアントエラーが発生しました。これは、クライアントエラーのデフォルトのステータスコードです。

エラーメッセージに基づいてエラーを解決するか、チケットを送信します。

50000000

サーバーエラーが発生しました。これは、サーバーエラーのデフォルトのステータスコードです。

ステータスコードがたまに返される場合は、無視します。ステータスコードが複数回返される場合は、チケットを送信します。

50000001

内部呼び出しエラーが発生しました。

ステータスコードがたまに返される場合は、無視します。ステータスコードが複数回返される場合は、チケットを送信します。

ゲートウェイエラー

ステータスコード

原因

解決策

40010001

メソッドはサポートされていません。

SDK を使用している場合は、チケットを送信します。

40010002

命令はサポートされていません。

SDK を使用している場合は、チケットを送信します。

40010003

命令形式が無効です。

SDK を使用している場合は、チケットを送信します。

40010004

クライアントが予期せず切断されました。

サーバーがリクエストされたタスクを完了する前にクライアントが切断されたかどうかを確認します。

40010005

タスクステータスが無効です。

タスクが現在の状態にあるときに命令がサポートされているかどうかを確認します。

構成エラー

ステータスコード

原因

解決策

40020105

アプリケーションが存在しません。

appkey が正しいかどうか、またトークンと同じ Alibaba Cloud アカウントに属しているかどうかを確認します。

テキスト読み上げ( TTS )サービスエラー

ステータスコード

原因

解決策

41020001

1 つ以上のパラメーターが無効です。

指定されたパラメーター値が有効かどうかを確認します。

51020001

TTS サーバーエラーが発生しました。

ステータスコードがたまに返される場合は、無視します。ステータスコードが複数回返される場合は、チケットを送信します。

[No text provided to translate. Please provide the text you want translated.]