語音合成為您提供將輸入文本合成為語音位元據的功能。
功能介紹
支援輸出PCM、WAV和MP3編碼格式資料。
支援設定語速、語調和音量。
支援設定不同類型的聲音。
重要字層級音素邊界介面:語音合成服務在輸出音訊同時,可輸出每個漢字/英文單詞在音頻中的時間位置,即時間戳記。該時間資訊可用於驅動虛擬人口型、做視頻配音字幕等。詳情請參見語音合成時間戳記功能介紹。
名稱
voice參數值
類型
適用情境
支援語言
支援採樣率(Hz)
支援字層級音素邊界介面
備忘
小雲
Xiaoyun
標準女聲
通用情境
中文及中英文混合情境
8K/16K
否
無
小剛
Xiaogang
標準男聲
通用情境
中文及中英文混合情境
8K/16K
否
無
若兮
Ruoxi
溫柔女聲
通用情境
中文及中英文混合情境
8K/16K/24K
否
無
思琪
Siqi
溫柔女聲
通用情境
中文及中英文混合情境
8K/16K/24K
是
無
思佳
Sijia
標準女聲
通用情境
中文及中英文混合情境
8K/16K/24K
否
無
思誠
Sicheng
標準男聲
通用情境
中文及中英文混合情境
8K/16K/24K
是
無
艾琪
Aiqi
溫柔女聲
通用情境
中文及中英文混合情境
8K/16K
是
無
艾佳
Aijia
標準女聲
通用情境
中文及中英文混合情境
8K/16K
是
無
艾誠
Aicheng
標準男聲
通用情境
中文及中英文混合情境
8K/16K
是
無
艾達
Aida
標準男聲
通用情境
中文及中英文混合情境
8K/16K
是
無
寧兒
Ninger
標準女聲
通用情境
純中文情境
8K/16K/24K
否
無
瑞琳
Ruilin
標準女聲
通用情境
純中文情境
8K/16K/24K
否
無
思悅
Siyue
溫柔女聲
客服情境
中文及中英文混合情境
8K/16K/24K
否
無
艾雅
Aiya
嚴厲女聲
客服情境
中文及中英文混合情境
8K/16K
是
無
艾夏
Aixia
親和女聲
客服情境
中文及中英文混合情境
8K/16K
是
無
艾美
Aimei
甜美女聲
客服情境
中文及中英文混合情境
8K/16K
是
無
艾雨
Aiyu
自然女聲
客服情境
中文及中英文混合情境
8K/16K
是
無
艾悅
Aiyue
溫柔女聲
客服情境
中文及中英文混合情境
8K/16K
是
無
艾婧
Aijing
嚴厲女聲
客服情境
中文及中英文混合情境
8K/16K
是
無
小美
Xiaomei
甜美女聲
客服情境
中文及中英文混合情境
8K/16K/24K
否
無
艾娜
Aina
浙普女聲
客服情境
純中文情境
8K/16K
是
無
伊娜
Yina
浙普女聲
客服情境
純中文情境
8K/16K/24K
否
無
思婧
Sijing
嚴厲女聲
客服情境
純中文情境
8K/16K/24K
是
無
思彤
Sitong
兒童音
童聲情境
純中文情境
8K/16K/24K
否
無
小北
Xiaobei
蘿莉女聲
童聲情境
純中文情境
8K/16K/24K
是
無
艾彤
Aitong
兒童音
童聲情境
純中文情境
8K/16K
是
無
艾薇
Aiwei
蘿莉女聲
童聲情境
純中文情境
8K/16K
是
無
艾寶
Aibao
蘿莉女聲
童聲情境
純中文情境
8K/16K
是
無
Harry
Harry
英音男聲
英文情境
英文情境
8K/16K
否
無
Abby
Abby
美音女聲
英文情境
英文情境
8K/16K
否
無
Andy
Andy
美音男聲
英文情境
英文情境
8K/16K
否
無
Eric
Eric
英音男聲
英文情境
英文情境
8K/16K
否
無
Emily
Emily
英音女聲
英文情境
英文情境
8K/16K
否
無
Luna
Luna
英音女聲
英文情境
英文情境
8K/16K
否
無
Luca
Luca
英音男聲
英文情境
英文情境
8K/16K
否
無
Wendy
Wendy
英音女聲
英文情境
英文情境
8K/16K/24K
否
無
William
William
英音男聲
英文情境
英文情境
8K/16K/24K
否
無
Olivia
Olivia
英音女聲
英文情境
英文情境
8K/16K/24K
否
無
姍姍
Shanshan
粵語女聲
方言情境
標準粵文(簡體)及粵英文混合情境
8K/16K/24K
否
無
小玥
Xiaoyue
四川話女聲
方言情境
中文及中英文混合情境
8K/16K
否
公測版
Lydia
Lydia
英中雙語女聲
英文情境
英文情境
8K/16K
否
公測版
艾碩
Aishuo
自然男聲
客服情境
中文及中英文混合情境
8K/16K
是
公測版
青青
Qingqing
中國台灣話女聲
方言情境
中文情境
8K/16K
否
公測版
翠姐
Cuijie
東北話女聲
方言情境
中文情境
8K/16K
否
公測版
小澤
Xiaoze
湖南重口音男聲
方言情境
中文情境
8K/16K
是
公測版
調用限制
輸入文本必須採用
UTF-8編碼。輸入文本不能超過300個字元,超過300字元的內容會被截斷。
服務地址
訪問類型 | 說明 | URL |
外網訪問 | 所有伺服器均可使用外網訪問URL(SDK中預設設定了外網訪問URL)。 | wss://nls-gateway-ap-southeast-1.aliyuncs.com/ws/v1 |
互動流程
上圖不包含RESTful API的互動流程,關於RESTful API的互動流程圖請參見RESTful API。
服務端的響應除了音頻流之外,都會在返回資訊的header包含本次識別任務的task_id參數,請記錄該值。如果出現錯誤,請您提交工單並提供task_id和錯誤資訊,諮詢產品支援人員。
1. 鑒權
用戶端在與服務端建立WebSocket串連時,使用Token進行鑒權。關於Token擷取請參見擷取Token。
2. 開始合成
用戶端發起語音合成請求,在請求訊息中進行參數設定,各參數通過SDK中SpeechSynthesizer對象的set方法設定,含義如下。
參數 | 類型 | 是否必需 | 說明 |
appkey | String | 是 | 管控台建立的專案appkey。 |
text | String | 是 | 待合成文本,常值內容必須採用 |
voice | String | 否 | 發音人,預設是 |
format | String | 否 | 音頻編碼格式,預設值:PCM。支援PCM/WAV/MP3格式。 |
sample_rate | Integer | 否 | 音頻採樣率,預設值:16000。 |
volume | Integer | 否 | 音量,取值範圍:0~100。預設值:50。 |
speech_rate | Integer | 否 | 語速,取值範圍:-500~500,預設值:0。 |
pitch_rate | Integer | 否 | 語調,取值範圍:-500~500,預設值:0。 |
3. 接收合成資料
服務端返回合成的語音位元據,SDK接收並處理位元據。
4. 結束合成
語音合成完畢,服務端發送合成完畢事件通知,舉例如下。
{
"header": {
"message_id": "05450bf69c53413f8d88aed1ee60****",
"task_id": "640bc797bb684bd6960185651307****",
"namespace": "SpeechSynthesizer",
"name": "SynthesisCompleted",
"status": 20000000,
"status_message": "GATEWAY|SUCCESS|Success."
}
}文檔樣本將合成的音頻儲存在檔案中,如果您需要播放音頻且對即時性要求較高,建議使用流式播放,即邊接收語音資料邊播放,減少延時。
服務狀態代碼
服務的每一次響應都包含status欄位,即服務狀態代碼,各狀態代碼含義如下。
通用錯誤:
錯誤碼 | 原因 | 解決辦法 |
40000001 | 身份認證失敗 | 檢查使用的令牌是否正確,是否到期。 |
40000002 | 無效的訊息 | 檢查發送的訊息是否符合要求。 |
403 | 令牌到期或無效的參數 | 首先檢查使用的令牌是否到期,然後檢查參數值設定是否合理。 |
40000004 | 空閑逾時 | 確認是否長時間(10秒)沒有發送資料到服務端。 |
40000005 | 請求數量過多 | 檢查是否超過了並發串連數或者每秒鐘請求數。如果超過並發數,建議從免費版升級到商用版,或者商用版擴容並發資源。 |
40000000 | 預設的用戶端錯誤碼 | 查看錯誤訊息或提交工單諮詢產品支援人員。 |
50000000 | 預設的服務端錯誤 | 如果偶現可以忽略,重複出現請提交工單諮詢產品支援人員。 |
50000001 | 內部調用錯誤 | 如果偶現可以忽略,重複出現請提交工單諮詢產品支援人員。 |
網關錯誤:
錯誤碼 | 原因 | 解決辦法 |
40010001 | 不支援的介面 | 使用了不支援的介面,如果使用SDK請提交工單諮詢產品支援人員。 |
40010002 | 不支援的指令 | 使用了不支援的指令,如果使用SDK請提交工單諮詢產品支援人員。 |
40010003 | 無效的指令 | 指令格式錯誤,如果使用SDK請提交工單諮詢產品支援人員。 |
40010004 | 用戶端提前中斷連線 | 檢查是否在請求正常完成之前關閉了串連。 |
40010005 | 任務狀態錯誤 | 發送了當前任務狀態不能處理的指令。 |
配置錯誤:
錯誤碼 | 原因 | 解決辦法 |
40020105 | 應用不存在 | 檢查應用appkey是否正確,是否與令牌歸屬同一個帳號。 |
TTS(Text to Speech)錯誤:
錯誤碼 | 原因 | 解決辦法 |
41020001 | 參數錯誤 | 檢查是否傳遞了正確的參數。 |
51020001 | TTS服務端錯誤 | 如果偶現可以忽略,重複出現請提交工單諮詢產品支援人員。 |