本文為您介紹SSML(Speech Synthesis Markup Language)標記語言的功能、標籤使用及樣本。
概述
SSML是一種基於XML的語音合成標記語言。與純文字的合成相比,使用SSML可以充實合成的內容,為最終合成效果帶來更多變化。SSML不僅控制語音合成能讀什麼,更能控制語音合成可以怎麼讀,包括控制斷句分詞方式、發音、停頓等特徵。
阿里巴巴語音合成服務的SSML實現基於W3C的語音合成標記語言版本1.0。但並不支援W3C包含的所有的標記類型,而是從業務角度出發,將支援的標記類型最大程度與業務需求綁定。
使用說明
目前僅中文及英文聲音支援SSML功能,中文和英文所支援的SSML標籤及內容也有略有差別,詳情請參考文檔下方各標籤的介紹和樣本。
所有文本需放在<speak></speak>標籤之內,每個語音合成任務可使用多個<speak></speak>標籤,支援SSML與文本結合的方式。
文本頭部<speak>之前可以省略XML Header。
標籤內的文字內容如果包含XML的特殊字元,需要做字元轉義,常用的特殊字元對應關係如下。
"(雙引號)對應:"
' (撇號或單引號)對應:'
&(表示和的符號)對應:&
<(小於符號)對應:<
> (大於符號)對應:>
智能語音任務及人聲複製(基礎版)支援本文列出的所有SSML標籤及屬效能力;
人聲複製(福士版)僅支援<speak>、<break>、<s>、<sub>、<w>、<phoneme>、<say-as>這7種標籤能力,其中<speak>僅支援rate、pitch、volume屬性配置,其他標籤不支援屬性配置(下文簡稱為“空屬性”)。
標籤
<speak>
描述
<speak>標籤是所有待支援SSML標籤的根節點。一切需要調用SSML標籤的文本都要包含在<speak></speak>中。
文法
<speak>需要調用SSML標籤的文本</speak>屬性
<speak>標籤支援如下屬性。
屬性名稱
屬性類型
屬性值
是否必選
描述
voice
String
線上可調用的發音人的名稱代號,為全小寫voice參數值,如"siyue"。
否
阿里巴巴語音合成特有標籤。在合成時,指定發音人,優先順序高於介面請求參數
voice指定的發音人。voice聲音類型列表
encodeType
String
PCM/WAV/MP3
否
阿里巴巴語音合成特有標籤。在合成時,指定音頻檔案格式,優先順序高於介面請求參數
format指定的檔案格式。sampleRate
String
8000/16000/24000/48000
否
阿里巴巴語音合成特有標籤。在合成時,指定音訊採樣率,優先順序高於介面請求參數
sample_rate指定的音頻採樣率。rate
String
[-500,500]之間整數。預設值為0。
大於0表示加快語速。
小於0表示減慢語速。
否
阿里巴巴語音合成特有標籤。在合成時,指定音訊語速,優先順序高於介面請求參數
speech_rate指定的語速。pitch
String
[-500,500]之間整數。預設值為0。
大於0表示升高音高。
小於0表示降低音高。
否
阿里巴巴語音合成特有標籤。在合成時,指定音訊音高,優先順序高於介面請求參數
pitch_rate指定的音高。volume
String
[0,100]之間整數。預設值為50。
大於50表示增大音量。
小於50表示減小音量。
否
阿里巴巴語音合成特有標籤。在合成時,指定音訊音量,優先順序高於介面請求參數
volume指定的音量。effect
String
robot/lolita/lowpass/echo/eq/lpfilter/hpfilter
否
阿里巴巴語音合成特有標籤。使用該標籤可以使合成的語音產生不同的聲音效果。
robot:機器人音效。
lolita:蘿莉音效。
lowpass:低通音效。
echo:回聲音效。
eq:均衡器。
lpfilter:低通濾波器。
hpfilter:高通濾波器。
說明其中eq、lpfilter、hpfilter是進階效果器,您可以通過
effectValue自訂效果器的效果。一個SSML只支援一種音效,不可以寫多個effect屬性。
選擇使用音效功能會增加系統延時。
effectValue
String
當effect取值為eq/lpfilter/hpfilter時,使用該參數修改效果器的預設效果。
否
eq(均衡器):系統預設使用8個等級。對應的頻率為[“40 Hz”,“100 Hz”, “200 Hz”, “400 Hz”, “800 Hz”, “1600 Hz”, “4000 Hz”, “12000 Hz”];對應的頻寬為[“1.0q”, “1.0q”, “1.0q”, “1.0q”, “1.0q”, “1.0q”, “1.0q”, “1.0q”]。在使用過程中,需要輸入8個等級對應的增益,其取值範圍為[-20 dB, 20 dB]。例如,effectValue=”1 1 1 1 1 1 1 1”。是一個以空格分割的8個整數組成的字串。數值為0表示不調整對應頻率的增益。
lpfilter:輸入低通濾波器的頻率值。取值為(0, 目標採樣率/2]之間的整數。例如effectValue=”800”。
hpfilter:輸入高通濾波器的頻率值。取值為(0, 目標採樣率/2]之間的整數。例如effectValue=“1200”。
bgm
String
線上可調用的背景音樂的名稱。參見bgm屬性說明。
否
阿里巴巴語音合成特有標籤。為合成的語音添加指定的背景音樂。
backgroundMusicVolume
String
[0,100]之間的整數。預設值為50。
大於50表示增大音量。
小於50表示減小音量。
否
阿里巴巴語音合成特有標籤。控制背景音樂的音量。
其中,bgm屬性說明如下。
服務內嵌URL
自訂背景音URL
目前阿里巴巴語音合成服務內嵌如下幾款背景音樂供您體驗:
您可以根據需求,使用自訂的背景音。需要將背景音存放在阿里雲的OSS上,並且所在的儲存空間至少為公用讀取許可權,請參見建立儲存空間。使用HTTP/HTTPS協議組建檔案訪問連結,請參見上傳檔案。
音頻要求:
採樣率16 kHz、單聲道WAV格式。
短文本語音合成不超過3.5 MB,長文本語音合成不超過10 MB。
合成時間長度超出背景音時間長度時,背景音將隨合成音頻迴圈播放(如果背景音不是WAV格式,可使用ffmpeg將其轉為WAV格式:
ffmpeg -i 輸入音頻 -acodec pcm_s16le -ac 1 -ar 16000 目標.wav)。標籤內的URL如果包含XML的特殊字元,需要做字元轉義。
位元深度要求16位。
重要您需要對上傳的音頻著作權承擔相應的法律責任。
標籤關係
<speak>標籤可以包含文本和以下標籤:
<break>
<s>
<w>
<phoneme>
<say-as>
樣本
空屬性
<speak>需要調用SSML標籤的文本</speak>音頻效果:SSML-speak1.mp3
voice屬性
<speak voice="xiaogang">我是男聲。</speak>音頻效果:SSML-speak2.mp3
encodeType屬性
<speak encodeType="mp3">我可以產生壓縮格式的音頻。</speak>音頻效果:SSML-encode.mp3
sampleRate屬性
<speak sampleRate="8000">看看我的檔案大小吧,是16000採樣率音訊一半。</speak>音頻效果:SSML-speak4.mp3
rate屬性
<speak rate="200">我的語速比正常人快。</speak>音頻效果:SSML-speak5.mp3
pitch屬性
<speak pitch="-100">我的音高卻比別人低。</speak>音頻效果:SSML-speak6.mp3
volume屬性
<speak volume="80">我的音量也很大。</speak>音頻效果:SSML-speak7.mp3
屬性群組合(空格分隔)
<speak rate="200" pitch="-100" volume="80">所以放在一起,我的聲音是這樣的。</speak>音頻效果:SSML-speak8.mp3
effect屬性
<speak effect="robot">你喜歡機器人瓦力嗎?</speak>音頻效果:SSML-speak9.mp3
bgm屬性
<speak bgm="http://nls.alicdn.com/bgm/2.wav" backgroundMusicVolume="30" rate="-500" volume="40"><break time="2s"/>陰崖老木蒼蒼煙<break time="700ms"/>雨聲猶在竹林間<break time="700ms"/>綿蕝固知裨國計<break time="700ms"/>綿州風物總堪憐<break time="2s"/></speak>音頻效果:SSML-speak10.mp3
<emotion>
描述
<emotion>用於多情感聲音合成,該標籤是可選標籤,不支援多情感聲音合成的發音人使用情感標籤會導致合成請求報錯。
文法
<emotion category="happy" intensity="1.0">今天天氣真不錯!</emotion>屬性
<emotion>標籤支援如下屬性。
屬性名稱
屬性類型
屬性值
是否必須
描述
category
String
枚舉值:如neutral, happy。
是
指定說話情緒。每個發音人支援的情緒參見下表所示。
intensity
String
浮點值:數值範圍 [0.01,2.0]。
否
指定情緒強度。預設值為1.0,表示預定義的情緒強度。最小值為0.01,導致目標情緒略有傾向。最大值為2.0,導致目標情緒強度加倍。
其中,多情感聲音支援說明如下。
音色名
voice參數值
情感分類(emotion category)
知妙_多情感
zhimiao_emo
serious,sad,disgust,jealousy,embarrassed,happy,fear,surprise,neutral,frustrated,affectionate,gentle,angry,newscast,customer-service,story,living
知米_多情感
zhimi_emo
angry,fear,happy,hate,neutral,sad,surprise
知燕_多情感
zhiyan_emo
neutral,happy,angry,sad,fear,hate,surprise,arousal
知貝_多情感
zhibei_emo
neutral,happy,angry,sad,fear,hate,surprise
知甜_多情感
zhitian_emo
neutral,happy,angry,sad,fear,hate,surprise
標籤關係
<emotion>標籤可以包含文本和以下標籤:
<s>
<sub>
<say-as>
<w>
<phoneme>
<soundEvent/>
<break/>
樣本
空屬性
<speak voice="zhitian_emo"><emotion category="happy" intensity="1.0">今天天氣真不錯!</emotion></speak>音頻效果:SSML-emotion.wav
<break>
描述
用於在文本中插入停頓,該標籤是可選標籤。
文法
<break time="string"/>屬性
屬性名稱
屬性類型
屬性值
是否必選
描述
time
String
[number]s/[number]ms
否
以秒/毫秒為單位設定停頓的時間長度 (如“2s“、“50ms”)。
[number]s:以秒為單位,[number]取值範圍為[1, 10]的整數。
[number]ms:以毫秒為單位,[number]取值範圍為[50, 10000]的整數。
標籤關係
<break>是空標籤,不能包含任何標籤。如果SSML結構中存在<s>標籤,請把<break>寫在<s>裡面,表示對當前段落或句子設定停頓。
樣本
<speak>請閉上眼睛休息一下<break time="500ms"/>好了,請睜開眼睛。</speak>音頻效果:SSML-break.mp3
<s>
描述
用於表示文本的句子結構,該標籤是可選標籤。
文法
<s>文本</s>屬性
無。
標籤關係
<s>標籤可以包含文本和以下標籤:
<break>
<w>
<phoneme>
<say-as>
樣本
<speak><s>這是第一句話</s><s>這是第二句話</s></speak>音頻效果:SSML-s.mp3
<sub>
描述
使用別名替換標籤內文本。
文法
<sub alias="string"></sub>屬性
屬性名稱
屬性類型
屬性值
是否必選
描述
alias
String
替換後的內容
是
用於替換標籤內的文本。
標籤關係
<sub>標籤可以包括文本。
樣本
<speak><sub alias="網路通訊協定標準">W3C</sub></speak>音頻效果:SSML-sub.mp3
<w>
描述
用於表示文本的詞語結構,該標籤是可選標籤。英文文本通常採用空格來進行分詞,一般無需使用此標籤。<w>標籤內部必須是一個獨立的詞或短語,這個詞或短語不允許混合使用中文和其他外語。
文法
<w>文本</w>屬性
無。
標籤關係
<w>標籤可以包含文本。
樣本
<speak>南京市長<w>江大橋</w>今天發表了演講。</speak>音頻效果:SSML-w.mp3
<phoneme>
描述
用於控制標籤內文本的讀音,該標籤是可選標籤。英文文本不支援該標籤。
文法
<phoneme alphabet="string" ph="string">文本</phoneme>屬性
屬性名稱
屬性類型
屬性值
是否必選
描述
alphabet
String
py
是
“py”表示拼音。
ph
String
標籤內文本對應的拼音串
是
拼音用法的賦值規範:
字與字的拼音用空格分隔,拼音的數目必須與字數相等。
每個拼音由發音和音調組成,音調為1~5的數字編號,其中”5”表示輕聲。
標籤關係
<phoneme>標籤可以包括文本。
樣本
<speak>去<phoneme alphabet="py" ph="dian3 dang4 hang2">典當行</phoneme>把這個玩意<phoneme alphabet="py" ph="dang4 diao4">當掉</phoneme></speak>音頻效果:SSML-phoneme.mp3
<soundEvent>
描述
提示音標籤,可以在SSML合成過程中,通過該標籤在任意位置插入提示音。
文法
<soundEvent src="URL"/>屬性
屬性名稱
屬性類型
屬性值
是否必選
描述
src
String
URL提示音資源路徑
是
您可以根據需求,使用自訂提示音。需要將提示音存放在阿里雲OSS上,並且所在的儲存空間至少為公用讀取許可權,請參見建立儲存空間,使用HTTP/HTTPS協議組建檔案訪問連結請參見上傳檔案。
音頻要求:
採樣率16 kHz、單聲道WAV格式。
不超過2 MB。
位元深度要求16位。
重要
您需要對上傳的音頻著作權承擔相應的法律責任。
標籤關係
<soundEvent>是空標籤,不可以包含任何標籤。
樣本
<speak>一匹馬受了驚嚇<soundEvent src="http://nls.alicdn.com/sound-event/horse-neigh.wav"/>人們四散躲避</speak>音頻效果:SSML-sound-event.mp3
<say-as>
描述
用於指示出標籤內文本的資訊類型,進而按照該類型的預設發音方式發音。
文法
<say-as interpret-as="string">文本</say-as>屬性
屬性名稱
屬性類型
屬性值
是否必選
描述
interpret-as
String
cardinal/digits/telephone/name/address/id/characters/punctuation/date/time/currency/measure
是
指示出標籤內文本的資訊類型:
cardinal:按整數或小數發音
digits:按數字發音。
telephone:按電話號碼常用方式發音。
name:按人名發音。
address:按地址發音。
id:適用於賬戶名、暱稱等
characters:將標籤內的文本按字元一一讀出。
punctuation:將標籤內的文本按標點符號的方式讀出來。
date:按日期發音。
time:按時間發音。
currency:按金額發音。
measure:按計量單位發音。
各<say-as>類型支援範圍
cardinal
格式
樣本
中文輸出
說明
數字串
145
一百四十五
整數輸入範圍:20位以內的正負整數,[-99999999999999999999,99999999999999999999]。
小數輸入範圍:對小數點後小數的位元沒有特殊限制,建議不超過10位。
負號+數字串
-145
負一百四十五
以逗號分隔3位元字串
10,000
一萬
負號+以逗號分隔3位元字串
-10,124
負一萬一百二十四
數字串+小數點+2個零
10.00
十
負號+數字串+小數點+2個零
-110.00
負一百一十
數字串+小數點+數字串
79.090
七十九點零九零
負號+數字串+小數點+數字串
-79.001
負七十九點零零一
格式
樣本
英文輸出
說明
數字串
145
one hundred forty five
整數輸入範圍:13位以內的正負整數,[-999999999999,999999999999]。
小數輸入範圍:對小數點後小數的位元沒有特殊限制,建議不超過10位。
以零開頭的數字串
0145
one hundred forty five
負號+數字串
-145
minus hundred forty five
以逗號分隔三位元字串
60,000
sixty thousand
負號+以逗號分隔三位元字串
-208,000
minus two hundred eight thousand
數字串+小數點+零
12.00
twelve
數字串+小數點+數字串
12.34
twelve point three four
以逗號分隔三位元字串+小數點+數字串
1,000.1
one thousand point one
負號+數字串+小數點+數字串
-12.34
minus twelve point three four
負號+以逗號分隔三位元字串+小數點+數字串
-1,000.1
minus one thousand point one
(以逗號分隔三位)數字串+連詞符+(以逗號分隔三位)數字
1-1,000
one to one thousand
其他預設讀法
012.34
twelve point three four
無
1/2
one half
-3/4
minus three quarters
5.1/6
five point one over six
-3 1/2
minus three and a half
1,000.3^3
one thousand point three to the power of three
3e9.1
three times ten to the power of nine point one
23.10%
twenty three point one percent
digits
格式
樣本
中文輸出
說明
數字串
129090909
一二九零九零九零九
對數字串的長度沒有特殊限制,建議不超過20位。
當數字串超過10位時,每個數字後插入停頓。
格式
樣本
英文輸出
說明
數字串
12034
one two zero three four
對數字串的長度沒有特殊限制,建議不超過20位。
當數字串以空格或連詞符分組時,分組之間會插入逗號而產生適當停頓,支援最長5個分組。
數字串+空格或連詞符+數字串+空格或連詞符+數字串+空格或連詞符+數字串
1-23-456 7890
one, two three, four five six, seven eight nine zero
telephone
格式
樣本
中文輸出
說明
有線電話號
4930286
四九三 零二八六
支援7~8位有線電話號,支援空格和“-”作為分隔字元。
其中,7位有線電話號支援“3-4”的數字分隔方式;8位有線電話號支援“4-4”的數字分隔方式。
493 0286
四九三 零二八六
493-0286
四九三 零二八六
62552560
六二五五 二五六零
6255 2560
六二五五 二五六零
6255-2560
六二五五 二五六零
有線電話號+分機號
4930286-109
四九三 零二八六 轉么零九
支援1~4位分機號。
4930286轉109
四九三 零二八六 轉么零九
4930286分機109
四九三 零二八六 分機么零九
4930286分機號109
四九三 零二八六 分機號么零九
區號+有線電話號
01062552560
零么零 六二五五 二五六零
支援區號:010、02x、03xx、04xx、05xx、07xx、08xx、09xx。
010 62552560
零么零 六二五五 二五六零
010 6255 2560
零么零 六二五五 二五六零
010 6255-2560
零么零 六二五五 二五六零
010-62552560
零么零 六二五五 二五六零
010-6255-2560
零么零 六二五五 二五六零
(010)62552560
零么零 六二五五 二五六零
03198907098
零三么九 八九零 七零九八
0319-8907098
三么九 八九零 七零九八
區號+有線電話號+分機號
010 62552560-109
零么零 六二五五 二五六零 轉么零九
無
010-62552560-109
零么零 六二五五 二五六零 轉么零九
(010)62552560-109
零么零 六二五五 二五六零 轉么零九
(010)62552560轉109
零么零 六二五五 二五六零 轉么零九
(010)62552560分機109
零么零 六二五五 二五六零 分機么零九
(010)62552560分機號109
零么零 六二五五 二五六零 分機號么零九
國家代碼+區號+有線電話號
86-010-62791627
八六 零么零 六二七九 么六二七
支援國家代碼:86、 (86)、+86、(+86)、0086。並統一讀為“八六”。
(86)10-62791627
八六 么零 六二七九 么六二七
+86-010-62791627
八六 零么零 六二七九 么六二七
0086-10-62791627
八六 么零 六二七九 么六二七
(+86)-10-6279 1627
八六 么零 六二七九 么六二七
國家代碼+區號+有線電話號+分機號
(86)21-58118818-207
八六 二么 五八么么 八八么八 轉二零七
無
(86)021-5811-8818-207
八六 零二么 五八么么 八八么八 轉二零七
(86)021-58118818轉207
八六 零二么 五八么么 八八么八 轉二零七
(86)21-5811-8818分機207
八六 二么 五八么么 八八么八 分機二零七
+86-021-58118818分機號207
八六 零二么 五八么么 八八么八分機號二零七
手機號
139 0000 5678
么三九 零零零零 五六七八
支援11位手機號,支援3-3-5、3-4-4兩種數字分隔方式
139-000-05678
么三九 零零零 零五六七八
139 000 05678
么三九 零零零 零五六七八
國家代碼+手機號
+86-13900005678
八六 么三九 零零零零 五六七八
無
(+86)-139-0000-5678
八六 么三九 零零零零 五六七八
+8613900005678
八六 么三九 零零零零 五六七八
0086-139 000 05678
八六 么三九 零零零 零五六七八
服務號
123
么二三
支援常用的服務號。
支援以400/800開頭的10位服務號,支援以“3-3-4”的數字分隔方式。
支援以12530/17951/12593開頭的16位號碼。
95678
九五六七八
4008110510
四零零 八么么 零五么零
800-810-8888
八零零 八么零 八八八八
1253013520638377
么二五三零 么三五 二零六三 八三七七
其他
(86)(21)9899-80800-0909
八六 二么 九八九九 八零八零零 零九零九
支援“數字串+分隔字元(左右括弧、-)”方式。
格式
樣本
英文輸出
說明
數字串
12034
one two oh three four
對數字串的長度沒有特殊限制,建議不超過20位。當數字串以空格或連詞符分組時,分組之間會插入逗號而產生適當停頓,支援最長5個分組。
數字串+空格或連詞符+數字串+空格或連詞符+數字串
1-23-456 7890
one, two three, four five six, seven eight nine oh
加號+數字串+空格或連詞符+數字串
+43-211-0567
plus four three, two one one, oh five six seven
左括弧+數字串+右括弧+空格+數字串+空格或連詞符+數字串
(21) 654-3210
(two one) six five four, three two one oh
address
格式
樣本
中文輸出
說明
常用地址格式
元和鎮嘉元30-9
元和鎮嘉元三十杠九
支援常用地址格式。此處地址指標準的郵寄地址。
市台路388弄1107-1108號
市台路三八八弄么么零七杠么么零八號
華潤二十四城六期錦雲府3-1-3205
華潤二十四城六期錦雲府三杠一杠三二零五
聖華名都大廈2幢2006室
聖華名都大廈二幢二零零六室
五常街道庭院5幢4單元201
五常街道庭院五幢四單元二零么
芙蓉江路150弄19號
芙蓉江路么五零弄十九號
英文文本不支援該標籤。
id
格式
樣本
輸出
說明
字串
dell0101
D E L L 零 一 零 一
大小寫英文字元、阿拉伯數字0~9、底線。
輸出的空格表示每個字元之間插入停頓,即字元一個一個地讀。
myid_1998
M Y I D 底線 一 九 九 八
AiTest
A I T E S T
英文文本該標籤功能同標籤characters。
characters
格式
樣本
中文輸出
說明
字串
ISBN 1-001-099098-1
I S B N 一 杠 零 零 一 杠 零 九 九 零 九 八 杠 一
支援中文漢字、大小寫英文字元、阿拉伯數字0~9以及部分全形和半形字元。
輸出的空格表示每個字元之間插入停頓,即字元一個一個地讀。標籤內的文本如果包含XML的特殊字元,需要做字元轉義。
x10b2345_u
x 一 零 b 二 三 四 五 底線 u
v1.0.1
v 一 點 零 點 一
版本號碼2.0
版本號碼二 點 零
蘇M MA000
蘇M M A 零 零 零
空中巴士A330
空中巴士A 三 三 零
型號s01 s02和s03
型號s 零 一 s 零二 和s 零 三
空中巴士A330
空中巴士A 三 三 零
αβγ
阿爾法 貝塔 伽瑪
格式
樣本
英文輸出
說明
字串
*b+3$.c-0'=α
asterisk B plus three dollar dot C dash zero apostrophe equals alpha
支援中文漢字、大小寫英文字元、阿拉伯數字0~9以及部分全形和半形字元。
輸出的空格表示每個字元之間插入停頓,即字元一個一個地讀。
標籤內的文本如果包含XML的特殊字元,需要做字元轉義。
punctuation
格式
樣本
中文輸出
說明
標點符號
…
省略符號
支援常見中英文標點。輸出的空格表示每個字元之間插入停頓,即字元一個一個地讀。
標籤內的文本如果包含XML的特殊字元,需要做字元轉義。
……
省略符號
!"#$%&
歎號 雙引號 井號 dollar 百分比符號 and
‘()*+
單引號 左括弧 右括弧 星號 加號
,-./:;
逗號 杠 點 斜杠 冒號 分號
<=>?@
小於 等號 大於 問號 at
[\]^_
左方括弧 反斜線 右方括弧 脫字元 底線
英文文本該標籤功能同標籤characters。
date
格式
樣本
中文輸出
說明
xx年
71年
七一年
支援2位和4位年份。其中:
2位年份支援60年~99年、00年~09年、10年~19年。
4位年份支援1000年~1999年、2000年~2099年。
04年
零四年
19年
一九年
1011年
一零一一年
1998年
一九九八年
2008年
二零零八年
xx年xx月
98年4月
九八年四月
當月份為1到9月時,支援開頭帶“0”和不帶“0”兩種寫法。例如“1908年4月”和“1908年04月”。
1998年04月
一九九八年四月
08年8月
零八年八月
2008年8月
二零零八年八月
xx年xx月xx日xx年xx月xx號
98年4月23日
九八年四月二十三日
當日期為1到9日時,支援開頭帶“0”和不帶“0”兩種寫法。例如“1908年4月8日”和“1908年04月08日”。
1998年04月23日
一九九八年四月二十三日
08年8月8號
零八年八月八號
2008年08月08號
二零零八年八月八號
xx年xx月xx日xx年xx月xx號
98年4月23日
九八年四月二十三日
當日期為1到9日時,支援開頭帶“0”和不“0”兩種寫法。例如“1908年4月8日”和“1908年04月08日”。
1998年04月23日
一九九八年四月二十三日
08年8月8號
零八年八月八號
2008年08月08號
二零零八年八月八號
xx月xx號
3月20日
三月二十日
無
08月07號
八月七號
年月縮寫
2018/08
二零一八年八月
支援“/”、“-”、“.”作為縮寫的分隔字元。
2018-08
二零一八年八月
2018.08
二零一八年八月
年月日縮寫
2018/08/08
二零一八年八月八日
2018-8-8
二零一八年八月八日
2018.08.08
二零一八年八月八日
xx年xx月xx日~xx年xx月xx日xx年xx月xx號~xx年xx月xx號
04年9月1日~30日
零四年九月一日至三十日
支援“~”、“-”作為“至”的縮寫標誌。
2004年09月01號-2008年06月08號
二零零四年九月一號至二零零八年六月八號
xx年xx月xx日~xx日xx年xx月xx號~xx號
04年9月1日~30日
零四年九月一日至三十日
2004年09月01號-2008年06月08號
二零零四年九月一號至二零零八年六月八號
xx年xx月~xx年xx月
01年04月~10年04月
零一年四月至一零年四月
2001年04月~2010年04月
二零零一年四月至二零一零年四月
xx月xx日~xx月xx日xx月xx號~xx月xx號
10月1日~10月7日
十月一日至十月七日
10月01號~10月07號
十月一號至十月七號
xx月xx日~xx日xx月xx號~xx號
10月1日~7日
十月一日至七日
10月01號~07號
十月一號至七號
年月日縮寫~年月日縮寫
2018/03/03~2019/01/01
二零一八年三月三日至二零一九年一月一日
支援“/”、“.”作為縮寫的分隔字元,支援“~”、“-”作為“至”的縮寫標誌。
1997.9.9~1998.9.9
一九九七年九月九日至一九九八年九月九日
月日縮寫~月日縮寫
10/20~10/31
十月二十日至十月三十一日
xx~xx月xx月~xx月
1~10月
一至十月
1月~10月
一月至十月
月日年縮寫
10/20/2018
二零一八年十月二十日
僅支援4位的年份,僅支援“/”作為日期的分隔字元,僅支援“月/日/年”的書寫方式。
格式
樣本
英文輸出
說明
四位元字/兩位元字或四位元字-兩位元字
2000/01
two thousand, oh one
跨年度。
1900-01
nineteen hundred, oh one
2001-02
twenty oh one, oh two
2019-20
twenty nineteen, twenty
1998-99
nineteen ninety eight, ninety nine
1999-00
nineteen ninety nine, oh oh
以1或2開頭的四位元字
2000
two thousand
四位元字年份。
1900
nineteen hundred
1905
nineteen oh five
2021
twenty twenty one
星期幾-星期幾
或
星期幾~星期幾
或
星期幾&星期幾
mon-wed
monday to wednesday
星期幾的範圍標籤內的文本如果包含XML的特殊字元,需要做字元轉義。
tue~fri
tuesday to friday
sat&sun
saturday and sunday
DD-DD MMM, YYYY
或
DD~DD MMM, YYYY
或
DD&DD MMM, YYYY
19-20 Jan, 2000
the nineteen to the twentieth of january two thousand
DD表示兩位元字日期,MMM表示月份的三字母縮寫或完整單詞,YYYY表示以1或2開頭的四位元字年份。
01 ~ 10 Jul, 2020
the first to the tenth of july twenty twenty
05&06 Apr, 2009
the fifth and the sixth of april two thousand nine
MMM DD-DD
或
MMM DD~DD
或
MMM DD&DD
Feb 01 - 03
feburary the first to the third
MMM表示月份的三字母縮寫或完整單詞,DD表示兩位元字日期。
Aug 10~20
august the tenth to the twentieth
Dec 11&12
december the eleventh and the twelfth
MMM-MMM
或
MMM~MMM
或
MMM&MMM
Jan-Jun
january to june
MMM表示月份的三字母縮寫或完整單詞。
jul ~ dec
july to december
sep&oct
september and october
YYYY-YYYY
或
YYYY~YYYY
1990 - 2000
nineteen ninety to two thousand
YYYY表示以1或2開頭的四位元字年份。
2001~2021
two thousand one to twenty twenty one
WWW DD MMM YYYY
Sun 20 Nov 2011
sunday the twentieth of november twenty eleven
WWW表示星期幾的三字母縮寫或完整單詞,DD表示兩位元字日期,MMM表示月份的三字母縮寫或完整單詞,MM表示兩位元字月份(或三字母縮寫或完整單詞),YYYY表示以1或2開頭的四位元字年份。
WWW DD MMM
Sun 20 Nov
sunday the twentieth of november
WWW MMM DD YYYY
Sun Nov 20 2011
sunday november the twentieth twenty eleven
WWW MMM DD
Sun Nov 20
sunday november the twentieth
WWW YYYY-MM-DD
Sat 2010-10-01
aturday october the first twenty ten
WWW YYYY/MM/DD
Sat 2010/10/01
saturday october the first twenty ten
WWW MM/DD/YYYY
Sun 11/20/2011
sunday november the twentieth twenty eleven
MM/DD/YYYY
11/20/2011
november the twentieth twenty eleven
YYYY
1998
nineteen ninety eight
其他預設讀法
10 Mar, 2001
the tenth of march two thousand one
無
10 Mar
the tenth of march
Mar 2001
march two thousand one
Fri. 10/Mar/2001
friday the tenth of march two thousand one
Mar 10th, 2001
march the tenth two thousand one
Mar 10
march the tenth
2001/03/10
march the tenth two thousand one
2001-03-10
march the tenth two thousand one
2000s
two thousands
2010's
twenty tens
1900's
nineteen hundreds
1990s
nineteen nineties
time
格式
樣本
中文輸出
說明
時刻
12:00
十二點
支援常用時間和時間範圍格式。
12:00:00點
十二點
10:20分
十點二十分
10:20:30
十點二十分三十秒
09:18:14
九點十八分十四秒
時刻~時刻
11:00~12:00
十一點到十二點
09:00-14:00
九點到十四點
11:00~11:30
十一點到十一點三十分
11:00-12:18
十一點到十二點十八分
10:30~11:00
十點三十分到十一點
09:28-10:00
九點二十八分到十點
10:20~11:20
十點二十分到十一點二十分
06:00~08:00
六點到八點
上午10:20~下午13:30
上午十點二十分到下午十三點三十分
時間縮寫
5:00 am
淩晨五點整
5:30 am
淩晨五點半
5:20:12 am
淩晨五點二十分十二秒
7:00 am
上午七點整
7:30 AM
上午七點半
7:20:12 a.m.
上午七點二十分十二秒
07:08:12 A.M.
上午七點零八分十二秒
5:00 pm
下午五點整
5:30 PM
下午五點半
5:20:12 p.m.
下午五點二十分十二秒
05:09:12 P.M.
下午五點零九分十二秒
9:00 pm
晚上九點整
9:30 pm
晚上九點半
9:20:12 PM
晚上九點二十分十二秒
9:02:12 P.M.
晚上九點零二分十二秒
12:00 pm
中午十二點整
12:30 p.m.
中午十二點半
12:20:12 PM
中午十二點二十分十二秒
格式
樣本
英文輸出
說明
HH:MM AM或PM
09:00 AM
nine A M
HH表示一或兩位元字小時,MM表示兩位元字分鐘,AM/PM表示上/下午。
09:03 PM
nine oh three P M
09:13 p.m.
nine thirteen p m
HH:MM
21:00
twenty one hundred
HHMM
100
one oclock
時刻-時刻
8:00 am - 05:30 pm
eight a m to five p m
支援常見時間格式和範圍。
7:05~10:15 AM
seven oh five to ten fifteen A M
09:00-13:00
nine oclock to thirteen hundred
currency
格式
樣本
中文輸出
說明
數字+金額標識符
12.00 RMB
十二人民幣
支援AUD(澳幣) 、CAD(加元)、 HKD(港幣)、JPY(日元)、USD(美元)、CHF(瑞士法郎)、NOK(挪威克朗)、SEK(瑞典克朗)、GBP(英鎊)、 RMB(人民幣)、CNY(元)和EUR(歐元)。
支援的數字格式包括:整數、小數以及以逗號分隔的國際寫法。
12.50 RMB
十二點五零人民幣
12,000,000 RMB
一千二百萬人民幣
12,000,000.00 RMB
一千二百萬人民幣
12,000.35 RMB
一萬兩千點三五人民幣
金額標識符+數字
$12
十二美元
支援 CAD(加元)、 $(美元)、Fr(法郎)、kr(丹麥幣)、 £(英鎊)、¥(元)和 €(歐元)。
支援的數字格式包括:整數、小數以及以逗號分隔的國際寫法。
$12.00
十二美元
$12.12
二點一二美元
$12,000
一萬兩千美元
$12,000.00
一萬兩千美元
$12,000.99
一萬兩千點九九美元
其他預設讀法
1213
一千二百一十三
無
1213 KML
一千二百一十三K M L
1213.00 KML
一千二百一十三K M L
1213.9 KML
一千二百一十三點九K M L
1,000 KML
一千K M L
1,000.00 KML
一千K M L
1,000.98 KML
一千點九八K M L
12,000
一萬兩千
格式
樣本
英文輸出
說明
數字+金額識別符
1.00 RMB
one yuan
支援的數字格式:整數、小數以及以逗號分隔的國際寫法。
支援的金額識別符:
CN¥ (yuan)
CNY (yuan)
RMB (yuan)
AUD (australian dollar)
CAD (canadian dollar)
CHF (swiss franc)
DKK (danish krone)
EUR (euro)
GBP (british pound)
HKD (Hong Kong(China) dollar)
JPY (japanese yen)
NOK (norwegian krone)
SEK (swedish krona)
SGD (singapore dollar)
USD (united states dollar)
2.02 CNY
two point zero two yuan
1,000.23 CN¥
one thousand point two three yuan
1.01 SGD
one singapore dollar and one cent
2.01 CAD
two canadian dollars and one cent
3.1 HKD
three hong kong dollars and ten cents
1,000.00 EUR
one thousand euros
金額識別符+數字
US$ 1.00
one US dollar
支援的數字格式:整數、小數以及以逗號分隔的國際寫法。
支援的金額識別符:
US$ (US dollar)
CA$ (Canadian dollar)
AU$ (Australian dollar)
SG$ (Singapore dollar)
HK$ (Hong Kong dollar)
C$ (Canadian dollar)
A$ (Australian dollar)
$ (dollar)
£ (pound)
€ (euro)
CN¥ (yuan)
CNY (yuan)
RMB (yuan)
AUD (australian dollar)
CAD (canadian dollar)
CHF (swiss franc)
DKK (danish krone)
EUR (euro)
GBP (british pound)
HKD (Hong Kong(China) dollar)
JPY (japanese yen)
NOK (norwegian krone)
SEK (swedish krona)
SGD (singapore dollar)
USD (united states dollar)
$0.01
one cent
JPY 1.01
one japanese yen and one sen
£1.1
one pound and ten pence
€2.01
two euros and one cent
USD 1,000
one thousand united states dollars
數字+量詞+金額識別符
或
金額識別符+數字+量詞
1.23 Tn RMB
one point two three trillion yuan
支援的量詞格式包括:
thousand
million
billion
trillion
Mil (million)
mil (million)
Bil (billion)
bil (billion)
MM (million)
Bn (billion)
bn (billion)
Tn (trillion)
tn (trillion)
K(thousand)
k (thousand)
M (million)
m (million)
$1.2 K
one point two thousand dollars
measure
格式
樣本
中文輸出
說明
數字+中文單位
2片
兩片
支援常見中文單位及單位縮寫。
120公頃
一百二十公頃
100多毫克
一百多毫克
100來米
一百來米
100餘人
一百餘人
1厘米20毫米
一厘米二十毫米
120.00平方公裡
一百二十平方公裡
數字+單位縮寫
120.56 cm²
一百二十點五六平方厘米
120 ㎡ 56 cm²
一百二十平方米五十六平方厘米
100 m 12 cm 6 mm
一百米十二厘米六毫米
範圍
10~15 kg
十至十五千克
10.24~789.82畝
十點二四至七百八十九點八二畝
10米~15米
十米至十五米
10.24 cm~19.08 cm
十點二四厘米至十九點零八厘米
數字+單位+"/"+單位
10元/斤
十元每斤
199~299元/件
一百九十九至二百九十九元每件
299.99元/g~399.99元/g
二百九十九點九九元每克至三百九十九點九九元每克
其他預設讀法
12紮
十二紮
30 rm
三十r m
4萬萬同胞
四萬萬同胞
12.897微克
十二點八九七微克
格式
樣本
英文輸出
說明
數字+計量單位
1.0 kg
one kilogram
支援的數字格式:整數、小數以及以逗號分隔的國際寫法。
支援常見單位縮寫。
1,234.01 km
one thousand two hundred thirty four point zero one kilometres.
計量單位
mm2
square millimetre
<say-as>常見符號讀法如下表所示。
符號
中文讀法
英文讀法
!
歎號
exclamation mark
“
雙引號
double quote
#
井號
pound
$
dollar
dollar
%
百分比符號
percent
&
and
and
‘
單引號
left quote
(
左括弧
left parenthesis
)
右括弧
right parenthesis
*
星
asterisk
+
加
plus
,
逗號
comma
-
杠
dash
.
點
dot
/
斜杠
slash
:
零冒號
solon
;
分號
semicolon
<
小於
less than
=
等號
equals
>
大於
greater than
?
問號
question mark
@
at
at
[
左方括弧
left bracket
\
反斜線
back slash
]
右方括弧
right bracket
^
脫字元
caret
_
底線
underscore
`
反引號
back quote
{
左花括弧
left brace
|
豎線
vertical bar
}
右花括弧
right brace
~
波浪線
tilde
!
歎號
exclamation mark
“
左雙引號
left double quote
”
右雙引號
right double qute
‘
左單引號
left quote
’
右單引號
right quote
(
左括弧
left parenthesis
)
右括弧
right parenthesis
,
逗號
comma
。
句號
full stop
—
杠
em dash
:
冒號
colon
;
分號
semicolon
?
問號
question mark
、
頓號
enumeration comma
…
省略符號
ellipsis
……
省略符號
ellipsis
《
左>形箭號
left guillemet
》
右>形箭號
right guillemet
¥
人民幣符號
yuan
≥
大於等於
greater than or equal to
≤
小於等於
less than or equal to
≠
不等於
not equal
≈
約等於
approximately equal
±
加減
plus or minus
×
乘
times
π
派
pi
Α
阿爾法
alpha
Β
貝塔
beta
Γ
伽瑪
gamma
Δ
德爾塔
delta
Ε
艾普西龍
epsilon
Ζ
捷塔
zeta
Θ
西塔
theta
Ι
艾歐塔
iota
Κ
喀帕
kappa
∧
拉姆達
lambda
Μ
繆
mu
Ν
拗
nu
Ξ
克西
ksi
Ο
歐麥克輪
omicron
∏
派
pi
Ρ
柔
rho
∑
西格瑪
sigma
Τ
套
tau
Υ
宇普西龍
upsilon
Φ
fai
phi
Χ
器
chi
Ψ
普賽
psi
Ω
歐米伽
omega
α
阿爾法
alpha
β
貝塔
beta
γ
伽瑪
gamma
δ
德爾塔
delta
ε
艾普西龍
epsilon
ζ
捷塔
zeta
η
依塔
eta
θ
西塔
theta
ι
艾歐塔
iota
κ
喀帕
kappa
λ
拉姆達
lambda
μ
繆
mu
ν
拗
nu
ξ
克西
ksi
ο
歐麥克輪
omicron
π
派
pi
ρ
柔
rho
σ
西格瑪
sigma
τ
套
tau
υ
宇普西龍
upsilon
φ
fai
phi
χ
器
chi
ψ
普賽
psi
ω
歐米伽
omega
<say-as>常見計量單位如下表所示。
格式
類別
中文樣本
英文樣本
縮寫
長度
nm(納米)、μm(微米)、 mm(毫米)、cm(厘米)、m(米)、km(千米)、ft(英尺)、in(英寸)
nm (nanometre), μm (micrometre), mm (millimetre), cm (centimetre), m (metre), km (kilometre), ft (foot), in (inch)
面積
cm²(平方厘米)、㎡(平方米)、km²(平方千米)、SqFt(平方英尺)
cm² (square centimetre), ㎡ (square metre), km2 (square kilometre), SqFt (square foot)
體積
cm³(立方厘米)、m³(立方米)、km³(立方千米)、mL(毫升)、L(升)、gallon(加侖)
cm³ (cubic centimetre), m³ (cubic metre), km3(cubic kilometre), mL (millilitre), L (millilitre), gal (gallon)
重量
μg(微克)、mg(毫克)、g(克)、kg(千克)
μg (microgram), mg (microgram), g (gram), kg (kilogram)
時間
min(分)、sec(秒)、ms(毫秒)
min (minute), sec (second), ms (millisecond)
電磁
μA(微安)、mA(毫安)、Ω(歐姆)、Hz(赫茲)、kHz(千赫茲)、MHz(兆赫茲)、GHz(吉赫茲)、V(伏)、kV(千伏)、kWh(千瓦時)
μA (microamp), mA (milliamp), Hz (hertz), kHz (kilohertz), MHz (megahertz), GHz (gigahertz), V (volt), kV (kilovolt), kWh (kilowatt hour)
聲音
dB(分貝)
dB (decibel)
氣壓
Pa(帕)、kPa(千帕)、Mpa(兆帕)
Pa (pascal), kPa (kilopascal), MPa (megapascal)
其他常見單位
支援不限於上述類別的中文單位,例如“米”、“秒”、“美元”、“毫升每瓶”等。以及中文量詞,例如“架”、“場”、“頭”、“部”、“盆”等。
支援不限於上述類別的計量單位,例如 tsp (teaspoon), rpm (round per minute), KB (kilobyte), mmHg (milimetre of mercury) 等。
標籤關係
<say-as>標籤可以包括文本。
樣本
cardinal
<speak><say-as interpret-as="cardinal">12345</say-as></speak>中文音頻效果:SSML-say-as_Cardinal.mp3
<speak><say-as interpret-as="cardinal">10234</say-as></speak>英文音頻效果:en-SSML-say-as_cardinal.mp3
digits
<speak><say-as interpret-as="digits">12345</say-as></speak>中文音頻效果:SSML-say-as_digit.mp3
<speak><say-as interpret-as="digits">10234</say-as></speak>英文音頻效果:en-SSML-say-as_digits.mp3
telephone
<speak><say-as interpret-as="telephone">12345</say-as></speak>中文音頻效果:SSML-say-as_Telephone.mp3
<speak><say-as interpret-as="telephone">10234</say-as></speak>英文音頻效果:en-SSML-say-as_telephone.mp3
name
<speak>她的曾用名是<say-as interpret-as="name">曾小凡</say-as></speak>音頻效果:SSML-say-as_Name.mp3
address
<speak><say-as interpret-as="address">富路國際1號樓3單元304</say-as></speak>id
<speak><say-as interpret-as="id">myid_1998</say-as></speak>音頻效果:SSML-say-as_id.mp3
characters
<speak><say-as interpret-as="characters">希臘字母αβ</say-as></speak>中文音頻效果:SSML-say-as_characters.mp3
<speak><say-as interpret-as="characters">*b+3.c$=α</say-as></speak>punctuation
<speak><say-as interpret-as="punctuation"> -./:;</say-as></speak>date
<speak><say-as interpret-as="date">1000-10-10</say-as></speak>中文音頻效果:SSML-say-as_date.mp3
<speak><say-as interpret-as="date">10-01-2020</say-as></speak>英文音頻效果:en-SSML-say-as_date.mp3
time
<speak><say-as interpret-as="time">5:00am</say-as></speak>中文音頻效果:SSML-say-as_time.mp3
<speak><say-as interpret-as="time">0500</say-as></speak>英文音頻效果:en-SSML-say-as_time.mp3
currency
<speak><say-as interpret-as="currency">13,000,000.00RMB</say-as></speak>中文音頻效果:SSML-say-as_currency.mp3
<speak><say-as interpret-as="currency">$1,000.01</say-as></speak>英文音頻效果:en-SSML-say-as_currency.mp3
measure
<speak><say-as interpret-as="measure">100m12cm6mm</say-as></speak>中文音頻效果:SSML-say-as_measure.mp3
<speak><say-as interpret-as="measure">1,000.01kg</say-as></speak>英文音頻效果:en-SSML-say-as_measure.mp3
綜合樣本
<speak>相傳北宋年間,<say-as interpret-as="date">1121-10-10</say-as>,<say-as interpret-as="address">開封城</say-as>郊外的早晨籠罩在一片<sub alias="雙十一">11.11</sub>前買買買的歡樂海洋中。一支運貨的騾隊剛進入城門,一個膚白貌美<phoneme alphabet="py" ph="de5">地</phoneme>姑娘便攔下第一排的小哥<say-as interpret-as="name">阿發。</say-as></speak>
<speak>“親,本店今日特惠,鞋履全場<say-as interpret-as="digits">199</say-as>減<say-as interpret-as="cardinal">100</say-as>,走過路過不要錯過”。</speak>
<speak>“不啦不啦,趕著上貨,已經<say-as interpret-as="time">09:59:59</say-as>了,再晚就供應鏈斷裂了”。</speak>
<speak><say-as interpret-as="name">阿發</say-as>擦了擦汗,帶著運貨隊伍,徑直穿過鬧巷,耳邊充斥著各種叫賣聲:</speak>
<speak>最新花色現染布匹,買兩尺送一尺;</speak>
<speak>爆款紗帽頭盔,7天無理由退貨;</speak>
<speak>專治大小方脈,調理男人婦人疑難雜症。</speak>
<speak>突然,一匹馬不知怎麼受了驚,在路上嘶鳴狂奔。一個孩子也嚇壞了,跌跌撞撞地撲向大人懷裡<break time="50ms"/>大喊道:</speak>
<speak>“媽媽,媽媽!”</speak>
<speak>這時,<say-as interpret-as="name">阿發</say-as>心想</speak>
<speak>“嚇死寶寶了!”</speak>
<speak>於是他趕緊捂住了<phoneme alphabet="py" ph="he2 bao1">錢包</phoneme>,繼續趕路送貨。一路上,<say-as interpret-as="address">開封城</say-as>的繁榮景象給<say-as interpret-as="name">阿發</say-as>留下了深刻的印象。</speak>
<speak>物換星移,繁華落盡,於是他在購物狂歡之餘握起畫筆,勾勒出一幅長卷,並命名為《清明上河圖》。</speak>