全部產品
Search
文件中心

Intelligent Media Services:SSML標記語言說明

更新時間:Nov 01, 2024

本文為您介紹SSML(Speech Synthesis Markup Language)標記語言的功能、標籤使用及樣本。

概述

SSML是一種基於XML的語音合成標記語言。與純文字的合成相比,使用SSML可以充實合成的內容,為最終合成效果帶來更多變化。SSML不僅控制語音合成能讀什麼,更能控制語音合成可以怎麼讀,包括控制斷句分詞方式、發音、停頓等特徵。

說明

阿里巴巴語音合成服務的SSML實現基於W3C的語音合成標記語言版本1.0。但並不支援W3C包含的所有的標記類型,而是從業務角度出發,將支援的標記類型最大程度與業務需求綁定。

使用說明

  • 目前僅中文及英文聲音支援SSML功能,中文和英文所支援的SSML標籤及內容也有略有差別,詳情請參考文檔下方各標籤的介紹和樣本。

  • 所有文本需放在<speak></speak>標籤之內,每個語音合成任務可使用多個<speak></speak>標籤,支援SSML與文本結合的方式。

  • 文本頭部<speak>之前可以省略XML Header。

  • 標籤內的文字內容如果包含XML的特殊字元,需要做字元轉義,常用的特殊字元對應關係如下。

    • "(雙引號)對應:&quot;

    • ' (撇號或單引號)對應:&apos;

    • &(表示和的符號)對應:&amp;

    • <(小於符號)對應:&lt;

    • > (大於符號)對應:&gt;

說明

智能語音任務及人聲複製(基礎版)支援本文列出的所有SSML標籤及屬效能力;

人聲複製(福士版)僅支援<speak>、<break>、<s>、<sub>、<w>、<phoneme>、<say-as>這7種標籤能力,其中<speak>僅支援rate、pitch、volume屬性配置,其他標籤不支援屬性配置(下文簡稱為“空屬性”)。

標籤

<speak>

  • 描述

    <speak>標籤是所有待支援SSML標籤的根節點。一切需要調用SSML標籤的文本都要包含在<speak></speak>中。

  • 文法

     <speak>需要調用SSML標籤的文本</speak>
  • 屬性

    <speak>標籤支援如下屬性。

    屬性名稱

    屬性類型

    屬性值

    是否必選

    描述

    voice

    String

    線上可調用的發音人的名稱代號,為全小寫voice參數值,如"siyue"。

    阿里巴巴語音合成特有標籤。在合成時,指定發音人,優先順序高於介面請求參數voice指定的發音人。

    voice聲音類型列表

    encodeType

    String

    PCM/WAV/MP3

    阿里巴巴語音合成特有標籤。在合成時,指定音頻檔案格式,優先順序高於介面請求參數format指定的檔案格式。

    sampleRate

    String

    8000/16000/24000/48000

    阿里巴巴語音合成特有標籤。在合成時,指定音訊採樣率,優先順序高於介面請求參數sample_rate指定的音頻採樣率。

    rate

    String

    [-500,500]之間整數。預設值為0。

    • 大於0表示加快語速。

    • 小於0表示減慢語速。

    阿里巴巴語音合成特有標籤。在合成時,指定音訊語速,優先順序高於介面請求參數speech_rate指定的語速。

    pitch

    String

    [-500,500]之間整數。預設值為0。

    • 大於0表示升高音高。

    • 小於0表示降低音高。

    阿里巴巴語音合成特有標籤。在合成時,指定音訊音高,優先順序高於介面請求參數pitch_rate指定的音高。

    volume

    String

    [0,100]之間整數。預設值為50。

    • 大於50表示增大音量。

    • 小於50表示減小音量。

    阿里巴巴語音合成特有標籤。在合成時,指定音訊音量,優先順序高於介面請求參數volume指定的音量。

    effect

    String

    robot/lolita/lowpass/echo/eq/lpfilter/hpfilter

    阿里巴巴語音合成特有標籤。使用該標籤可以使合成的語音產生不同的聲音效果。

    • robot:機器人音效。

    • lolita:蘿莉音效。

    • lowpass:低通音效。

    • echo:回聲音效。

    • eq:均衡器。

    • lpfilter:低通濾波器。

    • hpfilter:高通濾波器。

    說明

    其中eq、lpfilter、hpfilter是進階效果器,您可以通過effectValue自訂效果器的效果。

    一個SSML只支援一種音效,不可以寫多個effect屬性。

    選擇使用音效功能會增加系統延時。

    effectValue

    String

    當effect取值為eq/lpfilter/hpfilter時,使用該參數修改效果器的預設效果。

    • eq(均衡器):系統預設使用8個等級。對應的頻率為[“40 Hz”,“100 Hz”, “200 Hz”, “400 Hz”, “800 Hz”, “1600 Hz”, “4000 Hz”, “12000 Hz”];對應的頻寬為[“1.0q”, “1.0q”, “1.0q”, “1.0q”, “1.0q”, “1.0q”, “1.0q”, “1.0q”]。在使用過程中,需要輸入8個等級對應的增益,其取值範圍為[-20 dB, 20 dB]。例如,effectValue=”1 1 1 1 1 1 1 1”。是一個以空格分割的8個整數組成的字串。數值為0表示不調整對應頻率的增益。

    • lpfilter:輸入低通濾波器的頻率值。取值為(0, 目標採樣率/2]之間的整數。例如effectValue=”800”。

    • hpfilter:輸入高通濾波器的頻率值。取值為(0, 目標採樣率/2]之間的整數。例如effectValue=“1200”。

    bgm

    String

    線上可調用的背景音樂的名稱。參見bgm屬性說明。

    阿里巴巴語音合成特有標籤。為合成的語音添加指定的背景音樂。

    backgroundMusicVolume

    String

    [0,100]之間的整數。預設值為50。

    • 大於50表示增大音量。

    • 小於50表示減小音量。

    阿里巴巴語音合成特有標籤。控制背景音樂的音量。

    其中,bgm屬性說明如下。

    服務內嵌URL

    自訂背景音URL

    目前阿里巴巴語音合成服務內嵌如下幾款背景音樂供您體驗:

    您可以根據需求,使用自訂的背景音。需要將背景音存放在阿里雲的OSS上,並且所在的儲存空間至少為公用讀取許可權,請參見建立儲存空間。使用HTTP/HTTPS協議組建檔案訪問連結,請參見上傳檔案

    音頻要求:

    • 採樣率16 kHz、單聲道WAV格式。

    • 短文本語音合成不超過3.5 MB,長文本語音合成不超過10 MB。

    • 合成時間長度超出背景音時間長度時,背景音將隨合成音頻迴圈播放(如果背景音不是WAV格式,可使用ffmpeg將其轉為WAV格式:ffmpeg -i 輸入音頻 -acodec pcm_s16le -ac 1 -ar 16000 目標.wav)。

    • 標籤內的URL如果包含XML的特殊字元,需要做字元轉義。

    • 位元深度要求16位。

    重要

    您需要對上傳的音頻著作權承擔相應的法律責任。

  • 標籤關係

    <speak>標籤可以包含文本和以下標籤:

    • <break>

    • <s>

    • <w>

    • <phoneme>

    • <say-as>

  • 樣本

    • 空屬性

      <speak>需要調用SSML標籤的文本</speak>

      音頻效果:SSML-speak1.mp3

    • voice屬性

      <speak voice="xiaogang">我是男聲。</speak>

      音頻效果:SSML-speak2.mp3

    • encodeType屬性

      <speak encodeType="mp3">我可以產生壓縮格式的音頻。</speak>

      音頻效果:SSML-encode.mp3

    • sampleRate屬性

      <speak sampleRate="8000">看看我的檔案大小吧,是16000採樣率音訊一半。</speak>

      音頻效果:SSML-speak4.mp3

    • rate屬性

      <speak rate="200">我的語速比正常人快。</speak>

      音頻效果:SSML-speak5.mp3

    • pitch屬性

      <speak pitch="-100">我的音高卻比別人低。</speak>

      音頻效果:SSML-speak6.mp3

    • volume屬性

      <speak volume="80">我的音量也很大。</speak>

      音頻效果:SSML-speak7.mp3

    • 屬性群組合(空格分隔)

      <speak rate="200" pitch="-100" volume="80">所以放在一起,我的聲音是這樣的。</speak>

      音頻效果:SSML-speak8.mp3

    • effect屬性

      <speak effect="robot">你喜歡機器人瓦力嗎?</speak>

      音頻效果:SSML-speak9.mp3

    • bgm屬性

      <speak bgm="http://nls.alicdn.com/bgm/2.wav" backgroundMusicVolume="30" rate="-500" volume="40"><break time="2s"/>陰崖老木蒼蒼煙<break time="700ms"/>雨聲猶在竹林間<break time="700ms"/>綿蕝固知裨國計<break time="700ms"/>綿州風物總堪憐<break time="2s"/></speak>

      音頻效果:SSML-speak10.mp3

<emotion>

  • 描述

    <emotion>用於多情感聲音合成,該標籤是可選標籤,不支援多情感聲音合成的發音人使用情感標籤會導致合成請求報錯。

  • 文法

    <emotion category="happy" intensity="1.0">今天天氣真不錯!</emotion>
  • 屬性

    <emotion>標籤支援如下屬性。

    屬性名稱

    屬性類型

    屬性值

    是否必須

    描述

    category

    String

    枚舉值:如neutral, happy。

    指定說話情緒。每個發音人支援的情緒參見下表所示。

    intensity

    String

    浮點值:數值範圍 [0.01,2.0]。

    指定情緒強度。預設值為1.0,表示預定義的情緒強度。最小值為0.01,導致目標情緒略有傾向。最大值為2.0,導致目標情緒強度加倍。

    其中,多情感聲音支援說明如下。

    音色名

    voice參數值

    情感分類(emotion category)

    知妙_多情感

    zhimiao_emo

    serious,sad,disgust,jealousy,embarrassed,happy,fear,surprise,neutral,frustrated,affectionate,gentle,angry,newscast,customer-service,story,living

    知米_多情感

    zhimi_emo

    angry,fear,happy,hate,neutral,sad,surprise

    知燕_多情感

    zhiyan_emo

    neutral,happy,angry,sad,fear,hate,surprise,arousal

    知貝_多情感

    zhibei_emo

    neutral,happy,angry,sad,fear,hate,surprise

    知甜_多情感

    zhitian_emo

    neutral,happy,angry,sad,fear,hate,surprise

  • 標籤關係

    <emotion>標籤可以包含文本和以下標籤:

    • <s>

    • <sub>

    • <say-as>

    • <w>

    • <phoneme>

    • <soundEvent/>

    • <break/>

  • 樣本

    • 空屬性

      <speak voice="zhitian_emo"><emotion category="happy" intensity="1.0">今天天氣真不錯!</emotion></speak>

      音頻效果:SSML-emotion.wav

<break>

  • 描述

    用於在文本中插入停頓,該標籤是可選標籤。

  • 文法

    <break time="string"/>
  • 屬性

    屬性名稱

    屬性類型

    屬性值

    是否必選

    描述

    time

    String

    [number]s/[number]ms

    以秒/毫秒為單位設定停頓的時間長度 (如“2s“、“50ms”)。

    • [number]s:以秒為單位,[number]取值範圍為[1, 10]的整數。

    • [number]ms:以毫秒為單位,[number]取值範圍為[50, 10000]的整數。

  • 標籤關係

    <break>是空標籤,不能包含任何標籤。如果SSML結構中存在<s>標籤,請把<break>寫在<s>裡面,表示對當前段落或句子設定停頓。

  • 樣本

     <speak>請閉上眼睛休息一下<break time="500ms"/>好了,請睜開眼睛。</speak>

    音頻效果:SSML-break.mp3

<s>

  • 描述

    用於表示文本的句子結構,該標籤是可選標籤。

  • 文法

     <s>文本</s>
  • 屬性

    無。

  • 標籤關係

    <s>標籤可以包含文本和以下標籤:

    • <break>

    • <w>

    • <phoneme>

    • <say-as>

  • 樣本

    <speak><s>這是第一句話</s><s>這是第二句話</s></speak>

    音頻效果:SSML-s.mp3

<sub>

  • 描述

    使用別名替換標籤內文本。

  • 文法

     <sub alias="string"></sub>
  • 屬性

    屬性名稱

    屬性類型

    屬性值

    是否必選

    描述

    alias

    String

    替換後的內容

    用於替換標籤內的文本。

  • 標籤關係

    <sub>標籤可以包括文本。

  • 樣本

     <speak><sub alias="網路通訊協定標準">W3C</sub></speak>

    音頻效果:SSML-sub.mp3

<w>

  • 描述

    用於表示文本的詞語結構,該標籤是可選標籤。英文文本通常採用空格來進行分詞,一般無需使用此標籤。<w>標籤內部必須是一個獨立的詞或短語,這個詞或短語不允許混合使用中文和其他外語。

  • 文法

     <w>文本</w>
  • 屬性

    無。

  • 標籤關係

    <w>標籤可以包含文本。

  • 樣本

     <speak>南京市長<w>江大橋</w>今天發表了演講。</speak>

    音頻效果:SSML-w.mp3

<phoneme>

  • 描述

    用於控制標籤內文本的讀音,該標籤是可選標籤。英文文本不支援該標籤。

  • 文法

     <phoneme alphabet="string" ph="string">文本</phoneme>
  • 屬性

    屬性名稱

    屬性類型

    屬性值

    是否必選

    描述

    alphabet

    String

    py

    “py”表示拼音。

    ph

    String

    標籤內文本對應的拼音串

    拼音用法的賦值規範:

    • 字與字的拼音用空格分隔,拼音的數目必須與字數相等。

    • 每個拼音由發音和音調組成,音調為1~5的數字編號,其中”5”表示輕聲。

  • 標籤關係

    <phoneme>標籤可以包括文本。

  • 樣本

     <speak>去<phoneme alphabet="py" ph="dian3 dang4 hang2">典當行</phoneme>把這個玩意<phoneme alphabet="py" ph="dang4 diao4">當掉</phoneme></speak>

    音頻效果:SSML-phoneme.mp3

<soundEvent>

  • 描述

    提示音標籤,可以在SSML合成過程中,通過該標籤在任意位置插入提示音。

  • 文法

     <soundEvent src="URL"/>
  • 屬性

    屬性名稱

    屬性類型

    屬性值

    是否必選

    描述

    src

    String

    URL提示音資源路徑

    您可以根據需求,使用自訂提示音。需要將提示音存放在阿里雲OSS上,並且所在的儲存空間至少為公用讀取許可權,請參見建立儲存空間,使用HTTP/HTTPS協議組建檔案訪問連結請參見上傳檔案

    音頻要求:

    • 採樣率16 kHz、單聲道WAV格式。

    • 不超過2 MB。

    • 位元深度要求16位。

    重要

    您需要對上傳的音頻著作權承擔相應的法律責任。

  • 標籤關係

    <soundEvent>是空標籤,不可以包含任何標籤。

  • 樣本

     <speak>一匹馬受了驚嚇<soundEvent src="http://nls.alicdn.com/sound-event/horse-neigh.wav"/>人們四散躲避</speak>

    音頻效果:SSML-sound-event.mp3

<say-as>

  • 描述

    用於指示出標籤內文本的資訊類型,進而按照該類型的預設發音方式發音。

  • 文法

     <say-as interpret-as="string">文本</say-as>
  • 屬性

    屬性名稱

    屬性類型

    屬性值

    是否必選

    描述

    interpret-as

    String

    cardinal/digits/telephone/name/address/id/characters/punctuation/date/time/currency/measure

    指示出標籤內文本的資訊類型:

    • cardinal:按整數或小數發音

    • digits:按數字發音。

    • telephone:按電話號碼常用方式發音。

    • name:按人名發音。

    • address:按地址發音。

    • id:適用於賬戶名、暱稱等

    • characters:將標籤內的文本按字元一一讀出。

    • punctuation:將標籤內的文本按標點符號的方式讀出來。

    • date:按日期發音。

    • time:按時間發音。

    • currency:按金額發音。

    • measure:按計量單位發音。

  • 各<say-as>類型支援範圍

    • cardinal

      格式

      樣本

      中文輸出

      說明

      數字串

      145

      一百四十五

      整數輸入範圍:20位以內的正負整數,[-99999999999999999999,99999999999999999999]。

      小數輸入範圍:對小數點後小數的位元沒有特殊限制,建議不超過10位。

      負號+數字串

      -145

      負一百四十五

      以逗號分隔3位元字串

      10,000

      一萬

      負號+以逗號分隔3位元字串

      -10,124

      負一萬一百二十四

      數字串+小數點+2個零

      10.00

      負號+數字串+小數點+2個零

      -110.00

      負一百一十

      數字串+小數點+數字串

      79.090

      七十九點零九零

      負號+數字串+小數點+數字串

      -79.001

      負七十九點零零一

      格式

      樣本

      英文輸出

      說明

      數字串

      145

      one hundred forty five

      整數輸入範圍:13位以內的正負整數,[-999999999999,999999999999]。

      小數輸入範圍:對小數點後小數的位元沒有特殊限制,建議不超過10位。

      以零開頭的數字串

      0145

      one hundred forty five

      負號+數字串

      -145

      minus hundred forty five

      以逗號分隔三位元字串

      60,000

      sixty thousand

      負號+以逗號分隔三位元字串

      -208,000

      minus two hundred eight thousand

      數字串+小數點+零

      12.00

      twelve

      數字串+小數點+數字串

      12.34

      twelve point three four

      以逗號分隔三位元字串+小數點+數字串

      1,000.1

      one thousand point one

      負號+數字串+小數點+數字串

      -12.34

      minus twelve point three four

      負號+以逗號分隔三位元字串+小數點+數字串

      -1,000.1

      minus one thousand point one

      (以逗號分隔三位)數字串+連詞符+(以逗號分隔三位)數字

      1-1,000

      one to one thousand

      其他預設讀法

      012.34

      twelve point three four

      1/2

      one half

      -3/4

      minus three quarters

      5.1/6

      five point one over six

      -3 1/2

      minus three and a half

      1,000.3^3

      one thousand point three to the power of three

      3e9.1

      three times ten to the power of nine point one

      23.10%

      twenty three point one percent

    • digits

      格式

      樣本

      中文輸出

      說明

      數字串

      129090909

      一二九零九零九零九

      對數字串的長度沒有特殊限制,建議不超過20位。

      當數字串超過10位時,每個數字後插入停頓。

      格式

      樣本

      英文輸出

      說明

      數字串

      12034

      one two zero three four

      對數字串的長度沒有特殊限制,建議不超過20位。

      當數字串以空格或連詞符分組時,分組之間會插入逗號而產生適當停頓,支援最長5個分組。

      數字串+空格或連詞符+數字串+空格或連詞符+數字串+空格或連詞符+數字串

      1-23-456 7890

      one, two three, four five six, seven eight nine zero

    • telephone

      格式

      樣本

      中文輸出

      說明

      有線電話號

      4930286

      四九三 零二八六

      支援7~8位有線電話號,支援空格和“-”作為分隔字元。

      其中,7位有線電話號支援“3-4”的數字分隔方式;8位有線電話號支援“4-4”的數字分隔方式。

      493 0286

      四九三 零二八六

      493-0286

      四九三 零二八六

      62552560

      六二五五 二五六零

      6255 2560

      六二五五 二五六零

      6255-2560

      六二五五 二五六零

      有線電話號+分機號

      4930286-109

      四九三 零二八六 轉么零九

      支援1~4位分機號。

      4930286轉109

      四九三 零二八六 轉么零九

      4930286分機109

      四九三 零二八六 分機么零九

      4930286分機號109

      四九三 零二八六 分機號么零九

      區號+有線電話號

      01062552560

      零么零 六二五五 二五六零

      支援區號:010、02x、03xx、04xx、05xx、07xx、08xx、09xx。

      010 62552560

      零么零 六二五五 二五六零

      010 6255 2560

      零么零 六二五五 二五六零

      010 6255-2560

      零么零 六二五五 二五六零

      010-62552560

      零么零 六二五五 二五六零

      010-6255-2560

      零么零 六二五五 二五六零

      (010)62552560

      零么零 六二五五 二五六零

      03198907098

      零三么九 八九零 七零九八

      0319-8907098

      三么九 八九零 七零九八

      區號+有線電話號+分機號

      010 62552560-109

      零么零 六二五五 二五六零 轉么零九

      010-62552560-109

      零么零 六二五五 二五六零 轉么零九

      (010)62552560-109

      零么零 六二五五 二五六零 轉么零九

      (010)62552560轉109

      零么零 六二五五 二五六零 轉么零九

      (010)62552560分機109

      零么零 六二五五 二五六零 分機么零九

      (010)62552560分機號109

      零么零 六二五五 二五六零 分機號么零九

      國家代碼+區號+有線電話號

      86-010-62791627

      八六 零么零 六二七九 么六二七

      支援國家代碼:86、 (86)、+86、(+86)、0086。並統一讀為“八六”。

      (86)10-62791627

      八六 么零 六二七九 么六二七

      +86-010-62791627

      八六 零么零 六二七九 么六二七

      0086-10-62791627

      八六 么零 六二七九 么六二七

      (+86)-10-6279 1627

      八六 么零 六二七九 么六二七

      國家代碼+區號+有線電話號+分機號

      (86)21-58118818-207

      八六 二么 五八么么 八八么八 轉二零七

      (86)021-5811-8818-207

      八六 零二么 五八么么 八八么八 轉二零七

      (86)021-58118818轉207

      八六 零二么 五八么么 八八么八 轉二零七

      (86)21-5811-8818分機207

      八六 二么 五八么么 八八么八 分機二零七

      +86-021-58118818分機號207

      八六 零二么 五八么么 八八么八分機號二零七

      手機號

      139 0000 5678

      么三九 零零零零 五六七八

      支援11位手機號,支援3-3-5、3-4-4兩種數字分隔方式

      139-000-05678

      么三九 零零零 零五六七八

      139 000 05678

      么三九 零零零 零五六七八

      國家代碼+手機號

      +86-13900005678

      八六 么三九 零零零零 五六七八

      (+86)-139-0000-5678

      八六 么三九 零零零零 五六七八

      +8613900005678

      八六 么三九 零零零零 五六七八

      0086-139 000 05678

      八六 么三九 零零零 零五六七八

      服務號

      123

      么二三

      • 支援常用的服務號。

      • 支援以400/800開頭的10位服務號,支援以“3-3-4”的數字分隔方式。

      • 支援以12530/17951/12593開頭的16位號碼。

      95678

      九五六七八

      4008110510

      四零零 八么么 零五么零

      800-810-8888

      八零零 八么零 八八八八

      1253013520638377

      么二五三零 么三五 二零六三 八三七七

      其他

      (86)(21)9899-80800-0909

      八六 二么 九八九九 八零八零零 零九零九

      支援“數字串+分隔字元(左右括弧、-)”方式。

      格式

      樣本

      英文輸出

      說明

      數字串

      12034

      one two oh three four

      對數字串的長度沒有特殊限制,建議不超過20位。當數字串以空格或連詞符分組時,分組之間會插入逗號而產生適當停頓,支援最長5個分組。

      數字串+空格或連詞符+數字串+空格或連詞符+數字串

      1-23-456 7890

      one, two three, four five six, seven eight nine oh

      加號+數字串+空格或連詞符+數字串

      +43-211-0567

      plus four three, two one one, oh five six seven

      左括弧+數字串+右括弧+空格+數字串+空格或連詞符+數字串

      (21) 654-3210

      (two one) six five four, three two one oh

    • address

      格式

      樣本

      中文輸出

      說明

      常用地址格式

      元和鎮嘉元30-9

      元和鎮嘉元三十杠九

      支援常用地址格式。此處地址指標準的郵寄地址。

      市台路388弄1107-1108號

      市台路三八八弄么么零七杠么么零八號

      華潤二十四城六期錦雲府3-1-3205

      華潤二十四城六期錦雲府三杠一杠三二零五

      聖華名都大廈2幢2006室

      聖華名都大廈二幢二零零六室

      五常街道庭院5幢4單元201

      五常街道庭院五幢四單元二零么

      芙蓉江路150弄19號

      芙蓉江路么五零弄十九號

      英文文本不支援該標籤。

    • id

      格式

      樣本

      輸出

      說明

      字串

      dell0101

      D E L L 零 一 零 一

      大小寫英文字元、阿拉伯數字0~9、底線。

      輸出的空格表示每個字元之間插入停頓,即字元一個一個地讀。

      myid_1998

      M Y I D 底線 一 九 九 八

      AiTest

      A I T E S T

      英文文本該標籤功能同標籤characters。

    • characters

      格式

      樣本

      中文輸出

      說明

      字串

      ISBN 1-001-099098-1

      I S B N 一 杠 零 零 一 杠 零 九 九 零 九 八 杠 一

      支援中文漢字、大小寫英文字元、阿拉伯數字0~9以及部分全形和半形字元。

      輸出的空格表示每個字元之間插入停頓,即字元一個一個地讀。標籤內的文本如果包含XML的特殊字元,需要做字元轉義。

      x10b2345_u

      x 一 零 b 二 三 四 五 底線 u

      v1.0.1

      v 一 點 零 點 一

      版本號碼2.0

      版本號碼二 點 零

      蘇M MA000

      蘇M M A 零 零 零

      空中巴士A330

      空中巴士A 三 三 零

      型號s01 s02和s03

      型號s 零 一 s 零二 和s 零 三

      空中巴士A330

      空中巴士A 三 三 零

      αβγ

      阿爾法 貝塔 伽瑪

      格式

      樣本

      英文輸出

      說明

      字串

      *b+3$.c-0'=α

      asterisk B plus three dollar dot C dash zero apostrophe equals alpha

      支援中文漢字、大小寫英文字元、阿拉伯數字0~9以及部分全形和半形字元。

      輸出的空格表示每個字元之間插入停頓,即字元一個一個地讀。

      標籤內的文本如果包含XML的特殊字元,需要做字元轉義。

    • punctuation

      格式

      樣本

      中文輸出

      說明

      標點符號

      省略符號

      支援常見中英文標點。輸出的空格表示每個字元之間插入停頓,即字元一個一個地讀。

      標籤內的文本如果包含XML的特殊字元,需要做字元轉義。

      ……

      省略符號

      !"#$%&

      歎號 雙引號 井號 dollar 百分比符號 and

      ‘()*+

      單引號 左括弧 右括弧 星號 加號

      ,-./:;

      逗號 杠 點 斜杠 冒號 分號

      <=>?@

      小於 等號 大於 問號 at

      [\]^_

      左方括弧 反斜線 右方括弧 脫字元 底線

      英文文本該標籤功能同標籤characters。

    • date

      格式

      樣本

      中文輸出

      說明

      xx年

      71年

      七一年

      支援2位和4位年份。其中:

      • 2位年份支援60年~99年、00年~09年、10年~19年。

      • 4位年份支援1000年~1999年、2000年~2099年。

      04年

      零四年

      19年

      一九年

      1011年

      一零一一年

      1998年

      一九九八年

      2008年

      二零零八年

      xx年xx月

      98年4月

      九八年四月

      當月份為1到9月時,支援開頭帶“0”和不帶“0”兩種寫法。例如“1908年4月”和“1908年04月”。

      1998年04月

      一九九八年四月

      08年8月

      零八年八月

      2008年8月

      二零零八年八月

      xx年xx月xx日xx年xx月xx號

      98年4月23日

      九八年四月二十三日

      當日期為1到9日時,支援開頭帶“0”和不帶“0”兩種寫法。例如“1908年4月8日”和“1908年04月08日”。

      1998年04月23日

      一九九八年四月二十三日

      08年8月8號

      零八年八月八號

      2008年08月08號

      二零零八年八月八號

      xx年xx月xx日xx年xx月xx號

      98年4月23日

      九八年四月二十三日

      當日期為1到9日時,支援開頭帶“0”和不“0”兩種寫法。例如“1908年4月8日”和“1908年04月08日”。

      1998年04月23日

      一九九八年四月二十三日

      08年8月8號

      零八年八月八號

      2008年08月08號

      二零零八年八月八號

      xx月xx號

      3月20日

      三月二十日

      08月07號

      八月七號

      年月縮寫

      2018/08

      二零一八年八月

      支援“/”、“-”、“.”作為縮寫的分隔字元。

      2018-08

      二零一八年八月

      2018.08

      二零一八年八月

      年月日縮寫

      2018/08/08

      二零一八年八月八日

      2018-8-8

      二零一八年八月八日

      2018.08.08

      二零一八年八月八日

      xx年xx月xx日~xx年xx月xx日xx年xx月xx號~xx年xx月xx號

      04年9月1日~30日

      零四年九月一日至三十日

      支援“~”、“-”作為“至”的縮寫標誌。

      2004年09月01號-2008年06月08號

      二零零四年九月一號至二零零八年六月八號

      xx年xx月xx日~xx日xx年xx月xx號~xx號

      04年9月1日~30日

      零四年九月一日至三十日

      2004年09月01號-2008年06月08號

      二零零四年九月一號至二零零八年六月八號

      xx年xx月~xx年xx月

      01年04月~10年04月

      零一年四月至一零年四月

      2001年04月~2010年04月

      二零零一年四月至二零一零年四月

      xx月xx日~xx月xx日xx月xx號~xx月xx號

      10月1日~10月7日

      十月一日至十月七日

      10月01號~10月07號

      十月一號至十月七號

      xx月xx日~xx日xx月xx號~xx號

      10月1日~7日

      十月一日至七日

      10月01號~07號

      十月一號至七號

      年月日縮寫~年月日縮寫

      2018/03/03~2019/01/01

      二零一八年三月三日至二零一九年一月一日

      支援“/”、“.”作為縮寫的分隔字元,支援“~”、“-”作為“至”的縮寫標誌。

      1997.9.9~1998.9.9

      一九九七年九月九日至一九九八年九月九日

      月日縮寫~月日縮寫

      10/20~10/31

      十月二十日至十月三十一日

      xx~xx月xx月~xx月

      1~10月

      一至十月

      1月~10月

      一月至十月

      月日年縮寫

      10/20/2018

      二零一八年十月二十日

      僅支援4位的年份,僅支援“/”作為日期的分隔字元,僅支援“月/日/年”的書寫方式。

      格式

      樣本

      英文輸出

      說明

      四位元字/兩位元字或四位元字-兩位元字

      2000/01

      two thousand, oh one

      跨年度。

      1900-01

      nineteen hundred, oh one

      2001-02

      twenty oh one, oh two

      2019-20

      twenty nineteen, twenty

      1998-99

      nineteen ninety eight, ninety nine

      1999-00

      nineteen ninety nine, oh oh

      以1或2開頭的四位元字

      2000

      two thousand

      四位元字年份。

      1900

      nineteen hundred

      1905

      nineteen oh five

      2021

      twenty twenty one

      星期幾-星期幾

      星期幾~星期幾

      星期幾&星期幾

      mon-wed

      monday to wednesday

      星期幾的範圍標籤內的文本如果包含XML的特殊字元,需要做字元轉義。

      tue~fri

      tuesday to friday

      sat&sun

      saturday and sunday

      DD-DD MMM, YYYY

      DD~DD MMM, YYYY

      DD&DD MMM, YYYY

      19-20 Jan, 2000

      the nineteen to the twentieth of january two thousand

      DD表示兩位元字日期,MMM表示月份的三字母縮寫或完整單詞,YYYY表示以1或2開頭的四位元字年份。

      01 ~ 10 Jul, 2020

      the first to the tenth of july twenty twenty

      05&06 Apr, 2009

      the fifth and the sixth of april two thousand nine

      MMM DD-DD

      MMM DD~DD

      MMM DD&DD

      Feb 01 - 03

      feburary the first to the third

      MMM表示月份的三字母縮寫或完整單詞,DD表示兩位元字日期。

      Aug 10~20

      august the tenth to the twentieth

      Dec 11&12

      december the eleventh and the twelfth

      MMM-MMM

      MMM~MMM

      MMM&MMM

      Jan-Jun

      january to june

      MMM表示月份的三字母縮寫或完整單詞。

      jul ~ dec

      july to december

      sep&oct

      september and october

      YYYY-YYYY

      YYYY~YYYY

      1990 - 2000

      nineteen ninety to two thousand

      YYYY表示以1或2開頭的四位元字年份。

      2001~2021

      two thousand one to twenty twenty one

      WWW DD MMM YYYY

      Sun 20 Nov 2011

      sunday the twentieth of november twenty eleven

      WWW表示星期幾的三字母縮寫或完整單詞,DD表示兩位元字日期,MMM表示月份的三字母縮寫或完整單詞,MM表示兩位元字月份(或三字母縮寫或完整單詞),YYYY表示以1或2開頭的四位元字年份。

      WWW DD MMM

      Sun 20 Nov

      sunday the twentieth of november

      WWW MMM DD YYYY

      Sun Nov 20 2011

      sunday november the twentieth twenty eleven

      WWW MMM DD

      Sun Nov 20

      sunday november the twentieth

      WWW YYYY-MM-DD

      Sat 2010-10-01

      aturday october the first twenty ten

      WWW YYYY/MM/DD

      Sat 2010/10/01

      saturday october the first twenty ten

      WWW MM/DD/YYYY

      Sun 11/20/2011

      sunday november the twentieth twenty eleven

      MM/DD/YYYY

      11/20/2011

      november the twentieth twenty eleven

      YYYY

      1998

      nineteen ninety eight

      其他預設讀法

      10 Mar, 2001

      the tenth of march two thousand one

      10 Mar

      the tenth of march

      Mar 2001

      march two thousand one

      Fri. 10/Mar/2001

      friday the tenth of march two thousand one

      Mar 10th, 2001

      march the tenth two thousand one

      Mar 10

      march the tenth

      2001/03/10

      march the tenth two thousand one

      2001-03-10

      march the tenth two thousand one

      2000s

      two thousands

      2010's

      twenty tens

      1900's

      nineteen hundreds

      1990s

      nineteen nineties

    • time

      格式

      樣本

      中文輸出

      說明

      時刻

      12:00

      十二點

      支援常用時間和時間範圍格式。

      12:00:00點

      十二點

      10:20分

      十點二十分

      10:20:30

      十點二十分三十秒

      09:18:14

      九點十八分十四秒

      時刻~時刻

      11:00~12:00

      十一點到十二點

      09:00-14:00

      九點到十四點

      11:00~11:30

      十一點到十一點三十分

      11:00-12:18

      十一點到十二點十八分

      10:30~11:00

      十點三十分到十一點

      09:28-10:00

      九點二十八分到十點

      10:20~11:20

      十點二十分到十一點二十分

      06:00~08:00

      六點到八點

      上午10:20~下午13:30

      上午十點二十分到下午十三點三十分

      時間縮寫

      5:00 am

      淩晨五點整

      5:30 am

      淩晨五點半

      5:20:12 am

      淩晨五點二十分十二秒

      7:00 am

      上午七點整

      7:30 AM

      上午七點半

      7:20:12 a.m.

      上午七點二十分十二秒

      07:08:12 A.M.

      上午七點零八分十二秒

      5:00 pm

      下午五點整

      5:30 PM

      下午五點半

      5:20:12 p.m.

      下午五點二十分十二秒

      05:09:12 P.M.

      下午五點零九分十二秒

      9:00 pm

      晚上九點整

      9:30 pm

      晚上九點半

      9:20:12 PM

      晚上九點二十分十二秒

      9:02:12 P.M.

      晚上九點零二分十二秒

      12:00 pm

      中午十二點整

      12:30 p.m.

      中午十二點半

      12:20:12 PM

      中午十二點二十分十二秒

      格式

      樣本

      英文輸出

      說明

      HH:MM AM或PM

      09:00 AM

      nine A M

      HH表示一或兩位元字小時,MM表示兩位元字分鐘,AM/PM表示上/下午。

      09:03 PM

      nine oh three P M

      09:13 p.m.

      nine thirteen p m

      HH:MM

      21:00

      twenty one hundred

      HHMM

      100

      one oclock

      時刻-時刻

      8:00 am - 05:30 pm

      eight a m to five p m

      支援常見時間格式和範圍。

      7:05~10:15 AM

      seven oh five to ten fifteen A M

      09:00-13:00

      nine oclock to thirteen hundred

    • currency

      格式

      樣本

      中文輸出

      說明

      數字+金額標識符

      12.00 RMB

      十二人民幣

      支援AUD(澳幣) 、CAD(加元)、 HKD(港幣)、JPY(日元)、USD(美元)、CHF(瑞士法郎)、NOK(挪威克朗)、SEK(瑞典克朗)、GBP(英鎊)、 RMB(人民幣)、CNY(元)和EUR(歐元)。

      支援的數字格式包括:整數、小數以及以逗號分隔的國際寫法。

      12.50 RMB

      十二點五零人民幣

      12,000,000 RMB

      一千二百萬人民幣

      12,000,000.00 RMB

      一千二百萬人民幣

      12,000.35 RMB

      一萬兩千點三五人民幣

      金額標識符+數字

      $12

      十二美元

      支援 CAD(加元)、 $(美元)、Fr(法郎)、kr(丹麥幣)、 £(英鎊)、¥(元)和 €(歐元)。

      支援的數字格式包括:整數、小數以及以逗號分隔的國際寫法。

      $12.00

      十二美元

      $12.12

      二點一二美元

      $12,000

      一萬兩千美元

      $12,000.00

      一萬兩千美元

      $12,000.99

      一萬兩千點九九美元

      其他預設讀法

      1213

      一千二百一十三

      1213 KML

      一千二百一十三K M L

      1213.00 KML

      一千二百一十三K M L

      1213.9 KML

      一千二百一十三點九K M L

      1,000 KML

      一千K M L

      1,000.00 KML

      一千K M L

      1,000.98 KML

      一千點九八K M L

      12,000

      一萬兩千

      格式

      樣本

      英文輸出

      說明

      數字+金額識別符

      1.00 RMB

      one yuan

      支援的數字格式:整數、小數以及以逗號分隔的國際寫法。

      支援的金額識別符:

      CN¥ (yuan)

      CNY (yuan)

      RMB (yuan)

      AUD (australian dollar)

      CAD (canadian dollar)

      CHF (swiss franc)

      DKK (danish krone)

      EUR (euro)

      GBP (british pound)

      HKD (Hong Kong(China) dollar)

      JPY (japanese yen)

      NOK (norwegian krone)

      SEK (swedish krona)

      SGD (singapore dollar)

      USD (united states dollar)

      2.02 CNY

      two point zero two yuan

      1,000.23 CN¥

      one thousand point two three yuan

      1.01 SGD

      one singapore dollar and one cent

      2.01 CAD

      two canadian dollars and one cent

      3.1 HKD

      three hong kong dollars and ten cents

      1,000.00 EUR

      one thousand euros

      金額識別符+數字

      US$ 1.00

      one US dollar

      支援的數字格式:整數、小數以及以逗號分隔的國際寫法。

      支援的金額識別符:

      US$ (US dollar)

      CA$ (Canadian dollar)

      AU$ (Australian dollar)

      SG$ (Singapore dollar)

      HK$ (Hong Kong dollar)

      C$ (Canadian dollar)

      A$ (Australian dollar)

      $ (dollar)

      £ (pound)

      € (euro)

      CN¥ (yuan)

      CNY (yuan)

      RMB (yuan)

      AUD (australian dollar)

      CAD (canadian dollar)

      CHF (swiss franc)

      DKK (danish krone)

      EUR (euro)

      GBP (british pound)

      HKD (Hong Kong(China) dollar)

      JPY (japanese yen)

      NOK (norwegian krone)

      SEK (swedish krona)

      SGD (singapore dollar)

      USD (united states dollar)

      $0.01

      one cent

      JPY 1.01

      one japanese yen and one sen

      £1.1

      one pound and ten pence

      €2.01

      two euros and one cent

      USD 1,000

      one thousand united states dollars

      數字+量詞+金額識別符

      金額識別符+數字+量詞

      1.23 Tn RMB

      one point two three trillion yuan

      支援的量詞格式包括:

      thousand

      million

      billion

      trillion

      Mil (million)

      mil (million)

      Bil (billion)

      bil (billion)

      MM (million)

      Bn (billion)

      bn (billion)

      Tn (trillion)

      tn (trillion)

      K(thousand)

      k (thousand)

      M (million)

      m (million)

      $1.2 K

      one point two thousand dollars

    • measure

      格式

      樣本

      中文輸出

      說明

      數字+中文單位

      2片

      兩片

      支援常見中文單位及單位縮寫。

      120公頃

      一百二十公頃

      100多毫克

      一百多毫克

      100來米

      一百來米

      100餘人

      一百餘人

      1厘米20毫米

      一厘米二十毫米

      120.00平方公裡

      一百二十平方公裡

      數字+單位縮寫

      120.56 cm²

      一百二十點五六平方厘米

      120 ㎡ 56 cm²

      一百二十平方米五十六平方厘米

      100 m 12 cm 6 mm

      一百米十二厘米六毫米

      範圍

      10~15 kg

      十至十五千克

      10.24~789.82畝

      十點二四至七百八十九點八二畝

      10米~15米

      十米至十五米

      10.24 cm~19.08 cm

      十點二四厘米至十九點零八厘米

      數字+單位+"/"+單位

      10元/斤

      十元每斤

      199~299元/件

      一百九十九至二百九十九元每件

      299.99元/g~399.99元/g

      二百九十九點九九元每克至三百九十九點九九元每克

      其他預設讀法

      12紮

      十二紮

      30 rm

      三十r m

      4萬萬同胞

      四萬萬同胞

      12.897微克

      十二點八九七微克

      格式

      樣本

      英文輸出

      說明

      數字+計量單位

      1.0 kg

      one kilogram

      支援的數字格式:整數、小數以及以逗號分隔的國際寫法。

      支援常見單位縮寫。

      1,234.01 km

      one thousand two hundred thirty four point zero one kilometres.

      計量單位

      mm2

      square millimetre

    • <say-as>常見符號讀法如下表所示。

      符號

      中文讀法

      英文讀法

      !

      歎號

      exclamation mark

      雙引號

      double quote

      #

      井號

      pound

      $

      dollar

      dollar

      %

      百分比符號

      percent

      &

      and

      and

      單引號

      left quote

      左括弧

      left parenthesis

      右括弧

      right parenthesis

      *

      asterisk

      +

      plus

      ,

      逗號

      comma

      -

      dash

      .

      dot

      /

      斜杠

      slash

      零冒號

      solon

      分號

      semicolon

      <

      小於

      less than

      =

      等號

      equals

      >

      大於

      greater than

      ?

      問號

      question mark

      @

      at

      at

      [

      左方括弧

      left bracket

      \

      反斜線

      back slash

      ]

      右方括弧

      right bracket

      ^

      脫字元

      caret

      _

      底線

      underscore

      `

      反引號

      back quote

      {

      左花括弧

      left brace

      |

      豎線

      vertical bar

      }

      右花括弧

      right brace

      ~

      波浪線

      tilde

      歎號

      exclamation mark

      左雙引號

      left double quote

      右雙引號

      right double qute

      左單引號

      left quote

      右單引號

      right quote

      左括弧

      left parenthesis

      右括弧

      right parenthesis

      逗號

      comma

      句號

      full stop

      em dash

      冒號

      colon

      分號

      semicolon

      問號

      question mark

      頓號

      enumeration comma

      省略符號

      ellipsis

      ……

      省略符號

      ellipsis

      左>形箭號

      left guillemet

      右>形箭號

      right guillemet

      人民幣符號

      yuan

      大於等於

      greater than or equal to

      小於等於

      less than or equal to

      不等於

      not equal

      約等於

      approximately equal

      ±

      加減

      plus or minus

      ×

      times

      π

      pi

      Α

      阿爾法

      alpha

      Β

      貝塔

      beta

      Γ

      伽瑪

      gamma

      Δ

      德爾塔

      delta

      Ε

      艾普西龍

      epsilon

      Ζ

      捷塔

      zeta

      Θ

      西塔

      theta

      Ι

      艾歐塔

      iota

      Κ

      喀帕

      kappa

      拉姆達

      lambda

      Μ

      mu

      Ν

      nu

      Ξ

      克西

      ksi

      Ο

      歐麥克輪

      omicron

      pi

      Ρ

      rho

      西格瑪

      sigma

      Τ

      tau

      Υ

      宇普西龍

      upsilon

      Φ

      fai

      phi

      Χ

      chi

      Ψ

      普賽

      psi

      Ω

      歐米伽

      omega

      α

      阿爾法

      alpha

      β

      貝塔

      beta

      γ

      伽瑪

      gamma

      δ

      德爾塔

      delta

      ε

      艾普西龍

      epsilon

      ζ

      捷塔

      zeta

      η

      依塔

      eta

      θ

      西塔

      theta

      ι

      艾歐塔

      iota

      κ

      喀帕

      kappa

      λ

      拉姆達

      lambda

      μ

      mu

      ν

      nu

      ξ

      克西

      ksi

      ο

      歐麥克輪

      omicron

      π

      pi

      ρ

      rho

      σ

      西格瑪

      sigma

      τ

      tau

      υ

      宇普西龍

      upsilon

      φ

      fai

      phi

      χ

      chi

      ψ

      普賽

      psi

      ω

      歐米伽

      omega

    • <say-as>常見計量單位如下表所示。

      格式

      類別

      中文樣本

      英文樣本

      縮寫

      長度

      nm(納米)、μm(微米)、 mm(毫米)、cm(厘米)、m(米)、km(千米)、ft(英尺)、in(英寸)

      nm (nanometre), μm (micrometre), mm (millimetre), cm (centimetre), m (metre), km (kilometre), ft (foot), in (inch)

      面積

      cm²(平方厘米)、㎡(平方米)、km²(平方千米)、SqFt(平方英尺)

      cm² (square centimetre), ㎡ (square metre), km2 (square kilometre), SqFt (square foot)

      體積

      cm³(立方厘米)、m³(立方米)、km³(立方千米)、mL(毫升)、L(升)、gallon(加侖)

      cm³ (cubic centimetre), m³ (cubic metre), km3(cubic kilometre), mL (millilitre), L (millilitre), gal (gallon)

      重量

      μg(微克)、mg(毫克)、g(克)、kg(千克)

      μg (microgram), mg (microgram), g (gram), kg (kilogram)

      時間

      min(分)、sec(秒)、ms(毫秒)

      min (minute), sec (second), ms (millisecond)

      電磁

      μA(微安)、mA(毫安)、Ω(歐姆)、Hz(赫茲)、kHz(千赫茲)、MHz(兆赫茲)、GHz(吉赫茲)、V(伏)、kV(千伏)、kWh(千瓦時)

      μA (microamp), mA (milliamp), Hz (hertz), kHz (kilohertz), MHz (megahertz), GHz (gigahertz), V (volt), kV (kilovolt), kWh (kilowatt hour)

      聲音

      dB(分貝)

      dB (decibel)

      氣壓

      Pa(帕)、kPa(千帕)、Mpa(兆帕)

      Pa (pascal), kPa (kilopascal), MPa (megapascal)

      其他常見單位

      支援不限於上述類別的中文單位,例如“米”、“秒”、“美元”、“毫升每瓶”等。以及中文量詞,例如“架”、“場”、“頭”、“部”、“盆”等。

      支援不限於上述類別的計量單位,例如 tsp (teaspoon), rpm (round per minute), KB (kilobyte), mmHg (milimetre of mercury) 等。

  • 標籤關係

    <say-as>標籤可以包括文本。

  • 樣本

綜合樣本

<speak>相傳北宋年間,<say-as interpret-as="date">1121-10-10</say-as>,<say-as interpret-as="address">開封城</say-as>郊外的早晨籠罩在一片<sub alias="雙十一">11.11</sub>前買買買的歡樂海洋中。一支運貨的騾隊剛進入城門,一個膚白貌美<phoneme alphabet="py" ph="de5">地</phoneme>姑娘便攔下第一排的小哥<say-as interpret-as="name">阿發。</say-as></speak>
<speak>“親,本店今日特惠,鞋履全場<say-as interpret-as="digits">199</say-as>減<say-as interpret-as="cardinal">100</say-as>,走過路過不要錯過”。</speak>
<speak>“不啦不啦,趕著上貨,已經<say-as interpret-as="time">09:59:59</say-as>了,再晚就供應鏈斷裂了”。</speak>
<speak><say-as interpret-as="name">阿發</say-as>擦了擦汗,帶著運貨隊伍,徑直穿過鬧巷,耳邊充斥著各種叫賣聲:</speak>
<speak>最新花色現染布匹,買兩尺送一尺;</speak>
<speak>爆款紗帽頭盔,7天無理由退貨;</speak>
<speak>專治大小方脈,調理男人婦人疑難雜症。</speak>
<speak>突然,一匹馬不知怎麼受了驚,在路上嘶鳴狂奔。一個孩子也嚇壞了,跌跌撞撞地撲向大人懷裡<break time="50ms"/>大喊道:</speak>
<speak>“媽媽,媽媽!”</speak>
<speak>這時,<say-as interpret-as="name">阿發</say-as>心想</speak>
<speak>“嚇死寶寶了!”</speak>
<speak>於是他趕緊捂住了<phoneme alphabet="py" ph="he2 bao1">錢包</phoneme>,繼續趕路送貨。一路上,<say-as interpret-as="address">開封城</say-as>的繁榮景象給<say-as interpret-as="name">阿發</say-as>留下了深刻的印象。</speak>
<speak>物換星移,繁華落盡,於是他在購物狂歡之餘握起畫筆,勾勒出一幅長卷,並命名為《清明上河圖》。</speak>