SSML标签说明
SSML(Speech Synthesis Markup Language,语音合成标记语言)是一种基于XML的标记语言,用于控制语音合成的输出。通过使用SSML标签,您可以更精确地控制语音的发音、停顿、语调等。
详细说明
characters、spell-out
这段文字是以单个字母的形式(逐个拼出)朗读出来的。
读作“T E S T”。
如大写“T E S T”。
alphanumeric
文本以单个字母(拼写出来)的形式朗读,并适当停顿。
作为“A B C <暂停> D E F”。
可以使用“-”指定暂停。
如“A B <暂停> C D <暂停> E F”。
cardinal、number
以基数形式朗读文本。
朗读为“There are ten options。”
ordinal
以序数形式朗读文本。
朗读为“Select the third option.”
number_digit
以一系列单个数字的形式朗读文本。
读作“1 2 3 4 5 6 7 8 9”。
fraction
以分数形式朗读文本。
朗读为“three eighths of an inch.”
date
以日期形式朗读文本。format 属性指定日期格式(d=日,m=月,y=年)。
朗读为“Today is October twelfth two thousand sixteen.”
朗读为“Today is December tenth two thousand sixteen.”
time
以时间形式朗读文本。format 属性指定时间是使用 12 小时制 (hms12) 还是 24 小时制 (hms24) 指定的。请使用冒号分隔表示小时、分钟和秒的数字。下面是一些有效时间示例:12:35、1:14:32、08:15 和 02:50:45。
朗读为“The train departs at four A M.”
duration
此文本朗读为持续时间。format 属性指定持续时间的格式(h=小时、m=分钟和 s=秒)。
发音为“一小时十八分三十秒”。
发音为“一分八秒”。
此标记仅支持英语和西班牙语。
telephone
此文本朗读为电话号码。
朗读为“My number is area code eight eight eight five five five one two one two.”
currency
此文本朗读为货币。
朗读为“ninety-nine US dollars and ninety cents。”
unit
文本作为一个单元进行朗读。
作为“十米”。
address
以地址形式朗读文本。
朗读为:“I'm at 150th court north east redmond washington.”
name
此文本朗读为人名。
发音为 [æd]。
在中文姓名中,某些字符出现在姓氏中时发音不同。例如,语音合成引擎在以下示例中将“仇”
发音为 [qiú] 而非 [chóu]。
注意事项
- SSML标签必须正确闭合
- 除了SSML标签外,内容中不可以出现<>符号,否则会生成失败
- 某些标签可能只支持特定语言
- 不同的语音合成引擎对SSML的支持程度可能有所不同