买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请公开了语音合成的输入音素的训练方法、装置及获得方法,训练方法包括:将中文文本中的中文句子拆分成汉字;将汉字转化成拼音,该拼音包括声调;将拼音转化为音素;将汉字、音素和声调输入词嵌入模型,获得汉字向量、音素序列向量和声调向量;形成拼音向量,单个拼音向量与对应的汉字向量及其声调向量存在一一对应关系。本申请训练和获得的输入音素包含了汉字的信息和拼音的结构信息以及声调信息,作为语音合成模型的输入,因此语音合成模型无需对汉字、拼音和声调之间的对应关系进行训练。
主权项:1.一种语音合成的输入音素的训练方法,其特征在于,包括:将中文文本中的中文句子拆分成汉字;将汉字转化成拼音,该拼音包括声调;将拼音转化为音素;将汉字、音素和声调输入词嵌入模型,获得汉字向量、音素序列向量和声调向量,形成汉字向量集、音素序列向量集和声调向量集;单个拼音向量与对应的汉字向量及其声调向量存在一一对应关系;汉字向量集与声调向量集之间存在一一对应关系;依据音素所在的拼音确定音素间的关联关系,并根据音素间的关联关系将多个音素向量组合起来形成单个拼音向量,形成拼音向量集;其中,同一个汉字向量和同一个声调向量的数量是1-4个;其中,按照单个拼音向量包含的音素的数量对汉字向量和声调向量进行复制,使汉字向量的数量、声调向量的数量与音素的数量相同,并将这些汉字向量、声调向量与该单个拼音向量建立对应关系;其中,汉字向量集、声调向量集、拼音向量集作为语音合成模型的输入音素,输入音素包含了汉字的信息和拼音的结构信息以及声调信息,语音合成模型无需对汉字、拼音和声调之间的对应关系进行训练。
全文数据:
权利要求:
百度查询: 恒信东方文化股份有限公司 语音合成的输入音素的训练方法、装置及获得方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。