首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

使用跨语言音素映射的语音生成 

申请/专利权人:谷歌有限责任公司

申请日:2018-10-11

公开(公告)日:2024-07-05

公开(公告)号:CN112334974B

主分类号:G10L13/08

分类号:G10L13/08;G10L13/047;G10L13/06

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2021.02.26#实质审查的生效;2021.02.05#公开

摘要:可以通过利用通用音素集来生成跨语言自然语言文本数据流的计算机生成的语音。在各种实施方式中,所述自然语言文本数据流包括采用主要语言的主要语言部分以及不是采用所述主要语言的次要语言部分。可以从通用数据集中的一组音素确定对应于所述次要语言部分的音素。可以将这些音素映射回所述主要语言的一组音素。可以使用与所述主要语言相关联的音素生成这些音素的音频数据,以读出所述自然语言文本数据流的所述次要语言部分。

主权项:1.一种用于从自然语言文本数据流生成计算机生成的语音的方法,所述方法由一个或多个处理器实施并且包括:接收自然语言文本数据流,所述自然语言文本数据流将被转换成计算机生成的语音以经由计算装置的一个或多个扬声器渲染给用户,其中,所述自然语言文本数据流包括采用分配给所述用户的主要语言的主要部分,以及不是采用分配给所述用户的所述主要语言的次要语言部分;确定所述自然语言文本数据流的所述次要语言部分是否采用未作为所述用户的熟悉语言分配的次要语言;处理所述自然语言文本数据流的所述主要部分,以确定分配给所述主要语言并且对应于所述主要部分的第一组音素;处理所述自然语言文本数据流的次要部分,以确定对应于所述次要部分的通用音素集中的第二组音素,其中,所述通用音素集至少包括对应于所述主要语言和所述次要语言的音素;响应于确定所述次要语言部分采用未作为所述用户的熟悉语言分配的所述次要语言:将对应于所述次要部分并且不是用于所述主要语言的一个或多个第二音素映射到采用所述主要语言的一个或多个相关音素,其中,将所述一个或多个第二音素映射到所述一个或多个相关音素基于所述通用音素集中的音素与主要语言音素之间的定义映射;通过用采用所述主要语言的所述相关音素代替所述第二组音素中的所述一个或多个第二音素,来生成修改的第二组音素;处理所述第一组音素和所述修改的第二组音素,以生成模仿说所述第一组音素和所述修改的第二组音素的人类说话者的音频数据;以及使所述音频数据经由所述计算装置的所述一个或多个扬声器被渲染。

全文数据:

权利要求:

百度查询: 谷歌有限责任公司 使用跨语言音素映射的语音生成

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。