首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

生成和使用用于关键词检出系统的文本到语音数据和语音识别系统中的说话者适配 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:微软技术许可有限责任公司

摘要:提供了用于生成和使用文本到语音TTS数据以供改进的语音识别模型的系统、方法和设备。利用关键词无关的基线训练数据来训练主模型。在一些实例中,利用新的TTS训练数据来修改主模型的声学和语言模型子组件。在一些实例中,新的TTS训练是从用于在基线训练数据中代表不足的关键词的多说话者神经TTS系统获得的。在一些实例中,新的TTS训练数据被用于关键词检出KWS应用中的发音学习和关键词相关置信评分的归一化。在一些实例中,新的TTS训练数据被用于语音识别模型中的快速说话者适配。

主权项:1.一种被配置成利用文本到语音数据修改机器学习模型的计算系统,所述机器学习模型被用于语音识别,其中所述计算系统包括:一个或多个处理器;以及一个或多个计算机可读硬件存储设备,所述一个或多个计算机可读硬件存储设备存储计算机可执行指令,所述计算机可执行指令被构造成由所述一个或多个处理器执行以致使所述计算系统至少:标识利用基线训练数据训练的主模型,所述主模型包括声学模型和语言模型,所述声学模型和所述语言模型是所述主模型的子组件;获得新的文本到语音TTS训练数据;以及利用所述新的TTS训练数据修改所述主模型的至少所述声学模型和所述语言模型,以降低在执行语音识别时所述主模型的语音识别误差;其中计算机可执行指令的所述执行进一步致使所述计算系统执行关键词的发音学习,其中所述计算系统被致使:构造解码图,所述解码图包括自由音素循环;使用所述主模型和所述新的TTS训练数据从所述自由音素循环解码音素序列,其中经解码的音素序列对应于所述关键词的发音;基于频率计数执行发音投票和选择;以及将所述关键词的所选择的发音添加到所述解码图。

全文数据:

权利要求:

百度查询: 微软技术许可有限责任公司 生成和使用用于关键词检出系统的文本到语音数据和语音识别系统中的说话者适配

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术