利用联合语言标识的流式端到端多语言语音识别

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：一种方法400包括接收声学帧序列110作为对自动语音识别ASR模型200的输入。所述方法还包括由第一编码器210针对对应的声学帧生成第一高阶特征表示212。所述方法还包括由第二编码器220针对对应的第一高阶特征表示生成第二高阶特征表示222。所述方法还包括由语言标识ID预测器230基于第一高阶特征表示和第二高阶特征表示的串联231来生成语言预测表示232。所述方法还包括由第一解码器240a基于第二高阶特征表示和语言预测表示的串联来生成在可能的语音识别预测文本上的第一概率分布120a。

主权项：1.一种多语言自动化语音识别ASR模型200，其特征在于，包括：第一编码器210，所述第一编码器被配置为：接收声学帧序列110作为输入；以及在多个输出步骤中的每一处针对所述声学帧序列110中的对应的声学帧110生成第一高阶特征表示212；第二编码器220，所述第二编码器被配置为：接收由所述第一编码器210在所述多个输出步骤中的每一处生成的所述第一高阶特征表示212作为输入；以及在所述多个输出步骤中的每一处针对对应的第一高阶特征表示212生成第二高阶特征表示222；语言标识ID预测器230，所述语言标识预测器被配置为：接收由所述第一编码器210在所述多个输出步骤中的每一处生成的所述第一高阶特征表示212和由所述第二编码器220在所述多个输出步骤中的每一处生成的所述第二高阶特征表示222的串联231作为输入；以及在所述多个输出步骤中的每一处生成语言预测表示232；以及第一解码器240a，所述第一解码器被配置为：接收由所述第二编码器220在所述多个输出步骤中的每一处生成的所述第二高阶特征表示222和由所述语言ID预测器230在所述多个输出步骤中的每一处生成的所述语言预测表示232的串联作为输入；以及在所述多个输出步骤中的每一处生成在可能的语音识别预测文本上的第一概率分布120a。

全文数据：

权利要求：

百度查询：谷歌有限责任公司利用联合语言标识的流式端到端多语言语音识别

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

相关技术

相关技术

相关技术

相关技术

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

利用联合语言标识的流式端到端多语言语音识别

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务