基于混合专家的多方言语音识别模型、训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：昆明理工大学

摘要：本发明提供基于混合专家的多方言语音识别模型、训练方法，属自然语言处理领域。模型包括通用编码器、方言编码器、声学融合模块、注意力解码器和CTC解码器；通用编码器由12层的DialectMoe编码器块组成，负责以方言无关的方式捕获语音信息；方言编码器由6层Conformer编码器组成，从特征序列中捕获方言信息；声学融合模块用于将通用编码器和方言编码器的输出进行声学融合；注意力解码器用于根据声学融合模块的输出计算注意力损失并解码出文本；CTC解码器用于根据通用编码器的输出计算CTC损失并解码出文本。本发明所提出的模型在低资源下多方言语音识别中表现出了优异的性能。

主权项：1.基于混合专家的多方言语音识别模型，其特征在于：包括通用编码器、方言编码器、声学融合模块、注意力解码器和CTC解码器；所述通用编码器由12层的DialectMoe编码器块组成，负责以方言无关的方式捕获语音信息；所述方言编码器由6层Conformer编码器组成，从特征序列中捕获方言信息；所述声学融合模块用于将通用编码器和方言编码器的输出进行声学融合；所述注意力解码器用于根据声学融合模块的输出计算注意力损失并解码出文本；所述CTC解码器用于根据通用编码器的输出计算CTC损失并解码出文本。

全文数据：

权利要求：

百度查询：昆明理工大学基于混合专家的多方言语音识别模型、训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：储能变流器及储能系统

下一篇：一种水库运行管理与安全评价系统及安全评价方法

相关技术

储能变流器及储能系统

一种水库运行管理与安全评价系统及安全评价方法

用于对数据中心的PUE值的预测方法及系统

一种BODIPY类化合物、制备方法及其应用

一种基于机场场面空地互联的虚拟交通灯系统

用于工业环境中对象的质量评估的方法和系统

一种低硬度彩色天然橡胶材料及其制备方法

化合物、有机电致发光元件用材料、有机电致发光元件和电子设备

一种炉头自动生产线及其工艺

一种塑料导气管成型设备

一种铸造用固化剂及其制备方法和使用方法

超临界CO₂腐蚀测试系统的样品加载装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于混合专家的多方言语音识别模型、训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务