买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:世优(北京)科技股份有限公司
摘要:本发明公开了一种基于场景的语音识别方法及装置。其中,该方法包括:获取待识别语音信号的语音编码特征;获取与待识别语音信号的应用场景对应的场景关键词,并基于场景关键词生成包含上下文依赖的场景特征向量;通过多层双向神经网络,逐层使用不同深度的上下文特征,来从场景特征向量中提取出与场景关键词相关的深层隐层特征;基于动态注意力机制,将深层隐层特征与语音编码特征进行融合处理,生成包含场景关键词的融合特征;基于融合特征,通过分类器计算出待识别语音信号的语音单元的概率分布,并基于概率分布对语音单元进行分类;根据语音单元的分类结果,对待识别语音信号进行语音识别。本发明解决了现有技术中语音识别不准确的技术问题。
主权项:1.一种基于场景的语音识别方法,其特征在于,包括:获取待识别语音信号,并对所述待识别语音信号进行预处理以生成语音编码特征;获取与所述待识别语音信号的应用场景对应的场景关键词,并基于所述场景关键词生成包含上下文依赖的场景特征向量;通过多层双向神经网络,逐层使用不同深度的上下文特征,来从所述场景特征向量中提取出与所述场景关键词相关的深层隐层特征;基于动态注意力机制,将所述深层隐层特征与所述语音编码特征进行融合处理,生成包含所述场景关键词的融合特征;基于所述融合特征,通过分类器计算出所述待识别语音信号的语音单元的概率分布,并基于所述概率分布对所述语音单元进行分类;根据所述语音单元的分类结果,对所述待识别语音信号进行语音识别,得到识别后的语音结果。
全文数据:
权利要求:
百度查询: 世优(北京)科技股份有限公司 基于场景的语音识别方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。