Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种数字人语音交互抗干扰方法、系统、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州倚澜科技有限公司

摘要:本发明属于自然语言处理技术领域,公开一种数字人语音交互抗干扰方法、系统、设备及介质,该方法包括:捕获音频信号,并通过语音预处理,优化音频信号的语音质量与采样率;基于文本数据,构建语言模型,并引入热词加权与自学习机制,训练语言模型的热词概率与泛化能力;实时识别音频信号中的流式语音,并提取流式语音中的关键词,捕捉及响应与关键词匹配的用户意图;将流式语音转换为文本字符串,通过动态滑动窗口匹配,识别意图匹配成功率,并在匹配成功后,下发数字人控制命令。本发明通过先进技术的集成和优化,提高语音识别的准确性和鲁棒性,显著改善数字人在噪声环境下的语音交互性能,从而提供更加流畅和自然的用户体验。

主权项:1.一种数字人语音交互抗干扰方法,其特征在于,包括:捕获音频信号,并通过语音预处理,优化音频信号的语音质量与采样率;基于文本数据,构建语言模型,并引入热词加权与自学习机制,训练语言模型的热词概率与泛化能力;实时识别音频信号中的流式语音,并提取流式语音中的关键词,捕捉及响应与关键词匹配的用户意图;将流式语音转换为文本字符串,通过动态滑动窗口匹配,识别意图匹配成功率,并在匹配成功后,下发数字人控制命令;所述基于文本数据,构建语言模型,并引入热词加权与自学习机制,训练语言模型的热词概率与泛化能力包括:收集文本数据,建立包含热词与重点语句的热词数据库;选取实时语音识别模型作为基础,构建初始模型;将所述文本数据按照预设比例划分为训练集、验证集与测试集,并设定输入文本序列,输入至所述初始模型;通过参数计算与迭代训练,得到语言模型;引入热词的加权系数,调整所述热词数据库中每个热词的出现频率,并计算调整后的热词概率分布,以及归一化后的热词概率分布;引入自学习机制,利用新的识别数据对所述语言模型进行增量训练;并基于训练识别结果,分析高频热词,定期更新训练集,重新训练所述语言模型。

全文数据:

权利要求:

百度查询: 杭州倚澜科技有限公司 一种数字人语音交互抗干扰方法、系统、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。