买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请公开了一种多模态融合的人机交互意图理解方法及系统。其实现步骤为:麦克风捕获语音,再转换为文字;摄像头捕获帧序列;文字与帧序列通过判断门判断输入是否为空;如果内容为文字,则文字通过特征提取模块,得到文本特征;如果为文字与帧序列,则帧序列通过门控模块判断手势类型;如果为动态手势,则帧序列通过网络提取特征,与文本特征通过特征融合模块进行融合;如果为静态手势,则静态手势通过特征提取模块提取特征,与文本特征通过融合网络进行融合;如果输入内容为动态手势,则帧序列通过时间空间特征网络;最终进行意图分类。本发明形成一个完整的多模态融合网络,作为机器人进行意图理解的重要过程,可以更好提高意图理解准确率。
主权项:1.一种多模态融合的人机交互意图理解方法,其特征在于,所述方法包括:数据的预处理,并将预处理后的数据输入到判断门;若帧序列内容非空,将帧序列输入到门控模块,判断手势类型;动态手势通过特征提取网络提取动态手势的时间与空间信息;静态手势通过边缘特征提取网络提取特征;文字通过TransformerTextEncoder提取文本特征;将得到的特征通过多模态融合模块进行特征融合,并通过MLP进行意图的输出。
全文数据:
权利要求:
百度查询: 济南大学 多模态融合的人机交互的意图理解方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。