多模态融合的人机交互的意图理解方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本申请公开了一种多模态融合的人机交互意图理解方法及系统。其实现步骤为：麦克风捕获语音，再转换为文字；摄像头捕获帧序列；文字与帧序列通过判断门判断输入是否为空；如果内容为文字，则文字通过特征提取模块，得到文本特征；如果为文字与帧序列，则帧序列通过门控模块判断手势类型；如果为动态手势，则帧序列通过网络提取特征，与文本特征通过特征融合模块进行融合；如果为静态手势，则静态手势通过特征提取模块提取特征，与文本特征通过融合网络进行融合；如果输入内容为动态手势，则帧序列通过时间空间特征网络；最终进行意图分类。本发明形成一个完整的多模态融合网络，作为机器人进行意图理解的重要过程，可以更好提高意图理解准确率。

主权项：1.一种多模态融合的人机交互意图理解方法，其特征在于，所述方法包括：数据的预处理，并将预处理后的数据输入到判断门；若帧序列内容非空，将帧序列输入到门控模块，判断手势类型；动态手势通过特征提取网络提取动态手势的时间与空间信息；静态手势通过边缘特征提取网络提取特征；文字通过TransformerTextEncoder提取文本特征；将得到的特征通过多模态融合模块进行特征融合，并通过MLP进行意图的输出。

全文数据：

权利要求：

百度查询：济南大学多模态融合的人机交互的意图理解方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种二胺、聚酰胺酸、聚酰亚胺、液晶取向剂及液晶取向膜

下一篇：一种大承重的手术室机械臂

相关技术

一种二胺、聚酰胺酸、聚酰亚胺、液晶取向剂及液晶取向膜

一种大承重的手术室机械臂

业务请求的业务分表查询方法、装置、设备及存储介质

低温红外焦面高精度、低热串扰、集成式杜瓦封装结构

一种用于热处理的可拆卸支架

多层包覆富锂锰正极材料及其制备方法、正极片和电池

具有抗腐蚀钝化膜的Fe-Cr-Si合金及制备方法

显示面板及显示装置

基于GPT的加弹机数字孪生机理模型构建方法及系统

一种基于PLC的安检输送线

一种贝壳破裂纹高效破裂装置及贝壳加工系统

一种全氟异丁基甲醚的制备方法

意图相关技术

基于意图识别的车道保持纠偏方法、系统、设备和介质_浙江智马达智能科技有限公司_202411376227.6

集成开发环境中的语音意图理解与智能化软件协作方法_同济大学_202411171255.4

基于政务大模型的意图识别方法及装置、介质、设备_浪潮云信息技术股份公司_202411195785.2

用户行为解耦与意图学习的推荐方法及系统_上海大学_202411201138.8

一种基于目标航迹分类的意图识别方法和装置_中国船舶集团有限公司第七〇九研究所_202410958457.7

意图识别模型的动态训练方法、装置、设备和存储介质_中兴通讯股份有限公司_201810658950.1

一种基于行驶意图与环境的AMT换挡自适应控制方法_徐州徐工传动科技有限公司_202411198249.8

一种基于眼动与脑电结合的意图判断方法、装置、设备及介质_上海韶脑传感技术有限公司_202411098892.3

用户意图决策模型的训练方法和使用方法_恒银金融科技股份有限公司_202410953913.9

一种基于双层车道意图推断的目标车辆轨迹预测方法_北京航空航天大学_202411205254.7

人机交互相关技术

人机交互的中药材智能巡检系统、方法及装置_北京市农林科学院信息技术研究中心_202411099694.9

一种基于人工智能的自助购票人机交互方法及系统_武汉市丰谊商务国际旅行社有限公司_202411137000.6

应用于问答的人机交互方法、装置、设备及存储介质_北京百度网讯科技有限公司_202411237138.3

一种基于深度学习和人机交互的机械臂控制方法和系统_北京理工大学_202411353138.X

一种考虑人机交互的下肢康复外骨骼机器人最优约束跟随控制方法_安徽大学_202411215261.5

一种基于人机对话交互数据的智能择校系统_北京学橙归来科技有限公司_202311448607.1

直播设备交互系统_北京纽曼凤凰科技有限公司_202221483469.1

基于点云的6-DOF人机协作姿态规划与类人交互运动生成方法_北京工业大学_202410003701.4

无人机状态检测方法、无人机控制装置和无人机_浙江华视智检科技有限公司_202410361942.6

交互式查看系统_微软技术许可有限责任公司_201980084195.3

理解相关技术

便于理解比对的医学影像观察灯箱_唐山弘康健康咨询服务有限公司_202420618873.8

一种用于复杂事件理解的动态假设验证方法及装置_哈尔滨工业大学_202411150973.3

一种多层语义理解大模型智能体构造及应用方法_上海熵智信息科技有限公司_202411112965.X

集成开发环境中的语音意图理解与智能化软件协作方法_同济大学_202411171255.4

一种基于大模型的教学视频理解的方法_德清阿尔法创新研究院_202410982830.2

一种处理解锁闯关控制模式的方法及装置_北京翼鸥教育科技有限公司_202411082704.8

基于多模态多形式统一的多轮图文理解与定位方法及装置_中国科学院自动化研究所_202411282777.1

视频理解、模型训练方法、装置、计算机设备及存储介质_北京通用人工智能研究院_202310632623.X

多模态融合的人机交互的意图理解方法及系统_济南大学_202411269806.0

视频理解、剧情预测、视频问答方法、装置、设备及介质_北京通用人工智能研究院_202310629127.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

多模态融合的人机交互的意图理解方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务