买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请涉及智能机器人控制领域,其具体地公开了一种基于视觉听觉融合的智能控制方法、系统和电子设备,将待监测工作人员在工作过程中的监控视频以及待监测工作人员在工作过程中的语音信号作为输入数据,通过深度学习技术中的卷积神经网络模型分别对二者进行卷积编码之后得到工作人员动作变化特征向量和工作人员语音特征向量。也就是,输入数据通过深度学习技术处理之后得到两个更加准确地特征表示。然后融合并分析这两个特征向量以获取分类结果。这样,通过视觉听觉融合的多模态特征分析方法,能够更加全面地监测到工作人员的指令操作,从而实现机器人与工作人员的协同操作和交互。
主权项:1.一种基于视觉听觉融合的智能控制方法,其特征在于,包括:采集待监测工作人员在工作过程中的监控视频以及待监测工作人员在工作过程中的语音信号;分别获取所述待监测工作人员在工作过程中的监控视频的特征信息以及所述待监测工作人员在工作过程中的语音信号的特征信息以得到工作人员动作变化特征向量和工作人员语音特征向量;基于所述工作人员动作变化特征向量和所述工作人员语音特征向量,以得到分类结果。
全文数据:
权利要求:
百度查询: 武汉晟桥科技有限公司 基于视觉听觉融合的智能控制方法、系统和电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。