买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供一种机器人目标导航方法及装置,该方法包括:从待导航机器人在当前时刻之前预设时间段内各时刻的视觉观测数据中提取待导航机器人的视觉特征,并确定待导航机器人在预设时间段内各时刻接收的目标类别的语义嵌入信息,预设时间段包括当前时刻;根据当前时刻对应的语义嵌入信息对演员‑评论员算法中演员策略网络训练后的权重进行偏置,得到演员策略网络的最终权重;根据预设时间段内各时刻对应的视觉特征、语义嵌入信息和待导航机器人在预设时间段内除当前时刻以外各时刻的动作,基于最终权重对应的演员策略网络得到待导航机器人在当前时刻的动作。本发明实现提高机器人对未见类别的目标导航准确性。
主权项:1.一种机器人目标导航方法,其特征在于,包括:从待导航机器人在当前时刻之前预设时间段内各时刻的视觉观测数据中提取所述待导航机器人的视觉特征,并确定所述待导航机器人在所述预设时间段内各时刻接收的目标类别的语义嵌入信息,所述预设时间段包括所述当前时刻;根据所述当前时刻对应的语义嵌入信息对演员-评论员算法中演员策略网络训练后的权重进行偏置,得到所述演员策略网络的最终权重;根据所述预设时间段内各时刻对应的视觉特征、语义嵌入信息和所述待导航机器人在所述预设时间段内除当前时刻以外各时刻的动作,基于所述最终权重对应的演员策略网络得到所述待导航机器人在所述当前时刻的动作;所述演员-评论员算法通过将机器人样本在所述预设时间段内各时刻的视觉观测数据和目标类别作为样本,将所述机器人样本对应的动作作为标签进行训练得到;其中,所述根据所述预设时间段内各时刻对应的视觉特征、语义嵌入信息和所述待导航机器人在所述预设时间段内除当前时刻以外各时刻的动作,基于所述最终权重对应的演员策略网络得到所述待导航机器人在所述当前时刻的动作,包括:将所述预设时间段内各时刻对应的视觉特征、语义嵌入信息和所述各时刻的前一时刻对应的动作进行拼接,得到所述各时刻对应的导航信息;根据所述预设时间段内各时刻对应的导航信息,基于所述最终权重对应的演员策略网络得到所述待导航机器人在所述当前时刻的动作;其中,所述根据所述预设时间段内各时刻对应的导航信息,基于所述最终权重对应的演员策略网络得到所述待导航机器人在所述当前时刻的动作,包括:将所述预设时间段内所有时刻对应的导航信息输入时序卷积神经网络,得到所述时序卷积神经网络输出的所述待导航机器人在所述当前时刻的动作。
全文数据:
权利要求:
百度查询: 中国科学院自动化研究所 机器人目标导航方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。