首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种多机械臂多目标寻找的训练方法及训练装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京云创大数据科技股份有限公司

摘要:本发明属于机械臂设计技术领域,提供了一种多机械臂多目标寻找的训练方法、方法及训练装置。所述训练方法包括:基于聚类算法对各机械臂与各目标进行匹配,并基于固定轨迹规划算法对各机械臂进行轨迹规划以使其寻找到与之匹配的各目标;进而以规划后的轨迹作为各相应机械臂的预训练经验;以所述预训练经验作为相应机械臂积累的先验知识,并基于强化学习算法进行机械臂与目标间的交互迭代训练直至到达预设的迭代阈值;进而获得训练后的各机械臂;其中,所述强化学习算法中的奖励函数包括:第一奖励函数、第二奖励函数及第三奖励函数。本发明确保了基于强化学习算法进行多机械臂多目标寻找时的快速收敛,从而满足当前工业场景对机械臂的新需求。

主权项:1.一种多机械臂多目标寻找的训练方法,其特征在于,包括:基于聚类算法对各机械臂与各目标进行匹配,并基于固定轨迹规划算法对各机械臂进行轨迹规划以使其寻找到与之匹配的各目标;进而以规划后的轨迹作为各相应机械臂的预训练经验;以所述预训练经验作为相应机械臂积累的先验知识,并基于强化学习算法进行机械臂与目标间的交互迭代训练直至到达预设的迭代阈值,进而获得训练后的各机械臂;其中,所述强化学习算法中的奖励函数包括:第一奖励函数、第二奖励函数及第三奖励函数,所述第一奖励函数用于表示任意两个机械臂发生碰撞,所述第二奖励函数用于表示任一机械臂单独寻找到目标,且其他机械臂未发生碰撞;所述第三奖励函数用于表示所有机械臂均寻找到目标;所述第一奖励函数、所述第二奖励函数及所述第三奖励函数均包括第一奖励项及第二奖励项,所述第一奖励项包括距离惩罚项及时间惩罚项,所述第二奖励项包括动作惩罚项;所述距离惩罚项包括所述机械臂的末端至预设目标间的欧式距离;所述时间惩罚项包括所述机械臂执行当前时刻最优的各关节的转动量及转动速度时的消耗时长;所述动作惩罚项包括所述机械臂执行当前时刻最优的各关节的转动量及转动速度后其与自身起点间的相对位置。

全文数据:

权利要求:

百度查询: 南京云创大数据科技股份有限公司 一种多机械臂多目标寻找的训练方法及训练装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。