恭喜湘潭大学李明富获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜湘潭大学申请的专利一种基于深度强化学习与导纳控制的机器人轴孔装配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115674204B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211369853.3,技术领域涉及:B25J9/16;该发明授权一种基于深度强化学习与导纳控制的机器人轴孔装配方法是由李明富;邓旭康;谭雅斌;姜瑞森;张黎明;刘振宇设计研发完成,并于2022-11-03向国家知识产权局提交的专利申请。
本一种基于深度强化学习与导纳控制的机器人轴孔装配方法在说明书摘要公布了:本发明提供了一种基于深度强化学习与导纳控制的机器人轴孔装配方法,属于智能制造领域;本发明针对单轴孔搜孔阶段与多轴孔搜孔阶段,分别设计深度强化学习网络Ⅰ和深度强化学习网络Ⅱ来训练搜孔动作的输出,同时在此过程中加入搜孔先验知识,来提高深度强化学习网络的探索训练效率;针对单轴孔插孔阶段与多轴孔插孔阶段,设计基于深度强化学习网络Ⅲ的变导纳控制方法来实现机器人顺利的插孔,同时加入插孔先验知识,若状态为先验状态则直接输出机器人调整姿态,如不是则输入到深度强化学习网络Ⅲ进行训练,提高了机器人插孔的效率;采用本发明的技术方案,通过深度强化学习网络的训练,输出调整策略,可以控制机器人完成单轴孔与多轴孔的装配。
本发明授权一种基于深度强化学习与导纳控制的机器人轴孔装配方法在权利要求书中公布了:1.一种基于深度强化学习与导纳控制的机器人轴孔装配方法,其特征在于,包括以下步骤:步骤1、将机器人轴孔装配分为三个阶段:孔外自由近孔阶段、孔边搜孔阶段、孔内插孔阶段;同时,区分机器人单轴孔装配与多轴孔装配的方法;步骤2、通过视觉定位的方式,对装配孔进行粗定位,控制机器人运动,使得机器人末端工件到达孔边的位置,机器人进入装配的孔边搜孔阶段;步骤3、孔边搜孔阶段中,首先设计基于人类搜孔经验的搜孔先验知识,预设先验状态与先验动作,组成先验知识记忆库,其次采集机器人的力力矩信息与位姿信息,作为深度强化学习网络的输入,通过先验状态分类模型判断该输入是否为先验知识,若是,则直接输出相应的动作,如不是则输入到深度强化学习网络进行探索与训练,输出机器人位置或姿态的调整策略动作,使得机器人末端的工件能顺利的搜孔;分别构建针对单轴孔搜孔的深度强化学习网络I与针对多轴孔装配的深度强化学习网络II;步骤4、针对孔边搜孔阶段的深度强化学习网络,设计奖惩函数、训练回合数以及每个回合训练的最大步数;利用深度强化学习网络I与深度强化学习网络II分别对单轴孔搜孔与多轴孔搜孔进行探索训练,直至每回合的步数收敛以及奖励值也收敛;步骤5、孔内插孔阶段,在机械臂末端Z轴方向设定恒定的期望力,其余方向上的力与力矩都为0,同时使机器人末端朝着设定的期望位置运动,采集插孔过程中机器人末端力力矩信息,将采集到的机器人末端力力矩与设定的期望力做比较,得到实时的力偏差;将力偏差输入到导纳控制器中,经导纳控制算法计算,输出机器人末端工件的调整姿态;同时通过深度强化学习算法实时优化导纳控制参数,实现变导纳控制;步骤6、设计基于人类插孔经验的插孔先验知识记忆库,包括先验状态与先验经验值,通过构建分类器对深度强化学习网络的输入状态进行甄别,若输入状态为先验状态,则直接输出相对应的先验经验值,继而直接控制机器人工件末端运动;若输入状态不是先验状态,则送入深度强化学习网络中进行训练,得到导纳控制参数;定义需要训练的导纳控制参数,并且对导纳控制算法仿真,通过选择不同的导纳控制参数进行仿真,确定需要训练的导纳控制参数,预先确定导纳控制参数变化范围;步骤7、构建用于变导纳控制的可以输出连续动作的深度强化学习网络III,采集插孔过程中的力力矩信号、位姿信号,作为深度强化学习的状态输入,深度强化学习网络的输出为导纳控制的参数;设计深度强化学习网络III的奖惩函数,训练回合数,每回合训练的最大步数;步骤8、在孔内插孔阶段,设定机器人末端到达一定的插孔深度且各轴力力矩在一定的阈值范围内代表插孔成功。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湘潭大学,其通讯地址为:411105 湖南省湘潭市雨湖区湘潭大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。