恭喜浙江大学张建明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江大学申请的专利行人环境下基于深度强化学习的机器人路径避碰规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116360454B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310437715.2,技术领域涉及:G05D1/43;该发明授权行人环境下基于深度强化学习的机器人路径避碰规划方法是由张建明;曹晋瑜;朱骞;朱科设计研发完成,并于2023-04-18向国家知识产权局提交的专利申请。
本行人环境下基于深度强化学习的机器人路径避碰规划方法在说明书摘要公布了:本发明公开了一种行人环境下基于深度强化学习的机器人路径避碰规划方法,属于深度学习与移动机器人导航技术领域。本发明融合多种碰撞算法生成由行人状态构成的行人轨迹数据集,利用编解码器对行人状态编解码后,与由马尔可夫元组获得的机器人当前状态与观测共同作为深度神经网络的输入,生成机器人的状态‑动作价值对的估计值;利用动作神经网络输出当前状态下机器人选择的最优动作,利用评价神经网络对机器人的状态‑动作进行打分,基于强化学习迭代训练。本发明在执行阶段,采用激光雷达获取周围环境数据,实现移动机器人在行人环境下的安全导航,有效解决了动态环境下机器人导航的短视与遮挡问题,提高了机器人避障行为的安全性、时效性。
本发明授权行人环境下基于深度强化学习的机器人路径避碰规划方法在权利要求书中公布了:1.行人环境下基于深度强化学习的机器人路径避碰规划方法,其特征在于包括以下步骤: S1:以机器人与人在当前时刻状态定义状态空间;根据状态空间,将机器人与行人之间的相互观测建模为部分可观测马尔可夫元组; S2:设置多步代理阶段奖励函数,包括对机器人与动态障碍物碰撞的惩罚、对机器人与动态障碍物距离的约束、与目标点距离的惩罚、以及时间代价; 所述的多步代理阶段奖励函数如下: 其中,N表示多步代理阶段奖励函数的总步数,rt表示第t步的奖励,T表示导航过程中的总决策次数,γ表示折扣率,k表示当前步数; S3:根据行人的动作空间,基于碰撞算法随机生成由行人状态构成的行人轨迹数据集; S4:将行人轨迹数据集输入编解码器网络,提取行人运动特征; S5:根据行人运动特征、由部分可观测马尔可夫元组获得的机器人当前状态与观测,利用深度学习网络对机器人的状态-动作价值对进行估计; S6:利用动作神经网络根据机器人的状态-动作价值对的估计值,输出当前状态下机器人选择的最优动作,利用评价神经网络对机器人的状态-动作进行打分,利用强化学习迭代训练,结合多步代理阶段奖励函数,更新优化编解码器网络、深度学习网络、动作神经网络和评价神经网络的参数; S7:在机器人路径避碰规划过程中,获取周围环境数据,首先利用训练后的编解码器网络对行人状态编码得到行人运动特征;再根据行人运动特征、由部分可观测马尔可夫元组获得的机器人当前状态与观测,利用训练后的深度学习网络对机器人的状态-动作价值对进行估计;最后通过训练后的动作神经网络输出当前状态下的最优动作,实现在动态行人环境下的安全导航。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。