首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于轨迹跟踪的深度强化学习局部路径规划方法 

申请/专利权人:西南大学

申请日:2024-03-13

公开(公告)日:2024-06-28

公开(公告)号:CN118259671A

主分类号:G05D1/43

分类号:G05D1/43;G05D1/242;G05D1/246;G05D1/633;G05D1/644;G05D1/247;G05D1/648;G05D109/10

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本发明公开了一种基于轨迹跟踪的深度强化学习局部路径规划方法,移动机器人通过2D激光雷达传感器增量式构建周围环境的栅格地图,结合一条从当前位置到达目标导航点的全局轨迹,计算机器人相对于全局轨迹的横向偏移、角度偏移以及横向偏移的变化量,并利用深度强化学习PPO算法得到线速度、角速度控制信号,实现机器人对全局轨迹的跟踪,同时提供一种减少控制信号振荡的方法,与现有技术相比较,本发明实现了机器人无碰撞完成导航任务,具备躲避动态和静态障碍物能力,并且相较于传统方法轨迹更加平滑。

主权项:1.一种基于轨迹跟踪的深度强化学习局部路径规划方法,其特征在于:包所述路径规划包括以下步骤:步骤1:设置机器人起始位置和导航目标点,利用2D激光雷达采集当前时刻周围环境的点云数据,构建栅格地图;步骤2:根据栅格地图、机器人起始位置和导航目标点,确定一条能到达目标点的全局路径;步骤3:找到当前时刻机器人距离全局路径最近的点,计算横向偏移、横向偏移变化量和角度偏移;步骤4:将横向偏移、角度偏移、上一时刻机器人的速度、角速度,以及2D激光雷达传感器观测数据,输入PPO算法,经过PPO算法进行优化求解得到当前时刻的线速度、角速度输出,并发布给机器人执行;步骤5:机器人根据设定的线速度和角速度前进一定时间,计算当前时刻横向偏移惩罚、横向偏移变化奖励、角度偏移惩罚、碰撞惩罚,进一步加权计算当前时刻综合奖励,反馈至PPO算法进行梯度更新;步骤6:判断是否发生碰撞或超过最大步数或到达目标点,若都不是,则将重复步骤1至步骤5,否则将判断网络是否收敛,若不是,则重置训练环境,重复步骤1至步骤5,否则视为训练完成,退出环境。

全文数据:

权利要求:

百度查询: 西南大学 一种基于轨迹跟踪的深度强化学习局部路径规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。