首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于强化学习自适应调参的无人矿卡路径跟踪控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京航空航天大学

摘要:本发明涉及路径跟踪控制领域,提出了一种基于强化学习自适应调参的无人矿卡路径跟踪控制方法,包括:S1,设计多点预瞄的纯跟踪PID底层控制器:包括由多点预瞄、纯跟踪算法和PID控制器三部分;S2,计算路径跟踪控制状态:所述跟踪控制状态数据用于底层控制器的权重系数计算及强化学习上层控制器的所述状态空间和奖励函数;S3,设计强化学习上层控制器:强化学习上层控制器用于接收车辆路径跟踪控制状态的输出,对底层控制器中的各项参数进行实时自适应调整,将调整后的各项参数输出给所述底层控制器完成对车辆转向的控制。本发明能够实时自适应调整控制参数,稳定保持高精度控制,增强无人矿卡横向控制系统安全性与可靠性的目的。

主权项:1.基于强化学习自适应调参的无人矿卡路径跟踪控制方法,其特征在于,具体步骤如下:S1、设计多点预瞄的纯跟踪PID底层控制器:由多点预瞄、纯跟踪算法和PID控制器三部分共同构成;根据车辆与期望路径之间的几何位置关系,在期望路径上选取三个预瞄路径点包括预瞄近点、预瞄中点、预瞄远点,通过纯跟踪算法计算获得每个预瞄路径点的前轮基础转角,再通过PID控制器对每个所述前轮基础转角进行补偿,补偿后得到三个预瞄路径点的前轮转角,三个所述前轮转角按照一定权重混合计算得到实际期望前轮转角;S2、计算路径跟踪控制状态:首先,根据车辆预瞄模型,基于当前车速和基础预瞄距离,计算获得实际预瞄距离;然后,基于车辆二自由度运动学模型计算路径跟踪控制状态,控制状态量包括横向偏差、方位角偏差,计算获得的所述跟踪控制状态数据用于所述底层控制器的权重系数计算及强化学习上层控制器的所述状态空间和奖励函数;S3、设计强化学习上层控制器:基于强化学习模型设计上层控制器,包括对所述强化学习模型中的状态空间、动作空间以及奖励函数的设计;强化学习上层控制器用于接收车辆路径跟踪控制状态的输出,对所述底层控制器中的各项参数进行实时自适应调整,将调整后的各项参数输出给所述底层控制器完成对车辆转向的控制,所述各项参数包括PID系数和预瞄近点、预瞄中点、预瞄远点的权重系数。

全文数据:

权利要求:

百度查询: 北京航空航天大学 基于强化学习自适应调参的无人矿卡路径跟踪控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。