买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京理工大学;南京长江自动化研究院有限公司;南京工业职业技术大学
摘要:本发明公开了一种林地路径规划与抗扰动自适应轨迹跟踪方法及系统,方法包括如下步骤:基于林区作业常见路面情况,定义不同路面通过系数;基于路面通过系数与坡度,设计路径代价的模糊规则;基于模糊代价,深度神经网络(DQN)与边界惩罚因子进行六边形地图下的A*路径规划;构建考虑扰动与前轮转角失配的车辆运动学模型;设计林地抗扰动跟踪控制系统;基于林地作业环境设计MPC控制器优化目标与模糊权重决策器;将规划出的路径作为参考路径进行轨迹跟踪。本发明具备良好的可扩展性且实现了对不同路面与行驶速度下的动态特性自适应控制。
主权项:1.一种林地路径规划与抗扰动自适应轨迹跟踪方法,其特征在于,包括:S1、根据林区常见路面情况以及对移动平台的影响,使用[0,1]之间的系数μ衡量通过林区路面的难易程度;S2、通过系数μ的论域生成7个模糊集合成员VS,S,SS,M,SL,L,VL;地形坡度θ的论域生成7个模糊集合成员NL,NM,NS,ZO,PS,PM,PL;通过系数μ和地形坡度θ间的模糊规则生成路径模糊代价λ;定义边界惩罚因子ρv;构造DQN网络,定义DQN网络打分为Qs,a,其中s为当前车辆周围环境,位置与朝向,a为DQN网络在当前状态下给出的动作,Qs,a为当前状态与动作下的预期受益;具体为:步骤S21、将系数μ的论域设置为[0,1],根据论域生成模糊集合,模糊集合成员包括VS,S,SS,M,SL,L,VL;分别代表通过系数非常小,小,较小,适中,大,非常大;步骤S22、将地形坡度θ的论域设置为[-π4,π4],模糊集合成员包括NL,NM,NS,ZO,PS,PM,PL,分别代表坡度负大,负中,负小,零,正小,正中,正大;步骤S23、根据系数μ和地形坡度θ构建模糊规则表,生成路径模糊代价;步骤S24、定义边界惩罚因子ρv; ;ρv(x,y)是(x,y)处的边界势能,α为势能的下降速度,d0(x,y)为节点到达障碍物的距离,dv(x,y)是节点到达维诺地图边的最近距离,d0max是边界势能的半径;ρv(x,y)取值从0到1,当d0>d0max时,(x,y)势能为0,势能值到达最大的时候是(x,y)在障碍物上或者里面,势能值到达最小的时候是(x,y)在广义泰森多边形的边上;步骤S25、设立移动平台对应的奖励函数,奖励如下: ;R为当前节点移动的奖励,μ为步骤S1定义的系数;步骤S26、基于奖励函数构造DQN,DQN的输入是平台周围10*10的感受野,输出为平台向周围六个节点移动的评价函数,DQN的TDtarget为: ;其中Y为TDtarget,Rt为当前行动的奖励,γ为衰减率,Qst+1,a;w为DQN在行动后的下一个状态下的打分,其中,st+1为下一个时刻的状态,w为当前DQN模型参数,a为DQN得到的动作;利用TDtarget对DQN进行训练,训练结束后,DQN对当前移动平台的6个方向进行打分,记作Qs,a;S3、构建A算法的代价函数g,构建A算法的启发函数h,由当前点与终点的六边形栅格地图坐标的距离与DQN网络打分Qs,a融合得到,构建A算法的总体代价f=g+h,利用f,g与h进行路径规划,得到最优路径;具体为:步骤S31、构建代价函数g;;其中λ为步骤S2定义的模糊代价,ρv为边界因子,N为边界增益系数,L为系数;步骤S32、构建启发函数h; ;其中q、s、r为当前点的六边形栅格地图坐标,qe、se、re为终点的六边形栅格地图坐标,ζ为栅格边长,k为坐标距离与DQN的融合系数;步骤S33、构建总体代价f=g+h进行路径规划,具体为:步骤S331、对六边形栅格地图进行初始化,确定起点与终点的位置;步骤S332、建立待搜索列表与已搜索列表,对待搜索列表进行初始化,将起点加入已搜索列表;步骤S333、开始搜索,遍历待搜索列表,选择待搜索列表中f最小的节点,将该节点移出待搜索列表,放入已搜索列表;步骤S334、将该节点设置为父节点,筛选与障碍不碰撞的子节点;步骤S335、遍历筛选出来的子节点,分别计算每个节点对应的模糊代价,DQN网络打分,边界惩罚因子,构造代价值g与启发值h,g+h得到总体代价,作为总体代价f;步骤S336、判断当前子节点是否已经在待搜索列表中:如果当前节点已经在待搜索列表中,对节点的总体代价f进行比较:如果该节点新计算的总体代价比原先计算的f更低,则分别更新该节点对应的g,h与f,并且更新该节点所属的父节点;如果相等或更高,则不更新;如果当前节点不在待搜索列表中,则将该节点的g,h与f保存在待搜索列表中,并且更新该节点所属的父节点;步骤S337、判断该节点是否为目标节点;如果是目标节点,则进入步骤S338,如果否,则跳转到步骤S333继续执行;步骤S338、输出从起点到终点的路径;S4、构建小车抗扰动失配角补偿运动学模型,状态量包括t时刻的横纵坐标偏移和角度偏移,模型输入量包括t时刻的参考转角和失配角,以及当前采样时间、线速度和角速度;具体为:构建小车抗扰动失配角补偿运动学模型: ; ; ;;;其中,为系统状态矩阵,为系统输入矩阵,为系统时刻的状态量,Uk为系统k时刻的输入量,,与分别为系统在k时刻的横纵坐标偏移与角度偏移,为k时刻的角度扰动,θr(k)与dr分别为k时刻的参考角度与失配角,vr为k时刻的参考速度,Ts为当前采样时间,vk与wk为当前车辆线速度与角速度;S5、构建路面自适应MPC控制系统,包括前馈与反馈两部分,前馈部分基于参考状态与实际状态的误差进行自适应MPC控制,控制量输出给扰动观测器和线控底盘,反馈部分将实际状态量与MPC预测状态量送入RBF扰动观测器,将观察到的静差视作前轮失配误差用以修正模型,将扰动分离并与其余状态量一并反馈MPC;设计模糊权重决策器,通过当前扰动与路面自适应车速模块产生的参考速度,选择当前MPC优化目标的权重矩阵;具体为:步骤S51、构建前馈部分,根据车辆参考状态与实际状态的误差进行自适应MPC控制,在进行滚动优化与最小二次型求解之后,将求解出的控制量输出给扰动观测器,同时将控制量输出给线控底盘;其中,扰动观测器采用RBF状态观测器;步骤S52、构建反馈部分,将当前实际状态量与MPC预测的状态量送入RBF扰动观测器,将观察到的静差视作前轮失配产生的误差用以修正模型,将扰动分离并与其余状态量一并反馈MPC控制器;步骤S53、模糊权重决策器通过当前扰动与路面自适应车速模块产生的参考速度,选择当前优化目标的权重矩阵;S6、构建MPC的优化目标函数,包含状态跟踪误差和控制量变化两项,由权重矩阵Q和R决定其比重;使用路面通过系数μ与当前小车速度v之间的模糊规则来调节权重矩阵Q和R的比值;具体为:步骤S61、构建MPC的优化目标函数,包含状态跟踪误差和控制量变化两项,由权重矩阵Q和R决定其比重;;其中与为优化目标的权重矩阵,与为当前时刻到时刻的状态量与控制量,为优化目标;步骤S62、使用路面通过系数与当前小车速度之间的模糊规则来调节权重矩阵Q和R的比值;通过控制权重矩阵的比值,调节系统的动态指标,具体为:步骤S621、小车速度v的论域为[0,10ms],生成7个模糊集合成员:VS,S,SS,M,SL,L,VL;步骤S622、权重比RQ的论域为[0,10],生成3个模糊集合成员:S,M,L,分别代表更看重收敛速度,平衡,更看重平顺度;步骤S623、根据路面情况和速度v,通过模糊规则推理得到RQ值,动态调整MPC性能;步骤S63、采用动态TSK模糊系统,使用神经网络拟合结论部分的参数;前提部分使用λ与v的模糊隶属度:λ={VS,S,SS,M,SL,L,VL};v={VS,S,SS,M,SL,L,VL};结论部分改为关于λ和v的函数RQ=fλ,v=a0+a1λ+a2v+a3λ·v+b;其中,a0,a1,a2,a3为输出部分各个线性项的系数,b为偏移常数;通过梯度下降优化算法训练函数参数{a0,a1,a2,a3,b},以拟合离线采集的专家操控数据;通过在线滚动更新模型,持续学习新采集的人机交互数据;S7、将规划出的路径作为参考路径进行轨迹跟踪。
全文数据:
权利要求:
百度查询: 南京理工大学 南京长江自动化研究院有限公司 南京工业职业技术大学 林地路径规划与抗扰动自适应轨迹跟踪方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。