首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于强化学习MPC的无人艇轨迹跟踪控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨工程大学

摘要:本发明属于水面无人艇轨迹跟踪控制技术领域,具体涉及一种基于强化学习MPC的无人艇轨迹跟踪控制方法。本发明在无人艇的MPC轨迹跟踪控制器设计过程中,选用无人艇的运动学模型和操纵响应模型作为预测模型,根据无人艇轨迹跟踪任务需求构造控制性能指标函数,在MPC滚动优化过程中利用强化学习的DDPG算法构建性能指标函数的求解器,通过最小化性能指标函数求解出轨迹跟踪的最优控制序列,最终将每时刻控制序列的第一个控制量作用于无人艇系统上。本发明提高了轨迹跟踪控制的鲁棒性和抗干扰,同时具备自学习能力,适应于复杂的海况环境,相较于传统的MPC控制算法其自主性和实时性更强,跟踪误差更小。

主权项:1.一种基于强化学习MPC的无人艇轨迹跟踪控制方法,其特征在于,包括如下步骤:步骤1:获取无人艇的实时状态信息x,y,ψ,r,包括无人艇的位置坐标x,y、实时航向角ψ、艏摇角速度r;步骤2:根据当前轨迹跟踪点Pk+1xk+1,yk+1和上一航迹跟踪点为Pkxk,yk,利用LOS导引算法计算无人艇实时的期望航向角ψd;步骤3:建立无人艇轨迹跟踪的水平面数学模型,设计无人艇轨迹跟踪的DDPG-MPC智能控制器;无人艇以恒定速度U航行,轨迹跟踪数学模型为: 其中,T表示无人艇对舵的快速应答性和航向稳定性;K为增益系数;α为非线性系数;δ为操舵角;在控制器设计中,状态变量χ=x,y,ψ,r,输出量Y=x,y,ψ,控制量u=δ;离散状况下无人艇轨迹跟踪非线性系统的预测模型表示为:χk+1=fχk,uk,wk其中,wk为系统扰动;f·为系统的非线性函数;考虑k时刻对k+i时刻状态变量χ的预测值可表示为χk+i|k,其对应的系统输出值Yk+i|k=Cχk+i|k,k+i时刻输入系统参考轨迹为Yrefk+i|k,作用于系统的控制量δk+i|k;考虑k时刻开始由预测模型预测未来N个时刻的状态序列χk、输出序列Yk、控制序列uk以及轨迹参考序列Yrefk表示为:χk=χk+1|k,......,χk+N|kTYk=Yk+1|k,......,Yk+N|kTuk=uk|k,......,uk+N-1|kTYrefk=Yrefk+1|k,......,Yrefk+N|kT由此根据上述部分建立无人艇轨迹跟踪控制的性能指标: 其中,Q,R为性能指标函数的权值矩阵;步骤4:利用DDPG算法求解MPC滚动优化过程中的最优控制序列,控制序列的第一个控制量作用于无人艇系统上。

全文数据:

权利要求:

百度查询: 哈尔滨工程大学 一种基于强化学习MPC的无人艇轨迹跟踪控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。