Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜南京航空航天大学赵振根获国家专利权

恭喜南京航空航天大学赵振根获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜南京航空航天大学申请的专利一种Q学习的固定翼无人机H无穷抗干扰控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115407654B

龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211023187.8,技术领域涉及:G05B13/04;该发明授权一种Q学习的固定翼无人机H无穷抗干扰控制方法是由赵振根;程磊;梁惠勇;孔飞设计研发完成,并于2022-08-25向国家知识产权局提交的专利申请。

一种Q学习的固定翼无人机H无穷抗干扰控制方法在说明书摘要公布了:本发明提供了一种Q学习的固定翼无人机H无穷抗干扰控制方法。首先,建立有扰动项的无人机纵向模型;其次,利用无人机输入、输出和扰动重建状态,设计基于输出反馈的Q函数H无穷贝尔曼方程,获得最优控制输入和最坏扰动;再次,将Q函数参数化后,利用输入输出以及扰动输入数据在线求解核矩阵,构建数据驱动下的最优控制输入和最坏扰动输入;最后,选取满足扰动衰减条件的扰动输入,测试在该扰动下系统的抗干扰性,并在非线性模型上验证本发明所得抗干扰控制器的有效性。本发明相对Q学习方法,结合了H无穷理论,考虑外界扰动的情况下基于Q学习设计控制律,不仅具有Q学习的无模型优点,也大大提升无人机系统的抗干扰能力。

本发明授权一种Q学习的固定翼无人机H无穷抗干扰控制方法在权利要求书中公布了:1.一种Q学习的固定翼无人机H无穷抗干扰控制方法,其特征在于,包括以下步骤:1建立无人机纵向系统状态的空间模型,所述无人机纵向系统状态的空间模型包含扰动项;2在无人机纵向系统状态可观测条件下,通过控制输入、观测输出和扰动输入数据重构无人机纵向系统状态;3结合H∞理论构建输出反馈Q函数;4将输出反馈Q函数参数化,收集无人机纵向系统输入输出和扰动的数据,在线迭代求解最优核矩阵;5利用最优控制输入和最坏情况下扰动表达式,结合最优核矩阵,计算得到最优控制输入和最坏情况下扰动输入;6利用扰动衰减条件,选定符合扰动条件下的扰动输入,将该扰动输入加入无人机纵向系统中,验证学习到的抗干扰控制器对在扰动衰减条件下的扰动输入的有效抑制性;步骤1中首先构建不包括扰动项的无人机纵向系统状态的空间模型,其表达式为:xk+1=Axk+Bukyk=Cxk,其中:k时刻的状态量无人机系统输出值n1、n、和p分别为控制输入维数、状态变量维数、实数集和无人机纵向系统输出维数;A、B和C分别为状态转移矩阵、控制输入矩阵和观测矩阵;xk包含无人机四个状态变量,分别为速度V、迎角α、俯仰角θ和俯仰角速率q;无人机的四个状态变量分别为: 其中t表示时间;Iy为绕机体坐标系y轴的转动惯量,Tt为无人机的发动机推力,D为阻力,L为升力,g为重力加速度,M为俯仰力矩,m为无人机的质量;则包括扰动项的无人机纵向系统状态的空间模型为:xk+1=Axk+Buk+Ewkyk=Cxk,其中为加入无人机纵向系统的扰动输入项,n2为扰动输入维数,E为扰动输入矩阵;步骤2中:将无人机纵向系统状态重构为: 其中Mu、Mw和My分别为控制输入重构矩阵、扰动输入重构矩阵和无人机纵向系统输出重构矩阵,是由不同时刻的控制输入构成的控制输入向量,是由不同时刻的扰动输入构成的输出向量,是由不同时刻的无人机纵向系统输出构成的输出向量,且: UN=[BAB…AN-1B],VN=[CAN-1T…CATCT]T, 其中:UN和VN分别表示无人机纵向系统的能控性和能观性矩阵;DN1和DN2分别为控制输入耦合矩阵和扰动输入耦合矩阵;N为过去时刻的步长,N满足N≥n,n为状态变量维数;和分别表示k-N时刻的控制输入、扰动输入和无人机纵向系统输出;T表示矩阵的转置,AN-1,AN-2,AN-3表示状态转移矩阵A的N-1,N-2,N-3次方;步骤3中:所述输出反馈Q函数为: 其中Q1和R为权重矩阵,γd为扰动衰减因子,γ为折扣因子,0<γ≤1;P为广义黎卡提方程的解,记zk为以k时刻为基点的过去N个时刻由控制输入、扰动输入和无人机纵向系统输出组成的向量,将Q函数改写为: 其中:H为输出反馈Q函数的核矩阵且满足参数l=n1N+n2N+pN+n1+n2;n1为控制输入维数,n2为扰动输入维数,p为输出维数; 为的性能耦合矩阵,为和的性能耦合矩阵,为和的性能耦合矩阵,为和uk的性能耦合矩阵,为和wk的性能耦合矩阵; 为和的性能耦合矩阵,为的性能耦合矩阵,为和的性能耦合矩阵,为和uk的性能耦合矩阵,为和wk的性能耦合矩阵; 为和的性能耦合矩阵,为和的性能耦合矩阵,为的性能耦合矩阵,为和uk的性能耦合矩阵,为和wk的性能耦合矩阵; 为uk和的性能耦合矩阵,为uk和的性能耦合矩阵,为uk和的性能耦合矩阵,Huu为uk的性能耦合矩阵,Huw为uk和wk的性能耦合矩阵; 为wk和的性能耦合矩阵,为wk和的性能耦合矩阵,为wk和的性能耦合矩阵,Hwu为wk和uk的性能耦合矩阵,Hww为wk的性能耦合矩阵;I为单位矩阵;步骤4中:利用无人机纵向系统状态的空间模型表达式生成所需[k-N,k-1]时间步长内系统输入、输出以及扰动输入数据,利用所得到的:uk-1,uk-2,...,uk-N,wk-1,wk-2,...,wk-N,yk-1,yk-2,...,yk-N,基于输出反馈Q函数H∞策略迭代算法,学习得到最优核矩阵H最优;基于输出反馈Q函数H∞策略迭代算法,学习得到最优核矩阵H最优的具体实现过程为:步骤4-1,初始化:分别对H0、Qy、R、γ、γd初始化赋值,其中:H0为核矩阵H的初始化值,Qy为权重矩阵;步骤4-2,策略评估:对无人机纵向系统生成的输入、输出以及扰动输入数据进行收集,求解输出反馈Q函数H∞贝尔曼方程,获取收集区间步长L,L取值应满足L≥l×l+12,因此:L≥n1N+n2N+pN+n1+n2×n1N+n2N+pN+n1+n2+12,输出反馈Q函数H∞贝尔曼方程: 其中Hj为第j次迭代的H矩阵,zk+1为以k+1时刻为基点的过去N个时刻由控制输入、扰动输入和无人机纵向系统输出组成的向量;步骤4-3,策略更新:以数据驱动的形式更新控制输入与扰动输入: 和分别为在第k步第j+1次迭代时的控制输入和扰动输入;步骤4-4,终止条件:当满足收敛条件||Hj-Hj-1||≤ε时停止迭代,ε为收敛条件常数,终止迭代时即获取最优核矩阵H最优;若不满足收敛条件,则执行j=j+1后继续迭代;步骤5中将最优核矩阵H最优中的元素组成最优控制律和最坏扰动的形式,最优控制输入和最坏扰动输入表示为: 其中:表示满足终止迭代条件时对应的最优核矩阵H最优所包含的子矩阵。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。