买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南开大学
摘要:本发明涉及非电变量的控制或调节系统技术领域,尤其涉及一种多拦截飞行器协同突防博弈制导律设计方法,包括如下步骤:建立三维相对运动模型;设定存在时间使各拦截飞行器在内的一个时间点达到预设制导效果;为各拦截飞行器设定状态空间、动作空间及奖励函数;初始化状态空间、动作空间、奖励函数及网络参数;对各拦截飞行器在每一个设定的时间步内根据当前actor网络及状态选择动作,并将经验元组数据进行存储;随机抽取经验元组数据对网络进行学习,并更新网络;重复迭代直至设计的动作使各拦截飞行器达到预设制导效果。本发明提供的方法具有高度的适应性,强大的决策能力以及协同效率,方案先进且灵活有效。
主权项:1.一种多拦截飞行器协同突防博弈制导律设计方法,其特征在于:包括如下步骤:S1:建立目标飞行器、反拦截飞行器及拦截飞行器间的三维相对运动模型,其中拦截飞行器包括一个领导拦截飞行器及多个跟随拦截飞行器;S2:针对三维相对运动模型设定存在时间,使各拦截飞行器达到下述预设制导效果:各拦截飞行器的剩余飞行时间达到一致,各拦截飞行器的视线高低角和视线方位角在从初始状态到达这段时间内的一个时间点分别收敛到期望值,且在绕开反拦截飞行器攻击的同时,完成对目标飞行器的攻击;S3:为各拦截飞行器分别设定状态空间;S4:对协同制导律进行设计,为各拦截飞行器分别设定动作空间,使各拦截飞行器达到步骤S2所述的预设制导效果;S5:为各拦截飞行器设计奖励函数,使各拦截飞行器与环境交互后的弹目距离趋近于0,视线高低角、视线方位角同时趋近于其期望值;S6:初始化各拦截飞行器的状态空间、动作空间、奖励函数及原始actor网络参数、原始critic网络参数、目标actor网络参数、目标critic网络参数,并将根据设定状态空间设计的状态、根据动作空间设计的动作及根据奖励函数设计的奖励分别赋予相应的拦截飞行器;S7:对各拦截飞行器在每一个设定的时间步内根据当前actor网络及状态选择动作,使各拦截飞行器达到步骤S2所述的预设制导效果,并将每一个设定的时间步内获得的经验元组数据进行存储;S8:随机抽取多组经验元组数据对actor网络及critic网络进行学习,并更新原始actor网络参数、原始critic网络参数、目标actor网络参数、目标critic网络参数,同时对各拦截飞行器目标actor网络及目标critic网络进行软更新;S9:重复迭代步骤S7及步骤S8,直至设计的动作使各拦截飞行器达到步骤S2所述的预设制导效果,得到能够达到预设制导效果的各拦截飞行器的动作。
全文数据:
权利要求:
百度查询: 南开大学 一种多拦截飞行器协同突防博弈制导律设计方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。