买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京瀚海伏羲防务科技有限公司;南京现代综合交通实验室
摘要:本发明公开了一种跨域异构无人集群博弈对抗策略生成方法及系统,涉及无人系统与自动化技术领域。主要步骤包括:构建神经‑内分泌‑免疫机制启发下的随机博弈模型;利用生物神经‑内分泌‑免疫调节机理,进行无人机态势信息融合,用以建立无人机集群的相互作用;采用随机博弈模型的无人机集群近端策略优化的方法进行集中式训练、分布式执行,生成大型无人机群体的对抗策略。本发明无人机集群通过跨域异构无人集群博弈对抗策略,优化无人机集群的战术部署和资源分配,提升集群在对抗任务中的效能和生存能力,能够更有效地进行空战对抗,提高整体作战能力和效率。
主权项:1.一种跨域异构无人集群博弈对抗策略生成方法,其特征在于,具体步骤为:步骤S1,构建神经-内分泌-免疫机制启发下的随机博弈模型,具体为:在平面坐标系中构建无人机的运动模型,无人机的位置坐标为x,y,公式为: 式中,V为无人机的速度标量,需要满足约束:ξ为航迹偏角;V和ξ的变化量可表示为: 其中,a为加速度,大小需满足约束:|a|≤amax,λξ为描述角加速度的常值系数;步骤S2,利用生物神经-内分泌-免疫调节机理,进行无人机态势信息融合,用以建立无人机集群的相互作用,具体为:S21、获取当前环境下己方无人机的状态信息Si和邻域范围内的友机、敌机的状态信息S=sf1,…,sfn,se1,…sem;S22、根据所述己方无人机Ui与其他无人机之间的角度、间距、相对速度,计算相互作用的影响度,具体包括:计算Ui受到友机Uj的协同激励计算公式为: 其中,为Ui受到友机Uj产生的角度协同激励,为Ui受到友机Uj产生的间距协同激励,为Ui受到友机Uj产生的相对速度协同激励;计算Ui受到敌机Uk产生的威胁计算公式为: 其中,为Ui受到敌机Uk产生的角度威胁,为Ui受到敌机Uk产生的距离威胁,为Ui受到敌机Uk产生的速度威胁;S23、根据影响度计算所述友方无人机和敌方无人机的重要度权值,包括:计算集群内友方无人机对无人机Ui的友方态势权值,公式为: 其中,为归一化因子,避免产生的数据过大或过小;计算集群内敌方无人机对无人机Ui的敌方态势权值,公式为: S24、将步骤S23获得的态势权值与状态进行加权计算,获得初次融合后的态势信息,公式为: 其中,Sj为友方无人机状态,Sk为敌方无人机状态,S25、将无人机自身状态Si与步骤S24获得的所述初次融合后的态势信息F,通过神经系统进行矩阵的拼接进行调节融合,获取无人机Ui的最终态势信息,具体公式为:S′i=concatP·Si,F;其中,S′i为训练时无人机的状态信息,P为无人机状态信息S′i的特征转换矩阵,concat为矩阵拼接函数;步骤S3,通过无人机集群近端策略优化算法强化学习,生成无人机集群博弈对抗策略,具体为:设计奖励函数,将所述无人机集群的协同对抗分为攻防对抗和围捕对抗,使无人机在对抗环境中做出选择,具体包括:击毁敌机,定义的奖励函数具体为: 其中,d为攻击无人机Uattack和防御无人机Udefence之间的相对距离,η、φ分别为Uattack和Udefence的视线角;协助友机,定义协同进攻、互相支援的无人机的奖励函数具体为: 其中,D为己方各个无人机与所有敌方无人机距离的集合,D具体为N是己方无人机的架数,M是敌机的架数;避免己方冲突,定义碰撞危险区域和伪碰撞临界区域,并定义奖励函数具体为: 其中,Rself为尺寸半径,δself为临界区域的半径,Rcollision为碰撞危险区域的半径,δcritical为冲突临界区域的半径;集群内无人机在当前状态执行动作后,所获得的奖励为: 步骤S4,采用随机博弈模型的无人机集群近端策略优化的方法进行集中式训练、分布式执行,用于生成大型无人机群体的对抗策略,具体为:通过Critic网络接收所有无人机的观测信息与动作,作为联合状态动作对进行学习,训练学习中心价值函数;定义无人机的Actor网络函数,公式为: 其中,min表示取括号中两项里较小的一项值,clip函数表示如果括号中的第一项小于第二项函数的作用,就将概率比限制在0.1的范围。
全文数据:
权利要求:
百度查询: 南京瀚海伏羲防务科技有限公司 南京现代综合交通实验室 一种跨域异构无人集群博弈对抗策略生成方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。