首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于强化学习的某分队数智化建模方法及仿真系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民解放军63963部队

摘要:一种基于强化学习的某分队数智化建模方法及仿真系统,属于人工智能技术领域。方法包括:通过概率神经网络分别计算与打击目标相连的智能体实体对该打击目标的毁伤概率;通过智能体选择模块根据毁伤概率的高低依次选择N个智能体实体;通过图注意力机制模块生成对该打击目标实体的摧毁向量;通过BP神经网络根据摧毁向量生成Q个指标项。本发明提供的建模方法及仿真系统能够展现强对抗、动态变化的战场态势,且推演作战指标项的速度快、效率高。

主权项:1.一种基于强化学习的某分队数智化建模方法,其特征在于,包括如下步骤:根据实时测量数据生成包括实体和连接实体之间的边的动态知识图谱,实体包括多个智能体和多个打击目标;通过打击目标选择模块在t时刻根据作战任务从动态知识图谱中选择1个打击目标实体;通过概率神经网络分别计算与该打击目标相连的智能体实体对该打击目标的毁伤概率;通过智能体选择模块根据毁伤概率的高低依次选择N个智能体实体,并将所选择的智能体的测量数据组成特征向量提供给图注意力机制模型模块,第n个智能体实体的特征向量为An;通过图注意力机制模型模块根据N个智能体实体的特征向量生成对该打击目标实体的摧毁向量为E={e1t,…,ent,…,eNt},其中,图注意力机制模型模块包括N个图注意力机制模型,ent为第k个图注意力机制模型在t时刻输出对打击目标的摧毁向量;通过BP神经网络根据N个智能体实体的特征向量和摧毁向量E={e1t,…,ent,…,eNt}生成t时刻输出的Q个指标项,n=1,2,…,N;其中, ,式中σ为第一激活函数,为智能体中的第j个智能体打击目标的特征向量Aj对第n个智能体打击目标的特征向量An的贡献度;ε为第二激活函数;ρ为图注意力机制模型的输入模块到隐含模块的参数;W表示参数矩阵;||表示将WAn和WAj拼接起来;BP神经网络包括第一输入模块、第一隐含模块和第一输出模块,所述第一输入模块包括N个神经元,第n个神经元t时刻输入的值为:bnt=An+wenent式中,wen为第n个特征值ent的加权系数;第一隐含模块包括I个神经元,第i个神经元t时刻的输出为: ,式中,wni为第一输入模块第n个神经元与第一隐含模块的第i个神经元之间的权重;Si为高斯函数的带宽,Mi为高斯函数的中心;ut-1i为第i个神经元t-1时刻的输出;Ψ0为初始调整系数;P为调整次数;Ψ为调整函数,i=1,2,…,I;第一输出模块包括Q个神经元,第q个神经元t时刻输出的指标项为: ,式中,wiq为第一隐含模块第i个神经元和第一输出模块第q个神经元之间的权重,q=1,…,Q。

全文数据:

权利要求:

百度查询: 中国人民解放军63963部队 一种基于强化学习的某分队数智化建模方法及仿真系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。