买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国人民解放军军事科学院系统工程研究院
摘要:本发明公开了一种频谱博弈决策的智能迭代方法和装置,所述方法包括:获取任务信息、在线知识库和离线数据集;利用训练完毕的频谱博弈装备决策模型,对所述任务信息进行处理,得到干扰信息;所述频谱博弈装备决策模型与在线知识库相连接;利用所述干扰信息的干扰信号参数,生成干扰信号;将所述干扰信号,按照所述干扰方式,发送至干扰目标;采集得到干扰目标发出的反馈信息;利用所述干扰信息、任务信息和反馈信息,对干扰决策评估模型的离线数据库进行更新;所述离线数据库,与所述干扰决策评估模型相连接;利用更新后的离线数据库,对所述干扰决策评估模型进行训练处理;利用训练后的所述干扰决策评估模型,对所述在线知识库进行更新;利用更新后的在线知识库,对所述频谱博弈装备决策模型进行训练更新,实现对频谱博弈决策的智能迭代。本发明方法解决了算法训练高质量样本数据难收集的难题,采用实时频谱博弈对抗思路,通过构建双环路,形成电磁频谱博弈闭环,大幅提高目标侧与干扰侧智能算法的学习效率。
主权项:1.一种频谱博弈决策的智能迭代方法,其特征在于,包括:S1,获取任务信息、在线知识库和离线数据集;所述任务信息,包括干扰目标信息和目标信号信息;所述目标信号信息,包括载频、带宽、码元速率、幅度、调制类型;所述在线知识库的数据,包括目标信息和对应的干扰信息;所述离线数据集,包括离线数据;所述离线数据,包括目标信号信息、干扰信号参数、干扰方式信息和干扰效果值;S2,利用训练完毕的频谱博弈装备决策模型,对所述任务信息进行处理,得到干扰信息;所述频谱博弈装备决策模型与在线知识库相连接;所述干扰信息,包括干扰信号参数和干扰方式信息;所述干扰信号参数,包括干扰信号中心频率、带宽、占空比、调制方式;所述干扰方式信息的取值,包括压制干扰、欺骗干扰、灵巧式干扰;S3,利用所述干扰信息的干扰信号参数,生成干扰信号;将所述干扰信号,按照所述干扰方式,发送至干扰目标;采集得到干扰目标发出的反馈信息;所述反馈信息,包括干扰后信号信息;S4,利用所述干扰信息、任务信息和反馈信息,对干扰决策评估模型的离线数据库进行更新;所述离线数据库,与所述干扰决策评估模型相连接;S5,利用更新后的离线数据库,对所述干扰决策评估模型进行训练处理;S6,利用训练后的所述干扰决策评估模型,对所述在线知识库进行更新;S7,利用更新后的在线知识库,对所述频谱博弈装备决策模型进行训练更新,实现对频谱博弈决策的智能迭代;所述频谱博弈装备决策模型,包括第一输入模块、第一卷积模块、深度可分离卷积模块、第一升维卷积模块、第二升维卷积模块、第三升维卷积模块、第四升维卷积模块、第二卷积模块、第一池化模块、第三卷积模块、第四卷积模块、第五卷积模块、第六卷积模块、第二池化模块、第七卷积模块、第二全连接模块;所述第一输入模块的输入端,用于接收所述目标信号信息;所述第一输入模块的输出端,与所述第一卷积模块的输入端相连接;所述第一卷积模块的输出端,与所述深度可分离卷积模块的输入端相连接;所述深度可分离卷积模块的输出端,与所述第一升维卷积模块的输入端相连接;所述第一升维卷积模块的输出端,与所述第二升维卷积模块的输入端相连接;所述第二升维卷积模块的输出端,与所述第三升维卷积模块的输入端相连接;所述第三升维卷积模块的输出端,与所述第四升维卷积模块的输入端相连接;所述第四升维卷积模块的输出端,与所述第二卷积模块的输入端相连接;所述第二卷积模块的输出端,与所述第一池化模块的输入端相连接;所述第一池化模块的输出端,与所述第三卷积模块的输入端相连接;所述第三卷积模块的输出端,与所述第四卷积模块的输入端相连接;所述第四卷积模块的输出端,与所述第五卷积模块的输入端相连接;所述第五卷积模块的输出端,与所述第六卷积模块的输入端相连接;所述第六卷积模块的输出端,与所述第二池化模块的输入端相连接;所述第二池化模块的输出端,与所述第七卷积模块的输入端相连接;所述第七卷积模块的输出端,与所述第二全连接模块的输入端相连接;所述第二全连接模块的输出端,用于输出所述干扰信息;所述干扰决策评估模型,包括输入模块、评估模块、决策网络;所述评估模块,包括行为评估网络和目标评估网络;所述输入模块,利用输入端接收数据,并利用各个输出端,将所述输入端接收的数据输出;所述决策网络的输入端,与所述输入模块的输出端相连接;所述行为评估网络的输入端,与所述输入模块的输出端相连接;所述行为评估网络的输出端,与所述目标评估网络的输入端相连接;所述决策网络的输入端,与所述目标评估网络的输出端相连接;所述行为评估网络的输入端,与所述决策网络的输出端相连接;所述决策网络,包括:第一输入层、第一隐藏层、第一上采样层、第一卷积层、第二隐藏层、第三隐藏层和第一输出层;所述行为评估网络,包括:第二输入层、第四隐藏层、第二上采样层、第五隐藏层、第二卷积层、第一残差注意力层和第二输出层;所述目标评估网络,包括:第三输入层、第六隐藏层、第七隐藏层、第八隐藏层和第三输出层;所述第一至第八隐藏层,均采用全连接网络来实现;所述行为评估网络,用于对输入的目标信号信息和干扰信号参数进行处理,得到第一估计值;利用参数更新值,对其参数进行更新;所述目标评估网络,对所述目标信号信息和干扰方式信息进行处理,得到干扰效果值;利用参数更新值,对其参数进行更新;所述决策网络,用于对所述目标信号信息、干扰效果值进行处理,得到干扰信号参数和干扰方式信息,作为所述干扰决策评估模型的输出;利用参数更新值,对其参数进行更新。
全文数据:
权利要求:
百度查询: 中国人民解放军军事科学院系统工程研究院 一种频谱博弈决策的智能迭代方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。