一种基于强化学习的GNSS转发式无人机诱骗时延控制系统

导航：龙图腾网> 最新专利技术> 一种基于强化学习的GNSS转发式无人机诱骗时延控制系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京航空航天大学

摘要：本发明涉及一种基于强化学习的GNSS转发式无人机诱骗时延控制系统，包括诱骗控制终端和被诱骗无人机；诱骗控制终端向被诱骗无人机转发时延受控的GNSS卫星信号控制被诱骗无人机向诱骗设定目标位置飞行；诱骗控制终端中设置强化学习模型，根据诱骗设定目标位置和无人机的实时状态设置奖励函数，将无人机飞行状态信息输入强化学习模型中，得到诱骗时延决策行为，对转发GNSS卫星信号进行时延控制；诱骗控制终端实时采集诱骗时延决策行为控制下被诱骗无人机的飞行状态，对当前诱骗时延决策行为进行奖励和惩罚，调整下一步的诱骗时延决策行为；根据实时诱骗时延决策行为和对应的无人机飞行状态在线训练和更新强化学习模型。本发明有效提高欺骗效率和成功率。

主权项：1.一种基于强化学习的GNSS转发式无人机诱骗时延控制系统，其特征在于，包括诱骗控制终端和被诱骗无人机；所述诱骗控制终端向被诱骗无人机转发时延受控的GNSS卫星信号控制被诱骗无人机向诱骗设定目标位置飞行；所述诱骗控制终端中设置强化学习模型，根据诱骗设定目标位置和无人机的实时状态设置奖励函数，将无人机飞行状态信息输入强化学习模型中，得到诱骗时延决策行为，对转发GNSS卫星信号进行时延控制；所述诱骗控制终端实时采集诱骗时延决策行为控制下被诱骗无人机的飞行状态，对当前诱骗时延决策行为进行奖励和惩罚，调整下一步的诱骗时延决策行为；并在诱骗计划实施过程中，根据实时诱骗时延决策行为和对应的无人机飞行状态在线训练和更新强化学习模型；所述诱骗控制终端中设置的强化学习模型采用actor-critic方法，包括策略网络和价值网络；其中，策略网络，根据输入的状态s产生并输出动作α；其中，状态s为被诱骗无人机的当前飞行状态s，动作α为控制无人机下一步飞行状态的诱骗时延决策行为；价值网络，基于接收的无人机飞行状态s给与之对应的动作α即诱骗时延决策行为进行打分，指导策略网络做出改进；强化学习模型采用在线训练的方式，在强化学习模型中设置经验回放数组，所述经验回放数组中包括四元组sj,αj,rj,sj+1；sj为第j个回合的状态，αj为第j个回合的动作，rj为第j个回合获得的奖励，sj+1观测的第j+1个回合的状态；把策略网络和价值网络当前参数记作θnow和ωnow，在进行策略网络和价值网络更新时，从经验回放数组中抽取该回合对应的四元组，进行下一回合的网络更新；价值网络和策略网络更新过程包括：1对策略网络进行预测：αj＝μsj；θnow，αj+1＝μsj+1；θnow式中，在当前的策略网络μsj；θnow中，用αj来更新θnow，执行动作αj之后，观测得到的奖励和新的状态sj+1，再根据更新后的策略网络μsj+1；θnow计算αj+1；而从经验回放数组中抽取的αj则是用上一个策略网络μsj；θold计算得到的，θold为策略网络的上一个参数；2对价值网络进行预测：训练价值网络的目标是让价值网络的预测逐渐接近真实价值函数；价值网络qs,α；ω输入是状态s和动作α，ω为价值网络参数，价值网络输出的价值，用于反应动作的好坏；预测中，qj＝qsj,αj；ωnow，qj+1＝qsj+1,αj+1；ωnow式中，在当前的策略网络qsj,αj；ωnow中，用αj、sj来更新ωnow，执行动作αj之后，观测得到的奖励和新的状态sj+1，再根据更新后的策略网络qsj+1,αj+1；ωnow计算qj+1；3计算TD目标和TD误差：TD目标：yj＝rj+γ·qj+1；TD误差：δj＝qj-yj；rj为第j个回合获得的奖励，γ为折扣率；4最后更新价值网络和策略网络：ωnow-λ·δj·▽ωqsj,αj；ωnow→ωnew；θnow+β·▽θμsj；θnow·▽αqsj,αj；ωnow→θnew；式中λ、β为学习率，使用网格搜索方法取值，通过比较不同学习率下的训练结果，选取表现最优的学习率；▽ω为价值网络的参数梯度，▽θ为策略网络的参数梯度、▽α为动作梯度。

全文数据：

权利要求：

百度查询：北京航空航天大学一种基于强化学习的GNSS转发式无人机诱骗时延控制系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种分体式水杯

下一篇：铁路平板车用移动端板

相关技术

一种分体式水杯

铁路平板车用移动端板

一种高速内圆磨电主轴电机转子结构

一种饲料加工粉碎装置

一种纺线防缠绕装置

一种垃圾炉烟尘废气排放检测装置

一种磷石膏基生态修复材料淋溶水回收设备

一种自锁式液压顶缸

一种无纺布成卷机

一种六足兼轮式切割救援机器

一种白蚁引诱灭杀一体化饵料棒

一种镭射膜生产用背涂装置

发式相关技术

一种换热效果好的蒸发式冷凝器_山东欣飞制冷设备有限公司_202323605995.8

一种基于多阶段启发式算法的点位排查动态路径规划方法_四川国蓝中天环境科技集团有限公司_202410840668.0

去神经疗法的启发式选择_美敦力爱尔兰制造无限公司_202410209026.0

一种无雾蒸发式加湿器_中山市浩奇电器有限公司_202420314351.9

基于欺骗干扰时延模型的转发式欺骗信号正时延优化方法_东南大学_202410773330.8

基于启发式策略的用户销售匹配方法及装置_元保科创(北京)科技有限公司_202410549199.7

一种智能自蒸发式小型通信机房空调_安徽中科新源半导体科技有限公司_202411017791.9

启发式语音交互方法、装置、设备和存储介质_安徽淘云科技股份有限公司_202410698694.4

一种锅炉水汽监测用触发式报警控制系统_安徽省特种设备检测院_202411054774.2

启发式的大数据分析方法、装置、电子设备及存储介质_平安银行股份有限公司_202410764640.3

转相关技术

一种用于激光转印的导电结构及激光转印装置_上海电气集团恒羲光伏科技(南通)有限公司_202323615618.2

转鼓造粒机用输送机_河南龙昌机械制造有限公司_201810804340.8

一种转架窑_中冶长天国际工程有限责任公司_202410745633.9

一种可转位切削刀片_赣州澳克泰工具技术有限公司_202211183354.5

一种电机堵转试验的检测工装_安徽省电机产品及零部件质量监督检验中心_202010922304.9

一种电机输出端堵转检测工装_江苏中炬电机有限公司_202411035298.X

一出二转换接头模具_上海裕鼎电源科技有限公司_202323453715.6

一种铝锭精炼全自动转液装置_重庆嘉锐铝业有限公司_202323622979.X

一种可转位切削工具_赣州澳克泰工具技术有限公司_202410760294.1

5G轨旁数据高速转储系统_广州铁路投资建设集团有限公司_202410760079.1

无人机相关技术

一种无人机翼及无人机_四川傲势科技有限公司_202410739210.6

无人机巡检装置和无人机巡检系统_国电环境保护研究院有限公司_202410827554.2

一种无人机机身及无人机_南昌三瑞智能科技股份有限公司_202420371830.4

基于无人机的测绘系统_山东星屹时空信息科技有限公司_202410629294.8

用于消防的灭火无人机_徐州智航智能科技有限公司_202410652987.9

一种应用于无人机的防摔装置及防摔无人机_襄阳汽车职业技术学院_202420279779.4

一种无人机拍摄方向调节装置及相应的电力巡检无人机_国网冀北电力有限公司信息通信分公司_202420116814.0

一种农药喷洒无人机_河北雨田时和年丰农业服务有限公司_202420322329.9

一种无人机摄影用防护装置_谢勇_202323655393.3

基于无人机的河湖水面巡查平台_苏州浩丰空间数据科技有限公司_202410628709.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于强化学习的GNSS转发式无人机诱骗时延控制系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务