首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种感知辅助的智能无人机隐蔽通信与路径规划方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京理工大学

摘要:本发明公开的一种感知辅助的智能无人机隐蔽通信与路径规划方法,属于无线通信信息安全技术和路径规划领域。本发明实现方法为:构建无人机推进能耗模型和无线信道模型,结合隐蔽通信理论构建多检测时隙下的累计隐蔽性约束;基于地面节点和合法无人机的感知辅助信息和无人机网络对地面节点的调度约束,构建智能无人机隐蔽通信与路径规划的优化问题;根据马尔科夫决策过程构建深度强化学习框架,合法无人机在累计隐蔽性约束的辅助下在环境中交互训练,在保证传输数据安全前提下,实现无人机单次飞行所收集数据量最大;基于深度强化学习框架利用Q估计网络辅助无人机进行自适应决策,根据最大价值的动作实现无人机隐蔽通信与最优轨迹规划。

主权项:1.一种感知辅助的智能无人机隐蔽通信与路径规划方法,其特征在于:包括如下步骤:步骤一、针对无人机携带能量有限的特点,构建无人机推进能耗模型表征无人机飞行轨迹对无人机单次飞行时间的影响;针对地对空无线信道特点,构建无人机合法通信链路模型,给出每个收集周期内合法无人机数据收集量和数据上行传输速率,并构建窃听者无人机的窃听信道模型;利用KL散度表征窃听者无人机多检测时隙下的检测错误概率,结合条件风险价值和拉盖尔级数推导累计隐蔽性约束;步骤二、建立无人机对地面节点的调度规则,根据步骤一建立的无人机推进能耗模型、地空无线信道模型以及累计隐蔽性约束,构建无人机路径规划,地面节点功率控制和调度策略的联合优化问题;步骤三、将步骤二中建立的联合优化问题建模为具有状态集合、动作集合、奖励和环境的强化学习框架;基于累计隐蔽约束,利用条件风险价值和拉盖尔级数展开式,表征每个决策周期内的隐蔽性容量状态;在强化学习中,智能体通过与环境交互,根据当前t时刻环境的状态st,输出动作at,并通过环境得到反馈奖励rt和下一时刻状态st+1;强化学习中引入状态-动作价值,即Q值,来评估当前状态下动作的好坏;由于每个动作都会对后续动作选择产生影响,因此Q值基于累计折扣奖励构建的;在具体实施决策时,智能体是根据Q函数选择当前状态,即选择Q值最大的动作,实现累计奖励最大化;步骤四、针对步骤三所构建的强化学习框架,制定基于价值的深度强化学习算法来解决联合优化问题;在环境中不断训练深度神经网络直到收敛后,将每一时刻无人机的状态输入训练后的神经网络,根据网络输出的动作状态价值,获取无人机的最优动态路径规划和地面节点的调度策略;深度强化学习算法利用深度神经网络拟合Q函数,当神经网络训练收敛后,通过将当前环境状态输入神经网络,神经网络输出不同可选动作的Q值,智能体将选择具有最大Q值的动作执行决策;重复利用Q估计网络辅助无人机进行自适应决策,无人机每一决策周期的速度和方向被唯一确定,进而实现无人机隐蔽通信与最优轨迹规划。

全文数据:

权利要求:

百度查询: 北京理工大学 一种感知辅助的智能无人机隐蔽通信与路径规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。