首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于可重构智能反射面的无人机防窃听安全通信方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江苏海洋大学;蓝湾海洋资源开发技术创新中心

摘要:本发明涉及无人机防窃听安全通信技术领域,公开了一种基于可重构智能反射面的无人机防窃听安全通信方法,通过整合RIS技术至无人机通信系统,利用其智能控制反射特性,显著提升了通信安全性。本发明采用深度强化学习的联合优化框架,同步优化无人机的运动轨迹、RIS的相移配置及用户调度策略,最大化合法用户与潜在窃听者之间的信道差异,增强物理层的通信安全性。还建立了直射信道遮蔽概率模型,并通过设计高效的状态、动作和奖励表示,将通信安全优化问题转化为强化学习问题,使用近端策略优化方法求解。本发明在提高通信安全性的同时,也显著提升了通信效率和质量,并通过无人机的灵活部署和RIS的智能调控,增强了系统的适应性和灵活性。

主权项:1.一种基于可重构智能反射面的无人机防窃听安全通信方法,其特征在于,包括以下步骤:S1:采用无人机至用户的下行系统链路;无人机至用户的下行系统链路具体结构如下:P1:包含一个具有Nu个发射天线的无人机通信基站;P2:K个地面的合法用户为UE;P3:一个具体坐标未知的潜在窃听者为EAV;P4:一个具有Mc×Mr个反射单元组成的均匀平面阵列可重构智能反射表面;其中,下行系统中同时存在空地直射信道与空-RIS-用户的反射信道;S2:将步骤S1中所述下行系统的总运行时间T分割成Nt个长度为δ的小时隙,并采用三维笛卡尔坐标系描述S1中下行系统的单位坐标;下行系统中的单位坐标具体表示为:无人机在第n个时隙中的坐标表示为Lu[n]=qu[n],hu[n],其中qu[n]=xu[n],yu[n]为其水平坐标,hu[n]为无人机在该时刻下的高度;地面的合法用户坐标表示为qk=xk,yk,地面所部署的RIS的坐标为qr=xr,yr,潜在窃听者的具体坐标记作qe=xe,ye,因实际场景下通常无法获取窃听者的具体位置,故而将窃听者估计位置记作qee=xee,yee,其中xee与yee为水平的坐标,精确坐标与估计坐标间满足xe=xee+Δxe,ye=yee+Δye1且Δxe2+Δye2≤ε2,从而将估计误差限制在值ε中;S3:分别对步骤S1中所述下行系统中存在的UAV-UE直射信道与UAV-RIS-UE的非直射信道进行建模;下行系统中的UAV-UE直射信道与UAV-RIS-UE的非直射信道建模过程如下:T1:直射信道中,UAV-UE与UAV-EAV的信道增益分别为: 其中,β0为参考距离为1m时的信道增益,duk与due分别为UAV至UE与EAV间的欧氏距离;T2:在反射信道中,UAV-RIS的信道响应表达为: 其中,λ为载波波长,dr与dc分别为RIS上反射单元的水平与垂直的间距,dur[n]=hu[n]2+||qu[n]-qk||2为UAV与RIS间的欧式距离,分别为在n时刻的到达角在水平x方向的余弦值、在水平y方向的余弦值及以及在垂直h方向的正弦值,其中hu与hr分别为UAV与RIS的高度;T3:RIS-UE与RIS-EAV的阵列响应为: T4:RIS的相移系数矩阵记作: 其中,为每个反射单元的相移;T5:UAV-UE与UAV-EAV的信道增益分别为:gurk[n]=hrkT·Θ[n]·hur[n]8gure[n]=hreT·Θ[n]·hur[n]9T6:城市环境中UAV-UE与UAV-EAV的直射信道被阻塞概率分别为: 其中,a与b为固定的经验系数;T7:UE与EAV处的信道增益分别为:gk[n]=Puk[n]guk[n]+1-Puk[n]gurk[n]12ge[n]=Pue[n]gue[n]+1-Pue[n]gure[n]13UE与EAV处的下行速率分别为: 其中,ck[n]∈{0,1}且为服务调度变量,指明同一时刻只有一个UE接受UAV的服务,B为带宽,pu为恒定的UAV信号发射功率,σ为加性高斯白噪声;T8:通信安全速率定义为最坏情况下的UE信道容量与EAV信道容量之差,表示为: T9:安全率优化问题定义为: P为所构建优化问题,与分别为UAV在水平与垂直方向上的最大速度,qu,min与qu,max为UAV在水平方向的最小与最大移动边界,hu,min与hu,max为UAV在垂直方向的最小与最大移动边界,ck为服务决策变量用以指明UAV所服务的UE,Dk为每个UE需要得到最小服务量,约束条件C1与C2分别限制了无人机水平及垂直方向运动的最大速度,C3与C4限制了无人机运动的场地大小,C5指明同一时刻下只有一个用户接受来自无人机的服务,C6要求每个用户至少接受到一定量的传输;S4:利用近端策略优化方法对步骤S3中的优化问题建模;近端策略优化问题建模步骤如下:S4-1:定义状态sn={qu[n],hu[n],dk[n]},其中二元变量dk[n]∈{0,1}指示该UE所接受服务量是否达标;S4-2:动作an={qa[n],ha[n],ca[n],θ[n]},其中qa[n]为UAV水平运动方向,ha[n]为UAV的垂直运动方向,二元变量ca[n]∈{1,2...,K}指示该时刻UAV所服务的UE,θ[n]为离散化后的相移取值;S4-3:奖励设计为rn=dk[n]Rs[n]-ξV[n],其中V[n]为该时刻下所违反的约束条件数量,ξ为惩罚系数;近端策略优化的初始化需要策略网络、策略网络的拷贝以及价值网络,该三种网络具体包含以下组成方式:P1:所述策略网络、策略网络的拷贝及价值网络均为三层全连接网络结构;P2:策略网络及策略网络的拷贝的前两层分别配置有128和64个神经元,并采用Relu函数作为激活函数;输出层的神经元数量等同于动作空间的维度,并采用Softmax函数作为激活函数;P3:价值网络的前两层分别配置有64和32个神经元,同样采用Relu函数作为激活函数;输出层神经元数量为1,且不使用激活函数;S5:采用基于深度强化学习的方法优化无人机运动轨迹、RIS相移配置和用户调度策略;基于深度强化学习的方法具体包括以下训练步骤:S5-1:初始化环境中UAV、UE和EAV的位置,以及每个UE的待服务量;S5-2:初始化策略网络π,策略网络的拷贝πold,价值网络V的初始权重,初始化经验回放M;S5-3:获取初始化后的状态sn;S5-4:将状态输入策略网络πold,得到动作a的概率分布,通过对该概率分布采样得到动作an,执行动作an以得到奖励rn与次状态sn+1;S5-5:将经验元组{sn,an,rn,sn+1}存入经验回放M中;S5-6:循环步骤S5-3与步骤S5-4直至该次任务执行结束;S5-7:通过计算优势函数,其中为状态价值函数,γ为折扣因子;S5-8:根据使用梯度下降法更新价值网络V;S5-9:通过计算裁剪代理目标函数,其中将根据进行裁剪,再通过使用梯度下降法更新策略网络π,其中c1与c2为权重系数,为熵奖励项;S5-10:清空经验回放M;S5-11:若已达预先设置的训练次数,则结束训练,否则重复步骤S5-3至步骤S5-10。

全文数据:

权利要求:

百度查询: 江苏海洋大学 蓝湾海洋资源开发技术创新中心 一种基于可重构智能反射面的无人机防窃听安全通信方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。