首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种能量采集认知物联网络抗干扰最优传输方法 

申请/专利权人:福州大学

申请日:2022-10-18

公开(公告)日:2024-06-28

公开(公告)号:CN115766089B

主分类号:H04L9/40

分类号:H04L9/40;H04L41/14;H04B17/382

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2023.03.24#实质审查的生效;2023.03.07#公开

摘要:本发明涉及一种能量采集认知物联网络抗干扰最优传输方法。通过将认知无线电技术、能量采集技术、抗干扰技术在通信领域相结合,将认知物联网络建模为一个主基站、多个主用户、多个物联网节点、一个物联网认知基站和多个恶意攻击节点所构成的完整系统。通过深度强化学习方法对认知物联网络各个节点在发送、接收信号被恶意攻击的情况下,认知基站无需先验知识,无模型的学习恶意节点信道攻击策略,合理制定对抗策略并调节各个节点的信道接入、模式选择和功率分配以达到系统吞吐量最大化目的。本发明适用于无线通信领域。

主权项:1.一种能量采集认知物联网络抗干扰最优传输方法,其特征在于,通过将认知无线电技术、能量采集技术、抗干扰技术在通信领域相结合,对认知通信网络各个节点在发送、接收信号被恶意攻击的情况下,认知基站无需先验知识,无模型的学习恶意节点信道攻击策略,制定对抗策略并调节各个节点的信道接入、模式选择和功率分配以达到系统吞吐量最大化目的;该方法具体步骤如下:步骤1、搭建强化学习环境,考虑一个以认知基站CBS为圆心半径为1km的范围,N个CIoT节点位于圆内且服从泊松分布,CIoT节点拥有相同的初始功率Pt0={P1t0=P0,...,PNt0=P0}和电池水平Bt0={B1t0=B0,...,BNt0=B0},空闲信道数量为L;在此范围内考虑一个恶意攻击节点,它也服从泊松分布,也有初始功率Pjt0=Pj0;CBS为agent使用强化学习算法与环境进行交互;步骤2、构建基于深度强化学习的认知通信网络抗干扰资源分配算法,首先生成认知通信网络的拓扑结构,初始化训练轮次数episode,每轮训练次数steps,actor的学习率lr_A,critic的学习率lr_C,奖励折扣率γ,经验回放池D的最大容量C,训练批次大小batch_size以及神经网络权重参数:策略网络actor的online权重θμ和actor的target权重θμ′,Q网络critic的online权重θQ和actor的target权重θQ′;步骤3、在每个episode的开始,更新认知通信网络环境中所有CIoT节点和攻击节点的位置和并重新计算所有链路的信道增益,包括CIoT节点与CBS的信道增益和恶意攻击节点与CIoT节点的信道增益更新频谱感知得到的信道状态Ιt={I1t,...,ILt},信道状态为繁忙或空闲;更新后的CIoT节点电池状态Bt={B1t,...,BNt};得到状态空间作为每个episode的开始的初始状态;步骤4、在每个episode的第t个step,CBS将St带入DDPG算法得到动作将动作与环境交互,在τ时间内CIoT节点根据更新每个节点的工作模式Mit,选择频谱接入或能量采集,之后在1-τ的时间内通过能量采集公式更新每个CIoT节点获取的能量Eit,或者在1-τ的时间内按照功率Pit接入空闲信道进行数据传输;在1-τ时间结束后更新每个CIoT节点电池状态Bit+1;CBS在每个t时隙最后根据下式计算CIoT节点总的吞吐量即强化学习的奖励r: 其中T为每个时隙的时长,W为带宽,SINRit为第i个CIoT节点的信噪比;在得到奖励r后,对于长期的系统性能,即累积吞吐量,不仅应该考虑当前时间段t上的瞬时奖励r,还应该考虑未来的奖励;因此,从第t个时间段开始的折现未来累积吞吐量表示如下: 其中,折扣率0<γ<1;将累计吞吐量最大化,表述为: s.t.INPt≤ILt 其中,表示期望的给定值,Gt表示从第t个时隙开始的折现未来累积吞吐量,INPt表示第t个时间段上功率分配策略集合中大于零的元素数,ILt表示第t个时间段处的空闲通道数,T为每个时隙的周期,τ为每个时隙中控制阶段的持续时间,Pit表示第t个时隙处CIoT节点i的发射功率,es表示为信号交换所需的能量,gibt表示CIoT节点i与CBS之间的信道增益,n表示高斯白噪声n~N0,ω2,SINRthreshold表示信干噪比阈值;步骤5、CBS将动作每带入环境后,环境会返回相应的奖励r和下一状态CBS将这个状态转换过程存入经验回放池R,作为训练online网络的数据集;之后从经验回放池R中,随机采样batch_size个已存放数据作为online策略网络、onlineQ网络的一个mini-batch训练数据;用si,ai,ri,si+1表示batch_size中的单个transition数据;而后进行DDPG算法神经网络的更新。

全文数据:

权利要求:

百度查询: 福州大学 一种能量采集认知物联网络抗干扰最优传输方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。