Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国人民解放军陆军工程大学徐逸凡获国家专利权

恭喜中国人民解放军陆军工程大学徐逸凡获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国人民解放军陆军工程大学申请的专利一种基于Q学习的联合信道和路由选择跨层决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119484387B

龙图腾网通过国家知识产权局官网在2025-04-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510038071.9,技术领域涉及:H04L45/02;该发明授权一种基于Q学习的联合信道和路由选择跨层决策方法是由徐逸凡;徐煜华;许江;任国春;龚玉萍;崔丽;冯智斌;杜嘉韬设计研发完成,并于2025-01-10向国家知识产权局提交的专利申请。

一种基于Q学习的联合信道和路由选择跨层决策方法在说明书摘要公布了:本申请提供一种基于Q学习的联合信道和路由选择跨层决策方法,方法包括:获取坐标;每个路由节点周期性的广播用来发现、建立、保活邻居关系的报文;当邻居节点接收到Hello包后反馈确认报文,建立好邻居关系;当源节点有数据需要传输时,源节点按照选择策略选择出下一跳节点和信道传输数据包,数据包中包含选择的下一跳节点的地址;邻居点判断数据包是否应该由自己转发;下一跳节点通过控制链路向源节点回复,回复信息中包含估计的信干比和自己最新的Q表;源节点根据反馈的信干比和前期获得的位置用来计算奖励值;源节点根据奖励值更新Q表和节点选择策略。本方法提高了网络传输速率和抗干扰性能,减少了端到端的时延、跳数。

本发明授权一种基于Q学习的联合信道和路由选择跨层决策方法在权利要求书中公布了:1.一种基于Q学习的联合信道和路由选择跨层决策方法,其特征在于,所述方法包括:步骤1,获取坐标:在前期,网络中的路由节点通过配备的定位系统获取自身的实时坐标信息;步骤2,每个路由节点周期性的广播用来发现、建立、保活邻居关系的报文,即Hello包;当邻居节点接收到Hello包后反馈一个包含自己的地址和坐标信息的确认报文,即ACK;收到ACK的路由节点,将邻居信息记录在邻居表中,建立好邻居关系;步骤3,当源节点有数据需要传输时,源节点按照选择策略选择出下一跳节点和信道;并将选择的下一跳节点的地址、目的节点的地址加在数据包中,向外传输;步骤4,当邻居节点接收到数据包时,对比数据包中下一跳节点的地址与自己的地址是否相同;如果不同,认为数据包不是让自己转发的,则丢弃不进行处理转发;当报文中下一跳节点的地址与自己的地址相同时,则继续对数据包处理并分析接收到的信号来估计信干比;步骤5,下一跳节点通过控制链路向源节点回复,回复信息中包含估计的信干比和自己最新的Q表;步骤6,源节点根据反馈的信干比和前期获得的位置计算奖励值;步骤7,源节点根据奖励值更新Q表和节点选择策略;步骤8,下一跳节点重复步骤3至步骤7中源节点的过程直到数据包发送到目的节点;信干比通过以下方法确定:在多跳路由通信系统中,信道模型受到大尺度衰落的影响,从第l跳节点到第l+1跳节点的信道增益,记为hl,l+1,表示为: 其中表示第l跳节点到第l+1跳节点的距离,β表示路径衰落因子;第l+1跳节点到干扰机之间的信道增益hj,l+1表示为假设路由节点的发射功率相同为Pt,干扰机的发射功率为Pj,则第l+1跳节点Nl+1的接收信干比SJNRl+1为: 其中σft表示通信信道ft的信道噪声,ψft-fj指示函数表示如下: 其中ft表示第l跳节点和第l+1跳节点之间的通信信道,fj表示干扰所在的信道;当ft=fj时表示路由节点接入的信道与干扰所在信道相同,数据链路被干扰;步骤6,源节点根据反馈的信干比和前期获得的位置计算奖励值,包括:根据接收信干比SJNRl+1,第l跳节点和第l+1跳节点之间的用户通信速率Cl,l+1为: 其中w表示通信信道的信道带宽,SJNRth表示接收机成功解调的信干比门限;当接收SJNRl+1低于解调门限时,第l+1跳节点无法正确解调信号,认为被干扰,通信速率为0;再根据传输速率和位置信息计算奖励值: 其中,rc、re分别是两个负数,作用是躲避干扰并选择下一跳越来越靠近目的节点的动作;dl,D、dl+1,D、dS,D分别表示第l跳节点、第l+1跳节点和源节点到目的节点的距离;w1、w2是两个权重系数,能够调整传输速率和下一跳节点位置的影响大小,满足w1+w2=1;第l跳节点Nl的下一跳节点和信道选择只与第l-1跳节点Nl-1的下一跳节点和信道选择有关,与之前链路的节点和信道选择无关,因此Nl的下一跳节点和信道选择问题视为离散时间马尔科夫决策过程MDP;MDP模型通过一个四元组定义为表示状态空间,表示动作空间,表示状态转移概率,表示奖励值;MDP模型中核心元素定义如下:定义状态空间 其中Sl表示第l跳节点的状态,Nl表示当前所在的路由节点,表示当前干扰所在的信道,L表示可用信道的个数,Ql代表第l跳能够选择的路由节点数;定义动作空间 其中al表示第l跳节点的动作,al=Nl+1,ftl+1,Nl+1表示第l跳的节点选择的第l+1跳节点,ftl+1表示连接第l跳和第l+1跳节点的通信信道,Ql+1代表第l+1跳能够选择的路由节点数;定义状态转移概率矩阵表示从状态Sl选择动作al到达状态Sl+1的概率;定义奖励值RSl,al表示在状态Sl下选择动作al得到的即时奖励值;将跳数和地理位置建立联系,选择距离目的节点更近的路由节点作为下一跳;即距离目的节点越近需要转发的次数越少,距离越远需要转发的次数越多;因此定义每一跳的奖励值为rSl,al: 其中,rc、re是两个负数,目的是尽量躲避干扰并选择下一跳越来越靠近目的节点的动作;w1、w2是两个权重系数,能够调整传输速率和下一跳节点位置的影响大小,满足w1+w2=1;dl,D、dl+1,D、dS,D分别表示第l跳节点、第l+1跳节点和源节点到目的节点的距离;当dl,D-dl+1,D<0时表示当前节点选择了一个距离目的节点更远的下一跳,此时节点选择错误,给一个负值奖励rc;当dl,D-dl+1,D>0时,表示当前节点选择了一个更靠近目的节点的下一跳,节点选择正确;步骤7,源节点根据奖励值更新Q表和节点选择策略,包括:对于任意第l跳节点,Q表的更新公式为: 其中α∈0,1为学习速率,γ为折扣因子,rl为当前状态Sl选择动作al的即时回报值,Sl状态在路由节点选择并执行动作al后变为Sl+1状态;Ql,tSl,al表示在当前状态Sl下选择动作al的Q值,Ql,t+1Sl,al表示更新后的Q值;定义路由节点和信道选择策略PlN、的更新公式为: 其中表示在状态Sl下选择Nl+1节点对应的最大Q值,maxQl+1Sl+1,:,:表示在下一个状态Sl+1下能够获得的最大Q值;β为玻尔兹曼模型的相关参数: 其中,β0表示探索阶段的开始,βfinal表示探索阶段的结束,τ是玻尔兹曼模型的第一参数,v是玻尔兹曼模型的第二参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军陆军工程大学,其通讯地址为:210007 江苏省南京市秦淮区后标营88号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。