买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:航天恒星科技有限公司;北京卫星信息工程研究所;北京理工大学
摘要:本发明涉及一种基于分域优化的卫星时间敏感路由调度方法,通过将卫星网络建模为虚拟节点的网络拓扑,根据卫星的实时位置动态分配卫星对应的虚拟节点,根据获取的节点业务信息对业务进行分类,生成业务的具有最小时延代价的最短路径,再根据业务的调度优先级,对高调度优先级时敏业务按最短路径转发,对中、低调度优先级时敏业务进行路径优化,对非时敏业务生成调度路径优化全局网络负载均衡性能后,再对业务进行转发调度,可实现在卫星网络动态拓扑下对于时敏业务的确定性时延保障,降低了链路切换带来的时延抖动,同时提高了网络资源利用率。
主权项:1.一种基于分域优化的卫星时间敏感路由调度方法,其特征在于,包括以下步骤:步骤S1、基于卫星覆盖范围划分虚拟节点坐标,将卫星网络建模为虚拟节点网络拓扑,根据卫星的实时位置动态分配卫星对应的虚拟节点;步骤S2、对于所述虚拟节点网络拓扑中任意一个作为源节点的所述虚拟节点,获取所述虚拟节点的节点业务信息,对业务进行分类,将所述业务分为非时敏业务、时敏业务;步骤S3、基于所述虚拟节点网络拓扑,采用最短路径算法,生成所述业务的一条最小时延路径,根据所述业务的最小转发时延与业务转发期限计算所述业务的调度优先级;其中,所述步骤S3包括:步骤S31、根据所述虚拟节点网络拓扑与所述节点业务信息,通过dijkstra算法以所述业务的最小转发时延为代价从所述虚拟节点网络拓扑查找出一条从所述业务的源节点st到目标节点en的最短路径作为所述最小时延路径并记录所述最小时延路径的传输时延为所述最小转发时延步骤S32、根据所述业务的所述最小转发时延与所述业务转发期限,计算所述业务的调度优先级的等级,其计算公式如下所示: 其中timenow表示业务f的当前时间点,φf为所述业务f的调度优先级,定义为所述业务f的剩余转发时间与所述最小转发时延之比,并反映业务最大可转发次数,所述业务最大可转发次数越低,所述业务f的调度优先级越高;nmax、nlow分别表示转发次数限制的最大值和最小值;当时,业务f的调度优先级为高,φf=max;当时,业务f的调度优先级为中,对于调度优先级为中的时敏业务,其调度优先级根据其剩余可转发次数动态变化;当时,业务f的调度优先级为低,φf=low;步骤S4、基于所述业务的调度优先级,为中、低调度优先级的时敏业务根据其所述最小时延路径所经过的所述虚拟节点,生成所述业务f的优化域在所述步骤S4中,具体包括:对于调度优先级为中、低级的时敏业务,根据其所述最小时延路径记录所述最小时延路径中处于不同轨道的所述虚拟节点所使用到的所有轨道{orbit1,orbit2,…,orbitn};对于处于相同轨道的所述虚拟节点,记录所述最小时延路径在此轨道上占用所有所述虚拟节点与路径方向{sate1,sate2,…,satem};对于每条轨道orbit,记录同方向同数量的所述虚拟节点,构成新的卫星节点集合并根据所述新的卫星节点集合,生成所述业务的优化域其中表示所述优化域内虚拟节点的集合,表示所述优化域内卫星链路的集合;步骤S5、对于高调度优先级的时敏业务,依据其所述最小时延路径立即转发;步骤S6、对于中、低调度优先级的时敏业务,通过第一强化学习算法,根据业务的类型,在所述优化域内进行时延与时延抖动优化,生成第一优化调度路径;步骤S7、对于非时敏业务,通过第二强化学习算法,生成第二优化调度路径,优化全局网络负载均衡性能;在所述步骤S6中,具体包括:步骤S61、设置智能体参数,所述智能体参数包括状态now_s、动作a、状态next_s、学习策略、回报r和Q值,状态now_s为智能体所在的节点;动作a为智能体可选择的下一节点方向,包括上、下、左和右;状态next_s为智能体根据选择的动作去往的下一个节点;学习策略为智能体从起点为源节点st到终点为目标节点en过程中选择的动作集合;回报r为智能体执行一次动作后对此动作的评价;Q值表示智能体所执行动作的综合评价,如果当前状态now_s不是目标节点en,所述Q值按式2计算:Qnow_s,a=Qnow_s,a+alpha×r+gamma×Qnext_s,a-Qnow_s,a2否则,所述Q值按式3计算:Qnow_s,a=Qnow_s,a+alpha×r-Qnow_s,a3其中,alpha是学习率,gamma是折扣系数;步骤S62、设置算法奖励,其表达式为: 其中,time表示每一跳的总时延属性值,ttra表示每一跳的传输时延属性值,tque表示每一跳的排队时延属性值,tpro表示每一跳的处理时延属性值,tsen表示每一跳的发送时延属性值,j表示每一跳的时延抖动属性值,ω1表示业务流对于时延的敏感度,ω2表示业务流对于时延抖动的敏感度,ω1、ω2为和为1的两个非负参数;步骤S63、智能体根据所述智能体参数、所述优化域和所述算法奖励进行迭代,当智能体选择下一跳节点等于业务目标节点时,即智能体成功找到一条可行的学习策略,结束一次迭代;根据智能体每次执行的动作a的Q值,生成Q表,并在每次迭代完成后,记录本次迭代的总回报R;步骤S64、根据上一次迭代完成后的Q表,进行下一轮迭代,直到达到最大迭代次数;步骤S65、迭代完成后根据记录的所有迭代的总回报R,挑选出总回报R最大时的迭代结果,作为本轮优化最终的第一优化调度路径;在所述步骤S7中,具体包括:对于非时敏业务,利用所述第二强化学习算法,在所述虚拟节点网络拓扑内针对全局网络负载均衡性能进行优化,将所述第二强化学习算法的算法奖励设置为: 其中bwe表示链路e的剩余可用带宽,BWe表示链路e的总带宽,ω3、ω4为两个和为1的常数且ω3取决于当前网络拥塞程度;ttra表示每一跳的传输时延属性值;所述网络拥塞程度通过网络中所有链路的总带宽使用率来表示,即为: 其中ω3表示网络总带宽使用率,N表示网络总链路数量;当网络拥塞时,智能体在选择路径时偏向于未使用的路径;反之网络空闲时,智能体偏向选择时延较短的路径,以对链路资源进行合理分配;步骤S8、基于所选调度路径与调度优先级,对中、低调度优先级的时敏业务和所述非时敏业务进行不同节点之间的转发调度。
全文数据:
权利要求:
百度查询: 航天恒星科技有限公司 北京卫星信息工程研究所 北京理工大学 基于分域优化的卫星时间敏感路由调度方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。