一种基于深度强化学习的异构网络切片调度方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国电子科技集团公司第七研究所

摘要：本发明公开了一种基于深度强化学习的异构网络切片调度方法，所述的方法采用对神经网络离线训练阶段和在线切片调度阶段作为一个调度周期交替进行的方式实现，具体如下：S1：对深度强化学习模型进行离线训练阶段；S2：在线切片调度阶段。本发明采用一种基于深度强化学习的异构网络切片调度算法，在与环境的交互中学习切片调度策略，在神经网络训练和切片调度反复迭代中学出最优的调度策略，即切片可用带宽阈值是在与多变的环境交互中不断变化的，直到学习出最优的调度阈值为止。同等实验条件下，本发明在QoS满足率、业务传输完成时间、切片带宽平均利用率上均有提升。

主权项：1.一种基于深度强化学习的异构网络切片调度方法，其特征在于：所述的方法采用对神经网络离线训练阶段和在线切片调度阶段作为一个调度周期交替进行的方式实现，具体如下：S1：对深度强化学习模型进行离线训练阶段S101：将得到的业务QoS需求信息和切片状态信息构成环境的状态参数，并作为深度强化学习模型的输入，深度强化学习模型输出一组概率向量，代表选择每个切片的概率值；S102：切片调度器选择概率值最大的切片进行调度，调度完成后更新环境状态，并得到反馈的奖励函数值；其中，所述的奖励函数值表示所选择切片的网络性能与业务QoS需求相符的程度：其中，λ、α、β均表示权重，0＜λ＜1，0＜α＜1，0＜β1；xt,i表示在第t个调度周期，第i个切片的可用带宽；wt，i表示在第t个调度周期，业务请求的带宽需求；ut，i表示在第t个调度周期，业务请求的时延要求；dt，i表示在第t个调度周期，第i个切片的平均往返时延；vt，i表示在第t个调度周期，第i个切片的丢包率；ct，i表示在第t个调度周期，业务请求的丢包率要求；S103：根据奖励函数值的最大值，得到此时最优的调度策略为每个切片的可用带宽阈值；选择可用带宽高于可用带宽阈值的切片进行传输；S2：在线切片调度阶段S201：根据步骤S103得到的调度策略进行调度，并把每次调度的信息以经验元组的形式保存到经验回收池中；S202：在线调度结束后，从经验回收池中按批次大小取出经验信息，回到步骤S1继续离线训练深度强化学习模型，得到更好的调度策略。

全文数据：

权利要求：

百度查询：中国电子科技集团公司第七研究所一种基于深度强化学习的异构网络切片调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于治疗胰腺癌的帕特胺A衍生物

下一篇：完整性检查方法以及相关联计算机程序和设备

相关技术

用于治疗胰腺癌的帕特胺A衍生物

完整性检查方法以及相关联计算机程序和设备

指纹识别组件及智能门锁

一种具有清洁组件的制袋机自动放卷设备

一种高覆膜强度白卡纸的涂料

散热器及具有该散热器的燃料电池冷却系统

一种防弹隐身方舱

生活垃圾填埋场内垃圾堆体边坡的绿化结构及施工方法

一种基于牙颌面畸形锥束CT图像的三维颌面重建方法

烹饪设备

用于处理与电机相关联的数据的方法和装置

一种园林用草坪修剪机

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度强化学习的异构网络切片调度方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务