Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向多边缘服务提供商场景的电池调度方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民解放军国防科技大学

摘要:本发明涉及一种面向多边缘服务提供商场景的电池调度方法和装置。所述方法包括:在由多个边缘服务提供商和多个电池组成的感兴趣边缘计算区域内,为每一个边缘服务提供商建立一个独立智能体,并重新定义:1智能体执行的动作以降低动作空间的维度,以及2执行动作后的奖励,以对齐优化目标,即降低碳排放和电池退化成本。采用分布式训练和分布式执行策略,并增加Q值钱扰动策略,以此隔离各个智能体的训练和推理,实现信息保护,此外,设计动作转换机制,将定义的动作转换为智能体中电池实际充放电操作,提高了整体训练和执行效率。本方法具备有效协调多个边缘服务提供商的能力,能够实现碳排放减少高达60%,同时保持隐私并控制开销。

主权项:1.一种面向多边缘服务提供商场景的电池调度方法,其特征在于,所述方法包括:确定感兴趣的边缘计算区域;在所述边缘计算区域内,包含多个边缘服务提供商以及多个电池;每个边缘服务提供商拥有一组边缘服务器和一组电池;每个边缘服务提供商作为一个独立的智能体运行;确定智能体的动作及其执行动作后的奖励的定义;其中,根据智能体所拥有的所有电池的充电状态总和定义动作,根据碳排放和电池退化成本定义执行动作后的奖励;获取智能体的元组样本;其中,一个元组由当前时隙和下一个时隙的系统状态、智能体动作以及执行动作后的奖励构成;当前和下一个时隙的系统状态通过合并时隙内所有智能体的局部观测而得;将每个智能体的局部观测输入相应的深度递归Q网络中,得到对应的第一Q值并对其进行扰动,然后将所有智能体的第一扰动Q值进行聚合,得到第一联合Q值;将每个智能体执行动作后的局部观测输入相应的目标Q网络中,得到对应的第二Q值并对其进行扰动,然后将所有智能体的第二扰动Q值进行聚合,得到第二联合Q值,根据第二联合Q值和所有智能体执行动作后的奖励得到目标值;其中,目标Q网络和深度递归Q网络的网络结构相同;根据第一联合Q值和目标值构建损失函数,当损失函数收敛时,得到训练好的深度递归Q网络;将智能体的实际局部观测输入训练好的深度递归Q网络中,输出智能体Q值,并通过贪婪选择得到动作并指导电池的充放电动作。

全文数据:

权利要求:

百度查询: 中国人民解放军国防科技大学 一种面向多边缘服务提供商场景的电池调度方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。