首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于局部敏感哈希的改良DDPG强化学习混合能源管理方法 

申请/专利权人:浙大宁波理工学院

申请日:2022-11-10

公开(公告)日:2024-06-21

公开(公告)号:CN115648973B

主分类号:B60L50/60

分类号:B60L50/60;B60L50/40;G06N3/048;G06N3/092

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2023.02.17#实质审查的生效;2023.01.31#公开

摘要:本发明公开一种基于局部敏感哈希的改良DDPG强化学习混合能源管理方法,属于自动化技术领域。本发明提出的改良DDPG算法针对传统DDPG算法对环境探索效率低的缺点,进行了基于局部敏感哈希的探索能力优化。本发明通过局部敏感哈希中的SimHash算法将混合能源系统的状态量映射成指定比特值的哈希码,通过哈希表对哈希码进行模糊计数,并在DDPG算法奖励函数设计中,加入了计数的结果项,用以激励算法产生和已有状态不同的新状态。本发明相比于传统DDPG算法,有更好的环境探索效率,从而能够更好地突破局部最优解,得到更优的控制器。并且本发明在控制性能方面,能够通过超级电容回收更多电量,节约锂电池用电量,降低输出电流波动,保护电池健康程度。

主权项:1.一种基于局部敏感哈希的改良DDPG强化学习混合能源管理方法,用于对由锂电池和超级电容构成的混合能源系统进行管理,其特征在于,步骤如下:S1:结合DDPG强化学习模块和局部敏感哈希模糊计数模块,构建基于局部敏感哈希的改良DDPG强化学习混合能源控制器;所述DDPG强化学习模块由在线动作网络、目标动作网络、在线评价网络和目标评价网络组成,作为混合能源系统的主控制器;所述局部敏感哈希模糊计数模块中,输入是控制器输出的动作量作用于环境后得到的混合能源系统的状态量,输出是在哈希表内查询得到的状态量对应的计数结果;模块中先通过SimHash算法把混合能源系统的状态量新映射成哈希特征码,并利用一张存储已有类别哈希特征码的哈希表,对新映射的哈希特征码进行模糊计数,得到与新映射的哈希特征码匹配的类别数量作为计数结果,用于计算DDPG强化学习模块的奖励函数子部分;S2:获取车辆在不同路况下行驶的实时功率需求数据,并将其作为训练数据对改良DDPG强化学习混合能源控制器进行离线训练,最终训练获得一个确定性的最终控制策略,用于对混合能源系统进行实时能量管理。

全文数据:

权利要求:

百度查询: 浙大宁波理工学院 基于局部敏感哈希的改良DDPG强化学习混合能源管理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。