一种基于深度强化学习的含碳捕集多源电力系统调度方法

导航：龙图腾网> 最新专利技术> 一种基于深度强化学习的含碳捕集多源电力系统调度方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：太原理工大学

摘要：本发明属于电力领域，具体是一种基于深度强化学习的含碳捕集多源电力系统调度方法。包括S1：初始化强化学习训练参数；S2：智能体获取当前电力系统负荷需求得到环境状态，通过观测环境状态给出调度动作；S3：计算调度动作所获得的奖励函数值；S4：收集样本存入经验池；S5：重复步骤S2‑S4，直至经验池有N条经验；S6：取出N条经验，更新Critic网络参数以及Actor网络参数，并清空经验池；S7：重复步骤S2‑S6，当训练回合达到最大训练回合数，训练结束，保存网络参数；S8：在线应用已经训练好的Actor网络参数。

主权项：1.一种基于深度强化学习的含碳捕集多源电力系统调度方法，其特征在于，包括：S1：初始化训练参数，包括设定每回合更新经验条数N、每回合训练次数T以及最大迭代次数，初始化神经网络经验池；初始化电力系统工作状态，各类电源的出力以及当前时刻电负荷；S2：智能体获取当前电力系统负荷需求得到环境状态，通过观测环境状态给出调度动作；S3：计算调度动作所获得的奖励函数值；S4：收集样本存入经验池；S5：重复步骤S2-S4，直至经验池有N条经验；S6：取出N条经验，更新Critic网络参数以及Actor网络参数，并清空经验池；S7：重复步骤S2-S6，当训练回合达到最大训练回合数，训练结束，保存网络参数；S8：在线应用已经训练好的Actor网络参数，获取当前时刻的环境状态输入至Actor网络，根据最优策略输出调度动作，计算奖励函数值，并转移至下一环境状态。

全文数据：

权利要求：

百度查询：太原理工大学一种基于深度强化学习的含碳捕集多源电力系统调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：测试方法、装置、电子设备及可读存储介质及产品

下一篇：一种汽轮机启动疏水再利用系统及其方法

相关技术

测试方法、装置、电子设备及可读存储介质及产品

一种汽轮机启动疏水再利用系统及其方法

半导体器件及其制备方法

一种缺陷检测方法和相关设备

一种进气管的清洗方法及半导体工艺设备

基于大数据的深度神经网络构建音频数据搜索方法及系统

一种荧光硅点、荧光硅点制备方法、pH检测方法及生物传感器

一种碳纤维纺丝前驱体及碳纤维的生产方法

金属燃料电池与其他类型蓄电池的协同应用系统及方法

一种全固废水下不分散混凝土及其制备方法

一种潮气量检测系统及装置

一种正负可调叠加高频脉冲的电源

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度强化学习的含碳捕集多源电力系统调度方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务