首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种自适应不确定性的电力系统动态经济调度方法 

申请/专利权人:国家电网公司华中分部;武汉大学

申请日:2022-05-23

公开(公告)日:2024-07-05

公开(公告)号:CN114897388B

主分类号:G06Q10/0631

分类号:G06Q10/0631;G06Q50/06;H02J3/00;H02J3/46

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2022.09.09#实质审查的生效;2022.08.12#公开

摘要:本发明提出了一种自适应不确定性的电力系统动态经济调度方法。在新能源大规模并网的背景下,电源侧的不确定性将给调度问题带来新的挑战,现有调度策略可能失去原有效力。本发明搭建了电力系统经济调度模型,并完成了对电力系统环境感知方法设计,再利用深度强化学习的思想,提出了一种自适应不确定性的调度方法,针对不确定性电力系统对方法机制进行了改进。

主权项:1.一种自适应不确定性的电力系统动态经济调度方法,其特征在于,包括以下步骤:步骤1,导入电力系统中每个调度时段的状态变量,所述电力系统每个调度时段的状态变量包括每个调度时段的发电机组状态变量、每个调度时段的新能源状态变量、每个调度时段的负荷状态变量;得到的数据包含了所有调度时间段的状态,调度日数为D,以每个调度日作为一个调度周期,每个调度周期包含了T个调度时段;以下表述某个调度时段t的状态空间表述方法:首先需要观测发电机组的出力值、向上备用容量、向下备用容量,N台发电机组的状态空间可用下式归纳:sG,t=P1,t,P2,t…PN,t,U1,t,U2,t…UN,t,D1,t,D2,t…DN,t式中,下标中t表示第t个调度时刻,sG,t表示发电机组状态空间,下标数字1,2,…N代表发电机编号,P代表功率,U代表发电机向上备用容量,D代表发电机向下备用容量;其次对于具有随机性的光伏出力、风电出力、负荷,不仅考虑了其实时值的大小,还考虑了其时序相关性而引入其一次导数和二次导数:sM,t=PPV,t,PWT,t,PL,t,PPV,d1,t,PWT,d1,t,PL,d1,t,PPV,d2,t,PWT,d2,t,PL,d2,t式中,下标中t表示第t个调度时刻,sM,t表示第t个调度时段的随机状态空间,PPV,t为第t个调度时段光伏出力,PWT,t为第t个调度时段风机出力,PL,t为第t个调度时段负荷需求;下标中d1表示一次导数,d2表示二次导数,第t个调度时段的一次导数和二次导数求解方法如下:PPV,d1,t=PPV,t-PPV,t-1PPV,d2,t=PPV,t-2PPV,t-1+PPV,t-2PWT,d1,t=PWT,t-PWT,t-1PWT,d2,t=PWT,t-2PWT,t-1+PWT,t-2PL,d1,t=PL,t-PL,t-1PL,d2,t=PL,t-2PL,t-1+PL,t-2式中PPV,t为第t个调度时段光伏出力,PWT,t为第t个调度时段风机出力,PL,t为第t个调度时段负荷需求;PPV,t-1为第t-1个调度时段光伏出力,PWT,t-1为第t-1个调度时段风机出力,PL,t-1为第t-1个调度时段负荷需求;PPV,d1,t为第t个调度时段光伏出力的一次导数,PWT,d1,t为第t个调度时段风机出力的一次导数,PL,d1,t为第t个调度时段负荷需求的一次导数,PPV,d2,t为第t个调度时段光伏出力的二次导数,PWT,d2,t为第t个调度时段风机出力的二次导数,PL,d2,t为第t个调度时段负荷需求的二次导数则获取的维数为3N+9的状态空间最终可以表示为:st={sG,t,sM,t}式中,st为第t个调度时刻状态空间,sG,t为第t个调度时刻发电机组状态空间,sM,t表示第t个调度时段的随机状态空间;步骤2,初始化策略网络和Q值网络,包括了:原策略网络参数θQ,目标策略网络参数θQ',原Q值网络参数θμ,目标Q值网络参数θμ',设定学习迭代次数K,确定调度周期长度T,初始化经验池,设定动作-学习比例Z;初始迭代次数k=0,调度时段t=0;确定折扣因子γ∈[0,1];步骤3,初始化电力系统状态.随机选择一个调度日的第一个调度时段t=0初始化状态空间s0;迭代次数k=k+1;步骤4,根据策略网络输出决策动作值,并以探索性动作机制执行实际动作值,调度时段t=t+1;实际动作值可用下式表示: 其中,是策略网络采取的实际动作,由常规发电机组功率调整值以及向上备用调整值向下备用调整值组成,at是输出的决策动作,n为随机噪声,p为随着迭代次数逐渐衰减的噪声占比;步骤5,根据策略网络采取的实际动作计算即时奖励rt;即时奖励rt可由下式给出:rt=-0.05FG,t+FR,t+FS,t式中FG,t为发电机组在第t个调度时段的常规发电机成本,FR,t为发电机组在第t个调度时段的备用成本,FS,t为发电机组在第t个调度时段的随机性成本;具体为: 其中,下标中t表示第t个调度时段,对于第t个调度时段:hi为第i个机组对应的常数项成本系数,bi为第i个机组对应的一次项成本系数,ci为第i个机组对应的二次项成本系数,模型内考虑有N个常规机组;备用成本为系统预旋转备用产生的成本: 式中,下标中t表示第t个调度时段,对于第t个调度时段:FR,t为备用成本,Ui,t为第i个发电机的向上备用容量,Di,t为第i个发电机的向上备用容量,kU为向上备用成本系数,kD为向下备用成本系数;随机性成本充分考虑了电力系统的不确定性,是由光伏以及风电出力的预测误差造成的,预测误差造成的功率差额可由旋转备用弥补,但超出备用裕量时会导致切负荷或是弃风、弃光现象:FS,t=cUPU,t+cDPD,t+cLPL,t+cAPA,tt式中,下标中t表示第t个调度时段,对于第t个调度时段:FS,t为随机性成本,PU,t是向上备用功率,PD,t是向下备用功率,PL,t是被切除负荷,PA,t是弃风弃光总功率分,cU是向上备用成本系数,cD是向下备用成本系数,cL是被切除负荷成本系数,cU是弃风弃光成本系数;步骤6,根据第t个调度时段策略网络采取的实际动作值和状态空间st={sG,t,sM,t},确定下一个调度时段状态空间st+1;下一个调度时段状态空间st+1的发电机状态可由下式表示:st+1={sG,t+1,sM,t+1}其中,sM,t+1为第t+1调度时段的随机状态空间,sG,t+1为第t+1调度时段发电机状态;第t+1调度时段发电机状态sG,t+1由第t个调度时段状态st和第t个调度时段采取的实际动作值决定: 步骤7,由步骤3-5得到状态转移过程;状态转移过程可由下式表述:{st,at,rt,st+1}式中,st为第t个调度时段的状态空间,at为第t个调度时段策略网络的输出动作值,rt为第t个调度时段的即时奖励,st+1是第t+1个调度时段的状态空间;记录到经验池中,完成一次经验回收;利用动作-学习比例机制,每回收Z次进行一次学习,Z为设定好的动作-学习比例,作为优选,当Z=4时,每产生4次动作,即产生了4次经验,而学习一次;学习是指更新神经网络参数,具体为如下步骤:步骤7.1,更新原Q值网络: 其中,θQ为原Q值网络的网络参数,αQ为原Q值网络的学习率,为梯度计算函数,LθQ为损失函数;损失函数LθQ具体为:LθQ=Eyt-Qst,at|θQ2式中E·为数学期望函数,st为第t个调度时段状态空间,at|θQ为在原Q值网络参数为θQ条件下第t个调度时段原Q值网络的输出动作值,yt为目标Q值,Qst,at为动作-值函数;目标Q值yt可由下式计算:yt=rt+γQst+1,μ′st+1|θμ′|θQ′;式中rt为第t个调度时段的即时奖励,γ为折扣因子,θμ′为目标策略网络参数,θQ′为目标Q值网络参数;μ′st表示在第t个调度时段条件下,目标网络输出的动作值,定义为:前述式中,动作-值函数Qst,at可由下式定义: 式中,t表示第t个调度时段,st为第t个调度时段状态空间,at为第t个调度时段策略网络的输出动作值,E·为数学期望函数,T为调度周期长度,γ为折扣因子,rt+mst+m,at+m为第t+m个调度时段的即时奖励;步骤7.2,更新原策略网络: 式中,θμ为原策略网络的网络参数,αμ为原策略网络的学习率,为梯度计算函数,μ为原策略网络输出的动作;计算方法为: 其中,下标t表示第t个调度时段,为梯度计算函数,s为状态空间,θQ为原Q值网络参数,θμ为原策略网络参数,a|θQ为在原Q值网络参数为θQ条件下的原Q值网络参数输出动作值;μs表示原网络输出的动作值,定义为:前述式中,动作-值函数Qst,at可由下式定义:步骤7.3,更新目标网络: 其中,θμ′为目标策略网络参数,θQ′为目标Q值网络参数,θQ为原Q值网络参数,θμ为原策略网络参数,τ为软更新模式下的网络更新速度,一般远远小于1;软更新模式导致目标网络更新很慢,好处是学习的稳定性增强,更易于收敛;步骤8,若调度时段t小于调度周期T,则返回第4步;步骤9,若动作次数k小于设定学习迭代次数K,则返回步骤3;否则,训练结束,输出训练后的模型。

全文数据:

权利要求:

百度查询: 国家电网公司华中分部 武汉大学 一种自适应不确定性的电力系统动态经济调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。