买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种自适应拓扑变化的配电网无功电压控制方法,基于云边协同架构将配电网无功电压控制任务分成两个阶段:部署于云侧平台的配电网全局电压优化策略及部署于边侧计算中心的分布式光伏无功控制策略,在配电网拓扑发生变化后,基于原始网络结构配电网无功电压控制策略进行迁移学习。本发明针对配电网拓扑变化导致原有配电网电压控制策略不再适用的问题,采取基于残差网络的迁移学习算法,结合原有的配电网电压控制策略在新拓扑结构下的少量运行数据样本,自适应修正原有的配电网电压控制策略,从而在保障配电网持续可靠供应优质电力的同时,避免了重新训练配电网电压控制模型,节省了算力资源和训练时间。
主权项:1.一种自适应拓扑变化的配电网无功电压控制方法,其特征在于,所述方法基于云边协同架构,将分布式光伏无功电压控制方法分为基于云侧平台的配电网全局电压控制策略和基于边侧计算中心的配电网无功电压控制策略;基于云侧平台的配电网全局电压控制策略以变压器调节抽头、电容器投切组和分布式光伏无功功率为控制对象,结合云侧平台收集到的配电网数据,以最小总功率损耗为目标函数,以配电网安全稳定运行为约束条件,基于配电网无功电压控制模型求解,获取变压器调节抽头、电容器投切组和分布式光伏基准无功功率的24h内最优调度结果,并将24h内最优调度结果分发至边侧计算中心;所述基于云侧平台的配电网全局电压控制策略的目标函数和约束条件如下:1.1目标函数: 式中,tapt表示变压器调节抽头在第t时刻的调节档位;cim,t表示接入节点i的电容器投切组的第m个电容器在第t时刻的投切状态,cim,t为[0,1]变量;QPVi,t表示接入节点i的分布式光伏在第t时刻的无功功率;T表示24h的调度周期;E表示配电网中输电线路的集合;lij,t表示首端节点为i末端节点为j的输电线路上在第t时刻流过的电流幅值的平方;rij表示首端节点为i末端节点为j的输电线路的电阻;1.2约束条件: vi,t=vj,t+2Pij,trij+Qij,txij+lij,trij2+xij2 式中,PPVj,t、QPVj,t分别表示接入节点j的分布式光伏在第t时刻的有功功率和无功功率;PLj,t、QLj,t分别表示接入节点j的负荷在第t时刻的有功功率和无功功率;QCBi,t、QCBj,t分别表示接入节点i和节点j的电容器投切组在第t时刻的无功功率;Pij,t、Qij,t分别表示第t时刻节点i流入节点j的有功功率和无功功率;Pjk,t、Qjk,t分别表示第t时刻节点j流入节点k的有功功率和无功功率;ljk,t表示首端节点为j末端节点为k的输电线路上在第t时刻流过的电流幅值的平方;rjk表示首端节点为j末端节点为k的输电线路的电阻;xjk表示首端节点为j末端节点为k的输电线路的电抗;xij表示首端节点为i末端节点为j的输电线路的电抗;v1,t、vi,t和vj,t分别表示第t时刻节点1、节点i和节点j的电压幅值的平方;Vmin、Vmax分别表示节点电压幅值的最小值和最大值;Vs表示平衡节点处的电压标幺值;ΔVT表示变压器调节抽头的调节单位;tapt+1表示变压器调节抽头在第t+1时刻的调节档位;βt表示变压器调节抽头在第t时刻档位调节的最大值;tapmax表示变压器调节抽头在24h内档位调整动作的最大值;cim,t、cim,t+1分别表示接入节点i的电容器投切组中第m个电容器在第t、t+1时刻的投切状态;aim,t=cim,t·cim,t+1,aim,t为[0,1]变量;bim,t表示接入节点i的电容器投切组中的第m个电容器在相邻时刻的运行状态是否发生变化,bim,t为[0,1]变量;qim,t表示接入节点i的电容器投切组中的第m个电容器的无功功率;capim,max表示接入节点i的电容器投切组中的第m个电容器在24h内投切状态改变次数的最大值;SPVi表示接入节点i的分布式光伏的额定视在功率;PPVi,t表示接入节点i的分布式光伏在第t时刻的有功功率;边侧计算中心基于深度神经网络,采用深度强化学习算法离线训练其内部部署的配电网无功电压控制器;在离线训练过程中,控制器基于云侧平台下发的变压器调节抽头、电容器投切组和分布式光伏无功功率的最优调度结果以及采集到的分布式光伏有功和无功输出功率,考虑节点电压和分布式光伏无功出力约束,建立以有功损失最小为目标的动作价值函数,然后解析计算动作价值函数相对于深度神经网络结构参数的回归梯度,并将结果用于深度神经网络的参数更新;每次迭代,控制器根据深度神经网络做出动作,并与仿真环境交互,仿真环境接收控制器的动作,从而进行潮流计算,并更新控制器的下一步状态;所述配电网无功电压控制器的训练过程如下:2.1将配电网当前状态Statex作为控制器的输入,获取控制器的输出并进一步获取仿真环境的动作其中,当前状态Statex包括各分布式光伏的有功输出值与变压器调节抽头和电容器投切组的调度结果,即Vx,tapx分别表示当前状态的分布式光伏有功功率向量、节点电压向量、分布式光伏无功功率向量、电容器投切组无功功率向量、变压器调节抽头的调节档位;控制器的输出表示前后状态的分布式光伏的无功输出差值即分别表示接入节点i的分布式光伏下一个状态和当前状态的无功功率;仿真环境的动作由对应的控制器产生,表示为Wi,bi是深度神经网络中各连接层之间的权重和偏差,表示深度神经网络的输出,ε0,σx表示控制器在做出探索动作过程中受到的噪声扰动,噪声服从正态分布,均值为0,标准差为σx;2.2基于配电网当前状态Statex、控制器的输出和配电网下一个状态Statex+1,获取动作价值RStatex,ax;构造无功电压控制策略的目标函数F如下: 其中,为电力系统的有功功率损耗,为平均电压违反值,为无功能力违反值,λ1和λ2均为极大值; 式中,gij为首端节点为i末端节点为j的输电线路的电导;和分别表示当前状态中节点i和节点j的电压幅值;表示当前状态中节点i和节点j的电压相角差;和分别表示当前状态中超越电压上限和超越电压下限的节点数;NPV为分布式光伏的数量;和分别表示当前状态接入节点i的分布式光伏的无功功率上限和无功功率下限,2.3基于电压灵敏度估计配电网下一个状态Statex+1的电压幅值,重复2.1-2.3生成训练数据集;其中,电压灵敏度矩阵S表示如下: 式中,为雅各比矩阵,JPδ、JQδ、JPV、JQV分别为对应雅各比矩阵的4个分块矩阵,P为节点输入有功功率向量,Q为节点输入无功功率向量,δ为节点电压相角向量,V为节点电压幅值向量;配电网下一个状态Statex+1的电压幅值的计算公式如下: 式中,表示下一个状态中节点i的电压幅值;Sij为电压灵敏度矩阵S中对应节点i和节点j之间关系的元素;为仿真环境的动作决策中,对应节点j的无功功率动作值;2.4采用基于电压灵敏度的确定梯度上升法,计算动作价值函数的梯度并更新深度神经网络的参数,使得当前状态的动作值逼近奖励值最大的期望动作;深度神经网络的梯度计算和更新方式如下: 式中,n表示深度神经网络梯度更新时使用的样本数量,D表示样本数据集合,d表示一个样本数据,包含Statex、outputx、RStatex,ax和Statex+1,表示深度神经网络第r次更新时结构参数的修正值,Sx、ax分别表示样本数据集合D中一个样本数据的当前状态和动作值,表示一个样本数据中动作值相对于状态值的梯度;表示一个样本数据中价值函数相对于动作值的梯度;θr、θr+1分别表示深度神经网络第r、r+1次更新后的深度神经网络结构参数,η表示深度神经网络参数更新的学习率,W、b分别表示权重和偏差,Nb表示配电网输电线路数量,gl表示配电网输电线路的电导,表示电压灵敏度矩阵中对应节点i和节点p的元素;表示电压灵敏度矩阵中对应节点j和节点p的元素,其中节点i属于违反节点电压上限约束的节点,节点j属于违反节点电压下限约束的节点,节点p属于分布式光伏接入的节点;表示深度神经网络基于当前状态Statex的输出值outputx向量中对应接入节点p的分布式光伏的元素,表示当前状态Statex中接入节点p的分布式光伏的无功功率,QPV,min、QPV,max分别表示分布式光伏的无功功率输出下限和上限;在配电网拓扑结构发生变化后,边侧计算中心首先对原有的配电网无功电压控制器进行离线测试,生成小样本测试数据集,结合原有控制器中的深度神经网络结构参数,构建残差神经网络,并根据生成的小样本测试数据集,对残差神经网络进行迁移学习训练,最终得到适用于拓扑结构发生变化后的配电网无功电压控制器;所述迁移学习训练的过程如下:3.1在迁移学习训练的初始阶段,采用基于状态差异的迁移方法,通过最小化小样本测试数据集中变化前后拓扑之间状态的最大平均差异,在不标记目标样本的情况下预训练初始目标模型,最大平均差异的计算公式如下: 式中,分别表示控制器基于变化前、后的配电网拓扑结构生成的测试数据集中的当前状态;将最大平均差异引入确定性梯度更新策略中,对残差神经网络进行再训练,具体的梯度更新过程如下: 式中,n′表示残差神经网络更新时使用的样本数量,D′表示用于迁移学习的样本数据集合,D′<<D,d′表示D′中的一个样本数据,包含Statex′、outputx′、R′Statex′,ax′和Statex+1′,表示基于最大平均差异计算得出的梯度,λ表示权重参数;3.2针对变化后的配电网拓扑,若控制器基于状态采取动作对应的下一个状态违背节点电压约束或者无功功率约束,则此时的状态动作和下一个状态构成1个标签数据;利用所有的标签数据对残差神经网络进行深度强化学习,在状态附近生成相似状态 式中,和分别表示基于正态分布的分布式光伏有功、无功修正值,为考虑分布式光伏有功或无功修正后的节点电压修正值;3.3使用主动泛化学习对控制器进行训练,即随机生成初始状态并进行深度强化学习。
全文数据:
权利要求:
百度查询: 南京理工大学 一种自适应拓扑变化的配电网无功/电压控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。