买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及一种基于变点分组‑二步分位数与DCNN结合的风电数据恢复方法,根据异常数据的不同成因对数据形态进行划分;采集某风电场电表数据的风速‑功率数据样本构成集合;利用变点分组法进行数据清洗,剔除底部堆积型异常数据、中部堆积型异常数据和部分曲线周围分散型异常数据;利用二步分位数算法识别曲线上部堆积型异常数据和剩余的曲线周围分散型异常数据,将异常数据删除得到正常数据集;使用DCNN进行曲线优化,将部分时间点数据缺失的风速‑功率数据构成的曲线进行重构,得到无数据缺失的时间点的风机风速‑功率数据。本发明提升了恢复后风速‑功率数据构成曲线的准确性,保证后续研究数据分析的精度与模型建立的准度。
主权项:1.一种基于变点分组-二步分位数与DCNN结合的风电数据恢复方法,其特征在于,包括:步骤S1:对风电受控出力影响因素进行分析,根据异常数据的不同成因对风速-功率数据形态进行划分;步骤S2:采集风电机组的风速区间的风速-功率数据样本,从而构成风电机组的风速-功率数据样本集合;步骤S3:利用变点分组法对得到的风速-功率数据样本进行清洗,剔除曲线底部堆积型异常数据、曲线中部堆积型异常数据和部分的曲线周围分散型异常数据;步骤S4:利用二步分位数算法识别曲线上部堆积型异常数据和剩余的曲线周围分散型异常数据,进而将所有的异常数据删除得到正常数据集;步骤S5:使用深度卷积神经网络即DCNN进行曲线优化,将清洗后的部分缺失的风速-功率数据点进行重构,得到重构后的无数据缺失的风速-功率数据点;所述步骤S2:具体包括:步骤S21:某一风速区间内的数据样本集合为: ,式中,和分别表示第个数据样本的风速和功率,且数据按照功率值降序排列,即令,;步骤S22:求出各风速-功率数据点方差为: ,其中,为第j个数据点的功率,表示第1个数据点到第i个数据点的功率的平均值;步骤S23:计算方差变化率: ;所述步骤S3中,利用变点分组法,剔除底部堆积型异常数据、中部堆积型异常数据和部分曲线周围分散型异常数据,具体包括:步骤S31:利用变点分组法进行数据清洗,剔除异常数据时,采用最小二乘法对方差变化率进行处理;设是数据样本次序的变量为,有自变量和因变量的函数,其中,是的完全已知非随机函数,为随机变量,分为前后两段,两段各服从一阶线性模型,回归系数在处发生突变,即: ,式中,和为系数列向量,e为自然对数,为回归变点,是连续的,因此有约束条件: ,其中,为回归变点处的完全已知非随机函数;步骤S32:根据最小二乘法的原理,步骤S21中的数据样本模型的加权目标函数为: ,式中,各项的权与样本的误差方差成反比;步骤S33:求出在约束条件下目标函数的最小值,以确定变点的估计值: ,求出变点后,变点之后的数据作为异常数据删除,因而将数据划分为正常数据和异常数据两部分,即: ,式中,为数据样本中风速区间的正常数据集;为数据样本中风速区间的异常数据集,对其他风速区间进行相同处理,即得到风电机组整个风速区间的风速-功率曲线正常数据集和异常数据集;所述步骤S4:利用二步分位数算法识别曲线上部堆积型异常数据和剩余的曲线周围分散型异常数据,进而将上述异常数据删除得到正常数据集,具体包括:步骤S41:将风速区间内的风速-功率数据样本根据功率升序依次排列并分为四等份,处于分割点位置的三个数值,和就是分位数,将功率升序中间数据集记为,分位数计算方法如下:(1)计算第2个四分位数,即中位数为: ,(2)计算第1和第3个四分位数和:当时,从处将数据样本分为两部分但不包含,分别计算这两部分的中位数,得到的这两个中位数即为和;当时,有: ,其中为分位点参数,有;同理,时,有: ,(3)得到分位距: ,得到样本数据的异常值的内限: , 中处于内限外的数据都为曲线上部堆积型异常数据和剩余的曲线周围分散型异常数据,即功率异常数据集为: ,步骤S42:将风速区间内的风速-功率数据样本根据风速升序依次排列并分为四等份,处于分割点位置的三个数值,和就是分位数,将风速升序中间数据集记为,分位数计算方法如下:(1)计算第2个四分位数,即中位数为: ,(2)计算第1和第3个四分位数和:当时,从处将数据样本分为两部分不包含,分别计算这两部分的中位数,得到的这两个中位数即为和;当时,有: ,其中,为分位点参数,有;同理,时,有: ,(3)得到分位距: ,得到样本数据的异常值的内限: ,样本中处于内限外的数据都为曲线上部堆积型异常数据和剩余的曲线周围分散型异常数据,即风速异常数据集为: ,将异常数据删除得到训练的样本数据集; ,其中为Wn风速区间的正常数据集,X1为功率异常数据集,Y1风速异常数据集;通过风口电能表得到风电机组真实出力的风速-功率数据作为训练的样本验证集,其中为风电机组真实出力的风速-功率数据的功率数据,为风电机组真实出力的风速-功率数据的风速数据;所述步骤S5:使用DCNN进行数据恢复,将清洗后的部分时间点数据缺失的风速-功率数据构成的曲线进行重构,得到重构后的无数据缺失的时间点的风机风速-功率数据具体实现如下;步骤S51:DCNN结构由一层输入层、三层隐藏层和一层输出层构成;首先对功率数据进行数据恢复的过程包括:(1)损失函数为:,其中T为训练周期;初始化最小损失函数,令Lossbest值为无穷,训练周期计数器t=1;进入步骤(2);(2)判断t小于等于T是否成立:若成立,设置耐心值计数器count值为1,进入步骤(3),否则,进入步骤(8);(3)判断count小于等于patience是否成立:若成立,则进入步骤(4);否则,Lossbest=Lθt,进入步骤(7);其中patience为正整数,是用于监测模型训练的耐心值;(4)使用训练的样本数据集训练深度卷积神经网络,第t个训练周期训练得到的网络参数为θt,对应的深度卷积神经网络进入步骤(5);(5)使用训练的样本验证集对进行验证,得到第t个训练周期的优化深度卷积神经网络进入步骤(6);(6)计算的损失函数Lθt:若Lθt大于Lossbest,则计数count加一,进入步骤(3);其中,,K表示风电机组真实出力的风速-功率数据中功率数据集的样本总数,k为风电机组真实出力的风速-功率数据中功率数据集的样本索引,Xk为风电机组真实出力的风速-功率数据中功率数据集中的第k个样本,Yk为输出标签集中的第k个标签,Xk与Yk对应,1≤t≤T;(7)将t加一,返回步骤(2);(8)将Lossbest对应的网络参数作为最优网络模型参数,对应的优化得到的深度卷积神经网络作为最优网络模型;(9)按照步骤(1)至(8)对风速数据进行数据恢复。
全文数据:
权利要求:
百度查询: 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 大连理工大学 基于变点分组-二步分位数与DCNN结合的风电数据恢复方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。