首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于一阶差分和ARIMA法的日电量异常值检测与校正系统 

申请/专利权人:国网湖南省电力有限公司;国网湖南省电力有限公司经济技术研究院;国家电网有限公司;北京经世万方信息技术有限公司

申请日:2022-06-09

公开(公告)日:2024-07-02

公开(公告)号:CN115081840B

主分类号:G06Q10/0639

分类号:G06Q10/0639;G06Q50/06;H02J13/00

优先权:

专利状态码:有效-授权

法律状态:2024.07.02#授权;2022.10.11#实质审查的生效;2022.09.20#公开

摘要:本发明涉及一种基于一阶差分和ARIMA法的日电量异常值检测与校正系统,包括:对历史原始时间序列日电量数据,按照时间顺序进行排序;针对排序好的日电量数据,对缺失值用前后5位非空数值均值作为初步拟合值,得到新时间序列数据;分别通过一阶差分模型和ARIMA模型进行数据异常值检测,结合判断识别出整个时间序列的异常点;对异常点处理得到最终完整时间序列数据集。本发明采用一阶差分和ARIMA模型相结合的方法对异常值就行检测与校正,能极大可能得调高异常值校正的准确度,从而更好地服务电力公司内部电力供需形势分析、精细化运营。

主权项:1.一种基于一阶差分和ARIMA法的日电量异常值检测与校正系统,其特征在于,包括以下步骤:步骤1、对历史原始时间序列日电量数据,按照时间顺序进行排序,标记其缺失值对应的数据位置p;步骤2、对所述排序好的日电量数据,对p点对应的数值用前后5位非空数值均值作为初步拟合值,得到初始整理好的历史数据X数据集,记为X={X1,X2,X3.......Xn};步骤3、对所述步骤2的整理好的初始历史数据,通过一阶差分模型,即方法a进行数据异常值检测,识别出来的异常值对应的数据位置分别用Ai代替,采用“安全点”均值法对该异常值点进行第一次修正,具体修正步骤如下:步骤301、计算X数据集的标准差,即步骤302、计算X的一阶差分向量FirstDifference,以下简称FD,即XFDj=Xi-Xi-1,那么与之对应的一阶差分数据集XFD={XFD1,XFD2,XFD3.......XFDn};步骤303、基于步骤301和302,针对一阶差分模型检测出来的异常点的数据进行校正,具体步骤如下:步骤303A、在对SFD数据集进行一阶差分模型异常值检测过程中,若第i个点的一阶差分大于m倍标准差,即XFDim*σX,其中,m为可由用户自主决定的正数,理论上m值越大,用户对数据偏差接受程度越大,那么判断该点为基于一阶差分模型检测出来的异常点,即判断结果记为1;反之为非异常点即判断结果记为0;步骤303B、基于步骤303A,就判断结果为1的情况,采用“安全点”均值法对检测出来的异常点进行数值修正,即其中i点为异常点,k为i点之前第一个不为异常点,j为i点以后第一个不为异常点;就判断结果为0的情况,沿用原值,即YAi=Xi;步骤303C、基于步骤303B结果,循环执行步骤303A和303B,直至检测异常点的结果全为0时终止循环;步骤304、基于步骤303,得出一阶差分模型修正后的完整数据集YA={YA1,YA2,YA3.......YAn};步骤4、对所述步骤2的整理好的初始历史数据,通过ARIMA模型,即方法b进行数据异常值检测,识别出来的异常值对应的数据位置分别用Bi代替,采用ARIMA方法对该异常值点进行检测与第二次修正,具体步骤如下:步骤401、建立ARIMA拟合模型为被解释变量其中Xi受d值的影响,当d=0时,Xt为原序列数据;当d=n时,Xt为与之对应的n阶差分数据序列;步骤402、根据贝叶斯信息准则BIC进行最优拟合ARIMA模型的确定,具体步骤如下:步骤402A、限定p、q和d的取值范围均属于[0,2],p、q和d同为0的情况除外;步骤402B、基于步骤402A选定的p、q和d参数值,执行ARIMA回归模型,得到基于p、q和d组合的参数集pqd={pqd1,pqd2,pqd3.......pqd26};步骤402C、基于步骤402B,计算BIC值,BIC=lnnk-2lnL,其中,L为当前维度模型对应的最大似然函数值,n和k分别为样本大小和参数数量,得到BIC={BIC1,BIC2,BIC3.......BIC26};步骤402D、基于步骤402B和402C,选取min{BIC1,BIC2,BIC3.......BIC26}对应的pqd参数集值,为进入下一步ARIMA模型拟合的参数;步骤403、修正后的完整数据集为YB={YB1,YB2,YB3.......YBn};基于步骤402,假定{X1,X2,X3.......Xn}为原时间序列,{YB1,YB2,YB3.......YBn}为ARIMA拟合序列,则残差序列ε={YB1-X1,YB2-X2,YB3-X3.......YBn-Xn},若若异常值判别结果为1,Xi为异常点,反之为非异常点;步骤5、对所述步骤3和步骤4的拟合结果YAi和YBi进行最后异常值检测,结合上述结果,确定最终异常值的数据位置,标记为ABi,具体如下:步骤501、若点i为上述步骤1提及的缺失点,即i=p时,则认为该类数据点为异常点,需做异常值剔除处理,并标记ABi=1;步骤502、若点i的方法a和b的检测判定结果均为正常点,即YAi=Xi和YBi=Xi都满足时,则认为该类数据点为正常点,无需做异常值剔除处理,并标记ABi=0,其中AB代表最终判断结果序列;步骤503、若点i的方法a和b的检测判定结果均为异常点,即YAi≠Xi和YBi≠Xi都满足时,则认为该类数据点为异常点,需做异常值剔除处理,并标记ABi=1;步骤504、若点i的方法a和b的检测判定结果不一致,即除上述两种情况外的其他情况时,则认为该类数据点为疑似异常点,需进入下一步操作:步骤504A、若方法a判定点i为异常,且处理后的YAi与原值Xi=0差异率的绝对值超过n,即其中,n为可由用户自主决定的正数,理论上n值越大,用户对数据偏差接受程度越大,则判定点i为异常,并标记ABi=1;反之,标记ABi=0;步骤504B、若方法b判定点i为异常,且处理后的YBi与原值Xi=0差异率的绝对值超过n,即则判定点i为异常,并标记ABi=1;反之,标记ABi=0;步骤6、对上述确定的异常点ABi对应的数值标记为空值,用ARIMA模型对空值进行数据拟合,得到最终完整时间序列数据集Y={Y1,Y2,Y3.......Yn}。

全文数据:

权利要求:

百度查询: 国网湖南省电力有限公司 国网湖南省电力有限公司经济技术研究院 国家电网有限公司 北京经世万方信息技术有限公司 一种基于一阶差分和ARIMA法的日电量异常值检测与校正系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。