首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于循环神经网络的非平稳时序数据预测方法 

申请/专利权人:西安工业大学

申请日:2020-06-15

公开(公告)日:2024-07-05

公开(公告)号:CN111754033B

主分类号:G06F18/10

分类号:G06F18/10;G06N3/044;G06N3/084;G06F18/2433

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2020.10.30#实质审查的生效;2020.10.09#公开

摘要:本发明提供了一种基于循环神经网络的非平稳时序数据预测方法,包括以下步骤:读取数据库中相应原始时序数据后,采用滑动窗口技术结合局部离群因子算法以及线性插值方法,分别实现原始时序数据中异常值的检测与缺失值的修正,达到数据预处理的目的;同时,对预处理后数据进行相应的数据重构操作,以适用于有监督型模型的输入;依据前部分中处理后的数据,通过循环神经网络方法实现非平稳时序数据的滚动预测。本发明方法对原始时序数据进行了相应预处理操作,不仅实现毛刺数据识别,还实现异常数据与缺失数据的修正,提高预测方法的精度;同时,采用循环神经网络方法实现非平稳时序数据的滚动预测,大幅提高非平稳时序数据预测的精确度。

主权项:1.一种基于循环神经网络的非平稳时序数据预测方法,其特征在于,包括以下步骤:步骤1、获取数据库中一段时间内原始数据;步骤2、对获取的原始数据预处理操作,实现对异常数据检测与缺失数据修正;步骤3、将预处理后的数据进行数据重构与标准化,形成特定的输入形式;步骤4、计算经过循环神经网络的传播后,当前输入数据对应的输出数据;步骤5、计算上述输出值与真实数据的偏差,实现最偏差的优化迭代,获取最小偏差对应的循环网络参数;步骤6、获取当前待预测指标的当前时间瞬时数据,并实现相关预处理;步骤7、采用循环神经网络的网络参数,对待预测的非平稳时序数据进行滚动预测;步骤1获取数据库中一段时间内原始数据包括以下步骤:步骤101、获取系统中预测时刻前10个月待预测指标的一维时间序列数据;步骤102、数据获取频率为10分钟,积累获取当前时序指标43200个数据,保存为本地文件;步骤2所述的原始数据预处理操作包括以下步骤:步骤201、对获取的时序指标数据,按照时间顺序一天中144个时序数据划分为一个时间窗口,并以步长为24滑动时间窗口,依次形成多个时间窗口子序列;步骤202、对每个时间窗口子序列数据,分别进行异常值的检测;步骤203、对检测出的异常值以及缺失值,结合当前窗口内数据进行线性插值;步骤204、合并每个时间窗口数据,对重复数据进行中位数替换;步骤2所述的异常数据是指:超限值:超出该时间窗口内阈值的时序数据;毛刺值:与相邻时序数据的偏差均在20%以上的数据;缺失值:当前时间点,未检测到数值的时序数据;步骤2所述的异常数据检测与缺失数据修正包括以下步骤:步骤211、对时序序列数据中的缺失值替换为0数据;步骤212、依次将一维时序数据中相邻两个数据映射为二位数组;步骤213、假设当前数据点o与其第k个最近邻点的距离为dko,数据点o和o′之间的距离为do,o′,则当前数据点o的k近邻数NKo,计算公式为:NKo={o'|o'∈D,do,o'≤dko}步骤214、计算数据点o到数据点o′的可达距离dreacho,o′,计算公式为:dreacho,o'=max{dko,do,o'}步骤215、计算数据点o的局部可达密度,计算公式为: 步骤216、计算数据点o的局部离群指数LOFko,计算公式为: 步骤217、若数据点o的局部离群指数大于1,则判别为异常数据;步骤218、采用线性插值法对检测出的异常数据异常数据进行修正;步骤3所述的数据重构与标准化是指:将处理后的一维无监督的时间序列数据重构为带有监督信号的高维数组,并进行标准化便于网络的学习,具体步骤如下:步骤301、将当前数据滞后12个时间点形成12维数组,当前时间点数据作为标签数据;步骤302、将连续12个时间点数据划分为一个时间窗口,并按照步长为1依次滑动窗口,形成一组带有监督信号的高维数据集;步骤303、对原始时序数据进行离差标准化,使数据映射到[0,1]区间;步骤4所述的当前输入数据经过循环神经网络的后对应的输出数据,步骤如下:步骤401、计算循环神经网络中隐含层中重置门的输出值,上一时刻隐含向量Ht-1和当前时刻输入值Xt一起输入到重置门,得到一个0到1之间的重置门输出值,计算公式为:Rt=σXtWxr+Ht-1Whr+br步骤402、计算隐含层中更新门的输出值,当前输入Xt和上一时刻隐含状态Ht-1进入更新门的输出0到1之间的数值,计算公式为:Zt=σXtWxz+Ht-1Whz+bz步骤403、计算候选隐藏状态变量,通过tanh层创建一个候选隐含状态,计算公式为: 步骤404、计算当前时刻的隐含状态向量,候选隐含状态向量和上一时刻隐含状态向量通过加权平均得到当前时刻的隐含状态向量Ht,计算公式为: 步骤405、计算网络输出值,将当前时刻隐含状态向量加权与输出层偏置相加,再共同输出最终值Yt,计算公式为:Yt=σWoHt+bo步骤5所述的获取最小偏差对应的网络参数方法,步骤如下:步骤501、计算输出值与真实数据的偏差,选用均方误差作为在损失函数,计算公式为: 步骤502、按照时间的方向顺序,计算损失函数对于各网络参数的偏导数,计算公式为: 步骤503、通过梯度下降算法将误差反向传播,实现按照学习率α优化网络参数,公式为: 步骤504、当优化网络参数不再减少或迭代的次数达到预设次数,得到网络的最优参数。

全文数据:

权利要求:

百度查询: 西安工业大学 一种基于循环神经网络的非平稳时序数据预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。