恭喜杭州电子科技大学马佳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州电子科技大学申请的专利一种时间序列数据异常标记方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114490156B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210090576.6,技术领域涉及:G06F11/07;该发明授权一种时间序列数据异常标记方法是由马佳;刘春山;夏永祥;涂海程设计研发完成,并于2022-01-25向国家知识产权局提交的专利申请。
本一种时间序列数据异常标记方法在说明书摘要公布了:本发明公开了一种时间序列数据异常标记方法,包括以下步骤:对时间序列数据进行预处理。数据预处理包括时间序列数据归一化、序列缺失值填充、以及序列平滑处理三个步骤;对所述预处理后的时间序列进行分类。根据序列快速傅里叶变换周期频域分量的大小、自相关系数大小、以及零值比例的大小,将时间序列按照数据特性分为四种类型;对所述不同数据类型的时间序列分别设计一种异常标记方法。本发明在保证时间序列异常标记高准确率的前提下,开发了一套简单高效、适用于大规模时间序列的异常标记的方法。
本发明授权一种时间序列数据异常标记方法在权利要求书中公布了:1.一种时间序列数据异常标记方法,其特征在于,包括以下步骤:步骤1、时间序列数据预处理;步骤2、时间序列分类;步骤3、时间序列数据异常标记;针对四种类型的时间序列分别设计了四种不同的异常标记方法,时间序列需根据分类的结果,匹配相应的标记方法对归一化后的时间序列进行异常点的标记;若时间序列被判定为以一天为周期的时间序列,则按照方法1的流程进行异常点的标记;方法1的具体流程为:流程1.1:取时间序列每天相同时刻的值,对每一时刻所有的值进行异常检测,标记出时间序列的离群值和部分上下文异常值;选取时间序列中所有0点时刻的数据然后使用N-sigma准则检测该序列的异常点;N-sigma准则中的N值为可调系数,该准则根据N值大小按照设定概率确定正常数值区间,并将超出区间的数值标记为异常数据,其表达式为: 其中μ和σ分别为相应序列的均值和标准差,xi为对应时间序列i时刻的数值;流程1.2:对时间序列数据做差分运算,通过差分数据检测原始时间序列的上下文异常点;将时间序列进行差分后的序列记为其差分公式为: 其中表示差分序列的第t个数据,表示时间序列的t时刻的数据;判断差分数据某一时刻数值是否为异常值,需要通过该时刻前面一定长度窗口的统计信息来确定当前时刻数值的范围;在此令滑动窗口的长度为s0,此时历史窗口的数据为然后使用boxplot方法确定当前时刻正常数据范围为Q1-k*IQR,Q3+k*IQR,其中Q3、Q1分别为数据的上、下四分位数,IQR为Q3-Q1,k为可调系数;当前时刻数值超出正常数据范围时,便可将数值标记为异常值;有的周期数据每一天同时刻都会发生跳变,但从数据全局来看不属于异常,而boxplot算法也能将这样的数据检测出来,为了避免这类误判,对差分后的数据同样使用同时刻N-sigma准则来排除上述误判情况,将boxplot和同时刻N-sigma算法共同检测出的异常点作为差分数据最终的异常点;流程1.3:对差分数据标签进行修正;经过流程1.2后,便可得到差分序列的标签序列令为标签序列中t时刻的值,且差分的目的是为了找出不符合变化趋势的点,对该类数据进行差分后,会出现一正一负的异常差分数据点;对于一个上下文异常的数据会在和中出现一个正的、一个负的异常差分数据,若只检测到其中一个异常差分数据,则根据此点前后正负关系,修正标签序列以确定异常差分数据对应原始数据的准确位置;流程1.4:对时间序列重采样并检测重采样时间序列的异常点;取时间序列每一天的上四分位数,得到分位数时间序列然后对分位数时间序列使用滑动窗口结合boxplot的方法进行异常检测,若某时刻为正常点,标签记为0,为异常点标签记为1,同时将异常点的值从序列中剔除,以免污染下一个滑动窗口的数据;为了防止在初始窗口中含有跳变点,还需使用同样大小的窗口从序列末尾向序列开头进行滑动,以完成反向异常检测,得到正向标记序列和反向标记序列流程1.5:根据标记后的0、1序列确定时间序列跳变点位置;将中的最长异常子序列的长度分别记为lf和lb,将规定的异常子序列长度阈值记为lts;首先将lf、lb跟阈值lts作比较,若两者都小于阈值,则说明时间序列中不存在长时间的异常值跳变,将标记序列与相加形成综合标签,将大于0的标签变为1,然后对综合标签进行差分,通过1与-1值的位置定位到异常跳变点;若lf、lb中有一个以上大于阈值lts,则说明原始时间序列中存在长时间的跳变,将跳变时间持续较长的标记序列作为主标记序列,对该序列进行差分,通过1与-1定位跳变点,并将发生最长时间跳变的跳变时刻记为tb,然后对另一条标记序列差分数据tb时刻附近的值进行归零操作,以防止两次标记结果冲突,造成误判。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。