恭喜杭州电子科技大学;国网江苏省电力有限公司无锡供电分公司马佳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州电子科技大学;国网江苏省电力有限公司无锡供电分公司申请的专利基于大规模网络流量类型数据的跳变点检测系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115168091B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210829981.5,技术领域涉及:G06F11/07;该发明授权基于大规模网络流量类型数据的跳变点检测系统及方法是由马佳;刘春山;夏永祥;涂海程;赵楼设计研发完成,并于2022-07-13向国家知识产权局提交的专利申请。
本基于大规模网络流量类型数据的跳变点检测系统及方法在说明书摘要公布了:本发明公开了基于大规模网络流量类型数据的跳变点检测系统及方法,具体包括以下步骤:对参考窗口的数据进行预处理,预处理包括缺失值填充、数据归一化和平滑处理三个步骤;对预处理后的时间序列使用离散傅里叶变换结合自相关系数的方法进行分类;将不同类别的时间序列转换为具有0和1的二进制序列,并通过前后窗口1的密度变化来识别跳变点,该方法使用双向检测方法来判断数据是向上跳变还是向下跳变。本发明方法不需要提前假设数据的分布,具有较好的鲁棒性,且算法的复杂度较低,在大规模数据处理中可以得到较好的应用。
本发明授权基于大规模网络流量类型数据的跳变点检测系统及方法在权利要求书中公布了:1.基于大规模网络流量类型数据的跳变点检测方法,其特征在于,包括以下步骤:步骤1、参考窗口数据预处理;预处理包括时间序列缺失值填充、数据归一化以及平滑处理三个步骤,处理后的时间序列有助于提高序列分类的准确性;步骤2、参考窗口序列分类;根据人类行为模式,将数据分为三种不同类型的时间序列,分别为以一天为周期的时间序列、以一周为周期的时间序列和非周期时间序列;使用离散傅里叶变换结合自相关系数来对时间序列进行分类;步骤3、二进制时间序列密度差异检测;针对不同类型的时间序列,其跳变点检测的步骤相同,但不同类型序列的参数选取不同;此步骤首先将原始时间序列转换为二进制序列,然后识别参考窗口和测试窗口二进制序列中1的密度是否存在差异,以此来检测变化点;密度差异检测分为前向检测和后向检测,前向检测使用参考窗口去检测测试窗口是否发生跳变,而后向检测使用测试窗口去检测参考窗口是否存在跳变;步骤3具体如下:经过步骤2确定时间序列的类型,针对不同类型的时间序列,其跳变点检测的步骤相同,但不同类型序列的参数选取不同;首先将原始时间序列转换为二进制序列,然后识别参考窗口和测试窗口二进制序列中1的密度是否存在差异,以此来检测变化点;密度差异检测分为前向检测和后向检测,前向检测使用参考窗口去检测测试窗口是否发生跳变,而后向检测使用测试窗口去检测参考窗口是否存在跳变;前向检测和后向检测具有相同的原理,以下详细介绍前向检测原理;步骤3.1,将参考窗口和测试窗口序列转换为二进制序列;由于跳变点可能以向上或向下跳跃的形式出现,因此采用两个阈值,即上阈值uts和下阈值lts,将原始时间序列转换成两个不同的二进制序列,以检测向上和向下的跳变点;这里将上阈值uts设置为:uts=Q3+k1*IQR5其中IQR=Q3-Q1,Q3、Q1分别为参考窗口的上、下四分位数,k1为超参数;获得上阈值uts后,将参考窗和测试窗的原始数据都转换为二进制值,其转换公式为: 其中yt是时间序列在t时刻的二进制值;同时将下阈值lts设置为:lts=Quantilek27其中Quantile·表示取时间序列的分位数,k2为超参数,且需要结合序列的数据特性进行人为设定,相应的转换公式为: 由于周期为一周的时间序列在工作日和周末通常具有不同的数据特性,分别为工作日和周末数据设置了不同的上阈值uts和下阈值lts;对于其他两种类型序列,工作日和周末的阈值设置是一样的;步骤3.2,判别参考窗口和测试窗口二进制序列中1的密度是否存在差异;一旦获得参考和测试窗口的二进制序列,则参考序列Yref中1的密度ρ计算公式如下: 其中sumYref表示对标签序列Yref进行求和,假设二进制序列中的样本是独立于同一分布抽取的,即遵循二项分布,则测试窗口至少有q个1的样本的概率的计算公式如下: 当fq|ρ的概率接近于0时,意味着在测试窗口中观察到q个1的样本是一个罕见的事件,表明1的样本的密度发生了变化;1的样本的密度增加意味着一个向上的变化,此时通过公式10计算右尾概率,以检测向上的跳变点;类似地,1的样本密度的减少意味着一个向下的变化,此时计算左尾概率,以检测向下的跳变点;由于直接计算fq|ρ在数字上有困难,因此根据中心极限定理,利用正态分布去近似代替二项分布,正态分布的均值μ和标准差σ通过以下公式来进行计算:μ=l2*ρ11 在得到正态分布的均值μ和标准差σ后,使用N-sigma准则检测向上或向下的跳变点;也就是说,对于应用上阈值uts检测向上变化而产生的二进制序列,测试阈值被设定为cts=μ+N1*σ,其中N1是超参数;如果Ytest中1的样本个数超过了cts,那么就检测出一个向上的变化;对于应用下阈值lts检测向下变化而产生的二进制序列,测试阈值被设定为cts=μ-N2*σ,其中N2也是一个超参数;如果Ytest中1的样本数量低于cts,那么就检测出一个向下的变化;值得注意的是,当ρ很小时,说明Yref中1的密度很小,此时Ytest中1的密度稍有变化时,就容易将其误判为跳变数据,故需要对ρ设置一个密度阈值ρts,当ρ小于ρts时,一律用密度阈值ρts进行代替;后向检测原理与前向检测相同,前向检测使用参考窗口去检测测试窗口是否发生跳变,而后向检测使用测试窗口去检测参考窗口是否存在跳变;为了减少错误警报的机会,只有前向和后向检测给出一致警报的情况下,数据才会被判别为跳变点。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学;国网江苏省电力有限公司无锡供电分公司,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。