买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:国际商业机器公司
申请日:2019-05-20
公开(公告)日:2024-12-17
公开(公告)号:CN112154418B
专利技术分类:
专利摘要:根据本发明的实施例,一种方法准确地检测时间序列数据集的异常或离群值。一种用于识别时间序列数据集的特定数据元素是否为离群值的方法包括预测该特定数据元素的值以及获得阈值,所述阈值相对于所述预测值定义所述数据元素的实际值是否为离群值。在本发明实施例的一个方面中,基于与时间序列数据集的时间上在所述特定数据元素之前的数据元素相关联的历史误差值来生成所述阈值。
专利权项:1.一种用于确定时间序列数据集的具有值的数据元素是否为离群值的计算机实现的方法,所述方法包括:从所述时间序列数据集的时间上在所述数据元素之前的第一数据获得用于预测所述数据元素的值的预测数据;使用所述预测数据来预测所述数据元素的预测值;获得表示在所述数据元素的所述值和所述预测值之间的差的所述数据元素的误差值;获得所述时间序列数据集的历史误差值,每个历史误差值表示所述时间序列数据集的在时间上在所述数据元素之前的第二数据元素的值与第二数据元素的预测值之间的差,其中所述第二数据元素对应于在所述数据元素之前的特定预定时间段获得的所述时间序列数据集的数据元素;基于所述历史误差值中的一个或多个历史误差值获得所述数据元素的所述误差值的阈值,所述阈值用于定义被认为是离群值的所述数据元素的误差值,其中,获得所述阈值包括:基于预期为离群值的误差值的百分比确定预定数;将所述历史误差值的统计测量乘以所述预定数以生成结果,其中,所述统计测量包括平均值、中值、众数和标准偏差中的一者;以及基于所述结果确定所述阈值,其中,针对所述时间序列数据集中的每个数据元素来确定不同的阈值;以及基于所述阈值和所述数据元素的所述误差值的比较来确定所述数据元素是否为离群值。
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。