买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:温州大学;温州大学大数据与信息技术研究院
摘要:本发明提供一种基于shapelet和pso特征选择的时序数据分类方法,包括获取原始时间序列,并初始化分割数量、shaplet候选集、子序列集合和子序列长度范围;根据分割数量对原始时间序列进行分割,以得到子序列集合;对子序列集合进行迭代计算,以选出当前拟合误差和最大的子序列及其对应拟合误差最大的点,并以该点为中心对当前所选子序列进行左右拆分之后,将长度位于子序列长度范围内的拆分序列加入到shaplet候选集中,且在每一次迭代完成后,对子序列集合进行当前所选子序列删除并更新,直至shaplet候选集中子序列的当前数量大于等于分割数量时结束迭代计算;输出最终的shapelet候选集。实施本发明,能显著减少候选子序列的数量,并降低计算复杂度的同时,提高特征评估标准。
主权项:1.一种基于shapelet和pso特征选择的时序数据分类方法,其特征在于,所述方法包括以下步骤:S1、获取原始时间序列,并初始化分割数量为、shaplet候选集为空、子序列集合为空和子序列长度范围为[];S2、根据所述分割数量,将所述原始时间序列进行分割,以得到个子序列,并将所得个子序列加入到所述子序列集合中;S3、判断所述shaplet候选集中子序列的当前数量是否小于所述分割数量;若是,则执行步骤S4;若否,则跳转至步骤S7;S4、根据公式和计算出所述子序列集合中所有子序列的拟合误差和,并进一步选出当前拟合误差和最大的子序列;其中,每一子序列均定义为M;和分别为所述子序列集合中子序列M的起点编码和终点编码;为所述子序列集合中子序列M中所有计算点的总数;和和分别为所述子序列集合中子序列M的起点值和终点值;所述子序列集合中子序列M中第个计算点的值;S5、在当前所选拟合误差和最大的子序列中,确定拟合误差最大的点,并以所确定的拟合误差最大的点为中心,将当前所选拟合误差和最大的子序列进行左右拆分,得到两个均具有拟合误差最大的点的拆分序列,且进一步从所得的两个拆分序列中,将长度位于所述子序列长度范围内的拆分序列加入到所述shaplet候选集中;S6、从所述子序列集合中,删除当前所选拟合误差和最大的子序列并更新,返回步骤S3;S7、输出最终的shapelet候选集。
全文数据:
权利要求:
百度查询: 温州大学 温州大学大数据与信息技术研究院 一种基于shapelet和pso特征选择的时序数据分类方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。