首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于K-Means空间模型的跟踪式增量无监督概念漂移自适应方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京邮电大学

摘要:本发明属于在线数据流环境下的概念漂移检测与自适应领域,公开了一种基于K‑Means空间模型的跟踪式增量无监督概念漂移自适应方法,该方法首先是利用训练数据训练预处理过程中涉及到的各种参数,并使用这些参数对数据进行预处理;再基于K‑Means空间模型,利用同类的内聚特性对低维数据实现无监督式的分类,并生成初始的概念集合;最后对于每一个到达的样本,基于距离判定阈值对其与每个概念的欧几里得距离进行条件判定,根据不同得到判定结果,对相应的概念采取不同的更新策略。该方法解决响应式概念漂移检测方法无法有效监测增量概念漂移发生的问题,增强概念集合模型构建的速度与质量,满足用户低时延、高精准的服务需求。

主权项:1.一种基于K-Means空间模型的跟踪式增量无监督概念漂移自适应方法,其特征在于:所述跟踪式增量无监督概念漂移自适应方法通过主成分分析、监督特征加权、初始概念模型生成、概念信息增量更新的相互协作,完成增量漂移的自适应过程,具体包括以下步骤:步骤1、对训练数据进行标准化:采用学生化残差进行数据T-标准化; 其中表示训练数据样本第j个属性的均值,sj表示训练数据样本第j个属性的标准差,Aij表示训练数据矩阵中,第i个数据的第j维度数值;步骤2、判断训练数据类型,如果数据类型为训练数据则进行步骤3,如果数据类型为在线数据,则进行步骤7;步骤3、使用主成分分析方法对训练数据进行降维操作,利用训练数据,生成主成分分析的参数即变换矩阵V′,将训练数据投影至目标特征空间;步骤4、对步骤3中的训练数据的空间分布进行统计分析,获得各个维度上训练数据的分布情况,分布情况以权值向量ω表示,以权值向量ω对训练数据进行加权,增强概念集合模型构建的速度与质量;步骤5、对经过步骤4预处理后的低维数据进行K-Means聚类,对低维数据进行分簇;步骤6、对步骤5基于低维数据获得的分簇参照专家标签生成概念集合模型;步骤7、基于步骤3和步骤4中训练所获得的参数对步骤2中的所述在线数据进行数据预处理,计算到达数据样本的相关概念数量,根据不同的相关概念数量,选择相应的执行步骤;步骤8、如果关联概念数量为0,则不进行任何处理,如果关联概念数量为一,则进行针对单一要素的概念学习,如果关联概念数量为多,则进行针对多个要素的概念学习,并转入步骤9更新概念信息后继续处理下一个到达的在线数据;步骤9、更新概念信息即更新概念在空间中的范围信息,多个概念构成了概念集合模型。

全文数据:

权利要求:

百度查询: 南京邮电大学 一种基于K-Means空间模型的跟踪式增量无监督概念漂移自适应方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。