首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

带噪音数据分类方法、系统及社交网络用户分类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中南大学

摘要:本发明公开了一种带噪音数据分类方法,包括获取待分类的目标带噪音数据集;构建包括目标带噪音数据集中所有节点的近邻图;计算图中每个点的局部密度值及对应的依赖点,将每个点及其依赖点之间形成有向边并构建中间图;构造最小生成森林并划分和聚类;根据划分和聚类结果完成目标带噪音数据集的分类。本发明还公开了一种实现所述带噪音数据分类方法的系统,以及包括了所述带噪音数据分类方法的社交网络用户分类方法。本发明通过局部敏感哈希方法对数据进行处理,经过近邻图的构建和最小生成树的聚类,实现了带噪音数据的分类和社交网络的用户分类;而且本发明的可靠性更高,精确性更好。

主权项:1.一种带噪音数据分类方法,其特征在于包括如下步骤:S1.获取目标社交网络的用户数据信息,并作为待分类的目标带噪音数据集;S2.基于局部敏感哈希算法,构建包括目标带噪音数据集中所有节点的近邻图;S3.针对步骤S2得到的近邻图,计算图中每个点的局部密度值及对应的依赖点,将每个点及其依赖点之间形成有向边,从而构建中间图;S4.基于步骤S2得到的近邻图构造最小生成森林,并基于步骤S3构建的中间图,对构造的最小森林进行划分和聚类;具体包括如下步骤:根据步骤S2得到的近邻图,采用Kruskal算法进行处理,得到对应的最小生成森林;根据步骤S3构建的中间图,计算中间图中每个连通分量的均匀度,并根据得到的均匀度计算中间图中每条边的非连通度量值;在最小生成森林中,删除条边后,再根据每条边的非连通度量值进行聚类;其中,k为指定的聚类的数目,为最小生成森林的连通分量的个数;S5.根据步骤S4得到的划分和聚类结果,完成目标带噪音数据集的分类,得到用户关系网络图,从而完成目标社交网络的用户分类。

全文数据:

权利要求:

百度查询: 中南大学 带噪音数据分类方法、系统及社交网络用户分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。