买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华侨大学
摘要:一种面向超大规模数据的球粒聚类方法,用于提升大规模数据处理速度,包括如下步骤:对原始数据集进行预处理,将非规范化数据转换为数值型数据;对预处理后的数据通过多次抽样和球粒算法进行初步数据分布获取,识别出代表球及其球心,并据此得到数据的整体分布;再次利用球粒算法对识别出的所有代表球进行精细化处理以识别关键球,根据所述关键球构建数据的森林并分配标签;计算未标记数据点与已标记关键球的球心之间的最小欧式距离,进行全局标签的分配。本发明显著提升数据处理速度,不仅有助于推动大数据技术的发展,同时也可作为图像处理等其他领域预处理步骤的有效工具。
主权项:1.一种面向超大规模数据的球粒聚类方法,用于提升大规模数据处理速度,其特征在于,包括如下步骤:对原始数据集进行预处理,将非规范化数据转换为数值型数据;对预处理后的数据通过多次抽样和球粒算法进行初步数据分布获取,识别出代表球及其球心,并据此得到数据的整体分布;再次利用球粒算法对识别出的所有代表球进行精细化处理以识别关键球,根据所述关键球构建数据的森林并分配标签;计算未标记数据点与已标记的关键球的球心之间的最小欧式距离,进行全局标签的分配。
全文数据:
权利要求:
百度查询: 华侨大学 一种面向超大规模数据的球粒聚类方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。