恭喜深圳市汉云科技有限公司熊志强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜深圳市汉云科技有限公司申请的专利分布式数据库的数据分组统计方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113254493B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202010752066.1,技术领域涉及:G06F16/2458;该发明授权分布式数据库的数据分组统计方法及系统是由熊志强设计研发完成,并于2020-07-30向国家知识产权局提交的专利申请。
本分布式数据库的数据分组统计方法及系统在说明书摘要公布了:本申请适用于数据分析技术领域,尤其涉及一种分布式数据库的数据分组统计方法及系统。该方法根据服务器与N个数据节点对分布在N个数据节点中的待分组数据集进行数据分组统计,通过服务器获取待分组数据集的数据分片类型,使N个数据节点根据待分组数据集的数据分片类型进行一次分组统计或两次分组统计,服务器再对N个数据节点的分组统计结果进行统计,实现对分布在N个数据节点的待分组数据集的数据分组统计,应对大量数据时无需通过服务器进行分组,避免了服务器从N个数据节点调取大量数据构成的待分组数据集,减少了服务器的响应时间,提高了服务器分组统计效率。
本发明授权分布式数据库的数据分组统计方法及系统在权利要求书中公布了:1.一种分布式数据库的数据分组统计方法,所述数据分组统计方法应用于分布式数据库的数据分组统计系统,所述数据分组统计系统包括服务器和N个数据节点,N为大于1的整数,其特征在于,待分组数据集分布于所述N个数据节点,所述数据分组统计方法包括:所述服务器获取待分组数据集的数据分片类型;所述N个数据节点根据所述待分组数据集的数据分片类型,对各自的本地数据集进行一次分组统计或两次分组统计,得到N个目标分组统计结果集,其中,一个数据节点的本地数据集为所述待分组数据集分布在该数据节点的数据集,一个数据节点对应一个所述目标分组统计结果集;所述服务器对所述N个目标分组统计结果集进行统计,确定目标统计结果;所述N个数据节点根据所述待分组数据集的数据分片类型,对各自的本地数据集进行一次分组统计或两次分组统计,得到N个目标分组统计结果集包括:所述N个数据节点在所述待分组数据集的数据分片类型为哈希分片,且所述待分组数据集的哈希分片的分片字段集属于目标分片字段集的子集时,对各自的本地数据集进行分组统计,得到N个目标分组统计结果集;所述N个数据节点在所述待分组数据集的数据分片类型不为哈希分片,或者所述待分组数据集的哈希分片的分片字段集不属于目标分片字段集的子集时,对各自的本地数据集进行第一次分组统计,得到N个初始分组统计结果集;所述N个数据节点在所述N个初始分组统计结果集的总行数大于行数阈值时,根据所述目标分片字段集,对各自的初始分组统计结果集进行哈希分片,得到各自的哈希分片结果集;所述N个数据节点对各自的哈希分片结果集进行第二次分组统计,得到所述N个目标分组统计结果集;所述数据分组统计方法还包括:所述服务器在所述总行数小于或等于行数阈值时,对所述N个初始分组统计结果集进行分组统计,得到目标统计结果;所述对所述N个初始分组统计结果集进行分组统计,得到目标统计结果包括:按照分片字段集升序,对所述N个初始分组统计结果集中每行数据进行排序;获取所述N个初始分组统计结果集的N个首行数据;将所述N个首行数据的中分片字段集最小的数据归为同一分组并进行统计,得到一个分组统计结果;将所述分片字段集最小的数据从对应的初始分组统计结果集中移除,并将所述对应的初始分组统计结果集中所述分片字段集最小的数据后的数据作为首行数据;遍历所述N个初始分组统计结果集的每行数据,得到所有的分组统计结果即为目标统计结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市汉云科技有限公司,其通讯地址为:518000 广东省深圳市南山区粤海街道科技南十二路方大大厦203;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。