买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:河南大学
摘要:本发明提供一种基于配置和聚合感知的Spark动态排序优化策略。该方法包括:步骤1:获取待处理任务的任务信息、对应的集群端配置信息和Driver端配置信息;其中,所述任务信息包括任务数据量和任务个数;步骤2:根据任务信息、集群端配置信息和Driver端配置信息分别确定在集群端对待处理任务拟执行排序算子所需的时间Ct以及Driver端拟获取待处理任务的数据传输时间Dt1和在Driver端对待处理任务拟执行排序算子所需的时间Dt2;步骤3:若Dt小于Ct,则将待处理任务直接分配至Driver端执行排序算子;其中,Dt为Dt1和Dt2之和。本发明能够减少集群负担,解决排序算子对数据处理先集群后Driver端导致的资源争用的问题。
主权项:1.一种基于配置和聚合感知的Spark动态排序优化策略,其特征在于,包括:步骤1:获取待处理任务的任务信息、对应的集群端配置信息和Driver端配置信息;其中,所述任务信息包括任务数据量和任务个数;步骤2:根据任务信息、集群端配置信息和Driver端配置信息分别确定在集群端对待处理任务拟执行排序算子所需的时间Ct以及Driver端拟获取待处理任务的数据传输时间Dt1和在Driver端对待处理任务拟执行排序算子所需的时间Dt2;步骤3:若Dt小于Ct,则将待处理任务直接分配至Driver端执行排序算子;其中,Dt为Dt1和Dt2之和。
全文数据:
权利要求:
百度查询: 河南大学 一种基于配置和聚合感知的Spark动态排序优化策略
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。