买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:湖南大学;湖南大学深圳研究院
摘要:本申请涉及一种基于ARM处理器的SpMV并行加速处理方法与系统,其中,方法包括:加载稀疏矩阵;若当前ARM处理器支持NUMA,则获取最大NUMA节点数目m,并将已加载的所述稀疏矩阵基于m进行行划分;将划分好的所述稀疏矩阵根据NUMA策略分配到各个节点上,并将每个节点上的子矩阵再根据线程数再次划分;将每个线程中需要处理的子矩阵按照列的相似度进行重排,并将对应的向量也重新排序;将排序后的子矩阵转换为对齐的CSR格式,并且每个线程将对齐的CSR格式的子矩阵与对应的向量进行SpMV处理;将每个节点上的SpMV相乘结果合并得到计算结果。整个过程中,通过列重排显著减少对齐的CSR格式中的向量对,可以显著加速SpMV操作,实现高效的基于ARM处理器的SpMV并行加速处理。
主权项:1.一种基于ARM处理器的SpMV并行加速处理方法,其特征在于,所述方法包括:加载稀疏矩阵;若当前ARM处理器支持NUMA,则获取最大NUMA节点数目m,并将已加载的所述稀疏矩阵基于m进行行划分;将划分好的所述稀疏矩阵根据NUMA策略分配到各个节点上,并将每个节点上的子矩阵再根据线程数再次划分;将每个线程中需要处理的子矩阵按照列的相似度进行重排,并将对应的向量也重新排序;将排序后的子矩阵转换为对齐的CSR格式ACSR,并且每个线程将对齐的CSR格式的子矩阵与对应的向量进行SpMV处理;将每个节点上的SpMV相乘结果合并得到计算结果。
全文数据:
权利要求:
百度查询: 湖南大学 湖南大学深圳研究院 基于ARM处理器的SpMV并行加速处理方法与系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。