申请/专利权人:青海大学
申请日:2024-04-17
公开(公告)日:2024-07-05
公开(公告)号:CN118296291A
主分类号:G06F17/16
分类号:G06F17/16;G06F7/523;G06F9/50
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.07.23#实质审查的生效;2024.07.05#公开
摘要:本发明涉及计算机信息技术领域,尤其涉及一种GPU稀疏矩阵向量乘的快速求解方法及装置。方法包括:提取待求解的稀疏矩阵数据的数据特征,并获取对应的GPU平台的硬件参数特征;根据数据特征和硬件参数特征基于预先构建的自动调优模型确定稀疏矩阵数据的最佳分块数量;基于最佳分块数量列向均匀切分CSR格式下的稀疏矩阵数据,得到对应的数据块;利用数据重排方法基于最佳分块数量对数据块进行重排;基于GPU平台对重排后的数据块进行并行计算,并存储计算结果。本发明可以充分的保证各个计算资源的任务量一致,使其能在不同硬件架构的GPU上发挥出最佳的计算性能;并且极大的减少了GPU线程访问数据的开销。
主权项:1.一种GPU稀疏矩阵向量乘的快速求解方法,其特征在于,包括:提取待求解的稀疏矩阵数据的数据特征,并获取对应的GPU平台的硬件参数特征;根据所述数据特征和所述硬件参数特征基于预先构建的自动调优模型确定所述稀疏矩阵数据的最佳分块数量;基于所述最佳分块数量列向均匀切分CSR格式下的所述稀疏矩阵数据,得到对应的数据块;利用数据重排方法基于所述最佳分块数量对所述数据块进行重排;基于所述GPU平台对重排后的所述数据块进行并行计算,并存储计算结果。
全文数据:
权利要求:
百度查询: 青海大学 GPU稀疏矩阵向量乘的快速求解方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。