恭喜广东工业大学;广东能哥知识科技有限公司王卓薇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜广东工业大学;广东能哥知识科技有限公司申请的专利利用GPU对OpenFOAM解算器PCG进行加速的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115270054B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210899519.2,技术领域涉及:G06F17/12;该发明授权利用GPU对OpenFOAM解算器PCG进行加速的方法是由王卓薇;陈浩楠;程良伦设计研发完成,并于2022-07-28向国家知识产权局提交的专利申请。
本利用GPU对OpenFOAM解算器PCG进行加速的方法在说明书摘要公布了:本发明公开了一种利用GPU对OpenFOAM解算器PCG进行加速的方法,包括:1将OpenFOAM网格化所生成的格式为ldu的稀疏矩阵转化为更加适合于GPU运算的ELLB稀疏矩阵存储格式;2将格式转换后的稀疏矩阵与向量进行乘法,根据不同的存储样式采用不同的相乘方法。3根据PCG解算器的原理,对涉及到稀疏矩阵向量乘法的运算时引入ELLB稀疏矩阵存储格式和相乘方法。本发明的优点是:充分利用GPU的硬件特性,通过引入ELLB稀疏矩阵存储格式,提高该格式下稀疏矩阵乘法的效率,从而提高OpenFOAM中里利用解算器PCG求解实际问题的效率。
本发明授权利用GPU对OpenFOAM解算器PCG进行加速的方法在权利要求书中公布了:1.一种利用GPU对OpenFOAM解算器PCG进行加速的方法,其特征在于,包括以下步骤:S1:将OpenFOAM所离散后的线性方程组Ax=b的矩阵A由ldu格式先转化为ELLPACK格式,再转化:ELLB格式;S2:对value以及col_idx进行分块处理,分为长为ω,分块后子块的矩阵宽度为σ的矩阵块进行存储;同时,记录每行元素的数目,并进行归并求和,作为e_num数组,用于求解辅助矩阵;S3:为了区分每一个块的起始位置,引入tile_ptr向量,该向量代表每一个块的第一个元素所在的行的标号;同时,引入辅助向量bit_flag确定每一行开始的元素;S4:根据整个矩阵中的非零元素数目nnz及矩阵的整体行数数目row_num求出每行的元素平均数目avg: 根据avg的大小,确定分块后子块的宽度大小为σ: 提高读取数据时的数据利用率,将分块后的子块长度ω设为32;将分块后的矩阵按列进行存储;S5:对于块矩阵中的辅助向量bit_flag,采用二进制的方式进行存储,缩减所需要的内存空间,用一个unsignedint元素代表一个矩阵块的行开始数;根据矩阵的每行非零元素数目e_num与矩阵宽度σ的元素的大小,求出每一行非零元素在分块后所占的行数,根据行数求出每一个矩阵块的bit_flag;S6:对于整体辅助向量tile_ptr,根据原本向量e_num的值,进行二分查找,进而求出每一个矩阵块所对应的tile_ptr的值;S7:基于ELLB的SpMV并行优化;对于ELLB稀疏矩阵存储格式,对于每一行元素,分配一个线程进行处理;通过设置矩阵宽度σ,使得每个线程计算所需要的开销是一致的;SpMV的步骤如下:计算每一行数据的元素和;根据bit_flag向量针对每一块的值进行处理;根据tile_ptr的值求解最终的y值;S8:将并行优化的SpMV算法集成至OpenFOAM的PCG算法中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学;广东能哥知识科技有限公司,其通讯地址为:510006 广东省广州市番禺区广州大学城外环西路100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。