恭喜山东省计算中心(国家超级计算济南中心);齐鲁工业大学(山东省科学院)刘弢获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜山东省计算中心(国家超级计算济南中心);齐鲁工业大学(山东省科学院)申请的专利基于新一代申威处理器计算资源受限与通信冗余优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119292794B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411826361.1,技术领域涉及:G06F9/50;该发明授权基于新一代申威处理器计算资源受限与通信冗余优化方法是由刘弢;吕晓光;宋猛;秦晗;郭莹设计研发完成,并于2024-12-12向国家知识产权局提交的专利申请。
本基于新一代申威处理器计算资源受限与通信冗余优化方法在说明书摘要公布了:本发明涉及基于新一代申威处理器计算资源受限与通信冗余优化方法,属于电子信息技术领域。包括:首先,对热点计算部分进行分析,判断热点计算部分循环次数与计算量需要的核组的数量;其中,计算部分的代码运行时间占总代码运行时间一半以上,则判定该计算部分为热点计算部分;然后,多核组申请与编号,让多核组对热点计算部分进行协同计算;再次,在协同计算完成后,对核组内的从核进行分组,优化对数据的收集、传输,核组间再进行数据收集、传输;最后,将最终结果单次传回主存。本发明通过申请多核组协同优化,使得从核优化能够利用更多的计算资源,大大提升了程序的执行效率。
本发明授权基于新一代申威处理器计算资源受限与通信冗余优化方法在权利要求书中公布了:1.基于新一代申威处理器计算资源受限与通信冗余优化方法,其特征在于,包括: 首先,对热点计算部分进行分析,判断热点计算部分循环次数与计算量需要的核组的数量;其中,计算部分的代码运行时间占总代码运行时间一半以上,则判定该计算部分为热点计算部分; 然后,多核组申请与编号,让多核组对热点计算部分进行协同计算; 再次,在协同计算完成后,对核组内的从核进行分组,优化对数据的收集、传输,核组间再进行数据收集、传输; 最后,将最终结果单次传回主存; 判断热点计算部分循环次数与计算量需要的核组的数量;是指:通过训练线性回归模型预测核组的数量;包括: 1提取三类程序的数据作为训练数据;三类程序分别是计算复杂度为On,On2,On3的程序,n表示循环执行的次数;O是渐近上界的表示法,用来描述算法的运行时间或空间需求随输入规模增长的变化趋势;On表示算法的运行时间与输入规模成正比;On2表示算法的运行时间与输入规模的平方成正比;On3表示算法的运行时间与输入规模的立方成正比;训练数据包括多个样本,三类程序的数据包括特征和目标值,特征包括循环次数、计算复杂度;目标值是实际测试得到的每种组合下所需的核组数;通过修改这三类程序的循环次数,将循环次数与计算复杂度进行排列组合,测试出每种组合最优核组数,得到训练数据的多个样本; 2使用上述训练数据,训练一个线性回归模型,线性回归模型的公式如下所示: y=β0+β1x1+β2x2+…+βixi…βnxn; 其中,y是预测值,β0是偏差项,βi是每个特征的权重,xi是每个特征的值; 训练过程包括:根据特征数量初始化线性回归模型,包括权重和偏差项,权重和偏差项初始值设为0;使用训练数据对线性回归模型进行训练,通过多次迭代,调整权重和偏差项,使得线性回归模型拟合训练数据;使用均方误差作为损失函数,通过梯度下降法不断优化线性回归模型的参数,得到训练好的线性回归模型; 3将新的数据输入至训练好的线性回归模型进行预测,输出预测的核组数目; 多核组对热点计算部分进行协同计算;包括: 选择3核组协同计算时,线程号范围是0-191,核组号范围是0-2,每个线程都有自己对应的核组号;根据热点计算部分的特点,将计算任务分配给各从核,具体是指:将总任务量除以总线程数,得到每个从核具体需要操作的任务量,每个从核执行自己那部分任务的计算;各从核通过DMA方式或者直接访主存方式从主核获取需要的数据,每个从核独立完成自己的一部分任务,各核组间的从核计算互不干扰,在核组内对计算部分进行规约操作、RMA传输操作,将结果传回主核; 以3核组协同优化时,对核组内的从核进行分组,优化对数据的收集、传输,核组间再进行数据收集、传输;包括: 首先,在多从核任务执行时,划分从核小组,每四个从核组成一个从核小组,每个从核的逻辑编号为0、1、2、3,并为每个从核小组的从核分配LDM连续共享空间;每个从核计算完成后,将结果放入LDM连续共享空间;每个从核小组指定逻辑编号为0的从核为三级汇总从核,负责收集本组内其他从核的计算结果; 然后,在每个核组中指定0号从核为二级汇总从核,负责汇总本核组内各三级汇总从核的结果;具体操作是:每个三级汇总从核通过RMA操作将结果发送给二级汇总从核; 最后,将核组编号为0的0号从核设为一级汇总从核,负责将核组编号为1、2的二级汇总从核的结果汇总,从而获得最终计算结果,再由一级汇总从核将该最终计算结果通过DMA传回主存。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东省计算中心(国家超级计算济南中心);齐鲁工业大学(山东省科学院),其通讯地址为:250014 山东省济南市历下区科院路19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。