首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于计算任务重构的GPU计算单元数量自动度量方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京麟卓信息科技有限公司

摘要:本发明公开了一种基于计算任务重构的GPU计算单元数量自动度量方法,通过构建计算任务形成第一测试程序对象测得计算单元可支持的最大工作组数,基于最大工作组数重新构建计算任务形成第二测试程序对象测得初测数量数组,再以初测数量数组及最大工作组数为基础构建计算任务形成第三测试程序对象,采用第三测试程序对象及由其复制得到的对照测试核函数串行测试验证初测数量数组中的结果,得到被测GPU内计算单元的准确数量,实现了以软件方式度量GPU内计算单元的数量,为相关计算程序优化提供了准确的参数支撑。

主权项:1.一种基于计算任务重构的GPU计算单元数量自动度量方法,其特征在于,具体包括以下步骤:步骤1、查询被测GPU内计算单元可支持的最大工作组数,将该最大工作组数记为最大组数标称值,基于第一命令队列及第一基础核函数创建第一计算任务,将第一计算任务记为第一测试核函数;指定工作组的数量为第一数量,在被测GPU的任一计算单元上采用第一测试核函数在第一数量的工作组内执行第一命令队列,获取执行结果,直到第一数量达到最大组数标称值或执行结果为执行失败;当第一命令队列的执行结果为执行失败时所采用的第一数量减1作为最大组数实测值输出;否则最大组数标称值即为最大组数实测值;步骤2、基于第二命令队列及第二基础核函数创建第二计算任务,将第二计算任务记为第二测试核函数;指定工作组的数量为第二数量,令第二数量等于最大组数实测值,在被测GPU上采用第二测试核函数在第二数量的工作组内执行第二命令队列记录执行时间,将执行时间记为计算单元执行时间;令执行次数n的初始值为0;步骤3、在被测GPU上采用第二测试核函数在第二数量的工作组内执行第二命令队列,记录执行时间为本轮执行时间,若本轮执行时间大于计算单元执行时间则执行步骤4,否则将第二数量与最大组数实测值之和作为第二数量执行步骤3;步骤4、第二数量与最大组数实测值的商为被测GPU内计算单元的数量CUNum,记为CUNum_n,令n自加1,若n不大于N则执行步骤3,N为设定的数量最大值;否则对N个计算单元的数量CUNum去重后得到M个不同的CUNum,M个不同的CUNum构成初测数量数组,执行步骤5;步骤5、基于第三命令队列及第三基础核函数创建第三计算任务,将第三计算任务记为第三测试核函数,复制第三测试核函数形成对照测试核函数;令执行次数m的初始值为0,m的最大值为初测数量数组内元素的数量M;步骤6、从初测数量数组中选择第m个初测数量,将第m个初测数量记为初测数量_m,以初测数量_m与特定值之积为第三数量,其中,特定值满足以下条件:特定值小于最大组数实测值,且最大组数实测值与特定值之差与初测数量_m之积大于最大组数实测值;在被测GPU上采用第三测试核函数在第三数量的工作组内执行第三命令队列,以实现均匀且部分填充被测GPU内的各计算单元;以最大组数实测值与特定值之差为第四数量,令执行次数i的初始值为0;步骤7、在被测GPU上采用对照测试核函数在第四数量的工作组内执行第三命令队列,记录本轮的执行时间;若本轮的执行时间大于上一轮的执行时间则执行步骤9,否则执行步骤8;步骤8、令i自加1,并以第四数量的二倍更新第四数量,执行步骤7;步骤9、若i-1与初测数量_m相等,则说明初测数量_m为计算单元数量的准确值,结束本流程;否则令m自加1,若m不大于M则执行步骤6,若m大于M则结束本流程。

全文数据:

权利要求:

百度查询: 北京麟卓信息科技有限公司 一种基于计算任务重构的GPU计算单元数量自动度量方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。