首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于访存冲突度量的存储体大小测算方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京麟卓信息科技有限公司

摘要:本发明公开了一种基于访存冲突度量的存储体大小测算方法,通过构建能够触发Bank冲突的存储体测算核函数,存储体测算核函数包含共享内存访问内核,共享内存访问内核为按照设定地址及设定数据量执行设定次数访问共享内存操作的循环结构,根据存储体测算核函数及共享内存访问内核的二进制代码的大小确定执行共享内存访问内核的设定次数,再构建主机代码改变设定地址迭代测算存储体测算核函数的执行时间,具有相对较短执行时间的设定地址即为被测GPU的Bank大小,实现了在不查询硬件手册或者调用硬件查询API的前提下,以软件方式直接准确的测算GPU的Bank大小。

主权项:1.一种基于访存冲突度量的存储体大小测算方法,其特征在于,具体包括以下步骤:步骤1、获取被测GPU的指令缓存大小,构建通过访问共享内存触发Bank冲突的核函数,将其记为存储体测算核函数;存储体测算核函数中包含按照设定地址及设定数据量执行设定次数访问共享内存操作的循环结构,将其记为共享内存访问内核,设定次数为使执行该设定次数次循环体后得到的代码不超过指令缓存大小的最大值,设定数据量为设定的每个线程可处理的数据总量;在执行共享内存访问内核的前、后均执行线程块内各线程的同步操作;步骤2、将存储体测算核函数编译为二进制代码,将其记为第一代码;从第一代码中获取共享内存访问内核所对应的二进制代码,将其记为第二代码,将第二代码中循环体所对应的二进制代码记为第三代码;根据设定数据量以及第一代码、第二代码的大小确定设定次数的最大值,将其记为最大设定次数;步骤3、获取被测GPU的汇编代码中NOP指令的数据量大小,将其记为NOP大小;根据最大设定次数、设定数据量、第二代码的大小及NOP大小确定第一指令数量,将共享内存访问内核替换为第一指令数量个的NOP指令,将此时的存储体测算核函数记为中间核函数;步骤4、构建用于计算存储体测算核函数执行时间的主机代码,将其记为执行时间计算代码,执行时间计算代码调用中间核函数,并在调用中间核函数之前启动计时器、在调用中间核函数之后停止计时器,计时器两次计时结果的差值即为中间核函数的执行时间;步骤5、编译执行时间计算代码得到二进制代码,将其记为目标二进制代码,获取目标二进制代码内中间核函数的起始地址,将其记为第一起始地址;以第一起始地址为起点定位第一个同步操作执行结束的地址,将其记为第一同步地址,将第一同步地址与最大设定次数、设定数据量及第二代码的大小三者之积的和作为替换结束地址,再将从第一同步地址到替换结束地址的范围内的代码替换为N个第三代码,N的取值为最大设定次数与设定数据量之积;设定迭代次数M,令M的初始值为0,M的最大值为Mmax;步骤6、按照确定的设定地址、设定数据量及最大设定次数,执行目标二进制代码得到存储体测算核函数的执行时间;步骤7、若M不大于Mmax,则增大设定地址后执行步骤6;否则执行步骤8;步骤8、选择执行时间与之前的执行时间之差大于阈值的最小的执行时间,其对应的设定地址即为Bank的大小。

全文数据:

权利要求:

百度查询: 北京麟卓信息科技有限公司 一种基于访存冲突度量的存储体大小测算方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术