首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于批量片段处理的ROP单元组处理方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:武汉凌久微电子有限公司

摘要:本发明适用于GPU技术领域,提供一种基于批量片段处理的ROP并行处理实现方法,包括:构建ROPs顶层结构;SMPU将着色后的片段数据或者当前的配置命令通过ROP调度机发送至相应的ROP加速单元;每个ROP加速单元对接收到的片段数据或者配置命令进行相应操作,其中对于片段数据,以Pipeline的方式批量操作,操作完成后将颜色信息写入像素缓冲区中,模板深度信息写入到模板深度缓冲区中。本发明设计了全新的ROPs顶层结构,易实现,易扩展,同时,通过本发明方法,实现大块数据持续处理,能够使得Pipeline在大多情况下处于灌满状态,Pipeline一旦灌满数据吞吐量也将达到最大值,像素填充率也大大提升,从而提高了图形处理器整体处理性能。

主权项:1.一种基于批量片段处理的ROP并行处理实现方法,其特征在于,所述实现方法包括下述步骤:步骤S1、构建ROPs顶层结构;所述ROPs顶层结构包括ROPs单元组和多个SMPU,其中所述ROPs单元组包括ROP调度机和多个ROP加速单元,所有SMPU和ROP加速单元均连接至所述ROP调度机,每个ROP加速单元还连接有ROP缓冲区,所述ROP缓冲区包括像素缓冲区和模板深度缓冲区;步骤S2、所述SMPU将着色后的片段数据或者当前的配置命令通过ROP调度机发送至相应的ROP加速单元;步骤S3、每个ROP加速单元对接收到的片段数据或者配置命令进行相应操作,其中对于片段数据,以Pipeline的方式批量操作,操作完成后将颜色信息写入像素缓冲区中,模板深度信息写入到模板深度缓冲区中;其中所述步骤S2具体过程如下:S21、SMPU将着色后的片段数据或者当前的配置命令发送至ROP调度机,其中配置命令只能通过固定的SMPU下发,着色后的片段数据可通过任何一个SMPU下发;S22、当ROP调度机接收到配置命令时,将配置命令广播至所有ROP加速单元;S23、当ROP调度机接收到片段数据时,根据片段数据当前的y坐标信息选择分配给相应的ROP加速单元;步骤S23中,当ROP调度机接收到片段数据时,首先还需判断所述片段数据前后间是否存在相关性,若不存在相关性,则按照设置将逐批下发片段数据,若存在相关性,不论片段数据是否满一批,均将片段数据进行按批拆分,保证下发的每一批片段数据间不存在任何数据相关;步骤S3中,每个ROP调度机发送的片段数据或者配置命令保存至ROP加速单元的命令数据缓存中,所述步骤S3的具体过程如下:S31、ROP加速单元读取命令数据缓存并对读取内容进行解析;S32、如果是配置命令,继续解析配置命令,如果是非执行类命令,则设置对应的配置寄存器,如果是执行类命令,则发送命令并执行相应的批量处理操作;S33、如果是片段数据,首先对片段数据进行裁剪测试,然后根据配置寄存器的配置情况判断是否需要访问缓冲区,如果需要访问缓冲区,则连续发起访问缓冲区请求,读取对应缓冲区读回目标信息并将信息缓存,然后开启Pipeline操作,如果不需要访问缓冲区,则直接将片段数据依次写入到Pipeline中;Pipeline操作完成后用输出的像素信息覆盖原缓冲区对应的信息。

全文数据:

权利要求:

百度查询: 武汉凌久微电子有限公司 一种基于批量片段处理的ROP单元组处理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。