恭喜南京大学王中风获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京大学申请的专利一种基于对数块浮点量化的神经网络加速系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114626516B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210300275.1,技术领域涉及:G06F9/30;该发明授权一种基于对数块浮点量化的神经网络加速系统是由王中风;倪超;鲁金铭;林军设计研发完成,并于2022-03-24向国家知识产权局提交的专利申请。
本一种基于对数块浮点量化的神经网络加速系统在说明书摘要公布了:本申请提供一种基于对数块浮点量化的神经网络加速系统。所述系统包括编译器、运行时和神经网络加速器,在使用时,编译器按照量化分块粒度对待部署模型数据进行分块,并将待部署模型全部转换为硬件指令,通过运行时与神经网络加速器进行交互,神经网络加速器根据指令将数据按照搬运分块粒度从片外分块搬运至片上进行加载,并对各个数据量化分块进行对数块浮点量化,最终利用量化结果执行对应的神经网络运算。整个系统通过编译器将模型转换为硬件可以识别的指令,由运行时向硬件下发指令和数据并与硬件进行高效通信,同时采用完全适配于对数块浮点量化方法的硬件架构,计算冗余较少,计算效率较高,可以有效地支持深度神经网络模型的端到端部署。
本发明授权一种基于对数块浮点量化的神经网络加速系统在权利要求书中公布了:1.一种基于对数块浮点量化的神经网络加速系统,其特征在于,包括依次连接的编译器、运行时和神经网络加速器,所述神经网络加速器包括控制单元、转换单元,以及依次连接的张量DMA、片上缓存单元和计算单元,其中:所述编译器被配置为执行以下步骤:按照预设的量化分块粒度对待部署模型数据进行分块,得到多个数据量化分块,所述待部署模型数据包括待部署模型的权重值和当前激活值,所述当前激活值包括当前输入值和当前输出激活值;将所述待部署模型转换为供所述神经网络加速器识别的多个硬件指令,多个硬件指令包括访存指令和计算指令,所述访存指令用于指示所述张量DMA通过所述运行时按照搬运分块粒度,将各个数据量化分块从片外存储中分块搬运至所述片上缓存单元进行加载,以及从所述片上缓存单元中搬运至片外存储中进行存储,所述搬运分块粒度为所述量化分块粒度的整数倍,所述计算指令用于指示所述控制单元向所述计算单元和所述转换单元分配计算数据和数据转换方式;所述控制单元被配置为执行以下步骤:控制所述张量DMA按照所述访存指令,将各个数据量化分块按所述搬运分块粒度从片外存储中分块搬运至所述片上缓存单元进行加载,以及从所述片上缓存单元中搬运至片外存储中进行存储;控制所述转换单元根据各个数据量化分块的块浮点共享指数,对所述片上缓存单元中的各个数据量化分块进行对数块浮点量化,其中,各个数据量化分块中的权重值量化分块的块浮点共享指数为所述编译器根据所述权重值量化分块中所有权重元素预先确定的,各个数据量化分块中的当前激活值量化分块的块浮点共享指数为所述编译器根据预先获取的激活值样本集中所有元素离线确定的,或者为所述转换单元根据所述当前激活值量化分块中所有元素在线确定的;控制所述计算单元根据各个数据量化分块的对数块浮点量化结果,执行计算密集型算子的计算以及访存密集型算子的计算;所述搬运分块粒度通过以下方式设置:根据权重值搬运分块的搬运次数、当前输入值搬运分块的搬运次数、当前输出激活值搬运分块的搬运次数、权重值搬运分块所占有的片上存储量、当前输入值搬运分块所占有的片上存储量以及当前输出激活值搬运分块所占有的片上存储量,确定总片外数据传输量,所述权重值搬运分块根据所述权重值量化分块以及第一整数倍确定,所述当前输入值搬运分块根据各个数据量化分块中的当前输入值量化分块以及第二整数倍确定,所述当前输出激活值搬运分块根据各个数据量化分块中的当前输出激活值量化分块以及第三整数倍确定;从各个总片外数据传输量中,按照约束条件搜索确定最小总片外数据传输量,所述约束条件为所述权重值搬运分块、所述当前输入值搬运分块和所述当前输出激活值搬运分块各自所占有的片上存储量小于或等于各自对应的允许片上总缓存量;获取所述最小总片外数据传输量所对应的目标权重值搬运分块的大小、目标当前输入值搬运分块的大小和目标当前输出激活值搬运分块的大小;将所述目标权重值搬运分块的大小、所述目标当前输入值搬运分块的大小和所述目标当前输出激活值搬运分块的大小,确定为所述搬运分块粒度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。