买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆科技大学
摘要:本发明涉及神经网络领域专用应用芯片加速计算架构技术领域,具体公开了一种基于动态可重构脉动张量运算引擎的深度神经网络加速器,其采用动态可重构脉动张量阵列运算引擎单元实现高吞吐量张量乘法计算,采用权重参数存储单元存放权重张量,采用张量排序模块实现稀疏网络权重解包和对网络层参数进行排序优化完成并行流水线运算,采用激活值向量存储单元作为神经网络计算引擎的片内高速数据暂存区,提升数据重复利用率和降低与外存交互,采用累加器和矩阵转置向量单元完成对计算结果累计求和、快速处理矩阵转置和张量维度变换,采用标量运算单元实现网络模型的非线性函数计算,具有资源利用率高,能耗占用低,精度损失低,模型运算速度快等优点。
主权项:1.基于动态可重构脉动张量运算引擎的深度神经网络加速器,其特征在于,包括:包括HBM高速内存接口、权重参数存储单元、张量排序模块、激活值向量存储单元、动态可重构脉动张量阵列运算引擎单元、累加器和矩阵转置向量单元、标量运算单元;所述HBM高速内存接口用于从DRAM外部存储器中分别调入深度神经网络的权重张量、特征图张量至所述权重参数存储单元及所述激活值向量存储单元中;所述权重参数存储单元用于将自身存储的权重张量并行拍打送入所述张量排序模块的多个张量排序单元,所述激活值向量存储单元用于将自身存储的特征图张量并行拍打送入所述动态可重构脉动张量阵列运算引擎单元;多个所述张量排序单元用于对送入的所述权重张量进行排序优化,完成张量到矩阵的分解,然后拍打送入所述动态可重构脉动张量阵列运算引擎单元;所述动态可重构脉动张量阵列运算引擎单元用于根据输入的所述权重张量和所述特征图张量动态重构多个脉动张量阵列运算引擎并分别对其进行并行的乘累加操作,输出对应的乘累加运算结果至所述累加器和矩阵转置向量单元;所述累加器和矩阵转置向量单元用于对输入的所述乘累加运算结果进行累加缓存和异步处理矩阵转置操作,输出所述权重张量和所述特征图张量的最终运算结果至所述标量运算单元;所述标量运算单元用于对输入的所述最终运算结果进行特定应用场景下的数据运算操作,输出对应的数据运算结果至所述激活值向量存储单元作为深度神经网络的新的特征图张量参与下一轮计算或直接作为深度神经网络的最终推理结果;所述HBM高速内存接口还用于从所述激活值向量存储单元中取出深度神经网络的最终推理结果并传输至所述DRAM外部存储器中;所述动态可重构脉动张量阵列运算引擎单元包括多个所述脉动张量运算引擎,每个所述脉动张量运算引擎的数量以及运算方式由外部的编译器动态确定;每个所述脉动张量运算引擎的输入均为可变维度的权重张量和特征图张量,多个所述脉动张量运算引擎独立并行流水线运算,最后得到多个运算结果输入所述累加器和矩阵转置向量单元。
全文数据:
权利要求:
百度查询: 重庆科技大学 基于动态可重构脉动张量运算引擎的深度神经网络加速器
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。