恭喜北京邮电大学;四方联盟(北京)科技发展有限公司;联洋国融(北京)科技有限公司欧中洪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京邮电大学;四方联盟(北京)科技发展有限公司;联洋国融(北京)科技有限公司申请的专利一种支持多种硬件平台的神经网络模型量化部署方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116362287B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310102989.6,技术领域涉及:G06N3/04;该发明授权一种支持多种硬件平台的神经网络模型量化部署方法是由欧中洪;范丽娜;王勇;宿兴辉;尧思远;宋美娜设计研发完成,并于2023-01-29向国家知识产权局提交的专利申请。
本一种支持多种硬件平台的神经网络模型量化部署方法在说明书摘要公布了:本发明提出一种支持多种硬件平台的神经网络模型量化部署方法,包括,获取待量化神经网络模型;针对待部署硬件平台配置网络量化参数;根据待部署硬件平台使用基准量化方法对待量化神经网络模型进行预量化;使用跨层权重均衡与偏差吸收相结合的思想对预量化神经网络模型参数进行均匀分布调整,获取调整后神经网络模型;根据待部署硬件平台使用自适应图调度策略找到调整后神经网络模型精度和速度间的最佳平衡点,根据最佳平衡点计算并导出量化后神经网络模型和量化后神经网络模型参数;将量化后神经网络模型参数写入到待部署硬件平台。通过本发明提出的方法,用于提升模型在端侧的推理速度,使模型可以部署在计算资源受限设备或时延敏感的应用中。
本发明授权一种支持多种硬件平台的神经网络模型量化部署方法在权利要求书中公布了:1.一种支持多种硬件平台的神经网络模型量化部署方法,其特征在于,包括以下步骤:获取待量化神经网络模型;针对待部署硬件平台配置网络量化参数,所述待部署硬件平台包括电力开放环境下的硬件平台;根据所述待部署硬件平台使用基准量化方法对所述待量化神经网络模型进行预量化;使用跨层权重均衡与偏差吸收相结合的思想对所述预量化神经网络模型参数进行均匀分布调整,获取调整后神经网络模型;根据所述待部署硬件平台使用自适应图调度策略找到所述调整后神经网络模型精度和速度间的最佳平衡点,根据所述最佳平衡点计算并导出量化后神经网络模型和量化后神经网络模型参数;将所述量化后神经网络模型参数写入到待部署硬件平台;其中,所述使用跨层权重均衡与偏差吸收相结合的思想对所述预量化神经网络模型参数进行均匀分布调整,包括:根据公式(1)进行上下层之间不同通道缩放系数的调整, (1)其中,,,,S是一个对角矩阵,对角线上的每个值是用来调整缩放系数的因子;根据公式(2)减少量化误差, (2)其中,,,,c是常数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学;四方联盟(北京)科技发展有限公司;联洋国融(北京)科技有限公司,其通讯地址为:100876 北京市海淀区西土城路10号北京邮电大学新科研楼627室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。