首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

面向轻量卷积神经网络的训练后量化方法、装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中科南京人工智能创新研究院;中国科学院自动化研究所

摘要:本发明公开了一种面向轻量卷积神经网络的训练后量化方法、装置,该方法包括读取图像数据;构建浮点模型和量化后模型,基于随机预处理和打乱顺序后的图像批次,逐块地对浮点模型和量化后模型中的每个模型块进行输出特征图的重建,并计算输出特征图重建的损失;基于特征图重建的损失,对量化后模型的每个模型块的批归一化参数和量化参数进行梯度更新和学习。本发明通过对图像数据进行逐块地预处理和随机打乱顺序,提高了模型对输入数据的泛化能力,避免了模型过拟合;通过逐块学习并更新批归一化层参数、权重缩放因子和激活缩放因子,可以在量化过程中细致调整模型参数,在低比特量化下仍保持较高的模型精度。

主权项:1.一种面向轻量卷积神经网络的训练后量化方法,其特征在于,包括如下步骤:S1、读取图像数据并归一化;构建图像变换集合并为每种图像变换设置变换参数;其中,图像预处理变换包括随机缩放裁剪和水平翻转;变换参数包括随机缩放的比例范围和随机翻转概率;S2、基于轻量卷积神经网络模型构建浮点模型和量化模型,并划分为N个模型块,将量化模型中的模型参数初始化为浮点模型的模型参数,模型权重的缩放因子和量化零点,激活的缩放因子和零点通过浮点权重和激活的最大值和最小值进行初始化;N为大于0的自然数;S3、针对每个模型块,逐块优化量化模型的批归一化层的参数、均值和方差、激活和权重的缩放因子;在优化每个模型块前,读取图像数据和图像变换集合,对图像数据进行随机预处理,得到处理后的图像批次,并随机打乱图像批次的顺序;基于打乱顺序后的图像批次,针对浮点模型和量化后模型中的当前处理模型块,重建输出特征图并计算输出特征图重建的损失;S4、基于特征图重建的损失,使用梯度下降法对量化后模型的当前模型块的批归一化参数、激活和权重的缩放因子进行梯度更新和学习;S5、判断所有模型块是否处理结束,若结束,对量化模型整体进行非对称张量级量化处理。

全文数据:

权利要求:

百度查询: 中科南京人工智能创新研究院 中国科学院自动化研究所 面向轻量卷积神经网络的训练后量化方法、装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。