一种适用于国产硬件的FP32模型转换方法

导航：龙图腾网> 最新专利技术> 一种适用于国产硬件的FP32模型转换方法

申请/专利权人：福建亿榕信息技术有限公司;国网信息通信产业集团有限公司

申请日：2023-12-25

公开（公告）日：2024-07-05

公开（公告）号：CN117454948B

主分类号：G06N3/063

分类号：G06N3/063;G06N3/06;G06F18/214

优先权：

专利状态码：有效-授权

法律状态：2024.07.05#授权;2024.02.13#实质审查的生效;2024.01.26#公开

摘要：本发明涉及一种适用于国产硬件的FP32模型转换方法，包括以下步骤：步骤S1:基于原始FP32模型，获取训练数据集；步骤S2:基于训练数据集，构建初始缩放因子和偏置；步骤S3:根据缩放因子，将原始FP32模型转换为INT8模型；步骤S4:基于量化感知训练INT8模型，在训练过程中，根据量化感知精度和量化感知损失的变化情况，动态调整模型参数，直到满足预设精度，则得到最终的INT8模型；步骤S5:将最终的INT8模型部署到国产硬件上。本发明在保持较高性能的同时，降低模型的精度损失，提高FP32模型在国产AI加速硬件上的运行效率。

主权项：1.一种适用于国产硬件的FP32模型转换方法，其特征在于，包括以下步骤：步骤S1:基于原始FP32模型，获取训练数据集；步骤S2:基于训练数据集，构建初始缩放因子和偏置；步骤S3:根据缩放因子，将原始FP32模型转换为INT8模型；步骤S4:基于量化感知训练INT8模型，在训练过程中，根据量化感知精度和量化感知损失的变化情况，动态调整模型参数，直到满足预设精度，则得到最终的INT8模型；步骤S5:将最终的INT8模型部署到国产硬件上；所述步骤S3具体为：将原始的浮点权重和激活值转换为整数表示，量化的公式如下：INT8_weight=roundFP32_weightscale_weight；INT8_activation=roundFP32_activationscale_activation；其中，INT8_weight和INT8_activation分别表示量化后的权重和激活值、scale_weight和scale_activation是量化的缩放因子;FP32_weight和FP32_activation分别表示浮点数表示的权重和激活值;在模型推理过程中，将INT8精度的权重和激活值反量化为浮点数表示,反量化的公式如下FP32_weight=INT8_weight*scale_weight；FP32_activation=INT8_activation*scale_activation；引入量化误差,量化误差修正的公式如下：FP32_activation=INT8_activation+bias_activation*scale_activation；其中，bias_activation是用于修正量化误差的偏置项；所述原始FP32模型包括图像分类模型和语言模型，构建初始的缩放因子和偏置项，具体如下：图像分类模型：对于图像分类模型，使用训练集中的图像数据来计算均值和标准差；对于每个通道（R、G、B）或特征维度，计算训练集中所有图像的均值和标准差；将每个通道的标准差除以预设参量来估计缩放因子；并使用每个特征维度的均值作为初始偏置项；语言模型：对于语言模型，对于每个特征维度，将文本数据视为序列，计算序列中所有数据的均值和标准差；将每个特征维度的标准差除以预设参量来估计缩放因子；并使用每个特征维度的均值作为初始偏置项；所述基于量化感知训练INT8模型，具体为：（1）将量化后的权重和激活值输入到模型中进行前向传播；（2）在前向传播过程中，使用量化后的权重和激活值进行计算，得到输出结果；（3）基于损失函数，进行输出结果和真实标签进行比较，loss=-1N*sumy_true*logsoftmaxy_pred；其中，y_true是真实标签，y_pred是量化后的整数输出结果，N是样本数量；softmaxy_pred表示对量化后的整数输出结果进行softmax函数计算；（4）根据损失函数计算损失，使用梯度下降算法计算梯度，并将梯度传播回模型的每一层；（5）在反向传播过程中，使用量化后的权重和激活值进行梯度计算和参数更新；（6）基于更新后的权重和激活值，更新量化的缩放因子；（7）重复进行多个训练迭代，直到达到预定的训练轮数或达到预设精度要求；所述前向传播，具体为：对于每个神经元的输入，使用量化后的权重和激活值进行计算；对于第l层的第j个神经元，使用以下公式计算其输入：input_j=sumINT8_weight[l][j][i]*INT8_activation[l-1][i]foriinrangenum_inputs；对于第l层的第j个神经元，使用激活函数计算其输出：output_j=activation_functioninput_j；重复以上步骤，直到计算出模型的输出；其中，INT8_weight[l][j][i]表示第l层的第j个神经元与第l-1层的第i个神经元之间的连接权重，INT8_activation[l-1][i]表示第l-1层的第i个神经元的激活值，num_inputs表示第l-1层的神经元数量；所述反向传播，具体如下：对于量化权重的梯度计算：gradient_weight=gradient_quantized_weight*scale_factor；其中，gradient_quantized_weight表示量化后的权重梯度，scale_factor表示缩放因子，gradient_weight表示浮点数权重的梯度；对于量化激活值的梯度计算：gradient_activation=gradient_quantized_activation*scale_factor；其中，gradient_quantized_activation表示量化后的激活值梯度，scale_factor表示缩放因子，gradient_activation表示浮点数激活值的梯度；参数更新：对于量化权重的参数更新：updated_weight=weight-learning_ratea*gradient_weight；其中，weight表示浮点数权重，learning_ratea表示学习率，gradient_weight表示浮点数权重的梯度，updated_weight表示更新后的浮点数权重；对于量化激活值的参数更新：updated_activation=activation-learning_rateu*gradient_activation；其中，activation表示浮点数激活值，learning_rateu表示学习率，gradient_activation表示浮点数激活值的梯度，updated_activation表示更新后的浮点数激活值；基于更新后的权重和激活值，更新量化的缩放因子，具体为：对于权重的缩放因子更新：updated_scale_factor_weight=maxmax_weight,min_weight2^bitwidth-1；其中，bitwidth表示量化位宽，updated_scale_factor_weight表示更新后的权重的缩放因子；max_weight=maxabsupdated_weight；min_weight=minabsupdated_weight；对于激活值的缩放因子更新：updated_scale_factor_activation=maxmax_activation,min_activation2^bitwidth-1；其中，bitwidth表示量化位宽，updated_scale_factor_activation表示更新后的激活值的缩放因子；max_activation=maxabsupdated_activation；min_activation=minabsupdated_activation；所述步骤S5具体为：获取与目标硬件设备兼容的驱动程序，所述驱动程序负责与硬件设备进行通信，并提供接口和功能，以支持模型推理操作；在驱动程序的基础上，集成一个推理引擎，用于加载和执行量化的INT8模型，所述推理引擎负责解析模型文件、构建计算图、执行推理操作，并将结果返回给驱动程序；在推理引擎中，实现模型加载和优化的功能，包括将量化后的INT8模型文件加载到内存中，并进行模型优化；在推理引擎中，实现模型的推理过程，包括将输入数据传递给模型，执行前向计算，并获取模型的输出结果。

全文数据：

权利要求：

百度查询：福建亿榕信息技术有限公司国网信息通信产业集团有限公司一种适用于国产硬件的FP32模型转换方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于视觉定位的全自动智能灌装装置

下一篇：一种球形石墨成型装置

相关技术

一种基于视觉定位的全自动智能灌装装置

一种球形石墨成型装置

电池端面检测装置

一种智能电表远程监测系统及方法

一种应用于PCB制造串接直流式曝光装置及工艺流程

一种太阳高度角演示仪

储能电池包散热系统

一种前列腺支架

一种匹伐他汀关键中间体的制备方法

一种水轮发电机组碳刷打火检测方法、系统及存储介质

一种废旧路面沥青回收处理系统

一种热成型侧壁斜楔成型设备及其成型方法

硬件相关技术

O-RAN中的硬件加速指南的发行_乐天移动株式会社_202280084740.0

一种计算机硬件故障检测维修设备_江西工程学院_202310141625.9

硬件系统的可靠性分析方法、设备、程序产品及存储介质_浪潮电子信息产业股份有限公司_202410465675.7

一种电子信息工程用硬件检测设备_江苏思创智能技术有限公司_202410573300.2

一种灵活可配的高稳定时频同步系统硬件架构及实现方法_中国人民解放军国防科技大学_202410673695.3

一种混动电机硬件在环故障注入测试系统、方法及设备_上海法雷奥汽车电器系统有限公司_202410546053.7

初等函数的硬件实现系统_山东浪潮科学研究院有限公司_202410512148.7

动态生成的代码的硬件验证_苹果公司_202180073713.9

一种计算机硬件固定框_大庆市泰勒恩科技开发有限公司_202323331582.5

神经网络硬件加速器及方法_深圳博瑞晶芯科技有限公司_202410396058.6

转换相关技术

电压转换器_库卡德国有限公司_201980053202.3

电力转换装置_金刚石捷步拉电机株式会社_202110665573.6

电力转换装置_金刚石捷步拉电机株式会社_202110666543.7

功率转换装置_三菱电机株式会社_202010529420.4

A/D转换器_株式会社电装_202410109816.1

串并转换电路、芯片、电子设备及串并转换方法_北京智芯微电子科技有限公司_202410260385.9

电气设备组件、转换器以及电力转换装置_住友电装株式会社_202410032295.4

一种数模转换电路_贵州航天控制技术有限公司_202410412238.9

一种转换水路装置_友信精密实业(深圳)有限公司_202322644614.0

坐标转换系统及作业机械_日立建机株式会社_201980057605.5

模型相关技术

训练BEV对象检测模型_APTIV技术股份公司_202410108709.7

一种用于离心模型实验的考虑静动力相似模型桩设计方法_浙江大学_202310873486.9

浅水湖泊模型网格剖分优化方法及水动力模型建立方法_河北省水利科学研究院(河北省大坝安全技术中心、河北省堤防水闸技术中心)_202410573564.8

一种基于混合专家模型的语言模型改进结构的方法及系统_山东浪潮科学研究院有限公司_202410612011.9

高眼压动物模型的制备方法、动物模型及其用途_中国人民解放军总医院第三医学中心_202410279718.2

用于模型校准的改进量规选择_ASML荷兰有限公司_202080017459.6

一种小鼠脑出血模型_中国人民解放军联勤保障部队第九六一医院_202322711996.4

一种复苏训练模型_天津市胸科医院_202323272088.6

一种建筑模型照明装置_赵文波_202322783849.8

一种模型预测控制的三相并网逆变器模型失配补偿方法_福州大学_202210870667.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种适用于国产硬件的FP32模型转换方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务