买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:四川无际智慧科技有限公司
摘要:本发明提供一种自然语言模型的剪枝处理方法、系统和电子设备,基于获得的各个训练数据并基于自然语言模型,获得对应的输入构造数据及对应的标签数据,标签数据表征多头注意力运算模块中各个头部的权重。利用输入构造数据及标签数据对构建的剪枝小模型进行训练,将剪枝小模型的模型参数与自然语言模型的模型参数进行合并,得到具备剪枝功能的自然语言模型,其中,该模型中包含的剪枝小模型的模型参数可用于对待处理数据进行处理时,对自然语言模型中的多个头部进行剪枝处理。该方案中,优化后的自然语言模型中剪枝小模型部分能够根据每次的不同输入自适应找到最优的头部,推理效果更好、鲁棒性更强。
主权项:1.一种自然语言模型的剪枝处理方法,其特征在于,所述自然语言模型包括依次连接的嵌入层和模块层组,所述模块层组包括多头注意力运算模块,所述多头注意力运算模块包括多个头部,所述方法包括:获取多个训练数据,将各所述训练数据导入所述自然语言模型,所述训练数据为段落文本或对话问答数据;通过所述嵌入层获得各所述训练数据对应的数据向量,通过所述模块层组并基于所述数据向量获得对应的输入构造数据及所述输入构造数据对应的标签数据,所述标签数据表征所述多头注意力运算模块中各个头部对应的权重;利用所述输入构造数据及对应的标签数据对构建的剪枝小模型进行训练,得到训练完成的剪枝小模型的模型参数;将训练完成的所述剪枝小模型的模型参数与所述自然语言模型的模型参数进行合并,得到具备剪枝功能的自然语言模型,其中,具备剪枝功能的自然语言模型中包含的所述剪枝小模型的模型参数用于对待处理数据进行处理时,对所述自然语言模型中的多个头部进行剪枝处理。
全文数据:
权利要求:
百度查询: 四川无际智慧科技有限公司 自然语言模型的剪枝处理方法、系统和电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。