首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于豪斯霍尔德变换自适应的大模型微调方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民大学

摘要:本公开提供一种基于豪斯霍尔德变换自适应的大模型微调方法。包括四个步骤:第一步、给定一个数据集D和一个预训练好的模型M,使用数据集D对预训练好的模型M的L个权重矩阵进行适应训练;第二步、使用Url来表示第l个权重矩阵W的HRA参数,在训练过程中利用数据集D和模型M,构建损失函数对M的L个权重矩阵进行更新;第三步、选取合适的r决定需要微调的参数量;第四步、调整λ的取值的同时也要调整训练过程种使用的学习率,经过多次实验选择合适的超参数。最终实现与其相当甚至少于先前方法的参数量、具有更低的计算复杂度、在模型容量和正则化之间能够取得平衡的技术效果。

主权项:1.一种基于豪斯霍尔德变换自适应的大模型微调方法,其特征在于,包括四个步骤:第一步、给定一个在自然语言处理任务下的文本序列数据集D和一个预训练好的模型M,使用数据集D对预训练好的模型M的L个权重矩阵进行适应训练;通过构建一系列可学习的豪斯霍德尔反射形成构成正交关系的豪斯霍尔德反射矩阵,然后通过将每个冻结的权重矩阵与该正交矩阵相乘来微调模型;第二步、使用Url来表示第l个权重矩阵W的HRA参数,在训练过程中利用数据集D和模型M,构建损失函数对M的L个权重矩阵进行更新: 第三步、选取合适的r决定需要微调的参数量;第四步、调整λ的取值的同时也要调整训练过程种使用的学习率,经过多次实验选择合适的超参数,其中针对使用MetaMathQA数据集微调LLaMa2-7B模型,当λ=0时,设置学习率为1E-05,当λ=1e-4时,设置学习率为3E-05,当λ=∞时,设置学习率为1E-03;针对使用DreamBooth数据集微调StableDiffusion模型时,学习率均设置为7E-06,使用COCO数据集、Celeba-HQ数据集和ADE20K数据集时,学习率均设置为3E-05;GLUE这个数据集中包含多个小数据集,针对其中不同的小数据集,学习率的设置如图11,最终得到微调后的针对自然语言处理任务的大模型。

全文数据:

权利要求:

百度查询: 中国人民大学 一种基于豪斯霍尔德变换自适应的大模型微调方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。