买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及信息安全技术领域,特别涉及一种针对终端资源受限的联邦大模型个性化训练方法。包括:参数服务器端:位于参数服务器端的大模型包含多个层级,且每个大模型的层级设有一个权重矩阵;本地终端:对应大模型中的每个权重矩阵,在本地终端的每个工作节点部署一个对应的LoRA模块,并在本地终端增设一个LocalLayer层;本地终端通过参数服务器端进行联邦大模型训练过程包括:S1.前向传播;S2.计算Loss;S3.反向传播。本发明利用参数服务器的计算、存储资源来帮助资源受限的多个终端实现对大模型的联邦训练。
主权项:1.一种针对终端资源受限的联邦大模型个性化训练方法,其特征在于,包括:参数服务器端:位于参数服务器端的大模型包含多个层级,且每个大模型的层级设有一个权重矩阵;本地终端:对应大模型中的每个权重矩阵,在本地终端的每个工作节点部署一个对应的LoRA模块,并在本地终端增设一个LocalLayer层;本地终端通过参数服务器端进行联邦大模型训练过程包括:S1.前向传播:输入数据x经本地终端的LocalLayer层传输给参数服务器端的大模型,中间数据沿大模型各层进行前向传播,并输出最终数据a;S2.计算Loss:通过大模型的输出数据a与本地标签y计算得到Loss;S3.反向传播:所得到的Loss经过多个LoRA模块进行反向梯度传播,对本地终端的LoRA模块进行迭代更新。
全文数据:
权利要求:
百度查询: 喀什大学 一种针对终端资源受限的联邦大模型个性化训练方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。