买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请公开了一种大模型训练系统、大模型训练方法及相关服务器,涉及多方安全计算技术领域和大模型训练技术领域,大模型训练系统的服务器包括CPU芯片和GPU加速卡,CPU芯片上具有TEE区域,该TEE区域内包含模型训练模块,GPU加速卡上具有算法执行模块,模型训练模块通过安全加密通道与客户端相连,多个服务器的模型训练模块之间通过安全加密通道相连,大模型训练过程中,每个服务器可以通过安全加密通道与客户端交互数据,各服务器之间也可以通过安全加密通道交互数据,每个服务器的CPU芯片的模型训练模块位于TEE区域中,提高了大模型训练的数据安全性,CPU芯片和GPU加速卡完成各自更适合执行的计算操作,提高了大模型训练的训练效率。
主权项:1.一种大模型训练系统,其特征在于,包括:多个服务器,所述服务器包括CPU芯片和GPU加速卡,所述CPU芯片上具有可信执行环境TEE区域,所述TEE区域内包含模型训练模块,所述GPU加速卡上具有算法执行模块,其中,所述模型训练模块通过安全加密通道与客户端相连,所述多个服务器的所述模型训练模块之间通过安全加密通道相连,所述多个服务器中包含各单机训练服务器和至少一个聚合训练服务器;所述单机训练服务器的所述模型训练模块,用于接收相连的所述客户端通过安全加密通道发送的训练数据;所述单机训练服务器的所述模型训练模块和所述算法执行模块,用于基于所述训练数据,以及模型训练算法中各自需要执行的计算操作,通过数据交互进行模型训练,得到单机训练特征数据,所述模型训练模块需要执行的计算操作包括数据预处理和中间变量数据裁剪,所述算法执行模块需要执行的计算操作包括矩阵运算;所述单机训练服务器的所述模型训练模块,还用于通过安全加密通道向所述聚合训练服务器的所述模型训练模块发送所述单机训练特征数据;所述聚合训练服务器的所述模型训练模块和所述算法执行模块,用于通过数据交互,对来自各服务器的所述单机训练特征数据进行聚合训练操作,得到聚合特征数据;当不需要基于所述聚合特征数据再次进行迭代训练时,所述聚合训练服务器的所述模型训练模块和所述算法执行模块,生成模型训练结果;当需要基于所述聚合特征数据再次进行迭代训练时,所述聚合训练服务器的所述模型训练模块,用于通过安全加密通道向各所述单机训练服务器的所述模型训练模块发送所述聚合训练数据;所述单机训练服务器的所述模型训练模块和所述算法执行模块,还用于基于所述聚合训练数据,以及模型训练算法中各自需要执行的计算操作,通过数据交互进行模型训练,得到再次迭代训练的单机训练特征数据,并通过安全加密通道发送至所述聚合训练服务器的所述模型训练模块,供所述聚合训练服务器的所述模型训练模块和所述算法执行模块再次执行聚合训练操作。
全文数据:
权利要求:
百度查询: 华控清交信息科技(北京)有限公司 一种大模型训练系统、大模型训练方法及相关服务器
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。