大语言模型的训练方法、装置、设备和介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京百度网讯科技有限公司

摘要：本公开提供了一种大语言模型的训练方法、装置、设备和介质，涉及人工智能技术领域，尤其涉及自然语言处理和深度学习等技术领域。该方法包括：获取大规模无监督文本数据；从大规模问答数据中提取多个问题答案对；基于多个问题答案对，构建弱监督指令数据，包括：针对多个问题答案对中的每一个问题答案对，将该问题答案对中的问题作为样本指令，并将该问题答案对中的答案作为与样本指令对应的真值回复数据，构建与该问题答案对对应的指令训练样本；以及基于与多个问题答案对各自对应的指令训练样本，构建弱监督指令数据；以及利用包括大规模无监督文本数据和弱监督指令数据的混合训练数据，对大语言模型进行预训练。

主权项：1.一种大语言模型的训练方法，包括：获取大规模无监督文本数据；从大规模问答数据中提取多个问题答案对，所述多个问题答案对中的每一个问题答案对包括对应的问题文本和答案文本；基于所述多个问题答案对，构建弱监督指令数据，包括：针对所述多个问题答案对中的每一个问题答案对，将该问题答案对中的问题文本作为样本指令，并将该问题答案对中的答案文本作为与所述样本指令对应的真值回复数据，构建与该问题答案对对应的指令训练样本；以及基于与所述多个问题答案对各自对应的指令训练样本，构建所述弱监督指令数据；以及利用包括所述大规模无监督文本数据和所述弱监督指令数据的混合训练数据，对大语言模型进行预训练，包括：基于递增的学习率，利用所述混合训练数据对所述大语言模型进行预设训练步数的预训练，以得到中间大语言模型，其中，所述预设训练步数的预训练中的每一步所使用的混合训练数据中的弱监督指令数据的比例是基于当前训练步数和所述预设训练步数而确定的；以及基于递减的学习率，利用所述混合训练数据对所述中间大语言模型进行预训练，其中，在学习率递减的训练阶段，每一步所使用的混合训练数据中的弱监督指令数据的比例维持不变。

全文数据：

权利要求：

百度查询：北京百度网讯科技有限公司大语言模型的训练方法、装置、设备和介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于饲料的甘油酯型鱼油的制备方法

下一篇：用于密钥管理的方法、装置、设备和存储介质

相关技术

一种用于饲料的甘油酯型鱼油的制备方法

用于密钥管理的方法、装置、设备和存储介质

一种防爆型两位三通空气电磁阀

一种熔断器及熔断器生产方法

一种有限空间内微小水雾聚集排出装置

一种基于坐标变换的海面目标双站被动定位方法

一种用于前列腺癌治疗的lncRNA ENST00000510619及其应用

一种高效不锈钢拉丝设备及拉丝工艺

一种压力可变的肋骨压紧胸带

一种可防止意外反锁房门的锁体结构及方法

一种数控机床远程监测系统

一种网球训练测试装置和测试方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

大语言模型的训练方法、装置、设备和介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务