买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请公开一种大模型微调数据配比方法及相关装置,涉及人工智能领域,通过使用每个场景的验证数据集对针对每个场景专门训练得到的场景模型进行验证,得到的第一测评结果集作为每个场景的最优测评效果。同时将初始通用场景模型使用每个所述验证数据集进行验证测评,得到每个所述验证数据集的第二测评结果。以第一测评结果集与第二测评结果集之间的距离最小为目标,根据梯度下降算法按照预设学习率对每个所述初始监督微调数据集进行更新。使用更新后的合并数据集进行通用场景模型的更新,再使用每个验证数据集对更新的通用场景模型进行验证更新,不断重复上述过程得到最佳的数据集配比。在提高数据配比优化的效率的同时,提高最佳配比的准确性。
主权项:1.一种大模型微调数据配比方法,其特征在于,包括:S1、将每个应用场景相对应的场景模型,使用所述应用场景相对应的验证数据集进行验证测评,得到所述验证数据集的第一测评结果,每个所述应用场景相对应的场景模型由每个所述应用场景相对应的初始监督微调数据集对通用模型训练得到;S2、将初始通用场景模型使用每个所述验证数据集进行验证测评,得到每个所述验证数据集的第二测评结果,所述初始通用场景模型由使用初始合并数据集对所述通用模型训练得到,所述初始合并数据集由将每个所述初始监督微调数据集合并得到;S3、以第一测评结果集与第二测评结果集之间的距离最小为目标,根据梯度下降算法按照预设学习率对每个所述初始监督微调数据集进行更新,得到更新后的初始合并数据集,所述第一测评结果集包括所有第一测评结果,所述第二测评结果集包括所有第二测评结果;S4、使用所述更新后的初始合并数据集对所述初始通用场景模型进行更新,得到更新后的初始通用场景模型;S5、将所述更新后的初始通用场景模型使用每个所述验证数据集进行验证测评,得到更新后的第二测评结果集,并将所述更新后的第二测评结果集作为所述第二测评结果集;S6、重复执行步骤S3至步骤S5,直至所述距离不大于第一预设值或梯度变化不大于第二预设值。
全文数据:
权利要求:
百度查询: 杭州亚信软件有限公司 一种大模型微调数据配比方法及相关装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。