买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:江西师范大学
摘要:本发明公开了一种基于知识迁移的电力领域文本理解模型的训练方法,属于电力知识文本理解技术领域,所述一种基于知识迁移的电力领域文本理解模型的训练方法包括获取电力领域相关文本数据,构建数据集D1和数据集D2,得到经D1微调的第一模型和经D2微调的第二模型,使用经D2微调的第二模型初始化知识迁移模型KTM,将数据集D1中的训练样本分别输入到知识迁移模型KTM和经D1微调的第一模型中进行训练,输出样本的预测值、软标签和真实标签,根据样本的预测值、软标签和样本的真实标签,计算损失值,然后让梯度反向传播回知识迁移模型KTM,规避大模型固有的参数多、内存占用大、训练时间长、预测速度慢等问题,实现资源消耗和性能的双赢。
主权项:1.一种基于知识迁移的电力领域文本理解模型的训练方法,其特征在于,包括以下步骤:步骤S1、获取电力领域相关文本数据,构建数据集D1和数据集D2,根据数据集D1对第一模型进行微调,得到经D1微调的第一模型,根据数据集D2对第二模型进行微调,得到经D2微调的第二模型;步骤S2、使用经D2微调的第二模型初始化知识迁移模型KTM;步骤S3、将数据集D1中的训练样本分别输入到知识迁移模型KTM和经D1微调的第一模型中进行训练,输出样本的预测值、软标签和真实标签;步骤S4、根据样本的预测值、软标签和样本的真实标签,计算损失值,然后让梯度反向传播回知识迁移模型KTM。
全文数据:
权利要求:
百度查询: 江西师范大学 一种基于知识迁移的电力领域文本理解模型的训练方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。