首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种军事大模型的微调训练方法、装置以及设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:厦门渊亭信息科技有限公司

摘要:本发明公开了一种军事大模型的微调训练方法、装置以及设备,其包括:基于预设的军事知识图谱中获取原始军事知识数据并根据预设问答模板进行构建,得到问答对训练数据;将所述问答对训练数据输入基于Qwen作为预训练模型并利用改进的LoRA参数初始化方式进行微调训练,得到军事大模型,其中,所述改进的LoRA参数初始化方式包括采用投影降维的方式将所述预训练模型的参数进行降维蒸馏后赋值给LoRA的参数。能够提高军事大模型在回答相关问题时的准确性和可靠性,能够有效减少模型生成“幻觉回答”的可能性,保证了军事信息的真实性和权威性。

主权项:1.一种军事大模型的微调训练方法,其特征在于,所述方法包括:基于预设的军事知识图谱中获取原始军事知识数据并根据预设问答模板进行构建,得到问答对训练数据;将所述问答对训练数据输入基于Qwen作为预训练模型并利用改进的LoRA参数初始化方式进行微调训练,得到军事大模型,其中,所述改进的LoRA参数初始化方式包括采用投影降维的方式将所述预训练模型的参数进行降维蒸馏后赋值给LoRA的参数;所述LoRA的参数包括第一参数和第二参数;所述采用投影降维的方式将所述预训练模型的参数进行降维蒸馏后赋值给LoRA的参数,包括:对所述预训练模型的参数进行去中心化操作,得到初始矩阵;通过计算所述初始矩阵的协方差矩阵,对所述协方差矩阵进行特征值的分解,得到特征值与特征向量,对所述特征值进行降序排列,并取前r个最大的所述特征值对应的所述特征向量作为行向量组成特征向量矩阵;根据所述特征向量矩阵对所述第一参数以及所述第二参数进行初始化,得到第一矩阵以及第二矩阵;其中,所述对所述预训练模型的参数进行去中心化操作,得到初始矩阵,包括:利用对所述预训练模型的参数进行去中心化操作,得到初始矩阵;其中,表示所述预训练模型的参数,表示所述初始矩阵,表示第i列的一维向量,表示第i列的平均值,n表示所述预训练模型的参数的列数,共有n个列向量。

全文数据:

权利要求:

百度查询: 厦门渊亭信息科技有限公司 一种军事大模型的微调训练方法、装置以及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。