恭喜信华信技术股份有限公司孙伟宏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜信华信技术股份有限公司申请的专利一种面向软件工程的生成式大模型训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118966385B 。
龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411448896.X,技术领域涉及:G06N20/00;该发明授权一种面向软件工程的生成式大模型训练方法是由孙伟宏;白亮;吕鹏设计研发完成,并于2024-10-17向国家知识产权局提交的专利申请。
本一种面向软件工程的生成式大模型训练方法在说明书摘要公布了:本发明公开了一种面向软件工程的生成式大模型训练方法,包括具体步骤如下:步骤A:Agent服务端每分钟访问一次训练服务端的待执行任务队列,Agent服务将携带的训练服务器IP与队列中队头的任务训练服务器匹配,如果IP相同,则获取训练任务信息;如果不相同,则继续与队列中下一个训练任务的IP匹配,直到找到具有相同服务器IP的任务;步骤B:获取到待执行的训练任务后,需要判断该任务是否是多轮训练任务,如果是:则执行步骤G;如果不是执行步骤C;本发明涉及软件工程技术领域,本发明的有益效果是,生成式大模型训练方法,其特征在于Agent服务实时监测训练服务端的待执行任务,如监测到有待执行任务,则按照步骤训练任务。
本发明授权一种面向软件工程的生成式大模型训练方法在权利要求书中公布了:1.一种面向软件工程的生成式大模型训练方法,其特征在于,具体步骤如下:步骤A:Agent服务端每分钟访问一次训练服务端,检查待执行任务队列,每个待执行任务由训练服务端创建时指定相应的训练服务器IP,Agent服务端携带训练服务器的IP地址,首先与队列中创建时间最早的任务的训练服务器IP进行匹配,如果IP地址相同,Agent服务端将获取该任务的训练信息;如果不匹配,Agent服务端将继续匹配队列中的下一个任务,直到找到与训练服务器IP地址一致的任务为止;步骤B:获取到待执行的训练任务后,需要判断该任务是否是多轮训练任务,如果是:则执行步骤G;如果不是执行步骤C;步骤C:训练任务被分配到相应的服务器实例中执行,这些服务器实例是已配置并添加到大模型工具链中的云主机或边缘算力服务器,服务器实例根据训练任务信息部署所需的训练环境,部署完成后,这些实例将用于支撑模型训练的运行;步骤D:在训练任务的服务器中加载基础模型;步骤E:下载需要训练的数据集到服务器实例中;步骤F:将训练脚本下载到服务器实例中,该脚本用于配置模型训练所需的参数,并根据训练任务的具体脚本参数进行相应的设置;步骤G:运行脚本开始训练,脚本自动调整模型训练的默认参数,包括开发语言、训练精度、最大上下文长度、训练轮数以及微调模型的层数,随后,脚本启动训练过程,按照设定的训练轮数执行任务,模型将从训练数据集中学习规律和模式,并生成输出的参数文件;步骤H:训练任务过程中,不断写入训练任务日志,服务端实时查看日志的执行数据,监测训练任务是否执行完成,如果未完成,继续检测日志;如果执行完成并成功,则保存训练结果并且返回结果给训练服务端;如果执行完成并失败,返回结果给训练服务端;步骤I:训练完成后,需要将生成的模型参数文件上传至对象存储的指定位置进行保存,每执行一轮训练生成一个参数文件,上传的文件数量与训练轮数相对应;步骤J:上传模型完毕,清除训练任务遗留的历史数据;步骤K:释放服务器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人信华信技术股份有限公司,其通讯地址为:116000 辽宁省大连市高新技术产业园区黄浦路977号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。