Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜上海序禄信息科技有限公司屠义新获国家专利权

恭喜上海序禄信息科技有限公司屠义新获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜上海序禄信息科技有限公司申请的专利问答大模型的后训练方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119808964B

龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510287593.2,技术领域涉及:G06N5/04;该发明授权问答大模型的后训练方法、装置、电子设备及存储介质是由屠义新;马路通;王明超;王欢;刘兵;刘涛设计研发完成,并于2025-03-12向国家知识产权局提交的专利申请。

问答大模型的后训练方法、装置、电子设备及存储介质在说明书摘要公布了:本发明提供了一种问答大模型的后训练方法、装置、电子设备及存储介质,涉及人工智能领域。首先获取若干推理数据,再基于全部推理数据,构造推理数据集;最后利用推理数据集对问答大模型进行后训练处理;由于每份推理数据是对原问题及其原答案进行逻辑拆分得到的,故推理数据集可以用于引导问答大模型学习对输入问题进行分步推理。本发明能够使得问答大模型能够学会对问题进行分步推理,从而在根本上提升了模型的逻辑推理能力。

本发明授权问答大模型的后训练方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种问答大模型的后训练方法,其特征在于,包括:获取若干推理数据;针对每份所述推理数据,基于所述推理数据,利用递进推理式构造规则获得至少一个第一样本,第一子集包括每份所述推理数据对应的全部第一样本;针对每份所述推理数据,基于所述推理数据,利用递进拆解式构造规则获得至少一个第二样本,第二子集包括每份所述推理数据对应的全部第二样本;针对每份所述推理数据,基于所述推理数据,利用中间截取式构造规则获得至少一个第三样本,第三子集包括每份所述推理数据对应的全部第三样本;针对每份所述推理数据,基于所述推理数据,利用分步推理式构造规则获得至少一个第四样本,第四子集包括每份所述推理数据对应的全部第四样本;利用推理数据集对所述问答大模型进行后训练处理,所述推理数据集用于引导所述问答大模型学习对输入问题进行分步推理,所述推理数据集包括所述第一子集、所述第二子集、所述第三子集和所述第四子集,所述第一子集用于引导所述问答大模型学习对所述输入问题进行分步解答,所述第二子集用于引导所述问答大模型学习对所述输入问题进行逻辑拆解,所述第三子集用于引导所述问答大模型学习基于分步推理的方式补全缺失的中间过程,所述第四子集用于引导所述问答大模型学习对所述输入问题进行逻辑拆解后进行分步解答;其中,所述推理数据包括原问题、基于所述原问题拆分得到的逻辑层次递进的N个子问题以及每个子问题的子答案,所述基于所述推理数据,利用中间截取式构造规则获得至少一个第三样本的步骤,包括:将第三引导文本、所述推理数据中除了第一个子问题和第一个子答案以外的每个其他子问题和其他子答案进行拼接得到第一个第三样本,并设置第一个第三样本的标签为所述推理数据中的第一个子问题和第一个子答案,所述第三引导文本用于指示所述问答大模型基于输入内容推理出所述输入内容中缺失的中间子问题及其中间子答案;将所述第三引导文本、所述推理数据中除了第m个子问题和第m个子答案以外的每个其他子问题和其他子答案进行拼接得到第m个第三样本,并设置第m个第三样本的标签为所述推理数据中的第m个子问题和第m个子答案,。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海序禄信息科技有限公司,其通讯地址为:200335 上海市浦东新区中国(上海)自由贸易试验区浦东大道2123号三层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。