恭喜北京明略软件系统有限公司王博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京明略软件系统有限公司申请的专利基于片段抽取的阅读理解方法、系统、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113918681B 。
龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111201099.8,技术领域涉及:G06F16/334;该发明授权基于片段抽取的阅读理解方法、系统、电子设备和存储介质是由王博;薛小娜设计研发完成,并于2021-10-15向国家知识产权局提交的专利申请。
本基于片段抽取的阅读理解方法、系统、电子设备和存储介质在说明书摘要公布了:本申请涉及一种基于片段抽取的阅读理解方法、系统、电子设备和存储介质,其中,该方法包括:预测模型训练步骤,利用训练数据对预训练模型进行训练,并获得第一预测模型;预测模型微调步骤,利用微调训练数据对第一预测模型和线性层进行微调,更新参数并获得第二预测模型;答案获取步骤,将待预测问题和上下文文本拼接得到预测输入文本,并将其输入至第二预测模型,获得待预测问题对应的答案的开始位置概率、结束位置概率以及片段位置概率,获得至少一个答案片段文本。通过对预测模型微调步骤和答案获取步骤进行改进,增加片段位置概率,可以获得至少一个答案片段文本,可以同时使用单一答案和多答案的场景,增加了本方法的适用性。
本发明授权基于片段抽取的阅读理解方法、系统、电子设备和存储介质在权利要求书中公布了:1.一种基于片段抽取的阅读理解方法,其特征在于,包括:预测模型训练步骤,利用训练数据对预训练模型进行训练,并获得第一预测模型;预测模型微调步骤,利用微调训练数据对所述第一预测模型和线性层进行微调,更新参数并获得第二预测模型;答案获取步骤,将待预测问题文本和上下文文本拼接得到预测输入文本,并将其输入至所述第二预测模型,获得所述待预测问题文本对应的答案的开始位置概率、结束位置概率以及片段位置概率,获得至少一个答案片段文本;其中,所述微调训练数据包括问题文本和上下文文本,所述微调训练数据上预先标注有开始位置标签、结束位置标签和片段位置标签,所述预测模型微调步骤进一步包括:输入文本获取步骤,将所述问题文本和所述上下文文本拼接,获得训练输入文本;字粒度语义表示向量获取步骤,将所述训练输入文本输入至所述第一预测模型,所述第一预测模型的编码层对所述训练输入文本进行编码,并输出所述训练输入文本的字粒度语义表示向量,所述字粒度语义表示向量的维度为[L,H],其中,所述L对应于所述训练输入文本的长度,所述H对应于所述第一预测模型的隐层尺寸;起始位置概率获取步骤,将所述字粒度语义表示向量分别输入至开始线性层和结束线性层,得到开始位置概率和结束位置概率;片段位置概率获取步骤,对所述字粒度语义表示向量进行维度拓展,获得第一拓展向量和第二拓展向量,并将其输入至片段线性层,输出片段位置概率;模型损失获取步骤,根据预先标注的所述开始位置标签、所述结束位置标签、所述片段位置标签和开始位置概率、结束位置概率、片段位置概率,利用交叉熵损失函数分别计算开始位置损失、结束位置损失和片段位置损失,并据此计算总损失;模型微调训练步骤,使用标注后的所述训练输入文本对所述第一预测模型进行训练,调整所述编码层、所述开始线性层、所述结束线性层和所述片段线性层的参数至所述总损失满足预设条件,并获取第二预测模型;其中,所述获得至少一个答案片段文本包括:根据获取的所述开始位置概率和所述结束位置概率得到多个片段文本,并根据所述片段位置概率利用公式进行筛选,获取至少一个所述答案片段文本,所述公式具体为: 其中,、、分别为开始位置概率、结束位置概率和片段位置概率,i为候选开始位置,j为候选结束位置,q为所述问题文本长度,c为所述上下文文本长度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京明略软件系统有限公司,其通讯地址为:100089 北京市海淀区中关村东路1号院1号楼10层A1002;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。