Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜浙江大学伍赛获国家专利权

恭喜浙江大学伍赛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜浙江大学申请的专利一种面向低数据的动态增强多跳文本阅读识别处理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113988079B

龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111144082.3,技术领域涉及:G06F40/30;该发明授权一种面向低数据的动态增强多跳文本阅读识别处理方法是由伍赛;任雪峰;陈刚;陈珂;寿黎但设计研发完成,并于2021-09-28向国家知识产权局提交的专利申请。

一种面向低数据的动态增强多跳文本阅读识别处理方法在说明书摘要公布了:本发明公开了一种面向低数据的动态增强多跳文本阅读识别处理方法。对文档的数据集进行修正预处理;构建动态增强的答案预测模型;使用训练集训练动态增强的答案预测模型作为教师模型;随机挑选一部分无标签的数据集输入到教师模型中预测获得标签结果建立伪标签,将带有伪标签的数据集加到训练集形成新训练集;用新训练集再训练教师模型获得学生模型;不断重复步骤迭代,直到验证集的模型精度结果满足预设阈值要求;用最终的学生模型对待测阅读文档进行预测,输出预测获得待测阅读文档的答案。本发明使用动态增强的方法来扩充数据,能够减少输入长度,解决标签数据少情况下的多跳阅读理解问题,增强模型的泛化能力。

本发明授权一种面向低数据的动态增强多跳文本阅读识别处理方法在权利要求书中公布了:1.一种面向低数据的动态增强多跳文本阅读识别处理方法,其特征在于,包括以下步骤:步骤1:对文档的数据集进行修正预处理;步骤2:构建动态增强的答案预测模型;2.1、从数据集的文档中进行分句获得各个句子,从各个句子中提取局部或者全部再结合文档对应的问题拼接组成上下文文本;2.2、将上下文文本输入到预训练好的答案预测模型中,获取上下文文本的整体特征向量CLS_ALL以及上下文文本中问题和每个句子的每个字的解码特征向量,由问题的每个字的解码特征向量组成问题向量Q,由所有句子的每个字的解码特征向量组成上下文向量C;2.3、A、将整体特征向量CLS_ALL经过线性层处理后获得预测的答案类别type,表示为以下公式处理:type=softmaxLinearCLS_ALLτ∈R1×4其中,softmax表示softmax激活函数,τ表示超参数;B、根据问题向量Q和上下文向量C按照以下方式处理获得上下文特征向量C′,进而根据上下文特征向量C′通过多层感知机提取出两个结果分别作为预测的答案开始位置start和答案结束位置end:Q′=Attention_poolingQ∈R1×dC′=Normw1·CLS_ALL+w2·Q′+w3·C∈Rl×d 式中,w1、w2、w3分别表示第一、第二、第三权重,d表示隐向量的维度,l表示句子的长度,Q′表示降维问题向量,Norm表示归一化函数,MLP表示多层感知机,R1×4表示答案的四种类型分别对应的四个维度,d表示隐层的维度,l表示上下文的长度;表示上下文中各个位置是否为答案起止位置的概率,分别对应答案开始位置start和答案结束位置end;C、根据整体特征向量CLS_ALL、问题向量Q和上下文向量C共同按照以下方式处理获得预测输出的支撑句:SFeature=W·AttentionPoolingC,CLS_ALL,Q 式中,W表示权重矩阵;sigmoid表示sigmoid激活函数,AttentionPooling表示注意力池化操作,表示预测输出的支撑句;步骤3:以经过步骤1处理过的具有已知标签的数据集作为训练集,使用训练集训练动态增强的答案预测模型,以训练后的答案预测模型作为教师模型;步骤4:随机挑选一部分无标签的数据集输入到步骤3得到的教师模型中预测获得标签结果,以预测获得的标签作为伪标签,附加到无标签的数据集上形成带有伪标签的数据集,进而将带有伪标签的数据集加入到训练集中,形成新训练集;步骤5:使用步骤4得到的新训练集再训练步骤3得到的教师模型,训练后的教师模型作为学生模型;步骤6:采用另外具有已知标签的数据集作为验证集,验证集输入到步骤5获得的学生模型中测试获得模型精度结果,若模型精度结果满足预设阈值要求,则进行下一步骤;若模型精度结果不满足预设阈值要求,则回到步骤3以学生模型作为教师模型进行迭代处理,不断重复步骤3-步骤5进行迭代,直到通过验证集获得的模型精度结果满足预设阈值要求;步骤7:使用步骤6最终获得的学生模型对待测阅读文档进行预测,输出预测获得待测阅读文档的标签及其中的答案。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。