恭喜西北工业大学梁韵基获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜西北工业大学申请的专利一种面向复杂因果关系抽取模型的收敛加速方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116450838B 。
龙图腾网通过国家知识产权局官网在2025-03-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310239515.6,技术领域涉及:G06F16/36;该发明授权一种面向复杂因果关系抽取模型的收敛加速方法是由梁韵基;刘磊;王梓哲;纪亚鹏;张鹏设计研发完成,并于2023-03-13向国家知识产权局提交的专利申请。
本一种面向复杂因果关系抽取模型的收敛加速方法在说明书摘要公布了:本发明公开了一种面向复杂因果关系抽取模型的收敛加速方法,首先构造正负样本进行数据增强,其次通过对比表示学习框架抽取文本中的因果关系;最终通过引入多样性自步学习来提升对比表示学习抽取复杂因果关系的收敛速度。本发明使基于对比表示学习的复杂因果关系抽取模型收敛速度大幅度提升,通过在多个数据集上进行测试,抽取准确率高达90%。
本发明授权一种面向复杂因果关系抽取模型的收敛加速方法在权利要求书中公布了:1.一种面向复杂因果关系抽取模型的收敛加速方法,其特征在于,包括以下步骤:步骤1:数据增强模板集合构建;给定因果关系数据集从其中挑选部分具有显式因果关系的样例,抽取其中的原因论元xc、结果论元xe以及显式连接词ω,构建用于数据增强的因果关系三元组其中m表示D中三元组的数量;步骤2:采用数据增强方法实现对比表示学习的正负样本构造;给定一条输入文本χ={...,eixcei,...,ejxeej,...},获取输入文本序列中的因果论元R={xc,xe},并对原因论元xc和结果论元xe的向量表示xc和xe进行向量拼接,表示为XR=Concatxc,xe;对D中的每一对原因论元xci和结果论元xei进行向量表示,分别为xci和xei,并对其进行向量拼接表示为Xi=Concatxci,xei,然后计算XR和Xi的余弦相似度来衡量语义相似性,最后选取和XR余弦相似度最大的Xi对应的连接词作为最合适的连接词ωp;正样本表示为改变论元的方向性构建负样本步骤3:复杂因果关系的抽取;分别将原始输入和正样本或原始输入和负样本输入到对比表示学习框架的两个深度编码器中进行关系抽取;两个深度编码器采用BiLSTM和Transformer的两层结构,采用对比损失和最大似然损失来构建目标函数 其中表示两个深度编码器的输入向量和向量之间的欧氏距离,t0是定义的半径阈值,如果模型输出两个向量之间的语义相似度大于0.5,Y=1;否则Y=0;α表示两个损失函数之间的权重;yi和分别表示样本的真实标签和预测标签,n表示样本数目;步骤4:多样性自步学习收敛加速;引入多样性自步学习对目标函数进行改进,通过最小化多样性自步损失函数联合训练复杂因果关系抽取模型的参数w以及潜在的权重向量v=[v1,...,vn]: 其中,λ和γ表示控制样本难易程度的参数,表示多样性项,b表示训练期间的类数目;采用迭代双凸优化策略求解当v固定时,作为一个标准的监督学习目标函数,以最小的损失学习参数w;对于给定的w,通过计算全局最优其中是一个门单元。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。