Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京工业大学史宏纬获国家专利权

恭喜北京工业大学史宏纬获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京工业大学申请的专利基于全局指针网络的实体关系联合抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114417839B

龙图腾网通过国家知识产权局官网在2025-03-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210060118.8,技术领域涉及:G06F40/253;该发明授权基于全局指针网络的实体关系联合抽取方法是由史宏纬;王洁设计研发完成,并于2022-01-19向国家知识产权局提交的专利申请。

基于全局指针网络的实体关系联合抽取方法在说明书摘要公布了:本发明公开了基于全局指针网络的实体关系联合抽取方法,通过将实体首尾位置视为一个整体进行判别来解决目标不一致问题。引入了条件层归一化融合头实体信息以指导模型捕捉三元组方向特征;并增添了关系分类任务抽取出句子潜在语义关系以过滤掉部分预测错误的三元组。本发明在公开数据集CMeIE上的实验结果表明本发明构建的模型能有效地识别句子中的关系三元组。设计了全局指针网络,作为解码器对输入语句进行关系和尾实体的抽取。全局指针网络将实体首尾位置视为一个整体进行判别,实现了训练与预测目标的一致性,增强了实体关系抽取模型的性能,提高模型抽取三元组的精确率。

本发明授权基于全局指针网络的实体关系联合抽取方法在权利要求书中公布了:1.基于全局指针网络的实体关系联合抽取方法,其特征在于:该方法包括以下步骤:步骤1:对输入句子进行特征提取;使用NEZHA预训练语言模型对输入语句进行全局特征提取,挖掘深层次语义特征,得到上下文信息丰富的编码向量;步骤2:识别出句子中所有的头实体;将步骤1得到的编码向量使用指针网络分别标注出句子中每个字是否为实体的首尾位置,并采用最近匹配原则,即每个首位置标记向后匹配最近尾位置标记,将首位置标记到尾位置标记所对应子序列识别为头实体;步骤3:引入条件层归一化方法融合编码向量与头实体特征;将层归一化结构中对应的偏置和权重设置为头实体特征的函数,将得到的融合向量作为关系与尾实体抽取的输入;步骤4:抽取每个头实体在特定关系下的尾实体;设计了全局指针网络,根据步骤3输出的融合向量在每一种预定义关系下,将句子划分为若干个连续子序列并对子序列打分,根据分数判别出哪些子序列为正确的尾实体;步骤5:模型可能抽取出包含错误语义关系的三元组,将编码向量中具有全局语义信息的[CLS]向量作为句向量,对其关系分类以识别出句子中潜在语义关系并以此过滤掉抽取结果中部分不合理三元组;基于标注策略的方法对实体关系抽取任务进行建模和求解,如式1所示: 其中,h、r、t分别表示三元组的头实体、关系、尾实体,X表示输入的句子,Ω表示数据集的所有关系构成的集合;步骤4:在每一个预定义关系下根据融合特征抽取出句子中可能存在的尾实体;设计全局指针网络将实体首尾位置视作整体进行判别,而不是将实体首尾位置分开标注,从而使得模型更具有全局观,并实现了模型训练与预测目标的一致性;全局指针网络将长度为n的输入句子视为nn+12个长度不同的连续子序列,表示形式为i,j,其中i表示起始位置,j表示结束位置;对每一个子序列打分,根据分数判别出正确的尾实体;假设数据集中共有m种关系类别,模型将分别在m个关系子空间下对子序列进行判别,将关系和尾实体抽取任务转换为m个“nn+12选k”的多标签分类任务,k表示尾实体的数量;首先,全局指针网络使用了两个线性层对融合编码向量H'做线性变换,得到向量序列和其次,为了增强指针网络对尾实体长度和跨度的敏感性,引入了相对位置编码RoPE,将满足的变换矩阵R应用到qa和ka向量中;最后,用和的内积sαi,j,表示从i到j的子序列作为完整尾实体的分数,所有分数大于阈值的子序列都被视为当前头实体在第α种关系下的尾实体;全局指针网络标注流程如下所示: 其中,表示训练参数矩阵,表示偏置向量;对于抽取出的每一个头实体,重复进行上述关系和尾实体抽取的操作,以抽取出句子中所有可能的三元组;引入CircleLoss,使每一个实体子序列的得分都不小于非实体子序列的得分,最终输出分数最高的k个子序列;添加了一个s0阈值来确定模块最终输出的尾实体数目,使得实体子序列的分数都大于s0,非实体子序列都小于s0,最终输出所有大于阈值s0的子序列;通过最小化此损失函数训练模型参数,具体如下所示: 其中,Pα表示当前头实体在第α种关系下的所有非尾实体子序列,Qα表示当前头实体在第a种关系下的所有尾实体子序列。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。