恭喜河海大学戚荣志获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜河海大学申请的专利基于门控机制和图注意力网络的中文实体关系抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114722820B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210281501.6,技术领域涉及:G06F40/295;该发明授权基于门控机制和图注意力网络的中文实体关系抽取方法是由戚荣志;赵小涵;李水艳;毛莺池;黄倩;高逸飞;陈子琦设计研发完成,并于2022-03-21向国家知识产权局提交的专利申请。
本基于门控机制和图注意力网络的中文实体关系抽取方法在说明书摘要公布了:本发明公开了一种基于门控机制和图注意力网络的中文实体关系抽取方法,首先,使用中文BERT预训练模型将文本转换为机器可以识别的向量形式;其次,将实体嵌入拼接到每个词嵌入后面,采用一种全局信息门控机制,计算门控向量,实现词嵌入的实体语义强化;然后,对文本进行依存句法分析,获得依存句法树,构造出邻接矩阵、依赖类型矩阵和依赖方向矩阵,使用掩码自注意力求得注意力权重矩阵,进而在图注意力网络中对文本进行特征提取;最后,从图注意力网络的输出中,获取两个实体和句子的表征向量,经过多层感知机将该向量转换到分类空间,输入至分类器中完成关系分类。
本发明授权基于门控机制和图注意力网络的中文实体关系抽取方法在权利要求书中公布了:1.一种基于门控机制和图注意力网络的中文实体关系抽取方法,其特征在于,包含以下步骤:步骤1使用中文BERT预训练模型将文本转换为机器可以识别的向量形式;步骤2将实体嵌入拼接到每个词嵌入后面,采用一种全局信息门控机制,计算门控向量,实现词嵌入的实体语义强化;步骤3对文本进行依存句法分析,获得依存句法树,构造出邻接矩阵、依赖类型矩阵和依赖方向矩阵,使用掩码自注意力求得注意力权重矩阵,进而在图注意力网络中对文本句子进行特征提取;步骤4从图注意力网络的输出中,获取两个实体和句子的表征向量,经过多层感知机将该表征向量转换到分类空间,输入至分类器中完成关系分类;所述步骤2中词嵌入的实体语义强化指的是对于BERT模型转换得到的词嵌入进行实体语义增强,具体包含以下步骤:2-1将头实体和尾实体的嵌入表示拼接,然后使用一个前馈网络将两个实体的语义信息进行融合,其过程公式化为:ve=tanhWe[vh,vt]+be其中,vh和vt分别对应头尾实体的词嵌入,是可学习的参数矩阵,用于拼接实体嵌入的线性转换,是一个偏置项,tanh为双曲正切函数,ve是融合了头尾实体信息的实体嵌入;2-2将该融合后的实体嵌入与句子中每个词语的词向量进行拼接,初步得到实体嵌入增强的候选词向量;同时,将这些候选词向量加和求平均,获得融合全局信息和实体嵌入的监督向量s,以上过程可以表示为: 其中,表示第i个词语的候选词向量,n为句子s中词语的数量;2-3以监督向量与候选词向量为输入,输出每个候选词向量所对应的门控向量: 其中,是一个需要训练的参数矩阵,dg=dw+de是偏置项,运算符⊙表示将两端向量按元素相乘,sigmoid函数输出范围为0,1;2-4计算第i个词语在经过实体嵌入增强后的词嵌入表示将该词语的候选词向量与对应的门控向量按元素相乘,其计算过程如下式: 所述步骤3中根据句子的依存句法树构造出邻接矩阵、依赖类型矩阵和依赖方向矩阵,采用掩码自注意力机制计算注意力转移权重,进而在图注意力网络中对文本进行特征提取,具体步骤,包括:3-1根据句子的依存句法树构造邻接矩阵A,设依存句法树上有n个结点,那么可以使用一个n×n的邻接矩阵A来表示该依存句法树;当结点i和结点j之间存在依赖边时,A中元素ai,j和aj,i为1,否则为0,此时A是一个无向图;特别地,依存树转换的邻接矩阵中,每个结点都有一个自旋边,即ai,i=1;根据依存句法树的提供的依赖类型和依赖方向信息,构造依赖类型矩阵T和依赖方向矩阵D的构造方式;依赖类型矩阵T大小为n×n,若结点i和结点j的依赖类型为nsubj,则T中元素ti,j的值为type_to_id_mappingnsubj,type_to_id_mapping表示依赖类型到数值的映射;依赖方向矩阵D大小同样为n×n,若存在依赖边i→j,则元素di,j=1表示该依赖边是正向的,反之dj,i=-1表示依赖边是反向的;3-2图注意力网络采用了一种掩码自注意力机制,在每一层计算一个全新的信息传递的注意力权重矩阵,该权重矩阵不仅完全保留了原始依存句法树的结构信息,而且赋予了依赖边不同的权重;实体嵌入增强后的词向量序列为同时是图注意力网络的初始输入符号表示第i个词语在l层的隐层向量;在一个L层的图注意力网络中,第l层会使用掩码自注意力计算得到一个n×n邻接矩阵Pl,表示结点i和结点j之间依赖边的权重,其计算过程如下式: 其中,ai,j表示原始的邻接矩阵中的权重,它只有0,1两种取值,当ai,j=0时,对应自注意力计算得到的当ai,j=1时,表示依赖类型ti,j所对应依赖类型的嵌入向量,fun·是一个注意力函数,用于计算两个节点间依赖边的重要程度值,即ei,j,该注意力函数的具体细节如下式所示: 其中,LeakyRelu是激活函数,[·]表示向量的拼接操作,fdi,j表示一个与依赖边方向相关的函数,若依赖边i→j是正向的则使用正向的参数矩阵,否则使用反向的参数矩阵,细节下所示: 其中,分别对应正向和反向可学习的权重矩阵;3-3结合本层的注意力权重矩阵和网络输入,计算图注意力网络中每个结点的隐层向量,其过程如下式表示: 其中,Wl表示第l层图注意力网络的可学习权重矩阵,bl是偏置项。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河海大学,其通讯地址为:211100 江苏省南京市江宁开发区佛城西路8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。