首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于细粒度提示学习和双向图卷积的关系抽取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京理工大学

摘要:本发明公开了一种基于细粒度提示学习和双向图卷积的关系抽取方法,属于自然语言处理和信息抽取技术领域。本发明首先进行文本预处理,即在非结构化文本中插入实体多粒度标记符和提示学习模板;构建句子序列特征,生成句子序列特征表示;构建句子的依赖特征,生成句子的依赖特征表示;构建句子的混合嵌入表示,输出关系抽取结果。本发明引入了实体类型、实体词语的词法和上位词语义信息,增强了提示学习模板的词法和语义信息以及上下文语义表达能力;捕获了句子隐含的序列特征和依赖特征,挖掘了文本的多维度词法和语义特征,提高了关系抽取性能。

主权项:1.一种基于细粒度提示学习和双向图卷积的关系抽取方法,其特征在于:依托于细粒度提示学习和双向图卷积网络;该模型包括四个模块:第一个模块为文本预处理模块,包括生成多粒度标记符、构建提示学习模板和标签词集合;第二个模块为序列特征生成模块,包括分词、生成句子的嵌入表示、生成句子的序列特征表示;第三个模块为依赖特征生成模块,包括构建句子的依赖树及其邻接矩阵、前向传播和后向传播、对依赖树进行软修剪;第四个模块为关系抽取模块,包括构建句子的混合嵌入表示、线性变换、输出关系抽取结果。所述基于细粒度提示学习和图卷积网络的关系抽取方法,包括以下步骤:步骤1:文本预处理,即在非结构化文本中插入实体多粒度标记符和提示学习模板;步骤1.1:对于非结构化文本,插入实体多粒度标记符;步骤1.2:对于非结构化文本,引入提示学习,弥补预训练和微调之间的差距,构建提示学习模板及其对应的标签词集合;步骤2:构建句子的序列特征,生成句子的序列特征表示;步骤2.1:对句子进行分词;步骤2.2:生成句子的嵌入表示;步骤2.3:生成句子的序列特征表示;步骤3:构建句子的依赖特征,生成句子的依赖特征表示;步骤3.1:对于句子S,构建句子S的依赖树及其相应的邻接矩阵,输入至双向图卷积网络;步骤3.2:将经过步骤3.1生成的邻接矩阵作为输入,采用具有L层的双向图卷积网络,通过在前向传播和反向传播阶段中分别聚合节点和边的邻居节点来传播信息;步骤3.3:基于注意力机制对句子的依赖树进行软修剪;步骤4:构建句子的混合嵌入表示,输出关系抽取结果;步骤4.1:生成句子的混合嵌入表示;对于句子S,将经过步骤2生成的序列特征表示和步骤3生成的依赖特征表示进行拼接,生成句子的混合嵌入表示。步骤4.2:对句子的混合嵌入表示进行线性变换;将步骤4.1生成的句子混合嵌入表示输入至全连接层,对其进行线性变换,将输入的高维向量映射到低维空间中,实现特征组合。步骤4.3:输出关系抽取结果;将步骤4.2生成的向量表示输入至Softmax层,获得两个实体之间的关系预测向量。在训练过程中使用交叉熵损失函数计算预测结果和真实标签之间的误差,通过最小化损失函数Loss来更新关系抽取模型参数。

全文数据:

权利要求:

百度查询: 北京理工大学 一种基于细粒度提示学习和双向图卷积的关系抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。