首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于抽象语义表示和指针网络的事件抽取方法及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:桂林电子科技大学

摘要:本发明公开了一种基于中文抽象语义表示和指针网络的事件抽取方法,首先通过预训练模型BERT获取原始句子的嵌入矩阵;然后利用双向门控循环单元强化嵌入矩阵的语义特征;接着将中文抽象语义表示的信息矩阵与增强后的句嵌入矩阵一起输入图注意网络,以捕获论元之间的交互关系和依存信息;最后使用指针网络同时抽取触发词和论元,以识别重叠的角色和嵌套的论元,并将模型应用于目标数据集以完成事件抽取任务。本发明提供的事件抽取方法能够有效解决中文事件抽取中多个论元的交互关系未充分利用、依存句法信息和语义依存信息未综合考虑、事件角色重叠和论元嵌套以及数据样本较少情况下事件抽取效果较差等问题,具有较高的准确度和较好的泛化性。

主权项:1.一种基于抽象语义表示和指针网络的事件抽取方法,其特征在于,所述方法包括:BERT词嵌入模块:将待抽取的原始文本S接入BERT预训练模型,完成原始文本S的向量初始化,并提取BERT的中间输出层,以得到原始文本S的嵌入表示x;BiGRU句编码模块:对嵌入表示x输入双向门控循环单元,分别获取x对应的前后向量,最终得到句编码向量Ψ;CAMR信息融合模块:将原始文本S输入中文抽象语义表示解析器以获取对应的中文抽象语义表示,CAMR为图结构数据,且对于一个原始文本包含多个句子的情况,需要将多个CAMR以图拼接方式合并,并进行重构,合并和重构后的CAMR用符号C表示,将中文抽象语义表示C同句编码向量Ψ一起输入到图注意网络GAT中,通过GAT的图注意力层进行特征向量融合,得到特征融合矩阵;指针网络解码模块:在解码层阶段,针对原始数据集中事件文本所对应的每一条标注转化为一个端到端的标签L,视触发词为一个特殊的论元并与其它论元一起从事件文本中进行抽取;设计两种指针分别识别触发词和论元的在事件文本中下标的首位置和尾位置,并以二分类网络模型对论元角色进行分类;输入序列文本中的每个词代表某一个论元下标的首尾位置,而任意两个词下标组成的首尾位置都可代表任意的论元角色。

全文数据:

权利要求:

百度查询: 桂林电子科技大学 基于抽象语义表示和指针网络的事件抽取方法及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。