首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于机器阅读理解的实体关系联合抽取方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国网上海市电力公司;中国科学院计算技术研究所

摘要:本发明涉及一种基于机器阅读理解的实体关系联合抽取方法及系统,方法首先针对实体类型和关系类型分别设计实体抽取问题模板和关系抽取问题模板,并基于机器阅读理解进行非限定实体抽取;接着根据抽取的实体分别筛选正向抽取候选关系集合和逆向抽取候选关系集合,基于上述候选关系集合自动生成关系抽取问题模板,并基于机器阅读理解进行限定式双向关系抽取;对于推理过程,将正向和逆向抽取的实体关系三元组取交集和差集,交集直接作为最终结果,差集中概率大于阈值的三元组也并入到结果中。与现有技术相比,本发明可以有效地解决实体关系语义建模不全面,以及重叠三元组问题,最终为构建知识图谱提供高质量的实体关系三元组。

主权项:1.一种基于机器阅读理解的实体关系联合抽取方法,其特征在于,包括以下步骤:步骤1:根据预先设定好的实体类型和关系类型分别设置实体抽取问题模板和基于已抽取实体的关系抽取问题模板,所述关系抽取问题模板包括关系尾实体抽取问题模板和关系头实体抽取问题模板;步骤2:获取待预测句子,将所述实体抽取问题模板与该待预测句子拼接,然后通过第一机器阅读理解模型进行非限定实体抽取,输出所述待预测句子中的实体片段;步骤3:根据步骤2中获取的实体片段作为头实体从所述关系尾实体抽取问题模板中筛选并填充实体片段得到正向抽取候选关系集合,将实体片段作为尾实体从所述关系头实体抽取问题模板中筛选并填充实体片段得到逆向抽取候选关系集合,然后基于正向抽取候选关系集合和逆向抽取候选关系集合生成关系抽取问题模板;步骤4:基于第二机器阅读理解模型将步骤3获取的关系抽取问题模板与待预测句子拼接,抽取尾实体或头实体,得到正向抽取和逆向抽取的实体关系三元组;取正向抽取和逆向抽取的实体关系三元组交集,以及差集中概率大于既定阈值的三元组作为最终实体关系三元组;抽取尾实体为正向抽取,抽取头实体为逆向抽取;所述第一机器阅读理解模型和第二机器阅读理解模型的训练过程为:循环执行步骤2-步骤4,对第一机器阅读理解模型和第二机器阅读理解模型进行联合训练。

全文数据:

权利要求:

百度查询: 国网上海市电力公司 中国科学院计算技术研究所 基于机器阅读理解的实体关系联合抽取方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。