首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多粒度对比学习的远程监督关系抽取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:新疆大学

摘要:本发明提供了一种基于多粒度对比学习的远程监督关系抽取方法,涉及信息抽取技术领域,方法包括:获取数据样本中的句子;将句子分割为单词序列;向单词序列的头部和尾部分别进行标记,得到标记后的句子;利用双向编码器得到初始句子特征;利用正例对编码器得到初始正样本特征;根据图编码器得到关系和实体对的约束特征并将约束特征融合到对应的初始句子特征和初始正样本特征中,得到增强句子特征和增强正样本特征;将增强句子特征融合为包级特征;将包级特征和增强正样本特征输入对比学习关系分类器,对数据样本的关系进行抽取,得到分类关系。本发明解决了忽略不同层级特征之间的交互导致关系抽取的准确性和效率低及长尾关系抽取能力弱的问题。

主权项:1.一种基于多粒度对比学习的远程监督关系抽取方法,其特征在于,应用于远程监督关系抽取模型,所述远程监督关系抽取模型包括:正例对编码器、图编码器和包编码器,所述正例对编码器用于获取初始正样本特征,所述图编码器用于提取约束图中关系和实体对的约束特征并将所述所述约束特征融合到对应的初始句子特征和初始正样本特征中,得到增强句子特征和增强正样本特征,所述包编码器用于将所述增强句子特征融合为包级特征,方法包括:获取数据样本中的句子;将所述句子分割为单词序列;向所述单词序列的头部和尾部分别进行标记,得到标记后的句子;利用双向编码器对标记后的句子进行编码并对所述单词序列的头尾进行串联得到初始句子特征;根据所述句子,利用所述正例对编码器得到初始正样本特征;根据所述图编码器得到关系和实体对的约束特征并将所述约束特征融合到对应的初始句子特征和初始正样本特征中,得到增强句子特征和增强正样本特征;利用所述包编码器将所述增强句子特征融合为包级特征;将所述包级特征和所述增强正样本特征输入对比学习关系分类器,对所述数据样本的关系进行抽取,得到分类关系。

全文数据:

权利要求:

百度查询: 新疆大学 一种基于多粒度对比学习的远程监督关系抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。