首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

命名实体关系识别方法、装置、电子设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京工业大学

摘要:本发明提供一种命名实体关系识别方法、装置、电子设备及存储介质。所述方法包括:获取目标文本,将所述目标文本输入至命名实体关系识别模型中,得到命名实体关系识别结果;其中,所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成。本发明通过经过对比学习训练的命名实体关系识别模型进行命名实体关系识别,可以有效去除远程监督产生的噪音,降低所收集的命名实体关系结果的不确定性。

主权项:1.一种命名实体关系识别方法,其特征在于,包括:获取目标文本,将所述目标文本输入至命名实体关系识别模型中,得到命名实体关系识别结果;其中,所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成,所述命名实体关系识别模型基于以下步骤进行训练:步骤1,根据预设知识库的远程监督,构建远程标记命名实体关系数据集;步骤2,将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中,得到用于表征命名实体关系的词向量;所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本,以及利用表征命名实体关系的词向量作为输出样本,进行训练后得到的;步骤3,对所述词向量对应的命名实体的实体类型分别进行标注后,输入至强化学习代理子模型中,得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集;其中,所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本,以及利用假阳性命名实体关系实例作为负样本,基于交差熵代价函数进行训练后得到的;步骤4,将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中,得到命名实体关系增强的词向量;其中,所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性,以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力;所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本,以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本,进行训练后得到的;步骤5,将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器,根据关系分类器的当前性能不断优化强化学习代理模型,直至输出去除噪音的远程标记命名实体关系数据集,所述命名实体关系识别模型训练结束;所述交差熵代价函数jθ为: 其中,yi为强化学习代理选择的标签,保留为1,去除为0,a为动作,si为状态,θ是代价损失参数,i是从1到总元组集个数的区间取值;所述对比学习关系增强子模型训练的损失函数为: 其中,tA和tB为通过线性采样的元组集,和为元组集,和为正样本的关系表示,Z为正样本与负样本的余弦相似度,N为超参数,为从负样本集中采样的元组,为总元组集,tC是非线性采集的元组集;所述关系分类器训练的损失函数jθ为: 其中,Ω为与上次迭代所移除的假阳性命名实体关系实例中不同的部分,a为动作,s为状态,R为强化学习代理子模型的奖励参数。

全文数据:

权利要求:

百度查询: 北京工业大学 命名实体关系识别方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。