首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

实体链接处理方法、设备、存储介质及程序产品 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州恒生聚源信息技术有限公司;上海恒生聚源数据服务有限公司

摘要:本申请提供一种实体链接处理方法、设备、存储介质及程序产品,方法包括:获取待链接的实体提及;根据预设的标准名称库以及已构建的别名库,确定实体提及对应的召回结果集合,其中,召回结果集合中包括多个召回结果,各召回结果分别为一个标准名称,别名库基于预先训练得到深度双向自然语言处理模型构建得到,且,深度双向自然语言处理模型训练时,基于别名的头部在标准名称中的位置与别名的尾部在标准名称中的位置之间的约束关系确定损失信息;根据实体提及与召回结果集合中各召回结果的文本相似度或语义相似度,确定召回结果集合中的目标召回结果,并将目标召回结果作为实体提及的实体链接结果。通过本申请能够提升实体链接结果的准确性。

主权项:1.一种实体链接处理方法,其特征在于,包括:获取待链接的实体提及;根据预设的标准名称库以及已构建的别名库,确定所述实体提及对应的召回结果集合,其中,所述召回结果集合中包括多个召回结果,各召回结果分别为一个标准名称,所述别名库基于预先训练得到深度双向自然语言处理模型构建得到,且,所述深度双向自然语言处理模型训练时,基于别名的头部在标准名称中的位置与别名的尾部在标准名称中的位置之间的约束关系确定损失信息;根据所述实体提及与所述召回结果集合中各召回结果的文本相似度或语义相似度,确定所述召回结果集合中的目标召回结果,并将所述目标召回结果作为所述实体提及的实体链接结果;基于所述深度双向自然语言处理模型构建所述别名库的过程包括:将目标标准名称输入所述深度双向自然语言处理模型中,由所述深度双向自然语言处理模型生成目标头向量以及目标尾向量;获取所述目标头向量中表征属于头部、且位置大于第一预设值的至少一个头位置,并获取所述目标尾向量中表征属于尾部、且位置大于第二预设值的至少一个尾位置;将所述至少一个头位置与所述至少一个尾位置两两组合,得到至少一个位置组合,从所述至少一个位置组合中筛选出头位置与尾位置的间隔满足预设条件的至少一个目标位置组合;将各目标位置组合在所述目标标准名称中对应的文本段分别作为所述目标标准名称的一个别名,并将所述目标标准名称与各别名存储至所述别名库中。

全文数据:

权利要求:

百度查询: 杭州恒生聚源信息技术有限公司 上海恒生聚源数据服务有限公司 实体链接处理方法、设备、存储介质及程序产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。