买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本发明公开了命名实体识别方法、装置、计算机设备及可读存储介质,涉及自然语言处理技术领域,包括获取医学文本,对所述医学文本进行预处理,获得待处理文本;基于预设词典对所述待处理文本进行微生物实体抽取,获得目标实体;根据第一预设规则和所述目标实体生成多个候选缩写实体,并采用第一模型获得目标缩写实体;根据第二预设规则和所述目标实体生成多个候选补充实体,并采用第二模型获得目标补充实体;基于所述目标实体、所述目标缩写实体以及目标补充实体生成目标数据,解决了现有基于字典匹配的实体抽取无法考虑缩写或带有特定信息的实体,准确率较低的技术问题。
主权项:1.一种命名实体识别方法,其特征在于,包括:获取医学文本,对所述医学文本进行预处理,获得待处理文本;基于预设词典对所述待处理文本进行微生物实体抽取,获得目标实体;根据第一预设规则和所述目标实体生成多个候选缩写实体,并采用第一模型从所述候选缩写实体中筛选,获得与所述目标实体对应的候选缩写实体,作为目标缩写实体;根据第二预设规则和所述目标实体生成多个候选补充实体,并采用第二模型对所述候选补充实体进行筛选,获得目标补充实体;其中,所述候选补充实体通过对所述目标实体进行扩展边界获得,所述采用第二模型对所述候选补充实体进行筛选,获得目标补充实体,包括以下:获取任一候选补充实体,采用CharCNN层对所述候选补充实体进行处理,获得与所述候选补充实体对应的特征向量;同步采用位置编码层对所述候选补充实体进行处理,获得与所述候选补充实体对应的位置向量;将所述特征向量和所述位置向量拼接后输入全连接层处理,获得分类结果;当所述分类结果为否,则获取另一候选补充实体;当所述分类结果为是,则获取所述候选补充实体作为目标补充实体;基于所述目标实体、所述目标缩写实体以及目标补充实体生成目标数据。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 命名实体识别方法、装置、计算机设备及可读存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。