买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:昆明理工大学
摘要:本发明涉及基于双仿射注意力的中文电子病历命名实体识别方法。本发明包括:获取数据集并进行标注;数据初始化阶段构建字符索引和医学词典查找表,并使用词典查找表匹配文本中的医学词汇;接着在文本嵌入阶段使用ERNIE‑Health预训练模型获得字符嵌入表示,并使用TCN提取字符局部语义特征并生成词语嵌入表示;再拼接字词嵌入表示并使用BiLSTM模块提取上下文远距离依赖关系。第五个是双仿射注意力阶段实现实体间的特征交互,提取实体之间存在的潜在语义关系;Softmax分类阶段实现标签的最终解码;本发明实现实体边界和语义信息的准确把握,改善VTE患者中文电子病历命名实体识别过程中的实体边界和语义信息丢失问题。
主权项:1.基于双仿射注意力的中文电子病历命名实体识别方法,其特征在于,所述方法的具体步骤如下:Step1、获取静脉血栓栓塞症中文电子病历数据集,处理静脉血栓栓塞症中文电子病历原始文本,并对其进行实体标注;Step2、首先是数据初始化阶段,获取的静脉血栓栓塞症中文电子病历数据集,对文本中的所有字符进行索引;通过词典文件构建词语表,并使用词语表匹配句子中存在的词语,生成由词语首尾字符位置索引表示的词语序列;Step3、文本嵌入阶段,使用预训练模型对字符进行嵌入表示,并查找词语在序列中的索引得到词语的首尾字符位置嵌入;Step4、将字符序列分别与词语首尾位置嵌入拼接,拼接得到的两个嵌入充当开始层和结束层,使用BiLSTM提取字符远距离依赖关系;Step5、将提取完远距离特征的开始层嵌入和结束层表示传入双仿射注意力中,采用开始层与结束层表示拼接、点乘和相减的多种交互方式,实现词语首尾位置交互;Step6、将双仿射注意力的输出结果传入Softmax函数用于标签分类。
全文数据:
权利要求:
百度查询: 昆明理工大学 基于双仿射注意力的中文电子病历命名实体识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。