首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于电子病历问答模型的数据预处理系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:生命奇点(北京)科技有限公司;奇点数联(北京)科技有限公司

摘要:本发明提供了一种基于电子病历问答模型的数据预处理系统,系统包括样本电子病历信息集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:根据样本电子病例信息集,获取候选文本集,根据候选文本集和目标术语知识图谱,获取候选关键词集,根据候选文本集和候选关键词集,获取初始文本集,根据初始文本集,获取目标文本集,根据目标文本集,获取指定文本向量以实现数据预处理,本发明基于文本的类型对文本字符串的数量进行统一,保证了获取到的指定文本向量的全面性,同时,考虑文本中的关键词因素,基于不同因素采用不同手段对文本进行处理,提高了获取到的指定文本向量集的准确度。

主权项:1.一种基于电子病历问答模型的数据预处理系统,其特征在于,所述系统包括:样本电子病历信息集、处理器和存储有计算机程序的存储器,其中,所述样本电子病历信息集包括若干个样本电子病历信息,所述样本电子病历信息为从数据库中获取到的病历中对应的异常状态特征信息,当所述计算机程序被处理器执行时,实现以下步骤:S1,根据样本电子病历信息集,获取候选文本集A={A1,……,Ai,……,An},Ai为第i个候选文本,i=1……n,n为候选文本的数量;S3,根据A和目标术语知识图谱,获取A对应的候选关键词集Q={Q1,……,Qi,……,Qn},Qi为Ai对应的候选关键词列表;S5,根据A和Q,获取初始文本集T={T1,……,Ti,……,Tn},Ti={Ai,Qi},Ti为第i个初始文本;S7,根据T,获取指定文本集U={U1,……,Ui,……,Un},Ui为第i个指定文本,其中,在S7中通过如下步骤获取Ui:S71,根据Ti,获取Ti对应的文本字符串WTi=WT0i1,……,WT0ix,……,WT0ip,WT1i1,……,WT1iy,……,WT1iq,WT0ix为Ai对应的第x个文字字符,x=1……p,p为Ai对应的文字字符的数量,WT1iy为Qi对应的第y个文字字符,y=1……q,q为Qi对应的文字字符的数量;S72,当p+q=K时,获取Ui=Ti,其中,K为预设的关键优先级阈值;S73,当p+q>K时,获取Q对应的候选优先级集P={P1,……,Pi,……,Pn},Pi={Pi1,……,Pie,……,Pifi},Pie为Qi对应的候选关键词列表中第e个候选关键词对应的候选优先级,e=1……fi,fi为Qi对应的候选关键词列表中候选关键词的数量;S74,基于P,对WTi进行处理以获取Ui;S75,当p+q<K时,获取Qi对应的指定关键词集Ri={Ri1,……,Rie,……,Rifi}和Qi对应的指定优先级集Gi={Gi1,……,Gie,……,Gifi},Rie为Qie对应的指定关键词列表,Gie为Qie对应的指定优先级列表;S76,根据Ri和Gi,对WTi进行处理以获取Ui;S9,根据U,获取指定文本向量集以实现数据预处理,其中,所述指定文本向量集包括若干个指定文本向量,其中,所述指定文本向量为将指定文本输入至预训练电子病历编码模型中获取到的。

全文数据:

权利要求:

百度查询: 生命奇点(北京)科技有限公司 奇点数联(北京)科技有限公司 一种基于电子病历问答模型的数据预处理系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。