恭喜厦门快商通科技股份有限公司黄友福获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜厦门快商通科技股份有限公司申请的专利一种医疗症状实体信息归一化方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115148367B 。
龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210736314.2,技术领域涉及:G16H50/70;该发明授权一种医疗症状实体信息归一化方法和系统是由黄友福;肖龙源;李海洲;李稀敏;李威设计研发完成,并于2022-06-27向国家知识产权局提交的专利申请。
本一种医疗症状实体信息归一化方法和系统在说明书摘要公布了:本发明提供一种医疗症状实体信息归一化方法,首先根据疾病信息定义标准症状类别列表,利用实体识别方法识别所包含的原始症状,结合实疾病数据本身文本,对疾病数据进行打标,作为模型训练数据集;针对训练数据集中的每条句子、每条症状信息进行embedding编码,并进行实体信息归一化模型的训练,得到训练完成后的实体信息归一化模型;将需要归一化的医疗数据输入训练完成后的实体信息归一化模型,得到维度为[1,N]的向量,确定实体信息归一化模型输出的N维向量中值最大的元素所在的维度,得到归一化后的对应类别;本发明提供的方法能够结合实体识别方法对结果进行归一化,消除实体信息歧义,降低实体信息处理的复杂度,且本发明提供的模型识别能力强。
本发明授权一种医疗症状实体信息归一化方法和系统在权利要求书中公布了:1.一种医疗症状实体信息归一化方法,其特征在于,包括:根据疾病信息定义标准症状类别列表,所述疾病信息包括但不限于疾病特征、疾病种类以及疾病生理现象;对原始数据集中的每条疾病数据,利用实体识别方法识别所包含的原始症状,结合实体识别方法抽取出的原始症状和疾病数据本身文本,对疾病数据进行打标,其标签类别为标准症状列表中的一类,标注完后作为模型训练数据集;针对训练数据集中的每条句子信息进行embedding编码,得到维度为[40,80]的句子矩阵X1,针对训练数据集中的每条症状信息进行embedding编码,得到维度为[40,80]的实体矩阵X2,针对训练数据集中的每条标准症状类别进行embedding编码,得到维度为[N,1]的向量Y,其中N为定义的标准症状类别数,向量的每个维度代表一个类别,本标准症状类别对应的维度值为1,另外维度值为0;利用训练数据中的句子矩阵X1和实体矩阵X2进行实体信息归一化模型的训练,得到训练完成后的实体信息归一化模型,所述实体信息归一化模型包括:句子编码模块,实体症状编码模块,句子批量标准化模块,实体批量标准化模块,句子自注意力模块,第一拼接模块,第一自注意力模块,第二拼接模块以及全连接层;输入句子矩阵X1,按0.5比例进行随机抽取,输入句子批量标准化模块得到句子标准化矩阵X1a,维度为[40,80],将句子标准化矩阵X1a输入句子自注意力模块,得到句子向量X1b,维度为[1,80];输入实体矩阵X2,按0.5比例进行随机抽取,输入实体批量标准化模块得到实体标准化矩阵X2a,维度为[8,80];将句子标准化矩阵X1a和实体标准化X2a输入第一拼接模块进行拼接,得到标准化拼接矩阵X3,维度为[48,80];将标准化拼接矩阵X3输入第一自注意力模块得到标准化注意向量X4,维度为[1,80];将句子向量X1b和标准化注意向量X4输入第二拼接模块进行拼接,得到组合向量X5,维度为[1,160];将组合向量X5输入全连接层并用softmax进行归一化,得到输出向量Y’,维度为[1,N];组合向量X5输入全连接层后得到预设维度为[1,N]的向量,将预设维度为[1,N]的向量的每个元素经过softmax进行归一化就得到向量Y’;向量Y’的维度为[1,N],所有元素值的和为1;softmax公式为其中z为向量Y’的元素,i取值为1,2,3...N;计算输出向量Y’与Y的交叉熵,逐步迭代优化至满足迭代条件,得到训练完成后的实体信息归一化模型;利用实体识别方法对疾病句子进行识别,提取出实体识别方法识别到的症状实体信息;将句子信息和症状实体信息进行embedding编码,将编码后的句子矩阵和实体矩阵输入训练完成后的实体信息归一化模型,得到维度为[1,N]的向量,确定实体信息归一化模型输出的N维向量中值最大的元素所在的维度,得到归一化后的对应类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门快商通科技股份有限公司,其通讯地址为:361000 福建省厦门市软件园三期诚毅北大街63号1301单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。