首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

疾病预测模型的训练方法、疾病预测系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民解放军空军军医大学

摘要:本发明涉及医疗信息技术领域,公开疾病预测模型的训练方法、疾病预测系统,包括步骤:收集大量的原始病例数据,对原始病例数据进行预处理,整理出医疗数据和诊断结果;将医疗数据和诊断结果作为训练集对神经网络模型进行训练,使得神经网络模型输出医疗数据或诊断结果的预测概率;基于神经网络模型输出的预测概率,通过XGBoost算法构建疾病预测模型。本发明基于病人的原始病例数据,以多模态医疗数据为训练集训练出能够对医疗数据或诊断结果进行预测的神经网络模型,最后构建疾病预测模型用于输入待预测数据后得到诊断结果辅助医生诊断。

主权项:1.疾病预测模型的训练方法,其特征在于:包括以下步骤:步骤1,收集大量的原始病例数据,对原始病例数据进行预处理,整理出医疗数据和诊断结果;所述步骤1具体中,原始病例数据的字段数据包括病人序号、病人年龄、检验项目、检验结果、症状部位、症状程度、症状持续时间、治疗时间、治疗手段、诊断结果;所述步骤1中,对原始病例数据进行预处理,整理出医疗数据和诊断结果的步骤,包括:将病人年龄、检验项目、检验结果、症状部位、症状程度、症状持续时间、治疗时间、治疗手段这8个字段数据作为医疗数据,则所有病人的医疗数据样本集为X={X1,X2,...,XN},其中Xi表示序号为i的病人的医疗数据,N为病人总数,i∈[1,N];诊断结果标签集为Y={Y1,Y2,...,YN},Yi为Xi对应的诊断结果,且将诊断结果Yi作为医疗数据Xi的标签;病人i的医疗数据为,其中表示病人i的医疗数据中的第v个字段数据,v=1,2,...,8;步骤2,将医疗数据和诊断结果作为训练集对神经网络模型进行训练,使得神经网络模型输出医疗数据或诊断结果的预测概率;所述步骤2具体包括以下步骤:将医疗数据Xi中的字段数据转换为词向量,首先计算字段数据的词频: 其中,表示字段数据的词频;表示字段数据在医疗数据Xi中出现的次数;T表示医疗数据Xi中字段数据的总数;计算字段数据的义原频率: 其中,表示字段数据的义原频率;N表示病人总数;表示包含了字段数据的医疗数据数量;将字段数据转换为词向量: 建立词向量与索引之间的系数矩阵: 其中,表示系数矩阵,维度为M;表示系数矩阵中第v行第j列的系数,v=1,2,...,8,j=1,2,...,M;计算词向量的评分矩阵: 其中,表示评分矩阵,维度为M;表示评分矩阵中第v行第j列的系数,有: 其中,表示的评分;表示第M个维度的补偿系数;表示第M-1个维度的补偿系数;表示第1个维度的补偿系数;表示第M个维度的权重,表示第M-1个维度的权重,表示第1个维度的权重,T为矩阵转置;表示第1个维度的偏置;表示第M-1个维度的偏置;表示第M个维度的偏置;将词向量投影到指定的维度M: 其中,词向量的维度为M;医疗数据Xi的词向量表示为: 将诊断结果Yi投影到指定的维度M: 其中,诊断结果向量的维度为M; 中具有8个词向量,中具有1个词向量,将这9个词向量中的任一词向量作为中心词wcore,将用表示,其中,计算中心词wcore的预测概率: 其中,core=1,2,...,9,k=1,2,...,9;将预测概率最大化,等同于最小化损失函数L: 基于梯度下降算法,进行多次迭代,使得损失函数L最小化,以此得到最优的预测概率;步骤3,基于神经网络模型输出的预测概率,通过XGBoost算法构建疾病预测模型。

全文数据:

权利要求:

百度查询: 中国人民解放军空军军医大学 疾病预测模型的训练方法、疾病预测系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。