买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西安电子科技大学;中国人民解放军空军军医大学
摘要:本发明提出了一种基于ODE和GRUD的急性病症发生几率的评估方法,用于解决现有技术中存在的没有同时考虑时序数据的临床指标缺失和采样的时间间隔不均匀导致的评估准确性较低的技术问题。实现步骤为:获取多临床指标的时序数据集、时间戳序列集和急性病症标签集;获取信息衰减表征训练样本集、信息衰减表征验证集样本和信息衰减表征测试样本集;构建基于ODE和GRUD的门控递归单元网络;对基于ODE和GRUD的门控递归单元网络进行迭代训练;获取急性病症发生几率的评估结果。本方法能够兼顾时序数据的临床指标缺失和采样时间间隔不均匀的问题,将临床指标缺失的影响纳入隐藏态更新的过程,提升急性病症发生概率估计的准确性。
主权项:1.一种基于ODE和GRUD的急性病症发生几率的评估方法,其特征在于,包括如下步骤:1获取多临床指标的时序数据集S、时间戳序列集T和急性病症标签集L:1a采集Ns个患者的17个临床指标,包括Glucose、Systolicbloodpressure、Glascowcomascaleverbalresponse、Temperature、Weight、Diastolicbloodpressure、Fractioninspiredoxygen、Glascowcomascaletotal、Capillaryrefillrate、Meanbloodpressure、HeartRate、Oxygensaturation、pH、Height、Glascowcomascaleeyeopening、Respiratoryrate和Glascowcomascalemotorresponse,每个临床指标至少被采集一次,每个患者共采集不少于Nr次,且每次采集的数据至少包括17个临床指标中的一个,即每次采集的数据中可能存在缺失的临床指标,并按照采集时间由前到后的顺序对每个患者采集的Nr次临床指标进行排序,得到包括Ns个患者的多临床指标的时序数据集同时按照每个患者每次采集临床指标由前到后的顺序记录采集的时间戳,得到时间戳序列集其中,Ns≥3000,Nr≥10,表示第ns个患者的多临床指标时序数据,表示对应的时间戳序列;1b对每个患者的多临床指标时序数据对应的肾衰竭、心肌梗塞、肺衰竭、肺炎、呼吸衰竭、败血症和休克7种急性病症进行标注,得到急性病症标签集其中,表示与对应的急性病症标签集合其中,表示第l个急性病症标签,表示该急性病症发生,表示该急性病症未发生;2获取信息衰减表征训练样本集Dtrain、信息衰减表征验证集样本Dval和信息衰减表征测试样本集Dtest:2a对多临床指标的时序数据集S中所有多临床指标的时序数据的17个临床指标的最大值、最小值和平均值进行统计,得到临床指标最大值集合临床指标最小值集合和临床指标平均值集合并对S中的每个多临床指标时序数据中每次采集中的每个临床指标的值按照Vmax中对应于该临床指标的最大值、Vmin中对应于该临床指标的最小值和Vmean中对应于该临床指标的平均值进行归一化,得到归一化后的时序数据集其中,表示与第ns个患者的多临床指标时序数据对应的归一化后的时序数据,和分别表示第nc个临床指标的最大值、最小值和平均值;2b将归一化后时序数据集S1中每个归一化后的时序数据复制为和并将中每次采集的时序数据所缺失临床指标的位置填充0,同时将每次采集的时序数据中的临床指标的值修改为1,得到掩模序列集将中首次采集的各个临床指标的值设置为1,第二的到第Nr次每次采集的每一个临床指标的值填充为距离该临床指标上一次被采集的时间间隔,得到间隔序列集将中首次采集的所缺失临床指标的位置填充为该临床指标对应于Vmean中的该临床指标平均值,第二的到第Nr次每次采集的时序数据所缺失临床指标的位置填充该临床指标之前最近一次被采集的值,得到填充序列集其中和分别表示对应于的包括Nr个掩模向量的掩模序列、包括Nr个间隔向量的间隔序列和包括Nr个填充向量的填充序列;2c将对应的掩模序列间隔序列填充序列和时间戳序列组合成输入序列得到输入序列集并将D中半数以上的输入序列作为信息衰减表征训练样本集Dtrain,将剩余的输入序列平分为信息衰减表征验证样本集Dval和信息衰减表征测试样本集Dtest,其中表示对应的输入序列;3构建基于ODE和GRUD的门控递归单元网络K:构建包括顺次连接的衰减门控递归单元网络GRUD、常微分模块ODE和全连接层的门控递归单元网络K,其中GRUD包含顺次连接的并行排列的隐藏态衰减处理全连接层和输入衰减处理全连接层、并行排列的更新门计算单元和重置门计算单元,以及隐藏态计算单元,ODE包含顺次连接的常微分方程计算模块和隐藏态更新模块;4对基于ODE和GRUD的门控递归单元网络K进行迭代训练:4a初始化迭代次数为e,最大迭代次数为E,200≤E≤500,初始学习率为η=0.0001,第e次迭代的学习率为ηe,提升停滞次数为C,最优平均绝对误差为BCEbest,初始化K的所有偏置参数均数值为0,初始化第e次迭代GRUD的初始隐藏态为符合正态分布,并令e=1,C=0,BCEbest=9223372036854775807,ηe=η;4b将信息衰减表征训练样本集Dtrain作为基于ODE和GRUD的门控递归单元网络K的输入进行前向传播,实现步骤为:4b1按照信息衰减表征训练样本包含的时间戳序列中时间戳由前到后的顺序选择第t个时间戳并以信息衰减表征训练样本中对应的掩模向量时间间隔向量填充向量和作为K中GRUD的输入,计算时间戳为t时衰减门控递归单元网络GRUD的中间隐藏态计算公式为: 其中,和分别表示GRUD中输入衰减处理全连接层的权重参数和偏置参数,和分别表示GRUD中隐藏态衰减处理全连接层的权重参数和偏置参数,Wg、Ug和Fg表示GRUD的重置门计算单元的权重参数,bg表示GRUD的重置门计算单元的偏置参数,Wz、Uz和Fz表示GRUD的更新门计算单元的权重参数,bz表示GRUD的更新门计算单元的偏置参数,Wq、Uq和Fq表示GRUD的隐藏态计算单元的权重参数,bq表示GRUD的隐藏态计算单元的偏置参数,σ·表示sigmoid函数,tanh·表示tanh函数,⊙表示元素乘;4b2常微分模块ODE的常微分方程计算模块判断时间戳是否为中最后一个时间戳,若是,执行步骤4b3,否则,执行步骤4b4;4b3常微分模块ODE的常微分方程计算模块计算中间隐藏态的梯度隐藏态更新模块通过对进行更新,得到信息衰减表征训练样本对应的GRUD的最后隐藏态hlast,其中: 其中,Δt表示与之间的时间间隔,hlast表示信息衰减表征训练样本对应的GRUD的最终隐藏态;4b4常微分模块ODE的常微分方程计算模块计算中间隐藏态的梯度隐藏态更新模块通过对进行更新,并执行步骤4b1,其中: 其中,当t=1时Δt=1,表示时间戳为时GRUD的更新前隐藏态;4c将hlast作为基于ODE和GRUD的门控递归单元网络K的全连接层的输入进行编码,得到信息衰减表征训练样本对应的7种急性病症发生几率的评估结果4d采用平均二值交叉熵函数计算信息衰减表征训练样本集Dtrain中所有信息衰减表征训练样本对应的7种急性病症发生几率的评估结果与其对应的急性病症标签的平均二值交熵值并以ηe为学习率,采用自适应学习率优化算法Adam,通过对基于ODE和GRUD的门控递归单元网络K的所有权重参数W和所有偏置参数b进行更新,得到第e次迭代的基于ODE和GRUD的门控递归单元网络Ke;4e将验证集Dval中所有信息衰减表征验证样本和GRUD的初始隐藏态作为Ke的输入进行前向传播,以Ke包含的GRUD计算GRUD的中间隐藏态以ODE计算GRUD的中间隐藏态的梯度并对GRUD的初始隐藏态进行更新得到GRUD的最终隐藏态,并将GRUD的最终隐藏态作为Ke中全连接层的输入进行编码,得到Dval中所有信息衰减表征验证样本对应的7种急性病症发生几率的评估结果并计算中每个信息衰减表征验证样本对应的7种急性病症发生几率的评估结果与其对应的7种急性病症发生几率的标签的平均二值交叉熵值的平均值BCEval;4f判断BCEval<BCEbest是否成立,若是,令BCEbest=BCEm,C=0,并执行步骤4g,否则令C=C+1,并执行步骤4g;4g判断e=E或者C=3是否成立,若是,得到训练好的基于ODE和GRUD的门控递归单元网络Kbest,否则令e=e+1,并执行步骤4b;5获取急性病症发生几率的评估结果:将信息衰减表征测试样本集Dtest中每个信息衰减表征测试样本和GRUD的初始隐藏态作为作为训练好的基于ODE和GRUD的门控递归单元网络Kbest的输入进行前向传播,以Kbest包含的GRUD计算GRUD的中间隐藏态以ODE计算中间隐藏态的梯度并对初始隐藏态进行更新得到最终隐藏态hlast,并将hlast作为Kbest中全连接层的输入进行编码得到Dtest中所有输入序列对应的7种急性病症发生几率的评估结果
全文数据:
权利要求:
百度查询: 西安电子科技大学 中国人民解放军空军军医大学 基于ODE和GRUD的急性病症发生几率的评估方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。