买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:暨南大学附属第一医院(广州华侨医院)
摘要:本发明公开了一种基于机器学习算法的子痫前期预测方法,包括以下步骤:步骤1、收集样本数据,获得样本特征;步骤2、对样本特征进行转换和填空;步骤3、将数据特征构建基于随机森林的子痫前期风险预测模型;步骤4、运用步骤3构建的基于随机森林的子痫前期风险预测模型对测试样本进行子痫前期风险预测。本发明能够为临床管理和早期干预子痫前期高风险人群提供辅助方法,以提高临床对于孕早期子痫前期筛查的准确率。
主权项:1.一种基于机器学习算法的子痫前期预测方法,其特征在于,包括以下步骤:步骤1、收集样本数据,获得样本特征;步骤1.1、收集孕妇在进行早孕期非整倍体联合筛查时正常单胎妊娠孕妇的样本数据,并根据已知的妊娠结局分别标注正常标签和患病标签;步骤1.2、根据预设标准选择样本数据中与子痫前期相关的样本特征;步骤2、对步骤1.2所述的样本特征进行转换和填空,具体转换和填空过程如下:步骤2.1、将样本特征进行转换和编码,以使其符合基于机器学习算法的训练模型的输入;步骤2.2、若样本特征中部分特征存在缺失值或空值,则针对不同特征的空值,利用不同的填空方式,对样本特征中具有空值的特征进行填空,若不存在空值,则不需要填空,最终形成无空值的训练样本并进入步骤3;步骤3、将步骤2形成的训练样本构建基于随机森林的子痫前期风险预测模型,具体模型构建如下:步骤3.1、构建训练样本的数据集;步骤3.2、将清洗好的训练样本打乱,采用分层随机抽样的方法将训练样本分成n个集合,其中“n-1”个集合作为训练集用来训练模型,剩余一个集合为测试集用于评估模型,其中,n为自然数;步骤3.3、对训练集的训练样本进行数据平衡;步骤3.4、对训练集的训练样本进行标准化处理,将原始数据变换到均值为0,标准差为1的范围内;步骤3.5、将随机森林的分类器个数设置为X,决策树的最大深度为Y,其余参数使用sklearn库中的默认值,其中,X大于等于10,Y大于等于5且Y小于100;步骤4、运用步骤3构建的基于随机森林的子痫前期风险预测模型对测试集样本数据进行子痫前期风险预测。
全文数据:
权利要求:
百度查询: 暨南大学附属第一医院(广州华侨医院) 一种基于机器学习算法的子痫前期预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。