买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉大学
摘要:本发明公开了一种基于广靶代谢组学和机器学习的生物标志物筛选方法及其所选慢性肾病生物标志物组、应用。本发明用于筛选生物标志物并构建最优预测模型,利用机器学习的方法处理代谢组学测定的高通量、高维度、高相关性代谢物丰度矩阵,通过特征重建、特征筛选、模型构建和模型筛选的步骤可实现高效的生物标志物筛选并构建最优预测模型。使用该方法从慢性肾病患者血浆中筛选出7个代谢物作为生物标志物,构建了预测模型用以区分不同分期的慢性肾病患者,该预测模型的平均曲线下面积可达0.99。本发明为处理复杂的广靶代谢组学数据提供了流程化的操作工具,能高效筛选出生物标志物,构建预测性能优良的预测模型。
主权项:1.一种慢性肾病生物标志物组,其特征在于:所述慢性肾病生物标志物组包括7种血液代谢物:5-氨基咪唑核糖核苷酸、金松酸、醛赖氨酸、5-甲基硫代腺苷、5-甲氧基吲哚乙酸、脱氧核糖-1-磷酸和2-羟乙基磺酸;所述慢性肾病生物标志物组是基于如下筛选方法应用得到的;所述应用为数据分析流程,包含如下步骤:步骤S1:采用广靶代谢组学技术对血液样本中的代谢物并进行定性和定量分析,具体为:S1.1:收集和处理血液样本;S1.2:建立项目分析数据库:采用高分辨质谱分析混合样品QC中的代谢物,保留离子信息,与本地标准品库去重后建立项目数据库;S1.3:采用三重四极杆质谱测定所有样品中的代谢物含量;S1.4:用MultiQuant3.0.3软件处理原始质谱数据,获取代谢物丰度矩阵;步骤S2:采用机器学习技术对代谢物丰度矩阵进行分析,筛选生物标志物并构建预测模型,具体为:S2.1:特征重建,针对代谢物丰度矩阵进行正态性转换和缩放;S2.2:特征筛选,采用过滤法和包装法筛选出最重要的代谢物作为生物标志物;S2.3:模型构建,采用监督学习方法,通过带交叉验证的网格搜索确定各模型的最佳参数组合,构建6个预测模型;S2.4:模型选择,通过模型在测试集或者外部验证集上的F1分数,AUC和DCA曲线确定最佳模型为预测模型;步骤S3:筛选慢性肾病生物标志物,具体为:S3.1:收集血液样本,从医院选取慢性肾病患者和健康对照作为研究对象使用EDTA抗凝采血管采集研究对象空腹静脉血,离心后提取上清液冻入保存;S3.2:处理血浆样品:样本收集齐后从冰箱中取出,遵循“梯度解冻-加提取液-离心-提取上清液”步骤处理血样,另配制空白对照和混合样品QC;S3.3:进行广靶代谢组学分析;S3.4:采用机器学习筛选生物标志物并构建预测模型。
全文数据:
权利要求:
百度查询: 武汉大学 基于广靶代谢组学和机器学习的生物标志物筛选方法及其所选慢性肾病生物标志物组、应用
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。