首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

预测结直肠癌预后风险的模型构建方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:佳木斯大学

摘要:本发明涉及一种预测结直肠癌预后风险的模型构建方法,依靠训练集GSE39582筛选结直肠癌预后相关基因,构建预后标签PSCRC及其预后评估,接着再用两个外部数据集GSE17536和CRC_TCGA进行PSCRC验证,最后绘制多因素预后模型并评估其预后效果。本发明在传统的结直肠癌临床指标的基础上,整合新发现的标签PSCRC,构建了新的结直肠癌多因素预后模型,提高了预后效果,可以及早发现疾病的严重程度,从而尽早采取相应的治疗措施,帮助临床医师制定合理的治疗方案,实现最优治疗效果,对提高患者的生存率和生活质量有着重要的指导和参考意义。

主权项:1.一种预测结直肠癌预后风险的模型构建方法,其特征在于,包括如下步骤:a.数据下载与处理:从TCGA数据库下载包含临床和RNAseq数据的结直肠癌数据集CRC_TCGA,提取TPM格式的数据,用log2方法处理数据;从GEO数据库下载结直肠癌数据集GSE39582和GSE17536,经过id转换和标准化处理;b.筛选训练集中预后相关基因:采用训练集GSE39582作为处理对象,使用R软件包“survival”,整合生存时间、生存状态和基因表达数据,利用cox方法评估每个基因的预后显著性;c.利用训练集构建预后标签PSCRC及其预后评估:c1.Lasso-cox分析预后lasso变量轨迹的建立:使用R软件包的glmnet对清洗过后的GSE39582数据进行分析得到变量系数值、λ对数值、L1正则化值,并对数据进行可视化;预后lasso系数筛选:使用glmnet包对清洗过后的GSE39582数据进行分析得到变量λ值、最大似然数或C指数并对数据进行可视化;c2.PSCRC预后效果评估根据PSCRC风险分数计算公式计算预后标签风险评分,并据此将GSE39582数据集中患者分为两组,使用R包“survival”的“survfit”函数分析两组患者预后差异,并使用logrank检验方法评估差异显著性;随后,利用R包“pROC”的“ROC”函数在1年、3年和5年三个时间点进行ROC分析,并使用“ci”函数评估曲线下面积和置信区间,获得最终AUC结果;最后,分析PSCRC风险评分与患者随访时间、结局以及每个基因表达变化之间的关系;d.外部数据集验证PSCRCd1.根据PSCRC风险分数计算公式计算两个外部数据集GSE17536和CRC_TCGA中PSCRC的风险评分,验证PSCRC的预后效果;d2.Kaplan-Meier生存曲线绘制:首先根据50%的百分位数将患者分成两组,进一步使用R软件包“survival”的“survfit”函数分析两组的预后差异,利用logranktest方法评估了不同组样本之间的预后差异显著性;d3.ROC分析:利用R软件包“pROC”进行了ROC分析以获得AUC;d4.风险热图绘制:利用R包“ggplot2”分析不同风险分数与患者的随访时间、事件及各个基因的表达变化的关系;e.多因素预后模型绘制与预后效果评估;e1.绘制预后模型和校准曲线:使用R软件包“survival”包进行比例风险假设检验,并进行Cox回归分析,使用“rms”包构建nomogram相关模型,Calibration分析,并进行可视化;e2.决策曲线分析评估预后效果:通过“survival”包拟合预后模型,使用“stdca.R”文件进行决策曲线分析;c2中,PSCRC风险分数计算公式为:PSCRC风险分数=0.34×ZEB1-AS1+0.08×PTPN14+-0.11×MYB+0.05×LINC00973+0.03×GDI1+0.04×SLC2A3+0.01×SIX4+-0.08×ACAT2+0.04×KRT6A+-0.18×ZNF552+0.06×SEMA4C+0.29×KIF7+0.09×GABRG2+-0.09×TNFRSF14+0.09×LINC00638+-0.14×OIT3+0.25×HCN4+0.73×OFCC1。

全文数据:

权利要求:

百度查询: 佳木斯大学 预测结直肠癌预后风险的模型构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。