首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于局部和全局的网络中心性分析的癌症驱动基因预测方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安徽大学

摘要:本发明公开了一种基于局部和全局的网络中心性分析的癌症驱动基因预测方法,包括以下步骤:S1:对标准化的体细胞突变数据和基因表达数据进行预处理,表达成基因‑矩阵的形式;S2:使用预处理完成的数据对下载的PPI网络加权;S3:模型构建,使用改进的重启随机游走算法分析网络的全局和局部特征;S4:使用构建好的模型对癌症数据集进行预测,以获取驱动基因的排名向量,实现对癌症驱动基因的预测。还公开了一种基于局部和全局的网络中心性分析的癌症驱动基因预测系统。本发明能够更好地识别驱动基因,大大提高对癌症驱动基因预测的精度,为癌症的诊断和精准医疗的发展做出了贡献。

主权项:1.一种基于局部和全局的网络中心性分析的癌症驱动基因预测方法,其特征在于,包括以下步骤:S1:对标准化的体细胞突变数据和基因表达数据进行预处理,表达成基因-矩阵的形式;S2:使用预处理后的数据对下载的PPI网络加权;具体步骤包括:S201:输入预处理后的体细胞突变数据,根据得到的突变基因-患者矩阵M,计算突变基因的突变得分,其中,每个基因i的突变分数Mi表示突变对癌症的贡献,定义为: Ki为突变基因i的所有发生突变的患者集合,Nk是样本k中突变基因的总数,Nmax为所有样本中突变基因的最大数目,如果基因i在所有样本中没有突变,即Ki为空,则Mi被赋予一个不大于任何突变基因的背景突变评分;S202:输入预处理完成的基因表达数据,根据差异表达基因-患者的矩阵D,计算两个基因之间的皮尔森相关系数: 其中,xi和xj分别代表基因i和基因j的表达量,N代表样本数,利用R语言中的cor函数计算PCC值,将基因i和j之间的PCC值作为节点i和j在网络中的权值;S203:整合突变得分Mi和PCC,以此计算基因之间的相互作用分数来为PPI网络加权,加强随机游走算法中的初始概率P0t; Mi和Mj分别表示基因i和j的突变得分,wij表示网络的边缘权重,所述边缘权重使用基因之间的皮尔森相关系数S3:模型构建,使用改进的重启随机游走算法通过控制跳转步长分析网络的全局和局部特征;具体步骤包括:S301:在加权的PPI网络上使用随机游走算法遍历网络节点,并将PPI网络的权值作为随机游走的初始概率P0t;S302:采用反馈中心性代替随机游走算法的跳转概率,通过控制随机游走的步长,得到在不同的步长下网络分析的结果;S303:整合不同步长所得到的结果,通过递归的方法得到在已知的驱动基因验证下精度趋近于1的结果,并返回不同步长所占的权值,整合公式如下:score=w1P1+w2P2+w3P3其中,P1代表步长为2的重启随机游走算法计算的节点向量,P2表示的是步长为3,P3表示的是迭代趋于平稳并且步长小于1000的结果;通过整合不同步长的RWR算法的结果,能够识别网络中的重要的基因节点;S4:使用构建好的模型对癌症数据集进行预测,以获取驱动基因的排名向量,实现对癌症驱动基因的预测。

全文数据:

权利要求:

百度查询: 安徽大学 基于局部和全局的网络中心性分析的癌症驱动基因预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。