首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于雌激素受体-表观遗传因子互作网络的乳腺癌蛋白标志物筛选方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:太原理工大学

摘要:本发明提供一种基于雌激素受体‑表观遗传因子互作网络的乳腺癌蛋白标志物筛选方法,属于乳腺癌蛋白标志物筛选技术领域;所要解决的技术问题为:提供一种基于雌激素受体‑表观遗传因子互作网络的乳腺癌蛋白标志物筛选方法的改进;解决该技术问题采用的技术方案为:从公共数据库中收集多组雌激素受体和表观遗传因子的蛋白质互作组质谱数据,应用MaxQuant软件对蛋白质组进行定性和定量分析,进行肽段搜库匹配;使用基于二项式分布概率的算法对肽段‑谱图进行匹配评分,进一步通过评分对肽段进行排序,确定肽段修饰,每次都会计算包含中性损失和排除中性损失的分数;本发明应用于乳腺癌蛋白标志物筛选。

主权项:1.一种基于雌激素受体-表观遗传因子互作网络的乳腺癌蛋白标志物筛选方法,其特征在于:包括如下的筛选步骤:步骤一:通过挖掘和分析蛋白质组学数据,构建一个全面的雌激素受体与表观遗传因子相互作用网络:步骤1.1:从公共数据库ProteomeXchange、UniProt、NCBI中收集多组雌激素受体ERαβ和表观遗传因子METTL314、TET2的蛋白互作组质谱数据,应用MaxQuant软件对蛋白质组进行定性和定量分析,进行肽段搜库匹配;步骤1.2:使用基于二项式分布概率的算法对肽段-谱图进行匹配评分,进一步通过评分对肽段进行排序,确定肽段修饰:首先计算理论碎片质量与质谱中峰的匹配数量k,然后通过计算至少有k个匹配的概率,并取其负对数乘以10来得到对应谱图的分数sq,loss,该分数反映理论碎片质量列表与质谱质量列表之间的相似性,计算公式为: ;式中:n表示理论离子的总数,k表示理论碎片质量与质谱中峰的匹配数量,q表示质量区间内允许出现的峰的个数,用于计算单个随机匹配的概率;在质谱分析中,化合物分子经历碎裂过程,生成不同的碎片离子,产生中性损失,每次都会计算包含中性损失和排除中性损失的分数,选择两个分数中的最大值,并对于来自反向数据库的序列采用相同的评分操作,计算公式为: ;式中:sq表示包含中性损失和排除中性损失的分数中的最大值,通过计算不同q值下的分数,选择最佳分数;基于上述评分操作,从蛋白质列表中筛选出核受体与表观遗传因子;步骤1.3:搜集蛋白互作数据库STRING和BioGRID中已发表的雌激素受体与表观遗传因子互作证据,将结果与步骤1.2中筛选得到的核受体与表观遗传因子进行整合,使用Cytoscape软件绘制蛋白质互作网络图,绘制的蛋白质互作网络图包括雌激素受体与核受体以及各种表观遗传修饰因子之间的相互作用;步骤1.4:针对乳腺癌蛋白质组数据,使用Limma包软件将乳腺癌样本与癌旁正常组织样本进行差异对比分析,筛选出在乳腺癌组织中差异表达的蛋白,这些差异蛋白与乳腺癌的发生和发展有关;步骤二:运用机器学习方法确定乳腺癌新分型,然后筛选出蛋白标志物:步骤2.1:基于一致性聚类算法确定乳腺癌新分型:在差异蛋白中筛选出与雌激素受体互作的核受体和表观遗传因子,作为分类和标志物的候选者,利用这些差异蛋白在乳腺癌样本中的表达量数据,采用一致性聚类算法对乳腺癌进行无监督聚类;采用中心点划分的PAM算法进行无监督聚类,通过选择代表性的样本作为中心点,将数据集中的样本划分到与其最近的中心点中,找到最优的中心点配置,使得所有样本与其对应的中心点之间的距离总和最小;步骤2.2:基于蛋白质组数据设计集成分类器模型PEC,将乳腺癌样本中蛋白表达量作为特征,将带有分类标签的乳腺癌样本作为目标变量,融合多个单独的分类器预测并筛选蛋白质标志物,集成分类器模型PEC具体的设计方法为:采用网格搜索法,通过穷举参数空间中的所有可能组合,确定每个分类器的最佳参数,进而优化单独分类器的性能,在此过程中,采用软投票策略,将每个分类器的预测结果进行加权平均,其中权重取决于每个分类器的置信度;将各个单独分类器组合成一个投票分类器,将多个分类器的预测结果结合起来,确定最终的分类决策。

全文数据:

权利要求:

百度查询: 太原理工大学 一种基于雌激素受体-表观遗传因子互作网络的乳腺癌蛋白标志物筛选方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。