买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南开大学
摘要:本发明提出了整合单细胞转录组与空间转录组数据的分析方法及系统,包括:获取空间转录组数据,对空间转录组数据进行预处理;通过聚类方法将空间转录组数据中的采样点划分为若干个类别,每一个类别表示组织切片图像中一个组织区域;根据去污染后的空间基因表达数据,和空间聚类步骤的结果,筛选出在空间中具有差异性表达的基因;根据输入的单细胞数据进行分析,基于筛选出在空间中具有差异性表达的基因得出每个细胞亚群的表达模式;根据单细胞数据集中的细胞亚群表达模式,将所有spot的基因表达作为输入,获得细胞类型在各个组织区域中的分布。
主权项:1.整合单细胞转录组与空间转录组数据的分析方法,其特征是,包括:获取空间转录组数据,对空间转录组数据进行预处理;预处理之后去除空间转录组数据中游离的mRNA和处理基因表达的缺失值,得到去污染后的空间表达矩阵;利用去污染后的空间表达矩阵、采样点在组织切片中的位置信息和组织学影像,通过聚类方法将空间转录组数据中的采样点划分为若干个类别,每一个类别表示组织切片图像中一个组织区域,具体包括:对去污染后的空间表达矩阵中的基因进行降维,之后对降维后的每一个维度采用多元t分布模型进行建模和聚类,最后进行参数的更新;或者,整合空间位置信息和组织学影像信息,计算去污染后的空间表达矩阵中每个spot之间的距离,并采用图卷积神经网络,整合距离信息与基因表达量,最后基于图卷积网络的输出,采用无监督深度嵌入聚类分析方法将空间转录组数据中的采样点划分为若干个组织区域;或者,通过对每个采样点对应染色图区域和邻域信息对基因的表达进行均一化,再进行无监督聚类;根据去污染后的空间基因表达数据,和空间聚类步骤的结果,筛选出在空间中具有差异性表达的基因;根据输入的单细胞数据进行分析,得出每个细胞亚群在单细胞高表达基因下的表达模式,具体包括:对单细胞转录组数据集进行质量控制;过滤基因含量过低的细胞以及未在细胞中表达的基因;筛选出具有高表达的基因;利用数据集给出的细胞类型标注,对细胞亚群进行随机下采样,每个细胞亚群中提取出少量细胞作为该细胞亚群的表达模式,最后得到单细胞参考表达矩阵;根据单细胞数据集中的细胞亚群表达模式,将所有spot的基因表达作为输入,获得细胞类型在各个组织区域中的分布,具体包括:采用spacexr方法,在给定提供的单细胞数据后,读取每种细胞类型中所有基因的平均表达,然后采用逐步拟合的方法,找到最符合采样点基因表达的一种或两种细胞类型,然后用最大似然估计法拟合泊松分布的参数,进而推断出采样点中的细胞类型比例;或者,采用stereoscope方法,在给定提供的单细胞数据后,通过查找最大似然估计获得细胞类型分布特定参数的值,最后根据观测到的空间数据,利用细胞类型的先验分布,估计每个采样点的细胞类型比例。
全文数据:
权利要求:
百度查询: 南开大学 整合单细胞转录组与空间转录组数据的分析方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。