首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于域对抗和变分推断的单细胞数据整合方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西北工业大学

摘要:本发明涉及一种基于域对抗和变分推断策略的单细胞数据整合的方法,该方法通过整合跨技术、跨模态、跨样本的大规模的单细胞数据实现高维多模态单细胞数据的降维和去噪,它可以从多种不同角度准确描述细胞的类型、状态。本发明由于采用深度神经网络学习的框架,训练过程中采用小批量随机梯度下降的策略搜索最优的模型参数,从而可以利用GPU提高训练并行规模,减少时间,提高效率。该发明的主要特征是:1具有较强的通用性;2具有可扩展性,3可以应用于大规模的单细胞数据。

主权项:1.一种基于域对抗和变分推断的单细胞数据整合方法,其特征在于步骤如下:步骤1:需要整合的、从不同的单细胞测序数据集中收集到的标准化的基因表达矩阵输入到模型中;所述的模型由一个特征提取器、一个非线性函数映射和一个域分类器组成;所述特征提取器部分使用KL正则化项使变分推断的神经网络学习到单细胞数据的低维特征,即隐变量Z;所述非线性函数映射部分用于将从特征提取器中学到的低维特征还原到原始的数据分布;所述域分类器通过梯度反转层连接到神经网络的瓶颈层,使得本模型在提取特征的同时混淆不同批次数据的来源以进行批次效应的去除;该模型将这三部分融合,共同构建了一个目标损失函数;所述的特征提取器是一个变分推断的神经网络,输入n*p的基因表达矩阵,n为细胞数,p为基因数,通过三个全连接层连接,输出两个n*d的低维矩阵,分别表示隐变量Z的后验概率分布的均值和协方差矩阵;估计的分布与Z的先验分布的KL散度为损失函数的第一项;所述的非线性函数映射:输入特征提取器产生的隐变量Z的样本,经过3个全连接层的转换后,输出重构的表达矩阵;重构误差为损失函数的第二项;所述域分类器:输入特征提取器产生的隐变量Z的样本,首先经过1个梯度反转层,然后经过2个全连接层的转换,最后经过softmax激活函数得到分类结果;分类结果和批次标签的均方差作为损失函数的第三项;步骤2:通过最小化目标函数,模型输出可用于下游分析的隐变量Z,即去除批次效应的单细胞低维嵌入特征,完成单细胞数据整合的任务。

全文数据:

权利要求:

百度查询: 西北工业大学 一种基于域对抗和变分推断的单细胞数据整合方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。