首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多组学辅助的单细胞转录组的表示方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:大湾区大学(筹)

摘要:本发明涉及生物信息技术领域,具体公开了一种基于多组学辅助的单细胞转录组的表示方法。将每个基因或者蛋白在每个细胞的表达值视为一个分词,决定使用两个MAE结构去分别去训练CITE‑seq的转录组和蛋白组数据来完成多组学辅助任务。训练阶段分为三阶段,第一阶段是多模态数据的预训练阶段,第二阶段是多模态数据的微调阶段,第三阶段为一个独特的单模态数据的预测阶段。本发明提出了scMMAE单细胞多模态掩码自编码器,使用纯MAE作为骨干网络,加上交叉注意力机制,结构简单,性能强大,本发明首次将该结构应用到CITE‑seq数据上,还可以辅助单模态数据进行下游任务。

主权项:1.一种基于多组学辅助的单细胞转录组的表示方法,其特征在于,包括以下步骤:1预训练阶段对转录组数据进行RPKM标准化,对蛋白组数据进行CLR标准化;2以每个细胞为单位对转录组数据和蛋白组数据进行输入,数据通过线性层生成分词序列;3对生成的分词序列添加一个基于基因的嵌入向量和基于蛋白产生的嵌入向量;4在训练的过程中,随机遮掩5~15%的分词序列,然后将未遮掩的向量输入到模型的编码器中进行学习,对已编码的基因表达向量和蛋白质组学向量进行融合,通过解码器重建完整的分词序列,当均方误差损失函数趋于稳定时保存预训练模型;5微调阶段提供25~35%的注释完成的细胞类型标签,微调阶段使用预训练模型的编码器,全部数据输入到编码器中,不进行遮掩,微调解码器使之输出正确的标签,当交叉熵损失函数趋于稳定保存微调模型;6预测阶段通过单细胞转录组与蛋白质组的数据,或仅对单细胞转录组学数据,利用微调模型对单个细胞的类型进行预测;7对预测数据进行下游任务分析。

全文数据:

权利要求:

百度查询: 大湾区大学(筹) 一种基于多组学辅助的单细胞转录组的表示方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。