首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种跨物种单细胞注释方法 

申请/专利权人:苏州大学

申请日:2024-05-07

公开(公告)日:2024-07-05

公开(公告)号:CN118298926A

主分类号:G16B40/00

分类号:G16B40/00;G16B20/00;G06N3/042;G06N3/0455;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.23#实质审查的生效;2024.07.05#公开

摘要:本发明提供了一种跨物种单细胞注释方法,包括步骤:S1.数据质量控制和标准化;S2.筛选节点基因和特征基因,构建异构图网络;所述特征基因通过跨物种数据集的差异表达基因和跨物种一对一、一对多及多对多同源关系计算得到;S3.在异构图中使用基于元路径邻居整合跨物种细胞间信息得到输入特征;S4.跨物种单细胞数据整合和多阶段训练:将多个元路径特征输入到模型中进行数据整合和多阶段训练,注释跨物种单细胞类别。本发明特征基因筛选中加入多种基因同源关系,并通过细胞‑基因异构图建立基因同源关系的子图,通过Transformer模型整合基于元路径邻居生成的特征和多阶段训练进行数据增广,提高了跨物种单细胞注释精度。

主权项:1.一种跨物种单细胞注释方法,其特征在于,包括以下步骤:S1.数据质量控制和标准化:分别对跨物种数据集中各物种细胞信息和细胞中各基因表达信息数据集分别进行过滤,去除异常细胞和异常表达基因;然后对每个数据集进行归一化;S2.构建异构图网络:使用主成分分析方法对步骤S1所述跨物种数据集进行降维,在跨物种数据集中分别对参考数据集和待测数据集做物种内部K-近邻以及对参考数据集和待测数据集间做物种间相互最近邻,筛选节点基因和特征基因,构建包括细胞-细胞图网络、基因-基因图网络和细胞-基因图网络的异构图网络;所述特征基因通过以下方法计算:通过跨物种数据集的差异表达基因和跨物种同源关系计算得到跨物种的特征基因;所述跨物种同源关系包括基因间一对一,一对多及多对多同源关系;S3.生成输入特征:根据构建的异构图网络,通过定义元路径,使用基于元路径邻居的整合方法,进行跨物种细胞间信息的整合,得到一组元路径特征矩阵,作为模型的输入特征;S4.跨物种单细胞数据整合和多阶段训练:将多个元路径特征输入到基于Transformer整合特征的模型中进行数据整合,进行多阶段训练,在每次训练中降低模型损失函数,提高训练集准确率评价,对跨物种单细胞类别注释。

全文数据:

权利要求:

百度查询: 苏州大学 一种跨物种单细胞注释方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。