申请/专利权人:哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
申请日:2023-09-18
公开(公告)日:2024-06-25
公开(公告)号:CN117153260B
主分类号:G16B30/10
分类号:G16B30/10;G06F18/23;G06F18/22;G06F18/2135
优先权:
专利状态码:有效-授权
法律状态:2024.06.25#授权;2023.12.19#实质审查的生效;2023.12.01#公开
摘要:本发明公开了一种基于对比学习的空间转录组数据聚类方法、装置、设备及存储介质,该方法包括:基于空间转录组数据获得加权的特征矩阵和邻接矩阵并构建邻接图;将邻接图分别输入孪生网络结构两个编码器以学习第一节点表示和第二节点表示;基于第一节点表示、第二节点表示构建用于计算对比损失的正样本集;基于节点的软聚类分布和辅助分布计算聚类损失;通过对比损失和聚类损失指导模型训练进而获得聚类结果。通过孪生网络结构进行对比学习获得用于构建正样本集的节点表示,并计算对比损失和聚类损失,并基于节点间的对比损失和聚类损失指导模型训练,如此基于对比学习获得了针对基因转录组数据的数据聚类方法,提高了空间转录组数据聚类的针对性和准确性。
主权项:1.一种基于对比学习的空间转录组数据聚类方法,其特征在于,所述方法包括:对基于空间转录组数据构造的基因表达矩阵进行预处理获得加权的特征矩阵和邻接矩阵,并基于所述加权的特征矩阵和邻接矩阵构建邻接图;将所述邻接图分别输入孪生网络结构的第一编码器和第二编码器,通过所述第一编码器和所述第二编码器学习对应的第一节点表示和第二节点表示;基于所述第一节点表示、所述第二节点表示构建正样本集,并根据所述正样本集计算第二节点表示的节点表示预测值与第一节点表示之间的对比损失;确定每个节点的软聚类分布和辅助分布,并基于所述软聚类分布和辅助分布计算聚类损失;通过所述对比损失和所述聚类损失指导模型训练,模型训练完成后基于所述软聚类分布获得对应节点的聚类结果所述基于所述第一节点表示、所述第二节点表示构建正样本集,并根据所述正样本集计算第二节点表示的节点表示预测值与第一节点表示之间的对比损失包括:基于各个节点的第一节点表示、第二节点表示构建节点的正样本集;基于节点总行数、正样本集内的第一节点表示,以及第二节点表示的节点表示预测值计算对比损失;所述基于所述第一节点表示、所述第二节点表示和空间位置构建正样本集包括:基于目标节点的第二节点表示和其它节点的第一节点表示确定目标节点与其它节点间的余弦相似性;获得每一个目标节点与其它节点间的余弦相似性后,确定每一个目标节点的K-近邻节点集;将目标节点在K-近邻节点集与邻接图中邻居节点的交集确定为局部语义正样本;确定与目标节点属于同一个k-means聚类簇的同类节点,将K-近邻节点集与同类节点的交集确定为全局语义正样本;将所述局部语义正样本与所述全局语义正样本的并集确定为目标节点的正样本集。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于对比学习的空间转录组数据聚类方法、装置及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。