首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于对比学习的TCR与抗原复合物亲和力预测算法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京工业大学

摘要:本发明公布了一种基于自监督对比学习的TCR与抗原复合物亲和力预测算法,包括预训练与预测两个阶段:1对比学习预训练阶段,使用TCR序列作为训练集,对TCR序列的氨基酸计算注意力权重,以一定概率掩盖部分氨基酸产生新的TCR序列,通过Transformer编码器进行编码,生成两条序列的向量表示embedding,然后根据对比学习框架,计算两条序列的余弦相似性,归一化温度‑尺度交叉熵计算损失,使用梯度下降算法进行损失函数优化。2下游预测阶段,操作者将待测试的TCR序列与抗原复合物序列,输入至训练好的Transformer编码器得到向量表示,将特征向量串联后输入到全连接网络中预测TCR与抗原复合物亲和力。

主权项:1.一种基于对比学习的TCR与抗原复合物亲和力预测算法,其特征在于:包括以下步骤:S1:使用训练集中的TCRCDR3序列作为模型输入;S2:基于注意力机制的编码模块对TCR序列的每个氨基酸进行编码,并计算注意力权重;S3:通过修改注意力权重概率掩蔽方式来生成不同的掩蔽TCR序列;S4:将原始TCR序列与掩蔽生成的TCR序列输入到Transformer编码器进行编码,生成两条序列的向量表征hi和hi’;S5:将向量hi和hi’输入到自监督对比学习模块中,该模块使用归一化温度-尺度交叉熵计算对比损失,通过迭代更新参数最小化对比损失,获得训练好的TCR编码器;S6:在预测任务中,训练好的编码器被用于对TCRCDR3序列编码,使用公开的MHC编码器对抗原序列进行编码,将两种序列编码后的特征串联起来,作为预测模块的输入;S7:预测网络使用多层全连接网络,预测TCR和抗原的结合。

全文数据:

权利要求:

百度查询: 南京工业大学 一种基于对比学习的TCR与抗原复合物亲和力预测算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。