首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于迁移学习的TCR-表位结合预测方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:常州大学

摘要:本发明公开了一种基于迁移学习的TCR‑表位结合预测方法,包括:获取TCR序列数据集,对所述TCR序列数据集进行数据处理,通过对TCR序列过滤得到表位序列,通过动态训练策略得到训练集和测试集;训练自回归编码器模型和ProtBert模型,并对TCR序列和表位序列进行特征提取,得到TCR序列特征和表位序列特征;对所述TCR序列特征和表位序列特征通过二维直方图进行数据转换,并输入到二维卷积网络中输出向量,将输出向量输入到全连接网络,得到第一输出向量,同时将二维卷积网络中输出向量合并,得到第二路网络;将第一输出向量和第二路网络通过多头注意力策略合并,对合并向量进行扁平化处理,得到全连接网络的输入,提高了TCR‑表位结合任务的预测准确性。

主权项:1.一种基于迁移学习的TCR-表位结合预测方法,其特征在于,包括:获取TCR序列数据集,对所述TCR序列数据集进行数据处理,通过对TCR序列过滤得到表位序列,通过动态训练策略得到训练集和测试集;训练自回归编码器模型和ProtBert模型,并对TCR序列和表位序列进行特征提取,得到TCR序列特征和表位序列特征;对所述TCR序列特征和表位序列特征通过二维直方图进行数据转换,并输入到二维卷积网络中输出向量,将输出向量输入到全连接网络,得到第一输出向量,同时将二维卷积网络中输出向量合并,得到第二路网络;将第一输出向量和第二路网络通过多头注意力策略合并,对合并向量进行扁平化处理,得到全连接网络的输入;所述通过动态训练策略得到训练集和测试集,包括,从数据集中读取TCR和表位数据,初始化空列表存储新的TCR和表位数据,遍历每个TCR和表位对,将TCR和表位添加到字典中,并计算表位的频率分布;二次遍历每个TCR和表位对,将原始的TCR和表位添加到列表中,每个TCR序列,根据字典中每个表位的频率分布,从原始表位中选择一个表位序列结合作为负样本对,将新的TCR和表位数据添加到初始化的空列表中,新配对的负样本集中的表位序列频率分布要与正样本集相同;创建一个新的数据框,将原始的正样本和生成的负样本数据以及标签添加到数据框中,将数据框保存为输出文件作为训练集;所述输入到二维卷积网络中输出向量,将输出向量输入到全连接网络,得到第一输出向量,同时将二维卷积网络中输出向量合并,得到第二路网络,包括,将表位序列特征和TCR序列特征分别输入到二维卷积网络中,将两路的输出数据合并,进行向量展开,输入到三层全连接网络,得到第一输出向量;通过一层二维卷积,得到卷积网络数据的两个分支,第一个分支连接到多个二维卷积网络,输出第二输出向量,第二个分支通过多个卷积网络,输出第三输出向量,将第二输出向量与第三输出向量合并,得到第二路网络。

全文数据:

权利要求:

百度查询: 常州大学 一种基于迁移学习的TCR-表位结合预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。