首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于双重协同机制的蛋白质相互作用预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国海洋大学

摘要:本发明涉及蛋白质预测技术领域,特别涉及一种基于双重协同机制的蛋白质相互作用预测方法。本发明通过利用蛋白质结构对之间的交互注意力,将蛋白质协同引入到孪生架构中,实现了蛋白质之间的相互作用知识共享。本发明提出基于交互注意力的蛋白协同机制,使得一个蛋白内关键残基的判定不仅依赖于自身特征,还依赖于其协作蛋白,从而实现了两个蛋白质间的知识共享,进一步提高了模型的相互作用预测准确性。本发明将蛋白质功能预测任务和亚细胞位置预测任务引入到蛋白质相互作用预测模型的训练过程中,从而使得一对蛋白质间共享的知识能够在不同任务中得到互补,进一步提高了模型的相互作用预测准确性。

主权项:1.一种基于蛋白协同和任务协同的蛋白质相互作用预测方法,其特征在于,包括以下步骤:步骤一:残基接触图的构建首先,根据AlphaFold2所预测的蛋白结构中Alpha-C的三维坐标,计算任意一对残基之间的欧式距离;接着,若残基i和残基j之间的欧氏距离di,j小于预设阈值t,则将其视为接触,依次类推,从而得到完整的接触图,其被定义为: 其中,A∈RN×N表示残基接触图,N为残基数量,阈值t经实验测定,被设置为残基接触图A∈RN×N被看作邻接矩阵,用于表示蛋白质二维结构内残基间的连接关系;步骤二:构建预训练的残基嵌入将长度为N的蛋白序列送入预训练好的ESM-2中,通过ESM-2将蛋白内的任何残基转化为连续的向量,其尺寸为1×1280;由于ESM-2对蛋白共进化信息、功能位点等知识的隐式学习能力,所获得的向量包含了丰富的与蛋白相互作用相关的先验知识,可以直接作为残基嵌入;在此基础上,由堆叠的残基嵌入组成的特征矩阵X∈RN×1280转移到下游的蛋白质任务中;步骤三:利用孪生图注意力层提取蛋白结构特征经过步骤一、二,一对蛋白质可以被表示成两个蛋白质图和其中V1和V2分别为和的残基结点的集合,A1和A2分别为和的邻接矩阵,X1和X2分别为和的特征矩阵;在此基础上,孪生图注意力层被应用,以提取该蛋白质对的结构特征;步骤四、基于交互注意力的蛋白协同经过上述步骤,获得蛋白质对更新后的特征表示,即X1′和X2′,然而,每种表示的更新只考虑了各自内在的结构或拓扑特征,却忽略了其协同蛋白对自身的信息增强,因此,交互注意力被引入来实现蛋白间的协同,从而促进它们的知识共享;交互注意力的关键是注意力分数的计算,它的计算充分结合了蛋白质对中两个蛋白各自的特征和对此,设计了三个不同的策略用于注意力分数的计算: 其中,和分别表示第一个蛋白中的第i个残基嵌入和第二个蛋白中第j个残基嵌入,d表示特征维度,·T和⊙分别表示转置和哈达玛积,U∈Rd×d,V∈Rd×d和w∈R1×d分别是三组可学习的模型参数,用于对和进行可学习的线性映射,从而使得第二个蛋白中第j个残基对第一个蛋白中的第i个残基的注意力分数qij可以被得到;之后进行SoftMax操作后,获得一对蛋白质的概率向量形式的最终交互注意力分数: 其中,exp是以自然常数e为底的指数函数。这样,通过第二个蛋白对第一个蛋白中第i个残基的注意力分数和第一个蛋白对第二个蛋白中第j个残基的注意力分数的计算,蛋白质相互作用的知识在蛋白质对之间被充分共享,使得每个蛋白中对相互作用贡献更大的残基可以根据其协同蛋白被识别出来;最后,将两个注意力得分与原始蛋白质表示和相乘,进行残基重要性的调整,从而实现蛋白质对的协同: 步骤五、基于同构多任务学习的任务协同将步骤四得到的蛋白质对的表示s1和s2直接被输入到全连接分类器中进行二进制相互作用预测,本步骤引入具有蛋白质功能预测和亚细胞位置预测两个辅助任务的同构多任务学习,以共同微调孪生注意力层的可学习参数,从而实现任务协同,促进多个生物领域的知识互补,提高相互作用预测模型的泛化能力。

全文数据:

权利要求:

百度查询: 中国海洋大学 一种基于双重协同机制的蛋白质相互作用预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。