首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于二级结构特征编码的药物-蛋白亲和力预测方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:武汉大学

摘要:本发明提供了一种基于二级结构特征编码的药物‑蛋白亲和力预测方法及装置,其中的方法包括:S1:将蛋白氨基酸序列和药物序列进行二级结构切分并向量化。S2:将得到的向量X进行随机掩码得到Xm。S3:搭建多头注意力模型。S4:输入Xm,训练预测模型A,以预测掩码的二级结构为训练目标,直至模型收敛。S5:在模型A的基础上增加分数拟合层。S6:输入X,训练拟合模型B,以预测药物蛋白亲和分数为训练目标,直至模型收敛。S7:将需要预测的药物和蛋白输入模型B,并预测得到亲和分数。本发明使用基于二级结构特征编码的药物蛋白亲和分数预测方法,进行药物的虚拟筛选,为后续生物实验提供指导和减少工作量,加速新药研发。

主权项:1.基于二级结构特征编码的药物-蛋白亲和力预测方法,其特征在于,包括:S1:获取蛋白氨基酸序列和药物SMILES序列,对蛋白氨基酸序列和药物SMILES序列进行拼接,并根据二级结构进行切分,转换得到代表蛋白和药物序列的向量X;S2:将X进行随机掩码,得到部分二级结构掩码表示Xm;S3:搭建多头注意力模型,作为预测模型A,随机初始化预测模型A中的参数;S4:将Xm作为训练数据输入预测模型A,对预测模型A进行训练,以预测掩码的二级结构为训练目标,直至预测模型A收敛,得到训练好的预测模型A;S5:在预测模型A的基础上增加分数拟合层,作为拟合模型B,并以训练好的模型A作为初始化参数;S6:将X作为训练数据输入拟合模型B,对拟合模型B进行训练,以预测药物蛋白亲和分数为训练目标,直至拟合模型B收敛,得到训练好的拟合模型B;S7:将需要预测的药物和蛋白输入训练好的拟合模型B,进行药物-蛋白亲和力预测;步骤S1中根据二级结构进行切分的方法为:使用FCS算法挖掘序列中的多个二级结构,并整理得到二级结构的词表,FCS算法为二级结构挖掘算法;将词表中的二级结构作为序列中的最小单位,并根据词表序号对蛋白氨基酸序列和药物SMILES序列中的二级结构进行替换,得到代表蛋白和药物序列的向量X。

全文数据:

权利要求:

百度查询: 武汉大学 基于二级结构特征编码的药物-蛋白亲和力预测方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

-相关技术