买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国海洋大学
摘要:本发明提供一种基于生物信息学的金枪鱼ACE抑制肽的靶向制备与筛查方法,涉及生物靶向制备领域。本发明基于ACE抑制肽数据库建立了一种专门用于ACE抑制肽筛查的深度学习模型,准确度高,损失率低,利用该模型筛查金枪鱼肽文库中的潜在ACE抑制活性肽,分析潜在活性肽的末端氨基酸组成预测最佳酶切位点和特异性酶切组合,利用特异性酶进行水解实验获得的高ACE抑制活性的金枪鱼蛋白水解物,填补了市面上天然高活性降血压产品的空白,进一步利用虚拟筛查方法从该水解物中快速识别高活性ACE抑制肽,从而建立了一种金枪鱼ACE抑制肽靶向制备和快速筛查的方法。
主权项:1.一种基于生物信息学的金枪鱼ACE抑制肽的靶向制备与筛查方法,其特征在于:该基于生物信息学的金枪鱼ACE抑制肽的靶向制备与筛查方法利用一个新建的ACE抑制肽筛查的深度学习模型DeepACE,筛查金枪鱼肽文库中具有ACE抑制活性潜力的肽,根据筛查出ACE抑制活性潜力肽的末端氨基酸组成预测酶切位点和特异性酶切组合,进行水解实验从而提供一种以金枪鱼碎肉为原料靶向制备有ACE抑制活性的水解物的方法,并提供一种从此水解物中利用生物信息学快速筛查高活性ACE抑制肽的方法;所述ACE抑制肽筛查的深度学习模型DeepACE包含一个ACE抑制肽识别模型和一个ACE抑制肽分类模型,所述ACE抑制肽识别模型建立方法步骤如下:S1:构建ACE抑制肽阳性样本库和阴性样本库,用于ACE抑制肽识别模型的训练与验证;S2:使用huggingface的transformer模块调用ESM-2蛋白质预训练模型提取序列特征,该模型是由Facebook公司基于bert模型在UniRef50蛋白质序列数据库上预训练得到;S3:通过固定ESM-2蛋白质预训练模型的参数,额外增加一个多层感知器模块用于在ACE抑制肽数据集上进行微调,以适应分类任务;此过程通过在大规模蛋白质序列数据上预训练,并在下游子任务进行参数微调,能够超过传统的基于小样本数据训练的模型的性能,可选的,该多层感知器包括四个全连接层,前三个全连接层的每一层之后接一个批标准化层Bn层和ReLU激活函数。最后一个全连接层作为输出层,将特征映射到最终的输出空间;S4:对输出特征进行softmax操作,将其转换为概率分布,最终返回预测的分布概率;所述ACE抑制肽分类模型建立方法如下:S1:根据阳性样本中肽的ACE抑制IC50将阳性样本库分为高活性库和低活性库阈值为50μM,用于ACE抑制肽分类模型的训练与验证;S2:使用rdkit的AllChem模块提取肽序列的分子指纹,radius参数和n_features参数分别设置为2和1024,之后使用BiLSTM提取分子指纹特征;S3:使用ESMFold结构预测模型API直接预测输入序列的三维结构,使用MDAnalysis的select_atoms模块提取三维结构的主链结构,接着使用Pyuul模型的VolumeMaker模块获取主链结构的点云表面特征,并使用BiLSTM提取特征;S4:使用huggingface的transformer模块调用ESM-2蛋白质预训练模型提取序列特征;S5:使用Transformer的注意力机制架构将多模态特征进行融合,可选的,将提取的分子指纹特征作为Q,提取的主链结构的点云表面特征作为K和V,使用Transformer的交叉注意力机制融合两者的特征。之后,将融合后的特征作为Q,K,V执行自注意力机制。接着,将经过自注意力机制后的特征作为Q,ESM-2蛋白质预训练模型提取的序列特征作为K和V,并使用交叉注意力机制融合两者的特征;S6:使用多层感知器MLP进行分类,使用softmax输出每个类别的概率;S7:模型的训练与评价:ACE抑制肽识别模型和ACE抑制肽分类模型分别按8:2的比例和9:1的比例将数据集分成训练集和验证集,使用模型在验证集上的准确率指标作为保存模型参数的依据,保留在验证集上准确率最高时的模型参数。ACE抑制肽识别模型在验证集上的准确率为98.8%,ACE抑制肽分类模型在验证集上的准确率为88.2%。
全文数据:
权利要求:
百度查询: 中国海洋大学 一种基于生物信息学的金枪鱼ACE抑制肽的靶向制备与筛查方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。