恭喜湘潭大学张园获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜湘潭大学申请的专利基于生成对抗网络数据生成的蛋白质突变稳定性预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119360959B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411957506.1,技术领域涉及:G16B20/50;该发明授权基于生成对抗网络数据生成的蛋白质突变稳定性预测方法是由张园;邓竣升;胡凯;高协平设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本基于生成对抗网络数据生成的蛋白质突变稳定性预测方法在说明书摘要公布了:本发明公开了一种基于生成对抗网络数据生成的蛋白质突变稳定性预测方法,属于生物信息技术领域,包括以下步骤:构建蛋白质突变数据集;对Megascale数据集以及蛋白质突变数据集提取蛋白质特征;对生成对抗网络进行五折交叉验证,并保存生成器G;通过生成器G生成突变样本;构建下游任务网络模型;通过自适应梯度法优化下游任务网络模型参数;通过验证集计算评价指标验证模型性能;通过下游任务网络模型实现预测。本发明应用生成对抗网络生成蛋白质突变样本,有效解决了蛋白质稳定性研究中的数据稀缺问题;生成对抗机制结合循环一致性损失,确保了生成数据的高质量,并成功扩充了数据集,提升了模型对不同突变类型的适应能力。
本发明授权基于生成对抗网络数据生成的蛋白质突变稳定性预测方法在权利要求书中公布了:1.一种基于生成对抗网络数据生成的蛋白质突变稳定性预测方法,其特征在于,包括以下步骤:S1:手动构建蛋白质突变数据集;S2:分别对Megascale数据集以及步骤S1构建的蛋白质突变数据集提取蛋白质特征,得到Megascale特征数据集和蛋白质突变特征数据集,并将蛋白质突变特征数据集划分为训练集、验证集和测试集;所述步骤S2中,对于Megascale数据集中的样本,选择突变氨基酸及其周围的16个氨基酸,提取所有氨基酸的结构和序列信息后,将突变氨基酸作为节点,周围的16个氨基酸之间的相互作用作为边,分别构建突变前后样本的完全图,从而得到Megascale特征数据集;S3:使用步骤S2获取的Megascale特征数据集对生成对抗网络进行五折交叉验证,并保存训练完成后的生成器G;所述步骤S3中的生成对抗网络包含了两个生成器G、F和两个判别器DX、DY,均通过自适应特征传播机制提取信息;首先使用Megascale数据集训练判别器DX和DY,使DX和DY能够判别是否为真实样本,然后再训练生成器G和F,使得生成器G将突变前的特征样本根据标签信息转换为突变后的特征样本,并生成突变所导致的稳定性变化值,从而欺骗判别器DY,生成器F将突变后的特征样本根据标签信息转换为突变前的特征样本,从而欺骗判别器DX;S4:通过生成器G生成突变样本,并将生成的突变样本与步骤S2中的训练集和验证集结合,得到新的训练集和验证集;S5:构建下游任务网络模型,并使用步骤S4得到的新的训练集对下游任务网络模型进行训练;S6:利用均方误差损失函数得到下游任务网络模型整体损失值,并通过自适应梯度法来优化下游任务网络模型参数;S7:将步骤S4得到的新的验证集输入到已训练完成的下游任务网络模型中,使用皮尔逊相关系数PCC和均方根误差RMSE计算得到验证集的预测性能;S8:将步骤S2中的测试集输入到下游任务网络模型,实现对蛋白质突变稳定性的预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湘潭大学,其通讯地址为:411105 湖南省湘潭市西郊;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。