买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:厦门大学
摘要:本申请提出了一种基于二维分子图的分子类药性无监督预测方法及装置,其中,该方法包括:首先,在大量包括类药和非类药分子的数据库ChEMBL上,通过原子掩码预测和化学键掩码预测的预训练任务训练教师模型,使其学到了和类药性高度相关的分子拓扑结构的特征;然后,仅在药物数据上蒸馏出一个与教师模型结构相同的学生模型;接着,将一个任意分子分别输入到教师模型和学生模型,并将两个模型输出的特征表示的差距作为这个任意分子的类药性分数;最后,根据类药性分数对这个任意分子的类药性进行预测,以得到预测结果;由此,通过训练好的教师模型和学生模型能够直接捕捉和类药性高度相关的分子特征,同时极大地缓解了一维序列模型的长度偏差问题。
主权项:1.一种基于二维分子图的分子类药性无监督预测方法,其特征在于,包括以下步骤:获取第一训练数据集,其中,所述第一训练数据集包括类药分子的二维分子图和非类药分子的二维分子图;将所述第一训练数据集输入到预先构建的教师模型,并采用掩码预测对所述教师模型进行预训练,以得到预训练好的教师模型;获取第二训练数据集,其中,所述第二训练数据集仅包括药物分子的二维分子图;将所述第二训练数据集输入到所述预训练好的教师模型以得到第一原子表示,以及将所述第二训练数据集输入到预先构建的与所述教师模型结构相同的学生模型以得到第二原子表示,并最小化所述第一原子表示和所述第二原子表示之间的距离以更新所述学生模型的参数,以得到训练好的学生模型;获取待预测分子的二维分子图,将所述待预测分子的二维分子图输入到所述预训练好的教师模型以得到第三原子表示,以及将所述待预测分子的二维分子图输入到所述训练好的学生模型以得到第四原子表示,根据所述第三原子表示和所述第四原子表示计算所述待预测分子的类药性分数;根据所述类药性分数对所述待预测分子的类药性进行预测,以得到预测结果。
全文数据:
权利要求:
百度查询: 厦门大学 基于二维分子图的分子类药性无监督预测方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。