首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于多样子结构特征融合的分子活性预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安电子科技大学

摘要:本发明公开了一种基于多样子结构特征融合的分子活性预测方法,通过提取分子图子结构特征对神经网络进行训练,克服了现有技术中提取子结构闭环,网络预测精度差,计算困难的问题。本发明实现的步骤是:1药物分子信息转化成分子特征矩阵;2挑选初始节点;3获得多个子结构;4计算子结构的相似度;5融合子结构特征矩阵;6训练神经网络;7判断训练神经网络是否收敛;8获得待预测分子活性。本发明具有分辨不同子结构之间的差异性、解决分子图噪声问题和预测分子活性精度高的优点。

主权项:1.一种基于多样子结构特征融合的分子活性预测方法,其特征在于,利用随机游走方法提取分子图多个子结构特征,将融合后的多个子结构特征输入到训练好的多层神经网络预测分子活性,该方法的具体步骤包括:1获得药物分子信息对应的特征矩阵:将一种药物分子中的原子基于字节进行独热编码后,得到独热编码特征矩阵,将该种药物原子之间的键值对表示成邻域特征矩阵,将该种药物分子活性基于字节进行独热编码,得到独热编码标签特征矩阵;2挑选初始节点:2a将药物分子的原子表示成节点,原子之间的化学键表示成连边,药物分子活性表示成分子图标签,由节点、连边和分子图标签组成分子图;2b利用Betweenness方法,计算分子图中每个节点的中心性值,选取节点中心性值最高的节点作为初始节点;3提取分子图多个子结构特征:由初始节点开始,利用随机游走方法,从分子图中挑选小于分子图节点数量的l个无重复节点组成分子图的子结构,利用相同方法挑选出一个子结构集合;4计算子结构的相似度:4a将子结构集合中的每个子结构基于节点编码,得到该子结构的特征矩阵;4b利用相似度公式,计算子结构集合中的每两两子结构的相似度: 其中,Jm,n表示子结构集合中第m个子结构和第n个子结构的相似度,g表示子结构集合中第m个子结构对应的特征矩阵,p表示子结构集合中第n个子结构的特征矩阵,|·|表示矩阵取模操作,∩表示取交集操作,∪表示取并集操作;4c将所有相似度大于或等于阈值的子结构存储到相似集合中,再将剩余的子结构存储到相异集合中,所述阈值是在0.5,1的范围内,根据不同分子图类中节点的数量选取;5融合子结构特征矩阵:将相似集合中所有的子结构特征矩阵平均得到一个融合后的子结构特征矩阵;6训练神经网络:6a从相异集合中任意选取两个子结构特征,将所选的两个子结构特征输入到4层的多层感知机神经网络中,输出预测的分子图标签,利用交叉熵损失函数,计算与该预测的分子图标签对应真实的分子图标签之间的损失值;6b将融合后的子结构特征输入到4层的多层感知机神经网络中,输出预测的分子图标签,利用交叉熵损失函数,计算与该预测的分子图标签对应真实的分子图标签之间的损失值;6c将上面两个损失值叠加,得到训练神经网络的损失值;7判断训练神经网络的损失值是否收敛,若是,停止训练,得到训练好的多层感知机神经网络,执行步骤8,否则,执行步骤3;8将待预测的同类的分子图输入到训练好的多层感知机神经网络中,输出分子图标签,得到与分子图标签对应的活性类型。

全文数据:

权利要求:

百度查询: 西安电子科技大学 基于多样子结构特征融合的分子活性预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。