买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国石油大学(华东)
摘要:本发明公开了一种基于人工智能的药物靶点相互作用预测方法及系统,方法包括数据收集、数据预处理、复合特征嵌入和提取、多模态联合学习和药物靶点相互作用预测。本发明涉及药物分析技术领域,具体是指一种基于人工智能的药物靶点相互作用预测方法及系统,本方案采用结合图变压器和图同构改进图神经网络的方法进行特征嵌入和特征提取,通过将两种子网的特征提取结果进行交叉和融合,优化了药物和蛋白质复杂结构和功能信息的特征捕获,提高了预测精度;采用结合交互注意力机制的卷积循环联合神经网络,进行多模态联合学习,通过交互注意力机制确保药物和蛋白质特征的交互和联系性,最后采用计算SHAP值的方法优化可解释性。
主权项:1.一种基于人工智能的药物靶点相互作用预测方法,其特征在于:该方法包括以下步骤:步骤S1:数据收集,得到药物靶点相互作用预测原始数据集;步骤S2:数据预处理,得到标准化相互作用预测数据集;步骤S3:复合特征嵌入和提取,用于提取药物和蛋白质数据相关的全局特征和局部特征,具体为依据所述标准化相互作用预测数据集,采用结合图变压器和图同构改进图神经网络的方法进行特征嵌入和特征提取,得到药物相互作用特征数据,所述结合图变压器和图同构改进图神经网络,具体包括图变压器子块、图同构子网和改进图神经子网;所述图变压器子块,用于通过全局自注意力机制和位置编码,捕捉节点特征间的复杂依赖关系;所述图同构子网,用于提升了对局部分子结构和蛋白质序列的学习能力;所述改进图神经子网,用于优化特征表示并处理全局复杂分子结构特征和蛋白质序列特征;所述采用结合图变压器和图同构改进图神经网络的方法进行特征嵌入和特征提取,得到药物相互作用特征数据的步骤,包括:步骤S31:构建图变压器子块,具体包括以下步骤:步骤S311:构建多头自注意力机制,用于并行处理多个分子空间特征,计算公式为: 式中,Attention·是注意力函数,Q是查询矩阵,K是键矩阵,V是值矩阵,Softmax·是分类器函数,T是转置运算符,dk是维度缩放因子;步骤S312:位置编码,用于表示分子结构和蛋白质序列的全局特征,计算公式为: 式中,PE·是位置编码函数,pos是位置索引,用于表示原子和氨基酸特征,i是特征维度索引,dmodel是特征维度的大小;步骤S313:引入归一化和残差连接,用于稳定梯度,具体为通过归一化层和前馈网络进行归一化和残差连接操作,计算公式为:H=LNEV,ES+FFNEV,ES;式中,H是归一化特征数据,LN·是归一化函数,FFN·是前馈网络函数,EV是原子嵌入特征矩阵,ES是氨基酸嵌入特征矩阵;步骤S32:构建图同构子网,具体包括以下步骤:步骤S321:领域特征聚合,用于融合分子节点和氨基酸序列的特征,计算公式为: 式中,是第k+1层图同构子网的融合特征,MLPk是对应第k层图同构子网的多层感知器标识符,∈k是第k层图同构子网的权值参数,k是图同构子网的层数索引,i′是分子节点特征索引,N是氨基酸序列特征的总数,n是氨基酸序列特征索引,是对应第k层图同构子网的第n个氨基酸序列特征;步骤S322:图同构层级更新,用于聚合不同层次的分子特征,计算公式为:Hk+1=GINConvkHk,A;式中,Hk+1是第k+1层图同构子网的更新聚合特征,GINConvk·是图同构卷积操作,A是邻接矩阵;步骤S33:构建改进图神经子网,具体为构建基本图神经子网,并通过特征融合和注意力融合,进行基本图神经子网的融合特征改进,优化特征表示并处理全局复杂分子结构特征和蛋白质序列特征,具体包括以下步骤:步骤S331:构建基本图神经子网,具体为构建多层感知器作为更新函数,并对分子结构特征的分子节点特征和边特征进行特征聚合,对氨基酸序列中的特征数据进行聚合,得到基本图神经子网特征输出:步骤S332:特征融合,计算公式为:HTotal=[HGAT,HGIN];式中,HTotal是融合子网特征,HGAT是基本图神经子网特征输出,HGIN是图同构子网输出的更新聚合特征,[,]是特征拼接操作运算符;步骤S333:注意力融合,具体为对融合后的融合子网特征应用注意力机制,优化特征表示:步骤S334:多层次特征聚合和归一化,具体为对所述融合子网特征进行多层感知器特征聚合和归一化操作,得到改进融合特征输出,计算公式为:Hout=LNMLPHTotal;式中,Hout是改进融合特征输出,LN·是归一化函数,MLP是多层感知器标识符,HTotal是融合子网特征;步骤S34:子网融合,具体为构建全连接层,将所述改进融合特征输出映射为复合特征输出;步骤S35:复合特征嵌入和提取,具体为通过所述子网融合,进行特征提取模型训练,并采用二元交叉熵损失函数进行模型优化,得到复合特征提取模型,并使用所述复合特征提取模型进行特征嵌入和提取,得到药物相互作用特征数;步骤S4:多模态联合学习,用于进行药物和蛋白质数据的特征融合,并进行交互特征提取和模型训练,具体为依据所述药物相互作用特征数据,采用结合交互注意力机制的卷积循环联合神经网络,进行多模态联合学习,得到多模态相互作用预测模型,具体包括以下步骤:步骤S41:构建交互自注意力机制;步骤S42:构建卷积子网;步骤S43:构建循环子网;步骤S44:多模态联合学习模型训练;步骤S5:药物靶点相互作用预测,结合可解释增强方法进行药物靶点相互作用预测,得到药物靶点相互作用预测数据。
全文数据:
权利要求:
百度查询: 中国石油大学(华东) 一种基于人工智能的药物靶点相互作用预测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。