Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种融合序列及网络嵌入的病毒宿主蛋白-蛋白相互作用预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:辽宁大学

摘要:一种融合序列及网络嵌入的病毒宿主蛋白‑蛋白相互作用预测方法,步骤1:对数据进行预处理;步骤2:使用Doc2vec方法提取病毒及宿主蛋白质序列特征,对蛋白质序列进行矢量化;步骤3:构建宿主蛋白‑蛋白相互作用网络及病毒蛋白质序列相似性网络;步骤4:使用Node2vec算法提取上述两个网络的特征,将网络矢量化后与序列特征进行数量积;步骤5:根据得到的融合上述两种特征的矩阵,构建长短期记忆网络进行训练,将训练好的模型用于预测。本发明考虑到了蛋白质相互作用的网络特征,利用Node2vec模型对蛋白质相互作用网络特征建模,将网络特征与序列特征融合起来,更好地提高了病毒宿主蛋白‑蛋白相互作用预测的正确率。

主权项:1.一种融合序列及网络嵌入的病毒宿主蛋白-蛋白相互作用预测方法,其特征在于,包括以下步骤:步骤1:对数据进行预处理;步骤2:使用Doc2vec方法提取病毒及宿主蛋白质序列特征,对蛋白质序列进行矢量化;步骤2.1:使用来自SwissProt数据库的长度在30到5000个氨基酸之间的非冗余蛋白质序列,并去除序列相似性0.5的冗余序列,剩余序列作为训练Doc2vec模型的语料库,训练Doc2vec模型;步骤2.2:使用训练完的Doc2vec模型获取病毒及宿主蛋白质序列特征,得到病毒及宿主蛋白质序列向量;步骤3:构建宿主蛋白-蛋白相互作用网络及病毒蛋白质序列相似性网络;步骤3.1:根据宿主蛋白质相互作用数据生成宿主蛋白质-蛋白质之间的相互作用网络;步骤3.2:利用Smith-Waterman算法计算各病毒蛋白质之间的相似性,计算方法如下: 其中,LSli,lj为针对蛋白质构建的相似性矩阵;swli,lj表示两个蛋白质序列的相似性;步骤4:使用Node2vec算法提取上述两个网络的特征,将网络矢量化后与序列特征进行数量积;步骤4.1:通过超参数p和q来控制随机游走的策略,采样获取宿主蛋白质相互作用网络节点序列,其中两个节点之间的转移概率为:πvx=αpqt,x·ωvx2其中,v是当前的节点,t是v的上一步所在节点,x代表下一步的位置,ω为两节点的边的权重,α为搜索偏置,定义为: 其中,p和q为超参数,dtx代表t和x之间的最短距离;步骤4.2:节点序列通过Skip-Gram模型得到每个节点的网络特征,计算方法如下: 其中:但由于其计算代价高,采用负采样技术优化;步骤4.3:将得到宿主蛋白质相互作用网络特征与步骤2得到的宿主蛋白质序列特征进行数量积;步骤4.4:同样采用步骤4.1和步骤4.2中的方法,对病毒蛋白质序列相似性网络进行网络特征提取,将提取后的网络特征与序列特征进行数量积;步骤5:根据得到的融合上述两种特征的矩阵,构建长短期记忆网络进行训练,将训练好的模型用于预测。

全文数据:

权利要求:

百度查询: 辽宁大学 一种融合序列及网络嵌入的病毒宿主蛋白-蛋白相互作用预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

-相关技术