首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种抗菌肽判别器的获取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙大宁波理工学院

摘要:本发明公开了一种抗菌肽判别器的获取方法,涉及抗菌肽识别领域,通过公开的抗菌肽数据库构建多个相似度不同的正样本训练集,并基于roberta‑base模型利用通过各正样本训练集获取正样本目标训练集,通过UniProt蛋白质数据库获取多个负样本训练集,并基于roberta‑base模型利用负样本训练集B、C、D、E获取负样本目标训练集;通过多个负样本训练集获取最优分词策略;并基于最优分词策略,在预选负样本训练集上对各预训练模型进行抗菌肽识别和效果预测确定最优模型主体;通过正样本目标训练集与负样本目标训练集训练最优模型主体得到目标模型主体,通过最优分词策略、目标模型主体与输出层构建出抗菌肽判别器,通过抗菌肽判别器实现了对抗菌肽的准确与智能识别。

主权项:1.一种抗菌肽判别器的获取方法,其特征在于,所述抗菌肽判别器包括输入词嵌入层、目标模型主体与输出层;所述输入词嵌入层用于利用最优分词策略获取肽序列对应的固定维度向量;所述模型主体用于对固定维度向量进行特征提取并输出潜在空间特征向量;所述输出层用于对模型主体输出的潜在空间特征向量进行线性变换、归一化与激活函数的处理,并利用处理后的潜在空间特征向量预测输入的肽序列为抗菌肽的概率,所述潜在空间特征向量表示对输入的肽序列建模的潜在特征空间;所述获取方法包括:通过公开的抗菌肽数据库构建正样本数据集datasetpos,通过正样本数据集datasetpos获取正样本测试集Stest-pos与正样本训练集Strain-pos,通过Strain-pos获取第一正样本训练集、第二正样本训练集与第三正样本训练集;基于roberta-base模型利用Strain-pos、第一正样本训练集、第二正样本训练集与第三正样本训练集获取正样本目标训练集;各正样本训练集之间的相似度不同;通过UniProt蛋白质数据库获取负样本数据集datasetneg,通过datasetneg获取负样本测试集Stest-neg与负样本训练集A、负样本训练集E、负样本训练集D、负样本训练集C、负样本训练集B;所述正样本数据集表示由抗菌肽构成的数据集,负样本数据集表示由非抗菌肽构成的数据集;基于roberta-base模型利用负样本训练集B、C、D、E获取负样本目标训练集;分别基于各预设分词策略,依次在负样本训练集A、B、C上训练各预设模型,以验证各预设分词策略的效果,得到最优分词策略;获取多个预训练模型,并基于最优分词策略,在预选负样本训练集上对各预训练模型进行抗菌肽识别和效果预测得到各预训练模型对应的Accuracy与F1-Score,通过Accuracy与F1-Score确定最优模型主体;通过正样本目标训练集与负样本目标训练集训练最优模型主体得到目标模型主体。

全文数据:

权利要求:

百度查询: 浙大宁波理工学院 一种抗菌肽判别器的获取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。