首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

预测植物lncRNA中sORFs的贝叶斯优化集成学习方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:大连理工大学

摘要:本发明提出了一种预测植物lncRNA中sORFs的贝叶斯优化集成学习方法,属于生物信息学和机器学习领域。本发明可以对植物长非编码RNAlncRNA中小开放阅读框sORFs有无编码能力进行预测,不仅为lncRNA编码小肽的发现奠定了基础,同时为生物实验验证提供重要参考,有利于揭示生命体性状及抗病抗逆的分子机制,在农林业生产等领域具有重要的价值。

主权项:1.一种预测植物lncRNA中sORFs的贝叶斯优化集成学习方法,其特征在于,该方法包括以下步骤:Step1:利用生物信息学软件和公共数据库获取小开放阅读框sORFs序列数据并进行数据预处理,结合逻辑推理对数据进行进一步筛选,提高数据可信度;Step2:将处理后的sORFs序列翻译成相应的氨基酸序列,对sORFs序列及氨基酸序列分别进行序列及理化性质特征提取,共得到1795维人工特征;Step3:构建结合多卷积池化与SENet模块的MCSENN深度学习模型,提取sORFs序列512维深层特征;Step4:利用全相关的Boruta特征选择算法对人工提取的1795维特征进行特征选择,实现特征维度压缩;利用主成分分析PCA算法分别对步骤3中MCSENN深度学习模型提取的特征与步骤2中人工提取的特征进行降维,去除冗余信息;Step5:选择分类效果优秀的XGBoost与LightGBM作为基模型,用贝叶斯优化算法对基模型进行优化,采用逻辑回归LR模型来减少基模型之间的信息冗余,构建集成学习模型sORFPred;Step6:模型训练,在苔藓数据集上采用五折交叉验证进行模型训练和测试,将五次实验得到的性能指标取平均值进行模型性能评估。

全文数据:

权利要求:

百度查询: 大连理工大学 预测植物lncRNA中sORFs的贝叶斯优化集成学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。