预测植物lncRNA中sORFs的贝叶斯优化集成学习方法

导航：龙图腾网> 最新专利技术> 预测植物lncRNA中sORFs的贝叶斯优化集成学习方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：大连理工大学

摘要：本发明提出了一种预测植物lncRNA中sORFs的贝叶斯优化集成学习方法，属于生物信息学和机器学习领域。本发明可以对植物长非编码RNAlncRNA中小开放阅读框sORFs有无编码能力进行预测，不仅为lncRNA编码小肽的发现奠定了基础，同时为生物实验验证提供重要参考，有利于揭示生命体性状及抗病抗逆的分子机制，在农林业生产等领域具有重要的价值。

主权项：1.一种预测植物lncRNA中sORFs的贝叶斯优化集成学习方法，其特征在于，该方法包括以下步骤：Step1：利用生物信息学软件和公共数据库获取小开放阅读框sORFs序列数据并进行数据预处理，结合逻辑推理对数据进行进一步筛选，提高数据可信度；Step2：将处理后的sORFs序列翻译成相应的氨基酸序列，对sORFs序列及氨基酸序列分别进行序列及理化性质特征提取，共得到1795维人工特征；Step3：构建结合多卷积池化与SENet模块的MCSENN深度学习模型，提取sORFs序列512维深层特征；步骤Step3具体过程为：3.1：对sORFs序列进行分词处理并进行p-nts编码；3.2：将编码序列输入嵌入层，并进行多尺度卷积池化操作；具体如下：3.2.1：嵌入层将编码序列映射成128×101的矩阵向量，易于卷积操作和特征提取；3.2.2：使用4个不同尺度卷积核代替单一卷积核，充分提取特征，挖掘sORFs序列的有效信息；每个尺度的卷积池化操作过程如下：a选用64个尺度为f的卷积核进行卷积操作，其中，m表示卷积核宽度，f为卷积尺度，即可得到卷积后的特征矩阵C；b对特征矩阵C进行最大池化操作，提取局部区域重要的特征信息P，其中l为特征映射集C的长度，f为卷积核尺度，故以尺度为f的卷积核进行卷积操作后，经池化大小为l-f的max-pooling操作后输出如下：Pil-f＝maxCi,Ci+1,...,Ci+l-f-1，i∈1,2,...,f+1c按照步骤a、b中的方法，对4个尺度的卷积核f1、f2、f3和f4进行卷积池化操作后，将各输出结果进行串联，得出多尺度卷积操作的最终结果V，其表示如下： 3.3：将卷积池化后的数据V输入SENet结构进行特征重标定首先对输入大小为W×H×N的特征图进行压缩操作，得到1×1×N向量；接下来通过两层全连接的bottleneck结构进行激励操作，得到特征图中每个通道的权值，其中缩放参数SERatio设为158，从而减少通道个数，降低计算量；最后是scale操作，将SENet模块计算出来的各通道权重值分别和原有特征向量对应通道的二维矩阵相乘，得出结果输出；3.4：将步骤3.3所得结果输入展平层Flatten，利用展平层Flatten将多维输入一维化，实现从卷积层到全连接层的过渡；3.5：最后经全连接层Dense作用，并利用sigmoid函数将其映射在[0,1]之间，得出预测标签；其中，标签为0，表示没有编码能力；标签为1，表示有编码能力；3.6：将sORFs序列输入MCSENN深度学习模型，提取Flatten层输出，得到512维特征；Step4：利用全相关的Boruta特征选择算法对人工提取的1795维特征进行特征选择，实现特征维度压缩；利用主成分分析PCA算法分别对步骤3中MCSENN深度学习模型提取的特征与步骤2中人工提取的特征进行降维，去除冗余信息；Step5：选择分类效果优秀的XGBoost与LightGBM作为基模型，用贝叶斯优化算法对基模型进行优化，采用逻辑回归LR模型来减少基模型之间的信息冗余，构建集成学习模型sORFPred；Step6：模型训练，在苔藓数据集上采用五折交叉验证进行模型训练和测试，将五次实验得到的性能指标取平均值进行模型性能评估。

全文数据：

权利要求：

百度查询：大连理工大学预测植物lncRNA中sORFs的贝叶斯优化集成学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种转运罐体的箱体

下一篇：一种废弃物收集及处理系统

相关技术

一种转运罐体的箱体

一种废弃物收集及处理系统

一种铰点支座防变形焊接系统

一种高效线扫描光固化成像装置和方法

一种基于视觉定位的无人机自适应高度调节方法

简易式快拆模块化球类器材

无源腰部助力外骨骼

用于人群管理和维护操作的系统和方法

一种冷库用压力平衡装置

显示器下方的光学生物特征成像装置中的传感器位移补偿

一种磨盘组件及谷物粉碎研磨装置

一种监控球形玻璃罩清洗装置及监控系统

sORFs相关技术

预测植物lncRNA中sORFs的贝叶斯优化集成学习方法_大连理工大学_202210310175.7

贝叶斯相关技术

预测植物lncRNA中sORFs的贝叶斯优化集成学习方法_大连理工大学_202210310175.7

基于多变量和贝叶斯网络的交通冲突评估方法及系统_山东大学_202411266146.0

被动合成孔径声纳的贝叶斯稳健DOA估计方法_西北工业大学_202410992713.4

贝莱斯芽孢杆菌菌株及其应用_天津科技大学_202410929781.6

一株贝莱斯芽孢杆菌及其应用_福建农林大学_202410954813.8

基于贝叶斯网络的台风风暴潮灾害链灾变风险评估方法_中国水利水电科学研究院_202410006264.1

一种多维协同迭代的贝叶斯深度学习水位预测方法及系统_浙江禹贡信息科技有限公司_202411259787.3

一种基于贝叶斯不确定性捕捉的文本分类方法_南通大学_202410843275.5

一种基于贝叶斯算法的人体健康数据分析模型及方法_广州市奕经云科技有限公司_202410416794.3

基于特征随机的朴素贝叶斯岩相分类集成学习方法及装置_中国石油大学(北京)_202010613340.7

优化相关技术

一种可见光通信系统的优化方法及优化系统_中国科学院空间应用工程与技术中心_202410857925.1

一种基于几何优化和拓扑优化的网格质量调整方法和系统_浙江远算科技有限公司_202411262378.9

一种山地风电场低电阻优化装置及优化方法_国核电力规划设计研究院重庆有限公司_202410917363.5

优化标志解释的系统和方法_通用汽车环球科技运作有限责任公司_202311415540.1

一种长航时无人机执行任务过程的优化方法和优化系统_中国人民解放军国防科技大学_202410702318.8

一种基于灰狼优化算法的海上风电场运维方案优化方法_贵州大学_202410989806.1

一种物流优化调度管理方法_安徽九瀛物流有限公司_202411041288.7

信号覆盖优化方法、装置、设备和存储介质_北京新润通科技有限公司_202410947355.5

ECU支架、车辆和ECU支架优化设计方法_广州汽车集团股份有限公司_202410891752.5

一种眼底检查图像处理优化方法_山东黄海智能装备有限公司_202411280678.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

预测植物lncRNA中sORFs的贝叶斯优化集成学习方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务