首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于深度学习结合化学性质的ncRNA家族预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:桂林电子科技大学

摘要:本发明公开了一种度学习模型结合核苷酸化学性质对于ncRNA家族的预测方法,使用的是公共数据库Rfam中的数据集,利用计算核苷酸化学性质与核苷酸密度的方法NCP‑ND对核苷酸序列数据进行编码,使用多尺度注意力机制(MSA)对初始特征向量进行加权,再使用Bi‑LSTM捕获核苷酸序列的上下文特征,进而使用DenseNet来提取核苷酸序列的全局特征,最后通过全连接网络进行多分类;通过正则化等技术来防止模型过拟合,使用十折交叉验证以及独立测试集来对模型进行性能测试。该方法使用NCP‑ND进行特征编码,不需要生物学的先验知识,利用深度学习的计算方法提高了ncRNA家族预测的准确率。

主权项:1.一种基于深度学习结合化学性质的ncRNA家族预测方法,步骤如下:1)数据集获取与整理:从公共数据库Rfam获取13种ncRNA家族的序列数据,使其中一个家族作为正样本,其余家族皆为负样本,每个家族进行这样的操作;2)特征编码:使用NCP-ND(核苷酸化学性质和核苷酸密度)特征编码方法来对核苷酸序列进行编码,具体是将序列中的四个碱基(A、C、G、T)编码为四个长度为3的特征向量(NCP),同时利用碱基的位置信息来计算核苷酸密度作为长度为1的另外一个特征向量(ND),NCP与ND组合将核苷酸序列中位置i的碱基编码为一个四维向量,进而通过该方法编码来提取ncRNA序列的低层特征;3)模型构建:将NCPND编码后的特征向量经过多尺度注意力机制进行加权注意相对重要的低层特征,进而使用Bi-LSTM对加权过的特征捕捉序列的上下文特征,通过DenseNet中的密集块来获得序列的全局特征,最后通过全连接层进行多分类;4)模型调优:采用批量归一化和L2正则化技术对模型优化,以获得最佳预测效果;5)模型评估:采用十折交叉验证和独立测试对模型进行评估,具体使用精确率Precision、召回率Recall、F1分数F1-score和马修斯相关系数(Matthewscorrelationcoefficient作为性能评估指标。

全文数据:

权利要求:

百度查询: 桂林电子科技大学 一种基于深度学习结合化学性质的ncRNA家族预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。