恭喜上海算法创新研究院;北京深势科技有限公司温翰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上海算法创新研究院;北京深势科技有限公司申请的专利一种用于mRNA的多任务处理模型的处理方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119207568B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411470050.6,技术领域涉及:G16B30/00;该发明授权一种用于mRNA的多任务处理模型的处理方法和装置是由温翰;李永歌;顾睿初;王喜;龚禹桥;司端淼;张林峰设计研发完成,并于2024-10-21向国家知识产权局提交的专利申请。
本一种用于mRNA的多任务处理模型的处理方法和装置在说明书摘要公布了:本发明实施例涉及一种用于mRNA的多任务处理模型的处理方法和装置,所述方法包括:构建多任务处理模型;对多物种的mRNA序列以及对应的Ribo‑seq序列进行数据采集,并基于采集数据训练多任务处理模型;并在训练结束后将用户输入的mRNA序列和Ribo‑seq序列转换成对应向量输入多任务处理模型进行预测得到对应的核糖体密度翻译效率翻译延伸速率翻译阻碍点预测向量;并根据得到的预测向量用户输入的Ribo‑seq序列进行校正、对用户输入的mRNA序列进行核糖体高密度区、高效翻译区、延伸速率变化区以及潜在阻碍点标记。通过本发明可以提高数据获取效率、提高Ribo‑seq数据质量、提高预测的物种泛化性。
本发明授权一种用于mRNA的多任务处理模型的处理方法和装置在权利要求书中公布了:1.一种用于mRNA的多任务处理模型的处理方法,其特征在于,所述方法包括:构建一个用于对mRNA序列的核糖体密度、翻译效率、翻译延伸速率和翻译阻碍点进行预测的多任务处理模型;对多个物种的所述mRNA序列以及对应的Ribo-seq序列进行数据采集并基于采集数据构建第一数据集;并基于所述第一数据集对所述多任务处理模型进行模型训练;所述mRNA序列由多个碱基单元顺序排序而成;所述Ribo-seq序列的序列长度与对应的所述mRNA序列的序列长度一致;所述Ribo-seq序列由多个核糖体足迹计数值顺序排序而成,所述核糖体足迹计数值与所述碱基单元一一对应;模型训练结束后,接收用户输入的第一mRNA序列和第一Ribo-seq序列;对所述第一mRNA序列和所述第一Ribo-seq序列进行向量转换得到对应的第一mRNA向量和第一Ribo-seq向量;并由所述多任务处理模型根据所述第一mRNA向量和所述第一Ribo-seq向量进行核糖体密度、翻译效率、翻译延伸速率和翻译阻碍点预测处理得到对应的第一核糖体密度向量、第一翻译效率向量、第一翻译延伸速率向量和第一翻译阻碍点向量;根据所述第一核糖体密度向量对所述第一Ribo-seq序列进行校正;并根据所述第一核糖体密度向量、所述第一翻译效率向量、所述第一翻译延伸速率向量和所述第一翻译阻碍点向量对所述第一mRNA序列进行核糖体高密度区、高效翻译区、延伸速率变化区以及潜在阻碍点标记;并将校正后的所述第一Ribo-seq序列以及带有标记的所述第一mRNA序列向用户反馈;其中,所述多任务处理模型用于根据输入的mRNA向量A和Ribo-seq向量B进行核糖体密度、翻译效率、翻译延伸速率和翻译阻碍点预测处理并输出对应的核糖体密度预测向量PD、翻译效率预测向量PE、翻译延伸速率预测向量PV和翻译阻碍点预测向量PS;所述mRNA向量A与一个所述mRNA序列对应,由多个碱基编码ai顺序排序而成,1≤i≤NA,NA为当前mRNA序列的序列长度;所述碱基编码ai与所述当前mRNA序列的所述碱基单元一一对应;所述Ribo-seq向量B与所述当前mRNA序列的所述Ribo-seq序列对应,由NA个足迹编码bi顺序排序而成;所述足迹编码bi与当前Ribo-seq序列的所述核糖体足迹计数值一一对应、与所述碱基编码ai一一对应;所述核糖体密度预测向量PD由NA个核糖体密度di顺序排序而成;所述核糖体密度di与所述碱基编码ai一一对应;所述翻译效率预测向量PE由NA个翻译效率ei顺序排序而成;所述翻译效率ei与所述碱基编码ai一一对应;所述翻译延伸速率预测向量PV由NA个翻译延伸速率vi顺序排序而成;所述翻译延伸速率vi与所述碱基编码ai一一对应;所述翻译阻碍点预测向量PS由NA个翻译点类型si顺序排序而成;所述翻译点类型si与所述碱基编码ai一一对应;所述翻译点类型si包括阻碍点和非阻碍点两种类型;所述多任务处理模型的第一模型输入端和第二模型输入端分别用于接收对应的所述mRNA向量A和所述Ribo-seq向量B,第一模型输出端、第二模型输出端、第三模型输出端和第四模型输出端分别用于输出对应的所述核糖体密度预测向量PD、所述翻译效率预测向量PE、所述翻译延伸速率预测向量PV和所述翻译阻碍点预测向量PS;所述多任务处理模型包括特征融合模块、Uni-RNA模型、核糖体密度预测头、翻译效率预测头、翻译延伸速率预测头和翻译阻碍点预测头;所述特征融合模块的第一、第二输入端分别与对应的所述第一、第二模型输入端连接,输出端与所述Uni-RNA模型的输入端连接;所述Uni-RNA模型的输出端分别与所述核糖体密度预测头、所述翻译效率预测头、所述翻译延伸速率预测头和所述翻译阻碍点预测头的输入端连接;所述核糖体密度预测头、所述翻译效率预测头、所述翻译延伸速率预测头和所述翻译阻碍点预测头的输出端分别与对应的所述第一、第二、第三和第四模型输出端连接;所述特征融合模块用于按所述Uni-RNA模型对应的输入嵌入层的编码方式对所述mRNA向量A和所述Ribo-seq向量B分别进行编码生成对应的第一、第二编码向量;并将所述第一、第二编码向量的哈达玛积向量作为对应的融合特征向量X向所述Uni-RNA模型发送;所述融合特征向量X由NA个融合特征xi顺序排序而成;所述Uni-RNA模型已完成预训练;所述Uni-RNA模型用于对所述融合特征向量X进行特征编码处理得到对应的编码特征向量Y向所述核糖体密度预测头、所述翻译效率预测头、所述翻译延伸速率预测头和所述翻译阻碍点预测头分别发送;所述核糖体密度预测头基于一类非线性回归预测模型实现;所述核糖体密度预测头用于根据所述编码特征向量Y对各碱基单元位置上的核糖体密度进行预测得到对应的所述核糖体密度预测向量PD;所述非线性回归预测模型至少包括MLP模型、NNR模型、GBDT模型和XGBoost模型;所述翻译效率预测头基于一类所述非线性回归预测模型实现;所述翻译效率预测头用于根据所述编码特征向量Y对各碱基单元位置上的翻译效率进行预测得到对应的所述翻译效率预测向量PE;所述翻译延伸速率预测头基于一类所述非线性回归预测模型实现;所述翻译延伸速率预测头用于根据所述编码特征向量Y对各碱基单元位置上的翻译延伸速率进行预测得到对应的所述翻译延伸速率预测向量PV;所述翻译阻碍点预测头基于一种二分类模型实现;所述翻译阻碍点预测头用于根据所述编码特征向量Y对各碱基单元位置点是否为一个翻译阻碍点进行二分类识别得到对应的所述翻译阻碍点预测向量PS;所述二分类模型至少包括基于MLP模型实现的二分类器、基于CNN模型实现的二分类器、基于决策树模型实现的二分类器、基于随机森林模型实现的二分类器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海算法创新研究院;北京深势科技有限公司,其通讯地址为:201306 上海市浦东新区南汇新城镇环湖西一路333号城投大厦1号楼2楼219室、221室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。