买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:烟台大学
摘要:本发明涉及基因测序领域,具体为一种基于图压缩的序列到图比对方法、系统、装置、存储介质,获取基因组图和测序序列,将基因组图中的可合并结点进行合并,生成合并结点,对基因组图进行更新后得到压缩图,基于四位二进制标记位对压缩图和测序序列进行碱基编码,引入碱基置换罚分后进行序列到图的比对,得到不同罚分模式下的比对分数,同时基于最佳比对分数位置确定回溯起点,基于回溯起点依次在其相邻位置中选择其比对分数来源方向作为回溯方向进行回溯,得到最佳比对路径,减少了图数据规模,提高了比对效率。
主权项:1.一种基于图压缩的序列到图比对方法,其特征在于,包括以下步骤:S1、获取基因组图和测序序列;S2、基因组图图压缩:遍历基因组图中的所有结点,获取只有一个前驱结点和一个后继结点的结点为待合并结点,如果存在若干个待合并结点拥有共同的前驱结点和后继接结点,则若干个待合并结点为可合并结点,将基因组图中所述可合并结点进行合并,生成合并结点,对基因组图进行更新后得到压缩图;S3、编码:基于四位二进制标记位对压缩图中的合并结点和非合并结点中的碱基进行编码,得到编码后的压缩图;基于四位二进制标记位对测序序列中的每个碱基进行编码,得到编码后的测序序列;S4、序列到图比对:对编码后的压缩图进行拓扑排序,与编码后的测序序列进行偏序比对,基于比对结果、预先设定的匹配罚分和不匹配罚分引入碱基置换罚分,基于引入的碱基置换罚分分别得到线性罚分、仿射罚分和双仿射罚分模式下的比对分数,基于比对分数确定编码后的压缩图拓扑排序后最末端的结点和编码后的测序序列中最末端碱基的比对分数为最佳比对分数;S5、基于所述比对分数构建二维方向的回溯矩阵,基于最佳比对分数位置确定回溯起点,基于回溯起点依次在其相邻位置中选择其比对分数来源方向作为回溯方向进行回溯,得到最佳比对路径,基于最佳比对路径进行序列到图的比对。
全文数据:
权利要求:
百度查询: 烟台大学 基于图压缩的序列到图比对方法、系统、装置、存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。