首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于高通量染色体构象捕获的超大染色体组装方法及应用 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西北工业大学

摘要:本发明公开了一种基于高通量染色体构象捕获的超大染色体组装方法及应用,涉及生物信息学和生物技术领域。所述方法包括将待组装测序数据通过Hi‑C文库比对到contig版本的基因组,并对contig错误片段进行打断,然后进行第一轮组装;对每个bins进行第二轮组装;将所有bins中的scaffolds合并后进行第三轮组装;分别对每条染色体进行第四轮组装,并对每条染色体中contigs再次调整,得到各个染色体的挂载结果。本发明通过染色体分段进行Juicebox手动调整,解决了针对超大或contig数目过万基因组遇到的Juicebox程序冻结卡顿问题。

主权项:1.一种基于高通量染色体构象捕获的超大染色体组装方法,其特征在于,包括以下步骤:将待组装测序数据通过Hi-C文库比对到contig版本的基因组,并对contig错误片段打断,进行第一轮组装;按第一轮组装结果中的contigs进行划分,分为10个或10以上的bins,对每个bins进行第二轮组装,并将contigs组装为scaffolds,获得各个bin的scaffolds;将所有bins中的scaffolds合并后进行第三轮组装,并对scaffolds的顺序进行调整,将调整后的scaffolds划分到多条染色体中;将每条染色体的scaffolds重新打断为contigs,分别对每条染色体的contigs进行第四轮组装,并对每条染色体中contigs再次调整,采用3D-DNA软件挂载出最终的染色体;其中,第一轮组装、第二轮组装、第三轮组装以及第四轮组装均采用3D-DNA软件;将contigs组装为scaffolds时,利用Hi-C技术所做的互作图,根据contigs之间相互作用的强度手动调整contigs的排序组装scaffolds;手动调整contigs的排序组装scaffolds时,采用Juicebox软件进行调整;采用Juicebox软件手动调整contigs的排序组装scaffolds的步骤包括:步骤(1)在Juicebox中打开需要用到的Hi-C组装互作图,并且导入assembly文件;步骤(2)若出现某一个点,其左上角和右下角没有任何相关系数的点,则说明该点上游和下游的序列之间缺乏物理接近性,即拼接错误,随后将选择有问题的contig插入到和其自身相关的区域,如果插入的区域出现显示的相关性图画与上游和下游形成的图画呈现垂直状态,则需要将刚刚插入的contig进行翻转;步骤(3)对于所有位置不合适的contigs,按照步骤(2)进行重复;对scaffolds的顺序进行调整时,采用Juicebox软件进行调整;对每条染色体中contigs再次调整的步骤包括:运行Juicebox软件对每条染色体上的contigs进行调整,将位置不合适的contig进行手动调整,并对不属于本条染色体上的contigs进行手动切除;在每条染色体上使用3D-DNA软件进行染色体挂载;所述基于高通量染色体构象捕获的超大染色体组装方法能对20GB以上的染色体数据或者对contig数目过万的染色体数据进行组装。

全文数据:

权利要求:

百度查询: 西北工业大学 基于高通量染色体构象捕获的超大染色体组装方法及应用

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。