买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉康测科技有限公司
摘要:本发明涉及基因组学和转录组学技术领域,公开了一种基于二分搜索的高效peak注释方法,包括:获取测序后的比对结果,通过macs2进行PeakCalling,得到样本的Peak结果;根据样本对应的基因组文件及数据库内拥有的文件进行判断,若数据库内存在样本对应的基因坐标文件的解析结果,则直接进行注释;否则对对应的基因坐标文件进行解析;得到六种数组后,读取Peak文件并进行注释;读取基因坐标文件的解析结果,得到其在解析结果中的索引值,随后根据索引读取注释信息,根据信息写入输出文件,完成注释。本发明优化了基因坐标文件读取的步骤,通过对基因坐标文件的序列化,解决了对于同一物种,同一基因组版本注释时需多次读取基因坐标文件的问题,降低了IO压力。
主权项:1.一种基于二分搜索的高效peak注释方法,其特征在于,包括:S1、获取测序后的比对结果,通过macs2进行PeakCalling,得到样本的Peak结果,并对结果进行格式化,以使其符合输入注释工具的格式要求;S2、根据样本对应的基因组文件及数据库内拥有的文件进行判断,若数据库内存在样本对应的基因坐标文件的解析结果,则直接进行注释,得到六种数组;否则对对应的基因坐标文件进行解析,得到所需的解析结果文件;S3、得到六种数组后,读取Peak文件并进行注释;对于每一行对应的Peak,取其起始位点和终止位点后在六种数组中分别进行查找;S4、读取基因坐标文件的解析结果,对于输入的Peak文件中的每个Peak均根据其起始和终止位点进行查找,并根据选择的不同搜索模式,得到其在解析结果中的索引值,随后根据索引读取注释信息,根据信息写入输出文件,完成注释。
全文数据:
权利要求:
百度查询: 武汉康测科技有限公司 一种基于二分搜索的高效peak注释方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。