买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭州联川基因诊断技术有限公司
摘要:本发明公开了一种确定靶向测序数据中代表性序列的方法、设备和介质,属于生物数据处理技术领域。所述方法包括将测序reads基于mTag序列进行分类;进一步包括从各mTag类别中选择一条代表性序列。利用本发明的方法,可以精准地选择mTag类别中的代表性序列,使得测序数据利用率更高,检测灵敏度和特异性也更好。
主权项:1.一种确定靶向测序数据中代表性序列的方法,其特征在于,包括以下步骤:S1,mTag分类:将测序reads基于mTag序列进行分类,获得mTag类别;S3,代表序列选择:从各mTag类别中选择一条代表性序列,利用以下步骤选取代表性序列:S31’,从目标序列第一个碱基位置开始,统计所述mTag类别中所有reads该位置的碱基类型及数目:1若该位置只有一种碱基类型,则无需修正,继续下一碱基的修正;2若该位置不止一种碱基类型,则对数目非第一多的碱基类型进行修正:①若该碱基质量值不小于第六阈值P6,则无需修正;②若该碱基质量值小于第六阈值P6,则将其修正为数目第一多的碱基类型;③统计该mTag中所有reads该位置修正后的碱基类型及数目,若数目第一多的碱基类型占比不低于第七阈值P7,则将所有非第一多的碱基类型均修正为数目第一多的碱基类型,继续下一碱基的修正;若数目第一多的碱基类型占比低于第八阈值P8,则直接舍弃该mTag类别所有reads,S32’,若按照步骤S31’完成所有碱基的修正,则选择其中任意一条reads作为代表性序列,其中,P6=15~20;P7=75%~90%。
全文数据:
权利要求:
百度查询: 杭州联川基因诊断技术有限公司 一种确定靶向测序数据中代表性序列的方法、设备和介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。