买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广州华大基因医学检验所有限公司;深圳华大医学检验实验室;深圳华大基因股份有限公司;天津华大医学检验所有限公司
摘要:本申请公开了一种UID测序、UID序列设计、UID去重质量值校正方法及应用。本申请方法包括UID序列设计和UID去重质量值校正步骤;UID序列设计包括预先为待测样本添加较长UID;统计常规去重的重复序列组中的序列总数;再UID去重,统计重复序列组中的UID组数;拟合序列总数和对应UID组数;根据需要数据量,从拟合函数中获得预期UID组数;利用R语言编程,模拟UID长度n取不同值时,UID添加到所有预期UID组数中,并确保所有组都连接不同UID概率95%或以上的最小n值,即最佳UID长度。本申请可动态设计UID长度,能在满足UID随机性前提下更少占用测序数据量;质量值校正,可根据质量值的提升能体现UID测序的精确性;运用到变异检测算法中,能支撑更低频变异检出。
主权项:1.一种UID测序方法,其特征在于:包括UID序列设计步骤和UID去重质量值校正步骤;所述UID序列设计步骤,包括预先为待测DNA样本添加8-20bp的UID序列;对测序结果进行常规去重,统计每个常规去重的重复序列组中包含的序列总数;采用UID去重算法对所述常规去重的重复序列组进行第二次去重,并统计每个常规去重的重复序列组中包含的UID组数;将每个常规去重的重复序列组中的序列总数和对应的UID组数拟合,获得两者的拟合函数;根据待测DNA样本测序需要的常规去重后的重复序列组中的序列总数,根据所述拟合函数,获得所需的预期UID组数;设UID序列的长度为n,则UID序列的组合数为4n,以预期UID组数为纵坐标,利用R语言编程,模拟计算n取不同长度时,将4n种可能的UID序列随机添加到预期UID组数的原始模板中,确保预期UID组数的原始模板都连接不同UID序列的概率在95%或以上的,最小n值,即最佳的UID序列长度,以此长度设计所述UID序列;所述UID去重质量值校正步骤,包括在UID去重算法的压缩去重算法中,每个位点选取出现比例大于或等于设定阈值的碱基,利用R语言编程计算该位点设定阈值及以上比例的碱基都发生测序错误的概率,标记为P1;设PCR错误发生在第j轮,对应的PCR错误所占比例为fj,对应的PCR错误率为p,综合考虑第一轮PCR两条reads同时发生错误,或者多轮PCR扩增都至少有一条发生错误的情况,利用R语言编程计算所有满足条件的fj和对应的p,如表1所示;表1 fj 0.625 0.6875 0.75 0.8125 0.8750 0.9375 1 p 1.788456e-06 9.504819e-09 8.911369e-07 4.752641e-09 2.384031e-09 1.266989e-11 1.115584e-07 。
全文数据:
权利要求:
百度查询: 广州华大基因医学检验所有限公司 深圳华大医学检验实验室 深圳华大基因股份有限公司 天津华大医学检验所有限公司 UID测序、UID序列设计、UID去重质量值校正的方法及应用
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。