首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

用于复杂序列捕获和分析的分子杂交探针 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:威廉马歇莱思大学

摘要:本公开描述了使用设计的互补相互作用模式从几种寡核苷酸模块化构建的杂交探针,允许所述探针序列特异性地捕获或分析长的和或复杂的核酸靶序列。

主权项:1.一种用于靶核酸序列的序列选择性结合的核酸杂交探针,所述靶核酸序列包含5'至3'顺序的第一区和第二区以及第三区,所述核酸杂交探针包含第一互补寡核苷酸,其包含5'至3'顺序的第四区和第五区,所述第五区与所述第一区在序列上互补,第二互补寡核苷酸,其包含5'至3'顺序的第六区、第七区和第八区,所述第六区与所述第三区互补,所述第七区与所述第二区互补,并且所述第八区与所述第四区互补,第一保护寡核苷酸,其包含5'至3'顺序的第九区和第十一区,所述第九区与所述第五区互补并且与所述第一区同源,第二保护寡核苷酸,其包含5'至3'顺序的第十二区和第十区,所述第十区与所述第七区互补并且与所述第二区同源,并且所述第十二区与所述第十一区互补,其中所述第一互补寡核苷酸进一步在所述第五区的3'处包含第十六区,并且其中所述核酸杂交探针进一步包含第一通用寡核苷酸,所述第一通用寡核苷酸包含第十五区,所述第十五区与所述第十六区互补,并且其中所述第一保护寡核苷酸进一步在所述第九区的5'处包含第十四区,并且其中所述核酸杂交探针进一步包含第二通用寡核苷酸,所述第二通用寡核苷酸包含第十三区,所述第十三区与所述第十四区互补。

全文数据:用于复杂序列捕获和分析的分子杂交探针相关申请的交叉引用本申请要求2016年9月22日提交的美国临时申请号62398,484的优先权,该美国临时申请的全文以引用方式并入本文。背景技术用于分析核酸序列的常用技术包括聚合酶链式反应PCR和下一代测序NGS,但是这些技术无法分析长序列或复杂序列。具体地,三核苷酸重复由于滑链错配而难以分析,并且事实上致病性变体往往表征为超过NGS的读取长度的长链>200个核苷酸。标准杂交探针为:1长度受合成能力的限制,并且不能查询长靶区;2对具有组合多样性的DNA样本诸如T细胞受体和抗体片段Fragment进行分析是不经济的;3不能对三核苷酸重复进行精确定量,诸如在亨廷顿氏基因Huntington’sgene、脆性X染色体FragileX和费德里克共济失调Federick’sAtaxia基因,以及微卫星重复序列中的三核苷酸重复。美国专利申请公开号20140255924公开了一种使用不同区段Section的模块化探针设计,每个区段具有可变区,所述可变区与靶互补并侧接有彼此互补的臂。然而,此方法使用“或”逻辑,在这种情况下,一旦任何区段结合至靶,其就会募集其他区段。因此,该方法缺乏对长靶序列的特异性。此类现有技术方法未表现出对具有单核苷酸选择性的指定位置处的多核苷酸变异的耐受性。先前的尝试通常在探针中使用简并核苷酸混合物例如N或通用人工核苷酸例如肌苷来赋予序列变异耐受性,但是此类方法不能同等地耐受插入、缺失和替换。此外,这些方法通常与设计用于允许跨长靶区的单核苷酸选择性或用于在节段Segment接头处提供耐受性的双链探针不相容。克服这些限制的杂交探针将可用于序列捕获和分析。发明内容本公开提供了一种用于捕获和分析长的和复杂的靶核酸序列的核酸探针方法。核酸探针的特征为模块化构建,在所述模块化构建中,互补寡核苷酸共同跨越长靶序列并与之杂交。同时,模块化探针还包含具有与靶相似的序列的分子竞争剂物质,以通过分子竞争来确保杂交特异性。使用此方法,已经对160个核苷酸nt长的靶序列进行了特异性检测,并对三联体重复序列例如对于亨廷顿氏病而言为CAG上的重复数进行了定量。此方法可以允许将组合探针构建用于靶序列表现出组合多样性的免疫分析应用。与关于利用与靶序列互补的单一寡核苷酸的立足点探针toeholdprobe和X-探针的先前工作相比,在此呈现的模块化探针使用多种不同的寡核苷酸来结合靶的不同子序列。因为对于未官能化的DNA寡核苷酸,寡核苷酸合成能力的上限为约200nt,而对于荧光团官能化的DNA寡核苷酸,寡核苷酸合成能力的上限为约90nt,因此关于杂交探针的现有技术不能有效地探测长度超过约100nt的区。本发明使探针能够通过其模块化构建来查询更长的靶区。此外,本公开的探针可将序列变异耐受性的特征与核苷酸选择性组合。附图简要说明在结合附图阅读时,能够更好地理解上述发明内容以及以下对说明性实施例的详细描述。出于说明本公开的目的,在附图中示出了本公开的示例性构建。然而,本公开不限于本文公开的特定方法和手段。图1A描绘了模块化探针的一般实施方式。包含区4和区5的第一互补寡核苷酸可以与包含区7和区8的第二互补寡核苷酸杂交。靶包含区1和区2,所述区1和区2分别与区5和区7互补。第一保护寡核苷酸包含区9,所述区9与区5互补。图1B描绘了模块化探针的一般实施方式。包含区4和区5的第一互补寡核苷酸可以与包含区7和区8的第二互补寡核苷酸杂交。靶包含区1和区2,所述区1和区2分别与区5和区7互补。第一保护寡核苷酸包含区9,所述区9与区7互补。图2A描绘了具有2个互补寡核苷酸、2个保护寡核苷酸和2个通用寡核苷酸的模块化探针的一个实施例的示意图。因为荧光团F与猝灭剂Q共定位,所以探针天然处于黑暗状态下。图2B示出,图2A的模块化探针与靶的反应导致溶液荧光性增大,此是因为荧光团由星形表示不再猝灭。图3A描绘了示例性探针配制。图3B描绘了示例性探针配制。图3C描绘了示例性探针配制。图3D描绘了示例性探针配制。图4示出了使用模块化探针靶向某DNA序列的实验结果,所述DNA序列包含KRAScDNA的有义链上的前143个核苷酸和直接在KRAScDNA的5′末端的17个内含子核苷酸。图5A描绘了由3个互补寡核苷酸和3个保护寡核苷酸以及通用荧光团寡核苷酸和通用猝灭剂寡核苷酸组成的三节段探针的示意图。所有三个互补寡核苷酸都包含与靶序列中的区互补的中间区。图5B描绘了四节段探针的示意图。图6示出了模块化探针靶向某DNA序列的实验结果,所述序列包含KRAScDNA的有义链上的前143个核苷酸和直接在KRAScDNA的5′末端的17个内含子核苷酸。图7描绘了杂交反应30分钟后观察到的荧光。图8A示出了可以合成和构建为与图8B中所示的不同靶子序列结合的模块化探针的各个节段的不同版本。图8B描绘了针对图8A中描绘的模块化探针的各个节段的版本的不同靶序列。每个靶的双字母代码对应于图8A中的节段的节段1第一个字母和节段2第二个字母。图9描绘了模块化探针的另一示例。图10A描绘了模块化探针的另一示例,所述模块化探针具有与第一互补寡核苷酸杂交的通用生物素化寡核苷酸,以用于对靶序列进行基于表面的捕获。图10B描绘了模块化探针的另一示例,所述模块化探针具有通用荧光团寡核苷酸,所述通用荧光团寡核苷酸与第一互补寡核苷酸杂交,而不是与通用猝灭剂寡核苷酸杂交。图10C描绘了另一示例性模块化探针。图11A描绘了带有n个内部节段的条件荧光M-探针的设计。图11B示出了图11A的M-探针与靶的杂交导致上部寡核苷酸位移为多链复合体。图11C示出了来自图11B中描绘的实验的以一式三份测量的实验荧光。图12A描绘了M-探针设计。图12B描绘了10种耐受的变异。图12C描绘了12种不耐受的变异。图12D示出了具有多达7个核苷酸的变异的靶的荧光响应。图13A描绘了节段实例的组合,展示了用于VDJ重组检测的M-探针的组合构建。图13B描绘了人TCR-β基因VDJ重组过程。图13C描绘了M-探针与带有V2区和J1-3区的匹配靶序列之间的示例性杂交反应。图13D示出了在过夜杂交反应后观察到的M-探针的荧光。图13E描绘了观察到的脱靶荧光左和在靶荧光右的分布。图14A描绘了对560nt靶向区内的单核苷酸变异的M-探针检测。rs1509186单核苷酸多态性SNP在NA18562基因组DNAgDNA样本中是纯合的GG,并且在NA18537中是纯合的AA。图14B示出了M-探针10nM最终浓度对来自图14A的相应扩增子靶的荧光响应。图15A描绘了使用M-探针,使用一系列M-探针对三联体重复数进行的分析。图15B示出了具有不同三联体重复数的合成寡核苷酸靶对设计用于检测具有≥18个CAG重复的靶的M-探针的实验荧光响应。图15C示出了对8种合成靶的M-探针响应的总结;当靶重复数小于M-探针重复数时,观察到最少的杂交。图15D描绘了使用生物素官能化的M-探针图45从基因组DNA中选择性捕获高重复HTT基因的工作流程。图15E描绘了从NA20209和NA20245基因组DNA样本捕获的HTT基因的qPCR扩增迹线每次反应125nggDNA初始输入。图15F描绘了对7份基因组DNA样本的实验观察Ct值的总结一式三份运行的平均值。图15G示出了使用一系列M-探针来精确测定三联体重复数。图16描绘了示例n=1的M-探针的反应机理。步骤1:探针的单链部分称为立足点用作链置换过程的起始区。步骤2:多链中间体以随机游走random-walk的方式从终止节段t前进通过内部节段si。步骤3:在内部节段s1处结束。步骤4:最终,释放包含所有上方链的保护复合物。图17示出了对M-探针与其预期靶之间的标准杂交自由能ΔG°的计算。对于单核苷酸特异性,ΔG°应大致为0。单独基序的ΔG°项基于SantaLucia,J.&Hicks,D.TheThermodynamicsofDNAStructuralMotifs.Ann.Rev.Biochem.33,415-4402004中的文献测量或估计。图18描绘了使用逆时针增加化学计量的M-探针制剂。存在高达1倍的可消耗靶序列的副产物,但没有在不存在靶的情况下具有高荧光的副产物。图19描绘了使用不同化学计量的假设制剂。在这种情况下,0.5倍过量的通用荧光物质表现出高荧光,导致信号背景比降低和检测限更差。图20A示出了根据8%聚丙烯酰胺凝胶电泳结果的M-探针制备的产率。图20B示出了基于泳道1-6的凝胶带谱的M-探针制备的产率。图21A示出了通过对新制备的M-探针进行基本验证获得的M-探针的稳定性。实验方案与图11C的实验方案相同。图21B示出了通过对4℃下于1×PBS中储存1个月之后的M-探针进行基本验证获得的M-探针的稳定性。图22A示出了M-探针的性能,以与图22B中的立足点探针和图22C中的X-探针的性能进行比较。图22B示出了立足点探针的性能,以与图22A中的M-探针和图22C中的X-探针的性能进行比较。图22C示出了X-探针的性能,以与图22A中的M-探针和图22B中的立足点探针的性能进行比较。图23A-图23D示出了分别M-探针,其中n=0在u节段中具有不同长度互补区段的4种X-探针的设计和实验结果。图24示出了在人TCR-β基因、VDJ重组,以及V-D接头区和D-J接头区中的变异。V-D与D-J之间的区经历随机缺失和非模板化插入,从而产生高变的CDR3区,该高变的CDR3区对于识别多种抗原是重要的。图24底部的图表基于来自Freeman,J.D.,Warren,R.L.,Webb,J.R.,Nelson,B.H.,&Holt,R.A.ProfilingtheT-cellreceptorbeta-chainrepertoirebymassivelyparallelsequencing.GenomeRes.19,1817-1824,2009的数据,描述了来自外周血的T淋巴细胞中的V3′缺失、V与J之间的序列以及J5′缺失的长度分布。图25示出了8个选定V节段的缺失长度的分布。未示处超过7个碱基的缺失的频率,因为它们仅对应于少于3%的克隆型。在每个子图上方显示了最接近每个V节段的3’末端的7个碱基的序列。图26示出了6个选定J节段的缺失长度的分布。未表示超过12个碱基的缺失的频率,因为它们仅对应于约3%的克隆型。在每个子图上方显示了最接近每个J节段的5’末端的10个碱基的序列。图27描绘了对于VDJ靶的示例性M-探针设计。V区、V-J之间的序列和J区被颜色编码为蓝色、绿色和黄色。符号Δ后面的数字表示缺失的长度。图28描绘了48种完全匹配的M-探针反应的凸起尺寸分布。图29A-图29C描绘了3种M-探针与其各自相应的具有V10J1-2、V11J1-2和V12J1-3的靶的结合动力学。图30A-图30B分别描绘了V节段和J节段中的荧光信号与错配数的蜂群图beeswarmplot。V序列比J序列更保守,因此错配数更少。图31A-图31B示出了用于端点荧光测量的AppliedBiosystemsQuantStudio7仪器中96孔板的位置校正。图31A示出了在含有0.1%Tween20的1xPBS缓冲液中的ROX标记的寡核苷酸的平均原始相对荧光单位RFU值。每个孔含有指定浓度的10μL溶液。在此示出了在37℃孵育20分钟后,在37℃每30秒收集一次的20次测量的平均值。图31B示出了对于A1孔的示例位置校正。将四种浓度下的RFU值相对于相应的参考RFU值整个平板上的平均值作图。计算最小二乘线性拟合并将其用于校正所有后续实验的位置偏差。图32A-图32B示出了8种M-探针与8种VDJ靶之间成对相互作用的端点荧光信号。图32A:匹配的探针靶荧光信号以红色或粉红色示出,错配的探针靶对以绿色或浅绿色示出。所有反应实验一式三份地进行。每个孔含有100nMM-探针和300nM靶。在37℃孵育过夜并在37℃于qPCR机器中孵育30分钟后开始进行数据收集。然后收集30个数据点每个数据点30秒。图32B:对于8种M-探针和靶的经位置校正的平均端点荧光。沿主对角线显示了来自匹配探针和靶的信号。图33A描绘了分别设计用于靶向KRAScDNA的前99nt和前160nt的两种M-探针。垂直虚线表示分离M-探针节段的接头。在此,两种M-探针都仅结合至整个靶的子序列。图33B示出了M-探针10nM最终浓度对扩增子靶的荧光响应。在37℃于1×PBS中进行杂交实验。图33C示出了M-探针对超过200nt的靶序列中的缺失的序列选择性。将以下三种不同的正向引物fP与反向引物rP一起使用:fP1产生具有M-探针3的完整靶序列的扩增子,fP2产生缺失3个核苷酸Δ3nt的扩增子,并且fP3扩增子具有6nt的缺失Δ6nt。s1和t的靶特异性区的长度分为115nt和103nt。图33D示出了M-探针310nM最终浓度对扩增子靶的荧光响应。图34A-图34B描绘了KRAS扩增子最小自由能mfe二级结构,正如NUPACK所预测的。所述核苷酸根据采用所示状态的概率来着色。图34A示出了用作图33A-图33B的靶的扩增子。相应的M-探针的靶序列以灰色99nt靶向区和粉红色160nt靶向区突出显示。图34B示出了用作图33C-图33D的靶的扩增子。图35A-图35B示出了通过使用AppliedBiosystemsPowerUpSYBRGreenMasterMix进行不对称PCR而对靶扩增子产生进行的qPCR验证。图35A示出了使用Bio-RadCFX96Touch实时PCR机器从96孔板收集的qPCR数据。迹线表明,所有三种靶的扩增在50个循环内达到平衡。图35B示出了对所观察到的循环阈值Ct的值的总结。图36A-图36B描绘了靶向SNPrs7648926周围的430nt侧翼序列的M-探针的设计和性能。图36A示出M-探针n=2设计为具有与样本NA18562相同的基因型。从样本NA18537产生的扩增子在与M-探针反应时产生单碱基错配。图36B示出了M-探针10nM对从样本NA18562和NA18537产生的扩增子靶的荧光响应。在45℃于1×PBS中进行杂交实验。图37A-图37C描绘了通过NUPACK预测的长扩增子最小自由能mfe二级结构。着色线指示相应M-探针的接头位置。图37A示出了用作430ntM-探针图36A-图36B的靶的扩增子。图37B-图37C描绘了用作图36A-图36B的靶的扩增子。图38描绘了具有26个CAG重复的合成DNA寡核苷酸的Sanger测序。图39描绘了设计用于HTT三联体重复分析的条件性发荧光的M-探针的示意图和序列。针对6个重复和9个重复的M-探针的n=0,并使用它们自己的t节段。针对12个重复和15个重复的M-探针的n=1,并且使用s1。针对18个重复和21个重复的M-探针的n=2,并且使用s1和s2。针对24个重复和27个重复的M-探针的n=3,并且使用s1、s2和s3。图40A-图40B展示了不同M-探针链化学计量对靶杂交反应的影响。图40A示出了浓度不断增加的化学计量,以确保没有对抗副产物。图40B示出了简化的化学计量有利于扩展至更大的n。这两种化学计量似乎没有显著的性能差异。图41A-图41B描绘了用于检测FMR1基因和FXN基因的CGG和GAA三联体重复的M-探针。图41A:靶序列是FMR1基因的反义链,因为具有CGG重复的靶采用高度稳定的二级结构,该高度稳定的二级结构减慢与M-探针的杂交反应。此M-探针靶向19个CCG重复,明确区分16个重复与19个重复。图41B:靶向19个GAA重复的M-探针明确区分16个重复与19个重复。图42示出了8种合成靶各自的M-探针响应曲线对于组合版本,请参见图5C。误差条表示一式三份实验的±标准偏差。每个反应中探针和靶的最终浓度分别为100nM和300nM。图43A-图43E示出了针对杂合样本的M-探针响应曲线。这些实验中M-探针的最终浓度为100nM。图43A:通过使具有9个和24个CAG重复的合成靶的1∶1混合物与M-探针进行反应而观察到的荧光。图43B:通过使具有12个和21个CAG重复的合成靶的1∶1混合物与M-探针进行反应而观察到的荧光。图43C:通过使具有27个CAG重复的合成靶与M-探针进行反应而观察到的荧光。图43D:针对具有9个和24个CAG重复的合成靶的1∶1混合物的归一化响应曲线。图43E:针对具有12个和21个CAG重复的合成靶的1∶1混合物的归一化响应曲线。图44A-图44C示出了使用条件性发荧光的M-探针对基因组DNA样本进行的HTT三联体重复分析。a靶向扩增子靶中的6个重复的M-探针的荧光响应。通过对基因组DNA样本NA18537进行不对称PCR参见方法扩增来产生所述靶。b对人类基因组DNA样本NA18537进行的HTT三联体重复分析。c对6种其他人类基因组DNA样本进行的HTT三联体重复分析。误差条表示一式三份实验的±标准误差。图45描绘了设计用于进行NA20248CAG重复1736HTT三联体重复分析的捕获M-探针的示意图和序列。针对33个重复、35个重复、36个重复、37个重复和39个重复的M-探针的n=1,并且使用它们自己的t节段。它们共享相同的S1节段,以探测18个CAG重复。它们自己的t节段分别探测15个、17个、18个、19个、21个CAG重复。图46描绘了从7种基因组DNA样本捕获的HTT基因的原始qPCR迹线。具体实施方式本公开将提供对附图的描述,在附图中示出了本公开的主题的一些而非全部实施例。实际上,所述主题可以以许多不同的形式体现,并且不应该被解释为限于本文阐述的实施例;相反,提供这些实施例是为了使本公开满足所有的法律要求。除非另有定义,本文使用的所有技术和科学术语具有和本领域中的普通技术人员通常所理解的相同的含义。模块化探针是基于对具有至少部分已知序列的靶核酸序列的检测或捕获而设计的。靶序列在概念上分成几个区,一个区是多个连续核苷酸,所述连续核苷酸充当杂交或解离单元。在本公开的大部分内容中,我们认为靶包含三个区,该三个区以5’至3’的顺序标记为区1、区2和区3。应注意,这些区可以或可以不直接彼此邻接;图1A-图1B中区1和区2之间的虚线表示可能存在既不是区1也不是区2的组成部分的附加核苷酸。模块化探针的最一般实例包含两个互补寡核苷酸和一个保护寡核苷酸图1A-图1B。这两个互补寡核苷酸各自具有与靶序列的不同区分别为1和2互补的区5和7。此外,这两个互补寡核苷酸还分别进一步具有区4和区8,所述区4和区8彼此互补,并用于在溶液中共定位这两个互补寡核苷酸。所述保护寡核苷酸包含区9,所述区9与区5或区7互补,因此与靶区1或靶区2在序列上同源。在与所述两个互补寡核苷酸杂交时,所述保护寡核苷酸与靶竞争,从而改善模块化探针的序列特异性。在一些实施例中,本公开的核酸杂交探针的互补寡核苷酸可包含从1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、105个核苷酸、110个核苷酸、120个核苷酸、130个核苷酸、140个核苷酸、150个核苷酸、160个核苷酸、170个核苷酸、180个核苷酸、190个核苷酸、200个核苷酸、210个核苷酸、220个核苷酸、230个核苷酸、240个核苷酸、250个核苷酸、260个核苷酸、270个核苷酸、280个核苷酸、290个核苷酸、300个核苷酸、310个核苷酸、320个核苷酸、330个核苷酸、340个核苷酸、350个核苷酸、360个核苷酸、370个核苷酸、380个核苷酸、390个核苷酸、400个核苷酸、410个核苷酸、420个核苷酸、430个核苷酸、440个核苷酸、450个核苷酸、460个核苷酸、470个核苷酸、480个核苷酸、490个核苷酸、500个核苷酸、510个核苷酸、520个核苷酸、530个核苷酸、540个核苷酸和550个核苷酸中的任一者至560个核苷酸、550个核苷酸、540个核苷酸、530个核苷酸、520个核苷酸、510个核苷酸、500个核苷酸、490个核苷酸、480个核苷酸、470个核苷酸、460个核苷酸、450个核苷酸、440个核苷酸、430个核苷酸、420个核苷酸、410个核苷酸、400个核苷酸、390个核苷酸、380个核苷酸、370个核苷酸、360个核苷酸、350个核苷酸、340个核苷酸、330个核苷酸、320个核苷酸、310个核苷酸、300个核苷酸、290个核苷酸、280个核苷酸、270个核苷酸、260个核苷酸、250个核苷酸、240个核苷酸、230个核苷酸、220个核苷酸、210个核苷酸、200个核苷酸、190个核苷酸、180个核苷酸、170个核苷酸、160个核苷酸、150个核苷酸、140个核苷酸、130个核苷酸、120个核苷酸、110个核苷酸、100个核苷酸、90个核苷酸、80个核苷酸、70个核苷酸、60个核苷酸、50个核苷酸、45个核苷酸、40个核苷酸、35个核苷酸、30个核苷酸、25个核苷酸、20个核苷酸、15个核苷酸、10个核苷酸、9个核苷酸、8个核苷酸、7个核苷酸、6个核苷酸、5个核苷酸、4个核苷酸、3个核苷酸、2个核苷酸和1个核苷酸中的任一者。在一些实施例中,本公开的核酸杂交探针的互补寡核苷酸可包含超过500个核苷酸。在一些实施例中,与所述靶核酸序列的部分互补的互补寡核苷酸的部分可包含从1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、105个核苷酸、110个核苷酸、120个核苷酸、130个核苷酸、140个核苷酸、150个核苷酸、160个核苷酸、170个核苷酸、180个核苷酸、190个核苷酸、200个核苷酸、210个核苷酸、220个核苷酸、230个核苷酸、240个核苷酸、250个核苷酸、260个核苷酸、270个核苷酸、280个核苷酸、290个核苷酸、300个核苷酸、310个核苷酸、320个核苷酸、330个核苷酸、340个核苷酸、350个核苷酸、360个核苷酸、370个核苷酸、380个核苷酸、390个核苷酸、400个核苷酸、410个核苷酸、420个核苷酸、430个核苷酸、440个核苷酸、450个核苷酸、460个核苷酸、470个核苷酸、480个核苷酸、490个核苷酸、500个核苷酸、510个核苷酸、520个核苷酸、530个核苷酸、540个核苷酸和550个核苷酸中的任一者至560个核苷酸、550个核苷酸、540个核苷酸、530个核苷酸、520个核苷酸、510个核苷酸、500个核苷酸、490个核苷酸、480个核苷酸、470个核苷酸、460个核苷酸、450个核苷酸、440个核苷酸、430个核苷酸、420个核苷酸、410个核苷酸、400个核苷酸、390个核苷酸、380个核苷酸、370个核苷酸、360个核苷酸、350个核苷酸、340个核苷酸、330个核苷酸、320个核苷酸、310个核苷酸、300个核苷酸、290个核苷酸、280个核苷酸、270个核苷酸、260个核苷酸、250个核苷酸、240个核苷酸、230个核苷酸、220个核苷酸、210个核苷酸、200个核苷酸、190个核苷酸、180个核苷酸、170个核苷酸、160个核苷酸、150个核苷酸、140个核苷酸、130个核苷酸、120个核苷酸、110个核苷酸、100个核苷酸、90个核苷酸、80个核苷酸、70个核苷酸、60个核苷酸、50个核苷酸、45个核苷酸、40个核苷酸、35个核苷酸、30个核苷酸、25个核苷酸、20个核苷酸、15个核苷酸、10个核苷酸、9个核苷酸、8个核苷酸、7个核苷酸、6个核苷酸、5个核苷酸、4个核苷酸、3个核苷酸、2个核苷酸和1个核苷酸中的任一者。在一些实施例中,与靶核酸序列的部分互补的互补寡核苷酸的部分可包含超过500个核苷酸。在一些实施例中,与另一个互补寡核苷酸的部分互补的互补寡核苷酸的任何部分可包含从1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸中的任一者至100个核苷酸、90个核苷酸、80个核苷酸、70个核苷酸、60个核苷酸、50个核苷酸、45个核苷酸、40个核苷酸、35个核苷酸、30个核苷酸、25个核苷酸、20个核苷酸、15个核苷酸、10个核苷酸、9个核苷酸、8个核苷酸、7个核苷酸、6个核苷酸、5个核苷酸、4个核苷酸、3个核苷酸、2个核苷酸和1个核苷酸中的任一者。在一些实施例中,与核酸杂交探针的一部分该部分不对应于互补的保护寡核苷酸互补的靶序列部分包含从1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸和45个核苷酸中的任一者至50个核苷酸、45个核苷酸、40个核苷酸、35个核苷酸、30个核苷酸、25个核苷酸、20个核苷酸、15个核苷酸、10个核苷酸、9个核苷酸、8个核苷酸、7个核苷酸、6个核苷酸、5个核苷酸、4个核苷酸、3个核苷酸、2个核苷酸和1个核苷酸中的任一者。在一些实施例中,与核酸杂交探针的部分该部分不对应于互补的保护寡核苷酸互补的靶序列的部分包含超过50个核苷酸。例如,核酸杂交探针的立足点区,诸如图2A-图2B中的区6,可以包含从1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸和45个核苷酸中的任一者至50个核苷酸、45个核苷酸、40个核苷酸、35个核苷酸、30个核苷酸、25个核苷酸、20个核苷酸、15个核苷酸、10个核苷酸、9个核苷酸、8个核苷酸、7个核苷酸、6个核苷酸、5个核苷酸、4个核苷酸、3个核苷酸、2个核苷酸和1个核苷酸中的任一者,或者可包含超过50个核苷酸。条件性发荧光的模块化探针。图2A-图2B示出了具有2个互补寡核苷酸一个包括区16、区5和区4,另一个包括区6、区7和区8、2个保护寡核苷酸一个包括区14、区9和区11,另一个包括区12和区10和2个通用寡核苷酸13和15的模块化探针的实施例。利用荧光团F使得其中一个通用寡核苷酸15官能化,并利用猝灭剂Q使得另一个通用寡核苷酸13官能化。如图所示,区5与区9和区1互补,而区7与区10和区2互补。区6立足点与靶的区3互补。此外,区13和区14、区15和区16、区11和区12以及区4和区8也分别彼此互补。在模块化探针的天然构型中,猝灭剂在荧光团的Forster半径5nm内,并且探针荧光低。在与靶序列杂交后,保护寡核苷酸和具有猝灭剂的通用寡核苷酸从互补寡核苷酸移位和离域,从而导致溶液荧光增加。经背景扣除的荧光是与结合靶分子的数目呈线性的第一近似值。因此,条件性发荧光的模块化探针可用作测定不同靶的杂交率以及靶-探针结合的杂交动力学的方法。用于从模块化探针的组分寡核苷酸即互补寡核苷酸、保护寡核苷酸和通用寡核苷酸制备模块化探针的许多配制方案是可行的示例在图3A-图3D中示出,并且这些配制方案的相对有效性取决于靶序列的复杂性、组分寡核苷酸的纯度,以及移液和等分的可实现准确度。图3A描绘了互补寡核苷酸C1和C2与保护寡核苷酸P1和P2以及具有荧光团F和猝灭剂Q的通用寡核苷酸C0和P0在缓冲液中及有利于杂交的温度下的处于溶解状态的组合体。通用寡核苷酸C0以1X化学计量存在,同时互补寡核苷酸以1.1X存在,并且保护寡核苷酸和P0以2.1X存在。任选地,可以应用热退火过程以改善杂交率。在此示出的保护寡核苷酸和互补寡核苷酸的化学计量是示例,并非旨在作为对配制的限制或约束。图3B示出了用于探针的另一组化学计量C0为1X;C1为1.2X;C2为1.3X,P0为3X,P1为2.4X;并且P2为2.3X。图3C示出了通过以下方式进行的另一种配制:通过混合或退火分离形成两种子探针虚线框,随后使所述子探针结合以配制探针C0为1X;C1为1.2X;C2为1.3X,P0为3X,P1为2.4X;并且P2为2.3X。图3D示出了通过将经由退火或混合而单独形成的两种子探针进行混合来配制探针的另一种方式C0为1X;C1为1.1X;C2为1.1X,P0为2.1X,P1为2.1X;并且P2为2.1X。图4示出了模块化探针靶向某DNA序列的实验结果,所述DNA序列包含KRAScDNA的有义链上的前143个核苷酸和直接在KRAScDNA的5′末端的17个内含子核苷酸。基于图3B中所示的方案来配制探针。针对包含KRAScDNA的前82nt的99nt序列而设计的探针的浓度为10nM,并且反应在37℃下的1xPBS缓冲液中进行。通过从人类基因组DNA进行不对称PCR产生具有靶序列的179ntssDNA扩增子,并经由尺寸排阻过滤进行纯化;此匹配的靶在30分钟内引发强烈的荧光响应,指示了有效杂交。相比之下,具有不相关靶序列的136ntssDNA扩增子也是通过不对称PCR产生的不会引发任何荧光信号。使用序列1-序列6形成探针,并且靶是通过使用序列42和序列43作为引物的PCR扩增而制备的序列41。该不相关靶是通过使用序列45和序列46作为引物的PCR扩增而制备的序列44。在时间t=0时添加靶导致荧光快速增长,表明了靶的成功结合。相比之下,在时间t=0时添加不相关的序列没有导致荧光的显著增长。具有附加节段的模块化探针。现在为止,如在图2A-图4中所体现的模块化探针含有两个互补寡核苷酸和两个保护寡核苷酸。此后,我们将互补寡核苷酸和具有互补区的保护寡核苷酸的组合称为节段Segment。因此,如图2A-图2B中所体现的探针是两节段探针;图5A-图5B示出了三节段探针和四节段探针的示意图。如图5A-图5B中所示,互补寡核苷酸可包含区22、区18、区15、区16、区5、区4、区8、区7和区6图5A-图5B以及区28、区24和区21图5B。保护寡核苷酸可包含区20、区17、区13、区14、区9、区11、区12和区10图5A-图5B以及区26、区23和区19图5B。在图5A中,可以包括两个通用寡核苷酸19和21,所述通用寡核苷酸包括21上的荧光团F和19上的猝灭剂Q。在图5B中,可以包括两个通用寡核苷酸27和25,所述通用寡核苷酸包括27上的荧光团F和25上的猝灭剂Q。在图5A-图5B中,区24、区18、区5、区7和区6分别与区23、区17、区9、区10和区3互补。区24、区18、区5和区7也与靶的区42、区41、区1和区2互补。区19和区20、区13和区14、区11和区12、区21和区22、区15和区16、区4和区8、区25和区26以及区27和区28分别彼此互补。在一些实施例中,核酸杂交探针或M-探针可包括两个或更多个节段。在一些实施例中,核酸杂交探针或M-探针可包括三个节段。在一些实施例中,核酸杂交探针或M-探针可包括四个节段。在一些实施例中,核酸杂交探针或M-探针可包含5个节段、6个节段、7个节段、8个节段、9个节段、10个节段或多于10个节段。图2A-图2B中的探针由两个互补寡核苷酸和两个保护寡核苷酸组成,但互补寡核苷酸和保护寡核苷酸的数目原则上可以任意扩展。构建具有更多节段的模块化探针的优点包括:1探测更长靶序列的能力,2由于更短的长度而更容易合成组分寡核苷酸,3探针配制中附加的组合多样性,以及4有附加的位置和分子用来使化学部分官能化。图6示出了模块化探针靶向某DNA序列的实验结果,所述序列包含KRAScDNA的有义链上的前143个核苷酸和直接在KRAScDNA的5′末端的17个内含子核苷酸。基于图3B中所示的方案来配制探针。针对包含KRAScDNA的前143nt的160nt序列而设计的探针的浓度为10nM,并且反应在37℃下的1xPBS缓冲液中进行。通过从人类基因组DNA进行不对称PCR产生具有靶序列的179ntssDNA扩增子,并经由尺寸排阻过滤进行纯化;此匹配的靶在60分钟内引发强烈的荧光响应,指示了有效杂交。相比之下,具有不相关靶序列的150ntssDNA扩增子也是通过不对称PCR产生的不会引发任何荧光信号。使用序列1、2、3、4、7、8、9和10形成探针,并且靶是通过使用序列42和序列43作为引物的PCR扩增而制备的序列41。该不相关靶是通过使用序列45和序列46作为引物的PCR扩增而制备的序列44。与两节段探针一样,预期的靶快速诱导荧光信号的增长,而不相关的序列不会导致任何荧光变化。对三联体重复进行定量。几种疾病的起因或特征是异常数目的三联体重复;示例包括亨廷顿氏病过量的CAG重复、弗里德希氏共济失调GAA重复、肌强直性营养不良CTG重复和脆性X染色体综合征CGG重复。在生物学上,这些重复诱导DNA复制期间的滑链错配;滑链错配还使许多常规DNA分析技术诸如Sanger测序、定量PCR,以及下一代测序复杂化或被排除。在此,我们设计了几种针对亨廷顿氏基因序列的模块化探针,每种探针设计为靶向阈值数目的重复6个重复、9个重复、12个重复、15个重复、18个重复、21个重复、24个重复和27个重复以及3′相邻序列。例如,12重复探针还设计用于与具有12个或更多个CAG重复,以及CAG重复的8nt下游序列的任何靶序列杂交。图7总结了杂交反应30分钟后观察到的荧光。使用序列1、2、19和20形成6重复探针X轴上的6。使用序列1、2、21和22形成9重复探针X轴上的9。使用序列1、2、23、24、25和26形成12重复探针X轴上的12。使用序列1、2、23、24、27和28形成15重复探针X轴上的15。使用序列1、2、23、24、29、30、31和32形成18重复探针X轴上的18。使用序列1、2、23、24、29、30、33和34形成21重复探针X轴上的21。使用序列1、2、23、24、29、30、35、36、37和38形成24重复探针X轴上的24。使用序列1、2、23、24、29、30、35、36、39和40形成27重复探针X轴上的27。6重复6R靶是序列11。9重复9R靶是序列12。12重复12R靶是序列13。15重复15R靶是序列14。18重复18R靶是序列15。21重复21R靶是序列16。24重复24R靶是序列17。27重复27R靶是序列18。所使用的靶是具有CAG三联体的6个、9个、12个、15个、18个、21个、24个和27个拷贝和8nt下游序列的合成寡核苷酸。如所预测的,当靶的三联体重复数目大于或等于由模块化探针所测试的重复数目时,荧光较高,否则较低。组合探针制剂。可以合成和构建模块化探针的每个节段的不同版本,所述不同版本结合不同的靶子序列图8A-图8B。每个节段的这些不同版本可以模块化地组合以形成许多在组合上不同的模块化探针。在图8A-图8B中,区5A与区9A和靶的区1A互补,区5B与区9B和靶的区1B互补,并且区5C与区9C和靶的区1C互补。在图8A-图8B中,区7A与区10A和靶的区2A互补,区7B与区10B和靶的区2B互补,并且区7C与区10C和靶的区2C互补。在图8A-图8B中,区6A与靶的区3A互补,区6B与靶的区3B互补,并且区3C与靶的区6C互补。区11和区12以及区4和区8也分别彼此互补。对于每个节段具有3个版本的2节段探针,探针可以配制成靶向9个不同的序列,如图8A-图8B中所示。对于每个节段具有20个版本的3节段探针,可以将8000种不同的探针配制成针对一样多的靶序列,即使仅合成了120种寡核苷酸也如此。我们设想我们的模块化探针的这种组合制剂特征使其特别适用于这样的免疫分析应用,在所述免疫分析应用中T细胞和B细胞经历遗传重排即VDJ重组并表现出高序列多样性。模块化探针的组合制剂也非常适用于检测来自cDNA的基因融合。模块化探针结构变化。除了先前在图1A-图1B、图2A-图2B和图5A-图5B中示出的实施例之外,可以设想针对特定应用具有不同优点的许多其他变型。图9和图10A-图10C示出了模块化探针的另外实施例。在图9中所示的示例中,第一互补寡核苷酸上的区32不与靶序列的任何区互补,而是与第一保护寡核苷酸上的区31互补。第二互补寡核苷酸上的区34与靶序列的区33互补,但不与第二保护寡核苷酸的任何区互补。可以添加这些附加类型的区以赋予探针改善的灵敏度或特异性,或者另选地帮助放松对杂交的空间位阻效应。此外,在图9中,区11和区12、区13和区14、区21和区22、区1和区2、区31和区32、区23和区24、区3和区4、区5和区6、区33和区34分别彼此互补。图10B中描绘的探针可能更适用于其中可以洗掉未结合的探针分子的测定,诸如在荧光原位杂交FISH测定中。图10C中描绘的探针在几个互补寡核苷酸上由荧光团官能化,并且可以使每个靶分子产生更亮的荧光信号,从而改善分子灵敏度。另外,保护寡核苷酸中的一者具有区10不与任何其他保护寡核苷酸杂交,并且可以在不需要其他保护寡核苷酸的协同置换的情况下被更容易地置换。此探针可能更适用于针对具有明显二级结构的靶的测定。在图10A-图10C中,区5和区9、区15和区16、区4和区8、区7和区10、区37和区38、区31和区36、区35和区34、区32和区33以及区13和区14分别彼此互补。这些探针设计旨在用作示例,而不是将权利要求书或本发明的范围限制于在此呈现的特定实施例。语言准确性。除非另有明确说明,否则本文件中的“互补”是指“部分或完全互补”。当一个序列的超过80%的比对核苷酸与另一个序列的相应核苷酸互补时,这两个序列被定义为“部分互补”。示例用以下示例说明了本发明,但应理解,以下方法适用并且示例仅用于说明目的,而且本发明并不局限于此。方法寡聚核苷酸合成和储存条件。本研究中使用的寡核苷酸分子购自IntegratedDNATechnologiesIDT。取决于寡核苷酸的长度、修饰和序列,每种寡核苷酸订购时均经过标准脱盐或经过合成后PAGE或HPLC纯化。由IDT经由质谱法对所有寡核苷酸进行序列验证;还通过毛细管电泳对纯化的寡核苷酸和gBlock基因片段进行大小验证。每种寡核苷酸的序列和纯化方法可以在表8-表21中找到。除了超聚体ultramer寡核苷酸和gBlock基因片段以外,所有其他寡核苷酸在最初由IDT在Tris·EDTApH=8.0缓冲液中以约100μM预悬浮;将储备溶液储存在4℃下直至使用。VDJ重组序列选择和杂交靶设计。从IMGTGene-DB数据库http:www.imgt.orggenedb下载人T细胞受体β可变V、多样性D和连接J种系编码基因的序列。共有48个功能性TRBV基因排除ORF和假基因,2个功能性TRBD基因和13个功能性TRBJ基因。作为概念的证明,我们设计了48个VDJ重组靶,其包含8个TRBV基因的最后35nt碱基、V与J之间的区的48个生物学上存在的序列,以及6个TRBJ基因的前35nt碱基。然后,基于在生物学中观察到的缺失数目的分布,每个V序列的3′末端缺失0至7个核苷酸,并且每个J序列的5′末端缺失0至10个核苷酸。VDJ重组靶设计的详细描述在图24-图26所附的文本中提供。M-探针配制和链化学计量。对于所有靶向非重复序列的探针,通过以下方式来配制1μM的M-探针储备溶液:以指定比率将所有组分链混合在一起来最小化对反应有害的多链复合体的形成图16-图23D及所附文本。例如,为了配制图11C中所示的M-探针,我们以1∶1.1∶1.1∶2.1∶2.1∶2.1的比率在1×磷酸盐缓冲盐水PBS,从购自Sigma-Aldrich的10×PBS稀释中混合该M-探针的组分链。从下通用链开始并在上通用链处结束,比率在逆时针方向上对应于每个组分链。使用的M-探针的化学计量比列出于表1中。然后,我们在我们的实验室中使用三个EppendorfMasterCycler个人型热循环仪中的一个对M-探针溶液执行热退火,接着进行以下程序:在95℃下初始变性5分钟,随后在75分钟内均匀冷却至20℃。将退火的探针储存在4℃下直到使用。对于靶向重复序列的所有探针,通过两步形成来配制1μM的M-探针储备溶液:单独配制单个节段,然后将其进行组合以避免探针畸形。为了配制n=1的探针例如图15A-图15G中所示的MP-12,将u和s1的4个组分链退火以形成u∶s1,将t的2个组分链退火以形成t,并将这两种溶液混合以形成完整的探针。为了配制n=2的探针例如图15A-图15G中所示的MP-18,将u和s1的4个组分链退火以形成u∶s1,将s2和t的4个组分链退火以形成s2∶t,并将这两种溶液混合以形成完整的探针。为了配制n=3的探针例如图15A-图15G中所示的MP-24,将u和s1的4个组分链退火以形成u∶s1,将s2和s3的4个组分链退火以形成s2∶s3,将t的2个组分链退火以形成t,并将这三种溶液混合以形成完整的探针。用于基于时间的荧光测量的方案。使用两个HoribaFluoromax-4荧光计中的一个在1×PBS中于37℃下测量图11C、图12D和图15B中所示的基于时间的荧光迹线。使用两个HoribaFluoromax-4荧光计中的一个在1×PBS中于45℃下测量图14B中所示的基于时间的荧光迹线。将实验中的M-探针浓度设定为10nM,合成靶浓度为30nM图12D、图15B,PCR扩增子浓度未定量图14B。为了实现这些最终浓度,我们将12μL1μM图11C、图12D和图15B或40μL0.3μM图14B的M-探针溶液吸移到填充有1200μL1×PBS缓冲液的HelhnaSemi-Micro114F分光荧光计比色皿中。然后,我们将比色皿在机器中于所需温度下孵育20分钟至1小时,以允许在数据采集开始后进行温度平衡。随后,将比色皿从机器中取出;将靶或PCR后的溶液加入比色皿。适当混合后,将比色皿放回机器中。对于图11C中示出的实验,使突变的靶12G>T,31G>A与M-探针反应2小时。然后,再次从机器中取出比色皿,并将具有正确靶的溶液加入比色皿以产生10nMM-探针、30nM错配靶和30nM完全匹配靶的最终混合物。对于数据采集,将激发波长和发射波长设定于582nm和600nm,以在我们的当前缓冲液中产生ROX荧光团的最佳荧光信号。对于激发和发射两者,将狭缝尺寸设定为4nm,并且积分时间为10秒每个比色皿,积分间隔为60秒。通过购自ThermoFisherScientific的外部水浴来控制荧光测量期间的反应温度。将实验数据输出成文本文件,随后使用MATLAB脚本导入和绘制成图。时间t=0对应于添加靶溶液后采集的第一个数据点。表1:在每个实验中使用的M-探针的组分链的化学计量比。化学计量比是从下通用链到上通用链逆时针排列的。用于均衡荧光测量的方案。使用AppliedBiosystemsQuantStudio7Flex实时PCR系统作为平板读取器来测量图13D和图15C中所示的均衡荧光信号。这些实验中的最终M-探针浓度为100nM,合成靶浓度为300nM。首先将M-探针和靶混合在一起以在1×PBS中达到所需浓度,然后将反应混合物在EppendorfMasterCycler个人型热循环仪或MULTI-THERM温度控制涡旋器BenchmarkScientific中于37℃下孵育过夜12-18小时。在孵育后,将10μL的M-探针与靶的混合物吸移到96孔PCR板ThermoFisherScientific中,随后密封该96孔PCR板。在PCR机器中于37℃下执行30分钟的孵育步骤,然后在每个孔中收集30个连续数据点每个数据点30秒。将实验数据收集并导出为Excel文件,随后使用MATLAB脚本进行分析和绘图。分析包括针对位置偏差的荧光信号校正。对数据分析程序的详细描述可以在图31A-图32B及所附文本中找到。用于不对称PCR的方案。应用不对称PCR以产生图14B中使用的杂交靶。对于图14A-图14B中所示的实验,人基因组DNA样本NA18537和NA18562购自Coriell并用作扩增模板。首先使用Nanodrop2000c分光光度计ThermoFisherScientific对该gDNA样本进行定量,然后在1×Tris·EDTA0.1%Tween20溶液中稀释至达到100ngμL。将稀释的模板储备液储存在4℃下直到使用。如图14A所示,将PCR引物设计成扩增含有rs1509186SNP的590nt扩增子,并将n=3的M-探针设计成与具有序列匹配NA18562的扩增子的560nt结合。基于1000Genomes基因型数据库,预计在560nt靶向区中,在NA18537与NA18562之间不存在其他序列差异。SNP定位于距M-探针靶区的5′末端196nt处。类似地,在rs9509962SNP周围产生单独的590nt扩增子;此第二M-探针也是560nt长,并且SNP与靶区的5′端相距285nt。垂直虚线表示分离M-探针节段的接头。探针和靶制备的相关细节,请参见图33A-图37C所附文本。在图14B中,于45℃下在1×PBS中进行杂交实验。来自NA18562gDNA样本的扩增子实线比来自NA18537样本的扩增子虚线诱导显著更高的荧光,表明M-探针甚至对560nt靶序列上的单核苷酸变异也具有选择性。我们通过混合10×PCR缓冲液含有Mg2+,Sigma-Aldrich、dNTP混合物由dATP、dTTP、dCTP和dGTP储备液制备,Sigma-Aldrich、正向引物、反向引物、Taq聚合酶Sigma-Aldrich、模板溶液和Milli-QH2O来制备我们的PCR反应混合物。总反应体积在0.7mLEppendorfPCR试管中为50μL,如表S0-2中所示。将含有反应混合物的离心管置于三个EppendorfMasterCycler个人型热循环仪中的一个内,按照表3中列出的PCR方案进行扩增。用于选择性捕获长三联体重复的方案。首先使用5循环PCR程序扩增7种基因组DNA样本NA18537、NA18524、NA20245、NA20248、NA20208、NA20209和NA20210的HTT基因中的CAG重复表4、表5。所有基因组均购自Coriell,作为验证我们技术的参考模板。NA20245、NA20248、NA20208、NA20209和NA20210具有已知的CAG重复长度,而NA18537和NA18524具有未知的CAG重复长度。首先用Nanodrop2000c分光光度计ThermoFisherScientific对gDNA样本进行定量。然后使用各种量的模板溶液来制备PCR混合物。表2:不对称PCR反应混合物配制表3:热循环仪不对称PCR程序。表4:5循环PCR反应混合物配制。表5:5循环PCR程序。在PCR后,将100μL的反应产物样本进行柱纯化,并各自在90μL的MilliQ水中洗脱。将15μL的洗脱产物在95℃下变性10min,然后与15μL的2×PBS和15μL预退火的存在于1×PBS中的600pM探针溶液混合以形成45μL的杂交反应混合物探针最终浓度为200pM,所述探针溶液含有以下捕获探针中的一种:MP-9、MP-27、MP-33、MP-35、MP-36、MP-37或MP-39。在此,M-探针的通用链未被荧光团和猝灭剂官能化。相反,利用生物素部分将下通用链的51末端官能化,使得与探针结合的DNA分子可以随后通过链霉亲和素官能化的磁珠进行分离。使混合物在37℃下反应过夜12至18小时。在使用珠粒捕获结合的DNA之前,将10μL的DynabeadsMyOne链霉亲和素T1磁珠溶液等分,在1×PBS中洗涤三次,并在65μL1×PBS中再悬浮以用于各个反应。然后,将45μL经孵育的样本转移到含有制备的珠粒的试管中。在彻底混合后,将试管在37℃于恒定振荡rpm=450下孵育1小时。将含有未结合的DNA的上清液冲洗掉,随后通过将珠粒在25μLMilliQ水中于95℃下孵育10分钟而将在珠粒表面上捕获的链释放。然后通过使用表6中所示方案的qPCR来对洗脱的溶液进行定量。qPCR在Bio-RadCFX96机器中一式三份地进行。表6:qPCR程序。实施例1M-探针设计原理M-探针反应机理。从概念上讲,M-探针可以被认为是立足点探针的多链等同物,其中探针和保护序列分布在通过臂连接的多个寡核苷酸上。上链共同形成保护体,而下链共同形成探针。在与靶杂交后,保护复合体上链将通过链置换而与探针复合体下链解离。M-探针与其靶之间的杂交反应的机理如图16中所示。M-探针的t节段的单链部分称为立足点toehold,并且用作链置换过程的起始区。然后,多链中间体以随机游走方式从终止节段t前进至最左侧节段s1,穿过内部节段si。在与靶序列进行杂交反应后,上部M-探针寡核苷酸作为多链保护复合体而被释放。如图11A中所示,下部寡核苷酸具有与靶的子序列互补的序列,并且上部寡核苷酸具有与靶的子序列相同的序列。最右侧的下部寡核苷酸的单链核苷酸引发杂交反应,并且被称为立足点。在通用节段u中,上部寡核苷酸和下部寡核苷酸分别由猝灭剂Q和荧光团F官能化。如图11B中所示,由于荧光团和猝灭剂的离域,荧光通过M-探针与靶的杂交过程而增加。杂交反应设计为是可逆且具有序列特异性的。图11C描绘了于37℃下在1×PBS中n=1的M-探针10nM与43nt合成靶寡核苷酸30nM杂交的实验结果。靶的单核苷酸变异12G>T和31G>A,分别在s1节段和t节段中,突出显示引起比预期的靶T显著更低的荧光信号。图11C示出将匹配的靶加入到M-探针的溶液仍然产生立即和强烈的荧光响应,其中所述M-探针的溶液与具有单核苷酸变异的靶预反应。这表明变异12G>T和31G>A在中间状态1和2下不捕集M-探针图16。因此,M-探针不易被变异“毒害”,并且可靠地与其预期的靶序列杂交。M-探针热力学的设计。M-探针与其预期靶之间的杂交反应的标准自由能可以基于文献参数来计算,并且在图17中示出。ΔG°Toe项表示立足点结合的标准自由能,ΔG°NH1、ΔG°NH2是非同源区的标准自由能,ΔG°ML1、ΔG°ML2、ΔG°ML3是在不同杂交区的接头处形成的多环的估计标准自由能,并且ΔG°标记是紧邻猝灭剂的荧光团的热力学贡献与溶液中游离荧光团的热力学贡献之间的估计的标准自由能差。基于最近邻模型来计算各区之间杂交的标准自由能。垂直臂序列被设计为彼此正交,并且不太可能与人基因组结合,因为它们选自与人DNA具有低同源性的序列文库例如ERCC外部RNA对照。垂直臂在与靶的反应过程中保持杂交,因此ΔG°rxn的计算不会明确地考虑这些区。M-探针制剂的化学计量。我们通常使用化学计量比的组分链来配制M-探针,使得每个单独链的量从左下角荧光团标记的uC链,参见图18以逆时针方式增加。使用n=1的M-探针作为示例,我们用uC∶s1C∶tC∶tP∶s1P∶uP=1∶1.5∶2∶3∶4∶5的比率来配制该M-探针。热退火后,我们应该得到1x的所需产物和几种非所需的产物。考虑到链定量的不准确性,该化学计量被设计用于防止配制出非所需的副产物例如,参见图19。然而,只要通用荧光链是限制性子组分,任意化学计量就应该适用于大多数应用。M-探针制剂的产率。为了显示M-探针制备的效率和产率,我们使用不同退火方案和不同化学计量比制备了基本验证探针用于图11C中和重复CAG重复探针MP-18用于图15B中。然后使用8%天然聚丙烯酰胺凝胶电泳PAGE来评估每种M-探针制备方法的产率。将5uL的500nMDNA移液到各个泳道中,并将凝胶在100伏下运行。在ROX荧光团的激发发射波长582nm600nm下扫描凝胶。通常,不同的制备方案在M-探针制剂产率方面产生很小的变化,其中变化在2%以内图20B。在图20A中,每个泳道填充有5uL的500nMDNA。泳道1至泳道4填充有CAG重复探针MP-18。泳道1:使用1∶1.1∶1.1∶1.1∶2.1∶2.1∶2.1∶2.1的化学计量比制备的MP-18,一步形成。泳道2:1∶1.1∶1.1∶1.1∶2.1∶2.1∶2.1∶2.1,两步形成。泳道3:1∶1.2∶2.8∶3.2∶1.4∶1.5∶2.5∶2.6,一步形成。泳道4:1∶1.2∶2.8∶3.2∶1.4∶1.5∶2.5∶2.6,两步形成。泳道5至泳道7填充有非重复探针图11C中使用的探针。泳道5:1∶1.1∶1.1∶2.1∶2.1∶2.1,一步形成。泳道6:1∶1.1∶1.1∶2.1∶2.1∶2.1,两步形成。泳道7:1∶1.1∶1.1∶2.1∶2.1∶2.1,具有不含ROX荧光团的uC链。泳道8至泳道9是单链ROX荧光团链。在图20B中,用ImageQuantTL软件分析凝胶图像。自动检测条带,并使用与ImageQuantTL软件一起打包的“滚球rollingball”算法扣除凝胶的荧光背景。将条带强度绘制成图。将2条虚线之间的AUC与总AUC的比率用作M-探针制备的产率。M-探针的稳定性。为了评估M-探针的稳定性,我们在第1天和第33天进行了基本探针验证实验与图11C中所示相同。M-探针的动力学和选择性保持不变图21A-图21B。结果表明退火的M-探针可以储存超过一个月,并且每次分析不需要进行新的制备。M-探针与立足点探针和X-探针的比较。当反应ΔG°为约0时,立足点探针、X-探针n=0的M-探针和M-探针都遵循相同的设计原则并表现出高序列特异性。为了研究这三种实施方式之间是否存在系统差异,我们针对相同的合成靶DNA序列测试了各种设计中的一种图22A-图22C。这三种设计定性地产生了类似的结果,但是M-探针和X-探针在没有添加靶的情况下表现出更高的背景信号。该较高的背景可能是因为荧光团和猝灭剂附近的多环增加了荧光团和猝灭剂分开的距离大于荧光团的Forster半径的可能性。另外,立足点探针表现出的来自单核苷酸变异靶的荧光低于M-探针和X-探针;这可能是由于M-探针和X-探针的ΔG°ML项被低估,导致反应ΔG°显著低于根据计算所预期的,从而导致特异性降低。我们认为,优化M-探针和X-探针序列以缩短立足点的长度应校正与立足点探针的这种差异。M-探针通用节段的设计。M-探针的通用节段u通常由一种或多种化学部分官能化,以促进对所关注的靶的检测或富集。构成通用节段的两个寡核苷酸可以任选地具有互补的水平区,以及将它们连接到节段s1所需的臂序列。X-探针是n=0的M-探针的特殊情况,用于研究通用节段中互补区的长度的影响。图23A-图23D示出了在u中具有不同互补长度的4种不同X-探针设计的序列设计。为了保持对单核苷酸变异的序列选择性,将不与靶互补的附加核苷酸引入靶特异性节段的上游以维持总反应标准自由能ΔG°≈0。我们将这些附加的核苷酸表示为左非同源区和右非同源区。u左非同源区中互补区的强度影响反应动力学和荧光信噪比。在非常长的左非同源区的限制下,荧光团标记的链和猝灭剂标记的链的解离可能非常慢。在非常短的左非同源区的限制下,其中碱基堆叠的强度没有强到足以克服闭合多环的熵罚分,荧光团和猝灭剂不共定位,并且M-探针表现出高背景荧光。具有短的左非同源区的探针的猝灭效率通常比没有左非同源区的探针的猝灭效率差图23D。示例2VDJ靶设计。我们基于已发表的来自外周血的T淋巴细胞的VDJ组合序列设计了合成的VDJ杂交靶。对根据从380名男性和170名女性汇集的外周T细胞mRNA的测序数据组装的CDR3克隆种类的33664个序列进行分析,并且将具有对V和J两者的明确分配的22704个序列用于进一步分析。为了确定在V区的3′末端和J区的5′末端附近存在的缺失数,将在CDR3克隆种类中观察到的V序列和J序列与从IMGTGene-DBhttp:www.imgt.orggenedb下载的相应的种系编码的V基因序列和J基因序列进行比较。对于该数据集,V节段的3′处的缺失可以多达13个碱基,并且J节段的5′末端的缺失可以多达25个碱基图24B。根据IMGTGene-DB,2个种系编码的功能性TRBD基因非常短,分别为12nt和16nt。因此,在大量碱基缺失和插入后,D节段的起源通常是不可识别的。在我们的分析中,我们将未模板化的碱基和剩余的D基因序列视为“V-J之间的序列”,并且不特别区分这两者。结果显示V与J之间的序列的长度在0与44个碱基之间图24B。我们基于8个任意选择的TRBV基因、48个V-J之间的生物学上存在的序列和6个任意选择的TRBJ基因设计了48个VDJ重组靶。因此,为每个V节段分配了6个靶,并且为每个J节段分配了8个靶。生物学中所选V节段和J节段内缺失的分布如图25和图26所示,并且在我们的设计中大致保守。例如,对于具有V5-1作为V节段的6种靶,它们中的2种在V区中没有任何缺失,它们中的另外2种具有4nt缺失,1种具有1nt缺失,并且最后一种具有2nt缺失。对于具有J1-3作为J节段的8种靶,它们中的4种在J区中没有任何缺失,它们中的2种具有4nt缺失,1种具有2nt缺失,并且最后一种具有3nt缺失。根据图24B中所示的长度分布,从22704种CDR3克隆种类中提取的相应序列列表中任意选择V-J之间的48个不同序列。然后随机装配这些V节段、V-J之间的序列和J节段以形成全长杂交靶。示例3VDJ探针设计种系编码的D基因非常短,并且由于大量的碱基缺失和随机插入,成熟T细胞中的D基因使用通常是不可识别的。因此,我们设计了n=1的M-探针,该M-探针所具有的s1节段和t节段仅靶向V和J种系基因子序列,该V和J种系基因子序列不太可能在VDJ重组过程中缺失。当匹配的靶DNA序列结合到M-探针时,凸起将在s1节段与t节段之间的接头处形成。该凸起包括剩余D区中的所有碱基,以及V-D接头和D-J接头处的随机缺失和非模板化插入。VDJ探针的靶向区被设计为仅覆盖从V的最3′端的第35个碱基至J的最5′端的第35个碱基的序列,这是因为CDR3上游和下游的序列V的5′和J的3′通常是保守的,并且因此在这种情况下不提供信息。图27示出了在靶向V2和J1-3的M-探针与其对应的靶之间的反应的热力学计算中使用的值,所述相应的靶在V中具有2nt缺失,在J中具有0nt缺失,并且在V与J之间具有17nt序列。在靶与探针杂交后,将在V与J之间的接头处形成26nt的凸起。48个完全匹配的M-探针与靶反应的凸起尺寸的分布示出于图28中。针对图27中的反应计算的自由能如下:我们估计产物中凸起的自由能值包括多环罚分为约+8.0kcalmol,并且荧光团-猝灭剂相互作用为-1.5kcalmol。DNA杂交的标准模型表明了能量对凸起长度的对数依赖性,因此除了在明显靶二级结构的情况下,不同靶序列对同一M-探针的ΔG°值不应有大的偏差。然后我们设计了立足点和非同源区,以使总反应能量略低于0kcalmol。因此,探针将保持对V节段和J节段中的突变的良好特异性,而且还提供对在接头处形成的较大凸起结构域的耐受性。因此,尽管事实上一些凸起序列可以超过30nt长,但是荧光响应曲线显示这些靶仍然可以以合理快速的方式与M-探针反应图29A-图29C。图30A-图30B示出了荧光信号对照探针与靶之间错配的数目的蜂群图曲线。在分析中使用我们用于生成图13D的相同数据集。0个错配代表完全匹配的探针和靶对。左小图中的紫色点表示在V节段中具有错配的336个探针和靶对,而右小图中的紫色点表示在J节段中具有错配的240个探针和靶对。无论错配的数量和位置如何,都观察到高特异性。示例4VDJM-探针反应的终点荧光测量。在实施例3中,我们展示了VDJM-探针与其靶杂交的动力学迹线。为了实现对大量靶-探针组合的终点数据的更高通量收集,我们使用AppliedBiosystemsQuantStudio7Flex实时PCR系统来测量杂交后产物的荧光。应注意,没有添加聚合酶;该仪器仅用于温度控制和荧光测量。96个不同的孔位置各自在荧光水平上表现出轻微的偏差。我们在实验分析之前进行了校准实验以校正这些系统位置偏差。图31A示出了位置校正之前4个平板的平均相对荧光单位RFU水平。我们将10μL的0nM、50nM、100nM和200nMROX标记的寡核苷酸溶液吸移到各个平板的各个孔中。x轴和y轴表示孔位置,并且每个孔的颜色表示在37℃孵育20min后收集的20个连续荧光测量值的平均值。对于所有浓度,平均荧光值在不同的孔位置中变化;在平板的中左侧的孔倾向于具有比其他孔低至多30%的荧光。为了校正位置依赖性,将整个平板的平均荧光用作参考。我们进行了在参考荧光与四种浓度的原始荧光之间的线性回归,然后施加最佳拟合斜率和截距值来将每个孔的荧光线性转换为等同的参考荧光。孔A1的位置校正在图31B中作为示例示出。初步实验。在进行所有48种VDJM-探针的实验之前,我们首先对8种M-探针及其对应的8种靶序列进行较小规模的测试。研究了总共64次反应的探针与靶之间的每个成对相互作用图32A。M-探针与其对应靶配对的反应显示出高终点荧光红色和粉红色迹线,并且所有其他反应显示出显著较低的荧光绿色和浅绿色迹线。结果汇总在图32B中。由于靶和探针之间的二级结构和有效ΔG°rxn不同,所以观察到的完全匹配杂交反应的荧光值存在一些变化图32B中的主对角线。示例5长靶较长的靶DNA序列更容易形成明显的二级结构,这可能由于热力学和动力学原因而干扰与M-探针的预期杂交。出于该原因,当使用基因组DNA样本工作时,我们首先进行PCR扩增以产生较短的扩增子,然后将该较短的扩增子与M-探针杂交。然而,即使仅考虑扩增子,对于一些靶序列可能仍然存在显著的二级结构。为了证明M-探针探测长序列的能力,我们设计了靶向99nt、160nt、218nt、430nt和560nt图14A-图14B靶序列的相应M-探针。图33A-图33B示出了靶向KRAS基因cDNA靶的99nt子序列和160nt子序列的两种M-探针的设计和性能,并且图33C-图33D进一步示出了靶向KRAScDNA的218nt子序列的M-探针的序列选择性。M-探针与它们各自相应的靶之间的所有杂交反应在10nMM-探针浓度下在反应的20分钟内产生预期的荧光。在此,靶是使用不对称PCR从合成IDTgBlock基因片段产生的单链扩增子序列。图34A-图34B中示出了上述实验中使用的靶的预测最小自由能mfe结构,如针对1XPBS0.15MNa+等同的盐度和37℃的实验条件通过NUPACK预测的。通过概率着色来呈现结构,在所述概率着色中靶结构中的每个碱基按照每个核苷酸碱基采用图中描绘的配对状态的概率进行着色。图34A示出了179ntKRAS扩增子上的靶向区,包括KRAS靶序列的5′区的17nt内含子区。图34B示出了277ntKRAS扩增子上的靶向区,所述靶向区跨越KRAScDNA的位置180至位置456。图35A-图35B示出了对三种靶序列扩增的qPCR分析。对于用于产生具有3nt缺失和6nt缺失的扩增子fP2和fP3的引物,观察到了一定的扩增延迟,这是因为与fP1相比,fP2和fP3与模板结合地不太顺利。因为不对称PCR运行70个循环,所以尽管三种扩增子靶的Ct值不同,但这三种扩增子靶的数量应该几乎相同。没有模板对照Ct值表明,与扩增子相比,引物二聚体形成不明显。靶向围绕SNPrs7648926侧翼的430nt序列的M-探针的设计和性能示出在图36A-图36B中。与560ntM-探针类似,M-探针430具有与样本NA18562相同的基因型,而具有与样本NA18537不同的基因型。杂交后立即显示了单碱基区别。通过优化探针热力学可以实现完全匹配和错配反应曲线之间的更好分离。为了最小化靶二级结构对探针反应动力学的潜在影响,在45℃而不是37℃下进行M-探针与超过400nt靶向区的反应。超过400nt的扩增子的二级结构的最小自由能和相应M-探针的节段分布示出于图37A-37C中。n≥1的M-探针具有多个靶特异性节段包括t,并且可以绕过寡核苷酸合成限制以探测更长的连续靶序列。例如,鉴于L核苷酸的寡核苷酸合成限制标准寡核苷酸的L=100,IDT超聚体寡核苷酸的L=200,n个内部节段中的每一者都可以探测L-2A个核苷酸其中A是臂序列的长度,并且末端t节段可以探测L-A个核苷酸。因此,n个内部节段M-探针可以探测以下最大长度LMLM=n+1·L-2n+1·A连续核苷酸。根据上面的等式,很明显的是,M-探针有利于较短的臂长A。用于稳定形成M-探针的A的最小长度取决于臂序列、温度和缓冲液盐度;在37-45℃和1×PBS下,A=22对于大多数臂序列的稳定性是足够的。对于L=180和A=22,n=2的M-探针可探测高达430nt,并且n=3的M-探针可探测高达564nt。即使在结合长DNA靶时,M-探针仍保持其高序列选择性。图14A-图14B示出在两种不同的560nt靶向区内检测到了两种单核苷酸多态性SNP。这些实验的靶是来自NA18562和NA18537细胞系基因组DNA的扩增子,所述扩增子在M-探针靶向区的中间仅有单个核苷酸不同。先前没有证明DNA杂交探针对探测超过约50nt的长度的单核苷酸选择性。因此,M-探针将等位基因特异性检测和富集的有效长度范围增大了超过10倍,并且可以潜在地用作用于确认序列的新方法。我们还设计并测试了靶向序列为99nt、160nt、218nt和430nt长的M-探针,并获得了预期结果;有关详细信息,请参见图33A-图37C及所附文本。示例6三核苷酸重复分析。对于标准分子分析技术来说进行DNA三核苷酸重复扩增分析是困难的。图38示出了对具有26个CAG重复的合成超聚体DNA寡核苷酸进行Sanger测序的结果。只能对前15个CAG重复进行明确分析;这不足以用于对亨廷顿氏病和其他三联重复疾病进行诊断分析。条件性发荧光的M-探针的设计和配制。每个M-探针提供有关DNA样本是否含有三联体重复数等于或超过设计数的HTT基因的信息。因此,具有不同三联体重复阈值的一系列不同M-探针能够提供关于三联体重复数的精确信息。图39示出了M-探针的组分,所述组分的阈值在3个与27个重复之间。我们研究了组分链的化学计量比是否对M-探针性能具有显著影响图40A-图40B。我们所解决的问题是,因为通过260nm吸光度A260进行DNA寡核苷酸定量由于消光系数估计误差以及缓冲液和其他杂质对A260的贡献误差而是不准确的,所以一些寡核苷酸种类的浓度会比预期高或低20%之多。在对抗性情况下,这可能导致大部分M-探针畸形而不与预期靶反应,或者甚至与变体进行非特异性反应。一种防止这种情况的方式是使用相对于其他链有意过量的某些链,使得所有可能的副产物都是不会产生假阳性信号的非荧光物质。我们的比较实验再次表明,这个潜在的问题在实践中并不重要。用于分析CGG和GAA三联体重复序列的M-探针。我们还设计了靶向FMR1基因CGG重复区图41A和FXN基因GAA重复区图41B的M-探针。前者的三核苷酸重复扩增与脆性X染色体综合征相关,而后者的三核苷酸重复扩增与弗里德希氏共济失调相关。对于CGG重复检测,我们将M-探针设计成靶向反向链,以避免由富含G的序列形成强二级结构。对合成三联体重复样本进行的对照荧光实验。图42示出了M-探针对8种合成靶的响应、背景水平和每个数据点的标准偏差的单独曲线。与合成的寡核苷酸靶相比,基因组DNA样本通常在HTT基因座中是杂合的-两个单倍体拷贝的CAG重复数目是不同的。为了证明我们的方法也可以分析杂合样本,我们使用具有9个CAG重复的靶和具有24个CAG重复的靶的1∶1混合物图43A和具有12个重复的靶和具有21个重复的靶的1∶1混合物图43B来测试我们的探针。与纯合样本相比,转变点不太明显图42。在通过使用探针与T-CAG27之间的信号进行数据归一化之后,当探针重复数超过每个等位基因的重复数时,我们观察到了2个显著的约最大荧光的50%信号下降。这些结果表明,通过对实验方案的微小修改,M-探针具有分析杂合样本的潜力。为了分析来自人基因组DNA样本的HTT三联体重复,对HTT重复区进行PCR扩增,并将扩增子用作杂交靶。图44A示出了靶向6CAG重复的M-探针对从人基因组DNA样本NA18537产生的PCR扩增子的荧光响应。图44B总结了观察到的一系列M-探针对NA18537扩增子的响应,其中HTT基因中的CAG重复未在1000Genomes数据库中表征。因为人基因组DNA是二倍体,所以存在HTT的两个拷贝,这两个拷贝可能具有不同的三联体重复数。基于图44B中的数据,我们认为这两个HTT基因拷贝都具有少于21个重复,并且它们中的一个可具有少于18个重复。还通过相同的方法分析了具有未知HTT重复状态的6种其他基因组样本的HTT基因重复数图44C。使用生物素官能化的M-探针从基因组DNA中选择性捕获高重复HTT基因。为了应用M-探针来分析基因组DNA样本中HTT中的三联体重复数,使用生物素官能化的M-探针来选择性结合所具有的HTT超过三联体重复的阈值数的DNA。为了证明我们的方法能够精确地确定基因组DNA样本中的重复数,我们设计了具有33个、35个、36个、37个和39个CAG重复的HTT探针示意图在图45中示出,并使用它们来捕获样本NA20248中具有36个CAG重复的显性等位基因的HTT区。作为用于确定基因组DNA样本中疾病可能性的最小方法,我们使用探针HTT9和HTT27来捕获8种基因组样本的HTT区。单独qPCR迹线示出在图46中。所有Ct值列于表7中。表7:对生物素官能化的M-探针杂交捕获产物的qPCR结果的总结。NA18537和NA18524样本的三联体重复数目未在公开可得的数据库中报告。1×TE表示阴性对照实验,在所述阴性对照实验中M-探针与不含gDNA样本的空白样本杂交。“裸珠粒”表示不使用M-探针的阴性对照实验,用于表征磁珠对基因组DNA的非特异性捕获量。最后一行展示了仅使用引物而不含样本引物二聚体Ct的阴性对照。图15A示出了被设计用于分析亨廷顿氏基因HTT中的CAG三联体重复的M-探针的示意图。在图15A中,设计了一系列M-探针,每种M-探针靶向阈值数量的三联体重复在亨廷顿氏基因HTT的情况下为CAG。只有达到或超过其阈值重复数的靶序列才会与M-探针显著杂交。除了重复区黄色之外,M-探针还与8nt的下游序列绿色结合以确保与HTT基因的特异性杂交。图15B示出了靶向18个CAG重复的条件性发荧光M-探针对具有12个、15个、18个、21个和24个重复的5种不同DNA寡核苷酸靶分别标记为T12、T15、T18、T21和T24的荧光响应。在图15B中,[M-探针]=10nM并且[靶]=30nM;杂交在37℃下在1×PBS中进行。每个M-探针的t节段中的非重复HTT特异性序列确保M-探针结合特异于HTT基因,而不是具有CAG三联体重复的其他基因组区。尽管各种M-探针制剂方案通常产生相似的形成产率图20A-图20B,但对于本章节中的重复序列M-探针,将节段单独退火并随后进行组合。设计了一系列M-探针,每种M-探针靶向不同数量的CAG重复;重复数等于或超过M-探针的重复数的任何HTT基因序列将会引发阳性信号。因此,当HTT基因或扩增子的等分试样与一系列M-探针反应时,仍然产生阳性信号的最长M-探针指示三联体重复的数目。T18、T21和T24表现为与M-探针显著结合,而不与T12和T15显著结合,证实了该M-探针作用为被设计充当三核苷酸重复数的可编程高通过滤器。图15C示出了对不同M-探针与合成寡核苷酸靶之间的响应的总结;仅当靶重复数等于或超过M-探针重复数时才观察到显著的杂交。类似的M-探针也被验证用于分析CGG重复与脆性X染色体综合征相关和GAA重复与弗里德希氏共济失调相关的三联体重复数;有关细节和结果,请参见图38-图46的论述。为了应用M-探针来分析基因组DNA样本中HTT中的三联体重复数,使用生物素官能化的M-探针来选择性结合所具有的HTT超过三联体重复的阈值数的DNA图15D。在图15D中,使用链霉亲和素官能化的磁珠来分离结合的DNA和未结合的DNA。随后通过qPCR对捕获的DNA分子进行扩增和定量。首先用5循环PCR方案预扩增基因组DNA样本,以产生具有HTT三联体重复的扩增子以及所述重复的最少上游20nt和下游14nt。以这种方式产生的扩增子不具有可能干扰与M-探针的杂交由于二级结构等的5′和3′长悬垂端。随后将这些扩增子与适当的M-探针一起孵育并用链霉亲和素包被的磁珠进行捕获;通过洗涤步骤去除未结合的DNA分子。使用qPCR对捕获的DNA进行洗脱和定量图15E。在图15E中,使用靶向9个重复的M-探针M-探针9和靶向27个重复的M-探针M-探针27来对gDNA样本进行分类。观察到的NA20245的5循环阈值差异ΔCt表明,具有高于阈值重复数的HTT基因的捕获效率比低于阈值的那些高约30倍。具有少于阈值重复数M-探针中的三联体数的HTT基因的扩增显示出比超过阈值重复数的HTT基因显著更高的循环阈值Ct。通过设计两个不同的M-探针,一个靶向9个重复,一个靶向27个重复,我们可以控制样本变异性,并通过观察到的Ct值的差异ΔCt来确定潜在的疾病状态。小<2ΔCt值指示两个HTT基因拷贝中的至少一个超过27个重复,并且大>5ΔCt值指示相反情况。低重复数HTT基因的残余扩增可能是由于基因组DNA与磁珠的非特异性结合数据未示出。图15F总结了7种基因组DNA样本的观察结果,其中5种具有已知的HTT基因型,2种具有未知的基因型。在图15F中,具有少于27个重复的样本表现出大于5的循环ΔCt;并且具有扩展的三联体重复具有亨廷顿氏病风险的样本表现出小于2的循环ΔCt。我们的方法正确识别了5种已知样本的长度状态,并确定NA18537样本和NA18524样本均仅具有低于27个CAG重复的HTT基因。2种M-探针系统在此靶向9个重复和27个重复代表确定未知基因组DNA样本中的疾病可能性所需的最小方案。通过将该方法扩展成包括具有不同三联体重复阈值的更多种M-探针,可以实现对HTT三联体重复数的更精确定量。为了证明这一点,我们设计了靶向33个、35个、36个、37个和39个CAG重复的5种不同M-探针,并将所述M-探针施加至NA20248基因组DNA样本。靶向37个重复和39个重复的M-探针的实验Ct值比靶向33个重复、35个重复和36个重复的M-探针高多于5个循环,正确地表明该样本具有一个具有恰好36个CAG重复的HTT基因拷贝图15G在图15G中,构建了靶向33个重复、35个重复、36个重复、37个重复和39个重复的5种不同的M-探针,并将所述M-探针施加至NA20248基因组DNA样本。基于观察到的Ct值,正确地确定NA20248拥有具有36个重复的HTT基因。除了我们在此提出的杂交捕获工作流程之外,用于使用M-探针来分析三联体重复的替代方法是将HTT基因扩增至高于纳摩尔浓度,然后将扩增子直接与条件性发荧光的M-探针反应。该第二种方法的相对优点是避免了固相分离步骤,从而缩短了总的实际操作时间。相对缺点是对高浓度扩增子进行开管步骤可能导致实验室污染,并且是在诊断设置中不希望出现的情况。两种方法都能够在小扩增范围例如对于亨廷顿氏病为27-40内使用单一重复分辨来可靠地检测重复扩增,这是通过先前报道的方法难以实现的。Budworth,H.和McMurray,C.T.,关于体细胞CAG重复扩增及其与亨廷顿氏病的毒性的关系的分析的问题与解决方案ProblemsandsolutionsfortheanalysisofsomaticCAGrepeatexpansionandtheirrelationshiptoHuntington′sdiseasetoxicity.RareDis,4:e11318852016;Jama,M.、Millson,A.、Miller,C.E.和LyonE.,三联体重复引发的PCR简化了亨廷顿氏病的测定TripletrepeatprimedPCRsimplifiestestingforHuntingtondisease.JMolDiagn,15:255-2622016;Bonifazi,E.,等人,RNA荧光原位杂交在I型肌强直性营养不良的产前分子诊断中的应用UseofRNAfluorescenceinsituhybridizationintheprenatalmoleculardiagnosisofmyotonicdystrophytypeI.ClinChem,52:319-3222006;Kern,A.,和Seitz,O.,对重复DNA序列的模板指导连接:一种用于探测亨廷顿氏DNA长度的化学方法Template-directedligationonrepetitiveDNAsequences:achemicalmethodtoprobethelengthofHuntingtonDNA.ChemSci,6:724-7282015。通过使用具有更多和或更长节段的M-探针,还可以分析更大的扩增范围。示例7寡核苷酸序列的列表。在此列出了用于所有实验的寡核苷酸序列。对于每个M-探针,具有与靶序列的序列同源性的上部寡核苷酸被称为P保护体序列,并且具有与靶序列的序列互补性的下部寡核苷酸被称为C补体序列。每条链在其名称标签中包括:使用该链的图,该链所属的节段,以及必要时的附加描述词。例如,图11-uP是指图11A-图11C中的猝灭剂标记的寡核苷酸u对应于通用节段,P对应于上链。M-探针概念验证实验图11A-图11C。图11C和图16-图23D中使用的合成DNA靶和探针的寡核苷酸序列示于表8中。所有序列均订购自IntegrateDNATechnologiesIDT。5IAbRQ表示在寡核苷酸的5′末端官能化的IowaBlackRQ猝灭剂部分,并且3Rox_N表示在寡核苷酸的3′末端由NHS酯化学物官能化的ROX荧光团的IDT条目代码。将荧光团标记的uC链和猝灭剂标记的uP链由IDT进行合成后HPLC纯化;所有其他链都订购为进行标准脱盐和不进行纯化。表8:用于图11A-图11C和图16-图22C的寡核苷酸序列。表9:用于非同源分布实验的序列如图23A-图23D中所示。M-探针接头处的序列变异耐受性图12A-图12D。用于如图12A-图12D所示的序列变异耐受性实验的靶和探针的序列列出于下表中。除图12-tP和图12-tC外,所有寡核苷酸均经HPLC纯化。表10:用于构建图12A-图12D中使用的M-探针的寡核苷酸序列。5IABkFQ表示寡核苷酸5′末端处的IowaBlackFQ猝灭剂修饰。臂区以大写字母示出。表11:用作图12A-图12D实验的靶和变体的寡核苷酸序列。下划线表示缺失,并且省略号...表示序列在下一行继续。经由由组合模块构建的M-探针进行VDJ重组检测图13A-图13D。该章节展示了用于图13A-图13D和图24-图32B中的T细胞受体βVDJ重组实验的靶和探针的寡核苷酸序列。所有靶链均被订购为进行HPLC纯化,而M-探针相关链例如s1P被订购为标准脱盐寡核苷酸。表12:用于构建用于图13A-图13D和图24-图32B中的实验的M-探针的寡核苷酸序列。表13:用作用于图13A-图13D和图24-图32B中的实验的靶的寡核苷酸序列。表14:用作用于图13A-图13D和图24-图32B中的实验的靶的寡核苷酸序列。使用M-探针来探测和检测长靶图14A-图14B。该章节展示了用于使用结合连续长靶序列的M-探针进行实验的靶和探针的寡核苷酸序列图14A-14B。除引物外,本章节中的所有寡核苷酸均使用PAGE进行合成后纯化。表15:用于构建图33A-图33D中使用的M-探针的寡核苷酸序列。表16:用于产生扩增子作为靶以在图33A-图33D中与M-探针反应的引物表17:用作PCR扩增模板的gBlock序列。大写的序列是侧翼内含子序列表18:用于图14A-图14B和图36A-图36B中的通用P和C序列表19:用于产生扩增子作为靶以在图14A-图14B和图36A-图36B中与M-探针反应的引物。表20:用于构建图36A-图36B中使用的M-探针的寡核苷酸序列。表21:用于构建图14A-图14B中使用的M-探针的寡核苷酸序列。表22:用作430ntM-探针chr3.1772231-1772689,GRCh37.p13初级装配的靶的扩增子序列。大写的序列是探测序列。表23:用作560ntM-探针-1chr9.1095713-1096302,GRCh37.p13初级装配和M-探针-2chrl3.22569207-22569796,GRCh37.p13初级装配的靶的扩增子序列。大写的序列是探测序列。检测重复序列图15A-图15G。本章节展示了用于使用M-探针分析亨廷顿氏基因HTT中的基因组DNA的三联体重复数图15A-图15G、图38-图40、图42-图46,以及其他三联体重复图41的实验的靶和探针的寡核苷酸序列。图15abc-靶-21r,图15abc-靶-24r和图15abc-靶-27r是经合成后PAGE纯化的,并且所有其他链是HPLC纯化的。表24:用作图15A-图15C的合成靶的寡核苷酸序列。表25:用于构建图15B-图15F的M-探针的寡核苷酸序列。表26:用于图15D-图15G所示的杂交捕获实验的通用节段寡核苷酸。表27:用于构建图15G的M-探针的寡核苷酸序列。表28:用于图38中的Sanger测序实验的具有26个CAG重复的超聚体合成序列。表29:在图40A-图40B中用于测试配制方案的寡核苷酸序列。表30:在图41A中用于检查FMR1基因中的CGG重复的寡核苷酸序列。表31:在图41B中用于检查FXN基因中的GAA重复的寡核苷酸序列。示例8M-探针设计和验证。图11A示出了用于直接检测靶核酸序列的M-探针的一般结构和构建。M-探针由左通用节段u、标记为s1至sn的n个内部节段、以及右末端节段t组成。在终止节段t中,上部寡核苷酸比下部寡核苷酸短一定数量的核苷酸;最右下部链上的单链核苷酸被称为立足点。Zhang,D.Y.和Winfree,E.,使用立足点交换控制DNA链置换动力学ControlofDNAstranddisplacementkineticsusingtoeholdexchange.JAmChemSoc,131,17303-173142009。每个节段由两个经由水平区彼此杂交的寡核苷酸组成;在s节段和t节段中,这些水平区的序列是靶特异性的。在该文章整篇中,下部寡核苷酸具有与靶的子序列互补的序列,并且上部寡核苷酸具有与靶的子序列相同的序列。不同的节段经由两个垂直“臂”彼此杂交,该两个垂直“臂”具有与靶无关的序列。为了进行有效配制,每个臂具有独特的序列,所述独特的序列经计算机模拟而被设计为彼此正交并且还不可能与人类基因组结合。在与靶序列进行杂交反应后,上部M-探针寡核苷酸作为多链复合体而被释放图11B。然后,释放的多链复合体可以与产物重新缔合并诱导逆反应。遵循参考文献Zhang,D.Y.、Chen,S.X.和Yin,P.,核酸杂交特异性的热力学优化Thermodynamicoptimizationofnucleicacidhybridizationspecificity.NatChem,4,208-2142012中描述的原理,该反应可逆性允许靶与M-探针之间的杂交是选择性的,而无论靶的长度如何。关于设计细节,请参见图16-图23D和描述。图11C示出n=1的序列选择性M-探针对其靶43nt序列以及该靶的两种单核苷酸变体的荧光响应。同时,M-探针不会被具有变体的长寿命反应中间体毒害,因为在2小时处添加靶会导致立即且强烈的荧光响应。示例9程序化序列变异耐受性。许多基于杂交的富集和检测方法的一项技术挑战是在已知位置处耐受潜在的单核苷酸多态性SNP。遗传的SNP在人类基因组中是常见的,其中文献报道在普通人中SNP频率为约11000nt。InternationalHapMapConsortium等,超过310万个SNP的第二代人类单倍型图谱Asecondgenerationhumanhaplotypemapofover3.1millionSNPs.Nature,449,851-8612007。许多SNP是内含或同义突变,对蛋白质序列没有影响,但由于它们与临床或科学上重要的序列变异非常接近,所以可能会干扰杂交探针的检测或富集。作为一个示例,rs1050171是EGFR基因中的同义SNPc.2361G>A,其在人类群体中的等位基因频率为43%;其位于距c.2369C>TT790M突变8个核苷酸处,所述突变具有对抗癌药物厄洛替尼erlotinib的抗性。1000Genomes数据库和dbSNP数据库提供了关于在人基因组中等位基因频率为0.5%或更高的SNP的序列、位置和频率信息。1000GenomesProjectConsortium,关于人类遗传变异的全球参考Aglobalreferenceforhumangeneticvariation.Nature,526,68-742015;Sherry,S.T.等人,dbSNP∶NCBI遗传变异数据库dbSNP:theNCBIdatabaseofgeneticvariation.NucleicAcidsRes,29,308-3112001。图12A示出M-探针可以设计成使得预期靶中的多个核苷酸位于节段接头处并且不与M-探针绿色区中的任何核苷酸杂交。该“耐受”区中的序列变异对与M-探针进行杂交反应的具有较小的影响。相比之下,甚至在其他区中的单核苷酸变异也会导致反应的大变化,从而导致显著更低的结合率。图12D示出在使用相同的M-探针的情况下,耐受高达7nt的变异的靶的荧光响应不会显著降低到低于预期靶的荧光响应。在另一方面,非耐受变体显示出急剧下降的杂交率,甚至对于1nt缺失、插入和替换也如此。M-探针独特地提供对节段接头处的序列变化的耐受性图12A;这些位置处的序列变化、插入和缺失对整体杂交反应的标准自由能仅具有很小甚至不明显的影响。相比之下,在与节段杂交的位置处发生靶序列变异导致凸起或错配凸起,所述凸起或错配凸起使杂交产物不稳定并且使得与预期的靶序列相比,显著增加,从而导致更低的杂交率和荧光。在实验上,我们观察到在节段接头处高达7nt的变异对M-探针杂交率几乎没有影响图12B和图12D,但是甚至在节段s1和t中的单核苷酸变异也会导致结合率的严重减小图12C和图12D。对于在特定基因座处具有已知潜在变异的靶,可以将M-探针设计为使得这些基因座对应于节段接头。在一些实施例中,节段接头可以跨越至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个或100个核苷酸。在一些实施例中,节段接头可以跨越从1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸和90个核苷酸中的任一者至100个核苷酸、90个核苷酸、80个核苷酸、70个核苷酸、60个核苷酸、50个核苷酸、45个核苷酸、40个核苷酸、35个核苷酸、30个核苷酸、25个核苷酸、20个核苷酸、15个核苷酸、10个核苷酸、9个核苷酸、8个核苷酸、7个核苷酸、6个核苷酸、5个核苷酸、4个核苷酸、3个核苷酸、2个核苷酸和1个核苷酸中的任一者。由于二级结构的变化,在耐受的插入核苷酸数目方面存在显著的序列变异性。根据我们的实验和公布的热力学参数,我们相信大多数7nt插入应该是可以耐受的。然而,耐受的插入核苷酸数目没有硬性最大值-例如,具有形成完美发夹的100nt插入的有利靶序列可能仍然可以被耐受。示例10组合M-探针的形成。M-探针的模块化构建的另一个特征是多个不同的内部节段可以组合地组合以产生针对不同靶序列的许多不同M-探针图13A。图13A示出各个靶特异性节段可以选自多个模块mi。相邻节段的模块的成对组合允许通过使用有限数量的组分链来构建靶向不同靶的大量探针。在给定每个节段si的mi实例的情况下,可以构建的M-探针的总数是:其中mt是末端节段t的实例数。相比之下,用于构建这些实例的寡核苷酸的数目与mi的总和成比例,所述总和:对于大n和mi值,组合制剂显著降低检测或富集序列所需的寡核苷酸的数目。在人T细胞中,TCRβ基因经历VDJ重组,其中1V、1D和1J基因区分别选自48V、2D和13J基因节段图13B。图13B示出重组发生在48TRBV蓝色、2TRBD绿色和13个TRBJ基因橙色之间,之后是在V-D与D-J接头处的随机缺失和非模板化插入,从而产生对抗原识别很重要的高变CDR3。随机缺失和非模板化插入在V-D和D-J接头处发生,以提供进一步的T细胞受体多样性来促进对多种抗原的识别。组合配制的M-探针耐受VDJ接头处序列变异,因此非常适用于对重组TCRβ基因进行基于杂交的检测和富集。由于D基因区中的短长度和高序列变异性,我们选择将整个D区视为可变的,并将M-探针设计为n=1,其中s1节段对应于V区并且t节段对应于J区。在M-探针与其预期靶结合后时形成的凸起的长度在8nt与32nt之间变化。设计s1节段和t节段的m1=8和mt=6的不同实例,从而允许对48个组合地重组的VDJ序列进行检测图13C。图13C示出V与J之间的高变序列在与M-探针杂交后形成凸起结构,凸起大小在8nt与32nt之间。在图13D中,主对角线对应于在靶杂交,在所述在靶杂交中靶的V区和J区与M-探针节段匹配,而非对角线蓝色正方形对应于这样的杂交反应,在所述杂交反应中在M-探针与靶之间V区和J区中的一者不同。未测试V区和J区两者都不同的靶和M-探针的杂交反应灰色正方形。所有实验在37℃下在1×PBS中一式三份地进行,[M-探针]=100nM,[靶]=300nM。有关M-探针的设计细节,请参见图25-图30B和所附文本。图13D示出了对48个TCRβ序列靶与48个M-探针之间杂交的总结。主对角线对应于48个在靶杂交反应的终点荧光,在所述在靶杂交反应中,在s1区和t区的识别方面,所述靶与M-探针完全匹配关于数据采集细节,请参见图31A-图32B所附的描述。深蓝色的非对角正方形对应于576个脱靶杂交反应,在所述脱靶杂交反应中,在s1或t中的一者而非两者的识别方面,所述靶与M-探针匹配。灰色正方形表示这样的组合,在所述组合中M-探针的s1节段和t节段都不与靶匹配,并且都未进行测试,因为它们被判断为不太可能产生显著的杂交反应。在经实验表征的624个杂交反应中,所有脱靶杂交实验产生小于0.6a.u.的荧光,而在靶杂交中的43个90%产生超过0.6a.u.的荧光,并且30个63%产生超过1.2a.u.的荧光图13E。因此,主要的失败模式似乎是一部分M-探针不能与其匹配靶序列进行显著杂交。性能不佳的可能原因包括由于对大凸起的不稳定效应的不准确估计导致的不利的杂交热力学和由于靶序列中的二级结构导致的缓慢杂交动力学。对M-探针序列设计进行经验优化可以克服热力学误差,并且M-探针在较高温度下操作可以加速杂交动力学。因此,本发明很好地适用于获得所提及的结果和优点以及其中所固有的结果和优点。虽然本领域技术人员可以进行许多改变,但是此类改变包含在部分地通过所附权利要求书说明的本发明的精神内。已经出于说明和描述的目的呈现了对本公开的特定实施例的前述描述。示例性实施例被选择和描述以便最好地解释本公开的原理及其实际应用,从而使得本领域的其他技术人员能够以适合于所设想的特定用途的各种修改来最好地利用本主题和各种实施例。本公开中的各种实施例的不同特征和公开内容可以在本公开的范围内组合。序列表

权利要求:1.一种用于靶核酸序列的序列选择性结合的核酸杂交探针,所述靶核酸序列包含5′至3′顺序的第一区和第二区,所述核酸杂交探针包含第一互补寡核苷酸,其包含5′至3′顺序的第四区和第五区,所述第五区与所述第一区在序列上互补,第二互补寡核苷酸,其包含5′至3′顺序的第七区和第八区,所述第七区与所述第二区互补,并且所述第八区与所述第四区互补,以及第一保护寡核苷酸,其包含第九区,所述第九区与所述第五区或所述第七区两者之一互补。2.根据权利要求1所述的核酸杂交探针,其中所述靶核酸序列进一步包含在所述第一区的5′末端的第三区,并且其中所述第一互补寡核苷酸进一步包含在所述第五区的3′末端的第六区,所述第六区与所述第三区互补。3.根据权利要求1所述的核酸杂交探针,其中所述靶核酸序列进一步包含在所述第二区的3′末端的第三区,并且其中所述第二互补寡核苷酸进一步包含在所述第七区的5′末端的第六区,所述第六区与所述第三区互补。4.根据权利要求1-3中任一项所述的核酸杂交探针,其中所述第九区与所述第五区互补,并且其中所述核酸杂交探针进一步包含第二保护寡核苷酸,所述第二保护寡核苷酸包含第十区,所述第十区与所述第七区互补。5.根据权利要求4所述的核酸杂交探针,其中所述第一保护寡核苷酸进一步包含第十一区,并且其中所述第二保护寡核苷酸进一步包含第十二区,所述第十二区与所述第十一区互补。6.根据权利要求1-5中任一项所述的核酸杂交探针,其中用于捕获或检测的部分使得所述第一互补寡核苷酸或第二互补寡核苷酸官能化。7.根据权利要求6所述的核酸杂交探针,其中生物素或荧光团使得所述第一互补寡核苷酸或第二互补寡核苷酸官能化。8.根据权利要求1-5中任一项所述的核酸杂交探针,其中所述第一互补寡核苷酸进一步包含第十六区,并且其中所述核酸杂交探针进一步包含第一通用寡核苷酸,所述第一通用寡核苷酸包含第十五区,所述第十五区与所述第十六区互补。9.根据权利要求8所述的核酸杂交探针,其中用于捕获或检测的部分使得所述第一通用寡核苷酸官能化。10.根据权利要求9所述的核酸杂交探针,其中生物素或荧光团使得所述第一通用寡核苷酸官能化。11.根据权利要求1-5中任一项所述的核酸杂交探针,其中所述第一保护寡核苷酸进一步包含第十四区,并且其中所述核酸杂交探针进一步包含第二通用寡核苷酸,所述第二通用寡核苷酸包含第十三区,所述第十三区与所述第十四区互补。12.根据权利要求11所述的核酸杂交探针,其中用于捕获或检测的部分使得所述第一通用寡核苷酸官能化。13.根据权利要求12所述的核酸杂交探针,其中生物素或荧光团使得所述第一通用寡核苷酸官能化。14.根据权利要求8所述的核酸杂交探针,其中所述第一保护寡核苷酸进一步包含第十四区,并且其中所述核酸杂交探针进一步包含第二通用寡核苷酸,所述第二通用寡核苷酸包含第十三区,所述第十三区与所述第十四区互补。15.根据权利要求14所述的核酸杂交探针,其中用于捕获或检测的部分使得所述第一通用寡核苷酸和或所述第二通用寡核苷酸官能化。16.根据权利要求15所述的核酸杂交探针,其中荧光团使得所述第一通用寡核苷酸官能化,猝灭剂使得所述第二通用寡核苷酸官能化。17.根据权利要求15所述的核酸杂交探针,其中猝灭剂使得所述第一通用寡核苷酸官能化,荧光团使得所述第二通用寡核苷酸官能化。18.根据权利要求1-17中任一项所述的核酸杂交探针,其中所述第一区包含5至200个核苷酸。19.根据权利要求1-17中任一项所述的核酸杂交探针,其中所述第二区包含5至200个核苷酸。20.根据权利要求1-17中任一项所述的核酸杂交探针,其中所述第三区包含1至50个核苷酸。21.根据权利要求1-17中任一项所述的核酸杂交探针,其中所述第四区包含5至100个核苷酸。22.根据权利要求1-21中任一项所述的核酸杂交探针,其中所述靶核酸序列含有三核苷酸重复序列,并且其中所述第一互补寡核苷酸和所述第二互补寡核苷酸共同跨越一重复阈值,其中仅当所述靶核酸序列的三核苷酸重复数等于或超过所述重复阈值时,所述靶标才有效结合至所述核酸杂交探针。23.一种包含根据权利要求1-22中任一项所述的核酸杂交探针的溶液,其中所述第一保护寡核苷酸的浓度在所述第一互补寡核苷酸的浓度的1.01倍与10,000倍之间。24.一种包含根据权利要求1-22中任一项所述的核酸杂交探针的溶液,其中所述第二互补寡核苷酸的浓度在所述第一互补寡核苷酸的浓度的0.1倍与10倍之间。25.一种用于配制根据权利要求1-22中任一项所述的核酸杂交探针的方法,包括:从第一互补寡核苷酸候选物库中选择第一互补寡核苷酸;从第二互补寡核苷酸候选物库中选择第二互补寡核苷酸;从第一保护寡核苷酸候选物库中选择第一保护寡核苷酸;将所述第一互补寡核苷酸、所述第二互补寡核苷酸和所述第一保护寡核苷酸在水溶液中混合;使所述溶液在有利于DNA杂交的温度和缓冲液条件下反应。26.一种用于配制多种核酸杂交探针的方法,其包括:通过权利要求25所述的方法来配制权利要求1-22中任一项所述的第一核酸杂交探针,以得到第一核酸杂交探针溶液;通过权利要求25所述的方法来配制权利要求1-22中任一项所述的第二核酸杂交探针,以得到第二核酸杂交探针溶液,其中所述第二核酸杂交探针的所述第四区与所述第一核酸杂交探针的所述第四区在序列上相似或相同,并且其中所述第二核酸杂交探针的所述第八区与所述第一核酸杂交探针的所述第八区在序列上相似或相同;以及将所述第一核酸杂交探针溶液和所述第二核酸杂交探针溶液在不利于由所述第一核酸杂交探针和所述第二核酸杂交探针中的每一者的所述第四区和所述第八区形成的杂交双链体解离的温度和缓冲液条件下混合。27.根据权利要求26所述的方法,其中所述第一核酸杂交探针的所述第一互补寡核苷酸与所述第二核酸杂交探针的所述第一互补寡核苷酸在序列上相同。28.根据权利要求26所述的方法,其中所述第一核酸杂交探针的所述第二互补寡核苷酸与所述第二核酸杂交探针的所述第二互补寡核苷酸在序列上相同。29.一种用于从样本中检测DNA或RNA靶核酸序列的方法,其中所述靶核酸序列包含5′至3′顺序的第一区和第二区,所述方法包括:使所述样本与核酸杂交探针接触,其中所述核酸杂交探针包含:第一互补寡核苷酸,其包含:5′至3′顺序的第四区和第五区,其中所述第五区与所述第一区在序列上互补;第二互补寡核苷酸,其包含:5′至3′顺序的第七区和第八区,其中所述第七区与所述第二区在序列上互补,并且其中所述第八区与所述第四区互补,以及第一保护寡核苷酸,其包含第九区,其中所述第九区与所述第五区或所述第七区两者之一互补。30.根据权利要求29所述的方法,其中所述靶核酸序列进一步包含在所述第一区的5′末端的第三区,并且其中所述第一互补寡核苷酸进一步包含在所述第五区的3′末端的第六区,并且其中所述第六区与所述第三区互补。31.根据权利要求29所述的方法,其中所述靶核酸序列进一步包含在所述第二区的3′末端的第三区,并且其中所述第二互补寡核苷酸进一步包含在所述第七区的5′末端的第六区,并且其中所述第六区与所述第三区互补。32.一种用于从已知包含DNA或RNA靶核酸序列的样本中定量DNA或RNA靶核酸序列中的三联体重复数的方法,所述方法包括:将所述样本分成至少三个等分试样;使各个等分试样与根据权利要求22所述的核酸杂交探针接触,其中用于各个等分试样的所述核酸杂交探针具有不同的重复阈值;观察各个等分试样的结合率;根据所述等分试样与所述不同探针的相对结合率来确定或约束靶序列数。33.根据权利要求1-22中任一项所述的核酸杂交探针,其中所述核酸杂交探针进一步包含在所述第一互补寡核苷酸与所述第二互补寡核苷酸之间的节段接头,并且其中当所述第一互补寡核苷酸和所述第二互补寡核苷酸与所述靶序列杂交时,所述节段接头位于所述核酸杂交探针中对应于所述靶核酸序列的部分的位置处,所述靶核酸序列的所述部分在所述第一区与所述第二区之间。34.一种用于检测样本中根据权利要求1-22中任一项所述的靶核酸序列的所述第一区和或所述第二区中的核苷酸变异的方法,其包括:使所述样本与根据权利要求33所述的核酸杂交探针接触。35.一种用于改善核酸杂交探针对所耐受的核酸变异的耐受性的方法,其包括:将所述核酸杂交探针设计成包含在互补寡核苷酸之间的至少一个节段接头,其中每个互补寡核苷酸与靶核酸序列的至少一部分以及至少一种不同的互补寡核苷酸互补,其中每个节段接头对应于所述靶核酸序列的至少一个耐受区,其中所述靶核酸序列的所述至少一个耐受区包含耐受核苷酸变异的核苷酸。

百度查询: 威廉马歇莱思大学 用于复杂序列捕获和分析的分子杂交探针

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。