一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

核酸分析方法与流程

2021-11-30 22:01:00 来源:中国专利 TAG:

核酸分析方法
交叉引用
1.本技术要求2019年2月11日提交的美国临时专利申请号62/804,082、2019年8月22日提交的美国临时专利申请号62/890,240以及2019年10月17日提交的美国临时专利申请号62/916,683的权益,出于所有目的,每个所述美国临时专利均通过引用完全并入本文。


背景技术:

2.生物分子研究的进步部分地得益于用于表征分子和/或其生物反应的技术的改进。特别是,核酸研究得益于用于序列分析的技术开发。核酸测序在分子生物学和医学领域(例如诊断和治疗监测)中有多种应用。核酸测序可提供可用于诊断受试者的特定病症和/或定制治疗计划的信息。测序广泛用于分子生物学应用,包括载体设计、基因疗法、疫苗设计、工业菌株设计和验证。执行最终序列分析的方式可以在此类分析中可获得的信息的类型和质量方面发挥作用。


技术实现要素:

3.本文认识到对用于提高分析和/或处理核酸样品的方法(例如乳液pcr)的效率、灵敏度和准确度的方法、过程和组合物的需要。本公开提供用于在高准确度和灵敏度以及有效的试剂使用情况下分析和/或处理核酸分子(例如,在生物样品中发现的那些)的方法和组合物。在乳液液滴(或其他类型的分区,例如孔)中使用更高数量的珠(例如,使用珠与核酸分子的更高比率)进行核酸扩增或测序(例如,聚合酶链式反应或pcr)可能导致更高的克隆拷贝数和减少的模板损失,由此可能继而导致提高准确性和灵敏度,同时保持高效的工作流程。本公开还提供了用于即使在分区(例如,乳液分区)中存在多于一种核酸模板的情况下实现克隆扩增的方法和系统。这里描述的系统和方法可以允许在分区中(例如,以大于泊松分布的密度)加载多个珠和/或核酸模板,使得例如试剂(例如pcr试剂)可以有效地使用。
4.在一个方面,提供了一种用于核酸处理的方法,所述方法包括:(a)提供多个分区,其中所述多个分区的分区包含(i)多个珠中的至少两个珠,(ii)核酸分子,和(iii)一种或多种试剂;(b)在所述分区中,使用所述核酸分子和所述一种或多种试剂来产生所述核酸分子的一个或多个扩增产物,其中所述一个或多个扩增产物的至少一子集附接至所述至少两个珠中的珠;(c)从所述分区回收所述珠;以及(d)测定附接于所述珠上的所述一个或多个扩增产物中的扩增产物或其衍生物以鉴定所述核酸分子的序列。
5.在一些实施方案中,(a)包括使(i)包含含有所述核酸分子的多个核酸分子的第一溶液和(ii)包含含有所述至少两个珠的所述多个珠的第二溶液与跟所述第一溶液和所述第二溶液不混溶的流体接触以产生所述多个分区。在一些实施方案中,所述第一溶液和所述第二溶液是相同的溶液。在一些实施方案中,所述第一溶液和所述第二溶液是不同的溶液。
6.在一些实施方案中,珠上附接有多个引物分子,用于使用核酸分子进行一个或多
个扩增反应,并且(b)包括使用所述多个引物分子中的引物分子进行所述一个或多个扩增反应以产生所述一个或多个扩增产物中的扩增产物。在一些实施方案中,珠上附接有多个另外的引物分子,用于使用核酸分子进行一个或多个另外的扩增反应,所述多个另外的引物分子与所述多个引物分子不同。
7.在一些实施方案中,(b)进一步包括使用所述多个另外的引物分子中的另外的引物分子进行所述一个或多个另外的扩增反应以产生所述一个或多个扩增产物中的另外的扩增产物,其中所述另外的扩增产物的至少一子集附接至所述珠,以及其中(d)进一步包括测定附接至所述珠上的所述另外的扩增产物或其衍生物,以鉴定所述核酸分子的序列。在一些实施方案中,所述核酸分子是双链核酸分子。在一些实施方案中,使用所述多个引物分子产生与所述核酸分子的第一链对应的扩增产物,并且使用所述多个另外的引物分子产生与所述核酸分子的第二链对应的扩增产物。在一些实施方案中,(d)包括产生与所述一个或多个扩增产物的序列或其衍生物相关的配对末端测序读段。
8.在一些实施方案中,所述至少两个珠中的另外一个珠上附接有多个另外的引物分子,用于使用核酸分子进行一个或多个另外的扩增反应,所述多个另外的引物分子与所述多个引物分子不同。在一些实施方案中,所述方法进一步包括:(e)使用所述多个另外的引物分子中的另外的引物分子进行所述一个或多个另外的扩增反应以产生所述一个或多个扩增产物中的另外的扩增产物,其中所述另外的扩增产物的至少一子集附接至所述至少两个珠中的所述另外一个珠;(f)从所述分区回收所述另外一个珠;以及(g)测定附接至所述另外一个珠上的所述另外的扩增产物或其衍生物,以鉴定所述核酸分子的序列。在一些实施方案中,所述核酸分子是双链核酸分子。在一些实施方案中,使用偶联至所述珠的所述多个引物分子产生与所述核酸分子的第一链对应的扩增产物,以及其中使用偶联至所述另外一个珠的所述多个另外的引物分子产生与所述核酸分子的第二链对应的扩增产物。在一些实施方案中,(d)进一步包括产生与所述多个扩增产物或其衍生物的序列相关的配对末端测序读段。
9.在一些实施方案中,所述多个分区中的至少80%中的每一个包括所述多个珠中的两个或更多个珠。在一些实施方案中,所述多个分区中的至少85%中的每一个包括所述多个珠中的两个或更多个珠。在一些实施方案中,所述多个分区中的至少90%中的每一个包括所述多个珠中的两个或更多个珠。
10.在一些实施方案中,所述多个分区中的至少80%中的每一个包括所述多个珠中的三个或更多个珠。在一些实施方案中,所述多个分区中的至少85%中的每一个包括所述多个珠中的三个或更多个珠。在一些实施方案中,所述多个分区中的至少90%中的每一个包括所述多个珠中的三个或更多个珠。
11.在一些实施方案中,所述至少两个珠彼此附接。在一些实施方案中,所述至少两个珠通过至少一个化学接头而彼此附接。在一些实施方案中,所述至少两个珠通过夹板寡核苷酸而彼此附接。
12.在一些实施方案中,所述方法进一步包括将所述多个分区中的各自包括至少两个珠的分区与所述多个分区中的各自包括至多一个珠的其他分区分开。在一些实施方案中,所述分开包括光学检测各自包含至少两个珠的分区和/或各自包含至多一个珠的其他分区,并且至少部分地基于所述光学检测,调整流体装置中流体的流动方向以提供在流体装
置的第一通道中各自包含至少两个珠的分区和在流体装置的第二通道中各自包含至多一个珠的其他分区。
13.在一些实施方案中,所述一种或多种试剂包含含有引发序列的核酸分子。在一些实施方案中,包含引发序列的核酸分子进一步包含独特的分子标识符序列。在一些实施方案中,包含引发序列的核酸分子进一步包含条形码序列。在一些实施方案中,引发序列是靶特异性引发序列。在一些实施方案中,引发序列是非靶特异性引发序列。
14.在一些实施方案中,所述一种或多种试剂包含一种或多种聚合用酶(polymerizing enzyme)。
15.在一些实施方案中,所述核酸分子源自细胞或所述细胞的成分。
16.在一些实施方案中,所述多个分区是多个液滴。
17.在一些实施方案中,(d)包括对所述扩增产物或其衍生物进行测序。
18.在一些实施方案中,在(a)中,所述核酸分子附接至所述珠上。
19.在另一方面,提供了一种用于核酸处理的方法,所述方法包括:(a)提供多个分区,其中所述多个分区的分区包含(i)多个珠中的至少两个珠,其中所述至少两个珠彼此附接,(ii)核酸分子,和(iii)一种或多种试剂;以及(b)在所述分区中,使用所述核酸分子和所述一种或多种试剂来产生所述核酸分子的一个或多个扩增产物,其中所述一个或多个扩增产物的至少一子集附接至所述至少两个珠中的珠。
20.在一些实施方案中,所述方法进一步包括(c)从所述分区回收珠;以及(d)测定附接于所述珠上的所述一个或多个扩增产物中的扩增产物或其衍生物,以鉴定所述核酸分子的序列。在一些实施方案中,(a)包括使(i)包含含有所述核酸分子的多个核酸分子的第一溶液和(ii)包含含有所述至少两个珠的所述多个珠的第二溶液与跟所述第一溶液和所述第二溶液不混溶的流体接触以产生所述多个分区。
21.在一些实施方案中,珠上附接有多个引物分子,用于使用核酸分子进行一个或多个扩增反应,以及其中(b)包括使用所述多个引物分子中的引物分子进行所述一个或多个扩增反应以产生所述一个或多个扩增产物中的扩增产物。
22.在一些实施方案中,珠上附接有多个另外的引物分子,用于使用核酸分子进行一个或多个另外的扩增反应,所述多个另外的引物分子与所述多个引物分子不同。在一些实施方案中,(b)进一步包括使用所述多个另外的引物分子中的另外的引物分子进行所述一个或多个另外的扩增反应以产生所述一个或多个扩增产物中的另外的扩增产物,其中所述另外的扩增产物的至少一子集附接至所述珠,以及其中(d)进一步包括测定附接至所述珠上的所述另外的扩增产物或其衍生物,以鉴定所述核酸分子的序列。
23.在一些实施方案中,所述至少两个珠中的另外一个珠上附接有多个另外的引物分子,用于使用核酸分子进行一个或多个另外的扩增反应,所述多个另外的引物分子与所述多个引物分子不同。在一些实施方案中,所述方法进一步包括:(e)使用所述多个另外的引物分子中的另外的引物分子进行所述一个或多个另外的扩增反应以产生所述一个或多个扩增产物中的另外的扩增产物,其中所述另外的扩增产物的至少一子集附接至所述至少两个珠中的所述另外一个珠;(f)从所述分区回收所述另外一个珠;以及(g)测定附接至所述另外一个珠上的所述另外的扩增产物或其衍生物,以鉴定所述核酸分子的序列。
24.在另一方面,提供了一种用于克隆地扩增核酸分子的方法,所述方法包括:(a)提
供一种反应混合物,所述反应混合物包含(i)表面,所述表面包含固定在其上的多个第一引物,其中所述多个第一引物与第一序列具有序列同一性(或同源性),(ii)核酸分子,其中所述核酸分子包含与所述第一序列的互补序列不同的末端序列,以及(iii)包含第一部分和第二部分的第二引物,其中所述第一部分被配置为与所述核酸分子退火,以及其中所述第二部分包含延伸序列,以及其中所述延伸序列或其互补序列被配置为与所述第一序列杂交;(b)使用所述核酸分子和所述第二引物产生延伸产物,所述延伸产物包含所述延伸序列或其互补序列;以及(c)使用固定在所述表面上的所述多个第一引物扩增所述延伸产物。
25.在一些实施方案中,所述第二引物被固定在所述表面上。
26.在一些实施方案中,所述核酸分子在(b)之前不与所述多个第一引物杂交。
27.在一些实施方案中,所述表面包含扩增位点阵列,其中所述扩增位点阵列包含固定在其上的多组第一引物,其中所述多组第一引物与所述第一序列具有序列同源性。在一些实施方案中,所述核酸分子具有通向反应混合物中的扩增位点阵列的流体通路。在一些实施方案中,扩增位点阵列的每个扩增位点包含固定在表面上的多组第一引物中的一组第一引物。
28.在一些实施方案中,所述表面是珠。
29.在一些实施方案中,反应混合物以一定体积的乳液分散相提供。在一些实施方案中,乳液包含第二体积的分散相,所述第二体积的分散相包含含有第二表面的第二反应混合物。
30.在一些实施方案中,(b)和(c)在反应混合物中进行。
31.在一些实施方案中,反应混合物包含多个核酸分子,其中所述多个核酸分子包含含有不同核酸序列的核酸分子。在一些实施方案中,所述多个核酸分子中的每一个被配置为与第二引物偶联以产生包含延伸序列或其互补序列的延伸产物。
32.在一些实施方案中,该方法进一步包括提供包含多个反应混合物的多个分区,其中所述多个分区包含(i)包含所述核酸分子的多个核酸分子和(ii)包含所述表面的多个表面,其中所述多个分区中的第一分区包含所述反应混合物,以及其中所述多个分区中的第二分区包含所述多个核酸分子中的第二核酸分子和所述多个表面中的第二表面。在一些实施方案中,所述多个核酸分子以大于所述多个分区中每个分区平均1个核酸分子的密度分布在所述多个分区中。
33.在一些实施方案中,反应混合物包含第三核酸分子和另外的第二引物,以及其中所述核酸分子或其衍生物在所述第二核酸分子偶联至所述另外的第二引物之前偶联至所述多个第一引物中的至少99%。
34.在一些实施方案中,(c)以比(b)的速率快至少10倍的速率进行。
35.在一些实施方案中,所述核酸分子是单链的。
36.在一些实施方案中,所述第二引物在反应混合物中具有预定浓度,其相对于(c)的速率限制(b)的速率。
37.在一些实施方案中,反应混合物进一步包含未固定至所述表面的另外的第一引物,其中所述另外的第一引物与所述第一序列具有序列同一性。
38.在一些实施方案中,反应混合物进一步包含多个第三引物,所述多个第三引物被配置为当与所述第一引物或所述第二引物一起在聚合酶链式反应(pcr)反应中使用时以指
数方式扩增所述核酸分子。在一些实施方案中,反应混合物进一步包含第四引物,其中所述第四引物具有第三部分和第四部分,其中所述第三部分被配置为与所述核酸分子退火以及其中所述第二部分包含第二延伸序列。
39.在一些实施方案中,所述方法进一步包括:(d)使用所述核酸分子和所述第四引物产生第二延伸产物,所述第二延伸包含被配置为与所述第三引物杂交的第二延伸序列或其互补序列;以及(e)使用所述多个第三引物扩增所述第二延伸产物。在一些实施方案中,所述核酸分子在(d)之前不与所述多个第三引物中的第三引物杂交。在一些实施方案中,所述多个第三引物的浓度比反应混合物中的所述第四引物的浓度大至少10倍。
40.在一些实施方案中,反应混合物进一步包含核酸聚合酶。
41.在一些实施方案中,(b)在等温条件下进行。
42.在一些实施方案中,(c)在等温条件下进行。
43.在一些实施方案中,所述方法进一步包括回收所述表面。
44.在一些实施方案中,所述方法进一步包括测定所述核酸分子的扩增产物或其衍生物以鉴定所述核酸分子的序列。
45.在一些实施方案中,所述核酸分子包含与所述核酸分子的5’末端附接的第一衔接子以及与所述核酸分子的3'末端附接的第二衔接子。在一些实施方案中,所述第一衔接子和所述第二衔接子具有相同的序列。
46.在一些实施方案中,所述方法进一步包括使反应混合物经受使(b)相对于(c)更慢和/或为更罕见事件的条件。在一些实施方案中,所述条件包括温度。在一些实施方案中,所述温度大约等于所述核酸分子和所述第二引物之间的退火温度。
47.在另一方面,提供了一种用于克隆地扩增核酸分子的系统,所述系统包括:反应混合物,所述反应混合物包含(i)表面,所述表面包含固定在其上的多个第一引物,其中所述多个第一引物与第一序列具有序列同一性(或同源性);(ii)核酸分子,其中所述核酸分子包含与所述第一序列的互补序列不同的末端序列;(iii)包含第一部分和第二部分的第二引物,其中所述第一部分被配置为与所述核酸分子退火,以及其中所述第二部分包含延伸序列,其中所述延伸序列或其互补序列被配置为与所述第一序列杂交;以及(iv)被配置为使用所述核酸分子进行核酸延伸反应的试剂。
48.在一些实施方案中,所述核酸分子是单链的。
49.在一些实施方案中,所述第二引物被配置为与所述核酸分子偶联以产生延伸产物,所述延伸产物包含被配置为与所述第一序列杂交的延伸序列或互补序列。
50.在一些实施方案中,其中所述延伸产物能够在所述反应混合物中产生。在一些实施方案中,所述延伸产物能够在等温条件下产生。在一些实施方案中,所述延伸产物或其扩增产物被配置为与固定到所述表面的所述多个第一引物偶联。在一些实施方案中,所述延伸产物或其扩增产物被配置为与所述反应混合物内的固定到所述表面的所述多个第一引物偶联。在一些实施方案中,所述延伸产物的所述扩增产物被配置为在等温条件下产生。在一些实施方案中,反应混合物包含第二核酸分子和另外的第二引物,以及其中所述核酸分子或其衍生物被配置为在所述第二核酸分子偶联至所述另外的第二引物之前偶联至所述多个第一引物中的至少99%。
51.在一些实施方案中,所述第二引物在所述反应混合物中具有预定浓度,其相对于
所述延伸产物在所述表面上扩增的速率限制了所述核酸分子与所述第二引物偶联以产生延伸产物的速率。
52.在一些实施方案中,所述第二引物被固定在所述表面上。
53.在一些实施方案中,所述表面包含扩增位点阵列,其中所述扩增位点阵列包含固定在其上的多组第一引物,其中所述多组第一引物与所述第一序列具有序列同一性。在一些实施方案中,所述核酸分子具有通向反应混合物中的扩增位点阵列的流体通路。在一些实施方案中,扩增位点阵列的每个扩增位点都包含固定在表面上的多组第一引物中的一组第一引物。
54.在一些实施方案中,所述表面是珠。
55.在一些实施方案中,所述系统进一步包含乳液,其中所述反应混合物以一定体积的乳液分散相提供。在一些实施方案中,乳液包含第二体积的分散相,所述第二体积的分散相包含含有第二表面的第二反应混合物。
56.在一些实施方案中,反应混合物包含多个核酸分子,其中所述多个核酸分子包含含有不同核酸序列的核酸分子。在一些实施方案中,所述多个核酸分子中的每一个都被配置为与第二引物偶联以产生包含延伸序列或其互补序列的延伸产物。
57.在一些实施方案中,该系统进一步包括包含多个反应混合物的多个分区,其中所述多个分区包含(i)包含所述核酸分子的多个核酸分子和(ii)包含所述表面的多个表面,其中所述多个分区中的第一分区包含所述反应混合物,以及其中所述多个分区的第二分区包含所述多个核酸分子中的第二核酸分子和所述多个表面中的第二表面。在一些实施方案中,所述多个核酸分子以大于所述多个分区中每个分区平均1个核酸分子的密度分布在所述多个分区中。
58.在一些实施方案中,其中所述反应混合物进一步包含未固定到所述表面的另外的第一引物。
59.在一些实施方案中,反应混合物进一步包含多个第三引物,所述多个第三引物被配置为当与所述第一引物或所述第二引物一起在聚合酶链式反应(pcr)反应中使用时以指数方式扩增所述核酸分子。在一些实施方案中,反应混合物进一步包含第四引物,所述第四引物具有第三部分和第四部分,其中所述第三部分被配置为与所述核酸分子退火以及其中所述第四部分包含第二延伸序列。
60.在一些实施方案中,所述系统进一步包括一个或多个处理器,所述一个或多个处理器单独地或共同地被配置为测定所述核酸分子的扩增产物或其衍生物以鉴定所述核酸分子的序列。
61.在一些实施方案中,所述表面包含多个扩增位点并且每个扩增位点具有附接至所述表面的不同第一引物的多个拷贝。
62.在一些实施方案中,所述核酸分子包含与所述核酸分子的5’末端附接的第一衔接子以及与所述核酸分子的3'末端附接的第二衔接子。在一些实施方案中,所述第一衔接子和所述第二衔接子具有相同的序列。
63.在另一方面,提供了一种用于克隆地扩增核酸样品的方法,所述方法包括:(a)形成包含多个分区的乳液,其中所述多个分区中的分区包含(i)核酸分子,(ii)包含固定在其上的多个第一引物的珠,其中所述多个第一引物与第一序列具有序列同一性(或同源性),
以及(iii)试剂混合物,所述试剂混合物被配置为执行附接反应和扩增反应,所述附接反应允许所述核酸分子或其衍生物附接至所述珠,所述扩增反应使用所述多个第一引物;以及(b)温育所述乳液,从而(i)进行所述附接反应以将所述核酸分子或其衍生物附接至所述珠上,以及(ii)进行所述扩增反应以产生附接至所述珠的所述核酸分子或其衍生物的拷贝,其中第一时间段大于第二时间段,其中所述第一时间段从(b)中的温育开始并在所述核酸分子或其衍生物附接至所述珠时结束,以及其中所述第二时间段在所述核酸分子或其衍生物附接至所述珠时开始并在扩增反应结束时结束。
64.在一些实施方案中,第一时间段是第二时间段的至少约5倍、至少约10倍、至少约20倍、至少约50倍或至少约100倍。
65.在一些实施方案中,(b)中的温育包括使乳液经受至少两种不同的条件。在一些实施方案中,使乳液经受(i)所述至少两种不同条件中的第一条件持续第一时间段和(ii)所述至少两种不同条件中的第二条件持续第二时间段。
66.在一些实施方案中,当使乳液经受足以引发附接反应的条件时,(b)中的温育开始。在一些实施方案中,所述条件选自温度、压力、试剂浓度、电场、磁场和辐射暴露。
67.在一些实施方案中,所述核酸分子溶解在所述试剂混合物中并且所述试剂混合物与所述珠接触。
68.在一些实施方案中,所述核酸分子不能在所述乳液温育之前附接至所述珠。
69.在一些实施方案中,所述核酸分子在所述乳液温育之前不与所述第一引物杂交。
70.在一些实施方案中,所述附接反应是连接反应。
71.在一些实施方案中,所述附接反应是引物延伸反应。
72.在一些实施方案中,所述试剂混合物包含含有第一部分和第二部分的第二引物,所述第一部分与所述核酸分子退火并且所述第二部分包含延伸序列。
73.在一些实施方案中,所述第二引物附接至所述珠。在一些实施方案中,附接反应使用所述第二引物和所述核酸分子来产生延伸产物,产物包含被配置为与所述第一序列杂交的延伸序列或其互补序列。在一些实施方案中,扩增反应使用固定在所述珠上的所述多个第一引物来扩增所述延伸产物。在一些实施方案中,所述第二引物具有预定浓度,使得所述第一时间段大于所述第二时间段。在一些实施方案中,所述乳液进一步包含多个第三引物,所述多个第三引物能够在与所述第一引物或所述第二引物一起用于聚合酶链式反应(pcr)反应中时以指数方式扩增所述核酸分子。
74.在一些实施方案中,当与所述珠附接的所述多个第一引物中的至少99%与所述延伸产物或其衍生物偶联时,扩增反应结束。
75.在一些实施方案中,所述乳液包含包括所述核酸分子的核酸分子文库,这些核酸分子以大于所述多个分区中每个分区平均1个核酸分子的密度分布在所述多个分区中。在一些实施方案中,所述核酸分子文库的每个核酸分子能够与所述第二引物偶联。
76.在一些实施方案中,所述多个分区的分区包含多个核酸分子,其中所述多个核酸分子包含所述核酸分子。在一些实施方案中,所述核酸分子在第二核酸分子附接至所述珠之前完成附接反应和扩增反应。
77.在一些实施方案中,所述核酸分子是单链的。
78.在一些实施方案中,所述乳液进一步包含未附接至所述珠上的另外的第一引物。
79.在一些实施方案中,所述乳液进一步包含核酸聚合酶。
80.在一些实施方案中,所述延伸反应在等温条件下进行。
81.在一些实施方案中,所述扩增反应在等温条件下进行。
82.在一些实施方案中,所述方法进一步包括从所述乳液中回收所述珠。
83.在一些实施方案中,所述方法进一步包括测定所述核酸分子或其衍生物的扩增产物以鉴定所述核酸分子的序列。
84.在一些实施方案中,所述试剂混合物被进一步配置为在所述附接反应之前进行延伸反应以允许所述扩增反应进行。在一些实施方案中,所述延伸反应发生在第三时间段内,所述第三时间段在所述乳液开始温育时开始并在所述扩增反应开始时结束。在一些实施方案中,所述第三时间段与所述第一时间段同时发生。在一些实施方案中,所述第三时间段发生在所述第二时间段之前。
85.本公开的另一方面提供了一种用于制备被配置为附接至核酸分子的支持物的方法,所述方法包括:(a)提供包含多个支持物和多个延伸基团的混合物,其中所述多个支持物中的支持物包含第一引物,其中所述多个延伸基团中的延伸基团包含延伸引物分子;(b)使所述混合物经受足以将所述支持物的所述第一引物附接至延伸基团中的延伸引物上的条件,以产生包含以下的所得混合物:(i)与所述多个延伸基团不相缔合的未经延伸的支持物,和(ii)与所述延伸基团相缔合的经延伸的支持物和被配置为由捕获用实体(capturing entity)捕获的被捕获实体(capture entity),其中所述经延伸的支持物包含第二引物,所述第二引物包含与所述延伸引物分子的序列互补的序列;以及(c)通过使用所述捕获用实体捕获所述被捕获实体,将所述经延伸的支持物从所得混合物分离。
86.在一些实施方案中,所述方法进一步包括将所述延伸基团从所述经延伸的支持物解离。在一些实施方案中,解离包括解链。在一些实施方案中,所述方法进一步包括将所述核酸分子与所述第二引物退火以产生附接模板的支持物。在一些实施方案中,所述方法进一步包括将附接模板的支持物分配在分区中。在一些实施方案中,所述方法进一步包括进行扩增反应以将所述核酸分子的多个扩增产物固定到所述经延伸的支持物上。
87.在一些实施方案中,所述支持物包含珠。在一些实施方案中,所述支持物包含多个第一引物,其中所述多个第一引物包含所述第一引物。在一些实施方案中,所述被捕获实体包含生物素且所述捕获用实体包含链霉亲和素。在一些实施方案中,所述被捕获实体包含捕获序列并且所述捕获用实体包含与所述捕获序列互补的捕获序列。
88.在一些实施方案中,所述被捕获实体包含磁性粒子并且所述捕获用实体包含磁场系统。在一些实施方案中,所述被捕获实体包含带电粒子并且所述捕获用实体包含电场系统。
89.在一些实施方案中,在(a)中,所述延伸基团包含所述被捕获实体。
90.在一些实施方案中,(b)包括使用所述第一引物进行延伸反应以掺入包含所述被捕获实体的核苷酸。
91.在一些实施方案中,通过使用所述捕获用实体捕获所述被捕获实体来从所得混合物中分离所述经延伸的支持物包括:提供捕获用基团(capturing group),所述捕获用基团包含(i)所述捕获用实体和(ii)被配置为由次级捕获用实体捕获的次级被捕获实体;通过使用所述捕获用实体捕获所述被捕获实体,将所述捕获用基团与所述经延伸的支持物相缔
合;以及通过使用所述次级捕获用实体捕获所述次级被捕获实体,将所述经延伸的支持物从所得混合物分离。
92.在一些实施方案中,所述次级被捕获实体包含生物素且所述次级捕获用实体包含链霉亲和素。在一些实施方案中,所述次级被捕获实体包含捕获序列并且所述次级捕获用实体包含与所述捕获序列互补的捕获序列。在一些实施方案中,所述次级被捕获实体包含磁性粒子并且所述次级捕获用实体包含磁场系统。在一些实施方案中,所述次级被捕获实体包含带电粒子并且所述次级捕获用实体包含电场系统。在一些实施方案中,所述次级捕获用实体捕获多个经延伸的支持物,并且所述多个经延伸的支持物包含所述经延伸的支持物。在一些实施方案中,所述方法进一步包括将所述被捕获基团从所述经延伸的支持物解离。
93.在另一方面,本公开提供了一种用于制备被配置为附接至核酸分子的支持物的方法,所述方法包括:(a)提供包含多个未经延伸的支持物和多个经延伸的支持物的混合物,其中所述多个未经延伸的支持物中的未经延伸的支持物不包含引物序列并且所述多个经延伸的支持物中的经延伸的支持物包含所述引物序列,其中所述引物序列被配置为附接至所述核酸分子;(b)提供被捕获基团,所述被捕获基团包含(i)被配置为由捕获用实体捕获的被捕获实体和(ii)序列,其被配置为附接至混合物中的引物序列以使用所述经延伸的支持物的引物序列与所述被捕获基团的序列而使所述经延伸的支持物与所述被捕获基团相缔合;以及(c)通过使用所述捕获用实体捕获所述被捕获实体,将所述经延伸的支持物从所得混合物分离。
94.在一些实施方案中,所述方法进一步包括将所述被捕获基团从所述经延伸的支持物解离。在一些实施方案中,所述解离包括解链。
95.在一些实施方案中,所述方法进一步包括,在通过捕获所述被捕获实体从所得混合物中分离所述经延伸的支持物之后,使用所述捕获用实体将所述核酸分子附接至所述引物序列。在一些实施方案中,所述经延伸的支持物包含珠。在一些实施方案中,所述被捕获实体包含生物素且所述捕获用实体包含链霉亲和素。
96.在一些实施方案中,所述被捕获实体包含捕获序列并且所述捕获用实体包含与所述捕获序列互补的捕获序列。在一些实施方案中,所述被捕获实体包含磁性粒子并且所述捕获用实体包含磁场系统。在一些实施方案中,所述被捕获实体包含带电粒子并且所述捕获用实体包含电场系统。
97.在另一方面,本公开提供了一种制备支持物的方法,所述方法包括:(a)提供包含多个支持物和多个模板核酸分子的混合物,其中所述多个支持物中的支持物包含多个引物,其中所述多个模板核酸分子中的模板核酸分子包含(i)衔接子,所述衔接子被配置为附接至所述多个引物中的引物和(ii)被捕获实体,所述被捕获实体被配置为由与其偶联的捕获用实体捕获;(b)使所述混合物经受足以将所述支持物的所述引物附接至所述模板核酸分子的所述衔接子上的条件,以产生包含以下的所得混合物:(i)未经延伸的支持物,所述未经延伸的支持物不与所述多个模板核酸分子相缔合;和(ii)经延伸的支持物,所述经延伸的支持物与跟所述模板核酸分子偶联的所述被捕获实体相缔合,其中所述经延伸的支持物包含含有与所述模板核酸分子的序列互补的序列的核酸分子,其中所述经延伸的支持物上的所述多个引物中的至少50%与所述多个模板核酸分子不相缔合;以及(c)通过使用所
述捕获用实体捕获所述被捕获实体,将所述经延伸的支持物从所得混合物分离。
98.在另一方面,本公开提供了一种制备支持物的方法,所述方法包括:(a)提供包含多个支持物和多个模板核酸分子的混合物,其中所述多个支持物中的支持物包含多个引物,其中所述多个模板核酸分子中的模板核酸分子包含衔接子,所述衔接子被配置为附接至所述多个引物中的引物;(b)使所述混合物经受足以将所述支持物的所述引物附接至所述模板核酸分子的所述衔接子上的条件,以产生包含以下的所得混合物:(i)未经延伸的支持物,所述未经延伸的支持物不与所述多个模板核酸分子相缔合;和(ii)经延伸的支持物,所述经延伸的支持物与跟所述模板核酸分子偶联的被捕获实体相缔合,其中所述被捕获实体被配置为由捕获用实体捕获,其中所述经延伸的支持物包含含有与所述模板核酸分子的序列互补的序列的核酸分子,其中所述经延伸的支持物上的所述多个引物中的至少50%与所述多个模板核酸分子不相缔合;(c)通过使用所述捕获用实体捕获所述被捕获实体,从所得混合物中分离所述经延伸的支持物;以及(d)将多个经延伸的支持物分配进入多个液滴,其中所述多个经延伸的支持物包含所述经延伸的支持物,其中所述多个液滴中的液滴包含所述经延伸的支持物。
99.在一些实施方案中,所述经延伸的支持物上的多个引物中的至少80%与所述多个模板核酸分子不相缔合。在一些实施方案中,所述经延伸的支持物上的多个引物中的至少90%与所述多个模板核酸分子不相缔合。在一些实施方案中,所述经延伸的支持物上的多个引物中的至少95%与所述多个模板核酸分子不相缔合。在一些实施方案中,所述经延伸的支持物上的多个引物中的至少99%与所述多个模板核酸分子不相缔合。
100.在一些实施方案中,所述方法进一步包括将所述模板核酸分子从所述经延伸的支持物解离。在一些实施方案中,所述解离包括解链。在一些实施方案中,所述支持物包含珠。在一些实施方案中,所述被捕获实体包含生物素且所述捕获用实体包含链霉亲和素。在一些实施方案中,所述被捕获实体包含捕获序列并且所述捕获用实体包含与所述捕获序列互补的捕获序列。在一些实施方案中,所述被捕获实体包含磁性粒子并且其中所述捕获用实体包含磁场系统。在一些实施方案中,所述被捕获实体包含带电粒子并且其中所述捕获用实体包含电场系统。
101.在一些实施方案中,通过使用所述捕获用实体捕获所述被捕获实体来从所得混合物中分离所述经延伸的支持物包括:提供捕获用基团,所述捕获用基团包含(i)所述捕获用实体和(ii)被配置为由次级捕获用实体捕获的次级被捕获实体;通过使用所述捕获用实体捕获所述被捕获实体,将所述捕获用基团与所述经延伸的支持物相缔合;以及通过使用所述次级捕获用实体捕获所述次级被捕获实体,将所述经延伸的支持物从所得混合物分离。
102.在一些实施方案中,所述次级被捕获实体包含生物素且所述次级捕获用实体包含链霉亲和素。在一些实施方案中,所述次级被捕获实体包含捕获序列并且所述次级捕获用实体包含与所述捕获序列互补的捕获序列。在一些实施方案中,所述次级被捕获实体包含磁性粒子并且所述次级捕获用实体包含磁场系统。
103.在一些实施方案中,所述被捕获实体包含带电粒子并且所述次级捕获用实体包含电场系统。在一些实施方案中,所述次级捕获用实体捕获多个经延伸的支持物,其中所述多个经延伸的支持物包含所述经延伸的支持物。在一些实施方案中,所述方法进一步包括将所述被捕获基团从所述经延伸的支持物解离。
104.在一些实施方案中,在(a)中所述模板核酸分子包含所述被捕获实体。
105.在一些实施方案中,(b)包括使用所述引物进行延伸反应以掺入包含所述被捕获实体的核苷酸。
106.在一些实施方案中,其中所述液滴包含所述多个经延伸的支持物中的单个经延伸的支持物,其中所述单个经延伸的支持物是所述经延伸的支持物。在一些实施方案中,所述多个液滴中的大部分被占用的液滴包含所述多个经延伸的支持物中的单个经延伸的支持物。在一些实施方案中,所述多个液滴包含未占用的液滴,其中所述未占用的液滴不包括所述多个经延伸的支持物中的任何经延伸的支持物。
107.在一些实施方案中,(d)包括分配混合物,其中所述混合物包含所述多个经延伸的支持物,其中所述混合物包含比未经延伸的支持物更多的经延伸的支持物。在一些实施方案中,所述混合物中基本上所有的支持物都是经延伸的支持物。
108.本公开内容的另一方面提供了一种非暂时性计算机可读取介质,其包括在由一个或多个计算机处理器执行时实现上文或本文其他地方的任何方法的机器可执行代码。
109.本公开内容的另一方面提供了包含一个或多个计算机处理器和与之耦合的计算机存储器的系统。所述计算机存储器包含机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实现上述或本文其他地方的任何方法。
110.通过以下在其中仅示出和描述了本公开内容的说明性实施方案的详细描述,本公开内容的其他方面和优点对于本领域技术人员将变得显而易见。将会认识到,本公开内容能够具有其他和不同的实施方案,并且其若干细节能够在各个明显的方面进行修改,所有这些都不偏离本公开内容。因此,附图和说明书在本质上将被认为是说明性而非限制性的。援引并入
111.本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。在通过引用并入的出版物和专利或专利申请与本说明书中包含的公开内容相抵触的程度下,本说明书旨在取代和/或优先于任何此类矛盾的材料。
附图说明
112.本发明的新颖特征在所附权利要求中具体阐述。通过参考以下对其中利用到本发明原理的说明性实施方案加以阐述的详细描述以及附图(本文也称为“图”),将会获得对本发明特征和优点的更好理解,在这些附图中:
113.图1描绘了通用下一代测序(ngs)方法的示意图并显示了遗传材料可能会逃避分析的情况和/或表明工作流程中可能存在的潜在噪声源和突变。
114.图2描绘了通用ngs方法的示意图,并显示了对分析工作流程进行修改可能会增加产率(例如,从分析的生物样品中获得的信息量)并降低核酸分析过程中出现噪声和突变的可能性的情况。
115.图3显示了分区的单珠(左图)和多珠(右图)加载的比较。如图所示,乳液聚合酶链式反应(empcr或epcr)过程中液滴(或其他分区,如孔)的多珠加载可能会显著减少epcr工作流程中样品材料(例如基因组材料)的损失,从而导致与涉及单珠加载的方法(左图)相比,提高了准确性和试剂的利用,同时降低了序列分析过程中的噪音。
116.图4显示序列分析中的噪声可以通过将另外的措施(例如读取编码和反向互补链(例如,生成配对末端序列读段))合并到核酸分析工作流程中来进一步降低。
117.图5a和图5b显示了液滴加载、l
液滴
和扫描(f
拆分
=50%、f
seq
=100%)的读段配对结果。
118.图6显示了被编程或以其他方式配置以实现本文提供的方法的计算机控制系统。
119.图7描绘了侧接不同衔接子序列的生物样品(核酸分子5)的示意图。衔接子a包含引物a(1

7)和引物a'(703),衔接子b包含引物b(4

7)和引物b'(702)。
120.图8描绘了两种类型的珠(806)的示意图。一种类型的珠包含固定的引物a(1

8)或其片段或部分。一种类型的珠包含固定的引物b(4

8)或其片段或部分。
121.图9说明了分别涉及用于模板加载和测序的第一组珠和第二组珠的工作流程。
122.图10a说明了受针对所述珠和所述模板的泊松加载限制的epcr方法。
123.图10b说明了一种epcr方法,所述方法受到针对所述珠的泊松加载的限制,但实现了大于泊松分布的模板密度。
124.图10c说明了实现模板密度和珠密度大于泊松分布的epcr方法。
125.图11说明了示例epcr方法。
126.图12说明了产生多克隆珠的示例epcr方法。
127.图13说明了本公开的示例epcr方法。
128.图14说明了本公开的具有多个模板的示例epcr方法。
129.图15a、图15b和图15c说明了本公开的epcr方法的另外细节。
130.图16a和图16b说明了本公开的epcr方法的另外细节。
131.图17a、图17b、图17c和图17d说明了在开放表面上执行的本公开的方法。
132.图18a和图18b说明了本公开的实施方案,其中所述第二引物附接至所述表面。
133.图18c、图18d和图18e说明了本公开的实施方案,其中表面上的每个集落位置具有不同的第一引物。
134.图19a、图19b、图19c和图19d说明了本公开的包括第二缓慢延伸步骤的实施方案。
135.图20说明了示例,其中衔接子附接至模板核酸分子的每个末端。
136.图21说明了生成经延伸的支持物的示例。
137.图22a

b说明了通过施加磁力从溶液中分离经延伸的支持物的示例。
138.图23说明了通过施加磁力从溶液中分离经延伸的支持物的另一个示例。
139.图24a

b说明了用于生成多个预富集的支持物的示例预富集方法。
140.图25显示了使用预富集程序的扩增结果。
141.图26显示了在不同的延伸引物输入浓度下捕获的富集珠的存在。
142.图27显示了在不同的延伸引物输入浓度下,富集珠中延伸引物序列的存在。
143.图28显示了在不同延伸引物输入浓度下,扩增珠的存在。
144.图29显示了在不同延伸引物输入浓度下,扩增珠中的多克隆性。
具体实施方式
145.虽然本文已经示出和描述了本公开内容的各种实施方案,但对于本领域技术人员显而易见的是,这样的实施方案仅以示例的方式提供。本领域技术人员可在不偏离本发明
的情况下想到许多变化、改变和替代。应当理解,可以使用本文中所述的本发明的实施方案的各种替代方案。
146.在值被描述为范围的情况下,应当理解,此类公开包括此类范围内所有可能的子范围的公开,以及落入此类范围内的特定数值,无论是特定数值还是特定子范围是明确规定的。
147.在本文中范围可以表达为从“约”一个具体值,和/或至“约”另一具体值。术语“约”和“大约”通常应表示对于给定值或值范围可接受的误差或变化程度,例如,在给定值或值范围的百分之20(%)以内、15%以内、10%以内或5%以内的误差或变化程度。
148.如本文所用,术语“扩增”通常是指核酸分子或延伸产物(例如,核酸分子上引物延伸反应的产物)的一个或多个拷贝的产生。核酸分子的扩增可产生与核酸分子杂交的单链,或核酸分子或其互补序列的多个拷贝。扩增子可以是通过扩增程序从起始模板核酸分子产生的单链或双链核酸分子。扩增子可包含核酸链,其至少一部分可与起始模板的至少一部分基本相同或基本互补。当起始模板是双链核酸分子时,扩增子可包含与一条链的至少一部分基本相同并且与任一链的至少一部分基本互补的核酸链。无论初始模板是单链的还是双链的,扩增子都可以是单链的或双链的。扩增反应可以是例如聚合酶链式反应(pcr),例如乳液聚合酶链式反应(epcr;例如,在微反应器例如孔或液滴内进行的pcr)。
149.如本文所用,术语“变性”通常是指将双链分子(例如,dna)分离成单链分子。变性可以是完全变性或部分变性。在部分变性中,通过dna中双链区域两侧的两条脱氧核糖核酸(dna)链的变性,可以在双链分子中形成单链区域。
150.如本文所用,术语“克隆”通常指核酸群体,其中大部分(例如,大于50%、60%、70%、80%、90%、95%或99%)的成员具有基本相同的序列。核酸分子克隆群体的成员可以彼此具有序列同源性。在一些情况中,此类成员可与模板核酸分子具有序列同源性。在一些情况中,此类成员可与模板核酸分子(如果是单链的)的互补序列具有序列同源性。克隆群体的成员可以是双链或单链的。群体的成员可以不是100%相同或互补的,因为,例如,在合成过程中可能会发生“错误”,使得给定群体中的少数可能与该群体中的大多数不具有序列同源性。例如,群体的至少50%的成员可以彼此或与参考核酸分子(即,用作序列比较基础的确定序列的分子)基本相同。群体中至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或更多的成员可以与参考核酸分子基本相同。如果两个分子之间的同一性百分比是至少60%、70%、75%、80%、85%、90%、95%、98%、99%、99.9%或更大,则可以认为这两个分子基本相同(或同源)。如果两个分子之间的互补性百分比是至少60%、70%、75%、80%、85%、90%、95%、98%、99%、99.9%或更高,则可以认为这两个分子是基本互补的。可能会发生非同源核酸的低或非实质性水平的混合,因此克隆群体可以包含少数(例如,少于30%,例如,少于10%)的不同核酸。
151.如本文所用,术语“互补序列”通常指与另一序列杂交或与此类其他序列具有序列互补性的序列。两条单链核酸分子之间的杂交可能涉及形成在某些条件下稳定的双链结构。如果两条单链多核苷酸通过两个或更多个顺序相邻的碱基配对而彼此结合,则可以认为它们是杂交的。双链结构的一条链中的很大一部分核苷酸可以与另一条链上的核苷进行沃森

克里克碱基配对。杂交还可包括核苷类似物的配对,例如脱氧肌苷、具有2

氨基嘌呤碱基的核苷等,其可用于降低探针的简并性,无论这种配对是否涉及氢键的形成。
152.如本文所用,术语“聚合用酶”通常是指催化聚合反应的物质。聚合用酶可用于通过掺入核苷酸或核苷酸类似物来延伸与模板链配对的核酸引物。聚合用酶可以通过延伸现有核苷酸链的3'末端,通过创建磷酸二酯键一次一个地添加与模板链匹配的新核苷酸,来添加新的dna链。聚合用酶可以是聚合酶,例如核酸聚合酶。聚合酶可以是天然存在的或合成的。聚合酶可具有相对高的持续合成能力,即聚合酶连续将核苷酸掺入核酸模板而不释放核酸模板的能力。聚合用酶可以是转录酶。聚合酶的实例包括但不限于dna聚合酶、rna聚合酶、热稳定性聚合酶、野生型聚合酶、经修饰的聚合酶、大肠杆菌dna聚合酶i、t7 dna聚合酶、噬菌体t4 dna聚合酶、029(phi29)dna聚合酶、taq聚合酶、tth聚合酶、tli聚合酶、pfu聚合酶、pwo聚合酶、vent聚合酶、deepvent聚合酶、extaq聚合酶、la

taq聚合酶、sso聚合酶、poc聚合酶、pab聚合酶,mth聚合酶、es4聚合酶、tru聚合酶、tac聚合酶、tne聚合酶、tma聚合酶、tea聚合酶、tih聚合酶、tfi聚合酶、platinum taq聚合酶、tbr聚合酶、tfl聚合酶、pfutubo聚合酶、pyrobest聚合酶、pwo聚合酶、kod聚合酶、bst聚合酶、sac聚合酶、klenow片段、具有3'到5'外切核酸酶活性的聚合酶,以及它们的变体、经修饰的产物和衍生物。聚合酶可以是单亚基聚合酶。
153.如本文所用,术语“解链温度”或“熔点”通常是指样本中核酸分子链的至少一部分与互补链的至少一部分分离时的温度。解链温度可以是双链核酸分子部分或完全变性时的温度。解链温度可以指给定核酸分子的多个序列中的序列的温度,或多个序列的温度。双链核酸分子的不同区域可具有不同的解链温度。例如,双链核酸分子可以包括具有第一熔点的第一区域和具有高于第一熔点的第二熔点的第二区域。因此,双链核酸分子的不同区域可以在不同温度下解链(例如,部分变性)。核酸分子或其区域(例如,核酸序列)的熔点可以通过实验确定(例如,通过解链分析或其他程序)或可以基于核酸分子的序列和长度来估计。例如,可以使用诸如melting的软件程序来估计核酸序列的解链温度(dumousseau m,rodriguez n,juty n,le nov
è
re n,melting,a flexible platform to predict the melting temperatures of nucleic acids.bmc bioinformatics.2012may 16;13:101.doi:10.1186/1471

2105

13

101)。因此,如本文所述的熔点可以是估计的熔点。核酸序列的真实熔点可基于与感兴趣的核酸序列相邻的序列或缺乏序列以及其他因素而变化。
154.如本文所用,术语“核苷酸”通常是指包括碱基(例如核碱基)、糖部分和磷酸部分的物质。核苷酸可包含具有附接的磷酸基团的游离碱。包括具有三个附接的磷酸基团的碱基的物质可被称为核苷三磷酸。当核苷酸被添加到增长的核酸分子链中时,核苷酸的近端磷酸酯与增长链之间的磷酸二酯键的形成可能伴随着高能磷酸酯键的水解和作为焦磷酸酯的两个远端磷酸酯的释放。核苷酸可以是天然存在的或非天然存在的(例如,修饰的或工程化的核苷酸)。
155.如本文所用,术语“核苷酸类似物”可以包括但不限于可以是或可以不是天然存在的核苷酸的核苷酸。例如,核苷酸类似物可以衍生自规范核苷酸和/或包括与规范核苷酸的结构相似性,例如包括腺嘌呤

(a)、胸腺嘧啶

(t)、胞嘧啶

(c)、尿嘧啶

(u)或鸟嘌呤

(g)的核苷酸。核苷酸类似物可包含相对于天然核苷酸的一个或多个差异或修饰。核苷酸类似物的实例包括肌苷、二氨基嘌呤、5

氟尿嘧啶、5

溴尿嘧啶、5

氯尿嘧啶、5

碘尿嘧啶、次黄嘌呤、黄嘌呤、脱氮黄嘌呤、脱氮鸟嘌呤、异胞嘧啶、异鸟嘌呤、4

乙酰胞嘧啶、5

(羧基羟甲基)尿嘧啶、5

羧甲基氨基甲基
‑2‑
硫尿嘧啶、5

羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β

d

半乳糖基辫苷、n6

异戊烯基腺嘌呤、1

甲基鸟嘌呤、1

甲基肌苷、2,2

二甲基鸟嘌呤、2

甲基腺嘌呤、2

甲基鸟嘌呤、3

甲基胞嘧啶、5

甲基胞嘧啶、n6

腺嘌呤、7

甲基鸟嘌呤、5

甲基氨基甲基尿嘧啶、5

甲氧基氨基甲基
‑2‑
硫尿嘧啶、β

d

甘露糖基辫苷、5'

甲氧基羧甲基尿嘧啶、5

甲氧基尿嘧啶、2

甲硫基

d46

异戊烯基腺嘌呤、尿嘧啶
‑5‑
氧乙酸酸(v)、怀丁氧苷(wybutoxosine)、假尿嘧啶、辫苷、2

硫胞嘧啶、5

甲基
‑2‑
硫尿嘧啶、2

硫尿嘧啶、4

硫脲嘧啶、5

甲基硫脲嘧啶、尿嘧啶
‑5‑
氧乙酸甲酯、尿嘧啶
‑5‑
氧乙酸(v),5

甲基
‑2‑
硫尿嘧啶、3

(3

氨基
‑3‑
n
‑2‑
羧丙基)尿嘧啶、(acp3)w、2,6

二氨基嘌呤、乙炔基核苷酸碱基、1

丙炔基核苷酸碱基、叠氮基核苷酸碱基、膦硒酸酯核酸及其修饰形式(例如,通过氧化、还原和/或添加取代基,例如烷基、羟烷基、羟基或卤素部分)。核酸分子(例如,多核苷酸、双链核酸分子、单链核酸分子、引物、衔接子等)可以在碱基部分(例如,在通常可用于与互补核苷酸形成氢键的一个或多个原子处和/或在通常不能与互补核苷酸形成氢键的一个或多个原子处)、糖部分或磷酸骨架处进行修饰。在一些情况下,核苷酸可包括在其磷酸部分中的修饰,包括对三磷酸部分的修饰。此外,修饰的非限制性实例包括更长长度的磷酸链(例如,具有4、5、6、7、8、9、10个或多个磷酸部分的磷酸链)、具有硫醇部分的修饰(例如,α

硫代三磷酸和β

硫代三磷酸),以及具有硒部分的修饰(例如膦硒酸酯核酸)。核苷酸或核苷酸类似物可包含选自核糖、脱氧核糖及其修饰形式的糖(例如,通过氧化、还原和/或添加取代基,例如烷基、羟烷基、羟基或卤素部分)。核苷酸类似物还可包含修饰的接头部分(例如,代替磷酸部分)。核苷酸类似物还可以包含胺修饰的基团,例如氨基烯丙基

dutp(aa

dutp)和氨基己基丙烯酰胺

dctp(aha

dctp),以允许胺反应性部分的共价附接,例如n

羟基琥珀酰亚胺酯(nhs)。本公开的寡核苷酸中标准dna碱基对或rna碱基对的替代物可以提供例如,以比特/立方毫米计的更高密度、更高的安全性(抵抗天然毒素的意外或有意的合成)、更容易区分光

程序化聚合酶和/或较低的二级结构。核苷酸类似物可能能够与用于核苷酸检测的可检测部分反应或结合。
156.如本文所用,术语“支持物”或“基底”通常指任何固体或半固体制品,其上可固定诸如核酸分子之类的试剂。核酸分子可以被合成、附接、连接或以其他方式固定。核酸分子可以通过任何方法固定在基底上,包括但不限于物理吸附、通过离子键或共价键形成或其组合。基底可以是二维的(例如,平面的2d基底)或3维的。在一些情况中,基底可以是流动池的组件和/或可以被包含在测序仪器内或适配成被测序仪器接收。基底可包括聚合物、玻璃或金属材料。基底的实例包括膜、平面基底、微量滴定板、珠(例如磁珠)、过滤器、测试条、载玻片、盖玻片和试管。基底可以包括有机聚合物,例如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯和聚丙烯酰胺(例如聚丙烯酰胺凝胶),以及它们的共聚物和接枝物。基底可包括胶乳或葡聚糖。基底也可以是无机物,例如玻璃、二氧化硅、金、可控孔玻璃(cpg)或反相二氧化硅。支持物的构造可以是例如珠、球、粒子、颗粒、凝胶、多孔基质或基底的形式。在一些情况中,基底可以是单个固体或半固体制品(例如,单个粒子),而在其他情况下,基底可以包括多个固体或半固体制品(例如,粒子的集合)。基底可以是平面的、基本平面的或非平面的。基底可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特性。基底可以成形为包括一个或多个孔、凹陷或其他容器、器皿、特征或位置。多个基底可以在不同位置配置成阵列。基底可以是可寻址的(例如,用于试剂的机器人递送),或通过检测方法,例如通过激光照射和共焦或偏转光收集进行扫描。例如,基底可以与检测器呈光学和/或物理连通。可替代地,基
底可以与检测器物理分开一定距离。扩增基底(例如珠)可以放置在另一基底内或另一基底上(例如,在第二支持物的孔内)。
157.如本文所用,术语“标记”通常是指能够与种类诸如例如核苷酸类似物偶联的部分。标记可以包括亲和部分。在一些情况下,标记可以是发射可被检测的信号(或减少已发射的信号)的可检测标记。在一些情况下,此类信号可以指示一种或多种核苷酸或核苷酸类似物的掺入。在一些情况下,标记可与核苷酸或核苷酸类似物偶联,该核苷酸或核苷酸类似物可用于引物延伸反应。在一些情况下,标记可在引物延伸反应后与核苷酸类似物偶联。在一些情况下,标记可以与核苷酸或核苷酸类似物特异性反应。偶联可以是共价的或非共价的(例如,通过离子相互作用、范德华力等)。在一些情况下,偶联可以通过接头进行,接头可以是可切割的,例如光可切割的(例如,在紫外光下可切割的),化学可切割的(例如,通过还原剂,例如二硫苏糖醇(dtt)、三(2

羧乙基)膦(tcep)、三(羟丙基)膦(thp)或酶可切割的(例如,通过酯酶、脂肪酶、肽酶或蛋白酶)。在一些情况下,标记可以是发光的;即荧光或磷光。标记可以是猝灭剂分子。如本文所用,术语“猝灭剂”是指可以减少发射信号的分子。例如,模板核酸分子可以设计为发出可检测的信号。包含猝灭剂的核苷酸或核苷酸类似物的掺入可以减少或消除该信号,然后检测该减少或消除。在一些情况中,如本文别处所述,用猝灭剂进行标记可在核苷酸或核苷酸类似物掺入后发生。染料和标记可以被掺入核酸序列中。染料和标记也可被掺入接头中,例如用于将一个或多个珠彼此连接的接头。染料的非限制性实例包括sybr绿、sybr蓝、dapi、碘化丙锭、hoeste、sybr金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄素、荧光香豆素(fluorcoumanin)、椭圆玫瑰树碱、道诺霉素、氯喹、偏端霉素d、色霉素、乙菲啶(homidium)、光神霉素、多吡啶钌、氨茴霉素、菲啶和吖啶、溴化乙锭、碘化丙锭、碘化己锭、二氢乙锭、乙锭同型二聚体

1和乙锭同型二聚体

2、单叠氮化乙锭和acma、hoechst 33258、hoechst 33342、hoechst 34580、dapi、吖啶橙、7

aad、放线菌素d、lds751、羟脒(hydroxystilbamidine)、sytox blue、sytox green、sytox orange、popo

1、popo

3、yoyo

1、yoyo

3、toto

1、toto

3、jojo

1、lolo

1、bobo

1、bobo

3、po

pro

1、po

pro

3、bo

pro

1、bo

pro

3、to

pro

1、to

pro

3、to

pro

5、jo

pro

1、lo

pro

1、yo

pro

1、yo

pro

3、picogreen、oligreen、ribogreen、sybr gold、sybr green i、sybr green ii、sybr dx、syto

40、syto

41、syto

42、syto

43、syto

44、syto

45(蓝色)、syto

13、syto

16、syto

24、syto

21、syto

23、syto

12、syto

11、syto

20、syto

22、syto

15、syto

14、syto

25(绿色)、syto

81、syto

80、syto

82、syto

83、syto

84、syto

85(橙色)、syto

64、syto

17、syto

59、syto

61、syto

62、syto

60、syto

63(红色)、荧光素、异硫氰酸荧光素(fitc)、四甲基异硫氰酸罗丹明(tritc)、罗丹明、四甲基罗丹明、r

藻红蛋白、cy

2、cy

3、cy

3.5、cy

5、cy5.5、cy

7、德克萨斯红(texas red)、phar

red、别藻蓝蛋白(apc)、sybr green i、sybr green ii、sybr gold、celltracker green、7

aad、乙锭同型二聚体i、乙锭同型二聚体ii、乙锭同型二聚体iii、溴化乙锭、伞形酮、曙红、绿色荧光蛋白、赤藓红、香豆素、甲基香豆素、芘、孔雀绿、茋、萤光黄、级联蓝(cascade blue)、二氯三嗪胺荧光素、丹磺酰氯、荧光镧系络合物(如包含铕和铽的那些络合物)、羧基四氯荧光素、5

羧基荧光素和/或6

羧基荧光素(fam)、vic、5

碘乙酰胺基荧光素或6

碘乙酰胺基荧光素、5

{[2
‑5‑
(乙酰基巯基)

琥珀酰基]氨基}荧光素和5

{[3
‑5‑
(乙酰基巯基)

琥珀酰基]氨基}荧光素(samsa

荧光素)、丽丝胺罗丹明b磺酰氯、5

羧基罗丹明和/或6

羧基罗丹明(rox)、7

氨基

甲基

香豆素、7

氨基
‑4‑
甲基香豆素
‑3‑
乙酸(amca)、bodipy荧光团、8

甲氧基芘

1,3,6

三磺酸三钠盐、3,6

二磺酸
‑4‑
氨基

萘二甲酰亚胺、藻胆蛋白、alexafluor 350、alexafluor 405、alexafluor 430、alexafluor 488、alexafluor 532、alexafluor 546、alexafluor 555、alexafluor 568、alexafluor 594、alexafluor 610、alexafluor 633、alexafluor 635、alexafluor 647、alexafluor 660、alexafluor 680、alexafluor 700、alexafluor 750和alexafluor 790染料、dylight 350、dylight 405、dylight 488、dylight 550、dylight 594、dylight 633、dylight 650、dylight 680、dylight 755和dylight 800染料,或者其他荧光团、black hole猝灭剂染料(biosearch technologies),诸如bh1

0、bhq

1、bhq

3、bhq

10;qsy染料荧光猝灭剂(来自分子探针/invitrogen),诸如qsy7、qsy9、qsy21、qsy35和其他猝灭剂诸如dabcyl和dabsyl;cy5q和cy7q以及暗花菁染料(ge healthcare);dy

猝灭剂(dyomics),诸如dyq

660和dyq

661;以及atto荧光猝灭剂(atto

tec gmbh),诸如atto 540q、580q、612q。在一些情况下,标记可能是不自淬灭或不表现邻近淬灭的类型。不自淬灭或不表现邻近猝灭的标记类型的非限制性实例包括双满(bimane)衍生物,诸如溴代双满。如本文所用,术语“邻近猝灭”通常是指一种现象,其中一种或多种彼此靠近的染料与它们单独表现出的荧光相比可能表现出较低的荧光。在一些情况下,染料可经受邻近猝灭,其中供体染料和受体染料彼此在1nm至50nm之内。
[0158]
如本文所用,术语“检测器”通常是指能够检测信号例如指示掺入的核苷酸或核苷酸类似物存在或不存在的信号的装置。检测器可以包括可以检测信号的光学和/或电子组件。涉及检测器的检测方法的非限制性实例包括光学检测、光谱检测、静电检测和电化学检测。光学检测方法包括但不限于荧光法和紫外可见(uv

vis)光吸收。光谱检测方法包括但不限于质谱、核磁共振(nmr)光谱和红外光谱。静电检测方法包括但不限于基于凝胶的技术,例如凝胶电泳。电化学检测方法包括但不限于在对扩增产物进行高效液相色谱分离后对扩增产物的电化学检测。
[0159]
如本文所用,术语“测序”通常是指产生或鉴定生物分子例如核酸分子的序列的过程。此类序列可以是核酸序列,其可以包括核酸碱基(例如,核碱基)的序列。测序可以是例如,单分子测序、合成测序、杂交测序或连接测序。可以使用固定在支持物(例如,流动池或一个或多个珠)上的模板核酸分子进行测序。测序测定可产生对应于一种或多种模板核酸分子的一种或多种测序读段。
[0160]
如本文所用,术语“读段”通常是指核酸序列,例如测序读段。测序读段可以是通过核酸测序测定获得的核酸碱基(例如,核苷酸)或碱基对的推断序列。测序读段可以由核酸测序仪生成,例如大规模平行阵列测序仪(例如,illumina或pacific biosciences of california)。测序读段可对应于受试者基因组的一部分,或在一些情况下全部。测序读段可以是测序读段集合的一部分,其可以通过例如比对(例如,与参考基因组)组合以产生受试者的基因组序列。
[0161]
如本文所用,术语“受试者”通常是指可以从中衍生出生物样本(例如,正在进行或将进行加工或分析的生物样本)的个体或实体。受试者可以是动物(例如,哺乳动物或非哺乳动物)或植物。受试者可以是人、狗、猫、马、猪、鸟、非人灵长类动物、猿猴、农场动物、伴侣动物、运动动物或啮齿动物。受试者可以是患者。受试者可能患有或怀疑患有疾病或病症,例如癌症(例如,乳腺癌、结直肠癌、脑癌、白血病、肺癌、皮肤癌、肝癌、胰腺癌、淋巴瘤、食道
癌或宫颈癌)或传染病。可替代地或另外地,可能已知受试者先前患有疾病或病症。受试者可能患有或疑似患有遗传病症,诸如软骨发育不全、α

1抗胰蛋白酶缺乏症、抗磷脂综合征、孤独症、常染色体显性多囊肾病、进行性神经性腓骨肌萎缩征(charcot

marie

tooth)、猫叫综合征、克罗恩病、囊性纤维化、痛性脂肪病(dercum disease)、唐氏综合征、杜安综合征(duane syndrome)、杜氏肌营养不良、莱顿第五因子血栓形成倾向、家族性高胆固醇血症、家族性地中海热、脆性x综合征、戈谢病、血色素沉着症、血友病、前脑无裂畸形、亨廷顿病、克林费尔特综合征、马方综合征、强直性肌营养不良、神经纤维瘤病、努南综合征、成骨不全、帕金森病、苯丙酮尿症、波伦异常、卟啉症、早衰、色素性视网膜炎、重度联合免疫缺陷、镰状细胞病、脊髓性肌萎缩、泰

萨克斯病(tay

sachs)、地中海贫血、三甲基胺尿症、特纳综合征、腭帆心脏面部综合征、wagr综合征或威尔逊病。受试者可能正在接受疾病或病症的治疗。受试者可能对给定的疾病或病症有症状或无症状。受试者可以是健康的(例如,没有被怀疑患有疾病或病症)。受试者可能对给定疾病具有一种或多种风险因素。受试者可能具有给定的体重、身高、体重指数或其他身体特征。受试者可能具有给定的民族或种族遗产、出生地或居住地、国籍、疾病或缓解状态、家族病史或其他特征。
[0162]
如本文所用,术语“生物样本”通常是指从受试者获得的样本。生物样本可以直接或间接地从受试者获得。可以通过任何合适的方法从受试者获得样本,包括但不限于吐痰、擦拭、抽血、活检、获得排泄物(例如,尿液、粪便、痰液、呕吐物或唾液)、切除、刮擦、和穿刺。样本可以通过例如静脉内或动脉内进入循环体系、收集分泌的生物样本(例如,粪便、尿液、唾液、痰液等)、呼吸或手术提取组织(例如,活检)从受试者获得。样本可以通过非侵入性方法获得,包括但不限于:刮擦皮肤或子宫颈、擦拭脸颊或收集唾液、尿液、粪便、月经、泪液或精液。或者,样本可以通过侵入性程序获得,例如活检、针吸或静脉切开术。样本可以包括体液,例如但不限于血液(例如,全血、红细胞、白血球或白细胞、血小板)、血浆、血清、汗液、泪液、唾液、痰液、尿液、精液、粘液、滑膜液、母乳、初乳、羊水、胆汁、骨髓、组织液或细胞外液或脑脊液。例如,可以通过穿刺方法获得样本以获得包含血液和/或血浆的体液。此类样本可以包含细胞和无细胞核酸材料。或者,样本可以从任何其他来源获得,包括但不限于血液、汗液、毛囊、颊组织、泪液、月经、粪便或唾液。生物样本可以是组织样本,例如肿瘤活检。样本可以从本文提供的任何组织获得,包括但不限于皮肤、心脏、肺、肾、乳腺、胰腺、肝脏、肠、脑、前列腺、食管、肌肉、平滑肌、膀胱、胆囊、结肠或甲状腺。本文提供的获得方法包括活组织检查方法,包括细针抽吸、芯针活组织检查、真空辅助活组织检查、粗针吸取芯活组织检查、切口活组织检查、切除活组织检查、钻取活组织检查、刮取活组织检查或皮肤活组织检查。生物样本可包括一种或多种细胞。生物样本可包含一种或多种核酸分子,例如一种或多种脱氧核糖核酸(dna)和/或核糖核酸(rna)分子(例如,包括在细胞内或不包括在细胞内)。核酸分子可包括在细胞内。可替代地或另外地,核酸分子可以不包括在细胞内(例如,无细胞核酸分子)。生物样本可以是无细胞样本。
[0163]
如本文所用,术语“无细胞样本”通常是指基本上无细胞的样本(例如,基于体积少于10%的细胞)。无细胞样本可以衍生自任何来源(例如,如本文所述的)。例如,无细胞样本可以衍生自血液、汗液、尿液或唾液。例如,无细胞样本可以衍生自组织或体液。无细胞样本可以衍生自多种组织或体液。例如,来自第一组织或流体的样本可以与来自第二组织或流体的样本组合(例如,在获得样本时或获得样本之后)。在一个实例中,可以从受试者收集第
一流体和第二流体(例如,在相同或不同时间)并且可以将第一流体和第二流体组合以提供样本。无细胞样本可包含一种或多种核酸分子,例如一种或多种dna或rna分子。
[0164]
可以处理不是无细胞样本的样本(例如,包含一种或多种细胞的样本)以提供无细胞样本。例如,可以从受试者获得包括一种或多种细胞以及不包括在细胞内的一种或多种核酸分子(例如,dna和/或rna分子)(例如,无细胞核酸分子)的样本。可以对样本进行处理(例如,如本文所述的)以将细胞和其他材料与不包括在细胞内的核酸分子分离,从而提供无细胞样本(例如,包括不包括在细胞内的核酸分子)。然后可以对无细胞样本进行进一步分析和处理(例如,如本文提供的)。不包括在细胞内的核酸分子(例如,无细胞核酸分子)可以衍生自细胞和组织。例如,无细胞核酸分子可衍生自肿瘤组织或(例如,身体组织的)降解细胞。无细胞核酸分子可包含任何类型的核酸分子(例如,如本文所述的)。无细胞核酸分子可以是双链的、单链的或其组合。无细胞核酸分子可以通过分泌或细胞死亡过程,例如细胞坏死、细胞凋亡等释放到体液中。无细胞核酸分子可以从癌细胞(例如,循环肿瘤dna(ctdna))释放到体液中。无细胞核酸分子也可以是在母体血流中自由循环的胎儿dna(例如,无细胞胎儿核酸分子,例如cffdna)。可替代地或另外地,无细胞核酸分子可以从健康细胞释放到体液中。
[0165]
直接从受试者获得的生物样品在从受试者获得后可能没有进一步处理。例如,可以通过进入受试者的循环系统、从受试者(例如,通过针)取出血液并将取出的血液转移到容器中来直接从受试者获得血液样品。容器可包含试剂(例如抗凝剂),使得血液样品可用于进一步分析。在另一个示例中,可以使用拭子接近受试者口咽表面上的上皮细胞。在从受试者获得生物样品之后,包含生物样品的拭子可以与流体(例如缓冲液)接触以从拭子收集生物流体。
[0166]
可以从受试者获得包含一种或多种核酸分子的任何合适的生物样本。适合根据本文提供的方法使用的样本(例如,生物样本或无细胞生物样本)可以是任何材料,包括组织、细胞、降解的细胞、核酸、基因、基因片段、表达产物、基因表达产物和/或待测试个体的基因表达产物片段。生物样本可以是固体物质(例如,生物组织)或可以是流体(例如,生物流体)。通常,生物流体可包括与活生物体相关联的任何流体。生物样本的非限制性实例包括从受试者的任何解剖学部位(例如,组织、循环系统、骨髓)获得的血液(或血液组分——例如,白细胞、红细胞、血小板)、从受试者的任何解剖学部位获得的细胞、皮肤、心脏、肺、肾、呼吸、骨髓、粪便、精液、阴道分泌物、衍生自肿瘤组织的组织液、乳房、胰腺、脑脊液、组织、咽拭子、活检,胎盘液、羊水、肝脏、肌肉、平滑肌、膀胱、胆囊、结肠、肠、脑、宫腔积液、痰液、脓、微生物群、胎粪、母乳、前列腺、食管、甲状腺、血清、唾液、尿液、胃液和消化液、泪液、眼液、汗液、粘液、耳垢、油、腺体分泌物、脊髓液、头发、指甲、皮肤细胞、血浆、鼻拭子或鼻咽冲洗液、脊髓液、脐血、强液和/或其他排泄物或身体组织。提供了用于确定样本适用性和/或充分性的方法。样本可包括但不限于血液、血浆、组织、细胞、降解细胞、无细胞核酸分子和/或来自细胞或衍生自个体细胞的生物材料,例如无细胞核酸分子。样本可以是细胞、组织或无细胞生物材料的异质或同质群体。可以使用能够提供适用于本文所述的分析方法的样本的任何方法来获得生物样本。
[0167]
样本(例如,生物样本或无细胞生物样本)可以经历一个或多个过程以准备用于分析,包括但不限于过滤、离心、选择性沉淀、透化、分离、搅拌、加热、纯化、和/或其他过程。例
如,可以过滤样本以去除污染物或其他材料。在一个实例中,可以处理包含细胞的样本以将细胞与样本中的其他材料分离。此类过程可用于制备仅包含无细胞核酸分子的样本。此类过程可以由多步离心过程组成。可以获得多个样本,例如来自同一受试者的多个样本(例如,以相同或不同方式从相同或不同身体位置获得的,和/或在相同或不同时间(例如,相隔数秒、数分钟、数小时、数天、数周、数月或数年)或来自不同受试者的多个样本,用于如本文所述的分析。在一个实例中,第一样本在受试者经历治疗方案或程序之前从该受试者获得,且第二样本在该受试者经历治疗方案或程序之后从该受试者获得。可替代地或另外地,可同时或大约同时从同一受试者获得多个样本。从同一受试者获得的不同样本可以相同或不同的方式获得。例如,第一样本可以通过活检获得,而第二样本可以通过抽血获得。以不同方式获得的样本可以由不同的医疗专业人员、使用不同的技术、在不同的时间和/或在不同的位置获得。从同一受试者获得的不同样本可以从身体的不同部位获得。例如,第一样本可以从身体的第一区域(例如,第一组织)获得而第二样本可以从该身体的第二区域(例如,第二组织)获得。
[0168]
当在反应容器中提供时,如本文所用的生物样本(例如,包含一种或多种核酸分子的生物样本)可能不被纯化。此外,对于包含一种或多种核酸分子的生物样本,当将生物样本提供给反应容器时可能不会提取一种或多种核酸分子。例如,当将生物样本提供给反应容器时,生物样本的核糖核酸(rna)和/或脱氧核糖核酸(dna)分子可能不会从生物样本中提取。此外,当将生物样本提供给反应容器时,生物样本中存在的靶核酸(例如,靶rna或靶dna分子)可能不被浓缩。或者,可以纯化生物样本和/或可以从生物样本中的其他材料中分离核酸分子。
[0169]
如本文所述的生物样本可包含靶核酸。如本文所用,术语“模板核酸”、“靶核酸”、“核酸分子”、“核酸序列”、“核酸片段”、“寡核苷酸”、“多核苷酸”和“核酸”通常是指任何长度的核苷酸(例如脱氧核糖核苷酸(dntp)或核糖核苷酸(rntp)或其类似物)的聚合形式,并且可以互换使用。核酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。核酸分子可具有至少约10个核酸碱基(“碱基”)、20个碱基、30个碱基、40个碱基、50个碱基、100个碱基、200个碱基、300个碱基、400个碱基、500个碱基、1千碱基(kb)、2kb、3kb、4kb、5kb、10kb、50kb或更多个碱基的长度。寡核苷酸通常由四种核苷酸碱基的特定序列组成:腺嘌呤(a);胞嘧啶(c);鸟嘌呤(g);和胸腺嘧啶(t)(当多核苷酸是rna时,尿嘧啶(u)替代胸腺嘧啶(t))。寡核苷酸可包括一种或多种非标准核苷酸、核苷酸类似物和/或修饰的核苷酸。核酸的非限制性实例包括dna、rna、基因组dna(例如,gdna,例如剪切的gdna)、无细胞dna(例如,cfdna)、合成dna/rna、基因或基因片段的编码或非编码区、由连锁分析定义的位点(基因座)、外显子、内含子、信使rna(mrna)、转移rna、核糖体rna、短干扰rna(sirna)、短发夹rna(shrna)、微

rna(mirna)、核酶、互补dna(cdna)、重组核酸、分支核酸、质粒、载体、任何序列的分离的dna、任何序列的分离的rna、核酸探针和引物。核酸可以包含一种或多种修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果存在,可以在核酸组装之前或之后对核苷酸结构进行修饰。核酸的核苷酸序列可能被非核苷酸组分中断。核酸可以在聚合后进一步修饰,例如通过与报道剂缀合或结合进行修饰。
[0170]
可扩增如本文所述的靶核酸或样本核酸以产生扩增产物。靶核酸可以是靶rna或靶dna。当靶核酸是靶rna时,靶rna可以是任何类型的rna,包括本文别处描述的rna类型。靶
rna可以是病毒rna和/或肿瘤rna。病毒rna可能对受试者具有致病性。致病病毒rna的非限制性实例包括人类免疫缺陷病毒i(hiv i)、人类免疫缺陷病毒n(hiv 11)、正粘病毒、埃博拉病毒、登革病毒、流感病毒(例如,h1n1、h3n2、h7n9或h5n1)、疱疹病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎(例如,装甲rna

hcv病毒)病毒、丁型肝炎病毒、戊型肝炎病毒、庚型肝炎病毒、爱泼斯坦

巴尔病毒、单核细胞增多症病毒、巨细胞病毒、sars病毒、西尼罗河热病毒、脊髓灰质炎病毒和麻疹病毒。
[0171]
生物样本可包含多种靶核酸分子。例如,生物样本可以包含来自单个受试者的多种靶核酸分子。在另一个实例中,生物样本可以包含来自第一受试者的第一靶核酸分子和来自第二受试者的第二靶核酸分子。
[0172]
本文所述的方法可以在反应容器(例如,乳液中的液滴,或多个孔中的孔)中进行。可以使用任何合适的反应容器。反应容器包括主体,该主体可以包括内表面、外表面,并且在一些情况中,包括开口端和相对的关闭端。在一些情况中,反应容器可以不包括开口端或关闭端。例如,反应容器可以是液滴。在其他情况下,反应容器可以包括盖,该盖可以被配置为在开口端处接触主体,使得在进行接触时反应容器的开口端是关闭的。盖可以永久地与反应容器相关联,使得它在打开和关闭配置中保持附接至反应容器。盖可以是可移除的,使得当反应容器打开时,盖与反应容器分离。反应容器诸如流动池室(例如,包含油包水乳液或多个孔的流动池室)可包含一个或多个入口或出口,所述入口或出口可用于提供和移除反应中使用的试剂。试剂可以通过压力和真空控制而进出该室。如本文所用的反应容器可以是密封的,任选地不透气地密封的(例如,密封的微孔板)。
[0173]
反应容器可以具有不同的尺寸、形状、重量和构造。一些反应容器可以是基本上圆形或椭圆形的管状。一些反应容器可以是矩形、正方形、菱形、圆形、椭圆形或三角形。反应容器可以是规则形状或不规则形状。例如,作为液滴(例如,乳液中的液滴,例如水性液滴)的反应容器可以是基本上球形的。反应容器(例如,微孔板或流动池的孔)的关闭端可具有锥形、圆形或平坦表面。反应容器类型的非限制性示例包括管、孔、毛细管、盒、比色皿、离心管、液滴或移液管头。反应容器可由任何合适的材料构成,此类材料的非限制性示例包括玻璃、金属、塑料、不混溶流体及其组合。在一个示例中,反应容器可以是液滴,例如不混溶流体例如油中的水性液滴。反应容器可以是任何合适的尺寸。例如,反应容器可以是具有至少约1纳米(nm)、10nm、50nm、100nm、1微米(μm)、10μm、50μm、100μm、1毫米(mm)、10mm、50mm、100mm或1厘米(cm)直径的大致球形的液滴。可替代地,反应容器可以是直径至少约100μm、1mm、5mm或10mm的孔。孔的深度可以与孔的直径相同或不同。例如,孔可具有约5mm的直径和约10mm的深度。
[0174]
反应容器可以是反应容器的集合或阵列的部分。反应容器的集合或阵列对于自动化方法和/或同时处理多个样品可能特别有用。反应容器可以是由多个孔组成的微孔板的孔。反应容器可以保持在热循环器的热块的孔中,其中热循环块包括多个孔,每个孔能够接收样品容器。由反应容器(例如,液滴或微孔)组成的集合或阵列可包含任何合适数量的反应容器。反应容器的集合或阵列可包括至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200、300、400、500、1,000、10,000或更多个容器。例如,反应容器的集合或阵列可包含至少2、4、6、8、10、12、14、16、18、20、25、35、48、96、144、384或更多个反应容器。反应容器(例如,微孔)的集合或阵列的反应容器部分也可以是由流体处理装置单独地可寻址的,使得流体
处理装置可正确识别反应容器并将适当的流体材料分配到反应容器中。流体处理装置可用于将流体材料自动添加到反应容器中。
[0175]
在一些情况中,一个或多个反应容器可被包括在另一个反应容器内。例如,多个液滴可以被包含在容器中,例如烧杯、试管、流动池室或其他容器,或者(例如,微孔板或流动池的)多个孔可以被包含在容器例如流动池室中。在一个示例中,可以在流动池室的表面上提供多个孔,使得核酸反应可以直接在流动池上发生。在另一示例中,一个或多个液滴可以被物理地限制到给定区域,例如容器的表面。液滴可以通过例如电磁力而被物理约束,例如通过容器的材料(例如,表面)和包含在液滴内的材料(例如,顺磁性珠或偶联至珠的磁性标记)之间的磁引力或通过使用光镊。在一个示例中,液滴可以被限制在(例如,微孔板或流动池的)孔内。
[0176]
如本文所用的反应容器(例如,液滴或孔)可包括多个热区。可以在反应容器内的热敏分层材料的帮助下在反应容器内创建热区。在这种情况下,可以使用热敏分层材料的加热来将反应混合物从一个热区释放到下一个热区。反应容器可包括2、3、4、5、6、7、8、9、10、11、12、13、14、15、20或更多个热区。反应容器内的热区可以通过将反应容器的不同区域暴露于不同的温度循环条件来实现。例如,流动池室的不同区域(例如,包括多个孔和/或液滴)可以经受不同的温度循环条件。可替代地,反应容器的阵列或集合中的一个或多个反应容器可经受一个或多个不同的热区。例如,第一组反应容器可以放置在第一热区内,而第二组反应容器可以放置在第二热区内(例如,通过物理分开各个反应容器)。可替代地或另外地,反应容器的阵列或集合中的一个或多个反应容器可经受多个不同的温度(例如,在整个过程中的不同时间)。施加到反应容器的温度可以适用于例如核酸反应的引发、核酸分子的退火、退火的核酸分子的延伸(例如引物延伸)、双链核酸序列或其部分的部分或完全变性、或任何其他有用的过程。例如,可以根据热循环方案控制温度。在一个示例中,反应容器的全部或部分可在第一时间经受第一温度持续第一持续时间,并且反应容器或其部分可随后在第二时间经受第二温度持续第二持续时间。第一温度可以是例如适合于核酸反应(例如,pcr)的引发或第一核酸分子与第二核酸分子的退火(例如,杂交)的温度。例如,第二温度可以是适合于退火的核酸分子(例如引物分子)的延伸和/或退火的核酸分子的变性的温度。还可以应用另外的不同温度。温度可以重复任何合适的次数(例如,用于任何数量的热循环)。
[0177]
如本文所述,术语“珠”通常是指任何形状和尺寸的固体支持物、树脂、凝胶(例如,水凝胶)、胶体或粒子。珠可以包括任何合适的材料,例如玻璃或陶瓷、一种或多种聚合物和/或金属。合适的聚合物的示例包括但不限于尼龙、聚四氟乙烯、聚苯乙烯、聚丙烯酰胺、琼脂糖、纤维素、纤维素衍生物或葡聚糖。合适的金属的示例包括顺磁性金属,例如铁。珠可以是磁性的或非磁性的。例如,珠可以包括带有一个或多个磁性标记的一种或多种聚合物。可以使用电磁力操纵磁珠(例如,在位置之间移动或物理地限制到例如反应容器例如流动池室的给定位置)。珠可以具有一个或多个不同的尺寸,包括直径。珠的尺寸(例如珠的直径)可以小于约1mm、小于约0.1mm、小于约0.01mm、小于约0.005mm、约1nm至约100nm、约1μm至约100μm,或约1mm至约100mm。珠的集合可以包括具有相同或不同特征的一个或多个珠。例如,珠的集合中的第一珠可以具有第一直径,珠的集合中的第二珠可以具有第二直径。第一直径可以与第二直径相同或近似相同或不同。类似地,第一珠可具有与第二珠相同或不
同的形状和组成。在一个示例中,第一珠可包含第一聚合物材料而第二珠可包含第二聚合物材料。第一聚合物材料可以与第二聚合物材料相同或不同。第一珠可包含第一材料,例如与其偶联的第一寡核苷酸(例如,引物),第二珠可包含第二材料,例如与其偶联的第二寡核苷酸(例如,引物)。第一和第二寡核苷酸可以相同或不同。例如,第一寡核苷酸(例如,第一引物)可以具有与第二寡核苷酸(例如,第二引物)相同的核酸序列或不同的核酸序列。在一些情况中,第一寡核苷酸(例如,第一引物)可以包含第一核酸序列和第二核酸序列,并且第二寡核苷酸(例如,第二引物)可以包含第三核酸序列和第四核酸序列。第一和第三核酸序列可以相同。例如,第一和第三核酸序列可以是条形码序列。第二和第四核酸序列可以不同。例如,第二和第四核酸序列可以是被配置为执行不同功能的功能序列。如本文所述,第二和第四核酸序列可以是配置为捕获不同核酸分子的引物(例如,捕获)序列。在一个示例中,第一珠可以具有与其偶联的多个第一寡核苷酸(例如,第一引物)并且第二珠可以具有与其偶联的多个第二寡核苷酸(例如,第二引物),其中所述多个第一寡核苷酸中的给定第一寡核苷酸包含第一核酸序列和第二核酸序列,并且所述多个第二寡核苷酸中的给定第二寡核苷酸包含第三核酸序列和第四核酸序列。第一和第三核酸序列可以相同(例如,条形码序列)。第二和第四核酸序列可以不同(例如,不同的功能序列)。在一些情况中,与第一珠偶联的多个第一寡核苷酸中的第二核酸序列可以变化,和/或与第二珠偶联的多个第一寡核苷酸中的第四核酸序列可以变化。例如,第二核酸序列和/或第四核酸序列可以是适合于捕获各种模板核酸分子的随机n聚体(n

mer)。与珠偶联的寡核苷酸的核酸序列可以具有任何有用的碱基组成和长度的任何有用的序列。在一些情况中,与珠偶联的寡核苷酸的核酸序列可仅包含规范核苷酸,而在其他情况下,与珠偶联的寡核苷酸的核酸序列可包含一个或多个核苷酸类似物。核酸序列可包含一个或多个标记或染料,例如一个或多个荧光标记、染料、磁性标记、射频标记或其他标签。与珠偶联的寡核苷酸的核酸序列可以包含一个或多个另外特征,例如复制块、可切割碱基或可逆终止子。
[0178]
如本文所用,术语“引物”或“引物分子”通常是指与模板核酸分子的一部分互补的多核苷酸。例如,引物可以与模板核酸分子的链的一部分互补。引物可以是作为核酸合成起点的核酸链,例如引物延伸反应,其可以是核酸反应(例如,核酸扩增反应,例如pcr)的组成部分。引物可以与模板链杂交,然后可以将核苷酸(例如,规范核苷酸或核苷酸类似物)添加到引物的末端,有时在聚合用酶例如聚合酶的帮助下。因此,在dna样品的复制过程中,催化复制的酶可能会在附接至dna样品的引物的3'末端开始复制并复制相对链。引物(例如,寡核苷酸)可具有一个或多个官能团,其可用于将引物偶联至支持物或载物,例如珠或粒子。
[0179]
引物可以与模板核酸完全或部分互补。引物可表现出与模板核酸的序列同一性或同源性或互补性。引物和模板核酸之间的同源性或序列同一性或互补性可以基于引物的长度。例如,如果引物长度是大约20个核酸,则它可以包含10个或更多个与模板核酸互补的邻接核酸碱基。引物和模板核酸之间的互补性或同源性或序列同一性可能是有限的。引物的长度可以在8个核苷酸碱基到50个核苷酸碱基之间。引物的长度可以是多于2个核苷酸碱基、多于3个核苷酸碱基、4个核苷酸碱基、5个核苷酸碱基、6个核苷酸碱基、7个核苷酸碱基、8个核苷酸碱基、9个核苷酸碱基、10个核苷酸碱基、11个核苷酸碱基、12个核苷酸碱基、13个核苷酸碱基、14个核苷酸碱基、15个核苷酸碱基、16个核苷酸碱基、17个核苷酸碱基、18个核苷酸
碱基、19个核苷酸碱基、20个核苷酸碱基、21个核苷酸碱基、22个核苷酸碱基、23个核苷酸碱基、24个核苷酸碱基、25个核苷酸碱基、26个核苷酸碱基、27个核苷酸碱基、28个核苷酸碱基、29个核苷酸碱基、30个核苷酸碱基、31个核苷酸碱基、32个核苷酸碱基、33个核苷酸碱基、34个核苷酸碱基、35个核苷酸碱基、37个核苷酸碱基、40个核苷酸碱基、42个核苷酸碱基、45个核苷酸碱基、47个核苷酸碱基或50个核苷酸碱基。引物的长度可以是少于50个核苷酸碱基、47个核苷酸碱基、45个核苷酸碱基、42个核苷酸碱基、40个核苷酸碱基、37个核苷酸碱基、35个核苷酸碱基、34个核苷酸碱基、33个核苷酸碱基、32个核苷酸碱基、31个核苷酸碱基、30个核苷酸碱基、29个核苷酸碱基、28个核苷酸碱基、27个核苷酸碱基、26个核苷酸碱基、25个核苷酸碱基、24个核苷酸碱基、23个核苷酸碱基、22个核苷酸碱基、21个核苷酸碱基、20个核苷酸碱基、19个核苷酸碱基、18个核苷酸碱基、17个核苷酸碱基、16个核苷酸碱基、15个核苷酸碱基、14个核苷酸碱基、13个核苷酸碱基、12个核苷酸碱基、11个核苷酸碱基、10个核苷酸碱基、9个核苷酸碱基、8个核苷酸碱基、7个核苷酸碱基、6个核苷酸碱基、5个核苷酸碱基、4个核苷酸碱基、3个核苷酸碱基或2个核苷酸碱基。
[0180]
术语“%序列同一性”在本文中可以与术语“%同一性”互换使用,并且可以指当使用序列比对程序比对时两个或更多个核苷酸序列之间的核苷酸序列同一性水平。如本文所用,80%同一性可以与通过定义的算法确定的80%序列同一性同义,并且意味着给定序列与另一长度的另一序列至少80%相同。%同一性可以选自与给定的序列例如至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%或更高序列同一性。%同一性可以在例如约60%至约70%、约70%至约80%、约80%至约85%、约85%至约90%、约90%至约95%,或约95%至约99%的范围。
[0181]
术语“%序列同源性”或“序列同源性百分比”或“序列同一性百分比”在本文中可以与术语“%同源性”、“%序列同一性”或“%同一性”互换使用,并且可以指当使用序列比对程序比对时两个或更多个核苷酸序列之间的核苷酸序列同源性水平。例如,如本文所用,80%同源性可以与通过定义的算法确定的80%序列同源性同义,因此给定序列的同源物在所述给定序列的长度上具有大于80%的序列同源性。%同源性可以选自与给定的序列例如至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%或更高序列同源性。%同源性可以在例如约60%至约70%、约70%至约80%、约80%至约85%、约85%至约90%、约90%至约95%,或约95%至约99%的范围。
[0182]
如本文所用,术语“引物延伸反应”通常是指引物与模板核酸链的结合,然后是(一个或多个)引物的延伸。它还可以包括双链核酸的变性,以及引物链与变性模板核酸链中的一条或两条的结合,然后是(一个或多个)引物的延伸。引物延伸反应可用于通过使用酶(例如聚合用酶如聚合酶)以模板指导的方式将核苷酸或核苷酸类似物掺入至引物。引物延伸反应可以是核酸扩增反应的过程。
[0183]
如本文所用,术语“衔接子”通常是指适应于允许测序仪器对靶多核苷酸进行测序的分子(例如,多核苷酸),例如通过与靶核酸分子相互作用以促进测序(例如,下一代测序(ngs))。测序衔接子可以允许靶核酸分子被测序仪器测序。例如,测序衔接子可包含与附接于测序系统的固体支持物(例如珠或流动池)的捕获多核苷酸杂交或结合的核苷酸序列。测序衔接子可包含与多核苷酸杂交或结合以产生发夹环的核苷酸序列,其允许通过测序系统对靶多核苷酸进行测序。测序衔接子可以包括测序仪基序,其可以是与另一分子(例如,多
核苷酸)的流动池序列互补并且可由测序系统用于对靶多核苷酸进行测序的核苷酸序列。测序仪基序还可包括用于测序(例如合成测序)的引物序列。测序仪基序可包括用于将文库衔接子偶联至测序系统并对靶多核苷酸(例如样品核酸)进行测序的(一个或多个)序列。
[0184]
如本文所述,衔接子可具有第一子部分和第二子部分。第一子部分和第二子部分可以具有序列互补性。如本文所述的衔接子可以是用于产生配对末端序列读段的配对末端衔接子。
[0185]
如本文所用,术语“聚合酶”、“聚合用酶”或“聚合作用酶”通常是指能够催化聚合反应的任何酶并且可以互换使用。聚合用酶可用于通过掺入核苷酸或核苷酸类似物来延伸引物。聚合酶的示例包括但不限于核酸聚合酶。聚合酶可以是天然存在的或合成的。聚合酶的示例是φ29聚合酶或其衍生物。聚合酶可以是聚合作用酶。也可以使用转录酶或连接酶(即催化键形成的酶)。聚合酶的示例包括dna聚合酶、rna聚合酶、热稳定性聚合酶、野生型聚合酶、经修饰的聚合酶、大肠杆菌dna聚合酶i、t7 dna聚合酶、噬菌体t4 dna聚合酶、φ29(phi29)dna聚合酶、taq聚合酶、tth聚合酶、tli聚合酶、pfu聚合酶、pwo聚合酶、vent聚合酶、deepvent聚合酶、ex

taq聚合酶、la

taw聚合酶、sso聚合酶、poc聚合酶、pab聚合酶,mth聚合酶、es4聚合酶、tru聚合酶、tac聚合酶、tne聚合酶、tma聚合酶、tca聚合酶、tih聚合酶、tfi聚合酶、platinum taq聚合酶、tbr聚合酶、tfl聚合酶、pfutubo聚合酶、pyrobest聚合酶、kod聚合酶、bst聚合酶、sac聚合酶、klenow片段、具有3'到5'外切核酸酶活性的聚合酶,以及它们的变体、经修饰的产物和衍生物。聚合酶可以是单亚基聚合酶。聚合酶可具有高持续合成能力,即聚合酶连续将核苷酸掺入核酸模板而不释放核酸模板的能力。
[0186]
如本文所用,术语“至少部分地”通常是指总量的任何分数。例如,“至少部分地”可以指总量的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99.9%。
[0187]
如本文所用,术语“条形码”或“条形码序列”通常指可用于鉴定一个或多个特定核酸的一个或多个核苷酸序列。条形码可包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸(例如,连续核苷酸)。条形码可包含至少约10、约20、约30、约40、约50、约60、约70、约80、约90、约100或更多个连续核苷酸。用于扩增和/或测序过程(例如,ngs)的所有条形码可能不同。包含条形码的核酸群体中不同条形码的多样性可以随机产生或非随机产生。
[0188]
条形码可以由一个或多个区段组成。例如,条形码可包含具有第一核酸序列的第一区段和具有第二核酸序列的第二区段。第一核酸序列可以与第二核酸序列相同或不同。可以根据拆分池方案以组合方式组装包括多个区段的条形码序列,其中多个不同的第一区段分布在多个第一分区中,然后将内容物合并并分布在多个第二分区中。多个不同的第二区段然后分布在多个第二分区中并链接到多个第二分区内的多个不同的第一区段,然后将多个第二分区的内容物合并。该过程可以使用任意数量的不同区段和分区重复任意次数以提供任意水平的条形码多样性。在一些情况中,条形码序列的第一区段可以与珠偶联。
[0189]
如本文所述,条形码的使用可允许使用下一代测序技术对多个样品进行高通量分析。包含多个核酸分子的样品可以分布在多个分区(例如,乳液中的液滴)中,其中每个分区包含含有独特条形码序列的核酸条形码分子。样品可以被分区,使得多个分区中的所有或大部分分区包括多个核酸分子中的至少一个核酸分子。给定分区的核酸分子和核酸条形码
分子然后可用于(例如,通过核酸扩增反应)产生核酸分子的至少一个序列的一个或多个拷贝和/或互补序列,所述拷贝和/或互补序列包括核酸条形码分子的条形码序列或其互补序列。然后可以合并各种不同分区的内容物(例如,扩增产物或其衍生物)并进行测序。在一些情况中,核酸条形码分子可以与珠偶联。在这种情况下,拷贝和/或互补序列也可以与珠偶联。核酸条形码分子和拷贝和/或互补序列可以从分区内的珠释放或在合并之后释放以促进使用测序仪器进行核酸测序。因为多个核酸分子中的核酸分子的拷贝和/或互补序列各自包括独特的条形码序列或其互补序列,所以使用核酸测序测定获得的测序读段可以与多个核酸分子中的跟其对应的核酸分子相关联。所述方法可以应用于被包括在多个分区之间分配的细胞内的核酸分子,和/或源自多个不同样品的核酸分子。
[0190]
在一些方面,本文提供了系统、方法和组合物,其中分区包含多于单个珠。在一些方面,本文提供系统、方法和组合物,其中分区包含多于单个分析物(例如核酸分子,例如模板核酸分子)。有利地,本公开的系统、方法和组合物不需要依赖于为了成功的下游处理而进行的单一内容物加载(例如,具有单个珠,具有单个分析物)。有利地,本公开的系统、方法和组合物不需要依赖于形成根据泊松分布至多单一加载(例如,具有单个珠、具有单个分析物)的分区,所述依赖通常可能会导致资源浪费,其中大量分区消耗某些资源(例如,珠、分析物、试剂等)但由于缺少某些其他资源(例如,珠、分析物)中的一种或多种(或在其他方面的错误数量或错误组成)而无用。在一些情况中,有利地,本公开内容的系统、方法和组合物可实现比依赖单一加载的系统、方法和组合物更高的效率和/或更高的输出。方法
[0191]
本公开提供用于分析和/或处理生物样品的方法。具体地,本公开提供了一种用于分析和/或处理包含一个或多个核酸分子(例如,多个核酸分子)的核酸样品的方法。核酸样品(例如,生物样品或无细胞生物样品)可包含多个核酸分子,例如多个脱氧核糖核酸(dna)和/或核糖核酸(rna)分子。如本文公开的用于分析和/或处理生物样品的方法可以包括产生多个分区(例如,多个孔或液滴,例如通过产生包含多个液滴的乳液),其中每个分区(例如,液滴或孔)可以包含(i)多个珠和(ii)至少一个核酸分子(例如,生物样品的靶核酸分子)。多个分区中的给定分区还可包含一种或多种试剂。
[0192]
在一些情况中,多个分区中的分区(例如,给定分区)可以包含至少两个珠。因此,本公开的方法可以在分区(诸如乳液中的液滴)内提供珠与核酸分子的增加的比率(例如,等于或大于2,或等于或大于4的比率等)。多个分区中的第一分区的至少一个核酸分子可以与多个分区中的第二分区的至少一个核酸分子不同(例如,具有不同的核苷酸序列)。例如,第一分区的至少一个核酸分子可以源自第一生物样品(例如,来自第一受试者)并且第二分区的至少一个核酸分子可以源自第二生物样品(例如,来自第二受试者或来自第一受试者但在不同的时间或通过不同的方法获取)。在另一个实例中,第一分区的至少一个核酸分子可源自生物样品的第一细胞,第二分区的至少一个核酸分子可源自同一生物样品的第二细胞。可替代地,多个分区中的第一分区的至少一个核酸分子可以与多个分区中的第二分区的至少一个核酸分子相同(例如,具有相同的核苷酸序列)或近似相同(例如,具有高序列互补性)。
[0193]
位于多个分区中的分区中的至少一个核酸分子可以通过产生至少一个核酸分子的一个或多个扩增产物而在分区内(例如,在乳液中的液滴内)扩增。扩增过程和/或测序过
程可以通过聚合酶链式反应(pcr)进行。可以在至少一个核酸分子与珠附接(例如,共价或非共价连接)时或当至少一个核酸分子不与珠附接时进行扩增过程。例如,在至少一个核酸分子附接至分区内包括的至少两个珠中的珠上时,至少一个核酸分子的一个或多个扩增产物可以在多个分区中的分区内产生。可以合并多个分区的内容物(例如,核酸分子和相应的扩增产物和珠可以从乳液中的多个液滴中的液滴释放)。在从多个分区中的分区释放珠

核酸分子复合物(或多个复合物)时,珠

核酸分子复合物(或多个复合物)可以与其他材料(例如,与乳液的多个液滴中的液滴中的合并内容物)分开。随后,可以(例如,通过确定测序仪中的核苷酸序列)测定或分析多个分区中的分区的至少一个核酸分子或可能已经形成的与其对应的任何扩增产物或其衍生物。
[0194]
图1描绘了通用下一代测序(ngs)方法的示意图,并指示了其中遗传材料可能逃脱分析和/或潜在噪声源和突变可能被引入的工作流程的部分。可以提供生物样品(101)。例如,生物样品可以包含适当大小的dna,例如cfdna和剪切gdna。生物样品可以是有限输入(111),其代表包括稀有变体的总材料。生物样品可以进行衔接子连接(102)。在此过程中,基因组材料可能会丢失(112),例如由于连接不完全和无成效的衔接子组合。连接衔接子的样品可以进行pct扩增(103),这可以导致拷贝数和突变的增加(113)。可以对产物进行克隆扩增,例如通过乳液pcr(104)进行。在这个过程中,可能会丢失更多的材料,突变数量可能会增加(114),例如由于双泊松加载方案,优化方案以最小化混合模板的克隆拷贝。可以对克隆扩增产物进行测序(105)。在此过程中,总体噪声和信号衰减可能会导致错误(115)。图2描绘了图1的示意图的修改版本,其中对工作流程的修改可以增加产率(例如,从分析的生物样品中获得的信息量)并降低核酸分析过程中出现噪声和突变的可能性。可以提供生物样品(201)。在此供给期间,执行pcr富集可能会减少样品损失(211)。在一些情况中,突变速率可能会增加。生物样品可以进行衔接子连接(202)。在此过程中,可以使用带有随机标识符的衔接子。在一些情况中,可以使用配对末端衔接子(212)。在测序期间(例如,205),此类衔接子可能会减少或消除对多次读取的需要。连接衔接子的样品可以进行pct扩增(203),在此期间可以通过随机标识符纠正突变(213)。可以对产物进行克隆扩增,例如通过乳液pcr(204)进行。在这个过程中,每个文库模板可以使用多个珠(214),这可以使模板损失最小化。可以对克隆扩增产物进行测序(205)。在此过程中,可以处理多个读段和/或配对末端读段(215)。在一些情况中,每个文库模板使用多个珠(例如,214)可以减少或消除生成多个读段和/或必须使用随机标识符校正pcr扩增衍生突变的需要。本文提供的方法对通用ngs方法进行了修改以提供增强的核酸扩增和测序。本公开的方法的优点可以是分区(例如,液滴)内的珠与核酸分子的增高比率(例如,>2),这可以导致样品分析期间增加的准确度和灵敏度,原因是例如给定核酸分子的克隆拷贝数更高以及样品或模板损失减少。
[0195]
如本文所用,术语“双泊松”通常是指通过随机抽样将来自两种不同项种类的单个离散项分配到分区中的统计难度。通常,每个种类的加载由泊松统计控制。对于n个项随机分布在m个相等分区中的给定情况,分区中发现的相对群体取决于项与分区的比率,λ:当两个种类的项分别分布到分区中时,每一个都将遵循自己的泊松分布,导致双泊松分布,导致最多只有一小部分分区具有每个种类的单个实例。给出项与分区比率λ,包
含n个项的分区的概率可以计算为:对于单个泊松过程,在每个分区加载一个时,只有一个项的分区的分数计算如下:p(n=1|λ=1)=1/e≈36.8%。这可以通过设置导数并注意对于任何n当n=λ时出现极值。这也代表项的36.8%。如果将两个种类a和b加载到分区中,则分布为:这在下面的表1中列出,对于每个种类λ=1。在这种情况下,只有1/e2≈13.5%的分区具有种类a和b各自的单个项。a的数量表1

分区群体的分布
[0196]
如果一个种类的核酸模板(例如a)和一个种类的珠(例如b)被分配进入液滴(例如分区),则如本公开内容中所考虑的,因为模板、珠、分区和阳性珠(分区中具有至少一个模板的珠)的相对成本可以显著变化,λ
模板
和λ

的最佳值可以被优化以最小化成本并提高效率。例如,分区和珠可以以较低的成本加权,模板和阳性珠可以以较高的成本加权。这种优化可以解释不同失败事件的成本,例如用模板加载液滴的失败,这将花费液滴和珠。然而,在这种情况下,由于珠是阴性珠(分区中没有任何模板的珠),因此在洗去阴性珠的富集步骤后不再评估进一步的成本。在另一个失败事件中,一个分区加载了两个或更多个模板和一个或多个珠(这将花费模板和珠),以及创建一个或多个多克隆阳性珠(带有混合模板),这可能会进一步导致下游处理成本。
[0197]
根据本文提供的方法使用的生物样品可以是固体生物样品(例如,组织样品,例如活检样品)或液体生物样品(例如,来自体液,例如血液)。生物样品可包含多个核酸分子。在一些情况中,生物样品可包含含有多个核酸分子的多个细胞。在其他情况下,生物样品可以是无细胞生物样品(例如,如本文所述)。可处理生物样品以去除细胞物质和/或其他碎片、分离和/或裂解细胞、添加或去除试剂、或以其他方式制备生物样品以用于后续处理。例如,
可以处理生物样品以提供无细胞生物样品。可以使用本文公开的方法分析的核酸分子可以是无细胞核酸分子(例如,cfdna或ctdna)。无细胞核酸分子可能源自生物体或受试者的特定组织或器官,例如来自癌组织,并且可能以低至极低的浓度(例如,<10ng/ml)存在于样品中。
[0198]
如本文所公开的用于分析生物样品的方法可包括使具有相同或不同物理化学性质例如极性和粘度的两种或更多种溶剂、液体或流体接触(例如,混合或合并)。使两种或更多种材料接触可导致产生包含多个液滴的乳液(例如,油包水或水包油乳液)。两种或更多种材料(例如,液体)可以是不混溶的。本文公开的方法可以包括将具有第一极性(例如,具有一定的第一亲水性或亲脂性)的第一材料(例如,溶剂或溶液)与具有第二极性(例如,具有一定的第二亲水性或亲脂性)的第二材料(例如,溶剂或溶液)接触。第一材料(例如,水溶液)的极性可以与第二材料(例如,非极性流体,例如油)的极性相同、相似或不同。如本文所公开的,第一材料可以是水溶液并且第二材料可以是油。在水溶液与油接触时,可形成乳液(例如,在液滴产生接合处)。乳液可具有分散相和连续相。
[0199]
通常,本公开的方法包括包含水性分散相和连续油相的乳液。因此,本文公开的方法可包括使包含多个核酸分子、多个珠和多种试剂的水溶液和油接触以产生包含所述多个核酸分子中的核酸分子(例如,靶核酸分子)、所述多个珠中的珠和所述多种试剂中的试剂的多个水性液滴。在一些情况中,所述多个核酸分子可被包含在多个细胞内,使得所述多个水性液滴可包含多个细胞。在一些情况中,一个液滴可包含不超过一个细胞。在一些情况中,可以组合同相中的一个或多个液滴。例如,包含多个核酸分子(例如,靶核酸分子)的多个第一液滴(例如,水性液滴)可以与包含多个珠和/或试剂的多个第二液滴(例如,水性液滴)组合(例如,合并或聚结)以提供包含所述多个核酸分子和所述多个珠和/或试剂的多个第三液滴(例如,水性液滴)。多个第一液滴和第二液滴可以包括相同的材料(例如,具有相同的特性,例如极性)或可以是不同的材料(例如,具有不同的特性,例如不同的极性)。在其他情况下,包含多个核酸分子(例如,靶核酸分子)的第一材料(例如,水溶液)可以与包含多个珠和/或试剂的第二材料(例如,水溶液)组合以提供包含多个核酸分子和多个珠和/或试剂的第三材料。然后可以将第三材料与跟第一和/或第二溶液不混溶的液体或流体(例如油)接触(或使其接触)以产生多个液滴(例如水性液滴)。因此,第一和第二溶液可以是水溶液,并且与所述第一和第二溶液不混溶的第三液体或流体可以是油(或其任何衍生物)。
[0200]
液滴可以通过任何有用的方法产生。例如,气溶胶或气刀液滴发生器可用于通过将前体流体(例如,第一材料如水溶液)的液滴分配到另一种溶液中来产生液滴。也可以采用微流体液滴生成方法。例如,第一材料(例如,水溶液)可以在第一通道中流向液滴产生接合处,在那里它与在第二通道中流向液滴产生接合处的第二材料(例如,油)接触,在其中液滴可以形成。在一些情况中,可以通过迫使第一材料通过喷嘴进入包含第二材料的区域来形成第一材料的液滴。第一材料可以是水溶液并且可以包含一个或多个要素,例如多个核酸分子、多个珠和/或多种试剂,使得形成的液滴可以包含核酸分子、珠和/或试剂。可以使用各种其他配置来生成液滴。此类配置的示例和液滴生成方法的细节可以在例如美国专利号9,694,361和美国专利公开号2018/0334670中找到,它们的全部内容通过引用并入本文。
[0201]
在一些情况中,产生多个分区(例如,液滴)可以包括使用包含多个核酸分子的第一水溶液和包含多个粒子例如珠(例如,具有附接在其表面的引物序列的珠)的第二水溶
液。然后第一水溶液和第二水溶液可与可能与第一和/或第二溶液不混溶的第三液体或流体(例如油)接触(例如,在液滴产生接合处)。这种不混溶性或极性差异可以导致形成乳液(例如,油包水乳液)。如本文所述的乳液可包含多个分区,例如液滴(例如,水性液滴)。这些液滴可以包含珠、核酸分子和另外成分,例如试剂。在一些情况中,根据本文提供的方法产生的多个液滴中的液滴各自可以包含一个或多个核酸分子(例如,靶核酸分子)、两个或更多个珠和一种或多种试剂。此类试剂可用作反应容器,其中可在液滴内产生对应于一个或多个核酸分子的扩增产物。当液滴包括一个或多个细胞,每个细胞都包含一个或多个核酸分子时,所述试剂可包括用于裂解和/或透化细胞的试剂以提供对其中的一个或多个核酸分子的接近。
[0202]
可以在第一溶液(例如水溶液)中提供多个核酸分子(例如,靶核酸分子),并且可以在第二溶液(例如,水溶液)中提供多个珠。第一溶液和第二溶液可以是相同的溶液(例如,都是水溶液)或可以是不同的溶液。包含多个核酸分子的第一溶液和包含多个珠的第二溶液可与第三液体或流体(例如油)接触。第三液体或流体可以与第一和第二溶液二者都不混溶并且当与第一和第二溶液接触时可以形成乳液(例如,如本文所述)。由一种或多种溶液与一种或多种不混溶性流体接触产生的乳液可形成或产生多个分区(例如,多个液滴)。
[0203]
如本文所公开的,分区可以是由水性分散相形成并且可以被连续相(例如,油)包围的液滴。乳液可以是微乳液或纳米乳液,这取决于连续相内分散相粒子(例如,分区诸如液滴)的尺寸(例如,近似直径)。在一些情况中,分区可以指被配置为将第一分区与第二分区分开或将分区的内部体积与该分区外的体积分开的任何单元。例如,分区可以是孔、微孔、容器、管、储存库、容器或其他器皿。
[0204]
因此,分配在本文中可以描述为提供多个液滴(例如,乳液中的水性液滴)或孔。多个分区的分区,例如多个液滴中的液滴,可以包含包含一个或多个核酸分子和/或一个或多个(例如,两个或更多个)珠的水溶液。分区还可包含一种或多种试剂,例如用于裂解或透化细胞的一种或多种试剂或用于进行扩增反应的一种或多种试剂(例如,核苷酸、聚合用酶等)。多个分区中的分区可以包括不同的组分或其量。例如,多个分区中的第一分区可包含一个或多个核酸分子且不包括珠,而多个分区中的第二分区可包含一个或多个核酸分子和两个或更多个珠。此外,多个分区中的第三分区可包含一个或多个核酸分子和一个珠,而多个分区中的第四分区可包含一个或多个珠且可不包含任何核酸分子。在一些情况中,多个分区中的一个或多个分区可能未被占用(例如,不包含核酸分子、珠或试剂)。分区内的材料分布可以至少部分地由泊松分布控制。在一些情况中,可以通过优化各种溶液中提供的材料量以及溶液和流体通过微流体通道的流量来调整液滴内提供的材料(例如,核酸分子、珠和试剂)的量。例如,流体或溶液通过微流体通道的流量可以至少部分地通过施加特定压力或真空和/或仔细选择通道的长度和宽度来控制。元件诸如过滤结构、锥形区域、流量调节器和空气阱也可用于控制使用液滴生成系统生成的液滴的占用率。在一个示例中,可以使用过量的珠来尝试击败泊松统计并生成与以其他方式可能生成的相比更多的包含至少两个珠的分区。例如,液滴生成系统可以用珠过载以促进生成多个分区中更大比例的包含至少两个珠的分区。
[0205]
在一些情况中,至多约90%、80%、70%、60%、50%、40%、30%、20%、10%、5%或更少的生成的分区可能未被占用。在一些情况中,至多约90%、80%、70%、60%、50%、
40%、30%、20%、10%、5%或更少的生成的分区不包括珠。在一些情况中,至多约90%、80%、70%、60%、50%、40%、30%、20%、10%、5%或更少的生成的分区不包括核酸分子(例如,靶核酸分子)。在一些情况中,至多约90%、80%、70%、60%、50%、40%、30%、20%、10%、5%或更少的生成的分区不包括试剂。产生的分区的至少一个子集可以包含一个或多个核酸分子(例如,靶核酸分子)、一个或多个珠和一种或多种试剂(例如,如本文所述)。产生的分区的至少一个子集可以包含一个或多个核酸分子(例如,靶核酸分子)、两个或更多个珠(例如,至少两个珠)和一种或多种试剂(例如,如本文所述)。分区诸如液滴可包含至少一个、至少两个或至少五个核酸分子和至少一个、至少两个、至少三个、至少五个或至少十个珠。
[0206]
分区例如液滴可以包含相同或不同的至少两个核酸分子,例如在它们的核苷酸序列方面和/或在那些核酸分子所连接到的一个或多个衔接子序列方面相同或不同。通常,与存在于所述分区中的核酸分子的数量相比,本公开的分区可包含过量的珠。分区可包含至少两倍于核酸分子的珠。分区诸如液滴的中的至少两个、至少三个、至少四个、至少五个或更多个珠可以是相同的(例如,同一的)珠或可以是不同的珠。不同的珠可包括不同的特性,例如尺寸、直径、流动性、刚性、孔隙率或可压缩性。不同的珠可以由不同的材料(例如,不同的水凝胶)形成。在一些情况中,分区可包含至少一个为水凝胶珠的珠和至少一个为顺磁性的珠。此外,第一分区例如第一液滴中的至少一个、至少两个、至少三个、至少五个或至少十个珠可以与第二分区例如第二液滴中的至少一个、至少两个、至少三个、至少五个或至少十个珠相同或不同。珠可以包含与其偶联(例如,结合或连接到珠的组分的表面)的多个材料(例如,核酸条形码分子或引物分子)。
[0207]
多个分区(例如,多个液滴)中的每个分区(例如,每个液滴)可以包含与多个分区(例如,多个液滴)中的任何其他分区(例如,另一个液滴)或其任何组合相比相同或不同的核酸分子和/或相同或不同的珠。因此,与多个分区(例如,多个液滴)中的第二分区(例如,第一液滴)相比,多个分区(例如,多个液滴)中的第一分区(例如,第一液滴)可以包含相同或不同的核酸分子(例如,具有不同的核苷酸序列)。类似地,与第二分区(例如,第一液滴)相比,第一分区(例如,第一液滴)可以包含相同或不同的珠(例如,具有不同的引物)。
[0208]
如本文所述的粒子(例如珠)(例如位于分区诸如乳液液滴内的珠)可包含多个引物分子(例如核酸条形码分子)。多个引物分子可以附接(例如,化学连接)到珠上,并且可以由一个或多个引物分子构成。可附接至珠的一个或多个引物分子可包含相同或不同的核苷酸序列。多个引物分子可以附接(例如,化学连接)到珠上,使得核酸分子(例如,靶核酸分子)可以结合(例如,共价或非共价地)或杂交到与珠偶联的多个引物分子中的至少一个引物分子,从而将核酸分子连接(例如,固定)到珠上。多个引物分子可用于进行一个或多个扩增反应(例如,pcr)以在分区(例如液滴)内产生多个扩增产物。一个或多个扩增反应可以包含一个或多个引物延伸反应,所述反应可以包括引物与靶核酸分子的杂交和引物分子的后续延伸(例如,通过聚合用酶)以产生靶核酸分子的序列的互补序列。在每个分区(例如,液滴)中产生的扩增产物可以是分区内包括的核酸分子(例如,靶核酸分子)的相同拷贝(例如,具有相同的核苷酸序列)或其衍生物或片段(例如,具有不同的核苷酸序列)。此类衍生物和片段在其核苷酸序列的长度和/或序列方面可以变化并且可以在扩增反应(例如,pcr)期间产生。在一些情况中,扩增反应可用于将一个或多个序列掺入扩增产物中。例如,一个
或多个条形码序列、独特的分子标识符、衔接子序列、流动池衔接子或其他序列可以被掺入扩增产物中。此类序列可促进后续处理(例如,通过核酸测序测定)。
[0209]
例如,第一珠可包含与其偶联的第一组核酸条形码分子,第二珠可包含与其偶联的第二组核酸条形码分子。第一组核酸条形码分子中的核酸条形码分子可各自包含第一条形码序列和第一引物序列,而第二组核酸条形码分子中的核酸条形码分子可各自包含第二条形码序列和第二引物序列。第一条形码序列可以不同于第二条形码序列。第一引物序列可以与第二引物序列相同或不同。给定分区的第一珠和第二珠可以连接(例如,拴系)在一起。条形码序列可以是独特的,使得没有珠包含相同的条形码序列。可替代地,条形码序列可以被显著稀释(例如,以如此大的数量存在,例如使用至少100万、至少1000万或更多个不同的条形码序列)以致条形码序列预期不会在不同的分区之间重复。在一个示例中,多个分区中的第一分区可包含(i)包含与其偶联的第一组核酸条形码分子的第一珠,所述核酸条形码分子各自包含第一条形码序列和第一引物序列,以及(ii)包含与其偶联的第二组核酸条形码分子的第二珠,所述核酸条形码分子各自包含第二条形码序列和第二引物序列。多个分区中的第二分区可以包含(i)包含与其偶联的第三组核酸条形码分子的第三珠,所述核酸条形码分子各自包含第三条形码序列和第三引物序列,和(ii)包含与其偶联的第四组核酸条形码分子的第四珠,所述核酸条形码分子各自包含第四条形码序列和第四引物序列。第一、第二、第三和第四条形码序列可以彼此都不同。第一、第二、第三和第四引物序列可以全部相同。例如,各种引物序列可以是被配置为杂交和/或捕获给定靶核酸分子的被靶向引物序列,或偶联至一个或多个靶核酸分子的衔接子。在一个示例中,各种引物序列可以包含聚(t)序列并且被配置为与核糖核酸(rna)分子例如信使rna(mrna)分子的聚(a)序列杂交。
[0210]
图4描绘了可与模板核酸分子偶联的功能序列的示例。例如,功能序列是扩增引物序列、测序引物序列、其互补序列和/或其组合。扩增引物序列可以是溶液扩增引物序列。扩增引物序列可以是基底固定引物序列。测序引物序列可以被配置用于促进对编码链的测序。测序引物序列可以被配置用于促进对模板链的反向互补序列的测序。左分图的左侧部分显示了通过基底固定引物分子403而固定到表面450的模板核酸分子,所述基底固定引物分子403偶联至模板核酸分子的第一链420。模板核酸分子的第二链430包含用于对编码链测序的衔接子406以及溶液扩增引物分子407。左分图的右侧部分显示了通过基底固定引物分子403而固定到表面450的模板核酸分子的相同拷贝,所述基底固定引物分子403偶联至模板核酸分子的第二链430。核酸分子的第一链420包含溶液扩增引物分子407和用于对反向互补链测序的衔接子408。基底固定引物(例如403)可被视为第二衔接子402(“衔接子2”),而偶联至模板核酸分子的给定链上的扩增和测序引物(例如406和407、408和407)可以一起构成第一衔接子401(“衔接子1”)。如图4所示,第一衔接子401可以被配置为使得各种序列可以具有不同的解链温度并且因此可以例如通过将包含衔接子的分子加热到给定的温度范围而部分变性。图4的右侧分图显示经由测序衔接子475(例如测序引物)而与第二模板核酸分子480连接的第一模板核酸分子470,其中复合物通过基底固定引物分子465而固定到基底460上。测序衔接子475可以以茎环构造403(“衔接子1”)提供,而附加到复合物的游离末端的衔接子485可以以y形构造404(“衔接子2”)提供。衔接子485可包含测序引物和溶液扩增引物。
[0211]
在多达一个或多个不同的引物分子可以连接(例如,化学连接)到一个珠时,如本文所述的分区或液滴可以包含多个珠,其中每个珠连接到一个或多个引物分子,其中一个或多个引物分子可以相同或不同(例如,包含相同或不同的核苷酸序列)。换言之,单个分区或液滴内的多个珠可包含多个相同或不同的引物分子,其能够结合至多个相同或不同的核酸分子(例如,靶核酸分子)。因此,可以使用多个引物分子(例如,核酸条形码分子)在分区中扩增多个核酸分子以产生多个扩增产物。本公开的方法还可以包括使用可以通过将第一珠连接到第二珠(例如,通过一个或多个化学接头或一个或多个夹板寡核苷酸)而形成的珠对,其中珠对的第一珠和第二珠包含不同的引物分子(例如,核酸条形码分子)。
[0212]
珠可以通过一个或多个接头连接。接头可以是寡核苷酸。接头可包含一个或多个碳水化合物分子。接头可包含亲和结合蛋白。接头可以是亲水的。接头可以是疏水的。接头可以是静电的。接头可以被标记。接头可以是可切割的接头或不可切割的接头。一个或多个核苷酸和/或一个或多个接头部分可用染料、荧光团或量子点(例如,如本文所述)标记。
[0213]
除了包含一个或多个靶核酸分子和一个或多个珠之外,多个分区(例如,多个液滴)中的每个分区(例如,液滴)可以进一步包含一种或多种试剂。可以存在于每个分区内的试剂可以包括缓冲液(例如,某些浓度的各种离子)、蛋白质(例如,酶,例如聚合用酶)、单体分子(例如,核苷酸,例如dntp)、寡聚分子(例如,寡核苷酸)、和聚合分子(例如,核酸,如合成核酸分子)。试剂可用于裂解或透化细胞以提供对其中的核酸分子的接近。试剂可用于扩增和/或引物延伸反应。“试剂”核酸分子(与生物样品的“样品”或“靶”核酸分子相对)可包含引发序列和/或独特的分子标识符(例如,随机标识符或条形码)。如本文所述和使用的引发序列可以是靶特异性的或非靶特异性的(例如,随机n聚体)。此外,试剂核酸分子可包含功能序列,例如测序衔接子和流动池序列。此类“试剂”核酸分子可与珠偶联(例如,如本文所述)。如本文所公开的聚合用酶可以是聚合酶(例如,如本文所述)。聚合酶可以是内源性聚合酶或经修饰的(例如工程化的)聚合酶。聚合酶可用于进行扩增反应(例如,诸如epcr之类的pcr)以产生多个扩增产物。
[0214]
分区的另外组分可以是合成的核酸分子。合成的核酸分子可以是双链的。合成的核酸分子可包含可切割的元件。可切割的元件可以允许合成的核酸分子的组分的分离。分离可以通过化学、光、热或其他方法完成。合成的核酸分子也可以进行连接和/或环化。在连接和/或环化后,合成的核酸分子可被切割以提供经切割的合成的核酸分子。然后可以通过扩增反应(例如,如本文所述)对经切割的合成的核酸分子进行缺口填充。
[0215]
生物样品的核酸分子(例如,dna或rna分子)可以在多个分区之间分配之前被处理。可替代地,可以在多个分区之间进行分配之后处理生物样品的核酸分子。例如,核酸分子可以用一个或多个衔接子(例如,通过杂交或连接过程)进行官能化。衔接子可以包含随机标识符序列(例如条形码或独特分子标识符(umi)序列),其可以允许在数据分析(例如测序和序列分析)期间鉴定原始样品核酸分子和相应的扩增产物(例如,如本文所述)。核酸分子与衔接子(或多个衔接子)的连接反应可以在溶液中(例如,在多个分区之间分配之前)或在乳液中(例如,在多个分区之间分配之后)发生。因此,当核酸分子和衔接子都在水溶液中时,连接反应可以发生,其中水溶液可以是在分区诸如乳液液滴内的水溶液。附接至(例如,共价或非共价连接到)核酸分子(例如,单核酸链)的衔接子的序列可以促进核酸分子与引物分子或其序列的结合。这样的引物分子可以附接至珠上,使得核酸分子通过其衔接子序
列而与引物的相互作用(例如,共价或非共价地结合)可以将核酸分子附接至分区(例如乳液液滴或孔)中的珠上。在将核酸分子连接到珠后,可以进行一个或多个扩增反应(例如,pcr,例如epcr)以产生所述核酸分子的多个扩增产物(例如,如本文所述)。可与本文所述的方法和组合物组合使用的衔接子可以使得能够产生配对末端序列读段。因此,珠与核酸分子更高量的比率和配对末端衔接子的组合使用可以提供具有更高准确性和灵敏度的方法来分析生物样品(例如,靶核酸分子)。
[0216]
本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含一个或多个珠。本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含两个或更多个珠。本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含三个或更多个珠。本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含四个或更多个珠。本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含五个或更多个珠。本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含六个或更多个珠。本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含七个或更多个珠。本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含八个或更多个珠。本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含九个或更多个珠。本公开的方法可以提供多个分区(例如,液滴),其中多个分区中的至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%包含十个或更多个珠。
[0217]
本公开的方法可提供多个分区(例如,液滴),其中多个分区中的至少75%包含约一至三个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少80%包含约一至三个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少85%包含约一至三个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少90%包含约一至三个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少95%包含约一至三个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少97%包含约一至三个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少99%包含约一至三个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的约100%包含约一至三个珠。
[0218]
本公开的方法可提供多个分区(例如,液滴),其中多个分区中的至少75%包含约
两个至五个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少80%包含约两个至五个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少85%包含约两个至五个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少90%包含约两个至五个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少95%包含约两个至五个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少97%包含约两个至五个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少99%包含约两个至五个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的100%包含约两个至五个珠。
[0219]
本公开的方法可提供多个分区(例如,液滴),其中多个分区中的至少75%包含约三个至七个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少80%包含约三个至七个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少85%包含约三个至七个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少90%包含约三个至七个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少95%包含约三个至七个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少97%包含约三个至七个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少99%包含约三个至七个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的100%包含约三个至七个珠。
[0220]
本公开的方法可提供多个分区(例如,液滴),其中多个分区中的至少75%包含约五个至十个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少80%包含约五个至十个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少85%包含约五个至十个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少90%包含约五个至十个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少95%包含约五个至十个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少97%包含约五个至十个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的至少99%包含约五个至十个珠。一种方法可以提供多个分区(例如,液滴),其中多个分区中的100%包含约五个至十个珠。
[0221]
本公开的方法可提供多个分区(例如,液滴),其中多个分区中的至少75%包含的珠与核酸分子比等于或大于2、等于或大于3、等于或大于4、等于或大于5、或等于或大于10。一种方法可提供多个分区(例如,液滴),其中多个分区中的至少85%包含的珠与核酸分子比等于或大于2、等于或大于3、等于或大于4、等于或大于5、或等于或大于10。一种方法可提供多个分区(例如,液滴),其中多个分区中的至少95%包含的珠与核酸分子比等于或大于2、等于或大于3、等于或大于4、等于或大于5、或等于或大于10。一种方法可提供多个分区(例如,液滴),其中多个分区中的至少99%包含的珠与核酸分子比等于或大于2、等于或大于3、等于或大于4、等于或大于5、或等于或大于10。
[0222]
本公开的方法可以包括使用多个不同组的珠。例如,一种方法可以包括使用第一组珠和第二组珠。第一组(或多个)珠中的第一珠可以包含与偶联(例如,共价或非共价连接)至生物样品(例如,一个或多个核酸分子,例如一个或多个dna或rna分子)的第一核酸链的第一衔接子(例如,第一配对末端衔接子序列)具有至少部分序列互补性的第一引物。第二组珠中的第二珠可以包含与偶联至生物样品的第二核酸链的第二衔接子(例如,第二配
对末端衔接子序列)具有序列互补性的第二引物。第一引物可以不同于第二引物。如本文所述的方法可包括在分区中分配(例如,共同分配)(i)第一组珠中的第一珠,(ii)第二组珠中的第二珠,和(iii)包含与其偶联的第一或第二衔接子的核酸分子。可以使用例如一个或多个液滴(例如,在乳液中)或孔来实现分配。可以使用包含第一组珠和第二组珠中的珠的珠对,使得给定的珠对包含第一组珠和第二组珠中的珠。这种方法可以促进将第一和第二引物两者递送至包含珠对的给定分区。
[0223]
在一个示例中,多个分区(例如,多个液滴)中的分区(例如,液滴)(其包含至少两个珠(第一组珠中的第一珠和第二组珠中的第二珠),任选地被配置为珠对,其中第一珠包含第一引物分子并且第二珠包含第二引物分子)和包含一个或多个衔接子序列的核酸分子(被配置为与第一珠的引物序列相互作用的第一衔接子和/或被配置为与第二珠的引物序列相互作用的第二衔接子))可以经受条件,其能够产生与第一和/或第二衔接子偶联的核酸分子或其链(例如,单链(ss)dna或rna)的一个或多个拷贝或其互补序列(或片段)。当核酸分子是双链核酸分子(例如,双链(ds)dna)时,可以产生核酸分子的两链的一个或多个拷贝,或其互补序列或片段。产生第一链和/或第二链的一个或多个拷贝或其互补序列可包括使第一和第二珠和核酸分子经受足以进行引物延伸反应和/或核酸扩增反应(例如,诸如epcr之类的pcr)的条件。第一珠的第一引物分子和/或第二珠的第二引物分子可用于产生包含第一和/或第二衔接子序列的核酸分子的一个或多个拷贝和/或其互补序列。核酸分子的一个或多个拷贝和/或其互补序列可与第一或第二珠偶联,因此可用于另外的扩增反应。在特定实例中,核酸分子可包含与第一衔接子偶联的第一链和与第二衔接子偶联的第二链,其中第一衔接子被配置为与第一珠的第一引物分子相互作用并且第二衔接子被配置为与第二珠的第二引物分子相互作用。第一引物分子可用于产生核酸分子的第一链的一个或多个拷贝和/或其互补序列,第二引物分子可用于产生核酸分子的第二链的一个或多个拷贝和/或其互补序列。核酸分子的第一链的一个或多个拷贝和/或其互补序列可以与第一珠偶联。第二链的一个或多个拷贝和/或其互补序列可以与第二珠偶联。这些偶联的拷贝和/或互补序列可用于另外的扩增反应。第一链的一个或多个拷贝的序列或其互补序列可以至少部分地与第二链的一个或多个拷贝的序列或其互补序列重叠。
[0224]
本领域技术人员将理解,描述双链模板分子的示例也适用于单链模板分子。在一个具体实例中,模板单链可与第一衔接子偶联并且可包含与第二衔接子互补的区域,其中第一衔接子被配置为与第一珠的第一引物分子相互作用并且第二衔接子被配置为与第二珠的第二引物分子相互作用。尽管模板中不存在第二衔接子,但在合成互补链后,新链包含第二衔接子。第一引物分子可用于产生模板的一个或多个互补序列,并且第二引物分子可用于产生模板互补序列的一个或多个互补序列或拷贝。模板单链分子的一个或多个拷贝和/或其互补序列可以与第一珠偶联。模板单链分子的互补序列的一个或多个拷贝和/或其互补序列可以与第二珠偶联。通常,在前述示例中,描述了双链模板;然而,应当理解,也可以使用包含与第二链中描述的区域互补的区域的单链模板。
[0225]
扩增过程完成后,分布在多个分区中的多个珠(例如,多个珠

核酸分子复合物)可以从多个分区(例如,液滴或孔)中回收,并且珠(例如,多个珠

核酸分子复合物)可以从乳液或混合物中分离(例如磁性分离)。随后,可以(例如,通过确定测序仪中的核苷酸序列)测定或分析在任何先前扩增和/或处理步骤期间可能形成的核酸分子或其任何衍生物。
[0226]
在一些情况中,包含不同数量珠的分区(例如,液滴)可以彼此分开。例如,可以将包含第一数量的珠的第一分区(例如,液滴)与包含第二数量的珠的第二分区(例如,液滴)分开。第一数量的珠和第二数量的珠可以相同或不同。例如,第一分区可以包括单个珠并且第二分区可以包括两个珠。在一些情况中,包含给定数量的珠的所有或大部分分区可以与包含不同数量的珠的所有或大部分分区分离。例如,包含单个珠的所有或大部分分区可以与包含零个珠的分区和/或包含两个或更多个珠的分区分离。在另一个实例中,包含两个珠的所有或大部分分区可以与包含其他数量的珠的分区分离。包含不同数量珠的分区的分离可以通过以下来完成:例如光学检测包含不同数量珠的分区并且至少部分地基于这种光学检测而调整流动方向(例如,在微流体通道系统内)以沿第一方向(例如,沿第一通道)发送包含第一数量珠的分区(例如,液滴)并沿第二方向(例如,沿第二通道)发送包含第二数量珠的分区(例如,液滴))。可替代地或另外地,可以使用其他分离策略,包括光学和非光学策略。例如,分区的物理特性,例如质量或密度,可用于分离分区。在一些情况中,多个分区可以经受一种或多种力或场以促进这种分离。
[0227]
在一些情况中,对附接至珠的核酸分子(例如,扩增产物或其衍生物)进行测序。在其他情况下,对未附接至珠的核酸分子(例如,扩增产物或其衍生物)进行测序。例如,附接至珠的核酸分子(例如,扩增产物或其衍生物)可以从珠上去除(例如,通过将核酸分子和珠去偶联)并提供给测序系统进行测序(例如,如本文所述)。核酸分子可以通过例如对珠或包含其的分区施加刺激而从珠上去除。这种刺激可以是例如热刺激、光刺激或化学刺激(例如还原剂)。从珠去除的核酸分子随后可附接至流动池的表面(例如,附接至流动池内的一个或多个孔),在那里它们可经历一个或多个测序反应和/或一个或多个另外的扩增反应。
[0228]
在一些情况中,可以使用多个不同组的珠来制备用于测序的核酸样品。例如,第一组珠中的第一珠可以用来执行第一功能,第二组珠中的第二珠可以用来执行第二功能。不同组的珠可以包含相同或不同的材料并且具有任何数量的共享的或不同的特性(例如,形状、大小、顺磁状态等)。例如,第一组珠中的第一珠可以小于第二组珠中的第二珠。第一组珠中的第一珠可以是直径在约1

100纳米(nm)之间,例如约50nm的纳米珠,而第二组珠中的第二珠可以具有大于约100nm的直径。例如,第二组珠中的第二珠可以是直径在约1

100微米(μm)之间的微珠。第一珠也可以是磁性的,而第二珠可以不是磁性的。由不同组的珠执行的不同功能可包括例如模板加载、扩增和测序。在一个示例中,第一组珠中的第一珠可用于制备包含用于后续处理的多个核酸分子的样品。第一珠可包含与其偶联的多个引物分子,所述引物分子可与多个核酸分子中的核酸分子序列互补。例如,第一组珠的第一子集可以包含与多个核酸分子中的核酸分子的第一序列互补的第一引物分子,并且第一组珠的第二子集可以包含与多个核酸分子中的核酸分子的第二序列互补的第二引物分子。第一序列可以是与多个核酸分子中的核酸分子偶联的第一衔接子的序列,并且第二序列可以是与多个核酸分子中的核酸分子(例如,相同或不同的核酸分子)偶联的第二衔接子的序列。第一序列可以与多个核酸分子中的核酸分子的第一链偶联,并且第二序列可以与多个核酸分子中的核酸分子的第二链偶联。第一组珠和多个核酸分子可以在本体溶液中组合并经受足以使偶联至第一组珠的第一珠的引物分子与多个核酸分子中的核酸分子的序列杂交的条件。然后可以延伸引物分子以产生与多个核酸分子的链互补的链。所得双链核酸分子可与第一组珠的第一珠偶联。与珠偶联的双链核酸分子可以使用例如末端转移酶进行末端封闭。在一
些情况中,单个双链核酸分子可以与给定的第一珠偶联。在其他情况下,多个双链核酸分子可以与给定的珠偶联。然后可以洗涤本体溶液并且可以将第一组珠与溶液中的其他材料分离(例如,通过磁性分离),所述溶液包括多个核酸分子中的游离核酸分子。
[0229]
然后可以将第一组珠在多个分区(例如,液滴;如本文所述)之间分配。多个分区中的分区可包含第一组珠中的与一个或多个双链核酸分子(例如模板核酸分子)偶联的一个或多个第一珠。多个分区中的其他分区可包含第一组珠中的未与双链核酸分子偶联的一个或多个第一珠。多个分区中的其他分区可以不包括第一组珠中的第一珠。
[0230]
第一组珠可以与一种或多种试剂(例如,如本文所述)和第二组珠共同分配。第二组珠可以包含在准备测序(例如,如本文所述)中适合于捕获和扩增模板核酸分子的引物分子。第二组珠在本文中可称为“测序珠”。因此,多个分区可包含以下中的一个或多个:(i)分区的第一子集,包括第一组珠中的与一个或多个双链核酸分子偶联的一个或多个第一珠和第二组珠中的至少两个第二珠;(ii)分区的第二子集,其包括第一组珠中的与一个或多个双链核酸分子偶联的一个或多个第一珠和第二组珠中的仅一个第二珠;(iii)分区的第三子集,其包括第一组珠中的与一个或多个双链核酸分子偶联的一个或多个第一珠并且不包括第二组珠中的第二珠;(iv)分区的第四子集,其包括第一组珠中的未与双链核酸分子偶联的一个或多个第一珠和第二组珠中的至少两个第二珠;(v)分区的第五子集,其包括第一组珠中的未与双链核酸分子偶联的一个或多个第一珠和第二组珠中的仅一个第二珠;(vi)分区的第六子集,其包括第一组珠中的未与双链核酸分子偶联的一个或多个第一珠并且不包括第二组珠中的第二珠;(vii)分区的第七子集,其不包括第一组珠中的第一珠并且确实包括第二组珠中的至少两个第二珠;(viii)分区的第八子集,其不包括第一组珠中的第一珠并且确实包括第二组珠中的仅一个第二珠;以及(ix)分区的第九子集,其不包括第一组珠中的第一珠或第二组珠的第二珠。因此,多个分区中的仅某些子集可以包括模板核酸分子和第二组珠中的至少一个第二珠。上述分区的第三子集中的分区包括与第一组珠中的第一珠偶联的至少一个模板核酸分子,但不包括第二组珠中的第二珠(例如,测序珠)。由于这些分区不包括测序珠,因此不会为测序准备任何材料。在回收第三组分区中的分区内容后,可以使用磁捕获来消除第一珠。因此,不会检测到对应于第三组分区中的分区的测序产物。上述分区的第七子集中的分区不包括带有模板核酸分子的第一珠,但包括第二组珠中的至少两个第二珠。因为这些分区不包括模板核酸分子,所以不会产生对应于模板核酸分子的扩增产物,也不会获得测序读段。磁性分离可用于去除未连接到模板核酸分子的任何第一珠。上述分区的第一子集中的分区包括与模板核酸分子偶联的至少一个第一珠和第二组珠中的至少两个第二珠(例如,如本文所述)。因此,如本文所述,扩增和测序可在至少两个第二珠上进行。扩增后磁性捕获可以消除加载模板的纳米珠(例如,第一珠),从而这些珠将不会通过测序测定被检测到。图9说明了所述方法涉及第一组和第二组珠。提供了一组测序珠901和一组模板加载纳米珠902。在一个实例中,模板加载纳米珠的直径为约50纳米。模板加载纳米珠可以是磁性的和/或包括另一种捕获机制。模板加载纳米珠可以用引物包被。在第一模板制备操作910中,模板加载纳米珠(涂有引物)和模板核酸分子可以在本体混合物中组合。可以过量提供纳米珠。在第二模板制备操作920中,模板可以经受足以(i)使模板与纳米珠退火和(ii)延伸的条件。未结合的模板可以被洗掉,例如通过固定或以其他方式捕获纳米珠并应用洗涤溶液。任选地,使用末端转移酶封闭末端。这种模板制备操作可以生成纳
米珠结合的模板。在乳液操作930中,纳米珠结合的模板可以与测序珠和其他试剂(例如溶液引物分子)一起分配进入液滴,以生成(940)不同占用的液滴以及在一些情况中未被占用的液滴。一些液滴(i)可以包含纳米珠结合的模板,没有测序珠。一些液滴(ii)可以包含测序珠,没有纳米珠结合的模板。一些液滴(iii)可同时包含纳米珠结合的模板和测序珠。要获得模板阳性测序珠,必须存在纳米珠。液滴可以进行扩增940。乳液可能会破裂并且液滴的内容物会合并。如(i)中在没有测序珠的情况下,扩增后的纳米珠捕获(例如,使用磁体)可以消除纳米珠结合的模板,并且由于纳米珠的捕获和小尺寸,测序仪可能无法检测到纳米珠(或与此类纳米珠结合的模板),导致这些液滴没有测序读段。如(ii)中在没有模板的情况下,由于没有模板,扩增可能无法进行。扩增后纳米珠捕获可能会消除空纳米珠(没有与它们结合的模板)。这些液滴不会产生测序读段。如(iii)中在存在测序珠和纳米珠结合的模板的情况下,扩增产物可以固定到测序珠上。扩增后纳米珠捕获可以消除纳米珠结合的模板和其他纳米珠。由于纳米珠的捕获和小尺寸,测序仪可能无法检测到纳米珠(或与此类纳米珠结合的模板),并且将从这些液滴中测序珠上的核酸分子的测序中产生测序读段。扩增反应
[0231]
如本文公开的用于分析和/或处理生物样品的方法可包括任何有用类型的反应(例如,任何核酸扩增反应)以分析和/或处理靶核酸分子以产生靶核酸分子的一个或多个拷贝或互补序列(例如,扩增的核酸分子或扩增的产物)。核酸分子的扩增产物(例如,拷贝或互补序列)可以与核酸分子具有至少部分序列互补性(例如,>90%)。如本文所述的扩增反应可包括单引物延伸反应,例如,当进行核酸扩增时。核酸的扩增可以是线性的、指数的或其组合。扩增可以是基于乳液的或可以是基于非乳液的。可与本文公开的方法组合使用的核酸扩增反应的非限制性实例包括逆转录、引物延伸、聚合酶链式反应(例如,pcr)、连接酶链式反应、解旋酶依赖性扩增、不对称扩增、滚环扩增和多重置换扩增(mda)。可以使用本文描述的方法产生的扩增产物可以是dna。在扩增靶rna的情况下,可以通过rna的逆转录获得dna(例如,互补dna(cdna))并且随后可以使用dna的扩增来产生扩增的dna产物。扩增的dna产物可以指示生物样品中靶rna的存在。在扩增dna的情况下,可以采用任何dna扩增方法。dna扩增方法的非限制性实例包括聚合酶链式反应(pcr)、pcr变化形式(例如实时pcr、等位基因特异性pcr、组装pcr、不对称pcr、数字pcr、乳液pcr(例如epcr)、拨出pcr、解旋酶依赖性pcr、嵌套pcr、热启动pcr、反向pcr、甲基化特异性pcr、微引物pcr、多重pcr、嵌套pcr、重叠延伸pcr、热不对称交错pcr、触底pcr)和连接酶链式反应(lcr)。本文所述的方法可包括线性dna扩增。本文所述的方法可包括指数dna扩增。dna扩增可以通过嵌套pcr实现,这可以提高检测扩增的dna产物的灵敏度。此外,配对末端衔接子可用于pcr扩增以提高对生物样品分析的准确性和/或灵敏度(例如,通过提高信噪比)。
[0232]
本文所述的方法可采用不同时间段(例如,几分钟或几小时)的扩增反应。扩增产生指示生物样品中存在靶核酸分子的可检测量的扩增产物的时间段可以根据以下而变化:可以获得靶核酸分子的生物样品,可以进行的具体核酸扩增反应,可以进行的扩增反应的特定循环数,以及进行的分区过程,例如产生多个液滴。各种检测和测序方案也可能允许不同的检测限。靶核酸分子的扩增可在以下时间段内产生指示靶核酸存在的可检测量的扩增产物:240分钟或更短;120分钟或更短;90分钟或更短;60分钟或更短;50分钟或更短;45分钟或更短;40分钟或更短;35分钟或更短;30分钟或更短;25分钟或更短;20分钟或更短;15
分钟或更短;10分钟或更短;或5分钟或更短。在一些情况中,核酸分子的单个拷贝或互补序列可能是可检测的(例如,使用核酸测序分析)。这种低检测限可以通过配对末端测序来实现。
[0233]
在本文提供的任何方法中,核酸测序可用于鉴定核酸分子(例如,靶核酸分子)的拷贝和/或互补序列的序列。在核酸测序测定中作为测序读段获得的核酸分子的拷贝和/或互补序列的序列可以使用条形码序列或其他样品索引或标签而与它们起源的核酸分子相关联。例如,与给定细胞或给定样品的核酸分子对应的测序读段可以使用条形码序列等连同给定细胞或样品进行鉴定。在一些情况中,样品的核酸分子(例如,靶核酸分子)的第一链的一个或多个拷贝和核酸分子的第二链的一个或多个拷贝或其互补序列可以经历核酸测序(例如,如本文所述)。如上所述,核酸测序是一种核酸处理反应,其可以包括合成测序或聚合酶链式反应(pcr)。在一些方法中,核酸测序可包括乳液聚合酶链式反应(epcr)。
[0234]
多个分区中的至少一个分区还可以包含除了至少第一珠、第二珠以及第一和第二样品核酸分子之外的材料或组分。分区的另外组分可以是合成的核酸分子。合成的核酸分子可以是双链的。合成的核酸分子可包含可切割的元件。可切割的元件可以允许合成的核酸分子的组分的分离。分离可以通过化学、光、热或其他方法完成。合成的核酸分子也可以进行连接和/或环化。在连接和/或环化后,合成的核酸分子可被切割以提供经切割的合成的核酸分子。然后可以通过扩增反应(例如,如本文所述)对经切割的合成的核酸分子进行缺口填充。
[0235]
扩增过程完成后(例如,在扩增循环的一定持续时间和/或次数之后),分布在多个分区中的多个珠(例如,多个珠

核酸分子复合物)可以从多个分区(例如,液滴或孔)中回收,并且珠(例如,多个珠

核酸分子复合物)可以从乳液或混合物中分离(例如磁性分离)。随后,可以(例如,通过确定测序仪中的核苷酸序列)测定或分析在任何先前扩增和/或处理步骤期间可能已形成的核酸分子或其任何衍生物。在一些情况中,仅对偶联至珠的核酸分子(例如,扩增产物或其衍生物)进行测序。在其他情况下,仅对未偶联至珠的核酸分子(例如,扩增产物或其衍生物)进行测序。在一些情况中,偶联至珠的核酸分子和未偶联至珠的核酸分子(例如,扩增产物或其衍生物)都被(例如,同时或分开地)测序。
[0236]
本公开的方法的优点可以是分区(例如,液滴)内的珠与核酸分子的比率增加(例如,>2),这可以导致样品分析期间增加的准确度和灵敏度,至少部分原因是给定核酸分子的克隆拷贝数更高以及样品或模板损失减少。通过添加足够多的珠,可以大大降低有模板但没有珠的分区的百分比。这将双泊松分布方案简化为单泊松分布方案。这在生物样品可能仅包含痕量核酸(例如肿瘤诊断和分期中的cfdna)的领域具有重要意义。此外,珠与核酸分子更高量的比率和配对末端衔接子的组合使用可以提供具有更高准确性和灵敏度的方法来分析生物样品(例如,样品核酸分子)。珠组合物
[0237]
本文公开的用于分析生物样品的方法可以包括扩增一个或多个(例如,多个)核酸分子(例如,靶核酸分子)。如本文所述的核酸扩增可以使用一个或多个核酸分子(例如,单链核酸分子)可以结合的一个或多个珠或珠粒子(例如,一组或多组珠)进行。可以使用多种方法来制备第一组珠和/或第二组珠。第一组珠和/或第二组珠可以由一种或多种材料和/或组分构成。第一组珠和/或第二组珠可以是例如聚合物珠(例如,如本文所述)。第一组珠
和/或第二组珠可具有涂层,例如peg层或水凝胶(例如,如本文所述)。第一组珠和/或第二组珠可包含相同的芯珠或不同的芯珠(例如,包含相同或不同的材料)。因此,第一组珠中的珠可以由第一材料制备并且第二组珠中的珠可以由第二材料制备,其中第一材料可以与第二材料相同或不同。第一组珠中的珠可包含与其偶联的第一引物分子,而第二组珠中的珠可包含与其偶联的第二引物分子。在第一组珠和第二组珠的制备(例如,合成)期间,可以将第一和第二引物分子分别提供给第一组珠和第二组珠。可替代地,在制备第一组珠和第二组珠(例如尚未包含引物分子的“核心珠”和/或预官能化的珠)之后,可以将第一和第二引物分子分别提供给第一组珠和第二组珠。当引物分子在随后的过程中被固定到珠上时,第一组珠和第二组珠中的珠可以分别进一步被处理。可以使用多种化学方法将每个珠组的引物分子固定到珠上。偶联可通过例如酰胺、酯或二硫化物官能团发生。点击化学(例如,staudinger连接或diels

alder化学)可用于将引物分子固定在珠上。可以使用另外的下游化学进一步修饰固定的引物分子。
[0238]
本文公开的用于分析和/或处理生物样品的方法可以包括制备(例如,合成)第一组珠和第二组珠,使得产生一组可释放地(例如,热或化学地可释放地)偶联的第一珠和第二珠。例如,第一珠可以可释放地偶联至第二珠上,使得在施加刺激(例如,热、化学或光刺激)时,珠可以从彼此释放。类似地,在施加刺激例如热、化学或光刺激时,与第一组珠和/或第二组珠中的珠偶联的引物分子可从珠上释放。
[0239]
可释放地偶联的第一珠和第二珠可以通过非共价相互作用或键(例如,蛋白质相互作用)或共价键而偶联。第一珠可以通过一个或多个化学接头和/或通过一个或多个夹板寡核苷酸而连接到第二珠上。非共价相互作用例如蛋白质相互作用可以是氢键、范德华力、偶极

偶极相互作用或其任何组合。可以使用各种化学方法例如偶联反应(例如酰胺键形成)或点击化学(例如staudinger连接或diels

alder反应)在珠之间形成(例如合成地形成)共价键。
[0240]
包括与第二珠可释放地偶联的第一珠的可释放地偶联的珠对可以经受(例如,热或化学)刺激,其刺激第一珠从第二珠释放。刺激可以包括温度变化和/或化学刺激(例如,ph和/或离子浓度的变化)。
[0241]
可替代地,第一组珠和第二组珠也可以被制备(例如,合成),从而产生一组不可逆地偶联的第一珠和第二珠(例如,一组珠对,每个珠对都包含不可逆地偶联至第二珠的第一珠)。第一组珠中的第一珠也可以不可去除地偶联至第二组珠中的第二珠。这种不可去除的偶联可以包括第一珠和第二珠之间通过共价化学键的交联。
[0242]
在第一组珠和第二组珠的珠的初始制备(例如,合成)之后,可以进行尺寸选择过程,该过程可以区分第一珠和/或第二珠的各种组合。例如,尺寸选择过程可以区分包含偶联至第二珠的第一珠的珠对和包含两个第一珠的珠对或包含两个第二珠的珠对。尺寸选择过程例如过滤过程也可用于分离珠的团块或聚集体和/或从包含多个珠的溶液中去除碎屑。生成配对末端序列读段的方法
[0243]
如本文所述,在进行扩增和/或测序过程时,本公开的方法可以利用分区(例如,液滴)内的珠与核酸分子(例如,靶核酸分子)的增加的比率(例如,>2)。这导致在样品分析过程中增加的准确性和灵敏度,至少部分是由于能够产生给定核酸分子的更高克隆拷贝数并
且减少样品或模板损失。将珠与核酸分子的更高比率的使用与配对末端衔接子的使用相组合,可以提供用于分析生物样品的核酸分子(例如,靶核酸分子)的甚至更高的准确度和灵敏度的方法。
[0244]
在一些情况中,本文提供的方法可包括产生可与生物样品的核酸分子(例如,靶核酸分子)的序列相关联的配对末端测序读段。配对末端测序读段的产生可以增加本文提供的方法的灵敏度和准确度。
[0245]
本文所述的包括用于生成配对末端测序读段的一个或多个步骤的方法可以包括提供第一组粒子(例如珠)和第二组粒子(例如珠)(例如,如本文所述)。第一组珠中的第一珠可包含第一引物分子(例如,偶联至第一珠),其与偶联至生物样品的核酸分子(例如,靶核酸分子,例如dna或rna分子)的第一核酸链的第一衔接子具有至少部分序列互补性。第二组珠中的第二珠可以包含与偶联至靶核酸分子的第二核酸链的第二衔接子具有序列互补性的第二引物分子(例如,偶联至第二珠)。第一引物分子可以不同于第二引物分子。可替代地,第一和第二引物分子可以相同(例如,包含相同的核酸序列)或彼此互补。
[0246]
包括产生配对末端测序读段的方法可以包括在分区中(例如,液滴,例如乳液中的水性液滴)分配(例如,共分配)(i)第一组珠中的第一珠,(ii)第二组珠中的第二珠,和(iii)生物样品的核酸分子(例如,靶核酸分子),其中所述核酸分子包含与核酸分子的第一链偶联的第一衔接子和与核酸分子的第二链偶联的第二衔接子。分配可以根据本文提供的方法实现并且可以提供多个分区(例如,多个液滴或孔),其中的至少一个子集可以各自包括第一组珠中的至少一个第一珠和第二组珠中的第二珠和多个核酸分子中的核酸分子,所述核酸分子可以包含含有第一衔接子序列的第一链和含有第二衔接子序列的第二链。第一和第二衔接子序列可以是配对末端衔接子序列。多个核酸分子中给定核酸分子的每个链还可包含模板核酸序列。
[0247]
包括产生配对末端测序读段的方法可以包括在分区中(例如,液滴,例如乳液中的水性液滴)分配(例如,共分配)(i)第一组珠中的第一珠,(ii)第二组珠中的第二珠,和(iii)生物样品的核酸分子(例如,靶单链核酸分子),其中所述核酸分子包含与其偶联的第一衔接子和与第二衔接子互补的区域(例如序列)。分配可以根据本文提供的方法实现并且可以提供多个分区(例如,多个液滴或孔),其中的至少一个子集可以各自包括第一组珠中的至少一个第一珠和第二组珠中的第二珠和多个核酸分子中的核酸分子,所述核酸分子可包含与其偶联的第一衔接子序列和与第二衔接子序列互补的区域(例如序列)。第一和第二衔接子序列可以是配对末端衔接子序列。
[0248]
分区(其包含第一组珠子中的至少一个第一珠、第二组珠中的第二珠和多个核酸分子中的核酸分子,所述核酸分子包含与所述核酸分子的第一链偶联的第一衔接子和与所述核酸分子的第二链偶联的第二衔接子)可以经受条件,以至足以产生第一核酸分子的第一链的一个或多个拷贝或其互补序列,和/或第二核酸分子的与第二衔接子偶联的第二链的一个或多个拷贝或其互补序列。产生第一链和/或第二链的一个或多个拷贝或其互补链可包括使包含第一和第二珠和核酸分子的分区经受足以进行引物延伸反应和/或核酸扩增反应的条件(例如,诸如epcr之类的pcr)。所述反应可以包括使用可被包括在分区内的一种或多种试剂。第一珠的第一引物分子可用于产生第一链的一个或多个拷贝,和/或其互补序列。第一链的一个或多个拷贝和/或其互补序列可以与第一珠偶联,因此可以用作另外扩增
反应(例如,指数扩增)的模板。第二珠的第二引物分子可用于产生第二链的一个或多个拷贝,和/或其互补序列。第二链的一个或多个拷贝和/或其互补序列可以与第二珠偶联,因此可以用作另外扩增反应(例如,指数扩增)的模板。第一链的一个或多个拷贝或其互补序列的序列可以至少部分地与第二链的一个或多个拷贝或其互补序列的序列重叠。
[0249]
为了分析如本文所述的生物样品,可以使用任何有用类型的反应(例如,任何核酸扩增反应)来处理靶核酸分子以产生靶核酸分子的一个或多个拷贝或其互补序列(例如,扩增产物)。扩增可以是基于乳液的或可以是基于非乳液的。可与本文公开的方法组合使用的核酸扩增反应的非限制性实例包括逆转录、引物延伸、聚合酶链式反应(例如,pcr)、连接酶链式反应、解旋酶依赖性扩增、不对称扩增、滚环扩增和多重置换扩增(mda)。可以使用本文描述的方法产生的扩增产物可以是dna。在扩增靶rna的情况下,可以通过rna的逆转录获得dna(例如,互补dna(cdna))并且随后可以使用dna的扩增来产生扩增的dna产物。扩增的dna产物可以指示生物样品中靶rna的存在。在扩增dna的情况下,可以采用任何dna扩增方法。dna扩增方法的非限制性实例包括聚合酶链式反应(pcr)、pcr变化形式(例如实时pcr、等位基因特异性pcr、组装pcr、不对称pcr、数字pcr、乳液pcr(例如epcr)、拨出pcr、解旋酶依赖性pcr、嵌套pcr、热启动pcr、反向pcr、甲基化特异性pcr、微引物pcr、多重pcr、嵌套pcr、重叠延伸pcr、热不对称交错pcr、触底pcr)和连接酶链式反应(lcr)。本文所述的方法可包括线性dna扩增。本文所述的方法可包括指数dna扩增。dna扩增可以通过嵌套pcr实现,这可以提高检测扩增的dna产物的灵敏度。此外,配对末端衔接子可用于pcr扩增以提高对生物样品分析的准确性和/或灵敏度(例如,通过提高信噪比)。
[0250]
扩增产生指示存在扩增的靶核酸的可检测量的扩增产物的时间段可以根据以下而变化:可以获得靶核酸的生物样品,有待进行的具体核酸扩增反应,扩增反应的特定循环数(例如,高达120分钟),以及进行的分区过程,例如产生多个液滴。靶核酸分子的扩增可在以下时间段内产生指示靶核酸存在的可检测量的扩增产物:240分钟或更短;120分钟或更短;90分钟或更短;60分钟或更短;50分钟或更短;45分钟或更短;40分钟或更短;35分钟或更短;30分钟或更短;25分钟或更短;20分钟或更短;15分钟或更短;10分钟或更短;或5分钟或更短。
[0251]
来自第一组(例如,多个)珠的第一珠可以可释放地(例如,热和/或化学可释放地)偶联至来自第二组(例如,多个)珠的第二珠。类似地,第一组珠中的另外的珠可以可释放地偶联至第二组珠中的另外的珠,使得可以有一组可释放地偶联的第一珠和第二珠。例如,第一珠可以可释放地偶联至第二珠上,使得在施加刺激(例如,热、化学或光刺激)时,珠可以从彼此释放。类似地,在施加刺激例如热、化学或光刺激时,与第一组珠和/或第二组珠中的珠偶联的引物分子可从珠上释放。
[0252]
可释放地偶联的第一珠和第二珠可以通过非共价相互作用或键(例如,蛋白质相互作用)或共价键而偶联。第一珠可以通过一个或多个化学接头和/或通过一个或多个夹板寡核苷酸而连接到第二珠上。非共价相互作用例如蛋白质相互作用可以是氢键、范德华力、偶极

偶极相互作用或其任何组合。可以使用各种化学方法例如偶联反应(例如酰胺键形成)或点击化学(例如staudinger连接或diels

alder反应)在珠之间形成(例如合成地形成)共价键。
[0253]
包括与第二珠可释放地偶联的第一珠的可释放地偶联的珠对可以经受(例如,热
或化学)刺激,其刺激第一珠从第二珠释放。刺激可以包括温度变化和/或化学刺激(例如,ph和/或离子浓度的变化)。
[0254]
可替代地,第一组珠和第二组珠也可以被制备(例如,合成),从而产生一组不可逆地偶联的第一珠和第二珠(例如,一组珠对,每个珠对都包含不可逆地偶联至第二珠的第一珠)。第一组珠中的第一珠也可以不可去除地偶联至第二组珠中的第二珠。这种不可去除的偶联可以包括第一珠和第二珠之间通过共价化学键的交联。
[0255]
在第一组珠和第二组珠的珠的初始制备(例如,合成)之后,可以进行尺寸选择过程,该过程可以区分第一珠和/或第二珠的各种组合。例如,尺寸选择过程可以区分包含偶联至第二珠的第一珠的珠对和包含两个第一珠的珠对或包含两个第二珠的珠对。尺寸选择过程例如过滤过程也可用于分离珠的团块或聚集体和/或从包含多个珠的溶液中去除碎屑。
[0256]
如本文所述,第一链(例如,生物样品的第一核酸分子)可以与第一衔接子(例如,第一配对末端衔接子)偶联并且第二链(例如,生物样品的第二核酸分子)可以与第二衔接子(例如,第一配对末端衔接子)偶联。第一和/或第二衔接子可以参与核酸测序过程(例如,诸如epcr之类的pcr)。第一衔接子可以包括第一子部分和第二子部分,所述第一子部分可以与第二子部分具有序列互补性。序列互补性通常是指与其配对的序列互补的序列。类似地,第二衔接子可以包括第一子部分和第二子部分,所述第一子部分可以与第二子部分具有序列互补性。衔接子的一个或多个部分可具有不同的解链温度。例如,衔接子可包括具有第一解链温度的第一部分和具有第二解链温度的第二部分,其中第一解链温度高于第二解链温度。通过使用包含例如富含腺嘌呤、胸腺嘧啶和肌苷的序列的衔接子可以赋予不同的解链温度。这样的衔接子可以促进衔接子的部分变性,从而为它们所偶联的核酸分子的后续处理提供接近。
[0257]
如本文所述,核酸测序(例如,ngs)可以在一个分区或多个分区(例如,多个液滴或孔)中发生。这样的分区(例如,多个分区中的分区)可以包含(i)来自第一组珠的至少一个第一珠,(ii)来自第二组珠的至少一个第二珠,以及(iii)生物样品(或其一定体积分数)(例如,核酸分子),其包含与第一链(例如,第一核酸分子)偶联的第一衔接子,以及与第二链(例如,第二核酸分子)偶联的第二衔接子。分区可以是液滴,也可以是孔。
[0258]
包括如本文所述的配对末端序列读段的方法可以包括提供来自第一组珠中的具有与第一衔接子具有序列互补性的第一引物分子的第一珠(例如,部分1

8,图8)和来自第二组珠中的具有与第二衔接子具有序列互补性的第二引物分子的第二珠(例如,部分4

8,图8)(参见例如图8)。第一组珠和第二组珠然后可以在多个分区之间分布(例如,随机分布)(例如,如本文所述),使得多个分区中的给定分区包括第一组珠中的第一珠和第二组珠中的第二珠。如图7所示,核酸分子705可包含第一链和第二链,其中第一链与第二链具有序列互补性。可选择衔接子1

7和4

7,以便从两末端的核酸扩增产生重叠区域。衔接子1

7对应于互补序列703,衔接子4

7对应于互补序列702。重叠可以允许将生物样品的第一链的拷贝或其互补序列与生物样品的第二链的拷贝或其互补序列相匹配。重叠可以包括,例如,10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350或更多个碱基对(例如,每链的拷贝或其互补序列的10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350或更多个核苷酸)。第一和
第二链或其拷贝或互补序列的核酸测序(例如,pcr,例如epcr)可以提供包括重叠的全部或部分的序列读段。重叠区域可以位于两个衔接子之间。例如,第一链可以包含第一衔接子和第三衔接子,所述第一和第三衔接子位于第一模板序列的侧翼,第二链可以包含第二衔接子和第四衔接子,所述第二和第四衔接子位于第二模板序列的侧翼,其中第一模板序列可以与第二模板序列具有序列互补性。这些衔接子可以是单链衔接子。第三和第四衔接子可以分别是第二和第一衔接子的互补序列。可替代地,可以使用双链衔接子。图7描述了这样的系统,其中第一衔接子包括第一子部分(例如,图7的部分1

7)和第二子部分(例如,图7的序列703),其中第一子部分可以与第二子部分具有序列互补性。第二衔接子具有第一子部分(例如,图7的部分4

7)和第二子部分(例如,图7的序列702),其中第一子部分可以与第二子部分具有序列互补性。包含第一和第二链的生物样品(例如,核酸分子)可以在分区(例如,一个或多个液滴或孔)与来自第一组珠的第一珠和来自第二组珠(例如,如本文所述)的第二珠分配。包括在分区中的材料随后可以进行核酸扩增反应和/或核酸测序。生物样品可以是诸如图7中描述的核酸分子。所述核酸分子包含含有多个碱基对的重叠区域(例如,图7的核酸分子705,以白色描绘)。在具有第一和第二珠的分区中分配之后,分区中的材料可以进行核酸测序以提供与核酸分子的第一和第二链对应的序列读段。例如,如果系统读段长度约为1000个核苷酸,并且生物样品的长度约为1800个核苷酸,则可以生成与第一链对应的约1000个核苷酸的序列读段和与第二链的约1000个核苷酸对应的序列读段,其中第一和第二序列读段将具有约200个核苷酸的重叠。
[0259]
如本文所述的用于分析和/或处理生物样品的方法可以包括提供来自第一组珠中的具有与第一衔接子具有序列互补性的第一引物分子的第一珠(例如,部分1

8,图8)和来自第二组珠中的具有与第二衔接子具有序列互补性的第二引物分子的第二珠(例如,部分4

8,图8)(参见例如图8)。第一组珠中的第一珠和第二组珠中的第二珠可以可释放地偶联。因此,可以形成包括第一组珠中的第一珠和第二组珠中的第二珠的可释放地偶联的珠对。第一珠和第二珠的偶联可以通过如本文所述的蛋白质相互作用或共价键来实现。可以制备一组这样的可释放地偶联的珠对,其中每个珠对包括第一组珠中的珠,所述珠可释放地偶联至第二组珠的珠。在可释放地偶联的第一珠和第二珠的组的制备期间,可以进行尺寸选择过程以区分或选择与第一珠和/或第二珠的其他组合(例如,包括第一组珠中的两个珠或第二组珠中的两个珠的对)分开的可释放地偶联的第一珠和第二珠的对。如本文所述,包括可释放地偶联至第二珠的第一珠的可释放地偶联的珠对可以经受刺激(例如,热或化学刺激)。施加刺激可以使第一珠从第二珠释放。
[0260]
生物样品的第一和第二链的侧翼可以是两个不同的衔接子,第一衔接子和第二衔接子,每个衔接子可以是双链衔接子。第一衔接子由第一子部分(例如,图7的部分1

7)和第二子部分(例如,图7的序列703)组成,其中第一子部分可以与第二子部分具有序列互补性(参见例如图7)。第二衔接子具有第一子部分(例如,图7的部分4

7)和第二子部分(例如,图7的序列702),其中第一子部分可以与第二子部分具有序列互补性(参见例如图7)。然后将生物样品与第一组珠中的第一珠和第二组珠中的第二珠在分区(例如,乳液中的一个或多个液滴或孔)分配。位于或存在于分区中的材料和/或组分(例如,液滴)然后可以进行后续处理,例如核酸扩增和核酸测序(例如,pcr,例如epcr)。
[0261]
本公开的方法可以包括第一组珠中的含有与第一衔接子具有序列互补性的第一
引物分子的第一珠(例如,部分1

8,图8中描绘)和第二组珠中的含有与第二衔接子具有序列互补性的第二引物分子的第二珠(例如,部分4

8,图8中描绘)(参见例如图8)。第一组珠中的第一珠和第二组珠中的第二珠可以不可释放地(例如,不可逆地)偶联以形成包括第一组珠中的第一珠和第二组珠中的第二珠的珠对。第一珠和第二珠的偶联可以通过蛋白质相互作用、共价键、经由一个或多个化学接头和/或经由一个或多个夹板寡核苷酸来实现。可以制备一组这样的不可释放地偶联的珠对,其中每个珠对包括第一组珠中的珠,所述珠不可释放地偶联至第二组珠的珠。在不可释放地偶联的第一珠和第二珠的组的制备期间,可以进行尺寸选择过程以区分和/或选择与第一珠和/或第二珠的其他组合(例如,包括第一组珠中的两个珠或第二组珠中的两个珠的对)分开的第一珠和第二珠的对。
[0262]
可以选择生物样品(例如,如由图7的核酸分子705所描绘的,包括第一链和第二链),使得从两末端的核酸扩增产生重叠(参见例如图7)。重叠允许生物样品的第一链的拷贝与生物样品的第二链的拷贝的匹配。生物样品的侧翼可以是两个不同的衔接子,第一衔接子和第二衔接子,每个衔接子可以是双链衔接子。第一衔接子可以由第一子部分(例如,图7的部分1

7所描绘)和第二子部分(例如,图7的序列703所描绘)组成,其中第一子部分可以与第二子部分具有序列互补性(参见例如图7)。第二衔接子包含第一子部分(例如,图7的部分4

7所描绘)和第二子部分(例如,图7的序列702所描绘)组成,其中第一子部分可以与第二子部分具有序列互补性(参见例如图7)。然后可以将生物样品与第一组珠中的第一珠和第二组珠中的第二珠在分区(例如,一个或多个液滴或孔)分配(例如,进入一个或多个液滴)。然后对分区中的材料进行后续处理,例如核酸扩增和/或核酸测序。
[0263]
本公开还提供了用于处理生物样品(例如,包含第一链和第二链的核酸分子)的方法,包括提供第一组珠和第二组珠。第一组珠中的第一珠可以包含与偶联至生物样品的第一链的第一衔接子具有序列互补性的第一引物分子。第二组珠中的第二珠可以包含与偶联至生物样品的第二链的第二衔接子具有序列互补性的第二引物分子。第一引物分子可以不同于第二引物分子。
[0264]
所述方法可以包括在分区中分配(例如,产生一个或多个液滴)(i)第一组珠中的第一珠,(ii)第二组珠中的第二珠,和(iii)生物样品,其包含与第一链偶联的第一衔接子和与第二链偶联的第二衔接子。可以使用例如乳液或孔中的液滴来实现分配。
[0265]
包含第一和第二珠和生物样品的分区可以经受足以产生与第一衔接子偶联的第一链的一个或多个拷贝的或其互补序列,和/或与第二衔接子偶联的第二链的一个或多个拷贝的或其互补序列。产生第一链和/或第二链的一个或多个拷贝或其互补链可包括使第一和第二珠和生物样品经受足以进行引物延伸反应和/或核酸扩增反应的条件(例如,诸如epcr之类的pcr)。第一珠的第一引物可用于产生第一链的一个或多个拷贝,和/或其互补序列。第一链的一个或多个拷贝和/或其互补序列可与第一珠偶联并可用于扩增反应(例如,线性或指数扩增)。第二珠的第二引物可用于产生第二链的一个或多个拷贝,和/或其互补序列。第二链的一个或多个拷贝和/或其互补序列可与第二珠偶联并可用于扩增反应(例如,线性或指数扩增)。第一链的一个或多个拷贝或其互补序列的序列可以至少部分地与第二链的一个或多个拷贝或其互补序列的序列重叠。如本文所述,可使用任何类型的核酸扩增反应来产生扩增产物(例如,第一和/或第二链的一个或多个拷贝或其互补序列)。第一链的一个或多个拷贝可以与第二链的一个或多个拷贝不重叠。
[0266]
多个分区中的至少一个分区还可以包含除了至少第一珠、第二珠以及第一和第二样品核酸分子之外的材料或组分。分区的另外组分可以是合成的核酸分子。合成的核酸分子可以是双链的。合成的核酸分子可包含可切割的元件。可切割的元件可以允许合成的核酸分子的组分的分离。分离可以通过化学、光、热或其他方法完成。合成的核酸分子也可以进行连接和/或环化。在连接和/或环化后,合成的核酸分子可被切割以提供经切割的合成的核酸分子。然后可以通过扩增反应(例如,如本文所述)对经切割的合成的核酸分子进行缺口填充。可替代地或另外地,分区可包含一种或多种试剂,例如一种或多种用于裂解或透化细胞或用于引物延伸或扩增反应(例如,核苷酸和聚合用酶)的试剂。
[0267]
如本文所公开的,用于分析和/或处理生物样品的方法可以包括第一组珠中的第一珠,所述第一珠可以可释放地偶联至第二组珠中的第二珠。第一组珠中的第一珠和第二组珠中的第二珠可以通过蛋白质相互作用或共价键可释放地偶联。蛋白质相互作用可以指氢键、范德华力、偶极

偶极相互作用或其任何组合。可以使用多种化学反应例如偶联反应和/或点击化学在珠之间形成(例如,合成地形成)共价键。
[0268]
可释放地偶联至第二珠的第一珠可以经受刺激。刺激导致第一珠从第二珠释放。刺激可以是温度变化或化学刺激。可替代地,第一组珠中的第一珠可以不可去除地偶联至第二组珠中的第二珠。这种不可去除的偶联可以包括第一珠和第二珠之间的交联(例如,共价连接)。
[0269]
在目前公开的用于分析和/或处理生物样品的方法中,所述方法可以包括制备(例如,合成)包含第一组珠和/或第二组珠的多个珠。第一组珠或第二组珠可以是例如聚合物珠。珠可以是水凝胶珠。珠可具有涂层,例如peg层或水凝胶。在使用多组珠的情况下,多组珠可以包含相同的芯珠或不同的芯珠(例如,包含相同或不同的材料)。例如,第一组珠中的珠可以由第一材料制备并且第二组珠中的珠可以由第二材料制备,其中第一材料可以与第二材料相同或不同。在第一组珠和第二组珠的制备(例如,合成)期间,可以将第一和第二引物分子分别提供给第一组珠和第二组珠。可替代地,在制备第一组珠和第二组珠(例如尚未包含引物分子的“核心珠”)之后,可以将第一和第二引物分子分别提供给第一组珠和第二组珠。当引物分子在随后的过程中被固定到珠上时,第一组珠和第二组珠中的珠可以分别进一步被处理。可以使用多种化学方法将每个珠组的引物分子固定到珠上。偶联可通过例如酰胺、酯或二硫化物官能团发生。点击化学(例如,staudinger连接或diels

alder化学)可用于将引物固定在珠上。可以使用另外的下游化学进一步修饰固定的引物分子。
[0270]
如本文所述,珠可以以珠对提供。珠对中的珠可以可释放地或不可释放地(例如,不可逆地)彼此偶联(例如,如本文所述)。珠对可以包括第一组珠中的第一珠和第二组珠中的第二珠(例如,如本文所述)。
[0271]
本文公开的用于分析和/或处理生物样品的方法可以包括可以进行核酸测序(例如,ngs)的第一链的一个或多个拷贝和第二链的一个或多个拷贝。如本文所述,核酸测序是一种核酸扩增反应,其可包括合成测序或聚合酶链式反应(pcr)。核酸扩增和/或测序可包括乳液聚合酶链式反应(epcr)。如本文所公开的,pcr例如epcr可以在例如乳液液滴的分区中进行,其中至少一个子集可以各自包含含有第一引物分子的至少一个第一珠、含有第二引物分子的第二珠和分别包含第一和第二衔接子的第一和第二核酸链,其中第一和第二衔接子(例如,配对末端衔接子)可以分别与第一和第二引物分子具有至少部分序列互补性。
[0272]
第一衔接子可以包括第一子部分和第二子部分,第一子部分与第二子部分具有序列互补性(例如,如图7中所示的)。序列互补性通常是指与其配对的序列互补的序列。
[0273]
多个分区中的每个分区(例如,每个液滴或孔)可以包含第一组珠中的至少一个第一珠、第二组珠中的至少一个第二珠,以及生物样品(其包含偶联至第一链的第一衔接子和偶联至第二链的第二衔接子)。分区可以是液滴或孔。
[0274]
本文描述的用于分析生物样品的方法可以包括两种类型的珠(例如,第一珠和第二珠),其包含各自对应于特定衔接子的引物序列,其中衔接子可以与包含一个或多个模板序列的生物样品的核酸分子偶联。核酸分子的模板序列可以通过衔接子中包含的一个或多个条形码序列来鉴定。可以选择靶核酸文库插入物(例如,由图7中的核酸分子705描绘)长度,使得从两末端进行的核酸测序提供具有无或极少的重叠的序列读段。插入物可能是末端修复的和a加尾的。合成的双链核酸分子可以被设计成使得它可以与插入物成环并连接,使得合成的双链可以包含优选没有末端磷酸酯的t突出端。合成的双链核酸分子的序列可以如下:条形码2'、pb'可切割的元件、pa、条形码1。条形码1和条形码2’可以可能是商业上可获得的,并且条形码1和条形码2'可以是也可以不是不同的序列。在本文描述的方法中使用的条形码序列可以被很好地定义以便相互指定。可切割的元件可允许通过化学、光、热或其他机制分离合成的双链核酸分子的链。在连接和环化之后,合成的双链核酸分子可以通过基于聚合酶的延伸而被切割和填充缺口。两种类型的珠(参见例如图8的部分806)可用于克隆扩增,一种具有固定的pa(1

2)寡核苷酸或至少是pa的一个子部分,另一种具有pb(4

2)寡核苷酸或至少是固定的pb的子部分。
[0275]
扩增过程完成后,分布在多个分区中的多个珠(例如,多个珠

核酸分子复合物)可以从多个分区(例如,液滴或孔)中回收,并且珠(例如,多个珠

核酸分子复合物)可以从乳液或混合物中分离(例如磁性分离)。随后,可以测定或分析可能在任何先前扩增和/或处理步骤期间形成的核酸分子或其任何衍生物(例如,通过确定测序仪中的核苷酸序列)。在一些情况中,仅偶联至珠的核酸分子(例如,扩增产物或其衍生物)进行测序。在其他情况下,仅对未偶联至珠的核酸分子(例如,扩增产物或其衍生物)进行测序。在一些情况中,偶联至珠的核酸分子和未偶联至珠的核酸分子(例如,扩增产物或其衍生物)都被测序(例如,同时或分开)。
[0276]
因此,当生物样品包含低量和/或低浓度的核酸分子(例如,cfdna)时,本文公开的方法的优势可能特别重要。类似地,当分析样品以检测稀有等位基因时(例如,在癌症诊断和检测中),本公开内容的方法的准确性和灵敏度可能特别重要。用于克隆扩增的方法和系统
[0277]
以前用于引物珠的克隆扩增的乳液pcr方法,其中液滴加载单个珠和单个模板以确保扩增后的单克隆珠,由于双泊松分布,可能会导致大量试剂无法有效利用。图10a描绘了用于实现包含单个珠和单个模板的液滴的示例示意图。根据泊松分布,液滴可以加载试剂(例如,模板1010和珠1008),例如以确保液滴具有至多单个珠和/或至多单个模板。然而,如图图10a中所示,这可能导致只有少数液滴(例如,液滴1000)具有珠1002和模板1004。相对于输入用于分配的珠1008和模板1010的初始量,这可能导致仅少数扩增的珠1006。此类程序还可以低效地使用扩增试剂,因为许多乳液液滴将缺少珠(例如,液滴1012),缺少模板(例如,液滴1014),甚至缺少珠和模板(例如,液滴1016)。一些方案可以建议仅加载所有带
模板的液滴的大约20

30%。模板可以根据泊松分布进行分布。在30%的加载量下,所有扩增的珠中少于15%可能是多克隆微珠(分区中有2个或更多模板)。然而,所有没有模板的液滴(例如,剩余的70%)都不能用于下游处理,聚合酶、dntp、引物珠和引物等试剂在这些液滴中被浪费了。在一些情况中,珠还根据泊松分布加载,这另外地稀释了“功能性”液滴(例如,具有单个珠和至少一个珠)的数量。第二个缺点是,如果只对扩增的引物珠感兴趣,则需要另外的富集步骤来将扩增的珠与未扩增的珠(例如,源自分区中没有模板的珠)分选出来。
[0278]
相反,参考图10b,本文公开的方法、系统和组合物可以将更多的模板1018加载到乳液中,使得液滴1020中的许多包含多于一个模板,并且仍然产生可用于下游处理的单克隆珠1022。如果没有本文所述的特征,模板的这种过载(例如,多于单个加载)预计会在扩增后导致大百分比的多克隆珠(例如,包含源自多个模板的拷贝的珠)。然而,使用本文所述的方法、系统和组合物,所得珠(例如,扩增的珠)基本上保持单克隆(例如,单克隆珠1022)。因此,本文提供了包含含有多个模板和珠(或其他支持物,例如表面)的分区的方法、系统和组合物,以及用于从包含多个模板的此类分区实现单克隆珠(或其他支持物,例如表面)的方法、系统和组合物。
[0279]
有益的是,珠也可以更有效地使用,并且在一些情况中,在用于后续方法(例如,用于dna测序)之前,可能不需要针对扩增的珠的单独富集程序。在一些情况中,本文所述的方法导致输入用于分配的珠的约50%、约60%、约70%、约80%、约90%、约95%或约97%被扩增。在一些情况中,本文所述的方法导致输入用于分配的珠的至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、或至少约97%被扩增。
[0280]
有益的是,模板也可以更有效地使用,这对于稀有或珍贵的样品尤其重要。在一些情况中,本文所述的方法导致输入用于分配的模板分子的至少约50%、约60%、约70%、约80%、约90%、约95%或约97%被扩增。在一些情况中,本文所述的方法导致输入用于分配的模板分子的至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、或至少约97%被扩增。
[0281]
图10b中描述的实施方案可以比图10a的实施方案更有效,因为,虽然在图10a的实施方案中,单克隆珠可以由具有单个珠和单个模板的液滴产生,但在图10b中,大多数包含珠和至少一个模板的液滴,无论模板数量如何,都可以产生单克隆珠。然而,在这样的实施方案中,缺少珠的液滴仍然浪费扩增试剂。因此,本发明提供了例如图10c所示的实施方案,其中相对于液滴的数量加载了相对大量的模板1024和相对大量的珠1026使得液滴1028中的大多数包含至少一个珠和至少一个模板。此类实施方案可导致试剂的有效使用、珠的有效使用和/或核酸模板的有效使用,因为单克隆珠可由具有至少一个模板和至少一个珠的液滴产生。因此,本文提供了包含分区的方法、系统和组合物,所述分区包含至少一个模板和至少一个珠(或其他支持物,例如表面),以及用于从包含至少一个模板和至少一个珠(或其他支持物,例如表面)的分区实现单克隆珠(或其他支持物,例如表面)的方法、系统和组合物。
[0282]
相对于输入用于分配的珠的初始量1026和/或核酸模板的初始数量1024,本文所述的方法可以产生大量的单克隆扩增珠1030。在一些实施方案中,本文所述的方法导致输入用于分配的模板核酸分子的约50%、约60%、约70%、约80%、约90%、约95%或约97%被
扩增并附接在珠上。在一些实施方案下,本文所述的方法导致输入用于分配的模板核酸分子的至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、或至少约97%被扩增并附接在珠上。
[0283]
在一些情况中,在分配之后,液滴中的约50%、约60%、约70%、约80%、约90%、约95%或约97%含有至少一个珠和至少一个核酸模板。在一些情况中,在分配之后,本文所述的方法导致液滴中的至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、或至少约97%含有至少一个珠和至少一个核酸模板。
[0284]
被扩增的任何合适比例的珠可以是单克隆的。例如,本文所述的方法导致约60%、约70%、约80%、约90%、约95%或约97%的扩增珠是单克隆的。在一些情况中,至少约60%、至少约70%、至少约80%、至少约90%、至少约95%或至少约97%的扩增珠是单克隆的。
[0285]
核酸模板可以附接在表面上并被扩增。例如,参考11,扩增可以在乳液中,在液滴内进行。乳液(例如油)的连续相1100围绕分散相1102(例如水溶液)。连续相可以将分散相分成多个分区。多个分区的一部分可以包括一个或多个珠1104,其具有附接至珠表面的表面引物1106(第一引物)的多个拷贝。多个第一引物可以与第一序列具有序列同源性。核酸模板1108也可以在分散相的分区中。模板的一个末端1110可以与表面引物1106退火和/或被其扩增。另一个末端1112可以与第二引物1114退火和/或被其扩增。在一些情况中,第二引物1114可以在分区中的分散相中。在扩增1116之后,这样的系统可以产生具有附接至珠的模板核酸(或其反向互补序列)的多个(克隆)拷贝的珠。这种具有模板的克隆拷贝的珠可用于dna测序方法,例如,与可从模板的单拷贝产生的信号相比放大测序信号。
[0286]
在现有方法中,当分散相包含两个或更多个不同的模板核酸时,会出现复杂情况。不同的模板可以是核酸文库的非克隆成员。例如,参考图12,多个分区中的分区1200包括第一核酸模板1202和不同于所述第一个核酸模板1202的第二核酸模板1204。在制作模板库的过程中,可以将共同的第一末端1206和共同的第二末端1208添加到每个相应的模板的每个中(例如,以便于附接库成员到珠并使用单一方案进行扩增)。在扩增1210之后,这样的系统可以产生非克隆的珠(即,具有第一模板的至少一个拷贝和附接至珠的第二模板的至少一个拷贝)。例如,如果在dna测序方法中使用非克隆珠,则与克隆珠相比,测序数据可能较差。来自两个模板的非克隆珠的信号可能很难或不可能以单个珠的分辨率解析。
[0287]
本文认识到需要一种方法,其中将一个以上的核酸模板加载到分区(例如,液滴)中,但只有一个模板附接在珠(或其他支持物)上并被扩增。本文提供解决至少上述需要的方法、系统和组合物。本公开的系统、方法和组合物可以比限于单模板分区的现有方法浪费更少的试剂(即,因为使用所提出的方法允许更多包含至少一个能够扩增的核酸模板分子的液滴)而不牺牲单克隆珠的百分比。
[0288]
本公开的方法包括在两个关键阶段控制从分配到克隆扩增的整个过程,首先是模板核酸或其衍生物首先附接至表面,然后是这种附接的模板在表面上的扩增。本文所述的方法可包括降低前者的速率(即,附接)和/或增加后者的速率(即,扩增)。结果是,即使存在多个不同的模板,大多数珠也只有单个模板的克隆拷贝。例如,如果与扩增相比附接缓慢和/或是罕见事件,则附接至表面的第一模板将迅速扩增并消耗基本上所有的表面引物,然后第二模板可以附接至表面。
[0289]
参考图13,乳液液滴1300可以包含珠1302、模板核酸分子1304、附接至珠的第一引物1306、和第二引物1308。珠可以包含与第一序列具有序列同源性的多个第一引物。液滴还可以包含溶液中的第三引物1310。模板可以包含第一末端1316和第二末端1318。在一些情况中,模板的两个末端在被第二引物1308延伸之前可能无法与珠上的第一引物1306退火。例如,模板的末端序列可能与第一序列不互补。第二引物1308具有第一部分1312和第二部分1314。第二部分可以包括延伸序列。第一部分1312可以与模板的第一末端1316退火,复合物可以进行核酸延伸反应产生包含延伸序列或其互补序列的延伸产物1320。延伸产物1320可以使用延伸序列或其互补序列与珠上的第一引物1306退火。第三引物1310可以与核酸模板或其互补序列的第二末端1318退火,以启动延伸反应。珠1302上可以有第一引物1306的多个拷贝,其可用于扩增延伸产物1320以创建附接至珠1322的经克隆扩增的模板。
[0290]
本文所述的方法和系统可用于产生克隆扩增珠(即,非多克隆珠)。参考图14,乳液液滴1400可以具有多于一个核酸模板分子。该图显示了第一模板1402和第二模板1404,尽管可以有两个以上的模板。两个模板都能够被第二引物1406延伸。然而,该过程被设计为相对于将延伸产物退火至附接在珠1408上的第一引物和/或使用第一引物在珠上的指数扩增更慢(例如,发生得更少)。因此,至少在随后从第一核酸模板的延伸产物扩增第一核酸模板之前,极有可能从第一核酸模板1410而不是第二模板产生延伸产物。由于扩增比延伸和/或附接快,因此即使最初将多个模板加载到液滴中,也可以产生具有对应于第一核酸模板1415的单克隆扩增产物的珠。可以回收珠和/或可以从珠上洗掉未扩增的模板。
[0291]
核酸模板可以是单链或双链的。图10

14不区分模板的单链或双链,即使这些图显示一条线来代表核酸模板。图15a具体显示了一个实施方案,其中第一模板1500和第二模板1502最初是单链的。为清楚起见,描绘了单链模板的5'和3'末端。第二引物的第一部分1504可以与模板核酸分子的3'末端杂交。然后可以从它们各自的3'末端延伸第二引物和第一核酸模板以产生双链延伸产物1506。模板为单链的一个优点是第三引物(第三引物)1508在产生延伸产物之前不会扩增模板(甚至是线性扩增)。
[0292]
在一些情况中,第二引物(即延伸引物)具有有限浓度。在一些情况中,乳液液滴只有延伸引物的一个拷贝1510。在这种情况下,延伸引物被消耗并且不能用于延伸第二核酸模板。如果第二模板没有延伸,它就不能与附接在珠上的引物杂交,扩增的珠更有可能是单克隆的(即使液滴最初包含许多不同的模板)。即使液滴中有延伸引物的几个拷贝,限制(降低)延伸引物的浓度也是有益的。相对于延伸后珠上的扩增速率,低浓度的延伸引物可使延伸反应不太可能发生(即,较慢)。这些过程的这种速率差异会导致高比例的单克隆珠。在一些情况中,延伸引物的浓度与第一引物的浓度之比约为10
‑1、10
‑2、10
‑3、10
‑4、10
‑5、10
‑6、10
‑7、10
‑8、10
‑9或更少。在一些情况中,延伸引物的浓度与第三引物的浓度之比约为10
‑1、10
‑2、10
‑3、10
‑4、10
‑5、10
‑6、10
‑7、10
‑8、10
‑9或更少。
[0293]
继续在图15b中,双链延伸产物1506中的两个链可以解离(例如,通过变性)并且延伸产物1512的链之一可以与附接在珠上第一引物(表面引物)1514退火(例如,在其3'末端)。表面引物可以延伸1516,产生双链构建体1518,其中一个链附接至珠上。继续在图15c中,双链构建体的未附接至珠1520的链可以解离并与表面引物1522的第二拷贝杂交。所述方法的该扩增过程(即图15c)可以比延伸和退火(即图15a

15b)更快。在一些情况中,扩增是指数级的。表面引物的第二个拷贝可以延伸1524。第一表面引物的延伸拷贝也可以与溶
液引物(第三引物)1526结合使用以产生能够延伸更多表面引物的另一个模板。
[0294]
在一些情况中,乳液液滴还可包含第一引物的未附接于表面的另外拷贝以促进扩增速率。参考图16a,在模板核酸分子的初始延伸(使用第二引物)以产生双链延伸产物1600之后,溶液1602中的一些另外的第一引物可以与溶液(第三)引物1604结合使用,以指数地扩增溶液中的延伸产物。这种基于溶液的扩增的一个优点可以是,用延伸产物1606的另外溶液拷贝,一个或多个延伸产物可以更快地与珠退火以进行进一步指数扩增。在缓慢延伸步骤之后,所述方法的其余部分可以在延伸第二模板分子之前快速进行。
[0295]
将在溶液中还具有第一引物可能还有其他优点。参考图16b,第二(延伸)引物1608的额外拷贝可以在第一模板延伸后迅速消耗,使得它们不可用于延伸第二模板。第一引物的溶液拷贝可以快速创建延伸产物1610的另外拷贝,而无需依赖较慢的基于表面的扩增(相对于基于溶液的扩增)。延伸产物的另外拷贝可以是用于杂交和消耗第二引物1612的另外拷贝的基底。第二引物的所有拷贝可使用第一核酸模板(或其衍生物拷贝)快速延伸,然后它们可用于延伸第二核酸模板。
[0296]
应当理解,本文描述的系统和方法不限于珠上模板的克隆扩增和/或乳液中的扩增。参考图17a,所述方法可以在表面1700上执行,例如玻璃、塑料、硅晶片或任何其他合适的表面。表面可以具有分开的区域1702、1704,每个区域具有多个附接在表面区域中的第一引物1706。例如,每个区域可以被足够的间隔区域(缺少第一引物)分开。在一些情况中,第一区域中的任何第一引物和第二区域中的任何第一引物之间的最小距离可以在10
‑1、10
‑2、10
‑3、10
‑4、10
‑5、10
‑6、10
‑7、10
‑8、10
‑9m或更小的数量级。模板核酸分子1708、1710的文库可以与多个分开的区域流体接触。即,本文所述的方法不需要在多个乳液液滴中进行,尽管它们可能是。
[0297]
开放表面上的主要机制与在乳液中进行时相似,其中所有组分都具有流体通路到第一基底的多个簇。参考图17b,第二引物1712可以延伸第一核酸模板。在图17c中,延伸产物1714可以与开放表面上的第一簇上的第一引物的拷贝之一(其可以延伸1716)杂交。在用于产生延伸产物的缓慢过程之后,表面上的扩增可以更快,使得在簇位置处的第一引物的基本上所有拷贝可以在源自第二模板的延伸产物在相同的簇位置退火之前被消耗(并且是克隆的)。参考图17d,可以产生对应于第一核酸模板1718的克隆簇。其他簇位置1720可用于另一个或多个核酸模板的克隆扩增。
[0298]
在一些情况中,第二引物也附接于表面(替代地或另外地存在于溶液中)。相对于簇中(或珠上)附接的第一引物的数量,第二引物的浓度可以是有限的,例如浓度低。这些实施方案的优点可以是,与快速消耗第一引物的局部拷贝的后期扩增过程相比,所述方法的初始过程可以进一步减慢。参考图18a,表面1800可以具有多个簇。簇可以形成阵列(例如,用于通过不同簇的成像进行dna测序)。簇可以具有第一引物1802的多个拷贝和第二引物1804的较少拷贝。在一些情况中,第二引物的浓度与第一引物的浓度之比约为10
‑1、10
‑2、10
‑3、10
‑4、10
‑5、10
‑6、10
‑7、10
‑8、10
‑9或更少。簇可以与包含第一模板1806和第二模板1808的核酸文库流体接触。继续在图18b中,第一核酸模板1806可用第二引物延伸以产生延伸产物,其随后可用第一引物1802扩增以产生克隆簇。
[0299]
在一些实施方案中,第一引物的相应序列在表面的不同簇位置处(或在不同珠上)不同。参考图18c,第一簇位置1812(或第一珠上)的多个第一引物1810具有与第二簇位置
1816(或在第二珠上)的多个第一引物1814不同的序列。第二引物也可以在不同的簇或珠位置不同。在一些情况中,第二引物具有共同的第一部分和不同的第二部分。如图图18c中所示,位于第一簇位置1812(或在第一珠上)的第一第二引物的第一部分1818与位于第二簇位置1816(或在第二珠上)的第二第二引物的第一部分1820相同。然而,各个第二引物的第二部分可以不同。在一些情况中,第一第二引物的第二部分1822可以与第一第一引物1810相同。在一些情况中,第二第二引物的第二部分1824可以与第二第一引物1814相同。
[0300]
在不同的簇位置(或在不同的珠上)具有不同的第一引物可导致最初在簇位置延伸的模板产生对该簇位置的另外亲和力(对其他簇位置没有另外的亲和力)。与非延伸模板和第二引物之间杂交的亲和性相比,来自给定簇位置的延伸区提供了另外的同源性碱基对和增加的对给定簇位置的亲和性。乳液的退火反应、延伸反应和/或温育可以在足够严格的条件(例如温度)下进行,使得在没有延伸的情况下,退火和/或延伸是罕见的和/或缓慢的事件。
[0301]
参考图18d,第一模板1806可以在第一簇位置(或珠)1812处延伸以产生包含与第一第一引物1810互补的区域的第一延伸产物。第二模板1808可在第二簇位置(或珠)1816处延伸以产生包含与第二第一引物1814互补的区域的第二延伸产物。参考图18e,第一延伸产物1826具有与以下具有同源性的区域、以及可以与以下退火、以及可以提供用于以下的延伸的模板:第一簇位置1812但不是第二簇位置1816的第一引物,即因为第一模板最初是在第一簇位置扩增的。类似地,第二延伸产物1828具有与以下具有同源性的区域、以及可以与以下退火、以及可以提供用于以下的延伸的模板:第二簇位置1816但不是第二簇位置1812的第一引物,即因为第一模板最初是在第二个簇位置扩增的。不利于延伸产物在簇位置之间的迁移,特别是如果使用的温度高于或类似于第二引物和核酸模板之间的退火温度时。本文所述的任何溶液可指本体溶液或液滴内的环境(例如,包括表面,例如珠或其他支持物的表面)。
[0302]
本公开可以涉及模板最初缓慢或罕见地附接至表面,然后快速扩增表面附接的模板(或其衍生物)以用完表面引物,提供克隆扩增的模板(或其衍生物)。如上所述,这可以通过使用模板的扩增以允许附接来实现。此外,可以将扩增之前的另一个缓慢或罕见的步骤添加到本文所述的方法中。进一步缓慢的步骤还可以涉及模板的延伸,这次是在远离附接至表面的模板末端的末端处。
[0303]
参考图19a,系统、方法和组合物可以包括模板1900,其与第二引物1902(固定在表面上)退火并延伸以产生延伸产物。可以使用核酸模板分子作为模板来延伸第二引物,从而产生待测序的核酸分子的最终集落的第一拷贝。继续图19b,延伸产物1904可以从第二引物扩散开,与附接在表面的第一引物1906的拷贝杂交,并作为用于第一引物1908的延伸的模板。然而,这种延伸是线性的而不是指数的,即在每个循环中只延伸了第一(表面)引物的一个拷贝。这是因为模板和/或延伸产物1904的远末端1910(与表面固定的引物偶联的末端的相对末端)最初不与第三引物1912互补。该系统还可包括具有第一部分1916和第二部分1918的第四引物1914。第一部分可以与核酸模板退火,并且第二部分能够延伸核酸模板,使得延伸产物可以与第三引物杂交。
[0304]
继续图19c,第四引物1914可以进一步延伸固定到表面1920的先前延伸的拷贝(来自第一或第二引物)。在一些情况中,例如当文库模板是双链时,第四引物也可以在溶液中
延伸模板核酸(或其产物)。在一些情况中,文库模板是单链的,第四引物不与文库模板杂交,直到其已用第一或第二引物首先延伸。
[0305]
在这个延伸之后,继续图19d,现在能够延伸第三引物1912以产生能够作为模板用于延伸第一引物1906的另外拷贝的另外多核苷酸。与指数扩增(使用第一和第三引物)相比,原始文库模板在每一末端的初始延伸(使用第二和第四引物)可能是相对缓慢和罕见的事件。在一些情况中,在指数扩增可以填充由附接在表面的第一引物簇定义的集落位置之前,需要完成这两种延伸。
[0306]
在另一方面,本文提供了一种用于克隆扩增核酸样品的方法。所述方法可以包括形成具有多个分区的乳液。多个分区中的分区可以包含模板核酸、具有附接至珠的第一引物的多个拷贝的珠、以及能够进行允许模板核酸或其衍生物附接至珠的附接反应的试剂混合物和使用第一引物的多个拷贝的扩增反应。所述方法还可以包括温育乳液,从而进行将模板核酸或其衍生物附接至珠上的附接反应,以及进行扩增反应以扩增附接至珠上的模板核酸或其衍生物。
[0307]
在一些情况中,第一时间段(其持续时间如下所述)大于第二时间段(其持续时间如下所述)。第一时间段可以在乳液开始温育时开始,并在模板核酸或其衍生物附接至珠上时结束。在一些情况中,第二时间段可以在模板核酸或其衍生物附接至珠上时开始,并在扩增反应结束时结束。在一些情况中,为了限定第二时间段的目的,当珠上的第一引物或表面上簇位置的第一引物簇完全延伸时,可以认为扩增反应结束。在一些情况中,为了定义第二段时间,当表面上簇位置的第一引物的珠或簇上至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更多第一引物已经延伸时,可以认为扩增反应结束。
[0308]
第一时间段可以是第二时间段的任何合适的倍数。在一些实施方案中,第一时间段是第二时间段的约5、约10、约20、约50或约100倍。在一些实施方案中,第一时间段是第二时间段的至少约5倍、至少约10倍、至少约20倍、至少约50倍或至少约100倍。提供支持物的方法
[0309]
本文提供了用于产生和/或提供包含如本文别处所述的经延伸的引物(例如,第二引物)的支持物的方法。在此描述的任何支持物可以随后被分配,例如在epcr操作期间。包含至少一个经延伸的引物分子(例如,第二引物)和/或至少一个模板核酸分子的支持物在本文中通常可被称为经延伸的支持物。例如,参考图18a,延伸的支持物包含表面1800,所述表面包含引物簇或多个这样的簇,并且所述簇包含第一数量的第一引物(例如,1802)和第二数量的第二引物(例如,1804)。在一些情况中,第二数量可能低于第一数量。例如,表面上第二引物的浓度与第一引物的浓度之比约为10
‑1、10
‑2、10
‑3、10
‑4、10
‑5、10
‑6、10
‑7、10
‑8、10
‑9或更少的量级。在示例性操作中,如本文所述,核酸模板与附接于表面的第二引物偶联(例如,退火)并进行核酸延伸反应以产生延伸产物,所述延伸产物或其衍生物随后可以用附接在表面上的第一引物进行扩增。在一些情况中,核酸模板可能无法与第一引物退火。在另一个实例中,延伸的支持物包含表面,所述表面包含引物簇或多个引物,并且模板核酸分子与簇的引物偶联。
[0310]
本文提供用于从(一个或多个)未经延伸的支持物和(一个或多个)经延伸的支持物的混合物中分离经延伸的支持物的方法。在一些情况中,支持物可以是能够单独地或与
其他支持物一起从第一位置运输到第二位置的移动支持物(例如珠、粒子等)。支持物可以是本文别处描述的任何支持物。分离的经延伸的支持物的组合物、混合物或溶液可能特别有益于下游操作,例如随后分配进入液滴,如本文别处所述,其中此类液滴的占用通常遵循泊松分布,这导致产生大部分未占用或单独占用的液滴,以确保产生有效浓度的单独占用的液滴。有利地,如果仅经延伸的支持物被分区,则被支持物占用的液滴群将不会被包含未经延伸的支持物的液滴稀释,未经延伸的支持物对于下游操作(例如,文库的克隆扩增)而言比经延伸的支持物更低效(如果不是无用的话)。当经延伸的支持物包含与其偶联的模板核酸分子时,双泊松分布(对于液滴中的支持物占用率和模板占用率中的每一个)可以减少为单一泊松分布(对于液滴中的单个模板

支持物组装占用率)。如本文别处所述,经延伸的支持物还可有利地允许液滴过载(例如,液滴中多于一个)。可以使用除液滴以外的分区,例如孔或其他容器。如本文别处所述,经延伸的支持物也可有益于在本体溶液中使用。
[0311]
图21说明了用于产生和/或提供经延伸的支持物2100的示例方法,其中经延伸的支持物2100包括附接在支持物(例如,珠)表面上的多个引物。多个引物可以包含一个或多个第一引物2102和一个或多个第二引物2103。在一些情况中,产生包含簇的经延伸的支持物2100可能特别令人感兴趣,所述簇包含与第一引物2102相比数量相对较少的第二引物2103。在一些情况中,经延伸的支持物具有附接至其上的第二引物2103的一个拷贝。在其他情况下,经延伸的支持物具有第二引物2103的多于一个拷贝,例如第二引物2103的少许拷贝或几个拷贝(未示出)。可替代地或另外地,第一引物2102的数量或浓度可以高于附接至支持物表面的第二引物2103的数量或浓度。在一个示例中,当经延伸的支持物用于样品制备(例如,用于核酸模板的扩增)时,如本文所述,核酸模板可以用第二引物进行延伸,在极少数情况下并且因此在速率限制操作中,以产生随后可以用第一引物扩增的延伸产物,所述扩增可以比初始延伸产物生成反应显著更快的速率进行,因为第一引物的拷贝多于提供在支持物上的第二引物的拷贝。在一些情况中,扩增反应可以耗尽(例如通过与其偶联)经延伸的支持物上的第一引物的拷贝,然后另一核酸模板可以用反应混合物中的另一第二引物(如果有的话)进行延伸,从而促进支持物上(或支持物上的簇内)的单克隆群体。
[0312]
起始支持物2101(或未经延伸的支持物)可以包含第一引物2102。起始支持物可包含多个第一引物,例如第一引物的簇。第一引物可以附接至延伸引物2104,例如通过互补序列的杂交,随后延伸以产生经延伸的引物,第二引物2103,其固定到支持物。附接反应(例如,杂交)可以在溶液中进行,例如在包含多个未经延伸的支持物的本体溶液中和/或在包含含有未经延伸的支持物的分区的乳液中进行。附接过程(例如杂交)可以包括单循环延伸过程。在产生第二引物之后,可以进行洗涤和/或解链操作以解离延伸引物以产生经延伸的支持物2100。
[0313]
在一些情况中,可以调节反应混合物中未经延伸的支持物(例如2101)和延伸引物(例如2104)的各自浓度以促进产生包含最少数量(例如,一个、一些、几个等)的第二引物的经延伸的支持物。例如,经延伸的支持物可以包含至少约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.99%、99.999%、99.9999%或更多的第一引物(在第一引物和第二引物群的总和中)。
[0314]
例如,相对于存在的第一引物的数量或浓度(例如,通过附接至未经延伸的支持
物),反应混合物可以包含更少数量或更低浓度的延伸引物。在一些情况中,溶液中延伸引物的浓度与未经延伸的支持物的浓度之比为至多约1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50、1:100、1:500、1:1000、1:5000、1:10000或更低。可替代地或另外地,溶液中延伸引物的浓度与未经延伸的支持物的浓度之比为至少约1:50、1:40、1:30、1:20、1:29、1:18、1:17、1:16、1:14、1:13、1:12、1:11、1:10或更高。在一些情况中,溶液中延伸引物的浓度相比于未经延伸的支持物的浓度的百分比为至多约50%、45%、40%、35%、30%、25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%或更低。可替代地或另外地,延伸引物的浓度相比于未经延伸的支持物的浓度的百分比为至少约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%或更高。所得混合物可包含(一个或多个)经延伸的支持物和(一个或多个)保持未延伸的未经延伸的支持物的混合物。
[0315]
本文提供用于从(一个或多个)未经延伸的支持物和(一个或多个)经延伸的支持物的混合物中分离经延伸的支持物的方法。
[0316]
图22a图示了用于分离经延伸的支持物的示例方法。起始支持物2201(或未经延伸的支持物)可以包含第一引物2202。起始支持物可包含多个第一引物,例如第一引物的簇。可以使起始支持物与延伸基团2204接触。第一引物可以附接至延伸基团。延伸基团可包含引物分子,所述引物分子包含被捕获实体2205。在一些情况中,被捕获实体可包含生物素(b),使得引物分子被生物素化。在一些情况中,被捕获实体可以包含捕获序列(例如,核酸序列)。在一些情况中,引物分子的序列可用作捕获序列。在其他情况下,被捕获实体可以包含含有捕获序列的另一核酸分子。在一些情况中,被捕获实体可以包含能够通过施加磁场来捕获的磁性粒子。在一些情况中,被捕获实体可以包含能够通过施加电场来捕获的带电粒子。在一些情况中,被捕获实体可以包含一种或多种其他机制,其配置为或能够由捕获用实体捕获。
[0317]
第一引物2202可以例如通过互补序列(例如,第一引物2202的序列和引物分子的序列之间)的杂交而附接至延伸基团2204,并随后延伸以产生经延伸的引物,第二引物2203,其固定在支持物上。附接反应(例如,杂交)可以在溶液中进行,例如在包含多个未经延伸的支持物的本体溶液中和/或在包含含有未经延伸的支持物的分区的乳液中进行。附接过程(例如杂交)可以包括单循环延伸过程。在产生第二引物之后,延伸基团2204可以保持与第一引物2202缔合并固定到支持物上。
[0318]
可替代地,参考图22b,起始支持物2201(或未经延伸的支持物)可以包含第一引物2202。起始支持物可包含多个第一引物,例如第一引物的簇。可以使起始支持物与延伸基团2204接触。第一引物可以附接至延伸基团。此示例中的延伸基团缺少被捕获实体2205。第一引物2202可以例如通过互补序列(例如,第一引物2202的序列和引物分子的序列之间)的杂交而附接至延伸基团2204,并随后延伸以产生经延伸的引物,第二引物2203,其固定在支持物上。对于延伸反应,可以使用包含被捕获实体(例如,包含被捕获实体的核苷酸,例如生物素)的试剂,产生包含被捕获实体2205的第二引物2203。在一些情况中,被捕获实体可以是
生物素(b),使得生物素标记的核苷酸用于延伸反应。可以使用单个经标记的碱基,例如经标记的腺嘌呤、经标记的胸腺嘧啶、经标记的鸟嘌呤或经标记的胞嘧啶,或其类似物。经标记的核苷酸可以基于延伸基团2204的序列来选择。在一个示例中,仅添加单个经标记的核苷酸。这可以通过为延伸基团2204选择仅包含特定碱基的一个残基的序列来实现。可替代地,可以在两个操作中执行延伸。在第一操作中,仅添加第一核苷酸并且该核苷酸用被捕获实体2205标记。用所有碱基进行第二延伸反应,其中不使用经标记的碱基。这产生仅包含一个被捕获实体2205的第二引物2203。可替代地,可以在延伸的任何其他位置(例如,第二位置、第三位置、第四位置等)进行逐步单个经标记的核苷酸添加。在一些情况中,被捕获实体可以包含捕获序列(例如,核酸序列)。在一些情况中,延伸基团2204的互补序列是捕获序列,使得第二引物2203包含捕获序列。
[0319]
回到图22a,包含附接至其上的延伸基团2204的支持物可以与捕获用基团2220接触或以其他方式由捕获用基团2220捕获。在一些情况中,捕获用基团可以包括捕获用实体2207,其被配置为捕获被捕获实体2205。例如,捕获用实体可以被配置为靶向被捕获实体。在一些情况中,当被捕获部分包含生物素时,捕获用实体可包含链霉亲和素(sa)。在一些情况中,当被捕获实体包含捕获序列(例如,与互补捕获序列互补)时,捕获用实体可包含互补捕获序列。在一些情况中,捕获用实体可以包括被配置为当被捕获实体包括磁性粒子时施加磁场的设备、系统或装置。在一些情况中,捕获用实体可以包括被配置为当被捕获实体包括带电粒子时施加电场的设备、系统或装置。在一些情况中,捕获用实体可以包括被配置为捕获被捕获实体的一种或多种其他机制。在一些情况中,捕获用基团可以包括次级被捕获实体2206,例如,用于由次级捕用获实体2208进行的后续捕获。次级被捕获实体和次级捕获用实体可以包含本文别处描述的任何一种或多种捕获机制(例如,生物素和链霉亲和素、互补捕获序列等)。在一些情况中,次级被捕获实体可以包括磁性粒子(例如,磁珠)并且次级捕获用实体可以包括磁性系统(例如,被配置为施加磁场的磁体、设备、系统或装置等)。在一些情况中,次级被捕获实体可以包括带电粒子(例如,携带电荷的带电珠)并且次级捕获用实体可以包括电气系统(例如,被配置为施加电场的磁体、设备、系统或装置等)。
[0320]
当包含附接至其上的延伸基团2204的支持物与捕获用基团2220接触或以其他方式由其捕获时,捕获用基团的捕获用实体2207可以与固定在支持物上的被捕获实体2205结合、偶联、杂交或以其他方式缔合。被捕获实体和捕获用实体之间的缔合可以包括非共价键的形成。缔合可以包括形成共价键。所述缔合可以包括例如在施加刺激时形成可释放的键。在一些情况中,缔合可能不会形成任何键。例如,缔合可以增加捕获用实体和被捕获实体之间的物理接近度(或减少物理距离)。在一些情况中,单个被捕获实体可以能够与单个捕获用实体相缔合。可替代地,单个被捕获实体可以能够与多个捕获用实体相缔合。可替代地或另外地,单个捕获用实体可以能够与多个被捕获实体相缔合。被捕获实体/捕获用实体对可以是任何组合。所述对可以包括但不限于生物素/链霉亲和素、叠氮化物/环辛炔和硫醇/马来酰亚胺。本领域技术人员将理解,该对分子中的任一分子可用作被捕获实体或捕获用实体,被捕获实体能够连接至核苷酸。包含生物素、叠氮化物、环辛炔、四唑和硫醇以及许多其他的经化学修饰的碱基适合作为被捕获实体。
[0321]
多个未经延伸的支持物和多个延伸基团可以在本体溶液中经受本文所述的操作。在一些情况中,可以调节反应混合物中未经延伸的支持物和延伸基团的各自浓度以促进产
生包含最少数量(例如,一个、一些、几个等)的第二引物的经延伸的支持物。例如,相对于存在的第一引物的数量或浓度(例如,通过附接至未经延伸的支持物),反应混合物可以包含更少数量或更低浓度的延伸引物(例如,引物分子)。在一些情况中,溶液中延伸基团的浓度与未经延伸的支持物的浓度之比为至多约1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50、1:100、1:500、1:1000、1:5000、1:10000或更低。可替代地或另外地,溶液中延伸基团的浓度与未经延伸的支持物的浓度之比为至少约1:50、1:40、1:30、1:20、1:29、1:18、1:17、1:16、1:14、1:13、1:12、1:11、1:10或更高。在一些情况中,溶液中延伸基团的浓度相比于未经延伸的支持物的浓度的百分比为至多约50%、45%、40%、35%、30%、25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%或更低。可替代地或另外地,延伸基团的浓度相比于未经延伸的支持物的浓度的百分比为至少约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、或更高。所得混合物可包含(一个或多个)经延伸的支持物和保持未延伸的未经延伸的支持物的混合物。
[0322]
在一些情况中,捕获用基团可以通过靶向附接至其的延伸基团而从(一个或多个)经延伸的支持物(每个包含与其附接的延伸基团)和(一个或多个)未经延伸的支持物(未附接至延伸基团)的混合物分离经延伸的支持物。在一些情况中,捕获用基团可以通过靶向附接至其的对应延伸基团而从(一个或多个)经延伸的支持物(每个包含与其附接的延伸基团)和(一个或多个)未经延伸的支持物(未附接至延伸基团)的混合物分离多个经延伸的支持物。在一些情况中,多个捕获用基团可用于通过靶向附接至其的延伸基团而从(一个或多个)经延伸的支持物(每个包含与其附接的延伸基团)和(一个或多个)未经延伸的支持物(未附接至延伸基团)的混合物分离经延伸的支持物。
[0323]
一旦分离,可以进行洗涤和/或解链操作以将延伸基团从支持物解离以提供经延伸的支持物2200。
[0324]
在一些情况中,捕获用基团2220可以与经延伸的支持物缔合,而不从混合物中分离经延伸的支持物。在一些情况中,当捕获用基团进一步包含次级被捕获实体2206时,支持物可以保持与混合物中的次级被捕获实体缔合。可以使支持物与次级捕获用实体2208接触或以其他方式由其捕获。次级捕获用实体可以与捕获用基团的次级被捕获实体结合、偶联、杂交或以其他方式缔合。次级被捕获实体和次级捕获用实体之间的缔合可以包括非共价键的形成。缔合可以包括形成共价键。所述缔合可以包括例如在施加刺激时形成可释放的键。在一些情况中,缔合可能不会形成任何键。例如,缔合可以增加次级捕获用实体和次级被捕获实体的物理接近度(例如减少物理距离)。在一些情况中,单个次级被捕获实体可以能够与单个次级捕获用实体相缔合。可替代地,单个次级捕被获实体可以能够与多个次级捕获用实体相缔合。可替代地或另外地,单个次级捕获用实体可以能够与多个次级被捕获实体相缔合。在一些情况中,次级捕获用基团可以通过靶向附接至其的被捕获基团而从(一个或多个)经延伸的支持物(每个包含与其附接的被捕获基团)和(一个或多个)未经延伸的支持物(未附接至被捕获基团)的混合物分离经延伸的支持物。在一些情况中,次级捕获用基团可以通过靶向附接至其的对应被捕获基团而从(一个或多个)经延伸的支持物(每个包含与其附接的被捕获基团)和(一个或多个)未经延伸的支持物(未附接至被捕获基团)的混合物
分离多个经延伸的支持物。在一些情况中,多个次级捕获用基团可用于通过靶向附接至其的被捕获基团而从(一个或多个)经延伸的支持物(每个包含与其附接的被捕获基团)和(一个或多个)未经延伸的支持物(未附接至被捕获基团)的混合物分离经延伸的支持物。
[0325]
一旦分离,就可以进行洗涤和/或解链操作以将延伸基团和被捕获基团(并且在一些情况中还有次级捕获用实体)从支持物解离以提供经延伸的支持物2200。
[0326]
在一些情况中,次级捕获用实体2208可以与经延伸的支持物缔合,而不从混合物中分离经延伸的支持物。在一些情况中,次级捕获用实体可以包括被配置为由第三捕获用实体(未示出)进行后续捕获的第三被捕获实体。应当理解,任何级别的捕获用实体可以包括另一个被捕获基团,该基团可以被下一级别的捕获用实体捕获,用于从混合物分离和/或由下一级别的捕获用实体缔合。一旦分离,可以进行洗涤和/或解链操作以将延伸基团(和任何数量的被捕获实体和/或捕获用实体)从支持物解离以提供经延伸的支持物2200。
[0327]
在示例性操作中,使各自包含多个第一引物的多个支持物与各自包含生物素化的引物分子的多个延伸基团接触。在一些情况中,引物分子附接至第一引物并进行核酸延伸以产生固定至支持物的第二引物。支持物保持与生物素化的引物分子缔合并与包含与磁珠偶联的链霉亲和素的被捕获基团接触。链霉亲和素与生物素结合,从而将磁珠与支持物缔合。在一些情况中,支持物不与延伸基团接触并且不与磁珠相缔合。例如,混合物可包含与(一个或多个)磁珠相缔合的经延伸的支持物和未与磁珠相缔合的未经延伸的支持物。使用磁体或施加其他磁场来靶向(一个或多个)磁珠并将与(一个或多个)磁珠相缔合的经延伸的支持物从混合物分离。所得分离的组合物仅包含(一个或多个)经延伸的支持物或大部分的(一个或多个)经延伸的支持物。应当理解,在分离的组合物中可能存在一些污染。进行洗涤操作以将(一个或多个)延伸基团和/或(一个或多个)被捕获基团从(一个或多个)经延伸的支持物解离。
[0328]
图23图示了用于分离经延伸的支持物的另一个示例方法。可以提供包含第二引物2302的经延伸的支持物2300,例如根据关于图21描述的方法。可以提供被捕获基团,其包含被捕获实体2305(例如,磁珠)和与其附接的核酸序列2303。附接至被捕获实体的核酸序列可包含与附接至经延伸的支持物的第二引物的序列的序列同源性。被捕获基团可以与经延伸的支持物相缔合,例如通过核酸序列和第二引物的序列的杂交,从而将被捕获实体与经延伸的支持物相缔合。与被捕获基团相缔合的支持物可以与捕获用实体2306(例如,磁体)接触或以其他方式由其捕获。被捕获基团和/或被捕获实体可以能够在缔合之后从经延伸的支持物解离。在一些情况中,可以重复使用被捕获基团。在一些情况中,可以重复使用被捕获实体。在一些情况中,可以重复使用包含核酸序列2303的核酸分子。重复使用不同的试剂可能是分离经延伸的支持物的一种成本有效的方法。被捕获实体和捕获用实体可以包含本文别处描述的任何一种或多种捕获机制(例如,生物素和链霉亲和素、互补捕获序列、磁性粒子和磁场、带电粒子和电场等)。例如,被捕获实体可以包括具有磁性的粒子并且捕获用实体可以被配置为施加磁场。例如,被捕获实体可以包括携带电荷的带电粒子并且捕获用实体可以被配置为施加电场。例如,被捕获实体可包含核酸捕获序列并且捕获用实体可包含互补核酸捕获序列。技术人员将理解,核酸序列2303可用于将被捕获实体2305直接附接至第二引物2302。如图22b中所述,可以使用延伸反应将包含被捕获实体2305的捕获序列或经修饰的核苷酸直接添加到支持物上的引物。在图22b中,引物是第一引物,但应理解引
物也可以是第二引物2302。
[0329]
其他方法可用于从混合物溶液中分离延伸的支持物。此类分离方法可包括使用能够结合经延伸的支持物(例如,2300)的一个或多个其他序列或部分,从而将经延伸的支持物与支持物群的其余进行分离。在一些实例中,与溶液中存在的其余试剂、材料和/或部分相比,此类序列或部分可包含对经延伸的支持物更高或显著更高的结合亲和力。因此,此类序列或部分(在本文中称为分离部分)可以能够结合、缔合和/或捕获经延伸的支持物。将经延伸的支持物与溶液的其余进行分离可有助于提供经延伸的支持物的更纯化的组合物,其在一些示例中可用作实验、测定或程序(例如在本文中别处描述的方法和系统)中的试剂。
[0330]
经延伸的支持物可以作为试剂产生、分离、制造和/或制备。经延伸的支持物可以被包括在试剂盒中,例如实验试剂盒或测试。经延伸的支持物可用于实验或其他程序。例如,试剂盒可包含组合物,所述组合物包含具有至少约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高纯度的经延伸的支持物试剂溶液(经延伸的支持物的浓度相比于经延伸的支持物和未经延伸的支持物的组合浓度)。
[0331]
本公开提供了在实验中使用经延伸的支持物的方法。例如,可以为经延伸的支持物提供序列文库,例如要在实验(例如测序实验,例如下一代测序或任何其他类型的测序)中分析的核酸序列文库。序列文库可包含核酸序列,其可包含与其附接的一个或多个衔接子序列。序列文库可包含模板核酸序列。模板核酸序列可包含与其附接的一个或多个衔接子序列。例如,模板核酸序列可以包含位于第一末端侧翼的衔接子序列。在另一个示例中,模板核酸序列可包含位于两个末端侧翼的相同或不同衔接子序列。可替代地,模板分子可以不包含衔接子序列。
[0332]
在一些实例中,经延伸的支持物可以与核酸序列文库混合并且混合物可以经受足以引发核酸延伸反应的条件,该反应可以将模板核酸序列(或其互补序列)固定到支持物上。在一些情况中,此类反应可以在分区(例如,乳液中的液滴)中进行,如本文别处所述,其中分区包含一个或多个经延伸的支持物和一个或多个模板核酸序列。在其他情况下,此类反应可以在本体溶液中进行。在一些示例中,固定化(例如杂交)可以在溶液中(例如芯片外)进行,并且在溶液中固定化之后,固定化的组装体(经延伸的支持物和模板分子的组合)可以被封装在分区(例如此处描述的分区)用于后续操作。在一些示例中,分区是液滴。在一些示例中,分区是孔。预富集
[0333]
本文提供了用于产生预组装支持物的方法,在本文中通常称为组装体,其中该组装体包含固定到单个支持物的单个模板核酸分子。在随后的操作中,如本文所述,此类组装体以集合可与扩增试剂(例如,溶液引物)一起分配以促进乳液的各个反应室内的模板核酸分子的扩增反应。有利地,包含单个组装体的分区可以将扩增产物的单克隆群体固定到分区内的相同支持物。分区中此类组装体的区室化或封装可遵循泊松分布以例如除了包含单个组装体的分区还包括不包含任何组装体的分区和/或包含多个组装体的分区(例如,具有不同的模板序列)。通过在分配之前提供预组装的支持物,有利地,针对在乳液的分区之间分布的双泊松问题可以被简化为单泊松分布问题。如果多个支持物和(未固定到支持物上的)多个模板被分配,每个都遵循其自己的泊松分布模型,则与一阶泊松分布模型相比,生
成的具有单个支持物和单个模板的分区明显更少。与本文所述的方法相比,这导致有价资源的低效使用和宝贵模板的损失。
[0334]
在一些情况中,方法可以包括提供包含多个经延伸的支持物和多个模板核酸分子(例如,在文库中)的混合物,每个模板核酸分子具有不同的核酸序列。多个经延伸的支持物可包含如本文别处所述的经延伸的支持物的纯化组合物(来自经延伸的支持物和未经延伸的支持物的混合物)。每个模板核酸分子可以被配置为和/或能够与第二引物退火。多个经延伸的支持物中的经延伸的支持物可以包含多个第一引物和单个拷贝、少许拷贝、几个拷贝和/或相对于可用于与模板核酸分子退火的多个第一引物的数量显著更少数量的第二引物。混合物可经受足以使多个模板核酸分子与分布在多个经延伸的支持物上的多个第二引物退火或以其他方式缔合的条件。混合物可经受足以洗涤未偶联至支持物的模板核酸分子的条件。在一些情况中,这可以通过将支持物固定到固定平台(例如,被配置为固定支持物的另一个表面或结构,例如通过对支持物的某种亲和力(例如,磁、电、疏水、亲水等))来实现,从而在洗涤过程中支持物保持稳定。由于每个经延伸的支持物仅具有一个拷贝、少许拷贝、几个拷贝和/或相对于多个第一引物的数量显著更少数量的第二引物,因此所得反应产物可包含多个组装体,其中大多数或基本上所有的组装体各自包含固定到支持物的单个模板核酸分子。此类组装体可以如本文别处所述例如与扩增试剂(例如,包括溶液引物)一起进行分配以促进模板核酸分子在各个反应室内的扩增反应。有利地,包含单个组装体的分区可以将扩增产物的单克隆群体固定到分区内的相同支持物。
[0335]
在一些实例中,在经延伸的支持物和模板核酸分子的混合过程中,在合适的情况下(例如,当存在大量可用样品时),经延伸的支持物的浓度可以低于模板核酸分子的浓度。例如,可以过量提供(一个或多个)样品。提供过量的样品可能会减少因混合和杂交而导致的空白经延伸(缺少模板)的支持物的数量。
[0336]
使用某些方法,技术人员可能必须进行非常精确的测量以准备样品,例如在将样品与支持物混合以生成有用的组装体群之前。本公开中提供的经延伸的支持物可以有利地与不需要精确测量反应混合物中文库浓度的过程相容。在一些示例中,即使在没有以高精度测量文库的浓度时,仅提供过量的样品可能有助于成功的(例如,与经延伸的支持物)杂交过程。例如,在一些情况中,提供过量的样品可以允许减少杂交反应的温育时间。提供过量的样品(文库)可能会增加杂交速率和产率。可替代地,在一些情况中,例如在样品很珍贵的情况下,可能不会提供过量的样品。
[0337]
在一些情况中,参考图24a,方法可以包括提供包含多个支持物(例如,支持物2401,未经延伸的支持物)和多个模板核酸分子(例如,模板核酸分子2402)的混合物,所述多个模板核酸分子各自具有不同的核酸序列。模板核酸分子可以被配置为和/或能够与附接在支持物上的引物退火。模板核酸分子可以包含被捕获实体2406,其被配置为随后由捕获用基团2408中的捕获用实体捕获。支持物可包含可用于与模板核酸分子退火的多个引物。
[0338]
可替代地,图24b说明了一种示例方法,其中模板核酸分子缺少被捕获实体2406,并且将被捕获实体2406添加到延伸产物中。如关于图24a所描述的,提供了混合物,所述混合物包含多个支持物(例如,支持物2401,未经延伸的支持物)和多个模板核酸分子(例如,模板核酸分子2402),所述多个模板核酸分子各自具有不同的核酸序列。缺少被捕获实体的
模板核酸分子可以被配置为和/或能够与附接在支持物上的引物退火。类似于图22b的描述,引物可以附接至模板核酸分子,例如通过互补序列(例如,在第一引物的序列和衔接子1的序列之间)的杂交,然后延伸以生成固定在支持物上的延伸产物。对于延伸反应,可以使用包含被捕获实体(例如,包含被捕获实体的核苷酸)的试剂,产生包含被捕获实体2406的延伸产物。在一些情况中,被捕获实体可以是生物素(b),使得生物素标记的核苷酸用于延伸反应。可以使用单个经标记的碱基,例如经标记的腺嘌呤、经标记的胸腺嘧啶、经标记的鸟嘌呤或经标记的胞嘧啶,或其类似物。可以基于模板2402的衔接子1的序列来选择经标记的核苷酸。在一个示例中,仅添加单个经标记的核苷酸。这可以通过在两个操作中执行延伸来实现。在第一操作中,仅添加第一核苷酸并且该核苷酸用被捕获实体2406标记。这可以是与第一引物的序列不互补的衔接子1序列中存在的第一碱基。用所有碱基进行第二延伸反应,其中不使用经标记的碱基。这导致固定在支持物上的延伸产物仅包含一个被捕获实体2406。可替代地,可以在延伸的任何其他位置(例如,第二位置、第三位置、第四位置等)进行逐步单个经标记的核苷酸添加。
[0339]
在一些情况中,可以调节反应混合物中支持物和模板核酸分子的各自浓度以促进大部分组装体的产生,所述组装体包含单个支持物和固定到所述支持物上的单个模板核酸分子(或其互补序列)。例如,所得支持物可包含至少约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.99%、99.999%、99.9999%或更多的与模板核酸分子不相缔合的引物(在总引物群中)
[0340]
例如,相对于存在的支持物的数量或浓度,反应混合物可以包含更少数量或更低浓度的模板核酸分子。在一些情况中,溶液中模板核酸分子的浓度与支持物浓度的比为至多约1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50或更低。可替代地或另外地,溶液中模板核酸分子的浓度与支持物的浓度之比为至少约1:50、1:40、1:30、1:20、1:29、1:18、1:17、1:16、1:14、1:13、1:12、1:11、1:10或更高。在一些情况中,溶液中模板核酸分子的浓度相比于支持物的浓度的百分比为至多约50%、45%、40%、35%、30%、25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%或更低。可替代地或另外地,溶液中模板核酸分子的浓度相比于支持物的浓度的百分比为至少约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%或更高。
[0341]
回到图24a,混合物可经受足以使(2403)多个模板核酸分子与分布于多个支持物上的多个引物退火的条件,并进行延伸(2404)以产生固定在相应支持物上的相应模板核酸分子的互补序列。支持物可保持与相应模板核酸分子(例如,2402)的相应被捕获实体(例如,2406)相缔合。所得混合物可包含含有与其缔合的一个或多个模板核酸分子(和被捕获实体)的支持物和不含有与其缔合的任何模板核酸分子(和被捕获实体)的支持物的混合物。
[0342]
在一些情况中,被捕获实体2406可包含生物素(b)。在一些情况中,被捕获实体可以包含捕获序列(例如,核酸序列)。在一些情况中,模板核酸分子的序列可用作捕获序列。
在其他情况下,被捕获实体可以包含含有捕获序列的另一核酸分子。在一些情况中,被捕获实体可以包含能够通过施加磁场来捕获的磁性粒子。在一些情况中,被捕获实体可以包含能够通过施加电场来捕获的带电粒子。在一些情况中,如本文别处所述,被捕获实体可以包含一种或多种其他机制,其配置为或能够由捕获用实体捕获。
[0343]
包含与其缔合的模板核酸分子2402的支持物2401可以与捕获用基团2408接触或以其他方式由其捕获。捕获用基团可以包括捕获用实体,其被配置为捕获被捕获实体2406。例如,捕获用实体可以被配置为靶向被捕获实体。在一些情况中,当被捕获部分包含生物素时,捕获用实体可包含链霉亲和素(sa)。在一些情况中,当被捕获实体包含捕获序列(例如,与互补捕获序列互补)时,捕获用实体可包含互补捕获序列。在一些情况中,捕获用实体可以包括被配置为当被捕获实体包括磁性粒子时施加磁场的设备、系统或装置。在一些情况中,捕获用实体可以包括被配置为当被捕获实体包括带电粒子时施加电场的设备、系统或装置。在一些情况中,捕获用实体可以包括被配置为捕获被捕获实体的一种或多种其他机制。在一些情况中,捕获用基团可以包括次级被捕获实体,例如,用于由次级捕获用实体2407进行的后续捕获。次级被捕获实体和次级捕获用实体可以包含本文别处描述的任何一种或多种捕获机制(例如,生物素和链霉亲和素、互补捕获序列等)。在一些情况中,次级被捕获实体可以包括磁性粒子(例如,磁珠)并且次级捕获用实体可以包括磁性系统(例如,被配置为施加磁场的磁体、设备、系统或装置等)。在一些情况中,次级被捕获实体可以包括带电粒子(例如,携带电荷的带电珠)并且次级捕获用实体可以包括电气系统(例如,被配置为施加电场的磁体、设备、系统或装置等)。
[0344]
当包含缔合到其上的被捕获实体2406的支持物与捕获用基团2408接触或以其他方式由其捕获时,捕获用基团的捕获用实体可以与被捕获实体结合、偶联、杂交或以其他方式缔合。被捕获实体和捕获用实体之间的缔合可以包括非共价键的形成。缔合可以包括形成共价键。所述缔合可以包括例如在施加刺激时形成可释放的键。在一些情况中,缔合可能不会形成任何键。例如,缔合可以增加捕获用实体和被捕获实体之间的物理接近度(或减少物理距离)。在一些情况中,单个被捕获实体可以能够与单个捕获用实体相缔合。可替代地,单个被捕获实体可以能够与多个捕获用实体相缔合。可替代地或另外地,单个捕获用实体可以能够与多个被捕获实体相缔合。
[0345]
在一些情况中,捕获用基团2408可以通过靶向被捕获实体来从混合物分离包含模板核酸分子2402(和被捕获实体2406)的支持物2401。在一些情况中,捕获用基团可以从混合物中分离多个支持物,每个支持物包含一个或多个模板核酸分子。在一些情况中,多个捕获用基团可用于从混合物中分离包含模板核酸分子的支持物。一旦分离,可以进行洗涤和/或解链操作(2405)以将模板核酸分子从支持物解离以提供组装体2400。
[0346]
在一些情况中,捕获用基团2408可以与支持物缔合,而不从混合物中分离支持物。在一些情况中,当捕获用基团进一步包含次级被捕获实体时,支持物可以保持与混合物中的次级被捕获实体缔合。可以使支持物与次级捕获用实体2407接触或以其他方式由其捕获。次级捕获用实体可以与捕获用基团的次级被捕获实体结合、偶联、杂交或以其他方式缔合。次级被捕获实体和次级捕获用实体之间的缔合可以包括非共价键的形成。缔合可以包括形成共价键。所述缔合可以包括例如在施加刺激时形成可释放的键。在一些情况中,缔合可能不会形成任何键。例如,缔合可以增加次级捕获用实体和次级被捕获实体的物理接近
度(例如减少物理距离)。在一些情况中,单个次级被捕获实体可以能够与单个次级捕获用实体相缔合。可替代地,单个次级被捕获实体可以能够与多个次级捕获用实体相缔合。可替代地或另外地,单个次级捕获用实体可以能够与多个次级被捕获实体相缔合。在一些情况中,次级捕获用基团可以从混合物中分离包含模板核酸分子的支持物。在一些情况中,次级捕获用基团可以从混合物中分离多个支持物。在一些情况中,多个次级捕获用基团可用于从混合物中分离支持物。
[0347]
一旦分离,可以进行洗涤和/或解链操作以从支持物解离模板核酸分子2402和被捕获基团2408(并且在一些情况中还有次级捕获用实体2407)以提供组装体2400。
[0348]
在一些情况中,次级捕获用实体2407可以与支持物缔合,而不从混合物中分离支持物。在一些情况中,次级捕获用实体可以包括被配置为由第三捕获用实体(未示出)进行后续捕获的第三被捕获实体。应当理解,任何级别的捕获用实体可以包括另一个被捕获基团,该基团可以被下一级别的捕获用实体捕获,用于从混合物分离和/或由下一级别的捕获用实体缔合。一旦分离,可以进行洗涤和/或解链操作以从支持物解离模板核酸分子(和任何数量的被捕获实体和/或捕获用实体)以提供组装体2400。
[0349]
此类组装体可以如本文别处所述例如与扩增试剂(例如,包括溶液引物)一起进行分配以促进模板核酸分子在各个反应室内的扩增反应。有利地,包含单个组装体的分区可以将扩增产物的单克隆群体固定到分区内的相同支持物。
[0350]
支持物(具有模板核酸分子或其互补序列)的预富集方法可以在溶液中进行。在一些示例中,预富集方法可以在不包含任何乳液或分区的溶液中进行。在其他示例中,可以在分区中执行预富集方法。程序可以集成。可替代地,过程可以不集成。计算机控制系统
[0351]
本公开提供被编程以实现本公开的方法的计算机控制系统。图6显示了计算机系统601,其被编程或以其他方式配置以实施本公开的方法和系统,例如进行核酸序列和序列分析。
[0352]
计算机系统601包括中央处理单元(cpu,本文也称为“处理器”和“计算机处理器”)605,其可以是单核或多核处理器,或者是用于并行处理的多个处理器。计算机系统601还包括存储器或存储器位置610(例如,随机存取存储器、只读存储器、闪存)、电子存储单元615(例如,硬盘)、用于与一个或多个其他系统通信的通信接口620(例如,网络适配器)以及外围设备625,诸如高速缓存、其他存储器、数据存储和/或电子显示适配器。存储器610、存储单元615、接口620和外围设备625通过诸如主板等通信总线(实线)而与cpu605通信。存储单元615可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统601可以借助于通信接口620可操作地耦合到计算机网络(“网络”)630。网络630可以是因特网、互联网和/或外联网,或者与因特网通信的内联网和/或外联网。网络630是电信和/或数据网络。网络630可以包括一个或多个计算机服务器,其可以实现分布式计算,诸如云计算。网络630可以借助于计算机系统601实现对等网络,这可以使得耦合到计算机系统601的设备能够起到客户端或服务器的作用。
[0353]
cpu 605可以执行一系列机器可读指令,该机器可读指令可以体现在程序或软件中。指令可以存储在存储位置如存储器610中。指令可以针对cpu 605,该指令随后可以编程或以其他方式配置cpu605以实现本公开内容的方法。由cpu 605执行的操作的实例可以包
括提取、解码、执行和回写。
[0354]
cpu 605可以是电路如集成电路的一部分。电路中可以包括系统601的一个或多个其他组件。该电路是专用集成电路(asic)。
[0355]
存储单元615可以存储文件,诸如驱动程序、库和保存的程序。存储单元615可以存储用户数据,例如用户偏好和用户程序。计算机系统601可以包括一个或多个附加数据存储单元,所述附加数据存储单元位于计算机系统601外部,诸如位于通过内联网或因特网而与计算机系统601通信的远程服务器上。
[0356]
计算机系统601可通过网络630而与一个或多个远程计算机系统通信。例如,计算机系统601可以与用户的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如,便携式pc)、平板或平板型pc(例如,ipad、galaxy tab)、电话、智能手机(例如,iphone、支持android的设备、)或个人数字助理。用户可以经由网络630访问计算机系统601。
[0357]
本文所述的方法可通过机器(例如,计算机处理器)可执行代码的方式来实现,该机器可执行代码存储在计算机系统601的电子存储位置上,例如存储器610或电子存储单元615上。机器可执行代码或机器可读代码可以以软件的形式提供。在使用期间,该代码可由处理器605执行。可从存储单元615检索代码并将其存储在存储器610上,以供处理器605迅速存取。在一些情况下,可排除电子存储单元615,并且将机器可执行指令存储在存储器610上。
[0358]
该代码可以被预编译并配置成由具有适于执行该代码的处理器的机器使用,或者可以在运行期间被编译。代码可以用编程语言提供,可以选择编程语言以使代码能够以预编译或即时编译(as

compiled)的方式执行。
[0359]
本文提供的系统和方法的各个方面,诸如计算机系统1101,可以在编程中体现。该技术的各个方面可以被认为是“产品”或“制品”,其一般为在一种类型的机器可读介质上携带或体现的机器(或处理器)可执行代码和/或相关数据的形式。机器可执行代码可以存储在电子存储单元如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘上。“存储”型介质可以包括计算机的任何或全部有形存储器、处理器等,或其相关模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可以在任何时间为软件编程提供非暂时性存储。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。例如,这样的通信可以使软件能够从一台计算机或处理器加载到另一台计算机或处理器中,例如从管理服务器或主机加载到应用服务器的计算机平台中。因此,可以承载软件元素的另一类型的介质包括光波、电波和电磁波,诸如跨本地设备之间的物理接口、通过有线和光学陆线网络以及各种空中链路而使用的。携载此类波的物理元件,诸如有线或无线链路、光学链路等,也可以被视为承载软件的介质。如本文所用,除非仅限于非暂时性有形的“存储”介质,否则计算机或机器“可读介质”等术语是指参与向处理器提供指令以供执行的任何介质。
[0360]
因此,机器可读介质如计算机可执行代码可采取多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,诸如任何计算机中的任何存储设备等,诸如可用于实现如附图中所示的数据库等。易失性存储介质包括动态存储器,诸如这样的计算机平台的主存储器。有形传输介质包括同轴缆线、铜线和光
纤,包括构成计算机系统内的总线的线。载波传输介质可以采取电信号或电磁信号或者声波或光波的形式,诸如在射频(rf)和红外(ir)数据通信期间产生的那些。因此,计算机可读介质的常见形式包括例如:软盘、柔性盘、硬盘、磁带、任何其他磁性介质、cd

rom、dvd或dvd

rom、任何其他光学介质、穿孔卡片纸带、任何其他具有孔洞图案的物理存储介质、ram、rom、prom和eprom、flash

eprom、任何其他存储器芯片或匣盒、传送数据或指令的载波、传送此类载波的电缆或链路,或者计算机可以从中读取编程代码和/或数据的任何其他介质。这些形式的计算机可读介质中的许多介质可以参与将一个或多个指令的一个或多个序列携载到处理器以供执行。
[0361]
计算机系统601可以包括或与电子显示器635通信,该电子显示器635包括用于提供例如核酸序列的结果(例如,序列读段、共有序列等)的用户界面(ui)640。ui的示例包括但不限于图形用户界面(gui)和基于网页的用户界面。
[0362]
可以通过一种或多种算法来执行本公开的方法和系统。可以在由中央处理单元605执行时通过软件实现算法。例如,所述算法可以实现本公开的方法。实施例
[0363]
以下实施例被包括在内以进一步描述本公开的一些方面,并且不用来限制本公开的范围。实施例1
[0364]
该实施例证明本文描述的用于分析核酸样品的方法优于其他技术。
[0365]
进行了epcr工作流程并显示在图3的左分图中。将dna模板分子的变体1(301)和2(302)与珠(303)一起乳化(304)。与乳液中的液滴总数相比,模板和珠都处于低丰度,导致多克隆珠和克隆拷贝最少。大多数液滴是空的(305),一些液滴仅包含单个珠(306),而一些液滴仅包含模板核酸分子(307)。(306)和(307)都没有递送扩增的模板阳性珠,并且(307)中的dna模板逃脱了分析工作流程,因此没有未被分析。只有包含模板核酸分子和珠二者(例如,308)的液滴才是能够产生扩增产物用于后续分析的功能性扩增反应体。在破乳和富集(309)之后,模板阳性珠递送可用于测序的珠(310)。
[0366]
进行了如本文所述的核酸分析方法并显示在图3的右侧分图上。如本文所述,显著更高数量的珠(311)被加载到乳液液滴中。因此,与乳液中的大多数液滴中每个液滴0

1个珠相反,将多个珠(例如,0

10个珠)加载到乳液中的大多数液滴中的每个液滴中。包含模板核酸分子的所有液滴也包括珠,因此产生每个珠的多个克隆拷贝(312),(313)。使用如本文所述的一种或多种程序,在破乳和富集之后没有模板核酸分子丢失,并且两种变体(314/315)都进行了多次测序,从而提高了准确性。
[0367]
为了进一步提高分辨率(例如,信噪比),将独特的分子标识符(umi)用于标记模板以将特定变体分配给单个起始模板。
[0368]
该数据表明,本公开的方法和组合物可以显著提高分析核酸样品的准确度。当仅存在非常有限的样品材料和/或检测稀有变体很重要时,这可能特别重要。实施例2
[0369]
该实施例展示了用于生成图5a和图5b中描绘的图形的数学模型。图5a描绘了一个图,其横轴502表示生成配对读段的概率(%),具有10%的增量指数,以及纵轴501表示唯一读段的分数(%),具有10%的增量指数。图5b描绘了一个图,其横轴504表示平均液滴群体,
具有1的增量指数,以及纵轴503表示(%),具有10%的增量指数。
[0370]
使用以下数学关系:其中p(x|y)表示给定y时x的概率分布,m
a
和m
b
分别是群体a和b的珠数量,l
液滴
是平均珠数量/液滴,n
液滴
是液滴中珠数量的变量,f
拆分
是a型珠的分数,f
seq
是珠被测序的概率。实施例3
[0371]
该实施例显示珠类型a和b的随机液滴加载效率的分析关系(图5a)。
[0372]
以参数方式扫描平均珠加载,在唯一读段的预期分数与生成配对读段的概率之间建立关系,即实现a和b中的每个至少一个拷贝。例如,对于生成配对读段的概率为50%,30%的读段是唯一的。图5b显示了对于给定平均液滴珠加载而言各种读段场景之间的关系。场景标记为p(n
a
,n
b
),其中n
a
和n
b
分别是a和b型读段的珠的数量。索引505标记不同的图线,从上到下依次为(i)p(>0,>0),(ii)p(1,1),(iii)p(2,1)|p(1,2),(iv)p(2,2),(v)p(3,1)|p(1,3),和(vi)f
冗余
。情况n
a
>0和n
b
>0,即p(>0,>0),解释了获得a&b读段对的所有场景,并且是最高的实曲线。p(1,1)是一种特殊情况,其中获得每个读段的一个且仅一个拷贝。虚曲线是a或b的冗余拷贝的读段的分数。f
拆分
是50%并且表明两个珠的可能性相等。f
seq
是100%并且是珠被测序的可能性。注释表明,获得100%的效率来生成配对读段会产生90%的测序冗余(a和/或b的另外拷贝)。实施例4
[0373]
该实施例展示了用于分析生物样品的方法(参见例如图7)。
[0374]
这种分析生物样品的方法包括两种类型的珠,每种珠包含与多个衔接子中的特定衔接子对应的引物序列,其中多个衔接子包括多个条形码序列。衔接子可以与生物样品的多个核酸分子的核酸分子(例如,靶核酸分子)的末端偶联。选择靶核酸文库插入物长度(例如,由图7中的核酸分子705描绘),使得从两末端进行的核酸测序提供具有无或极少的重叠的序列读段。在用多个衔接子中的衔接子官能化之前,插入物被末端修复并a加尾。合成的双链核酸分子被设计成可以与插入物成环和连接。出于这个原因,合成的双链包含优选没有末端磷酸酯的t突出端。合成的双链核酸分子的序列如下:条形码2'、pb'可切割的元件、pa、条形码1。条形码1和条形码2'可以是任何商业上可获得的条形码序列,也可以是不同的序列。可替代地,在一些实施例中,条形码1和条形码2'可以不是不同的序列。然而,条形码序列是明确定义的,因此它们可以相互指定。可切割的元件允许通过化学、光、热或其他机制分离合成的双链核酸分子的链。在连接和环化之后,合成的双链核酸分子通过基于聚合酶的延伸而被切割和填充缺口。两种类型的珠(例如,在图8中部分806描述的那些)可用于克隆扩增,一种具有固定的pa(1

8,图8)寡核苷酸或至少是pa的子部分,另一种具有pb(4

8,图8)寡核苷酸或至少是固定的pb的子部分。
[0375]
因此,线性化的缺口填充的模板的热变性允许在将珠分布到分离良好的隔室(例如分区)以进行克隆扩增(例如在epcr中)之前与两种珠类型进行退火。该实施例与本文描述的任何方法的组合可以允许消除核酸扩增反应的退火过程。
实施例5
[0376]
该实施例展示了使用插入物文库(i)产生克隆扩增珠的方法,该插入物文库具有附接在每个末端的相同衔接子对(a/a')(参见例如图20)。如本文所用,撇号(')表示反向互补(例如,a'是a的反向互补序列)。珠上附接有第二引物(x a)的少许拷贝和第一引物(x)的许多拷贝。适应的插入物(a’i a)与第二引物杂交并被延伸。延伸产物能够进一步延伸第一引物(x)的拷贝,但不能以指数方式延伸。当延伸的第二(或第一)引物的另一末端也使用第四引物(a b')进行延伸时,允许指数扩增。现在可以使用表面引物(x)的许多拷贝和溶液引物(第三引物,b')的许多拷贝进行指数表面扩增。其他珠具有不同的第一引物(z),因此从第一珠(x)产生的延伸产物对第二珠(z)没有增加的亲和力。选择温度、浓度和其他扩增条件,使得与指数扩增相比,第一和第二延伸是缓慢和/或罕见的事件。选择温度、浓度和其他扩增条件,使得第一延伸产物(x)不用作其他珠(z)的模板。
[0377]
以下权利要求旨在限定本发明的范围,并且由此覆盖在这些权利要求范围内的方法和结构及其等同物。实施例6
[0378]
如本文所述,包含与其偶联的模板核酸分子的经延伸的支持物使用以下程序来制备。
[0379]
文库的退火和延伸:用以下组分/浓度制备最终体积为100微升的反应混合物:1 10x taq聚合酶反应缓冲液、8.2毫摩尔(mm)mgcl2、12mm dntp、10皮摩尔(pm)文库、1微摩尔/分钟(u)taq dna聚合酶和6.00x107个珠/微升。使用表2中的条件在热循环仪中温育该混合物:表2

热循环条件
[0380]
通过添加400微升(μl)tet缓冲液(te ph 8.0,0.05%triton x

100)来洗涤珠。将该混合物涡旋30秒,然后在离心机中以21,000转每分钟(rpm)旋转8分钟。去除上清液,留下100μl。用500μl 1x sa结合缓冲液(20mm tris ph 3.0、50mm nacl、0.05%triton x

100)来洗涤珠。将该混合物涡旋30秒,然后在离心机中以21,000rpm旋转8分钟。去除上清液,留下100μl。
[0381]
富集经延伸的珠:将100μl磁性链霉亲和素珠添加到经延伸的珠。将该混合物混合并在室温下温育1小时。将珠在合适的磁体上磁化直至溶液澄清,并除去上清液。将珠通过轻轻重新混悬而用500μl的sa结合缓冲液进行洗涤。在第二次磁化操作中,将珠在合适的磁体上磁化直至溶液澄清,并除去上清液。将珠通过轻轻重新混悬而用500μl的sa结合缓冲液进行洗涤。在第三次磁化操作中,将珠在合适的磁体上磁化直至溶液澄清,并除去上清液。
[0382]
洗脱经延伸的珠:将珠重新悬浮在300μl 50℃ meltoff缓冲液(0.1mol/升(m)naoh,0.05%triton x

100)中,并在50℃温育5分钟。将混合物短暂涡旋并将珠在适当的磁
体上磁化直至溶液澄清。将含有珠的上清液去除并保留。在第二次熔化操作中,将珠重新悬浮在300μl 50℃ meltoff缓冲液(0.1mol/升(m)naoh,0.05%triton x

100)中,并在50℃温育5分钟。将混合物短暂涡旋并将珠在适当的磁体上磁化直至溶液澄清。将含有珠的上清液去除并保留并与较早的含有珠的上清液合并。将洗脱的珠在离心机中以21,000rpm旋转8分钟,去除上清液,留下100μl。将珠用500μl 1x sa结合缓冲液洗涤,并涡旋30秒。将珠在离心机中以21,000rpm旋转8分钟,去除上清液,留下100μl。将珠用500μl tet缓冲液洗涤,并涡旋30秒。将珠在离心机中以21,000rpm旋转8分钟,去除上清液,留下100μl。
[0383]
富集的珠随后用于epcr程序。实施例7
[0384]
下面的表3和图25显示了使用预富集(例如,在克隆扩增之前富集支持物(例如珠)混合物以使用分离的和/或浓缩的经延伸的支持物混合物进行扩增)程序相比于没有执行预富集程序的对照程序的扩增结果。在大肠杆菌文库模板和人工模板上进行扩增。方法模板%富集%扩增%多克隆预富集大肠杆菌文库595n/a预富集人工模板1.69013.25对照人工模板n/a1711表3

预富集相比于对照结果
[0385]
图25在分图(a)中显示了经过预富集程序的大肠杆菌文库,在分图(b)中显示了经过预富集程序的人工模板文库,在分图(c)中显示了经过对照程序(没有预富集)的人工模板文库。每张图都显示了计数相比于别藻蓝蛋白(apc)荧光的分布。对于分图(a)和(c),纵轴指标分别按升序0、500、1,000和1,600读取,横轴指标分别按升序100、101、102、103、104、105、106和10
7.2
读取。对于分图(b),纵轴指标分别按升序0、200、400、600和800读取,横轴指标分别按升序100、101、102、103、104、105、106和10
7.2
读取。如分图(a)中所示,大肠杆菌文库(富集前)导致5%富集(理论值为10%)和95.3%扩增。如分图(b)中所示,人工模板文库(富集前)导致1.6%富集(理论值为10%)和89.6%扩增。如分图(c)中所示,人工模板文库(对照)导致16.8%扩增。预富集人工模板文库群体中的大约13.25%导致多克隆扩增。富集后人工模板文库群体中的大约11%导致多克隆扩增。实施例8
[0386]
如本文所述,包含被配置为附接至模板核酸分子(例如,与其附接的衔接子)的延伸引物序列的经延伸的支持物使用以下程序来制备。
[0387]
从10微摩尔储备液到10纳摩尔(nm)、1nm、0.1nm和0.01nm储备液中的每一种,在10毫摩尔(mm)tris ph 8.0中制备生物素化的延伸引物分子的系列稀释液,并进一步稀释这些以达到6000万个珠/μl中的最终浓度1000、100、10和1皮摩尔(pm)。生物素化的延伸引物分子包含延伸引物序列的互补序列。珠上的引物分子与生物素化的延伸引物分子之间的预退火在95℃下进行2分钟。将该混合物缓慢冷却至50℃,并在1x缓冲液中保持总共45分钟。将引物在70℃加热块处延伸20分钟,并用1x bw缓冲液洗涤两次。将磁性链霉亲和素珠在室温下在转子上与生物素模板化的珠杂交1.5小时。珠被磁性捕获。磁性捕获后,将珠(具有单一延伸引物序列)使用0.1%naoh和0.05%以及triton x

100在水中在50
℃洗脱5分钟。将富集的珠使用1x缓冲液洗涤三次,随后用于epcr程序。实施例9
[0388]
下面的表4和图26

27显示了以不同延伸引物:珠输入比率进行引物延伸后捕获的富集珠的结果。表4

富集的珠的捕获
[0389]
对于1000pm浓度的延伸引物以及10:1的延伸引物:珠比率,具有0、1和2 个模板的珠的预测%分别为0%、0%和100%。因此,捕获的珠的预测%(具有至少n=1个延伸引物)是100%。捕获的珠的观察%为51%。
[0390]
对于100pm浓度的延伸引物以及1:1的延伸引物:珠比率,具有0、1和2 个模板的珠的预测%分别为37%、37%和26%。因此,捕获的珠的预测%(具有至少n=1个延伸引物)是63%。捕获的珠的观察%为35%。
[0391]
图26在分图(a)中显示了在1000pm延伸引物输入浓度下捕获的富集珠的存在,在分图(b)中显示了在100pm延伸引物输入浓度下捕获的富集珠的存在。每个图都显示了计数相比于异硫氰酸荧光素(fitc)荧光的分布,fitc阈值为800。对于每个图,纵轴指标分别按升序0、10,000和25,600读取,横轴指标分别按升序100、101、102、103、104、105、106和10
7.2
读取。
[0392]
图27在分图(a)中显示了在1000pm延伸引物输入浓度和10:1延伸引物:珠比率时,富集珠中存在延伸引物序列,并且在分图(b)中显示了在100pm延伸引物输入浓度和1:1延伸引物:珠比率时,富集珠中存在延伸引物序列。每张图都显示了计数相比于别藻蓝蛋白(apc)荧光的分布。对于分图(a),纵轴指标分别按升序0、5,000、10,000和12,800读取,横轴指标分别按升序100、101、102、103、104、105、106和10
7.2
读取。对于分图(b),纵轴指标分别按升序0、1,000、2,000和3,200读取,横轴指标分别按升序100、101、102、103、104、105、106和10
7.2
读取。如分图(a)和(b)中所示,分别观察到富集珠中的75.1%和79.1%含有至少一个延伸引物序列。实施例10
[0393]
如本文所述,使用以下程序将包含经延伸的引物序列的经延伸的支持物附接至模板核酸分子(例如,与其附接的衔接子)。
[0394]
文库模板与经延伸的支持物预退火:提供两个种类的单链模板和经延伸的珠(包含经延伸的引物序列的珠)的混合物,其中模板:富集珠过量20倍,并且在95℃退火2分钟,缓慢冷却至50℃,并在1x缓冲液中保持总共45分钟。将该混合物在50℃再温育另外的时间,同时旋转2

20小时。将珠用1x缓冲液洗涤一次。所得珠具有与其偶联的模板分子(例如,单个模板分子)。
[0395]
分配模板化的经延伸的支持物用于epcr:模板化的珠被分配进入液滴用于epcr。
应当理解,分配用于epcr之前,模板化的珠(例如,通过延伸引物序列而与模板分子偶联的珠)可以通过模板与延伸引物序列的退火和/或通过从延伸引物序列延伸生成与珠偶联的模板的互补序列而与模板偶联。实施例11
[0396]
下面的表5和图28

29显示了在不同延伸引物:珠输入比率下使用模板化的珠进行epcr扩增的结果。两个种类的模板的atto探针与扩增珠退火并测量总扩增。
[0397]
图28在分图(a)中显示在1000pm延伸引物输入浓度、10:1延伸引物:珠输入比率、200pm模板输入浓度和1:20富集珠:模板输入比率下扩增珠(或文库阳性珠)的存在,并且在分图(b)中显示在100pm延伸引物输入浓度、1:1延伸引物:珠输入比率、200pm模板输入浓度和1:20富集珠:模板输入比率下扩增珠(或阳性珠)的存在。每张图都显示了计数相比于别藻蓝蛋白(apc)荧光的分布。对于分图(a),纵轴指标分别按升序0、2000、4000和6400读取,横轴指标分别按升序100、101、102、103、104、105、106和10
7.2
读取。对于分图(b),纵轴指标分别按升序0、100、150和200读取,横轴指标分别按升序100、101、102、103、104、105、106和10
7.2
读取。如分图(a)和(b)中所示,对于1000pm和100pm延伸引物输入浓度,分别有80.1%和41.5%的富集珠被扩增。
[0398]
图29在垂直分图(a)中显示两个图,表明在1000pm延伸引物输入浓度、10:1延伸引物:珠输入比率、200pm模板输入浓度和1:20富集珠:模板输入比率下扩增珠的多克隆性,并且在垂直分图(b)中显示两个图,表明在100pm延伸引物输入浓度、1:1延伸引物:珠输入比率、200pm模板输入浓度和1:20富集珠:模板输入比率下扩增珠的多克隆性。每个图都显示了apc荧光相比于fitc荧光的分布。对于每个图的每个纵轴和横轴,轴指标分别按升序100、101、102、103、104、105、106和10
7.2
读取。靠上的两个图有关于fitc的阈值,靠下两个图有关于apc荧光的阈值。表5

多克隆%
[0399]
如表5所示,预富集珠的观察的多克隆百分比为30%和6%(分别对于1000pm和100pm延伸引物输入浓度而言),分别比理论预测的67%和23%多克隆性更低。此外,对于80.1%和41.5%文库阳性率,在没有预富集的情况下执行epcr的预测多克隆百分比分别为44%和22%(参见例如关于图28的文库阳性珠结果)。因此,结果表明,与标准泊松加载(无预富集)相比,执行本文所述的预富集程序在给定的文库

阳性珠比率时产生更低水平的多克隆性。
[0400]
尽管本文已经示出并描述了本发明的优选实施方案,但对本领域技术人员而言显而易见的是:这些实施方案仅以示例的方式提供。本发明不意在受说明书中提供的具体实例的限制。虽然已经参考以上说明书描述了本发明,但是本文中对实施方案的描述和说明并非意在以限制性含义进行解释。在不偏离本公开内容的情况下,本领域技术人员现将想
到许多变化、改变和替代。此外,应当理解,本发明的所有方面不限于本文阐述的特定描述、配置或相对比例,而是取决于各种条件和变量。应当理解,本文所述的本发明实施方案的各种替代方案可用于实践本发明。因此,考虑到本发明还应涵盖任何此类替代、修改、变化或等同物。以下权利要求旨在限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同物。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献