一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数字式PCR条码化的制作方法

2022-03-22 22:32:26 来源:中国专利 TAG:

数字式pcr条码化
相关申请的交叉引用
1.本技术是中国专利申请号201580000806.3的分案申请。本技术要求于2014年6月24日提交的62/016,568号美国临时专利申请的优先权,该文的全部内容通过引用纳入本文用于所有目的。


背景技术:

2.多细胞生物的个体细胞往往在基因表达和/或基因型上呈现极大差异,甚至在相同组织或细胞类型的个体细胞之间也存在这种差异。例如,在b细胞成熟过程中,细胞进行体细胞重组和高度突变来产生高度多样化的抗体库。又例如,肿瘤细胞可以产生基因组异质性,其原因如关卡基因失调等。类似地,克隆单细胞生物体群体的个体细胞也可出现异质的基因调控或蛋白质表达模式,即使处于相同培养物中时仍然如此。因此,日渐认识到单细胞分析可以提供被传统分析方法(对来自多个细胞的混合材料进行分析)所模糊的信息此外,在对大量细胞进行分析时,对细胞群体应用单体基因组分析和/或基因表达分析能揭示基因表达和基因型的天然多样性。该方法会是有益的,例如,用于分析癌症的进展、理解自身免疫疾病的发展、指导改进疫苗以及对自然生物进程获得更好的理解。更宽泛地,用于改进高通量序列分析的组合物、方法、试剂盒和/或系统会是有益的,例如,用于分析癌症的进展、理解自身免疫疾病的发展、指导改进疫苗以及对自然生物进程获得更好的理解。


技术实现要素:

3.本文提供用于核酸分析的方法、组合物和试剂盒。例如,本文所述的方法、组合物和试剂盒可用于单细胞水平的基因组或基因表达分析。在一些实施方式中,此类方法、组合物和试剂盒能对个体细胞进行高通量和/或高度并行分析,例如通过基因表达、蛋白质表达和/或基因组分析。
4.在第一方面,本发明提供含有粒子的划分产物(partition),所述粒子包含固相支持面,所述固相支持面上偶联有多个寡核苷酸引物,其中所述多个寡核苷酸引物包含:可通过聚合酶用于连接和/或延伸的3’端;连接至所述固相支持面的5’端;和至少一个条码区。在一些实施方式中,所述至少一个条码区包含划分产物特异性条码,所述划分产物特异性条码在偶联于所述固相支持面的所述多个寡核苷酸引物中基本相同。在一些实施方式中,所述至少一个条码区包含分子条码,偶联于所述固相支持面的所述多个寡核苷酸引物中每一个的分子条码是基本独有的。
5.在一些实施方式中,所述至少一个条码区包含粒子条码和分子条码。在一些实施方式中,所述多个寡核苷酸引物包含:含有10-100个核苷酸的限定序列的第一限定区;含有6-20个核苷酸的粒子条码,其中所述多个寡核苷酸引物中全部、基本全部或多数包含相同的粒子条码;和含有6-20个核苷酸的分子条码,其中所述多个寡核苷酸引物中全部或基本全部各自包含独有分子条码。在一些实施方式中,第一限定序列包含3’捕获区。在一些实施方式中,所述捕获区包含随机序列、聚胸苷或聚腺苷序列。
6.在一些实施方式中,偶联于固相支持面的多个寡核苷酸引物各自含有发夹区。在一些实施方式中,所述发夹区含有尿嘧啶。在一些实施方式中,所述多个寡核苷酸引物各自含有在寡核苷酸5’端的尿嘧啶。在一些实施方式中,所述多个寡核苷酸引物通过二硫键偶联于固相支持面。在一些实施方式中,所述多个寡核苷酸引物含有沿这些引物3’端至少一部分的双链区。在一些实施方式中,所述多个寡核苷酸引物是双链的。在一些实施方式中,双链寡核苷酸或寡核苷酸呈双链的部分含有钝化5’端。在一些实施方式中,钝化5’端含有5’羟基(oh)。在一些实施方式中,划分产物含有液滴。在一些实施方式中,划分产物可含有至少10、100、200、300、500、750、1000、2500、5000、7,500、10,000、15,000、20,000、30,000、50,000、100,000、1x106、1x107或更多拷贝的划分产物特异性条码,其中这些拷贝是相同或基本相同的,且如果存在其它划分产物时,独特或基本独特地区别于其它划分产物中的划分产物特异性条码的。
7.在第二方面,本发明提供多个以上任一所述划分产物,这多个划分产物包含至少约1,000、10,000、50,000、100,000、500,000、1,000,000或更多粒子,这些粒子包含独有粒子条码,这些独有粒子条码就每个粒子而言基本相同而在粒子之间是基本彼此独特的。在一些实施方式中,(平均)每个划分产物1或更少种粒子。在一些实施方式中,所述划分产物包含切割自1种或更少带条码粒子(平均)的寡核苷酸。在一些实施方式中,所述多个划分产物包含靶核酸。在一些实施方式中,所述多个划分产物包含(平均)每个划分产物1个或更少细胞的靶核酸。在一些实施方式中,靶核酸是mrna且粒子含有聚胸苷捕获区。在一些实施方式中,靶核酸是cdna且粒子含有聚腺苷或聚胸苷捕获区。在一些实施方式中,这些划分产物含液滴。
8.在第三方面,本发明提供了制造任上所述划分产物的方法,该方法包括:将多个反式亚酰胺核苷酸依序偶联至固相支持面以产生在5’端连接至所述固相支持面的多个寡核苷酸引物;并对所述固相支持面进行划分。在一些实施方式中,所述偶联包括:(a)将反式亚酰胺核苷酸的等动力学(equikinetic)或等摩尔混合物偶联至5’已连接寡核苷酸引物的3’端;以及(b)将(a)重复6-20次从而产生多个独有分子条码。在一些实施方式中,所述偶联包括将寡核苷酸引物的5’端通过二硫键连接至固相支持面。在一些实施方式中,所述划分包括将固相支持面分至液滴。
9.在第四方面,本发明提供了制造多个以上任一所述划分产物的方法,该方法包括:(a)提供包含固相支持面的多个粒子;(b)偶联反式亚酰胺核苷酸至所述多个粒子的固相支持面,所述偶联在至少四个分开的反应中进行,每个反应偶联不同的核苷酸,在偶联后合并粒子并混合;(c)将(a)重复6-20次,从而产生多个带条码粒子,带条码粒子各自含有多个拷贝的该粒子独有寡核苷酸,其中这些独有性粒子条码就某个粒子而言是基本相同的,而在粒子之间则基本彼此独特;以及(d)将多个带条码粒子划分。在一些实施方式中,所述方法在划分步骤之前还包括:将核苷酸混合物偶联至所述多个粒子;并将(a)重复6-20次,从而产生含有粒子条码和分子条码的多个粒子。在一些实施方式中,所述划分包括将多个带条码粒子分至多个液滴。
10.在第五方面,本发明提供分析多个细胞的核酸的方法,其包含:提供多个以上任一所述划分产物(例如,液滴),其中每个划分产物包含:含有寡核苷酸群的粒子,这些寡核苷酸具有捕获序列和该粒子独有条码;和含靶核酸的样品;可选地,将偶联至多个粒子的寡核
苷酸引物从所述粒子切下;将寡核苷酸引物的捕获序列或其部分与各划分产物中靶核酸的至少一部分杂交;对已杂交的寡核苷酸引物进行模板引导的核酸聚合,从而将寡核苷酸引物共价结合于各划分产物内靶核酸的至少一部分,其中所述模板引导的核酸聚合在划分产物合并之前或之后进行;合并划分产物;并进行高通量测序。
11.在一些实施方式中,所述方法包括合并划分产物,然后进行已杂交寡核苷酸引物的模板引导的核酸聚合。在一些实施方式中,所述方法包括进行已杂交寡核苷酸引物的模板引导的核酸聚合,然后合并划分产物。在一些实施方式中,所述含靶核酸的样品包括含靶核酸的细胞。在一些实施方式中,杂交之前细胞被裂解。
12.在第六种实施方式中,本发明提供分析多个细胞的核酸的方法,其包含:提供以上任一所述划分产物,其中每个划分产物包含:含有寡核苷酸群的粒子,这些寡核苷酸具有捕获序列和该粒子独有条码;和含靶核酸的样品;可选地,将偶联至多个粒子的寡核苷酸引物从所述粒子切下;将寡核苷酸引物连接至各划分产物中靶核酸的至少一部分,从而使寡核苷酸引物共价结合于各划分产物中靶核酸的至少一部分,其中所述连接在划分产物合并之前进行;合并划分产物;并进行高通量测序。
13.在一些实施方式中,所述含靶核酸的样品包括含靶核酸的细胞。在一些实施方式中,连接之前细胞被裂解。在一些实施方式中,所述含靶核酸的样品包含dna。在一些实施方式中,所述含靶核酸的样品包含长片段dna。在一些实施方式中,所述dna是双链的。
14.在另一方面,本发明提供带双条码的粒子,所述粒子包含固相支持面,所述固相支持面上偶联有多个寡核苷酸引物,其中所述多个寡核苷酸引物包含:含有10-100个核苷酸的限定序列的第一限定区;含有6-20个核苷酸的粒子条码,其中所述多个寡核苷酸引物中全部、基本全部或多数包含相同的粒子条码;和含有6-20个核苷酸的分子条码,其中所述多个寡核苷酸引物中全部或基本全部包含独有分子条码。
15.在一些实施方式中,所述粒子还含有第二限定区,其包含10-100个核苷酸的限定序列。一些情况中,第一限定序列包含捕获序列用于捕获核酸。一些情况中,第二限定序列包含引物结合位点或其互补序列。一些情况中,捕获序列包含10-25、15-30或20-45个或更多个胸腺嘧啶核苷。一些情况中,第一限定区包含一个或多个尿嘧啶核苷。一些情况中,所述粒子自3’到5’包含:第一限定序列,粒子条码,和分子条码。其它情况中,所述粒子自5’到3’包含:第一限定序列,粒子条码,和分子条码。一些情况中,第二限定序列在分子条码的5’。一些情况中,第二限定序列在分子条码的3’。
16.另一方面,本发明提供多个以上任一所述带双条码的粒子,所述多个粒子含有至少约1,000、10,000、50,000、100,000、500,000、1,000,000或更多独有粒子条码。一些情况中,所述多个带双条码的粒子包含至少1,000、10,000、50,000、100,000、500,000、1,000,000或更多粒子。
17.另一方面,本发明提供一种试剂盒,其包含以上任一所述多个带双条码的粒子,并且还包含用于将所述多个粒子划分成多个划分产物的物质。在一些实施方式中,用于将所述多个粒子划分多个划分产物的物质包含与水不互溶的液体。在一些实施方式中,用于将所述多个粒子划分成多个划分产物的物质包含一种装置,其含有多个微通道或多个微孔或纳米孔。
18.另一方面,本发明提供从多个前体粒子产生多个带条码粒子的方法,所述方法包
括:(a)将核苷酸偶联至多个前体粒子,其中所述偶联在至少四个分开的反应中进行,每个反应偶联不同的核酸,其中在偶联后,将粒子合并且混合;(b)将(a)重复6-20次,从而产生多个带条码的粒子,其中带条码粒子各自含有该粒子独有寡核苷酸条码的多份相同或基本相同拷贝。
19.在一些实施方式中,该方法还包括:将核苷酸混合物偶联至多个带条码粒子的寡核苷酸(例如,5’或3’寡核苷酸末端);并将(a)重复6-20次,从而产生多个含有粒子条码和分子条码的粒子。在一些实施方式中,所述方法还包含将限定序列偶联至多个带条码粒子,其中所述限定序列含有捕获序列用于捕获核酸。在一些实施方式中,所述限定序列包含一个或多个尿嘧啶核苷。一些情况中,含捕获序列的所述限定序列先偶联至所述粒子,然后产生所述粒子条码。一些情况中,所述方法还包含将第二限定序列偶联至多个带条码粒子,其中所述第二限定序列含有引物结合位点。一些情况中,在产生所述粒子条码后将所述第二限定序列偶联至所述粒子。
20.在另一方面,本发明提供分析多个细胞的核酸的方法,其包含:提供多个带条码粒子,其中每个粒子含有寡核苷酸群,这些寡核苷酸具有捕获序列和该粒子独有条码;提供细胞群;划分所述多个粒子和所述细胞群,从而产生多个划分产物,每个划分产物中具有单一粒子和单细胞的核酸;将细胞群在划分产物中裂解;可选将偶联于多个粒子的寡核苷酸引物从所述粒子切下;将捕获序列或其部分与各划分产物中单细胞核酸的至少一部分杂交;模板引导的核酸聚合,从而将寡核苷酸引物共价结合于各划分产物内单细胞核酸的至少一部分。一些情况中,切割在裂解细胞前进行。一些情况中,切割在裂解细胞前进行。一些情况中,切割与细胞的裂解同时进行。
21.在一些实施方式中,所述划分包括:划分多个带条码粒子已产生多个具有单一带条码粒子的划分产物;在划分多个粒子后,从带条码粒子切割寡核苷酸并将细胞群分入多个具有单一带条码粒子的划分产物,从而产生多个划分产物,这些划分产物具有单一细胞和来自单一带条码粒子的寡核苷酸群。一些情况中,切割在将细胞分入含条码划分产物之前进行。一些情况中,切割在将细胞分入含条码划分产物之后进行。一些情况中,切割与将细胞分入含条码划分产物同时进行。例如,同时切割并划分细胞可以通过在含有切割试剂的溶液存在下划分细胞来进行。在一些实施方式中,所述寡核苷酸含有一个或多个尿嘧啶核苷且所述切割包括使带条码粒子接触尿嘧啶dna去糖基化酶。一些情况中,寡核苷酸经二硫键连接至带条码粒子,且切割包括使带条码粒子接触还原剂。
22.一些情况中,模板引导的核酸聚合或逆转录或后续扩增是在限定的dutp对dttp比例下进行,从而以限定的u对t之比在t的位置掺入u。一些情况中,u对t之比是约1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90、1/100或更低。一些情况中,该比值是1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90或1/100。一些情况中,单细胞核酸的cdna或扩增子随后通过接触udg/apei而片段化。一些情况中,片段接触末端转移酶以添加多核苷酸至所述片段的5’或3’端。一些情况中,多核苷酸末端杂交至衔接子寡核苷酸。所述衔接子寡核苷酸可通过聚合和/或连接而偶联至单一细胞的核酸。
23.另一方面,本发明提供多个划分产物,这些划分产物包含:水凝胶;线性聚丙烯酰胺寡核苷酸偶联物;双功能条码模板核酸,其具有条码区、含正向引物结合位点的第一末端
和含反向引物结合位点的第二末端;带标记的反向引物,其含有捕获区和引物区,其引物区与双功能条码模板核酸的第二末端的反向引物结合位点杂交,其中线性聚丙烯酰胺寡核苷酸偶联物含有正向引物,该正向引物与双功能条码模板核酸的第一末端的正向引物结合位点杂交,且所述双功能条码模板核酸的条码区含有各划分产物的独有序列。一些情况中,所述带标记的反向引物含有独有分子条码。一些情况中,各划分产物含有多个带标记的反向引物,这些反向引物含有独有分子条码。在一些实施方式中,所述双功能条码模板核酸是双链的。在一些实施方式中,所述双功能条码模板核酸是单链的。
24.另一方面,本发明提供多个划分产物,每个划分产物包含:水凝胶;和线性聚丙烯酰胺寡核苷酸偶联物,其中所述线性聚丙烯酰胺寡核苷酸偶联物含有单链的双功能条码模板核酸,其具有条码区、偶联至所述线性聚丙烯酰胺的第一末端和含捕获区的第二末端,且其中双功能条码模板核酸的条码区在各划分产物中含有独有序列(例如,独有或基本独有的划分产物特异性条码)。一些情况中,划分产物含有唯一或基本唯一的划分产物特异性条码序列,该序列在一个划分产物中的全部划分产物特异性条码间是相同或基本相同的,但相对其它划分产物的划分产物特异性条码是独特或基本独特的。个体划分产物可含有至少10、100、200、300、500、750、1000、2500、5000、7,500、10,000、15,000、20,000、30,000、50,000、100,000、1x106、1x107或更多拷贝的划分产物特异性条码,其中这些拷贝就一个划分产物的划分产物特异性条码序列而言相同或基本相同的,而相对其它划分产物中的划分产物特异性条码则是独特或基本独特的。一些情况中,线性聚丙烯酰胺寡核苷酸偶联物还含有第二条码区,其中所述第二条码区含有分子条码。
25.在一些实施方式中,所述捕获区包含聚a核苷酸序列或聚t核苷酸序列。在一些实施方式中,所述捕获区可含有含靶核酸序列的一部分或其反向互补序列的核苷酸序列。在一些实施方式中,所述带标记的反向引物标记有生物素分子或其衍生物。
26.在一些实施方式中,低于约10%、1%、0.1%或更少的划分产物具有超过一种独有条码序列或者超过一种独有第一条码序列(例如,独有划分产物特异性条码)。在一些实施方式中,划分产物还包含dna扩增试剂。
27.在一些实施方式中,划分产物含有水凝胶且每个划分产物还包含单一细胞。在一些实施方式中,划分产物含有sol水凝胶且每个划分产物还包含来自单一细胞的核酸。在一些实施方式中,划分产物含有gel水凝胶且每个划分产物还包含来自单一细胞的核酸。一些情况中,划分产物还含有模板引导的核酸扩增试剂。例如,模板引导的核酸扩增的试剂可包括进行逆转录的试剂。
28.在一些实施方式中,多个划分产物包括至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000个或更多个。一些情况中,多个划分产物至少10,000个,每个含有不超过一种独有条码序列(例如,不超过一种独有划分产物特异性条码序列)。划分产物可含有唯一或基本唯一的划分产物特异性条码序列,该序列在一个划分产物中的全部划分产物特异性条码间是相同或基本相同的,但相对其它划分产物的划分产物特异性条码是独特或基本独特的。划分产物各自可含有至少10、100、200、300、500、750、1000、2500、5000、7,500、10,000、15,000、20,000、30,000、50,000、100,000、1x106、1x107或更多拷贝的划分产物特异性条码,其中这些拷贝就一个划分产物的划分产物特异性条码序列而言是相同或基本相同的,而相对其它划分产物中的划分产物特异性条码则是独特或基
本独特的。
29.在另一方面,本发明提供了制造以上任一所述多个划分产物的方法,该方法包括:混合sol水凝胶和线性聚丙烯酰胺寡核苷酸偶联物,混合时存在:带标记的反向引物,dna聚合和/或扩增试剂,和双功能条码模板核酸,该模板核酸具有条码区(例如,划分产物特异性条码区)、含正向引物结合位点的第一末端和含反向引物结合位点的第二末端,由此形成混合物;以及划分该混合物,其中双功能条码模板的浓度使得至少划分产物中约90%、99.5%或更多所含独有条码序列数不大于一(例如,划分产物特异性条码序列数不大于一)。一些情况中,带标记的反向引物含有分子条码且多个划分产物中的每一个含有多个独有分子条码序列。
30.在一些实施方式中,所述双功能条码模板核酸是单链的双功能条码模板核酸。在一些实施方式中,所述方法还包括在划分产物中进行dna扩增以扩增所述双功能条码模板核酸并将双功能条码模板核酸共价连接至所述线性聚丙烯酰胺寡核苷酸偶联物。在一些实施方式中,所述方法还包括固化所述sol水凝胶成gel形式以产生多个带标记的水凝胶粒子,这些粒子各自含有线性丙烯酰胺寡核苷酸偶联物,其中线性聚丙烯酰胺寡核苷酸偶联物共价连接所述双功能条码模板核酸,且所述带标记的水凝胶粒子各自含有独有条码序列(例如,各自含有独有划分产物特异性条码序列)。一些情况中,带标记的水凝胶粒子各自含有多个分子条码序列。
31.在一些实施方式中,所述方法还包括合并划分产物和获得带标记的水凝胶粒子,这些粒子各自含有独有条码序列(例如,各自含有独有的划分产物特异性条码序列)。一些情况中,所述方法还包括将水凝胶粒子与标记分离,其中所述分离包括产生含有线性聚丙烯酰胺偶联物,其共价连接单链双功能条码模板核酸。一些情况中,所述分离包括使带标记的水凝胶粒子接触核酸变性剂并将标记从水凝胶粒子洗下。一些情况中,所述变性剂是碱性氢氧化物。
32.一些情况中,所述方法还包括形成多个划分产物,每个划分产物含有单一细胞和如下所述水凝胶粒子之一,所述所述水凝胶粒子包含共价连接单链双功能条码模板核酸的线性聚丙烯酰胺偶联物,所述条码模板核酸具有独有条码序列(例如,独有划分产物特异性条码序列)。一些情况中,形成各自含有单一细胞和水凝胶粒子的多个划分产物是在模板引导的核酸聚合试剂存在下进行的。一些情况中,所述方法还包括裂解划分产物中的单一细胞。
33.另一方面,本发明提供用于单细胞分析的高通量方法,其包括:将以上任一所述方法并行进行至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000、50,000、75,000、100,000、250,000、500,000、1x106或更多倍次;进行模板引导的核酸聚合或连接,从而使含有单链双功能条码模板核酸的线性聚丙烯酰胺寡核苷酸偶联物共价结合单细胞核酸的至少一部分;合并划分产物,此后或此前进行模板引导的聚合或连接;并进行高通量测序。
34.另一方面,本发明提供水凝胶粒子,其中所述粒子包含:水凝胶;和线性聚丙烯酰胺寡核苷酸偶联物,其中所述线性聚丙烯酰胺寡核苷酸偶联物包封在水凝胶基质中,且所述寡核苷酸偶联物包含单链双功能条码模板核酸,该模板核酸具有条码区、偶联至线性聚丙烯酰胺的第一末端和含有捕获区的第二末端。一些情况中,所述线性聚丙烯酰胺寡核苷
酸偶联物含有第一条码区和第二条码区,其中第一条码区是每个水凝胶粒子独有或基本独有的细胞或粒子条码,第二条码区是每个带条码寡核苷酸分子独有或或基本独有的分子条码。
35.另一方面,本发明提供一组以上任一所述水凝胶粒子,其中每个粒子具有独有条码序列(例如,独有细胞或粒子条码序列)。在一些实施方式中,每个粒子具有独有或基本独有的细胞或粒子条码且偶联至水凝胶的每个寡核苷酸具有独有或基本独有的分子条码。所述的组可含有至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000、50,000、75,000、100,000、250,000、500,000、1x10

或更多的水凝胶粒子,其中每个粒子具有独有或基本独有条码序列(例如,独有细胞或粒子条码序列)。粒子可各自含有至少10、100、200、300、500、750、1000、2500、5000、7,500、10,000、15,000、20,000、30,000、50,000、100,000、1x106\1x107或更多拷贝的细胞或粒子条码。
36.另一方面,本发明提供分析单细胞核酸的方法,其包括:形成含有以上任一所述水凝胶粒子的划分产物,单一细胞,和用于模板引导的核酸聚合的试剂;裂解所述单一细胞;进行模板引导的核酸聚合,从而使含有单链双功能条码模板核酸的线性聚丙烯酰胺寡核苷酸偶联物共价结合单一细胞核酸的至少一部分或其互补dna(cdna);以及对所述单一细胞的核酸或cdna测序。一些情况中,模板引导的核酸聚合或逆转录或后续扩增步骤是在限定的dutp对dttp比例下进行,从而以限定的u对t之比在t的位置掺入u。一些情况中,u对t之比是约1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90、1/100或更低。一些情况中,该比值是1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90或1/100。一些情况中,单细胞核酸的cdna或扩增子随后通过接触udg/apei而片段化。一些情况中,片段接触末端转移酶以添加多核苷酸至所述片段的5’或3’端。一些情况中,多核苷酸末端杂交至衔接子寡核苷酸。所述衔接子寡核苷酸可通过聚合和/或连接而偶联至单细胞核酸。
37.另一方面,本发明提供同步个体化分析多个细胞的核酸的方法,所述方法包含:提供以上任一所述水凝胶粒子的悬液;形成多个划分产物,其中每个划分产物包含:水凝胶粒子,其中含有:水凝胶,线性聚丙烯酰胺寡核苷酸偶联物,单一细胞和模板指导核酸聚合的试剂,其中所述线性聚丙烯酰胺寡核苷酸偶联物包封在水凝胶基质中,且所述寡核苷酸偶联物含有单链双功能条码模板核酸,该模板核酸具有条码区(例如,独有细胞或划分产物特异性条码区)、偶联至线性聚丙烯酰胺的第一末端和含捕获区的第二末端;裂解这些单细胞;进行模板引导的核酸聚合,从而使含有单链双功能条码模板核酸(其具有各划分产物混合物的独有条码区)的线性聚丙烯酰胺寡核苷酸偶联物共价结合各划分产物混合物的单一细胞的核酸或cdna的至少一部分;合并划分产物;并进行带条码核酸的高通量测序,其中具有同样条码(例如,同样的细胞或划分产物特异性条码)的序列源自相同的单一细胞和/或源自相同的单个划分产物。一些情况中,所述线性聚丙烯酰胺寡核苷酸偶联物还含有多个独有分子条码。一些情况中,具有同样分子条码的序列源自相同的核酸分子。
38.在一些实施方式中,所述多个划分产物包括至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000、50,000、75,000、100,000、250,000、500,000、1x106或更多划分产物。一些情况中,模板引导的核酸聚合试剂包括逆转录试剂。一些情况中,裂解这些单细胞包括将多个划分产物平衡至使水凝胶熔化的温度。一些情况中,所
述平衡包括加热所述的多个划分产物并熔化水凝胶粒子。
39.一些情况中,模板引导的核酸聚合或逆转录或后续扩增步骤是在限定的dutp对dttp比例下进行,从而以限定的u对t之比在t的位置掺入u。一些情况中,u对t之比是约1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90、1/100或更低。一些情况中,该比值是1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90或1/100。一些情况中,单细胞核酸的cdna或扩增子随后通过接触udg/apei而片段化。一些情况中,片段接触末端转移酶以添加多核苷酸至所述片段的5’或3’端。一些情况中,多核苷酸末端杂交至衔接子寡核苷酸。所述衔接子寡核苷酸可通过聚合和/或连接而偶联至单细胞的核酸。
40.上述任意方面、实施方式、情况或示例中,所述水凝胶可包含琼脂糖。定义
41.除非另有说明,本文所用的所有科技术语具有本发明所属领域普通技术人员通常所理解的含义。通常,本文所用的命名和下述细胞培养、分子遗传学、有机化学和核酸化学以及杂交中的实验室步骤均为本领域熟知和常用的。使用标准技术进行核酸和肽合成。按照本领域和各种通用参考文献所述的常规方法进行这些技术和步骤(通常参见,sambrook等,《分子克隆:实验室手册》(molecular cloning:a laboratory manual),第2版(1989)冷泉港实验室出版社(cold spring harbor laboratory press),纽约冷泉港(cold spring harbor,n.y.),其通过引用纳入本文),全文中提供这些参考文献。本文所用的命名以及下述分析化学和有机合成中的实验室步骤均为本领域熟知且常用。
42.术语“扩增反应”指用于以线性或指数方式倍增核酸靶序列拷贝的各种体外方法。这类方法包括但不限于聚合酶链反应(pcr);dna连接酶链反应(参见美国专利号4,683,195和4,683,202,pcr protocols:a guide to methods and applications(pcr方案:方法和应用指南)(innis等编,1990))(lcr);基于qbeta rna复制酶和基于rna转录的扩增反应(例如,涉及t7、t3或sp6引导的rna聚合),例如转录扩增系统(tas),基于核酸序列的扩增(nsaba),和自主维持序列复制(3sr);等温扩增反应(例如,单引物等温扩增(spia));以及本领域技术人员已知的其它方法。
[0043]“扩增”指将溶液置于足以扩增多核苷酸的条件下的步骤(如果反应的所有组分是完整的)。扩增反应的组分包括,例如,引物、多核苷酸模板、聚合酶、核苷酸等。术语“扩增”一般是指靶核酸的“指数型”增长。然而,本文所用的“扩增”也可指核酸的选择靶序列数量的线性增长,如由循环测序或线性扩增所得。
[0044]
术语“扩增反应混合物”指包含用于扩增靶核酸的各种试剂的水性溶液。这些试剂包括酶、水性缓冲剂、盐、扩增引物、靶核酸和三磷酸核苷。扩增反应混合物还可包含稳定剂和其它添加剂以优化效率和特异性。根据上下文,混合物可以是完全或是不完全的扩增反应混合物。
[0045]“聚合酶链反应”或“pcr”是指靶双链dna的特定区段或子序列得以几何级数式扩增的一种方法。pcr是本领域技术人员所熟知的;参见例如,美国专利号4,683,195和4,683,202;和《pcr方案:方法和应用指南》,innis等编,1990。示例性pcr反应条件一般包括两步或三步式循环。两步骤循环具有变性步骤,之后是杂交/延长步骤。三步骤循环包括变性步骤,之后是杂交步骤,之后是独立的延长步骤。
[0046]“引物”指与靶核酸上的序列杂交并且用作核酸合成的起始点的多核苷酸序列。引物可以是各种长度的并且通常长度小于50个核苷酸,例如长度为12-30个核苷酸。可基于本领域技术人员已知的原理设计用于pcr的引物的长度和序列,参见例如innis等(同上)。引物可以是dna、rna或dna部分与rna部分的嵌合体。一些情况中,引物可包括一个或多个带修饰或非天然的核苷碱基。一些情况中,引物带标记。
[0047]
核酸或其部分与另一核酸“杂交”的某些条件使得生理缓冲液(例如,ph 6-9,25-150mm盐酸盐)中限定温度下的非特异性杂交最少。一些情况中,核酸或其部分与一组靶核酸之间共有的保守序列杂交。一些情况中,如果包括与超过一个核苷酸伴侣互补的“通用”核苷酸在内有至少约6、8、10、12、14、16或18个连续的互补核苷酸,引物或其部分能杂交至引物结合位点。或者,如果在至少约12、14、16或18个连续的互补核苷酸中有不到1或2个互补错配,引物或其部分能杂交至引物结合位点。在一些实施方式中,发生特异性杂交的限定温度是室温。在一些实施方式中,发生特异性杂交的限定温度高于室温。在一些实施方式中,发生特异性杂交的限定温度至少约37、40、42、45、50、55、60、65、70、75或80℃。在一些实施方式中,发生特异性杂交的限定温度37、40、42、45、50、55、60、65、70、75或80℃。
[0048]“模板”指包含待扩增的多核苷酸、其侧或为一对引物杂交位点的多核苷酸序列。因此,“靶模板”包含毗邻引物的至少一个杂交位点的靶多核苷酸序列。因此,“靶模板”包含侧接有“正向”引物和“反向”引物的杂交位点的靶多核苷酸序列。
[0049]
本文所用的“核酸”表示dna、rna、单链、双链、或更高度聚集的杂交基序及其任意化学修饰。修饰包括但不限于,提供整合入其它电荷、极化性、氢键、静电相互作用、与核酸配体碱基或核酸配体整体的连接点和作用点的化学基团的那些修饰。这类修饰包括但不限于,肽核酸(pna)、磷酸二酯基团修饰(例如,硫代磷酸酯、甲基膦酸酯)、2
′‑
位糖修饰、5-位嘧啶修饰、8-位嘌呤修饰、环外胺处的修饰、4-硫尿核苷的取代、5-溴或5-碘-尿嘧啶的取代、骨架修饰、甲基化、不常见的碱基配对组合如异碱基(isobases)、异胞苷和异胍(isoguanidine)等。核酸也可包含非天然碱基,如硝基吲哚。修饰还可包括3

和5

修饰,包括但不限于用荧光团(例如,量子点)或其他部分加帽。
[0050]
术语“长片段dna”指长度至少约300、400、500、600、700、800、1,000或更多碱基(或对双链靶dna而言是碱基对)的靶dna。长片段dna可以是从基因组获取“差相(phased)”测序信息的一种尤为有利的底物。差相基因组序列指序列信息可被指定到个体的具体染色单体的序列。
[0051]
术语“多肽”、“肽”和“蛋白质”在本文中互换使用,指氨基酸残基的聚合物。该术语可用于表示其中一个或多个氨基酸残基是相应天然产生氨基酸的人造化学模拟物的氨基酸聚合物,以及天然产生的氨基酸聚合物和非天然产生的氨基酸聚合物。
[0052]“聚合酶”是指能进行模板引导的多核苷酸(例如,dna和/或rna)合成的酶。该术语同时包括全长多肽和具有聚合酶活性的结构域。dna聚合酶是本领域技术人员熟知的,包括但不限于从激烈火球菌(pyrococcus furiosus)、滨海嗜热球菌(thermococcus litoralis)和海栖热袍菌(thermotoga maritime)分离或衍生的dna聚合酶或其修饰版本。市售的聚合酶的其它示例包括,但不限于:克列诺片段(新英格兰生物实验室公司(new englandinc.)、taq dna聚合酶(凯杰公司(qiagen))、9
°ntm dna聚合酶(新英格兰生物实验室公司)、deep vent
tm dna聚合酶(新英格兰生物实验室公司)、manta dna聚合酶
(enzymatics公司)、bst dna聚合酶(新英格兰生物实验室公司)、和phi29dna聚合酶(新英格兰生物实验室公司)。
[0053]
聚合酶包括dna-依赖聚合酶和rna-依赖聚合酶,如逆转录酶。已知至少5个dna-依赖dna聚合酶家族,虽然大多数落入a、b和c家族。其它类型dna聚合酶包括噬菌体聚合酶。相似地,rna聚合酶通常包括真核rna聚合酶i、ii和iii,和细菌rna聚合酶以及噬菌体和病毒聚合酶。rna聚合酶可以是dna-依赖的和rna-依赖的。
[0054]
术语“标记”、“可检测标记”、“可检测部分”和类似术语指可通过光谱、光化学、生物化学、免疫化学、化学或其它物理手段检测的组合物。例如,可用的标签包括荧光染料(荧光团)、发光剂、高电子密度试剂、酶(例如,elisa中常用)、生物素、地高辛、
32
p和其它同位素、半抗原、以及可被检测的蛋白质(例如通过将放射性标签整合至肽中或或用于检测与肽特异性反应的抗体)。该术语包括单一标记试剂的组合,例如,提供独特可检测特征(例如,特定波长或波长组合下)的荧光团的组合。可以采用本领域已知的用于将标签偶联到需要的试剂的任何方法,例如,使用如下文献中所述的方法:hermanson,《生物偶联技术》(bioconjugate techniques)1996,圣迭戈的学术出版社有限公司(academic press,inc.)。
[0055]
本文所用术语“划分”或“划分”指将样品分为多个部分或多个“划分产物”。划分产物通常是实体意义上的,例如,一个划分产物中的样品不与或基本不与邻近划分产物中的样品混合。划分产物可以是固体或流体。在一些实施方式中,划分产物是固体划分产物,例如微通道。在一些实施方式中,划分产物是流体划分产物,例如液滴。在一些实施方式中,流体划分产物(如液滴)是多种不互溶流体(如水和油)的混合物。在一些实施方式中,流体划分产物(如液滴)是水性液滴,其被不互溶的运载体流体(如油)包围。
[0056]
一些情况下,隔离是虚拟(virtual)的。在优选实施方式中,虚拟划分产物需要一种分子或一组分子具有实体性改变,所述改变由此划定就该分子或该组分子而言的独特划分产物。适于确立或保持虚拟划分的典型实体性改变包括但不限于:核酸条码、可检测标记等。例如,样品可在物理上被划分,且各划分产物的组分标记有独有标识(例如,独有核酸序列条码)使得所述标识在与其它划分产物比较时是唯一的,但在该划分产物的组分间是共有的。独特性标识可用以在需将实体上划分开的材料合并的下游应用中维持虚拟隔离。因此,如果样品是多细胞样品并被实体性分成多个含单细胞的划分产物,标识可在划分产物被重新合并后区分不同的单细胞核酸。
[0057]
如本文所述,术语“凝胶”指交联材料的显著稀释网络。

水凝胶

是其中液体组分为水的凝胶。凝胶和水凝胶可以是可形变的。凝胶和水凝胶可以是sol(液态)或gel(固态)形式。一些情况中,水凝胶是可逆的。可逆的水凝胶可以在sol(液态)或gel(固态)形式之间可逆转换。例如,琼脂糖水凝胶可用热转换成sol形式并用冷却来转换成gel形式。或者,一些水凝胶组合物在转换温度以下以sol形式存在而在转换温度以上以gel形式存在。一些情况中,sol(液态)水凝胶,或水凝胶前体,可以不可逆地硬化成gel形式。例如,丙烯酰胺可以不可逆地聚合成gel形式。如本文所用,sol指水凝胶的可溶形式或指水凝胶前体,而gel指固态水凝胶。本领域已知大量可逆和不可逆的水凝胶组合物,包括例如下列文件中所述:美国专利号4,438,258、6,534,083、8,008,476、8,329,763;美国专利申请号2002/0,009,591、2013/0,022,569、2013/0,034,592;和国际专利申请号wo/1997/030092与wo/2001/049240。
[0058]
如本文所用“条码”是鉴别其所偶联分子的短核苷酸序列(例如,长至少约4、6、8、10或12个核苷酸)。例如,条码可用来鉴定划分产物中的分子。这样的划分产物特异性条码应相对于其它划分产物的条码为该划分产物所独有例如,含有来自单一细胞的靶rna的划分产物可以经受逆转录条件,各划分产物中采用的引物含有不同的划分产物特异性条码序列,从而将独有“细胞条码”的拷贝纳入各划分产物逆转录所得核酸。由此,来自各细胞的核酸可藉由独有“细胞条码”而与其它细胞的核酸相区分。一些情况中,细胞条码是由偶联至粒子的寡核苷酸上存在的“粒子条码”来提供,其中所述粒子条码为偶联至该粒子的全部或基本全部寡核苷酸所共有(例如,在它们之间相同或基本相同)。因此,细胞和粒子条码可存在于划分产物中、附着至粒子、或结合至细胞核酸,以同一条码序列的多个拷贝的形式。相同序列的细胞或粒子条码可鉴定为衍生自相同细胞、划分产物或粒子。此类划分产物特异性的细胞或粒子条码可用各种方法产生,这些方法导致条码偶联至或纳入固相或水凝胶支持物(例如,固体珠或粒子或水凝胶珠或粒子)。一些情况中,粒子特异性的细胞或粒子条码是采用本文所述的拆分与混合(也称拆分与合并)的合成方案来产生。划分产物特异性条码可以是细胞条码和/或粒子条码。类似地,细胞条码可以是划分产物特异性条码和/或粒子条码。此外,粒子条码可以是细胞条码和/或划分产物特异性条码。
[0059]
其它情况中,条码专一性辨识其偶联的分子。例如,通过用各自含有独有“分子条码”的引物进行逆转录。在另一些实施例中,引物可利用含有各划分产物独有“划分产物特异性条码”和各分子独有“分子条码”的那些。条码化之后,划分产物可被合并,并可选扩增,而仍保持虚拟隔离。因此,可计算包含各条码的靶核酸(例如,逆转录所得核酸)的存在与否(例如,通过测序)而无需维持实体划分。
[0060]
条码序列的长度决定能区分多少独特性样品。例如,1个核苷酸的条码能区分不多于4个样品或分子;4个核苷酸的条码能区分不多于44即256个样品;6个核苷酸的条码能区分不多于4096个不同样品;而8个核苷酸的条码能标引不多于65,536个不同样品此外,条码可结合于两条链,或者通过对第一和第二链合成都采用带条码引物,或者通过连接。
[0061]
条码通常是合成和/或聚合(例如扩增)得到,所用过程难免有不精确性。因此,原指望均一的条码(例如,单一划分产物、细胞或珠的全部带条码核酸所共有的细胞、粒子或划分产物特异性条码)可能相对于范本条码序列含有不同程度的n-1缺失或其它突变。因此,称作“相同或基本相同拷贝”的条码指由于例如合成、聚合或纯化中的一个或多个误差而相对范本条码序列含有不同程度n-1缺失或其它突变的有不一致的条码。此外,在采用例如本文所述的拆分与合并方法和/或核苷酸前体分子等量混合物的合成中,条码核苷酸的随机偶联可能导致低概率事件,其中的条码并非绝对独特(例如,不同于群体的其它条码,或不同于不同划分产物、细胞或珠的条码)。但是,这类偏离理论理想条码的轻微偏差不会干扰本文所述的单细胞分析方法、组合物和试剂盒。因此,如本文所用,在粒子、细胞、划分产物特异性或分子条码上下文中的术语“独有性”涵盖偏离理想条码序列的各组非有意的n-1缺失和突变。一些情况中,由于条码合成、聚合和/或扩增的不精确性质造成的问题可以通过相对待区分的条码序列的数量进行可能的条码序列的过密采样来克服(例如,至少约2、5、10倍或更多倍的可能的条码序列)。例如,可用具有9个条码核苷酸的细胞条码来分析10,000个细胞,这样的条码给出262,144个可能的条码序列。本领域熟知条码技术的使用,参见例如katsuyuki shiroguchi等proc natl acad sci u s a.,2012年1月24日109(4):
1347-52和smith,am等nucleic acids research can 11,(2010)。附图简要说明
[0062]
图1:制备和使用带条码水凝胶粒子的过程概图。a)此处所示过程利用的寡核苷酸具有侧接了已知结构末端(锚序列)的简并核心序列。所述锚序列被用来利用pcr将功能性序列连接到简并核心序列。通过用共价偶联至水凝胶聚合物的至少一个pcr引物来扩增核心模板,由此将功能性条码直接合成到水凝胶粒子上。引物和聚合物包封入液滴,模板低于1拷贝/液滴。在液滴中进行pcr来扩增模板分子。扩增后,聚合物硬化成粒子。由此得到成百万的水凝胶粒子,每个具有成百万拷贝的独有功能性dna条码。b)随后可在另一乳液滴中将条码库与待条码化的对象如核酸或细胞合并。在条码化反应后,液滴可被合并及进行后续处理例如dna测序。
[0063]
图2:聚丙烯酰胺寡核苷酸合成。通过在dna寡核苷酸存在下进行丙烯酰胺聚合来将dna寡核苷酸共价连接至聚丙烯酰胺聚合物,所述dna寡核苷酸已合成有5’端的丙烯酰胺(acyridite)部分产物是高分子量的聚丙烯酰胺(lpa),沿其长度共价偶联有dna寡核苷酸。
[0064]
图3:条码粒子形成a)lpa-寡核苷酸偶联物(正向引物)与水凝胶、生物素化反向引物、pcr试剂和条码模板混合,用微流体装置将该溶液纳入均一的油包水液滴中。b1)所用各浓度为:引物浓度高到每滴有好几百万引物而模板浓度则低于每滴一个。这确保对基本全部液滴而言,任一液滴中仅有单个模板或者没有模板。对于rna-seq应用,模板含有无偏扩增用t7启动子、测序引物结合位点、条码区和扩增用引物结合位点。反向引物结合pbs并添加“寡聚dt”功能使得能捕获聚a mrna。反向引物还具有5’生物素以使后续在过程中能富集“pcr阳性”珠。b2)这些滴经热循环来pcr扩增模板分子。起初含有模板分子的各滴此时含有成百万拷贝的双链dna,这些双链dna具有寡聚dt功能块和所接的生物素。b3)将珠硬化成粒子并从油中洗入水性悬液。pcr阳性珠通过磁性链霉亲和素粒子得以富集,通过碱性变性去除生物素化的链并清洗粒子。
[0065]
图4:单细胞rna条码化供单细胞表达分析(rna-seq)。将条码凝胶粒子库在微流体装置中和多个细胞混合,并共包封入水性液滴,液滴中含有裂解细胞的试剂和进行rna逆转录的试剂。这些滴被加热以熔化琼脂糖凝胶并裂解细胞,从而使得细胞rna和条码寡核苷酸接触。这些滴被冷却至允许逆转录酶起作用的温度,在滴内发生第一链合成(fss)。fss反应为每一个逆转录得到的转录物接上条码。破乳,从而将全部fss反应合并入单管内。由于rna已带条码,测序用库制备的其余步骤在单管内用已合并的滴来进行。最后,制得的库通过ngs来测序。条码的去卷积使得由每个细胞所读取的序列可被专一性地辨识。
[0066]
图5:将条码库直接合成在珠上。1)dna合成在用dna合成树脂制成的珠上,例如30μm直径的聚苯乙烯粒子。首先添加的那些核苷酸是限定序列(d=限定的)。在rna-seq应用的情况中,这些核苷酸通常是用来捕获mrna的~15-20个t核苷酸。2)“拆分与混合”这些珠可分入4个不同的反应分别加入a、c、g或t。然后这四个反应被合并、混合并再次拆分,再添加又一个核苷酸。通常在拆分与混合部分加入10-14个核苷酸。在该过程结束时,某个珠上的全部寡核苷酸都是相同的,而且每个珠都是独特的。这就是细胞条码。3)这些珠重新组合并添加数个“n”(等量或等动力学量的各个核苷酸),重复10-14次。对此n-段(n-block)的核苷酸,各珠上的每个核苷酸都是独特的。这就是分子条码。最后,加上另一段限定序列,该段用作结合位点用于pcr或用来添加其它功能,例如测序衔接子。5.寡核苷酸可从5’向3’合成。
例如,5’向3’合成可用反式亚酰胺化学来进行。这种情况中,本文所述的18-25个核苷酸的限定的捕获序列可自由结合靶核酸序列和引发聚合(例如,逆转录),不论是否从珠上切割。一些情况中,在从5’向3’合成寡核苷酸时,最后的寡核苷酸从5’到3’由以下四段组成:a)约18-25个核苷酸的限定的捕获序列,例如用于捕获mrna的聚t。还可以有用于将寡核苷酸从珠切割下来的一个限定序列或核苷酸类似物。b)细胞条码段。给定珠上的每份寡核苷酸的该段都是相同的,但各珠不同。c)分子条码。每个寡核苷酸都有其独有的分子条码。d)用于下游扩增的限定区。所有珠和寡核苷酸的该区序列具有相同的序列。或者(未显示),寡核苷酸可从3’向5’合成。
[0067]
图6:显示液滴中单细胞信使rna分析的方法。产生具有划分产物特异性和分子条码的条码寡核苷酸。在逆转录所得cdna中以限定的u/t比例将尿嘧啶(u)掺入胸腺嘧啶(t)的位置。用尿嘧啶dna糖基化酶/脱嘌呤内切核酸酶(udg/apei)来将cdna片段化。末端转移酶将多个拷贝的单一多核苷酸添加至所述片段。用侧接引物tt04和tt05来纳入用于高通量测序的衔接子序列。
[0068]
图7:显示通过连接来条码化核酸的方法。发夹条码化寡核苷酸被合成在固体支持物(例如,珠)上,使得寡核苷酸含有游离的3’可供后续聚合和/或连接(例如,采用反式亚磷酰胺合成法)。只显示了两个由固体支持物固定化的带条码发夹寡核苷酸。所述寡核苷酸可通过二硫桥连接到固体支持物上。尿嘧啶可用在寡核苷酸序列的5’末端区(例如,作为第一个碱基)。一些情况中,5’末端区尿嘧啶是5’硫醇带修饰尿嘧啶(例如,5
′‑
硫醇(硫代已基;c6修饰)。尿嘧啶也可被纳入发夹区。含有发夹条码化寡核苷酸的固体支持物可被划分(例如,划分成含有靶核酸或靶细胞的划分产物)。划分产物中,可能存在的二硫桥可被切割而从固体支持物上释放寡核苷酸。类似地,可进行尿嘧啶切除来释放寡核苷酸,切割发夹区和/或提供游离5’供连接至双链靶核酸(例如,基因组片段、cdna等)。然后,经切割和/或切除的发夹条码化寡核苷酸可连接至双链靶核酸。一些情况中,在连接得到带切口dna产物前没有去除(例如,通过切除近端尿嘧啶)寡核苷酸的5’端硫(底部)。
[0069]
图8:显示通过连接来条码化核酸的方法。发夹条码化寡核苷酸被合成在固体支持物(例如,珠)上,使得寡核苷酸含有游离的3’可供后续聚合和/或连接(例如,采用反式亚磷酰胺合成法)。只显示了两个由固体支持物固定化的带条码发夹寡核苷酸。所述寡核苷酸可通过二硫桥连接到固体支持物上。尿嘧啶可用在寡核苷酸序列的5’末端区(例如,作为第一个碱基)。一些情况中,5’末端区尿嘧啶是5’硫醇带修饰尿嘧啶(例如,5
′‑
硫醇(硫代己基;c6修饰)。尿嘧啶也可被纳入发夹区。可由dna聚合酶接触固体支持物所结合的寡核苷酸来延伸发夹寡核苷酸的3’端并拷贝条码序列。含有发夹条码化寡核苷酸的固体支持物可被划分(例如,划分成含有靶核酸或靶细胞的划分产物)。划分可在dna聚合酶接触以延伸发夹寡核苷酸3’端之前或之后进行。划分产物中,可能存在的二硫桥可被切割而从固体支持物上释放寡核苷酸。类似地,可进行尿嘧啶切除来释放寡核苷酸,切割发夹区和/或提供游离5’供连接至双链靶核酸(例如,基因组片段、cdna等)。然后,经切割和/或切除的发夹条码化寡核苷酸可连接至双链靶核酸。一些情况中,在连接得到带切口的dna产物前没有去除(例如,通过切除近端尿嘧啶)寡核苷酸的5’端硫(底部)。
[0070]
图9:显示通过连接来条码化核酸的方法。条码化寡核苷酸被合成在固体支持物(例如,珠)上,使得寡核苷酸含有游离的3’可供后续聚合和/或连接(例如,采用反式亚磷酰
胺合成法)。只显示了两个由固体支持物固定化的带条码寡核苷酸。所述寡核苷酸可通过二硫桥连接到固体支持物上。引物可杂交至条码寡核苷酸的3’端。dna聚合酶可接触寡核苷酸来产生双链产物。引物可在5’端钝化(例如有oh基团)使得双链产物只有上方链可连接。固定有链化条码化寡核苷酸的固体支持物可被划分(例如,划分成含有靶核酸或靶细胞的划分产物)。划分可在接触dna聚合酶以产生双链条码化寡核苷酸之前或之后进行。划分产物中,可能存在的二硫桥可被切割而从固体支持物上释放寡核苷酸。然后,经切割的条码化寡核苷酸可连接至双链靶核酸。以5’oh结尾的寡核苷酸只能通过3’连接。
[0071]
图10:显示通过连接来条码化核酸的方法。条码化寡核苷酸被合成在固体支持物(例如,珠)上,使得寡核苷酸含有游离的3’可供后续聚合和/或连接(例如,采用反式亚磷酰胺合成法)。只显示了两个由固体支持物固定化的带条码寡核苷酸。所述寡核苷酸可通过二硫桥连接到固体支持物上。引物可杂交至条码寡核苷酸的3’端。引物可在5’端钝化(例如有oh基团)使得引物的5’端不能被连接。固定有链化条码化寡核苷酸的固体支持物可被划分(例如,划分成含有靶核酸或靶细胞的划分产物)。回复可在引物杂交之前或之后进行。划分产物中,可能存在的二硫桥可被切割而从固体支持物上释放寡核苷酸。然后,经切割的条码化寡核苷酸可连接至双链靶核酸。以5’oh结尾的寡核苷酸只能通过3’连接。然后,可进行切口翻译dna合成来拷贝衔接子的下方链,其包括粒子条码序列和通用衔接子序列。切口翻译可在划分产物中进行或在合并划分产物后进行。
[0072]
图11:显示将条码化寡核苷酸珠划分成多个单细胞划分产物用于单细胞rna-seq的工作流程。
[0073]
图12:显示采用条码化寡核苷酸珠供高通量cdna测序的方法的示意图。该示意图中,在固体支持物粒子上产生具有粒子条码和分子条码的条码(bc)寡核苷酸。所述寡核苷酸可通过二硫桥连接到固体支持物上。寡核苷酸可含有游离的3’供后续杂交和聚合或转化成可连接(例如,双链化)的末端。寡核苷酸可具有含约15到约20个或约15到约35个胸腺嘧啶核苷酸的聚胸苷区用于mrna捕获。寡核苷酸可具有5’位的通用标签。5’通用标签可包括来自p5衔接子(illumina)的rd1序列或与rd1序列互补的序列。划分产物中,含有核酸的样品可与寡核苷酸条码化的珠一起接受划分。样品可包括细胞。一些情况中,样品和寡核苷酸条码化的珠可划分成使得划分产物平均含有不超过1个珠和/或细胞。划分产物中,细胞可被裂解。划分产物中,寡核苷酸可从珠上释放。在二硫键连接寡核苷酸至固体支持物时,寡核苷酸释放可用还原剂实现。发生寡核苷酸与核酸靶标的杂交,并且底物被聚合。靶核酸可以是rna。聚合可以是逆转录。划分产物可被合并。若划分产物是液滴,可通过使用去污剂破乳。或者,在寡核苷酸杂交至核酸靶标后,划分产物被合并而且在整体反应(bulk reaction)中发生聚合。外切核酸酶i可用来消化未结合的引物。产物可纯化,例如用ampure珠纯化。靶核酸用寡核苷酸扩增,所述寡核苷酸与底物中的靶序列互补并与条码寡核苷酸的通用部分互补。这些寡核苷酸可进一步以通用引物序列加尾。产物可纯化,例如用ampure珠纯化。进一步扩增可用与头道扩增反应产物杂交的寡核苷酸来进行。寡核苷酸可进一步接有通用引物序列并带有用于新一代测序的标引(index)。产物可进一步纯化,例如用ampure珠纯化。发明详述i.引言
[0074]
本文记载用于核酸分析的方法、组合物和试剂盒。所述的方法、组合物和试剂盒可用于,例如,单细胞水平的细胞分析。在一些实施方式中,所述方法利用具有多个寡核苷酸的新型双条码化粒子,所述多个寡核苷酸具有粒子条码和分子条码,粒子条码在所述多个寡核苷酸之间相同或基本相同,而分子条码则是每个寡核苷酸所独有或基本独有的。在多个粒子中,某粒子上的多个寡核苷酸之间粒子条码可以相同或基本相同,但该粒子上的粒子条码与其它粒子上的多个寡核苷酸相比是独特或基本独特的。所述双条码化粒子可用于,例如,在单细胞水平将核酸条码化,其中每个核酸具有能专一性辨识来源细胞的条码以及专一性辨识所述核酸的分子条码。
[0075]
在一些实施方式中,所述方法利用双功能条码模板核酸的新型组合和两个分开的划分步骤,将多个细胞的靶核酸(例如,dna或rna)条码化,使得每个细胞的核酸具有独特性条码。在一些实施方式中,所述方法利用双功能条码化水凝胶粒子的新型库,其中所述双功能条码化水凝胶粒子含有捕获区用于杂交划分产物中单细胞的靶核酸(例如,dna或rna)并将核酸条码化。
[0076]
本文所述的方法、组合物和试剂盒可用于分析多种靶核酸。一些情况中,分析的是单细胞靶核酸(例如基因组dna、rna、mrna、lncrna等)。但是,所述方法、组合物和试剂盒不限于单细胞分析。例如,可提取来自含多个细胞的生物学样品的核酸并进行划分,使得各划分产物含有来自不到一个细胞、一个细胞或者多个细胞的核酸。经划分的核酸可用本文所述的带条码粒子(例如,水凝胶粒子或聚甲基丙烯酸甲酯或聚苯乙烯珠)来条码化。适合的靶核酸底物包括但不限于下述的一种或多种:长片段dna,交联和/或环化的dna片段(例如,来自3c或4c文库),分支dna扩增的产物;来自单一细胞的核酸;来自多细胞生物如秀丽新杆线虫(c.elegans)(参见如clausell-tormos等,chem biol.2008年5月;15(5):427-37)、球体(参见如fennema等,trends biotechnol.2013年2月;31(2):108-15)或外来体(参见如j extracell vesicles.2015年5月29日;4:26760)的核酸。
[0077]
一些情况中,通过划分单一细胞和条码(例如,条码化粒子)以至没有、基本没有、或低于约10%、1%、0.1%、0.01%或0.001%的划分产物含有超过1个细胞或超过1个独特细胞条码序列或粒子条码序列,由此实现核酸的单细胞分析。一些情况中,通过划分单一细胞和条码化粒子以至没有、基本没有、或低于约10%、1%、0.1%、0.01%或0.001%的划分产物含有超过1个细胞或超过1个粒子,由此实现核酸的单细胞分析。ii.组合物
[0078]
在一些实施方式中,本发明提供多个划分产物(例如,至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000或更多划分产物),每个划分产物具有其独有的条码。所述划分产物可进一步含有模板引导的核酸聚合试剂和/或模板引导的核酸聚合产物。示例性的模板引导的核酸聚合试剂包括聚合酶(例如,热稳定dna依赖性聚合物或rna依赖性聚合酶),核苷酸,缓冲剂,盐,寡核苷酸引物等。模板引导的核酸聚合试剂进一步包括用于进行逆转录的试剂。示例性模板引导的核酸聚合产物包括模板引导的核酸聚合产生的条码化核酸。划分产物可兼有或者替代性含有模板引导的核酸连接试剂和/或模板引导的核酸连接产物。示例性的模板引导的核酸连接试剂包括连接酶(例如,dna依赖性连接物或rna依赖性连接酶),核苷酸,缓冲剂,盐,寡核苷酸引物等。示例性的模板引导的核酸连接产物包括由释放自粒子的条码化核苷酸被连接至双链靶核酸而通过模板引导的
核酸连接得到的条码化核酸。多个划分产物可各自含有单细胞或来自单细胞的核酸。一些情况中,多个划分产物可用于以单细胞水平分析多细胞样品的核酸。a.水凝胶
[0079]
在一些实施方式中,各自含有独特划分产物特异性条码的多个划分产物是采用基于水凝胶的工艺所产生。因此,一些情况中,所述多个划分产物含有:水凝胶;双功能条码模板核酸,其具有条码区、正向引物结合位点和反向引物结合位点;构造成连接水凝胶和双功能条码模板的寡核苷酸;和带标记的反向引物,所述反向引物具有捕获区和引物区,其中所述引物区或其部分杂交双功能条码模板核酸的反向引物结合位点或其部分。反向引物还可含有分子条码,所述分子条码专一性辨识反向引物的分子或其聚合酶延伸产物。一些情况中,水凝胶是sol形式。一些情况中,水凝胶是gel形式。示例性水凝胶是琼脂糖水凝胶。其它水凝胶包括但不限于例如下列文件中所述:美国专利号4,438,258、6,534,083、8,008,476、8,329,763;美国专利申请号2002/0,009,591、2013/0,022,569、2013/0,034,592;和国际专利申请号wo/1997/030092与wo/2001/049240。一些情况中,构造成连接水凝胶和条码的所述寡核苷酸含有正向引物部分,该部分与双功能条码模板的正向引物结合位点杂交。
[0080]
在一些实施方式中,各自成连接水凝胶和条码的所述寡核苷酸共价连接至水凝胶。本领域已知共价结合寡核苷酸至一种或多种水凝胶基质的大量方法。仅举一例,醛衍生化琼脂糖可共价连接至合成寡核苷酸的5
’‑
胺基团。因此,各划分产物中,共价连接至水凝胶并含有正向引物部分的寡核苷酸可杂交至双功能条码模板的正向引物结合位点,从而形成多个划分产物,其各自含有连接至寡核苷酸的水凝胶粒子。这种实施方式中,水凝胶还因寡核苷酸的正向引物部分和双功能条码模板的正向引物结合位点之间的杂交而连接于双功能条码模板。一些情况中,寡核苷酸的正向引物部分是t7引物、其部分或其反向互补序列。
[0081]
在一些实施方式中,构造成将水凝胶连接至条码的寡核苷酸偶联于高分子量(例如,至少约5、10、15、20、25、30、35、40、50kda或更大)的聚合物,所述聚合物能被空间约束于gel形式的水凝胶基质内。例如,寡核苷酸可偶联于高分子量线性或支链聚丙烯酰胺。又例如,寡核苷酸可偶联于高分子量核酸。高分子量聚合物寡核苷酸偶联物(例如,线性聚丙烯酰胺寡核苷酸偶联物)可通过与sol水凝胶混合并将该水凝胶硬化成gel形式而纳入水凝胶基质中。一些情况中,所述多个划分产物含有偶联于高分子线性或支链聚丙烯酰胺的寡核苷酸、sol形式的水凝胶和含有独有划分产物特异性条码的双功能条码模板。其它高分子量聚合物适合与寡核苷酸偶联并包封入水凝胶。示例性聚合物包括但不限于:葡聚糖、壳聚糖、苯乙烯化明胶、透明质酸、海藻酸、明胶、聚乙二醇,及其衍生物。
[0082]
一些情况中,通过形成含有一或多个丙烯酰胺-寡核苷酸和多个丙烯酰胺单体的反应混合物并由该反应混合物聚合产生线性聚丙烯酰胺-寡核苷酸偶联物而将寡核苷酸偶联入线性聚丙烯酰胺。可进行该反应来产生多种线性聚丙烯酰胺寡核苷酸偶联物。纳入线性聚丙烯酰胺分子的寡核苷酸的平均数量可通过改变反应条件来控制。例如,可改变下列非限制性反应条件来控制所纳入寡核苷酸的平均数量:ph,温度,入射光强度,聚合反应时间,或寡核苷酸、丙烯酰胺单体、催化剂(例如,temed)或引发剂(例如,核黄素或过硫酸铵)的浓度。
[0083]
双功能条码模板可用正向引物和/或反向引物(例如,带标记反向引物,或具有分
子条码带标记反向引物)来扩增。水凝胶随后可硬化成多个划分产物,其各自含有连接或包封有寡核苷酸的水凝胶粒子。一些情况中,水凝胶在扩增期间是sol形式而在扩增后硬化成gel形式。一些情况中,正向和/或反向引物的结合以及扩增将双功能条码模板从单链核酸分子转化成双链核酸分子。一些情况中,寡核苷酸的正向引物部分是t7引物、其部分或其反向互补序列。一些情况中,用带标记的反向引物扩增给出带标记的双功能条码核酸。一些情况中,标记是生物素标记或其衍生物。
[0084]
一些情况中,寡核苷酸可含有与双功能条码模板的正向引物结合位点杂交的正向引物部分。因此,该实施方式中,寡核苷酸通过杂交和/或此后自所述正向引物的聚合来连接水凝胶粒子与双功能条码模板。
[0085]
双功能条码模板含有条码区。条码区可含有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个条码核苷酸。例如,20个核苷酸的条码区可专一性辨识4
20
个不同的细胞。一些情况中,条码区含有约5到约25个条码核苷酸,约8到约20个条码核苷酸,或者约10到约14个条码核苷酸。
[0086]
一些情况中,双功能条码模板还含有正向引物结合位点和反向引物结合位点。正向引物结合位点与构造成连接水凝胶至双功能条码模板的寡核苷酸中的正向引物或其部分杂交。在一些实施方式中,双功能条码模板在5’端到3’端含有:正向引物结合位点,独特的划分产物特异性或水凝胶粒子条码,和反向引物结合位点。一些情况中,正向引物结合位点是t7引物的结合位点,或其部分。一些情况中,正向引物结合位点是t7引物序列的反向互补序列,或其部分。一些情况中,反向引物结合位点杂交带标记反向引物的引物区或其部分。
[0087]
在一些实施方式中,双功能条码模板可含有额外的核酸序列以提供特定功能。例如,双功能条码模板可含有一或多个额外引物结合位点、条码(例如分子或划分产物特异性的),或者一或多个标记。一些情况中,所述一或多个额外引物结合位点是测序引物结合位点。
[0088]
一些情况中,双功能条码模板作为单链核酸被引入划分产物,通过构造成连接水凝胶至双功能条码模板的寡核苷酸而连接至水凝胶,并通过聚合酶转化成双链核酸。例如,可用正向和/或反向引物来扩增双功能条码模板。一些情况中,扩增产物含有由双功能条码模板提供的划分产物特异性条码和由含有分子条码的带标记反向引物提供的分子条码。
[0089]
一些情况中,反向引物含有与双功能条码模板的反向引物结合位点杂交的引物区和捕获区。捕获区可以是任何下述序列:其反向互补序列能够捕获(例如,杂交)感兴趣的靶核酸或多个靶核酸。例如,捕获区可以是聚腺苷序列(例如,10-25或更多个连续的腺嘌呤核苷酸)。又例如:捕获区的反向互补序列可杂交某基因家族的保守区。再例如:捕获区的反向互补序列能杂交含有两个连续外显子的序列,从而检测自特定基因或基因家族表达的成熟rna。一些情况中,反向引物的捕获区含有一或多个肌苷、硝基吲哚或其它通用核苷酸。
[0090]
捕获区可通过正向引物的引物区杂交至双功能条码模板而连接至水凝胶。引物引发和模板引导的的正向和反向引物的聚合于是可纳入捕获区的反向互补序列。一些情况中,引物引发和模板引导的的反向和正向引物的聚合纳入捕获区的反向互补序列和分子条码。这类情形中,水凝胶随后会共价连接至捕获区。例如,水凝胶可随后被共价连接至聚胸苷序列(例如,10-25或更多个连续的胸腺嘧啶核苷酸)用于捕获细胞的mrna。
[0091]
在一些实施方式中,所述多个划分产物中低于约10%、1%、0.1%、0.05%、0.01%、0.005%、0.001%或更少含有超过一种独特条码或独特条码序列(例如,划分产物特异性条码序列)。在一些实施方式中,所述多个划分产物含有至少1,000、5,000、10,000、15,000、20,000或30,000个划分产物,其各自含有不超过一种独有划分产物特异性条码序列。在一些实施方式中,所述多个划分产物含有至少1,000、5,000、10,000、15,000、20,000或30,000个划分产物,其各自至少90%、95%或更多的划分产物含有独有划分产物特异性条码序列。例如,可对含有双功能条码模板核酸稀释溶液的样品进行划分。或者,样品划分成的划分产物数量可大于双功能条码模板核酸分子的数量。划分产物可各自含有至少10、100、200、300、500、750、1000、2500、5000、7,500、10,000、15,000、20,000、30,000、50,000、100,000、1x106、1x107或更多拷贝的划分产物特异性条码,其中这些拷贝在同一划分产物的划分产物特异性条码序列之间是相同或基本相同的,而相对其它划分产物中的划分产物特异性条码则是独特或基本独特的。
[0092]
一些情况中,划分所提供的划分产物不含任何双功能条码模板核酸,因此不含有条码。此类划分产物被称为“空白”划分产物,但本领域技术人员知道这些划分产物可能含有其它分子,包括但不限于模板引导的核酸聚合试剂或靶核酸。
[0093]
一些情况中,空白划分产物可与含有条码的划分产物相分离。例如,各份划分产物中,双功能条码模板核酸可用正向和/或反向引物来扩增。此后划分产物可基于扩增产物的存在与否采用本领域已知方法来分离。例如,可检测插入型染料的荧光增强。
[0094]
一些情况中,在水凝胶是gel形式并将形成水凝胶粒子时合并所述多个划分产物(例如,在扩增之前或之后),条码化粒子与不含条码的粒子被分开。例如,采用本领域已知方法,含有与带标记反向引物相对应标记(例如,生物素标记)的粒子可与不含该标记的划分产物分开。
[0095]
在一些实施方式中,所述多个划分产物含有独特条码化(例如,划分产物各自具有独有划分产物特异性条码)的水凝胶(例如,sol或gel),并且各划分产物中还含有单一细胞、来自单细胞的核酸或来自多个细胞的核酸。例如,可提供多个gel形式的水凝胶粒子,这些粒子各自含有独特条码(例如独特的粒子条码).所述粒子可与多个细胞混合,并划分成具有条码化水凝胶粒子和单一细胞或来自单细胞的核酸的多个划分产物。或者,可形成各自具有单一细胞的多个划分产物,所述细胞可选被裂解,且随后使条码化粒子(例如,各自具有粒子条码的粒子)被纳入所述多个划分产物内。又或者,可形成各自具有条码化水凝胶的多个划分产物(例如,各自具有独有粒子条码)然后使细胞被纳入其中。再或者,可形成各自具有条码化水凝胶的多个划分产物和各自含有单一细胞或来自单细胞的核酸的多个划分产物。含条码化水凝胶的划分产物随后可与含单一细胞/核酸的划分产物合并来形成含有条码化水凝胶和单一细胞或来自单细胞的核酸的多个划分产物。通常,进行这些方法使得多数、大多数、至少90%、95%、99%或更多的划分产物各自含有唯一独特划分产物特异性条码序列。例如,各划分产物可含有一至数百万拷贝或更多拷贝的唯一独特划分产物特异性条码序列。一些情况中,所述划分产物还含有多条独特分子条码序列,这些序列为划分产物内各分子条码化核酸分子所独有或基本独有。
[0096]
一些情况中,划分产物可在裂解条件裂解划分产物中的细胞,从而形成具有条码化水凝胶粒子和来自单细胞的核酸的多个划分产物。一些情况中,划分产物可被加热以裂
解细胞并熔化水凝胶,从而形成具有sol水凝胶和来自单细胞的核酸的多个划分产物。
[0097]
在一些实施方式中,本发明提供水凝胶粒子,其中所述水凝胶粒子含有gel形式的水凝胶和含有单链双功能条码模板核酸的寡核苷酸,其中双功能条码的第一末端偶联至水凝胶或偶联至包封于水凝胶基质中的聚丙烯酰胺,而其第二末端具有捕获区。在一些实施方式中,本发明提供一组此类粒子(例如,至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000、50,000、75,000、100,000、250,000、500,000、1x106或更多水凝胶粒子),各粒子具有独特条码序列。
[0098]
捕获区可以是任何下述序列:其反向互补序列能够捕获(例如,杂交)感兴趣的靶核酸或多个靶核酸。例如,捕获区可以是聚腺苷序列(例如,10-25或更多个连续的腺嘌呤核苷酸)。又例如:捕获区的反向互补序列可杂交某基因家族的保守区。再例如:捕获区的反向互补序列能杂交含有两个连续外显子的序列,从而检测自特定基因或基因家族表达的成熟rna。一些情况中,反向引物的捕获区含有一或多个肌苷、硝基吲哚或其它通用核苷酸。
[0099]
一些情况中,水凝胶粒子或水凝胶粒子组的双功能条码可还含有多个引物结合位点。例如,可包括t7引物结合位点或其反向互补序列供靶核酸的无偏扩增。又例如,双功能条码可包括一或多个测序引物结合位点或其反向互补序列。b.无需水凝胶的条码化粒子或划分产物
[0100]
在一些实施方式中,提供无需水凝胶的条码化粒子或含有此类条码化粒子的划分产物。。例如,条码可用标准寡核苷酸合成方法合成在固相支持物粒子上。一些情况中,条码化粒子(例如,至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000、50,000、75,000、100,000、250,000、500,000、or1x106个粒子)含有独有粒子条码。例如,各粒子可含有多个寡核苷酸,其中该粒子的每个寡核苷酸含有相同或基本相同的条码序列。一些情况中,划分所述条码化粒子,以至全部、基本全部或至少90%、95%、99%或更多的划分产物含有不超过1个粒子,由此提供了含有独特性条码的多个划分产物。
[0101]
一些情形中,条码化粒子包含固相支持面,所述固相支持面具有多个寡核苷酸引物偶联其上,其中所述多个寡核苷酸引物包含:第一限定序列,其具有10-100个核苷酸的限定序列;具有6-20个核苷酸的粒子条码,其中所述多个寡核苷酸引物中多数、全部或基本全部含有相同的粒子条码序列。一些情况中,条码化粒子自3’到5’含有:所述第一限定序列,和所述粒子条码。其它情况中,条码化粒子自5’到3’含有:所述第一限定序列,和所述粒子条码。
[0102]
一些情况中,提供双条码化粒子。例如,双条码化粒子可含有多个寡核苷酸,各寡核苷酸含有对该粒子独有的细胞/粒子条码和多个各寡核苷酸独有的分子条码。一些情形中,双条码化粒子包含固相支持面,所述固相支持面具有多个寡核苷酸引物偶联其上,其中所述多个寡核苷酸引物包含:含有10-100个核苷酸的限定序列的第一限定区;含有6-20个核苷酸的粒子条码,其中所述多个寡核苷酸引物中全部、基本全部或多数包含相同的粒子条码;和含有6-20个核苷酸的分子条码,其中所述多个寡核苷酸引物中全部或基本全部包含独特性分子条码。一些情况中,双条码化粒子自3’到5’含有:所述第一限定序列,所述粒子条码和所述分子条码。其它情况中,条码化粒子自5’到3’含有:所述第一限定序列,所述粒子条码,和所述分子条码。本领域技术人员会理解粒子条码和分子条码的相对位置可以改变。例如,一些情况中,双条码化粒子含有的粒子条码在分子条码的5’。其它情况中,双条
码化粒子含有的粒子条码在分子条码的3’。
[0103]
一些情况中,条码化粒子或双条码化粒子的多个寡核苷酸含有切割区。例如,切割区可邻近固体支持物。因此,切割区可构造成能使寡核苷酸从固体支持物上切割。一些情况中,切割区含有至少一个尿嘧啶核苷酸。一些情况中,切割区含有内切核酸酶识别位点。一些情况中,切割区是酸或碱不稳定键。一些情况中,切割区含有二硫接头。一些情况中,切割区含有5’硫醇带修饰尿嘧啶(例如,5
′‑
硫醇(硫代己基;c6修饰)。一些情况中,切割区在所述寡核苷酸的5’端或其邻近。例如,寡核苷酸可在5’端偶联至固体支持物,而5’端或其邻近的切割区使得寡核苷酸能从固体支持物上切下。其它情况中,切割区在3’端或其邻近。例如,寡核苷酸可在3’端偶联至固体支持物,而3’端或其邻近的切割区使得寡核苷酸能从固体支持物上切下。
[0104]
一些情况中,第一限定区是捕获区。条码化粒子、双条码化粒子或粒子组的捕获区可以是能够捕获(例如,杂交)感兴趣的靶核酸或多个靶核酸的任何序列。例如,捕获区可以是聚胸苷序列(例如,10-25或更多个连续的胸腺嘧啶核苷酸)。又例如,捕获区可杂交某基因家族的保守区。再例如,捕获区能杂交含有两个连续外显子的序列,从而检测自特定基因或基因家族表达的成熟rna。一些情况中,捕获区含有一或多个肌苷、硝基吲哚或其它通用核苷酸。
[0105]
一些情况中,条码化粒子、双条码化粒子或粒子组可还含有多个引物结合位点。例如,可包括t7引物结合位点或其反向互补序列供靶核酸的无偏扩增。又例如,粒子可包括一或多个测序引物结合位点或其反向互补序列。
[0106]
适用于条码化或双条码粒子的固体支持物包括调孔玻璃(cpg)(可购自glen research公司,弗吉尼亚州斯特灵),草酰-调孔玻璃(参见如alul等,nucleic acids research 1991,19,1527),tentagel支持物-一种氨基聚乙二醇衍生化支持物(参见如wright等,tetrahedron letters 1993,34,3373),聚苯乙烯,poros-聚苯乙烯/二乙烯基苯的共聚物,或可逆交联的丙烯酰胺。很多其它固体支持物市售可得且适用于本发明。
[0107]
一些情况中,提供多个(例如,至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000、50,000、75,000、100,000、250,000、500,000、1x106或更多)的条码化或双条码化粒子。
[0108]
在一些实施方式中,提供多个划分产物(例如,至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000、50,000、75,000、100,000、250,000、500,000、1x106或更多划分产物),所述多个划分产物各自含有多个寡核苷酸,这些寡核苷酸具有划分产物特异性条码和分子条码,所述划分产物特异性条码划分产物内相同或基本相同但划分产物间彼此独特,而分子条码则是寡核苷酸分子独有性的。一些情况中,所述寡核苷酸偶联至固体支持物粒子,例如固体支持物珠。其它情况中,所述寡核苷酸没有偶联。一些情况中,所述划分产物含有固体支持物粒子和多个寡核苷酸,其中所述多个寡核苷酸已从所述固体支持物粒子切下。c.用于产生具有均一大小分布的已扩增核酸或cdna的组合物
[0109]
此处所述为含有限定utp/ttp或dutp/dttp比例的试剂或试剂混合物。所述比例通常小于1。一些情况中,该比值是1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90或1/100或更低。一些情况中,该比值是1∶2、1/
3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90或1/100。以限定比例含有utp和ttp,或者dutp和dttp的混合物可用于靶核酸的逆转录和/或扩增过程中。这样,u和t以限定的比例掺入聚合所得核酸。因此,所述试剂混合物还可含有聚合酶、缓冲剂、盐、引物(例如,条码化引物)和其它核苷酸。
[0110]
聚合所得(例如,扩增所得,逆转录所得等)核酸可随后用udg/apei处理来产生具有均一大小分布的核酸片段。这种片段化可以非显著时间依赖性的方式进行。例如,不象其它酶促或物理片段化方法,所述片段化不会随着处理步骤继续而产生更小的片段。相反,假定反应进行足够长时间并使用足量udg/apei,片段的大小分布由u对t之比决定。u相对t的浓度越高,掺入聚合所得链的尿嘧啶核苷酸就越多。掺入的尿嘧啶核苷酸越多,片段化程度就越高。
[0111]
因此,在此还记载了含有条码化(例如,细胞和/或分子条码化)脱氧核糖核酸(dna)(例如,扩增和/或逆转录所得)的反应混合物,其中的dna含有尿嘧啶核苷酸以限定的u对t之比替代胸腺嘧啶核苷酸。一些情况中,该比值是约1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90、1/100或更低。一些情况中,该比值是1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90或1/100。反应混合物还可含有udg/apei。一些情况中,反应混合物在液滴或其它划分产物中。一些情况中,反应混合物还含有末端转移酶。
[0112]
在此还记载含有靶标条码化(例如,粒子和/或分子条码化)脱氧核糖核酸(dna)的反应混合物。靶标条码化dna可以是,例如,从rna如mrna扩增和/或逆转录所得。靶标条码化dna可以不含尿嘧啶核苷酸,并可具有均一的大小分布。可通过从条码化寡核苷酸聚合或连接条码化寡核苷酸来将条码接上靶dna来使所述dna条码化。条码化寡核苷酸可含有粒子和/或分子条码化区,可选有供dna底物杂交的捕获区,和限定序列(例如,通用引物结合位点)。条码化靶标dna可用寡核苷酸群来扩增,该寡核苷酸群杂交靶标条码化dna底物使得所杂交引物之间的距离呈均一的大小分布。相邻寡核苷酸引发位点间的距离可以是例如相隔(平均)约25、50、100、200、300、400、500、600、700、800、900、1000个核苷酸。杂交至条码化靶标dna的寡核苷酸引物的聚合可提供具有均一大小分布的多个聚合产物。一些情况中,反应混合物在液滴或其它划分产物中。iii.方法
[0113]
提供各自具有独特条码序列的多个划分产物的制备方法。还提供各自具有独特双功能条码的多个粒子的制备方法。这些方法包括需要水凝胶和不依赖于使用水凝胶的那些方法。a.具有独特条码的水凝胶粒子或划分产物的制备方去
[0114]
在一些实施方式中,具有独特的划分产物特异性、粒子或细胞条码的粒子或划分产物的制备方法包括:混合sol水凝胶和寡核苷酸偶联物,混合时存在(i)带标记反向引物;(ii)dna扩增试剂和(iii)双功能条码模板核酸(例如,单链双功能条码模板核酸),其具有条码区、含正向引物结合位点的第一末端和含反向引物结合位点的第二末端,混合形成混合物并随后划分所述混合物。一些情况中,寡核苷酸偶联物是线性聚丙烯酰胺寡核苷酸偶联物。一些情况中,寡核苷酸偶联物直接偶联至水凝胶。一些情况中,双功能条码模板存在于混合物中的浓度使得所述多个划分产物中至少约90%、95%、99.5%或更多含有不超过1
种独特条码分子。
[0115]
一些情况中,所述方法还包括在划分产物中进行dna扩增来扩增所述双功能条码模板核酸从而将双功能条码模板核酸共价连接到寡核苷酸偶联物。一些情况中,dna扩增是用寡核苷酸偶联物编码的正向引物和/或带标记反向引物来扩增。一些情况中,扩增是pcr扩增。一些情况中,扩增产生双链的双功能条码模板核酸.
[0116]
一些情况中,带标记反向引物含有捕获区,该捕获区在聚合和/或扩增步骤中连接至水凝胶。捕获区可以是任何下述序列:其反向互补序列能够捕获(例如,杂交)感兴趣的靶核酸或多个靶核酸。例如,捕获区可以是聚腺苷序列(例如,10-25或更多个连续的腺嘌呤核苷酸)。又例如:捕获区的反向互补序列可杂交某基因家族的保守区。再例如:捕获区的反向互补序列能杂交含有两个连续外显子的序列,从而检测自特定基因或基因家族表达的成熟rna。一些情况中,反向引物的捕获区含有一或多个肌苷、硝基吲哚或其它通用核苷酸。
[0117]
一些情况中,捕获区是随机序列(例如,随机五聚体、六聚体、七聚体或八聚体)。具有随机序列捕获区的条码化粒子可用来杂交、条码化、扩增和/或测序具有未知序列的靶标dna。一些情况中,随机序列可用来杂交、条码化、扩增和/或测序长片段dna靶标。例如,随机序列可杂交至长片段dna靶标的多个位置并产生多个条码化子片段用于后续分析。这些条码化的子片段(例如,单个划分产物中的子片段)可能含有共同的长dna片段条码和/或独特分子条码。
[0118]
一些情况中,所述方法还包括硬化所述sol水凝胶成gel形式来产生多个带标记水凝胶粒子,每个粒子在一个划分产物中,且各粒子含有寡核苷酸偶联物,所述寡核苷酸偶联物共价连接至双功能条码模板核酸,而且各带标记水凝胶粒子含有独特条码序列。一些情况中,各粒子还可含有多个分子条码序列。一些情况中,可合并这些划分产物获得一组带标记水凝胶粒子,其各自含有独特条码序列。
[0119]
本文所述的水凝胶粒子(例如,含有分子和/或细胞/粒子条码的粒子)可含有大量寡核苷酸。通常,粒子上连接有1,000、10,000、100,000、1x106、1x107或更多的寡核苷酸。
[0120]
在一些实施方式中,带标记水凝胶粒子可与不带标记的水凝胶粒子分开,例如,采用对所述标记有亲和性的结合于固体支持物的亲和试剂。例如,亲和试剂可接触所述粒子和不带标记的粒子,从而通过清洗固体支持物来去除未结合的水凝胶粒子。
[0121]
在一些实施方式中,带标记的水凝胶粒子具有双链核酸,其含有独特条码和捕获区并可选含有分子条码,这些水凝胶粒子可随后被进一步处理以产生具有单链核酸的水凝胶粒子,所述单链核酸含有独特条码和捕获区和可选的分子条码。例如,一些情况中,各自含有独特条码序列的带标记水凝胶粒子或带标记水凝胶粒子组被处理以去除标记,去除带标记反向引物,和/或去除由带标记反向引物聚合或扩增得到的带标记单链或双链产物。一些情况中,所述带标记水凝胶粒子可用对所述标记有亲和性的亲和试剂捕获,并且所述粒子随后经受核酸变性条件。示例性的核酸变性条件包括热或碱变性或其组合。一些情况中,碱变性是通过使带标记水凝胶粒子(单或多个)接触碱性氢氧化物或其它碱来进行。然后可回收所述水凝胶粒子或粒子组,而标记仍结合于亲和试剂。
[0122]
在一些实施方式中,各自具有独特条码的多个水凝胶粒子被划分成多个划分产物。一些情况中,水凝胶粒子各自具有独特条码和多个分子条码。一些情况中,进行划分的条件使得全部、基本全部或多数的划分产物含有不超过1个水凝胶粒子。一些情况中,进行
划分的条件使得每个划分产物、基本全部或多数划分产物含有水凝胶粒子。一些情况中,不含有水凝胶粒子的划分产物与含有水凝胶粒子的划分产物被分开。例如,可通过光学分选(例如,荧光活化的粒子分选)、基于体积的分选(例如,使用库尔特原理)或基于密度的分选(例如,离心)去除没有水凝胶粒子的划分产物。
[0123]
一些情况中,在多个细胞的存在下划分水凝胶粒子,使得各划分产物含有水凝胶粒子和单一细胞或来自单细胞的核酸。一些情况中,在多个细胞的存在下划分水凝胶粒子,使得各划分产物含有水凝胶粒子和单一细胞,然后这些细胞可被裂解。一些情况中,在多个细胞的存在下和细胞裂解剂(例如,去污剂)的存在下划分水凝胶粒子,使得划分后这些细胞在划分产物中裂解。一些情况中,处理(例如,加热)划分产物以裂解划分在其内的细胞。
[0124]
或者,可形成各自具有单一细胞的多个划分产物,所述细胞可选被裂解,且随后使条码化粒子纳入所述多个划分产物内。又或者,可形成各自具有条码化水凝胶的多个划分产物并使细胞纳入其中。再或者,可形成各自具有条码化水凝胶的多个划分产物和各自含有单一细胞或来自单细胞的核酸的多个划分产物。含水凝胶的划分产物随后可与含单一细胞/核酸的划分产物合并来形成含有条码化水凝胶和单一细胞或来自单细胞的核酸的多个划分产物。
[0125]
在一些实施方式中,在模板引导的核酸聚合试剂的存在下形成划分产物。示例性的模板引导的核酸聚合试剂包括聚合酶(例如,热稳定dna依赖性聚合物或逆转录酶),核苷酸,缓冲剂,盐,寡核苷酸引物等。模板引导的核酸聚合试剂进一步包括用于进行逆转录的试剂。
[0126]
在一些实施方式中,含有单一细胞的划分产物或含有水凝胶粒子和单一细胞的划分产物被裂解。可用本领域已知方法裂解细胞。裂解细胞的示例性方法包括加热划分产物或将去污剂纳入划分产物。一些情况中,细胞在dna扩增期间(例如,热循环期间)和/或逆转录期间被裂解。
[0127]
制备和使用水凝胶例如条码化水凝胶的其它组合物和方法包括文献所述,例如,klein等,cell.2015年5月21日;161(5):1187-201。b.具有独特性条码且无需水凝胶的粒子或划分产物的制备方法
[0128]
具有独特性粒子或细胞条码而无需水凝胶的粒子可以合成得到。一些情况中,所述粒子可在标准寡核苷酸合成仪中合成。另外,所述合成可以人工进行。寡核苷酸合成可采用本领域已知方法自3’向5’,或自5’向3’进行。合成寡核苷酸的方法包括转化成亚磷酰胺然后用固相化学法。代表性的固相技术是采用标准亚磷酰胺化学方法的dna和rna合成所用的那些技术。(参见如protocols for oligonucleotides and analogs(寡核苷酸和类似物方法),agrawal,s.编著,胡马纳出版社(humana press),新泽西州托托瓦,1993)。用于此类合成的设备有多家供应商,包括应用生物系统公司(applied biosystems)。
[0129]
进行固相寡核苷酸合成的任意粒子均可适用。适用于条码化或粒子的固体支持物包括调孔玻璃(cpg)(可购自glen research公司,弗吉尼亚州斯特灵),草酰-调孔玻璃(参见如alul等,nucleic acids research 1991,19,1527),tentagel支持物-一种氨基聚乙二醇衍生化支持物(参见如wright等,tetrahedron letters 1993,34,3373)或poros-聚苯乙烯/二乙烯基苯的共聚物。很多其它固体支持物市售可得且适用于本发明。
[0130]
在一些实施方式中,粒子的合成采用拆分、偶联和混合方法来产生粒子条码。一些
情况中,可通过提供多个粒子用于进行固相寡核苷酸合成来进行拆分与混合法。一些情况中,粒子上偶联了寡核苷酸。例如,进行拆分、偶联和混合法来产生粒子条码前,粒子可以已经偶联有第一限定或第二限定区。例如,进行拆分、偶联和混合法来产生粒子条码之前,粒子可以已经偶联有分子条码。
[0131]
所提供的粒子可拆分入四个不同的反应混合物,每个反应混合物分别将不同的核苷酸偶联至粒子。例如,第一反应混合物偶联腺嘌呤,第二反应混合物偶联鸟嘌呤,第三反应混合物偶联胞嘧啶,而第四反应混合物偶联胸腺嘧啶。偶联完成后,四个不同反应混合物的产物被合并、混合,再拆分入四个不同的反应混合物,每个反应混合物分别将不同的核苷酸偶联至粒子。可重复拆分、偶联和混合来为各粒子产生任意长的独有条码。通常,重复次数能使粒子条码的长度及由此得到的可能的粒子条码序列的数量大大超过粒子数量(例如,至少2倍、10倍、100倍或更多倍)。例如,若粒子数量是103,那么要产生含有至少100,000个可能序列的条码,可以通过重复拆分、偶联和混合至少9次以制备含有49(=262,144)个可能序列的条码。
[0132]
一些情况中,所述拆分、偶联和混合被重复约1-50次、约2-20次、约5-20次、约6-20次、约7-20次、约8-20次、约9-20次、约10-20次、约10-14次、或1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25,26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50次。
[0133]
在一些实施方式中,粒子经简并核苷酸合成产生分子条码。例如,可将核苷酸的等摩尔或等动力学混合物偶联至多个粒子。可重复偶联来为各寡核苷酸分子产生任意长的独有条码。通常,重复次数选为使得分子条码的长度及由此得到的可能的分子条码序列的数量大大超过寡核苷酸数量(例如,至少2倍、10倍、100倍或更多倍于此)。例如,若预期粒子含有约106个寡核苷酸,那么简并核苷酸偶联步骤可重复至少10次来产生含有4
12
(=16,777,216)个可能序列的分子条码。
[0134]
一些情况中,所述核苷酸的简并混合物的偶联反应被重复约5-50次、约6-20次、约7-20次、约8-20次、约9-20次、约10-20次、约11-20次、约12-20次、约10-14次、或1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50次。
[0135]
在一些实施方式中,条码化粒子或双条码化粒子接着偶联至第一和/或第二限定区。第一区可含有能杂交靶核酸的捕获区。一些情况中,第一区可含有切割区。第二区可含有用于下游加工的限定区。例如,第二区可含有供引物结合用于扩增和/或测序的限定序列(例如,通用引物结合位点)。又例如,第二区可含有适于连接一种或多种靶多核苷酸的限定序列。再例如,第一区可含有适于连接一种或多种靶多核苷酸的限定序列。又再例如,第一或第二捕获区的限定序列可经寡核苷酸加工(例如,切割、尿嘧啶切除、引物结合、聚合、由末端转移酶添加核苷酸、磷酸化、去磷酸化等)变得适于连接。寡核苷酸加工可包括,例如,寡核苷酸切割、尿嘧啶切除、引物结合、聚合、由末端转移酶添加核苷酸、磷酸化、去磷酸化等。引物结合可包括一或多种寡核苷酸的退火,所述寡核苷酸含有一或多个带修饰核苷酸,例如,含有一或多个尿嘧啶核苷酸,或含有待修饰的5’羟基末端。
[0136]
捕获区可以是能够捕获(例如,杂交)感兴趣的靶核酸或多个靶核酸的任何序列。例如,捕获区可以是聚胸苷序列(例如,10-25或更多个连续的胸腺嘧啶核苷酸)。又例如,捕
获区可杂交某基因家族的保守区。再例如,捕获区能杂交含有两个连续外显子的序列,从而检测自特定基因或基因家族表达的成熟rna。一些情况中,捕获区含有一或多个肌苷、硝基吲哚或其它通用核苷酸。
[0137]
一些情况中,捕获区是随机序列(例如,随机五聚体、六聚体、七聚体或八聚体)。具有随机序列捕获区的条码化粒子可用来杂交、条码化、扩增和/或测序具有未知序列的靶标dna。一些情况中,随机序列可用来杂交、条码化、扩增和/或测序长片段dna靶标。例如,随机序列可杂交至长片段dna靶标的多个位置并产生多个条码化子片段用于后续分析。这些条码化的子片段(例如,单个划分产物中的子片段)可能含有共同的长dna片段条码和/或独特分子条码。
[0138]
本文所述的非水凝胶的寡核苷酸粒子包括但不限于:寡核苷酸固相合成于粒子上形成的非水凝胶粒子(例如,含有分子和/或细胞/粒子条码)可包含大量寡核苷酸。通常,粒子上连接有1,000、10,000、100,000、1x106、1x107或更多的寡核苷酸。
[0139]
制备和使用非水凝胶粒子例如条码化粒子的其它组合物和方法包括文献所述,例如,macosko等,cell.2015年5月21日;161(5):1202-14。c.进行单细胞分析的方法
[0140]
在一些实施方式中,提供单细胞分析的方法例如,可提供划分产物,其中所述划分产物含有:具有条码和捕获区的独特划分产物特异性条码寡核苷酸,单一细胞或来自单细胞的核酸,和用于模板引导的核酸聚合的试剂条码寡核苷酸的捕获区可构造成杂交一个或多个靶核酸,如本文所述。条码寡核苷酸还可含有分子条码,所述分子条码为该划分产物内或该组划分产物中每个划分产物内的每个条码寡核苷酸分子所独有的。在一些实施方式中,条码寡核苷酸偶联至水凝胶。在一些实施方式中,条码寡核苷酸偶联至高分子量聚合物,而所述划分产物另含有水凝胶。在一些实施方式中,条码寡核苷酸偶联至固体支持物。在一些实施方式中,条码寡核苷酸不偶联至水凝胶、高分子量聚合物或固体支持物。
[0141]
在一些实施方式中,提供单细胞分析的高通量方法例如,可提供一组划分产物,该组划分产物(例如,至少100、200、300、500、750、1000、2500、5000、7500、10,000、15,000、20,000、30,000、50,000、75,000、100,000、250,000、500,000、或1x106个划分产物)各自含有:具有独有划分产物特异性条码和捕获区的条码寡核苷酸,单一细胞或来自单细胞的核酸,和用于模板引导的核酸聚合的试剂。
[0142]
一些情况中,所述划分产物或划分产物组含有水凝胶(例如,sol或gel形式的)。例如,划分产物或划分产物组可含有偶联于水凝胶的双功能条码,所述双功能条码具有条码区和捕获区。一些情况中,所述双功能条码可具有多个条码区,例如分子条码区和粒子条码区。一些情况中,所述划分产物组可含有偶联于高分子量聚合物如线性聚丙烯酰胺的双功能条码。一些情况中,偶联于高分子量聚合物的双功能条码被包封在gel形式的水凝胶基质中。一些情况中,划分产物各自含有gel形式的水凝胶和单一细胞,且所述水凝胶通过加热转换成sol形式。一些情况中,在水凝胶转换成sol后,sol水凝胶在划分产物中稀释,使其在室温下不再形成gel形式。
[0143]
在一些实施方式中,划分产物含有连接于固体支持物的寡核苷酸(例如,划分产物特异性和/或分子条码寡核苷酸)。在一些实施方式中,连接于固体支持物的寡核苷酸被从固体支持物上切下,所述切割是在划分产物中或在划分产物后续合并后(例如,在连接、杂
交、聚合和/或扩增后划分产物的合并以后)进行。切割方法包括但不限于:改变ph或使寡核苷酸接触udg/apei或限制性内切酶。一些情况中,寡核苷酸通过二硫桥连接在固体支持物上(例如,通过固体支持物上的硫和共价结合在寡核苷酸5’或3’端或中间核酸的硫之间的二硫键)。这类情况中,可通过使固体支持物接触还原剂来切下所述寡核苷酸,所述还原剂例如硫醇或膦试剂,包括但不限于β-巯基乙醇、二硫苏糖醇(dtt)或三(2-羧基乙基)膦(tcep)。
[0144]
在一些实施方式中,所述划分产物或划分产物组含有单一细胞或该组划分产物各自含有单一细胞。这些细胞可通过本领域已知的任何方法裂解,包括但不限于加热或接触去污剂。裂解后,所述划分产物或划分产物组含有来自单细胞的核酸。
[0145]
所述划分产物中或划分产物组内每一个中的来自单细胞的核酸可通过在划分产物中进行模板引导的核酸聚合而被条码化,其中所述聚合由条码化寡核苷酸的捕获区引发。例如,捕获区可杂交细胞中靶核酸(一或多种),再进行聚合。一些情况中,捕获区含有聚胸苷序列并杂交细胞的mrna。这类情况中,聚合可包括逆转录。作为补充或替代,聚合可包括扩增rna、mrna、microrna、dna或cdna。
[0146]
由条码化寡核苷酸的捕获区引发的聚合可由此将细胞的核酸或其聚合产物(例如,扩增子、cdna等)条码化。条码化的核酸可由此含有特定条码,该条码能专一性辨识核酸来源的单一细胞。一些情况中,条码化寡核苷酸还含有分子条码,且条码化的核酸可由此含有特定条码,该条码能能专一性辨识核酸来源的核酸分子。核酸被条码化以后,可从所述划分产物或划分产物组回收所述核酸用于下游处理。例如,可对条码化的核酸进行测序(例如,高通量测序)。作为补充或替代,可对条码化的核酸进行基因分型。
[0147]
在一些实施方式中,条码化核酸文库可被片段化以活动具有所需大小或大小分布的核酸产物。片段化的方法是本领域已知的,包括物理方法如超声或剪切,化学方法和酶促方法(例如,dna酶i)。一些情况中,可在限定比例的utp和ttp或者dutp和dttp的存在下产生条码化核酸,从而以该限定比例将尿嘧啶掺入胸腺嘧啶的位置。一些情况中,u对t的比值是1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90或1/100或更低。一些情况中,该比值是1∶2、1/3、1/4、1/5、1/6、1/7、1/8、1/9、1/10、1/15、1/20、1/25、1/30、1/40、1/50、1/70、1/75、1/80、1/90或1/100。此类情况中,核酸可通过接触udg/apei而被片段化。
[0148]
片段化的条码化核酸可杂交一或多种额外引物来添加衔接子序列并被扩增。一些情况中,片段化的条码化核酸接触末端转移酶来添加多核苷酸(例如,聚a、聚t、聚g或聚c)以产生一或多个衔接子引物结合位点。或者,片段化的条码化核酸可连接一或多个衔接子寡核苷酸。衔接子可含有测序引物结合位点和可用于定量和/或高通量测序的其它序列。
[0149]
高通量测序和基因分型的方法是本领域已知的。例如,此类测序技术包括但不限于:焦磷酸测序、连接法测序、单分子测序、合成法测序(sbs)、大量同步克隆法、大量同步单分子sbs、大量同步单分子实时法,大量同步单分子纳米孔技术等。morozova和marra提供对一些此类技术的综述,见genomics,92:255(2008),该文在此通过引用全文纳入本文。
[0150]
示例性的dna测序技术包括基于荧光的测序技术(参见如birren等,genome analysis:analyzing dna,1(基因组分析:dna分析,第1卷),纽约冷泉港,该文在此通过引用全文纳入本文)。在一些实施方式中,使用本领域已理解的自动化测序技术。在一些实施
方式中,本技术提供经划分扩增子的同步测序(pct申请号wo 2006/0841,32,该文在此通过引用全文纳入本文)。在一些实施方式中,dna测序的实现是通过同步寡核苷酸延伸(参见如美国专利号5,750,341和6,306,597,两者在此通过引用全文纳入本文)。测序技术的补充示例包括:church多克隆技术(mitra等,2003,analytical biochemistry 320,55-65;shendure等,2005science 309,1728-1732;和美国专利号6,432,360,6,485,944,6,511,803;在此通过引用全文纳入本文),454皮升焦磷酸测序技术(picotiter pyrosequencing technology,margulies等,2005nature 437,376-380;美国公布号2005/0130173;在此通过引用全文纳入本文),solexa单碱基添加技术(bennett等,2005,pharmacogenomics,6,373-382;美国专利号6,787,308和6,833,246;在此通过引用全文纳入本文),lynx大量同步极好测序技术(brenner等,(2000).nat.biotechnol.18:630-634;美国专利号5,695,934,5,714,330;在此通过引用全文纳入本文)和adessi pcr克隆技术(adessi等(2000).nucleic acid res.28,e87;wo 2000/018957;在此通过引用全文纳入本文)。
[0151]
通常,高通量测序都具有大量同步这一共同特征,高通量策略的目的是使成本低于较早的测序方法(参见如voelkerding等,clinical chem.,55:641-658,2009;maclean等,nature rev.microbiol.,7:287-296;两者在此都通过引用全文纳入本文)。此类方法可大致分成通常用和不用模板扩增两大类。需要扩增的方法包括罗氏公司以454技术平台商业化的焦磷酸测序(例如,gs 20和gs flx),illumina销售的solexa平台,和应用生物系统公司(applied biosystems)销售的支持态寡核苷酸连接和检测(supported oligonucleotide ligation and detection,solid)平台。非扩增方法也称为单分子测序,其示例有螺旋生物科学公司(helicos biosciences)销售的heliscope平台,visigen公司、牛津纳米孔技术公司(oxford nanopore technologies)、生命技术公司(life technologies)/离子流(ion torrent)和太平洋生物科学公司销售的平台。
[0152]
焦磷酸测序(voelkerding等,clinical chem.,55:641-658,2009;maclean等,nature rev.microbial.,7:287-296;美国专利号6,210,891和6,258,568;其各自通过引用全文纳入本文)中,模板dna被片段化、末端修复、连接至衔接子、并用珠捕获单模板分子来进行原位克隆性扩增,珠上载有与衔接子互补的寡核苷酸。载有单模板类型的各珠被分入油包水微泡中,模板被克隆性扩增,所用技术被称作乳液pcr。扩增后破乳,珠被置入皮升微孔板(picotitre plate)的各孔内,孔在测序反应中作为流动室。在测序酶和发光报道子如萤光酶的存在下,流动室中发生四种dntp试剂各自的有序迭代引入。合适的dntp被加到测序引物的3

端时,所产生的atp导致孔内发光脉冲,用ccd相机予以记录。能够实现大于或等于400个碱基的读取长度,且能够实现106个序列读取,得到最多达5亿碱基对(mb)的序列。
[0153]
在solexa/illumina平台中(voelkerding等,clinical chem.,55.641-658,2009;maclean等,nature rev.microbial.,7:287-296;美国专利号6,833,246,7,115,400和6,969,488;其各自通过引用全文纳入本文),产生的测序数据较短。该方法中,单链的片段化dna末端修复产生5
′‑
磷酸化钝端,然后由klenow介导添加单一a碱基至这些片段的3

端。添加a便于添加t-突端衔接子寡核苷酸,后者将被用来捕获流动室表面上模板-衔接子分子,流动室中插有寡核苷酸锚。锚被用作pcr引物,但由于模板的长度且其靠近其它邻近的锚寡核苷酸,pcr延伸导致分子“拱跨(arching over)”杂交邻近的锚寡核苷酸在流动室表面形成桥式结构。这些dna环被变性并切割。正链随后通过可逆染料终止子来测序。通过检测纳
入后荧光来确定所纳入核苷酸的序列,在下一轮dntp添加前除去各荧光团和阻断。序列读取长度从36个核苷酸到超过50个核苷酸,总体输出为每次运行分析超过10亿个核苷酸对。
[0154]
用solid技术测序核酸分子(voelkerding等,clinical chem.,55:641-658,2009;maclean等,nature rev.microbial.,7:287-296;美国专利号5,912,148;and 6,130,073;其各自通过引用全文纳入本文)还包括模板片段化,连接寡核苷酸衔接子,与珠结合,以及乳液pcr克隆性扩增。此后,载有模板的珠被固定化在玻璃流动室的衍生化表面,与衔接子寡核苷酸互补的引物发生退火。但该引物并不用作3

延伸,而是用来提供5

磷酸基团供连接至问询探针,这些探针含有两个探针特异性碱基及其后6个简并碱基和四种荧光标记其一。solid系统中,问询探针中每个探针3

的两个碱基有16种可能的组合而在5

端是四种荧光标记之一。荧光颜色,及由此辨识的各探针对应于指定的颜色-空间编码方案。多轮(通常7轮)探针退火、连接和荧光检测后变性,然后用相对初始引物错开一位碱基的引物进行第二轮的测序。以此方式,模板序列可通过计算得以重建,而且模板碱基问询两次,得到更高的精确度。序列读取长度平均为35个核苷酸,总体输出为每次测序运行超过40亿个核苷酸对。
[0155]
某些实施方式中,采用纳米孔测序(参见如astier等,j.am.chem.soc.2006feb.8;128(5)1705-10,通过引用纳入本文)。纳米孔测序的原理涉及纳米孔浸入传导液并跨纳米孔施加电压(伏特)时所发生的现象。这些条件下,可观察到由于离子传导有微弱电流通过纳米孔,而电流的量对纳米孔的大小极度敏感。随着核酸的每个碱基通过该纳米孔,就会导致通过纳米孔的电流幅度有变化,这种变化对于四种碱基的每一种是不同的,从而允许确定dna分子的序列。
[0156]
某些实施方式中,采用螺旋生物科学公司(helicos biosciences corporation)的heliscope(voelkerding等,clinical chem.,55.641-658,2009;maclean等,nature rev.microbial,7:287-296;美国专利号7,169,560,7,282,337,7,482,120,7,501,245,6,818,395,6,911,345和7,501,245;其各自通过引用全文纳入本文)。模板dna被片段化并在3

端多腺苷化,最后的腺苷载有荧光素标记。变性的多腺苷化模板片段连接到流动室表面上的聚(dt)寡核苷酸上。由ccd相机记录被捕获模板的初始物理位置,然后切下并洗去标记。通过添加聚合酶并系列添加带荧光标记的dntp试剂来实现测序。纳入事件产生对应于dntp的荧光信号,而ccd相机在每轮dntp添加前捕捉信号。序列读取长度在25-50个核苷酸,总体输出为每次运行分析超过10亿个核苷酸对。
[0157]
离子流技术的dna测序是基于对dna聚合所释放氢离子的检测(参见如science 327(5970):1190(2010);美国专利申请公布号2009/0026082;2009/0127589;2010/0301398;2010/0197507;2010/0188073和2010/0137143;全部通过引用全文纳入本文用于所有目的)。微孔含有待测序的模板dna链。微孔层下方是超敏isfet离子传感器。所有层都包含在cmos半导体芯片内,该芯片与电子工业中所用的类似。在dntp被纳入生长中的互补链时释放氢离子,触发超敏离子传感器。若模板系列中存在均聚重复系列,单次循环中会纳入多个dntp分子。这导致对应数量的氢释放,和成比例的更高电子信号。这一技术与其它测序技术的区别之处在于不适用带修饰核苷酸和光学元件。离子流测序仪的单碱基精确度为每50碱基读取~99.6%,每次运行产生~100mb。读取长度是100个碱基对。5个重复的均聚重复序列的精确度是~98%。离子半导体测序的优势在于测序速度快且前期和运行成本
低。
[0158]
可适用于本发明的另一示例性核酸测序方法是由stratos genomics公司开发并用到xpandomer分子的测序方法。该测序方法通常包括提供由模板引导的合成产生的子链。该子链通常包括按对应于靶核酸全部或部分的连续核苷酸序列偶联的多个亚单元,各亚单元含有接臂(tether)、至少一个探针或核碱基残基和至少一个选择性可切割的键。选择性可切割的键是被切割来得到xpandomer,其长度大于子链的所述多个亚单元的长度。xpandomer通常包括接臂和报道子元件,报道子元件用以解析序列中对应于靶核酸的全部或部分的连续核苷酸序列的遗传信息。xpandomer随后被测得。对基于xpandomer的方法的补充细节在文献中有记载,例如美国专利公布号2009/0035777,其通过引用全文纳入本文。
[0159]
其它单分子测序方法包括利用visigen平台通过合成来实时测序(voelkerding等,clinical chem.,55:641-58,2009;美国专利号7,329,492,美国专利申请序列号11/671,956和11/781,166;其各自通过引用全文纳入本文),其中,固定化的带引物dna模板用带荧光素修饰的聚合酶和荧光素受体分子来进行链延伸,在核苷酸添加时产生可测的荧光共振能量转移(fret)。
[0160]
另一实时单分子测序系统是由太平洋生物科学公司(pacific biosciences)开发的(voelkerding等,clinical chem.,55.641-658,2009;maclean等,nature rev.microbiol.,7:287-296;美国专利号7,170,050,7,302,146,7,313,308和7,476,503;其各自通过引用全文纳入本文),其利用直径50-100nm含有约20仄升(10-21
l)反应体积的反应孔。测序反应利用固定化模板、改良的phi29 dna聚合酶和高局部浓度的带荧光素标记的各dntp来进行。高局部浓度和连续反应条件允许采用激光激发、光学波导和ccd相机来通过荧光信号检测实时捕捉纳入事件。
[0161]
在某些实施方式中,单分子实时(smrt)dna测序方法采用太平洋生物科学公司(pacific biosciences)开发的零级波导(zero-mode waveguide,zmw)或类似方法。用此技术,dna测序在smrt芯片上进行,这些芯片各自含有数千个零级波导(zmw)。zmw是孔,直径是纳米的几十分之一,制造在100nm金属膜中,该膜置于二氧化硅基材上。每个zmw成为提供检测体积仅20仄升(10-21
l)的纳米光子可视化室。以此体积,可在数千个带标记核苷酸的背景中检测出单个分子的活性。zmw通过合成进行测序,为观察dna聚合酶提供了窗口。各zmw室内,单个dna聚合酶分子结合在底面从而永久保持在检测体积内。磷酸连接(phospholinked)的核苷酸每种标记有不同颜色的荧光团,这些核苷酸随后以高浓度引入反应溶液中,这些浓度提高酶速度、精确性和处理能力(processivity)。由于zmw体积小,即使在这些高浓度下,检测体积被众核苷酸占据的时间占比很小。此外,由于转运核苷酸的扩散距离很短,对检测体积的经停很快,仅持续几微秒。结果就是背景很低。
[0162]
可调试用于本发明的用于此类实时测序的方法和系统在文献中有记载,例如,美国专利号7,405,281、7,315,019、7,313,308、7,302,146和7,170,050;美国专利公布号2008/0212960、2008/0206764、2008/0199932、2008/0199874、2008/0176769、2008/0176316、2008/0176241、2008/0165346、2008/0160531、2008/0157005、2008/0153100、2008/0153095、2008/0152281、2008/0152280、2008/0145278、2008/0128627、2008/0108082、2008/0095488、2008/0080059、2008/0050747、2008/0032301、2008/0030628、
2008/0009007、2007/0238679、2007/0231804、2007/0206187、2007/0196846、2007/0188750、2007/0161017、2007/0141598、2007/0134128、2007/0128133、2007/0077564、2007/0072196和2007/0036511,以及korlach等(2008)“selective aluminum passivation for targeted immobilization of single dna polymerase molecules in zero-mode waveguide nanostructures(选择性铝钝化用于将单个dna聚合酶分子靶向固定在零级波导纳米结构中)”pnas 105(4):1176-81,其全部在此通过引用全文纳入本文。iv.试剂盒
[0163]
提供试剂盒用于分析单细胞的核酸。在一些实施方式中,试剂盒可含有多个条码化粒子,各粒子含有独特条码和捕获区。一些情况中,这些粒子含有水凝胶(例如,可逆水凝胶如琼脂糖)或由其组成。这些粒子还可含有分子条码,所述分子条码为单个粒子或多个例子上每个寡核苷酸各自独有。
[0164]
一些情况中,试剂盒含有用于将所述多个粒子划分成多个划分产物的物质。一些情况中,用于划分的试剂包括用于形成乳液滴的与水不互溶的液体。一些情况中,所述试剂包括含有多个微通道的装置或多个微孔或纳米孔。
[0165]
通过引用将本文引用的所有专利、专利申请和其它公开文献包括genbank登录号全文纳入本文用于所有目的。
v.实施例
[0166]
仅以说明的形式而非限制的形式提供以下实施例。可改变或调整多种非关键参数来得到基本相同或相似的结果。实施例1:基于水凝胶的条码化过程和概述
[0167]
图1提供了基于水凝胶的条码化过程的概述。简而言之,双功能条码寡核苷酸具有条码和两个功能性末端,通过用至少一种引物扩增所述双功能条码寡核苷酸来将该双功能条码寡核苷酸扩增在水凝胶粒子上,所述引物共价偶联于水凝胶上或共价偶联于水凝胶转化成gel形式时将被水凝胶包封的高分子量聚合物上。扩增后,聚合物硬化成粒子,得到大量(例如,>106)水凝胶粒子,每个都有大量(例如,>106)拷贝的独有功能性dna条码。图1a.条码库可与另一组乳液滴混合,这些乳液滴各自含有待条码化的对象,例如纯化的核酸或细胞。在条码化后,液滴可被合并及进行后续处理例如dna测序。图1b.实施例2:基于水凝胶的条码化过程
[0168]
含有正向引物的dna寡核苷酸于5’端共价结合丙烯酰胺。形成含有丙烯酰胺单体、催化剂、引发剂和丙烯酰胺-寡核苷酸的反应混合物,从而将一或多个拷贝的寡核苷酸纳入高分子量线性聚丙烯酰胺。图2.线性聚丙烯酰胺寡核苷酸偶联物,sol形式的琼脂糖,具有聚腺苷捕获区的生物素化反向引物,pcr试剂,以及具有正向和反向引物结合位点与条码的双功能条码核酸模板被划分成多个液滴划分产物。图3a.进行划分的双功能条码核酸模板的浓度使得至少90%、95%、99%、基本全部或者所有的划分产物含有不超过1个双功能条码核酸模板。图3b,1。
[0169]
反向引物结合反向引物结合位点并添加聚胸苷功能以能捕获聚腺苷mrna。反向引物还含有5’生物素来允许已扩增粒子的富集。图3b,2这些滴经热循环来pcr扩增双功能条码模板模板分子。初始含有模板分子的各滴此时含有成百万拷贝的双链dna,这些双链dna
1936.html)。此外,采用反式亚酰胺使得反应自5’向3’进行,提供游离的3
’‑
oh以启动引物延伸。在合成中,用拆分-合并(拆分与混合)合成在生长中的寡核苷酸审偶联8-15个连续碱基以提供珠/细胞条码。一些情况中,以等摩尔或等动力学混合物生长中的寡核苷酸上偶联4、5、6、7、8、9、10、11、12或更多个连续碱基以提供分子条码。实施例6:将条码化衔接子连接到双链靶模板核酸
[0174]
用反式亚磷酰胺将发夹条码化寡核苷酸合成到dna合成树脂上,该方法提供具有游离3’端的寡核苷酸。所述寡核苷酸通过二硫连接而接到固体支持物上。5
′‑
硫代己基修饰的尿嘧啶用作寡核苷酸序列最5’位的碱基。尿嘧啶也被纳入发夹区。采用混合与拆分方法合成条码来产生珠/粒子/细胞条码。作为替代或补充,依序3’添加核苷酸的等摩尔或等动力学混合物来合成条码以产生分子条码。对含有发夹条码化寡核苷酸的这些珠进行划分。划分产物中,二硫连接被切割来从珠释放寡核苷酸。用udg/apei进行尿嘧啶切除来切割发夹区并由此使其线性化并提供游离5’供连接至双链靶核酸(例如,基因组片段、cdna等)。经切割和/或切除的发夹条码化寡核苷酸被连接至双链靶核酸。或者,在连接前没有通过切除最5’的尿嘧啶碱基来去除寡核苷酸的5’端硫,得到带切口的dna产物(图7,底部)。实施例7:将条码化衔接子连接到双链靶模板核酸
[0175]
用反式亚磷酰胺合成法将发夹条码化寡核苷酸合成到dna合成树脂上,该方法提供具有游离3’端的寡核苷酸。所述寡核苷酸通过二硫连接而接到固体支持物上。5
′‑
硫代己基修饰的尿嘧啶用作寡核苷酸序列最5’位的碱基。尿嘧啶也被纳入发夹区。采用混合与拆分方法合成条码来产生珠/粒子/细胞条码。替代或补充,依序3’添加核苷酸的等摩尔或等动力学混合物来合成条码以产生分子条码。dna聚合酶接触结合于珠的寡核苷酸来延伸发夹寡核苷酸的3’端并拷贝条码序列。对含有发夹条码化寡核苷酸的这些珠进行划分。划分在dna聚合酶接触以延伸发夹寡核苷酸3’之前或之后进行。二硫连接被切割以从固体支持物释放寡核苷酸。进行尿嘧啶切除来释放寡核苷酸,线性化发夹区,并提供游离5’供连接至双链靶核酸。经切割和/或切除的发夹条码化寡核苷酸被连接至双链靶核酸。一些情况中,在连接前没有通过切除最5’的尿嘧啶碱基来去除寡核苷酸的5’端硫,得到带切口的dna产物(图8,底部)。实施例8:将条码化衔接子连接到双链靶模板核酸
[0176]
下述实施例概述于图9:条码化寡核苷酸被合成在dna合成树脂上,使得寡核苷酸含有游离的3’可供后续用反式亚磷酰胺合成来聚合和/或连接。所述寡核苷酸通过二硫连接而接到固体支持物上。引物杂交至条码寡核苷酸的3’端。dna聚合酶接触寡核苷酸来产生双链产物。引物在5’端钝化使得双链产物只有上方链可连接。划分条码化寡核苷酸珠。划分在接触dna聚合酶以产生双链条码化寡核苷酸之前或之后进行。划分产物中,二硫连接被切割来从珠释放寡核苷酸。经切割的条码化寡核苷酸被连接至双链靶核酸。以5’oh结尾的寡核苷酸只能通过3’连接。实施例9:将条码化衔接子连接到双链靶模板核酸
[0177]
下述实施例概述于图10:条码化寡核苷酸被合成在dna合成树脂上,使得寡核苷酸含有游离的3’可供后续用反式亚磷酰胺合成来聚合和/或连接。所述寡核苷酸通过二硫连接而接到固体支持物上。引物杂交至条码寡核苷酸的3’端。引物在5’端钝化(例如有oh基团)使得引物的5’端不能被连接。划分条码化寡核苷酸珠。划分在引物杂交之前或之后进
行。划分产物中,二硫连接被切割来从珠释放寡核苷酸。经切割的条码化寡核苷酸被连接至双链靶核酸。以5’oh结尾的寡核苷酸只能通过3’连接。进行切口翻译dna合成来拷贝衔接子的下方链,其包括粒子条码序列和通用衔接子序列。切口翻译在划分产物中进行或在合并划分产物后进行。实施例10:单细胞靶向rna-seq
[0178]
试剂:(括号内的数字对应图11中带编号的方框)(1)条码化寡核苷酸珠(寡核苷酸珠)。保存于缓冲液如te中以保持dna的稳定性,且含一些表面活性剂以防止珠聚集:普流罗尼克f-68、f-98,吐温-20等。(2)珠清洗缓冲液:类似于珠保存缓冲液(3)珠包封缓冲液:rt反应所必需的至少一些组分(tris,镁,各dntp,nacl或kcl,rt酶:所述组分由(3)和(5)分含从而仅在划分产物形成时两份溶液混合后才可能开始rt)。可含有用以对珠浮力匹配的组分:示例有optiprep、nycodenz(分子密度梯度介质)、percoll或ludox是基于二氧化硅纳米粒子的密度匹配。还可依赖于聚合物例如黄原胶或菲克(ficoll),其提高粘度且略有浮力匹配效果。浮力匹配减少包封期间样品搅拌的需求。珠包封缓冲液中还可含有细胞裂解试剂,如去污剂。已知为细胞裂解剂且与rt兼容的合适去污剂是非离子型的,例如曲通x-100、brij-35、np-40、igepal-650。(4)细胞清洗缓冲液:通常是带ph缓冲的等张溶液如pbs。(5)细胞包封缓冲液:rt反应所必需的至少一些组分(tris,镁,各dntp,nacl或kcl,rt酶:所述组由(3)和(5)分含从而仅在液滴形成时两份溶液混合后才可能开始rt)可包括(3)中所含的浮力匹配试剂。还可含有从珠上切割下寡核苷酸所必需的试剂,例如tcep或dtt。浓度通常是2-4mm tcep和10-50mm dtt。(6)破乳混合物即用化合物令液滴划分产物合并。合适的化合物有2,2,3,3,4,4,4-七氟-1-丁醇,1h,1h,2h,2h-全氟-1-辛醇或氯仿。(7)购自生产商的ampure xp(8)购自生产商的ampure xp(9)多重pcr使用市售多重混合物。
[0179]
从培养或分解组织获取细胞。在细胞清洗缓冲液如加有0.01%普流罗尼克f-68的1xpbs中通过600xg离心1分钟并吸去清洗缓冲液来清洗1-3遍。在血球计数器或自动细胞计数器上将细胞计数。在细胞包封缓冲液中重悬至1x105细胞/ml。合适的细胞包封缓冲液是50mm tris ph8,各dntp,rt酶,4mm tcep,5%optiprep和rna酶抑制剂。珠在珠清洗缓冲液如te 0.01%普流罗尼克f-98中清洗3遍。在珠包封缓冲液如1x rt缓冲液-各dntp和酶、50%optiprep、0.1%brij-35中重悬至1x105珠/ml。移取15μl的珠悬浮液放入微流体芯片各珠孔内,并移取15μl细胞悬液至各细胞孔内。移取表面活性剂和油放入油孔。放入细胞液滴产生器设备中并激活液滴形成。
[0180]
在滴形成后,将液滴和油自样品孔移出并放入96孔板。放入热循环仪的区块中,于50℃孵育1-2小时进行逆转录和细胞裂解,然后85℃孵育10-20分钟来使逆转录酶变性。
[0181]
为了破乳,从板移出样品并将相似样品合并入单个1.5ml离心管。于1000xg离心1分钟并去除底部油层。加入破乳溶液,例如含20%2,2,3,3,4,4,4-七氟-1-丁醇的hfe7500,振荡并再次离心。从顶部取出澄清的水相,并进行库构建和高通量测序。
实施例11:用分子条码化的珠来条码化并扩增靶核酸
[0182]
下述实施例概述于图12:(1)细胞与反式亚酰胺法合成的含有游离3’端供聚合的寡核苷酸珠一同划分。在同步实验中测试在寡核苷酸珠上10个核苷酸的分子条码序列存在与否的影响。细胞与带分子条码或不带代码的珠一同划分。寡核苷酸自3’向5’含有:3’的聚胸苷序列,可选的分子条码,5’二硫连接至珠。细胞被裂解,寡核苷酸被还原剂从珠上释放,聚腺苷mrna被杂交到寡核苷酸的聚胸苷区,并进行逆转录。(2)合并液滴并(3)通过exoi消化去除引物。(4)所得产物用ampure xp珠纯化。用于高通量测序的衔接子由下述两步扩增来接上:(5)在第一步扩增中添加rd2和rd1引物;(6)产物用ampure珠纯化;以及,(7)在第二步扩增中添加p7和p5。为步骤(5)测试两种不同的市售扩增混合物。还测试一步式扩增添加p7和p5衔接子(未显示)。
[0183]
通过experion凝胶电泳测试所得扩增产物的dna片段大小分布。结果显示无论是否存在分子条码、无论高通量测序是否一步式添加或是经两步式扩增添加、无论步骤(5)中使用何种扩增混合物,都得到了预期的250-750bp片段大小。一步式扩增的效率略低,可能是由于使用了较低的引物浓度。样品中非模板扩增很少或没有。还通过解链曲线分析来测试所得扩增产物以获得ntc qpcr对样品数据的影响。所测样品的δct是6或更高。因此,对样品ct的影响是~1%或更低。因此,未见ntc qpcr对样品数据有显著影响。扩增产物的qpcr分析显示一步式扩增方法未产生显著的库偏置。ddpcr检测gapdh拷贝数以测定靶富集(或损失)。在步骤(5)中采用伯乐公司(bio-rad)的preamp supermix以及分子条码化珠用一步式扩增实现了约8000倍的富集。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献