一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

嗜中温DNA聚合酶延伸阻断物的制作方法

2022-12-02 19:08:27 来源:中国专利 TAG:

嗜中温dna聚合酶延伸阻断物
1.相关申请
2.本技术根据35 u.s.c.
§
119(e)要求2020年1月31日提交的美国临时专利申请序列第62/968947号的权益,此相关申请的内容为了所有目的通过引用以其整体并入本文。
3.背景
4.领域
5.本公开内容总体上涉及分子生物学领域,并且特别涉及使用分子条形码化的多组学分析。
6.对相关技术的描述
7.分子条形码化的方法和技术可用于单细胞转录组学分析,包括使用例如逆转录、聚合酶链式反应(pcr)扩增和下一代测序(ngs)破译基因表达谱以确定细胞的状态。分子条形码化还可用于单细胞蛋白质组学分析。对使核酸靶分子在5’末端和3’末端中的一个或两个上条形码化的方法和技术存在需求。对能够有效地定量分析细胞的基因表达的系统和方法存在需求。
8.概述
9.本文的公开内容包括用于对样品中的核酸靶进行标记的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸(blocker oligonucleotide)接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括:基于与多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。
10.本文的公开内容包括用于确定样品中核酸靶的数目的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或
更多种阻断物寡核苷酸接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括:基于与多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。方法可以包括:扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子,所述多于一种单标记的核酸分子各自包含第二分子标记。在一些实施方案中,确定样品中核酸靶的拷贝数包括:基于与多于一种单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。
11.本文的公开内容包括用于确定样品中核酸靶的数目的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括:扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子,所述多于一种单标记的核酸分子各自包含第二分子标记。方法可以包括:基于与多于一种单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。
12.在一些实施方案中,使条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交包括使条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区进行分子间杂交。方法可以包括:在使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交之前,使多于一种条形码化核酸分子变性。方法可以包括:在扩增多于一种延伸的条形码化核酸分子之前使多于一种延伸的条形码化核酸分子变性。在一些实施方案中,确定核酸靶的拷贝数包括基于与多于一种单标记的核酸分子中的单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定样品中多于一种核酸靶中的每一种的拷贝数,所述多于一种单标记的核酸分子包含多于一种核酸靶中的每一种的序列。在一些实施方案中,多于一种核酸靶中的每一种的序列包括多于一种核酸靶中的每一种的子序列。在一些实施方案中,多于一种条形码化核酸分子中的核酸靶的序列包括核酸靶的子序列。
13.在一些实施方案中,靶结合区的互补物与靶结合区的一部分互补。在一些实施方案中,靶结合区包括基因特异性序列和/或多(dt)序列。在一些实施方案中,第二分子标记不同于第一分子标记,并且其中第二分子标记不是第一分子标记的互补物。在一些实施方案中,多于一种延伸的条形码化核酸分子各自包含核酸靶的序列。在一些实施方案中,核酸靶包括mrna,并且其中多于一种延伸的条形码化核酸分子各自包含核酸靶的有义链的序列。
14.方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与以下杂交:(i)多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区,(ii)条形码化核酸分子自身的靶结合区,和/或(iii)多于一种条形码化核酸分子中的不同条形码化核酸分子的靶结合区;延伸多于一种条形码化核酸分子的3’末端以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记和第二分子标记;以及基于与多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、具有不同序列的第二分子标记或其组合的数目来确定样品中核酸靶的拷贝数。在一些实施方案中,使条形码化核酸分子的靶结合区的互补物与条形码化核酸分子自身的靶结合区杂交包括使条形码化核酸分子内的靶结合区和靶结合区的互补物进行分子内杂交以形成茎环。在一些实施方案中,第二分子标记是第一分子标记的互补物。在一些实施方案中,使条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交包括使条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区进行分子间杂交。在一些实施方案中,第二分子标记不同于第一分子标记,并且其中第二分子标记不是第一分子标记的互补物。在一些实施方案中,使条形码化核酸分子的靶结合区的互补物与多于一种条形码化核酸分子中的不同条形码化核酸分子的靶结合区杂交包括使条形码化核酸分子的靶结合区的互补物与多于一种条形码化核酸分子中的不同条形码化核酸分子的靶结合区进行分子间杂交。在一些实施方案中,第二分子标记的序列不同于第一分子标记的序列,并且其中第二分子标记不是第一分子标记的互补物。在一些实施方案中,一种或更多种阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。
15.在一些实施方案中,逆转录酶能够具有末端转移酶活性。在一些实施方案中,模板转换寡核苷酸包含一个或更多个3’核糖核苷酸。在一些实施方案中,模板转换寡核苷酸包含三个3’核糖核苷酸。在一些实施方案中,3’核糖核苷酸包括鸟嘌呤。在一些实施方案中,逆转录酶包括病毒逆转录酶。在一些实施方案中,病毒逆转录酶是鼠白血病病毒(mlv)逆转录酶或moloney鼠白血病病毒(mmlv)逆转录酶。在一些实施方案中,样品包括单细胞,任选地免疫细胞,进一步任选地b细胞或t细胞。在一些实施方案中,样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。在一些实施方案中,单细胞包括循环肿瘤细胞。在一些实施方案中,第一通用序列在分子标记和靶结合区的5’。在一些实施方案中,多于一种延伸的条形码化核酸分子不包含第一通用序列的互补物。在一些实施方案中,包含第一通用序列的互补物的延伸的条形码化核酸分子的产生减少了至少10%、至少25%、至少50%、至少80%、至少90%、至少95%或至少99%。
16.在一些实施方案中,扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子包括使用能够与第一通用序列杂交的引物和扩增引物。在一些实施方案中,
扩增引物是靶特异性引物。在一些实施方案中,靶特异性引物与以下特异性杂交:免疫受体、免疫受体的恒定区、免疫受体的可变区、免疫受体的多样性区和/或免疫受体的可变区和多样性区的连接处。在一些实施方案中,免疫受体是t细胞受体(tcr)和/或b细胞受体(bcr)。在一些实施方案中,tcr包含tcrα链、tcrβ链、tcrβ链、tcrβ链或其任何组合。在一些实施方案中,bcr受体包含bcr重链和/或bcr轻链。在一些实施方案中,扩增引物特异性结合延伸的条形码化核酸分子,所述延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记。在一些实施方案中,扩增引物不结合包含第一分子标记的延伸的条形码化核酸分子。在一些实施方案中,扩增引物包含核酸靶的互补物。在一些实施方案中,核酸靶包括mrna,并且其中扩增引物包含核酸靶的反义链的序列。在一些实施方案中,阻断物寡核苷酸减少包含多于一种分子标记的单标记的核酸分子的产生。在一些实施方案中,包含多于一种分子标记的单标记的核酸分子的产生减少了至少10%、至少25%、至少50%、至少80%、至少90%、至少95%或至少99%。
17.在一些实施方案中,使寡核苷酸条形码的3’末端延伸包括使用嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合来使寡核苷酸条形码的3’末端延伸。在一些实施方案中,使寡核苷酸条形码的3’末端延伸包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶使寡核苷酸条形码的3’末端延伸。在一些实施方案中,dna聚合酶包括klenow片段。在一些实施方案中,使多于一种条形码化核酸分子的3’末端延伸包括使用嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合使多于一种条形码化核酸分子的3’末端延伸。在一些实施方案中,使多于一种条形码化核酸分子的3’末端延伸包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶使多于一种条形码化核酸分子的3’末端延伸。例如,dna聚合酶可以包括klenow片段。
18.方法可以包括:获得多于一种延伸的条形码化核酸分子或其产物的序列信息。在一些实施方案中,获得序列信息包括将测序衔接子附接到多于一种延伸的条形码化核酸分子或其产物。在一些实施方案中,获得序列信息包括将测序衔接子附接到多于一种单标记的核酸分子或其产物。在一些实施方案中,获得序列信息包括获得单细胞的bcr轻链和bcr重链的序列信息。在一些实施方案中,bcr轻链和bcr重链的序列信息包括bcr轻链和/或bcr重链的互补决定区1(cdr1)、cdr2、cdr3或其任何组合的序列。方法可以包括:基于所获得的序列信息,使单细胞的bcr轻链和bcr重链进行配对。在一些实施方案中,样品包括多于一个单细胞,方法包括基于所获得的序列信息使至少50%的所述单细胞的bcr轻链和bcr重链进行配对。
19.在一些实施方案中,获得序列信息包括获得单细胞的tcr α链和tcrβ链的序列信息。在一些实施方案中,tcrα链和tcrβ链的序列信息包括tcrα链和/或tcrβ链的互补决定区1(cdr1)、cdr2、cdr3或其任何组合的序列。方法可以包括:基于所获得的序列信息使单细胞的tcrα链和tcrβ链进行配对。在一些实施方案中,样品包括多于一个单细胞,方法包括基于所获得的序列信息使至少50%的所述单细胞的tcrα链和tcrβ链进行配对。
20.在一些实施方案中,获得序列信息包括获得单细胞的tcrγ链和tcrδ链的序列信息。在一些实施方案中,tcrγ链和tcr δ链的序列信息包括tcrγ链和/或tcrδ链的互补决定区1(cdr1)、cdr2、cdr3或其任何组合的序列。方法可以包括:基于获得的序列信息使单细
胞的tcrγ链和tcrδ链进行配对。在一些实施方案中,样品包括多于一个单细胞,方法包括基于所获得的序列信息使至少50%的所述单细胞的tcrγ链和tcrδ链进行配对。
21.在一些实施方案中,靶结合区的互补物包括靶结合区的反向互补序列和/或靶结合区的互补序列。在一些实施方案中,分子标记的互补物包括分子标记的反向互补序列和/或分子标记的互补序列。在一些实施方案中,多于一种条形码化核酸分子包括条形码化脱氧核糖核酸(dna)分子和/或条形码化核糖核酸(rna)分子。
22.本文的公开内容包括对样品中的核酸靶进行标记的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记、细胞标记和能够与核酸靶的拷贝杂交的靶结合区。方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸。方法可以包括:使第一链条形码化多核苷酸与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使随机引物与多于一种第一链条形码化多核苷酸接触,其中随机引物中的每一种包含第二通用序列或其互补物。方法可以包括:使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸以产生多于一种延伸产物,其中阻断物寡核苷酸减少不期望的延伸产物的产生,其中不期望的延伸产物包括与寡核苷酸条形码的一部分杂交的随机引物的延伸产物。方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种延伸产物,从而产生第一多于一种条形码化扩增子。在一些实施方案中,扩增多于一种延伸产物包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到多于一种延伸产物。方法可以包括:基于与第一多于一种条形码化扩增子或其产物关联的具有不同序列的分子标记的数目来确定样品中核酸靶的拷贝数。
23.本文的公开内容包括用于确定样品中核酸靶的数目的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记、细胞标记和能够与核酸靶的拷贝杂交的靶结合区。方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸。方法可以包括:使第一链条形码化多核苷酸与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使随机引物与多于一种第一链条形码化多核苷酸接触,其中随机引物中的每一种包含第二通用序列或其互补物。方法可以包括:使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸以产生多于一种延伸产物,其中阻断物寡核苷酸减少不期望的延伸产物的产生,其中不期望的延伸产物包括与寡核苷酸条形码的一部分杂交的随机引物的延伸产物。方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种延伸产物,从而产生第一多于一种条形码化扩增子。方法可以包括:基于与第一多于一种条形码化扩增子或其产物关联的具有不同序列的分子标记的数目来确定样品中核酸靶的拷贝数。
24.在一些实施方案中,使核酸靶的拷贝接触包括使多于一种核酸靶的拷贝与多于一种寡核苷酸条形码接触,使多于一种寡核苷酸条形码延伸包括使与多于一种核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸,并且确定样品中核酸靶的拷贝数包括基于与第一多于一种条形码化扩增子中的条形码化扩增子关
联的具有不同序列的分子标记的数目来确定样品中多于一种核酸靶中的每一种的数目,所述第一多于一种条形码化扩增子包括多于一种核酸靶中的每一种的序列。在一些实施方案中,多于一种核酸靶中的每一种的序列包括多于一种核酸靶中的每一种的子序列。在一些实施方案中,第一多于一种条形码化扩增子中的核酸靶的序列包括核酸靶的子序列。
25.方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增第一多于一种条形码化扩增子,从而产生第二多于一种条形码化扩增子。在一些实施方案中,扩增第一多于一种条形码化扩增子包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到第一多于一种条形码化扩增子。方法可以包括:基于与第二多于一种条形码化扩增子或其产物关联的具有不同序列的分子标记的数目来确定样品中核酸靶的拷贝数。在一些实施方案中,使核酸靶的拷贝接触包括使多于一种核酸靶的拷贝与多于一种寡核苷酸条形码接触,使多于一种寡核苷酸条形码延伸包括使与多于一种核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸,和/或确定样品中核酸靶的拷贝数包括基于与第二多于一种条形码化扩增子中的条形码化扩增子关联的具有不同序列的分子标记的数目来确定样品中多于一种核酸靶中的每一种的数目,所述第二多于一种条形码化扩增子包括多于一种核酸靶中的每一种的序列。在一些实施方案中,多于一种核酸靶中的每一种的序列包括多于一种核酸靶中的每一种的子序列。在一些实施方案中,第二多于一种条形码化扩增子中的核酸靶的序列包括核酸靶的子序列。
26.在一些实施方案中,第一多于一种条形码化扩增子和/或第二多于一种条形码化扩增子中的每一种包含以下的至少一部分:第一通用序列、第二通用序列或二者。在一些实施方案中,第一通用序列和第二通用序列是相同的。在一些实施方案中,第一通用序列和第二通用序列是不同的。在一些实施方案中,第一通用序列和/或第二通用序列包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分。在一些实施方案中,测序衔接子包括p5序列、p7序列、其互补序列和/或其部分。在一些实施方案中,测序引物包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。
27.在一些实施方案中,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸包括使用逆转录酶使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸。在一些实施方案中,逆转录酶包括病毒逆转录酶。在一些实施方案中,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸。在一些实施方案中,使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸。在一些实施方案中,缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶包括嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合。在一些实施方案中,dna聚合酶包括klenow片段。
28.在一些实施方案中,使随机引物延伸的步骤在近似恒定的温度进行。在一些实施方案中,使随机引物延伸的步骤在不变的温度进行。在一些实施方案中,使随机引物延伸的步骤在第一延伸温度开始,并且然后在第二延伸温度进行,其中第二延伸温度高于第一延伸温度。在一些实施方案中,第一延伸温度为约37℃。在一些实施方案中,第二延伸温度为
约55℃。在一些实施方案中,一种或更多种阻断物寡核苷酸包括处于或低于初始延伸温度的退火温度。在一些实施方案中,阻断物寡核苷酸在比大多数随机引物更高的温度与多于一种第一链条形码化多核苷酸杂交。在一些实施方案中,与多于一种第一链条形码化多核苷酸杂交的阻断物寡核苷酸在使随机引物延伸的步骤期间解链脱离。在一些实施方案中,一种或更多种阻断物寡核苷酸包括低于第二延伸温度的解链温度。
29.在一些实施方案中,与寡核苷酸条形码的一部分杂交的随机引物的延伸产生不期望的延伸产物。在一些实施方案中,不期望的延伸产物占多于一种延伸产物的少于40%、少于20%、少于10%或少于5%。在一些实施方案中,不期望的延伸产物的产生减少了至少10%、至少25%、至少50%、至少80%、至少90%、至少95%或至少99%。在一些实施方案中,第一多于一种条形码化扩增子和/或第二多于一种条形码化扩增子包含全转录组扩增(wta)产物。在一些实施方案中,第一多于一种条形码化扩增子和/或第二多于一种条形码化扩增子对应于单细胞的mrna的至少10%。在一些实施方案中,第一多于一种条形码化扩增子和/或第二多于一种条形码化扩增子对应于单细胞的mrna的至少50%或至少90%。在一些实施方案中,多于一种核酸靶中的一种或更多种包括低表达基因的mrna。在一些实施方案中,所述随机引物包含随机核苷酸序列。在一些实施方案中,随机核苷酸序列的长度为约4个至约30个核苷酸。在一些实施方案中,所述随机核苷酸序列的长度为6个或9个核苷酸。在一些实施方案中,靶结合区包括寡dt序列、随机序列、靶特异性序列或其组合。在一些实施方案中,靶结合区包括多(dt)区,并且其中核酸靶包含多(da)区。
30.方法可以包括:重复以下步骤:使第一链条形码化多核苷酸与一种或更多种阻断物寡核苷酸接触,使随机引物与多于一种第一链条形码化多核苷酸接触,使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸,以及扩增多于一种延伸产物。方法可以包括:使用多于一种第一链条形码化多核苷酸作为模板合成第三多于一种条形码化扩增子以产生第三多于一种条形码化扩增子。在一些实施方案中,合成第三多于一种条形码化扩增子包括对多于一种第一链条形码化多核苷酸进行聚合酶链式反应(pcr)扩增。在一些实施方案中,合成第三多于一种条形码化扩增子包括使用能够与第一通用序列或其互补物杂交的引物和靶特异性引物进行的pcr扩增。方法可以包括:获得第三多于一种条形码化扩增子或其产物的序列信息。在一些实施方案中,获得序列信息包括将测序衔接子附接到多于一种延伸产物、第一多于一种条形码化扩增子、第二多于一种条形码化扩增子、第三多于一种条形码化扩增子,或其产物。在一些实施方案中,靶特异性引物与免疫受体特异性杂交。在一些实施方案中,免疫受体是t细胞受体(tcr)和/或b细胞受体(bcr)。
31.在一些实施方案中,样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。在一些实施方案中,样品包括外周血单个核细胞或免疫细胞。在一些实施方案中,免疫细胞包括b细胞、t细胞或其组合。在一些实施方案中,扩增多于一种延伸产物不在存在固体支持物的情况下进行。在一些实施方案中,方法不包括核糖核酸酶h诱导的引发、末端修复和/或衔接子连接。在一些实施方案中,方法不包括片段化、标签片段化(tagmentation)或二者。在一些实施方案中,方法不包括用于去除不期望的延伸产物的步骤。
32.方法可以包括:获得多于一种延伸产物、第一多于一种条形码化扩增子、第二多于一种条形码化扩增子、第三多于一种条形码化扩增子或其产物的序列信息。在一些实施方
案中,获得序列信息包括获得包括多于一种延伸产物、第一多于一种条形码化扩增子、第二多于一种条形码化扩增子、第三多于一种条形码化扩增子或其产物的多于一个测序读段的测序数据。在一些实施方案中,不期望的延伸产物的测序读段是总测序读段的少于40%、少于20%、少于10%或少于5%。在一些实施方案中,第一链条形码化多核苷酸包括条形码化脱氧核糖核酸(dna)分子、条形码化核糖核酸(rna)分子或二者。
33.在一些实施方案中,寡核苷酸条形码的一部分包括第一通用序列、细胞标记、分子标记、靶结合区、其部分或其任何组合。在一些实施方案中,一种或更多种阻断物寡核苷酸能够与以下的全部或一部分特异性结合:第一通用序列、细胞标记、分子标记、靶结合区或其任何组合。在一些实施方案中,细胞标记包含细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分。在一些实施方案中,一种或更多种阻断物寡核苷酸能够与以下的全部或一部分特异性结合:细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分。在一些实施方案中,一种或更多种阻断物寡核苷酸包含以下的互补序列:细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分、第一通用序列、分子标记、靶结合区、其部分或其任何组合。
34.在一些实施方案中,一种或更多种阻断物寡核苷酸长度为1nt至100nt、长度为1nt至50nt、长度为1nt至21nt或长度为约12nt。在一些实施方案中,一种或更多种阻断物寡核苷酸具有至少45℃、至少50℃、至少60℃或至少70℃的tm。在一些实施方案中,一种或更多种阻断物寡核苷酸具有至多45℃、至多50℃、至多60℃或至多70℃的tm。在一些实施方案中,一种或更多种阻断物寡核苷酸不包含非天然核苷酸。在一些实施方案中,一种或更多种阻断物寡核苷酸不能作为用于逆转录酶或聚合酶的引物起作用。在一些实施方案中,一种或更多种阻断物寡核苷酸包含非天然核苷酸。在一些实施方案中,一种或更多种阻断物寡核苷酸包括锁核酸(lna)、肽核酸(pna)、dna、lna/pna嵌合体、lna/dna嵌合体、pna/dna嵌合体或其任何组合。在一些实施方案中,核酸靶包括核酸分子。
35.在一些实施方案中,核酸分子包括核糖核酸(rna)、信使rna(mrna)、微rna、小干扰rna(sirna)、rna降解产物、包含多(a)尾的rna或其任何组合。在一些实施方案中,mrna编码免疫受体。在一些实施方案中,核酸靶包含细胞组分结合试剂。在一些实施方案中,核酸分子与细胞组分结合试剂缔合。方法可以包括:使核酸分子和细胞组分结合试剂解离。在一些实施方案中,多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列。在一些实施方案中,多于一种寡核苷酸条形码的每一种分子标记包含至少6个核苷酸。在一些实施方案中,多于一种寡核苷酸条形码与固体支持物关联。在一些实施方案中,与同一固体支持物关联的多于一种寡核苷酸条形码各自包含相同的样品标记。在一些实施方案中,多于一种寡核苷酸条形码的每一种样品标记包含至少6个核苷酸。在一些实施方案中,多于一种寡核苷酸条形码各自包含细胞标记。在一些实施方案中,多于一种寡核苷酸条形码的每一种细胞标记包含至少6个核苷酸。在一些实施方案中,与同一固体支持物关联的寡核苷酸条形码包含相同的细胞标记。在一些实施方案中,与不同的固体支持物关联的寡核苷酸条形码包含不同的细胞标记。
36.在一些实施方案中,多于一种延伸的条形码化核酸分子各自包含细胞标记和细胞标记的互补物,并且任选地细胞标记的互补物包括细胞标记的反向互补序列和/或细胞标记的互补序列。方法可以包括:在存在乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(dmso)、
甘油、甲酰胺、7-脱氮-gtp、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合中的一种或更多种的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸。
37.在一些实施方案中,固体支持物包括合成颗粒或平坦表面。在一些实施方案中,样品包括单细胞,方法包括将包含多于一种寡核苷酸条形码的合成颗粒与样品中的单细胞关联。方法可以包括:在将合成颗粒与单细胞关联后裂解单细胞。在一些实施方案中,裂解单细胞包括加热样品、使样品与去污剂接触、改变样品的ph或其任何组合。在一些实施方案中,合成颗粒和单细胞在同一孔中。在一些实施方案中,合成颗粒和单细胞在同一液滴中。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被固定或部分地固定在合成颗粒上,或者多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在合成颗粒中。在一些实施方案中,合成颗粒是可破坏的。在一些实施方案中,合成颗粒包括珠。在一些实施方案中,珠包括琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白a缀合珠、蛋白g缀合珠、蛋白a/g缀合珠、蛋白l缀合珠、寡(dt)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合;选自由以下组成的组的材料:聚二甲基硅氧烷(pdms)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合;或者可破坏的水凝胶颗粒。在一些实施方案中,多于一种寡核苷酸条形码中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。在一些实施方案中,接头官能团和支持物官能团单独地选自由c6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮及其任何组合组成的组。
38.本文的公开内容包括试剂盒。试剂盒可以包含:多于一种寡核苷酸条形码,其中多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列;能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸;逆转录酶;包含靶结合区或其一部分的模板转换寡核苷酸;以及缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶。
39.本文的公开内容包括试剂盒。试剂盒可以包含:多于一种寡核苷酸条形码,其中多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列;多于一种随机引物;与第一通用序列和/或细胞标记的全部或一部分互补的一种或更多种阻断物寡核苷酸;缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶;以及逆转录酶。在一些实施方案中,随机引物包含随机核苷酸序列。在一些实施方案中,随机核苷酸序列的长度为约4个至约30个核苷酸。在一些实施方案中,随机核苷酸序列的长度为6个或9个核苷酸。
40.在一些实施方案中,缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶包括嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合。在一些实施方案中,寡核苷酸条形码的一部分包括第一通用序列、细胞标记、分子标记、靶结合区、其部分或其任何组合。在一些实施方案中,一种或更多种阻断物寡核苷酸能够与以下的全部或一部分特异性结合:第一通用序列、细胞标记、分子标记、靶结合区或其任何组合。在一些实施方案中,细胞标记包含细胞标记的第一部分、第一接头、细胞标记的第二部
分、第二接头和细胞标记的第三部分。在一些实施方案中,一种或更多种阻断物寡核苷酸能够与以下的全部或一部分特异性结合:细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分。在一些实施方案中,一种或更多种阻断物寡核苷酸包含以下的互补序列:细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分、第一通用序列、分子标记、靶结合区、其部分或其任何组合。
41.在一些实施方案中,一种或更多种阻断物寡核苷酸长度为1nt至100nt、长度为1nt至50nt、长度为1nt至21nt或长度为约12nt。在一些实施方案中,一种或更多种阻断物寡核苷酸具有至少45℃、至少50℃、至少60℃或至少70℃的tm。在一些实施方案中,一种或更多种阻断物寡核苷酸具有至多45℃、至多50℃、至多60℃或至多70℃的tm。在一些实施方案中,一种或更多种阻断物寡核苷酸不包含非天然核苷酸。在一些实施方案中,一种或更多种阻断物寡核苷酸不能作为用于逆转录酶或聚合酶的引物起作用。在一些实施方案中,一种或更多种阻断物寡核苷酸包含非天然核苷酸。在一些实施方案中,一种或更多种阻断物寡核苷酸包括锁核酸(lna)、肽核酸(pna)、dna、lna/pna嵌合体、lna/dna嵌合体、pna/dna嵌合体或其任何组合。
42.在一些实施方案中,dna聚合酶包括klenow片段。在一些实施方案中,逆转录酶包括病毒逆转录酶。在一些实施方案中,逆转录酶包括鼠白血病病毒(mlv)逆转录酶或moloney鼠白血病病毒(mmlv)逆转录酶。在一些实施方案中,模板转换寡核苷酸包含一个或更多个3’核糖核苷酸。在一些实施方案中,模板转换寡核苷酸包含三个3’核糖核苷酸。在一些实施方案中,3’核糖核苷酸包括鸟嘌呤。
43.试剂盒可以包含以下中的一种或更多种:乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(dmso)、甘油、甲酰胺、7-脱氮-gtp、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合。试剂盒可以包含:缓冲液、筒、一种或更多种用于逆转录反应的试剂、一种或更多种用于扩增反应的试剂或其组合。在一些实施方案中,靶结合区包括基因特异性序列、寡(dt)序列、随机多聚体或其任何组合。在一些实施方案中,寡核苷酸条形码包含相同的样品标记和/或相同的细胞标记。在一些实施方案中,多于一种寡核苷酸条形码的每一种样品标记、细胞标记和/或分子标记包含至少6个核苷酸。
44.在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被固定或部分地固定在合成颗粒上;和/或多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在合成颗粒中。在一些实施方案中,合成颗粒是可破坏的。在一些实施方案中,合成颗粒包括珠。在一些实施方案中,珠包括琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白a缀合珠、蛋白g缀合珠、蛋白a/g缀合珠、蛋白l缀合珠、寡(dt)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合;选自由以下组成的组的材料:聚二甲基硅氧烷(pdms)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合;或者可破坏的水凝胶颗粒。在一些实施方案中,多于一种寡核苷酸条形码中的每一种包含接头官能团。在一些实施方案中,合成颗粒包含固体支持物官能团。在一些实施方案中,支持物官能团和接头官能团彼此关联;并且接头官能团和支持物官能团单独地选自由c6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮及其任何组合组成的组。
45.附图简述
46.图1图示了非限制性示例性条形码。
47.图2示出条形码化和数字计数的非限制性示例性工作流程。
48.图3是示出用于从多于一种靶产生在3’末端条形码化的靶的索引文库的非限制性示例性过程的示意图。
49.图4a-图4e示出了使用5’条形码化和本文公开的阻断物寡核苷酸确定核酸靶(例如,免疫受体的v(d)j区)的序列的非限制性示例性工作流程的示意图。
50.图5a-图5d示出了使用阻断物寡核苷酸进行基于随机引发和引物延伸(rpe)的全转录组分析(wta)的非限制性示例性工作流程的示意图。
51.详述
52.以下详述中参考了形成本文的一部分的附图。在附图中,除非上下文另外指示,否则相似的符号通常标识相似的组成部分。在详述、附图和权利要求书中描述的说明性实施方案不意味着是限制性的。在不脱离本文提供的主题的精神或范围的情况下,可以利用其他实施方案,并且可以做出其他改变。将容易理解的是,如本文一般描述的以及附图中图示的本公开内容的方面能够以各种不同的配置来布置、替换、组合、分离和设计,所有这些都在本文中明确设想并且构成本公开内容的一部分。
53.本文提及的所有专利、公开的专利申请、其他出版物和来自genbank的序列,以及其他数据库关于相关技术通过引用以其整体并入。
54.对少量核酸(例如信使核糖核苷酸(mrna)分子)进行定量对于确定例如在不同发育阶段或在不同环境条件下在细胞中表达的基因是临床上重要的。然而,确定核酸分子(例如,mrna分子)的绝对数目也可以是非常具有挑战性的,尤其是当分子数目非常小时。确定样品中分子的绝对数目的一种方法是数字聚合酶链式反应(pcr)。理想地,pcr在每个循环中产生相同拷贝的分子。然而,pcr可具有缺点使得每个分子以随机概率复制,且此概率根据pcr循环和基因序列而变化,这导致扩增偏倚和不准确的基因表达测量。具有独特分子标记(molecular labels,也称为分子索引(molecular indexes,mi))的随机条形码可以用于计数分子数目和校正扩增偏倚。诸如precise
tm
测定(cellular research,inc.(palo alto,ca))和rhapsody
tm
测定(becton,dickinson and company(franklin lakes,nj))的随机条形码化可以通过使用分子标记(ml)在逆转录(rt)期间标记mrna来校正由pcr和文库制备步骤引起的偏倚。
55.precise
tm
测定可以利用具有在多(t)寡核苷酸上的大量(例如6561种至65536种)独特分子标记序列的随机条形码的非耗尽性池(non-depleting pool),以在rt步骤期间与样品中的所有多(a)-mrna杂交。随机条形码可以包含通用pcr引发位点。在rt期间,靶基因分子与随机条形码随机反应。每种靶分子可以与随机条形码杂交,导致产生随机条形码化的互补核糖核苷酸(cdna)分子。在标记后,可以将来自微孔板微孔的随机条形码化cdna分子汇集到单个管中用于pcr扩增和测序。可以分析原始测序数据以产生读段的数目、具有独特分子标记序列的随机条形码的数目以及mrna分子的数目。
56.本文的公开内容包括用于对样品中的核酸靶进行标记的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结
合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括:基于与多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。
57.本文的公开内容包括用于确定样品中核酸靶的数目的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括:基于与多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。方法可以包括:扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子,所述多于一种单标记的核酸分子各自包含第二分子标记。在一些实施方案中,确定样品中核酸靶的拷贝数包括:基于与多于一种单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。
58.本文的公开内容包括用于确定样品中核酸靶的数目的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于
一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括:扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子,所述多于一种单标记的核酸分子各自包含第二分子标记。方法可以包括:基于与多于一种单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。
59.本文的公开内容包括对样品中的核酸靶进行标记的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记、细胞标记和能够与核酸靶的拷贝杂交的靶结合区。方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸。方法可以包括:使第一链条形码化多核苷酸与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使随机引物与多于一种第一链条形码化多核苷酸接触,其中随机引物中的每一种包含第二通用序列或其互补物。方法可以包括:使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸以产生多于一种延伸产物,其中阻断物寡核苷酸减少不期望的延伸产物的产生,其中不期望的延伸产物包括与寡核苷酸条形码的一部分杂交的随机引物的延伸产物。方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种延伸产物,从而产生第一多于一种条形码化扩增子。在一些实施方案中,扩增多于一种延伸产物包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到多于一种延伸产物。方法可以包括:基于与第一多于一种条形码化扩增子或其产物关联的具有不同序列的分子标记的数目来确定样品中核酸靶的拷贝数。
60.本文的公开内容包括用于确定样品中核酸靶的数目的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记、细胞标记和能够与核酸靶的拷贝杂交的靶结合区。方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸。方法可以包括:使第一链条形码化多核苷酸与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使随机引物与多于一种第一链条形码化多核苷酸接触,其中随机引物中的每一种包含第二通用序列或其互补物。方法可以包括:使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸以产生多于一种延伸产物,其中阻断物寡核苷酸减少不期望的延伸产物的产生,其中不期望的延伸产物包括与寡核苷酸条形码的一部分杂交的随机引物的延伸产物。方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种延伸产物,从而产生第一多于一种条形码化扩增子。方法可以包括:基于与第一多于一种条形码化扩增子或其产物关联的具有不同序列的分子标记的数目来确定样品中核酸靶的拷贝数。
61.本文的公开内容包括试剂盒。试剂盒可以包含:多于一种寡核苷酸条形码,其中多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列;能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸;逆转录酶;包含靶结合区或
其一部分的模板转换寡核苷酸;以及缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶。
62.本文的公开内容包括试剂盒。试剂盒可以包含:多于一种寡核苷酸条形码,其中多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列;多于一种随机引物;与第一通用序列和/或细胞标记的全部或一部分互补的一种或更多种阻断物寡核苷酸;缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶;以及逆转录酶。在一些实施方案中,随机引物包含随机核苷酸序列。在一些实施方案中,随机核苷酸序列的长度为约4个至约30个核苷酸。在一些实施方案中,随机核苷酸序列的长度为6个或9个核苷酸。
63.定义
64.除非另外定义,否则本文使用的技术术语和科学术语具有与本公开内容所属领域的普通技术人员通常所理解的相同意义。参见,例如,singleton等人,dictionary of microbiology and molecular biology,第2版,j.wiley&sons(new york,ny 1994);sambrook等人,molecular cloning,a laboratory manual,cold spring harbor press(cold spring harbor,ny 1989)。为了本公开内容的目的,下文定义了以下术语。
65.如本文使用的,术语“衔接子”可以意指促进关联的核酸的扩增或测序的序列。关联的核酸可以包括靶核酸。关联的核酸可以包括空间标记、靶标记、样品标记、索引标记或条形码序列(例如,分子标记)中的一种或更多种。衔接子可以是线性的。衔接子可以是预腺苷酸化的衔接子。衔接子可以是双链或单链的。一种或更多种衔接子可以位于核酸的5’端或3’端。当衔接子在5’端和3’端包含已知序列时,已知序列可以是相同或不同的序列。位于多核苷酸的5’端和/或3’端的衔接子可以能够与固定在表面上的一种或更多种寡核苷酸杂交。在一些实施方案中,衔接子可以包含通用序列。通用序列可以是两种或更多种核酸分子共有的核苷酸序列的区域。两种或更多种核酸分子也可以具有不同序列的区域。因此,例如,5’衔接子可以包含相同和/或通用核酸序列,并且3’衔接子可以包含相同和/或通用序列。可以存在于多于一种核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单种通用引物复制或扩增多于一种不同序列。类似地,可以存在于核酸分子的集合中的不同成员中的至少一种、两种(例如,一对)或更多种通用序列可以允许使用与通用序列互补的至少一种、两种(例如,一对)或更多种单一通用引物复制或扩增多于一种不同序列。因此,通用引物包含可与此类通用序列杂交的序列。可以修饰具有靶核酸序列的分子以将通用衔接子(例如,非靶核酸序列)附接到不同靶核酸序列的一个末端或两个末端。与靶核酸附接的一种或更多种通用引物可以提供通用引物杂交的位点。与靶核酸附接的一种或更多种通用引物可以彼此相同或不同。
66.如本文使用的,术语“关联”或“与...关联”可以意指,两个或更多个物质可以被鉴定为在某个时间点共定位。关联可以意指,两个或更多个物质在或曾经在相似的容器内。关联可以是信息学关联。例如,关于两个或更多个物质的数字信息可以被存储并且可以用于确定一种或更多种物质在某个时间点共定位。关联也可以是物理关联。在一些实施方案中,两个或更多个关联的物质彼此“拴系”、“附接”或“固定”或与共同的固体或半固体表面“拴系”、“附接”或“固定”。关联可以指用于将标记与固体或半固体支持物(诸如珠)附接的共价
或非共价方式。关联可以是靶与标记之间的共价键。关联可以包括两个分子(诸如靶分子和标记)之间的杂交。
67.如本文使用的,术语“互补”可以指两个核苷酸之间精确配对的能力。例如,如果核酸在给定位置处的核苷酸能够与另一个核酸的核苷酸形成氢键,则这两个核酸被认为在该位置处是彼此互补的。两个单链核酸分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在全部互补性时它可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补,则第一核苷酸序列可以被称为第二序列的“互补物”。如果第一核苷酸序列和与第二序列相反的序列(即,核苷酸顺序相反)互补,则第一核苷酸序列可以被称为第二序列的“反向互补物”。如本文使用的,“互补”序列可以指序列的“互补物”或“反向互补物”。从本公开内容理解,如果一个分子可以与另一个分子杂交,则其可以与其所杂交的分子互补或部分互补。
68.如本文使用的,术语“数字计数”可以指用于估计样品中靶分子数目的方法。数字计数可以包括确定已经与样品中的靶关联的独特标记的数目的步骤。这种方法(其本质上可以是随机的)将计数分子的问题从相同分子的定位和鉴定之一转化为有关检测一组预定义标记的一系列是/否数字问题。
69.如本文使用的,术语“一种标记(label)”或“多于一种标记(labels)”可以指与样品中的靶关联的核酸代码。标记可以是例如核酸标记。标记可以是完全或部分可扩增的标记。标记可以是完全或部分可测序的标记。标记可以是可鉴定为有区别的天然核酸的一部分。标记可以是已知的序列。标记可以包括核酸序列的连接处,例如天然和非天然序列的连接处。如本文使用的,术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如,在多种实施方案中,可以使用标记来确定样品的身份、样品的来源、细胞的身份和/或靶。
70.如本文使用的,术语“非耗尽性储库(non-depleting reservoir)”可以指由许多不同标记组成的条形码(例如,随机条形码)的池。非耗尽性储库可以包括大量不同的条形码,使得当非耗尽性储库与靶池关联时,每种靶可能与独特条形码关联。每种标记的靶分子的独特性可以通过随机选择的统计来确定,并且取决于与标记的多样性相比在集合中相同的靶分子的拷贝数。所得的标记的靶分子的集合的大小可以通过条形码化处理的随机性质来确定,并且然后对检测到的条形码的数目的分析允许计算原始集合或样品中存在的靶分子的数目。当存在的靶分子的拷贝数与独特条形码的数目的比率低时,标记的靶分子是高度独特的(即,多于一种靶分子被给定标记标记的概率非常低)。
71.如本文使用的,术语“核酸”是指多核苷酸序列或其片段。核酸可以包括核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是dna。核酸可以是rna。核酸可以包括一种或更多种类似物(例如,改变的主链、糖或核酸碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、非天然核酸(xeno nucleic acid)、吗啉代核酸(morpholinos)、锁核酸、二醇核酸、苏糖核酸、二脱氧核苷酸、虫草菌素、7-脱氮-gtp、荧光团(例如,罗丹明或与糖连接的荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、cpg岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫代尿苷、假尿苷、二氢尿苷、辫苷(queuosine)以及怀俄苷(wyosine)。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。
72.核酸可以包括一种或更多种修饰(例如,碱基修饰、主链修饰),以为核酸提供新的或增强的特征(例如,改进的稳定性)。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两个最常见的类别是嘌呤和嘧啶。核苷酸可以是还包括与核苷的糖部分共价连接的磷酸基团的核苷。对于包括呋喃戊糖的那些核苷,磷酸基团可以连接到糖的2’、3’或5’羟基部分。在形成核酸时,磷酸基团可以将相邻的核苷彼此共价连接以形成线性聚合化合物。继而,此线性聚合化合物的各端可以进一步连接而形成环状化合物;然而,线性化合物通常是合适的。此外,线性化合物可以具有内部核苷酸碱基互补性,并且因此可以按产生完全或部分双链化合物的方式折叠。在核酸中,磷酸基团通常可以称为形成核酸的核苷间主链。键(linkage)或主链可以是3’到5’磷酸二酯键。
73.核酸可以包括经修饰的主链和/或经修饰的核苷间键。经修饰的主链可以包括那些在主链中保留磷原子的主链和那些在主链中没有磷原子的主链。合适的其中含磷原子的经修饰的核酸主链可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯诸如3
’‑
亚烷基膦酸酯、5
’‑
亚烷基膦酸酯、手性膦酸酯、亚膦酸酯、磷酰胺酯(phosphoramidate)(包括3
’‑
氨基磷酰胺酯和氨基烷基磷酰胺酯、磷酸二酰胺酯(phosphorodiamidates)、硫代磷酰胺酯(thionophosphoramidates))、硫代烷基磷酸酯、硫代烷基磷酸三酯、硒代磷酸酯和硼磷酸酯,具有正常3
’‑5’
连接、2
’‑5’
连接的类似物以及具有反向极性的类似物(其中一个或更多个核苷酸间连接是3’至3’、5’至5’或2’至2’连接)。
74.核酸可以包括由短链烷基或环烷基核苷间键,混合杂原子,和烷基或环烷基核苷间键,或者一个或更多个短链杂原子的或杂环的核苷间键形成的多核苷酸主链。这些可以包括具有吗啉代(morpholino)连接的那些(部分由核苷的糖部分形成);硅氧烷主链;硫化物、亚砜和砜主链;甲乙酰基(formacetyl)和硫代甲乙酰基主链;亚甲基甲乙酰基和硫代甲乙酰基主链;核糖乙酰基主链;含烯烃的主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链;和具有混合的n、o、s和ch2组分部分的其他的那些。
75.核酸可以包括核酸模拟物。术语“模拟物”可以意在包括其中仅呋喃糖环或呋喃糖环和核苷酸间键二者被非呋喃糖基团替代的多核苷酸,仅呋喃糖环的替代也可以称为糖替代物(surrogate)。可以维持杂环碱基部分或经修饰的杂环碱基部分,以与适当的靶核酸杂交。一种这样的核酸可以是肽核酸(pna)。在pna中,多核苷酸的糖主链可以被含酰胺的主链替代,特别是被氨基乙基甘氨酸主链替代。核苷酸可以被保留,并且直接或间接与主链的酰胺部分的氮杂氮原子结合。pna化合物中的主链可以包含两个或更多个连接的氨基乙基甘氨酸单元,这使得pna具有含酰胺的主链。杂环碱基部分可以直接或间接与主链的酰胺部分的氮杂氮原子结合。
76.核酸可以包括吗啉代主链结构。例如,核酸可以包含替代核糖环的6元吗啉代环。在这些实施方案的一些中,磷酸二酰胺酯或其他非磷酸二酯核苷间键可以替代磷酸二酯键。
77.核酸可以包括具有附接至吗啉代环的杂环碱基的连接的吗啉代单元(例如,吗啉代核酸)。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化
合物与细胞蛋白可以具有较少的不期望的相互作用。基于吗啉代的多核苷酸可以是核酸的非离子模拟物。吗啉代类别内的各种化合物可以使用不同的连接基团来连接。另外类别的多核苷酸模拟物可以称为环己烯基核酸(cena)。核酸分子中通常存在的呋喃糖环可以被环己烯基环替代。使用亚磷酰胺化学可以制备cena dmt保护的亚磷酰胺单体并用于寡聚化合物合成。将cena单体掺入核酸链可以增加dna/rna杂合体的稳定性。cena寡腺苷酸酯可以与核酸互补物形成复合体,具有与天然复合体相似的稳定性。另外的修饰可以包括锁核酸(lna),其中2
’‑
羟基基团与糖环的4’碳原子连接,从而形成2
’‑
c,4
’‑
c-氧亚甲基连接,从而形成双环糖部分。连接可以是亚甲基(-ch
2-),桥接2’氧原子和4’碳原子的基团,其中n是1或2。lna和lna类似物可以显示与互补核酸的非常高的双链体热稳定性(tm= 3℃至 10℃)、对3
’‑
外切核酸酶降解的稳定性和良好的溶解性。
78.核酸还可以包括核碱基(通常简称为“碱基”)修饰或取代。如本文使用的,“未修饰的”或“天然的”核碱基可以包括嘌呤碱基(例如,腺嘌呤(a)和鸟嘌呤(g)),以及嘧啶碱基(例如,胸腺嘧啶(t)、胞嘧啶(c)和尿嘧啶(u))。经修饰的核碱基可以包括其他合成以及天然的核碱基,诸如5-甲基胞嘧啶(5-me-c)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物,2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-卤素尿嘧啶(5-halouracil)和胞嘧啶、5-丙炔基(-c≡c-ch3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物,6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫代尿嘧啶,8-卤素、8-氨基、8-硫代、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤素特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤、2-f-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。经修饰的核碱基可以包括三环嘧啶,诸如吩噁嗪胞苷(1h-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3h)-酮)、吩噻嗪胞苷(1h-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3h)-酮),g-钳(g-clamps)诸如取代的吩噁嗪胞苷(例如,9-(2-氨基乙氧基)-h-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3h)-酮)、吩噻嗪胞苷(1h-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3h)-酮),g-钳诸如取代的吩噁嗪胞苷(例如,9-(2-氨基乙氧基)-h-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3h)-酮)、咔唑胞苷(2h-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(h-吡啶并(3’,2’:4,5)吡咯并[2,3-d]嘧啶-2-酮)。
[0079]
如本文使用的,术语“样品”可以指包含靶的组合物。用于通过所公开的方法、装置和系统进行分析的合适样品包括细胞、组织、器官或生物体。
[0080]
如本文使用的,术语“采样装置”或“装置”可以指可以取样品的切片和/或将所述切片放置在基底上的装置。采样装置可以指例如荧光激活细胞分选(facs)机、细胞分选机、活检针、活检装置、组织切片装置、微流体装置、刀片格栅和/或超薄切片机。
[0081]
如本文使用的,术语“固体支持物”可以指可以附接多于一种条形码(例如,随机条形码)的离散固体或半固体表面。固体支持物可以包括任何类型的实心的、多孔的或空心的球体、球、承座(bearing)、圆柱体或由塑料、陶瓷、金属或聚合材料(例如,水凝胶)构成的其他类似配置,其上可以固定核酸(例如,共价地或非共价地)。固体支持物可以包括可以是球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。珠的形状可以是非球形的。以阵列间隔开的多于
一个固体支持物可以不包括基底。固体支持物可以与术语“珠”互换使用。
[0082]
如本文使用的,术语“随机条形码”可以指本公开内容的包含标记的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
[0083]
如本文使用的,术语“基因特异性随机条形码”可以指包含标记和基因特异性的靶结合区的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
[0084]
如本文使用的,术语“随机条形码化”可以指核酸的随机标记(例如,条形码化)。随机条形码化可以利用递归泊松策略来关联并对与靶关联的标记进行定量。如本文使用的,术语“随机条形码化”可以与“随机进行标记”互换使用。
[0085]
如本文使用的,术语“靶”可以指可与条形码(例如,随机条形码)关联的组合物。用于通过所公开的方法、装置和系统进行分析的示例性合适的靶包括寡核苷酸、dna、rna、mrna、微小rna、trna等。靶可以是单链的或双链的。在一些实施方案中,靶可以是蛋白、肽或多肽。在一些实施方案中,靶是脂质。如本文使用的,“靶”可以与“物质(species)”互换使用。
[0086]
如本文使用的,术语“逆转录酶”可以指具有逆转录酶活性(即,催化从rna模板合成dna)的一组酶。通常,这样的酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒(retroplasmid)逆转录酶、逆转录子逆转录酶、细菌逆转录酶、ii组内含子衍生的逆转录酶,及它们的突变体、变体或衍生物。非逆转录病毒逆转录酶包括非ltr逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶和ii组内含子逆转录酶。ii组内含子逆转录酶的实例包括乳酸乳球菌(lactococcus lactis)li.ltrb内含子逆转录酶、细长嗜热聚球藻(thermosynechococcus elongatus)tei4c内含子逆转录酶或嗜热脂肪土芽孢杆菌(geobacillus stearothermophilus)gsi-iic内含子逆转录酶。其他类别的逆转录酶可以包括许多类型的非逆转录病毒逆转录酶(即,尤其是逆转录子、ii组内含子、以及多样性产生型逆转录元件)。
[0087]
术语“通用衔接子引物”、“通用引物衔接子”或“通用衔接子序列”可互换地使用,以指可以用于与条形码(例如,随机条形码)杂交以产生基因特异性条形码的核苷酸序列。通用衔接子序列可以例如是在本公开内容的方法中使用的遍及所有条形码通用的已知序列。例如,当使用本文公开的方法标记多于一种靶时,每种靶特异性序列可以连接到相同的通用衔接子序列。在一些实施方案中,多于一种通用衔接子序列可以用于本文公开的方法中。例如,当使用本文公开的方法标记多于一种靶时,至少两种靶特异性序列连接到不同的通用衔接子序列。通用衔接子引物及其互补物可以被包括在两种寡核苷酸中,其中的一种寡核苷酸包含靶特异性序列且另一种寡核苷酸包含条形码。例如,通用衔接子序列可以是包含靶特异性序列的寡核苷酸的一部分以产生与靶核酸互补的核苷酸序列。包含条形码和通用衔接子序列的互补序列的第二寡核苷酸可与核苷酸序列杂交并产生靶特异性条形码
(例如,靶特异性随机条形码)。在一些实施方案中,通用衔接子引物具有与本公开内容的方法中使用的通用pcr引物不同的序列。
[0088]
条形码
[0089]
条形码化,诸如随机条形码化,已在例如us 2015/0299784、wo2015/031691和fu等人,proc natl acad sci u.s.a.2011年5月31日;108(22):9026-31中描述,这些专利申请和出版物的内容特此以其整体并入。在一些实施方案中,本文公开的条形码可以是随机条形码,所述随机条形码可以是可以用于对靶随机标记(例如,条形码化、加标签)的多核苷酸序列。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例可以是以下或可以是约以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或在这些值中的任何两个之间的数字或范围,则条形码可以称为随机条形码。靶可以是包括具有相同或几乎相同序列的mrna分子的mrna物质。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例是至少以下或是至多以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1,则条形码可以称为随机条形码。随机条形码的条形码序列可以称为分子标记。
[0090]
条形码(例如,随机条形码)可以包括一种或更多种标记。示例性标记可以包括通用标记、细胞标记、条形码序列(例如,分子标记)、样品标记、板标记、空间标记和/或前空间标记(pre-spatial label)。图1图示了具有空间标记的示例性条形码104。条形码104可以包含可以使条形码与固体支持物108连接的5’胺。条形码可以包含通用标记、维度标记、空间标记、细胞标记和/或分子标记。条形码中不同标记(包括但不限于通用标记、维度标记、空间标记、细胞标记和分子标记)的顺序可以变化。例如,如图1中所示,通用标记可以是最5’侧的标记(5
’‑
most label),且分子标记可以是最3’侧的标记(3
’‑
most label)。空间标记、维度标记和细胞标记可以处于任何顺序。在一些实施方案中,通用标记、空间标记、维度标记、细胞标记和分子标记处于任何顺序。条形码可以包含靶结合区。靶结合区可以与样品中的靶(例如,靶核酸、rna、mrna、dna)相互作用。例如,靶结合区可以包含可以与mrna的多(a)尾相互作用的寡(dt)序列。在一些情况下,条形码的标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列)可以由1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸隔开。
[0091]
标记(例如,细胞标记)可以包含一组独特的定义长度的核酸子序列,例如每种七个核苷酸(相当于一些汉明错误校正代码中使用的比特数目),其可被设计成提供错误校正能力。可以设计包含七个核苷酸序列的错误校正子序列组,使得所述组中的序列的任何成对组合展现出定义的“遗传距离”(或错配碱基数),例如一组错误校正子序列可被设计成展现三个核苷酸的遗传距离。在这种情况下,对于标记的靶核酸分子的序列数据组中的错误校正序列的审查(在下文更详细地描述)可允许人们检测或校正扩增错误或测序错误。在一些实施方案中,用于产生错误校正代码的核酸子序列的长度可以变化,例如,它们的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、31个、40个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。在一些实施方案中,其他长度的核酸子序列可以用来产生错误校正代码。
[0092]
条形码可以包含靶结合区。靶结合区可以与样品中的靶相互作用。靶可以是以下或包括以下:核糖核酸(rna)、信使rna(mrna)、微小rna、小干扰rna(sirna)、rna降解产物、各自含有多(a)尾的rna或其任何组合。在一些实施方案中,多于一种靶可以包括脱氧核糖核酸(dna)。
[0093]
在一些实施方案中,靶结合区可以包括可以与mrna的多(a)尾相互作用的寡(dt)序列。条形码的一种或更多种标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列(例如,分子标记))可以通过间隔区(spacer)与条形码的另一种或两种剩余标记隔开。间隔区可以是例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸。在一些实施方案中,条形码的所有标记都未被间隔区隔开。
[0094]
通用标记
[0095]
条形码可以包含一种或更多种通用标记。在一些实施方案中,一种或更多种通用标记对于附接至给定固体支持物的条形码组中的所有条形码可以是相同的。在一些实施方案中,一种或更多种通用标记对于附接至多于一个珠的所有条形码可以是相同的。在一些实施方案中,通用标记可以包括能够与测序引物杂交的核酸序列。测序引物可以用于对包括通用标记的条形码进行测序。测序引物(例如,通用测序引物)可以包括与高通量测序平台相关的测序引物。在一些实施方案中,通用标记可以包括能够与pcr引物杂交的核酸序列。在一些实施方案中,通用标记可以包括能够与测序引物和pcr引物杂交的核酸序列。能够与测序引物或pcr引物杂交的通用标记的核酸序列可以被称为引物结合位点。通用标记可以包括可以用于引发条形码转录的序列。通用标记可以包括可以用于延伸条形码或条形码内的区域的序列。通用标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。例如,通用标记可以包括至少约10个核苷酸。通用标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。在一些实施方案中,可裂解接头或经修饰的核苷酸可以是通用标记序列的一部分,以使条形码能够从支持物上被裂解下来。
[0096]
维度标记
[0097]
条形码可以包含一种或更多种维度标记。在一些实施方案中,维度标记可以包括提供关于标记(例如,随机标记)发生的维度的信息的核酸序列。例如,维度标记可以提供关于靶被条形码化的时间的信息。维度标记可以与样品中条形码化(例如,随机条形码化)的时间关联。维度标记可以在标记的时间被激活。不同的维度标记可以在不同的时间被激活。维度标记提供关于靶、靶的组和/或样品被条形码化的顺序的信息。例如,在细胞周期的g0期可以将细胞的群体条形码化。在细胞周期的g1期,可以用条形码(例如,随机条形码)对细胞再次进行脉冲处理。在细胞周期的s期,可以用条形码对细胞再次进行脉冲处理,等等。每个脉冲(例如,细胞周期的每个时期)的条形码可以包含不同的维度标记。以这种方式,维度标记提供关于哪些靶在细胞周期的哪个时期被标记的信息。维度标记可以探询许多不同的生物学时间。示例性的生物学时间可以包括但不限于细胞周期、转录(例如,转录起始)和转录物降解。在另一种实例中,样品(例如,细胞、细胞的群体)可以在用药物和/或疗法治疗之前和/或之后标记。不同靶的拷贝数的变化可以指示样品对药物和/或疗法的响应。
[0098]
维度标记可以是可激活的。可激活的维度标记可以在特定时间点被激活。可激活的标记可以被例如组成型地激活(例如,不关闭)。可激活的维度标记可以被例如可逆地激活(例如,可激活的维度标记可以被打开和关闭)。维度标记可以被例如可逆地激活至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。维度标记可以被可逆地激活例如至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。在一些实施方案中,可以用荧光、光、化学事件(例如,裂解,连接另一种分子,添加修饰(例如,聚乙二醇化、类泛素化(sumoylate)、乙酰化、甲基化、去乙酰化、去甲基化)、光化学事件(例如,光罩(photocaging))以及引入非天然的核苷酸将维度标记激活。
[0099]
在一些实施方案中,维度标记对于附接至给定固体支持物(例如,珠)的所有条形码(例如,随机条形码)可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上至少60%、70%、80%、85%、90%、95%、97%、99%或100%的条形码可以包含相同的维度标记。在一些实施方案中,同一固体支持物上至少60%的条形码可以包含相同的维度标记。在一些实施方案中,同一固体支持物上至少95%的条形码可以包含相同的维度标记。
[0100]
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特维度标记序列。维度标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。维度标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。维度标记可以包含约5个至约200个之间的核苷酸。维度标记可以包含约10个至约150个之间的核苷酸。维度标记可以包含长度在约20个至约125个之间的核苷酸。
[0101]
空间标记
[0102]
条形码可以包含一种或更多种空间标记。在一些实施方案中,空间标记可以包含提供关于与条形码关联的靶分子的空间取向的信息的核酸序列。空间标记可以与样品中的坐标关联。坐标可以是固定的坐标。例如,坐标可以相对于基底固定。空间标记可以参考二维或三维网格。坐标可以相对于界标(landmark)固定。界标可在空间中被鉴定。界标可以是可被成像的结构。界标可以是生物结构,例如解剖学界标。界标可以是细胞界标,例如细胞器。界标可以是非天然界标,诸如具有可鉴定标识(诸如色码、条形码、磁特性(magnetic property)、荧光、放射性或独特尺寸或形状)的结构。空间标记可以与物理分区(例如,孔、容器或液滴)关联。在一些实施方案中,将多于一种空间标记一起用于编码空间中的一个或更多个位置。
[0103]
空间标记对于附接至给定固体支持物(例如,珠)的所有条形码可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上包含相同空间标记的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或在这些值中的任何两个之间的数字或范围。在一些实施方案中,同一固体支持物上包含相同空间标记的条形码的百分比可以是至少以下或是至多以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施方案中,同一固体支持物上至少60%的条形码可以包含相同的空间标记。在一些实施方案中,同一固体支持物上至少95%的条形码可以包含相同的空间标记。
[0104]
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特空间标记序列。空间标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。空间标记的长度可以是至少以下或至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。空间标记可以包含约5个至约200个之间的核苷酸。空间标记可以包含约10个至约150个之间的核苷酸。空间标记可以包含长度在约20个至约125个之间的核苷酸。
[0105]
细胞标记
[0106]
条形码(例如,随机条形码)可以包含一种或更多种细胞标记。在一些实施方案中,细胞标记可以包含提供用于确定哪种靶核酸来源于哪种细胞的信息的核酸序列。在一些实施方案中,细胞标记对于附接至给定固体支持物(例如,珠)的所有条形码是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上包含相同细胞标记的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或在这些值中的任何两个之间的数字或范围。在一些实施方案中,同一固体支持物上包含相同细胞标记的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。例如,同一固体支持物上至少60%的条形码可以包含相同的细胞标记。作为另一种实例,同一固体支持物上至少95%的条形码可以包含相同的细胞标记。
[0107]
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特细胞标记序列。细胞标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。细胞标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。例如,细胞标记可以包含约5个至约200个之间的核苷酸。作为另一种实例,细胞标记可以包含约10个至约150个之间的核苷酸。作为又另一种实例,细胞标记可以包含长度在约20个至约125个之间的核苷酸。
[0108]
条形码序列
[0109]
条形码可以包含一种或更多种条形码序列。在一些实施方案中,条形码序列可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。条形码序列可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器(例如,提供粗略估计)的核酸序列。
[0110]
在一些实施方案中,将一组相异的(diverse)条形码序列附接至给定固体支持物(例如,珠)。在一些实施方案中,可以存在以下或可以存在约以下:102种、103种、104种、105种、106种、107种、108种、109种独特分子标记序列或在这些值中的任何两个之间的数字或范围的独特分子标记序列。例如,多于一种条形码可以包括约6561种具有不同序列的条形码序列。作为另一种实例,多于一种条形码可以包括约65536种具有不同序列的条形码序列。在一些实施方案中,可以存在至少以下或至多以下:102种、103种、104种、105种、106种、107种、108种或109种独特条形码序列。独特分子标记序列可以附接至给定固体支持物(例如,珠)。在一些实施方案中,独特分子标记序列被颗粒(例如水凝胶珠)部分或全部包含。
[0111]
在不同实施方式中,条形码的长度可以是不同的。例如,条形码的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。作为另一种实例,条形码的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。
[0112]
分子标记
[0113]
条形码(例如,随机条形码)可以包含一种或更多种分子标记。分子标记可以包含条形码序列。在一些实施方案中,分子标记可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。分子标记可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器的核酸序列。
[0114]
在一些实施方案中,将一组相异的分子标记附接至给定固体支持物(例如,珠)。在一些实施方案中,可以存在以下或可以存在约以下:102种、103种、104种、105种、106种、107种、108种、109种或在这些值中的任何两个之间的数字或范围的独特分子标记序列。例如,多于一种条形码可以包括约6561种具有不同序列的分子标记。作为另一种实例,多于一种条形码可以包括约65536种具有不同序列的分子标记。在一些实施方案中,可以存在至少或至多102种、103种、104种、105种、106种、107种、108种或109种独特分子标记序列。具有独特分子标记序列的条形码可以附接至给定固体支持物(例如,珠)。
[0115]
对于使用多于一种随机条形码的条形码化(例如,随机条形码化),不同分子标记序列的数目与任何靶的出现数目的比例可以是以下或可以是约以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或在这些值中的任何两个之间的数字或范围。靶可以是包括具有相同或几乎相同序列的mrna分子的mrna物质。在一些实施方案中,不同分子标记序列的数目与任何靶的出现数目的比例是至少以下或是至多以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1。
[0116]
分子标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。分子标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。
[0117]
靶结合区
[0118]
条形码可以包含一个或更多个靶结合区,诸如捕获探针。在一些实施方案中,靶结合区可以与感兴趣的靶杂交。在一些实施方案中,靶结合区可以包含与靶(例如,靶核酸、靶分子,例如待分析的细胞核酸)特异性杂交(例如,与特定基因序列特异性杂交)的核酸序列。在一些实施方案中,靶结合区可以包含可以附接(例如,杂交)至特定靶核酸的特定位置的核酸序列。在一些实施方案中,靶结合区可以包含能够与限制性酶位点突出端(例如,ecori粘性末端突出端)特异性杂交的核酸序列。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。
[0119]
在一些实施方案中,靶结合区可以包含非特异性靶核酸序列。非特异性靶核酸序列可以指可以独立于靶核酸的特定序列结合多于一种靶核酸的序列。例如,靶结合区可以
包括随机多聚体序列或与mrna分子上的多(a)尾杂交的寡(dt)序列。随机多聚体序列可以是,例如,随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或任何长度的更高多聚体序列。在一些实施方案中,对于附接至给定珠的所有条形码,靶结合区是相同的。在一些实施方案中,对于附接至给定珠的多于一种条形码,靶结合区可以包括两种或更多种不同的靶结合序列。靶结合区的长度可以是以下或可以是约以下:5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。靶结合区的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。
[0120]
在一些实施方案中,靶结合区可以包含寡(dt),所述寡(dt)可以与包含聚腺苷酸化末端的mrna杂交。靶结合区可以是基因特异性的。例如,可以将靶结合区配置为与靶的特定区域杂交。靶结合区的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。靶结合区的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸。靶结合区的长度可以是约5-30个核苷酸。当条形码包含基因特异性靶结合区时,条形码在本文中可以称为基因特异性条形码。
[0121]
定向特性(orientation property)
[0122]
随机条形码(例如,随机条形码)可以包含一种或更多种可以用于对条形码进行定向(例如,比对)的定向特性。条形码可以包含用于等电聚焦的部分。不同的条形码可以包含不同的等电聚焦点。当将这些条形码引入样品中时,样品可以经历等电聚焦,以便于将条形码定向成已知的方式。以这种方式,定向特性可以用于开发样品中条形码的已知的映射。示例性定向特性可以包括电泳迁移率(例如,基于条形码的尺寸)、等电点、自旋、电导率和/或自组装。例如,具有自组装的定向特性的条形码激活时可以自组装成特定的定向(例如,核酸纳米结构)。
[0123]
亲和特性(affinity property)
[0124]
条形码(例如,随机条形码)可以包含一种或更多种亲和特性。例如,空间标记可以包含亲和特性。亲和特性可以包括可以促进条形码与另一种实体(例如,细胞受体)结合的化学部分和/或生物部分。例如,亲和特性可以包括抗体,例如,对样品上的特定部分(例如,受体)特异性的抗体。在一些实施方案中,抗体可以将条形码引导至特定细胞类型或分子。在特定细胞类型或分子处和/或特定细胞类型或分子附近的靶可以被标记(例如,被随机标记)。在一些实施方案中,亲和特性可以提供空间标记的核苷酸序列之外的空间信息,因为抗体可以将条形码引导至特定位置。抗体可以是治疗性抗体,例如单克隆抗体或多克隆抗体。抗体可以是人源化的或嵌合的。抗体可以是裸抗体或融合抗体。
[0125]
抗体可以是全长(即,天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如,igg抗体)或免疫球蛋白分子的免疫活性(即,特异性结合性)部分(如抗体片段)。
[0126]
抗体片段可以是例如抗体的一部分,诸如f(ab’)2、fab’、fab、fv、sfv等。在一些实
施方案中,抗体片段可以与由全长抗体识别的相同抗原结合。抗体片段可以包括由抗体的可变区组成的分离的片段,诸如由重链和轻链的可变区组成的“fv”片段和其中轻链和重链可变区通过肽接头连接的重组单链多肽分子(“scfv蛋白”)。示例性抗体可以包括但不限于癌细胞抗体、病毒抗体、与细胞表面受体(cd8、cd34、cd45)结合的抗体和治疗性抗体。
[0127]
通用衔接子引物
[0128]
条形码可以包含一种或更多种通用衔接子引物。例如,基因特异性条形码(诸如基因特异性随机条形码)可以包含通用衔接子引物。通用衔接子引物可以指遍及所有条形码的通用的核苷酸序列。通用衔接子引物可以用于构建基因特异性条形码。通用衔接子引物的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。通用衔接子引物的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸。通用衔接子引物的长度可以是5-30个核苷酸。
[0129]
接头
[0130]
当条形码包含多于一种类型的标记(例如,多于一种细胞标记或多于一种条形码序列,诸如一种分子标记)时,标记之间可以散布有接头标记序列。接头标记序列的长度可以是至少约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。接头标记序列的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。在一些情况下,接头标记序列的长度是12个核苷酸。接头标记序列可以用于促进条形码的合成。接头标记可以包括错误校正(例如,汉明)码。
[0131]
固体支持物
[0132]
在一些实施方案中,本文公开的条形码(诸如随机条形码)可以与固体支持物关联。固体支持物可以是例如合成颗粒。在一些实施方案中,固体支持物上的多于一种条形码(例如,第一多于一种条形码)的一些或所有条形码序列(诸如,随机条形码(例如,第一条形码序列)的分子标记)相差至少一个核苷酸。同一固体支持物上的条形码的细胞标记可以是相同的。不同的固体支持物上的条形码的细胞标记可以相差至少一个核苷酸。例如,第一固体支持物上的第一多于一种条形码的第一细胞标记可以具有相同的序列,且第二固体支持物上的第二多于一种条形码的第二细胞标记可以具有相同的序列。第一固体支持物上的第一多于一种条形码的第一细胞标记和第二固体支持物上的第二多于一种条形码的第二细胞标记可以相差至少一个核苷酸。细胞标记可以是例如约5-20个核苷酸长。条形码序列可以是例如约5-20个核苷酸长。合成颗粒可以是例如珠。
[0133]
珠可以是例如硅胶珠、可控孔径玻璃珠、磁珠、dynabead、sephadex/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠或其任何组合。珠可以包括材料诸如聚二甲基硅氧烷(pdms)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮或其任何组合。
[0134]
在一些实施方案中,珠可以是用条形码或随机条形码官能化的聚合物珠(例如可变形珠或凝胶珠)(诸如来自10x genomics(san francisco,ca)的凝胶珠)。在一些实施方
式中,凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促进剂(例如,四甲基乙二胺(temed))后,可以产生凝胶珠。
[0135]
在一些实施方案中,颗粒可以是可破坏的(例如,可溶解的、可降解的)。例如,聚合物珠可以例如在期望的条件下溶解、熔化或降解。所期望的条件可以包括环境条件。所期望的条件可以导致聚合物珠以受控方式溶解、熔化或降解。凝胶珠可以由于化学刺激、物理刺激、生物刺激、热刺激、磁刺激、电刺激、光刺激或其任何组合而溶解、熔化或降解。
[0136]
例如,分析物和/或试剂(诸如寡核苷酸条形码)可以偶联/固定至凝胶珠的内表面(例如,经由寡核苷酸条形码和/或用于产生寡核苷酸条形码的材料的扩散而可及的内部)和/或凝胶珠的外表面或本文描述的任何其他微胶囊。偶联/固定可以经由任何形式的化学键合(例如,共价键、离子键)或物理现象(例如,范德华力、偶极-偶极相互作用等)。在一些实施方案中,本文描述的试剂与凝胶珠或任何其他微胶囊的偶联/固定可以是可逆的,诸如,例如经由不稳定型部分(例如,经由化学交联物,包括本文描述的化学交联物)。在施加刺激后,不稳定型部分可以被裂解并释放所固定的试剂。在一些实施方案中,不稳定型部分是二硫键。例如,在经由二硫键将寡核苷酸条形码固定至凝胶珠的情况下,使二硫键暴露于还原剂可以裂解二硫键并从珠释放寡核苷酸条形码。不稳定型部分可以作为凝胶珠或微胶囊的一部分、作为将试剂或分析物与凝胶珠或微胶囊连接的化学接头的一部分和/或作为试剂或分析物的一部分被包括。在一些实施方案中,多于一种条形码的至少一种条形码可以被固定在颗粒上、被部分固定在颗粒上、被包封在颗粒中、被部分包封在颗粒中或其任何组合。
[0137]
在一些实施方案中,凝胶珠可以包括宽范围的不同的聚合物,包括但不限于:聚合物、热敏聚合物、光敏聚合物、磁性聚合物、ph敏感聚合物、盐敏感聚合物、化学敏感聚合物、聚电解质、多糖、肽、蛋白和/或塑料。聚合物可以包括但不限于以下材料:诸如聚(n-异丙基丙烯酰胺)(pnipaam)、聚(苯乙烯磺酸酯)(pss)、聚(烯丙基胺)(paam)、聚(丙烯酸)(paa)、聚(乙烯亚胺)(pei)、聚(双烯丙基二甲基-氯化铵)(pdadmac)、聚(吡咯)(poly(pyrolle),ppy)、聚(乙烯基吡咯烷酮)(pvpon)、聚(乙烯基吡啶)(pvp)、聚(甲基丙烯酸)(pmaa)、聚(甲基丙烯酸甲酯)(pmma)、聚苯乙烯(ps)、聚(四氢呋喃)(pthf)、聚(邻苯二甲醛)(ppa)、聚(己基紫精)(phv)、聚(l-赖氨酸)(pll)、聚(l-精氨酸)(parg)、聚(乳酸-共-羟基乙酸)(plga)。
[0138]
许多化学刺激可以用于触发珠的破坏、溶解或降解。这些化学改变的实例可以包括但不限于ph介导的珠壁改变、经由交联键的化学裂解使珠壁崩解、珠壁的触发解聚和珠壁转换反应。批量(bulk)改变也可以用于触发珠的破坏。
[0139]
通过各种刺激对微胶囊的批量或物理改变在设计胶囊以释放试剂方面也提供了许多优点。在宏观尺度上发生批量或物理改变,其中珠破裂是由刺激引起的机械-物理力的结果。这些过程可以包括但不限于压力引起的破裂、珠壁熔化或珠壁的孔隙率的改变。
[0140]
生物刺激也可以用于触发珠的破坏、溶解或降解。通常,生物触发物类似于化学触发物,但是许多实例使用生物分子或生命系统中常见的分子,诸如酶、肽、糖、脂肪酸、核酸等。例如,珠可以包含具有对特定蛋白酶的裂解敏感的肽交联的聚合物。更特别地,一种实例可以包括包含gflgk肽交联的微胶囊。在添加生物触发物(诸如蛋白酶组织蛋白酶b(cathepsin b))后,壳壁的肽交联被裂解并且珠的内容物被释放。在其他情况下,蛋白酶可
以是热激活的。在另一种实例中,珠包括包含纤维素的壳壁。壳聚糖水解酶的添加用作纤维素键裂解、壳壁解聚及其内部内容物释放的生物触发物。
[0141]
还可以在施加热刺激后诱导珠释放其内容物。温度的改变可以引起珠的各种改变。热量的变化可以引起珠熔化,使得珠壁崩解。在一些实施方案中,热量可以增加珠内部组分的内部压力,使得珠破裂或爆炸。在一些实施方案中,热量可以使珠转化成收缩的脱水状态。热量还可以作用于珠壁内的热敏聚合物,从而引起珠的破坏。
[0142]
将磁性纳米颗粒包括在微胶囊的珠壁中可以允许珠的触发破裂以及将珠引导呈阵列形式。本公开内容的装置可以包括用于任一目的的磁珠。在一种实例中,将fe3o4纳米颗粒掺入含聚电解质的珠中,在存在振荡磁场刺激的情况下触发破裂。
[0143]
珠也可以由于电刺激的结果被破坏、溶解或降解。与先前部分中描述的磁性颗粒类似,电敏珠可以允许珠的触发破裂以及其他功能,诸如电场中的对齐、电导率或氧化还原反应。在一种实例中,含电敏材料的珠在电场中对齐,从而可以控制内部试剂的释放。在其他实例中,电场可以在珠壁自身内引起氧化还原反应,这可以增加孔隙率。
[0144]
也可以使用光刺激来破坏珠。许多光触发物是可能的,并且可以包括使用各种分子(诸如能够吸收特定波长范围的光子的纳米颗粒和发色团)的系统。例如,金属氧化物涂层可以用作胶囊触发物。涂覆有sio2的聚电解质胶囊的uv照射可以导致珠壁的崩解。在又另一种实例中,可以将可光切换材料(诸如偶氮苯基团)掺入珠壁中。在施加uv或可见光后,诸如这些化学物质的化学物质在吸收光子后经历可逆的顺式至反式异构化。在此方面,光子开关(photon switch)的掺入产生了在施加光触发物后可以崩解或变得更多孔的珠壁。
[0145]
例如,在图2中图示的条形码化(例如,随机条形码化)的非限制性实例中,在框208处将细胞(诸如单细胞)引入微孔阵列的多于一个微孔上之后,在框212处可以将珠引入微孔阵列的多于一个微孔上。每个微孔可以包含一个珠。珠可以包含多于一种条形码。条形码可以包含附接至珠的5’胺区域。条形码可以包含通用标记、条形码序列(例如,分子标记)、靶结合区或其任何组合。
[0146]
本文公开的条形码可以与固体支持物(例如,珠)关联(例如,附接)。与固体支持物关联的条形码可各自包含选自这样的组的条形码序列,所述组包括至少100种或1000种具有独特序列的条形码序列。在一些实施方案中,与固体支持物关联的不同条形码可以包含具有不同序列的条形码。在一些实施方案中,与固体支持物关联的条形码的一定百分比包含相同的细胞标记。例如,百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或在这些值中的任何两个之间的数字或范围。作为另一个实例,所述百分比可以是至少以下或可以是至多以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施方案中,与固体支持物关联的条形码可以具有相同的细胞标记。与不同固体支持物关联的条形码可以具有选自这样的组的不同的细胞标记,所述组包括至少100种或1000种具有独特序列的细胞标记。
[0147]
本文公开的条形码可以与固体支持物(例如,珠)关联(例如,附接)。在一些实施方案中,可以用包括与多于一种条形码关联的多于一种合成颗粒的固体支持物将样品中的多于一种靶条形码化。在一些实施方案中,固体支持物可以包括与多于一种条形码关联的多于一个合成颗粒。不同固体支持物上的多于一种条形码的空间标记可以相差至少一个核苷酸。固体支持物可以例如在二维或三维包括多于一种条形码。合成颗粒可以是珠。珠可以是
硅胶珠、可控孔径玻璃珠、磁珠、dynabead、sephadex/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠或其任何组合。固体支持物可以包括聚合物、基质、水凝胶、针阵列装置、抗体或其任何组合。在一些实施方案中,固体支持物可以自由浮动。在一些实施方案中,固体支持物可以包埋到半固体或固体阵列中。条形码可以不与固体支持物关联。条形码可以是单独的核苷酸。条形码可以与基底关联。
[0148]
如本文使用的,术语“拴系的”、“附接的”和“固定的”可以互换使用,并且可以指用于将条形码附接至固体支持物的共价或非共价方式。可以将各种不同的固体支持物中的任何一种用作固体支持物,以用于附接预先合成的条形码或用于原位固相合成条形码。
[0149]
在一些实施方案中,固体支持物是珠。珠可以包括一种或更多种类型的实心的、多孔的或空心的球体、球、承座、圆柱体或可以固定核酸(例如,共价地或非共价地)的其他类似配置。珠可以由例如塑料、陶瓷、金属、聚合物材料或其任何组合构成。珠可以是或包括球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。在一些实施方案中,珠的形状可以是非球形的。
[0150]
珠可以包含包括但不限于以下的各种材料:顺磁材料(例如,镁、钼、锂和钽)、超顺磁材料(例如,铁氧体(fe3o4;磁铁矿)纳米颗粒)、铁磁材料(例如,铁、镍、钴,它们的一些合金,以及一些稀土金属化合物)、陶瓷、塑料、玻璃、聚苯乙烯、二氧化硅、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、琼脂糖、水凝胶、聚合物、纤维素、尼龙或其任何组合。
[0151]
在一些实施方案中,珠(例如,标记所附接的珠)是水凝胶珠。在一些实施方案中,珠包括水凝胶。
[0152]
本文公开的一些实施方案包括一个或更多个颗粒(例如,珠)。每个颗粒可以包含多于一种寡核苷酸(例如,条形码)。多于一种寡核苷酸中的每一种可以包含条形码序列(例如,分子标记序列)、细胞标记和靶结合区(例如,寡(dt)序列、基因特异性序列、随机多聚体或其组合)。多于一种寡核苷酸的每一种的细胞标记序列可以是相同的。不同颗粒上的寡核苷酸的细胞标记序列可以是不同的,使得可以鉴定不同颗粒上的寡核苷酸。在不同实施方式中,不同细胞标记序列的数目可以是不同的。在一些实施方案中,细胞标记序列的数目可以是以下或可以是约以下:10种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、3000种、4000种、5000种、6000种、7000种、8000种、9000种、10000种、20000种、30000种、40000种、50000种、60000种、70000种、80000种、90000种、100000种、106种、107种、108种、109种、在这些值中的任何两个之间的数字或范围或更多。在一些实施方案中,细胞标记序列的数目可以是至少以下或可以是至多以下:10种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、3000种、4000种、5000种、6000种、7000种、8000种、9000种、10000种、20000种、30000种、40000种、50000种、60000种、70000种、80000种、90000种、100000种、106种、107种、108种或109种。在一些实施方案中,多于一个颗粒中不多于1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个或更多个包含具有相同细胞序列的寡核苷酸。在一些实施方案中,包含具有相同细胞序列的寡核苷酸的多于一个颗粒可以是至多0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%或更多。在一些实施方案中,多于一个颗粒全都不具有相同的细胞标记序列。
[0153]
在每个颗粒上的多于一种寡核苷酸可以包含不同的条形码序列(例如,分子标记)。在一些实施方案中,条形码序列的数目可以是以下或可以是约以下:10种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、3000种、4000种、5000种、6000种、7000种、8000种、9000种、10000种、20000种、30000种、40000种、50000种、60000种、70000种、80000种、90000种、100000种、106种、107种、108种、109种或在这些值中的任何两个之间的数字或范围。在一些实施方案中,条形码序列的数目可以是至少以下或可以是至多以下:10种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、3000种、4000种、5000种、6000种、7000种、8000种、9000种、10000种、20000种、30000种、40000种、50000种、60000种、70000种、80000种、90000种、100000种、106种、107种、108种或109种。例如,多于一种寡核苷酸中的至少100种包含不同的条形码序列。作为另一种实例,在单个颗粒中,多于一种寡核苷酸中的至少100种、500种、1000种、5000种、10000种、15000种、20000种、50000种、这些值中的任何两个之间的数字或范围或更多种包含不同的条形码序列。一些实施方案提供了多于一种包含条形码的颗粒。在一些实施方案中,待标记的靶和不同条形码序列的出现(或拷贝或数目)的比例可以是至少1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90或更高。在一些实施方案中,多于一种寡核苷酸的每一种还包含样品标记、通用标记或二者。颗粒可以是例如纳米颗粒或微米颗粒。
[0154]
珠的尺寸可以不同。例如,珠的直径的范围可以是0.1微米至50微米。在一些实施方案中,珠的直径可以是以下或可以是约以下:0.1微米、0.5微米、1微米、2微米、3微米、4微米、5微米、6微米、7微米、8微米、9微米、10微米、20微米、30微米、40微米或50微米或在这些值中的任何两个之间的数字或范围。
[0155]
珠的直径可以与基底的孔的直径相关。在一些实施方案中,珠的直径可以比孔的直径长或短以下或者约以下:10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或在这些值中的任何两个之间的数字或范围。珠的直径可以与细胞(例如,被基底的孔捕获的单细胞)的直径相关。在一些实施方案中,珠的直径可以比孔的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。珠的直径可以与细胞(例如,被基底的孔捕获的单细胞)的直径相关。在一些实施方案中,珠的直径可以比细胞的直径长或短以下或者约以下:10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、300%或在这些值中的任何两个之间的数字或范围。在一些实施方案中,珠的直径可以比细胞的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%或300%。
[0156]
珠可以附接至基底和/或包埋到基底中。珠可以附接至凝胶、水凝胶、聚合物和/或基质和/或包埋到凝胶、水凝胶、聚合物和/或基质中。珠在基底(例如凝胶、基质、支架或聚合物)中的空间位置可以使用珠上的条形码上存在的空间标记来鉴定,该空间标记可以用作位置地址。
[0157]
珠的实例可以包括但不限于链霉抗生物素蛋白珠、琼脂糖珠、磁珠、微珠、抗体缀合的珠(例如,抗免疫球蛋白微珠)、蛋白a缀合的珠、蛋白g缀合的珠、蛋白a/g缀合的珠、蛋白l缀合的珠、寡(dt)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠和bcmag
tm
羧基封端磁珠。
[0158]
珠可以与量子点或荧光染料关联(例如,用量子点或荧光染料浸渍),以使其在一个荧光光学通道或多于一个光学通道中发荧光。珠可以与氧化铁或氧化铬关联,使其成为顺磁性或铁磁性。珠可以是可鉴定的。例如,可以使用照相机对珠成像。珠可以具有与珠关联的可检测代码。例如,珠可以包含条形码。珠可以改变尺寸,例如由于在有机溶液或无机溶液中溶胀。珠可以是疏水的。珠可以是亲水的。珠可以是生物相容的。
[0159]
固体支持物(例如,珠)可以被可视化。固体支持物可以包含可视化标签(例如,荧光染料)。固体支持物(例如,珠)可以蚀刻有标识符(例如,数字)。标识符可以通过对珠成像来可视化。
[0160]
固体支持物可以包括可溶性、半溶性或不溶性材料。当固体支持物包括接头、支架、构建模块(building block)或其他与其附接的反应性部分时,固体支持物可以被称为“官能化的”,而当固体支持物缺少这种与其附接的反应性部分时,固体支持物可以被称为“非官能化的”。固体支持物可以以溶液中游离,诸如在微量滴定孔中的形式;以流通形式,诸如在柱中;或以浸量尺(dipstick)使用。
[0161]
固体支持物可以包括膜、纸(paper)、塑料、涂覆表面、平坦表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以采取树脂、凝胶、微球或其他几何配置的形式。固体支持物可以包括二氧化硅芯片、微米颗粒、纳米颗粒、板、阵列、毛细管、平坦支持物诸如玻璃纤维过滤器、玻璃表面、金属表面(钢、金、银、铝、硅和铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片、塑料材料包括多孔板或膜(例如,由聚乙烯、聚丙烯、聚酰胺、聚偏二氟乙烯形成),和/或晶片、梳、针或针头(例如,适于组合合成或分析的针阵列)或珠,平坦表面诸如晶片(例如,硅晶片)的凹陷或纳升孔阵列,具有凹陷的晶片(具有或不具有过滤器底部)。
[0162]
固体支持物可以包括聚合物基质(例如,凝胶、水凝胶)。聚合物基质可以能够渗透细胞内空间(例如,细胞器周围)。聚合物基质可以能够被泵送到整个循环系统。
[0163]
基底和微孔阵列
[0164]
如本文使用的,基底可以指固体支持物类型。基底可以指可以包含本公开内容的条形码或随机条形码的固体支持物。基底可以例如包括多于一个微孔。基底可以例如是包括两个或更多个微孔的孔阵列。在一些实施方案中,微孔可以包括定义体积的小的反应室。在一些实施方案中,微孔可以捕获一个或更多个细胞。在一些实施方案中,微孔可以仅捕获一个细胞。在一些实施方案中,微孔可以捕获一个或更多个固体支持物。在一些实施方案中,微孔可以仅捕获一个固体支持物。在一些实施方案中,微孔捕获单细胞和单个固体支持物(例如,珠)。微孔可以包含本公开内容的条形码试剂。
[0165]
条形码化的方法
[0166]
本公开内容提供了用于估计身体样品(例如,组织、器官、肿瘤、细胞)中不同位置处的不同靶的数目的方法。方法可以包括将条形码(例如,随机条形码)紧密接近样品放置,裂解样品,将不同的靶与条形码关联,对靶进行扩增和/或对靶进行数字计数。方法还可以包括对从条形码上的空间标记获得的信息进行分析和/或将所述信息可视化。在一些实施方案中,方法包括使样品中的多于一种靶可视化。将多于一种靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在将样品中的多于一种靶条形码化(例如,随机条形码化)之前或之后产生二维映射图和三维映射图。将样品中的多于一种靶可视
化可以包括将多于一种靶映射到样品的映射图上。将多于一种靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在对样品中的多于一种靶进行条形码化之前或之后生成二维映射图和三维映射图。在一些实施方案中,可以在裂解样品之前或之后生成二维映射图和三维映射图。在产生二维映射图或三维映射图之前或之后裂解样品可以包括加热样品、使样品与去污剂接触、改变样品的ph或其任何组合。
[0167]
在一些实施方案中,将多于一种靶条形码化包括将多于一种条形码与多于一种靶杂交以产生条形码化的靶(例如,随机条形码化的靶)。将多于一种靶条形码化可以包括产生条形码化靶的索引文库。产生条形码化靶的索引文库可以用包含多于一种条形码(例如,随机条形码)的固体支持物来进行。
[0168]
使样品和条形码接触
[0169]
本公开内容提供了用于使样品(例如,细胞)与本公开内容的基底接触的方法。可以使包括例如细胞、器官或组织薄切片的样品与条形码(例如,随机条形码)接触。细胞可以例如通过重力流来接触,其中可以使细胞沉淀并且产生单层。样品可以是组织薄切片。可以将薄切片放置于基底上。样品可以是一维的(例如,形成平坦表面)。可以使样品(例如,细胞)分散遍及基底,例如,通过在基底上生长/培养细胞。
[0170]
当条形码紧密接近靶时,靶可以与条形码杂交。条形码可以按不可耗尽的比例接触,使得每种不同的靶可以与本公开内容的不同条形码关联。为了确保靶与条形码之间的有效关联,可以将靶与条形码交联。
[0171]
细胞裂解
[0172]
在细胞和条形码的分配之后,可以使细胞裂解以释放靶分子。细胞裂解可以通过各种手段中的任何一种来完成,例如通过化学或生化手段,通过渗透冲击,或通过热裂解、机械裂解或光学裂解的手段。可以通过添加包含去污剂(例如,sds、十二烷基硫酸锂、triton x-100、tween-20或np-40)、有机溶剂(例如,甲醇或丙酮)或消化酶(例如,蛋白酶k、胃蛋白酶或胰蛋白酶)或其任何组合的细胞裂解缓冲液来裂解细胞。为了增加靶与条形码的关联,可以通过例如降低裂解物的温度和/或增加裂解物的粘度来改变靶分子的扩散速率。
[0173]
在一些实施方案中,可以使用滤纸来裂解样品。可以在滤纸上部用裂解缓冲液浸泡滤纸。可以通过压力将滤纸施加至样品,这可以促进样品的裂解以及样品的靶与基底的杂交。
[0174]
在一些实施方案中,裂解可以通过机械裂解、热裂解、光学裂解和/或化学裂解来进行。化学裂解可以包括使用消化酶,诸如蛋白酶k、胃蛋白酶和胰蛋白酶。裂解可以通过将裂解缓冲液添加至基底来进行。裂解缓冲液可以包含tris hcl。裂解缓冲液可以包含至少约0.01m、0.05m、0.1m、0.5m或1m或更多的tris hcl。裂解缓冲液可以包含至多约0.01m、0.05m、0.1m、0.5m或1m或更多的tris hcl。裂解缓冲液可以包含约0.1m tris hcl。裂解缓冲液的ph可以是至少约1、2、3、4、5、6、7、8、9、10或更高。裂解缓冲液的ph可以是至多约1、2、3、4、5、6、7、8、9、10或更高。在一些实施方案中,裂解缓冲液的ph是约7.5。裂解缓冲液可以包含盐(例如,licl)。裂解缓冲液中的盐浓度可以是至少约0.1m、0.5m或1m或更高。裂解缓冲液中的盐浓度可以是至多约0.1m、0.5m或1m或更高。在一些实施方案中,裂解缓冲液中的盐浓度是约0.5m。裂解缓冲液可以包含去污剂(例如,sds、十二烷基硫酸锂、triton x、
tween、np-40)。裂解缓冲液中的去污剂浓度可以是至少约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。裂解缓冲液中的去污剂浓度可以是至多约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。在一些实施方案中,裂解缓冲液中的去污剂浓度是约1%的十二烷基硫酸锂。裂解方法中使用的时间可以取决于所使用的去污剂的量。在一些实施方案中,使用的去污剂越多,裂解所需的时间越少。裂解缓冲液可以包含螯合剂(例如,edta、egta)。裂解缓冲液中的螯合剂浓度可以是至少约1mm、5mm、10mm、15mm、20mm、25mm或30mm或更高。裂解缓冲液中的螯合剂浓度可以是至多约1mm、5mm、10mm、15mm、20mm、25mm或30mm或更高。在一些实施方案中,裂解缓冲液中的螯合剂浓度是约10mm。裂解缓冲液可以包含还原剂(例如,β-巯基乙醇、dtt)。裂解缓冲液中的还原剂浓度可以是至少约1mm、5mm、10mm、15mm或20mm或更高。裂解缓冲液中还原剂的浓度可以是至多约1mm、5mm、10mm、15mm或20mm或更高。在一些实施方案中,裂解缓冲液中的还原剂浓度是约5mm。在一些实施方案中,裂解缓冲液可以包含约0.1m tris hcl,约ph 7.5,约0.5m licl,约1%十二烷基硫酸锂,约10mm edta和约5mm dtt。
[0175]
裂解可以在约4℃、10℃、15℃、20℃、25℃或30℃的温度进行。裂解可以进行约1分钟、5分钟、10分钟、15分钟或20分钟或更多分钟。裂解的细胞可以包含至少约100000种、200000种、300000种、400000种、500000种、600000种或700000种或更多种靶核酸分子。裂解的细胞可以包含至多约100000种、200000种、300000种、400000种、500000种、600000种或700000种或更多种靶核酸分子。
[0176]
将条形码附接至靶核酸分子
[0177]
在细胞裂解和核酸分子从细胞释放之后,核酸分子可以与共定位的固体支持物的条形码随机关联。关联可以包括使条形码的靶识别区与靶核酸分子的互补部分杂交(例如,条形码的寡(dt)可以与靶的多(a)尾相互作用)。可以选择用于杂交的测定条件(例如,缓冲液ph、离子强度、温度等)以促进形成特定的稳定的杂交体。在一些实施方案中,可以将从裂解的细胞释放的核酸分子与基底上的多于一种探针关联(例如,与基底上的探针杂交)。当探针包含寡(dt)时,可以将mrna分子与探针杂交并且逆转录。寡核苷酸的寡(dt)部分可以充当用于cdna分子的第一链合成的引物。例如,在图2中图示的条形码化的非限制性实例中,在框216处,mrna分子可以与珠上的条形码杂交。例如,单链的核苷酸片段可以与条形码的靶结合区杂交。
[0178]
附接还可以包括将条形码的靶识别区与靶核酸分子的一部分连接。例如,靶结合区可以包含可以能够与限制性位点突出端(例如,ecori粘性末端突出端)特异性杂交的核酸序列。测定程序还可以包括用限制性酶(例如,ecori)处理靶核酸以产生限制性位点突出端。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。连接酶(例如,t4 dna连接酶)可以用于连接两个片段。
[0179]
例如,在图2中图示的条形码化的非限制性实例中,在框220处,随后可以将来自多于一个细胞(或多于一个样品)的标记的靶(例如,靶-条形码分子)汇集至例如管中。标记的靶可以通过例如取回(retrieving)条形码和/或附接靶-条形码分子的珠来汇集。
[0180]
可以通过使用磁珠和外部施加的磁场来实现附接的靶-条形码分子的基于固体支持物的集合的取回。汇集靶-条形码分子后,所有进一步的处理可以在单个反应容器中进
行。进一步的处理可以包括,例如,逆转录反应、扩增反应、裂解反应、解离反应和/或核酸延伸反应。进一步的处理反应可以在微孔内进行,即,不先汇集来自多于一个细胞的标记的靶核酸分子。
[0181]
逆转录
[0182]
本公开内容提供了使用逆转录(例如,在图2的框224处)来产生靶-条形码缀合物的方法。靶-条形码缀合物可以包含条形码以及靶核酸的全部或一部分的互补序列(即,条形码化的cdna分子,诸如随机条形码化的cdna分子)。关联的rna分子的逆转录可以通过添加逆转录引物连同逆转录酶而发生。逆转录引物可以是寡(dt)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。寡(dt)引物的长度可以是12-18个核苷酸或可以是约12-18个核苷酸,并且与哺乳动物mrna的3’端的内源多(a)尾结合。随机六核苷酸引物可以在各个互补位点处与mrna结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mrna。
[0183]
在一些实施方案中,标记的rna分子的逆转录可以通过添加逆转录引物而发生。在一些实施方案中,逆转录引物是寡(dt)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。通常,寡(dt)引物的长度是12-18个核苷酸,并且与哺乳动物mrna的3’端的内源多(a)尾结合。随机六核苷酸引物可以在各个互补位点处与mrna结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mrna。
[0184]
逆转录可以重复地发生以产生多于一个标记的cdna分子。本文公开的方法可以包括进行至少约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次逆转录反应。方法可以包括进行至少约25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次逆转录反应。
[0185]
扩增
[0186]
可以进行一个或更多个核酸扩增反应(例如,在图2的框228处)以产生标记的靶核酸分子的多于一个拷贝。扩增可以以多重化方式进行,其中多于一种靶核酸序列同时进行扩增。扩增反应可以用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(如果存在)的至少一部分。扩增反应可以包括扩增细胞标记和/或条形码序列(例如,分子标记)的至少一部分。扩增反应可以包括扩增样品标签、细胞标记、空间标记、条形码序列(例如,分子标记)、靶核酸或其组合的至少一部分。扩增反应可以包括扩增多于一种核酸的0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%或在这些值中的任何两个之间的范围或数字。方法还可以包括进行一个或更多个cdna合成反应以产生包含样品标记、细胞标记、空间标记和/或条形码序列(例如,分子标记)的靶-条形码分子的一个或更多个cdna拷贝。
[0187]
在一些实施方案中,可以使用聚合酶链式反应(pcr)进行扩增。如本文使用的,pcr可以指用于通过dna的互补链的引物同时延伸使特定dna序列体外扩增的反应。如本文使用的,pcr可以包括所述反应的衍生形式,包括但不限于rt-pcr、实时pcr、巢式pcr、定量pcr、多重化pcr、数字pcr和组装pcr。
[0188]
标记的核酸的扩增可以包括非基于pcr的方法。非基于pcr的方法的实例包括但不限于多重置换扩增(mda)、转录介导的扩增(tma)、基于核酸序列的扩增(nasba)、链置换扩增(sda)、实时sda、滚环扩增或环到环扩增。其他非基于pcr的扩增方法包括dna依赖性rna
聚合酶驱动的rna转录扩增或rna指导的dna合成和转录的多于一个循环以扩增dna或rna靶、连接酶链式反应(lcr)和qβ复制酶(qβ)方法、回文探针的使用、链置换扩增、使用限制性核酸内切酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’核酸外切酶活性的核酸聚合酶的链置换扩增、滚环扩增和分支延伸扩增(ram)。在一些实施方案中,扩增不产生环化转录物。
[0189]
在一些实施方案中,本文公开的方法还包括对标记的核酸(例如,标记的rna、标记的dna、标记的cdna)进行聚合酶链式反应以产生标记的扩增子(例如,随机标记的扩增子)。标记的扩增子可以是双链分子。双链分子可包括双链rna分子、双链dna分子或者与dna分子杂交的rna分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或条形码序列(例如,分子标记)。标记的扩增子可以是单链分子。单链分子可以包括dna、rna或其组合。本公开内容的核酸可以包括合成的或改变的核酸。
[0190]
扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定或可触发的核苷酸。非天然核苷酸的实例可以包括,但不限于肽核酸(pna)、吗啉代和锁核酸(lna)以及乙二醇核酸(gna)与苏糖核酸(tna)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。
[0191]
进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以包含少于12-15个核苷酸。一种或更多种引物可以退火至多于一种标记的靶(例如,随机标记的靶)的至少一部分。一种或更多种引物可以退火至多于一种标记的靶的3’端或5’端。一种或更多种引物可以退火至多于一种标记的靶的内部区域。内部区域可以与多于一种标记的靶的3’末端距离至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种基因特异性引物。
[0192]
一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、条形码序列(例如,分子标记)、靶或其任何组合。一种或更多种引物可以包括通用引物和定制引物。定制引物可以设计成扩增一种或更多种靶。靶可以包括一个或更多个样品中总核酸的子集。靶可以包括一个或更多个样品中总标记靶的子集。一种或更多种引物可以包括至少96种或更多种定制引物。一种或更多种引物可以包括至少960种或更多种定制引物。一种或更多种引物可以包括至少9600种或更多种定制引物。一种或更多种定制引物可以退火至两种或更多种不同的标记的核酸。两种或更多种不同的标记的核酸可以对应于一种或更多种基因。
[0193]
可以在本公开内容的方法中使用任何扩增方案。例如,在一种方案中,第一轮pcr可以使用基因特异性引物和针对通用illumina测序引物1序列的引物来扩增附接至珠的分子。第二轮pcr可以使用侧翼为illumina测序引物2序列的巢式基因特异性引物和针对通用illumina测序引物1序列的引物扩增第一pcr产物。第三轮pcr添加p5和p7以及样品索引,以使pcr产物变成illumina测序文库。使用150bp
×
2测序的测序可以揭示读段1上的细胞标记和条形码序列(例如,分子标记)、读段2上的基因以及索引1读段上的样品索引。
[0194]
在一些实施方案中,可以使用化学裂解将核酸从基底去除。例如,存在于核酸中的化学基团或经修饰的碱基可以用于促进将核酸从固体支持物去除。例如,酶可以用于将核酸从基底去除。例如,通过限制性核酸内切酶消化可以将核酸从基底去除。例如,用尿嘧啶-d-糖苷酶(udg)处理含dutp或ddutp的核酸可以用于将核酸从基底去除。例如,可以使用进行核苷酸切除的酶(诸如,碱基切除修复酶,诸如无嘌呤/无嘧啶(apurinic/apyrimidinic,ap)核酸内切酶)将核酸从基底去除。在一些实施方案中,可以使用可光裂解基团以及光将核酸从基底去除。在一些实施方案中,可以使用可裂解接头将核酸从基底去除。例如,可裂解接头可以包括以下中的至少一种:生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、生物素/中性抗生物素蛋白、ig蛋白a、光不稳定型接头、酸或碱不稳定型接头基团或适配体。
[0195]
当探针是基因特异性时,可以将分子与探针杂交,并且逆转录和/或扩增。在一些实施方案中,在核酸已经合成(例如,逆转录)之后,核酸可以被扩增。扩增可以以多重方式进行,其中多种靶核酸序列同时扩增。扩增可以将测序衔接子添加至核酸。
[0196]
在一些实施方案中,可以例如用桥接扩增在基底上进行扩增。cdna可以加同聚物尾,以便产生相容末端,用于使用基底上的寡(dt)探针进行桥接扩增。在桥接扩增中,与模板核酸的3’末端互补的引物可以是共价地附接至固体颗粒的每对引物中的第一引物。当包含模板核酸的样品与颗粒接触并进行单个热循环时,可以将模板分子退火至第一引物,并且第一引物通过添加核苷酸而向前延长以形成双链体分子,所述双链体分子由模板分子和与模板互补的新形成的dna链构成。在下一循环的加热步骤中,双链体分子可以变性,从颗粒释放模板分子并且留下通过第一引物附接至颗粒的互补dna链。在随后的退火和延长步骤的退火阶段中,互补链可以与第二引物杂交,第二引物在从第一引物去除的位置处与互补链的区段互补。这种杂交可导致互补链在第一引物和第二引物之间形成桥,通过共价键连接第一引物并通过杂交连接第二引物。在延长阶段,在同一反应混合物中通过添加核苷酸,第二引物可以在反向方向上延长,从而将桥转化为双链桥。然后开始下一个循环,并且双链桥可以变性以产生两个单链核酸分子,每个单链核酸分子具有的一个末端分别经由第一引物和第二引物附接至颗粒表面,其中每个单链核酸分子的另一个末端是未附接的。在这第二个循环的退火和延长步骤中,每条链可以与同一颗粒上先前未使用的另外的互补引物杂交,以形成新的单链桥。现在杂交的两个先前未使用的引物延长从而将两个新的桥转换成双链桥。
[0197]
扩增反应可以包括扩增多于一种核酸的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%。
[0198]
标记的核酸的扩增可以包括基于pcr的方法或非基于pcr的方法。标记的核酸的扩增可以包括对标记的核酸的指数式扩增。标记的核酸的扩增可以包括对标记的核酸的线性
扩增。扩增可以通过聚合酶链式反应(pcr)来进行。pcr可以指用于通过dna的互补链的引物同时延伸使特定dna序列体外扩增的反应。pcr可以涵盖反应的衍生形式,包括但不限于,rt-pcr、实时pcr、巢式pcr、定量pcr、多重化pcr、数字pcr、抑制pcr、半抑制pcr以及组装pcr。
[0199]
在一些实施方案中,标记的核酸的扩增包括非基于pcr的方法。非基于pcr的方法的实例包括但不限于多重置换扩增(mda)、转录介导的扩增(tma)、基于核酸序列的扩增(nasba)、链置换扩增(sda)、实时sda、滚环扩增或环到环扩增。其他非基于pcr的扩增方法包括dna依赖性rna聚合酶驱动的rna转录扩增或rna指导的dna合成和转录的多于一个循环以扩增dna或rna靶、连接酶链式反应(lcr)、qβ复制酶(qβ)方法、回文探针的使用、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和/或分支延伸扩增(ram)。
[0200]
在一些实施方案中,本文公开的方法还包括对扩增的扩增子(例如,靶)进行巢式聚合酶链式反应。扩增子可以是双链分子。双链分子可包括双链rna分子、双链dna分子或者与dna分子杂交的rna分子。双链分子的一条或两条链可以包含样品标签或分子标识符标记。可选地,扩增子可以是单链分子。单链分子可以包括dna、rna或其组合。本发明的核酸可以包括合成的或改变的核酸。
[0201]
在一些实施方案中,方法包括反复扩增标记的核酸以产生多于一个扩增子。本文公开的方法可以包括进行至少约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次扩增反应。可选地,方法包括进行至少约25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次扩增反应。
[0202]
扩增可以还包括将一种或更多种对照核酸添加至一个或更多个包含多于一种核酸的样品中。扩增可以还包括将一种或更多种对照核酸添加至多于一种核酸。对照核酸可以包含对照标记。
[0203]
扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定型和/或可触发的核苷酸。非天然核苷酸的实例包括但不限于肽核酸(pna)、吗啉代和锁核酸(lna)以及乙二醇核酸(gna)与苏糖核酸(tna)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。
[0204]
进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括一种或更多种寡核苷酸。一种或更多种寡核苷酸可以包含至少约7-9个核苷酸。一种或更多种寡核苷酸可以包含少于12-15个核苷酸。一种或更多种引物可以退火至多于一种标记的核酸的至少一部分。一种或更多种引物可以退火至多于一种标记的核酸的3’端和/或5’端。一种或更多种引物可以退火至多于一种标记的核酸的内部区域。内部区域可以与多于一种标记的核酸的3’末端距离至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、
700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种管家基因引物。一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标签、第二样品标签、分子标识符标记、核酸或其产物。一种或更多种引物可以包括通用引物和定制引物。定制引物可以被设计成扩增一种或更多种靶核酸。靶核酸可以包括一个或更多个样品中总核酸的子集。在一些实施方案中,引物是与本公开内容的阵列附接的探针。
[0205]
在一些实施方案中,将样品中的多于一种靶条形码化(例如,随机条形码化)还包括产生条形码化靶(例如,随机条形码化靶)或靶的条形码化片段的索引文库。不同的条形码的条形码序列(例如,不同的随机条形码的分子标记)可以彼此不同。产生条形码化靶的索引文库包括从样品中的多于一种靶产生多于一种索引多核苷酸。例如,对于包括第一索引靶和第二索引靶的条形码化靶的索引文库,第一索引多核苷酸的标记区与第二索引多核苷酸的标记区可以相差以下、相差约以下、相差至少以下或相差至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。在一些实施方案中,产生条形码化靶的索引文库包括使多于一种靶(例如mrna分子)与包含多(t)区和标记区的多于一种寡核苷酸接触;以及使用逆转录酶进行第一链合成以产生单链标记的cdna分子(每种包含cdna区和标记区),其中多于一种靶包括至少两种不同序列的mrna分子,且多于一种寡核苷酸包括至少两种不同序列的寡核苷酸。产生条形码化靶的索引文库还可以包括扩增单链标记的cdna分子以产生双链标记的cdna分子;以及对双链标记的cdna分子进行巢式pcr以产生标记的扩增子。在一些实施方案中,方法可以包括产生衔接子标记的扩增子。
[0206]
条形码化(例如,随机条形码化)可以包括使用核酸条形码或标签以标记个体核酸(例如,dna或rna)分子。在一些实施方案中,其包括在从mrna产生cdna分子时将dna条形码或标签添加至cdna分子。可以进行巢式pcr以使pcr扩增偏倚最小化。可以添加用于测序(例如下一代测序(ngs))使用的衔接子。例如在图2的框232处,可以使用测序结果来确定靶的一个或更多个拷贝的细胞标记、分子标记和核苷酸片段的序列。
[0207]
图3是示出了产生条形码化靶(例如,随机条形码化靶)的索引文库,诸如条形码化的mrna或其片段的索引文库的非限制性示例性过程的示意图。如步骤1中示出的,逆转录过程可以用独特分子标记序列、细胞标记序列和通用pcr位点对每个mrna分子进行编码。具体地,通过将一组条形码(例如,随机条形码)310与rna分子302的多(a)尾区308杂交(例如,随机杂交),可以将rna分子302逆转录以产生标记的cdna分子304(包括cdna区306)。条形码310中的每一个可以包括靶结合区,例如多(dt)区312、标记区314(例如,条形码序列或分子)和通用pcr区316。
[0208]
在一些实施方案中,细胞标记序列可以包含3个至20个核苷酸。在一些实施方案中,分子标记序列可以包含3个至20个核苷酸。在一些实施方案中,多于一种随机条形码中的每一种还包括通用标记和细胞标记中的一种或更多种,其中通用标记对于固体支持物上的多于一种随机条形码是相同的,并且细胞标记对于固体支持物上的多于一种随机条形码是相同的。在一些实施方案中,通用标记可以包含3个至20个核苷酸。在一些实施方案中,细
胞标记包含3个至20个核苷酸。
[0209]
在一些实施方案中,标记区314可以包含条形码序列或分子标记318和细胞标记320。在一些实施方案中,标记区314可以包括通用标记、维度标记和细胞标记中的一种或更多种。条形码序列或分子标记318的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸,或这些值中的任何值之间的数字或范围的核苷酸。细胞标记320的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸,或这些值中的任何值之间的数字或范围的核苷酸。通用标记的长度可以是以下、可以是约以下,可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸,或这些值中的任何值之间的数字或范围的核苷酸。通用标记对于固体支持物上的多于一种随机条形码可以是相同的,并且细胞标记对于固体支持物上的多于一种随机条形码是相同的。维度标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或在这些值中的任何值之间的数字或范围的核苷酸。
[0210]
在一些实施方案中,标记区314可以包括以下、包括约以下、包括至少以下或包括至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个不同标记或在这些值中的任何值之间的数字或范围的不同标记,诸如条形码序列或分子标记318和细胞标记320。每种标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或在这些值中的任何值之间的数字或范围的核苷酸。一组条形码或随机条形码310可以包括以下、包括约以下、包括至少以下或可以是至多以下:10个、20个、40个、50个、70个、80个、90个、102个、103个、104个、105个、106个、107个、108个、109个、10
10
个、10
11
个、10
12
个、10
13
个、10
14
个、10
15
个、10
20
个条形码或随机条形码310或在这些值中的任何值之间的数字或范围的条形码或随机条形码310。并且条形码或随机条形码310的组可以例如,各自包含独特标记区314。标记的cdna分子304可以进行纯化以去除过量的条形码或随机条形码310。纯化可以包括ampure珠纯化。
[0211]
如步骤2中示出的,来自步骤1中的逆转录过程的产物可以汇集到1个管中,且用第1pcr引物池和第1通用pcr引物进行pcr扩增。因为独特标记区314,汇集是可能的。特别地,可以将标记的cdna分子304扩增以产生巢式pcr标记的扩增子322。扩增可以包括多重pcr扩增。扩增可以包括以单一反应体积用96种多重引物进行的多重pcr扩增。在一些实施方案中,在单一反应体积中,多重pcr扩增可以利用以下、利用约以下、利用至少以下或利用至多以下:10种、20种、40种、50种、70种、80种、90种、102种、103种、104种、105种、106种、107种、108种、109种、10
10
种、10
11
种、10
12
种、10
13
种、10
14
种、10
15
种、10
20
种多重引物或在这些值中的任何值之间的数字或范围的多重引物。扩增可以包括使用第1pcr引物池324和通用引物328,所述第1pcr引物池324包括靶向特定基因的定制引物326a-c。定制引物326可以与标记的cdna分子304的cdna部分306’内的区域杂交。通用引物328可以与标记的cdna分子304的通
用pcr区域316杂交。
[0212]
如图3的步骤3中示出的,来自步骤2中的pcr扩增的产物可以用巢式pcr引物池和第2通用pcr引物扩增。巢式pcr可以使pcr扩增偏倚最小化。特别地,巢式pcr标记的扩增子322可通过巢式pcr进行进一步扩增。巢式pcr可以包括在单一反应体积中用巢式pcr引物332a-c的巢式pcr引物池330和第2通用pcr引物328’进行的多重pcr。巢式pcr引物池330可以包含以下、包含约以下、包含至少以下或包含至多以下:1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种不同的巢式pcr引物332或在这些值中的任何值之间的数字或范围的不同的巢式pcr引物332。巢式pcr引物332可以包含衔接子334,并与标记的扩增子322的cdna部分306”内的区域杂交。通用引物328’可以包含衔接子336,并与标记的扩增子322的通用pcr区域316杂交。由此,步骤3产生衔接子标记的扩增子338。在一些实施方案中,巢式pcr引物332和第2通用pcr引物328’可以不包含衔接子334和衔接子336。而是,衔接子334和衔接子336可以连接至巢式pcr的产物以产生衔接子标记的扩增子338。
[0213]
如步骤4中示出的,可以使用文库扩增引物将来自步骤3的pcr产物进行pcr扩增用于测序。特别地,可以使用衔接子334和衔接子336对衔接子标记的扩增子338进行一个或更多个另外的测定。衔接子334和衔接子336可以与引物340和引物342杂交。一种或更多种引物340和引物342可以是pcr扩增引物。一种或更多种引物340和引物342可以是测序引物。一种或更多种衔接子334和衔接子336可以用于衔接子标记的扩增子338的进一步扩增。一种或更多种衔接子334和衔接子336可以用于对衔接子标记的扩增子338测序。引物342可以包含板索引344,使得使用同一组条形码或随机条形码310产生的扩增子可以使用下一代测序(ngs)在一个测序反应中测序。
[0214]
阻断物寡核苷酸
[0215]
本文的公开内容包括用于dna聚合酶延伸阻断物(例如,阻断物寡核苷酸、阻断物寡核苷酸、延伸阻断物、阻断物)的系统、方法、组合物和试剂盒。在一些实施方案中,所公开的延伸阻断物可以在随机引发的(例如,基于随机引发和引物延伸(rpe)的)全转录组分析(wta)期间的引物延伸期间和/或在将靶结合区的互补物添加(例如,通过模板转换反应)到条形码化核酸分子的末端(例如,3’末端)(例如,本公开内容的5’条形码化方法)之后的延伸期间,阻断由聚合酶(例如,嗜中温聚合酶)的延伸。在一些实施方案中,所公开的延伸阻断物被配置成结合本文提供的寡核苷酸条形码的一个或更多个部分(例如,细胞标记、通用序列、分子标记、靶结合区)。在一些实施方案中,所公开的延伸阻断物被配置成结合过多的转录物cdna序列以减少或消除产物。与不采用本文提供的阻断物寡核苷酸的目前可用的方法相比,本文提供的方法和组合物的一些实施方案改进了工作流程(例如,减少时间和/或工作量)。另外,本文提供的阻断物寡核苷酸方法和组合物可以增加测序结果的特异性(例如,更少的不想要的产物和/或更多的靶向产物)。本文提供的方法和组合物的一些实施方案减少或防止在对免疫受体的v(d)j区进行3’和/或5’表达谱分析期间产生的不期望的产物(例如,包含第一通用序列的互补物的延伸的条形码化核酸分子)。本文提供的方法和组合物的一些实施方案减少或防止在基于rpe的全转录组分析期间产生的不期望的产物(例如,与寡核苷酸条形码的一部分杂交的随机引物的延伸产物)。在一些实施方案中,这两种类型的不想要的产物中的任一种的产生被阻断使得pcr反应资源能够用于产生更多意图扩
增的产物,并且能够使得该方案不需要额外的产物纯化步骤。
[0216]
本文提供的方法和组合物的一些实施方案采用嗜中温聚合酶或嗜中温聚合酶以外的聚合酶。在一些实施方案中,所公开的延伸阻断物可以通过嗜冷聚合酶阻断延伸。在一些实施方案中,与所公开的阻断物寡核苷酸协同采用聚合酶能够在杂交的多(dt):多(da)复合物(例如,15-30bp)在本文公开的3’和/或5’表达谱分析期间稳定的温度使其延伸。在一些实施方案中,与所公开的阻断物寡核苷酸协同采用聚合酶能够在杂交的9个碱基的随机物(例如,wta rpe引物)在本文提供的基于rpe的wta方法期间稳定的温度使其延伸。在一些实施方案中,在本文提供的基于rpe的wta方法期间的最终延伸采用更高的温度。在一些实施方案中,嗜中温和/或嗜冷聚合酶与热稳定聚合酶一起使用。在一些这样的实施方案中,提供聚合酶以分别完成低温和高温所需的功能。在一些实施方案中,将嗜热聚合酶与所公开的在较低温度具有足够活性的阻断物寡核苷酸一起采用。
[0217]
在一些实施方案中,核酸靶可以包含细胞组分结合试剂。与核酸靶关联的细胞结合试剂(例如,抗体寡核苷酸,诸如样品索引寡核苷酸)已在us2018/0088112和2018年3月27日提交的美国申请第15/937,713号中描述;这些申请中的每一项的内容通过引用以其整体并入本文。在一些实施方案中,可以使用本公开内容的5’条形码化方法获得单细胞的多组学信息,诸如基因组学、染色质可及性、甲基组学、转录组学和蛋白组学。核酸分子可以与细胞组分结合试剂缔合。方法可以包括:使核酸分子和细胞组分结合试剂解离。
[0218]
一种或更多种阻断物寡核苷酸可以能够与以下的全部或一部分特异性结合:第一通用序列、细胞标记、分子标记、靶结合区或其任何组合。细胞标记可以包含细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和/或细胞标记的第三部分。一种或更多种阻断物寡核苷酸可以能够与以下的全部或一部分特异性结合:细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分。一种或更多种阻断物寡核苷酸可以包含以下的互补序列:细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分、第一通用序列、分子标记、靶结合区、其部分或其任何组合。一种或更多种阻断物寡核苷酸可以具有在约30℃和约70℃之间(例如,30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃,或这些值中的任何两个之间的数字或范围)的退火温度。一种或更多种阻断物寡核苷酸可以具有在约30℃和约70℃之间(例如,30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃,或这些值中的任何两个之间的数字或范围)的解链温度。
[0219]
在一些实施方案中,阻断物寡核苷酸可以包含一个或更多个非天然核苷酸。非天然核苷酸可以是例如光不稳定或可触发的核苷酸。非天然核苷酸的实例可以包括,但不限于肽核酸(pna)、吗啉代和锁核酸(lna)以及乙二醇核酸(gna)与苏糖核酸(tna)。在一些实施方案中,阻断物寡核苷酸是嵌合寡核苷酸,诸如lna/pna/dna嵌合体、lna/dna嵌合体、pna/dna嵌合体、gna/dna嵌合体、tna/dna嵌合体或其任何组合。
[0220]
阻断物寡核苷酸的长度可以变化。例如,在一些实施方案中,阻断物寡核苷酸的解链温度(tm)可以通过调整阻断物寡核苷酸的长度来修改。例如,阻断物寡核苷酸可以具有以下、约以下、小于以下、大于以下的长度:4nt、6nt、8nt、10nt、12nt、15nt、20nt、21nt、25nt、30nt、35nt、40nt、45nt、50nt、60nt、70nt、80nt、90nt、100nt、150nt、200nt,或在上述值中的任何两个之间的范围。在一些实施方案中,阻断物寡核苷酸长度为8nt至100nt或长度为约8nt至100nt。在一些实施方案中,阻断物寡核苷酸长度为10nt至50nt或长度为约
10nt至50nt。在一些实施方案中,阻断物寡核苷酸长度为12nt至21nt或长度为约12nt至21nt。在一些实施方案中,阻断物寡核苷酸长度为20nt至30nt或长度为约20nt至30nt。在一些实施方案中,阻断物寡核苷酸长度为25nt或为约25nt。
[0221]
在一些实施方案中,阻断物寡核苷酸的tm由包含lna/dna嵌合体或pna/dna嵌合体的阻断物寡核苷酸中dna残基的数目修改。例如,包含lna/dna嵌合体或pna/dna嵌合体的阻断物寡核苷酸可以具有以下、约以下、小于以下、大于以下的百分比的dna残基:10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%、90%,或在上述值中的任何两个之间的范围。
[0222]
在一些实施方案中,阻断物寡核苷酸可以设计成不能作为用于扩增和/或延伸反应的引物或探针起作用。例如,阻断物寡核苷酸可以不能作为用于逆转录酶或聚合酶的引物起作用。例如,包含lna/dna嵌合体或pna/dna嵌合体的阻断物寡核苷酸可以被设计成具有一定百分比的lna或pna残基,或者在某些位置上具有lna或pna残基,诸如靠近或位于寡核苷酸的3’末端、5’末端或中间部分。在一些实施方案中,包含lna/dna嵌合体或pna/dna嵌合体的阻断物寡核苷酸可以具有以下、约以下、小于以下、大于以下的百分比的lna残基或pna残基:10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%、90%,或在上述值中的任何两个之间的范围。
[0223]
在一些实施方案中,本文公开的延伸产物和/或扩增产物可用于测序。可以使用本领域已知的任何合适的测序方法,优选地高通量方法。例如,也可以利用使用以下平台的循环阵列测序:诸如roche 454、illumina solexa、abi-solid、ion torrent、complete genomics、pacific bioscience、helicos或polonator平台。测序可以包括miseq测序和/或hiseq测序。在一些实施方案中,本文公开的阻断物寡核苷酸方法可以通过降低源自不期望的核酸物质的测序读段的数目来增加测序效率,所述源自不期望的核酸物质的测序读段诸如例如对以下的测序:(i)与寡核苷酸条形码的一部分杂交的随机引物的延伸产物或其产物,和/或(ii)包含第一通用序列的互补物的延伸的条形码化核酸分子或其产物。
[0224]
对核酸靶的5’末端进行条形码化的方法
[0225]
高通量单细胞rna测序改变了对复杂和异质生物样品的理解。然而,大多数方法只能实现对mrna转录物信息进行3’分析,这可能限制了对剪接变体、选择性转录起始位点和由于重排造成的高度可变基因座诸如t细胞受体和b细胞受体和抗体的vdj连接处的分析。使用5’条形码化和/或3’条形码化确定核酸靶(例如,免疫受体的v(d)j区)的序列的方法在2019年9月30日提交的美国专利申请第16/588,405号中描述;该专利申请的内容通过引用以其整体并入本文。用于在核酸靶的5’末端上进行分子条形码化的系统、方法、组合物和试剂盒已在作为美国专利申请公布第2019/0338278号公布的美国专利申请第16/588,405中描述,该专利申请的内容通过引用以其整体并入本文。
[0226]
本文的公开内容包括用于将具有分子标记(或分子索引)的条形码(例如,随机条形码)附接到被条形码化或被标记的核酸靶(例如,脱氧核糖核酸分子和核糖核酸分子)的5’末端的系统、方法、组合物和试剂盒。本文公开的基于5’的转录物计数方法可以互补或补充例如基于3’的转录物计数方法(例如rhapsody
tm
测定(becton,dickinson and company(franklin lakes,nj))、chromium
tm
单细胞3’解决方案(10x genomics(san francisco,ca)))。条形码化的核酸靶可用于序列鉴定、转录物计数、选择性剪接分析、突变筛选和/或
以高通量方式进行全长测序。对5’末端(相对于被标记的靶核酸靶的5’)转录物计数可以揭示在核酸分子的5’末端或较靠近核酸分子的5’末端的选择性剪接同种型和变体(包括但不限于剪接变体、单核苷酸多态性(snp)、插入、缺失、取代)。在一些实施方案中,方法可以涉及分子内杂交。
[0227]
本公开内容的方法可用于鉴定b细胞受体(bcr)、t细胞受体(tcr)和抗体的vdj区。vdj重组又称为体细胞重组,是免疫系统产生免疫球蛋白(ig)(例如,bcr)和t细胞受体(tcr)的早期阶段中的遗传重组机制。vdj重组可以几乎随机地组合可变(v)基因区段、多样(d)基因区段和连接(j)基因区段。由于其在选择不同基因时的随机性,它能够多样地编码蛋白以匹配来自细菌、病毒、寄生虫、功能失调的细胞(诸如肿瘤细胞)和花粉的抗原。
[0228]
vdj区可以包含3mb的大基因座,该3mb的大基因座包含可变(v)基因、多样性(d)基因和连接(j)基因。这些是可以参与vdj重组的区段。可以存在可以不经历vdj重组的恒定基因。该基因座的vdj重组中的第一个事件可以是,d基因中的一个重排到j基因中的一个。其后,v基因中的一个可以附加到该dj重排以形成功能性的vdj重排的基因,该功能性的vdj重排的基因然后编码重链蛋白的可变区段。这两个步骤都可以由可以使间插dna缺失的重组酶酶类催化。
[0229]
该重组过程在祖b细胞中以逐步的方式发生以产生抗体组库所需的多样性。每个b细胞可能只产生一种抗体(例如,bcr)。这种特异性可以通过等位基因排斥,使得一个等位基因信号进行功能性重排以阻止第二个等位基因的进一步重组来实现。
[0230]
在一些实施方案中,样品包括免疫细胞。免疫细胞可以包括,例如,t细胞、b细胞、淋巴样干细胞、髓样祖细胞、淋巴细胞、粒细胞、b细胞祖细胞、t细胞祖细胞、自然杀伤细胞、tc细胞、th细胞、浆细胞、记忆细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、肥大细胞、单核细胞、树突状细胞和/或巨噬细胞,或其任何组合。
[0231]
t细胞可以是t细胞克隆,t细胞克隆可以指源自单个t细胞的t细胞或具有相同tcr的t细胞。t细胞可以是t细胞系的一部分,t细胞系可以包括t细胞克隆和具有不同tcr的t细胞的混合群体,所有这些tcr都可以识别相同的靶(例如,抗原、肿瘤、病毒)。t细胞可以从许多来源获得,包括外周血单个核细胞、骨髓、淋巴结组织、脾组织和肿瘤。t细胞可以诸如使用ficoll分离从采集自受试者的单位血液获得。个体的循环血液中的细胞可以通过单采血液成分术(apheresis)或白细胞单采术(leukapheresis)获得。单采血液成分术产品可以包括淋巴细胞(包括t细胞、单核细胞、粒细胞、b细胞)、其他有核白细胞、红细胞和血小板。细胞可以被洗涤并在培养基中重悬以分离感兴趣的细胞。
[0232]
t细胞可以通过裂解红细胞和耗尽单核细胞(例如,通过percoll
tm
梯度离心)从外周血淋巴细胞中分离。可以通过正选择或负选择技术进一步分离特定的t细胞亚群,诸如cd28 t细胞、cd4 t细胞、cdc、cd45ra t细胞、和cd45ro t细胞。例如,t细胞可以通过与抗cd3/抗cd28(即,3
×
28)-缀合珠诸如m-450cd3/cd28 t或xcyte dynabeads
tm
孵育足以对于合意的t细胞进行正选择的时间段来分离。免疫细胞(例如,t细胞和b细胞)可以是抗原特异性的(例如,肿瘤特异性的)。
[0233]
在一些实施方案中,细胞可以是抗原呈递细胞(apc),诸如b细胞、来自淋巴结的活化的b细胞、类淋巴母细胞、静息b细胞或赘生性b细胞,例如来自淋巴瘤。apc可指在其表面表达至少一种bcrc蛋白的b细胞或滤泡树突状细胞。
[0234]
本公开内容的方法可以用于追踪单个t细胞的分子表型。不同亚型的t细胞可以通过不同分子标志物的表达来区分。t细胞表达来自不同的tcr组库的独特的t细胞受体(tcr)。在大多数t细胞中,tcr可以由α链和β链的异源二聚体组成;每一个功能链都可能是t细胞发育过程中体细胞dna重组事件的产物,允许在单个个体中表达超过一百万种不同的tcr。tcr可以用来定义个体t细胞的身份,允许在免疫应答过程中对t细胞克隆扩增的谱系进行追踪。本公开内容的免疫学方法可以以多种方式使用,包括但不限于,鉴定单个t细胞中独特的tcrα链和tcrβ链配对,在单细胞水平定量tcr和标志物表达,鉴定个体中的tcr多样性,表征不同t细胞群体中表达的tcr组库,确定tcr的α链等位基因和β链等位基因的功能性,以及鉴定免疫应答过程中t细胞的克隆扩增。
[0235]
t细胞受体链配对
[0236]
t细胞受体(tcr)是存在于t淋巴细胞表面的识别分子。在t细胞表面发现的t细胞受体可以由两个糖蛋白亚基组成,这两个亚基被称为α链和β链。两条链可以包括约40kda的分子量并具有可变结构域和恒定结构域。编码α链和β链的基因可以在v、d和j区的文库中被组织,基因从v、d和j区通过遗传重排形成。tcr可以识别由抗原呈递细胞呈递的抗原,该抗原作为与由组织相容性基因编码的特定自身分子组成的复合体的一部分。最有效的组织相容性基因被称为主要组织相容性复合体(mhc)。因此,被t细胞受体识别的复合体由mhc/肽配体组成。
[0237]
在一些实施方案中,本公开内容的方法、装置和系统可用于t细胞受体测序和配对。本公开内容的方法、装置和系统可以用于对t细胞受体α链和β链进行测序,使α链和β链进行配对,和/或确定t细胞受体α链的功能性拷贝。单细胞可以被容纳在具有单个固体支持物(例如,珠)的单个分区(例如,孔)中。细胞可以被裂解。珠可以包含随机标记,随机标记可以结合到tcr的α和/或β链内的特定位置。与固体支持物关联的tcrα分子和tcr定分子可以经历本公开内容的分子生物学方法,包括逆转录、扩增和测序。包含相同细胞标记的tcr经链和β链可以被认为来自相同的单细胞,从而使tcr的α链和β链进行配对。
[0238]
抗体组库中的重链和轻链配对
[0239]
本公开内容的方法、装置和系统可以用于使bcr受体和抗体的重链和轻链进行配对。本公开内容的方法允许确定单个生物体或细胞群体中免疫受体和抗体的组库。本公开内容的方法可以帮助确定组成免疫受体的多肽链对。b细胞和t细胞各自表达免疫受体;b细胞表达免疫球蛋白和bcr,并且t细胞表达t细胞受体(tcr)。这两种免疫受体类型可以包含两条多肽链。免疫球蛋白可以包含可变重(vh)链和可变轻(vl)链。可以有两种tcr类型:一种由α链和β链组成,并且另一种由δ链和γ链组成。免疫受体中的多肽可以包含恒定区和可变区。可变区可以由b细胞或t细胞染色体上基因片段的重组和末端连接重排导致。在b细胞中,可变区的另外的多样化可以通过体细胞高频突变发生。
[0240]
免疫系统有大量的受体,并且由淋巴细胞表达的任何给定受体对可以由一对分别的、独特的转录物编码。知晓单细胞中表达的免疫受体链对的序列可以用来确定给定个体或细胞群体的免疫组库(immune repertoire)。
[0241]
在一些实施方案中,本公开内容的方法、装置和系统可用于抗体测序和配对。本公开内容的方法、装置和系统可以用于对(例如,在b细胞中的)抗体重链和轻链进行测序,和/或对重链和轻链进行配对。单细胞可以被容纳在具有单个固体支持物(例如,珠)的单个分
区(例如,孔)中。细胞可以被裂解。
[0242]
珠可以包含随机标记,随机标记可以结合到抗体(例如,b细胞中的)的重链和/或轻链内的特定位置。与固体支持物关联的重链分子和轻链分子可以经历本公开内容的分子生物学方法,包括逆转录、扩增和测序。包含相同细胞标记的抗体重链和轻链可以被认为来自相同的单细胞,从而使抗体的重链和轻链进行配对。
[0243]
本文的公开内容包括用于对样品中的核酸靶进行标记的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括:基于与多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。在一些实施方案中,方法包括使能够与寡核苷酸条形码的不同部分杂交的阻断物寡核苷酸的混合物(例如,能够与通用序列杂交的第一阻断物寡核苷酸和能够与细胞标记杂交的第二阻断物寡核苷酸)接触。
[0244]
本文的公开内容包括用于确定样品中核酸靶的数目的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括:基于与多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。方法可以包括:扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子,所述多于一种单标记的核酸分子各自包含第二分子标记。在一些实施方案中,确定样品中核酸靶的拷贝数包括:基于与多于一种单标记的核酸分子关联的具有不同序列的第二分子标
记的数目来确定样品中核酸靶的拷贝数。
[0245]
本文的公开内容包括用于确定样品中核酸靶的数目的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括:扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子,所述多于一种单标记的核酸分子各自包含第二分子标记。方法可以包括:基于与多于一种单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。
[0246]
多于一种核酸靶中的每一种的序列可以包括多于一种核酸靶中的每一种的子序列。多于一种条形码化核酸分子中的核酸靶的序列可以包括核酸靶的子序列。靶结合区的互补物可以与靶结合区的一部分互补。靶结合区可以包括基因特异性序列和/或多(dt)序列。在一些实施方案中,第二分子标记不同于第一分子标记,并且第二分子标记不是第一分子标记的互补物。多于一种延伸的条形码化核酸分子各自可以包含核酸靶的序列。核酸靶包括mrna,并且多于一种延伸的条形码化核酸分子可以各自包含核酸靶的有义链的序列。
[0247]
方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与以下杂交:(i)多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区,(ii)条形码化核酸分子自身的靶结合区,和/或(iii)多于一种条形码化核酸分子中的不同条形码化核酸分子的靶结合区;延伸多于一种条形码化核酸分子的3’末端以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记和第二分子标记;以及基于与多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、具有不同序列的第二分子标记或其组合的数目来确定样品中核酸靶的拷贝数。在一些实施方案中,使条形码化核酸分子的靶结合区的互补物与条形码化核酸分子自身的靶结合区杂交包括使条形码化核酸分子内的靶结合区和靶结合区的互补物进行分子内杂交以形成茎环。在一些实施方案中,第二分子标记是第一分子标记的互补物。在一些实施方案中,使条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交包括使条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区进行分子间杂交。在一些实施方案中,第二分子标记不同于第一分子标记,并且其中第二分子标记不是第一分子标记的互补物。在一些实施方案中,使条形码化核酸分子的靶结合区的互补物与多于一种条形码化核酸分子中的不同条形码化核酸分子的靶结合区杂交包括使条形码化核酸分子的靶结合区的互补物与多于一种条形码化核
酸分子中的不同条形码化核酸分子的靶结合区进行分子间杂交。在一些实施方案中,第二分子标记的序列不同于第一分子标记的序列,并且其中第二分子标记不是第一分子标记的互补物。
[0248]
一种或更多种阻断物寡核苷酸可以减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。在一些实施方案中,与在不存在阻断物寡核苷酸的情况下进行的相当的方法相比,包含第一通用序列的互补物的延伸的条形码化核酸分子的产生减少了至少5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。第一通用序列可以在分子标记和靶结合区的5’。在一些实施方案中,多于一种延伸的条形码化核酸分子不包含第一通用序列的互补物。
[0249]
使寡核苷酸条形码的3’末端延伸可以包括使用嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合使寡核苷酸条形码的3’末端延伸。使寡核苷酸条形码的3’端延伸可以包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶使寡核苷酸条形码的3’末端延伸。在一些实施方案中,dna聚合酶包括klenow片段。
[0250]
使多于一种条形码化核酸分子的3’末端延伸可以包括使用嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合使多于一种条形码化核酸分子的3’末端延伸。使多于一种条形码化核酸分子的3’末端延伸可以包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶使多于一种条形码化核酸分子的3’末端延伸。在一些实施方案中,dna聚合酶包括klenow片段。
[0251]
在一些实施方案中,方法包括将靶结合区的互补物添加(例如,通过模板转换反应)到条形码化核酸分子的末端(例如,3’末端)。在一些实施方案中,方法包括寡核苷酸条形码(或其产物,诸如例如另一种条形码化核酸分子,或其扩增子)的靶结合区的i)分子内杂交和/或ii)分子间杂交,随后进行延伸以产生延伸的条形码化核酸分子。延伸的条形码化核酸分子可以在3’末端和5’末端二者上被条形码化。在一些实施方案中,条形码化的分子的分子内杂交在3’多(dt)捕获珠上与捕获mrna转录物形成发夹环。mrna分子可以经由多(a)尾与寡核苷酸条形码的靶结合区结合而被捕获到珠上。杂交后,模板转换可以用于在捕获的转录物的5’末端处附接多(da)尾。然后新的多(da)尾可以与在同一珠上的游离捕获寡核苷酸(例如,条形码,诸如随机条形码)杂交。延伸之后,mrna分子可以在3’末端和5’末端二者上被条形码化。这允许产生可以在例如illumina测序平台上进行测序的3’条形码化的和5’条形码化的转录物二者。获取条形码化的5’序列可以允许检测t细胞受体(tcr)和b细胞受体(bcr)的可变区,以及发生在转录物的5’末端的剪接变体和序列变异。
[0252]
本文公开的方法可以允许基于3’的和/或基于5’的序列确定。方法可以实现为序列确定提供灵活性。在一些实施方案中,方法能够实现在rhapsody
tm
系统上对诸如小鼠样品和人类样品的样品的t细胞和b细胞二者进行免疫组库谱分析,除了所使用的引物外不改变
方案或产品配置。在一些实施方案中,可以进行v(d)j的3’和/或5’基因表达谱分析。在一些实施方案中,可以研究单细胞平台中t细胞和b细胞的表型标志物和v(d)j序列二者。在一些实施方案中,它们的转录物的3’和5’信息二者都可以在单个实验中捕获。本文公开的方法可以允许t细胞和b细胞二者的v(d)j检测(例如,高频突变)。
[0253]
本文描述的方法和系统可以与使用与寡核苷酸关联(例如,与寡核苷酸附接或缀合)的抗体(本文也称为abo或aboligo)的方法和系统一起使用。使用abo来确定单细胞中的蛋白表达谱和追踪样品来源的实施方案已在美国专利申请第15/715,028号(公布为美国专利申请公布第2018/0088112号)和美国专利申请第15/937,713号中描述;每项专利申请的内容通过引用以其整体并入本文。在一些实施方案中,本文公开的方法允许对t细胞和b细胞的v(d)j谱分析、3’靶向扩增、5’靶向扩增、3’全转录组扩增(wta)、5’wta、用abo进行蛋白表达谱分析和/或单个实验中的样品多重化分析。
[0254]
在一些实施方案中,寡核苷酸条形码(可与固体支持物关联的)包含第一通用序列(例如,读段1(r1)、通用引物)。本文提供了对5’末端和3’末端上的靶进行条形码化的方法。在本文公开的对免疫受体的v(d)j区进行3’和/或5’表达谱分析的方法的一些实施方案中,主要不想要的产物通过通用引物到通用引物的扩增,从本文提供的5’条形码化方案的任何产物形成。提供了与寡核苷酸条形码的r1-部分(例如,第一通用序列)互补的阻断物寡核苷酸,用于在延伸之前与嗜中温聚合酶(例如,klenow exo-)接触。在一些实施方案中,提供了用于阻断r1至r1扩增子扩增(通用至通用)的方法和组合物。也可以使用与寡核苷酸条形码的细胞标记的细胞标记第一接头(l1)和第二接头(l2)序列互补的阻断物寡核苷酸。在一些实施方案中,r1、l1和/或l2序列的互补阻断物寡核苷酸的组合减少或消除了增加背景产物的r1至r1扩增子。在一些实施方案中还提供了与各种细胞标记互补的阻断物寡核苷酸。本文提供的阻断物寡核苷酸可以减少或消除背景r1至r1产物。在一些实施方案中,仅使条形码化核酸分子与空寡核苷酸条形码杂交,然后使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸将产生可以特异性地用作使用通用引物(r1)和tcr/bcr引物的vdj 5’分析pcr反应模板的产物。在一些实施方案中,条形码化核酸分子的所有其他杂交和延伸反应产生不能用作使用通用引物(r1)和tcr/bcr引物的vdj 5’分析pcr反应的模板的产物。在pcr的循环1中,可以从tcr/bcr循环1产物产生r1的互补物。阻断物寡核苷酸可以是可延伸的或不可延伸的。在一些实施方案中,阻断物寡核苷酸在杂交反应之前的变性步骤期间被消除。
[0255]
图4a-图4e示出了使用5’条形码化和本文公开的阻断物寡核苷酸确定核酸靶(例如,免疫受体的v(d)j区)的序列的非限制性示例性工作流程的示意图。条形码(例如,随机条形码、寡核苷酸条形码402)可以包含靶结合区(例如,多(dt)404),该靶结合区可以经由多(da)尾408与核酸靶(例如,多腺苷酸化的rna转录物406)结合,或与其他核酸靶结合,用于标记或条形码化(例如,加独特标记)。靶结合区可以包含基因特异性序列、寡(dt)序列、随机多聚体或其任何组合。在一些实施方案中,条形码与固体支持物(例如,颗粒410)关联。多于一种条形码402可以与颗粒410关联。在一些实施方案中,颗粒是珠。珠可以是用条形码或随机条形码官能化的聚合珠,例如可变形的珠或凝胶珠(诸如来自10x genomics(san francisco,ca)的凝胶珠)。在一些实施方式中,凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促
进剂(例如,四甲基乙二胺(temed))后,可以产生凝胶珠。
[0256]
图4a描绘了逆转录反应400a的非限制性示例性实施方案。在逆转录400a过程中,当到达寡核苷酸条形码402的末端后,酶(例如,逆转录酶,诸如moloney鼠白血病病毒(mmlv))的末端转移酶活性使一些另外的核苷酸(例如,脱氧胞苷、ccc 412)添加到新合成的cdna序列链414c(rna序列414r的反义序列)的3’末端。这些ccc碱基412可以作为模板转换寡核苷酸(例如,模板转换寡核苷酸)416的锚定位点起作用,它包括与加尾序列(例如,rgrgrg 418)互补的序列。模板转换寡核苷酸416可以包含靶结合区404的至少一部分。在rgrgrg 418和附加的脱氧胞苷链段(stretch)412之间碱基配对后,酶“转换”模板链,从寡核苷酸条形码402到模板转换寡核苷酸416,并继续复制到模板转换寡核苷酸416的5’末端。因此,得到的第一链标记的cdna(例如,条形码化核酸分子420)含有模板转换寡核苷酸416的反向互补物序列并且因此可以包含靶结合区(例如,多(da)408)的互补物(例如,反向互补物)。条形码化核酸分子420可以包括cdna414c(rna序列414r的反向互补序列)。该反应可以在存在一种或更多种配置为减少二级结构的添加剂(例如,乙二醇)的情况下进行。条形码化核酸分子420也可以包含多个标记。寡核苷酸条形码402可以包含分别用于标记转录物406和追踪rna转录物406(或核酸靶,诸如例如抗体寡核苷酸(无论是与抗体缔合的还是已与抗体解离的))的样品来源的第一分子标记(ml1)422和样品标记(例如,分区标记、细胞标记(cl)424),以及用于后续反应的位于每种条形码402的第一分子标记422/细胞标记424区域侧翼的一个或更多个另外的序列,诸如例如,第一通用序列426(例如,读段1序列)。每个样品的寡核苷酸条形码中分子标记的序列的组库可以足够大以对rna转录物进行随机标记。在一些实施方案中,样品标记是分区标记。在一些实施方案中,样品标记是细胞标记。条形码化核酸分子420可以经历变性步骤400b(例如,变性),从而产生单链的条形码化核酸分子421。
[0257]
在一些实施方案中,在使多于一种条形码化核酸分子的3’末端延伸之后,使第一分子标记与第二分子标记杂交。在一些实施方案中,延伸的条形码化核酸分子各自包含第一分子标记、第二分子标记、靶结合区和靶结合区的互补物。在一些实施方案中,靶结合区的互补物与靶结合区的一部分互补。在一些实施方案中,靶结合区包括基因特异性序列。在一些实施方案中,靶结合区包括多(dt)序列。
[0258]
术语“模板转换”可以指逆转录酶将初始核酸序列模板转换为新的核酸序列模板的3’末端的能力,该新的核酸序列模板的3’末端与由初始模板合成的核酸的3’末端具有很小或没有互补性。模板转换的实例是逆转录酶将初始核酸序列模板/引物底物转换为新的核酸序列模板的3’末端的能力,该新的核酸序列模板的3’末端与核酸引物链的3’末端几乎不互补或不互补。模板转换允许例如使用逆转录酶制备dna拷贝,所述逆转录酶将初始核酸序列模板转换为新的核酸序列模板的3’末端,该新的核酸序列模板的3’末端与由初始模板合成的dna的3’末端具有很小或没有互补性,由此允许合成将衔接子序列与靶寡核苷酸序列直接相连(无连接)的连续产物dna。模板转换可以包括连接衔接子、均聚物加尾(例如,多腺苷酸化)、随机引物或聚合酶可与之关联的寡核苷酸。在上述任何实施方案中,模板转换可用于引入靶结合区或其互补物。
[0259]
在一些实施方案中,逆转录酶能够具有末端转移酶活性。在一些实施方案中,模板转换寡核苷酸包含一个或更多个3’核糖核苷酸。在一些实施方案中,模板转换寡核苷酸包
含三个3’核糖核苷酸。在一些实施方案中,3’核糖核苷酸包括鸟嘌呤。在一些实施方案中,逆转录酶包括病毒逆转录酶。在一些实施方案中,病毒逆转录酶是鼠白血病病毒(mlv)逆转录酶。在一些实施方案中,病毒逆转录酶是moloney鼠白血病病毒(mmlv)逆转录酶。
[0260]
靶结合区的互补物可以包括靶结合区的反向互补序列,或者可以包括靶结合区的互补序列。分子标记的互补物可以包括分子标记的反向互补序列,或者可以包括分子标记的互补序列。在一些实施方案中,多于一种条形码化核酸分子可以包括条形码化的脱氧核糖核酸(dna)分子和/或条形码化的核糖核酸(rna)分子。在一些实施方案中,核酸靶包括核酸分子(例如核糖核酸(rna)、信使rna(mrna)、微rna、小干扰rna(sirna)、rna降解产物、包含多(a)尾的rna或其任何组合)。在一些实施方案中,mrna编码免疫受体。核酸靶可以包含细胞组分结合试剂。在一些实施方案中,核酸分子与细胞组分结合试剂缔合。方法可以包括使核酸分子和细胞组分结合试剂解离。在一些实施方案中,多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列。多于一种寡核苷酸条形码的每一种分子标记可以包含至少6个核苷酸。
[0261]
在一些实施方案中,多于一种寡核苷酸条形码与固体支持物关联。与同一固体支持物关联的多于一种寡核苷酸条形码可以各自包含相同的样品标记。多于一种寡核苷酸条形码的每一种样品标记可以包含至少6个核苷酸。多于一种寡核苷酸条形码可以各自包含细胞标记。多于一种寡核苷酸条形码的每一种细胞标记可以包含至少6个核苷酸。与同一固体支持物关联的寡核苷酸条形码可以包含相同的细胞标记。与不同固体支持物关联的寡核苷酸条形码可以包含不同的细胞标记。多于一种延伸的条形码化核酸分子可以各自包含细胞标记和细胞标记的互补物。细胞标记的互补物可以包括细胞标记的反向互补序列或细胞标记的互补序列。方法可以包括在存在乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(dmso)、甘油、甲酰胺、7-脱氮-gtp、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合中的一种或更多种的情况下,延伸与核酸靶的拷贝杂交的多于一种寡核苷酸条形码。在一些实施方案中,固体支持物可以包括合成颗粒。在一些实施方案中,固体支持物可以包括平坦表面。
[0262]
样品可以包含单细胞,并且方法可以包括将包含多于一种寡核苷酸条形码的合成颗粒与样品中的单细胞关联。方法可以包括在将合成颗粒与单细胞关联后裂解单细胞。裂解单细胞可以包括加热样品、使样品与去污剂接触、改变样品的ph,或其任何组合。在一些实施方案中,合成颗粒和单细胞在同一孔中。在一些实施方案中,合成颗粒和单细胞在同一液滴中。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被固定在合成颗粒上。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被部分地固定在合成颗粒上。多于一种寡核苷酸条形码中的至少一种可以被包封在合成颗粒中。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被部分地包封在合成颗粒中。在一些实施方案中,合成颗粒是可破坏的。合成颗粒可以包括珠。珠可以包括琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白a缀合珠、蛋白g缀合珠、蛋白a/g缀合珠、蛋白l缀合珠、寡(dt)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。合成颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(pdms)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合。在一些实施方案中,合成颗粒可以包括可破坏的水凝胶颗粒。多于一种寡核苷酸条形码中的每一种可以包含接头官能团,合成颗
粒可以包含固体支持物官能团,和/或支持物官能团和接头官能团可以彼此关联。在一些实施方案中,接头官能团和支持物官能团单独地选自由c6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
[0263]
工作流程可以包括单链条形码化核酸分子421的分子内和/或分子间杂交400c。在一些实施方案中,可以发生多于一种类型的杂交反应400c(例如,400c1、400c2和/或400c3)。该工作流程可以包括在一个或更多个杂交反应400c(例如,400c1、400c2和/或400c3)之后的延伸反应400d。在一些实施方案中,杂交和/或延伸反应在存在高盐缓冲液和/或peg的情况下进行。在一些实施方案中,使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶(例如,klenow片段)进行延伸。缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶可以包括嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合。
[0264]
工作流程可以包括使单链条形码化核酸分子421进行分子内杂交400c1,如非限制性示例性图4b示意图中描绘的。工作流程可以包括使单链条形码化核酸分子421内的靶结合区404和靶结合区的互补物408进行分子内杂交400c1形成茎环。工作流程可以包括使单链条形码化核酸分子421的茎环的3’末端延伸400d以产生延伸的条形码化核酸分子420c。
[0265]
工作流程可以包括使条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区进行分子间杂交。在一些实施方案中,第二分子标记不同于第一分子标记,并且其中第二分子标记不是第一分子标记的互补物。在一些实施方案中,方法包括使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记。在一些实施方案中,第二分子标记的序列不同于第一分子标记的序列,并且其中第二分子标记不是第一分子标记的互补物。工作流程可以包括使单链条形码化核酸分子421与独特寡核苷酸条形码434进行分子间杂交400c2,如非限制性示例性图4b示意图中描绘的。独特的寡核苷酸条形码434可以包含第二分子标记436、细胞标记424和第一通用序列426。寡核苷酸条形码434的第二分子标记436的序列可以不同于单链条形码化核酸分子421的第一分子标记422的序列(例如,不是互补物)。寡核苷酸条形码434的靶结合区404、细胞标记424和/或第一通用序列426可以与单链条形码化核酸分子421的靶结合区404、细胞标记424和/或第一通用序列426相同(或是其互补物)。在一些实施方案中,工作流程可以包括使单链条形码化核酸分子421的靶结合区的互补物408与寡核苷酸条形码434的靶结合区404进行分子间杂交400c2。工作流程可以包括使单链条形码化核酸分子421的3’末端延伸400d以产生延伸的条形码化核酸分子420e1。延伸的条形码化核酸分子420e1可以包含cdna 414c。工作流程可以包括使寡核苷酸条形码434的3’末端延伸400d以产生延伸的条形码化核酸分子420e2。延伸的条形码化核酸分子420e2可以包含反义cdna 414cas。
[0266]
工作流程可以包括使单链条形码化核酸分子421与独特条形码化核酸分子428进行分子间杂交400c3,如非限制性示例性图4b示意图中描绘的。独特条形码化核酸分子428可以包含cdna 430c、第二分子标记432、细胞标记424和第一通用序列426。条形码化核酸分子428的第二分子标记432的序列可以不同于单链条形码化核酸分子421的第一分子标记422的序列(例如,不是互补物)。条形码化核酸分子428的靶结合区404、细胞标记424和/或
第一通用序列426可以与单链条形码化核酸分子421的靶结合区404、细胞标记424和/或第一通用序列426相同(或是其互补物)。在一些实施方案中,工作流程可以包括使单链条形码化核酸分子421的靶结合区的互补物408与条形码化核酸分子428的靶结合区404进行分子间杂交400c3。工作流程可以包括使单链条形码化核酸分子421的3’末端延伸400d以产生延伸的条形码化核酸分子420e3。
[0267]
本文提供的方法和组合物的一些实施方案改进、减少或防止在对免疫受体的v(d)j区进行3’和/或5’表达谱分析期间产生的不期望的产物(例如,包含第一通用序列的互补物的延伸的条形码化核酸分子)。工作流程可以包括使单链条形码化核酸分子421与阻断物寡核苷酸480接触,如非限制性示例性图4b示意图中描绘的。与阻断物寡核苷酸480接触可以发生在单链条形码化核酸分子421的分子间和/或分子内杂交之前、之后和/或与之同时。
[0268]
阻断物寡核苷酸可以能够特异性结合寡核苷酸条形码的一部分,诸如例如,分子标记、细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分、分子标记、第一通用序列、其部分或其任何组合。在一些实施方案中,所公开的延伸阻断物被配置成结合寡核苷酸条形码的除靶结合区(或其互补物)之外的任何部分。在一些实施方案中,所公开的延伸阻断物被配置成结合细胞标记(例如,随机序列和/或分隔随机序列的接头序列)。在一些实施方案中,采用与寡核苷酸条形码的多于一个部分结合的多于一种阻断物寡核苷酸(例如,相对于第二接头和第一通用序列,与阻断物寡核苷酸接触)。例如,阻断物寡核苷酸480可以能够与第一通用序列426特异性结合。阻断物寡核苷酸480可以包含第一通用序列426的全部或一部分的互补物(例如,反向互补物)。在一些实施方案中,多于一种阻断物寡核苷酸480可以能够与第一通用序列426的不同部分特异性结合。阻断物寡核苷酸480可以由天然和/或非天然核苷酸组成。阻断物寡核苷酸480的3’末端可以是可延伸的或不可延伸的。阻断物寡核苷酸480不能作为用于逆转录酶或聚合酶的引物起作用。在一些实施方案中,一旦dna聚合酶到达阻断物寡核苷酸480,延伸反应400d就终止。阻断物寡核苷酸480的结合可以防止进一步延伸到包含第一通用序列426的模板的区域中。在一些实施方案中,延伸的条形码化核酸分子420c、420e1、420e2和/或420e3不包含第一通用序列、细胞标记和/或分子标记的互补物(例如,反向互补物)。在一些实施方案中,阻断物寡核苷酸480可以能够与细胞标记组分特异性结合,并且延伸的条形码化核酸分子420c、420e1、420e2和/或420e3不包含第一通用序列、细胞标记和/或分子标记的互补物(例如,反向互补物)。在一些实施方案中,阻断物寡核苷酸480可以使不期望的延伸产物(例如,包含第一通用序列的互补物(例如,反向互补物)的延伸的条形码化核酸分子)的产生减少至少10%、至少25%、至少50%、至少80%、至少90%、至少95%或至少99%。
[0269]
工作流程可以包括使延伸的条形码化核酸分子420c、420e1、420e2和/或420e3变性400f以产生单链延伸的条形码化核酸分子420cd、420e1d、420e2d和/或420e3d。在一些实施方案中,单链延伸的条形码化核酸分子420cd、420e1d、420e2d和/或420e3d不包含第一通用序列426的互补物(例如,反向互补物)。单链延伸的条形码化核酸分子420cd、420e1d、420e2d和/或420e3d可以包含靶核酸分子(例如,转录物)的5’末端和/或3’末端上的条形码(例如,细胞标记和分子标记),从而与一端仅有一种条形码的靶核酸分子的涉及序列鉴定、转录物计数、选择性剪接分析、突变筛选和/或全长测序的分析相比,实现对靶核酸分子更广泛的分析。
[0270]
在不存在所公开的阻断物寡核苷酸的情况下,单链延伸的条形码化核酸分子420cd、420e1d、420e2d和/或420e3d可以包含第一通用序列的反向互补物。在这样的实施方案中,使用含有通用序列的引物(无论是否含有另外的引物)的pcr反应可以产生单链延伸的条形码化核酸分子420cd、420e1d、420e2d和/或420e3d的全长拷贝。在一些实施方案中,这样的全长拷贝是不期望的。在一些实施方案中,所公开的延伸阻断物减少或防止这样的不想要的通用到通用pcr产物的形成。
[0271]
单链延伸的条形码化核酸分子420cd、420e1d、420e2d和/或420e3d可以用作用于一个或更多个扩增反应(例如,pcr)的模板,诸如例如,图4e中描绘的非限制性示例性扩增方案。一次或更多次扩增可以包括靶特异性(例如,基因特异性)cdna扩增。例如,单链延伸的条形码化核酸分子420e2d可以经历采用包含第一通用序列426的序列的通用寡核苷酸引物476和靶特异性引物478的第一轮扩增(“pcr1”)400f。靶特异性引物478可以包含第二通用序列(例如,读段2序列、通用pcr手柄)。靶特异性引物478可以包含核酸靶的互补物。靶特异性引物478可以结合免疫受体的恒定区、可变区、多样性区和/或连接区。在其中核酸靶包括mrna的实施方案中,靶特异性引物478可以包含核酸靶的反义链的序列(例如,cdna)。靶特异性引物478可以不能够特异性结合单链延伸的条形码化核酸分子420cd、420e1d、420e2d和/或420e3d。靶特异性引物478可以能够特异性结合单链延伸的条形码化核酸分子420e2d并被延伸以产生产物482。单链延伸的条形码化核酸分子420cd、420e1d、420e2d和/或420e3d可以不能够用作用于通用寡核苷酸引物476的模板。产物482可以包含第一通用序列的反向互补物426rc。靶特异性引物478可以能够特异性结合产物482并被延伸以产生产物484。pcr1产物可以包含第二分子标记436和细胞标记424。包含482和484(例如,pcr1产物)的双链dna分子可以进行另外的下游反应400g(如本文公开的引发和延伸反应、扩增反应和/或测序反应)。例如,在一些实施方案中,工作流程包括采用通用寡核苷酸引物和巢式靶特异性引物的第二轮扩增(“pcr2”)。通用寡核苷酸引物和/或巢式靶特异性引物可以经由一种或更多种引物中的一个或更多个突出端将一个或更多个测序衔接子添加到pcr2产物。工作流程可以包括pcr2产物的文库扩增(“索引pcr”)。索引pcr可以经由测序文库扩增引物中的突出端添加测序衔接子(例如,p5和p7)和样品索引(例如,i5和i7)。索引pcr扩增子可以被测序并经历本公开内容的下游方法。使用150bp
×
2测序的测序可以揭示读段1上的细胞标记、独特分子标记和/或基因(或基因的部分序列),读段2上的基因(或基因的部分序列)以及索引1读段和/或索引2读段上的样品索引。pcr1、pcr2和/或pcr3可以包括1-30个循环(例如,15个循环)。在一些实施方案中,工作流程包括采用一组靶特异性pcr1引物和/或一组靶特异性pcr2引物的多重pcr。在一些实施方案中,靶包括bcr、tcr和/或免疫相关转录物。在一些实施方案中,可以进行对免疫受体的v(d)j区的3’和/或5’表达谱分析。在一些实施方案中,可以研究单细胞平台中t细胞和/或b细胞的表型标志物和一种或更多种免疫受体v(d)j序列二者。在一些实施方案中,可以在单个实验中捕获它们的转录物的3’和5’信息二者。本文公开的方法可以允许t细胞和b细胞二者的v(d)j检测(例如,高频突变)。
[0272]
在一些实施方案中,本文提供的阻断物寡核苷酸可以与使用组合的5’条形码化和随机引发方法获得全长v(d)j信息(例如,在rhapsody系统上通过illumina测序)的方法协同采用,所述方法已在2020年11月6日提交的题为“using random priming to obtain full-length v(d)jinformation for immune repertoire sequencing”的美国专利申请
号17/091,639中描述,该专利申请的内容通过引用以其整体并入本文。在一些实施方案中,提供了采用5’条形码化、随机引发和延伸以及所公开的阻断物寡核苷酸来获得全长v(d)j信息的方法。例如,在一些实施方案中,方法包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区。方法可以包括:在存在逆转录酶和包含靶结合区或其一部分的模板转换寡核苷酸的情况下,使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸,以产生多于一种条形码化核酸分子,所述多于一种条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区和靶结合区的互补物。方法可以包括:使条形码化核酸分子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使每种条形码化核酸分子的靶结合区的互补物与多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交。方法可以包括:使与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’末端延伸以产生多于一种延伸的条形码化核酸分子,所述多于一种延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记,其中阻断物寡核苷酸减少包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。方法可以包括使用能够与核酸靶的序列杂交的靶特异性引物和包含第一通用序列的引物扩增多于一种延伸的条形码化核酸分子,从而产生包含核酸靶的序列或其一部分的第一多于一种条形码化扩增子。方法可以包括使第一多于一种条形码化扩增子与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括使随机引物与第一多于一种条形码化扩增子杂交,并使随机引物延伸以产生多于一种延伸产物。阻断物寡核苷酸可以减少不期望的延伸产物的产生。随机引物可以包含第二通用序列或其互补物。方法可以包括使用能够与第一通用序列和第二通用序列或它们的互补物杂交的引物扩增多于一种延伸产物,从而产生第二多于一种条形码化扩增子。方法可以包括基于与第二多于一种条形码化扩增子或其产物关联的具有不同序列的第一分子标记、具有不同序列的第二分子标记或其组合的数目来确定样品中核酸靶的拷贝数。
[0273]
免疫组库谱分析
[0274]
在一些实施方案中,提供了对免疫受体的v(d)j区进行3’和/或5’表达谱分析的方法。在一些实施方案中,样品包括单细胞。在一些实施方案中,样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。单细胞可以包括免疫细胞。在一些实施方案中,免疫细胞是b细胞或t细胞。在一些实施方案中,单细胞可以包括循环肿瘤细胞。在一些实施方案中,每一种寡核苷酸条形码可以包含第一通用序列。在一些实施方案中,多于一种延伸的条形码化核酸分子包含第一通用序列,并且不包含第一通用序列的互补物。在一些实施方案中,扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子包括使用能够与第一通用序列杂交的引物和扩增引物。
[0275]
在一些实施方案中,扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子包括使用能够与第一通用序列杂交的引物和扩增引物。扩增引物可以是靶特异性引物。靶特异性引物可以与以下特异性杂交:免疫受体、免疫受体的恒定区、免疫受体的可变区、免疫受体的多样性区和/或免疫受体的可变区和多样性区的连接处。在一些实施方案中,扩增引物特异性结合延伸的条形码化核酸分子,所述延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记。在一些实施方案中,扩增引物不结合包含
第一分子标记的延伸的条形码化核酸分子。在一些实施方案中,扩增引物包含核酸靶的互补物。在一些实施方案中,核酸靶包括mrna,并且其中扩增引物包含核酸靶的反义链的序列。在一些实施方案中,阻断物寡核苷酸减少包含多于一种分子标记的单标记的核酸分子的产生。在一些实施方案中,与在不存在延伸阻断物的情况下进行的相当的方法相比,包含多于一种分子标记的单标记的核酸分子的产生减少了至少5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。
[0276]
在一些实施方案中,扩增引物是靶特异性引物。在一些这样的实施方案中,靶特异性引物与免疫受体特异性杂交。例如,靶特异性引物可以与免疫受体的恒定区、免疫受体的可变区、免疫受体的多样性区、免疫受体的可变区和多样性区的连接处或其任何组合特异性杂交。免疫受体可以是t细胞受体(tcr)和/或b细胞受体(bcr)。tcr可以包含tcrα链、tcrβ链、tcrγ链、tcrδ链或其任何组合。bcr可以包含bcr重链和/或bcr轻链。
[0277]
方法可以包括获得多于一种延伸的条形码化核酸分子或其产物的序列信息。获得序列信息可以包括将测序衔接子附接到多于一种延伸的条形码化核酸分子或其产物。获得序列信息可以包括将测序衔接子附接到多于一种单标记的核酸分子或其产物。
[0278]
获得序列信息可以包括获得单细胞的bcr轻链和bcr重链的序列信息。bcr轻链和bcr重链的序列信息可以包括bcr轻链和/或bcr重链的互补决定区1(cdr1)、cdr2、cdr3或其任何组合的序列。方法可以包括基于所获得的序列信息使单细胞的bcr轻链和bcr重链进行配对。样品可以包括多于一个单细胞,并且方法可以包括基于所获得的序列信息使至少50%的单细胞的bcr轻链和bcr重链进行配对。在一些实施方案中,其中bcr轻链和bcr重链按照本文提供的方法配对的样品的单细胞百分比可以是以下或是约以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,或这些值中的任何两个之间的数字或范围。在一些实施方案中,其中bcr轻链和bcr重链按照本文提供的方法配对的样品的单细胞百分比可以是至少以下或至多以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、
53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0279]
获得序列信息可以包括获得单细胞的tcrα链和tcrβ链的序列信息。在一些实施方案中,tcrα链和tcrβ链的序列信息可以包括tcrα链和/或tcrβ链的互补决定区1(cdr1)、cdr2、cdr3或其任何组合的序列。
[0280]
在一些实施方案中,方法可以包括基于所获得的序列信息使单细胞的tcrα链和tcrβ链进行配对。在一些实施方案中,样品可以包括多于一个单细胞,并且方法可以包括基于所获得的序列信息使至少50%的单细胞的tcrα链和tcrβ链进行配对。在一些实施方案中,其中tcrα链和tcrβ链按照本文提供的方法配对的样品的单细胞百分比可以是以下或是约以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,或这些值中的任何两个之间的数字或范围。在一些实施方案中,其中tcrα链和tcrβ链按照本文提供的方法配对的样品的单细胞百分比可以是至少以下或至多以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0281]
获得序列信息可以包括获得单细胞的tcrγ链和tcrδ链的序列信息。tcrγ链和tcrδ链的序列信息可以包括tcrγ链和/或tcrδ链的互补决定区1(cdr1)、cdr2、cdr3或其任何组合的序列。方法可以包括基于所获得的序列信息使单细胞的tcrγ链和tcrδ链进行配对。样品可以包括多于一个单细胞,并且方法可以包括基于所获得的序列信息使至少50%的单细胞的tcrγ链和tcrδ链进行配对。在一些实施方案中,其中tcrγ链和tcrδ链按照本文提供的方法配对的样品的单细胞百分比可以是以下或是约以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、
48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,或这些值中的任何两个之间的数字或范围。在一些实施方案中,其中tcrδ链和tcrγ链根据本文提供的方法配对的样品的单细胞百分比可以是至少以下或至多以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0282]
具有随机引发和延伸的全转录组分析(wta)
[0283]
本文的公开内容包括用于从cdna产物(例如,bd rhapsody单细胞分析系统的cdna产物)产生全转录组分析(wta)文库用于用所公开的阻断物寡核苷酸在相容的测序仪(例如,测序仪)上进行测序的方法。目前,标准的bd rhapsody rna工作流程首先经由bd rhapsody细胞捕获珠(下文称为’珠’)上的3’捕获和cdna合成来捕获rna转录组,然后进行2次多重化巢式pcr扩增,以富集感兴趣的rna靶(靶向测定)。在方法的一些实施方案中,靶向rna分析通常对低表达靶产生更高的灵敏度,而wta rna分析提供更大广度的被询问基因。在一些实施方案中,期望的靶的成功扩增可能需要彻底了解感兴趣的模型系统中每种rna的3’末端及其多腺苷酸化位点的使用。wta方法,例如与bd rhapsody一起使用,允许获得若干水平的信息,包括1)在其模型系统中识别感兴趣的rna靶,以鉴定待设计的一组基因;2)将其模型系统中转录组的3’末端表征为用于bd rhapsody的新一代pcr组套设计(panel design)的输入,以及3)与标准bd rhapsody靶向方法相比,允许用户通过测定更大广度的基因来进行发现生物学。对过去公开的wta方法的挑战是实现含有珠的wta pcr扩增,因为该pcr产量低。例如,在一些实施方案中,本文公开的新的基于rpe的wta方法用替换随机引发和dna聚合酶延伸可以免去在珠上进行wta pcr的需要。基于rpe的全转录组分析的方法和组合物已在美国专利申请第16/677,012号中描述;该专利申请的内容通过引用以其整体并入本文。本文公开的基于rpe的wta方法可以导致低丰度转录物的灵敏度提高、检测新的转录物、检测新的细胞类型和/或降低测序成本。与可选的非基于rpe的wta方法(例如,基于连接或基于片段化的wta方法)和/或不采用所公开的阻断物寡核苷酸的基于rpe的wta方法相比,本文提供的基于rpe的wta方法的一些实施方案导致低丰度转录物的灵敏度增加、检测新的转录物、检测新的细胞类型和/或测序成本减少。在一些实施方案中,方法包括使能够与寡核苷酸条形码的不同部分杂交的阻断物寡核苷酸的混合物(例如,能够与通用序列杂交的第一阻断物寡核苷酸和能够与细胞标记杂交的第二阻断物寡核苷酸)接触。
[0284]
本文提供的方法和组合物的一些实施方案减少或防止在基于rpe的全转录组分析期间产生的不期望的产物(例如,与寡核苷酸条形码的一部分杂交的随机引物的延伸产
物)。对于wta,主要的不想要的产物可以由随机引物扩增形成,所述随机引物在珠寡核苷酸的多dt或umi或接头或细胞标记处或附近延伸并向珠延伸。在一些实施方案中,每个加尾的随机物都可以被延伸。然而,这些随机物经常可以与寡核苷酸条形码杂交,并从每个珠上的可能每个寡核苷酸条形码产生短的不想要的rpe(随机引发的延伸)pcr产物。即使没有任何mrna可复制的寡核苷酸条形码(例如,在没有细胞的孔中的寡核苷酸条形码偶联珠)也可能发生这种情况。因此,不想要的产物可能非常大量。对用于去除和/或防止产生这些短的大量的不想要的pcr产物的产生的组合物和方法存在需求。添加用于在产生后去除这些短的不想要的产物的方案步骤可能是不利的。在一些实施方案中,通过使阻断物寡核苷酸(阻断物)与颗粒关联寡核苷酸条形码杂交在用嗜中温聚合酶(例如,klenow exo-)延伸之前防止随机物与这些颗粒关联寡核苷酸条形码杂交来解决上述需求。在一些实施方案中,在wta期间采用的随机物具有随机的9个碱基的序列。在一些这样的实施方案中,阻断物包含至少9个碱基,使得它们在比大多数随机物更高的温度杂交。在一些实施方案中,细胞标记的接头序列为12个碱基长。在一些这样的实施方案中,12个碱基的阻断物应该是减少或防止不想要的延伸产物的适当的长度。在一些实施方案中,wta方案采用37℃延伸,然后45℃和55℃的延伸温度。在一些这样的实施方案中,12个碱基的阻断物将解链脱离并允许cdna wta产物来包含细胞标记和r1互补物。
[0285]
在一些实施方案中,wta阻断物寡核苷酸是不可延伸的。在一些实施方案中,如果阻断物被延伸,它们可能不会在cdna可以通过umi、细胞标记和r1序列被复制之前被解链脱离。相反,在一些实施方案中,如果wta阻断物被足够紧密地平铺,则它们不足以延伸来增加它们的解链温度,使得它们保持在模板上,并且不允许细胞标记、umi和r1序列的复制。在一些实施方案中,使阻断物不可延伸以实现防止短的不想要的pcr产物且还允许通过umi、细胞标记和r1序列复制cdna的目标。在一些实施方案中,阻断物紧密地平铺在一起使得延伸很少或不发生。在一些这样的实施方案中,阻断物结合(例如,与之互补)r1、接头1、接头2、细胞标记1、细胞标记2、细胞标记3和/或多(dt)区,并且阻断物之间的间隔很小或没有。在一些实施方案中,方法对r1采用约2种阻断物,对多(dt)采用约2种(或更多个)阻断物,对每个接头采用约1种阻断物,并且对每个细胞标记区采用约96种阻断物。
[0286]
图5a-图5d示出了使用阻断物寡核苷酸进行基于随机引发和引物延伸(rpe)的全转录组分析(wta)的非限制性示例性工作流程的示意图。条形码(例如,随机条形码、寡核苷酸条形码502)可以包含靶结合区(例如,多(dt)510),所述靶结合区可以经由多(da)尾518与核酸靶(例如,多腺苷酸化的rna转录物514或其他核酸靶,诸如例如,结合试剂寡核苷酸(无论是与结合试剂缔合的还是与结合试剂解离的))结合,或与其他核酸靶结合,用于标记或条形码化(例如,加独特标记)。靶结合区可以包含基因特异性序列、寡(dt)序列、随机多聚体或其任何组合。寡核苷酸条形码502还可以包含多个标记。寡核苷酸条形码502可以包含分别用于标记转录物和/或追踪rna转录物(或核酸靶,诸如例如抗体寡核苷酸(无论是与抗体缔合的还是已与抗体解离的))的样品来源的分子标记(ml)508和样品标记(例如,分区标记、细胞标记(cl)506),以及用于后续反应的位于每种寡核苷酸条形码502的分子标记508/细胞标记506区域侧翼的一个或更多个另外的序列,诸如例如,第一通用序列504(例如,读段1序列)。每个样品的寡核苷酸条形码中分子标记的序列的库可以足够大以对rna转录物进行随机标记。在一些实施方案中,样品标记是分区标记。
[0287]
在一些实施方案中,样品标记是细胞标记。细胞标记可以包含一个或更多个随机或非随机序列,所述随机或非随机序列散布有一个或更多个标记接头(例如,接头、接头标记序列)。接头标记序列的长度可以是至少约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。接头标记序列的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。在一些情况下,接头标记序列的长度是12个核苷酸。接头标记序列可以用于促进条形码的合成。接头标记可以包括错误校正(例如,汉明)码。例如,细胞标记506可以包含细胞标记的第一部分506a、第一接头506b、细胞标记的第二部分506c、第二接头506d和细胞标记的第三部分506e。对于两个或更多个寡核苷酸偶联的固体支持物,细胞标记的接头(例如,第一接头和第二接头)可以是相同的。用于两个或更多个固体支持物的细胞标记的第一部分、细胞标记的第二部分和/或细胞标记的第三部分对于两种或更多种寡核苷酸偶联的固体支持物可以是不同的。
[0288]
在一些实施方案中,条形码与固体支持物(例如,颗粒512)关联。多于一种寡核苷酸条形码502可以与颗粒512关联。在一些实施方案中,颗粒是珠。珠可以是用条形码或随机条形码官能化的聚合珠,例如可变形的珠或凝胶珠(诸如来自10x genomics(san francisco,ca)的凝胶珠)。在一些实施方式中,凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促进剂(例如,四甲基乙二胺(temed))后,可以产生凝胶珠。多腺苷酸化rna转录物514可以包含rna序列516r和多(da)尾518。
[0289]
工作流程可以包括使多腺苷酸化rna转录物514和寡核苷酸条形码502杂交。工作流程可以包括使与多腺苷酸化rna转录物514杂交的寡核苷酸条形码502延伸(例如,通过逆转录500a)以产生条形码化核酸分子520,所述条形码化核酸分子520包含cdna 516c(rna序列516r的反向互补序列)。工作流程可以包括rna酶h处理和/或变性500b(例如,加热和/或碱变性)和使多腺苷酸化转录物与条形码化核酸分子分离。
[0290]
工作流程可以包括使条形码化核酸分子520(和相邻的寡核苷酸条形码502)与随机引物522接触500c1。如描绘的,随机引物522还可以与寡核苷酸条形码502结合。随机引物522可以包含突出端,所述突出端可以包含或可以为例如第二通用序列(或其互补物,例如反向互补物)(例如,读段2序列、通用pcr手柄)。随机引物522可以沿着条形码化核酸分子的编码序列与不同的位置结合。然而,如图5c中示出的,随机引物522也可以结合到寡核苷酸条形码的部分,诸如例如,通用标记、细胞标记、分子标记等的部分。工作流程还可以包括如本文公开的下游反应500c2(例如,引物延伸、扩增反应和/或测序)。使与寡核苷酸条形码的一部分杂交的随机引物522延伸可以产生不期望的延伸产物。对用于防止这样的不期望的延伸产物的产生的wta分析的组合物和方法存在需求。
[0291]
工作流程可以包括使条形码化核酸分子520(和相邻的寡核苷酸条形码502)与一种或更多种阻断物寡核苷酸524(例如,524a、524b、524c和/或524d)接触500d1。阻断物寡核苷酸524可以被配置为与寡核苷酸条形码的一部分(例如,第一通用序列、细胞标记、分子标记、靶结合区(例如,多(dt)))特异性结合。例如,阻断物寡核苷酸524a和524b可以能够与第一通用序列504特异性结合。阻断物寡核苷酸524a和524b可以包含第一通用序列504的全部或一部分的互补物(例如,反向互补物)。阻断物寡核苷酸524c和524d可以能够与细胞标记506特异性结合。例如,阻断物寡核苷酸524c和524d可以分别包含第一接头506b和第二接头
506d的全部或一部分的互补物(例如,反向互补物)。阻断物寡核苷酸524可以由天然和/或非天然核苷酸组成。阻断物寡核苷酸524的3’末端可以是可延伸的或具有不可延伸的末端526。阻断物寡核苷酸524可以不能够作为用于逆转录酶或聚合酶的引物起作用。在一些实施方案中,阻断物寡核苷酸524可以是可延伸的,并且接触步骤500d1包括与多于一种阻断物寡核苷酸524(例如,524a、524b、524c和/或524d)接触。
[0292]
工作流程可以包括使条形码化核酸分子520与随机引物522接触500d2。步骤500d1可以发生在步骤500d2之前或可以与500d2同时进行。随机引物522可以包含突出端,所述突出端可以包含或可以为例如第二通用序列(或其互补物,例如反向互补物)(例如,读段2序列、通用pcr手柄)。随机引物522可以沿着条形码化核酸分子的编码序列与不同的位置结合。然而,如图5d中示出的,可以通过在存在阻断物寡核苷酸524的情况下来防止随机引物522与寡核苷酸条形码的部分诸如例如通用标记、细胞标记、分子标记等的部分结合。工作流程还可以包括如本文公开的下游反应500d3(例如,引物延伸、扩增反应和/或测序)。在一些实施方案中,阻断物寡核苷酸524(例如,524a、524b、524c和/或524d)可以将不期望的延伸产物(例如,与寡核苷酸条形码的一部分杂交的随机引物的延伸产物)的产生减少至少10%、至少25%、至少50%、至少80%、至少90%、至少95%或至少99%。在一些实施方案中,使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶(例如,klenow片段)进行延伸。缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶可以包括嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合。使随机引物522延伸的步骤可以在不变的温度进行。例如,随机引物的延伸522可以在第一延伸温度(例如,37℃)开始,并且然后在第二延伸温度(例如,55℃)进行,其中第二延伸温度高于第一延伸温度。一种或更多种阻断物寡核苷酸524可以包括处于或低于初始延伸温度的退火温度。阻断物寡核苷酸524可以在比大多数随机引物522更高的温度与多于一种第一链条形码化多核苷酸杂交。在使随机引物522延伸的步骤期间,与多于一种第一链条形码化多核苷酸杂交的阻断物寡核苷酸524可以解链脱离。一种或更多种阻断物寡核苷酸524可以包括低于第二延伸温度的解链温度。
[0293]
本文的公开内容包括对样品中的核酸靶进行标记的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记、细胞标记和能够与核酸靶的拷贝杂交的靶结合区。方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸。方法可以包括:使第一链条形码化多核苷酸与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使随机引物与多于一种第一链条形码化多核苷酸接触,其中随机引物中的每一种包含第二通用序列或其互补物。方法可以包括:使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸以产生多于一种延伸产物,其中阻断物寡核苷酸减少不期望的延伸产物的产生,其中不期望的延伸产物包括与寡核苷酸条形码的一部分杂交的随机引物的延伸产物。方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种延伸产物,从而产生第一多于一种条形码化扩增子。在一些实施方案中,扩增多于一种延伸产物包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到多于一种延伸产物。方法可以包括:基于与第一多于一种条形码化扩增子或其产物关联的具有不同
序列的分子标记的数目来确定样品中核酸靶的拷贝数。
[0294]
本文的公开内容包括用于确定样品中核酸靶的数目的方法。方法可以包括:使核酸靶的拷贝与多于一种寡核苷酸条形码接触,其中每种寡核苷酸条形码包含第一通用序列、分子标记、细胞标记和能够与核酸靶的拷贝杂交的靶结合区。方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸。方法可以包括:使第一链条形码化多核苷酸与能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸接触。方法可以包括:使随机引物与多于一种第一链条形码化多核苷酸接触,其中随机引物中的每一种包含第二通用序列或其互补物。方法可以包括:使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸以产生多于一种延伸产物,其中阻断物寡核苷酸减少不期望的延伸产物的产生,其中不期望的延伸产物包括与寡核苷酸条形码的一部分杂交的随机引物的延伸产物。方法可以包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种延伸产物,从而产生第一多于一种条形码化扩增子。方法可以包括:基于与第一多于一种条形码化扩增子或其产物关联的具有不同序列的分子标记的数目来确定样品中核酸靶的拷贝数。
[0295]
在一些实施方案中,使随机引物延伸的步骤在近似恒定的温度进行。在一些实施方案中,使随机引物延伸的步骤在不变的温度进行。在一些实施方案中,使随机引物延伸的步骤在第一延伸温度开始。在一些实施方案中,使随机引物延伸的步骤在一个或更多个不同于第一延伸温度的温度(例如,第二延伸温度和/或第三延伸温度)进行。第二延伸温度和/或第三延伸温度可以高于或低于第一延伸温度。在一些实施方案中,第一延伸温度为约30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃,或这些值中的任何两个之间的数字或范围。在一些实施方案中,第二延伸温度和/或第三延伸温度为约30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃,或这些值中的任何两个之间的数字或范围。在一些实施方案中,第一延伸温度为约37℃。在一些实施方案中,第二延伸温度为约55℃。在一些实施方案中,第二延伸温度为约45℃。在一些实施方案中,一种或更多种阻断物寡核苷酸包括处于或低于初始延伸温度的退火温度。在一些实施方案中,阻断物寡核苷酸在比大多数随机引物更高的温度与多于一种第一链条形码化多核苷酸杂交。在一些实施方案中,与多于一种第一链条形码化多核苷酸杂交的阻断物寡核苷酸在使随机引物延伸的步骤期间解链脱离。在一些实施方案中,一种或更多种阻断物寡核苷酸包括低于第二延伸温度的解链温度。
[0296]
在一些实施方案中,与寡核苷酸条形码的一部分杂交的随机引物的延伸产生不期望的延伸产物。不期望的延伸产物可以包括不包含靶核酸(或其互补物)的序列的延伸产物。在一些实施方案中,与不存在延伸阻断物的情况下进行的相当的方法相比,不期望的延伸产物的产生减少了至少5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、
17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。在一些实施方案中,不期望的延伸产物占多于一种延伸产物的少于5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%,或这些值中的任何两个之间的数字或范围。
[0297]
第一链条形码化多核苷酸可以包括条形码化脱氧核糖核酸(dna)分子、条形码化核糖核酸(rna)分子或二者。在不同实施方式中,随机引发和延伸循环的数目可以不同。在一些实施方案中,随机引发和延伸循环的数目可以包括以下或包括约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个、100个随机引发和延伸循环,或这些值中的任何两个之间的数字或范围的随机引发和延伸循环。在一些实施方案中,随机引发和延伸循环的数目可以包括至少以下或至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个或100个随机引发和延伸循环。
[0298]
方法可以包括使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种延伸产物,从而产生第一多于一种条形码化扩增子。在不同的实施方式中,扩增(例如,线性扩增、pcr扩增)的循环的数目可以是不同的。在一些实施方案中,扩增可以包括以下或包括约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个、100个扩增循环,或这些值中的任何两个之间的数字或范围的扩增循环。在一些实施方案中,线性扩增可以包括至少或至多1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个或100个扩增循环。第一多于一种条形码化扩增子可以对应于单细胞的mrna的至少10%。第一多于一种条形码化扩增子可以对应于单细胞的mrna的至少50%。第一多于一种条形码化扩增子可以对应于单细胞的mrna的至少90%。在一些实施方案中,第一多于一种条形码化扩增子可以对应于单细胞的mrna的至少以下:5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、
16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,或这些值中的任何两个之间的数字或范围。第一多于一种条形码化扩增子可以包含全转录组扩增(wta)产物。扩增多于一种延伸产物可以包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到多于一种延伸产物。方法可以包括基于与第一多于一种条形码化扩增子或其产物关联的具有不同序列的分子标记的数目,确定样品中核酸靶的拷贝数。在一些实施方案中,扩增多于一种延伸产物不在存在固体支持物的情况下进行。在一些实施方案中,方法不包括核糖核酸酶h诱导的引发、末端修复和/或衔接子连接。在一些实施方案中,方法不包括片段化、标签片段化或二者。在一些实施方案中,方法不包括用于去除不期望的延伸产物的步骤。
[0299]
在一些实施方案中,使核酸靶的拷贝接触包括使多于一种核酸靶的拷贝与多于一种寡核苷酸条形码接触,使多于一种寡核苷酸条形码延伸包括使与多于一种核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸,并且确定样品中核酸靶的拷贝数包括基于与第一多于一种条形码化扩增子中的条形码化扩增子关联的具有不同序列的分子标记的数目来确定样品中多于一种核酸靶中的每一种的数目,所述第一多于一种条形码化扩增子包括多于一种核酸靶中的每一种的序列。多于一种核酸靶中的每一种的序列可以包括多于一种核酸靶中的每一种的子序列。第一多于一种条形码化扩增子中的核酸靶的序列可以包括核酸靶的子序列。
[0300]
方法可以包括使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增第一多于一种条形码化扩增子,从而产生第二多于一种条形码化扩增子。方法可以包括使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种延伸产物,从而产生第一多于一种条形码化扩增子。在不同的实施方式中,扩增(例如,线性扩增、pcr扩增)的循环的数目可以是不同的。在一些实施方案中,扩增可以包括以下或包括约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个、100个扩增循环,或这些值中的任何两个之间的数字或范围的扩增循环。在一些实施方案中,线性扩增可以包括至少或至多1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个或100个扩增循环。第二多于一种条形码化扩增子可以对应于单细胞的mrna的至少10%、单细胞的mrna的至少50%或单细胞的mrna的至少90%。在一些实施方案中,第二多于一种条形码化扩增子可以对应于单细胞的mrna的至少以下:5%、6%、7%、8%、9%、10%、11%、12%、
13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,或这些值中的任何两个之间的数字或范围。第二多于一种条形码化扩增子可以包含全转录组扩增(wta)产物。扩增第一多于一种条形码化扩增子可以包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到第一多于一种条形码化扩增子。
[0301]
方法可以包括基于与第二多于一种条形码化扩增子或其产物关联的具有不同序列的分子标记的数目,确定样品中核酸靶的拷贝数。在一些实施方案中,使核酸靶的拷贝接触包括使多于一种核酸靶的拷贝与多于一种寡核苷酸条形码接触,使多于一种寡核苷酸条形码延伸包括使与多于一种核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一种第一链条形码化多核苷酸,和/或其中确定样品中核酸靶的拷贝数包括基于与第二多于一种条形码化扩增子中的条形码化扩增子关联的具有不同序列的分子标记的数目来确定样品中多于一种核酸靶中的每一种的数目,所述第二多于一种条形码化扩增子包括多于一种核酸靶中的每一种的序列。多于一种核酸靶中的每一种的序列可以包括多于一种核酸靶中的每一种的子序列。第二多于一种条形码化扩增子中的核酸靶的序列可以包括核酸靶的子序列。
[0302]
第一多于一种条形码化扩增子和/或第二多于一种条形码化扩增子中的每一种可以包含以下的至少一部分:第一通用序列、第二通用序列或二者。第一通用序列和第二通用序列可以相同或不同。第一通用序列和/或第二通用序列可以包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分。测序衔接子可以包括p5序列、p7序列、其互补序列和/或其部分。测序引物可以包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。
[0303]
随机引物可以包含随机核苷酸序列。随机核苷酸序列的长度可以为约4个至约30个核苷酸。在一些实施方案中,所述随机核苷酸序列的长度为6个或9个核苷酸。在不同实施方式中,随机核苷酸序列可以具有不同的长度。在一些实施方案中,随机引物内的随机核苷酸序列的长度是以下或是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个核苷酸,或这些值中的任何两个之间的数字或范围。在一些实施方案中,随机引物内的随机核苷酸序列的长度是至少以下或至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个核苷酸。在不同的实施方式中,随机引物可以在随机引发步骤期间具有不同的浓度。在一些实施方案中,随机引物在随机引发期间的浓度是至少以下或至多以下:1um、2um、3um、4um、5um、6um、7um、8um、9um、10um、11um、12um、13um、14um、15um、16um、17um、18um、19um、20um、25um、30um、35um、40um、45um、50um、60um、70um、80um、90um、100um、110um、120um、128um,或这些值中的任何两个之间的数字或范围的um。
[0304]
使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸可以包括使用逆转录酶(例如,病毒逆转录酶)使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸。使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸可以包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸。使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸可以包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶(例如,klenow片段)使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸。在一些实施方案中,延伸酶是klenow或klenow exo-。缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶可以包括嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合。
[0305]
在一些实施方案中,多于一种第一链条形码化多核苷酸可以被再用作另外的延伸和/或扩增反应的模板(在随机引发和延伸之后)。方法可以包括重复以下步骤:使第一链条形码化多核苷酸与一种或更多种阻断物寡核苷酸接触,使随机引物与多于一种第一链条形码化多核苷酸接触,使与多于一种第一链条形码化多核苷酸杂交的随机引物延伸,以及扩增多于一种延伸产物。方法可以包括使用多于一种第一链条形码化多核苷酸作为模板合成第三多于一种条形码化扩增子以产生第三多于一种条形码化扩增子。合成第三多于一种条形码化扩增子可以包括对多于一种第一链条形码化多核苷酸进行聚合酶链式反应(pcr)扩增。合成第三多于一种条形码化扩增子可以包括使用能够与第一通用序列或其互补物杂交的引物以及靶特异性引物进行的pcr扩增。方法可以包括获得第三多于一种条形码化扩增子或其产物的序列信息。获得序列信息可以包括将测序衔接子附接到第三多于一种条形码化扩增子或其产物。靶特异性引物可以与免疫受体(例如,t细胞受体(tcr)和/或b细胞受体(bcr))特异性杂交。
[0306]
在一些实施方案中,全转录组分析可以与以一个工作流程进行的靶向基因表达谱分析、用abo的样品多重化和用abo的蛋白表达谱分析中的一种或更多种相容,并且可以以一个工作流程进行。在一些实施方案中,对第一链条形码化多核苷酸的一部分(例如,在细胞捕获和条形码化之后的珠)进行二次取样以用于rpe wta,并且将剩余的第一链条形码化多核苷酸用于靶向(例如,基因特异性)扩增和分析(例如,靶向pcr2和靶向索引pcr)。在一些实施方案中,在rpe wta之后,第一链条形码化多核苷酸可以使用本文公开的多重化引物组再用于靶向(例如,基因特异性)扩增和分析。在一些实施方案中,从本文提供的基于rpe的wta方法获得的测序信息用于产生用于本文公开的靶向(例如,基因特异性)扩增和分析的一组引物。
[0307]
样品可以包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。样品可以包括外周血单个核细胞或免疫细胞。免疫细胞可以包括b细胞、t细胞或其组合。核酸靶可以包括核酸分子。核酸分子可以包括核糖核酸(rna)、信使rna(mrna)、微rna、小干扰rna(sirna)、rna降解产物、含有多(a)尾的rna或其任何组合。mrna编码免疫受体。多于一种核酸靶中的一种或更多种可以包括低表达基因的mrna。核酸靶可以包含细胞组分结合试剂。核酸分子可以与细胞组分结合试剂缔合。方法可以包括使核酸分子和细胞组分结合试剂解离。靶结合区可以包含寡dt序列、随机序列、靶特异性序列或其组合。靶结合区可以包含多(dt)区,并且核酸靶可以包含多(da)区。
[0308]
方法可以包括多于一种延伸产物、第一多于一种条形码化扩增子和/或第二多于一种条形码化扩增子的清理(例如,ampure清理)。在不同的实施方式中,spri清理比率可以是不同的。在一些实施方案中,spri清理比率为约0.1x至约3.0x(例如0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.5、2.7、3.0,以及这些值中的任何两个中的范围)。清理可以是单侧或双侧的。在本文提供的方法的一些实施方案中,使用所公开的阻断物寡核苷酸通过减少不想要的产物的产生而有利地减少了清理步骤的数目。在本文提供的方法的一些实施方案中,使用所公开的阻断物寡核苷酸有利地改变了清理步骤的实施(例如,无论清理可以是单侧的或双侧的和/或spri清理比率)。
[0309]
多于一种寡核苷酸条形码中的至少10种可以包含不同的分子标记序列。多于一种寡核苷酸条形码的每一种分子标记可以包含至少6个核苷酸。多于一种寡核苷酸条形码可以与固体支持物关联。与同一固体支持物关联的多于一种寡核苷酸条形码可以各自包含相同的样品标记。多于一种寡核苷酸条形码的每一种样品标记可以包含至少6个核苷酸。多于一种寡核苷酸条形码可以各自包含细胞标记。多于一种寡核苷酸条形码的每一种细胞标记可以包含至少6个核苷酸。与同一固体支持物关联的寡核苷酸条形码可以包含相同的细胞标记。与不同固体支持物关联的寡核苷酸条形码可以包含不同的细胞标记。固体支持物可以包括合成颗粒、平坦表面,或其组合。在本文提供的反应的不同实施方式中,固体支持物(例如珠)可以具有不同的密度。在一些实施方案中,在随机引发和延伸反应期间固体支持物的密度是以下或是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000固体支持物/ul,或这些值中的任何两个之间的数字或范围的固体支持物/ul。在一些实施方案中,所有固体支持物用于随机引发和延伸反应。在一些实施方案中,仅一部分固体支持物用于随机引发和延伸反应(例如,二次取样)中。在一些这样的实施方案中,二次取样包括将不包含第一链条形码化多核苷酸的固体支持物(例如,“冷”珠)添加到二次取样的固体支持物。
[0310]
样品可以包含单细胞,方法包括将包含多于一种寡核苷酸条形码的合成颗粒与样品中的单细胞关联。方法可以包括在将合成颗粒与单细胞关联后裂解单细胞。裂解单细胞可以包括加热样品、使样品与去污剂接触、改变样品的ph或其任何组合。合成颗粒和单细胞可以在同一分区(例如,孔或液滴)中。多于一种寡核苷酸条形码中的至少一种可以被固定或部分地固定在合成颗粒上。多于一种寡核苷酸条形码中的至少一种可以被包封或部分地包封在合成颗粒中。合成颗粒可以是可破坏的(例如,可破坏的水凝胶颗粒)。合成颗粒可以包括珠。珠可以包括琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白a缀合珠、蛋白g缀合珠、蛋白a/g缀合珠、蛋白l缀合珠、寡(dt)缀合珠、二氧化硅珠、水凝胶珠、凝胶珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。合成颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(pdms)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明
胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合。多于一种寡核苷酸条形码中的每一种可以包含接头官能团,合成颗粒可以包含固体支持物官能团,和/或支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由c6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮及其任何组合组成的组。
[0311]
试剂盒
[0312]
本文的公开内容包括试剂盒。试剂盒可以包含:多于一种寡核苷酸条形码,其中多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列;能够与寡核苷酸条形码的一部分特异性结合的一种或更多种阻断物寡核苷酸;逆转录酶;包含靶结合区或其一部分的模板转换寡核苷酸;以及缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶。
[0313]
本文的公开内容包括试剂盒。试剂盒可以包含:多于一种寡核苷酸条形码,其中多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区,并且其中多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列;多于一种随机引物;与第一通用序列和/或细胞标记的全部或一部分互补的一种或更多种阻断物寡核苷酸;缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的dna聚合酶;以及逆转录酶。在一些实施方案中,随机引物包含随机核苷酸序列。在一些实施方案中,随机核苷酸序列的长度为约4个至约30个核苷酸。在一些实施方案中,随机核苷酸序列的长度为6个或9个核苷酸。
[0314]
在一些实施方案中,寡核苷酸条形码的一部分包括第一通用序列、细胞标记、分子标记、靶结合区、其部分或其任何组合。在一些实施方案中,一种或更多种阻断物寡核苷酸能够与以下的全部或一部分特异性结合:第一通用序列、细胞标记、分子标记、靶结合区或其任何组合。在一些实施方案中,细胞标记包含细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分。在一些实施方案中,一种或更多种阻断物寡核苷酸能够与以下的全部或一部分特异性结合:细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分。在一些实施方案中,一种或更多种阻断物寡核苷酸包含以下的互补序列:细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分、第一通用序列、分子标记、靶结合区、其部分或其任何组合。
[0315]
在一些实施方案中,一种或更多种阻断物寡核苷酸长度为1nt至100nt、长度为1nt至50nt、长度为1nt至21nt或长度为约12nt。在一些实施方案中,一种或更多种阻断物寡核苷酸具有至少45℃、至少50℃、至少60℃或至少70℃的tm。在一些实施方案中,一种或更多种阻断物寡核苷酸具有至多45℃、至多50℃、至多60℃或至多70℃的tm。在一些实施方案中,一种或更多种阻断物寡核苷酸不包含非天然核苷酸。在一些实施方案中,一种或更多种阻断物寡核苷酸不能作为用于逆转录酶或聚合酶的引物起作用。在一些实施方案中,一种或更多种阻断物寡核苷酸包含非天然核苷酸。在一些实施方案中,一种或更多种阻断物寡核苷酸包括锁核酸(lna)、肽核酸(pna)、dna、lna/pna嵌合体、lna/dna嵌合体、pna/dna嵌合体或其任何组合。
[0316]
在一些实施方案中,缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至
少一种的dna聚合酶包括嗜中温dna聚合酶、嗜热dna聚合酶、嗜冷dna聚合酶或其任何组合。在一些实施方案中,dna聚合酶包括klenow片段。在一些实施方案中,逆转录酶包括病毒逆转录酶。在一些实施方案中,病毒逆转录酶是鼠白血病病毒(mlv)逆转录酶。在一些实施方案中,病毒逆转录酶是moloney鼠白血病病毒(mmlv)逆转录酶。在一些实施方案中,模板转换寡核苷酸包含一个或更多个3’核糖核苷酸,例如三个3’核糖核苷酸。在一些实施方案中,3’核糖核苷酸包括鸟嘌呤。在一些实施方案中,试剂盒包含以下中的一种或更多种:乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(dmso)、甘油、甲酰胺、7-脱氮-gtp、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合。
[0317]
在一些实施方案中,试剂盒包含缓冲液。在一些实施方案中,试剂盒包含盒。在一些实施方案中,试剂盒包含一种或更多种用于逆转录反应的试剂。在一些实施方案中,试剂盒包含一种或更多种用于扩增反应的试剂。在一些实施方案中,靶结合区包括基因特异性序列、寡(dt)序列、随机多聚体或其任何组合。在一些实施方案中,寡核苷酸条形码包含相同的样品标记和/或相同的细胞标记。在一些实施方案中,多于一种寡核苷酸条形码的每一种样品标记和/或细胞标记包含至少6个核苷酸。在一些实施方案中,多于一种寡核苷酸条形码的每一种分子标记包含至少6个核苷酸。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被固定在合成颗粒上。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被部分地固定在合成颗粒上。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被包封在合成颗粒中。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被部分地包封在合成颗粒中。在一些实施方案中,合成颗粒是可破坏的。在一些实施方案中,合成颗粒包括珠,例如琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白a缀合珠、蛋白g缀合珠、蛋白a/g缀合珠、蛋白l缀合珠、寡(dt)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。在一些实施方案中,合成颗粒包含选自由以下组成的组的材料:聚二甲基硅氧烷(pdms)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合。在一些实施方案中,合成颗粒包括可破坏的水凝胶颗粒。在一些实施方案中,多于一种寡核苷酸条形码中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,和/或支持物官能团和接头官能团彼此关联。在一些实施方案中,接头官能团和支持物官能团单独地选自由c6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
[0318]
尽管本文已经公开了各种方面和实施方案,但其他方面和实施方案对本领域技术人员将是明显的。本文公开的各种方面和实施方案用于说明的目的而并不旨在限制,真正范围和精神由以下权利要求指出。
[0319]
本领域的技术人员将理解,对于本文公开的这个和其他过程和方法,在该过程和方法中执行的功能可以以不同的顺序实现。此外,所概述的步骤和操作仅作为示例提供,并且该步骤和操作中的一些可以是任选的,组合成较少的步骤和操作,或者扩展成另外的步骤和操作,而不偏离所公开的实施方案的本质。
[0320]
关于本文中使用基本上任何复数和/或单数术语,在对于上下文和/或应用适当的情况下,本领域技术人员可以从复数转换为单数和/或从单数转换为复数。为了清楚起见,可以在本文明确阐述各种单数/复数排列。
[0321]
本领域技术人员将理解,通常,本文使用的术语,并且特别是所附权利要求书(例如,所附权利要求书的主体)中的术语,通常旨在作为“开放性的”术语(例如,术语“包括/包含(including)”应解释为“包括但不限于(including but not limited to)”,术语“具有(having)”应解释为“具有至少(having at least)”,术语“包括/包含(includes)”应解释为“包括但不限于(includes but is not limited to)”等)。本领域技术人员将进一步理解,如果意图所介绍的权利要求陈述中的特定数字,则这样的意图将明确地陈述于权利要求中,并且在这种陈述不存在的情况下,不存在这种意图。例如,作为对理解的帮助,以下所附权利要求书可以包含介绍性措辞“至少一种”和“一种或更多种”的使用,以介绍权利要求陈述。然而,此类措辞的使用不应解读为意味着由不定冠词“一(a)”或“一(an)”介绍权利要求陈述会将任何包含此类介绍的权利要求陈述的具体权利要求限制到包含仅一种此类陈述的实施方案,甚至当同一权利要求包括介绍性措辞“一种或更多种”或“至少一种”以及不定冠词诸如“一(a)”或“一(an)”时也是如此(例如,“一(a)”和/或“一(an)”应解释为意指“至少一种”或“一种或更多种”);这对于使用定冠词来介绍权利要求陈述同样适用。此外,即使明确地陈述了介绍的权利要求陈述的特定数字,本领域技术人员将认识到,此类陈述应解释为意指至少所陈述的数字(例如,仅陈述“两种陈述”而没有其他修饰词意指至少两种陈述或两种或更多种陈述)。此外,在使用类似于“a、b和c等中的至少一种”的惯例的那些情况下,通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如,“具有a、b和c中的至少一种的系统”将包括但不限于具有单独的a,具有单独的b,具有单独的c,a和b一起,a和c一起,b和c一起,和/或a、b和c一起等的系统)。在使用类似于“a、b或c等中的至少一种”的惯例的那些情况下,通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如,“具有a、b或c中的至少一种的系统”将包括但不限于具有单独的a,具有单独的b,具有单独的c,a和b一起,a和c一起,b和c一起,和/或a、b和c一起等的系统)。本领域技术人员将进一步理解,实际上,无论在说明书、权利要求书还是在附图中,呈现两个或更多个替代术语的任何分离性词语和/或措辞应被理解为考虑到包括术语之一、任一术语或两个术语的可能性。例如,短语“a或b”应被理解为包括“a”或“b”或“a和b”的可能性。
[0322]
此外,当本公开内容的特征或方面以马库什组(markush group)描述时,本领域技术人员将意识到,本公开内容还由此以马库什组的任何个体成员或成员子组描述。
[0323]
如本领域技术人员将理解的,出于任何和所有目的,诸如在提供书面描述方面,本文公开的所有范围还涵盖该范围的任何和所有可能的子范围和子范围的组合。任何列举的范围可以被容易地认为充分地描述了并且使得同一范围能够被分成至少相等的二分之一、三分之一、四分之一、五分之一、十分之一等。作为非限制性实例,本文讨论的每个范围可以被容易地分成下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的,所有语言诸如“多达(up to)”、“至少”等包括所述及的数字并且指随后可以被分成如以上讨论的子范围的范围。最后,如本领域技术人员将理解的,范围包括每个单独的成员。因此,例如,具有1-3个细胞的组是指具有1个、2个或3个细胞的组。类似地,具有1-5个细胞的组是指具有1个、2个、3个、4个或5个细胞的组,等等。
[0324]
从前述内容,应当理解,本文出于说明的目的已经描述了本公开内容的各种实施方案,并且可以在不脱离本公开内容的范围和精神的情况下进行各种修改。因此,本文公开的各种实施方案并不旨在进行限制,真正的范围和精神由以下权利要求来指示。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献