一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

密集聚集的分析物层和检测方法与流程

2021-11-20 05:15:00 来源:中国专利 TAG:

密集聚集的分析物层和检测方法
交叉引用
1.本技术要求于2018年9月19日提交的美国临时专利申请号62/733,525的优先权,该申请通过引用全文并入本文。


背景技术:

2.平价快速测序正在全球范围内引发一场医学和医疗保健的革命。自2000年人类第一个基因组测序以来,一个基因组的价格急剧下降,最近实现了一个重要的里程碑,即$1000的基因组。然而,对于能够实现大规模人群测序、疾病筛查和早期检测等应用的更低成本测序有着巨大的需求。
3.衡量测序成本的一个标准是30x人类基因组(定义为90千兆碱基)的价格。测序系统的主要成本构成主要是耗材,包括生物芯片和试剂,其次是仪器成本。


技术实现要素:

4.本文涉及对于改进的成像方法和改进的基底以及生产具有分析物致密层的基底的方法的需要。例如,为了达到$10的30x基因组测序,成本降低100倍,可能需要将每个芯片单位面积的数据量增加100倍和/或将每个数据点的试剂量减少100倍。因此,可能需要提供具有可由超分辨率成像系统成像的高密度脱氧核糖核酸(dna)聚集的芯片。
5.在簇密度为每平方厘米一千万个分子的示例性1000基因组平台中,每个分子平均占用10um2芯片面积。因此,平均有效间距为3,160nm。如果密度增加100倍,对于相同的芯片面积和试剂,可以获得多100倍的信息,导致成本降低100倍。在100倍更高密度下,新的间距可能需要是320nm。
6.因此,为了降低测序成本,必须实现分布在低成本生物芯片表面的靶dna分子的高密度聚集。然而这些密集聚集的分子在测序中产生的荧光学信号,需要通过超分辨率光学成像系统来分辨,该系统能够分辨光的衍射极限以下的光学信号。
7.此外,尽管存在不受光学信号衍射极限限制的其他方法,例如由诸如ion torrent和oxford nanopore等公司开发的基于电的系统,但通过高通量成像和低成本耗材的组合,基于光学的系统可以实现所有现有技术的最低测序成本。
8.平价快速测序正在全球范围内引发一场医学和医疗保健的革命。自2000年人类第一个基因组测序以来,一个基因组的价格急剧下降,最近实现了一个重要的里程碑,即$1000的基因组。然而,本文涉及对于能够实现大规模人群测序、疾病筛查和早期检测等应用的更低成本测序的巨大需求。本公开提供了在大幅压缩的时间范围内实现$10基因组的方法和系统。在这个价格点上,对每个新生儿进行测序可能是经济的,并可能为深度测序和单细胞分析消除成本障碍。
9.衡量测序成本的一个标准是30x人类基因组(定义为90千兆碱基)的价格。测序系统的主要成本构成可能主要与耗材(可能包括生物芯片和试剂)有关,其次是仪器成本。因此,为了达到$10的30x基因组测序,成本降低100倍,可能希望将每个芯片单位面积的数据
量增加100倍和/或将每个数据点的试剂量减少100倍。因此,可能希望提供具有可由超分辨率成像系统成像的高密度dna聚集的芯片。
10.在簇密度为每平方厘米一千万个分子的示例性1000基因组平台中,每个分子平均占用10微米(um2)芯片面积。因此,平均有效间距为3,160纳米(nm)。如果密度增加100倍,对于相同的芯片面积和试剂,可以获得多100倍的信息,导致成本降低100倍。在100倍更高密度下,新的间距可能需要是320nm。
11.因此,为了降低测序成本,可能必须实现分布在低成本生物芯片表面的靶dna分子的高密度聚集。然而这些密集聚集的分子在测序中产生的荧光学信号,需要通过超分辨率光学成像系统来分辨,该系统能够分辨光的衍射极限以下的光学信号。
12.此外,尽管存在不受光学信号衍射极限限制的其他方法,例如由诸如ion torrent和oxford nanopore等公司开发的基于电的系统,但通过高通量成像和低成本耗材的组合,基于光学的系统可以实现所有现有技术的最低测序成本。
13.本公开内容提供用于分析物检测,例如核酸测序(例如,以在大幅压缩的时间范围内实现s10基因组)的方法和系统。本公开内容的方法和系统可用于鉴定核酸分子,例如dna或核糖核酸(rna)分子、多肽和/或蛋白质。在可以使用本公开内容的方法和系统实现的价格点上,对每个新生儿进行测序可能是经济的,并可能为深度测序和单细胞分析消除成本障碍。
14.本公开内容的一个方面包括用于对以高密度布置在基底表面上的多个分析物进行测序的方法,该方法包括:提供包含表面的基底,其中表面包含多个分析物,所述多个分析物以使得所述多个分析物的分析物的结合位置之间的最小有效间距小于λ/(2*na)的密度布置在表面上,其中“na”是所述光学成像模块的数值孔径,并且其中所述表面包含用于通过合成进行测序的试剂;执行探针结合至所述多个分析物的多个循环,所述多个循环中的循环包括:使所述多个分析物与多个探针接触,所述多个探针中的探针包含可检测标记;(ii)用光学系统对所述表面的区域进行成像,以检测来自与所述多个分析物接触的每个探针的光学信号,从而在所述循环中检测所述区域中的多个光学信号;从来自所述多个循环中的至少两个循环的所述区域的图像中确定所述多个光学信号中的每个的峰位置;将每个光学信号的所述峰位置叠加,并在每个光学信号簇处应用光学分布模型,以确定每个检测到的探针在所述表面上的相对位置;使用所述确定的相对位置和分辨函数来分辨来自每个循环的每个区域图像中的所述光学信号;从所述反卷积光学信号鉴定每个区域和每个循环的所述可检测标记;以及在每个分析物位置处,从所述多个循环中的所述鉴定的可检测标记鉴定布置在所述基底表面上的分析物。在一些实施方案中,串联体加载在表面上并紧密聚集,以使得中心到中心距离为—250纳米(nm),方差为 /

25nm。在一些实施方案中,分子之间的平均中心到中心距离为约315nm。在一些实施方案中,多个分析物(例如,核酸分子)可相邻表面沉积,使得多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、
390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。多个分析物可以是核酸分子(dna和/或rna)、蛋白质和/或多肽。多个分析物可相邻表面布置,使得多个分析物中的单个分析物可被分辨(例如,光学分辨)。多个分析物可相邻所述表面布置,使得多个分析物中的相邻分析物彼此不相接或碰触。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。在一些实施方案中,所述多个分析物中的一个或多个分析物用拒斥物质或吸引物质处理。在一些实施方案中,所述拒斥物质或吸引物质包含两性离子特征。在一些实施方案中,所述拒斥物质或吸引物质包括peg、多糖、安福灵(ampholine)两性电解质、磺基甜菜碱和/或bsa。在一些实施方案中,所述分析物是dna串联体。在一些实施方案中,所述dna串联体与ssdna丝杂交。在一些实施方案中,所述分析物是蛋白质或肽。在一些实施方案中,所述探针包含多个可逆终止子核苷酸。在一些实施方案中,所述多个可逆终止子核苷酸包括至少四个不同的核苷酸,每个核苷酸具有不同的可检测标记。在一些实施方案中,所述分辨包括使用来自所述确定的相对位置的所述相邻多核苷酸之间的中心到中心距离从相邻多核苷酸去除干扰光学信号。在一些实施方案中,所述分辨函数包括机器学习。在一些实施方案中,所述分辨函数包括最近邻变量回归。在一些实施方案中,所述多核苷酸密集地聚集在所述基底上,使得由来自掺入相邻多核苷酸的核苷酸的所述可检测标记发射的光学信号之间存在叠加,并且其中所述相邻多核苷酸各自包含不同的序列。在一些实施方案中,多核苷酸以每平方微米多于4个分子的平均密度沉积在所述表面上。在一些实施方案中,沿着图像区域的轴以每300纳米一个像素或更高的分辨率执行所述表面的所述成像。在一些实施方案中,光学成像模块被配置为以每250纳米一个像素或更高的分辨率获得所述多个光学信号。在一些实施方案中,光学成像模块被配置为以每200纳米一个像素或更高的分辨率获得所述多个光学信号。在一些实施方案中,光学成像模块被配置为以每150纳米一个像素或更高的分辨率获得所述多个光学信号。在一些实施方案中,光学成像模块被配置为以每100纳米一个像素或更高的分辨率获得所述多个光学信号。在一些实施方案中,所述方法还包括从每个循环的所述区域图像中的每一个产生具有较高像素密度的过采样图像。在一些实施方案中,所述叠加所述峰位置包括对准在多个所述循环的每个区域中检测到的所述光学信号峰的位置,以产生来自所述多个循环的每个多核苷酸的光峰位置的簇。在一些实施方案中,所述叠加所述峰位置包括对准在所述循环的子集的每个区域中检测到的所述光学信号峰的位置,以产生来自所述循环的子集的每个多核苷酸的光峰位置的簇。在一些实施方案中,所述光学分布模型包括点扩展函数。在一些实施方案中,沉积到基底表面的所述分析物的所述相对位置在l0纳米rms内确定。
15.本公开的另一个方面包括一种用于精确确定沉积在密集聚集基底表面上的分析物的相对位置的方法,该方法包括:提供包括表面的基底,其中表面包括沉积在表面上离散位置处的多个分析物;在所述表面上执行探针结合和信号检测的多个循环,每个循环包括:使所述分析物与来自探针组的多个探针接触,其中所述探针包含可检测标记,其中每个所述探针特异性地结合靶分析物;以及用光学系统对所述表面的区域进行成像,以检测来自与所述表面上离散位置处的所述分析物结合的单个探针的多个光学信号;从来自所述多个循环中的至少两个循环的所述区域的图像的所述多个光学信号中的每个确定峰位置;以及
将每个光学信号的所述峰位置叠加,并在每个光学信号簇处应用光学分布模型,以提高的精度确定每个检测到的分析物在所述表面上的相对位置。在一些实施方案中,串联体加载在表面上并紧密聚集,以使得中心到中心距离为—250nm,方差为 /

25nm。在一些实施方案中,分子之间的平均中心到中心距离为约315nm。在一些实施方案中,多个分析物(例如,核酸分子)可相邻表面沉积,使得多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。在一些实施方案中,该方法还包括:使用所述确定的相对位置和分辨函数来分辨来自每个循环的每个区域图像中的所述光学信号;以及从所述反卷积的光学信号中针对每个区域和每个循环鉴定与所述沉积的分析物结合的所述可检测标记。在一些实施方案中,所述多个分析物中的一个或多个分析物用拒斥物质或吸引物质处理。在一些实施方案中,所述拒斥物质或吸引物质包含两性离子特征。在一些实施方案中,所述拒斥物质或吸引物质包括peg、多糖、安福灵两性电解质、磺基甜菜碱和/或bsa。在一些实施方案中,所述分析物是dna串联体。在一些实施方案中,所述dna串联体与ssdna丝杂交。在一些实施方案中,所述分析物是蛋白质或肽。在一些实施方案中,所述方法还包括对在每个循环中检测到的每个分析物使用所述可检测标记鉴定,以鉴定所述基底上的多个所述分析物。在一些实施方案中,所述分辨包括使用来自所述相邻分析物的所述确定的相对位置的所述相邻分析物之间的中心到中心距离从相邻分析物去除干扰光学信号。在一些实施方案中,所述分辨函数包括机器学习。在一些实施方案中,所述分辨函数包括最近邻变量回归。在一些实施方案中,所述分析物是单个生物分子。在一些实施方案中,沉积在所述表面上的所述分析物的间隔平均小于可检测标记所发射的并由光学系统成像的光的衍射极限。在一些实施方案中,沉积的分析物包括每个分析物和最近的相邻分析物之间小于500nm的平均中心到中心距离。在一些实施方案中,所述叠加所述峰位置包括对准在多个所述循环的每个区域中检测到的所述光学信号峰的位置,以产生来自所述多个循环的每个分析物的光峰位置的簇。在一些实施方案中,所述相对位置以l0nm rms内的精度确定。在一些实施方案中,所述方法分辨来自以每平方微米约4个至约25个分析物的密度的表面的光学信号。
16.本公开的另一个方面包括用于确定多个分析物的标识的系统,包括光学成像设备,所述光学成像设备被配置为在探针与沉积在基底表面上的分析物结合的多个循环中对来自基底的区域的多个光学信号成像;以及图像处理模块,所述模块被配置为:从来自所述多个循环中的至少两个循环的所述区域的图像的所述多个光学信号中的每个确定峰位置;通过将光学分布模型应用于来自所述多个循环的每个光学信号簇,以提高的精度确定每个检测到的分析物在所述表面上的相对位置;以及使用所述确定的相对位置和分辨函数来反
卷积来自每个循环的每个区域图像中的所述光学信号。在一些实施方案中,串联体加载在表面上并紧密聚集,以使得中心到中心距离为—250nm,方差为 /

25nm。在一些实施方案中,分子之间的平均中心到中心距离为约315nm。在一些实施方案中,多个分析物(例如,核酸分子)可相邻表面沉积,使得多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。在一些实施方案中,所述表面是图案化的。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。在一些实施方案中,所述图像处理模块还被配置为使用所述反卷积的光学信号来确定沉积在所述表面上的所述分析物的标识。在一些实施方案中,所述光学成像装置包括限定可扫描区域的可移动台。在一些实施方案中,所述光学成像装置包括传感器和光学放大器,所述传感器和光学放大器被配置为在所述可扫描区域中以低于衍射极限对基底的表面进行采样。在一些实施方案中,所述系统还包括基底,所述基底包括以低于衍射极限的中心到中心间距沉积到基底表面的分析物。在一些实施方案中,所述分辨包括使用所述相邻分析物之间的中心到中心距离从相邻分析物去除干扰光学信号,以确定所述相邻分析物的所述相对位置。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。
17.本公开的另一方面包括用于处理或分析多个分析物的方法,所述方法包括:将所述多个分析物以最小有效间距小于λ/(2*na)的测量值的密度相邻基底的表面布置;在探针与相邻所述基底布置的所述多个分析物的分析物结合的一个或多个循环中从所述基底获得多个光学信号,其中所述多个光学信号的至少一个子集叠加,所述多个光学信号包括具有波长(λ)的光;应用成像算法来处理所述多个光学信号,以鉴定所述多个分析物的分析物的位置或所述分析物相对于所述多个分析物中的另一个分析物的相对位置;以及使用所述位置或相对位置来鉴定所述多个分析物中的所述分析物。在一些实施方案中,串联体加载在表面上并紧密聚集,以使得中心到中心距离为—250nm,方差为 /

25nm。在一些实施方案中,分子之间的平均中心到中心距离为约315nm。在一些实施方案中,多个分析物(例如,核酸分子)可相邻表面沉积,使得多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、
160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。在一些实施方案中,所述多个分析物中的一个或多个分析物用拒斥物质或吸引物质处理。在一些实施方案中,所述拒斥物质或吸引物质包含两性离子特征。在一些实施方案中,所述拒斥物质或吸引物质包括peg、多糖、安福灵两性电解质、磺基甜菜碱和/或bsa。在一些实施方案中,所述分析物是dna串联体。在一些实施方案中,所述dna串联体与ssdna丝杂交。在一些实施方案中,所述分析物是蛋白质或肽。在一些实施方案中,步骤(b)进一步包括配置光学处理模块以覆盖来自结合到分析物的所述一个或多个探针循环的所述多个光学信号,并且步骤(c)进一步包括应用光学分布模型所述多个光学信号的所述覆盖以确定每个检测到的分析物的相对位置。在一些实施方案中,所述成像算法包括分辨函数。在一些实施方案中,所述分辨函数包括机器学习。在一些实施方案中,所述分辨函数包括最近邻变量回归。在一些实施方案中,所述分辨函数包括使用所述相邻分析物之间的中心到中心距离从相邻分析物去除干扰光学信号。在一些实施方案中,所述多个分析物以每平方微米约1个至25个分子的密度相邻所述基底布置。在一些实施方案中,光学成像模块被配置为以每300纳米一个像素或更高的分辨率获得所述多个光学信号。在一些实施方案中,光学成像模块被配置为以每250纳米一个像素或更高的分辨率获得所述多个光学信号。在一些实施方案中,光学成像模块被配置为以每200纳米一个像素或更高的分辨率获得所述多个光学信号。在一些实施方案中,光学成像模块被配置为以每150纳米一个像素或更高的分辨率获得所述多个光学信号。在一些实施方案中,光学成像模块被配置为以每100纳米一个像素或更高的分辨率获得所述多个光学信号。
18.本公开的另一方面包括控制沉积在表面上的多个分析物的分析物之间的平均最小中心到中心距离的分布的方法,所述方法包括用拒斥物质或吸引物质处理所述一个或多个分析物。在一些实施方案中,串联体加载在表面上并紧密聚集,以使得中心到中心距离为—250nm,方差为 /

25nm。在一些实施方案中,分子之间的平均中心到中心距离为约315nm。在一些实施方案中,多个分析物(例如,核酸分子)可相邻表面沉积,使得多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。在一些实施方案中,所述拒斥物质或吸引物质包含两性离子特征。在一些实施方案中,所述拒斥物质或吸引物质包括peg、多糖、安福灵两性电解质、磺基甜菜碱和/或bsa。在一些实施方案中,所述分析物是dna串联体。在一些实施方案中,所述dna串联体与ssdna丝杂交。在一些实施方案中,所述分析物是蛋白质或肽。在一些实施方案中,多个分析物中的一个或多个分析物之间的所述平均最小中心到中心距离小于约500nm。在一些实施方案中,
多个分析物中的一个或多个分析物之间的所述平均最小中心到中心距离是约315nm。在一些实施方案中,所述多个分析物(例如,核酸分子)可相邻表面沉积,使得所述多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。在一些实施方案中,多个分析物中的一个或多个分析物之间的所述平均最小中心到中心距离是约250nm。在一些实施方案中,所述用拒斥物质或吸引物质处理所述一个或多个分析物包括在将所述多个分析物沉积到所述表面之前将所述拒斥物质或吸引物质施用到所述表面。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。
19.本公开的另一方面包括控制沉积在表面上的多个分析物的一个或多个分析物之间的平均最小中心到中心距离的分布的方法,所述方法包括:用拒斥物质或吸引物质处理所述一个或多个分析物;将所述多个分析物暴露于气

液界面,使得所述多个分析物形成沉积在所述表面上的分析物单层。在一些实施方案中,串联体加载在表面上并紧密聚集,以使得中心到中心距离为—250nm,方差为 /

25nm。在一些实施方案中,分子之间的平均中心到中心距离为约315nm。在一些实施方案中,所述多个分析物(例如,核酸分子)可相邻表面沉积,使得所述多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。在一些实施方案中,所述气

液界面是空气

水界面。在一些实施方案中,(c)中的沉积包括拉或拖。在一些实施方案中,多个分析物中的一个或多个分析物之间的所述平均最小中心到中心距离小于约500nm。在一些实施方案中,多个分析物中的一个或多个分析物之间的所述平均最小中心到中心距离是约315nm。在一些实施方案中,多个分析物中的一个或多个分析物之间的所述平均最小中心到中心距离是约250nm。
20.本公开的另一方面包括系统,该系统包括与表面相邻的多个核酸分子,该多个核酸分子彼此不接触。在一些实施方案中,串联体加载在表面上并紧密聚集,以使得中心到中心距离为—250nm,方差为 /

25nm。在一些实施方案中,分子之间的平均中心到中心距离为
约315nm。在一些实施方案中,所述多个分析物(例如,核酸分子)可相邻表面沉积,使得所述多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。在一些实施方案中,所述多个核酸分子是多个串联体。在一些实施方案中,所述多个核酸分子的相邻核酸分子具有小于约500nm的平均中心到中心间距。
21.本公开的另一方面包括方法,该方法包括在使得多个核酸分子彼此不接触的条件下提供与表面相邻的所述多个核酸分子。在一些实施方案中,串联体加载在表面上并紧密聚集,以使得中心到中心距离为—250nm,方差为 /

25nm。在一些实施方案中,分子之间的平均中心到中心距离为约315nm。在一些实施方案中,所述多个分析物(例如,核酸分子)可相邻表面沉积,使得所述多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。在一些实施方案中,所述表面是非图案化的。在一些实施方案中,所述表面是图案化的。在一些实施方案中,所述多个核酸分子是多个串联体。在一些实施方案中,所述多个核酸分子的相邻核酸分子具有小于约500nm的平均中心到中心间距。
22.本公开的另一个方面提供了一种非暂时性计算机可读介质,其包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行后实现上文或本文其他地方的任何方法。
23.本公开的另一方面提供了一种系统,其包括一个或多个计算机处理器和耦合到其上的计算机存储器。所述计算机存储器包括机器可执行代码,所述机器可执行代码在由所述一个或多个计算机处理器执行后实现上文或本文其他地方的任何方法。
24.通过以下在其中仅示出和描述了本公开内容的说明性实施方案的详细描述,本公开内容的其他方面和优点将会对本领域技术人员而言变得显而易见。如将认识到的,本公开内容能够具有其他的和不同的实施方案,并且其若干细节能够在各个明显的方面进行修改,所有这些均不脱离本公开内容。因此,附图和说明书在本质上将被视为是说明性而非限制性的。
援引并入
25.本说明书中提到的所有出版物、专利和专利申请均通过引用并入本文,其程度如同明确且单独地指出每个单独的出版物、专利或专利申请通过引用并入。在通过引用合并的出版物和专利或专利申请与本说明书中包含的公开内容相矛盾的情况下,本说明书旨在取代和/或优先于任何此类矛盾的材料。
附图说明
26.在所附权利要求中具体阐述了本公开内容的新颖特征。通过参考以下对说明性实施方式进行阐述的详细描述以及附图(本文中也称为“图”),将会更好地理解本公开内容的特征和优点,其中:
27.图1示出了测序器通量与阵列间距的关系,并概述了满足s10基因组所需标准的系统设计。
28.图2a示出了用于低成本测序的在240nm间距上80nm直径结合区域(斑点)的高密度区域的拟实施方案。
29.图2b是所提议的基底密度与用于1,000基因组的样品有效密度的比较。
30.图3示出了在600nm间距上用2x滤波器处理的单个分析物的模拟检测的串扰计算。
31.图4示出了在400nm、300nm和250nm的中心到中心距离下检测基底上单个分析物的图像的过采样2x(左)相比于过采样4x和反卷积(右)模拟。还示出了过采样的4x和中心到中心距离为200nm的反卷积的单个图像。
32.图5示出了使用过采样2x相比于过采样4x和反卷积模拟处理的单个分析物(阵列间距(nm))之间不同中心到中心距离下相邻斑点之间的串扰图。
33.图6描绘了根据本公开内容的实施方案的用于以高精度确定基底上分析物的相对位置的方法的流程图。
34.图7描绘了根据本公开的实施方案的用于从基底检测到的反卷积光学信号中鉴定单个分析物的方法的流程图。
35.图8描绘了根据本公开内容的实施方案的对沉积在基底上的多核苷酸进行测序的方法的流程图。
36.图9示出了根据本公开的实施方案的来自循环检测的光学信号检测过程中的操作的概述。
37.图10a示出了根据本公开内容的实施方案的用于初始原图像分析的操作的流程图。
38.图10b示出了根据本公开内容的实施方案的用于从来自多个循环的光学信号峰信息确定位置的操作的流程图。
39.图10c示出了根据本公开内容的实施方案的用于使用精确的相对位置信息和图像反卷积算法从图像中鉴定叠加光学信号的操作的流程图。
40.图11描绘了根据本公开内容的实施方案的用于来自密集聚集的基底的循环检测的图像的光学信号检测和反卷积过程的操作的详细流程图。
41.图12a示出了从原始图像检测到的光学信号中四个荧光团之间荧光团强度的串扰图。
42.图12b示出了来自4x过采样图像的四个荧光团之间的荧光团强度的串扰图。
43.图13a示出了来自未进行反卷积或最近邻校正的4x过采样图像的四个荧光团之间的荧光团强度的串扰图。
44.图13b示出了根据本公开内容的实施方案的使用具有精确分析物位置信息的反卷积算法的来自4x过采样和反卷积图像的四个荧光团之间的荧光团强度的串扰图。
45.图14a示出了分析物之间中心到中心间距约为315nm的区域的原始图像的模拟四色复合。
46.图14b示出了分析物之间中心到中心间距约315nm的反卷积图像的模拟四色复合。
47.图15a示出了对应于包含等量突变型和野生型(wt)靶点的egfr基因中密码子790附近区域的合成寡核苷酸模板的1:1混合物的测序结果。
48.图15b描绘了交替碱基掺入和裂解循环的图像。
49.图16是沉积在基底上并由包含荧光团探针结合的单分析物的图像。
50.图17(右分图)示出了每个循环的区域的过采样图像的峰,这些图像叠加自基底上的几个分析物(峰簇)。左分图是右分图的平滑版本,用指示相对位置信息的高度精确的峰重现多个循环中来自分析物的峰的高斯分布。
51.图18示出了在一个区域中发现的多个分子中的每个分子的定位变化。定位方差中值为5nm,3西格玛定位方差小于10nm。
52.图19示出了根据本公开内容的实施方案的脱氧核糖核酸(dna)文库构建、环化和串联体形成的流程图。
53.图20示出了根据本公开内容的实施方案的dna文库构建、环化和串联体形成的流程图,包括串联体上ssdna“丝”的合成,以便于排除形成串联体层。
54.图21a和图21b描绘了根据本公开内容的实施方案的包被的串联体,以便于在串联体层中与其他串联体相排斥。
55.图22示出了根据本公开内容的实施方案的紧密聚集的随机分布的串联体层的实施方案。
56.图23a示出了根据本公开内容的实施方案的形成包含来自样品的靶序列的环状dna文库的流程图。
57.图23b示出了根据本公开内容的实施方案的将串联体加载到基底上的层上并对串联体进行测序的流程图。
58.图24描绘了根据本公开内容的实施方案的使用独特分子标识符以在每个串联体中包括源信息(或其他信息)的实施方案。
59.图25a

图25c示出了根据本公开内容的一些实施方案的以高密度分布在基底表面上的串联体层的图像。图25d描绘了根据本公开的一些实施方案的串联体表面密度的图。
60.图26a

图26d描绘了与用于测序串联体靶的基底结合的串联体的图像,示出了相邻的邻近串联体之间序列的成功分辨。
61.图27a

图27c示出了使用本文所述方法和系统通过大肠杆菌的合成测序法的结果。图27a

图27b示出了各种碱基对读段。图27c示出了大肠杆菌测序的单个斑点的碱基调用的分辨。
62.图28示出了通过编程或以其他方式配置以实现本文提供的方法的计算机系统。
具体实施方式
63.尽管本文中已经示出并描述了本发明的各种实施方案,但对于本领域技术人员容易理解的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本发明的情况下可想到多种变化、改变和替代。应当理解,可采用本文所述的本发明实施方案的各种替代方案。
64.每当术语“至少”、“大于”或“大于或等于”在两个或更多个数值的系列中的第一个数值之前时,术语“至少”、“大于”或“大于或等于”适用于该系列数值中的每个数值。例如,大于或等于1、2或3等同于大于或等于1、大于或等于2或大于或等于3。
65.当术语“不大于”、“小于”或“小于或等于”在两个或更多个数值的系列中的第一个数值之前时,术语“不大于”、“小于”或“小于或等于”适用于该系列数值中的每个数值。例如,小于或等于3、2或1等同于小于或等于3、小于或等于2或小于或等于1。
66.如本文所用,术语“中心到中心距离”一般指的是通过每个分子在基底上的平均位置之间的差值测量的两个相邻分子之间的距离。术语“平均最小中心到中心距离”具体指设置在基底上的每个分析物的中心与其最近相邻的分析物的中心之间的平均距离,尽管术语“中心到中心距离”也指在限制的上下文中与基底上的分析物密度相对应的最小中心到中心距离。如本文所用,术语“间距”或“平均有效间距”通常用于指平均最小中心到中心距离。在分析物的规则阵列的上下文中,间距也可用于确定相邻分子之间沿限定轴的中心到中心的距离。
67.如本文所使用的,术语“叠加”(例如,叠加图像)一般指的是叠加来自不同循环的图像,以在多个循环中产生来自每个分析物的检测到的光学信号的分布(例如,位置和强度,或峰的位置)。可通过叠加图像、叠加人工处理图像或叠加包括位置信息的数据集来生成检测到的光学信号的这种分布。因此,如本文所使用的,术语“叠加图像”通常包括这些机制中的任何一个,以针对多个循环中的每个循环产生来自与单个分析物结合的单个探针的光学信号的位置信息分布。
[0068]“循环”通常通过完成一个或多个遍次并从基底上剥离可检测标记来定义。可以执行每个循环的一个或多个遍次的后续循环。对于本文所述的方法和系统,在单个基底或样品上执行多个循环。对于脱氧核糖核酸(dna)测序,多个循环可能需要使用可逆终止子和可从掺入的核苷酸中去除的可检测标记。对于蛋白质,多个循环可能要求探针去除(剥离)条件或者保持蛋白质折叠在其适当构型,或者选择所使用的探针与肽序列结合,使得结合效率与蛋白质折叠构型无关。
[0069]
检测分析中的“遍次(pass)”一般是指将包含可检测标记的多个探针引入结合的分析物,在探针和不同的靶分析物之间发生选择性结合,并且从可检测标记检测多个信号的过程。遍次包括引入一组与靶分析物特异性结合的抗体。遍次还可包括引入一组经标记的核苷酸,用于在合成测序过程中掺入生长链。在基底被剥离所有可检测标记之前,或者在测序期间可检测标记或可逆终止子从掺入的核苷酸中去除之前,可以有不同组探针的多次遍次。通常,如果在一个遍次过程中使用四种核苷酸,则循环可能仅包括通过合成进行标准四核苷酸测序的一个遍次。
[0070]
如本文所用,“图像”一般指的是在循环或循环内的遍次期间拍摄的区域的图像。在一些实施方案中,单个图像被限制为可检测标记的单个颜色的检测。
[0071]
如本文所用,术语“区域”一般指被成像的基底的单个区域。在典型的测定中,每个循环对单个区域成像至少一次。例如,对于具有4种颜色的20个循环的测定,可以有20*4=80个图像,所有图像都在同一区域中。
[0072]“靶分析物”或“分析物”一般指要被鉴定、定量和以其他方式表征的分子、化合物、复合物、物质或组分。靶分析物可以包括例如但不限于单个分子(任何分子大小)、单个生物分子、多肽、蛋白质(折叠或未折叠)、多核苷酸分子(核糖核酸(rna)、互补dna(cdna)或dna)、其片段、其经修饰的分子(例如经修饰的核酸)或其组合。在一个实施方案中,靶多核苷酸包括杂交引物以促进通过合成进行测序。通过探针识别靶分析物,所述探针可用于使用本文所述的光学检测方法对靶分析物进行测序、鉴定和定量。
[0073]
本文所用的“探针”一般是指能够与其他分子(例如,通过合成测序期间的互补标记核苷酸、多核苷酸、多肽或全长蛋白质等)、细胞组分或结构(脂质、细胞壁等)或细胞结合以检测或评估分子、细胞组分或结构或细胞的性质的分子。探针包括与靶分析物结合的结构或组分。在一些实施方案中,多个探针可识别相同靶分析物的不同部分。探针的实例包括但不限于经标记的可逆终止子核苷酸、适体、抗体、多肽、寡核苷酸(dna、rna)或其任意组合。下文还详细描述了作为探针的抗体、适体、寡核苷酸序列及其组合。
[0074]
所述探针可以包含可检测标记,所述可检测标记用于检测所述探针与靶分析物的结合。探针可以直接或间接地与靶分析物结合、杂交、缀合或共价连接。
[0075]
如本文所用,术语“可检测标记”一般指结合到探针上的分子,当探针结合到靶分析物上并使用光学成像系统成像时,该分子可产生可检测的光学信号。可检测标记可直接或间接地与探针结合、杂交、缀合或共价连接。在一些实施方案中,可检测标记是荧光分子或化学发光分子。探针可以通过可检测标记进行光学检测。
[0076]
如本文所使用的,术语“光学分布模型”一般指的是来自点源的光检测的概率的统计分布。例如,这些包括高斯分布。可以修改高斯分布以包括检测中的预期像差,以生成点扩展函数作为光学分布模型。
[0077]
本文提供的系统和方法有助于光学检测和鉴别结合到与基底表面结合的紧密聚集的分析物上的探针。部分地,本文所述的方法和系统依赖于对基底表面上的多个靶分析物的重复检测,以提高对基底上的每个分析物的相对位置的鉴定的准确性。然后,该信息可用于对每个循环的基底的区域的每个图像执行信号分辨,以可靠地鉴定来自与靶分析物结合的探针的信号。在一些实施方案中,分辨包括反卷积。在一些实施方案中,这种类型的反卷积处理可用于区分当被激活光激活时具有叠加发射光谱的结合到靶分析物的不同探针。在一些实施方案中,反卷积处理可用于从相邻分析物分离光学信号。这对于具有由于光学系统的衍射极限而使光学检测具有挑战性的密度的分析物的基底特别有用。
[0078]
在一些实施方案中,本文描述的方法和系统在测序中特别有用。通过提供有助于在密集聚集的基底上进行可靠的光学检测的方法和系统,与测序相关的成本,如试剂、所用克隆分子的数量、处理和读取时间都可以减少,从而大大推进了测序技术,特别是通过使用光学检测的核苷酸进行合成的测序。
[0079]
尽管本文所述的系统和方法对于推进测序技术具有重要意义,但本文所述的方法和系统一般适用于结合到基底表面的分析物的光学检测,包括在单分子水平上。测序成本降低
[0080]
测序技术包括illumina和complete genomics等公司开发的基于图像的系统,以及ion torrent和oxford nanopore等公司开发的基于电气的系统。基于图像的测序系统目前具有所有现有测序技术中最低的测序成本。基于图像的系统通过高通量成像光学器件和低成本耗材的结合实现低成本。然而,现有技术的光学检测系统在相邻的可分辨分子之间具有大约微米的最小中心到中心的间距,这部分是由于光学系统的衍射极限。在一些实施方案中,本文所描述的是方法,所述方法用于获得基于图像的测序系统(其使用现有的生物化学方法,使用循环检测)的显著低成本,确定分析物的精确位置以及使用位置信息对成像信号进行高度精确的反卷积以适应增加的低于衍射极限的聚集密度。密集聚集的分析物层和检测方法
[0081]
本文提供了便于对来自沉积在表面上的具有低于衍射极限的中心到中心间距的分析物的信号成像的系统和方法。这些系统和方法使用先进的成像系统来生成超分辨率图像,循环检测以便于高精度地在基底上确定分子的位置,以及分辨图像以高精度地获得密集聚集的表面上每个分子的信号标识。这些方法和系统允许在密集聚集的基底上通过合成进行测序,以提供高效率和非常高通量的高精度多核苷酸序列测定。
[0082]
测序系统的主要成本构成主要是耗材,包括生物芯片和试剂,其次是仪器成本。要达到一个s10 30x基因组,成本降低100倍,单位面积的数据量需要增加100倍,每个数据点的试剂量需要下降100倍。
[0083]
图1示出了测序器通量与阵列间距的关系,并概述了满足s10基因组所需标准的系统设计。其基本思路是,要实现成本降低100倍,单位面积的数据量需要增加100倍,每个数据点的试剂量需要下降100倍。为了实现成本的这种降低,本文提供了有助于以低于衍射极限的密度沉积在基底表面上的多核苷酸的可靠测序的方法和系统。这些高密度允许更有效地使用试剂,并增加单位面积的数据量。此外,检测可靠性的增加允许减少可能被合成的克隆拷贝数量,以鉴定和纠正测序和检测中的错误,进一步降低试剂成本和数据处理成本。分析物在基底表面上的高密度分布
[0084]
图2a示出了在240nm间距上80nm直径结合区域(斑点)的高密度区域的拟议实施方案。在本实施方案中,可以使用有序阵列,其中单链dna分子排他地结合到芯片上的指定区域。在一些实施方案中,使用小于40kb的串联体(即,包含串联连接的相同dna序列的多个拷贝的长的连续dna分子),以便不会过度填充该斑点。串联体的大小大致与面积成比例,这意味着较小的串联体的伸出长度可能约为4kb至5kb,如果使用相同的扩增过程,则产生约10个拷贝。也可以使用4kb长度的dna,直接对每个串联体进行测序。另一种选择是将较短的dna片段与未测序的填充dna结合,使总长度达到创建排除分子所需的大小。
[0085]
图2b是所提议的间距与用于s1,000基因组的样品有效间距的比较。新阵列的密度提高了170倍,满足
[0086]
达到100倍更高密度的标准。拷贝数/成像斑点/单位面积也满足至少比现有平台低100倍的标准。这有助于确保试剂成本效率比基线高100倍。密集排列的单个生物分子的成像及衍射极限
[0087]
增加成像平台的分子密度的一个限制是衍射极限。光学系统衍射极限的公式为:d=λ/2na
[0088]
其中d为衍射极限,λ为光的波长,na为光学系统的数值孔径。典型的空气成像系统
具有1.0到1.2的na。使用λ=600nm,衍射极限在250至300nm之间。对于水浸体系,na为—1.0,给出了300nm的衍射极限。
[0089]
如果包含生物分子的阵列或其他基底表面上的特征太接近,两个光学信号可能会基本上叠加,这样只看到单个斑点,仅基于图像无法可靠地分辨。这可能由于光学成像系统引入的误差而加剧,所述误差例如由于对移动基底的不精确跟踪而导致的模糊,或者传感器和基底表面之间的光路中的光学变化。
[0090]
从显微镜的样品平面中的一点发出的透射光或荧光发射波前在物镜孔的边缘处被衍射,有效地扩展波前以产生点源的图像,该图像被展宽成具有有限但比原点更大尺寸的中心盘的衍射图案。因此,由于光的衍射,样品的图像从来没有完美地代表样品中存在的真实细节,因为存在一个下限,低于这个下限,显微镜光学系统无法分辨结构细节。
[0091]
由于衍射极限的限制,用显微镜观察亚波长结构是困难的。显微镜中的点物体,例如荧光蛋白或多核苷酸,可在中间平面产生图像,该图像可包括由干涉作用产生的衍射图案。当高度放大时,可以观察到点物体的衍射图案包括由一系列衍射环包围的中心斑点(衍射盘)。结合起来,这个点源衍射图案被称为艾里盘(airy disk)。
[0092]
艾里图案(airy pattern)中的中心斑点的大小与光的波长和物镜的孔径角有关。对于显微镜物镜,孔径角用数值孔径(na)来描述,数值孔径包括术语sin(θ),即物镜能够从样品聚光的半角。在分辨率方面,衍射艾里盘在侧向(x,y)像平面内的半径由下式定义:阿贝分辨率(abbe resolution)=λ/2*na,其中,λ是透射光中的平均照明波长或荧光中的激发波长带。物镜数值孔径(na=n
·
sin(θ))由成像介质(n;通常为空气、水、甘油或油)的折射率乘以孔径角(sin(θ))的正弦来定义。由于这种关系,由点源产生的斑点的大小随着波长的减小和数值孔径的增大而减小,但始终保持有限直径的圆盘。阿贝分辨率(即,阿贝极限)在此也被称为衍射极限,并定义光学系统的分辨率极限。
[0093]
如果两个艾里盘或点扩散函数之间的距离大于衍射极限,则认为这两个点源是可分辨的(并且很容易区分)。否则,艾里盘合并在一起,被认为不被分辨。
[0094]
因此,从波长为2的可检测标记点源发射的光,在折射率为n的介质中行进并会聚到半角为0的斑点,可以形成具有以下直径的衍射受限斑点:d=λ/2*na。考虑到约500nm的绿光和na(数值孔径)为1,衍射极限大致为d=λ/2=250nm(0.25pm),这限制了分析物如蛋白质、核苷酸和其他测序底物(如图20所示)在能够通过常规成像技术成像的表面上的密度。如本文所用,测序底物包括可从中获得测序信息的任何分析物,例如用于测序反应的模板。即使在光学显微镜配备有最高可用质量的透镜元件、完全对准并且具有最高数值孔径的情况下,分辨率仍然被限制在最佳情况下光波长的大约一半。为了提高分辨率,可以使用较短的波长,如uv和x射线显微镜。这些技术提供了更好的分辨率,但昂贵,在生物样品中缺乏对比度,并可能损坏样品。图像分辨
[0095]
在一些实施方案中,本文描述的图像分辨方法包括反卷积。反卷积是一种基于算法的过程,用于逆转卷积对记录数据的影响。反卷积的概念在信号处理和图像处理技术中有着广泛的应用。由于这些技术在许多科学和工程学科中得到了广泛的应用,反卷积得到了许多应用。
[0096]
在光学和成像中,“反卷积”一词专门用来指逆转光学显微镜、电子显微镜、望远镜
或其他成像仪器中发生的光学畸变,从而产生更清晰图像的过程。它通常是在数字领域通过软件算法完成的,作为一套显微镜图像处理技术的一部分。
[0097]
通常的方法是假设通过仪器的光路在光学上是完美的,与点扩展函数(psf)(即一个数学函数,它描述了理论点光源(或其他波)通过仪器的路径所产生的畸变)卷积。通常,这样的点源会为最终的图像贡献一小块区域的模糊性。如果可以确定这个函数,那么就需要计算它的逆函数或互补函数,并将获取的图像与之进行卷积。反卷积映射到傅里叶共域中的除法。这使得反卷积可以很容易地应用于经过傅里叶变换的实验数据。一个例子是核磁共振波谱,其中数据记录在时域中,但在频域中分析。用指数函数划分时域数据具有减小频域中洛伦斯线宽度的效果。其结果是原始的、不失真的图像。
[0098]
然而,对于衍射限制成像,还需要反卷积来进一步细化信号,以提高超过衍射限制的分辨率,即使点扩展函数是完全已知的。很难在小于奈奎斯特(nyquist)距离的距离上可靠地分开两个对象。然而,本文描述的是使用循环检测、分析物位置确定、对准和反卷积来可靠地检测以远小于奈奎斯特距离的距离分开的对象的方法和系统。制备高密度随机串联体层用于测序
[0099]
本文还提供了制备和使用高密度串联体层的方法。在一些实施方案中,串联体随机分布在紧密聚集层中的基底表面上,用于单独检测和测序。在一些实施方案中,本文提供了在基底上制备和随机分布串联体层的方法,使得它们获得高密度或平均中心到中心距离。
[0100]
串联体(即cat)是长的单链dna分子,通过滚动环扩增(rca)作为ss环dna得到。在一些实施方案中,每个串联体包含插入在已知序列衔接子之间的从几个到几百个拷贝的靶dna序列。可以生成包含靶dna序列的串联体文库。在一些实施方案中,串联体包括自排除的特征,以便于在基底上以最小的叠加或相邻串联体之间的最小距离分层紧密聚集的单层串联体,并且不需要基底上的特定附着点。如本文所述,这些排除性特征有助于紧密聚集层,同时最小化太接近而无法通过光学成像分辨的最近邻串联体的数量。
[0101]
在一些实施方案中,本文提供的是包含表面的基底,其中所述表面结合到紧密聚集的、随机分布的扩增靶的集合,例如dna串联体。
[0102]
在一些实施方案中,该基底用于促进核苷酸测序,包括整个基因组或外显子的测序。在一些实施方案中,可以对大量单个细胞靶进行测序。这些可以使用簇排序表示选定的靶组。本文所述的测序可用于,例如(i)检测多个遗传变异(例如,用于基因分型、耐药性测定、亲子鉴定),(ii)对多个cdna分子进行测序,用于基因表达分析以计数途径动力学,或(iii)检测双亚硫酸盐处理后靶多核苷酸上的甲基化残基。在一些实施方案中,测序方法需要靶扩增以产生如实施方案中所述的—200个靶拷贝的小簇。
[0103]
在一个实施方案中,所述方法包括:利用连接酶反应为整个基因组的靶产生环状单链分子,利用等温全基因组扩增方法扩增环状dna以产生具有几百个拷贝的环状扩增靶(cat)的簇,并确保用适当的试剂包覆cat以产生具有大约250nm的均匀尺寸和大约225

275nm的分布的纳米球。
[0104]
在一个实施方案中,所述方法还包括:将cat以紧密聚集的集合分布在生物芯片上以及在去除包被材料的情况下将它们附着到表面上,并确保cat在多个测序反应循环中保持与载玻片的结合。
[0105]
在一些实施方案中,基于重复杂交检测和/或测序和鉴定靶生物分子。这有助于提高精确度,包括灵敏度和/或特异性的降低,以提供改进的靶鉴定和/或测序。
[0106]
在一些实施方案中,单碱基延伸测定和寡核苷酸连接测定在单分子水平上进行以提供证实。这种证实级别允许非常高的多路复用和数字计数,以以前无法通过光学成像获得的更高精度量化相对和绝对丰度。测序
[0107]
光学检测成像系统是衍射受限的,因此具有典型用于测序的荧光团的300nm的理论最大分辨率。到目前为止,最好的测序系统在其阵列上的相邻多核苷酸之间的中心到中心间距为600nm,或衍射极限的—2x。这个2x的因子是用来解释强度、阵列和生物的变化,这些变化可能会导致位置的误差。为了实现10基因组,需要大约200nm的中心到中心间距,这需要亚衍射限制的成像能力。
[0108]
对于测序,本文所述系统和方法的目的是分辨在具有低于光学系统衍射极限的中心到中心间距的基底上测序的多核苷酸。
[0109]
如本文所述,我们提供部分通过以高精度(例如,l0nm rms或更低)鉴定每个分析物的位置来实现亚衍射限制成像的方法和系统。相比较而言,现有的超分辨率系统只能以低至20nm rms的精度鉴定位置,比该系统差2x。因此,本文公开的方法和系统使得亚衍射限制的成像能够鉴定基底上密集聚集的分子,以实现每单位酶的高数据率、每单位时间的数据率和高数据精度。这些亚衍射限制的成像技术广泛适用于使用本文所述的循环检测的技术。多个测序循环串联体cat的制作方法环状ssdna靶点的创建
[0110]
在一些实施方案中,本文描述了制备串联体库以作为层分布在基底表面上的方法,例如,作为随机分布的密集聚集层。合成包含待测序靶dna的串联体,首先可扩增靶dna并将其转化为环状dna模板。在一些实施方案中,扩增产物经历环状模板连接,所述环状模板连接可以通过模板介导的酶促连接(例如,t4 dna连接酶)或使用特殊dna连接酶(即circligase)的无模板连接来进行,以形成通过环状dna模板的滚环扩增而形成的串联体的前体。rca/rcr基本技术
[0111]
滚环复制描述了一种能够快速合成dna或rna的环状分子的多拷贝循环的单向核酸复制过程。
[0112]
rca(滚环扩增)是一种等温核酸扩增技术,其中聚合酶连续地将单核苷酸加到与环状模板退火的引物上,从而产生含有数十至数百个串联重复序列(与环状模板互补)的长串联体ssdna。
[0113]
滚环扩增可通过将环形dna模板暴露于以下来进行:1.dna聚合酶。2.与聚合酶相容的合适缓冲液。3.短的dna或rna引物。4.脱氧核苷酸三磷酸(dntp)。
[0114]
在一些实施方案中,用于滚环扩增的聚合酶是用于dna扩增的phi29、bst或vent exo

dna聚合酶,以及用于rna扩增的t7 rna聚合酶。rca可以在恒温下(室温至37℃)在游离
溶液在和在沉积靶上进行(固相扩增)。dna rca反应通常通过引物诱导的单链dna伸长进行。
[0115]
在一些实施方案中,图19示出了用于构建测序底物的串联体文库以加载到物理基底(例如流动池)上的方法。在一些实施方案中,如图20所示构建测序底物的串联体库。“丝(hairs)”是ssdna分子,可以通过使用反向引物与延伸的串联体dna反向合成而产生。这些“丝”可用于控制串联体的大小和/或拒斥特性。在一些实施方案中,本文所述的测序反应使用ssdna“丝”作为模板发生。终止rcr反应
[0116]
添加edta螯合phi29酶必需的mg2 辅因子可阻止cat的滚环扩增。phi29是强置换性聚合酶,而用于测序的标准聚合酶,例如therminator9,仅具有弱置换性。可使用或调整用于对该底物进行测序的更具有置换性的酶。
[0117]
可替代地,可以使用单链结合蛋白(ssb)或解旋酶,或它们的组合来帮助置换。这些可添加到延伸反应中或用作预温育操作,以制备用于测序的底物。
[0118]
可替代地,可以使用未标记的可逆终止子剂停止滚环反应。这可能是一种使溶液中的停顿更均匀的方法,比用edta停顿得到更均匀大小的cat。此外,测序反应随后可从解封操作开始,随后用标记的可逆终止子核苷酸延伸。这可能允许对底物进行自然选择,其中延伸的3’末端可用于通过合成进行测序的正常反应。
[0119]
phi29很可能紧紧地结合在cat的延伸端。使用可逆终止子剂来停止反应可能会破坏这种相互作用的稳定性。其他蛋白质变性剂如离液盐或清洁剂可能需要置换phi29以使测序反应能够进行串联体组成
[0120]
cat在延伸的单链上有几个相同的靶dna拷贝。cat也可以在上面所述的ssdna“丝”上有几个相同的靶dna反向拷贝。
[0121]
在一些实施方案中,串联体的长度至少为1,000个核苷酸(不大于400,000个)。
[0122]
在一些实施方案中,串联体的直径至少为150nm(不大于300nm)。优选地,相邻串联体之间的禁止区不小于实现所需密度或间距所需的最小中心到中心距离。密集聚集的随机阵列阵列的制作方法(串联体的随机分布的紧密聚集层)控制的间距
[0123]
本文提供了几种控制在非图案化表面上排列的cat之间的最小中心到中心距离的分布的机构。在一些实施方案中,这些方法和组合物有助于形成均匀的、紧密聚集的自组装随机cat层,在相邻cat之间具有受控的最小中心到中心距离,使得它们可以在染料标记的测序底物之间具有最小的串扰情况下进行测序。
[0124]
cat本身在溶液中由于它们的强负电荷而相互拒斥,但它们彼此可能过于接近,以致于一旦吸附在表面上,标记的相邻cat就无法有效地进行扩散限制分辨。
[0125]
在一些实施方案中,串联体被“包封”或“包被”在拒斥物质或吸引物质的外壳中,以增加它们的有效排除尺寸,而不改变cat本身的尺寸或它们包含的测序底物的拷贝数。
[0126]
在一些实施方案中,修饰cat吸附在基底表面上的蛋白质层,以在表面上隔开相互作用的蛋白质。例如,cat可以通过与先前吸附在表面上的蛋白质的相互作用与玻璃、硅或
经修饰(例如氨基硅烷化)的表面相互作用。
[0127]
因此,cat或结合对的蛋白质伴侣的修饰可以帮助尺寸排除,以在表面上实现均匀的、密集聚集的串联体层,而没有cat的特定附着点。在一些实施方案中,这些修饰包括交联或附着分子,如peg或多糖,以包覆cat或其蛋白质结合伴侣。
[0128]
如图21a所示,ub是描绘经包被的串联体的实施方案。
[0129]
本实施方案中的内核可以是缠绕的dna靶的多个拷贝。外层,即包被,可以包括类似peg的化合物、具有两性离子特征的化合物、安福灵两性电解质、磺基甜菜碱和其他类似分子,其正电荷在内部与核酸相互作用,而负电荷在外部,以确保纳米球不聚集。cat加载在芯片上
[0130]
在一些实施方案中,串联体分布在高密度层中基底的非图案化表面上。这种紧密聚集的形成有利于紧密聚集的测序底物的形成,以实现更高的通量和/或更低的成本测序。在一些实施方案中,所述表面是图案化的。图25所示为非图案化表面上密集聚集的串联体层的示例。
[0131]
在一些实施方案中,串联体加载在生物芯片上并紧密聚集,以使得中心到中心距离为250nm,方差为 /

25纳米。
[0132]
在一些实施方案中,分子之间的平均中心到中心距离为约315nm。在一些实施方案中,所述多个分析物(例如,核酸分子)可相邻表面沉积,使得所述多个分析物中的相邻分析物可具有至少10纳米(nm)、50nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm或更大的平均中心到中心间距。平均中心到中心间距可以小于或等于500nm、490nm、480nm、470nm、460nm、450nm、440nm、430nm、420nm、410nm、400nm、390nm、380nm、370nm、360nm、350nm、340nm、330nm、320nm、310nm、300nm、290nm、280nm、270nm、260nm、250nm、240nm、230nm、220nm、210nm、200nm、190nm、180nm、170nm、160nm、150nm、140nm、130nm、120nm、110nm、100nm、50nm或更小。
[0133]
在一些实施方案中,串联体包括包被,以实现相邻串联体之间的中心到中心距离的较低阈值,从而最小化检测期间的串扰。在一些实施方案中,在将串联体结合到表面之后,包被溶解,并且cat附着到表面并可被测序。
[0134]
使用另一种蛋白质如bsa,这可通过化学交联到cat或蛋白质结合伴侣,或通过链霉亲和素相互作用将间隔蛋白(例如bsa)连接到与公共文库衔接子序列互补的寡核苷酸。用bsa包被cat可能有一个另外的好处,即在cat的结合层中形成蛋白质凝胶,这可能使酶促反应的局部环境更类似于聚合酶正常作用的细胞核的自然环境。
[0135]
人们也可以杂交与公共文库衔接子序列部分地互补并延伸到不具有同源性的序列以外的长的单链寡核苷酸。在一些实施方案中,长的单链寡核苷酸是上文段落[00113]中提到的丝。这样长的寡核苷酸可以在不改变其所含的测序底物数量的情况下起到增加cat大小的作用。表面附着后,这些长寡核苷酸可能会被冲走,并且每个cat可能会朝着其附着位点的中心塌陷,增加相邻cat之间的有效中心到中心距离。
[0136]
dna也可用于修饰蛋白质结合伴侣(通过交联或附着,例如链霉亲和素)以产生表面,所述表面具有被拒斥性区域(例如由于它们的负电荷)分隔的吸引性蛋白质结合位点。
在非图案化表面上沉积紧密聚集的串联体层
[0137]
生物分析物从水溶液到非图案化的、粘附的固体表面上的最佳聚集密度的限制之一是,由于粘附的分析物不能横向移动和最小化粘附分子之间的间距,分析物在表面上的随机结合不能提供最大的紧密聚集。结果,分析物的这种随机不可逆粘附在本来可以排列成最紧密聚集的阵列中产生了间距缺陷。
[0138]
然而,许多生物分析物,包括蛋白质和核酸,已知是表面活性的,并且迁移到空气

水界面,导致该界面处的表面张力降低,产生亚稳态的生物分子单层。在这种情况下,表面活性分析物在界面处可以自由地横向移动,实现最大的紧密聚集密度,而溶液中不利的疏水相互作用是最大聚集的驱动力。
[0139]
因此,在一些实施方案中,在空气

水界面处紧密聚集的、自发形成的生物分子单层构造物可以通过在已经与空气接触的固体表面上拉动或拖动生物分子溶液团块而转移或沉积到固体表面上。因此,在空气

水界面处的紧密聚集的生物分子构造物当团块移动穿过固体表面时从三相(空气



固体)接触点沉积到固体表面上。
[0140]
在一些实施方案中,可以在添加cat之前在表面上放置蛋白质层。那么cat可能会被添加到已经铺好的蛋白质层。如果结合蛋白是经修饰的伴侣,这种顺序添加可能特别有效。测序测序工作流程
[0141]
在一些实施方案中,本文提供了检测来自串联体的多核苷酸序列的方法,例如,通过在非图案化的表面上形成密集聚集层和通过合成进行循环测序(参见例如图23)。在一些实施方案中,所述表面是图案化的。
[0142]
基于重复杂交的靶检测和其证实是实现靶鉴定和定量计数的关键特征。同步和信号调用(未反应的寡核苷酸的ddntp加帽)
[0143]
在一些实施方案中,通过合成的测序包括在延伸循环之后添加不可逆的ddntp终止剂以加帽未延伸的寡核苷酸。例如,在用经标记的和冷可逆终止子剂的混合物获得最大起始和/或延伸之后,延伸循环(例如,用能够更好地掺入ddntp的不同聚合酶)和非常高浓度的所有四种ddntp。此操作可能会不可逆转地终止cat内任何在所讨论的循环中未能扩展的测序模板的扩展。尽管这可能导致与起始或延伸的低效率成正比的信号逐渐丢失,但重要的是,它还可能降低cat内在任何循环“跳过”延伸的那些模板的后续循环的背景,这一过程导致cat内一些相同模板上的滞后合成产生的混合信号。
[0144]
这一过程可能会提高cat内模板的同步性,使滞后模板产生较少的信号,从而使序列中正确碱基产生较纯净的信号。在所有其他条件相同的情况下,它可能导致更长的有效序列读段。反应
[0145]
这些cat有几个相同的靶dna拷贝,但在滚环扩增过程中产生的最后一个拷贝是独特的,因为它包含主动延伸的3’末端。这个ss环及其主动延伸的末端很可能在cat的dna球的中心附近,所以它在cat的单层内的禁止区的中心附近。它也远离其上形成单层的表面。提高主动延伸末端远离表面可以增加用于测序反应的化学品和酶的可及性,并且还可能提高染料标记在表面上背景荧光的焦平面之上。这些特性使其成为单分子测序的理想选择。
成对末端测序umi实施方案
[0146]
独特性分子标识符(umi)已经被用于标记分子,从而能够鉴定重复的pcr产物,并且能够使双链测序应用减少误差。
[0147]
在一些实施方案中,包含umi的衔接子被掺入用于形成串联体的环状dna模板中。
[0148]
在一个实施方案中,将umi al和a2衔接子添加到链a和b的5’和3’末端,如图24所示。al和a2可以具有样品id的条形码。它们还具有用于连接/环生成的区域和测序引物结合区域,以使两条链都能测序。衔接子也可以具有umi序列。
[0149]
测序完成后,umi可用于定位来自同一dna片段的环,并作为成对末端读段进行分析。如果读段长度较短,成对末端读段对映射很有用。
[0150]
虽然可以使用umi,但许多应用,如nipt、pcr扩增组和基因组的大部分可以可靠地测序,而不具有成对末端能力。成像和循环检测
[0151]
如本文所述,检测方法和系统中的每个都需要循环检测以实现亚衍射限制成像。循环检测包括结合和成像或探针,例如抗体或核苷酸,结合到可发射可见光光学信号的可检测标记上。通过使用来自不同循环的区域的一系列图像的位置信息,可以有效地使用反卷积来分辨来自密集聚集的底物的信号,以从由于光学成像的衍射极限而被遮蔽的信号中鉴定单个光学信号。在多个循环之后,分子的精确位置可能会变得越来越精确。使用该信息,可以执行另外的计算以帮助关于由于像素离散化效应而发生的串扰矩阵中的已知不对称的串扰校正。分析物的光学检测方法
[0152]
在一些实施方案中,光学信号被数字化,并且基于每个分析物的数字信号的代码(id代码)来鉴定分析物。
[0153]
如本文所述,分析物沉积到固体基底上,探针结合到分析物上。每个探针包含标签并与靶分析物特异性结合。在一些实施方案中,标签是发射相同荧光颜色的荧光分子,并且在每个后续遍次处检测另外荧光的信号。在遍次过程中,包括标签的一组探针与基底接触,允许它们结合到它们的靶上。捕获基底的图像,并从每个遍次后获得的图像分析可检测信号。对于基底上的每个检测位置(例如,靶分析物),记录关于可检测信号的存在和/或不存在的信息。
[0154]
在一些实施方案中,本公开包括方法,所述方法包括用于检测从包括标签的探针发射的光学信号的操作,在基底上的各个位置处对多个遍次和/或多个循环期间发射的信号进行计数,以及使用基于k位的计算将信号作为数字信息分析以鉴定基底上的每个靶分析物。如下文所述,可以使用误差校正来解释光学检测信号中的误差。
[0155]
在一些实施方案中,基底与包含n个靶分析物的分析物结合。为了检测n个靶分析物,选择探针结合和信号检测的m个循环。所述m个循环中的每个包括1个遍次或更多个遍次,且每个遍次包括n组探针,使得每组探针特异性结合所述n个靶分析物中的一个。在某些实施方案中,存在用于n个靶分析物的n组探针。
[0156]
在每个循环中,对于每个遍次引入探针组,存在预定的顺序。在一些实施方案中,探针组的预定顺序是随机顺序。在其他实施方案中,探针组的预定顺序是非随机顺序。在一
个实施方案中,非随机顺序可以由计算机处理器选择。预定顺序在针对每个靶分析物的密钥中表示。生成包括探针组的顺序的密钥,并且探针的顺序在代码中数字化,以鉴定每个靶分析物。
[0157]
在一些实施方案中,每组有序探针与用于检测靶分析物的不同标签相关联,并且不同标签的数目小于n个靶分析物的数目。在这种情况下,每一n个靶分析物与m个循环的m个标签序列匹配。标签的有序序列作为鉴定代码与靶分析物相关联。光学检测的探针的定量
[0158]
检测过程结束后,对来自每个探针池的信号进行计数,对于基底上的每个位置,可以记录信号的有无以及信号的颜色。
[0159]
从可检测信号中,对于n个不同的靶分析物,在m个循环中的每个循环中获得k位信息。k位信息用于确定l总位信息,使得k
×
m=l位信息并且l≥log2(n)。l位信息用于确定n个不同的靶分析物的标识(和存在)。如果只执行一个循环(m=1),则kx1=l。然而,可以执行多个循环(m>1),以产生每个分析物更多的总位信息l。每个后续循环提供用于鉴定靶分析物的另外光学信号信息。
[0160]
在实践中,信号中会出现误差,这使靶分析物鉴定的准确性变得混乱。例如,探针可能结合错误的靶(例如,假阳性)或未能结合正确的靶(例如,假阴性)。如下所述,提供了用于解释光和电信号检测中的误差的方法。电检测方法
[0161]
在其他实施方案中,电检测方法用于检测基底上靶分析物的存在。靶分析物用寡核苷酸尾区标记,寡核苷酸标签用离子敏感区域效应晶体管(isfet,或ph传感器)检测,其测量溶液中的氢离子浓度。isfet在以下文件中有更详细的描述:于2007年12月14日提交的rothberg等人的美国专利号7,948,015和于2009年5月29日提交的rothberg等人的美国专利号2010/0301398,上述文件通过引用全文并入本文。
[0162]
isfet为分析物的鉴定和表征提供了一种灵敏和特异的电检测系统。在一个实施方案中,本文公开的电检测方法由计算机(例如,处理器)执行。通过isfet的电极可以将溶液的离子浓度转换成对数电位,从而检测和测量电输出信号。
[0163]
isfet以前曾用于促进dna测序。在酶促将单链(ss)dna转化为双链dna的过程中,每个核苷酸加入到dna分子中时都会释放氢离子。isfet能检测这些释放的氢离子,并能确定dna分子中何时加入了核苷酸。通过同步三磷酸核苷(datp、dctp、dgtp和dttp)的掺入,还可以确定dna序列。例如,如果当单链dna模板暴露于datp时没有检测到电输出信号,但在dgtp存在时检测到电输出信号,则dna序列在所述位置由互补的胞嘧啶碱基组成。
[0164]
在一个实施方案中,isfet用于检测探针的尾区,然后鉴定相应的靶分析物。例如,靶分析物可以沉积在基底上,例如包含一个或多个isfet的集成电路芯片上。当加入相应的探针(例如适体和尾区)并与靶分析物特异性结合时,加入核苷酸和酶(聚合酶)用于尾区的转录。isfet检测释放的氢离子作为电输出信号,并测量当dntp掺入尾区时离子浓度的变化。释放的氢离子的量对应于尾区的长度和停止,并且关于尾区的该信息可用于在各种标签之间进行区分。
[0165]
最简单的尾区是完全由一个均聚碱基区组成的尾区。在这种情况下,有四个可能的尾区:聚a尾、聚c尾、聚g尾和聚t尾。然而,通常需要在尾区中具有很大的多样性。
[0166]
在尾区中产生多样性的方法是通过在尾区的均聚碱基区内提供终止碱基。终止碱基是尾区的一部分,该尾区包含与均聚碱基区相邻的至少一个核苷酸,使得所述至少一个核苷酸由与所述均聚碱基区内的碱基不同的碱基组成。在一个实施方案中,终止碱基是一个核苷酸。在其他实施方案中,终止碱基包括多个核苷酸。通常,终止碱基两侧有两个均聚碱基区。在一个实施方案中,位于终止碱基两侧的两个均聚碱基区由相同的碱基组成。在另一个实施方案中,两个均聚碱基区由两种不同的碱基组成。在另一个实施方案中,尾区包含多于一个终止碱基。
[0167]
在一个示例中,isfet可以检测100个氢离子的最小阈值数。靶分析物1结合到组合物上所述组合物具有由100个核苷酸的聚a尾组成的尾区,后接一个胞嘧啶碱基,后接另外的100个核苷酸的聚a尾,尾区总长度为201个核苷酸。靶分析物2结合到具有由200个核苷酸的聚a尾部组成的尾区的组合物上。加入dttp后,在有利于多核苷酸合成的条件下,与靶分析物1相关联的尾区上的合成可释放100个氢离子,这可与跟靶分析物2相关联的尾区上的多核苷酸合成(其可释放200个氢离子)区分开来。isfet可针对每个尾区检测不同的电输出信号。此外,如果添加dgtp,随后添加更多的dttp,则与靶分析物1相关联的尾区可能会释放一个,然后由于进一步的多核苷酸合成而释放100个以上的氢离子。基于尾区组成添加特定的三磷酸核苷产生的不同的电输出信号允许isfet检测来自每个尾区的氢离子,并且该信息可用于鉴定尾区及其对应的靶分析物。
[0168]
均聚碱基区、终止碱基及其组合的各种长度可用于唯一地标记样品中的每种分析物。在美国临时申请号61/868,988中描述了对适体和尾区的电检测以鉴定基底中的靶分析物的另外描述,该申请通过引用全文并入本文。
[0169]
在其他实施方案中,抗体用作上述电检测方法中的探针。所述抗体可以是通过接头区结合到充当标签的寡核苷酸尾区的一级或二级抗体。
[0170]
这些电检测方法可用于数百种(甚至数千种)不同的靶分析物的同时检测。每个靶分析物可以与数字标识符相关联,使得不同的数字标识符的数量与样品中不同的靶分析物的数量成比例。标识符可以由数字信息的位数来表示,并且在有序尾区集合内被编码。顺序地使有序尾区集合中的每个尾区特异性结合与靶分析物特异性结合的探针区的接头区。可替代地,如果尾区与它们相应的探针区共价结合,则顺序地使有序尾区集合中的每个尾区特异性结合靶分析物。
[0171]
在一个实施方案中,一个循环由尾区与接头区的结合和剥离表示,使得发生多核苷酸合成并释放氢离子,氢离子被检测为电输出信号。因此,用于鉴定靶分析物的循环数等于有序尾区集合中的尾区数。有序尾区集合中尾区的数量取决于待鉴定的靶分析物的数量,以及待生成的信息的总位数。在另一个实施方案中,一个循环由与特异性结合并从靶分析物剥离的探针区共价结合的尾区表示。
[0172]
从每个循环检测到的电输出信号被数字化成位信息,使得在执行所有循环以将每个尾区结合到其相应的连接区之后,所获得的数字信息的总位可用于鉴定和表征所述靶分析物。总位数取决于用于鉴定靶分析物的鉴定位数,加上用于错误校正的位数。用于错误校正的位数是基于所需的电输出信号的鲁棒性和精确度来选择的。通常,错误校正的数目可以是鉴定位数的2或3倍。解码检测到的分析物的顺序和标识
[0173]
用于检测分析物的探针在每个循环中以有序的方式引入基底。生成密钥,对每个靶分析物的探针顺序信息进行编码。对每个分析物检测到的信号可以数字化为信息位。信号的顺序提供了用于鉴定每个分析物的代码,该代码可以编码为信息位。错误校正方法
[0174]
在上述光和电检测方法中,在信号的结合和/或检测中可能发生错误。在某些情况下,错误率可高达五分之一(例如五个荧光学信号中有一个不正确)。这等于每五个循环序列中有一个错误。实际的错误率可能不会高达20%,但百分之几的错误率是可能的。一般来说,错误率取决于包括样品中分析物的类型和所用探针的类型在内的许多因素。在电检测方法中,例如,在一个循环过程中,尾区可能不能正确地结合到适体上的相应探针区域。在光学检测方法中,抗体探针可能不结合其靶点或结合错误的靶点。
[0175]
生成另外的循环以考虑检测到的信号中的错误并获得另外的信息位,例如奇偶校验位。所述另外的信息位用于使用错误校正码来校正错误。在一个实施方案中,错误校正码是reed

solomon码,它是用于检测和校正系统中的错误的非二进制循环码。在其他实施方案中,可以使用各种其他错误校正码。其他错误校正码包括,例如,分组码、卷积码、golay码、hamming码、bch码、an码、reed

muller码、gappa码、hadamard码、walsh码、hagelbarger码、极化码、重复码、重复累加码、擦除码、在线码、组码、扩展码、恒重码、旋风码、低密度奇偶校验码、最大距离码、突发错误码、luby变换码、喷泉码和速龙码。参见error control coding,第2版,s.lin和dj costello,prentice hall,纽约,2004年。下面还提供了示例,其演示了通过添加循环和获得另外信息位来进行序错误校正的方法。
[0176]
reed

solomon码的一个示例包括具有4位符号的rs(15,9)码,其中n=15,k=9,s=4和t=3,并且n=2s

1和k=n

2t,“n”是符号的数目,“k”是数据符号的数目,“s”是每个符号的位大小,并且“t”是可以校正的错误的数目,并且“2t”是奇偶校验符号的数目。有九个数据符号(k=9)和六个奇偶校验符号(2t=6)。如果使用碱基

x数字,并且x=4,则每个荧光颜色由两个位(0和1)表示。一对颜色可以由包括两个高位和两个低位的四位符号表示。
[0177]
由于选择了碱基

4,因此使用七个探针池或七种颜色的序列来鉴定每个靶分析物。该序列由31/2的4位符号表示。其余51/2数据符号设为零。然后,reed

solomon rs(15,9)编码器产生由12个另外探测池表示的六个奇偶校验符号。因此,总共需要19个探测池(7 12)来获得针对t=3个符号的错误校正。
[0178]
假设有7个探测池,对错误校正码性能进行了monte carlo模拟,以鉴定多达16384个不同的靶。使用这些模拟,对于不同数目的奇偶校验位,确定了实现10

5的校正错误率的最大允许原始错误率(与鉴定荧光标记相关联)。
[0179]
在一些实施方案中,生成包括与分析物相关联的预期信息位(例如,探针的预期顺序和用于分析物的信号类型)的密钥。将特定分析物的这些预期信息位与从靶分析物获得的实际l信息位进行比较。使用reed

solomon方法,在比较预期信息位和实际信息位时,可以容忍信号中的向上误差。
[0180]
在一些实施方案中,使用reed

solomon解码器来比较预期信号序列与来自特定探针的观察信号序列。例如,可以使用七个探针池来鉴定靶分析物,预期的颜色序列为bggbbyy,由14位表示。然后可以使用另外的奇偶校验池来进行错误校正。例如,可以使用六
个4位奇偶校验符号。
[0181]
使用循环探针结合和光学检测的方法和系统描述于2015年11月19日出版的美国公开号2015/0330974,digital analysis of molecular analytes using single molecule detection和2018年9月6日出版的美国公开号2018/0252936,high speed scanning with acceleration tracking中,其各自通过引用全文并入本文。
[0182]
在一些实施方案中,使用至少在奈奎斯特极限处的采样来获得原始图像,以便于更精确地确定过采样图像。通过超过奈奎斯特极限的采样(过采样)来增加用于表示图像的像素数,增加了可用于图像处理和示出的像素数据。
[0183]
理论上,如果以奈奎斯特速率或更高的速率采样,带宽受限的信号可以被完美地重构。奈奎斯特速率定义为信号中最高频率分量的两倍。过采样通过放宽抗混叠滤波器性能要求,提高分辨率、降低噪声,并有助于避免混叠和相位失真。如果一个信号以n倍奈奎斯特速率采样,则称其过采样倍数为n。
[0184]
因此,在一些实施方案中,以不超过所观察到的光波长的一半的像素大小拍摄每个图像。在一些实施方案中,在检测中使用小于约200nm x 200nm的像素尺寸,以实现在奈奎斯特极限或以上的采样。优选地,在基底的原始成像期间以至少奈奎斯特极限的频率进行采样,以优化在此描述的系统或方法的分辨率。这可以结合本文所述的反卷积方法和光学系统来完成,以高精度地分辨低于衍射极限的基底上的特征。处理来自不同循环的图像
[0185]
为了实现亚衍射限制成像,本发明克服了几个障碍。
[0186]
像素化误差存在于原始图像中,并且由于像素化而阻止从光学信号中鉴定存在的信息。至少在奈奎斯特频率下采样和如本文所述的过采样图像的产生各自都有助于克服像素化误差。
[0187]
各种分子的点扩散(psf)叠加是因为psf的大小大于像素大小(低于奈奎斯特),并且因为中心到中心的间距如此小,以致于由于空间叠加而产生串扰。最近邻例如变量回归(用于中心到中心串扰校正)可用于帮助多个叠加光学信号的反卷积。但是,如果我们知道每个分析物在基底上的相对位置,并且对区域的图像有良好的对准,这就可以改进。在一些实施方案中,机器学习(例如人工智能或“a.i.”)可用于帮助多个叠加光学信号的反卷积。在一些实施方案中,机器学习在探针结合和成像的多个循环中处理输入数据,以对进一步的图像进行反卷积。
[0188]
在多个循环之后,分子的精确位置可能会变得越来越精确。利用该信息,通过校正由于像素离散化效应和衍射极限而产生的光学信号的空间叠加中的已知非对称性,可以执行另外的计算以帮助反卷积。它们还可以用来校正不同发射光谱中的发射光谱叠加。
[0189]
每个分析物的高度精确的相对位置信息可以通过叠加来自不同循环的相同区域的图像来获得,以根据与每个分析物结合的不同探针的光学信号产生测量峰的分布。然后,该分布可用于生成对应于分析物的单个相对位置的峰值信号。来自循环子集的图像可用于生成每个分析物的相对位置信息。在一些实施方案中,在定位文件中提供该相对位置信息。
[0190]
每个循环为区域成像的特定区域可以随循环而变化。因此,为了提高对每个图像的分析物位置的鉴定的准确性,可以在多个循环中执行区域的图像之间的对准。根据该对准,然后可以鉴定与参考文件相比较的偏移信息并将其合并到反卷积算法中,以进一步增
加由于衍射极限而被遮蔽的光学信号的反卷积和信号鉴定的精度。在一些实施方案中,在区域对准文件中提供该信息。信号检测(串扰/最近邻)
[0191]
一旦准确地确定了基底上分析物的相对位置信息,并且每个循环的区域图像与该位置信息对准,就可以使用串扰和最近邻回归对每个过采样图像的分析来准确地鉴定每个图像中每个分析物的光学信号。
[0192]
在一些实施方案中,对于沉积在基底上并结合到包含可检测标记的探针的多个生物分子中的每个,鉴定被光学系统的衍射极限遮蔽的多个光学信号。在一些实施方案中,探针是掺入的核苷酸,并且所述系列循环用于使用合成测序确定沉积在阵列上的多核苷酸的序列。
[0193]
对图像应用反卷积的模拟
[0194]
分子密度受到相邻分子串扰的限制。图3描述了单个分析物的模拟图像。这个特殊的图像是600nm间距上的分析物层的模拟,该分析物层已经用2x过采样滤波器处理。8个相邻点的串扰作为阵列间距和算法类型的函数被平均。
[0195]
图4是用多个间距和图像处理算法两种变体处理的一系列图像,第一个是2x过采样图像,第二个是具有反卷积的4x过采样图像,如本文所述。图5是这两个类型的图像处理在低至200nm间距时的串扰分析。对于275nm或以上的间距,在过采样为2x情况下可接受的串扰水平为25%或25%以下。在使用光学系统的点扩展函数进行4x反卷积的情况下,对于210nm或以上的间距,可接受的串扰水平为25%或25%以下。
[0196]
分子的物理尺寸可能使斑点加宽约为结合区大小的一半。例如,对于80nm的斑点,间距可以增加大约40nm。可以使用较小的斑点尺寸,但这可能具有可能允许较少的拷贝和可能需要较大的照明强度的折衷。单拷贝提供最简单的样品制备,但需要最大的照明强度。
[0197]
讨论的亚衍射极限成像方法涉及过采样、反卷积和串扰校正等图像处理技术。本文描述的方法和系统结合使用来自分析物的多个探针光学信号成像循环的信息来确定分析物在基底上的精确相对位置。使用该信息可以执行另外的计算以帮助关于由于像素离散化效应而发生的串扰矩阵中的已知不对称的串扰校正。方法
[0198]
在一些实施方案中,如图6所示,本文提供了一种用于精确确定沉积在密集聚集的基底表面上的分析物的相对位置的方法。该方法包括首先提供包括表面的基底,其中表面包括沉积在所述表面上离散位置处的多个分析物。然后,在所述表面上执行多个探针结合和信号检测循环。每个检测循环包括使分析物与能够结合到沉积在表面上的靶分析物的探针组接触,用光学系统对所述表面的区域进行成像,以检测来自在所述表面上离散位置处结合到所述分析物的单个探针的多个光学信号,以及如果要执行另一个检测循环,则去除结合的探针。从每个图像,检测来自所述多个循环的至少两个(即,子集)的所述区域的图像的所述多个光学信号中的每个的峰位置。对每个分析物的峰的位置进行叠加,生成峰的簇,然后根据该簇确定每个分析物在基底上的精确相对位置。
[0199]
在一些实施方案中,如图7所示,然后在结合位置信息的反卷积算法中使用基底上分析物的精确位置信息(例如,用于鉴定基底上相邻分析物之间的中心到中心间距),该反卷积算法可应用于图像,以对来自每个所述图像的叠加光学信号进行反卷积。在一些实施
方案中,反卷积算法包括最近邻变量回归,用于具有叠加光学信号的相邻分析物之间的空间区分。
[0200]
在一些实施方案中,如图8所示,分析物检测的方法被应用于沉积在基底上的单个多核苷酸的测序。
[0201]
在一些实施方案中,如图11所示,从密集聚集的基底反卷积光学信号。操作可分为四个不同的部分,如图9所示:1)图像分析,其包括针对每个循环从区域的每个图像生成过采样图像,以及生成包括图像中每个检测到的光学信号的峰位置和强度的峰文件(即数据集)。2)生成定位文件,其包括对从针对每个分析物的多个光学信号检测循环中生成的多个峰进行对准,以确定分析物在基底上的精确相对位置。3)生成区域对准文件,其包括每个图像的偏移信息,以将来自不同检测循环的区域的图像相对于选定的参考图像对准。4)提取强度,其使用偏移信息和位置信息结合反卷积建模来确定从每个过采样图像中检测到的信号的准确标识。“提取强度”操作还可以包括其他误差校正,例如用于校正通过合成处理和检测进行的测序中的误差的先前循环回归。在每个部分中执行的操作将在下面进一步详细描述。
[0202]
在图10a和图11所示的图像分析操作下,处理来自每个循环的每个区域的图像,以增加每个检测信号的像素数,锐化每个信号的峰,并鉴定每个信号的峰强度。该信息用于为每个循环的每个区域生成峰文件,该峰文件包括每个分析物的位置的测量(来自观察到的光学信号的峰),以及来自每个信号的峰强度的强度。在一些实施方案中,来自每个区域的图像首先经历背景减除以执行从图像中去除噪声的初始去除。然后,使用平滑和反卷积处理图像,以生成过采样图像,该过采样图像包括基于在每个图像中观察到的信号的建模而人工生成的像素。在一些实施方案中,过采样图像可以从原始图像的每个像素生成4个像素、9个像素或16个像素。
[0203]
然后鉴定在每个原始图像中检测到的或在过采样图像中存在的来自光学信号的峰,并且将每个检测到的分析物的强度和位置信息放置到峰文件中以供进一步处理。
[0204]
在一些实施方案中,对应于从基底的每个循环和每个区域检测到的所有图像的n个原始图像或输出到用于每个成像区域的n个过采样图像和n个峰文件。峰文件包括每个图像的每个检测到的分析物的相对位置。在一些实施方案中,峰文件还包括每个检测到的分析物的强度信息。在一些实施方案中,在每个循环中为每个颜色和每个区域生成一个峰文件。在一些实施方案中,每个循环还包括多个遍次,使得可以针对每个循环中的每个遍次为每个颜色和每个区域生成一个峰文件。在一些实施方案中,峰文件指定来自单个区域内的光学信号的峰位置。
[0205]
在优选实施方案中,峰文件包括来自每个循环的区域的每个经处理过采样图像的xy位置信息。xy位置信息包括来自过采样图像的探针(例如荧光团)的每个检测到的可检测标记的位置的估计坐标。峰文件还可以包括来自每个单独的可检测标记的信号的强度信息。
[0206]
过采样图像的生成用于克服像素化误差,以鉴定存在的由于像素化而不能提取的信息。通过平滑和反卷积对原始图像的初始处理有助于在峰文件中提供更精确的信息,从而可以以更高的精度确定每个分析物的位置,并且该信息随后可以用于提供在衍射受限成像中被遮蔽的信号的更精确的确定。
[0207]
在一些实施方案中,使用至少在奈奎斯特极限处的采样来获得原始图像,以便于更精确地确定过采样图像。通过超过奈奎斯特极限的采样(过采样)来增加用于表示图像的像素数,增加了可用于图像处理和示出的像素数据。
[0208]
理论上,如果以奈奎斯特速率或更高的速率采样,带宽受限的信号可以被完美地重构。奈奎斯特速率定义为信号中最高频率分量的两倍。过采样通过放宽抗混叠滤波器性能要求,提高分辨率、降低噪声,并有助于避免混叠和相位失真。如果一个信号以n倍奈奎斯特速率采样,则称其过采样倍数为n。
[0209]
因此,在一些实施方案中,以不超过所观察到的光波长的一半的像素大小拍摄每个图像。在一些实施方案中,在检测中使用小于约200nm x 200nm的像素尺寸,以实现在奈奎斯特极限或以上的采样。
[0210]
平滑使用近似函数捕获数据中的重要模式,同时剔除噪声或其他精细尺度结构/快速现象。在平滑处理中,对信号的数据点进行修改,从而减少单个点,并增加低于相邻点的点,从而得到更平滑的信号。本文使用平滑来使在每个图像中检测到的衍射受限光学信号平滑,以更好地从信号中鉴定峰和强度。
[0211]
尽管每个原始图像是衍射限制的,但本文描述的是导致从不同循环的相同分析物收集多个信号的方法。该方法的一个实施方案在图10b的流程图中示出。来自每个分析物的这些多个信号用于确定比来自每个单独图像的衍射限制信号精确得多的位置。它们可用于在小于5nm的分辨率下鉴定区域中的分子。然后将此信息存储为本地化文件,如图11所示。然后,高精度的位置信息可用于结合反卷积算法,例如串扰回归和最近邻变量回归,从每个单独的区域图像中大大改进信号鉴定。
[0212]
如图11所示,用于生成定位文件的操作使用峰文件中提供的位置信息来确定一组分析物在基底上的相对位置。在一些实施方案中,每个定位文件包含来自基底的单个成像区域的分析物组的相对位置。定位文件组合来自多个循环的位置信息,以生成低于衍射极限的检测分析物的高度精确的位置信息。
[0213]
在一些实施方案中,每个分析物的相对位置信息被平均确定为小于10nm标准偏差(即,rms,或均方根)。在一些实施方案中,每个分析物的相对位置信息被平均确定为小于10nm 2x标准偏差。在一些实施方案中,每个分析物的相对位置信息被平均确定为小于10nm 3x标准偏差。在一些实施方案中,每个分析物的相对位置信息被确定为小于10nm中值标准偏差。在一些实施方案中,每个分析物的相对位置信息被确定为小于10nm中值2x标准偏差。在一些实施方案中,每个分析物的相对位置信息被确定为小于10nm中值3x标准偏差。
[0214]
根据来自不同循环的区域的峰文件的子集,生成定位文件以确定分析物在阵列上的位置。如图11所示,在一些实施方案中,首先使用点扩展函数对峰文件进行归一化,以考虑光学系统中的像差。归一化峰文件可用于基于峰文件中提供的位置和强度信息生成人工归一化图像。然后对准每个图像。在一些实施方案中,可以通过关联每个图像对并执行精细拟合来执行对准。一旦对准,来自每个循环的每个分析物的位置信息然后可以被叠加,以提供基底上的位置测量的分布。该分布用于确定提供分析物在基底上的高度精确的相对位置的单个峰位置。在一些实施方案中,泊松分布被应用于每个分析物的叠加位置以确定单个峰。
[0215]
然后,根据来自所述循环的位置信息的至少一个子集确定的峰被记录在定位文件
中,所述定位文件包括以低于衍射极限的精度测量每个检测到的分析物的相对位置。如上所述,仅需要来自循环子集的图像来确定该信息。
[0216]
如图11所示,对于每个循环和颜色,来自每个区域的归一化峰文件和归一化定位文件可用于生成来自区域的每个图像相对于区域的参考图像的偏移信息。该偏移信息可用于改进分析物在每个原始图像中的相对位置确定的精度,以进一步改进来自密集聚集的基底和衍射受限图像的信号鉴定。在一些实施方案中,该偏移信息被存储为区域对准文件。在一些实施方案中,来自组合的定位文件和区域对准文件的区域中的每个分析物的位置信息小于10nm rms、小于5nm rms、或小于2nm rms。
[0217]
在一些实施方案中,通过确定相对于来自区域的主文件的偏移信息来对来自单个区域的图像进行对准来生成区域对准文件。为每个区域生成一个区域对准文件。该文件由来自所有循环的区域的所有图像生成,并且包括区域的所有图像相对于来自区域的参考图像的偏移信息。
[0218]
在一些实施方案中,在对准之前,利用点扩展函数对每个峰文件进行归一化,随后根据归一化的峰文件生成人工图像并对人工图像进行傅里叶变换。然后将归一化峰文件的人工图像的傅里叶变换与来自对应区域的归一化定位文件的人工图像的傅里叶变换的复共轭进行卷积。对于每个循环的每个峰文件都要这样做。所得到的文件然后经历逆傅里叶变换以重新生成图像文件,并且所述图像文件相对于来自所述区域的参考文件对准以生成每个图像文件的偏移信息。在一些实施方案中,该对准包括相对于参考文件的精细拟合。
[0219]
区域对准文件因此包含每个过采样图像的偏移信息,并且可以与对应区域的定位文件结合使用,以生成每个分析物的高度精确的相对位置,以用于后续的“提取强度”操作。
[0220]
作为在区域上执行20个循环,并且针对要检测的4种颜色中的每一种生成一个图像,从而生成该区域的80个图像的示例,针对从该区域拍摄的所有80个图像(20个循环*4种颜色)生成一个区域对准文件。在一些实施方案中,区域对准文件内容包括:区域、对每个图像观察到的颜色、循环检测中的操作类型(例如,结合或剥离)以及相对于参考图像的图像偏移坐标。
[0221]
在一些实施方案中,在对准过程期间,计算对准2个图像所需的xy“移位”或“残差”,并且对剩余图像重复该过程,计算应用于所有图像的最佳拟合残差。
[0222]
在一些实施方案中,抛弃超过阈值的残差,并且重新计算最佳拟合。重复这一过程,直到所有单个残差都在阈值内。
[0223]
然后使用来自定位文件的精确位置信息和来自区域对准文件的偏移信息对每个过采样图像进行反卷积。强度提取操作的实施方案示于图10c和图11中。各种分子的点扩散函数(psf)叠加是因为中心到中心的间距很小,以至于来自相邻分析物的信号的点扩散函数叠加。与精确分析物位置信息和/或偏移信息相结合的最近邻变量回归可用于对来自相邻分析物的信号进行反卷积,所述相邻分析物具有中心到中心的距离,所述中心到中心的距离由于衍射极限而抑制分辨率。每个分析物的精确相对位置信息的使用促进了来自衍射极限以下的相邻分析物的光学信号的空间反卷积。在一些实施方案中,相邻分析物的相对位置被用于确定相邻分析物之间的精确中心到中心距离,其可与光学系统的点扩展函数组合使用,以估计相邻分析物之间的空间串扰,用于对来自每个单独图像的信号进行反卷积。这使得分析物密度低于衍射极限的基底能够用于光学检测技术,如多核苷酸测序。
[0224]
在某些实施方案中,发射光谱在不同信号之间叠加(即“串扰”)。例如,在合成测序过程中,测序过程中使用的四种染料典型地在发射光谱上有一些叠加。
[0225]
在特定实施方案中,当在不同颜色通道之间发生串扰并且当串扰对于不同图像集不同时,通过串扰回归结合每个过采样图像的定位和区域对准文件来解决将颜色(例如,碱基调用)分配给在循环内获得的图像集中的不同特征的问题,以从来自所使用的每个不同可检测标记的光学信号中去除叠加的发射光谱。这进一步增加了对与基底上的每个分析物结合的每个探针的可检测标记标识的鉴定的准确性。
[0226]
因此,在一些实施方案中,如本文所公开的,从来自循环的区域的单个图像鉴定信号和/或其强度使用以下特征:1)过采样的图像

在定义的位置提供强度和信号。2)精确的相对位置

定位文件(根据来自至少一个循环子集的信息提供位置信息)和区域对准文件(提供区域中所有图像的偏移/对准信息)。3)图像处理

使用区域中每个分析物的精确相对位置信息进行最近邻变量回归(空间反卷积)和串扰回归(发射光谱反卷积)。每种分析物的探针(如检测用抗体或测序用互补核苷酸)的精确鉴定。图像处理模拟
[0227]
在图12a、图12b、图13a和图13b所示的模拟串扰曲线图中示出了本文所公开的方法和系统的效果。对于这些图中的每个,示出了在10um x 10um区域内与每个检测到的分析物处的四个荧光团之一相关的发射光谱强度的串扰图。对应于四个荧光团之一的每个轴延伸到绘图的每个角落。因此,位于图中心的一个点可能具有来自所有四个荧光团的相等强度贡献。在成像循环期间从单个荧光团检测到的发射强度被分配以在朝向x、y的方向上移动斑点;x、

y;

x、y;或

x、

y。因此,沿着这四个轴的斑点群的分离表明在分析物位置处有来自荧光团的清晰的反卷积信号。每个模拟基于10.075um x 10.075um区域中1024个分子的检测,这表示密度为10.088个分子/平方微米,或分子之间的平均中心到中心距离约为315nm。这与在小于约200nm x 200nm的像素尺寸下的约62x62像素的成像区域相关。
[0228]
在一些实施方案中,分子之间的平均中心到中心距离为约150nm至约500nm。在一些实施方案中,分子之间的平均中心到中心距离为约150nm至约175nm、约150nm至约200nm、约150nm至约225nm、约150nm至约250nm、约150nm至约275nm、约150nm至约300nm、约150nm至约325nm、约150nm至约350nm、约150nm至约375nm、约150nm至约400nm、约150nm至约500nm、约175nm至约200nm、约175nm至约225nm、约175nm至约250nm、约175nm至约275nm、约175nm至约300nm、约175nm至约325nm、约175nm至约350nm、约175nm至约375nm、约175nm至约400nm、约175nm至约500nm、约200nm至约225nm、约200nm至约250nm、约200nm至约275nm、约200nm至约300nm、约200nm至约325nm、约200nm至约350nm、约200nm至约375nm、约200nm至约400nm、约200nm至约500nm、约225nm至约250nm、约225nm至约275nm、约225nm至约300nm、约225nm至约325nm、约225nm至约350nm、约225nm至约375nm、约225nm至约400nm、约225nm至约500nm、约250nm至约275nm、约250nm至约300nm、约250nm至约325nm、约250nm至约350nm、约250nm至约375nm、约250nm至约400nm、约250nm至约500nm、约275nm至约300nm、约275nm至约325nm、约275nm至约350nm、约275nm至约375nm、约275nm至约400nm、约275nm至约500nm、约300nm至约325nm、约300nm至约350nm、约300nm至约375nm、约300nm至约400nm、约300nm至约500nm、约325nm至约350nm、约325nm至约375nm、约325nm至约400nm、约325nm至约500nm、约350nm至约375nm、约350nm至约400nm、约350nm至约500nm、约375nm至约400nm、约375nm至约500nm或
约400nm至约500nm。在一些实施方案中,分子之间的平均中心到中心距离为约150nm、约175nm、约200nm、约225nm、约250nm、约275nm、约300nm、约325nm、约350nm、约375nm、约400nm或约500nm。在一些实施方案中,分子之间的平均中心到中心距离为至少约150nm、约175nm、约200nm、约225nm、约250nm、约275nm、约300nm、约325nm、约350nm、约375nm或约400nm。在一些实施方案中,分子之间的平均中心到中心距离为至多约175nm、约200nm、约225nm、约250nm、约275nm、约300nm、约325nm、约350nm、约375nm、约400nm或约500nm。
[0229]
图12a示出了从原始图像检测到的光学信号中四个荧光团之间荧光团强度的串扰图。图12b和图13a均示出了通过生成4x过采样图像实现的四个荧光团之间的分离,表明在每个分析物处实现了一定程度的串扰去除。图13b示出了相同成像区域的串扰曲线图,但具有如图11所示并在此描述的执行的反卷积和最近邻回归。与图13a和图12a相比,检测到的每种分析物显示其光学信号与其他荧光团的清晰分离,表明每种分析物的荧光团鉴定高度精确。
[0230]
图14a和图14b示出了如上模拟的每个检测到的10.075μm x 10.075um区域的模拟四色复合。这在视觉上表示原始图像(图14a)和如本文所述处理的图像(图14b)的分析物之间的清晰度。测序
[0231]
上述和图11中描述的方法也有助于通过合成测序进行测序,所述合成测序使用光学检测结合到包含密集聚集的多核苷酸的基底上生长的互补链中的互补可逆终止子。因此,可以使用本文所述的方法和光学检测系统可靠地检测与以衍射极限以下的中心到中心距离的相邻多核苷酸序列相关的信号。测序期间的图像处理还可以包括基于在基底上重复的克隆序列或基于数据本身的先前循环回归,以校正测序反应或检测中的错误。在一些实施方案中,沉积在用于测序的基底上的多核苷酸是串联体。串联体可以包含多个相同拷贝的待测序多核苷酸。因此,由本文描述的方法和系统鉴定的每个光学信号可以指来自掺入核苷酸的单个可检测标记(例如荧光团),或者可以指结合到单个串联体上的多个位置的多个可检测标记,使得信号是来自多个位置的平均值。可能发生的分辨率可能不是在单个可检测标记之间,而是在沉积到基底上的不同串联体之间。
[0232]
在一些实施方案中,待测序的分子(单拷贝或多拷贝)可以使用共价连接、通过杂交捕获表面上的寡核苷酸或通过其他非共价结合而结合到表面上。结合的分子可能会在表面保留数百个循环,并且在剥离初始测序引物后,可以用不同的引物组重新询问,以确认特定变体的存在。
[0233]
在一个实施方案中,可以使用化学反应除去荧光团和封闭基团。
[0234]
在另一个实施方案中,可以使用uv光除去荧光基团和封闭基团。
[0235]
在一个实施方案中,待测序的分子可以沉积在具有50

100nm直径的反应表面上,并且这些区域可以以150

300nm的间距间隔开。这些分子可能具有条形码,附着在其上用于靶反卷积和用于启动测序的测序引物结合区。缓冲液可含有适当量的dna聚合酶以使延伸反应得以进行。这些可包含通过任何可用的基因扩增方法(pcr、全基因组扩增等)产生的待测序靶的10

100拷贝。
[0236]
在另一个实施方案中,用条形码和引物退火位点标记的单个靶分子可以沉积在直径为20

50nm的反应表面上,以60

150nm的间距间隔开。分子可以单独测序。
[0237]
在一个实施方案中,引物可以结合到靶,并且可以使用单个或多个荧光团一次使用一个dntp延伸;表面可以成像,荧光团可以被去除和洗涤,并且重复该过程以产生第二延伸。在同一dntp上存在多个荧光团可使得能够定义存在于基因组的某些区域(2至5个或更多)中的重复核苷酸的数目。
[0238]
在一个不同的实施方案中,在引物退火之后,所有四个具有荧光团和封闭的3’羟基的dntp可用于聚合酶延伸反应,表面可成像并去除荧光团和封闭基团,并且重复该过程多个循环。
[0239]
在另一个实施方案中,序列可基于连接反应推断,所述连接反应退火基于特定核苷酸在给定位置的存在而连接的特定探针。
[0240]
可以使用随机阵列,其可以比使用上述技术的现有技术的随机阵列具有改进的密度,然而随机阵列通常具有4x到10x减少的有序阵列的面密度。随机阵列的优点包括用于芯片的均匀的、非图案化的表面和使用较短的核酸链,因为不需要依赖较长链的排除特性。计算机系统
[0241]
本公开提供被编程以实现本公开的方法的计算机系统。图28示出了计算机系统2801,其被编程或以其他方式配置为指导本文所述的方法并利用本文所述的系统。计算机系统2801可以调节本公开的各个方面,诸如,例如,指导本文所述的探针结合的循环。计算机系统2801可以是用户的电子设备或相对于电子设备远程定位的计算机系统。电子设备可以是移动电子设备。
[0242]
计算机系统2801包括中央处理单元(cpu,本文也称为“处理器”和“计算机处理器”)2805,其可以是单核或多核处理器,或者是用于并行处理的多个处理器。计算机系统2801还包括存储器或存储器位置2810(例如,随机存取存储器、只读存储器、闪存),电子存储单元2815(例如,硬盘),用于与一个或多个其他系统通信的通信接口2820(例如,网络适配器),以及外围设备2825,例如高速缓存、其他存储器、数据存储和/或电子显示适配器。存储器2810,存储单元2815,接口2820和外围设备2825通过通信总线(实线)如母板与cpu 2805通信。存储单元2815可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统2801可以借助于通信接口2820可操作地耦合到计算机网络(“网络”)2830。网络2830可以是因特网、内联网和/或外联网、或者与因特网通信的内联网和/或外联网。在一些情况下,网络2830是电信和/或数据网络。网络2830可以包括一个或多个计算机服务器,其可以启用分布式计算,例如云计算。网络2830在一些情况下借助于计算机系统2801可实现对等网络,其可使耦合到计算机系统2801的设备表现为客户端或服务器。
[0243]
cpu 2805可以执行一系列机器可读指令,其可以具体化在程序或软件中。指令可以存储在存储器位置中,例如存储器2810中。可以将指令引导到cpu 2805,cpu 2085随后可以程序化设定为或另外配置cpu 2805以执行本公开的方法。由cpu 2805执行的操作的例子可以包括获取,解码,执行和回写。
[0244]
cpu 2805可以是电路例如集成电路的一部分。系统2801的一个或多个其他组件可以包括在电路中。在一些情况下,该电路是专用集成电路(asic))。
[0245]
存储单元2815可以存储文件,例如驱动程序、库和保存的程序。存储单元2815可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统2801可以包括在计算机系统2801外部的一个或多个附加数据存储单元,例如位于通过内联网或因特网与计算机
系统2801通信的远程服务器上。
[0246]
计算机系统2801可以通过网络2830与一个或多个远程计算机系统通信。例如,计算机系统2801可以与用户的远程计算机系统通信。远程计算机系统的例子包括个人计算机(例如便携式pc)、触屏电脑或平板电脑(例如,galaxytab)、电话、智能电话(例如,iphone、支持android的设备、)或个人数字助理。用户可以经由网络2830访问计算机系统2801。
[0247]
本文中描述的方法可以通过存储在计算机系统2801的电子存储位置上,如例如在存储器2810或电子存储单元2815上的机器(例如,计算机处理器)可执行代码来实现。机器可执行代码或机器可读代码可以以软件的形式提供。在使用期间,代码可以由处理器2805执行。在一些情况下,可以从存储单元2815取回代码并将其存储在存储器2810上以供处理器2805随时访问。在一些情况下,可以排除电子存储单元2815,并且机器可执行指令存储在存储器2810上。
[0248]
可以预编译和配置代码以用于具有适于执行代码的处理器的机器,或者可以在运行时期间编译。代码可以以编程语言提供,可以选择该编程语言使代码能够以预编译或如编译的方式执行。
[0249]
本文提供的系统和方法的各方面,例如计算机系统2801,可以具体化在编程中。该技术的各个方面可以被认为是通常以一种类型的机器可读介质中承载或具体化的机器(或处理器)可执行代码和/或相关数据的形式的“产品”或“制品”。机器可执行代码可以存储在电子存储单元,例如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘上。“存储”型介质可以包括计算机的有形存储器、处理器等、或其相关模块,例如各种半导体存储器、磁带驱动器、磁盘驱动器等的任何一个或全部,其可以随时提供非暂时性存储用于软件编程。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。例如,这类通信可以使软件从一个计算机或处理器加载到另一个计算机或处理器,例如,从管理服务器或主计算机加载到应用服务器的计算机平台。因此,可以承载软件元件的另一种类型的介质包括光波、电波和电磁波,例如跨本地设备之间的物理接口,通过有线和光学陆线网络以及通过各种空中链路使用的。携带这类波的物理元件,例如有线或无线链路、光链路等,也可以被认为是承载软件的介质。如本文所使用的,除非限定为非暂时性的有形“存储”介质,诸如计算机或机器“可读介质”之类的术语是指参与向处理器提供指令以供执行的任何介质。
[0250]
因此,机器可读介质如计算机可执行代码可以采用许多形式,包括但不限于,有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,如任何计算机等中的任何存储设备,如可用于实现附图中所示的数据库等。易失性存储介质包括动态存储器,例如这类计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括在计算机系统内构成总线的线。载波传输介质可以采用电或电磁信号,或声波或光波的形式,例如在射频(rf)和红外(ir)数据通信期间产生的那些。因此,计算机可读介质的常见形式包括,例如:软盘(floppy disk)、软磁盘(flexible disk)、硬盘、磁带、任何其他磁介质、cd

rom、dvd或dvd

rom,任何其他光学介质、穿孔卡纸带、任何其他带孔图案的物理存储介质、ram、rom、prom和eprom、flash

eprom、任何其他存储器芯片或盒式磁带、传输数据或指令的载波、传输此类载波的电缆或链路或计算机可从中读取编程代码和/或数据的任何其
他介质。许多这些形式的计算机可读介质可涉及将一个或多个指令的一个或多个序列传送到处理器以供执行。
[0251]
计算机系统2801可以包括电子显示器2835或与电子显示器2835通信,电子显示器2835包括用户界面(ui)2840,用于提供例如本文提及的可检测信号序列或本文提及的分析物的标识或本文公开的分析物的位置或本文公开的任何其他信息。ui的例子包括但不限于图形用户界面(gui)和基于web的用户界面。
[0252]
可以通过一种或多种算法来执行本公开的方法和系统。可以在由中央处理单元2805执行时通过软件实现算法。算法例如可以指导本文公开的光学模块捕获图像或指导探针结合。等同物和范围
[0253]
本领域技术人员将认识到或者仅通过常规实验就能够确定与在此描述的根据本公开的特定实施方案的许多等同物。本公开的范围不旨在限于以上描述,而是如所附权利要求书中所阐述。
[0254]
在权利要求中,冠词如“一个”、“一种”以及“该”可以表示一个或多个,除非指明与此相反或另外地从上下文中是显然的。如果组的一个、多于一个或全部成员存在于、使用于或另外相关于给出的产品或流程,则在该组的一个或多个成员之间包括“或者”的权利要求或说明书被认为是满意的,除非有相反的指明或另外从上下文明显可见。本公开包括在给定产品或方法中存在、使用或以其他方式与给定产品或方法相关的组的确切一个成员的实施方案。本公开包括其中多于一个或全部组成员存在于给定产品或方法中、使用于给定产品或方法中或以其他方式与给定产品或方法相关的实施方案。
[0255]
在给定范围的情况下,包括端点。此外,应理解的是,除非另外指出或从上下文和本领域普通技术人员的理解中显而易见,否则以范围表示的值在本发明的不同实施方案中可以假定为所述范围内的任何特定值或子范围,至所述范围的下限的单位的十分之一,除非上下文另有明确规定。
[0256]
将所有引用的来源,例如,参考文献、公开物、数据库、数据库条目、和在此引用的技术,通过引用并入本技术中,即使在引文中没有明确说明。在引用来源和本技术的相互矛盾的说法的情况下,本技术中的说法应当为准。
[0257]
章节和表格标题不旨在为限制性的。实施例
[0258]
下面是用于实现本发明的具体实施方案的实施例。所提供的示例仅用于说明性目的,并不意在以任何方式限制本发明的范围。虽然已努力确保关于所用数字(例如量、温度等)的准确性,但当然仍应允许一些实验误差和偏差。
[0259]
除非另有说明,本公开内容的实践可以采用本领域技术范围内的蛋白质化学、生物化学、重组dna技术和药理学的常规方法。此类技术在文献中有充分说明。参见例如,t.e.creighton,proteins:structures and molecular properties(w.h.freeman and company,1993);a.l.lehninger,biochemistry(worth publishers,inc.,现行版);sambrook,et al.,molecular cloning:a laboratory manual(第2版,1989);methods in enzymology(s.colowick和n.kaplan编辑,academic press,inc.);remington’s pharmaceutical sciences,第18版(easton,pennsylvania:mack publishing company,
1990);carey和sundberg advanced organic chemistry第3版(plenum press)卷a和b(1992)。实施例1:分子的密集聚集
[0260]
下面的方法将描述如何利用间距范围在200nm和333nm之间的正方形有序阵列。将描述允许更小间距的另外方法。在2018年3月2日提交的国际申请pct/us2018/020737中描述了成像系统,该国际申请通过引用并入本文,其将用作实现亚衍射极限成像的参考系统。光学系统可包括多个2,048乘2,048像素的摄像机,其工作频率高达每秒100hz帧(fps),视场大小为332.8um乘332.8um。这套系统能够在90fps及以上测量低至单一荧光。使用此系统,在85fps时每分子有1

10个拷贝(或1

10个荧光团)可在15分钟内达到所需通量以使63mm x 63mm载玻片成像。通过使用两个芯片或通过将单个芯片划分为至少2个区域,连续且同时执行生物化学循环和成像。实施例2:用合成测序法进行单分子测序
[0261]
在apton系统上评价了用合成测序法的单分子测序。为了验证方法学,首先将带有5’磷酸基的单链dna模板通过edc(1

乙基
‑3‑
(3

二甲基氨丙基)碳二亚胺)化学连接到具有流动池的替卡酰肼活化硅表面的芯片上。测序引物是与沉积在表面的靶退火。在我们最初的研究中使用的测序模板包括合成的含有egfr l858r、egfr t790m和braf v600e突变的寡核苷酸和两个从ercc 00013和ercc 00171对照rna转录物反转录的cdna样品。在dna模板固定化和引物退火后,流动池被加载在apton仪器上进行测序反应,这涉及多个循环的酶促单核苷酸掺入反应、成像检测荧光染料检测,随后是化学裂解。用来自neb的therminator ix dna聚合酶进行单碱基延伸反应,该酶是一种9
°
ntm dna聚合酶变异体,具有更强的掺入修饰的双脱氧核苷酸的能力。反应中使用的四种dntp被4种不同的可裂解荧光染料标记并在3
’‑
oh上被一个可裂解部分(来自mychem的dctp

af488、datp

afcy3、dttp

texred和dgtp

cy5)封闭。在每个测序反应循环中,由于dntp上的3
’‑
封闭基团,单个经标记的dntp被掺入,并且反应终止。在dntp掺入后,通过洗涤将未掺入的核苷酸从流动池中除去,并将掺入的荧光染料标记的核苷酸成像以鉴定碱基。捕获图像后,使用100mm tcep((三(2

羧乙基)膦),ph9.0)从掺入的核苷酸上裂解荧光染料和封闭部分,允许在下一个循环中随后添加下一个互补核苷酸。然后重复该延伸、检测和裂解循环以增加读段长度。
[0262]
图15a示出了对应于包含等量突变型和野生型(wt)靶点的egfr基因中密码子790附近区域的合成寡核苷酸模板的1:1混合物的测序结果。染料标记的核苷酸的掺入图像用于对合成模板进行测序,所述合成模板对应于egfr基因第790密码子附近的第一个碱基突变的区域(wt中的c掺入和突变体中的t掺入)。图15a中的剪辑图像描绘了碱基掺入和裂解循环交替的图像。该数据显示了该系统检测10个碱基掺入循环的能力。箭头表示观察到的碱基变化。
[0263]
所用的人工合成寡核苷酸长约60个核苷酸。使用具有在密码子790突变前一个碱基终止的序列的引物来启动延伸n反应。在dna聚合酶掺入核苷酸后和与tcep发生裂解反应后对表面进行成像。黄色圆圈表示模板分子的位置,该模板分子使用10个连续的染料掺入循环的数据对准。分子通过已知的颜色掺入序列来鉴定,然后通过人工密集的视觉检查来鉴定实际的碱基掺入。
[0264]
用染料标记的核苷酸对从rna模板产生的cdna进行测序。所使用的rna是由克隆的
gca gaa gac ggc ata cga gat)引物的50:50混合物,10um:
[0272]
在以下条件下进行pcr扩增:5mm(94℃),然后进行以下的35次循环:94℃,15秒;55℃,30秒;和68℃,30秒。将扩增产物的等分试样在2%凝胶上运行,以验证文库分子大小(在本例中为300

500个碱基对)。然后根据制造商的方案使用自旋柱(thermofisher)纯化pcr扩增产物。靶dna的环化
[0273]
然后在表2所述的反应混合物中通过连接使纯化的pcr扩增产物进行单链环化:
[0274]
桥接寡核苷酸序列为tcg gtg gtc gcc gta tca ttc aag cag aag acg gca tac gag at。
[0275]
连接是在以下条件下进行:95℃30秒,然后进行以下的40次循环:95℃,15秒;55℃,2分钟;62℃,3分钟。
[0276]
连接后,加入外切核酸酶i和外切核酸酶iii(new england biolabs)各1μl,反应在37℃中再孵育45分钟,在85℃中再孵育30分钟。用zymo

spintm柱(oligo clean&concentratortm试剂盒zymo research,irvine,ca)使用制造商的方案纯化所得材料。纯化后,使用qubit 2.0荧光仪(thermofisher)和quant

it (thermofisher)测量浓度,使用已知浓度的寡核苷酸定制校准样品。从环状dna形成串联体
[0277]
在表3中描述的反应混合物中形成包含靶序列的环状dna的串联体:
[0278]
引物溶液为引物(atc tcg tat gcc gtc ttc tgc ttg)在3x反应缓冲液中的750nm悬浮液。10x反应缓冲液为:500mm tris

hc1,100mm(nh4)2so4,40mm dtt,100mm mgc12,ph 7.5@25℃。
[0279]
将环模板 引物混合液在90℃中孵育10mm,然后在30℃中孵育30min。然后如表3所示加入预加热酶混合物90mm。加入反应失活缓冲液使反应停止,并在4℃中保存。
[0280]
然后将串联体库层叠在基底上,以形成与基底表面结合的密集聚集的随机分布的层,随后通过成像和图像处理对结合的串联体进行测序,并分析数据,如图23b所示和如下所述。
[0281]
将1微升测序底物与19ul柠檬酸磷酸盐缓冲液混合,将10ul加载到定制生物芯片上并孵育过夜。然后用柠檬酸磷酸盐缓冲液洗涤芯片2x,用磷酸钾缓冲液洗涤芯片2x,用na wash 3缓冲液洗涤芯片2x。
[0282]
将荧光探针结合到与芯片表面结合的串联体层上以确定标识。示出密度的图像如图25a

图25c所示。图25d示出了根据本文所述方法(apton

对照靶)的1侧串联体层的测量密度和在较高密度下的模拟分布(apton

sim)的曲线图。实施例5:测序大肠杆菌读段成像/测序
[0283]
用标准测序化学方法进行合成测序。将包含密集聚集的串联体层的芯片装入aptonbio测序仪中,并在60℃中用wash1(20mm tris

hc1,10mm(nh4)2so4,10mm kc1,2mm mgso4,0.1%100,ph 8.8@25℃,50mm nacl)洗涤6x 5mm。将测序寡核苷酸(atc tcg tat gcc gtc ttc tgc ttg)在杂交缓冲液中稀释至100nm,孵育1x 1mm,然后在60℃中孵育2x10mm,在杂交操作之间用wash1洗涤。然后进行以下8个操作的三十二个循环:
[0284]1‑
裂解:在60℃中225秒,使用表4中的缓冲液
[0285]2‑
洗涤:在30℃中在ph8磷酸盐缓冲液中240秒。
[0286]3‑
成像:wash2(20mm tris

hc1、5mm抗坏血酸(ph 8.8)
[0287]4‑
洗涤:wash1,在60℃中
[0288]5‑
延伸:在60℃中450秒,使用表5中的缓冲液0℃中450秒,使用表5中的缓冲液
[0289]6‑
洗涤:wash 1,在30℃中
[0290]7‑
洗涤:在30℃中在ph8的磷酸盐缓冲液中2min。
[0291]8‑
成像:wash 2。
[0292]
结果:
[0293]
30

40bp的读段如图27a所示。20

25bp的读段如图27b所示。
[0294]
图27c所示的交汇图示出了大肠杆菌测序的单个斑点的碱基调用的分辨。
[0295]
尽管本文已经示出并描述了优选的实施方案,但对于本领域技术人员显而易见的
是,这些实施方案仅以示例的方式提供。本发明不受说明书中提供的具体实施例的限制。尽管已经参照上述说明书描述了本发明,但是本文实施例的描述和说明不意味着以限制的意义来解释。在不脱离所公开的实施方案的情况下,本领域技术人员现将会想到很多变化、改变和替代。此外,应当理解,本发明的所有方面不限于本文所述的具体描述、配置或相对比例,其取决于各种条件和变量。应当理解,在实施本发明时可以采用本文所述的本发明实施例的各种替代方案。因此,可以预期本发明还将覆盖任何这样的替代、修改、变化或等效物。旨在以下述权利要求限定实施方案的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同物。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献