一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

平行核酸分析方法与流程

2022-09-08 09:31:52 来源:中国专利 TAG:

平行核酸分析方法
1.本发明涉及平行核酸分析领域。


背景技术:

2.在短短几个月内,新出现的冠状病毒sars-cov2导致了covid-19全球大流行病。世界在等待有效且可规模化的疫苗接种和抗病毒疗法,同时,必须尽可能好地控制covid-19。为此,有两种措施可用,即保持社交距离(例如通过封锁措施)和用于接触者追踪和随机监视的分子测试。然而,检测活动性疾病(即从拭子、漱口液、痰液或唾液中检测病毒rna的存在)的分子方法目前成本高昂,并且受到设备和试剂供应短缺的阻碍。可以通过在混并的(pooled)rna提取物中进行pcr检测来实施大规模测试(ben-ami et al.,clinical microbiology and infection 2020,26:1248-1253)。但是,这种混并方法可能需要重新测试以识别阳性测试池中的单个阳性样本。为了在多重(multiplex)方法中识别单个样本,将样本来源的dna通过特定的核苷酸序列进行条码化(dao thi et al.,sci.transl.med.2020;12:eabc7075)。病毒序列伴随条码序列一起被确定,从而建立各个样本中病毒存在的联系。然而,一般而言,多路技术会降低测定的灵敏度和/或提高病毒遗传物质的检测限(visseaux et al.,j clin micr 2020,58(8):e00630-20)。
3.仍然需要进一步增加测试能力,同时降低测试成本,并且优选还保持或提高测试灵敏度。本发明的目标是提高大规模测试能力以满足这些需求。


技术实现要素:

4.本发明提供了一种检测多个样本中目标核酸的方法,该方法包括以下步骤:a)在用于每个样本的单独容器中提供来自多个样本的分析物核酸,其中所述容器布置成子集阵列,其中所述阵列包括两个或更多个子集;b)使用与所述分析物核酸杂交的至少一对引物对通过引物延伸反应扩增核酸,其中引物对包含正向引物和反向引物,其中所述正向引物和反向引物均分别包含接头序列、样本标识符序列和用于与所述分析物核酸杂交的结合序列;c)将两个或更多个子集的容器的步骤b)的扩增的核酸组合成组合容器的阵列,其中一个子集而非另一子集的容器组合成组合容器;d)使用与步骤c)的组合容器的所述扩增的核酸杂交的至少一对另外的引物对通过引物延伸反应扩增核酸,其中另外的引物对包含另外的正向引物和另外的反向引物,其中所述另外的正向引物和另外的反向引物均包含子集标识符序列和用于与所述接头序列杂交的序列;e)确定步骤d)扩增的核酸的序列;f)通过与具有所述子集标识符序列和所述样本标识符序列的子集和容器相关联,将步骤e)的确定的目标核酸序列分配给样本。
5.本发明进一步提供了适用于本发明方法的引物组。这种组可以包括:至少10个不同的引物a,该至少10个不同的引物a从5’到3’包含序列:接头a序列、长度至少为4nt的标识符序列、和靶结合序列,其中在所述至少10个不同的引物a中所述标识符序列是不同的,可选地具有至少为1的汉明距离(hamming distance)或至少为1的编辑距离(levenshtein distance)的序列距离;至少10个不同的引物b,该至少10个不同的引物b从5'到3'包含序
列:接头b序列、长度至少为4nt的标识符序列、和靶结合序列,其中在所述至少10个不同的引物b中所述标识符序列是不同的,可选地具有至少为1的汉明距离或至少为1的编辑距离的序列距离;至少10个不同的引物c,该至少10个不同的引物c从5'到3'包含序列:接头c序列、长度至少为4nt的标识符序列、和与所述接头a序列结合的结合序列,其中在所述至少10个不同的引物c中所述标识符序列是不同的,可选地具有至少为1的汉明距离或至少为1的编辑距离的序列距离;以及至少10个不同的引物d,该至少10个不同的引物d从5'到3'包含序列:接头d序列、长度至少为4nt的标识符序列、和与所述接头b序列结合的结合序列,其中在所述至少10个不同的引物d中所述标识符序列是不同的,可选地具有至少为1的汉明距离或至少为1的编辑距离的序列距离。
6.在优选的实施方式中,目标核酸是rna,例如来自rna病毒。该方法包括在步骤a)中将rna转化为cdna。因此,本发明的方法也可以写成检测多个样本中包括核糖核酸(rna)的目标核酸的方法,该方法包括以下步骤:a)在用于每个样本的单独容器中提供来自多个样本的分析物核酸,其中所述容器布置成子集阵列,其中所述阵列包括两个或更多个子集;包括逆转录rna,从而产生rna的互补dna作为分析物核酸;b)使用与所述分析物核酸杂交的至少一对引物对通过引物延伸反应扩增核酸,特别是dna,其中引物对包含正向引物和反向引物,其中所述正向引物和反向引物均分别包含接头序列、样本标识符序列和用于与所述分析物核酸杂交的结合序列;其中所述扩增优选地是dna特异性的和/或使用dna聚合酶的;c)将两个或更多个子集的容器的步骤b)的扩增的核酸组合成组合容器的阵列,其中一个子集而非另一子集的容器组合成组合容器;d)使用与步骤c)的组合容器的所述扩增的核酸杂交的至少一对另外的引物对通过引物延伸反应扩增核酸,其中另外的引物对包含另外的正向引物和另外的反向引物,其中所述另外的正向引物和另外的反向引物均包含子集标识符序列和用于与所述接头序列杂交的序列;e)确定步骤d)扩增的核酸的序列;f)通过与具有所述子集标识符序列和所述样本标识符序列的子集和容器相关联,将步骤e)的确定的目标核酸序列分配给样本。
7.本发明的公开内容同样涉及本发明的所有方面,例如,方法的描述也涉及作为该组的适用性或该组的用途;同样,该组的描述也涉及其可在该方法中使用的组件。特别地,引物a和b可以用作正向引物和反向引物;引物c和d可以用作另外的正向引物和另外的反向引物。
具体实施方式
8.本发明提供了一种检测多个样本中目标核酸的方法。这种目标核酸可以例如来自病原体,例如病毒、细菌或真菌,因此用于通过其核酸检测所述病原体。这允许将该方法用于诊断与病原体存在相关的疾病。
9.通常,目标核酸是预先选择的,即通过使用与目标核酸结合的引物预先选择。因此,本发明的方法可用于检测特定目标病原体的存在。
10.本发明的方法通常在体外进行,即根据本发明离体分析样本和/或在先前已从中获得样本的对象体外分析样本。
11.从中获得样本的对象可以是例如人或非人动物,例如哺乳动物、鸟类或爬行动物。优选地,对象是哺乳动物,特别是人。
12.样本可以来自或包含生物样本,例如体液,例如痰液、唾液、鼻粘液、支气管肺泡灌洗液、尿液、血清或血液样本。这种含有痰液、唾液或鼻粘液的样本可以从鼻咽拭子、口咽拭子、鼻拭子、漱口液获得或将痰液提供到容器中获得。更通常,样本可以是固体样本、液体样本或气态呼出气体中携带的气溶胶。
13.目标核酸可以从生物样本、细胞或包囊(例如病毒包囊)中释放出来,从而使其在溶液中可用于进一步处理。这种释放可以包括从致病源中去除,例如通过病原体的分解,这可以包括病毒分解或细菌或真菌的裂解或成孔(porosis)。可选地,通过例如去除和/或灭活任何会降解或消化目标核酸的酶来稳定目标核酸。例如,如果目标核酸是dna或包含dna,则可以添加dnase抑制剂,或者如果目标核酸是rna或包含rna,则可以添加rnase抑制剂。组合起来或作为替代方案,可以通过升高的温度或化学物质来处理样本,例如以足以灭活这些不需要的酶如dnase和/或rnase的强度和时间来处理。
14.如上所述,目标核酸可以是dna或rna,优选地目标核酸包含rna或由rna组成。
15.目标核酸,例如如上所述从生物样本、细胞或包囊中释放的核酸,可以用作本发明方法中的分析物核酸。在进一步的实施方式中,核酸可以被进一步处理、复制或转化为另一种类型的核酸,例如从生物样本的rna产生cdna。cdna可以通过逆转录产生。然后可以将cdna用作本发明方法中的分析物核酸。进一步的修饰可以是将来自样本的核酸片段化。
16.在本发明的优选实施方式中,病毒rna是目标核酸。此类病毒rna从病毒荚膜(例如衣壳或包膜)中释放出来,并通过进行逆转录转化为cdna。特别地,本发明可以包括在步骤a)中提供来自样本的rna并通过逆转录产生所述rna的cdna,其中在步骤b)中扩增的核酸包含所述cdna。逆转录可以通过逆转录酶进行,例如野生型或修饰的m-mlv逆转录酶,例如superscript
tm
逆转录酶,例如superscript
tm iii逆转录酶或superscript
tm iv逆转录酶。与野生型m-mlv逆转录酶相比,这种修饰的m-mlv逆转录酶在操作条件下(环境压力在1巴,50℃)优选具有降低的rnase h活性和/或增加的热稳定性。用于逆转录的示例引物可以是例如随机引物,例如随机六聚体,其是具有给定长度的可变序列的各种引物的集合。引物的示例长度为5、6、7、8、9、10、11、12、13、14或更多个核苷酸长度,优选6个核苷酸(六聚体)或优选8-12个核苷酸用于靶特异性引物。如果进行,则优选不在逆转录期间添加条码或“标识符序列”。优选在本发明方法中稍后在步骤b)和d)期间添加这种“标识符序列”,尤其是在将dna(例如,cdna)作为分析物核酸处理时。此类条码或“标识符序列”稍后可用于下游,以将确定的核酸序列连接到样本所来源的对象(因此可能感染病原体)。
17.容纳样本核酸的容器可以是适用于本发明方法的任何容纳装置。示例容器可以选自烧瓶、小瓶、袋子、注射器、或包括孔板上的微孔在内的孔、或液滴。特别地,孔板上的孔是优选的,因为它们允许在本发明方法期间易于组织、平行移液、易于处理和自动化。在被放入将用于本发明方法的优选容器中之前,样本可能已经在另一个容器中被操纵、运输和/或处理,例如以便于从患者运输到执行本发明方法的设施。
18.根据多个样本区分的每个样本至少最初在单独的容器中。当然,本发明确实包括使用混并的生物样本(例如来自多于一个对象)作为一个样本处理,但优选的是每个样本仅与一个对象相关,以单独与目标核酸相关联。
19.多个样本可以包括10个或更多个样本,例如20、50、75、100、150、200、250、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2500、3000、4000、5000、
6000、7000、8000、9000、9500、10000、12000个或更多个样本以及这些值之间的任何范围。例如,多个样本是20至1000000个样本,例如40至500000个样本或90至100000个样本。
20.在本发明方法的步骤a)中,将来自多个样本的分析物核酸提供在用于每个样本的单独的容器中。分析物核酸可以是rna或dna;优选dna,因此,分析物核酸可以包含dna或由dna组成。如果目标核酸,例如来自病原体的核酸是rna,则优选由其产生cdna以用作分析物核酸,如上所述。cdna的产生可以在之后在本发明方法中使用的同一容器中进行。在继续进行步骤b)之前,酶,如逆转录酶可以被灭活,例如通过升高温度(例如对于superscript
tm
逆转录酶为70℃或更高)。
21.容器布置成子集阵列,其中该阵列包括两个或更多个子集。“子集阵列”是指容器(具有分析物核酸)被分成至少两组(“阵列包括两个或更多个子集”)。这种布置可以是对执行本发明方法的用户可用的信息和/或由其使得子集布置显而易见的特殊分组和/或容器的标签或标记。例如,容器可以布置成子集阵列,并且子集包括在坐标处的容器。该坐标可以被记录并且其容器的信息可以被用户存储。坐标可以具有2d或3d布置,例如具有容器的一个或多个载体的行、列和/或堆叠(stack)。这种载体可以是板,例如具有作为容器的凹陷部,例如孔板。当然,可以使用任何其他形式的坐标来标识子集的容器和/或来自特定对象的样本的容器,包括油中的水基液滴。容器可能有壁或没有壁,例如在液滴的情况下。在优选的实施方式中,容器被布置成子集阵列并且子集包括在坐标处的容器。在步骤c)中组合每个子集的具有相应坐标的容器。
22.一个例子是使用两个或更多个孔板。一个孔板中的所有孔(容器)是子集,每个孔板形成其孔(容器)的一个子集。根据该示例,多个两个或更多个孔板将因此包含两个或更多个子集的阵列,其中子集数量是孔板的数量并且每个子集(单个孔板)由每个板中孔(容器)的数量或更少(如果不是所有的孔都包含分析物核酸)组成。事实上,在优选的实施方式中,这样的孔板(子集)可以使用其孔(容器)中的1-10个用于对照,因此在96孔板的情况下,少于96个孔可以用于分析物核酸。不管这个例子如何,在本发明的任何实施方式中,每个子集可以在容器中包含一个或多个对照核酸或没有核酸的空对照,在整个本发明方法中将其与具有分析物核酸的容器类似地处理。
23.在本发明的优选的实施方式中,两个或更多个子集是8个或更多个子集、10个或更多个子集,例如20个或更多个子集,例如30个或更多个子集、40个或更多个子集、50个或更多个子集、60个或更多个子集、70个或更多个子集、80个或更多个子集、或90个或更多个子集。8个子集的示例是8个pcr条孔板。
24.在同样优选的实施方式中,子集包括10个或更多个容器,优选20个或更多个容器,或30个或更多个容器,或40个或更多个容器,或50个或更多个容器,或60个或更多个容器,或70个或更多个容器,或80个或更多个容器,或90个或更多个容器。
25.子集或容器阵列的这种数量的例子是孔板,例如96孔板、384孔板或1536孔板。任何上述数量(至少2个、10个、20个等)的孔都可以用作本发明的容器或子集的成员。板上的剩余孔可以使用或不使用,例如作为对照。对于代表板的子集或通常任何此类阵列,子集的数量代表板或阵列的数量。当在步骤c)中组合子集时,它们的组合核酸也可以储存在容器中,其中每个子集组合核酸在单独的容器中。同样,在一些示例中,可以使用孔板,例如一个或多个孔包含子集组合核酸。在优选的实施方式中,该方法使用96个容器(子集大小)和96
个子集;在其他选项中,该方法使用384个容器(子集大小)和96或384个子集。这将充分利用96孔板或384孔板。1536孔板也可用于容器或子集。在任何这些实施方式中,容纳样本或子集(当在步骤d中组合时)的容器的数量可以更少以容纳如上所述的对照。
26.在本发明方法的步骤b)中,使用与所述分析物核酸杂交的至少一对引物对通过引物延伸反应来扩增核酸,其中引物对包含正向和反向引物,其中所述正向和反向引物均分别包含接头序列、样本标识符序列(“样本索引”)和用于与所述分析物核酸杂交的结合序列;
27.如上所述,分析物核酸优选是dna——因为dna已经由样本提供,或者在将rna转化为cdna之后,cdna被用作步骤b)中的分析物核酸。引物延伸反应在本领域中是常规的并且包括将引物与分析物核酸结合并以模板特异性方式用另外的核苷酸延伸引物,其中模板是分析物核酸。因此,如果样本包含适当的模板,则会生成互补链。这种反应优选用dna聚合酶进行。同样可以用另一个引物产生第二链。两种引物都被称为用于第一链和第二链生成的正向和反向引物,这在本领域中是常见的。引物延伸反应的例子是pcr。
28.可选择地,分析物核酸是rna。以rna为模板,优选生成互补dna链(也称为拷贝dna或cdna)。因此,(正向)引物优选是dna,延伸的核苷酸也是dna。这样的反应例如是逆转录,其可以通过逆转录酶来促进。然后用反向引物产生第二链是以dna为模板的dna聚合,优选地用如上所述的dna聚合酶。然后,进一步的扩增轮或扩增循环可以完全基于dna,包括使用正向引物的引物延伸反应,给反应在进一步的轮或循环中可以使用反向引物的扩增产物的产生的互补链作为模板。根据本实施方式,与前一段的区别在于,在前一段中,正向和反向引物都在完全基于dna的扩增程序中添加了它们的样本标识符,而第二种替代方案在逆转录反应(或通常在基于rna的扩增反应)中添加已经具有样本标识符的引物。根据本发明,优选仅使用dna模板添加样本标识符,因为基于dna的引物延伸反应更稳健,副反应更少,不过当然使用rna模板也是可能的,特别是考虑到本发明使用两个样本标识符(在正向和反向引物上都使用)以补偿甚至增加方法的可靠性,从而提高特异性。
29.如所述的,根据本发明,正向和反向引物都分别包含接头序列、样本标识符序列和用于与分析物核酸杂交的结合序列。
30.用于与分析物核酸杂交的结合序列包含分析物核酸(或者在反向引物的情况下,其互补序列)的互补序列,使得引物通过在反应条件下杂交与分析物核酸(或者在反向引物的情况下,其互补序列)特异性结合。杂交的反应条件可以根据所使用的酶和/或缓冲液而变化,并且可以例如包括在包含750mm tris-hcl ph8.3、200mm(nh4)2so4、1%triton x-100的pcr缓冲液中加热至58℃,这是本发明的优选实施方式。也可以使用缓冲液的变体。例如,缓冲液可包含7至9的ph,优选约8.3。优选存在硫酸根离子;还优选使用拥挤剂如triton x-100;优选浓度为0.3%至3%,例如约1%(全部是w/w-%)。优选地,分析物核酸的互补序列包含与分析物核酸(或其互补序列,在反向引物的情况下)互补的8个或更多个核苷酸,例如9、10、11、12、13、14、15、16、17、18、19、20、21、22个或更多个核苷酸,例如8-30个核苷酸。正向和反向引物的互补核苷酸的数量可以独立选择。通过结合序列,引物对目标分析物核酸序列具有特异性。这些分析物序列可以例如来自病原体,这将在下面更详细地阐述。
31.正向和反向引物上的接头序列是在本发明方法的下游用于在步骤d)中将另外的正向和反向引物与扩增的核酸结合的序列,假设接头序列保留在扩增产物中。这样的接头
序列通常是人工的并且通常不与样本中的预期核酸结合。合适的接头序列在本领域中是已知的并且例如已保存在数据库中(例如2020年7月的illumina接头序列1000000002694v14)。根据本发明可以使用任何这样的接头。通常,几乎任何序列都是可能的,但当然互补序列用于步骤d)的另外的正向和反向引物,从而与步骤b)的正向和反向引物形成相互关联的引物。当然,扩增的核酸中只有一个引物序列与每个用于与另外的正向和反向引物中的接头序列杂交的序列结合。例如,用于与另外的正向引物中的接头序列杂交的序列与正向引物的接头序列结合,但不与反向引物的接头序列结合;用于与另外的反向引物的接头序列杂交的序列与反向引物的接头序列结合,但不与正向引物的接头序列结合;或反之亦然。独立选择的正向和反向引物的接头序列的长度可以是8个或更多个,例如9、10、11、12、13、14、15、16、17、18、19、20、21、22个甚至更多个核苷酸,例如8-30个核苷酸。
32.样本标识符序列是识别样本的扩增产物的标签或条码,并通过引物引入所述扩增产物中。通常选择样本标识符序列来识别子集中的样本。由于在步骤d)中引入了另外的标识符序列,因此不需要对整个阵列的每个样本进行唯一标记。样本标识符序列可以在不同类型的分析物核酸/用于与分析物核酸杂交的结合序列之间共享。不同子集的核酸可以用选自同一样本标识符序列池的样本标识符序列标记和/或可以包含由同一样本标识符序列标记的核酸。由于正向和反向引物都包含样本标识符序列(独立选择),因此本发明的方法引入了高特异性。在优选的实施方式中,给定的容器/样本的正向和反向引物的样本标识符序列不应该是相同的或至少不选择为相同的,一致情况仅是随机出现的,应低于容器或样本的5%或低于1%。发明人已经注意到使用这种方法可以显著降低假阳性结果的发生率,否则这种情况会在使用大量扩增循环时发生。尽管样本中不存在目标核酸,但不需要的扩增反应可能会产生产物,从而导致假阳性结果(如果不采取进一步的控制步骤的话)。
33.优选地在步骤b)中,对于给定的用于与所述分析物核酸杂交的结合序列,正向引物的每个样本标识符序列与其他正向引物的样本标识符序列不同。换言之,对于给定的分析物核酸或用于与分析物核酸杂交的结合序列,样本标识符序列各自是唯一的,或者,在最终扩增产物中,对于给定的扩增子,样本标识符序列是唯一的。对于不同的用于与分析物核酸杂交的结合序列/扩增子,可以使用相同的样本标识符序列。在类似的优选实施方式中,在步骤b)中,对于给定的用于与分析物核酸杂交的结合序列,反向引物的每个样本标识符序列与其他反向引物的样本标识符序列不同。这两个优选的实施方式当然可以组合;即,正向和反向引物的样本标识符序列对于给定的用于与分析物核酸/扩增子杂交的结合序列来说是唯一的。在其他实施方式中,样本标识符序列在正向和反向引物的组合的组中也可以是唯一的,但这不是必需的,但当然是可选的——可选地仅对于给定的用于与分析物核酸杂交的结合序列/扩增子或不仅对于给定的用于与分析物核酸杂交的结合序列/扩增子。
34.本发明方法基于分析物核酸的然后是互补核酸的重复扩增(“扩增循环”)。由至少正向或反向引物启动的每个扩增被认为是一个扩增循环。因此,为了说明,正向和反向引物的扩增反应而没有进一步的扩增反应被认为是具有2个扩增循环的反应。因此,正向和反向引物最少有2个扩增循环才能掺入到扩增产物中,以便用样本标识符进行标记。如果同时存在正向和反向引物以及正向和反向引物的模板,则两种引物会在一个扩增循环中产生扩增产物。这通常是扩增循环第2次以后的情况。在实验实践中,扩增循环是一轮加热和冷却。大量的扩增循环会增加错误结果的数量。然而,可能需要大量的扩增循环来检测少量存在的
目标核酸或分析物核酸。通常使用针对所有样本/容器的标准化条件,即所有容器/样本的扩增循环数相同。在一些容器中,可能存在大量分析物核酸,而在其他容器中存在少量。在本发明之前,这会导致针对一些样本的次优条件,从而导致假阳性或假阴性结果。本发明已经改进了这样的方法,以允许足够的灵敏度和选择性以在一个多重反应中检测各种样本,例如实施例中所示。本发明使用步骤b)的各种扩增循环,例如2-80个扩增循环,优选5至75、10至70、20至65、25至60、30至55、35至50或40至45个扩增循环,或这些值之间的任何范围。在优选的实施方式中,步骤b)的扩增是终点扩增。根据在本发明所有方面中优选的该实施方式,它努力使每个容器中的扩增的核酸的数量相等,而与初始核酸量无关。这极大地有助于在本发明的平行检测方法中检测各种浓度和量的范围的目标核酸。终点扩增是指进行扩增反应直到不再发生扩增(在每个容器中)。这可能是由于进一步扩增循环所需的核苷酸被消耗和/或用于另一个扩增循环的引物被消耗的事实。具有较少被扩增的核酸的容器将比具有更多数量的被扩增的核酸的容器花费更多的扩增循环。因此,因为所有容器都被类似地处理,即以相同的扩增循环数处理,所以选择一定的扩增循环数以扩增具有最少量的待检测的目标核酸的容器。当然,无论扩增循环的数量和核苷酸和/或引物的数量如何,空容器都不会产生任何扩增产物。扩增过程中的引物和/或核苷酸消耗可能是由于分析物核酸(如果存在)、对照和/或加标(spike-in)。如果不存在对照和加标,则可以针对分析物核酸在给定数量的循环中导致终点(不能进一步完全扩增)的最小数量选择检测限。这种分析物核酸的最小数量可以是例如10或100或500或1000个分析物核酸。选择的扩增循环数应考虑添加的核苷酸和引物的量,添加的核苷酸和引物的量决定了直到它们被消耗(扩增至饱和)时的循环数。因此,在本发明的优选实施方式中,选择步骤b)中的扩增循环数使得分析物核酸在容器中不再发生扩增。在正常情况下,40个或更多个,例如45个或更多个循环对于终点扩增是足够的。熟练的从业者可以为手头的样本选择合适的扩增循环数。通常,如果预期样本中的目标核酸数量较少,则将选择更多的扩增循环数。使用本发明,可以检测在样本丰度上有很大差异的目标核酸,其中每个样本的目标核酸数量高达x107个拷贝。令人惊讶的是,这些有差异的样本可以在一个多重反应中在对所有样本都相同的条件下进行处理。
35.在正向和/或反向引物的优选结构中,用于与分析物核酸杂交的结合序列优选在正向和/或反向引物的3’端。这允许在5’到3’的方向上进行有效的延伸反应。优选地,样本标识符序列位于结合序列和接头序列之间。接头序列可以位于或靠近正向和/或反向引物的5’端。因此,正向和/或反向引物的优选引物结构在5’至3’方向包括:[接头序列]-[样本标识符序列]-[结合序列]。
[0036]
步骤c)包括将两个或更多个子集的容器的步骤b)的扩增的核酸组合成组合容器的阵列,其中一个子集而非另一子集的容器组合成组合容器。因此,一个子集的容器被组合成组合容器。这是针对多于两个的子集完成的,从而创建了两个或更多个组合容器,每个容器对应于一个子集。鉴于分析物核酸已被扩增以产生由步骤b)中的样本标识符标记的扩增产物,尽管组合成一个由组合容器中的不同分析物核酸的多个不同扩增产物组成的池,但每个扩增的核酸都携带样本/原始容器信息。
[0037]
在本发明的优选实施方式中,组合的两个或更多个子集(当然对于每个子集单独地组合)优选地是10个或更多个子集,例如20个或更多个子集,例如30个或更多个子集、40个或更多个子集、50个或更多个子集、60个或更多个子集、70个或更多个子集、80个或更多
个子集、或90个或更多个子集。在优选的实施方式中,96个子集、384或1536个子集被组合以充分使用96、384或1536孔板,其中每个孔包含一个组合子集。容纳子集的容器数量可以减少以容纳如上所述的对照。
[0038]
组合容器可以在物理上类似于上述容器,但当然包含各种扩增的核酸。示例组合容器可以选自烧瓶、小瓶、袋子、注射器或包括孔板上的微孔在内的孔。特别地,孔板是优选的,其中不同的孔是不同的组合容器或包含不同的组合容器。
[0039]
步骤d)包括使用与步骤c)的组合容器的所述扩增的核酸杂交的至少一对另外的引物对通过引物延伸反应扩增核酸,其中另外的引物对包含另外的正向引物和另外的反向引物,其中所述另外的正向引物和另外的反向引物均包含子集标识符序列(“子集索引”)和用于与所述接头序列杂交的序列。步骤d)类似于步骤b),其中是现在扩增产物被扩增而不是分析物核酸,引物被称为“另外的引物”,并且现在使用标记来标识子集(或组合容器)而非分析物。用于进一步扩增反应或其他用途的接头,例如测序接头序列,现在是可选的,可以存在也可以不存在。另外的引物与已经通过如上所述的步骤b)的引物掺入到扩增产物中的接头序列结合。
[0040]
在另外的正向和/或反向引物的优选结构中,用于与接头序列杂交的序列优选在正向和/或反向引物的3’端。这允许在5’到3’的方向上进行有效的延伸反应。优选地,子集标识符序列在从用于杂交的序列到接头序列的5’方向上。
[0041]
在优选的实施方式中,在步骤d)中,另外的正向引物的每个子集标识符序列与其他另外的正向引物的子集标识符序列不同;和/或在步骤d)中,另外的反向引物的每个子集标识符序列与其他另外的反向引物的子集标识符序列不同。如上文关于步骤b)中正向和反向引物的唯一性所述的,另外的正向和/或反向引物在每组中也是唯一的,即另外的正向引物的子集标识符序列与其他另外的正向引物的其他子集标识符序列不同。这同样适用于另外的反向引物的子集标识符序列。因此,在该优选的实施方式中,子集标识符序列在另外的正向引物和另外的反向引物的相应组内是唯一的。在其他实施方式中,子集标识符序列在另外的正向和另外的反向引物的组合组中也可以是唯一的,但这不是必需的,但当然是可选的。
[0042]
在优选的实施方式中,另外的正向和/或反向引物可以包含另外的接头序列。这样的另外的接头序列可以允许在测序反应期间的进一步的引物结合反应或与探针结合,因此另外的引物也被称为“测序接头序列”。当存在这样的另外的接头时,优选子集标识符序列位于用于与接头序列杂交的序列和测序接头序列或另外的接头序列之间。另外的或测序接头序列可以位于或靠近另外的正向和/或反向引物的5’端。因此,另外的正向和/或反向引物的优选引物结构在5’至3’方向包括:[测序接头序列]-[子集标识符序列]-[用于与接头序列杂交的序列]。
[0043]
在优选的实施方式中,导致扩增产物显著增加的主要扩增在步骤b)中。在步骤d)中可以实现进一步的扩增。然而,优选使扩增聚焦在步骤b)上。因此,在该优选的实施方式中,在步骤d)中仅进行了很少的扩增循环。应进行至少两个扩增循环以使另外的正向引物和另外的反向引物发生反应。对于步骤d),本发明的扩增循环很少但也有数个,例如最多35个扩增循环或最多20个扩增循环。在优选的实施方式中,使用2至14个扩增循环,优选3至13、4至12、5至11、6至10、7至9或8个扩增循环,或这些值之间的任何范围。在优选的实施方
式中,步骤d)中的扩增核酸限于最多12个扩增循环,优选最多10个扩增循环。
[0044]
在优选的实施方式中,步骤b)中获得的扩增产物是dna。同样在步骤d)中,优选获得dna扩增产物。可以如上文步骤b)所述使用dna聚合酶。同样,步骤d)也优选pcr反应。
[0045]
在进一步优选的实施方式中,在步骤d)中,使用交错引物(staggered primers)来扩增核酸。“交错引物”是指使用多个引物,其中引物具有0至10个、例如1、2、3、4、5、6、7、8、9或10个、优选1至4个插入的核苷酸,作为“另外的接头序列”(例如“测序接头”)和子集标识符序列之间的间隔核苷酸。该实施方式适用于另外的正向和/或另外的反向引物两者或之一。当扩增产物的测序从扩增产物的一端开始时,通常仅另外的引物之一(另外的正向或另外的反向引物)具有这些间隔核苷酸以具有它们的益处。优选地,另外的正向引物包含间隔核苷酸。在步骤e)中对不同的扩增的核酸进行测序期间,间隔核苷酸导致偏移,使得子集标识符序列的特定核苷酸与另外的接头序列的距离不同,因此在测序反应的不同时间点或情况下读取。间隔核苷酸优选是随机的,即在引物中给定位置的a、g、c、t的混合物。当对相同的核苷酸位置进行测序时,具有不同的间隔会减少竞争反应和/或优化测序仪的增益,如果没有交错,相同的核苷酸位置在同一时间或同一情况下将是相同的核苷酸类型(例如,g、a、c、t)。间隔核苷酸可以是任何核苷酸类型,优选在给定位置(距另外的接头序列一定距离),在不同引物中使用不同的间隔核苷酸以避免与间隔核苷酸产生这种竞争反应。根据容器/子集使用这种交错引物(具有不同的间隔核苷酸的引物的混合物)。特定容器可具有恒定数量的间隔核苷酸,而其他容器具有其他数量的间隔核苷酸。
[0046]
步骤e)包括确定步骤d)扩增的核酸的序列。可以按本领域已知的方式进行序列测定,例如通过sanger测序或下一代测序。优选地,对于测序,步骤d)扩增的核酸被固定在固相上,例如固定在柱上或珠子上。一个例子是流动槽测序。对于这样的固定,与固相上的探针结合是可能的,例如通过上述测序接头。测序接头可以是illumina p5和/或p7接头。仅固定步骤d)扩增的核酸的一端或固定步骤d)扩增的核酸的两端,从而与固相形成环。对于一端固定,仅另外的正向引物和另外的反向引物之一可以具有测序接头;对于两端固定,另外的正向引物和另外的反向引物都可以具有测序接头。
[0047]
在步骤e)中所确定的序列是通过另外的正向和另外的反向引物引入到扩增的核酸中的子集标识符序列、通过正向和反向引物引入到扩增的核酸中的样本标识符序列以及对应于正向和反向引物的通过用于与分析物核酸杂交的结合序列在分析物核酸中杂交的区域之间的序列的分析物序列。分析物序列对应于目标核酸并标识目标核酸,样本标识符序列和子集标识符序列对应于样本并标识样本。
[0048]
优选地,选择正向和反向引物中用于与分析物核酸杂交的结合序列,以便限制测序成本,即分析物分子上这些相应区域之间的区域(使得分析物序列(扩增子))的长度为至少10和/或最多400个核苷酸,优选20至300个核苷酸,甚至更优选30至200个核苷酸,例如40至150个核苷酸,甚至更优选45至100个核苷酸,或约70个核苷酸。
[0049]
在优选的实施方式中,对于分析物核酸、加标、内部对照和添加的对照的任何扩增子都在这些范围内,特别优选是大致相同的,例如在它们长度的30%以内(最长的扩增子核苷酸长度 /-30%)。具有相似的长度会最大限度地减少竞争反应。
[0050]
作为在步骤e)中生成的信息之后的数据处理步骤,在步骤f)中,通过与具有子集标识符序列和样本标识符序列的子集和容器相关联,将步骤e)的确定的目标核酸序列分配
给样本。在其他实施方式中,步骤f)可以用诸如计算机上的技术手段来执行。计算机可以接收样本标识信息例如其容器的位置(例如在阵列中的位置)、子集标识符序列和样本标识符序列以及确定的序列,并通过其分析物序列呈现样本中检测到的目标核酸的信息。优选地,步骤f)中给出的信息包括目标核苷酸是否存在于样本中的是或否信息。计算机或本发明的装置或试剂盒可以包括计算机可读数据存储设备,例如闪存或硬盘,以存储用于执行这种方法的指令。在本发明的一些实施方式中,步骤f)可以被省略或外包给不执行步骤a)至e)的方法的另一服务提供商。
[0051]
在本发明方法的优选实施方式中,步骤b)的正向和反向引物中的至少一个在步骤b)期间和/或之后但在步骤c)之前被耗尽。可选择地或组合地,优选地组合地,游离核苷酸(扩增反应中的底物)也被耗尽。这种耗尽降低了基于步骤d)期间正向和反向引物引发的有害反应的风险。这样的耗尽可以例如是物理去除,例如通过与诸如珠子的固相结合并去除具有引物的珠子。固相可以包含结合单链引物但不结合双链扩增产物的互补序列。优选地,引物和/或核苷酸被酶促耗尽,例如通过核酸酶或磷酸酶,其从引物和/或核苷酸3'端去除磷酸酯,从而它们不适合进一步的延伸反应。一个例子是酶混合物exostar
tm
。优选地,使用外切核酸酶1和/或碱性磷酸酶用于引物和/或核苷酸的酶促耗尽。
[0052]
在本发明的优选实施方式中,其中在如上所述的步骤a)中对目标rna核酸进行逆转录,还优选的是在步骤b)之前耗尽引物(rt引物)和/或核苷酸以避免有害反应。所述耗尽可以如上所述机械地或酶促地进行,例如,通过纯化、吸附(例如在固相上),或通过酶促活性(例如通过磷酸酶或核酸酶)来进行。
[0053]
另一种耗尽方法是用正向和/或反向引物扩增加标核酸。在该实施方式中,正向和反向引物与加标核酸(或仅“加标”)结合,该加标核酸具有与引物的用于与分析物核酸杂交的结合序列的互补的核酸序列,但该序列与所述互补序列之间的分析物核酸不同,以便不使加标与目标核酸混淆。因此,加标核酸对分析物核酸产生竞争扩增反应,从而耗尽引物。由于这种竞争反应可降低分析物核酸的灵敏度,因此优选例如物理地或酶促地耗尽引物。然而,令人惊讶地发现,在本发明方法的大多数情况下,这种竞争反应不会阻碍分析物核酸的检测——参见实施例。
[0054]
酶促去除可以例如使用单链特异性核酸酶。这是优选的实施方式之一。因此,本发明的方法可以包括正向和反向引物的耗尽,包括用单链特异性核酸酶处理。
[0055]
在本发明的方法中,添加到容器中并像分析物核酸一样被扩增和标记的加标或任何其他添加的对照核酸在优选的实施方式中用于所有容器。此类加标和对照可用于识别本发明检测方法中的问题,例如是否存在对任何反应的抑制剂。无论样本质量如何,加标和添加的对照核酸都应在步骤e)中产生可检测的产物。
[0056]
本发明的方法可以进一步包括通过步骤a)至d),优选还包括步骤e)和/或f),来扩增和处理样本的内部对照,内部对照是一种无论目标核酸如何都预期存在于样本中的核酸或基因或其编码区。这样的内部对照可以例如来自对象(例如人)的组成型表达的基因。在优选的实施方式中,内部对照可以是核糖体基因或编码序列。与核糖体基因或编码序列或预期存在于样本中的核酸的任何其他内部对照结合的引物对可用于步骤a)(在rna的情况下)或步骤b)(特别是在dna的情况下)中。rna内部对照是优选的。核糖体基因或编码区或其他内部对照可与分析物核酸及其在步骤b)和d)中的扩增产物平行扩增作为对照。对照反应
可以包含在没有分析物核酸的单独容器中或包含在具有分析物核酸的容器中。
[0057]
特别地,步骤d)的加标的产物和添加的对照的产物的比较可以与步骤d)的样本内部对照的产物进行比较。这种比较可以指示本发明方法中的问题(当添加的对照不产生其预期的产物或数量时),或者如果样本没有适当地分离或处理(如果添加的对照或加标而不是内部对照产生步骤d)中的预期产物)这种比较可以提供指示。例如,此类问题可以是漱口液和其他不合适的样本的获取方法不正确。
[0058]
目标核酸可以是病原体核酸。这种病原体核酸可以是特定病原体所特有的。通过识别病原体核酸,可以推断样本中存在病原体的至少部分。优选地,病原体核酸是病毒核酸。
[0059]
通常,目标核酸或分析物序列可以来自任何生物体,包括病毒、细菌或真菌。一个例子是肠道细菌。可以用本发明的方法检测,特别是识别任何生物体中的特征序列。
[0060]
在本发明的特别优选的实施方式中,目标核酸选自sars-cov-2核酸、流感病毒核酸、副流感病毒核酸、呼吸道合胞病毒核酸、鼻病毒核酸或其组合。当提及目标核酸的组合时,在本发明的方法中平行检测两种或更多种目标核酸。因此,在步骤b)中包括更多的引物对,它们通过它们的用于与分析物核酸杂交的结合序列对对应于两种或更多种目标核酸的分析物核酸具有特异性。此外,病原体特异性引物可以可选地用于步骤a),逆转录中,或用于步骤b)中,以增加该方法的灵敏度。
[0061]
在本发明的优选实施方式中,选择两种或更多种目标核酸用于本发明方法中的检测,优选其中两种或更多种目标核酸来自病毒。对于两种或更多种目标核酸,病毒可以是相同的病毒或不同的病毒。在步骤b)中的优选实施方式中,使用具有用于与两种或更多种分析物核酸杂交的结合序列的正向和反向引物。在步骤f)中可以搜索两种或更多种目标核酸并将其分配给样本。
[0062]
在优选的实施方式中,平行检测1、2、3、4、5、6、7、8种或更多种目标核酸,优选两种或更多种目标核酸。在优选的实施方式中,从1、2、3、4、5、6、7、8种或更多种生物体例如病原体中检测两种或更多种目标核酸。例如,可以检测来自同一生物体(例如一个病原体)或不同生物体(例如多个病原体)的两种或更多种不同的目标核酸。在优选的实施方式中,扩增子的选择还包括针对宿主rna的内部对照作为样本质量对照。
[0063]
病原体可以是病毒、细菌或真菌病原体。
[0064]
示例病毒包括肠病毒、偏肺病毒、腺病毒、甲型、乙型、丙型、丁型流感病毒、呼吸道合胞病毒(rsv)、sars相关冠状病毒(包括sars-cov-1、sars-cov-2、mers-cov)、风疹病毒、水痘带状疱疹病毒、诺如病毒、轮状病毒、肠病毒等。优选地,病毒是rna病毒。
[0065]
在优选的实施方式中,本发明可用于检测一种或多种病原体的变体或一种或多种标记蛋白的变体,例如指示病原体的致病性和/或其对宿主免疫系统的反应性、或疾病(例如感染或肿瘤)的进展、可分性(severability)和/或可治疗性的那些变体。
[0066]
在优选的实施方式中,一种或多种病原体是病毒。在特别优选的实施方式中,待检测的病毒包括sars-cov-2的特定变体或毒株,例如20a.eu1、20a.eu2、b.1.1.7(也称为20i/501y.v1或alpha)、b.1.351(也称为20h/501y.v2或beta)、p.1(也称为20j/501y.v3或gamma)、b.1.617.2和ay谱系(也称为delta)、b.1.525(也称为eta)、b.1.526(也称为iota)、b.1.617.1(也称为kappa)、b.1.617.3、p.2(也称为zeta)、b.1.621(也称为mu)、20b/
s.484k、以及在刺突蛋白中具有突变或缺失的变体或毒株,其中突变包括s:s13i、s:l18f、s:d80y、s:s98y、s:d138y、s:w152c、s:l189f、s:p209h、s:a222v、s:p272l、s:k417n、s:n439k、s:k444n、s:452r、s:s477n、s:t478k、s:n501y、s:d614g、s:q677h、s:a222v、s:s477n、s:n501、尤其是s:n501y、s:n501t、s:n501s、s:e484、尤其是s:e484k、s:n453f、s:s98f、s:l452r、s:d80y、s:a522s、s:e583d、s:a626s、s:q675r、s:p681、尤其s:p681h、s:p681r、s:p681l、s:i692v、s:v772i、s:v1122l、s:m1229i、s:a570d、s:d614g、s:p681h、s:t716i、s:s982a、s:d1118h,以及具有缺失s:h69-、s:v70-、s:69/70-、s:144-的缺失变体,或在其他基因座发生突变的变体,其中突变例如orf10:v30l、n:s186y、n:d377y、n:p199l、n:a220v、n:m234i、n:a376t、orf1b:a176s、orf1b:v767l、orf1b:k1141r、orf1b:e1184d、orf1a:i2501t、orf3a:q38r、orf3a:g172r、orf3a:v202l、orf1a:i4205v、orf1b:d1183y、orf1a:t945i、orf1a:t1567i、orf1a:q3346k、orf1a:v3475f、orf1a:m3862i、orf1b:p255t、orf7a:r80i,或其组合,例如在b.1.1.7中,例如s:缺失69-70、s:缺失144、s:n501y、s:a570d、s:d614g、s:p681h、s:t716i、s:s982a、s:d1118h的组合。
[0067]
待检测的目标核酸可以包括sars-cov-2刺突蛋白的核酸。刺突蛋白高度指示sars-cov-2感染和病毒的病毒性或对宿主免疫系统的反应性,以及它与细胞受体ace2对接的能力。
[0068]
可以用本发明的方法检测的刺突蛋白的示例变体可以包含以下突变中的任何一种:选自e484q e484g k417n f456v t478i e484a s494q n439k f490s s477r s477i s477n n501t k417t t478r l455f n501y g446s e484k y449n t478k s494p的任何一种或多种突变(在gh分支(b.l.*)中);选自e484q t478i n439k y449h g446v f490s y495h f490l s477n y489h n501t g476s k417t g496s l455f n501y v445i e484k t478k g485r s494p的任何一种或多种突变(在gr&gry分支中,例如b.l.1.1&b.1.1.7);选自e484q t478i a475t s494t f490i g504s s477n g476s s494a n501y g446l g447v v503a p499r e484k e484v q493l k458n t500s y453h y505w e484g g504d v503f y453f t500n e484a q493e k417e v503i g485v q506k p499l k417t g485d r403k g504n g485s g446s g502k n501s k458r v445f v445a p499h g485f s494l y449h g446v f456l n439d y495h f490l f486l n501t t478r g496s g446a t478k g485r s494p q498r q493r k417n n501i a475s n439k s477g a475v f490s s477r g502n s477i y489l f490v l455f v445i e484d g446r g446d n501k(在g、gk&gv分支的任何一种或多种突变(b.l、b.1.617.2、ay.*&b.1.177)中);选自k417n e484q y453f s477g s494l g446v f490l s477i k417t g496s n501y l455f e484k p499r t478k k458n s494p的任何一种或多种突变(在非g分支(a、b&b.2)中)。
[0069]
本发明的检测方法包括确定扩增的核酸的序列的步骤,所述扩增的核酸源自分析物核酸,所述分析物核酸在该方法中通过扩增步骤进行处理,其中目标核酸通过引物选择。核酸的确定自动导致扩增的序列被识别。因此,本发明的方法可用于识别病原体(例如sars-cov-2)的已知的和未知的或新的变体或毒株。因此,本发明方法在本发明所有方面中可以包括识别样本或分析物核酸中病原体的变体或毒株的步骤。优选地,变体或毒株是sars-cov-2的变体或毒株。
[0070]
在sars-cov-2的情况下,特别优选的是检测对应于sars-cov-2刺突蛋白的氨基酸1-722和767-839的核酸序列,因为在该区域发生了许多与病毒的传染性相关的突变。在同
样优选的实施方式中,目标核酸包含任何上述sars-cov-2变体或毒株的突变或其在sars-cov-2基因组中的位置,如前一段所述,这允许用本发明的检测方法识别在这些遗传位置具有新突变的新变体或毒株。
[0071]
细菌病原体可以选自脑膜炎奈瑟菌、肺炎支原体、百日咳博德特氏菌、链球菌属(例如肺炎链球菌、a组链球菌)、金黄色葡萄球菌(例如耐甲氧西林金黄色葡萄球菌)、结核分枝杆菌等。
[0072]
真菌病原体例如选自曲霉属(特别是其孢子)。
[0073]
病原体可以是呼吸道病原体,例如可见于痰液、唾液、鼻粘液、支气管肺泡灌洗液。这种体液可以作为样本收集,其中的病原体可以被检测到。
[0074]
此外,本发明的方法可用于检测具有疾病生物标志物的dna作为目标核酸,例如从肺癌结节脱落的dna中的krasg12d突变。
[0075]
本发明的方法可用于检测任何此类病原体或生物标志物。本发明的组可包含具有用于与分析物核酸杂交的结合序列的引物,所述分析物核酸包含此类病原体核酸或具有生物标志物的核酸。
[0076]
在优选的实施方式中,正向引物的样本标识符序列包含至少为1、优选地至少为2或至少为3的与正向引物的其他样本标识符序列的序列距离,优选汉明距离或编辑距离。
[0077]
在其他优选的实施方式中,反向引物的样本标识符序列包含至少为1、优选地至少为2或至少为3的与反向引物的其他样本标识符序列的序列距离,优选汉明距离或编辑距离。
[0078]
在优选的实施方式中,另外的正向引物的子集标识符序列包含至少为1、优选地至少为2或至少为3的与另外的正向引物的其他子集标识符序列的序列距离,优选汉明距离或编辑距离。
[0079]
在其他优选的实施方式中,另外的反向引物的子集标识符序列包含至少为1、优选地至少为2或至少为3的与另外的反向引物的其他子集标识符序列的序列距离,优选汉明距离或编辑距离。
[0080]
如上所述,标识符的序列可以独立地从同一序列池中选择。作为步骤d)的扩增产物中的标识符序列与正向引物、反向引物、另外的正向引物或另外的反向引物相关的性质在扩增产物内的标识符序列的位置上是显而易见的。扩增产物通常会具有以下结构:[来自另外的正向引物的子集标识符]-[来自正向引物的样本标识符序列]-[分析物序列]-[来自反向引物的样本标识符序列]-[来自另外的反向引物的子集标识符序列],或该结构的任何部分或全部的任何互补序列。根据替代接头的使用,该结构可以具有反转的从分析物到样本标识符序列的内部部分,例如:[来自另外的正向引物的子集标识符]-[来自反向引物的样本标识符序列]-[分析物序列]-[来自正向引物的样本标识符序列]-[来自另外的反向引物的子集标识符序列],或该结构的任何部分或全部的任何互补序列。因此,标识符序列的位置可以是已知的,因此使用同一序列池来选择任何一个标识符序列是没有问题的。当然,例如通过在一组标识符序列内要求如上所述的序列距离,在一组标识符序列内,将相同地或类似地标记两个不同样本的双序列不应出现。一组标识符序列内的序列距离减少了步骤f)中的错误分配,例如由于测序错误导致的错误分配。
[0081]
在进一步优选的实施方式中,独立选择的任何或所有标识符序列具有至少4个,优
选5个,更优选至少6个核苷酸,或至少7个或至少8个核苷酸的长度。特别地,正向引物的样本标识符序列的长度可以为至少4个,优选至少5个,甚至更优选至少6个核苷酸(nt),优选至少7个核苷酸或至少8个核苷酸,例如4-16个核苷酸长度;反向引物的样本标识符序列的长度可以为至少4个,优选至少5个,甚至更优选至少6个核苷酸,优选至少7个核苷酸或至少8个核苷酸,例如4-16个核苷酸长度;另外的正向引物的子集标识符序列的长度可以为至少4个、优选至少5个,甚至更优选至少6个核苷酸、优选至少7个核苷酸或至少8个核苷酸,例如4-16个核苷酸长度;另外的反向引物的子集标识符序列的长度可以为至少4个,优选至少5个,甚至更优选至少6个核苷酸,优选至少7个核苷酸或至少8个核苷酸,例如4-16个核苷酸长度。可以根据本发明方法中平行处理的样本数量对长度进行扩展,以保持样本和子集之间的可区分性。
[0082]
本发明还包括适用于本发明方法的引物组。该组可以包含至少10个不同的引物a或由至少10个不同的引物a组成,该至少10个不同的引物a从5’到3’包含序列:接头a序列、长度至少为4nt、优选至少5nt、甚至更优选至少6nt的标识符序列、和靶结合序列,其中在至少10个不同的引物a中标识符序列是不同的,优选具有汉明距离至少为1的或编辑距离至少为1、优选至少为2或至少为3的序列距离。上面公开的关于正向引物的所有内容都适用于该组的引物a。
[0083]
该组可以进一步包含至少10个不同的引物b或由至少10个不同的引物b组成,该至少10个不同的引物b从5’到3’包含序列:接头b序列、长度至少为4nt、优选至少5nt、甚至更优选至少6nt的标识符序列、和靶结合序列,其中在至少10个不同的引物b中标识符序列是不同的,优选具有汉明距离至少为1、优选至少为2或至少为3的或编辑距离至少为1、优选至少为2或至少为3的序列距离。上面公开的关于反向引物的所有内容都适用于该组的引物b。
[0084]
该组可以进一步包含至少10个不同的引物c或由至少10个不同的引物c组成,该至少10个不同的引物c从5’到3’包含序列:接头c序列、长度至少为4nt、优选至少5nt、甚至更优选至少6nt的标识符序列、和与接头a序列结合的结合序列,其中在至少10个不同的引物c中标识符序列是不同的,优选具有汉明距离至少为1、优选至少为2或至少为3的或编辑距离至少为1、优选至少为2或至少为3的序列距离。上面公开的关于另外的正向引物的所有内容都适用于该组的引物c。
[0085]
该组可以进一步包含至少10个不同的引物d或由至少10个不同的引物d组成,该至少10个不同的引物d从5’到3’包含序列:接头d序列、长度至少为4nt、优选至少5nt、甚至更优选至少6nt的标识符序列、和与接头b序列结合的结合序列,其中在至少10个不同的引物d中标识符序列是不同的,优选具有汉明距离至少为1、优选至少为2或至少为3的或编辑距离至少为1、优选至少为2或至少为3的序列距离。上面公开的关于另外的反向引物的所有内容都适用于该组的引物d。
[0086]
引物a可用作本发明方法中的正向引物;引物b可用作本发明方法中的反向引物;引物c可用作本发明方法中的另外的正向引物;引物d可以用作本发明方法中的另外的反向引物。
[0087]
在优选的实施方式中,引物a(或正向引物)和引物b(或反向引物)的靶结合序列分别包含病毒基因的序列或反义序列。两种引物都具有靶结合序列,该靶结合序列允许引物与包含靶序列或其互补序列的靶核苷酸结合(取决于结合有义链或反义链)。靶结合序列在
本文中也称为用于与分析物核酸杂交的结合序列。在本发明的方法中,分析物核酸包含靶结合序列或其互补序列。
[0088]
病毒基因优选属于sars-cov-2n、m、e或s基因或其编码序列,流感病毒pa、pb1、pb2、pa、ha、np、na、m1、m2、ns1或nep基因或其编码序列、副流感病毒hn、f、m、np、p或l基因或其编码序列、鼻病毒vp1、vp2、vp3、vp4、2a、2b、2c、3a、3b、3c或3d基因或编码序列;人呼吸道合胞病毒a(hrsv-a)ga1、ga2、ga3、ga4、ga5、ga6、ga7、saa1、na1或na2基因或编码序列;人呼吸道合胞病毒b(hrsv-b)gb1、ga2、ga3、gb4、sab1、sab2、sab3、ba1、ba2、ba3、ba4、ba5或ba6基因或编码序列。这些基因或编码区也是优选的目标核酸并且可以在本发明方法的步骤b)中与正向和反向引物杂交。在本发明所有方面的特别优选的实施方式中,引物靶向的目标核酸或病毒基因是sars-cov-2的n基因(优选地被两个不同的引物对结合或靶向)以及流感病毒m1或m2基因。在本发明所有方面的特别优选的实施方式中,引物靶向的目标核酸或病毒基因是sars-cov-2的s基因,优选被1、2、3、4、5、6、7、8、9、10、11、12、13或更多个不同的引物对结合或靶向。
[0089]
该组还可以包括与核糖体基因或编码序列或预期存在于样本中的核酸的任何其他内部对照结合的引物对。这种核糖体基因或编码区或其他内部对照可与步骤b)和d)中的分析物核酸及其扩增产物平行扩增作为对照。对照反应可以包含在没有分析物核酸的单独容器中或包含在具有分析物核酸的容器中。
[0090]
可以在试剂盒中提供本发明的组。这种试剂盒可以以包含试剂盒内容物的包装容器提供。该试剂盒还可以包括用于执行本发明方法的说明。
[0091]
此外,该试剂盒可以包含本发明方法中所需的任何组分,例如聚合酶、可选的逆转录酶、缓冲液、核苷酸、单链特异性核酸酶例如单链特异性rna核酸酶和/或单链特异性dna核酸酶。
[0092]
在整个本公开中,本文所用的冠词“一”、“一个”和“该”指代的是一个或多于一个(即至少一个)冠词语法对象。
[0093]
如本文所用,近似词,例如但不限于“约”、“基本”、“基本上”是指这样一种情况:当这样修饰时理解为不一定是绝对的或完全的,但对于本领域的普通技术人员来说,会被认为足够接近以保证将这种情况指定为存在。描述可以变化的程度将取决于可以进行多大的改变并且仍将使本领域普通技术人员认识到所修饰的特征仍然具有未修饰的特征所需的特性和能力。一般而言,但根据前面的讨论,本文中由诸如“约”等近似词修饰的数值可以与所述值相差例如
±
10%。
[0094]
如本文中使用的,词语“包含(comprising)”(以及任何形式的包含(例如comprise和comprises))、“具有(having)”(以及任何形式的具有(例如have和has))、“包括(including)”(以及任何形式的包括,例如include和includes)或“含有(containing)”(以及任何形式的包含(例如contain和contains))是包容性的或开放式的并且不排除额外的、未提及的元素或方法步骤。表述“包含”在用于一个元素并结合该元素的某个值的数值范围使用时意味着该元素被限制在该范围内,“包含”与其他元素的可选存在有关。例如,具有范围的元素可能会从属于排除该元素以超出该范围的数量存在的隐含限制条件。如本文所用,短语“基本上由
……
组成”规定指定的整数或步骤以及那些不实质影响要求保护的发明的特征或功能的那些。如本文所用,封闭式术语“组成”仅用于指示所列举的元素的存在。
[0095]
在不必限于本发明的这些实施方式的情况下,将通过附图和实施例进一步描述本发明。
附图说明
[0096]
图1:设置基于下一代测序(ngs)的管道,用于从呼吸道粗样本中检测sars-cov2。a.图示设想的分析管道的概述方案。b.通过taqman qrt-pcr进行不同的rna提取处理后对n1扩增子进行sars-cov2检测的比较分析。两名sars-cov2阳性人员和一名阴性人员的漱口液样本收集在hbss中。纯化(不浓缩)rna或使用热灭活30分钟(ref)、tcep/edta(hudson缓冲液)或quickextract产生粗裂解物。c.rt或pcr期间扩增子索引的图示。彩色框表示在ngs期间在单个样本中用于检测的不同索引。箭头示出了在rt期间与rna杂交的寡核苷酸或在pcr中与dna杂交的寡核苷酸。d.在rt或pcr中索引后获得的扩增子的比较。长引物含有>20bp的索引和互补序列并因此与pcr兼容,这种长引物已经作为rt引物被包括在内,或者使用短引物进行rt,即随机六聚体和两个结合sars-cov2扩增子的3'的n基因特异性引物。在1步pcr中,热启动taq聚合酶在rt期间已经存在,而在2步pcr中,热启动taq聚合酶是在rt之后添加的。灰色三角形表示3645、1215、405、135、45、15、5或0个分子的合成模板稀释系列。thermo ss3:thermofisher提供的superscript iii酶;h.m.ss3:自制superscript iii样酶;h.m.ss2.5:自制高级superscript ii样酶;e.比较从总共192个不同浓度的sars-cov2阴性或阳性样本中获得的总读段计数。
[0097]
图2:靶向18s rrna的对照引物对提供比广泛使用的rpp30引物更好的特异性。a.使用由cdc设计的sars-cov2 n基因特异性引物对n1以及人类rnase p(rpp30)特异性引物对获得的ngs读段计数。对加标了5120、2560、1280、
……
、5分子合成模板的双倍稀释系列以及0分子的灭活漱口液-qe样本进行rt-pcr。非特异性扩增子定义为由各自匹配的引物对产生但其间序列不正确的扩增子。b.对a中所示条件的池中产生的所有扩增子的分析。非特异性扩增子通常掺有与引物序列互补的一小段序列,并且几乎完全由至少一种rpp30特异性引物产生。在这种情况下,特异的扩增子加起来不到读段的1%。c.rpp30引物和两个替代内部对照引物对在存在和不存在rt的情况下对从16名个体的漱口液中纯化的rna进行sybr green qpcr分析。ct值转换为任意单位。d和e.rt对照(rtc)加标的图示;合成、克隆和t7转录扩增子,该扩增子具有与核糖体内部对照相同的引物结合位点但具有不同的且更长的中间序列。它以1000个分子/反应添加到逆转录中。核糖体与rtc读段的比率用作样本质量量度,既不是核糖体读段,也不是针对特定样本的抑制/失败的pcr反应的加标点读段。
[0098]
图3:二维冗余双重索引允许扩展到群体级别的测试。a.描述基于96个孔的索引的方案。这些可以通过正向引物或反向引物掺入。对于后者,它们可以在rt或pcr期间掺入。红色圆圈突出显示了加载合成模板以测试索引策略的性能的位置。b.从下一代测序获得的n3扩增子读段基于a中在pcr期间由反向引物掺入的索引而映射到孔。正向引物索引在该分析中被忽略。注意经常错误分配到不正确的位置。c.描述复合索引的方案。每孔都被识别为正向和反向索引的唯一组合。d.n3 ngs读段基于c中的复合索引而映射到孔。为了模拟复合索引,使用了如b和f中相同的数据集,并在指向列或行的池中处理引物。e.唯一双重索引是一种冗余索引方法,其通过正向和反向引物对例如孔进行编码。因此,在生物信息学上可以拒绝读段的不合理的重组产物。f.用如e中的双重索引对如b和d中相同的数据集进行分析的
ngs结果成功过滤掉所有错误分配的读段。g.两步pcr策略,其整合指向孔和随后指向板的冗余双重索引。彩色框代表索引。h.pcr工作流程的图示。对所有样本分别进行rt和pcr 1。随后将每个板混并到一个孔位置,用exostar处理扩增子以去除多余的引物,并进行第二次pcr。我们目前使用和验证的条码组允许混并多达36,864个样本。在任何illumina平台上对所有pcr 2扩增子进行混并、凝胶纯化和测序。
[0099]
图4:在对大量漱口液样本进行测试时,sarseq是特异且灵敏的。a.在sars-cov2阴性样本中pcr1期间用于清除n1和n3引物的rna加标的示意图。与rtc类似,引物结合位点与n1/3扩增子相同,但中间序列不同且更长,以免与病毒来源的扩增子竞争。b.在最低模板浓度下sars-cov2的检测频率。描述了检测到的病例数为24个。注意,假设孔中分子是泊松分布,则一个和三个分子的预期检测频率仅为63%和95%。c.根据合成的sars-cov2模板的一式四份的读段计数。注意在存在n1/3加标时可变性降低。d.sarseq在864个样本的测试池上的性能。用于我们的内部人员测试管道的收集于hbss的漱口液样本用合成rna或由在没有稀释时ct为30的阳性样本产生的稀释系列加标。所有漏报的样本都是该探针的1:100,000稀释品,因此推测是sars-cov2阴性。没有阴性位置表现出大于1个读段。样本质量通过核糖体读段与核糖体加标的比率来评估。
[0100]
图5:对患者样本进行sarseq验证。a.sarseq的h2o对照板,其具有三对引物,即n1、n3和rtc存在下的核糖体以及n1和n3清除剂加标。b.在没有逆转录酶的情况下,对漱口液-quickextract板进行sarseq。没有检测到假阳性孔。由于没有rtc读段,样本qc得分很高,同时观察到以dna为模板的核糖体扩增子。c.对通过拭子获得并收集在vtm中的576个样本进行的分析。d.基于相同的灭活的患者拭子的c的独立复测(replicate)。颜色代码描述了c和d的读段计数和样本质量得分。e.对如c和d中的样本进行两次独立的n1 taqman qpcr运行。两次运行的ct值相对彼此进行绘图。颜色代码:红色:两次qpcr复测中的样本得分均为阳性,橙色:样本得分一次,黑色:样本得分为阴性。在第36个循环随机且最后检测sars-cov2。f.对于至少一个qpcr复测,得分阳性的ct值为36或更低的所有样本的重现性维恩图。g、h.sarseq的ngs结果与诊断性qpcr获得的ct值的比较。使用一组90个样本(包括不同缓冲液中的拭子和漱口液)进行rna提取和qpcr测量,平行地,将这些样本的等分试样与quickextract或tcep/edta混合,并分别通过sarseq一式三份和一式四份进行测量。我们报告了我们称样本为相对于qpcr ct值的ngs(使用n1或n3扩增子)阳性的复测的数量。没有显示qpcr且ngs阴性的63个样本。
[0101]
图6:几种呼吸道病毒的多重分析。a.六块96孔板填充有在hbss中的漱口液并在来自我们内部管道的quickextract中灭活,将这六块96孔板用来自各种呼吸道病毒的rna加标。对于sars-cov2,按指示稀释ct值为30的阳性漱口液样本。所有其他病毒的rna从感染该病毒后48小时的hek细胞中获得。稀释度以体积比表示。一个反应中使用六对引物进行sarseq,即针对sars-cov2的n1和n3、甲型流感病毒、乙型流感病毒、人鼻病毒(hrv)和核糖体。基于扩增子序列变体区分甲型流感亚株和hrv亚株。b.图a中实验的假阳性率和假阴性率分析。正如预期的那样,ct为30的sars-cov2样本的1:100,000稀释品被漏报。检测到所有病毒加标的所有其他阳性样本。检测到乙型流感病毒的假阳性样本可能是由于h2o对照板(未显示)中也有纯化rna对试剂或设备的零星污染。假阳性读段计数没有达到在真阳性样本中观察到的数量。没有检测到任何其他病毒的高于阈值的假阳性样本。
[0102]
图7:测试三个扩增子(sars-cov2 n1和n3,以及人类核糖体)的引物对,这些引物对携带具有110个唯一双重索引的延伸。具有索引#29的引物对被排除在外,因为它们不能有效地产生核糖体扩增子;具有索引#74的引物对被排除在外,因为它们不能有效地产生n3扩增子。可以有效使用引物对1-4,但其未包含在最终组中,因为这些索引在方法的初始设置期间是实验室中经常使用的,我们希望消除所有可能的交叉污染源。
[0103]
图8:a.为完全抑制将索引错误分配给不正确的样本(并以此避免假阳性)而采取的不同措施的贡献。将sars-cov2合成rna添加到b8和f2位。基于单个索引或复合索引分配样本身份会产生大量错误分配。这些可以通过三个独立的措施来减少:添加竞争性加标和用exostar处理以去除pcr 1后任何剩余的引物,以及限制pcr2的循环数以防止扩增子与其索引之间的重组。尽管所有这些措施都有助于减少错误分配,但添加双重冗余索引(或唯一双重索引)会完全抑制这种情况。b.示出了两个阴性对照板(-rt和h2o)的n1和n3读段,它们在同一次运行中与许多其他阳性板一起运行。我们检测到0个读段的事实表明,在所有板中也没有孔标识的错误分配。这是因为每个板也由冗余/唯一双重索引编码。
[0104]
图9:sarseq刺突蛋白变异检测。病毒基因组rna使用13对对s基因特异的引物对进行逆转录,产生的cdna以13个部分重叠的片段或“小区(tiles)”的形式扩增,这些片段或“小区”共同覆盖约三分之二的s基因(图a和图b)。具体来说,覆盖了s基因的编码刺突蛋白的胞外部分的部分,与ace2受体和大多数已知的中和抗体的相互作用发生在此处。这也是已鉴定出所有当前关注的突变的部分(图b)。氨基酸(aa)470-502的关键区域被覆盖两次(由小区8和9),以确保对特别的目标变体进行稳健检测。因为重叠片段不能在同一个反应管中一起扩增(因为引物则会优先扩增重叠),所以rt和pcr实际上是在两个被称为“奇”和“偶”(指的是包含的小区的数量)的单独的反应中进行的(图c)。在rt和pcr 1之后,混并样本,进行pcr 2以添加第二组条码,并最终与来自其他板的待测序样本混并(图c和图d)。对小区进行生物信息学比对,以提取可与参考s基因序列进行比较以识别变体的共有序列。
[0105]
图10:sarseq序列复原效率;对于192个阳性样本,对使用商业一步法试剂盒(luna)的qpcr ct值与sarseq的扩增子覆盖率进行了比较。复原的截止值是该扩增子的读段的中位数的2%或至少10个读段。测序数据在一个novaseq通道上作为具有2255个的池而获得。(a)根据ct值,每个样本最多13个扩增子的复原。序列复原直到ct为33时几乎是完全的。(b)至少扩增子8或9在s基因的最可变结构域(氨基酸位置470-502)处的序列覆盖。几乎所有<ct35的样本都可以分析该区域中的相关突变s477n、e484k、n501y和其他突变。(c)由于高效且特定的序列检索和对s基因的关注以及强大的条码策略,sarseq能够多路对>20k样本在单个novaseq通道中进行序列分析。该图同时通过将截止值设置为高10倍(即100个读段)来估计>20000个样本的测序效率。
[0106]
图11:以一个分析批次为例的sarseq输出;(a)分析管道的表格输出示例,突出显示了一些相关氨基酸。总分析窗口涵盖氨基酸1-722和氨基酸767-839,参见实施例23中的引物。(b)变体分布饼状图,突出显示了关注的b.1.1.7和b.1.351两个变体,相比于具有次要或其他突变的毒株。(c)其他变体的细目以及观察到的氨基酸变化的注释。
[0107]
图12:在sarseq分析运行中观察到的变体分布的时间线;绘制每周(2021年日历周,kw)分析样本中的突变频率。每个时间点由2200-2500个分析样本组成。
[0108]
实施例
[0109]
本发明提供了一种灵敏且特异性的方法来检测sars-cov2 rna及其他核酸,该方法可以扩展到数以万计的平行测试。检测sars-cov2的金标准是基于rt-qpcr的检测方法,它通过dna扩增来测量sars-cov2特有的短rna片段的丰度。由于pcr反应可以扩增不正确的片段(非特异性扩增子),尽管使用了特异性引物对,rt-qpcr测定也通常通过使用荧光标记的taqman探针来提高特异性。这通常意味着每个反应只能检测几个不同的扩增子,再加上对特定qpcr机器的需求,严重限制了这些检测的可扩展性和通量(特别是在不希望样本混并的情况下)。
[0110]
下一代测序(ngs)在原则上可以通过测序和计算分析来检测特定的扩增子,并且在它可以检测到的不同扩增子的数量方面不受限制:由于在测序过程中会显示扩增子的身份,如果用于不同扩增子的引物对兼容,则可以在同一反应中扩增多个不同的片段(病毒和细胞对照)。除了平行检测每个样本的多个不同扩增子外,单个样本还可以用特征序列条码进行唯一标记,从而允许随后的混并和混并测序。对每个样本检测多个扩增子和平行处理数万个样本的优势意味着ngs方案提供了巨大的成本节约潜力,因此对于大规模测试非常有吸引力。
[0111]
然而,虽然ngs方案在概念上很简单,并且确实已经提出了几种不同的方案,但它们的有效实施在各个步骤中受到挑战,这些挑战直接影响总体可行性、成本和潜在的成本节约。
[0112]
在这里,我们描述了一种基于冗余的、双重的和二维的条码策略的稳健的高通量方案,该方案通过冗余双重索引实现完美的样本召回,同时通过沿两个维度进行复合索引扩展到数万个样本,该方案称为sarseq(通过rna测序进行的唾液分析(saliva analysis by rna sequencing),根据其首选用途之一)。示例方案进一步使用2步终点rt-pcr并使用与ngs兼容的扩增子和引物对。该方案在具有合成rna的样本、和患者样本上进行了验证,显示出该方案的实用性扩展到在单个实验中同时检测同一样本中的sars-cov2、流感病毒和hrv病毒。总体而言,该管道可以有效地与96或384孔格式的高通量样本采集、机器人技术和ngs相结合,以在每个实验中约为1天的运转时间检测数万个样本中的sars-cov2和其他病毒(图1a)。
[0113]
实施例1:输入样本制备
[0114]
我们描述的管道可以从各种不同的输入样本开始。被测样本类型:
[0115]

来自漱口液样本的纯化的rna
[0116]

与lucigen的quickextract溶液混合(1:1比例)的漱口液样本
[0117]

与quickextract混合(1:1比例)的vtm中的拭子
[0118]
将直接与quickextract混合的样本在95℃下孵育5分钟以灭活,并直接使用或在-80℃下冷冻保存。我们没有观察到冷冻和解冻后阳性信号下降(即使经过两次冻融循环)。
[0119]
将样本排布在96孔板中。所述反应设置最多使用5μl的任何上述样本。
[0120]
实施例2:逆转录
[0121]
使用superscript iii逆转录酶和包含随机六聚体以及两个在sars-cov2 n基因上引发(prime)的12聚体寡核苷酸的引物混合物进行逆转录。
[0122]
制备包含下列所有组分的预混物(master mix)并将其分配到96孔板(每孔20μl)。使用液体操作机器人(或多通道移液器),将5μl的每个样本转移到包含rt反应混合物的各
个孔中。rt反应在室温下进行。板用铝密封箔密封(它有助于在rt反应后轻松移除,减少孔中的振动,从而避免产生可能导致样本之间交叉污染的气溶胶)并在热循环仪中按照下列条件孵育。
[0123]
每孔中每个反应的预混物组成(体积,以μl为单位):
[0124][0125]
无论在何处提及,对于每个反应,1000个拷贝的核糖体合成rna加标和50个拷贝的每个n1和n3rna合成加标都包含在rt预混物中。此外,无论在何处提及,thermofisher/invitrogentmsuperscripttmiii或luna universal one-step rt-qpcr kit(neb)或superscript 2.5均用于逆转录。在所有其他实验中,superscript iii用于逆转录。
[0126]
热循环仪程序:
[0127]
25℃下5分钟(引物退火)
[0128]
55℃下15分钟(逆转录)
[0129]
95℃下3分钟(rt灭活)
[0130]
冷却至12℃(在板仍然很热时取出板会导致塑料弯曲,使进一步的移液和密封更加困难)
[0131]a10x rt缓冲液组成:
[0132]
200mm tris-hcl ph 8.3
[0133]
500mm kcl
[0134]
50mm mgcl2[0135]
200mm(nh4)2so4[0136]
1%triton x-100
[0137]brt引物混合物组成:12.5mm各随机六聚体,n基因特异性12聚体#1和n-基因特异性12聚体#2(完整25μl rt反应中的最终浓度各为1mm)
[0138]
实施例3:加标合成rna模板的体外转录
[0139]
从idt或microsynth订购在中间和远离引物结合位点的具有唯一识别序列的ribo、n1和n3加标dna片段。通过topo克隆将加标模板克隆到pcr2.1质粒中。含有加标模板的质粒克隆通过sanger测序得到确认。为了进行有效的体外转录,在t7启动子和加标模板的下游通过使用独特的限制酶来线性化质粒。根据制造商的说明,使用neb hiscribe
tm
试剂盒进行体外转录。用turbo dnase/thermofisher处理转录反应1小时,并使用zymo rna清洁浓缩离心柱(zymo rna clean and concentrator spin column)纯化rna。等分rna并储存在-80℃。
[0140]
实施例4:第一次pcr
[0141]
进行第一次pcr以扩增cdna,并添加样本索引作为双重条码。
[0142]
制备包含下列所有组分的预混物,包括hotstart taq聚合酶和尿嘧啶dna糖基化酶(来自neb/m0372l的南极热敏udg),并将其分配到96孔深孔板中。将包含双重孔条码的96个引物对组合c也排布在96孔板中(可以同时制备多个引物板并在-20℃下冷冻储存)。使用液体操作机器人,将96组带条码的引物添加到pcr预混物中并充分混合。将25μl这种完全2xpcr混合物添加到如上制备的25μl rt反应中。将板用铝密封箔密封并在热循环仪中按照下列条件孵育。
[0143]
反应建立期间,所有组分均保持在室温;连同热循环仪中的第一步,在30℃下孵育10分钟,这为udg作用于先前pcr反应的含尿嘧啶的扩增产物提供了合适的条件,从而去除了假性的携带污染物。udg热灭活后,在utp存在下再次进行随后的pcr反应,以防止在后续运行中携带污染。
[0144]
正向引物:
[0145]
sarscov2 n基因的第1组(n1):seq id no:1至96
[0146]
sarscov2 n基因的第2组(n3):seq id no:97至192
[0147]
rrna组:seq id no:193至288
[0148]
甲型流感组:seq id no:289至384
[0149]
乙型流感组:seq id no:385至480
[0150]
人鼻病毒组:seq id no:481至495
[0151]
所有正向引物都含有相同的5'部分,该5'部分包含接头序列(ctacacgacgctcttccgatct(seq id no:991)

seq id no:1至495中的任何一个的第1至第22个nt),然后是从a、c、g或t中随机选择的交错核苷酸,即1至4个n,然后是样本标识符序列,对于给定的扩增子特异性组内的所有引物,该样本标识符序列都是不同的,其在此对于所有seq id no:1至495均为8聚体(例如ccaatact(seq id no:992),seq id no:1的第24至第31个nt),然后是用于与分析物核酸杂交的结合序列;例如对于n1:gaccccaaaatcagcgaaat(seq id no:993)(seq id no:1的第32至第51个nt);对于n3:gggagccttgaatacaccaaaa(seq id no:994)(seq id no:97的第32至第53个nt);对于rrna:ggcattcgtattgcgccgcta(seq id no:995)(seq id no:193的第32至第52个nt);对于甲型流感:ctcatggartggctaaag(seq id no:996)(seq id no:289的第32至第49个nt);对于乙型流感病毒:gccttctccatcttctg(seq id no:997)(seq id no:385的第32至第48个nt);对于人鼻病毒:tccctccggcccctgaat(seq id no:998)(seq id no:481的第32至第48个nt)。
[0152]
反向引物:
[0153]
sarscov2 n基因的第1组(n1):seq id no:496至591
[0154]
sarscov2 n基因的第2组(n3):seq id no:592至687
[0155]
rrna组:seq id no:688至783
[0156]
甲型流感组:seq id no:784至879
[0157]
乙型流感组:seq id no:880至975
[0158]
人鼻病毒组:seq id no:976至990
[0159]
所有反向引物都含有相同的5’部分,该5’部分包含接头序列(gtgactggagttcagacgtgtgctcttccgatct(seq id no:999)

seq id no:496至990中任何一个的第1至第34个nt);然后是样本标识符序列,对于给定的扩增子特异性组内的所有引物,该样本标识符序
列是不同的,其在此对于所有seq id no:1至495均为8聚体(例如agcttggt(seq id no:1000),seq id no:496至990的第35至第42个nt),然后是用于与分析物核酸杂交的结合序列;例如对于n1:tctggttactgccagttgaatctg(seq id no:1001)(seq id no:496的第43至第66个nt);对于n3:tgtagcacgattgcagcattg(seq id no:1002)(seq id no:592的第43至第63个nt);对于rrna:ggcaaatgctttcgctctggtc(seq id no:1003)(seq id no:688的第43至第64个nt);对于甲型流感;tggacaaancgtctactacgctgcag(seq id no:1004)(seq id no:784的第43至65个nt);对于乙型流感:gtcgctgtttggagacac(seq id no:1005)(seq id no:880的第43至第60个nt);对于人鼻病毒:gaaacacggacacccaaagtagt(seq id no:1006)(seq id no:976的第43至第65个nt)。
[0160]
交错间隔核苷酸仅用于正向引物而不用于反向引物,因为它们的作用仅在扩增产物的一侧才需要,以在测序期间发挥它们的作用。
[0161]
每孔每个反应的预混物组成(体积,以μl为单位)
[0162][0163]
热循环仪程序:
[0164]
在30℃下10分钟(对于高udg活性)
[0165]
95℃下3分钟(udg失活,hotstart taq激活)
[0166]
45个循环:95℃下20秒,58℃下30秒,72℃下20秒
[0167]
72℃下2分钟
[0168]
冷却至12℃(在板仍然很热时取出板会导致塑料弯曲,使进一步的移液和密封更加困难)
[0169]cpcr引物混合物组成:对于所有病毒扩增子,2mm各正向和反向引物,对于rrna扩增子,1mm各正向和反向引物(完整50μl反应中各引物对的最终浓度分别为200nm和100nm)
[0170]d10x pcr补充缓冲液组成:
[0171]
750mm tris-hcl ph 8.3
[0172]
200mm(nh4)2so4[0173]
1%triton x-100
[0174]
实施例5:板混并
[0175]
将来自单个96孔板的所有带有孔条码的(well-barcoded)pcr产物混并在一起,通常使用多通道移液器将20μl的各反应物合并在塑料容器中,并在充分混合后,将1ml转移到eppendorf管中。对每个pcr板重复此操作。将来自各板池的5μl重新排布在新的96孔板中,并用2μl illustra exoprostar 1-step在37℃下处理30分钟,然后在80℃下进行15分钟以去除任何剩余的引物。
[0176]
实施例6:第二次pcr
[0177]
使用测序接头添加子集索引(板条码)。将具有下列所有组分的预混物分布在96孔板(37.5μl/孔)中。每孔中我们添加了10μl唯一双重索引i5/i7引物对(带有nextflex条码
的定制合成的索引引物,排布在96孔板中)和2.5μl exostar处理的pcr 1池。反应运行8个循环以添加带有板条码的测序接头。
[0178]
每孔每个反应的预混物组成(体积,以μl为单位)
[0179][0180]
热循环仪程序:
[0181]
95℃下3分钟
[0182]
8个循环:95℃下15秒,65℃下30秒,72℃下30秒
[0183]
72℃下2分钟
[0184]
冷却至12℃
[0185]e10x sequencing-ready pcr缓冲液组成:
[0186]
750mm tris-hcl ph 8.3
[0187]
200mm(nh4)2so4[0188]
20mm mgcl2[0189]
0.1%tween 20
[0190]
实施例7:混并和测序准备
[0191]
将来自96孔板的所有样本(每孔20μl)混并,将250μl混并的样本在2%琼脂糖凝胶上分离,并切除220bp至260bp大小的扩增子,然后使用qiagen凝胶提取试剂盒进行凝胶纯化。
[0192]
为了确保快速周转,根据经验优化了用于illumina测序的文库的制备。在前四次测序运行中,执行了文库的标准质量控制,包括qubit测量、大小分析和qpcr。检测了由qubit得到的浓度测量值与qpcr之间的相关性。在每种情况下,qpcr测定的摩尔浓度均是qubit测量的浓度的10倍高。因此,我们可以省略大小分析和qpcr,这两者都很耗时。最终,文库浓度由3次独立的qubit测量值确定,将以ng/μl为单位获得的值乘以10并用作以纳摩尔为单位的样本摩尔浓度。此过程使我们能够在收到测序文库后的15分钟内启动测序仪。测序运行的最终准备根据illumina的指南进行,包括样本的变性、中和以及用于测序的最终稀释。
[0193]
实施例8:测序
[0194]
根据测序仪类型,使用以下浓度进行测序:10pm用于miseq v2 chemistry型,15pm用于miseq v3chemistry型,2.2pm用于nextseq550 high output型,1.3pm用于nextseq550 medium output型。在每次测序运行中,都会加标10%的phix文库以增加复杂度。为避免先前测序运行中的条码污染,每次运行前根据illumina的指南用漂白剂清洗测序仪。
[0195]
实施例9:数据分析
[0196]
ngs数据(fastq.gz文件)一次性映射到预期的扩增子序列集和预期的孔和板索引集。尽管任何标准ngs工作流程和读段映射软件(例如bowtie或类似软件)都是适用的,我们使用了基于字符串哈希化的专用shell和awk脚本,其允许每个扩增子和索引出现0个或1个
错配。i5和i7索引表示板索引(子集索引),部分正向读段(以及在配对末端测序情况下的反向读段)表示孔索引(样本索引);我们需要对板和孔进行正确的冗余编码。由于正向读段的孔索引从随机偏移开始,我们首先确定扩增子的身份和位置,然后推断孔索引的位置,最后将孔索引与预期的孔索引进行比较。
[0197]
实施例10:在不进行rna提取的情况下直接进行样本处理
[0198]
目前许多检测病毒rna的管道都是从生物材料(拭子、唾液、漱口液等)中纯化rna开始的。然而,为了降低成本并匹配基于ngs的管道的通量,绕过了rna提取。通常,样本收集在病毒转运介质(vtm)中。此外,唾液代表一种理想的病毒转运介质,现在经常用作sars-cov2测试管道的输入物。我们发现10ml hbss漱口与自行采样兼容。漱口液样本与医务人员收集的拭子具有相似的灵敏度,并且比纯唾液更优选,因为样本的粘度变得更加均匀,因此更容易移液,使样本更适合自动化(图1a)。已知几种使呼吸道试样病毒rna稳定、规避rna纯化并实现所需的可扩展性的方法(swab-seq(bloom et al.,doi.org/10.1101/2020.08.04.20167874)、salivadirect(vogels et al.,doi.org/10.1101/2020.08.03.20167791)、quick extract(ladha et al.,doi.org/10.1101/2020.05.07.20055947)、hudson缓冲液(lalli et al.,doi.org/10.1101/2020.05.07.20093542))。为了比较这些方法,我们将包装在细胞培养物中的逆转录病毒颗粒混合到漱口液样本中,然后根据不同的方案处理样本:i)95℃下30分钟(swab-seq),ii)加入蛋白酶k后于95分钟下5分钟(saliva-direct),iii)与quickextract 1:1混合并在95℃下5分钟,以及iv)裂解和rna提取。然后,我们通过对病毒特异性扩增子进行定量rt-pcr,评估了rna暴露的效率及其处理前后的稳定性。我们证实了所有这些方法都能产生与rt-pcr兼容的稳定的rna。然而,dna quickextract显示出在煮沸后vtm沉淀最少,因此除非另有说明,否则dna quickextract用于大多数实验(图1b)。
[0199]
实施例11:与1步rt-pcr相比,2步rt-pcr具有增加的特异性
[0200]
用于测序的病毒基因组片段的扩增由rt和pcr步骤组成。指向单个样本的索引可以在逆转录(rt)步骤以及pcr期间掺入(图1c)。然而,我们发现,与在pcr步骤中引入样本条码相比,在rt步骤中引入样本条码会导致非特异性pcr产物的比例增加,这可能是因为pcr的较高温度构成了更多限制性和进而特异性的条件(图1d)。鉴于ngs流动槽上的序列空间大但有限,这种特异性的缺乏意味着许多非特异性扩增子将是序列,这会干扰扩展到非常大的样本数量。因此,我们决定仅在pcr期间整合位置索引。具体而言,将单个样本排布在96孔板的单个孔中,其中使每个样本的rna首先进行逆转录(rt),然后通过pcr进行扩增,以产生各种所需的病毒扩增子和对照扩增子。rt步骤中的引发是使用随机六聚体以及两个基因特异性十二聚体进行的,这些十二聚体增加了对sars-cov2的灵敏度。
[0201]
实施例12:通过45个循环终点pcr压缩动态范围能够灵敏检测低病毒滴度的样本
[0202]
为来自病毒感染个体的样本建立混并的基于ngs的检测的障碍之一来源于以下事实:病毒载量可能相差许多数量级,因此高滴度样本将主导ngs。taqman rt-qpcr报告了20-25个循环的ct值差异,这转化为2
25
=3350万倍的病毒滴度差异。因此,如果要将低病毒滴度的样本可靠地识别为阳性,例如>100个病毒衍生的扩增子读段,则高病毒滴度的样本需要3.3x109个读段,这是令人望而却步的。因此,需要压缩动态范围,以抑制来自高度阳性样本的信号,但代价是提供足够的灵敏度来检测具有较低滴度的样本。为了实现这种信号压缩,
我们将第一个pcr反应运行45个循环,直到每个单独的样本达到饱和。这导致每孔产生相似数量的扩增子,而这与初始病毒滴度无关(图1d、图1e)。总之,使用粗呼吸道样本作为输入物,2步rt-pcr产生高特异性,甚至在样本中生成代表性特征扩增子,从而能够混并许多样本以通过ngs进行分析。
[0203]
实施例13:病毒和人对照扩增子的选择
[0204]
除了患者之间病毒滴度的动态范围非常大之外,非特异性pcr扩增子还会严重影响ngs对病毒扩增子的检测,因为ngs读段的数量本质上是有限的(并且与总成本成正比)。例如,大约40k(96x384)个样本的平行分析意味着每个样本在miseq上总共只能接收约500个读段,在hiseq上接收约2k个读段和在nextseq平台上接收约10k个读段。如果这些读段的很大一部分花费在对非特异性扩增子进行测序,则检测灵敏度将受到严重影响。因此,选择这样的扩增子和引物对是至关重要的:i)显示高灵敏度;ii)生成相当短的扩增子;iii)单独或与同一反应中存在的任何其他引物对组合时生成少量的非特异性扩增子,这在使用具有长延伸的引物(此处:样本识别条码序列和用于第二次pcr的引物结合位点,如下所述)时特别重要。
[0205]
实施例14:用于控制样本存在和质量的18s-rrna特异性引物对
[0206]
针对我们的dna突出端的性能,我们测试了若干已建立的sars-cov2特异性引物对。疾病控制中心(cdc)提出的sars-cov2 n基因特异性引物n1和n3均对sars-cov2 n基因具有特异性,在sybr-green qpcr(不控制扩增子身份)以及在初始测序运行中表现最佳,并且具有约70的理想的扩增子长度。我们还测试了n1扩增子以及广泛使用的靶向rpp30(rnasep)的内部对照引物对。虽然n1引物显示出相当数量的正确扩增子(这取决于模板中合成加标的数量),但rpp30的特异性扩增子比例仅为0.06%至1.5%(图2a)。在跨条件分析所有观察到的扩增子时,我们检测到共同使用了>99%的ngs读段的各种短序列。绝大多数是由rpp30特异性引物生成的(图2b),这表明这些引物与多重pcr和ngs不兼容。因此,我们打算建立一个新的将产生更少的非特异性扩增子的对照引物对。我们在从16名个体获得的漱口液样本上测试了几个引物组,但在所有样本中仅检测到一个对18s核糖体rna具有特异性的引物对,并且该引物对显示出对逆转录酶存在的强烈依赖性(图2c)。因此,我们选择了这种18s核糖体rna特异性引物对来控制样本质量。值得注意的是,核糖体扩增子在ct值为15-45时被检测到,因此与在患者体内的病毒扩增子范围相当。因此,我们在sarseq专题中测试了作为宿主对照的核糖体rna。事实上,核糖体引物对/扩增子选择表现良好,既没有单独地,也没有与n1或n3引物对组合而产生大量的非特异性扩增子(图2e)。
[0207]
实施例15:用于rt-pcr性能的合成加标rna对照
[0208]
由于18s扩增子(与rpp30扩增子类似)不跨越内含子,因此无法区分呼吸样本中丰富的基因组dna模板。特别是,即使使用核糖体引物,quickextract处理的漱口液也没有显示出主要的基于rna的信号(图2c)。这可能是意料之中的,因为在漱口过程中很少有活细胞会脱落,并且释放的rna也不会在样本长时间储存后存活。相比之下,具有基因组rna的病毒颗粒有效脱落并被良好保持在特别是缓冲等渗条件下,例如病毒转运介质(vtm)、唾液和漱口液的hbss溶液,以保护病毒rna免受呼吸道试样ref中大量的rnase活性的影响。为了整合额外的内部rna对照以评估所有探针中成功的逆转录,我们因此纳入了具有与核糖体扩增子相同的引物结合位点的rna,但两者之间的序列不相关。这种体外转录的rna以1000个分
no:1至495中的“n”核苷酸(参见图3g和实施例4)。我们对每个扩增子总共测试了110个引物对,以建立对所有扩增子都显示出良好的扩增行为的96个引物对的组(图7)。重要的是,一个孔内的所有扩增子都获得相同的交错和索引,以防止pcr期间扩增子之间的重组。预先准备好的引物板和自动移液管道使我们能够平行处理数千个样本。
[0215]
实施例19:在两个维度上完好地保留样本身份
[0216]
在对单个样本(=96孔板的孔;第一维)进行索引后,将一个板的所有样本混并到新96孔板中的一个位置,并在第二次pcr中,添加板特异性索引(第二维)。我们实施了四项措施,以确保在第一次和第二次pcr之间完好保留样本身份。i)为了避免第1次pcr的引物存在于第2次pcr中,我们纳入了带有n1和n3引物结合位点的rna模板,其类似于我们的rt对照和用于swab-seq管道的分母(denominator),以抑制随机污染。此外,我们ii)用dna核酸外切酶对池进行处理,以酶促降解所有单链dna,从而降解所有剩余的引物,尤其是来自sars-cov2阴性孔的引物。iii)我们将pcr 2的循环数保持在最低限度,以避免pcr期间的扩增子重组,并使用防止延伸步骤过早终止的pcr方案。事实上,这些措施协同地促进了读段分配的稳健性(图8a)。iv)在每个维度中,我们使用具有至少三个错配的lowenstein距离的双重和冗余索引。该管道还抑制了板之间的读段错误分配,因此在同一实验中运行的其他板上没有检测到图3a、图3c、图3e的位置(图8b)。
[0217]
因此,我们通过建立基于pcr的索引策略为sars-cov2建立了可扩展且稳健的索引,其包含两组冗余索引,并且我们进行了生物信息学过滤以仅允许这四个索引的合理组合。编码96孔条码和384板条码的能力意味着这可用于同时研究36,864个单独的样本。为了说明该方法的可扩展性,例如通过使用384孔板在每个维度增加4倍将使>145,000个样本的多路复用成为可能。因此,测序能力不再是许多国家频繁进行群体大范围测试的瓶颈,而且测序价格可以忽略不计。该索引系统允许过滤测序流动槽中可能导致独立分析运行之间的读段错误分配的任何dna残留物。总之,在pcr 1期间引入的双重冗余索引确保了样本身份特异性,二维索引允许可扩展性,同时防止任何读段从阳性样本溢出到阴性样本,即便跨越多个数量级的信号强度。我们将这种使用下一代测序sarseq对呼吸道样本进行的直接分析称为“通过rna测序进行的唾液分析”。
[0218]
实施例20:sarseq的特异性和灵敏度
[0219]
为了测试sarseq的灵敏度、特异性和可扩展性,我们开始运行大样本队列。为了在接近真实的条件下进行分析,我们准备了样本板并使用机器人移液平台对它们进行平行处理。如前所述,我们还测试了与n1/n3扩增子具有相同引物结合位点但其间序列不同的加标的效果。
[0220]
最初,我们通过将病毒模板稀释至每5ul探针体积1、3或10个拷贝(2-0.2拷贝/ul)来测试sarseq管道的灵敏度。为了说明quick extract作为输入缓冲液对该管道的贡献以及测试使用该方法进行的rna提取,我们测试了以合成rna在h2o中以及在与hbss混合的quick extract中进行的上述稀释,并且还分析了在quick extract中的病毒颗粒。使用h2o进行稀释,我们能够在平均每孔1个扩增子的稀释度下在24个测试案例中针对n1和n3分别在5个和6个案例中检测到sars-cov2(图4a)。假设泊松分布指向每分子0.3-0.4的检测效率,在这样的稀释度下,预计63%的孔将包含一种或多种病毒模板。quick extract将该效率提高到每分子0.7,而直接从病毒颗粒中检测的效率为每分子1.1(图4b)。n1和n3分母加
标的存在甚至显示出稍微更好的检测效率。据推测,传染性covid-19患者表现出可检测到的病毒滴度>103/μl。因此,我们的检测限是缓解当前的sars-cov2大流行所需的灵敏度至少100倍高。接下来,我们测试了加标对sarseq定量行为的影响(图4c)。由于我们执行端点pcr,因此sarseq刻意地仅反馈半定量结果。然而,当以一式四份测试一系列稀释的合成加标时,我们注意到在这些加标存在的情况下重现性有所提高,因此将它们包含在最终设置中。
[0221]
为了用数百个真实样本挑战省略rna纯化的sarseq,我们接下来从收集于hbss中的漱口液样本生成样本板。这种粗样本可能含有抑制rt或pcr步骤的试剂。为此,我们生成了一系列稀释的合成模板,并将在taqman q-pcr测定中呈现ct=30的对象或患者样本的稀释系列加标到几个位置。事实上,当测试六个96孔板时,我们能够对之前通过rna纯化然后是基于taqman的qpcr而检测到的所有患者进行检测。此外,我们看到了所有患者以及我们在运行该管道之前添加的合成加标。基于n1和n3扩增子的结果之间的重叠为100%(图4d)。
[0222]
测试大量患者时的另一个关键参数是假阳性率。因此,我们非常高兴地看到,对于之前通过q-pcr测试为阴性的人员的漱口液以及所有h2o对照,我们的索引策略和管道通常提供零个以及极少的1个指示sars-cov2的读段。该二元结果显示出sarseq对感染状态的明确评估。由于没有假阳性结果,我们不需要使用分母扩增子来设置阳性结果的信号强度阈值。然而,我们设想如果以足够高的浓度掺入以降低灵敏度,它们可以是减少随机读段的有效方法。
[0223]
实施例21:sarseq对大量患者样本的性能
[0224]
为了测试sarseq是否能够在许多独立患者的临床诊断管道中收集的vtm样本中稳健地检测出真正的sars-cov2病毒,我们用sarseq以一式二份对564个样本的组进行了测试。虽然我们没有在h2o或-rt条件下检测到n1或n3扩增子(图5a、图5b),但我们频繁地在所有板中获得sarscov2读段,其中扩增子和复测之间具有良好的对应关系(图5c、图5d)。为了分析与标准测试的对应关系,我们还在taqman q-pcr测定中以一式两份测量了样本。正如预期,我们发现ct值低于36(图5e,红点)的两个复测之间存在非常好的对应关系以及检测边界处的随机表现(图5e,橙色点),其中一个或两个复测得分为阳性。在另外354个样本中没有检测到sars-cov2。我们分析了基于qpcr的测定和基于ngs的测定之间的重叠,发现在至少一个qpcr中得到的ct值<36的157个样本或96.3%的样本实际上在所有四种检测中都得分为阳性,同时有六个样本仅能用一种或两种测定法检测到(图5f)。我们假设检测边界处的随机表现是由于反应中存在或不存在单个病毒基因组。如果这是真的,那么单个复测的扩增子之间的对应关系也有望优于复测之间的每种扩增子的对应关系,即便n1和n3可能表现出不同的灵敏度。实际上,在通过1种至3种测定检测到的样本中,有48个和43个样本显示出在一个复测中用两种扩增子检测到sars-cov2,而只有18个和25个样本分别用n1或n3独立检测到两次。因此,我们得出结论,sarseq对单个病毒基因组是敏感的。我们绘制了两个sarseq复测的读段计数,以可视化读段计数的重现性(图5g、图5h)。正如预期的那样,我们发现与qpcr相比,相关性较低,一些样本在ngs中未检测到,而在一次qpcr中运行以任何ct存在,以及检测到一个或两个q-pcr漏报的一些样本。我们还观察到n1/n3读段计数的明显上限,这归因于终点pcr中读段的刻意钝化,以在样本之间均匀分布测序空间(另请参见图1e)。综上所述,sarseq能够在564个样本的患者队列中以高重现性和对单分子水平灵敏
可重现地识别sars-cov2。
[0225]
实施例22:对呼吸道感染因子的检测的更广泛的适用性
[0226]
多种感染因子引起临床症状重叠的疾病,主要是甲型和乙型流感。此外,预计尤其是在冬季,各种呼吸道症状将引起患者的关注(即使临床症状不严格重叠),并从而急剧增加对可靠/灵敏的sars-cov2测试的需求。最突出的是,我们预计即使在保持社交距离的措施下,鼻病毒感染仍将频繁发生,因为典型的冬季会使每个人发作数次鼻病毒感染。对于sarseq,如果不增加测序深度要求,则另外的扩增子无需额外费用。因此,我们可以进一步多路进行sarseq,如sars-cov2那样检测见于相同类型的样本中的其他常见呼吸道病毒。
[0227]
为了适应上述rna病毒,我们试图优化甲型流感、乙型流感和鼻病毒流感的引物,以与我们的sars-cov2特异性sarseq管道相结合。为此,我们根据qpcr性能、扩增子长度和ngs初试选择引物。对于泛甲型流感扩增子,我们决定将bose等人的简并正向引物(clin microbiol 47(9),2009:2779

2786)与简并who反向引物结合,这些引物均靶向m基因。对于泛乙型流感,我们选择了针对m基因的seq id no:385至480(正向引物)和seq id no:880至975(反向引物)的引物(参见实施例4)。使用do等人(jj mol diagn.2010;12(1):102

108)的引物对检测鼻病毒。
[0228]
为了测试对于大量试样的性能,我们采集了漱口液quick extract样本,并以1:100的体积比或其稀释品加标到获得自纯化前48小时用各自病毒株感染的hek293t细胞的纯化rna中。使用机器人管道处理样本。我们在存在六对引物的情况下进行pcr1,其中两对针对sars-cov2,对于核糖体对照、甲型流感、乙型流感和鼻病毒各一对。在混并和pcr2后,通过配对末端测序对样本进行测序,以说明存在较长的扩增子,并将读段映射到孔/样本(图6b)。值得注意的是,通过在建立rt反应之前移取加标rna,我们显然产生了乙型流感的rna污染,该污染随机分布在所有反应中(包括h2o对照,但不包括rt对照),并可重现地获得了相对于样本中的加标更低的读段计数。该事件强调了反应混合物制备和样本操作的局部分离的重要性。所有pcr后步骤从一开始就总是在不同的实验室中进行,因此dna扩增子不会对我们的管道产生可检测的污染。尽管如此,我们在我们的方案中实施了掺入utp以及在pcr之前的udg消化步骤,以防止扩增子的污染风险。然而,重要的是,我们用于平行检测各种病毒性呼吸道疾病rna的多重管道在六个96孔板中表现强劲。除了预期的ct30的sars-cov2样本的1/1mio稀释品外,我们没有获得假阴性样本。除了明显的乙型流感样本污染外,我们也没有看到任何其他假阳性事件。此外,甲型流感的扩增子序列使我们能够区分我们使用的两种加标毒株,即a/wsn和a/wy。这是特别令人感兴趣的,因为a/wy如用作乙型流感加标的b/lee那样包含在当前的疫苗接种中,因为预计它将在北半球2020/21流感季节流行。同样,我们能够通过各自扩增子中的多态性区分用作加标的三种鼻病毒株,即hrv a1a、a1b和a2。因此,总的来看,我们的管道在其当前设置下在单个反应中区别性地检测七种不同的病毒性呼吸道病原体,包含各种内部对照、样本质量对照,并且有意地对sars-cov2具有特殊的灵敏度。因此,sarseq代表了一种通过rt-pcr和下一代测序来检测呼吸道感染的多重、大规模平行化分析。
[0229]
实施例23:sars-cov2加标变体检测
[0230]
实施例2至9中描述的方法的变型允许大规模灵敏地检测常见的和新的sars-cov2刺突蛋白变体。采用该方法能以高通量每天对2400个进行常规分析。
[0231]
该方法基本上遵循实施例2至9,其中在方法上稍作修改,而使用不同的引物来分析刺突蛋白的不同部分。特别地,产生了刺突蛋白的13种不同的扩增子。这些涵盖了与刺突蛋白的氨基酸1-722和767-839相对应的核酸序列,这是发现免疫相关突变的地方。
[0232]
简而言之,该方法包含以下步骤:
[0233]
1、rna提取:为便于说明,本方法使用纯化rna为例。但是,它也适用于其他样本类型,例如漱口液或唾液,如实施例1中所述。
[0234]
2、逆转录:rt如实施例2所述用修改的引物进行。每个样本进行两个独立的平行反应,每个反应具有不同的rt引物组(“奇”和“偶”)。引物组的方法和加标基因覆盖率如图9所示。简而言之,将5μl样本添加到“奇”和“偶”完全rt混合物中(每个反应20μl)。将板密封并在55℃下孵育30分钟以及在95℃下灭活3分钟。已根据s基因不同部分的特异性(参见图9c)和具有约58℃的解链温度来选择引物。选择略高于逆转录酶工作温度(55℃)的解链温度避免由于病毒基因组的二级结构造成的效率损失。
[0235]
rt引物序列是:
[0236]
1:catgtatagcatggaaccaagtaaca(seq id no:1007)
[0237]
2:cgttattaacaataagtagggactgggt(seq id no:1008)
[0238]
3:ccatcaatattcttaaacacaaattccctaag(seq id no:1009)
[0239]
4:cccacataataagctgcagca(seq id no:1010)
[0240]
5:ctacagtgaaggatttcaacgtaca(seq id no:1011)
[0241]
6:gcatagacattagtaaagcagagatca(seq id no:1012)
[0242]
7:caggtaattataattaccaccaacctt(seq id no:1013)
[0243]
8:agttcaaaagaaagtactactactctgt(seq id no:1014)
[0244]
9:ccaaattgttggaaaggcagaaac(seq id no:1015)
[0245]
10:gcatgaatagcaacagggact(seq id no:1016)
[0246]
11:gtctgataactagcgcatatacctg(seq id no:1017)
[0247]
12:gtacaatctactgatgtcttggtca(seq id no:1018)
[0248]
13:gtgcacaaatgaggtctctagca(seq id no:1019)
[0249]
7(替代版本):gagattagacttcctaaacaatctatacaggt(seq id no:1020)
[0250]
3、pcr1:第一pcr反应与实施例4类似。打开cdna板并添加25μl完全pcr补充混合物(包括引物)。将“偶”pcr混合物添加到偶数编号的rt板中,将“奇”pcr混合物添加到奇数编号的rt板中。pcr引物除了对13个不同的s基因片段(“小区”)(图c)具有特异性外,还具有与实施例4中描述的引物相同的结构,即它们在指向板中特定孔的正向和反向引物中具有唯一双重索引组合(参见图3)。虽然在实施例4中使用了96个不同的双重索引组合,但此处出于成本考虑使用了12个或24个索引,但在概念上遵循与实施例4中描述的相同的原则,唯一的区别是在下一步中混并的不是完全板,只有12个(或24个)携带不同索引的样本被混并在一起。
[0251]
如实施例4中所述,正向引物再次包含含有接头序列的5'部分,随后是交错核苷酸,即从a、c、g或t中随机选择的1至4个核苷酸,然后是样本标识符序列,该样本标识符序列对于给定的扩增子特异性组内的所有引物都是不同的,例如为8聚体,然后是用于与分析物核酸杂交的结合序列。
[0252]
同样如实施例4中所述,所有反向引物都包含相同的含有接头序列的5'部分,然后是样本标识符序列,该样本标识符序列对于给定的扩增子特异性组内的所有引物都是不同的,例如为8聚体,然后是用于与分析物核酸杂交的结合序列。
[0253]
用于加标基因片段的用于与分析物核酸杂交的结合序列是:
[0254]
1-正向:ggggtactgctgttatgtctttaaaaga(seq id no:1021)
[0255]1–
反向:ctgaggatctgaaaactttgtcagggt(seq id no:1022)
[0256]
2-正向:cccctgcatacactaattctttcacac(seq id no:1023)
[0257]2–
反向:ctgggtcttcgaatctaaagtagtacca(seq id no:1024)
[0258]
3-正向:gcttccactgagaagtctaacataataagagg(seq id no:1025)
[0259]3–
反向:ccctgttttccttcaaggtcca(seq id no:1026)
[0260]
4-正向:gttggatggaaagtgagttcagagt(seq id no:1027)
[0261]4–
反向:acctattggcaaatctaccaatggttc(seq id no:1028)
[0262]
5-正向:gcgtgatctccctcagggttt(seq id no:1029)
[0263]5–
反向:cgtacactttgtttctgagagagggt(seq id no:1030)
[0264]
6-正向:cagatgctgtagactgtgcactt(seq id no:1031)
[0265]6–
反向:cacttaaaagtggaaaatgatgcggaa(seq id no:1032)
[0266]
7-正向:ggaagagaatcagcaactgtgttgc(seq id no:1033)
[0267]7–
反向:caccaaccttagaatcaagattgttagaattcc(seq id no:1034)
[0268]
8-正向:ccagatgattttacaggctgcgt(seq id no:1035)
[0269]8–
反向:gtactactactctgtatggttggtaaccaac(seq id no:1036)
[0270]
9-正向:gtctaatctcaaaccttttgagagagat(seq id no:1037)
[0271]9–
反向:gaacacctgtgcctgttaaaccat(seq id no:1038)
[0272]
10-正向:gcaccagcaactgtttgtggac(seq id no:1039)
[0273]
10

反向:cagcaacctggttagaagtatttgttcc(seq id no:1040)
[0274]
11-正向:cgtgatccacagacacttgagattct(seq id no:1041)
[0275]
11

反向:cctgcaccaatgggtatgtcaca(seq id no:1042)
[0276]
12-正向:gcaggctgtttaataggggctg(seq id no:1043)
[0277]
12

反向:ggtcatagacactggtagaatttctgtgg(seq id no:1044)
[0278]
13-正向:ggcagtttttgtacacaattaaaccgtg(seq id no:1045)
[0279]
13

反向:tctagcagcaatatcaccaaggca(seq id no:1046)
[0280]
在该实施例中,如实施例4所述,针对不同的孔,使用具有不同的样本标识符序列(这些不同的样本标识符序列对于给定的扩增子特异性组内的所有引物均不同)的每组24个不同的引物,例如24个“1-正向”、24个“1-反向”等引物,。
[0281]
4、pcr2:样本按板(如果使用96个索引)或按行(如果仅使用12个索引)混并,每个池首先用exostar处理以降解剩余的引物和核苷酸,然后如在实施例7中描述的进行第二次pcr,添加允许对样本进行复合编码的“板”或“行”索引,从而提高通量。pcr2引物还包括如实施例7中所述的illumina流动槽接头。
[0282]
5、文库清理:pcr2产生可测序的产物,只需将其混并并通过凝胶纯化进行清理,以去除引物二聚体和非特异性的较小的扩增子。
[0283]
6、测序:根据制造商的说明进行illumina测序。由于覆盖了更长的区域,因此使用了比实施例2至9中更大的测序深度。
[0284]
数据分析显示了所有扩增子的高覆盖率(图10)。在实际应用中,每周分析来自covid19患者的2200-2500个样本。图11显示了检测到的与正常变体相比氨基酸(aa)发生了变化的sars-cov2变体。图12显示了每周检测到的sars-cov2变体的变化(显示了2021年第3-8日历周)。
[0285]
总结
[0286]
由sars-cov2引起的全球大流行对我们的社会和经济产生了全球性的重大影响。已经表明,尽管我们在现代医学方面取得了进步以及我们对感染级联(infection cascades)有了概念性的理解,但大多数国家并没有准备好应对这种挑战。为阻止sars-cov2进一步传播而采取的保持社交距离的措施同样影响着人类生活的几乎所有方面。为了尽量减少此类措施,需要尽可能有指导地实施它们,为此需要感染事件的数据。重要的是,这种筛查工作的目标与检测有sars-cov2症状的个体不同。尽管后者需要金标准方法来就最佳治疗提出建议,但缓解(mitigation)筛查确实会产生一些歧义,尤其是在替代方案不进行测试的情况下。然而,大规模缓解测试带来了重大的实际挑战:i)样本收集需要对后勤进行大量投资。其中包括供应链问题、人员、对数字化数据管理的需求,以及常见的法律障碍。此外,提高依从性的沟通已被认为是一项日益严峻的挑战。ii)测试必须对sars-cov2具有高度特异性,并且几乎没有假阳性,以防止基于错误结果将人员隔离,以便建立信任。基于ngs的sars-cov2检测可以通过以比taqman探针可以达到的更特异的精度检测基因组片段来提供这样的结果。此外,平行检测两个片段代表独立检测。iii)大规模测试的成本必须尽可能低,以合理地实现规模化。这里呈现的sarseq依赖于可以大规模购买和在内部生产的酶。缓冲液由标准盐制成。iv)大规模测试不得干扰在医疗/诊断设施中进行的测试或与其相混淆。因此,它既不应在同一设施进行,也不应与诊断有症状患者所需的供应竞争。sarseq完全依赖于经典分子生物学设施(如大学、研究所、生物技术公司和制药公司)中足够数量的设备。v)测试必须大规模化。我们设置了sarseq最多平行分析36k样本,并在单次测序运行中测试多达20k样本。因此,ngs容量并不代表该方法的实际限制。sarseq受到样本供应以及可以实施的pcr通量的限制。
[0287]
除了sars-cov2,该管道还可以快速适应额外的扩增子,以检测其他传染因子,例如新出现的病毒。我们已经对sars-cov2、甲型和乙型流感以及hrv实施了平行筛查,并旨在将其延展到具有重叠临床表现的其他呼吸道感染,例如rsv。此外,任何新出现的病毒都可以添加到该专题中。此外,sarseq不仅限于呼吸道试样,还可以将管道延展到其他人体样本,甚至监测管道,例如废水监测。
[0288]
sarseq的一个限制是检测的时间要求。必须进行两次pcr反应,然后进行测序(ngs)和分析,因此理论时间要求约为15小时。因此,sarseq并不非常适合需要立即获得结果的情况。这种情况下,抗原测试或rt-lamp是更好的方法。相反,sarseq理想地用于对非常大规模的感染进行定期(例如每周)监测。此外,sarseq目前只是半定量的。如果需要准确的病毒滴度,例如以终止隔离,可能最好使用非多重qpcr。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献