一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

核酸序列浓度的确定的制作方法

2022-06-06 00:33:14 来源:中国专利 TAG:

核酸序列浓度的确定
1.相关申请的交叉引用
2.本技术要求2019年10月16日提交的欧洲专利申请号ep19306346的优先权,其内容通过引用整体并入本文。
技术领域
3.本发明涉及测量生物样品中核酸序列的浓度的方法。


背景技术:

4.正常人在每个健康的二倍体细胞中都有两组23条染色体。在一些情况下,可能会在任何一条或多条所述染色体上发生突变,从而导致染色体异常。这些异常可能与遗传疾病、癌症和其他疾病有关。染色体异常的检测可以识别容易患上特定疾病的个体或确定最适合给定个体的治疗。在这方面,检测染色体异常是非常有价值的。
5.除了人类的健康,染色体异常的检测还与其他物种相关,包括但不限于昆虫、细菌、植物和含有有机体的混合样品,例如土壤和食品,其中可能会因基因工程而进行转基因生物(gmo)检测,例如用于质量控制。检测病毒、类病毒和其他不含染色体的基因组中发生的基因突变也高度相关。
6.在这种背景下,以定性和定量的方式检测基因组异常的特征(即生物样品中特定核酸序列的变化)是相关的。
7.这种检测目前通过扩增目标样品中的靶核酸来有效地进行。可以通过将寡核苷酸引物与样品结合,然后使样品经受与核酸定量相容的扩增条件(例如聚合酶链式反应(pcr)条件)来进行扩增。这些扩增方法能够产生单个靶核酸序列的多个拷贝,从而达到检测阈值。
8.然而,以定量方式测量生物样品中此类特定核酸序列的浓度更为相关,例如,当目标不仅是检测而且还要量化遗传疾病,例如监测罕见突变的进化时。
9.在一些情况下,生物样品中存在的核酸受损,通常以短长度的序列被片段化。在这样的片段化核酸群体中,在给定的pcr测定中要扩增的序列有时是随机切割的。在这种情况下,该核酸序列的扩增不能通过pcr方法进行,从而导致对目标核酸序列存在的低估。
10.本发明提出了一种纠正这种低估问题的方法。


技术实现要素:

11.本发明涉及确定未片段化核酸中被测序列(如下文进一步定义)的浓度的方法,包括用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,从而获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
12.在一些实施方案中,提供了一种确定未片段化核酸中被测序列的浓度的方法,包括以下步骤:
13.i.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;和
14.ii.用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
15.在一些实施方案中,提供了一种确定未片段化核酸中被测序列的浓度的方法,包括以下步骤:
16.i.确定包含片段化核酸的样品中核酸的长度分布(ld),其中片段化核酸来源于所述未片段化核酸;
17.ii.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;和
18.iii.用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
19.在一些实施方案中,该方法包括:
20.i.提供片段化核酸的样品,所述片段化核酸来源于所述未片段化核酸;
21.ii.提供所述片段化核酸的核酸片段长度分布(ld);
22.iii.用测量方法测量所述片段化核酸样品中所述被测序列的浓度;
23.iv.根据所述片段化核酸的所述核酸片段长度分布(ld)和所述测量方法的参数确定校正系数;和
24.v.用所述校正系数校正片段化核酸中所述被测序列的浓度,以获得未片段化核酸中所述被测序列的浓度。
25.在实施方案中,片段化核酸的样品是以下三类的任意组合:
26.i.无细胞样品或含细胞样品;
27.ii.自然片段化的样品或人工片段化的样品;和
28.iii.任何类型的脱氧核糖核酸(dna)或核糖核酸(rna)。
29.在实施方案中,测量方法是等温定量核酸扩增方法,优选选自环介导的等温扩增和基于定量核酸序列的扩增。
30.在另一个实施方案中,测量方法是非等温定量核酸扩增方法,优选选自定量聚合酶链式反应、实时聚合酶链式反应、数字聚合酶链式反应、多重聚合酶链式反应和多重数字聚合酶链式反应。
31.在实施方案中,如下文进一步定义,所述测量方法的参数包括要扩增的序列的长度。在该实施方案的具体配置中,至少5%的核酸片段的长度比要扩增的序列的长度短。在该实施方案的另一具体配置中,至多95%的核酸片段的长度比要扩增的序列的长度短。
32.在实施方案中,要扩增的序列的长度大于40bp且小于200bp,优选大于50bp且小于170bp,更优选大于65bp且小于150bp,甚至更优选大于70bp且小于130bp。
33.在实施方案中,核酸片段长度分布(ld)包含在25bp至350bp、优选30bp至320bp、更优选35bp至290bp、甚至更优选40bp至270bp的范围内。
34.本发明进一步涉及一种确定未片段化核酸中第一被测序列s1的第一浓度和第二被测序列s2的第二浓度的函数的方法,包括以下步骤:
35.i.根据上述任意确定方法确定所述未片段化核酸中s1的浓度;
36.ii.根据上述任意确定方法确定所述未片段化核酸中s2的浓度;和
37.iii.计算所述s1浓度和所述s2浓度的所述函数;
38.其中所述s1浓度和所述s2浓度是在同一样品中确定的;并且其中与s1相关的要扩增的序列的长度不同于与s2相关的要扩增的序列的长度。
39.本发明还涉及一种被配置为确定未片段化核酸中被测序列的浓度的系统,其包括:
40.i.被配置为测量片段化核酸的样品中所述被测序列的浓度的模块,所述片段化核酸来源于所述未片段化核酸;
41.ii.被配置为根据所述片段化核酸的核酸片段长度分布(ld)和所述测量的参数计算校正系数的模块;和
42.iii.被配置为用所述校正系数计算未片段化核酸中所述被测序列的浓度的模块。
43.在具体配置中,所述被配置为测量所述片段化核酸中所述被测序列的浓度的模块是等温定量核酸扩增模块,其优选选自环介导的等温扩增模块和基于定量核酸序列的扩增模块。
44.在替代配置中,所述被配置为测量所述片段化核酸中所述被测序列的浓度的模块是非等温定量核酸扩增模块,其优选选自定量聚合酶链式反应模块、实时聚合酶链式反应模块、数字聚合酶链式反应模块、多重聚合酶链式反应模块和多重数字聚合酶链式反应。
45.在一个实施方案中,所述测量的参数包括要扩增的序列的长度。
46.定义
47.在本发明中,下列术语具有以下含义:
48.术语“扩增子”是指扩增反应的核酸产物。扩增子可以是单链或双链的,或它们的组合。
49.术语“扩增”是指复制随时间重复发生以形成模板分子的至少一个片段的多个拷贝的反应。随着扩增的进行,扩增可产生拷贝数的指数或线性增加。典型的扩增使拷贝数和/或信号增加超过1,000倍。用于本文所公开的基于液滴的测定的示例性扩增反应可以包括聚合酶链式反应(pcr)或连接酶链式反应,它们中的每一个均由热循环驱动。基于液滴的测定还可以或可替代地使用可以等温进行的其他扩增反应。扩增可以在扩增混合物中进行,或测定其发生,扩增混合物是能够在组合物中产生核酸靶分子(如果存在的话)的多个拷贝的任何组合物。“扩增混合物”可以包括至少一种引物或引物对、至少一种探针、至少一种复制酶(例如,至少一种聚合酶,例如至少一种dna和/或rna聚合酶,例如反转录酶)和脱氧核苷酸(和/或核苷酸)三磷酸(dntp和/或ntp)和含有复制酶活性所必需的任何成分的缓冲液等的任意组合。
50.术语“测定”是指用于表征样品的过程和/或反应,以及从该过程和/或反应获得的任何信号、值、数据和/或结果。
51.术语“切割”等同于术语“片段化”,指的是核酸序列。
52.术语“被测序列”是指在本发明的方法中从样品中被定量的精确序列。在点突变的情况下,被测序列包括被检测到的突变。在一些实施方案中,使用荧光报道分子。当使用与特定序列连接的荧光报道分子时(例如,如图1a所示),“被测序列”可能比要扩增的序列短并包含在要扩增的序列中(如本文进一步定义的)。当使用游离的荧光报道分子时(例如,如
图1b所示),被测序列通常是扩增子。
53.术语“数字pcr”或“dpcr”是指基于有多少样品分区支持靶标的扩增,在样品的分区中进行以确定样品中核酸靶标的存在/不存在、浓度和/或拷贝数的pcr测定。除核酸之外,数字pcr的概念可以扩展到其他类型的分析物。
54.术语“标记”是指与任何实体(例如化合物、生物颗粒(例如,细胞、细菌、孢子、病毒或细胞器)或液滴)连接或引入任何实体(例如化合物、生物颗粒(例如,细胞、细菌、孢子、病毒或细胞器)或液滴)中的可识别和/或可区分的标志物或标识。例如,标记可以是使实体在光学上可检测和/或在光学上可区分的染料。用于标记的示例性染料是荧光染料(荧光团)和荧光猝灭剂。
55.与核酸相关的术语“长度”是指形成单链分子的连续核苷酸或碱基的数量或形成双链分子的连续碱基对的数量。长度以核苷酸和碱基对量度。
56.术语“多重数字pcr”是指为同时扩增至少两个不同的核酸序列,特别是同时扩增两个、三个、四个、五个、六个、七个、八个或更多个不同的核酸序列(如同在一个容器中一起进行许多单独的pcr反应)进行的数字pcr测定。该过程使用多种引物扩增样品中的核酸。特别地,“多重数字pcr”包括“双重数字pcr”和“三重数字pcr”。相反,为扩增一个核酸序列而进行的数字pcr测定是“单重数字pcr”,通常简称为“数字pcr”。
57.术语“多重pcr”是指为同时扩增至少两个不同的核酸序列,特别是同时扩增两个、三个、四个、五个、六个、七个、八个或更多个不同的核酸序列(如同在一个容器中一起进行许多单独的pcr反应)进行的pcr测定。该过程使用多种引物扩增样品中的核酸。特别地,“多重pcr”包括“双重pcr”和“三重pcr”。相反,为扩增一个核酸序列而进行的pcr测定是“单重pcr”,通常简称为“pcr”。
58.术语“核酸”是指脱氧核糖核酸(dna)或核糖核酸(rna)两者,无论它是扩增产物、合成产生的、rna逆转录产物还是天然存在的。通常,核酸是单链或双链分子,由天然存在的核苷酸组成。
59.术语“核苷酸”除了指天然存在的核糖核苷酸或脱氧核糖核苷酸单体外,在本文中应理解为指关于使用该核苷酸的特定背景(例如,与互补碱基杂交:腺嘌呤(a)与胸腺嘧啶(t)配对,鸟嘌呤(g)与胞嘧啶(c)配对)功能上等同的其相关结构变体,包括衍生物和类似物以及化学修饰,除非上下文另有明确说明。
60.术语“分区”是指大体积的分隔部分。分区可以是从形成大体积的样品(例如制备的样品)产生的样品分区。从大体积产生的分区可以在大小上基本一致或可以具有不同的大小(例如,两个或更多个分离的、均匀大小的分区的集合)。示例性分区是“液滴”。分区的大小也可以以预定的大小分布或随机的大小分布变化。
61.术语“pcr”或“聚合酶链式反应”是指依赖加热和冷却的交替循环(即热循环)来实现连续复制循环的核酸扩增测定。pcr可以通过在两个或更多个温度设定点之间的热循环进行,例如较高的解链(变性)温度和较低的退火/延伸温度,或者通过在三个或更多个温度设定点之间的热循环进行,例如较高的解链温度,较低的退火温度和中间延伸温度等。退火和/或延伸温度可能在循环反应期间发生变化的其他形式的pcr(例如touchdown pcr)可以包括在该定义中。
62.术语“引物”是指当置于开始多核苷酸延伸的条件下时能够作为模板指导的核酸
合成的起始点起作用的寡核苷酸;例如,在合适的缓冲液中包含必需的三磷酸核苷(由复制的模板决定)和聚合酶以及合适的温度或温度循环(例如,如在聚合酶链式反应中)的条件下。
63.术语“探针”是指与至少一种标记(如至少一种染料)连接的核酸。
64.术语“定性pcr”是指基于pcr的分析,其确定样品中是否存在靶标,通常无需对靶标的存在进行任何实质性定量。在示例性实施方案中,可以通过确定分区包包含至少预定百分比的阳性液滴(阳性样品)或不包含(阴性样品)来进行定性的数字pcr。
65.术语“定量pcr”、“qpcr”、“实时定量聚合酶链式反应”或“动力学聚合酶链式反应”是指基于pcr的分析,其确定样品中靶标的浓度和/或拷贝数。该技术使用pcr同时扩增和定量靶核酸,其中定量是依靠仅在与靶核酸杂交后才可检测出的嵌入荧光染料或含有仅在序列扩增时才可检测出的荧光报道分子的序列特异性探针。
66.术语“实时pcr”是指在反应期间(例如在反应的最终热循环之前完成一个或多个热循环之后)测量扩增子形成的基于pcr的分析。实时pcr通常基于靶标扩增的动力学提供靶标的定量。
67.术语“复制”是指形成核酸或其片段的拷贝(即,直接拷贝和/或互补拷贝)的过程。复制通常涉及酶,例如聚合酶和/或连接酶等。复制的核酸和/或片段是用于复制的模板(和/或靶标)。
68.术语“样品”是指来自任何合适来源的目标化合物、组合物和/或混合物。样品是用于测定分析样品方面(例如与可能存在于样品中的至少一种分析物相关的方面)的一般目标对象。样品可以在其天然状态、收集时和/或改变的状态下进行分析,例如,在储存、保存、提取、裂解、稀释、浓缩、纯化、过滤、与一种或多种试剂混合、预扩增(例如,通过在pcr之前对样品进行有限的pcr循环(例如,《15个)来实现靶标富集)、在pcr之前去除扩增子(例如,用尿嘧啶-d-糖基化酶(udg,也称为ung,尿嘧啶-n-糖基化酶基因)处理)以消除任何先前产生的扩增子造成的遗留污染(即,所述扩增子可以用udg消化,因为它是用dutp而不是dttp产生的))、分区或其任何组合等后。临床样品可能包括鼻咽洗液、血液、血浆、无细胞血浆、血沉棕黄层、唾液、尿液、粪便、唾液、粘液、伤口拭子、组织活检、奶汁、液体抽吸物、拭子(例如,鼻咽拭子)和/或组织等。可出于诊断目的(例如,定量测量临床分析物,例如传染原)或出于监测目的(例如,确定目标环境分析物(例如生物威胁剂)是否超过预定阈值)收集样品。
69.术语“要扩增的序列”是指包括“被测序列”(如上定义)的核酸,从正向引物的序列开始,到与反向引物互补的序列结束,并包含位于引物序列之间的任何另外的碱基对。要扩增的序列的扩增产物是扩增子。最终,扩增允许通过确定浓度对“要扩增的序列”进行定量。要扩增的序列的长度记为“l
a”。
附图说明
70.图1是定量核酸扩增方法的示意图,作为实例而非限制。这里,双链片段化核酸由水平黑色实线表示。两个引物(正向引物fp和反向引物rp)分别限定了要扩增的序列(sa)的左右边界。要扩增的序列(sa)的两条链在扩增过程中都被复制。在图1a中,被测序列(ds)是要扩增的序列(sa)的一部分。荧光标记的探针(probe)与被测序列特异性结合。在图1b中,
被测序列(ds)和要扩增的序列(sa)相同。荧光染料(fd)嵌入在扩增过程中产生的双链核酸中。
71.图2是显示在实施例e1中使用的样品中的dna片段的长度分布(ld)的图,长度分布集中在150bp左右。f(i)是样品中片段的长度为i个碱基对(x轴)的概率(y轴-任意单位)。
72.图3显示了对图2中所示的样品估算的,作为要扩增的序列的长度la(以碱基对bp为单位)的函数的要扩增的序列未被切割的概率p。
73.图4显示了对图2中所示的样品估算的,作为要扩增的序列的长度la(以碱基对bp为单位)的函数的预测的校正因子(pcf)。
具体实施方式
74.本技术提供了用于校正包含片段化核酸的核酸样品中被测序列的测量浓度的方法和系统。本文提供的方法和系统允许确定更接近未片段化核酸中被测序列的真实浓度的被测序列的校正浓度。当通过扩增包含被测序列的要扩增的序列来测量被测序列的浓度时,包含要扩增的序列的一部分但长度比要扩增的序列的长度短的片段将不会被复制。复制截短的靶标区域(即要扩增的序列)的这种失败导致浓度被低估。本文提供的方法可用于校正对未片段化核酸样品中核酸浓度产生的低估。
75.因此,本发明在一些方面提供了一种确定未片段化核酸中被测序列的浓度(包括确定所述被测序列的拷贝数)的方法,包括以下步骤(下文称为“基本方法”)。在一些方面,本发明提供了一种校准包含片段化核酸分子的样品中被测序列的浓度(包括所述被测序列的拷贝数)的方法。还提供了可用于本文所述方法的试剂盒、软件、设备和其他制品。
76.i.本技术的方法
77.本发明涉及一种确定未片段化核酸中被测序列的浓度的方法,包括用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,从而获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布和测量方法的至少一个参数。
78.在一些实施方案中,提供了一种确定未片段化核酸中被测序列的浓度的方法,包括以下步骤:
79.i.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;和
80.ii.用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
81.在一些实施方案中,提供了一种确定未片段化核酸中被测序列(如下文进一步定义)的浓度的方法,包括以下步骤:
82.i.在包含片段化核酸的所述样品中扩增包含所述被测序列的靶标区域(以下称为“要扩增的序列”);
83.ii.测量所述被测序列的浓度;和
84.iii.用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
85.在一些实施方案中,本文提供了一种确定未片段化核酸中被测序列的浓度的方
法,包括以下步骤:
86.i.确定包含片段化核酸的样品中核酸的长度分布(ld),其中片段化核酸来源于所述未片段化核酸;
87.ii.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;以及用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
88.在一些实施方案中,本文提供了校准包含片段化核酸的样品中被测序列的测量浓度的方法,以使其更接近地反映未片段化核酸中被测序列的浓度,包括以下步骤:
89.i.确定包含片段化核酸的样品中核酸的长度分布(ld),其中片段化核酸来源于所述未片段化核酸;和
90.ii.用校正系数校正测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和用于确定被测序列的浓度的测量方法的至少一个参数。
91.在一些实施方案中,本文提供了一种校准包含片段化核酸的样品中被测序列的测量浓度的方法,其中被测序列的测量浓度是样品中被测序列的实际浓度的低估,包括以下步骤:
92.i.确定包含片段化核酸的样品中核酸的长度分布(ld),其中片段化核酸来源于所述未片段化核酸;和
93.ii.用校正系数校正测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和用于确定被测序列的浓度的测量方法的至少一个参数。
94.在一些实施方案中,本文提供了一种校正包含片段化核酸的样品中被测序列的测量浓度的方法,以使其更接近地反映未片段化核酸中被测序列的浓度,包括以下步骤:
95.i.确定包含片段化核酸的样品中核酸的长度分布(ld),其中片段化核酸来源于所述未片段化核酸;
96.ii.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;和
97.iii.用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
98.在一些实施方案中,本文提供了一种校正包含片段化核酸的样品中被测序列的测量浓度的方法,其中被测序列的测量浓度是样品中被测序列的真实浓度的低估,包括以下步骤:
99.i.确定包含片段化核酸的样品中核酸的长度分布(ld),其中片段化核酸来源于所述未片段化核酸;
100.ii.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;和
101.iii.用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
102.在一些实施方案中,本技术的方法不包括获得片段化核酸的序列。在一些实施方案中,该方法不包括获得或预测片段化核酸的遗传坐标。在一些实施方案中,该方法不包括将片段化核酸组装成连续序列。
103.在一些实施方案中,片段化核酸的样品是以下三类的任意组合,如下文“核酸样品和长度分布”小节中所述:
104.i.无细胞样品或含细胞样品;
105.ii.自然片段化的样品或人工片段化的样品;和
106.iii.任何类型的脱氧核糖核酸或核糖核酸。
107.在一些实施方案中,测量方法不包括对样品中的核酸进行测序。在一些实施方案中,测量被测序列的浓度可以包括扩增包含被测序列的要扩增的序列。在一些实施方案中,测量方法是等温定量核酸扩增方法(例如,环介导的等温扩增或基于定量核酸序列的扩增)。在一些实施方案中,测量方法是非等温定量核酸扩增方法(例如,定量聚合酶链式反应、实时聚合酶链式反应、数字聚合酶链式反应、多重聚合酶链式反应和多重数字聚合酶链式反应)。
108.在根据任何前述方法的一些实施方案中,如图1b所示,被测序列和要扩增的序列是相同的,并且测量步骤包括对标记向扩增过程中产生的核酸中的掺入(例如嵌入染料,例如包含荧光团的荧光染料)进行检测。
109.在一些实施方案中,被测序列是要扩增的序列的子集,和/或测量步骤包括检测标记的探针与被测序列(例如,包含荧光团的荧光标记的探针)的结合,如图1a所示。
110.在本发明的基本方法的测量步骤中实施的测量方法本质上使用一些与确定校正系数相关的参数。在具体实施方案中,测量方法是使用复制和扩增混合物的扩增方法。
111.在一些实施方案中,该方法可以进一步包括基于样品中核酸的长度分布和所述测量方法的至少一个参数确定校正系数的步骤。
112.在一些实施方案中,测量方法的至少一个参数可以包括要扩增的序列的长度。在一些实施方案中,测量方法的至少一个参数仅包括要扩增的序列的长度。
113.因此,例如,在一些实施方案中,本文提供了一种确定未片段化核酸中被测序列的浓度的方法,包括以下步骤:
114.i.确定包含片段化核酸的样品中核酸的长度分布(ld),其中片段化核酸来源于所述未片段化核酸;
115.ii.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;并用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和包含被测序列的要扩增的序列的长度。
116.在一些实施方案中,本文提供了一种校准包含片段化核酸的样品中被测序列的测量浓度的方法,以使其更接近地反映未片段化核酸中被测序列的浓度,包括以下步骤:
117.i.确定包含片段化核酸的样品中核酸的长度分布(ld),其中片段化核酸来源于所述未片段化核酸;和
118.ii.用校正系数校正测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和包含被测序列的要扩增的序列的长度。
119.在一些实施方案中,本文提供了一种校正包含片段化核酸的样品中被测序列的测量浓度的方法,以使其更接近地反映未片段化核酸中被测序列的浓度,包括以下步骤:
120.i.确定包含片段化核酸的样品中核酸的长度分布(ld),其中片段化核酸来源于所
述未片段化核酸;
121.ii.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;和
122.iii.用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和包含被测序列的要扩增的序列的长度。
123.要扩增的序列的长度可以表示为la,它实际上是引物(正向和反向)的长度加上位于引物之间的任何另外的碱基对的长度的总和。
124.在实施方案中,要扩增的序列的长度la等于或长于引物(正向和反向)的长度,并且在一些实施方案中不超过约200bp,例如不超过约170bp,不超过150bp,或不超过130bp。
125.对于复制,引物必须首先与核酸结合。当引物的所有碱基与核酸互补(对于dna,腺嘌呤与胸腺嘧啶互补,鸟嘌呤与胞嘧啶互补;对于rna,腺嘌呤与尿嘧啶互补,鸟嘌呤与胞嘧啶互补)时,结合是最佳的,但如果引物的几个碱基与核酸不互补,结合也可能是有效的。换句话说,如果核酸序列在引物应该结合的地方被缩短了几个碱基,复制过程仍然可以是有效的。相关参数可以是la,或l
a-n,其中n是大于0的整数;或r.la(r乘以la),其中缩短系数r的范围在75%到100%之间,前提是r.la始终是整数值。在一些实施方案中,n是1至15、1至10或1至5的整数。在一些实施方案中,r是大于0.75且小于1、大于0.8且小于1、大于0.85且小于1、大于0.9且小于1或大于0.95且小于1的值。
126.使用长度参数la,可以根据在下文“确定校正系数”小节中描述的任何实施方案来确定校正系数。
127.校正系数可以用l
a-n近似地计算,其中n是大于0(例如,1至15、1至10或1至5)的整数,或用r.la(r乘以la)近似地计算,其中缩短系数r的范围在75%和100%之间并且前提是r.la始终是整数值,以考虑仍会导致复制的缩短片段,如在下文“确定校正系数”小节中所述。
128.在一些实施方案中,提供了一种确定未片段化核酸中被测序列的浓度的方法,包括以下步骤:i.确定包含片段化核酸的样品中核酸的长度分布,其中片段化核酸来源于所述未片段化核酸;ii.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;和iii.用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,
129.其中校正系数由以下确定:
[0130][0131]
其中l是(l
a-n)或r*la,
[0132]
其中la是要扩增的序列的长度,
[0133]
其中n是大于0且小于15的整数;
[0134]
其中r在0.75和1之间;
[0135]
其中f(i)是样品中片段长度为i个碱基对的概率;和
[0136]
其中是核酸片段的平均长度。
[0137]
在一些实施方案中,l是la。
[0138]
关于核酸片段的长度分布,长度小于la(或l
a-n或r.la)的片段无论如何都不会被复制。如果这样的片段包含要扩增的序列的一部分,它就不会被复制,这会导致浓度被低估。
[0139]
本文所述的校正系数也可以基于要扩增的序列基于序列片段化偏差(bias)而被片段化的概率。在一些实施方案中,要扩增的序列将被片段化的相对概率是已知的。在一些实施方案中,要扩增的序列将被片段化的概率取决于片段化的来源(例如,天然存在的核酸片段化或通过物理方法如超声处理的片段化)。例如,可以通过将调整前的校正系数与要扩增的序列基于序列片段化偏差而被片段化的概率相乘来调整校正系数。替代地,可以通过修改片段长度分布(ld)曲线来解释要扩增的序列基于序列片段化偏差而被片段化的概率。
[0140]
在一些实施方案中,测量方法的至少一个参数进一步包括选自由以下组成的组的扩增步骤的参数:要扩增的序列的gc含量;扩增引物的gc含量;扩增引物的长度;使用的聚合酶类型;和扩增循环的温度。在一些实施方案中,扩增步骤的另外的参数可以作为与片段长度分布(ld)曲线相乘的系数或作为如在下文“校准校正系数”小节中所述的与校正系数相乘的校准系数被并入。
[0141]
在一些实施方案中,测量方法的至少一个参数进一步包括选自由以下组成的组的测量步骤的参数:检测探针的序列;所用荧光团的光稳定性;所用荧光团的化学稳定性;所用荧光团的量子产率;和所用荧光团的波长。在一些实施方案中,扩增步骤的另外的参数可以作为与片段长度分布(ld)曲线相乘的系数或作为如在下文“校准校正系数”小节中所述的与校正系数相乘的校准系数被并入。
[0142]
在一些实施方案中,校正包括将在包含片段化核酸的样品中测量的浓度乘以校正系数。在一些实施方案中,校正包括将在包含片段化核酸的样品中测量的浓度乘以校正系数和另外的校正因子。在一些实施方案中,另外的校正因子基于要扩增的序列基于序列片段化偏差而被片段化的概率。在一些实施方案中,另外的校正因子基于如上所述的测量方法的至少一个参数。在一些实施方案中,另外的校正因子基于影响序列扩增的测量方法的至少一个参数(例如,要扩增的序列的gc含量)。在一些实施方案中,另外的校正因子基于影响被测序列的检测的测量方法的至少一个参数(例如,所用荧光团的光稳定性或化学稳定性)。在一些实施方案中,另外的校正因子基于如在下文“校准校正系数”小节中所述的实验确定的校准因子。
[0143]
在一些实施方案中,如果样品中至少5%的核酸的长度比要扩增的序列的长度短,则应用校正。在一些实施方案中,样品中不超过95%的核酸片段的长度比要扩增的序列的长度短。
[0144]
本技术还提供了一种确定同一未片段化核酸样品中第一被测序列(被测序列s1)的第一浓度和第二被测序列(被测序列s2)的第二浓度的函数的方法。所述函数可以是分数或比率。
[0145]
为此,本文所述的方法可以进一步包括:
[0146]
i.用测量方法测量所述包含片段化核酸的样品中第二被测序列的浓度;和
[0147]
ii.用校正系数校正片段化核酸中所述第二被测序列的浓度,以获得未片段化核酸中所述第二被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
[0148]
在一些实施方案中,测量第二被测序列的浓度包括扩增包含第二被测序列的要扩增的第二序列。在一些实施方案中,测量方法包括多重扩增步骤。在一些实施方案中,要扩增的第一序列的长度不同于要扩增的第二序列的长度,并且对第一被测序列和第二被测序列应用不同的校正系数。在一些实施方案中,要扩增的第一序列和要扩增的第二序列的长度相同。在一些实施方案中,测量方法的其他参数在第一被测序列和第二被测序列之间不同(例如,与探针的结合/检测相关的参数,或如在下文“确定校正系数”小节中所述的影响扩增的任何参数)。
[0149]
在一些实施方案中,要扩增的第一序列包括突变等位基因被测序列或变异等位基因被测序列,要扩增的第二序列包括相应的参考等位基因被测序列。在一些实施方案中,与要扩增的第二序列所包含的相应参考序列相比,要扩增的第一序列包含插入或缺失。在一些实施方案中,该方法进一步包括确定与第二被测序列相比的第一被测序列的校正突变等位基因分数(maf)的步骤。在一些实施方案中,该方法进一步包括确定与第二被测序列相比的第一被测序列的校正变异等位基因分数(vaf)的步骤。
[0150]
在一些实施方案中,要扩增的第一序列从包含拷贝数变异(cnv)的变体核酸扩增,要扩增的第二序列从参考核酸扩增。在一些实施方案中,该方法进一步包括确定与变体序列相比的参考序列的校正拷贝数变动(cnv
real
)的步骤。
[0151]
在任何前述实施方案中,该方法可以进一步包括基于在具有第一片段长度分布(ld1)的第一核酸样品和具有第二片段长度分布(ld2)的第二核酸样品中被测序列的测量浓度来校准校正系数的步骤。
[0152]
核酸样品和长度分布
[0153]
在本文提供的一些实施方案中,提供了包含片段化核酸的样品。片段化核酸实际上是来自原始核酸(即未片段化核酸)的已经经历了片段化的片段。事实上,未片段化核酸中被测序列的浓度是受欢迎的测量,但可用的样品实际上是片段化的。在一些实施方案中,该方法不包括将未片段化核酸片段化以产生包含片段化核酸的样品。
[0154]
样品可以包含任何类型的片段化核酸。特别地,样品可以是无细胞样品,即核酸已经从细胞(如唾液、血浆、尿液或全血)中释放出来的生物液体;或含细胞样品,即基本上含有细胞的生物样品,例如活检。此外,样品可以是天然片段化的样品,即未片段化核酸在取样前(即在活体中)或在取样后由于保存处理或储存条件而自然降解。样品最终可能是人工片段化的样品,即对未片段化核酸进行取样,然后根据测量方法的需要进行人工降解。此外,样品可以是脱氧核糖核酸(dna)或核糖核酸(rna)。
[0155]
无细胞的天然片段化的dna样品的实例是:
[0156]
·
在细胞凋亡过程中被半胱天冬酶激活的dna酶消化并随后在垂死细胞的吞噬后被溶酶体dna酶ii消化的dna;和
[0157]
·
被血浆核酸酶切割的循环dna。
[0158]
天然片段化的rna样品的实例包括但不限于被核糖核酸酶(例如核酸内切酶和核酸外切酶)切割的信使rna。这些样品可以是无细胞样品或含细胞样品。
[0159]
人工片段化的dna和rna样品的实例是:
[0160]
·
在福尔马林固定后将核酸片段化然后进行石蜡包埋(ffpe)的那些(含细胞样品的实例);和
[0161]
·
使用声学剪切法将核酸片段化的那些(无细胞样品的实例)。
[0162]
在本发明基本方法的测量步骤中实施的测量方法可以是等温定量核酸扩增方法或非等温定量核酸扩增方法。
[0163]
等温定量核酸扩增方法可以是环介导的等温扩增或基于定量核酸序列的扩增。它可以与逆转录步骤结合以检测rna。
[0164]
非等温定量核酸扩增方法可以是定量聚合酶链式反应、实时聚合酶链式反应、数字聚合酶链式反应、多重聚合酶链式反应或多重数字聚合酶链式反应。它可以与逆转录步骤结合以检测rna。
[0165]
在所述方法的一些实施方案中,提供了核酸片段的长度分布(ld)。在本发明中,片段是指由原始未片段化核酸的天然或人工片段化产生的单个核酸。作为说明而非限制,长度为10000个碱基对(bp)的原始未片段化核酸可以例如被片段化为25个长度为75bp的片段、50个长度为100bp的片段和25个长度为125bp的片段,产生短链核酸的群体。然后可以定义该群体中核酸片段的长度分布,即,对于所有可能的长度,具有给定长度的片段的数量。长度分布也可以用通常的统计函数(例如,高斯或泊松分布)或平均值和标准偏差等参数来定义。
[0166]
适用于测量样品中核酸片段的长度分布的设备是例如来自agilent technologies的tape station 4200仪器或bioanalyzer 2100仪器,或来自perkinelmer的labchip gx touch nucleic acid analyzer。
[0167]
关于核酸片段的长度分布,长度小于要扩增的序列的长度la(或l
a-n或r.la,如上所述)的片段将不会被复制。如果这样的片段包含要扩增的序列的一部分,它将不会被复制,这会导致浓度被低估。本文提供的方法可用于校正对未片段化核酸样品中核酸浓度产生的低估。
[0168]
如果只有少数片段的长度短于la(或l
a-n或r.la),则校正系数可能会很小。事实上,申请人注意到当至少5%的核酸片段的长度短于la(或l
a-n或r.la)时,校正系数更相关。长度短于la(或l
a-n或r.la)的片段的比例可以是至少6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%或85%。在一些实施方案中,当至少5%的核酸片段的长度比la(或l
a-n或r.la)短时,应用确定校正系数和校正被测序列的浓度的步骤。
[0169]
此外,如果几乎所有片段的长度都短于la(或l
a-n或r.la),则校正系数可能会非常高。事实上,申请人注意到,当最多95%的核酸片段的长度短于la(或l
a-n或r.la)时,校正系数更相关。长度短于la(或l
a-n或r.la)的片段的比例可以是最多94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、
30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%或15%。
[0170]
特别地,长度短于la(或l
a-n或r.la)的片段的比例可以在选自以下的范围内:5%-95%、5%-90%、5%-85%、5%-80%、5%-75%、5%-70%、5%-65%、5%-60%、5%-55%、5%-50%、10%-95%、10%-90%、10%-85%、10%-80%、10%-75%、10%-70%、10%-65%、10%-60%、10%-55%、10%-50%、15%-95%、15%-90%、15%-85%、15%-80%、15%-75%、15%-70%、15%-65%、15%-60%、15%-55%、15%-50%、20%-95%、20%-90%、20%-85%、20%-80%、20%-75%、20%-70%、20%-65%、20%-60%、20%-55%、20%-50%、25%-95%、25%-90%、25%-85%、25%-80%、25%-75%、25%-70%、25%-65%、25%-60%、25%-55%、25%-50%、30%-95%、30%-90%、30%-85%、30%-80%、30%-75%、30%-70%、30%-65%、30%-60%、30%-55%、30%-50%、35%-95%、35%-90%、35%-85%、35%-80%、35%-75%、35%-70%、35%-65%、35%-60%、35%-55%、35%-50%、40%-95%、40%-90%、40%-85%、40%-80%、40%-75%、40%-70%、40%-65%、40%-60%、40%-55%、40%-50%、45%-95%、45%-90%、45%-85%、45%-80%、45%-75%、45%-70%、45%-65%、45%-60%、45%-55%、45%-50%。
[0171]
在另一个实施方案中,la长于40bp且短于200bp,优选长于50bp且短于170bp,更优选长于65bp且短于150bp,甚至更优选长于70bp且短于130bp。在一些实施方案中,要扩增的序列的长度la在65-70bp、70-75bp、75-80bp、80-90bp、90-100bp、100-110bp、110-120bp或120-130bp范围内。
[0172]
在另一个实施方案中,核酸片段长度分布包含在10bp至1000bp的范围内。核酸片段长度分布优选包含在25bp至350bp、优选30bp至320bp、更优选35bp至290bp、甚至更优选40bp至270bp的范围内。
[0173]
确定校正系数
[0174]
在一些实施方案中,确定校正系数。确实,如果原始未片段化核酸在要扩增的序列内部发生片段化,所用的测量方法无法检测到要扩增的序列。这种检测的缺失导致浓度被低估。该校正系数取决于核酸片段长度分布,以及与定义要扩增的序列拷贝在片段化期间被切割的概率相关的参数,例如要扩增的序列的长度,并且可能取决于与测量方法具体相关的参数。
[0175]
在一些实施方案中,用校正系数校正被测序列的测量浓度,以获得未片段化核酸中(即原始样品中)被测序列的浓度。
[0176]
在一些实施方案中,为测量被测序列的浓度而实施的测量方法固有地使用一些与确定校正系数相关的参数。在一些实施方案中,测量方法是使用复制和扩增混合物的扩增方法。
[0177]
特别相关的参数是要扩增的序列的长度,以下称为la。要扩增的序列的长度la实际上是引物(正向和反向)的长度加上位于引物之间的任何另外的碱基对的长度的总和。
[0178]
在实施方案中,要扩增的序列la的长度等于或长于引物(正向和反向)的长度,并且小于200bp,优选小于170bp,更优选小于150bp,甚至更优选小于130bp。
[0179]
对于复制,引物必须首先与核酸结合。当引物的所有碱基与核酸互补(对于dna,腺嘌呤与胸腺嘧啶互补,鸟嘌呤与胞嘧啶互补;对于rna,腺嘌呤与尿嘧啶互补,鸟嘌呤与胞嘧
啶互补)时,结合是最佳的,但如果引物的几个碱基与核酸不互补,结合也可能是有效的。换句话说,如果核酸序列在引物应该结合的地方被缩短了几个碱基,复制过程仍然可以是有效的。相关参数可以是la,或l
a-n,其中n是1到15的整数;或r.la(r乘以la),其中缩短系数r的范围在75%到100%之间,前提是r.la始终是整数值。在一些实施方案中,r是大于0.75且小于1、大于0.8且小于1、大于0.9且小于1、或大于0.95且小于1的值,前提是r.la始终是整数值。
[0180]
在一些实施方案中,可以基于引物与要扩增的序列结合的预测强度来预测n或r的值,所述要扩增的序列在引物应该结合的地方被缩短了几个碱基。例如,可以基于要扩增的序列和/或引物的参数(例如,要扩增的序列的gc含量;扩增引物的gc含量;扩增引物的长度;所用聚合酶的类型;扩增循环的温度)来预测n或r的值。在一些实施方案中,可以基于以下来预测n或r的值:(a)与要扩增的全长序列结合的引物的预测解链温度(tm),(b)与如上所述缩短了因子n或r的要扩增的序列(即l
a-n或r.la)结合的引物的预测解链温度,以及(c)扩增方法中使用的退火温度。
[0181]
在一些实施方案中,n或r的值可以通过实验确定,例如在下文“校准校正系数”小节中描述的校准步骤中。在一些实施方案中,n或r可以针对要扩增的给定序列和一个样品的扩增引物组通过实验确定,然后用于校准其中要扩增的序列和扩增条件相同的任何样品的l参数.
[0182]
使用长度参数la,校正系数可以以下列方式确定。
[0183]
令p(x)为事件x的概率。
[0184]
令la为要扩增的序列的长度(以碱基对的数目计)。
[0185]
令f为样品中核酸片段长度的概率分布(f(i)为样品中片段长度为i个碱基对的概率)。
[0186]
令为片段的平均长度(以碱基对的数目计)。
[0187]
让我们假设未片段化核酸的切割位置是随机的并且沿碱基对是等概率的。
[0188]
让我们将互斥事件中的概率体系ω进行分区:
[0189][0190]
其中
[0191]
然后
[0192][0193]
通过应用贝叶斯规则p(a∩b)=p(a/b)p(b)
[0194]
p({要扩增的序列未被切割}∩s(la,i))=p({要扩增的序列未被切割}/s(la,i))p(s(la,i))
[0195]

[0196]
p({要扩增的序列未被切割}/s(la,i))=1-p({要扩增的序列被切割}/s(la,i))
[0197]
如果la≤i,否则0
[0198]
此外,令n为片段化核酸样品中的片段总数:
[0199]

[0200]
因此:
[0201][0202][0203][0204][0205]
并且
[0206][0207]
最后,在将片段化核酸样品中的被测序列的测量浓度(c
测量
)乘以校正因子后,得到未片段化核酸样品中的被测序列的浓度(c
真实
):
[0208][0209][0210]
该校正因子取决于样品中核酸片段的长度分布(f)和扩增方法的参数,即要扩增的序列的长度la。
[0211]
校正系数可以用l
a-n近似地计算,其中n是大于0的整数(例如,1至15、1至10或1至5的整数),或用r.la(r乘以la)近似地计算,其中缩短系数r的范围在75%和100%之间并且前提是r.la始终是整数值,以考虑仍导致复制的缩短片段。
[0212]
例如,在其中一组扩增引物仍可结合并扩增被因子n缩短的靶标区域的一些实施方案中,校正系数由以下确定:
[0213][0214]
其中l是靶标区域的长度减去n(l
a-n),其中n是1至15的整数;
[0215]
其中f(i)是样品中片段长度为i个碱基对的概率;和
[0216]
其中是核酸片段的平均长度。
[0217]
在其中一组扩增引物仍可结合并扩增被缩短系数r缩短的靶标区域一些实施方案中,校正系数由以下确定:
[0218][0219]
其中l是靶标区域的长度乘以r(r.la),其中r为至少0.75且小于1,前提是r.la始终是整数值。
[0220]
其中f(i)是样品中片段长度为i个碱基对的概率;和
[0221]
其中是核酸片段的平均长度。
[0222]
值得注意的是,在一些情况下,测量发生突变的核酸的分数(例如突变等位基因分数(maf))可能是相关的。在这种特定情况下,第一被测序列(s1)是突变体(mut),第二被测序列(s2)是野生型(wt)。当两个被测序列都与不同长度的要扩增的序列相关时,两个浓度的校正系数是不同的,必须加以考虑。
[0223]
在一些情况下,测量已扩增的变体核酸(var)与已扩增的参考核酸(ref)的比率(即拷贝数变异(cnv))也可能是相关的(变体不一定是参考的突变)。
[0224]
在一些实施方案中,该方法包括以下步骤。
[0225]
在第一步中,根据上述基本方法测定未片段化核酸中s1的浓度。在该步骤中,考虑与s1相关的要扩增的序列的长度来确定校正系数。
[0226]
在第二步中,根据上述基本方法测定未片段化核酸中s2的浓度。在该步骤中,考虑与s2相关的要扩增的序列的长度来确定校正系数。
[0227]
在第三步中,确定s1浓度和s2浓度的函数。
[0228]
在该方法中,所述s1浓度和所述s2浓度是在同一样品中测定的。为了对同一样品进行s1和s2浓度的测量,多重pcr或多重数字pcr是特别适用的。
[0229]
在该方法中,与s1相关的要扩增的序列的长度和与s2相关的要扩增的序列的长度是不同的。
[0230]
对于突变等位基因分数(maf)的特定情况,函数是由以下关系确定的分数:
[0231][0232][0233]
可以根据用于确定突变等位基因分数(maf)的相同方法确定校正的变异等位基因分数(vaf)。
[0234]
对于拷贝数变异(cnv)的特定情况,函数是由以下关系确定的比率:
[0235]
[0236][0237]
校准校正系数
[0238]
在一些实施方案中,该方法进一步包括校准校正系数的步骤。在一些实施方案中,校准系数基于要扩增的序列的参数或测量方法的参数(例如,扩增或检测步骤的参数)进行校准。
[0239]
在本文提供的一些实施方案中,校正系数还可以基于要扩增的序列基于序列片段化偏差被片段化的概率。在一些实施方案中,要扩增的序列将被片段化的相对概率是已知的。在一些实施方案中,要扩增的序列将被片段化的概率取决于片段化的来源(例如,天然存在的核酸片段化或通过物理方法如超声处理的片段化)。在一些实施方案中,片段化偏差取决于包含要扩增的序列的区域的染色质结构。在一些实施方案中,片段化偏差取决于要扩增的序列内与片段化相关的序列(例如,限制性内切酶靶向的位点)的相对发生。
[0240]
例如,在一些实施方案中,核酸样品可以包括在细胞凋亡过程中被半胱天冬酶激活的dna酶消化的dna。在一些实施方案中,校正系数可以包括基于要扩增的序列在细胞凋亡过程中被片段化的概率的校正因子。在大多数体细胞组织中,dna的凋亡切割导致形成长度大约为195bp及其倍数的片段,而神经元染色质的片段化模式的特征是约165bp的大小。可重复长度对应于单个核小体大小(具有降解的dna接头)。在核小体核心内,组蛋白保护dna免受核酸酶的影响,而接头易被消化。因此,在一些实施方案中,校正因子被应用于表示要扩增的序列基于其在染色质结构中(例如,在核小体或接头区域)中的定位而被片段化的概率的校正系数。
[0241]
在一些实施方案中,序列片段化偏差是位置偏差。例如,在一些实施方案中,核酸样品是rna样品。rna转录物可以优先在转录物内的某些位置被切割,例如在转录物的开始和/或末端处(tuerk a,wiktorin g,g
ü
ler s(2017)mixture models reveal multiple positional bias types in rna-seq data and lead to accurate transcript concentration estimates.plos computational biology 13(5):e1005515)。因此,这种类型的偏差被称为位置偏差。因此,在一些实施方案中,校正因子被应用于表示要扩增的序列基于要扩增的序列在rna转录物中的位置而被片段化的概率的校正系数。
[0242]
在一些实施方案中,核酸样品可以包含人工片段化的核酸,例如通过机械剪切或酶促片段化产生的核酸。对于包含酶促片段化核酸的核酸样品,可以将校正系数应用于说明所用酶的识别序列或序列偏好(例如,转座酶的序列偏差)的校正系数。
[0243]
在一些实施方案中,测量方法的至少一个参数可以进一步包括选自由以下组成的组的扩增步骤的参数:要扩增的序列的gc含量;扩增引物的gc含量;扩增引物的长度;所用聚合酶的类型;和扩增循环的温度。在一些实施方案中,测量方法的至少一个参数可以进一步包括选自由以下组成的组的测量步骤的参数:检测探针的序列;所用荧光团的光稳定性;所用荧光团的化学稳定性;所用荧光团的量子产率;和所用荧光团的波长。在一些实施方案中,扩增步骤的另外的参数可以作为与长度分布(ld)曲线相乘的系数或作为与校正系数相乘的校准系数被并入。
[0244]
在一些实施方案中,如上所述的测量方法的另外的参数的影响可以通过实验确定
并且作为通过实验确定的校准因子被并入校正系数中。
[0245]
在一些实施方案中,该方法进一步包括基于在具有第一片段长度分布(ld1)的第一核酸样品和具有第二片段长度分布(ld2)的第二核酸样品中的被测序列的测量浓度来校准校正系数的步骤。在一些实施方案中,第一核酸样品是未片段化样品。在一些实施方案中,第一核酸样品包含片段化核酸,其中少于5%的核酸片段的长度比要扩增的序列的长度短。在一些实施方案中,第一核酸样品用于确定第二核酸样品的真值(ground-truth)校正因子。可以确定真值校正因子与预测校正系数之间的相对误差,并将其作为校准因子应用于计算被测序列的校正浓度。
[0246]
在一些实施方案中,如本领域技术人员将容易理解的,可以根据在预测的校正系数和真值校正因子之间产生最佳拟合的n或r的值来确定n或r。
[0247]
在根据本文提供的任一实施方案的一些方法中,该方法进一步包括基于上述任一参数用校准因子校正浓度。在一些实施方案中,可以根据本文提供的任一测量方法将校准因子应用为修改的稀释因子。
[0248]
ii.本技术的系统
[0249]
最后,本发明涉及一种被配置为确定未片段化核酸中被测序列的浓度的系统。该系统包括以下模块。
[0250]
第一模块被配置为测量片段化核酸样品中被测序列的浓度,所述片段化核酸来源于所述未片段化核酸。该模块实现了本发明基本方法的测量步骤。
[0251]
合适的模块包括实时热循环仪并使用包含引物、嵌入荧光染料或荧光探针和聚合酶的反应混合物,在合适的缓冲液中进行扩增反应。替代地,可以使用数字pcr平台代替实时热循环仪。这种数字pcr平台由pcr容器(通常是管、板或微流控芯片)、分区系统、热循环仪和荧光读数器以及分析软件组成。
[0252]
第二模块被配置为根据所述片段化核酸的核酸片段长度分布和所述测量的参数来计算校正系数。该模块通常是包括显示屏、至少一个微处理器、数据交换模块和至少一个计算机可读存储介质的计算机设备。替代地,该模块可以连接到包括至少一个微处理器、数据交换模块和至少一个计算机可读存储介质的远程服务器。
[0253]
当程序由计算机或远程服务器执行时,包括指令的计算机程序可以使计算机或远程服务器自动计算校正系数。
[0254]
当程序由计算机或远程服务器执行时,可以使用包括指令的计算机可读存储介质。在实施方案中,计算机可读存储介质是非暂时性计算机可读存储介质。
[0255]
第三模块被配置为用校正系数计算未片段化核酸中被测序列的浓度。
[0256]
第一模块可以是等温定量核酸扩增模块或非等温定量核酸扩增模块。
[0257]
等温定量核酸扩增模块通常包括引物、嵌入荧光染料和与等温扩增相容的聚合酶,在合适的等温缓冲液中进行扩增反应,以及配备有兼容分析软件的温控荧光扫描仪。合适的模块是执行环介导的等温扩增、基于定量核酸序列的扩增、rna技术的信号介导的扩增和链置换扩增的模块。
[0258]
非等温定量核酸扩增模块一般为定量聚合酶链式反应模块、实时聚合酶链式反应模块、数字聚合酶链式反应模块、多重聚合酶链式反应模块和多重数字聚合酶链式反应模块。
[0259]
第二模块可以使用要扩增的序列的长度作为第一模块执行的测量的参数来计算校正系数。
[0260]
所有这些参数可以逐一或组合地包含在第二模块完成的校正系数的计算中。
[0261]
iii.示例性实施方案
[0262]
本技术的一方面提供了校正未片段化核酸中被测序列的浓度的方法。本技术的另一方面提供了被配置为确定未片段化核酸中被测序列的浓度的系统。
[0263]
为此,本技术提供如下示例性实施方案:
[0264]
实施方案1.一种确定未片段化核酸中被测序列的浓度的方法,包括以下步骤:
[0265]
i.提供片段化核酸的样品,所述片段化核酸来源于所述未片段化核酸;
[0266]
ii.提供所述片段化核酸的核酸片段长度分布(ld);
[0267]
iii.用测量方法测量所述片段化核酸的样品中所述被测序列的浓度;
[0268]
iv.根据所述片段化核酸的所述核酸片段长度分布(ld)和所述测量方法的参数确定校正系数;和
[0269]
v.用所述校正系数校正片段化核酸中所述被测序列的浓度,以获得未片段化核酸中所述被测序列的浓度。
[0270]
实施方案2.根据实施方案1所述的确定未片段化核酸中被测序列的浓度的方法,其中片段化核酸的样品是以下三类的任意组合:
[0271]
i.无细胞样品或含细胞样品;
[0272]
ii.天然片段化的样品或人工片段化的样品;和
[0273]
iii.任何类型的脱氧核糖核酸或核糖核酸。
[0274]
实施方案3.根据前述实施方案中任一项所述的确定未片段化核酸中被测序列的浓度的方法,其中所述测量方法是等温定量核酸扩增方法,优选选自环介导的等温扩增和基于定量核酸序列的扩增。
[0275]
实施方案4.根据实施方案1或2所述的确定未片段化核酸中被测序列的浓度的方法,其中所述测量方法是非等温定量核酸扩增方法,优选选自定量聚合酶链式反应、实时聚合酶链式反应、数字聚合酶链式反应、多重聚合酶链式反应和多重数字聚合酶链式反应。
[0276]
实施方案5.根据实施方案3或4所述的确定未片段化核酸中被测序列的浓度的方法,其中所述测量方法的参数包括要扩增的序列的长度。
[0277]
实施方案6.根据实施方案5所述的确定未片段化核酸中被测序列的浓度的方法,其中至少5%的核酸片段的长度比要扩增的序列的长度短。
[0278]
实施方案7.根据实施方案5或6所述的确定未片段化核酸中被测序列的浓度的方法,其中至多95%的核酸片段的长度比要扩增的序列的长度短。
[0279]
实施方案8.根据实施方案5至7中任一项所述的确定未片段化核酸中被测序列的浓度的方法,其中要扩增的序列的长度大于40bp且小于200bp,优选大于50bp且小于170bp,更优选大于65bp且小于150bp,甚至更优选大于70bp且小于130bp。
[0280]
实施方案9.根据实施方案1至8中任一项所述的确定未片段化核酸中被测序列的浓度的方法,其中核酸片段长度分布包含在25bp至350bp、优选30bp至320bp、更优选35bp至290bp、甚至更优选40bp至270bp的范围内。
[0281]
实施方案10.一种确定未片段化核酸中第一被测序列s1的第一浓度和第二被测序
列s2的第二浓度的函数的方法,包括:
[0282]
iv.根据实施方案5至9中任一项确定所述未片段化核酸中s1的浓度;
[0283]
v.根据实施方案5至9中任一项确定所述未片段化核酸中s2的浓度;和
[0284]
vi.计算所述s1浓度和所述s2浓度的所述函数;
[0285]
其中所述s1浓度和所述s2浓度是在同一样品中测定的;和
[0286]
其中与s1相关的要扩增的序列的长度和与s2相关的要扩增的序列的长度是不同的。
[0287]
实施方案11.一种被配置为确定未片段化核酸中被测序列的浓度的系统,包括:
[0288]
i.被配置为测量片段化核酸的样品中所述被测序列的浓度的模块,所述片段化核酸来源于所述未片段化核酸;
[0289]
ii.被配置为根据所述片段化核酸的核酸片段长度分布(ld)和所述测量的参数计算校正系数的模块;和
[0290]
iii.被配置为用所述校正系数计算未片段化核酸中所述被测序列的浓度的模块。
[0291]
实施方案12.根据实施方案11所述的被配置为确定未片段化核酸中被测序列的浓度的系统,其中被配置为测量所述片段化核酸中所述被测序列的浓度的模块是等温定量核酸扩增模块,其优选选自环介导的等温扩增模块和基于定量核酸序列的扩增模块。
[0292]
实施方案13.根据实施方案11所述的被配置为确定未片段化核酸中被测序列的浓度的系统,其中被配置为测量所述片段化核酸中所述被测序列的浓度的模块是非等温定量核酸扩增模块,其优选选自定量聚合酶链式反应模块、实时聚合酶链式反应模块、数字聚合酶链式反应模块、多重聚合酶链式反应模块和多重数字聚合酶链式反应。
[0293]
实施方案14.根据实施方案12或13所述的被配置为确定未片段化核酸中被测序列的浓度的系统,其中所述测量的参数包括要扩增的序列的长度。
[0294]
iv.实施方案
[0295]
本技术的一方面提供了校正与包含片段化核酸的核酸样品中的目标核酸序列的存在被低估有关的问题的方法。本技术的另一方面提供了被配置为确定未片段化核酸中被测序列的浓度的系统。
[0296]
为此,本技术提供如下实施方案:
[0297]
实施方案1’.一种确定未片段化核酸中被测序列的浓度的方法,包括以下步骤:
[0298]
i.确定包含片段化核酸的样品中核酸的长度分布,其中片段化核酸来源于所述未片段化核酸;
[0299]
ii.用测量方法测量所述包含片段化核酸的样品中所述被测序列的浓度;和
[0300]
iii.用校正系数校正包含片段化核酸的样品中所述被测序列的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布和测量方法的至少一个参数。
[0301]
实施方案2’.实施方案1’的方法,其中测量被测序列的浓度包括扩增包含被测序列的要扩增的序列。
[0302]
实施方案3’.实施方案2’的方法,其中被测序列和要扩增的序列是相同的,并且其中测量步骤包括检测标记向扩增过程中产生的核酸中的掺入。
[0303]
实施方案4’.实施方案3’的方法,其中标记是包含荧光团的荧光染料。
[0304]
实施方案5’.实施方案2’的方法,其中被测序列是要扩增的序列的子集,并且其中测量步骤包括检测标记探针与被测序列的结合。
[0305]
实施方案6’.实施方案4’的方法,其中标记探针是包含荧光团的荧光标记探针。
[0306]
实施方案7’.前述实施方案中任一项的方法,其中该方法进一步包括基于样品中核酸的长度分布(ld)和所述测量方法的至少一个参数确定校正系数的步骤。
[0307]
实施方案8’.前述实施方案中任一项的方法,其中测量方法的至少一个参数包括要扩增的序列的长度(la)。
[0308]
实施方案9’.实施方案2
’‑8’
中任一项的方法,其中校正系数由以下确定:
[0309][0310]
其中l是要扩增的序列的长度(la);
[0311]
其中f(i)是样品中片段长度为i个碱基对的概率;和
[0312]
其中是核酸片段的平均长度。
[0313]
实施方案10’.实施方案2
’‑8’
中任一项的方法,其中一组扩增引物仍可结合被因子n缩短的要扩增的序列,并且其中校正系数由以下确定:
[0314][0315]
其中l是要扩增的序列的长度减去n(l
a-n),其中n是1至15的整数;
[0316]
其中f(i)是样品中片段长度为i个碱基对的概率;和
[0317]
其中是核酸片段的平均长度。
[0318]
实施方案11’.实施方案10’的方法,其中n是1至5的整数。
[0319]
实施方案12’.实施方案2
’‑8’
中任一项的方法,其中一组扩增引物仍可与被缩短系数r缩短的要扩增的序列结合,并且其中校正系数由以下确定:
[0320][0321]
其中l是要扩增的序列的长度乘以r(r.la),其中r是至少0.75且小于1,前提是r.la始终为整数值;
[0322]
其中f(i)是样品中片段长度为i个碱基对的概率;和
[0323]
其中是核酸片段的平均长度。
[0324]
实施方案13’.前述实施方案中任一项的方法,其中校正系数还基于要扩增的序列基于序列片段化偏差被片段化的概率。
[0325]
实施方案14’.实施方案2
’‑
13’中任一项的方法,其中测量方法的至少一个参数进一步包括选自由以下组成的组的扩增步骤的参数:要扩增的序列的gc含量;扩增引物的gc含量;扩增引物的长度;所用聚合酶的类型;扩增循环的温度。
[0326]
实施方案15’.实施方案4’或6’中任一项的方法,其中测量方法的至少一个参数进一步包括选自由以下组成的组的测量步骤的参数:检测探针的序列;所用荧光团的光稳定性;所用荧光团的化学稳定性;所用荧光团的量子产率;和所用荧光团的波长。
[0327]
实施方案16’.前述实施方案中任一项的方法,其中校正包括将在包含片段化核酸的样品中测量的浓度乘以校正系数。
[0328]
实施方案17’.前述实施方案中任一项的方法,其中如果样品中至少5%的核酸的长度比要扩增的序列的长度短,则应用校正。
[0329]
实施方案18’.前述实施方案中任一项的方法,其中样品中不超过95%的核酸片段的长度比要扩增的序列的长度短。
[0330]
实施方案19’.前述实施方案中任一项的方法,其中要扩增的序列的长度大于40bp且小于200bp。
[0331]
实施方案20’.实施方案19’的方法,其中要扩增的序列的长度大于50bp且小于170bp。
[0332]
实施方案21’.实施方案19’的方法,其中要扩增的序列的长度大于65bp且小于150bp。
[0333]
实施方案22’.实施方案19’的方法,其中要扩增的序列的长度大于70bp且小于130bp。
[0334]
实施方案23’.前述实施方案中任一项的方法,其中样品中核酸片段的长度分布(ld)包含在25bp至350bp的范围内。
[0335]
实施方案24’.实施方案23’的方法,其中样品中核酸片段的长度分布(ld)包含在30bp至320bp的范围内。
[0336]
实施方案25’.实施方案23’的方法,其中样品中核酸片段的长度分布(ld)包含在35bp至290bp的范围内。
[0337]
实施方案26’.实施方案23’的方法,其中样品中核酸片段的长度分布(ld)包含在40bp至270bp的范围内。
[0338]
实施方案27’.前述实施方案中任一项的方法,其中所述方法不包括获得片段化核酸的序列。
[0339]
实施方案28’.前述实施方案中任一项的方法,其中所述方法不包括获得或预测片段化核酸的遗传坐标。
[0340]
实施方案29’.前述实施方案中任一项的方法,其中所述方法不包括将片段化核酸组装成连续序列。
[0341]
实施方案30’.前述实施方案中任一项的方法,其中所述方法不包括将未片段化核酸片段化以产生包含片段化核酸的样品。
[0342]
实施方案31’.前述实施方案中任一项的方法,其中测量方法不包括对样品中的核酸进行测序。
[0343]
实施方案32’.前述实施方案中任一项的方法,其中包含片段化核酸的样品是含细胞样品。
[0344]
实施方案33’.实施方案1
’‑
31’中任一项的方法,其中包含片段化核酸的样品是无细胞样品。
[0345]
实施方案34’.前述实施方案中任一项的方法,其中包含片段化核酸的样品是天然片段化的样品。
[0346]
实施方案35’.实施方案1
’‑
29’或31
’‑
33’中任一项的方法,其中包含片段化核酸
的样品是人工片段化的样品。
[0347]
实施方案36’.前述实施方案中任一项的方法,其中包含片段化核酸的样品是脱氧核糖核酸样品。
[0348]
实施方案37’.前述实施方案中任一项的方法,其中包含片段化核酸的样品是核糖核酸样品。
[0349]
实施方案38’.根据实施方案2
’‑
37’中任一项所述的测定未片段化核酸中被测序列的浓度的方法,其中所述测量方法是等温定量核酸扩增方法。
[0350]
实施方案39’.实施方案38’的方法,其中测量方法选自由以下组成的组:环介导的等温扩增和基于定量核酸序列的扩增。
[0351]
实施方案40’.实施方案2
’‑
37’中任一项的方法,其中测量方法是非等温定量核酸扩增方法。
[0352]
实施方案41’.实施方案40’的方法,其中测量方法选自由以下组成的组:定量聚合酶链式反应、实时聚合酶链式反应、数字聚合酶链式反应、多重聚合酶链式反应和多重数字聚合酶链式反应。
[0353]
实施方案42’.前述实施方案中任一项的方法,其中所述方法进一步包括基于具有第一片段长度分布(ld1)的第一核酸样品和具有第二片段长度分布(ld2)的第二核酸样品中的被测序列的测量浓度来校准校正系数的步骤。
[0354]
实施方案43’.前述任一实施方案的方法,其中所述方法进一步包括:
[0355]
i.用测量方法测量所述包含片段化核酸的样品中第二被测序列的浓度;和
[0356]
ii.用校正系数校正片段化核酸中所述第二被测序列的测量浓度,以获得未片段化核酸中所述第二被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数。
[0357]
实施方案44’.实施方案43’的方法,其中测量第二被测序列的浓度包括扩增包含第二被测序列的要扩增的第二序列。
[0358]
实施方案45’.实施方案44’的方法,其中要扩增的第一序列的长度不同于要扩增的第二序列的长度。
[0359]
实施方案46’.实施方案43
’‑
45’中任一项的方法,其中要扩增的第一序列包括突变等位基因被测序列,要扩增的第二序列包括相应的参考等位基因被测序列。
[0360]
实施方案47’.实施方案43
’‑
45’中任一项的方法,其中与要扩增的第二序列所包含的相应参考序列相比,要扩增的第一序列包含插入或缺失。
[0361]
实施方案48’.实施方案43
’‑
45’中任一项的方法,其中所述方法进一步包括确定与第二被测序列相比的第一被测序列的校正突变等位基因分数(maf)的步骤。
[0362]
实施方案49’.实施方案48’的方法,其中校正的maf(maf
real
)使用以下计算:
[0363][0364]
实施方案50’.实施方案43
’‑
45’中任一项的方法,其中要扩增的第一序列从包含拷贝数变异(cnv)的变体核酸扩增,并且要扩增的第二序列从参考核酸扩增。
[0365]
实施方案51’.实施方案43
’‑
45’中任一项的方法,其中要扩增的第一序列从包含拷贝数变异(cnv)的变体核酸扩增,并且要扩增的第二序列从参考核酸扩增。
[0366]
实施方案52’.实施方案43
’‑
45’中任一项的方法,其中要扩增的第一序列从包含拷贝数变异(cnv)的变体核酸扩增,并且要扩增的第二序列从参考核酸扩增。
[0367]
实施方案53’.实施方案50’的方法,其中所述方法进一步包括使用以下公式确定参考序列与变体序列相比的校正拷贝数变异(cnv
real
)的步骤:
[0368][0369]
实施方案54’.实施方案43
’‑
51’中任一项的方法,其中测量方法包括多重扩增步骤。
[0370]
实施方案55’.一种被配置为确定未片段化核酸中被测序列的浓度的系统,包括:
[0371]
i.被配置为测量包含片段化核酸的样品中所述被测序列的浓度的模块,所述片段化核酸来源于所述未片段化核酸;
[0372]
ii.被配置为根据样品中核酸的长度分布(ld)和所述测量的参数计算校正系数的模块;和
[0373]
iii.被配置为使用所述校正系数计算未片段化核酸中所述被测序列的浓度的模块。
[0374]
实施方案56’.根据实施方案53’的被配置为确定未片段化核酸中被测序列的浓度的系统,其中被配置为测量所述片段化核酸中所述被测序列的浓度的模块是等温定量核酸扩增模块,选择环介导的等温扩增模块和基于定量核酸序列的扩增模块。
[0375]
实施方案57’.根据实施方案53’的被配置为确定未片段化核酸中被测序列的浓度的系统,其中被配置为测量所述片段化核酸中所述被测序列的浓度的模块是非等温定量核酸扩增模块,选自定量聚合酶链式反应模块、实时聚合酶链式反应模块、数字聚合酶链式反应模块、多重聚合酶链式反应模块和多重数字聚合酶链式反应。
[0376]
实施方案58’.根据实施方案54’或55的被配置为确定未片段化核酸中被测序列的浓度的系统,其中所述测量的参数包括要扩增的序列的长度。
[0377]
实施方案59’.一种确定未片段化核酸中第一被测序列s1的第一浓度和第二被测序列s2的第二浓度的拷贝数变异(cnv)的方法,包括:
[0378]
i.测量包含片段化核酸的核酸样品中s1和s2的浓度;
[0379]
ii.用校正系数校正包含片段化核酸的样品中s1和s2的测量浓度,以获得未片段化核酸中所述被测序列的浓度,其中校正系数基于长度分布(ld)和测量方法的至少一个参数;
[0380]
iii.使用s1和s2的校正浓度计算cnv;
[0381]
其中s1和s2的浓度是在同一样品中测量的;和
[0382]
其中与s1相关的测量方法的至少一个参数不同于与s2相关的测量方法的至少一个参数。
[0383]
实施方案60’.实施方案59’的方法,其中测量s1和s2的浓度包括扩增包含s1的要扩增的第一序列和包含s2的要扩增的第二序列。
[0384]
实施方案61’.实施方案60’的方法,其中测量方法的至少一个参数包括要扩增的序列的长度。
[0385]
实施方案62’.实施方案61’的方法,其中包含s1的要扩增的序列的长度不同于包含s2的要扩增的序列的长度。
[0386]
尽管已经描述和图示了各种实施方案,但详细描述不应被解释为限于此。本领域技术人员可以对实施实施方案进行各种修改而不背离由权利要求限定的本公开的真实精神和范围。
[0387]
实施例1
[0388]
实施例1的方法:
[0389]
a.经超声处理的dna的制备
[0390]
起始样品是200ng/μl的储备dna(=6.06e 4cp/μl)(人类基因组dna,bio-35025,bioline,paris,france),根据制造商,其平均长度大于50kbp。
[0391]
使用microtube-15(15到20μl
±
1),根据制造商,其可以包含多达1μg的dna。因此,使用te:tris-edta进行dna储备溶液的稀释步骤。这形成60ng/μl(=1.82e 4cp/μl)的dna溶液,其可以在microtube-15中进行超声处理。
[0392]
在m220 focused-ultrasonicator(brighton,united kingdom)上进行超声处理。
[0393]
首先,制备可通过实现的最小片段(长度分布以150bp为中心)以尽可能接近人类dna片段长度的分布,即接近在人血浆中发现的模式(163、316和465bp)。
[0394]
随后,制备了以200bp、350bp和550bp为中心的长度分布。
[0395]
所有超声处理均在microtube-50(55μl
±
2.5)或microtube snap-cap(130μl
±
5)中进行,其根据制造商可以包含多达5μg的dna。
[0396]
b.使用tapestation验证经超声处理的dna样品
[0397]
从4200tapestation系统(agilent technologies,santa clara,california,usa)电泳图像中提取灰度数据,以获得计算所有理论校正因子所需的碱基对分布。为了将质量单位转换为碱基对单位,将图像强度反转,然后除以图像像素位置处预期的片段长度。
[0398]
使用高灵敏度d1000 screentape。
[0399]
c.引物、探针和荧光团
[0400]
使用的引物和探针由eurogentec(eurogentec,angers,france)合成,并由反相高效液相色谱(hplc)纯化。
[0401]
triplex pcr实验中使用的荧光团是:如下所示的fam、hex和青色素(cy5):
[0402]
·
蓝色通道中的fam荧光团,使用长度为117个碱基对的要扩增的序列来检测序列braf v600 wt;
[0403]
·
绿色通道中的hex荧光团,使用长度为78个碱基对的要扩增的序列来检测序列egfr l858 wt;
[0404]
·
红色通道中的cy5荧光团,使用长度为81个碱基对的要扩增的序列来检测序列alb。
[0405]
制备模板braf-egfr-alb如表1所示。符号{}表示锁核酸碱基。
[0406]
表1
[0407][0408]
d.pcr混合物
[0409]
pcr反应使用multiplex qpcr(quanta biosciences,beverly,ma,usa)进行,终浓度为1x。在pcr混合物中加入0.1μm荧光素(vwr international,fontenay-sous-bois,france)。
[0410]
pcr混合物组装如下:
[0411]
·
qpcr multiplex(1x)
[0412]
·
荧光素(0.1μm)
[0413]
·
寡核苷酸braf v600 wt,fam荧光团(1x)
[0414]
·
寡核苷酸egfr l858 wt,hex荧光团(1x)
[0415]
·
寡核苷酸alb,cy5荧光团(1x)
[0416]
·

[0417]
表2
[0418][0419]
样品是通过稀释pcr混合物中的靶序列获得的,因此在非超声处理情况下每个靶序列的预期终浓度为3000cp/μl,如表2中所述。
[0420]
e.dpcr实验
[0421]
将样品加载到sapphire芯片(stilla technologies,villejuif,france)的入口腔室中,每个腔室加载27μl体积。每个经超声处理的样品使用三个重复(每个样品三个室)。一个未经超声处理的样品一式三份装入三个独立的腔室中。
[0422]
naica
tm
geode(stilla technologies,villejuif,france)被编程为对样品进行分区。
[0423]
pcr条件如下:95℃10分钟,然后是95℃30秒和58℃15秒的45个循环。
[0424]
使用naica
tm
prism3(stilla technologies,villejuif,france)进行图像采集的默认曝光时间对于蓝色、绿色和红色通道分别为65ms、250ms和50ms。
[0425]
f.校正因子计算
[0426]
根据本发明方法的预测的校正因子(“预测”)是从通过实验测量的样品的片段长度分布(如图2所示的以150bp为中心的长度分布)和要扩增的序列的碱基对的长度(bp)计算的。
[0427]
根据本发明的方法计算校正因子需要要扩增的序列未被切割的概率作为要扩增的序列的长度(如图3所示的以150bp为中心的长度分布)的函数。相同条件下的校正因子如图4所示。
[0428]
通过计算在未经超声处理的样品中实验测量的被测序列与经超声处理的样品的浓度之间的比值,在体外获得真值校正因子(“真值”)。
[0429]
相对误差(“相对误差”)被定义为预测的校正因子相对于真值校正因子的误差。
[0430]
实施例1的结果:
[0431]
实验和理论结果在表3中进行了比较。通过triplex数字pcr实验获得了预测和真实校正因子,所述实验测量在不同片段长度(150bp、200bp、350bp、550bp)的超声处理样品中的不同序列长度(78bp、81bp、117bp)的要扩增的序列的浓度。每个实验测量一式三份进行,显示的值是三次重复值的平均值。
[0432]
表3
[0433][0434]
可以看出,获得的相对误差值在1%到7%的范围内,表明预测的校正因子始终准确,并且相对于真值校正因子存在略微高估。
[0435]
从以上可以推断,本发明的方法在现实条件下提供直接可用的结果,因为要扩增的序列的长度代表标准pcr序列,并且因为片段长度分布符合天然存在的片段化。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献