一种文库标签引物的质控方法及其应用与流程

2022-07-30 10:41:55 来源：中国专利 TAG：

1.本发明涉及基因测序领域，特别是涉及一种文库标签引物的质控方法及其应用。

背景技术：

2.自1977年以来，从一代测序到如今的四代测序，基因测序技术呈现跨越式发展。概括来讲，以sanger为代表的一代测序，采用先合成后测序的方式，分辨率高，测序片段长，质控环节多，污染低且结果直观可视，但成本高，测序通量低；二代测序，采用边合成边测序的方式，测序读长较短，相较一代测序时间更短，数据产出更高，错误率更低；三代测序，采用单分子测序的方法，相较二代测序速度更快，测序读长更长，覆盖率更均匀，但数据产出较低，错误率较高。
3.目前二、三代测序仪在产前筛查、肿瘤伴随诊断、病原体检测等领域广泛应用。以illumina next550测序仪在病原宏基因组学应用为例，其有4个流动槽(flowcell)，样本加载系统将单一样本/单一样本混池直接加载到4条泳道中进行簇生成和测序反应，4条lane产生的总数据量达到400m reads；而对于病原宏基因组学应用来说，每个样本大约需要20m数据量，一张芯片能满足至少20个样本同时测序。测序仪器的测序能力要远大于测试样本序列量，为了提高数据利用效率，降低单样本成本，需要给不同样品加上特定的“标签”，从而可以在后续数据分析时将不同样品数据分开，而这个“标签”就是接头的index(即文库标签引物)，也常被称为barcode。
4.在进行临床样本检测前，需要在目的片段两端加上接头，即文库构建。以dna文库构建为例，常规建库步骤为：(1)片段化，采用超声或内切酶的方式打断核酸；(2)末端修复，经t4 dna聚合酶补平突出末端，经klenow dna聚合酶在3’端加a尾，经t4多聚合核苷酸激酶使5’端磷酸化；(3)接头连接，经连接酶在目的片段核酸两端连接含index的接头；(4)扩增，在taq酶和引物的作用下，使文库富集；(5)纯化，经磁珠分选后，得到目的大小范围内的文库。转座酶法建库的步骤为：(1)片段化，在转座酶的作用下打断基因组dna并将通用接头连在断口处；(2)终止片段化，以防片段被打断的太小；(3)扩增，在taq酶和引物(长接头，含index)的作用下，使文库富集；(5)纯化，经磁珠分选后，得到目的大小范围内的文库。
5.病原宏基因组学作为应用于临床病原感染检测的新兴技术，具有无需培养、无偏好性等优点；也由于样本的多样性，病原宏基因组学检出病原体序列分布从个位到百万条序列。在检出高序列病原体情况下，样本间特异的“标签”分子即使存在较低的交叉污染，也会导致数据拆分过程样本a污染b的情况。此外每例样本测序数据量是基因覆盖度和检测临检度度的保障，以病原宏基因组学为例，每样本上20m数据量，当数据量低于5m时需要重测分析，扩增效率和拆分效率更均一的接头更好的保障数据量需求。因此需要一种高效、低成本的文库标签引物质检方案，以评估接头的交叉污染比例、数据产出比、编号一致性、芯片数据拆分率等参数。

技术实现要素：

6.针对上述问题，本发明提供一种文库标签引物的质控方法，该质控方法通过与合格的质控品形成一对一的关系构建相应文库，没有片段化和核酸分选的过程，相较于常规建库方法，该质控方法中采用的建库方法更加节省时间，进而提高文库标签引物的质控效率，易实现文库标签引物质控的规模化。
7.为了达到上述目的，本发明提供了一种文库标签引物的质控方法，该质控方法包括以下步骤：
8.制备待检质控品：以区别于检测对象物种的基因序列作为质控模板序列，对所述质控模板序列进行滑动切割，切割窗口长度为100-1000bp，步长为50
±
25bp，得到若干拆分序列，将若干所述拆分序列比对至病原数据库，去除可匹配病原数据库的拆分序列，剩余序列即为特异性模板序列，针对若干所述特异性模板序列进行引物设计，分别得到对应的特异性扩增引物对，以所述特异性扩增引物对对所述质控模板序列的标准品进行pcr扩增，纯化富集，得到待检质控品；
9.构建第一文库：将所述待检质控品和质检合格的文库标签引物进行pcr扩增，得到第一文库；
10.第一质控：将所述第一文库进行测序，对测序后待检质控品数据进行质控分析，筛选出符合质控指标的质控品，即为合格的质控品，形成质控品集合；
11.构建第二文库：将所述质控品集合与待检接头引物序列进行pcr扩增，得到第二文库，所述待检接头引物序列包括待检文库标签引物、测序接头；
12.第二质控：将所述第二文库进行测序，对测序后待检接头引物序列数据进行质控分析，筛选出符合质控指标的文库标签引物，即为合格的文库标签引物。
13.本发明人在研究过程中发现，现有技术中已有的文库标签引物质控方法均需要进行标准的文库构建全流程，存在成本高、耗时长的缺点，以转座酶建库试剂为例，现在dna流程建库试剂盒单反应大概100元，构建20个文库耗时大概3h，当需要对400对或600对接头进行质检时，文库构建成本和时间都是非常巨大的阻碍。因此，本发明人基于pcr法构建了上述质控方法，通过与合格的质控品形成一对一的关系构建相应文库，没有片段化和核酸分选的过程，相较于常规建库方法，该质控方法中采用的建库方法更加节省时间，进而提高文库标签引物的质控效率，易实现文库标签引物质控的规模化。
14.并且，本发明的质控品构建过程满足了远低于1/106、甚至0.3/106的交叉污染比例，因此，对待检文库标签引物能够实现交叉污染比例低于1/106的质控需求；并且，质控品的插入片段大小明确，在准确文库pooling后，能够根据芯片的数据的拆分比例以及质控文库拆分数据，来衡量批次文库标签引物在芯片维度的拆分效率以及是否存在个别引物数据拆分效率不佳的情况。
15.在其中一个实施例中，所述第一质控还包括以下步骤：将质控分析不符合的质控品作为复检质控品，所述复检质控品重复进行所述构建第一文库步骤、所述第一质控步骤，筛选出合格的质控品。
16.在其中一个实施例中，所述第二质控还包括以下步骤：将质控分析不符合的文库标签引物作为复检文库标签引物，所述复检文库标签引物重复进行所述构建第二文库步骤、所述第二质控步骤，筛选出合格的文库标签引物。
17.在其中一个实施例中，所述构建第二文库步骤中，所述pcr扩增体系如下所示：
[0018][0019]
在其中一个实施例中，所述构建第二文库步骤中，所述pcr扩增程序如下所示：
[0020][0021]
在其中一个实施例中，所述引物设计的扩增子为100-600bp。
[0022]
在其中一个实施例中，所述质控模板序列选自：植源性核酸序列或噬菌体核酸序列。
[0023]
上述质控模板序列需要根据ngs不同应用领域选择不同来源的模板序列，例如病原宏基因组学领域，因临床检测一般针对人源和微生物基因组特异性序列，而植物中的叶绿素、光合作用等大量特殊基因序列与人和微生物无同源性，因此可以选择植源性核酸序列作为模板序列来源，用以质检文库标签引物；而其他领域，则可选择噬菌体核酸序列作为模板序列来源。
[0024]
在其中一个实施例中，所述质控指标包括：cross_contamination《1/106、实验产出数据量/预期数据量＞0.6、测序芯片数据拆分效率＞0.85和编号一致性。
[0025]
现有技术中没有一种可同时评估文库标签引物交叉污染比例、扩增效率、测序芯片数据拆分效率以及排除生产错误的方法，采用上述预定指标进行质控，能使所述质控方法同时评估文库标签引物的4种指标：cross_contamination(交叉污染比例)、实验产出数据量/预期数据量(数据产出比)、测序芯片数据拆分效率(pf率)、编号一致性(待检模板和实际检出模板一一对应)。
[0026]
本发明还提供了所述质控方法得到的质控品。
[0027]
本发明还提供了所述质控品在转座酶法文库标签引物质控中的用途。
[0028]
与现有技术相比，本发明具有以下有益效果：
[0029]
本发明的一种文库标签引物的质控方法及其应用，该质控方法通过与合格的质控品形成一对一的关系构建相应文库，没有片段化和核酸分选的过程，相较于常规建库方法，该质控方法中采用的建库方法更加节省时间，进而提高文库标签引物的质控效率，可以在大量引物质检时进行低成本、高效率地完成质检，交叉污染比例控制在1/100万以下，数据产出比(实际/预期)大于60％，芯片数据拆分效率大于85％，易实现文库标签引物质控的规模化。
附图说明
[0030]
图1为实施例1中合格的质控品的制备流程图；
[0031]
图2为实施例1中第一文库的制备流程图；
[0032]
图3为实施例1中第一质控步骤的交叉污染率的分析结果图；
[0033]
图4为实施例1中第一质控步骤的数据产出比大于0.6(实验产出数据量/预期数据量)的分析结果图；
[0034]
图5为实施例1中第二质控步骤的交叉污染率的分析结果图；
[0035]
图6为实施例1中第二质控步骤的数据产出比大于0.6(实验产出数据量/预期数据量)的分析结果图；
[0036]
图7为实施例1中第二质控步骤中，第一轮不合格引物对重新建库、质控的交叉污染率的分析结果图；
[0037]
图8为实施例1中第二质控步骤中，第一轮不合格引物对重新建库、质控的数据产出比大于0.6(实验产出数据量/预期数据量)的分析结果图。
具体实施方式
[0038]
为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
[0039]
除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。
[0040]
定义：
[0041]
index：二代测序中，人工设计合成的核酸序列，且无法与人源和微生物基因组进行比对，用于人源基因组测序时的样本区分，也称标签，和本发明中的文库标签引物表示同一个意思。
[0042]
来源：
[0043]
拟南芥gdna(本发明人自行从拟南芥叶子中按照常规技术手段提取所得)、pcr扩增体系扩增酶(entrans 2x qpcr probe master mix产品，abclonal生物科技(武汉)有限公司)
[0044]
本实施例所用试剂、材料、设备如无特殊说明，均为市售来源；实验方法如无特殊说明，均为本领域的常规实验方法。
[0045]
实施例1
[0046]
一、制备待检质控品。
[0047]
为了使文库标签引物的质检流程标准化和规模化，需要有大量合格的质控品作为前期储备，制备流程如图1所示。
[0048]
下述拟南芥gdna是本发明人自行从拟南芥叶子中提取所得，1.5ml ep管中-20℃保存；特异性扩增引物对是本发明人自主设计，在生工生物工程(上海)股份有限公司合成。
[0049]
1、制备特异性扩增引物对。
[0050]
以拟南芥gdna作为质控模板序列，对其进行滑动切割，切割窗口长度为1000bp，步长为50bp，得到若干拆分序列；将上述拆分序列比对到病原数据库中，去除可匹配病原数据
库的拆分序列，剩余序列即为特异性模板序列；采用引物设计软件primer3进行对上述特异性模板序列进行引物设计，共设计177对引物对，扩增子统一为150bp，得到对应的特异性扩增引物对。
[0051]
2、特异性扩增引物对的pcr扩增。
[0052]
(1)拟南芥gdna提取液溶解后，涡旋混匀，瞬时离心，使用qubit dsdna hs(high sensitivity)assay kit分析试剂盒进行浓度检测，根据需要投入量计算稀释浓度和稀释方案；本实施例样本数为177份，每份投入1ng gdna，扩增体系中加入体积为8μl/份，实验时取适量体积gdna稀释至0.125ng/μl。
[0053]
(2)将特异性扩增引物对按照编号顺序摆放，使用前充分溶解，涡旋混匀，瞬时离心，扩增酶使用前充分溶解，因扩增酶中含有甘油，使用时轻轻混匀并离心，避免产生气泡，使用后立即放回-20℃冰箱保存。若操作人员要在短时间内多次取用，可将扩增酶暂放4℃，使用完毕后，再放-20℃冰箱保存。
[0054]
(3)八连管中配置扩增体系，配置过程最好在冰盒上进行，按照规定程序进行扩增，得到扩增产物，扩增体系、扩增程序如下表所示。
[0055]
表1 pcr扩增体系(单位：μl)
[0056][0057]
表2 pcr扩增程序
[0058][0059][0060]
3、扩增产物纯化富集。
[0061]
(1)扩增结束后将八连管在低温处静置一段时间，用掌式离心机瞬时离心，以减少气溶胶污染。
[0062]
(2)扩增产物补水至50μl，加入1.0x(50μl)dna ampure xp磁珠，磁珠使用前需室温平衡30min使其均一化，加入磁珠后混合震荡，室温静置5min，使扩增产物与磁珠充分接触。
[0063]
(3)瞬时离心后，将八连管置于磁力板上，静置3min，使用移液枪弃去上清。
[0064]
(4)配置80％乙醇，将八连管的每个管中加入200μl，转管2周，弃去上清；重复此步骤一次，然后瞬时离心，再用小量程移液枪弃去残余乙醇。
[0065]
(5)保持开盖状态，干式恒温器上37℃烘干或室温通风晾干至磁珠表面哑光(乙醇残留会抑制后续酶反应，磁珠干裂则降低核酸洗脱率)。
[0066]
(6)加入20μl nf水，振荡混匀，静置2min，室温孵育进行洗脱。
[0067]
(7)瞬时离心后置于磁力板上，静置2min，吸取17μl上清液转移至新的八连管中，得到待检质控品。
[0068]
(8)浓度检测及稀释：使用qubit dsdna hs(high sensitivity)assay kit分析试剂盒对待检质控品进行浓度检测，取适量体积进行稀释(引物质检时不稀释)，-20℃冰箱保存。
[0069]
二、构建第一文库。
[0070]
1、将质检合格的接头引物序列及上述待检质控品分别取2μl、1μl于八连管，使用前充分溶解，涡旋混匀，瞬时离心，管中加10μl扩增酶和7μl nf水。
[0071]
2、在八连管中配置扩增体系，按照扩增程序进行扩增，扩增体系、扩增程序如下表所示。
[0072]
表3 pcr扩增体系(单位：μl)
[0073][0074]
表4 pcr扩增程序
[0075][0076]
3、扩增产物纯化富集。
[0077]
(1)扩增结束后将八连管在低温处静置一段时间，用掌式离心机瞬时离心，以减少气溶胶污染。
[0078]
(2)扩增产物补水至50μl，加入1.0x(50μl)dna ampure xp磁珠，磁珠使用前需室温平衡30min使其均一化，加入磁珠后混合震荡，室温静置5min，使扩增产物与磁珠充分接触。
[0079]
(3)瞬时离心后，将八连管置于磁力板上，静置3min，使用移液枪弃去上清。
[0080]
(4)配置80％乙醇，将八连管的每个管中加入200μl，转管2周，弃去上清；重复此步
骤一次，然后瞬时离心，再用小量程移液枪弃去残余乙醇。
[0081]
(5)保持开盖状态，干式恒温器上37℃烘干或室温通风晾干至磁珠表面哑光(乙醇残留会抑制后续酶反应，磁珠干裂则降低核酸洗脱率)。
[0082]
(6)加入20μl nf水，振荡混匀，静置2min，室温孵育进行洗脱。
[0083]
(7)瞬时离心后置于磁力板上，静置2min，吸取17μl上清液转移至新的八连管中，得到带有识别标签的文库，即第一文库，制备流程如图2所示。
[0084]
三、第一质控。
[0085]
1、上机测序。
[0086]
(1)将第一文库浓度输入上机信息表中，进行文库pooling使文库浓度均一化，将所有稀释后的文库pooling到一管中。
[0087]
(2)用nf水将20μl 1n naoh溶液稀释到0.2n，用ht1高通量测序缓冲液将pooling好的文库稀释至4nm。
[0088]
(3)文库变性，取规定体积4nm的文库于新的1.5ml ep管中，然后加入规定体积0.2n naoh溶液，振荡混匀，室温变性5min，期间涡旋混匀2次。
[0089]
(4)用ht1高通量测序缓冲液将变性后的文库稀释至20pm，然后进一步稀释至1.5pm。
[0090]
(5)每个文库上机3m数据量，按照上机操作对文库进行测序。
[0091]
2、质控分析。
[0092]
对测序后待检质控品数据进行质控分析，质控指标为：cross_contamination《1/106、实验产出数据量/预期数据量＞0.6、测序芯片数据拆分效率＞0.85和编号一致性(待检模板和实际检出模板一一对应)。
[0093]
若第一轮质控分析不符合，则将不符合的质控品作为复检质控品，将所述复检质控品重复进行构建第一文库步骤、第一质控步骤，筛选出合格的质控品。
[0094]
分析结果：交叉污染率(cross_contamination《百万分之一)的分析结果如图3所示，数据产出比大于0.6(实验产出数据量/预期数据量)的分析结果如图4所示，测序芯片数据拆分效率(pf率)大于0.85的分析结果如下表所示，编号一致性的分析结果为待检模板和实际检出模板一一对应。
[0095]
表5测序芯片数据拆分效率(pf率)大于0.85的分析结果
[0096][0097][0098]
基于以上数据筛选出177个合格质控品，形成质控品集合。
[0099]
四、构建第二文库。
[0100]
从integrated dna technologies(idt)合成的384对barcode长度为8nt的udi引物，适用于转座酶法建库试剂盒，上述384对接头引物序列为待检接头引物序列。
[0101]
1、选用已稀释合格后的质控品集合，同待检接头引物序列一起建库，该待检接头引物序列包括待检文库标签引物、测序接头，上述测序接头由本领域技术人员根据测序平
台选择单端index接头或双端index接头。在本实施例中，采用illumina平台，本发明人选择双端index接头。然后按照质控品、待检接头引物序列一一对应的形式对应好，并做好记录，试剂使用前充分溶解，涡旋混匀，瞬时离心。
[0102]
2、在八连管中配置扩增体系，按照扩增程序进行扩增，扩增体系如下表所示，扩增程序如上述表4所示。
[0103]
表6 pcr扩增体系(单位：μl)
[0104][0105]
3、扩增产物纯化富集：
[0106]
(1)扩增结束后将八连管在低温处静置一段时间，用掌式离心机瞬时离心，以减少气溶胶污染。
[0107]
(2)扩增产物补水至50μl，加入1.0x(50μl)dna ampure xp磁珠，磁珠使用前需室温平衡30min使其均一化，加入磁珠后混合震荡，室温静置5min，使扩增产物与磁珠充分接触。
[0108]
(3)瞬时离心后，将八连管置于磁力板上，静置3min，使用移液枪弃去上清。
[0109]
(4)配置80％乙醇，将八连管的每个管中加入200μl，转管2周，弃去上清；重复此步骤一次，然后瞬时离心，再用小量程移液枪弃去残余乙醇。
[0110]
(5)保持开盖状态，干式恒温器上37℃烘干或室温通风晾干至磁珠表面哑光(乙醇残留会抑制后续酶反应，磁珠干裂则降低核酸洗脱率)。
[0111]
(6)加入20μl nf水，振荡混匀，静置2min，室温孵育进行洗脱。
[0112]
(7)瞬时离心后置于磁力板上，静置2min，吸取17μl上清液转移至新的八连管中，得到带有识别标签的文库，即第二文库。
[0113]
五、第二质控。
[0114]
1、上机测序。
[0115]
(1)将第二文库浓度输入上机信息表中，进行文库pooling使文库浓度均一化，将所有稀释后的文库pooling到一管中。
[0116]
(2)用nf水将20μl 1n naoh溶液稀释到0.2n，用ht1高通量测序缓冲液将pooling好的文库稀释至4nm。
[0117]
(3)文库变性，取规定体积4nm的文库于新的1.5ml ep管中，然后加入规定体积0.2n naoh溶液，振荡混匀，室温变性5min，期间涡旋混匀2次。
[0118]
(4)用ht1高通量测序缓冲液将变性后的文库稀释至20pm，然后进一步稀释至1.5pm。
[0119]
(5)每个文库上机3m数据量，按照上机操作对文库进行测序。
[0120]
2、质控分析。
[0121]
对测序后待检接头引物序列数据进行质控分析，筛选得到合格的接头引物序列，
即得到合格的文库标签引物，质控指标为：cross_contamination《1/106、实验产出数据量/预期数据量＞0.6、测序芯片数据拆分效率＞0.85和编号一致性(待检模板和实际检出模板一一对应)。
[0122]
若第一轮质控分析不符合，则将不符合的文库标签引物作为复检文库标签引物，将所述复检文库标签引物对应的接头引物序列重复进行构建第二文库步骤、第二质控步骤，筛选出合格的文库标签引物。
[0123]
3、分析结果。
[0124]
(1)对上述384对接头引物序列进行第一轮质控的结果如图5、图6、下表所示，其中，交叉污染率(cross_contamination《百万分之一)的分析结果如图5所示，数据产出比大于0.6(实验产出数据量/预期数据量)的分析结果如图6所示，测序芯片数据拆分效率(pf率)大于0.85的分析结果如下表所示，编号一致性的分析结果为待检模板和实际检出模板一一对应。
[0125]
表7测序芯片数据拆分效率(pf率)大于0.85的分析结果
[0126]
batchnoflowcelltotal_readspf_reads％pf有效readsguangzhou0066hy7ttbgxk71584741157851227789.62518471380guangzhou0074hvyl7bgxk52576023445305021191.59414935097guangzhou0075hck7tbgxk59465268146242028186.6400436542guangzhou0086hknkjbgxj48860489744478478388.07391723293guangzhou0091hcjl5bgxk63462826549598420889.64444578421guangzhou0097hn32ybgxj73127794060615770688.41535877357guangzhou0106hctywbgxk57176312848874176087.11425765429
[0127]
(2)对第一轮污染率、数据量不合格的64对接头引物序列重新建库、质控，结果如图7-8所示。
[0128]
本发明人将第一轮质控中污染率不合格的接头引物序列作为组1，将第一轮质控中数据量不合格的接头引物序列作为组2，对组1、组2进行复检。
[0129]
组1的待检接头引物序列，第一次质控污染率不合格引物29个，复检后25个合格，即得到25个合格的待检文库标签引物，合格率86％。
[0130]
组2的待检接头引物序列，第一次质控数据量不合格引物35个，复检后17个合格，即得到17个合格的待检文库标签引物，合格率49％。
[0131]
最终筛选出合格的文库标签引物362对。
[0132]
通过上述方法，384对文库标签引物在两位实验操作员条件下，两天可完成第一轮质检全流程实验，第三天完成不合格部分复检处理，质检所用的总成本大概1.5-2.2万元；如果针对每个引物采用转座酶方式建库测序进行质检，成本大概需要6万元，需要至少5天完成第一轮质检。
[0133]
以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
[0134]
以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来
说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种高速注塑用的薄壁餐具树脂及其制备方法与流程

一种文库标签引物的质控方法及其应用与流程

相关文献

最热文献