一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

增加多核苷酸的无模板酶促合成中的长序列产率的制作方法

2022-07-11 04:19:03 来源:中国专利 TAG:

增加多核苷酸的无模板酶促合成中的长序列产率
背景
1.最近,人们对多核苷酸合成的酶促方法的兴趣有所增加,这不仅是因为许多领域(如合成生物学、crispr-cas9应用和高通量测序)对合成多核苷酸的需求增加,而且还因为多核苷酸合成的化学方法的局限性,如产物长度的上限以及有机溶剂的使用和所期望处置,jensen等人,biochemistry,57:1821-1832(2018)。酶促合成因其特异性和效率以及它对温和水性反应条件的要求而具有吸引力。
2.目前,大多数酶促方法采用无模板聚合酶将3
’‑
o-封闭的三磷酸核苷重复添加到单链引发剂或与支持物连接的延长链,然后去封闭直到获得所期望序列的多核苷酸。还可以包括加帽步骤。因为这些步骤
‑‑
单体连接、去封闭和加帽
‑‑
通常不会进行到完成,所以可能会生成失效序列。因此,大多数无模板酶促合成方法面临的挑战是将全长最终产物与失效序列分离。
3.鉴于上述情况,如果改进的方法可用于将全长最终产物与失效序列分离,则多核苷酸的酶促合成将得到推进。发明概述
4.本发明涉及用于多核苷酸的无模板酶促合成的方法和试剂盒,其包括用于从最终多核苷酸产物减少或清除失效序列的步骤。在各种实施方案中,此类步骤包括一个或多个基于杂交的、基于核酸酶消化的和基于捕获的子步骤。
5.在一些实施方案中,本发明涉及合成具有预定序列的多核苷酸的方法,其包括以下步骤:a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3
’‑
羟基的3
’‑
末端核苷酸;b)重复以下循环直到形成具有所述预定序列的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3
’‑
o-羟基的延长片段与3
’‑
o-封闭的三磷酸核苷以及模板非依赖性dna聚合酶接触,使得通过掺入3
’‑
o-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3
’‑
o-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3
’‑
羟基的延长片段;c)通过使引物退火至至少一条多核苷酸的3’端,并延伸所述引物以产生所述多核苷酸的反向互补序列,来生成双链多核苷酸;d)提供具有在所述双链多核苷酸中解离失效序列的杂交严格性的反应条件;以及e)消化所解离的双链多核苷酸的链。
6.在一些实施方案中,本发明涉及合成具有预定序列的多核苷酸的方法,其包括以下步骤:a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3
’‑
羟基的3
’‑
末端核苷酸;b)重复以下循环直到形成扩增的多核苷酸,其中每条在其3’端处包含具有通用引物结合位点的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3
’‑
o-羟基的延长片段与3
’‑
o-封闭的三磷酸核苷以及模板非依赖性dna聚合酶接触,使得通过掺入3
’‑
o-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3
’‑
o-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3
’‑
羟基的延长片段;c)通过使引物退火至每个扩增的多核苷酸的所述通用引物结合位点并延伸所述引物以产生所述多核苷酸的反向互补序列,来生成双链扩增的多核苷酸;d)提供具有杂交严格性的反应条件,使得在所述双链扩增的多核苷酸中的失效序列解离;以及e)消化所解离的双链扩增的多核苷酸的链。
7.在一些实施方案中,本发明涉及合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3
’‑
羟基的3
’‑
末端核苷酸;b)重复以下循环直到形成扩增的多核苷酸或其失效序列,其中每条在其3’端处包含具有引物结合位点的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3
’‑
o-羟基的延长片段与3
’‑
o-封闭的三磷酸核苷以及模板非依赖性dna聚合酶接触,使得通过掺入3
’‑
o-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3
’‑
o-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3
’‑
羟基的延长片段;c)使引物退火至所述扩增的多核苷酸或其失效序列的引物结合位点;d)重复以下循环直到形成扩增的多核苷酸的反向互补序列:(i)在引物延伸条件下使所述引物或具有游离3
’‑
o-羟基的延伸引物与3
’‑
o-封闭的三磷酸核苷以及模板依赖性的dna聚合酶接触,使得通过掺入3
’‑
o-封闭的三磷酸核苷来延伸所述引物或所述延伸引物,以形成包含3
’‑
o-封闭的延伸引物的双链片段,以及(ii)对所述延伸引物去封闭以形成具有游离3
’‑
羟基的延伸引物,其中在所述接触步骤(i)中,以与所述预定序列的反向互补序列相同的顺序使所述引物或所述延伸引物与3
’‑
o-封闭的三磷酸核苷接触,从而在失效序列上形成截短的反向互补序列;以及e)通过它们截短的反向互补序列去除失效序列。
8.在一些实施方案中,本发明涉及合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3
’‑
羟基的3
’‑
末端核苷酸;b)重复以下循环直到形成具有所述预定序列的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3
’‑
o-羟基的延长片段与3
’‑
o-氨基三磷酸核苷以及模板非依赖性dna聚合酶接触,使得通过掺入3
’‑
o-氨基三磷酸核苷来延长所述引发剂或所述延长片段,以形成3
’‑
o-氨基延长片段,(ii)将所述3
’‑
o-氨基延长片段转换为3
’‑
肟-延长片段,(iii)用3
’‑
核酸外切酶处理所述延长片段;(iv)将3
’‑
肟-延长片段转换为3
’‑
o-氨基延长片段;以及(v)对所述延长片段去封闭,以形成具有游离3
’‑
羟基的延长片段。
9.本发明的另一目的是提供用于增强用模板非依赖性dna聚合酶合成全长多核苷酸的试剂盒,所述试剂盒包含:(a)用于具有预定序列的多核苷酸的模板非依赖性合成的一个或多个tdt变体,(b)退火至所述多核苷酸的通用引物结合位点的一条或多条引物,(c)用于延伸退火至所述通用引物结合位点的所述一条或多条引物的模板依赖性聚合酶,和(c)消化失效序列的一种或多种单链核酸酶。附图简述
10.图1a和图1b以图解法示出了可用作本发明的一部分的多核苷酸的无模板酶促合成的方法。
11.图2a以图解法示出了本发明的使用杂交严格性来去除失效序列的方法的实施方案。
12.图2b以图解法示出了本发明的使用加帽和核酸外切酶处理来去除失效序列的方法。
13.图3a-图3c以图解法示出了实施方案,其采用模板非依赖性合成,然后进行合成链的模板依赖性的重新合成,然后进行非完整双链产物的核酸酶消化。
14.图4a-图4c示出了本发明的采用在阵列上杂交捕获全长多核苷酸的实施方案。
15.图5a-图5c示出了通过在阵列上组装全长多核苷酸来产生长片段的实施方案。
16.图6显示了证明3
’‑
肟基团赋予核酸外切酶抗性的数据。
17.图7a示出了可用于直接或间接切割电化学不稳定基团的稳压器/恒流器(pgstat)电路。
18.图7b以图解法示出了用于实施本发明方法的设备的组件。
19.图7c以图解法示出了用于实施本发明方法的可替代设备,其中一些试剂使用喷墨液滴发生器被递送至反应部位。发明详述
20.本发明的一般原理在本文中被更详细地公开,特别是通过实例的方式,如附图中所示和详细描述的那些实例。然而,应当理解,本发明不将本发明限制于所描述的特定实施方案。本发明可进行各种修改和可替代形式,其细节针对若干实施方案示出。本发明将涵盖落入本发明的原理和范围内的所有修改、等效物和可替代物。
21.除非另有指示,否则本发明的实践可以采用有机化学、分子生物学(包括重组技术)、细胞生物学和生物化学的常规技术和描述,这些都在本领域的技术范围内。此类常规技术可以包括但不限于合成肽、合成多核苷酸、单克隆抗体的制备和使用,核酸克隆,扩增,测序和分析以及相关技术。此类常规技术的方案可在制造商的产品文献和标准实验室手册中找到,诸如基因组分析:实验室手册系列(第i-iv卷)(genome analysis:a laboratory manual series(vols.i-iv));pcr引物:实验室手册(pcr primer:a laboratory manual);和分子克隆:实验室手册(molecular cloning:a laboratory manual)(全部来自冷泉港实验室出版社);lutz和bornscheuer,编辑,蛋白质工程手册(protein engineering handbook)(wiley-vch,2009);hermanson,bioconjugate techniques,第2版(学术出版社(academic press),2008);以及类似文献。
22.本发明涉及多核苷酸的无模板酶促合成方法,其包括用于减少最终产物中的失效序列数量的步骤。此类步骤包括但不限于依赖于杂交严格性和核酸酶处理来提高全长多核苷酸产率的步骤。图2a示出了本发明的一实施方案的步骤。固体支持物(202)提供为具有引发剂(204),以进行无模板酶促多核苷酸合成(下文有更完整的描述)。在合成(206)后,即在进行预定数量的连续掺入预定核苷酸序列的循环后,初始产物(207)含有多核苷酸的混合物,其包含全长序列(208)和由于掺入(包括掺入未封闭的dntp污染物)、去封闭和/或加帽等失败而缺失一个或多个核苷酸的失效序列(210a)。尽管不希望受理论束缚,但据信序列失效的另一个重要来源是由于酶变性和/或粘附到固体支持物和/或生长的多核苷酸链的空间位阻,结果是大多数失效序列是所期望序列的3’截短;因此,大多数失效序列没有可用作引物结合位点的3’端序列,并且可以通过该特性与全长多核苷酸区分开来。
23.对于全长多核苷酸,可以使引物(214)退火(212)至其3’端并在4种dntp存在的情况下通过模板依赖性聚合酶延伸(216),以合成初始产物的反向互补链,产生双链多核苷酸产物(218),其可能包括一些双链形式的失效序列(210b)。反应混合物的严格性增加(220),直到失效序列的反向互补序列开始从初始合成链解链(222)。严格性增加,直到仅全长双链多核苷酸产物(221)保留在固体支持物(202)上。然后可以用优先破坏单链dna(如3’截短的失效序列)的核酸酶(例如3
’→5’
核酸外切酶,如大肠杆菌(e.coli)核酸外切酶i)处理(224)剩余的全长序列。然后可以从固体支持物(202)上释放全长链(225),作为双链(228)或单链(230)产物。在一些实施方案中,引物(214)及其引物结合位点可以包括iis型限制性
核酸内切酶位点或切口酶位点,以从与固体支持物(202)连接的链去除末端引物结合位点。在另一实施方案中,引物可以用模板依赖性聚合酶来延伸,其中在每个反应步骤中仅包括单一dntp,并且此类dntp的序列由全长多核苷酸所期望的预定序列确定(例如,如图3a的实施方案所述的)。因此,至用作模板的多核苷酸包含任何缺失或其他异常所达到的程度,模板/延伸的引物复合物的双链部分将减少,从而允许通过杂交严格性从全长序列更容易地分离失效序列。
24.在一些实施方案中,在合成期间,可以通过将通用引物结合位点合成至其3’端来扩增所期望预定序列的多核苷酸。例如,可以在以下步骤中进行此类实施方案:(a)提供引发剂,其通过5’端与固体支持物连接并且具有包含游离3
’‑
羟基的3
’‑
末端核苷酸;(b)重复以下循环直到形成扩增的多核苷酸,其中每条在其3’端处包含具有通用引物结合位点的多核苷酸:(i)在延长条件下使所述引发剂或具有游离3
’‑
o-羟基的延长片段与3
’‑
o-封闭的三磷酸核苷以及模板非依赖性dna聚合酶接触,使得通过掺入3
’‑
o-封闭的三磷酸核苷来延长所述引发剂或所述延长片段,以形成3
’‑
o-封闭的延长片段,以及(ii)对所述延长片段去封闭,以形成具有游离3
’‑
羟基的延长片段;(c)通过使引物退火至每个扩增的多核苷酸的所述通用引物结合位点并延伸所述引物以产生所述多核苷酸的反向互补序列,来生成双链扩增的多核苷酸;(d)提供具有杂交严格性的反应条件,使得在所述双链扩增的多核苷酸中的失效序列解离;以及(e)消化所解离的双链扩增的多核苷酸的链。在其他实施方案中,所述方法可以包括从未消化的双链扩增的多核苷酸上切割通用引物结合位点以产生预定序列的所述多核苷酸的步骤。例如,可以通过以其双链形式设计通用引物结合位点以包含iis型限制性核酸内切酶识别位点,来完成此类切割。可以切割引物结合位点并洗涤固体支持物,以在从支持物上释放所期望的多核苷酸之前去除双链片段和核酸内切酶。
25.图2b示出了本发明的另一实施方案的步骤,其中在最终循环中对全长链加帽,以防止在通过核酸酶处理消化失效序列后核酸酶被消化,从而仅保留全长链。在此类消化后,可以去除捕获部分(264)。如上所述,固体支持物(252)上的引发剂(254)通过无模板酶促合成而延伸(256),产生包含全长多核苷酸(258)和如上所述的失效序列(260)(其主要为3
’‑
截短)的产物(257)。在预定数量的去封闭-掺入循环后,进行最终的加帽步骤(262),以向全长链添加加帽部分(264),其使得它们对3
’→5’
核酸外切酶消化具有抗性。在一些实施方案中,添加加帽部分(264)的反应是可逆的,使得在消化失效序列后,可以去除加帽部分(264),以恢复3
’‑
羟基端。在本发明的一个方面,如通过图6中的数据所示的,在采用3
’‑
o-氨基-dntp单体的实施方案中,已发现3
’‑
o-胺部分可易于转换为3
’‑
肟部分(例如,于50mm乙酸盐中的50mm丙酮,ph 5),并且3
’‑
肟对核酸外切酶处理(例如,热稳定的核酸外切酶i,neb)具有抗性。此外,3
’‑
o-肟可通过用甲氧基胺或等效试剂处理而转换回3
’‑
o-胺。3
’‑
o-胺可通过去封闭而转换为3
’‑
羟基,其在一些实施方案中,可以通过甲氧基胺处理在相同的反应混合物中进行。在其他实施方案中,多聚a尾可被添加为加帽部分,以防止被3
’→5’
核酸外切酶消化。
26.回到图2b,在加帽(262)后,用3
’→5’
核酸外切酶消化未加帽的序列(270)(如虚线所示的),其后去除加帽部分(264)。可从固体支持物(252)上释放或切割(271)全长链(274),以产生单链产物(273),或者它们可被转换(276)为双链形式,并被释放或被切割(278),以产生双链产物(280)。如图2a的实施方案中所示,还可以通过将通用引物结合位点
合成至多核苷酸的3’端来扩增本实施方案的多核苷酸,所述通用引物结合位点可以在完整合成、退火引物和产生互补链后被去除。
27.本发明的另一实施方案在图3a中示出。按如上所述合成多核苷酸产物(307),并将引物(314)退火至新合成链的3’端。然后使用模板依赖性的聚合酶延伸(331)引物(314),其中3’封闭的dntp被递送至通过无模板的合成合成的链的所期望序列的反向互补序列中的延伸引物(314)。由于暴露于生长的互补链的3’封闭的dntp的序列是所期望序列的反向互补序列,因此一旦到达失效位置,用作模板的失效序列将与所呈现的3
’‑
封闭的dntp以及截短或停止被延伸的失效序列的反向互补链变得反相。也就是说,在用作模板的全长多核苷酸上,下一个碱基可能是“a”,而失效序列可能缺失“a”,使得不会掺入3
’‑
可逆保护的dttp。虽然失效序列可能会因偶然出现的序列而重新开始延伸,但它会导致最终的延伸产物比用作模板的全长多核苷酸的产物短。只有全长序列(332)会产生完整的双链产物。可以通过解链和/或核酸外切酶消化(例如,exo i、exo t、exo vii)或通过用非特异性单链核酸内切酶(绿豆、核酸酶p1)处理,来从固体支持物(302)上去除(334)失效序列及其截短的组分。如上所述,全长链(335)可以作为单链(338)或双链(340)产物释放(336)。如图3b所示的,全长链(380)可被用于通过线性扩增产生互补链。也就是说,全长双链产物(380)的非共价连接链可以被解链(382)以释放互补链(384),其后引物(386)可以退火(385)至共价连接链(388)并在常规的模板依赖性聚合酶延伸反应中延伸(389),以形成新的非共价连接产物(390)。产物(390)可以从共价连接的全长链中解链并且重复循环(392)。在一些实施方案中,可以在每个核苷酸添加循环中实施加帽步骤。在其他实施方案中,全长链可以通过固相扩增方法(如桥式pcr、rpa、模板步移等)扩增。在一些此类扩增中,可以为固体支持物(302)提供引物群以及引发剂(304)。如在图2a的实施方案中,该实施方案的多核苷酸也可以通过将通用引物结合位点合成至多核苷酸的3’端来扩增,所述通用引物结合位点可以在合成完成、引物退火和互补链产生后被去除。
28.如图3c中所示的,图3a的实施方案可以通过无模板合成和模板依赖性合成的一系列交替步骤来进行。通过采用此类交替步骤,合成的链可以保持相对短,从而使全长序列与失效序列之间的解链温度差异最大化。例如,无模板合成的步骤包括多达10个,或多达20个,或多达30个,或多达40个,或多达50个连接循环。在一些实施方案中,无模板合成的步骤可以包括在10至50个范围内的多个掺入循环;在其他实施方案中,范围可以是10至30个;在其他实施方案中,该范围可以是10至20个。如上所述,初始产物(350)通过无模板酶促合成制备,其后引物(314)退火至合成链,并在3
’‑
封闭的dntp存在的情况下通过模板依赖性聚合酶延伸(354),以产生双链产物(355)。双链产物(355)包括完全双链的全长序列(357)以及部分双链和部分单链的失效序列(353)。如上文所提及的,双链产物(355)可以通过优先对较短失效序列的互补序列解链,然后进行单链核酸外切酶处理,或(如同所示的)通过切割引物(314)及其引物结合位点(显示为双链片段(358),然后优先解链(359)以及进行核酸外切酶处理而被加工(356),以产生全长序列,其可通过另一轮的无模板酶促合成(360)而延伸,以进而产生延伸的产物(362),其中每个包含新的片段(365),其可以包括新的失效序列。然后对延伸产物(362)进行另一循环(364)的引物退火、延伸和去除失效序列。
29.在一些实施方案中,可以通过在它们各自的引发剂上使用正交保护基团,在与所期望的多核苷酸相同的阵列上合成在图2a-图2b、图3a-图3c和相关实施方案中描述的实施
方案中采用的引物,例如,使用由godron等人,国际专利公开wo2020/141143所公开的技术。因此,在一些实施方案中,可以在相同反应混合物中合成具有针对特定多核苷酸定制序列的引物。在其他实施方案中,期望的多核苷酸可以通过通用引物结合位点延伸它们的3’端。
30.如下文更全面描述的,本发明的其他实施方案可以使用在固体支持物上的平行合成来实施,如含有空间上不同的合成区域的平面阵列,在该区域内可以合成不同的多核苷酸。如图4a-图4c中所示的,此类阵列可以被用于全长多核苷酸的合成和富集。图4a示出了示例性平面阵列(400)的子部分,其包括具有离散合成位点(404)的中心区域1(402)和包括与区域1(402)的合成位点不同的一个或多个合成位点(405)的外围区域2(406)。根据本发明,在其他平面阵列中,区域1(402)的离散合成位点(404)可以覆盖区域1(402)的而非所示的(或区域1(402)的全部)不同的部分,并且同样地,离散的合成位点(405)可以覆盖区域2(406)的而非所示的(整个区域2(406)的全部)不同的部分。所采用的配置是熟练从业人员的设计选择,其取决于所选择的平行合成方法,例如,该方法可以基于电化学、光化学或两者,用于合成反应的局部控制。在图4a-图4c的实施方案中,基本概念是形成两个区域(regions/zones),区域1是中心,且区域2围绕区域1。利用此类配置,在区域1中合成并从区域1释放的序列将扩散通过区域2,从而区域1的多核苷酸可以被设计并合成为包含与在区域2中设计和合成的多核苷酸互补的核苷酸片段。因此,在两个区域中合成多核苷酸后,在区域1的多核苷酸释放后,此类释放的区域1多核苷酸可以通过与区域2中的它们的互补序列杂交而被捕获。通过在阵列上平行进行此类操作,可以获得全长序列的大量富集的不同多核苷酸。
31.返回图4a,作为此类操作的实例,区域1多核苷酸被合成以产生产物(408),其包含全长序列和失效序列的组合。例如,在第一步中,可以合成300-mer序列,以产生含有20%全长序列和80%失效序列的产物(408)。在第二步中,在区域2(406)的反应位点(405)处合成与产物(408)序列的一部分互补的30-mer序列(412)。例如,30-mer产物(412)可能是90%的纯全长序列和10%的失效序列。在一些实施方案中,多核苷酸(408)的3’端是与30-mer产物(412)互补的部分。如图4c所示,在切割(414)区域1(402)的产物(408)(在允许杂交的条件下)后,产物的多核苷酸扩散穿过区域2(406),其中全长序列(416a、b、c)的一部分通过与区域2(406)中它们的互补序列杂交而被捕获。可选地,通过使用与区域1和区域2的分子连接的结合对的成员(如生物素和链霉亲和素)代替基于杂交的选择,可以实现类似的结果。例如,在此类可替代方案中,在区域1(402)的多核苷酸(408)的最终合成步骤中,可以掺入用生物素衍生化的dntp,并且代替在区域2(406)中合成30-mer互补多核苷酸(412),可以将链霉亲和素的涂层应用于区域2(406)。在任一情况下,全长多核苷酸(416a-c)可以通过切割或去杂交(420)而被释放(418)。
32.如图5a-图5c中所示的,图4a-图4c的阵列可以被应用于从包含来自单个区域的全长多核苷酸的组分组装更大的多核苷酸(“组装的多核苷酸”)。包括(例如)区域a、区域b、区域c至区域k的一系列合成区域(501)可以被线性地布置在阵列上。在每个区域中,在中心合成位点(分别为502、504、506、
……
508)处合成具有序列a、序列b、序列c
……
序列k的多核苷酸组分,并在外围合成位点(分别为503、505、507、...509)处合成夹板寡核苷酸a
’‑
b’、b
’‑
c’、c
’‑d’…j’‑
k’。夹板寡核苷酸包含与相邻区域的全长多核苷酸末端互补的区域,从而(例如)在连接酶存在的情况下,区域a和b的多核苷酸与夹板寡核苷酸a
’‑
b’杂交后,区域a
和b的多核苷酸形成根据图5b中所示的设计(510)的中间组装的多核苷酸。如图5c中所示的,此类组装可以在中心合成位点处的多核苷酸富集全长序列之后以逐步方式进行(这可以在每个连接步骤之前同时或逐步进行)。此类逐步组装的步骤按如下进行:(i)在杂交条件和连接条件下,切割第一区域(例如区域a)的中心合成位点的全长多核苷酸,并且切割(512)第一区域的外围合成位点处的夹板寡核苷酸,使得全长序列和夹板寡核苷酸都可以扩散(514)到第二区域(例如区域b),并形成包含来自第一区域的全长序列、第二区域的全长序列(其仍然与其合成位点连接)和夹板寡核苷酸的三向复合物(516)形式,其(ii)允许将区域a的全长序列连接到区域b的全长序列的3’端,以形成序列a-b的组装中间体。可以通过施加电场e(530和531)以在与它们形成复合物的连接多核苷酸的方向上驱动带负电荷的多核苷酸和寡核苷酸,来偏移切割序列的扩散。在组装中间体在第二区域连接(和任选的扩增,例如通过模板步移或其他固相扩增方法)后,对下一个区域重复(524)上述步骤,直到完成组装的多核苷酸。无模板酶促合成
33.通常,无模板(或等效地,“模板非依赖性”)酶促dna合成方法包括重复的步骤循环(如图2所示的重复的步骤循环),其中在每个循环中预定的核苷酸与引发剂或生长链连接。在以下参考文献中描述了无模板酶促合成的一般要素:ybert等人,国际专利公开wo/2015/159023;ybert等人,国际专利公开wo/2017/216472;hyman,美国专利5436143;hiatt等人,美国专利5763594;jensen等人,biochemistry,57:1821-1832(2018);mathews等人,organic&biomolecular chemistry,doi:0.1039/c6ob01371f(2016);schmitz等人,organic lett.,1(11):1729-1731(1999)。
34.例如,提供了与固体支持物(102)连接的具有游离3
’‑
羟基(103)的引发剂多核苷酸(100)。在将3
’‑
o-经保护的dntp有效酶促掺入到引发剂多核苷酸(100)(或延长的引发剂多核苷酸)的3’端上的条件(104)下,向引发剂多核苷酸(100)(或随后循环中的延长的引发剂多核苷酸)添加3
’‑
o-经保护的dntp以及无模板聚合酶(如tdt或其变体(例如ybert等人,wo/2017/216472;champion等人,wo2019/135007))。该反应产生延长的引发剂多核苷酸,其3
’‑
羟基被保护(106)。如果延长的引发剂多核苷酸包含竞争序列,则3
’‑
o-保护基可以被去除,或去保护,并且可以从原来的引发剂多核苷酸切割所期望的序列。可以采用多种单链切割技术中的任一种来进行此类切割,例如,通过在原始引发剂多核苷酸内的预定位置处插入可切割的核苷酸。示例性的可切割核苷酸可以是尿嘧啶核苷酸,其被尿嘧啶dna糖基化酶切割。如果延长的引发剂多核苷酸不包含完整的序列,则3
’‑
o-保护基被去除以暴露游离3
’‑
羟基(103),并且延长的引发剂多核苷酸进行另一循环的核苷酸添加和去保护。
35.如本文所用的,关于特定基团(如核苷酸或核苷的3
’‑
羟基)的术语“经保护的”和“封闭的”可互换使用,并且旨在意指与在化学或酶促过程中防止该基团发生化学变化的特定基团共价连接的部分。只要指定的基团是三磷酸核苷的3
’‑
羟基,或其中掺入了3
’‑
经保护的(或封闭的)-三磷酸核苷的延伸片段(或“延伸中间体”),则阻止的化学变化是通过酶促连接反应进一步或随后延伸延伸片段(或“延伸中间体”)。
36.如本文所用的,“引发剂”(或等效术语,诸如“引发片段”、“引发剂核酸”、“引发剂寡核苷酸”等)通常是指具有游离3’端的短寡核苷酸序列,其可以通过无模板聚合酶(如tdt)被进一步延长。在一实施方案中,引发片段是dna引发片段。在可替代的实施方案中,引
发片段是rna引发片段。在一些实施方案中,引发片段具有3-100个核苷酸,特别是3-20个核苷酸。在一些实施方案中,引发片段是单链的。在可替代的实施方案中,引发片段是双链的。在一些实施方案中,引发剂可以包含具有tdt可以将3
’‑
o-经保护的dntp与其连接的游离羟基的非核酸化合物,例如baiga,美国专利公开us2019/0078065和us2019/0078126。
37.在一些实施方案中,引发剂可以包含具有游离羟基的非核酸化合物,tdt可将所述非核酸化合物与3
’‑
o-经保护的dntp连接,例如baiga,美国专利公开us2019/0078065和us2019/0078126。
38.合成完成后,具有所期望核苷酸序列的多核苷酸可以通过切割从引发剂和固体支持物上被释放。为此目的,可以使用多种可切割的连接或可切割的核苷酸。在一些实施方案中,切割所期望多核苷酸在切割链上留下天然游离5
’‑
羟基;然而,在可替代实施方案中,切割步骤可以留下部分,例如5
’‑
磷酸盐,其可以在后续步骤中去除,例如通过磷酸酶处理。切割步骤可以通过化学、热、酶促或通过光化学方法进行。在一些实施方案中,可切割的核苷酸可以是核苷酸类似物(如脱氧尿苷或8-氧代-脱氧鸟苷),它们被特定的糖基化酶(例如,分别为尿嘧啶脱氧糖基化酶及随后的核酸内切酶viii和8-氧代鸟嘌呤dna糖基化酶)识别。在一些实施方案中,可以通过提供具有脱氧肌苷作为倒数第二个3’核苷酸的引发剂来完成切割,所述引发剂可以在引发剂的3’端被核酸内切酶v切割,在释放的多核苷酸上留下5
’‑
磷酸盐。用于切割单链多核苷酸的其他方法在以下参考文献中被公开,这些参考文献通过引用并入:美国专利第5,739,386、5,700,642和5,830,655号;以及美国专利公开第2003/0186226号和第2004/0106728号;以及urdea和horn,美国专利5367066。
39.在一些实施方案中,通过糖基化酶和/或核酸内切酶切割可能需要双链dna底物。
40.回到图1a,在一些实施方案中,在每个合成步骤中,在3
’‑
o-经保护的dntp存在的情况下,使用无模板聚合酶(如tdt)将核苷酸的有序序列与引发剂核酸连接。在一些实施方案中,合成寡核苷酸的方法包括以下步骤:(a)提供具有游离3
’‑
羟基的引发剂(100);(b)在延伸条件下(104),在3
’‑
o-经保护的三磷酸核苷存在的情况下,使具有游离3
’‑
羟基的引发剂或延伸中间体与无模板的聚合酶反应,以产生3
’‑
o-经保护的延伸中间体(106);(c)对延伸中间体进行去保护,以产生具有游离3
’‑
羟基的延伸中间体(108);以及(d)重复步骤(b)和(c)(110),直到合成多核苷酸。(有时,术语“延伸中间体”和“延伸片段”可互换使用)。在一些实施方案中,引发剂提供为例如通过其5’端与固体支持物连接的寡核苷酸。上述方法还可以包括在反应或延伸步骤之后以及去保护步骤之后的洗涤步骤。例如,反应步骤可以包括在预定的孵育期或反应时间后去除未掺入的三磷酸核苷的子步骤(例如通过洗涤)。此类预定的孵育期或反应时间可以是几秒钟(例如30sec)至几分钟(例如30min)。
41.当合成支持物上的多核苷酸序列包括反向互补子序列时,可以通过在反向互补区域之间形成氢键来产生二级分子内或分子间结构。在一些实施方案中,选择环外胺的碱基保护部分以使被保护氮的氢不能参与氢键结合,从而防止此类二级结构的形成。也就是说,可以采用碱基保护部分来防止氢键的形成,如在正常碱基配对中形成的氢键,例如在核苷a和t之间以及g和c之间形成的氢键。在合成结束时,碱基保护部分可以被去除并且多核苷酸产物可以从固体支持物上被切割下来,例如,通过将它从其引发剂上切割下来。
42.除了提供具有碱基保护基团的3
’‑
o-封闭的dntp单体外,延长反应可以使用热稳定的无模板聚合酶在更高的温度下进行。例如,可以采用具有高于40℃活性的热稳定的无
模板聚合酶;或者,在一些实施方案中,可以采用具有40-85℃范围内的活性的热稳定的无模板聚合酶;或者,在一些实施方案中,可以采用具有40-65℃范围内的活性的热稳定的无模板聚合酶。
43.在一些实施例中,延长条件可以包括向延长反应混合物中添加抑制氢键结合或碱基堆积的溶剂。此类溶剂包括具有低介电常数的水混溶性溶剂(如二甲亚砜(dmso)、甲醇等)。同样,在一些实施方案中,延长条件可以包括提供离液剂,其包括但不限于正丁醇、乙醇、氯化胍、高氯酸锂、乙酸锂、氯化镁、苯酚、2-丙醇、十二烷基硫酸钠、硫脲、尿素等。在一些实施方案中,延长条件包括存在二级结构抑制量的dmso。在一些实施方案中,延长条件可以包括提供抑制二级结构形成的dna结合蛋白,其中此类蛋白包括但不限于单链结合蛋白、解旋酶、dna乙二醇酶(dna glycolases)等。
44.没有碱基保护的3
’‑
o-封闭的dntp可从商业供应商购得,或使用发表的技术合成,例如,美国专利7057026;guo等人,proc.natl.acad.sci.,105(27):9145-9150(2008);benner,美国专利7544794和8212020;国际专利公开wo2004/005667、wo91/06678;canard等人,gene(本文中引用的);metzker等人,nucleic acids research,22:4259-4267(1994);meng等人,j.org.chem.,14:3248-3252(3006);美国专利公开2005/037991。可按如下所述合成具有碱基保护的3
’‑
o-封闭的dntp。
45.当采用经碱基保护的dntp时,图1a的上述方法还可以包括步骤(e):去除碱基保护部分,在酰基或脒保护基团的情况下,这可以(例如)包括用浓氨处理。
46.除了在反应或延伸步骤之后的洗涤步骤之外,上述方法还可以包括一个或多个加帽步骤。第一加帽步骤可以加帽,或使得部分合成的多核苷酸上的未反应的3
’‑
oh基对进一步延伸呈惰性。此类加帽步骤通常在连接步骤之后实施,并且无论何时使用加帽化合物,都选择不与刚刚与生长链连接的单体的保护基团反应。在一些实施方案中,此类加帽步骤可以通过连接(例如,通过第二个酶促连接步骤)使部分合成的多核苷酸不能例如用tdt进一步连接的加帽化合物来实施。此类加帽化合物可以是三磷酸双脱氧核苷。在其他实施方案中,具有游离3
’‑
羟基的非延伸链可以通过用3
’‑
核酸外切酶活性(例如exo i)处理它们来降解。例如,参见hyman,美国专利5436143。同样,在一些实施方案中,可以对未能去封闭的链进行处理以去除该链或使其对进一步延伸呈惰性。可以在去保护步骤之后实施第二加帽步骤,以使受影响的链对任何后续连接或去保护任何3
’‑
o保护或封闭基团都呈惰性。选择此类第二加帽步骤的加帽化合物,以使它们不与可能存在的游离3
’‑
羟基反应。在一些实施方案中,此类第二加帽化合物可以是醛基和疏水基团的缀合物。后一组允许基于疏水性进行分离,例如andrus,美国专利5047524。
47.在一些实施方案中,延伸或延长步骤的反应条件可以包括以下物质:2.0μm纯化的tdt;125-600μm的3
’‑
o-封闭的dntp(例如,3
’‑
o-nh
2-封闭的dntp);约10至约500mm的卡可基酸钾缓冲液(6.5-7.5的ph),以及约0.01至约10mm的二价阳离子(例如,cocl2或mncl2),其中所述延长反应可以在50μl反应体积中,在rt至45℃范围内的温度下进行3分钟。在实施方案中,其中3
’‑
o-封闭的dntp是3
’‑
o-nh
2-封闭的dntp,去封闭步骤的反应条件可以包括以下物质:700mm的nano2;1m的乙酸钠(用乙酸调节ph范围为4.8-6.5),其中所述去封闭反应可以在50μl体积中,在rt至45℃范围内的温度下进行30秒至几分钟。
48.取决于特定的应用,去封闭和/或切割的步骤可以包括多种化学或物理条件,例如
光、热、ph、特定试剂(如能够切割特定化学键的酶)的存在。选择3
’‑
o-封闭基团和相应的去封闭条件的指导可以在以下参考文献中找到,这些参考文献通过引用并入本文中:benner,美国专利7544794和8212020;美国专利5808045;美国专利8808988;国际专利公开wo91/06678;以及下列参考文献。在一些实施方案中,切割剂(有时也被称为去封闭试剂或去封闭剂)是化学切割剂,诸如例如二硫苏糖醇(dtt)。在可替代实施方案中,切割剂可以是酶促切割剂,诸如例如磷酸酶,其可以切割3
’‑
磷酸封闭基团。本领域技术人员将理解,去封闭剂的选择取决于所使用的3
’‑
核苷酸封闭基团的类型、是否使用一个或多个封闭基团、引发剂是否与活细胞或生物体或固体支持物连接等,这使得需要进行温和的处理。例如,膦,如三(2-羧乙基)膦(tcep)可以被用于切割3’o-叠氮甲基,钯络合物可以被用于切割3’o-烯丙基,或亚硝酸钠可以被用于切割3’o-氨基。在具体实施方案中,切割反应涉及tcep、钯络合物或亚硝酸钠,例如参见美国专利8212020,其通过引用并入本文中。
49.如上所述,在一些实施方案中,期望采用两个或更多个封闭基团,这些封闭基团可以使用正交去封闭条件来去除。以下示例性的保护基对可以被用于平行合成实施方案中。应当理解,其他保护基团对或包含多于两个的基团可能可用于本发明的这些实施方案中。3
’‑
o-nh23
’‑
o-叠氮甲基3
’‑
o-nh23
’‑
o-烯丙基、3
’‑
o-炔丙基3
’‑
o-nh23
’‑
o-磷酸酯3
’‑
o-叠氮甲基3
’‑
o-烯丙基、3
’‑
o-炔丙基3
’‑
o-叠氮甲基3
’‑
o-磷酸酯3
’‑
o-烯丙基、3
’‑
o-炔丙基3
’‑
o-磷酸酯
50.在活细胞上合成寡核苷酸需要温和的去封闭或去保护的条件,即不破坏细胞膜、不使蛋白质变性、不干扰关键细胞功能等的条件。在一些实施方案中,去保护的条件在与细胞存活相容的生理条件范围内。在此类实施方案中,酶促去保护是可期望的,因为它可以在生理条件下进行。在一些实施方案中,特定的酶促可去除的封闭基团与特定的酶缔合以去除它们。例如,基于酯-或酰基-的封闭基团可以用酯酶(如乙酰酯酶)或类似酶去除,并且磷酸酯封闭基团可以用3’磷酸酶(如t4多核苷酸激酶)去除。例如,可以通过用100mm的tris-hcl(ph 6.5)、10mm的mgcl2、5mm的2-巯基乙醇和一种unit t4多核苷酸激酶的溶液处理来去除3
’‑
o-磷酸酯。反应在37℃的温度下进行一分钟。
[0051]“3
’‑
磷酸酯封闭的”或“3
’‑
磷酸酯保护的”核苷酸是指其中3
’‑
位置处的羟基通过存在的含磷酸酯部分封闭的核苷酸。根据本发明的3
’‑
磷酸酯封闭的核苷酸的实例是核苷酸基(nucleotidyl)-3
’‑
磷酸单酯/核苷酸基-2’,3
’‑
环磷酸酯、核苷酸基-2
’‑
磷酸单酯和核苷酸基-2’或3
’‑
烷基磷酸二酯,以及核苷酸基-2’或3
’‑
焦磷酸酯。也可以使用硫代磷酸酯或此类化合物的其他类似物,只要该取代不会阻止磷酸酶去磷酸化导致游离的3
’‑
oh。
[0052]3’‑
o-酯保护的dntp或3
’‑
o-磷酸酯保护的dntp的合成和酶促去保护的其他实例在以下参考文献中有详细描述:canard等人,proc.natl.acad.sci.,92:10859-10863(1995);canard等人,gene,148:1-6(1994);cameron等人,biochemistry,16(23):5120-5126(1977);rasolonjatovo等人,nucleosides&nucleotides,18(4&5):1021-1022(1999);ferrero等人,monatshefte fur chemie,131:585-616(2000);taunton-rigby等人,j.org.chem.,38(5):977-985(1973);uemura等人,tetrahedron lett.,30(29):3819-3820
(1989);becker等人,j.biol.chem.,242(5):936-950(1967);tsien,国际专利公开wo1991/006678。
[0053]
在一些实施方案中,经修饰的核苷酸包含经修饰的核苷酸或核苷分子,其包含嘌呤或嘧啶碱基和核糖或脱氧核糖糖部分,所述糖部分具有与其共价连接的可去除的3
’‑
oh封闭基团,使得3’碳原子连接一组结构:-o-z其中

z是以下中的任一个:

c(r’)
2-o-r”、-c(r’)
2-n(r”)2、-c(r’)
2-n(h)r”、-c(r’)
2-s-r”和

c(r’)
2-f,其中每个r”是可去除的保护基团或其一部分;每个r’独立地是氢原子、烷基、取代烷基、芳烷基、烯基、炔基、芳基、杂芳基、杂环基、酰基、氰基、烷氧基、芳氧基、杂芳氧基或氨基,或通过连接基团连接的可检测标记;条件是在一些实施方案中,此类取代基具有至多10个碳原子和/或至多5个氧或氮杂原子;或(r’)2表示式=c(r
”’
)2的基团,其中每个r
”’
可以相同或不同,并且选自氢和卤原子以及烷基,条件是在一些实施方案中,每个r
’”
的烷基具有1-3个碳原子;并且其中所述分子可以反应产生中间体,其中每个r”被交换为h,或者,其中z是

(r’)
2-f,f被交换为oh、sh或nh2,优选oh,该中间体在水性条件下解离得到具有游离3
’‑
oh的分子;条件是其中z是

c(r’)
2-s-r”,两个r’基团都不是h。在某些实施方案中,经修饰的核苷酸或核苷的r’是烷基或取代的烷基,条件是此类烷基或取代的烷基具有1至10个碳原子和0至4个氧或氮杂原子。在某些实施方案中,经修饰的核苷酸或核苷的-z具有式

c(r’)
2-n3。在某些实施方案中,z是叠氮甲基。
[0054]
在一些实施方案中,z是具有或不具有分子量为200或更小的杂原子的可切割有机部分。在其他实施方案中,z是具有或不具有分子量为100或更小的杂原子的可切割有机部分。在其他实施方案中,z是具有或不具有分子量为50或更小的杂原子的可切割有机部分。在一些实施方案中,z是具有或不具有分子量为200或更小的杂原子的酶促可切割的有机部分。在其他实施方案中,z是具有或不具有分子量为100或更小的杂原子的酶促可切割的有机部分。在其他实施方案中,z是具有或不具有分子量为50或更小的杂原子的酶促可切割的有机部分。在其他实施方案中,z是分子量为200或更小的酶促可切割的酯基。在其他实施方案中,z是可被3
’‑
磷酸酶去除的磷酸酯基团。在一些实施方案中,以下3
’‑
磷酸酶中的一种或多种可以与制造商推荐的方案一起使用:t4多核苷酸激酶、小牛肠碱性磷酸酶、重组虾碱性磷酸酶(例如可从new england biolabs,beverly,ma获得)。
[0055]
在其他实施方案中,3
’‑
封闭的三磷酸核苷酸被3
’‑
o-叠氮甲基、3
’‑
o-nh2或3
’‑
o-烯丙基封闭。在其他实施方案中,本发明的3
’‑
o-封闭基团包括3
’‑
o-甲基、3
’‑
o-(2-硝基苄基)、3
’‑
o-烯丙基、3
’‑
o-胺、3
’‑
o-叠氮甲基、3
’‑
o-叔丁氧乙氧基、3
’‑
o-(2-氰乙基)、3
’‑
o-硝基和3
’‑
o-炔丙基。在其他实施方案中,3
’‑
封闭的三磷酸核苷酸被3
’‑
o-叠氮甲基或3
’‑
o-nh2封闭。此类3’封闭的三磷酸核苷的合成和使用在以下参考文献中公开:美国专利9410197;8808988;6664097;5744595;7544794;8034923;8212020;10472383;guo等人,proc.natl.acad.sci.,105(27):9145-9150(2008);以及类似参考文献。
[0056]
在一些实施方案中,3
’‑
o-保护基团是电化学不稳定的基团。即,保护基团的去保护或可切割是通过改变导致可切割的保护基团附近的电化学条件来完成的。电化学条件的此类变化可以通过改变或施加物理量(如电压差或光)来引起以激活辅助物质,这反过来会导致保护基团位置处电化学条件的变化(如ph升高或降低)。在一些实施方案中,电化学不
稳定基团包括例如ph敏感保护基团,其在ph变化至预定值时被切割。在其他实施方案中,电化学不稳定的基团包括保护基团,当还原或氧化条件改变时,例如通过增加或减少保护基团位置处的电压差,其直接被切割。tdt变体
[0057]
多种不同的无模板聚合酶可用于由本发明的系统和装置实施的合成方法中。无模板聚合酶包括但不限于polx家族聚合酶(包括dna聚合酶β、λ和μ)、多聚(a)聚合酶(pap)、多聚(u)聚合酶(pup)、dna聚合酶θ等,例如,以下参考文献中所述的:ybert等人,国际专利公开wo2017/216472;champion等人,美国专利10435676;champion等人,国际专利公开wo2020/099451;yang等人,j.biol.chem.,269(16):11859-11868(1994);motea等人,biochim.biophys.acta,1804(5):1151-1166(2010)。特别地,末端脱氧核苷酸转移酶(tdt)及其变体可用于无模板dna合成,尤其是用于多核苷酸的喷墨辅助合成。
[0058]
在一些实施方案中,酶促合成方法采用tdt变体,其显示出相对于3
’‑
o-经修饰的三磷酸核苷增加的掺入活性。例如,此类tdt变体可以使用champion等人,美国专利10435676中所描述的技术产生,该专利通过引用并入本文中。在一些实施方案中,采用与具有seq id no2-31中的任一项的氨基酸序列以及表1中所列出的一个或多个取代的tdt至少60%相同的氨基酸序列的tdt变体,其中所述tdt变体(i)能够在无模板的情况下合成核酸片段,和(ii)能够在核酸片段的游离3
’‑
羟基上掺入3
’‑
o-经修饰的核苷酸。在一些实施方案中,上述tdt变体包括表1中所列出的每个位置处的取代。在一些实施方案中,上述同一性百分比值与所示的seq id no具有至少80%的同一性;在一些实施方案中,上述同一性百分比值与所示的seq id no具有至少90%的同一性;在一些实施方案中,上述同一性百分比值与所示的seq id no具有至少95%的同一性;在一些实施方案中,上述同一性百分比值至少为97%的同一性;在一些实施方案中,上述百分比同一性值为至少98%的同一性;在一些实施方案中,上述同一性百分比值为至少99%的同一性。如本文所用的,用于比较参考序列与变体序列的同一性百分比值不包括明确指定的含有变体序列取代的氨基酸位置;也就是说,百分比同一性关系在参考蛋白的序列与在变体中包含取代的明确指定位置之外的变体蛋白的序列之间。因此,例如,如果参考序列和变体序列各自包含100个氨基酸并且变体序列在位置25和81具有突变,那么同源性百分比将是关于序列1-24、26-80和82-100。
[0059]
关于(ii),此类3
’‑
o-经修饰的核苷酸可以包含3
’‑
o-nh2-三磷酸核苷、3
’‑
o-叠氮甲基-三磷酸核苷、3
’‑
o-烯丙基-三磷酸核苷、3
’‑
o-(2-硝基苄基)-三磷酸核苷或3
’‑
o-炔丙基-三磷酸核苷。表1
[0060]
在一些实施方案中,如表1中所示的,用于本发明方法的其他tdt变体包括甲硫氨酸、半胱氨酸或谷氨酸的一个或多个取代。
[0061]
在一些实施方案中,如表1中所示的,用于本发明的方法的其他tdt变体包括甲硫氨酸、半胱氨酸或谷氨酸的一个或多个其他的取代。
[0062]
在表2中列出了可用于本发明方法的其他特定tdt变体。表2的tdt变体ds1001至ds1018中的每一个包含与seq id no 2至少60%相同的氨基酸序列,并且包含在指定位置处的取代。在一些实施方案中,tdt变体ds1001至ds1018包含与seq id no 2至少80%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,tdt变体ds1001至ds1018包含与seq id no 2至少90%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,tdt变体ds1001至ds1018包含与seq id no 2至少95%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,tdt变体ds1001至ds1018包含与seq id no 2至少97%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,tdt变体ds1001至ds1018包含与seq id no 2至少98%相同的氨基酸序列,并且包含在指定位置处的取代;在一些实施方案中,tdt变体ds1001至ds1018包含与seq id no 2至少99%相同的氨基酸,并且包含在指定位置处的取代。表2:用于本发明方法的特定tdt变体
[0063]
如上所述的本发明的tdt变体各自包含与指定的seq id no具有百分比序列同一性的氨基酸序列,受指定取代存在的影响。在一些实施方案中,以这种方式描述的本发明的tdt变体与指定的seq id no之间的序列差异的数量和类型可能是由于取代、缺失和/或插入,并且被取代、缺失和/或插入的氨基酸可以包含任何氨基酸。在一些实施方案中,此类缺失、取代和/或插入仅包含天然存在的氨基酸。在一些实施方案中,取代仅包含保守的或同义的氨基酸变化,如grantham,science,185:862-864(1974)中所述的。也就是说,氨基酸的取代只能发生在其同义氨基酸组的成员中。在一些实施方案中,可采用的同义氨基酸组列于表3a中。表3a:同义氨基酸组i
[0064]
在一些实施方案中,可采用的同义氨基酸组列于表3b中。表3b:同义氨基酸组ii
7.5、150mm nacl(sigma)和20mm咪唑(sigma)洗涤和平衡柱。tdt聚合酶在平衡后与柱结合;然后,例如由50mm tris-hcl(sigma)ph 7.5、500mm nacl(sigma)和20mm咪唑(sigma)组成的洗涤缓冲液可以以15倍柱体积应用于柱。在此类洗涤之后,用50mm tris-hcl(sigma)ph 7.5、500mm nacl(sigma)和0.5m咪唑(sigma)洗脱tdt聚合酶。收集与最高浓度的目标tdt聚合酶相对应的级分并在单个样品中合并。用透析缓冲液(20mm tris-hcl,ph 6.8、200mm na cl、50mm mgoac、100mm[nh4]2so4)对合并的级分进行透析。随后在浓缩过滤器(amicon ultra-30,merk millipore)的帮助下浓缩透析液。将浓缩的酶以小等分试样分配,加入50%最终甘油,然后将这些等分试样在-20℃冷冻并长期储存。在sdspage凝胶中分析5μl不同纯化酶级分。
[0069]
在一些实施方案中,tdt变体可以可操作地连接至包括共价或非共价键的连接子部分;氨基酸标签(例如多聚氨基酸标签、多聚his标签、6his标签等);化合物(例如聚乙二醇);蛋白质-蛋白质结合对(例如,生物素-亲和素);亲和连接;捕获探针;或这些的任何组合。连接子部分可以与tdt变体分开或作为tdt变体的一部分。与本发明的tdt变体一起使用的示例性his标签是masshhhhhhssgsenlyfqtgssg-(seq id no:54))。标签-连接子部分不干扰tdt变体的核苷酸结合活性或催化活性。上述过程或等效过程产生可与多种试剂混合的分离的tdt变体,所述试剂为诸如盐、ph缓冲剂、载体化合物等,它们对于活性和/或保存是必需的或有用的。模板依赖性酶促合成
[0070]
许多聚合酶和3
’‑
可逆保护的dntp可用于在dna测序领域中开发的模板依赖性酶促合成,例如以下参考文献(通过引用并入本文中)公开了示例性聚合酶和3
’‑
可逆保护的dntp:ju等人,美国专利6664079、7345159、7635578、7713698;balasubramanian等人,美国专利7566537、7790869、8394586、9121062;smith等人,美国专利8852910;wu,thesis,columbia university,2008;guo等人,proc.natl.acad.sci.,105(27):9145-9150(2008);chen等人,美国专利9765309、10150954;ost等人,美国专利8623628等。模板依赖性酶促合成的步骤与实施无模板酶促合成的那些步骤相似,当然,除了前者采用不同类型的聚合酶并需要模板的存在。即,在将引物退火至合成链(用作模板)后,通过重复以下循环来合成合成链的反向互补链:(i)在存在3
’‑
o-经保护的三磷酸核苷的情况下,在延伸条件下使引物或具有游离3
’‑
羟基的延伸中间体与模板依赖性聚合酶反应,以产生3
’‑
o保护的延伸中间体;(ii)将延伸中间体去保护,以产生具有游离3
’‑
羟基的延伸中间体;以及(iii)重复步骤(i)和(ii)直到合成反向互补序列。碱基保护基团
[0071]
可以采用多种保护基团(或等效地,“碱基保护部分”)来减少或消除在多核苷酸链延伸过程中二级结构的形成。通常,去除碱基保护基团的条件与去除3
’‑
o-封闭基团的条件是正交的。具体地,当3
’‑
o-封闭基团的去除或去封闭条件为酸性时,则可选择碱基保护基团为碱不稳定的。在此类情况下,由于使用了酸不稳定的5
’‑
o-三苯甲基保护单体,在亚磷酰胺合成化学中开发出了许多碱不稳定的保护基团,例如beaucage和iyer,tetrahedron letters,48(12):2223-2311(1992)。特别地,用于亚磷酰胺化学的酰基和脒保护基团适用于本发明的实施方案(例如,beaucage和iyer(上文引用的)的表2和表3的保护基团)。在一些实施方案中,碱基保护基团是脒,如在beaucage和iyer(上文引用的)的表2中所描述的。
通常,碱基保护的3
’‑
o-封闭的三磷酸核苷单体可以通过文献中所描述的方法的常规修改来合成,如以下实例中所描述的。
[0072]
在一些实施方案中,碱基保护基团与三磷酸脱氧腺苷的6-氮、三磷酸脱氧鸟苷的2-氮和/或三磷酸脱氧胞苷的4-氮上。在一些实施方案中,碱基保护基团与所有指定的氮连接。在一些实施方案中,与三磷酸脱氧腺苷的6-氮连接的碱基保护基团选自:苯甲酰基、邻苯二甲酰基、苯氧基乙酰基和甲氧基乙酰基;与三磷酸脱氧鸟苷的2-氮连接的碱基保护基团选自:异丁酰基、异丁酰氧基乙烯、乙酰基、4-异丙基-苯氧基乙酰基、苯氧基乙酰基和甲氧基乙酰基;并且与三磷酸脱氧胞苷的4-氮连接的碱基保护基团选自:苯甲酰基、邻苯二甲酰基、乙酰基和异丁酰基。
[0073]
在一些实施方案中,与三磷酸脱氧腺苷的6-氮连接的保护基团是苯甲酰基;与三磷酸脱氧鸟苷的2-氮连接的碱基保护基团是异丁酰基或二甲基甲脒;并且与三磷酸脱氧胞苷的4-氮连接的碱基保护基团是乙酰基。
[0074]
在一些实施方案中,与三磷酸脱氧腺苷的6-氮连接的碱基保护基团是苯氧乙酰基;与三磷酸脱氧鸟苷的2-氮连接的碱基保护基团是4-异丙基-苯氧基乙酰基或二甲基甲脒;并且与三磷酸脱氧胞苷的4-氮连接的碱基保护基团是乙酰基。
[0075]
在一些实施方案中,碱基保护部分被去除(即产物被去保护),并且在同一反应中产物被从固体支持物上切割。例如,引发剂可以包括核糖尿苷,其可以通过用1m的koh或类似试剂(氨、氢氧化铵、naoh等)处理而被切割以释放多核苷酸产物,所述试剂同时去除碱不稳定的碱基保护部分。延长条件的其他修改
[0076]
除了提供具有碱基保护基团的3
’‑
o-封闭的dntp单体外,延长反应可以使用热稳定的无模板聚合酶在更高的温度下进行。例如,可以采用具有高于40℃活性的热稳定的无模板聚合酶;或者,在一些实施方案中,可以采用具有40-85℃范围内的活性的热稳定的无模板聚合酶;或者,在一些实施方案中,可以采用具有40-65℃范围内的活性的热稳定的无模板聚合酶。
[0077]
在一些实施例中,延长条件可以包括向延长反应混合物中添加抑制氢键结合或碱基堆积的溶剂。此类溶剂包括具有低介电常数的水混溶性溶剂(如二甲亚砜(dmso)、甲醇等)。同样,在一些实施方案中,延长条件可以包括提供离液剂,其包括但不限于正丁醇、乙醇、氯化胍、高氯酸锂、乙酸锂、氯化镁、苯酚、2-丙醇、十二烷基硫酸钠、硫脲、尿素等。在一些实施方案中,延长条件包括存在二级结构抑制量的dmso。在一些实施方案中,延长条件可以包括提供抑制二级结构形成的dna结合蛋白,其中此类蛋白包括但不限于单链结合蛋白、解旋酶、dna乙二醇酶等。使用无模板聚合酶在固体支持物上进行平行多核苷酸合成
[0078]
在一些实施方案中,通过提供具有离散的、非重叠的、可寻址位点的支持物来实施平行合成,在该位点合成单独的多核苷酸,并且提供了用于控制独立于其他位点的每个位点处的电化学条件的方式。在一些实施方案中,此类平行合成支持物是具有可寻址位点的规则图案的平面支持物,如位点的直线图案或位点的六边形图案。在一些实施方案中,平面支持物的每个位点与一个或多个电极相关联,其电学特性可以在独立于平面支持物的其他电极的可寻址区域中被控制。在一些实施方案中,此类平面支持物具有多个位点,其包括至
少256个位点、至少512个位点、至少1024个位点、至少5000个位点、至少10,000个位点、至少25,000个位点,或至少100,000个位点,以及多达10,000,000个位点。在一些实施方案中,此类平面支持物具有大于1000,或10,000,或25,000,或50,000,或100,000,或500,000的多个位点,以及最多1,000,000个位点或最多10,000,000个位点。在一些实施方案中,此类平面支持物的位点以规则阵列布置并且每个位点与与平面支持物集成的至少一个电极相关联。在一些实施方案中,进行合成和/或测序的离散位点各自具有以下范围内的面积:.25μm2至1000μm2、或1μm2至1000μm2、或10μm2至1000μm2、或100μm2至1000μm2。在一些实施方案中,在每个位点合成的多核苷酸的量为至少10-6
fmol、或至少10-3
fmol、或至少1fmol、或至少1pmol,或者在每个位点合成的多核苷酸的量范围为:10-6
fmol至1fmol、或10-3fmol至1fmol、或1fmol至1pmol、或10-6
pmol至10pmol、或10-6
pmol至1pmol。在一些实施方案中,在每个位点合成的多核苷酸的数量范围为1000个分子至106个分子,或1000个分子至109个分子,或1000个分子至10
12
个分子。上述阵列上的可寻址位点可以排列成包括区域的组(如上所述的,诸如区域1和区域2),以实施本发明的方法。
[0079]
在一些实施方案中,在每个反应位点处酶促合成的多核苷酸具有50至500个核苷酸范围内的长度;在其他实施方案中,此类多核苷酸具有50至1000个核苷酸范围内的长度。
[0080]
图1b示出了在可寻址的离散位点上平行合成多条多核苷酸的一实施方案的步骤,所述离散位点可用于特定光照明或用于电极激活。在一些实施方案中,阵列是可寻址电极阵列,其中可以控制各个电极以在阵列的任何给定工作电极和反电极之间产生预定电压差。提供阵列(120),使得每个位点(122)具有引发剂或具有经保护的3
’‑
羟基的延长片段(表示为暗盘)。为了启动合成循环,使用去保护方法对选定位点(对应于下一个单体为a的多核苷酸的位点)的引发剂或延长片段的3
’‑
羟基去保护(121)(表示为开放圆盘),该方法可以限于所选位点的位置。如下文更全面地描述的,在一些实施方案中,此类局部去保护可以通过局部光反应或通过使用位点特异性电极的电压差的局部变化来实现。向选择性去保护的位点添加包含3
’‑
o-经保护的datp(124)的试剂,并将无模板聚合酶(如tdt)递送到去保护的位点。如下文简要描述的,合成试剂可以以多种方式递送,如通过整个阵列上的简单整体流动、由喷墨装置递送到各个位点的液滴等。在连接反应进行到完成或达到适当程度的预定时间后,洗涤阵列,并且在选定位点的下一组多核苷酸(c是下一个单体的那些)使其3
’‑
羟基去保护。向选择性去保护位点添加包含3
’‑
o-经保护的dctp(128)的试剂,并将无模板聚合酶(如tdt)递送至去保护位点。对dgtp(130)和dttp(132)进行类似的步骤,直到循环完成。重复(134)循环直到完成多核苷酸。光诱导的去保护
[0081]
在一些实施方案中,平行合成可以采用利用光生酸的光诱导的去保护,以局部去保护,例如gao等人,美国专利6426184、7491680和7838466。有利地,寡核苷酸在流动池中合成,与当今用于通过合成测序(sbs)的那些流动池非常相似。sbs使用经过修饰的dntp,其包含阻止进一步聚合的终止子。因此,聚合酶只能将单个碱基添加到每个正在生长的dna或rna拷贝链中。测序反应同时在固体表面上散布开的大量不同模板分子上进行。在将四种dntp添加到模板后,终止子被去除。这种化学物质被称为“可逆终止剂”。最后,启动另外四个dntp添加循环。由于单个碱基以统一的方式添加到所有模板中,因此测序过程会产生一组统一长度的dna/rna序列读取。有利地,通过将dna/rna样品片段化成每个大约200个碱基
长的片段,将dna/rna样品制备成“测序文库”。将定制衔接子添加到每一端,并且文库流过固体表面(“流动池”),并且模板片段与该表面结合。在此之后,固相“桥式扩增”pcr过程(簇生成)在流动池表面上的紧密物理簇中创建每种模板的大约一百万个拷贝。电化学去保护
[0082]
可替代地或除了局部光化学产生ph变化之外,电极处的受控电势变化可被用于直接或间接切割电化学不稳定基团。例如,可以通过采用电活性化合物,使用电压变化间接切割ph敏感保护基团,该电活性化合物的氧化还原状态可以通过控制局部电压差来改变,从而释放影响局部ph的电子,例如southern,美国专利5667667;egeland和southern,美国专利公开us2004/0238369;egeland等人,nucleic acids research,33(14):e125(2005);maurer等人,美国专利9267213;fomina等人,labchip,16:2236-2244(2016)。
[0083]
如图7a中所示的,在一些实施方案中,电极阵列上的每个位点可以被配置为如levine等人(上文引用的)所述的稳压器和/或恒流器电化学电池(7001)或metrohm应用注释ec08。在恒电势模式下,如图7a中所示的稳压器/恒流器(pgstat)电路(7000)将准确控制反电极(ce)(7002)对工作电极(we)(7004)的电势,从而使工作电极(we)(7004)和参比电极(re)(7006)之间的电势差限定良好,并且对应于用户指定的值。在恒电流模式下,we(7004)和ce(7002)之间的电流受到控制。re(7006)和we(7004)之间的电势差以及ce(7002)和we(7004)之间流动的电流被连续监测。通过使用pgstat,用户指定的值(即施加的电势或电流)在测量期间的任何时候都可以通过使用负反馈机制进行精确控制。
[0084]
从图中可以看出,ce(7002)连接到被称为控制放大器(ca)(7008)的电子块的输出。控制放大器迫使电流流过电池。分别针对低电流和高电流,使用电流跟随器(低cf)(7010)或分流器(高cr)(7012)测量电流值。始终利用差异放大器(diffamp)(7016)测量re(7006)与s(7014)之间的电势差。根据仪器使用的模式(稳压的或横流的),相应地设置pstat/gstat开关(7018)。然后将信号馈入求和点( )(7020),该求和点与数模转换器(e

)(7022)设置的波形一起用作控制放大器的输入。
[0085]
反电极(也被称为辅助电极)是用于闭合电化学电池中的电流电路的电极。它通常由惰性材料(例如pt、au、石墨、玻璃碳)制成,并且其通常不参与电化学反应。因为电流在we(7004)与ce(7002)之间流动,所以ce的总表面积(电子的源/汇)通常大于we的面积,因此它不会成为电化学过程的动力学中的限制因素。
[0086]
参比电极是具有稳定且众所周知的电极电势的电极,并且它被用作电化学电池中用于电势控制和测量的参考点。参比电极电势的高稳定性通常是通过采用具有恒定(缓冲或饱和)浓度的每个氧化还原反应参与者的氧化还原系统来实现的。此外,流过参比电极的电流保持接近零(理想情况下为零),这是通过使用ce关闭池中的电流电路以及静电计上非常高的输入阻抗(》100gohm)来实现的。
[0087]
工作电极是电化学系统中发生目标反应的电极。常见的工作电极可以由惰性材料制成,如au、ag、pt、玻璃碳(gc)和hg滴和薄膜电极等。工作电极(7004)可以包括用于连接分子的涂层,如用于无模板酶促多核苷酸合成的引发剂。
[0088]
两个电极设置。在双电极电池设置中,ce(7002)和re(7006)在其中一个电极上短接,而we(7004)和s(7014)在相反电极上短接。测量整个电池的电势。这包括来自ce/电解质界面和电解质本身的贡献。因此,只要精确控制跨we(7004)电化学界面的界面电势并不重
要,并且整个电池的行为正在研究中,就可以使用双电极配置。
[0089]
三电极设置。三电极池设置是电化学中最常见的电化学电池设置。在这种情况下,电流在ce(7002)与we(7004)之间流动。控制we(7004)与ce(7002)之间的电势差,并测量re(7006)(最好保持在紧靠we(7004)附近)与s(7014)之间的电势差。由于we(7004)与s(7014)相连,并且we(7004)保持在伪地(固定、稳定的电势),通过控制ce(7002)的极化,re(7006)与we(7004)之间的电势差会一直受到控制。通常不会测量we(7004)与ce(7002)之间的电势。这是由控制放大器(7008)施加的电压,并且其受仪器的顺从电压限制。它被调整,以使得we(7004)与re(7006)之间的电势差将等于由用户指定的电势差。这种配置允许相对于re(7006)控制we(7004)处电化学界面间的电势。
[0090]
已经构建了包含在电路支持基板(尤其是cmos)中形成的多个可单独寻址电极的大型电极阵列,以用于基于亚磷酰胺的合成和传感器应用,例如,montgomery,美国专利6093302、6444111和6280595;gindilis,美国专利9339782;maurer等人,美国专利9267213;maurer等人,plosone,2006年12月,第1卷,e34;fomina等人,labchip,16:2236-2244(2016);kavusi等人,美国专利9075041;johnson等人,美国专利9874538和9910008;gordon等人,美国专利6251595;levine等人等。ieee j.solid state circuits,43:1859-1871(2008)等。这些参考文献为本发明的特定实施方案的设计提供了关于诸如阵列位置处的电极数量、尺寸、组成和配置等特征;用于电压和电流控制和测量的cmos电路;阵列制造和操作;在阵列位点连接或固定化学组分(诸如例如引发剂)的方法等的指导。
[0091]
特别感兴趣的是morimoto等人,anal.chem.80:905-914(2008);levine等人(上文引用的);和fomina等人(上文引用的)及它们的cmos技术实施中所述的,特别是如levine等人和fomina等人所述的电极配置。在本发明的一些实施方案中,提供的电极阵列包括在cmos基板中的多个可单独寻址的工作电极,其在操作上与参比电极以及反电极相关联,后者可以在板上或与cmos电极阵列分离。cmos电路被配置为使得工作电极与反电极之间的电压可以被调整,以建立和维持选定工作电极与参比电极之间的所期望电压差。可以在选定的工作电极处改变所期望的电压差以切割电化学不稳定的保护基团。酶促合成和电化学去保护的组合。
[0092]
在一方面,本发明还提供了解决方案,其用于将通过降低ph来诱导特别控制的去保护的不同方式与酶促dna合成技术相结合。酶促合成与水性介质完全兼容。大多数化学、电化学或光化学,通过物理驱动实现ph值变化,仅在水性介质中起作用。本发明通过开发用于ph变化的适当化学物质以及用于酶促合成的适当缓冲剂、试剂和保护基团,来提供使这两个方面兼容的技术解决方案。因此,在一个实施方案中,可控化学与dna合成以及与流动池芯片表面化学兼容。
[0093]
电化学或诱导的去保护,即在与反应位点相邻的电极处使用电压变化,已被用于在基于亚磷酰胺的合成中去除dmt保护基团,例如egeland等人,nucleic acids research,33(14):e125(2005);montgomery(上文引用的)。本发明部分是发现和认识到平行的无模板酶促多核苷酸合成可以使用对酶促合成特异性的保护基的电化学去保护来完成。具体地,3
’‑
o-叠氮甲基保护基团可以通过直接还原来切割,并且3
’‑
o-氨基保护基团可以通过电活性中间化合物的方式,通过调节局部ph值而被间接切割。例如,在后者的情况下,在一些实施方案中,典型的去保护溶液是用hcl滴定至ph 5.0-5.5的700mm亚硝酸钠(nano2)和1m乙
酸钠。可以通过将局部ph从ph 7降低到ph 5来实现阵列反应位点处的3
’‑
o-nh2基团的局部去保护。
[0094]
用于实施本发明方法的设备。在图7b中以图解法示出了用于实施本发明方法的设备的组件。流动池和电极阵列(700)包括反应位点阵列,每个反应位点可以包括微孔、涂层以增强引发剂或其他组分的连接,并且每个反应位点在操作上与一个或多个电极相关联。在一些实施方案中,电极阵列与cmos控制和测量电路集成为单个芯片。流动池可以有多种设计来控制电极阵列上试剂的路径和流速。在一些实施方案中,流动池是微流体装置。也就是说,它可以用微机械加工技术或精密模制制造,以包括其它的流体通道、腔室等。在一方面,流动池包括入口(702)、出口(703)和用于限定电极阵列(707)上的试剂流动路径的流动室(705)。在离开流动池和传感器阵列(700)之后,将试剂丢弃到废物容器(706)中。根据该实施方案,该设备的功能是以预定的顺序、预定的持续时间、预定的流速将不同的试剂递送到流动池和电极阵列(700),并且任选地以测量电极位点处的物理和/或化学参数,其提供有关其中发生的反应状态的信息。为此,流体控制器(718)通过常规仪器控制软件(例如lab view(national instruments,austin,tex.)),通过线路(720和722)控制多种试剂(714)(例如,在适当的缓冲液和去保护溶液中的3
’‑
o-经保护的dntp和/或无模板聚合酶)和阀门(例如,712和716)的操作的驱动力。
[0095]
可以通过泵、气压或其他常规方法驱动试剂通过流体路径、阀和流动池。在一些实施方案中,单个参比电极(708)可以被放置在流动池和传感器阵列(700)的上游。在其他实施方案中,参比电极可以被放置在流动室内。在一些实施方案中,单一流体或试剂在整个多步反应中与参比电极(708)接触。这可以通过图7b中所示的配置来实现,其中试剂(714)通过通道(709)被引导至流动池(705)。当那些试剂流动时,阀(712)关闭,从而防止任何洗涤溶液流入通道(709)中。尽管洗涤溶液的流动停止,但在参比电极、通道(709)与电极阵列(707)之间仍然存在不间断的流体和电连通。当流过通道(709)时,最多试剂(714)扩散到通道(711)中,但是参比电极(708)与通道(709)和(711)之间的连接之间的距离被选择为使得很少量或没有量的在公用通道(709)中流动的试剂到达参比电极(708)。尽管图7b和其他图将电极(例如参比电极708)示出为与流体通道(例如,711)同心的圆柱体,但是参比电极如(708)可以具有多种不同的形状。例如,它可以是插入(711)内腔中的导线。在一方面,参比电极(708)构成通道(712)的一部分,其由诸如不锈钢、金等的导电材料制成。在一些实施方案中,材料对于与其接触的试剂是惰性的。在一实施方案中,参比电极(708)是由形成通道(712)的一部分的导电材料制成的管。
[0096]
参比电压的电势取决于电极与电极接触的溶液之间的界面。例如,不同三磷酸核苷的溶液可能会导致参比电压发生变化,从而导致工作电极处发生非期望的变化。如图7b中所示的,对于使用频繁洗涤步骤的多步反应,可选择洗涤溶液(710)作为与参比电极(708)连续接触的试剂。
[0097]
该实施方案的其他组件包括阵列控制器(724),其用于提供偏置电压(如以控制工作电极和反电极(721)之间的电势,其可以与阵列(707)集成或不集成)以及至电极阵列(如果这些组件没有集成到电极阵列中)的定时和控制信号,以及用于收集和/或处理输出信号。来自流动池和电极阵列(700)的信息以及仪器设置和控制可以通过用户界面(728)显示和进入。对于一些实施方案,例如核酸合成和/或测序,流动池和传感器阵列(700)的温度受
到控制,使得反应发生并且在已知的并且优选地预定的温度下进行测量。此类温度可以通过传统的温度控制装置来控制,如peltier装置等。在一方面,通过控制流过流动池的试剂的温度来方便地控制温度。设备的流动池和流体回路可以通过多种方法和材料制造。选择材料时要考虑的因素包括所需要的化学惰性程度、操作条件(例如温度等)、待递送的试剂量、是否需要参比电压、可制造性等。对于小规模流体递送,微流体制造技术非常适合制造本发明的流体回路,并且本领域普通技术人员容易获得对此类技术的指导,例如malloy,注塑成型塑料零件设计:简介(plastic part design for injection molding:an introduction)(hanser gardner publications,1994);herold等人,编辑,芯片实验室技术(第1卷):制造和微流体(lab-on-a-chip technology(vol.1):fabrication and microfluidics)(caister academic press,2009)等。对于中等规模和更大规模的流体递送,可以使用常规机械加工技术来制造可以组装到本发明的流动池或流体回路中的部件。在一方面,诸如聚碳酸酯、聚甲基甲基丙烯酸酯等的塑料可以被用于制造本发明的流动池和流体回路。
[0098]
图7c以图表法示出了用于实施本发明方法的替代设备,其中使用喷墨液滴发生器将一些试剂递送至反应位点。上述的许多设计特征都适用于本实施方案。如上所述,流动池和电极阵列(750)包括反应位点阵列,每个反应位点可以包括微孔、涂层以增强引发剂或其他组分的连接,并且每个反应位点在操作上与一个或多个电极相关联。如上所述,在一些实施方案中,电极阵列可以与cmos控制和测量电路集成为单个芯片。流动池可以有多种设计来控制电极阵列上试剂的路径和流速;然而,与图7b的设备不同,此处电极阵列的反应位点必须是可接近的,以便通过打印头(780)递送含有试剂的液滴。在一方面,流动池包括入口(752)、出口(753)和流动室(755),用于限定电极阵列(757)上的试剂(不通过打印头(780)递送)的流动路径。在离开流动池和传感器阵列(750)之后,将试剂丢弃到废物容器(756)中。根据该实施方案,设备的功能是经由入口(752)或打印头(780)以预定的顺序、以预定的持续时间、以预定的流速将不同的试剂递送到流动池和电极阵列(750),并且任选地以测量电极或反应位点处的物理和/或化学参数,这些参数提供关于其中发生的反应状态的信息。为此,流体控制器(758)通过线路(771a、7711b和771c)控制阀(760a和760b)和打印头(780)。阀(760a)和(760b)控制洗涤溶液(761)和去保护溶液(762)(如果需要)到流动池(757)的递送。用于设计和控制喷墨递送系统的指南为本领域技术人员所熟知,并且可以在美国专利公开us2003/0170698和美国专利6306599;6323043;7276336;7534561及类似参考文献中找到。
[0099]
在一些实施方案中,单个参比电极(708)可以被放置在流动池和传感器阵列(700)的上游。在其他实施方案中,参比电极可以被放置在流动室内。在一些实施方案中,可以采用单个反电极(763),或者在其他实施方案中,可以采用多于一个反电极,并且如上所述,此类反电极可以集成或不集成在相同的电子基板上作为阵列(757)的工作电极。如虚线(771、772和773)所示的,设备通过用户界面(792)控制,其继而通过流体/喷墨控制器(765)和阵列控制器(790)致动和监测合成步骤。具体地,物理参数(如温度)以及用于电极选择、电压控制、传感器读出等的电路,通过阵列控制器(790)处理;试剂(796)、液滴速率、头部移动等的选择由流体/喷墨控制器(765)控制。在一些实施方案中,在3
’‑
o-经保护的dntp单体和/或无模板聚合酶的液滴递送期间,由于流动池(755)可能被排空以防
止接收不同单体的相邻反应位点之间的交叉污染,反应位点与参比电极(781)之间的电解质连接被破坏。在一些实施方案中,可以通过提供被疏水区域包围的反应位点来避免此类交叉污染,使得当诸如洗涤溶液或去保护溶液的电解质从流动室退去时,每个位点都被分离的液滴包围,例如,如brennan,美国专利5474796、6921636等中所述的。具体地,当流动室充满去保护溶液时,连续电解质路径恢复到参比电极(781)和可以在阵列(757)上或阵列外的反电极。
[0100]
在一些实施方式中,选择工作电极与参比电极之间的电压差的值以避免不希望的氧化还原反应(如水的电解),从而不会在装置的流体中形成气泡。在一些实施方案中,在本发明中引起电化学反应的预定电压差为约1.5伏或更低。
[0101]
在一些实施方案中,本发明的方法,如由图7b和图7c的设备所实施的,可以包括以下步骤:(a)提供反应位点的空间可寻址阵列,其中每个反应位点在操作上与至少一个工作电极相关联并且在其上布置有通过它们的5’端连接且具有3
’‑
o-电化学不稳定的保护基团的引发剂;(b)对每种核苷酸进行包括以下步骤的循环:(i)通过在预定地址处的每个电极与参比电极之间产生电压差以使电化学不稳定的保护基团被切割,从而在预定地址的电极处的引发剂或延长片段上产生游离3
’‑
羟基,来在预定地址处的电极处对引发剂或延长片段去保护,和(ii)在延长条件下使预定地址处的电极与3
’‑
o-电化学不稳定的保护的三磷酸核苷以及模板非依赖性dna聚合酶接触,以通过掺入3
’‑
电化学不稳定的保护的三磷酸核苷来延长预定地址处的引发剂或延长片段,以形成3
’‑
o-电化学不稳定的保护的延长片段;以及(c)重复步骤(b),直到预定序列的多核苷酸的阵列完成。反应位点通常是底物上的离散区域,其中合成了具有预定序列的单一种类的多核苷酸。反应位点在空间上是可寻址的,因为它们在基板或表面上具有明确的位置,其通常形成规则的图案,如直线图案、六边形图案等。每个反应位点在操作上与至少一个工作电极相关联,因为反应位点处的电势或电压可以由其相关联的一个或多个工作电极控制或确定。通常,反应位点和工作电极在空间上对齐。也就是说,如果电极是嵌入基板表面上的圆盘或其他平面结构,则反应位点占据的面积对应于电极表面的面积。这有利于确保在反应位点处发生的反应中的均匀电效应。在一些实施方案中,反应位点可以包括工作电极表面上的基板或膜,例如,此类基板或膜可以被用于促进组分(如引发剂)的连接和/或保留。此类基板和电极可以被集成在半导体装置(如cmos装置)中。关于步骤(b),对每种核苷酸进行所示的步骤循环并不旨在限于四种核苷酸a、c、g和t。在一些实施方案中,每种核苷酸意指a、c、g和t的子集。在其他实施方案中,每种核苷酸意指可以包括非天然核苷酸或可用于编码多核苷酸中的信息的其他核苷酸类似物的扩展集。在本发明的方法中可以采用多种模板非依赖性dna聚合酶;具体地,采用末端脱氧核苷酸转移酶的变体,例如,如ybert等人,国际专利公开wo/2019/030149等中所述。步骤(b)的循环可以包括进一步的步骤,如洗涤步骤。延长条件包括缓冲液、盐、温度、辅因子等,它们对于所采用的无模板聚合酶的掺入活性是必需的或有用的。
[0102]
在一些实施方案中,电化学不稳定的保护基团可以是ph敏感的,并且ph可以通过工作电极与参比电极之间的电压差来调节,该电压激活电活性剂继而改变ph,例如southern,美国专利5667667;mauer等人,美国专利9267213等,其在此通过引用并入本文中。示例性的电活性剂包括对苯二酚、苯醌、醌及其衍生物。
[0103]
在一些实施方案中,电化学不稳定的保护基团本身可以是氧化还原敏感的,使得
工作电极与参比电极之间的电压差将电化学不稳定的保护基团转换为还原态,从而切割所述电化学不稳定的保护基团。具体地,在一些实施方案中,氧化还原敏感的3
’‑
o-保护基团是叠氮甲基。用于实施本发明方法的试剂盒
[0104]
本发明包括用于实施本发明方法的多种试剂盒。在一方面,本发明的试剂盒在适合进行本文所述的无模板酶促多核苷酸合成的制剂中包含tdt变体。此类试剂盒还可以包括合成缓冲液,其为优化无模板添加或将3
’‑
o-经保护的dntp掺入生长链提供反应条件。在一些实施方案中,本发明的试剂盒还包括3
’‑
o-可逆保护的dntp。在此类实施方案中,3
’‑
o-可逆保护的dntp可以包含3
’‑
o-氨基-dntp或3
’‑
o-叠氮甲基-dntp。在其他实施方案中,试剂盒可以单独或与上述项目一起包括以下项目中的一项或多项:(i)用于进行如本文所述的去保护步骤的去保护试剂,(ii)具有连接其上的引发剂的固体支持物,(iii)用于从固体支持物上释放完整多核苷酸的切割试剂,(iv)用于在酶促添加或连接步骤结束时去除未反应的3
’‑
o-经保护的dntp的洗涤试剂或缓冲液,(v)合成后处理试剂,如纯化柱、脱盐试剂、洗脱试剂等,(vi)用于退火至在全长多核苷酸产物的3’端上合成的通用引物结合位点的引物,(vii)用于延伸退火至多核苷酸产物的引物结合位点的引物的模板依赖性聚合酶,(viii)消化从多核苷酸产物和/或失效序列解链的片段的一种或多种单链核酸酶。
[0105]
关于上述项目(ii)和(iii),某些引发剂和切割试剂一起使用。例如,包含肌苷可切割核苷酸的引发剂可以与核酸内切酶v切割试剂一起提供;包含硝基苄基光可切割连接子的引发剂可以与用于切割光可切割连接子的合适光源一起提供;包含尿嘧啶的引发剂可以与尿嘧啶dna糖基化酶切割试剂一起提供等。定义
[0106]
除非本文另有明确定义,否则本文中所使用的核酸化学、生物化学、遗传学和分子生物学的术语和符号遵循该领域的标准论文和文本的那些,例如kornberg和baker,dna replication,第2版(w.h.freeman,纽约,1992);lehninger,biochemistry,第2版(worth publishers,纽约,1975);strachan和read,human molecular genetics,第2版(wiley-liss,纽约,1999)。
[0107]
关于两个或更多个不同tdt中的氨基酸位置的“功能等效”意指(i)各个位置处的氨基酸在tdt的活性中发挥相同的功能作用,和(ii)氨基酸出现在各个tdt的氨基酸序列中的同源氨基酸位置处。基于序列比对和/或分子建模,可能识别两个或更多个不同tdt的氨基酸序列中位置等效或同源的氨基酸残基。在一些实施方案中,功能等效的氨基酸位置属于在进化相关物种(例如属、科等)的tdt的氨基酸序列中保守的低效基序。此类保守的低效基序的实例描述于motea等人,biochim.biophys.acta.1804(5):1151-1166(2010);delarue等人,embo j.,21:427-439(2002)和类似参考文献中。
[0108]“试剂盒”是指任何递送系统(如包装),其用于递送材料或试剂以进行由本发明的系统或设备实施的方法。在一些实施方案中,消耗材料或试剂在本文被称为“试剂盒”的包装中递送给本发明的系统或设备的用户。在本发明的系统和设备的上下文中,此类递送系统通常包括允许储存、运输或递送材料的包装方法和材料,如可能具有容易损坏或污染的组件(如合成支持物)的合成板。例如,试剂盒可以包括包含合成板和/或支撑材料的一个或多个外壳(例如,盒子)。此类内容物可以一起或单独地递送给预期的接收者。例如,第一容
器可以包含合成板,其中每个孔中的合成支持物都真空包裹在保护性塑料材料中,而第二或更多容器包含3
’‑
o-可逆封闭的dntp以及无模板聚合酶和缓冲液。
[0109]
可互换使用的“突变体”或“变体”是指来源于本文所述的天然或参考tdt多肽的多肽,并且包含在一个或多个位置处的修饰或改变,即取代、插入和/或缺失。变体可以通过本领域熟知的各种技术获得。特别地,用于改变编码野生型蛋白质的dna序列的技术的实例包括但不限于定点诱变、随机诱变、序列改组和合成寡核苷酸构建。诱变活性在于删除、插入或取代蛋白质序列中的一个或几个氨基酸,或者在本发明的聚合酶的情况下删除、插入或取代一个或几个氨基酸。以下术语被用于指定取代:l238a表示参考或野生型序列的第238位氨基酸残基(亮氨酸,l)改变为丙氨酸(a)。a132v/i/m表示亲本序列第132位的氨基酸残基(丙氨酸,a)被下列氨基酸之一取代:缬氨酸(v)、异亮氨酸(i)或甲硫氨酸(m)。取代可以是保守性或非保守性取代。保守性取代的实例属于以下组;碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺、天冬酰胺和苏氨酸)、疏水性氨基酸(甲硫氨酸、亮氨酸、异亮氨酸、半胱氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸和丝氨酸)。
[0110]“多核苷酸”或“寡核苷酸”可互换使用,并且每个意指核苷酸单体或其类似物的线性聚合物。组成多核苷酸和寡核苷酸的单体能够通过单体与单体相互作用的规则模式的方式与天然多核苷酸特异性结合,如watson-crick类型的碱基配对、碱基堆叠、hoogsteen或反向hoogsteen类型的碱基配对等。此类单体及其核苷间连接可以是天然存在的或可以是其类似物,例如天然存在的或非天然存在的类似物。非天然存在的类似物可以包括pna、硫代磷酸酯核苷间连接、含有允许连接标记(如荧光团)或半抗原的连接基团的碱基等。每当寡核苷酸或多核苷酸的使用需要酶促加工(诸如通过聚合酶延伸、通过连接酶连接等时),普通技术人员将理解在那些情况下寡核苷酸或多核苷酸将不包含核苷间连接的某些类似物、糖部分或任何或某些位置处的碱基。多核苷酸的大小范围通常从几个单体单元开始(例如5-40个,此时它们通常被称为“寡核苷酸”)至几千个单体单元。每当多核苷酸或寡核苷酸通过字母序列(大写或小写,如“atgcctg”)表示时,应理解核苷酸从左到右按5
’→3’
顺序排列,并且“a”表示脱氧腺苷,“c”表示脱氧胞苷,“g”表示脱氧鸟苷,并且“t”表示胸苷,“i”表示脱氧肌苷,“u”表示尿苷,除非另有指示或从上下文中显而易见。除非另有说明,否则术语和原子编号约定将遵循strachan和read,human molecular genetics 2(wiley-liss,纽约,1999)中所公开的那些。通常多核苷酸包含通过磷酸二酯键连接的四种天然核苷(例如对于dna的脱氧腺苷、脱氧胞苷、脱氧鸟苷、脱氧胸苷,或对于rna的它们的核糖对应物);然而,它们也可以包含非天然核苷酸类似物,例如包括经修饰的碱基、糖或核苷间连接。本领域技术人员清楚,酶对活性具有特定的寡核苷酸或多核苷酸底物要求,例如单链dna、rna/dna双链体等,则为寡核苷酸或多核苷酸底物选择合适的组成完全在普通技术人员的知识范围内,尤其是在论文(如sambrook等人,molecular cloning,第2版(冷泉港实验室,纽约,1989))和类似参考资料的指导下。同样,寡核苷酸和多核苷酸可以指单链形式或双链形式(即寡核苷酸或多核苷酸及其相应互补物的双链体)。普通技术人员从术语使用的上下文中将清楚,旨在哪种形式或哪两种形式。
[0111]“引物”意指寡核苷酸,无论是天然的还是合成的,其在与多核苷酸模板形成双链体后,能够充当核酸合成的起始点并从其3'端沿模板延伸,使得形成延伸的双链体。引物的
延伸通常利用核酸聚合酶(如dna或rna聚合酶)进行。延伸过程中添加的核苷酸序列由模板多核苷酸的序列决定。通常引物由dna聚合酶延伸。引物的长度通常在14至40个核苷酸的范围内,或在18至36个核苷酸的范围内。引物被用于多种核酸扩增反应,例如,使用单一引物的线性扩增反应,或采用两种或更多种引物的聚合酶链式反应。选择用于特定应用的引物长度和序列的指导对于本领域普通技术人员来说是众所周知的,如通过引用并入本文中的以下参考文献所证明的那样:dieffenbach,编辑,pcr引物:实验室手册(pcr primer:a laboratory manual),第2版(冷泉港出版社,纽约,2003)。
[0112]“序列同一性”是指两条序列(如两条多肽序列或两条多核苷酸序列)之间的匹配(例如,相同的氨基酸残基)的数量(或分数,通常表示为百分比)。序列同一性是通过在比对时比较序列来确定的,以使重叠和同一性最大化,同时使序列间隙最小化。具体地,序列同一性可以使用许多数学全局或局部比对算法中的任一种来确定,这取决于两条序列的长度。相似长度的序列优选使用全局比对算法(例如,needleman和wunsch算法;needleman和wunsch,j.mol.biol.,48:443-453(1970))比对,其在整个长度上最佳地比对序列,而具有显著不同长度的序列优选使用局部比对算法(例如,smith和waterman算法(smith和waterman,j.mol.biol.,147:195-197(1981))或altschul算法(altschul等人,acids research,25(17):3389-3402(1997);altschul等人,febs j.,272:5101-5109(2005))比对。用于确定氨基酸序列同一性百分比目的的比对可以通过本领域技术范围内的多种方式实现,例如,使用互联网网站上可用的公共可用计算机软件,如http://blast.ncbi.nlm.nih.gov/或ttp://www.ebi.ac.uk/tools/emboss/。本领域技术人员可以确定用于测量比对的适当参数,其包括在被比较的序列的全长上实现最大比对所期望的任何算法。出于本文的目的,氨基酸序列同一性%值是指使用成对序列比对程序emboss needle生成的值,该程序使用needleman-wunsch算法产生两条序列的最佳全局比对,其中所有搜索参数均设置为默认值,即评分矩阵=blosum62,缺口开放=10,缺口延伸=0.5,末端缺口罚分=假,末端缺口开放=10和末端缺口延伸=0.5。
[0113]“取代”意指一个氨基酸残基被另一个氨基酸残基代替。优选地,术语“取代”是指用选自以下的另一氨基酸代替一个氨基酸残基:天然存在的标准20种氨基酸残基、稀有天然存在的氨基酸残基(例如羟脯氨酸、羟赖氨酸、别羟基赖氨酸、6-n-甲基赖氨酸、n-乙基甘氨酸、n-甲基甘氨酸、n-乙基天冬酰胺、别异亮氨酸、n-甲基异亮氨酸、n-甲基缬氨酸、焦谷氨酰胺、氨基丁酸、鸟氨酸、正亮氨酸、正缬氨酸)和非天然存在的氨基酸残基,通常是合成的(例如环己基丙氨酸)。优选地,术语“取代”是指氨基酸残基被选自天然存在的标准20种氨基酸残基的另一氨基酸残基代替。符号“ ”表示取代的组合。根据以下命名法,氨基酸在本文中通过它们的单字母或三字母代码表示:a:丙氨酸(ala);c:半胱氨酸(cys);d:天冬氨酸(asp);e:谷氨酸(glu);f:苯丙氨酸(phe);g:甘氨酸(gly);h:组氨酸(his);i:异亮氨酸(ile);k:赖氨酸(lys);l:亮氨酸(leu);m:甲硫氨酸(met);n:天冬酰胺(asn);p:脯氨酸(pro);q:谷氨酰胺(gln);r:精氨酸(arg);s:丝氨酸(ser);t:苏氨酸(thr);v:缬氨酸(val);w:色氨酸(trp)和y:酪氨酸(tyr)。在本文件中,以下术语被用于指定取代:l238a表示在亲本序列的第238位的氨基酸残基(亮氨酸,l)被改变为丙氨酸(a)。a132v/i/m表示在亲本序列第132位的氨基酸残基(丙氨酸,a)被下列氨基酸之一取代:缬氨酸(v)、异亮氨酸(i)或甲硫氨酸(m)。取代可以是保守性或非保守性取代。保守性取代的实例属于以下组:碱
性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺、天冬酰胺和苏氨酸)、疏水性氨基酸(甲硫氨酸、亮氨酸、异亮氨酸、半胱氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸和丝氨酸)。
[0114]
本公开不旨在限制于所阐述的特定形式的范围,而是旨在涵盖本文描述的变化的可替代物、修改和等同物。此外,本公开的范围完全涵盖鉴于本公开对于本领域技术人员而言可能变得显而易见的其他变化。本发明的范围仅受所附权利要求的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献