一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于多核苷酸无模板酶学合成的嵌合末端脱氧核苷酸转移酶的制作方法

2022-07-24 01:00:47 来源:中国专利 TAG:

用于多核苷酸无模板酶学合成的嵌合末端脱氧核苷酸转移酶


背景技术:

1.使用大长度范围的预定序列的高度纯化的廉价多核苷酸已经成为包括基因组和诊断测序、多重核酸扩增、治疗性抗体开发、合成生物学、基于核酸的治疗剂、dna折纸、基于dna的数据存储等的技术的核心。最近,通过使用无模板聚合酶的基于酶的方法,例如末端脱氧核苷酸转移酶(tdt),补充或替代基于化学的合成方法引发了人们的兴趣,因为这种酶的效率已被证实并且具有温和的无毒反应条件的益处,例如ybert等人的国际专利公开wo2015/159023;hiatt等人的美国专利5763594;jensen等人,biochemistry,57:1821-1832(2018)。大多数基于酶的合成方法需要使用可逆封闭的三磷酸核苷,以便在多核苷酸产物中获得所需的序列。但是,与未修饰的三磷酸核苷相比,天然tdt并入这种修饰的三磷酸核苷的效率降低。因此,大量的工作已经致力于开发对于修饰的三磷酸核苷具有更好的并入效率以及其它性能特征的新的tdt变体,例如,在生长链的不同3
’‑
序列之间降低的并入变异性,改进的可制造性等,例如champion等的美国专利公开us2019/0211315;ybert等的国际专利公开wo2017/216472等。
2.鉴于上述情况,如果新的无模板聚合酶(例如新的tdt变体)以及使用方法可用于可逆性封闭的三磷酸核苷的改进的稳定性和并入,则将为基于酶学的无模板酶多核苷酸合成的领域带来进步。
3.发明概述
4.本发明涉及用于多核苷酸的无模板酶学合成的方法和组合物。本发明包括脱氧核苷酸转移酶(tdt)变体及其组合物,所述tdt变体是包含源自不同物种的氨基酸序列并显示出一种或多种改进的tdt变体的嵌合体,一种或多种改进包括将可逆性封闭的三磷酸核苷并入多核苷酸中的改进的效率,改进的稳定性,改进的可制造性,或降低的序列特异性并入速率的变化。本发明还包括使用这种嵌合tdt变体合成预定序列的多核苷酸的方法和试剂盒。
5.更具体地,本发明涉及嵌合末端脱氧核苷酸转移酶(tdt)变体,其包含与由下式定义的氨基酸序列具有至少80%同一性的氨基酸序列:
6.b
1-b
2-b37.其中:
8.b1是不具有brct样区域的第一物种tdt的氨基酸区段,b1从第一物种tdt的n末端延伸至第一物种tdt的vsc基序(含vsc基序)与第一物种tdt的kmt基序(含kmt基序)之间的氨基酸位置,其中b1包含在其fmr基序中的蛋氨酸或功能等同残基的取代,当b1包含ggfrr基序时,b1包含在其ggfrr基序中的第二精氨酸或功能等同残基的取代,以及当b1包括vsc基序时,b1包含在其vsc基序中的缬氨酸或丝氨酸或半胱氨酸或功能等同残基的一个或多个取代;
9.b2是第二物种tdt的氨基酸区段,b2从b1的c末端延伸至第二物种tdt的c末端,或者当b3包含一个或多个氨基酸时延伸至b3的n末端,其中当b2包含vsc基序时,b2在其vsc基序中分别包含缬氨酸或丝氨酸或半胱氨酸或功能等同残基的一个或多个取代,当b2包括
ggfrr基序时,b2在其ggfrr基序中包含第二精氨酸或功能等同残基的取代,当b2包括tgsr基序时,b2在其tgsr基序中包含精氨酸或功能等同残基的取代,以及当b2包括fer基序时,b2在其fer基序中包含谷氨酸或功能等同残基的取代;以及
10.b3是第三物种tdt的氨基酸区段,b3包含0至70个氨基酸并且从第三物种tdt的c末端延伸至b2的c末端氨基酸,其中当b3包括tgsr基序时,b3在其tgsr基序中包含精氨酸或功能等同残基的取代,并且当b3包括fer基序时,b3在其fer基序中包含谷氨酸或功能等同残基的取代;
11.并且其中所述嵌合tdt变体(i)能够在没有模板的情况下合成核酸片段,并且(ii)能够将3
’‑
o-封闭的三磷酸核苷并入到核酸片段上;
12.并且其中b1、b2和b3被选择为使得所述嵌合tdt变体具有350至410个氨基酸。
13.本发明还涉及嵌合末端脱氧核苷酸转移酶(tdt)变体,其包含与由下式定义的氨基酸序列具有至少80%同一性的氨基酸序列:
14.j
1-j
2-j315.其中:
16.j1是不具有brct样区域的小鼠tdt的氨基酸区段,j1从小鼠tdt的n末端延伸至vsc基序(含vsc基序)和kmt基序(含kmt基序)之间的氨基酸位置,其中j1包含fmr基序中蛋氨酸或功能等同残基的取代,当j1包含ggfrr基序时,j1包含在其ggfrr基序中第二精氨酸或功能等同残基的取代,以及当j1包括vsc基序时,j1包含在其vsc基序中的缬氨酸或丝氨酸或半胱氨酸或功能等同残基的一个或多个取代;
17.j2是非小鼠tdt的氨基酸区段,j2从位于vsc基序和kmt基序之间的氨基酸位置延伸至tgsr基序的氨基酸位置,其中当j2包含ggfrr基序时,所述氨基酸区段包含其ggfrr基序中第二精氨酸或功能等同残基的取代,并且当j2包括vsc基序时,j2包含在其vsc基序中缬氨酸或丝氨酸或半胱氨酸或功能等同残基的一个或多个取代;和
18.j3是小鼠tdt的氨基酸区段,j3从tgsr基序的氨基酸位置延伸至小鼠tdt的c末端氨基酸,其中当j3包含tgsr基序时,j3包含其tgsr基序中的精氨酸或功能等同残基的取代,并且当j3包含fer基序时,j3包含其fer基序中的谷氨酸或功能等同残基的取代;
19.并且其中所述嵌合tdt变体(i)能够在没有模板的情况下合成核酸片段,并且(ii)能够将3
’‑
o-封闭的三磷酸核苷并入到核酸片段上;
20.并且其中j1、j2和j3被选择为使得嵌合tdt变体具有350至410个氨基酸。
21.在一些实施方案中,本发明的嵌合tdt变体包含三个连续区段:没有brct样片段的n末端区段,内部区段和c末端区段,其中n末端区段和c末端区段均来自第一物种的tdt,内部区段来自第二物种的tdt。在一些实施方案中,n末端区段和内部区段之间的边界在vsc基序处,并且内部区段和c末端区段之间的边界在tgsr基序处。在其它实施方案中,n末端区段和内部区段之间的边界在kmt基序处,并且内部区段和c末端区段之间的边界在tgsr基序处。在其它实施方案中,n末端区段和内部区段之间的边界在vsc基序处,并且内部区段和c末端区段之间的边界在kmt基序处。如本文所用,区段之间的边界的发生在指定基序处意味着该边界可以位于基序中,或在n端方向上距基序的n末端氨基酸1-15个氨基酸,或在c端方向上距基序的c末端氨基酸1-15个氨基酸。在一些实施方案中,这样的边界位置可以是在n端方向上距基序的n末端氨基酸1-10个氨基酸,或在c端方向上距基序的c末端氨基酸1-10
个氨基酸。在一些实施方案中,这样的边界位置可以是在n端方向上距基序的n末端氨基酸1-5个氨基酸,或在c端方向上距基序的c末端氨基酸1-5个氨基酸。在一些实施方案中,上述嵌合tdt变体的n末端区段和c末端区段均来自小鼠tdt变体。在一些实施方案中,这样的小鼠区段进行一个或多个突变,或多个突变,如表2中所述。
22.在一些实施方案中,本发明包括如下所述的分离的嵌合tdt变体。
23.在一个方面,本发明涉及使用本发明的嵌合tdt变体合成多核苷酸的方法,所述方法包括以下步骤:(a)提供具有自由3
’‑
羟基的引发物;和(b)重复以下循环:(i)在延伸条件下,使引发物或具有自由3
’‑
o-羟基的延伸片段与3
’‑
o-封闭的三磷酸核苷和嵌合tdt变体接触,使得通过并入3
’‑
o-封闭的(和任选的碱基保护的)三磷酸核苷来延伸所述引发物或延伸片段,以形成3
’‑
o-封闭的延伸片段,以及(ii)解封闭所述延伸片段,以形成具有自由3
’‑
羟基的延伸片段,直到合成所述多核苷酸。
24.本发明还涉及用于进行核苷酸并入反应的试剂盒,其包含:a)权利要求1-20中任一项的嵌合tdt变体,b)一种或多种核苷酸,优选一种或多种3
’‑
o-封闭的三磷酸核苷,和c)任选地至少一种核酸引物。
25.附图简要说明
26.图1图示了使用本发明的tdt变体的无模板酶学核酸合成方法的步骤。
27.图2图示了说明了本发明的嵌合tdt变体的结构。
28.图3a-3b的数据显示在利用tdt变体m27、m57和m59的合成期间在不同的三聚体序列(或“密码子”)处发生的缺失的百分比。
29.发明详细描述
30.本发明的细节已经通过附图中的示例示出并将被详细描述,但是本发明可以进行各种修改和替换形式。应当理解,本发明不限于所描述的特定实施方案。本技术意图覆盖落入本发明的精神和范围内的所有修改、等同方案和替代方案。本发明的各方面的指导可在许多现有的参考文献和本领域普通技术人员熟知的论文中找到。
31.本发明涉及嵌合tdt变体及其在使用3
’‑
o-可逆性封闭的三磷酸核苷合成给定(或等同于预定或用户确定)序列的多核苷酸中的用途。本发明的tdt变体是“嵌合的”,表示它们包含来自两种或更多种不同生物学物种(通常是不同哺乳动物物种)的多个氨基酸区段。在一些实施方案中,所述多个氨基酸区段是2个或3个,并且在一些实施方案中,所述区段可以选自2种不同的物种,并且在其它实施方案中,选自3种不同的物种。也就是说,在一些实施方案中,2或3个区段来自2种不同的物种。当3个片段来自2个不同的物种时,来自第一物种的两个区段位于所述嵌合tdt变体的n末端和c末端,并且第二物种tdt区段夹在它们之间。在每种情况下,选择的区段所来自的tdt变体在下文所示位置具有氨基酸取代,所述氨基酸取代增强嵌合tdt变体对3
’‑
o-可逆性封闭的三磷酸核苷的并入活性。在一些实施方案中,本发明的嵌合tdt变体中来自不同物种的区段之间的边界位置和氨基酸取代的位置是相对于存在于所有tdt蛋白(尤其是哺乳动物tdt蛋白)的氨基酸序列中的多个序列基序来定义的,并且这些序列基序在科学文献中是公知的或在本文中定义。本发明的嵌合tdt变体中的氨基酸区段的排序保留了天然tdt中存在的序列基序的排序和数目。也就是说,每个天然tdt具有序列基序的排序和数目(例如从n末端到c末端:fmr、vsc、ggfrr、kmt、tgsr、fer等)。本发明的每个嵌合tdt变体具有这些序列基序的相同的排序和数目。
32.如图2所示,对于一些实施方案,本发明的嵌合tdt变体包含来自三种不同物种的三个区段:来自物种1的tdt变体的b1(200),来自物种2的tdt变体的b2(202)和来自物种3的tdt变体的b3(204)。本发明的嵌合tdt不包括n末端brct样区段,n末端brct样区段在野生型或天然存在的tdt中通常包含约130个氨基酸,例如delarue等,embo j.,21(3):427-439(2002)。也就是说,本发明的所有嵌合tdt变体都在n末端截短它们的brct样区段。在一些实施方案中,通过使用常规序列比对工具(例如multalin(mitchell,bioinformatics,9(5):614-615(1993))),将全长tdt序列与seq id no:2的截短的小鼠tdt或类似序列进行比对,从全长tdt能容易地确定b1区段的n末端氨基酸。如箭头(206a、206b、208a和208b)所示,区段b1和b2之间以及区段b2和b3之间的边界对于由所示序列基序的位置限定的所示区域内的不同嵌合tdt变体可以变化(并且如箭头所示):b
1-b2边界可以位于vsc基序和kmt基序之间的任何氨基酸位置,并且b
2-b3边界可以位于drr基序(或相当于距c末端约70个氨基酸的氨基酸位置)和嵌合tdt变体的c末端之间的任何氨基酸位置。也就是说,在一些实施方案中,区段b3可以含有零个氨基酸,或者换句话说,区段b3可以不存在,使得该实施方案仅由来自两种不同物种的两个区段组成。
33.本文所用的公知的tdt序列基序包括位于330-340位(参照全长小鼠tdt确定,例如seq id no:1)氨基酸区段中或附近的ggfrr(或tggfrrg)基序和位于450-460位(也是参照全长小鼠tdt确定,例如seq id no:1)氨基酸区段中或附近的tsgr基序。这些序列基序和另外的序列基序frm(相对于seq id no:1位于185-195位氨基酸区段附近)、vsc(相对于seq id no:1位于295-305位氨基酸区段附近)、kmt(相对于seq id no:1位于335-345位氨基酸区段附近)和fer(相对于seq id no:1位于450-465位氨基酸区段附近)用于定义本发明的一些实施方案。或者,kmt基序中的氨基酸取代可等同地定义为ggfrr基序和ghd基序(位于或接近seq id no:1的氨基酸区段34-345位)之间的区段中的氨基酸取代。在一些实施方案中,kmt基序可替代地定义为tggfrrg基序和ghd基序之间(不包括tggfrrg基序和ghd基序)的氨基酸区段,例如delarue等(上文引用)。在其它实施方案中,kmt基序是tggfrrg基序和选自kmt、kki、kkm、kef、kkv、kkl和kkt的ghd基序之间的3氨基酸区段。在一些实施方案中,fmr基序是位于选自fmr、flr和ymr的185-200位氨基酸区段(参考seq id no:1)中或附近的3氨基酸区段。在一些实施方案中,vsc基序是位于选自vsc、idc、iss、tsy、ska、skp、sra和asc的氨基酸区段295-305位(参考seq id no:1)中或附近的3氨基酸区段。在一些实施方案中,tgsr基序是位于选自tgsr、tgsp和sgsr的氨基酸区段445-460位(参考seq id no:1)中或附近的4氨基酸区段。在一些实施方案中,fer基序是位于选自fer和fgr的氨基酸区段454-460位(参考seq id no:1)中或附近的3氨基酸区段。如关于序列基序所使用的,在一些实施方案中,术语“附近”或“位于”是指在所示范围或基序的15个氨基酸范围内,或在所示范围或基序的10个氨基酸范围内。各种基序的位置可以根据tdt的物种而变化,然而,基序沿着tdt氨基酸序列的排序对于所有物种都是相同的,并且序列基序对之间的相对间隔(以氨基酸计)是高度保守的,如下文表1中所选择的基序所示。因此,基序是用于限定构成本发明的嵌合tdt的氨基酸区段的有用的“界碑”。
34.表1
[0035][0036]
#不包括vsc
[0037]
*包括vsc&tgsr
[0038]
^不包括tgsr
[0039]
在一些实施方案中,本发明的嵌合tdt变体具有与下式定义的氨基酸序列具有至少80%同一性的氨基酸序列:
[0040]b1-b
2-b3[0041]
其中:
[0042]
b1是不具有brct样区域的第一物种tdt的氨基酸区段,b1从第一物种tdt的n末端延伸至第一物种tdt的vsc基序与第一物种tdt的kmt基序之间的氨基酸位置,其中b1包含在其fmr基序中的蛋氨酸或功能等同残基的取代,当b1包含ggfrr基序时,b1包含在其ggfrr基序中的第二精氨酸(从n末端至c末端)或功能等同残基的取代,以及当b1包括vsc基序时,b1包含在其vsc基序中的缬氨酸或丝氨酸或半胱氨酸或功能等同残基的一个或多个取代;
[0043]
b2是第二物种tdt的氨基酸区段,b2从b1的c末端延伸至第二物种tdt的c末端,或者当b3包含一个或多个氨基酸时延伸至b3的n末端,其中当b2包含vsc基序时,b2在其vsc基序中分别包含缬氨酸或丝氨酸或半胱氨酸或功能等同残基的一个或多个取代,当b2包括ggfrr基序时,b2在其ggfrr基序中包含第二精氨酸或功能等同残基的取代,当b2包括tgsr基序时,b2在其tgsr基序中包含精氨酸或功能等同残基的取代,以及当b2包括fer基序时,b2在其fer基序中包含谷氨酸或功能等同残基的取代;以及
[0044]
b3是第三物种tdt的氨基酸区段,b3包含0至70个氨基酸并且从第三物种tdt的c末端延伸至b2的c末端氨基酸,其中当b3包括tgsr基序时,b3在其tgsr基序中包含精氨酸或功能等同残基的取代,并且当b3包括fer基序时,b3在其fer基序中包含谷氨酸或功能等同残基的取代;并且其中所述嵌合tdt变体(i)能够在没有模板的情况下合成核酸片段,并且(ii)能够将3
’‑
o-封闭的三磷酸核苷并入到核酸片段上;并且其中b1、b2和b3被选择为使得所述嵌合tdt变体具有350至410个氨基酸。
[0045]
在一些实施方案中,上述嵌合tdt变体具有选自seq id nos 2、3、4、5、6、7、8、9、10、11、12、13、14、15、27、27、28、29、30、31、32、33、34、35、36、37、38、39、40和41的氨基酸序列的b1、b2和b3区段,其中:每个b1区段具有(i)在fmr基序中蛋氨酸或其功能等同残基的取代是位于相对于seq id nos:2、3、4、6、7、8、11、12和13位的第63位;相对于seq id no:5的第62位;相对于seq id no:9的第64位;相对于seq id no:10、26、28、29、30、32、33、34、36、37、38和39的第61位;相对于seq id no:14的第66位;相对于seq id no:15的第47位;和相对于seq id no:27、31、35和40的第48位;(ii)vsc基序中缬氨酸或其功能等同残基的取代位于相对于seq id no:2、3、4、6、7、8、11和12的第171位;相对于seq id no:5、32、33、34、36、37、38、39和41的第170位;相对于seq id no:9的第172位;相对于seq id no:10、28、29、30、32、33、34、36、37、38、38和41的第169位;相对于seq id no:13的第180位;相对于seq id no:14的第174位;相对于seq id no:15的第154位;相对于seq id no:26的第168位;相对于seq id no:27、35和40的第156位;相对于seq id no:31的第157位;(iii)在所述vsc基序中的丝氨酸或其功能等同残基的取代位于相对于seq id nos:2、3、4、6、7、8、11和12的第172位;相对于seq id no:5的第171位;相对于seq id no:9的第173位;相对于seq id no:10、28、29、30的第170位;相对于seq id no:13的第181位;相对于seq id no:14的第175位;以及相对于seq id no:15的第155位;相对于seq id no:26的第169位和相对于seq id no:27、31、35和40的第157位;(iv)在所述vsc基序中的半胱氨酸或其功能等同残基的取代位于相对于seq id no:2、3、4、6、7、8、11和12的第173位;相对于seq id no:5的第172位;相对于seq id no:9的第174位;相对于seq id no:10、28、29、30、32、33、34、37、38、39和41的第171位;相对于seq id no:13的第182位;相对于seq id no:14的第176位;相对于seq id no:26的第170位;相对于seq id no:27、31、35、36和40的第158位;以及相对于seq id no:15的第156位;每个b2区段在所述ggfrr基序中具有第二精氨酸或其功能等同残基的取代,所述残基位于相对于seq id nos:2、3、4、6、7、8、11和12的第207位;相对于seq id no:5的第206位;相对于seq id no:9的第208位;相对于seq id no:10、28、29、30、32、33、34、36、37、38、39和41的第205位;相对于seq id no:26的第204位;相对于seq id no:27、31、35和40的第192位;相对于seq id no:13的第216位;相对于seq id no:14的210位;以及相对于seq id no:15的第190位;并且每个b3区段(在一些实施方案中是b2区段)具有(i)在所述tgsr基序中精氨酸或功能等同残基的取代位于相对于seq id nos:2、7、8、12和33的第325位;相对于seq id no:3、4、29和32的第324位;相对于seq id no:5的第320位;相对于seq id no:6的第331位;相对于seq id no:9和26的第326位;相对于seq id no:28、30的第327位;相对于seq id no:10的第323位;相对于seq id no:11和14的第328位;相对于seq id no:13的第338位;相对于seq id no:27、31的第314位;相对于seq id no:35的第310位;相对于seq id no:31的第311位;相对于seq id no:32的第321位;相对于seq id no:33、34的第322位;相
对于seq id no:36、37、38、39和41的第323位;相对于seq id no:40的第309位;和相对于seq id no:15的第308位;和(ii)fer基序中的谷氨酸或功能等同残基的取代位于相对于seq id no:2、7、8和12在第328位;相对于seq id no:3、4和29的第327位;相对于seq id no:5的第323位;相对于seq id no:6的第334位;相对于seq id no:9和26的第329位;相对于seq id no:10、36、37、38、39和41的第326位;相对于seq id no:11和14的第331位;相对于seq id no:13的第341位;相对于seq id no:27的第317位;相对于seq id no:28和30的第330位;相对于seq id no:40的第312位;相对于seq id no:35的第313位;相对于seq id no:31的第314位;相对于seq id no:32的第324位;相对于seq id no:33和34的第325位;以及相对于seq id no:15的第311位。
[0046]
在一些实施方案中,本发明的嵌合tdt变体包含:(i)fmr基序中的蛋氨酸或功能等同残基的取代是r或q;(ii)ggfrr基序中的第二精氨酸或功能等同残基的取代为l或n;和(iii)vsc基序中的半胱氨酸或功能等同残基的取代为g、r、p、a、v、s、n、q或d,或在一些实施方案中是g或r;(iv)tgsr基序中精氨酸或功能等同残基的取代为p、n或a;和(v)fer基序中的谷氨酸或功能等同残基的取代为n、l、t或s。
[0047]
在一些实施方案中,上述百分比同一性值与所示的b
1-b
2-b3氨基酸序列具有至少80%同一性;在一些实施方案中,上述百分比同一性值与所示的b
1-b
2-b3氨基酸序列具有至少90%同一性;在一些实施方案中,上述百分比同一性值与所示的b
1-b
2-b3氨基酸序列具有至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值是至少98%的同一性;在一些实施方案中,上述同一性百分比值是至少99%的同一性。
[0048]
在一些实施方案中,嵌合tdt变体包括小鼠和牛tdt变体的嵌合体,其中b1和b3源自如上所述的小鼠tdt变体,b2源自如上所述的牛tdt变体。特别地,本发明的嵌合tdt变体可以包含从小鼠tdt变体m53(seq id no:21)和牛tdt变体m54(seq id no:22)获得的b1、b2和b3区段。在一些这样的嵌合tdt变体中,b1和b3源自m53,b2源自m54。
[0049]
在一些实施方案中,嵌合末端脱氧核苷酸转移酶(tdt)变体包含三个氨基酸区段:(a)小鼠tdt的n末端区段(没有其brct样片段),从n末端延伸至vsc基序处的位置,(b)来自非小鼠tdt的中部或内部区段,从vsc基序处的位置延伸至tgsr基序的n端方向的约5-15个氨基酸(或延伸至tgsr基序处的位置),和(c)小鼠tdt的c末端区段,由tgsr基序的n端方向的5-15个氨基酸延伸到小鼠tdt区段的c末端。
[0050]
在一些实施方案中,嵌合末端脱氧核苷酸转移酶(tdt)变体包含与由下式定义的氨基酸序列具有至少80%同一性的氨基酸序列:
[0051]j1-j
2-j3[0052]
其中:
[0053]
j1是不具有brct样区域的小鼠tdt的氨基酸区段,j1从小鼠tdt的n末端延伸至vsc基序(含vsc基序)和kmt基序(含kmt基序)之间的氨基酸位置,其中j1包含fmr基序中蛋氨酸或功能等同残基的取代,当j1包含ggfrr基序时,j1包含在其ggfrr基序中第二精氨酸或功能等同残基的取代,以及当j1包括vsc基序时,j1包含在其vsc基序中的缬氨酸或丝氨酸或半胱氨酸或功能等同残基的一个或多个取代;
[0054]
j2是非小鼠tdt的氨基酸区段,j2从位于vsc基序和kmt基序之间的氨基酸位置延伸
至tgsr基序的氨基酸位置,其中当j2包含ggfrr基序时,所述氨基酸区段包含其ggfrr基序中第二精氨酸或功能等同残基的取代,并且当j2包括vsc基序时,j2包含在其vsc基序中缬氨酸或丝氨酸或半胱氨酸或功能等同残基的一个或多个取代;和
[0055]
j3是小鼠tdt的氨基酸区段,j3从tgsr基序的氨基酸位置延伸至小鼠tdt的c末端氨基酸,其中当j3包含tgsr基序时,j3包含其tgsr基序中的精氨酸或功能等同残基的取代,并且当j3包含fer基序时,j3包含其fer基序中的谷氨酸或功能等同残基的取代;并且其中所述嵌合tdt变体(i)能够在没有模板的情况下合成核酸片段,并且(ii)能够将3
’‑
o-封闭的三磷酸核苷并入到核酸片段上;并且其中j1、j2和j3被选择为使得嵌合tdt变体具有350至410个氨基酸。
[0056]
在一些实施方案中,这样的嵌合tdt变体包含与由下式定义的氨基酸序列至少百分之八十相同的氨基酸序列:
[0057]j1-j
2-j3[0058]
其中:
[0059]
j1是具有选自seq id no:42、71、73或82的氨基酸序列的氨基酸区段;
[0060]
j2是具有选自以下的氨基酸序列的氨基酸区段:seq id nos 44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70,以上序列均在第35位具有精氨酸取代;和
[0061]
j3是具有seq id no:43的氨基酸序列的氨基酸区段,在相对于seq id no:43的第12位具有精氨酸的取代并且在第15位具有谷氨酸的取代,或j3具有seq id no:72的氨基酸序列;并且其中嵌合tdt变体(i)能够在没有模板的情况下合成核酸片段,并且(ii)能够将3
’‑
o-封闭的三磷酸核苷并入到核酸片段上。
[0062]
在一些实施方案中,j1是具有氨基酸序列seq id no:82的氨基酸区段;j2是具有选自seq id no:52、53、54、55、56、57、58、59、62和63的氨基酸序列的氨基酸区段;j3是具有seq id no:43的氨基酸序列的氨基酸区段,在相对于seq id no:43的第12位具有精氨酸的取代并且在第15位具有谷氨酸的取代,或j3是具有seq id no:72的氨基酸序列的氨基酸区段。
[0063]
在一些实施方案中,seq id no:42的氨基酸序列还在第63位具有蛋氨酸的取代;seq id no:44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69和70的氨基酸序列还各自在第1位具有半胱氨酸的取代;seq id no:43的氨基酸序列还在第38位具有精氨酸取代。
[0064]
在其他实施方案中,第63位的蛋氨酸的取代是r或q,第35位的精氨酸的取代是l或n,第1位的半胱氨酸的取代是g或r。
[0065]
在一些实施方案中,j2是具有选自哺乳动物tdt的氨基酸序列的氨基酸区段,例如seq id no:52、53、54、55、56、57、58、59、62、63、64、65、66、67、69或70。在一些实施方案中,j2是选自牛tdt的氨基酸区段,例如seq id no:58。
[0066]
在其他实施方案中,seq id no:42的氨基酸序列还具有第17位的丙氨酸取代,第52位的亮氨酸取代,第57位的甘氨酸取代,第63位的蛋氨酸取代和第108位的丙氨酸的取代。
[0067]
在一些实施方案中,上述百分比同一性值与所示的j
1-j
2-j3氨基酸序列具有至少
80%同一性;在一些实施方案中,上述百分比同一性值与所示的j
1-j
2-j3氨基酸序列具有至少90%同一性;在一些实施方案中,上述百分比同一性值与所示的j
1-j
2-j3氨基酸序列具有至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值是至少98%的同一性;在一些实施方案中,上述同一性百分比值是至少99%的同一性。
[0068]
上述实施方案的发明部分基于申请人的发现,即,基于常规的热位移测定,上述嵌合tdt变体j
1-j
2-j3比以前的tdt变体如m57(seq id no:23)具有更高的热稳定性,如下所述。在一些实施方案中,这种热稳定性的增加在1-2℃的范围内。
[0069]
在其他实施方案中,嵌合tdt变体包含与下式定义的氨基酸序列具有至少90%同一性的氨基酸序列:
[0070]r1-r
2-r3[0071]
其中:
[0072]
r1是不具有brct样片段的小鼠tdt的氨基酸区段,从n末端延伸至vsc基序的位置;
[0073]
r2是非小鼠tdt的氨基酸区段,从vsc基序的位置延伸到tgsr基序的位置,其中r2的ggfrr基序的第二精氨酸被取代;和
[0074]
r3是小鼠tdt的氨基酸区段,从tgsr基序的位置延伸至c末端,其中r3的tgsr基序的精氨酸被取代并且fer基序的谷氨酸被取代;并且其中嵌合tdt变体(i)能够在没有模板的情况下合成核酸片段,并且(ii)能够将3
’‑
o-封闭的三磷酸核苷并入到核酸片段上。
[0075]
在一些实施方案中,r1的c末端氨基酸是vsc基序的第二个氨基酸;r2的n端氨基酸为vsc基序的第三个氨基酸;r2的c末端氨基酸在距tgsr基序的n端方向上5-10个氨基酸的区域内。
[0076]
在一些实施方案中,上述百分比同一性值与所示的r
1-r
2-r3氨基酸序列具有至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值是至少98%的同一性;在一些实施方案中,上述同一性百分比值是至少99%的同一性。
[0077]
在一些实施方案中,嵌合tdt变体包含来自鼠tdt的至少一个氨基酸区段和来自牛tdt的至少一个氨基酸序列。这种嵌合tdt变体包括含有氨基酸序列seq id no:74(m57-n27-8-13c7,没有his标签),seq id no:75(46-557,没有his标签),seq id no:76(46-342,没有his标签),seq id no:77(46-571,没有his标签),seq id no:78(m92,没有his标签),seq id no:79(没有his标签的m93),seq id no:80(没有his标签的m94)和seq id no:81(没有his标签的m88)的tdt。申请人已经发现,基于常规的热位移测定,上述嵌合tdt变体比以前的tdt变体(如m57(seq id no:23))具有更高的热稳定性,如下所述。在一些实施方案中,这种热稳定性的增加在1-2℃的范围内。
[0078]
本发明的嵌合tdt变体可以包含来自多种不同物种的氨基酸区段,这些氨基酸区段另外具有选定氨基酸的突变。例如,由以下物种tdt构建的嵌合tdt变体可以具有一个或多个如下表中所述的突变:
[0079]
表2:嵌合tdt变体的实例
[0080]
[0081][0082]
本发明的嵌合tdt变体可以包含与指定的seq id no中给定区段具有一定百分比序列同一性的氨基酸区段,进行指定的取代。在一些实施方案中,以这种方式描述的本发明的嵌合tdt变体与指定的seq id no之间的序列差异的数目和类型可以是由于取代、缺失和/或插入,并且被取代、缺失和/或插入的氨基酸可能包括任何氨基酸。在一些实施方案中,这样的缺失、取代和/或插入仅包括天然存在的氨基酸。在一些实施方案中,取代仅包括保守型或同义型(synonymous)氨基酸改变,如grantham,science,185:862-864(1974)中所述。也就是说,氨基酸的取代只能在其同义型氨基酸组的成员中发生。在一些实施方案中,
可以使用的同义型氨基酸组列于表3a中。
[0083]
表3a:氨基酸同义组i
[0084][0085][0086]
在一些实施方案中,可以使用的同义氨基酸组列于表3b中。
[0087]
表3b:氨基酸同义组ii
[0088][0089][0090]
核苷酸并入活性的测量
[0091]
本发明变体的核苷酸并入效率可通过延伸或延长测定来测量,例如如boule等(下文引用),bentolila等(下文引用),和hiatt等人的美国专利5808045中所述,后者通过援引加入的方式并入到本文中。简言之,在这种测定的一种形式中,具有自由3
’‑
羟基的荧光标记的寡核苷酸在tdt延伸条件下与待测试的变体tdt在可逆封闭的三磷酸核苷存在下反应预定的持续时间,之后终止延伸反应,并且在通过凝胶电泳分离后,定量延伸产物和未延伸的引发寡核苷酸的量。通过这种测定,变体tdt的并入效率可以容易地与其它变体或野生型或参考tdt或其它聚合酶的效率比较。在一些实施方案中,变体tdt效率的量度可以是在同样测定中使用变体tdt的延伸产物的量与使用野生型tdt的延伸产物的量的比率(以百分比
给出)。
[0092]
在一些实施方案中,以下具体延伸测定可用于测量tdt的并入效率:所用引物如下:
[0093]
5'-aaaaaaaaaaaaaagggg-3'(seq id no:20)
[0094]
所述引物在5’末端还具有atto荧光染料。使用的代表性修饰核苷酸(在表4中记为dntp)包括3
’‑
o-氨基-2’,3
’‑
二脱氧核苷酸-5
’‑
三磷酸(onh2,firebird biosciences),例如3
’‑
o-氨基-2’,3
’‑
二脱氧腺苷-5
’‑
三磷酸。对于每个测试的不同变体,使用一个管进行反应。将试剂加入管中,从水开始,然后按表4的顺序加入。在37℃下孵育30分钟后,通过添加甲酰胺(sigma)终止反应。
[0095]
表4:延伸活性测定试剂
[0096][0097]
活性缓冲液包含例如补充有cocl2的tdt反应缓冲液(可获自new england biolabs)。
[0098]
通过常规聚丙烯酰胺凝胶电泳分析测定的产物。例如,上述测定的产物可以在16%聚丙烯酰胺变性凝胶(bio-rad)中分析。在分析即将开始前制备凝胶,通过将聚丙烯酰胺倾倒在玻璃平板内并使其聚合。将玻璃平板内的凝胶安装在填充用于电泳步骤的tbe缓冲液(sigma)的改造罐中。将待分析的样品加载在凝胶的顶部。在室温下,在凝胶的顶部和底部之间施加500至2000v的电压,持续3至6h。分离后,使用例如typhoon扫描仪(ge life sciences)扫描凝胶荧光。使用imagej软件(imagej.nih.gov/ij/)或其同类软件分析凝胶图像,以计算修饰核苷酸的并入百分比。
[0099]
发夹完成测定。在一个方面,本发明包括测量聚合酶(例如tdt变体)将dntp并入多核苷酸(即“测试多核苷酸”)的3’末端的能力的方法。一种这样的方法包括在反应条件下提供具有自由3’羟基的测试多核苷酸,其中所述测试多核苷酸基本上仅是单链的,但在用聚合酶(如tdt变体)延伸时形成包含单链环和双链茎的稳定发夹结构,从而允许通过双链多核苷酸的存在检测3’末端的延伸。双链结构可以以多种方式检测,包括但不限于,插入双链结构时优先发荧光的荧光染料,延伸多核苷酸上的受体(或供体)和寡核苷酸上的供体(或受体)之间的荧光共振能量转移(fret),所述寡核苷酸与新形成的发夹茎形成三链体,fret受体和供体均连接到测试多核苷酸并且在形成发夹或类似结构等时,被带入fret附近。在一些实施方案中,在延伸单个核苷酸后,测试多核苷酸的茎部的长度在4至6个碱基对的范围内;在其它实施方案中,这样的茎部的长度为4至5个碱基对;在其它实施方案中,这种茎部的长度为4个碱基对。在一些实施方案中,测试多核苷酸的长度在10至20个核苷酸的范围
内;在其它实施方案中,测试多核苷酸具有12-15个核苷酸的长度。在一些实施方案中,用这样的核苷酸延伸测试多核苷酸是有利的或方便的,所述核苷酸使不具有延伸的茎和具有延伸的茎的熔解温度之间的差异最大化;因此,在一些实施方案中,用dc或dg延伸测试多核苷酸(因此选择具有用于茎形成的合适互补核苷酸的测试多核苷酸)。
[0100]
用于发夹完成测定的示例性测试多核苷酸包括p875(5'-cagttaaaaact)(seq id no:16),其通过用dgtp延伸而完成;p876(5'-gagttaaaact)(seq id no:17),其通过用dctp延伸而完成;和p877(5'-cagcaaggct)(seq id no:18),其通过用dgtp延伸而完成。用于这些测试多核苷酸的示例性反应条件可以包括:2.5-5μm的测试多核苷酸,的1∶4000稀释液(来自biotium,inc.,fremont,ca的插入染料),200mm卡可基酸盐koh ph6.8,1mm cocl2,0-20%dmso和3
’‑
onh
2 dgtp和所需浓度的tdt。使用常规荧光计(例如tecan读数器)在28-38℃的反应温度下,使用设置为360nm的激发过滤器和设置为635nm的发射过滤器,可以通过染料的荧光增加来监测发夹的完成。
[0101]
在本发明该方面的一些实施方案中,可以通过以下步骤测试tdt变体对无模板三磷酸核苷并入的能力:(a)在一定条件下,将具有自由3
’‑
羟基的测试多核苷酸、tdt变体和三磷酸核苷组合,其中测试多核苷酸是单链的,但并入三磷酸核苷后形成具有双链茎区的发夹;和(b)检测形成的双链茎区的量,作为tdt变体并入三磷酸核苷的能力的量度。在一些实施方案中,三磷酸核苷是3
’‑
o-封闭的三磷酸核苷。
[0102]
tdt变量稳定性的测量
[0103]
蛋白质稳定性的增加可以用多种方式测量。基于荧光的热位移测定由于简单和低成本而特别用于这种测量。描述热位移测定及其在测量蛋白质稳定性中的应用的示例性参考文献如下:pantoliano et al,j.biomolecular screening,6(6):429-440(2001);huynh et al,curr.protocol.protein science,79:28.9.1-28.9.14;ericsson et al,anal.biochem.,357:289-298(2006);niesen et al,nature protocols,2(9):2212-2221(2007);and pantoliano et al,美国专利6020141,通过援引的方式将后者并入本文。这种测定的理念基础是通过暴露于疏水荧光探针可以区分折叠和解折叠的蛋白质。这种探针在水溶液中被淬灭,但优先结合解折叠蛋白的暴露的疏水内部,导致淬灭的急剧降低,从而可以作为温度的函数研究容易检测到的荧光发射。热诱导的解折叠是遵循典型的两态模型的不可逆的解折叠过程,在折叠和解折叠状态之间具有急剧的转变,其中熔解温度(tm)被定义为蛋白质解折叠转变的中点温度。用这种所谓的“热荧光”方法获得的熔解温度已经显示对于几种蛋白质与通过用于测量蛋白质稳定性的其它生物物理方法(例如圆二色性(cd),浊度测量和差示扫描量热法)测定的值具有良好的相关性。
[0104]
室温下的低荧光表示折叠良好的蛋白质。荧光发射随着温度的升高而增加,产生了代表蛋白质协同解折叠的s形曲线。所得的s形曲线可以与boltzmann方程拟合,以确定在解折叠转变的中点处出现的熔解温度;或者,通过将荧光发射的一阶导数作为温度的函数作图(-df/dt),可以容易地确定tm,其中tm对应于曲线的最小值,huynh等(上文引用)。
[0105]
可以使用各种荧光染料,并且可以直接商购或作为测定试剂盒的一部分商购。示例性的荧光染料是sypro orange。常规的实时pcr仪器可用于温度控制和荧光检测。通常,选择对应于使用tdt变体的dna合成反应的并入或偶联条件的缓冲液、盐浓度和组分,以及其它添加剂,例如dmso。下文给出了示例性的偶联条件。
[0106]
如上所述,在一些实施方案中,在n截短的tdt变体的指定位置的稳定化氨基酸取代(或者说,稳定化氨基酸)是这样的氨基酸取代,其相对于缺少稳定化氨基酸取代之外的相同氨基酸序列的tdt的熔解温度将所述tdt变体的熔解温度提高至少1℃,其中熔解温度通过基于荧光的热位移测定来确定。在一些实施方案中,这种测定使用sypro orange染料。在更进一步的实施方案中,这种测定的反应条件包括偶联反应条件。在其他实施方案中,这种稳定化氨基酸取代将tdt变体的熔解温度提高了1.5℃。
[0107]
在一些实施方案中,在以下溶液中使用热位移测定测量熔解温度:含有sypro orange染料的0.5卡可基酸盐koh缓冲液ph7.4。可以对测定进行染料和蛋白质浓度的一些常规优化,例如在上述参考文献中提供了这种优化的指导,尤其是huynh等(上文引用)。
[0108]
无模板酶学合成
[0109]
多核苷酸的无模板酶学合成可以通过多种已知方案使用无模板聚合酶进行,例如末端脱氧核苷酸转移酶(tdt),包括经改造以具有改善的特性的tdt变体,例如更高的温度稳定性或在并入3
’‑
o-封闭的三磷酸脱氧核苷(3
’‑
o-封闭的dntp)中更高的效率。例如ybert等人的国际专利公开wo/2015/159023;ybert等,国际专利公开wo/2017/216472;hyman,美国专利5436143;hiatt等,美国专利5763594;jensen等人,biochemistry,57:1821-1832(2018);mathews等人,organic&biomolecular chemistry,doi:0.1039/c60ob01371f(2016);schmitz等人,organic lett.,1(11):1729-1731(1999)。
[0110]
在一些实施方案中,酶学dna合成方法包括重复的步骤循环,例如图1所示,其中在每个循环中加入预定的核苷酸。提供了具有自由3
’‑
羟基(103)的引发多核苷酸(100),例如附接于固体支持物(102)。在能有效地将3
’‑
o-保护的-dntp酶学并入到引发多核苷酸(100)(或延伸的引发多核苷酸)的3’末端的条件(104)下,向引发多核苷酸(100)(或后续循环中的延伸的引发多核苷酸)中加入3
’‑
o-保护的dntp和tdt变体。该反应产生3
’‑
羟基被保护的延伸的引发多核苷酸(106)。如果延伸的引发多核苷酸含有完整的序列,则3
’‑
o-保护基团被去除或脱保护,并且期望的序列被从原始引发多核苷酸切割。这种切割可以使用多种单链切割技术中的任一种进行,例如,通过在原始引发多核苷酸内的预定位置插入可切割的核苷酸。示例性的可切割核苷酸可以是被尿嘧啶dna糖基化酶切割的尿嘧啶核苷酸。如果延伸的引发多核苷酸不包含完整的序列,则除去3
’‑
o-保护基团以暴露自由的3
’‑
羟基(103),并且延伸的引发多核苷酸经历另一循环的核苷酸添加和脱保护。
[0111]
如本文所用,关于指定基团(例如核苷酸或核苷的3
’‑
羟基)的术语“保护的”和“封闭的”可互换使用,并且旨在表示某种部分共价连接至该指定基团,防止在化学或酶学过程期间基团的化学变化。当指定基团是三磷酸核苷或其中已并入3
’‑
保护的(或封闭的)-三磷酸核苷的延伸片段(或“延伸中间体”)的3
’‑
羟基时,被阻止的化学变化是延伸片段(或“延伸中间体”)通过酶偶联反应的进一步或随后的延伸。
[0112]
在一些实施方案中,在每个合成步骤中,在3
’‑
o-可逆性封闭的dntp存在下,使用tdt将有序序列的核苷酸偶联至引发核酸。在一些实施方案中,合成寡核苷酸的方法包括以下步骤:(a)提供具有自由3
’‑
羟基的引发物;(b)在延伸条件下,在3
’‑
o-封闭的三磷酸核苷存在下,使所述引发物或具有自由3
’‑
羟基的延伸中间体与tdt反应,以产生3
’‑
o-封闭的延伸中间体;(c)解封闭所述延伸中间体,以产生具有自由3
’‑
羟基的延伸中间体;和(d)重复步骤(b)和(c),直至合成多核苷酸。(有时“延伸中间体”也称为“延伸片段”。)在一些实施方
案中,引发物作为例如通过其5'末端连接到固体支持物上的寡核苷酸提供。上述方法还可以包括在反应或延伸步骤之后以及在解封闭步骤之后的洗涤步骤。例如,反应步骤可以包括在预定的孵育期或反应时间之后,例如通过洗涤除去未并入的三磷酸核苷的子步骤。这种预定的孵育时间或反应时间可以是数秒(例如30秒)至数分钟(例如30分钟)。
[0113]
上述方法还可以包括封端步骤,以及在反应或延伸步骤之后以及在解封闭步骤之后的洗涤步骤。如上所述,在一些实施方案中,可以包括封端步骤,其中非延伸的自由3
’‑
羟基与防止封端链的任何进一步延伸的化合物反应。在一些实施方案中,这样的化合物可以是二三磷酸脱氧核苷。在其它实施方案中,具有自由3
’‑
羟基的非延伸链可通过用3
’‑
外切核酸酶活性(例如exo i)处理而降解。例如,参见hyman,美国专利5436143。同样,在一些实施方案中,未被解封闭的链可以被处理,以除去这样的链或使这样的链对进一步的延伸是惰性的。
[0114]
在包括寡核苷酸的连续合成的一些实施方案中,封端步骤可能是不希望的,因为封端可能阻止产生等摩尔量的多种寡核苷酸。在没有封端的情况下,序列将具有均匀分布的缺失错误,但是多种寡核苷酸中的每一种将以相等的摩尔量存在。在非延伸片段被封端时则不是这样的情形。
[0115]
在一些实施方案中,用于延伸或延伸步骤的反应条件可包括以下:2.0μm纯化的tdt;125-600μm 3
’‑
o-封闭的dntp(例如3
’‑
o-nh
2-封闭的dntp);约10至约500mm的二甲胂酸钾缓冲液(ph为6.5-7.5)和约0.01至约10mm的二价阳离子(例如cocl2或mncl2),其中延伸反应可以在50μl反应体积中,在室温至45℃范围内的温度下进行3分钟。在3
’‑
o-封闭的dntp是3
’‑
o-nh
2-封闭的dntp的实施方案中,用于解封闭步骤的反应条件可以包括以下:700mm nano2;1m乙酸钠(用乙酸调节至ph4.8-6.5),其中解封闭反应可以在50μl体积中在室温至45℃的范围内的温度下进行30秒至几分钟。
[0116]
根据具体应用,解封闭和/或切割的步骤可以包括各种化学或物理条件,例如光,热,ph,能够切割指定化学键的具体试剂(如酶)的存在。选择3
’‑
o-封闭基团和相应的解封闭条件方面的指导可以在以下参考文献中找到,将这些文献通过援引的方式并入本文:美国专利5808045;美国专利8808988;国际专利公开wo91/06678;以及以下引用的参考文献。在一些实施方案中,切割剂(有时也称为解封闭试剂或解封闭剂)是化学切割剂,例如二硫苏糖醇(dtt)。在其他实施方案中,切割剂可以是酶切割剂,例如磷酸酶,其可以切割3
’‑
磷酸封闭基团。本领域技术人员将理解,解封闭剂的选择取决于所用的3
’‑
核苷酸封闭基团的类型,是否使用一个或多个封闭基团,引发物是否连接到活细胞或生物体或固体支持物等,这种情况则需要温和的处理。例如,膦(如三(2-羧乙基)膦(tcep))可用于切割3
’‑
o-叠氮基甲基,钯络合物可用于切割3’o-烯丙基,或亚硝酸钠可用于切割3’o-氨基。在具体的实施方案中,切割反应涉及tcep、钯络合物或亚硝酸钠。
[0117]
如上所述,在一些实施方案中,期望使用两个或更多个可以使用正交解封闭条件除去的封闭基团。以下示例性封闭基团对(表5)可用于并行合成实施方案,例如上文所述的那些。应理解,其它封闭基团对或含有多于两个的基团可用于本发明的这些实施方案中。
[0118]
表5:示例性封闭基团对
[0119]3’‑
o-nh23
’‑
o-叠氮基甲基3
’‑
o-nh23
’‑
o-烯丙基3’‑
o-nh23
’‑
o-磷酸3
’‑
o-叠氮基甲基3
’‑
o-烯丙基3
’‑
o-叠氮基甲基3
’‑
o-磷酸3
’‑
o-烯丙基3
’‑
o-磷酸
[0120]
在活细胞上合成寡核苷酸需要温和的解封闭或脱保护条件,即,不破坏细胞膜、不变性蛋白质、不干扰关键细胞功能等的条件。在一些实施方案中,脱保护条件在与细胞存活相容的生理条件的范围内。在这样的实施方案中,酶学脱保护是期望的,因为酶学脱保护可以在生理条件下进行。在一些实施方案中,特定的可酶学去除的封闭基团与用于去除所述封闭基团的特定的酶相关联。例如,基于酯或酰基的封闭基团可以用酯酶(如乙酰酯酶或类似的酶)除去,并且可以用3’磷酸酶(如t4多核苷酸激酶)除去磷酸封闭基团。例如,3
’‑
o-磷酸可以通过用100mm tris-hcl(ph6.5)、10mm mgcl2、5mm 2-巯基乙醇和一个单位t4多核苷酸激酶的溶液处理来除去。反应在37℃的温度下进行1分钟。
[0121]“3
’‑
磷酸封闭的”核苷酸或“3
’‑
磷酸保护的”核苷酸是指其中3’位的羟基被含有磷酸的部分的存在封闭的核苷酸。本发明的3
’‑
磷酸封闭的核苷酸的实例是核苷酸-3
’‑
磷酸单酯/核苷酸-2’,3
’‑
环磷酸酯,核苷酸-2
’‑
磷酸单酯和核苷酸-2’或3
’‑
烷基磷酸酯二酯,以及核苷酸-2’或3
’‑
焦磷酸酯。还可以使用硫代磷酸或此类化合物的其它类似物,只要该取代不能防止由磷酸酶导致自由3
’‑
oh的脱磷酸化。
[0122]3’‑
o-酯保护的dntp或3
’‑
o-磷酸保护的dntp的合成和酶学脱保护的其它实例描述于以下参考文献中:canard et al,proc.natl.acad.sci.,92:10859-10863(1995);canard et al,gene,148:1-6(1994);cameron et al,biochemistry,16(23):5120-5126(1977);rasolonjatovo et al,nucleosides&nucleotides,18(4&5):1021-1022(1999);ferrero et al,monatshefte fur chemie,131:585-616(2000);taunton-rigby et al,j.org.chem.,38(5):977-985(1973);uemura et al,tetrahedron lett.,30(29):3819-3820(1989);becker et al,j.biol.chem.,242(5):936-950(1967);tsien,国际专利公开wo1991/006678。
[0123]
本文所用“引发物”(或等同术语,如“引发片段”,“引发核酸”,“引发寡核苷酸”等)是指具有自由3
’‑
末端的短寡核苷酸序列,其可通过无模板聚合酶(如tdt)进一步延伸。在一个实施方案中,引发片段是dna引发片段。在另一个实施方案中,引发片段是rna引发片段。在一个实施方案中,引发片段具有3-100个核苷酸,特别是3-20个核苷酸。在一个实施方案中,引发片段是单链的。在另一个实施方案中,引发片段是双链的。在一个具体的实施方案中,用5'-伯胺合成的引发寡核苷酸可以使用制造商的方案共价连接于磁珠。同样,用3
’‑
伯胺合成的引发寡核苷酸可以使用制造商的方案共价连接到磁珠。适合与本发明的实施方案一起使用的各种其它附接化学方案在本领域中是熟知的,例如integrated dna technologies brochure,“strategies for attaching oligonucleotides to solid supports,”v.6(2014);hermanson,bioconjugate techniques,second edition(academic press,2008)和类似文献。
[0124]
在本发明中使用的许多3
’‑
o-封闭的dntp可以从商业销售商购买或使用公开的技术合成,例如美国专利7057026;国际专利公布wo2004/005667,wo91/06678;canard等,gene(上文引用);metzker等人,nucleic acids research,22:4259-4267(1994);meng等,
j.org.chem.,14:3248-3252(3006);美国专利公开2005/037991。在一些实施方案中,经修饰的核苷酸包含经修饰的核苷酸或核苷分子,所述经修饰的核苷酸或核苷分子包含嘌呤或嘧啶碱基和核糖或脱氧核糖糖部分,所述核糖或脱氧核糖糖部分具有与其共价连接的可移除的3
’‑
oh封闭基团,使得所述3’碳原子连有以下结构的基团:
[0125]-o-z
[0126]
其中-z是-c(r’)
2-o-r”、-c(r’)
2-n(r”)2、-c(r’)
2-n(h)r”、-c(r’)
2-s-r”和-c(r’)
2-f中的任一个,其中每个r”是可移除保护基团或可移除保护基团的一部分;每个r’独立地为氢原子,烷基,取代的烷基,芳基烷基,烯基,炔基,芳基,杂芳基,杂环基,酰基,氰基,烷氧基,芳氧基,杂芳氧基或酰胺基,或通过连接基团连接的可检测标记;条件是在一些实施方案中,这样的取代基具有多至10个碳原子和/或多至5个氧或氮杂原子;或(r’)2表示式=c(r
”’
)2的基团,其中每个r
”’
可以相同或不同,并且选自包含氢原子和卤素原子以及烷基的组,条件是在一些实施方案中,每个r
”’
的烷基具有1至3个碳原子;并且其中所述分子可以反应以产生中间体,其中每个r”交换为h,或者其中z是-(r')
2-f,f交换为oh、sh或nh2,优选oh,所述中间体在水性条件下离解,以提供具有自由3
’‑
oh的分子;条件是当z是-c(r’)
2-s-r”时,两个r’基团不都是h。在某些实施方式中,修饰的核苷酸或核苷的r’是烷基或取代的烷基,条件是这样的烷基或取代的烷基具有1至10个碳原子和0至4个氧或氮杂原子。在某些实施方案中,经修饰核苷酸或核苷的-z具有式-c(r’)
2-n3。在某些实施方案中,z是叠氮基甲基。
[0127]
在一些实施方案中,z是可切割有机部分,具有或不具有杂原子,分子量为200或更小。在其它实施方案中,z是可切割有机部分,具有或不具有杂原子,分子量为100或更小。在其它实施方案中,z是可切割有机部分,具有或不具有杂原子,分子量为50或更小。在一些实施方案中,z是可酶学切割有机部分,具有或不具有杂原子,分子量为200或更小。在其它实施方案中,z是可酶学切割有机部分,具有或不具有杂原子,分子量为100或更小。在其它实施方案中,z是可酶学切割有机部分,具有或不具有杂原子,分子量为50或更小。在其它实施方案中,z是分子量为200或更小的可酶学切割的酯基。在其它实施方案中,z是可被3
’‑
磷酸酶除去的磷酸基团。在一些实施方案中,以下3
’‑
磷酸酶中的一种或多种可与制造商推荐的方案一起使用:t4多核苷酸激酶,小牛肠碱性磷酸酶,重组虾碱性磷酸酶(例如可得自new england biolabs,beverly,ma)。
[0128]
在进一步的具体实施方案中,3
’‑
封闭的核苷酸三磷酸被3
’‑
o-叠氮基甲基,3
’‑
o-nh2或3
’‑
o-烯丙基封闭。
[0129]
在其它实施方案中,本发明的3
’‑
o-封闭基团包括3
’‑
o-甲基,3
’‑
o-(2-硝基苄基),3
’‑
o-烯丙基,3
’‑
o-氨基,3
’‑
o-叠氮基甲基,3
’‑
o-叔丁氧基乙氧基,3
’‑
o-(2-氰基乙基)和3
’‑
o-炔丙基。
[0130]
在一些实施方案中,3
’‑
o-保护基团是电化学不稳定的基团。也就是说,保护基团的脱保护或切割是通过改变保护基团附近的电化学条件来实现的,这导致切割。这种电化学条件的变化可以通过改变或施加物理量(例如电压差或光)来激活辅助物质而引起,所述辅助物质又引起在保护基团的位置处的电化学条件的变化,例如ph的增加或降低。在一些实施方案中,电化学不稳定的基团包括,例如,ph敏感的保护基团,当ph被改变到预定值时,所述保护基团被切割。在其它实施方案中,电化学不稳定的基团包括这样的保护基团,其在
当还原或氧化条件改变时被直接切割,例如通过增加或降低保护基团的位点处的电压差。
[0131]
可以使用多种保护基团(也称为“碱基保护部分”)来减少或消除在多核苷酸链延伸过程中二级结构的形成。通常,除去碱基保护基团的条件与除去3
’‑
o-封闭基团的条件是正交的。特别地,当3
’‑
o-封闭基团的除去或解封闭条件是酸性的,则碱基保护基团可以被选择为碱不稳定的。在这种情况下,由于使用酸不稳定的5
’‑
o-三苯甲基保护的单体(例如beaucage and iyer,tetrahedron letters,48(12):2223-2311(1992)),在亚磷酰胺合成化学中已经开发了许多碱不稳定的保护基团。特别地,用于亚磷酰胺化学的酰基和脒保护基团可适用于本发明的实施方案(例如beaucage和iyer(上文引用)的表2和表3的保护基团)。在一些实施方案中,碱基保护基为脒,如beaucage和iyer(上文引用)的表2中所述。通常,碱基保护的3
’‑
o-封闭的三磷酸核苷单体可以通过文献中描述的方法的常规修饰来合成,例如在下文的实施例中描述的。
[0132]
在一些实施方案中,碱基保护基团与脱氧腺苷三磷酸的6-氮,脱氧鸟苷三磷酸的2-氮和/或脱氧胞苷三磷酸的4-氮连接。在一些实施方案中,碱基保护基团连接到所有指定的氮上。在一些实施方案中,与脱氧腺苷三磷酸的6-氮连接的碱基保护基团选自苯甲酰基、邻苯二甲酰基、苯氧基乙酰基和甲氧基乙酰基;与脱氧鸟苷三磷酸酯的2-氮连接的碱基保护基团选自异丁酰基,异丁酰氧基亚乙基,乙酰基,4-异丙基-苯氧基乙酰基,苯氧基乙酰基和甲氧基乙酰基;与脱氧胞苷三磷酸的4-氮连接的碱基保护基团选自苯甲酰基,邻苯二甲酰基,乙酰基和异丁酰基。
[0133]
在一些实施方案中,与脱氧腺苷三磷酸的6-氮连接的保护基团是苯甲酰基;与脱氧鸟苷三磷酸酯的2-氮连接的碱基保护基团是异丁酰基或二甲基甲脒;与脱氧胞苷三磷酸4-氮连接的碱基保护基团为乙酰基。
[0134]
在一些实施方案中,与脱氧腺苷三磷酸的6-氮连接的碱基保护基团是苯氧乙酰基;与脱氧鸟苷三磷酸酯的2-氮连接的碱基保护基团是4-异丙基-苯氧乙酰基或二甲基甲脒;与脱氧胞苷三磷酸4-氮连接的碱基保护基团为乙酰基。
[0135]
在一些实施方案中,在相同的反应中,碱基保护部分被除去(即,产物被脱保护),并且产物从固体支持物上切割。例如,引发物可以包含核糖尿苷,其可以通过用1m koh或类似试剂(氨,氢氧化铵,naoh等)处理而被切割以释放多核苷酸产物,同时去除碱不稳定的碱基保护部分。
[0136]
当使用碱基保护的dntp时,上述方法可以进一步包括除去碱基保护部分的步骤,在酰基或脒保护基团的情况下,可以(例如)包括用浓氨水处理。
[0137]
变体tdt的产生
[0138]
本发明的变体的产生可以通过突变已知的参考或野生型tdt编码多核苷酸,然后使用常规分子生物学技术将其表达为功能性蛋白。例如,编码截短的小鼠tdt酶(seq id no:2)的小鼠tdt基因可以使用常规分子生物学技术(例如使用stemmer et al,gene,164:49-53(1995);kodumal et al,proc.natl.acad.sci.,101:15573-15578(2004)等文献描述的方案),从合成片段组装,或者可以使用boule et al,mol.biotechnology,10:199-208(1998),or bentolila et al,embo j.,14:4221-4229(1995)等文献描述的方案从小鼠细胞直接克隆。
[0139]
例如,可以将分离的tdt基因插入表达载体,如pet32(novagen),得到载体pctdt,
然后可以使用常规方法制备和表达变体tdt蛋白。具有正确序列的载体可以转化入大肠杆菌生产菌株中。
[0140]
使用常规技术培养转化的菌株成为沉淀物,从沉淀物中提取tdt蛋白。例如,将预先制备的沉淀物在30至37℃水浴中解冻。一旦完全解冻,将沉淀物重悬于裂解缓冲液中,裂解缓冲液包含50mm tris-hcl(sigma)ph7.5,150mm nacl(sigma),0.5mm巯基乙醇(sigma),5%甘油(sigma),20mm咪唑(sigma)和1tab 100ml蛋白酶混合物抑制剂(thermofisher)。小心地进行再悬浮,以避免裂解不足和剩余聚集体。重悬的细胞通过几个弗氏压碎器循环裂解,直到获得完全的颜色均匀性。所用的通常压力为14000psi。然后将裂解物以10000rpm离心1小时至1小时30分钟。在柱纯化之前,使离心物通过0.2μm过滤器以除去任何碎片。
[0141]
tdt蛋白可以在一步法亲和操作中从离心物中纯化。例如,ni-nta亲和柱(ge healthcare)用于结合聚合酶。初始,用15柱体积的50mm tris-hcl(sigma)ph7.5、150mm nacl(sigma)和20mm咪唑(sigma)洗涤和平衡柱。平衡后,将聚合酶结合到柱上。然后,将15倍柱体积的包含50mm tris-hcl(sigma)ph7.5、500mm nacl(sigma)和20mm咪唑(sigma)的洗涤缓冲液加到柱上15倍柱体积。洗涤后,用50mm tris-hcl(sigma)ph7.5、500mm nacl(sigma)和0.5m咪唑(sigma)洗脱聚合酶。收集对应于最高浓度的目标聚合酶的级分,并将其汇集在单个样品中。合并的级分用透析缓冲液(20mm tris-hcl ph6.8,200mm nacl,50mm mgoac,100mm[nh4]2so4)透析。随后在浓缩过滤器(amicon ultra-30,merk millipore)的帮助下浓缩透析液。将浓缩的酶分成小份,最后加入50%甘油,然后将这些小份在-20℃冷冻并长期保存。在sdspage凝胶中分析5μl纯化酶的不同级分。
[0142]
在一些实施方案中,tdt变体可以可操作地连接到:包括共价键或非共价键的接头部分,氨基酸标签(例如,聚氨基酸标签、聚his标签、6his标签等),化合物(例如,聚乙二醇),蛋白-蛋白结合对(例如,生物素-抗生物素蛋白),亲和偶联,捕获探针,或这些的任意组合。接头部分可以与tdt变体分开或作为tdt变体的一部分。用于本发明的tdt变体的示例性his标签是masshhhhhssgsenlyfqtgssg-(seq id no:19))。标签-接头部分不干扰核苷酸结合活性或tdt变体的催化活性。
[0143]
上述方法或等同方法产生分离的tdt变体,其可以与对于活性和/或保存是必需的或有用的各种试剂混合,所述试剂例如盐,ph缓冲剂,载体化合物等。
[0144]
用于实施本发明方法的试剂盒
[0145]
本发明包括用于实施本发明方法的多种试剂盒。在一个方面,本发明的试剂盒包含一种或多种本发明的嵌合tdt变体,一种或多种tdt变体可以在适于实施如本文所述的无模板的酶学多核苷酸合成的一个制剂中或者在多个制剂中,如果分别提供。这样的试剂盒还可以包括用于每种tdt变体的合成缓冲液,提供用于优化3
’‑
o-保护的dntp无模板添加或并入为生长链的的反应条件。在一些实施方案中,每种tdt变体可以分开提供,提供在相同或不同的制剂中,提供在分开的容器中,并且在其它实施方案中,部分或所有的tdt变体可以在共同的制剂中提供为混合物。在一些实施方案中,本发明的试剂盒还包括3
’‑
o-可逆保护的dntp。在这样的实施方案中,3
’‑
o-可逆保护的dntp可以包含3
’‑
o-氨基-dntp或3
’‑
o-叠氮基甲基-dntp。在其他实施方案中,试剂盒可以包括以下一种或多种物质,单独提供或与上述物质在一起:(i)用于进行本文所述的脱保护或解封闭步骤的脱保护或解封闭试剂,(ii)连接有引发物的固体支持物,(iii)用于从固体支持物释放完成的多核苷酸的切割试
剂,(iv)用于在酶学添加或偶联步骤结束时除去未反应的3
’‑
o-可逆保护的dntp的洗涤试剂或缓冲液,和(v)合成后处理试剂,如纯化柱,脱盐试剂,洗脱试剂等。
[0146]
关于以上物质(ii)和(iii),某些引发物和切割试剂结合在一起。例如,包含肌苷可切割核苷酸的引发物可以与内切核酸酶v切割试剂一起存在;包含硝基苄基可光切割接头的引发物可以与合适的光源一起用于切割可光切割接头;包含尿嘧啶的引发物可以与尿嘧啶dna糖基化酶切割试剂一起存在等。
[0147]
实施例1:用于并入3
’‑
o-保护的三磷酸脱氧核苷的具有增强活性的嵌合小鼠-牛tdt变体
[0148]
在该实施例中,通过与小鼠tdt变体m27(seq id no:25)比较,测试从小鼠tdt变体m53(seq id no:21)和牛tdt变体m54(seq id no:54)构建的小鼠-牛嵌合tdt变体m57(seq id no:23)和m59(seq id no:24)在dntp并入中的序列特异性变异性。也就是说,测试m57和m59并入3
’‑
o-封闭的dntp的效率,表示为生长链的三个3
’‑
末端核苷酸的函数。对于测试,由每个嵌合tdt变体(m57和m59)以及作为对照的小鼠tdt变体m27合成24个52聚体随机序列多核苷酸。一式两份进行合成。选择二十四个52聚体,使得每个可能的4聚体以近似其预期频率(即1/256,或大约4或5次出现)表示在总数(24
×
52有效序列)中。
[0149]
合成条件。在ty 1x缓冲液0.01%tween20中分别制备含有两倍浓缩的dntp-onh2(1mm)、dmso(20%)和辅因子(4mm cocl2)和两倍浓缩的突变体(32μm)的预混物。对于m59和m27的反应比较,在核苷酸预混物中加入2
×
tween20。在37℃下,利用m27和m59或m57,一式两份地合成24个序列(52聚体)。延伸时间设定为4分钟。使用500pmole的di树脂(r133)和具有www.ptfe膜的滤板(pall laboratory,new york)进行合成。ty1x缓冲液含有200mm的二甲胂酸钾,ph6.8,mgcl
2 5mm。di树脂r133是通过氨基官能团与10t-di-t起始dna(引发dna)偶联的cnbr琼脂糖树脂(ge healthcare),并且接头是c12。因此,与树脂连接的完整序列是5ammc12/tttttttttt/di/t(seq id no:83)。
[0150]
合成后处理。合成后,进行第一次洗涤(1x100μl/孔h2o,3x100μl/孔sds/dtt,3x100μl/孔h2o)。对于m57/m27平板,不进行sds/dtt洗涤。然后,在通过抽真空移除剩余液体并将平板以2000g离心2分钟之后,立即用m59/m27板的th1缓冲液1x或m57/m27板的wle1缓冲液1x进行3
×
50μl洗涤。之后直接进行切割,以从树脂中除去合成的链。为了进行di切割,在42℃、1250rpm下,将树脂与1μm内部endov(配制于50μl反应体积(对于m59/m27板,为含有173mm nacl和50mm mgcl2的10mm tris ph7.9,对于m57/m27板,为含有50mm kcl和15mm mgcl2的10mm tris ph7.9))中孵育30分钟,然后在2000g下离心2分钟。将树脂用25μlth1缓冲液1x(对于m59/m27板)或用wle1缓冲液1x(对于m57/m27板)洗涤,在42℃、1250rpm下再孵育2分钟,并在2000g下再次离心2分钟。将回收的滤液转移到96孔pcr板中,并且如果需要,则在-20℃下储存。最后,从每个孔收集少于75μl。th1缓冲液含有10mm tris,170mm nacl,50mgcl2,ph8。wle1缓冲液含有10mm tris ph7.9,50mm kcl和15mm mgcl2。
[0151]
dna沉淀。每孔加入0.5μl糖原和naac(3m)ph5.2(7.5μl)并短暂摇动。每孔加入75μl异丙醇,并在4℃以3428g离心1小时15分钟。吸出上清液,并且在每孔中仅留有20μl。每孔加入180μl新鲜制备的80%乙醇,并在4℃以3428g离心30分钟。再次重复除去上清液和洗涤。离心后,每孔仅保留10μl,在speedvac中在35℃下干燥30分钟。将干燥的dna重悬于15μl mb级水中,之后测量浓度。
[0152]
文库制备:使用illumina 196rxns的accel-ngs 1s plus dna文库试剂盒(ozyme sw10096)制备文库。使用illumina的1s plus indexing试剂盒(ozyme sw16024)对文库进行索引。
[0153]
图3a和3b显示了从测序数据得到的结果。在图3a中,比较小鼠tdt变体m27(seq id no:25)和小鼠-牛嵌合tdt变体m57(seq id no:23)在不同三聚体序列之后发生的缺失频率(百分比)。在图3b中,比较小鼠tdt变体m27(seq id no:25)和小鼠-牛嵌合tdt变体m59(seq id no:24)在不同三聚体序列之后发生的缺失频率。应当注意,为了清楚起见,除了前四个三聚体,只有每隔一对的数据条用其对应的三聚体标记。在被合成的多核苷酸中,现有tdt变体(m27示例性代表)和嵌合tdt变体(m57和m59示例性代表)之间的重要差异是嵌合tdt变体m57和m59的缺失的序列特异性插入的最小化,特别是对于三联体cca和cta的出现(分别为图3a和3b中的300和302)。对于这两种三联体,m57或m59中三联体后的缺失率约为m27的缺失率的25%或更低。
[0154]
定义
[0155]
根据以下命名法,氨基酸由它们的单字母或三字母代码表示:a:丙氨酸(ala);c:半胱氨酸(cys);d:天冬氨酸(asp);e:谷氨酸(glu);f:苯丙氨酸(phe);g:甘氨酸(gly);h:组氨酸(his);i:异亮氨酸(ile);k:赖氨酸(lys);l:亮氨酸(leu);m:蛋氨酸(met);n:天冬酰胺(asn);p:脯氨酸(pro);q:谷氨酰胺(gln);r:精氨酸(arg);s:丝氨酸(ser);t:苏氨酸(thr);v:缬氨酸(val);w:色氨酸(trp)和y:酪氨酸(tyr)。
[0156]
关于两个或多个不同tdt中的氨基酸位置的“功能等同”是指(i)在各自位置的氨基酸在tdt的活性中起相同的功能作用,和(ii)在各个tdt的氨基酸序列中的同源氨基酸位置处存在的氨基酸。可以基于序列比对和/或分子建模来鉴定两个或多个不同tdt的氨基酸序列中的位置上等同的或同源的氨基酸残基。在一些实施方案中,功能等同的氨基酸位置属于在进化相关物种(例如通过属、科等相关)的tdt的氨基酸序列之间保守的序列基序。这种保守序列基序的实例描述于motea et al,biochim.biophys.acta.1804(5):1151-1166(2010);delarue et al,embo j.,21:427-439(2002)和类似文献。
[0157]
关于蛋白质,“分离的”是指这样的化合物,其已经从其天然环境的组分或从非均相反应混合物中鉴定和分离和/或回收。天然环境或反应混合物的污染物组分是会干扰蛋白质功能的物质,并且可以包括酶,激素和其它蛋白质或非蛋白质溶质。在一些实施方案中,本发明的蛋白质被纯化为(1)通过lowry方法测定,大于95重量%的蛋白质,最优选大于99重量%的蛋白质,(2)通过使用旋转杯定序器足以获得n末端或内部氨基酸序列的至少15个残基的程度,或(3)通过sds-page、在还原或非还原条件下、使用考马斯蓝或优选银染验证达到同质性。当通过重组方法制备时,本发明的分离的蛋白质可以在重组细胞内原位包括本发明的蛋白质,因为蛋白质的天然环境的至少一个组分将不存在。通常,通过至少一个纯化步骤制备本发明的分离的蛋白质。
[0158]“试剂盒”是指用于递送用于实施本发明方法的材料或试剂的任何递送系统。在反应测定的上下文中,这样的递送系统包括允许从一个位置到另一个位置储存、运输或递送反应试剂(例如,在适当容器中的一种或多种tdt变体,反应缓冲液,3
’‑
o-保护的-dntp,脱保护试剂,附接有引发物的固体支持物等)和/或支持材料(例如,用于进行测定的书面说明、缓冲液等)的系统和/或化合物(例如稀释剂,表面活性剂,载体等)。例如,试剂盒包括含
有相关反应试剂和/或支持材料的一个或多个外壳(例如盒子)。这种内容物可以一起或分开递送到预期的接受者。例如,第一容器可含有一种或多种用于合成方法的tdt变体,第二或另外的容器可含有脱保护剂,具有引发物的固体支持物,3
’‑
o-保护的dntp等。
[0159]
可互换使用的“突变体”或“变体”是指源自指定(通常为野生型或天然型)(例如seq id no:2)氨基酸序列的多肽,其含有相对于指定序列在一个或多个位置的修饰或改变,例如取代、插入和/或缺失。这种突变体或变体通常同时具有无模板聚合酶活性和并入一种或多种可逆性封闭的三磷酸核苷前体的能力。这些变体可以通过本领域熟知的各种技术获得。特别地,用于改变编码野生型蛋白的dna序列的技术的实例包括但不限于定点诱变,随机诱变和合成寡核苷酸构建等。诱变活性在于在蛋白质序列中或在本发明的聚合酶的情况下缺失、插入或取代一个或多个氨基酸。
[0160]“序列同一性”是指两个序列(例如两个多肽序列或两个多核苷酸序列)之间的匹配(例如,相同的氨基酸残基)的数目(或分数,通常表示为百分比)。通过比较比对时的序列来确定序列同一性,以便最大化重叠和同一性,同时最小化序列空位。特别地,根据两个序列的长度,序列同一性可以使用多种数学全局或局部比对算法中的任何一种来确定。相似长度的序列的比对优选使用全局比对算法(例如needleman和wunsch算法;needleman和wunsch,1970),其在整个长度上最优地比对序列,而明显不同长度的序列的比对优选使用局部比对算法(例如smith和waterman算法(smith和waterman,1981)或altschul算法(altschul等,1997;altschul等,2005))。用于确定氨基酸序列同一性百分比的比对可以以本领域技术人员所熟知的各种方式实现,例如,使用可在互联网网站上提供的可公开获得的计算机软件,如http://blast.ncbi.nlm.nih.gov/或http://www.ebi.ac.uk/tools/emboss/。本领域技术人员可以确定用于测量比对的适当参数,包括在所比较的序列的整个长度上实现最大比对所需的任何算法。出于本文的目的,氨基酸序列同一性%值是指使用成对序列比对程序emboss needle产生的值,其使用needleman-wunsch算法创建两个序列的最佳全局比对,其中所有搜索参数被设置为默认值,即,评分矩阵=blosum62,空位开放=10,空位延伸=0.5,末端空位罚分=false,末端空位开放=10和末端空位延伸=0.5。
[0161]“多核苷酸”或“寡核苷酸”可互换使用,并且各自表示核苷酸单体或其类似物的线性聚合物。构成多核苷酸和寡核苷酸的单体能够通过单体-单体相互作用的规则模式(例如watson-crick型碱基配对,碱基堆叠,hoogsteen或反向hoogsteen型碱基配对等)与天然多核苷酸特异性结合。这样的单体和它们的核苷间键可以是天然存在的或可以是类似物,例如天然存在的或非天然存在的类似物。非天然存在的类似物可包括pna,硫代磷酸核苷间键,含有允许连接标记的连接基团的碱基,例如荧光团或半抗原等。当使用寡核苷酸或多核苷酸需要酶学加工(例如通过聚合酶延伸,通过连接酶连接等)时,本领域普通技术人员将理解,在那些情况下,寡核苷酸或多核苷酸不会在任何位置或某些位置含有核苷间键、糖部分或碱基的某些类似物。多核苷酸的大小通常在数个单体单位,例如5-40个(多核苷酸通常被称为“寡核苷酸”时),至几千个单体单位的范围内。当多核苷酸或寡核苷酸由字母序列(大写或小写)表示时,例如“atgcctg”,应当理解,核苷酸从左至右为5'
→3’
顺序,并且“a”表示脱氧腺苷,“c”表示脱氧胞苷,“g”表示脱氧鸟苷,“t”表示胸苷,“i”表示脱氧肌苷,“u”表示尿苷,除非另有说明或从上下文能清楚判断出另外的情形。除非另有说明,术语和原子编号惯例遵循strachan and read,human molecular genetics 2(wiley-liss,new york,
1999)中公开的那些。通常,多核苷酸包含通过磷酸二酯键连接的四种天然核苷(例如对于dna的脱氧腺苷、脱氧胞苷、脱氧鸟苷、脱氧胸苷或对于rna的它们的核糖对应物),然而多核苷酸也可以包含非天然核苷酸类似物,例如包括修饰的碱基、糖或核苷间键。本领域技术人员清楚的是,当酶具有对活性的特定寡核苷酸或多核苷酸底物要求时,例如单链dna、rna/dna双链体等,那么选择用于寡核苷酸或多核苷酸底物的合适的组分完全在普通技术人员的知识范围内,特别是在来自文献的指导下,例如sambrook等,molecular cloning,secondedition(cold spring harborlaboratory,,new york,1989)等参考文献。同样,寡核苷酸和多核苷酸可以指单链形式或双链形式(即寡核苷酸或多核苷酸的双链体及其相应的互补物)。对于本领域的普通技术人员来说,从术语使用的上下文中可以清楚意指哪种形式或者指这两种形式。
[0162]“引物”是指天然的或合成的寡核苷酸,其在与多核苷酸模板形成双链体时能够充当核酸合成的起始点,并从其3’末端沿着模板延伸,从而形成延伸的双链体。引物的延伸通常用核酸聚合酶进行,例如dna或rna聚合酶。在延伸过程中加入的核苷酸序列由模板多核苷酸的序列决定。通常引物由dna聚合酶延伸。引物通常具有14-40个核苷酸的长度,或18-36个核苷酸的长度。引物用于多种核酸扩增反应,例如使用单一引物的线性扩增反应,或使用两种或多种引物的聚合酶链反应。选择用于特定应用的引物的长度和序列的指导是本领域普通技术人员熟知的,如以下参考文献所证明的:编者dieffenbach,pcr primer:a laboratory manual,第2版(cold spring harbor press,new york,2003)。
[0163]“取代”是指氨基酸残基被另一个氨基酸残基替代。优选地,术语“取代”是指将一个氨基酸残基替换为另一个氨基酸残基,另一个氨基酸残基选自天然存在的标准20个氨基酸残基、稀有天然存在的氨基酸残基(例如羟脯氨酸,羟赖氨酸,别羟赖氨酸,6-n-甲基赖氨酸,n-乙基甘氨酸,n-甲基甘氨酸,n-乙基天冬酰胺,别异亮氨酸,n-甲基异亮氨酸,n-甲基缬氨酸,焦谷氨酰胺,氨基丁酸,鸟氨酸,正亮氨酸,正缬氨酸)和非天然存在的氨基酸残基,非天然存在的氨基酸残基经常是合成制备(例如,环己基-丙氨酸)。优选地,术语“取代”是指将一个氨基酸残基替换为另一个氨基酸残基,另一个氨基酸残基选自天然存在的标准20个氨基酸残基。符号“ ”表示取代的组合。
[0164]
氨基酸在本文中由根据以下命名法的单字母或三字母代码表示:a:丙氨酸(ala);c:半胱氨酸(cys);d:天冬氨酸(asp);e:谷氨酸(glu);f:苯丙氨酸(phe);g:甘氨酸(gly);h:组氨酸(his);i:异亮氨酸(ile);k:赖氨酸(lys);l:亮氨酸(leu);m:蛋氨酸(met);n:天冬酰胺(asn);p:脯氨酸(pro);q:谷氨酰胺(gln);r:精氨酸(arg);s:丝氨酸(ser);t:苏氨酸(thr);v:缬氨酸(val);w:色氨酸(trp)和y:酪氨酸(tyr)。
[0165]
在本文中,使用以下术语表示取代:l238a表示母体序列的第238位的氨基酸残基(亮氨酸,l)被改变为丙氨酸(a)。a132v/i/m表示母体序列的第132位的氨基酸残基(丙氨酸,a)被下列氨基酸之一取代:缬氨酸(v),异亮氨酸(i)或蛋氨酸(m)。取代可以是保守取代或非保守取代。保守取代的实例为以下各组内的取代:碱性氨基酸(精氨酸,赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸),极性氨基酸(谷氨酰胺,天冬酰胺和苏氨酸),疏水性氨基酸(蛋氨酸,亮氨酸,异亮氨酸,半胱氨酸和缬氨酸),芳族氨基酸(苯丙氨酸,色氨酸和酪氨酸)和小氨基酸(甘氨酸,丙氨酸和丝氨酸)。
[0166]
关于蛋白质的氨基酸序列的“野生型”是指在自然界中存在的氨基酸序列。
[0167]
关于tdt变体的氨基酸序列,本文所用的“基序”是指在具体位置的tdt氨基酸序列的亚序列或区段,其在不同物种,特别是进化相关物种的tdt的氨基酸序列中是保守的(但可能是不相同的)。这种保守序列基序的实例描述于motea et al,biochim.biophys.acta.1804(5):1151-1166(2010);delarue et al,embo j.,21:427-439(2002)和类似的参考文献。示例性tdt基序包括(从n末端到c末端排序):fmr,vsc,ggfrr,kmt,ghd,tgsr,fer等。如本文所提及的,序列基序通过最常见的序列发生或共有序列,例如“tgsr”来鉴定,但是这样的命名并不意味着排除使用常规比对工具(如multalin(mitchell,bioinformatics,9(5):614-615(1993)))与tgsr比对的其它子序列。例如,“tgsr基序”包括与小鼠的区段“tgsr”比对的负鼠tdt的区段“sgsr”。在一些实施方案中,序列基序被定义为序列表达集合。例如,在一些实施方案中,fmr基序由fmr、flr和ymr组成的组中的序列组成。
[0168]
本技术不旨在限于所阐述的特定形式的范围,而是旨在涵盖本文中描述的变体方案的替代、修改和等同方案。此外,本技术的范围完全涵盖鉴于本技术内容对于本领域技术人员而言可以清楚获得的其它变化。本发明的范围仅由所附权利要求限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献