一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

末端脱氧核苷酸转移酶变体及其用途的制作方法

2022-03-19 12:31:47 来源:中国专利 TAG:

末端脱氧核苷酸转移酶变体及其用途
发明领域
本发明涉及末端脱氧核苷酸转移酶(tdt)变体及其在无模板的核酸序列的酶促合成中的用途。更具体地,本发明涉及适合掺入修饰的核苷酸以合成具有确定或可控序列(determined or controlled sequences)的核酸分子的此类变体。背景在过去的40年中,基于固相亚磷酰胺化学过程的核酸从头化学合成(de novo chemical synthesis)方法得到了广泛的使用和精进。该技术由四步骤的链延伸循环(chain elongation cycle)组成,其中每个循环将一个碱基添加到附接于固体支持基质的不断增长的寡核苷酸链上。尽管在过去的几十年中它一直是合成核酸的首选方法,但这个技术存在一些显著的局限性:它需要使用多种溶剂和试剂,并且由于化学反应效率的限制,合成寡核苷酸的长度通常不超过150-200个碱基。此外,这些短片段需要作进一步组装以提供所需的dna序列。化学合成的一个替代方案是使用不依赖模板的dna聚合酶,它将可逆终止子修饰的核苷酸添加到不断增长的核酸单链中。这允许以可控的方式在每个循环中添加一种类型的核苷酸。一些天然酶能够在无模板的情况下作用于天然核苷酸,因此可以以不可控的方式催化核酸的合成。然而,它们在掺入修饰的核苷酸方面,更具体地在掺入可逆终止子修饰的核苷酸方面效率特别低。人们已经在努力研发能够作用于修饰的核苷酸的新的dna聚合酶,但所得到的酶在任何类型的核酸合成的性能方面并不完全令人满意。到目前为止,只有少数能有效作用于单链dna(不使用模板)的dna聚合酶已获得鉴定。具有这种模板非依赖性活性的最具特征化的聚合酶是末端脱氧核苷酸转移酶(tdt)。tdt酶已广泛用于在各种类型应用中修饰单链dna,包括生物技术、生物医学研究和合成生物学。然而,天然tdt使用修饰的核苷酸的能力很差。人们已经进行若干尝试以研发具有用于掺入修饰的核苷酸的可接受性能的修饰的tdt。然而,这种修饰的核苷酸的掺入性能仍然是一个限制因素。掺入效率(incorporation efficiency)是推进合成总纯度和产率的关键参数。合成过程的这两个特征对核酸产品的质量、周转时间(turnaround time)和成本有显著影响。因此,需要研发出能够在无模板的情况下使用修饰的核苷酸的改进的tdt,以研发出高效且节省成本的核酸合成方法。


技术实现要素:

通过研究用于具有可控序列且不使用模板的多核苷酸的从头合成的tdt,本发明人已发现一些tdt催化结构域的靶向氨基酸残基可以经特异性地修饰以提高这类修饰的tdt在合成多核苷酸中的能力。更具体地,本发明人已研发出具有一种或多种靶向氨基酸取代的修饰的tdt,所述修饰的tdt使多核苷酸的酶促合成得以改进并使合成多核苷酸的总成本降低。本发明人先前研发了小鼠tdt变体(seq id no:1或seq id no:2)。通过进一步研究
tdt,本发明人现已研发出新的tdt变体。在一些实施例中,与野生型tdt(例如seq id no:10、12、14、16、18、20、22、24、26、28、30、32或34)和其n末端截短的包含tdt催化结构域的版本(例如seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35)相对比,每个修饰的tdt具有一个或多个靶向氨基酸取代。在一些实施例中,本发明的每个修饰的tdt的氨基酸序列与tdt的催化结构域(例如seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35)具有特定序列同一性百分比,并且具有一个或多个特定的氨基酸取代。本发明不依赖模板的聚合酶使酶促合成以更快的速度、更低的费用和更高的质量进行。因此,本发明的一个目的是提供末端脱氧核苷酸转移酶(tdt)变体,所述tdt变体包含tdt催化结构域的氨基酸序列或与tdt催化结构域有序列同一性百分比的氨基酸序列,如seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35所示,所述氨基酸序列在对应于残基c173(对于seq id no:11的氨基酸编号)或功能等效的残基的位置处具有至少一个氨基酸取代,所述tdt变体能够在无模板的情况下合成核酸片段并且能够将修饰的核苷酸(例如3'-o-修饰的核苷酸)掺入核酸片段中。具体地,所述修饰的核苷酸掺入到所述核酸片段的游离3
’‑
羟基上。更具体地,本发明的一个目的是提供末端脱氧核苷酸转移酶(tdt)变体,所述tdt变体包含与seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35具有至少90%同一性的氨基酸序列,所述氨基酸序列在对应于残基c173(对于seq id no:11、13、17、19、21、29或31)的位置处、在对应于残基c172(对于seq id no:15)的位置处、在对应于残基c178(对于seq id no:23)的位置处、在对应于残基c174(对于seq id no:25)的位置处、在对应于残基c171(对于seq id no:27)的位置处、在对应于残基c182(对于seq id no:33)的位置处或在对应于残基c176(对于seq id no:35)的位置处具有取代,其中所述tdt变体(i)能够在无模板的情况下合成核酸片段和(ii)能够将修饰的核苷酸(例如3'-o-修饰的核苷酸)掺入核酸片段中。在一些实施例中,以上同一性百分比值为与所指的seq id no具有至少95%同一性;在一些实施例中,以上同一性百分比值为至少97%同一性;在一些实施例中,以上同一性百分比值为至少98%同一性;在一些实施例中,以上同一性百分比值为至少99%同一性。有利地,关于(ii),这类修饰的核苷酸是可以掺入到核酸片段的游离3'-羟基上的3'-o-修饰的核苷酸。所述3'-o-修饰的核苷酸可以包含3
’‑
o-nh
2-核苷三磷酸、3
’‑
o-叠氮甲基-核苷三磷酸、3
’‑
o-烯丙基-核苷三磷酸、3'-o-(2-硝基苄基)-核苷三磷酸或3'-o-炔丙基-核苷三磷酸。在一个具体的实施例中,所述取代选自:c313g/r/p/a/v/s/n/q/d(对于seq id no:10)、c173g/r/p/a/v/s/n/q/d(对于seq id no:11)、c302g/r/p/a/v/s/n/q/d(对于seq id no:12)、c173g/r/p/a/v/s/n/q/d(对于seq id no:13)、c302g/r/p/a/v/s/n/q/d(对于seq id no:14)、c172g/r/p/a/v/s/n/q/d(对于seq id no:15)、c304g/r/p/a/v/s/n/q/d(对于seq id no:16)、c173g/r/p/a/v/s/n/q/d(对于seq id no:17)、c304g/r/p/a/v/s/n/q/d(对于seq id no:18)、c173g/r/p/a/v/s/n/q/d(对于seq id no:19)、c293g/r/p/a/v/s/n/q/d(对于seq id no:20)、c174g/r/p/a/v/s/n/q/d(对于seq id no:21)、c282g/r/p/a/v/s/n/q/d(对于seq id no:22)、c173g/r/p/a/v/s/n/q/d(对于seq id no:23)、c304g/r/p/a/v/s/n/q/d(对于seq id no:24)、
c174g/r/p/a/v/s/n/q/d(对于seq id no:25)、c300g/r/p/a/v/s/n/q/d(对于seq id no:26)、c171g/r/p/a/v/s/n/q/d(对于seq id no:27)、c305g/r/p/a/v/s/n/q/d(对于seq id no:28)、c173g/r/p/a/v/s/n/q/d(对于seq id no:29)、c302g/r/p/a/v/s/n/q/d(对于seq id no:30)、c173g/r/p/a/v/s/n/q/d(对于seq id no:31)、c313g/r/p/a/v/s/n/q/d(对于seq id no:32)、c182g/r/p/a/v/s/n/q/d(对于seq id no:33)、c271g/r/p/a/v/s/n/q/d(对于seq id no:34)、或c176g/r/p/a/v/s/n/q/d(对于seq id no:35)。在另一个实施例中,所述取代选自:c302g/r(对于seq id no:4)、c302g/r(对于seq id no:9)、c313g/r(对于seq id no:10)、c173g/r(对于seq id no:11)、c302g/r(对于seq id no:12)、c173g/r(对于seq id no:13)、c302g/r(对于seq id no:14)、c172g/r(对于seq id no:15)、c304g/r(对于seq id no:16)、c173g/r(对于seq id no:17)、c304g/r(对于seq id no:18)、c173g/r(对于seq id no:19)、c293g/r(对于seq id no:20)、c173g/r(对于seq id no:21)、c282g/r(对于seq id no:22)、c173g/r(对于seq id no:23)、c304g/r(对于seq id no:24)、c174g/r(对于seq id no:25)、c300g/r(对于seq id no:26)、c171g/r(对于seq id no:27)、c305g/r(对于seq id no:28)、c173g/r(对于seq id no:29)、c302g/r(对于seq id no:30)、c173g/r(对于seq id no:31)、c313g/r(对于seq id no:32)、c182g/r(对于seq id no:33)、c271g/r(对于seq id no:34)、或c176g/r(对于seq id no:35)。在一些实施例中,本发明涉及包含tdt变体的组合物,所述tdt变体包含与参考或野生型tdt序列具有至少90%同一性、在一些实施例中至少95%同一性、至少97%同一性、或在一些实施例中至少98%同一性或至少99%同一性的氨基酸序列,所述参考或野生型tdt序列选自由seq id no:11、13、15、17、19、21、23、25、27、29、31、33和35组成的组,其中这类tdt变体具有选自c173g/r/p/a/v/s/n/q/d、优选c173g/r的突变(其中氨基酸残基编号相对于seq id no:11,或相对于seq id no:13、15、17、19、21、23、25、27、29、31、33或35的等效残基编号),所述tdt变体(i)能够在无模板的情况下合成核酸片段以及(ii)这类tdt变体能够以高于参考或野生型tdt的效率或速率掺入3'-o-修饰的核苷酸三磷酸。在一些实施例中,本发明的一个目的是提供截短的末端脱氧核苷酸转移酶(tdt)变体,每个截短的tdt变体包含与seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35中的任一序列具有至少90%同一性的氨基酸序列,所述氨基酸序列具有至少两个氨基酸取代、优选至少三个氨基酸取代,所述氨基酸取代选自m63r/q、l131p、c173g/r、r207l/n、d250v、r325p/n和e328n/l/t/s,(其中残基编号相对于seq id no:11,或相对于seq id no:13、15、17、19、21、23、25、27、29、31、33或35中的功能等效残基编号),所述截短的tdt变体(i)能够在无模板的情况下合成核酸片段和(ii)能够将修饰的核苷酸掺入核酸片段中,例如将3'-o-可逆封闭的脱氧核苷三磷酸掺入到核酸片段的游离3
’‑
羟基上。在另外的实施例中,以上序列同一性百分比值为与指定序列相比,具有至少95%、96%、97%、98%或99%同一性。本发明的另一个目的是提供编码如上限定的tdt变体的核酸分子,和/或包含这种核酸分子的表达载体,和/或包含这种核酸分子或表达载体的宿主细胞。本发明另外的目的是提供生产根据本发明所述的tdt变体的方法,其中在允许表达编码所述变体的核酸的培养条件下,培养如上限定的宿主细胞,并且其中可选地回收所
述变体。本发明进一步涉及tdt变体在无模板的情况下通过向核酸片段连续添加一个或多个3'-o-修饰的核苷酸来合成核酸分子的用途。在一些实施例中,这种方法包括以下步骤:(a)提供包含具有游离3'-羟基的寡核苷酸的起始子;(b)在3
’‑
o-可逆封闭的核苷存在的情况下,在酶促延伸条件下使本发明的tdt变体与所述起始子或延长的起始子反应。在一些实施例中,这种方法进一步包括以下步骤:(c)解封所述延长的起始子以形成具有游离3
’‑
羟基的延长起始子和(d)重复步骤(b)和(c)直至合成预定序列的核酸分子。本发明的一个目的还在于提供在无模板的情况下合成核酸分子的方法,所述方法包括使核酸引物与至少一个核苷酸、优选至少一个3’o-修饰的核苷酸和根据本发明所述的tdt变体接触的步骤。本发明进一步提供一种用于进行核苷酸掺入反应的试剂盒,所述试剂盒包含根据本发明所述的tdt变体,一个或多个核苷酸、优选一个或多个3'o-修饰的核苷酸,和可选地至少一个核酸引物。
具体实施方式
dna聚合酶家族根据其序列同源性和晶体结构划分为7个家族。其中,polx家族聚合酶代表了从复制聚合酶到末端转移酶的多种聚合酶。polx家族聚合酶极广泛地存在于真核生物中。polx家族聚合酶涉及多种生物过程,尤其是dna损伤修复机制或错误纠正机制。polx家族包括聚合酶β(polβ)、聚合酶μ(polμ)、聚合酶λ(polλ)、来自酵母的聚合酶iv(pol iv)和末端脱氧核苷酸转移酶(tdt)。tdt天然地涉及dna修复和维持机制。尤其地,即使在无模板链的情况下,tdt也具有保持核苷酸聚合活性的独特能力。在特定条件且存在天然核苷酸的情况下,tdt能够在没有任何互补链的情况下将dna片段延长数百个核苷酸。然而,野生型tdt完全不能有效地掺入糖修饰的核苷酸。因此,本发明的目的是提供具有一个或多个靶向突变的tdt变体,所述tdt变体可在所述核苷酸片段的合成过程中将修饰的核苷酸掺入核酸片段中。更具体地,本发明人已鉴定出可以被有利地单独或组合取代的特定氨基酸残基,以提高酶合成具有预定序列的各种长度的核酸片段的能力,包括通过使用修饰的核苷酸。定义如本文所用,术语“突变体”和“变体”可互换地指代多肽,所述多肽与seq id no:11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35相关或由其衍生,并且在一个或多个(例如,几个)位置处包括修饰或改变,即取代、插入和/或缺失,以及在无模板情况下具有聚合酶活性和将3'-o-修饰的核苷三磷酸掺入核酸链的能力。所述变体可以通过本领域公知的各种技术获得。尤其地,用于改变编码野生型蛋白质的dna序列的技术的实例包括但不限于定点诱变、随机诱变和合成的寡核苷酸构建。诱变活性包括在蛋白质序列中或在本发明的聚合酶的情况下缺失、插入或取代一个或几个氨基酸。靶向氨基酸可以共存或沿着聚合酶的整个序列分布。例如,可以靶向特定的基序或结构特征。如本文所用,与位置或氨基酸相关的术语“修饰”或“改变”是指与野生型蛋白质的氨基酸相比,特定位置的氨基酸已被修饰。“取代”是指一个氨基酸残基被另一个氨基酸残基替代。优选地,术语“取代”是指一个氨基酸残基被另一个氨基酸残基取代,所述另一个氨基酸残基选自天然存在的20种标准氨基酸残基、稀有的天然存在的氨基酸残基(例如羟脯氨酸、羟基赖氨酸、别羟基赖氨酸、6-n-甲基赖氨酸、n-乙基甘氨酸、n-甲基甘氨酸、n-乙基天冬酰胺、别异亮氨酸、n-甲基异亮氨酸、n-甲基缬氨酸、焦谷氨酰胺(pyroglutamine)、氨基丁酸、鸟氨酸、正亮氨酸、正缬氨酸)和非天然存在的氨基酸残基(通常是合成的,例如环己基-丙氨酸)。优选地,术语“取代”是指一个氨基酸残基被另一个氨基酸残基取代,所述另一个氨基酸残基选自天然存在的20种标准氨基酸残基。符号“ ”表示取代的组合。根据以下命名法,本文中的氨基酸由它们的单字母或三字母代码表示:a:丙氨酸(ala);c:半胱氨酸(cys);d:天冬氨酸(asp);e:谷氨酸(glu);f:苯丙氨酸(phe);g:甘氨酸(gly);h:组氨酸(his);i:异亮氨酸(ile);k:赖氨酸(lys);l:亮氨酸(leu);m:蛋氨酸(met);n:天冬酰胺(asn);p:脯氨酸(pro);q:谷氨酰胺(gln);r:精氨酸(arg);s:丝氨酸(ser);t:苏氨酸(thr);v:缬氨酸(val);w:色氨酸(trp)和y:酪氨酸(tyr)。在本文件中,以下术语用于表示取代:l238a表示亲本序列第238位处的氨基酸残基(亮氨酸,l)变为丙氨酸(a)。a132v/i/m表示亲本序列第132位处的氨基酸残基(丙氨酸,a)被下列氨基酸之一取代:缬氨酸(v)、异亮氨酸(i)或蛋氨酸(m)。取代可以是保守的或非保守的取代。保守取代的实例在由以下组成的组的范围内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺、天冬酰胺和苏氨酸)、疏水性氨基酸(蛋氨酸、亮氨酸、异亮氨酸、半胱氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸和丝氨酸)。如本文所用,术语“序列同一性”或“同一性”是指两个多肽序列之间的匹配(相同氨基酸残基)的数量(或表示为百分比%的分数)。通过在比对时比较序列来确定序列同一性,比对是为了使交叉(overlap)和同一性最大化同时序列缺口(gap)最小化。尤其地,根据两个序列的长度,可以使用多种数学全局或局部比对算法中的任一种来确定序列同一性。相似长度的序列优选使用全局比对算法(例如尼德曼-温施算法;needleman和wunsch,1970)进行比对,该算法在整个长度上最优化地进行序列比对,而长度区别非常大的序列优选使用局部比对算法进行比对(例如史密斯-沃特曼算法(smith和waterman,1981)或altschul算法(altschul等人,1997;altschul等人,2005))。用于确定氨基酸序列同一性百分比的比对可以通过本领域技术范围内的各种方式实现,例如,使用可在互联网网站如http://blast.ncbi.nlm.nih.gov/或http://www.ebi.ac.uk/tools/emboss/上获得的公开可用的计算机软件。本领域的技术人员可以确定用于测量比对的适当参数,包括需要在被比较序列的全长范围实现最大比对的任何算法。出于本文的目的,%氨基酸序列同一性值是指使用成对序列比对程序emboss needle产生的值,该程序使用尼德曼-温施算法创建两个序列的最优全局比对,其中所有搜索参数设置为默认值,即评分矩阵=blosum62,空位开放=10,空位延伸=0.5,末端空位罚分=假值,末端空位开放=10和末端空位延伸=0.5。在本文中,术语“肽”、“多肽”、“蛋白质”、“酶”是指通过肽键连接的氨基酸链(无论形成所述链的氨基酸数量的多少)。除非另有说明,本技术中披露的位置参照指定的seq id no中列出的氨基酸序列
进行编号。tdt变体本发明提供tdt酶变体,所述tdt酶变体可用于在不使用模板链的情况下合成预定序列的多核苷酸,例如dna或rna。本发明的tdt变体可在酶介导的多核苷酸合成方法(例如hiatt等人,美国专利5763594中所描述)中使用修饰的核苷酸,尤其是3’o-修饰的核苷酸。在本发明的一些实施例中,“修饰的末端脱氧核糖核苷酸转移酶”、“修饰的tdt”、“末端脱氧核糖核苷酸转移酶变体”和“tdt变体”是指包含氨基酸区段的酶,所述氨基酸区段与seq id no:2、11、13、15、17、19、21、23、25、27、29、31、33或35中所列氨基酸序列之一具有至少80%同一性,至少一个氨基酸残基取代除外。在一些实施例中,tdt变体包含与seq id no:2、11、13、15、17、19、21、23、25、27、29、31、33、35具有至少90%同一性的氨基酸序列,至少一个氨基酸残基取代除外。在又其他的实施例中,tdt变体包含与seq id no:2、11、13、15、17、19、21、23、25、27、29、31、33、35具有至少95%同一性的氨基酸序列,至少一个氨基酸残基取代除外。在又其他的实施例中,tdt变体包含与seq id no:2、11、13、15、17、19、21、23、25、27、29、31、33、35具有至少97%、98%或99%同一性的氨基酸序列,至少一个氨基酸残基取代除外。在一些情况下,本发明的变体可以根据它们在特定残基上的突变来描述,其位置通过比对或参考seq id no来确定。“功能等效的残基”是指与功能等效的序列中的相应残基相比具有相同功能作用的tdt给定序列中的残基。在本发明的上下文中,选自seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35的每个tdt序列可被认为是其他任一序列的“功能等效的序列”。在一些实施例中,本发明包含末端脱氧核苷酸转移酶(tdt)变体,所述tdt变体包含与选自seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35的氨基酸序列具有至少80%、优选至少85%、90%、95%、97%、98%或99%同一性的氨基酸序列,所述氨基酸序列在对应于残基c173(对于seq id no:11)的功能等效的残基位置处具有至少一个氨基酸取代,所述tdt变体(i)能够在无模板的情况下合成核酸片段,和(ii)能够将3'-o-修饰的核苷三磷酸(例如3'-o-封闭的核苷三磷酸)掺入核酸片段中。实际上,本发明人已经发现这类取代对酶的表面性质和酶与核苷酸的相互作用性质均具有很大影响,从而可以使3'-o-修饰的核苷酸掺入核酸序列中。本发明tdt变体的进一步的实施例以条目列举在表1a至1c(单一取代)、表2a至2c(两个取代)、表3a至3c(三个取代)和表4a至4f(四个取代)中,其中每个这样的变体tdt由右列中指定的seq id no限定,该指定的seq id no被其同一行的左列中列出的取代修饰。“非野生型”取代是指取代可以是除了野生型序列、或(等效地)指定的seq id no的序列中指定位置处的氨基酸以外的任何氨基酸。表1a:第c173位(seq id no:11)或指定seq id no的功能等效位处的tdt变体以下处的非野生型
表1b:第c173位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
表1c:第c173位(seq id no: 11)或指定seq id no的功能等效位处的另一些tdt变体
表2a:第c173位(seq id no:11)和第m63位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
表2b:第c173位(seq id no:11)和第m63位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
表2c:第c173位(seq id no:11)和第m63位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体表3a:第c173位(seq id no:11)、第m63位(seq id no:11)和第r207位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
表3b:第c173位(seq id no:11)、第m63位(seq id no:11)和第r207位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
表3c:第c173位(seq id no:11)、第m63位(seq id no:11)和第r207位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
表4a:第c173位(seq id no:11)、第m63位(seq id no:11)、第r207位(seq id no:11)和第r324位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体no的功能等效位处的另一些tdt变体
表4b:第c173位(seq id no:11)、第m63位(seq id no:11)、第r207位(seq id no:11)和第r324位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
表4c:第c173位(seq id no:11)、第m63位(seq id no:11)、第r207位(seq id no:11)和第r324位(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体表4d:第c173位(seq id no:11)、第m63位(seq id no:11)、第r207位(seq id no:11)和第e327(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
表4e:第c173位(seq id no:11)、第m63位(seq id no:11)、第r207位(seq id no:11)和第e327(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
表4f:第c173位(seq id no:11)、第m63位(seq id no:11)、第r207位(seq id no:11)和第e327(seq id no:11)或指定seq id no的功能等效位处的另一些tdt变体
有利地,所述取代选自czzzg/r/p/a/v/s/n/q/d,其中czzz表示在seq id no:13、15、17、19、21、23、25、27、29、31、33和35中分别功能等效于seq id no:11的c173的氨基酸残基编号,所述取代优选地选自czzzg/r,其中czzz表示在seq id no:13、15、17、19、21、23、25、27、29、31、33和35中分别功能等效于seq id no:11的c173的氨基酸残基编号。在一个具体的实施例中,所述变体在对应于功能等效的残基的位置处进一步地包含至少一个氨基酸取代,所述功能等效的残基是选自seq id no:11的m63、r207、r324和e327的残基。根据本发明,如上披露的所有tdt变体都能够在无模板的情况下合成核酸片段并将修饰的核苷酸掺入核酸片段中。有利地,与seq id no:11、13、15、17、19、21、23、25、27、29、31、33和35的tdt相比,所述变体将修饰的核苷酸、优选3'o-修饰的核苷酸掺入核酸片段的能力提高。在上述一些实施例中,变体tdt掺入3'o-修饰的核苷三磷酸的效率是序列seq id no:11、13、15、17、19、21、23、25、27、29、31、33和35的野生型tdt的至少110%,在其他实施例中,变体tdt掺入3'o-修饰的核苷三磷酸的效率是序列seq id no:11、13、15、17、19、21、23、25、27、29、31、33和35的野生型tdt的至少150%;在其他实施例中,变体tdt掺入3'o-修饰的核苷三磷酸的效率是序列seq id no:11、13、15、17、19、21、23、25、27、29、31、33和35的野生型tdt的至少200%。在一个具体的实施例中,本发明的变体包含seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35的氨基酸序列和可选地在c末端或n末端的附加氨基酸片段。在另一个
实施例中,本发明的变体仅由seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35的氨基酸序列组成。根据本发明的另一个方面,所述末端脱氧核苷酸转移酶(tdt)变体包含如seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35所示的氨基酸序列,或包含与前述任一序列具有90%序列同一性、优选95%、96%、97%、98%、99%序列同一性的氨基酸序列,所述氨基酸序列具有选自m63r/q、l131p、c173g/r、r207l/n、d250v、r324p/n和e327n/l/t/s的至少三个氨基酸取代,或功能等效的残基,其中位置通过参考seq id no:11所示的氨基酸序列进行编号或直接按照本文其他地方所示的对于其单独的seq id no进行编号,所述tdt变体(i)能够在无模板的情况下合成核酸片段,和(ii)能够将3'-o-修饰的核苷酸掺入核酸片段中。例如,所述tdt变体包含与seq id no:11、13、15、17、19、21、23、25、27、29、31、33和35具有特定百分比以内的序列同一性的氨基酸序列,以及包含选自下组的取代组合或一种或多种功能等效的残基,该组由以下各项组成:m63r l131p r207l、m63r l131p r207n、m63r l131p d250v、m63r l131p r324p、m63r l131p r324a、m63r l131p e327l、m63r l131p e327n、m63r r207l d250v、m63r r207l r324p、m63r r207l r324a、m63r r207l e327l、m63r r207l e327n、m63r r207n d250v、m63r r207n r324p、m63r r207n r324a、m63r r207n e327l、m63r r207n e327n、m63r d250v r324p、m63r d250v r324a、m63r r324p e327l、m63r r324p e327n、m63r r324a e327l、m63r r324a e327n、m63q l131p r207l、m63q l131p r207n、m63q l13 ip d250v、m63q l131p r324p、m63q l131p r324a、m63q l131p e327l、m63q l131p e327n、m63q r207l d250v、m63q r207l r324p、m63q r207l r324a、m63q r207l e327l、m63q r207l e327n、m63q d250v r324p、m63q d250v r324a、m63q d250v e327l、m63q d250v e327n、m63q r324p e327l、m63q r324p e327n、m63q r324a e327l、m63q r324a e327n、l131p r207l d250v、l131p r207l r324a、l131p r207l e327l、l131p r207l e327n、l131p r207n d250v、l131p r207n r324p、l131p r207n r324a、l131p r207n e327l、l131p r207n e327n、l131p d250v r324p、l131p d250v r324a、l131p d250v e327l、l131p d250v e327n、l131p r324p e327l、l131p r324p e327n、l131p r324a e327l、l131p r324a e327n、r207l d250v r324p、r207l d250v r324a、r207l d250v e327l、r207l d250v e327n、r207l r324p e327l、r207l r324p e327n、r207l r324a e327l、r207l r324a e327n、r207n d250v r324p、r207n d250v r324a、r207n d250v e327l、r207n d250v e327n、r207n r324p e327l、r207n r324p e327n、r207n r324a e327l、r207n r324a e327n、d250v r324p e327l、d250v r324p e327n、d250v r324a e327l、d250v r324a e327n和r207l d250v r324p,其中以上位置编号相对于seq id no:11。在一个具体的实施例中,所述tdt变体包含与seq id no:11具有特定百分比以内的序列同一性的氨基酸序列,或功能等效的序列,所述序列具有取代组合r207l r324p e327l,或功能等效的残基。在一个具体的实施例中,所述tdt变体包含与seq id no:11具有特定百分比以内的序列同一性的氨基酸序列,或功能等效的序列,所述序列具有取代组合r207n r324a e327n,或功能等效的残基。
这种变体可在对应于选自l52、a108、l131、t340、g284、h287、e289、w450、r354和a510的残基(对于seq id no:11),或(在功能等效序列中)一个或多个功能等效的残基的位置处进一步地包含至少一个取代。如上文所披露,所述变体还可包含恒定突变组合l52f a108v r354k和/或g284l/s h287d e289a(对于seq id no:11),或(在功能等效序列中)功能等效的残基。根据另一个方面,本发明提供了末端脱氧核苷酸转移酶(tdt)变体,所述tdt变体包含与seq id no:11具有特定百分比以内的序列同一性的氨基酸序列,或功能等效的序列,所述序列具有选自m63r、m63q、l131p、r207l、r207n、d250v、r324p、r324a、e327l、e327n的至少一个氨基酸取代,或功能等效的残基,所述tdt变体(i)能够在无模板的情况下合成核酸片段,和(ii)能够将3'-o-修饰的核苷酸掺入核酸片段中。在另一个方面,本发明提供了末端脱氧核苷酸转移酶(tdt)变体,所述tdt变体包含与seq id no:11具有特定百分比以内的序列同一性的氨基酸序列,或功能等效的序列,所述序列具有选自下组的至少一个取代组合,或一个或多个功能等效的残基,该组由以下各项组成:m63r l131p、m63r r207l、m63r r207n、m63r d250v、m63r r324p、m63r r324a、m63r e327l、m63r e327n、m63q l131p、m63q r207l、m63q r207n、m63q d250v、m63q r324p、m63q r324a、m63q e327l、m63q e327n、l131p r207l、l131p r207n、l131p d250v、l131p r324p、l131p r324a、l131p e327l、l131p e327n、r207l d250v、r207l r324p、r207l r324a、r207l e327l、r207l e327n、r207n d250v、r207n r324p、r207n r324a、r207n e327l、r207n e327n、d250v r324p、d250v r324a、d250v e327l、d250v e327n、r324p e327l、r324p e327n、r324a e327l和r324a e327n,其中位置通过参考seq id no:11所示的氨基酸序列进行编号,所述tdt变体(i)能够在无模板的情况下合成核酸片段,和(ii)能够将3'-o-修饰的核苷酸掺入核酸片段中。根据一些实施例,tdt变体具有取代或如上所述的取代组合,并且具有与seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35具有至少80%以内同一性的氨基酸序列;在一些实施例中,这种氨基酸序列与seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35具有至少85%、90%、95%、96%、97%、98%或99%以内同一性。附加的修饰在一个实施例中,所述tdt变体在其n末端、c末端或两端进一步包括任何类型的标签肽(tagging peptide),例如his-tag序列。所述标签肽可用于纯化、鉴定、提高表达、分泌或提高催化活性。应当理解,在文献中广泛地描述了这类不同的标签,因此本发明涵盖技术人员已知的所有标签。本发明的变体还可在用于例如纯化重组聚合酶的蛋白质的n末端和/或c末端区域包括一种或多种外源或异源特征。本发明的变体可进一步地包含第c378至l406位之间的残基取代,其中位置通过参考seq id no:1所示的氨基酸序列进行编号,或包含功能等效的残基取代(序列seq id no:3的polμ聚合酶的残基h363至c390的取代),其中位置通过参考seq id no:3所示的氨基酸序列或功能等效的残基进行编号。有利地,所述tdt变体包含至少一个氨基酸序列seq id no:11、13、15、17、19、21、23、25、27、29、31、33或35,所述氨基酸序列具有所披露的一个或多个取代和序列同一性百
分比值。核酸、表达盒、载体本发明的另一个目的是提供编码本发明变体的核酸分子。如本文所用,术语“核酸”、“核酸序列”、“多核苷酸”、“寡核苷酸”和“核苷酸序列”可互换使用,是指脱氧核糖核苷酸和/或核糖核苷酸的序列。在一个实施例中,所述核酸是dna。在一个替代性的实施例中,所述核酸是rna。在一个替代性的实施例中,所述核酸是xna。所述核酸可以是单链形式或双链形式或两者的混合物。它可以是重组的、人工的和/或合成来源的,并且它可以包含修饰的核苷酸。这类修饰可以是天然修饰(例如表观遗传修饰),或非天然修饰(例如标记、修饰键(modified bond)、修饰的嘌呤或嘧啶碱基或修饰的糖)。在一个实施例中,所述核酸分子是带有天然存在的表观遗传修饰例如甲基化、羟甲基化、甲酰化或5-羧化的dna、rna或xna。在一个实施例中,所述核酸分子是带有非天然存在的修饰例如荧光标签、荧光标记、相互作用基团的dna、rna或xna。本发明的核酸可以是分离的或纯化的形式,并通过本领域本身已知的技术(例如cdna文库的克隆和表达、扩增、酶促合成或重组技术)制备、分离和/或操作。所述核酸也可以通过已知的化学合成技术(例如belousov(1997)nucleic acids res[核酸研究].25:3440-3444中所述)在体外合成。本发明还包括在严格条件下与编码如上限定的tdt变体的核酸杂交的核酸。优选地,这种严格条件包括在约42℃下将杂交过滤器在2x ssc/0.1%sds中孵育约2.5小时,然后在65℃下在1x ssc/0.1%sds中洗涤过滤器4次,每次15分钟。使用的方案在如下参考文献中有描述:sambrook等人(molecular cloning:a laboratory manual[分子克隆:实验室手册],冷泉港出版社,纽约冷泉港(1988))和ausubel(current protocols in molecular biology[当前的分子生物学实验方案](1989))。本发明还包括编码本发明的tdt变体的核酸,其中所述核酸的序列,或至少所述序列的一部分,已经利用优化的密码子使用(codon usage)进行了工程化。替代性地,根据本发明的核酸可以从根据本发明的tdt变体的序列推导出来,并且可以根据宿主细胞(核酸会在其中转录)来调整密码子使用。这些步骤可以根据本领域技术人员熟知的方法进行,其中一些方法在sambrook等人的参考手册中有描述(sambrook等人,2001年)。在一个实施例中,核酸分子是长度大于50、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、15000、20000、30000、40000、50000或100000个核苷酸的聚合物分子。本发明的核酸可进一步地包含附加的核苷酸序列,例如调节区,即可用于引起或调节多肽在选定宿主细胞或系统中的表达的启动子、增强子、沉默子、终止子、信号肽等。本发明进一步地涉及包含根据本发明所述的核酸的表达盒,所述核酸与一个或多个控制序列(control sequence)可操作地连接,所述控制序列指导所述核酸在合适宿主细胞中的表达。典型地,表达盒包含与控制序列(例如转录启动子和/或转录终止子)可操作地连接的根据本发明所述的核酸,或由所述核酸组成。控制序列可以包括被宿主细胞或体外表达系统识别的启动子,所述体外表达系统用于表达编码本发明的tdt变体的核酸。启动子包含介导酶表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷
酸,包括突变、截短和杂合启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。控制序列也可以是被宿主细胞识别以终止转录的转录终止子。终止子可操作地连接到编码酯酶的核酸的3'-末端。在宿主细胞中有功能的任何终止子可以用于本发明中。典型地,表达盒包含与转录启动子和转录终止子可操作地连接的根据本发明所述的核酸,或由所述核酸组成。本发明还涉及包含如上限定的核酸或表达盒的载体。术语“载体”是指用作将重组遗传物质转移到宿主细胞中的载体的dna分子。载体的主要类型是质粒、噬菌体、病毒、黏粒(cosmid)和人工染色体。载体本身通常是由插入片段(异源核酸序列,转基因)和作为载体“骨架”的较大序列组成的dna序列。典型地,将遗传信息传递给宿主的载体用于在靶细胞中分离、扩增或表达插入物。称为表达载体(表达构建体)的载体专门用于在靶细胞中表达异源序列,并且通常具有驱动编码多肽的异源序列表达的启动子序列。通常地,存在于表达载体中的调控元件包括转录启动子、核糖体结合位点、终止子和可选地存在的操纵子。优选地,表达载体还包含用于在宿主细胞中自主复制的复制起点、选择标记、有限数量的有用的限制酶位点和高拷贝数的潜力。表达载体例如是克隆载体、修饰的克隆载体、专门设计的质粒和病毒。在不同宿主中提供合适水平的多肽表达的表达载体是本领域公知的。典型地,载体的选择将取决于载体与要引入该载体的宿主细胞的相容性。本发明的另一个目的是提供包含如上所述的核酸、表达盒或载体的宿主细胞。因此,本发明涉及根据本发明所述的核酸、表达盒或载体转化、转染或转导宿主细胞的用途。典型地,载体的选择将取决于载体与必须引入该载体的宿主细胞的相容性。根据本发明,可以以瞬时或稳定的方式转化、转染或转导宿主细胞。将本发明的表达盒或载体引入宿主细胞中,从而所述表达盒或载体作为染色体整合体(chromosomal integrant)或自我复制的染色体外载体(self-replicating extra-chromosomal vector)保持。术语“宿主细胞”还包括因复制期间出现的突变而与亲本宿主细胞不完全相同的亲本宿主细胞的任何子代。宿主细胞可以是在产生本发明的变体中有用的任何细胞,例如原核生物或真核生物。原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。宿主细胞也可以是真核细胞,例如酵母、真菌、哺乳动物、昆虫或植物细胞。根据本发明所述的核酸、表达盒或表达载体可以通过技术人员已知的任何方法导入宿主细胞,例如电穿孔、缀合、转导、感受态细胞转化、原生质体转化、原生质体融合、生物射弹“基因枪”转化、peg介导的转化、脂质辅助转化或转染、化学介导的转染、醋酸锂介导的转化、脂质体介导的转化。可选地,可以将本发明的核酸、表达盒或载体的一个以上的拷贝插入宿主细胞以增加所述变体的产量。修饰的核苷酸根据本发明,所述tdt变体能够掺入修饰的核苷酸、优选地修饰的3'o-核苷酸、更优选地3'o-封闭的核苷酸。在本发明的上下文中,表述“修饰的核苷酸”是指包含与三个磷酸基团结合的核苷(即附接到脱氧核糖或核糖分子的碱基)的分子,所述磷酸基团在其以下末端之一具有至少一个附加基团:2'、3'、5'或碱基。所述附加基团通过阻断任何磷酸二酯键的形成(3'o-修
饰、2'或2'o修饰)或通过空间上阻断聚合酶附接到任何在其3'末端包含这种修饰的核苷酸(5'或碱基修饰)的核酸片段,来阻断核苷酸的进一步添加。此外,所述附加基团具有有利的可逆性质,使得该基团可通过特定的裂解反应被去除。例如含脱氧核糖的核苷酸的核苷三磷酸(nucleoside triphosphate或nucleotide triphosphate)包括脱氧腺苷三磷酸(datp)、脱氧鸟苷三磷酸(dgtp)、脱氧胞苷三磷酸(dctp)或脱氧胸苷三磷酸(dttp)。含核糖的核苷三磷酸的进一步实例是腺苷三磷酸(atp)、鸟苷三磷酸(gtp)、胞苷三磷酸(ctp)或尿苷三磷酸(utp)。其他类型的核苷可以与三个磷酸结合形成核苷三磷酸,例如天然存在的修饰的核苷和人工核苷。在一个具体的实施例中,所述修饰的核苷酸是3'o-封闭的核苷酸,其包含可逆地附接到核苷三磷酸的3'末端以阻断进一步核苷酸添加的基团。所述基团可以具有不同的化学性质,例如叠氮甲基、氨氧基和烯丙基。有利地,所述修饰的核苷酸选自3'-o-nh
2-核苷三磷酸、3'-o-叠氮甲基-核苷三磷酸、3'-o-烯丙基-核苷三磷酸、3'o-(2-硝基苄基)-核苷三磷酸或3'-o-炔丙基-核苷三磷酸。
[0022]
在一些实施例中,修饰的核苷酸包含修饰的核苷酸或核苷分子,所述修饰的核苷酸或核苷分子包含嘌呤或嘧啶碱基和核糖或脱氧核糖部分,所述核糖或脱氧核糖部分具有与其共价连接的可去除的3'-oh封闭基团,使得3'碳原子附接到该结构的基团:-o-z其中-z是-c(r')2-0-r"、-c(r')2-n(r")2、-c(r')2-n(h)r"、-c(r')2-s-r"和-c(r')2-f中任一项,其中每个r"是或是可去除保护基团的一部分;每个r'独立地是氢原子、烷基、取代的烷基、芳烷基、烯基、炔基、芳基、杂芳基、杂环、酰基、氰基、烷氧基、芳氧基、杂芳氧基或酰胺基,或通过连接基团(linking group)附接的可检测标记;条件是在一些实施例中,这类取代基具有最多10个碳原子和/或最多5个氧或氮杂原子;或(r')2表示式=c(r”')2的亚烷基,其中每个r”'可以相同或不同,并且选自包含氢和卤素原子以及烷基的组,条件是在一些实施例中,每个r”'的烷基具有1至3个碳原子;且其中所述分子可以反应以产生中间体,其中每个r"替换为h,或者当z是-(r')2-f时,f替换为oh、sh或nh2,优选oh,其中中间体在水性条件下解离以提供具有游离3'-oh的分子;条件是当z是-c(r')2-s-r"时,两个r'基团都不是h。在某些实施例中,修饰的核苷酸或核苷的r'是烷基或取代的烷基,条件是这种烷基或取代的烷基具有1至10个碳原子和0至4个氧或氮杂原子。在某些实施例中,修饰的核苷酸或核苷的-z具有式-c(r')
2-n3。在某些实施例中,z是叠氮甲基。
[0023]
在一些实施例中,z是具有或不具有杂原子的分子量为200或更小的可裂解有机部分。在其他实施例中,z是具有或不具有杂原子的分子量为100或更小的可裂解有机部分。在其他实施例中,z是具有或不具有杂原子的分子量为50或更小的可裂解有机部分。在另外的具体的实施例中,“3'o修饰的核苷酸”是指在3'末端带有3'-o-甲基、3'-叠氮基、3'-o-叠氮甲基、3'-o-氨基、3'-氨氧基或3'-o-烯丙基的核苷三磷酸。在另一个实施例中,3'-封闭的核苷三磷酸被3'-o-叠氮甲基、3'-氨氧基或3'-o-烯丙基封闭。在其他实施例中,“3'o修饰的核苷酸”是指在3'末端带有酯、醚、腈、磷酸盐、碳酸盐、氨基甲酸酯、羟胺、硼酸盐、硝酸盐、糖、磷酰胺、氨基磷酸酯、苯次磺酸酯、硫酸盐、砜或氨基酸的核苷三磷酸。在一些实施例中,前述3'-o-封端基团的分子量为100或更小。
在另一个实施例中,本发明的3'-o-封端基团包括甲基、3'-o-(2-硝基苄基)、烯丙基、胺、叠氮甲基、叔-丁氧基乙氧基或炔丙基。在另外的具体的实施例中,“3’o修饰的核苷酸”是指具有终止子效应子修饰基团的核苷三磷酸,例如在wo 2016034807中描述的那些。有趣的是,与野生型tdt相比,本发明的变体表现出对修饰的核苷酸更高的亲和力,从而在核酸合成过程中将这种修饰的核苷酸掺入核酸序列中的能力增加。更具体地,本发明的变体能够使用和在核酸序列中掺入修饰的3'o-核苷酸(更具体地,3'o-封闭的核苷酸),这对于野生型tdt而言是不可能的(参见knapp等人,chem.eur.j.[欧洲化学期刊],2011,17:2903)。根据一个具体的方面,本发明涉及能够在核酸酶促合成过程中与修饰的核苷酸共作用,尤其是与3'o-修饰的核苷酸(例如,3'o-封闭的核苷酸)共作用,并且具有产生长的核酸分子或核酸分子的衍生物的能力的tdt变体。核酸的酶促合成本发明的目的是提供可用于合成核酸的tdt变体,核酸的合成例如在以下文献有描述:ybert等人,wo 2015/159023;jensen等人,biochemistry[生物化学],57:1821-1832(2018);hiatt等人,美国专利5808045。更具体地,本发明的目的是提供适合将修饰的核苷酸添加到起始核酸链的tdt变体。然后可以将封闭基团去除以允许添加新的修饰的核苷酸。根据本发明,通过使用本发明的变体,可以进行包括加成和脱保护的连续循环。因此,该过程将允许添加可逆修饰的核苷酸和进一步去除封闭基团的多个循环,以允许起始核酸链受控地延长至限定序列。本发明考虑在任何酶促核酸合成过程中使用根据本发明所述的修饰的tdt。因此,本发明的一个目的是提供一种合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:a)提供具有含游离3'-羟基的3'-末端核苷酸的起始子;b)重复以下循环:(i)在延伸条件下,使所述起始子或具有游离3'-o-羟基的延长片段与3'-o-封闭的核苷三磷酸和本发明的tdt变体接触,使得所述起始子或延长片段通过3'-o-封闭的核苷三磷酸的掺入形成3'-o-封闭的延长片段得以延长,以及(ii)将所述延长片段解封以形成具有游离3'-羟基的延长片段,直至形成多核苷酸。本发明的目的还在于提供在无模板的情况下合成核酸分子的方法,所述方法包括使核酸引物与至少一个核苷酸、优选至少一个3'o-修饰的核苷酸和本发明的变体接触的步骤。本发明考虑了酶促核酸合成过程的概念。在这样的过程中,核酸分子在没有任何模板链的情况下从头合成。因此,借助本发明的变体,核苷酸的有序序列与起始子核酸片段偶联。应当理解,每个核苷酸与增长的核酸链的定量偶联和更普遍的高偶联效率是非常重要的。还应当理解的是,非终止子核苷酸,例如天然核苷酸或永久标记的核苷酸,将不允许对合成的序列进行任何控制,并且会导致例如不受控制且不想要的多聚加成(poly-addition)。在一些实施例中,合成多核苷酸的方法包括以下步骤:(a)提供具有游离3'-羟基的起始子;(b)在延伸条件下,在3'-o-封闭的核苷三磷酸存在的情况下,使所述起始子或具
有游离3'-羟基的延伸中间体与本发明的tdt变体反应,以产生3'-o-封闭的延伸中间体;(c)将延伸中间体解封闭以产生具有游离3'-羟基的延伸中间体;以及(d)重复步骤(b)和(c)直到合成多核苷酸。在一些实施例中,合成多核苷酸的方法包括以下步骤:(a)提供附接于固体支持物的起始子,所述起始子是具有游离3'-羟基的寡核苷酸;(b)在延伸条件下,在3'-o-封闭的核苷三磷酸存在的情况下,使所述起始子或具有游离3'-羟基的延伸中间体与本发明的tdt变体反应,以产生3'-o-封闭的延伸中间体;(c)洗涤固体支持物以去除未掺入的3'-o-封闭的核苷三磷酸;(d)通过将固体支持物暴露于解封剂中来解封延伸中间体,以产生具有游离3'-羟基的延伸中间体;以及(e)重复步骤(b)和(d)直到合成多核苷酸。所述方法可以包括从固体支持物上裂解完成的多核苷酸的另外的步骤。在一些实施例中,对于tdt催化的加成反应,酶促条件可包含约0.20至约200μm的具有保护3'-羟基的可去除的封闭部分的核苷酸和约0.20至200μm的源自起始底物的游离且未修饰的3'-羟基。在一些实施例中,反应缓冲液含有约10至约500mm二甲胂酸钾缓冲液(ph在6.5至7.5之间)和约0.01至约10mm二价阳离子(例如,cocl2或mncl2)。其他缓冲组合物和组分可适用于本发明的具体所需的实施例。在本发明的上下文中,表述“裂解反应”是指物质或物理条件所产生的任何作用,它能够裂解在先前描述的可逆修饰的核苷酸上的附加基团。本领域技术人员能够确定任何先前列出的基团的裂解反应。在一个实施例中,裂解剂是化学裂解剂。在一个替代性的实施例中,裂解剂是酶促裂解剂。本领域技术人员将理解,裂解剂的选择取决于所使用的3'-核苷酸封闭基团的类型。例如,三(2-羧乙基)膦(tcep)可用于裂解3'o-叠氮甲基,钯复合物可用于裂解3'o-烯丙基,或亚硝酸钠可用于裂解3'o-氨基。在具体的实施例中,裂解反应包括:tcep、钯复合物或亚硝酸钠。在具体的实施例中,裂解反应在诸如变性剂(例如尿素、氯化胍、甲酰胺或甜菜碱)的附加组分存在的情况下进行。在另一个实施例中,裂解反应使用一种或多种缓冲液进行。本领域技术人员将理解,裂解剂的选择取决于反应的确切机制。本发明涉及具有以定量方式掺入修饰的核苷酸的能力的tdt变体。“定量方式”或“定量反应”是指反应完成,即反应物完全转化为产物。以定量方式掺入可逆修饰的核苷酸的聚合酶是这样的一种聚合酶,它能够使用所有可用的核苷酸来延长每个核酸片段,从而将所有长度为n的起始片段转化为长度为n 1的片段。如本文所用,“起始片段(initiating fragment)”是指具有游离3'末端的可被进一步延长的短寡核苷酸序列。在一个实施例中,起始片段是dna起始片段。在一个替代性的实施例中,起始片段是rna起始片段。在一个实施例中,起始片段具有3至100个核苷酸,尤其是3至20个核苷酸。在一个实施例中,起始片段是单链的。在一个替代性的实施例中,起始片段是双链的。在一个实施例中,起始片段固定在固体支持物上。起始片段可以通过各种方法附接到固体支持物上,从而使片段稳定地经受各种酶促或合成反应条件。
在一个实施例中,起始片段通过可逆相互作用部分(例如化学裂解的接头、抗体/免疫原性表位、生物素/生物素结合蛋白或谷胱甘肽-gst标签)固定在固体支持物上。在另一个实施例中,起始片段通过可化学裂解接头(例如二硫化物、烯丙基或叠氮化物掩蔽的半胺醛醚(hemiaminal ether)接头)固定在固体支持物上。在起始片段中,固定部分包含至少一个限制性位点。文献中描述了使用限制性内切酶和限制性酶切位点在特定位点选择性水解核酸链。任何技术人员都能够选择会与起始片段切割位点序列相匹配的适当限制性内切酶。在一个替代性的实施例中,起始片段包含至少一个尿苷。使用尿嘧啶-dna糖基化酶(udg)处理会产生无碱基位点。使用无嘌呤/无嘧啶(ap)位点核酸内切酶处理合适的底物将提取核酸链。应用本文描述了tdt变体用于核酸合成、寡核苷酸合成、探针合成、贴标签、核酸扩增、适配体(aptamers)、治疗性核酸分子、药物靶点发现和验证、疾病诊断、代谢工程化、数据存储、作物改良、文库设计、测序池(sequencing pools)、核酸标记或附着或任何其他涉及核酸分子应用的用途。tdt变体的产生本发明的变体可以通过突变已知的参考或野生型tdt编码多核苷酸,然后使用常规分子生物学技术使其表达来产生。例如,小鼠tdt基因(seq id no:1)可以使用常规分子生物学技术从合成片段组装(例如可以使用以下文献描述的方案:stemmer等人,gene[基因],164:49-53(1995);kodumal等人,proc.natl.acad.sci.[美国科学院院报],101:15573-15578(2004)等),或可以使用以下文献描述的方案直接从小鼠细胞中克隆:boule等人,mol.biotechnology[分子生物技术],10:199-208(1998)或bentolila等人,embo j.[欧洲分子生物学组织期刊],14:4221-4229(1995)等。例如,可以将分离的tdt基因插入到表达载体(例如pet32(诺瓦根公司(novagen))中,得到载体pctdt,然后可以使用常规方案将载体pctdt用于制造和表达tdt蛋白变体。具有正确序列的载体可以转化到大肠杆菌生产菌株中。使用常规技术将转化菌株培养成沉淀,从中提取tdt蛋白。例如,先前制备的沉淀在30℃至37℃的水浴中解冻。完全解冻后,立即将沉淀重悬于裂解缓冲液中,裂解缓冲液由50mm tris-hcl(西格玛公司(sigma))ph 7.5、150mm nacl(西格玛公司)、0.5mm巯基乙醇(西格玛公司)、5%甘油(西格玛公司)、20mm咪唑(西格玛公司)和用于100ml蛋白酶混合物抑制剂的一个标签(赛默飞世尔公司(thermofisher))组成。仔细进行重悬以避免过早裂解和聚集体残留。重悬细胞通过弗氏压碎器的几个循环进行裂解,直到达到全色均一性(full color homogeneity)。通常使用的压力为14,000psi。然后将裂解物以10,000rpm的速度离心1h至1h 30min。在柱纯化之前,离心分离物(centrifugate)通过0.2μm过滤器以去除任何碎片。tdt蛋白可以通过一步式亲和性工艺从离心分离物中纯化出来。例如,使用ni-nta亲和柱(ge医疗公司(ge healthcare))结合聚合酶。首先,柱已经用15个柱体积的50mm tris-hcl(西格玛公司)ph 7.5、150mm nacl(西格玛公司)和20mm咪唑(西格玛公司)洗涤和平衡。聚合酶在平衡后与柱结合。然后将洗涤缓冲液施加到15个柱体积的柱上,该洗涤缓冲
液由50mm tris-hcl(西格玛公司)ph 7.5、500mm nacl(西格玛公司)和20mm咪唑(西格玛公司)组成。洗涤后,使用50mm tris-hcl(西格玛公司)ph 7.5、500mm nacl(西格玛公司)和0.5m咪唑(西格玛公司)洗脱聚合酶。收集与最高浓度的目标聚合酶相对应的馏分并将其汇合在单个样品中。汇合的馏分用透析缓冲液(20mm tris-hcl,ph 6.8,200mm nacl,50mm mgoac,100mm[nh4]2so4)进行透析。随后借助浓缩过滤器(amicon ultra-30,默克密理愽公司(merk millipore))浓缩透析液。将浓缩的酶分成小份等分试样,最后添加50%的甘油,然后将这些等分试样在-20℃下冷冻并长期储存。在sdspage凝胶中分析5μl纯化酶的不同馏分。试剂盒、酶和核苷酸组合物本发明的一个具体方面涉及包含根据本发明所述的tdt变体的组合物和试剂盒的用途,或本发明的任何具体方面,可选地涉及选自以下的一种或多种组分的任意组合:起始片段、一个或多个可逆终止子核苷酸、用于裂解反应的其他酶和试剂。所述试剂盒可用于酶促核酸合成方法。本发明涵盖包含根据本发明或本发明任何具体方面所述的tdt变体的物质组合物,所述tdt变体以适当的缓冲液和比例浓度与可逆修饰的核苷酸混合。实例实例1-根据本发明所述的tdt变体的产生、表达和纯化表达菌株的产生小鼠tdt基因是由pet28质粒产生的,如以下文献所描述:boul
é
等人,1998,mol.biotechnol.[分子生物技术],10,199-208。通过标准分子生物技术使用以下引物扩增序列seq id no:4(tag tdt):
·
t7前端:taatacgactcactataggg(seq id no:5)
·
t7末端:gctagttattgctcagcgg(seq id no:6)ο然后将该序列克隆到质粒pet32骨架中以产生新的pctdt质粒。测序后,将pctdt转化到商用大肠杆菌细胞,bl21(de3,来自诺瓦根公司)。在含卡那霉素的平板上生长的菌落被分离并命名为ec-ctdt。聚合酶变体的产生pctdt载体用作起始载体。包含一个或多个点突变的特定引物由安捷伦公司(agilent)在线软件生成(http://www.genomics.agilent.com:80/primerdesignprogram.jsp)。市售可得的试剂盒quickchange ii(安捷伦公司)已被用于生成所需的包含靶向突变的修饰的聚合酶。实验步骤遵照供应商的方案。在生成不同的载体之后,已对其中的每一个进行测序。如前所述,具有正确序列的载体已在大肠杆菌生产菌株中转化。分离出能够在卡那霉素lb琼脂平板上生长的克隆。表达ec-ctdt和ec-clone的菌株用于接种含50ml lb培养基的250ml锥形烧瓶(erlens),lb培养基中补充有适量卡那霉素。在37℃下过夜生长后,使用适当体积的这些预培养物接种含2l lb培养基的5l锥形烧瓶,lb培养基含卡那霉素。5l培养物的初始od选择为0.01。将锥形烧瓶在剧烈摇动下置于37℃,定期检查不同培养物的od。在达到介于0.6和0.9之间的od后,通过添加1ml的1m iptg(异丙基β-d-1-硫代吡喃半乳糖苷,西格玛公司)来补
充每个锥形烧瓶。将培养瓶重新置于37℃的受控温度下并摇动。过夜表达后,将细胞以几个沉淀收集。将表达相同变体的沉淀汇合并储存在-20℃下,最终可保存数月。提取先前制备的沉淀在30℃至37℃的水浴中解冻。完全解冻后,立即将沉淀重悬于裂解缓冲液中,裂解缓冲液由50mm tris-hcl(西格玛公司)ph 7.5、150mm nacl(西格玛公司)、0.5mm巯基乙醇(西格玛公司)、5%甘油(西格玛公司)、20mm咪唑(西格玛公司)和用于100ml蛋白酶混合物抑制剂的一个标签(赛默飞世尔公司)组成。仔细进行重悬以避免过早裂解和聚集体残留。重悬细胞通过弗氏压碎器的几个循环进行裂解,直到达到全色均一性。通常使用的压力为14,000psi。然后将裂解物以10,000rpm的速度离心1h至1h 30min。在柱纯化之前,离心分离物通过0.2μm过滤器以去除任何碎片。纯化使用一步式亲和步骤纯化产生并提取的聚合酶。使用ni-nta亲和柱(ge医疗公司)结合聚合酶。首先,柱已经用15个柱体积的50mm tris-hcl(西格玛公司)ph 7.5、150mm nacl(西格玛公司)和20mm咪唑(西格玛公司)洗涤和平衡。聚合酶在平衡后与柱结合。然后将洗涤缓冲液施加到15个柱体积的柱上,该洗涤缓冲液由50mm tris-hcl(西格玛公司)ph 7.5、500mm nacl(西格玛公司)和20mm咪唑(西格玛公司)组成。洗涤后,使用50mm tris-hcl(西格玛公司)ph 7.5、500mm nacl(西格玛公司)和0.5m咪唑(西格玛公司)洗脱聚合酶。收集与最高浓度的目标聚合酶相对应的馏分并将其汇合在单个样品中。汇合的馏分用透析缓冲液(20mm tris-hcl,ph 6.8,200mm nacl,50mm mgoac,100mm[nh4]2so4)进行透析。随后借助浓缩过滤器(amicon ultra-30,默克密理愽公司)浓缩透析液。将浓缩的酶分成小份等分试样,最后添加50%的甘油,然后将这些等分试样在-20℃下冷冻并长期储存。在sds-page凝胶中分析5μl纯化酶的不同馏分。实例2-用荧光引物评估tdt变体的活性活性测试根据实例1产生、表达和纯化的tdt变体的延伸性能通过以下测定进行评估。将所有结果相互比较,并与野生型tdt酶以及没有任何聚合酶的对照试管进行比较。表5:活性测试活性测试活性缓冲液包含例如补充有cocl2的tdt反应缓冲液(可从美国纽英伦生物技术公
司(new england biolabs)获得)。使用的引物如下:5'-aaaaaaaaaaaaaagggg-3'(seq id no:7)该引物的5'末端也有atto荧光染料。使用的核苷酸(在表5中表示为dntp)是3'-o-氨基-2',3'-二脱氧核苷酸-5'-三磷酸(onh2,火鸟生物科学(firebird biosciences)),例如3'-o-氨基-2',3'-二脱氧腺苷-5'-三磷酸。对于测试的每个不同变体,各使用一个试管进行反应。首先添加水,然后按照表5的顺序将试剂添加到试管中。在37℃下30分钟后,通过添加甲酰胺(西格玛公司)终止反应。分析分析涉及聚丙烯酰胺凝胶分析。活性测试的样品通过聚丙烯酰胺16%(伯乐公司(biorad))变性凝胶进行分析。凝胶是就在分析前通过将聚丙烯酰胺倒入玻璃板中使其聚合而制成的。将玻璃板内的凝胶安装在填充有tbe缓冲液(西格玛公司)的适配槽(adapted tank)上,以进行电泳步骤。待分析的样品加样在凝胶的上面。在室温下,在凝胶的顶部和底部之间施加500至2,000v的电压,持续3至6小时。根据样品目标大小移动后,将系统拆卸,并通过使用typhoon仪器(ge生命科学公司)扫描凝胶荧光。图像采集后,使用imagej软件(imagej.nih.gov/ij/)分析修饰的核苷酸的掺入百分比。实例3-用未标记引物评估tdt变体的活性活性测试根据实例1产生、表达和纯化的变体5的延伸性能通过以下测定进行评估。所有结果与从以前的研究中获得的参考变体(seq id no:9)以及没有任何聚合酶的对照试管进行比较。表6:活性测试试剂浓度体积h2o-12μl活性缓冲液10x2μldntp250μm2μl纯化的酶20μm2μl荧光引物dna500nm2μl使用的引物如下:5'-ttttttttttttaaataagg-3'(seq id no:8)使用的核苷酸(在表6中表示为dntp)是3'-o-氨基-2',3'-二脱氧核苷酸-5'-三磷酸(onh2,火鸟生物科学公司),例如像3'-o-氨基-2',3'-二脱氧腺苷-5'-三磷酸。对于测试的每个变体,各使用一个试管进行反应。首先添加水,然后按照表6的顺序将试剂添加到试管中。在37℃下30分钟后,通过添加甲酰胺(西格玛公司)终止反应。分析分析使用了液相色谱和质谱仪检测和定量法(lc/ms)。活性测试的样品通过lc/ms进行分析。将样品加样到lc/ms仪器并执行标准的寡核苷酸分离方法。数据采集后进行解卷积和光谱计算。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献