一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种包含甲苯双加氧酶编码序列的多核苷酸和表达盒及其应用的制作方法

2022-07-10 10:15:59 来源:中国专利 TAG:


1.本发明属于生物工程与医药化工生产领域。具体地,本发明提供一种多核苷酸,其包含甲苯双加氧酶的编码序列。本发明还提供包含所述多核苷酸的表达盒、载体和宿主细胞,以及其在制备顺式环己二烯邻二醇类化合物中的应用。


背景技术:

2.r.e.kallio等在20世纪60年代后期发现芳香烃降解菌中有一类芳环双羟基化加氧酶(gibson,d.t.et al.,biochemistry,1968,7,2653),这些酶以苯、甲苯、萘和联苯等底物,使得芳香环经过芳核的活化、环裂变以及柠檬酸循环中间体完成原核代谢,该研究对理解和利用自然界碳循环过程有重要意义,同时在合成独特的手性化学中间体方面也有应用价值。甲苯双加氧酶是研究的最为广泛的一类生物催化剂,可以帮助完成:1)芳香族顺式二羟基化反应、2)烯烃顺式二羟基化反应、3)硫化物氧化反应、4)苄基羟基化反应和5)烃去饱和反应和n-脱烷基反应等重要官能团转化工作。芳环在甲苯加氧酶的作用下专一地转化为独特的手性代谢产物顺式环己-3,5-二烯-1,2-二醇或顺式-二氢二醇中间体,这类酶促反应为手性顺二氢二醇类化合物作为前体的复杂分子合成化学提供了新的途径。tomas hudlicky等在2018年报道了通过酶促全细胞发酵的双羟化反应,使用了甲苯双加氧酶系的大肠杆菌jm109(pdtg601)将甲苯或其类似物转化为顺式环己二烯邻二醇类化合物中间体,(baidilov,d.et al.,angew.chem.int.ed.2018,57,10994-10998)。他们通过文献分析认为并建议从该中间体出发经fukuyama等报道的方法,通过21步反应可以合成天然产物河豚毒素。
3.tomas hudlicky等人使用的表达质粒pdtg601上携带的甲苯双加氧酶系dna直接来源于pseudomonas putida f1基因组上的原始序列,该序列不仅包含todc1/todc2/todb/toda四个基因的编码序列,还包括编码序列之间的间隔序列以及四个编码序列的组合方式。一般而言,不同物种的dna序列直接用在大肠杆菌中表达,会由于密码子使用偏好,启动子、核糖体识别位点的物种差异,使蛋白表达效果不尽如人意,从而影响酶的催化效果。


技术实现要素:

4.在一方面,本发明提供一种多核苷酸,其包含甲苯双加氧酶todc1、todc2、todb和toda的编码序列。
5.在一实施方案中,所述多核苷酸从5’端到3’端包含:(1)第一核苷酸序列,其包含todc1的编码序列,所述todc1具有seq id no:4的氨基酸序列;(2)第二核苷酸序列,其包含todc2的编码序列,所述todc2具有seq id no:5的氨基酸序列;(3)第三核苷酸序列,其包含todb的编码序列,所述todb具有seq id no:6的氨基酸序列;(4)第四核苷酸序列,其包含toda的编码序列,所述toda具有seq id no:7的氨基酸序列;其中所述第一、第二、第三和第四核苷酸序列各自独立地使用大肠杆菌偏好的密码子,todb的终止密码子taa与toda的起
始密码子atg形成嵌套序列taatg。
6.在具体的实施方案中,所述多核苷酸包含seq id no:1或seq id no:2的核苷酸序列。
7.在又一方面,本发明还提供包含本发明的多核苷酸的表达盒或载体,以及包含本发明的多核苷酸、表达盒或载体的宿主细胞。
8.在另一方面,本发明还提供一种制备甲苯双加氧酶的方法,所述方法包括:在适合表达盒或载体表达的条件下培养本发明的宿主细胞。
9.在又一方面,本发明提供了一种制备式(2)的化合物的方法,
[0010][0011]
所述方法包括:
[0012]
(1)在适合表达盒或载体表达的条件下培养本发明的宿主细胞;
[0013]
(2)向包含步骤(1)的宿主细胞的培养液中加入式(1)的化合物作为底物进行反应,以获得包含式(2)的化合物的发酵液:
[0014][0015]
(3)从步骤(2)的发酵液中回收式(2)的化合物;
[0016]
其中r选自卤素、-c
1-6
烷基、-c
2-6
烯基、-c
1-6
烷基-cn、-c
1-6
烷基-o-c(=o)-c
1-6
烷基、-c
3-8
环烷基、-c
3-8
环烯基、-c
6-10
芳基,其中所述c
1-6
烷基、-c
2-6
烯基、-c
1-6
烷基-cn、-c
1-6
烷基-o-c(=o)-c
1-6
烷基、-c
3-8
环烷基、-c
3-8
环烯基、-c
6-10
芳基任选地被一个或多个卤素取代;
[0017]
优选地,r选自卤素、甲基、-ch=ch2、-ch=chbr、-ch2ch2br、-ch2ch2cn、-ch2ch2n3、-ch2ch
2-o-c(=o)-ch3、-ch
2-o-c(=o)-ch3、环己烷基、环己烯基、苯基。
[0018]
因此,在又一方面,本发明涉及本发明的多核苷酸、表达盒、载体、宿主细胞在制备式(2)的化合物中的用途。
附图说明
[0019]
图1:pet-24a-todc1c2ba-1和pet-24a-todc1c2ba-2的质粒图谱。图谱中ndei和bamhi酶切位点之间包含的片段即为本发明的多核苷酸。
[0020]
图2:sds-page蛋白凝胶电泳图分析显示重组菌株中甲苯双加氧酶的可溶性表达,考马斯亮蓝染色示出代表todc1、todc2、todb和toda的蛋白条带;t:全细胞;s:上清;p:沉淀;1和2分别代表重组菌株bl21(de3)-todc1c2ba-1和bl21(de3)-todc1c2ba-2。
[0021]
图3:以乙酸苄酯为底物,利用重组菌株bl21(de3)(todc1c2ba-1)进行生物转化过程中的hplc检测图,13min位置为产物二醇化合物顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇(cas:131043-51-1),25min位置为底物乙酸苄酯。
[0022]
图4:以乙酸苄酯为底物,利用重组菌株bl21(de3)(todc1c2ba-2)进行生物转化所得产物顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇(cas:131043-51-1)的核磁图谱,溶剂为氘代氯仿。
具体实施方式
[0023]
以下通过特定的具体实施方式说明本发明的技术内容,本领域技术人员可由本说明书公开的内容容易地了解本发明的其他优点与功效。本发明也可以通过其他不同的具体实施方式加以施行或应用。本领域技术人员在不背离本发明的精神前提下,可以进行各种修饰与变更。如无明确说明,以下实施例中使用的试剂、仪器均是本领域常规试剂、仪器,可以通过商购途径获得;所使用的方法也是常规方法,本领域技术人员根据说明书内容,可以明确地知道如何完成所述实验,获得相应的结果。
[0024]
一般术语和定义
[0025]
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的蛋白质和核酸化学、分子生物学、细胞和组织培养、微生物学相关术语均为相应领域内广泛使用的术语。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
[0026]
如本文所用,除非上下文另外指明,单数形式的表述“一个”、“一种”或“这个”包括复数指代。
[0027]
本文所指的范围涵盖其端点和其中的每个点值以及由这些值构成的亚范围。例如c
1-6
涵盖c1、c2、c3、c4、c5、c6、c
1-5
、c
2-6
、c
3-5
、c
2-4
等。又例如,c
3-8
涵盖c3、c4、c5、c6、c7、c8、c
3-7
、c
4-8
、c
5-7
等。
[0028]
本文所用的术语“一个或多个”或者“至少一个”涵盖1、2、3、4、5、6、7、8、9个或更多个。
[0029]
在本文中,“核苷酸”包括脱氧核糖核苷酸和核糖核苷酸及其衍生物。“核苷酸”通常由代表其中碱基的单字母来指代:“a(a)”指脱氧腺苷酸或腺苷酸,“c(c)”指脱氧胞苷酸或胞苷酸,“g(c)”指脱氧鸟苷酸或鸟苷酸,“u(u)”指尿苷酸,“t(t)”指脱氧胸苷酸。
[0030]
如本文所用,术语“多核苷酸”指脱氧核糖核苷酸的聚合物(dna)或核糖核苷酸的聚合物(rna)。“多核苷酸序列”、“核酸序列”和“核苷酸序列”可以互换使用,用来表示多核苷酸中核苷酸的排序。多核苷酸可以是单链的或双链的。多核苷酸还可以包含合成的、非天然、修饰的核苷酸。多核苷酸可以包含一个或多个核苷酸序列(例如1、2、3、4、5、6、7、8个序列)。核苷酸序列可以包括但不限于,例如编码蛋白或多肽的编码序列、调控编码序列表达的调控序列以及限制性内切酶的酶切位点。
[0031]
如本文所用,“密码子”指多核苷酸中三个连续的核苷酸序列(又称三联体密码),其编码特定的氨基酸。不同物种对于密码子的使用是具有偏好性的,即同义密码子(编码相同氨基酸的密码子)在不同物种中使用的频率不同。通常认为,使用某物种偏好的密码子的蛋白编码序列可以在该物种表达系统中具有较高的翻译效率和准确率。“大肠杆菌偏好的
密码子”是指在大肠杆菌中使用频率较高的密码子。本发明的多核苷酸中包含的编码序列使用大肠杆菌偏好的密码子。
[0032]
如本文所用,术语“多肽”指包含通过肽键共价连接的两个以上氨基酸的聚合物。“蛋白”可以包含一条或多条多肽,其中多肽之间通过共价或非共价方式相互作用。除非另有说明,“多肽”和“蛋白”可以互换使用。
[0033]
如本文所用,“分离的”是指物质(例如多核苷酸或多肽)与其存在的来源或环境是分离的,即基本上不包含其他任何成分。
[0034]
如本文所用,术语“表达盒”指能够指导目的编码序列表达的多核苷酸,其包含可操作地连接至调控序列的目的编码序列。本发明的表达盒用于在大肠杆菌表达系统中表达蛋白或rna。可以应用于本发明的表达盒的调控序列可以包括例如:启动子、转录因子结合位点(例如核糖体结合位点)、增强子和转录终止信号(例如转录终止子)。
[0035]
如本文所用,“可操作连接”或“可操作地连接”是指核苷酸序列之间连接或相邻,从而一个核苷酸序列的功能受到另一核苷酸序列的影响。例如,与目的编码序列可操作连接的启动子指导目的编码序列的转录,与目的编码序列可操作连接的核糖体结合位点指导目的编码序列的翻译。
[0036]
在本文中,“编码序列”指编码目的蛋白(例如todc1、todc2、todb和toda)或多肽的核苷酸序列。
[0037]
在本文中,术语“表达”指从多核苷酸(例如目的编码序列)生产蛋白质的过程。在一些实施方案中,本发明的表达载体是“诱导型表达”的。“诱导型表达”是指基因的表达需要在特定条件下(例如在诱导物的存在下)实现。例如,在本发明的实施方案中,在重组菌株培养液中加入诱导物(例如iptg)来诱导甲苯双加氧酶todc1c2ba的表达。
[0038]
如本文所用,术语“启动子”是指包含rna聚合酶识别的核苷酸序列,其通过包含rna聚合酶和其他对于正确转录所需要的因子的识别序列来控制编码序列的表达。“启动子调控序列”可以包含近端和更远端的上游元件和/或下游元件。启动子调控序列影响与其可操作地连接的编码序列的转录、rna加工或稳定性、或者翻译。术语“启动子”的含义包括“启动子调控序列”。
[0039]
如本文所用,“增强子”是这样的核苷酸序列,其可以增强目的编码序列的转录。增强子可以是与启动子同源或异源的。增强子可以位于启动子序列之中、上游或下游。
[0040]
如本文所用,“转化”是指将多核苷酸或载体导入宿主细胞中,从而使多核苷酸或载体能够从宿主细胞表达。转化可以是瞬时或稳定的。经本发明的多核苷酸、表达盒或载体转化的宿主细胞又可以称为“重组细胞”。在一些实施方案中,宿主细胞为例如大肠杆菌的细菌菌株,这样的重组细胞又可以称为“重组菌株”。
[0041]
如本文所用,术语“宿主细胞”指用于接受、保持、复制、表达多核苷酸或载体的细胞。在本发明中,优选的宿主细胞是可以表达目的编码序列的细胞。
[0042]
术语“甲苯双加氧酶”或“todc1c2ba”指恶臭假单胞菌(pseudomonas putida)f1菌株蛋白todc1、todc2、todb和toda的合称。恶臭假单胞菌f1的todcl、todc2、todb和toda基因的核苷酸序列如genbank登录号:j04996.1中第620-4210位核苷酸所示(seq id no:12),其中包含间隔序列。“todc1”由todcl(又称为bnza)基因编码,又叫做benzene 1,2-dioxygenase subunit alpha,其具有uniprot识别号(uniprot id):a5w4f2所示氨基酸序
列(seq id no:4)。“todc2”由todc2(又称为bnzb)基因编码,又叫做benzene 1,2-dioxygenase subunit beta,其具有uniprot id:a5w4f1所示氨基酸序列(seq id no:5)。“todb”由todb基因编码,又叫做toluene 1,2-dioxygenase system ferredoxin subunit,其具有uniprot id:a5w4f0所示氨基酸序列(seq id no:6)。“toda”由toda基因编码,又叫做toluene 1,2-dioxygenase system ferredoxin
‑‑
nad( )reductase component,其具有uniprot id:a5w4e9所示氨基酸序列(seq id no:7)。
[0043]
todc1c2ba共同催化如下所示的从甲苯或甲苯类似物(式(1))到顺-环己二烯邻二醇类化合物(式(2))的反应:
[0044][0045]
其中r可以是卤素、甲基、-ch=ch2、-ch=chbr、-ch2ch2br、-ch2ch2cn、-ch2ch2n3、-ch2ch
2-o-c(=o)-ch3、-ch
2-o-c(=o)-ch3、环己烷基、环己烯基、苯基。由甲苯双加氧酶催化不同底物获得的产物可以作为中间体用于合成多种化合物,相关描述可以参见例如endoma,m.a.,et al.,organic process research&development,2002,6(4):525-532。
[0046]
如本文所用,“甲苯或甲苯类似物”具有如上式(1)所示结构。
[0047]
如本文所用,术语“顺-环己二烯邻二醇类化合物”具有如上式(2)所示结构。
[0048]
如本文所用,术语“取代(的)”表示所指定的原子的一个或多个氢被给定的基团的选择代替,条件是未超过所指定的原子在当前情况下的正常原子价并且所述取代形成稳定的化合物。取代基和/或变量的组合仅在这种组合形成稳定的化合物时才是允许的。本文所指的任选被取代的基团的取代基的实例可以是卤素。本文所述的烷基、烯基、环烷基、环烯基、芳基可以任性地被取代。
[0049]
如本文所用,术语“卤素”是指氟(f)、氯(cl)、溴(br)、碘(i)。
[0050]
在本文中,“i-j”或类似的表述是指涵盖端点、其中的每个整数以及由其中的整数构成的亚范围的范围。例如,c
1-6
涵盖c1、c2、c3、c4、c5和c6以及c
2-c5、c
3-c4等。
[0051]
本文所用,术语“烷基”,不论单独使用或与其他术语组合使用,是指具有特定碳原子数的支化或直链的饱和脂肪族烃基团。除另有注明外,“烷基”是指c
1-6
烷基。例如,“c
1-6
烷基”包括但不限于甲基、乙基、正丙基、异丙基、正丁基、叔丁基、异丁基、戊基、己基等。
[0052]
本文所用,术语“烯基”,不论单独使用或与其他术语组合使用,是指包含碳碳双键的特定碳原子数的支化或直链的不饱和脂肪族烃基团。除另有注明外,“烯基”是指c
2-6
烯基。
[0053]
如本文所用,术语“环烷基”,不论单独使用或与其他术语组合使用,是指具有特定碳原子数的饱和脂肪族环状烃基团。除另有注明外,“环烷基”是指c
3-8
环烷基。例如,包括但不限于环丙烷基、环丁烷基、环戊烷基和环己烷基等。
[0054]
如本文所用,术语“环烯基”,不论单独使用或与其他术语组合使用,是指包含碳碳
双键的特定碳原子数的不饱和脂肪族环状烃基团。除另有注明外,“环烯基”是指c
3-8
环烯基。例如,包括但不限于环丙烯基、环丁烯基、环戊烯基和环己烯基等。
[0055]
如本文所用,术语“芳基”,不论单独使用或与其他术语组合使用,是指包含5元或6元芳香碳环的芳香烃基团。除另有注明外,“芳基”是指c
6-10
芳基。例如,包括但不限于苯基、萘基等。
[0056]
本文中所使用的dna重组技术在本领域中是众所周知的(参见例如sambrook,j.et al.,molecular cloning:a laboratory manual,2
nd ed.,cold spring harbor laboratory press,cold spring harbor,n.y,1989)。
[0057]
多核苷酸
[0058]
在一方面,本发明提供一种多核苷酸,其包含恶臭假单胞菌f1菌株的甲苯双加氧酶todc1、todc2、todb和toda的编码序列。本发明的多核苷酸优选是分离的。
[0059]
在一实施方案中,所述多核苷酸从5’端到3’端包含:
[0060]
(1)第一核苷酸序列,其包含todc1的编码序列,所述todc1具有seq id no:4的氨基酸序列;
[0061]
(2)第二核苷酸序列,其包含todc2的编码序列,所述todc2具有seq id no:5的氨基酸序列;
[0062]
(3)第三核苷酸序列,其包含todb的编码序列,所述todb具有seq id no:6的氨基酸序列;
[0063]
(4)第四核苷酸序列,其包含toda的编码序列,所述toda具有seq id no:7的氨基酸序列;
[0064]
其中所述第一、第二、第三和第四核苷酸序列各自独立地使用大肠杆菌偏好的密码子,todb的终止密码子taa与toda的起始密码子atg形成嵌套序列taatg。
[0065]
在一优选实施方案中,所述第一核苷酸序列包含seq id no:1中第1-1350位核苷酸(又见seq id no:2中第1-1350位核苷酸)。在另一优选实施方案中,所述第二核苷酸序列包含seq id no:1中第1464-2024位核苷酸(又见seq id no:2中第1464-2024位核苷酸)。在又一优选实施方案中,所述第三核苷酸序列包含seq id no:1中第2036-2356位核苷酸(又见seq id no:2中第2042-2362位核苷酸)。在又一实施方案中,所述第四核苷酸序列包含seq id no:1中第2359-3588位核苷酸(又见seq id no:2中第2365-3594位核苷酸)。
[0066]
在一些实施方案中,所述多核苷酸还包含位于第一核苷酸序列与第二核苷酸序列之间的第一间隔序列,和/或位于第二核苷酸序列与第三核苷酸序列之间的第二间隔序列。
[0067]
在一实施方案中,所述第一间隔序列从5’端到3’端包含t7启动子、lac操纵基因(laco)和原核核糖体结合位点(rbs)。在一实施方案中,t7启动子包含seq id no:8的核苷酸序列。在一实施方案中,原核核糖体结合位点富含ag,例如aaggag。在一具体实施方案中,原核核糖体结合位点包含seq id no:9的核苷酸序列。在一实施方案中,lac操纵基因包含seq id no:10的核苷酸序列。
[0068]
在一实施方案中,所述第二间隔序列包含gtgatgtc(seq id no:1中第2028-2035位核苷酸)。在一优选实施方案中,所述第二间隔序列包含富含ag的rbs序列,例如aaggag。在更优选的实施方案中,第二间隔序列包含seq id no:9的核苷酸序列。
[0069]
优选地,所述第一间隔序列包含seq id no:3的核苷酸序列,和/或所述第二间隔
序列包含gtgatgtc(seq id no:1中第2028-2035位核苷酸)或gaaggagatatacc(seq id no:2中第2028-2041位核苷酸,对应seq id no:9)。
[0070]
在一具体实施方案中,所述多核苷酸包含seq id no:1或seq id no:2的核苷酸序列。
[0071]
在一实施方案中,所述第一、第二、第三和第四核苷酸序列还各自独立地包含多肽标签的编码序列。多肽标签的编码序列与目的多肽的编码序列(例如todc1、todc2、todb或toda的编码序列)可操作地连接,使得多肽标签和目的多肽从同一开放阅读框表达为融合多肽。多肽标签的实例包括但不限于谷胱甘肽s-转移酶(gst)、聚组氨酸标签(即his标签,例如his5、his6、his8等)、麦芽糖结合蛋白(mbp)、链球菌g蛋白的b1结构域(gb1)、硫氧还蛋白(trx)、小泛素相关修饰蛋白(sumo)。
[0072]
表达盒和载体
[0073]
在又一方面,本发明提供一种载体,其包含本发明的多核苷酸。
[0074]
载体可以为克隆载体或表达载体。在优选的实施方案中,所述载体为表达载体。
[0075]
在优选的实施方案中,载体以表达盒的形式包含本发明的多核苷酸,这样的载体可以是表达载体。因此,在另一方面,本发明还提供一种表达盒,其包含本发明的多核苷酸以及调控序列。调控序列与本发明的多核苷酸可操作地连接,并且指导所关注的蛋白(例如甲苯双加氧酶todc1、todc2、todb和toda)的表达。适用于表达盒的调控序列可以包括但不限于启动子、转录增强子、翻译增强子、原核核糖体结合位点、lac操纵子的调控元件、转录终止子及其组合。在优选的实施方案中,调控序列为启动子、原核核糖体结合位点、转录终止子或其组合。在更优选的实施方案中,调控序列为启动子、lac操纵子的调控元件、原核核糖体结合位点、转录终止子或其组合。
[0076]
启动子通常位于所关注蛋白的编码序列的上游。可以用于本发明的优选的启动子为t7启动子。t7启动子的示例性核苷酸序列示于seq id no:8。在一实施方案中,调控序列包含第二启动子,其位于本发明的多核苷酸的上游。在一具体实施方案中,第二启动子为t7启动子。在一具体实施方案中,t7启动子包含seq id no:8的核苷酸序列。
[0077]
原核核糖体结合位点通常位于启动子和所关注的蛋白的编码序列之间。优选地,原核核糖体结合位点位于起始密码子上游的5-10个碱基处。原核核糖体结合位点可以例如为shine-dalgarno序列。优选的原核核糖体结合位点序列富含ag。原核核糖体结合位点的示例性核苷酸序列示于seq id no:9。在一实施方案中,调控序列进一步包含第二原核核糖体结合位点,其位于如上所述的第二启动子与本发明的多核苷酸之间。在一具体实施方案中,第二原核核糖体结合位点包含seq id no:9的核苷酸序列。
[0078]
lac操纵子的调控元件可以例如为lac操纵基因(lac operator,laco)、lac阻遏物(laci)的启动子序列和编码序列。在优选的实施方案中,本发明的表达盒中包含lac操纵基因,其位于启动子与所关注的蛋白的编码序列之间,而lac阻遏物的启动子序列和编码序列存在于同一载体的另一表达盒中。在其他实施方案中,本发明的表达盒中包含lac操纵基因,其位于启动子与所关注的蛋白的编码序列之间,而lac阻遏物的启动子和编码序列存在于第二载体中。lac操纵基因的示例性核苷酸序列示于seq id no:10。在更进一步的实施方案中,调控序列还包含第二lac操纵基因,其位于如上所述的第二启动子与第二原核核糖体结合位点之间。在一具体实施方案中,第二lac操纵基因包含seq id no:10的核苷酸序列。
[0079]
在一具体实施方案中,所述表达盒或载体从5’端到3’端包含:(1)第二启动子;和(2)本发明的多核苷酸。在一具体实施方案中,第二启动子为t7启动子。在一具体实施方案中,t7启动子包含seq id no:8的核苷酸序列。
[0080]
在一具体实施方案中,所述表达盒或载体从5’端到3’端包含:(1)第二启动子;(2)第二原核核糖体结合位点;和(3)本发明的多核苷酸。在一具体实施方案中,第二启动子为t7启动子。在一实施方案中,t7启动子包含seq id no:8的核苷酸序列。在一优选实施方案中,第二原核核糖体结合位点序列富含ag。在一具体实施方案中,第二原核核糖体结合位点包含seq id no:9的核苷酸序列。
[0081]
在又一具体实施方案中,所述表达盒或载体从5’端到3’端包含:(1)第二启动子;(2)第二lac操纵基因;(3)第二原核核糖体结合位点;和(4)本发明的多核苷酸。在一具体实施方案中,第二启动子为t7启动子。在一具体实施方案中,t7启动子包含seq id no:8的核苷酸序列。在一优选实施方案中,第二原核核糖体结合位点序列富含ag,例如aaggag。在一具体实施方案中,第二原核核糖体结合位点包含seq id no:9的核苷酸序列。在另一具体实施方案中,第二lac操纵基因包含seq id no:10的核苷酸序列。
[0082]
在如上所述的实施方案中,所述表达盒或载体还可以包含转录终止子。转录终止子可以位于所关注的蛋白的编码序列的下游。转录终止子的选择与载体中的启动子以及宿主系统中包含的rna聚合酶相配合。在启动子为t7启动子的实施方案中,转录终止子可以为t7转录终止子。t7转录终止子的示例性核苷酸序列示于seq id no:11。在一实施方案中,第二启动子为t7启动子,转录终止子为t7转录终止子。在一具体实施方案中,t7转录终止子包含seq id no:11的核苷酸序列。
[0083]
在一实施方案中,所述表达盒或载体从5’端到3’端包含:
[0084]
(1)第二t7启动子(优选具有seq id no:8的核苷酸序列);
[0085]
(2)本发明的多核苷酸(优选具有seq id no:1或seq id no:2的核苷酸序列);和
[0086]
(3)任选存在的t7转录终止子(优选具有seq id no:11的核苷酸序列);
[0087]
优选地,所述表达盒或载体还包含位于第二t7启动子和第一核苷酸序列之间的第二原核核糖体结合位点(优选地,所述第二原核核糖体结合位点具有seq id no:9的核苷酸序列);
[0088]
更优选地,所述表达盒或载体还包含位于所述第二t7启动子和第二原核核糖体结合位点之间的第二lac操纵基因(优选地,所述第二lac操纵基因具有seq id no:10的核苷酸序列)。
[0089]
在一具体实施方案中,所述表达盒或载体从5’端到3’端包含:(1)第二t7启动子(优选具有seq id no:8的核苷酸序列);(2)第二lac操纵基因(优选具有seq id no:10的核苷酸序列);(3)第二原核核糖体结合位点(优选具有seq id no:9的核苷酸序列);(4)本发明的多核苷酸(优选具有seq id no:1或seq id no:2的核苷酸序列);和(5)t7转录终止子(优选具有seq id no:11的核苷酸序列)。
[0090]
载体还可以包含复制起点(例如puc origin、pbr322 origin或pmb1 origin)和抗生素抗性基因(例如卡那霉素抗性基因、羧苄青霉素抗性基因或氨苄青霉素抗性基因)表达盒。抗生素抗性基因表达盒通常可以包含启动子和抗生素抗性基因的编码序列。可以用于本发明的复制起点和抗生素抗性基因表达盒可以是本领域技术人员熟知的那些,例如可商
购的载体中所使用的复制起点和抗生素抗性基因表达盒。
[0091]
可以将本发明的多核苷酸克隆到可商购的载体中。可以用于本发明的载体优选为质粒载体。优选的可商购的质粒载体中可以已包含t7启动子、原核核糖体结合位点和t7转录终止子,其可以指导本发明的多核苷酸在表达t7聚合酶的宿主细胞中进行表达。更有选的可商购的质粒载体中还可以包含lac操纵子的调控元件。这类载体可以例如为pet系列载体(novagen公司)。在一些实施方案中,本发明的载体衍生自选自以下的载体:pet-3a-d、pet-9a-d( )、pet-11a-d、pet-14b、pet-21a-d( )、pet-23a-d( )、pet-24a-d( )、pet-30a-c( )、pet-28a-c( )、pet31b( )、pet32a-c( )、p33b、pet-41a-c( )、pet-42a-c( )。还可以考虑噬菌体载体和噬菌粒载体。在一具体实施方案中,本发明的载体衍生自pet-24a( )并且包含seq id no:1或seq id no:2的核苷酸序列。
[0092]
宿主细胞
[0093]
在另一方面,本发明提供一种宿主细胞,其包含本发明的多核苷酸、表达盒或载体。
[0094]
可以将本发明的表达盒或载体导入合适的宿主细胞用于表达甲苯双加氧酶。可以用于本发明的宿主细胞是可以商购的。优选的宿主细胞是大肠杆菌。对于用于蛋白表达的宿主细胞,更优选的是大肠杆菌。更优选的,所述大肠杆菌的染色体中整合有λ噬菌体de3区(其含有t7噬菌体rna聚合酶的编码序列),使得大肠杆菌能够表达t7 rna聚合酶。更优选的,大肠杆菌中t7 rna聚合酶的表达是诱导型的。例如,可以使大肠杆菌中t7 rna聚合酶处于lac操纵子的控制下,用iptg诱导t7 rna聚合酶的表达。在一实施方案中,所述宿主细胞选自大肠杆菌bl21(de3)、bl21-gold(de3)、bl21-gold(de3)plyss、rosetta(de3)、origami
tm 2(de3)、origamib(de3)、origami
tm b(de3)plyss、rosetta-gami b(de3)和lemo21(de3)。在一具体实施方案中,所述宿主细胞为大肠杆菌bl21(de3),其中转化有甲苯双加氧酶表达载体,所述甲苯双加氧酶表达载体衍生自pet-24a( )并且包含seq id no:1或seq id no:2的核苷酸序列。
[0095]
可以使用本领域已知的常规转化技术将本发明的载体导入宿主细胞。这类技术包括但不限于磷酸钙共沉淀、氯化钙共沉淀、热激、重组噬菌体转导、电穿孔、三亲本杂交(参见例如sambrook,j.et al.,molecular cloning:a laboratory manual,2
nd ed.,cold spring harbor laboratory press,cold spring harbor,n.y,1989)。
[0096]
制备甲苯双加氧酶的方法
[0097]
在又一方面,本发明提供了一种制备甲苯双加氧酶的方法,所述方法包括:在适合本发明的表达盒或载体表达的条件下培养本发明的宿主细胞。在一些实施方案中,所述方法进一步包括裂解表达甲苯双加氧酶的宿主细胞以获得含有甲苯双加氧酶的裂解液。在又一实施方案中,所述方法还包括纯化甲苯双加氧酶。
[0098]
在一具体实施方案中,所述宿主细胞为其中转化有本发明的载体的大肠杆菌bl21(de3)。
[0099]
在一具体实施方案中,所述在适合表达盒或载体表达的条件下培养宿主细胞包括:
[0100]
(1)在温度为约30-37℃、ph约6.8-7.3、溶氧≥20%的条件下,使用无机盐培养基培养转化有本发明的载体的大肠杆菌bl21(de3);
[0101]
(2)在溶氧突然上升时,以12-18ml/hr/l的速度添加66%葡萄糖溶液补料;以及
[0102]
(3)在当od600约为30-50时,将温度降至20-30℃,添加终浓度为0.1-1mm的异丙基-β-d-硫代半乳糖苷进行诱导表达。
[0103]
在一具体实施方案中,所述无机盐培养基包括6-10g/l kh2po4·
3h2o,11-15g/l k2hpo4,1-3g/l(nh4)25o4,1-3g/l mgso4·
7h2o,1-3g/l二水合柠檬酸三钠,2-5g/l大豆蛋白胨,5-10g/l一水合葡萄糖,0.1-1g/l泡敌,10-20ml/l微量元素溶液,所述微量元素溶液包含:10-20g/l一水合柠檬酸,1-5g/l fecl3·
6h2o,0.5-1g/l znso4·
7h2o,0.1-0.5g/l cocl2·
6h2o,0.1-0.5g/l cuso4·
5h2o,0.1-0.5g/l h3bo3,1-5g/l mnso4·
h2o和1-5g/l cacl2·
2h2o。
[0104]
制备环己二烯邻二醇类化合物的方法
[0105]
在又一方面,本发明提供了一种制备式(2)的化合物的方法,
[0106][0107]
所述方法包括:
[0108]
(1)在适合表达盒或载体表达的条件下培养本发明的宿主细胞;
[0109]
(2)向包含步骤(1)的宿主细胞的培养液中加入式(1)的化合物作为底物进行反应,以获得包含式(2)的化合物的发酵液:以及
[0110][0111]
(3)从步骤(2)的发酵液中回收式(2)的化合物;
[0112]
其中r选自卤素、-c
1-6
烷基、-c
2-6
烯基、-c
1-6
烷基-cn、-c
1-6
烷基-o-c(=o)-c
1-6
烷基、-c
3-8
环烷基、-c
3-8
环烯基、-c
6-10
芳基,其中所述c
1-6
烷基、-c
2-6
烯基、-c
1-6
烷基-cn、-c
1-6
烷基-o-c(=o)-c
1-6
烷基、-c
3-8
环烷基、-c
3-8
环烯基、-c
6-10
芳基任选地被一个或多个卤素取代;
[0113]
优选地,r选自卤素、甲基、-ch=ch2、-ch=chbr、-ch2ch2br、-ch2ch2cn、-ch2ch2n3、-ch2ch
2-o-c(=o)-ch3、-ch
2-o-c(=o)-ch3、环己烷基、环己烯基和苯基。
[0114]
在一具体实施方案中,r为甲基,式(1)的化合物为甲苯,式(2)的化合物为顺-(1s,2r)-3-甲基-3,5-环己二烯-1,2-二醇。在一具体实施方案中,r为碘(i),式(1)的化合物为碘苯,式(2)的化合物为顺-(1s,2r)-3-碘-3,5-环己二烯-1,2-二醇。在又一具体实施方案中,r为-ch
2-o-c(=o)-ch3,式(1)的化合物为乙酸苄酯,式(2)的化合物为顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇。
[0115]
在一具体实施方案中,所述宿主细胞为大肠杆菌bl21(de3),其中转化有甲苯双加
氧酶表达载体,所述甲苯双加氧酶表达载体衍生自pet-24a( )并且包含seq id no:1或seq id no:2的核苷酸序列。
[0116]
在一具体实施方案中,上述方法的步骤(1)包括:
[0117]
(1-1)在温度为约30-37℃、ph约6.8-7.3、溶氧≥20%的条件下,使用无机盐培养基培养转化有本发明的载体的大肠杆菌bl21(de3);
[0118]
(1-2)在溶氧突然上升时,以12-18ml/hr/l的速度添加66%葡萄糖溶液补料;以及
[0119]
(1-3)在当od600约为30-50时,将温度降至20-30℃,添加终浓度为0.1-1mm的异丙基-β-d-硫代半乳糖苷(iptg)进行诱导表达。
[0120]
在一实施方案中,上述方法的步骤(2)包括:在iptg诱导表达开始后,向发酵罐内流加所述式(1)的化合物,降低66%葡萄糖补料速度为6-12ml/hr/l至发酵结束。在一实施方案中,步骤(2)还包括使用hplc检测产物浓度,在产物浓度不再增加时停止反应。
[0121]
在一实施方案中,上述方法的步骤(3)包括:(3-1)离心收集发酵液上清;以及(3-2)从发酵上清液中获得产物式(2)的化合物。
[0122]
在一具体实施方案中,所述步骤(3)包括:
[0123]
(3-1)将发酵液的ph调节至7.5-9.0并离心收集发酵液上清;
[0124]
(3-2)在步骤(3-1)的发酵液上清中加入二氯甲烷或乙酸乙酯进行萃取以获得水相和含有产物的有机相;任选地,在水相中加入二氯甲烷或乙酸乙酯再萃取,合并有机相;
[0125]
(3-3)将步骤(3-2)的有机相减压浓缩,加入适量无水硫酸钠,过滤得到产物粗液;
[0126]
(3-4)继续浓缩步骤(3-3)的产物粗液,加入石油醚打浆至油状物变成固体;以及
[0127]
(3-5)向步骤(3-4)的固体加入甲基叔丁基醚进行打浆,30-50℃减压烘干得到产物式(2)的化合物。
[0128]
在一具体实施方案中,所述式(1)的化合物为乙酸苄酯,所述式(2)的化合物为顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇。
[0129]
因此,在又一方面,本发明涉及本发明的多核苷酸、表达盒、载体、宿主细胞在制备式(2)的化合物中的用途。
[0130]
式(2)的化合物(特别是顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇和顺-(1s,2r)-3-碘-3,5-环己二烯-1,2-二醇)可以作为反应中间体用于制备河豚毒素(参见例如baidilov,d.et al.,angew.chem.int.ed.2018,57,10994-10998)。相应的,在又一方面,本发明还涉及本发明的多核苷酸、表达盒、载体、宿主细胞在制备河豚毒素等复杂天然产物中的用途。
[0131]
有益效果
[0132]
本发明提供了一种多核苷酸,其包含恶臭假单胞菌f1菌株的甲苯双加氧酶(即todc1、todc2、todb和toda)的编码序列。本发明还提供了一种表达盒和载体,其包含本发明的多核苷酸。本发明的多核苷酸、表达盒和载体适合用于在大肠杆菌中表达所述甲苯双加氧酶。
[0133]
现有技术(例如baidilov,d.et al.,angew.chem.int.ed.2018,57,10994-10998)的表达体系为pdtg601与jm109菌株,pdtg601使用tac启动子,并且编码todc1c2ba的序列和编码序列之间的间隔序列直接来源于pseudomonas putida f1菌株的基因组(genbank登录号:j04996.1中第620-4210位核苷酸;序列示于seq id no:12)。
[0134]
与之相比,本发明的表达盒或载体使用强的t7启动子,todc1c2ba的编码序列中使用大肠杆菌偏好的密码子,并且将编码序列之间的间隔序列替换为包含t7启动子和/或大肠杆菌核糖体结合位点的序列。利用本发明的多核苷酸构建的载体和重组菌株,能够实现在大肠杆菌中高效表达甲苯双加氧酶系的有益效果。
[0135]
本发明的多核苷酸、表达盒、载体和重组菌株可以用于制备环己二烯邻二醇类化合物(例如顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇),并且产物浓度为2.1-2.5g/l,高于现有技术的1.7-2.1g/l。本发明的表达体系具有规模化高效率连续生产的能力,为手性顺二氢二醇类化合物作为前体的河豚毒素等复杂分子规模化人工全合成提供了新的途径,使河豚毒素作为合乎监管规范的候选药物开展临床试验成为可能,为河豚毒素成为人类镇痛和戒毒候选药物奠定了c-gmp原料药制造基础。
[0136]
实施例
[0137]
材料
[0138]
lb液体培养基:10g/l胰蛋白胨,5g/l酵母抽提物,10g/lnacl。
[0139]
tb液体培养基:12g/l胰蛋白胨,24g/l酵母提取物,4ml/l甘油,2.3g/l kh2po4,16.4g/l k2hpo4·
3h2o。
[0140]
微量元素溶液:14.4g/l一水合柠檬酸,3.0g/l fecl3·
6h2o,0.9g/l znso4·
7h2o,0.2g/l cocl2·
6h2o,0.2g/l cuso4·
5h2o,0.2g/l h3bo3,1.1g/l mnso4·
h2o,1.2g/l cacl2·
2h2o。
[0141]
无机盐培养基:7.9g/l kh2po4·
3h2o,13.0g/l k2hpo4,2.1g/l(nh4)2so4,1.7g/l mgso4·
7h2o,1.1g/l二水合柠檬酸三钠,2.5g/l大豆蛋白胨,7.5g/l一水合葡萄糖,0.5g/l泡敌,10ml/l微量元素溶液。
[0142]
66%葡萄糖溶液:660g/l一水合葡萄糖。
[0143]
实施例1:双加氧酶系todc1c2ba表达菌株的构建
[0144]
基于恶臭假单胞菌f1菌株中编码todc1c2ba的基因(genbank登录号:j04996.1中第620-4210位核苷酸,seq id no:12),设计了适合在大肠杆菌系统中表达todc1/todc2/todb/toda蛋白的两个多核苷酸,其分别具有如seq id no:1和seq id no:2所示的核苷酸序列。
[0145]
与seq id no:12的核苷酸序列相比,本发明的多核苷酸具有以下特征:
[0146]
(1)todc1、todc2、todb和toda的编码序列使用大肠杆菌偏好的密码子;
[0147]
(2)将seq id no:12中todc1终止密码子tga与todc2起始密码子atg之间的110个核苷酸序列替换成seq id no:3的序列。seq id no:3从5’端到3’端包含t7启动子(seq id no:8)、lac操纵基因(laco)(seq id no:10)和原核核糖体结合位点(rbs)序列(seq id no:9);
[0148]
(3)seq id no:12中todc2终止密码子tag与todb起始密码子atg之间的序列gtgatgtc(seq id no:1中第2028-2035位核苷酸),在seq id no:1的对应位置保持不变,在seq id no:2的对应位置则替换成为gaaggagatatacc (seq id no:2中第2028-2041位核苷酸,对应seq id no:9),seq id no:9为rbs序列;
[0149]
(4)todb终止密码子taa与toda起始密码子atg为密码子嵌套序列taatg,与seq id no:12一致。
[0150]
在包含甲苯双加氧酶编码序列的多核苷酸(seq id no:1和seq id no:2)的5’和3’端分别加上cat核苷酸序列和限制性内切酶bamhi酶切位点ggatcc,交付苏州金唯智生物科技有限公司合成,并将其克隆至载体pet-24a( )的ndei-bamhi酶切位点上,分别获得表达质粒pet-24a-todc1c2ba-1(包含seq id no:1)和pet-24a-todc1c2ba-2(包含seq id no:2)(图1)。将表达质粒转化至大肠杆菌bl21(de3)感受态细胞,获得表达甲苯双加氧酶todc1c2ba的重组菌株bl21(de3)(todc1c2ba-1)(表达pet-24a-todc1c2ba-1)和bl21(de3)(todc1c2ba-2)(表达pet-24a-todc1c2ba-2)。
[0151]
实施例2:甲苯双加氧酶todc1c2ba表达菌株的蛋白水平的检测
[0152]
挑取重组菌株单克隆于lb液体培养基(含50μg/ml卡那霉素)中,37℃生长16hr获得种子液。按1%比例将种子液接种到lb液体培养基(含50μg/ml卡那霉素),在37℃摇床培养至od600=0.5-1.0时,将摇床温度降至25℃,加入终浓度为0.1mm的异丙基-β-d-硫代半乳糖苷(iptg)进行诱导表达,继续摇床培养至24hr。将发酵液于4℃、8000rpm离心15min收集菌体。菌体用结合缓冲液(50mm tris-hcl(ph8.0),0.5m nacl)洗涤一次后,重悬于结合缓冲液中,在冰水浴中将菌悬液进行超声破碎。将破碎后菌液于4℃、12000rpm离心20min,制备蛋白样品,进行sds-page蛋白凝胶电泳分析。如图2所示,bl21(de3)(todc1c2ba-1)和bl21(de3)(todc1c2ba-2)两个重组菌株中甲苯双加氧酶todc1c2ba都有明显的可溶性表达。
[0153]
实施例3:顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇(cas:131043-51-1)的制备
[0154]
挑取重组菌株bl21(de3)(todc1c2ba-1)单克隆于tb液体培养基(含50μg/ml卡那霉素)中,37℃生长16hr获得种子液。按1%比例将种子液接种到预装25l无机盐培养基(含50μg/ml卡那霉素)的发酵罐中,37℃培养,氨水控制ph 7.0,通过调节罐压、转速和通气量,控制溶氧≥20%。约第4-5hr,溶氧突然上升(意味着初始碳源耗完),开始启动66%葡萄糖溶液补料,补料速度设定为15ml/hr/l。约第8-9hr,当od600约为40时,将温度降至25℃,添加终浓度为0.1mm的iptg进行诱导表达。第19-22hr,3个小时内匀速向发酵罐内流加完90g底物乙酸苄酯,降低66%葡萄糖补料速度为12ml/hr/l至发酵结束。hplc检测产物不再增加时,停止转化,产物浓度约为2.1g/l。转化过程中hplc检测图谱如图3所示。
[0155]
hplc分析方法为:仪器为安捷伦液相色谱仪1260系统,色谱柱为agilent zorbax eclipse xdb-c18 5μm(4.6mm
×
250mm),流动相为(a:甲醇,b:水),流速为1ml/min,检测波长为270nm,柱温为30℃,进样体积为10μl,运行时间为35min。hplc梯度条件为:
[0156]
时间%a%b备注02080数据采集开始202080 20.58020 27.58020 282080数据采集结束352080 [0157]
样品的制备:发酵液12000rpm离心10min,取上清,用甲醇稀释5-10倍,混匀后12000rpm离心10min,取上清进液相。
[0158]
发酵转化结束后,用5n naoh调节发酵液ph至8.0。离心机8000rpm,10min离心收集发酵液上清,约30l。发酵液上清中加入60l二氯甲烷,搅拌,静置分层后收集有机相。上层水相加入60l二氯甲烷再萃取一次,合并有机相。有机相40℃减压浓缩至1l,加入适量无水硫酸钠,过滤,得到棕色清液。清液继续浓缩干,加入石油醚打浆至油状物变成固体,弃上清。固体再用甲基叔丁基醚打浆,30℃减压烘干得到灰白色固体产物45.3g。产物顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇的hplc检测结果如图3所示。
[0159]
实施例4:顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇(cas:131043-51-1)的百克级制备
[0160]
挑取重组菌株bl21(de3)(todc1c2ba-2)单克隆于tb液体培养基(含50μg/ml卡那霉素)中,37℃生长16hr获得种子液。按1%比例将种子液接种到预装50l无机盐培养基(含50μg/ml卡那霉素)的发酵罐中,37℃培养,氨水控制ph 7.0,通过调节罐压、转速和通气量,控制溶氧≥20%。约第4-5hr,溶氧突然上升(意味着初始碳源耗完),开始启动66%葡萄糖溶液补料,补料速度设定为15ml/hr/l。约第8-9hr,当od600约为40时,将温度降至25℃,添加终浓度为0.1mm的iptg进行诱导表达。第16-22hr,6个小时内匀速向发酵罐内流加完200g底物乙酸苄酯,降低66%葡萄糖补料速度为12ml/hr/l至发酵结束。hplc检测产物不再增加时,停止转化,产物浓度约为2.5g/l。hplc分析方法同实施例3。
[0161]
发酵转化结束后,用5n naoh调节发酵液ph至8.0。用连续流管式离心机离心收集发酵液上清,约60l。发酵液上清中加入60l乙酸乙酯,搅拌,静置分层后收集有机相。上层水相加入60l乙酸乙酯再萃取一次,合并有机相。有机相40℃减压浓缩至10l,加入适量无水硫酸钠,抽滤,得到棕色清液。清液继续浓缩干,加入石油醚打浆至油状物变成固体,弃上清。固体再用甲基叔丁基醚打浆,30℃减压烘干得到灰白色固体产物约114g。产物顺-(1s,2r)-3-乙酰氧甲基-3,5-环已二烯-1,2-二醇(cas:131043-51-1)的核磁图谱示于图4。
[0162]
虽然本发明已以较佳的实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明精神和范围内,都可以做各种的改动与修饰,因此,本发明的保护范围应该以权利要求书所界定的为准。
[0163]
序列表
[0164]
seq id no:1包含甲苯双加氧酶的编码序列的多核苷酸
[0165][0166]
[0167]
seq id no:2包含甲苯双加氧酶的编码序列的多核苷酸
[0168]
[0169][0170]
seq id no:3,第一间隔序列
[0171][0172]
seq id no:4,todc1
[0173][0174]
seq id no:5,todc2
[0175][0176]
seq id no:6,todb
[0177][0178]
seq id no:7,toda
[0179][0180]
seq id no:8,t7启动子
[0181][0182]
seq id no:9,原核核糖体结合位点
[0183][0184]
seq id no:10,lac操纵基因
[0185][0186]
seq id no:11,t7转录终止子
[0187][0188]
seq id no:12,j04996.1中第620-4210位核苷酸
[0189]
[0190]
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献