udp
‑
鼠李糖的生物合成生产
1.对相关申请的交叉引用本技术要求2019年3月29日提交的美国临时申请系列号62/825,799的优先权,其公开内容通过引用整体并入本文。
发明领域
2.本公开内容总体上涉及二磷酸尿苷鼠李糖(“udp
‑
鼠李糖”或“udpr”或“udp
‑
rh”)的生物合成。更具体地,本公开内容涉及:用于制备udp
‑
鼠李糖的生物催化方法,其进而可用于含鼠李糖的甜菊糖苷的生物合成;以及具有可用于产生udp
‑
鼠李糖和含鼠李糖的甜菊糖苷的有关生物合成途径的酶活性的重组多肽。
背景技术:
3.甜菊糖苷是在甜叶菊(stevia rebaudiana)植物的叶子中发现的一类化合物,其可以用作高强度、低热量的甜味剂。这些天然存在的甜菊糖苷具有相同的基本二萜结构(甜菊醇主链),但在甜菊醇主链的c13和c19位置处的碳水化合物残基(例如,葡萄糖、鼠李糖和木糖残基)的数量和类型是不同的。有趣的是,基本甜菊醇结构的糖“装饰”中的这些变化经常显著地且不可预测地影响得到的甜菊糖苷的性能。受影响的性能可以包括但不限于总体味道特征、任何异味的存在和程度、结晶点、“口感”、溶解度和感觉到的甜度以及其它差异。具有已知结构的甜菊糖苷包括蛇菊苷、莱鲍迪苷a (“reb a”)、莱鲍迪苷b (“reb b”)、莱鲍迪苷c (“reb c”)、莱鲍迪苷d (“reb d”)、莱鲍迪苷e (“reb e”)、莱鲍迪苷f (“reb f”)、莱鲍迪苷m (“reb m”)、莱鲍迪苷j (“reb j”)、莱鲍迪苷n (“reb n”)和杜尔可苷a。
4.基于干重,蛇菊苷、reb a、reb c和杜尔可苷a分别占野生型甜叶菊叶中发现的所有甜菊糖苷的总重量的大约9.l%、3.8%、0.6%和0.3%。其它甜菊糖苷诸如reb j和reb n以显著更低的量存在。来自甜叶菊植物的提取物是商购可得的。在此类提取物中,蛇菊苷和reb a通常是主要组分,而其它已知的甜菊糖苷则作为微量或痕量组分存在。在任何给定的甜叶菊提取物中的各种甜菊糖苷的实际含量水平可以根据例如甜叶菊植物生长的气候和土壤、收获甜叶菊叶的条件和用于提取期望的甜菊糖苷的方法而变化。为了说明,商业制备物中reb a的量可以在总甜菊糖苷含量的约20重量%至超过约90重量%之间变化,而reb b、reb c和reb d的量可以分别为总甜菊糖苷含量的约1
‑
2重量%、约7
‑
15重量%和约2重量%。在此类提取物中,reb j和reb n各自通常占总甜菊糖苷含量的小于0.5重量%。
5.作为天然甜味剂,不同的甜菊糖苷具有不同程度的甜度、口感和余味。甜菊糖苷的甜度显著高于食用糖(即蔗糖)的甜度。例如,蛇菊苷本身的甜度是蔗糖的100
‑
150倍,但具有苦的余味,如在许多味道试验中所注意到的,而reb a和reb e的甜度是蔗糖的250
‑
450倍,并且余味特征比蛇菊苷好得多。但是,这些甜菊糖苷本身仍保持明显的余味。因此,任何甜叶菊提取物的总体味道特征均受提取物中各种甜菊糖苷的相对含量的深刻影响,而所述相对含量进而可能受植物来源、环境因素(诸如土壤含量和气候)和提取方法的影响。特别地,提取条件的变化可以导致甜叶菊提取物中甜菊糖苷的不一致组成,使得味道特征在不
同批次的提取产品之间变化。甜叶菊提取物的味道特征也可以受提取过程后保留在产品中的植物衍生的或环境衍生的污染物(诸如色素、脂质、蛋白、酚类和糖类)的影响。这些污染物通常具有对于将甜叶菊提取物用作甜味剂来说不期望的异味。此外,分离在甜叶菊提取物中不丰富的单独或特定组合的甜菊糖苷的方法可能会在成本和资源上令人望而却步。
6.此外,从植物中提取的方法通常采用使用溶剂诸如己烷、氯仿和乙醇的固
‑
液提取技术。溶剂提取是一种能量密集型方法,并且可以导致与有毒废物处理有关的问题。因此,需要新的生产方法来降低甜菊糖苷生产的成本以及减轻大规模培养和加工的环境影响。
7.因此,本领域需要新的制备甜菊糖苷、特别是含鼠李糖的甜菊糖苷诸如reb j和reb n的方法,其可以产生具有更好和更一致的味道特征的产品。鉴于通向此类含鼠李糖的甜菊糖苷的生物合成途径经常使用udp
‑
鼠李糖作为起始底物之一,本领域需要udp
‑
鼠李糖的新颖且有效的制备方法。
技术实现要素:
8.在不同的实施方案中,本公开内容涵盖制备udp
‑
鼠李糖的生物合成方法。在一个优选的实施方案中,本公开内容涉及一种制备二磷酸尿苷β
‑
l
‑
鼠李糖(“udp
‑
l
‑
鼠李糖”或“udp
‑
l
‑
r”或udp
‑
l
‑
rh”)的生物合成方法。通常,所述方法包括在有nad
和nadph的来源存在下将二磷酸尿苷
‑
葡萄糖(“udp
‑
葡萄糖”或“udpg”)与一种或多种重组多肽一起温育足够的时间以产生udp
‑
鼠李糖,其中所述一种或多种重组多肽单独地或共同地具有udp
‑
鼠李糖合酶活性。
9.在某些实施方案中,一种或多种重组多肽可以是具有udp
‑
葡萄糖4,6
‑
脱水酶、udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶和udp
‑4‑
酮
‑
鼠李糖4
‑
酮
‑
还原酶活性的三功能酶。这样的三功能多肽也被称作rhm酶。在这样的实施方案中,一种或多种重组多肽可以选自来自蓖麻(ricinus communis)、水蕨(ceratopteris thalictroides)、细叶满江红(azolla filiculoides)、绿色鞭毛藻(ostreococcus lucimarinus)、微拟球藻(nannochloropsis oceanica)、石莼(ulva lactuca)、golenkinia longispicula、亚心形四爿藻(tetraselmis subcordiformis)或心形四爿藻(tetraselmis cordiformis)的rhm酶。在这些实施方案中,一种或多种重组多肽可以选自包含与seq id no: 1、seq id no: 3、seq id no: 5、seq id no: 39、seq id no: 41、seq id no: 43、seq id no: 45、seq id no: 47或seq id no: 89具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的重组多肽。这些一种或多种重组多肽可以选自由核苷酸编码的重组多肽,所述核苷酸包含与seq id no: 2、seq id no: 4、seq id no: 6、seq id no: 40、seq id no: 42、seq id no: 44、seq id no: 46、seq id no: 48或seq id no: 90具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的核苷酸序列。
10.在某些实施方案中,一种或多种重组多肽可以包含第一重组多肽和第二重组多肽,其中所述第一重组多肽和所述第二重组多肽共同地具有udp
‑
鼠李糖合酶活性。具体地,第一重组多肽可以主要具有udp
‑
葡萄糖4,6
‑
脱水酶活性,且这样的重组多肽在本文中被称作“dh”(脱水酶)酶。第二重组多肽可以是具有udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶和udp
‑4‑
酮
‑
鼠李糖4
‑
酮
‑
还原酶活性的双功能重组多肽。该双功能重组多肽在本文中被称作
“
er”酶(字母“e”代表表异构酶活性且字母“r”代表还原酶活性)。
11.在这样的实施方案中,第一重组多肽可以选自来自灰葡萄孢(botrytis cinerea)、卤蕨(acrostichum aureum)、富油新绿藻(ettlia oleoabundans)、强壮团藻(volvox carteri)、莱茵衣藻(chlamydomonas reinhardtii)、oophila amblystomatis或dunaliella primolecta的dh酶。在这些实施方案中,第一重组多肽可以选自包含与seq id no: 7、seq id no: 27、seq id no: 29、seq id no: 31、seq id no: 33、seq id no: 35或seq id no: 37具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的重组多肽。这样的第一重组多肽可以选自由核苷酸编码的重组多肽,所述核苷酸包含与seq id no: 8、seq id no: 28、seq id no: 30、seq id no: 32、seq id no: 34、seq id no: 36或seq id no: 38具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的核苷酸序列。
12.合适的第二重组多肽的例子可以包括来自小立碗藓patens亚种(physcomitrella patens subsp.patens)、稻梨孢(pyricularia oryzae)、微拟球藻(nannochloropsis oceanica)、石莼(ulva lactuca)、心形四爿藻(tetraselmis cordiformis)、亚心形四爿藻(tetraselmis subcordiformis)、索罗金小球藻(chlorella sorokiniana)、chlamydomonas moewusii、golenkinia longispicula、莱茵衣藻(chlamydomonas reinhardtii)、佐夫色绿藻(chromochloris zofingiensis)、dunaliella primolecta、鲁兹巴夫藻(pavlova lutheri)、奇异丽藻(nitella mirabilis)、地钱(marchantia polymorpha)、江南卷柏(selaginella moellendorffii)、银叶真藓argenteum变种(bryum argenteum var argenteum)、拟南芥(arabidopsis thaliana)、稻梨孢(pyricularia oryzae)或克莱门柚(citrus clementina)的er酶。例如,第二重组多肽可以选自与seq id no: 49、seq id no: 51、seq id no: 53、seq id no: 55、seq id no: 57、seq id no: 59、seq id no: 61、seq id no: 63、seq id no: 65、seq id no: 67、seq id no: 69、seq id no: 71、seq id no: 73、seq id no: 75、seq id no: 77、seq id no: 79、seq id no: 81、seq id no: 91、seq id no: 93或seq id no: 95具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的重组多肽。这样的第二重组多肽可以选自由核苷酸编码的重组多肽,所述核苷酸包含与seq id no: 50、seq id no: 52、seq id no: 54、seq id no: 56、seq id no: 58、seq id no: 60、seq id no: 62、seq id no: 64、seq id no: 66、seq id no: 68、seq id no: 70、seq id no: 72、seq id no: 74、seq id no: 76、seq id no: 78、seq id no: 80、seq id no: 82、seq id no: 92、seq id no: 94或seq id no: 96具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的核苷酸序列。
13.在其它实施方案中,一种或多种重组多肽可以是融合酶,其包含具有udp
‑
葡萄糖4,6
‑
脱水酶活性的第一结构域(dh结构域)和具有双功能er活性的第二结构域(也就是说,udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶和udp
‑4‑
酮
‑
鼠李糖4
‑
酮
‑
还原酶活性)。dh结构域可以通过肽接头偶联至er结构域。在不同的实施方案中,所述肽接头可以包含2
‑
15个氨基酸。示例性的接头包括包含甘氨酸和丝氨酸的那些,例如,甘氨酸的重复单元、丝氨酸的重复单元、由甘氨酸和丝氨酸组成的某些基序的重复单元和它们的组合。在优选的实施方案中,肽接头可以是gsg。这样的融合酶因此包括与er结构域融合的dh结构域,它们共同地具
有udp
‑
鼠李糖合酶活性且具有催化udp
‑
葡萄糖向udp
‑
鼠李糖的转化的能力。
14.在涉及融合酶的实施方案中,融合酶的第一结构域可以包含来自灰葡萄孢、卤蕨、富油新绿藻、强壮团藻、莱茵衣藻、oophila amblystomatis或dunaliella primolecta的dh酶。在这些实施方案中,第一结构域可以包含与seq id no: 7、seq id no: 27、seq id no: 29、seq id no: 31、seq id no: 33、seq id no: 35或seq id no: 37具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的重组多肽。这样的dh结构域可以包含由核苷酸编码的重组多肽,所述核苷酸包含与seq id no: 8、seq id no: 28、seq id no: 30、seq id no: 32、seq id no: 34、seq id no: 36或seq id no: 38具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的核苷酸序列。融合酶的第二结构域可以包含来自小立碗藓patens亚种、稻梨孢、微拟球藻、石莼、心形四爿藻、亚心形四爿藻、索罗金小球藻、chlamydomonas moewusii、golenkinia longispicula、莱茵衣藻、佐夫色绿藻、dunaliella primolecta、鲁兹巴夫藻、奇异丽藻、地钱、江南卷柏、银叶真藓argenteum变种、拟南芥、稻梨孢或克莱门柚的er酶。例如,er结构域可以包含与seq id no: 49、seq id no: 51、seq id no: 53、seq id no: 55、seq id no: 57、seq id no: 59、seq id no: 61、seq id no: 63、seq id no: 65、seq id no: 67、seq id no: 69、seq id no: 71、seq id no: 73、seq id no: 75、seq id no: 77、seq id no: 79、seq id no: 81、seq id no: 91、seq id no: 93或seq id no: 95具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的重组多肽。这样的er结构域可以包含由核苷酸编码的重组多肽,所述核苷酸包含与seq id no: 50、seq id no: 52、seq id no: 54、seq id no: 56、seq id no: 58、seq id no: 60、seq id no: 62、seq id no: 64、seq id no: 66、seq id no: 68、seq id no: 70、seq id no: 72、seq id no: 74、seq id no: 76、seq id no: 78、seq id no: 80、seq id no: 82、seq id no: 92、seq id no: 94或seq id no: 96具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的核苷酸序列。在某些优选的实施方案中,融合酶的第一结构域可以包含与seq id no: 7具有至少80%序列同一性的氨基酸序列。第二结构域可以包含与seq id no: 91、seq id no: 93、seq id no: 95、seq id no: 61或seq id no: 63具有至少80%序列同一性的氨基酸序列。在这样的优选的实施方案中,融合酶整体可以包含与seq id no: 9、seq id no: 11或seq id no: 13、seq id no: 83或seq id no: 85具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列。在某些优选的实施方案中,融合酶的第一结构域可以包含与seq id no: 7或seq id no: 31具有至少80%序列同一性的氨基酸序列,且融合酶的第二结构域可以包含与seq id no: 63具有至少80%序列同一性的氨基酸序列。融合酶整体可以包含与seq id no: 87具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列。
15.在某些实施方案中,第一重组多肽可以包括与seq id no: 1、seq id no: 3、seq id no: 5、seq id no: 9、seq id no: 11、seq id no: 13、seq id no. 39、seq id no. 41、seq id no. 43、seq id no. 45、seq id no. 47、seq id no. 83、seq id no. 85、seq id no. 87或seq id no. 89具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、
至少98%、至少99%或100%序列同一性的氨基酸序列。在某些实施方案中,第一重组多肽可以包括与seq id no: 9具有至少90%序列同一性的氨基酸序列。在某些实施方案中,第一重组多肽可以包括与seq id no: 11具有至少90%序列同一性的氨基酸序列。在某些实施方案中,第一重组多肽可以包括与seq id no: 13具有至少90%序列同一性的氨基酸序列。在某些实施方案中,第一重组多肽可以包括与seq id no: 83具有至少90%序列同一性的氨基酸序列。在某些实施方案中,第一重组多肽可以包括与seq id no: 85具有至少90%序列同一性的氨基酸序列。在某些实施方案中,第一重组多肽可以包括与seq id no: 87具有至少90%序列同一性的氨基酸序列。在某些实施方案中,第一重组多肽可以包括与seq id no: 89具有至少90%序列同一性的氨基酸序列。
16.在不同的实施方案中,本文提供的生物合成方法可以包括在转化的细胞系统中表达第一重组多肽。在某些实施方案中,所述转化的细胞系统选自酵母、不产生udp
‑
鼠李糖的植物、藻类、真菌和细菌。在某些实施方案中,所述细菌或酵母可以选自:埃希氏菌属(escherichia);沙门氏菌属(salmonella);芽孢杆菌属(bacillus);不动杆菌属(acinetobacter);链霉菌属(streptomyces);棒杆菌属(corynebacterium);甲基弯曲菌属(methylosinus);甲基单胞菌属(methylomonas);红球菌属(rhodococcus);假单胞菌属(pseudomonas);红细菌属(rhodobacter);集胞蓝细菌属(synechocystis);酵母属(saccharomyces);接合酵母属(zygosaccharomyces);克鲁维酵母属(kluyveromyces);假丝酵母属(candida);汉逊酵母属(hansenula);德巴利酵母属(debaryomyces);毛霉菌属(mucor);毕赤酵母属(pichia);球拟酵母属(torulopsis);曲霉菌属(aspergillus);arthrobotlys;短杆菌属(brevibacteria);微杆菌属(microbacterium);节杆菌属(arthrobacter);柠檬酸杆菌属(citrobacter);克雷伯氏菌属(klebsiella);泛菌属(pantoea);和梭菌属(clostridium)。
17.在某些实施方案中,可以在将二磷酸尿苷
‑
葡萄糖与第一重组多肽一起温育足够的时间以产生udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖(“udp4k6g”)以后提供nadph的来源。在某些实施方案中,nadph的来源可以包括氧化反应底物和nadp
依赖性酶。在某些实施方案中,nadph的来源可以包括苹果酸和苹果酸酶。在某些实施方案中,nadph的来源可以包括甲酸和甲酸脱氢酶。在某些实施方案中,nadph的来源可以包括亚磷酸和亚磷酸脱氢酶。
18.在某些实施方案中,可以在转化的细胞系统中进行所述温育步骤。在其它实施方案中,可以在体外进行所述温育步骤。在某些实施方案中,本文中公开的生物合成方法可以包括从转化的细胞系统分离第一重组多肽和在体外进行温育步骤。
19.在某些实施方案中,在包含蔗糖和二磷酸尿苷(“udp”)的介质中温育具有鼠李糖合酶活性的第一重组多肽和具有蔗糖合酶活性的第二重组多肽。第二重组多肽可以选自拟南芥属(arabidopsis)蔗糖合酶、绿豆(vigna radiate)蔗糖合酶和咖啡属(coffea)蔗糖合酶。在该实施方案中,在反应的第一步中,蔗糖合酶活性产生udp
‑
葡萄糖,其进而被第一重组酶用作底物以产生udp
‑
鼠李糖。在该实施方案中的nadph的来源可以包括氧化反应底物和nadp
依赖性酶。在某些实施方案中,nadph的来源可以包括苹果酸和苹果酸酶。在某些实施方案中,nadph的来源可以包括甲酸和甲酸脱氢酶。在某些实施方案中,nadph的来源可以包括亚磷酸和亚磷酸脱氢酶。
20.在本文中还尤其提供了制备甜菊糖苷组合物的生物合成方法,所述甜菊糖苷组合
物包含至少一种含鼠李糖的甜菊糖苷。所述方法可以包括在有nad
和nadph的来源存在下将udp
‑
葡萄糖与具有udp
‑
鼠李糖合酶活性的第一重组多肽一起温育以产生udp
‑
鼠李糖;和在有具有udp
‑
鼠李糖基转移酶活性的第二重组多肽存在下使udp
‑
鼠李糖与甜菊糖苷底物反应,使得鼠李糖部分与甜菊糖苷底物偶联以产生至少一种含鼠李糖的甜菊糖苷。在某些实施方案中,所述甜菊糖苷底物可以是reb a且得到的甜菊糖苷组合物可以包括reb n、reb j或二者。
21.本公开内容的方面也提供了包括至少一种含鼠李糖的甜菊糖苷的甜菊糖苷组合物,所述含鼠李糖的甜菊糖苷可通过本文描述的任何生物合成方法(包括上述实施方案中的任一个)得到或生产。
22.本公开内容的方面也提供了编码如本文中所述的多肽的核酸。在某些实施方案中,所述核酸包含编码多肽的序列,所述多肽包含与seq id no: 1、seq id no: 3、seq id no: 5、seq id no: 9、seq id no: 11、seq id no: 13、seq id no. 39、seq id no. 41、seq id no. 43、seq id no. 45、seq id no. 47、seq id no. 83、seq id no. 85、seq id no. 87或seq id no. 89具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的氨基酸序列。在某些实施方案中,所述核酸包含seq id no: 2的序列。在某些实施方案中,所述核酸包含seq id no: 4的序列。在某些实施方案中,所述核酸包含seq id no: 6的序列。在某些实施方案中,所述核酸包含seq id no: 10的序列。在某些实施方案中,所述核酸包含seq id no: 12的序列。在某些实施方案中,所述核酸包含seq id no: 14的序列。在某些实施方案中,所述核酸包含seq id no: 40的序列。在某些实施方案中,所述核酸包含seq id no: 42的序列。在某些实施方案中,所述核酸包含seq id no: 44的序列。在某些实施方案中,所述核酸包含seq id no: 46的序列。在某些实施方案中,所述核酸包含seq id no: 84的序列。在某些实施方案中,所述核酸包含seq id no: 86的序列。在某些实施方案中,所述核酸包含seq id no: 88的序列。在某些实施方案中,所述核酸包含seq id no: 90的序列。在某些实施方案中,所述核酸是质粒或其它载体。
23.本公开内容的方面也提供了细胞,其包含本文描述的核酸,包括上述实施方案中的任一个。
24.本公开内容的方面提供了包含至少一种多肽的细胞,所述多肽包含与seq id no: 1、seq id no: 3、seq id no: 5、seq id no: 9、seq id no: 11、seq id no: 13、seq id no. 39、seq id no. 41、seq id no. 43、seq id no. 45、seq id no. 47、seq id no. 83、seq id no. 85、seq id no. 87或seq id no. 89具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的氨基酸序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 1的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 3的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 9的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 9的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 11的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 13的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 37的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 41的序列。在某些实施方案中,所述细胞包含至少一种多肽,
所述多肽包含seq id no: 43的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 45的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 47的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 83的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 85的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 87的序列。在某些实施方案中,所述细胞包含至少一种多肽,所述多肽包含seq id no: 89的序列。在某些实施方案中,所述细胞是酵母细胞、不产生udp
‑
鼠李糖的植物细胞、藻类细胞、真菌细胞或细菌细胞。在某些实施方案中,所述细菌或酵母细胞选自:埃希氏菌属;沙门氏菌属;芽孢杆菌属;不动杆菌属;链霉菌属;棒杆菌属;甲基弯曲菌属;甲基单胞菌属;红球菌属;假单胞菌属;红细菌属;集胞蓝细菌属;酵母属;接合酵母属;克鲁维酵母属;假丝酵母属;汉逊酵母属;德巴利酵母属;毛霉菌属;毕赤酵母属;球拟酵母属;曲霉菌属; arthrobotlys;短杆菌属;微杆菌属;节杆菌属;柠檬酸杆菌属;克雷伯氏菌属;泛菌属;和梭菌属。在某些实施方案中,所述细胞进一步包含一种或多种如本文中所述的具有udp
‑
鼠李糖基转移酶活性、udp
‑
葡萄糖基转移酶活性和/或蔗糖合酶活性的其它多肽。
25.关于实施方案中的细胞系统,它可以选自一种或多种细菌、一种或多种酵母和它们的组合,或允许用选定的基因进行遗传转化并此后进行udp
‑
鼠李糖的生物合成生产的任何细胞系统。在最优选的微生物系统中,使用大肠杆菌以产生期望的化合物。
26.本公开内容的其它方面提供了包含至少一种多肽的体外反应混合物,所述多肽包含与seq id no: 1、seq id no: 3、seq id no: 5、seq id no: 9、seq id no: 11、seq id no: 13、seq id no. 39、seq id no. 41、seq id no. 43、seq id no. 45、seq id no. 47、seq id no. 83、seq id no. 85、seq id no. 87或seq id no. 89具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的氨基酸序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 1的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 3的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 5的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 9的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 11的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 13的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 37的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 41的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 43的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 45的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 47的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 83的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 85的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 87的序列。在某些实施方案中,所述体外反应混合物包含至少一种多肽,所述多肽包含seq id no: 89的序列。在某些实施方案中,所述体外反应混合物进一步包含一种
或多种如本文中所述的具有udp
‑
鼠李糖基转移酶活性、udp
‑
葡萄糖基转移酶活性和/或蔗糖合酶活性的其它重组多肽。
27.尽管本公开内容易于进行各种修改和替代形式,但其具体实施方案在附图中以示例的方式示出并且将在本文中详细描述。但是,应当理解,本文中呈现的附图和详细描述无意将公开内容限制于所公开的特定实施方案,而是相反,其意图涵盖落入由所附权利要求限定的本公开内容的精神和范围内的所有修改、等同方案和替代方案。
28.本发明的其它特征和优点将在参考附图对本发明的优选实施方案的以下详细描述中变得明显。
附图说明
29.图1显示了二磷酸尿苷β
‑
l
‑
鼠李糖的化学结构。
30.图2的示意图解释了以下多酶合成途径:(a)从udp
‑
葡萄糖生产udp
‑
鼠李糖;(b)通过中间体reb j从reb a和udp
‑
鼠李糖生产reb n;(c)使用苹果酸酶maeb从nadp
和苹果酸再生nadph;和(d)根据本公开内容使用蔗糖合酶从udp和蔗糖再生udp
‑
葡萄糖(udpg)。
31.图3显示了在植物和真菌中涉及三种不同酶的udp
‑
鼠李糖生物合成途径。在该生物合成途径的第一步中,udp
‑
葡萄糖4,6脱水酶将udp
‑
葡萄糖转化成udp
‑4‑
酮
‑6‑
脱氧葡萄糖(“udp4k6g”)。在该生物合成途径的第二步中,酶udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5表异构酶将udp
‑4‑
酮
‑6‑
脱氧葡萄糖转化成udp
‑4‑
酮鼠李糖。在该生物合成途径的第三个酶促步骤中,udp
‑4‑
酮鼠李糖
‑4‑
酮还原酶将udp
‑4‑
酮鼠李糖转化成udp
‑
鼠李糖。具有所有三种酶活性的三功能多肽被称为“rhm”酶。具有udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5表异构酶和udp
‑4‑
酮鼠李糖
‑4‑
酮还原酶活性的双功能多肽被称为“er”酶。仅具有udp
‑
葡萄糖4,6脱水酶活性的多肽被称为“dh”酶。另外,在该实施方案中,nadph辅因子通过使用nadp
作为氧化剂将苹果酸氧化成丙酮酸而再生,并且该反应由nadp
依赖性的苹果酸酶(maeb)催化。此外,在本实施方案中,udp
‑
葡萄糖可以通过蔗糖合酶(sus)从udp和蔗糖转化。
32.图4显示了根据本公开内容使用三功能的udp
‑
鼠李糖合酶(例如,nrf1或nr32)将udp
‑
葡萄糖(udpg)生物转化为udp
‑
鼠李糖的在体外合成udp
‑
鼠李糖的一锅多酶系统。udp
‑
葡萄糖可以如所示在蔗糖合酶(sus)催化的反应中从udp和蔗糖补充。udp
‑
鼠李糖的合成可以与氧化反应偶联以再生nadph辅因子。在所示的实施方案中,nadph辅因子通过使用nadp
作为氧化剂将甲酸氧化成二氧化碳而再生,并且该反应由甲酸脱氢酶(fdh)催化。
33.图5显示了根据本公开内容使用三功能的udp
‑
鼠李糖合酶(例如,nrf1或nr32)将udp
‑
葡萄糖生物转化为udp
‑
鼠李糖的在体外合成udp
‑
鼠李糖的一锅多酶系统。udp
‑
葡萄糖可以如所示在蔗糖合酶(sus)催化的反应中从udp和蔗糖补充。udp
‑
鼠李糖的合成可以与氧化反应偶联以再生nadph辅因子。在所示的实施方案中,nadph辅因子通过使用nadp
作为氧化剂将亚磷酸氧化成磷酸而再生,并且该反应由亚磷酸脱氢酶(ptdh)催化。
34.图6显示了用于udp
‑
鼠李糖生产的三种三功能的udp
‑
鼠李糖合酶候选物(nr12、nr32和nr33)的酶活性分析的结果。酶后边的字母“a”表示一步辅因子添加方案,其中在反应开始时添加nad
和nadph。酶后边的字母“b”表示两步辅因子添加方案,其中在反应开始时添加nad
,但直到反应开始3小时才添加nadph。在3小时后(a)、6小时后(b)和18小时后(c)收集所有样品。将收集的样品用氯仿萃取并通过hplc分析。图例:“udp
‑
rh”= udp
‑
鼠李
糖;“udpg”= udp
‑
葡萄糖;和“udp4k6g”= udp
‑4‑
酮
‑6‑
脱氧葡萄糖。
35.图7显示了根据本公开内容的两步辅因子添加方案可以如何提高udp
‑
鼠李糖生产的转化效率。在该实验中,使用重组udp
‑
鼠李糖合酶酶nrf1。将收集的样品用氯仿萃取并通过hplc分析。在1小时、3小时、4小时、6小时和18小时以后收集所有样品。反应时间后边的字母“a”表示一步辅因子添加方案,其中在反应开始时添加nad
和nadph。反应时间后边的字母“b”表示两步辅因子添加方案,其中在反应开始时添加nad
,但直到反应开始3小时才添加nadph。图例:“udp
‑
rh”= udp
‑
鼠李糖;“udpg”= udp
‑
葡萄糖;和“udp4k6g”= udp
‑4‑
酮
‑6‑
脱氧葡萄糖。
36.图8对比了使用不同的一锅多酶反应系统的udp
‑
葡萄糖(udpg)、udp
‑4‑
酮
‑6‑
脱氧葡萄糖(udp4k6g)和udp
‑
鼠李糖(udp
‑
rh)的生产。图8、小图a显示了6小时反应时间后的结果。图8、小图b显示了18小时反应时间后的结果。在表2中总结了反应系统1
‑
6的细节。
37.图9. 用于udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖(udp4k6g)生产的dh候选物的酶分析。在该实验中包含的dh候选物是nr55n、nr60n、nr66n、nr67n、nr68n和nr69n。在该实验中还包括以下具有三功能酶活性的rhm候选物:nr53n、nr58n、nr62n、nr64n和nr65n。在18小时收集所有样品。将收集的样品用氯仿萃取并通过hplc分析。“udp
‑
rh”:udp
‑
鼠李糖;“udpg”:udp
‑
葡萄糖;“udp4k6g”:udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖。“对照”:不添加酶的反应。
38.图10. 用于udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖(udp4k6g)向udp
‑
β
‑
l
‑
鼠李糖的生物转化的er候选物的酶分析。在18小时收集所有样品。将收集的样品用氯仿萃取并通过hplc分析。“udp
‑
rh”:udp
‑
鼠李糖;“udpg”:udp
‑
葡萄糖;“udp4k6g”:udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖。
39.图11. 三种融合酶(nrf3、nrf2和nrf1)相对于dh酶(nx10)用于udp
‑
鼠李糖生产的酶活性对比。在反应开始时加入nad
,在反应开始后3小时加入nadph。在21小时收集全部样品。将收集的样品用氯仿萃取并通过hplc分析。图例:“udp
‑
rh”= udp
‑
鼠李糖;“udpg”= udp
‑
葡萄糖;和“udp4k6g”= udp
‑4‑
酮
‑6‑
脱氧葡萄糖。
40.图12. 用于udp
‑
鼠李糖生产的融合酶的酶分析。在初始反应中加入nad
,并在3小时后在反应中加入nadph。在21小时收集所有样品。将收集的样品用氯仿萃取并通过hplc分析。“udp
‑
rh”:udp
‑
鼠李糖;“udpg”:udp
‑
葡萄糖;“udp4k6g”:udp
‑4‑
酮
‑6‑
脱氧葡萄糖。
41.图13显示了使用为udp
‑
鼠李糖的体外合成而优化的一锅多酶反应系统生产udp
‑4‑
酮
‑6‑
脱氧葡萄糖(udp4k6g)和udp
‑
鼠李糖(udp
‑
rh)。在该实施方案中,nrf1用作rhm酶。使用两步辅因子添加方案,在反应开始时加入nad
,并在3小时后添加nadp
、maeb和苹果酸以再生nadph。在3小时和18小时的反应时间后分析产物。
42.图14显示了hplc波谱,证实了根据本公开内容的由选择的udp
‑
鼠李糖基转移酶(1,2 rhat)和udp
‑
葡萄糖基转移酶(ugt)催化的从reb a体外生产reb j和reb n。图14、小图a显示了reb j标准品。图14、小图b显示了reb n标准品。图14、小图c表明,当在22小时测量产物时,作为一种示例性的1,2 rhat,由eucp1酶促产生reb j。图。图14、小图d表明,当在25小时测量产物时,作为一种示例性的ugt,通过cp1从reb j产物酶促产生reb n。
具体实施方式
43.本文中使用的单数形式“一个”、“一种”和“所述”包括复数所指,除非上下文另外清楚地指示。
44.就在说明书或权利要求书中使用的术语“包括”、“具有”等来说,此类术语意图以类似于术语“包含”的方式为包含性的,如同“包含”在权利要求书中用作过渡词语时所解释的那样。
45.词语“示例性的”在本文中用于表示充当例子、实例或例证。本文中被描述为“示例性”的任何实施方案未必被解释为比其它实施方案优选或有利。
46.细胞系统是提供异位蛋白表达的任何细胞。其包括细菌、酵母、植物细胞和动物细胞。其包括原核细胞和真核细胞。其还包括基于细胞组分(诸如核糖体)的蛋白的体外表达。
47.编码序列将被赋予其对于本领域普通技术人员来说普通且惯用的含义,并且非限制地用于表示编码特定氨基酸序列的dna序列。
48.术语“使细胞系统生长”是指提供允许细胞繁殖和分裂的适当培养基。其还包括提供资源,使得细胞或细胞组分可以翻译和制备重组蛋白。
49.蛋白表达可以发生在基因表达后。其由dna已转录为信使rna(mrna)之后的阶段组成。然后将mrna翻译成多肽链,其最终折叠成蛋白。dna通过转染存在于细胞中,所述转染是一种有意将核酸引入细胞中的方法。该术语经常用于真核细胞中的非病毒方法。其还可以表示其它方法和细胞类型,尽管其它术语是优选的:“转化”更经常用于描述细菌、非动物真核细胞(包括植物细胞)中的非病毒dna转移。在动物细胞中,转染是优选的术语,因为转化也用于表示这些细胞中的癌性状态(致癌作用)的进展。转导经常用于描述病毒介导的dna转移。转化、转导和病毒感染在本技术中被包括转染的定义下。
50.根据本公开内容,如本文所要求保护的酵母是被归类为真菌界的成员的真核单细胞微生物。酵母是由多细胞祖先进化的单细胞生物体,但是其中可用于本公开内容的一些物种是具有通过形成被称为伪菌丝或假菌丝的连接的芽殖细胞串而发展多细胞特征的能力的那些物种。
51.在本公开内容中使用的ugt酶的名称与ugt命名委员会(mackenzie等人,
ꢀ“
the udp glycosyltransferase gene super family: recommended nomenclature updated based on evolutionary divergence,”pharmacogenetics, 1997, 第7卷, 第255
‑
269页)采用的命名系统一致,其通过家族编号、表示亚家族的字母和单个基因的编号的组合将ugt基因分类。例如,名称“ugt76gl”表示由属于ugt家族编号76(其为植物来源)、亚家族g和基因编号1的基因编码的ugt酶。
52.术语“互补”将被赋予其对于本领域普通技术人员来说普通且惯用的含义,并且非限制地用于描述能够彼此杂交的核苷酸碱基之间的关系。例如,对于dna,腺苷与胸腺嘧啶互补,并且胞嘧啶与鸟嘌呤互补。因此,本主题技术还包括与所附序列表中报告的完整序列互补的分离的核酸片段以及那些基本上相似的核酸序列。
53.术语“核酸”和“核苷酸”将被赋予其对于本领域普通技术人员来说各自的普通且惯用的含义,并且非限制性地用于表示单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。除非特别限制,否则该术语涵盖含有天然核苷酸的已知类似物的核酸,所述类似物具有与参考核酸相似的结合性能并且以与天然存在的核苷酸类似的方式被代谢。除非另有说明,否则特定的核酸序列也隐含地涵盖其保守修饰或简并的变体(例如,简并密码子置换)和互补序列,以及明确指出的序列。
54.术语“分离的”将被赋予其对于本领域普通技术人员来说普通且惯用的含义,并且
当用于分离的核酸或分离的多肽的上下文中时,非限制性地用于表示人为地存在于其天然环境之外并且因此不是自然产物的核酸或多肽。分离的核酸或多肽可以以纯化的形式存在,或者可以存在于非天然环境中,例如存在于转基因宿主细胞中。
55.本文中使用的术语“温育”意指将两种或更多种化学或生物实体(诸如化学化合物和酶)混合并且允许它们在有利于产生一种或多种化学或生物实体(其明显不同于最初的开始实体)的条件下相互作用的过程。
56.术语“简并变体”表示具有与参考核酸序列相差一个或多个简并密码子置换的残基序列的核酸序列。简并密码子置换可以如下实现:产生序列,其中一个或多个所选择的(或全部)密码子的第三位置被混合的碱基和/或脱氧肌苷残基置换。核酸序列及其所有简并变体将表达相同的氨基酸或多肽。
57.术语“多肽”、“蛋白”和“肽”将被赋予其对于本领域普通技术人员来说各自的普通且惯用的含义;这三个术语有时互换使用,并且非限制性地用于表示氨基酸或氨基酸类似物的聚合物,无论其大小或功能如何。尽管术语“蛋白”经常用于指相对大的多肽且“肽”经常用于指小的多肽,但这些术语在本领域中的使用会重叠和变化。除非另外指出,否则本文中使用的术语“多肽”表示肽、多肽和蛋白。当涉及多核苷酸产物时,术语“蛋白”、“多肽”和“肽”在本文中可互换地使用。因此,示例性多肽包括多核苷酸产物、天然存在的蛋白、同系物、直系同源物、旁系同源物、前述物质的片段和其它等同物、变体和类似物。
58.术语“多肽片段”和“片段”在提及参考多肽使用时,将被赋予其对于本领域普通技术人员来说普通且惯用的含义,并且非限制性地用于表示这样的多肽:其中与参考多肽本身相比缺失氨基酸残基,但是其中剩余的氨基酸序列通常与参考多肽中的相应位置相同。此类缺失可以发生在参考多肽的氨基末端或羧基末端,或可替换地两者。
59.术语多肽或蛋白的“功能片段”表示这样的肽片段:其为全长多肽或蛋白的一部分,并且具有与全长多肽或蛋白基本上相同的生物活性,或实现与全长多肽或蛋白基本上相同的功能(例如,实现相同的酶反应)。
60.互换使用的术语“变体多肽”、“经修饰的氨基酸序列”或“经修饰的多肽”表示与参考多肽相差一个或多个氨基酸(例如,相差一个或多个氨基酸置换、缺失和/或添加)的氨基酸序列。在一个方面,变体是保留参考多肽的一些或全部能力的“功能变体”。
61.术语“功能变体”进一步包括保守置换的变体。术语“保守置换的变体”表示这样的肽:其具有与参考肽相差一个或多个保守氨基酸置换的氨基酸序列并且维持参考肽的一些或全部活性。“保守氨基酸置换”是用功能相似的残基置换氨基酸残基。保守置换的例子包括:用一个非极性的(疏水的)残基诸如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸置换另一个;用一个带电荷的或极性的(亲水的)残基置换另一个,诸如在精氨酸和赖氨酸之间、在谷氨酰胺和天冬酰胺之间、在苏氨酸和丝氨酸之间;用一个碱性残基诸如赖氨酸或精氨酸置换另一个;或用一个酸性残基诸如天冬氨酸或谷氨酸置换另一个;或用一个芳族残基诸如苯丙氨酸、酪氨酸或色氨酸置换另一个。预期这样的置换对蛋白或多肽的表观分子量或等电点几乎没有影响或根本没有影响。短语“保守置换的变体”还包括其中残基被化学衍生的残基替代的肽,前提条件是,所得到的肽维持如本文所述的参考肽的一些或全部活性。
62.与主题技术的多肽相关的术语“变体”进一步包括功能活性多肽,其氨基酸序列与参考多肽的氨基酸序列具有至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少
81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%和甚至100%同一性。
63.以它的所有语法形式和拼写变化表示的术语“同源的”表示具有共同进化起源的多核苷酸或多肽之间的关系,包括来自超家族的多核苷酸或多肽以及来自不同物种的同源多核苷酸或蛋白(reeck等人, cell 50:667, 1987)。此类多核苷酸或多肽具有序列同源性,如其序列相似性所反映的,无论是在同一性百分比方面还是特定氨基酸或基序在保守位置处的存在方面。例如,两个同源多肽可以具有至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少900至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%和甚至100%同一性的氨基酸序列。
64.ꢀ“
合适的调节序列”将被赋予其对于本领域普通技术人员来说普通且惯用的含义,并且非限制地用于表示这样的核苷酸序列:其位于编码序列的上游(5'非编码序列)、内部、或下游(3'非编码序列),并且其影响相关编码序列的转录、rna加工或稳定性或翻译。调节序列可以包括启动子、翻译前导序列、内含子和多腺苷酸化识别序列。
[0065]“启动子”将被赋予其对于本领域普通技术人员来说普通且惯用的含义,并且非限制地用于表示能够控制编码序列或功能性rna的表达的dna序列。一般而言,编码序列位于启动子序列的3'。启动子可以全部源自天然基因,或者由源自在自然界中发现的不同启动子的不同元件组成,或者甚至包含合成的dna区段。本领域技术人员应理解,不同的启动子可以指导基因在不同组织或细胞类型中、或在不同发育阶段、或响应于不同环境条件的表达。造成基因在大多数细胞类型中在大多数时间表达的启动子通常被称为“组成型启动子”。进一步认识到,由于在大多数情况下调节序列的精确边界尚未完全确定,因此不同长度的dna片段可能具有相同的启动子活性。
[0066]
术语“可操作地连接”表示核酸序列在单个核酸片段上的缔合,使得一个的功能受另一个影响。例如,当启动子可以影响编码序列的表达(即,编码序列在启动子的转录控制下)时,启动子与编码序列可操作地连接。编码序列可以以有义或反义取向与调节序列可操作地连接。
[0067]
本文中使用的术语“表达”将被赋予其对于本领域普通技术人员来说普通且惯用的含义,并且非限制地用于表示源自主题技术的核酸片段的有义(mrna)或反义rna的转录和稳定积累。“过表达”表示在转基因或重组生物体中产生的基因产物超过了在正常或非转化生物体中的产生水平。
[0068]“转化”将被赋予其对于本领域技术人员来说普通且惯用的含义,并且非限制地用于表示多核苷酸向靶细胞中的转移。被转移的多核苷酸可以掺入到靶细胞的基因组或染色体dna中,从而产生遗传稳定的遗传特性,或者其可独立于宿主染色体进行复制。含有转化的核酸片段的宿主生物被称为“转基因的”或“转化的”。
[0069]
当在本文中与宿主细胞结合使用时,术语“转化的”、“转基因的”和“重组的”将被赋予其对于本领域普通技术人员来说各自的普通且惯用的含义,并且非限制性地用于表示已经向其中引入异源核酸分子的宿主生物体的细胞,诸如植物或微生物细胞。核酸分子可以被稳定地整合到宿主细胞的基因组中,或者核酸分子可以作为染色体外分子存在。此类
染色体外分子可以是自我复制的。转化的细胞、组织或受试者应被理解为不仅涵盖转化过程的终产物,而且涵盖其转基因后代。
[0070]
当在本文中与多核苷酸结合使用时,术语“重组的”、“异源的”和“外源的”将被赋予其对于本领域普通技术人员来说普通且惯用的含义,并且非限制性地用于表示这样的多核苷酸(例如,dna序列或基因):其源自对特定宿主细胞而言为外源的来源,或者如果源自相同来源,则相对于其原始形式被修饰。因此,宿主细胞中的异源基因包括这样的基因:其对特定宿主细胞而言为内源的,但已经通过例如使用定位诱变或其它重组技术进行修饰。该术语还包括天然存在的dna序列的非天然存在的多个拷贝。因此,该术语表示这样的dna区段:其对细胞而言为外源的或异源的,或对细胞而言为同源的,但在宿主细胞内处于通常未发现该元件的位置或形式。
[0071]
类似地,当在本文中与多肽或氨基酸序列结合使用时,术语“重组的”、“异源的”和“外源的”是指这样的多肽或氨基酸序列:其源自对特定宿主细胞而言为外源的来源,或者如果源自相同来源,则相对于其原始形式被修饰。因此,重组dna区段可以在宿主细胞中表达以产生重组多肽。
[0072]
术语“质粒”、“载体”和“盒”将被赋予其对于本领域普通技术人员来说各自的普通且惯用的含义,并且非限制性地用于表示经常携带不是细胞中心代谢的一部分的基因并且通常为环状双链dna分子形式的染色体外元件。此类元件可以是源自任何来源的、单链或双链dna或rna的、线性或环状的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已被连接或重组成独特的构建体,所述构建体能够将所选择的基因产物的启动子片段和dna序列连同适当的3'非翻译序列一起引入细胞中。“转化盒”表示含有外源基因并且除外源基因外还具有促进特定宿主细胞的转化的元件的特定载体。“表达盒”表示含有外源基因并且除外源基因外还具有允许该基因在外源宿主中增强表达的元件的特定载体。
[0073]
在某些实施方案中,本公开内容涉及udp
‑
鼠李糖的生物合成生产。在一个优选的实施方案中,本发明涉及udp
‑
l
‑
鼠李糖的生产,其化学结构显示在图1中。因为udp
‑
鼠李糖可以在含鼠李糖的甜菊糖苷诸如reb j和reb n的生物合成生产中用作鼠李糖供体部分,所以本公开内容也部分地涉及用于制备含鼠李糖的甜菊糖苷的生物合成途径,其包括例如从udp
‑
葡萄糖制备udp
‑
鼠李糖。
[0074]
参考图2,本公开内容的方面涉及反应系统,其至少包括具有upd
‑
鼠李糖合酶活性的第一重组多肽,其催化通过中间体udp
‑4‑
酮
‑6‑
脱氧葡萄糖(“udp4k6g”)从udp
‑
葡萄糖向udp
‑
鼠李糖的生物转化。在图2所示的实施方案中,第一重组多肽是催化udp
‑
葡萄糖向udp4k6g的生物转化和udp4k6g向udp
‑
鼠李糖的生物转化的三功能酶。在某些实施方案中,第一多肽可以包括两种不同的酶,每种酶负责生物转化中的不同步骤。反应系统还可以包括催化nadph的再生反应的第二多肽,nadph是用于udp
‑
葡萄糖向udp
‑
鼠李糖的生物转化的辅因子。反应系统可以进一步包括将udp和蔗糖转化成udp
‑
葡萄糖的第三重组多肽。在其中在含鼠李糖的甜菊糖苷诸如reb j和reb n的生物合成生产中将udp
‑
鼠李糖用作鼠李糖供体部分的实施方案中,反应系统可以包括具有鼠李糖基转移酶和葡萄糖基转移酶活性的另外酶。
[0075]
在植物和真菌中的udp
‑
鼠李糖生物合成途径涉及三种不同的酶。在该生物合成途
径的第一步中,udp
‑
葡萄糖4,6脱水酶(“dh”)将udp
‑
葡萄糖转化成udp
‑4‑
酮
‑6‑
脱氧葡萄糖(udp4k6g)。在该生物合成途径的第二步中,酶udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5表异构酶将udp
‑4‑
酮
‑6‑
脱氧葡萄糖转化成udp
‑4‑
酮鼠李糖。在该生物合成途径的第三个酶促步骤中,udp
‑4‑
酮鼠李糖
‑4‑
酮还原酶将udp
‑4‑
酮鼠李糖转化成udp
‑
鼠李糖。在不同的实施方案中,本发明提供了具有udp
‑
葡萄糖4,6
‑
脱水酶、udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶和udp
‑4‑
酮
‑
鼠李糖4
‑
酮
‑
还原酶活性的三功能重组多肽。这样的三功能多肽也被称作rhm酶。由于三功能的重组多肽表现出三种不同的酶功能,因此这种三功能的重组蛋白也被称作多酶蛋白。
[0076]
在某些实施方案中,本发明提供了仅具有udp
‑
葡萄糖4,6
‑
脱水酶活性的重组多肽,并且该重组多肽在本文中被称作“dh”(脱水酶)多肽。在另一个实施方案中,本发明提供了具有udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶和udp
‑4‑
酮
‑
鼠李糖4
‑
酮
‑
还原酶活性的双功能重组多肽。该双功能重组多肽在本文中被称作“er”(字母“e”代表表异构酶活性,且字母“r”代表还原酶活性)。在另一个实施方案中,本发明提供了一种重组融合多肽,其中具有udp
‑
葡萄糖4,6
‑
脱水酶活性的酶(dh多肽)与具有udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶和udp
‑4‑
酮
‑
鼠李糖4
‑
酮
‑
还原酶活性的双功能er多肽融合。发现这样的融合多肽具有催化udp
‑
葡萄糖向udp
‑
鼠李糖的转化的能力。
[0077]
在dh催化的步骤中需要辅因子nad
,且在er催化的步骤的第二步中需要辅因子nadph。
[0078]
参考表1,发明人已经鉴定了用于将udp
‑
葡萄糖生物转化成udp
‑
鼠李糖的多种三功能udp
‑
鼠李糖合酶。如在下面图6中所示,来自蓖麻的nr12 [seq id no: 1]、来自水蕨的nr32 [seq id no: 3]和来自细叶满江红的nr33 [seq id no: 5]被证实能够催化udp
‑
葡萄糖向udp
‑
鼠李糖的转化。因此,在某些实施方案中,本公开内容涉及用于制备udp
‑
鼠李糖的生物合成方法,其包括在有辅因子nad
和nadph存在下将包含与seq id no: 1、seq id no: 3或seq id no: 5具有至少80%序列同一性的氨基酸序列的重组多肽与底物诸如udp
‑
葡萄糖一起温育。
[0079]
在某些实施方案中,本公开内容涉及用于制备udp
‑
鼠李糖的生物合成方法,其包括将底物诸如udp
‑
葡萄糖与从高活性dh酶和高活性er酶的融合得到的人工融合酶一起温育。dh和er酶可以从以下实施例中所示的多种来源获得,并且它们的活性可以使用生化测定来确定。使用本领域技术人员众所周知的重组技术,可以将编码选定dh酶的核酸序列与编码选定er酶的核酸融合,以产生催化从udp
‑
葡萄糖合成udp
‑
鼠李糖的重组融合肽。dh酶和er酶可以通过肽接头偶联。在不同的实施方案中,肽接头可以包含2
‑
15个氨基酸。示例性接头包括包含甘氨酸和丝氨酸的那些。在优选的实施方案中,dh酶和er酶可以通过gsg接头偶联(表3)。
[0080]
在不同的实施方案中,可以在有蔗糖合酶(sus)存在下从udp和蔗糖原位制备udp
‑
葡萄糖。例如,sus可以具有与seq id no: 15具有至少80%序列同一性的氨基酸序列。
[0081]
如在图3
‑
5中所示,本反应系统可以包括用于再生辅因子nadph的nadp
依赖性酶和氧化反应底物。参考图3,在dh催化的反应中需要辅因子nad
,其中udp
‑
葡萄糖转化成udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖。udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖然后被udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶转化成udp
‑4‑
酮
‑
鼠李糖。udp
‑4‑
酮
‑
鼠李糖4
‑
酮
‑
还原酶将udp
‑4‑
酮
‑
鼠李糖催化
转化成udp
‑
鼠李糖的最后一步需要辅因子nadph。因此,整合可帮助再生nadph辅因子的副反应以确保udp
‑
鼠李糖的持续转化是有益的。
[0082]
继续参考图3,可以包括苹果酸和nadp
依赖性的苹果酸酶(“maeb”)以优化本途径。如显示的,在有nadp
存在下,maeb将苹果酸氧化成丙酮酸,在此过程中nadp
因子被还原回nadph,因此再生nadph用于udp
‑
鼠李糖的生物转化。
[0083]
图4显示了一个替代实施方案,其中使用了另一种nadp
依赖性酶甲酸脱氢酶(“fdh”)和甲酸。与苹果酸和maeb类似,甲酸被fdh酶氧化成co2,该酶使用nadp
作为辅因子。从甲酸除去的电子被转移到nadp
,从而将nadp
还原回nadph。
[0084]
图5显示了用于再生nadph的另一个替代实施方案。亚磷酸脱氢酶(“ptdh”),另一种示例性的nadp
依赖性酶,与亚磷酸一起添加。与苹果酸和maeb相似,亚磷酸被ptdh酶氧化成磷酸,ptdh酶使用nadp
作为辅因子。从亚磷酸中除去的电子被转移到nadp
,从而将nadp
还原回nadph。
[0085]
本公开内容的一部分涉及使用udp
‑
鼠李糖作为鼠李糖供体部分生产含鼠李糖的甜菊糖苷。回去参考图2,可以从reb a生产含鼠李糖的甜菊糖苷诸如reb j和reb n。在某些实施方案中,使用鼠李糖基转移酶(rhat)例如eu11 [seq id no. 97]、eucp1 [seq id no. 23]、hv1 [seq id no. 99]、ugt2e
‑
b [seq id no. 101]或nx114 [seq id no. 103]和鼠李糖供体部分诸如udp
‑
鼠李糖,可以将reb a转化成reb j。随后,使用udp
‑
糖基转移酶(ugt)例如ugt76g1 [seq id no. 107]、cp1 [seq id no. 25]、cp2 [seq id no. 105]或ugt76g1和sus的融合酶[seq id no. 109],可以将reb j转化成reb n。
实施例
[0086]
实施例1udp
‑
鼠李糖合酶的酶活性筛选使用种系发生、基因簇和蛋白blast分析来鉴定候选udp
‑
鼠李糖合酶(“rhm”)基因,其用于从udp
‑
葡萄糖生产udp
‑
鼠李糖。根据大肠杆菌的密码子偏好(gene universal, de),优化和合成所有候选rhm基因的全长dna片段。将合成的dna片段克隆进细菌表达载体petite n
‑
his sumo kan vector (lucigen)中。
[0087]
将每种表达构建体转化到大肠杆菌bl21 (de3)中,然后使其在37℃在含有50
µ
g/ml卡那霉素的lb培养基中生长直到达到0.8
‑
1.0的od
600
。通过添加1 mm异丙基β
‑
d
‑1‑
硫代吡喃半乳糖苷(iptg)诱导蛋白表达,并将培养物在16℃进一步温育22小时。通过离心(3,000 x g; 10 min; 4℃)收获细胞。收集细胞沉淀物并立即使用或在
‑
80℃储存。
[0088]
通常将细胞沉淀物重新悬浮在裂解缓冲液(50 mm磷酸钾缓冲液, ph 7.2, 25
µ
g/ml溶菌酶, 5
µ
g/ml dna酶i, 20 mm咪唑, 500 mm nacl, 10%甘油,和0.4%triton x
‑
100)中。将细胞在4℃通过声处理破碎,并通过离心(18,000 x g; 30 min)澄清细胞碎片。将上清液加载到平衡过的(平衡缓冲液: 50 mm磷酸钾缓冲液, ph 7.2, 20 mm咪唑, 500 mm nacl, 10%甘油) ni
‑
nta (qiagen)亲和柱。加载蛋白样品后,将柱用平衡缓冲液洗涤以除去未结合的污染物蛋白。用含有250 mm咪唑的平衡缓冲液洗脱his
‑
标记的rhm重组多肽。
[0089]
通过使用udp
‑
葡萄糖作为底物,测定纯化的候选物rhm重组多肽的udp
‑
鼠李糖合酶活性。通常,在200
µ
l体外反应系统中试验重组多肽(20
‑
50
µ
g)。反应系统含有50 mm磷酸
钾缓冲液ph 8.0、3mm mgcl2、3
‑
6mm udp
‑
葡萄糖、1
‑
3mm nad
、1mm dtt和1
‑
3mm nadph。反应在30
‑
37℃进行,并通过加入200
µ
l氯仿终止反应。将样品用等体积氯仿通过vertex萃取10分钟。离心10分钟后,收集上清液用于高效液相色谱法(hplc)分析。
[0090]
然后使用agilent 1200系统(agilent technologies, ca)进行hplc分析,该系统包括四元泵、控温柱隔室、自动进样器和uv吸光度检测器。使用dionex carbo pa10柱(4x120mm, thermo scientific)进行色谱分离,流动相以1ml/min的流速递送。流动相为h2o (mpa)和700 mm乙酸铵(ph 5.2) (mpb)。mpb的梯度浓度被编程用于样品分析。在hplc分析中使用的检测波长为261nm。活性筛选以后,将三种rhm酶(nr12、nr32和nr33)鉴定为udp
‑
葡萄糖向udp
‑
鼠李糖的生物转化的候选物(表1)。
[0091]
在三个不同的时间段(3小时、6小时和18小时)研究了三种不同的rhm酶即nr12、nr32和nr33的活性。在3小时结束时的酶活性显示在图6的顶部小图(a)中。在6小时和18小时结束时的酶活性分别显示在图6的中间小图(b)和底部小图(c)中。此外,在这些实验中,还努力理解在这三种rhm酶的udp
‑
葡萄糖4,6脱水酶组分作用期间nadph对nad
的还原的影响。在一种实验条件下,在实验开始时加入辅因子nad
和nadph。该流程变形被称为“一步辅因子添加”,并在图6中在酶名称后用字母“a”标记(nr12
‑
a、nr32
‑
a和nr33
‑
a)。在第二组实验中,在实验开始时加入nad
,且直到反应已经开始后3小时才加入nadph。该过程变形被称为“两步辅因子添加”,在图6中在酶名称后用字母“b”标记(nr12
‑
b、nr32
‑
b和nr33
‑
b)。
[0092]
继续参考图6,可以看出,在两种因子都存在的情况下,所有三种候选酶早在3小时标记时就开始产生udp
‑
鼠李糖(小图a)。当延长反应更长的反应时间时,产生更多的udp
‑
鼠李糖(图6中的小图b和c)。对于一步辅因子添加方案,nr32
‑
a在三种候选酶中表现出最高的udp
‑
鼠李糖生产活性(在18小时时为0.57g/l udp
‑
rh)。在该第一组实验(a)中,观察到,nr12
‑
a具有高udp
‑
葡萄糖4,6
‑
脱水酶(dh)活性,但非常低的udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶和udp
‑4‑
酮
‑
鼠李糖4
‑
酮
‑
还原酶(er)活性,如从udp
‑
葡萄糖(udpg)向udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖(udp4k6g)的高水平(几乎完全)转化所证明的。这些结果表明,所有三种酶都是udp
‑
葡萄糖向udp
‑
鼠李糖的生物转化的三功能udp
‑
鼠李糖合酶。
[0093]
另外,发明人还发现,两步辅因子添加方案可以提高转化效率,表明后期nadph添加可以避免udp
‑
鼠李糖对dh酶的负反馈调节。在两步辅因子添加过程中,在初始反应中加入nad
,并在3小时后在反应中加入nadph。如在图6中所示,nr32 (nr32
‑
b)和nr33 (nr33
‑
b)都具有比一步反应(nr32
‑
a和nr33
‑
a)更高的udp
‑
鼠李糖生产。nr32
‑
b具有最高的产生udp
‑
rh的活性,在18小时达到1.1g/l udp
‑
rh(小图c)。与第一组实验的结果一致,nr12
‑
b表现出高dh活性但非常低的er活性,如从udp
‑
葡萄糖向udp4k6g的高水平转化所证明的,但udp
‑
鼠李糖产生非常少。
[0094]
这些结果表明,两步辅因子添加方案可以用于提高从udp
‑
葡萄糖向udp
‑
鼠李糖的转化效率。
[0095]
实施例2辅因子的两步添加图7显示了根据本公开内容的两步辅因子添加方案可以如何在涉及三功能酶nrf1的反应中提高udp
‑
鼠李糖生产的转化效率。在两步反应(b
‑
1小时、b
‑
3小时、b
‑
4小时、b
‑
6小时、b
‑
18小时)中,在初始反应中加入nad
。udpg底物在3小时(b
‑
3小时)时通过dh活性完全
转化成udp
‑4‑
酮
‑6‑
脱氧葡萄糖。然后在反应中加入nadph,并证实udp
‑4‑
酮
‑6‑
脱氧葡萄糖在18小时(b
‑
18小时)已完全转化成udp
‑
鼠李糖。在一步反应(a
‑
1小时、a
‑
3小时、a
‑
4小时、a
‑
6小时、a
‑
18小时)中,在初始反应中加入nad 和nadph,且udpg未完全转化成udp
‑
鼠李糖,从而支持所报道的udp
‑
鼠李糖对dh活性具有负反馈作用。在两种方案(“a”表示一步方案,且“b”表示两步方案)下,在1小时、3小时、4小时、6小时和18小时后测量udp
‑
葡萄糖(udpg)、udp
‑4‑
酮
‑6‑
脱氧葡萄糖(udp4k6g)和udp
‑
鼠李糖(udp
‑
rh)的水平。
[0096]
实施例3用于体外合成udp
‑
鼠李糖的一锅多酶系统的优化蔗糖合酶(sus)可以分解一分子的蔗糖以产生一分子的果糖和一分子的葡萄糖。此外,sus可以将一个葡萄糖转移到udp以形成udp
‑
葡萄糖。因此,通过在原料中包含蔗糖、udp和sus,可以在有蔗糖合酶存在下补充本文公开的udp
‑
鼠李糖合成途径中所需的udp
‑
葡萄糖组分。
[0097]
另外,nadph是er活性的关键辅因子。在er催化的反应过程中,nadph被氧化为nadp
。通过整合nadp
依赖性的氧化反应作为本文公开的udp
‑
鼠李糖合成的一部分,可以再生nadph。示例性的nadp
依赖性的氧化反应包括苹果酸氧化成丙酮酸、甲酸氧化成co2、和亚磷酸氧化成磷酸。通过在原料中包含苹果酸、甲酸或亚磷酸以及可以催化这些氧化反应中的每一种的相应酶(分别为maeb、fdh和ptdh),nadph不断再生,从而进一步优化总udp
‑
鼠李糖产量。表1提供了关于各种酶的序列的信息。
[0098]
在该实施例中,使用两步辅因子添加方案在一锅多酶反应系统中使用起始材料的不同组合进行了六个不同的实验。表2提供了在该实验中试验的六个不同反应系统的组成。
[0099]
在六个系统中的每一个中,都不包括udp
‑
葡萄糖。相反,提供了udp、蔗糖和sus来生产所需的udp
‑
葡萄糖。参考图8,来自系统1的结果表明产生了udp
‑
葡萄糖,从而证实sus可以将udp完全转化成udp
‑
葡萄糖。通过与rhm酶(例如,nrf1)一起提供蔗糖合酶(sus),可以使用udp作为底物生产udp
‑
鼠李糖(系统2)。
[0100]
实验还证实了nadph再生在udp
‑
鼠李糖生产中的作用。继续参考图8,通过在含有少量nadph的反应系统(系统4)中加入maeb酶和苹果酸,仍然可以获得高水平的udp
‑
鼠李糖,从而证实了nadph的再生。相比之下,在包含相同量的nadph但不存在maeb酶的系统3中,产生低得多的量的udp
‑
rh。类似地,在含有少量nadp
的反应系统(系统5和6)中,如果存在maeb酶,添加的nadp
可以被maeb转化成nadph,并不断再生nadph用于udp
‑
鼠李糖生产(系统6)。在系统6中仅用1mm nadp
获得的udp
‑
鼠李糖的量与在系统2中用3mm nadph获得的量相当。相比之下,在不包括nadph且不包括maeb的系统5中,几乎没有任何udp4k6g被转化成udp
‑
鼠李糖。如上所述,苹果酸/maeb系统可以被其它nadp
依赖性的氧化系统诸如甲酸/fdh和亚磷酸/ptdh替代。
[0101]
实施例4udp
‑
葡萄糖4,6
‑
脱水酶的酶活性筛选udp
‑
葡萄糖4,6
‑
脱水酶(dh)可以催化udp
‑
葡萄糖(udpg)向udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖(udp4k6g)的生物转化的酶反应。为了鉴定特定的dh酶,基于多基因遗传分析和blast分析来选择酶候选物。
[0102]
商业合成所有候选dh基因的全长dna片段。cdna的几乎所有密码子都被更改为大
肠杆菌偏好的密码子(gene universal, de)。将合成的dna克隆进细菌表达载体petite n
‑
his sumo kan vector (lucigen)中。
[0103]
将每个表达构建体转化到大肠杆菌bl21 (de3)中,并随后在37℃在含有50
µ
g/ml卡那霉素的lb培养基中生长直到达到0.8
‑
1.0的od600。通过添加1 mm异丙基β
‑
d
‑1‑
硫代吡喃半乳糖苷(iptg)诱导蛋白表达,并将培养物在16℃进一步培养22小时。通过离心(3,000 x g; 10 min; 4℃)收获细胞。收集细胞沉淀物并立即使用或在
‑
80℃储存。
[0104]
通常将细胞沉淀物重新悬浮在裂解缓冲液(50 mm磷酸钾缓冲液, ph 7.2, 25ug/ml溶菌酶, 5ug/ml dna酶i, 20 mm咪唑, 500 mm nacl, 10%甘油,和0.4%triton x
‑
100)中。在4℃下通过声处理破碎细胞,并通过离心(18,000 x g; 30 min)澄清细胞碎片。将上清液加载到平衡过的(平衡缓冲液: 50 mm磷酸钾缓冲液, ph 7.2, 20 mm咪唑, 500 mm nacl, 10%甘油) ni
‑
nta (qiagen)亲和柱上。加载蛋白样品后,用平衡缓冲液洗涤柱以除去未结合的污染物蛋白。将his
‑
标记的dh重组多肽用含有250mm咪唑的平衡缓冲液洗脱。
[0105]
通过使用udpg作为底物,测定纯化的候选物dh重组多肽的udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖合成。通常,在200
µ
l体外反应系统中试验重组多肽(20
µ
g)。反应系统含有50 mm磷酸钾缓冲液ph 8.0、3mm mgcl2、3mm udpg、3mm nad
和1mm dtt。反应在30
‑
37℃进行,并通过加入200
µ
l氯仿终止反应。将样品用等体积氯仿通过vertex萃取10分钟。离心10分钟后,收集上清液用于高效液相色谱法(hplc)分析。
[0106]
然后使用agilent 1200系统(agilent technologies, ca)进行hplc分析,该系统包括四元泵、控温柱隔室、自动进样器和uv吸光度检测器。使用dionex carbo pa10柱(4x120mm, thermo scientific)进行色谱分离,流动相以1ml/min的流速递送。流动相为h2o (mpa)和700 mm乙酸铵(ph 5.2) (mpb)。mpb的梯度浓度被编程用于样品分析。在hplc分析中使用的检测波长为261nm。
[0107]
活性筛选以后,鉴定了12种新颖的dh酶,用于将udpg生物转化成udp4k6g (表1)。如在图9中所示,dh酶对于udp4k6g生产显示出不同水平的酶活性。此外,六种候选物(nr15n、nr53n、nr58n、nr62n、nr64n和nr65n)也显示出udp
‑
鼠李糖生产的低酶活性,表明这些酶可能具有从udpg合成udp
‑
l
‑
鼠李糖的三功能活性(rhm)。
[0108]
实施例5双功能的udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶/udp
‑4‑
酮鼠李糖4
‑
酮还原酶的酶活性筛选双功能的udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖3,5
‑
表异构酶/udp
‑4‑
酮鼠李糖4
‑
酮还原酶(er)酶可以将udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖转化成udp
‑
β
‑
l
‑
鼠李糖。为了鉴定特定的er酶,基于多基因遗传分析和blast分析选择了某些酶候选物。
[0109]
商业合成所有候选er基因的全长dna片段。cdna的几乎所有密码子都被更改为大肠杆菌偏好的密码子(gene universal, de)。将合成的dna克隆进细菌表达载体petite n
‑
his sumo kan vector (lucigen)中。
[0110]
将每个表达构建体转化到大肠杆菌bl21 (de3)中,并随后在37℃在含有50
µ
g/ml卡那霉素的lb培养基中生长直到达到0.8
‑
1.0的od600。通过添加1 mm异丙基β
‑
d
‑1‑
硫代吡喃半乳糖苷(iptg)诱导蛋白表达,并将培养物在16℃进一步培养22小时。通过离心(3,000 x g; 10 min; 4℃)收获细胞。收集细胞沉淀物并立即使用或在
‑
80℃储存。
[0111]
通常将细胞沉淀物重新悬浮在裂解缓冲液(50 mm磷酸钾缓冲液, ph 7.2, 25ug/ml溶菌酶, 5ug/ml dna酶i, 20 mm咪唑, 500 mm nacl, 10%甘油,和0.4%triton x
‑
100)中。将细胞在4℃下通过声处理破碎,并通过离心(18,000 x g; 30 min)澄清细胞碎片。将上清液加载到平衡过的(平衡缓冲液: 50 mm磷酸钾缓冲液, ph 7.2, 20 mm咪唑, 500 mm nacl, 10%甘油) ni
‑
nta (qiagen)亲和柱。加载蛋白样品后,将柱用平衡缓冲液洗涤以除去未结合的污染物蛋白。用含有250mm咪唑的平衡缓冲液洗脱his
‑
标记的er重组多肽。
[0112]
通过使用udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖(udp4k6g)作为底物,测定纯化的候选物er重组多肽的udp
‑
鼠李糖合成。通常,在200
µ
l体外反应系统中试验重组多肽(20
µ
g)。反应系统含有50 mm磷酸钾缓冲液ph 8.0、3mm mgcl2、3mm udp
‑4‑
酮
‑6‑
脱氧葡萄糖、3mm nadph和1mm dtt。反应在30
‑
37℃进行,并通过加入200
µ
l氯仿终止反应。将样品用等体积氯仿通过vertex萃取10分钟。离心10分钟后,收集上清液用于高效液相色谱法(hplc)分析。
[0113]
然后使用agilent 1200系统(agilent technologies, ca)进行hplc分析,该系统包括四元泵、控温柱隔室、自动进样器和uv吸光度检测器。使用dionex carbo pa10柱(4x120mm, thermo scientific)进行色谱分离,流动相以1ml/min的流速递送。流动相为h2o (mpa)和700 mm乙酸铵(ph 5.2) (mpb)。mpb的梯度浓度被编程用于样品分析。在hplc分析中使用的检测波长为261nm。
[0114]
活性筛选以后,鉴定了17种新颖的er酶,用于将udp
‑4‑
酮
‑6‑
脱氧
‑
葡萄糖生物转化成udp
‑
l
‑
鼠李糖(表1)。如在图10中所示,17种候选物对于udp
‑
l
‑
鼠李糖生产显示出不同水平的酶活性。在17种酶候选物中,以下酶显示出高er活性:nr21c、nr37c、nr40c、nr41c和nr46c。
[0115]
实施例6鉴定用于udp
‑
鼠李糖生产的新颖融合酶通过重组dna技术对融合酶的构建可用于获得具有udp
‑
鼠李糖合酶活性的新型三功能酶。但是,两种功能酶的融合不一定提供具有两种酶组分活性的活性融合酶。此外,合适的接头经常只能凭经验鉴定。
[0116]
基于对各种dh和er酶候选物以及三功能rhm酶的n
‑
端和c
‑
端结构域的广泛筛选,鉴定并筛选了一系列具有特定dh和er结构域的融合酶。
[0117]
这样的进一步筛选以后,发现六种融合酶具有将udp
‑
葡萄糖生物转化成udp
‑
鼠李糖的三功能活性(表3)。
[0118]
具体地,这些融合酶中的五种是基于与不同er酶(nx5c、nx13、nr5c、nr40c和nr41c)融合的高活性dh酶nx10,即nrf1 (nx10
‑
nx5c)、nrf2 (nx10
‑
nx13)、nrf3 (nx10
‑
nr5c)、nrf4 (nx10
‑
nr40c)和nrf5 (nx10
‑
nr41c)。另一种具有三功能活性的融合酶nrf7 (nr66n
‑
nr41c)是基于与高活性er酶nr41c融合的高活性dh酶nr66n。如在图11中所示,nx10信号酶可以将udp
‑
葡萄糖完全转化成udp
‑4‑
酮
‑6‑
脱氧葡萄糖(udp4k6g)。同时,图11和12表明,融合酶nrf1、nrf2、nrf3、nrf4、nrf5和nrf7在两步辅因子添加反应(其中在3小时反应后加入nadph)中都具有udp
‑
鼠李糖合成的三功能活性。值得注意的是,nrf1、nrf2、nrf4、nrf5和nrf7融合酶具有比nrf3更高的酶活性。
[0119]
实施例7udp
‑
鼠李糖和甜菊糖苷生产的组合
如在共同拥有的国际申请号pct/us2019/021876(现公布为wo2019/178116a1)中所述,发明人已鉴定了用于生物合成含鼠李糖的甜菊糖苷诸如reb j和reb n的各种udp
‑
鼠李糖基转移酶(1,2 rhat)。具体而言,reb j和reb n可以从reb a和udp
‑
鼠李糖合成。
[0120]
参考图2,通过将本文公开的用于生产udp
‑
鼠李糖的生物合成途径与在国际申请号pct/us2019/021876中公开的用于从reb a生产reb j/n的生物合成途径偶联,提供了一锅多酶反应系统,用于从reb a和udp
‑
葡萄糖体外生物转化reb j/n。
[0121]
在第一步中,通过两步辅因子添加过程,通过rhm酶诸如nrf1 (seq id no: 9)将udp
‑
葡萄糖转化成udp
‑
鼠李糖。udp
‑
葡萄糖(6mm)在3小时时完全转化成udp
‑4‑
酮
‑6‑
脱氧葡萄糖(图13)。随后,在反应中加入0.5 mm nadp
和nadph
‑
再生系统(例如,maeb酶和苹果酸),将udp
‑4‑
酮
‑6‑
脱氧葡萄糖转化成udp
‑
鼠李糖。参考图13,在18小时后获得了几乎3 g/l的udp
‑
rh。
[0122]
在第二步中,将reb a和udp
‑
鼠李糖基转移酶诸如eucp1 (seq id no: 23)加入反应系统中。udp
‑
鼠李糖基转移酶将一个鼠李糖部分从udp
‑
鼠李糖转移到reb a底物的19
‑
o
‑
葡萄糖的c
‑2’
,从而将reb a转化成reb j。在22
‑
小时测量reb j的水平。通过hplc确认eucp1的活性,其表明reb j的存在(图14、小图c)。udp作为副产物释放。
[0123]
在第三步中,将udp
‑
糖基转移酶酶诸如cp1 (seq id no: 25)、蔗糖合酶酶诸如sus (seq id no: 15)和蔗糖加入反应混合物中。sus酶催化从udp和蔗糖产生udp
‑
葡萄糖和果糖的反应。cp1酶催化reb j向reb n的转化,具体而言,通过将一个葡萄糖基部分从udp
‑
葡萄糖转移到reb j的19
‑
o
‑
葡萄糖的c
‑
3'以产生reb n和udp。在有蔗糖存在下,产生的udp被sus酶转化回udp
‑
葡萄糖,用于udp
‑
鼠李糖和reb n生产。hplc分析证实,reb n在25小时时从reb j产生(图14, 小图d)。
[0124]
基于这些结果,并再次参考图2,本发明的一锅多酶反应可以总结如下。在反应中,udp
‑
葡萄糖可以通过两步辅因子添加过程被udp
‑
鼠李糖合酶(例如,nrf1)转化成udp
‑
鼠李糖。udp
‑
鼠李糖基转移酶(例如,eucp1)可以用于将一个鼠李糖部分从udp
‑
鼠李糖转移到reb a的19
‑
o
‑
葡萄糖的c
‑
2'以产生reb j和udp。产生的udp可以被sus酶转化成udp
‑
葡萄糖,其中使用蔗糖作为葡萄糖来源。udp
‑
糖基转移酶酶(例如,cp1)可以用于将一个葡萄糖基部分从udpg转移到reb j的19
‑
o
‑
葡萄糖的c
‑
3'以产生reb n和udp。产生的udp可以被sus酶转化回udp
‑
葡萄糖,用于udp
‑
鼠李糖和reb n生产。
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。