一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

甲醇利用的制作方法

2022-03-19 15:02:39 来源:中国专利 TAG:

甲醇利用
1.本技术要求于2019年4月19日提交的美国临时专利申请号62/836152(其的整体通过引用被并入本文)的在35u.s.c
§
119下的优先权。另外,以电子方式附随提交的序列表特此通过引用并入(文件名称:2020-04-17t_us-592pct_seq_list;文件大小:537kb;备案日期:2020年4月16日)。
2.背景
发明领域
3.本公开涉及可以使用甲醇作为碳源的重组宿主细胞的产生。


背景技术:

4.甲醇是具有化学式ch3oh的还原性一碳化合物。甲醇便宜,并且可以使用起始于煤、石油、天然气和甲烷的合成气原料进行大规模生产。然而,由于低效的甲醇同化和天然存在的生物体(包含细菌)的低产品产率,因此在工业发酵过程中使用甲醇作为碳源往往受到限制。
5.概述
6.本发明的方面涉及表达编码甲醇脱氢酶(mdh)的异源基因的重组宿主细胞,其中mdh包括与seq id no:29-56或seq id no:81-88的区至少90%一致的序列,其中所述区对应于a0a031lyd0_9gamm(seq id no:34)的第96位残基至第295位残基。
7.在一些实施方案中,mdh包括区,所述区:
8.(a)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第256位残基至第295位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第256位残基至第295位残基,所述区包括不超过十七个氨基酸置换;
9.(b)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第167位残基至第172位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第167位残基至第172位残基,所述区包括不超过三个氨基酸置换;
10.(c)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第366位残基至第369位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第366位残基至第369位残基,所述区包括不超过两个氨基酸置换;
11.(d)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第42位残基至第46位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第42位残基至第46位残基,所述区包括不超过1个氨基酸置换;
12.(e)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第101位残基至第112位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第101位残基至第112位残基,所述区包括不超过四个氨基酸置换;
13.(f)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第144位残基至第152位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第144位残基至第152位残基,
所述区包括不超过两个氨基酸置换;和/或
14.(g)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第194位残基至第211位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第194位残基至第211位残基,所述区包括不超过三个氨基酸置换。
15.在一些实施方案中,(a)中的区包括下列中的至少一种:
16.(i)与野生型a0a031lyd0_9gamm(seq id no:34)的第256位对应的残基处的亮氨酸(l)或甲硫氨酸(m);
17.(ii)与野生型a0a031lyd0_9gamm(seq id no:34)的第259位对应的残基处的缬氨酸(v)或甲硫氨酸(m);
18.(iii)与野生型a0a031lyd0_9gamm(seq id no:34)的第264位对应的残基处的丙氨酸(a)或甘氨酸(g);
19.(iv)与野生型a0a031lyd0_9gamm(seq id no:34)的第265位对应的残基处的天门冬酰胺(n)、甘氨酸(g)或丝氨酸(s);
20.(v)与野生型a0a031lyd0_9gamm(seq id no:34)的第268位对应的残基处的苯丙氨酸(f)、酪氨酸(y)或亮氨酸(l);
21.(vi)与野生型a0a031lyd0_9gamm(seq id no:34)的第271位对应的残基处的丙氨酸(a)或丝氨酸(s);
22.(vii)(vii)与野生型a0a031lyd0_9gamm(seq id no:34)的第272位对应的残基处的异亮氨酸(i)或甲硫氨酸(m);
23.(viii)(viii)与野生型a0a031lyd0_9gamm(seq id no:34)的第273位对应的残基处的丙氨酸(a)或丝氨酸(s);
24.(ix)(ix)与野生型a0a031lyd0_9gamm(seq id no:34)的第276位对应的残基处的亮氨酸(l)或缬氨酸(v);
25.(x)(x)与野生型a0a031lyd0_9gamm(seq id no:34)的第279位对应的残基处的苯丙氨酸(f)、亮氨酸(l)或缬氨酸(v);
26.(xi)(xi)与野生型a0a031lyd0_9gamm(seq id no:34)的第281位对应的残基处的天门冬酰胺(n)、天门冬氨酸(d)、甘氨酸(g)或赖氨酸(k);
27.(xii)(xii)与野生型a0a031lyd0_9gamm(seq id no:34)的第282位对应的残基处的亮氨酸(l)、甲硫氨酸(m)或苯丙氨酸(f);
28.(xiii)(xiii)与野生型a0a031lyd0_9gamm(seq id no:34)的第283位对应的残基处的脯氨酸(p)或谷氨酰胺(q);
29.(xiv)(xiv)与野生型a0a031lyd0_9gamm(seq id no:34)的第286位对应的残基处的缬氨酸(v)或异亮氨酸(i);
30.(xv)(xv)与野生型a0a031lyd0_9gamm(seq id no:34)的第287位对应的残基处的丙氨酸(a)或半胱氨酸(c);
31.(xvi)(xvi)与野生型a0a031lyd0_9gamm(seq id no:34)的第289位对应的残基处的丙氨酸(a)或丝氨酸(s);
32.(xvii)(xvii)与野生型a0a031lyd0_9gamm(seq id no:34)的第290位对应的残基处的亮氨酸(l)、缬氨酸(v)或异亮氨酸(i);
33.(xviii)(xviii)与野生型a0a031lyd0_9gamm(seq id no:34)的第291位对应的残基处的亮氨酸(l)或缬氨酸(v);以及
34.(xix)(xix)与野生型a0a031lyd0_9gamm(seq id no:34)的第292位对应的残基处的甲硫氨酸(m)或亮氨酸(l)。
35.在一些实施方案中,mdh包括区,所述区:
36.(a)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第256位残基至第295位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第256位残基至第295位残基,所述区包括不超过三个氨基酸置换;
37.(b)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第167位残基至第172位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第167位残基至第172位残基,所述区包括不超过一个氨基酸置换;和/或
38.(c)对应于野生型a0a031lyd0_9gamm(seq id no:34)的第366位残基至第369位残基,其中相对于野生型a0a031lyd0_9gamm(seq id no:34)的第366位残基至第369位残基,所述区包括不超过一个氨基酸置换。
39.在一些实施方案中,(b)中的区包括与野生型a0a031lyd0_9gamm(seq id no:34)的第169位对应的残基处的丙氨酸(a)、脯氨酸(p)或缬氨酸(v)。在一些实施方案中,(b)中的区包括与野生型a0a031lyd0_9gamm(seq id no:34)的第169位对应的残基处的缬氨酸(v)。在一些实施方案中,(c)中的区包括与野生型a0a031lyd0_9gamm(seq id no:34)的第368位对应的残基处的丙氨酸(a)、缬氨酸(v)、甘氨酸(g)或精氨酸(r)。
40.在一些实施方案中,mdh包括与野生型a0a031lyd0_9gamm(seq id no:34)的第368位对应的残基处的精氨酸(r)。在一些实施方案中,mdh还包括与a0a031lyd0_9gamm(seq id no:34)中第31位对应的氨基酸残基处的丙氨酸(a)、天门冬氨酸(d)、谷氨酸(e)、天门冬酰胺(n)、脯氨酸(p)、谷氨酰胺(q)、丝氨酸(s)、苏氨酸(t)、缬氨酸(v)或甘氨酸(g)。
41.在一些实施方案中,mdh包括与a0a031lyd0_9gamm(seq id no:34)中第31位对应的氨基酸残基处的缬氨酸(v)。在一些实施方案中,mdh还包括与a0a031lyd0_9gamm(seq id no:34)中第26位对应的氨基酸残基处的丙氨酸(a)、异亮氨酸(i)、亮氨酸(l)或缬氨酸(v)。
42.在一些实施方案中,mdh还包括与a0a031lyd0_9gamm(seq id no:34)中第26位对应的氨基酸残基处的缬氨酸(v)。在一些实施方案中,相对于野生型a0a031lyd0_9gamm(seq id no:34)的序列,mdh包括超过一个氨基酸置换,其中氨基酸置换中的至少一个是保守置换。
43.在一些实施方案中,如通过xtt酶测定所测量的,与cnmdhm3相比,mdh具有至少25%的nad还原酶活性。在一些实施方案中,mdh能够催化甲醇到甲醛的转化。在一些实施方案中,如使用总蛋白和nadh的光密度所计算的,mdh具有至少20s-1
的k
cat
。在一些实施方案中,如使用总蛋白和nadh的光密度所计算的,mdh具有低于1.2m的km。在一些实施方案中,如通过总蛋白和nadh的光密度所计算的,mdh具有在300l/(mol*s)与1000l/(mol*s)之间的k
cat
/km比率。在一些实施方案中,如使用靶标蛋白浓度和nadh的浓度所计算的,mdh具有至少0.3s-1
的k
cat
。在一些实施方案中,如使用靶标蛋白浓度和nadh的浓度所计算的,mdh具有低于1.3m的km。在一些实施方案中,mdh具有在1l/(mol*s)与30l/(mol*s)之间的k
cat
/km比率。
44.在一些实施方案中,重组宿主细胞还包括编码选自seq id no:106-122或表3中的hps氨基酸序列的3-己酮糖-6-磷酸合酶(hps)的异源基因。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:135-146或表4中的phi氨基酸序列的3-己酮糖-6-磷酸异构酶(phi)的异源基因。
45.本发明的方面涉及表达编码甲醇脱氢酶(mdh)的异源基因的重组宿主细胞,其中mdh包括与对应于a0a031lyd0_9gamm(seq id no:34)的第96位残基至第295位残基的区至少90%一致的序列,并且其中mdh包括:
46.(a)与a0a031lyd0_9gamm(seq id no:34)中第26位对应的氨基酸残基处的缬氨酸(v);
47.(b)与a0a031lyd0_9gamm(seq id no:34)中第31位对应的氨基酸残基处的缬氨酸(v);
48.(c)与a0a031lyd0_9gamm(seq id no:34)中第169位对应的氨基酸残基处的缬氨酸(v);和/或
49.(d)与a0a031lyd0_9gamm(seq id no:34)中第368位对应的氨基酸残基处的精氨酸(r)。
50.在一些实施方案中,mdh包括(a)、(c)和(d)。在一些实施方案中,mdh包括(b)、(c)和(d)。在一些实施方案中,mdh包括(a)、(b)、(c)和(d)。在一些实施方案中,mdh包括(a)和(b);(a)和(c);(a)和(d);(b)和(c);(b)和(d);或(c)和(d)。在一些实施方案中,相对于野生型a0a031lyd0_9gamm(seq id no:34)的序列,mdh包括超过一个氨基酸置换,其中一个或多个氨基酸置换中的至少一个是保守氨基酸置换。
51.在一些实施方案中,如通过xtt酶测定所测量的,与cnmdhm3相比,mdh具有至少25%的nad还原酶活性。在一些实施方案中,mdh能够催化甲醇到甲醛的转化。在一些实施方案中,如使用总蛋白和nadh的光密度所计算的,mdh具有至少20s-1
的k
cat
。在一些实施方案中,如使用总蛋白和nadh的光密度所计算的,mdh具有至少0.04m的km。在一些实施方案中,mdh具有至少300的k
cat
/km比率。在一些实施方案中,如使用靶标蛋白浓度和nadh的浓度所计算的,mdh具有至少0.3s-1
的k
cat
。在一些实施方案中,如使用靶标蛋白浓度和nadh的浓度所计算的,mdh具有至少0.04m的km。在一些实施方案中,mdh具有至少1.1的k
cat
/km比率。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:106-122或表3中的hps氨基酸序列的3-己酮糖-6-磷酸合酶(hps)的异源基因。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:135-146或表4中的phi氨基酸序列的3-己酮糖-6-磷酸异构酶(phi)的异源基因。
52.本发明的方面涉及表达编码甲醇脱氢酶(mdh)的异源基因的重组宿主细胞,其中mdh包括与选自seq id no:29-56、seq id no:81-88、或表2中的mdh氨基酸序列的序列至少90%一致的序列。在一些实施方案中,相对于野生型a0a031lyd0_9gamm(seq id no:34)的序列,mdh包括至少一个氨基酸置换。在一些实施方案中,相对于野生型a0a031lyd0_9gamm(seq id no:34)的序列,mdh包括超过一个氨基酸置换,其中氨基酸置换中的至少一个是保守氨基酸置换。在一些实施方案中,如通过xtt酶测定所测量的,与cnmdhm3相比,mdh具有至少25%的nad还原酶活性。在一些实施方案中,mdh能够催化甲醇到甲醛的转化。在一些实施方案中,如使用总蛋白和nadh的光密度所计算的,mdh具有至少20s-1
的k
cat
。在一些实施方案
中,如使用总蛋白和nadh的光密度所计算的,mdh具有至少0.04m的km。在一些实施方案中,mdh具有至少300的k
cat
/km比率。在一些实施方案中,如使用靶标蛋白浓度和nadh的浓度所计算的,mdh具有至少0.3s-1
的k
cat
。在一些实施方案中,如使用靶标蛋白浓度和nadh的浓度所计算的,mdh具有至少0.04m的km。在一些实施方案中,mdh具有至少1.1的k
cat
/km比率。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:106-122或表3中的hps氨基酸序列的3-己酮糖-6-磷酸合酶(hps)的异源基因。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:135-146或表4中的phi氨基酸序列的3-己酮糖-6-磷酸异构酶(phi)的异源基因。
53.本发明的方面涉及表达编码3-己酮糖-6-磷酸(hps)的异源基因的重组宿主细胞,其中hps包括与seq id no:106-122的区至少90%一致的序列,其中所述区对应于野生型a0a0m4m0f0(seq id no:106)的第26位残基至第151位残基。
54.在一些实施方案中,hps包括区,所述区包括:
55.(a)与野生型a0a0m4m0f0(seq id no:6)的第4位对应的残基处的谷氨酰胺(q);
56.(b)与野生型a0a0m4m0f0(seq id no:6)的第6位对应的残基处的丙氨酸(a);
57.(c)与野生型a0a0m4m0f0(seq id no:6)的第8位对应的残基处的天门冬氨酸(d);
58.(d)与野生型a0a0m4m0f0(seq id no:6)的第27位对应的残基处的天门冬氨酸(d);
59.(e)与野生型a0a0m4m0f0(seq id no:6)的第30位对应的残基处的谷氨酸(e);
60.(f)与野生型a0a0m4m0f0(seq id no:6)的第32位对应的残基处的甘氨酸(g);
61.(g)与野生型a0a0m4m0f0(seq id no:6)的第33位对应的残基处的苏氨酸(t);
62.(h)与野生型a0a0m4m0f0(seq id no:6)的第34位对应的残基处的脯氨酸(p);
63.(i)与野生型a0a0m4m0f0(seq id no:6)的第40位对应的残基处的甘氨酸(g);
64.(j)与野生型a0a0m4m0f0(seq id no:6)的第59位对应的残基处的天门冬氨酸(d);
65.(k)与野生型a0a0m4m0f0(seq id no:6)的第61位对应的残基处的赖氨酸(k);
66.(l)与野生型a0a0m4m0f0(seq id no:6)的第63位对应的残基处的甲硫氨酸(m);
67.(m)与野生型a0a0m4m0f0(seq id no:6)的第64位对应的残基处的天门冬氨酸(d);
68.(n)与野生型a0a0m4m0f0(seq id no:6)的第69位对应的残基处的谷氨酸(e);
69.(o)与野生型a0a0m4m0f0(seq id no:6)的第77位对应的残基处的甘氨酸(g);
70.(p)与野生型a0a0m4m0f0(seq id no:6)的第78位对应的残基处的丙氨酸(a);
71.(q)与野生型a0a0m4m0f0(seq id no:6)的第84位对应的残基处的亮氨酸(l);
72.(r)与野生型a0a0m4m0f0(seq id no:6)的第92位对应的残基处的异亮氨酸(i);
73.(s)与野生型a0a0m4m0f0(seq id no:6)的第99位对应的残基处的丙氨酸(a);
74.(t)与野生型a0a0m4m0f0(seq id no:6)的第108位对应的残基处的缬氨酸(v);
75.(u)与野生型a0a0m4m0f0(seq id no:6)的第109位对应的残基处的天门冬氨酸(d);
76.(v)与野生型a0a0m4m0f0(seq id no:6)的第120位对应的残基处的丙氨酸(a);
77.(w)与野生型a0a0m4m0f0(seq id no:6)的第127位对应的残基处的甘氨酸(g);
78.(x)与野生型a0a0m4m0f0(seq id no:6)的第134位对应的残基处的组氨酸(h);
79.(y)与野生型a0a0m4m0f0(seq id no:6)的第136位对应的残基处的甘氨酸(g);
80.(z)与野生型a0a0m4m0f0(seq id no:6)的第138位对应的残基处的天门冬氨酸(d);
81.(aa)与野生型a0a0m4m0f0(seq id no:6)的第140位对应的残基处的谷氨酰胺(q);
82.(bb)与野生型a0a0m4m0f0(seq id no:6)的第141位对应的残基处的丙氨酸(a);
83.(cc)与野生型a0a0m4m0f0(seq id no:6)的第164位对应的残基处的丙氨酸(a);
84.(dd)与野生型a0a0m4m0f0(seq id no:6)的第165位对应的残基处的甘氨酸(g);
85.(ee)与野生型a0a0m4m0f0(seq id no:6)的第166位对应的残基处的甘氨酸(g);
86.(ff)与野生型a0a0m4m0f0(seq id no:6)的第186位对应的残基处的甘氨酸(g);
87.(gg)与野生型a0a0m4m0f0(seq id no:6)的第189位对应的残基处的异亮氨酸(i);和/或
88.(hh)与野生型a0a0m4m0f0(seq id no:6)的第199位对应的残基处的丙氨酸(a)。
89.在一些实施方案中,hps能够将甲醛和核酮糖5-磷酸转化成己酮糖-6-p。在一些实施方案中,hps具有对照酶的至少50%的活性,其中对照酶是来自荚膜甲基球菌(uniprotkb-q602l4)的hps(seq id no:122)。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:29-56、seq id no:81-88、或表2中的mdh氨基酸序列的甲醇脱氢酶(mdh)的异源基因。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:135-146或表4中的phi氨基酸序列的3-己酮糖-6-磷酸异构酶(phi)的异源基因。
90.本发明的方面涉及表达编码3-己酮糖-6-磷酸(hps)的异源基因的重组宿主细胞,其中hps包括与seq id no:106-122或表3中的hps氨基酸序列中的hps至少90%一致的序列。在一些实施方案中,相对于来自荚膜甲基球菌(uniprotkb-q602l4)的hps(seq id no:122)的序列,hps包括至少一个氨基酸置换。在一些实施方案中,hps能够将甲醛和核酮糖5-磷酸转化成己酮糖-6-p。在一些实施方案中,hps具有对照酶的至少50%的活性,其中对照酶是来自荚膜甲基球菌(uniprotkb-q602l4)的hps(seq id no:122)。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:29-56、seq id no:81-88、或表2中的mdh氨基酸序列的甲醇脱氢酶(mdh)的异源基因。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:135-146或表4中的phi氨基酸序列的3-己酮糖-6-磷酸异构酶(phi)的异源基因。
91.本发明的方面涉及表达编码3-己酮糖-6-磷酸异构酶(phi)的异源基因的重组宿主细胞,其中phi包括与选自seq id no:135-146或表4中的phi氨基酸序列的phi至少90%一致的序列。在一些实施方案中,相对于来自荚膜甲基球菌的phi(seq id no:146),phi包括至少一个氨基酸置换。
92.在一些实施方案中,phi能够将己酮糖-6-磷酸转化成果糖-6-磷酸。在一些实施方案中,phi具有对照酶的至少50%的活性,其中对照酶是来自荚膜甲基球菌的phi(seq id no:146)。在一些实施方案中,重组宿主细胞还包括编码选自seq id no:29-56、seq id no:81-88、或表2中的mdh氨基酸序列的甲醇脱氢酶(mdh)的异源基因。
93.在一些实施方案中,重组宿主细胞还包括编码选自seq id no:106-122或表3中的
hps氨基酸序列的3-己酮糖-6-磷酸合酶(hps)的异源基因。在一些实施方案中,重组宿主细胞还包括与选自seq id no:217-222或表5中的rpi氨基酸序列的rpi酶至少90%一致的序列。在一些实施方案中,重组宿主细胞还包括与选自seq id no:204-210或表5中的rpe氨基酸序列的rpe酶至少90%一致的序列。在一些实施方案中,重组宿主细胞还包括与选自seq id no:241-246或表5中的tkt氨基酸序列的tkt酶至少90%一致的序列。在一些实施方案中,重组宿主细胞还包括与选自seq id no:229-234或表5中的tal氨基酸序列的tal酶至少90%一致的序列。在一些实施方案中,重组宿主细胞还包括与选自seq id no:191-196或表5中的pfk氨基酸序列的pfk酶至少90%一致的序列。在一些实施方案中,重组宿主细胞还包括与选自seq id no:166-172或表5中的glpx氨基酸序列的glpx酶至少90%一致的序列。在一些实施方案中,重组宿主细胞还包括与选自seq id no:153-158或表5中的fba氨基酸序列的fba酶至少90%一致的序列。在一些实施方案中,重组宿主细胞还包括与选自seq id no:179-184或表5中的gnd氨基酸序列的gnd酶至少90%一致的序列。在一些实施方案中,重组宿主细胞还包括与选自seq id no:253-258或表5中的zwf氨基酸序列的zwf酶至少90%一致的序列。
94.在一些实施方案中,重组宿主细胞能够产生具有至少一个来源于原料中甲醇的碳的有机化合物,原料包括用甲醇对糖类的替代。在一些情况下,有机化合物是氨基酸。在一些情况下,有机化合物是赖氨酸。在一些实施方案中,用甲醇对糖类的%重量/重量(%w/w)取代为至少5%。在一些实施方案中,原料中提供的甲醇的至少25%被重组宿主细胞消耗。在一些实施方案中,糖类是蔗糖、葡萄糖、乳糖、右旋糖、或果糖。在一些实施方案中,重组宿主细胞是大肠埃希氏菌(escherichia coli)(大肠埃希氏菌(e.coli))细胞。在一些实施方案中,重组宿主细胞还包括编码s-(羟甲基)谷胱甘肽脱氢酶的基因的敲除。在一些实施方案中,基因是frma基因。在一些实施方案中,至少一种异源基因由j23104启动子、ec-ttl-p041启动子、和/或p
gal
启动子表达。在一些实施方案中,至少两种异源基因由j23104启动子、ec-ttl-p041启动子、或p
gal
启动子驱动。
95.本发明的方面涉及产生来源于甲醇的赖氨酸的方法,方法包括在原料中培养本文所描述的重组宿主细胞,从而产生来源于甲醇的赖氨酸,原料包括用甲醇对糖类的替代。
96.在一些实施方案中,原料中用甲醇对糖类的%重量/重量(%w/w)替代为至少5%。在一些实施方案中,原料中提供的甲醇的至少25%被重组宿主细胞消耗。在一些实施方案中,糖类是蔗糖、葡萄糖、乳糖、右旋糖、或果糖。
97.本公开另外的方面涉及包括与选自seq id no:1-28、73-80、89-105、123-134、147-152、159-165、173-178、185-190、197-203、211-216、223-228、235-240和247-252的序列至少90%一致的序列的运载体(vector)。
98.本公开另外的方面涉及包括与选自seq id no:1-28、73-80、89-105、123-134、147-152、159-165、173-178、185-190、197-203、211-216、223-228、235-240和247-252的序列至少90%一致的序列的表达盒。
99.本发明的限制中的每个可以涵盖本发明的各种实施方案。因此,预期涉及任何一个要素或要素的组合的本发明的限制中的每个都可以包含在本发明的每个方面中。本发明的应用不限于在以下描述中所示或者在附图中所图示说明的构造细节和组分的布置。本发明能够具有其他实施方案并且能够以各种方式被实践或进行。
100.附图的简要说明
101.附图并非旨在按比例绘制。附图仅是说明性的,而无需实现本公开。为了清楚起见,并非在每个附图中都标记每个组分。在附图中:
102.图1示出用于甲醇同化的核酮糖单磷酸途径(rump)的非限制性实例。
103.图2示出用于鉴别甲醇脱氢酶(mdh)的筛选库中大约6000种蛋白质的序列相似性网络(ssn)的图。
104.图3a-图3g示出隐马尔可夫模型(hmm)的序列标识图。
105.图4a-图4c示出本文公开的鉴别的二十八种mdh(seq id no:29-56)的比对。用clustalw生成比对。
106.图5是示出具有通过nash测定确定的甲醛产生活性和通过nad测定确定的甲醇依赖性nad 还原酶活性的候选mdh列表的图表。在nash测定中,示出与阳性对照相比,光密度在412nm处的吸光度。图6中描绘了nad测定。
107.图6示出具有甲醇依赖性nad 还原酶活性的mdh的筛选的结果。将值标准化为阳性对照cnmdhm3(seq id no:30)。比色测定通过由酶促反应生成的nadh来测量xtt四唑鎓染料(无色)的还原,以形成颜色鲜艳的橙色甲臜(formazan)衍生物。
108.图7a-图7b示出通过nash测定确定的经工程化的甲醇脱氢酶变体的酶活性。如通过净nad还原酶活性所测量的,与cnmdhm3和野生型a0a031lyd0_9gamm相比,不动杆菌属ver3 uniprot a0a031lyd0_9gamm的变体(1)a26v、s31v、a169v和a368r;(2)a26v、a169v和a368r;(3)a26v和a368r;或(4)s31v、a169v和a368r平均表现出改进的催化活性。cnmdhm3用作阳性对照。图7b提供来自图6中命中(hit)的四种mdh天然酶中每种的突变的列表。
109.图8示出用于表明甲醇脱氢酶活性的甲醛产生的体内nash测定的结果。cnmdhm3(seq id no:30)用作阳性对照。
110.图9a-图9b包含数据,数据示出体外nad还原酶活性(每mg蛋白质的速率)与通过nash测定确定的体内甲醇脱氢酶活性之间相关性的缺乏。cnmdhm3用作阳性对照。图9a是将图9b中示出的变体的包括重组mdh变体的细胞提取物的nad还原酶活性(每mg蛋白质的速率)与表达相同重组mdh的完整细胞中的nash活性进行比较的图。示出mdh_m3的值。图9b示出所测试的mdh变体的nadh还原酶活性值和nash活性值。
111.图10a-图10b示出基于靶标蛋白的浓度和在图6中示出的反应期间生成的nadh的信号计算的七种活性mdh酶的动力学表征。图10a示出使用总蛋白和与nadh产生结合的xtt甲臜的光吸收计算的来自细胞提取物的指定mdh中每个的k
cat
(s-1
)、km(m)和k
cat
/km比率。图10b示出使用靶标蛋白浓度和nadh的浓度计算的来自细胞提取物的指定mdh中每个的k
cat
(s-1
)、km(m)和k
cat
/km比率。通过nadh的荧光吸收的标准曲线(ex=340nm,em=445nm)计算图10b的nadh浓度。使用内标13c-肽通过绝对定量蛋白质组获得靶标蛋白浓度。*表示同位素标记的肽不可用干a0a031lydo_9gamm-a26v-a169v-a368r。
112.图11描绘了用于鉴别(1)3-己酮糖-6-磷酸合酶(hps)(左)和(2)3-己酮糖-6-磷酸异构酶(phi)的两个单独筛选库中大约1400种蛋白质的序列相似性网络(ssn)的图。
113.图12是用于筛选rump途径中的hps酶活性和phi酶活性的基于四唑鎓染料的测定的示意图。比色测定测量xtt四唑鎓染料(无色)的还原,以形成颜色鲜艳的橙色甲臜衍生物。
114.图13示出在筛选测定中具有大于2的z评分的hps酶命中。
115.图14示出在筛选测定中具有大于2的z评分的phi酶命中。
116.图15示出hps酶(左)和phi酶与荚膜甲基球菌对照相比的经蛋白质标准化的反应速率。*表示菌株中的细胞生长降低。
117.图16示出使用启动子、操纵子、mrna稳定性盒、核糖体结合位点和终止子的组合生成的1152个合成子,其中基因编码8种不同的mdh酶、4种不同的hps酶和4种不同的phi酶。测量
13
c-甲醇向生物质和产物的同化(未示出)。
118.图17示出用于合成途径的各个mdh酶、hps酶和phi酶。
119.图18示出表达异源mdh、异源hps和异源phi的宿主细胞的非限制性实例,与仅用90%葡萄糖供给检测到的88%赖氨酸滴度相比,宿主细胞能够产生多达95%的赖氨酸滴度(以90%葡萄糖 10%甲醇供给)。针对不表达异源rump途径酶的对照菌株计算赖氨酸滴度比率%。
120.图19示出五十六种具有酶活性的附加rump循环酶的列表。
121.图20示出用于测定指定酶的活性的反应和确定酶活性的测定的非限制性实例。
122.图21示出编码rump循环模块的质粒的构建的示意图。质粒在一个启动子下在一个表达盒中编码mdh、hps和phi,并且在另外的启动子下编码来自图19的两个至五个其他rump循环基因。
123.详细说明
124.甲醇(ch3oh)是便宜的原料,并且可以由多种来源(包含甲烷)合成,甲烷是地球上最丰富的化石燃料化合物。然而,在工业发酵过程中使用甲醇作为碳源往往具有高生产成本和低产率(尤其是在具有多个碳碳键的更复杂的化合物的生产中)。本公开至少部分地以出乎意料的发现(重组宿主细胞可以被工程化以有效地使用甲醇作为碳源例如以产生赖氨酸)为前提。因此,本文提供重组宿主细胞,所述重组宿主细胞被工程化以表达甲醇脱氢酶(mdh)、3-己酮糖-6-磷酸合酶(己酮糖磷酸合酶,hps)和3-己酮糖-6-磷酸异构酶(磷酸己酮糖异构酶,phi)、或其组合。本公开还提供用于制造氨基酸(包含赖氨酸)的方法(例如,使用表达mdh、hps和/或phi的重组宿主细胞)。
125.如本文所使用的,甲基营养型生物是能够甲醇同化(即,能够使用不包含碳-碳键的甲基化合物作为碳源)的生物体。不具有碳-碳键的甲基化合物包含甲烷和甲醇。
126.图1是甲基营养型生物甲醇芽孢杆菌(bacillus methanolicus)中的核酮糖单磷酸途径(rump)的非限制性实例。在rump途径中,通过甲醇脱氢酶(mdh)将甲醇转化成甲醛,并且用核酮糖5-磷酸(ru-5-p)固定甲醛以通过3-己酮糖-6-磷酸合酶(hps)形成己酮糖-6-磷酸(h-6-p)。然后,通过3-己酮糖-6-磷酸异构酶(phi)将己酮糖-6-磷酸(h-6-p)异构化成果糖6-磷酸(f-6-p)。通过磷酸果糖激酶(pfk)将f-6-p转化成果糖-1,6-二磷酸(f-1,6-dp)。果糖二磷酸醛缩酶(fba)由f-1,6-dp形成二羟丙酮磷酸(dhap)。dhap可以用于形成磷酸-烯醇-丙酮酸和丙酮酸。然后,将丙酮酸转化成乙酰辅酶a,乙酰辅酶a可以进入克雷布氏循环(柠檬酸循环,tca)以产生中间产物(包含草酰乙酸盐,草酰乙酸盐是赖氨酸的前体)。同时,丙酮酸或磷酸-烯醇-丙酮酸也可以被羧化成oaa,oaa是赖氨酸的前体。通过缩合成3个核酮糖-5-磷酸分子的三个甲醛分子的同化,产生三个β-d-呋喃果糖-6-磷酸(fmp)分子,以用于一个三磷酸分子(ga3p或dhap)的净产生。
127.甲醇脱氢酶(mdh)
128.本公开的方面提供甲醇脱氢酶(mdh),甲醇脱氢酶(mdh)可以例如在增加生物体(包含细菌和酵母)中的甲醇同化中有用。如本文所使用的,mdh能够将甲醇转化成甲醛。在一些实施方案中,mdh可以能够将乙醇或丁醇转化成甲醛。
129.作为非限制性实例,一种类型的mdh使用烟酰胺腺嘌呤(nad)辅因子(例如,烟酰胺腺嘌呤二核苷酸(nad )或烟酰胺腺嘌呤二核苷酸磷酸(nadp ))作为底物。作为非限制性实例,nad依赖性mdh可以结合金属离子(包含铁和镁或锌和镁)。参见,例如,hektor,et al.,j biol chem.2002dec 6;277(49):46966-73。在一些实施方案中,mdh是iii型铁依赖性醇脱氢酶。
130.作为非限制性实例,可以通过搜索具有保守醇脱氢酶域的序列(例如,pfam家族鉴别号pf00465)来鉴别醇脱氢酶。然后,可以使用本文所描述的方法或本领域已知的任何方法测试推定的醇脱氢酶的mdh活性。
131.本公开的mdh酶可以包含与seq id no:1-28、seq id no:73-80、seq id no:29-56或seq id no:81-88所示的序列(例如,核酸序列或氨基酸序列)、或者与表2中或图5-图6中的序列至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
132.在一些实施方案中,编码mdh酶的核酸序列可以是经密码子优化的(例如,用于在特定宿主细胞(包含细菌)中的表达)。
133.与本发明的方面相容的mdh酶可以来源于任何物种。适合的物种的非限制性实例包含弗氏柠檬酸杆菌(citrobacter freundii)、沃氏奈瑟氏菌(neisseria wadsworthii)、佛朗哥氏菌(franconibacter)、富养罗尔斯通氏菌(ralstonia eutropha)、荚壳伯克霍尔德氏菌(burkholderia glumae)、无色杆菌(achromobacter)、肠共生杆菌(commensalibacter intestini)、肠杆菌科细菌(enterobacteriaceae bacterium)、假单胞菌(pseudomonas)、丛毛单胞菌科细菌(comamonadaceae bacterium)、雷金斯堡约克氏菌(yokenella regensburgei)、恶臭假单胞菌(pseudomonas putida)、杀虫贪铜菌(cupriavidus necator)、栖苏打菌属活泼节杆菌(nitrincola lacisaponensis)、泉布拉格菌(pragia fontium)、荧光假单胞菌(pseudomonas fluorescens)、桔梗朝井杆菌(asaia platycodi)、菊苣假单胞菌(pseudomonas cichorii)、希瓦氏菌属p1-14-1(shewanella sp.p1-14-1)、编织奈瑟氏菌(neisseria weaveri)、奥德赛赖氨酸芽孢杆菌(lysinibacillus odysseyi)、约氏不动杆菌(acinetobacter johnsonii)、紫色色杆菌(chromobacterium violaceum)、胶状红长命菌(rubrivivax gelatinosus)、嗜水气单胞菌(aeromonas hydrophila)、罗伊赫海源菌(idiomarina loihiensis)、格尔纳不动杆菌(acinetobacter gerneri)、不动杆菌属ver3(acinetobacter sp.ver3)、奥奈达希瓦氏菌(shewanella oneidensis)、乳酪短杆菌(brevibacterium casei)、嗜甲基菌节杆菌(arthrobacter methylotrophus)、胃分枝杆菌(mycobacterium gastri)、红城红球菌
(rhodococcus erythropolis)、嗜甲基拟无枝酸菌(amycolatopsis methanolica)、甲醇芽孢杆菌(bacillus methanolicus)、甲醇酸单胞菌(acidomonas methanolica)、金黄甲基帽菌(methylocapsa aurea)、猫阿菲波菌(afipia felis)、angulomicrobium tetraedrale、扭脱甲基杆菌(methylobacterium extorquens)、江苏甲基球状菌(methlyopila jiangsuensis)、不饱和烃副球菌(paracoccus alkenifer)、瓜类鞘氨醇单胞菌(sphingomonas melonis)、二氯甲烷屈曲杆菌(ancylobacter dichloromethanicus)、争论贪噬菌(variovorax paradoxus)、methylophilus glucosoxydans、广泛嗜甲基营养菌(methyloversatilis universalis)、水甲基养菌(methylibium aquaticum)、印度发光杆菌(photobacterium indicum)、氧化硫噬甲基菌(methylophaga thiooxydans)、荚膜甲基球菌(methylococcus capsulatus)、产酸克雷伯菌(klebsiella oxytoca)、隔粘帚霉(gliocladium deliquescens)、宛氏拟青霉(paecilomyces variotii)、木素木霉(trichoderma lignorum)、博伊丁假丝酵母(candida boidini)、荚膜汉逊酵母(hansenula capsulatus)、毕赤酵母(pichia pastoris)、产黄青霉(penicillium chrysogenum)和印度发光杆菌。在一些实施方案中,mdh来源于能够将甲醇转化成甲醛的真核物种(例如,毕赤酵母属)。适合的物种包含图5-图6和表2中示出的那些物种。也参见,例如,kolb and stacheter,front microbiol.2013sep 5;4:268。
134.在一些实施方案中,本公开的mdh能够使用甲醇(meoh或ch3oh)和/或较长链的醇作为底物。作为非限制性实例,较长链的醇可以包含化学式c
nh2n 1
oh,其中n大于1。在一些实施方案中,本公开的mdh能够产生甲醛(ch2o或fald)。在一些实施方案中,本公开的mdh催化自甲醇的甲醛形成。
135.应当理解的是,可以通过本领域普通技术人员已知的任何方式测量mdh的活性。在一些实施方案中,可以通过确定酶的甲醇脱氢酶活性来测量mdh的活性。作为非限制性实例,可以使用四唑鎓染料(例如,xtt)测量甲醇脱氢酶活性。参见,例如,实施例1。也可以通过测量由mdh酶产生的甲醛的水平(例如,使用nash测定)来确定mdh活性。参见,例如,nash,biochem j.1953oct;55(3):416-21。可以在细胞裂解物中、在完整细胞中、或者以分离的mdh测量mdh的活性。
136.在一些实施方案中,本公开的mdh(例如,在细胞裂解物中、在完整细胞中、或者作为分离的mdh)的活性(例如,比活性)比对照的活性大至少1.1倍(例如,至少1.3倍、至少1.5倍、至少1.7倍、至少1.9倍、至少2倍、至少2.5倍、至少3倍、至少4倍、至少5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或至少100倍,包含之间的全部值)。作为非限制性实例,对照可以是不包含感兴趣的mdh的细胞。在一些实施方案中,对照是来自甲醇芽孢杆菌或杀虫贪铜菌n-1的mdh(例如,seq id no:30或32)(例如,在细胞裂解物中、在完整细胞中、或者作为分离的mdh)。在某些实施方案中,对照是野生型mdh序列。在某些实施方案中,在细胞或细胞裂解物中测量mdh的活性,并且与对照进行比较,对照是细胞或细胞裂解物、不包含mdh。
137.在一些实施方案中,本公开的mdh的活性(例如,比活性)为对照mdh(例如,cnmdhm3、a0a031lyd0_9gamm、和/或野生型mdh)的活性(例如,比活性)的至少1%、至少5%、至少10%、至少15%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至
少160%、至少170%、至少180%、至少190%、至少200%、至少500%、至少1000%、或者之间的任何值。
138.作为非限制性实例,可以通过确定nad还原酶活性(例如,使用常规xtt酶活性测定)来测量重组宿主细胞或细胞裂解物的mdh活性。参见,例如,用于xtt酶活性测定的图6中提供的图。在一些实施方案中,与对照细胞相比,包括本文所描述的mdh中任何一种的重组宿主细胞具有至少5%、至少10%、至少20%、至少25%、至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少140%、至少150%、至少160%、至少170%、至少180%、至少190%、至少200%、至少500%、或至少1000%的nad还原酶活性。在一些实施方案中,对照细胞表达编码cnmdhm3、a0a031lyd0_9gamm、和/或野生型mdh的异源基因。在一些实施方案中,对照细胞具有内源mdh表达。在一些实施方案中,对照细胞不内源地表达mdh。作为非限制性实例,也可以确定分离的mdh的nad还原酶活性并且与对照mdh(例如,cnmdhm3、a0a031lyd0_9gamm和/或野生型mdh)进行比较。
139.可以通过常规方法确定细胞裂解物中mdh酶的催化常数(k
cat
)值。例如,可以基于总细胞蛋白浓度和nadh光密度的计算或者基于细胞裂解物中靶标蛋白浓度和nadh浓度的计算来确定k
cat
值。在一些实施方案中,本公开提供具有至少0.01s-1
、至少0.05s-1
、至少0.1s-1
、至少0.5s-1
、至少1s-1
、至少5s-1
、至少10s-1
、至少15s-1
、至少20s-1
、至少25s-1
、至少30s-1
、至少40s-1
、至少50s-1
、至少60s-1
、至少70s-1
、至少80s-1
、至少90s-1
、至少100s-1
、至少125s-1
、至少150s-1
、至少175s-1
、至少200s-1
、至少225s-1
、至少250s-1
、至少275s-1
、至少300s-1
、至少325s-1
、至少350s-1
、至少375s-1
、至少400s-1
、至少450s-1
、至少500s-1
、至少550s-1
、至少600s-1
、至少700s-1
、至少800s-1
、至少900s-1
、或至少1000s-1
的k
cat
的mdh酶。
140.也可以使用常规方法以分离的蛋白质来测量mdh酶的k
cat
值。分离的mdh酶的k
cat
值可以为至少0.01s-1
、至少0.05s-1
、至少0.1s-1
、至少0.5s-1
、至少1s-1
、至少5s-1
、至少10s-1
、至少15s-1
、至少20s-1
、至少25s-1
、至少30s-1
、至少40s-1
、至少50s-1
、至少60s-1
、至少70s-1
、至少80s-1
、至少90s-1
、至少100s-1
、至少125s-1
、至少150s-1
、至少175s-1
、至少200s-1
、至少225s-1
、至少250s-1
、至少275s-1
、至少300s-1
、至少325s-1
、至少350s-1
、至少375s-1
、至少400s-1
、至少450s-1
、至少500s-1
、至少550s-1
、至少600s-1
、至少700s-1
、至少800s-1
、至少900s-1
、或至少1000s-1

141.也可以计算本文所描述的mdh酶中的任何一种在细胞裂解物中的km或者容许酶达到半数v
max
的底物的浓度。可以基于总细胞蛋白浓度和nadh光密度的计算或者基于细胞裂解物中靶标蛋白浓度和nadh浓度的计算来确定细胞裂解物中mdh酶的km。在一些实施方案中,本公开的重组宿主细胞可以包含具有下列km值的mdh:小于0.001m、小于0.005m、小于0.01m、小于0.02m、小于0.03m、小于0.04m、小于0.05m、小于0.06m、小于0.07m、小于0.08m、小于0.09m、小于0.1m、小于0.2m、小于0.3m、小于0.4m、小于0.5m、小于0.6m、小于0.7m、小于0.8m、小于0.9m、小于1m、小于1.1m、小于1.2m、小于1.3m、小于1.4m、小于1.5m、小于1.6m、小于1.7m、小于1.8m、小于1.9m、小于2m、小于3m、小于5m、小于10m、或者之间的任何值。
142.可以使用常规方法确定分离的mdh的km值。在一些实施方案中,本公开的分离的mdh可以具有下列km值:小于0.001m、小于0.005m、小于0.01m、小于0.02m、小于0.03m小于、
小于0.04m、小于0.05m、小于0.06m、小于0.07m、小于0.08m、小于0.09m、小于0.1m、小于0.2m、小于0.3m、小于0.4m、小于0.5m、小于0.6m、小于0.7m、小于0.8m、小于0.9m、小于1m、小于1.1m、小于1.2m、小于1.3m、小于1.4m、小于1.5m、小于1.6m、小于1.7m、小于1.8m、小于1.9m、小于2m、小于3m、小于5m、小于10m、或者之间的任何值。
143.在一些实施方案中,本公开提供具有一k
cat
/km比率的mdh酶,所述k
cat
/km比率大于0.001l/(mol*s)、大于0.005l/(mol*s)、大于1l/(mol*s)、大于5l/(mol*s)、大于10l/(mol*s)、大于20l/(mol*s)、大于30l/(mol*s)、大于40l/(mol*s)、大于50l/(mol*s)、大于60l/(mol*s)、大于70l/(mol*s)、大于80l/(mol*s)、大于90l/(mol*s)、大于100l/(mol*s)、大于200l/(mol*s)、大于300l/(mol*s)、大于400l/(mol*s)、大于500l/(mol*s)、大于600l/(mol*s)、大于700l/(mol*s)、大于800l/(mol*s)、大于900l/(mol*s)、大于1000l/(mol*s)、大于2500l/(mol*s)、大于5000l/(mol*s)、大于10000l/(mol*s)、或者之间的任何值。可以在细胞裂解物中或针对分离的mdh酶计算mdh酶的k
cat
/km比率。
144.在一些实施方案中,本公开的mdh酶具有从约100l/(mol*s)至约1500l/(mol*s)的k
cat
/km比率。在一些实施方案中,如基于总蛋白和nadh的光密度所计算的,k
cat
/km比率为从约250l/(mol*s)至约1000l/(mol*s)。在一些实施方案中,如基于总蛋白和nadh的光密度所计算的,k
cat
/km比率为从约300l/(mol*s)至约600l/(mol*s)。在一些实施方案中,如基于总蛋白和nadh的光密度所计算的,k
cat
/km比率为至少300l/(mol*s)、至少400l/(mol*s)、至少500l/(mol*s)、至少600l/(mol*s)、至少700l/(mol*s)、至少800l/(mol*s)、至少900l/(mol*s)、或至少1000l/(mol*s)。
145.在一些实施方案中,本公开提供具有基于靶标蛋白和nadh的浓度所计算的从约1l/(mol*s)至约75l/(mol*s)的k
cat
/km比率的mdh酶。在一些实施方案中,如基于靶标蛋白和nadh的浓度所计算的,k
cat
/km比率为从约1l/(mol*s)至约30l/(mol*s)。在一些实施方案中,如基于靶标蛋白和nadh的浓度所计算的,k
cat
/km比率为从约10l/(mol*s)至约50l/(mol*s)。在一些实施方案中,如基于靶标蛋白和nadh的浓度所计算的,k
cat
/km比率为从约1l/(mol*s)至约10l/(mol*s)或至约30l/(mol*s)。在一些实施方案中,如基于靶标蛋白和nadh的浓度所计算的,k
cat
/km比率为至少1l/(mol*s)、至少10l/(mol*s)、至少20l/(mol*s)、至少25l/(mol*s)、或至少50l/(mol*s)。
146.应当理解的是,本领域普通技术人员将能够基于与蛋白质相关的结构信息和/或功能信息将蛋白质表征为mdh酶。例如,在一些实施方案中,蛋白质可以基于其功能(如由甲醇产生甲醛的能力)被表征为mdh酶。在一些实施方案中,本公开的mdh酶是十聚体。在一些实施方案中,本公开的mdh酶在与来自甲醇芽孢杆菌(uniprotkb数据库参考号:p31005)的mdh的第100位对应的位置处包含天门冬氨酸(d)残基、在与来自甲醇芽孢杆菌(uniprotkb数据库参考号:p31005)的第103位对应的位置处包含赖氨酸(k)残基,或其组合。
147.如本文所使用的,当使用本领域已知的氨基酸序列比对工具(如,例如,clustal omega或)比对序列x和序列y、序列“x”中的残基在序列“y”中“a”的对应位置处时,序列“x”中的残基(如核酸残基或氨基酸残基)被称为与不同序列“y”中的位置或残基(如核酸残基或氨基酸残基)对应。
148.在一些实施方案中,与不表达异源基因的相同重组宿主细胞相比,表达编码mdh酶的异源基因的重组宿主细胞多产生至少10%、20%、30%、40%、50%、60%、70%、80%、
90%、或100%的甲醛。
149.在一些实施方案中,与对照mdh酶(例如,cnmdhm3、a0a031lyd0_9gamm、和/或野生型mdh)相比,mdh酶(例如,分离的mdh酶)多产生至少10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%甲醛。
150.在其他实施方案中,基于蛋白质与已知mdh酶之间的百分比一致性,蛋白质可以被表征为mdh酶。例如,蛋白质可以与本文描述的mdh序列中任何一种或者任何其他mdh酶的序列至少10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%(包含之间的全部值)一致。在其他实施方案中,基于与mdh酶相关的蛋白质中的一个或更多个域(例如,醇脱氢酶域(例如,cd08551下ncbi数据库中的保守域数据库中的fe-adh)、nad(p)-结合罗斯曼折叠域、或其任何组合)的存在,蛋白质可以被表征为mdh酶。
151.在一些实施方案中,与如seq id no:1-28、seq id no:73-80、seq id no:29-56或seq id no:81-88示出的序列(例如,核酸序列或氨基酸序列)相比、或者与选自表2中的序列的序列、或选自图5-图6中的序列的序列相比,mdh序列包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少34个、至少35个、至少36个、至少37个、至少38个、至少39个、至少40个、至少41个、至少42个、至少43个、至少44个、至少45个、至少46个、至少47个、至少48个、至少49个、至少50个、至少51个、至少52个、至少53个、至少54个、至少55个、至少56个、至少57个、至少58个、至少59个、至少60个、至少61个、至少62个、至少63个、至少64个、至少65个、至少66个、至少67个、至少68个、至少69个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、或至少100个突变(包含之间的全部值)。
152.在一些实施方案中,相对于如seq id no:29-56或seq id no:81-88所示的一个或更多个mdh序列、或者相对于表2中的mdh序列、或相对于图5-图6中的mdh序列,mdh序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
153.应当理解的是,mdh可以包含与下列一致的蛋白质序列:seq id no:29-56或seq id no:81-88中所示的氨基酸序列;由相对于seq id no:1-28或seq id no:73-80中所示的序列包含同义突变的核酸序列编码的表2中的mdh氨基酸序列;或者表2中的由核酸序列编码的mdh氨基酸序列。
154.在一些实施方案中,本公开的mdh可以包含与seq id no:34至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
155.在一些实施方案中,本公开的mdh可以包含与mdh序列的高度保守区(如与seq id no:34的第96位残基至第295位残基对应的区(图4a-图4c)或者与seq id no:29-33、35-56
或81-88中任何一种的对应区对应的区(图4a-图4c))至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
156.在一些实施方案中,本公开的mdh在与图4a-图4c中描绘的一个或更多个保守残基对应的位置处包含一个或更多个保守残基。在一些实施方案中,本公开的mdh包含至少两个(例如,至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、或至少20个)残基,所述残基在与图4a-图4c中描绘的高度保守区对应的区中为保守的。
157.在一些实施方案中,本公开的mdh包含与野生型a0a031lyd0_9gamm(seq id no:34)的第256位残基至第295位残基对应的区,并且相对于野生型a0a031lyd0_9gamm(seq id no:34)的第256位残基至第295位残基,所述区包含不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、或38个氨基酸置换。作为非限制性实例,与野生型a0a031lyd0_9gamm(seq id no:34)的第256位残基至第295位残基对应的区可以包含:与野生型a0a031lyd0_9gamm(seq id no:34)的第256位对应的残基处的亮氨酸(l)或甲硫氨酸(m);与野生型a0a031lyd0_9gamm(seq id no:34)的第259位对应的残基处的缬氨酸(v)或甲硫氨酸(m);与野生型a0a031lyd0_9gamm(seq id no:34)的第264位对应的残基处的丙氨酸(a)或甘氨酸(g);与野生型a0a031lyd0_9gamm(seq id no:34)的第265位对应的残基处的天门冬酰胺(n)、甘氨酸(g)或丝氨酸(s);与野生型a0a031lyd0_9gamm(seq id no:34)的第268位对应的残基处的苯丙氨酸(f)、酪氨酸(y)或亮氨酸(l);与野生型a0a031lyd0_9gamm(seq id no:34)的第271位对应的残基处的丙氨酸(a)或丝氨酸(s);与野生型a0a031lyd0_9gamm(seq id no:34)的第272位对应的残基处的异亮氨酸(i)或甲硫氨酸(m);与野生型a0a031lyd0_9gamm(seq id no:34)的第273位对应的残基处的丙氨酸(a)或丝氨酸(s);与野生型a0a031lyd0_9gamm(seq id no:34)的第276位对应的残基处的亮氨酸(l)或缬氨酸(v);与野生型a0a031lyd0_9gamm(seq id no:34)的第279位对应的残基处的苯丙氨酸(f)、亮氨酸(l)或缬氨酸(v);与野生型a0a031lyd0_9gamm(seq id no:34)的第281位对应的残基处的天门冬酰胺(n)、天门冬氨酸(d)、甘氨酸(g)或赖氨酸(k);与野生型a0a031lyd0_9gamm(seq id no:34)的第282位对应的残基处的亮氨酸(l)、甲硫氨酸(m)或苯丙氨酸(f);与野生型a0a031lyd0_9gamm(seq id no:34)的第283位对应的残基处的脯氨酸(p)或谷氨酰胺(q);与野生型a0a031lyd0_9gamm(seq id no:34)的第286位对应的残基处的缬氨酸(v)或异亮氨酸(i);与野生型a0a031lyd0_9gamm(seq id no:34)的第287位对应的残基处的丙氨酸(a)或半胱氨酸(c);与野生型a0a031lyd0_9gamm(seq id no:34)的第289位对应的残基处的丙氨酸(a)或丝氨酸(s);与野生型a0a031lyd0_9gamm(seq id no:34)的第290位对应的残基处的亮氨酸(l)、缬氨酸(v)或异亮氨酸(i);与野生型a0a031lyd0_9gamm(seq id no:34)的第291位对应的残基处的亮氨酸(l)或缬氨酸(v);和/或与野生型a0a031lyd0_9gamm(seq id no:34)的第
292位对应的残基处的甲硫氨酸(m)或亮氨酸(l)。本公开的mdh可以包含氨基酸序列lagmafnnaslgyvhamxhqlggfyxlphgvcnaxllphv(seq id no:57),其中x是任何氨基酸。在一些情况下,seq id no:57中的第18位是丙氨酸(a)或丝氨酸(s),seq id no:57中的第26位是天门冬酰胺(n)或天门冬氨酸(d),和/或seq id no:57中的第35位是亮氨酸(l)、缬氨酸(v)或异亮氨酸(i)。也参见,例如,seq id no:58。
158.本公开的mdh可以包含与野生型a0a031lyd0_9gamm(seq id no:34)的第167位残基至第172位残基对应的区,并且在一些实施方案中,相对于野生型a0a031lyd0_9gamm(seq id no:34)的第167位残基至第172位残基,所述区包含不超过1个、2个、3个、4个或5个氨基酸置换。作为非限制性实例,本公开的mdh可以包含与野生型a0a031lyd0_9gamm(seq id no:34)的第167位残基至第172位残基对应的区,并且包含与野生型a0a031lyd0_9gamm(seq id no:34)的第169位对应的残基处的缬氨酸(v)。在一些情况下,mdh包含与野生型a0a031lyd0_9gamm(seq id no:34)的第169位对应的残基处的丙氨酸(a)、脯氨酸(p)或缬氨酸(v)。在一些情况下,本公开的mdh包含氨基酸序列kmaivd(seq id no:59)、kmaiid(seq id no:60)、kfvivs(seq id no:61)、kmaivt(seq id no:62)、kmpvid(seq id no:63)、kmpvid(seq id no:64)、或kmvivd(seq id no:65)。也参见,例如,图4a-图4c。
159.本公开的mdh可以包含与野生型a0a031lyd0_9gamm(seq id no:34)的第366位残基至第369位残基对应的区,并且在一些实施方案中,相对于野生型a0a031lyd0_9gamm(seq id no:34)的第366位残基至第369位残基,所述区包含不超过1个、2个或3个氨基酸置换。在一些情况下,区包含与野生型a0a031lyd0_9gamm(seq id no:34)的第368位对应的残基处的丙氨酸(a)、缬氨酸(v)、甘氨酸(g)或精氨酸(r)。在一些情况下,区包含与野生型a0a031lyd0_9gamm(seq id no:34)的第368位对应的残基处的精氨酸(r)。作为非限制性实例,本公开的mdh可以在一些情况下包含序列kdac(seq id no:66)、kdvc(seq id no:67)、kdgn(seq id no:68)、qdvc(seq id no:69)、qdrc(seq id no:70)、ndac(seq id no:71)、或kdrc(seq id no:72)。也参见,例如,图4a-图4c。
160.本公开的mdh可以包含与野生型a0a031lyd0_9gamm(seq id no:34)的第42位残基至第46位残基对应的区。在一些情况下,相对于野生型a0a031lyd0_9gamm(seq id no:34)的第42位残基至第46位残基,与第42位残基至第46位残基对应的区包含1个、2个、3个或4个氨基酸置换。在一些情况下,相对于野生型a0a031lyd0_9gamm(seq id no:34)的第42位残基至第46位残基,区包含不超过4个(例如,不超过3个、不超过2个、或不超过1个)氨基酸置换。也参见,例如,图4a-图4c。
161.本公开的mdh可以包含与野生型a0a031lyd0_9gamm(seq id no:34)的第101位残基至第112位残基对应的区。在某些情况下,相对于野生型a0a031lyd0_9gamm(seq id no:34)的第101位残基至第112位残基,区包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或11个氨基酸置换。在某些情况下,相对于野生型a0a031lyd0_9gamm(seq id no:34)的第101位残基至第112位残基,区包含不超过11个(例如,不超过10个、不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过4个、不超过3个、不超过2个、不超过1个)氨基酸置换。也参见,例如,图4a-图4c。
162.本公开的mdh可以包含与野生型a0a031lyd0_9gamm(seq id no:34)的第144位残基至第152位残基对应的区。在某些情况下,相对于野生型a0a031lyd0_9gamm(seq id no:
34)的第144位残基至第152位残基,区包含不超过8个(例如,不超过7个、不超过6个、不超过5个、不超过4个、不超过3个、不超过2个、不超过1个)氨基酸置换。在某些情况下,相对于野生型a0a031lyd0_9gamm(seq id no:34)的第144位残基至第152位残基,区包含1个、2个、3个、4个、5个、6个、7个或8个氨基酸置换。也参见,例如,图4a-图4c。
163.本公开的mdh可以包含与野生型a0a031lyd0_9gamm(seq id no:34)的第194位残基至第211位残基对应的区。在一些情况下,相对于野生型a0a031lyd0_9gamm(seq id no:34)的第194位残基至第211位残基,区包含不超过17个(例如,不超过16个、不超过15个、不超过14个、不超过13个、不超过12个、不超过11个、不超过10个、不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过4个、不超过3个、不超过2、或不超过1个)氨基酸置换。在一些情况下,相对于野生型a0a031lyd0_9gamm(seq id no:34)的第194位残基至第211位残基,区包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或17个氨基酸置换。也参见,例如,图4a-图4c。
164.在一些情况下,mdh包含与a0a031lyd0_9gamm中第31位对应的氨基酸残基处的丙氨酸(a)、天门冬氨酸(d)、谷氨酸(e)、天门冬酰胺(n)、脯氨酸(p)、谷氨酰胺(q)、丝氨酸(s)、苏氨酸(t)、缬氨酸(v)或甘氨酸(g)。
165.在一些情况下,mdh包含与a0a031lyd0_9gamm中第26位对应的氨基酸残基处的丙氨酸(a)、异亮氨酸(i)、亮氨酸(l)或缬氨酸(v)。也参见,例如,图4a-4c。
166.在一些实施方案中,相对于不动杆菌属ver3 uniprot a0a031lyd0_9gamm(seq id no:34),本公开的mdh包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、105个、110个、115个、120个、130个、140个、150个、160个、170个、180个、190个、200个(包含之间的任何值)、或者更多个突变。在一些实施方案中,本公开的mdh包含与a0a031lyd0_9gamm(seq id no:34)中第31位、第26位、第169位、第368位、或其任何组合对应的残基处的突变。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第26位对应的残基是缬氨酸(v)或缬氨酸(v)的保守氨基酸置换。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第26位残基对应的丙氨酸(a)残基被突变成缬氨酸(v)或缬氨酸(v)的保守氨基酸置换。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第26位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第169位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第169位残基对应的丙氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第169位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第31位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第31位残基对应的丝氨酸残基被突变
成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第31位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第368位对应的残基是精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第368位残基对应的丙氨酸残基被突变成精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与a0a031lyd0_9gamm(seq id no:34)中第368位对应的残基包含带正电荷的r基团。也参见,例如,图4a-图4c。
167.在一些实施方案中,相对于a0a031lyd0_9gamm(seq id no:34),本公开的mdh包含以下突变:a26v、s31v、a169v、a368r或其组合。在一些实施方案中,相对于a0a031lyd0_9gamm(seq id no:34),本公开的mdh包含以下突变:(1)a26v、s31v、a169v和a368r;(2)a26v、a169v和a368r;(3)a26v和a368r;或(4)s31v、a169v和a368r。也参见,例如,图4a-图4c。
168.在一些实施方案中,相对于j2mtg6_psefl(seq id no:48),本公开的mdh包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个突变。在一些实施方案中,本公开的mdh包含与j2mtg6_psefl(seq id no:48)中第18位、第23位、第161位、第360位、或其任何组合对应的残基处的突变。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第18位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第18位残基对应的亮氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第18位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第23位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第23位残基对应的苏氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第23位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第161位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第161位残基对应的丙氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第161位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第360位对应的残基是精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第360位残基对应的丙氨酸残基被突变成精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与j2mtg6_psefl(seq id no:48)中第360位对应的残基包含带正电荷的r基团。
169.在一些实施方案中,相对于q5r120_idilo(seq id no:38),本公开的mdh包含1个、
2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个突变。在一些实施方案中,本公开的mdh包含与q5r120_idilo(seq id no:38)中第18位、第23位、第161位、第360位、或其任何组合对应的残基处的突变。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第18位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第18位残基对应的亮氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第18位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第23位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第23位残基对应的苏氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第23位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第161位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第161位残基对应的丙氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第161位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第360位对应的残基是精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第360位残基对应的丙氨酸残基被突变成精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q5r120_idilo(seq id no:38)中第360位对应的残基包含带正电荷的r基团。
170.在一些实施方案中,相对于uniprot c5ams6_burgb(seq id no:43),本公开的mdh包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个突变。在一些实施方案中,本公开的mdh包含与c5ams6_burgb(seq id no:43)中第26位、第31位、第169位、或第368位、或其任何组合对应的残基处的突变。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第26位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第26位残基对应的丙氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第26位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:
43)中第31位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第31位残基对应的苏氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第31位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第169位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第169位残基对应的丙氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第169位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第368位对应的残基是精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第368位残基对应的丙氨酸残基被突变成精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与c5ams6_burgb(seq id no:43)中第368位对应的残基包含带正电荷的r基团。
171.在一些实施方案中,相对于q8egv1_sheon(seq id no:46),本公开的mdh包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个突变。在一些实施方案中,本公开的mdh包含与q8egv1_sheon(seq id no:46)中第23位、第161位、第360位、或其任何组合对应的残基处的突变。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第18位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第18位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第23位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第23位残基对应的甘氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第23位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第161位对应的残基是缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第161位残基对应的丙氨酸残基被突变成缬氨酸或缬氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第161位对应的残基包含非极性脂族r基团。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第360位对应的残基是精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第360位残基对应的丙氨酸残基被突变成精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与q8egv1_sheon(seq id no:46)中第360位对应的残基包含带正电荷的r基团。
172.在一些实施方案中,相对于i3dx19_bacmt(bmadh61)(seq id no:31),本公开的mdh包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31
个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个突变。在一些实施方案中,本公开的mdh包含与bmadh61(seq id no:31)中第361位对应的残基处的突变。在一些实施方案中,mdh中与bmadh61(seq id no:31)中第361位对应的残基是精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与bmadh61(seq id no:31)中第361位对应的缬氨酸残基被突变成精氨酸或精氨酸的保守氨基酸置换。在一些实施方案中,mdh中与bmadh61(seq id no:31)中第361位对应的残基包含带正电荷的r基团。
173.在其他实施方案中,基于蛋白质的三维结构与已知mdh酶(例如,uniprotkb数据库参考号:p31005,对应于来自甲醇芽孢杆菌的mdh)的三维结构的比较,可以将蛋白质表征为mdh酶。应当理解的是,mdh酶可以为合成蛋白。
174.3-己酮糖-6-磷酸合酶(己酮糖磷酸合酶,hps)
175.本公开的方面提供3-己酮糖-6-磷酸合酶(己酮糖磷酸合酶,hps),3-己酮糖-6-磷酸合酶可以例如在增加生物体(包含细菌和酵母)中的甲醇同化中有用。
176.如本文所使用的,hps酶指能够将甲醛和核酮糖5-磷酸转化成己酮糖-6-p的酶。hps酶可以使用mn(2 )或mg(2 )作为辅因子。可以使用用于测量hps活性的任何适合的测定。参见,例如,quayle,methods enzymol.1982;90pt e:314-9。
177.在一些实施方案中,与对照酶相比,本公开的hps能够多产生至少1%、至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少200%、至少300%、至少400%、至少500%、至少600%、至少700%、至少800%、至少900%、至少1000%、或之间的任何值的己酮糖-6-p。对照hps酶可以来自荚膜甲基球菌(例如,uniprotkb-q602l4)(seq id no:122)。
178.作为非限制性实例,多酶联测定可以用于测定hps活性。例如,磷酸核糖异构酶(rpi)可以用于将核糖-5-磷酸转化成核酮糖-5-磷酸,并且分离的感兴趣的hps酶或者来自表达感兴趣的hps的重组宿主细胞的裂解物可以连同甲醛一起被引入。如果hps酶能够由核酮糖-5-磷酸和甲醛产生己酮糖-6-磷酸,则己酮糖-6-磷酸可以用作3-己酮糖-6-磷酸异构酶(phi)的底物。可以使用phi,phi可以将己酮糖-6-磷酸转化成果糖-6-磷酸。磷酸葡糖异构酶(pgi)可以用于将果糖-6-磷酸转化成葡糖-6-磷酸。最后,葡糖-6-磷酸脱氢酶(g6pdh)可以用于将葡糖-6-磷酸转化成6-磷酸葡糖酸-δ-内酯,并且由nadp 产生nadph。可以使用340nm处的吸光度测量nadph产生,或者可以将包含电子转移催化剂吩嗪硫酸甲酯(pms)的溶液连同xtt四唑鎓一起使用。如果使用pms溶液和xtt四唑鎓,则xtt四唑鎓到xtt甲臜的转化可以测量为比色读出(也参见图12)。
179.在一些实施方案中,与对照的活性相比,hps酶(例如,分离的hps、完整细胞中的hps、或细胞裂解物中的hps)具有至少1%、至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少200%、至少300%、
至少400%、至少500%、至少600%、至少700%、至少800%、至少900%、至少1000%、或之间的任何值的活性。对照可以为分离的对照hps酶、包含对照hps酶的细胞或细胞裂解物、或者不包含感兴趣的hps酶的细胞或细胞裂解物。hps对照酶的非限制性实例包含来自荚膜甲基球菌的hps。
180.hps酶可以来自任何物种(包含但不限于荚膜甲基球菌、球形节杆菌、节杆菌属ers1:01、胶质类芽孢杆菌(paenibacillus mucilaginosus)、β-变形菌(betaproteobacteria bacterium)、地下甲基热菌(methylothermus subterraneus)、溶酪巨球菌(macrococcus caseolyticus)、秋叶氏芽孢杆菌(bacillus akibai)、节杆菌属(菌株fb24)、节杆菌属(菌株fb24)、芽孢杆菌属fjat-27231、佛罗里达乳杆菌(lactobacillus floricola)、黄海芽孢杆菌(bacillus marisflavi)、类芽孢杆菌属leaf72、鲸乳杆菌dsm 22408(lactobacillus ceti dsm 22408)、类芽孢杆菌属fsl p4-0081、以及冰冻小杆菌属rit-pi-h(frigoribacterium sp.rit-pi-h)。在一些实施方案中,hps酶来自乳酪短杆菌、嗜甲基菌节杆菌、胃分枝杆菌、红城红球菌、嗜甲基拟无枝酸菌、甲醇芽孢杆菌、甲醇酸单胞菌、金黄甲基帽菌、猫阿菲波菌、angulomicrobium tetraedrale、扭脱甲基杆菌、江苏甲基球状菌、不饱和烃副球菌、瓜类鞘氨醇单胞菌、二氯甲烷屈曲杆菌、争论贪噬菌、methylophilus glucosoxydans、广泛嗜甲基营养菌、水甲基养菌、印度发光杆菌、氧化硫噬甲基菌、荚膜甲基球菌、产酸克雷伯菌、隔粘帚霉、宛氏拟青霉、木素木霉、博伊丁假丝酵母、荚膜汉逊酵母、毕赤酵母、产黄青霉、或印度发光杆菌。在一些实施方案中,hps酶来自图13中或表13中示出的物种。在一些实施方案中,hps酶来源于能够将甲醇转化成甲醛的真核物种(例如,毕赤酵母属)。
181.在一些实施方案中,与如seq id no:89-105或seq id no:106-122所示的序列(例如,核酸序列或氨基酸序列)相比、或者与表3中的hps序列或图13中的hps序列相比,本公开的hps包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
182.在一些实施方案中,相对于seq id no:106-122中所示的一个或更多个hps序列、或者相对于图13中的一个或更多个hps序列、或者相对于表13中的一个或更多个hps氨基酸序列,hps序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
183.应当理解的是,hps可以包含与以下一致的蛋白质序列:seq id no:106-122中所示的氨基酸序列;由相对于选自seq id no:89-105的序列包含同义突变的核酸序列编码的表3中的hps氨基酸序列;或者与由表3中的核酸序列编码的hps氨基酸序列相比。
184.在一些实施方案中,hps酶包含与野生型a0a0m4m0f0(seq id no:106)的第4位对应的残基处的谷氨酰胺(q);与野生型a0a0m4m0f0(seq id no:106)的第6位对应的残基处的丙氨酸(a);与野生型a0a0m4m0f0(seq id no:106)的第8位对应的残基处的天门冬氨酸(d);与野生型a0a0m4m0f0(seq id no:106)的第27位对应的残基处的天门冬氨酸(d);与野
生型a0a0m4m0f0(seq id no:106)的第30位对应的残基处的谷氨酸(e);与野生型a0a0m4m0f0(seq id no:106)的第32位对应的残基处的甘氨酸(g);与野生型a0a0m4m0f0(seq id no:106)的第33位对应的残基处的苏氨酸(t);与野生型a0a0m4m0f0(seq id no:106)的第34位对应的残基处的脯氨酸(p);与野生型a0a0m4m0f0(seq id no:106)的第40位对应的残基处的甘氨酸(g);与野生型a0a0m4m0f0(seq id no:106)的第59位对应的残基处的天门冬氨酸(d);与野生型a0a0m4m0f0(seq id no:106)的第61位对应的残基处的赖氨酸(k);与野生型a0a0m4m0f0(seq id no:106)的第63位对应的残基处的甲硫氨酸(m);与野生型a0a0m4m0f0(seq id no:106)的第64位对应的残基处的天门冬氨酸(d);与野生型a0a0m4m0f0(seq id no:106)的第69位对应的残基处的谷氨酸(e);与野生型a0a0m4m0f0(seq id no:106)的第77位对应的残基处的甘氨酸(g);与野生型a0a0m4m0f0(seq id no:106)的第78位对应的残基处的丙氨酸(a);与野生型a0a0m4m0f0(seq id no:106)的第84位对应的残基处的亮氨酸(l);与野生型a0a0m4m0f0(seq id no:106)的第92位对应的残基处的异亮氨酸(i);与野生型a0a0m4m0f0(seq id no:106)的第99位对应的残基处的丙氨酸(a);与野生型a0a0m4m0f0(seq id no:106)的第108位对应的残基处的缬氨酸(v);与野生型a0a0m4m0f0(seq id no:106)的第109位对应的残基处的天门冬氨酸(d);与野生型a0a0m4m0f0(seq id no:106)的第120位对应的残基处的丙氨酸(a);与野生型a0a0m4m0f0(seq id no:106)的第127位对应的残基处的甘氨酸(g);与野生型a0a0m4m0f0(seq id no:106)的第134位对应的残基处的组氨酸(h);与野生型a0a0m4m0f0(seq id no:106)的第136位对应的残基处的甘氨酸(g);与野生型a0a0m4m0f0(seq id no:106)的第138位对应的残基处的天门冬氨酸(d);与野生型a0a0m4m0f0(seq id no:106)的第140位对应的残基处的谷氨酰胺(q);与野生型a0a0m4m0f0(seq id no:106)的第141位对应的残基处的丙氨酸(a);与野生型a0a0m4m0f0(seq id no:106)的第164位对应的残基处的丙氨酸(a);与野生型a0a0m4m0f0(seq id no:106)的第165位对应的残基处的甘氨酸(g);与野生型a0a0m4m0f0(seq id no:106)的第166位对应的残基处的甘氨酸(g);与野生型a0a0m4m0f0(seq id no:106)的第186位对应的残基处的甘氨酸(g);与野生型a0a0m4m0f0(seq id no:106)的第189位对应的残基处的异亮氨酸(i);和/或与野生型a0a0m4m0f0(seq id no:106)的第199位对应的残基处的丙氨酸(a)。
185.在一些实施方案中,相对于a0a0m4m0f0(seq id no:106),hps酶包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少至少34个、至少35个、至少36个、3至少7个、至少38个、至少39个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、或至少200个氨基酸置换。
186.在一些实施方案中,相对于a0a0m4m0f0(seq id no:106),hps酶在不与a0a0m4m0f0(seq id no:106)的第4位、第6位、第8位、第27位、第30位、第32位、第33位、第34位、第40位、第59位、第61位、第63位、第64位、第69位、第77位、第78位、第84位、第92位、第99位、第108位、第109位、第120位、第127位、第134位、第136位、第138位、第140位、第141位、第
164位、第165位、第166位、第186位、第189位、和/或第199位对应的一个或更多个残基处包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少至少34个、至少35个、至少36个、3至少7个、至少38个、至少39个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、或至少200个氨基酸置换。
187.3-己酮糖-6-磷酸异构酶(phi)
188.本公开的另外的方面提供3-己酮糖-6-磷酸异构酶(phi)。如本文所使用的,3-己酮糖-6-磷酸异构酶(phi)是能够将3-己酮糖-6-磷酸转化成果糖-6-磷酸的酶。在一些实施方案中,phi包含与来自詹氏甲烷球菌的mj1247的第73位对应的残基处的甘氨酸(g)、与来自詹氏甲烷球菌的mj1247的第78位对应的残基处的脯氨酸(p)、和/或与来自詹氏甲烷球菌的mj1247的第84位对应的残基处的天门冬氨酸(d)、与来自詹氏甲烷球菌的mj1247的第74位对应的残基处的天门冬氨酸(d)或谷氨酸(e)、与来自詹氏甲烷球菌的mj1247的第75位对应的残基处的苏氨酸(t)、缬氨酸(v)或异亮氨酸(i)。参见,例如,martinez-cruz et al.,structure.2002feb;10(2):195-204。
189.与uniprot编号q58644对应的来自詹氏甲烷球菌的mj1247的phi序列为:
[0190][0191]
本公开的phi酶可以来自任何适合的物种(包含但不限于粪厌氧棒形菌(anaerofustis stercorihominis)、密执安棒状杆菌(clavibacter michiganensis)、霍洛诺本氏甲烷八叠球菌hb-1(methanosarcina horonobensis hb-1)、廷达尔甲烷叶菌(methanolobus tindarius)、mizuaakiibacter sediminis、乙酸甲烷八叠球菌(methanosarcina acetivorans)、溶藻弧菌(vibrio alginolyticus)、鲇爱德华氏菌(edwardsiella ictaluri)、脱氮嗜硫单胞菌(sulfurimonas denitrificans)和阴沟肠杆菌(enterobacter cloacae))。在某些实施方案中,phi酶来源于图14中示出的物种。
[0192]
任何适合的方法可以用于测量phi酶的活性。作为非限制性实例,多酶联测定可以用于测定phi活性。例如,磷酸核糖异构酶(rpi)可以用于将核糖-5-磷酸转化成核酮糖-5-磷酸,并且hps酶可以连同甲醛一起被引入以产生己酮糖-6-磷酸。可以添加感兴趣的酶(例如,分离的感兴趣的候选phi或者在细胞裂解物中),以确定酶是否能够将己酮糖-6-磷酸转化成果糖-6-磷酸。如果酶能够将己酮糖-6-磷酸转化成果糖-6-磷酸,则磷酸葡糖异构酶(pgi)将具有用于进一步加工的底物。pgi可以用于将果糖-6-磷酸转化成葡糖-6-磷酸。最后,葡糖-6-磷酸脱氢酶(g6pdh)可以用于将葡糖-6-磷酸转化成6-磷酸葡糖酸-δ-内酯,并且产生nadph。可以使用340nm处的吸光度测量nadph产生(参见,例如,taylor et al.,acta crystallogr d biol crystallogr.2001aug;57(pt 8):1138-40),或者包含电子转移催化剂吩嗪硫酸甲酯(pms)的溶液可以连同xtt四唑鎓一起使用。如果使用pms溶液和xtt四唑鎓,则xtt四唑鎓到xtt甲臜的转化可以测量为比色读出(也参见图12)。
[0193]
在一些实施方案中,与对照的活性相比,phi酶(例如,分离的phi、完整细胞中的phi、或细胞裂解物中的phi)具有至少1%、至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少200%、至少300%、至少400%、至少500%、至少600%、至少700%、至少800%、至少900%、至少1000%、或之间的任何值的活性。对照可以为分离的对照phi酶、包含对照phi酶的细胞或细胞裂解物、或者不包含感兴趣的phi酶的细胞或细胞裂解物。phi对照酶的非限制性实例包含来自荚膜甲基球菌的phi(seq id no:146)。
[0194]
在一些实施方案中,与如seq id no:123-134或seq id no:135-146所示的序列(例如,核酸序列或氨基酸序列)相比、或者与表4中的phi序列或图14中的phi序列相比,本公开的phi酶包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0195]
在一些实施方案中,相对于如seq id no:135-146所示的一个或更多个phi序列、相对于表4中的一个或更多个phi氨基酸序列、或者相对于图14中的一个或更多个phi序列,phi序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0196]
应当理解的是,phi可以包含与以下一致的蛋白质序列:选自seq id no:135-146的氨基酸序列;由相对于选自seq id no:123-134的序列包含同义突变的核酸编码的表4中的phi氨基酸序列;或者由表4中的核苷酸序列编码的phi氨基酸序列。
[0197]
附加的rump途径酶
[0198]
本公开还包含附加的rump途径酶(包含核糖-5-磷酸异构酶(rpi)、核酮糖5-磷酸3-差向异构酶(rpe)、转酮醇酶(tkt)、转醛醇酶(tal)、磷酸果糖激酶(pfk)、景天庚酮糖1,7-二磷酸酶(glpx)、果糖-二磷酸醛缩酶(fba)、6-磷酸葡糖酸脱氢酶(gnd)和葡糖-6-磷酸脱氢酶(zwf))。
[0199]
rpi酶能够催化核糖-5-磷酸到核酮糖-5-磷酸的转化。在一些实施方案中,与如seq id no:211-216或seq id no:217-222所示的序列(例如,核酸序列或氨基酸序列)相比、或者与表5中的rpi序列相比、或者与图19中的rpi序列相比,rpi酶可以包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0200]
在一些实施方案中,相对于如seq id no:217-222所示的一个或更多个rpi序列、相对于表5中的一个或更多个rpi氨基酸序列、或者相对于图19中的一个或更多个rpi序列,rpi序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0201]
应当理解的是,rpi可以包含与以下一致的蛋白质序列:选自seq id no:217-222的氨基酸序列;由相对于选自seq id no:211-216的序列包含同义突变的核酸编码的表5中的rpi氨基酸序列;或者由表5中的rpi核苷酸序列编码的rpi氨基酸序列。
[0202]
rpe酶能够催化d-核酮糖5-磷酸到d-木酮糖5-磷酸的差向异构化。在一些实施方案中,与如seq id no:197-203或seq id no:204-210所示的序列(例如,核酸序列或氨基酸序列)相比、或者与表5中的rpe序列相比、或者与图19中的rpe序列相比,rpe酶包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0203]
在一些实施方案中,相对于如seq id no:204-210所示的一个或更多个rpe序列、相对于表5中的rpe氨基酸序列、或者相对于图19中的rpe序列,rpe序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0204]
应当理解的是,rpe可以包含与以下一致的蛋白质序列:选自seq id no:204-210的氨基酸序列;由相对于选自seq id no:197-203的序列包含同义突变的核酸编码的表5中的rpe氨基酸序列;或者由表5中的rpe核苷酸序列编码的rpe氨基酸序列。
[0205]
tkt酶能够将2-碳片段从d-木酮糖-5-p转移至核糖-5-磷酸以产生景天庚酮糖-7-磷酸和甘油醛-3-p,反之亦然;能够将2-碳片段从d-木酮糖-5-p转移至醛糖赤藓糖-4-磷酸以产生果糖6-磷酸和甘油醛-3-p;或其任何组合。tkt酶可以使用辅因子二磷酸硫胺。在一些实施方案中,与如seq id no:235-240或seq id no:241-246所示的序列(例如,核酸序列或氨基酸序列)相比、或者与表5中的tkt序列相比、或者与图19中的tkt序列相比,tkt酶包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0206]
在一些实施方案中,相对于如seq id no:241-246所示的一个或更多个tkt序列、相对于表5中的tkt氨基酸序列、或者相对于图19中的tkt氨基酸序列,tkt序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0207]
应当理解的是,tkt可以包含与以下一致的蛋白质序列:选自seq id no:241-246的氨基酸序列;由相对于选自seq id no:235-240的序列包含同义突变的核酸编码的表5中的tkt氨基酸序列;或者由表5中的tkt核苷酸序列编码的tkt氨基酸序列。
[0208]
tal酶能够催化景天庚酮糖7-磷酸和d-甘油醛3-磷酸向d-赤藓糖4-磷酸和d-果糖6-磷酸的相互转化。在一些实施方案中,与如seq id no:223-228或seq id no:229-234所示的序列(例如,核酸序列或氨基酸序列)相比、与表5中的tal序列相比、或者与图19中的tal序列相比,tal酶包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至
少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0209]
在一些实施方案中,相对于如seq id no:229-234所示的一个或更多个tal序列、相对于表5中的tal氨基酸序列、或者相对于图19中的tal氨基酸序列,tal序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0210]
应当理解的是,tal可以包含与以下一致的蛋白质序列:如seq id no:229-234所示的氨基酸序列;由相对于如seq id no:223-228所示的序列包含同义突变的核酸编码的表5中的tal氨基酸序列;或者由表5中的tal核苷酸序列编码的tal氨基酸序列。
[0211]
pfk酶能够将果糖-6-磷酸转化成果糖-1,6-二磷酸。在一些实施方案中,与如seq id no:185-190或seq id no:191-196所示的序列(例如,核酸序列或氨基酸序列)相比、与表5中的pfk序列相比、或者与图19中的pfk序列相比,pfk酶包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0212]
在一些实施方案中,相对于如seq id no:191-196所示的一个或更多个pfk序列、相对于表5中的pfk氨基酸序列、或者相对于图19中的pfk序列,pfk序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0213]
应当理解的是,pfk可以包含与以下一致的蛋白质序列:选自seq id no:191-196的氨基酸序列;由相对于选自seq id no:185-190的序列包含同义突变的核酸编码的表5中的pfk氨基酸序列;或者由表5中的pfk核苷酸序列编码的pfk氨基酸序列。
[0214]
glpx酶能够使来自景天庚酮糖1,7-二磷酸的磷酸盐水解,以产生景天庚酮糖7-磷酸。在一些实施方案中,glpx酶包含与选自seq id no:159-165或seq id no:166-172的序列(例如,核酸序列或氨基酸序列)至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列,与表5中的glpx序列相比、或者与图19中的glpx序列相比,glpx酶包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、
至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0215]
在一些实施方案中,相对于如seq id no:166-172所示的一个或更多个glpx序列、相对于表5中的glpx氨基酸序列、或者相对于图19中的glpx序列,glpx序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0216]
应当理解的是,glpx可以包含与以下一致的蛋白质序列:seq id no:166-172中所示的氨基酸序列;由相对于seq id no:159-165中所示的序列包含同义突变的核酸编码的表5中的glpx氨基酸序列;或者由表5中的glpx核苷酸序列编码的glpx氨基酸序列。
[0217]
fba酶能够由β-d-果糖1,6-二磷酸产生二羟丙酮磷酸脂和d-甘油醛3-磷酸。在一些实施方案中,与如seq id no:147-152或seq id no:153-158所示的序列(例如,核酸序列或氨基酸序列)相比、与表5中的fba序列相比、或者与图19中的fba序列相比,fba酶包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0218]
在一些实施方案中,相对于如seq id no:153-158所示的一个或更多个fba序列、相对于表5中的一个或更多个fba氨基酸序列、或者相对于图19中的一个或更多个fba序列,fba序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0219]
应当理解的是,fba可以包含与以下一致的蛋白质序列:seq id no:153-158中所示的氨基酸序列;由相对于seq id no:147-152中所示的序列包含同义突变的核酸序列编码的表5中的fba氨基酸序列;或者由表5中的fba核苷酸序列编码的fba氨基酸序列。
[0220]
gnd酶能够由6-磷酸-d-葡糖酸和nadp 产生d-核酮糖5-磷酸、nadph和co2。在一些实施方案中,与seq id no:173-178或seq id no:179-184中所示的序列(例如,核酸序列或氨基酸序列)相比、与表5中的gnd序列相比、或者与图19中的gnd序列相比,gnd酶包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0221]
在一些实施方案中,相对于seq id no:179-184中所示的一个或更多个gnd序列、相对于表5中的一个或更多个gnd氨基酸序列、或者相对于图19中的一个或更多个gnd序列,gnd序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0222]
应当理解的是,gnd可以包含与以下一致的蛋白质序列:seq id no:179-184中所示的氨基酸序列;由相对于seq id no:173-178中所示的序列包含同义突变的核酸编码的表5中的gnd氨基酸序列;或者由表5中的gnd核酸序列编码的gnd氨基酸序列。
[0223]
zwf酶能够由d-葡萄糖6-磷酸和nadp 产生6-磷酸-d-葡糖酸-1,5-内酯、h


nadph。在一些实施方案中,与seq id no:247-252或seq id no:253-258中所示的序列(例如,核酸序列或氨基酸序列)相比、与表5中的zwf序列相比、或者与图19中的zwf序列相比,zwf酶包含至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)一致的序列。
[0224]
在一些实施方案中,相对于seq id no:253-258中所示的一个或更多个zwf序列、相对于表5中的一个或更多个zwf氨基酸序列、或者相对于图19中的一个或更多个zwf序列,zwf序列包含保守氨基酸置换。参见,例如,用于保守氨基酸置换的非限制性列表的表1。
[0225]
应当理解的是,zwf可以包含与以下一致的蛋白质序列:seq id no:253-258中所示的氨基酸序列;由相对于seq id no:247-252中所示的序列包含同义突变的核酸编码的表5中的zwf氨基酸序列;或者由表5中的zwf核苷酸序列编码的zwf氨基酸序列。
[0226]
变体
[0227]
本公开还包含本文所描述的序列(例如,mdh、hps、phi、或其他rump循环酶)(包含核酸序列或氨基酸序列)的变体。变体可以与参考序列共有至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)的序列一致性。
[0228]
本领域已知的术语“序列一致性”指通过序列比较(比对)确定的两个多肽或多核苷酸的序列之间的关系。在一些实施方案中,在重组序列(例如,mdh、hps、phi、或其他rump循环酶)的整个长度上确定序列一致性。在一些实施方案中,在重组序列(例如,mdh、hps、phi、或其他rump循环酶)的区(例如,一段氨基酸或核酸)上确定序列一致性。
[0229]
一致性还可以指由两个或更多个残基(例如,核酸残基或氨基酸残基)的串之间的匹配数确定的两个序列之间的序列相关性程度。一致性测量具有由特定数学模型或计算机程序(例如,“算法”)解决的空位比对(如果有的话)的两个或更多个序列中较小序列之间一致匹配的百分比。
[0230]
可以通过本领域普通技术人员已知的方法中的任何一种容易地计算相关多肽或核酸序列的一致性。可以例如使用karlin and altschul proc.natl.acad.sci.usa 87:2264-68,1990的算法、karlin and altschul proc.natl.acad.sci.usa 90:5873-77,1993中修改的算法来确定两个序列(例如,核酸序列或氨基酸序列)的“百分比一致性”。这样的算法被并入altschul et al.,j.mol.biol.215:403-10,1990的程序和程序(版本2.0)。例如,可以用xblast程序(评分=50,字长=3)进行蛋白质搜索,以获得与本发明的蛋白质分子同源的氨基酸序列。在两个序列之间存在空位的情况下,例如,如altschul et al.,nucleic acids res.25(17):3389-3402,1997中所描述
的,可以利用gapped当利用程序和gapped程序时,如本领域普通技术人员将理解的,可以使用各自程序(例如,和)的系统内定参数,或者可以适当地调整参数。
[0231]
例如,可以使用的另外的局部比对技术基于史密斯-沃特曼算法(smith,t.f.&waterman,m.s.(1981)“identification of common molecular subsequences.”j.mol.biol.147:195-197)。例如,可以使用的通用全局比对技术是基于动态编程的尼德曼-翁施算法(needleman,s.b.&wunsch,c.d.(1970)“a general method applicable to the search for similarities in the amino acid sequences of two proteins.”j.mol.biol.48:443-453)。
[0232]
最近,开发了一种快速最优全局序列比对算法(fogsaa),据称该算法比其他最优全局比对方法(包含尼德曼-翁施算法)更快地产生核酸序列和氨基酸序列的全局比对。在一些实施方案中,通过比对两个氨基酸序列、计算相同氨基酸的数量、并且除以氨基酸序列之一的长度来确定两个多肽的一致性。在一些实施方案中,通过比对两个核苷酸序列并且计算相同核苷酸的数量并且除以核酸之一的长度来确定两个核酸的一致性。
[0233]
对于多序列比对,可以使用计算机程序(包含clustal omega(sievers et al.,mol syst biol.2011oct 11;7:539))。
[0234]
如本文所使用的,变体序列可以是同源序列。如本文所使用的,同源序列是共有一定百分比一致性(例如,至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)百分比一致性)的序列(例如,核酸序列或氨基酸序列)。同源序列包含但不限于旁系同源序列或直系同源序列。旁系同源序列由物种的基因组内的基因的复制产生,而直系同源序列在物种形成事件之后趋异。
[0235]
在一些实施方案中,多肽变体(例如,mdh、hps、phi、或其他rump循环酶变体)包含与参考多肽(例如,参考mdh、参考hps、参考phi、或其他参考rump循环酶)共有二级结构(例如,α螺旋、β片层)的域。在一些实施方案中,多肽变体(例如,mdh、hps、phi、或其他rump循环酶变体)与参考多肽(例如,参考mdh、参考hps、参考phi、或其他参考rump循环酶)共有三级结构。作为非限制性实例,变体多肽(例如,mdh、hps、phi、或其他rump循环酶)与参考多肽相比可以具有低的一级序列一致性(例如,小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、或小于5%的序列一致性),但共有一个或更多个二级结构(例如,包含但不限于环、α螺旋或β片层),或者具有与参考多肽相同的三级结构。例如,环可以位于β片层与α螺旋之间、两个α螺旋之间、或两个β片层之间。同源建模可以用于比较两个或更多个三级结构。
[0236]
任何适合的方法(包含环状变换(yu and lutz,trends biotechnol.2011jan;29(1):18-25))都可以用于产生这样的变体。在环状变换中,可以环化多肽的线性一级序列(例如,通过连接序列的n末端和c末端),并且可以在不同位置处切断(“断裂”)多肽。因此,
如由线性序列比对方法(例如,clustal omega或blast)所确定的,新多肽的线性一级序列可以具有低的序列一致性(例如,小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小或小于5%(包含之间的全部值))。然而,两种蛋白质的拓扑分析可以揭示两种多肽的三级结构相似或不相似。不受特定理论的束缚,通过参考多肽的环状变换创建并且具有与参考多肽相似的三级结构的变体多肽可以共有相似的功能特性(例如,酶活性、酶动力学、底物特异性或产物特异性)。在一些情况下,环状变换可以改变二级结构、三级结构或四级结构,并且产生具有不同功能特性(例如,增加或减少的酶活性、不同的底物特异性、或不同的产物特异性)的酶。参见,例如,yu and lutz,trends biotechnol.2011jan;29(1):18-25。
[0237]
应当理解的是,在已经经历环状变换的蛋白质中,蛋白质的线性氨基酸序列将不同于尚未经历环状变换的参考蛋白质。然而,本领域普通技术人员将能够通过例如比对序列和检测保守基序、和/或通过比较蛋白质的结构或预测结构(例如,通过同源建模)容易地确定已经经历环状变换的蛋白质中的哪些残基对应于尚未经历环状变换的参考蛋白质中的残基。
[0238]
本公开也包含本文公开的重组mdh、hps、phi、或其他rump循环酶的功能变体。例如,功能变体可以结合相同底物中的一种或更多种(例如,甲醇、核酮糖-5-p、或己酮糖-6-p)或者产生相同产物中的一种或更多种(例如,甲醛、己酮糖-6-p、或果糖-6-p)。可以使用本领域已知的任何方法鉴别功能变体。例如,上文描述的karlin and altschul proc.natl.acad.sci.usa 87:2264-68,1990的算法可以用于鉴别具有已知功能的同源蛋白质。
[0239]
也可以通过搜索具有功能注释域的多肽鉴别推定的功能变体。数据库(包含pfam(sonnhammer et al.,proteins.1997jul;28(3):405-20))可以用于鉴别具有特定域的多肽。
[0240]
同源建模也可以用于鉴别适合突变而不影响功能的氨基酸残基。这样的方法的非限制性实例可以包含位置特异性评分矩阵(position-specific scoring matrix)(pssm)和能量最小化协议的使用。
[0241]
位置特异性评分矩阵(pssm)使用位置权重矩阵来鉴别共有序列(例如,基序)。可以在核酸序列或氨基酸序列上进行pssm。比对序列,并且方法考虑在特定位置处观察到的特定残基(例如,氨基酸或核苷酸)的频率和所分析的序列的数量。参见,例如,stormo et al.,nucleic acids res.1982may 11;10(9):2997-3011。可以计算在给定位置处观察到特定残基的可能性。不受特定理论的束缚,具有高变异性的序列中的位置可以适合突变(例如,pssm评分≥0)以产生功能同系物。
[0242]
pssm可以与rosetta能量函数的计算配对,rosetta能量函数确定野生型与单点突变体之间的差异。rosetta能量函数将该差异计算为(δδg
calc
)。利用rosetta函数,突变的残基与周围原子之间的键合相互作用被用于确定突变是增加还是减小蛋白质稳定性。例如,然后可以使用rosetta能量函数分析由pssm评分(例如,pssm评分≥0)指定为有利的突变,以确定突变对蛋白质稳定性的潜在影响。不受特定理论的束缚,潜在稳定化的突变对于蛋白质工程(例如,功能同系物的产生)是期望的。在一些实施方案中,潜在稳定化的突变具
有小于-0.1(例如,小于-0.2、小于-0.3、小于-0.35、小于-0.4、小于-0.45、小于-0.5、小于-0.55、小于-0.6、小于-0.65、小于-0.7、小于-0.75、小于-0.8、小于-0.85、小于-0.9、小于-0.95、或小于-1.0)rosetta能量单位(r.e.u.)的δδg
calc
值。参见,例如,goldenzweig et al.,mol cell.2016jul 21;63(2):337-346.doi:10.1016/j.molcel.2016.06.012。
[0243]
在一些实施方案中,mdh、hps、phi、或其他rump循环酶编码序列包含在与参考(例如,mdh、hps、phi、或其他rump循环酶)编码序列对应的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或超过100个位置处的突变。在一些实施方案中,相对于参考(例如,mdh、hps、phi、或其他rump循环酶)编码序列,mdh、hps、phi、或其他rump循环酶编码序列在编码序列的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99、100个或更多个密码子中包含突变。如本领域普通技术人员将理解的,由于遗传码的简并性,密码子内的突变可以改变由密码子编码的氨基酸或者可以不改变由密码子编码的氨基酸。在一些实施方案中,相对于参考多肽(例如,mdh、hps、phi、或其他rump循环酶)的氨基酸序列,编码序列中的一个或更多个突变不改变编码序列(例如,mdh、hps、phi、或其他rump循环酶)的氨基酸序列。
[0244]
在一些实施方案中,相对于参考多肽(例如,mdh、hps、phi、或其他rump循环酶)的氨基酸序列,重组mdh序列、重组hps序列、重组phi序列、或其他重组rump循环酶序列中的一个或更多个突变改变多肽(例如,mdh、hps、phi、或其他rump循环酶)的氨基酸序列。在一些实施方案中,相对于参考多肽(例如,mdh、hps、phi、或其他rump循环酶)的氨基酸序列,一个或更多个突变改变重组多肽(例如,mdh、hps、phi、或其他rump循环酶)的氨基酸序列,并且相对于参考多肽改变(增强或降低)多肽的活性。
[0245]
可以使用常规方法测量本文所描述的重组多肽(例如,mdh、hps、phi、或其他rump循环酶)中任何一种的活性(例如,比活性)。作为非限制性实例,可以通过测量重组多肽的底物特异性、产生的一种或多种产物、产生的一种或多种产物的浓度、或其任何组合来确定重组多肽的活性。如本文所使用的,重组多肽的“比活性”指每单位时间针对给定量(例如,浓度)的重组多肽产生的特定产物的量(例如,浓度)。
[0246]
本领域技术人员还将认识到,重组多肽(例如,mdh、hps、phi、或其他rump循环酶)编码序列中的突变可以造成保守氨基酸置换,以提供前述多肽的功能等效变体(例如,保留多肽活性的变体)。如本文所使用的,“保守氨基酸置换”指不改变进行氨基酸置换的蛋白质
的相对电荷特性或大小特性或功能活性的氨基酸置换。
[0247]
在一些情况下,氨基酸的特征在于其r基团(参见,例如,表1)。例如,氨基酸可以包含非极性脂族r基团、带正电荷的r基团、带负电荷的r基团、非极性芳族r基团、或极性不带电荷的r基团。包含非极性脂族r基团的氨基酸的非限制性实例包含丙氨酸、甘氨酸、缬氨酸、亮氨酸、甲硫氨酸和异亮氨酸。包含带正电荷的r基团的氨基酸的非限制性实例包含赖氨酸、精氨酸和组氨酸。包含带负电荷的r基团的氨基酸的非限制性实例包含天门冬氨酸和谷氨酸。包含非极性芳族r基团的氨基酸的非限制性实例包含苯丙氨酸、酪氨酸和色氨酸。包含极性不带电荷的r基团的氨基酸的非限制性实例包含丝氨酸、苏氨酸、半胱氨酸、脯氨酸、天门冬酰胺和谷氨酰胺。
[0248]
可以根据本领域普通技术人员已知的用于改变多肽序列的方法(如在编纂这样的方法的参考文献(例如,molecular cloning:a laboratory manual,j.sambrook,et al.,eds.,fourth edition,cold spring harbor laboratory press,cold spring harbor,new york,2012、或current protocols in molecular biology,f.m.ausubel,et al.,eds.,john wiley&sons,inc.,new york,2010)中发现的)来制备变体。
[0249]
多肽的功能等效变体的非限制性实例可以包含本文公开的蛋白质的氨基酸序列中的保守氨基酸置换。氨基酸的保守置换包含在以下组内的氨基酸之间进行的置换:(a)m、i、l、v;(b)f、y、w;(c)k、r、h;(d)a、g;(e)s、t;(f)q、n;以及(g)e、d。表1中提供保守氨基酸置换的附加的非限制性实例。
[0250]
在一些实施方案中,在制备变体多肽时,可以改变1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或超过20个残基。在一些实施方案中,氨基酸被保守氨基酸置换替代。
[0251]
表1.保守氨基酸置换的非限制性实例
[0252]
原始残基r基团类型保守氨基酸置换ala非极性脂族r基团cys、gly、serarg带正电荷的r基团his、lysasn极性不带电荷的r基团asp、gln、gluasp带负电荷的r基团asn、gln、glucys极性不带电荷的r基团ala、sergln极性不带电荷的r基团asn、asp、gluglu带负电荷的r基团asn、asp、glngly非极性脂族r基团ala、serhis带正电荷的r基团arg、tyr、trpile非极性脂族r基团leu、met、valleu非极性脂族r基团ile、met、vallys带正电荷的r基团arg、hismet非极性脂族r基团ile、leu、phe、valpro极性不带电荷的r基团 phe非极性芳族r基团met、trp、tyrser极性不带电荷的r基团ala、gly、thr
thr极性不带电荷的r基团ala、asn、sertrp非极性芳族r基团his、phe、tyr、mettyr非极性芳族r基团his、phe、trpval非极性脂族r基团ile、leu、met、thr
[0253]
可以通过改变多肽(例如,mdh、hps、phi、或其他rump循环酶)的编码序列来进行多肽的氨基酸序列中的氨基酸置换以产生具有期望特性和/或活性的重组多肽(例如,mdh、hps、phi、或其他rump循环酶)变体。类似地,通常通过改变重组多肽(例如,mdh、hps、phi、或其他rump循环酶)的编码序列来进行多肽的氨基酸序列中的保守氨基酸置换以产生多肽的功能等效变体。
[0254]
可以通过本领域普通技术人员已知的多种方法在核苷酸序列中进行突变(例如,置换)。例如,可以通过pcr定向突变、根据kunkel的方法(kunkel,proc.nat.acad.sci.u.s.a.82:488-492,1985)的定点突变、或者通过编码多肽的基因的化学合成来进行突变。
[0255]
增加甲醇同化、产生甲基营养型细胞、并且产生氨基酸的方法
[0256]
本公开的方面涉及编码酶的基因的重组表达、其功能修饰和变体、以及与其相关的应用。例如,本文所描述的方法可以用于增加甲醇同化、产生能够使用甲醇作为碳源的细胞、以及促进氨基酸产生。
[0257]
可以通过本领域已知的任何方法将编码本文所描述的重组多肽(例如,mdh、hps、phi、或其他rump循环酶)中任何一种的核酸并入任何适当的运载体中。例如,运载体可以是表达载体(包含但不限于病毒运载体(例如,慢病毒运载体、逆转录病毒运载体、腺病毒运载体、或腺相关病毒运载体)、适合于瞬时表达的任何运载体、适合于组成型表达的任何运载体、或者适合于诱导型表达的任何运载体(例如,半乳糖诱导型运载体(例如,包含p
gal
启动子)或强力霉素诱导型运载体))。下文实施例1中描述了用于重组多肽(例如,mdh、hps、phi、或其他rump循环酶)的表达的运载体的非限制性实例。
[0258]
在一些实施方案中,运载体在细胞中自主复制。运载体可以含有一个或更多个核酸内切酶限制性位点,核酸内切酶限制位点被限制性核酸内切酶切割以插入和连接含有本文所描述的基因的核酸,以产生能够在细胞中复制的重组运载体。运载体通常由dna组成,尽管rna运载体也是可用的。克隆运载体包含(但不限于):质粒、f黏粒(fosmid)、噬菌粒、病毒基因组和人工染色体。如本文所使用的,术语“表达运载体”或“表达构建体”指重组或合成生成的、具有一系列容许特定核酸在宿主细胞(例如,微生物)(如细菌细胞或酵母细胞)中转录的指定核酸元件的核酸构建体。在一些实施方案中,将本文所描述的基因的核酸序列插入克隆运载体中,使得其可操作地连接至调控序列,并且在一些实施方案中表达为rna转录物。在一些实施方案中,运载体含有一种或更多种标志物(如本文所描述的可选择的标志物),以鉴别用重组运载体转化或转染的细胞。在一些实施方案中,本文所描述的基因的核酸序列是经密码子优化的。密码子优化可以将基因产物的产量相对于未经密码子优化的参考序列增加至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%,或100%(包含之间的全部值)。
[0259]
当编码序列和调控序列共价地连接并且编码序列的表达或转录受到调控序列的
影响或控制时,编码序列和调控序列被称为“可操作地连接”。如果编码序列被翻译成功能蛋白,则如果5’调控序列中启动子的诱导转录编码序列,并且如果编码序列与调控序列之间的联接的性质不会(1)造成移码突变的引入;(2)干扰启动子区指导编码序列的转录的能力、或(3)干扰相应rna转录物被翻译成蛋白质的能力,则编码序列和调控序列被称为是可操作地连接。因此,如果启动子区转录编码序列并且转录物可以被翻译成感兴趣的蛋白质或多肽,则启动子区与编码序列可操作地连接。
[0260]
在一些实施方案中,编码本文所描述的蛋白质中的任何一种的核酸受调控序列(例如,增强子序列)的控制。在一些实施方案中,核酸在启动子的控制下表达。启动子可以是天然启动子(例如,基因在其内源环境中的启动子,该启动子提供基因表达的正常调控)。可替代地,启动子可以是与基因的天然启动子不同的启动子,例如,启动子与基因在其内源环境中的启动子不同。如本文所使用的,“异源启动子”或“重组启动子”是和与其可操作地连接的dna序列的转录并非天然地或正常地相关的启动子,或者并非天然地或正常地控制与其可操作地连接的dna序列的转录的启动子。在一些实施方案中,核苷酸序列受异源启动子的控制。
[0261]
在一些实施方案中,启动子可以驱动超过一种异源基因的表达。作为非限制性实例,一启动子可以驱动编码mdh、hps、phi、和/或任何其他rump循环酶(例如,核糖-5-磷酸异构酶(rpi)、核酮糖5-磷酸3-差向异构酶(rpe)、转酮醇酶(tkt)、转醛醇酶(tal)、磷酸果糖激酶(pfk)、景天庚酮糖1,7-二磷酸酶(glpx)、果糖-二磷酸醛缩酶(fba)、6-磷酸葡糖酸脱氢酶(gnd)和葡糖-6-磷酸脱氢酶(zwf))的异源基因的表达。在一些实施方案中,可以通过一操纵子编码mdh、hps、phi、和/或任何其他rump循环酶。在一些实施方案中,可以通过单独的操纵子编码mdh、hps、phi、和/或任何其他rump循环酶。在一些实施方案中,单独的启动子可以驱动每个异源基因的表达。
[0262]
在一些实施方案中,启动子是真核启动子。真核启动子的非限制性实例包含如本领域普通技术人员已知的tdh3、pgk1、pkc1、pdc1、tef1、tef2、rpl18b、ssa1、tdh2、pyk1、tpi1 gal1、gal10、gal7、gal3、gal2、met3、met25、hxt3、hxt7、act1、adh1、adh2、cup1-1、eno2和sod1(参见,例如,addgene网站:blog.addgene.org/plasmids-101-the-promoter-region)。在一些实施方案中,启动子是原核启动子(例如,噬菌体启动子或细菌启动子)。噬菌体启动子的非限制性实例包含pls1con、t3、t7、sp6和pl。细菌启动子的非限制性实例包含apfab101、apfab92(ec-ttl-p100)、abfab71(ec-ttl-p097)、apfab45(ec-ttl-9092)、apfab29、apfab76(ec-ttl-p075)、bba_j23104(ec ttl-p054)、j23104、ec-ttl-p041、apfab436(ec-ttl-p046)、apfab332、pbad、pmgrb、ptrc2、plac/ara、ptac和pm。
[0263]
在一些实施方案中,启动子是诱导型启动子。如本文所使用的,“诱导型启动子”是受到分子的存在或不存在控制的启动子。诱导型启动子的非限制性实例包含化学调控的启动子和物理调控的启动子。对于化学调控的启动子,转录活性可以由一种或更多种化合物(如醇、四环素、半乳糖、类固醇、金属、或其他化合物)调控。对于物理调控的启动子,转录活性可以受现象(如光或温度)的调控。四环素调控的启动子的非限制性实例包含脱水四环素(atc)响应性启动子和其他四环素响应性启动子系统(例如,四环素阻遏蛋白(tetr)、四环素操纵子序列(teto)和四环素反式激活子融合蛋白(tta))。类固醇调控的启动子的非限制性实例包含基于大鼠糖皮质激素受体、人雌激素受体、蛾蜕皮激素受体的启动子,以及来自
类固醇/类维生素a/甲状腺受体超家族的启动子。金属调控的启动子的非限制性实例包含来源于金属硫蛋白(结合并且螯合金属离子的蛋白质)基因的启动子。发病机制调控的启动子的非限制性实例包含由水杨酸、乙烯或苯并噻二唑(bth)诱导的启动子。温度/热诱导型启动子的非限制性实例包含热激启动子。光调控的启动子的非限制性实例包含来自植物细胞的光响应性启动子。在某些实施方案中,诱导型启动子是半乳糖诱导型启动子。在一些实施方案中,通过一种或更多种生理条件(例如,ph、温度、辐射、渗透压、盐水梯度、细胞表面结合、或者一种或更多种外在诱导剂或内在诱导剂的浓度)来诱导诱导型启动子。外在诱导物或诱导剂的非限制性实例包含氨基酸和氨基酸类似物、糖类和多糖、核酸、蛋白质转录激活子(activator)和阻遏子(repressor)、细胞因子、毒素、石油基化合物、含金属的化合物、盐、离子、酶底物类似物、激素或其任何组合。
[0264]
在一些实施方案中,启动子是组成型启动子。如本文所使用的,“组成型启动子”指允许基因的连续转录的未经调控的启动子。组成型启动子的非限制性实例包含tdh3、pgk1、pkc1、pdc1、tef1、tef2、rpl18b、ssa1、tdh2、pyk1,tpi1、hxt3、hxt7、act1、adh1、adh2、eno2和sod1。
[0265]
本文也预期了本领域普通技术人员已知的其他诱导型启动子或组成型启动子。
[0266]
基因表达所需的调控序列的确切性质可能在物种或细胞类型之间变化,但通常视需要包含分别涉及转录和翻译的起始的5’非转录序列和5’非翻译序列(如tata框、加帽序列、caat序列等)。特别地,这样的5’非转录调控序列将包含启动子区,该启动子区包含用于可操作地连接的基因的转录控制的启动子序列。调控序列还可以包含增强子序列或上游激活子序列。本文公开的运载体可以包含5’前导序列(leader)或信号序列。调控序列还可以包含终止子序列。在一些实施方案中,终止子序列在转录期间标记dna中基因的末端。适合于诱导异源生物体中的本文所描述的一个或更多个基因的表达的一种或更多种适当的运载体的选择和设计在本领域普通技术人员的能力和判断范围之内。
[0267]
含有表达必需元件的表达运载体是可商业获得的,并且是本领域普通技术人员已知的(参见,例如,sambrook et al.,molecular cloning:a laboratory manual,fourth edition,cold spring harbor laboratory press,2012)。
[0268]
可以在宿主细胞中表达本公开的多核苷酸和蛋白质中的任何一种。术语“宿主细胞”指可以用于表达多核苷酸(如编码酶的多核苷酸)的细胞。“重组宿主细胞”指已经通过例如克隆方法和转化方法或者通过本领域已知的其他方法(例如,选择性编辑方法)进行基因修饰的宿主细胞。
[0269]
就多核苷酸(如包括基因的多核苷酸)而言,术语“异源”与术语“外源的”和术语“重组”可互换地使用,并且指:已经被人工地提供给生物系统的多核苷酸;已经在生物系统内修饰的多核苷酸、或者已经在生物系统内操纵其表达或调控的多核苷酸。被引入宿主细胞中或者在宿主细胞中表达的异源多核苷酸可以是来自与宿主细胞不同的生物体或物种的多核苷酸,或者可以是合成的多核苷酸,或者可以是也在与宿主细胞相同的生物体或物种中内源表达的多核苷酸。例如,当在宿主细胞中内源表达的多核苷酸非天然地位于宿主细胞中;在宿主细胞中稳定或瞬时重组表达;在宿主细胞内被修饰;在宿主细胞内被选择性编辑;在宿主细胞内以不同于天然存在的拷贝数的拷贝数表达;或者在宿主细胞内以非天然方式表达(如通过操纵控制多核苷酸的表达的调控区)时,在宿主细胞中内源表达的多核
苷酸可以被认为是异源的。在一些实施方案中,异源多核苷酸是一多核苷酸,所述多核苷酸在宿主细胞中内源表达,但所述多核苷酸的表达由不天然调控多核苷酸表达的启动子驱动。在其他实施方案中,异源多核苷酸是一多核苷酸,所述多核苷酸在宿主细胞中内源表达,并且所述多核苷酸的表达由天然调控多核苷酸表达的启动子驱动,但所述启动子或另外的调控区被修饰。在一些实施方案中,启动子被重组激活或阻抑。例如,基于基因编辑的技术可以用于调控多核苷酸(包含内源多核苷酸)自启动子(包含内源启动子)的表达。参见,例如,chavez et al.,nat methods.2016jul;13(7):563-567。与参考多核苷酸序列相比,异源多核苷酸可以包括野生型序列或突变序列。
[0270]
任何适合的宿主细胞可以用于产生本文公开的重组多肽(例如,mdh、hps、phi、或其他rump循环酶)中的任何一种,宿主细胞包含真核细胞或原核细胞。适合的宿主细胞包含细菌细胞(例如,大肠埃希氏菌细胞)和真菌细胞(例如,酵母细胞)。细菌细胞属的非限制性实例包含短杆菌属、无色杆菌属、酸单胞菌属(acidomonas spp.)、不动杆菌属、气单胞菌属、阿菲波菌属(afipia spp.)、拟无枝酸菌属(amycolatopsis spp.)、anaerofustis属、屈曲杆菌属(ancylobacter spp.)、冰冻小杆菌属、发光杆菌属、肠杆菌属、角微菌属(angulomicrobium spp.)、节杆菌属、朝井杆菌属(asaia spp.)、芽孢杆菌属、β-变形菌属、伯克霍尔德氏菌属、假丝酵母属、色杆菌属、柠檬酸杆菌属、棒状杆菌属(clavibacter spp.)、丛毛单胞菌属、共生杆菌属(commensalibacter spp.)、贪铜菌属(cupriavidus spp.)、爱德华氏菌属(edwardsiella spp.)、埃希氏菌属(escherichia spp.)、佛朗哥氏菌属(franconibacter spp.)、粘帚霉属、汉逊酵母属、海源菌属(idiomarina spp.)、克雷伯菌属(klebsiella spp.)、乳杆菌属、赖氨酸芽孢杆菌属、巨球菌属(macrococcus spp.)、甲烷叶菌属(methanolobus spp.)、甲烷八叠球菌属(methanosarcina spp.)、甲烷八叠球菌属、甲基球状菌属(methlyopila spp.)、甲基养菌属(methylibium spp.)、甲基杆菌属、甲基帽菌属(methylocapsa spp.)、甲基球菌属(methylococcus spp.)、噬甲基菌属(methylophaga spp.)、嗜甲基菌属(methylophilus spp.)、甲基热菌属(methylothermus spp.)、嗜甲基营养菌属(methyloversatilis spp.)、mizuaakiibacter属、分枝杆菌属、奈瑟氏菌属、栖苏打菌属(nitrincola spp.)、拟青霉属、类芽孢杆菌属、副球菌属、青霉属、毕赤酵母属、布拉格菌属(pragia spp.)、假单胞菌属、罗尔斯通氏菌属、红球菌属、红长命菌属(rubrivivax spp.)、希瓦氏菌属、鞘氨醇单胞菌属、嗜硫单胞菌属(sulfurimonas spp.)、木霉属、贪噬菌属(variovorax spp.)、和约克氏菌属(yokenella spp.)、以及弧菌属。
[0271]
用于表达的酵母属的非限制性实例包含酵母属(例如,酿酒酵母)、毕赤酵母属、克鲁维酵母属(例如,乳酸克鲁维酵母)、汉逊酵母属和耶氏酵母属。在一些实施方案中,酵母菌株是工业多倍体酵母菌株。真菌细胞的其他非限制性实例包含获自曲霉属、青霉属、镰刀菌属、根霉属、支顶孢属、脉孢菌属、粪壳菌属、稻瘟菌属、异水霉属、黑粉菌属、葡萄孢属和木霉属的细胞。
[0272]
如本文所使用的,术语“细胞”可以指单个细胞或细胞群体(如属于相同细胞系或菌株的细胞群体)。不应当将单数术语“细胞”的使用解释为明确地指单个细胞而不是细胞群体。
[0273]
相对于野生型对应物,宿主细胞可以包含基因修饰。作为非限制性实例,宿主细胞
(例如,大肠埃希氏菌)可以被修饰以使编码s-(羟甲基)谷胱甘肽脱氢酶的基因(例如,frma)减少或失活。
[0274]
可以通过任何适合的方法(包含但不限于基因的缺失、向内源基因中引入点突变、和/或内源基因的截断)来实现基因表达的降低和/或基因失活。例如,可以使用基于聚合酶链反应(pcr)的方法(参见,例如,gardner et al.,methods mol biol.2014;1205:45-78)。作为非限制性实例,可以通过基因置换(例如,用标志物(包含选择标志物))删除基因。还可以通过转座子系统的使用来截断基因(参见,例如,poussu et al.,nucleic acids res.2005;33(12):e104)。
[0275]
可以使用本领域已知的任何方法将编码本文所描述的重组多肽(例如,mdh、hps、phi、或其他rump循环酶)中任何一种的运载体引入适合的宿主细胞中。
[0276]
hanahan methods enzymol.1991;204:63-113;gerhardt,p.r.,murray,r.g.e.,wood,w.a.&krieg,n.r.(editors)(1994).methods for general and molecular bacteriology.washington,dc:american society for microbiology;以及green,p.n.&bousfield,i.j.(1982).a taxonomic study of some gram-negative facultatively methylotrophic bacteria.j gen microbiol 128,623-638(其中的每个为此特此通过引用被整体并入)中描述了细菌转化方案的非限制性实例。
[0277]
gietz et al.,yeast transformation can be conducted by the liac/ss carrier dna/peg method.methods mol biol.2006;313:107-20(其为此特此通过引用被整体并入)中描述了酵母转化方案的非限制性实例。可以在本领域普通技术人员理解的任何适合的条件下培养宿主细胞。例如,可以使用本领域已知的任何培养基、温度和孵育条件。对于携带诱导型运载体的宿主细胞,可以用适当的诱导剂培养细胞以促进表达。
[0278]
可以在接触和/或核酸的整合之前、在接触和/或核酸的整合期间、和/或在接触和/或核酸的整合之后在任何类型(富集的或基本的)和任何组成的培养基中培养本文公开的任何细胞。如本领域普通技术人员所理解的,可以优化培养物或培养过程的条件。在一些实施方案中,选择的培养基补充有各种组分。在一些实施方案中,优化补充组分的浓度和量。在一些实施方案中,优化培养基和生长条件(例如,ph、温度等)的其他方面。在一些实施方案中,优化培养基补充一种或更多种补充组分的频率、以及培养细胞的时间量。
[0279]
可以在存在甲醇的情况下培养本公开的重组宿主细胞。在一些实施方案中,以原料中至少0.01%、至少0.05%、至少0.1%、至少0.5%、至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%(或之间的任何值)重量/重量(w/w)的糖类被甲醇替代的方式来培养重组宿主细胞。原料中糖类的非限制性实例包含但不限于蔗糖、葡萄糖、乳糖、右旋糖和果糖。
[0280]
可以通过计算以下内容来估计原料中糖类被甲醇替代的%w/w:[净
13
c-感兴趣的氨基酸%*感兴趣的氨基酸的滴度*(meoh的mw/氨基酸的mw)]/原料中的meoh滴度比率(例如,如果感兴趣的氨基酸是赖氨酸,则可以计算以下内容:[净
13
c-赖氨酸%*赖氨酸滴度*(meoh的mw/赖氨酸的mw)]/meoh滴度供给滴度),其中mw表示分子量,并且
13
c-感兴趣的氨基酸表示
13
c-标记的感兴趣的氨基酸。对于%w/w计算,使用阳性对照和阴性对照。阳性对照是供给有“正常”全剂量葡萄糖的菌株,并且阴性对照是供给有“不足”剂量的糖类(例如,葡萄
糖)并且未补充甲醇剂量的菌株。对于实验处理,菌株被供给糖类(例如,葡萄糖)和甲醇的混合物(即,与阴性(葡萄糖不足)对照中相同量的右旋糖加上尽可能多的甲醇,以达到与阳性(全葡萄糖剂量)对照中相同量的总供给碳)。氨基酸的净(天然丰度校正的)[
13
c]-质量富集(净
13
c-感兴趣的氨基酸%)可以计算为[
13
c-感兴趣的氨基酸]/[
13
c-感兴趣的氨基酸
12
c-感兴趣的氨基酸]%-13
c-感兴趣的氨基酸的天然丰度(例如,净
13
c-赖氨酸%=[
13
c-赖氨酸]/[
13
c-赖氨酸
12
c-赖氨酸]%-13
c-赖氨酸的天然丰度)。作为非限制性实例,lc/ms可以用于测量氨基酸的量。
[0281]
也可以计算重组宿主细胞将甲醇同化为氨基酸的能力。作为非限制性实例,甲醇同化为氨基酸(例如,赖氨酸)估计可以基于与“正常剂量”糖类过程和负10%减少剂量的糖类过程相比甲醇-糖类(例如,甲醇-葡萄糖)共供给对氨基酸总产量的补充,从而允许估计多少分数(或百分比)的甲醇剂量被转化成氨基酸,这可以被称为来源于甲醇的氨基酸分数或者来源于甲醇的氨基酸百分比。
[0282]
在一些实施方案中,本公开的重组宿主细胞能够产生包含来源于甲醇的包含至少一个碳(例如,至少两个碳或全部碳)的氨基酸。作为非限制性实例,可以如上所述使用
13
c-标记的甲醇,以确定重组细胞产生的净
13
c-标记的氨基酸百分比。
[0283]
在一些实施方案中,与不表达至少一种编码mdh酶、hps酶、phi酶、和/或其他rump途径酶的异源基因相比,本公开的表达至少一种编码mdh酶、hps酶、phi酶、和/或其他rump途径酶的异源基因的重组宿主细胞在存在甲醇的情况下多产生1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、或1000%的氨基酸(例如,赖氨酸)。在一些实施方案中,相对于不表达一种或更多种异源基因的宿主细胞,具有增加的赖氨酸产生的表达本文所描述的异源基因中的一种或更多种的重组宿主细胞是甲基营养型细胞。
[0284]
也可以通过本领域中使用的和本文所描述的任何适合的技术来测量重组宿主细胞消耗的甲醇的量。例如,可以通过在来源于甲醇的培养过程之后对来自全部来源的碳的求和来计算甲醇碳质量平衡。可以通过考虑初始原料中有多少甲醇、在原料中培养重组细胞之后原料中剩余多少甲醇、以及通过蒸发损失多少甲醇来计算甲醇碳质量平衡。不受特定理论的束缚,在发酵之后,甲醇将可能被并入细胞生物质中、分泌的最终产物中、液面上空间中的气相中,并且被排放至环境。
[0285]
在一些实施方案中,本公开的重组宿主细胞消耗的甲醇的百分比为至少0.01%、至少0.05%、至少0.1%、至少0.5%、至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%、或之间的任何值。在一些实施方案中,至少0.01%、至少0.05%、至少0.1%、至少0.5%、至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%、或之间的任何值的甲醇消耗表明细胞是甲基营养型细胞。
[0286]
在一些实施方案中,与不表达编码mdh酶、hps酶、phi酶、和/或其他rump途径酶的异源基因的宿主细胞相比,本公开的重组宿主细胞在甲醇中具有至少相同的或增加的活力。与不表达编码mdh酶、hps酶、phi酶、和/或其他rump途径酶的异源基因的宿主细胞相比,
在存在甲醇的情况下,重组宿主细胞的活力比不表达编码mdh酶、hps酶、phi酶、和/或其他rump途径酶的异源基因的宿主细胞的活力高至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%(或之间的任何值)。细胞活力测定的非限制性实例包含mtt测定、台盼蓝测定和发光细胞活力测定。在一些实施方案中,在存在甲醇的情况下的细胞活力表明重组宿主细胞是甲基营养型细胞。
[0287]
可以在本领域已知且使用的培养容器中进行本文所描述的细胞的培养。在一些实施方案中,充气反应容器(例如,搅拌釜反应器)用于培养细胞。在一些实施方案中,生物反应器或发酵器用于培养细胞。因此,在一些实施方案中,在发酵中使用细胞。如本文所使用的,术语“生物反应器”和术语“发酵器”可互换地使用,并且指在其中发生生物反应、生物化学反应和/或化学反应(涉及活生物体或活生物体的一部分)的包围物或部分包围物。“大规模生物反应器”或“工业规模生物反应器”是用于以商业规模或准商业规模生成产物的生物反应器。大型生物反应器通常具有在升、数百升、数千升、或更大范围内的体积。
[0288]
在一些实施方案中,生物反应器包含细胞(例如,细菌细胞或酵母细胞)或细胞培养物(例如,细菌细胞培养物或酵母细胞培养物)(如本文所描述的细胞或细胞培养物)。在一些实施方案中,生物反应器包含孢子和/或分离微生物的休眠细胞类型(例如,处于干燥状态的休眠细胞)。
[0289]
生物反应器的非限制性实例包含:搅拌釜发酵器、通过旋转混合装置搅动的生物反应器、恒化器、通过振动装置搅动的生物反应器、气升式发酵器、填充床反应器、固定床反应器、流化床生物反应器、采用波诱导的搅动的生物反应器、离心生物反应器、滚瓶、以及中空纤维生物反应器、滚转器设备(例如,台式种类、推车安装式种类、和/或自动化种类)、竖直堆叠的板、旋转瓶、搅拌瓶或摇动瓶、振动的多孔板、md瓶、方瓶、洛克斯氏瓶、多表面组织培养繁殖器、改良的发酵器、以及经涂覆的珠(例如,用血清蛋白、硝化纤维素或羧甲基纤维素涂覆的珠以防止细胞附着)。
[0290]
在一些实施方案中,生物反应器包含细胞培养系统,其中细胞(例如,细菌细胞或酵母细胞)与运动的液体和/或气泡接触。在一些实施方案中,细胞或细胞培养物悬浮生长。在其他实施方案中,细胞或细胞培养物附着于固相载体。载体系统的非限制性实例包含微载体(例如,可以是多孔或无孔的聚合物球、微珠和微盘)、带有特定化学基团(例如,叔胺基团)的交联珠(例如,右旋糖酐)、2d微载体(包含捕获在无孔聚合物纤维中的细胞)、3d载体(例如,载体纤维、中空纤维、多筒反应器(multicartridge reactor)、以及可以包含多孔纤维的半渗透膜)、具有降低的离子交换能力的微载体、微囊化细胞、毛细管、以及聚集体。在一些实施方案中,由材料(如右旋糖酐、明胶、玻璃、或纤维素)制造载体。
[0291]
在一些实施方案中,以连续模式、半连续模式或非连续模式操作工业规模的过程。操作模式的非限制性实例是分批、补料分批(fed batch)、扩展分批(extended batch)、重复分批(repetitive batch)、抽取/填充、旋转壁、旋转瓶、和/或灌注操作模式。在一些实施方案中,生物反应器允许连续或半连续补充底物原料(例如,碳水化合物来源)和/或从生物反应器连续或半连续分离产物。
[0292]
在一些实施方案中,生物反应器或发酵器包含传感器和/或控制系统以测量和/或
调整反应参数。反应参数的非限制性实例包含生物学参数(例如,生长速率、细胞尺寸、细胞数量、细胞密度、细胞类型、或细胞状态等)、化学参数(例如,ph、氧化还原电位、反应底物和/或产物的浓度、溶解的气体的浓度(如氧气浓度和co2浓度)、营养物浓度、代谢物浓度、寡肽的浓度、氨基酸的浓度、维生素的浓度、激素的浓度、添加剂的浓度、血清浓度、离子强度、离子的浓度、相对湿度、摩尔浓度、同渗容摩、其他化学物质(例如,缓冲剂、佐剂或反应副产物)的浓度)、物理/机械参数(例如,密度、传导率、搅拌程度、压力、和流速、剪切应力、剪切速率、粘度、颜色、浊度、光吸收、混合速率、转化率、以及热力学参数(如温度、光强度/质量)等)。测量本文所描述的参数的传感器对于相关机械和电子领域的普通技术人员来说是公知的。控制系统基于来自本文所描述的传感器的输入来调整生物反应器中的参数是生物反应器工程领域的普通技术人员公知的。
[0293]
在一些实施方案中,方法涉及分批发酵(例如,摇瓶发酵)。分批发酵(例如,摇瓶发酵)的一般考虑因素包含氧气和葡萄糖的水平。例如,分批发酵(例如,摇瓶发酵)可能受限于氧气和葡萄糖,因此在一些实施方案中,菌株在设计良好的补料分批发酵中进行的能力被低估。另外,最终产物(例如,氨基酸(包含赖氨酸))可以在溶解性、毒性、手性细胞累积和分泌方面显示出与天然存在的产物(例如,氨基酸(包含赖氨酸))的一些差异,并且在一些实施方案中可以具有不同的发酵动力学。
[0294]
本文所描述的方法包含使用重组宿主细胞、细胞裂解物或分离的重组多肽(例如,mdh、hps、phi、或其他rump循环酶)产生有机化合物。微生物发酵中产生的有机化合物的实例可以包含氨基酸、有机酸、多糖、蛋白质、抗生素和醇。氨基酸的实例包含丙氨酸(a)、精氨酸(r)、天门冬酰胺(n)、天门冬氨酸(d)、半胱氨酸(c)、谷氨酸(e)、谷氨酰胺(q)、甘氨酸(g)、组氨酸(h)、异亮氨酸(i)、亮氨酸(l)、赖氨酸(k)、甲硫氨酸(m)、苯丙氨酸(f)、脯氨酸(p)、丝氨酸(s)、苏氨酸(t)、色氨酸(w)、酪氨酸(y)和缬氨酸(v)。在一些实施方案中,氨基酸是d-氨基酸。在一些实施方案中,氨基酸是l-氨基酸。
[0295]
有机酸的实例包含乙酸、乳酸、丙酮酸、琥珀酸、苹果酸、衣康酸、柠檬酸、丙烯酸、丙酸和富马酸。多糖的实例包含黄原胶、右旋糖酐、藻酸盐、透明质酸、凝胶多糖、结冷胶、硬葡聚糖和普鲁兰多糖。蛋白质的实例包含激素、淋巴因子、干扰素和酶(如淀粉酶、葡糖淀粉酶、转化酶、乳糖酶、蛋白酶和脂肪酶)。抗生素的实例包含抗微生物剂(如β-内酰胺类、大环内酯类、袢霉素、四环素、氯霉素、肽能抗生素和氨基糖苷类)、抗真菌剂(如多氧霉素b、灰黄霉素和多烯大环内酯类)、抗癌剂、柔红霉素、阿霉素、放线菌素d、光辉霉素和博来霉素、蛋白酶/肽酶抑制剂(如亮抑酶肽、抗痛素和胃酶抑素)、以及胆固醇生物合成抑制剂(如康帕汀(compactin)、洛伐他汀和普伐他汀)。醇的实例包含乙醇、异丙醇、甘油、丙二醇、亚丙基二醇、1-丁醇和山梨糖醇。微生物发酵中产生的有机化合物的其他实例可以包含丙烯酰胺、二烯化合物(如异戊二烯)、类胡萝卜素(如虾青素)、类异戊二烯(如柠檬烯、法呢烯)和戊二胺。
[0296]
可以使用本领域已知的任何方法鉴别和提取由本文公开的重组宿主细胞中的任何一种产生的氨基酸(例如,赖氨酸)。质谱(例如,lc-ms、gc-ms)、氨基酸生物传感器和茚三酮测定是用于鉴别的方法的非限制性实例,并且可以用于帮助提取感兴趣的氨基酸。
[0297]
确定hps活性和/或phi活性的方法
[0298]
本公开的方面还提供确定酶是否具有hps活性和/或phi活性的方法。方法可以包
含向反应混合物添加(i)核糖-5-磷酸;(ii)rpi酶;(iii)感兴趣的酶;(iv)甲醛;(v)phi酶;(vi)pgi酶;(vii)g6pdh酶;(viii)nadp ;(ix)pmsox;以及(x)xtt四唑鎓;以及(b)测定xtt甲臜,其中xtt甲臜的存在表明感兴趣的酶是hps。在一些实施方案中,方法包含向反应混合物添加(i)核糖-5-磷酸;(ii)rpi酶;(iii)hps;(iv)甲醛;(v)感兴趣的酶;(vi)pgi酶;(vii)g6pdh酶;(viii)nadp ;(ix)pmsox;以及(x)xtt四唑鎓;以及(b)测定xtt甲臜,其中xtt甲臜的存在表明感兴趣的酶是phi。在一些实施方案中,方法包含向反应混合物添加(i)核糖-5-磷酸;(ii)rpi酶;(iii)感兴趣的酶;(iv)甲醛;(v)第二种感兴趣的酶;(vi)pgi酶;(vii)g6pdh酶;(viii)nadp ;(ix)pmsox;以及(x)xtt四唑鎓;以及(b)测定xtt甲臜,其中xtt甲臜的存在表明两种酶中的一者是phi,而另一种酶是hps。在一些实施方案中,方法用于确定细胞裂解物中phi和/或hps的存在。在一些实施方案中,方法用于确定至少一种分离的酶是phi还是hps。
[0299]
本发明在其应用方面不限于说明书中阐明的结构细节和组分布置。本发明能够具有其他实施方案,并且能够以各种方式被实践或执行。此外,本文使用的措辞和术语是出于描述的目的,而不应当被视为限制性的。本文对诸如“包含”、“包含”、“具有”、“含有”、“涉及”、和/或其变体等术语的使用意为涵盖其后列出的项目及其等同物以及附加项目。
[0300]
通过以下实施例进一步阐明本发明,但绝不应当将以下实施例解释为进一步限制。贯穿本技术所引用的全部参考文献(包含文献参考、授权专利、公布的专利申请、以及待审专利申请)的全部内容特此通过引用被明确并入。
实施例
[0301]
实施例1:甲醇脱氢酶(mdh)的鉴别和表征
[0302]
本实施例描述了mdh酶的鉴别、开发和表征。本领域技术人员将理解,多个序列可以编码相同的多肽,并且当在特定宿主细胞中表达序列时,密码子优化通常是有用的。
[0303]
mdh筛选
[0304]
为了鉴别mdh酶,使用生物信息学搜索鉴别总计5640个感兴趣的基因,并且从头合成4173个(图2)。生物信息学搜索包含使用来自富养罗尔斯通氏菌和甲醇芽孢杆菌的三个“种子”mdh序列(seq id no:29-31)。基于序列相似性,所筛选的最大类别的酶一般属于广泛的醇脱氢酶家族(ec 1.1.1.1)。使用比对工具和一组种子蛋白质序列从公共数据库选择一组2426个编码与醇脱氢酶和甲醇脱氢酶(adh/mdh)具有不同氨基酸相似性的蛋白质的基因作为野生型蛋白质序列。相应基因的核苷酸序列被密码子重新编码以在大肠埃希氏菌中最佳表达,并且通过从头dna合成组装成合成基因。
[0305]
合成总计1837个编码来自该蛋白质家族的相应多肽的基因。然后,将合成的线性双链dna片段克隆到适合的运载体中,测序验证,并且从组成型启动子或诱导型启动子开始在大肠埃希氏菌中表达。大肠埃希氏菌的任何可复制的质粒可以用作运载体。筛选包含蛋白质的细胞提取物的甲醇依赖性nad

还原酶活性。还筛选蛋白质的乙醇脱氢酶活性和丁醇脱氢酶活性。
[0306]
对该组1837种蛋白质的活性的聚类分析方法和实验测定允许分离具有推定的弱至强的甲醇脱氢酶活性的序列的群组,甲醇脱氢酶活性被定义为高于背景阴性对照3个标准偏差的测定活性。该群组包含28种mdh酶(seq id no:29-56)(如下表2中所示)。
[0307]
表2.mdh酶的非限制性实例
[0308]
[0309][0310]
该经鉴别的群组的序列信息用于生成隐马尔可夫结构模型。图3a-图3g中示出隐马尔可夫模型的序列标识图。图4a-图4c中示出28个序列的clustalw比对。在图4a-图4c中,序列如下所列:
[0311]
1.mdh_a0a0j1kgj0_aerhy(seq id no:44)
[0312]
2.mdh_q8egv1_sheon(seq id no:46)
[0313]
3.mdh_g6ezs9_9prot(seq id no:47)
[0314]
4.mdh_j2mtg6_psefl(seq id no:48)
[0315]
5.mdh_s6kj47_9psed(seq id no:49)
[0316]
6.mdh_l1m2d7_psepu(seq id no:40)
[0317]
7.mdh_a0a0q5fhc2_9psed(seq id no:42)
[0318]
8.mdh_a0a060nq50_9burk(seq id no:39)
[0319]
9.mdh_a0a0j6ls37_chrvl(seq id no:33)
[0320]
10.mdh_l0m0d9_entbf(seq id no:41)
[0321]
11.mdh_q5r120_idilo(seq id no:38)
[0322]
12.mdh_g4ct37_9neis(seq id no:37)
[0323]
13.mdh_g2diw5_9neis(seq id no:51)
[0324]
14.mdh_a0a0m7c799_9burk(seq id no:35)
[0325]
15.mdh_cnmdhm3(seq id no:30)
[0326]
16.mdh_c5ams6_burgb(seq id no:43)
[0327]
17.mdh_m1pk96_9zzzz(seq id no:50)
[0328]
18.mdh_a0a060qhe9_9prot(seq id no:36)
[0329]
19.mdh_a0a031lyd0_9gamm-s31v-a169v-a368r(seq id no:54)
[0330]
20.mdh_a0a031lyd0_9gamm-a26v-s31v-a169v-a368r(seq id no:56)
[0331]
21.mdh_a0a031lyd0_9gamm-a26v-a169v-a368r(seq id no:55)
[0332]
22.mdh_a0a031lyd0_9gamm(seq id no:34)
[0333]
23.mdh_n9cl98_acijo(seq id no:45)
[0334]
24.mdh_n8zm63_9gamm(seq id no:52)
[0335]
25.mdh_p45513(seq id no:53)
[0336]
26.mdh_bm_adh61(wt)(seq id no:31)
[0337]
27.mdh_bmadh61[v361r](seq id no:32)
[0338]
28.mdh_(bm)|i3e2p9(seq id no:29)
[0339]
还针对甲醇脱氢酶/甲醛产生活性筛选了经表达的蛋白质的子集(图5-图6)。nash测定(nash biochem j.1953oct;55(3):416-21)用于测定甲醛产生活性,而使用图6顶部示出的xtt四唑鎓测定测量甲醇依赖性nad 还原酶活性。在这些研究中,在细胞提取物(经裂解的细胞)或体内(全细胞)的背景下筛选经基因编码的酶活性。
[0340]
选择六个mdh基因,并且经受定点诱变以进一步提高相应酶的催化活性(图7、图8和图9a-图9b)。如通过甲醇氧化、nadh产生和甲醛产生(不动杆菌属ver3 uniprot a0a031lyd0_9gamm变体)所测量的,来自六个基因之一的一组突变体显示出提高的催化活性(图8)。相对于野生型a0a031lyd0_9gamm且相对于阳性对照cnmdhm3(seq id no:30),不动杆菌属ver3 uniprot a0a031lyd0_9gamm变体显示出提高的活性。变体包含以下突变:(1)a26v、s31v、a169v和a368r;(2)a26v、a169v和a368r;(3)a26v和a368r;或(4)s31v、a169v和a368r。与阳性对照cnmdhm3相比,a0a031lyd0_9gamm变体显示出净nad还原酶活性的至少20%的增加(图7)。与野生型a0a031lyd0_9gamm相比,包含a26v突变、a169v突变和a368r突变的a0a031lyd0_9gamm变体显示出净nad还原酶活性的超过25%的增加。针对mdh筛选中鉴别的活性最高的酶中的7种进行完整的动力学表征(图9a-图9b,包含2个对照(其中一个是cnmdhm3))。
[0341]
因此,mdh酶被鉴别出细菌宿主细胞的增加的甲醇脱氢酶活性(如通过甲醛产生所确定的)和甲醇依赖性nad

还原酶活性。
[0342]
实施例2:3-己酮糖-6-磷酸合酶(hps)和3-己酮糖-6-磷酸异构酶(phi)的鉴别和表征
[0343]
hps和phi筛选
[0344]
本实施例描述了某些有用的hps多肽和phi多肽和/或编码它们的序列的鉴别、开发和/或表征。本领域技术人员将理解,多个序列可以编码相同的多肽,并且当在特定宿主细胞中表达序列时密码子优化通常是有用的。
[0345]
按照上述adh/mdh基因/酶的类似流程构建推定的3-己酮糖-6-磷酸合酶(hps)和3-己酮糖-6-磷酸异构酶(phi)的库。使用种子多肽鉴别总计2004种候选hps酶和phi酶(来自每类的约一半)(图11)。总计1346个在诱导型表达运载体m416625中被合成为单独表达的
基因。此外,在考虑基因所来源的生物体的合成/遗传连锁、分类和生活方式的情况下,设计603个合成的双基因(候选hps和候选phi)操纵子。合成总计460个,以从p
l
启动子开始在m416625中表达。在基因表达诱导之后,使用新型酶测定对细胞提取物进行酶活性的筛选(图12)。如图12中所示,在基于xtt四唑鎓盐的还原的测定中筛选来自表达推定hps酶和推定phi酶的组合的细胞的提取物。
[0346]
在体外测定中,r5p化合物与甲醛一起转化成作为hps的底物的ru5p。然后,通过phi将来自hps反应的产物己酮糖-6-p异构化成f6p。通过一系列酶(包含pgi和zwf)将所得的f6p转化成nadph。在存在由上述酶偶联反应生成的nadph(其在比色测定中被检测)的情况下,通过测量xtt四唑鎓盐向甲臜的还原来确定通过该途径的通量。初步筛选鉴别至少15个基于hps酶活性的候选hps命中(定义为大于2的z-评分;图13,具有表3中包含的相应序列)和10个基于phi酶活性的候选phi命中(定义为大于2的z-评分;图14,具有表4中包含的相应序列),其中的一子集被证实与荚膜甲基球菌对照酶活性一样或者比荚膜甲基球菌对照酶更具活性(图15)。使用图12中示出的体外测定。
[0347]
表3.hps酶的非限制性实例
[0348]
[0349][0350]
表4.phi酶的非限制性实例
[0351]
[0352][0353]
因此,hps酶和phi酶被鉴别出可以用于促进细菌宿主细胞中通过rump途径的通量。
[0354]
实施例3:能够使用甲醇产生赖氨酸的重组宿主细胞的开发。
[0355]
本实施例描述了具有增加的赖氨酸产生的重组宿主细胞的开发。
[0356]
表达mdh酶、hps酶和phi酶的子集的基因(图17)和调控部分(启动子、操纵子、mrna稳定性盒、核糖体结合位点和终止子;图16)的库通过从头技术以全因子方式组装到核酮糖单磷酸类型的甲醇同化途径中,克隆到低拷贝数运载体中,并且在大肠埃希氏菌菌株中针对
13
c-甲醇向生物质和产物的同化进行测试。大肠埃希氏菌菌株包含frma基因敲除,并且不会天然地经历甲醇同化。frma基因编码s-(羟甲基)谷胱甘肽脱氢酶。
[0357]
合成1152个靶向途径中的836个途径。将途径质粒转化到包含frma基因敲除的大肠埃希氏菌菌株中,并且在分批生长方案中测试,以使用20g/l甲醇和20g/l葡萄糖的共同供给方案测量赖氨酸中的
13
c-净富集。所选择的反应监控lc-ms实验用于确定[
13
c]-赖氨酸/[
12
c]-赖氨酸比率和滴度。针对[
13
c]-meoh向[
13
c]-赖氨酸中的并入对重组宿主细胞进行测试,以确定净(天然丰度校正的)[
13
c]-质量富集([m 1]/[m m 1])。与空运载体对照相比,这些途径质粒的显著分数显示出增加的分数富集,其中至少一个菌株显示出26-27%的分数富集。还确定基于赖氨酸滴度的利用甲醇的百分比右旋糖替代,并且在至少一个菌株中鉴别基于赖氨酸滴度的利用甲醇的大于5%的右旋糖替代(图18)。
[0358]
因此,实施例1和实施例2中描述的筛选研究中鉴别的编码mdh酶、hps酶和phi酶的质粒的引入可以用于产生重组宿主细胞,所述重组宿主细胞可以有效地同化甲醇并且可以使用甲醇产生赖氨酸。
[0359]
实施例4:附加的rump循环酶的鉴别和表征。
[0360]
本实施例描述了附加的rump途径酶(包含核糖-5-磷酸异构酶(rpi)、d-核酮糖5-磷酸3-差向异构酶(rpe)、转酮醇酶(tkt)、转醛醇酶(tal)、磷酸果糖激酶(pfk)、景天庚酮糖1,7-二磷酸酶(glpx)、果糖-二磷酸醛缩酶(fba)、6-磷酸葡糖酸脱氢酶(gnd)、葡糖-6-磷酸脱氢酶(zwf)、或其组合(括号中指出编码甲醇芽孢杆菌中所示酶的基因的非限制性实例))的鉴别、开发和/或表征。本领域技术人员将理解,多个序列可以编码相同的多肽,并且当在特定宿主细胞中表达序列时密码子优化通常是有用的。
[0361]
通过探索候选戊糖磷酸途径和糖酵解酶的公共数据库来创建用于rump循环工程的酶库。靶向总计4677个属于9个酶类的基因以在表达运载体中合成,并且使用大肠埃希氏菌天然组作为对照酶(包含rpe、rpia、zwf、gnd、pfka、tkta、tala、glpx和fbab)进行测定开发。
[0362]
表5.附加的rump循环酶的非限制性实例
[0363]
[0364][0365]
在系统发育空间中广泛地靶向来源基因,并且在可能的情况下,对已知的甲基营养型生物体给予优先考虑。合成成功率平均高于80%。
[0366]
使用方法的组合筛选每个库。选择属于九种酶活性的一组56种酶(图19)用于组装成下文描述的质粒。图20示出用于鉴别指定酶的方法。
[0367]
该组56种基因中的两种至五种被分组到候选代谢模块中,并且合成子模块的长度跨度为从3千碱基至6.2千碱基。合成子模块被克隆到编码mdh、hps和phi的质粒中。图21是示出在质粒中整合包含在一个启动子下的图19中描绘的该组56种基因中两种至五种的表达盒与在另外的启动子下表达mdh、hps和phi的表达盒的示意图。下一代测序用于确认由质粒编码的序列。
[0368]
将这些质粒转化到缺乏frma的大肠埃希氏菌菌株中,并且测试赖氨酸中的
13
c-分数富集。使菌株在htp按比例缩小的发酵筛选中经受[
13
c]-meoh-葡萄糖共同供给,并且[
13
c]-分数富集显示出从~35至6%的范围。
[0369]
还针对向赖氨酸的甲醇同化对包含这些质粒的重组宿主细胞进行测试。向赖氨酸的甲醇同化估计基于与“正常剂量”葡萄糖过程和“负10%减少剂量的葡萄糖”过程相比由甲醇-葡萄糖共同供给的总赖氨酸产生的补充,从而允许估计多少分数的甲醇剂量被转化成赖氨酸(其可以被称为“来源于甲醇的”赖氨酸%)。检测到超过5%的来源于甲醇的赖氨酸。还通过甲醇碳质量平衡估计各种菌株的“甲醇消耗”,其中消耗的甲醇如下计算:添加的甲醇-培养肉汤中剩余的甲醇-蒸发的甲醇。基于供给溶液浓度和供给体积计算添加的甲醇。使用定量酶促测定计算培养肉汤中剩余的甲醇。通过废气质谱获得蒸发的甲醇。在至少一个菌株中观察到约35%的甲醇消耗。
[0370]
等同物
[0371]
本领域技术人员仅使用常规实验就将认识到或能够确知本文所描述的本发明的具体实施方案的许多等同物。这样的等同物旨在由以下权利要求书涵盖。
[0372]
本文公开的全部参考文献(包含专利文件)通过引用被整体(特别是本文所引用的公开内容)并入本文。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献