一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于在枫糖尿症(MSUD)的治疗中使用的酶的生物合成的制作方法

2022-05-08 08:51:00 来源:中国专利 TAG:

用于在枫糖尿症(msud)的治疗中使用的酶的生物合成
1.相关申请的交叉引用
2.本技术要求于2019年6月21日提交的标题为“用于在枫糖尿症(msud)的治疗中使用的酶的生物合成”的美国临时申请序列号62/865,129和于2019年6月21日提交的标题为“被工程化以治疗涉及亮氨酸、异亮氨酸和/或缬氨酸的分解代谢的紊乱的优化的细菌”的美国临时申请序列号62/864,875(其各自的公开内容通过引用被整体并入本文)的在35 u.s.c
§
119(e)下的权益。
3.对经由efs-web作为文本文件提交的序列表的引用
4.本技术含有已经经由efs-web以ascii格式提交的序列表,并且特此通过引用整体并入。创建于2020年6月19日的所述ascii副本名称为g0919.70033wo00-seq-omj.txt,并且大小为1.76兆字节(mb)。
发明领域
5.本公开涉及对于亮氨酸至异戊醇的转化有用的酶、核酸和细胞。
6.背景
7.枫糖尿症(msud)是由支链α-酮酸脱氢酶复合物(bckdc)的缺乏引起的代谢紊乱,从而导致支链氨基酸(亮氨酸、异亮氨酸和缬氨酸)及其毒性副产物(酮酸)在血液和尿液中的累积。msud的名字来自于受影响个体的尿液的独特甜味(特别是在诊断之前和在急性病期间)。仍然存在对于用于msud和其他以过多支链氨基酸为特征的病况的改进的治疗的需要。
8.概述
9.本公开至少部分地基于含有用于例如通过将亮氨酸转化成异戊醇来消耗亮氨酸的酶的经工程化的细胞的生成。例如,这样的经工程化的细胞对于治疗与亮氨酸的累积有关的疾病(如msud)是有用的。
10.本公开的方面涉及宿主细胞,宿主细胞包括编码亮氨酸脱氢酶(leudh)的异源多核苷酸,其中leudh酶包括与选自seq id no:2、seq id no:4、seq id no:6、seq id no:8、seq id no:10和seq id no:12的序列至少90%一致的氨基酸序列。在一些实施方案中,leudh酶包括与seq id no:2至少90%一致的氨基酸序列。在一些实施方案中,leudh酶包括seq id no:2。在一些实施方案中,leudh酶包括:与seq id no:27中的第13位残基对应的残基处的v;与seq id no:27中的第16位残基对应的残基处的w;与seq id no:27中的第42位残基对应的残基处的q;与seq id no:27中的第43位残基对应的残基处的t、y、f、e或w;与seq id no:27中的第44位残基对应的残基处的i、h、k或y;与seq id no:27中的第67位残基对应的残基处的t、e、a、s或k;与seq id no:27中的第71位残基对应的残基处的k;与seq id no:27中的第73位残基对应的残基处的s;与seq id no:27中的第76位残基对应的残基处的r、h、y、s、k或w;与seq id no:27中的第92位残基对应的残基处的y;与seq id no:27中的第93位残基对应的残基处的h;与seq id no:27中的第95位残基对应的残基处的g;与seq id no:27中的第100位残基对应的残基处的g;与seq id no:27中的第105位残基对应的残基处
的c;与seq id no:27中的第111位残基对应的残基处的g;与seq id no:27中的第113位残基对应的残基处的m;与seq id no:27中的第115位残基对应的残基处的n或v;与seq id no:27中的第116位残基对应的残基处的r、n或w;与seq id no:27中的第120位残基对应的残基处的a;与seq id no:27中的第122位残基对应的残基处的d;与seq id no:27中的第136位残基对应的残基处的e;与seq id no:27中的第140位残基对应的残基处的d;与seq id no:27中的第141位残基对应的残基处的m;与seq id no:27中的第160位残基对应的残基处的s;与seq id no:27中的第185位残基对应的残基处的f;与seq id no:27中的第196位残基对应的残基处的n;与seq id no:27中的第228位残基对应的残基处的y;与seq id no:27中的第248位残基对应的残基处的m;与seq id no:27中的第256位残基对应的残基处的c;与seq id no:27中的第293位残基对应的残基处的q或c;与seq id no:27中的第296位残基对应的残基处的k或n;与seq id no:27中的第297位残基对应的残基处的r、q或k;与seq id no:27中的第300位残基对应的残基处的c或d;与seq id no:27中的第302位残基对应的残基处的t或s;与seq id no:27中的第305位残基对应的残基处的c;与seq id no:27中的第319位残基对应的残基处的f;和/或与seq id no:27中的第330位残基对应的残基处的m。
11.本公开另外的方面涉及宿主细胞,宿主细胞包括编码亮氨酸脱氢酶(leudh)的异源多核苷酸,其中leudh酶包括:与seq id no:27中的第13位残基对应的残基处的v;与seq id no:27中的第16位残基对应的残基处的w;与seq id no:27中的第42位残基对应的残基处的q;与seq id no:27中的第43位残基对应的残基处的t、y、f、e或w;与seq id no:27中的第44位残基对应的残基处的i、h、k或y;与seq id no:27中的第67位残基对应的残基处的t、e、a、s或k;与seq id no:27中的第71位残基对应的残基处的k;与seq id no:27中的第73位残基对应的残基处的s;与seq id no:27中的第76位残基对应的残基处的r、h、y、s、k或w;与seq id no:27中的第92位残基对应的残基处的y;与seq id no:27中的第93位残基对应的残基处的h;与seq id no:27中的第95位残基对应的残基处的g;与seq id no:27中的第100位残基对应的残基处的g;与seq id no:27中的第105位残基对应的残基处的c;与seq id no:27中的第111位残基对应的残基处的g;与seq id no:27中的第113位残基对应的残基处的m;与seq id no:27中的第115位残基对应的残基处的n或v;与seq id no:27中的第116位残基对应的残基处的r、n或w;与seq id no:27中的第120位残基对应的残基处的a;与seq id no:27中的第122位残基对应的残基处的d;与seq id no:27中的第136位残基对应的残基处的e;与seq id no:27中的第140位残基对应的残基处的d;与seq id no:27中的第141位残基对应的残基处的m;与seq id no:27中的第160位残基对应的残基处的s;与seq id no:27中的第185位残基对应的残基处的f;与seq id no:27中的第196位残基对应的残基处的n;与seq id no:27中的第228位残基对应的残基处的y;与seq id no:27中的第248位残基对应的残基处的m;与seq id no:27中的第256位残基对应的残基处的c;与seq id no:27中的第293位残基对应的残基处的q或c;与seq id no:27中的第296位残基对应的残基处的k或n;与seq id no:27中的第297位残基对应的残基处的r、q或k;与seq id no:27中的第300位残基对应的残基处的c或d;与seq id no:27中的第302位残基对应的残基处的t或s;与seq id no:27中的第305位残基对应的残基处的c;与seq id no:27中的第319位残基对应的残基处的f;以及与seq id no:27中的第330位残基对应的残基处的m。
12.本公开另外的方面涉及宿主细胞,宿主细胞包括编码亮氨酸脱氢酶(leudh)的异源多核苷酸,其中相对于seq id no:27,leudh酶包括氨基酸残基:42、43、44、67、71、76、78、113、115、116、136、293、296、297和/或300处的氨基酸置换。在一些实施方案中,leudh酶包括:第42位残基处的a、q或t;第43位残基处的e、f、t、w或y;第44位残基处的h、i、k或y;第67位残基处的a、e、k、q、s或t;第71位残基处的c、d、h、k、m或t;第76位残基处的e、f、h、i、k、m、r、s、t、w或y;第78位残基处的c、f、h、k、q、v或y;第113位残基处的f、m、q、v、w或y;第115位残基处的n、q、s、t或v;第116位残基处的a、l、m、n、r、s、v或w;第136位残基处的e、f、l、r、s或y;第293位残基处的a、c、q、s或t;第296位残基处的a、c、e、i、k、l、n、s或t;第297位残基处的c、d、e、f、h、k、l、m、n、q、r、t、w或y;和/或第300位残基处的a、c、d、f、h、k、m、n、q、r、s、t、w或y。
13.本公开另外的方面涉及非天然存在的leudh酶,其中相对于seq id no:27,leudh酶包括氨基酸残基:42、43、44、67、71、76、78、113、115、116、136、293、296、297和/或300处的氨基酸置换。在一些实施方案中,leudh酶包括:第42位残基处的a、q或t;第43位残基处的e、f、t、w或y;第44位残基处的h、i、k或y;第67位残基处的a、e、k、q、s或t;第71位残基处的c、d、h、k、m或t;第76位残基处的e、f、h、i、k、m、r、s、t、w或y;第78位残基处的c、f、h、k、q、v或y;第113位残基处的f、m、q、v、w或y;第115位残基处的n、q、s、t或v;第116位残基处的a、l、m、n、r、s、v或w;第136位残基处的e、f、l、r、s或y;第293位残基处的a、c、q、s或t;第296位残基处的a、c、e、i、k、l、n、s或t;第297位残基处的c、d、e、f、h、k、l、m、n、q、r、t、w或y;和/或第300位残基处的a、c、d、f、h、k、m、n、q、r、s、t、w或y。
14.本公开另外的方面涉及宿主细胞,宿主细胞包括编码支链α-酮酸脱羧酶(kivd)的异源多核苷酸,其中kivd酶包括与选自seq id no:14、seq id no:16和seq id no:18的序列至少90%一致的氨基酸序列。在一些实施方案中,kivd酶包括与seq id no:18至少90%一致的氨基酸序列。在一些实施方案中,kivd酶包括seq id no:18。在一些实施方案中,kivd酶包括:与seq id no:29中的第33位残基对应的残基处的y;与seq id no:29中的第44位残基对应的残基处的q;与seq id no:29中的第117位残基对应的残基处的m;与seq id no:29中的第129位残基对应的残基处的i;与seq id no:29中的第185位残基对应的残基处的w;与seq id no:29中的第190位残基对应的残基处的i;与seq id no:29中的第225位残基对应的残基处的i;与seq id no:29中的第227位残基对应的残基处的y;与seq id no:29中的第311位残基对应的残基处的l;与seq id no:29中的第312位残基对应的残基处的g;与seq id no:29中的第313位残基对应的残基处的t;与seq id no:29中的第328位残基对应的残基处的p;与seq id no:29中的第341位残基对应的残基处的w;与seq id no:29中的第345位残基对应的残基处的h;与seq id no:29中的第347位残基对应的残基处的c;与seq id no:29中的第420位残基对应的残基处的r;与seq id no:29中的第494位残基对应的残基处的d;与seq id no:29中的第508位残基对应的残基处的c;和/或与seq id no:29中的第550位残基对应的残基处的f。
15.本公开另外的方面涉及宿主细胞,宿主细胞包括编码支链α-酮酸脱羧酶(kivd)的异源多核苷酸,其中kivd酶包括:与seq id no:29中的第33位残基对应的残基处的y;与seq id no:29中的第44位残基对应的残基处的q;与seq id no:29中的第117位残基对应的残基处的m;与seq id no:29中的第129位残基对应的残基处的i;与seq id no:29中的第185位残基对应的残基处的w;与seq id no:29中的第190位残基对应的残基处的i;与seq id no:
29中的第225位残基对应的残基处的i;与seq id no:29中的第227位残基对应的残基处的y;与seq id no:29中的第311位残基对应的残基处的l;与seq id no:29中的第312位残基对应的残基处的g;与seq id no:29中的第313位残基对应的残基处的t;与seq id no:29中的第328位残基对应的残基处的p;与seq id no:29中的第341位残基对应的残基处的w;与seq id no:29中的第345位残基对应的残基处的h;与seq id no:29中的第347位残基对应的残基处的c;与seq id no:29中的第420位残基对应的残基处的r;与seq id no:29中的第494位残基对应的残基处的d;与seq id no:29中的第508位残基对应的残基处的c;以及与seq id no:29中的第550位残基对应的残基处的f。
16.本公开另外的方面涉及宿主细胞,宿主细胞包括编码醇脱氢酶(adh)的异源多核苷酸,其中adh酶包括与选自seq id no:20、seq id no:22和seq id no:24的序列至少90%一致的氨基酸序列。在一些实施方案中,adh酶包括与seq id no:24至少90%一致的氨基酸序列。在一些实施方案中,adh酶包括seq id no:24。在一些实施方案中,adh酶包括:与seq id no:31中的第9位残基对应的残基处的p;与seq id no:31中的第16位残基对应的残基处的g;与seq id no:31中的第23位残基对应的残基处的q;与seq id no:31中的第28位残基对应的残基处的r;与seq id no:31中的第30位残基对应的残基处的a;与seq id no:31中的第93位残基对应的残基处的k;与seq id no:31中的第98位残基对应的残基处的l;与seq id no:31中的第99位残基对应的残基处的r;与seq id no:31中的第114位残基对应的残基处的p;与seq id no:31中的第115位残基对应的残基处的k;与seq id no:31中的第119位残基对应的残基处的y;与seq id no:31中的第194位残基对应的残基处的y;与seq id no:31中的第242位残基对应的残基处的p;与seq id no:31中的第249位残基对应的残基处的k;与seq id no:31中的第255位残基对应的残基处的e;与seq id no:31中的第260位残基对应的残基处的d;与seq id no:31中的第269位残基对应的残基处的h;与seq id no:31中的第281位残基对应的残基处的q;与seq id no:31中的第325位残基对应的残基处的l;与seq id no:31中的第333位残基对应的残基处的m;与seq id no:31中的第334位残基对应的残基处的p;和/或与seq id no:31中的第348位残基对应的残基处的q。
17.本公开另外的方面涉及宿主细胞,宿主细胞包括编码醇脱氢酶(adh)的异源多核苷酸,其中adh酶包括:与seq id no:31中的第9位残基对应的残基处的p;与seq id no:31中的第16位残基对应的残基处的g;与seq id no:31中的第23位残基对应的残基处的q;与seq id no:31中的第28位残基对应的残基处的r;与seq id no:31中的第30位残基对应的残基处的a;与seq id no:31中的第93位残基对应的残基处的k;与seq id no:31中的第98位残基对应的残基处的l;与seq id no:31中的第99位残基对应的残基处的r;与seq id no:31中的第114位残基对应的残基处的p;与seq id no:31中的第115位残基对应的残基处的k;与seq id no:31中的第119位残基对应的残基处的y;与seq id no:31中的第194位残基对应的残基处的y;与seq id no:31中的第242位残基对应的残基处的p;与seq id no:31中的第249位残基对应的残基处的k;与seq id no:31中的第255位残基对应的残基处的e;与seq id no:31中的第260位残基对应的残基处的d;与seq id no:31中的第269位残基对应的残基处的h;与seq id no:31中的第281位残基对应的残基处的q;与seq id no:31中的第325位残基对应的残基处的l;与seq id no:31中的第333位残基对应的残基处的m;与seq id no:31中的第334位残基对应的残基处的p;以及与seq id no:31中的第348位残基对应
的残基处的q。
18.在一些实施方案中,宿主细胞是植物细胞、藻类细胞、酵母细胞、细菌细胞或动物细胞。在一些实施方案中,宿主细胞是酵母细胞。在一些实施方案中,酵母细胞是酵母属细胞、耶氏酵母属细胞或毕赤酵母属细胞。在一些实施方案中,宿主细胞是细菌细胞。在一些实施方案中,细菌细胞是大肠埃希氏菌细胞或芽孢杆菌细胞。
19.在一些实施方案中,宿主细胞还包括编码支链氨基酸转运系统2载体蛋白(brnq)的异源多核苷酸。在一些实施方案中,brnq蛋白与seq id no:35的氨基酸序列至少90%一致。在一些实施方案中,brnq蛋白包括seq id no:35的氨基酸序列。
20.在一些实施方案中,异源多核苷酸与诱导型启动子可操作地连接。在一些实施方案中,异源多核苷酸在操纵子中表达。在一些实施方案中,操纵子表达超过一个异源多核苷酸,并且核糖体结合位点可以存在于每个异源多核苷酸之间。
21.在一些实施方案中,宿主细胞还包括编码kivd酶的异源多核苷酸和/或编码adh酶的异源多核苷酸。
22.在一些实施方案中,宿主细胞还包括编码leudh酶的异源多核苷酸和/或编码adh酶的异源多核苷酸。
23.在一些实施方案中,宿主细胞还包括编码leudh酶的异源多核苷酸和/或编码kivd酶的异源多核苷酸。
24.在一些实施方案中,宿主细胞能够从亮氨酸产生异戊醇。在一些实施方案中,相对于对照宿主细胞,宿主细胞消耗多至少两倍的亮氨酸,对照宿主细胞包括编码包括seq id no:27的序列的对照leudh酶的异源多核苷酸、编码包括seq id no:29的序列的对照kivd酶的异源多核苷酸、编码包括seq id no:31的序列的对照adh酶的异源多核苷酸、以及编码包括seq id no:35的序列的对照brnq蛋白的异源多核苷酸。
25.本公开另外的方面涉及包括培养本技术中公开的宿主细胞中的任何一种的方法。
26.本公开另外的方面涉及用于从亮氨酸产生异戊醇的方法,方法包括培养本技术中公开的宿主细胞中的任何一种。
27.本公开另外的方面涉及非天然存在的核酸,非天然存在的核酸包括与选自seq id no:1、seq id no:3、seq id no:5、seq id no:7、seq id no:9和seq id no:11的核酸序列至少90%一致的序列。
28.本公开另外的方面涉及非天然存在的核酸,非天然存在的核酸包括与选自seq id no:13、seq id no:15和seq id no:17的核酸序列至少90%一致的序列。
29.本公开另外的方面涉及非天然存在的核酸,非天然存在的核酸包括与选自seq id no:19、seq id no:21和seq id no:23的核酸序列至少90%一致的序列。
30.本公开另外的方面涉及非天然存在的核酸,非天然存在的核酸编码与选自seq id no:2、seq id no:4、seq id no:6、seq id no:8、seq id no:10和seq id no:12的序列至少90%一致的序列。
31.本公开另外的方面涉及非天然存在的核酸,非天然存在的核酸编码与选自seq id no:14、seq id no:16和seq id no:18的序列至少90%一致的序列。
32.本公开另外的方面涉及非天然存在的核酸,非天然存在的核酸编码与选自seq id no:20、seq id no:22和seq id no:24的序列至少90%一致的序列。
33.本公开另外的方面涉及包括本技术中公开的非天然存在的核酸中的任何一种的运载体。
34.本公开另外的方面涉及包括本技术中公开的非天然存在的核酸中的任何一种的表达盒。
35.本发明的限制中的每个可以涵盖本发明的各种实施方案。因此,预期涉及任何一个要素或要素的组合的本发明的限制中的每个都可以包含在本发明的每个方面中。本发明的应用不限于在以下描述中所示或者在附图中所图示说明的构造细节和组分的布置。本发明能够具有其他实施方案并且能够以各种方式被实践或进行。
36.附图的简要说明
37.附图并非旨在按比例绘制。在附图中,在各种图中图示说明的每个相同或几乎相同的组成部分由类似的数字表示。为清楚起见,并非每个组成部分都可以在每个图中标记。在附图中:
38.图1a-图1c描绘了序列相似性网络。每个点表示序列数据库中可用的单个氨基酸序列。氨基酸序列越紧密相关,点彼此之间越接近。每个序列相似性网络具有相应的簇键,簇键具有关于酶的注释或来源的信息。图1a示出亮氨酸脱氢酶(leudh)的序列相似性网络。簇键表示酶的注释。图1b示出酮异戊酸脱羧酶(kivd)的序列相似性网络。每个点的注释表示酶来源的系统发育进化枝。图1c示出醇脱氢酶(adh)的序列相似性网络。每个点的注释表示酶来源的系统发育进化枝。
39.图2描绘了示出来自leudh酶的筛选的数据的图表。用生物学复制(n=4)筛选220种leudh酶,以验证酶活性和排序。相对于蜡样芽孢杆菌leudh活性报告活性。
40.图3描绘了示出来自leudh酶的活性和特异性的比较的数据的图表。针对对leu、val和ile的活性筛选前200种leudh酶。相对于蜡样芽孢杆菌leudh活性报告leudh酶对leu的活性。将特异性测量为对leu的活性相对于val/leu的比率。在左侧图片中,相对于leu/val特异性报告对leu的酶活性。在右侧图片中,相对于leu/ile特异性报告酶活性。将经合理工程化的活性位点变体示出为未填充的圆形。以实心填充的圆形示出有来源的leudh酶。还示出阴性对照和阳性对照蜡样芽孢杆菌leudh。
41.图4示出来自leudh酶的特异性的比较的数据。针对对leu、val和ile的活性筛选前200种leudh酶。将特异性测量为对leu的活性相对于val/leu的比率。将经合理工程化的活性位点变体示出为未填充的圆形。以填充的圆形示出有来源的leudh酶。示出阴性对照和阳性对照蜡样芽孢杆菌leudh。
42.图5描绘了示出来自kivd酶的筛选的数据的图。用生物学复制(n=4)针对活性筛选55种kivd酶。相对于含有异源表达的金黄色葡萄球菌kivd的裂解物(其活性与裂解物的可测量的背景活性难以区分,并且因此等同于背景)的活性报告活性。
43.图6示出来自adh酶的筛选的数据。用生物学复制(n=4)筛选55种adh酶。相对于含有异源表达的酿酒酵母adh2的裂解物(其活性与裂解物的可测量的背景活性难以区分,并且因此等同于背景)的活性报告活性。
44.图7示出leudh酶的选择性的数据。测试了总计21种候选leudh酶。每组条形从左至右示出消耗的leu、消耗的ile和消耗的val。
45.图8示出消耗leu最高的菌株(5941、5942和5943)与原型菌株(1980)之间随着时间
的推移leu消耗的速率的比较。向基础培养基中添加8mm亮氨酸,并且在厌氧培养之后的0小时、2小时和4小时时间点处采集样品。
46.图9示出用于亮氨酸向异戊醇的转化的msud途径。
47.图10示出在ambr15生物反应器(n=2)中测定的菌株5941的异戊醇途径中间产物的细胞外图谱。误差条反映了重复生物反应器的标准偏差。与“加和”对应的数据表示所示中间产物的总浓度。leu=亮氨酸,酸=2-氧代异己酸,醛=异戊醛,醇=异戊醇。
48.发明的详细说明
49.在一些方面,本公开提供被工程化用于亮氨酸消耗的支链氨基酸(bcaa)途径的细胞、以及用于亮氨酸消耗的支链氨基酸(bcaa)途径的酶的组合。这些bcaa途径酶包含亮氨酸脱氢酶(leudh)、酮异戊酸脱羧酶(kivd)和醇脱氢酶(adh)。所公开的酶和包括这样的酶的宿主细胞可以用于促进亮氨酸消耗(例如,在患有与bcaa(例如,亮氨酸)累积相关的紊乱(如枫糖尿症(msud))的受试者中以及在其他医学环境和工业环境中)。
50.亮氨酸脱氢酶(leudh)
51.如本公开中所使用的,“亮氨酸脱氢酶(leudh)”指催化支链l-氨基酸(例如,l-亮氨酸、l-缬氨酸、l-异亮氨酸)向其2-氧代类似物的可逆脱氨基的酶。leudh酶可以使用l-亮氨酸作为底物。在一些实施方案中,与l-缬氨酸和/或l-异亮氨酸相比,leudh展现出对l-亮氨酸的特异性。在一些实施方案中,leudh从l-亮氨酸产生酮异己酸(也称为2-氧代异己酸)。
52.在一些实施方案中,宿主细胞包括leudh酶和/或编码这样的酶的异源多核苷酸。在一些实施方案中,宿主细胞包括编码下列的异源多核苷酸:包括与seq id no:2、seq id no:4、seq id no:6、seq id no:8、seq id no:10、seq id no:12或seq id no:257-475中的任何一种至少80%(例如,至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%)一致的氨基酸序列的leudh酶、表3或表4中的leudh酶、或者本公开中另外描述的leudh酶。在一些实施方案中,宿主细胞包括与seq id no:1、seq id no:3、seq id no:5、seq id no:7、seq id no:9、seq id no:11或seq id no:37-255中的任何一种至少90%(例如,至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%)一致的异源多核苷酸、编码表3或表4中的leudh酶或者本公开中另外描述的leudh酶的多核苷酸。
53.在一些实施方案中,宿主细胞包括来自蜡样芽孢杆菌的leudh。在其他实施方案中,宿主细胞不包括来自蜡样芽孢杆菌的leudh。
54.来自蜡样芽孢杆菌的leudh可以包括uniprotkb-p0a392的氨基酸序列(seq id no:27):
[0055][0056]
在一些实施方案中,seq id no:27的氨基酸序列由核酸序列:
[0057][0058]
编码。
[0059]
在一些实施方案中,相对于对照,表达编码leudh酶的异源多核苷酸的宿主细胞可以将亮氨酸至酮异己酸的转化增加多0.5倍、1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、5.5倍或6倍(例如,多2倍至6倍)。在一些实施方案中,对照是表达编码seq id no:27的异源多核苷酸的宿主细胞。在一些实施方案中,对照是大肠埃希氏菌nissle菌株syn1980δleue、δilvc、lacz:tetr-ptet-livkhmgf、tetr-ptet-leudh(bc)-kivd-adh2-brnq-rrnb ter(psc101)(如在美国专利申请公开号us20170232043中描述的)。
[0060]
在一些实施方案中,相对于缬氨酸,表达编码leudh酶的异源多核苷酸的宿主细胞可以展现出高至少0.5倍、1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、5.5倍或6倍(例如,高2倍至6倍)的对亮氨酸的活性。在一些实施方案中,相对于异亮氨酸,表达编码leudh酶的异源多核苷酸的宿主细胞可以展现出高至少0.5倍、1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、5.5倍或6倍(例如,高2倍至6倍)的对亮氨酸的活性。
[0061]
在一些实施方案中,leudh包括与seq id no:27、seq id no:2、seq id no:4、seq id no:6、seq id no:8、seq id no:10、seq id no:12或seq id no:257-475中的任何一种、seq id no:1、seq id no:3、seq id no:5、seq id no:7、seq id no:9、seq id no:11或seq id no:37-255中的任何一种、表3或表4中的leudh酶或本公开中另外描述的leudh酶的氨基酸序列或多核苷酸序列至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%一致的序列。
[0062]
在一些实施方案中,这样的leudh酶包括:与seq id no:27中的第13位残基对应的残基处的v;与seq id no:27中的第16位残基对应的残基处的w;与seq id no:27中的第42位残基对应的残基处的q;与seq id no:27中的第43位残基对应的残基处的t、y、f、e或w;与seq id no:27中的第44位残基对应的残基处的i、h、k或y;与seq id no:27中的第67位残基
对应的残基处的t、e、a、s或k;与seq id no:27中的第71位残基对应的残基处的k;与seq id no:27中的第73位残基对应的残基处的s;与seq id no:27中的第76位残基对应的残基处的r、h、y、s、k或w;与seq id no:27中的第92位残基对应的残基处的y;与seq id no:27中的第93位残基对应的残基处的h;与seq id no:27中的第95位残基对应的残基处的g;与seq id no:27中的第100位残基对应的残基处的g;与seq id no:27中的第105位残基对应的残基处的c;与seq id no:27中的第111位残基对应的残基处的g;与seq id no:27中的第113位残基对应的残基处的m;与seq id no:27中的第115位残基对应的残基处的n或v;与seq id no:27中的第116位残基对应的残基处的r、n或w;与seq id no:27中的第120位残基对应的残基处的a;与seq id no:27中的第122位残基对应的残基处的d;与seq id no:27中的第136位残基对应的残基处的e;与seq id no:27中的第140位残基对应的残基处的d;与seq id no:27中的第141位残基对应的残基处的m;与seq id no:27中的第160位残基对应的残基处的s;与seq id no:27中的第185位残基对应的残基处的f;与seq id no:27中的第196位残基对应的残基处的n;与seq id no:27中的第228位残基对应的残基处的y;与seq id no:27中的第248位残基对应的残基处的m;与seq id no:27中的第256位残基对应的残基处的c;与seq id no:27中的第293位残基对应的残基处的q或c;与seq id no:27中的第296位残基对应的残基处的k或n;与seq id no:27中的第297位残基对应的残基处的r、q或k;与seq id no:27中的第300位残基对应的残基处的c或d;与seq id no:27中的第302位残基对应的残基处的t或s;与seq id no:27中的第305位残基对应的残基处的c;与seq id no:27中的第319位残基对应的残基处的f;和/或与seq id no:27中的第330位残基对应的残基处的m。
[0063]
在一些实施方案中,leudh酶包括:与seq id no:27中的第13位残基对应的残基处的v;与seq id no:27中的第16位残基对应的残基处的w;与seq id no:27中的第42位残基对应的残基处的q;与seq id no:27中的第43位残基对应的残基处的t、y、f、e或w;与seq id no:27中的第44位残基对应的残基处的i、h、k或y;与seq id no:27中的第67位残基对应的残基处的t、e、a、s或k;与seq id no:27中的第71位残基对应的残基处的k;与seq id no:27中的第73位残基对应的残基处的s;与seq id no:27中的第76位残基对应的残基处的r、h、y、s、k或w;与seq id no:27中的第92位残基对应的残基处的y;与seq id no:27中的第93位残基对应的残基处的h;与seq id no:27中的第95位残基对应的残基处的g;与seq id no:27中的第100位残基对应的残基处的g;与seq id no:27中的第105位残基对应的残基处的c;与seq id no:27中的第111位残基对应的残基处的g;与seq id no:27中的第113位残基对应的残基处的m;与seq id no:27中的第115位残基对应的残基处的n或v;与seq id no:27中的第116位残基对应的残基处的r、n或w;与seq id no:27中的第120位残基对应的残基处的a;与seq id no:27中的第122位残基对应的残基处的d;与seq id no:27中的第136位残基对应的残基处的e;与seq id no:27中的第140位残基对应的残基处的d;与seq id no:27中的第141位残基对应的残基处的m;与seq id no:27中的第160位残基对应的残基处的s;与seq id no:27中的第185位残基对应的残基处的f;与seq id no:27中的第196位残基对应的残基处的n;与seq id no:27中的第228位残基对应的残基处的y;与seq id no:27中的第248位残基对应的残基处的m;与seq id no:27中的第256位残基对应的残基处的c;与seq id no:27中的第293位残基对应的残基处的q或c;与seq id no:27中的第296位残基对
应的残基处的k或n;与seq id no:27中的第297位残基对应的残基处的r、q或k;与seq id no:27中的第300位残基对应的残基处的c或d;与seq id no:27中的第302位残基对应的残基处的t或s;与seq id no:27中的第305位残基对应的残基处的c;与seq id no:27中的第319位残基对应的残基处的f;以及与seq id no:27中的第330位残基对应的残基处的m。
[0064]
在一些实施方案中,相对于seq id no:27、seq id no:2、seq id no:4、seq id no:6、seq id no:8、seq id no:10、seq id no:12或seq id no:257-475中的任何一种、表3或表4中的leudh酶、或本公开中另外描述的leudh酶,leudh酶包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少34个、至少35个、至少36个、至少37个、至少38个、至少39个、至少40个、至少41个、至少42个、至少43个、至少44个、至少45个、至少46个、至少47个、至少48个、至少49个、至少50个、至少60个、至少70个、至少80个、至少90个、或至少100个氨基酸置换、氨基酸缺失、氨基酸插入或氨基酸添加。
[0065]
在一些实施方案中,相对于seq id no:27,leudh酶包括一个或更多个残基处的氨基酸置换。在一些实施方案中,leudh酶包括与seq id no:27中的第42位对应的残基处的氨基酸置换、与seq id no:27中的第43位对应的残基处的氨基酸置换、与seq id no:27中的第44位对应的残基处的氨基酸置换、与seq id no:27中的第67位对应的残基处的氨基酸置换、与seq id no:27中的第71位对应的残基处的氨基酸置换、与seq id no:27中的第76位对应的残基处的氨基酸置换、与seq id no:27中的第78位对应的残基处的氨基酸置换、与seq id no:27中的第113位对应的残基处的氨基酸置换、与seq id no:27中的第115位对应的残基处的氨基酸置换、与seq id no:27中的第116位对应的残基处的氨基酸置换、与seq id no:27中的第136位对应的残基处的氨基酸置换、与seq id no:27中的第293位对应的残基处的氨基酸置换、与seq id no:27中的第296位对应的残基处的氨基酸置换、与seq id no:27中的第297位对应的残基处的氨基酸置换、和/或与seq id no:27中的第300位对应的残基处的氨基酸置换。在一些实施方案中,leudh酶包括:与seq id no:27中的第42位对应的残基处的a、q或t;与seq id no:27中的第43位对应的残基处的e、f、t、w或y;与seq id no:27中的第44位对应的残基处的h、i、k或y;与seq id no:27中的第67位对应的残基处的a、e、k、q、s或t;与seq id no:27中的第71位对应的残基处的c、d、h、k、m或t;与seq id no:27中的第76位对应的残基处的e、f、h、i、k、m、r、s、t、w或y;与seq id no:27中的第78位对应的残基处的c、f、h、k、q、v或y;与seq id no:27中的第113位对应的残基处的f、m、q、v、w或y;与seq id no:27中的第115位对应的残基处的n、q、s、t或v;与seq id no:27中的第116位对应的残基处的a、l、m、n、r、s、v或w;与seq id no:27中的第136位对应的残基处的e、f、l、r、s或y;与seq id no:27中的第293位对应的残基处的a、c、q、s或t;与seq id no:27中的第296位对应的残基处的a、c、e、i、k、l、n、s或t;与seq id no:27中的第297位对应的残基处的c、d、e、f、h、k、l、m、n、q、r、t、w或y;和/或与seq id no:27中的第300位对应的残基处的a、c、d、f、h、k、m、n、q、r、s、t、w或y。
[0066]
在一些实施方案中,相对于seq id no:27,leudh酶包括氨基酸残基:42、43、44、67、71、76、78、113、115、116、136、293、296、297和/或300处的氨基酸置换。在一些实施方案
中,leudh酶包括第42位残基处的a、q或t;第43位残基处的e、f、t、w或y;第44位残基处的h、i、k或y;第67位残基处的a、e、k、q、s或t;第71位残基处的c、d、h、k、m或t;第76位残基处的e、f、h、i、k、m、r、s、t、w或y;第78位残基处的c、f、h、k、q、v或y;第113位残基处的f、m、q、v、w或y;第115位残基处的n、q、s、t或v;第116位残基处的a、l、m、n、r、s、v或w;第136位残基处的e、f、l、r、s或y;第293位残基处的a、c、q、s或t;第296位残基处的a、c、e、i、k、l、n、s或t;第297位残基处的c、d、e、f、h、k、l、m、n、q、r、t、w或y;和/或第300位残基处的a、c、d、f、h、k、m、n、q、r、s、t、w或y。
[0067]
酮异戊酸脱羧酶(kivd)
[0068]
如本公开中所使用的,“酮异戊酸脱羧酶(kivd)”指催化来源于氨基酸转胺反应的α-酮酸向醛的脱羧的酶。kivd可以使用酮异己酸作为底物。在一些实施方案中,kivd从酮异己酸产生异戊醛。
[0069]
在一些实施方案中,宿主细胞包括kivd酶和/或编码这样的酶的异源多核苷酸。在一些实施方案中,宿主细胞包括编码kivd酶的异源多核苷酸,kivd酶包括与seq id no:14、seq id no:16、seq id no:18或seq id no:533-588中的任何一种、表3或表5中的kivd酶、或本公开中另外描述的kivd酶至少80%(例如,至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%)一致的氨基酸序列。在一些实施方案中,宿主细胞包括与seq id no:13、seq id no:15、seq id no:17或seq id no:477-532中的任何一种、编码表3或表5中的kivd酶的多核苷酸、或编码本公开中另外描述的kivd酶的多核苷酸至少90%(例如,至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%)一致的异源多核苷酸。
[0070]
在一些实施方案中,宿主细胞包括来自乳酸乳球菌的kivd。在其他实施方案中,宿主细胞不包括来自乳酸乳球菌的kivd。
[0071]
来自乳酸乳球菌的kivd可以包括uniprotkb-q684j7的氨基酸序列(seq id no:29):
[0072][0073]
在一些实施方案中,seq id no:29的氨基酸序列由核酸序列:
[0074][0075]
编码。
[0076]
在一些实施方案中,相对于对照,表达编码kivd酶的异源多核苷酸的宿主细胞可以将酮异己酸向异戊醛的转化增加多0.5倍、1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、5.5倍或6倍(例如,多2倍至6倍)。在一些实施方案中,对照是表达编码seq id no:29的异源多核苷酸的宿主细胞。在一些实施方案中,对照是大肠埃希氏菌nissle菌株syn1980δleue、δilvc、lacz:tetr-ptet-livkhmgf、tetr-ptet-leudh(bc)-kivd-adh2-brnq-rrnb ter(psc101)(如在美国专利申请公开号us20170232043中描述的)。
[0077]
在一些实施方案中,kivd酶包括与seq id no:29、seq id no:14、seq id no:16、seq id no:18或seq id no:533-588中的任何一种、seq id no:13、seq id no:15、seq id no:17或seq id no:477-532中的任何一种、编码表3或表5中的kivd酶或本公开中另外描述的kivd酶的氨基酸序列或多核苷酸序列至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%一致的序列。
[0078]
在一些实施方案中,相对于seq id no:29、seq id no:14、seq id no:16、seq id no:18或seq id no:533-588中的任何一种、表3或表5中的kivd酶、或本公开中另外描述的kivd酶,kivd酶包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少
8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少34个、至少35个、至少36个、至少37个、至少38个、至少39个、至少40个、至少41个、至少42个、至少43个、至少44个、至少45个、至少46个、至少47个、至少48个、至少49个、至少50个、至少60个、至少70个、至少80个、至少90个、或至少100个氨基酸置换、氨基酸缺失、氨基酸插入或氨基酸添加。
[0079]
在一些实施方案中,kivd酶包括:与seq id no:29中的第33位残基对应的残基处的y;与seq id no:29中的第44位残基对应的残基处的q;与seq id no:29中的第117位残基对应的残基处的m;与seq id no:29中的第129位残基对应的残基处的i;与seq id no:29中的第185位残基对应的残基处的w;与seq id no:29中的第190位残基对应的残基处的i;与seq id no:29中的第225位残基对应的残基处的i;与seq id no:29中的第227位残基对应的残基处的y;与seq id no:29中的第311位残基对应的残基处的l;与seq id no:29中的第312位残基对应的残基处的g;与seq id no:29中的第313位残基对应的残基处的t;与seq id no:29中的第328位残基对应的残基处的p;与seq id no:29中的第341位残基对应的残基处的w;与seq id no:29中的第345位残基对应的残基处的h;与seq id no:29中的第347位残基对应的残基处的c;与seq id no:29中的第420位残基对应的残基处的r;与seq id no:29中的第494位残基对应的残基处的d;与seq id no:29中的第508位残基对应的残基处的c;和/或与seq id no:29中的第550位残基对应的残基处的f。
[0080]
在一些实施方案中,kivd酶包括:与seq id no:29中的第33位残基对应的残基处的y;与seq id no:29中的第44位残基对应的残基处的q;与seq id no:29中的第117位残基对应的残基处的m;与seq id no:29中的第129位残基对应的残基处的i;与seq id no:29中的第185位残基对应的残基处的w;与seq id no:29中的第190位残基对应的残基处的i;与seq id no:29中的第225位残基对应的残基处的i;与seq id no:29中的第227位残基对应的残基处的y;与seq id no:29中的第311位残基对应的残基处的l;与seq id no:29中的第312位残基对应的残基处的g;与seq id no:29中的第313位残基对应的残基处的t;与seq id no:29中的第328位残基对应的残基处的p;与seq id no:29中的第341位残基对应的残基处的w;与seq id no:29中的第345位残基对应的残基处的h;与seq id no:29中的第347位残基对应的残基处的c;与seq id no:29中的第420位残基对应的残基处的r;与seq id no:29中的第494位残基对应的残基处的d;与seq id no:29中的第508位残基对应的残基处的c;以及与seq id no:29中的第550位残基对应的残基处的f。
[0081]
醇脱氢酶(adh)
[0082]
如本公开中所使用的,“醇脱氢酶(adh)”指催化乙醇向乙醛的转化的酶。adh可以使用异戊醛作为底物。在一些实施方案中,adh从异戊醛产生异戊醇。
[0083]
在一些实施方案中,宿主细胞包括adh酶和/或编码这样的酶的异源多核苷酸。在一些实施方案中,宿主细胞包括编码adh酶的异源多核苷酸,adh酶包括与seq id no:20、seq id no:22、seq id no:24或seq id no:645-700中的任何一种、表3或表6中的adh酶、或本公开中另外描述的adh酶至少80%(例如,至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%)
一致的氨基酸序列。在一些实施方案中,宿主细胞包括与seq id no:19、seq id no:21、seq id no:23或seq id no:589-644中的任何一种、编码表3或表6中的adh酶或本公开中另外描述的adh酶的多核苷酸至少90%(例如,至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%)一致的异源多核苷酸。
[0084]
在一些实施方案中,宿主细胞包括来自酿酒酵母的adh。在其他实施方案中,宿主细胞不包括来自酿酒酵母的adh。
[0085]
来自酿酒酵母的adh可以包括uniprotkb-p00331的氨基酸序列(seq id no:31):
[0086]
在一些实施方案中,seq id no:31的氨基酸序列由核酸序列:
[0087][0088]
编码。
[0089]
在一些实施方案中,相对于对照,表达编码adh酶的异源多核苷酸的宿主细胞可以将异戊醛向异戊醇的转化增加多0.5倍、1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、5.5倍或6倍(例如,多2倍至6倍)。在一些实施方案中,对照是表达编码seq id no:31的异源多核苷酸的宿主细胞。在一些实施方案中,对照是表达编码seq id no:31的异源多核苷酸的宿主细胞。在一些实施方案中,对照是大肠埃希氏菌nissle菌株syn1980δleue、δilvc、lacz:tetr-ptet-livkhmgf、tetr-ptet-leudh(bc)-kivd-adh2-brnq-rrnb ter(psc101)(如在美国专利申请公开号us20170232043中描述的)。
[0090]
在一些实施方案中,adh包括与seq id no:31、seq id no:20、seq id no:22、seq id no:24或seq id no:645-700中的任何一种、seq id no:19、seq id no:21、seq id no:23或seq id no:589-644中的任何一种、编码表3或表6中的adh酶或本公开中另外公开的adh酶的氨基酸序列或多核苷酸序列至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少
id no:31中的第325位残基对应的残基处的l;与seq id no:31中的第333位残基对应的残基处的m;与seq id no:31中的第334位残基对应的残基处的p;以及与seq id no:31中的第348位残基对应的残基处的q。
[0094]
支链氨基酸转运系统2载体蛋白(brnq)
[0095]
如本公开中所使用的,“支链氨基酸转运系统2载体蛋白(brnq)”指用于支链氨基酸的liv-ii转运系统的组分。brnq可以用于将支链氨基酸(例如,亮氨酸)转运到细胞(如宿主细胞)中。
[0096]
在一些实施方案中,宿主细胞包括brnq蛋白和/或编码这样的蛋白质的异源多核苷酸。在一些实施方案中,宿主细胞包括编码brnq蛋白的异源多核苷酸,brnq蛋白包括与本技术中描述的brnq蛋白(例如,seq id no:35)至少80%(例如,至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%)一致的氨基酸序列。在一些实施方案中,brnq蛋白包括uniprotkb-b7md59中所示的氨基酸序列。
[0097]
uniprotkb-b7md59具有氨基酸序列:
[0098][0099]
在一些实施方案中,seqidno:35由核酸序列:
[0100][0101]
编码。
[0102]
变体
[0103]
本公开也涵盖本公开中描述的酶和蛋白质的变体(例如,leudh、kivd或adh(并且包含核酸序列和氨基酸序列的变体))。变体可以与参考序列共有至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)的序列一致性。
[0104]
除非另外指出,否则本领域已知的术语“序列一致性”指通过序列比较(比对)确定的两个多肽或多核苷酸的序列之间的关系。在一些实施方案中,在序列(例如,leudh序列、kivd序列或adh序列)的整个长度上确定序列一致性。在一些实施方案中,在序列(例如,leudh序列、kivd序列或adh序列)的区(例如,氨基酸或核酸的段,例如,跨越活性位点的序列)上确定序列一致性。
[0105]
一致性还可以指由两个或更多个残基(例如,核酸残基或氨基酸残基)的串之间的匹配数确定的两个序列之间的序列相关性程度。一致性测量具有由特定数学模型或计算机程序(例如,算法)解决的空位比对(如果有的话)的两个或更多个序列之间一致匹配的百分比。
[0106]
可以通过本领域普通技术人员已知的方法中的任何一种容易地计算相关多肽或核酸序列的一致性。可以例如使用karlin and altschul proc.natl.acad.sci.usa 87:2264-68,1990的算法、karlin and altschul proc.natl.acad.sci.usa 90:5873-77,1993中修改的算法来确定两个序列(例如,核酸序列或氨基酸序列)的“百分比一致性”。这样的算法被并入altschul et al.,j.mol.biol.215:403-10,1990的程序和程序(版本2.0)。例如,可以用xblast程序(评分=50,字长=3)进行蛋白质搜索,以获得与本技术中描述的蛋白质同源的氨基酸序列。在两个序列之间存在空位的情况下,例如,如altschul et al.,nucleic acids res.25(17):3389-3402,1997中所描述的,可以利用gapped当利用程序和gapped程序时,如本领域普通技术人员将理解的,可以使用各自程序(例如,和)的系统内定参数,或者可以适当地调整参数。
[0107]
例如,可以使用的另外的局部比对技术基于史密斯-沃特曼算法(smith,t.f.&waterman,m.s.(1981)“identification of common molecular subsequences.”j.mol.biol.147:195-197)。例如,可以使用的通用全局比对技术是基于动态编程的尼德曼-翁施算法(needleman,s.b.&wunsch,c.d.(1970)“a general method applicable to the search for similarities in the amino acid sequences of two proteins.”j.mol.biol.48:443-453)。
[0108]
最近,开发了一种快速最优全局序列比对算法(fogsaa),据称该算法比其他最优全局比对方法(包含尼德曼-翁施算法)更快地产生核酸序列和氨基酸序列的全局比对。在一些实施方案中,通过比对两个氨基酸序列、计算相同氨基酸的数量、并且除以氨基酸序列之一的长度来确定两个多肽的一致性。在一些实施方案中,通过比对两个核苷酸序列并且
计算相同核苷酸的数量并且除以核酸之一的长度来确定两个核酸的一致性。
[0109]
对于多序列比对,可以使用计算机程序(包含clustal omega(sievers et al.,mol syst biol.2011 oct 11;7:539))。
[0110]
在优选实施方案中,当使用karlin and altschul proc.natl.acad.sci.usa 87:2264-68,1990(如在karlin and altschul proc.natl.acad.sci.usa 90:5873-77,1993中修改的)的算法(例如,程序、程序、程序或gapped程序,使用各程序的默认参数)确定序列一致性时,发现序列(包含核酸序列或氨基酸序列)(如本技术中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
[0111]
在一些实施方案中,当使用史密斯-沃特曼算法(smith,t.f.&waterman,m.s.(1981)“identification of common molecular subsequences.”j.mol.biol.147:195-197)或尼德曼-翁施算法(needleman,s.b.&wunsch,c.d.(1970)“a general method applicable to the search for similarities in the amino acid sequences of two proteins.”j.mol.biol.48:443-453)使用默认参数确定序列一致性时,发现序列(包含核酸序列或氨基酸序列)(如本技术中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
[0112]
在一些实施方案中,当使用快速最优全局序列比对算法(fogsaa)使用默认参数确定序列一致性时,发现序列(包含核酸序列或氨基酸序列)(如本技术中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
[0113]
在一些实施方案中,当使用clustal omega(sievers et al.,mol syst biol.2011oct 11;7:539)使用默认参数确定序列一致性时,发现序列(包含核酸序列或氨基酸序列)(如本技术中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
[0114]
如本公开中所使用的,当使用本领域已知的氨基酸序列比对工具(如,例如,clustal omega或)比对序列x和序列y且当序列“x”中的残基在序列“y”中的“z”的对应位置处时,序列“x”中的残基(如核酸残基或氨基酸残基)被称为对应于不同序列“y”中的位置或残基(如核酸残基或氨基酸残基)“z”。
[0115]
如本公开中所使用的,变体序列可以是同源序列。如本公开中所使用的,同源序列是共有一定百分比一致性(例如,至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%(包含之间的全部值)百分比一致性)的序列(例如,核酸序列或氨基酸序列)。同源序列包含但不限于旁系同源序列或直系同源序列。旁系同源序列由物种的基因组内的基因的复制产生,而直系同源序列在物种形成事件之后趋异。
[0116]
在一些实施方案中,多肽变体(例如,leudh酶变体、kivd酶变体或adh酶变体)包括与参考多肽(例如,参考leudh酶、参考kivd酶或参考adh酶)共有二级结构(例如,α螺旋、β片层)的域。在一些实施方案中,多肽变体(例如,leudh酶变体、kivd酶变体或adh酶变体)与参
考多肽(例如,参考leudh酶、参考kivd酶或参考adh酶)共有三级结构。作为非限制性实例,变体多肽(例如,leudh酶变体、kivd酶变体或adh酶变体)与参考多肽相比可以具有低的一级序列一致性(例如,小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、或小于5%的序列一致性),但共有一个或更多个二级结构(例如,包含但不限于环、α螺旋或β片层),或者具有与参考多肽相同的三级结构。例如,环可以位于β片层与α螺旋之间、两个α螺旋之间、或两个β片层之间。同源建模可以用于比较两个或更多个三级结构。
[0117]
任何适合的方法(包含环状变换(yu and lutz,trends biotechnol.2011 jan;29(1):18-25))都可以用于产生这样的变体。在环状变换中,可以环化多肽的线性一级序列(例如,通过连接序列的n末端和c末端),并且可以在不同位置处切断(“断裂”)多肽。因此,如由线性序列比对方法(例如,clustal omega或blast)所确定的,新多肽的线性一级序列可以具有低的序列一致性(例如,小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小或小于5%(包含之间的全部值))。然而,两种多肽的拓扑分析可以揭示其三级结构类似。不受特定理论的束缚,通过参考多肽的环状变换创建并且具有与参考多肽的三级结构类似的三级结构的变体多肽可以共有类似的功能特性(例如,酶活性、酶动力学、底物特异性或产物特异性)。在一些情况下,环状变换可以改变二级结构、三级结构或四级结构,并且产生具有不同功能特性(例如,增加或减少的酶活性、不同的底物特异性、或不同的产物特异性)的酶。参见,例如,yu and lutz,trends biotechnol.2011jan;29(1):18-25。
[0118]
应当理解的是,在已经经历环状变换的蛋白质中,蛋白质的线性氨基酸序列将不同于尚未经历环状变换的参考蛋白质。然而,本领域普通技术人员将能够通过例如比对序列和检测保守基序、和/或通过比较蛋白质的结构或预测结构(例如,通过同源建模)容易地确定已经经历环状变换的蛋白质中的哪些残基对应于尚未经历环状变换的参考蛋白质中的残基。本技术中描述的变体包含本技术中描述的序列的经环状变换的变体。
[0119]
在一些实施方案中,本技术中描述的确定感兴趣的序列与参考序列之间的百分比一致性的算法说明了序列之间的环状变换的存在。可以使用本领域已知的任何方法(包含,例如,raspodom(weiner et al.,bioinformatics.2005 apr 1;21(7):932-7))检测环状变换的存在。在一些实施方案中,在计算感兴趣的序列与本技术中描述的序列之间的百分比一致性之前,对环状变换的存在进行校正(例如,重排至少一个序列中的域)。应当理解本技术的权利要求包含在考虑序列的潜在环状变换后计算与参考序列的百分比一致性的序列。
[0120]
本公开也涵盖本技术中公开的重组leudh酶、kivd酶或adh酶的功能变体。例如,功能变体可以结合相同底物中的一种或更多种或者产生相同产物中的一种或更多种。可以使用本领域已知的任何方法鉴别功能变体。例如,上文描述的karlin and altschul proc.natl.acad.sci.usa 87:2264-68,1990的算法可以用于鉴别具有已知功能的同源蛋白质。
[0121]
也可以通过搜索具有功能注释域的多肽鉴别推定的功能变体。数据库(包含pfam(sonnhammer et al.,proteins.1997 jul;28(3):405-20))可以用于鉴别具有特定域的多肽。
[0122]
同源建模也可以用于鉴别适合突变而不影响功能的氨基酸残基。这样的方法的非
限制性实例可以包含位置特异性评分矩阵(position-specific scoring matrix)(pssm)和能量最小化协议的使用。
[0123]
位置特异性评分矩阵(pssm)使用位置权重矩阵来鉴别共有序列(例如,基序)。可以在核酸序列或氨基酸序列上进行pssm。比对序列,并且方法考虑在特定位置处观察到的特定残基(例如,氨基酸或核苷酸)的频率和所分析的序列的数量。参见,例如,stormo et al.,nucleic acids res.1982 may 11;10(9):2997-3011。可以计算在给定位置处观察到特定残基的可能性。不受特定理论的束缚,具有高变异性的序列中的位置可以适合突变(例如,pssm评分≥0)以产生功能同系物。
[0124]
pssm可以与rosetta能量函数的计算配对,rosetta能量函数确定野生型与单点突变体之间的差异。rosetta能量函数将该差异计算为(δδg
calc
)。利用rosetta函数,突变的残基与周围原子之间的键合相互作用被用于确定突变是增加还是减小蛋白质稳定性。例如,然后可以使用rosetta能量函数分析由pssm评分(例如,pssm评分≥0)指定为有利的突变,以确定突变对蛋白质稳定性的潜在影响。不受特定理论的束缚,潜在稳定化的突变对于蛋白质工程(例如,功能同系物的产生)是期望的。在一些实施方案中,潜在稳定化的突变具有小于-0.1(例如,小于-0.2、小于-0.3、小于-0.35、小于-0.4、小于-0.45、小于-0.5、小于-0.55、小于-0.6、小于-0.65、小于-0.7、小于-0.75、小于-0.8、小于-0.85、小于-0.9、小于-0.95、或小于-1.0)rosetta能量单位(r.e.u.)的δδg
calc
值。参见,例如,goldenzweig et al.,mol cell.2016jul 21;63(2):337-346.doi:10.1016/j.molcel.2016.06.012。
[0125]
在一些实施方案中,leudh酶、kivd酶或adh酶编码序列包括在与参考(例如,leudh酶、kivd酶或adh酶)编码序列对应的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或超过100个位置处的突变。在一些实施方案中,相对于参考(例如,leudh酶、kivd酶或adh酶)编码序列,leudh酶、kivd酶或adh酶编码序列在编码序列的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个密码子中包括突变。如本领域普通技术人员将理解的,由于遗传码的简并性,密码子内的突变可以改变由密码子编码的氨基酸或者可以不改变由密码子编码的氨基酸。在一些实施方案中,相对于参考多肽(例如,leudh酶、kivd酶或adh酶)的氨基酸序列,编码序列中的一个或更多个突变不改变编码序列(例如,leudh酶、kivd酶或adh酶)的氨基酸序列。
[0126]
在一些实施方案中,相对于参考多肽(例如,leudh酶、kivd酶或adh酶)的氨基酸序列,重组leudh酶序列、重组kivd酶序列或重组adh酶序列中的一个或更多个突变改变多肽(例如,leudh酶、kivd酶或adh酶)的氨基酸序列。在一些实施方案中,相对于参考多肽(例如,leudh酶、kivd酶或adh酶)的氨基酸序列,一个或更多个突变改变重组多肽(例如,leudh酶、kivd酶或adh酶)的氨基酸序列,并且相对于参考多肽改变(增强或降低)多肽的活性。
[0127]
可以使用常规方法测量本公开中描述的重组多肽(例如,leudh酶、kivd酶或adh酶)中任何一种的活性(例如,比活性)。作为非限制性实例,可以通过测量重组多肽的底物特异性、产生的一种或多种产物、产生的一种或多种产物的浓度、或其任何组合来确定重组多肽的活性。如本公开中所使用的,重组多肽的“比活性”指每单位时间针对给定量(例如,浓度)的重组多肽产生的特定产物的量(例如,浓度)。
[0128]
本领域技术人员还将认识到,重组多肽(例如,leudh酶、kivd酶或adh酶)编码序列中的突变可以造成保守氨基酸置换,以提供前述多肽的功能等效变体(例如,保留多肽的活性的变体)。如本公开中所使用的,“保守氨基酸置换”指不改变进行氨基酸置换的蛋白质的相对电荷特性或尺寸特性或功能活性的氨基酸置换。
[0129]
在一些情况下,氨基酸的特征在于其r基团(参见,例如,表1)。例如,氨基酸可以包括非极性脂族r基团、带正电荷的r基团、带负电荷的r基团、非极性芳族r基团、或极性不带电荷的r基团。包括非极性脂族r基团的氨基酸的非限制性实例包含丙氨酸、甘氨酸、缬氨酸、亮氨酸、甲硫氨酸和异亮氨酸。包括带正电荷的r基团的氨基酸的非限制性实例包含赖氨酸、精氨酸和组氨酸。包括带负电荷的r基团的氨基酸的非限制性实例包含天门冬氨酸盐和谷氨酸盐。包括非极性芳族r基团的氨基酸的非限制性实例包含苯丙氨酸、酪氨酸和色氨酸。包括极性不带电荷的r基团的氨基酸的非限制性实例包含丝氨酸、苏氨酸、半胱氨酸、脯氨酸、天门冬酰胺和谷氨酰胺。
[0130]
可以根据本领域普通技术人员已知的用于改变多肽序列的方法(如在编纂这样的方法的参考文献(例如,molecular cloning:a laboratory manual,j.sambrook,et al.,eds.,fourth edition,cold spring harbor laboratory press,cold spring harbor,new york,2012、或current protocols in molecular biology,f.m.ausubel,et al.,eds.,john wiley&sons,inc.,new york,2010)中发现的)来制备变体。
[0131]
多肽的功能等效变体的非限制性实例可以包含本技术中公开的蛋白质的氨基酸序列中的保守氨基酸置换。如本公开中所使用的,“保守置换”与“保守氨基酸置换”可互换地使用,并且指表1中提供的氨基酸置换中的任何一种。
[0132]
在一些实施方案中,在制备变体多肽时,可以改变1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或超过20个残基。在一些实施方案中,氨基酸被保守氨基酸置换替代。
[0133]
表1.保守氨基酸置换
[0134]
原始残基r基团类型保守氨基酸置换ala非极性脂族r基团cys、gly、serarg带正电荷的r基团his、lysasn极性不带电荷的r基团asp、gln、gluasp带负电荷的r基团asn、gln、glu
cys极性不带电荷的r基团ala、sergln极性不带电荷的r基团asn、asp、gluglu带负电荷的r基团asn、asp、glngly非极性脂族r基团ala、serhis带正电荷的r基团arg、tyr、trpile非极性脂族r基团leu、met、valleu非极性脂族r基团ile、met、vallys带正电荷的r基团arg、hismet非极性脂族r基团ile、leu、phe、valpro极性不带电荷的r基团 phe非极性芳族r基团met、trp、tyrser极性不带电荷的r基团ala、gly、thrthr极性不带电荷的r基团ala、asn、sertrp非极性芳族r基团his、phe、tyr、mettyr非极性芳族r基团his、phe、trpval非极性脂族r基团ile、leu、met、thr
[0135]
可以通过改变多肽(例如,leudh酶、kivd酶或adh酶)的编码序列来进行多肽的氨基酸序列中的氨基酸置换以产生具有期望性质和/或活性的重组多肽(例如,leudh酶、kivd酶或adh酶)变体。类似地,通常通过改变重组多肽(例如,leudh酶、kivd酶或adh酶)的编码序列来进行多肽的氨基酸序列中的保守氨基酸置换以产生多肽的功能等效变体。
[0136]
可以通过本领域普通技术人员已知的多种方法在核苷酸序列中进行突变(例如,置换)。例如,可以通过pcr定向突变、根据kunkel的方法(kunkel,proc.nat.acad.sci.u.s.a.82:488-492,1985)的定点突变、通过编码多肽的基因的化学合成、通过基因编辑技术、或者通过插入(如标签(例如,his标签或gfp标签)的插入)来进行突变。
[0137]
编码支链氨基酸(bcaa)途径酶的核酸
[0138]
本公开的方面涉及重组酶、其功能化修饰和变体、以及与其相关的应用。例如,本技术中描述的酶和细胞可以用于例如通过将亮氨酸转化成异戊醇来促进亮氨酸消耗。方法可以包括使用包括本技术中公开的一种或更多种酶的宿主细胞、细胞裂解物、分离的酶、或其任何组合。本公开涵盖包括在宿主细胞中重组表达编码本技术中公开的酶的多核苷酸的方法。本公开涵盖包括向有需要的受试者施用包括至少一种bcaa途径酶(例如,leudh酶、kivd酶或adh酶)的宿主细胞的方法。本公开还涵盖包括使反应混合物中的一种或更多种支链氨基酸(bcaa)与本技术中公开的bcaa途径酶反应的体外方法。在一些实施方案中,bcaa途径酶是leudh酶、kivd酶、或adh酶、或其组合。
[0139]
编码重组多肽(例如,leudh、kivd、adh和/或brnq)中的任何一种或更多种的核酸被本公开涵盖,并且可以被包括在宿主细胞内。在一些实施方案中,核酸是操纵子的形式。在一些实施方案中,至少一个核糖体结合位点存在于核酸中存在的编码序列中的一个或更多个之间。
[0140]
在一些实施方案中,本公开涵盖的leudh核酸序列、kivd核酸序列、adh核酸序列
和/或brnq核酸序列是与本公开中提供的leudh核酸序列、kivd核酸序列、adh核酸序列和/或brnq核酸序列在高严格性条件或中等严格性条件下杂交并且具有生物学活性的核酸序列。例如,可以使用在65℃的0.2
×
ssc至1
×
ssc、然后在65℃以0.2
×
ssc洗涤的高严格性条件下与编码leudh、kivd、adh和/或brnq的核酸杂交的核酸。可以使用在室温的6
×
ssc、然后在室温以2
×
ssc洗涤的低严格性条件下与编码leudh、kivd、adh和/或brnq的核酸杂交的核酸。其他杂交条件包含40℃或50℃的3
×
ssc、然后在20℃、30℃、40℃、50℃、60℃或65℃用1
×
ssc或2
×
ssc洗涤。
[0141]
可以在存在甲醛(例如,10%、20%、30%、40%或50%)的情况下进行杂交,甲醛的存在进一步增加了杂交的严格性。例如,s.阿格拉瓦尔(s.agrawal)(编者)分子生物学方法(methods in molecular biology),第20卷;和泰森(tijssen)(1993)生物化学和分子生物学实验技术-核酸探针杂交(laboratory techniques in biochemistry and molecular biology-hybridization with nucleic acid probes)(例如,第i部分第2章“杂交原理和核酸探针测定的策略的概述(overview of principles of hybridization and the strategy of nucleic acid probe assays)”,纽约爱思维尔提供核酸杂交的基本指导)中描述了核酸杂交的理论和实践。示例性蛋白质可以与leudh蛋白、kivd蛋白、或adh蛋白或其域(例如,催化域)具有至少约50%、70%、80%、90%(优选至少约95%,甚至更优选至少约98%,并且最优选至少99%)的同源性或一致性。其他示例性蛋白质可以由与leudh核酸、kivd核酸或adh核酸(例如,本技术中描述的那些leudh核酸、kivd核酸或adh核酸)至少约90%(优选至少约95%,甚至更优选至少约98%,并且最优选至少99%)的同源性或一致性的核酸编码。
[0142]
可以通过本领域已知的任何方法将编码本技术中描述的重组多肽(例如,leudh、kivd、adh和/或brnq)中任何一种或更多种的核酸并入任何适当的运载体中。例如,运载体可以是表达载体(包含但不限于病毒运载体(例如,慢病毒运载体、逆转录病毒运载体、腺病毒运载体、或腺相关病毒运载体)、适合于瞬时表达的任何运载体、适合于组成型表达的任何运载体、或者适合于诱导型表达的任何运载体(例如,半乳糖诱导型运载体或强力霉素诱导型运载体))。
[0143]
在一些实施方案中,运载体在细胞中自主复制。在一些实施方案中,将运载体整合到细胞内的染色体中。运载体可以含有一个或更多个核酸内切酶限制性位点,核酸内切酶限制位点被限制性核酸内切酶切割以插入和连接含有本技术中描述的基因的核酸,以产生能够在细胞中复制的重组运载体。运载体通常由dna组成,尽管rna运载体也是可用的。克隆运载体包含(但不限于):质粒、f黏粒(fosmid)、噬菌粒、病毒基因组和人工染色体。如本技术中所使用的,术语“表达运载体”或“表达构建体”指重组或合成生成的、具有一系列容许特定核酸在宿主细胞(例如,微生物)(如酵母细胞)中转录的指定核酸元件的核酸构建体。在一些实施方案中,将本技术中描述的基因的核酸序列插入克隆运载体中,使得其可操作地连接至调控序列,并且在一些实施方案中表达为rna转录物。在一些实施方案中,运载体含有一种或更多种标志物(如本技术中描述的可选择的标志物),以鉴别用重组运载体转化或转染的细胞。在一些实施方案中,本技术中描述的基因的核酸序列是经密码子优化的。密码子优化可以将基因产物的产量相对于未经密码子优化的参考序列增加至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、
至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或100%(包含之间的全部值)。
[0144]
在一些实施方案中,本技术中描述的核酸序列在质粒中表达。例如,本技术中描述的核酸序列可以在克隆质粒中表达。本技术中描述的核酸序列可以在质粒中表达以用于瞬时表达。本技术中描述的核酸序列也可以在质粒中表达以将核酸序列并入基因组dna中。
[0145]
当编码序列和调控序列共价地连接并且编码序列的表达或转录受到调控序列的影响或控制时,编码序列和调控序列被称为“可操作地连接(operably joined)”或“可操作地连接(operably linked)”。如果编码序列被翻译成功能蛋白,则如果5’调控序列中启动子的诱导容许编码序列被转录,并且如果编码序列与调控序列之间的联接的性质不会(1)造成移码突变的引入;(2)干扰启动子区指导编码序列的转录的能力、或(3)干扰相应rna转录物被翻译成蛋白质的能力,则编码序列和调控序列被称为是可操作地连接。
[0146]
在一些实施方案中,编码本技术中描述的蛋白质中的任何一种或更多种的核酸受调控序列(例如,增强子序列)的控制。在一些实施方案中,核酸在启动子的控制下表达。启动子可以是天然启动子(例如,基因在其内源环境中的启动子,该启动子提供基因表达的正常调控)。可替代地,启动子可以是与基因的天然启动子不同的启动子,例如,启动子与基因在其内源环境中的启动子不同。
[0147]
在一些实施方案中,启动子是真核启动子。真核启动子的非限制性实例包含如本领域普通技术人员已知的tdh3、pgk1、pkc1、pdc1、tef1、tef2、rpl18b、ssa1、tdh2、pyk1、tpi1 gal1、gal10、gal7、gal3、gal2、met3、met25、hxt3、hxt7、act1、adh1、adh2、cup1-1、eno2和sod1(参见,例如,addgene网站:blog.addgene.org/plasmids-101-the-promoter-region)。在一些实施方案中,启动子是原核启动子(例如,噬菌体启动子或细菌启动子)。如本领域普通技术人员所已知的,噬菌体启动子的非限制性实例包含pls1con、t3、t7、sp6和pl。细菌启动子的非限制性实例包含pbad、pmgrb、ptrc2、pci857、plac/ara、plac/fnr、ptac、ptet、pcmt和pm。
[0148]
在一些实施方案中,启动子是诱导型启动子。如本技术中所使用的,“诱导型启动子”是受到分子的存在或不存在控制的启动子。例如,这可以用于可控地诱导酶的表达。在一些实施方案中,在诱导型启动子与leudh、kivd和/或adh连接的情况下,可以在某些时间处诱导leudh、kivd和/或adh的表达或者可以在某些时间处不诱导leudh、kivd和/或adh的表达。例如,在一些实施方案中,可以在某些时间处不诱导表达,以便限制亮氨酸消耗(例如,在细胞生长期间)。诱导型启动子的非限制性实例包含化学调控的启动子和物理调控的启动子。对于化学调控的启动子,转录活性可以由一种或更多种化合物(如醇、四环素、半乳糖、类固醇、金属、或其他化合物)调控。对于物理调控的启动子,转录活性可以受现象(如光或温度)的调控。四环素调控的启动子的非限制性实例包含脱水四环素(atc)响应性启动子和其他四环素响应性启动子系统(例如,四环素阻遏蛋白(tetr)、四环素操纵子序列(teto)和四环素反式激活子融合蛋白(tta))。类固醇调控的启动子的非限制性实例包含基于大鼠糖皮质激素受体、人雌激素受体、蛾蜕皮激素受体的启动子,以及来自类固醇/类维生素a/甲状腺受体超家族的启动子。金属调控的启动子的非限制性实例包含来源于金属硫蛋白(结合并且螯合金属离子的蛋白质)基因的启动子。发病机制调控的启动子的非限制性实例包含由水杨酸、乙烯或苯并噻二唑(bth)诱导的启动子。温度/热诱导型启动子的非限制性
thermotolerans)、柳毕赤酵母(pichia salictaria)、栋树毕赤酵母(pichia quercuum)、皮杰普氏毕赤酵母(pichia pijperi)、树干毕赤酵母(pichia stipitis)、甲醇毕赤酵母(pichia methanolica)、安格斯毕赤酵母(pichia angusta)、乳酸克鲁维酵母(kluyveromyces lactis)、白假丝酵母(candida albicans)、或解脂耶氏酵母(yarrowia lipolytica)。
[0157]
在一些实施方案中,酵母菌株是工业多倍体酵母菌株。真菌细胞的其他非限制性实例包含获自曲霉属、青霉属、镰刀菌属、根霉属、支顶孢属、脉孢菌属、粪壳菌属、稻瘟菌属、异水霉属、黑粉菌属、葡萄孢属和木霉属的细胞。
[0158]
在某些实施方案中,宿主细胞是藻类细胞(如衣藻属(例如,莱茵衣藻)和席藻属(席藻属atcc29409))。
[0159]
在其他实施方案中,宿主细胞是原核细胞。适合的原核细胞包含革兰氏阳性细菌细胞、革兰氏阴性细菌细胞和革兰氏不定细菌细胞。宿主细胞可以是(但不限于):农杆菌属、脂环酸芽孢杆菌属(alicyclobacillus)、鱼腥藻属、倒囊藻属、不动杆菌属、热酸菌属(acidothermus)、节杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、短杆菌属、丁酸弧菌属、布赫纳氏菌属(buchnera)、油菜属菌属(campestris)、弯曲菌属、梭菌属、棒状杆菌属、着色菌属、粪球菌属、埃希氏菌属、肠球菌属、肠杆菌属、欧文氏菌属、梭杆菌属、粪杆菌属、弗朗西斯氏菌属、黄杆菌属、地芽孢杆菌属、嗜血杆菌属、螺杆菌属、克雷伯菌属、乳杆菌属、乳球菌属、泥杆菌属(ilyobacter)、微球菌属、微杆菌属、中间根瘤菌属(mesorhizobium)、甲基杆菌属、甲基杆菌属、分枝杆菌属、奈瑟氏菌属、泛菌属、假单胞菌属、原绿球藻(prochlorococcus)、红细菌属、红假单胞菌属、红假单胞菌属、罗氏菌属(roseburia)、红螺菌属、红球菌属、栅藻属、链霉菌属、链球菌属、聚球藻属(synecoccus)、糖单孢菌属、糖多孢菌属、葡萄球菌属、沙雷氏菌属、沙门氏菌属、志贺氏菌属、嗜热厌氧杆菌属(thermoanaerobacterium)、tropheryma、tularensis、temecula、嗜热聚球藻属(thermosynechococcus)、热球菌属(thermococcus)、尿素原体(ureaplasma)、黄杆菌属、小菌属(xylella)、耶尔森氏菌属和发酵单胞菌属。
[0160]
在一些实施方案中,细菌宿主菌株是工业菌株。许多细菌工业菌株是已知的,并且适合于本技术中描述的方法和组合物。
[0161]
在一些实施方案中,细菌宿主细胞是农杆菌属(例如,放射形农杆菌(a.radiobacter)、发根农杆菌(a.rhizogenes)、悬钩子农杆菌(a.rubi))、节杆菌属(例如,金黄节杆菌(a.aurescens)、柠檬节杆菌(a.citreus)、球形节杆菌(a.globformis)、裂烃谷氨酸节杆菌(a.hydrocarboglutamicus)、迈索尔节杆菌(a.mysorens)、烟草节杆菌(a.nicotianae)、石蜡节杆菌(a.paraffineus)、原玻璃蝇节杆菌(a.protophonniae)、玫瑰色石蜡节杆菌(a.roseoparaffinus)、硫磺节杆菌(a.sulfureus)、产脲节杆菌(a.ureafaciens))、芽孢杆菌属(例如,苏云金芽孢杆菌(b.thuringiensis)、炭疽芽孢杆菌(b.anthracis)、巨大芽孢杆菌(b.megaterium)、枯草芽孢杆菌(b.subtilis)、迟缓芽孢杆菌(b.lentus)、环状芽孢杆菌(b.circulars)、短小芽孢杆菌(b.pumilus)、灿烂芽孢杆菌(b.lautus)、凝结芽孢杆菌(b.coagulans)、短芽孢杆菌(b.brevis)、坚强芽孢杆菌(b.firmus)、嗜碱芽孢杆菌(b.alkaophius)、地衣芽孢杆菌(b.licheniformis)、克劳氏芽孢杆菌(b.clausii)、嗜热脂肪芽孢杆菌(b.stearothermophilus)、耐盐芽孢杆菌
(b.halodurans)和解淀粉芽孢杆菌(b.amyloliquefaciens))。在特定实施方案中,宿主细胞将是工业芽孢杆菌菌株(包含但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌和解淀粉芽孢杆菌)。在一些实施方案中,宿主细胞将是工业梭菌属(例如,丙酮丁醇梭菌(c.acetobutylicum)、破伤风梭菌e88(c.tetani e88)、象牙海岸梭菌(c.lituseburense)、糖丁基梭菌(c.saccharobutylicum)、产气荚膜梭菌(c.perfringens)、拜氏梭菌(c.beijerinckii))。在一些实施方案中,宿主细胞将是工业棒状杆菌属(例如,谷氨酸棒状杆菌(c.glutamicum)、嗜醋酸棒状杆菌(c.acetoacidophilum))。在一些实施方案中,宿主细胞将是工业埃希氏菌属(例如,大肠埃希氏菌)。在一些实施方案中,宿主细胞将是工业欧文氏菌属(例如,噬夏孢欧文氏菌(e.uredovora)、软腐欧文氏菌(e.carotovora)、菠萝欧文氏菌(e.ananas)、草生欧文氏菌(e.herbicola)、斑点欧文氏菌(e.punctata)、e.terreus)。在一些实施方案中,宿主细胞将是工业泛菌属(例如,柠檬泛菌(p.citrea)、成团泛菌(p.agglomerans))。在一些实施方案中,宿主细胞将是工业假单胞菌属(例如,恶臭假单胞菌(p.putida)、绿脓假单胞菌(p.aeruginosa)、梅瓦隆假单胞菌(p.mevalonii))。在一些实施方案中,宿主细胞将是工业链球菌属(例如,相似型链球菌(s.equisimiles)、酿脓链球菌(s.pyogenes)、乳房链球菌(s.uberis))。在一些实施方案中,宿主细胞将是工业链霉菌属(例如,产二素链霉菌(s.ambofaciens)、不产色链霉菌(s.achromogenes)、阿维链霉菌(s.avermitilis)、天蓝色链霉菌(s.coelicolor)、金霉素链霉菌(s.aureofaciens)、金色链霉菌(s.aureus)、杀真菌链霉菌(s.fungicidicus)、灰色链霉菌(s.griseus)、变铅青链霉菌(s.lividans))。在一些实施方案中,宿主细胞将是工业发酵单胞菌属(例如,运动发酵单胞菌(z.mobilis)、解脂发酵单胞菌(z.lipolytica))等。
[0162]
本公开也适合于与多种动物细胞类型(包含哺乳动物细胞,例如,人类细胞系(包含293细胞、海拉细胞、wi38细胞、per.c6细胞和bowes黑素瘤细胞)、小鼠细胞系(包含3t3、ns0、ns1、sp2/0)、仓鼠细胞系(cho、bhk)、猴细胞系(cos、frhl、vero)和杂交瘤细胞系)使用。
[0163]
在各种实施方案中,可以在本公开的实践中使用的菌株包含原核菌株和真核菌株两者,并且公众易于从多个培养物保藏中心(如美国典型培养物保藏中心(american type culture collection)(atcc)、德国微生物菌种保藏中心(deutsche sammlung von mikroorganismen and zellkulturen gmbh)(dsm)、荷兰微生物菌种保藏中心(centraalbureau voor schimmelcultures)(cbs)和美国农业研究服务专利培养物保藏中心北方地区研究中心(agricultural research service patent culture collection,northern regional research center)(nrrl)获取。本公开也适合于与多种植物细胞类型使用。
[0164]
如本技术中所使用的,术语“细胞”可以指单个细胞或细胞群体(如属于相同细胞系或菌株的细胞群体)。不应当将单数术语“细胞”的使用解释为明确地指单个细胞而不是细胞群体。相对于野生型对应物,宿主细胞可以包括基因修饰。
[0165]
可以使用本领域已知的任何方法将编码本技术中描述的重组多肽(例如,leudh酶、kivd酶、adh酶和/或brnq)中任何一种或更多种的运载体引入适合的宿主细胞中。可以在本领域普通技术人员理解的任何适合的条件下培养宿主细胞。例如,可以使用本领域已
知的任何培养基、温度和孵育条件。对于携带诱导型运载体的宿主细胞,可以用适当的诱导剂培养细胞以促进表达。
[0166]
可以在接触和/或核酸的整合之前、在接触和/或核酸的整合期间、和/或在接触和/或核酸的整合之后在任何类型(富集的或基本的)和任何组成的培养基中培养本技术中公开的任何细胞。如本领域普通技术人员所理解的,可以通过常规实验优化培养物或培养过程的条件。在一些实施方案中,选择的培养基补充有各种组分。在一些实施方案中,优化补充组分的浓度和量。在一些实施方案中,通过常规实验优化培养基和生长条件(例如,ph、温度等)的其他方面。在一些实施方案中,优化培养基补充一种或更多种补充组分的频率、以及培养细胞的时间量。
[0167]
可以在本领域已知且使用的培养容器中进行本技术中描述的细胞的培养。在一些实施方案中,充气反应容器(例如,搅拌釜反应器)用于培养细胞。在一些实施方案中,生物反应器或发酵器用于培养细胞。因此,在一些实施方案中,在发酵中使用细胞。如本技术中所使用的,术语“生物反应器”和术语“发酵器”可互换地使用,并且指在其中发生生物反应、生物化学反应和/或化学反应(涉及活生物体或活生物体的一部分)的包围物或部分包围物。“大规模生物反应器”或“工业规模生物反应器”是用于以商业规模或准商业规模生成产物的生物反应器。大型生物反应器通常具有在升、数百升、数千升、或更大范围内的体积。
[0168]
在一些实施方案中,生物反应器包括细胞(例如,细菌细胞)或细胞培养物(例如,细菌细胞培养物)(如本技术中描述的细胞或细胞培养物)。在一些实施方案中,生物反应器包括孢子和/或分离微生物的休眠细胞类型(例如,处于干燥状态的休眠细胞)。
[0169]
生物反应器的非限制性实例包含:搅拌釜发酵器、通过旋转混合装置搅动的生物反应器、恒化器、通过振动装置搅动的生物反应器、气升式发酵器、填充床反应器、固定床反应器、流化床生物反应器、采用波诱导的搅动的生物反应器、离心生物反应器、滚瓶、以及中空纤维生物反应器、滚转器设备(例如,台式种类、推车安装式种类、和/或自动化种类)、竖直堆叠的板、旋转瓶、搅拌瓶或摇动瓶、振动的多孔板、md瓶、方瓶、洛克斯氏瓶、多表面组织培养繁殖器、改良的发酵器、以及经涂覆的珠(例如,用血清蛋白、硝化纤维素或羧甲基纤维素涂覆的珠以防止细胞附着)。
[0170]
在一些实施方案中,生物反应器包含细胞培养系统,其中细胞(例如,细菌细胞)与运动的液体和/或气泡接触。在一些实施方案中,细胞或细胞培养物悬浮生长。在其他实施方案中,细胞或细胞培养物附着于固相载体。载体系统的非限制性实例包含微载体(例如,可以是多孔或无孔的聚合物球、微珠和微盘)、带有特定化学基团(例如,叔胺基团)的交联珠(例如,右旋糖酐)、2d微载体(包含捕获在无孔聚合物纤维中的细胞)、3d载体(例如,载体纤维、中空纤维、多筒反应器(multicartridge reactor)、以及可以包括多孔纤维的半渗透膜)、具有降低的离子交换能力的微载体、微囊化细胞、毛细管、以及聚集体。在一些实施方案中,由材料(如右旋糖酐、明胶、玻璃、或纤维素)制造载体。
[0171]
在一些实施方案中,以连续模式、半连续模式或非连续模式操作工业规模的过程。操作模式的非限制性实例是分批、补料分批(fed batch)、扩展分批(extended batch)、重复分批(repetitive batch)、抽取/填充、旋转壁、旋转瓶、和/或灌注操作模式。在一些实施方案中,生物反应器允许连续或半连续补充底物原料(例如,碳水化合物来源)和/或从生物反应器连续或半连续分离产物。
[0172]
在一些实施方案中,生物反应器或发酵器包含传感器和/或控制系统以测量和/或调整反应参数。反应参数的非限制性实例包含生物学参数(例如,生长速率、细胞尺寸、细胞数量、细胞密度、细胞类型、或细胞状态等)、化学参数(例如,ph、氧化还原电位、反应底物和/或产物的浓度、溶解的气体的浓度(如氧气浓度和co2浓度)、营养物浓度、代谢物浓度、寡肽的浓度、氨基酸的浓度、维生素的浓度、激素的浓度、添加剂的浓度、血清浓度、离子强度、离子的浓度、相对湿度、摩尔浓度、同渗容摩、其他化学物质(例如,缓冲剂、佐剂或反应副产物)的浓度)、物理/机械参数(例如,密度、传导率、搅拌程度、压力、和流速、剪切应力、剪切速率、粘度、颜色、浊度、光吸收、混合速率、转化率、以及热力学参数(如温度、光强度/质量)等)。测量本技术中描述的参数的传感器对于相关机械和电子领域的普通技术人员来说是公知的。控制系统基于来自本技术中描述的传感器的输入来调整生物反应器中的参数是生物反应器工程领域的普通技术人员公知的。
[0173]
在一些实施方案中,方法涉及分批发酵(例如,摇瓶发酵)。分批发酵(例如,摇瓶发酵)的一般考虑因素包含氧气和葡萄糖的水平。例如,分批发酵(例如,摇瓶发酵)可能受限于氧气和葡萄糖,因此在一些实施方案中,菌株在设计良好的补料分批发酵中进行的能力被低估。另外,最终产物可以在溶解性、毒性、细胞累积和分泌方面显示出与底物的一些差异,并且在一些实施方案中可以具有不同的发酵动力学。
[0174]
在一些实施方案中,本公开的细胞适合于在体内消耗亮氨酸。在一些实施方案中,细胞适合于产生一种或更多种用于经由转化为异戊醇消耗亮氨酸的酶(例如,leudh、kivd和/或adh)。在这样的实施方案中,酶可以通过在体外过程或离体过程中的生物转化来催化用于亮氨酸的消耗的反应。
[0175]
本公开的蛋白质或酶中的任何一种可以在宿主细胞中表达。如本技术中所使用的,宿主细胞是可以用于表达至少一种异源多核苷酸(例如,编码本技术中描述的蛋白质或酶)的细胞。就多核苷酸(如包括基因的多核苷酸)而言,术语“异源”与术语“外源的”和术语“重组”可互换地使用,并且指:已经被人工地提供给生物系统的多核苷酸;已经在生物系统内修饰的多核苷酸、或者已经在生物系统内操纵其表达或调控的多核苷酸。被引入宿主细胞中或者在宿主细胞中表达的异源多核苷酸可以是来自与宿主细胞不同的生物体或物种的多核苷酸,或者可以是合成的多核苷酸,或者可以是也在与宿主细胞相同的生物体或物种中内源表达的多核苷酸。例如,当在宿主细胞中内源表达的多核苷酸非天然地位于宿主细胞中;在宿主细胞中稳定或瞬时重组表达;在宿主细胞内被修饰;在宿主细胞内被选择性编辑;在宿主细胞内以不同于天然存在的拷贝数的拷贝数表达;或者在宿主细胞内以非天然方式表达(如通过操纵控制多核苷酸的表达的调控区)时,在宿主细胞中内源表达的多核苷酸可以被认为是异源的。在一些实施方案中,异源多核苷酸是一多核苷酸,所述多核苷酸在宿主细胞中内源表达,但所述多核苷酸的表达由不天然调控多核苷酸表达的启动子驱动。在其他实施方案中,异源多核苷酸是一多核苷酸,所述多核苷酸在宿主细胞中内源表达,并且所述多核苷酸的表达由天然调控多核苷酸表达的启动子驱动,但所述启动子或另外的调控区被修饰。在一些实施方案中,启动子被重组激活或阻抑。例如,基于基因编辑的技术可以用于调控多核苷酸(包含内源多核苷酸)自启动子(包含内源启动子)的表达。参见,例如,chavez et al.,nat methods.2016 jul;13(7):563-567。与参考多核苷酸序列相比,异源多核苷酸可以包括野生型序列或突变序列。
[0176]
任何适合的宿主细胞可以被用于产生本技术中公开的重组多肽(例如,leudh、kivd和/或adh)(包含真核细胞或原核细胞)中的任何一种。
[0177]
组合物
[0178]
本公开提供组合物(包含药物组合物),组合物包括本技术中描述的宿主细胞(例如,包括编码选自由leudh、kivd和adh组成的组的至少一种酶的异源多核苷酸的宿主细胞)或本技术中描述的一种或更多种酶(例如,leudh、kivd和/或adh)、以及可选的药学上可接受的赋形剂。
[0179]
在某些实施方案中,本技术中描述的宿主细胞以有效量提供在组合物(如药物组合物)中。在某些实施方案中,本技术中描述的一种或更多种酶以有效量提供在组合物(如药物组合物)中。在某些实施方案中,有效量是治疗有效量。在某些实施方案中,有效量是预防有效量。在一些实施方案中,有效量是足以治疗或改善msud的一种或更多种症状的量。
[0180]
在某些实施方案中,受试者是动物。在某些实施方案中,受试者是人类。在其他实施方案中,受试者是非人类动物。在某些实施方案中,受试者是哺乳动物。在某些实施方案中,受试者是非人类哺乳动物。在一些实施方案中,受试者是非哺乳动物。在某些实施方案中,受试者是驯养动物(如狗、猫、牛、猪、马、绵羊、鸡或山羊)。在某些实施方案中,受试者是伴侣动物(如狗或猫)。在某些实施方案中,受试者是家畜动物(如牛、猪、马、绵羊、鸡或山羊)。在某些实施方案中,受试者是动物园动物。在另外的实施方案中,受试者是研究动物(如啮齿动物(例如,小鼠、大鼠)、狗、猪或非人类灵长类动物)。
[0181]
可以通过本领域已知的任何方法制备本技术中描述的组合物(如药物组合物)。通常,这样的制备方法包含将本技术中描述的化合物(例如,“活性成分”)与载体或赋形剂和/或一种或更多种其他辅助成分联合,并且然后(如果必要的话和/或如果期望的话)成形和/或将产品包装成期望的单剂量单位或多剂量单位。
[0182]
方法
[0183]
在一些方面,本公开提供使用宿主细胞的方法。在一些实施方案中,本公开提供包括培养本技术中描述的宿主细胞(例如,包括编码选自由leudh、kivd和adh组成的组的至少一种酶的异源多核苷酸的宿主细胞)的方法。在本技术的其他处描述了用于培养细胞的方法。在一些实施方案中,本公开提供从亮氨酸产生异戊醇的方法,方法包括培养本技术中描述的宿主细胞(例如,包括编码leudh、kivd和adh的异源多核苷酸的宿主细胞)。在一些实施方案中,在体内(例如,在已经施用宿主细胞的人类受试者中)进行产生和培养。在一些实施方案中,离体(例如,在体外细胞培养环境中)进行产生。本技术中描述的组合物、细胞、酶和方法也适用于工业环境(包含其中可能存在支链氨基酸(例如,亮氨酸、异亮氨酸和缬氨酸)累积的任何应用)。
[0184]
通过以下实施例进一步阐明本发明,但绝不应当将以下实施例解释为限制。贯穿本技术所引用的全部参考文献(包含文献参考、授权专利、公布的专利申请、以及待审专利申请)的全部内容特此通过引用被明确并入。如果并入本技术的参考文献含有定义与本公开中定义的相同术语的定义不一致或不相容的术语,则应当以本公开中归于该术语的含义为准。然而,对本技术中引用的任何参考文献、文章、出版物、专利、专利公布和专利申请的提及不被认为是其构成有效现有技术或者形成世界上任何国家中的公知常识的一部分的承认或任何形式的暗示,也不应当被认为其构成有效现有技术或者形成世界上任何国家中
的公知常识的一部分的承认或任何形式的暗示。
实施例
[0185]
为了可以更充分地理解本技术中描述的发明,示出下列实施例。本技术中描述的实施例被提供以阐明本技术中提供的系统和方法,并且不被以任何方式解释为限制其范围。
[0186]
实施例1:酶库设计和合成
[0187]
材料和方法
[0188]
宏基因组酶发现
[0189]
基于机器学习的生物信息学工具用于在公共序列数据库(swissprot和trembl,一起被称为uniprot)中针对三种期望活性中的每种鉴别候选酶(亮氨酸脱氢酶,1.4.1.9;酮异戊酸脱羧酶,4.1.1.1;以及醇脱氢酶1.1.1.1)。对于leudh和adh,使用先前开发的算法使序列多样性最大化。对于kivd,使用分层取样方法。候选酶的总数为1175种leudh序列、1296种kivd序列和1177种adh序列。
[0190]
合理的酶设计
[0191]
对于leudh和adh,使用rosetta软件建立酶-过渡态复合物的分子模型,并且设计活性位点残基对20种氨基酸中的每种的系统突变。
[0192]
库合成
[0193]
全部leudh酶、kivd酶和adh酶的dna序列都被密码子优化以用于在大肠埃希氏菌中表达。在t7启动子的控制下在诱导型大肠埃希氏菌表达运载体中合成编码序列。
[0194]
结果
[0195]
为了改进消耗亮氨酸的支链氨基酸(bcaa)途径,进行实验以鉴别原型菌株(1980,也称为syn1980)中相对于亲本酶具有更高活性的leudh酶、kivd酶和adh酶,其中亲本菌株包含蜡样芽孢杆菌leudh、乳酸乳球菌kivd和酿酒酵母adh2。原型菌株还包含来自大肠埃希氏菌的brnq,brnq是可以将支链氨基酸(如亮氨酸)转运到细胞中的支链氨基酸的转运体。亲本leudh酶展现出底物杂泛性,从而使缬氨酸和异亮氨酸(除亮氨酸以外)脱氨基化。为了改进通过bcaa途径对亮氨酸的特定消耗,途径设计的附加目标是鉴别相对于缬氨酸(val)和异亮氨酸(ile)对亮氨酸(leu)具有增加的特异性的leudh酶。
[0196]
两种互补的方法用于针对每个酶家族(leudh、kivd和adh)设计库:宏基因组来源和合理设计(表2)。对于每种酶,设计>1000种酶的宏基因组库,以对序列数据库中可用的完整宏基因组序列空间进行采样(图1a-图1c)。对于leudh库和adh库,可用的结构数据用于蜡样芽孢杆菌leudh酶和酿酒酵母adh酶的合理设计。全部库的酶序列针对在大肠埃希氏菌中的表达进行优化,并且在诱导型大肠埃希氏菌表达运载体中合成,并且转化到大肠埃希氏菌中以用于高通量筛选。
[0197]
表2.酶库组成
[0198]
[0199]
实施例2:途径酶库的表征
[0200]
材料和方法
[0201]
细胞生长和酶制备
[0202]
对于筛选的酶库中的每个,将具有库质粒的菌株转化到大肠埃希氏菌t7表达宿主细胞中。将5μl/孔的解冻甘油原料压入用aeraseal密封的半高深孔板中的500μl/孔的lb 100μg/ml羧苄青霉素(lb-carb100)中。在37℃孵育样品,并且在80%湿度下以1000rpm摇动过夜。将50μl/孔的所得到的预培养物压入用aeraseal密封的半高深孔板中的450μl/孔的lb-carb100 1mm iptg中。在30℃孵育样品,并且在80%湿度下以1000rpm摇动过夜。将250μl/孔的所得到的产生培养物压入含有500μl磷酸盐缓冲盐水(pbs)的深孔板中,并且以4000*g离心10分钟。去除上清液,并且将所得到的细胞沉淀物重悬于200μl的bugbuster蛋白提取试剂 1μl/ml纯化的核酸酶(benzonase) 1μl/6ml纯化的溶菌酶中。将样品在室温孵育10分钟,以生成在体外酶测定中使用的细胞裂解物。
[0203]
leudh活性测定
[0204]
将leudh库菌株的10μl裂解物转移到含有90μl/孔测定缓冲液(20mm氨基酸[l-亮氨酸、l-缬氨酸或l-异亮氨酸]、200mm甘氨酸、200mm kcl、0.4mm nad,ph 10.5)的半面积平底板中。在读板器上进行光学测量,其中在340nm处读取吸光度读数10分钟。所得到的动力学数据用于解析nad 还原的最大速率(leudh活性的代用指标)。
[0205]
kivd活性测定
[0206]
将kivd库菌株的10μl裂解物转移到含有90μl/孔测定缓冲液(100mm pipes-koh、100mm谷氨酸钾、1mm二硫苏糖醇、0.4mm nad、1.5mm硫胺素焦磷酸、10mm谷氨酸镁、20mm酮异己酸(kic),ph 7.5)的半面积平底板中。偶联酶用于间接地测量对kic的kivd活性。在10分钟内进行光学吸光度测量。所得到的动力学数据用于确定kivd活性。
[0207]
adh活性测定
[0208]
将adh库菌株的10μl裂解物转移到含有90μl/孔测定缓冲液(50mm mops缓冲液、0.4mm nadh和30mm异戊醛,ph 7.0)的半面积平底板中。在读板器上在340nm处进行光学吸光度测量达10分钟。所得到的动力学数据用于解析nadh氧化的最大速率(adh活性的代用指标)。
[0209]
leudh选择性测定
[0210]
为了测量leudh选择性(在存在l-ile和l-val的情况下l-leu的特异性脱氨基化),将裂解物在裂解缓冲液中稀释四倍,并且将10μl/孔新稀释的裂解液压入90μl/孔的来自上文的改良测定缓冲液(特征在于0.5mm每种氨基酸(l-亮氨酸、l-异亮氨酸、l-缬氨酸)、200mm甘氨酸、200mm氯化钾和4mm nad)中。在不同的时间点淬灭反应,并且进行亮氨酸、异亮氨酸和缬氨酸的lc-ms定量。
[0211]
结果
[0212]
为了筛选3
×
~1300个成员的酶库,开发高通量(htp)方法以筛选大肠埃希氏菌细胞裂解物中的leudh酶活性、kivd酶活性和adh酶活性。简言之,在96深孔板中培养菌株以诱导蛋白质产生,其中每个板中包含阳性对照菌株和阴性对照菌株。裂解细胞,并且使用本文描述的酶特异性分光光度测定测量细胞裂解物中的酶活性。在全自动机械工作单元上进行酶测定。对于每个酶家族,在生物学复制品中测量完整的库(各自~1300个成员),并且选择
每个酶家族中具有最高活性的50-200种酶作为该家族的主要“命中”。用附加的复制(4个生物学重复)在二级筛选中重新筛选主要命中以验证酶排序。
[0213]
亮氨酸脱氢酶(leudh)
[0214]
首先针对使leu脱氨基化的能力筛选共计1378种leudh酶。最初的一轮筛选鉴别活性类似于或优于来自枯草芽孢杆菌的亲本leudh酶的活性的220种酶(表4)。在二级筛选中进一步分析这些主要命中(图2)。在二级筛选中,验证具有对leu的leudh活性多达1.8倍增加的leudh酶。
[0215]
活性计算为:酶活性除以背景酶活性减1。对照设置为0,并且具有值>0的菌株被认为是潜在命中。值表示相较于对照的分数改进。作为非限制性实例,具有50%改进的菌株将在表4中以0.5的值表示。
[0216]
为了确定主要leudh命中中的任何一种是否展现出相较于ile和val针对leu的增加的特异性,还针对对val和ile的活性筛选全部220种主要命中。特异性测量为对leu的活性与对ile或val的活性的比率。如图3中所示,从初级筛选中命中的酶展现出相较于val对leu高达2.7倍的偏好、以及相较于ile对leu的高5倍的偏好。当在该测定中测量时,阳性对照蜡样芽孢杆菌leudh显示出对leu、val和ile的同等偏好。
[0217]
在该库中观察到leu特异性对leu活性的折衷,其中最具特异性的leudh酶不是最具活性的leudh酶。通过比较对leu/ile的特异性与对leu/val的特异性,鉴别了相对于leu和val两者对leu具有增加的特异性的命中(图4)。对照蜡样芽孢杆菌leudh展现出对leu、val和ile大约同等的偏好。
[0218]
酮异戊酸脱羧酶(kivd)
[0219]
针对对酮异己酸的脱羧酶活性筛选总计1248种kivd酶。最初的一轮筛选鉴别了活性高于来自金黄色葡萄球菌的亲本kivd酶的活性的55种酶(表5),来自金黄色葡萄球菌的亲本kivd酶在该测定中未展现出大于背景裂解物脱羧酶活性的活性,并且等同于非零可测量的背景活性。在二级筛选中进一步分析这些主要kivd命中(图5)(表5)。在二级筛选中,鉴别了在该测定中相对于背景裂解物活性具有kivd活性的至少6倍至8倍增加的>40种kivd酶。kivd活性计算为:酶活性除以背景酶活性减1。
[0220]
醇脱氢酶(adh)
[0221]
针对将异戊醛还原为异戊醇的能力筛选共计1215种adh酶。最初的一轮筛选鉴别了活性高于来自酿酒酵母的亲本adh2酶的55种酶(表6),来自酿酒酵母的亲本adh2酶在该测定中未展现出大于背景裂解物醇脱氢酶活性的活性,并且等同于非零可测量的背景活性。由于adh2酶对酿酒酵母的活性与裂解物的背景活性无法区分,因此使用活性高于背景活性的马(equus caballus)adh作为筛选的阳性对照。在二级筛选中进一步分析这些主要命中(图6)(表6)。在二级筛选中,鉴别了相对于背景裂解物活性具有adh活性的至少20倍增加的5种adh酶。酿酒酵母的adh2酶用作二级筛选的对照。adh活性计算为:酶活性除以背景酶活性减1。
[0222]
实施例3:最高leudh候选酶的选择性
[0223]
材料和方法
[0224]
leudh选择性测定
[0225]
为了测量leudh选择性(在存在l-ile和l-val的情况下l-leu的特异性脱氨基化),
将裂解物在裂解缓冲液中稀释四倍,并且将10μl/孔新稀释的裂解液压入90μl/孔的来自上文的改良测定缓冲液(特征在于0.5mm每种氨基酸(l-亮氨酸、l-异亮氨酸、l-缬氨酸)、200mm甘氨酸、200mm氯化钾和4mm nad)中。在不同的时间点淬灭反应,并且进行亮氨酸、异亮氨酸和缬氨酸的lc-ms定量。
[0226]
结果
[0227]
leudh催化leu、val和ile的脱氨基化,并且因此全部底物都具有在底物池混合的体内环境中充当竞争者的可能性。为了更好地预测关于混合底物池的最高leudh命中的性能,测量leudh酶对leu的选择性(即,当leu、val和ile全部存在于反应混合物中时,leudh对leu的偏好)。在与htp筛选类似的细胞裂解物测定中筛选总计21种leudh酶,除了反应混合物含有摩尔比为1:1:1的leu、val和ile。在反应混合物中监测leu、val和ile消失的速率。图7示出每种leudh酶在反应混合物内leu、ile和val的消耗。当与亲本枯草芽孢杆菌leudh相比时,至少10种leudh酶显示出相较于val和ile对leu提高的偏好。对于几乎全部的leudh酶,显示出对缬氨酸的最小偏好。
[0228]
实施例4:途径酶命中选择和操纵子组装
[0229]
为了改进bcaa途径的整体leu消耗,针对每个步骤选择相对于亲本酶显示出更优性能的多种酶。对于leudh,基于两个标准选择6种命中:相对于val和ile,对leu的酶活性和对leu的特异性。由于leudh选择性分析与操纵子组装并行运行,因此选择性数据集不包括在leudh选择中。对于kivd和adh,基于体外酶活性对每个酶家族选择3种命中。总计12种酶进入最终操纵子设计(表3)。操纵子由依照下列顺序的酶的四种编码序列组成:leudh-kivd-adh-brnq。选择用于leu消耗的优选操纵子,并且如下所述进一步测试。
[0230]
表3.被选择用于推进操纵子设计的酶
[0231][0232]
实施例5:操纵子测试
[0233]
材料和方法
[0234]
细胞制备
[0235]
将支链氨基酸(bcaa)途径操纵子质粒转化到购自德国微生物和细胞培养物保藏中心(dsmz braunschweig,大肠埃希氏菌dsm 6601)的大肠埃希氏菌nissle菌株1917中。转化的细胞在冰上解冻,并且通过600nm处的光吸收(od
600
)测量细胞密度。在该方法中,假定1.0的od
600
等于109个细胞/ml。计算体积以便以1ml的2
×
109个细胞/ml细胞重悬液为目标,并且将细胞转移到96深孔板中,并且用冷pbs洗涤一次。在离心(4000rpm,4℃,10min)之后,弃去pbs,并且然后将细胞沉淀物重悬于1ml的1
×
m9 50mm mops 0.5%葡萄糖(mmg)缓冲液中。将八百(800)μl的每个样品转移到新的96深孔板中,并且添加800μl的含有16mm亮氨酸的mmg,通过移液充分混合。此时,收集指定为时间零的样品(200μl)。然后用透气膜覆盖板,并且移动至厌氧室中以在37℃孵育。在厌氧室中孵育期间,在2小时和4小时也收集样品。将样品在收集之后立即在4℃以4000rpm离心10分钟。将100μl的上清液转移到新的96孔板中,并且储存在-80℃以用于将来分析。
[0236]
亮氨酸活性测定
[0237]
使用ultimate 3000 uhplc-tsq quantum或vanquish uhplc-tsq altis系统通过液相色谱联用串联质谱(lc-ms/ms)在细菌上清液中对亮氨酸进行定量。用9份2:1乙腈:水
(含有1μg/ml亮氨酸-d3作为内标物)提取样品,涡旋,并且离心。用9份0.1%甲酸稀释上清液,并且同时用0.8μg/ml至1000μg/ml如上处理的标准物进行分析。在phenominex synergi 4um hydro-rp80a,75
×
2mm上使用0.1%甲酸(a)、0.1%甲酸/乙腈(b)以0.3ml/min和50摄氏度分离样品。在2μl注射和从0分钟至0.5分钟保持的初始5%b之后,在0.5分钟至1.5分钟内从5%至90%b梯度洗脱分析物,然后是高有机洗步骤和水平衡步骤。在电喷雾正离子模式下使用化合物特异性碰撞诱导的片段的选择反应监测(srm)来检测分析物(亮氨酸:132>86,异亮氨酸:亮氨酸-d3:135>89)。对srm色谱图进行积分,并且未知/内标峰面积比用于以标准曲线计算浓度。
[0238]
结果
[0239]
将通过htp筛选鉴别的消耗leu最高的操纵子转化到大肠埃希氏菌nissle 1917中(并且标记为菌株5941、菌株5942和菌株5943)中,并且与原型菌株1980进行比较。菌株5941含有cetobacterium ceti的leudh酶、erwinia iniecta的kivd酶和柴油食烷菌的adh酶。菌株5942具有cetobacterium ceti的leudh酶、erwinia iniecta的kivd酶和根瘤菌目细菌nrl2的adh酶。菌株5943具有cetobacterium ceti的leudh酶、erwinia iniecta的kivd酶和根瘤菌目细菌nrl2的adh酶。操纵子还含有大肠埃希氏菌的brnq。原型菌株含有蜡样芽孢杆菌leudh、乳酸乳球菌kivd、酿酒酵母adh2、以及大肠埃希氏菌brnq。
[0240]
针对leu消耗对来自消耗leu最高的操纵子和原型菌株的样品进行分析(图8)。发现含有消耗leu最高的操纵子的菌株(5941、5942和5943)与原型菌株(1980)相比以显著更快的速率消耗leu。
[0241]
实施例6:leudh酶的工程化和活性leudh酶的生物信息学分析
[0242]
如表4中所示,生成来自蜡样芽孢杆菌的uniprot p0a392(seq id no:27)的突变体,并且测试以确定突变体是否相对于uniprot p0a392(seq id no:27)显示出提高的活性或酶表达。使用实施例2中描述的leudh活性测定。观察到下列独特位置处的点突变提高活性或酶表达:42、43、44、67、71、76、78、113、115、116、136、293、296、297和300。
[0243]
观察到uniprot p0a392(seq id no:27)中的下列点突变提高活性或蛋白质表达:a115n、a115q、a115s、a115t、a115v、a297c、a297d、a297e、a297f、a297h、a297k、a297l、a297m、a297n、a297q、a297r、a297t、a297w、a297y、e116a、e116l、e116m、e116n、e116r、e116s、e116v、e116w、g43e、g43f、g43t、g43w、g43y、g44h、g44i、g44k、g44y、i113f、i113m、i113q、i113v、i113w、i113y、l300a、l300c、l300d、l300f、l300h、l300k、l300m、l300n、l300q、l300r、l300s、l300t、l300w、l300y、l42a、l42q、l42t、l76e、l76f、l76h、l76i、l76k、l76m、l76r、l76s、l76t、l76w、l76y、l78c、l78f、l78h、l78k、l78q、l78v、l78y、m67a、m67e、m67k、m67q、m67s、m67t、n71c、n71d、n71h、n71k、n71m、n71t、t136e、t136f、t136l、t136r、t136s、t136y、v293a、v293c、v293q、v293s、v293t、v296a、v296c、v296e、v296i、v296k、v296l、v296n、v296s和v296t。
[0244]
对seq id no:27的突变体和来自宏基因组库的命中的序列进行生物信息学分析。在下文表7中提供在命中中发现的独特残基的列表。示出seq id no:27中的相应位置。命中是相对于seq id no:27具有增加的活性(大于0)的leudh。对于多序列比对中的每个位置,将个体残基一致性归入命中和非命中,并且计算集合差。这些是经由系统点突变库或宏基因组序列对命中集而言独有的残基。
[0245]
实施例7:活性kivd酶的生物信息学分析
[0246]
对相对于seq id no:29显示出增加的活性的命中kivd酶进行生物信息学分析。表8中提供命中中发现的独特残基的列表。对于多序列比对中的每个位置,将个体残基一致性归入命中和非命中,并且计算集合差。这些是对命中集而言独有的残基。表8中指示seq id no:29中的相应位置。
[0247]
来自乳酸乳球菌的uniprot q684j7是在酪乳和奶酪的生产中广泛使用的微生物。虽然不是天然酶的命名反应,但kivd催化4-甲基-2-氧代戊酸酯的脱羧基化,以形成异戊醇。发现来自kivd酶库的命中具有超过其天然底物(其天然底物是α-酮异戊酸)的扩大的底物特异性。
[0248]
实施例8:活性adh酶的生物信息学分析
[0249]
对相对于seq id no:31显示出增加的活性的命中adh酶进行生物信息学分析。表9中提供命中中发现的独特残基的列表。对于多序列比对中的每个位置,将个体残基一致性归入命中和非命中,并且计算集合差。这些是对命中集而言独有的残基。表9中指示seq id no:31中的相应位置。
[0250]
实施例9:异戊醇途径的摩尔平衡闭合(molar balance closure)
[0251]
在15生物反应器中评估菌株5941中异戊醇途径的性能和摩尔平衡闭合。菌株5941包括seq id no:2的leudh酶、seq id no:18的kivd酶和seq id no:24的adh酶。用具有0.5%葡萄糖、10mm leu、10mm val和5mm ile的m9培养基将反应器填充至17ml。将条件控制为0%溶解氧和7.0的ph。接种激活的生物质以达到1的od600,并且随时间采集上清液样品以监测代谢物浓度。
[0252]
图10中示出途径中间产物的细胞外浓度分布。在180分钟的过程中,消耗4.1
±
0.3mm的亮氨酸,并且在培养基中积聚4.4
±
0.5mm的异戊醇。在上清液中未观察到酮酸(2-氧代异己酸)和醛(异戊醛)。因此,通过途径的通量被平衡,并且被考虑。途径中间产物的总摩尔数的守恒(与图10中的“加和”对应的数据)也证明了这一点。
[0253]
方法-发酵
[0254]
在来自sartorius的ambr15f微生物反应器系统中进行测定。容器填充有17ml补充有2.0mm mgso4、0.1mm cacl、5%葡萄糖、10mm l-亮氨酸、5mm l-异亮氨酸和10mm缬氨酸的1
×
m9培养基盐。在接种前18小时填充容器,以使ph光极和do光极两者水合。将反应器中的温度保持在37℃,使用2n naoh将ph值保持在7,并且使用0.14vvm n2流速将溶解氧保持在0。搅动设置为500rpm,以实现在整个实验中的良好混合。由synlogic提供的激活的生物质接种生物反应器以达到1的od600。在接种后0分钟、30分钟、90分钟、150分钟和180分钟对生物反应器取样。立即将样品在微量离心机中以15000
×
g离心30秒,并且去除上清液以用于分析。将上清液储存在-20℃直至准备好进行分析。
[0255]
方法-分析
[0256]
开发分析以用于两种方法。一种方法涉及用于亮氨酸(leu)、酮异己酸(leu酸)和异戊醛(leu醛)的定量的液相色谱质谱(lcms)。该方法也经验证,并且用于缬氨酸和异亮氨酸(及其各自的酸产物和醛产物)的定量。第二种方法涉及用于异戊醇(leu醇)的定量的气相色谱质谱(gcms)。总之,这些分析方法允许对菌株5941的全部途径中间产物的定量。gcms方法也经验证,并且用于缬氨酸醇产物和异亮氨酸醇产物的定量。
[0257]
在具有thermo q-exactive四极杆-orbitrap质谱检测器和thermo accucore pfp柱(2.1
×
100mm,2.6μm填料)的thermo ultimate 3000 uplc系统上使用下列洗脱溶剂进行lcms分析:a=0.1%甲酸和水中0.1%tfa;b=乙腈中0.1%甲酸。梯度为0.5ml/min的a中1%b达60秒,然后是在270秒内从a中1%b至a中40%b的线性直线上升。然后,用a中95%b冲洗柱达60秒,并且用a中1%b重新平衡达180秒。ms采集为从0.8分钟至5.3分钟。
[0258]
经由具有 3800v的正模式电离、400℃的汽化器温度、375℃的离子迁移管温度的标准thermo esi源将柱流出物引入质谱仪中。thermo以任意单位报告气体流速(在stp下可能接近l/min)。设定点为:鞘流气,60;辅助气,30;吹扫气,1。为了增加数据采集率,将静电场轨道阱分辨率设置为17500。四极杆分辨率为1m/z。
[0259]
该方法还衍生醛和酮酸两者,从而提高那些分析物的稳定性。探索多种衍生剂,并且发现甲醇中的2-(二甲基氨基)乙基肼在正模式下引起最佳灵敏度。甲醇中0.5m乙酸和0.5m乙酸钠的缓冲液用于leu酸和leu醛的定量,同时也测量未经衍生化的leu。
[0260]
使用j&w db-wax gc柱(15m)和作为提取溶剂的氯仿在具有gerstel自动进样器的agilent gcms/msd上进行gc-ms分析。将前部注射器设置在250℃和1ml/min的流速。烘箱温度在40℃保持1分钟,然后直线上升至130℃(15℃/min),并且然后直线上升至200℃(65℃/min)。ms采集扫描窗口在40-150mz,其中ms源和ms四极杆分别在250c和200c。
[0261]
为了便利高通量和自动化,gerstel自动进样器用于将提取的底部氯仿层注入在顶部具有充当覆盖物以防止产物蒸发的水性ambr15培养基的96孔板形式中。为了考虑任何其他潜在的醇产物蒸发,向氯仿中添加2-庚醇作为内部物。
[0262]
表3中的酶的序列
[0263]
leudh(标识符:t160946;登录号:a0a1t4pgg9)
[0264][0265]
leudh(标识符:t160389;登录号:a0a1m6be59)
[0266][0267]
leudh(标识符:t160283;登录号:a0a1s9b636)
[0268][0269]
leudh(标识符:t160434;登录号:a0a1d2rxb2)
[0270][0271]
leudh(标识符:t160048)
[0272][0273]
leudh(标识符:t160141;登录号:a0a0j1fee3)
[0274][0275]
kivd(标识符:t163988;登录号:a0a0l0p8d8)
[0276][0277]
kivd(标识符:t164076;登录号:a0a0m5jjz2)
[0278][0279][0280]
kivd(标识符:t163842;登录号:a0a0l7tb96)
[0281]
[0282]
adh(标识符:t159319;登录号:a0a1e4tma4)
[0283][0284][0285]
adh(标识符:t159028;登录号:a0a192ids9)
[0286][0287]
adh(标识符:t158538;登录号:a0a0p1j1w4)
[0288]
[0289]
gfp(阴性对照)
[0290][0291]
酶筛选数据
[0292]
表4.leudh酶和相对于对照的活性
[0293]
[0294]
[0295]
[0296]
[0297]
[0298]
[0299][0300]
表5.kivd酶和相对于对照的活性
[0301]
[0302][0303]
表6.adh酶和相对于对照的活性
[0304]
[0305]
[0306][0307]
表7.相对于seq id no:27具有增加的leudh活性的酶中的保守氨基酸
[0308]
[0309][0310]
表8.相对于seq id no:29具有增加的kivd活性的酶中的保守氨基酸
[0311]
seq id no:29中的位置中的对应位置氨基酸33y44q117m129i185w190i225i227y311l312g313t328p341w345h347c420r494d508c550f
[0312]
表9.相对于seq id no:31具有增加的adh活性的酶中的保守氨基酸
[0313]
seq id no:31中的对应位置氨基酸
9p16g23q28r30a93k98l99r114p115k119y194y242p249k255e260d269h281q325l333m334p348q
[0314]
等同物
[0315]
本领域技术人员仅使用常规实验就将认识到或能够确知本公开中描述的本发明的具体实施方案的许多等同物。这样的等同物旨在由以下权利要求书涵盖。
[0316]
本技术中公开的全部参考文献(包含专利文件)通过引用被整体(特别是本公开中引用的公开内容)并入本文。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献