一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于高产重组微生物的系统和方法及其用途与流程

2022-11-19 18:45:57 来源:中国专利 TAG:

用于高产重组微生物的系统和方法及其用途
相关申请的交叉引用
1.本技术要求2020年2月4日提交的美国临时专利申请序列号62/970,052的优先权。前述专利申请的全部内容通过引用并入本文。序列表
2.本技术包含序列表,该序列表已通过efs-web以ascii形式提交,并在此通过引用以其整体并入。所述ascii副本创建于2021年2月3日,命名为49160-719.601_st25.txt,并且大小为100,835字节。


背景技术:

3.在工业蛋白质生产中,降低成本的目标是使蛋白质产物在重组生物中的表达最大化。甲基营养酵母诸如毕赤酵母属(pichia sp.)是蛋白质的重要产生系统。尽管它们被广泛使用,但高产量的表达,特别是异源动物来源蛋白质的表达仍是挑战。该障碍在更大规模的发酵环境中尤为明显。虽然增加整合拷贝数可以导致蛋白质表达增加,但随着拷贝数的增加,产生的转录物数量似乎受到限制(aw和polizzi;microb cell fact.2013;12:128)。
4.对于无动物蛋白质的需求(特别是在基于食品的成分中)不断增长。例如,近年来人们对注重健康的快餐食物的偏好趋势明显,蛋白质需求创下历史新高。除了越来越注重健康的消费者群体之外,对工业孵化场不人道方面的厌恶可能促使人们接受并最终偏爱无动物蛋白质替代品,而不是工厂化养殖的蛋类。因此,需要用于高产地工业化产生食物蛋白质(例如,备选的无动物蛋类蛋白质)的新方法。


技术实现要素:

5.本发明解决了这种需要。该系统和方法在大规模生产中提供重组蛋白质的高滴度表达,并且特别适用于在微生物宿主中表达异源动物来源的蛋白质,诸如基于食物的蛋白质。
6.因此,本公开内容提供了用于表达异源蛋白质的工程化宿主细胞,所述工程化宿主细胞可以包含至少三个不同的表达盒(expression cassette),该至少三个不同表达盒被整合至该工程化宿主细胞的基因组中,其中;第一表达盒可以包含与编码异源蛋白质的异源基因序列可操作地连接的第一启动子;第二表达盒可以包含与编码异源蛋白质的异源基因序列可操作地连接的第二启动子;第三表达盒可以包含与辅助因子序列可操作地连接的第三启动子。在一些实施方案中,辅助因子编码序列与异源蛋白质编码序列的拷贝数比可以为至少1:10。
7.在一些方面,本文提供了用于表达异源蛋白质的工程化宿主细胞,其中所述工程化宿主细胞可以包含至少三个不同表达盒,该至少三个不同表达盒被整合至该工程化宿主细胞的基因组中。在一些情况下,第一表达盒可以包含与编码异源蛋白质的异源基因序列可操作地连接的第一启动子;第二表达盒可以包含与编码异源蛋白质的异源基因序列可操作地连接的第二启动子;第三表达盒可以包含与辅助因子序列可操作地连接的第三启动
子;并且辅助因子编码序列与异源蛋白质编码序列的拷贝数比可以为至多1:2。
8.在一些方面,本文提供了在宿主细胞中产生重组异源蛋白质的方法。该方法可以包括:将多个质粒转化至宿主细胞中;其中该多个质粒可以包含至少三个质粒,该至少三个质粒中的每一个可以包含不同表达盒;其中不同表达盒中的每一个可以包含与异源基因序列可操作地连接的不同启动子。该方法包括将至少三个不同表达盒中的每一个的至少一个拷贝整合至宿主细胞中。在一些情况下,至少三个表达盒中的至少一个可以包含与辅助因子基因序列可操作地连接的启动子。在一些情况下,辅助因子基因与异源基因的拷贝数比可以为至少1:10。
9.在一些方面,本文提供了在宿主细胞中产生重组异源蛋白质的方法。在一些实施方案中,该方法可以包括:将多个质粒转化至宿主细胞中;其中该多个质粒可以包含至少三个质粒,该至少三个质粒中的每一个可以包含不同表达盒;其中不同表达盒中的每一个可以包含与异源基因序列可操作地连接的不同启动子;将至少三个不同表达盒中的每一个的至少一个拷贝整合至宿主细胞中;其中至少三个表达盒中的至少一个可以包含与辅助因子基因序列可操作地连接的启动子。在一些情况下,辅助因子基因与异源基因的拷贝数比可以为至多1:2。
10.在一些实施方案中,该方法可以进一步包括鉴定整合的表达盒。在一些实施方案中,鉴定可以包括对宿主细胞基因组进行测序。在一些实施方案中,鉴定可以包括确定是否存在与异源基因序列可操作地连接的启动子。在一些实施方案中,该方法进一步可以包括转化可以包含一个或多个表达盒的至少一个质粒,其中表达盒中的每一个包含与异源基因序列可操作地连接的启动子,其中该启动子被鉴定为存在于宿主细胞基因组中。在一些实施方案中,该方法可以进一步包括转化可以包含一个或多个表达盒的至少一个质粒,其中表达盒中的每一个包含与异源基因序列可操作地连接的启动子,其中该启动子被鉴定为不存在于宿主细胞基因组中。
11.在一些实施方案中,辅助因子编码序列与异源蛋白质编码序列的拷贝数比可以为至少1:10、1:9、1:8、1:7、1:6、1:5、1:4或1:3。在一些实施方案中,辅助因子编码序列与异源蛋白质编码序列的拷贝数比可以为至多1:9、1:8、1:7、1:6、1:5、1:4、1:3或1:2。
12.在一些实施方案中,至少一个启动子可以是诱导型启动子。在一些实施方案中,所有启动子均是诱导型启动子。在一些实施方案中,诱导型启动子可以是甲醇诱导型启动子。在一些实施方案中,每个甲醇诱导型启动子可以独立地选自aox1、aox2、dak2、das2、fdh1、fgh1、fld1和pex11或其甲醇诱导型片段。
13.在一些实施方案中,至少一个启动子可以是组成型启动子。在一些实施方案中,组成型启动子可以独立地选自gap和gcw14。
14.在一些实施方案中,宿主细胞可以包含第一表达盒的至少2个拷贝。在一些实施方案中,宿主细胞可以包含第二表达盒的至少2个拷贝。在一些实施方案中,宿主细胞可以包含第四表达盒的至少1个拷贝,该第四表达盒可以包含与异源基因序列可操作地连接的第四启动子。在一些实施方案中,第一盒和第二盒以相同的5’至3’方向被整合至基因组中。在一些实施方案中,第一盒和第二盒以相对的5’至3’方向被整合至基因组中。
15.在一些实施方案中,宿主细胞可以在1或2个表达盒中包含辅助因子编码序列的至少2个拷贝。在一些实施方案中,宿主细胞可以在1、2、3、4或5个表达盒中包含辅助因子编码
序列的至少3、4或5个拷贝。在一些实施方案中,宿主细胞可以在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个表达盒中包含异源编码序列的至少3、4、5、6、7、8、9、10、11、12、13、14、15或16个拷贝。
16.在一些实施方案中,异源蛋白质可以是食物相关蛋白质。在一些实施方案中,食物相关蛋白质可以包括酶、营养蛋白质、食物成分或食物添加剂。在一些实施方案中,食物相关蛋白质可以是胃蛋白酶原蛋白质。在一些实施方案中,辅助因子编码序列与胃蛋白酶原编码序列的拷贝数比可以为1:2至1:5。
17.在一些实施方案中,食物相关蛋白质可以包括卵白蛋白质。在一些实施方案中,卵白蛋白质可以是卵类黏蛋白。在一些实施方案中,辅助因子编码序列与卵类黏蛋白编码序列的拷贝数比可以为1:3至1:6。在一些实施方案中,卵白蛋白质可以是卵清蛋白。在一些实施方案中,辅助因子编码序列与卵清蛋白编码序列的拷贝数比可以为1:3至1:8。
18.在一些实施方案中,在发酵条件下,工程化宿主细胞可以能够产生每升至少约5g的异源蛋白质。在一些实施方案中,在发酵条件下,工程化宿主细胞可以能够产生每升至少约10g的异源蛋白质。在一些实施方案中,在发酵条件下,工程化宿主细胞可以能够产生每升至少约20g的异源蛋白质。
19.在一些实施方案中,表达盒中的至少一个可以包含分泌信号。在一些实施方案中,表达盒中的至少一个可以包含终止序列。在一些实施方案中,辅助因子基因序列中的每一个编码独立地选自以下的蛋白质:hac1、丝氨酸/苏氨酸蛋白激酶2(kin2)、鲨烯合成酶(erg9)、蛋白质二硫键异构酶1(pdi1)、ssa1、ssa4、ssb1、sse1、bip、er膜蛋白复合物亚基1(emc1)、ynl181w氧化还原酶、整合膜蛋白锌金属蛋白酶ste24、14-3-3蛋白bmh2和内质网氧化还原蛋白1(ero1)。
20.在一些实施方案中,宿主细胞可以经工程化以有利于非同源整合而不是同源整合。在一些情况下,基于比同源整合更多的非同源整合对宿主细胞进行选择。在一些实施方案中,表达盒中的至少两个可以包含在不同整合位点处整合的异源基因序列。在一些实施方案中,宿主细胞可以是酵母细胞。在一些实施方案中,酵母细胞可以是毕赤酵母(pichia pastoris)。在一些实施方案中,可以通过对宿主细胞基因组进行测序来测量拷贝数。
21.在一些方面,本文提供了在宿主细胞中产生重组异源蛋白质的方法,其中该方法可以包括:将第一媒介物转化至宿主细胞中;其中所述第一媒介物可以包含一个或多个第一表达盒;其中该第一表达盒中的每一个可以至少包含与编码异源蛋白质的异源基因序列可操作地连接的第一启动子;将一个或多个第一表达盒随机整合至宿主细胞中。在一些实施方案中,该方法包括鉴定一个或多个第一表达盒在宿主细胞中的整合;将第二媒介物转化至宿主细胞中;其中所述第二媒介物可以包含一个或多个第二表达盒;其中该第二表达盒中的每一个可以至少包含与异源基因序列可操作地连接的第二启动子;其中第二启动子可以与第一启动子不同。在一些实施方案中,该方法包括将一个或多个第二表达盒随机整合至宿主细胞中,并且其中宿主细胞可以是酵母或丝状真菌,并且其中在发酵条件下,工程化细胞可以能够产生每升至少5g的异源蛋白质。
22.在一些实施方案中,该方法可以包括转化除了第二媒介物之外的多个媒介物,其中该多个媒介物中的每一个包含一个或多个表达盒,该一个或多个表达盒各自可以包含驱动编码异源蛋白质的异源基因序列进行表达的一个或多个启动子。在一些实施方案中,一
个或多个启动子包含第一启动子、第二启动子或其组合。在一些实施方案中,一个或多个启动子包含第一启动子、第二启动子、除了第一启动子或第二启动子之外的启动子或其组合。
23.在一些实施方案中,鉴定一个或多个第一表达盒的整合包括对获自宿主细胞的核酸进行测序。在一些实施方案中,鉴定一个或多个第一表达盒的整合可以包括鉴定是否存在抗性标志物;其中第一表达盒或第一质粒可以包含编码抗性标志物的序列。
24.在一些实施方案中,在发酵期间,异源蛋白质可以被分泌到培养基中,并且其中可以从发酵培养基中收获异源重组蛋白质。在一些实施方案中,第一表达盒和第二表达盒是线性分子,并且其中第一表达盒和第二表达盒在5’端有少于700bp与天然宿主细胞的基因组基因座同源。
25.在一些实施方案中,宿主细胞可以经工程化以有利于非同源整合而不是同源整合。在一些情况下,可以基于比同源整合更多的非同源整合对宿主细胞进行选择。在一些实施方案中,该方法进一步可以包括将辅助媒介物转化至宿主细胞中;其中所述辅助媒介物可以包含一个或多个辅助表达盒;其中辅助表达盒中的每一个可以包含与编码辅助因子蛋白质的基因序列可操作地连接的至少一个启动子。在一些实施方案中,一个或多个辅助表达盒中的启动子可以与第一启动子或第二启动子相同。在一些实施方案中,一个或多个辅助表达盒中的启动子可以与第一启动子或第二启动子不同。在一些实施方案中,该媒介物可以是质粒。在一些实施方案中,该媒介物可以是线性化质粒。
26.在一些方面,本文描述了用于通过发酵产生重组食物相关蛋白质的工程化细胞,其包含:至少一个第一盒,其包含与编码第一异源蛋白质的第一基因可操作地连接的第一启动子;和至少一个第二盒,其包含与编码第一异源蛋白质的第二基因可操作地连接的第二启动子;其中第一盒和第二盒在宿主细胞基因座的相同基因组基因座处或其附近被整合以产生工程化细胞;其中该基因组基因座不与第一启动子、第二启动子、第一基因或第二基因中的任何一个具有显著的序列同源性,并且其中宿主细胞是酵母或丝状真菌,并且其中在发酵条件下,工程化细胞能够产生每升至少5g的异源蛋白质。在一些实施方案中,第一启动子和第二启动子彼此不同。
27.在实施方案中,宿主细胞是甲基营养生物。在实施方案中,宿主细胞是法夫驹形氏酵母(komagataella phaffii)或巴斯德驹形氏酵母(komagataella pastoris)。在实施方案中,工程化细胞可以包含第一表达盒的2-5个拷贝。在其他实施方案中,工程化细胞可以包含第二表达盒的2-5个拷贝。在实施方案中,第一异源蛋白质包含动物来源的蛋白质序列。在一些实施方案中,动物来源的蛋白质序列编码卵白蛋白质。在实施方案中,卵白蛋白质选自卵黏蛋白(ovd)、卵清蛋白(ova)、卵转铁蛋白和溶菌酶。在一个方面,第一异源蛋白质包含胃蛋白酶原。在实施方案中,第一盒和第二盒以相同的5’至3’方向被整合至工程化细胞的基因组中。在实施方案中,第一盒和第二盒以相对的5’至3’方向被整合至工程化细胞的基因组中。
28.在实施方案中,工程化细胞可以进一步包含整合至基因组中的至少一个第三盒。在实施方案中,第三盒包含与第三基因可操作地连接的第三启动子。在实施方案中,第三基因编码辅助因子。在实施方案中,第三基因编码第一异源蛋白质。在实施方案中,第三基因编码第二异源蛋白质。在实施方案中,第三盒在与第一盒和第二盒不同的整合位点处整合至工程化细胞的基因组中。在另一个方面,第三盒在与第一盒和第二盒相同的基因组基因
座处整合。
29.在实施方案中,第一启动子是诱导型启动子。在实施方案中,第二启动子是诱导型启动子。在实施方案中,第一启动子是组成型启动子。在实施方案中,第二启动子是组成型启动子。在实施方案中,诱导型启动子是甲醇诱导型。在实施方案中,甲醇诱导型启动子选自aox1、aox2、fdh、fld1、pex11、das及其甲醇诱导型片段。在实施方案中,组成型启动子选自gap、gcw14。在实施方案中,第一分泌信号与由第一基因编码的蛋白质可操作地连接。在实施方案中,第二分泌信号与由第二基因编码的蛋白质可操作地连接。
30.在实施方案中,本文提供了发酵高滴度异源重组蛋白质的方法,该方法包括在发酵培养物中提供工程化细胞;在发酵的2至12天内,使发酵培养物生长至50克细胞干重的最小密度以得到为每升至少2至10克蛋白质的蛋白质浓度;以及收获异源重组蛋白质,其中异源重组蛋白质由工程化细胞的第一基因和第二基因编码。在实施方案中,重组蛋白质的滴度在2-12天内达到每升每50g细胞干重至少4g蛋白质。在实施方案中,异源重组蛋白质在发酵期间被分泌到培养基中,并且从发酵培养基中收获异源重组蛋白质。
31.在实施方案中,异源重组蛋白质包含动物来源的蛋白质。在实施方案中,动物来源的蛋白质是食物相关蛋白质,诸如食物成分、食物组分或可用于食物加工和生产的酶。在实施方案中,动物来源的蛋白质包括卵白蛋白质,并且产生的卵白蛋白质表现出天然全卵或卵白的一种或多种功能特征。在实施方案中,产生的卵白蛋白质的至少一种功能特征等同于或优于天然全卵或卵白的功能特征。在实施方案中,一种或多种功能特征选自溶解度、透明度、质地、起泡、打发、渗出、胶凝、澄清、凝固、涂覆、结晶控制、干燥、食用包装膜、精加工、风味、强化、耐冻性、光泽、保湿、隔热、润湿、口感、ph稳定性、蛋白质富集、丰富度、保质期延长、结构、嫩化、质地、增稠、水结合、油结合、褐变、乳化、氮:碳比和/或抗微生物活性。
32.在一些实施方案中,使用本文的盒和方法表达的动物来源的蛋白质包括酶。在实施方案中,酶用于食物相关工艺,例如酶是胰蛋白酶、胰凝乳蛋白酶、溶菌酶、胃蛋白酶或其前体或前原体。
33.在实施方案中,本文提供了产生工程化细胞的方法,该方法包括:用包含第一盒和第二盒的核酸组合物转化宿主细胞,其中第一盒和第二盒在核酸组合物中未共价连接。在实施方案中,第一盒和第二盒是线性分子,其中第一盒和第二盒在5’端有少于700bp与天然宿主细胞的基因组基因座同源。在实施方案中,宿主细胞经工程化以有利于非同源整合而不是同源整合。
附图说明
34.本发明的新颖特征在所附权利要求中具体阐述。通过参考以下对其中利用本发明原理的说明性实施方案加以阐述的详细描述和附图,将获得对本发明的特征和优点的更好理解,在附图中:
35.图1显示了通过同源与异位整合产生的工程化ovd转化体。使用两个质粒(一个含有ovd的3个拷贝,一个含有ovd的6个拷贝,并且该质粒被设计用于将这些拷贝靶向特定基因座),用ovd的更多拷贝转化已经表达ovd的两个菌株。图1比较了通过同源表达与异位表达产生的工程化ovd菌株中的相对蛋白质表达。重复筛选来自菌株cf14和cf15的经pcr检查的转化体的5至6个单菌落。图1a和图1b显示了来自该实验的cf14和cf15重复筛选的总结。
具体实施方式
36.本文提供了用于使用调节控制而在工程化甲基营养酵母细胞(诸如毕赤酵母属,在本文中也称为且替代称为驹形氏酵母属(komagataella sp.))中高产动物来源蛋白质(诸如动物来源的食物相关蛋白质)的生物系统和方法。本文所述的生物系统和方法采用异源基因序列的非同源整合,并且在一些情况下,使用这些整合位点来堆叠用于异源基因表达的表达盒。在一些实施方案中,整合的异源序列编码基于食物的蛋白质或食物相关蛋白质,诸如用作食物成分或在生产制造食品过程中使用的蛋白质。本文的系统和方法提供了高水平的基因表达,导致在发酵条件,特别是更大规模发酵条件下的高滴度蛋白质表达(大于5g/l)。
37.以下公开内容描述了通过组合以下项来驱动异源蛋白质在宿主细胞中高表达的系统和方法:(i)由一组不同的启动子驱动的多个表达盒稳定整合,每个整合位点携带一个或多个表达盒的多个拷贝;(ii)使用非同源重组方法,将多个表达盒共转化至宿主细胞(优选为毕赤酵母宿主细胞)的基因组中的单一位点中或单一位点附近;以及任选地,(iii)在宿主细胞基因组中整合表达盒后去除抗生素或其他选择标志物。表达盒与不同启动子的整合可以克服多拷贝整合的潜在问题,诸如盒的表达所需的同源转录因子的可能耗竭以及通过重组事件或其他宿主机制而缺失拷贝的可能性。
38.本文提供的系统和方法旨在促进宿主基因组中非同源位点的整合。与有利于同源重组的一些酵母不同,毕赤酵母属有利于异源序列的非同源整合。尽管具有这种有利的机制,但是毕赤酵母属的大多数表达系统却利用异源基因的同源整合。出乎意料地,在较小规模(诸如试管或摇瓶环境)中比较具有不同整合事件的工程化细胞显示出几乎等同的蛋白质产生水平,但是当在较大规模的发酵生产形式中进行比较时,在具有相应转基因的非同源整合事件的毕赤酵母细胞中发现了更高水平的期望异源蛋白质表达。
39.在一些实施方案中,在整合后,本文所述的工程化细胞不包含编码选择性标志物(例如营养缺陷型标志物或抗生素抗性基因)的序列,从而减少整合至宿主基因组中的外来异源dna的量。另外,由于许多营养缺陷型标志物与宿主细胞中的内源基因高度同源,因此使用这样的标志物可能有利于经转化dna的同源重组。
40.由于在大规模环境中的提高的高滴度表达能力以及在不使用抗生素或其他选择标志物的情况下的“更清洁”的生产系统,本文的系统和方法对于产生营养蛋白质(例如,用于食物成分和产品的植物或动物蛋白质、应用于食物和健康方面的蛋白质以及用于食物生产的动物来源的蛋白质)特别有用。i.重组食物蛋白质的高滴度产生
41.本文的方法提供了从工程化宿主细胞以大体积生长形式(诸如在发酵罐中)以提高的高滴度产生重组蛋白质。
42.在一些实施方案中,本文的方法包括以大于约1、2、3、5、10、20、50、100、500、1000升的培养体积且在一段时间内(诸如1、2、3、4、5、6、7、8、9、10天或多于10天)在大规模生长环境中从工程化宿主细胞产生异源蛋白质。本文的系统和方法以大规模生长形式(例如,发酵罐)在发酵条件下提供至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、32、34、36、38、40、42、44、46、48或50g蛋白质/升培养基的期望蛋白质的滴度。可以在一段时间内(诸如6小时、12小时、18小时、24小时、48小时或72小时)
达到期望的异源蛋白质滴度。在一些情况下,可以在一段时间内(例如1、2、3、4、5、6、7、8、9、10天或多于10天)在发酵条件下达到期望的异源蛋白质滴度。在一些实施方案中,这样的滴度是从发酵培养物中分泌的期望蛋白质的量。在一些实施方案中,这样的滴度是发酵培养物中存在的总期望蛋白质(细胞内和细胞外)的量。在一些实施方案中,这样的滴度是来自发酵培养物的分泌蛋白质的量。
43.在一些实施方案中,本文的方法包括从工程化宿主细胞的异源重组蛋白质产生,其达到高达10克细胞每升培养基、30g/l、40g/l、50g/l、70g/l、100g/l或150g/l的培养密度。在一些实施方案中,本文的方法包括从工程化宿主细胞的异源重组蛋白质产生,其达到高达100g细胞干重/l、150g细胞干重/l或200g细胞干重/l的细胞密度。发酵条件
44.本文的方法提供了发酵条件,该发酵条件提供了从工程化宿主细胞以大体积生长形式(诸如在发酵罐中)以提高的高滴度产生异源蛋白质。将酵母菌株甘油储备液解冻并以0.2%的接种比接种在含有bmdy培养基(bmdy培养基与bmgy培养基相似,其中甘油“g”已被葡萄糖/右旋糖“d”替代,毕赤酵母简易选择手册(pichia easy select manual),thermo fisher)的具挡板摇瓶中。将摇瓶在30℃和250rpm下温育26小时。然后将摇瓶培养物以10%的比率转移到含有bsm(基础盐培养基)、葡萄糖和痕量金属(毕赤酵母发酵工艺指南(pichia fermentation process guidelines),thermo fisher)的生物反应器中。
45.生物反应器发酵分为三个阶段。在第1阶段期间,可以令培养物生长24小时直至所有葡萄糖均被消耗。在第2阶段期间,可以以葡萄糖限制速率向培养物补料葡萄糖12小时。在第3阶段期间,可以通过连续补料葡萄糖和诱导型启动子的激活剂(例如,用于aox1启动子或pex11启动子的甲醇)的共同补料96小时来诱导培养物。
46.在一个实施方案中,本发明提供了提高在发酵培养条件下从宿主细胞产生感兴趣重组蛋白质的体积产率的方法。在实施方案中,本发明提供了优化用于甲醇诱导型发酵系统(例如,在aox1启动子的控制下)的细胞培养基,以用于使用补料分批发酵工艺在酵母宿主细胞中产生感兴趣重组蛋白质。在实施方案中,本发明提供了优化用于甲醇诱导型发酵系统(例如,在aox1启动子的控制下)的细胞培养基,以用于使用连续发酵工艺在酵母宿主细胞中产生目的重组蛋白质。在一些情况下,宿主细胞是毕赤酵母细胞。
47.在实施方案中,该方法包括a)提供甘油补料酵母宿主细胞培养物,其包含如本文别处所述经工程化的毕赤酵母细胞,b)提供甲醇补料培养基,并且任选地提供渗透保护剂,以及c)在发酵条件下诱导酵母宿主细胞以使得重组蛋白质表达,其中感兴趣蛋白质的体积产率高于至少5g/l。如本文所用,术语“体积产率”意指每单位培养物体积的目标重组蛋白质的量(g/l)。在一些实施方案中,发酵条件的优化可用于将如本文所述经工程化的毕赤酵母菌株的体积产率提高20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或大于100%。
48.在一些情况下,将如本文所述经工程化的宿主细胞的种子培养物接种到由合适培养基组成的起子培养物中。在一些情况下,培养基是bmgy培养基。在一些情况下,培养基是bmdy培养基。在一些情况下,起子培养基的体积为至多200ml、至多300ml或至多500ml。在一些情况下,起子培养物在24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃或32℃的温度下温育。在一些情况下,将起子培养物温育至多6小时、12小时、至多24小时、至多36小时或至多
48小时。在一些情况下,在温育期间以100rpm、200rpm、300rpm、500rpm或600rpm的速度振荡起子培养物。在一些情况下,为培养宿主细胞提供发酵条件的生物反应器系统接种种子与初始发酵培养基的体积比至多3%、至多5%、至多10%、至多15%或至多20%。在一些情况下,初始发酵培养基是bmgy培养基。在一些情况下,初始发酵培养基是bsm培养基(基础盐培养基)。在一些情况下,初始发酵培养基含有葡萄糖和痕量金属。
49.在实施方案中,基于aox1启动子的甲醇诱导型发酵系统可以使用甘油作为生物质生长的底物,然后使用甲醇补料来诱导异源蛋白质表达。在实施方案中,在发酵条件下培养毕赤酵母细胞涉及多阶段发酵工艺。在实施方案中,多阶段工艺是分批补料工艺。在实施方案中,初始阶段可以包括葡萄糖补料阶段,其中细胞在含葡萄糖培养基中培养以累积生物质。在一些情况下,初始阶段可以包括甘油补料阶段,其中细胞在含甘油培养基中培养以累积生物质。
50.在实施方案中,在下一阶段,可以以限速速率向细胞补料葡萄糖以准备诱导阶段。在实施方案中,葡萄糖的限速补料速率的范围可以为每小时至多0.005g/l、至多0.05g/l或至多0.5g/l的特定生长速率。在一些情况下,可以补料葡萄糖至多8小时、至多10小时、至多14小时、至多16小时、至多20小时、或至多24小时、至多30小时、至多36小时、至多40小时或至多48小时。在一些情况下,宿主细胞可以不在甲醇诱导之前补料甘油。
51.在一些情况下,甲醇诱导阶段之前可以是饥饿阶段。在一些情况下,诱导前的饥饿阶段可以持续30分钟、至多60分钟、至多90分钟、至多120分钟、至多150分钟、至多180分钟、至多4小时、至多6小时、至多8小时、至多9小时、至多10小时、至多15小时、至多18小时、至多20小时。
52.在一些情况下,可以优化甲醇补料速率以提高宿主细胞中重组蛋白质的产生。在一些情况下,甲醇补料方案(例如,保持固定的甲醇浓度(damasceno等人,2004),通过甲醇补料速率控制溶解氧浓度(charoenrat等人,2005),碳限制补料策略(zhang等人,2000)以及混合碳源补料(ramon等人,2007))可用于提高从工程化宿主细胞产生异源蛋白质的速率。在一些情况下,甲醇可以以恒定速率连续补料。在一些情况下,甲醇补料速率可以为至多0.5g/l/h,至多0.7g/l/h、0.8g/l/h、0.9g/l/h、1.1g/l/h、1.3g/l/h、1.5g/l/h、1.6g/l/h、1.8g/l/h、1.9g/l/h、2.1g/l/h、2.4g/l/h、2.6g/l/h、2.7g/l/h、2.9g/l/h、3.1g/l/h、3.3g/l/h、3.5g/l/h、3.7g/l/h、3.9g/l/h、4.5g/l/h或5.0g/l/h。在一些情况下,甲醇可以以指数速率补料。在一些情况下,甲醇可以作为定期推注添加。在一些情况下,对宿主细胞进行葡萄糖与甲醇共同补料。在一些情况下,葡萄糖补料速率可以为至多0.5g/l/h、至多0.7g/l/h、0.8g/l/h、0.9g/l/h、1.1g/l/h、1.3g/l/h、1.5g/l/h、1.6g/l/h、1.8g/l/h、1.9g/l/h、2.1g/l/h、2.4g/l/h、2.6g/l/h、2.7g/l/h、2.9g/l/h、3.1g/l/h、3.3g/l/h、3.5g/l/h、3.7g/l/h、3.9g/l/h、4.5g/l/h或5.0g/l/h。
53.在一些情况下,甲醇诱导阶段的长度可以为至多1天、至多2天、至多3天、至多4天、至多5天、至多6天、至多7天、至多8天、至多9天或至多10天。在一些情况下,甲醇诱导阶段的长度可以为至少1天、至少2天、至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天或至少10天。
54.可以设计合适的培养基以提供纯碳源。在一些情况下,培养基可以任选地提供生物素、盐、痕量元素和水。在一些情况下,宿主细胞的碳源可以选自葡萄糖、岩藻糖、甘露糖、
山梨糖或甘油、山梨糖醇。在一些情况下,培养基可以是bsgy、bmgy、bmmy、md或ypd培养基。在一些情况下,培养基组成可以通过影响细胞生长和生存力或改变细胞外蛋白酶的分泌来影响宿主细胞中的异源蛋白质表达。在一些情况下,可以将山梨糖醇或甜菜碱添加到培养基中以增加异源重组蛋白质的产生。在实施方案中,向分批补料培养系统中添加有机氮源(例如,酵母提取物和蛋白质胨的混合物)可用于增加宿主酵母细胞中的异源蛋白质产生。
55.宿主细胞的细胞壁完整性可以影响异源蛋白质的产量。在实施方案中,可以设计利用优化的培养基和发酵条件的改进培养条件以改进工程化毕赤酵母菌株的细胞壁完整性。例如,在实施方案中,发酵培养基可以包含补充有不可发酵糖或不可发酵糖醇作为渗透保护剂的基础培养基。在特定实施方案中,渗透保护剂可以选自麦芽糖、山梨糖、核糖、麦芽糖醇、肌醇、蜜二糖和奎尼酸。在一些情况下,甘油、阿糖醇、甘氨酸甜菜碱、山梨糖醇或海藻糖可用于在渗透胁迫条件下调节细胞渗透压。可以将渗透保护剂添加到任何合适的基础培养基中。在特定实施方案中,除了其他培养基补充剂(包括但不限于包含氨基酸、维生素、痕量金属或基础盐的混合物)之外,还可以添加渗透保护剂。在实施方案中,可以维持包含渗透保护剂通过甘油补料阶段、甲醇诱导阶段或这两个阶段。
56.在实施方案中,渗透保护剂以约15g/l、约25g/l、约35g/l、约50g/l、约75g/l或约100g/l的浓度存在。在实施方案中,分批培养基中渗透保护剂的存在增加并维持分批培养基的渗透压浓度为大于约50mosm/kg、大于约100mosm/kg、大于约200mosm/kg、大于约500mosm/kg、大于约700mosm/kg、大于1000mosm/kg或大于约1500mosm/kg。在实施方案中,使增加的渗透压维持约24小时至约48小时、约80小时至约110小时或直到甲醇诱导阶段完成(例如,约24至约150小时)。在一些情况下,维持增加的渗透压度过甲醇补料阶段。
57.在一些情况下,可以优化培养参数(例如ph、温度或溶解氧)以提高宿主细胞中重组蛋白质的产生。在一些情况下,培养温度条件可以为至少24℃、24.1℃、24.2℃、24.5℃、24.8℃、26.0℃、26.3℃、26.5℃、26.8℃、27.0℃、27.2℃、27.5℃、27.8℃、29.0℃、29.3℃、29.5℃、29.8℃、30.0℃、30.3℃、30.5℃、30.7℃、31℃、31.3℃、31.5℃、31.7℃、31.9℃、32.3℃、32.6℃、32.8℃、33.0℃、33.1℃、33.5℃、33.6℃或34.0℃。在一些情况下,发酵培养条件的ph可以为至多5、5.2、5.4、5.6、5.8、6.0、6.2、至多6.4、至多6.6、至多6.7、至多6.8、至多6.9、至多7.0、至多7.1、至多7.3、至多7.5、至多7.8、至多7.9或至多8.0。在一些情况下,发酵培养条件的ph可以为至少4、4.4、4.6、4.8、5、5.2、5.4、5.6、5.8、6.0、6.2、6.4、6.6、6.7、6.8、6.9、7.0、7.1、7.3、7.5、7.8或7.9。在一些情况下,溶解氧水平可以保持在至多15%、至多17%、至多20%、至多22%、至多25%、至多27%、至多30%、至多32%或至多35%的饱和度。食物蛋白质
58.在一些实施方案中,本文提供的方法可用于在大规模发酵环境中产生动物来源的食物相关蛋白质。在一些情况下,动物来源的蛋白质是酶,诸如用于食物和/或饮料成分和产品的制造、加工和/或产生。动物来源的酶的一些示例包括胰蛋白酶、胰凝乳蛋白酶、胃蛋白酶以及这样的酶的前体和前原体;例如,胃蛋白酶原是胃蛋白酶的前体/前原体。在一些情况下,动物蛋白质是营养蛋白质,诸如保持或结合维生素或矿物质的蛋白质(例如,铁结合蛋白或血红素结合蛋白)或提供蛋白质源和/或特定氨基酸的蛋白质。
59.在一些实施方案中,本文提供的方法可用于在大规模发酵环境中产生食物蛋白
质。在一些情况下,食物蛋白质可以是动物蛋白质。在一些实施方案中,动物蛋白质可以是卵相关蛋白质。这样的卵白蛋白质的示例性示例可以是卵清蛋白(ova)、卵类黏蛋白(ovd)、卵转铁蛋白和溶菌酶蛋白质。卵相关蛋白质的其他示例包括卵黏蛋白、卵球蛋白g2、卵球蛋白g3及其任何组合。卵相关蛋白质的其他示例包括卵抑制剂、卵糖蛋白、黄素蛋白、卵巨球蛋白、卵固蛋白(ovostatin)、半胱氨酸蛋白酶抑制剂、抗生物素蛋白、卵清蛋白相关蛋白x、卵清蛋白相关蛋白y及其任何组合。
60.在一些情况下,使用本文提供的系统和方法产生的蛋白质是经翻译后修饰的。这样的修饰包括糖基化和磷酸化。在一些情况下,产生的蛋白质的翻译后修饰与天然产生的蛋白质相同或基本相似。在一些情况下,与蛋白质的天然来源相比,产生的蛋白质的翻译后修饰发生改变。
61.在一些实施方案中,使用本文提供的系统和方法收获的重组蛋白质可以提供天然蛋白质的至少一种或多种功能特征。例如,重组卵白卵清蛋白可以表现出天然卵白蛋白质的至少一种或多种功能特征,其选自胶凝、起泡、打发、疏松、结合、弹性、充气、乳脂状和对组合物的黏合性。在其他情况下,一种或多种功能特征可以选自溶解度、透明度、质地、起泡、打发、渗出、胶凝、氮:碳比、水结合、油结合、褐变、乳化、澄清、凝固、涂覆、结晶控制、干燥、可食用包装膜、精加工、风味、强化、耐冻性、光泽、保湿、隔热、润湿、口感、ph稳定性、蛋白质富集、丰富度、保质期延长、结构、嫩化、质地、增稠或抗微生物活性。在一些情况下,使用本文提供的系统和方法收获的重组动物蛋白质可以提供与天然蛋白质的相同特征基本相同或比其更好的至少一种或多种功能特征。在一个示例中,用本文的系统和方法生产的重组卵清蛋白的特征可以与天然蛋白质提供的相同特征基本上相同或比其更好。在一些实施方案中,本文提供了用作卵白替代物的重组蛋白质组合物。
62.使用本文的系统和方法产生的蛋白质可以用于食物成分和食物产品。例如,使用本文所述的方法产生的重组卵清蛋白可以为食物成分和食物产品提供一种或多种功能特征。在一些情况下,使用本文的方法产生的重组动物蛋白质可以为食物成分或食物产品提供营养特征,诸如蛋白质含量、蛋白质强化和氨基酸含量。例如,由使用本文的方法产生的重组卵清蛋白提供的营养特征可以与卵、卵白或天然卵清蛋白相当或基本相似。在其他情况下,由使用本文的方法产生的重组卵清蛋白提供的营养特征可以优于由天然卵或天然卵白提供的营养特征。
63.食物组合物可以包括0.1%至50%的量(基于重量/重量(w/w)或重量/体积(w/v))的重组食物蛋白质,例如重组卵黏蛋白。使用本文的系统和方法产生的重组蛋白质可以以或至少以0.1%、0.2%、0.25%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%或50%(基于重量/重量(w/w)或重量/体积(w/v))存在于食物组合物中。附加地或备选地,使用本文的系统和方法产生的重组蛋白质可存在于这样的食物组合物中的浓度为至多70%、60%、50%、40%、30%、20%、15%、10%、5%、4%、3%、2%或1%(基于w/w或w/v)。在一些实施方案中,食物成分或食物产品中的重组蛋白质可以在0.1%-50%、1%-30%、0.1%-20%、1%-10%、0.1%-5%、1%-5%、0.1%-2%、1%-2%或0.1-1%w/w的浓度范围内。ii.用于高产量食物蛋白质产生的工程化细胞的生成
64.本文提供的系统和方法被设计用于通过将包含在一个或多个表达盒中的用于重组蛋白质表达的异源序列引入宿主细胞来工程化宿主细胞。
65.一个或多个表达盒可以被整合至宿主细胞中。宿主细胞可以包含第一表达盒。第一表达盒可以具有与编码第一异源蛋白质的第一基因可操作地连接的第一启动子。宿主细胞可以包含第二表达盒。在一些情况下,第一表达盒和第二表达盒编码相同的蛋白质。例如,第一表达盒和第二表达盒可以驱动重组卵类黏蛋白的表达。在一些情况下,在第一表达盒和第二表达盒中表达的重组异源蛋白质由相同的基因序列编码。在一些情况下,在第一表达盒和第二表达盒中表达的重组蛋白质可以由不同的基因序列编码。例如,表达盒可以包含编码相同蛋白质的一种或多种基因序列,诸如,这些基因序列中的一种可以经密码子优化。在一些情况下,编码在第一表达盒和第二表达盒中表达的重组蛋白质的基因序列可以具有至少80%、至少85%、至少90%、至少95%或至少99%的序列相似性。
66.在一些情况下,在第一表达盒中表达的重组蛋白质可以是与第二表达盒中的重组蛋白质同源的蛋白质。例如,第一表达盒中的重组蛋白质可以来自第一物种的卵相关蛋白质,并且第二表达盒中的重组蛋白质可以是来自相关物种的同源卵相关蛋白质。例如,第一表达盒中的重组蛋白质可以是由家鸡(gallus gallus domesticus)编码的卵类黏蛋白,并且第二表达盒中的重组蛋白质可以是由绿头鸭(anas platyrhynchos)物种编码的卵类黏蛋白。在一些情况下,编码在第一表达盒和第二表达盒中表达的重组蛋白质的同源基因序列可以具有至少80%、至少85%、至少90%、至少95%或至少99%的序列相似性。
67.在一些情况下,第一表达盒和第二表达盒可以编码不同的蛋白质。例如,第一表达盒和第二表达盒可以分别驱动卵类黏蛋白和卵清蛋白的表达。在一些情况下,任选地,第三表达盒可以与第三基因可操作地连接。在一些情况下,第三基因可以编码第一重组蛋白质。在一些情况下,第三基因可以编码第二重组蛋白质。在一些情况下,任选地,第三基因编码第三重组蛋白质。在一些情况下,第三重组异源蛋白质可以编码辅助蛋白质,即辅助第一异源蛋白质或第二异源蛋白质表达的蛋白质。
68.在一些情况下,任选地,第四表达盒可以与第四基因可操作地连接。在一些情况下,第四基因可以编码第一重组蛋白质。在一些情况下,第四基因可以编码第二重组蛋白质。在一些情况下,任选地,第四基因编码第三重组蛋白质。在一些情况下,任选地,第五表达盒可以与第五基因可操作地连接。在一些情况下,第五基因可以编码第一重组蛋白质。在一些情况下,第五基因可以编码第二重组蛋白质。在一些情况下,任选地,第五基因编码第三重组蛋白质。在一些情况下,任选地,第五基因编码第四重组蛋白质。在一些情况下,任选地,第五基因编码第五重组蛋白质。
69.在一些情况下,由第一表达盒或第二表达盒编码的重组异源蛋白质可以是动物来源的蛋白质。在一些情况下,动物来源的蛋白质是食物相关蛋白质。在一些情况下,动物来源的蛋白质可以是卵相关蛋白质。卵相关蛋白质或卵白蛋白质的示例包括例如,卵类黏蛋白、卵清蛋白、溶菌酶、卵转铁蛋白、卵黏蛋白、卵球蛋白g2、卵球蛋白g3及其任何组合。在一些情况下,信号肽的序列同一性可以是与表4中列出的seq id no:13-16具有至少80%、90%、95%、96%、97%、98%、99%或99.5%序列同一性的序列。用于生产的附加的卵相关蛋白质包括卵抑制剂、卵糖蛋白、黄素蛋白、卵巨球蛋白、卵固蛋白、半胱氨酸蛋白酶抑制剂、抗生物素蛋白、卵清蛋白相关蛋白x、卵清蛋白相关蛋白y及其任何组合。
70.在一些情况下,由第一表达盒或第二表达盒编码的重组异源蛋白质可以是基于植物的食物蛋白质。一些情况下,一种或多种基于植物的蛋白质可以包括但不限于:豌豆蛋白质分离物和/或浓缩物;鹰嘴豆(鸡心豆)蛋白质分离物和/或浓缩物;蚕豆蛋白质分离物和/或浓缩物;大豆蛋白质分离物和/或浓缩物;稻蛋白质分离物和/或浓缩物;绿豆蛋白质分离物和/或浓缩物;土豆蛋白质分离物和/或浓缩物;大麻蛋白质分离物和/或浓缩物;或其任何组合。基于植物的蛋白质可以包括,例如,大豆蛋白质(例如,所有形式,包括浓缩物和分离物)、豌豆蛋白质(例如,所有形式,包括浓缩物和分离物)、菜籽蛋白质(例如,所有形式,包括浓缩物和分离物)、其市售为小麦的其他植物蛋白质和分级的小麦蛋白质、玉米及其级分(包括玉米醇溶蛋白)、稻、燕麦、土豆、花生、绿豌豆粉、绿豆粉以及衍生自豆类、扁豆和干豆的任何蛋白质。在特定实施方案中,豌豆蛋白质可以衍生自黄豌豆,诸如加拿大黄豌豆。表达盒整合拷贝数
71.在一些实施方案中,用于整合至宿主细胞中的媒介物或质粒可以包含第一表达盒的一个或多个拷贝。在一些实施方案中,用于整合至宿主细胞中的质粒可以包含第一表达盒的一个或多个拷贝和第二表达盒的一个或多个拷贝。在一些情况下,工程化宿主细胞可以整合一个或多个质粒,每个质粒包含第一表达盒的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个或至少20个拷贝。在一些情况下,工程化宿主细胞可以整合一个或多个质粒,每个质粒包含第一表达盒的至多1个、至多2个、至多3个、至多4个、至多5个、至多6个、至多7个、至多8个、至多9个、至多10个、至多11个、至多12个、至多13个、至多14个、至多15个、至多16个、至多17个、至多18个、至多19个或至多20个拷贝。在一些情况下,工程化宿主细胞可以整合一个或多个质粒,每个质粒包含第二表达盒的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个或至少20个拷贝。在一些情况下,工程化宿主细胞可以整合一个或多个质粒,每个质粒包含第二表达盒的至多1个、至多2个、至多3个、至多4个、至多5个、至多6个、至多7个、至多8个、至多9个、至多10个、至多11个、至多12个、至多13个、至多14个、至多15个、至多16个、至多17个、至多18个、至多19个或至多20个拷贝。
72.在一些情况下,工程化宿主细胞可以整合第一表达盒的一个或多个拷贝、第二表达盒的一个或多个拷贝以及任选的第三表达盒的一个或多个拷贝。在一些情况下,宿主细胞整合可以包括第一表达盒的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个或至少20个拷贝以及第二表达盒的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个或至少20个拷贝。附加地,宿主细胞可以包括第三表达盒的至多1个、至多2个、至多3个、至多4个、至多5个、至多6个、至多7个、至多8个、至多9个、至多10个、至多11个、至多12个、至多13个、至多14个、至多15个、至多16个、至多17个、至多18个、至多19个或至多20个拷贝。在一些情况下,整合可以包括第一表达盒的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少
15个、至少16个、至少17个、至少18个、至少19个或至少20个拷贝以及第二表达盒的至多1个、至多2个、至多3个、至多4个、至多5个、至多6个、至多7个、至多8个、至多9个、至多10个、至多11个、至多12个、至多13个、至多14个、至多15个、至多16个、至多17个、至多18个、至多19个或至多20个拷贝。附加地,宿主细胞可以包括第三表达盒的至多1个、至多2个、至多3个、至多4个、至多5个、至多6个、至多7个、至多8个、至多9个、至多10个、至多11个、至多12个、至多13个、至多14个、至多15个、至多16个、至多17个、至多18个、至多19个或至多20个拷贝。
73.在一些情况下,工程化宿主细胞可以整合编码第一重组蛋白质的基因序列的一个或多个拷贝、编码第二重组蛋白质的基因序列的一个或多个拷贝以及任选的编码第三重组蛋白质的转基因的一个或多个拷贝。在一些情况下,宿主细胞整合可以包括编码第一重组蛋白质的转基因的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个或至少20个拷贝以及编码第二重组蛋白质的转基因的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个或至少20个拷贝。附加地,宿主细胞可以包括编码第三重组蛋白质的转基因的至多1个、至多2个、至多3个、至多4个、至多5个、至多6个、至多7个、至多8个、至多9个、至多10个、至多11个至多12个、至多13个、至多14个、至多15个、至多16个、至多17个、至多18个、至多19个或至多20个拷贝。附加地,宿主细胞可以包括编码第四重组蛋白质的转基因的至多1个、至多2个、至多3个、至多4个、至多5个、至多6个、至多7个、至多8个、至多9个、至多10个、至多11个、至多12个、至多13个、至多14个、至多15个、至多16个、至多17个、至多18个、至多19个或至多20个拷贝。附加地,宿主细胞可以包括编码第五重组蛋白质的转基因的至多1个、至多2个、至多3个、至多4个、至多5个、至多6个、至多7个、至多8个、至多9个、至多10个、至多11个、至多12个、至多13个、至多14个、至多15个、至多16个、至多17个、至多18个、至多19个或至多20个拷贝。
74.工程化宿主细胞可以包含编码异源蛋白质(诸如重组产生的动物蛋白质)的异源基因的多于一个拷贝。可以使用标准技术(诸如定量pcr或测序)来确定整合至宿主细胞基因组中的异源基因的拷贝数。诸如宿主细胞基因组测序的技术可以在拷贝数计算中提供最小变异量,因此可以提供更可靠的拷贝数计数。在一些情况下,工程化宿主细胞包含每个细胞2至20个异源基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞至少2个异源基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞至多20个异源基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞2至4、2至5、2至6、2至8、2至10、2至12、2至14、2至16、2至18、2至20、4至5、4至6、4至8、4至10、4至12、4至14、4至16、4至18、4至20、5至6、5至8、5至10、5至12、5至14、5至16、5至18、5至20、6至8、6至10、6至12、6至14、6至16、6至18、6至20、8至10、8至12、8至14、8至16、8至18、8至20、10至12、10至14、10至16、10至18、10至20、12至14、12至16、12至18、12至20、14至16、14至18、14至20、16至18、16至20或18至20个异源基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞约2、4、5、6、8、10、12、14、16、18或20个异源基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞至少2、4、5、6、8、10、12、14、16或18个异源基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞至多4、5、6、8、10、12、14、16、18
或20个异源基因拷贝。
75.工程化宿主细胞可以包含一个或多个拷贝的编码辅助因子蛋白质的辅助因子基因。可以使用标准技术(例如定量pcr或测序)来确定整合至宿主细胞基因组中的辅助因子基因的拷贝数。诸如宿主细胞基因组测序的技术可以在拷贝数计算中提供最小变异量,因此可以提供更可靠的拷贝数计数。在一些情况下,工程化宿主细胞包含每个细胞1至8个辅助因子基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞至少1个辅助因子基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞至多8个辅助因子基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞1至2、1至3、1至4、1至5、1至6、1至7、1至8、2至3、2至4、2至5、2至6、2至7、2至8、3至4、3至5、3至6、3至7、3至8、4至5、4至6、4至7、4至8、5至6、5至7、5至8、6至7、6至8或7至8个辅助因子基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞约1、2、3、4、5、6、7或8个辅助因子基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞至少1、2、3、4、5、6或7个辅助因子基因拷贝。在一些情况下,工程化宿主细胞包含每个细胞至多2、3、4、5、6、7或8个辅助因子基因拷贝。
76.在一些情况下,辅助因子基因与异源基因的拷贝数的平衡比率导致异源蛋白质产生增加。在缺乏辅助因子蛋白质的情况下,异源基因的过表达可能使宿主细胞产生的蛋白质的量饱和,但在一些情况下,如果存在一种或多种辅助因子蛋白质,工程化宿主细胞可能能够克服饱和并进一步提供更高滴度。在一些情况下,过表达的辅助因子蛋白质也可能导致蛋白质产生降低。在一些情况下,宿主细胞可以包含每个辅助因子基因拷贝1.1、1.2、1.3、1.5、1.7、1.9、2、2.2、2.4、2.5、2.6、2.8、3、3.2、3.4、3.6、3.8、4、4.2、4.4、4.6、4.8、5、5.4、5.8、6、6.4、6.8、7、7.4、7.8、8、8.4、8.8、9、9.4、9.8、10或12个异源基因拷贝。在各种实施方案中,辅助因子编码序列与异源蛋白质编码序列的拷贝数比为至少约1:10、1:9、1:8、1:7、1:6、1:5、1:4或1:3。在一些实施方案中,辅助因子编码序列与异源蛋白质编码序列的拷贝数比为至多约1:9、1:8、1:7、1:6、1:5、1:4、1:3或1:2。
77.辅助因子基因与异源基因的平衡拷贝数比可以根据异源蛋白质而变化,并且不希望受理论束缚,特定比率可能提供出乎意料的优异蛋白质表达,而另一个比率(高于或低于特定比率)可能提供非期望的蛋白质表达。
78.在一个示例中,辅助因子基因与卵类黏蛋白(ovd)基因的拷贝数比可以为1:2至1:8。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含2至8个ovd基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至少2个ovd基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至多8个ovd基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含2至2.25、2至2.5、2至2.75、2至3、2至3.5、2至4、2至4.5、2至5、2至5.5、2至6、2至8、2.25至2.5、2.25至2.75、2.25至3、2.25至3.5、2.25至4、2.25至4.5、2.25至5、2.25至5.5、2.25至6、2.25至8、2.5至2.75、2.5至3、2.5至3.5、2.5至4、2.5至4.5、2.5至5、2.5至5.5、2.5至6、2.5至8、2.75至3、2.75至3.5、2.75至4、2.75至4.5、2.75至5、2.75至5.5、2.75至6、2.75至8、3至3.5、3至4、3至4.5、3至5、3至5.5、3至6、3至8、3.5至4、3.5至4.5、3.5至5、3.5至5.5、3.5至6、3.5至8、4至4.5、4至5、4至5.5、4至6、4至8、4.5至5、4.5至5.5、4.5至6、4.5至8、5至5.5、5至6、5至8、5.5至6、5.5至8或6至8个ovd基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含约2、2.25、2.5、2.75、3、3.5、4、4.5、5、5.5、6或8个ovd基因拷贝。在一些示例中,对于每个辅助因子基
因拷贝,宿主细胞可以包含至少2、2.25、2.5、2.75、3、3.5、4、4.5、5、5.5、6或7个ovd基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至多2.25、2.5、2.75、3、3.5、4、4.5、5、5.5、6或8个ovd基因拷贝。
79.在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含2至5个卵清蛋白(ova)基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至少2个ova基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至多5个ova基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含2至2.5、2至3、2至3.2、2至3.4、2至3.6、2至3.8、2至4、2至4.5、2至5、2.5至3、2.5至3.2、2.5至3.4、2.5至3.6、2.5至3.8、2.5至4、2.5至4.5、2.5至5、3至3.2、3至3.4、3至3.6、3至3.8、3至4、3至4.5、3至5、3.2至3.4、3.2至3.6、3.2至3.8、3.2至4、3.2至4.5、3.2至5、3.4至3.6、3.4至3.8、3.4至4、3.4至4.5、3.4至5、3.6至3.8、3.6至4、3.6至4.5、3.6至5、3.8至4、3.8至4.5、3.8至5、4至4.5、4至5或4.5至5个ova基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含约2、2.5、3、3.2、3.4、3.6、3.8、4、4.5或5个ova基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至少2、2.5、3、3.2、3.4、3.6、3.8、4或4.5个ova基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至多2.5、3、3.2、3.4、3.6、3.8、4、4.5或5个ova基因拷贝。
80.在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含1.5至5个胃蛋白酶原(pga)基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至少1.5个pga基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至多5个pga基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含1.5至1.75、1.5至2、1.5至2.25、1.5至2.5、1.5至2.75、1.5至3、1.5至3.5、1.5至4、1.5至5、1.75至2、1.75至2.25、1.75至2.5、1.75至2.75、1.75至3、1.75至3.5、1.75至4、1.75至5、2至2.25、2至2.5、2至2.75、2至3、2至3.5、2至4、2至5、2.25至2.5、2.25至2.75、2.25至3、2.25至3.5、2.25至4、2.25至5、2.5至2.75、2.5至3、2.5至3.5、2.5至4、2.5至5、2.75至3、2.75至3.5、2.75至4、2.75至5、3至3.5、3至4、3至5、3.5至4、3.5至5或4至5个pga基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含约1.5、1.75、2、2.25、2.5、2.75、3、3.5、4或5个pga基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至少1.5、1.75、2、2.25、2.5、2.75、3、3.5或4个pga基因拷贝。在一些示例中,对于每个辅助因子基因拷贝,宿主细胞可以包含至多1.75、2、2.25、2.5、2.75、3、3.5、4或5个pga基因拷贝。增加的蛋白质产生
81.在一些情况下,本公开内容的工程化细胞及其使用方法提供了相对于对照细胞或对照方法增加的蛋白质产生。
82.在实施方案中,工程化细胞及其使用方法提供了相对于对照细胞或对照方法约1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3倍、3.1倍、3.2倍、3.3倍、3.4倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍、约4倍或其间的任何倍数的增加的蛋白质产生。在一些实施方案中,工程化细胞及其使用方法提供了相对于对照细胞或对照方法约4.2倍、4.4倍、4.6倍、4.8倍、5倍、5.2倍、5.4倍、5.6倍、5.8倍、6倍、6.2倍、6.4倍、6.6倍、6.8倍、7倍、7.2倍、7.4倍、7.6倍、7.8倍、8倍、8.2倍、8.4倍、8.6倍、8.8倍、9倍、9.2倍、9.4倍、9.6倍、9.8倍、约10倍或其间的
任何倍数的增加的蛋白质产生。在各种实施方案中,工程化细胞及其使用方法提供了相对于对照细胞或对照方法约10倍、15倍、20倍、25倍、约30倍或其间的任何倍数的增加的蛋白质产生。
83.在一些情况下,工程化细胞及其使用方法提供了相对于对照细胞或对照方法约1倍至约2倍、2倍至3倍、3倍至4倍、4倍至5倍、5倍至6倍、6倍至7倍、7倍至8倍、8倍至9倍、9倍至10倍、10倍至15倍、15倍至20倍、20倍至25倍或约25倍至约30倍的增加的蛋白质产生。
84.对照细胞可以是缺少如本文公开的第一表达盒、第二表达盒和/或第三表达盒的细胞。对照细胞可以包含小于或大于本文公开的拷贝数的异源蛋白质编码序列拷贝数。对照细胞可以包含小于或大于本文公开的拷贝数的辅助因子编码序列拷贝数。对照细胞可以包含在本文公开的比率之外(即,大于或低于)的辅助因子编码序列与异源蛋白质编码序列的拷贝数比。在一些情况下,对照可以包括上述与本文公开的工程化细胞的差异的任何组合。作为示例,辅助因子编码序列的拷贝数可以小于本文公开的拷贝数并且拷贝数比可以低于本文公开的比率,或者对照细胞可以缺少如本文公开的第二表达盒并且可以包含大于本文公开的拷贝数的辅助因子编码序列拷贝数。启动子多样性
85.转录瓶颈可能是由于那些可用于介导一个或多个表达盒中的整合启动子的活性的同源转录因子库的耗竭而产生的。在一些实施方案中,引入多种表达盒,这些表达盒携带不同启动子以驱动感兴趣转基因,从而使对可用转录因子的需求多样化以驱动表达。在一些情况下,每个表达盒携带独特的启动子,该启动子不同于另一个表达盒携带的启动子。附加地,多个启动子的使用降低了盒之间的同源性,这可能增加整合的稳定性和拷贝数,特别是当多个拷贝在基因组内的位点整合在一起时。在一些情况下,当包含特定启动子的表达盒被整合至细胞的基因组中时,如果用另一个仍包含特定启动子的表达盒转化细胞,则整合的特定启动子和转化的特定启动子的同源性可能导致整合的表达盒的同源重组和切除;在这种情况下,整合表达盒的拷贝数不会在后续转化后增加,而是由于新盒的整合和旧盒的切除,拷贝数保持不变。
86.在本文的一些实施方案中,第一表达盒和第二表达盒含有不同的启动子序列。启动子可以衍生自不同的来源(例如,不同的调节区)。启动子可以衍生自相同或基本上类似的来源,但序列的总长度和/或调控元件的排列不同。在一些情况下,启动子可以是合成启动子。
87.工程化宿主细胞可以包含与整合至基因组中的异源基因的序列可操作地连接的多于一个启动子。在一些情况下,工程化宿主细胞可以包含与一个或多个异源基因的序列可操作地连接的至少2、3、4、5、6、7或8个不同启动子。在一些情况下,工程化宿主细胞可以包含与异源基因的单个序列可操作地连接的至少2、3、4、5、6、7或8个不同启动子。可以使用一个质粒或媒介物将与基因连接的每个启动子转化至宿主细胞中。备选地,可以使用多于一个质粒或媒介物将与基因连接的启动子转化至宿主细胞中。
88.第一表达盒的启动子可以是诱导型启动子。诱导型启动子包括这样的启动子,其在存在诱导物(诸如小分子、蛋白质、肽、温度、光或其他环境条件)时转录基因的编码序列;另一方面,在不存在诱导物时转录很少或没有转录,因此,蛋白质表达很少或没有蛋白质表达。在一些实施方案中,表达盒包括醇诱导型启动子,诸如甲醇诱导型启动子。在一些实施
方案中,诸如在本文的系统和方法中采用两个或更多个不同表达盒时,每个表达盒可以采用不同的诱导型启动子。在一些实施方案中,诸如在本文的系统和方法中采用两个或更多个不同表达盒时,每个表达盒可以采用相同的诱导型启动子。在一些实施方案中,第一表达盒和第二表达盒的启动子是不同启动子序列,但均可以被相同诱导物诱导(例如,所有甲醇诱导型启动子)。用于毕赤酵母的示例性甲醇诱导型启动子包括aox1、aox2、fdh、pex11,以及糖诱导型启动子,诸如葡萄糖诱导的和鼠李糖调节的启动子。表达盒中可以包括的诱导型启动子的其他示例在本公开内容的其他地方进行了描述。
89.第一表达盒可以包括组成型启动子,其在不需要诱导物的情况下表达。用于本文的组成型启动子可以包括从提供高表达到提供更中等和更低表达水平的表达水平谱的那些组成型启动子。在一些实施方案中,诸如在本文的系统和方法中采用两个或更多个不同表达盒时,第一和第二类型的表达盒采用不同的组成型启动子。在本文的系统和方法中采用两个或更多个不同表达盒的一些实施方案中,第一表达盒采用诱导型启动子,并且第二表达盒采用组成型启动子。
90.在一些情况下,启动子序列的序列同一性可以是与表1中列出的seq id no:1-8具有至少80%、90%、95%、96%、97%、98%、99%或99.5%序列同一性的序列。在一些实施方案中,一个或多个启动子选自adh1 、醇脱氢酶(adh1、adh2、adh4)、ahsb4m、ainv、醇氧化酶i(aox1)、醇氧化酶2(aox2)、二羟基丙酮合酶(das)、烯醇化酶(eno、eno1)、甲醛脱氢酶(fld1)、fmd、甲酸脱氢酶(fmdh)、g1、g6、gaa、gcw14、gdha、3-磷酸甘油醛脱氢酶(gpda、gap、gapdh)、磷酸甘油酸变位酶(gpm1)、甘油激酶(gut1)、hsp82、invl 、异柠檬酸裂解酶(icl1)、乙酰羟酸异构还原酶(ilv5)、kar2、β-半乳糖苷酶(lac4)、leu2、melo、met3、nmt1、nsp、pcbc、pet9、过氧化物酶体生成蛋白8(pex8)、磷酸甘油酸激酶(pgk,pgk1)、pho1、pho5、pho89、磷脂酰肌醇合酶(pis1)、pyk1、丙酮酸激酶(pki1)、rps7、山梨醇脱氢酶(sdh)、3-磷酸丝氨酸氨基转移酶(ser1)、ssa4、tef、翻译延伸因子1α(tef1)、thi11、高丝氨酸激酶(thr1)、tpi、tps1、磷酸丙糖异构酶(tpi1)、xrp2和ypt1。终止子
91.表达盒可以在蛋白质编码序列的3’端包括终止子。在一些实施方案中,终止子和启动子序列来自相同的基因来源(例如,das启动子和das终止子)。在其他实施方案中,表达盒的启动子和终止子衍生自不同的基因来源。在一些实施方案中,诸如在本文的系统和方法中采用两个或更多个不同表达盒时,每个表达盒可以采用不同的终止序列。在一些实施方案中,诸如在本文的系统和方法中采用两个或更多个不同表达盒时,每个表达盒可以采用相同的终止子。
92.在一些情况下,终止序列的序列同一性可以是与表2中列出的seq id no:9-10具有至少80%、90%、95%、96%、97%、98%、99%或99.5%序列同一性的序列。在一些实施方案中,表达盒的终止子选自adh1 、醇脱氢酶(adh1、adh2、adh4)、ahsb4m、ainv、醇氧化酶i(aox1)、醇氧化酶2(aox2)、二羟基丙酮合酶(das)、烯醇化酶(eno、eno1)、甲醛脱氢酶(fld1)、fmd、甲酸脱氢酶(fmdh)、g1、g6、gaa、gcw14、gdha、3-磷酸甘油醛脱氢酶(gpda、gap、gapdh)、磷酸甘油酸变位酶(gpm1)、甘油激酶(gut1)、hsp82、invl 、异柠檬酸裂解酶(icl1)、乙酰羟酸异构还原酶(ilv5)、kar2、β-半乳糖苷酶(lac4)、leu2、melo、met3、nmt1、nsp、pcbc、pet9、过氧化物酶体生成蛋白8(pex8)、磷酸甘油酸激酶(pgk、pgk1)、pho1、pho5、
pho89、磷脂酰肌醇合酶(pis1)、pyk1、丙酮酸激酶(pki1)、rps7、山梨醇脱氢酶(sdh)、3-磷酸丝氨酸氨基转移酶(ser1)、ssa4、tef、翻译延伸因子1α(tef1)、thi11、高丝氨酸激酶(thr1)、tpi、tps1、磷酸丙糖异构酶(tpi1)、xrp2和ypt1。信号分泌序列
93.在实施方案中,本文提供的系统和方法被设计用于分泌期望的重组异源蛋白质。在一些情况下,这通过将分泌信号框内(in-frame)融合到整合至宿主细胞基因组中的多个表达盒中的重组异源蛋白质的编码区来实现。在一些实施方案中,多个表达盒可以包括异源分泌信号(例如,不是从待表达的异源蛋白质中天然衍生的)。在一些实施方案中,在本文的系统和方法中采用的多个表达盒可以包括异源分泌信号并且缺乏任何天然存在的分泌信号。
94.在一些实施方案中,诸如在本文的系统和方法中采用两个或更多个不同表达盒时,每个表达盒可以采用不同的分泌信号肽序列。在一些实施方案中,诸如在本文的系统和方法中采用两个或更多个不同表达盒时,每个表达盒可以采用相同的分泌信号肽序列。示例性分泌信号包括但不限于来自酿酒酵母(saccharomyces cerevisiae)的交配因子α-因子原序列、ostl信号序列、杂合ost1-α-因子原序列和合成的信号序列。
95.在一些情况下,信号肽的序列同一性可以是与表3中列出的seq id no:11-12具有至少80%、90%、95%、96%、97%、98%、99%或99.5%序列同一性的序列。在本文公开的任一实施方案中,信号肽可以选自酸性磷酸酶、白蛋白、碱性胞外蛋白酶、α-交配因子、淀粉酶、β-酪蛋白、碳水化合物结合模块家族21-淀粉结合结构域、羧肽酶y、纤维二糖水解酶i、二肽基蛋白酶、葡糖淀粉酶、热休克蛋白质(例如,细菌hsp70)、疏水蛋白、菊粉酶、转化酶、杀伤蛋白质或杀伤毒素(例如,128kda pgkl杀伤蛋白质、k1杀伤毒素的α-亚基(例如,乳酸克鲁维酵母(kluyveromyces lactis)、k1毒素kilm1、k28前原毒素、金合欢毕赤酵母(pichia acaciae))、富含亮氨酸人工信号肽cly-l8、溶菌酶、植物血凝素、麦芽糖结合蛋白、p因子、毕赤酵母dse、毕赤酵母exg、毕赤酵母pir1、毕赤酵母scw、pir4及其任何组合。选择标志物
96.在本文提供的系统和方法中,用于整合至宿主细胞中的表达盒可以被设计成缺少选择标志物。在一些其他情况下,用于整合至宿主细胞中的表达盒可以被设计用于使用一种或多种选择标志物来鉴定阳性整合体。在一些情况下,用于整合至宿主细胞中的表达盒可以包括一种或多种抗生素抗性基因、营养缺陷型标志物或其组合。在一些实施方案中,诸如在本文的系统和方法中采用两个或更多个不同表达盒的情况下,每个表达盒可以采用选择标志物的不同组合。在一些实施方案中,诸如在本文的系统和方法中采用两个或更多个不同表达盒时,每个表达盒可以采用相同的选择标志物组合。示例性的选择标志物可以包括:抗生素抗性基因(例如博来霉素(zeocin)、氨苄青霉素(ampicillin)、杀稻瘟素(blasticidin)、卡那霉素(kanamycin)、诺尔丝菌素(nurseothricin)、氯霉素(chloroamphenicol)、四环素(tetracycline)、三氯生(triclosan)、更昔洛韦(ganciclovir))或其任何组合。选择标志物的其他示例可以包括营养缺陷型标志物(例如ade1、arg4、his4、ura3、met2)或其任何组合。在一些情况下,营养缺陷型标志物可以是有缺陷的营养缺陷型标志物,例如leu2-d或参与亮氨酸代谢的leu2-d变体(betancur等人,2017)。在一些情况下,选择标志物的序列同一性可以是与表5中列出的seq id no:17-25具
有至少80%、90%、95%、96%、97%、98%、99%或99.5%序列同一性的序列。辅助因子蛋白质
97.工程化宿主细胞可以包编码辅助因子蛋白质的辅助因子基因的含一个或多个拷贝。在一些情况下,本文的方法可以包括使用用于表达辅助因子(诸如促进蛋白质折叠、蛋白质稳定性、蛋白质翻译和/或增加从启动子的转录的辅助因子)的表达盒进行转化。
98.包含一种或多种辅助因子基因的表达盒可以包含在用于表达异源基因的表达盒中使用的启动子。备选地,包含辅助因子基因的表达盒可以包含与整合至宿主基因组中用于表达异源基因的任何启动子不同的启动子。
99.示例性的辅助因子蛋白质包括诸如丝氨酸/苏氨酸蛋白激酶2(kin2)、鲨烯合成酶(erg9)、蛋白质二硫键异构酶1(pdi1)、热休克蛋白质(诸如ssa1、ssa4)、伴侣蛋白质(诸如ssb1、sse1、bip)、转录激活因子(诸如hac1)、er膜蛋白复合物亚基1(emc1)、ynl181w氧化还原酶、整合膜蛋白锌金属蛋白酶ste24、14-3-3蛋白bmh2、内质网氧化还原蛋白1(ero1)等蛋白质。在一些情况下,辅助因子蛋白质的序列同一性可以是与表6中列出的seq id no:26-39具有至少80%、90%、95%、96%、97%、98%、99%或99.5%序列同一性的序列。用于表达盒的遗传元件的示例性组合
100.表达盒的遗传元件可以设计成适合在预期的宿主细胞生物中表达。例如,可以针对多个表达盒中的遗传元件进行密码子优化以在预期的宿主细胞生物中有效表达。
101.可以构建表达盒以包含遗传元件(例如,启动子、终止子、信号序列、选择标志物、转基因编码序列等)的任何组合。在一些情况下,可以通过转化含有paox1启动子、α交配因子分泌信号、taox1终止子以及ura3选择标志物的表达盒来生成用于表达ovd编码序列的宿主菌株。在一些情况下,可以将pdas2启动子与α交配因子分泌信号和taox1终止子组合(无选择标志物)以生成用于表达ovd编码序列的盒。在一些情况下,表达盒可以包括ppex11启动子和taox1终止子。在一些情况下,表达盒可以包括驱动辅助因子蛋白质(诸如hac1)的ppex11启动子和taox1终止子。在一些情况下,用于表达ovd的表达盒可以包括paox1启动子、α交配因子分泌信号和taox1终止子以及选择标志物。
102.在一些情况下,可以通过转化含有paox1启动子、α交配因子分泌信号、taox1终止子以及选择标志物的表达盒来生成用于表达ovd编码序列的宿主菌株。在一些情况下,可以通过转化含有paox1启动子、α交配因子分泌信号、taox1终止子以及选择标志物的表达盒来生成用于表达ovd编码序列的宿主菌株。在一些情况下,可以通过转化含有pdas2启动子、α交配因子分泌信号、taox1终止子以及选择标志物的表达盒来生成用于表达ovd编码序列的宿主菌株。在一些情况下,可以通过转化含有pfld1启动子、α交配因子分泌信号、taox1终止子以及选择标志物的表达盒来生成用于表达ovd编码序列的宿主菌株。
103.在一些情况下,可以通过转化含有paox1启动子、α交配因子分泌信号、taox1终止子以及选择标志物的表达盒来生成用于表达pga编码序列的宿主菌株。在一些情况下,可以通过转化含有pfdh1启动子、α交配因子分泌信号、taox1终止子以及选择标志物的表达盒来生成用于表达pga编码序列的宿主菌株。在一些情况下,可以通过转化含有pfld1启动子、α交配因子分泌信号、taox1终止子以及选择标志物的表达盒来生成用于表达pga编码序列的宿主菌株。表达盒共转化的方法
104.本文的方法采用共转化以生成多个表达盒进入基因组中。将作为dna的表达盒(例如,1、2、3个或更多个不同的盒)混合在一起并转化至宿主细胞中。备选的方法可以采用预连接的盒,由此针对单个盒的多个拷贝的dna序列,或针对不同表达盒的dna序列在转化之前在体外(例如,在单个质粒中)连接。在一些情况下,包含设计的拷贝数的异源蛋白质(例如,重组卵清蛋白)的一个或多个质粒可以经线性化并组合在核酸的起始混合物中,以用于单一转化反应进入宿主细胞(例如,毕赤酵母)中。例如,质粒1可以含有盒的2个头对尾拷贝,该盒具有paox1启动子、与卵清蛋白(ova)cdna框内融合的α交配因子分泌信号和随后的taox2终止子,而质粒2可以用盒的四个头对尾拷贝构建,该盒含有pfld1启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子。两种质粒均可以包括loxzeo选择盒。在组合转化中,质粒1和2均经线性化并组合在核酸的起始混合物中,以用于单一转化反应进入毕赤酵母中,并回收转化菌株a。
105.在其他情况下,可以将包含一个或多个拷贝的表达盒的一个或多个质粒顺序转化至宿主细胞中。例如,先前从组合转化获得的菌株a可以用作起始材料。然后可以用两个质粒(质粒3和4)顺序转化菌株a,每个质粒均含有与编码cdna的卵清蛋白框内融合的pgk1信号序列。每个质粒可以含有启动子和终止子的独特组合。例如,质粒3可以含有pdas2和taox2,而质粒4可以含有pfld1和taox1。质粒3中的骨架可以包括loxzeo抗性基因。质粒4中的骨架可以包括潮霉素抗性。用质粒3转化第一菌株a,并通过选择回收转化菌株b。然后用质粒4转化菌株b,并通过选择回收最终的转化菌株c。在一些情况下,质粒可以被整合至相同的基因组基因座中,或在相同的基因组基因座附近。在其他情况下,质粒可以被整合至不同的基因组基因座中。
106.在一些情况下,引入表达盒骨架的选择标志物可以在顺序转化之间被切除,这在本公开内容的其他地方进行了描述。在一些情况下,可以使用带有不同选择标志物的质粒进行顺序转化。将表达盒整合至宿主细胞基因组中
107.在一些实施方案中,多个表达盒被整合至宿主细胞(诸如甲基营养酵母细胞,例如毕赤酵母细胞)的基因组中的单个位点中。在一些实施方案中,多个表达盒被整合在宿主细胞(诸如甲基营养酵母细胞,例如毕赤酵母细胞)的基因组中的另一个位点附近。在一些情况下,当在本文的系统和方法中采用两个或更多个不同表达盒时,第一表达盒和第二表达盒的整合位点可以位于相同的染色体上。在一些情况下,附加地,第三表达盒可以在与第一盒和第二盒不同的整合位点被整合至工程化细胞的基因组中。在一些情况下,附加地,第三表达盒可以在与第一盒和第二盒的整合位点相同的整合位点被整合至工程化细胞的基因组中。在一些情况下,当在本文的系统和方法中采用两个或更多个不同表达盒时,多个表达盒的整合位点可以位于宿主细胞基因组的不同染色体中的同源位点上。
108.在一些实施方案中,多个表达盒在宿主细胞的基因组位点串联整合,其中所有表达盒处于单一方向(例如,参考盒的5’至3’方向)。在一些实施方案中,多个表达盒以其中一个或多个盒与其他盒相比处于不同方向的布置被整合至宿主细胞(诸如甲基营养酵母细胞,例如毕赤酵母细胞)的基因组中。在一些情况下,在本文的系统和方法中采用两个或更多个不同表达盒时,第一表达盒和第二表达盒以相对的5’至3’方向被整合至基因组中。在一些情况下,在本文的系统和方法中采用两个或更多个不同表达盒时,第一表达盒和第二
表达盒以相同的5’至3’方向被整合至基因组中。在一些情况下,附加地,第三表达盒可以以与第一盒、第二盒或第一盒和第二盒不同的5’至3’方向在整合位点处整合至工程化细胞的基因组中。在一些情况下,附加地,第三表达盒可以以与第一盒、第二盒或第一盒和第二盒相同的5’至3’方向被整合至工程化细胞的基因组中。
109.在一些实施方案中,可以通过非同源重组将多个表达盒异位整合至宿主细胞基因组的单个基因组基因座中。在一些实施方案中,可以通过非同源重组将多个表达盒异位整合在宿主细胞基因组中的相同基因组基因座附近或相同基因组基因座处。在一些实施方案中,可以通过在宿主细胞基因组中的相同染色体上的非同源重组将多个表达盒异位整合。在一些实施方案中,可以通过在宿主细胞基因组中的不同染色体上的非同源重组将多个表达盒异位整合。
110.在一些情况下,可以通过非同源重组方法将多个表达盒整合至宿主细胞(例如,毕赤酵母细胞)的基因组中。在一些情况下,当在本文的系统和方法中采用两个或更多个不同表达盒时,可以通过非同源重组整合多个表达盒中的每个表达盒。在一些情况下,当在本文的系统和方法中采用两个或更多个不同表达盒时,可以通过非同源重组整合多个表达盒中的至少一个表达盒。
111.在一些情况下,当在本文的系统和方法中采用两个不同表达盒时,可以通过非同源重组整合第一表达盒和第二表达盒。在一些情况下,可以通过同源重组将多个表达盒整合至宿主细胞基因组中。在一些情况下,当在本文的系统和方法中采用两个不同表达盒时,可以通过非同源重组整合第一表达盒,并且可以通过同源重组整合第二表达盒。在一些情况下,附加地,可以通过与第一盒、第二盒或第一盒和第二盒不同的重组方法将第三表达盒整合至工程化细胞的基因组中。在一些情况下,附加地,可以通过与第一盒、第二盒或第一表达盒和第二表达盒相同的重组方法将第三表达盒整合至工程化细胞的基因组中。
112.在一些情况下,表达盒中的序列与宿主细胞基因组中的相应序列之间存在非实质的序列同源性。例如,当在本文的系统和方法中采用两个或更多个不同表达盒时,宿主细胞中整合的基因组基因座与第一启动子、第二启动子、第一基因、第二基因、第一信号序列、第二信号序列、第一选择性标志物或第二选择标志物不具有序列同源性。
113.在一些情况下,宿主细胞基因组中的序列与具有表达盒的一个或多个序列之间存在序列同源性。在一些情况下,序列同源性位于或部分位于线性化表达盒的5’和3’端的序列处。在一些情况下,在本文的系统和方法中采用两个不同表达盒,并且第一表达盒和第二表达盒是线性分子的情况下,第一表达盒或第二表达盒可以在5’端包含与宿主细胞基因组基因座的同源性。例如,整合的基因组基因座中的序列与表达盒的5’序列或3’序列处的序列之间的序列同源性可以为至少5bp、至少10bp、至少20bp、至少30bp、至少40bp、至少60bp、至少80bp、至少100bp、至少120bp、至少150bp、至少180bp、至少200bp、至少250bp、至少300bp、至少350bp、至少400bp、至少450bp、至少500bp、至少600bp、至少700bp长、至少800bp长、至少900bp长或至少1000bp长。在一些情况下,整合的基因组基因座中的序列与表达盒的5’序列或3’序列处的序列之间的序列同源性可以为至多10bp、至多20bp、至多30bp、至多40bp、至多60bp、至多80bp、至多100bp、至多120bp、至多150bp、至多180bp、至多200bp、至多250bp、至多300bp、至多350bp、至多400bp、至多450bp、至多500bp、至多600bp、至多700bp长、至多800bp长、至多900bp长或至多1000bp长。
114.在一些情况下,可以通过依赖于表达盒中的序列与宿主细胞基因组中的相应序列之间的序列同源性的同源重组来整合表达盒。在一些情况下,同源重组可以依赖于第一表达盒中的启动子序列与基因组启动子序列之间的序列同源性。例如,同源重组可以依赖于表达盒中的aox1启动子与基因组aox1序列之间的序列同源性。在一些情况下,同源重组可以依赖于第一表达盒中的分泌信号序列与宿主细胞基因组细胞中的分泌信号序列之间的序列同源性。在一些情况下,同源重组可以依赖于第一表达盒中的选择标志物序列与基因组序列之间的序列同源性。例如,同源重组可以依赖于表达盒中的ura3选择标志物与基因组ura3序列之间的序列同源性。选择标志物的切除和转化体筛选
115.在本文提供的方法中,将含有遗传信息的表达盒插入宿主细胞中。在一些实施方案中,可以通过本领域已知的任何方式分离成功转化体的克隆种群。在一些情况下,增加浓度的抗生素(诸如(g418)和zeocin
tm
)的使用,以及它们相应的抗生素抗性基因可用于筛选多拷贝整合。可以通过本领域经培训的人员已知的标准分子生物学方法(即菌落pcr、基因组测序)挑取和验证将表达盒整合至宿主细胞基因组中的单个菌落。可以通过标准分子生物学方法(例如,western印迹、使用已知标准蛋白质的sds-page)来确定单个蛋白质的表达。
116.在一些实施方案中,本文采用的方法包括整合包含选择标志物的表达盒,然后使用位点特异性基因组编辑系统切除选择标志物。在一些情况下,表达盒中的选择标志物序列,例如,抗生素抗性基因或营养缺陷型标志物可以与一对lox位点(例如,lox71和lox66;表5中提供的示例性序列;seq id no:23或24)邻接。工程化细胞中的cre重组酶表达可用于从loxp位点切除选择标志物基因。在一些情况下,(使用诸如表5中例示的序列,seq id no:22)可以将cre重组酶和选择标志物序列在表达盒中组合。在一些情况下,表达盒还可以含有cre基因内含子序列,以防止cre蛋白质表达中的遗漏。在一些情况下,cre重组酶可以使用附加体质粒单独表达。在一些情况下,其他重组酶系统(诸如flp/frt位点特异性重组系统)可用于在整合至基因组后切除选择标志物。在一些实施方案中,切除lox(或其他重组酶位点)之间的序列,也切除附加的序列,诸如载体骨架、细菌复制起点、细菌选择标志物和其他序列(其中一些示例在表5中提供)。在一些实施方案中,重组酶表达盒被包括在通过在宿主细胞中表达重组酶而切除的序列中。
117.有多种方法可用于在不使用选择标志物的情况下鉴定具有改变的基因组的那些细胞。在一些实施方案中,这样的方法包括但不限于pcr方法(包括定量pcr)、测序方法、核酸酶消化(例如,限制酶图谱)、southern印迹及其任何组合。表型读数,例如预测的功能增益或损失,也可以用作影响预期基因组修饰的指标。
118.使用本文提供的方法,在单个基因座处包含成功整合的表达盒的转化细胞的无标志物恢复(包括载体骨架和其他切除序列的丧失)可以在至少10%、20%、30%、50%、60%、70%、80%、90%或100%频率的筛选的接触宿主细胞或其克隆群内发生。在某些实施方案中,在两个、三个、四个或五个基因座处包含成功整合表达的转化细胞的无标志物恢复可以在至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的筛选的接触宿主细胞或其克隆群中发生。
119.在一些情况下,第一线性表达盒可以与宿主细胞中的第二线性表达盒重组以在宿
主细胞中形成两种或更多种不同的环状染色体外核酸。例如,宿主细胞可以与包含第一或第二表达盒的一个或多个拷贝的两个或更多个第二线性化质粒接触,第一和第二线性表达盒经历同源重组以形成包含选择标志物的编码序列的环状游离或染色体外核酸。一旦被环化,染色体外核酸包括选择标志物的编码序列和合适的调控序列,诸如能够在宿主细胞中表达标志物的启动子和/或终止子。
120.在一些实施方案中,本文所述的方法可以进一步包括从宿主细胞中消除环化的染色体外载体的步骤,例如,当选择的宿主细胞已被鉴定为包含期望的基因组整合时。在一些实施方案中,可以通过使选择的细胞经历足够的有丝分裂以使质粒从群体有效稀释来实现从选择的细胞中消除编码选择标志物的质粒。备选地,可以通过选择质粒的不存在来选择不含质粒的细胞,例如通过针对反选择标志物(例如ura3)进行选择或通过在选择性培养基和非选择性培养基上铺板相同的菌落,然后选择在选择性培养基上不生长但在非选择性培养基上生长的菌落。宿主细胞工程化
121.除了整合表达盒之外,还可以单独修饰宿主细胞。这样的修饰可以在用表达盒转化之前或之后进行。在一些情况下,修饰有助于宿主细胞的生长特征和/或表达特征,从而有助于在发酵条件下产生高蛋白质滴度。
122.在一些实施方案中,修饰改变宿主细胞对诱导物的反应。例如,一种这样的修饰可以是将宿主细胞(例如,毕赤酵母)的生长特性改变为甲醇型生长特性的修饰。在一些实施方案中,使用突变宿主作为宿主细胞以进一步转化和整合表达盒,其中一个或多个盒包括可由甲醇诱导的启动子。在一些实施方案中,修饰包括增加由表达盒编码的蛋白质的活性形式的量、累积或产生的一种或多种因子的表达。这样的修饰可以包括一种或多种辅助因子(诸如转录因子、伴侣蛋白质和参与蛋白质折叠的其他蛋白质)、转录后修饰酶(例如,磷酸化酶、磷酸酶、糖基化酶和去糖基化酶)的表达。
123.在一些实施方案中,宿主细胞(例如,毕赤酵母细胞)可以经工程化以显示与同源重组相比增加的非同源重组(nhej)。例如,在一些情况下,宿主细胞(例如,毕赤酵母细胞)可以经工程化以过表达参与细胞的非同源重组活动的基因(即编码驱动nhej途径或有助于nhej的蛋白质的一个或多个基因)。毕赤酵母的nhej途径基因的示例包括但不限于yku70、yku 80、dnl4、rad50、rad 27、mre1 1和pol4。不同宿主细胞的基因名称可能不同。nhej活动的增加可以是与在细胞中不过表达控制nhej的基因(例如毕赤酵母细胞的yku70基因座)的宿主细胞相比,同源重组减少至少20%、30%、40%、50%、60%、70%、80%、90%、100%或减少这些百分比之间的任何百分比。
124.为了减轻可能由于高重组蛋白质产生而导致的细胞内氨基酸浓度的耗竭,宿主细胞可以经工程化以改善巴斯德毕赤酵母中氨基酸的供应,从而改善蛋白质产生。在一些实施方案中,编码氨基酸生物合成的通用转录激活因子的gcn4的过表达,丝氨酸、异亮氨酸、丙氨酸和芳香族氨基酸合成代谢中代谢酶的直接过表达,或真菌羧酸酯酶的直接过表达,可用于通过调整酶丰度或其动力学来优化氨基酸的合成途径。
125.为了克服由于高重组蛋白质产生而可能发生的能量低效的限制,可以优化宿主细胞以改善参与细胞氧化还原和能量效率的前体供应。在一些实施方案中,策略可以包括使碳转向发酵途径的基因的删除、苹果酸脱氢酶的过表达(这可以增加线粒体nadh的供应)或
ppp的氧化部分中的酶(例如,nadh氧化酶)的过表达,其导致增加的nadph和前体的供应,从而产生更高滴度的蛋白质。
126.巴斯德毕赤酵母中表达的异源蛋白质发生非期望的蛋白质水解不仅降低产品产量或生物活性,而且还可能使完整产品的下游加工复杂化,因为降解产物将具有相似的物理化学和亲和力性质。为了缓解蛋白质水解问题,可以使用缺乏蛋白酶的蛋白酶缺陷型宿主细胞株。蛋白酶的示例包括pep4、羧肽酶y(prc1)和蛋白酶b(prb1)。这样的巴斯德毕赤酵母蛋白酶缺陷型菌株的示例包括smd1163(δhis4 δpep4 δprb1)、smd1165(δhis4 δprb1)和smd1168(δhis4 δpep4)。
127.高重组蛋白质产生以不合适的mrna结构、到er的不完全蛋白质折叠或蛋白质易位的形式诱导分泌瓶颈。宿主细胞可以经工程化以通过折叠辅助蛋白质(诸如ip/kar2p、dnaj、pdi、ppi和ero1p)的过表达或hac1(upr途径基因的转录调节因子)的过表达来克服潜在的分泌瓶颈。
128.在一些情况下,宿主细胞中异源蛋白质的产生可能伴随高甘露糖聚糖结构,影响血清半衰期或引发人体过敏反应。为了缓解这个问题,宿主细胞可以经进一步工程化以包括敲除蛋白质-o-甘露糖基转移酶(pmt)或由och1编码的酵母高尔基体蛋白质α-1,6-甘露糖基转移酶。在其他情况下,宿主细胞可以经工程化以表达里氏木霉(trichoderma reesei)α-1,2-甘露糖苷酶,或者可以使用携带适当靶向信号的几种糖基转移酶和糖苷酶中的一种(例如,β-1,2-n-乙酰葡萄糖胺转移酶1、尿苷5
’‑
二磷酸(udp)-glcnac转运蛋白、与酿酒酵母er蛋白质sec12的n端定位肽融合的小鼠甘露糖苷酶mnsia催化结构域、与来自酿酒酵母高尔基体蛋白质mnn9的前导序列融合的人glcnac转移酶gnti、黑腹果蝇(drosophila melanogaster)甘露糖苷酶ii(manii)或大鼠glcnac转移酶gntii的过表达、粟酒裂殖酵母(schizosaccharomyces pombe)半乳糖差向异构酶或人β-1,4半乳糖基转移酶的过表达)。在一些情况下,参与唾液酸合成、转运和转移的基因(例如,人udp-n-乙酰葡萄糖胺-2-差向异构酶/n-乙酰甘露糖胺激酶(gne)、人n-乙酰神经氨酸-9-磷酸合成酶(sps)、人cmp-唾液酸合成酶(css)、小鼠cmp-唾液酸转运蛋白(cst))可以共表达,以获得最佳的唾液酸化n-聚糖。
129.在一些情况下,重组宿主细胞可以是甲烷氧化菌。在甲烷氧化菌中,巴斯德驹形氏酵母和法夫驹形氏酵母是优选的(也称为毕赤酵母)。毕赤酵母属菌株的示例包括毕赤酵母菌株。示例可以包括nrrl y-11430、bg08、bg10、nrrl y-11430gs115(nrrl y-15851)、gs190(nrrl y-18014)、ppf1(nrrl y 18017)、ppy120oh、ygc4和衍生自其的菌株。可用作宿主细胞的巴斯德毕赤酵母菌株的其他示例包括但不限于cbs7435(nrrl y-11430)、cbs704(dsmz 70382)或其衍生物。利用甲醇的酵母的其他示例包括属于ogataea属(ogataea morpha)、假丝酵母属(博伊丁假丝酵母(candida boidinii))、球拟酵母属(球拟酵母(torulopsis))或驹形氏酵母属(komagataella)的酵母。
130.合适的宿主细胞生物的其他示例包括但不限于:阿克氏酵母属(arxula spp.);食腺嘌呤阿克氏酵母(arxula adeninivorans);克鲁维酵母属(kluyveromyces spp.),乳酸克鲁维酵母(kluyveromyces lactis);毕赤酵母属(pichia spp.),安格斯毕赤酵母(pichia angusta)、巴斯德毕赤酵母;酵母属(saccharomyces spp.),酿酒酵母;裂殖酵母属(schizosaccharomyces spp.),粟酒裂殖酵母;耶氏酵母属(yarrowia spp.),解脂耶氏
酵母(yarrowia lipolytica);蘑菇属(agaricus spp.),二孢蘑菇(agaricus bisporus);曲霉属(aspergillus spp.),泡盛曲霉(aspergillus awamori)、烟曲霉(aspergillus fumigatus)、构巢曲霉(aspergillus nidulans)、黑曲霉(aspergillus niger)、米曲霉(aspergillus oryzae);炭疽菌属(colletotrichum spp.),胶孢炭疽菌(colletotrichum gloeosporiodes);内座壳属(endothia spp.),寄生内座壳(endothia parasitica);镰孢属(fusarium spp.),禾本科镰孢(fusarium graminearum)、腐皮镰孢(fusarium solani);毛霉属(mucor spp.),米黑毛霉(mucor miehei)、微小毛霉(mucor pusillus);毁丝霉属(myceliophthora spp.),嗜热毁丝霉(myceliophthora thermophila);脉胞菌属(neurospora spp.),粗糙脉胞菌(neurospora crassa);青霉属(penicillium spp.),沙门柏干酪青霉(penicillium camemberti)、变灰青霉(penicillium canescens)、产黄青霉(penicillium chrysogenum)、埃默森青霉(penicillium emersonii(埃默森蓝状菌,talaromyces emersonii))、绳状青霉(penicillium funiculosum)、产紫青霉(penicillium purpurogenum)、娄地青霉(penicillium roqueforti);侧耳属(pleurotus spp.),糙皮侧耳(pleurotus ostreatus);根毛霉属(rhizomucor spp.),米黑根毛霉(rhizomucor miehei)、微小根毛霉(rhizomucor pusillus);根霉属(rhizopus spp.)、少根根霉(rhizopus arrhizus)、少孢根霉(rhizopus oligosporus)、米根霉(rhizopus oryzae);木霉属(trichoderma spp.),深绿木霉(trichoderma altroviride)、里氏木霉、绿木霉(trichoderma vireus);米曲霉(aspergillus oryzae)、枯草芽孢杆菌(bacillus subtilis)、大肠杆菌(escherichia coli)、嗜热毁丝霉、粗糙脉胞菌、毕赤酵母、毕赤酵母“muts”菌株(graz university of technology(cbs7435muts)或biogrammatics(bg11))、法夫驹形氏酵母和巴斯德驹形氏酵母。iii.定义
131.除非另有定义,否则本文使用的所有技术术语、符号和其他技术和科学术语或专用语旨在具有与要求保护的主题所属领域的普通技术人员通常理解的相同的含义。在一些情况下,为了清楚和/或为了便于参考,本文定义了具有普遍理解含义的术语,并且本文中包括这样的定义不一定被解释为表示与本领域通常理解的内容具有实质性差异。
132.在整个本技术中,可以以范围形式呈现各种实施方案。应当理解,范围形式的描述仅是为了方便和简洁,并且不应理解为对本公开内容范围的硬性限制。因此,范围的描述应该被认为已经具体公开了所有可能的子范围以及该范围内的各个数值。例如,对诸如1至6的范围的描述应该被认为具有具体公开的子范围,诸如1至3、1至4、1至5、2至4、2至6、3至6等,以及该范围内的各个数字,例如1、2、3、4、5和6。无论范围的宽度如何,这均适用。
133.作为示例的短语“辅助因子编码序列与异源蛋白质编码序列的比率为至少1:10”中的术语“至少”意指覆盖的比率可以相对于异源蛋白质编码序列的拷贝数具有辅助因子编码序列的更多个拷贝。换言之,“至少1:10”的条件,意指每有异源蛋白质编码序列的10个拷贝必须有辅助因子编码序列的“至少1个”拷贝,例如,可以有1个拷贝、2个拷贝、3个拷贝、4个拷贝或更多个拷贝。另一方面,作为示例的短语“辅助因子编码序列与异源蛋白质编码序列的比率为至多1:2”中的术语“至多”意指覆盖的比率可以相对于异源蛋白质编码序列的拷贝数具有辅助因子编码序列的更少个拷贝。换言之,“至多1:2”的条件,意指每有异源蛋白质编码序列的2个拷贝必须有辅助因子编码序列的“至多1”个拷贝。注意1:2的比率等
同于5:10的比率;因此,“至多5:10”的等同术语将涵盖每有异源蛋白质编码序列的10个拷贝有辅助因子序列的5个拷贝,每有异源蛋白质编码序列的10个拷贝有辅助因子序列的4个拷贝,每有异源蛋白质编码序列的10个拷贝有辅助因子序列的3个拷贝,以此类推。
134.在本文中,术语“约”或“大约”是指在由本领域普通技术人员确定的特定值的可接受误差范围内,这将部分取决于如何测量或确定该值,例如,测量系统的局限性。例如,根据本领域的实践,“约”可以指在1个或大于1个标准偏差内。备选地,“约”可以指给定值的至多20%、至多15%、至多10%、至多5%或至多1%的范围。备选地,特别是关于生物系统或工艺,该术语可以指在值的数量级内,优选地在5倍内,更优选地在2倍内。在本技术和权利要求中描述了特定值的情况下,除非另有说明,否则应假定术语“约”的含义在特定值的可接受误差范围内。
135.在本文中,术语“序列同一性”,诸如为了评估互补性百分比的目的,可以通过任何合适的比对算法来测量。一般来讲,“序列同一性”是指两个多核苷酸或多肽序列分别精确的核苷酸-核苷酸或氨基酸-氨基酸对应。通常,用于确定序列同一性的技术包括确定多核苷酸的核苷酸序列和/或确定由其编码的氨基酸序列并将这些序列与第二核苷酸或氨基酸序列进行比较。可以通过确定它们的“同一性百分比”来比较两个或更多个序列(多核苷酸或氨基酸)。与可能是较长分子(例如,多核苷酸或多肽)内的序列的参考序列(例如,核酸或氨基酸序列)的同一性百分比可以计算为两个最佳比对序列之间的精确匹配数除以参考序列的长度并乘以100。还可以例如通过使用先进的blast计算机程序(包括2.2.9版,可获自美国国立卫生研究院)比较序列信息来确定同一性百分比。在本文中,序列同一性百分比可以指序列和它们在查询序列的跨度上的比对。如果一个序列比另一个序列短,则可以在较短序列的跨度上考虑同一性百分比。在本文中,“覆盖率百分比”可以指与两个序列中较长序列比对相同的核苷酸或氨基酸的数量占较长序列中核苷酸或氨基酸数量的百分比。
136.在本文中,如果一个多核苷酸与另一个多核苷酸具有100%的序列同一性并且长度相同,则将它称为另一个多核苷酸的“拷贝”。在一些情况下,如果一个多核苷酸与另一个多核苷酸具有不同的序列,但由这两个多核苷酸编码的蛋白质具有相同的氨基酸序列,则将它称为另一个多核苷酸的“拷贝”。在本文中,如果多核苷酸不是一组多核苷酸中的任何元素的拷贝,或者对于一组中所有那些元素它是一个拷贝但是除了它的基因或氨基酸序列之外还包含将它与该元素区分开的化学差异,则它与该组多核苷酸“不同”。
137.在本文中,“表达盒”是任何多核苷酸,其含有编码转基因的子序列并且当包含在宿主细胞中时可以赋予该子序列表达并且对于该宿主生物是异源的。
138.本文使用的章节标题仅用于组织目的,不应被解释为限制所描述的主题。表1:启动子序列
表2:终止序列
表3:信号肽序列表4:与分泌信号融合的蛋白质
表5:选择标志物和其他标志物
表6:辅助蛋白质序列
iv.实施例
139.以下实施例仅用于说明目的,并不旨在限制本发明的范围。实施例1:通过顺序转化构建ovd表达菌株
140.使用如下的启动子、信号序列和终止子的文库构建ovd的表达盒。
141.用paox1启动子、与编码ovd(seq 1;seq id no:13)的cdna框内融合的α交配因子分泌信号(seq 1;seq id no:13)和随后的taox1终止子来构建质粒1。质粒1在质粒骨架上还含有ura3选择盒以用于选择。
142.用pdas2(1)启动子、与编码ovd(seq 1;seq id no:13)的cdna框内融合的α交配因子分泌信号(seq 1;seq id no:13)和随后的taox1终止子来构建质粒2。质粒2的骨架不含有选择表达盒。
143.通过用质粒1和质粒2的混合物转化毕赤酵母来构建菌株cf1,鉴定含有质粒1和质粒2二者的拷贝的菌落。
144.然后用质粒3转化所选择的菌株cf1以产生菌株cf2。质粒3包括用于同源整合至aox1基因组位点以产生aox1缺失表型的序列。在选择具有aox1缺失并保留整合的质粒1和2的菌落后,然后用cre重组酶瞬时转化该菌株以去除包含质粒骨架的floxed序列以产生菌株cf3。
145.对于转化,将至少1微克质粒dna用限制酶smii线性化。在消化后将线性化的dna用乙醇沉淀,然后重悬于水中。
146.使用harvard apparatus btx ecm 630电穿孔器装置将于1m冰冷的山梨糖醇中的大约75ul的制备的感受态毕赤酵母细胞在2mm电穿孔比色皿(bulldog bio)中以1500v 200欧姆电穿孔,其中电容器设置为25μf。电穿孔后立即将1ml 1m山梨糖醇添加到比色皿中,然后将细胞在30℃下静置1小时,然后平板接种到具有适当抗生素(取决于所选择的与诸如博来霉素、g418、潮霉素或诺尔丝菌素等抗生素选择标志物匹配的载体)的ypd琼脂平板上,然后在30℃下温育3天,然后鉴定并挑取菌落进行试验。
147.如本文所用,术语“floxed”是指从基因组中去除dna序列,其中序列的任一侧侧接有lox位点。重组酶的表达切除2个loxp位点之间的dna序列,因此产生的菌株不再携带质粒骨架。在本文的示例中,采用两种重组酶表达方法。在第一种方法中,cre重组酶从没有整合至毕赤酵母基因组中的复制质粒上的组成型启动子表达。当保留抗生素选择时,保留质粒。在通过重组酶去除质粒骨架后,所得菌株的抗生素选择去除,重组酶质粒不再保留。鉴定缺失质粒骨架和重组酶表达质粒的菌株。在第二种方法中,cre重组酶从甲醇诱导型启动子表达,该启动子被整合为包含表达盒的一个或多个质粒的质粒骨架的一部分,其中具有重组
酶盒的骨架侧接于loxp侧的任一侧。在甲醇诱导后,表达重组酶,然后重组酶切除该质粒骨架,从而使所得菌株缺失质粒骨架和重组酶盒。
148.以菌株cf3作为起始材料产生菌株cf4,然后用质粒4转化。质粒4包括上游的ppex11启动子、编码辅助因子的序列和随后的taox1终止序列。质粒4的骨架包括loxzeo synura选择盒。
149.将ovd的附加拷贝添加到菌株cf4以通过用质粒5转化产生cf5。质粒5含有上游的paox1启动子、与ovd(seq 2;seq id no:14)cdna框内融合的α交配因子分泌信号(seq 1;seq id no:13)和随后的taox1终止子。骨架还包括clph选择盒。实施例2:通过组合转化构建ovd表达株
150.构建一系列四种质粒(质粒7-10),其各自含有与ovd(seq 2;seq id no:14)编码cdna框内融合的α交配因子分泌信号(seq1;seq id no:13)和随后的taox1终止子。每个质粒在ovd融合物上游含有独特的启动子:质粒7含有paox1,质粒8含有pdas2(2),质粒9含有pfld1,并且质粒10含有pfdh1。质粒7-10各自包括上述ovd表达盒的3个拷贝,并且骨架包含loxzeo选择盒。质粒7-10经线性化,然后作为所有四种质粒的混合物被转化至毕赤酵母中。所得选定菌株被命名为cf6。实施例3:针对表达构建体的基因组堆叠进行菌株比较
151.使用前述实施例中描述的构建体和方法,构建了许多菌株,如下表7所示。表7:菌株中的整合菌株中的整合
实施例4:蛋白质表达分析
152.使用qpix菌落挑取器将来自转化的菌落挑取到96孔深孔板的ypd中。将挑取的菌落在平板振荡器中于30℃下生长24小时,然后离心,去除旧培养基,并添加含有葡萄糖和甲醇的新诱导培养基。诱导阶段持续96小时,每天补料葡萄糖/甲醇混合物。
153.为了测定分泌的蛋白质表达,将细胞和培养基离心,并测定所得上清液的等分试样的蛋白质含量。在一些情况下,将上清液直接添加到蛋白质测定试剂(来自thermo scientific的coomassie plus蛋白质测定试剂)中,将上清液于100mm磷酸钾缓冲液中稀释,然后将其添加到蛋白质测定试剂中。将样品与蛋白质测定试剂一起温育10分钟,然后使用spectra max m2读板器(molecular devices)在595nm波长下读数。数据以每升的蛋白质克数计算。
154.为了测定蛋白质量并确认蛋白质测定的结果,通过sds page分析上清液并用简单蓝色安全染料(simply blue safe stain,life technologies)染色。使用protein simple成像仪记录所得凝胶图像。实施例5:ovd菌株的蛋白质表达水平
155.对四种基因组堆叠的ovd菌株cf3、cf4、cf10和cf6的蛋白质表达进行相互比较,在使用深孔板生长形式的高通量筛选(hts)(如实施例4中所述)中并且在2升生物反应器中在高细胞密度生长条件下(dasgip)比较总蛋白质(如实施例7中进一步解释)。在hts深孔板生长形式下,使用cf6产生的蛋白质滴度作为基线(100%),菌株cf10(105.3%)和cf6(100%)比cf3(74.9%)和cf4(76.5%)菌株的总蛋白质表达更高。在dasgip条件下,使用cf6产生的蛋白质滴度作为基线(100%),与cf3(约135%)和cf6菌株相比,cf4和cf10的大规模总蛋白质产量分别为大约164%和200%实施例6:在大体积发酵条件下的表达使菌株cf3、cf5和cf10在40升发酵罐中生长。将酵母菌株甘油储备液解冻并以0.2%的接种率接种在含有bmdy培养基(bmdy培养基与bmgy培养基相似,其中甘油“g”已被葡萄糖/右旋糖“d”替代,毕赤酵母简易选择手册,thermo fisher)的具挡板摇瓶中。将摇瓶在30℃和250rpm下温育26小时。然后将摇瓶培养物以10%的比率转移到含有bsm(基础盐培养基)、葡萄糖和痕量金属的生物反应器中(毕赤酵母发酵工艺指南,thermo fisher)。
156.生物反应器发酵分为三个阶段。在第1阶段,使培养物生长24小时,直至所有葡萄糖均被消耗。在第2阶段,以葡萄糖限制速率向培养物补料葡萄糖12小时。最后,在第3阶段,通过连续补料葡萄糖和诱导型启动子的激活剂(即甲醇)的共同补料来诱导培养物96小时。
157.上清液中ovd的表达水平以克/升培养基测量。表8显示了在生物反应器中生长的不同菌株的上清液中ovd的相对蛋白质表达。滴度以g/l测量并用于计算倍数提高,或以表8中的相对水平呈现。菌株cf10是分泌型ovd的最高表达者。表8:相对表达水平菌株相对表达水平cf3 cf5 cf10 实施例7:具有同源整合位点与非同源整合位点的ovd工程化菌株的比较
158.通过在紧邻aox1基因上游经由同源重组(即,依赖于盒中的aox1启动子与基因组aox1序列之间的序列同源性)将盒整合而产生一系列包含aox1表达盒的转化体。通过测序确定的每个菌株中ovd的拷贝数在cf11菌株中为大约5,在cf12菌株中为1,并且在cf13菌株中为7-8。这些菌株中ovd的拷贝数与ovd的表达水平相关。将这3个工程化菌株与在非同源位点仅整合ovd的4-5个拷贝的cf1(实施例3)进行比较。出乎意料的是,没有一个同源整合的工程化ovd菌株的表达水平与cf1相当;cf1菌株的ovd表达显著高于具有相似ovd拷贝数的cf11,并且显著高于具有较高ovd拷贝数的cf13。
159.在单独的实验中,使用质粒进一步用附加的ovd拷贝对已经表达ovd的两个毕赤酵母菌株cf14和cf15进行转化。cf14和cf15均衍生自cf16,cf16是实施例2中描述的cf6的衍生菌株并且包含由ppex11驱动的添加的hac1辅助因子基因。用以下2个质粒转化cf14和cf15:含有3个ovd拷贝的质粒3x,含有6个ovd拷贝的质粒6x。3x和6x质粒中的ovd拷贝由aox1、das和fld启动子驱动。aox1终止子用于两个质粒。每组选择80-320个转化体(如表9所示)。从每组中选择高表达者。使用pcr确认ovd质粒的整合位点。使用cf6产生的蛋白质滴度作为基线(100%),cf14和cf15的dasgip滴度分别为176%和164%。
160.将cf15重转化组中的六个和cf14重转化组中的三个(质粒3x和6x转化体)划线用于单菌落,挑取5或6个单菌落并测定高蛋白质表达。表9指示了针对每个转化筛选的转化体的数量。表10指示了在期望位点呈插入阳性的转化体的数量与通过pcr检测时筛选的转化体总数的比较。
161.图1a-b显示了来自该实验的cf14和cf15重复筛选的总结,该实验通过质粒3x和6x的同源和非同源(异位)整合位点分离重复转化体组。
162.异位整合(即在非同源基因组位点整合)的转化体在每个重复转化体组中产生最高表达(在该数据中未区分来自3x和6x质粒的重复转化体)。表9:转化体 cf14cf153x2401606x32080表10:在期望位点呈插入阳性的转化子 cf14cf153x3/84/66x4/82/3实施例8:ovd菌株的比较
163.使用与实施例1至7中所述相似的方法制备毕赤酵母菌株d1-d10。一些菌株包含辅助因子hac1。hac1表达的表达盒在所有情况下均使用pex11启动子和aox1终止序列进行表达,但d10除外,d10中除了pex11外,还使用das启动子用于hac1表达。下表11显示了每个菌株的序列中存在的启动子、ovd的拷贝数和辅助因子的拷贝数。结果在下表11中提供。表11表明使用辅助拷贝时滴度明显提高,即使在减少异源基因拷贝数时也是如此。如所示,将异源基因(ovd)拷贝数从15个减少到12个,同时添加2个辅助拷贝,增加了深孔滴度(平均约10%)和dasgip滴度(平均约50%)。然而,将辅助拷贝数进一步增加到4产生不同的结果(降低了深孔滴度,增加了dasgip滴度)。
表11:ovd菌株的结果
带有星号的菌株经进一步修饰以降低甲醇利用能力,从而简化发酵条件。实施例9:通过组合转化来构建胃蛋白酶原表达菌株
164.如下构建一系列含有胃蛋白酶原表达盒的质粒。所有质粒在其骨架中均含有loxzeo选择标志物盒,且所有质粒在转化至毕赤酵母之前均经线性化。质粒11包含盒的3个头对尾拷贝,该盒具有paox1启动子、与胃蛋白酶原(pga)cdna(seq id no:15)框内融合的α交配因子分泌信号、和随后的taox1终止子。
165.质粒12由具有paox1启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子的盒的2个头对尾拷贝以及具有pfdh1启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子的盒的1个拷贝来构建。
166.质粒13由具有paox1启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子的盒的2个头对尾拷贝以及具有pfld1启动子、与pga cdna框内融合的α交配因
子分泌信号和随后的taox1终止子的盒的1个拷贝来构建。
167.质粒14包含具有paox1启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子的盒的2个头对尾拷贝以及具有pdas2(3)启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子的盒的1个拷贝。质粒14被构建成具有盒的4个头对尾拷贝,该盒具有paox1启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子。
168.质粒15包含具有paox1启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子的盒的2个头对尾拷贝以及具有pfld1启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子的盒的2个拷贝。
169.将全部经线性化的质粒11-15组合在核酸的起始混合物中,用于单一转化反应进入毕赤酵母中。从转化中分离菌株cf9。实施例10:通过顺序转化来构建胃蛋白酶原表达菌株
170.使用菌株cf9作为起始材料。然后用质粒6和质粒16转化,其含有paox1启动子、与pga cdna框内融合的α交配因子分泌信号和随后的taox1终止子,其中骨架含有clph标志物盒。去除转化的floxed骨架。从这些顺序转化中分离菌株cf7和cf8。实施例11:用胃蛋白酶原表达盒进行基因组堆叠的毕赤酵母的转化
171.巴斯德毕赤酵母菌株bg08(biogrammatics inc.,carlsbad;ca,usa)是从农业研究服务培养物保藏中心(agriculture research service culture collection)获得的phillips petroleum菌株nrrl y-11430的单菌落分离物(sturmberger等人,2016)。使用hoechst染料选择来去除细胞质杀伤质粒(sturmberger等人,2016),从bg08衍生巴斯德毕赤酵母bg10(biogrammatics inc,carlsbad,ca,usa)。然后将得到的bg10菌株进一步修饰,使其缺失醇氧化酶1基因(aox1)。这种缺失产生甲醇利用缓慢的表型,该表型降低菌株消耗甲醇的能力。该基础菌株称为dfb-001,用于转化胃蛋白酶原构建体。
172.将胃蛋白酶原构建体连同用于在强甲醇诱导型启动子控制下表达巴斯德毕赤酵母转录因子hac1的构建体一起转化至毕赤酵母中,并选择表达和分泌胃蛋白酶原的分离物。选择作为高产者的转化体用于后续步骤。高产菌株的繁殖证实,引入菌株的所有变化均稳定地整合至基因组中,并证实在非选择性生长培养基上生长》45代后存在。
173.对选择的转化体(所得菌株)进行dna测序;它包含hac1表达盒的三个拷贝和胃蛋白酶原表达盒的五个拷贝。测序也证实该菌株不含任何抗生素标志物或原核载体复制起点序列。测序显示胃蛋白酶原盒均位于所得菌株的1号染色体上的基因座上(见下表12)。表12:菌株中的整合
实施例12:胃蛋白酶原菌株的蛋白质表达水平
174.在两种生长条件下,将两个胃蛋白酶原基因组堆叠菌株cf7和cf8的蛋白质表达相互比较。第一个条件是在高通量筛选(hts)中表达,使用深孔板生长形式,如实施例3所述。cf8菌株显示出比cf7菌株更高的蛋白质表达。还在高细胞密度生长条件下的2升生物反应器中比较这些菌株(dasgip,参见实施例7)。简而言之,将酵母菌株甘油储备液解冻并以0.2%的接种率接种在含有bmdy培养基(bmdy培养基与bmgy培养基相似,其中甘油“g”已被葡萄糖/右旋糖“d”替代,毕赤酵母简易选择手册,thermo fisher)的具挡板摇瓶中。将摇瓶在30℃和250rpm下温育26小时。然后将摇瓶培养物以10%的比率转移到含有bsm(基础盐培养基)、葡萄糖和痕量金属的生物反应器中(毕赤酵母发酵工艺指南,thermo fisher)。生物反应器发酵分为三个阶段。在第1阶段,使培养物生长24小时,直到所有葡萄糖均被消耗。在第2阶段,以葡萄糖限制速率向培养物补料葡萄糖12小时。最后,在第3阶段,通过连续补料葡萄糖和诱导型启动子的激活剂(即甲醇)的共同补料来诱导培养96小时。
175.测定菌株的总分泌蛋白质,然后测定感兴趣的总分泌蛋白质(测定为存在于上清液中)。在两次测量中,cf8菌株均优于cf7菌株。使用来自以下实施例13的p5小规模滴度,cf7的小规模hts滴度为22%并且cf8为45%。使用来自以下实施例13的p5大规模滴度,cf7的大规模dasgip滴度为108%并且cf8为117.5%。实施例13:胃蛋白酶原菌株的比较
176.使用与实施例9至12中所述相似的方法制备毕赤酵母菌株p1-p5,其中所有表达盒均使用aox1终止序列。一些菌株包含辅助因子hac1。hac1表达的表达盒在所有情况下均使用pex11启动子和aox1终止序列进行表达。下表13显示了每个菌株的序列中存在的启动子、pga的拷贝数和辅助因子的拷贝数。结果在下表13中提供。表13:pga菌株的结果实施例14:卵清蛋白菌株的比较
177.使用与针对ovd和pga中所述的方法类似地制备表达毕赤酵母卵清蛋白(ova)的菌株v1-v8,其中所有表达盒均使用aox1终止序列。seq id no:16与下表14中描述的启动子可操作地连接。菌株v1是基础菌株,用具有驱动ova表达的启动子fld和das1的表达盒转化菌株v2。用具有驱动ova表达的aox1启动子的附加表达盒转化菌株v2,从而产生菌株v7。一些菌株(诸如v7)包含辅助因子hac1。hac1表达的表达盒在所有情况下均使用pex11启动子和aox1终止序列进行表达。下表14显示了每个菌株的序列中存在的启动子、ova的拷贝数和辅助因子的拷贝数。
178.表14展示了在使用辅助拷贝时,特别是在某些比率下显著提高的滴度。如所示,使用hac1拷贝显著提高了深孔和dasgip滴度二者。可以看出,增加异源基因(ova)拷贝数对提高滴度几乎没有作用(比较3个ova拷贝与9个ova拷贝),但添加hac1拷贝显示滴度显著提高,其中深孔滴度提高超过5倍,而dasgip滴度提高至3倍或更多。另外,随着异源基因拷贝数增加而观察到收益递减,当hac1拷贝数从2增加到5时观察到收益递减(或减少),表明异源基因拷贝与辅助拷贝的最佳工作比率。表14:ova菌株的结果带有星号的菌株经进一步修饰以降低甲醇利用能力,这简化了发酵条件
179.虽然本文已经示出和描述了本发明的优选实施方案,但是对于本领域技术人员而
言显而易见的是,这些实施方案仅作为示例提供。在不脱离本发明的情况下,本领域技术人员现在将想到许多变化、改变和替换。应当理解,在实施本发明时可以使用本文所述的本发明实施方案的各种替代方案。所附权利要求旨在限定本发明的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同物。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献