一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

通过抑制条件性必需基因进行反向选择的制作方法

2022-03-19 16:05:42 来源:中国专利 TAG:

通过抑制条件性必需基因进行反向选择
1.序列表的引用
2.本技术含有处于计算机可读形式的序列表,将其通过援引并入本文。
技术领域
3.本发明涉及通过抑制条件性必需基因进行反向选择的方法。


背景技术:

4.所谓的crispr基因组编辑系统已被广泛用作一种工具来修饰多种生物的基因组。crispr系统的力量在于其简单性及其在特异性目的基因中靶向和编辑单个碱基对的能力。该系统依赖于crispr相关蛋白(cas)(其是rna指导的内切核酸酶)以及所谓的指导rna(grna)分子(其能与内切核酸酶形成复合物并且将核酸酶活性指导至特定dna序列)。通过改变grna的核苷酸序列以匹配靶dna序列来选择dna靶序列。当与grna分子复合时,内切核酸酶可以识别并结合其靶dna序列,形成内切核酸酶-grna-dna复合物,并使用其一个或多个催化结构域产生双链断裂。
5.出于基因组编辑的目的,最广泛使用的crispr相关蛋白是2类的那些蛋白,其包括衍生自酿脓链球菌(streptococcus pyogenes)的cas9(ii型cas)和衍生自氨基酸球菌属(acidaminococcus)或毛螺菌科(lachnospiraceae)的cpf1(v型cas)。rna指导的内切核酸酶的另一实例是分离自直肠真杆菌(eubacterium rectale)的mad7。尽管mad7和cpf1之间存在一些结构相似性,但是在氨基酸水平上mad7与来自氨基酸球菌属物种的cpf1仅仅是31%保守的。
6.除了其在基因组编辑中使用外,crispr系统还可用于控制基因表达。该应用,通常被称为crispr干扰或crispri,允许基因的序列特异性抑制或激活。crispr干扰利用了一种可通过在负责内切核酸酶活性的催化结构域中引入氨基酸突变来获得的无催化活性的(“死”)内切核酸酶变体(例如,mad7d)。在与grna缔和时,所得复合物保留了与靶dna序列结合的能力,但不会在dna链中引入任何断裂。只要无催化活性的内切核酸酶结合至靶dna序列,该靶序列的表达就被抑制。通过改变grna序列,可以控制靶dna序列,并从而调节任何生物中几乎任何基因的表达。
7.在工业生物技术中,持续需要适合于开发经优化的生产宿主的强力且有效的选择系统。鉴于crispr技术的多功能性和精确性,据推测该系统可用于反向选择目的。然而,迄今为止,利用crispr技术进行直接选择的尝试是困难的。这对于细菌宿主细胞尤其如此,因为归因于已知来自真核生物的非同源末端连接(nhej)系统对双链(ds)断裂的低效修复机制,导致许多原核生物对rna指导的内切核酸酶-grna复合物的内切核酸酶活性非常敏感(参见,例如,su等人,scientific reports[科学报告]2016,6,37895;altenbuchner,applied and environmental microbiology[应用与环境微生物学]2016,82,第5421-5427页;peters等人,current opinion in microbiology[微生物学当前观点]2015,27,第121-126页;aravind和koonin,genome research[基因组研究]2001,11,第1365-1374页)。此外,
在许多情况下需要引入基因或操纵子(表达盒)的多个拷贝以使给定目的多肽的产率最大化。然而,如果为了在一个过程中引入多个表达盒而使多于一个位点靶向ds断裂,则使用crispr技术的直接选择将变得越来越困难。
[0008]
研究者报道了通过同源重组(hr),将目的基因(goi)成功整合到染色体上的grna靶点中,并且然后引入内切核酸酶活性进行ds断裂以杀死保留原始grna靶序列的细胞。以此方式,就有可能有效地富集已经接受goi的细胞。然而,hr和ds活性的这些事件的时机非常重要。rna指导的内切核酸酶典型地在产生ds断裂方面非常活跃,并且不应被表达,直至发生同源重组并去除靶点。


技术实现要素:

[0009]
本发明提供了在适用于微生物宿主细胞的选择系统中,利用crispr技术的多功能性和精确性的手段和方法。
[0010]
因此,在第一方面,本发明涉及用于将至少一种目的多核苷酸插入至宿主细胞基因组的方法,该方法包括以下步骤:
[0011]
a)提供一种宿主细胞,该宿主细胞在其基因组中包含以下:
[0012]
i.编码包含靶序列的选择性标记的多核苷酸,该靶序列侧接针对rna指导的内切核酸酶的功能性pam序列;
[0013]
ii.编码grna的至少一种多核苷酸,该grna与该靶序列至少80%互补并且能够与该靶序列杂交;以及
[0014]
iii.编码rna指导的内切核酸酶的无效核酸酶变体的多核苷酸,该rna指导的内切核酸酶能够与该grna相互作用并与该靶序列结合,从而抑制该选择性标记的表达;
[0015]
b)用至少一种目的多核苷酸转化所述宿主细胞,并且该至少一种目的多核苷酸能够使该编码grna的至少一种多核苷酸失活;
[0016]
c)选择由该选择性标记赋予的性状;以及
[0017]
d)识别转化的宿主细胞,其中该编码grna的至少一种多核苷酸已被该至少一种目的多核苷酸灭活。
[0018]
在第二方面,本发明涉及用于将至少两种不同的目的多核苷酸插入至宿主细胞基因组的方法,该方法包括以下步骤:
[0019]
a)提供一种宿主细胞,该宿主细胞在其基因组中包含以下:
[0020]
i.编码至少两种不同的选择性标记的至少两种多核苷酸,每种选择性标记包含侧接针对rna指导的内切核酸酶的功能性pam序列的不同的靶序列;
[0021]
ii.编码至少两个grna的至少两种多核苷酸,该至少两个grna与该至少两个不同的靶序列至少80%互补并且能够与该至少两个不同的靶序列杂交;
[0022]
iii.编码rna指导的内切核酸酶蛋白的无效核酸酶变体的多核苷酸,该rna指导的内切核酸酶蛋白能够与该至少两个grna相互作用并与该至少两个不同的靶序列结合,从而抑制该两种不同的选择性标记的表达;
[0023]
b)用至少两种不同的目的多核苷酸转化所述宿主细胞,所述多核苷酸能够使该编码至少两个grna的至少两种多核苷酸失活;和
[0024]
c)选择由该至少两种不同的选择性标记赋予的性状;以及
[0025]
d)识别转化的宿主细胞,其中该编码至少两个grna的至少两种多核苷酸已被该至少两种不同的目的多核苷酸灭活。
附图说明
[0026]
图1显示了pp3811-mad7d菌株中的bglc-mad7d基因座。
[0027]
图2显示了pp3811-mad7gdna1菌株中的gnt-dsred-mad7gdna(cat)基因座。
[0028]
图3显示了pp3811-mad7gdna2菌株中的amyl-dsred-mad7gdna(cat)基因座。
[0029]
图4显示了pp3811-mad7gdna3菌株中的laca2-dsred-mad7gdna(cat)基因座。
[0030]
图5显示了整合amyl后mol7800-amyl3中的gnt基因座。
[0031]
图6显示了重新整合amyl后mol7800-amyl3中的amyl基因座。
[0032]
图7显示了整合amyl后mol7800-amyl3中的laca2基因座。
[0033]
图8显示了pp3811-gdna3菌株的示意图。
[0034]
图9显示了pppamyl-attp质粒。
[0035]
序列表
[0036][0037]
定义
[0038]
cdna:术语“cdna”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mrna分子进行反转录而制备的dna分子。cdna缺乏可以存在于对应基因组dna中的内含子序列。初始的初级rna转录物是mrna的前体,其要通过一系列的步骤(包括剪接)进行加工,然后呈现为成熟的剪接的mrna。
[0039]
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由可读框确定,该可读框以起始密码子(如atg、gtg或ttg)开始并且以终止密码子(如taa、tag或tga)结束。编码序列可为基因组dna、cdna、合成dna、或其组合。
[0040]
条件性必需基因:条件性必需基因或基因座可以作为选择性标记起作用。细菌条件性必需选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,这些基因仅当在d-丙氨酸存在下培养细菌时是必需的;或是编码酶的基因,当细胞在半乳糖存在下生长时,这些酶参与udp半乳糖从细菌细胞中的去除。此类基因的非限制性实例是编码utp依赖性磷酸化酶(ec2.7.7.10)、udp-葡萄糖依赖性尿苷基转移酶(ec 2.7.7.12)或udp-半乳糖差向异构酶(ec 5.1.3.2)的来自枯草芽孢杆菌或地衣芽孢杆菌的那些。如果必需基因或基因座失活,将使得所得菌株具有缺陷(例如,不能代谢特定碳源),或生长需要(例如,变成氨基酸营养缺陷型,或对给定的压力变得敏感)。条件性必需基因的非限制性实例是编码d-丙氨酸消旋酶的基因、编码木糖异构酶的基因和葡萄糖酸操纵子的基因。优选地,该条件性必需基因选自由以下组成的组:dal、lysa、araa、gale、antk、metc、xyla、gntp、gntk、glpd、glpf、glpk、glpp、laca2、hisc、gapa、和aspb。
[0041]
控制序列:术语“控制序列”意指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。最少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制位点的目的,这些控制序列可以提供有多个接头。
[0042]
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。
[0043]
表达载体:术语“表达载体”意指直链或环状dna分子,其包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。
[0044]
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不相同的任何亲本细胞子代。
[0045]
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其性质相关的一种或多种或所有天然存在的成分中去除;(3)相对于自然界中发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分,提高物质的量而修饰的任何物质(例如,宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中;例如宿主细胞可以经遗传修饰以表达本发明的多肽。来自该宿主细胞的发酵液将包含分离的多肽。
[0046]
无效核酸酶:术语“无效核酸酶”用于描述内切核酸酶活性被破坏的rna指导的内切核酸酶。rna指导的内切核酸酶的无效核酸酶变体可结合至其靶dna序列,但是不会在靶dna序列中引入任何断裂。术语“无效核酸酶”、“无催化活性的”和“死”(缩写为“d”,例如,mad7d)在本文中可互换使用。
[0047]
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以原本不存在于自然界中的方式被修饰成含有核酸的区段,或者是合成的,该核酸分子包含一个或多个控制序列。
[0048]
可操作地连接:术语“可操作地连接”意指如下构型,在该构型中,控制序列被放置在相对于多核苷酸的编码序列适当的位置处,使得该控制序列指导该编码序列的表达。
[0049]
rna指导的内切核酸酶:术语“rna指导的内切核酸酶”意指具有内切核酸酶活性的多肽,其中该内切核酸酶活性受到一个或多个grna的控制,该grna与rna指导的内切核酸酶形成复合物并且将内切核酸酶活性指导至与该一个或多个grna互补并且能够与该一个或多个grna杂交的靶dna序列。
[0050]
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”来描述。
[0051]
出于本发明的目的,使用如在emboss包(emboss:the european molecular biology open software suite[emboss:欧洲分子生物学开放软件套件],rice等人,2000,trends genet.[遗传学趋势]16:276-277)(优选5.0.0版本或更新版本)的尼德尔(needle)程序中所实施的尼德曼-翁施(needleman-wunsch)算法(needleman和wunsch,1970,j.mol.biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性。所使用的参数是空位开放罚分10、空位延伸罚分0.5、和eblosum62(blosum62的emboss版)取代矩阵。将标记为“最长同一性”的尼德尔的输出(使用非简化选项获得)用作同一性百分比并且计算如下:
[0052]
(相同的残基x 100)/(比对长度-比对中的空位总数)
[0053]
出于本发明的目的,使用如在emboss包(emboss:the european molecular biology open software suite[emboss:欧洲分子生物学开放软件套件],rice等人,2000,同上)(优选地5.0.0版本或更新版本)的尼德尔程序中所实施的尼德曼-翁施算法(needleman和wunsch,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列同一性。所使用的参数是空位开放罚分10、空位延伸罚分0.5、和ednafull(ncbi nuc4.4的emboss版)取代矩阵。将标记为“最长同一性”的尼德尔的输出(使用非简化选项获得)用作同一性百分比并且计算如下:
[0054]
(相同的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
[0055]
序列互补性:两个互补核苷酸序列之间的关联度通过参数“序列互补性”描述并使用与针对序列同一性相同的算法确定,其中在比对和计算前将反义互补序列转换为其正义序列。
具体实施方式
[0056]
本发明提供了在适用于微生物宿主细胞的选择系统中,利用crispr技术的多功能性和精确性的手段和方法。通过使用编码crispri中的grna的dna序列(表示为

gdna’)作为间接的反向选择性标记,本发明人已表明,可以通过选择不存在编码grna的gdna将多个基因拷贝插入至宿主细胞基因组中。
[0057]
如本文实例中所示,合适的选择系统可以基于抗生素抗性基因,如赋予对氯霉素抗性的cat基因。包含编码cat基因的多核苷酸以及编码rna指导的内切核酸酶的无效核酸
酶变体的多核苷酸和编码针对cat基因的grna的多核苷酸的宿主细胞将因此仅在不存在氯霉素的情况下才能生长,因为内切核酸酶-grna复合物将抑制cat基因的表达。只要宿主细胞表达rna指导的内切核酸酶的无效核酸酶变体和grna,该宿主细胞保持对氯霉素敏感。
[0058]
在下一步中,用多核苷酸转化宿主细胞,这允许用目的基因替代gdna。通过随后对氯霉素抗性的选择,由于grna不再表达,仅具有被目的基因替换的gdna的细胞才能存活,这使得正确转化的宿主细胞对氯霉素具有抗性。
[0059]
如本文所附实例中所示,本发明的方法特别适合于在宿主细胞染色体上的单独基因座上一个或多个特定表达盒的一步多插入。本发明的方法提供了含有多个表达盒的宿主细胞,即多拷贝宿主细胞,其由于表达盒被插入到染色体上的单独基因座上而高度稳定。此类细胞在工业生物技术中作为用于生产目的多肽的强力主力是高度可靠的。
[0060]
因此,在第一方面,本发明涉及用于将至少一种目的多核苷酸插入至宿主细胞基因组的方法,该方法包括以下步骤:
[0061]
a)提供一种宿主细胞,该宿主细胞在其基因组中包含以下:
[0062]
i.编码包含靶序列的选择性标记的多核苷酸,该靶序列侧接针对rna指导的内切核酸酶的功能性pam序列;
[0063]
ii.编码grna的至少一种多核苷酸,该grna与该靶序列至少80%互补并且能够与该靶序列杂交;以及
[0064]
iii.编码rna指导的内切核酸酶的无效核酸酶变体的多核苷酸,该rna指导的内切核酸酶能够与该grna相互作用并与该靶序列结合,从而抑制该选择性标记的表达;
[0065]
b)用至少一种目的多核苷酸转化所述宿主细胞,并且该至少一种目的多核苷酸能够使该编码grna的至少一种多核苷酸失活;
[0066]
c)选择由该选择性标记赋予的性状;以及
[0067]
d)识别转化的宿主细胞,其中该编码grna的至少一种多核苷酸已被该至少一种目的多核苷酸灭活。
[0068]
在第一方面的方法的步骤(a)中提供的宿主细胞包含编码grna的至少一种多核苷酸。优选地,编码grna的多核苷酸的数目是至少一个,如至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少15个、至少20个、至少25个或更多个。
[0069]
在第一方面的方法的步骤(b)中用至少一种目的多核苷酸转化宿主细胞。优选地,目的多核苷酸的数目是至少一个,如至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少15个、至少20个、至少25个或更多个。
[0070]
在第一方面的优选的实施例中,该至少一种目的多核苷酸编码多肽;优选地该多肽包含酶;更优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地,该酶选自由以下组成的组:氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶和β-木糖苷酶。
[0071]
优选地,选择性标记是阳性选择标记、阴性选择标记、双向标记或条件性必需基
因。
[0072]
优选地,选择性标记是赋予对氯霉素、四环素、氨苄青霉素、大观霉素、卡那霉素或新霉素的抗性的抗生素抗性基因;更优选地,选择性标记是赋予对氯霉素的抗性的抗生素抗性基因。
[0073]
还优选地,选择性标记是选自由以下组成的组的抗生素抗性基因:cat、erm、tet、amp、spec、kana和neo;更优选地,选择性标记是cat基因。
[0074]
可替代地,并且还优选地,选择性标记是赋予对宿主细胞的营养缺陷型的基因。优选地,选择性标记是选自由以下组成的组的条件性必需基因:dal、lysa、araa、gale、antk metc、xyla、gntp、glpd、glpf、glpk、glpp、laca2、hisc、gapa和aspb基因。更优选地,选择性标记是dal基因。
[0075]
有许多众所周知的使基因失活的方法,例如,通过引入非正义突变或者移码突变来突变该基因、或者通过使开放阅读框的部分或全部缺失、或者通过操作一个或多个控制序列。
[0076]
相应地,在第一方面的优选的实施例中,该编码grna的至少一种多核苷酸通过所述多核苷酸的部分或全部缺失而失活。
[0077]
在第一方面的优选的实施例中,该编码grna的至少一种多核苷酸已在该宿主细胞基因组中被步骤(d)中的该至少一种目的多核苷酸部分或完全替换,从而使该编码grna的至少一种多核苷酸失活。
[0078]
在第二方面,本发明涉及用于将至少两种不同的目的多核苷酸插入至宿主细胞基因组的方法,该方法包括以下步骤:
[0079]
a)提供一种宿主细胞,该宿主细胞在其基因组中包含以下:
[0080]
i.编码至少两种不同的选择性标记的至少两种多核苷酸,每种选择性标记包含侧接针对rna指导的内切核酸酶的功能性pam序列的不同的靶序列;
[0081]
ii.编码至少两个grna的至少两种多核苷酸,该至少两个grna与该至少两个不同的靶序列至少80%互补并且能够与该至少两个不同的靶序列杂交;
[0082]
iii.编码rna指导的内切核酸酶的无效核酸酶变体的多核苷酸,该rna指导的内切核酸酶能够与该至少两个grna相互作用并与该至少两个不同的靶序列结合,从而抑制该两种不同的选择性标记的表达;
[0083]
b)用至少两种不同的目的多核苷酸转化所述宿主细胞,所述多核苷酸能够使该编码至少两个grna的至少两种多核苷酸失活;和
[0084]
c)选择由该至少两种不同的选择性标记赋予的性状;以及
[0085]
d)识别转化的宿主细胞,其中该编码至少两个grna的至少两种多核苷酸已被该至少两种不同的目的多核苷酸灭活。
[0086]
在第二方面的方法的步骤(a)中提供的宿主细胞包含编码至少两种不同的选择性标记的至少两种多核苷酸和编码至少两个grna的至少两种多核苷酸。优选地,编码至少两种不同的选择性标记和至少两个grna的多核苷酸的数目独立地为至少两个,如至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少15个、至少20个、至少25个或更多个。
[0087]
在第二方面的方法的步骤(b)中用至少两种不同的目的多核苷酸转化宿主细胞。
优选地,不同的目的多核苷酸的数目是至少两个,如至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少15个、至少20个、至少25个或更多个。
[0088]
在第二方面的优选的实施例中,该至少两种不同目的多核苷酸编码至少两种多肽;优选地该至少两种多肽包含至少两种酶;更优选地,该至少两种酶独立地选自由以下组成的组的:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;最优选地,该至少两种酶独立地选自由以下组成的组:氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶和β-木糖苷酶。
[0089]
优选地,该至少两种不同的选择性标记独立地是阳性选择标记、阴性选择标记、双向标记或条件性必需基因。
[0090]
优选地,该至少两种不同的选择性标记是选自由以下组成的组的抗生素抗性基因:cat、erm、tet、amp、spec、kana和neo。
[0091]
优选地,该至少两种不同的选择性标记是赋予对宿主细胞的营养缺陷型的基因。优选地,选择性标记是选自由以下组成的组的条件性必需基因:dal、lysa、araa、gale、antk metc、xyla、gntp、glpd、glpf、glpk、glpp、laca2、hisc、gapa和aspb基因。
[0092]
优选地,该至少两种不同的选择性标记独立地选自由以下组成的组:抗生素抗性基因和赋予对宿主细胞的营养缺陷型的基因;优选地,该至少两种不同的选择性标记独立地选自由以下组成的组的基因:cat、erm、tet、amp、spec、kana、neo、dal、lysa、araa、gale、antk metc、xyla、gntp、glpd、glpf、glpk、glpp、laca2、hisc、gapa和aspb。
[0093]
优选地,该编码至少两个grna的至少两种多核苷酸通过所述多核苷酸的部分或全部缺失而失活。
[0094]
优选地,该编码至少两个grna的至少两种多核苷酸已在宿主细胞基因组中被步骤(d)中的至少两种不同的目的多核苷酸部分或完全替换,从而使该编码至少两个grna的至少两种多核苷酸失活。
[0095]
多核苷酸
[0096]
本发明还涉及本发明的多核苷酸,包括目的多核苷酸以及编码选择性标记、grna和rna指导的内切核酸酶的无效核酸酶变体的多核苷酸。在一个实施例中,此类多核苷酸已经被分离。
[0097]
用于分离或克隆多核苷酸的技术是本领域已知的且包括从基因组dna或cdna或其组合进行分离。来自基因组dna的多核苷酸的克隆可以例如通过使用众所周知的聚合酶链式反应(pcr)或用以对具有共有的结构特征的克隆的dna片段进行检测的表达库抗体筛选来实现。参见例如,innis等人,1990,pcr:a guide to methods and application[pcr:方法和应用指南],academic press[学术出版社],纽约。可以使用其他核酸扩增程序如连接酶链式反应(lcr)、连接激活的转录(lat)和基于多核苷酸的扩增(nasba)。
[0098]
核酸构建体
[0099]
本发明还涉及核酸构建体,这些核酸构建体包含可操作地连接至一个或多个控制序列的本发明的多核苷酸,在与控制序列相容的条件下,该一个或多个控制序列指导编码
序列在合适的宿主细胞中的表达。
[0100]
可用许多方式操作这些多核苷酸以提供用于它们的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操纵可能是理想的或必需的。用于利用重组dna方法修饰多核苷酸的技术是本领域熟知的。
[0101]
控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明的多肽的多核苷酸的多核苷酸。启动子含有介导多肽的表达的转录控制序列。启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括变体、截短型及杂合型启动子,并且可以从编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
[0102]
用于在细菌宿主细胞中指导本发明核酸构建体的转录的适合启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌(bacillus amyloliquefaciens)α-淀粉酶基因(amyq)、地衣芽孢杆菌α-淀粉酶基因(amyl)、地衣芽孢杆菌青霉素酶基因(penp)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amym)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacb)、枯草芽孢杆菌xyla和xylb基因、苏云金芽孢杆菌cryiiia基因(agaisse和lereclus,1994,molecular microbiology[分子微生物学]13:97-107)、大肠杆菌(e.coli)lac操纵子、大肠杆菌trc启动子(egon等人,1988,gene[基因]69:301-315)、天蓝链霉菌(streptomyces coelicolor)琼脂水解酶基因(daga)、和原核β-内酰胺酶基因(villa-kamaroff等人,1978,proc.natl.acad.sci.usa[美国国家科学院院刊]75:3727-3731)、以及tac启动子(deboer等人,1983,proc.natl.acad.sci.usa[美国国家科学院院刊]80:21-25)。其他启动子描述于gilbert等人,1980,scientific american[科学美国人]242:74-94的“useful proteins from recombinant bacteria[来自重组细菌的有用蛋白质]”;和sambrook等人,1989,同上。串联启动子的实例披露于wo 99/43835中。
[0103]
用于指导本发明的核酸构建体在丝状真菌宿主细胞中的转录的合适启动子的实例是从以下的基因中获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaa)、米曲霉taka淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰孢胰蛋白酶样蛋白酶(wo 96/00787)、镶片镰孢淀粉葡糖苷酶(wo 00/56900)、镶片镰孢daria(wo 00/56900)、镶片镰孢quinn(wo00/56900)、米黑根毛霉(rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶i、里氏木霉纤维二糖水解酶ii、里氏木霉内切葡聚糖酶i、里氏木霉内切葡聚糖酶ii、里氏木霉内切葡聚糖酶iii、里氏木霉内切葡聚糖酶v、里氏木霉木聚糖酶i、里氏木霉木聚糖酶ii、里氏木霉木聚糖酶iii、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子,以及na2-tpi启动子(来自曲霉属中性α-淀粉酶基因的修饰的启动子,其中已用来自曲霉属磷酸丙糖异构酶基因的未翻译的前导序列替代未翻译的前导序列;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的经修饰的启动子,其中已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代未翻译的前导序列);及其变体、截短型、以及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
[0104]
在酵母宿主中,有用的启动子从以下的基因中获得:酿酒酵母烯醇酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh1、adh2/gap)、酿酒酵母磷酸丙糖异构酶(tpi)、酿酒酵母金属硫蛋白(cup1)、以及酿酒酵母3-磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子由romanos等人,1992,yeast[酵母]8:423-488描述。
[0105]
控制序列也可为由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接至多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子可用于本发明中。
[0106]
细菌宿主细胞的优选终止子从以下的基因获得:克劳氏芽孢杆菌碱性蛋白酶(aprh)、地衣芽孢杆菌α-淀粉酶(amyl)、和大肠杆菌核糖体rna(rrnb)。
[0107]
丝状真菌宿主细胞的优选终止子从以下的基因中获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉taka淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶i、里氏木霉纤维二糖水解酶ii、里氏木霉内切葡聚糖酶i、里氏木霉内切葡聚糖酶ii、里氏木霉内切葡聚糖酶iii、里氏木霉内切葡聚糖酶v、里氏木霉木聚糖酶i、里氏木霉木聚糖酶ii、里氏木霉木聚糖酶iii、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子。
[0108]
酵母宿主细胞的优选终止子从以下的基因中获得:酿酒酵母烯醇酶、酿酒酵母细胞色素c(cyc1)以及酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用的终止子由romanos等人(1992,同上)描述。
[0109]
控制序列还可以是启动子下游和基因的编码序列上游的mrna稳定子区,其提高该基因的表达。
[0110]
合适的mrna稳定子区的实例从以下基因中获得:苏云金芽孢杆菌cryiiia基因(wo 94/25612)和枯草芽孢杆菌sp82基因(hue等人,1995,journal of bacteriology[细菌学杂志]177:3465-3471)。
[0111]
控制序列也可以是前导序列,即对宿主细胞翻译很重要的mrna的非翻译区域。该前导序列可操作地连接至多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导序列。
[0112]
用于丝状真菌宿主细胞的优选前导序列从米曲霉taka淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
[0113]
酵母宿主细胞的合适的前导序列从以下的基因中获得:酿酒酵母烯醇酶(eno-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)。
[0114]
控制序列还可以是多腺苷酸化序列,一种可操作地连接至该多核苷酸的3
’‑
末端并且当转录时由宿主细胞识别为将多腺苷酸残基添加至所转录的mrna的信号的序列。可以使用在宿主细胞中有功能的任何多腺苷酸化序列。
[0115]
丝状真菌宿主细胞的优选多腺苷酸化序列从以下的基因中获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉taka淀粉酶和尖孢镰孢胰蛋白酶样蛋白酶。
[0116]
酵母宿主细胞的有用的多腺苷酸化序列由guo和sherman,1995,mol.cellular biol.[分子细胞生物学]15:5983-5990描述。
[0117]
控制序列还可以是编码与多肽的n-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5’端本身可以含有在翻译阅读框中天然与编码多肽的编码序列区段相连接的信号肽编码序列。可替代地,编码序列的5'端可以含有对编码序列而言外源的信号肽编码序列。在编码序列不天然地含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信
号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
[0118]
用于细菌宿主细胞的有效信号肽编码序列是从芽孢杆菌ncib 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprt、nprs、nprm)、和枯草芽孢杆菌prsa的基因获得的信号肽编码序列。其他信号肽由simonen和palva,1993,microbiological reviews[微生物评论]57:109-137描述。
[0119]
用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉taka淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶v、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
[0120]
用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因中获得。其他的有用的信号肽编码序列由romanos等人(1992,同上)描述。
[0121]
控制序列还可以是编码位于多肽的n-末端的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下的基因获得:枯草芽孢杆菌碱性蛋白酶(apre)、枯草芽孢杆菌中性蛋白酶(nprt)、嗜热毁丝霉(myceliophthora thermophila)漆酶(wo 95/33836)、米黑根毛霉天冬氨酸蛋白酶、和酿酒酵母α-因子。
[0122]
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列位于紧邻多肽的n-末端且该信号肽序列位于紧邻前肽序列的n-末端。
[0123]
还可希望的是添加调节序列,该调节序列调节宿主细胞生长相关的多核苷酸的表达。调节序列的实例是引起多核苷酸表达以响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac、和trp操纵子系统。在酵母中,可以使用adh2系统或gal1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉taka α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶i启动子以及里氏木霉纤维二糖水解酶ii启动子。调节序列的其他实例是允许基因扩增的那些序列。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,多核苷酸将与调节序列可操作地连接。
[0124]
表达载体
[0125]
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。各种核苷酸和控制序列可以连接在一起以产生重组表达载体,该重组表达载体可以包括一个或多个合宜的限制位点以允许在此类位点处插入或取代多核苷酸。可替代地,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生表达载体时,编码序列如此位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。
[0126]
重组表达载体可以是可以方便地经受重组dna程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。
[0127]
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色
体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总dna,或可以使用转座子。
[0128]
载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。
[0129]
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、赋予氨基酸或其他代谢物营养缺陷型的标记、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素、或四环素抗性)的标记。酵母宿主细胞的合适的标记包括但不限于:ade2、his3、leu2、lys2、met3、trp1和ura3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于adea(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeb(磷酸核糖酰-氨基咪唑合酶)、amds(乙酰胺酶)、argb(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niad(硝酸还原酶)、pyrg(乳清酸核苷-5'-磷酸脱羧酶)、sc(硫酸腺苷基转移酶)以及trpc(邻氨基苯甲酸合酶)连同其等同物。优选的用于曲霉细胞中的是构巢曲霉或米曲霉amds和pyrg基因以及吸水链霉菌(streptomyces hygroscopicus)bar基因。优选的用于木霉属细胞的是adea、adeb、amds、hph以及pyrg基因。
[0130]
选择性标记可以是如wo 2010/039889中所述的双选择性标记系统。在一个方面,双选择性标记是hph-tk双选择性标记系统。
[0131]
载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
[0132]
对于整合到宿主细胞基因组中,载体可以依靠多核苷酸序列或用于通过同源或非同源重组整合到基因组中的该载体的任何其他元件。可替代地,载体可以含有用于指导通过同源重组而整合入宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了提高在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,例如100至10,000个碱基对、400至10,000个碱基对、和800至10,000个碱基对,这些核酸与相对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
[0133]
为了自主复制,载体可以进一步包含复制起点,该复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
[0134]
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pbr322、puc19、pacyc177、和pacyc184的复制起点,以及允许在芽孢杆菌属中复制的质粒pub110、pe194、pta1060、和pamβ1的复制起点。
[0135]
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ars1、ars4、ars1与cen3的组合、及ars4与cen6的组合。
[0136]
在丝状真菌细胞中有用的复制起点的实例是ama1和ans1(gems等人,1991,gene[基因]98:61-67;cullen等人,1987,nucleic acids res.[核酸研究]15:9163-9175;wo 00/24883)。可根据wo 00/24883中披露的方法完成ama1基因的分离和包含该基因的质粒或载体的构建。
[0137]
可将本发明多核苷酸的多于一个拷贝插入宿主细胞以提高多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包括与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的提高的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标记基因的经扩增的拷贝以及由此该多核苷酸的另外的拷贝的细胞。
[0138]
用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如,sambrook等人,1989,同上)。
[0139]
宿主细胞
[0140]
本发明还涉及重组宿主细胞,这些重组宿主细胞包含可操作地连接至一个或多个控制序列的本发明的多核苷酸,该一个或多个控制序列指导本发明的多核苷酸的表达。将包含多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如较早前所述。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不相同的任何亲本细胞子代。
[0141]
宿主细胞可以是任何有用的细胞,例如原核细胞或真核细胞。
[0142]
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、大洋芽孢杆菌属、葡萄球菌属、链球菌属以及链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属(campylobacter)、大肠杆菌、黄杆菌属(flavobacterium)、梭杆菌属(fusobacterium)、螺杆菌属(helicobacter)、泥杆菌属(ilyobacter)、奈瑟氏菌属(neisseria)、假单胞菌属(pseudomonas)、沙门氏菌属(salmonella)、以及脲原体属(ureaplasma)。
[0143]
原核宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于:嗜碱芽孢杆菌(bacillus alkalophilus)、高地芽孢杆菌(bacillus altitudinis)、解淀粉芽孢杆菌、解淀粉芽孢杆菌植物亚种(b.amyloliquefaciens subsp.plantarum)、短芽孢杆菌(bacillus brevis)、环状芽孢杆菌(bacillus circulans)、克劳氏芽孢杆菌、凝结芽孢杆菌(bacillus coagulans)、坚强芽孢杆菌(bacillus firmus)、灿烂芽孢杆菌(bacillus lautus)、迟缓芽孢杆菌(bacillus lentus)、地衣芽孢杆菌、巨大芽孢杆菌(bacillus megaterium)、甲基营养型芽孢杆菌(bacillus methylotrophicus)、短小芽孢杆菌(bacillus pumilus)、沙福芽孢杆菌(bacillus safensis)、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。优选地,该原核宿主细胞是地衣芽孢杆菌细胞。
[0144]
该原核宿主细胞还可以是任何链球菌属细胞,包括但不限于似马链球菌(streptococcus equisimilis)、酿脓链球菌、乳房链球菌(streptococcus uberis)和马链球菌兽疫亚种(streptococcus equi subsp.zooepidemicus)细胞。
[0145]
该原核宿主细胞还可以是任何链霉菌属细胞,包括但不限于:不产色链霉菌(streptomyces achromogenes)、除虫链霉菌(streptomyces avermitilis)、天蓝链霉菌、灰色链霉菌(streptomyces griseus)、以及浅青紫链霉菌(streptomyces lividans)细胞。
[0146]
将dna引入芽孢杆菌属细胞中可以通过以下方式来实现:原生质体转化(参见例如,chang和cohen,1979,mol.gen.genet.[分子与普通遗传学]168:111-115)、感受态细胞转化(参见例如,young和spizizen,1961,j.bacteriol.[细菌学杂志]81:823-829;或dubnau和davidoff-abelson,1971,j.mol.biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如,shigekawa和dower,1988,biotechniques[生物技术]6:742-751)、或接合(参见例如,koehler和thorne,1987,j.bacteriol.[细菌学杂志]169:5271-5278)。将dna引入大肠杆菌细胞中可以通过以下方式来实现:原生质体转化(参见例如,hanahan,1983,j.mol.biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如,dower等人,1988,nucleic acids res.[核酸研究]16:6127-6145)。将dna引入链霉菌属细胞中可以通过以下方式来实现:原生质体转化、电穿孔(参见例如,gong等人,2004,folia microbiol.(praha)[叶线形微生物学(布拉格)]49:399-405)、接合(参见例如,mazodier等人,1989,j.bacteriol.[细菌学杂志]171:3583-3585)、或转导(参见例如,burke等人,2001,proc.natl.acad.sci.usa[美国国家科学院院刊]98:6289-6294)。将dna引入假单胞菌属细胞中可以通过以下方式来实现:电穿孔(参见例如,choi等人,2006,j.microbiol.methods[微生物学方法杂志]64:391-397)或接合(参见例如,pinedo和smets,2005,appl.environ.microbiol.[应用与环境微生物学]71:51-57)。将dna引入链球菌属细胞中可以通过以下方式来实现:天然感受态(natural competence)(参见例如,perry和kuramitsu,1981,infect.immun.[感染与免疫]32:1295-1297)、原生质体转化(参见例如,catt和jollick,1991,microbios[微生物学]68:189-207)、电穿孔(参见例如,buckley等人,1999,appl.environ.microbiol.[应用与环境微生物学]65:3800-3804)、或接合(参见例如,clewell,1981,microbiol.rev.[微生物学评论]45:409-436)。然而,可以使用本领域已知的将dna引入宿主细胞中的任何方法。
[0147]
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
[0148]
宿主细胞可以是真菌细胞。如本文所用的“真菌”包括子囊菌门(ascomycota)、担子菌门(basidiomycota)、壶菌门(chytridiomycota)和接合菌门(zygomycota)以及卵菌门(oomycota)和所有有丝分裂孢子真菌(如由hawksworth等人在以下文献中所定义:ainsworth and bisby’sdictionary of the fungi[安斯沃思和拜斯比真菌字典],第8版,1995,cab international[国际应用生物科学中心],university press[大学出版社],cambridge,uk[英国剑桥])。
[0149]
真菌宿主细胞可以为酵母细胞。如本文所用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌纲(fungi imperfecti)(芽孢纲(blastomycetes))的酵母。由于酵母的分类可在将来变化,出于本发明的目的,酵母应当如biology and activities of yeast[酵母的生物学与活性](skinner,passmore和davenport编辑,soc.app.bacteriol.symposium series no.9[应用细菌学学会专题论文集系列9],1980)中所描述的那样定义。
[0150]
酵母宿主细胞可以是假丝酵母属(candida)、汉逊酵母属(hansenula)、克鲁维酵母菌属(kluyveromyces)、毕赤酵母属(pichia)、酵母菌属(saccharomyces)、裂殖酵母属(schizosaccharomyces)或耶氏酵母属(yarrowia)细胞,如乳酸克鲁维酵母
eryngii)、土生梭孢壳霉(thielavia terrestris)、长域毛栓菌(trametes villosa)、变色栓菌(trametes versicolor)、哈茨木霉(trichoderma harzianum)、康宁木霉(trichoderma koningii)、长枝木霉(trichoderma longibrachiatum)、里氏木霉、或绿色木霉(trichoderma viride)细胞。
[0154]
可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中:ep 238023,yelton等人,1984,proc.natl.acad.sci.usa[美国国家科学院院刊]81:1470-1474以及christensen等人,1988,bio/technology[生物/技术]6:1419-1422。用于转化镰孢属物种的适合方法由malardier等人,1989,gene[基因]78:147-156和wo 96/00787描述。可以使用由以下文献描述的程序转化酵母:becker和guarente,在abelson,j.n.和simon,m.i.编辑,guide to yeast genetics and molecular biology[酵母遗传学与分子生物学指南],methods in enzymology[酶学方法],第194卷,第182-187页,academic press,inc.[学术出版社有限公司],纽约);ito等人,1983,j.bacteriol.[细菌学杂志]153:163;以及hinnen等人,1978,proc.natl.acad.sci.usa[美国国家科学院院刊]75:1920。
[0155]
rna指导的内切核酸酶的无效核酸酶变体
[0156]
若干个rna指导的内切核酸酶是已知的,并且随着近几年科学兴趣增加被更多发现;在makarova等人的综述(2015,an updated evolutionary classification of crispr

cas systems[crispr

cas系统的更新的进化分类],nature[自然]13:722-736)中提供。
[0157]
直肠真杆菌的rna指导的内切核酸酶的无效核酸酶变体(seq id no:2,称为mad7)可以通过破坏其内切核酸酶活性(例如,通过在负责内切核酸酶活性的催化结构域中引入功能丧失性突变)来制备。
[0158]
在一个实施例中,rna指导的内切核酸酶与seq id no:2具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该rna指导的内切核酸酶包含seq id no:2,或由其组成。
[0159]
在一个实施例中,编码rna指导的内切核酸酶的多核苷酸与seq id no:1具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该多核苷酸包含seq id no:1,或由其组成。
[0160]
在一个实施例中,该rna指导的内切核酸酶的无效核酸酶变体与seq id no:2具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且包含对应于seq id no:2的位置877的位置处的氨基酸改变。在优选的实施例中,对应于seq id no:2的位置877的位置处的氨基酸被ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、tyr或val(优选地被ala)取代。在优选的实施例中,该无效核酸酶变体包含seq id no:2的取代d877a,或由其组成。
[0161]
指导rna
[0162]
crispr基因组编辑中的grna构成了可重复编程的部分,使得系统如此通用。在天然酿脓链球菌系统中,grna实际上是两种rna多核苷酸的复合物,第一crrna含有约20个核苷酸,其确定了rna指导的内切核酸酶(称为cas9)的特异性和与crrna杂交以形成与cas9相互作用的rna复合物的tracr rna(参见jinek等人,2012,a programmable dual-rna-guided dna endonuclease in adaptive bacterial immunity[在自适应细菌免疫中的可编程双重-rna-指导的dna内切核酸酶],science[科学]337:816-821)。在本文中术语crrna和tracrrna与术语tracr配对rna和tracr rna可互换地使用。
[0163]
由于crispr-cas9系统的发现,单一多核苷酸grna已经被开发并成功应用,与天然两部分grna复合物一样有效。
[0164]
在优选的实施例中,该grna或该至少两个grna包含第一rna,该第一rna包含与该编码一个或多个选择性标记的一个或多个多核苷酸至少85%互补并且能够与该编码一个或多个选择性标记的一个或多个多核苷酸杂交的20个或更多个核苷酸(例如,21、22、23、24或25个核苷酸);优选地,该20个或更多个核苷酸(例如,21、22、23、24或25个核苷酸)与该编码一个或多个选择性标记的一个或多个多核苷酸至少90%、95%、97%、98%、99%或甚至100%互补并且能够与该编码一个或多个选择性标记的一个或多个多核苷酸杂交。
[0165]
在特别优选的实施例中,该grna或该至少两个grna包含第一rna,该第一rna包含与该编码一个或多个选择性标记的一个或多个多核苷酸至少85%互补并且能够与该编码一个或多个选择性标记的一个或多个多核苷酸杂交的21个核苷酸;优选地,该21个核苷酸与该编码一个或多个选择性标记的一个或多个多核苷酸至少90%、95%、97%、98%、99%或甚至100%互补并且能够与该编码一个或多个选择性标记的一个或多个多核苷酸杂交。
[0166]
在优选的实施例中,本发明的宿主细胞包含单一grna,该单一grna包含单个多核苷酸形式的第一和第二rna,并且其中当彼此杂交时,tracr配对序列和tracr序列形成茎环结构。
[0167]
为了使rna指导的内切核酸酶-grna复合物能够与靶序列(例如编码一个或多个选择性标记的一个或多个多核苷酸)杂交,该靶序列应侧接针对特定的rna指导的内切核酸酶功能性原型间隔子相邻基序(pam序列)。有关pam序列的综述,参见,例如,shah等人,2013,protospacer recognition motifs[原型间隔子识别基序],rna biol.[rna生物学]10(5):891

899。
[0168]
在优选的实施例中,该pam序列是tttn;更优选地,该pam序列选自由以下组成的组:ttta、tttt、tttg和tttc;最优选地,该pam序列是tttc。
[0169]
通过以下实例进一步描述本发明,这些实例不应理解为对本发明的范围进行限制。
[0170]
实例
[0171]
材料与方法
[0172]
用作缓冲液和底物的化学品是至少试剂级的商业产品。
[0173]
使用标准教科书程序,采用商业热循环仪和来自商业供应商的ready-to-go pcr beads,phusion聚合酶或red-taq聚合酶进行pcr扩增。
[0174]
lb琼脂:参见ep 0 506 780。
[0175]
lbpsg琼脂板含有lb琼脂,补充有磷酸盐(0.01m k3po4)、葡萄糖(0.4%)和淀粉
(0.5%);参见ep 0 805 867 b1。
[0176]
ty(液体肉汤)培养基:参见wo 1994/14968,第16页。
[0177]
寡核苷酸引物获得自dna技术公司(dna technology)(奥尔胡斯,丹麦)。用可商购的试剂盒和试剂,使用标准教科书程序进行dna操作(质粒和基因组dna制备、限制性酶切、纯化、连接、dna测序)。
[0178]
tss培养基:将含有10g细菌用琼脂的450ml millipore纯化的水高压灭菌20分钟。冷却至大约60℃后,添加以下成分:25ml 1m tris(ph 7.5)、1ml 2%fecl
3 6h2o、1ml 2%柠檬酸三钠二水合物、1.25ml 1m k2hpo4、1ml 10%mgso
4 7h2o、10ml 10%l-谷氨酰胺(l-谷氨酰胺仅在加热和高压灭菌期间溶解)、1.9ml 87%甘油(得到0.4%,于430ml中)。
[0179]
在一些情况下,使用来自通用电气医疗集团(ge healthcare)的templiphi试剂盒,在等温滚环扩增反应中扩增连接混合物。
[0180]
使用两步式程序(yasbin等人,1975,j.bacteriol.[细菌学杂志]121:296-304)或一步式程序将dna引入到枯草芽孢杆菌经提炼的天然感受态细胞中,其中将来自琼脂板的细胞材料再悬浮于spizisen 1培养基(12ml)(wo 2014/052630)中,在37℃以200rpm振荡大约4小时,将dna添加至400微升等分试样中,并且在选择性琼脂板上铺板之前,将这些等分试样在所希望的温度下,以150rpm振荡另外1小时。
[0181]
使用含有pls20的经修饰的枯草芽孢杆菌供体菌株pp3724,基本上如之前所描述的(ep 2 029 732b1),通过来自枯草芽孢杆菌的接合,将dna引入到地衣芽孢杆菌中,其中甲基化酶基因m.bli1904ii(us 2013/0177942)从在amye基因座处的三联启动子表达,pbc16衍生的orfβ和枯草芽孢杆菌coms基因(和卡那霉素抗性基因)从在alr基因座处的三联启动子表达(使得需要d-丙氨酸菌株),并且枯草芽孢杆菌coms基因(和cat基因)从在pel基因座处的三联启动子表达。
[0182]
枯草芽孢杆菌ja1343:ja1343是pl1801的孢子形成阴性衍生物(wo2005/042750)。部分spollac基因已经被删除,以获得孢子形成阴性表型。
[0183]
实例中描述的所有构建都是从基因艺术-赛默飞世尔科技公司(geneart-thermofisher scientific)订购的合成dna片段组装而成。如实例中所述,片段通过序列重叠延伸(soe)进行组装。
[0184]
根据先前描述的方法(美国专利号5,843,720),通过染色体整合与切割将本专利中使用的温度敏感性质粒并入地衣芽孢杆菌的基因组中。含质粒的地衣芽孢杆菌转化体在50℃在具有红霉素的lbpg选择性培养基上生长,以迫使载体整合到染色体的相同的序列处。基于其在50℃、在lbpg 红霉素选择性培养基上生长的能力来选择所希望的整合体。然后,使整合体于37℃无选择性地生长在lbpg培养基中,以允许切割整合的质粒。将细胞铺在lbpg板上并且针对红霉素-敏感性进行筛选。检查敏感性克隆是否正确整合了所需的构建体。
[0185]
菌株
[0186]
pp3724:含有pls20的枯草芽孢杆菌菌株,其中甲基化酶基因m.bli1904ii(us 2013/0177942)从在amye基因座处的三联启动子表达,pbc16衍生的orfβ和枯草芽孢杆菌coms基因(和卡那霉素抗性基因)从在alr基因座处的三联启动子表达(使得需要d-丙氨酸菌株),并且枯草芽孢杆菌coms基因(和cat基因)从在pel基因座处的三联启动子表达。
[0187]
ja1622:这种菌株是具有破坏的spoiiac基因(sigf)的枯草芽孢杆菌168衍生物ja578,其描述于wo 2002/00907中。该基因型是:amye::repf(pe194)、spoiiac。
[0188]
sj1904:这种菌株是描述于wo 2008/066931中的地衣芽孢杆菌菌株。编码碱性蛋白酶的基因(aprl)是失活的。
[0189]
pp3811:地衣芽孢杆菌菌株sj1904的衍生物,其中碱性蛋白酶基因aprl、金属蛋白酶mprl和spoiiac基因是失活的。
[0190]
pp3811-mad7d:这种菌株是地衣芽孢杆菌菌株pp3811,其中mad7d基因在bglc基因座处插入。最终插入物具有从wo 1993/010249中描述的pamyl启动子变体转录的mad7d基因。整合后染色体上的最终序列在图1和seq id no:3中描述。
[0191]
pp3811-mad7gdna1:这种菌株是地衣芽孢杆菌菌株pp3811-mad7d,其中将dsred基因和转录针对地衣芽孢杆菌中catl基因的grna(cat)的gdna(cat)插入至gnt基因座。在gdna的更下游,定位了来自噬菌体tp901-1的attb位点(wo 2006/042548)。dsred基因从wo 1999/043835中描述的三联启动子表达。整合后染色体上的最终序列在图2和seq id no:4中描述。
[0192]
pp3811-mad7gdna2:这种菌株是地衣芽孢杆菌菌株pp3811-mad7gdna1,其中将dsred基因和转录针对地衣芽孢杆菌中catl基因的grna(cat)的gdna(cat)插入至amyl基因座。在gdna的更下游,定位了attb位点(参见上文)。整合后染色体上的最终序列在图3和seq id no:5中描述。
[0193]
pp3811-mad7gdna3:这种菌株是地衣芽孢杆菌pp3811-mad7gdna2,其中将dsred基因和转录针对地衣芽孢杆菌中catl基因的grna(cat)的gdna(cat)插入至laca2基因座。在gdna的更下游,定位了attb位点(参见上文)。整合后染色体上的最终序列在图4和seq id no:6中描述。
[0194]
mol7800-amyl3:这是地衣芽孢杆菌菌株pp3811-mad7gdna3,其中dsred基因和gdna(cat)的三个拷贝被编码地衣芽孢杆菌α-淀粉酶的amyl基因的三个拷贝替换。图5-7和seq id no:7-9中描述了替换后染色体三个基因座的最终序列。
[0195]
pp3724-pppamyl-attp:这种菌株是含有质粒pppamyl-attp的接合供体菌株pp3724。
[0196]
质粒
[0197]
pc194:从金黄色葡萄球菌中分离的质粒(horinouchi和weisblum,1982)。
[0198]
pe194:从金黄色葡萄球菌中分离的质粒(horinouchi和weisblum,1982)。
[0199]
pub110:从金黄色葡萄球菌中分离的质粒(mckenzie等人,1986)
[0200]
pppamyl-attp:在实例6中为本发明构建的质粒。该质粒通过合成序列组装制备,以产生载体,该载体含有:(1)编码地衣芽孢杆菌α-淀粉酶的amyl基因,其前接用于整合的cry3a稳定子(2)wo 2006/042548中描述的来自tp901-1的attp和整合酶(int)。该整合酶促进了地衣芽孢杆菌宿主质粒上attp位点和染色体上attb位点的整合。
[0201]
实例1.将mad7d染色体整合到地衣芽孢杆菌的bglc基因座中
[0202]
将表达盒插入bglc基因座处,其中编码seq id no:2的无效核酸酶变体的mad7d基因(包含d877a取代的mad7d)由wo 1993/010249中描述的amyl启动子(p4199)表达。
[0203]
用于整合的dna作为合成dna订购(基因艺术-赛默飞世尔科技公司),并克隆到如
先前在wo 2006/042548中描述的整合载体中。在图1中显示了bglc基因座的最终图谱。将该基因座的核苷酸序列作为seq id no:3提供。
[0204]
用于pcr扩增的条件如下:使用phusion热启动dna聚合酶系统(赛默飞世尔科技公司(thermo fisher scientific))通过pcr扩增对应的dna片段。pcr扩增反应混合物含有1ul(约0,1ug)的模板dna、2ul的正义引物(20pmol/ul)、2ul的反义引物(20pmol/ul)、10ul的5x pcr缓冲液(具有7,5mm mgcl2)、8ul的dntp混合物(各1.25mm)、37ul水和0.5ul(2u/ul)dna聚合酶混合物。使用热循环仪来扩增片段。根据制造商的说明书,使用qiagen qiaquick凝胶提取试剂盒(凯杰公司(qiagen,inc.),加利福尼亚州巴伦西亚(valencia,ca)),用1x tbe缓冲液从1.2%琼脂糖凝胶中纯化pcr产物。
[0205]
将pcr产物用于随后的pcr反应中,使用剪接重叠pcr(soe)使用phusion热启动dna聚合酶系统(赛默科技公司(thermo scientific))产生单个质粒。pcr扩增反应混合物含有两种凝胶纯化的pcr产物和合成片段各50ng,并用热循环仪组装并扩增质粒。将所得的soe产物直接用于枯草芽孢杆菌宿主ja1622的转化以建立质粒。将质粒通过感受态转移到供体菌株pp3724中。
[0206]
将受体地衣芽孢杆菌菌株用上述质粒转化,并根据上述的程序整合和切割。通过该程序,染色体上bglc基因座被通过质粒递送的克隆的构建体替换(图1)。质粒在50℃限制性温度下丢失。最终菌株构建体包含从染色体上的bglc基因座表达的mad7d基因并命名为pp3811-mad7d。
[0207]
实例2.将dsred-ma7gdna(cat)染色体整合到地衣芽孢杆菌的gnt基因座中
[0208]
将表达盒插入gnt基因座处,其中编码红色荧光蛋白的dsred标记基因从由wo 2005/098016中描述的p3启动子表达。在dsred标记基因的下游,mad7gdna序列从解淀粉芽孢杆菌的amyq启动子表达。gdna转录针对cat标记基因的grna。cat标记基因编码地衣芽孢杆菌的乙酰转移酶,该乙酰转移酶赋予对氯霉素的抗性。已在wo 2007/138049中描述了将dna染色体整合到地衣芽孢杆菌中。用于整合的dna作为合成dna订购(基因艺术-赛默飞世尔科技公司),通过soe-pcr组装并克隆到如先前描述的基于pe194的温度敏感性整合载体中。在图2中显示了gnt基因座的最终图谱。将该基因座的核苷酸序列作为seq id no:4提供。
[0209]
pcr产物如实例1中所述制备并用于随后的pcr反应中,以使用剪接重叠pcr(soe)使用phusion热启动dna聚合酶系统(赛默科技公司)产生单个质粒。pcr扩增反应混合物含有两种凝胶纯化的pcr产物和合成片段各50ng,并用热循环仪组装并扩增整合质粒。将所得的soe产物直接用于枯草芽孢杆菌宿主ja1622的转化以建立整合质粒。将质粒转移到供体菌株pp3724中并用于接合。该质粒用于根据实例1中所述的程序在地衣芽孢杆菌的gnt基因座处插入dsred基因和mad7gdna(cat)。最终菌株命名为pp3811-mad7gdna1。
[0210]
实例3.将dsred-gdna(cat)染色体整合到地衣芽孢杆菌的amyl基因座中
[0211]
在amyl基因座处插入与实例2中所述的表达盒相同的表达盒。用于整合的dna作为合成dna订购(基因艺术-赛默飞世尔科技公司),通过soe-pcr组装并克隆到如先前在wo 2006/042548中描述的基于pe194的温度敏感性整合载体中。在图3中显示了amyl基因座的最终图谱。将该基因座的核苷酸序列作为seq id no:5提供。
[0212]
pcr产物如实例1中所述制备并用于随后的pcr反应中,以使用剪接重叠pcr(soe)
使用phusion热启动dna聚合酶系统(赛默科技公司)产生单个质粒。pcr扩增反应混合物含有两种凝胶纯化的pcr产物和合成片段各50ng,并用热循环仪组装并扩增整合质粒。将所得的soe产物直接用于枯草芽孢杆菌宿主ja1622的转化以建立整合质粒。将该质粒用于如以上在实例2中所述的在地衣芽孢杆菌菌株pp3811-mad7gdna1的amyl基因座处插入dsred基因和mad7gdna(cat)。最终菌株命名为pp3811-mad7gdna2。该菌株具有编码针对地衣芽孢杆菌宿主中的catl基因的grna的mad7gdna(cat)的两个拷贝。
[0213]
实例4.将dsred-mad7gdna(cat)染色体整合到地衣芽孢杆菌的laca2基因座中
[0214]
在laca2基因座处插入与实例2和3中所述的表达盒几乎相同的表达盒。唯一的区别是dsred基因的可替代的合成序列(dsredsyn)。该基因变体仍编码相同的荧光蛋白。用于整合的dna作为合成dna订购(基因艺术-赛默飞世尔科技公司),并克隆到如在wo 2006/042548中描述的整合载体中。在图4中显示了laca2基因座的最终图谱。将该基因座的核苷酸序列作为seq id no:6提供。
[0215]
pcr产物如实例1中所述制备并用于随后的pcr反应中,以使用剪接重叠pcr(soe)使用phusion热启动dna聚合酶系统(赛默科技公司)产生单个质粒。pcr扩增反应混合物含有两种凝胶纯化的pcr产物和合成片段各50ng,并用热循环仪组装并扩增整合质粒。将所得的soe产物直接用于枯草芽孢杆菌宿主ja1622的转化以建立整合质粒。将该质粒用于如以上在实例3中所述的在地衣芽孢杆菌pp3811-mad7gdna2的laca2基因座处插入dsred基因(dsredsyn)和mad7gdna(cat)。最终菌株命名为pp3811-mad7gdna3并具有dsred基因的三个拷贝和mad7gdna(cat)盒的三个拷贝以及从bglc基因座表达的mad7d(图8)。
[0216]
实例5.质粒pppamyl-attp的构建
[0217]
质粒pppamyl-attp由从基因艺术公司(geneart)订购的dna序列组装。在图9中描绘了完整的质粒和其标注。将该质粒的核苷酸序列作为seq id no:10提供。
[0218]
用于pcr扩增的条件如实例1中所述。将纯化的pcr产物用于随后的pcr反应中,使用剪接重叠pcr(soe)使用phusion热启动dna聚合酶系统(赛默科技公司)产生单个质粒。pcr扩增反应混合物含有六种凝胶纯化的pcr产物各50ng,并用热循环仪组装并扩增9550bp的质粒(图9)。将所得的soe产物直接用于转化枯草芽孢杆菌宿主ja1622以建立质粒pppamyl-attp。该质粒在实例6中用于转化实例4中描述的宿主菌株pp3811-mad7gdna3。
[0219]
该质粒编码来自地衣芽孢杆菌的淀粉酶基因amyl,其侧接在cry3a稳定子区域和attp噬菌体整合位点的上游。
[0220]
amyl整合入染色体将发生在存在于宿主菌株pp3811-mad7gdna3中和质粒上的cry3a稳定子区域以及分别在染色体和质粒上的attb和attp位点之间。
[0221]
实例6.选择淀粉酶基因amyl的三拷贝整合
[0222]
将实例5中所述的质粒pppamyl-attp转化到地衣芽孢杆菌菌株pp3811-mad7gdna3中,用于对三个不同基因座(gnt:dsred-mad7gdna(cat)、amyl:dsred-mad7gdna(cat)和laca2:dsred-mad7gdna(cat))中的amyl表达盒的分步整合进行选择。在该步骤中,gdna(cat)和dsred基因被amyl表达盒替换。通过在染色体上gdna基因座上的侧翼区和引入的质粒之间的重组介导替换;分别地,上游通过存在于宿主菌株pp3811-mad7gdna3的染色体上和质粒pppamyl-attp上相同的cry3a稳定子区域,并且下游通过染色体和质粒上的attb和attp位点。
[0223]
质粒转化pp3811-mad7gdna3后,将细胞在34℃下用1ug/ml红霉素在lbpg板上铺板三天,以允许在许可温度下在染色体和质粒之间发生扩增和重组事件。将菌落在200ul ty中洗涤,并且将50ul转移到5ml ty液体培养物中,并在34℃下以200rpm孵育24小时。在lbpg板上用6ug/ml氯霉素(cam)对培养物进行划线,以选择其中所有三个gdna(cat)基因座都被amyl表达盒替换的菌株。
[0224]
对来自cam板的大约十个不同菌落进行重新划线,并测试所有三个基因座中的amyl整合。所有菌落均在琼脂糖凝胶上显示出预期的条带。
[0225]
图5-7显示了替换后的三个基因座,并且它们的dna序列分别作为seq id no:7、seq id no:8和seq id no:9提供。菌株命名为mol7800-amyl3。
[0226]
氯霉素抗性克隆具有淀粉酶活性,这通过在补充有淀粉的lbpg板上进行铺板显示。所有菌落均在补充有淀粉的板上显示出明显的晕圈,这证实了淀粉酶的表达。
[0227]
该实例表明,本发明可以非常有效地用作一种工具,该工具用于对地衣芽孢杆菌染色体上表达盒的至少三个拷贝的整合进行选择。
[0228]
实例7.使用flp/frt技术以选择dna的三拷贝整合的宿主细胞构建。
[0229]
pct/ep2018/084463的实例7和8描述对目的基因的三个拷贝的基因组整合进行选择的宿主菌株的构建和利用。本发明披露了对目的基因的整合进行选择的替代和改善的系统。在此,构建含有强启动子(三联启动子,p3)的宿主菌株,该强启动子读入由frt-f位点、mad7d以及编码靶向glpd基因的grna的gdna、任选地标记基因、和frt-f3位点组成的片段。mad7d与glpd定向grna一起表达确保glpd基因的抑制,这导致宿主菌株不能在含有甘油为唯一碳源基本培养基上生长。参与糖代谢的其它基因可以用作靶标,其中在wo 2003/055967中披露了一些实例。
[0230]
随后使用flp/frt系统(wo 2018/077796)用目标基因替换mad7d-grna_glpd标记片段,这导致菌株现在能够在含有甘油作为唯一碳源的基本培养基生长,并且可以以这种方式对基因替换进行选择。
[0231]
如果该mad7d-grna_glpd片段已经插入到一个以上的染色体位点,则选择在含有甘油的基本培养基中生长将产生在所有此类位点发生目的基因整合的菌株。
[0232]
作为构建中的第一步,从来自基因艺术公司的大肠杆菌质粒上提供由frt-f位点、编码前接核糖体结合位点的mad7d片段、编码绿色荧光蛋白(gfp)的片段、pamyqsc启动子和mad7支架和靶向amyl启动子pamyl4199变体的gdna、以及frt-f3位点组成的dna序列作为全基因合成,并将该质粒引入至并保存至大肠杆菌top10细胞中作为sj14411(大肠杆菌top10/psj14411)。将质粒psj14411的全dna序列在此作为seq id no:11提供。
[0233]
在第二步中,从来自基因艺术公司的大肠杆菌质粒上获得的对应于gfp基因部分、pamyqsc启动子和mad7支架的三个dna序列以及靶向三个glpd基因片段的每一个的gdna、随后是frt-f3位点作为全基因合成。将这些质粒引入并保存至大肠杆菌top10细胞中,作为sj14412(大肠杆菌top10/psj14412)、sj14413(大肠杆菌top10/psj14413)以及sj14414(大肠杆菌top10/psj14414)。
[0234]
分别将质粒psj14412、psj14413和psj14414的全dna序列在此作为seq id no:12、seq id no:13和seq id no:14提供。
[0235]
在第三步中,为了获得用于构建对flp/frt介导的染色体插入进行选择的宿主菌
株的最终整合构建体,进行三个不同的3片段连接:
[0236]
用sbfi和mlui酶切psj13461(描述于wo 2018/077796的实例19中),并且将5785bp的sbfi-mlui片段凝胶纯化。
[0237]
用mlui和mfei酶切psj14411,并将4465bp的mlui-mfei片段凝胶纯化。
[0238]
用mfei和sbfi酶切psj14412、psj14413和psj14414中的每一个,并从中纯化出373bp的mfei-sbfi片段。
[0239]
将psj14412、psj14413和psj14414片段中的每一个与psj13461和psj14411片段合并、连接,并在引入枯草芽孢杆菌pp3724感受态细胞之前用templiphi处理连接混合物。将来自每个转化的所得转化体分别合并,并将这些转化子库保存为sj14438(pp3724/psj14438)、sj14439(pp3724/psj14439)和sj14440(pp3724/psj14440)。
[0240]
分别将质粒psj14438、psj14439和psj14440的全dna序列在此作为seq id no:15、seq id no:16和seq id no:17提供。
[0241]
在第四步中,将用于构建对基因整合进行选择的宿主菌株的最终整合构建体引入单拷贝flp/frt宿主菌株sj13872(其具有编码frt-f和frt-f3位点之间的黄色荧光蛋白(yfp)的基因),或引入将具有与红色荧光蛋白(rfp)的编码基因交换的yfp编码基因的衍生物中。为了实现该颜色基因交换,构建了表达翻转酶和并携带片段frt-f-rfp-frt-f3的温度敏感载体,将其引入枯草芽孢杆菌pp3724中并保存为sj14491(psj14491/pp3724),用于随后与地衣芽孢杆菌sj13872接合。在此将psj14491的全dna序列作为seq id no:18提供。
[0242]
通过接合将psj14491引入sj13872,在含有红霉素(2微克/ml)的lbpsg琼脂平板上选择转移结合子。将这些转移结合子进一步在不含红霉素的平板上铺板成单菌落,那些似乎已丢失质粒(对红霉素敏感)并显示红色荧光(显示rfp替换了yfp)的转移结合子被保留下来。
[0243]
在此使用的单拷贝flp/frt宿主菌株sj13872,从sj1904(wo2008/066931中描述的地衣芽孢杆菌菌株)开发并在染色体laca2基因座处含有p3启动子,该启动子读入由frt-f、编码yfp的基因和frt-f3组成的片段。关于glpd基因座,菌株sj13872是野生型,但含有许多本技术中所描述其用途无关其它修饰。
[0244]
该三种不同的质粒psj14438、psj14439和psj14440(携带编码靶向不同地衣芽孢杆菌glpd基因片段的grna的三种单独的gdna)通过接合引入sj13872或引入其红色衍生物。在30℃下,在含有红霉素(2微克/ml)的lbpsg琼脂平板上选择转移结合子。将这些转移结合子进一步在不含红霉素平板上铺板成单菌落,那些似乎已丢失质粒(对红霉素敏感)并显示绿色荧光的转移结合子被保留下来。
[0245]
这些转移结合子菌落进一步铺板于含有甘油作为唯一碳源的tss基本培养基平板上,以验证它们不能在此类平板上(由于mad7d和grna_glpd的表达,其抑制glpd表达)生长。
[0246]
然而,通过mad7d grna_glpd构建体的整合,衍生自sj13872或其红色衍生物的菌株在与供体菌株的接合中被用作受体,这些供体菌株在也表达翻转酶的载体上的frt-f和frt-f3位点之间携带例如,像amyl基因的目的基因,可以如之前在含有红霉素(2微克/ml)的lbpsg琼脂平板上选择转移结合子,并且其中mad7d grna_glpd片段被目的基因(例如,amyl)替换的菌株可以通过它们在含有甘油作为唯一碳源的tss基本培养基上/中生长的能力直接选择。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献