一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

使用无催化活性RNA指导的内切核酸酶的CRISPR-AID的制作方法

2022-12-03 02:42:07 来源:中国专利 TAG:

使用无催化活性rna指导的内切核酸酶的crispr-aid
1.序列表的引用
2.本技术含有计算机可读形式的序列表,将其通过引用并入本文。
技术领域
3.本发明涉及核碱基编辑复合物,以及编码所述核碱基编辑复合物的多核苷酸、包含所述多核苷酸的核酸构建体和表达载体、包含所述核碱基编辑复合物和/或多核苷酸的宿主细胞、以及制备和使用所述核碱基编辑复合物的方法,其中所述核碱基编辑复合物包含a)与seq id no:126或seq id no:155具有至少60%序列同一性的无催化活性rna指导的内切核酸酶以及b)核碱基编辑结构域。


背景技术:

4.将单核苷酸多态性(snp,也称为单核苷酸变异,snv)引入基因组是特定生物体进化的关键。工业上重要的微生物通常在实验室中被诱变以获得新的或增强的功能,例如压力耐受性、目的分子的更高表达潜力等。然而,现有的snp引入方法具有明显的局限性。通过紫外线照射或化学暴露获得的随机诱变提供了高度多样化的基因型,但对有益snp进行鉴定是劳动密集型的。通过crispr技术获得的定点诱变允许引入靶标特异性snp,因此看起来更有前景。简而言之,使用具有与目的基因座中的dna序列互补的原型间隔区的指导rna(grna)将rna指导的内切核酸酶(例如cas9或cpf1)引导至该目的基因座。rna指导的内切核酸酶在靶基因座处结合并切割dna链,导致双链断裂(dsb),细胞将尝试使用非同源末端连接(nhej)或类似机制对该断裂进行修复。然而,如果为细胞提供了编码所需点突变的修复dna,并且侧翼为与dsb上游和下游区域同源的序列,则同源定向修复(hdr)将导致在目的基因座中掺入含有所需突变的修复dna。尽管应用广泛,但这种基于crispr的方法不适合大规模诱变研究,因为每一个单个靶基因座都需要修复dna。此外,dsb的引入与细胞毒性有关。因此,一种以可靶向的方式产生高度多样化的突变体并易于识别所产生的snp的方法将是非常有利的。
5.可以通过使用所称的crispr-aid技术(komor等人,nature[自然],卷533,第420-424页,2016;nishida等人,science[自然],卷353,aaf8729,2016)来规避对修复dna的需求。本文中,将无催化活性rna指导的内切核酸酶连接到核碱基编辑结构域以形成核碱基编辑复合物。核碱基编辑结构域要么是胞嘧啶碱基编辑器(cbe),可将c-g碱基对转换为t-a碱基对,要么是腺嘌呤碱基编辑器(abe),可将a-t碱基对转换为g-c碱基对(rees和liu,nat.rev.genetics[遗传学自然评论],卷19,第770-788页,2018)。通过grna原型间隔子与其互补dna序列之间的碱基配对将无催化活性rna指导的内切核酸酶与靶基因座结合,导致所称的“r环”中的一小区段单链dna发生置换,其中将核碱基暴露于核碱基编辑结构域的脱氨基作用,导致过渡突变和snp生成。重要的是,由于将核碱基编辑复合物调整为仅在单链dna上操作,因此不会出现dsb,并且避免了相关的细胞毒性副作用。因此,crispr-aid是以可扩展和可靶向的方式将snp引入目的基因组的有用方法。
[0006]
cas9和cpf1的无催化活性变体已广泛应用于crispr-aid技术(nishida等人,见上文;li等人,nat.biotech.[自然生物技术],卷36,第324-327页,2018)。然而,crispr-aid系统的进一步发展仍然需要改变或改进各种属性,例如编辑效率或编辑窗口。
[0007]
wo 2015/133554描述了利用cas9d作为无催化活性rna指导的内切核酸酶以及活化诱导胞苷脱氨酶(aid)作为核碱基编辑结构域的crispr-aid。


技术实现要素:

[0008]
本发明的诸位发明人已经研究了分离自直肠真杆菌的rna指导的内切核酸酶的无催化活性版本(称为mad7)在crispr-aid碱基编辑中的用途。mad7与分离自氨基酸球菌属物种的cpf1的序列同一性只有31%,因此在结构上与其他已知的rna指导的内切核酸酶非常不同。然而,如本文披露的实例所示,利用mad7d-aid的crispr-aid碱基编辑在微生物宿主细胞中提供了与cas9d-aid相当的编辑效率,该微生物宿主细胞用含有mad7d-aid和grna表达盒的单个质粒转化,以稳定表达mad7d-aid组分。此外,观察到mad7d-aid的编辑窗口比cas9d-aid更宽,说明基于mad7d的crispr-aid更适合生成同一靶基因座的多个不同snp,这对于生成snp文库和筛选目的非常有利。
[0009]
在第一方面,本发明涉及核碱基编辑复合物,该核碱基编辑复合物包含以下、基本上由以下组成或由以下组成:
[0010]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0011]
b)核碱基编辑结构域。
[0012]
在第二方面中,本发明涉及编码第一方面所述的核碱基编辑复合物的多核苷酸。
[0013]
在第三方面中,本发明涉及包含第二方面所述的多核苷酸的核酸构建体。
[0014]
在第四方面,本发明涉及包含第二方面所述的多核苷酸和/或第三方面所述的核酸构建体的表达载体。
[0015]
在第五方面,本发明涉及包含第一方面所述的核碱基编辑复合物、第二方面所述的多核苷酸、第三方面所述的核酸构建体和/或第四方面所述的表达载体的宿主细胞。
[0016]
在第六方面,本发明涉及用于修饰dna靶序列中的至少一个核碱基的方法,该方法包括:
[0017]
a)提供第一方面所述的核碱基编辑复合物,其与与该dna靶序列互补并能够与该dna靶序列杂交的grna复合;以及
[0018]
b)使该核碱基编辑复合物与该dna靶序列接触;
[0019]
其中该dna靶序列中的至少一个核碱基被转化为不同的核碱基而不在目的dna序列中引入双链断裂。
附图说明
[0020]
图1示出了crispr-aid作用模式的示意图。
[0021]
图2示出了质粒phite277的示意图。
[0022]
图3示出了质粒ptna193的示意图。
[0023]
图4示出了dcas9-aid产生的白色孢子突变体的基因组序列。
[0024]
图5示出了质粒ptna235的示意图。
[0025]
图6示出了dcas9-aid-ugi产生的白色孢子突变体的基因组序列。
[0026]
图7示出了质粒ptna287的示意图。
[0027]
图8示出了mad7d-aid-ugi产生的白色孢子突变体的基因组序列。
[0028]
图9示出了34℃孵育产生的白色孢子突变体的基因组序列。
[0029]
图10示出了质粒pat3530的示意图。
[0030]
图11示出了质粒pmdt452的示意图。
[0031]
图12示出了质粒pmdt454/pmdt455的示意图。
[0032]
图13示出了菌株mdt545的dsred表达盒的示意图。
[0033]
定义
[0034]
根据此详细描述,以下定义适用。注意,单数形式“一种/个(a/an)”以及“该/这些(the)”包括复数个指示物,除非上下文中另外明确指明。
[0035]
本文提及“约”值或参数包括针对该值或参数本身的方面。例如,提及“约x”的描述包括方面“x”。
[0036]
除非另外定义或由上下文明确指示,否则本文所用的全部技术与科学术语具有如本发明所属领域的普通技术人员通常理解的相同含义。
[0037]
无催化活性的:术语“无催化活性”用于描述内切核酸酶活性被破坏的rna指导的内切核酸酶。无催化活性的内切核酸酶可以结合靶标dna序列中的断裂但不会在其中引入任何断裂。术语“无催化活性”、“核酸酶无效”和“死”(缩写为“d”,例如,mad7d)在本文中可互换使用。
[0038]
cdna:术语“cdna”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mrna分子进行反转录而制备的dna分子。cdna缺乏可以存在于对应基因组dna中的内含子序列。初始的初级rna转录物是mrna的前体,其要通过一系列的步骤(包括剪接)进行加工,然后呈现为成熟的剪接的mrna。
[0039]
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由开放阅读框确定,该开放阅读框以起始密码子(例如atg、gtg或ttg)开始并且以终止密码子(例如taa、tag或tga)结束。编码序列可为基因组dna、cdna、合成dna或其组合。
[0040]
控制序列:术语“控制序列”意指对于表达编码本发明的多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码多肽的多核苷酸而言可以是天然的(即,来自相同基因)或异源的(即,来自不同基因),或者相对于彼此是天然的或异源的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。最少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制位点的目的,这些控制序列可以提供有多个接头。
[0041]
表达:术语“表达”意指涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。
[0042]
表达载体:术语“表达载体”意指直链或环状dna分子,其包含编码多肽的多核苷酸
并且可操作地连接至提供用于其表达的控制序列。
[0043]
融合多肽:术语“融合多肽”是其中一种多肽在本发明多肽的n-末端或c-末端融合的多肽。通过将编码另一种多肽的多核苷酸与本发明的多核苷酸融合来产生融合多肽。用于产生融合多肽的技术是本领域已知的,并且包括连接编码多肽的编码序列使得它们符合读框,而且融合多肽的表达处于一个或多个相同的启动子和终止子的控制之下。还可以使用内含肽技术构建融合多肽,其中在翻译后产生融合多肽(cooper等人,1993,embo j.[欧洲分子生物学学会杂志]12:2575-2583;dawson等人,1994,science[科学]266:776-779)。融合多肽可进一步包含两个多肽之间的切割位点。在融合蛋白分泌之时,位点被切割,从而释放出这两种多肽。切割位点的实例包括但不限于在以下文献中披露的位点:martin等人,2003,j.ind.microbiol.biotechnol.[工业微生物生物技术杂志]3:568-576;svetina等人,2000,j.biotechnol.[生物技术杂志]76:245-251;rasmussen-wilson等人,1997,appl.environ.microbiol.[应用与环境微生物学]63:3488-3493;ward等人,1995,biotechnology[生物技术]13:498-503;和contreras等人,1991,biotechnology[生物技术]9:378-381;eaton等人,1986,biochemistry[生物化学]25:505-512;collins-racie等人,1995,biotechnology[生物技术]13:982-987;carter等人,1989,proteins:structure,function,and genetics[蛋白质:结构、功能以及遗传学]6:240-248;以及stevens,2003,drug discovery world[药物发现世界]4:35-48。
[0044]
异源:对于宿主细胞,术语“异源的”意指多肽或核酸不是天然存在于宿主细胞中。对于多肽或核酸,术语“异源的”意指控制序列(例如多肽或核酸的启动子或结构域)不与该多肽或核酸天然地相关联,即,控制序列是来自编码seq id no:126的成熟多肽的基因以外的基因。
[0045]
宿主细胞:术语“宿主细胞”意指其中引入了包含本发明多核苷酸的核酸构建体或表达载体的任何微生物或植物细胞。引入方法包括但不限于原生质体融合、转染、转化、电穿孔、接合和转导。在一些实施例中,宿主细胞是分离的重组宿主细胞,其与至少一种其他组分(包括但不限于蛋白质、核酸、细胞等)部分或完全分离。
[0046]
分离的:术语“分离的”是指多肽、核酸、细胞或其他特定材料或组分,其与在自然界中发现的与其天然相关联的至少一种其他材料或组分(包括但不限于,例如,其他蛋白质,核酸,细胞等)分离。分离的多肽包括但不限于含有分泌的多肽的培养液。
[0047]
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以原本不存在于自然界中的方式被修饰成含有核酸的区段,或者是合成的,该核酸分子包含一个或多个控制序列。
[0048]
可操作地连接:术语“可操作地连接”意指如下构型,在该构型中,控制序列被放置在相对于多核苷酸的编码序列适当的位置处,使得该控制序列指导该编码序列的表达。
[0049]
重组:当用于提及细胞、核酸、蛋白质或载体时,术语“重组”意指已经从其天然状态经修饰。因此,例如,重组细胞表达在天然(非重组)形式的细胞内未发现的基因,或与在自然界中发现的相比,以不同水平表达或在不同条件下表达天然基因。重组核酸与天然序列的差异在于一个或多个核苷酸和/或与异源序列(例如,表达载体中的异源启动子)可操作地连接。重组蛋白与天然序列的差异可以在于一个或多个氨基酸和/或与异源序列融合。包含编码多肽的核酸的载体是重组载体。术语“重组”与“遗传修饰的”和“转基因的”同义。
[0050]
rna指导的内切核酸酶:术语“rna指导的内切核酸酶”意指具有内切核酸酶活性的多肽,其中该内切核酸酶活性受到一个或多个grna的控制,该grna与rna指导的内切核酸酶形成复合物并且将内切核酸酶活性引导至与该一个或多个grna的一个或多个原型间隔区互补并且能够与该间隔区杂交的靶dna序列。
[0051]
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的相关性通过参数“序列同一性”来描述。
[0052]
出于本发明的目的,使用尼德曼-翁施算法(needleman-wunsch algorithm)(needleman和wunsch,1970,j.mol.biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性作为“最长同一性”的输出,该算法如emboss软件包(emboss:the european molecular biology open software suite[欧洲分子生物学开放软件套件],rice等人,2000,trends genet.[遗传学趋势]16:276-277,优选6.6.0版本或其后的版本)的尼德尔程序所实施的。使用的参数是空位开放罚分10、空位延伸罚分0.5以及eblosum62(blosum62的emboss版本)取代矩阵。为了使尼德尔程序报告最长同一性,必须在命令行中指定非简化(nobrief)选项。尼德尔标记的“最长同一性”的输出计算如下:
[0053]
(相同的残基x100)/(比对长度-比对中的空位总数)
[0054]
出于本发明的目的,使用尼德曼-翁施算法(needleman和wunsch,1970,同上)来确定两个多核苷酸序列之间的序列同一性作为“最长同一性”的输出,该算法如emboss软件包(emboss:the european molecular biology open software suite[欧洲分子生物学开放软件套件],rice等人,2000,同上)(优选6.6.0版本或更新版本)的尼德尔程序所实施的。使用的参数是空位开放罚分10、空位延伸罚分0.5以及ednafull(ncbi nuc4.4的emboss版本)取代矩阵。为了使尼德尔程序报告最长同一性,必须在命令行中指定非简化选项。尼德尔标记的“最长同一性”的输出计算如下:
[0055]
(相同的脱氧核糖核苷酸x100)/(比对长度-比对中的空位总数)
[0056]
变体命名惯例
[0057]
出于本发明的目的,使用在seq id no:126中披露的多肽来确定另一种rna指导的内切核酸酶中的相应的氨基酸位置。将另一种rna指导的内切核酸酶的氨基酸序列与seq id no:126中披露的多肽进行比对,并且基于比对,可以使用如在emboss包(emboss:the european molecular biology open software suite[emboss:欧洲分子生物学开放软件套件],rice等人,2000,trends genet.[遗传学趋势]16:276-277)(优选5.0.0版本或更新版本)的尼德尔程序中所实施的尼德曼-翁施算法(needleman和wunsch,1970,j.mol.biol.[分子生物学杂志]48:443-453)来确定与seq id no:126中披露的多肽中的任何氨基酸残基相对应的氨基酸位置编号。所使用的参数是空位开放罚分10、空位延伸罚分0.5、和eblosum62(blosum62的emboss版本)取代矩阵。
[0058]
在描述本发明的变体时,为了便于参考,以下描述的命名法经过了调整。采用了已接受的iupac单字母或三字母的氨基酸缩写。
[0059]
取代:对于氨基酸取代,使用以下命名法:原始氨基酸、位置、取代的氨基酸。相应地,将在位置226处的苏氨酸被丙氨酸取代表示为“thr226ala”或“t226a”。多个突变通过加号(“ ”)分开,例如“gly205arg ser411phe”或“g205r s411f”代表在位置205和位置411处的甘氨酸(g)和丝氨酸(s)分别被精氨酸(r)和苯丙氨酸(f)取代。
[0060]
缺失:对于氨基酸缺失,使用以下命名法:原始氨基酸、位置、
*
。相应地,将在位置195处的甘氨酸的缺失表示为“gly195*”或“g195*”。多个缺失由加号(“ ”)分隔,例如,“gly195
*
ser411
*”或“g195
*
s411
*”。
[0061]
插入:对于氨基酸插入,使用以下命名法:原始氨基酸、位置、原始氨基酸、插入的氨基酸。相应地,将在位置195处的甘氨酸之后插入赖氨酸表示为“gly195glylys”或“g195gk”。多个氨基酸的插入被表示为[原始氨基酸、位置、原始氨基酸、插入的氨基酸#1、插入的氨基酸#2;等]。例如,将在位置195处的甘氨酸之后插入赖氨酸和丙氨酸表示为“gly195glylysala”或“g195gka”。
[0062]
在此类情况下,通过将小写字母添加至在所插入的一个或多个氨基酸残基之前的氨基酸残基的位置编号而对所插入的一个或多个氨基酸残基进行编号。在以上实例中,该序列因此会是:
[0063]
亲本:
ꢀꢀ
变体:
[0064]
195
ꢀꢀꢀꢀꢀ
195 195a 195b
[0065]gꢀꢀꢀꢀꢀꢀꢀ
g-k-a
[0066]
多种改变:包含多个改变的变体由加号(“ ”)分开,例如“arg170tyr gly195glu”或者“r170y g195e”代表在位置170和位置195处的精氨酸和甘氨酸分别被酪氨酸和谷氨酸取代。
[0067]
不同改变。可以在一个位置上引入不同的变化时,这些不同的变化由一个逗号分开,例如“arg170tyr,glu”代表在位置170上的精氨酸被酪氨酸或谷氨酸取代。因此,“tyr167gly,ala arg170gly,ala”表示以下变体:
[0068]“tyr167gly arg170gly”、“tyr167gly arg170ala”、“tyr167ala arg170gly”、和“tyr167ala arg170ala”。
具体实施方式
[0069]
本发明的诸位发明人已经研究了分离自直肠真杆菌的rna指导的内切核酸酶的无催化活性版本(称为mad7)在crispr-aid碱基编辑中的用途。mad7与分离自氨基酸球菌属物种的cpf1的序列同一性只有31%,因此在结构上与其他已知的rna指导的内切核酸酶非常不同。然而,如本文披露的实例所示,利用mad7d-aid的crispr-aid碱基编辑在微生物宿主细胞中提供了与cas9d-aid相当的编辑效率,该微生物宿主细胞用含有mad7d-aid和grna表达盒的单个质粒转化,以稳定表达mad7d-aid组分。此外,观察到mad7d-aid的编辑窗口比cas9d-aid更宽,说明基于mad7d的crispr-aid更适合生成同一靶基因座的多个不同snp,这对于生成snp文库和筛选目的非常有利。
[0070]
核碱基编辑复合物
[0071]
在第一方面,本发明涉及核碱基编辑复合物,该核碱基编辑复合物包含以下、基本上由以下组成或由以下组成:
[0072]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0073]
b)核碱基编辑结构域。
[0074]
在一个实施例中,该核碱基编辑复合物包含以下、基本上由以下组成或由以下组成:
[0075]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126具有至少60%,例如,如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0076]
b)核碱基编辑结构域。
[0077]
无催化活性rna指导的内切核酸酶可以是任何与seq id no:126或seq id no:155具有至少60%序列同一性的无催化活性rna指导的内切核酸酶。在优选的实施例中,该无催化活性rna指导的内切核酸酶包含在对应于seq id no:126的位置877的位置处的氨基酸改变。在一个实施例中,在对应于seq id no:126的位置877的位置处的氨基酸被ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、tyr、或val,优选地被ala取代。在另一实施例中,变体包含seq id no:126的取代d877a,或由seq id no:126的取代d877a组成。在优选的实施例中,该无催化活性rna指导的内切核酸酶包含seq id no:126,基本上由seq id no:126组成,或由seq id no:126组成。在另一个优选的实施例中,该无催化活性rna指导的内切核酸酶包含seq id no:155,基本上由seq id no:155组成,或由seq id no:155组成。在一个实施例中,无催化活性rna指导的内切核酸酶由多核苷酸编码,该多核苷酸与seq id no:156具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。优选地,编码该无催化活性rna指导的内切核酸酶的多核苷酸包含seq id no:156的多核苷酸或由该多核苷酸组成。
[0078]
核碱基编辑结构域可以是胞嘧啶碱基编辑器(cbe),可将c-g碱基对转换为t-a碱基对,或者是腺嘌呤碱基编辑器(abe),可将a-t碱基对转换为g-c碱基对。总的来说,cbe和abe可以介导dna核碱基的所有四种可能的过渡突变(c至t、a至g、t至c以及g至a)(rees和liu,参见上文)。
[0079]
在一个方面,核碱基编辑结构域是胞嘧啶碱基编辑器(cbe)。通过将环外胺脱氨基成为靶胞嘧啶(c)来生成尿嘧啶(u)(聚合酶将其读取为胸腺嘧啶(t)),cbe将c-g碱基对转化为t-a碱基对。合适的cbe包括apobec/aid家族的成员,特别是胞苷脱氨酶1(cda1,如从海七鳃鳗获得的pmcda1,由seq id no:127的多核苷酸编码;nishida等人,见上文)和apobec1(harris等人,mol.cell.[分子细胞],卷10,第1247-1253页,2002),还包括apobec2、apobec3、apobec4和apobec5(knisbacher等人,trends genet.[遗传学趋势],卷32,第553-563页,2000)。
[0080]
在优选的实施例中,核碱基编辑结构域是apobec/aid家族的胞嘧啶碱基编辑器。
[0081]
在优选的实施例中,核碱基编辑结构域是apobec1或其同源物或变体。
[0082]
在优选的实施例中,核碱基编辑结构域是cda1或其同源物或变体。最优选地,核碱基编辑结构域是获得自海七鳃鳗的pmcda1。
[0083]
在优选的实施例中,该核碱基编辑结构域包含多肽或由多肽组成,该多肽与seq id no:128具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至
少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该核酸酶编辑结构域包含seq id no:128,基本上由seq id no:128组成,或由seq id no:128组成。
[0084]
在一个方面,核碱基编辑结构域是腺嘌呤碱基编辑器(abe)。与cbe类似,通过将靶标腺嘌呤(a)的环外胺脱氨基生成肌苷(i),abe将a-t碱基对转化为g-c碱基对。在聚合酶活性位点的情况下,i偏好与胞嘧啶(c)进行碱基配对,然后将其读取或复制为鸟嘌呤(g)。合适的abe基于来自大肠杆菌的trna腺苷脱氨酶(tada)(gaudelli等人,nature[自然],卷551,第464-471页,2017)并包括tada、tada*(tada的a106v和/或d108n变体)、tada同源二聚体和tada-tada*异源二聚体。
[0085]
在优选的实施例中,核碱基编辑结构域是基于trna腺苷脱氨酶(tada)的腺嘌呤碱基编辑器。
[0086]
在优选的实施例中,该核碱基编辑结构域选自由以下组成的组:tada、tada*、tada同源二聚体和tada-tada*异源二聚体;最优选地,该核碱基编辑结构域是tada-tada*异源二聚体。
[0087]
在真核细胞,特别是哺乳动物细胞中使用核碱基编辑结构域的一个挑战是需要规避在a-u和i-t中间体形成时启动的dna修复过程,特别是碱基切除修复过程,该过程由cbe将c脱氨为u产生的u-g错配激活。u-g错配的修复由尿嘧啶n-糖基化酶(ung)启动,该酶可能被尿嘧啶dna糖基化酶抑制剂(ugi)抑制,ugi是一种源自pbs噬菌体的dna模拟物(mol等人,cell[细胞],卷82,第701-708页,1995)。
[0088]
在一个实施例中,该核碱基编辑结构域是胞嘧啶碱基编辑器(cbe),并且该核碱基编辑复合物进一步包含尿嘧啶dna糖基化酶抑制剂(ugi)。优选地,该尿嘧啶dna糖基化酶抑制剂与seq id no:132具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。最优选地,该尿嘧啶dna糖基化酶抑制剂包含seq id no:132,基本上由seq id no:132组成,或由seq id no:132组成。
[0089]
该无催化活性rna指导的内切核酸酶和该核碱基编辑结构域可以以多种方式连接以形成本发明的核碱基编辑复合物。在一个实施例中,rna指导的内切核酸酶和核碱基编辑结构域以末端-末端方式融合,即无间插多肽序列。在另一个实施例中,无催化活性rna指导的内切核酸酶和核碱基编辑结构域经由间插多肽(即,接头多肽)连接。通过以末端-末端方式排列无催化活性rna指导的内切核酸酶和核碱基编辑结构域或经由接头多肽将其连接,可以将核碱基编辑复合物表达为单一融合多肽。接头多肽的长度和氨基酸组成将取决于无催化活性rna指导的内切核酸酶和核碱基编辑结构域的大小和三维结构并且接头多肽通常应具有足够的长度和柔性以防止无催化活性rna指导的内切核酸酶和核碱基编辑结构域的一个或多个结合和/或活性位点在它们连接在一起时的空间阻碍。
[0090]
因此,在一个方面,核碱基编辑复合物是包含无催化活性rna指导的内切核酸酶和核碱基编辑结构域的融合多肽。用于产生融合多肽的技术是本领域已知的,且包括连接编码多肽的编码序列使得它们符合读框,而且融合多肽的表达处于一个或多个相同的启动子和终止子的控制之下。还可以使用内含肽技术构建融合多肽,其中在翻译后产生融合多肽(cooper等人,1993,embo j.[欧洲分子生物学学会杂志]12:2575-2583;dawson等人,1994,
science[科学]266:776-779)。
[0091]
在一个实施例中,该无催化活性rna指导的内切核酸酶和该核碱基编辑结构域以末端-末端方式融合,即无间插接头多肽。
[0092]
在另一个实施例中,无催化活性rna指导的内切核酸酶和核碱基编辑结构域被接头多肽分开。优选地,该无催化活性rna指导的内切核酸酶、该接头多肽和该核碱基编辑结构域被框内编码(encoded in frame)并表达为单个多肽。
[0093]
优选地,接头多肽包含至少10氨基酸残基,例如,如至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160、至少170、至少180、至少190、至少200、至少225、至少250、至少275、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000或更多个氨基酸残基。更优选地,接头多肽包含至少75氨基酸残基,例如,如至少80、至少85、至少90、至少95、至少100、至少105、至少110、至少115、至少120或至少125个氨基酸残基。甚至更优选地,接头多肽包含80-120氨基酸残基,例如,如85-115个氨基酸残基,90-110个氨基酸残基,或95-105个氨基酸残基。
[0094]
在优选的实施例中,接头包含16个氨基酸残基或由16个氨基酸残基组成。
[0095]
在优选的实施例中,接头包含32个氨基酸残基或由32个氨基酸残基组成。
[0096]
在优选的实施例中,接头包含100个氨基酸残基或由100个氨基酸残基组成。
[0097]
在优选的实施例中,接头包含105个氨基酸残基或由105个氨基酸残基组成。
[0098]
在一个实施例中,该接头多肽与seq id no:130具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。优选地,该接头多肽包含seq id no:130的多肽或由该多肽组成。在一个实施例中,该接头多肽由多核苷酸编码,该多核苷酸与seq id no:129具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。优选地,该接头多肽包含seq id no:129的多核苷酸或由该多核苷酸组成。
[0099]
构建本发明的核碱基编辑复合物的另一个选择是将无催化活性rna指导的内切核酸酶和核碱基编辑结构域表达为两个单独的多肽,然后通过利用生物相容性,优选地双正交小分子反应的化学接合方法将它们连接起来。通常,通过安装所需的小分子官能团对多肽进行翻译后修饰,所述小分子官能团可任选地经由接头附接至多肽。合适的接合方法是cu(i)催化的叠氮化物-炔烃环加成(cuaac;rostovtsev等人,angew.chem.int.ed[德国应用化学],卷41,第2596-2599页,2002;等人,j.org.chem[有机化学杂志],卷67,第3057-3064页,2002)。
[0100]
在一个实施例中,本发明的核碱基编辑复合物包含:
[0101]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126具有至少60%,例如,如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0102]
b)核碱基编辑结构域,其包含多肽,该多肽与seq id no:128具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至
少97%、至少98%、至少99%或100%的序列同一性。
[0103]
在一个实施例中,本发明的核碱基编辑复合物包含:
[0104]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126具有至少60%,例如,如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;
[0105]
b)核碱基编辑结构域,其包含多肽,该多肽与seq id no:128具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0106]
c)尿嘧啶dna糖基化酶抑制剂,该抑制剂包含多肽,该多肽与seq id no:132具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。
[0107]
在一个实施例中,本发明的核碱基编辑复合物包含:
[0108]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126具有至少60%,例如,如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;
[0109]
b)核碱基编辑结构域,其包含多肽,该多肽与seq id no:128具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0110]
c)尿嘧啶dna糖基化酶抑制剂,该抑制剂包含多肽,该多肽与seq id no:132具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性,
[0111]
其中该无催化活性的rna指导的内切核酸酶和该核碱基编辑结构域被包含至少50个氨基酸(优选地至少100个氨基酸)的接头多肽分开。
[0112]
指导rna
[0113]
grna构成了crispr系统的可重新编程部分,允许将rna指导的内切核酸酶靶向特定的目的基因座。在大多数天然系统(包括酿脓链球菌)中,grna是两种rna多核苷酸的复合物,第一rna(crrna或原型间隔子)含有约20个核苷酸,其确定了rna指导的内切核酸酶的特异性,第二rna(tracrrna或支架)与第一rna杂交以形成与rna指导的内切核酸酶相互作用的rna复合物(参见jinek等人,2012,a programmable dual-rna-guided dna endonuclease in adaptive bacterial immunity[在自适应细菌免疫中的可编程双重-rna指导的dna内切核酸酶],science[科学]337:816-821)。在本文中术语crrna和tracrrna与术语tracr配对rna和tracr rna可互换地使用。
[0114]
由于crispr-cas9系统的发现,单一多核苷酸grna已经被开发并成功应用,与天然两部分grna复合物一样有效。
[0115]
在优选的实施例中,该grna是单一grna或rna复合物,该单一grna或rna复合物包含第一rna,该第一rna包含与该一个或多个dna靶序列至少85%互补并且能够与该一个或多个dna靶序列杂交的20个或更多个核苷酸;优选地,该20个或更多个核苷酸与该一个或多
个dna靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与该一个或多个dna靶序列杂交。
[0116]
在特别优选的实施例中,该grna是单一grna或rna复合物,该单一grna或rna复合物包含第一rna,该第一rna包含与该一个或多个dna靶序列至少85%互补并且能够与该一个或多个dna靶序列杂交的21个核苷酸;优选地,该21个核苷酸与该一个或多个dna靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与该一个或多个dna靶序列杂交。
[0117]
在另一个优选的实施例中,该grna包含单个多核苷酸形式的第一和第二rna,其中当彼此杂交时,tracr配对序列和tracr序列形成茎环结构。
[0118]
dna靶序列
[0119]
dna靶序列可以在任何地方找到,包括体内(例如,在细胞或活生物体内,包括作为所述细胞或生物体基因组的一部分)、离体或体外。dna靶序列应该与适合引导本发明的无催化活性的rna指导的内切核酸酶与dna靶序列结合的grna互补并能够与其杂交。
[0120]
优选地,该dna靶序列的长度是至少20个核苷酸,以允许其与该grna的对应的至少20个核苷酸的序列杂交。该dna靶序列可以位于基因组中的任何位置,但通常位于编码序列或可读框内。
[0121]
在优选的实施例中,该dna靶序列包含多核苷酸,该多核苷酸包含与该一个或多个grna至少85%互补并且能够与该grna杂交的20个或更多个核苷酸;优选地,该20个或更多个核苷酸与grna至少90%、95%、97%、98%、99%或甚至100%互补并且能够与该grna杂交。
[0122]
在特别优选的实施例中,该dna靶序列包含多核苷酸,该多核苷酸包含与该grna至少85%互补并且能够与该grna杂交的21个核苷酸;优选地,该21个核苷酸与grna至少90%、95%、97%、98%、99%或甚至100%互补并且能够与该grna杂交。
[0123]
dna靶序列的侧翼应该是功能性原型间隔子相邻基序(pam),其被本发明的rna指导的内切核酸酶识别。有关pam序列的综述,参见,例如,shah等人,2013,protospacer recognition motifs[原型间隔子识别基序],rna biol.[rna生物学]10(5):891-899。优选地,pam序列是5
’‑
tttn-3’或5
’‑
cttn-3’。更优选地,该pam序列是5
’‑
tttn-3’。最优选地,该pam序列是5
’‑
tttc-3’或5
’‑
tttg-3’。
[0124]
在优选的实施例中,该dna靶序列位于该pam序列的3’端。最优选地,该dna靶序列位于与该pam序列的3'端直接相邻的位置。
[0125]
优选地,该dna靶序列包含在编码多肽的可读框中或包含在启动子区域中。还优选地,该dna靶序列编码一个或多个选自由以下组成的组的酶:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;优选地,该一个或多个酶是α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、天冬酰胺酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡聚糖转移酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、和木聚糖酶。
[0126]
优选地,dna靶序列编码荧光蛋白(例如,绿色荧光蛋白)、其片段或变体。
[0127]
多核苷酸
[0128]
本发明还涉及编码本发明的核碱基编辑复合物的分离的多核苷酸,如本文所述。
[0129]
用于分离或克隆多核苷酸的技术是本领域已知的且包括从基因组dna或cdna或其组合进行分离。来自基因组dna的多核苷酸的克隆可以例如通过使用聚合酶链式反应(pcr)或用以对具有共有的结构特征的克隆的dna片段进行检测的表达库抗体筛选来实现。参见例如,innis等人,1990,pcr:a guide to methods and application[pcr:方法和应用指南],academic press[学术出版社],纽约。可以使用其他核酸扩增程序如连接酶链式反应(lcr)、连接激活的转录(lat)和基于多核苷酸的扩增(nasba)。
[0130]
核酸构建体
[0131]
本发明还涉及包含编码本发明的核碱基编辑复合物的多核苷酸的核酸构建体,其中该多核苷酸可操作地连接至一个或多个控制序列,在与控制序列相容的条件下,该一个或多个控制序列指导该编码序列在合适的宿主细胞中的表达。
[0132]
多核苷酸可以按多种方式操纵,以提供核碱基编辑复合物的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操纵可能是理想的或必需的。用于利用重组dna方法修饰多核苷酸的技术是本领域熟知的。
[0133]
控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明的多肽的多核苷酸的多核苷酸。启动子包含介导多肽的表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变启动子、截短启动子和杂合启动子,并且可以获得自编码与宿主细胞同源或异源的胞外或胞内多肽的基因。
[0134]
用于在细菌宿主细胞中指导本发明多核苷酸的转录的合适启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌(bacillus amyloliquefaciens)α-淀粉酶基因(amyq)、地衣芽孢杆菌(bacillus licheniformis)α-淀粉酶基因(amyl)、地衣芽孢杆菌青霉素酶基因(penp)、嗜热脂肪芽孢杆菌(bacillus stearothermophilus)产麦芽糖淀粉酶基因(amym)、枯草芽孢杆菌(bacillus subtilis)果聚糖蔗糖酶基因(sacb)、枯草芽孢杆菌xyla和xylb基因、苏云金芽孢杆菌(bacillus thuringiensis)cryiiia基因(agaisse和lereclus,1994,molecular microbiology[分子微生物学]13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(egon等人,1988,gene[基因]69:301-315)、天蓝链霉菌(streptomyces coelicolor)琼脂水解酶基因(daga)和原核β-内酰胺酶基因(villa-kamaroff等人,1978,proc.natl.acad.sci.usa[美国国家科学院院刊]75:3727-3731)以及tac启动子(deboer等人,1983,proc.natl.acad.sci.usa[美国国家科学院院刊]80:21-25)。其他启动子描述于gilbert等人,1980,scientific american[科学美国人]242:74-94的“useful proteins from recombinant bacteria[来自重组细菌的有用蛋白质]”;和sambrook等人,1989,同上。串联启动子的实例披露于wo 99/43835中。
[0135]
用于在丝状真菌宿主细胞中指导本发明多核苷酸的转录的适合的启动子的实例是从以下基因中获得的启动子:构巢曲霉(aspergillus nidulans)乙酰胺酶、黑曲霉(aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(aspergillus awamori)葡糖淀粉酶(glaa)、米曲霉(aspergillus oryzae)taka淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰孢(fusarium oxysporum)胰蛋白酶样蛋白酶(wo 96/00787)、镶片镰孢(fusarium venenatum)淀粉葡糖苷酶(wo 00/56900)、镶片
镰孢daria(wo 00/56900)、镶片镰孢quinn(wo 00/56900)、米黑根毛霉(rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉(trichoderma reesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶i、里氏木霉纤维二糖水解酶ii、里氏木霉内切葡聚糖酶i、里氏木霉内切葡聚糖酶ii、里氏木霉内切葡聚糖酶iii、里氏木霉内切葡聚糖酶v、里氏木霉木聚糖酶i、里氏木霉木聚糖酶ii、里氏木霉木聚糖酶iii、里氏木霉β-木糖苷酶以及里氏木霉翻译延伸因子,连同na2-tpi启动子(来自曲霉属中性α-淀粉酶基因的经修饰的启动子,其中已经用来自曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替代未翻译的前导序列;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的经修饰的启动子,其中已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代未翻译的前导序列);及其突变启动子、截短启动子和杂合启动子。其他启动子在美国专利号6,011,147中描述。
[0136]
在酵母宿主中,有用的启动子从以下的基因中获得:酿酒酵母烯醇酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh1、adh2/gap)、酿酒酵母丙糖磷酸异构酶(tpi)、酿酒酵母金属硫蛋白(cup1)、以及酿酒酵母3-磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子由romanos等人,1992,yeast[酵母]8:423-488描述。
[0137]
控制序列也可为由宿主细胞识别以终止转录的转录终止子。终止子可操作地连接至编码多肽的多核苷酸的3'末端。在宿主细胞中有功能的任何终止子可用于本发明中。
[0138]
细菌宿主细胞的优选终止子从以下的基因中获得:克劳氏芽孢杆菌碱性蛋白酶(aprh)、地衣芽孢杆菌α-淀粉酶(amyl)、和大肠杆菌核糖体rna(rrnb)。
[0139]
丝状真菌宿主细胞的优选终止子从以下的基因中获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉taka淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶i、里氏木霉纤维二糖水解酶ii、里氏木霉内切葡聚糖酶i、里氏木霉内切葡聚糖酶ii、里氏木霉内切葡聚糖酶iii、里氏木霉内切葡聚糖酶v、里氏木霉木聚糖酶i、里氏木霉木聚糖酶ii、里氏木霉木聚糖酶iii、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子。
[0140]
酵母宿主细胞的优选终止子从以下的基因中获得:酿酒酵母烯醇酶、酿酒酵母细胞色素c(cyc1)以及酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用的终止子由romanos等人(1992,同上)描述。
[0141]
控制序列还可以是启动子下游和基因的编码序列上游的mrna稳定子区域,其增加该基因的表达。
[0142]
适合的mrna稳定子区域的实例是从以下获得的:苏云金芽孢杆菌cryiiia基因(wo 94/25612)和枯草芽孢杆菌sp82基因(hue等人,1995,j.bacteriol.[细菌学杂志]177:3465-3471)。
[0143]
控制序列也可以是前导序列,即对宿主细胞翻译很重要的mrna的非翻译区域。前导序列可操作地连接至编码多肽的多核苷酸的5'末端。可以使用在宿主细胞中有功能的任何前导序列。
[0144]
丝状真菌宿主细胞的优选前导序列从以下的基因中获得:米曲霉taka淀粉酶和构巢曲霉丙糖磷酸异构酶。
[0145]
酵母宿主细胞的适合的前导序列从以下的基因中获得:酿酒酵母烯醇酶(eno-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶
(adh2/gap)。
[0146]
控制序列还可以是多腺苷酸化序列,一种可操作地连接至该多核苷酸的3’末端并且当转录时由宿主细胞识别为将多腺苷酸残基添加至所转录的mrna的信号的序列。可以使用在宿主细胞中有功能的任何多腺苷酸化序列。
[0147]
用于丝状真菌宿主细胞的优选多腺苷酸化序列从以下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉taka淀粉酶以及尖孢镰孢胰蛋白酶样蛋白酶。
[0148]
酵母宿主细胞的有用的多腺苷酸化序列由guo和sherman,1995,mol.cellular biol.[分子细胞生物学]15:5983-5990描述。
[0149]
控制序列还可以是编码与多肽的n-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5’端本身可以含有在翻译阅读框中天然与编码多肽的编码序列区段相连接的信号肽编码序列。可替代地,编码序列的5’端可以含有对于该编码序列是异源的信号肽编码序列。在编码序列天然地不含有信号肽编码序列的情况下,可能需要异源信号肽编码序列。可替代地,异源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
[0150]
细菌宿主细胞的有效信号肽编码序列是从以下的基因中获得的信号肽编码序列:芽孢杆菌ncib 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprt、nprs、nprm)和枯草芽孢杆菌prsa。另外的信号肽由simonen和palva,1993,microbiol.rev.[微生物评论]57:109-137描述。
[0151]
丝状真菌宿主细胞的有效信号肽编码序列是从以下的基因中获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉taka淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶v、疏棉状腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
[0152]
酵母宿主细胞的有用的信号肽从以下的基因中获得:酿酒酵母α-因子和酿酒酵母转化酶。其他的有用的信号肽编码序列由romanos等人(1992,同上)描述。
[0153]
控制序列还可以是编码位于多肽的n-末端的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下的基因中获得:枯草芽孢杆菌碱性蛋白酶(apre)、枯草芽孢杆菌中性蛋白酶(nprt)、嗜热毁丝霉(myceliophthora thermophila)漆酶(wo 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。
[0154]
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列位于紧邻多肽的n-末端且该信号肽序列位于紧邻前肽序列的n-末端。
[0155]
还可希望的是添加调节序列,这些调节序列调节宿主细胞生长相关的多肽的表达。调节序列的实例是引起基因表达以响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac、和trp操纵子系统。在酵母中,可以使用adh2系统或gal1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉taka α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶i启动子和里
氏木霉纤维二糖水解酶ii启动子。调节序列的其他实例是允许基因扩增的那些序列。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸会与调节序列可操作地连接。
[0156]
表达载体
[0157]
本发明还涉及包含编码本发明的核碱基编辑复合物的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以产生重组表达载体,该重组表达载体可包括一个或多个便利的限制位点以允许编码该多肽的多核苷酸在此类位点处的插入或取代。可替代地,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生表达载体时,编码序列如此位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。
[0158]
重组表达载体可以是可以方便地经受重组dna程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。
[0159]
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总dna,或可以使用转座子。
[0160]
载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。
[0161]
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素、或四环素抗性)的标记。酵母宿主细胞的适合的标记包括但不限于:ade2、his3、leu2、lys2、met3、trp1和ura3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于adea(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeb(磷酸核糖酰-氨基咪唑合酶)、amds(乙酰胺酶)、argb(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niad(硝酸还原酶)、pyrg(乳清酸核苷-5'-磷酸脱羧酶)、sc(硫酸腺苷基转移酶)以及trpc(邻氨基苯甲酸合酶)连同其等同物。优选的用于在曲霉属细胞中使用的是构巢曲霉或米曲霉amds和pyrg基因以及吸水链霉菌(streptomyces hygroscopicus)bar基因。优选的用于在木霉属细胞中使用的是adea、adeb、amds、hph和pyrg基因。
[0162]
选择性标记可以是如wo 2010/039889中所述的双选择性标记系统。在一方面,双选择性标记是hph-tk双选择性标记系统。
[0163]
载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
[0164]
对于整合到宿主细胞基因组中,载体可以依靠编码该多肽的多核苷酸序列或用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,载体可以含有用于指导通过同源重组而整合入宿主细胞基因组中的一个或多个染色体中的一个或
多个精确位置处的另外的多核苷酸。为了提高在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,例如100至10,000个碱基对、400至10,000个碱基对、和800至10,000个碱基对,这些核酸与相对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
[0165]
为了自主复制,载体可以进一步包含复制起点,该复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
[0166]
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pbr322、puc19、pacyc177、和pacyc184的复制起点,以及允许在芽孢杆菌属中复制的质粒pub110、pe194、pta1060、和pamβ1的复制起点。
[0167]
用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点、ars1、ars4、ars1与cen3的组合以及ars4与cen6的组合。
[0168]
在丝状真菌细胞中有用的复制起点的实例是ama1和ans1(gems等人,1991,gene[基因]98:61-67;cullen等人,1987,nucleic acids res.[核酸研究]15:9163-9175;wo 00/24883)。可根据wo 00/24883中披露的方法完成ama1基因的分离和包含该基因的质粒或载体的构建。
[0169]
可将本发明多核苷酸的多于一个拷贝插入宿主细胞以提高多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包括与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝以及由此该多核苷酸的另外的拷贝的细胞。
[0170]
用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如,sambrook等人,1989,同上)。
[0171]
宿主细胞
[0172]
本发明还涉及重组宿主细胞,该重组宿主细胞包含编码可操作地连接至一个或多个控制序列的本发明的核碱基编辑复合物的多核苷酸,该一个或多个控制序列引导该核碱基编辑复合物的表达。将包含多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如较早前所述。
[0173]
在一些实施例中,一个或多个控制序列中的至少一个与编码核碱基编辑复合物的多核苷酸是异源的。在一些实施例中,一个或多个控制序列中的至少一个与宿主细胞是异源的。
[0174]
在一些实施例中,重组宿主细胞包含本发明的多核苷酸的至少两个拷贝,例如三个、四个或五个。
[0175]
宿主细胞可以是任何细胞,例如原核细胞或真核细胞。
[0176]
宿主细胞可以是任何哺乳动物细胞、微生物细胞或植物细胞。
[0177]
优选地,该哺乳动物宿主细胞是小鼠、大鼠、猴或人细胞。
[0178]
优选地,微生物细胞是原核细胞(例如,细菌细胞)或真菌细胞(例如,丝状真菌细
胞或酵母细胞)。
[0179]
宿主细胞可以是任何微生物或植物细胞,例如原核细胞或真菌细胞。
[0180]
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、大洋芽孢杆菌属、葡萄球菌属、链球菌属以及链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属以及脲原体属。
[0181]
细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。最优选地,该细菌宿主细胞是地衣芽孢杆菌细胞。
[0182]
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于类马链球菌(streptococcus equisimilis)、酿脓链球菌(streptococcus pyogenes)、乳房链球菌(streptococcus uberis)以及马链球菌兽疫亚种(streptococcus equi subsp.zooepidemicus)细胞。
[0183]
细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于:不产色链霉菌(streptomyces achromogenes)、除虫链霉菌(streptomyces avermitilis)、天蓝链霉菌、灰色链霉菌以及浅青紫链霉菌(streptomyces lividans)细胞。
[0184]
将dna引入芽孢杆菌属细胞中可以通过以下方式来实现:原生质体转化(参见例如,chang和cohen,1979,mol.gen.genet.[分子与普通遗传学]168:111-115)、感受态细胞转化(参见例如,young和spizizen,1961,j.bacteriol.[细菌学杂志]81:823-829;或dubnau和davidoff-abelson,1971,j.mol.biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如,shigekawa和dower,1988,biotechniques[生物技术]6:742-751)、或接合(参见例如,koehler和thorne,1987,j.bacteriol.[细菌学杂志]169:5271-5278)。将dna引入大肠杆菌细胞中可以通过以下方式来实现:原生质体转化(参见例如,hanahan,1983,j.mol.biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如,dower等人,1988,nucleic acids res.[核酸研究]16:6127-6145)。将dna引入链霉菌属细胞中可以通过以下方式来实现:原生质体转化、电穿孔(参见例如,gong等人,2004,folia microbiol.(praha)[叶线形微生物学(布拉格)]49:399-405)、接合(参见例如,mazodier等人,1989,j.bacteriol.[细菌学杂志]171:3583-3585)、或转导(参见例如,burke等人,2001,proc.natl.acad.sci.usa[美国国家科学院院刊]98:6289-6294)。将dna引入假单胞菌属细胞中可以通过以下方式来实现:电穿孔(参见例如,choi等人,2006,j.microbiol.methods[微生物学方法杂志]64:391-397)或接合(参见例如,pinedo和smets,2005,appl.environ.microbiol.[应用与环境微生物学]71:51-57)。将dna引入链球菌属细胞中可以通过以下方式来实现:天然感受态(natural competence)(参见例如,perry和kuramitsu,1981,infect.immun.[感染与免疫]32:1295-1297)、原生质体转化(参见例如,catt和jollick,1991,microbios[微生物学]68:189-207)、电穿孔(参见例如,buckley等人,1999,appl.environ.microbiol.[应用与环境微生物学]65:3800-3804)、或接合(参见
例如,clewell,1981,microbiol.rev.[微生物学评论]45:409-436)。然而,可以使用本领域已知的将dna引入宿主细胞中的任何方法。
[0185]
宿主细胞可以是真菌细胞。如本文所用的“真菌”包括子囊菌门(ascomycota)、担子菌门(basidiomycota)、壶菌门(chytridiomycota)和接合菌门(zygomycota)以及卵菌门(oomycota)和所有有丝分裂孢子真菌(如由hawksworth等人在以下文献中所定义:ainsworth and bisby’s dictionary of the fungi[安斯沃思和拜斯比真菌字典],第8版,1995,cab international[国际应用生物科学中心],university press[大学出版社],cambridge,uk[英国剑桥])。
[0186]
真菌宿主细胞可以为酵母细胞。如本文所用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(fungi imperfecti)(芽孢纲(blastomycetes))的酵母。由于酵母的分类可在将来变化,出于本发明的目的,酵母应当如biology and activities of yeast[酵母的生物学与活性](skinner,passmore和davenport编辑,soc.app.bacteriol.symposium series no.9[应用细菌学学会专题论文集系列9],1980)中所描述的那样定义。
[0187]
酵母宿主细胞可以是假丝酵母属(candida)细胞、汉逊酵母属(hansenula)细胞、克鲁维酵母属(kluyveromyces)细胞、毕赤酵母属(pichia)细胞、酵母菌属(saccharomyces)细胞、裂殖酵母(schizosaccharomyces)或耶罗维亚酵母属(yarrowia)细胞,例如乳酸克鲁维酵母(kluyveromyces lactis)细胞、巴斯德毕赤酵母(也称为khomagataella phaffii)细胞、卡尔酵母(saccharomyces carlsbergensis)细胞、酿酒酵母(saccharomyces cerevisiae)细胞、糖化酵母(saccharomyces diastaticus)细胞、道格拉氏酵母(saccharomyces douglasii)细胞、克鲁弗酵母(saccharomyces kluyveri)细胞、诺地酵母(saccharomyces norbensis)细胞、卵形酵母(saccharomyces oviformis)细胞或解脂耶罗维亚酵母(yarrowia lipolytica)细胞。最优选地,该酵母宿主细胞是巴斯德毕赤酵母细胞。
[0188]
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(eumycota)和卵菌门(oomycota)的亚门的所有丝状形式(如由hawksworth等人,1995(同上)所定义的)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸来进行的,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding)来进行的,而碳分解代谢可以是发酵性的。
[0189]
丝状真菌宿主细胞可以是枝顶孢霉属(acremonium)、曲霉属、短梗霉属(aureobasidium)、烟管霉属(bjerkandera)、拟腊菌属(ceriporiopsis)、金孢子菌属(chrysosporium)、鬼伞属(coprinus)、革盖菌属(coriolus)、隐球菌属(cryptococcus)、线黑粉菌科(filibasidium)、镰孢属(fusarium)、腐质霉属(humicola)、梨孢菌属(magnaporthe)、毛霉属(mucor)、毁丝霉属(myceliophthora)、新美鞭菌属(neocallimastix)、脉胞菌属(neurospora)、拟青霉属(paecilomyces)、青霉属(penicillium)、平革菌属(phanerochaete)、射脉菌属(phlebia)、瘤胃壶菌属(piromyces)、侧耳属(pleurotus)、裂褶菌属(schizophyllum)、篮状菌属、嗜热子囊菌属
(thermoascus)、梭孢壳属(thielavia)、弯颈霉属(tolypocladium)、栓菌属(trametes)、或木霉属细胞。
[0190]
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管霉(bjerkandera adusta)、干拟蜡菌(ceriporiopsis aneirina)、卡内基拟蜡菌(ceriporiopsis caregiea)、浅黄拟蜡菌(ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(ceriporiopsis pannocinta)、环带拟蜡菌(ceriporiopsis rivulosa)、微红拟蜡菌(ceriporiopsis subrufa)、虫拟蜡菌(ceriporiopsis subvermispora)、狭边金孢子菌(chrysosporium inops)、嗜角质金孢子菌(chrysosporium keratinophilum)、卢克诺文思金孢子菌(chrysosporium lucknowense)、粪状金孢子菌(chrysosporium merdarium)、租金孢子菌(chrysosporium pannicola)、女王杜香金孢子菌(chrysosporium queenslandicum)、热带金孢子菌(chrysosporium tropicum)、褐薄金孢子菌(chrysosporium zonatum)、灰盖鬼伞(coprinus cinereus)、毛革盖菌(coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑根毛霉、嗜热毁丝霉、粗糙脉胞菌、产紫青霉、黄孢平革菌(phanerochaete chrysosporium)、射脉菌(phlebia radiata)、刺芹侧耳(pleurotus eryngii)、埃默森篮状菌、土生梭孢霉、长域毛栓菌(trametes villosa)、变色栓菌(trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。更优选地,该丝状真菌宿主细胞是黑曲霉、米曲霉或里氏木霉细胞。最优选地,该丝状真菌宿主细胞是黑曲霉或米曲霉细胞。
[0191]
可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的工艺以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中:ep 238023,yelton等人,1984,proc.natl.acad.sci.usa[美国国家科学院院刊]81:1470-1474以及christensen等人,1988,bio/technology[生物/技术]6:1419-1422。用于转化镰孢属物种的适合方法由malardier等人,1989,gene[基因]78:147-156和wo 96/00787描述。可以使用由以下文献描述的程序转化酵母:becker和guarente,在abelson,j.n.和simon,m.i.编辑,guide to yeast genetics and molecular biology[酵母遗传学与分子生物学指南],methods in enzymology[酶学方法],第194卷,第182-187页,academic press,inc.[学术出版社有限公司],纽约;ito等人,1983,j.bacteriol.[细菌学杂志]153:163;以及hinnen等人,1978,proc.natl.acad.sci.usa[美国国家科学院院刊]75:1920。
[0192]
实例
[0193]
材料与方法
[0194]
除非另有说明,否则dna操作和转化是使用sambrook等人(1989)molecular cloning:a laboratory manual[分子克隆:实验室手册],冷泉港实验室,冷泉港,纽约州;ausubel,f.m.等人(编辑)“current protocols in molecular biology[分子生物学现代方法]”,john wiley and sons[约翰威利父子出版公司],1995;harwood,c.r.和cutting,s.m.(编辑)所述的分子生物学标准方法进行的。“molecular biological methods for bacillus[用于芽孢杆菌的分子生物学方法]”.john wiley and sons[约翰威立父子公司],1990。
[0195]
购买的材料(大肠杆菌和试剂盒)
[0196]
使用大肠杆菌dh5α(东洋公司(toyobo))和stellar(宝生物公司(takara))用于质粒构建和扩增。使用qiagen plasmid试剂盒(凯杰公司)来回收扩增的质粒。根据制造商的说明书,用nebuilder hifi dna组装克隆试剂盒(新英格兰生物实验室公司)或in-fusion试剂盒(克罗泰克实验室公司(clontech laboratories,inc.))进行连接。聚合酶链式反应(pcr)是用primestar gxl dna聚合酶试剂盒(宝生物公司)进行的。qiaquick
tm
凝胶提取试剂盒(凯杰公司)被用于纯化pcr片段或从琼脂糖凝胶中提取dna片段。
[0197]

[0198]
用于dna操作的酶(例如限制性内切核酸酶,连接酶等)可获得自新英格兰生物实验室公司),并且根据制造商的说明书使用。
[0199]
质粒
[0200]
pbluescript ii sk-(斯特拉塔吉恩(stratagene)#212206)。
[0201]
实例中描述的crispr-cas9质粒含有来自稻瘟病菌的u6-2启动子、烟曲霉trna gly启动子、烟曲霉tef1启动子和hph标记基因。实例部分中描述了细节。
[0202]
来自草酸青霉的含有淀粉葡萄糖苷酶的po amg的序列描述于wo 2011/127802中。
[0203]
pat3530 crispr-ma7d-aid-ugi质粒描述于实例7中。
[0204]
微生物菌株
[0205]
如在wo 2012/160093中的实例14中描述,表达宿主菌株黑曲霉m1364由诺维信公司(novozymes)分离并为从土壤分离的黑曲霉nn049184的衍生物。m1364是一种来自草酸青霉的产生葡糖淀粉酶的菌株(po amg)。
[0206]
表达宿主菌株米曲霉jal355描述于wo 2005/070962的实例10中。
[0207]
枯草芽孢杆菌pp3724:该菌株是用于接合芽孢杆菌菌株的供体菌株,如wo 1996/029418中所述。
[0208]
地衣芽孢杆菌sj1904:这一菌株描述于wo 2008/066931中。
[0209]
培养基
[0210]
cove痕量金属溶液由以下构成:0.04g nab4o7
·
10h2o、0.4g cuso4
·
5h2o、1.2g feso4
·
7h2o、0.7g mnso4
·
h2o、0.8g na2moo2
·
2h20、10g znso4
·
7h2o、以及补足至1升的去离子水。
[0211]
50x cove盐溶液由以下构成:26g kcl、26g mgso4
·
7h2o、76g kh2po4、50ml cove痕量金属溶液、以及补足至1升的去离子水。
[0212]
cove培养基由以下构成:342.3g蔗糖、20ml 50x cove盐溶液、10ml1m乙酰胺、10ml 1.5m cscl2、25g纯净琼脂、以及去离子水补足至1升。
[0213]
cove-n-gly板由以下构成:218g山梨醇、10g甘油、2.02g kno3、50ml cove盐溶液、25g纯净琼脂、以及补足至1升的去离子水。
[0214]
cove-n(tf)由以下构成:342.3g蔗糖、3g nano3、20ml cove盐溶液、30g纯净琼脂、以及补足至1升的去离子水。
[0215]
cove-n顶层琼脂糖由以下构成:342.3g蔗糖、3g nano3、20ml cove盐溶液、10g低熔点琼脂糖、以及补足至1升的去离子水。
[0216]
cove-n由以下构成:30g蔗糖、3g nano3、20ml cove盐溶液、30g纯净琼脂、以及补
足至1升的去离子水。
[0217]
stc缓冲液由以下构成:0.8m山梨醇、25mm tris ph 8、以及25mm cacl2。
[0218]
stpc缓冲液由以下构成:在stc缓冲液中的40% peg 4000。
[0219]
lb培养基由以下构成:10g的胰蛋白胨、5g的酵母提取物、5g的氯化钠、以及去离子水补足至1升。
[0220]
lb加氨比西林板由以下构成:10g的胰蛋白胨、5g的酵母提取物、5g的氯化钠、15g的细菌培养用琼脂、以100μg/ml的氨比西林、以及去离子水补足至1升。
[0221]
ypg培养基由以下构成:10g的酵母提取物、20g的细菌培养用蛋白胨、20g的葡萄糖、以及去离子水补足至1升。
[0222]
soc培养基由以下构成:20g的胰蛋白胨、5g的酵母提取物、0.5g的nacl、10ml的250mm kcl、以及去离子水补足至1升。
[0223]
tae缓冲液由以下构成:4.84g的tris碱、1.14ml的冰乙酸、2ml的0.5m edta ph 8.0、以及去离子水补足至1升。
[0224]
使芽孢杆菌属菌株生长在lb琼脂(10g/l胰蛋白胨、5g/l酵母提取物、5g/l naci、15g/l琼脂)平板上、difco胰蛋白胨血琼脂基平板上或生长于lb液体培养基(10g/l胰蛋白胨、5g/l酵母提取物、5g/l naci)中。
[0225]
为了针对红霉素抗性进行选择,将琼脂培养基补充1μg/ml红霉素和25μg/ml洁霉素并且将液体培养基补充5μg/ml红霉素。为了选择四环素抗性,将琼脂和液体培养基补充15μg/ml四环素。为了选择红霉素抗性和四环素抗性,将琼脂和液体培养基补充2μg/ml红霉素抗性和15μg/ml四环素。
[0226]
使用spizizen i和spizizen ii培养基来制备和转化感受态枯草芽孢杆菌细胞。
[0227]
spizizen i培养基由以下组成:1 x spizizen盐(6g/l kh2p04、14g/l k2hp04、2g/l(nh4)2s04、1g/l柠檬酸钠二水合物、0.2g/l mgs04
·
7h20,ph 7.0)、0.5%葡萄糖、0.1%酵母提取物以及0.02%酪蛋白水解物。
[0228]
spizizen ii培养基由补充有0.5mm caci2和2.5mm mgci2的spizizen i培养基组成。
[0229]
接合供体菌株补充了100μg/ml d-丙氨酸。
[0230]
黑曲霉的转化
[0231]
曲霉属物种的转化可以使用用于酵母转化的一般方法实现。以下描述了用于本发明的优选程序。
[0232]
将黑曲霉宿主菌株接种至100ml的补充有10mm尿苷的ypg培养基上,并且在32℃在80rpm下孵育16小时。将球粒进行收集并且用0.6m kcl洗涤,并且将其重悬浮于含有商业β-葡聚糖酶产品(glucanex
tm
,诺维信公司,鲍斯韦,丹麦)的20ml 0.6m kcl(终浓度为20mg/ml)中。将悬浮液在32℃在80rpm下孵育直到形成原生质体,并且然后用stc缓冲液洗涤两次。将这些原生质体用血红蛋白计计数,并且在8:2:0.1的stcstpc:dmso溶液中重新悬浮并调节至终浓度为2.5x107个原生质体/ml。将大约4μg的质粒dna添加至100μl原生质体悬浮液中,轻轻混合,并且在冰上孵育30分钟。添加1ml的sptc,并且将该原生质体悬浮液在37℃孵育20分钟。在添加10ml的50℃cove或cove-n顶层琼脂糖之后,将反应倾倒于cove或cove-n(tf)琼脂板上,并且将该板于32℃孵育5天。
[0233]
米曲霉的转化
[0234]
如christensen等人;biotechnology[生物技术]1988 6 1419-1422所述,完成曲霉属转化。简言之,使米曲霉菌丝体在富营养培养液中生长。通过过滤从培养液中分离出菌丝体。将酶制剂(诺维信公司(novozymes))添加至渗透压稳定的缓冲液(如用磷酸钠缓冲至ph 5.0的1.2m mgso4)中的菌丝体中。将悬浮液在37℃下伴随搅拌孵育60分钟。通过mira-cloth过滤原生质体,以去除菌丝体碎片。收获原生质体,并且用stc(1.2m山梨醇、10mm cacl2、10mm tris-hcl(ph 7.5))洗涤两次。最后在200-1000微升stc中重悬原生质体。
[0235]
用于转化,将1μg crispr-aid-ugi质粒(pat3532-3537)添加至100μl原生质体悬浮液中,并且然后添加200μl peg溶液(60% peg 4000、10mm cacl2、10mm tris-hcl(ph 7.5)),并且在室温下孵育该混合物20分钟。收获原生质体并且用1.2m山梨醇洗涤两次。最后,在200μl 1.2m山梨醇中重悬原生质体。根据其在最小平板上生长的能力,选择含有pyrg基因的转化体,这些板中未添加10mm尿苷(cove d.j.1966.biochem.biophys.acta.[生物化学与生物物理学报]113:51-56)、含有1.0m蔗糖作为碳源、10mm nano4作为氮源。在37℃下生长5-7天后,稳定的转化体看起来强力地生长并且使菌落形成孢子。通过分生孢子纯化转化体一次。
[0236]
芽孢杆菌细胞的转化和接合
[0237]
枯草芽孢杆菌菌株的感受态细胞是根据yasbin等人(1973):transformation and transfection in lysogenic strains of bacillus subtilis[枯草芽孢杆菌的溶原性菌株中的转化和转染]168.j.bacteriol.[细菌学杂志]113,540-548中描述的方法制备和转化。
[0238]
基本上如wo 1996/029418中所述进行地衣芽孢杆菌的接合。
[0239]
实例中的pcr扩增
[0240]
聚合酶链式反应(pcr)是用primestar gxl dna聚合酶(宝生物公司)如下进行的。
[0241][0242]
3步循环:
[0243][0244]
对于实例9至11,聚合酶链式反应(pcr)是用sapphireamp fast pcr master mix(宝生物公司(takara bio))如下进行的。
[0245]
[0246][0247]
预变性:95℃,3min.
[0248]
30个周期:
[0249]
变性:95℃,15sec.
[0250]
退火:58℃,15sec.
[0251]
扩展:72℃,15sec.
[0252]
最终扩展:72℃,3min.
[0253]
a部分:黑曲霉
[0254]
实例1.构建含有dcas9-aid复合物和靶向pks基因的sgrna的表达盒的质粒。
[0255]
dcas9表达质粒的构建
[0256]
本实验的目的是首先制备质粒以在黑曲霉菌株中表达无催化活性(=“死”)cas9(即dcas9,其中包括对cas9的d10a和d840a取代)。
[0257]
使用psmai289质粒dna作为模板,使用引物对(表1a)通过pcr扩增u6-2启动子(来自稻瘟病菌)的片段,这些片段与烟曲霉trna gly和tef1启动子-dcas9融合,其后是hph选择标记。
[0258]
crispr-cas9质粒psmai289包含稻瘟病菌u6-2启动子和终止子、烟曲霉trnagly(gcc)1-6和cas9的序列。通过搜索来自联合基因组研究所(jgi)的稻瘟病菌菌株70-15(mg8)基因组序列数据库的基因注释,鉴定了稻瘟病菌u6-2启动子和终止子。通过从jgi搜索烟曲霉菌株293基因组序列数据库的基因注释,鉴定了烟曲霉trnagly(gcc)1-6基因序列(chr4:3650153-3650223( ))。
[0259]
根据说明书,使用nebuilder hifi dna组装克隆试剂盒将扩增的片段组装并连接到来自phite132(在wo 2015/025055中描述的phite50的衍生物)的5.5-kb nhei片段中,以产生phite277。在大肠杆菌dh5α中进行质粒制备。
[0260]
表1a.u6启动子-trna、dcas9和hph基因的引物
[0261][0262]
所得质粒phite277按顺序包含以下元素(图2):
[0263]
稻瘟病菌u6-2启动子(seq id no:9)
[0264]
烟曲霉trna gly(seq id no:10)
[0265]
cas9 sgrna主链(seq id no:11)
[0266]
稻瘟病菌u6-2终止子(seq id no:12)
[0267]
构巢曲霉tef1启动子(seq id no:13)
[0268]
dcas9_编码(seq id no:14)
[0269]
dcas9_蛋白质(seq id no:15)
[0270]
hph选择标记(seq id no:16)
[0271]
用靶向pks基因的sgrna表达盒构建dcas9-aid表达质粒。
[0272]
本实验的目的是制备质粒dna,用于测试与死cas9(作为mad7d-aid的对照)连接时aid突变活性的影响。将pks(或也称为wa)基因用作dcas9-aid的模型靶标。pks敲除突变体将显示白色孢子表型,这是选择预期突变体的良好指标。
[0273]
为了将海七鳃鳗衍生的胞苷脱氨酶与dcas9基因的c末端融合,将密码子优化的脱氨酶基因作为合成dna订购(基因艺术-赛默飞世尔科技公司(geneart-thermofisher scientific))。为了制备用于克隆的dna片段,对dcas9基因和phite277的载体区域进行了独立的pcr扩增。载体片段、dcas9片段和脱氨酶基因片段通过neb hifi克隆试剂盒接合,构建ptna193(dcas9-aid,sgrna空)。引物对在表1b中进行描述。图3示出了ptna193的示意图。
[0274]
表1b.用于构建具有空sgrna载体的dcas9-aid的引物
[0275]
引物名称序列5'

3'seq id no:if_u6cas9_fwdttttctctgctgtctgcctcg17if_dcascda_revgtcgccccccagttgactaag18if_cda3utr_fwdgcggacattcgatttatgccgttatg19if_u63utr_revagacagcagagaaaagccagatgg20cda插入_fwdcaactggggggcgacagcag21cda插入_revaaatcgaatgtccgcttatccggag22
[0276]
如表2所示,设计了四种不同的原型间隔子以靶向pks基因。将包括每个原型间隔子的寡dna对排序并通过nebuilder hifi克隆试剂盒克隆到ptna193的bglii位点,从而构建ptna197至200(dcas9-aid,分别靶向wa1至wa4)。用于构建这些质粒的寡dna见表3。为了使pks基因失活,按照以下标准选择原型间隔子:(1)终止密码子(tag、taa或tga)应通过c到t核苷酸转换引入,(2)从pam远端编号时,靶标c应位于第2至第5位(k.nishida等人,(2016)science[科学])。
[0277]
表2.用于破坏pks基因的原型间隔子序列。潜在靶标“c”带有下划线。
[0278][0279]
表3.用于构建ptna197-200的寡dna。匹配原型间隔子的序列以大写显示。
[0280][0281][0282]
如下进行对ptna193的原型间隔子克隆。将主链质粒ptna193用bglii在37℃下消化1小时。然后使用qiaquick凝胶提取试剂盒(qiagen)对消化的片段进行凝胶纯化。将纯化的dna片段与表3中所示的每对寡dna混合,并通过nebuilder hifi dna组装试剂盒将原型间隔子序列克隆到载体中。将两微升反应混合物转化到dh5α化学感受态大肠杆菌细胞中。将转化体涂布在lb加氨比西林板上,并且在37℃孵育过夜。使用qiagen小量制备试剂盒,将质粒dna从若干个转化体中纯化。通过限制酶消化,随后通过使用tae缓冲液的1.0%琼脂糖凝胶电泳,筛选适当连接的质粒dna。商业序列服务用于确定实际的dna序列。
[0283]
代表性质粒ptna193按顺序包含以下元素(图3):
[0284]
稻瘟病菌u6-2启动子(seq id no:9)
[0285]
烟曲霉trna gly(seq id no:10)
[0286]
cas9 sgrna主链(seq id no:11)
[0287]
稻瘟病菌u6-2终止子(seq id no:12)
[0288]
构巢曲霉tef1启动子(seq id no:13)
[0289]
dcas9-aid_编码(seq id no:35)
[0290]
dcas9-aid_蛋白质(seq id no:36)
[0291]
hph选择标记(seq id no:16)
[0292]
也可以在序列表中找到靶标pks(wa)基因序列(seq id no:37)。
[0293]
实例2.crispr-aid质粒的转化用于pks基因失活。
[0294]
黑曲霉菌株m1364中的pks失活
[0295]
本实验的目的是证明dcas9-aid可以在黑曲霉基因组中引入靶特异性c至t转换,并评估突变效应的效率。为此,用靶向内源pks基因的dcas9-aid质粒转化黑曲霉菌株m1364(如实例1所述)。将dcas9-aid和sgrna表达盒与潮霉素抗性基因以位点特异性方式整合到黑曲霉基因组中。在分离和孢子成熟后,检查转化体的孢子颜色,因为pks基因失活会导致白色孢子表型。通过靶基因座测序进一步分析显示预期表型的克隆。
[0296]
表4.pks靶向dcas9-aid转化总结
[0297][0298]
表4显示了pks靶向实验。结果,我们通过使用分别具有wa2或wa3sgrna和dcas9-aid表达盒的ptna198或199以8%的效率获得了白色孢子克隆。看看这些白色克隆的pks基因是否如预期发生突变,将基因组dna分离,并将靶标基因座pcr扩增。引物如下所示:
[0299]
对于wa2靶标:
[0300]
seq id no:38:引物pks_seq_f2:5'tcatatcggttctgccaagg 3’[0301]
seq id no:39:引物pks_r:5'gttgttgacgaaagttcgcc 3’[0302]
对于wa3靶标:
[0303]
seq id no:40:引物pks_f:5'actgcgactgggaatctgcg 3’[0304]
seq id no:41:引物pks_seq_r3:5'cttgtaattcttggaaatgcagg 3’[0305]
然后通过qiaquick凝胶提取试剂盒(凯杰公司)对扩增子进行凝胶纯化,并发送到商业序列服务以确定靶标区域的突变模式。从ptna193(无sgrna)处理中分离的黑色孢子克隆在该基因组区域未显示突变,而白色孢子克隆在预期位置显示c至t突变(图4)。ptna199(wa3靶标)产生的突变体在sgrna靶向位点有17bp的缺失(图4)。这可能是由于细胞的容易出错的dna修复,例如碱基切除修复,而不是图1中呈现的机制。无论如何,这些数据表明crispr-cas9-aid可以在黑曲霉菌株中起作用。
[0306]
实例3.通过添加ugi结构域提高突变效率。
[0307]
dcas9-aid-ugi表达质粒的构建
[0308]
我们展示了dcas9-aid系统以大约8%的效率引入了靶向突变,如实例2中所述。然而,这还不够实用。最近的报告表明,在dcas9-aid的c末端添加ugi(尿嘧啶糖基化酶抑制剂)可提高体内突变效率(rees h.a.和liu d.r.nature reviews genetics[自然综述遗传学]19,770-788(2018))。因此,本实验旨在制备含有dcas9-aid-ugi编码序列和sgrna表达盒的质粒dna。靶基因与实例2中描述的相同。
[0309]
为了将源自噬菌体的ugi基因融合到dcas9-aid的c末端,将密码子优化的ugi基因
作为合成dna订购(基因艺术-赛默飞世尔科技公司),参见seq id no:131。为了制备用于克隆的dna片段,首先用xbai和bmti限制酶消化ptna193,并对dcas9-aid编码片段进行凝胶纯化。接下来对载体部分进行pcr扩增,在dcas9-aid的3'utr的5'端添加bsrgi限制位点。然后用bsrgi和bmti消化这个pcr片段。最后,通过在其5'和3'端分别添加xbai和bsrgi限制位点,对ugi基因进行pcr扩增。这个ugi片段也用xbai和bsrgi消化。通过neb hifi克隆试剂盒接合上述消化的dna片段,从而构建ptna235(dcas9-aid-ugi,sgrna空)。引物对在表5中进行描述。图5示出了ptna235的示意图。
[0310]
表5.用于构建具有空sgrna载体的dcas9-aid-ugi的引物
[0311][0312]
sgrna靶序列与实例1中描述的相同。选择了四种不同的靶标原型间隔子(参见表2)。为了通过dcas9-aid-ugi靶向这些区域,将ptna235用bglii消化并在那里引入原型间隔子序列(参见表3),从而构建ptna240-243(分别靶向wa1至wa4)。
[0313]
代表性质粒ptna235按顺序包含以下元素(图5):
[0314]
稻瘟病菌u6-2启动子(seq id no:9)
[0315]
烟曲霉trna gly(seq id no:10)
[0316]
cas9 sgrna主链(seq id no:11)
[0317]
稻瘟病菌u6-2终止子(seq id no:12)
[0318]
构巢曲霉tef1启动子(seq id no:13)
[0319]
dcas9-aid-ugi_编码(seq id no:46)
[0320]
dcas9-aid-ugi_蛋白质(seq id no:47)
[0321]
hph选择标记(seq id no:16)
[0322]
黑曲霉菌株m1364中的pks失活
[0323]
本实验的目的是证明向dcas9-aid添加ugi结构域可以提高突变效率。为此,如实例2所述,用ptna235和240-243转化黑曲霉菌株m1364。在分离和孢子成熟后,检查转化体的孢子颜色,因为pks基因失活会导致白色孢子表型。通过靶基因座测序进一步分析显示预期表型的克隆。
[0324]
表6.pks靶向dcas9-aid-ugi转化总结
[0325][0326]
表6显示了pks靶向实验。结果,我们以25%-42%的效率获得了白色孢子克隆,这明显高于没有ugi的效率(参见实例2)。看看这些白色克隆的pks基因是否如预期发生突变,将基因组dna分离,并将靶标基因座pcr扩增。引物如下所示:
[0327]
对于wa1靶标:
[0328]
seq id no:40:引物pks_f:5'actgcgactgggaatctgcg 3’[0329]
seq id no:48:引物pks_seq_r1:5’atttgcaagagtggtttgtg 3’[0330]
对于wa2靶标:
[0331]
seq id no:38:引物pks_seq_f2:5'tcatatcggttctgccaagg 3’[0332]
seq id no:39:引物pks_r:5'gttgttgacgaaagttcgcc 3’[0333]
对于wa3靶标:
[0334]
seq id no:40:引物pks_f:5'actgcgactgggaatctgcg 3’[0335]
seq id no:41:引物pks_seq_r3:5'cttgtaattcttggaaatgcagg 3’[0336]
对于wa4靶标:
[0337]
seq id no:40:引物pks_f:5'actgcgactgggaatctgcg 3’[0338]
seq id no:48:引物pks_seq_r1:5’atttgcaagagtggtttgtg 3’[0339]
然后通过qiaquick凝胶提取试剂盒(凯杰公司)对扩增子进行凝胶纯化,并发送到商业序列服务以确定靶标区域的突变模式。从ptna235(无sgrna)处理中分离的黑色孢子克隆在该基因组区域未显示突变,而白色孢子克隆在预期位置显示c至t突变(图6)。因此,这些数据表明向dcas9-aid添加ugi结构域实际上提高了突变效率。
[0340]
实例4.mad7d的构建
[0341]
寻找mad7内切核酸酶活性的推定催化残基
[0342]
mad7中负责内切核酸酶活性的催化位点是通过与其他远亲fncpf1的活性位点周围的同源序列进行序列比对来确定的,可以通过在其ruvc样结构域中引入特定取代(d917a)来催化失活(zetsche等人,2015,cell[细胞]163,759-771)。使用muscle算法,通过与相关的毛螺菌科细菌cpf1(lbcpf1)和土拉热弗朗西斯氏菌cpf1(fncpf1)的多重比对在
mad7中识别出相应的保守区域。比对显示位置877与mad7的内切核酸酶活性相关,并且用ala(d877a)取代天然asp产生mad7的无催化活性版本(mad7d),参见由具有seq id no:124的多核苷酸编码的具有seq id no:125的多肽。
[0343]
mad7核酸酶的编码dna和氨基酸序列可分别见于seq id no:49和seq id no:50。上述用于多重比对的氨基酸序列可见于seq id no:51至53。
[0344]
mad7d-aid-ugi表达质粒的构建
[0345]
为了在质粒ptna235中用mad7d替换dcas9部分,mad7d基因作为合成dna订购(基因艺术-赛默飞世尔科技公司)。为了在ptna235中用mad7d替换dcas部分,对ptna235上除dcas9之外的dna序列进行pcr扩增和凝胶纯化。nebuilder hifi dna组装克隆试剂盒(新英格兰生物实验室公司(new england biolabs,inc.))将mad7d基因克隆到该片段中,从而构建了ptna261(mad7d-aid-ugi,cas9 sgrna表达)。为了用mad7表达盒替换cas9 sgrna表达盒,用bglii和pmli消化ptna261。通过使用nebuilder hifi dna组装克隆试剂盒克隆合成寡dna,将mad7 sgrna编码序列引入该位点,从而构建ptna287(mad7d-aid-ugi,mad7 sgrna表达(空))。引物对在表7中进行描述。图7示出了ptna287的示意图。
[0346]
表7.用于构建具有空sgrna载体的mad7d-aid-ugi的引物
[0347][0348]
代表性质粒ptna287按顺序包含以下元素:
[0349]
稻瘟病菌u6-2启动子(seq id no:9)
[0350]
烟曲霉trna gly(seq id no:10)
[0351]
mad7 sgrna主链(seq id no:60)
[0352]
稻瘟病菌u6-2终止子(seq id no:12)
[0353]
构巢曲霉tef1启动子(seq id no:13)
[0354]
mad7d-aid-ugi_编码(seq id no:61)
[0355]
mad7d-aid-ugi_蛋白质(seq id no:62)
[0356]
hph选择标记(seq id no:16)
[0357]
实例5.mad7d-aid质粒的转化用于pks基因失活。
[0358]
在黑曲霉菌株m1364中mad7d-aid使pks失活
[0359]
本实验的目的是证明mad7d-aid可以在黑曲霉基因组中引入靶特异性c至t转换,并评估突变效应的效率,如针对dcas9-aid的实例2所示。因为没有人报道过mad7d连接的脱氨酶的活性,因此我们首先旨在阐明胞苷作为aid底物的靶标位置。为此,设计了19个在pks基因座上具有不同靶标位置的靶序列(表8),当mad7d-aid引入c至t突变时,每个靶序列都会形成提前终止密码子。c的靶标位置从pam近端开始编号。将这些原型间隔子序列克隆到ptna287的bglii消化位点,从而使用表9中所示的寡dna构建ptna296-307和ptna324-330。
[0360]
表8.用于破坏pks基因的原型间隔子序列。潜在靶标“c”带有下划线。
[0361]
[0362]
[0363][0364]
表9.用于构建ptna296-307和324-330的寡dna。匹配原型间隔子的序列以大写显示。
[0365]
[0366]
[0367][0368]
接着,如实例2所述,用这些质粒dna转化黑曲霉菌株m1364。将mad7d-aid和sgrna表达盒与潮霉素抗性基因以位点特异性方式整合到黑曲霉基因组中。在分离和孢子成熟后,检查转化体的孢子颜色。通过靶基因座测序进一步分析显示预期表型(白色孢子颜色)的克隆。
[0369]
表10.pks靶向mad7d-aid转化总结
[0370][0371]
如表10所示,以8%至17%的效率获得含有有效sgrna的白色孢子突变体。看看这些白色克隆的pks基因是否如预期发生突变,将基因组dna分离,并将靶标基因座pcr扩增。引物如下所示:
[0372]
对于mdwa8靶标:
[0373]
seq id no:120:引物pks_seq_f5:5'ttcttcaacatgtcgcctcgg 3’[0374]
seq id no:121:引物pks_seq_r6:5’gtgttacagttgccagtgg 3’[0375]
对于mdwa13靶标:
[0376]
seq id no:122:引物pks_seq_f4:5'ggtacttgatgaattcgtcg 3’[0377]
seq id no:121:引物pks_seq_r6:5’gtgttacagttgccagtgg 3’[0378]
然后通过qiaquick凝胶提取试剂盒(凯杰公司)对扩增子进行凝胶纯化,并测序以确定靶向区域的突变模式。从ptna287(无sgrna)处理中分离的黑色孢子克隆在读取基因组区域未显示突变,而突变体在ptna303的c16、g17(反义),和ptna324的c13处发生突变,如预期的那样(图8)。这表明mad7d-aid的主要靶标窗口是c13至c17,并且mad7d-aid系统可以在
工业上重要的微生物如黑曲霉中引入c至t突变。
[0379]
实例6.研究mad7d-aid活性的最佳温度。
[0380]
mad7d-aid在不同孵育温度下使pks失活
[0381]
本实验的目的是研究mad7d-aid活性的最佳温度。为此,将ptna303转化到m1364宿主菌株中,并将转化体在25、30或34℃下孵育直至孢子成熟。在该实验中遵循实例5中描述的程序,不同之处在于孵育温度。结果总结于表11中。
[0382]
表11.ptna303在不同温度下的转化总结
[0383][0384]
如表11所示,白色孢子突变体的效率为0至67%,具有明显的趋势,即更高的温度提供更高的效率。看看这些白色克隆的pks基因是否如预期发生突变,将基因组dna分离,并将靶标基因座pcr扩增。引物如下所示:
[0385]
seq id no:120:引物pks_seq_f5:5'ttcttcaacatgtcgcctcgg 3’[0386]
seq id no:121:引物pks_seq_r6:5’gtgttacagttgccagtgg 3’[0387]
然后通过qiaquick凝胶提取试剂盒(凯杰公司)对扩增子进行凝胶纯化,并发送到商业序列服务以确定靶标区域的突变模式。有趣的是,白色孢子突变体在sgrna靶向序列中具有c至t或g至a突变,如图9所示。g至a突变可通过反义c至t突变引入。
[0388]
接下来,为了查看这种效率改进是否适用于其他sgrna,我们测试了13种sgrna进行34℃孵育,如表12中所列。
[0389]
表12.回顾pks靶向sgrna进行34℃孵育的总结
[0390][0391]
如表12所示,以0至58%的效率获得白色孢子突变体。与表10相比,使用一些sgrna,如mdwa2、mdwa8、mdwa13和mdwa14,编辑效率明显提高。看看这些白色克隆的pks基因是否如预期发生突变,将基因组dna分离,并将靶标基因座pcr扩增。引物如下所示:
[0392]
对于mdwa1-6:
[0393]
seq id no:123:引物ms-测试-wa3:5’tgaattcaactctttacaatcg 3’[0394]
seq id no:41:引物pks_seq_r3:5'cttgtaattcttggaaatgcagg 3’[0395]
对于mdwa8-14:
[0396]
seq id no:122:引物pks_seq_f4:5'ggtacttgatgaattcgtcg 3’[0397]
seq id no:121:引物pks_seq_r6:5’gtgttacagttgccagtgg 3’[0398]
然后通过qiaquick凝胶提取试剂盒(凯杰公司)对扩增子进行凝胶纯化,测序以确定靶向区域的突变模式。图9还显示了一些具有代表性的基因型。
[0399]
这些数据表明,mad7d-aid提供至少两种有益效果:
[0400]
1)mad7d-aid可能能够同时靶向正义链和反义链。一般来说,sgrna由于其互补性,应该与基因组dna的靶向链形成紧密的异源双链体,这使得非靶向链游离并且可以被aid靶向,反之亦然,靶向链由于双链体形成而不能被靶向。如实例3中所述,dcas9-aid将突变引入依赖于sgrna靶向链的正义链或反义链。但是,如图9所示,尽管mdwa8 sgrna仅靶向正义链,ptna303转化体在原型间隔区具有c至t和/或g至a突变。虽然机制尚不完全清楚,但这种作用似乎是由两条链的mad7d-aid脱氨作用介导的。
[0401]
2)mad7d-aid可能能够靶向原型间隔区任何位置的胞苷。如图9所示,ptna303转化体在原型间隔区(21bp长)具有c至t和/或g至a突变,这与dcad9-aid完全不同,dcad9-aid的
靶标范围限于原型间隔子(20bp长)内的4bp窗口,如实例3中所述。这在制作突变文库时显然是有益的,因为与dcas9-aid相比,mad7d-aid从单个sgrna创建更多种类的突变。
[0402]
总而言之,mad7d-aid系统具有有益且迄今未描述的特征,尤其是在为筛选目的创建突变文库时,这是开发工业上重要菌株的关键。
[0403]
b部分:米曲霉。
[0404]
实例7.米曲霉pat3530 mad7d-aid-ugi表达质粒的构建。
[0405]
质粒pat3530(图10,seq id no:133)是一种载体,可用于将原型间隔子序列克隆到单个asisi限制位点。
[0406]
质粒pat3530包含以下元素:
[0407][0408][0409]
米曲霉靶标wa基因序列可以在序列表中作为seq id no:134找到。
[0410]
实例8.转化mad7d-aid-ugi质粒用于米曲霉菌株jal355中的wa基因失活。
[0411]
本实验的目的是证明mad7d-aid-ugi可以在米曲霉基因组中引入靶特异性c至t转换,并评估突变效应的效率,如针对mad7d-aid案例的实例5所示。据我们所知,没有人报道过mad7d连接的脱氨酶的活性,因此我们首先旨在阐明胞苷作为aid底物的靶标位置。为此,设计了六个在pks基因座上具有不同靶标位置的靶序列(表13),当mad7d-aid引入c至t突变时,每个靶序列都会形成提前终止密码子。c的靶标位置从pam近端开始编号。这些原型间隔子序列(表14)被克隆到pat3530的asisi消化位点,导致pat3532-pat3537的构建。
[0412]
表13.用于破坏米曲霉中wa基因的原型间隔子序列。潜在靶标“c”带有下划线。
[0413][0414][0415]
表14.用于构建pat3532-3537的寡dna。匹配原型间隔子的序列以大写显示。
[0416][0417]
接着,如米曲霉转化方法中所述,将质粒pat3530和pat3532-pat3537转化到米曲霉菌株jal355中。含有mad7d-aid-ugi和sgrna表达盒的质粒通过这些质粒上的pyrg基因保持为复制型质粒。此后,来自每次转化的所有具有白色孢子颜色的菌落和相应数量的绿色孢子颜色菌落在非选择性平板(含有尿苷)上进行孢子分离,从而丢失了复制型质粒。通过靶基因座测序进一步分析所有重新分离的转化体。
[0418]
表15.wa靶向mad7d-aid-ugi米曲霉转化总结
[0419][0420]
如表15所示,获得了具有有效sgrna的白色孢子突变体。看看这些白色克隆的pks基因是否如预期发生突变,如下针对6个靶标将基因组dna分离,并将靶标基因座pcr扩增:
[0421]
对于pat3532和pat3533靶标:用oat3912:5'tccaagttctttgcatgc 3’(seq id no:147)和oat3613:5’tatctcaggttaggctcg 3’(seq id no:148)进行pcr扩增,得到500bp的扩增子。
[0422]
对于pat3534靶标:用ojal188:5'ccatggtccttaccatgc 3’(seq id no:149)和
oat3616:5’tatttatctcccgatagtcatc 3’(seq id no:150)进行pcr扩增,得到812bp的扩增子。
[0423]
对于pat3535靶标:用oat919:5'ctggctgtcaaggcttcc 3’(seq id no:151)和oat1040:5’tttgtggtgcagcttgaat 3’(seq id no:152)进行pcr扩增,得到733bp的扩增子。
[0424]
对于pat3536靶标:用ojal188和oat967:5’gcgaacacgaaccctac3’(seq id no:153)进行pcr扩增,得到2033bp的扩增子。
[0425]
对于pat3537靶标:用ojal188和oat3618:5’tcaaagcagcaaactcc 3’(seq id no:154)进行pcr扩增,得到2312bp的扩增子。
[0426]
然后通过qiaquick凝胶提取试剂盒(凯杰公司)对扩增子进行凝胶纯化并使用用于pcr扩增的引物进行测序,以确定靶向区域的突变模式。所有分离的绿色孢子菌落在靶标区域或任何测序的扩增子上均未显示突变。对于来自pat3532、pat3533、pat3534和pat3535的白色孢子菌落,它们都没有在靶位点或扩增子的其余部分发生突变。对于来自pat3536的白色孢子菌落,一个菌落具有导致终止密码子的预期c17突变,而另一个菌落在c8处具有沉默突变,表明在wa基因的其他地方发生了另一个突变。对于来自pat3537的白色孢子菌落,两个菌落具有相同的预期c15突变,导致终止密码子。
[0427]
在米曲霉中产生的实例支持了黑曲霉中的发现,并表明,mad7d-aid-ugi的主要靶标窗口是c8至c17,并且mad7d-aid-ugi系统也可以在米曲霉中引入c至t突变。
[0428]
c部分:地衣芽孢杆菌
[0429]
实例9:地衣芽孢杆菌中mad7d-aid-ugi表达质粒的构建
[0430]
引入质粒pmdt452用于在芽孢杆菌中表达mad7d-aid-ugi。在可移动的质粒载体pbc16中,质粒pmdt452包含mad7d-aid-ugi编码序列,该序列上游侧翼为启动子pamyl4199(美国专利号6,100,063)且下游侧翼为克劳氏芽孢杆菌的aprh转录终止子(bernhard等人(1978):bacteriocin and antibiotic resistance plasmids in bacillus cereus and bacillus subtilis.[蜡状芽孢杆菌和枯草芽孢杆菌中的细菌素和抗生素抗性质粒]j.bacteriol.[细菌学杂志]133,897-903)。通过转化将质粒pmdt452引入接合供体菌株枯草芽孢杆菌pp3724中,从而生产菌株pp3724/pmdt452。
[0431]
pmdt452的图谱示于图11中,mad7d-aid-ugi编码区的dna序列如seq id no:158所示,并且相应的氨基酸序列如seq id no:159所示。
[0432]
实例10.在地衣芽孢杆菌中构建用于表达靶向dsred基因的sgrna的质粒
[0433]
构建质粒pmdt454和pmdt455用于表达地衣芽孢杆菌菌株mdt545中靶向dsred基因的sgrna。每个质粒包含sgrna盒,其中sgrna在基于温度敏感的pamβ1衍生质粒pwt的质粒载体中(bidnenko等人(1998):in vivo relations between pamβ1-encoded type i topoisomerase and plasmid replication.[pamβ1编码的i型拓扑异构酶与质粒复制之间的体内关系]mol.microbiol.[分子微生物学]28,1005-1016)从pamyqsc启动子(pr
短“共有”amyq
;美国专利号6,255,076)表达并包含质粒pub110的转移起点orit(selinger,l.b.,mcgregor,n.f.,khachatourians,g.g.和hynes,m.f.(1990))。通过芽孢杆菌质粒pxo503动员密切相关的质粒pub110和pbc16需要反式作用开放阅读框β(j.bacteriol.[细菌学杂志],172,3290-3297)用于通过接合动员。设计了两个在dsred编码序列内具有不同靶标位置的原型间隔子(表16),当mad7d-aid引入c至t突变时,每个靶标序列都会形成提前
终止密码子。通过转化将质粒pmdt454和pmdt455引入到接合供体菌株枯草芽孢杆菌pp3724中,分别产生菌株pp3724/pmdt454和pp3724/pmdt455。
[0434]
图12显示了sgrna质粒pmdt454和pmdt455的结构图。作为sgrna质粒的一个实例,pmdt454 dna序列如seq id no:160所示。
[0435]
表16.用于破坏dsred基因的原型间隔子序列。潜在靶标c带有下划线。
[0436][0437]
实例11.将用于dsred基因失活的mad7d-aid-ugi质粒和sgrna质粒引入地衣芽孢杆菌
[0438]
地衣芽孢杆菌mdt545是地衣芽孢杆菌sj1904的衍生物,包含插入染色体的amyl基因座的dsred表达盒和插入染色体的xyla基因座的gfp表达盒。插入的dsred表达盒的图谱如图13所示,对应的dna序列如seq id no:163所示;dsred编码区的dna序列如seq id no:164所示。
[0439]
使用接合供体菌株pp3724/pmdt452,通过接合将质粒pmdt452引入地衣芽孢杆菌mdt545中,在34℃下选择对红霉素的抗性。将所得菌株命名为mdt545/pmdt452。
[0440]
使用接合供体菌株pp3724/pmdt454和pp3724/pmdt455,通过接合将sgrna质粒pmdt454和pmdt455分别引入地衣芽孢杆菌mdt545/pmdt452中,在34℃时选择对红霉素和四环素的抗性。
[0441]
由于dsred的表达,菌株mdt545的菌落呈红色。由于gfp的表达,破坏dsred会导致菌株呈绿色。然而,mad7d与dsred基因的结合也会导致基因沉默,从而导致dsred表达减少和菌落呈绿色。如果任一质粒丢失,由于dsred基因沉默而呈现绿色的菌落将再次呈现红色,而由于dsred基因突变而呈现绿色的菌落即使其中一个质粒丢失,仍将保持绿色。因此,为了区分dsred基因突变的菌落和dsred基因仅沉默的菌落,必须从抗生素选择中去除转导接合物,以使一种或两种质粒丢失。
[0442]
在34℃下孵育2天后,将sgrna质粒接合的选择性板用2ml lb肉汤淹没,并使用无菌涂布器将转导接合物菌落悬浮到肉汤中。然后向补充有2μg/ml红霉素和15μg/ml四环素的新鲜lb肉汤接种每次接合产生的细胞悬液,并在34℃下伴随250rpm摇动孵育。孵育过夜后,向不含抗生素的新鲜lb肉汤接种每个培养物,并在50℃下伴随250rpm摇动以促进温度敏感性sgrna质粒的损失。
[0443]
孵育过夜后,将lb培养物的稀释物铺在lb琼脂上并在34℃下孵育。挑选绿色菌落,并通过pcr从16个绿色菌落/接合中扩增dsred编码区。将pcr用exosap-it pcr产物清洁试
剂盒(应用生物系统公司(applied biosystems))处理并测序以确定靶向区域的突变模式。从表17中可以看出,测序结果表明预期的无义突变之一已经发生在每个绿色菌株的靶向原型间隔区,这证实了本发明的核碱基编辑复合物也在细菌细胞中有效地起作用。地衣芽孢杆菌中生成的实例支持米曲霉和黑曲霉中的发现,并且表明mad7d-aid-ugi系统也可以将c至t突变引入到地衣芽孢杆菌中。
[0444]
表17.靶向dsred的mad7d-aid-ugi地衣芽孢杆菌接合的结果总结
[0445][0446][0447]
实施例列表
[0448]
1.一种核碱基编辑复合物,其包含以下、基本上由以下组成或由以下组成:
[0449]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0450]
b)核碱基编辑结构域。
[0451]
2.根据实施例1所述的核碱基编辑复合物,其中该无催化活性rna指导的内切核酸酶包含在对应于seq id no:126的位置877的位置处的氨基酸改变;优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、tyr、或val取代;最优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala取代。
[0452]
3.根据前述实施例中任一项所述的核碱基编辑结构域,其中该无催化活性rna指导的内切核酸酶包含seq id no:126或seq id no:155,基本上由seq id no:126或seq id no:155组成,或由seq id no:126或seq id no:155组成。
[0453]
4.根据前述实施例中任一项所述的核碱基编辑复合物,其中该核碱基编辑结构域是胞嘧啶碱基编辑器(cbe)。
[0454]
5.根据实施例4所述的核碱基编辑复合物,其中该核碱基编辑结构域是apobec1/aid家族的胞嘧啶碱基编辑器;优选地,该核碱基编辑结构域是apobec1或cda1,特别是pmcda1。
[0455]
6.根据实施例4所述的核碱基编辑复合物,其中该核碱基编辑结构域包含多肽或由多肽组成,该多肽与seq id no:128具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该核酸酶编辑结构域包含seq id no:128,基本上由seq id no:128组成,或由seq id no:128组成。
[0456]
7.根据实施例4-6中任一项所述的核碱基编辑复合物,其进一步包含尿嘧啶dna糖基化酶抑制剂(ugi),其中优选地,该尿嘧啶dna糖基化酶抑制剂与seq id no:132具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。最优选地,该尿嘧啶dna糖基化酶抑制剂包含seq id no:132,基本上由seq id no:132组成,或由seq id no:132组成。
[0457]
8.根据实施例1-2中任一项所述的核碱基编辑复合物,其中该核碱基编辑结构域是腺嘌呤碱基编辑器(abe);优选地,该核碱基编辑结构域选自由以下组成的组:tada、tada*、tada同源二聚体和tada-tada*异源二聚体;最优选地,该核碱基编辑结构域是tada-tada*异源二聚体。
[0458]
9.根据前述实施例中任一项所述的核碱基编辑复合物,其中该无催化活性rna指导的内切核酸酶和该核碱基编辑结构域以末端-末端方式融合或经由接头多肽连接;优选地,该无催化活性rna指导的内切核酸酶、该接头多肽和该核碱基编辑结构域被框内编码并表达为单个多肽。
[0459]
10.根据实施例9所述的核碱基编辑复合物,其中该接头多肽包含至少10个氨基酸残基;优选地,该接头多肽包含至少50个氨基酸残基;最优选地,该接头多肽包含至少100个氨基酸残基。
[0460]
11.根据实施例10-11中任一项所述的核碱基编辑复合物,其中该接头多肽与seq id no:130具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该接头多肽包含seq id no:130,基本上由seq id no:130组成,或由seq id no:130组成。
[0461]
12.一种编码核碱基编辑复合物的多核苷酸,该多核苷酸包含以下、基本上由以下组成或由以下组成:
[0462]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0463]
b)核碱基编辑结构域。
[0464]
13.根据实施例12所述的多核苷酸,其中该无催化活性rna指导的内切核酸酶和该核碱基编辑结构域被框内编码并表达为单个多肽。
[0465]
14.根据实施例12-13中任一项所述的多核苷酸,其进一步包含编码接头多肽的第三多核苷酸,其中该第三多核苷酸位于第一多核苷酸的3’端和第二多核苷酸的5’端之间,并且其中该第一多核苷酸、第二多肽和第三多肽被框内编码并表达为单个多肽。
[0466]
15.根据实施例12-14中任一项所述的多核苷酸,其中该无催化活性rna指导的内切核酸酶包含在对应于seq id no:126的位置877的位置处的氨基酸改变;优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、tyr、或val取代;最优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala取代。
[0467]
16.根据实施例12-15中任一项所述的多核苷酸,其中该无催化活性rna指导的内切核酸酶包含seq id no:126或seq id no:155,基本上由seq id no:126或seq id no:155
组成,或由seq id no:126或seq id no:155组成。
[0468]
17.根据实施例12-16中任一项所述的多核苷酸,其中该核碱基编辑结构域是胞嘧啶碱基编辑器(cbe)。
[0469]
18.根据实施例17所述的多核苷酸,其中该核碱基编辑结构域是apobec1/aid家族的胞嘧啶碱基编辑器;优选地,该核碱基编辑结构域是apobec1或cda1,特别是pmcda1。
[0470]
19.根据实施例17所述的多核苷酸,其中该核碱基编辑结构域包含多肽或由多肽组成,该多肽与seq id no:128具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该核酸酶编辑结构域包含seq id no:128,基本上由seq id no:128组成,或由seq id no:128组成。
[0471]
20.根据实施例12-19中任一项所述的多核苷酸,其进一步包含尿嘧啶dna糖基化酶抑制剂(ugi),其中优选地,该尿嘧啶dna糖基化酶抑制剂与seq id no:132具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。最优选地,该尿嘧啶dna糖基化酶抑制剂包含seq id no:132,基本上由seq id no:132组成,或由seq id no:132组成。
[0472]
21.根据实施例12-16中任一项所述的多核苷酸,其中该核碱基编辑结构域是腺嘌呤碱基编辑器(abe);优选地,该核碱基编辑结构域选自由以下组成的组:tada、tada*、tada同源二聚体和tada-tada*异源二聚体;最优选地,该核碱基编辑结构域是tada-tada*异源二聚体。
[0473]
22.根据实施例14-21中任一项所述的多核苷酸,其中该接头多肽包含至少10个氨基酸残基;优选地,该接头多肽包含至少50个氨基酸残基;最优选地,该接头多肽包含至少100个氨基酸残基。
[0474]
23.根据实施例14-22中任一项所述的多核苷酸,其中该接头多肽与seq id no:130具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该接头多肽包含seq id no:130,基本上由seq id no:130组成,或由seq id no:130组成。
[0475]
24.一种包含编码核碱基编辑复合物的多核苷酸的核酸构建体,该核酸构建体包含以下、基本上由以下组成或由以下组成:
[0476]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0477]
b)核碱基编辑结构域。
[0478]
25.根据实施例24所述的核酸构建体,其中该无催化活性rna指导的内切核酸酶和该核碱基编辑结构域被框内编码并表达为单个多肽。
[0479]
26.根据实施例24-25中任一项所述的核酸构建体,其进一步包含编码接头多肽的第三多核苷酸,其中该第三多核苷酸位于第一多核苷酸的3’端和第二多核苷酸的5’端之间,并且其中该第一多核苷酸、第二多肽和第三多肽被框内编码并表达为单个多肽。
[0480]
27.根据实施例24-26中任一项所述的核酸构建体,其中该无催化活性rna指导的
内切核酸酶包含在对应于seq id no:126的位置877的位置处的氨基酸改变;优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、tyr、或val取代;最优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala取代。
[0481]
28.根据实施例24-27中任一项所述的核酸构建体,其中该无催化活性rna指导的内切核酸酶包含seq id no:126或seq id no:155,基本上由seq id no:126或seq id no:155组成,或由seq id no:126或seq id no:155组成。
[0482]
29.根据实施例24-28中任一项所述的核酸构建体,其中该核碱基编辑结构域是胞嘧啶碱基编辑器(cbe)。
[0483]
30.根据实施例29所述的核酸构建体,其中该核碱基编辑结构域是apobec1/aid家族的胞嘧啶碱基编辑器;优选地,该核碱基编辑结构域是apobec1或cda1,特别是pmcda1。
[0484]
31.根据实施例29-30所述的核酸构建体,其中该核碱基编辑结构域包含多肽或由多肽组成,该多肽与seq id no:128具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该核酸酶编辑结构域包含seq id no:128,基本上由seq id no:128组成,或由seq id no:128组成。
[0485]
32.根据实施例24-31中任一项所述的核酸构建体,其进一步包含尿嘧啶dna糖基化酶抑制剂(ugi),其中优选地,该尿嘧啶dna糖基化酶抑制剂与seq id no:132具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。最优选地,该尿嘧啶dna糖基化酶抑制剂包含seq id no:132,基本上由seq id no:132组成,或由seq id no:132组成。
[0486]
33.根据实施例24-28中任一项所述的核酸构建体,其中该核碱基编辑结构域是腺嘌呤碱基编辑器(abe);优选地,该核碱基编辑结构域选自由以下组成的组:tada、tada*、tada同源二聚体和tada-tada*异源二聚体;最优选地,该核碱基编辑结构域是tada-tada*异源二聚体。
[0487]
34.根据实施例26-33中任一项所述的核酸构建体,其中该接头多肽包含至少10个氨基酸残基;优选地,该接头多肽包含至少50个氨基酸残基;最优选地,该接头多肽包含至少100个氨基酸残基。
[0488]
35.根据实施例26-34中任一项所述的核酸构建体,其中该接头多肽与seq id no:130具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该接头多肽包含seq id no:130,基本上由seq id no:130组成,或由seq id no:130组成。
[0489]
36.一种表达载体,其包含:
[0490]
i)编码核碱基编辑复合物的多核苷酸,该多核苷酸包含以下、基本上由以下组成或由以下组成:
[0491]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0492]
b)核碱基编辑结构域;或
[0493]
ii)包含编码核碱基编辑复合物的多核苷酸的核酸构建体,该核酸构建体包含以下、基本上由以下组成或由以下组成:
[0494]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0495]
b)核碱基编辑结构域。
[0496]
37.根据实施例36所述的表达载体,其中该无催化活性rna指导的内切核酸酶和该核碱基编辑结构域被框内编码并表达为单个多肽。
[0497]
38.根据实施例36-37中任一项所述的表达载体,其进一步包含编码接头多肽的第三多核苷酸,其中该第三多核苷酸位于第一多核苷酸的3’端和第二多核苷酸的5’端之间,并且其中该第一多核苷酸、第二多肽和第三多肽被框内编码并表达为单个多肽。
[0498]
39.根据实施例36-38中任一项所述的表达载体,其中该无催化活性rna指导的内切核酸酶包含在对应于seq id no:126的位置877的位置处的氨基酸改变;优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、tyr、或val取代;最优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala取代。
[0499]
40.根据实施例36-39中任一项所述的表达载体,其中该无催化活性rna指导的内切核酸酶包含seq id no:126或seq id no:155,基本上由seq id no:126或seq id no:155组成,或由seq id no:126或seq id no:155组成。
[0500]
41.根据实施例36-40中任一项所述的表达载体,其中该核碱基编辑结构域是胞嘧啶碱基编辑器(cbe)。
[0501]
42.根据实施例41所述的表达载体,其中该核碱基编辑结构域是apobec1/aid家族的胞嘧啶碱基编辑器;优选地,该核碱基编辑结构域是apobec1或cda1,特别是pmcda1。
[0502]
43.根据实施例41-42所述的表达载体,其中该核碱基编辑结构域包含多肽或由多肽组成,该多肽与seq id no:128具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该核酸酶编辑结构域包含seq id no:128,基本上由seq id no:128组成,或由seq id no:128组成。
[0503]
44.根据实施例36-43中任一项所述的表达载体,其进一步包含尿嘧啶dna糖基化酶抑制剂(ugi),其中优选地,该尿嘧啶dna糖基化酶抑制剂与seq id no:132具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。最优选地,该尿嘧啶dna糖基化酶抑制剂包含seq id no:132,基本上由seq id no:132组成,或由seq id no:132组成。
[0504]
45.根据实施例36-40中任一项所述的表达载体,其中该核碱基编辑结构域是腺嘌呤碱基编辑器(abe);优选地,该核碱基编辑结构域选自由以下组成的组:tada、tada*、tada同源二聚体和tada-tada*异源二聚体;最优选地,该核碱基编辑结构域是tada-tada*异源二聚体。
[0505]
46.根据实施例38-45中任一项所述的表达载体,其中该接头多肽包含至少10个氨基酸残基;优选地,该接头多肽包含至少50个氨基酸残基;最优选地,该接头多肽包含至少100个氨基酸残基。
[0506]
47.根据实施例38-46中任一项所述的表达载体,其中该接头多肽与seq id no:130具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该接头多肽包含seq id no:130,基本上由seq id no:130组成,或由seq id no:130组成。
[0507]
48.一种宿主细胞,其包含:
[0508]
i)核碱基编辑复合物,其包含以下、基本上由以下组成或由以下组成:
[0509]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0510]
b)核碱基编辑结构域;
[0511]
ii)编码核碱基编辑复合物的多核苷酸,该多核苷酸包含以下、基本上由以下组成或由以下组成:
[0512]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0513]
b)核碱基编辑结构域;
[0514]
iii)包含编码核碱基编辑复合物的多核苷酸的核酸构建体,该核酸构建体包含以下、基本上由以下组成或由以下组成:
[0515]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0516]
b)核碱基编辑结构域;和/或
[0517]
iv)表达载体,其包含:
[0518]
a)编码核碱基编辑复合物的多核苷酸,该多核苷酸包含以下、基本上由以下组成或由以下组成:
[0519]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0520]
b)核碱基编辑结构域;或
[0521]
b)包含编码核碱基编辑复合物的多核苷酸的核酸构建体,该核酸构建体包含以下、基本上由以下组成或由以下组成:
[0522]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有
至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0523]
b)核碱基编辑结构域。
[0524]
49.根据实施例48所述的宿主细胞,其是原核或真核宿主细胞。
[0525]
50.根据实施例48-49中任一项所述的宿主细胞,其为细菌宿主细胞;优选地该细菌宿主细胞是芽孢杆菌属、埃希氏菌属、乳杆菌属、乳球菌属、链球菌属或链霉菌属细胞;更优选地,该细菌宿主细胞选自由以下组成的组:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、解淀粉芽孢杆菌植物亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、苏云金芽孢杆菌、大肠杆菌、嗜酸乳杆菌、淀粉乳杆菌、短乳杆菌、副干酪乳杆菌、纤维二糖乳杆菌、卷曲乳杆菌、弯曲乳杆菌、德氏乳杆菌保加利亚亚种、德氏乳杆菌乳酸亚种、发酵乳杆菌、禾口鸡乳杆菌、格氏乳杆菌、瑞士乳杆菌、约氏乳杆菌、植物乳杆菌、罗伊氏乳杆菌、雷曼氏乳酸杆菌、唾液乳杆菌、韩中大乳球菌、福尔摩沙乳球菌、富士山乳球菌、格氏乳球菌、乳酸乳球菌、鱼乳球菌、植物乳球菌、棉子糖乳球菌、中国台湾乳球菌、似马链球菌、酿脓链球菌、乳房链球菌、马链球菌兽疫亚种、不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞;最优选地,该细菌宿主细胞是地衣芽孢杆菌细胞。
[0526]
51.根据实施例48-49中任一项所述的宿主细胞,其为丝状真菌宿主细胞;优选地,该真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(coriolus)、隐球菌属、线黑粉菌科(filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(phlebia)、瘤胃壶菌属、侧耳属(pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(trametes)或木霉属细胞;更优选地,该丝状真菌宿主细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡孔菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞;最优选地,该丝状真菌宿主细胞是黑曲霉、米曲霉或里氏木霉细胞。
[0527]
52.根据实施例48-49中任一项所述的宿主细胞,其为酵母宿主细胞;优选地,该酵母宿主细胞是假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属和耶罗维亚酵母属细胞;更优选地,该酵母宿主细胞选自由以下组成的组:乳酸克鲁维酵母、巴斯德毕赤酵母、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、和解脂耶罗维亚酵母细胞;最优选地,该酵母宿主细胞是巴斯德毕赤酵母细胞。
[0528]
53.根据实施例48-49中任一项所述的宿主细胞,其为哺乳动物宿主细胞;优选地,该哺乳动物宿主细胞是小鼠、大鼠或人细胞。
[0529]
54.根据实施例48-53中任一项所述的宿主细胞,其中该无催化活性rna指导的内切核酸酶和该核碱基编辑结构域被框内编码并表达为单个多肽。
[0530]
55.根据实施例48-54中任一项所述的宿主细胞,其中该无催化活性rna指导的内切核酸酶和该核碱基编辑结构域以末端-末端方式融合或经由接头多肽连接;优选地,该无催化活性rna指导的内切核酸酶、该接头多肽和该核碱基编辑结构域被框内编码并表达为单个多肽。
[0531]
56.根据实施例48-55中任一项所述的宿主细胞,其中该无催化活性rna指导的内切核酸酶包含在对应于seq id no:126的位置877的位置处的氨基酸改变;优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、tyr、或val取代;最优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala取代。
[0532]
57.根据实施例48-56中任一项所述的宿主细胞,其中该无催化活性rna指导的内切核酸酶包含seq id no:126或seq id no:155,基本上由seq id no:126或seq id no:155组成,或由seq id no:126或seq id no:155组成。
[0533]
58.根据实施例48-57中任一项所述的宿主细胞,其中该核碱基编辑结构域是胞嘧啶碱基编辑器(cbe)。
[0534]
59.根据实施例58所述的宿主细胞,其中该核碱基编辑结构域是apobec1/aid家族的胞嘧啶碱基编辑器;优选地,该核碱基编辑结构域是apobec1或cda1,特别是pmcda1。
[0535]
60.根据实施例58-59所述的宿主细胞,其中该核碱基编辑结构域包含多肽或由多肽组成,该多肽与seq id no:128具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该核酸酶编辑结构域包含seq id no:128,基本上由seq id no:128组成,或由seq id no:128组成。
[0536]
61.根据实施例48-60中任一项所述的宿主细胞,其中该核碱基编辑复合物进一步包含尿嘧啶dna糖基化酶抑制剂(ugi),其中优选地,该尿嘧啶dna糖基化酶抑制剂与seq id no:132具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。最优选地,该尿嘧啶dna糖基化酶抑制剂包含seq id no:132,基本上由seq id no:132组成,或由seq id no:132组成。
[0537]
62.根据实施例48-57中任一项所述的宿主细胞,其中该核碱基编辑结构域是腺嘌呤碱基编辑器(abe);优选地,该核碱基编辑结构域选自由以下组成的组:tada、tada*、tada同源二聚体和tada-tada*异源二聚体;最优选地,该核碱基编辑结构域是tada-tada*异源二聚体。
[0538]
63.根据实施例55-62中任一项所述的宿主细胞,其中该接头多肽包含至少10个氨基酸残基;优选地,该接头多肽包含至少50个氨基酸残基;最优选地,该接头多肽包含至少100个氨基酸残基。
[0539]
64.根据实施例55-63中任一项所述的宿主细胞,其中该接头多肽与seq id no:
130具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该接头多肽包含seq id no:130,基本上由seq id no:130组成,或由seq id no:130组成。
[0540]
65.一种修饰dna靶序列中至少一个核碱基的方法,该方法包括:
[0541]
i)提供核碱基编辑复合物,其包含以下、基本上由以下组成或由以下组成:
[0542]
a)无催化活性rna指导的内切核酸酶,其与seq id no:126或seq id no:155具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;以及
[0543]
b)核碱基编辑结构域;
[0544]
其中该核碱基编辑复合物与与该dna靶序列互补并能够与该dna靶序列杂交的grna复合;以及
[0545]
ii)使该核碱基编辑复合物与该dna靶序列接触;
[0546]
其中该dna靶序列中的至少一个核碱基被转化为不同的核碱基而不在目的dna序列中引入双链断裂。
[0547]
66.根据实施例65所述的方法,其中该无催化活性rna指导的内切核酸酶包含在对应于seq id no:126的位置877的位置处的氨基酸改变;优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、tyr、或val取代;最优选地,在对应于seq id no:126的位置877的位置处的氨基酸被ala取代。
[0548]
67.根据实施例65-66中任一项所述的方法,其中该无催化活性rna指导的内切核酸酶包含seq id no:126或seq id no:155,基本上由seq id no:126或seq id no:155组成,或由seq id no:126或seq id no:155组成。
[0549]
68.根据实施例65-67中任一项所述的方法,其中该核碱基编辑结构域是胞嘧啶碱基编辑器(cbe)。
[0550]
69.根据实施例68所述的方法,其中该核碱基编辑结构域是apobec1/aid家族的胞嘧啶碱基编辑器;优选地,该核碱基编辑结构域是apobec1或cda1,特别是pmcda1。
[0551]
70.根据实施例68-69所述的方法,其中该核碱基编辑结构域包含多肽或由多肽组成,该多肽与seq id no:128具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该核酸酶编辑结构域包含seq id no:128,基本上由seq id no:128组成,或由seq id no:128组成。
[0552]
71.根据实施例68-70中任一项所述的方法,其进一步包含尿嘧啶dna糖基化酶抑制剂(ugi),其中优选地,该尿嘧啶dna糖基化酶抑制剂与seq id no:132具有至少80%,例如,如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。最优选地,该尿嘧啶dna糖基化酶抑制剂包含seq id no:132,基本上由seq id no:132组成,或由seq id no:132组成。
[0553]
72.根据实施例65-67中任一项所述的方法,其中该核碱基编辑结构域是腺嘌呤碱基编辑器(abe);优选地,该核碱基编辑结构域选自由以下组成的组:tada、tada*、tada同源
二聚体和tada-tada*异源二聚体;最优选地,该核碱基编辑结构域是tada-tada*异源二聚体。
[0554]
73.根据实施例65-72中任一项所述的方法,其中该无催化活性rna指导的内切核酸酶和该核碱基编辑结构域以末端-末端方式融合或经由接头多肽连接;优选地,该无催化活性rna指导的内切核酸酶、该接头多肽和该核碱基编辑结构域被框内编码并表达为单个多肽。
[0555]
74.根据实施例73所述的方法,其中该接头多肽包含至少10个氨基酸残基;优选地,该接头多肽包含至少50个氨基酸残基;最优选地,该接头多肽包含至少100个氨基酸残基。
[0556]
75.根据实施例73-74中任一项所述的方法,其中该接头多肽与seq id no:130具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;优选地,该接头多肽包含seq id no:130,基本上由seq id no:130组成,或由seq id no:130组成。
[0557]
76.根据实施例65-75中任一项所述的方法,其中该dna靶序列包含多核苷酸,该多核苷酸包含与该grna至少85%互补并且能够与该grna杂交的21个核苷酸;优选地,该21个核苷酸与grna至少90%、95%、97%、98%、99%或甚至100%互补并且能够与该grna杂交。
[0558]
77.根据实施例65-76中任一项所述的方法,其中该dna靶序列的侧翼为由该无催化活性rna指导的内切核酸酶识别的功能性原型间隔子相邻基序(pam);优选地,该pam序列是5
’‑
tttn-3’或5
’‑
cttn-3’;更优选地,该pam序列是5
’‑
tttn-3’;最优选地,该pam序列是5
’‑
tttc-3’或5
’‑
tttg-3’。
[0559]
78.根据实施例77所述的方法,其中该dna靶序列位于该pam序列的3’端;优选地,该dna靶序列位于与该pam序列的3'端直接相邻的位置。
[0560]
79.根据实施例65-78中任一项所述的方法,其中该dna靶序列包含在编码多肽的可读框中或包含在启动子区域中;优选地,该dna靶序列编码一个或多个选自由以下组成的组的酶:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;优选地,该一个或多个酶是α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、天冬酰胺酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡聚糖转移酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、和木聚糖酶。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献