一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

优化线粒体蛋白表达和递送的方法与流程

2022-04-27 07:41:39 来源:中国专利 TAG:

优化线粒体蛋白表达和递送的方法
发明领域
1.本发明涉及使用单一表达载体同时表达和递送两种或多种蛋白质至线粒体的方法。还描述了表达载体和包含该载体的宿主细胞。当蛋白质是基因组编辑试剂时,本发明还涉及表达载体改变线粒体异质性水平和治疗线粒体疾病的用途。


背景技术:

2.线粒体疾病是一组广泛的遗传性多系统病症,其中很大一部分是通过线粒体dna突变(mtdna)传播的,最低患病率为5,000名成人中的1人。人类mtdna是一个小的双链多拷贝基因组,每个细胞存在有约100

10,000个拷贝。在疾病状态下,突变的mtdna通常与异质中的野生型mtdna共存,并且由异质性mtdna突变引起的病况严重程度与突变负荷相关。在症状表现之前必须超过》60%突变mtdna负荷的阈值效应是异质性mtdna疾病的明确特征。
3.目前,还没有治愈线粒体疾病的方法。对于可以生育的线粒体患者,遗传咨询和pgd(植入前遗传诊断)是目前预防疾病传播的最佳选择。然而,pgd只能降低而不是消除传播疾病的风险。最近开发的线粒体替代技术涉及对患者和供体卵母细胞的一系列操作,从而产生携带来自三个不同来源的遗传物质的胚胎。由于这些原因,线粒体替代技术引起了生物学、医学和伦理学方面的关注。
4.将异质性mtdna比率转变(shift)到症状表现阈值以下的新替代治疗方法已经推动了许多研究,以治疗这些无法治愈和基本上无法治愈的疾病。一种这样的方法依赖于使用例如基因组编辑工具(例如线粒体靶向锌指核酸酶(mtzfn))在mtdna中产生位点特异性双链断裂。由于哺乳动物线粒体缺乏有效的dna双链断裂(dsb)修复途径,因此将dsb选择性引入突变mtdna会导致这些分子的快速降解。由于mtdna拷贝数保持在细胞类型特异性稳态水平,选择性消除突变mtdna会刺激剩余mtdna库的复制,从而引起异质性比率的转变。
5.我们最近开发了一种用于异质性线粒体疾病的体内实验基因疗法。我们在小鼠模型中使用带有mtzfn的基因组编辑来特异性消除突变的致病性mtdna,从而允许wt mtdna取而代之。在通过全身施用的腺相关病毒(aav)递送mtzfn后,突变mtdna的消除(或至少数量的减少)与分子和生化表型的逆转有关。这种序列定制的线粒体基因编辑方法为迄今为止无法治愈的线粒体疾病提供了治愈的前景。
6.迄今为止,基于mtzfn的疗法依赖于使用两个单独的载体将两种不同的zfn单体递送到同一细胞,这需要依赖于高剂量的双重转染/注射用于发挥功效。与许多疗法一样,mtzfn基因编辑方法必须在剂量太激进(例如导致mtdna过度消耗)或太弱(未实现突变mtdna减少)之间找到治疗平衡。能够平衡功效与毒性的权衡是使mtzfn疗法成为可行治疗选择的关键。本发明解决了这种需要。
7.除了治疗线粒体疾病之外,还需要在一般水平上提高两种或多种药剂特别是治疗剂或诊断剂向细胞内细胞器例如线粒体的递送效率。同样,需要在功效和毒性之间取得平衡。本发明也解决了这种需要。
8.发明概述
9.通过本发明,我们例如通过将两个zfn单体置于同一aav病毒粒子中改进了线粒体(mt)基因组编辑例如mtzfn疗法。这种方法只允许生产用于治疗应用的单一的mtzfn-aav产品。这种方法应显著最小化因将mt核酸酶作为单体放置在单独的aav中而引起的监管(批准一种而不是两种产品)和生产成本问题。重要的是,它还允许在保持功效的同时施用低得多的病毒剂量,因为相同细胞的共同感染(如单体方法所要求的)不再是一个问题。
10.因此,在本发明的第一方面,提供了一种用于将至少两种蛋白质同时表达并递送至线粒体的核酸分子,该核酸分子包含编码第一线粒体定位信号(mls)和第一蛋白质的第一核酸序列以及编码第二线粒体定位信号和第二蛋白质的第二核酸序列,其中第一和第二核酸序列被至少一个核糖体跳跃序列隔开,并且其中第一和第二核酸序列可操作地连接到调节序列。
11.在优选的实施方案中,第一和第二核酸序列编码第一和第二蛋白质,其中第一和第二蛋白质之间氨基酸序列的序列同一性百分比高于核酸序列的序列同一性百分比。
12.在更优选的实施方案中,第一和第二核酸序列编码具有最小70%至90%氨基酸序列同一性和最大55%至70%核酸序列同一性的蛋白质。在进一步优选的实施方案中,第一和第二核酸序列编码具有最小80%至90%氨基酸序列同一性和最大60%至70%核酸序列同一性的蛋白质。在特定的实施方案中,第一和第二核酸序列编码具有最小82%氨基酸序列同一性和最大63%核酸序列同一性的蛋白质。
13.在替代或另外的实施方案中,第一和第二蛋白质的核酸序列不具有长于1至40bp、更优选6至30bp、更优选6至20bp,优选6至15bp,和甚至更优选9bp的序列同一性(在本文中也称为“同源性”)区段。
14.在本发明的另一方面,提供了一种用于将至少两种蛋白质同时表达并递送至线粒体的核酸分子,该核酸分子包含编码第一线粒体定位信号和第一蛋白质的第一核酸序列以及编码第二线粒体定位信号和第二蛋白质的第二核酸序列,其中第一和第二核酸序列编码具有最小70%至90%氨基酸序列同一性和最大50%至70%核酸序列同一性的蛋白质,并且其中第一和第二核酸序列被至少一个核糖体跳跃序列隔开,并且其中第一和第二核酸序列可操作地连接到调节序列。
15.在一个实施方案中,第二线粒体定位信号包含一个或多个掩蔽线粒体定位信号的n-末端氨基酸。在优选的实施方案中,第二线粒体定位信号包含n-末端脯氨酸。
16.在优选的实施方案中,第一和第二蛋白质包含dna结合多肽和核酸酶。
17.在另一个实施方案中,核糖体跳跃序列是编码2a肽的核酸序列。优选地,2a肽选自t2a、p2a、e2a和f2a。
18.在一个实施方案中,dna结合多肽是锌指dna结合结构域。在另一个优选的实施方案中,核酸酶是fokl。
19.在进一步的实施方案中,第一和第二核酸序列进一步编码核输出信号。
20.在另一个实施方案中,核酸分子包含在载体内。优选地,载体是病毒或非病毒载体。更优选地,病毒载体是腺相关病毒。
21.在一个实施方案中,调节序列是启动子。
22.在本发明的另一方面,提供了包含如本文所述的核酸分子的宿主细胞。
23.在本发明的进一步的方面,提供了用作药物的如本文所述的核酸分子。
24.在本发明的另一方面,提供了用于治疗线粒体疾病的如本文所述的核酸分子。
25.在本发明的进一步的方面,提供了一种治疗方法,该方法包括将如本文所述的核酸分子施用于有需要的患者或个体。
26.在本发明的又进一步的方面,提供了一种治疗线粒体疾病的方法,该方法包括将如本文所述的核酸分子施用于有需要的患者或个体。
27.在本发明的另一方面,提供了一种改变线粒体dna异质性的方法,该方法包括将如本文所述的核酸分子施用于靶细胞或组织。
28.在本发明的进一步的方面,提供了将至少一个单链和/或双链断裂引入线粒体dna的方法,该方法包括将如本文所述的核酸分子施用于靶细胞或组织。
29.在本发明的最后一个方面,提供了一种将至少两种蛋白质同时表达和递送至线粒体的方法,该方法包括如将本文所述的核酸分子施用于靶细胞或组织。优选地,线粒体中第一蛋白质的表达和/或输入高于线粒体中第二蛋白质的表达和/或输入。
附图说明
30.在以下非限制性附图中进一步描述本发明:
31.图1显示了mtzfn单体作为单个orf(开放阅读框)进入培养细胞的传递和有效mtdna异质性转变的证据。
32.(a)实验的一般工作流程示意图,该实验涉及用共表达mtzfn单体和荧光标记蛋白的质粒瞬时转染异质性细胞,基于facs选择表达mtzfn单体二者的细胞,和表型评估mtzfn处理的细胞。
33.(b)改进的策略,其涉及用共表达由x2a肽分隔的mtzfn单体的单个质粒将异质性细胞进行瞬时转染。
34.(c)使用mtzfn选择性降解m.8993t》g mtdna的策略的详细示意图。常规的二聚的、工程化的mtzfn指向与突变碱基位置相邻(compa,绿色)的序列或包括(narpd,红色)突变碱基位置相邻的序列。只有当指定的核苷酸发生突变时,两种单体才应与底物结合,而不是与野生型序列结合。dna双链断裂只能引入突变的mtdna分子中,导致异质性的转变。
35.(d)在体外初步实验中用m.8993t》g胞质杂种测试的x2a肽变体。
36.(e)蛋白质印迹显示mtzfn单体的表达,在m.8993t》g胞质杂种中由不同的x2a肽分隔。
37.(f)由不同x2a肽分隔的mtzfn导致的m.8993t》g异质性的转变。从含有指示水平的m.8993t》g的143b细胞(其通过mtzfn处理获得)的总dna样品中扩增的最后一个循环热pcr产物(mtdna nt位置8339-9334)的rflp分析。野生型细胞和100%m.8993t》g胞质杂种用作对照。
38.图2显示了与两个aav病毒粒子方法相比,作为t2a aav的mtzfn递送的递送和改进的体内作用的证据。
39.(a)mtzfn单体由t2a肽分隔,允许从单个orf表达两种蛋白质构建体。aav-mtzfn-t2a构建体的示意图:lrt(l/r),反向末端重复;cmv,巨细胞病毒启动子;wpre,土拨鼠肝炎病毒转录后调控元件;bgh pa,来自牛生长激素mrna的rna多聚腺苷酸化信号。mtzfn的线粒体靶向是由来自人线粒体atp合酶亚基f1β的49个氨基酸长的mls促进的。nes,核输出信号;
zfp,锌指肽;ha,血凝素标签。
40.(b)体内实验方案。mtm25和wtm1在单独的aav基因组(红色和蓝色六边形)中或在由t2a分隔的单个aav(紫色六边形)中编码,然后通过尾静脉(tv)注射施用。在注射后65天处死动物。
41.(c)来自耳朵[e]和心脏[h]总dna的m.5024c》t异质性的焦磷酸测序。绘制了m.5024c》t中的变化(δ)。黑色三角形表示aav剂量增加。对于单独的2x单体方法,剂量为:5*10
11
、1*10
12
和1*10
13
(分别为轮廓线、纯色、条纹条)。对于t2a方法,等效剂量为:2.5*10
11
、5*10
11
和5*10
12
(分别为轮廓线、纯色、条纹条)。动物数量:n=20(赋形物),n=4(所有其他条件)。误差棒表示s.e.m。进行的统计分析:双尾学生t检验。赋形物/中间剂量p《0.00001,赋形物/高剂量p《0.00001。中心的度量是平均值。
[0042]
(d)在(c)条件下通过定量pcr评估mtdna拷贝数。n=20(赋形物)和n=4(所有其他条件)。中心线是平均值,并且误差棒表示s.e.m。使用双尾学生t检验进行统计分析;p=0.007931。中央黑线表示平均值。**表示p《0.01,***表示p《0.001。
[0043]
图3显示了心脏中aav递送的mtzfn的时间依赖性异质性转变活性。在单独的aav基因组中编码的mtm25和wtm1通过尾静脉(tv)注射以5*10
12
vg aav滴度施用。在注射后65或130天处死动物。该图显示了来自耳朵[e]和心脏[h]总dna的m.5024c》t异质性的焦磷酸测序。绘制了m.5024c》t中的变化(δ)。黑色三角形表示注射后65或130天的时间增加。动物数量:n=20(赋形物),n=4(65天),n=4(130天)。误差棒表示s.e.m。进行的统计分析:双尾学生t检验。赋形物/中间剂量p《0.00001,赋形物/高剂量p《0.00001。中心的度量是平均值。
[0044]
图4是当mtzfn单体在单独的载体(“2x单体”)中递送时实现有效异质性所需的剂量与本发明的单个载体(“1xt2a”)相比的比较。
[0045]
*调整剂量以反映每个转导细胞内两种mtzfn单体的同时递送,并允许在单独的2x aav单体方法和单体1-t2a-单体2-aav方法之间进行直接比较。
[0046]
据此:5*10
11
单独的2x aav单体剂量相当于2.5*10
11
t2a剂量。
[0047]
****观察到拷贝数耗尽。
具体实施方式
[0048]
现在将进一步描述本发明。在以下段落中,更详细地限定本发明的不同方面。除非明确地相反指示,否则如此限定的每个方面可与任何其它方面组合。特别地,指示为优选或有利的任何特征可以与指示为优选或有利的任何其他一个或多个特征组合。
[0049]
除非另有说明,本发明的实践将使用本领域技术范围内的微生物学、组织培养、分子生物学、化学、生物化学、重组dna技术和生物信息学的常规技术。这些技术在文献中有充分的说明。
[0050]
如本文所用,词语“核酸”、“核酸序列”、“核苷酸”、“核酸分子”或“多核苷酸”旨在包括dna分子(例如cdna或基因组dna),rna分子(例如mrna),天然存在的、突变的、合成的dna或rna分子,以及使用核苷酸类似物产生的dna或rna的类似物。它可以是单链或双链的。这样的核酸或多核苷酸包括但不限于结构基因的编码序列、反义序列和不编码mrna或蛋白质产物的非编码调节序列。这些术语也涵盖基因。术语“基因”或“基因序列”广泛用于指与生物功能相关的dna核酸。因此,基因可以包括如基因组序列中的内含子和外显子,或者可
以仅包括如cdna中的编码序列,和/或可以包括与调节序列组合的cdna。
[0051]
术语“多肽”和“蛋白质”在本文中可互换使用,是指通过肽键连接在一起的任何长度的聚合形式的氨基酸。
[0052]
在本发明的一个方面,提供了一种用于将两种或更多种蛋白质同时表达并递送至线粒体的核酸分子,该核酸分子包含编码第一线粒体定位信号和第一蛋白质的第一核酸序列以及编码第二线粒体定位信号和第二蛋白质的第二核酸序列,其中第一和第二核酸序列被至少一个核糖体跳跃序列隔开,并且其中第一和第二核酸序列可操作地连接到调节序列。
[0053]
在一个实施方案中,这两种蛋白质可以是需要同时表达和递送至线粒体的任何两种蛋白质。
[0054]
蛋白质可以相同或不同。即,核酸分子可用于同时表达和递送两种或更多种相同蛋白质或不同蛋白质至线粒体。例如,前者可用于递送靶蛋白和该靶标的标记物(例如荧光标记物)。
[0055]
后者可能是有用的,例如,当这两种蛋白质在功能上相互依赖或协同作用时。例如,蛋白质可以是蛋白质复合物或寡聚体的单体或亚基。在一个实例中,蛋白质可以是锌指核酸酶(zfn)单体。如下所述,在一个实施方案中,蛋白质包含dna结合结构域和dna切割结构域或核酸酶,或由dna结合结构域和dna切割结构域或核酸酶组成。
[0056]
在一个实施方案中,当第一和第二核酸序列编码第一和第二蛋白质时,第一和第二蛋白质之间氨基酸序列的序列同一性百分比优选高于核酸序列的序列同一性百分比。
[0057]
在一个特定实施方案中,蛋白质的氨基酸序列为至少60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%同一性,但蛋白质的核苷酸序列低于氨基酸水平的序列同一性水平。例如,在一个实施方案中,蛋白质的核苷酸序列最大为55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%或75%同一性。在更优选的实施方案中,第一和第二核酸序列编码具有最小60%至99%氨基酸序列同一性和最大55%至70%核酸序列同一性的蛋白质。在进一步优选的实施方案中,第一和第二核酸序列编码具有最小70%至90%氨基酸序列同一性、更优选80%至90%氨基酸序列同一性和最大55%至60%核酸序列同一性的蛋白质。在特定的实施方案中,第一和第二核酸序列编码具有最小82%氨基酸序列同一性和最大63%核酸序列同一性的蛋白质。在另一个实例中,第一和第二核酸序列编码具有100%氨基酸序列同一性和最大57%核酸序列同一性的蛋白质。
[0058]
在替代或另外的实施方案中,第一和第二蛋白质的核酸序列不具有长于6至40bp、更优选6至30bp、更优选6至20bp,优选6至15bp,和甚至更优选9bp的序列同一性(在本文中也称为“同源性”)区段。
[0059]“同源核苷酸的区段”是指至少98%、99%或100%同一性的核苷酸。
[0060]
因此,编码至少一种蛋白质的核酸序列包含与编码另一种蛋白质的核酸序列的一个或多个修饰或差异,并且这些优选导致密码子水平的变化,即密码子偏倚的变化。这意味着尽管蛋白质的两个核酸序列如上所述不同,但由于遗传密码子的简并性,所得氨基酸序
列具有高水平的序列同一性,同样如上所述的。这在本文中被称为“重新编码”。
[0061]
在一个实施方案中,仅一种蛋白质被重新编码。在另一个实施方案中,两种蛋白质都被重新编码。在一个实施方案中,线粒体定位信号(mls)和/或蛋白质的核酸序列被重新编码,如本文所定义。然而,在替代实施方案中,如下所述,使用不同线粒体定位信号的第一和第二核苷酸序列代替重新编码。
[0062]
我们已经发现,重新编码第一和/或第二核酸序列显著增加核酸分子的成活力,特别是当核酸分子是载体,更特别是病毒载体例如腺相关病毒载体时。特别是,我们发现当核酸分子用于表达两种高度相似的蛋白质(即核苷酸水平的高水平序列同一性)时,我们观察到了载体内的大规模缺失。我们进一步发现,这些大规模缺失是由同源蛋白质编码基因/核苷酸序列的重组引起的。这是大规模缺失的原因是出乎意料的,特别是当载体是质粒时没有观察到此类缺失。然而,我们发现重新编码第一和/或第二核酸序列避免了大规模缺失并导致具有全长、忠实编码的核酸序列的高滴度病毒颗粒。
[0063]
因此,在本发明的另一方面,提供了一种用于将两种或更多种蛋白质同时表达并递送至线粒体的核酸分子,该核酸分子包含编码第一线粒体定位信号和第一蛋白质的第一核酸序列以及编码第二线粒体定位信号和第二蛋白质的第二核酸序列,其中第一和第二核酸序列被至少一个核糖体跳跃序列隔开,并且其中第一和第二核酸序列可操作地连接到调节序列。
[0064]
在一个实施方案中,第一核酸序列编码与第一蛋白质融合的n末端线粒体定位信号。类似地,第二核酸序列编码与第二蛋白质融合的n末端线粒体定位信号。
[0065]“线粒体定位信号”(mls)是指将蛋白质引导至线粒体的肽序列。通常,mls的长度为10-70个氨基酸,并且由形成两亲性螺旋的疏水性和带正电荷的氨基酸交替模式组成。mls序列的实例包括以下或其功能变体:
[0066][0067]
其他mls序列是技术人员已知的,并且包括描述于minczuk m等人,2006中的序列,该文献通过引用并入本文。
[0068]
在一个实施方案中,第一和第二核酸序列的mls的序列相同。在一个替代实施方案
中,第一蛋白质的mls序列和第二蛋白质的mls序列不同。
[0069]
在一个实施方案中,mls序列包含额外的氨基酸残基,优选地“掩蔽”mls的n末端额外的氨基酸,即,它减慢了靶向序列向线粒体的输入速率(与缺乏这种额外氨基酸的序列相比)。在优选的实施方案中,额外的氨基酸残基是脯氨酸残基。
[0070]“掩蔽”是指定位信号被部分禁用。也就是说,该蛋白质不像携带没有该额外氨基酸残基的mls的蛋白质那样有效地定位于线粒体。这在图1(e)中得到了例证。图1(e)是蛋白质印迹,其显示了线粒体锌指核酸酶(zfn)、narpd和compa的表达。compa是如本文所用的第二蛋白质并且在其mls序列上包含额外的n-末端脯氨酸(作为核糖体跳跃序列加工的结果)。由于mls在输入到线粒体时被切割,因此输入的蛋白质由较低的条带表示,而较高的条带代表尚未被摄入到线粒体中的具有mls的蛋白质。从图1(e)中可以看出,蛋白质1(narpd)比蛋白质2(compa)更容易输入。不同的输入速率是由不同的输入量隐含的,其中所述不同的输入量是由蛋白质2的mls掩蔽引起的。
[0071]
这具有显著的益处,特别是在这种情况下,其中第二zfn单体的较慢输入降低了脱靶效应的可能性。这显示在图2c和2d中。图2c显示,在两个aav病毒粒子的高剂量下,存在着异质性显著转变,但同样的剂量也伴随着拷贝数的显著减少(图2d)。相比之下,t2a aav病毒粒子还显著转变异质性,而不会在统计学上显著影响拷贝数(图2d)。
[0072]
在一个实施方案中,第一和/或第二核酸序列编码蛋白质,其中该蛋白质包含dna结合结构域和dna切割结构域或核酸酶,或由dna结合结构域和dna切割结构域或核酸酶组成。在一个实施方案中,该蛋白质可用于线粒体dna的靶向基因组修饰或靶向基因组编辑。
[0073]
靶向基因组修饰或靶向基因组编辑是一种基因组工程技术,其使用靶向dna双链断裂(dsb)通过同源重组(hr)介导的重组事件来刺激基因组编辑。然而,如上所述,当在线粒体环境中使用基因组编辑时,缺乏任何有效的修复途径意味着双链断裂的引入会导致靶向线粒体基因组的降解。当基因组编辑的靶标是致病性mtdna时,致病性mtdna基因组的突变降解改变或导致线粒体异质性向野生型状态转变。因此,这些方法在线粒体疾病的治疗中具有重要价值。
[0074]
为了通过引入位点特异性dna dsb实现有效的基因组编辑,可使用四种主要类别的可定制的dna结合蛋白:来源于微生物移动遗传元件的大范围核酸酶、基于真核转录因子的zf核酸酶、来自黄单胞菌属细菌的转录激活因子样效应子(tale),和来自ii型细菌适应性免疫系统crispr(成簇的规则间隔的短回文重复序列)的rna-引导的dna内切核酸酶cas9。大范围核酸酶、zf和tale蛋白都通过蛋白质-dna相互作用识别特异性dna序列。尽管大范围核酸酶整合了核酸酶和dna结合结构域,zf和tale蛋白分别由靶向dna的3个或1个核苷酸(nt)的单独模块组成。zf和tale可以以所需的组合装配,并附着于foki的核酸酶结构域,以引导溶核活性朝向特定的基因组基因座。
[0075]
锌指核酸酶包含两个结构域;dna结合结构域和dna切割结构域。dna结合结构域通常包含3到6个锌指重复序列,能够识别靶标dna序列中的9到18个碱基对。dna切割结构域依赖于dna结合结构域,因为它没有序列特异性。最常用作dna切割结构域的是ii型限制性内切核酸酶foki,它需要二聚化用于切割,并且因此必须设计锌指核酸酶对以靶向非回文dna序列。结合结构域和切割结构域之间需要6-15bp的接头序列。
[0076]
在培养的细胞中,表达锌指核酸酶的构建体使用针对细胞类型优化的启动子,并
通过转染使用载体引入。beumer等人首先报道了胚胎注射,并表明可以通过将锌指核酸酶mrna和供体dna注射到胚胎中来实现锌指核酸酶的递送。这一突破导致了,当从斑马鱼、大鼠、小鼠、海胆、蚕和果蝇的经处理的胚胎中生长时,使用锌指核酸酶产生携带种系突变的活的成体(adult)。
[0077]
相比之下,tal效应子在通过细菌iii型分泌系统递送后进入细胞核,并与宿主基因启动子中的效应子特异性序列结合并激活转录。它们的靶向特异性由串联的33-35个氨基酸重复序列的中心结构域决定。然后是20个氨基酸的单个截短重复序列。所检查的大多数天然存在的tal效应子具有12至27个完整重复序列。
[0078]
这些重复序列仅通过两个相邻的氨基酸—它们的重复可变双残基(rvd)——而彼此不同。确定tal效应子将识别哪个单核苷酸的rvd:一个rvd对应于一个核苷酸,四个最常见的rvd各自优先与四个碱基之一相关联。天然存在的识别位点之前一致地有tal效应子活性所需的t。tal效应子可融合至foki核酸酶的催化结构域,以产生tal效应子核酸酶(talen),该核酸酶使得体内靶向dna双链断裂(dsb)以进行基因组编辑。cermak t等描述了一组定制的质粒,其可以与golden gate克隆方法一起使用,以装配多个dna片段。如其中所描述的,golden gate方法使用iis型限制性内切核酸酶,该限制性内切核酸酶在它们的识别位点外切割以产生独特的4 bp突出端。通过在相同的反应混合物中消化和连接使克隆加速,原因在于正确的装配消除了酶识别位点。定制的talen或tal效应子构建体的装配包括两个步骤:(i)将重复模块组装成1-10个重复序列的中间阵列,和(ii)将中间阵列连接到骨架中以制备最终构建体。因此,使用本领域已知的技术,设计靶向如本文所描述的致病性mtdna序列的tal效应子是可能的。
[0079]
因此,在一个实施方案中,dna结合结构域是锌指dna结合结构域。如上所述,通常这样的dna结合结构域包含三到六个单独的锌指重复,并且每个都可以识别靶序列中的九到十八个碱基对。
[0080]
在一个实例中,靶序列是mtdna多态性(点突变),特别是致病性mtdna多态性。在进一步的实例中,dna结合结构域靶向以下致病性mtdna多态性之一:m.3243a》g,m.3271t》c,m.8344a》g,m.8356t》c,m.8993t》c/g,m.8363g》a,m.11778g》a,m.3460g》a,m.3394t》c,m,3291t》c,m.3303c》t,m.3302a》g,m.3250t》c,m.3256c》t,m.3251a》g,m.3252a》g和m.3260a》g。在替代的实例中,多态性可以是一个或多个核苷酸的缺失。例如,缺失可以选自m.del_8469:13447(也称为“普通缺失”),m.del_8482:13460,m.del_12112:14412,m.del_11232:13980,m.del_8648:16085,m.del_547:4443,m.del_7841:13905和m.del_8271:8281。
[0081]
在一个实例中,锌指dna结合结构域的蛋白质序列选自seq id no:7和9或其功能变体。在进一步的实例中,锌指dna结合结构的核酸序列选自seq id no:18和20或其功能变体。
[0082]
在特定的实施方案中,第一核酸序列编码包含如seq id no:7中定义的dna结合结构域的蛋白质或其功能变体,并且第二核酸序列编码包含如seq id no:9中定义的dna结合结构域的蛋白质或其功能变体。
[0083]
在替代的实施方案中,dna结合结构域可以是tal效应子。“tal效应子”(转录激活因子样(tal)效应子)或tale是指这样的蛋白质序列:其能够结合线粒体dna靶序列,并且能够与核酸酶例如foki的切割结构域融合以产生tal效应子核酸酶或与talens或大范围核酸
酶的切割结构域融合以产生megatal。tale蛋白由负责dna结合的中心结构域、核定位信号和激活靶基因转录的结构域组成。dna结合结构域由单体组成,并且每个单体能够与靶核苷酸序列中的一个核苷酸结合。单体是33-35个氨基酸的串联重复,其中位于位置12和13的两个氨基酸是高度可变的(重复可变双残基,rvd)。rvd负责识别单个特异性核苷酸。hd靶向胞嘧啶;ni靶向腺嘌呤,ng靶向胸腺嘧啶,nn靶向鸟嘌呤(尽管nn也能够以较低的特异性结合腺嘌呤)。当第一和/或第二核酸序列编码talen时,核酸分子优选不是aav,如下所述。核酸分子可以是质粒。
[0084]
在进一步的实施方案中,第一核酸序列可以编码zfn并且第二核酸序列可以编码talen,如上所述——或反之亦然。
[0085]“核酸酶”是指包含dna切割结构域的任何酶。换言之,“核酸酶”是指能够切割至少一条dna链(称为切口酶)或优选两条dna链(核酸酶)的酶。也就是说,核酸酶可以在线粒体dna序列中产生单链或双链断裂,其中前者是通过使双链切割所需的zfn二聚体中一个zfn单体的催化活性失活而产生的。在一个实施方案中,核酸酶是核酸内切酶,优选ii型限制性核酸内切酶,并且更优选iis型限制性核酸酶。合适的核酸酶的实例包括foki,acul,alwl,bael,bbsl,bbsl-hf,bbvl,bccl,bceal,bcgl,bcivi,bcodi,bfual,bmrl,bpuel,bsal,bsal-hf,bsaxi,bseri,bsgi,bsm ai,bsmbi,bsmfi,bsml,bspcni,bspmi,bspqi,bsrdi,bsrl,btgzi,btsci,btsl,btslmutl,cspcl,earl,ecil,esp3l,faul,fokl,hgal,hphl,hpyav,mboll,mlyl,mmel,mnll,nmeaiii,plel,sapl和sfani。在优选的实施方案中,核酸酶是fokl。
[0086]
在特定的实施方案中,第一核酸序列编码包含如seq id no:8或其功能变体中定义的dna切割结构域或核酸酶的蛋白质,并且第二核酸序列编码包含如seq id no:10或其功能变体中定义的dna切割结构域或核酸酶的蛋白质。
[0087]
如上所述,第一和第二核酸序列被至少一个核糖体跳跃序列隔开。
[0088]“核糖体跳跃序列”是这样的序列:当它在新生肽链中翻译时,可防止核糖体与下一个脯氨酸形成肽键。结果,翻译停止,新生多肽被释放并重新启动翻译以产生第二多肽。这种机制导致多聚蛋白的明显共翻译切割。因此,核糖体跳跃序列允许将两种蛋白质表达为来自单个mrna分子的单独蛋白质。
[0089]
在一个实施方案中,核糖体跳跃序列是2a样肽。2a样肽的实例包括:
[0090][0091]
因此,在一个实施方案中,2a样肽选自上述2a样序列之一或其功能变体。
[0092]
p2a肽的使用导致将c末端核糖体跳跃序列(或此类序列的大部分)添加到第一多肽链(即由第一核酸序列编码的蛋白质),并将n末端脯氨酸添加到下一多肽(即由第二核酸序列编码的蛋白质)。如上所述,我们发现第二mls上的n端脯氨酸掩蔽了信号序列并减慢了第二蛋白质进入线粒体的运输速度。
[0093]
在替代实施方案中,核糖体跳跃序列是trna序列。trna序列可用于允许从由串联排列的trna-rna单元组成的单个工程化多顺反子基因产生多个rna。多顺反子基因被内源性转录机制转录后,核酸内切酶rnase p和rnase z(或细菌中的rnase e)识别并特异性切割3’和5’末端特异性位点处的trna,释放成熟的rna和trna。有利的是,trna及其加工系统在所有生物体中实际上都是保守的,并且因此该方法可用于所有已知物种。在另一个替代方案中,核糖体跳跃序列可以是内部核糖体进入位点或ires。合适的ires的序列是技术人员熟知的。
[0094]
在替代实施方案中,代替核糖体跳跃序列,第一和第二核酸序列被至少一个序列隔开,该序列允许第一和第二核酸序列在转录时自我切割/自我加工。例如,第一和第二核酸序列可以被编码核酶的至少一个核酸序列隔开。一旦转录,初级转录本将进行自催化切割以产生两种mls蛋白。
[0095]
在一个实例中,核酶可以选自锤头(hh)核酶单元和/或丁型肝炎病毒(hdv)核酶单元。在一个实施方案中,hh(锤头)核酶的序列包含以下序列:ctgatgagtccgtgaggacgaaacgagtaagctcgtc(seq id no:40)或所描述的其变体。在进一步的实施方案中,丁型肝炎病毒(hdv)核酶的序列是:
[0096]
ggccggcatggtcccagcctcctcgctggcgccggctgggcaacatgcttcggcatggcgaatgggac(seq id no:41)或如本文所述的其变体。
[0097]
在使用此类替代核糖体跳跃序列或核酶的情况下,例如,核酸分子可进一步包含一个或多个kozak序列((gcc)gccrccaugg)(seq id no:42)或其功能变体以用作翻译起始位点。优选地,此类序列将在第一和第二核酸序列之间。
[0098]
在另一个实施方案中,第一和/或第二核酸序列进一步编码核输出信号(nes)。通常,nes序列是四个疏水残基的短氨基酸序列,其靶向新生多肽,用于使用核转运通过核孔复合物从细胞核输出到细胞质中。在一个实例中,nes具有如seq id no:4中定义的氨基酸序列和seq id no:15中定义的核酸序列或其功能变体。
[0099]
在进一步的实施方案中,核酸分子包含至少一个优选两个反向末端重复或ltr。优选地,核酸分子包含5’ltr和3’ltr。5’ltr充当rna pol ii启动子。3’ltr充当终止子序列,标记操纵子的末端并导致转录停止。
[0100]
在优选的实施方案中,第一和第二核酸序列与至少一个调节序列可操作地连接。更优选地,第一和第二核酸序列与一个调节序列可操作地连接。
[0101]
通篇使用的术语“可操作地连接”是指调节序列与第一和/或第二核酸序列之间的功能性连接,使得调节序列能够启动第一和/或第二核酸序列的转录。
[0102]
根据本发明的所有方面,术语“调节序列”在本文中与“启动子”可互换使用,并且所有术语在广义上下文中被认为是指能够实现与它们连接的序列的表达的调节核酸序列。术语“调节序列”还涵盖赋予、激活或增强核酸分子在细胞,组织或器官中表达的合成融合分子或衍生物。
[0103]
术语“启动子”通常指位于基因转录起点上游的核酸控制序列,其参与rna聚合酶和其它蛋白质的结合,从而指导可操作连接的核酸的转录。上述术语涵盖源自经典真核生物基因组基因的转录调节序列(包括tata盒,其是精确转录起始所需的,具有或不具有ccaat盒序列)和额外的调节元件(即上游激活序列、增强子和沉默子),所述额外的调节元件响应于发育性和/或外部刺激或以组织特异性方式改变基因表达。该术语还包括经典原核生物基因的转录调节序列,在这种情况下,它可以包括-35盒序列和/或-10盒转录调节序列。
[0104]
在一个实施方案中,启动子可以是组成型启动子。“组成型启动子”指在大多数的但不必是所有的生长和发育阶段期间以及在大多数环境条件下,在至少一个细胞、组织或器官中具有转录活性的启动子。组成型启动子的例子包括cmv、cag、rosa26、泛素、肌动蛋白、微管蛋白、gapdh、pgk、sv40和ef1a启动子。
[0105]
在替代实施方案中,启动子可以是组织特异性启动子。组织特异性启动子是仅在特定细胞或组织中有活性的转录控制元件。
[0106]
为了鉴定功能等效的启动子,候选启动子的启动子强度和/或表达模式可以例如通过将启动子可操作地连接到报道基因并测定报道基因在各种组织中的表达水平和模式来分析。合适的众所周知的报道基因是技术人员已知的并且包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。
[0107]
在一个具体实施方案中,核酸分子可包含如seq id no:26中定义的核酸序列或其功能变体。
[0108]
关于seq id no中的任一项,通篇使用的术语“变体”或“功能变体”是指保留完整非变体序列的生物学功能的变体核苷酸或蛋白质序列。功能变体还包含具有不影响功能例如在非保守残基中的序列改变的变体。还涵盖与本文所示的野生型序列相比基本同一性的变体,即仅具有一些(例如在非保守残基中的)序列变异,并且具有生物学活性。导致在给定位点产生不影响所编码多肽的功能特性的不同氨基酸的核酸序列或核糖核酸序列中的改
变是本领域熟知的。例如,氨基酸丙氨酸(疏水氨基酸)的密码子可被编码另一较低疏水性残基(如甘氨酸)或较高疏水性残基(如缬氨酸、亮氨酸或异亮氨酸)的密码子置换。类似地,导致用一个带负电荷的残基置换另一个的变化,例如用天冬氨酸置换谷氨酸,或用一个带正电荷的残基置换另一个的变化,例如用赖氨酸置换精氨酸,也可以预期产生功能等同的产物。导致多肽分子的n-末端和c-末端部分改变的核苷酸变化预期也不会改变该多肽的活性。所提出的每一种修饰都在本领域的常规技术范围内,如编码产物的生物活性的保留所确定的。
[0109]
如本文所述的本发明的任何方面中所使用的,“变体”或“功能变体”与非变体核酸或氨基酸序列具有至少25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或至少99%的总序列同一性。
[0110]
在优选的实施方案中,核酸分子是载体或包含在载体内。
[0111]
在一个实施方案中,载体是病毒载体。更优选地,病毒载体选自腺病毒、腺相关病毒(aav)、甲病毒、黄病毒、单纯疱疹病毒(hsv)、麻疹病毒、弹状病毒、逆转录病毒、慢病毒、新城疫病毒(ndv)、痘病毒、微小核糖核酸病毒和其杂交病毒。在一个实施方案中,载体是腺相关病毒(aav)或aav变体。在进一步优选的实施方案中,aav可以选自血清型1,2,3,4,5,6,7,8,9,10或11。技术人员会理解血清型在它们的趋性方面不同,因此靶组织的选择将取决于待感染的靶组织。例如,当靶组织是心脏时,aav可以选自血清型1、8和9,并且最优选的是aav9。在另一个实例中,当靶组织是脑或cns时,aav可以选自血清型1、2、4、5、8和9。类似地,当靶组织是肌肉时,aav可以选自血清型1、6、7、8和9。在最后一个实例中,当靶组织是肺时,aav可以选自血清型4、5、6和9。
[0112]
在替代实施方案中,载体是非病毒载体,例如质粒。在该实施方案中,可以使用转染将非病毒载体递送至靶细胞或组织。合适的转染技术的实例是技术人员已知的并且包括化学和物理转染。在一个实施方案中,化学转染包括使用磷酸钙、脂质或蛋白质复合物。在一个实例中,非病毒载体可与脂质溶液组合以形成脂质体或脂质复合物(lipoplex)。在另一个实施方案中,物理转染方式包括电穿孔、显微注射或使用弹道颗粒。在进一步的实例中,细菌可用于将非病毒载体递送至靶细胞或组织。这被称为细菌感染。
[0113]
在本发明的另一方面,提供了包含上述载体的宿主细胞。
[0114]
如本文所用,“宿主细胞”或“细胞”可以是真核细胞,并且可以包括细菌细胞、真菌细胞例如酵母、植物细胞、昆虫细胞或哺乳动物细胞(人或非人细胞)。在优选的实例中,宿主细胞可以选自心脏、脑、肝、眼、肾、肠、胰腺、肌肉或肺细胞。在更优选的实施方案中,细胞可以选自心脏、脑、肌肉或肺细胞。在一个实施方案中,细胞是心脏细胞。
[0115]
在本发明的另一方面,提供了一种转基因生物,其中该转基因生物表达本发明的核酸分子。同样,该生物是任何原核生物或真核生物。
[0116]
在一个实施方案中,后代生物被核酸分子瞬时转化。在另一个实施方案中,后代生物可以用本文所述的核酸分子稳定转化并且包含可遗传地维持在生物的至少一个细胞中
的外源多核苷酸。该方法可以包括验证构建体或载体被稳定整合的步骤。
[0117]
在本发明的进一步的方面,提供了通过本文所述的方法获得或可获得的生物。
[0118]
如本文所用,术语“生物”是指任何原核或真核生物。真核生物的一些实例包括人、非人灵长类动物/哺乳动物、家畜动物(例如牛、马、猪、绵羊、山羊、鸡、骆驼、驴、猫和狗)、哺乳动物模式生物(小鼠、大鼠、仓鼠、豚鼠、兔或其他啮齿类动物)、两栖动物(例如非洲爪蟾)、鱼、昆虫(例如果蝇)、线虫(例如秀丽隐杆线虫(c.elegans))、植物、藻类、真菌。原核生物的实例包括细菌(例如蓝细菌)和古细菌。在最优选的实施方案中,生物不是人类。
[0119]
在本发明的进一步方面,提供了包含本文所述的核酸分子的组合物。任选地,组合物可进一步包含药学上可接受的载体。这种药学上可接受的载体可以包括赋形剂和其他有助于将活性化合物加工成适于药物施用的制剂的组分。
[0120]
在本发明的进一步方面,提供了用作药物的如本文所述的核酸分子或组合物。在本发明的另一方面,提供了一种治疗方法,该方法包括向有需要的个体或患者施用优选治疗有效量的如本文所述的核酸分子或组合物。
[0121]
在本发明的另一方面,提供了用于治疗线粒体疾病的如上所述的核酸分子或组合物。或者,提供一种治疗线粒体疾病的方法,该方法包括施用如上所述的核酸分子或组合物以用于治疗线粒体疾病。
[0122]
如本文所用,“线粒体疾病”是一种病况、疾病或病症,其特征在于线粒体活性或功能缺陷,特别是由mtdna突变引起的或与mtdna突变相关联的线粒体活性或功能缺陷。线粒体病症的实例包括但不限于,衰老;ad(阿尔茨海默病);adpd(阿尔茨海默病和帕金森病);氨基葡糖苷诱导的耳聋;癌症;心肌病;cpeo(慢性进行性外眼肌麻痹);脑肌病;fbsn(家族性双侧纹状体坏死);ficp(致命婴儿心肌病 (fatal infantile cardiomyopathy plus),一种melas相关心肌病);ldyt(莱伯遗传性视神经病和张力失常);lhon(莱伯遗传性视神经病);limm(致命婴儿线粒体肌病);mm(线粒体肌病);mmc(母体肌病和心肌病);melas(线粒体肌病、脑病、乳酸酸中毒和中风样发作):merrf(伴有中风样发作的肌阵挛型癫痫);merrf(肌阵挛型癫痫和不规整红肌纤维);mils(母系遗传的leigh综合征);线粒体肌病;narp(神经原性肌肉无力、共济失调和色素性视网膜炎;该基因座的替代表型报告为leigh病);peo;sne(亚急性坏死性脑病);mhcm(母系遗传的肥厚性心肌病);cpeo(慢性进行性外眼肌麻痹);kss(卡恩斯赛尔综合症);dm(糖尿病);dmdf(糖尿病 耳聋);cipo(慢性假性肠梗阻伴肌病和眼肌麻痹);deaf(母系遗传的耳聋或氨基葡糖苷诱导的耳聋);pem(进行性脑病)和snhl(感觉神经性听力损失)。在另一个实施方案中,线粒体疾病是与mtdna中的任何突变相关联的疾病。例如,大约60%的肿瘤包含mtdna突变,其中许多会导致造成线粒体功能障碍的异质性水平或突变同质性。
[0123]
如本文所用,“治疗有效量”可指在实现治疗目的所需的剂量和时间段内适合治疗有效的量。本领域技术人员会理解,施用量将根据个体的年龄、性别、体重等因素而变化。治疗有效量还可以优选地是限制对治疗的任何不需要的副作用的量。
[0124]
值得注意的是,本发明人在图2和图4中表明,与使用两种核酸分子以施用相同蛋白质时相比,施用本发明的核酸分子时实现线粒体dna异质性变化所需的剂量显著较低。特别是,从图4中的表格可以看出,异质性的显著转变仅在1x10
13
vg/小鼠的浓度下观察到。相比之下,使用单个核酸分子在低至2.5x10
11
vg/小鼠的剂量下可以观察到异质性的转变(2个
病毒粒子的可比剂量5x10
11
vg/小鼠对异质性没有影响)。
[0125]
因此,施用本发明的核酸分子的治疗有效剂量将低于在两个或更多个核酸分子中施用相同蛋白质所需的治疗有效剂量。
[0126]
核酸分子的施用可以通过物理干扰来完成。物理干扰的方法包括电穿孔、基因枪、超声波或高压注射。
[0127]
核酸分子或组合物的施用可以通过口服或肠胃外完成。肠胃外递送的方法包括局部、动脉内、肌肉内、皮下、髓内、鞘内、心室内、静脉内、腹膜内、粘膜或鼻内施用。然而最优选地,核酸分子或组合物通过局部或全身注射施用。局部注射包括电穿孔、基因枪、超声和高压;而全身注射包括静脉注射、门注射和动脉注射。例如,在靶组织是心脏的情况下,核酸分子可以与例如支架或冠状动脉搭桥的外科手术同时直接施用到心脏中。
[0128]
可以使用本领域已知的药学上可接受的载体以适合口服施用的剂量配制用于口服施用的药物组合物。这样的载体能够将组合物配制成适合受试者摄取的片剂、丸剂、糖衣丸、胶囊、液体、凝胶、糖浆、浆液、悬浮液等。
[0129]
用于肠胃外施用的药物制剂包括活性化合物的水溶液。对于注射,本发明的药物组合物可以配制在水溶液中,优选在生理相容的缓冲液中,例如hanks’s溶液、ringer’s溶液或生理缓冲盐水。水性悬浮液注射剂可含有增加悬浮液粘度的物质,例如羧甲基纤维素钠、山梨醇或葡聚糖。此外,活性化合物的悬浮液可以制备成合适的油性注射悬浮液。合适的亲脂性溶剂或赋形物包括脂肪油例如芝麻油,或合成脂肪酸酯,例如油酸乙酯或甘油三酯,或脂质体。任选地,悬浮液还可以包含合适的稳定剂或增加化合物溶解度以允许制备高浓度溶液的试剂。药物组合物还可包括佐剂以增强或调节抗原性。
[0130]
对于局部或鼻腔施用,适合于待渗透的特定屏障的渗透剂可用于制剂中。
[0131]
在本发明的另一方面,提供了一种改变线粒体dna异质性的方法,该方法包括将本发明的核酸分子施用于靶细胞或靶组织。如前所述,每个细胞中有数千个mtdna拷贝。在这个群体中存在大量的突变,其中一些突变将是致病突变。致病突变的可变表型表达取决于异质性的程度和受影响组织的能量需求。因此,每个组织都有mtdna的阈值浓度,必须超过该浓度才能引起疾病。这导致包含野生型和致病性mtdna基因组二者的mtdna异质性群体。在本发明的优选实施方案中,该方法包括改变或转变野生型对致病性mtdna的比率,即,增加野生型对致病性mtdna的量。优选地,转变可以是至少5%,10%,15%,20%,25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%或99%支持野生型mtdna基因组。优选地,野生型:致病性比率的转变导致致病性mtdna的浓度低于该组织的致病阈值。
[0132]
在本发明的进一步的方面,提供了将单链和/或双链断裂引入至少一个mtdna优选致病性mtdna的方法,该方法包括将本发明的核酸分子施用于靶细胞或靶组织。
[0133]
在本发明的最后一个方面,提供了一种将至少两种蛋白质(即,第一和第二蛋白质)同时表达和递送至线粒体的方法,如上所述,该方法包括将本发明的核酸分子施用至靶细胞或靶组织。在优选的实施方案中,在线粒体中第一蛋白质的表达和/或输入速率高于第二蛋白质的表达和/或输入速率。如上所述,并如图2所示,当核糖体跳跃序列是2a肽或当第二蛋白质在其n末端mls序列上包含额外的氨基酸(例如脯氨酸)时,mls被掩蔽,导致第二蛋白质进入线粒体的输入速率较慢。
[0134]
同样,用于上述方法的本发明核酸分子的剂量将低于在两个或更多个核酸分子中施用相同蛋白质所需的剂量。
[0135]
虽然前述公开提供了对本发明范围内所包含的主题的一般描述,包括制备和使用本发明的方法及其最佳模式,但提供了以下实施例以进一步使本领域技术人员能够实施本发明并提供其完整的书面描述。然而,本领域技术人员将理解,这些实施例的细节不应被理解为对本发明的限制,本发明的范围应由本公开所附权利要求及其等同物来理解。鉴于本公开,本发明的各种另外的方面和实施方案对于本领域技术人员将是显而易见的。
[0136]
如本文所用,对照可以是尚未用本发明的至少一种核酸分子治疗的个体、患者或细胞。
[0137]
本文中使用的术语“和/或”被认为是两个特定特征或部件在具有或不具有另一个的情况下每一个的具体公开。例如,“a和/或b”应被认为是(i)a、(ii)b和(iii)a和b中的每一个的具体公开,就像每个在本文中单独地列出一样。
[0138]
除非上下文另外指出,以上陈述的特征的描述和定义不限于本发明的任何特定方面或实施方案,并且等同地应用于所描述的所有方面和实施方案。
[0139]
前述申请、其中引用或在其审查期间引用的所有文件和序列登录号(“申请引用文献”)、和在申请引用文献中引用或参考的所有文献、以及本文引用或参考的所有文献(“本文引用的文献”)、本文引用文献中引用或参考的所有文献、以及本文或通过引用并入本文的任何文献中提及的任何产品的任何制造商的说明书、描述、产品说明书和产品页,均通过引用并入本文,并且可以用于本发明的实践。更具体地说,所有参考文献均通过引用并入,其程度如同每个单独的文件被具体和单独地指出通过引用并入。
[0140]
现在在以下非限制性实施例中进一步描述本发明。
[0141]
实施例1
[0142]
测试由2a肽隔开的mtzfn单体的表达和异质性转变
[0143]
我们的目的是测试以下内容:如果用2a肽隔开,两种mtzfn单体是否都可以表达,并且是否可以在培养的细胞中特异性地转变异质性。2a方法依赖于在2a的c末端跳过甘氨酰-脯氨酰肽键的合成,并将该序列置于编码一种以上目标蛋白质的orf内,并介于这两种蛋白质之间。这导致上游蛋白质通过真核释放(终止)因子1和3(erf1、erf3)从核糖体中释放出来。释放的多肽在其c末端保留了大部分2a肽。然后核糖体恢复mrna的翻译,下游蛋白质在其n末端含有脯氨酸。上游mtzfn单体的c末端延伸和下游mtzfn单体n末端的脯氨酸的存在在理论上可能会干扰foki结构域(蛋白质1)的溶核活性和/或mtzfn(蛋白质2)的线粒体靶向。为了通过实验测试这一点,我们使用先前描述的mtzfn(comp/narpd)在携带m.8993t》g突变的胞质杂种细胞中进行了异质性转变实验(图1)。与之前的实验不同,在comp和narpd单体从单独的质粒中表达的情况下,现在将它们放置在一个载体中,并用编码各种类型2a肽(t2a、*t2a、*p2a)的dna序列隔开(图1b和1d)。我们在所有条件下检测到大量mtdna异质性转变(shift),如通过从具有指示水平的m.8993t》g的细胞的总dna样品扩增的最后一个循环热pcr产物(mtdna nt位置8339-9334)的rflp测量的(图1f)。该结果与通过t2a的作用有效隔开mtzfn单体及其有效的线粒体输入是一致的。通过蛋白质印迹检测到每个mtzfn单体中线粒体定位信号(mls)的处理(图1e)。这构成了使用2a肽用于从相同启动子控制下的一个双顺反子表达的两个zfn的线粒体导入的第一实例。这些结果还表明,上游
mtzfn单体的c末端延伸和下游mtzfn单体的n末端脯氨酸分别不会严重干扰foki的dna核溶解和/或线粒体输入。重要的是,n末端脯氨酸似乎通过掩蔽mls来减缓第二mtzfn(compa(-))的输入速率。这提高了线粒体中异质性转变的效率,否则两种单体的高表达水平会导致脱靶效应(gammage等人,2016,nucleic acids res.)。这是第一次使用2a肽证明下游mls的掩蔽,在这种情况下,它允许对线粒体中mtzfn介导的dna切割的催化速率进行关键调节。
[0144]
测试由2a肽隔开的mtzfn单体的体内mtdna异质性转变
[0145]
我们着手确定由t2a肽隔开的mtzfn单体在体内是否能有效地靶向mtdna。我们为这项工作选择了t2a,因为它是所测试的x2a肽中最短的,并且具有相当的效率(图1)。作为模型,我们使用了唯一可用的异质性小鼠,它概括了心脏组织中线粒体病症的关键分子特征。该小鼠品系在线粒体trna
ala
中具有点突变m.5024c》t(mt-trna
ala
)。我们测试了先前显示的mtzfn单体对(mtm25和wtm1),当包含在两个单独的病毒基因组中并衣壳化(encapsidated)在aav载体中时,会在体内转变mtdna异质性(gammage等人,2018,nat.med.)。我们在单个病毒基因组中编码mtm25和wtm1 mtzfn单体(图2a),并衣壳化在相同的向心性、工程化aav9.45血清型中。获得包含mtm25-t2a-wtm1的aav9.45的初步尝试导致了衣壳化的基因组内的大规模缺失。我们推断这些缺失源于串联排列的mtzfn的高度重复序列的重组。为了克服这个问题,我们重新编码了mtzfn单体,以便它们共享63%的序列同源性(即序列同一性)而不是93%,没有长于9bp(以前》400)的同源性区段。然后再次使用这种重新编码的构建体来生成向心性aav9.45,从而产生具有全长、忠实编码构建体的高滴度病毒颗粒。
[0146]
接下来,将不同剂量的mtm25-t2a-wtm-aav9.45(2.5*10
11
,5*10
11
和5*10
12
vg/小鼠)施用于携带约50%-80%范围内的m.5024c》t异质性的mt-trna
ala
动物中(图2b)。为了能够在我们之前的公开内容(gammage等人,2018年)和当前公开内容之间进行直接比较,与单独的单体aav剂量相比,这些mtm25-t2a-wtm-aav9.45剂量减半以反映在每个转导细胞内两个mtzfn单体的同时递送。据此:5*10
11
单独的2x aav单体剂量相当于2.5*10
11
t2a剂量。由于在m.5024c》t小鼠的组织之间仅观察到异质性的最小差异,因此通过比较焦磷酸测序数据来评估mtdna异质性,所述焦磷酸测序数据表达为在两周龄(实验干预之前)确定的耳孔基因型(e)和死后心脏基因型(h)之间的变化(δ)。注射后65天对动物的分析显示,m.5024c》t突变mtdna在mtzfn处理的小鼠中被特异性消除,但在赋形物对照中没有被特异性消除(图2c)。mtzfn治疗改变异质性的程度遵循aav剂量依赖性趋势,低至2.5*10
11
vg的剂量部分有效,并且5*10
11
的剂量证明有效消除m.5024c》t突变mtdna(图2c,轮廓条)。与我们之前依赖于注射mtm25和wtm1 mtzfn单体作为单独的病毒颗粒的方法相比,这是一个很大的改进。在这些先前的实验中,最低有效剂量为5*10
12
,而5*10
11
和1*10
12
由于mtzfn浓度不足和aav对靶组织的镶嵌(mosaic)转导而无效。用于衣壳化在单独的病毒粒子中的mtm25和wtm1 mtzfn单体的最高剂量(1*10
13
vg/小鼠)由于脱靶效应导致部分mtdna拷贝数耗尽,这在mtm25-t2a-wtm-aav9.45的等效剂量中未观察到(图2d,条纹条)。在任何其他条件下,mtdna拷贝数都没有可检测到的变化。
[0147]
材料和方法
[0148]
图1:a、b,gammage等人2016,methods mol biol中详述的facs方法;d-f,gammage等人,2014embo mol med中详述的克隆、蛋白质印迹和放射性标记pcr方法。
[0149]
图2:a,来自商业供应商(geneart)的完整重新编码构建体的合成,gammage等人,2014embo mol med中的克隆。b,gammage等人,2018nat med和gammage等人,2014embo mol med中详述的克隆。c、d,gammage等人,2018nat med中的组织提取和dna分析。
[0150]
图3gammage等人,2018nat med中的组织提取和dna分析。
[0151]
aav生成过程中重组证据的描述
[0152]
在将全长构建体衣壳化入aav9.45后,在两个单独的商业aav制备设备中,产生了pcr产物,其跨度从cmv启动子到bgh多聚腺苷酸化位点的转基因长度,表明当与从质粒来源产生的pcr产物(~3.5kb)相比时,分子量显著降低(~2kb)。在对这些pcr产物进行sanger测序后,aav样品中具有显著同源性的区域之间(mls序列、zfp和foki结构域之间)出现移码重组事件,这不存在于质粒中。在重新编码mtzfn2后,利用密码子使用中的冗余,实现了mtzfn1和mtzfn2之间在核苷酸水平上的序列同一性降低,从92%减少到63%。此外,mtzfn1和mtzfn2之间同源序列的最长区段从424bp减少到9bp。在对全长重新编码构建体进行衣壳化(encapsidation)后,未检测到跨越转基因区域的质粒或aav衍生pcr产物之间的分子量差异,并且通过sanger测序未检测到重组分子。
[0153]
参考文献
[0154]
minczuk m et al.,2006.sequence-specific modification of mitochondrial dna using a chimeric zinc finger methylase.proc.natl.acad.sci.usa.103(52):19689-19694.
[0155]
minczuk m et al.,2010.construction and testing of engineered zinc-finger proteins for sequence-specific modification of mtdna.nat.protoc.5(2):342-356.
[0156]
gammage et al.,2014.mitochondrially targeted zfns for selective degradation of pathogenic mitochondrial genomes bearing large-scale deletions or point mutations.embo mol.med.6(4):458-466.
[0157]
gammage et al.,2016.near-complete elimination of mutant mtdna by iterative or dynamic dose-controlled treatment with mtzfns.nucleic acids res.44(16):7804-7816.
[0158]
gammage et al.,2018.genome editing in mitochondria corrects a pathogenic mtdna mutation in vivo.nat.med.doi:10.1038/s41591-018-0165-9.
[0159]
cermak,t et al.,efficient design and assembly of custom talen and other tal effector-based constructs for dna targeting.nucleic acid res.39(2011).
[0160]
序列表
[0161]
氨基酸序列:
[0162]
seq id no:1:线粒体定位信号1
[0163]
mlgfvgrvaaapasgalrrltpsaslppaqlllraaptavhpvrdyaaq
[0164]
seq id no:2:线粒体定位信号2
[0165]
pmlgfvgrvaaapasgalrrltpsaslppaqlllraaptavhpvrdyaaq
[0166]
seq id no:3:ha表位标签
[0167]
ypydvpdya
[0168]
seq id no:4:核输出标签
[0169]
vdemtkkfgtltihdtek
[0170]
seq id no:5:短的柔性接头
[0171]
aa
[0172]
seq id no:6:限制位点
[0173]
ef
[0174]
seq id no:7:锌指蛋白1
[0175][0176]
seq id no:8:foki催化结构域1
[0177][0178]
seq id no:9:锌指蛋白2
[0179][0180]
seq id no:10:foki催化结构域2
[0181][0182]
seq id no:11:t2a序列
[0183]
egrgslltcgdveenpg
[0184]
核酸序列
[0185]
seq id no:12:线粒体定位信号1
[0186][0187]
seq id no:13:线粒体定位信号2
[0188][0189]
seq id no:14:ha表位标签
[0190]
tacccctacgacgtgcccgactacgcc
[0191]
seq id no:15:核输出标签
[0192]
gtggatgaaatgaccaaaaagttcggcacgctcaccattcacgacaccgaaaag
[0193]
seq id no:16:短的柔性接头
[0194]
gccgcc
[0195]
seq id no:17:限制位点
[0196]
gaattc
[0197]
seq id no:18:锌指蛋白1
[0198][0199]
seq id no:19:foki催化结构域1
[0200][0201]
seq id no:20:锌指蛋白2
[0202][0203]
seq id no:21:foki催化结构域2
[0204][0205]
seq id no:22:t2a序列
[0206]
gaagggagaggatctctgcttacttgcggcgatgtagaggaaaaccccggaccc
[0207]
seq id no:23:限制位点
[0208]
gs
[0209]
seq id no:24:限制位点
[0210]
ggatcc
[0211]
seq id no:25:完整的mtm25( )_t2a_wtm1(-)氨基酸序列
[0212][0213]
seq id no:26:完整的mtm25( )_t2a_wtm1(-)核酸氨基酸序列
[0214]
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献