一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于核碱基编辑的锌指融合蛋白的制作方法

2023-06-15 06:04:12 来源:中国专利 TAG:

用于核碱基编辑的锌指融合蛋白
1.相关申请的交叉引用
2.本专利申请要求于2020年9月25日提交的美国临时专利申请63/083,662;2021年3月23日提交的美国临时专利申请63/164,893;以及2021年8月6日提交的美国临时专利申请63/230,580的优先权。那些优先权申请的公开通过整体引用并入本文。
3.序列表
4.本技术含有以ascii格式电子提交的序列表,并且据此通过整体引用并入。在2021年9月22日创建的序列表的电子副本命名为025297_wo034_sl.txt,并且大小为529,443字节。


背景技术:

5.单碱基的精确dna编辑在治疗和理解如遗传病的病症病症方面具有各种应用。例如,一个或多个基因的敲除可以通过使常规密码子转化为终止密码子,或者通过使剪接受体位点突变以引入外显子跳跃和/或移码突变来实现。此外,dna点突变与广泛的病症相关联。单碱基编辑可用于纠正有害突变或者引入有益的遗传修饰。
6.胞苷脱氨酶将核碱基胞嘧啶转化为胸腺嘧啶(或者将核苷脱氧胞苷转化为胸苷)。这些酶在嘧啶补救途径中起作用,主要作用于单链dna以使胞嘧啶转化成尿嘧啶,尿嘧啶随后在dna复制或修复期间被胸腺嘧啶碱基替换。在细菌新洋葱伯克霍尔德菌(burkholderia cenocepacia)中所鉴定的胞苷脱氨酶ddda可催化双链dna内的胞嘧啶脱氨为尿嘧啶。ddda因此绕过了使dsdna解旋为ssdna的要求(mok等人,nature(2020)583:631-7)。虽然mok的研究报道了采用与转录激活因子样效应因子(tale)蛋白融合的ddda衍生的胞嘧啶碱基编辑器在人ccr5基因座处的c至t的碱基编辑,但尚不清楚该方法的适用范围有多广泛。另外,与ddda相比,对双链dna起作用的新脱氨酶可以具有改善或改变的碱基编辑活性。
7.因此,仍然需要开发出用于预防和治疗多种疾病的精确碱基编辑系统。


技术实现要素:

8.本公开提供了基于锌指蛋白(zfp)的核碱基编辑系统及其用途。在一个方面,本公开提供了用于使细胞(例如,真核细胞或原核细胞,其中真核细胞可以是哺乳动物细胞,如人细胞、或植物细胞)的基因组中的胞嘧啶变为胸腺嘧啶的系统,该系统包括第一融合蛋白和第二融合蛋白、或者分别用于表达第一和第二融合蛋白的第一和第二表达构建体,其中a)第一融合蛋白包含:i)第一锌指蛋白(zfp)结构域,该第一锌指蛋白结构域结合细胞中的靶基因组区中的第一序列,和ii)胞苷脱氨酶多肽的第一部分(例如,其中胞苷脱氨酶是包含与seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219至少90%相同的氨基酸序列的毒素衍生的脱氨酶(tdd));b)第二融合蛋白包含:i)第二zfp结构域,该第二zfp结构域结合靶基因组区中的第二序列,和ii)胞苷脱氨酶多肽的第二部分;并且c)第一融合蛋白和第二融合蛋白与靶基因组区的结合导致了第一和第二部分的二聚化,其中二聚化部分形成了能够使靶基因组区中
的胞嘧啶变为尿嘧啶的活性胞苷脱氨酶。在一些实施方案中,第一和第二部分自身缺乏胞苷脱氨酶活性。在一些实施方案中,第一和第二部分形成了包含与seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219至少90%相同的氨基酸序列的活性胞苷脱氨酶。在一些实施方案中,第一和第二部分形成了包含seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219的氨基酸序列的活性胞苷脱氨酶。在一些实施方案中,靶基因组区可以特异于细胞中基因的特定等位基因。在一些实施方案中,靶向胞嘧啶可介于靶基因组区中的第一序列与第二序列的近端之间,任选地其中近端相距不超过100bp。
9.还提供了包含多于一对的第一和第二融合蛋白的本发明碱基编辑器系统的多重形式,其中每对融合蛋白结合不同的靶基因组区,任选地其中一对融合蛋白的第一和第二胞苷脱氨酶部分不同于另一对融合蛋白的第一和第二部分。
10.在一些实施方案中,碱基编辑器系统还包含在未编辑或编辑的链上产生单链dna断裂的切口酶,其中dna断裂与待编辑的胞嘧啶相距不超过约500bp,任选地不超过200bp,任选地约10-50bp。切口酶可以是例如基于zfp的切口酶、基于tale的切口酶、或基于crispr的切口酶。在一些实施方案中,切口酶是通过第一切口酶结构域和第二切口酶结构域的二聚化形成的基于zfp的切口酶,该第一切口酶结构域和第二切口酶结构域分别与两个结合靶基因组区的zfp结构域融合,其中第一和第二切口酶结构域自身无活性,或者缺乏显著或特异性的切口酶活性。在某些实施方案中,切口酶结构域中的一者与第一或第二zfp-胞苷脱氨酶融合蛋白融合,并且另一个切口酶结构域与结合靶基因组区中的第三序列的第三zfp结构域融合。替代性地,两个切口酶结构域可以分别地与结合靶基因组区中的第三序列的第三zfp结构域以及结合靶基因组区中的第四序列的第四zfp结构域融合。在特定实施方案中,第一和第二切口酶结构域衍生自foki。
11.在一些实施方案中,碱基编辑器系统还包含胞苷脱氨酶的抑制组分,例如,毒素衍生的脱氨酶抑制剂(tddi),其中胞苷脱氨酶是tdd。例如,抑制剂可以是dddi组分,其中胞苷脱氨酶是ddda。在某些实施方案中,该系统包含第三融合蛋白或者用于在细胞中表达第三融合蛋白的第三表达构建体,其中第三融合蛋白包含i)zfp结构域,该zfp结构域结合靶基因组区中的第三序列,和ii)胞苷脱氨酶的抑制结构域(例如其中胞苷脱氨酶为tdd的tddi,如其中胞苷脱氨酶为ddda的dddi),并且第三融合蛋白与靶基因组区的结合导致了抑制结构域与二聚化胞苷脱氨酶部分相互作用,并由此对其胞苷脱氨酶活性进行抑制。
12.在含有抑制结构域的碱基编辑器系统的一些实施方案中,该系统包含第三融合蛋白或者用于在细胞中表达第三融合蛋白的第三表达构建体,以及第四融合蛋白或者用于在细胞中表达第四融合蛋白的第四表达构建体,其中第三融合蛋白包含i)zfp结构域,该zfp结构域结合靶基因组区中的第三序列,和ii)第一二聚化结构域;并且第四融合蛋白包含i)胞苷脱氨酶的抑制结构域(例如其中胞苷脱氨酶为tdd的tddi,如其中胞苷脱氨酶为ddda的dddi),和ii)能够在二聚化诱导剂存在下与第一二聚化结构域配偶的第二二聚化结构域;并且第三融合蛋白与靶基因组区的结合以及第三和第四融合蛋白的二聚化导致了抑制结构域与二聚化胞苷脱氨酶部分结合,并由此对其胞苷脱氨酶活性进行抑制。
13.在含有抑制结构域的碱基编辑器系统的一些实施方案中,该系统包含第三融合蛋
白或者用于在细胞中表达第三融合蛋白的第三表达构建体,以及第四融合蛋白或者用于在细胞中表达第四融合蛋白的第四表达构建体,其中第三融合蛋白包含i)zfp结构域,该zfp结构域结合靶基因组区中的第三序列,和ii)第一二聚化结构域;并且第四融合蛋白包含i)胞苷脱氨酶的抑制结构域(例如其中胞苷脱氨酶为tdd的tddi,如其中胞苷脱氨酶为ddda的dddi),和ii)能够在不存在二聚化抑制剂时与第一二聚化结构域配偶的第二二聚化结构域;并且第三融合蛋白与靶基因组区的结合以及第三和第四融合蛋白的二聚化导致了抑制结构域与二聚化胞苷脱氨酶部分结合,并由此对其胞苷脱氨酶活性进行抑制。
14.在特定实施方案中,本文所述的碱基编辑器系统包含本文所述的切口酶组分和抑制结构域组分。
15.本文所述的融合蛋白中使用的任何zfp结构域可以独立地具有2、3、4、5、6、7、或8个锌指。
16.在一些实施方案中,本发明的碱基编辑器系统的蛋白质组分借助于表达盒或构建体提供给细胞。此类盒或构建体可以在相同或单独的表达载体如病毒载体上提供给细胞。病毒载体可以是例如腺相关病毒(aav)载体、腺病毒载体、或慢病毒载体。
17.在本文所述的碱基编辑器系统的一些实施方案中,胞苷脱氨酶是tdd。在某些实施方案中,tdd包含seq id no:72(ddda)的氨基酸序列、或包含所述序列的tdd的毒性结构域(例如,seq id no:49或81的毒性结构域)。在一些实施方案中,胞苷脱氨酶是包含与seq id no:49或81的氨基酸序列至少20%、30%、40%、50%、60%、70%、80%、90%、92%、94%、95%、96%、97%、98%、或99%相同的氨基酸序列的tdd。在某些实施方案中,第一ddda部分包含seq id no:72的氨基酸1264-1427的氨基酸1264-1333、1264-1397、1264-1404、1264-1407、或它们的片段;并且第二ddda部分包含seq id no:72的所述氨基酸的剩余部分、或其片段;或反之亦然;其中两部分形成功能性胞苷脱氨酶。在某些实施方案中,第一ddda部分包含seq id no:72的氨基酸1290-1427的氨基酸1290-1333、1290-1397、1290-1404、1290-1407、或它们的片段;并且第二ddda部分包含seq id no:72的所述氨基酸的剩余部分、或其片段;或反之亦然;其中两部分形成功能性胞苷脱氨酶。在一些实施方案中,第一和第二ddda部分分别地包含seq id no:82和83、seq id no:84和85、seq id no:18和19、seq id no:51和52、或seq id no:53和54;或反之亦然。
18.在本文所述的碱基编辑器系统的一些实施方案中,胞苷脱氨酶是在选自seq id no:72中的y1307、t1311、s1331、v1346、h1366、n1367、n1368、p1369、e1370、g1371、t1372、f1375、v1392、p1394、p1395、i1399、p1400、v1401、k1402、a1405和t1406的一个或多个残基处具有突变的ddda。
19.在本文所述的碱基编辑器系统的一些实施方案中,胞苷脱氨酶是包含seq id no:86-91和117-129中任一者的氨基酸序列的tdd。在某些实施方案中,胞苷脱氨酶包含含有seq id no:86-91和117-129中任一者的氨基酸序列的tdd的毒性结构域。在某些实施方案中,tdd包含与seq id no:92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219的氨基酸序列至少20%、30%、40%、50%、60%、70%、80%、90%、92%、94%、95%、96%、97%、98%、或99%相同的氨基酸序列。在特定实施方案中,胞苷脱氨酶是包含seq id no:92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219的氨基酸序列的tdd。在特定实施方案
中,第一和第二胞苷脱氨酶部分分别地包含seq id no:93和94、seq id no:96和97、seq id no:99和100、seq id no:102和103、seq id no:105和106、seq id no:108和109、seq id no:130和131、seq id no:132和133、seq id no:135和136、seq id no:137和138、seq id no:139和140、seq id no:141和142、seq id no:144和145、seq id no:146和147、seq id no:148和149、seq id no:150和151、seq id no:153和154、seq id no:155和156、seq id no:158和159、seq id no:160和161、seq id no:163和164、seq id no:165和166、seq id no:168和169、seq id no:170和171、seq id no:173和174、seq id no:175和176、seq id no:178和179、seq id no:180和181、seq id no:182和183、seq id no:185和186、seq id no:187和188、seq id no:190和191、seq id no:192和193、seq id no:195和196、seq id no:197和198、seq id no:200和201、seq id no:202和203、seq id no:205和206、seq id no:207和208、seq id no:210和211、seq id no:212和213、seq id no:215和216、seq id no:217和218、seq id no:220和221、或seq id no:222和223;或反之亦然。
20.在相关方面,本公开还提供了融合蛋白,该融合蛋白包含i)锌指蛋白(zfp)结构域,该锌指蛋白结构域结合基因(其可以是真核基因,例如人基因),和ii)胞苷脱氨酶多肽或其片段,例如,其中胞苷脱氨酶是包含与seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219至少90%相同的氨基酸序列的tdd,任选地其中zfp结构域和胞苷脱氨酶或其片段通过肽接头连接。在一些实施方案中,tdd包含seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219的氨基酸序列。
21.在相关方面,本公开提供了融合蛋白,该融合蛋白包含i)锌指蛋白(zfp)结构域,该锌指蛋白结构域结合基因(其可以是真核基因,例如人基因),和ii)胞苷脱氨酶抑制结构域,例如,其中胞苷脱氨酶是包含与seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219至少90%相同的氨基酸序列的tdd,任选地其中zfp结构域和抑制结构域通过肽接头连接。在一些实施方案中,胞苷脱氨酶抑制结构域是tddi,如其中胞苷脱氨酶为ddda的dddi。在一些实施方案中,tdd包含seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219的氨基酸序列。
22.在相关方面,本公开提供了融合蛋白,该融合蛋白包含i)锌指蛋白(zfp)结构域,该锌指蛋白结构域结合基因(其可以是真核基因,例如人基因),和ii)切口酶或其片段,任选地其中zfp结构域和切口酶或其片段通过肽接头连接。
23.在一个方面,本公开提供了一对融合蛋白,该对融合蛋白包含a)第一融合蛋白,该第一融合蛋白包含i)锌指蛋白(zfp)结构域,该锌指蛋白结构域结合基因(其可以是真核基因,例如人基因),和ii)第一二聚化结构域,以及b)第二融合蛋白,该第二融合蛋白包含i)胞苷脱氨酶抑制结构域,例如,其中胞苷脱氨酶是包含与seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219至少90%相同的氨基酸序列的tdd,和ii)第二二聚化结构域,其中第一和第二二聚化结构域可以在二聚化诱导剂的存在下二聚化。在一些实施方案中,胞苷脱氨酶抑制结构域是tddi,如其中胞苷脱氨酶为ddda的dddi。在一些实施方案中,tdd包含seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219
的氨基酸序列。
24.在另一方面,本公开提供了一对融合蛋白,该对融合蛋白包含a)第一融合蛋白,该第一融合蛋白包含i)锌指蛋白(zfp)结构域,该锌指蛋白结构域结合基因(其可以是真核基因,例如人基因),和ii)第一二聚化结构域,以及b)第二融合蛋白,该第二融合蛋白包含i)胞苷脱氨酶抑制结构域,例如,其中胞苷脱氨酶是包含与seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219至少90%相同的氨基酸序列的tdd,和ii)第二二聚化结构域,其中第一和第二二聚化结构域可以在不存在二聚化抑制剂时二聚化。在一些实施方案中,胞苷脱氨酶抑制结构域是tddi,如其中胞苷脱氨酶为ddda的dddi。在一些实施方案中,tdd包含seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219的氨基酸序列。
25.在一个方面,本公开提供了编码本文所述的一种或多种融合蛋白的一种或多种核酸分子,以及包含一种或多种核酸分子的表达构建体和包含一种或多种表达构建体的病毒载体,任选地其中病毒载体可以是腺相关病毒载体、腺病毒载体、或慢病毒载体。还提供了一种细胞(其可以是真核细胞,例如哺乳动物细胞或植物细胞),该细胞包含如本文所述的碱基编辑器系统、如本文所述的一种或多种融合蛋白、如本文所述的一种或多种分离的核酸分子、如本文所述的一种或多种表达构建体、或如本文所述的一种或多种病毒载体。在一些实施方案中,哺乳动物细胞是人细胞,如人胚胎干细胞或人诱导性多能干细胞。
26.在一些方面,本公开提供了使细胞(其可以是真核细胞,例如哺乳动物或植物细胞)中的靶基因组区中的胞嘧啶变为胸腺嘧啶的方法,该方法包括向细胞递送如本文所述的碱基编辑器系统。在一些实施方案中,胞嘧啶向胸腺嘧啶的改变在靶基因组区产生了终止密码子。该系统的多重形式可靶向多于一个基因组区(例如,2、3、4、或5个基因组区)。编辑可以在体内、离体、或体外进行。
27.还提供了通过本发明的编辑方法获得的基因工程细胞(其可以是真核细胞,例如哺乳动物细胞如人ipsc或植物细胞)。
28.本文所述的工程化细胞(例如工程化人细胞),包括包含细胞和药学上可接受的载剂的药物组合物,可以用于治疗有此需要的患者(例如对有此需要的人类患者)或者用于制备用于治疗有此需要的患者的药物。在一些实施方案中,患者患有癌症、自身免疫病症、常染色体显性疾病、或粒线体病症。在一些实施方案中,患者患有镰状细胞病、血友病、囊性纤维化、苯丙酮尿症、泰萨二氏病、朊病毒病、色盲、溶酶体贮积病、弗里德希共济失调、或前列腺癌。还设想了包含细胞的试剂盒和制品。
29.本发明的其他特征、目的以及优点在以下详细描述中显而易见。然而,应当理解,尽管指出了本发明的实施方案和方面,但是给出的详细描述仅仅是说明性的,而非限制性的。根据详细描述,本发明范围内的各种变化和修改对于本领域的技术人员将变得显而易见。
附图说明
30.图1是说明用于c至t碱基编辑的一对zfp-tdd融合蛋白的示意图。矩形代表融合蛋白的zfp结构域中的dna结合锌指。加下划线的c核苷酸上方的箭头形状代表融合蛋白的二
聚化tdd结构域。锌指结构域与tdd结构域之间的黑线代表肽接头。
31.图2a是显示ccr5靶向zfp-tdd融合蛋白对的zfp设计的示意图。c9、c10、c18和c24是用于碱基编辑的靶核苷酸。顶部链(左到右):seq id no:227。底部链(右到左):seq id no:228。
32.图2b是显示二聚化zfp-ddda对的构建体设计的实例的示意图。flag:flag标签。nls:核定位序列。ugi:尿嘧啶dna糖苷酶抑制剂。
33.图3是显示一系列zfp-ddda融合蛋白对在人ccr5基因座处的c至t碱基编辑的热图结果的表。编辑活性度对应于细胞内阴影的暗度。l0、l7a和l26代表用于使ddda结构域与zfp结构域的c端在融合蛋白中融合的肽接头。
34.图4是显示一系列zfp-ddda融合蛋白对在人ccr5基因座处的c至t碱基编辑的热图结果的表,其中ddda分裂发生在不同位置。编辑活性度对应于细胞内阴影的暗度。
35.图5是显示ccr5靶向zfp-tdd融合蛋白的zfp设计的示意图。c9、c10、c18和c24是用于碱基编辑的靶核苷酸。从顶部到底部:seq id no:229(左到右)、seq id no:230(右到左)、seq id no:231(左到右)、seq id no:232(右到左)、seq id no:233(左到右)以及seq id no:234(右到左)。
36.图6a-6c是显示一系列具有所指定ddda突变的zfp-ddda融合蛋白对在人ccr5基因座处的c至t碱基编辑的热图结果的表。突变相对于seq id no:72进行编号。编辑活性度对应于细胞内阴影的暗度。
37.图7a是说明组合使用zfp-tdd碱基编辑系统和切口酶系统来增加碱基编辑效率的示意图。此处所显示的切口酶系统是基于crispr/cas的切口酶系统。说明性的基因座是人ccr5基因座。顶部链(左到右):seq id no:235。底部链(右到左):seq id no:236。
38.图7b是显示使用图7a的方法在人ccr5基因座处的ddda c至t碱基编辑的热图结果的表。编辑活性度对应于细胞内阴影的暗度。
39.图8是说明组合使用zfp-tdd碱基编辑系统和基于crispr/cas的切口酶系统的示意图。
40.图9是说明三聚化zfp-tdd foki切口酶碱基编辑系统的实例的示意图。
41.图10是显示组合使用的ccr5靶向zfp-tdd融合蛋白对与zfp-切口酶的zfp设计的示意图。c9、c10、c18和c24是用于碱基编辑的靶核苷酸。顶部链(左到右):seq id no:237。底部链(右到左):seq id no:238。
42.图11是显示使用图10的方法在人ccr5基因座处的ddda c至t碱基编辑的热图结果的表。编辑活性度对应于细胞内阴影的暗度。
43.图12是显示一系列zfp-tdd融合蛋白对在人ccr5基因座处的c至t碱基编辑的热图结果的表。编辑活性度对应于细胞内阴影的暗度。o1:tdd1;o2:tdd2;o3:tdd3;o4:tdd4;o5:tdd5;o6:tdd6。
44.图13是显示具有tdd1-tdd6的zfp融合蛋白对在ccr5碱基编辑窗口中针对任何c的c至t碱基编辑的最高频率的热图结果的表。o1:tdd1;o2:tdd2;o3:tdd3;o4:tdd4;o5:tdd5;o6:tdd6。
45.图14是显示具有tdd1-tdd6的zfp融合蛋白对在ccr5碱基编辑窗口中针对任何c的c至t碱基编辑的最高频率的热图结果的表。o1:tdd1;o2:tdd2;o3:tdd3;o4:tdd4;o5:tdd5;
o6:tdd6。
46.图15是显示ciita靶向zfp-tdd融合蛋白对的zfp设计的示意图。g2、g5、c6、c8、g10、g11、g14、c15和c16是用于碱基编辑的靶核苷酸。顶部链(左到右):seq id no:239。底部链(右到左):seq id no:240。
47.图16是显示一系列zfp-tdd融合蛋白对在人ciita基因座(“位点2”)处的c至t碱基编辑的最高频率的热图结果的表。编辑活性度对应于细胞内阴影的暗度。o1:tdd1;o14:tdd14;等。
48.图17是显示ciita碱基编辑窗口中针对任何c(加下划线)的c至t碱基编辑的最高频率的热图结果及其针对ddda、tdd4、tdd6、tdd9、tdd10、tdd14、tdd15和tdd18的序列基序的表。扩增子:seq id no:244。o4:tdd4;o6:tdd6;等。
49.图18是显示具有tdd6或tdd14的zfp融合蛋白对在人ciita基因座(“位点2”)处的c至t碱基编辑的热图结果的表。l26、l21、l18、l13、l11、l9、l6和l4代表用于使tdd6或tdd14结构域与zfp结构域的c端在融合蛋白中融合的肽接头。编辑活性度对应于细胞内阴影的暗度。o6:tdd6;o14:tdd14。
50.图19是说明用靶向zfp-tddi抑制tdd的设计的示意图。
51.发明详述
52.本公开提供了用于在细胞dna(如基因组dna)中碱基编辑(例如从胞嘧啶(c)至胸腺嘧啶(t))的系统和方法。该系统需要使用zfp-毒素衍生的脱氨酶(tdd)融合蛋白(zfp-tdd)。通过在细胞环境中提供精确的基因编辑,本发明的系统和方法可用于预防和/或治疗多种疾病。设想这些系统和方法特别可用于需要同时敲除多个人基因的基于细胞的疗法。
53.本发明的系统和方法可使靶向的c:g碱基对转化为t:a碱基对。在一些实施方案中,碱基编辑系统还可以包括使转化的稳定性增加的蛋白质(例如,ugi),和/或使靠近靶向碱基的dna产生切口的核酸内切酶,以便刺激编辑区中的dna修复并促使相对链上g核苷酸至a的纠正,从而形成编辑的t:a碱基对。
54.本发明的系统和方法是有利的,部分是由于融合蛋白中zfp结构域的尺寸紧凑。相比之下,tale的较大物理尺寸和长c端tale接头限制了碱基编辑窗口可以有多小以及设计密度。工程化tale的尺寸和高度重复性质也使得使用常见病毒载体向人细胞递送基于tale的碱基编辑器具有挑战性。本发明的zfp衍生的碱基编辑系统避免了这些问题。例如,与tale碱基编辑器系统(例如tale-tdd)或crispr/cas碱基编辑器系统相比,这些zfp衍生的系统的紧凑度可以允许包装在单个aav载体内。此外,由于本文的融合蛋白的小尺寸,有可能在编辑系统中包括切口酶,以便允许在靠近编辑的碱基处生成dna切口,并由此有利于dna修复机制将与编辑的c相对的碱基从g改变为相应的a,从而形成正确的t:a碱基对。包含切口酶可以大大地增加碱基编辑效率。
55.i.锌指融合蛋白
56.提供了融合蛋白,该融合蛋白含有与碱基编辑器结构域(例如,胞苷脱氨酶结构域,其可以是如本文所述的tdd)、胞苷脱氨酶抑制剂(例如,tddi,如其中胞苷脱氨酶为ddda的dddi)结构域和/或切口酶结构域(例如,foki结构域)融合的dna结合锌指蛋白(zfp)结构域。如本文所用,“融合蛋白”是指其中异源功能结构域(即,在自然界中不天然存在于同一蛋白质中的功能结构域)共价连接(例如,通过肽基键)的多肽。这些可重组制备的融合蛋白
是本发明碱基编辑器系统的组分。在一些实施方案中,本文的zfp融合蛋白包含胞苷脱氨酶结构域(例如,衍生自如本文所述的tdd)和额外的切口酶结构域和/或ugi结构域。
57.本文还设想了本发明系统的其他形式。例如,两个功能结构域可以通过非共价键结合在一起,而非肽基连接。在一些实施方案中,两个功能结构域(例如,zfp结构域和胞苷脱氨酶抑制剂结构域;或zfp结构域和切口酶结构域)各自与二聚化配偶体(例如,亮氨酸拉链和本文进一步描述的那些)融合,使得两个功能结构域通过二聚化配偶体的相互作用结合在一起。在某些实施方案中,这些结构域的二聚化可以通过特定药剂(例如小分子或肽)的存在或不存在进行控制。设想在本发明的任何方面,此类形式可以代替融合蛋白。
58.以下进一步详细描述了本发明碱基编辑器系统的各组分。
59.a.碱基编辑器
60.除zfp结构域之外,本公开的zfp-胞苷脱氨酶融合蛋白还包含胞苷脱氨酶结构域。如本文所用,术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质。胞苷脱氨酶结构域例如可催化胞嘧啶脱氨成尿嘧啶,其中尿嘧啶在dna复制或修复期间被胸腺嘧啶碱基替换。脱氨酶结构域可以是天然存在的或者可以是工程化的。在一些实施方案中,本公开的胞苷脱氨酶作用于双链dna。
61.在一些实施方案中,胞苷脱氨酶衍生自可例如来自原核或真核生物体的毒素。在某些实施方案中,生物体可以是细菌或真菌。此类胞苷脱氨酶在本文中称为毒素衍生的脱氨酶(tdd)。ddda和ddda直系同源物为tdd。如本文所用,“衍生自”毒素的胞苷脱氨酶可以指与天然存在的毒素相同或者作为保留脱氨酶活性的毒素的修饰形式的胞苷脱氨酶。
62.在一些实施方案中,胞苷脱氨酶为ddda(seq id no:72)。在某些实施方案中,胞苷脱氨酶包含ddda的毒性结构域(例如氨基酸1290-1427(seq id no:49)或1264-1427(seq id no:81)),并且融合蛋白称作zfp-ddda。以下显示了衍生自新洋葱伯克霍尔德菌的ddda蛋白的示例性全序列:
63.64.[0065][0066]
如本文所用,除非另有说明,否则术语“ddda”是指ddda毒性结构域。
[0067]
在某些实施方案中,胞苷脱氨酶是ddda的“再连接”形式(例如seq id no:50)。
[0068]
本公开还提供了在形成核苷酸口袋的残基(例如,y1307、t1311、s1331、v1346、h1366、n1367、n1368、p1369、e1370、g1371、t1372、f1375、v1392、p1394、p1395、i1399、p1400、v1401、k1402、a1405、t1406、或它们的任何组合,其中残基的编号是相对于seq id no:72的)处突变的ddda变体的形式。ddda可例如在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、或22个所述残基处突变。在一些实施方案中,ddda在残基e1370、n1368、y1307、t1311、s1331、k1402、或它们的任何组合处突变。在某些实施方案中,ddda在残基e1370、n1368、y1307、或它们的任何组合处突变。在某些实施方案中,一个或多个突变可以增加ddda效率、增加ddda活性、改变ddda活性窗口、或它们的任何组合。设想在本发明的任何方面,此类变体可以替代野生型ddda。
[0069]
在特定实施方案中,胞苷脱氨酶结构域(例如,衍生自本文所述的tdd)是由单独缺乏胞苷脱氨酶活性但二聚化以形成活性胞苷脱氨酶的第一和第二“半结构域”或“分裂物”构成的“分裂酶”。如本文所用,“无活性”或“缺乏胞苷脱氨酶活性”的半结构域可以是如下半结构域:i)缺乏任何胞苷脱氨酶活性(例如,任何可检测的胞苷脱氨酶活性),ii)缺乏特异性胞苷脱氨酶活性,或者iii)缺乏显著的胞苷脱氨酶活性(即,1%、2%、3%、4%、5%、6%、7%、8%、9%、或10%或更高的中靶碱基编辑活性,其在特定实施方案中可以是10%或更高)。例如,活性胞苷脱氨酶的组装可以通过彼此靠近的半结构域连接的锌指蛋白与dna靶标的结合来驱动,使得半结构域被定位以允许功能性胞苷脱氨酶的组装。
[0070]
应当理解,本文所述的“半结构域”对可以指分别缺乏胞苷脱氨酶活性,但在一起形成功能性胞苷脱氨酶结构域(野生型或本文所讨论的变体)的任何胞苷脱氨酶多肽序列对。在胞苷脱氨酶是ddda的情况下,ddda序列中的“分裂”可发生在许多位置中的任一者,例如,g1322、g1333、a1343、n1357、g1371、n1387、e1396、g1397、a1398、i1399、p1400、v1401、k1402、r1403、g1404、a1405、t1406、g1407、或e1408处,并且不需要处于蛋白质的中间。在一
些实施方案中,“分裂”发生在g1322、g1333、a1343、n1357、g1371、n1387、g1397、g1404、或g1407。在某些实施方案中,“分裂”发生在g1404、g1407、g1333、或g1397。在特定实施方案中,“分裂”发生在g1404或g1407。在一些实施方案中,ddda半结构域对可以包含如下氨基酸序列:
[0071]
a)seq id no:82和83;
[0072]
b)seq id no:84和85;
[0073]
c)seq id no:18和19;
[0074]
d)seq id no:51和52;或
[0075]
e)seq id no:53和54。
[0076]
在某些实施方案中,tdd可以包含例如根据ncbi登录号wp_069977532.1(“tdd1”,seq id no:86)、wp_021798742.1(“tdd2”,seq id no:87)、qnm04114(“tdd3”,seq id no:88)、wp_181981612(“tdd4”,seq id no:89)、axi73669.1(“tdd5”,seq id no:90)、wp_195441564(“tdd6”,seq id no:91)、avt32940.1(“tdd7”,seq id no:117)、wp_189594293.1(“tdd8”,seq id no:118)、tcp42004.1(“tdd9”,seq id no:119)、wp_171906854.1(“tdd10”,seq id no:120)、wp_174422267.1(“tdd11”,seq id no:121)、wp_059728184.1(“tdd12”,seq id no:122)、wp_133186147.1(“tdd13”,seq id no:123)、wp_083941146.1(“tdd14”,seq id no:124)、wp_082507154.1(“tdd15”,seq id no:125)、wp_044236021.1(“tdd16”,seq id no:126)、wp_165374601.1(“tdd17”,seq id no:127)、nli59004.1(“tdd18”,seq id no:128)、或kab8140648.1(“tdd19,”seq id no:129)的氨基酸序列、或所述氨基酸序列的能够具有胞苷脱氨酶活性的部分(例如“毒性结构域”)。这些氨基酸序列如下所显示:
[0077]
ncbi登录号wp_069977532.1(tdd1)
[0078]
msssdagrafgvpenvlarftrypggarrragrtararrlgivlsavlsa
[0079]
tllpaeawaiappaprtgptldalqqeeevdpdpaameelddwdggpvep
[0080]
padytptevtpptggtapvpldsageelvpagtlpvrigqaspteedpappa
[0081]
psgtwdvtvepratteaaavdgaiikltppasgstpvdveldygrfedlfg
[0082]
tewssrlkltqlpecflttpeleecgtpitiptsndpatgtvratvdpadgq
[0083]
pqglaaqsgggpavlaatdsasgaggtykatslsatgswtaggsgggfs
[0084]
wsypltipdtpagpapkislsyssqsvdgrtsvangqaswigdgwdyhpgf
[0085]
verryrscnddrsgtpnndnsadkeksdlcwasdnvvmslggsttelvr
[0086]
ddttgtwvaqndtgarieykdkdggalaaqtagydgehwvvttrdgt
[0087]
rywfgrntlpgrgaptnsaltvpvfgnhtgepchaatyaassctqawrw
[0088]
nldyvedvhgnamvvdwkkeqnryaknekfkaavsydrdayptqily
[0089]
glraddlagppagkvvfhaaprclesaatcseakfesknyadkqpwwd
[0090]
tpatlhckagdencyvtsptfwsrvrlsaietqgqrtpgstalstvdrwt
[0091]
lhqsfpkqrtdthpplwlesitrvgfgrpdasgnqsskalpavtflpnkvd
[0092]
mpnrvlksttdqtpdfdrlrvevirtetggethvtysapcpvggtrptpas
[0093]
ngtrcfpvhwspdpaafsdenldksgyepplewfnkyvvtkvtemdlva
[0094]
eqpsvetvytyegdaawakntdeygkpalrtydqwrgyasvvtrtgtt
[0095]
antgaadateqsqtrtryfrgmsgdagrakvhvtltdvtgtattvedll
[0096]
pyqgmaaetltytkaggdvaarelafpysrktasrarpglpaleayrtg
[0097]
ttrtdsiqhisgdrtraaqnhttyddayglptqtysltlspndsgtlvagd
[0098]
erctvttyvhntaahiiglpdrvrattgdcaaapnattgqivsdsrtayd
[0099]
algafgtapvkglpvqvdtisgggtswitsarteydalgratkvtdaag
[0100]
nsttttyspatgpafevtvtnaaghattttldpgrgsaltvtdqngrktt
[0101]
stydelgratgvwtpsrpvnqdasvrfvyqiedskvpavhtrvlrdagt
[0102]
yeesielydgflrprqtqrealgggrivtetlynangsakevrdgylaeg
[0103]
eparelfvplsldqvpsatrtaydglgrpvrtttlhrgvprhsattayggd
[0104]
welsrtgmspdgttplsgsravkattdalgrpariqhfttqnvsaesvdt
[0105]
tytydprgplaqvtdaqqntwtytydargrktsstdpdagaayfgyna
[0106]
ldqqvwskdnqgrlqyttydvlgrqtelrddsasgplvakwtfdtlpg
[0107]
akghpvastryndgaaftsevtgydteyrptgnkvtipstpmttglagt
[0108]
ytyastytptgkvqsvdlpatpgglaaekvitrydgedspttmsglawyt
[0109]
adtflgpygevlrtasgeaprrvwttnvydedtrrltrttahretaphpv
[0110]
stttygydtvgnitsiadqqpagteeqcfsydpmgrlvhawtdgnsavcp
[0111]
rtstapgagparadvsagvdgggywhsyafdaignrtkltvhdrtdaal
[0112]
ddtytytygktlpgnpqpvqphtltqvdavlnepgsrveprstyaydtsg
[0113]
nttqrviggdtqtlawdrrnkltsvdtnndgtpdvkylydasgnrlved
[0114]
dgttrtlflgeaeivvntagqavdarryysspgapttirttggkttghklt
[0115]
vmlsdhhstattaveltdtqpvtrrrfdpygnprgtepttwpdrrtylgv
[0116]
giddpatglthigareydastgrfisvdpvmdltdplqmngytyanadpi
[0117]
nnsdptgllldargggtqkcvgtcvkdvtnrkgiplppgeewkhegea
[0118]
qtdfngdgfitvfptvnvpakwkkakkyteafykavdtacfygrescad
[0119]
peypsrahsinnwkgkackavggkcperlswgegpafaggfaiaaeeya
[0120]
grggyrgggarrgspckcflagtevlmadgstksiediklgdevvatdp
[0121]
vtgeagahpvsaliatendkrfnelviitsegverltathehpfwspsege
[0122]
wleagelrtgmtlrsdsgetlvvagnraftqrartynltvadlhtyyvl
[0123]
agqtpvlvhnancgphlkdlqkdyprrtvgildvgtdqlpmisgpggqs
[0124]
gllknlpgrtkangehvethaaaflrmnpgvrkavlyidyptgtcgtcr
[0125]
stlpdmlpegvqlwvisprrtekftglpd(seq id no:86)
[0126]
ncbi登录号wp_021798742.1(tdd2)
[0127]
mvdlgayeepvafddgvadalrsaasalsgtlsgqaasrsswaatastd
[0128]
feghyadvfdanaraacddcsniasaldalaadvqtmkdaaaserdrr
[0129]
rqakewadrqkdewapkswiddhlgldkppagppetpvvdaqaptvat
[0130]
wsepaqgqaggvssarpddlrtyssnvtgandtvttqkgtldgalsdfa
[0131]
drcswcsidtsgittalaafganntnetrwvdtvaaafeaaggsgaisav
[0132]
sdaaldaslqaagvtqsrqpvdvtaptiqgdpqtsgyaddpvntttgnfi
[0133]
epetdlafsggcaslgfdrvynslsagvgafgpgwastadqrllvtedg
[0134]
avwvqpsgrhvvfprlgngwdrahndtywlhtttdttgptpgdapttg
[0135]
aaggagvfvvsdnaggrwvfdragrpvsvsrgpgtrvdhrwdgdrlv
[0136]
glthergravtiewndhhtritaltandgrrvdygydpagrlteaasag
[0137]
gtrtygwneagliatvtdpdgvveaantynehgqvtsqrsrfgrlshyt
[0138]
ylpggvtqvadedggrantwihdqtgrlvgmvdadgnrqsigwdqwg
[0139]
nrvqitgrdgrttvcrydargrlitrqeasgartdyewdeadrvvqvtv
[0140]
tdttssshgntssaggsgpsvtsyeyegagrnpstvtdpeggvtrltwdq
[0141]
nllteatdpagvrvrlgydghgdlvsttnaagdtarlvrdgagrvvaai
[0142]
tplghrteyrydeagrlasrqdpdgalwryehttggrlsavvdpdggrt
[0143]
vteygpggveeattdplgrrleqewddlgnlagvrlpdgrewsyvhdg
[0144]
lsrltetvdpagglwrreydvngmvaatvdptgvrrglawaadgsvtv
[0145]
sdasgtarvgvdglgrpvsvsvssapapgeavpmgmsleetvgtgapap
[0146]
ggagpdgpdarvvvrdlcgrpvealdadggltrlmrdaagrlveeispa
[0147]
grstryewdrcgrlsavigpdgarttmaydaasrliaqdgpggrvrvay
[0148]
drcgrlstvtapgrgkttwgydragrvrsvrspawglvrfgydpagqlt
[0149]
avtnalggvtrydydecgrlvqvtdplghvtrrtytaadrvetlvdplg
[0150]
rttqagydaagrqlwqtddtgerlafgwdeagrlervatggeglpgqt
[0151]
ccaltrpgrrvlrvtgpggardelvfdrlgrlarharggrtvgewswd
[0152]
pdgactaftgpdgqrvryayddagalvrvegtafgpvtvrrdtagrltg
[0153]
mdgpgltqrwdrdetghviayrrtkngvttssrvsrdesgrvtavdgpd
[0154]
gtvrygydpagqlariegpdgrresftwdkaghltrrsverpgarpettl
[0155]
ysydpagqlastdgpdgrtlytwdaagrrtgqdgpdghwsyswapsgh
[0156]
ltavtrrtphdartwrisrdglglprriddtdlawdlsgpvpaltrfgtht
[0157]
vtglpralaidgtltstgwrparptsaddpwappppvvetdgarlgvgga
[0158]
vglggleilgarvhdpttfsflspdpldqpplapwatnpysyaannplaft
[0159]
dptglrpltdtdfeaykhdhgglggwiadhkdyliggamviaggvlma
[0160]
tgvggplggmligagadtiiqrattgqvdygqvavsgllgaagggaasa
[0161]
llkgggrlatelgatglrtaittgaasgtasgaggsgygyltgpgphtvs
[0162]
gfltstatgaveggllggasgaaghglsttgknvlghfeptpttpqgtss
[0163]
dtiaemlnsasqpgrtagvldidgeltpltsgrpslpnyiasghvegqaam
[0164]
imrqqqvqsatvyhdnpngtcgycysqlptllpegaaldvvppagtvppsnrwhnggpsfignssepkpwpr(seq id no:87)
[0165]
ncbi登录号qnm04114.1(tdd3)
[0166]
mslpeydgttthgvlvlddgtqigftsgngdprytnyrnnghveqksalymrennisnatvyhnntngtcgycntmtatflpegatltvvppenavannsraidyvktytgtsndpkisprykgn(seq id no:88)
[0167]
ncbi登录号wp_181981612(tdd4)
[0168]
mlaiekiksgdkvistdpetmetspktvletyirevttlvhltvngeeivttvdhpfyvknqgfikagelivgdelldsncnvllvenhsveltdepvtvynfqvedfhtyhvgkcrllvhnancnqekpvlpkydgkttegvmvtpdgkqisfksgnsstpsypqykaqsashvegkaalymrengineatvfhnnpngtcgfcdrqvpallpkgaklt
vvppsnsvannvraipvpktyignstvpkik(seq id no:89)
[0169]
ncbi登录号axi73669.1(tdd5)
[0170]
msssvsgrafrvsgvltritkswtpgsarrssasvrhrgravrarslgvtlsavlaatllpaeawaiappaprigpslvdlqqeepadpdqakidelstwsgapveppadytptattppaggtapvaldgagddlvpvgnlpvrlgkasptdeepdppapggtwdvaveprtsteasdvdgalitvtppsggatpvdieldygkfedlfgtawssrlrltqlpecflttpeldecttvvdvpsvndpsndtvratidpaaspqqglstqsgggpvvlaatdsasgaggtykatpftatgtwtaggsgggfswsypltapappagpaptislsyssqsvdgrtsvangqaswigdgwdynpgfierryrscnddrsgtpnnaggkdkkksdlcwasdnlvmslggsatalvhdgttgawvaqsdtgarieyrtrtgspktaqtgaydgeywvvttrdgtrywfgrntipgrtaatesaltvpvfgnhsgepchatayadsscaqawrwnldyvedvhgnamivdwkketnryarnekfkeavayhrggypaqilyglraddlngapagkvvfktaprcvedagttcsptgyesdnyadkqpwwdtpatlhcksgakncfvtsptfwssvrlteiethgrrtpgstalslvdswtlkqsfpkqrtdthpplwlesitrtghgapnasgeqtsralppvsflpnvvdmpnrvskgatdetpdfdrlrvetvrtetggeihvdysapcavgtahpspetnttrcfpvhyspdpealsdevlakkpapvewfnkyvvqkvtekdrvarqpdvvttyayegggawgrstdeftkpklrtydqwrgyasvlvr
[0171]
kgvtgadpaaadateqsqtrmryfrgmsgdagrptvtvkdstgaetlg
[0172]
edlapyqgmpaetvaytraggdvasrilawptsretasqarpglpalkah
[0173]
rvatartetvetisggrtrtartvttyddtyglpltaetltltpdgsggttt
[0174]
gdrscstntyvhntakhliglvqrarttvgtcaqaatasgsdvvsdtrvs
[0175]
ydaldafgaapvrglpfrtdtvgadgtgwvtsarteydplgratevrd
[0176]
akghvskvgfvpptgpaftttstdakghttttaldpargtalsvtdangr
[0177]
rttsaydelgrttavwspsrtqgtdkasvlfdyqiednkvpatrtrvlrd
[0178]
ngtyedsvtvydgllrprqaqtealgggrivtetlynangapaetrngy
[0179]
laegepqtelfvplsltqvpsasktaydglgravrttvlhagdpqhsatv
[0180]
rhegdrtltrtgmsadgttpmpgsrstatwtdalgrtskiehftatdlsa
[0181]
aidtrytydargnlakvtdardniwtytydargrltfstdpdagsssfg
[0182]
ydvldrqiwskdsrqrsqhtvydelgrrtelrddsaegplvakwtydtl
[0183]
pgakglpvastryhegaeftsevtgydqeyrptgsrttipstplttglagt
[0184]
ytykntytptglpqsvelpatpgglaaekvitrydgegsprttsglawyt
[0185]
vdtvlsplgqvlrtasgeapnrvwathfydestgrldrritdretldpsri
[0186]
setsyahdtvgnitsitdtqsparvdrqcfaydpmgrlahawtakspgcp
[0187]
rsstaqgagpnrtdvspsidgagywhsyefdtignrtgmvvhdpadpal
[0188]
ddtyvythgvpsegplqpatlqphtltkvdatvrgpgstvtssstyaydps
[0189]
gnttqrviggdtqaltwdrrnklmsadtdddgtadvtylydasgnrll
[0190]
eadattrtlylgeseivvdtagrpvearryyshpgapttlrttggrtsght
[0191]
ltvqltdhhntptasvaltggqpvtrrmfdpygnprgtepttwpdrrtyl
[0192]
gvgiddettglthigareydsvtgrfisadpiidiadplqmngyayannnp
[0193]
vtnwdptglksdecgslyrcggnqvittkttkyqdvntvarhfektasw
[0194]
atlaqwkaeglgkspafgkakkltkwknehyeknwtinlvpgmarsw
[0195]
vsgvdaaasaimpfptvqaaplydslvsslgvntkgrayangeglmdgl
[0196]
smvggvgaiapgiksglkaaakgcgpgnsftpgtevaladgttkpiediki
[0197]
gdevlatdpetgetraekvtaeirgdgtknlvkvtidtdgdrgtdtaeit
[0198]
atdghpfwvpelgrwidatdlapgqwlrtsagthvqitaikrwtetatvh
[0199]
nltvadlhtyyvlagktpvlvhnencgpnlkdlpkdydrrtvgildvgt
[0200]
dqlpmisgpggqsgllknlpgrtkantdhveahtaaflrmnpgirkavlyidyptgtcgtcgstlpdmlpegvqlwvisprktekfaglpd(seq id no:
[0201]
90)
[0202]
ncbi登录号wp_195441564(tdd6)
[0203]
mkltykeleielelagllaveelvltqglnchagltlkilieeeqrdelvt
[0204]
mssdagvtvrelektngqvvfrgkletvsarrenglfylyleawsytm
[0205]
dwdrvkksrsfqngaltymevvqrvlsgygqsgvtdhatggacipefll
[0206]
qyeesdwvflrrlashfgtylladatdacgkvyfgvpeisygtvldrqg
[0207]
ytmekdmlhyarvlekegvlsqeascwnvtvrfflrmwetltfngiea
[0208]
vvtamrlhtekgelvysyvlarragirrekeknpgifgmsipatvmersg
[0209]
nrirvhfeidpeyeasektkyftyaiesssfycmpeegsqvhiyfpdhdeqg
[0210]
avavhairsgegasgscstpenkrfsdpsgsamdmtpaslqfapdaggat
[0211]
vlhlegggflsltgmdiklktqmgmasdkekpmqdlmicgeqkltmqi
[0212]
gessddcivmeagtevrsalvvqeadsspaavpsgdellseqeaadaqar
[0213]
eaennavkedmitkkqeskrkivdgvislvtvvgltaltvatgglaapfai
[0214]
aagvkatfavadiaegldgyskmnamdasrpanflrdtvfggnqtaydi
[0215]
tsmitdvafdvvsgkalvgafsgadkvskvqkfagkamsfwngicpktk
[0216]
vanflfqmggtmlfgavndylttgkvdlknlgldafaglakgtlgtag
[0217]
tekikrllntdnkwvekavgilagttfgttvdlginklagrdvdllqvik
[0218]
qnliesglgqffgepidvvtgaflitatdftlpdiredlrvqrkynstsrea
[0219]
gllgpgwsfsyecrlycsgnrlhakldsgitavfawdgshavnvtrgce
[0220]
wleltgeddgwriydgrnykcyhydgqglltaaedrngqcvrlyyege
[0221]
rltrittplgysldveirdgrlvqirdhmgrtmqyryengflsdvihmde
[0222]
gvthyeydsngyleravdqakvtylenryddagrvvlqtlangdtyra
[0223]
dyhpeknrvtivssvhdkavehwynefgeiletsyqdgtkeryeygeng
[0224]
hrtsrtdrlgrkttwtydeagrlteevqpdglrtvhrydaagneilrtd
[0225]
sagretafeydghhnrtaerrtdglqvrenrsvydwmgrltetadaeg
[0226]
nrtqyqygeaggkpsvirfadgetcsfeydkagrmmaqedacgrteyg
[0227]
ynarnkralvrdgegnetrwmydgmgrllalylpkawkeqhgeysys
[0228]
ydfldrlihtknpdggherlmrdgegnvlkrvhpnaydscrddgegtt
[0229]
ydydsdgnnirihypdggcerifydsegnrirhvmpesydpqtddgegft
[0230]
ytydacsrltgvtgpdgvrqasytydpagnlteetdaegrctyrsytaf
[0231]
gelkeqlkpalekdgvmlyeritwqydrcgnvlleqrhggywdsngvlvkedgaglalrftydsrnrrirvedglgavischydvqgklvyeekavsgevrqvihygydragrlterkeeldsglaplegepryavtryrydgngnrtgivtpegyrilrsydacdrlvservvddkngidrttsvtydyagnitrivrsgkglgeweqgygydlkdriv
hvkdclgpvfsyeydkndrriaetlpqtgmtengksgypknqnryrydvygrlltrtdgsgtvqeenrylpdgrlalsreadgqeiryaygahgreeetgtarsrkagraaqkyrydsrgritgvvngngnetgydldawgriqnirqadggeegytydfagnvtgtrdanggvityrynsqgkvceitdqegnsetfrydregrmvlhvdrngsevrttynvdgnpvletgtdrngenrvtrsfeydasgnvrkavaggfcytyeyrpdgkllkksasgrtilscsyhadgslesltdasgkpvfyeydwrgnlsgvrdengdmlaayahtpggklkeichgnglctryeydtdgnmihlhfqrengetisdlwyeydlngnrtlktgkcilsgdsltdlavsyrydsmdrltsesrdgeetaysydfcgnrlkkldksgteeyhynrknqlicrfsekektayrydlqgnlleaagaegtevfsynafqqqtavtmpdgkhlenrydaeylragtvengtvtsfsyhngellaesspegdtisryipgygvaagwnreksgyhyyhldeqnstayitggsceienryeydafgvlknsmeefhnrilytgqqydqtsgqyylrarfynpvigrfvqedeyrgdglnlyaycknnpvvyydpsgydsqypckeemsagagesgrktislpeydgttthgvlvlddgtqigftsgngdprytnyrnnghveqksalymrennisnatvyhnntngtcgycntmtatflpegatltvvppenavannsraidyvktytgtsndpkisprykgn(seq id no:91)
[0232]
ncbi登录号avt32940.1(tdd7)
[0233]
mgdrlpafvdggdtlgifsrggierdlasgvagpasslpkgtpgfnglvkshveghaaalmrqngipnaelyinrvpcgsgngcaamlphmlpegatlrvygpngydrtftglpd(seq id no:117)
[0234]
ncbi登录号wp_189594293.1(tdd8)
[0235]
mssrpfrkrlpgavvrrwlgrgavvaslsllpqvvvpsgydfaaqaqsvaarkkledrpeakinkvgvlrpgtskapkdksapasrktrerlqeaswpksgkataavtatseatvnvgglgmeltqepaapaaksaksttkrkatgpaekvtlrvhsratakkagvngvlltvdpargesnekaedtdklrisldyssfsdvyggnfgprlslvklpacalttpekkscrtqtpvagadneaesqtlt
[0236]
gtvparnlkagtpmllaaaadssggggdfsatplsptatweaggstgdf
[0237]
twdyplrvppatagpspnlsisynsasvdgrtagennqtsligegfsitesyi
[0238]
erkyasckddgqsgkgdlcwkyanatlvlngkavelvnacadksacdt
[0239]
aalseasggtwkvknedgtrvehltgasgngdnngeywkvtdasgiqy
[0240]
yfgkhrmpgwsdkgttdtadddpstystwavpvfgddsgepcykssgfa
[0241]
dsscnqawrwnldyvvdthdnastywysketnyysknadttvngtay
[0242]
trggylnridyglrsdliyskpaaqqvrftygqrcivtngcssltkdtka
[0243]
nwpdvpydmicaantkcttqigpsfftrqrlidittsvwtgtgttrrdvd
[0244]
twhlshdfpdtgdasspslwlksiqntgkantttaamppivfggiqmpnh
[0245]
vegsgqdnlryikwrvrtiksetgstltvnysdpdciwgssmpsavdknt
[0246]
rrcfpvkwsqsgttpvtdwfhkyvvtsvlqddpyghsdtgetyydyqg
[0247]
gagwaysddegltkpsnrtwsqwrgygkvvttsgnsegprskkstlym
[0248]
rglngekeldgtarvakvtdstgtaiddsrqyagfvretiayngsdelsg
[0249]
tintpwshktgshtyswgtteawivqagetesrtkistgtrtvkqkttyd
[0250]
ttygmpitvedsgdatkfgdescvrtsyarntsawlvnrvsrtetysvpc
[0251]
atipaipadvvsdittaydakavgaaptqgditatyrvasynaadktpvyq
[0252]
qvssstfdklgrpltetnaldrtvktsyvpddtgygpltsktttdpklyts
[0253]
ttevdpawgaaskttdangnvtewsfdalgrlrsvwkpdrsrtlddaa
[0254]
sivyaysvnndketwvrtdalkadgktynssyeifdsllrprqkqvpapn
[0255]
ggrvisemlyddrglayiansqvhdnsapsgtlantytgsvpastetvfd
[0256]
aagratdsifrvygqekwrtktdqqgdrtavtaaaggtgtltivdargr
[0257]
vterrefggpaptgtdytrtlyeytpggqikkmtgpdgavwtyeydlrg
[0258]
rkttstdpdkgsitttyndadqpltatttldnvsrtlindydelgrptgtw
[0259]
dgtkdnahqltkftydslakgqptasiryvggttgkiysqsvtgydaln
[0260]
rpkgtktviaatdplvtagapqtfttstaynidgtvqstslpaaaglpaet
[0261]
vkntynslgmltgtdgmtdyvqhigyspygeieetrlgtsteakqlqvl
[0262]
nryedgtrrlanthtldqtnagytsdvdyvydatgnvksvtdkangk
[0263]
dtqcfaydgyrrlteawtpssndcatarsasalggpapywtswtykpgg
[0264]
lrdsqtehktsgdtktvygypavntsgtgqphtltsvtvgsgsaktyty
[0265]
dehgnttkrysptgtaqsltwniegeltrltegtkttdylydangellirr
[0266]
spdktvlylggqelhydtatekftaqryypagdatavrtetglswmvdd
[0267]
hhgtasmtvdattqavtrrytkpfgeargtapsvwpddkgflgkpadtg
[0268]
tglthigareydptlgrflsvdpvlapddheslngyayanntpvtlsdpt
[0269]
glrpdgmcggsssscgggtetwtlnskggwdwsytktytkkftyrtgn
[0270]
ggtrtgtmtttvrtevghkavrivfkkgpepkpakkdgqcsscwamgtn
[0271]
pgyspgatddwidrpkletwqkvvlgaisvvaagvilapaaivvgegcla
[0272]
aapvcaaeiaeaatggasggsavvgagvvatgakavttgkslsesqatls
[0273]
vaqrllatigeegktagvleldgeliplvsgksslpnyaasghvegqaali
[0274]
mrdrgatsgrllidnpsgicgycksqvatllpenatlqvgtplgtvtpssr
[0275]
wsasrtftgndrdpkpwpr(seq id no:118)
[0276]
ncbi登录号tcp42004.1(tdd9)
[0277]
mafgigtsrrgsgggrgwgrrlvtpvaalallaplgeaqdavaqdagav
[0278]
rsgpvqpdvpkprvskvkevkglgakkardrvaagkkagaaqaararr
[0279]
eqtavwpgpdtasieladdrrakaelggasvsvvpengrktaasgtaqv
[0280]
tildqkaadkagvtgvllsatadtagtaevsvdysgfasafggdwaqrl
[0281]
hlvqlpacvlttpekavcrrqtplktdnnaseqsvaaqvalakaepgaps
[0282]
aqsvasaegpsatvlavtaaaagsgaspkgtgdyaatelspssaweaggs
[0283]
sgaftwnygftvppaaagptpplalsydsgsidgrtattnnqgsavgegf
[0284]
sltesyiersygscdkdghadvwdhcwkydnasivlngksnrlikddts
[0285]
gkwrletddstvtrstgadngddngeywtvttgdgtkyvfgenkldg
[0286]
aadqrtnstwtvpvfgddsgepgydkgdtfaeravtqawrwnldyved
[0287]
tsgnastywyakdsnyypknkattanasytrggylkeiryglrkdalft
[0288]
ddadakvvfahaerctvgscttltkdtaknwpdvpfdaicssgdsecna
[0289]
agpsffsrkrltgistfswnaaskafdpvdtweltqdyydagdigdttdh
[0290]
vlvlesikrtakagataidvnpvtftyqlrpnrvdgtddilplkrhrietit
[0291]
setgsittvtlsqpeckrstvldapqdsntrpcypqfwningatkasvdw
[0292]
fhkyrvlavavddptghnesiehaydyagaawhysddpfttknertwse
[0293]
wrgyrdvttytgaldttrsksvsrymlgmdgdkntdgttksvstaplm
[0294]
dtdvdfaaltdsdpysgqllqqvtysgsqpistsytnfthkntasqtvpd
[0295]
atdhtarwvrpnssyastyltasktwrtqvttsryddlgmvtshddygq
[0296]
kglsgdeictrtwyarnteaginslvsrtrtvgkecsvddtaldlpadnk
[0297]
rsgdvlsdtataydgatwsdsmkptkglvtwtgrakgyasgtpswqtlt
[0298]
saapadfdvlgrplkvtnaegqptttaytpvtagpvtkiisgnpkgfktts
[0299]
fldprtgqelrtydanlkktervydalgrltqvwlpnrdrgsesatfgps
[0300]
vkfeytidnndpswvstaalkkdgktyatsyaiydamlrplqsqtetsng
[0301]
grlltdtrydtrglpyetyanifdttstpngtytraeygeapnqnatvfd
[0302]
gagrptkstllvfgvekwstttsytgdstattaldggtasraitnirghtv
[0303]
esreyagkspadaqygdglgvgfastrtlytrgglqkqitgpddatwsy
[0304]
tydlfgrqveaedpdkgtssteydvldratkstdsrsksiltaydelgrm
[0305]
vgtwagsktdtnqrteytydkllkgqpdksiryvggkagqaytdtitey
[0306]
dslsrpvaaslelpaddpfakvgalgsasrtlsfrhaynlddtvktaeepa
[0307]
lgglpseiidygynnvgqvtsvggstgyllgatysplgqpweqllgtant
[0308]
adhkkvsirntfedgtgrltrsnvkadsqpymlqdlnysfdqvgnvtsi
[0309]
tdpttlggtssaetqcftydshrrlteawtpsqqkcsdprstsslsgpapy
[0310]
wtsytyntagqrttettrkaagdttttycytktdqphfltgtttkgdca
[0311]
trertytpdttgnttkrpgasttqdlawseegkltkltengkatdylyda
[0312]
tgellirnttsgervlytgttelhlrtdgttwaqryyaagdqtvamrsne
[0313]
sgtnkltylagdhhgtsslaisadstqtvskrymtpfgaergkptgtawp
[0314]
ddkgflskttdkttglthigareydpaigqfistdpildpaqpqslngysya
[0315]
nntpvtaadpsglwcdscndgkgwtrpdggtrgdenggknpdgsvrgt
[0316]
pgfpstrpttvgygnspgagkvitdlgsgtpalpppdvyqdyqpklpgvg
[0317]
qmgrngtympelsyelnvelyfrercsfswteecesirafythgedshgl
[0318]
prywtdvqdiptvntcpicenigfdiilatlpigkvgklrfapkvesaesml
[0319]
rslsqegktagvldingeliplvsgtsslknyaasghvegqaalimrerg
[0320]
vasarliidnpsgicgycrsqvptllpagatlevttprgtvpptarwsngk
[0321]
tfvgnendpkpwpr(seq id no:119)
[0322]
ncbi登录号wp_171906854.1(tdd10)
[0323]
mrgwvravsipvivgvlstalsmppsfadqepvarteattdglptnadeg
[0324]
qraeppalipsenripgvglkseiesqptaasvadgplpsersdsffpalapt
[0325]
pptivgyvptslapgcaewgalrwthpdsrpnglvhlytfelyrdsdda
[0326]
mvwdqlfdytltgagvvsdvagdcesilpdpqatpivelgesyyakvya
[0327]
wdgtgwsapatssaypavalpgltdeaargvcvcdtstgrlyplnilrad
[0328]
pvntatgtltesatdltipgvgpaisasrtynstdptvgplgkgwsfpyfse
[0329]
lesaassvtykaedgqeveyalqggayrlppgastrlrsvsggyqletks
[0330]
hqvigfdqngrleyardssgqgvslayatngtldkitdasgrevdvtmd
[0331]
asgkvtaialsdgrsvsygytgdlltsvtdvrggvteyeydaagrlaai
[0332]
tdplgnevmrstydaqgrvisqvdagggtwgfeyvddgayqttrttdp
[0333]
rggvsrdvyynnvlvesetaggaittyqyderlrlaatvdphgrttrht
[0334]
ydandnllstthpngdreaftyssggdlltetspegrkttytydanhrv
[0335]
atttdpnggvtsytyntdgqvltetspegnvtefeydaqgnrvatispeg
[0336]
rrttatfdaygrlesqttarghvagadpadftttfaydvasnltsstdplg
[0337]
hvteyeydlnnrrttvidpldrrtetefdaagrvvkiiepggaetvheyd
[0338]
lagnqvattdaeggrttrtfdldahmitmtaargnepgaepadftwgye
[0339]
ydglgnvveetdsaggivsygyderyrqtsvtnqanettttaydgdgnt
[0340]
vsvtdpldrtvsttynglnlpatvtdpagkvstviydrdgnrtstttplg
[0341]
hkatftydgdgmlvqdqtpngngristytydadgnqirtvdpqgrftta
[0342]
tfdnagrvssrslwnvtttygyddagrlttvtggdgavteygyntagd
[0343]
lvtvtdpndhvtthtyddahrrtattdalnrtrtfgydadgnqtstvla
[0344]
rgpasgdlarwtvtqsydelgrrtgvttgstastasyaydpvgrltgvtd
[0345]
aggttttvyddagqiasvtrgsqaygytydprgmvktitqpggvtvtnt
[0346]
fdddgrlattastnagttafsydknnnltridnlaatglvnrwqqrnyd
[0347]
radalvstttgtgtttdptqtvtysrdgagrpfvirrgaggtqapgeahf
[0348]
fdaagrlaqvcydassmfgqncatadetlaytydgagnrltetrtggtt
[0349]
pgtttytydaanqltqrgnttysydadgnqisdgatswtydelnrlvgi
[0350]
dtptadsqltydglgnrtsvttgattrtfswdinnplplltsvtqgtsttr
[0351]
yrygpdaipvnaningtnhalltedlnsltttynrttgakswtttyepfg
[0352]
tprnttstglttaqvglgytgeyldpttgllnlrarnynptlgqftstdp
[0353]
vetpqgtpsispyayvdnrptvltdpsgacffidmpwipgcsepswadevtp
[0354]
atngvlaglisaaedtfyltgmalgvdwvgydgdlaqqlfdeaavegn
[0355]
yhgetyqqaqlvgglvalvggaastaaslarictslvrkirppvasgglat
[0356]
evpayagsrtagtlvtpdgaefplisgwhppaasmpqgtpgmnivtkshv
[0357]
eahaaaimrnqglseatlwinrapcggkpgcaamlprmvpsgstltinv
[0358]
vpngsagsiadtliirgig(seq id no:120)
[0359]
ncbi登录号wp_174422267.1(tdd11)
[0360]
msdsenrltrasdspasgktqseskvntacdslldtagstydslkqpfssk
[0361]
ggalhhvseavnalaslqgapsqllntgiaqiplldkmpgmpasvisaah
[0362]
lgtphahshppsdgfplpsmgatigsgclsvligglpaarvqdigiaptcgg
[0363]
ltpyfnietgssntfiggmraarmgidmtrhcnpmghagksgeeaegaa
[0364]
ekgeqaaseaaevssrarwmgragkawkvgnaavgpasgvagaasda
[0365]
khhealaaammaaqtaadaammllsnlmgkdpgiepsmgmlmdgnp
[0366]
tvliggfpmpdsqmmwhgakhglgkkvkarradrqkeaapcrdghpv
[0367]
dvvrgtaenefvdyetriapgfkweryycsgwseqdgelgfgfrhcfqh
[0368]
elrllrtraiyvdalnreypilrnaagryegvfagyeleqrdgrrfvlrh
[0369]
grlgdmtferaseadrtarlvnhvrdgvestleyarngalmridqekgp
[0370]
grrrqlidfryddcghivelyltdpqgetkrivhyrydtagclaastnpl
[0371]
gavmshgydgrrrmvretdangysfsyrydsqdrciesmgqdglwhvs
[0372]
ldyqpgrtvvtradggkwtflydeartvtrivdpyggttervsgdngri
[0373]
lreidsggrvmrwlyderggntgrmdrwgnrwptkdeapvlpnplaht
[0374]
vpntplalqwgdarhedladtlllppeiakiaasffppqpfsasteqcdet
[0375]
grviartdgygqaerlrldatgnllqlcdrdgrdycysiaswnlreset
[0376]
dplgntvryryspkqeitaivdangnestytydyksrltsvtrhgtvret
[0377]
yaydvgdrliekrdgtgnallrfevgedglqktrilasgethtykydhr
[0378]
gnftrastdkldvtltydaygrrtgdkrdgrgidhsfvggrlesttyfg
[0379]
rfvvryeagqagdvmihtpgggihrlrraadgtvllrlgnrtnvlygfd
[0380]
adgrctgrlswpegrtaeihcvqyrysavgelrcvidstggtieyqydaa
[0381]
hrlvgesrdgwavrrfeydqggnllstptcqwmrytegnrlssascgaf
[0382]
rynsrnhlaeqieennrrttyhynsmdllvqvkwsdrqeswrseydgl
[0383]
crriakamgqartqyfwdgdrlaaeaapdgrlriyvyvneasylpfmfi
[0384]
dypscdaepesgsayyvfcnqvglperiesamgldawraeeiepygsirva
[0385]
tgnaidydlrwpghwfdvetglhynrfryfqptlgrylqsdpagqsggv
[0386]
nlyaysanplvfvdvlglecphndksttecarceakeevdqrekrdkel
[0387]
areiyhiedkysdshagigldpdekkraledkidyddlvrkrekaredll
[0388]
eaekrlreeeirakyptpeeaqlppydgdttyalmyytdehgkshvvels
[0389]
sggaddehsnyaaaghtegqaavimrqrkitsavvvhnntdgtcpfcva
[0390]
hlptllpsgaelrvvpprsakakkpgwidvsktfegnarkpldnknkkst
[0391]
(seq id no:121)
[0392]
ncbi登录号wp_059728184.1(tdd12)
[0393]
msepanrltrasepserhaaqseskadtacesllgtvkstfdpfkqtfssd
[0394]
gsalhhvseavnalaslqsapsqllntgiaqiplldkmpgmpaatigvphl
[0395]
gtphahshppssgfplpsigatigsgclsvliggipaarvldigiaptcggltp
[0396]
yfdiqtgssntffggmraarmgidmtrhcnpmghvgksggkaagaaek
[0397]
teeaaseaaqvtsrakwmgragkawkvgnaavgpasgaagaaadaa
[0398]
hgeelaaammaaqtaadaammllgnlmgkdpgiepsmgtllagnptv
[0399]
lvggfplpdsqmmwhgvkhgigkkvrarianrrkevspctdghpvdvv
[0400]
rgtaenefvdyetkiapafkweryycsgwseqdgalgfgfrhcfqhelr
[0401]
llrtraiyvdalnreypilrnaagryegvfagyeleqrdgrrfllrhgrh
[0402]
gdmtfereneadrtarfvshvrddvectleyarngalariaqedarglr
[0403]
rqlidfryddrghivelcltdprgqtrrlahyrydaagcltvvtdplgav
[0404]
tshgyddrrrmvretdangysfsyrydsqgrcietvgqdgllhvvldy
[0405]
qpgrtvvtradggkwtflydnartvtrivdpyggmterviggdgrilrei
[0406]
dsggrvmrwlydergrntgrmdrwgncwptrdeapvlpnplahtvpv
[0407]
tpldlqwgevspaeltdsvllspeiqkvaeslfqqpafspseqhdargqvv
[0408]
artdehggverfrrdaagniiqvcdkdgrahhygiaswslresetdslg
[0409]
ntvryrysnkqeitsivdangnesaytydykgritsvmrhgvvretyty
[0410]
dagdrliekrdgagnlllrfevgenglhskrilasgethtyeydrrgnft
[0411]
kastdkfdvtrtydahgrrtgdkrdgrgiehvygdgrlcsttyferftv
[0412]
ryeaeadgevlihapvggthrlqrssdgqillrlgnganvlcrfdahgr
[0413]
cvgrlvwpegrpkechrvayqysamgelrrvianttgtteylyddahrl
[0414]
igeshdgwpvrrfeydcggnllsaptcqwmrytegnrlatasrgafyy
[0415]
ndrnhlaeqigennhrtsyhynsmdllvkvtwsdwpevwtaeydglcr
[0416]
riakamgparteyywdgdrlaaeiapngqlriyvyvnetsylpfmfidy
[0417]
dgcdaapesgrgyyvfsnqvglpewiediagacvwrameidpygairva
[0418]
pgnelgynlrwpghwldpetglhynrfrsyhsalgrylqsdpagqsggi
[0419]
nlyaytanplvfvdvlgrecphlnesssecsqcenreeaerirkemlqsis
[0420]
rrmdiegdvtghpgilltqaeltgkyshyaeeykqllkdidtkreaeeaa
[0421]
llreaypsmegatlppfdgkttiglmfytdasgqyqvkklfsgekvlsny
[0422]
datghvegkaalimrnekiteavvmhnhpsgtcnycdkqvetllpknat
[0423]
lrvippenakaptsywndqpttyrgdgkdpkapskk(seq id no:122)
[0424]
ncbi登录号wp_133186147.1(tdd13)
[0425]
mstppgnpaspanepppppaplisptgntsvdalasavnagaqpfqqlgnp
[0426]
kantldrvtnvvsgavgslgaldqllntgmamipganlvpgmpaafigv
[0427]
phlgvphahahppsdgvpmpscgvtigsgclsvlyggmpaarvldiglap
[0428]
tcgglapifeictgssntfiggaraarmaldltrhcnplgmsgaghaeqd
[0429]
aekasalkramhiagmaapvasggltaadqavdgagaaavemtaaqta
[0430]
adaiamamsnlmgkdpgvepgvgtlidgdasvliggfpmpdalamlml
[0431]
gwglrkkahapegagepkrteqgeckgghpvdvvrgtaenqftdyatl
[0432]
dapefkweryyrsdwserdgalgfgfrhsfqhelrllrtraiyvdghgr
[0433]
ayafgrsasgryedvfagyeleqqgenrfvllqatrgeftferasaaqas
[0434]
arlvrhvhegvesalryagdgtlrhieqtaqreqrhrmidllydarghv
[0435]
vemrvtdprgavlcaaryrydatgclvastdalgasmtygydawrrmi
[0436]
retdangyafsyrydsdgrcvesagqdglwrvlldyqpgrtvvtqadg
[0437]
grwtylydaartvtrivdpyggatervigddgriveevdsggrvmrwly
[0438]
dergentgrqdrwgnrwptrdeapvlpnplahvvparplellwgdarp
[0439]
edftdrlllppeieavaaaafapsaavpkpaeqrdgagrvirrtdesghae
[0440]
clhrdaagnvvqlrdkdgryygyaiaswnlresetdplgntvryryss
[0441]
kqnitavvdangnesrytydyksrltrvarhdtiresyvydtgdrliekr
[0442]
dgagntllrfevgenglhskrilasgethtyeydrrgnftrastdkfevt
[0443]
ltydafgrrtgdkrdgrgvehsfvgqrlesttwfgrfvvryetgpsgdv
[0444]
mihtpggdvhrlqraadgtvllrlsnstnvlykfdengrcagrltwpd
[0445]
ghtsanrcvqyrysavgelrqvidskggtteyqyddahrlvgesregw
[0446]
afrrfeydrggnllstptcqwmrytegnrlsgaacgafcynsrnhlae
[0447]
qigennrrttwhynsmdllvrvqwsdrqenwsaeydglcrriakamg
[0448]
qartqyfwdgdrlaaevapngqlriyayvnetsylpfmfidydgcdaap
[0449]
esgrtyyvfcnqvglpewiedisrgcvwgvneidpygaicvapdneleyn
[0450]
lrwpghwfdpetdlhynrfrsyspvlgrylqsdpagqagginlyahtan
[0451]
plvfidvlgrecphgnesssecsqcadreeaerinakilqliskkmsiedav
[0452]
tghpgeliplphfeidkeyshyakeykqlladidalaearedallreqfpsmdavtlppfdgkttigymfytdangqyhvrklysggkvlsnydssghvegmaalimrkgriteavvmhnhpsgtchycngqvetllpknaklkvippanakaptkywydqpvdylgnsndpkpps(seq id no:123)
[0453]
ncbi登录号wp_083941146.1(tdd14)
[0454]
gssgknvrmprdyaselpeydgktthgvlvtnegkviqlrsggkeepytgykavsashvegkaaiwirengssggtvyhnnttgtcgycnsqvkallpegvelkivpptnavaknaqaravptinvgngtqpgrkqk(seq id no:124)
[0455]
ncbi登录号wp_082507154.1(tdd15)
[0456]
mdaetglvyfqaryydpqlgrfitqdpyegdwktplslhhylyayanpttyvdlngyyardanevqryiiaesncaktgscdavtalrepsearqrsaancksldrcreiaddaarsegdisarikalqkdlrngieanpttgiktiweldkqlearnisagavreagrhvrwrafvenreltdhekvapaaemygvlsggriviaravarssvtrasitqesktigvtaevapneslrntsgdlrasansarnqpygngqsasaspstnsagssgknvrlprdyaselpeydgkttygvlvtnegkviqlrsggkevpysgykavsashvegkaaiwirenassggtvyhnnttgtcgycnsqvkallpegvelkivppanavarnsqakaiptinvgnatqpgrkp(seq id no:125)
[0457]
ncbi登录号wp_044236021.1(tdd16)
[0458]
mlastwldlvigvdlhfelvppvmapvpfphpfvglvfdpwgllgglvisnvmsvatggslqgpvlinlmpatttgtdaknwmllphfiippgvmwapmvrvpkpsiipgkpiglelpipppgdavvitgsktvhamganlcrlgdialscsdpirlptaailtipkgmpvlvggppaldlmaaafalikckwvanrlhklvnriknarlrnllnrvvcfftghpvdvatgrvmtqatdfelpgplplqfervyasswadraspvgrgwshsldqavwlepgkvvyraedgreieldtfelpgrmlqpgqesfeplnrllfrcldghrwevesaeglvhefapvagdadpamarltrkrsrqghaitlhydgkgcltwvqdsggrivrfehdeaghltqvslphptqpgwlphtryiyspegdlvevvdplghrtryeyvghllvretdrtglsfyfgydgtgpgaycirtwgdggiydheidydkvnrvtfvtdslgatttyemnvanavvkvidprggetryeyndvlwkteevepaggatryeydargnctkstgpdgatvqveydarnvpiravnpcgeewqwvydaqgqlveridplgettryeydkgmvvtiteasgvttaeyddsrnlrrvqgpseaets
[0459]
yvydalgrmvvkrsparvaerlhydacgrlvtveqpdgnvwrlaydge
[0460]
gnlteiqdhhqrvrmryggyhqmvsrqeaedttlfrydsegrlvaiene
[0461]
ageiyqyeldscgraglergfdggcwkyerdaagrviklrkpsgaearl
[0462]
iydamgrlvevrrsdsaverfryrkdgalieaenstiqvkferdalgrvv
[0463]
remqgghwvessyergartwvasslgvhsaimrderrsvvamtagrgv
[0464]
dewrvelsrdafgleterklssgivstwardalgrprhrgvahsnnvlf
[0465]
gveyqwapgsrlvalidtergttafhfdersrlvgaklpggridrrepdri
[0466]
gniyraqdqrdrtysdggilrgagetrythdldgnltqkvlpdgatwsy
[0467]
synaagclkeverpdgtrvtfaydalgrrvskrwgenevwwlwdrhv
[0468]
plheistraepitwlfepesfapiakiegdrhydilcdhlgaptvvldeagv
[0469]
vtwrarldihaavqpeiaetecpwrwpgqyedqetglyynrfryydpea
[0470]
dryisqdplgpvgglnlysyaadpltwsdplglqpdppppptpmgntlpg
[0471]
wdggktqgwfvypdgterhlisgydgpskftqgipgmngnikshveaha
[0472]
aalmrqyelskatlyinrvpcpgvrgcdallarmlpegvqleiigpngfk
[0473]
ktytglpdpklkpkgcs(seq id no:126)
[0474]
ncbi登录号wp_165374601.1(tdd17)
[0475]
mtacsdsprlppsllelpdtpcpepdeaaspfpaelphsatveagaiagsfg
[0476]
vtstgeatytiplvvppgragmqpelavqydsasgegvlgmgfsvtglsa
[0477]
vtrcprnlaqdgeiravrydegdalcldgkrlvevggggevveyrtvpd
[0478]
tfarvvasyeggwdrargpkrlrvftragrvleyggepsgqvlakggvi
[0479]
rawwatrvsdrsgntidfhyqnetsasegytvehaprrieytghpraaat
[0480]
raiefvyaprrpgtgrvlysrgmalrssqqldrirmlgpggalvreyrfs
[0481]
ytsgpatgrrllnavrecaadgrckpatrfrwhhgtgpgfaevgtrlrvp
[0482]
esergslmtmdatgdgrddlvttdldlpvdddnpitnffvapnrmaegg
[0483]
sssfgalalahqemhhappspvqpelgtpidynddgrmdiflhdvhgryp
[0484]
dwhvllatpegtfrrkstgirrkfgidapppldlnsrnasahladvdgdg
[0485]
iadllqcedtgsvftdwtlhlwrpaasgfepepsripalrghpcnaethla
[0486]
dvdsdgkvdllvyeatitgngtlfgttfealsfvrpgewtkratglpvlk
[0487]
agsggrvivldvngdglpdavetgfddgqlrtfintgdgfaagvsslpsf
[0488]
vfdadafaklaapidhnsdgrqdllmpirepggpvlwkilqatgstgdgt
[0489]
favidarlpvsevlvdreitlahpwaprvtdvdgdgnqdvvlavgkelrv
[0490]
frsrlreedllwtvsdgmsaydpeeaghvpkvqieyshlsaaepgvrge
[0491]
qrtylprydtgepgdgacdypvrcalgprrvvsryavnngadrlrtfqv
[0492]
ayrngkyhrlgrgflgfgvrivrdaasgagsaeffdnvtfdpsdrsfpla
[0493]
ghvvrewrwtpepqqkgvsrvelsyterlihailtnrgksyftlpvyqkq
[0494]
rreqgehrrdsgktleeyvrdtwyaptqvvsrterlvsawdafgniree
[0495]
ststagvdltlkvkrtfrndedawliglletqqecsralsieqcrtssray
[0496]
drhgrvrtesagsddddpetvvrvrytrdafgnvihtraedafggrrka
[0497]
cvsydaegvfpyaqrnpeghvtytrydaghgaleavvdpnglatqwah
[0498]
dglgriteerrpdgtttratlsrtrdggprgdawrvlrrtatdggadetv
[0499]
eldgfgrpirgwaykartddgpaervvqeiafdqsgervarrslpaaegt
[0500]
prermqvetyghdatgriawhraawgaetryrylgrtvevegpggrvt
[0501]
tiendalgrpvrivdpeggvtsyaygpfgglwtvtdpgdakttterdayg
[0502]
rvrrhidpdrgtavahydgfgqqtstvdalgrevswkhdrlgraversd
[0503]
edgtttwtwdeaehgvgklaevaspeghrttyrydalgrlreeelaieg
[0504]
erfattvdydghsrpfrlwypqaegerrfgvrrifdahghlvglrnersr
[0505]
emfwrledtdeagririeefgngvttersyhetkgrlrrvatmkdhvvl
[0506]
qdlwygyddrlnlssrrddrlertehfrydkldrltcaarherfclfet
[0507]
tyapngnirekpdvgeytydpehphavrtagadvfaydavgnqvrrpgv
[0508]
eeirytafdlpasitlaggtgtvdldydgdqrrirkttpmeqtvyagdly
[0509]
ervtdlatgvvehrytvrsseravavvtkraggeartlyihvdhlgsvdl
[0510]
ltegrgedagreverrsydafgarrdpvtwrrapkaeappallargftg
[0511]
hgsddelglvhmkgrlydpkigrfttpdpvvsrplfgqswnaysyvlnn
no:182和183、seq id no:185和186、seq id no:187和188、seq id no:190和191、seq id no:192和193、seq id no:195和196、seq id no:197和198、seq id no:200和201、seq id no:202和203、seq id no:205和206、seq id no:207和208、seq id no:210和211、seq id no:212和213、seq id no:215和216、seq id no:217和218、seq id no:220和221、或seq id no:222和223的氨基酸序列。
[0534]
如本文所用,除非另有说明,否则术语“tdd”是指tdd毒性结构域。
[0535]
在本公开涉及胞苷脱氨酶(例如,本文所述的tdd)的情况下,设想其他胞苷脱氨酶可用于本文所述的融合蛋白和细胞编辑系统中。胞苷脱氨酶可以包含野生型或进化型结构域。在某些实施方案中,胞苷脱氨酶可以是例如载脂蛋白b mrna-编辑复合物1(apobec1)结构域或激活诱导脱氨酶(aid)。
[0536]
本公开还提供了其他潜在的胞苷脱氨酶。此类胞苷脱氨酶可用于例如本文所述的融合蛋白和细胞编辑系统中。在一些实施方案中,胞苷脱氨酶为本文所述的tdd的功能类似物。tdd的功能类似物是具有与所述tdd相同或基本上相同的生物学功能(即胞苷脱氨酶功能)的分子。例如,功能类似物可以是tdd的同种型或变体,例如,含有具有或不具有额外氨基酸残基的tdd的一部分并且/或者含有相对于tdd而言的突变(例如,与tdd(例如,包含seq id no:72、86-91和117-129中任一者的氨基酸序列的tdd)具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%序列同一性的变体,或其毒性结构域(例如,包含seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219的氨基酸序列的毒性结构域))。在某些实施方案中,功能类似物为本文所述的tdd的直系同源物。在某些实施方案中,tdd直系同源物可以包含与所述tdd(例如,包含seq id no:72、86-91和117-129中任一者的氨基酸序列的tdd)的氨基酸序列至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%相同的氨基酸序列。在某些实施方案中,tdd直系同源物可以包含具有与本文所述的tdd的毒性结构域的氨基酸序列至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%相同的氨基酸序列的毒性结构域(例如,包含seq id no:49、81、92、95、98、101、104、107、134、143、152、157、162、167、172、177、184、189、194、199、204、209、214、或219的氨基酸序列的毒性结构域)。
[0537]
在氨基酸或核苷酸序列的上下文中,术语“相同百分比”是指当进行最大对应性比对时两个序列中相同的残基的百分比。两个序列的百分比同一性可以通过例如使用默认参数的(可在美国国家医学图书馆国家生物技术信息中心网站(u.s.national library of medicine’s national center for biotechnology information)获得)获得。在一些实施方案中,出于比较目的而比对的参考序列的长度为参考序列的至少30%(例如,至少40%、50%、60%、70%、80%、或90%、或100%)。
[0538]
在某些实施方案中,本文所述的胞苷脱氨酶可以靶向ac序列、tc序列、gc序列、cc序列、aac序列、tac序列、gac序列、cac序列、atc序列、ttc序列、gtc序列、ctc序列、agc序列、tgc序列、ggc序列、cgc序列、acc序列、tcc序列、gcc序列、ccc序列、或它们的任何组合中的胞苷。在某些实施方案中,本文所述的胞苷脱氨酶具有与ddda相比增加的效率和/或活性。在一些实施方案中,增加的效率或活性可例如处于以上靶序列的任一种或组合。
sceiii、i-crei、i-tevi、i-tevii和i-teviii的识别序列是已知的。另参见美国专利5,420,032和6,833,252;belfort等人,nucleic acids res.(1997)25:3379-88;dujon等人,gene(1989)82:115-8;perler等人,nucleic acids res.(1994)22:1125-7;jasin,trends genet.(1996)12:224-8;gimble等人,jmol biol.(1996)263:163-80;argast等人,j mol biol.(1998)280:345-53;和new england biolabs目录册。此外,归巢核酸内切酶和大范围核酸酶的dna结合特异性可以工程改造以结合非天然靶位点。参见例如chevalier等人,mol cell(2002)10:895-905;epinat等人,nucleic acids res.(2003)31:2952-62;ashworth等人,nature(2006)441:656-59;paques等人,current gene therapy(2007)7:49-66;和美国专利公开2007/0117128。
[0545]
在一些实施方案中,本发明的zfp融合蛋白包含一个或多个锌指结构域。结构域可以经由可延伸柔性接头连接在一起,使得例如一个结构域包含一个或多个(例如,3、4、5、或6个)锌指,且另一个结构域包含额外的一个或多个(例如,3、4、5、或6个)锌指。在一些实施方案中,接头是标准的指间接头,使得指阵列包含含有8、9、10、11或12个或更多个指的一个dna结合结构域。在其他实施方案中,接头是非典型接头,如柔性接头。例如,两个zfp结构域能够以zfp-zfp-结构域、结构域-zfp-zfp、zfp-结构域-zfp、或zfp-结构域-zfp-结构域(两个zfp-结构域融合蛋白经由接头融合在一起)构型(从n端到c端)连接至胞苷脱氨酶、抑制剂、或切口酶结构域(“结构域”),如本文所述的那些。
[0546]
在一些实施方案中,zfp融合蛋白是“双手的”,即,它们含有由间插氨基酸隔开的两个锌指簇(两个zfp结构域),使得两个zfp结构域结合两个不连续的靶位点。双手型锌指结合蛋白的实例是sip1,其中四个锌指的簇位于蛋白质的氨基端,且三个锌指的簇位于羧基端(参见remacle等人,embo j.(1999)18(18):5073-84)。这些蛋白质中的每个锌指簇能够结合独特的靶序列,并且两个靶序列之间的间隔可以包含多个核苷酸。
[0547]
本文所述的zfp融合蛋白的dna结合zfp结构域将蛋白质导向dna靶区。在一些实施方案中,dna靶区的长度至少是8bp。例如,靶区的长度可以是8bp至40bp,如长度为12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、或36bp。
[0548]
在某些实施方案中,zfp结合靶向的碱基的任一侧上的1至100个(或其间的任何数目)核苷酸的靶位点。在其他实施方案中,zfp结合靶向的碱基的任一侧上的1至50个(或其间的任何数目)核苷酸的靶位点。
[0549]
c.碱基编辑器抑制剂
[0550]
在一些实施方案中,本文所述的碱基编辑器系统可以包括编辑器的抑制剂,以在时间和空间上更好地调节系统的碱基编辑活性。例如,在胞苷脱氨酶为如本文所述的tdd的情况下,抑制剂可以是抑制所述tdd的tddi。在编辑器为胞苷脱氨酶ddda的情况下,抑制剂可以是例如dddi。在一些实施方案中,dddi具有以下所显示的氨基酸序列。
[0551]
myaddfdgei eidevdslve flsrrpafda nnfvltfees gfpqlnifak ndiavvyymd igenfvskgn sasggtekfy enklggevdl skdcvvskeq mieaakqffa tkqrpeqltw sel(seq id no:73)
[0552]
因此,在一些实施方案中,除zfp-tdd融合蛋白之外,碱基编辑器系统还包括tddi组分。tddi组分可以通过与其他共价融合的dna结合结构域,或者通过与未与其他共价结合的dna结合结构域二聚化而与tdd复合物紧密靠近。
[0553]
在一些实施方案中,本发明的碱基编辑系统包含含有zfp结构域和抑制剂结构域的zfp-抑制剂融合蛋白,其中zfp结构域结合至dna靶区中靠近(例如,在50-100nt内)zfp-胞苷脱氨酶融合蛋白的结合位点的序列。当该zfp-抑制剂融合蛋白引入细胞时,抑制剂结构域将与胞苷脱氨酶复合物紧密靠近并结合该复合物,由此抑制胞苷脱氨酶在该基因座处的碱基编辑活性。被zfp-抑制剂的zfp结构域结合的序列的存在决定了抑制剂的抑制活性。
[0554]
在一些实施方案中,抑制剂结构域与胞苷脱氨酶复合物的结合可以通过药剂(例如小分子或肽)进行调节。例如,抑制剂结构域可以与二聚化结构域融合,并且其二聚化配偶体可以与zfp结构域融合,该zfp结构域结合至dna靶区域中靠近(例如,在50-100nt内)zfp-胞苷脱氨酶融合蛋白的结合位点的序列。抑制剂和zfp的二聚化结构域可以在二聚化诱导剂(例如小分子或肽)的存在下二聚化。在该药剂存在的情况下,抑制剂结构域将通过二聚化而与dna靶区紧密靠近,从而导致胞苷脱氨酶复合物的结合和失活。一旦药剂撤除,抑制剂结构域将不再在dna靶区附近螯合,并且将从胞苷脱氨酶复合物分离,从而允许进行碱基编辑过程。此类药剂和二聚化结构域的实例显示于下表1中:
[0555]
表1.二聚化结构域和二聚化诱导剂
[0556][0557]
相反地,与zfp融合的结构域和抑制剂结构域的二聚化可能受到二聚化抑制剂(例如,小分子或肽)抑制而非促进,使得该试剂的存在将允许胞苷脱氨酶复合物的活性。如果药剂撤除,抑制剂结构域将能够结合胞苷脱氨酶复合物,从而抑制碱基编辑过程。
[0558]
d.尿嘧啶dna糖苷酶抑制剂
[0559]
如本文所用,术语“尿嘧啶糖苷酶抑制剂”或“ugi”是指可抑制尿嘧啶-dna糖苷酶
碱基切除修复酶的蛋白质。在检测到g:u错配时,细胞通过由尿嘧啶n-糖苷酶(ung)切除错配的尿嘧啶所引发的碱基切除修复而应答。在一些实施方案中,本文所述的碱基编辑器系统还包含一个或多个ugi以保护编辑的g:u中间体不被ung切除。在某些实施方案中,本文所述的zfp-胞苷脱氨酶(例如zfp-tdd)融合蛋白可以包含例如通过本文所述的接头附接的一个或多个ugi结构域。在一些实施方案中,接头为sggs接头(seq id no:245)。一个或多个ugi结构域可位于融合蛋白的n端、c端、或它们的任何组合(例如,一个ugi结构域位于c端、一个ugi结构域位于n端、两个ugi结构域位于c端、两个ugi结构域位于n端、或它们的任何组合)。额外地或替代性地,一个或多个ugi结构域可位于单独的zfp融合蛋白(“zfp-ugi”)上。在特定实施方案中,ugi结构域包含seq id no:20的氨基酸序列。
[0560]
e.切口酶
[0561]
在一些实施方案中,本文所述的碱基编辑器系统还包含切口酶以在编辑的dna靶区附近(例如,在距编辑的碱基10、20、30、40、50、60、70、80、90、或100nt内)产生单链dna断裂。切口的产生引起dna修复机制,使得切口下游的区域被切除和替换,导致完全编辑的双链dna靶区。切口可以是例如相同链或相反链上编辑的碱基的5'或3'。
[0562]
在一些实施方案中,本文所述的碱基编辑器系统具有包括切口酶功能的三聚体构造。例如,二聚切口酶的一个结构域可以与zfp-胞苷脱氨酶(例如,如本文所述的zfp-tdd)融合,并且另一结构域可以与独立的zfp融合,使得两个zfp结构域与其dna靶区的结合导致能够产生单链断裂的活性切口酶。参见例如图9。
[0563]
在一些实施方案中,本文所述的碱基编辑器系统具有包括切口酶功能的四聚体构造。除了两种zfp-胞苷脱氨酶(例如,如本文所述的zfp-tdd)融合蛋白之外,此系统还包括两种zfp-切口酶蛋白,其中二聚切口酶的一个结构域与第一zfp结构域融合且另一结构域与第二zfp结构域融合,使得两个zfp结构域与其dna靶区的结合导致能够产生单链断裂的活性切口酶。
[0564]
在一些实施方案中,切口酶可以是例如zfn切口酶、talen切口酶、或crispr/cas切口酶。在某些实施方案中,切口酶衍生自foki dna裂解结构域。在一些实施方案中,与亲本foki切口酶相比,该foki切口酶包含一个或多个突变,例如,改变裂解结构域的电荷的突变;基于分子建模预计接近dna主链且显示foki同源物的变异的残基的突变;和/或其他残基处的突变(参见例如美国专利8,623,618和guo等人,j mol biol.(2010)400(1):96-107)。
[0565]
在本文所述的zfp融合蛋白中,一个或多个切口酶结构域可位于dna结合zfp结构域的任一侧,包括融合分子的n端或c端侧(zfp结构域的n端和/或c端)。在一些实施方案中,本文所述的zfp-胞苷脱氨酶(例如,如本文所述的zfp-tdd)融合蛋白包含处于n端或c端的胞苷脱氨酶结构域以及处于相反端的切口酶结构域。
[0566]
f.肽接头
[0567]
在本文所述的融合蛋白中,zfp、胞苷脱氨酶(例如,如本文所述的tdd)、抑制剂(例如tddi,如其中胞苷脱氨酶为ddda的dddi)、切口酶和/或ugi结构域可相对于彼此以任何顺序定位。在一些实施方案中,结构域可以通过直接肽键、肽接头、或它们的任何组合彼此缔合。在一些实施方案中,两个或更多个结构域可以通过二聚化(例如,通过亮氨酸拉链、stat蛋白n端结构域、或fk506结合蛋白)彼此缔合。
[0568]
在一些实施方案中,zfp、胞苷脱氨酶(例如,如本文所述的tdd)、抑制剂(例如tddi,如其中胞苷脱氨酶为ddda的dddi)、ugi、和/或切口酶结构域、和/或zfp结构域内的锌指可以通过肽接头,例如约5至200个氨基酸(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、或26或更多个氨基酸)的不可裂解肽接头进行连接。优选的接头通常为作为重组融合蛋白合成的柔性氨基酸亚序列。参见例如美国专利6,479,626;6,903,185;7,153,949;8,772,453;和9,163,245;以及pct专利公开wo 2011/139349。本文所述的蛋白质可以包括合适接头的任何组合。
[0569]
在一些实施方案中,肽接头的长度为三至30个氨基酸残基并且富含g和/或s。此类接头的非限制性实例为sggs接头(seq id no:245)以及g4s型接头,即含有一个或多个(例如2、3、或4个)ggggs(seq id no:71)基序、或基序的变体(如具有来自基序的一个、两个、或三个氨基酸插入、缺失和置换的那些)的接头。
[0570]
在特定实施方案中,用于本文所述的融合蛋白的肽接头可以是l0(lrgsqlvks;seq id no:15)、l7a(lrgsqlvkskseaaar;seq idno:16)、l26(lrgsqlvkskseaaarggggsggggs;seq id no:17)、l21(lrgsqlvkskseaaarggggs;seq id no:110)、l18(lrgsqlvkskseaaargs;seq id no:111)、l13(lrgsqlvksksgs;seq id no:112)、l11(lrgsqlvksgs;seq id no:113)、l9(lrgsqlvgs;seq id no:114)、l6(lrgsgs;seq id no:115)、或l4(lrgs;seq id no:116)。
[0571]
ii.碱基编辑器系统
[0572]
本公开提供了包含本文所述的zfp融合蛋白的碱基编辑器系统。碱基编辑器系统可用于将dna靶区中的胞嘧啶碱基编辑为尿嘧啶碱基,其中尿嘧啶在dna复制或修复期间被胸腺嘧啶碱基替换。在某些实施方案中,编辑导致了靶向的c:g碱基对变为t:a碱基对。图1说明了本公开的碱基编辑系统。
[0573]
如本文所述的碱基编辑器系统可用于敲除基因(例如,通过将常规密码子改变为终止密码子,和/或通过使剪接受体位点突变以引入外显子跳跃和/或移码突变);将突变引入基因的控制元件(例如,启动子或增强子区)中以提高或降低表达;纠正致病突变(例如,点突变);和/或诱导导致治疗益处的突变。靶dna可位于细胞的染色体中或染色体外序列(例如线粒体dna)中。碱基编辑可在体外、离体、或体内进行。
[0574]
在一些实施方案中,本文所述的碱基编辑器系统进行一个或多个密码子转换,例如caa至taa;cag至tag;cga至tga;或tgg至tag、tga、或taa;或它们的任何组合;由此引入一个或多个终止密码子。
[0575]
除zfp-胞苷脱氨酶(例如,如本文所述的zfp-tdd)融合蛋白之外,本公开的碱基编辑器系统还可以包括可有助于调节或改善系统的编辑活性的如本文所述的组分,如抑制剂结构域(例如tddi,如其中胞苷脱氨酶为ddda的dddi)、ugi、和切口酶、或它们的任何组合。在某些实施方案中,系统可以包装在单一病毒载体(例如aav载体)中。
[0576]
在一些实施方案中,本公开的碱基编辑器系统包含一对zfp-胞苷脱氨酶(例如,如本文所述的zfp-tdd)融合蛋白,它们各自包含自身缺乏胞苷脱氨酶活性的胞苷脱氨酶半结构域,其中zfp与其相应的核苷酸靶标的结合导致了能够将靶向的c碱基编辑为t的活性胞苷脱氨酶分子(例如,通过用u替换c,c在dna复制或修复期间被t替换)。
[0577]
例如,在一些实施方案中,该碱基编辑器系统可以包含:a)第一融合蛋白(zfp-tdd
左),该第一融合蛋白包含:i)第一zfp结构域,该第一zfp结构域在靶向用于编辑的碱基的一侧上结合双链dna靶区的核苷酸;和ii)tdd n-半结构域;以及b)第二融合蛋白(zfp-tdd右),该第二融合蛋白包含:i)第二zfp结构域,该第二zfp结构域在靶向用于编辑的碱基的另一侧上结合双链dna靶区的核苷酸;和ii)tdd c-半结构域;其中zfp-tdd左和zfp-tdd右与它们相应的核苷酸的结合导致了能够通过将c碱基改变为t来编辑dna靶区的活性tdd分子。zfp-tdd和/或dna靶区可例如如本文所述。
[0578]
在一些实施方案中,碱基编辑器系统可以包含:a)第一融合蛋白(zfp-tddi),该第一融合蛋白与第一dna靶区内的核苷酸结合且包含:i)锌指蛋白(zfp)结构域,该锌指蛋白结构域与第一dna靶区内的核苷酸结合;和ii)tddi结构域;b)第二融合蛋白(zfp-tdd左),该第二融合蛋白包含:i)zfp结构域,该zfp结构域在靶向用于编辑的碱基的一侧上结合第二dna靶区的核苷酸;和ii)tdd n-半结构域;以及c)第三融合蛋白(zfp-tdd右),该第三融合蛋白包含:i)zfp结构域,该zfp结构域在靶向用于编辑的碱基的另一侧上结合第二dna靶区的核苷酸;和ii)tdd c-半结构域;其中zfp-tdd左和zfp-tdd右与它们相应的核苷酸的结合导致了能够通过将c碱基改变为t来编辑第二dna靶区的活性tdd分子;并且其中zfp-tddi与第一dna靶区的结合阻止了tdd对第二dna靶区的编辑。zfp-tdd、zfp-tddi和dna靶区可例如如本文所述。
[0579]
在一些实施方案中,碱基编辑器系统可以包含:a)第一融合蛋白,该第一融合蛋白包含:i)锌指蛋白(zfp)结构域,该锌指蛋白结构域结合第一dna靶区内的核苷酸,和ii)二聚化结构域;b)第二融合蛋白,该第二融合蛋白包含:i)tddi结构域;和ii)与a)的二聚化结构域配偶的二聚化结构域;c)第三融合蛋白(zfp-tdd左),该第三融合蛋白包含:i)zfp结构域,该zfp结构域在靶向用于编辑的碱基的一侧上结合第二dna靶区的核苷酸,和ii)tdd n-半结构域;以及d)第四融合蛋白(zfp-tdd右),该第四融合蛋白包含:i)zfp结构域,该zfp结构域在靶向用于编辑的碱基的另一侧上结合第二dna靶区的核苷酸,和ii)tdd c-半结构域;其中zfp-tdd左和zfp-tdd右与它们相应的核苷酸的结合导致了能够通过将c碱基改变为t来编辑第二dna靶区的活性tdd分子;并且其中a)和b)的融合蛋白二聚化以形成zfp-tddi,并且a)的zfp与第一dna靶区的结合阻止了tdd对第二dna靶区的编辑。zfp-tdd、zfp-tddi和/或dna靶区可例如如本文所述。
[0580]
在一些实施方案中,a)和b)的融合蛋白的二聚化结构域在二聚化诱导剂存在下配偶形成zfp-tddi,导致tdd活性的抑制。
[0581]
在一些实施方案中,a)和b)的融合蛋白的二聚化结构域在二聚化抑制剂的存在下被抑制配偶形成zfp-tddi,从而允许tdd活性。
[0582]
在一些实施方案中,zfp-tddi对要保护免于tdd碱基编辑活性的序列是特异性的。例如,zfp结构域可以结合以其未编辑形式保留的等位基因(例如,其中另一个等位基因如突变的等位基因被靶向用于编辑)、或已知的脱靶编辑位点。在一些实施方案中,tdd碱基编辑可在未受保护的等位基因中将常规密码子转化为终止密码子。
[0583]
在一些实施方案中,zfp-tddi(或其组分)的表达可处于诱导型启动子的控制之下。在某些实施方案中,这样的系统可用作“杀伤开关”,其中zfp-tddi保护细胞中的必需基因不被编辑,并且降低或消除zfp-tddi的表达导致了细胞死亡。
[0584]
在zfp-tddi的组装受到二聚化诱导或二聚化抑制剂的控制的情况下,碱基编辑能
够以药剂的存在或不存为条件。此种条件型系统也可用作“杀伤开关”,例如,其中zfp-tddi保护细胞中的必需基因在存在二聚化诱导剂或者在不存在二聚化抑制剂时不被编辑,并且移除或施用药剂分别导致细胞死亡。
[0585]
在某些实施方案中,本公开的碱基编辑器系统可以是包含多于一个zfp-tdd左和zfp-tdd右对的多重系统;此系统能够一次编辑多于一个dna靶区。在特定实施方案中,为了增加编辑特异性,多重系统包含zfp-tdd对,其中对于每个对,tdd n-半结构域和c-半结构域在tdd序列中的不同位置(例如,本文所述的位置)处分裂。在某些实施方案中,由多重系统的zfp-tdd对编辑的dna靶区可处于不同的基因中。在某些实施方案中,dna靶区可处于同一基因中。
[0586]
在任何以上实施方案中,tdd和tdd1可以是本文所述的任一种。在某些实施方案中,tdd可以是ddda,并且tddi可以是dddi。还设想可使用其他胞苷脱氨酶和抑制剂替换tdd和tddi。在特定实施方案中,本文所述的多重系统可以包含第一zfp-胞苷脱氨酶对和第二zfp-胞苷脱氨酶对,其中第一和第二对利用不同的胞苷脱氨酶(例如,选自本文所述的那些)。
[0587]
在一些实施方案中,本文所述的系统和方法在至少1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的细胞中产生dna靶区的靶向编辑。在一些实施方案中,编辑的细胞表现出很少乃至没有的脱靶插入缺失(例如,小于5%、4%、3%、2%、1%、0.5%、0.2%、或0.1%的脱靶插入缺失)。在一些实施方案中,编辑的细胞表现出很少乃至没有的脱靶碱基编辑(例如,小于5%、4%、3%、2%、1%、0.5%、0.2%、或0.1%的脱靶碱基编辑);然而,由于脱靶位点的碱基编辑可能不倾向于易位或其他基因组排列,也可以考虑更高的百分比。
[0588]
本公开还提供了编码本文所述的zfp融合蛋白的核酸分子,其可以是病毒或非病毒载体的一部分。另外,本公开提供了包含如本文所述的碱基编辑器系统的细胞或细胞群,以及此类细胞的后代,其中细胞包含一个或多个编辑的碱基。
[0589]
iii.zfp融合蛋白的递送
[0590]
可通过多种方法(例如,电穿孔、蛋白质与受体配体的融合、脂质纳米颗粒、阳离子或阴离子脂质体、或核定位信号(例如,与脂质体组合))将本公开的zfp融合蛋白作为蛋白质引入靶细胞。在其他实施方案中,融合蛋白通过编码它的核酸分子(例如dna质粒或mrna)引入靶细胞。核酸分子可位于核酸表达载体中,该核酸表达载体可以包括表达控制序列如启动子、增强子、转录信号序列以及转录终止序列,允许zfp融合蛋白的编码序列的表达。
[0591]
在一些实施方案中,用于指导zfp融合蛋白表达的载体上的启动子是组成型活性启动子或诱导型启动子。合适的启动子包括但不限于劳斯肉瘤病毒(rous sarcoma virus)(rsv)长末端重复序列(ltr)启动子(任选地具有rsv增强子)、巨细胞病毒(cmv)启动子(任选地具有cmv增强子)、cmv立即早期启动子、猿猴病毒40(sv40)启动子、二氢叶酸还原酶(dhfr)启动子、β肌动蛋白启动子、磷酸甘油酸激酶(pgk)启动子、eflα启动子、莫洛尼鼠白血病病毒(momlv)ltr、基于肌酸激酶(ck6)的启动子、转甲状腺素蛋白启动子(ttr)、胸苷激酶(tk)启动子、四环素反应性启动子(tre)、乙型肝炎病毒(hbv)启动子、人α1-抗胰蛋白酶(haat)启动子、嵌合肝脏特异性启动子(lsp)、e2因子(e2f)启动子、人端粒酶逆转录酶(htert)启动子、cmv增强子/鸡β-肌动蛋白/兔β-珠蛋白启动子(cag启动子;niwa等人,gene
(1991)108(2):193-9),以及ru-486-反应性启动子。此外,启动子可以包括一个或多个自调节元件,由此zfp融合蛋白可以结合并使其自身表达水平阻遏至预定阈值。参见美国专利9,624,498。
[0592]
可采用将核苷酸序列引入细胞中的任何方法,包括但不限于电穿孔、磷酸钙沉淀、显微注射、阳离子或阴离子脂质体、与核定位信号组合的脂质体、天然存在的脂质体(例如外泌体)、或病毒转导。在某些实施方案中,核苷酸序列为mrna的形式并经由电穿孔递送至细胞。
[0593]
对于表达载体的体内递送,可以使用病毒转导。本领域的技术人员可以调整本领域已知的用于本公开的多种病毒载体,例如痘苗病毒载体、腺病毒载体、慢病毒载体、痘病毒载体、腺相关病毒(aav)载体、逆转录病毒载体和嵌合型病毒载体。在一些实施方案中,本文所用的病毒载体是重组aav(raav)载体。可使用任何合适的aav血清型。例如,aav可以是aav1、aav2、aav3、aav3b、aav4、aav5、aav6、aav7、aav8、aav8.2、aav9、aav.php.b、aav.php.eb、或aavrh10、或为新型血清型或假型,如aav2/8、aav2/5、aav2/6、aav2/9、或aav2/6/9。在一些实施方案中,表达载体是aav病毒载体,并且通过重组aav病毒体引入靶标人细胞,该病毒体的基因组包含构建体——包括在两端具有aav反向末端重复序列(itr),以允许在生产系统如昆虫细胞/杆状病毒生产系统或哺乳动物细胞生产系统中产生aav病毒体。aav可以工程化使得其衣壳蛋白在人类中具有降低的免疫原性或增强的转导能力。本文所述的病毒载体可使用本领域已知的方法产生。可采用任何合适的受纳或包装细胞类型来产生病毒颗粒。例如,哺乳动物(例如293)或昆虫(例如sf9)细胞可用作包装细胞系。
[0594]
本文所述的碱基编辑方法可以靶向任何类型的细胞。例如,细胞可以是真核或原核的。在一些实施方案中,细胞为哺乳动物(例如人)细胞或植物细胞。人细胞可以包括例如t细胞、自然杀伤(nk)细胞、nk t细胞、α-βt细胞、γ-δt细胞、细胞毒性t淋巴细胞(ctl)、调节性t细胞、b细胞、人胚胎干细胞、肿瘤浸润性淋巴细胞(til)或可从中分化出淋巴样细胞的多能干细胞(例如,诱导性多能干细胞(ipsc))。在一些实施方案中,系统可用于在多能干细胞分化成多种细胞类型之前修饰多能干细胞。例如,可以在分化成淋巴样细胞类型(如调节性t细胞、效应t细胞、自然杀伤细胞等)之前修饰淋巴样细胞前体。本公开的多重碱基编辑系统(包含多于一个zfp-胞苷脱氨酶(例如zfp-tdd)对)特别地可用于同时制备具有多重碱基编辑的细胞,包括多能细胞。在一些实施方案中,多重系统可用于制备例如同种异体t细胞。在系统包含能够在存在或不存在如本文所述的二聚化调节剂时诱导组装的zfp-胞苷脱氨酶抑制剂(例如zfp-tddi)的情况下,设想编辑的细胞可置于在施用药剂后激活的“杀伤开关”的控制之下。
[0595]
对于农业应用,也设想了将蛋白质或核酸分子引入植物细胞的任何方法,如根癌农杆菌(agrobacterium tumefaciens)介导的t-dna递送。
[0596]
iv.药学应用
[0597]
本公开提供了使细胞dna中的胞嘧啶编辑为胸腺嘧啶碱基的方法,该方法包括向细胞(例如,来自患者)递送本文所述的碱基编辑器系统,从而导致靶向的c碱基被t碱基替换。细胞可处于患者内(体内治疗),或者可对从患者移除的细胞进行如本文所述的方法,然后向患者递送编辑的细胞(离体治疗)。在一些实施方案中,将细胞在用作治疗物之前进一步离体操作。术语“治疗”涵盖症状的减轻、症状发作的预防、疾病进展的减缓、生活质量的
改善以及存活增加。在一些实施方案中,由本文所述的方法治疗的患者为哺乳动物,例如人。
[0598]
在一些实施方案中,本公开的方法用于编辑与疾病相关联的基因或调控序列。例如,在某些实施方案中,碱基编辑可纠正dna序列中的点突变以恢复正常的基因表达或活性。在某些实施方案中,碱基编辑可将终止密码子引入有害基因(例如癌基因)中。在某些实施方案中,碱基编辑可引入导致治疗益处的突变。
[0599]
在一些实施方案中,患者患有癌症。在某些实施方案中,将来自患者的细胞在碱基编辑之前或之后进一步修饰,以提供对化疗剂的抗性。然后,可用化疗剂治疗患者,这在一些实施方案中可以导致编辑的细胞相对于未编辑的细胞的更高存活率。
[0600]
在一些实施方案中,患者患有自身免疫病症。
[0601]
在一些实施方案中,患者患有常染色体显性疾病,如常染色体显性多囊肾病。
[0602]
在一些实施方案中,患者患有粒线体病症。
[0603]
在一些实施方案中,患者患有镰状细胞病、血友病(例如甲型、乙型、或丙型血友病)、囊性纤维化、苯丙酮尿症、泰萨二氏病、朊病毒病、色盲、溶酶体贮积病(例如法布里病)、弗里德希共济失调、或前列腺癌。
[0604]
在一些实施方案中,本公开的方法可以将碱基编辑靶向基因的特定等位基因,例如野生型或突变等位基因。在某些实施方案中,等位基因可以与癌症相关联。例如,该方法可靶向jak2的v617f突变的等位基因,这导致了组成型酪氨酸磷酸化活性并且在骨髓增生性肿瘤的扩增中发挥关键作用。敲除具有v617f突变的等位基因的表达(例如,通过引入终止密码子)可有利于jak2 v617f病症的成功治疗。
[0605]
本公开还提供了药物组合物,该药物组合物包含本文所述的碱基编辑器系统的元件,如zfp-胞苷脱氨酶(例如,如本文所述的zfp-tdd)对以及任选地胞苷脱氨酶抑制剂(例如tdd1,如其中胞苷脱氨酶为ddda的dddi)组分(例如,zfp-胞苷脱氨酶抑制剂组分)、或编码所述元件的核苷酸序列(例如,在如本文所述的病毒或非病毒载体中)。药物组合物还可包含药学上可接受的载剂,如水、盐水(例如磷酸盐缓冲盐水)、右旋糖、甘油、蔗糖、乳糖、明胶、右旋糖酐、白蛋白、或果胶。此外,组合物可含有辅助物质,如润湿剂或乳化剂、ph缓冲剂、稳定剂、或增强药物组合物的有效性的其他试剂。药物组合物可含有递送媒介物,如脂质体、纳米胶囊、微粒、微球、脂质颗粒以及囊泡。
[0606]
在一些实施方案中,本文所述的碱基编辑器系统可被工程化以靶向选自以下的基因组基因座:2b4(cd244)、4-1bb(cd137)、a2ar、aavs1、actb、aid、alb、b2m、b7.1、b7.2、b7-h2、b7-h3、b7-h4、b7-h6、baffr、bcl11a、blame(slamf8)、btla、嗜乳脂蛋白、ciita、ccr5、cd100(sema4d)、cd103、cd3ζ、cd4、cd5、cd7、cd11a、cd11b、cd11c、cd11d、cd150、ipo-3)、cd160、cd160(by55)、cd18、cd19、cd2、cd27、cd28、cd29、cd30、cd4、cd40、cd47、cd48、cd49a、cd49d、cd49f、cd52、cd69、cd7、cd83、cd84、cd8α、cd8β、cd96(tactile)、cds、ceacam1、cish、crtam、ctla4、cxcr4、dck、dgk、dgka、dgkb、dgkd、dgke、dgkg、dgki、dgkk、dgkq、dgkz、dhfr、dnam1(cd226)、ep2/4受体、腺苷受体(包括a2ar)、fas、faslg、gads、gitr、gm-csf、gp49b、hhla2、hla-a、hla-b、hla-c、hla-dpa1、hla-dpb1、hiv-ltr(长末端重复序列)、hla-dqa1、hla-dqb1、hla-dra、hla-drb1、hla-i、hvem、hvem、ia4、icam-1、icos、icos、icos(cd278)、ifn-α/β/γ、il-1β、il-12、il-15、il-18、il-23、il2rβ、il2rγ、il2ra、il-6、il7rα、ilt-2、
ilt-4、免疫球蛋白重链基因座、免疫球蛋白轻链基因座、itga4、itga4、itga6、itgad、itgae、itgal、itgam、itgax、itgb1、itgb2、itgb7、kir家族受体、klrg1、lag-3、lair-1、lat、light、ltbr、ly9(cd229)、mnk1/2、nkg2c、nkg2d、nkp30、nkp44、nkp46、nkp80(klrf1)、ox2r、ox40、pag/cbp、pd-1、pd-l1、pd-l2、pge2受体、pir-b、ppp1r12c、prnp1、psgl1、ptpn2、rance/rankl、rfx5、rosa26、selplg(cd162)、sirpα(cd47)、slam(slamf1、slamf4(cd244、2b4)、slamf5、slamf6(ntb-a、ly108)、slamf7、slp-76、socs1、socs3、束缚蛋白、tgfbr2、tigit、tim-1、tim-3、tim-4、tmigd2、tra、trac、trb、trd、trg、tnf、tnf-α、tnfr2、trim5、tuba1、vista、vla1、或vla-6。
[0607]
应当理解,本文所述的zfp融合蛋白和碱基编辑器系统可用于本文所述的治疗方法中,可用于本文所述的治疗中,或者可用于制备本文所述的用于治疗的药物。
[0608]
v.农业应用
[0609]
所描述的使细胞dna中的胞嘧啶编辑为胸腺嘧啶碱基的系统和方法也可用于农业应用中。例如,在某些实施方案中,碱基编辑可纠正dna序列中的一个或多个点突变以恢复正常的基因表达或活性。在某些实施方案中,碱基编辑可将终止密码子引入一个或多个有害基因中。在某些实施方案中,碱基编辑可引入一个或多个有益突变。在特定实施方案中,本文所述的系统和方法用于编辑农作物。
[0610]
除非本文另有定义,否则与本公开结合使用的科学和技术术语应具有本领域的普通技术人员通常所理解的含义。在下文中描述了示例性方法和材料,尽管与本文所述的那些类似或等同的方法和材料也可用于实践或测试本公开。如发生矛盾,以本说明书及其所包括的定义为准。一般来讲,本文所述的与心脏病学、医学、医药化学以及细胞生物学相关使用的命名法和技术是本领域中公知和常用的那些。酶促反应和纯化技术根据制造商的说明进行,如本领域通常所实现或如本文所述。此外,除非上下文另有要求,否则单数术语应包括复数,并且复数术语应包括单数。在整个说明书和实施方案中,词语“具有(have)”和“包含(comprise)”或变型如“具有(has)”、“具有(having)”、“包含(comprises)”或“包含(comprising)”将理解为暗示包括所述的整数或整数组,但不排除任何其他整数或整数组。还应当指出,术语“或”通常以其包括“和/或”在内的含义使用,除非内容另有明确规定。如本文所用,术语“约”是指在特定用法的上下文内从所述数值加或减10%、5%、或1%的数值范围。另外,本文所提供的标题仅为方便起见,而非解释所要求保护的实施方案的范围或含义。
[0611]
本文所提及的所有出版物和其他参考文献均通过整体引用并入本文。虽然本文引用了许多文献,但是这种引用并不构成承认这些文献中的任一者形成本领域公知常识的一部分。
[0612]
为了可以更好地理解本发明,阐述了以下实施例。这些实施例仅用于举例说明的目的,而不应理解为以任何方式限制本发明的范围。
实施例
[0613]
实施例1:zfp-tdd设计
[0614]
为了制备zfp-ddda融合蛋白对,将ddda肽在如mok等人(同上)所述的残基g1333(“ddda-g1333”)处,以及在残基g1404(“ddda-g1404”)和g1407(“ddda-g1407”)处分裂成两
半(各自缺乏胞苷脱氨酶活性)。八种左zfp和五种右zfp被设计成将ddda半部靶向人ccr5基因座处的位点,使得半部可在靶位点处二聚化并恢复ddda的催化活性。左和右zfp对覆盖了从2-bp到24-bp的各种不同碱基编辑窗口(图2a)。
[0615]
各分裂ddda对的n端半部与左zfp的c端融合,并且c端半部与右zfp的c端融合,并且反之亦然。对于ddda-g1333,使用三种不同接头(l0、l7a和l26)之一,而对于ddda-g1404和ddda-g1407,使用l26接头。对于所有其他实验,除非另有说明,否则使用l26接头。ugi(尿嘧啶dna糖苷酶抑制剂)结构域也与每个n端半部和c端半部的c端融合。所有zfp-ddda融合构建体还含有3xflag标签以及与zfp的n端融合的sv40核定位信号。左和右zfp对的实例显示于图2b中。
[0616]
上述序列和若干制备的构建体的序列显示于下表2中。指序列在左zfp#1-8和右zfp#1-5中加下划线且加粗。表2中的zfp靶向ccr5基因座。
[0617]
表2.zfp-ddda组分和构建体的序列(ccr5基因座zfp)
[0618]
[0619]
[0620]
[0621]
[0622]
[0623]
[0624]
[0625]
[0626]
[0627]
[0628]
[0629][0630]
seq:seq id no。
[0631]
实施例2:k562细胞中的zfp-ddda碱基编辑
[0632]
为了测定使用根据上述方法制备的相同接头zfp-ddda对的细胞中的碱基编辑,从atcc获得k562(atcc,ccl243)细胞,并在37℃和5% co2下维持于具有10% fbs和1
×
青霉素-链霉素-谷氨酰胺(psg)(gibco,10378-016)的rpmi1640中。按照制造商的说明,使用sf细胞系96孔nucleofector试剂盒(lonza,v4sc-2960),将400ng的编码成对zfp-ddda的pdna电穿孔到k562细胞中。简而言之,将细胞用1
×
pbs(不含二价阳离子)洗涤两次并以2
×
105个细胞/15 μl的补充sf细胞系96孔nucleofector溶液重悬。对于每次转染,将15μl的细胞悬浮液与5 μl的pdna混合,并转移至lonza nucleocuvette板,然后使用针对k562细胞的方案(nucleofector程序96-ff-120)在amaxa nucleofector 96孔shuttle系统(lonza)上电穿孔。将电穿孔的细胞在室温下孵育10分钟,然后转移到96孔组织培养板中的150μl预温热的完全培养基中。将细胞孵育72小时,然后收获用于碱基编辑定量。
[0633]
采用以下最佳条件,使用primer3来设计用于ccr5基因座的pcr引物:扩增子尺寸
no:49)
[0643]
》再连接的ddda全(1398-c_term:1334-1397:接头(双下划线):n-term-1333,其中单下划线指示通过再连接形成的临近连接点):
[0644][0645]
然后鉴定了两种不同的策略,以使再连接的ddda分裂为两个半部以制备功能性无毒碱基编辑器,即再连接_g1309和再连接_n1357:
[0646]
》再连接_g1309-n:
[0647][0648]
》再连接_g1309-c:
[0649]
qtvgtfyyvndaggleskvfssgg(seq id no:52)
[0650]
》再连接_n1357-n:
[0651]
aipvkrgatgetkvftgnsnspksptkggcptpypnyanaghvegqsalfmrdn(seq id no:53)
[0652]
》再连接_n1357-c:
[0653][0654]
然后,基于这些分裂物再连接的ddda构造,设计用于ccr5基因座的相应zfp-ddda碱基编辑器。参见例如表4。设想当根据上述方案在k562细胞中测试时,再连接的zfp-ddda对将能够进行c至t的碱基编辑。此种再连接对可以增加多重碱基编辑器应用的特异性,因为只有每个分裂对的左臂和右臂能够形成功能性ddda。
[0655]
表4.再连接的zfp-ddda构建体的序列(ccr5基因座)
[0656]
[0657]
[0658]
[0659]
[0660]
[0661]
[0662][0663]
sed:seq id no。
[0664]
实施例4:zfp-ddda结合口袋的再成形
[0665]
ddda衍生的胞嘧啶碱基编辑器限于c至t编辑,并且在碱基编辑窗口内对tc二核苷酸具有较强偏好。鉴定了用于饱和诱变的各种残基以放宽这些限制并增加酶的效率和/或活性,包括y1307、t1311、s1331、v1346、h1366、n1367、n1368、p1369、e1370、g1371、t1372、f1375、v1392、p1394、p1395、i1399、p1400、v1401、k1402、a1405和t1406。突变相对于seq id no:72进行编号。基于ddda与包括腺嘌呤脱氨酶的其他碱基编辑器之间的结构比对,确定这些残基形成核苷酸口袋。根据上述方案,使用图5中所显示的左和右zfp对,在k562细胞中测试在位置e1370、n1368和y1307处具有突变的ddda变体。
[0666]
如图6a-6c中所显示,某些残基变化引起效率/活性的增加。此外,一些残基变化改变了ddda酶的活性窗口;此类改变可以增大基于ddda的试剂的精度和特异性。y1307和n1368两者似乎对变化敏感,其中一些突变改变了y1307的活性谱(例如,某些情况下在c18处的活性几乎增加20倍,以及能够接近c9和c10)。e1370似乎对变化不太敏感,其中某些突变显示出有益效果(例如在“左_zfp#4-g1333-n:右_zfp#5-g1333-c”的上下文中的e1370h)。
[0667]
实施例5:组合的zfp-tdd 切口酶碱基编辑方法
[0668]
碱基编辑器的效率可通过用切口酶使未修饰的dna链产生切口而增加。该未修饰的dna链然后被细胞识别为新合成的nda链,并且天然dna修复机制使用修饰链作为模板来修复切口dna链。未修饰链可使用foki衍生的zfn或talen或crispr/cas衍生的切口酶进行切口。图7a和7b分别显示了使用crispr/cas9切口酶的zfp-tdd碱基编辑设计和结果。然而,所有三种方法均需要递送两种额外的构建体(用于zfn或talen切口酶的两种肽;用于crispr/cas切口酶的一种肽和一种sgrna;图8)。
[0669]
开发出了三聚zfp-tdd碱基编辑器构造以克服该限制,从而有利于递送且也使得碱基编辑和dna产生切口更有可能同时发生,增加了编辑效率。使用此三聚体构造,二聚foki切口酶的一半可与左或右zfp-tdd的n端融合,且foki切口酶的相应另一半可通过独立的zfp-foki肽靶向感兴趣的位点(图9)。使用ddda的切口酶实验的序列可见于下表5中,其中zfp设计显示于图10(左_zfp#4 右_zfp#1 切口酶zfp#2,或左_zfp#4 右_zfp#5 切口酶zfp#1)。
[0670]
表5.zfp-切口酶构建体的序列(ccr5基因座)
[0671]
[0672]
[0673][0674]
根据上述方案,在k562细胞中测试三聚zfp-ddda-切口酶系统。如图11所显示,三聚zfp-ddda-切口酶系统显示出比基于crispr的切口酶更高水平的碱基编辑活性,在一些情况下具有约70%的碱基编辑,以及接近背景的更低水平的插入缺失。除了优于基于crispr的切口酶系统之外,三聚zfp-tdd-切口酶系统还可以在其紧凑尺寸方面特别有利,与其他平台如crispr/cas和tale-tdd碱基编辑器系统不同,紧凑尺寸可适合于单一病毒载体如aav。
[0675]
实施例6:k562细胞中tdd的碱基编辑活性
[0676]
鉴定了19种其他潜在的胞苷脱氨酶(表6)并测试碱基编辑活性。
[0677]
表6.tdd信息
[0678]
[0679][0680]
seq:seq id no。
[0681]
在以上实施例中所描述的碱基编辑系统中,用上述的tdd置换ddda,并在k562细胞中根据所述的碱基编辑方案在ccr5基因座处使用上述ccr5靶向zfp,和/或在ciita基因座(“位点2”)处使用下述ciita靶向zfp(参见表7)进行测试。ciita引物和扩增子的序列显示于下表8中。
[0682]
表7.ciita位点2锌指蛋白
[0683]
[0684][0685]
seq:seq id no。
[0686]
使用l26接头(seq id no:17),将各tdd分裂物的一个成员与左zfp的c端融合,并将另一成员与右zfp的c端融合。ugi(尿嘧啶dna糖苷酶抑制剂)结构域(seq id no:20)也用sggs接头(seq id no:245)与各n端半部和c端半部的c端融合。所有的zfp融合构建体还含有3xflag标签以及与zfp的n端融合的sv40核定位信号(seq id no:1)。
[0687]
表8.ciita位点2引物和扩增子序列
[0688][0689]
seq:seq id no。
[0690]
用于tdd的序列包括在下表9中。对于某些tdd,还测试了变体毒性结构域(在tdd指示符后由“b”指示,例如对于tdd2为“tdd2b”)。
[0691]
表9.tdd毒性结构域和分裂物的序列
[0692]
[0693]
[0694]
[0695]
[0696]
[0697]
[0698]
[0699]
[0700]
[0701]
[0702]
[0703][0704]
seq:seq id no。
[0705]
在ccr5基因座处的tdd碱基编辑活性
[0706]
图12显示了tdd1-tdd6(选定分裂物)在靶序列ccr5的c9、c10、c14、c16、c18、c20和c24处的碱基编辑频率,其使用不同的两对zfp dna结合结构域(参见图10)。测试每种分裂酶的两个取向(即,对于每个取向,其中n端和c端半部连接zfp对的不同成员)。在碱基编辑系统包括切口酶的实验中,使用zfp-foki切口酶或crispr/cas9切口酶。
[0707]
图13显示碱基编辑窗口中针对任何c的每种脱氨酶的最高编辑频率的比较(基于图12中所显示的数据以及额外的重复实验)。至少三种tdd(tdd3、tdd4和tdd6)显示出可检测的碱基编辑活性(》0.25%碱基编辑),其中tdd4显示出比ddda更高的最大活性。
[0708]
图14提供了tdd碱基编辑活性的更详细分析(基于图12中所显示的数据以及额外的重复实验),显示了在具有或不具有切口酶活性的情况下,针对每种tdd对两种不同zfp对的两种结合取向,碱基编辑窗口中的任何c的最高编辑频率。某些tdd的碱基编辑似乎对于zfp对(例如tdd4)或结合取向(例如tdd3)敏感。尽管至少在zfp#4和zfp#5的情况下具有结合取向依赖性,tdd6似乎对于其所测试的每种条件均具有可检测的活性(》0.25%碱基编辑)。对于每种tdd,在一些情况下,产生切口似乎改善了碱基编辑活性(另见图12)。
[0709]
ciita基因座处的tdd碱基编辑活性
[0710]
针对使用所显示的zfp结合结构域(“ciita_位点_2_右_1”、“ciita_位点_2_右_5”和“ciita_位点_2_左_6”)的在靶序列ciita中标记为g2、g5、c6、c8、g10、g11、g14、c15和c16的核苷酸处的碱基编辑,测试所选tdd分裂酶(图15)。图16显示碱基编辑窗口中针对任何c的每种融合蛋白对的最高编辑频率的比较。在ccr5基因座处具有活性的tdd3、tdd4和tdd6也在ciita基因座处显示出可检测的碱基编辑活性(》0.25%碱基编辑)。八种额外的tdd(tdd8、tdd9、tdd10、tdd12、tdd14、tdd15、tdd18和tdd19)也显示出可检测的编辑。碱基编辑活性似乎对tdd分裂位置敏感,并且在一些情况下对所用毒性结构域的变体(例如,tdd4)敏感。tdd4似乎在其所测试的每种条件下均具有显著的活性。一些tdd也提供了增加的靶向密度(图17),其中tc和ac位点处的活性(相比于ddda;参见例如tdd6)以及gc和cc位点处的活性(例如tdd6)更强。
[0711]
不同接头对ciita基因座处的tdd碱基编辑活性的效应
[0712]
为了评估碱基编辑活性是否受到脱氨酶与zfp结构域之间的不同接头的影响,用接头l26、l21、l18、l13、l11、l9、l6和l4评估tdd6在ciita基因座处的编辑频率。如图18所显
示,不同的接头长度能够改变碱基编辑窗口内的碱基编辑谱。例如,使左zfp与n端或c端tdd分裂物连接的接头缩短似乎使活性窗口变窄。此类改变可以增加碱基编辑器精度和特异性。在一些情况下,接头长度的效应似乎对于tdd分裂物针对zfp对或针对tdd的结合取向是敏感的(例如,关于tdd14的l4表现)。
[0713]
实施例7:tdd的靶向抑制剂tddi
[0714]
tdd酶可通过tddi失活。例如,天然ddda酶可通过dddi抑制剂失活。zfp或tale连接的tddi可以靶向潜在的tdd衍生的胞嘧啶碱基编辑器位点,阻止该位点被编辑(图19)。tddi抑制剂可使用由小分子增强的二聚化结构域连接至zfp,从而使编辑活性处于小分子的控制之下。
[0715]
通过将靶向tddi构建体设计为等位基因特异性,编辑可以选择性地靶向某些等位基因,例如,通过仅在存在突变时编辑终止密码子来敲除有害突变体。例如,可以通过仅在存在v617f突变时编辑终止密码子而敲除jak2v617f。
[0716]
该tddi方法还可用于减少脱靶位点处的编辑,特别是在不能通过其他方式消除的情况下。
[0717]
还设想了可以使用其他胞苷脱氨酶及其抑制剂替换tdd和tddi。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表