一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

重组酶组合物和使用方法与流程

2022-04-30 08:03:55 来源:中国专利 TAG:

重组酶组合物和使用方法
1.相关申请
2.本技术要求2019年7月19日提交的美国序列号62/876,165以及2020年6月15日提交的美国序列号63/039,328的优先权,将其中每个的全部内容通过引用并入本文。
3.序列表
4.本技术包含序列表,该序列表已经以ascii格式以电子方式提交,并且特此通过引用以其全文并入。所述ascii拷贝创建于2020年7月16日,命名为v2065-7003wo_sl.txt,并且大小为2,102,102字节。


背景技术:

5.在没有专门的蛋白质来促进插入事件的情况下,目的核酸整合到基因组中的频率较低且位点特异性极低。一些现有的方法、例如crispr/cas9更适合于小型编辑,并且在整合较长序列时效率较低。其他现有的方法、例如cre/loxp需要第一步先将loxp位点插入基因组中,然后第二步将目的序列插入loxp位点中。本领域需要改善的组合物(例如,蛋白质和核酸)和方法用于在基因组中插入、改变、或缺失目的序列。


技术实现要素:

6.本披露涉及用于体内或体外改变宿主细胞、组织或受试者中一个或多个位置处的基因组的新颖组合物、系统和方法。特别地,本发明的特征在于用于使用重组酶多肽(例如,酪氨酸重组酶,例如,如本文所述)将外源遗传元件引入宿主基因组中的组合物、系统和方法。
7.列举的实施例
8.1.一种用于修饰dna的系统,该系统包含:
9.a)重组酶多肽,其包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或编码该重组酶多肽的核酸;以及
10.b)双链插入dna,其包含:
11.(i)与(a)的重组酶多肽结合的dna识别序列,
12.所述dna识别序列具有第一副回文(parapalindromic)序列和第二副回文序列,其中每个副回文序列为约10-30、12-27、或10-15个核苷酸,例如,约13个核苷酸,并且该第一和第二副回文序列一起构成如下核苷酸序列的副回文区,该核苷酸序列为表1的核苷酸序列,或与该表1的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于该表1的核苷酸序列具有不超过1、2、3、或4个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
13.所述dna识别序列进一步包含约5-10个核苷酸例如约8个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
14.(ii)异源对象序列。
15.2.一种用于修饰dna的系统,该系统包含:
16.a)重组酶多肽,其包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或编码该重组酶多肽的核酸;以及
17.b)插入dna,其包含:
18.(i)与(a)的重组酶多肽结合的表1的人第一副回文序列和人第二副回文序列,以及
19.(ii)任选地,异源对象序列。
20.3.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少70%序列同一性的氨基酸序列。
21.4.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少75%序列同一性的氨基酸序列。
22.5.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少80%序列同一性的氨基酸序列。
23.6.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少85%序列同一性的氨基酸序列。
24.7.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少90%序列同一性的氨基酸序列。
25.8.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少95%序列同一性的氨基酸序列。
26.9.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少96%序列同一性的氨基酸序列。
27.10.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少97%序列同一性的氨基酸序列。
28.11.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少98%序列同一性的氨基酸序列。
29.12.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有至少99%序列同一性的氨基酸序列。
30.13.如实施例1或2所述的系统,其中该重组酶多肽包含与表2的氨基酸序列具有100%序列同一性的氨基酸序列。
31.14.如实施例1-13中任一项所述的系统,其中(a)和(b)在分开的容器中。
32.15.如实施例1-13中任一项所述的系统,其中(a)和(b)是混合的。
33.16.一种细胞(例如,真核细胞,例如,哺乳动物细胞,例如,人细胞;或原核细胞),其包含:重组酶多肽,其包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或编码该重组酶多肽的核酸。
34.17.如实施例16所述的细胞,其进一步包含含有以下的插入dna:
35.(i)与该重组酶多肽结合的dna识别序列,所述dna识别序列包含第一副回文序列和第二副回文序列,
36.其中每个副回文序列为约10-30、12-27、或10-15个核苷酸,例如,约13个核苷酸,并且该第一和第二副回文序列一起构成如下核苷酸序列的副回文区,该核苷酸序列为表1的核苷酸序列,或与该表1的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于该表1的核苷酸序列具有不超过1、2、3、或4个序列改变(例如,取代、插入、或缺失)的核苷酸序列,
37.其中所述dna识别序列进一步包含约5-10个核苷酸例如约8个核苷酸的核心序列,并且其中该核心序列位于该第一和第二副回文序列之间;以及
38.(ii)任选地,异源对象序列。
39.18.一种细胞(例如,真核细胞,例如,哺乳动物细胞,例如,人细胞;或原核细胞),其包含:
40.(i)dna识别序列,所述dna识别序列包含第一副回文序列和第二副回文序列,
41.其中每个副回文序列为约10-30、12-27、或10-15个核苷酸,例如,约13个核苷酸,并且该第一和第二副回文序列一起构成如下核苷酸序列的副回文区,该核苷酸序列为表1的核苷酸序列,或与该表1的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于该表1的核苷酸序列具有不超过1、2、3、或4个序列改变(例如,取代、插入、或缺失)的核苷酸序列,
42.其中所述dna识别序列进一步包含约5-10个核苷酸例如约8个核苷酸的核心序列,并且其中该核心序列位于该第一和第二副回文序列之间;以及
43.(ii)异源对象序列。
44.19.如实施例18所述的细胞,其中该dna识别序列在该异源对象序列的1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、或100个核苷酸内。
45.20.如实施例18或19所述的细胞,其中该dna识别序列和异源对象序列在染色体中或染色体外。
46.21.如实施例16-20中任一项所述的细胞,其中该细胞是真核细胞。
47.22.如实施例21所述的细胞,其中该细胞是哺乳动物细胞。
48.23.如实施例22所述的细胞,其中该细胞是人细胞。
49.24.如实施例16-20中任一项所述的细胞,其中该细胞是原核细胞(例如,细菌细胞)。
50.25.一种分离的真核细胞,其包含在表1的第2列或第3列中所列的基因组位置处稳定整合至其基因组中的异源对象序列。
51.26.如实施例25所述的分离的真核细胞,其中该细胞是动物细胞(例如,哺乳动物细胞)或植物细胞。
52.27.如实施例26所述的分离的真核细胞,其中该哺乳动物细胞是人细胞。
53.28.如实施例26所述的分离的真核细胞,其中该动物细胞是牛细胞、马细胞、猪细胞、山羊细胞、绵羊细胞、鸡细胞或火鸡细胞。
54.29.如实施例26所述的分离的真核细胞,其中该植物细胞是玉米细胞、大豆细胞、小麦细胞或水稻细胞。
55.30.一种修饰真核细胞(例如,哺乳动物细胞,例如,人细胞)的基因组的方法,该方法包括使该细胞与以下接触:
56.a)重组酶多肽,其包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,或编码该重组酶多肽的核酸;以及
57.b)插入dna,其包含:
58.(i)与(a)的重组酶多肽结合的dna识别序列,所述dna识别序列包含第一副回文序列和第二副回文序列,其中每个副回文序列为约10-30、12-27、或10-15个核苷酸,例如,约13个核苷酸,并且该第一和第二副回文序列一起构成如下核苷酸序列的副回文区,该核苷酸序列为表1的核苷酸序列,或与该表1的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于该表1的核苷酸序列具有不超过1、2、3、或4个序列改变(例如,取代、插入、或缺失)的核苷酸序列,
59.其中所述dna识别序列进一步包含约5-10个核苷酸例如约8个核苷酸的核心序列,并且其中该核心序列位于该第一和第二副回文序列之间,以及
60.(ii)异源对象序列,
61.从而对该真核细胞的基因组进行修饰。
62.31.一种将异源对象序列插入真核细胞(例如,哺乳动物细胞,例如,人细胞)的基因组的方法,该方法包括使该细胞与以下接触:
63.a)重组酶多肽,其包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,或编码该多肽的核酸;以及
64.b)插入dna,其包含:
65.(i)与(a)的重组酶多肽结合的dna识别序列,所述dna识别序列包含第一副回文序列和第二副回文序列,其中每个副回文序列为约10-30、12-27、或10-15个核苷酸,例如,约13个核苷酸,并且该第一和第二副回文序列一起构成如下核苷酸序列的副回文区,该核苷酸序列为表1或2的核苷酸序列,并且
66.其中所述dna识别序列进一步包含约5-10个核苷酸例如约8个核苷酸的核心序列,并且其中该核心序列位于该第一和第二副回文序列之间,以及
67.(ii)异源对象序列,
68.从而例如以例如在实例5的测定中所测量的该真核细胞群体的至少约0.1%(例如,至少约0.1%、0.5%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)的频率将该异源对象序列插入该真核细胞的基因组。
69.32.如实施例30或31所述的方法,其中(a)和(b)分开或一起施用。
70.33.如实施例30或31所述的方法,其中(a)在(b)的施用之前、与其同时、或在其之后施用。
71.34.如实施例30-33中任一项所述的方法,其中(a)包含编码该多肽的核酸。
72.35.如实施例34所述的方法,其中(a)的核酸和(b)的插入dna位于同一核酸分子上、例如位于同一载体上。
73.36.如实施例34所述的方法,其中(a)的核酸和(b)的插入dna位于分开的核酸分子上。
74.37.如实施例30-36中任一项所述的方法,其中该细胞仅具有一个与该插入dna的dna识别序列相容的内源dna识别序列。
75.38.如实施例30-36中任一项所述的方法,其中该细胞具有两个或更多个与该插入dna的dna识别序列相容的内源dna识别序列。
76.39.一种分离的重组酶多肽,其包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列。
77.40.如实施例39所述的分离的重组酶多肽,其相对于表1或2的重组酶序列包含至少一个插入、缺失、或取代。
78.41.如实施例40所述的分离的重组酶多肽,其中该合成的重组酶多肽结合真核(例如,哺乳动物,例如,人)基因组基因座(例如,表1的序列)。
79.42.如实施例40或41所述的分离的重组酶多肽,其中该合成的重组酶多肽相对于表1或2的对应未经修饰的氨基酸序列对该基因组基因座的亲和力增加至少2倍、3倍、4倍、或5倍。
80.43.一种分离的核酸,其编码如下重组酶多肽,该重组酶多肽包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
81.44.如实施例43所述的分离的核酸,其编码如下重组酶多肽,该重组酶多肽相对于表1或2的重组酶序列包含至少一个插入、缺失、或取代。
82.45.如实施例43或44所述的分离的核酸序列,其针对哺乳动物细胞、例如人细胞进行了密码子优化。
83.46.如实施例43-45中任一项所述的分离的核酸,其进一步包含异源启动子(例如,哺乳动物启动子,例如,组织特异性启动子)、微小rna(例如,组织特异性限制性mirna)、聚腺苷酸化信号或异源有效负载。
84.47.一种分离的核酸(例如,dna),其包含:
85.(i)dna识别序列,所述dna识别序列包含第一副回文序列和第二副回文序列,其中每个副回文序列为约10-30、12-27、或10-15个核苷酸,例如,约13个核苷酸,并且该第一和第二副回文序列一起构成如下核苷酸序列的副回文区,该核苷酸序列为表1的核苷酸序列,并且
86.所述dna识别序列进一步包含约5-10个核苷酸例如约8个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
87.(ii)异源对象序列。
88.48.如实施例47所述的分离的核酸,其与表1或2的重组酶多肽结合。
89.49.一种制备重组酶多肽的方法,该方法包括:
90.a)提供核酸,该核酸编码如下重组酶多肽,该重组酶多肽包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,和
91.b)在允许该重组酶多肽产生的条件下将该核酸引入细胞(例如,真核细胞或原核细胞,例如,如本文所述),
92.从而制备该重组酶多肽。
93.50.一种制备重组酶多肽的方法,该方法包括:
94.a)提供包含如下核酸的细胞(例如,原核或真核细胞),该核酸编码如下重组酶多肽,该重组酶多肽包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,和
95.b)在允许该重组酶多肽产生的条件下孵育该细胞,
96.从而制备该重组酶多肽。
97.51.一种制备包含dna识别序列和异源序列的插入dna的方法,该方法包括:
98.a)提供核酸,该核酸包含:
99.(i)dna识别序列,其与如下重组酶多肽结合,该重组酶多肽包含表1或2的氨基酸序列,或与该表1或2的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,所述dna识别序列包含第一副回文序列和第二副回文序列,其中每个副回文序列为约10-30、12-27、或10-15个核苷酸,例如,约13个核苷酸,并且该第一和第二副回文序列一起构成如下核苷酸序列的副回文区,该核苷酸序列为表1的核苷酸序列,并且
100.所述dna识别序列进一步包含约5-10个核苷酸例如约8个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
101.(ii)异源对象序列,以及
102.b)在允许该核酸复制的条件下将该核酸引入细胞(例如,真核细胞或原核细胞,例如,如本文所述),
103.从而制备该插入dna。
104.52.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽相对于表1或2的氨基酸序列包含至少一个插入、缺失、或取代。
105.53.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽相对于表1或2的氨基酸序列在n末端、c末端、或n末端和c末端两端包含截短。
106.54.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽包含核定位序列,例如内源核定位序列或异源核定位序列。
107.55.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该异源对象序列以例如在实例5的测定中所测量的该细胞的群体的至少约0.1%(例如,至少约0.1%、0.5%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)的效率插入该细胞的基因组。
108.56.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该异源对象序列在例如由实例4的测定所测量的至少约1%(例如,至少约1%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%、或100%)的插入事件中插入该细胞的基因组内的位点(例如,表1的第4列中所列的基因座,例如,与针对表1的第1列中所列的重组酶的行对应)。
109.57.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中,在这些细胞的群体中(如与该系统接触的细胞的群体),该异源对象序列在例如由实例4的测定所测量的该群体中至少1%、5%、10%、15%、20%、25%、30%、40%、50%、
30、12-27、或10-15个,例如约13个核苷酸的3’区。
121.69.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该第一和第二副回文序列长度相同。
122.70.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列长度为5-10个核苷酸(例如,约8个核苷酸)。
123.71.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列能够与人基因组中的对应序列、或该对应序列的反向互补序列杂交。
124.72.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列与人基因组中的对应序列具有至少10%、20%、30%、40%、50%、60%、70%、80%、或90%同一性。
125.73.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列与人基因组中的对应序列具有不超过1、2、3、4、5、6、7、8、或9个错配。
126.74.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列当被该重组酶切割时形成能与人基因组中的对应序列杂交的粘性末端。
127.75.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该异源对象序列包含真核基因(例如哺乳动物基因,例如人基因,例如血液因子(例如,基因组因子i、ii、v、vii、x、xi、xii或xiii)或酶(例如溶酶体酶)),或合成人基因(例如嵌合抗原受体)。
128.76.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入dna包含异源对象序列和dna识别序列。
129.77.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入dna包含编码该重组酶多肽的核酸序列。
130.78.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入dna和编码该重组酶多肽的核酸存在于分开的核酸分子中。
131.79.如实施例1-77中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入dna和编码该重组酶多肽的核酸存在于同一核酸分子中。
132.80.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入dna进一步包含以下中的1、2、3、4、5个或全部:
133.(a)开放阅读框,例如编码多肽的序列,例如酶(例如,溶酶体酶)、血液因子、外显子;
134.(b)非编码和/或调节序列,例如结合转录调控剂的序列,例如启动子(例如,异源启动子)、增强子、绝缘子;
135.(c)剪接受体位点;
136.(d)聚a位点;
137.(e)表观遗传修饰位点;或
138.(f)基因表达单元。
139.81.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入dna包含质粒、病毒载体(例如,慢病毒载体或游离病毒载体)或其他自我
复制载体。
140.82.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞不包含由该异源对象序列构成的内源人基因,或不包含由所述基因编码的蛋白质。
141.83.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞来自如下生物,该生物不包含由该异源对象序列构成的内源人基因,或不包含由所述基因编码的蛋白质。
142.84.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞包含内源人dna识别序列。
143.85.如实施例84所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该内源人dna识别序列可操作地连接至人基因组内的位点,例如,位于人基因组内的某一位点,该位点具有以下标准中的至少1、2、3、4、5、6、7、8或9项:
144.(i)距癌症相关基因》300kb;
145.(ii)距mirna/其他功能性小rna》300kb;
146.(iii)距5'基因末端》50kb;
147.(iv)距复制起点》50kb;
148.(v)距任何极保守元件》50kb;
149.(vi)转录活性低(即无mrna /-25kb);(vii)不在拷贝数可变区中;
150.(viii)在开放染色质中;和/或
151.(ix)是唯一的,例如,在人基因组中有1个拷贝。
152.86.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞是动物细胞,例如哺乳动物细胞,例如人细胞。
153.87.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞是植物细胞。
154.88.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞未经基因修饰。
155.89.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞不包含loxp位点。
156.90.如前述实施例中任一项所述的系统或方法,其中该编码该重组酶多肽的核酸在病毒载体、例如aav载体中。
157.91.如前述实施例中任一项所述的系统或方法,其中该双链插入dna在病毒载体、例如aav载体中。
158.92.如前述实施例中任一项所述的系统或方法,其中该编码该重组酶多肽的核酸是mrna,其中任选地该mrna在lnp中。
159.93.如前述实施例中任一项所述的系统或方法,其中该双链插入dna不在病毒载体中,例如,其中该双链插入dna是裸dna或转染试剂中的dna。
160.94.如前述实施例中任一项所述的系统或方法,其中:
161.该编码该重组酶多肽的核酸在第一病毒载体、例如第一aav载体中,并且该插入dna在第二病毒载体、例如第二aav载体中。
162.95.如前述实施例中任一项所述的系统或方法,其中:
163.该编码该重组酶多肽的核酸是mrna,其中任选地该mrna在lnp中,并且
164.该插入dna在病毒载体、例如aav载体中。
165.96.如前述实施例中任一项所述的系统或方法,其中:
166.该编码该重组酶多肽的核酸是mrna,并且
167.该双链插入dna不在病毒载体中,例如,其中该双链插入dna是裸dna或转染试剂中的dna。
168.97.如前述实施例中任一项所述的系统或方法,其中该插入dna具有至少1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、110kb、120kb、130kb、140kb、或150kb的长度。
169.98.如前述实施例中任一项所述的系统或方法,其中该插入dna不包含抗生素抗性基因或任何其他细菌基因或部分。
170.99.如前述实施例中任一项所述的系统、细胞、多肽、核酸、或方法,其中该重组酶多肽是选自以下的重组酶:rec17(seq id no:1231)、rec19(seq id no:1233)、rec20(seq id no:1234)、rec27(seq id no:1241)、rec29(seq id no:1243)、rec30(seq id no:1244)、rec31(seq id no:1245)、rec32(seq id no:1246)、rec33(seq id no:1247)、rec34(seq id no:1248)、rec35(seq id no:1249)、rec36(seq id no:1250)、rec37(seq id no:1251)、rec38(seq id no:1252)、rec39(seq id no:1253)、rec338(seq id no:1552)、或rec589(seq id no:1803),或具有如下氨基酸序列的重组酶多肽,该氨基酸序列与这些重组酶的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性,或相对于这些重组酶的氨基酸序列具有不超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、或50个序列改变(例如,取代、插入、或缺失)。
171.100.如前述实施例中任一项所述的系统、细胞、多肽、核酸、或方法,其中当该多肽、系统、或核酸用于报告基因倒位测定、例如实例13的测定中时,结果使报告基因在至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、20%、25%、30%、35%、40%、45%、50%、55%、或60%的细胞中表达。
172.101.如前述实施例中任一项所述的系统、细胞、多肽、核酸、或方法,其中该报告基因倒位测定包括:
173.i)将该多肽、系统或核酸引入测试细胞群体,
174.ii)向该测试细胞群体引入核酸,该核酸从5’至3’包含启动子、与重组酶多肽结合的第一dna识别序列、反义取向的gfp基因、以及与重组酶多肽结合的第二dna识别序列(例如,其中该第一和第二dna识别序列各自包含来自表1第3列中与对应重组酶多肽在同一行的一个或多个序列),
175.iii)将该测试细胞群体孵育一定时间、例如在37℃时2天,例如,如实例13所述,该时间足以使该gfp基因倒位,以及
176.iv)确定该测试群体中展示gfp荧光的细胞的百分比值,例如,其中gfp荧光的阈值为背景荧光的至少1.7x(1.7倍)、1.8x、1.9x、2x、2.1x、2.2x、或2.3x(例如,2x),例如,如实例13所述。
177.102.如前述实施例中任一项所述的系统、细胞、多肽、核酸、或方法,其中当该多
肽、系统、或核酸用于报告基因整合测定、例如实例14的测定中时,结果使平均报告基因拷贝数为至少0.05、0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.7、0.8、0.9、或0.95个/细胞。
178.103.如前述实施例中任一项所述的系统、细胞、多肽、核酸、或方法,其中该报告基因整合测定包括:
179.i)将该多肽、系统或核酸引入测试细胞群体,
180.ii)向该测试细胞群体引入核酸,该核酸从5’至3’包含与重组酶多肽结合的第一dna识别序列、gfp基因、以及与重组酶多肽结合的第二dna识别序列(例如,其中该第一和第二dna识别序列各自包含来自表1第3列中与对应重组酶多肽在同一行的一个或多个序列),
181.iii)将该测试细胞群体孵育一定时间、例如在37℃时2-5天,例如,如实例14所述,该时间足以使该gfp基因整合到该测试细胞群体的基因组dna中,以及
182.iv)确定该测试细胞群体的基因组dna中每细胞的平均gfp基因拷贝数的值,例如,其中阈值拷贝数为所检测的背景拷贝数的至少1.7x(1.7倍)、1.8x、1.9x、2x、2.1x、2.2x、或2.3x(例如,2x),例如,如实例14所述。
183.104.如前述实施例中任一项所述的系统、细胞、多肽、核酸、或方法,其中该核酸(例如,分离的核酸)、插入dna(例如,双链插入dna)或异源对象序列包含人工染色体、例如细菌人工染色体。
184.105.如前述实施例中任一项所述的系统、细胞、多肽、或核酸,它们用作实验室工具或研究工具,或用于实验室方法或研究方法。
185.106.如实施例30-38或52-104中任一项所述的方法,其中该方法用作实验室方法或研究方法或用作实验室方法或研究方法的一部分。
186.107.如实施例105或106中任一项所述的系统、细胞、多肽、核酸或方法,其中该实验室工具或研究工具或实验室方法或研究方法用于修饰动物细胞,例如哺乳动物细胞(例如,人细胞)、植物细胞、或真菌细胞。
187.108.如实施例105-107中任一项所述的系统、细胞、多肽、核酸或方法,其中该实验室工具或研究工具或实验室方法或研究方法在体外使用。
188.本披露考虑前述各方面和/或实施例中任何一个或多个的所有组合,以及在具体实施方式和实例中所阐述的实施例中任何一个或多个的组合。
189.定义
190.结构域:如本文所用,术语“结构域”是指有助于生物分子的特定功能的生物分子的结构。结构域可以包含生物分子的连续区域(例如,连续序列)或不同的非连续区域(例如,非连续序列)。蛋白质结构域的实例包括但不限于核定位序列、重组酶结构域、dna识别结构域(例如,与或能够与识别位点结合的识别结构域,例如,如本文所述)、酪氨酸重组酶n末端结构域和酪氨酸重组酶c末端结构域;核酸的结构域的实例是调节结构域,如转录因子结合结构域、副回文序列、副回文区、核心序列或对象序列(例如,异源对象序列)。在一些实施例中,重组酶多肽包含表1或2的多肽或其片段或变体的一个或多个结构域(例如,重组酶结构域或dna识别结构域)。
191.外源的:如本文所用,术语外源的,当相对于生物分子(例如核酸序列或多肽)使用时,意指通过人工将生物分子引入宿主基因组、细胞或生物中。例如,使用重组dna技术或其
他方法添加到现有基因组、细胞、组织或受试者中的核酸对于现有核酸序列、细胞、组织或受试者而言是外源的。
192.基因组安全港位点(gsh位点):基因组安全港位点是宿主基因组中的位点,该位点能够容纳新遗传材料的整合,例如,使得插入的遗传元件不会引起宿主基因组的显著改变对宿主细胞或生物构成风险。gsh位点通常满足以下标准中的1、2、3、4、5、6、7、8或9项:(i)距癌症相关基因》300kb;(ii)距mirna/其他功能性小rna》300kb;(iii)距5’基因末端》50kb;(iv)距复制起点》50kb;(v)距任何极保守元件》50kb;(vi)转录活性低(即无mrna /-25kb);(vii)不在拷贝数可变区中;(viii)在开放染色质中;和/或(ix)是唯一的,在人基因组中有1个拷贝。满足一些或所有这些标准的人基因组中gsh位点的实例包括:(i)腺相关病毒位点1(aavs1),它是aav病毒在19号染色体上整合的天然存在的位点;(ii)趋化因子(c-c基序)受体5(ccr5)基因,一种被称为hiv-1共同受体的趋化因子受体基因;(iii)小鼠rosa26基因座的人直系同源物;(iv)rdna基因座。另外的gsh位点是已知的,并且描述于例如pellenz等人,2018年8月20日电子公开(https://doi.org/10.1101/396390)中。
193.异源的:当用于参考第二元件来描述第一元件时,术语异源的意指第一元件和第二元件在自然界中不以如所描述的布置存在。例如,异源多肽、核酸分子、构建体或序列是指(a)对于表达其的细胞而言不是天然的多肽、核酸分子或多肽或核酸分子序列的一部分,(b)相对于其天然状态已发生改变或突变的多肽或核酸分子或多肽或核酸分子的一部分,或(c)具有与在类似条件下的天然表达水平相比改变的表达的多肽或核酸分子。例如,异源调节序列(例如启动子、增强子)可以用于调节基因或核酸分子的表达,其方式不同于基因或核酸分子通常在自然界中表达的方式。在某些实施例中,异源核酸分子可以存在于天然宿主细胞基因组中,但是可以具有改变的表达水平或具有不同的序列或两者。在其他实施例中,异源核酸分子对于宿主细胞或宿主基因组可能不是内源的,而是通过转化(例如,转染、电穿孔)引入宿主细胞的,其中所添加的分子可以整合到宿主基因组中,或可以作为染色体外遗传材料短暂存在(例如,mrna)或半稳定存在超过一代(例如,游离病毒载体、质粒或其他自我复制载体)。
194.突变或突变的:当应用于核酸序列时,术语“突变的”意指与参考(例如天然)核酸序列相比,核酸序列中的核苷酸可以被插入、缺失或改变。可以在基因座处进行单个改变(点突变),或者可以在单个基因座处插入、缺失或改变多个核苷酸。另外,可以在核酸序列内的任何数目的基因座处进行一个或多个改变。核酸序列可以通过本领域已知的任何方法进行突变。
195.核酸分子:核酸分子是指rna和dna分子两者,包括但不限于cdna、基因组dna和mrna,并且还包括合成的核酸分子,例如化学合成或重组产生的核酸分子,例如如本文所述的dna模板。核酸分子可以是双链或单链、环状或线性的。如果是单链,则核酸分子可以是有义链或反义链。除非另有说明,并且作为本文中以通用格式“seq id no:”所述的所有序列的实例,“包含seq id no:1的核酸”是指具有(i)seq id no:1的序列或(ii)与seq id no:1互补的序列的核酸、至少一部分。两者之间的选择取决于使用seq id no:1的上下文。例如,如果将核酸用作探针,则两者之间的选择取决于探针与期望的靶互补的要求。如本领域技术人员将容易理解的,本披露的核酸序列可以被化学或生物化学修饰或可以含有非天然或衍生的核苷酸碱基。此类修饰包括例如标签,甲基化,用类似物取代一个或多个天然存在的
核苷酸,核苷酸间修饰,例如不带电荷的连接(例如,甲基膦酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等)、带电荷的连接(例如,硫代磷酸酯、二硫代磷酸酯等),侧链部分(例如,多肽),嵌入剂(例如,吖啶、补骨脂素等),螯合剂,烷基化剂和经修饰的连接(例如,α异头核酸等等)。还包括合成的分子,它们模拟多核苷酸经由氢键和其他化学相互作用与指定序列结合的能力。此类分子是本领域已知的,并且包括例如其中肽键替代分子主链中的磷酸键的那些。其他修饰可以包括,例如,其中核糖环含有桥接部分或其他结构(例如在“锁定”核酸中发现的修饰)的类似物。
196.基因表达单元:基因表达单元是核酸序列,其包含与至少一个效应子序列可操作地连接的至少一个调节核酸序列。当第一核酸序列被放置成与第二核酸序列有功能关系时,该第一核酸序列与该第二核酸序列可操作地连接。例如,如果启动子或增强子影响编码序列的转录或表达,则该启动子或增强子与该编码序列可操作地连接。可操作地连接的dna序列可以是连续的或非连续的。在需要连接两个蛋白质编码区的情况下,可操作地连接的序列可以在同一阅读框中。
197.宿主:如本文所用,术语宿主基因组或宿主细胞是指已将蛋白质和/或遗传材料引入其中的细胞和/或其基因组。应当理解,此类术语不仅旨在指特定的受试者细胞和/或基因组,而且还指这种细胞的子代和/或这种细胞的子代的基因组。因为由于突变或环境影响,某些修饰可能在后代中发生,所以这种子代实际上可能与亲本细胞不同,但仍包括在本文所用的术语“宿主细胞”的范围内。宿主基因组或宿主细胞可以是在培养物中生长的分离的细胞或细胞系,或者是从这种细胞或细胞系分离的基因组材料,或者可以是构成活组织或生物的宿主细胞或宿主基因组。在一些情况下,宿主细胞可以是动物细胞或植物细胞,例如,如本文所述。在某些情况下,宿主细胞可以是牛细胞、马细胞、猪细胞、山羊细胞、绵羊细胞、鸡细胞或火鸡细胞。在某些情况下,宿主细胞可以是玉米细胞、大豆细胞、小麦细胞或水稻细胞。
198.重组酶多肽:如本文所用,重组酶多肽是指具有催化核酸分子(例如,dna分子)重组反应的功能能力的多肽。重组反应可以包括,例如,一条或多条核酸链断裂(例如,双链断裂),接着是两条核酸链末端(例如,粘性末端)的连接。在一些情况下,重组反应包括将插入核酸插入例如靶位点,例如在基因组或构建体中的靶位点。在一些情况下,重组酶多肽包含天然存在的重组酶(例如,酪氨酸重组酶,例如,cre重组酶或flp重组酶)的一个或多个结构元件。在某些情况下,重组酶多肽包含与本文所述的重组酶具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%序列同一性的氨基酸序列(例如,如表1或2中所列)。在一些情况下,重组酶多肽具有天然存在的重组酶(例如,酪氨酸重组酶,例如,cre重组酶或flp重组酶)的一种或多种功能特征。在一些情况下,重组酶多肽识别(例如,结合)核酸分子中的识别序列(例如,表1或2中所列的识别序列,或与该所列的序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列)。在一些实施例中,重组酶多肽作为分离的单体不具有活性。在一些实施例中,重组酶多肽与一个或多个其他重组酶多肽(例如,每个重组反应四个重组酶多肽)协同催化重组反应。
199.插入核酸分子:如本文所用,插入核酸分子(例如,插入dna)是如下核酸分子(例如,dna分子),该核酸分子被或将被至少部分地插入靶核酸分子(例如,基因组dna)内的靶位点。插入核酸分子可以包括,例如,相对于靶核酸分子(例如,基因组dna)异源的核酸序
列。在一些情况下,插入核酸分子包含对象序列(例如,异源对象序列)。在一些情况下,插入核酸分子包含dna识别序列,例如,存在于靶核酸中的dna识别序列的同源dna识别序列。在一些实施例中,插入核酸分子是环状的,而在一些实施例中,插入核酸分子是线性的。在一些实施例中,插入核酸分子也称为模板核酸分子(例如,模板dna)。
200.识别序列:识别序列(例如,dna识别序列)通常是指由重组酶多肽识别(例如,能够被该重组酶多肽结合)的核酸(例如,dna)序列,例如,如本文所述。在一些情况下,识别序列包含两个副回文序列,例如,如本文所述。在某些情况下,这两个副回文序列一起形成副回文区或其部分。在一些情况下,识别序列进一步包含例如,如本文所述位于这两个副回文序列之间的核心序列。在一些情况下,识别序列包含表1所列的核酸序列,或与该表1所列的核酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列。
201.核心序列:如本文所用,核心序列是指位于两个副回文序列之间的核酸序列。在一些情况下,核心序列可以被重组酶多肽(例如,对包含两个副回文序列的识别序列进行识别的重组酶多肽)切割,例如以形成粘性末端。在一些实施例中,核心序列的长度是约5-10个核苷酸、例如约8个核苷酸。
202.对象序列:如本文所用,术语对象序列是指可以例如通过重组酶多肽被理想地插入靶核酸分子中的核酸区段,例如,如本文所述。在一些实施例中,插入dna包含dna识别序列和对于该dna识别序列异源的对象序列,该对象序列在本文通常被称为“异源对象序列”。在一些情况下,对象序列相对于其所插入的核酸分子可以是异源的。在一些情况下,对象序列包含编码基因(例如,真核基因,例如,哺乳动物基因,例如,人基因)的核酸序列或其他目的载物(cargo)(例如,编码功能性rna例如sirna或mirna的序列),例如,如本文所述。在某些情况下,基因编码多肽(例如,血液因子或酶)。在一些情况下,对象序列包含一个或多个编码可选择标志物(例如,营养缺陷型标志物或抗生素标志物)的核酸序列、和/或核酸控制元件(例如,启动子、增强子、沉默子或绝缘子)。
203.副回文:如本文所用,术语副回文是指一对核酸序列的特性,其中一个核酸序列是相对于另一个核酸序列的回文结构,或者与相对于另一个核酸序列的回文结构具有至少50%(例如,至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)序列同一性,或者相对于另一个核酸序列具有不超过1、2、3、4、5、6、7、或8个序列错配。如本文所用,“副回文序列”是指相对于彼此是副回文的一对核酸序列中的至少一个。如本文所用,“副回文区”是指包含两个副回文序列的核酸序列或其部分。在一些情况下,副回文区包含核酸区段侧翼的两个副回文序列,例如,包含核心序列。
附图说明
204.图1示出了示例性重组酶报告基因质粒的图。通过同源重组酶(例如,cre)的存在可以激活含有侧翼是反向取向的重组酶识别位点(例如,loxp)的反向gfp基因的非活性报告基因质粒,这使得gfp基因翻转至如下取向,在该取向上编码序列的转录是由上游启动子(例如,cmv)驱动的。
205.图2示出了描述示例性重组酶介导的整合到人基因组中的图。在上方图中,由重组酶表达质粒表达的重组酶识别插入dna质粒上的第一靶位点和人基因组中的第二靶位点,
并催化这两个位点之间的重组,最终使插入dna质粒在第二靶位点处整合到人基因组中。在下方图中,示出了用于对基因组整合事件进行定量的ddpcr测定的引物和探针位置。
具体实施方式
206.本披露涉及用于例如体内或体外靶向、编辑、修饰或操纵细胞、组织或受试者中dna序列中的一个或多个位置处的dna序列(例如,将异源对象dna序列插入哺乳动物基因组的靶位点)的组合物、系统和方法。对象dna序列可以包括例如编码序列、调节序列、基因表达单元。
207.gene-writer
tm
基因组编辑器
208.本发明提供了可用于例如通过对包含可被重组酶多肽结合的同源识别序列的两个dna序列进行重组来修饰或操纵dna序列的重组酶多肽(例如,酪氨酸重组酶多肽,例如,如表1或2中所列)。在一些实施例中,gene writer
tm
基因编辑器系统可以包含:(a)多肽或编码多肽的核酸,其中该多肽包含(i)含有重组酶活性的结构域,和(ii)含有dna结合功能的结构域(例如,dna识别结构域,其例如结合或能够结合识别序列,例如,如本文所述);以及(b)插入dna,其包含(i)结合多肽的序列(例如,如本文所述的识别序列)和任选地(ii)对象序列(例如,异源对象序列)。在一些实施例中,含有重组酶活性的结构域和含有dna结合功能的结构域是相同的结构域。例如,gene writer基因组编辑器蛋白可包含dna结合结构域和重组酶结构域。在某些实施例中,gene writer
tm
基因编辑器多肽的元件可以源自重组酶多肽(例如,酪氨酸重组酶)的序列,例如,如本文所述,例如,如表1或2中所列。在一些实施例中,gene writer基因组编辑器与第二多肽组合。在一些实施例中,第二多肽源自重组酶多肽(例如,酪氨酸重组酶),例如,如本文所述,例如,如表1或2中所列。
209.gene writer基因编辑器系统的重组酶多肽组分
210.可用于本文所述的系统、细胞和方法的示例性重组酶多肽家族包括酪氨酸重组酶。通常,酪氨酸重组酶是催化两个识别序列之间的位点特异性重组的酶。这两个识别序列可以例如在同一核酸(例如,dna)分子上,或可以存在于两个分开的核酸(例如,dna)分子中。在一些实施例中,酪氨酸重组酶多肽包含两个结构域,即包含dna接触位点的n末端结构域和包含活性位点的c末端结构域。
211.酪氨酸重组酶通常通过两个重组酶多肽单体与每个识别序列的伴随结合来起作用,这样四个单体参与单个重组酶反应。如例如gaj等人(2014;biotechnol.bioeng.[生物技术与生物工程]111(1):1-15;通过引用以其全文并入本文)所述,在每对酪氨酸重组酶单体与识别序列结合后,与dna结合的二聚体随后会经历dna链断裂、链交换和重新连接以形成霍利迪(holliday)连结体中间体,然后再进行一轮dna链断裂和连接以形成重组链。酪氨酸重组酶的非限制性实例包括cre重组酶和flp重组酶,以及表1或2中所列的重组酶多肽。
[0212]
本领域技术人员可以例如通过使用常规序列分析工具(如基本局部比对搜索工具(blast)或cd-搜索(cd-search)(用于保守结构域分析)),来确定重组酶多肽(例如,酪氨酸重组酶)及其结构域的核酸和对应的多肽序列。其他序列分析工具是已知的并且可以在例如https://molbiol-tools.ca,例如在https://molbiol-tools.ca/motifs.htm上找到。
[0213]
示例性重组酶多肽
[0214]
在一些实施例中,gene writer
tm
基因编辑器系统包含重组酶多肽(例如,酪氨酸重
组酶多肽),例如,如本文所述。通常,重组酶多肽(例如,酪氨酸重组酶多肽)特异性结合核酸识别序列并在识别序列内的位点(例如,识别序列内的核心序列)处催化重组反应。在一些实施例中,重组酶多肽对识别序列或其部分(例如,其核心序列)与另一个核酸序列(例如,包含同源识别序列和任选地对象序列(例如,异源对象序列)的插入dna)之间的重组进行催化。例如,重组酶多肽(例如,酪氨酸重组酶多肽)可以催化重组反应,使对象序列或其部分插入另一个核酸分子(例如,基因组dna分子,例如,染色体或线粒体dna)。
[0215]
以下表1提供了示例性双向酪氨酸重组酶多肽氨基酸序列(见第1列),及其对应的dna识别序列(见第2列和第3列),这些序列借助生物信息学手段鉴定。表1和2包含先前未被鉴定为双向酪氨酸重组酶的氨基酸序列,并且还包括酪氨酸重组酶的对应dna识别序列,这些酪氨酸重组酶的dna识别序列先前是未知的。表1的第1列中各登录号的氨基酸序列通过引用以其全文特此并入。
[0216]
更具体而言,第2列提供天然dna识别序列(例如,来自细菌或古细菌),并且第3列提供该行所列重组酶的对应人dna识别序列。第4列表示第3列的人dna识别序列的基因组位置。第5列提供了人dna识别序列的安全港评分,表示位点所满足的安全港标准的数目。
[0217]
表1的dna识别序列具有以下结构域:第一副回文序列、核心序列和第二副回文序列。在不希望受理论约束的情况下,在一些实施例中,酪氨酸重组酶基于副回文区(第一和第二副回文序列)识别dna识别序列,并且对核心序列没有任何特定的序列要求。因此,在一些实施例中,酪氨酸重组酶可以将dna插入人基因组中的靶位点,其中该靶位点具有可能与天然核心序列实质性或完全趋异的核心序列。因此,表1第2列包括这些位置上的n。在一些实施例中,可以选择插入dna中的核心重叠序列以至少部分地与人基因组中的对应序列相匹配。在一些实施例中,重组酶仅具有单个人dna识别序列。
[0218]
表1.示例性酪氨酸重组酶、对应的识别序列、其人基因组位置、以及基因组位置的安全港评分。如dna序列中所列,“n”可以是任何核苷酸(例如,a、c、g、或t中的任一个)。
[0219]
[0220]
[0221]
[0222]
[0223]
[0224]
[0225]
[0226]
[0227]
[0228]
[0229]
[0230]
[0231]
[0232]
[0233]
[0234]
[0235]
[0236]
[0237]
[0238]
[0239]
[0240]
[0241]
[0242]
[0243]
[0244]
[0245]
[0246]
[0247]
[0248]
[0249]
[0250]
[0251]
[0252]
[0253]
[0254]
[0255]
[0256]
[0257]
[0258]
[0259]
[0260][0261]
酪氨酸重组酶的氨基酸序列的非限制性实例在表1的第1列中按登录号提供。表1在第2列中进一步提供了给定示例性酪氨酸重组酶结合的一个或多个示例性天然非人(例如细菌、病毒或古细菌)识别序列。表1中所列的每个天然识别序列典型地包含三个区段:(i)第一副回文序列,(ii)通常不包括确定的核酸序列的间隔子(例如,核心序列),和(iii)第二副回文序列,其中该第一和第二副回文序列相对于彼此是副回文的。表1在第3列中进一步提供了人基因组中每个示例性酪氨酸重组酶的一个或多个示例性识别序列。通常,表1的第3列中所列的人识别序列各自包含三个区段:(i)第一副回文序列,(ii)通常包括确定的核酸序列的间隔子(例如,核心序列),和(iii)第二副回文序列,其中该第一和第二副回文序列相对于彼此是副回文的。表1在第4列中包括人基因组中示例性人识别序列的基因组位置。
[0262]
表2.表1的酪氨酸重组酶的氨基酸序列。
[0263]
[0264]
[0265]
[0266]
[0267]
[0268]
[0269]
[0270]
[0271]
[0272]
[0273]
[0274]
[0275]
[0276]
[0277]
[0278]
[0279]
[0280]
[0281]
[0282]
[0283]
[0284]
[0285]
[0286]
[0287]
[0288]
[0289]
[0290]
[0291]
[0292]
[0293]
[0294]
[0295]
[0296]
[0297]
[0298]
[0299]
[0300]
[0301]
[0302]
[0303]
[0304]
[0305]
[0306]
[0307]
[0308]
[0309]
[0310]
[0311]
[0312]
[0313]
[0314]
[0315]
[0316]
[0317]
[0318]
[0319]
[0320]
[0321]
[0322]
[0323]
[0324]
[0325]
[0326]
[0327]
[0328]
[0329]
[0330]
[0331]
[0332]
[0333]
[0334]
[0335]
[0336]
[0337]
[0338]
[0339]
[0340]
[0341]
[0342]
[0343]
[0344][0345]
在一些实施例中,重组酶多肽(例如,如本文所述的系统或细胞中包含的重组酶多肽)包含如表2中所列的氨基酸序列,或与如表2中所列的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%序列同一性的氨基酸序列,或相对于如表2中所列的氨基酸序列具有不超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、或50个序列改变(例如,取代、插入或缺失)的氨基酸序列。在一些实施例中,重组酶多肽(例如,如本文所述的系统或细胞中包含的重组酶多肽)或其部分与如表2中所列的重组酶多肽的dna结合结构域、重组酶正常结构域、n末端结构域和/或c末端结构域的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%序列同一性,或相对于该氨基酸序列具有不超过1、2、3、4、5、6、7、8、9、或10个序列改变(例如,取代、插入或缺失)。在一些实施例中,重组酶多肽(例如,如本文所述的系统或细胞中包含的重组酶多肽)具有如下重组酶多肽的dna结合活性和/或重组酶活性中的一种或多种,该重组酶多肽包含如表2中所列的氨基酸序列,或与如表2中所列的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%序列同一性的氨基酸序列,或相对于如表2中所列的氨基酸序列具有不超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、或50个序列改变(例如,取代、插入或缺失)的氨基酸序列。
[0346]
在一些实施例中,插入dna(例如,如本文所述的系统或细胞中包含的插入dna)包含如表1的第2列或第3列中所列的核酸识别序列,或与该核酸识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于该核酸识别序列具有不超过1、2、3、4、5、6、7、或8个序列改变(例如,取代、插入或缺失)的核酸序列。在一些实施例中,插入dna(例如,如本文所述的系统或细胞中包含的插入dna)包含如表1的第2列或第3列中所列的核酸识别序列的一个或多个(例如,两个)副回文序列,或与该一个或多个副回文序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于该一个或多个副回文序列具有不超过1、2、3、4、5、6、7、或8个序列改变(例如,取代、插入或缺失)的核酸序列。在一些实施例中,插入dna(例如,如本文所述的系统或细胞中包含的插入dna)包含如表1的第3列中所列的核酸识别序列的间隔子(例如,核心序列),或与该间隔子具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于该间隔子具有不超过1、2、3、4、5、6、7、或8个序列改变(例如,取代、插入或缺失)的核酸序列。在某些实施例中,插入dna进一步包含异源对象序列。
[0347]
在一些实施例中,插入dna(例如,如本文所述的系统或细胞中包含的插入dna)包含如表1的第2列或第3列中所列的核酸识别序列,或与该核酸识别序列具有至少70%、
75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于该核酸识别序列具有不超过1、2、3、4、5、6、7、或8个序列改变(例如,取代、插入或缺失)的核酸序列,即人识别序列的同源识别序列(例如,如表1的第3列中所列,例如,在与第2列中列出核酸识别序列的行相同的行中),或与该同源识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于该同源识别序列具有不超过1、2、3、4、5、6、7、或8个序列改变(例如,取代、插入或缺失)的核酸序列。在某些实施例中,同源人识别序列位于人基因组中表1的第4列中所列的位置处(例如,与第3列的同一行中所列的同源人识别序列对应)。
[0348]
在一些实施例中,用于本文所述的组合物或方法的插入dna或重组酶多肽引导异源对象序列插入安全港评分为至少3、4、5、6、7、或8的位置。在一些实施例中,用于本文所述的组合物或方法的插入dna或重组酶多肽引导异源对象序列插入唯一的、在人基因组中有1个拷贝的基因组安全港位点。举例来说,唯一的位点能以1个拷贝存在于单倍体人基因组中,这样二倍体细胞可以包含位于同源染色体对上的2个拷贝的位点。作为另一个实例,唯一的位点能以1个拷贝存在于二倍体人基因组中,这样二倍体细胞包含位于同源染色体对的仅一条染色体上的1拷贝的位点。
[0349]
在一些实施例中,与核心序列直接相邻的副回文序列中的三个碱基对(“核心相邻基序”)包含aaa、aga、ata或taa。在一些实施例中,核心相邻基序包含至少一个a(例如,包含2或3个a)。在一些实施例中,核心相邻基序是ana或naa(其中n是任何核苷酸)。在一些实施例中,本文所述的dna识别位点包含第一副回文序列中的第一核心相邻基序和第二副回文序列中的第二核心相邻基序。在一些实施例中,第一核心相邻基序和第二核心相邻基序具有相同的核苷酸序列,而在其他实施例中,第一核心相邻基序和第二核心相邻基序具有不同的序列。
[0350]
在一些实施例中,与人dna识别序列相比,插入dna上的dna识别序列具有0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个错配。在不希望受理论约束的情况下,在一些实施例中,考虑dna识别序列之间的错配可以使重组酶活性更倾向于整合而非切除,例如,如araki等人,nucleic acids research[核酸研究],1997,第25卷,第4期,868-872中所述,该文献通过引用以其全文并入本文。在一些实施例中,与由重组酶多肽识别的天然识别序列相比,插入dna上的dna识别序列和/或人dna识别序列各自包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个错配。在某些实施例中,插入dna与人dna识别序列之间的重组导致整合的核酸分子的形成,该整合的核酸分子包含位于整合序列(例如,异源对象序列)侧翼的两个识别序列。在某些实施例中,与以下中的一项或多项(例如,一项、两项或全部三项)相比,整合的核酸分子的两个识别序列中的一个或两个包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个错配:(i)天然识别序列,(ii)插入dna上的识别序列,和/或(iii)人dna识别序列。在一些实施例中,错配全部存在于同一副回文序列上。在一些实施例中,错配存在于不同副回文序列上。在实施例中,与天然识别序列相比,整合的核酸分子的两个识别序列中的一个或两个包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个错配。在一些实施例中,错配存在于核心序列中。在一些实施例中,考虑整合的核酸分子的一个或多个识别序列与天然识别序列、插入dna识别序列、和/或人dna识别序列之间的这些差异使得与整合的核酸分子的一个或多个识别序列和天然识别序列相比,重组酶多肽与整合的核酸分子的
识别序列之间的结合亲和力减小。
[0351]
在一些实施例中,人识别序列(例如,人dna识别序列,例如,如表1的第3列中所列)位于基因组安全港位点中或附近(例如,在基因组安全港位点的1、2、3、4、5、10、15、20、30、40、50、75、100、150、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、或10,000个核苷酸内)。在一些实施例中,人识别序列位于基因组中某一位置,该位置满足以下标准中的1、2、3、4、5、6、7、8或9项:(i)距癌症相关基因》300kb;(ii)距mirna/其他功能性小rna》300kb;(iii)距5’基因末端》50kb;(iv)距复制起点》50kb;(v)距任何极保守元件》50kb;(vi)转录活性低(即无mrna /-25kb);(vii)不在拷贝数可变区中;(viii)在开放染色质中;和/或(ix)是唯一的,在人基因组中有1个拷贝。在一些实施例中,表1的第4列中所列的基因组位置位于基因组安全港位点中或附近(例如,在基因组安全港位点的1、2、3、4、5、10、15、20、30、40、50、75、100、150、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、或10,000个核苷酸内)。在一些实施例中,表1的第4列中所列的基因组位置位于基因组中某一位置,该位置满足以下标准中的1、2、3、4、5、6、7、8或9项:(i)距癌症相关基因》300kb;(ii)距mirna/其他功能性小rna》300kb;(iii)距5’基因末端》50kb;(iv)距复制起点》50kb;(v)距任何极保守元件》50kb;(vi)转录活性低(即无mrna /-25kb);(vii)不在拷贝数可变区中;(viii)在开放染色质中;和/或(ix)是唯一的,在人基因组中有1个拷贝。
[0352]
在实施例中,如本文所述的细胞或系统包含以下中的一项或多项(例如,1、2、或3项):(i)如表1或2的第1列的单行中所列的重组酶多肽,或与该重组酶多肽具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%序列同一性的氨基酸序列;(ii)插入dna,其包含如表1的第2列和同一行中所列的dna识别序列,或与该dna识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于该dna识别序列具有不超过1、2、3、或4个序列改变(例如,取代、插入、或缺失)的核酸序列,任选地其中该插入dna进一步包含对象序列(例如,异源对象序列);和/或(iii)基因组,其包含如表1的第3列和同一行中所列的人dna识别序列,或与该人dna识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于该人dna识别序列具有不超过1、2、3、或4个序列改变(例如,取代、插入、或缺失)的核酸序列;优选地其中该人dna识别序列位于该基因组中表1的第4列中和与人dna识别序列列表相对应的同一行中所列的位置处。
[0353]
在一些实施例中,如本文所述的gene writing
tm
系统的一种或多种蛋白质组分可以与模板(例如,dna模板)预先缔合。例如,在一些实施例中,可以首先将gene writer
tm
多肽与dna模板组合以形成脱氧核糖核蛋白(dnp)复合物。在一些实施例中,dnp可经由例如转染、核转染、病毒、囊泡、lnp、外泌体、融合体递送至细胞。有关dnp递送的另外的描述例如在以下中找到:guha和calos j mol biol[分子生物学杂志](2020),该文献通过引用以其全文并入本文。
[0354]
在一些实施例中,本文所述的多肽包含一个或多个(例如,2、3、4、5个)核靶向序列,例如核定位序列(nls)。在一些实施例中,nls是两组分nls。在一些实施例中,nls促进了包含nls的蛋白质导入到细胞核中。在一些实施例中,将nls与本文所述的gene writer的n末端融合。在一些实施例中,将nls与gene writer的c末端融合。在一些实施例中,将nls与cas结构域的n末端或c末端融合。在一些实施例中,在nls与gene writer的邻近结构域之间
布置接头序列。
[0355]
在一些实施例中,nls包含氨基酸序列mdsllmnrrkflyqfknvrwakgrretylc(seq id no:1822)、pkkrkvegadkrtadgsefespkkkrkv(seq id no:1823)、rksgkiaaiwkrprkpkkkrkv krtadgsefespkkkrkv(seq id no:1824)、kktelqttnaenktkkl(seq id no:1825)、或krgindrnfwrgengrktr(seq id no:1826)、krpaatkkagqakkkk(seq id no:1827),或其功能性片段或变体。示例性nls序列还描述于pct/ep 2000/011690中,该专利的内容针对其对示例性核定位序列的披露通过引用并入本文。
[0356]
在一些实施例中,nls是两组分nls。两组分nls典型地包含由间隔子序列(其长度可以是例如约10个氨基酸)间隔开的两个碱性氨基酸簇。单组分nls典型地缺乏间隔子。两组分nls的实例是核浆素nls,具有序列kr[paatkkagqa]kkkk(seq id no:1828),其中间隔子置于括号内。另一个示例性两组分nls具有序列pkkkrkvegadkrtadgsefespkkkrkv(seq id no:1829)。示例性nls描述于国际申请wo 2020051561中,该申请通过引用以其全文并入本文,包括其关于核定位序列的披露。
[0357]
dna结合结构域
[0358]
在一些实施例中,重组酶多肽(例如,如本文所述的系统或细胞中包含的重组酶多肽),例如酪氨酸重组酶,包含dna结合结构域(例如,靶结合结构域或模板结合结构域)。
[0359]
在一些实施例中,本文所述的重组酶多肽可被重新定向至人基因组中的确定的靶位点。在一些实施例中,可以将本文所述的重组酶与异源结构域(例如,异源dna结合结构域)融合。在一些实施例中,可以将重组酶与异源dna结合结构域(例如,来自锌指、tal、大范围核酸酶、转录因子或序列指导的dna结合元件的dna结合结构域)融合。在一些实施例中,可以将重组酶与来自序列指导的dna结合元件(例如,crispr相关的(cas)dna结合元件,例如,cas9)的dna结合结构域融合。在一些实施例中,与重组酶结构域融合的dna结合元件可以含有使其他催化功能失活的突变,例如,使内切核酸酶活性失活的突变,例如,产生失活的大范围核酸酶或部分或完全失活的cas蛋白的突变,例如,产生切口酶cas9或失活cas9(dcas9)的突变。
[0360]
在一些实施例中,dna结合结构域包含酿脓链球菌(streptococcus pyogenes)cas9(spcas9)或其功能性片段或变体。在一些实施例中,dna结合结构域包含经修饰的spcas9。在实施例中,经修饰的spcas9包含改变了原间隔子邻近基序(pam)特异性的修饰。在实施例中,pam对核酸序列5
’‑
ngt-3’具有特异性。在实施例中,经修饰的spcas9包含例如在位置l1111、d1135、g1218、e1219、a1322、或r1335中的一个或多个处的一个或多个氨基酸取代,例如,该一个或多个氨基酸取代选自l1111r、d1135v、g1218r、e1219f、a1322r、r1335v。在实施例中,经修饰的spcas9包含氨基酸取代t1337r和一个或多个另外的氨基酸取代,例如,该一个或多个另外的氨基酸取代选自l1111、d1135l、s1136r、g1218s、e1219v、d1332a、d1332s、d1332t、d1332v、d1332l、d1332k、d1332r、r1335q、t1337、t1337l、t1337q、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337h、t1337q、和t1337m,或其对应的氨基酸取代。在实施例中,经修饰的spcas9包含:(i)一个或多个氨基酸取代,其选自d1135l、s1136r、g1218s、e1219v、a1322r、r1335q、和t1337;以及(ii)一个或多个氨基酸取代,其选自l1111r、g1218r、e1219f、d1332a、d1332s、d1332t、d1332v、d1332l、d1332k、d1332r、t1337l、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337r、t1337h、t1337q、和
t1337m,或这些所列举氨基酸取代的对应的氨基酸取代。
[0361]
在一些实施例中,dna结合结构域包含cas结构域、例如cas9结构域。在实施例中,dna结合结构域包含核酸酶活性cas结构域、cas切口酶(ncas)结构域、或核酸酶非活性cas(dcas)结构域。在实施例中,dna结合结构域包含核酸酶活性cas9结构域、cas9切口酶(ncas9)结构域、或核酸酶非活性cas9(dcas9)结构域。在一些实施例中,dna结合结构域包含cas9(例如,dcas9和ncas9)的cas9结构域、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、或cas12i。
[0362]
在一些实施例中,dna结合结构域包含cas9(例如,dcas9和ncas9)、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、或cas12i。在一些实施例中,dna结合结构域包含酿脓链球菌或嗜热链球菌(s.thermophilus)cas9或其功能性片段。在一些实施例中,dna结合结构域包含cas9序列,例如,如chylinski,rhun,和charpentier(2013)rnabiology[rna生物学]10:5,726-737中所述;该文献通过引用并入本文。在一些实施例中,dna结合结构域包含cas(例如,cas9,例如,如本文所述)的hnh核酸酶亚结构域和/或ruvc1亚结构域,或其变体。在一些实施例中,dna结合结构域包含cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、或cas12i。在一些实施例中,dna结合结构域包含cas多肽(例如,酶)或其功能性片段。在实施例中,cas多肽(例如,酶)选自cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas8a、cas8b、cas8c、cas9(例如,csn1或csx12)、cas10、cas10d、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csx11、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、ii型cas效应子蛋白、v型cas效应子蛋白、vi型cas效应子蛋白、carf、ding、cpf1、cas12b/c2c1、cas12c/c2c3、cas12b/c2c1、cas12c/c2c3、spcas9(k855a)、espcas9(1.1)、spcas9-hf1、超精确的cas9变体(hypacas9)、其同源物、其经修饰的或经工程化的版本、和/或其功能性片段。在实施例中,cas9包含例如选自h840a、d10a、p475a、w476a、n477a、d1125a、w1126a、和d1127a的一个或多个取代。在实施例中,cas9包含在选自以下的位置处的一个或多个突变:d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986、和/或a987,例如,选自d10a、g12a、g17a、e762a、h840a、n854a、n863a、h982a、h983a、a984a、和/或d986a的一个或多个取代。在一些实施例中,dna结合结构域包含来自溃疡棒状杆菌(corynebacterium ulcerans)、白喉棒状杆菌(corynebacterium diphtheria)、食蚜螺菌(spiroplasma syrphidicola)、中间普雷沃菌(prevotella intermedia)、台湾螺原体(spiroplasma taiwanense)、鱼型链球菌(streptococcus iniae)、波罗的海贝尔氏菌(belliella baltica)、扭曲冷弯曲菌(psychroflexus torquis)、嗜热链球菌、英诺克李斯特菌(listeria innocua)、空肠弯曲菌(campylobacter jejuni)、脑膜炎奈瑟菌(neisseria meningitidis)、酿脓链球菌、或金黄色葡萄球菌(staphylococcus aureus)的cas(例如,cas9)序列、或其片段或变体。
[0363]
在一些实施例中,dna结合结构域包含例如包含一个或多个取代(例如,在位置d917、e1006a、d1255处)或其任何组合的cpf1结构域,该一个或多个取代例如选自d917a、
e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a、和d917a/e1006a/d1255a。
[0364]
在一些实施例中,dna结合结构域包含spcas9、spcas9-vrqr、spcas9-vrer、xcas9(sp)、sacas9、sacas9-kkh、spcas9-mqkser、spcas9-lrkiqk、或spcas9-lrvsql。
[0365]
在一些实施例中,dna结合结构域包含如以下表3中所列的氨基酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%、或99%序列同一性的氨基酸序列。在一些实施例中,dna结合结构域包含如下氨基酸序列,该氨基酸序列相对于本文所述的氨基酸序列中的任一个具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50个差异(例如,突变)。
[0366]
表3.参考序列中的每一个通过引用以其全文并入。
[0367]
[0368]
[0369]
[0370][0371]
在一些实施例中,cas多肽结合引导dna结合的grna。在一些实施例中,grna例如从5’至3’包含:(1)grna间隔子;(2)grna支架。在一些实施例中:
[0372]
(1)是约18-22 nt(例如,20 nt)的cas9间隔子。
[0373]
(2)是包含一个或多个发夹环(例如,1、2、或3个环)的grna支架,用于使模板与切口酶cas9结构域缔合。在一些实施例中,grna支架携带序列,从5’至3’为
[0374][0375]
在一些实施例中,本文所述的gene writing系统用于在hek293、k562、u2os、或hela细胞中进行编辑。在一些实施例中,gene writing系统用于在原代细胞(例如,来自e18.5小鼠的原代皮层神经元)中进行编辑。
[0376]
在一些实施例中,本文所述的系统或方法涉及美国专利申请公开号20200063126、20190002889、或20190002875(其中每个通过引用以其全文并入本文)中描述的crispr dna靶向酶或系统或其功能性片段或变体。例如,在一些实施例中,本文所述的genewriter多肽或cas内切核酸酶包含本段中提及的任何申请的多肽序列,并且在一些实施例中,指导rna包含本段中提及的任何申请的核酸序列。
[0377]
在一些实施例中,dna结合结构域(例如,靶结合结构域或模板结合结构域)包含大范围核酸酶结构域、或其功能性片段。在一些实施例中,大范围核酸酶结构域具有内切核酸酶活性、例如双链切割和/或切口酶活性。在其他实施例中,大范围核酸酶结构域具有降低的活性,例如,缺乏内切核酸酶活性,例如,该大范围核酸酶无催化活性。在一些实施例中,无催化活性的大范围核酸酶用作dna结合结构域,例如,如fonfara等人nucleic acids res[核酸研究]40(2):847-860(2012)中所述,该文献通过引用以其全文并入本文。在实施例中,该dna结合结构域相对于野生型dna结合结构域包含一个或多个修饰、例如经由定向进化(例如,噬菌体辅助的连续进化(pace))的修饰。
[0378]
内含肽
[0379]
在一些实施例中,如下文更详细地描述的,可以例如在第一结构域将内含肽-n与本文所述的多肽(例如,gene writer多肽)的n末端部分融合。在实施例中,可以将内含肽-c与本文所述的多肽的c末端部分融合(例如,在第二结构域),例如,以便将n末端部分与c末端部分连接,从而将第一和第二结构域连接。在一些实施例中,第一和第二结构域各自独立
地选自dna结合结构域和催化结构域、例如重组酶结构域。在一些实施例中,使用本文所述的内含肽策略使单个结构域断裂,例如,dna结合结构域,例如,dcas9结构域。
[0380]
在一些实施例中,本文所述的系统或方法涉及内含肽,该内含肽是自我剪接蛋白质内含子(例如,肽),例如,其连接侧翼n末端和c末端外显肽(例如,待连接的片段)。在一些情况下,内含肽可以包含蛋白质的片段,该片段能够在称为蛋白质剪接的过程中自我切除并将剩余的片段(外显肽)与肽键连接。内含肽也称为“蛋白质内含子”。本文将内含肽自我切除并将蛋白质的剩余部分连接的过程称为“蛋白质剪接”或“内含肽介导的蛋白质剪接”。在一些实施例中,前体蛋白(在内含肽介导的蛋白质剪接之前的含内含肽的蛋白质)的内含肽来自两个基因。这种内含肽在本文称为断裂内含肽(例如,断裂内含肽-n和断裂内含肽-c)。例如,在蓝细菌中,dna聚合酶iii的催化亚基a(即dnae)由两个分开的基因dnae-n和dnae-c编码。由dnae-n基因编码的内含肽在本文可以称为“内含肽-n”。由dnae-c基因编码的内含肽在本文可以称为“内含肽-c”。
[0381]
内含肽用于连接异源蛋白质片段的用途描述于例如wood等人,j.biol.chem.[生物化学杂志]289(21);14512-9(2014)(通过引用以其全文并入本文)中。例如,当与分开的蛋白质片段融合时,内含肽intn和intc可以彼此识别,自我剪除,和/或同时连接它们所融合的蛋白质片段的侧翼n末端和c末端外显肽,从而从两个蛋白质片段重构全长蛋白质。
[0382]
在一些实施例中,使用基于dnae内含肽的合成内含肽,即cfa-n(例如,断裂内含肽-n)和cfa-c(例如,断裂内含肽-c)内含肽对。此类内含肽的实例已描述于例如stevens等人,j am chem soc.[美国化学学会杂志]2016年2月24日;138(7):2162-5(通过引用以其全文并入本文)中。根据本披露可以使用的内含肽对的非限制性实例包括:cfa dnae内含肽、ssp gyrb内含肽、ssp dnax内含肽、ter dnae3内含肽、ter thyx内含肽、rma dnab内含肽和cne prp8内含肽(例如,如美国专利号8,394,604中所述,该专利通过引用并入本文)。
[0383]
在一些实施例中,可以将内含肽-n和内含肽-c分别与断裂cas9的n末端部分和断裂cas9的c末端部分融合,以便将断裂cas9的n末端部分和断裂cas9的c末端部分连接。例如,在一些实施例中,将内含肽-n与断裂cas9的n末端部分的c末端融合,即形成n—[断裂cas9的n末端部分]-[内含肽-n]~c的结构。在一些实施例中,将内含肽-c与断裂cas9的c末端部分的n末端融合,即形成n-[内含肽-c]~[断裂cas9的c末端部分]-c的结构。用于连接与内含肽融合的蛋白质(例如,断裂cas9)的内含肽介导的蛋白质剪接的机制描述于shah等人,chem sci.[化学科学]2014;5(l):446-46l中,该文献通过引用并入本文。用于设计和使用内含肽的方法在本领域已知,并且例如由wo 2020051561、w0 2014004336、wo 2017132580、us 20150344549、和us 20180127780进行了描述,其中每个通过引用以其全文并入本文。
[0384]
在一些实施例中,断裂是指分成两个或更多个片段。在一些实施例中,断裂cas9蛋白或断裂cas9包含cas9蛋白,该蛋白作为由两个分开的核苷酸序列编码的n末端片段和c末端片段来提供。可以对与cas9蛋白的n末端部分和c末端部分对应的多肽进行剪接以形成重构的cas9蛋白。在实施例中,将cas9蛋白在该蛋白的无序区内分成两个片段,例如,如nishimasu等人,cell[细胞],第156卷,第5期,第935-949页,2014中所述,或如jiang等人(2016)science[科学]351:867-871和pdb文件:5f9r中所述(其中每个通过引用以其全文并入本文)。无序区域可通过本领域已知的一种或多种蛋白质结构测定技术测定,包括但不限
于x射线晶体学、nmr光谱学、电子显微术(例如,cryoem)和/或计算机模拟蛋白质建模。在一些实施例中,将蛋白质在例如氨基酸a292-g364、f445-k483、或e565-t637之间的spcas9的区域内的任何c、t、a、或s处,或在任何其他cas9、cas9变体(例如,ncas9、dcas9)或其他napdnabp中的对应位置处分成两个片段。在其他实施例中,将蛋白质在spcas9 t310、t313、a456、s469、或c574处分成两个片段。在一些实施例中,将蛋白质分成两个片段的过程称为对蛋白质的断裂。
[0385]
在一些实施例中,蛋白质片段的长度范围为约2-1000个氨基酸(例如,2-10、10-50、50-100、100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、或900-1000个之间的氨基酸)。在一些实施例中,蛋白质片段的长度范围为约5-500个氨基酸(例如,5-10、10-50、50-100、100-200、200-300、300-400、或400-500个之间的氨基酸)。在一些实施例中,蛋白质片段的长度范围为约20-200个氨基酸(例如,20-30、30-40、40-50、50-100、或100-200个之间的氨基酸)。
[0386]
在一些实施例中,将gene writer多肽的部分或片段,例如,如本文所述,与内含肽融合。可以将核酸酶与内含肽的n末端或c末端融合。在一些实施例中,将融合蛋白的部分或片段与内含肽融合并与aav衣壳蛋白融合。可以将内含肽、核酸酶和衣壳蛋白以任何排列方式(例如,核酸酶-内含肽-衣壳、内含肽-核酸酶-衣壳、衣壳-内含肽-核酸酶等)融合在一起。在一些实施例中,将内含肽的n末端与融合蛋白的c末端融合,并将内含肽的c末端与aav衣壳蛋白的n末端融合。
[0387]
在一些实施例中,将gene writer多肽(例如,包含切口酶cas9结构域的多肽)与内含肽-n融合,并将包含聚合酶结构域的多肽与内含肽-c融合。
[0388]
以下提供了内含肽的示例性核苷酸和氨基酸序列:
[0389]
dnae内含肽-n dna:
[0390][0391]
dnae内含肽-n蛋白质:
[0392][0393]
dnae内含肽-c dna:
[0394][0395]
内含肽-c:
[0396][0397]
cfa-n dna:
[0398][0399]
cfa-n蛋白质:
[0400][0401]
cfa-c dna:
[0402][0403]
cfa-c蛋白质:
[0404][0405]
插入dna
[0406]
在一些实施例中,如本文所述的插入dna包含如下核酸序列,该核酸序列可以例如通过重组酶多肽(例如,酪氨酸重组酶多肽)整合到靶dna分子中,例如,如本文所述。插入dna典型地能够结合系统的一个或多个重组酶多肽(例如,重组酶多肽的多个拷贝)。在一些实施例中,插入dna包含如下区域,该区域能够结合重组酶多肽(例如,如本文所述的识别序列)。
[0407]
在一些实施例中,插入dna可以包含用于插入靶dna的对象序列。对象序列可以是编码的或非编码的。在一些实施例中,对象序列可以包含开放阅读框。在一些实施例中,插入dna包含科扎克(kozak)序列。在一些实施例中,插入dna包含内部核糖体进入位点。在一些实施例中,插入dna包含自切割肽,例如t2a或p2a位点。在一些实施例中,插入dna包含起始密码子。在一些实施例中,插入dna包含剪接受体位点。在一些实施例中,插入dna包含剪接供体位点。在一些实施例中,插入dna例如在终止密码子的下游包含微小rna结合位点。在一些实施例中,插入dna例如在开放阅读框的终止密码子下游包含聚a尾。在一些实施例中,插入dna包含一个或多个外显子。在一些实施例中,插入dna包含一个或多个内含子。在一些实施例中,插入dna包含真核转录终止子。在一些实施例中,插入dna包含增强的翻译元件或翻译增强元件。在一些实施例中,插入dna包含微小rna序列、sirna序列、指导rna序列、piwi rna序列。在一些实施例中,插入dna包含由至少一个可操作地连接至效应子序列的调节区构成的基因表达单元。效应子序列可以是转录成rna的序列(例如,编码序列或非编码序列,例如编码微小rna的序列)。在一些实施例中,对象序列可以含有非编码序列。例如,插入dna可以包含启动子或增强子序列。在一些实施例中,插入dna包含组织特异性启动子或增强子,其中的每个可以是单向的或双向的。在一些实施例中,启动子是rna聚合酶i启动子、rna聚合酶ii启动子或rna聚合酶iii启动子。在一些实施例中,启动子包含tata元件。在一些实施例中,启动子包含b识别元件。在一些实施例中,启动子具有针对转录因子的一个或多个结合位点。
[0408]
在一些实施例中,将插入dna的对象序列插入靶基因组的内源内含子中。在一些实
施例中,将插入dna的对象序列插入靶基因组中,从而充当新的外显子。在一些实施例中,将对象序列插入靶基因组导致天然外显子的替换或天然外显子的跳过。在一些实施例中,将插入dna的对象序列插入靶基因组的基因组安全港位点中,例如aavs1、ccr5、或rosa26中。在一些实施例中,将插入dna的对象序列添加到基因组的基因间区域或基因内区域中。在一些实施例中,将插入dna的对象序列添加到基因组的内源活性基因的5’或3’的0.1kb、0.25kb、0.5kb、0.75、kb,1kb、2kb、3kb、4kb、5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb之内。在一些实施例中,将插入dna的对象序列添加到基因组的内源启动子或增强子的5’或3’的0.1kb、0.25kb、0.5kb、0.75、kb、1kb、2kb、3kb、4kb,5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb之内。在一些实施例中,插入dna的对象序列可以是例如在50-50,000个碱基对之间(例如,在50-40,000bp之间,在500-30,000bp之间,在500-20,000bp之间,在100-15,000bp之间,在500-10,000bp之间,在50-10,000bp之间,在50-5,000bp之间)。在一些实施例中,插入dna的对象序列可以是例如1-50个碱基对(例如,在1-10、10-20、20-30、30-40、或40-50个碱基对之间)。
[0409]
在某些实施例中,可以鉴定、设计、工程化和构建插入dna,以包含改变或指定靶细胞或靶生物的基因组功能的序列,例如通过将异源编码区引入基因组;影响或引起外显子结构/替代性剪接;引起内源基因的破坏;引起内源基因的转录激活;引起内源dna的表观遗传调节;引起可操作地连接的基因上调或下调,等等。在某些实施例中,可以将插入dna工程化以包含编码外显子和/或转基因的序列,提供与转录因子激活剂、阻遏物、增强子等及其组合的结合位点。在其他实施例中,编码序列可以进一步用剪接受体位点、聚a尾定制。
[0410]
插入dna可与靶dna具有某种同源性。在一些实施例中,插入dna具有与靶dna或其部分完全同源的至少3、4、5、6、7、8、9、10或更多个碱基。在一些实施例中,插入dna具有与靶dna或其部分至少50%、60%、70%、80%、85%、90%、95%、97%、98%、99%或100%同源的至少10、15、20、25、30、40、50、60、80、100、120、140、160、180、200或更多个碱基。
[0411]
作为本文所述的其他递送方法的替代方案,在一些实施例中,递送至细胞的核酸(例如,编码重组酶的核酸、或模板核酸,或两者)被设计为微环,其中与gene writing
tm
不相关的质粒主链序列在施用于细胞之前被去除。已经证明与主链含有细菌部分(例如,细菌复制起点、抗生素选择盒)的质粒相比,微环可实现更高的转染效率和基因表达,并已被用于提高转座效率(sharma等人mol ther nucleic acids[分子治疗-核酸]2:e74(2013))。在一些实施例中,编码gene writer
tm
多肽的dna载体以微环形式递送。在一些实施例中,含有gene writer
tm
模板的dna载体以微环形式递送。在用于递送核酸的此类替代性手段的一些实施例中,细菌部分侧翼有重组位点,例如attp/attb、loxp、frt位点。在一些实施例中,同源重组酶的添加可实现分子内重组和细菌部分的切除。在一些实施例中,通过phic31重组酶识别重组酶位点。在一些实施例中,通过cre重组酶识别重组酶位点。在一些实施例中,通过flp重组酶识别重组酶位点。在一些实施例中,微环产生于稳定表达诱导型微环组装酶的产细菌菌株中,例如,大肠杆菌(e.coli)菌株,例如根据kay等人nat biotechnol[自然生物技术]28(12):1287-1289(2010)的生产菌株。微环dna载体的制备和生产方法描述于us9233174,其通过引用以其全文并入本文。
[0412]
除了质粒dna之外,还可以通过从病毒主链(例如,aav载体)中切除所需的构建体(例如,重组酶表达盒或治疗性表达盒)来产生微环。此前已证明从病毒主链中切除插入dna
序列并使其环化,可能对转座酶介导的整合效率很重要(yant等人nat biotechnol[自然生物技术]20(10):999-1005(2002))。在一些实施例中,首先配制微环,然后将其递送至靶细胞。在其他实施例中,通过共递送重组酶在细胞内由dna载体(例如,质粒dna、raav、scaav、cedna、“狗骨头dna”(doggybone dna))形成微环,导致侧翼是重组酶识别位点的核酸的切除和环化,该核酸为例如编码gene writer
tm
多肽的核酸、或dna模板、或两者。在一些实施例中,针对第一切除事件(例如,分子内重组)和第二整合(例如,靶位点整合)事件使用相同的重组酶。在一些实施例中,将切除的环状dna上的重组位点(例如,在第一重组事件之后,例如,分子内重组之后)用作第二重组(例如,靶位点整合)事件的模板识别位点。
[0413]
接头
[0414]
在一些实施例中,本文所述的组合物和系统的结构域(例如,重组酶结构域和/或重组酶多肽的dna识别结构域,例如,如本文所述)可以通过接头连接。本文所述的包含接头元件的组合物具有s1-l-s2的一般形式,其中s1和s2可以相同或不同,并代表通过接头彼此缔合的两个结构域部分(例如,各自是多肽或核酸结构域)。在一些实施例中,接头可以连接两个多肽。在一些实施例中,接头可以连接两个核酸分子。在一些实施例中,接头可以连接多肽和核酸分子。接头可以是化学键,例如一个或多个共价键或非共价键。接头可以是柔性的、刚性的和/或可切割的。在一些实施例中,接头是肽接头。通常,肽接头的长度是至少2、3、4、5、6、7、8、9、10或更多个氨基酸,例如,长度是2-50个氨基酸,长度是2-30个氨基酸。
[0415]
最常用的柔性接头具有的序列主要由gly和ser残基(“gs”接头)段组成。柔性接头可以有用于连接需要一定程度的移动或相互作用的结构域,并且可以包括小的、非极性的(例如gly)或极性的(例如ser或thr)氨基酸。ser或thr的掺入还可以通过与水分子形成氢键来维持接头在水溶液中的稳定性,且因此减少了接头与其他部分之间的不利相互作用。此类接头的实例包括具有结构[ggs]
≥1
或[gggs]
≥1
(seq id no:1844)的那些。刚性接头有用于保持各结构域之间的固定距离并维持它们的独立功能。当结构域的空间分离对于保持药剂中一种或多种组分的稳定性或生物活性至关重要时,刚性接头也可以是有用的。刚性接头可以具有α螺旋结构或富含脯氨酸的序列(pro-rich序列)、(xp)n,其中x表示任何氨基酸,优选ala、lys或glu。可切割接头可以在体内释放游离的功能性结构域。在一些实施例中,接头可以在特异性条件下(例如在还原剂或蛋白酶的存在下)切割。体内可切割接头可利用二硫键的可逆性质。一个实例包括两个cys残基之间的凝血酶敏感性序列(例如,prs)。cprsc的体外凝血酶处理导致凝血酶敏感性序列的切割,而可逆的二硫键保持完整。此类接头是已知的并且描述于,例如,chen等人,2013.fusion protein linkers:property,design and functionality[融合蛋白接头:特性、设计和功能]adv drug deliv rev.[先进药物输送评论]65(10):1357-1369。本文所述组合物中接头的体内切割也可以通过蛋白酶进行,该蛋白酶在病理条件下(例如癌症或炎症)在体内、在特定细胞或组织中、或在受限的某些细胞区室内表达。许多蛋白酶的特异性在受限的区室中提供了对接头的较缓慢切割。
[0416]
在一些实施例中,氨基酸接头是存在于天然多肽的此类结构域之间的内源氨基酸(或与之同源)。在一些实施例中,存在于此类结构域之间的内源氨基酸被取代,但是长度与天然长度没有变化。在一些实施例中,将另外的氨基酸残基添加至结构域之间的天然存在的氨基酸残基。
[0417]
在一些实施例中,氨基酸接头被计算地设计或筛选以最大化蛋白质功能(anad等人,febs letters[febs通讯],587:19,2013)。
[0418]
基因组安全港位点
[0419]
在一些实施例中,gene writer靶向基因组安全港位点(例如,引导将异源对象序列插入安全港评分为至少3、4、5、6、7、或8的位置)。在一些实施例中,基因组安全港位点是natural harbor
tm
位点。在一些实施例中,natural harbor
tm
位点源自移动遗传元件的天然靶标,例如,重组酶、转座子、逆转录转座子或逆转录病毒。鉴于移动元件的天然靶标的进化选择,其可充当基因组整合的理想位置。在一些实施例中,natural harbor
tm
位点是核糖体dna(rdna)。在一些实施例中,natural harbor
tm
位点是5s rdna、18s rdna、5.8s rdna或28s rdna。在一些实施例中,natural harbor
tm
位点是5s rdna中的mutsu位点。在一些实施例中,natural harbor
tm
位点是28s rdna中的r2位点、r5位点、r6位点、r4位点、r1位点、r9位点或rt位点。在一些实施例中,natural harbor
tm
位点是18s rdna中的r8位点或r7位点。
[0420]
在一些实施例中,natural harbor
tm
位点是编码转移rna(trna)的dna。在一些实施例中,natural harbor
tm
位点是编码trna-asp或trna-glu的dna。在一些实施例中,natural harbor
tm
位点是编码剪接体rna的dna。在一些实施例中,natural harbor
tm
位点是编码小核rna(snrna)例如u2snrna的dna。
[0421]
因此,在一些方面,本披露提供了如下方法,该方法包括使用本文所述的genewriter系统将异源对象序列插入natural harbor
tm
位点。在一些实施例中,natural harbor
tm
位点是在下表4中描述的位点。在一些实施例中,将异源对象序列插入natural harbor
tm
位点的20、50、100、150、200、250、500或1000个碱基对内。在一些实施例中,将异源对象序列插入natural harbor
tm
位点的0.1kb、0.25kb、0.5kb、0.75、kb、1kb、2kb、3kb、4kb、5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb内。在一些实施例中,将异源对象序列插入与表4所示序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的位点。在一些实施例中,将异源对象序列插入与表4所示序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的位点的20、50、100、150、200、250、500或1000个碱基对内,或该位点的0.1kb、0.25kb、0.5kb、0.75、kb、1kb、2kb、3kb、4kb、5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb内。在一些实施例中,将异源对象序列插入表4第5列中所示的基因内,或该基因的20、50、100、150、200、250、500或1000个碱基对内,或该基因的0.1kb、0.25kb、0.5kb、0.75、kb、1kb、2kb、3kb、4kb、5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb内。
[0422]
表4.natural harbor
tm
位点。第1列指示插入natural harbor
tm
位点的逆转录转座子。第2列指示在natural harbor
tm
位点处的基因。第3列和第4列显示了插入位点5’和3’的示例性人基因组序列(例如,250bp)。第5列和第6列列出了示例基因符号和对应的基因id。
[0423]
[0424]
[0425]
[0426]
[0427][0428]
gene writers
tm
的另外的功能性特征
[0429]
在一些情况下,如本文所述的gene writer可以由一个或多个功能性测量值或特征来表征。在一些实施例中,dna结合结构域(例如,靶结合结构域)具有下文所述的一个或多个功能性特征。在一些实施例中,模板结合结构域具有下文所述的一个或多个功能性特征。在一些实施例中,模板(例如,模板dna)具有下文所述的一个或多个功能性特征。在一些实施例中,被gene writer改变的靶位点在被gene writer改变后具有下文所述的一个或多个功能性特征。
[0430]
gene writer多肽
[0431]
dna结合结构域
itr)的组分。在一些实施例中,例如,当在整合之前通过第一重组事件首先将模板dna从病毒载体中切除时,靶位点在超过约1%或10%的事件中不含有由非模板dna(例如,内源dna或载体dna(例如,aav itr))产生的插入,例如,如通过对靶位点的长读段扩增子测序所确定的,例如,如karst等人(2020),同上中所述。在一些实施例中,靶位点含有与模板dna相对应的整合序列。
[0441]
在一些实施例中,本文所述的gene writer能够位点特异性地编辑靶dna,例如,将模板dna插入靶dna。在一些实施例中,位点特异性的gene writer能够产生编辑(例如,插入),该编辑存在于靶位点的频率高于基因组中任何其他位点。在一些实施例中,位点特异性的gene writer能够在靶位点中产生编辑(例如,插入),频率为在人基因组中所有其他位点处频率的至少2、3、4、5、10、50、100、或1000倍。在一些实施例中,整合位点的位置通过单向测序确定。在用于文库制备的接头或引物中掺入独特的分子标识符(umi)允许对离散插入事件进行定量,这可以在中靶插入与所有其他插入之间进行比较,以确定对已定义靶位点的偏好。
[0442]
在一些实施例中,gene writing系统用于编辑存在于人基因组中单个位置的靶dna序列。在一些实施例中,gene writing系统用于编辑存在于人基因组中单个同源染色体上的单个位置的靶dna序列,例如,是单倍型特异性的。在一些实施例中,gene writing系统用于编辑存在于人基因组中两个同源染色体上的单个位置的靶dna序列。在一些实施例中,gene writing系统用于编辑存在于基因组中多个位置(例如,基因组中至少2、3、4、5、10、20、50、100、200、500、1000、5000、10000、100000、200000、500000、1000000个(例如,alu元件)位置)的靶dna序列。
[0443]
在一些实施例中,gene writer系统能够编辑基因组而不引入不希望的突变。在一些实施例中,gene writer系统能够通过将模板(例如,模板dna)插入基因组来编辑基因组。在一些实施例中,基因组中所得的修饰含有相对于模板dna序列的最小突变。在一些实施例中,基因组插入相对于模板dna的平均错误率为少于10-4
、10-5
、或10-6
个突变/核苷酸。在一些实施例中,相对于被引入靶细胞的模板dna的突变的数量平均为少于1、2、3、4、5、10、20、30、40、50、60、70、80、90、或100个核苷酸/基因组。在一些实施例中,靶基因组中插入的错误率通过遍及已知靶位点的长读段扩增子测序(例如,如karst等人(2020),同上中所述)并与模板dna序列进行比较来确定。在一些实施例中,通过该方法列举的错误包括相对于模板序列的核苷酸取代。在一些实施例中,通过该方法列举的错误包括相对于模板序列的核苷酸缺失。在一些实施例中,通过该方法列举的错误包括相对于模板序列的核苷酸插入。在一些实施例中,通过该方法列举的错误包括相对于模板序列的一个或多个核苷酸取代、缺失或插入的组合。
[0444]
整合事件的效率可以用作gene writer系统对靶位点或靶细胞编辑的量度。在一些实施例中,本文所述的gene writer系统能够在靶位点或靶细胞的一部分中整合异源对象序列。在一些实施例中,gene writer系统能够编辑至少1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.5%、99.9%或100%的靶基因座,如通过在遍及靶标的扩增和使用长读段扩增子测序分析时对编辑的检测来测量的,例如,如karst等人(2020)中所述。在一些实施例中,gene writer系统能够以遍及细胞群体至少0.1个(例如,至少0.1、0.5、1、2、3、4、5、10、或100个)拷贝/基因组的平均拷贝数
(如相对于参考基因(例如,rpp30)归一化的)编辑细胞,例如,如通过利用转基因特异性引物-探针集的ddpcr确定的,例如,如根据lin等人hum gene ther methods[人类基因治疗方法]27(5):197-208(2016)中的方法。
[0445]
在一些实施例中,每细胞拷贝数通过单细胞ddpcr(sc-ddpcr)分析,例如,如根据igarashi等人mol ther methods clin dev[分子治疗方法与临床发展]6:8-16(2017)的方法,该文献通过引用以其全文并入本文。在一些实施例中,至少1%(例如,至少1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)的靶细胞对整合呈阳性,如通过使用转基因特异性引物-探针集的sc-ddpcr评估的。在一些实施例中,平均拷贝数为至少0.1个(例如,至少0.1、0.5、1、2、3、4、5、10、或100个)拷贝/细胞,如通过使用转基因特异性引物-探针集的sc-ddpcr测量的。
[0446]
另外的gene writer特征
[0447]
在一些实施例中,gene writer系统可以在不需要内源宿主因子的情况下产生完整的书写。在一些实施例中,该系统可以在不需要dna修复的情况下产生完整的书写。在一些实施例中,该系统可以在不引起dna损伤应答的情况下产生完整的书写。
[0448]
在一些实施例中,该系统不需要通过nhej途径、同源重组修复途径、碱基切除修复途径或其任何组合进行dna修复。dna修复途径的参与可以例如经由dna修复途径抑制剂或dna修复途径缺陷细胞系的应用来测定。例如,当应用dna修复途径抑制剂时,可以首先进行prestoblue细胞生存力测定,以确定抑制剂的毒性以及是否应进行任何归一化。scr7是nhej的抑制剂,其可在gene writer
tm
递送过程中以一系列稀释度使用。parp蛋白是核酶,其作为同二聚体与单链和双链断裂结合。因此,其抑制剂可用于相关dna修复途径的测试,包括同源重组修复途径和碱基切除修复途径。实验程序与scr7的实验程序相同。具有核苷酸切除修复(ner)途径的核心蛋白缺陷的细胞系可用于测试ner对gene writing
tm
的影响。在将gene writer
tm
系统递送到细胞中之后,可将ddpcr用于评估在抑制dna修复途径的情况下异源对象序列的插入。还可以进行测序分析以评估某些dna修复途径是否起作用。在一些实施例中,进入基因组中的gene writing
tm
不会因本文所述的dna修复途径的敲除而减少。在一些实施例中,进入基因组中的gene writing
tm
不会因dna修复途径的敲除而减少超过50%。
[0449]
gene writer的进化变体
[0450]
在一些实施例中,本发明提供了gene writer的进化变体。在一些实施例中,进化变体可以通过对参考gene writer或其中包含的片段或结构域之一进行诱变处理而产生。在一些实施例中,使一个或多个结构域(例如,催化或dna结合结构域(例如,靶结合结构域或模板结合结构域),包括例如序列指导的dna结合元件)进化。在一些实施例中,可以使一个或多个此类进化变体结构域单独进化或与其他结构域一起进化。在一些实施例中,可以将一个或多个进化变体结构域与一个或多个未进化的同源组分或一个或多个同源组分的进化的变体组合,例如,该一个或多个同源组分的进化的变体能以并行或连续方式进化。
[0451]
在一些实施例中,对参考gene writer或其片段或结构域进行诱变处理的过程包括对该参考gene writer或其片段或结构域进行诱变处理。在实施例中,诱变包括连续进化方法(例如,pace)或非连续进化方法(例如,pance),例如,如本文所述。在一些实施例中,进化的gene writer或其片段或结构域(例如,dna结合结构域,例如,靶结合结构域或模板结
合结构域)包含引入其氨基酸序列的相对于参考gene writer或其片段或结构域的氨基酸序列的一个或多个氨基酸变异。在实施例中,氨基酸序列变异可以包括参考gene writer的氨基酸序列内的一个或多个突变的残基(例如,保守取代、非保守取代、或其组合),例如,该一个或多个突变的残基是由于编码gene writer的核苷酸序列的变化(例如,该编码序列中任何特定位置处密码子的变化),该变化引起一个或多个氨基酸(例如,截短的蛋白质)的缺失、一个或多个氨基酸的插入或前述内容的任何组合。进化变体gene writer可以包括gene writer的一个或多个组分或结构域中的变体(例如,引入催化结构域、dna结合结构域或其组合的变体)。
[0452]
在一些方面,本文明提供了使用或包含gene writer的进化变体的gene writer、系统、试剂盒和方法,例如,采用了gene writer的进化的变体或由pace或pance生产或可由其生产的gene writer。在实施例中,未进化的参考gene writer是如本文披露的gene writer。
[0453]
如本文所用,术语“噬菌体辅助的连续进化(pace)”通常是指采用噬菌体作为病毒载体的连续进化。pace技术的实例已描述于例如以下中:2009年9月8日提交的国际pct申请号pct/us 2009/056194,其于2010年3月11日公开为wo 2010/028347;2011年12月22日提交的国际pct申请pct/us 2011/066747,其于2012年6月28日公开为wo 2012/088381;2015年5月5日发布的美国专利号9,023,594;2017年9月26日发布的美国专利号9,771,574;2016年7月19日发布的美国专利号9,394,537;2015年1月20日提交的国际pct申请pct/us 2015/012022,其于2015年9月11日公开为wo 2015/134121;2019年1月15日发布的美国专利号10,179,911;以及2016年4月15日提交的国际pct申请pct/us 2016/027795,其于2016年10月20日公开为wo 2016/168631,其中每个的全部内容通过引用并入本文。
[0454]
如本文所用,术语“噬菌体辅助的非连续进化(pance)”通常是指采用噬菌体作为病毒载体的非连续进化。pance技术的实例已描述于例如suzuki t.等人,crystal structures reveal an elusive functional domain of pyrrolysyl-trna synthetase[晶体结构揭示了吡咯赖氨酰trna合成酶的难以捉摸的功能性结构域],nat chem biol.[自然化学生物学]13(12):1261-1266(2017)中,该文献通过引用以其全文并入本文。简言之,pance是一种使用进化中的选择噬菌体(sp)的连续烧瓶转移进行快速体内定向进化的技术,其中含有要在新鲜宿主细胞(例如,大肠杆菌细胞)中进化的目的基因。宿主细胞内的基因可能保持不变,而sp中含有的基因则连续进化。噬菌体生长后,可以使用被感染的细胞的等分试样来转染后续含有宿主大肠杆菌的烧瓶。这一过程可以重复和/或继续,直到期望的表型实现进化,例如,持续所需的转移次数。
[0455]
本领域技术人员通过参考(尤其是)前述参考文献可以容易地理解将pace和pance应用于gene writer的方法。用于例如使用噬菌体颗粒例如在宿主细胞群体中引导基因组修饰蛋白或系统的连续进化的另外的示例性方法可用于产生gene writer或其片段或亚结构域的进化变体。此类方法的非限制性实例描述于以下中:2009年9月8日提交的国际pct申请pct/us 2009/056194,其于2010年3月11日公开为wo 2010/028347;2011年12月22日提交的国际pct申请pct/us 2011/066747,其于2012年6月28日公开为wo 2012/088381;2015年5月5日发布的美国专利号9,023,594;2017年9月26日发布的美国专利号9,771,574;2016年7月19日发布的美国专利号9,394,537;2015年1月20日提交的国际pct申请pct/us 2015/
012022,其于2015年9月11日公开为wo 2015/134121;2019年1月15日发布的美国专利号10,179,911;2019年6月14日提交的国际申请号pct/us 2019/37216;2019年1月31日公开的国际专利公开wo 2019/023680;2016年4月15日提交的国际pct申请pct/us 2016/027795,其于2016年10月20日公开为wo 2016/168631;以及2019年8月23日提交的国际专利公开号pct/us 2019/47996;其中每个通过引用以其全文并入本文。
[0456]
在一些非限制性说明性实施例中,进化变体gene writer、或其片段或结构域的进化方法包括:(a)使宿主细胞群体与包含目的基因(起始gene writer或其片段或结构域)的病毒载体群体接触,其中:(1)宿主细胞易于被病毒载体感染;(2)宿主细胞对产生病毒颗粒所需的病毒基因进行表达;(3)产生感染性病毒颗粒所需的至少一种病毒基因的表达取决于目的基因的功能;和/或(4)病毒载体允许蛋白质在宿主细胞中表达,并且可以被宿主细胞复制和包装成病毒颗粒。在一些实施例中,该方法包括(b)使宿主细胞与诱变剂接触,其使用具有提高突变率的突变的宿主细胞(例如,通过携带突变质粒或某种基因组修饰—例如,校对受损的dna聚合酶、sos基因,例如umuc、umud’、和/或reca,如果与质粒结合,这些突变可能在诱导型启动子的控制下)或其组合。在一些实施例中,该方法包括(c)在允许病毒复制和产生病毒颗粒的条件下孵育宿主细胞群体,其中从宿主细胞群体中去除宿主细胞,并将新鲜的、未感染的宿主细胞引入到宿主细胞群体中,从而补充宿主细胞群体并产生宿主细胞流。在一些实施例中,将细胞在允许目的基因获得突变的条件下孵育。在一些实施例中,该方法进一步包括(d)从宿主细胞群体中分离病毒载体的突变版本,该突变版本编码进化基因产物(例如,进化变体gene writer、或其片段或结构域)。
[0457]
本领域技术人员将理解在上述框架内可采用的各种特征。例如,在一些实施例中,病毒载体或噬菌体是丝状噬菌体,例如m13噬菌体,例如m13选择噬菌体。在某些实施例中,产生感染性病毒颗粒所需的基因是m13基因iii(giii)。在实施例中,噬菌体可能缺乏功能性giii,但不同的是包含gi、gii、giv、gv、gvi、gvii、gviii、gix、和gx。在一些实施例中,感染性vsv颗粒的产生涉及包膜蛋白vsv-g。各种实施例可以使用不同的逆转录病毒载体,例如鼠白血病病毒载体或慢病毒载体。在实施例中,利用vsv-g包膜蛋白(例如,作为病毒的天然包膜蛋白的替代物)可以有效包装逆转录病毒载体。
[0458]
在一些实施例中,根据合适数量的病毒生命周期孵育宿主细胞,例如至少10、至少20、至少30、至少40、至少50、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少4000、至少5000、至少7500、至少10000或更多个连续的病毒生命周期,在m13噬菌体的说明性和非限制性实例中,每个病毒生命周期为10-20分钟。类似地,可以调节条件以调整宿主细胞在宿主细胞群体中保留的时间,例如约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约30、约35、约40、约45、约50、约55、约60、约70、约80、约90、约100、约120、约150、或约180分钟。可以部分地通过宿主细胞的密度来控制宿主细胞群体,或者在一些实施例中,流入物中的宿主细胞密度为例如103个细胞/ml、约104个细胞/ml、约105个细胞/ml、约5-105个细胞/ml、约106个细胞/ml、约5-106个细胞/ml、约107个细胞/ml、约5-107个细胞/ml、约108个细胞/ml、约5-108个细胞/ml、约109个细胞/ml、约5
·
109个细胞/ml、约10
10
个细胞/ml、或约5
·
10
10
个细胞/ml。
[0459]
核酸
[0460]
启动子
[0461]
在一些实施例中,一个或多个启动子或增强子元件与例如控制异源对象序列表达的编码gene writer多肽的核酸或模板核酸可操作地连接。在某些实施例中,该一个或多个启动子或增强子元件包含细胞类型或组织特异性元件。在一些实施例中,启动子或增强子是相同的或源自天然地控制异源对象序列表达的启动子或增强子。例如,鸟氨酸转氨甲酰酶启动子和增强子可用于在本发明提供的系统或方法中控制鸟氨酸转氨甲酰酶基因的表达以便纠正鸟氨酸转氨甲酰酶缺陷。在一些实施例中,启动子是表33中的启动子或其功能性片段或变体。
[0462]
可以例如在统一资源定位符(例如,https://www.invivogen.com/tissue-specific-promoters)中找到可商购的示例性组织特异性启动子。在一些实施例中,启动子是天然启动子或最小启动子,例如由来自给定基因的5’区域的单个片段组成。在一些实施例中,天然启动子包含核心启动子及其天然5’utr。在一些实施例中,5’utr包含内含子。在其他实施例中,这些包括复合型启动子,这些复合型启动子组合了起点不同的启动子元件,或由远端增强子与起点相同的最小启动子组装而产生。在一些实施例中,一个或多个组织特异性表达控制序列包含pct公开号wo 2020014209(通过引用以其全文并入本文)的表2或表3中的一个或多个序列。
[0463]
示例性细胞或组织特异性启动子在以下各表中提供,并且编码它们的示例性核酸序列是本领域已知的并且可以使用多种资源轻松地访问,例如ncbi数据库,包括refseq,以及真核启动子数据库(http://epd.epfl.ch//index.php)。
[0464]
表5.示例性细胞或组织特异性启动子
[0465]
[0466][0467]
表6.另外的示例性细胞或组织特异性启动子
[0468]
[0469]
[0470]
[0471][0472]
取决于所利用的宿主/载体系统,可以在表达载体中使用许多合适的转录和翻译控制元件中的任一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等(参见例如,bitter等人(1987)methods in enzymology[酶学方法],153:516-544;其通过引用以其全文并入本文)。
[0473]
在一些实施例中,编码gene writer的核酸或模板核酸与控制元件(例如,转录控制元件,例如启动子)可操作地连接。在一些实施例中,转录控制元件可以在真核细胞(例如,哺乳动物细胞)或原核细胞(例如,细菌或古细菌细胞)中起作用。在一些实施例中,编码多肽的核苷酸序列与例如允许该编码多肽的核苷酸序列在原核和真核细胞中表达的多个控制元件可操作地连接。
[0474]
出于说明的目的,空间上受限的启动子的实例包括但不限于神经元特异性启动子、脂肪细胞特异性启动子、心肌细胞特异性启动子、平滑肌特异性启动子、光感受器特异性启动子等。神经元特异性的空间上受限的启动子包括但不限于:神经元特异性烯醇化酶(nse)启动子(参见例如,embl hseno2,x51956);芳香族氨基酸脱羧酶(aadc)启动子、神经丝启动子(参见例如,genbank humnfl,l04147);突触蛋白启动子(参见例如,genbank humsynib,m55301);thy-1启动子(参见例如,chen等人(1987)cell[细胞]51:7-19;以及llewellyn,等人(2010)nat.med.[自然
·
医学]16(10):1161-1166);5-羟色胺受体启动子(参见例如,genbank s62283);酪氨酸羟化酶启动子(th)(参见例如,oh等人(2009)gene ther[基因治疗]16:437;sasaoka等人(1992)mol.brain res.[分子脑研究]16:274;boundy等人(1998)j.neurosci.[神经科学杂志]18:9989;以及kaneda等人(1991)neuron[神经元]6:583-594);gnrh启动子(参见例如,radovick等人(1991)proc.natl.acad.sci.usa[美国
国家科学院院刊]88:3402-3406);l7启动子(参见例如,oberdick等人(1990)science[科学]248:223-226);dnmt启动子(参见例如,bartge等人(1988)proc.natl.acad.sci.usa[美国国家科学院院刊]85:3648-3652);脑啡肽启动子(参见例如,comb等人(1988)embo j.[欧洲分子生物学学会杂志]17:3793-3805);髓鞘碱性蛋白(mbp)启动子;ca2 -钙调蛋白依赖性蛋白激酶ii-α(camkiiα)启动子(参见例如,mayford等人(1996)proc.natl.acad.sci.usa[美国国家科学院院刊]93:13250;以及casanova等人(2001)genesis[遗传]31:37);cmv增强子/血小板源性生长因子-β启动子(参见例如,liu等人(2004)gene therapy[基因治疗]11:52-60);等。
[0475]
脂肪细胞特异性的空间上受限的启动子包括但不限于:ap2基因启动子/增强子,例如,人ap2基因的-5.4kb至 21bp区域(参见例如,tozzo等人(1997)endocrinol[内分泌学].138:1604;ross等人(1990)proc.natl.acad.sci.usa[美国国家科学院院刊]87:9590;以及pavjani等人(2005)nat.med.[自然
·
医学]11:797);葡萄糖转运蛋白-4(glut4)启动子(参见例如,knight等人(2003)proc.natl.acad.sci.usa[美国国家科学院院刊]100:14725);脂肪酸转位酶(fat/cd36)启动子(参见例如,kuriki等人(2002)biol.pharm.bull.[生物和医药学报]25:1476;以及sato等人(2002)j.biol.chem.[生物化学杂志]277:15703);硬脂酰基-辅酶a去饱和酶-1(scd1)启动子(tabor等人(1999)j.biol.chem.[生物化学杂志]274:20603);瘦素启动子(参见例如,mason等人(1998)endocrinol.[内分泌学]139:1013;以及chen等人(1999)biochem.biophys.res.comm.[生物化学与生物物理研究通讯]262:187);脂连蛋白启动子(参见例如,kita等人(2005)biochem.biophys.res.comm.[生物化学与生物物理研究通讯]331:484;以及chakrabarti(2010)endocrinol.[内分泌学]151:2408);降脂蛋白启动子(参见例如,platt等人(1989)proc.natl.acad.sci.usa[美国国家科学院院刊]86:7490);抗胰岛素蛋白启动子(参见例如,seo等人(2003)molec.endocrinol.[分子内分泌学]17:1522);等。
[0476]
心肌细胞特异性的空间上受限的启动子包括但不限于源自以下基因的控制序列:肌球蛋白轻链-2、α-肌球蛋白重链、ae3、心肌肌钙蛋白c、心肌肌动蛋白等。franz等人(1997)cardiovasc.res.[心血管研究]35:560-566;robbins等人(1995)ann.n.y.acad.sci.[纽约科学院年报]752:492-505;linn等人(1995)circ.res.[循环研究]76:584-591;parmacek等人(1994)mol.cell.biol.[分子细胞生物学]14:1870-1885;hunter等人(1993)hypertension[高血压]22:608-617;以及sartorelli等人(1992)proc.natl.acad.sci.usa[美国国家科学院院刊]89:4047-4051。
[0477]
平滑肌特异性的空间上受限的启动子包括但不限于sm22α启动子(参见例如,aky
ü
rek等人(2000)mol.med.[分子医学]6:983;以及美国专利号7,169,874);平滑肌细胞分化特异性抗原(smoothelin)启动子(参见例如,wo 2001/018048);α-平滑肌肌动蛋白启动子;等。例如,已经证明sm22α启动子的0.4kb区域(其内含两个carg元件)介导血管平滑肌细胞特异性表达(参见例如,kim,等人(1997)mol.cell.biol.[分子细胞生物学]17,2266-2278;li,等人,(1996)j.cell biol.[细胞生物学杂志]132,849-859;和moessler,等人(1996)development[发育]122,2415-2425)。
[0478]
光感受器特异性的空间上受限的启动子包括但不限于视紫红质启动子;视紫红质激酶启动子(young等人(2003)ophthalmol.vis.sci.[眼科学与视觉科学]44:4076);β磷酸
二酯酶基因启动子(nicoud等人(2007)j.gene med.[基因医学杂志]9:1015);视网膜色素变性基因启动子(nicoud等人(2007)同上);光感受器间维生素a类结合蛋白(irbp)基因增强子(nicoud等人(2007)同上);irbp基因启动子(yokoyama等人(1992)exp eye res.[实验眼科研究杂志]55:225);等。
[0479]
非限制性示例性细胞特异性启动子
[0480]
本领域已知的细胞特异性启动子可用于引导gene writer蛋白的表达,例如,如本文所述。非限制性示例性哺乳动物细胞特异性启动子已被表征并用于以细胞特异性方式表达cre重组酶的小鼠。某些非限制性示例性哺乳动物细胞特异性启动子列于us 9845481的表1中,该文献通过引用并入本文。
[0481]
在一些实施例中,细胞特异性启动子是在植物中具有活性的启动子。许多示例性的细胞特异性植物启动子是本领域已知的。参见例如,美国专利号5,097,025;5,783,393;5,880,330;5,981,727;7,557,264;6,291,666;7,132,526;以及7,323,622;以及美国公开号2010/0269226;2007/0180580;2005/0034192;以及2005/0086712,出于任何目的这些均通过引用以其全文并入本文。
[0482]
在一些实施例中,如本文所述的载体包含表达盒。如本文所用,术语“表达盒”是指包含足以表达本发明的核酸分子的核酸元件的核酸构建体。典型地,表达盒包含本发明的与启动子序列可操作地连接的核酸分子。术语“可操作地连接”是指两个或更多个核酸片段在单个核酸片段上的缔合,这样使得一个核酸片段的功能受到另一个的影响。例如,当启动子能够影响编码序列的表达时,则该启动子与该编码序列可操作地连接(例如,该编码序列在该启动子的转录控制之下)。编码序列能以有义或反义取向与调节序列可操作地连接。在某些实施例中,启动子是异源启动子。如本文所用,术语“异源启动子”是指在自然界中未发现与给定编码序列可操作地连接的启动子。在某些实施例中,表达盒可以包含另外的元件,例如,内含子、增强子、聚腺苷酸化位点、土拨鼠应答元件(wre)和/或已知影响编码序列表达水平的其他元件。“启动子”典型地控制编码序列或功能性rna的表达。在某些实施例中,启动子序列包含近端和更远端上游元件,并可以进一步包含增强子元件。“增强子”典型地可以刺激启动子的活性,且可以是启动子的固有元件或被插入以增强启动子的水平或组织特异性的异源元件。在某些实施例中,启动子整体源自天然基因。在某些实施例中,启动子由源自不同天然存在的启动子的不同元件构成。在某些实施例中,启动子包含合成的核苷酸序列。本领域技术人员将理解,不同的启动子将引导基因在不同的组织或细胞类型中、或在不同的发育阶段、或应答于不同的环境条件或应答于药物或转录辅助因子的存在或不存在的表达。普遍存在的、细胞类型特异性的、组织特异性的、发育阶段特异性的和条件性的启动子,例如,药物应答性启动子(例如,四环素应答性启动子)为本领域技术人员所熟知。启动子的实例包括但不限于:磷酸甘油酸激酶(pkg)启动子、cag(cmv增强子、鸡β肌动蛋白启动子(cba)和兔β珠蛋白内含子的复合物)、nse(神经元特异性烯醇化酶)、突触蛋白或neun启动子、sv40早期启动子、小鼠乳腺肿瘤病毒ltr启动子;腺病毒主要晚期启动子(ad mlp);单纯疱疹病毒(hsv)启动子、巨细胞病毒(cmv)启动子例如cmv立即早期启动子区(cmvie)、sffv启动子、劳斯肉瘤病毒(rsv)启动子、合成启动子、杂合启动子等。其他启动子可以是人类来源的或来自其他物种(包括来自小鼠)。常见的启动子包括例如:人巨细胞病毒(cmv)立即早期基因启动子、sv40早期启动子、劳斯肉瘤病毒长末端重复序列、[β]-肌动
蛋白、大鼠胰岛素启动子、磷酸甘油酸激酶启动子、人α-1抗胰蛋白酶(haat)启动子、甲状腺素转运蛋白启动子、tbg启动子和其他肝脏特异性启动子、结蛋白启动子和类似的肌肉特异性启动子、ef1-α启动子、cag启动子和其他组成型启动子、具有多组织特异性的杂合启动子、对神经元特异的启动子(如突触蛋白)和甘油醛-3-磷酸脱氢酶启动子,所有这些都是本领域技术人员熟知且容易获得的启动子,可用于获得目的编码序列的高水平表达。另外,源自非病毒基因(如鼠金属硫蛋白基因)的序列也将在本文找到用途。此类启动子序列可商购自例如stratagene公司(stratagene)(加利福尼亚州圣地亚哥(san diego,ca))。另外的示例性启动子序列描述于例如wo 2018213786 a1(其通过引用以其全文并入本文)中。
[0483]
在一些实施例中,载脂蛋白e增强子(apoe)或其功能性片段用于例如促使在肝脏中的表达。在一些实施例中,使用两个拷贝的apoe增强子或其功能性片段。在一些实施例中,apoe增强子或其功能性片段与启动子(例如,人α-1抗胰蛋白酶(haat)启动子)组合使用。
[0484]
在一些实施例中,调节序列赋予组织特异性基因表达能力。在一些情况下,组织特异性调节序列结合以组织特异性方式诱导转录的组织特异性转录因子。各种组织特异性调节序列(例如,启动子、增强子等)是本领域已知的。示例性组织特异性调节序列包括但不限于以下组织特异性启动子:肝脏特异性甲状腺素结合球蛋白(tbg)启动子、胰岛素启动子、胰高血糖素启动子、生长抑素启动子、胰多肽(ppy)启动子、突触蛋白-1(syn)启动子、肌酸激酶(mck)启动子、哺乳动物结蛋白(des)启动子、α-肌球蛋白重链(a-mhc)启动子或心肌肌钙蛋白t(ctnt)启动子。其他示例性启动子包括:β-肌动蛋白启动子、乙型肝炎病毒核心启动子,sandig等人,gene ther.[基因治疗],3:1002-9(1996);甲胎蛋白(afp)启动子,arbuthnot等人,hum.gene ther.[人类基因治疗],7:1503-14(1996);骨钙素启动子(stein等人,mol.biol.rep.[分子生物学报告],24:185-96(1997));骨唾液酸蛋白启动子(chen等人,j.bone miner.res.[骨矿物质研究杂志],11:654-64(1996));cd2启动子(hansal等人,j.immunol.[免疫学杂志],161:1063-8(1998));免疫球蛋白重链启动子;t细胞受体α链启动子、神经元如神经元特异性烯醇化酶(nse)启动子(andersen等人,cell.mol.neurobiol.[细胞和分子神经生物学],13:503-15(1993));神经丝轻链基因启动子(piccioli等人,proc.natl.acad.sci.usa[美国国家科学院院刊],88:5611-5(1991));和神经元特异性vgf基因启动子(piccioli等人,neuron[神经元],15:373-84(1995))等。另外的示例性启动子序列描述于例如美国专利号10300146(其通过引用以其全文并入本文)中。在一些实施例中,组织特异性调节元件(例如,组织特异性启动子)选自已知与在给定组织中高度表达的基因可操作地连接的一种,例如,如通过rna-seq或蛋白质表达数据、或其组合所测量的。用于通过表达分析组织特异性的方法教授于fagerberg等人mol cell proteomics[分子与细胞蛋白质组学]13(2):397-406(2014)中,该文献通过引用以其全文并入本文。
[0485]
在一些实施例中,本文所述的载体是多顺反子表达构建体。多顺反子表达构建体包括例如含有第一表达盒和第二表达盒的构建体,该第一表达盒例如包含第一启动子和第一编码核酸序列,该第二表达盒例如包含第二启动子和第二编码核酸序列。在一些情况下,此类多顺反子表达构建体可特别用于递送非翻译基因产物(例如发夹rna)以及多肽(例如,gene writer和gene writer模板)。在一些实施例中,多顺反子表达构建体可以表现出一种或多种所包括的转基因的降低的表达水平,例如,这是因为启动子干扰或存在非常接近的
不相容的核酸元件。如果多顺反子表达构建体是病毒载体的一部分,则在一些情况下,自我互补核酸序列的存在可能会干扰病毒繁殖或包装所需结构的形成。
[0486]
在一些实施例中,序列编码含发夹的rna。在一些实施例中,发夹rna是指导rna、模板rna、shrna、或microrna。在一些实施例中,第一启动子是rna聚合酶i启动子。在一些实施例中,第一启动子是rna聚合酶ii启动子。在一些实施例中,第二启动子是rna聚合酶iii启动子。在一些实施例中,第二启动子是u6或h1启动子。在一些实施例中,核酸构建体包含aav构建体b1或b2的结构。
[0487]
在不希望受理论约束的情况下,与含有仅一个顺反子的表达系统相比,多顺反子表达构建体可能无法实现最佳的表达水平。利用包含两个或更多个启动子元件的多顺反子表达构建体实现的表达水平降低的所认为的原因之一是启动子干扰现象(参见例如,curtin j a,dane a p,swanson a,alexander i e,ginn s l.bidirectional promoter interference between two widely used internal heterologous promoters in a late-generation lentiviral construct[晚期慢病毒构建体中两个广泛使用的内部异源启动子之间的双向启动子干扰].gene ther.[基因治疗]2008年3月;15(5):384-90;和martin-duque p,jezzard s,kaftansis l,vassaux g.direct comparison of the insulating properties of two genetic elements in an adenoviral vector containing two different expression cassettes[在含有两个不同表达盒的腺病毒载体中对两个遗传元件的绝缘特性的直接比较].hum gene ther.[人类基因治疗]2004年10月;15(10):995-1002;两个参考文献均通过引用并入本文以披露启动子干扰现象)。在一些实施例中,可以通过以下克服启动子干扰的问题,例如通过产生包含仅一个启动子的多顺反子表达构建体,该启动子促进由内部核糖体进入位点分开的多个编码核酸序列的转录;或通过将包含具有转录绝缘子元件的自身启动子的顺反子分开。在一些实施例中,多个顺反子的单启动子驱动的表达可能导致顺反子的不均匀表达水平。在一些实施例中,不能有效地分离启动子并且分离元件可能与一些基因转移载体(例如,一些逆转录病毒载体)不相容。
[0488]
微小rna
[0489]
mirna和其他小干扰核酸通常经由靶rna转录物切割/降解或靶信使rna(mrna)的翻译阻抑来调节基因表达。在一些情况下,mirna可以天然表达,典型地作为最终的19-25个非翻译的rna产物。mirna通常通过与靶mrna的3

非翻译区(utr)的序列特异性相互作用来表现出它们的活性。这些内源表达的mirna可以形成发夹前体,这些发夹前体随后被加工成mirna双链体,并进一步加工成成熟的单链mirna分子。这种成熟的mirna通常指导多蛋白复合物mirisc,mirisc基于其与成熟mirna的互补性来识别靶mrna的靶3

utr区。有用的转基因产物可以包括例如调节连接的多肽表达的mirna或mirna结合位点。mirna基因的非限制性列表;例如,在如us 10300146,22:25-25:48(其通过引用并入)中所列的那些方法的方法中,这些基因及其同源物的产物可用作转基因或用作小干扰核酸(例如,mirna海绵、反义寡核苷酸)的靶标。在一些实施例中,将一个或多个前述mirna的一个或多个结合位点掺入转基因(例如,由raav载体递送的转基因)中,例如以抑制转基因在含有该转基因的动物的一种或多种组织中的表达。在一些实施例中,可以选择结合位点以便以组织特异性方式控制转基因的表达。例如,可以将肝脏特异性mir-122的结合位点掺入转基因中以抑制该转基因
在肝脏中的表达。另外的示例性mirna序列描述于例如美国专利号10300146(其通过引用以其全文并入本文)中。
[0490]
mir抑制剂或mirna抑制剂通常是阻断mirna表达和/或加工的药剂。此类药剂的实例包括但不限于:抑制mirna与drosha复合物相互作用的微小rna拮抗剂、微小rna特异性反义、微小rna海绵和微小rna寡核苷酸(双链、发夹、短寡核苷酸)。微小rna抑制剂(例如,mirna海绵)可以在来自转基因的细胞中表达(例如,如ebert,m.s.nature methods[自然方法],2007年8月12日电子公开中所述;其通过引用以其全文并入本文)。在一些实施例中,微小rna海绵或其他mir抑制剂与aav一起使用。微小rna海绵通常通过互补的七聚体种子序列特异性抑制mirna。在一些实施例中,可以使用单个海绵序列沉默整个mirna家族。其他用于在细胞中沉默mirna功能(mirna靶标的去阻抑)的方法对于本领域普通技术人员来说将是显而易见的。
[0491]
在一些实施例中,如本文所述的mirna包含pct公开号wo 2020014209的表4中所列的序列,该pct公开通过引用并入本文。还通过引用并入本文的是来自wo 2020014209的示例性mirna序列的列表。
[0492]5’
utr和3’utr
[0493]
在某些实施例中,包含编码gene writer多肽(例如,如本文所述)的开放阅读框的核酸包含5’utr和/或3’utr。在实施例中,用于蛋白质表达的5’utr和3’utr,例如用于gene writer多肽或异源对象序列的mrna(或编码rna的dna),包含优化的表达序列。在一些实施例中,5’utr包含gggaaauaagagagaaaagaagaguaagaagaaauauaagagcca cc(seq id no:1867)和/或3’utr包含ugauaauaggcuggagccucgguggccaugcuucuugccccuuggg ccuccccccagccccuccuccccuuccugcacccguacccccguggu cuuugaauaaagucuga(seq id no:1868),例如,如richner等人cell[细胞]168(6):p1114-1125(2017)中所述,其中的序列通过引用并入本文。
[0494]
在一些实施例中,gene writer系统的开放阅读框,例如,编码gene writer多肽的mrna(或编码mrna的dna)的orf或异源对象序列的mrna(或编码mrna的dna)的一个或多个orf,侧翼有增强其表达的5’和/或3’非翻译区(utr)。在一些实施例中,系统的mrna组分(或从dna组分产生的转录物)的5’utr包含序列5
’‑
gggaaauaagagagaaaagaagaguaagaagaaauauaagagc cacc-3’(seq id no:1869)。在一些实施例中,系统的mrna组分(或从dna组分产生的转录物)的3’utr包含序列5
’‑
ugauaauaggcuggagccucgguggccaugcuucuugccccuug ggccuccccccagccccuccuccccuuccugcacccguacccccgug gucuuugaauaaagucuga-3’(seq id no:1870)。richner等人cell[细胞]168(6):p1114-1125(2017)已经证明5’utr和3’utr的这种组合实现了可操作地连接的orf的理想表达,该文献的传授内容和序列通过引用并入本文。在一些实施例中,本文所述的系统包含编码转录物的dna,其中该dna包含对应的5’utr和3’utr序列,其中t取代以上所列的序列中的u。在一些实施例中,用于产生系统的rna组分的dna载体进一步包含用于启动体外转录的5’utr上游的启动子,例如t7、t3、或sp6启动子。以上5’utr以ggg开头,这对于使用t7 rna聚合酶优化转录是合适的开始。对于调整转录水平和改变转录起始位点核苷酸以适应替代性的5’utr,davidson等人.pac symp biocomput[pac symp生物计算]433-443(2010)的传授内容描述了满足这两个特征的t7启动子变体及其发现方法。
[0495]
病毒载体及其组分
[0496]
除了如本文所述的相关酶或结构域的来源,例如作为本文所用的重组酶和dna结合结构域(例如,cre重组酶、λ整合酶或来自aav rep蛋白的dna结合结构域)的来源,病毒是用于本文所述的系统的有用的递送媒介物来源。一些酶可以具有多种活性。在一些实施例中,用作gene writer递送系统或其组分来源的病毒可选自如baltimore bacteriol rev[细菌综述]35(3):235-241(1971)所述的组。
[0497]
在一些实施例中,病毒选自组i病毒,例如,该病毒是dna病毒并将dsdna包装成病毒体。在一些实施例中,组i病毒选自例如腺病毒、疱疹病毒、痘病毒。
[0498]
在一些实施例中,病毒选自组ii病毒,例如,该病毒是dna病毒并将ssdna包装成病毒体。在一些实施例中,组ii病毒选自例如细小病毒。在一些实施例中,细小病毒是依赖性细小病毒,例如腺相关病毒(aav)。
[0499]
在一些实施例中,病毒选自组iii病毒,例如,该病毒是rna病毒并将dsrna包装成病毒体。在一些实施例中,组iii病毒选自例如呼肠孤病毒。在一些实施例中,包含在此类病毒体中的dsrna的一条或两条链是编码分子,在转导至宿主细胞后能够直接用作mrna,例如,在转导至宿主细胞后可以直接翻译成蛋白质而不需要任何干预性核酸复制或聚合步骤。
[0500]
在一些实施例中,病毒选自组iv病毒,例如,该病毒是rna病毒并将ssrna( )包装成病毒体。在一些实施例中,组iv病毒选自例如冠状病毒、小rna病毒、披膜病毒。在一些实施例中,包含在此类病毒体中的ssrna( )是编码分子,在转导至宿主细胞后能够直接用作mrna,例如,在转导至宿主细胞后可以直接翻译成蛋白质而不需要任何干预性核酸复制或聚合步骤。
[0501]
在一些实施例中,病毒选自组v病毒,例如,该病毒是rna病毒并将ssrna(-)包装成病毒体。在一些实施例中,组v病毒选自例如正黏病毒、弹状病毒。在一些实施例中,具有ssrna(-)基因组的rna病毒还在病毒体内携带酶,该酶被转导至具有病毒基因组的宿主细胞,例如rna依赖性rna聚合酶,能够将ssrna(-)拷贝到可以由宿主直接翻译的ssrna( )。
[0502]
在一些实施例中,病毒选自组vi病毒,例如,该病毒是逆转录病毒并将ssrna( )包装成病毒体。在一些实施例中,组vi病毒选自例如逆转录病毒。在一些实施例中,逆转录病毒是慢病毒,例如,hiv-1、hiv-2、siv、biv。在一些实施例中,逆转录病毒是泡沫病毒属(spumavirus),例如泡沫病毒(foamy virus),例如hfv、sfv、bfv。在一些实施例中,包含在此类病毒体中的ssrna( )是编码分子,在转导至宿主细胞后能够直接用作mrna,例如,在转导至宿主细胞后可以直接翻译成蛋白质而不需要任何干预性核酸复制或聚合步骤。在一些实施例中,ssrna( )首先被逆转录并拷贝以产生dsdna基因组中间体,mrna可以由该基因组中间体在宿主细胞中得以转录。在一些实施例中,具有ssrna( )基因组的rna病毒还在病毒体内携带酶,该酶被转导至具有病毒基因组的宿主细胞,例如rna依赖性dna聚合酶,能够将ssrna( )拷贝到可以转录为mrna并由宿主翻译的dsdna。
[0503]
在一些实施例中,病毒选自组vii病毒,例如,该病毒是逆转录病毒并将dsrna包装成病毒体。在一些实施例中,组vii病毒选自例如嗜肝dna病毒。在一些实施例中,包含在此类病毒体中的dsrna的一条或两条链是编码分子,在转导至宿主细胞后能够直接用作mrna,例如,在转导至宿主细胞后可以直接翻译成蛋白质而不需要任何干预性核酸复制或聚合步
骤。在一些实施例中,包含在此类病毒体中的dsrna的一条或两条链首先被逆转录并拷贝以产生dsdna基因组中间体,mrna可以由该基因组中间体在宿主细胞中得以转录。在一些实施例中,具有dsrna基因组的rna病毒还在病毒体内携带酶,该酶被转导至具有病毒基因组的宿主细胞,例如rna依赖性dna聚合酶,能够将dsrna拷贝到可以转录为mrna并由宿主翻译的dsdna。
[0504]
在一些实施例中,本发明中用于递送核酸的病毒体还可以携带参与gene writing过程的酶。例如,病毒体可以包含与核酸一起被递送到宿主细胞中的重组酶结构域。在一些实施例中,模板核酸可以与病毒体内的gene writer多肽缔合,从而在从病毒颗粒转导核酸后两者被共同递送至靶细胞。在一些实施例中,病毒体中的核酸可以包含dna,例如线性ssdna、线性dsdna、环状ssdna、环状dsdna、微环dna、dbdna、cedna。在一些实施例中,病毒体中的核酸可以包含rna,例如线性ssrna、线性dsrna、环状ssrna、环状dsrna。在一些实施例中,病毒基因组可以在转导至宿主细胞后环化,例如,线性ssrna分子可以经历共价连接以形成环状ssrna,线性dsrna分子可以经历共价连接以形成环状dsrna或一个或多个环状ssrna。在一些实施例中,病毒基因组可以通过在宿主细胞中的滚环复制来复制。在一些实施例中,病毒基因组可以包含单个核酸分子,例如,包含非分段基因组。在一些实施例中,病毒基因组可以包含两个或更多个核酸分子,例如,包含分段基因组。在一些实施例中,病毒体中的核酸可以与一种或蛋白质缔合。在一些实施例中,病毒体中的一种或多种蛋白质可在转导后被递送至宿主细胞。在一些实施例中,可通过向靶核酸添加病毒体包装信号而使天然病毒适于核酸递送,其中宿主细胞用于包装含有包装信号的靶核酸。
[0505]
在一些实施例中,用作递送媒介物的病毒体可以包含共生人类病毒。在一些实施例中,用作递送媒介物的病毒体可以包含指环病毒,其用途描述于wo 2018232017 a1中,该文献通过引用以其全文并入本文。
[0506]
组合物和系统的产生
[0507]
如本领域技术人员将理解的那样,设计和构建核酸构建体和蛋白质或多肽(例如本文所述的系统、构建体和多肽)的方法在本领域中是常规的。通常,可以使用重组方法。通常,参见smales和james(编辑),therapeutic proteins:methods and protocols[治疗性蛋白:方法和方案](methods in molecular biology[分子生物学方法]),humana press[胡玛纳出版社](2005);以及crommelin,sindelar和meibohm(编辑),pharmaceutical biotechnology:fundamentals and applications[药物生物技术:基础与应用],springer[斯普林格出版社](2013)。设计、制备、评估、纯化和操纵核酸组合物的方法描述于green和sambrook(编辑),molecular cloning:a laboratory manual[分子克隆:实验室手册](第四版),cold spring harbor laboratory press[冷泉港实验室出版社](2012)。
[0508]
用于产生本文所述的治疗性药物蛋白质或多肽的示例性方法涉及在哺乳动物细胞中表达,尽管也可以使用昆虫细胞、酵母、细菌、或其他细胞,在适当的启动子控制下,产生重组蛋白。哺乳动物表达载体可以包含非转录元件,如复制起点、合适的启动子、以及其他5’或3’侧翼非转录序列;以及5’或3’非翻译序列,如必要的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、以及终止序列。源自sv40病毒基因组的dna序列,例如sv40起点、早期启动子、剪接和聚腺苷酸化位点可以用于提供异源dna序列表达所需的其他遗传元件。在以下文献中描述了用于与细菌、真菌、酵母、和哺乳动物细胞宿主一起使用的适当的
克隆和表达载体:green和sambrook,molecular cloning:a laboratory manual[分子克隆:实验室手册](第四版),cold spring harbor laboratory press[冷泉港实验室出版社](2012)。
[0509]
各种哺乳动物细胞培养系统可以用于表达和制造重组蛋白。哺乳动物表达系统的实例包括cho、cos、hek293、hela和bhk细胞系。在以下文献中描述了用于生产蛋白治疗剂的宿主细胞培养的过程:zhou和kantardjieff(编辑),mammalian cell cultures for biologics manufacturing[用于生物制品制造的哺乳动物细胞培养](advances in biochemical engineering/biotechnology[生物化学工程/生物科技的进展]),springer[斯普林格出版社](2014)。本文所述的组合物可包括载体,例如编码重组蛋白的病毒载体,例如慢病毒载体。在一些实施例中,载体,例如病毒载体,可以包含编码重组蛋白的核酸。
[0510]
在以下文献中描述了蛋白治疗剂的纯化:franks,protein biotechnology:isolation,characterization,and stabilization[蛋白生物技术:分离、表征、和稳定化],humana press[胡玛纳出版社](2013);以及cutler,protein purification protocols[蛋白纯化方案](methods in molecular biology[分子生物学方法]),humana press[胡玛纳出版社](2010)。
[0511]
rna(例如,grna或mrna,例如,编码genewriter的mrna)也可以如本文所述产生。在一些实施例中,rna区段可以通过化学合成产生。在一些实施例中,rna区段可以通过核酸模板的体外转录产生,例如通过提供rna聚合酶以作用于dna模板的同源启动子以产生rna转录物。在一些实施例中,使用例如t7、t3、或sp6 rna聚合酶或其衍生物进行体外转录,该rna聚合酶或其衍生物作用于dna(例如,dsdna、ssdna、线性dna、质粒dna、线性dna扩增子、线性化质粒dna),该dna例如编码rna区段,例如在同源启动子(例如,t7、t3或sp6启动子)的转录控制下。在一些实施例中,化学合成和体外转录的组合用于产生rna区段以便组装。在实施例中,grna通过化学合成产生,且异源对象序列区段通过体外转录产生。在不希望受理论约束的情况下,体外转录可能更适合于产生较长的rna分子。在一些实施例中,可以降低体外转录的反应温度,例如低于37℃(例如,在0-10c、10-20c、或20-30c之间),以使全长转录物的比例更高(参见krieg nucleic acids res[核酸研究]18:6463(1990),其通过引用以其全文并入本文)。在一些实施例中,采用用于长转录物的改进合成的方案来合成长rna(例如,大于5kb的rna),例如使用例如可以在体外产生27kb转录物的t7 ribomax express(thiel等人j gen virol[普通病毒学杂志]82(6):1273-1281(2001))。在一些实施例中,如本文所述对rna分子的修饰可以在rna区段合成期间(例如,通过包含经修饰的核苷酸或替代性的结合化学物质)、在通过化学或酶促过程合成rna区段之后、在一个或多个rna区段组装之后或其组合中掺入。
[0512]
在一些实施例中,使用t7聚合酶介导的dna依赖性rna转录从线性化dna模板体外合成系统的mrna(例如,编码gene writer多肽的mrna),其中utp任选地被1-甲基假utp取代。在一些实施例中,转录物掺入了5

和3

utr,例如,gggaaauaagagagaaaagaagaguaagaagaaauauaagagcca cc(seq id no:1871)和ugauaauaggcuggagccucgguggccaugcuucuugccccuuggg ccuccccccagccccuccuccccuuccugcacccguacccccguggu cuuugaauaaagucuga(seq id no:1872),或其功能性片段或变体,并且任选地包括聚a尾,该聚a尾可在dna模板中编码或在转录后酶促地添加。在一些实施例中,将供体甲基基团(例如,s-腺苷甲硫氨酸)添加到
具有帽0(cap 0)结构的甲基化的加帽rna中以产生提高mrna翻译效率的帽1结构(richner等人cell[细胞]168(6):p1114-1125(2017))。
[0513]
在一些实施例中,来自t7启动子的转录物以ggg基序起始。在一些实施例中,来自t7启动子的转录物不以ggg基序起始。已经表明,在转录起始处的ggg基序尽管提供了更高的产率,但由于转录物在模板链的三个c残基上发生从 1到 3的滑移,转录起始处的ggg基序可能导致t7rnap合成聚(g)产物的阶梯(imburgio等人.biochemistry[生物化学]39(34):10419-10430(2000))。对于调整转录水平和改变转录起始位点核苷酸以适应替代性的5’utr,davidson等人.pac symp biocomput[pac symp生物计算]433-443(2010)的传授内容描述了满足这两个特征的t7启动子变体及其发现方法。
[0514]
在一些实施例中,rna区段可以通过共价偶联彼此连接。在一些实施例中,rna连接酶(例如,t4 rna连接酶)可用于将两个或更多个rna区段彼此连接。当使用诸如rna连接酶的试剂时,5’末端典型地与3’末端连接。在一些实施例中,如果将两个区段连接,则可以形成两种可能的线性构建体(即,(1)5
’‑
区段1-区段2-3’和(2)5
’‑
区段2-区段1-3’)。在一些实施例中,还可以发生分子内环化。这两个问题可以例如通过阻断一个5’末端或一个3’末端以使rna连接酶不能将末端连接到另一个末端来解决。在实施例中,如果需要构建体5
’‑
区段1-区段2-3’,则将阻断基团置于区段1的5’端或区段2的3’端可导致仅形成正确的线性连接产物和/或防止分子内环化。用于共价连接两个核酸(例如,rna)区段的组合物和方法连同包括使用rna连接酶将两个单链rna区段彼此定向连接的方法披露于例如us 20160102322 a1(通过引用以其全文并入本文)中。
[0515]
可以与例如t4rna连接酶结合使用的末端阻断剂的一个实例是双脱氧终止子。t4 rna连接酶典型地催化5
’‑
磷酸和3
’‑
羟基末端之间磷酸二酯键的atp依赖性连接。在一些实施例中,当使用t4 rna连接酶时,合适的末端必须存在于被连接的末端上。在末端阻断t4 rna连接酶的一种手段包括不具有正确的末端形式。通常,具有5-羟基或3
’‑
磷酸的rna区段的末端不会充当t4 rna连接酶的底物。
[0516]
可用于连接rna区段的另外的示例性方法是通过点击化学(例如,如美国专利号7,375,234和7,070,941以及美国专利公开号2013/0046084中所述,其中的全部披露通过引用并入本文)。例如,一种示例性的点击化学反应是在炔烃基团和叠氮化物基团之间进行(参见us 20160102322 a1的图11,其通过引用以其全文并入本文)。任何点击反应都有可能被用于连接rna区段(例如,cu-叠氮化物-炔烃、菌株促进的叠氮化物-炔烃、施陶丁格(staudinger)连接、四嗪连接、光诱导的四唑-烯烃、硫醇-烯、nhs酯、环氧化物、异氰酸酯和醛-氨基氧基)。在一些实施例中,使用点击化学反应连接rna分子是有利的,因为点击化学反应快速、模块化、高效,通常不产生有毒废产物,可以用水作为溶剂进行,和/或可以设置成具有立体特异性。
[0517]
在一些实施例中,可以使用叠氮化物-炔烃胡伊斯根环加成(huisgen cycloaddition)反应连接rna区段,该反应通常是叠氮化物与末端或内部炔烃之间的1,3-偶极环加成,其得到用于连接rna区段的1,2,3-三唑。在不希望受理论约束的情况下,该连接方法的一个优点可以是该反应可以通过添加所需的cu(i)离子来引发。可以连接rna区段的其他示例性机制包括但不限于使用卤素(f—、br—、i—)/炔烃加成反应、羰基/巯基/马来酰亚胺、和羧基/胺键。例如,可以在3

处用硫醇修饰一个rna分子(使用二硫键亚酰胺和
通用支持物或二硫化物修饰的支持物),并且可以在5

处用acrydite修饰另一个rna分子(使用丙烯酸亚磷酰胺),然后可以通过迈克尔(michael)加成反应将两个rna分子连接。该策略也可以应用于逐步连接多个rna分子。还提供了用于将多于两个(例如,三个、四个、五个、六个等)rna分子彼此连接的方法。在不希望受理论约束的情况下,当所需的rna分子长于约40个核苷酸时,这可能是有用的,例如,使得化学合成效率降低,例如,如us 20160102322 a1(其通过引用以其全文并入本文)中所指明。
[0518]
举例来说,tracrrna的长度典型地为大约80个核苷酸。此类rna分子可以例如通过诸如体外转录或化学合成的过程来产生。在一些实施例中,当化学合成用于产生此类rna分子时,它们可以作为单一合成产物或通过将两个或更多个合成的rna区段彼此连接来产生。在实施例中,当三个或更多个rna区段彼此连接时,可以使用不同的方法将各个区段连接在一起。此外,rna区段可以在一锅(例如,容器、器皿、孔、管、板或其他接受器)中、全部同时或在一锅中在不同时间或在不同锅中在不同时间彼此连接。在非限制性实例中,为了按数字顺序组装rna区段1、2和3,可以首先将rna区段1和2从5’到3’彼此连接。然后可以纯化反应产物的反应混合物组分(例如,通过色谱法),然后放置在第二锅中,以便将3

末端与rna区段3的5

末端连接。然后可以将最终反应产物与rna区段3的5

末端连接。
[0519]
在另一个非限制性实例中,rna区段1(约30个核苷酸)是crrna的靶基因座识别序列和发夹区1的部分。rna区段2(约35个核苷酸)含有发夹区1的其余部分和发夹区1与发夹区2之间的一些线性tracrrna。rna区段3(约35个核苷酸)含有发夹区1与发夹区2之间的线性tracrrna的其余部分以及全部的发夹区2。在该实例中,使用点击化学将rna区段2和3从5

到3

连接。此外,反应产物的5

和3

末端均被磷酸化。然后使反应产物与具有3

末端羟基基团的rna区段1和t4 rna连接酶接触以产生指导rna分子。
[0520]
许多另外的连接化学物质可以用于根据本发明的方法连接rna区段。这些化学物质中的一些阐述于us 20160102322 a1的表6中,该文献通过引用以其全文并入本文。
[0521]
载体
[0522]
本披露部分地提供了编码本文所述的gene writer多肽、本文所述的模板核酸、或两者的核酸(例如,载体)。在一些实施例中,载体包含选择性标志物,例如,抗生素抗性标志物。在一些实施例中,抗生素抗性标志物是卡那霉素抗性标志物。在一些实施例中,抗生素抗性标志物不赋予对β-内酰胺抗生素的抗性。在一些实施例中,载体不包含氨苄西林抗性标志物。在一些实施例中,载体包含卡那霉素抗性标志物而不包含氨苄西林抗性标志物。在一些实施例中,将编码gene writer多肽的载体整合到靶细胞基因组中(例如,在施用于靶细胞、组织、器官或受试者后)。在一些实施例中,不将编码gene writer多肽的载体整合到靶细胞基因组中(例如,在施用于靶细胞、组织、器官或受试者后)。在一些实施例中,不将包含模板核酸(例如,模板dna)的载体整合到靶细胞基因组中(例如,在施用于靶细胞、组织、器官或受试者后)。在一些实施例中,如果将载体整合到靶细胞基因组中的靶位点中,则不将选择性标志物整合到基因组中。在一些实施例中,如果将载体整合到靶细胞基因组中的靶位点中,则不将参与载体维持的基因或序列(例如,质粒维持基因)整合到基因组中。在一些实施例中,如果将载体整合到靶细胞基因组中的靶位点中,则不将转移调节序列(例如,反向末端重复序列,例如,来自aav)整合到基因组中。在一些实施例中,向靶细胞、组织、器官或受试者施用载体(例如,编码本文所述的gene writer多肽、本文所述的模板核酸、或两
者的载体)可使载体的部分整合到所述靶细胞、组织、器官或受试者的一个或多个基因组中的一个或多个靶位点中。在一些实施例中,包含整合材料的少于99%、95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、5%、4%、3%、2%、或1%的靶位点(例如,没有靶位点)包含来自载体的选择性标志物(例如,抗生素抗性基因)、转移调节序列(例如,反向末端重复序列,例如,来自aav)、或两者。
[0523]
aav载体
[0524]
在一些实施例中,编码本文所述的gene writer多肽、本文所述的模板核酸、或两者的载体是腺相关病毒(aav)载体,例如,其包含aav基因组。在一些实施例中,aav基因组包含分别编码四种复制蛋白和三种衣壳蛋白的两个基因。在一些实施例中,基因的侧翼中任何一侧有145-bp的反向末端重复序列(itr)。在一些实施例中,病毒体包含例如以1:1:10比率产生的多达三种衣壳蛋白(vp1、vp2、和/或vp3)。在一些实施例中,衣壳蛋白产生自相同的开放阅读框和/或差异剪接(vp1)和替代性的翻译起始位点(分别为vp2和vp3)。通常,vp3是病毒体中最丰富的亚基,并参与细胞表面的受体识别,从而定义了病毒的嗜性。在一些实施例中,vp1在vp1的n末端包含例如在病毒感染性方面起作用的磷脂酶结构域。
[0525]
在一些实施例中,病毒载体的包装能力限制了可以包装到载体中的碱基编辑器的大小。例如,aav的包装能力可以是约4.5kb(例如,约3.0、3.5、4.0、4.5、5.0、5.5、或6.0kb),例如,包括一个或两个反向末端重复序列(itr),例如,145个碱基itr。
[0526]
在一些实施例中,重组aav(raav)包含在载体转基因盒侧翼的顺式作用145-bp itr,例如,提供高达4.5kb用于外源dna的包装。感染后,在一些情况下,raav可以表达本文所述的蛋白质,并通过以环状头对尾连环体形式游离地存在而持续存在而不整合到宿主基因组中。raav可以例如在体外和体内使用。在一些实施例中,aav介导的基因递送要求基因的编码序列的长度在大小上等于或大于野生型aav基因组。
[0527]
超过该大小的基因的aav递送和/或大的生理调节元件的使用可以例如通过将要递送的一种或多种蛋白质分成两个或更多个片段来完成。在一些实施例中,n末端片段与断裂内含肽-n融合。在一些实施例中,c末端片段与断裂内含肽-c融合。在实施例中,将片段包装到两个或更多个aav载体中。
[0528]
在一些实施例中,通过将大的转基因表达盒分成两个单独的半部分(5端和3端,或头和尾)来产生双重aav载体,例如,其中盒的每一半被包装在单个aav载体中(其《5kb)。在一些实施例中,然后可以在通过两个双重aav载体对同一细胞进行的共感染后实现全长转基因表达盒的重新组装。在一些实施例中,共感染之后是以下中的一项或多项:(1)5和3基因组之间的同源重组(hr)(双重aav重叠载体);(2)5和3基因组的itr介导的尾对头连环化(双重aav反式剪接载体);和/或(3)这两种机制的组合(双重aav杂合载体)。在一些实施例中,体内使用双重aav载体导致全长蛋白质的表达。在一些实施例中,双重aav载体平台的使用代表了用于大小大于约4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、或5.0kb的转基因的有效且可行的基因转移策略。在一些实施例中,aav载体还可用于例如在核酸和肽的体外生产中用靶核酸转导细胞。在一些实施例中,aav载体可用于体内和离体基因治疗程序(参见例如,west等人,virology[病毒学]160:38-47(1987);美国专利号4,797,368;wo 93/24641;kotin,human gene therapy[人类基因治疗]5:793-801(1994);muzyczka,j.clin.invest[临床研究杂志].94:1351(1994);其中每个通过引用以其全文并入本文)。
重组aav载体的构建描述于许多公开物中,包括美国专利号5,173,414;tratschin等人,mol.cell.biol.[分子细胞生物学]5:3251-3260(1985);tratschin,等人,mol.cell.biol.[分子细胞生物学]4:2072-2081(1984);hermonat和muzyczka,pnas[美国国家科学院院刊]81:6466-6470(1984);以及samulski等人,j.virol.[病毒学杂志]63:03822-3828(1989)(其通过引用以其全文并入本文)。
[0529]
在一些实施例中,本文所述的gene writer(例如,具有或不具有一种或多种指导核酸)可以使用aav、慢病毒、腺病毒或其他质粒或病毒载体类型进行递送,特别是使用来自以下文献的配制品和剂量:例如,美国专利号8,454,972(针对腺病毒的配制品、剂量)、美国专利号8,404,658(针对aav的配制品、剂量)和美国专利号5,846,946(针对dna质粒的配制品、剂量)以及来自临床试验和关于涉及慢病毒、aav和腺病毒的临床试验的公开物。例如,对于aav,施用途径、配制品和剂量可如美国专利号8,454,972和涉及aav的临床试验中所述。对于腺病毒,施用途径、配制品和剂量可如美国专利号8,404,658和涉及腺病毒的临床试验中所述。对于质粒递送,施用途径、配制品和剂量可如美国专利号5,846,946和涉及质粒的临床研究中所述。剂量可以基于或外推为平均70kg的个体(例如男性成人),并且可以针对患者、受试者、不同重量和物种的哺乳动物进行调整。施用频率在医学或兽医学从业者(例如医师、兽医师)的范围之内,其取决于常规因素,包括患者或受试者的年龄、性别、一般健康状况、其他状况以及着手解决的特定病症或症状。在一些实施例中,可以将病毒载体注射到目的组织中。对于细胞类型特异性gene writing,在一些实施例中,gene writer和任选的指导核酸的表达可以由细胞类型特异性启动子驱动。
[0530]
在一些实施例中,例如,由于纯化方法不需要可以激活免疫反应的细胞颗粒的超速离心,aav允许低毒性。在一些实施例中,aav允许引起插入诱变的可能性低,原因是例如它基本上不整合到宿主基因组中。
[0531]
在一些实施例中,aav具有约4.4、4.5、4.6、4.7、或4.75kb的包装限制。在一些实施例中,gene writer、启动子和转录终止子可以配合在单个病毒载体中。在一些情况下,spcas9(4.1kb)可能难以包装成aav。因此,在一些实施例中,使用长度比其他gene writer或碱基编辑器短的gene writer。在一些实施例中,gene writer小于约4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb、或1.5kb。
[0532]
aav可以是aav1、aav2、aav5或其任何组合。在一些实施例中,aav的类型是根据要靶向的细胞来选择的;例如,可选择aav血清型1、2、5或杂合衣壳aav1、aav2、aav5或其任何组合用于靶向脑或神经元细胞;或者可以选择aav4用于靶向心脏组织。在一些实施例中,选择aav8用于递送至肝脏。关于这些细胞的示例性aav血清型描述于例如grimm,d.等人,j.virol.[病毒学杂志]82:5887-5911(2008)(其通过引用以其全文并入本文)中。在一些实施例中,aav是指所有血清型、亚型和天然存在的aav以及重组aav。aav可用于指代病毒本身或其衍生物。在一些实施例中,aav包括aav1、aav2、aav3、aav3b、aav4、aav5、aav6、aav6.2、aav7、aavrh.64rl、aavhu.37、aavrh.8、aavrh.32.33、aav8、aav9、aav-dj、aav2/8、aavrhlo、aavlk03、av10、aav11、aav 12、rhlo、和其杂合体,禽aav、牛aav、犬aav、马aav、灵长类动物aav、非灵长类动物aav、和羊aav。各种aav血清型的基因组序列,以及天然末端重复序列(tr)、rep蛋白和衣壳亚基的序列是本领域已知的。此类序列可在文献或公共数据库如
genbank中找到。表7中列出了另外的示例性aav血清型。
[0533]
表7:病毒递送方式
[0534][0535][0536]
在一些实施例中,药物组合物(例如,包含如本文所述的aav的药物组合物)具有少于10%的空衣壳、少于8%的空衣壳、少于7%的空衣壳、少于5%的空衣壳、少于3%的空衣壳、或少于1%的空衣壳。在一些实施例中,药物组合物具有少于约5%的空衣壳。在一些实施例中,空衣壳的数量低于检测限。在一些实施例中,药物组合物具有少量空衣壳是有利的,原因是例如空衣壳可能产生例如很少或没有实质性的治疗益处的不良应答(例如,免疫
应答、炎性应答、肝脏应答和/或心脏应答)。
[0537]
在一些实施例中,药物组合物中的残余宿主细胞蛋白(rhcp)少于或等于100ng/ml rhcp/1x10
13
vg/ml,例如,少于或等于40ng/ml rhcp/1x10
13
vg/ml或1-50ng/ml rhcp/1x10
13
vg/ml。在一些实施例中,药物组合物包含少于10ng rhcp/l.0x10
13
vg、或少于5ng rhcp/1.0x10
13
vg、少于4ng rhcp/1.0x10
13
vg、或少于3ng rhcp/1.0x10
13
vg,或介于之间的任何浓度。在一些实施例中,药物组合物中的残余宿主细胞dna(hcdna)少于或等于5x106pg/ml hcdna/1x10
13
vg/ml、少于或等于1.2x106pg/ml hcdna/1x10
13
vg/ml、或1x105pg/ml hcdna/1x10
13
vg/ml。在一些实施例中,所述药物组合物中的残余宿主细胞dna少于5.0x105pg/1x10
13
vg、少于2.0x105pg/l.0x10
13
vg、少于1.1x105pg/1.0x10
13
vg、少于1.0x105pg hcdna/1.0x10
13
vg、少于0.9x105pg hcdna/1.0x10
13
vg、少于0.8x105pg hcdna/1.0x10
13
vg,或介于之间的任何浓度。
[0538]
在一些实施例中,药物组合物中的残余质粒dna少于或等于1.7x105pg/ml/1.0x10
13
vg/ml、或1x105pg/ml/1x1.0x10
13
vg/ml、或1.7x106pg/ml/1.0x10
13
vg/ml。在一些实施例中,药物组合物中的残余dna质粒少于10.0x105pg/1.0x10
13
vg、少于8.0x105pg/1.0x10
13
vg或少于6.8x105pg/1.0x10
13
vg。在实施例中,药物组合物包含少于0.5ng/1.0x10
13
vg、少于0.3ng/1.0x10
13
vg、少于0.22ng/1.0x10
13
vg或少于0.2ng/1.0x10
13
vg或任何中间浓度的牛血清白蛋白(bsa)。在实施例中,药物组合物中的benzonase为少于0.2ng/1.0x10
13
vg、少于0.1ng/1.0x10
13
vg、少于0.09ng/1.0x10
13
vg、少于0.08ng/1.0x10
13
vg或任何中间浓度。在实施例中,药物组合物中的泊洛沙姆188(poloxamer 188)为约10至150ppm、约15至100ppm或约20至80ppm。在实施例中,药物组合物中的铯为少于50pg/g(ppm)、少于30pg/g(ppm)或少于20pg/g(ppm)或任何中间浓度。
[0539]
在实施例中,药物组合物包含少于10%、少于8%、少于7%、少于6%、少于5%、少于4%、少于3%、少于2%或介于之间的任何百分比的总杂质,例如,如通过sds-page测定。在实施例中,例如,如通过sds-page测定的总纯度为大于90%、大于92%、大于93%、大于94%、大于95%、大于96%、大于97%、大于98%、或介于之间的任何百分比。在实施例中,例如,如通过sds-page测量的,没有单一的未命名相关杂质多于5%、多于4%、多于3%或多于2%、或介于之间的任何百分比。在实施例中,药物组合物包含的填充的衣壳相对于总衣壳(例如,如通过分析型超速离心测量的峰1 峰2)的百分比为大于85%、大于86%、大于87%、大于88%、大于89%、大于90%、大于91%、大于91.9%、大于92%、大于93%,或介于之间的任何百分比。在药物组合物的实施例中,通过分析型超速离心在峰1中测量的填充的衣壳的百分比为20%-80%、25%-75%、30%-75%、35%-75%或37.4%-70.3%。在药物组合物的实施例中,通过分析型超速离心在峰2中测量的填充的衣壳的百分比为20%-80%、20%-70%、22%-65%、24%-62%、或24.9%-60.1%。
[0540]
在一个实施例中,药物组合物包含1.0至5.0x10
13
vg/ml、1.2至3.0x10
13
vg/ml或1.7至2.3x10
13
vg/ml的基因组效价。在一个实施例中,药物组合物显示出小于5cfu/ml、小于4cfu/ml、小于3cfu/ml、小于2cfu/ml或小于1cfu/ml或任何中间浓度的生物负载。在实施例中,根据usp,例如usp《85》(通过引用以其全文并入)的内毒素的量少于1.0eu/ml、少于0.8eu/ml或少于0.75eu/ml。在实施例中,根据usp,例如usp《785》(通过引用以其全文并入)的药物组合物的渗透压摩尔浓度为350至450mosm/kg、370至440mosm/kg或390至430mosm/
protocols[蛋白纯化方案](methods in molecular biology[分子生物学方法]),humana press[胡玛纳出版社](2010)。
[0550]
在一些实施例中,gene writer
tm
系统、多肽和/或模板核酸(例如,模板dna)符合某些质量标准。在一些实施例中,通过本文所述的方法产生的gene writer
tm
系统、多肽和/或模板核酸(例如,模板dna)符合某些质量标准。因此,在一些方面,本披露涉及制造符合某些质量标准的gene writer
tm
系统、多肽和/或模板核酸的方法,例如,其中对所述质量标准进行测定。在一些方面,本披露还涉及在gene writer
tm
系统、多肽和/或模板核酸中测定所述质量标准的方法。在一些实施例中,质量标准包括但不限于以下中的一项或多项(例如,1、2、3、4、5、6、7、8、9、10、11、或12项):
[0551]
(i)模板dna或编码genewriter多肽的mrna的长度,例如,该dna或mrna的长度是否超出参考长度或在参考长度范围内,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的dna或mrna的长度大于100、125、150、175、或200个核苷酸;
[0552]
(ii)mrna上聚a尾的存在、不存在和/或长度,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的mrna含有聚a尾(例如,长度为至少5、10、20、30、50、70、100个核苷酸的聚a尾);
[0553]
(iii)mrna上5’帽的存在、不存在和/或类型,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的mrna含有5’帽,例如该帽是否是7-甲基鸟苷帽,例如o-me-m7g帽;
[0554]
(iv)mrna中一种或多种经修饰的核苷酸(例如,选自假尿苷、二氢尿苷、肌苷、7-甲基鸟苷、1-n-甲基假尿苷(1-me-ψ)、5-甲氧基尿苷(5-mo-u)、5-甲基胞苷(5mc)或锁定的核苷酸)的存在、不存在和/或类型,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的mrna含有一种或多种经修饰的核苷酸;
[0555]
(v)模板dna或mrna的稳定性(例如,随着时间的推移和/或在预选条件下),例如是否至少80%、85%、90%、95%、96%、97%、98%、或99%的dna或mrna在稳定性测试后保持完整(例如,长度大于100、125、150、175或200个核苷酸);
[0556]
(vi)模板dna或mrna在用于修饰dna的系统中的效力,例如,在测定了包含dna或mrna的系统的效力之后,是否至少1%的靶位点被修饰;
[0557]
(vii)多肽、第一多肽或第二多肽的长度,例如,该多肽、第一多肽或第二多肽的长度是否超出参考长度或在参考长度范围内,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的多肽、第一多肽或第二多肽的长度大于600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1600、1700、1800、1900、或2000个氨基酸(并且任选地,长度不超过2500、2000、1500、1400、1300、1200、1100、1000、900、800、700、或600个氨基酸);
[0558]
(viii)多肽、第一多肽或第二多肽上翻译后修饰的存在、不存在和/或类型,例如是否至少80%、85%、90%、95%、96%、97%、98%、或99%的多肽、第一多肽或第二多肽含有磷酸化、甲基化、乙酰化、肉豆蔻酰化、棕榈酰化、异戊二烯化、glipyatyon或脂酰化,或其任何组合;
[0559]
(ix)多肽、第一多肽或第二多肽中一种或多种人工、合成或非典型氨基酸(例如,选自鸟氨酸、β-丙氨酸、gaba、δ-氨基乙酰丙酸、paba、d-氨基酸(例如,d-丙氨酸或d-谷氨
酸)、氨基异丁酸、脱氢丙氨酸、胱硫醚、羊毛硫氨酸、甲烯胱氨酸、二氨基庚二酸、高丙氨酸、正缬氨酸、正亮氨酸、高正亮氨酸(homonorleucine)、高丝氨酸、o-甲基-高丝氨酸和o-乙基-高丝氨酸、乙硫氨酸、硒代半胱氨酸、硒代高半胱氨酸、硒代甲硫氨酸、硒代乙硫氨酸、碲代半胱氨酸或碲代甲硫氨酸)的存在、不存在和/或类型,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的多肽、第一多肽或第二多肽含有一个或多个人工、合成或非典型氨基酸;
[0560]
(x)多肽、第一多肽或第二多肽的稳定性(例如,随着时间的推移和/或在预选条件下),例如是否至少80%、85%、90%、95%、96%、97%、98%、或99%的多肽、第一多肽或第二多肽在稳定性测试后保持完整(例如,长度大于600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1600、1700、1800、1900、或2000个氨基酸(并且任选地,长度不超过2500、2000、1500、1400、1300、1200、1100、1000、900、800、700、或600个氨基酸));
[0561]
(xi)多肽、第一多肽或第二多肽在用于修饰dna的系统中的效力,例如在测定了包含多肽、第一多肽或第二多肽的系统的效力之后是否至少1%的靶位点被修饰;或
[0562]
(xii)热原、病毒、真菌、细菌病原体或宿主细胞蛋白中的一种或多种的存在、不存在、和/或水平,例如,系统是否不含或基本上不含热原、病毒、真菌、细菌病原体或宿主细胞蛋白污染。
[0563]
在一些实施例中,本文所述的系统或药物组合物不含内毒素。
[0564]
在一些实施例中,对热原、病毒、真菌、细菌病原体和/或宿主细胞蛋白中的一种或多种的存在、不存在、和/或水平进行确定。在实施例中,对系统是否不含或基本上不含热原、病毒、真菌、细菌病原体和/或宿主细胞蛋白污染进行确定。
[0565]
在一些实施例中,如本文所述的药物组合物或系统具有以下特征中的一项或多项(例如,1、2、3或4项):
[0566]
(a)相对于编码多肽的rna的少于1%(例如,少于0.5%、0.4%、0.3%、0.2%、或0.1%)的dna模板,例如,以摩尔计;
[0567]
(b)相对于编码多肽的rna的少于1%(例如,少于0.5%、0.4%、0.3%、0.2%、或0.1%)的未加帽rna,例如,以摩尔计;
[0568]
(c)相对于编码多肽的rna的小于1%(例如,小于0.5%、0.4%、0.3%、0.2%、或0.1%)的部分长度rna,例如,以摩尔计;
[0569]
(d)基本上缺乏未反应的帽二核苷酸。
[0570]
示例性异源对象序列
[0571]
在一些实施例中,本文提供的系统或方法包含异源对象序列,其中该异源对象序列或其反向互补序列编码蛋白质(例如,抗体)或肽。在一些实施例中,疗法是由监管机构例如fda批准的疗法。
[0572]
在一些实施例中,蛋白质或肽是来自thpdb数据库的蛋白质或肽(usmani等人plos one[公共科学图书馆
·
综合]12(7):e0181748(2017),其通过引用以其全文并入本文)。在一些实施例中,蛋白质或肽是表8中披露的蛋白质或肽。在一些实施例中,本文披露的系统或方法,例如包含gene writer的那些系统或方法,可用于将来自表8的蛋白质或肽的表达盒整合到宿主细胞中,以使蛋白质或肽能够在宿主中表达。在一些实施例中,表8第一列中
的蛋白质或肽的序列可以在表8第三列中提供的专利或申请中找到,这些专利或申请通过引用以其全文并入。
[0573]
在一些实施例中,蛋白质或肽是lu等人j biomed sci[生物医学科学杂志]27(1):1(2020)的表1中披露的抗体,该文献通过引用以其全文并入本文。在一些实施例中,蛋白质或肽是表9中披露的抗体。在一些实施例中,本文披露的系统或方法,例如包含gene writer的那些系统或方法,可用于将来自表9的抗体的表达盒整合到宿主细胞中,以使抗体能够在宿主中表达。在一些实施例中,本文所述的系统或方法用于在具有表9的第3列的适应证的受试者中表达与表9的第2列的靶标结合的药剂(例如,表9的第1列的单克隆抗体)。
[0574]
表8.示例性蛋白质和肽治疗剂。
[0575]
[0576]
[0577]
[0578]
[0579]
[0580]
[0581]
[0582]
[0583]
[0584]
[0585][0586]
表9.示例性单克隆抗体疗法。
[0587]
[0588]
[0589]
[0590][0591]
应用
[0592]
通过将编码基因整合到dna序列模板中,gene writer系统可以满足治疗需求,例如,通过在具有功能丧失性突变的个体中提供治疗性转基因(例如,包含在如本文所述的对象序列中)的表达,通过以正常转基因代替功能获得性突变,通过提供调节序列以消除功能获得性突变表达,和/或通过控制可操作地连接的基因、转基因及其系统的表达。在某些实施例中,对象序列(例如,异源对象序列)包含编码对宿主细胞的治疗需要特异的功能性元件(例如,多肽或非编码rna,例如,如本文所述)的编码序列。在一些实施例中,对象序列(例如,异源对象序列)包含启动子,例如组织特异性启动子或增强子。在一些实施例中,启动子可以与编码序列可操作地连接。
[0593]
在实施例中,gene writer
tm
基因编辑器系统可以提供包含例如治疗剂(例如,治疗性转基因)的对象序列,该治疗剂表达例如替换型血液因子或替换型酶例如溶酶体酶。例如,本文所述的组合物、系统和方法可用于在靶人基因组中表达半乳糖苷酶α或β以治疗法布里病(fabry disease);针对戈谢病(gaucher disease)的伊米苷酶、塔格苷酶(taliglucerase)α、维拉苷酶(velaglucerase)α或阿糖脑苷酶;针对溶酶体酸性脂肪酶缺乏症(沃尔曼病(wolman disease)/cesd)的塞贝脂酶α;针对黏多醣贮积症的拉罗尼酶、艾度硫酸酯酶、依罗硫酸酯酶α、或加硫酶;针对庞贝病的阿糖苷酶α。例如,本文所述的组合物、系统和方法可用于在靶人基因组中表达因子i、ii、v、vii、x、xi、xii或xiii,以改善血液因子缺陷。
[0594]
施用
[0595]
本文所述的组合物和系统可以在体外或体内使用。在一些实施例中,例如在体外或体内将系统或系统的组分递送至细胞(例如,哺乳动物细胞,例如人细胞)。本领域技术人员将理解,可以以多肽、核酸(例如,dna、rna)及其组合的形式递送gene writer系统的组分。
[0596]
在一些实施例中,系统和/或系统的组分以核酸的形式递送。例如,可以以编码重组酶多肽的dna或rna的形式递送重组酶多肽。在一些实施例中,系统或系统的组分(例如,插入dna和编码重组酶多肽的核酸分子)在1、2、3、4或更多个不同的核酸分子上递送。在一些实施例中,系统或系统的组分作为dna和rna的组合递送。在一些实施例中,系统或系统的组分作为dna和蛋白质的组合递送。在一些实施例中,系统或系统的组分作为rna和蛋白质的组合递送。在一些实施例中,重组酶多肽作为蛋白质递送。
[0597]
在一些实施例中,使用载体将系统或系统的组分递送至细胞,例如哺乳动物细胞或人细胞。载体可以是例如质粒或病毒。在一些实施例中,递送是体内、体外、离体或原位的。在一些实施例中,病毒是腺相关病毒(aav)、慢病毒、腺病毒。在一些实施例中,系统或系统的组分与病毒样颗粒或病毒体一起被递送至细胞。在一些实施例中,递送使用一种以上的病毒、病毒样颗粒或病毒体。
[0598]
在一个实施例中,本文所述的组合物和系统可以配制在脂质体或其他类似的囊泡中。脂质体是球形囊泡结构,这些球形囊泡结构由围绕内部水性隔室的单层或多层的脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。脂质体可以是阴离子的、中性的或阳离子的。脂质体具有生物相容性,无毒,可以递送亲水性和亲脂性药物分子,保护其载物免受血浆酶的降解,并且将其负载转运穿过生物膜和血脑屏障(bbb)(关于综述,参见例如,spuch和navarro,journal of drug delivery[药物递送杂志],第2011卷,文章id 469679,第12页,2011.doi:10.1155/2011/469679)。
[0599]
囊泡可以由若干种不同类型的脂质制成;然而,磷脂最常用于生成脂质体作为药物载剂。用于制备多层囊泡脂质的方法是本领域已知的(参见例如美国专利号6,693,086,其关于多层囊泡脂质制备的传授内容通过引用并入本文)。尽管当脂质膜与水性溶液混合时,囊泡形成可以是自发的,但也可以通过经由使用均质器、超声波仪或挤压设备以振荡的形式施加力来加快囊泡形成(关于综述,参见例如,spuch和navarro,journal of drug delivery[药物递送杂志],第2011卷,文章id 469679,第12页,2011.doi:10.1155/2011/469679)。可以通过挤出通过具有减小尺寸的过滤器来制备挤出的脂质,如templeton等人,nature biotech[自然生物技术],15:647-652,1997中所述,该文献关于挤出脂质制备的传授内容通过引用并入本文。
[0600]
脂质纳米颗粒是为本文所述的药物组合物提供生物相容性和可生物降解的递送系统的载剂的另一个实例。纳米结构化的脂质载剂(nlc)是经修饰的固体脂质纳米颗粒(sln),这些经修饰的固体脂质纳米颗粒保留了sln的特征、改善了药物稳定性和负载能力、并且防止了药物泄漏。聚合物纳米颗粒(pnp)是药物递送的重要组成部分。这些纳米颗粒可以有效地将药物递送引导至特定靶标并且改善药物稳定性和受控的药物释放。也可以使用脂质聚合物纳米颗粒(pln),即一种组合了脂质体和聚合物的新型载剂。这些纳米颗粒具有pnp和脂质体的互补优势。pln由核-壳结构构成;聚合物核提供了稳定的结构,并且磷脂壳提供了良好的生物相容性。这样,这两种组分增加了药物包封效率、促进了表面修饰、并且防止了水溶性药物的泄漏。对于综述,参见例如,li等人2017,nanomaterials[纳米材料]7,122;doi:10.3390/nano7060122。
[0601]
外泌体也可用作本文所述的组合物和系统的药物递送媒介物。对于综述,参见ha等人2016年7月.acta pharmaceutica sinica b[药学学报]第6卷第4期,第287-296页;
https://doi.org/10.1016/j.apsb.2016.02.001。
[0602]
在一些实施例中,本文所述的系统的至少一种组分包含融合体。融合体与靶细胞相互作用并融合,并因此可用作多种分子的递送媒介物。它们通常由封闭管腔或腔的两亲性脂质双层和与两亲性脂质双层相互作用的融合原组成。融合原组分已被证明是可工程化的,以便赋予融合和有效负载递送的靶细胞特异性,从而允许产生具有可编程细胞特异性的递送媒介物(参见例如,pct公开号wo/2020014209中与融合体设计、制备和使用相关的部分,该pct公开通过引用以其全文并入本文)。
[0603]
可以将gene writer系统引入细胞、组织和多细胞生物中。在一些实施例中,系统或系统的组分经由机械手段或物理手段递送至细胞。
[0604]
以下文献中描述了蛋白治疗剂的配制品:meyer(编辑),therapeutic protein drug products:practical approaches to formulation in the laboratory,manufacturing,and the clinic[治疗性蛋白药物产品:实验室、制造和临床中配制品的实践方法],woodhead publishing series[伍德海德出版系列](2012)。
[0605]
在一些实施例中,本文所述的gene writer
tm
系统被递送至来自大脑、小脑、肾上腺、卵巢、胰腺、甲状旁腺、垂体、睾丸、甲状腺、乳房、脾脏、扁桃体、胸腺、淋巴结、骨髓、肺、心肌、食道、胃、小肠、结肠、肝脏、唾液腺、肾脏、前列腺、血液、或其他细胞或组织类型的组织或细胞。在一些实施例中,本文所述的gene writer
tm
系统用于治疗疾病,例如癌症、炎性疾病、传染病、遗传缺陷或其他疾病。癌症可以是大脑、小脑、肾上腺、卵巢、胰腺、甲状旁腺、垂体、睾丸、甲状腺、乳房、脾脏、扁桃体、胸腺、淋巴结、骨髓、肺、心肌、食道、胃、小肠、结肠、肝脏、唾液腺、肾脏、前列腺、血液、或其他细胞或组织类型的癌症,并且可以包括多种癌症。
[0606]
在一些实施例中,本文所述的gene writer
tm
系统通过肠内施用(例如口服、直肠、胃肠、舌下、唇下或颊部施用)来施用。在一些实施例中,本文所述的gene writer
tm
系统通过肠胃外施用(例如,静脉内、肌内、皮下、皮内、硬膜外、脑内、脑室内、表皮、经鼻、动脉内、关节内、海绵窦内、眼内、骨内输注、腹膜内、鞘内、宫内、阴道内、膀胱内、血管周围或经粘膜施用)来施用。在一些实施例中,本文所述的gene writer
tm
系统通过局部施用(例如,透皮施用)来施用。
[0607]
在一些实施例中,如本文所述的gene writer
tm
系统可用于修饰动物细胞、植物细胞或真菌细胞。在一些实施例中,如本文所述的gene writer
tm
系统可用于修饰哺乳动物细胞(例如,人细胞)。在一些实施例中,如本文所述的gene writer
tm
系统可用于修饰来自家畜动物(例如,牛、马、绵羊、山羊、猪、美洲驼、羊驼、骆驼、牦牛、鸡、鸭、鹅或鸵鸟)的细胞。在一些实施例中,如本文所述的gene writer
tm
系统可用作实验室工具或研究工具,或用于实验室方法或研究方法中,例如以修饰动物细胞例如哺乳动物细胞(例如,人细胞)、植物细胞或真菌细胞。
[0608]
在一些实施例中,如本文所述的gene writer
tm
系统可用于表达蛋白质、模板或异源对象序列(例如,在动物细胞例如哺乳动物细胞(例如,人细胞)、植物细胞中、或真菌细胞中)。在一些实施例中,如本文所述的gene writer
tm
系统可用于在诱导型启动子(例如,小分子诱导型启动子)的控制下表达蛋白质、模板或异源对象序列。在一些实施例中,gene writing系统或其有效负载被设计用于例如通过使用诱导型启动子的可调控制。例如,驱动目的基因的启动子(例如,tet)在整合时可能是沉默的,但在一些情况下,可能在暴露于小
分子诱导剂(例如,强力霉素)时被激活。在一些实施例中,可调表达允许基因(例如,治疗性基因)的治疗后控制,例如,允许小分子依赖性给药效果。在实施例中,小分子依赖性给药效果包括在时间和/或空间上改变基因产物的水平,例如,通过局部施用。在一些实施例中,本文所述的系统中使用的启动子可以是诱导型的,例如应答于宿主的内源分子和/或对其施用的外源小分子。
[0609]
适合适应证的治疗
[0610]
在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)用于治疗疾病、障碍或病症。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分用于治疗表10-15中任一个中所列的疾病、障碍或病症。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分用于治疗造血干细胞(hsc)疾病、障碍或病症,例如,如表10中所列。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分用于治疗肾脏疾病、障碍或病症,例如,如表11中所列。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分用于治疗肝脏疾病、障碍或病症,例如,如表12中所列。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分用于治疗肺疾病、障碍或病症,例如,如表13中所列。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分用于治疗骨骼肌疾病、障碍或病症,例如,如表14中所列。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分用于治疗皮肤疾病、障碍或病症,例如,如表15中所列。
[0611]
表10-15:针对将用于重组酶的转gene writer选择的适应证
[0612]
表10:hsc
[0613]
[0614][0615]
表11:肾脏
[0616]
疾病受影响的基因先天性肾病综合征nphs2胱氨酸病ctns
[0617]
表12:肝脏
[0618]
[0619][0620]
表13:肺
[0621]
[0622][0623]
表14:骨骼肌
[0624]
疾病受影响的基因贝克肌营养不良dmd贝克肌强直clcn1贝特莱姆肌病(bethlem myopathy)col6a2中心核肌病,x-连接的(管状(motubular))mtm1先天性肌无力综合征chrne进行性假肥大性肌营养不良dmd埃默里-德赖弗斯肌营养不良,adlmna肢带肌营养不良2acapn3肢带肌营养不良,2d型sgca
[0625]
表15:皮肤
[0626][0627]
在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)用于治疗遗传疾病、障碍或病症。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)用于治疗被诊断患有遗传疾病、障碍或病症的受试者(例如,人类患者)。在一些实施例中,遗传疾病、障碍或病症与特定基因型(例如,杂合或纯合基因型)相关。在一些实施例中,遗传疾病、障碍或病症与特定突变(例如,取代、缺失或插入,例如核苷酸扩增)相关。在一些实施例中,遗传疾病、障碍或病症是囊性纤维化或鸟氨酸氨甲酰基转移酶(otc)缺乏症。在一些实施例中,本文所述的用
于治疗遗传疾病、障碍或病症的gene writer
tm
系统包含异源对象序列,该异源对象序列包含基因的功能性(例如,野生型)拷贝,受试者(例如,人类患者)缺乏该功能性拷贝(例如,完全或在靶细胞群体中缺乏)。在一些实施例中,基因的功能性拷贝包含功能性(例如,野生型)cftr基因或otc基因。
[0628]
在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分(例如,本文所述的多肽或核酸)用于治疗具有超出健康范围水平的生物标志物(例如,与疾病、障碍或病症(例如遗传疾病、障碍或病症)相关的生物标志物)的受试者(例如,人类患者)。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)用于治疗诊断为具有超出健康范围水平的生物标志物(例如,与疾病、障碍或病症(例如遗传疾病、障碍或病症)相关的生物标志物)的受试者(例如,人类患者)。
[0629]
在一些实施例中,生物标志物的存在和/或水平和/或受试者(例如,人类患者)的基因型在使用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)治疗之前确定。在一些实施例中,生物标志物的存在和/或水平和/或受试者(例如,人类患者)的基因型在使用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)治疗之后确定。在一些实施例中,生物标志物的存在和/或水平和/或受试者(例如,人类患者)的基因型在使用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)治疗之前和之后确定。
[0630]
在一些实施例中,应答于确定生物标志物在受试者(例如,人类患者)体内以超出正常和/或健康范围的水平存在而施用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)。在一些实施例中,应答于在第一次施用本文所述的gene writer
tm
系统或其组分或部分之后确定生物标志物在受试者(例如,人类患者)体内以超出正常和/或健康范围的水平存在而再次施用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)。在一些实施例中,应答于确定受试者(例如,人类患者)例如或该受试者体内的靶细胞群体具有特定基因型(例如,与疾病、障碍或病症相关的基因型)而施用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)。在一些实施例中,应答于在第一次施用本文所述的gene writer
tm
系统或其组分或部分之后确定受试者(例如,人类患者)例如或该受试者体内的靶细胞群体具有特定基因型(例如,与疾病、障碍或病症相关的基因型)而再次施用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)。在一些实施例中,继续或重复施用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸),直至生物标志物在受试者(例如,人类患者)体内以在正常和/或健康范围内的水平存在。在一些实施例中,继续或重复施用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸),直至受试者(例如,人类患者)例如或该受试者体内的靶细胞群体不再具有该特定基因型(例如,与疾病、障碍或病症相关的基因型)。
[0631]
在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)用于产前治疗疾病、障碍或病症(例如,在人类受试者的子宫内,例如胚胎或胎儿)。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)用于产后治疗疾病、障碍或病症(例如,在人类婴儿、幼儿或儿童中)。在一些实施例中,本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核
酸)用于治疗新生儿疾病、障碍或病症。
[0632]
在一些实施例中,用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)治疗的受试者(例如,人类患者)例如或该受试者体内的靶细胞群体的基因型随着受试者的发展保持稳定。在该上下文中,稳定可以指在用本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)进行的治疗完成之后,受试者(例如,或该受试者体内的靶细胞群体)的基因型没有发生另外的改变。在该上下文中,稳定可以另外地或替代性地指由本文所述的gene writer系统对受试者的基因型进行的改变的持续存在。在不希望受理论约束的情况下,可能希望避免、防止或尽量减少受试者基因型的除了由gene writer系统造成的那些改变之外的另外的改变。另外地或替代性地,可能希望受试者(例如,或该受试者体内的靶细胞群体)的基因型的改变在治疗完成后持续存在(例如,持续至少选定的时间间隔,例如,无限期地)。在一些实施例中,受试者,例如或该受试者体内的靶细胞群体的基因型在治疗完成后在治疗后的选定时间间隔(例如,1、2、3、4、5、6、或7天,或1、2、3、4、5、6、7、8、9、或10周,或3、4、5、6、7、8、9、10、或11个月,或1、2、3、4、5、6、7、8、9、或10年(例如,无限期地))与该受试者,例如或该受试者体内的靶细胞群体的基因型相同。在一些实施例中,由本文所述的gene writer
tm
系统或其组分或部分(例如,如本文所述的多肽或核酸)对受试者,例如或该受试者体内的靶细胞群体的基因型进行的改变在治疗后持续存在至少选定的时间间隔,例如,1、2、3、4、5、6、或7天,或1、2、3、4、5、6、7、8、9、或10周,或3、4、5、6、7、8、9、10、或11个月,或1、2、3、4、5、6、7、8、9、或10年(例如,无限期地)。
[0633]
植物修饰方法
[0634]
本文所述的gene writer系统可用于修饰植物或植物部分(例如,叶、根、花、果实或种子)例如以增加植物的适应度。
[0635]
a.向植物的递送
[0636]
本文提供了将本文所述的gene writer系统递送至植物的方法。包括用于通过使植物或其一部分与gene writer系统接触而将gene writer系统递送至植物的方法。这些方法可用于修饰植物以例如增加植物的适应度。
[0637]
更具体而言,在一些实施例中,本文所述的核酸(例如,编码genewriter的核酸)可以在载体中编码,例如邻近植物启动子(例如,植物载体(例如,phuc411)中的玉蜀黍泛素启动子(zmubi))而插入。在一些实施例中,本文所述的核酸经由农杆菌被引入植物(例如,粳稻)或植物的一部分(例如,植物的愈伤组织)。在一些实施例中,本文所述的系统和方法可以通过用无效等位基因(例如,在起始密码子处含有碱基取代)替换植物基因(例如,潮霉素磷酸转移酶(hpt))而用于植物。xu等人.development of plant prime-editing systems for precise genome editing[用于精确基因组编辑的植物引导编辑系统的开发],2020,plant communications[植物通讯]描述了用于修饰植物基因组的系统和方法。
[0638]
在一方面,本文提供了一种增加植物的适应度的方法,该方法包括向该植物递送本文所述的gene writer系统(例如,以有效的量和持续时间)以相对于未经处理的植物(例如,未递送该gene writer系统的植物)增加该植物的适应度。
[0639]
由于递送gene writer系统而产生的植物适应度的增加能以多种方式表现出来,例如,从而导致植物的更好的生产,例如改善的产率,改善的植物活力或从植物中收获的产物的质量,农业或园艺业所希望的收获前或收获后的性状(例如,味道、外观、货架期)的改
善,或在其他方面使人类受益的性状(例如,减少变应原产生)的改善。改善的植物产率涉及相对于在相同条件下但不应用本发明组合物而生产的植物的相同产品的产率或与应用常规植物修饰剂相比,按可测量量计植物的产品的产率的增加(例如,如通过植物生物质、谷物、种子或果实产率、蛋白质含量、碳水化合物或油含量或叶面积测量的)。例如,产率可以增加至少约0.5%、约1%、约2%、约3%、约4%、约5%、约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约100%、或大于100%。在一些情况下,相对于未处理的植物,该方法有效地将产率增加约2x倍、5x倍、10x倍、25x倍、50x倍、75x倍、100x倍、或大于100x倍。产率可以以在某种基础上植物或植物的产品的重量或体积计的量来表示。基础可以以时间、生长面积、生产的植物的重量、或所用原材料的量来表示。例如,此类方法可以增加植物组织的产率,这些植物组织包括但不限于:种子、果实、仁、圆荚、块茎、根和叶。
[0640]
由于递送gene writer系统而产生的植物适应度的增加也可以通过其他手段来测量,如相对于在相同条件下但不施用本发明组合物或应用常规植物修饰剂而生产的植物的相同因素,以活力等级的增加或改善、林分(每单位面积的植物数量)的增加、植物高度、秆围、秆长、叶数量、叶尺寸、植物冠层、视觉外观(诸如更绿的叶颜色)、根等级、出苗、蛋白质含量、分蘖的增加、更大的叶、更多的叶、更少的死的基生叶、分蘖更强、所需肥料更少、所需种子更少、分蘖更多产、开花更早、提早的谷物或种子成熟度、更少的植物节(verse)(倒伏)、芽生长的增加、更早萌发、或这些因素的任何组合,按可测量或可察觉的量来测量。
[0641]
因此,本文提供了一种修饰植物的方法,该方法包括向植物递送有效量的本文提供的gene writer系统中的任一种,其中该方法修饰该植物并由此相对于未经处理的植物引入或增加该植物中的有益性状(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%,70%、80%、90%、100%或大于100%)。特别地,该方法相对于未经处理的植物可以增加植物的适应度(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
[0642]
在一些情况下,植物适应度的增加是以下方面的增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%):抗病性、耐旱性、耐热性、耐寒性、耐盐性、金属耐受性、除草剂耐受性、化学耐受性、水分利用效率、氮利用、对氮胁迫的抗性、固氮、有害生物抗性、草食动物抗性、病原体抗性、产率、限水条件下的产率、活力、生长、光合能力、营养、蛋白质含量、碳水化合物含量、油含量、生物质、芽长、根长、根结构、种子重量、或可收获产物的量。
[0643]
在一些情况下,适应度的增加是发育、生长、产率、对非生物胁迫源的抗性或对生物胁迫源的抗性增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。非生物胁迫是指植物或植物部分所经受的环境胁迫条件,包括例如干旱胁迫、盐胁迫、热胁迫、冷胁迫和低营养胁迫。生物胁迫是指植物或植物部分所经受的环境胁迫条件,包括例如线虫胁迫、食草昆虫胁迫、真菌病原体胁迫、细菌病原体胁迫或病毒病原体胁迫。胁迫可以是暂时的,例如几个小时,几天,几个月或永久的,例如持续植物的一生。
[0644]
在一些,从植物收获的产物质量中(10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。例如,植物适应度的增加可以是从植物收获的产物的商业上有利的特征(例如,味道或外观)的改善。在其他情况下,植物适应度的增加是从植物收获
的产物的货架期的增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
[0645]
可替代地,适应度的增加可以是对人类或动物健康有益的性状的改变,例如变应原产生的减少。例如,适应度的增加可以是刺激动物(例如人)中免疫应答的变应原(例如花粉)的产生减少(例如,减少约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
[0646]
植物的修饰(例如,适应度的增加)可能来自一个或多个植物部分的修饰。例如,可以通过接触植物的叶、种子、花粉、根、果实、芽、花、细胞,原生质体或组织(例如分生组织)来修饰植物。因此,在另一方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的花粉与有效量的本文中植物修饰组合物中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
[0647]
在又另一方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的种子与有效量的本文披露的gene writer系统中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
[0648]
在另一方面,本文提供了一种包括使植物的原生质体与有效量的本文所述的gene writer系统中的任一种接触的方法,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%,或大于100%)。
[0649]
在另外的方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的植物细胞与有效量的本文所述的gene writer系统中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%,或大于100%)。
[0650]
在另一方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的分生组织与有效量的本文的植物修饰组合物中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%,或大于100%)。
[0651]
在另一方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的胚与有效量的本文的植物修饰组合物中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%,或大于100%)。
[0652]
b.应用方法
[0653]
本文所述的植物可以以允许将组合物递送或施用于植物的任何合适方式暴露于本文所述的任何gene writer系统组合物。gene writer系统可以单独递送或与其他活性(例如,肥料剂)或非活性物质组合递送,并且可以通过例如喷雾、注射(例如显微注射)、通过植物、倾倒、浸渍,以浓缩液体、凝胶、溶液、悬浮液、喷雾、粉剂、丸剂、块剂、砖剂等(配制成递送有效浓度的植物修饰组合物)的形式来应用。应用本文所述的组合物的量和位置通常取决于植物的习性、植物可被植物修饰组合物靶向的生命周期阶段、将施用的位置、以及
植物修饰组合物的物理和功能特征。
[0654]
在一些情况下,通过例如背包喷雾、空中喷雾、作物喷雾/尘剂等将组合物直接喷雾到植物(例如作物)上。在将gene writer系统递送至植物的情况下,接受gene writer系统的植物可以处于植物生长的任何阶段。例如,配制的植物修饰组合物可以在植物生长的早期阶段以种子包衣或根处理剂的形式或在作物周期的后期阶段以总植物处理剂的形式来应用。在一些情况下,植物修饰组合物可以作为局部剂应用于植物。
[0655]
此外,可以将gene writer系统(例如,在植物生长的土壤中,或在用于浇灌植物的水中)作为通过植物的组织而吸收和分布的内吸剂(systemic agent)应用。在一些情况下,植物或食物生物可以经遗传转化以表达gene writer系统。
[0656]
延迟释放或持续释放也可以通过以下方式完成:向gene writer系统或具有一种或多种植物修饰组合物的组合物包覆可溶解或生物可侵蚀的包衣层(诸如明胶),该包衣层在使用环境中溶解或侵蚀,从而然后使植物修饰组合物gene writer系统位置可用,或者通过将药剂分散在可溶解或可侵蚀的基质中。此类持续释放和/或分配方式装置可有利地用于始终维持本文所述的一种或多种植物修饰组合物的有效浓度。
[0657]
在一些情况下,将gene writer系统递送至植物的一部分,例如叶、种子、花粉、根、果实、芽、或花,或其组织、细胞或原生质体。在一些情况下,将gene writer系统递送至植物的细胞。在一些情况下,将gene writer系统递送至植物的原生质体。在一些情况下,将gene writer系统递送至植物的组织。例如,可以将组合物递送至植物的分生组织(例如,顶端分生组织、侧生分生组织或间生分生组织)。在一些情况下,将组合物递送至植物的永久组织(例如,简单组织(例如,薄壁组织、厚角组织或厚壁组织)或复杂的永久组织(例如,木质部或韧皮部))。在一些情况下,将gene writer系统递送至植物胚。
[0658]
c.植物
[0659]
可以将多种植物递送至本文所述的gene writer系统或用其处理。可以根据本发明方法递送gene writer系统(即,“处理的”)的植物包括整株植物及其部分,包括但不限于芽营养器官/结构(例如,叶、茎和块茎)、根、花和花器官/结构(例如,苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳、子叶、和种皮)和果实(成熟的子房)、植物组织(例如,维管组织、基本组织等)和细胞(例如,保卫细胞、卵细胞等)及其子代。植物部分可以进一步指如以下的植物部分:芽、根、茎、种子、托叶、叶、花瓣、花、胚珠、苞片、枝、叶柄、节间、树皮、短柔毛、分蘖、根茎、叶状体(frond)、叶片、花粉、雄蕊等。
[0660]
可以在本文披露的方法中处理的植物的类别包括高等植物和低等植物类别,包括被子植物(单子叶植物和双子叶植物)、裸子植物、蕨类、木贼类植物、裸蕨植物、石松类植物、苔藓植物、和藻类(例如,多细胞藻类或单细胞藻类)。可以根据本发明方法处理的植物进一步包括任何维管植物,例如单子叶植物或双子叶植物或裸子植物,包括但不限于苜蓿、苹果、拟南芥属、香蕉、大麦、卡诺拉油菜、蓖麻籽、菊花、三叶草、可可、咖啡、棉花、棉籽、玉米、海甘蓝、蔓越莓、黄瓜、石斛兰、薯蓣、桉树、羊茅草、亚麻、唐菖蒲、百合科、亚麻籽、粟、甜瓜、芥菜、燕麦、油棕、油菜、番木瓜、花生、菠萝、观赏植物、菜豆、马铃薯、油菜籽、水稻、黑麦、黑麦草、红花、芝麻、高粱、大豆、甜菜、甘蔗、向日葵、草莓、烟草、番茄、草皮草、小麦和蔬菜作物(如莴苣、芹菜、西兰花、花椰菜、葫芦);水果树和坚果树,如苹果、梨、桃、橙子、葡萄柚、柠檬、酸橙、扁桃、山核桃、胡桃、榛子;藤本植物,如葡萄(例如,葡萄园)、猕猴桃、蛇麻子
spp.)、柳属物种(salix sp.)、接骨木属物种(sambucus spp.)、黑麦(secale cereale)、胡麻属物种(sesamum spp.)、白芥属物种(sinapis spp.)、茄属物种(solanum spp.)(例如,马铃薯(solanum tuberosum)、红茄(solanum integrifolium)或番茄(solanum lycopersicum))、双色高粱(sorghum bicolor)、石茅(sorghum halepense)、菠菜属物种(spinacia spp.)、罗晃子(tamarindus indica)、可可树(theobroma cacao)、三叶草属物种(trifolium spp.)、小黑麦(triticosecale rimpaui)、小麦属物种(triticum spp.)(例如,普通小麦(triticum aestivum))、硬粒小麦(triticum durum)、圆锥小麦(triticum turgidum)、triticum hybernum、马卡小麦(triticum macha)、triticum sativum或triticum vulgare)、越橘属物种(vaccinium spp.)、蚕豆属物种(vicia spp.)、豇豆属物种(vigna spp.)、香堇菜(viola odorata)、葡萄属物种(vitis spp.)、和玉米(zea mays)。在某些实施例中,作物植物是水稻、油菜、卡诺拉油菜、大豆、玉米(玉蜀黍(maize))、棉花、甘蔗、苜蓿、高粱、或小麦。
[0662]
用于本发明的植物或植物部分包括任何植物发育阶段的植物。在某些情况下,可以在萌发、幼苗生长、营养生长、和繁殖生长的阶段进行递送。在某些情况下,向植物的递送在营养生长和繁殖生长阶段期间进行。在一些情况下,将组合物递送至植物的花粉。在一些情况下,将组合物递送至植物的种子。在一些情况下,将组合物递送至植物的原生质体。在一些情况下,将组合物递送至植物的组织。例如,可以将组合物递送至植物的分生组织(例如,顶端分生组织、侧生分生组织或间生分生组织)。在一些情况下,将组合物递送至植物的永久组织(例如,简单组织(例如,薄壁组织、厚角组织或厚壁组织)或复杂的永久组织(例如,木质部或韧皮部))。在一些情况下,将组合物递送至植物胚。在一些情况下,将组合物递送至植物细胞。营养生长和繁殖生长阶段在本文中也称为“成株”或“成熟”植物。
[0663]
在将gene writer系统递送至植物部分的情况下,可以通过植物修饰剂对植物部分进行修饰。替代性地,gene writer系统可以被分布到植物的其他部分(例如,通过植物的循环系统),其他部分随后被植物修饰剂修饰。
[0664]
脂质纳米颗粒
[0665]
本发明提供的方法和系统可以采用任何合适的载剂或递送形式,在某些实施例中包括脂质纳米颗粒(lnp)。在一些实施例中,脂质纳米颗粒包含一种或多种离子脂质,诸如非阳离子脂质(例如,中性或阴离子或两性离子脂质);一种或多种缀合的脂质(诸如wo 2019217941的表5中描述的peg缀合的脂质或缀合至聚合物的脂质;其通过引用以其全文并入本文);一种或多种固醇(例如,胆固醇);以及,任选地,一种或多种靶向分子(例如,缀合的受体、受体配体、抗体);或前述内容的组合。
[0666]
可用于形成纳米颗粒(例如,脂质纳米颗粒)的脂质包括例如wo 2019217941的表4中描述的那些,其通过引用并入-例如,含脂质的纳米颗粒可包含wo 2019217941的表4中的一种或多种脂质。脂质纳米颗粒可以包括另外的要素,诸如聚合物,诸如通过引用并入的wo 2019217941的表5中描述的聚合物。
[0667]
在一些实施例中,缀合的脂质,当存在时,可以包括以下的一种或多种:peg-二酰基甘油(dag)(诸如l-(单甲氧基-聚乙二醇)-2,3-二肉豆蔻酰甘油(peg-dmg))、peg-二烷氧基丙基(daa)、peg-磷脂、peg-神经酰胺(cer)、聚乙二醇化磷脂酰乙醇胺(peg-pe)、peg琥珀酸二酰基甘油(pegs-dag)(诸如4-0-(2’,3
’‑
二(十四烷酰氧基)丙基-l-0-(w-甲氧基(聚乙
氧基)乙基)丁二酸酯(peg-s-dmg))、peg二烷氧基丙基氨基甲酸酯、n-(羰基-甲氧基聚乙二醇2000)-1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺钠盐,以及在wo 2019051289的表2中描述的那些(通过引用并入)和前述的组合。
[0668]
在一些实施例中,可掺入脂质纳米颗粒中的固醇包括胆固醇或胆固醇衍生物中的一种或多种,诸如通过引用并入的w0 2009/127060或us 2010/0130588中的那些。另外的示例性固醇包括植物固醇,包括通过引用并入本文的eygeris等人(2020),dx.doi.org/10.1021/acs.nanolett.0c01386中描述的那些。
[0669]
在一些实施例中,脂质颗粒包含可电离脂质、非阳离子脂质、抑制颗粒聚集的缀合脂质和固醇。这些组分的量可以独立地变化,以获得所需特性。例如,在一些实施例中,脂质纳米颗粒包含:可电离脂质,其量为总脂质的约20摩尔%至约90摩尔%(在其他实施例中,它可以是脂质纳米颗粒中存在的总脂质的20%-70%(摩尔)、30%-60%(摩尔)或40%-50%(摩尔);约50摩尔%至约90摩尔%);非阳离子脂质,其量为总脂质的约5摩尔%至约30摩尔%;缀合脂质,其量为总脂质的约0.5摩尔%至约20摩尔%;以及固醇,其量为总脂质的约20摩尔%至约50摩尔%。总脂质与核酸(例如,编码gene writer或模板核酸)的比率可以根据需要而变化。例如,总脂质与核酸(质量或重量)的比率可为约10:1至约30:1。
[0670]
在一些实施例中,脂质与核酸的比率(质量/质量比率;w/w比)可处于约1:1至约25:1、约10:1至约14:1、约3:1至约15:1、约4:1至约10:1、约5:1至约9:1或约6:1至约9:1的范围内。可以调节脂质和核酸的量以提供所需的n/p比,例如3、4、5、6、7、8、9、10或更高的n/p比。通常,脂质纳米颗粒配制品的总脂质含量可在约5mg/ml至约30mg/ml的范围内。
[0671]
可用于脂质纳米颗粒配制品中的示例性可电离脂质包括但不限于通过引用并入本文的wo 2019051289的表1中所列的那些。另外的示例性脂质包括但不限于下式中的一种或多种:us 2016/0311759的x;us 20150376115或us 2016/0376224中的i;us 20160151284的i、ii或iii;us 20170210967的i、ia、ii或iia;us 20150140070的i-c;us 2013/0178541的a;us 2013/0303587或us 2013/0123338的i;us 2015/0141678的i;us 2015/0239926的ii、iii、iv或v;us 2017/0119904的i;wo 2017/117528的i或ii;us 2012/0149894的a;us 2015/0057373的a;wo 2013/116126的a;us 2013/0090372的a;us 2013/0274523的a;us 2013/0274504的a;us 2013/0053572的a;w0 2013/016058的a;w0 2012/162210的a;us 2008/042973的i;us 2012/01287670的i、ii、iii或iv;us 2014/0200257的i或ii;us 2015/0203446的i、ii或iii;us 2015/0005363的i或iii;us 2014/0308304的i、ia、ib、ic、id、ii、iia、iib、iic、iid或iii-xxiv;us 2013/0338210;w0 2009/132131的i、ii、iii或iv;us 2012/01011478的a;us 2012/0027796的i或xxxv;us 2012/0058144的xiv或xvii;us 2013/0323269;us 2011/0117125的i;us 2011/0256175的i、ii或iii;us 2012/0202871的i、ii、iii、iv、v、vi、vii、viii、ix、x、xi、xii;us 2011/0076335的i、ii、iii、iv、v、vi、vii、viii、x、xii、xiii、xiv、xv或xvi;us 2006/008378的i或ii;us 2013/0123338的i;us 2015/0064242的i或x-a-y-z;us 2013/0022649的xvi、xvii或xviii;us 2013/0116307的i、ii或iii;us 2013/0116307的i、ii或iii;us 2010/0062967的i或ii;us 2013/0189351的i-x;us 2014/0039032的i;us 2018/0028664的v;us 2016/0317458的i;us 2013/0195920的i。
[0672]
在一些实施例中,可电离脂质是mc3(6z,9z,28z,3lz)-三十七烷-6,9,28,3l-四烯-l9-基-4-(二甲基氨基)丁酸酯(dlin-mc3-dma或mc3),例如,如wo 2019051289 a9(通过
引用以其全文并入本文)的实例9中所述。在一些实施例中,可电离脂质是脂质atx-002,例如,如wo 2019051289 a9(通过引用以其全文并入本文)的实例10中所述。在一些实施例中,可电离脂质是(l3z,l6z)-a,a-二甲基-3-壬基二十二-l3,l6-二烯-l-胺(化合物32),例如,如wo 2019051289 a9(通过引用以其全文并入本文)的实例11中所述。在一些实施例中,可电离脂质是化合物6或化合物22,例如,如wo 2019051289a9(通过引用以其全文并入本文)的实例12中所述。
[0673]
示例性非阳离子脂质包括但不限于二硬脂酰-sn-甘油基-磷酸乙醇胺、二硬脂酰磷脂酰胆碱(dspc)、二油酰磷脂酰胆碱(dopc)、二棕榈酰磷脂酰胆碱(dppc)、二油酰磷脂酰胆碱(dopg)、二棕榈酰磷脂酰甘油(dppg)、二油酰磷脂酰乙醇胺(dope)、棕榈酰油酰磷脂酰胆碱(popc)、棕榈酰油酰磷脂酰乙醇胺(pope)、二油酰-磷脂酰乙醇胺4-(n-马来酰亚胺甲基)-环己烷-1-羧酸酯(dope-mal)、二棕榈酰磷脂酰乙醇胺(dppe)、二肉豆蔻酰磷酸乙醇胺(dmpe)、二硬脂酰-磷脂酰-乙醇胺(dspe)、单甲基-磷脂酰乙醇胺(诸如16-o-单甲基pe)、二甲基-磷脂酰乙醇胺(诸如16-o-二甲基pe)、l8-l-反式pe、l-硬脂酰-2-油酰-磷脂酰乙醇胺(sope)、氢化大豆磷脂酰胆碱(hspc)、卵磷脂酰胆碱(epc)、二油酰磷脂酰丝氨酸(dops)、神经鞘磷脂(sm)、二肉豆蔻酰磷脂酰胆碱(dmpc)、二肉豆蔻酰磷脂酰甘油(dmpg)、二硬脂酰磷脂酰甘油(dspg)、二芥酰基磷脂酰胆碱(depc)、棕榈酰油酰磷脂酰甘油(popg)、二反油烯酰-磷脂酰乙醇胺(depe)、卵磷脂、磷脂酰乙醇胺、溶血卵磷脂、溶血磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、鞘磷脂、卵鞘磷脂(esm)、脑磷脂、心磷脂、磷脂酸、脑苷脂、双十六烷基磷酸、溶血磷脂酰胆碱、二亚油酰基磷脂酰胆碱或其混合物。应当理解,也可以使用其他二酰基磷脂酰胆碱和二酰基磷脂酰乙醇胺磷脂。这些脂质中的酰基基团优选为源自具有c10-c24碳链的脂肪酸的酰基基团,例如月桂酰基、肉豆蔻酰基、棕榈酰基、硬脂酰基或油酰基。在某些实施例中,另外的示例性脂质包括但不限于通过引用并入本文的kim等人(2020)dx.doi.org/10.1021/acs.nanolett.0c01386中描述的那些。在一些实施例中,此类脂质包括发现会改善用mrna进行肝脏转染的植物脂质(例如dgts)。
[0674]
适合用于脂质纳米颗粒中的非阳离子脂质的其他实例包括但不限于非磷脂质,例如硬脂胺、十二烷基胺、十六烷基胺、乙酰基棕榈酸酯、蓖麻酸甘油酯、硬脂酸十六烷基酯、肉豆蔻酸异丙酯、两性丙烯酸聚合物、三乙醇胺-月桂基硫酸盐、烷基-芳基硫酸盐、聚乙氧基化脂肪酸酰胺、双十八烷基二甲基溴化铵、神经酰胺、鞘磷脂等。其他非阳离子脂质在wo 2017/099823或美国专利公开us2018/0028664中描述,其内容通过引用以其全文并入本文。
[0675]
在一些实施例中,非阳离子脂质是油酸或通过引用以其全文并入的us 2018/0028664的式i、ii或iv的化合物。非阳离子脂质可以占脂质纳米颗粒中存在的总脂质的例如0-30%(摩尔)。在一些实施例中,非阳离子脂质含量是脂质纳米颗粒中存在的总脂质的5%-20%(摩尔)或10%-15%(摩尔)。在实施例中,可电离脂质与中性脂质的摩尔比为约2:1至约8:1(例如,约2:1、3:1、4:1、5:1、6:1、7:1或8:1)。
[0676]
在一些实施例中,脂质纳米颗粒不包含任何磷脂。
[0677]
在一些方面,脂质纳米颗粒可进一步包含诸如固醇的组分以提供膜完整性。可用于脂质纳米颗粒中的一种示例性固醇是胆固醇及其衍生物。胆固醇衍生物的非限制性实例包括极性类似物,诸如5a-胆甾烷醇、53-粪甾烷醇、胆甾醇基-(2
’‑
羟基)-乙基醚、胆甾醇基-(4
’‑
羟基)-丁基醚和6-酮胆甾烷醇;非极性类似物,诸如5a-胆甾烷、胆甾烯酮、5a-胆甾
烷酮、5p-胆甾烷酮和胆甾醇癸酸酯;及其混合物。在一些实施例中,胆固醇衍生物是极性类似物,例如,胆甾醇基-(4
’‑
羟基)-丁基醚。示例性的胆固醇衍生物在pct公开w0 2009/127060和美国专利公开us 2010/0130588中描述,其中每个通过引用以其全文并入本文。
[0678]
在一些实施例中,提供膜完整性的组分,诸如固醇,可占脂质纳米颗粒中存在的总脂质的0-50%(摩尔)(例如,0-10%、10%-20%、20%-30%、30%-40%或40%-50%)。在一些实施例中,此类组分是脂质纳米颗粒的总脂质含量的20%-50%(摩尔)、30%-40%(摩尔)。
[0679]
在一些实施例中,脂质纳米颗粒可包含聚乙二醇(peg)或缀合的脂质分子。通常,这些用于抑制脂质纳米颗粒的聚集和/或提供空间稳定。示例性的缀合脂质包括但不限于peg-脂质缀合物、聚噁唑啉(poz)-脂质缀合物、聚酰胺-脂质缀合物(诸如atta-脂质缀合物)、阳离子聚合物脂质(cpl)缀合物及其混合物。在一些实施例中,缀合脂质分子是peg-脂质缀合物,例如(甲氧基聚乙二醇)缀合脂质。
[0680]
示例性的peg-脂质缀合物包括但不限于peg-二酰基甘油(dag)(诸如l-(单甲氧基-聚乙二醇)-2,3-二肉豆蔻酰甘油(peg-dmg))、peg-二烷氧基丙基(daa)、peg-磷脂、peg-神经酰胺(cer)、聚乙二醇化磷脂酰乙醇胺(peg-pe)、peg琥珀酸二酰基甘油(pegs-dag)(诸如4-0-(2’,3
’‑
二(十四烷酰氧基)丙基-l-0-(w-甲氧基(聚乙氧基)乙基)丁二酸酯(peg-s-dmg))、peg二烷氧基丙基氨基甲酸酯、n-(羰基-甲氧基聚乙二醇2000)-l,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺钠盐或其混合物。另外的示例性peg-脂质缀合物例如在us 5,885,613、us 6,287,591、us 2003/0077829、us 2003/0077829、us 2005/0175682、us 2008/0020058、us 2011/0117125、us 2010/0130588、us 2016/0376224、us 2017/0119904和us/099823中描述,所有这些的内容通过引用以其全文并入本文。在一些实施例中,peg-脂质是us 2018/0028664的式iii、iii-a-i、iii-a-2、iii-b-1、iii-b-2或v的化合物,其内容通过引用以其全文并入本文。在一些实施例中,peg-脂质具有us 20150376115或us 2016/0376224的式ii,两者的内容通过引用以其全文并入本文。在一些实施例中,peg-daa缀合物可以是例如peg-二月桂基氧基丙基、peg-二肉豆蔻基氧基丙基、peg-二棕榈基氧基丙基或peg-二硬脂基氧基丙基。peg-脂质可以是以下的一种或多种:peg-dmg、peg-二月桂基甘油、peg-二棕榈酰甘油、peg-二硬脂基甘油、peg-二月桂基甘油脂酰胺、peg-二肉豆蔻基甘油脂酰胺、peg-二棕榈酰甘油脂酰胺、peg-二硬脂基甘油脂酰胺、peg-胆固醇(l-[8
’‑
(胆甾-5-烯-3[β]-氧基)甲酰胺基-3’,6
’‑
二氧杂辛基]氨基甲酰基-[ω]-甲基-聚(乙二醇)、peg-dmb(3,4-双十四烷氧基苄基-[ω]-甲基-聚(乙二醇)醚)和1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-n-[甲氧基(聚乙二醇)-2000]。在一些实施例中,peg-脂质包含peg-dmg、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-n-[甲氧基(聚乙二醇)-2000]。在一些实施例中,peg-脂质包含选自以下的结构:
[0681][0682]
在一些实施例中,与peg以外的分子缀合的脂质也可用于代替peg-脂质。例如,聚噁唑啉(poz)-脂质缀合物、聚酰胺-脂质缀合物(诸如atta-脂质缀合物)和阳离子聚合物脂质(gpl)缀合物可用于代替peg-脂质或与peg-脂质一起使用。
[0683]
示例性的缀合脂质,即peg-脂质、(poz)-脂质缀合物、atta-脂质缀合物和阳离子聚合物-脂质在wo 2019051289 a9的表2中列出的pct和lis专利申请中描述,所有这些的内容通过引用以其全文并入本文。
[0684]
在一些实施例中,peg或缀合脂质可以占脂质纳米颗粒中存在的总脂质的0-20%(摩尔)。在一些实施例中,peg或缀合脂质的含量为脂质纳米颗粒中存在的总脂质的0.5%-10%或2%-5%(摩尔)。可电离脂质、非阳离子脂质、固醇和peg/缀合脂质的摩尔比可以根据需要变化。例如,脂质颗粒可包含按组合物的摩尔或总重量计30%-70%的可电离脂质,按组合物的摩尔或总重量计0-60%的胆固醇,按组合物的摩尔或总重量计0-30%的非阳离子脂质和按组合物的摩尔或总重量计1%-10%的缀合脂质。优选地,组合物包含按组合物的摩尔或总重量计30%-40%的可电离脂质,按组合物的摩尔或总重量计40%-50%的胆固醇,和按组合物的摩尔或总重量计10%-20%的非阳离子脂质。在一些其他实施例中,该组合物是按组合物的摩尔或总重量计50%-75%的可电离脂质,按组合物的摩尔或总重量计20%-40%的胆固醇和按组合物的摩尔或总重量计5%至10%的非阳离子脂质以及按组合物的摩尔或总重量计1%-10%的缀合脂质。该组合物可以含有按组合物的摩尔或总重量计60%-70%的可电离脂质,按组合物的摩尔或总重量计25%-35%的胆固醇,以及按组合物的摩尔或总重量计5%-10%的非阳离子脂质。该组合物还可含有按组合物的摩尔或总重量计至多90%的可电离脂质和按组合物的摩尔或总重量计2%至15%的非阳离子脂质。配制品也可以是脂质纳米颗粒配制品,例如包含按组合物的摩尔或总重量计8%-30%的可电离脂质,按组合物的摩尔或总重量计5%-30%的非阳离子脂质,以及按组合物的摩尔或总重量计0-20%的胆固醇;按组合物的摩尔或总重量计4%-25%的可电离脂质,按组合物的摩尔或总重量计4%-25%的非阳离子脂质,按组合物的摩尔或总重量计2%至25%的胆固醇,按组合物的摩尔或总重量计10%至35%的缀合脂质,以及按组合物的摩尔或总重量计5%的胆固醇;或按组合物的摩尔或总重量计2%-30%的可电离脂质,按组合物的摩尔或总重
量计2%-30%的非阳离子脂质,按组合物的摩尔或总重量计1%至15%的胆固醇,按组合物的摩尔或总重量计2%至35%的缀合脂质,以及按组合物的摩尔或总重量计1%-20%的胆固醇;或按组合物的摩尔或总重量计甚至高达90%的可电离脂质和按组合物的摩尔或总重量计2%-10%的非阳离子脂质,或按组合物的摩尔或总重量计甚至100%的阳离子脂质。在一些实施例中,脂质颗粒配制品包含摩尔比为50:10:38.5:1.5的可电离脂质、磷脂、胆固醇和聚乙二醇化脂质。在一些其他实施例中,脂质颗粒配制品包含摩尔比为60:38.5:1.5的可电离脂质、胆固醇和聚乙二醇化脂质。
[0685]
在一些实施例中,脂质颗粒包含可电离脂质、非阳离子脂质(例如磷脂)、固醇(例如胆固醇)和聚乙二醇化脂质,其中可电离脂质的脂质摩尔比在20至70摩尔%的范围内,目标为40-60,非阳离子脂质的摩尔百分比在0至30的范围内,目标为0至15,固醇的摩尔百分比在20至70的范围内,目标为30至50,并且聚乙二醇化脂质的摩尔百分比在1至6的范围内,目标为2至5。
[0686]
在一些实施例中,脂质颗粒包含摩尔比为50:10:38.5:1.5的可电离脂质/非阳离子脂质/固醇/缀合脂质。
[0687]
在一个方面,本披露提供了包含磷脂、卵磷脂、磷脂酰胆碱和磷脂酰乙醇胺的脂质纳米颗粒配制品。
[0688]
在一些实施例中,还可以包括一种或多种另外的化合物。那些化合物可以单独施用,或者另外的化合物可以包括在本发明的脂质纳米颗粒中。换言之,除核酸或至少第二核酸之外,脂质纳米颗粒可含有不同于第一核酸的其他化合物。非限制性地,其他另外的化合物可以选自由以下组成的组:小的或大的有机分子或无机分子、单糖、二糖、三糖、寡糖、多糖、肽、蛋白质、其肽类似物和衍生物、肽模拟物、核酸、核酸类似物和衍生物、由生物材料制成的提取物,或其任何组合。
[0689]
在一些实施例中,通过添加靶向结构域将lnp定向至特定组织。例如,可以将生物配体展示在lnp的表面,以增强与展示同源受体的细胞的相互作用,从而推动与细胞表达受体的组织的缔合和向其中的载物递送。在一些实施例中,生物配体可以是驱动递送至肝脏的配体,例如展示galnac的lnp促使核酸载物递送至展示无唾液酸糖蛋白受体(asgpr)的肝细胞。akinc等人mol ther[分子治疗]18(7):1357-1364(2010)的工作传授了将三价galnac配体与peg-脂质缀合(galnac-peg-dsg)以产生依赖于asgpr的lnp以获得可观察的lnp载物效应(参见,例如,图6)。其他展示配体的lnp配制品,例如掺入叶酸、转铁蛋白或抗体的配制品,在wo 2017223135中进行了讨论,其通过引用以其全文并入本文,此外还有在其中使用的参考文献也并入本文:即,kolhatkar等人,curr drug discov technol[当代药物发现技术].2011 8:197-206;musacchio和torchilin,front biosci.[生物科学前沿]2011 16:1388-1412;yu等人,mol membr biol.[分子膜生物学]2010 27:286-298;patil等人,crit rev ther drug carrier syst[治疗性药物载剂系统的重要评论].2008 25:1-61;benoit等人,biomacromolecules[生物大分子].2011 12:2708-2714;zhao等人,expert opin drug deliv[药物递送专家观点].2008 5:309-319;akinc等人,mol ther[分子治疗].2010 18:1357-1364;srinivasan等人,methods mol biol[分子生物学方法].2012 820:105-116;ben-arie等人,methods mol biol[分子生物学方法].2012 757:497-507;peer 2010 j control release[控释杂志].20:63-68;peer等人,proc natl acad sci u s a.[美国
国家科学院院刊]2007 104:4095-4100;kim等人,methods mol biol.[分子生物学方法]2011 721:339-353;subramanya等人,mol ther[分子治疗].2010 18:2028-2037;song等人,nat biotechnol.[自然生物技术]2005 23:709-717;peer等人,science[科学].2008 319:627-630;以及peer和lieberman,gene ther[基因治疗].2011 18:1127-1133。
[0690]
在一些实施例中,通过将选择性器官靶向(selective organ targeting,sort)分子添加至包含传统组分(例如可电离的阳离子脂质、两亲性磷脂、胆固醇和聚(乙二醇)(peg))的配制品中来针对组织特异性活性对lnp进行选择。cheng等人nat nanotechnol[自然纳米技术]15(4):313-320(2020)的传授内容证明,添加补充的“sort”组分可根据sort分子的百分比和生物物理特性精确地改变体内rna递送谱并介导组织特异性(例如,肺、肝脏、脾脏)基因递送和编辑。
[0691]
在一些实施例中,lnp包含生物可降解的可电离脂质。在一些实施例中,lnp包含(9z,l2z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙基十八碳-9,l2-二烯酸酯,也称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙基(9z,l2z)-十八碳-9,l2-二烯酸酯)或另一种可电离脂质。参见,例如wo 2019/067992、wo/2017/173054、wo 2015/095340和wo 2014/136086,以及其中提供的参考文献的脂质。在一些实施例中,在lnp脂质的上下文中术语阳离子和可电离是可互换的,例如,其中可电离脂质根据ph是阳离子的。
[0692]
在一些实施例中,可以将gene writer系统的多个组分制备为单一lnp配制品,例如,lnp配制品包含编码gene writer多肽的mrna和rna模板。可以改变核酸组分的比率以便最大化治疗剂的特性。在一些实施例中,rna模板与编码gene writer多肽的mrna的比率为按摩尔比计约1:1至100:1,例如约1:1至20:1、约20:1至40:1、约40:1至60:1、约60:1至80:1、或约80:1至100:1。在其他实施例中,可以由单独的配制品制备多种核酸的系统,例如,包含模板rna的一种lnp配制品和包含编码gene writer多肽的mrna的第二lnp配制品。在一些实施例中,该系统可以包含配制到lnp中的多于两种核酸组分。在一些实施例中,该系统可以包含蛋白质(例如,gene writer多肽)以及配制到至少一种lnp配制品中的模板rna。
[0693]
在一些实施例中,lnp配制品的平均lnp直径可以在数十nm和数百nm之间,例如通过动态光散射(dls)测量的。在一些实施例中,lnp配制品的平均lnp直径可以为约40nm至约150nm,诸如约40nm、45nm、50nm、55nm、60nm、65nm、70nm、75nm、80nm、85nm、90nm、95nm、100nm、105nm、110nm、115nm、120nm、125nm、130nm、135nm、140nm、145nm或150nm。在一些实施例中,lnp配制品的平均lnp直径可为约50nm至约100nm、约50nm至约90nm、约50nm至约80nm、约50nm至约70nm、约50nm至约60nm、约60nm至约100nm、约60nm至约90nm、约60nm至约80nm、约60nm至约70nm、约70nm至约100nm、约70nm至约90nm、约70nm至约80nm、约80nm至约100nm、约80nm至约90nm或约90nm至约100nm。在一些实施例中,lnp配制品的平均lnp直径可为约70nm至约100nm。在特定实施例中,lnp配制品的平均lnp直径可为约80nm。在一些实施例中,lnp配制品的平均lnp直径可为约100nm。在一些实施例中,lnp配制品的平均lnp直径范围为约l mm至约500mm、约5mm至约200mm、约10mm至约100mm、约20mm至约80mm、约25mm至约60mm、约30mm至约55mm、约35mm至约50mm,或约38mm至约42mm。
[0694]
在一些情况下,lnp可以是相对均质的。多分散性指数可用于指示lnp的均质性,例如脂质纳米颗粒的粒度分布。小的(例如,小于0.3)多分散性指数通常指示窄的粒度分布。
lnp的多分散性指数可为约0至约0.25,诸如0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.10、0.11、0.12、0.13、0.14、0.15、0.16、0.17、0.18、0.19、0.20、0.21、0.22、0.23、0.24或0.25。在一些实施例中,lnp的多分散性指数可为约0.10至约0.20。
[0695]
lnp的ζ电位可用于指示组合物的电动电位。在一些实施例中,ζ电位可以描述lnp的表面电荷。具有相对低电荷(正电荷或负电荷)的脂质纳米颗粒通常是期望的,因为更高电荷的物质可能不理想地与体内的细胞、组织和其他元素相互作用。在一些实施例中,lnp的ζ电位可为约-10mv至约 20mv、约-10mv至约 15mv、约-10mv至约 10mv、约-10mv至约 5mv、约-10mv至约0mv、约-10mv至约-5mv、约-5mv至约 20mv、约-5mv至约 15mv、约-5mv至约 10mv、约-5mv至约 5mv、约-5mv至约0mv、约0mv至约 20mv、约0mv至约 15mv、约0mv至约 10mv、约0mv至约 5mv、约 5mv至约 20mv、约 5mv至约 15mv或约 5mv至约 10mv。
[0696]
蛋白质和/或核酸(例如,gene writer多肽或编码该多肽的mrna)的包封效率描述了相对于所提供的初始量,在制备后被包封或以其他方式与lnp缔合的蛋白质和/或核酸的量。包封效率理想的是较高(例如,接近100%)。包封效率可以例如通过比较在用一种或多种有机溶剂或洗涤剂破碎脂质纳米颗粒之前和之后含有脂质纳米颗粒的溶液中蛋白质或核酸的量来测量。阴离子交换树脂可用于测量溶液中游离蛋白质或核酸(例如rna)的量。荧光可用于测量溶液中游离蛋白质和/或核酸(例如rna)的量。对于本文所述的脂质纳米颗粒,蛋白质和/或核酸的包封效率可以是至少50%,例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,包封效率可以是至少80%。在一些实施例中,包封效率可以是至少90%。在一些实施例中,包封效率可以是至少95%。
[0697]
lnp可以任选地包含一层或多层包衣。在一些实施例中,lnp可以配制在具有包衣的胶囊、膜或片剂中。包含本文所述的组合物的胶囊、膜或片剂可具有任何可用的尺寸、拉伸强度、硬度或密度。
[0698]
另外的示例性脂质、配制品、方法和lnp表征由wo 2020061457传授,其通过引用以其全文并入本文。
[0699]
在一些实施例中,使用lipofectamine messengermax(赛默飞世尔(thermo fisher))或transit-mrna转染试剂(米卢斯生物(mirus bio))进行体外或离体细胞脂质转染。在某些实施例中,使用genvoy_ilm可电离脂质混合物(精密纳米系统(precision nanosystems))配制lnp。在某些实施例中,使用2,2-二亚油烯基-4-二甲基氨基乙基-[1,3]-二氧戊环(dlin-kc2-dma)或二亚油烯基甲基-4-二甲基氨基丁酸酯(dlin-mc3-dma或mc3)配制lnp,其配制和体内用途在jayaraman等人angew chem int ed engl[德国应用化学]51(34):8529-8533(2012)中传授,其通过引用以其全文并入本文。
[0700]
优化用于递送crispr-cas系统(例如cas9-grna rnp、grna、cas9mrna)的lnp配制品在两者均通过引用并入的wo 2019067992和wo 2019067910中描述。
[0701]
可用于递送核酸的另外的特定lnp配制品在两者均通过引用并入的us8158601和us8168775中描述,其包括帕替西兰(patisiran)中使用的以名称onpattro销售的配制品。
[0702]
gene writer lnp的示例性给药可包括约0.1、0.25、0.3、0.5、1、2、3、4、5、6、8、10或100mg/kg(rna)。包含编码系统的一种或多种组分的核酸的aav的示例性给药可包括约10
11
、10
12
、10
13
和10
14
vg/kg的moi。
writer
tm
系统)转染的细胞中检测到预期长度的pcr产物,其指示成功的gene writing
tm
基因组编辑事件。
[0725]
将转染的细胞再培养10天,然后在多个细胞培养传代后经由流式细胞术测定gfp表达。计算来自每个细胞群体的gfp阳性细胞的百分比。在用第4组测试剂转染的hek293细胞群体中检测到gfp阳性细胞,表明表达了经由gene writing基因组编辑添加到哺乳动物细胞基因组中的基因表达单元。
[0726]
实例3:使用gene writer
tm
系统将剪接受体靶向递送至哺乳动物细胞中。
[0727]
该实例描述了gene writing基因组编辑系统的制备和使用,以将异源序列添加到内含子区中,充当上游外显子的剪接受体。将新外显子剪接到第一内含子中(该新外显子在5’端包含剪接受体位点,在3’端包含聚a尾)将产生成熟的mrna,其包含与新外显子剪接的天然基因座的第一天然外显子。
[0728]
在该实例中,重组酶蛋白选自表1的第1列。重组酶蛋白靶向表1的第4列中所列的对应基因组基因座以进行dna整合。模板dna编码gfp,其具有紧接成熟gfp的第一个氨基酸5’的剪接受体位点(起始密码子被去除),和终止密码子下游的3’聚a尾。
[0729]
hek293细胞用以下测试剂转染:
[0730]
1.乱序dna对照
[0731]
2.编码上述多肽的dna
[0732]
3.上述模板dna
[0733]
4.2和3的组合
[0734]
转染后,将hek293细胞培养至少4天,并测定位点特异性gene writing基因组编辑和适当的mrna加工。从hek293细胞分离基因组dna。进行逆转录pcr以测量包含靶基因座的第一天然外显子和新外显子的成熟mrna。rt-pcr反应使用与靶基因座的第一天然外显子结合的正向引物和与gfp结合的反向引物进行。rt-pcr产物在琼脂糖凝胶上电泳以测量dna的长度。在用第4组测试剂转染的细胞中检测到预期长度的pcr产物,其表明成功的gene writing基因组编辑事件和成功的剪接事件。该结果将表明gene writing基因组编辑系统可以将编码基因的异源序列添加到内含子区中,以充当上游外显子的剪接受体。
[0735]
将转染的细胞再培养10天,然后在多个细胞培养传代后经由流式细胞术测定gfp表达。计算来自每个细胞群体的gfp阳性细胞的百分比。在用第4组测试剂转染的hek293细胞群体中检测到gfp阳性细胞,表明表达了经由gene writing基因组编辑添加到哺乳动物细胞基因组中的基因表达单元。
[0736]
实例4:哺乳动物细胞中gene writing的特异性
[0737]
该实例描述了将gene writer
tm
基因组系统递送至哺乳动物细胞,用于将外源dna位点特异性地插入哺乳动物细胞基因组中,以及对位点特异性插入特异性的测量。
[0738]
在该实例中,如任何前述实例中所述,在hek293t细胞中进行gene writing。转染后,将hek293t细胞培养至少4天,然后测定位点特异性基因组编辑。如schmidt等人nature methods[自然方法]4,1051-1057(2007)中所述使用对模板dna特异的正向引物进行线性扩增pcr,线性扩增pcr将扩增相邻的基因组dna。然后使用下一代测序技术在miseq仪器上对扩增的pcr产物进行测序。将miseq读数映射到hek293t基因组,以鉴定基因组中的整合位点。
[0739]
映射到靶基因组位点的lam-pcr测序读数的百分比是gene writer的特异性。
[0740]
lam-pcr测序读数映射到的总基因组位点的数量是总整合位点的数量。
[0741]
实例5:哺乳动物细胞中gene writing的效率
[0742]
该实例描述了将gene writer
tm
基因组系统递送至哺乳动物细胞,用于将外源dna位点特异性地插入哺乳动物细胞基因组中,以及对gene writing的效率的测量。
[0743]
在该实例中,如任何前述实例中所述,在hek293t细胞中进行gene writing。转染后,将hek293t细胞培养至少4天,然后测定位点特异性基因组编辑。如lin等人,human gene therapy methods[人类基因治疗方法]27(5),197-208,2016中所述进行数字液滴pcr。正向引物与模板dna结合,且反向引物结合在选自表1的第4列的适当基因组基因座的一侧,因此仅在整合靶dna时才预期发生pcr扩增。针对靶位点的探针含有fam荧光团,且用于测量基因组中靶dna的拷贝数。对管家基因(例如rpp30)特异的引物和hex荧光团探针用于测量每个液滴的基因组dna拷贝数。
[0744]
相对于每个液滴的管家dna拷贝数归一化的每个液滴的靶dna拷贝数是gene writer的效率。
[0745]
实例6:细胞中重组酶的拷贝数的确定
[0746]
以下实例描述了每细胞基础上重组酶的绝对定量。该测量使用基于aqua质谱的方法进行,例如,可在以下统一资源定位符(url):https://www.sciencedirect.com/science/article/pii/s1046202304002087?via%3di hub访问。
[0747]
在将重组酶和dna模板递送至细胞后,允许重组进行24小时,之后对细胞进行定量,且然后通过该ms方法进行定量。该方法涉及两个阶段。
[0748]
在第一阶段,检查重组酶的氨基酸序列,并选择有代表性的胰蛋白酶肽进行分析。然后合成aqua肽,其氨基酸序列精确模拟蛋白水解过程中产生的对应天然肽。然而,在一个残基处掺入稳定的同位素,以使质谱仪能够区分分析物和内标。合成肽和天然肽共有相同的物理化学特性,包括色谱共洗脱、电离效率和碎片离子的相对分布,但由于它们的质量差异而在质谱仪中检测到差异。接下来通过lc-ms/ms技术分析合成肽,以确认肽的保留时间、确定碎片离子强度并选择离子用于srm分析。在这种srm实验中,三重四极杆质谱仪涉及选择第一个扫描四极杆或q1中的预期前体离子。仅具有这一质荷比(m/z)的离子会被引导到碰撞池(q2)中以进行碎片化。所得产物离子被传递到第三个四极杆(q3),其中单个碎片离子的m/z比在狭窄的m/z窗口中进行监测。
[0749]
第二阶段涉及对来自细胞或组织裂解物的重组酶进行定量。定量的细胞数量或组织质量用于启动反应,并用于将定量相对于每细胞基础归一化。在蛋白水解之前分离细胞裂解物以经由sds-page增加测定的动态范围,然后切除重组酶迁移的凝胶区域。进行凝胶内消化以获得天然胰蛋白酶肽。凝胶内消化是在aqua肽存在的情况下进行的,在消化过程中将该肽添加到凝胶块中。在蛋白水解之后,使用在第一阶段期间确定的参数在lc-srm实验中分析包含重肽和轻肽两者的复杂肽混合物。
[0750]
基于质谱的定量结果被转换为加载的蛋白质数量,以确定每个细胞的重组酶数量。
[0751]
实例7:细胞内dna的拷贝数
[0752]
q-fish
[0753]
以下实例描述了每细胞基础上对递送的dna模板的定量。在该实例中,重组酶整合的dna含有dna探针结合位点。在将重组酶和dna模板递送至细胞后,允许重组进行24小时,之后对细胞进行定量,并准备细胞用于定量荧光原位杂交(q-fish)。使用fish标签dna橙色试剂盒(fish tag dna orange kit)和alex fluor 555染料(赛默飞世尔公司(thermofisher)目录号f32948)进行q-fish。简而言之,与dna模板上的dna探针结合位点结合的dna探针是通过试剂盒手册中所述的切口平移、染料标记和纯化的程序产生的。然后按照试剂盒手册中所述用dna探针标记细胞。在维持在37c和5%co2的同时,将细胞在具有63x油浸物镜的蔡司公司(zeiss)lsm 710共聚焦显微镜上成像。dna探针经过555nm激光激发以刺激alexa flour。编写matlab脚本来测量相对于用已知数量的dna生成的标准的alex fluor强度。使用该方法,确定了递送至细胞的模板dna的量。
[0754]
qpcr
[0755]
以下实例描述了每细胞基础上对递送的dna模板的定量。在该实例中,重组酶整合的dna含有dna探针结合位点。在将重组酶和dna模板递送至细胞后,允许重组进行24小时,之后对细胞进行定量,并准备细胞用于定量pcr(qpcr)。使用针对该方案的标准试剂盒进行qpcr,这些标准试剂盒例如为赛默飞世尔公司taqman产品(https://www.thermofisher.com/us/en/home/life-science/pcr/real-time-pcr/real-time-pcr-assays-search.html)。简而言之,设计的引物可特异性扩增所递送模板dna的区域以及特定扩增子的探针。通过使用定量的纯模板dna的连续稀释来生成标准曲线,以将阈值ct数与dna模板数相关联。然后从被分析的细胞中提取dna,并按照制造商的说明与所有另外的组分一起输入到qpcr反应中。然后在适当的qpcr机器上分析样品以确定ct数,然后将ct数映射到标准曲线以进行绝对定量。使用该方法,确定了递送至细胞的模板dna的量。
[0756]
实例8:dna:重组酶的细胞内比率
[0757]
以下实例描述了对靶细胞中重组酶蛋白与模板dna细胞比率的确定。在将重组酶和dna模板递送至细胞后,允许重组进行24小时,之后对细胞进行定量,并准备细胞用于如上述实例中所述对重组酶和模板dna进行定量。然后将这两个值(每个细胞的重组酶和每个细胞的模板dna)相除(每个细胞的重组酶/每个细胞的模板dna)以确定这些量的总体平均比率。使用该方法,确定了递送至细胞的重组酶与模板dna的比率。
[0758]
实例9:dna损伤应答抑制剂存在下的活性-nhej抑制剂存在下的活性
[0759]
以下实例描述了在非同源末端连接抑制剂存在的情况下重组酶蛋白活性的测定,以强调重组酶活性不依赖于这些途径中涉及的蛋白质的表达。简而言之,进行上述实例中概述以确定重组酶活性效率的测定。然而,在这种情况下,进行了两个单独的实验。
[0760]
在实验1中,在递送重组酶和模板dna之后24小时,将1μm的nhej抑制剂scr7(https://www.sigmaaldrich.com/catalog/product/sigma/sml1546?lang=en&region=us)添加到细胞生长培养基中以抑制该途径。方案的所有其他元素都是相同的。
[0761]
在实验2中,对细胞的操纵与实验1相同,但未向培养基中添加抑制剂。根据上述实例对两个实验的效率进行分析,并确定相对于未抑制活性的抑制活性百分比。
[0762]
实例10:dna损伤应答抑制剂存在下的活性-hdr抑制剂存在下的活性
[0763]
以下实例描述了在同源重组的抑制剂存在的情况下重组酶蛋白活性的测定,以强调重组酶活性不依赖于这些途径中涉及的蛋白质的表达。简而言之,进行上述实例中概述
以确定重组酶活性效率的测定。然而,在这种情况下,进行了两个单独的实验。
[0764]
在实验1中,在递送重组酶和模板dna之后24小时,将1μm的hr抑制剂b02(https://www.selleckchem.com/products/b02.html)添加到细胞生长培养基中以抑制该途径。方案的所有其他元素都是相同的。
[0765]
在实验2中:对细胞的操纵与实验1相同,但未向培养基中添加抑制剂。根据上述实例对两个实验的效率进行分析,并确定相对于未抑制活性的抑制活性百分比。
[0766]
实例11:核重组酶相对于细胞质重组酶的百分比
[0767]
以下实例描述了对靶细胞核中重组酶蛋白与靶细胞细胞质中重组酶蛋白比率的确定。如本文所述将重组酶和dna模板递送至细胞后12小时时,对细胞进行定量并准备细胞用于分析。使用以下标准试剂盒,按照制造商的说明:赛默飞世尔公司的ne-per核和细胞质提取将细胞分成核和细胞质部分。将细胞质和核部分皆保留,然后进行上述实例中概述的基于质谱的重组酶定量测定。使用该方法,确定了细胞中核重组酶与细胞质重组酶的比率。
[0768]
实例12:向植物细胞的递送
[0769]
该实例说明了将至少一种重组酶递送至植物细胞的方法,其中该植物细胞位于植物或植物部分中。更具体而言,该实例描述了将gene writing重组酶及其模板dna递送至非表皮植物细胞(即,大豆胚中的细胞),以便在切除的大豆胚的种系细胞中编辑内源植物基因(即,八氢番茄红素脱氢酶,pds)。该实例描述了将编码所递送转基因的多核苷酸通过多重屏障(例如,多个细胞层、种皮、细胞壁、质膜)直接递送到大豆种系细胞中,从而导致靶核苷酸序列pds的可遗传改变。所描述的方法不采用常用技术细菌介导的转化(例如,通过土壤杆菌属物种)或基因枪法。
[0770]
将质粒设计用于在大豆(橹豆(glycine max))中递送重组酶和靶向内源八氢番茄红素脱氢酶(pds)的单一模板dna。对本领域技术人员显而易见的是,很容易设计编码其他重组酶和模板dna序列的类似质粒,任选地包括不同的元件(例如,不同的启动子、终止子、可选择或可检测的标志物、细胞穿透肽、核定位信号、叶绿体转运肽或线粒体靶向肽等),并以类似方式使用。
[0771]
在第一系列实验中,使用递送剂和电穿孔的组合将这些载体递送至大豆胚中的非表皮植物细胞。成熟的干燥大豆种子(栽培品种威廉姆斯82(cv.williams 82))如下进行表面灭菌。将干燥的大豆种子在封闭室中放置4小时,该封闭室中放置含有100毫升5%次氯酸钠溶液的烧杯,向该烧杯中新添加4毫升盐酸。在该灭菌处理之后使种子保持干燥。通过手动使用剃刀刀片将灭菌的种子分成两半,并手动将胚与子叶分离。每个测试或对照处理针对20个切除的胚进行。然后进行以下一系列实验。
[0772]
实验1:制备在无菌过滤的milliq水中的0.01%ctab(十六烷基三甲基溴化铵,一种季铵表面活性剂)中含有载体(每种质粒每微升100纳克)的递送溶液。将每种溶液冷却至4摄氏度,并将500微升直接添加到胚中,然后立即将其置于真空室中的冰上并进行负压(2x10"3毫巴)处理15分钟。在冷却/负压处理之后,使用设置有以下参数(50v,25毫秒脉冲长度,对于99个脉冲的75毫秒脉冲间隔)的btx-harvard ecm-830电穿孔装置对胚胎进行电流处理。
[0773]
实验2:条件与实验1相同,不同之处在于与递送溶液的初始接触和负压处理在室温下进行。
[0774]
实验3:条件与实验1相同,不同之处在于递送溶液在没有ctab的情况下制备但包括0.1%silwet l-77
tm
(cas号27306-78-1,可从纽约奥尔巴尼迈图高性能材料公司(momentive performance materials,albany,n.y)获得)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
[0775]
实验4:条件与实验3相同,不同之处在于制备了几种递送溶液,其中每种进一步包括20微克/毫升的一种单壁碳纳米管制剂,该制剂选自目录号为704113、750530、724777、和805033的那些(均可从密苏里州圣路易斯西格玛奥德里奇公司(sigma-aldrich,st.louis,mo)获得)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
[0776]
实验5:条件与实验3相同,不同之处在于递送溶液进一步包括20微克/毫升的三乙氧基丙基氨基硅烷官能化二氧化硅纳米颗粒(目录号791334,密苏里州圣路易斯西格玛奥德里奇公司)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
[0777]
实验6:条件与实验3相同,不同之处在于递送溶液进一步包括9微克/毫升支链聚乙烯亚胺,分子量为25,000(cas号9002-98-6,目录号408727,密苏里州圣路易斯西格玛奥德里奇公司)或9微克/毫升支链聚乙烯亚胺,分子量为800(cas号25987-06-8,目录号408719,密苏里州圣路易斯西格玛奥德里奇公司)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
[0778]
实验7:条件与实验3相同,不同之处在于递送溶液进一步包括20%v/v二甲亚砜(dmso,目录号d4540,密苏里州圣路易斯西格玛奥德里奇公司)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
[0779]
实验8:条件与实验3相同,不同之处在于递送溶液进一步含有50微摩尔的九精氨酸(rrrrrrrrr,seq id no:1873)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
[0780]
实验9:条件与实验3相同,不同之处在于真空处理之后,将胚和处理溶液转移到微量离心管中并在4000x g下离心2、5、10或20分钟。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
[0781]
实验10:条件与实验3相同,不同之处在于真空处理之后,将胚和处理溶液转移到微量离心管中并在4000x g下离心2、5、10或20分钟。
[0782]
实验11:条件与实验4相同,不同之处在于真空处理之后,将胚和处理溶液转移到微量离心管中并在4000x g下离心2、5、10或20分钟。
[0783]
实验12:条件与实验5相同,不同之处在于真空处理之后,将胚和处理溶液转移到微量离心管中并在4000x g下离心2、5、10或20分钟。
[0784]
递送处理后,将每个处理组的胚用无菌水洗涤5次,转移到含有1/2ms固体培养基(2.165g murashige和skoog培养基盐,目录号msp0501,犹他州史密斯菲尔德凯西森实验室(caisson laboratories,smithfield,ut))、10克蔗糖和8克bacto琼脂的培养皿中,用蒸馏水定容至1.00升,并置于设置为25摄氏度的组织培养箱中。待胚伸长、发育成根、出现真叶后,将幼苗移入土壤中长出。对所有内源pds等位基因的修饰导致植物无法产生叶绿素并具有可见的漂白表型。对所有内源pds等位基因的一部分的修饰使植物仍然能够产生叶绿素;对于改变的pds基因杂合的植物将长成种子,且可遗传的基因组修饰的效率由子代种子的
分子分析确定。
[0785]
实例13:通过游离报告基因倒位测定评估人细胞中的gene writer活性。
[0786]
该实例描述了针对人细胞中gene writer活性的报告基因测定。具体而言,该报告基因测定涉及将非活性报告基因质粒和带有可以将报告基因质粒上的反向gfp基因激活的酪氨酸重组酶的第二质粒共递送。
[0787]
在该实例中,将gene writer和报告基因递送至hek293t细胞。该递送包含两个质粒:1)重组酶表达质粒,其编码由哺乳动物cmv启动子驱动的重组酶序列(例如,表1中的重组酶、表2中的重组酶序列),以及2)报告基因质粒,其包含位于重组酶靶位点上游的cmv启动子,该重组酶靶位点侧翼是反向egfp序列(例如,在相对于彼此的反向取向上,侧翼是来自表1的第2列或第3列的一对识别位点的反向egfp序列)。选择酪氨酸重组酶以便对其天然序列(例如,如细菌中发现的天然序列,例如,如表1的第2列中所述)以及对应的人基因组序列(含有至多3个错配,例如,如表1的第3列中所述)进行活性测试,这些酪氨酸重组酶如本文其他地方所发现的且识别与人基因组同源的回文序列,包含至多3个错配。同源重组酶的存在可实现egfp序列的倒位,并允许cmv启动子驱动egfp表达,例如,如图1中的示意图所示。
[0788]
使用transit-293试剂(麦鲁斯生物公司(mirusbio))将大约120,000个hek293t细胞与表达重组酶的质粒和反向gfp报告基因质粒以重组酶的质粒:报告基因质粒为1:3的摩尔比率共转染,或以类似方式将这些hek293t细胞仅与报告基因质粒共转染作为阴性对照。转染后两天,利用流式细胞术测量重组酶活性,以确定egfp阳性细胞的百分比。流式细胞术分析的结果在表16中提供,且表明与阴性对照(仅报告基因质粒)相比,在人细胞中有活性的重组酶使egfp阳性细胞的百分比增加。
[0789]
实例14:通过在内源基因组基因座处的整合评估人细胞中的gene writer活性。
[0790]
该实例描述了针对人细胞中gene writer活性的整合测定。具体而言,该测定涉及将包含异源对象序列和重组酶识别位点的插入dna质粒和携带用于催化插入dna质粒整合到基因组的酪氨酸重组酶的第二质粒共递送。
[0791]
在该实例中,将gene writer和目的序列递送至hek293t细胞。该递送包含两个质粒:1)重组酶表达质粒,其含有由哺乳动物cmv启动子驱动的重组酶序列(例如,表1中的重组酶、表2中的重组酶序列),以及2)插入dna质粒,其包含目的基因(例如,gfp序列)上游的cmv启动子和天然重组酶识别位点(例如,表1第2列的序列)或与人基因组中某一序列(例如,人基因组中与天然识别位点同源的序列(例如,表1第3列的序列))匹配的重组酶识别位点,其中有三个或少于三个错配。图2中示出了示例整合反应。
[0792]
使用transit-293试剂(麦鲁斯生物公司)将大约120,000个hek293t细胞与表达重组酶的质粒和插入dna质粒以重组酶的质粒:插入dna质粒为1:3的摩尔比率共转染,或以类似方式将这些hek293t细胞仅与报告基因质粒共转染作为阴性对照。在转染后2-5天,使用液滴数字pcr(droplet digital,ddpcr)测量重组酶介导的基因组整合。通过计算相对于rpp30参考对照归一化的插入dna整合子的平均基因组拷贝数来近似估计成功整合的细胞百分比。ddpcr分析结果在表16中提供,且表明与阴性对照(仅报告基因质粒)相比,能够将插入dna质粒整合到人基因组中的重组酶使每基因组的平均整合事件数增加。
[0793]
实例15:倒位和整合测定数据
[0794]
使用游离报告基因倒位(实例13)或基因组整合(实例14)测定在人细胞中测试来自表1或2的重组酶,且数据显示在表16中。第2列指示加入了表1和2中所列的重组酶蛋白。对于游离测定,倒位活性显示为通过流式细胞术测量的gfp 细胞的百分比,其中第4列指示使用天然识别位点(表1的第2列)的倒位活性,且第6列指示使用最匹配的人类位点(表1的第3列)的倒位活性,第3列和第5列显示在没有重组酶的情况下各自的背景gfp。对于基因组整合测定,通过ddpcr测量的整合活性表示为通过每个基因组拷贝的整合插入dna载体的平均拷贝估计的细胞百分比,并显示在第7列中。在表16中列出的示例性重组酶中,至少34种在游离报告基因倒位测定中使用最匹配的人类位点显示出高于背景的活性。其中,至少有21种使用最匹配的人类位点显示出至少两倍于背景水平的活性。在通过基因组整合测定测试的表16中所列的示例性重组酶中,至少17种在人基因组中在最匹配的位点处显示活性。nt=未测试
[0795]
表16:人细胞中的重组酶活性。
[0796]
[0797]
[0798]
[0799]
[0800][0801]
实例16:酪氨酸重组酶和模板dna向哺乳动物细胞的双重aav递送
[0802]
该实例描述了基于酪氨酸重组酶的gene writer系统用于将模板dna靶向整合到人基因组中的用途。更具体而言,将重组酶(例如,具有来自表1或2的氨基酸序列的酪氨酸重组酶)和包含相关识别位点的模板dna(例如,来自表1的第2列或第3列的序列)共同递送至hek293t细胞作为单独的aav病毒载体,以将dna精确有效地插入哺乳动物细胞基因组中,该基因组包含同源识别位点,例如来自表1的第3列的序列。
[0803]
评估两种转基因构型以确定使用不同aav插入dna形式的整合、稳定性和表达:1)包含单个识别位点的模板,该识别位点利用在细胞核中的aav转导后双链环化dna的形成;或2)包含两个位于所需插入序列侧翼的相同取向识别位点的模板,例如来自表1的第2列或第3列中相同取向的识别序列的两个拷贝,其可以首先通过重组酶从aav基因组中切除用于环化,然后整合到哺乳动物基因组中。
[0804]
编码重组酶的腺相关病毒载体或含有对应识别位点的插入dna基于paav-cmv-egfp-wpre-pa病毒主链(sirion生物技术公司(sirion biotech))产生,但其中用ef1a启动子替换cmv启动子。paav-ef1a-重组酶-wpre-pa是使用人类密码子优化的重组酶(genscript公司(genscript))产生的。paav-填充片断插入dna构建体另外含有5’aav2 itr序列与ef1a启动子之间的500bp填充片断序列,或接近5’末端aav2 itr序列的500bp填充片断序列和接近3’aav2 itr的500bp填充片断序列。上面列出的aav载体以10
13
总vg规模包装成aav2血清型(sirion生物技术公司)。
[0805]
hek293t细胞以40,000个细胞/孔接种在48孔板形式中。24h后,用包含重组酶表达载体的aav和包含插入dna载体的aav,或仅包含插入dna载体的aav(阴性对照)转导细胞。在转导后第3天和第7天,提取基因组dna以评估使用双重aav递送酪氨酸重组酶和包含其识别位点的插入dna载体的整合效率。经由ddpcr评估整合事件,以对整个细胞群体的平均整合事件(拷贝/基因组)进行定量,以估计成功编辑的细胞比例。
[0806]
实例17:用于在人细胞中位点特异性整合的gene writing多肽和模板dna的体外组合mrna和aav递送
[0807]
该实例描述了gene writer系统用于将外源dna位点特异性地插入哺乳动物细胞基因组的用途。更具体而言,将重组酶(例如,具有来自表1或2的氨基酸序列的酪氨酸重组酶)和包含相关识别位点的模板dna(例如,来自表1的第2列或第3列的序列)引入hek293t细胞。在该实例中,将重组酶作为编码该重组酶的mrna递送,将模板dna经由aav递送。
[0808]
hek293t细胞以40,000个细胞/孔接种在48孔板形式中。24h后,用编码重组酶多肽的mrna和包含插入dna载体的aav,或仅包含插入dna载体的aav(阴性对照)转导细胞。递送时间通过以下条件评估:1)在同一天的重组酶的mrna递送和模板dna的aav递送,2)在模板dna的aav递送之前24h的重组酶的mrna递送,3)在重组酶的mrna递送之前24h的模板dna的aav递送。在mrna的转染后和aav的转导后三天提取基因组dna,以评估整合效率。经由ddpcr评估整合效率,以对整个细胞群体的平均整合事件(拷贝/基因组)进行定量,以估计成功编辑的细胞比例。
[0809]
实例18:向hsc的gene writing多肽和模板dna的离体组合mrna和aav递送以便治疗β-地中海贫血和镰状细胞疾病。
[0810]
该实例描述了将编码重组酶的mrna和aav模板dna递送到c34 细胞(造血干细胞和祖细胞)中,以便编写活跃表达的γ-珠蛋白基因盒来治疗引起β-地中海贫血和镰状细胞疾病的基因突变。
[0811]
在该实例中,aav6用于递送模板dna。更具体而言,aav6模板dna依次包括5’itr、重组酶识别位点(例如来自表1的第2列或第3列的序列)、pol ii启动子(例如人β-珠蛋白启动子)、人胎儿γ-珠蛋白编码序列、聚a尾和3’itr。考虑到电穿孔试剂的最大体积限制,将重组酶mrna和aav6模板经由不同的条件共同递送到cd34细胞中,这些条件为例如:1)将aav6模板和重组酶mrna共电穿孔;2)在aav6插入dna转导前15分钟对重组酶mrna进行电穿孔。
[0812]
电穿孔/转导后,将细胞在cd34维持培养基中培养2天。然后,收获约10%的经处理细胞用于基因组dna分离以确定整合效率。将其余的细胞转移到红细胞扩增和分化培养基中。分化约20天后,进行三项测定以确定红细胞分化后γ-珠蛋白的整合:1)用nucred(赛默飞世尔科技公司(thermo fisher scientific))对细胞子集进行染色以确定去核率;2)用异硫氰酸荧光素(fitc)缀合的抗γ-珠蛋白抗体(圣克鲁斯公司(santa cruz))对细胞子集进行染色,以确定胎儿血红蛋白阳性细胞的百分比;3)收获细胞子集用于hplc以确定γ-珠蛋白链表达。
[0813]
实例19:用于产生car-t细胞的gene writer多肽和环状dna模板的离体递送。
[0814]
该实例描述了将gene writing系统作为脱氧核糖核蛋白(dnp)递送至离体人原代t细胞以产生car-t细胞,例如用于治疗b细胞淋巴瘤的car-t细胞。
[0815]
制备并纯化gene writer多肽,例如重组酶,例如具有来自表1或表2的序列的重组酶,以直接以其活性蛋白形式使用。对于模板组分,在该实例中使用了缺少质粒主链和细菌序列的微环dna质粒,例如,根据chen等人mol ther[分子治疗]8(3):495-500(2003)的方法制备,其中首先使用重组事件来切除这些外来的质粒维持功能以最小化质粒大小和细胞反应。第一重组事件可以通过使所需载体序列与定位在相同取向的同源识别位点侧接来进行,使得与同源重组酶的体外重组导致包含单拷贝重组酶识别位点和用于整合的所需序列的微环模板dna的形成,其从剩余的质粒载体中纯化。模板dna微环依次包含重组酶识别位点,例如来自表1的第2列或第3列的序列,pol ii启动子,例如ef-1,人类密码子优化的嵌合
抗原受体(包括细胞外配体结合结构域、跨膜结构域和细胞内信号传导结构域),例如,cd19特异性hu19-cd828z(genbank mn698642;brudno等人nat med[自然医学]26:270-280(2020))car分子和聚a尾。首先将模板dna与纯化的重组酶蛋白混合,并在室温下孵育15-30分钟以形成dnp复合物。然后,将dnp复合物被核转染到活化的t细胞中。使用用于分子定量的ddpcr测定通过gene writer系统的整合,并通过流式细胞术测量car表达。
[0816]
实例20:编码gene writer多肽的mrna的产生
[0817]
该实例描述了通过从dna载体体外转录产生编码重组酶的mrna。mrna模板质粒包括t7启动子,后跟5’utr、重组酶编码序列、3’utr和约100个核苷酸长的聚(a)尾。将质粒通过酶促限制线性化,产生聚(a)尾下游的平端或5’突出端,并用于使用t7聚合酶(neb)进行的体外转录(ivt)。ivt后,将rna用dna酶i(neb)处理。缓冲液交换后,在gtp和sam(neb)存在的情况下,使用牛痘加帽酶(neb)和2
’‑
o-甲基转移酶(neb)进行酶促加帽。使用硅胶柱(例如,rna纯化试剂盒)对加帽rna进行纯化和浓缩,并通过2mm柠檬酸钠ph 6.5缓冲。
[0818]
实例21:用于确定整合位点的单向测序测定
[0819]
该实例描述了单向测序的性能,以确定具有全基因组特异性的无偏谱的未知整合位点的序列。
[0820]
通过使用包含重组酶和用于插入的模板dna的gene writing系统,如前面的实例进行整合实验。将重组酶和插入dna质粒转染到293t细胞中。在转染后72小时提取基因组dna并根据以下方法进行单向测序。首先,通过基因组dna的片段化、末端修复和接头连接创建下一代文库。接下来,使用与模板特异性序列结合的正向引物和与测序接头结合的反向引物,通过两步巢式pcr扩增含有模板dna整合事件的片段化基因组dna。将pcr产物在毛细管凝胶电泳仪上可视化,纯化,并通过qubit(赛默飞世尔公司)定量。最终文库在miseq上使用300bp配对末端读数(依诺米那公司(illumina))进行测序。通过检测位于插入物侧翼的dna并将该序列映射回人基因组序列(例如,hg38)来进行数据分析。
[0821]
实例22:双重aav载体用于治疗cftr小鼠模型的囊性纤维化的用途
[0822]
该实例描述了递送作为双重aav载体系统的gene writing系统以便治疗小鼠疾病模型中的囊性纤维化。囊性纤维化是一种由cftr基因突变引起的肺疾病,其可以通过将野生型cftr基因插入肺细胞基因组来治疗,肺细胞例如为在呼吸性细支气管和柱状无纤毛细胞中发现的终末细支气管中的细胞。
[0823]
将gene writing多肽(例如,包含表1或表2的序列)和包含同源重组酶识别位点的模板dna(例如,来自表1的第2列或第3列的序列)包装到aav6衣壳中,其中多肽的表达由cag启动子驱动,根据halbert等人hum gene ther[人类基因治疗]18(4):344-354(2007)的传授内容,已表明其组合对鼠呼吸道上皮细胞中的高水平转导和表达有效。
[0824]
如前所述(santry等人bmc biotechnol[bmc生物技术]17:43(2017)),使用改良的鼻内施用将aav制剂通过鼻内方式共同递送给cftr基因敲除(cftr
tm1unc
)小鼠(杰克逊实验室(the jackson labs))。简言之,将aav包装、纯化和浓缩,其包含重组酶表达盒或模板dna,包含在pol ii启动子例如cag启动子控制下的cftr基因,以及同源重组酶识别位点。在一些实施例中,cftr表达盒的侧翼是重组酶识别位点。使用改良的鼻内施用将制备的aav分别以1
×
10
10-1
×
10
12
vg/小鼠范围内的剂量递送至cftr敲除小鼠。一周后,收获肺组织并用
于基因组提取和组织分析。为了测量整合效率,使用ddpcr对cftr基因整合进行定量,以确定包含或缺少插入物的细胞和靶位点的比例。为了测定来自成功整合的cftr的表达,通过免疫组织化学法分析组织以确定表达和病理学。
[0825]
实例23:通过引入瞬时表达整合酶治疗鸟氨酸氨甲酰基转移酶缺乏症的方法
[0826]
该实例描述了通过递送和表达编码gene writer多肽的mrna(例如,来自表1或表2的重组酶序列)以及递送提供模板dna用于整合的aav对鸟氨酸氨甲酰基转移酶(otc)缺乏症的治疗。otc缺乏症是一种罕见的遗传性障碍,由于不能有效分解氮而导致氨积累。氨的积累会导致高氨血症,这种疾病可能会使人衰弱,且在严重的情况下会致命。aav模板包含在pol ii启动子控制下的人otc基因的野生型拷贝,例如apoe.haat,和同源重组酶识别位点,例如来自表1的第2列或第3列的序列。在一些实施例中,otc表达盒的侧翼是重组酶识别位点。
[0827]
在该实例中,重组酶mrna的lnp配制品遵循lnp-int-01的配制品(finn等人cell reports[细胞报告]22:2227-2235(2018)传授的方法,其通过引用并入本文)并且模板dna被配制在aav2/8中(ginn等人jhep reports[jhep报告](2019)传授的方法,其通过引用并入本文)。简言之,通过经由面部颞浅静脉注射含有重组酶mrna和aav(含有模板dna)(1
×
10
10-1
×
10
12
vg/小鼠)的lnp配制品(1-3mg/kg)治疗新生spf
ash
小鼠(杰克逊实验室)来恢复otc缺乏症(lampe等人.j vis exp[可视实验杂志]93:e52037(2014))。spf
ash
小鼠具有某种残留的小鼠otc活性,其在一些实施例中通过施用表达针对小鼠otc的shrna的aav被沉默,如前所述(cunningham等人mol ther[分子治疗]19(5):854-859(2011),其方法通过引用并入本文)。otc酶活性、氨水平和乳清酸如前所述进行测量(cunningham等人mol ther[分子治疗]19(5):854-859(2011))。1周后,收获小鼠肝脏并用于gdna提取和组织分析。hotc的整合效率通过ddpcr对提取的gdna进行测量。通过免疫组织化学法分析小鼠肝脏组织以确认hotc表达。
[0828]
实例24:gene writing将大有效负载整合到人细胞中的用途
[0829]
该实例描述了在体外进行的重组酶介导的大有效负载向人细胞中的整合。
[0830]
在该实例中,gene writer多肽组分包含编码重组酶的mrna,例如,表1或表2的重组酶序列,以及包含以下的模板dna:同源重组酶识别位点,例如表1的第2列或第3列的序列;gfp表达盒,例如与egfp可操作地连接的cmv启动子;以及填充片断序列,使总质粒大小达到大约20kb。
[0831]
简言之,将hek293t细胞与重组酶mrna和大模板dna共电穿孔。三天后,测量整合效率和特异性。为了测量整合效率,对基因组dna进行液滴数字pcr(ddpcr),例如,如lin等人hum gene ther methods[人类基因治疗方法]27(5):197-208(2016)所述,使用跨整合结点扩增的引物-探针组,例如,一个引物与模板dna退火,另一个引物与基因组的适当侧翼区域退火,使得仅对整合事件进行定量。数据相对于内部参考基因(例如,rpp30)归一化,且效率表示为整个细胞群体中每基因组的平均整合事件。为了测量特异性,通过单向测序来评估基因组dna中的整合事件以确定基因组坐标,如实例21中所述。
[0832]
实例25:gene writing离体将细菌人工染色体整合到人胚胎干细胞中的用途。
[0833]
该实例描述了重组酶介导的细菌人工染色体(bac)向人胚胎干细胞(hesc)中的整合。
[0834]
bac载体能够维持非常大(》100kb)的dna有效负载,且因此可以携带许多基因或复杂的基因回路,这些基因或复杂的基因回路可能在细胞工程中有用。尽管已经证明它们整合到hesc中(rostovskaya等人nucleic acids res[核酸研究]40(19):e150(2012)),但这是使用在它们的整合模式中缺乏序列特异性的转座子完成的。该实例描述了大型构建体的序列特异性整合。
[0835]
在该实例中,经工程化以携带所需有效负载的bac进一步包含重组酶识别序列,例如表1的第2列或第3列的序列,该重组酶识别序列能够被gene writer多肽(例如重组酶,例如具有表1或表2的序列的重组酶)识别。根据rostovskaya等人nucleic acids res[核酸研究]40(19):e150(2012)的传授内容,通过电穿孔或脂质转染将大约150kb bac引入hesc。三天后,测量整合效率和特异性。为了测量整合效率,对基因组dna进行液滴数字pcr(ddpcr),例如,如lin等人hum gene ther methods[人类基因治疗方法]27(5):197-208(2016)所述,使用跨整合结点扩增的引物-探针组,例如,一个引物与模板dna退火,另一个引物与基因组的适当侧翼区域退火,使得仅对整合事件进行定量。数据相对于内部参考基因(例如,rpp30)归一化,且效率表示为整个细胞群体中每基因组的平均整合事件。为了测量特异性,通过单向测序来评估基因组dna中的整合事件以确定基因组坐标,如实例21中所述。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献