一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

CRISPR相关转座酶系统和其使用方法与流程

2021-10-23 08:42:00 来源:中国专利 TAG:美国 申请 临时 提交 靶向

crispr相关转座酶系统和其使用方法
1.相关申请的交叉引用
2.本技术要求2018年12月17日提交的美国临时申请第62/780,658号、2018年12月21日提交的美国临时申请第62/783,878号、2019年3月19日提交的美国临时申请第62/820,639号、2019年4月5日提交的美国临时申请第62/830,059号、2019年4月23日提交的美国临时申请第62/837,695号、2019年5月7日提交的美国临时申请第62/844,685号、2019年5月24日提交的美国临时申请第62/852,922号、2019年5月31日提交的美国临时申请第62/855,763号、2019年6月17日提交的美国临时申请第62/862,531号、2019年7月8日提交的美国临时申请第62/871,683号、2019年9月23日提交的美国临时申请第62/904,548号、2019年10月12日提交的美国临时申请第62/914,471号的权益。上述申请的全部内容特此通过引用全部并入本文。
3.关于联邦政府资助研究的声明
4.本发明是在美国国立卫生研究院授予的拨款号mh110049和hl141201的政府支持下完成的。政府拥有本发明的某些权利。
5.对电子序列表的引用
6.电子序列表(“brod_4220wp_st25.txt”;大小为1,184,555字节并且其创建于2019年12月17日)的内容通过引用整体并入本文。
技术领域
7.本发明一般涉及用于靶向基因修饰、靶向插入、基因转录物的扰动和核酸编辑的系统、方法和组合物。新型核酸靶向系统包含成簇规则间隔短回文重复序列(crispr)系统和可转座元件的组分。


背景技术:

8.基因组测序技术和分析方法的最新进展显著加速了对与范围广泛的生物学功能和疾病相关的遗传因子进行编目和映射的能力。需要精确的基因组靶向技术,以通过允许对单个遗传元件进行选择性扰动来实现因果遗传变异的系统逆向工程,以及推进合成生物学、生物技术和医学应用。尽管基因组编辑技术如设计者锌指、转录激活子样效应子(tale)或归巢大范围核酸酶可用于产生靶向基因组扰动,但是仍需要采用新型策略和分子机制并且价格可承受、易于建立、可扩展并且适合于靶向真核基因组内的多个位置的新的基因组工程技术。这将为基因组工程和生物技术的新应用提供主要资源。
9.细菌和古细菌适应性免疫的crispr

cas系统显示出蛋白质组成、基因组基因座构造和系统功能的极端多样性,并且包含crispr样组分的系统很普遍并不断被发现。新型1类多亚基效应子复合物和2类单亚基效应子模块可开发作为强大的基因组工程工具。这些以包含与1类和2类crispr

cas系统和crispr阵列相关的tn7样转座子的细菌和古细菌基因组为例。
10.在本技术中对任何文件的引用或标识均不承认所述文件可用作本发明的现有技
术。


技术实现要素:

11.在一个方面,本公开提供了一种用于插入供体多核苷酸的工程化核酸靶向系统,所述系统包含:a)一种或多种crispr相关转座酶蛋白或其功能片段;b)cas蛋白;和c)能够与所述cas蛋白复合并引导指导物

cas蛋白复合物与靶多核苷酸的靶序列的序列特异性结合的指导分子。
12.在一些实施方案中,一种或多种crispr相关转座酶蛋白包含i)tnsb和tnsc,或ii)tnia和tnib。在一些实施方案中,一种或多种crispr相关转座酶蛋白包含:a)tnsa、tnsb、tnsc和tniq,b)tnsa、tnsb和tnsc,c)tnsb、tnsc和tniq,d)tnsa、tnsb和tniq,e)tnse,f)tnia、tnib和tniq,g)tnsb、tnsc和tnsd,或h)它们的任何组合。在一些实施方案中,一种或多种crispr相关转座酶蛋白包含tnsb、tnsc和tniq。在一些实施方案中,tnsb、tnsc和tniq由表26或表27中的多核苷酸编码,或者是表28或表29中的蛋白质。在一些实施方案中,tnse不与dna结合。在一些实施方案中,一种或多种crispr相关转座酶蛋白是一种或多种tn5转座酶。在一些实施方案中,一种或多种crispr相关转座酶蛋白是一种或多种tn7转座酶或tn7样转座酶。在一些实施方案中,一种或多种crispr相关转座酶蛋白包含tnpa。在一些实施方案中,一种或多种crispr相关转座酶蛋白包含tnpai
s608
。在一些实施方案中,所述系统还包含用于插入靶多核苷酸中的供体多核苷酸。在一些实施方案中,供体多核苷酸将被插入靶多核苷酸中pam序列下游40至100个碱基之间的位置。在一些实施方案中,供体多核苷酸的侧翼是右端序列元件和左端序列元件。
13.在一些实施方案中,供体多核苷酸:a)向靶多核苷酸引入一个或多个突变,b)在靶多核苷酸中引入或校正提前终止密码子,c)破坏剪接位点,d)恢复或引入剪接位点,e)在靶多核苷酸的一个或两个等位基因处插入基因或基因片段,或f)它们的组合。在一些实施方案中,由供体多核苷酸引入的一个或多个突变包括取代、缺失、插入或它们的组合。在一些实施方案中,一个或多个突变导致靶多核苷酸上的开放阅读框的移位。在一些实施方案中,供体多核苷酸长度在100个碱基至30kb之间。
14.在一些实施方案中,cas蛋白是v型cas蛋白。在一些实施方案中,v型cas蛋白是v

j型cas蛋白。在一些实施方案中,cas蛋白是cas12。在一些实施方案中,cas12是cas12a或cas12b。在一些实施方案中,cas 12是cas12k。在一些实施方案中,cas12k由表26或表27中的多核苷酸编码,或者是表28或表29中的蛋白质。在一些实施方案中,cas12k属于图2a和图2b或表26的生物体。在一些实施方案中,cas蛋白包含激活突变。在一些实施方案中,cas蛋白是i型cas蛋白。在一些实施方案中,i型cas蛋白包含cas5f、cas6f、cas7f和cas8f。在一些实施方案中,i型cas蛋白包含cas8f

cas5f、cas6f和cas7f。在一些实施方案中,i型cas蛋白是i

f型cas蛋白。在一些实施方案中,cas蛋白是ii型cas蛋白。在一些实施方案中,与野生型对应物相比,ii型cas蛋白是突变的cas蛋白。在一些实施方案中,突变的cas蛋白是突变的cas9。在一些实施方案中,突变的cas9是cas9
d10a

15.在一些实施方案中,cas蛋白缺乏核酸酶活性。在一些实施方案中,所述系统还包含供体多核苷酸。在一些实施方案中,crispr

cas系统包含dna结合结构域。在一些实施方案中,dna结合结构域是死cas蛋白。在一些实施方案中,死cas蛋白是dcas9、dcas12a或
dcas12b。在一些实施方案中,dna结合结构域是rna指导的dna结合结构域。在一些实施方案中,靶核酸具有pam。在一些实施方案中,pam在靶标的5'侧并且包含tttn或attn。在一些实施方案中,pam包含ngtn、rgtr、vgtd或vgtr。在一些实施方案中,指导分子是由表26中的多核苷酸编码的rna分子。
16.在另一方面,本公开提供了一种工程化系统,所述工程化系统包含一种或多种编码本文的组分(a)、(b)和/或(c)的多核苷酸。在一些实施方案中,一种或多种多核苷酸可操作地连接到一种或多种调控序列。在一些实施方案中,所述系统包含一种或多种转座子组分。在一些实施方案中,一种或多种蛋白质和核酸组分由载体包含。在一些实施方案中,一种或多种转座酶包含tnsb、tnsc和tniq,并且cas蛋白是cas12k。在一些实施方案中,一种或多种多核苷酸选自表26中的多核苷酸。
17.在另一方面,本公开提供了一种载体,所述载体包含一种或多种编码本文组分(a)、(b)和/或(c)的多核苷酸。
18.在另一方面,本公开提供了包含本文载体的细胞或其后代。
19.在另一方面,本公开提供了包含本文系统的细胞或其后代,其包含由所述系统产生的一个或多个插入。在一些实施方案中,细胞是原核细胞。在一些实施方案中,细胞是真核细胞。在一些实施方案中,细胞是哺乳动物细胞、非人灵长类动物细胞或人类细胞。在一些实施方案中,细胞是植物细胞。在另一方面,本公开提供了包含本文细胞的生物体或其群体。
20.在另一方面,本公开提供了将供体多核苷酸插入细胞中的靶多核苷酸的方法,所述方法包括向所述细胞中引入:a)一种或多种crispr相关转座酶或其功能片段,b)cas蛋白,c)能够与靶多核苷酸上的靶序列结合并设计为与所述cas蛋白形成crispr

cas复合物的指导分子,和e)供体多核苷酸,其中所述crispr

cas复合物将所述crispr相关转座酶引导到所述靶序列,并且所述crispr相关转座酶将所述供体多核苷酸插入到所述靶多核苷酸中的所述靶序列处或附近。
21.在一些实施方案中,供体多核苷酸将被插入靶多核苷酸中pam序列下游40至100个碱基之间的位置。在一些实施方案中,供体多核苷酸:a)向靶多核苷酸引入一个或多个突变,b)在靶多核苷酸中校正或引入提前终止密码子,c)破坏剪接位点,d)恢复或引入剪接位点,e)在靶多核苷酸的一个或两个等位基因处插入基因或基因片段,或f)它们的组合。
22.在一些实施方案中,由供体多核苷酸引入的一个或多个突变包括取代、缺失、插入或它们的组合。在一些实施方案中,一个或多个突变导致靶多核苷酸上的开放阅读框的移位。在一些实施方案中,供体多核苷酸长度在100个碱基至30kb之间。在一些实施方案中,组分(a)、(b)和(c)中的一者或多者由与在细胞中表达的调控序列可操作地连接的核酸表达。在一些实施方案中,将组分(a)、(b)和(c)中的一者或多者引入粒子中。在一些实施方案中,粒子包含核糖核蛋白(rnp)。在一些实施方案中,细胞是原核细胞。在一些实施方案中,细胞是真核细胞。在一些实施方案中,细胞是哺乳动物细胞、非人灵长类动物细胞或人类细胞。在一些实施方案中,细胞是植物细胞。
23.在另一方面,本公开提供了一种用于将多核苷酸插入靶核酸中的工程化核酸靶向系统,所述系统包含a)被设计成与tnsbc形成复合物并连接到可编程dna结合结构域的工程化c2c5蛋白或其片段,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合
物靶向靶核酸的指导物,c)i)tnsa、tnsb和tniq,或ii)tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端和左端序列元件。
24.在另一方面,本公开提供了一种用于将多核苷酸插入靶核酸中的工程化核酸靶向系统,所述系统包含a)被设计成与tnsabc

tniq结合或与可编程dna结合结构域连接的tnsabc结合的cas5678f复合物的组分,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向靶核酸的指导物,c)i)tnsa、tnsb、tnsc和tniq,或ii)tnsa、tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端和左端序列元件。
25.在另一方面,本公开提供了一种将多核苷酸插入细胞中的靶核酸中的方法,所述方法包括向所述细胞中引入a)被设计成与tnsabc或tnsbc形成复合物并连接到可编程dna结合结构域的工程化tnse蛋白或其片段,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向靶核酸的指导物,c)i)tnsa、tnsb和tnsc,或ii)tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端和左端序列元件,其中所述指导物引导所述靶核酸的切割,由此插入所述多核苷酸。
26.在另一方面,本公开提供了一种将多核苷酸插入细胞中的靶核酸中的方法,所述方法包括向所述细胞中引入a)被设计成与tnsbc形成复合物并连接到可编程dna结合结构域的工程化c2c5蛋白或其片段,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向靶核酸的指导物,c)i)tnsa、tnsb和tniq,或ii)tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端和左端序列元件,其中所述指导物引导所述靶核酸的切割,由此插入所述多核苷酸。
27.在另一方面,本公开提供了一种将多核苷酸插入细胞中的靶核酸中的方法,所述方法包括向所述细胞中引入a)被设计成与tnsabc

tniq结合或与连接到可编程dna结合结构域的tnsabc结合的cas5678f复合物的组分,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向靶核酸的指导物,c)i)tnsa、tnsb、tnsc和tniq,或ii)tnsa、tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端和左端序列元件。
28.在另一方面,本公开提供了一种用于将多核苷酸插入靶核酸中的工程化核酸靶向系统,所述系统包含a)被设计成与tnsbc形成复合物并连接到可编程dna结合结构域的工程化c2c5蛋白或其片段,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向靶核酸的指导物,c)i)tnia、tnib和tniq,或ii)tnsb和tnsc,和tnsd,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端和左端序列元件。
29.在另一方面,本公开提供了一种将多核苷酸插入细胞中的靶核酸中的方法,所述方法包括向所述细胞中引入a)被设计成与tnsabc

tniq结合或与连接到可编程dna结合结构域的tnsabc结合的cas5678f复合物的组分,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向靶核酸的指导物,c)i)tnia、tnib和tniq,或ii)tnsb和tnsc,和tnsd,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端和左端序列元件。
30.考虑到所示示例实施方案的以下详细描述,示例实施方案的这些和其他方面、目的、特征和优点对于本领域普通技术人员将变得显而易见。
附图说明
31.将通过参考以下阐述可利用本发明原理的说明性实施方案的详细描述和附图来
获得对本发明的特征和优点的理解,在所述附图中:
32.图1.描绘了蓝杆藻属(cyanothece)物种pcc 8801的v

u5(c2c5)区域的图谱。
33.图2a

2b.v

u5效应蛋白的分类学。
34.图3.霍夫曼伪枝藻(scytonema hoffmanni)utex 2349的图谱。
35.图4a

4c.来自霍夫曼伪枝藻utex 2349的小rna

seq。图4a:与c2c5基因座相关的转录物。图4b:图4a中描绘的四种推定tracrrna的序列(seq id no:1

4)。图4c:tracrrna_1与dr的预测折叠(seq id no:390

391)。
36.图5.来自蓝藻(cyanobacteria)中的天然基因座的rna测序以及四种tracrrna与crrna的折叠(seq id no:930

937)。
37.图6a

6b.图6a:用于在大肠杆菌(e.coli)中产生插入的载体。tnsb、tnsc、tniq和c2c5连同内源性tracrrna区域和靶向fnpsp1的crrna一起由puc19质粒表达。r6k供体质粒含有带有卡那霉素抗性货物基因的t14左转座子末端和右转座子末端。使用含有6n pam文库的pacyc目标质粒。回收卡那霉素抗性菌落并测序以鉴定富集的pam基序和插入位点位置。图6b:pam文库的靶序列(seq id no:5

6)。
38.图7.插入pam文库的深度测序揭示了t14_c2c5(utex b 2349)的gtn pam偏好和靶标下游的插入位置。
39.图8a

8b.插入gtt pam靶标中的测序确认。t14供体被插入到左端连接处gcttg目标位点的下游并且证实该位点(gcttg)在右端连接处重复,与野生型tn7转座酶的已知活性一致。图8a:le连接处(seq id no:7

8)。图8b:re连接处(seq id no:9

10)。
40.图9.rna指导的利用纯化组分的体外转座。在存在tnsb、tnsc、tniq和c2c5的情况下,tracrrna 2.8和2.11都介导靶向插入。
41.图10a

10b.crrna和tracrrna的预测退火。图10a:来自表达t14 c2c5的大肠杆菌的rna

seq。图10b:crrna和tracrrna 2.11之间的预测结合以及连接crrna和tracrrna 2.11的sgrna设计(seq id no:938

940)。
42.图11.rna指导插入的体外条件。插入是特异于crrna靶序列的并且存在有5'ggtt pam而不是aacc pam或乱序靶标。插入依赖于所有四种蛋白质组分(tnsb、tnsc、tniq和c2c5),并且去除任何因子都会消除活性。插入可在25、30和37c发生,在37c观察到最高活性。
43.图12a

12c.sgrna变体。图12a:设计了12个sgrna变体并测试了体外rna指导的转座活性。sgrna核苷酸序列显示在实施例11中。图12b:大肠杆菌中rna指导插入的插入频率。图12c:sgrna

10的预测折叠(seq id no:11)。
44.图13a

13c.crispr相关转座酶(cast)系统。图13a:含有tn7样蛋白、crispr

cas效应子cas12j和crispr阵列的霍夫曼伪枝藻cast基因座的示意图。预测的转座子末端标注为le和re。图13b:蓝藻霍夫曼伪枝藻的荧光显微照片。比例尺,40um。图13c:来自霍夫曼伪枝藻的小rna

seq读段的比对。标记了推定的tracrrna的位置。
45.图14a

14d.rna指导插入的靶向要求。图14a:在大肠杆菌中测试cast系统活性的实验的示意图。图14b:由shcast和accast介导的插入的pam基序。图14c:通过深度测序鉴定的shcast和accast插入位置。图14d:通过ddpcr确定的具有ptarget底物的大肠杆菌中shcast系统的插入频率。误差条表示来自n=3个重复物的标准偏差。
46.图15a

15d.rna指导插入的遗传要求。图15a:tnsb、tnsc、tniq、cas12j和tracrrna对插入活性的遗传要求。缺失组分由虚线轮廓指示。图15b:用pj23119启动子表达的6种tracrrna变体的插入活性。图15c:tracrrna和crrna碱基配对和突出显示接头序列(蓝色)(seq id no:12

15)的两个sgrna设计的示意图。图15d:le和re的供体截短的插入活性。预测的转座酶结合位点用灰线指示。对于所有组,实验均在大肠杆菌中进行,并且插入频率通过ddpcr对提取的质粒dna确定。误差条表示来自n=3个重复物的标准偏差。
47.图16a

16f.rna指导的转座酶的体外重组。图16a:用纯化的shcast蛋白和质粒供体和靶标进行体外转座反应的示意图。图16b:体外转座的rna要求。通过pcr检测pinsert的le和re连接处。所有反应都含有pdonor和ptarget。示意图指示所有反应的引物位置和预期产物大小。图16c:体外shcast的靶向特异性。所有反应都含有shcast蛋白和sgrna。图16d:体外转座的蛋白质要求。所有反应都含有pdonor、ptarget和sgrna。图16e:体外转座的crispr

cas效应子要求。所有反应都含有shcast蛋白、pdonor和ptarget。图16f:从大肠杆菌转化和提取后pinsert反应产物的色谱图。le和re元件突出显示,并表示出重复的插入位点。对于所有组,shcast蛋白以50nm的终浓度使用,并且所有反应以n=3个重复物进行并显示了代表性图像(seq id no:16

19)。
48.图17a

17e.shcast介导大肠杆菌中的基因组插入。图17a:测试大肠杆菌基因组插入的实验的示意图。图17b:shcast转化后10个测试原间隔子的插入频率。通过对提取的基因组dna进行ddpcr来确定插入频率。误差条表示来自n=3个重复物的标准偏差。图17c:shcast转化后大肠杆菌群体中3个测试原间隔子的侧翼pcr。示意图指示引物的位置和预期的产物大小。图17d:shcast转化后通过深度测序确定的插入位点位置。图17e:通过无偏供体检测确定的插入位置。注释出每个原间隔子的位置以及映射到靶标的总供体读段的百分比。
49.图18.rna指导的dna转座的模型。由cas12j、tnsb、tnsc和tniq组成的shcast复合物介导pam下游60

66bp的dna插入。将转座子le和re序列以及任何额外货物基因插入dna中,导致5bp插入位点的重复。
50.图19a

19d.用于靶向dna转座的工程化cas9

tnpa融合物。图19a:使用与cas9d10a融合的tnpa的体外插入反应的示意图。反应含有哺乳动物细胞裂解物和质粒靶标以及环状ssdna联合供体。图19b:利用cas9

tnpa体外插入到质粒靶标中。插入通过pcr检测并依赖于供体dna、活性转座酶和暴露r环中ttac插入基序的sgrna。图19c:具有侧翼引物的体外反应产物的深度测序揭示了ttac插入位点下游的精确插入。le和re元件被注释(seq id no:20

30)。图19d:来自各种插入位点底物的tnpa家族蛋白的体外测试。所有tnpa蛋白都与cas9d10a融合并在哺乳动物裂解物中表达。使用ddpcr确定插入频率。
51.图20a

20c.crispr相关转座酶(cast)系统以及tnsb、tnsc和tniq蛋白的序列特征。图20a:在这项工作中分析的两个tn7样元件的注释基因组图谱。指示了物种名称、基因组登录号和核苷酸坐标。基因由指示转录方向的块箭头显示,并大致按比例绘制。cast相关基因是彩色的。带注释的货物基因以浅灰色显示,并根据来自相应hhpred搜索的统计显著命中率(概率>90%)提供简短描述。crispr阵列中间隔子的数量和crispr重复序列的序列指示在方案的右端(seq id no:31

32)。图20b:cast转座酶的三个核心蛋白的序列特征和结构域组织。蛋白质以大致按比例绘制的矩形显示。基于来自相应hhpred搜索的统计显著
命中率(概率>90%),结构域在矩形内显示为灰色框。pfam数据库中最相关的命中物被映射并显示在相应的矩形上方。shtniq蛋白与来自不同tn7样元件的选定同源物进行比较。对于shtnsb和shtnsc指示催化基序。缩写:chat,胱天蛋白酶家族蛋白酶;hepn,预测的hepn家族的rna酶;hth

螺旋

转角

螺旋dna结合结构域;rhh,带

螺旋

螺旋dna结合结构域;rm,限制性修饰;tpr,含有三十四肽重复序列的蛋白。图20c:小rna

seq揭示accast crispr阵列和预测的tracrrna的活跃表达。
52.图21a

21c.rna指导插入的靶向要求。图21a:将pam、pdonor和shcast phelper或accast phelper的文库转化到大肠杆菌中用于发现pam靶向要求。插入产物被选择性扩增,并且具有可检测插入的pam被排序并基于它们的log2富集分数进行评分。log2富集截止值4用于优选pam的后续分析。图21b:用于shcast和accast的优选pam序列的pam轮解释。图21c:通过用限定的pam转化phelper、pdonor和ptarget进行shcast中单个pam的验证。插入频率由ddpcr确定。
53.图22.大肠杆菌中靶向插入产物的sanger测序。来自用phelper、pdonor和ptargetggtt转化的大肠杆菌的质粒dna被重新转化到大肠杆菌中并进行sanger测序验证。重复的插入位点在每条迹线中加下划线(seq id no:33

37)。
54.图23a

23d.rna指导插入的插入位点要求。图23a:插入基序文库筛选的示意图。pdonor、ptarget和phelper被转化到大肠杆菌中,并通过pcr富集插入以进行后续的测序分析。图23b:插入位点上游的5n基序根据它们相对于输入文库的log2富集进行排序和评分。最丰富的插入位置(62bp)上游5bp用于分析。log2富集截止值1用于优选基序的后续分析,显示出非常弱的基序偏好。图23c:5n优选基序的序列标识显示对插入位点上游3bp的t/a核苷酸的较小偏好。图23d:鉴定的优选基序序列的基序轮解释。
55.图24a

24b.shcast转座子末端序列分析。图24a:shcast转座子末端的序列突出显示短和长重复基序(seq id no:38

39)。图24b:shcast重复基序和典型tn7tnsb结合序列(seq id no:40

49)的比对。
56.图25a

25d.rna指导的转座酶的体外重组。图25a:纯化的shcast蛋白的考马斯染色的sds

page凝胶。图25b:shcast的体外转座活性的温度依赖性。图25c:在不存在atp和mgcl2的情况下的体外反应。图25d:利用cas9和cas12j在ptargetggtt上的体外切割反应。缓冲液1:neb cutsmart,缓冲液2:neb 1,缓冲液3:neb 2,缓冲液4:tn7反应缓冲液。
57.图26a

26b.shcast介导大肠杆菌中的基因组插入。图26a:通过le连接处的套式pcr筛选大肠杆菌基因组中48个目标位点的插入。图26b:对用phelper与基因组靶向sgrna和pdonor转化的大肠杆菌进行重新划线,证明能够用目标插入产物恢复细菌的克隆群体。
58.图27.大肠杆菌基因组插入的序列分析。基因组插入的靶向扩增和深度测序以鉴定插入位置。
59.图28.cast介导的基因校正的潜在策略。通过靶向dna插入替换含有突变的外显子。
60.图29.shcast插入质粒中与cas12j无关。利用野生型shcast和非靶向sgrna和具有cas12j缺失的shcast插入phelper中的序列分析。
61.图30a

30d.图30a显示了用于体外转座酶反应的134bp双链dna底物的示意图。来自幽门螺杆菌(helicobacter pylori)is608的转座酶tnpa将单链dna 5'插入到ttac位点
(seq id no:50)。图30b显示了用于在哺乳动物细胞中表达的构建体的示意图。来自is608的tnpa作为二聚体起作用,并且构建体由融合tnpa单体与cas9

d10a(tnpa

cas9)、融合至cas9

d10a的tnpa的串联二聚体(tnpa
x2

cas9)或单独的游离tnpa制成。xten
16
和xten
32
分别是具有16和32个氨基酸的蛋白质接头。图30c显示了用含有tnpa的哺乳动物细胞裂解物插入外来dna。与a组中的134bp底物、合成sgrna以及来自表达指定构建体的哺乳动物细胞的裂解物进行体外反应。所有反应中包括的所提供的供体都是200bp环状ssdna分子,其含有is608的左发夹和右发夹以及90bp外来内部dna。pcr e1扩增完整底物,而插入特异性pcr e2和e3含有一个侧翼引物和一个对供体序列特异的引物。观察到的产物与供体插入一致,并且与183bp(e2)和170bp(e3)的预测大小相匹配。无法在总反应中或在pcr e1中检测到334bp条带表明整体插入率较低。当tnpa存在于任何不依赖于sgrna的裂解物中时,pcr e2和e3表明供体插入。图30d显示了指示供体dna插入位点的e2产物的ngs测序。tnpa的非特异性整合发生在阵列中所有可能的整合位点,由相距4bp的峰指示。与tnpa
x2

cas9

d10a裂解物温育导致单链dna 5'靶向整合到距pam15和19bp的位置,其方式取决于指导rna(seq id no:51)的存在和目标位点。
62.图31a

31d.图31a显示了克隆到puc19中的用于体外转座酶反应的280bp双链dna底物的示意图。底物含有ttacx6tnpa插入位点的两个阵列,其中一个由cas9 sgrna靶向。质粒底物用t5核酸外切酶处理以去除污染的单链dna。图31b显示了利用含有tnpa的哺乳动物细胞裂解物插入外来dna。与a组中的280bp底物、合成sgrna以及来自表达指定构建体的哺乳动物细胞的裂解物进行体外反应。供体dna是160bp环状ssdna分子,其含有is608的左发夹和右发夹以及90bp外来dna。pcr e1扩增完整底物,而插入特异性pcr e2和e3含有一个侧翼引物和一个对供体序列特异的引物。与tnpa
is608 x2

cas9
d10a
而非单独tnpa温育后可检测到250bp pcr产物,并且取决于供体和sgrna的存在。图31c显示了从匹配的大肠杆菌中纯化重组tnpa
is608 x2

cas9
d10a
。考马斯染色的sds

page显示纯化蛋白质的两种稀释度。图31d显示了使用哺乳动物细胞裂解物与纯化蛋白质的体外dna插入的比较。与a组中的280bp底物、合成的sgrna和表达指定构建体的哺乳动物细胞的裂解物或来自c组的纯化蛋白质进行体外反应。供体dna是160bp环状ssdna分子,其含有is608的左发夹和右发夹以及90bp外来dna。pcr e1扩增了完整底物,而插入特异性pcr e2和e3含有一个侧翼引物和一个对供体序列特异的引物。添加tnpa
is608 x2

cas9
d10a
裂解物和蛋白质后,250bp的e2产物微弱可见,而pcr e3检测到更稳健的插入产物。与240bp条带相比,152bp处的较暗条带与定向插入到cas9靶向ttac阵列一致,预测为第二个ttac阵列处非靶向插入的大小。152bp e3插入特异性pcr产物依赖于供体dna和sgrna。
63.图32显示了展示示例性方法的示意图。cas9用于暴露单链dna底物。huh转座酶被栓系以插入单链dna。相对的链被切刻并允许填充dna合成。
64.图33显示了哺乳动物表达构建体的示意图,其中来自幽门螺杆菌is608的tnpa与d10a切口酶cas9融合。xten
16
和xten
32
是两种不同的多肽接头。底物1的示意图,一种双链dna底物(互补链未显示),具有12个ttac插入位点的阵列并被两个cas9 sgrna(seq id no:52)靶向。
65.图34显示了体外插入反应。底物1与指定的哺乳动物细胞裂解物、200bp环状单链dna供体和sgrna一起温育。pcr e2和e3通过使用一种供体特异性引物跨越插入连接处来检
测插入产物。
66.图35显示了来自滑动片7中突出显示的e2反应的插入位点的ngs。在不存在指导物的情况下,在阵列中的所有可能位置检测到插入。在反应中添加sgrna1或sgrna2使插入事件偏向于底物中两个更突出的位点(seq id no:53)。
67.图36显示了对应于来自各个sgrna(seq id no:54)的pam的位置16和20的突出插入位点。
68.图37显示了来自多种细菌物种的tnpa

cas9融合物的新融合物的示意图和表达。ggs
32
和xten
32
是多肽接头。来自幽门螺杆菌的ishp608、来自肉毒杆菌(clostridium botulinum)的iscbt1、来自念珠藻属(nostoc)物种的isnsp2、来自蜡状芽孢杆菌(bacillus cereus)的isbce3、来自鼠疫耶尔森氏菌(yersinia pestis)的is200g、来自马氏甲烷八叠球菌(methanosarcina mazei)的ismma22、来自霍乱弧菌(vibrio chloerae)的is1004。利用底物1的实验揭示了单独使用tnpa的插入产物,这可能是由底物的单链dna污染造成的。用六个ttac插入位点的两个阵列构建了第二质粒底物(底物2)。通过t5核酸外切酶消化去除单链dna。
69.图38显示了体外插入反应。底物2与指定的哺乳动物细胞裂解物、160bp环状单链dna供体和sgrna1一起温育。pcr e2检测到预测大小为247bp的插入事件。
70.图39显示了tnpa

cas9纯化蛋白的sds

page(左图,显示了两种稀释度)。与哺乳动物细胞裂解物和纯化蛋白质的体外反应都揭示了依赖于供体和sgrna的插入事件。
lin
供体表示线性供体。
71.图40显示了来自滑动片12中突出显示的反应的插入位点的ngs。在不存在指导物的情况下,在整个阵列中检测到低水平的插入。添加sgrna2导致指导序列内的靶向插入,最突出的是在距pam(seq id no:55)的第16位。
72.图41显示了具有被不同tnpa直系同源物识别的插入位点的质粒底物(底物3)。与哺乳动物裂解物、160bp环状单链dna供体和sgrna进行体外反应。来自is608的tnpa插入在ttac序列之后并且靶向底物的其他区域不会导致可检测的插入。
73.图42a

42g.crispr相关转座酶(cast)系统的靶向要求。图42a.含有tn7样蛋白、crispr

cas效应子cas12k和crispr阵列的霍夫曼伪枝藻cast基因座的示意图。图42b.蓝藻霍夫曼伪枝藻的荧光显微照片。比例尺,40um(seq id no:56)。图42c.来自霍夫曼伪枝藻的小rna

seq读段的比对。标记了推定的tracrrna的位置。图42d.在大肠杆菌中测试cast系统活性的实验的示意图(seq id no:941)。图42e.由shcast和accast介导的插入的pam基序。图42f.通过深度测序鉴定的shcast和accast插入位置。图42g.通过ddpcr确定的shcast系统在带有ptarget底物的大肠杆菌中的插入频率。误差条表示来自n=3个重复物的标准偏差。
74.图43a

43d.rna指导插入的遗传要求。图43a.tnsb、tnsc、tniq、cas12k和tracrrna对插入活性的遗传要求。缺失组分由虚线轮廓指示。图43b.用pj23119启动子表达的6种tracrrna变体的插入活性。图43c.tracrrna和crrna碱基配对和突出显示接头序列(蓝色)(seq id no:57

60)的两个sgrna设计的示意图。图43d.插入到含有shcast转座子末端的ptarget中的活性相对于没有先前插入的ptarget中的活性。
75.图44a

44f.rna指导的转座酶的体外重组。图44a.使用纯化的shcast蛋白和质粒
供体和靶标进行体外转座反应的示意图。图44b.体外转座的rna要求。通过pcr检测pinsert的le和re连接处。所有反应都含有pdonor和ptarget。示意图指示了所有反应的引物位置和预期产物大小。图44c.shcast的体外靶向特异性。所有反应都含有shcast蛋白和sgrna。图44d.体外转座的蛋白质要求。所有反应都含有pdonor、ptarget和sgrna。图44e.体外转座的crispr

cas效应子要求。所有反应都含有shcast蛋白、pdonor和ptarget。图44f.从大肠杆菌中转化和提取后pinsert反应产物的色谱图。突出显示le和re元件,并表示重复的插入位点。对于所有组,shcast蛋白以50nm的终浓度使用,并且所有反应以n=3个重复物进行,并显示了代表性图像(seq id no:61

64)。
76.图45a

45e.shcast介导大肠杆菌中的基因组插入。图45a.测试大肠杆菌中基因组插入的实验的示意图。图45b.shcast转化后10个测试原间隔子的插入频率。通过对提取的基因组dna进行ddpcr来确定插入频率。误差条表示来自n=3个重复物的标准偏差。图45.c shcast转化后大肠杆菌群体中3个测试的原间隔子的侧翼pcr。示意图指示引物的位置和预期产物大小。图45d.shcast转化后通过深度测序确定的插入位点位置。图45e.通过无偏供体检测确定的插入位置。注释出每个原间隔子的位置以及映射到靶标的总供体读段的百分比。
77.图46.rna指导的dna转座的模型。由cas12k、tnsb、tnsc和tniq组成的shcast复合物介导pam下游60

66bp的dna插入。将转座子le和re序列以及任何额外货物基因插入dna中,导致5bp插入位点的重复。
78.图47a

47f.用于靶向dna转座的工程化cas9

tnpa融合物。图47a.使用与cas9d10a融合的tnpa的体外插入反应的示意图。cas9结合产生了r环并暴露出ssdna窗口,该窗口是ssdna特异性转座酶tnpa可及的(16、36)。来自幽门螺杆菌的tnpa与cas9d10a融合,cas9d10a切刻目标链,并假设宿主修复机制将填充所插入的ssdna供体的相反链。用hek293t细胞裂解物和质粒靶标与环状ssdna re

le联合供体中间体进行反应。图47b.使用cas9

tnpa体外插入质粒靶标。插入通过pcr检测并依赖于供体dna、活性转座酶和暴露r环中ttac插入基序的sgrna。先前已证明tnpa

y127的突变会消除转座酶活性(17)。图47c.带有侧翼引物的体外反应产物的深度测序揭示了ttac插入位点下游的精确插入。le和re元件被注释(seq id no:65

75)。图47d.来自各种插入位点底物的tnpa家族蛋白的体外测试。所有tnpa蛋白都与cas9d10a融合并在hek293t细胞中表达。使用ddpcr确定插入频率,n=4个重复物。图47e.大肠杆菌中带有分裂β

内酰胺酶基因的报告质粒的示意图。将dna供体置于质粒起点附近以在复制过程中处于滞后dna链上以促进供体切除。le

ampr89

268

re插入目标位点会产生功能性抗性基因,并且通过计算抗性菌落的数量来确定插入频率。对抗性菌落进行sanger测序,其揭示正确插入目标位点(测试8个)。图47f.通过氨苄青霉素抗性菌落测量的大肠杆菌中tnpa

cas9的插入频率。n=4个重复物。
79.图48a

48c.crispr相关转座酶(cast)系统以及tnsb、tnsc和tniq蛋白的序列特征。图48a.在这项工作中分析的两个tn7样元件的注释基因组图谱。指示了物种名称、基因组登录号和核苷酸坐标。基因由指示转录方向的块箭头显示并大致按比例绘制。cast相关基因是彩色的。带注释的货物基因以浅灰色显示,并根据来自相应hhpred搜索的统计显著命中率(概率>90%)提供简短描述。crispr阵列中间隔子的数量和crispr重复序列的序列显示在方案的右端(seq id no:942

943)。图48b.cast转座酶的三个核心蛋白的序列特征
和结构域组织。蛋白质以大致按比例绘制的矩形显示。基于来自相应hhpred搜索的统计显著命中率(概率>90%),结构域在矩形内显示为灰色框。pfam数据库中最相关的命中物被映射并显示在相应的矩形上方。shtniq蛋白与来自不同tn7样元件的选定同源物进行比较。对于shtnsb和shtnsc指示催化基序。缩写:chat,胱天蛋白酶家族蛋白酶;hepn,预测的hepn家族的rna酶;hth

螺旋

转角

螺旋dna结合结构域;rhh,带

螺旋

螺旋dna结合结构域;rm,限制性修饰;tpr,含有三十四肽重复序列的蛋白。图48c.小rna

seq揭示了accast crispr阵列和预测的tracrrna的活跃表达。
80.图49a

49c.rna指导插入的靶向要求。图49a.将pam、pdonor和shcast phelper或accast phelper的文库转化到大肠杆菌中用于发现pam靶向要求。插入产物被选择性扩增,并且具有可检测插入的pam基于它们的log2富集分数进行排序并评分。log2富集截止值4用于后续分析优选pam。图49b.用于shcast和accast的优选pam序列的pam轮解释。图49c.shcast中单个pam的验证是通过使用限定的pam转化phelper、pdonor和ptarget来进行的。插入频率由ddpcr确定。
81.图50.大肠杆菌中靶向插入产物的sanger测序。来自用phelper、pdonor和ptargetggtt转化的大肠杆菌的质粒dna被重新转化到大肠杆菌中,并进行sanger测序验证。重复的插入位点在每条迹线中加下划线(seq id no:76

80)。
82.图51a

51d.rna指导插入的插入位点要求。图51a.插入基序文库筛选的示意图。pdonor、ptarget和phelper被转化到大肠杆菌中,并通过pcr富集插入以进行后续的测序分析。图51b.插入位点上游的5n基序根据它们相对于输入文库的log2富集进行排序和评分。最丰富的插入位置(62bp)上游5bp用于分析。log2富集截止值1用于优选基序的后续分析,显示出非常弱的基序偏好。图51c.5n优选基序的序列标识显示对插入位点上游3bp的t/a核苷酸有较小的偏好。图51d.鉴定的优选基序序列的基序轮解释。
83.图52a

52e.shcast的转座特性。图52a.靶向含有shcast转座子末端的质粒的质粒插入测定的示意图。图52b.向含有shcast转座子le的ptarget中的插入活性。每个靶标的插入活性定义为插入含有shcast转座子le的ptarget中的频率与插入无转座子末端的ptarget中的频率的比率。图52c.shcast向具有不同供体货物大小的ptarget中的插入频率。货物大小包括转座子末端。图52d.在存在和不存在tnsb的情况下从靶向psp49的大肠杆菌收获的质粒中,无法检测到转座后pdonor的重新连接。图52e.在从靶向psp49的大肠杆菌中收获的质粒中,通过pcr无法检测到重新连接的供体。
84.图53a

53c.shcast转座子末端序列分析。图53a.利用le和re的供体截短的插入活性。预测的转座酶结合位点用灰线指示。对于所有组,实验均在大肠杆菌中进行,并且通过ddpcr对提取的质粒dna确定插入频率。误差条表示来自n=3个重复物的标准偏差。图53b.shcast转座子末端的序列突出显示了短和长重复序列基序(seq id no:81

82)。图53c.shcast重复基序与典型tn7tnsb结合序列(seq id no:83

92)的比对。
85.图54a

54d.rna指导的转座酶的体外重组。图54a.纯化的shcast蛋白的考马斯染色sds

page凝胶。图54b.shcast的体外转座活性的温度依赖性。图54c.不存在atp和mgcl2的情况下的体外反应。图54d.在ptargetggtt上与cas9和cas12k的体外裂解反应。缓冲液1:neb cutsmart,缓冲液2:neb 1,缓冲液3:neb 2,缓冲液4:tn7反应缓冲液。
86.图55a

55c.shcast介导大肠杆菌中的基因组插入。图55a.通过le连接处的套式
pcr筛选大肠杆菌基因组中48个目标位点的插入。图55b.对用具有基因组靶向sgrna的phelper和pdonor转化的大肠杆菌重新划线,证明能够用目标插入产物恢复细菌的克隆群体。图55c.使用具有靶向psp42的sgrna的phelper,含有多种货物大小的pdonor的基因组插入频率。
87.图56a

56c.大肠杆菌基因组插入的序列分析。图56a.基因组插入的靶向扩增和深度测序以鉴定插入位置。图56b.靶向基因组的phelper的脱靶插入读段。标记了最丰富的不依赖于指导物的脱靶的近端基因。已鉴定的依赖于指导物的脱靶以红色突出显示。图56c.psp42与鉴定的依赖于指导物的脱靶间隔子(seq id no:93

94)的比对。
88.图57.cast介导的基因校正的潜在策略。通过靶向dna插入替换含有突变的外显子。
89.图58.shcast插入质粒中与cas12k无关。使用野生型shcast和非靶向sgrna以及缺失cas12k的shcast插入phelper中的序列分析。
90.图59a

59b显示了cas12k直系同源物在不同时间点在293hek细胞中与dna的结合:第2天(图59a)和第3天(图59b)。
91.图60显示了靶标(dnmt1、emx1、vegfa、grin2b)中的插入产物。
92.图61a

61d显示了dnmt1(图61a)、emx1(图61b)、vegfa(图61c)和grin2b(图61d)的读段到估计插入产物的映射。
93.图62显示了具有nls标签的cas12k、tniq、tnsb和tnsc的插入结果。
94.图63显示了示例性cast的每个组分在人类细胞裂解物中的体外活性。
95.图64显示了示例性野生型shcast对某些浓度的镁具有偏好。
96.图65显示了通过生物信息学分析鉴定的候选cast系统。
97.图66显示了带有注释的cast系统的实例。
98.图67显示了针对一般ngtn pam偏好和原间隔子下游的插入测试的示例性cast系统。
99.图68显示了展示双向插入的示例性cast系统。
100.图69显示了预测的sgrna(seq id no:95

116)的实例。
101.图70显示了使用各种测定法鉴定的示例性功能系统。
102.图71是用于筛选系统中的高活性变体的示例性方法和筛选结果。
103.图72显示了用于评价插入产物的示例性方法。
104.图73显示了示例性cast(系统id t21,依沙矛丝藻(cuspidothrix issatschenkoi)charlie

1)(seq id no:117

120)的注释。
105.图74a

74b.图74a:将t59 nls

b、c、nls

q和nls

k或nls

b、c、nls

gfp

q和nls

gfp

k共转染到hek

293细胞中。两天后,收获细胞,并将来自这些细胞的裂解物添加到体外转座测定中,其中存在或不存在靶向fnpsp1的sgrna。凝胶显示了来自该测定的插入产物的pcr检测结果。图74b:使用ngs对来自上述反应的pcr条带进行测序,证明了在pam区域(seq id no:121

144)下游约60bp处验证的rgtr pam插入。
106.图75显示了哺乳动物细胞中质粒靶向测定的示意图。
107.图76a

76d来自哺乳动物细胞中质粒靶向测定的经验证质粒插入的ngs序列。图76a grin2b agta靶标(seq id no:145

202)。图76b grin2b ggtg靶标(seq id no:203

260)。图76c vegfa agta靶标(seq id no:261

308)。图76d vegf ggtg靶标(seq id no:309

367)。
108.图77显示了使用sumo

q

nls的下拉实验。
109.图78

81显示了t59 cas12k

t2a构建体v5

v8的图谱。
110.图82

85显示了t59 cas12k

cas9融合构建体(seq id no:368

389)的图谱。
111.本文中的附图仅用于说明目的而不一定按比例绘制。
具体实施方式
112.一般定义
113.除非另有定义,否则本文所使用的技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。分子生物学中常用术语和技术的定义可见于:molecular cloning:a laboratory manual,第2版(1989)(sambrook,fritsch和maniatis);molecular cloning:a laboratory manual,第4版(2012)(green和sambrook);current protocols in molecular biology(1987)(f.m.ausubel等人编辑);methods in enzymology系列(academic press,inc.):pcr 2:a practical approach(1995)(m.j.macpherson,b.d.hames和g.r.taylor编辑):antibodies,a laboratory manual(1988)(harlow和lane编辑):antibodies a laboratory manual,第2版,2013(e.a.greenfield编辑);animal cell culture(1987)(r.i.freshney编辑);benjamin lewin,genes ix,由jones和bartlet出版,2008(isbn 0763752223);kendrew等人(编辑),the encyclopedia of molecular biology,由blackwell science ltd.出版,1994(isbn 0632021829);robert a.meyers(编辑),molecular biology and biotechnology:a comprehensive desk reference,由vch publishers,inc.出版,1995(isbn 9780471185710);singleton等人,dictionary of microbiology and molecular biology,第2版,j.wiley&sons(new york,n.y.1994),march,advanced organic chemistry reactions,mechanisms and structure,第4版,john wiley&sons(new york,n.y.1992);以及marten h.hofker和jan van deursen,transgenic mouse methods and protocols,第2版(2011)。
114.如本文所用,单数形式“一个”、“一种”和“所述”包括单数和复数个指代物,除非上下文另外明确指出。
115.术语“任选的”或“任选地”是指随后描述的事件、情况或取代基可能发生或可能不发生,并且该描述包括事件或情况发生的例子以及事件或情况没有发生的例子。
116.由端点对数值范围的叙述包括各个范围内包含的所有数字和分数,以及所列举的端点。
117.当指代例如参数、量、持续时间等的可测量值时,如本文所用的术语“约”或“大约”旨在涵盖指定值的变化和与指定值相比的变化,例如 /

10%或更少、 /

5%或更少、 /

1%或更少以及 /

0.1%或更少的指定值的变化或与指定值相比的变化,只要这样的变化适于在所公开的发明中进行即可。应当理解,修饰语“约”或“大约”所指的值本身也是特定地且优选地公开的。
118.如本文所用,“生物样品”可含有全细胞和/或活细胞和/或细胞碎片。生物样品可包含(或源自)“体液”。本发明涵盖以下实施方案,其中体液选自羊水、房水、玻璃体液、胆
汁、血清、乳汁、脑脊髓液、耵聍(耳垢)、乳糜、食糜、内淋巴液、周淋巴液、渗出液、粪便、女性射液、胃酸、胃液、淋巴液、粘液(包括鼻腔引流和粘痰)、心包液、腹膜液、胸膜液、脓液、稀粘液、唾液、皮脂(皮油)、精液、痰液、滑液、汗液、眼泪、尿液、阴道分泌物、呕吐物和其一种或多种的混合物。生物样品包括细胞培养物、体液、来自体液的细胞培养物。体液可例如通过穿刺或其他收集或采样程序从哺乳动物获得。
119.术语“受试者”、“个体”和“患者”在本文中可互换使用,是指脊椎动物,优选为哺乳动物,更优选为人类。哺乳动物包括但不限于鼠类、猿猴、人类、农场动物、运动动物和宠物。还涵盖体内获得或体外培养的生物实体的组织、细胞和它们的后代。
120.术语“示例性”在本文中用来表示用作实例、例子或说明。本文中被描述为“示例性”的任何方面或设计不必被解释为相对于其他方面或设计是优选的或有利的。相反,使用词语“示例性”旨在以具体的方式呈现概念。
121.在下文中描述各种实施方案。应当注意,特定实施方案不旨在作为详尽的描述或作为对本文所讨论的更广泛方面的限制。结合特定实施方案描述的一个方面不必限于所述实施方案,并且可与任何其他实施方案一起实践。在整个说明书中,对“一个实施方案”、“实施方案”、“示例实施方案”的引用是指结合实施方案描述的特定特征、结构或特性包括在本发明的至少一个实施方案中。因此,在整个说明书中各处出现的短语“在一个实施方案中”、“在一实施方案中”或“一个示例实施方案”不一定全部指代同一实施方案,但有可能。此外,在一个或多个实施方案中,特定特征、结构或特性可以任何合适的方式组合,这对于本领域技术人员而言根据本公开将是显而易见的。此外,尽管本文描述的一些实施方案包括其他实施方案中包括的一些但不包括其他特征,但是不同实施方案的特征的组合意图在本发明的范围内。例如,在所附权利要求中,任何要求保护的实施方案都可以任何组合使用。
122.本文引用的所有出版物、公开的专利文件和专利申请均通过引用并入本文,其引用程度就如同每个单独的出版物、公开的专利文件或专利申请被明确地和单独地指出通过引用并入一样。
123.由端点对数值范围的叙述包括各个范围内包含的所有数字和分数,以及所列举的端点。
124.当指代例如参数、量、持续时间等的可测量值时,如本文所用的术语“约”或“大约”旨在涵盖指定值的变化和与指定值相比的变化,即 /

20%或更少,优选 /

10%或更少,更优选 1

5%或更少,并且仍更优选 /

1%或更少,只要这样的变化适于在所公开的发明中进行即可。应当理解,修饰语“约”或“大约”所指的值本身也是特定地且优选地公开的。
125.而术语“一个或多个”或“至少一个”或“x个或更多个”,其中x是一个数字并理解为表示x或x的逐一增加,例如一个或多个或至少一个成员或一组成员的“x个或更多个”,本身是明确的,通过进一步举例说明,该术语尤其涵盖对所述成员中的任何一个,或对所述成员中的任何两个或更多个的提及,例如,所述成员中的任何>3、>4、>5、>6或>7等,直至所有所述成员。
126.概述
127.本公开提供了用于将多核苷酸插入靶核酸(例如,细胞的基因组)中的期望位置的工程化核酸靶向系统和方法。一般来说,所述系统包含一种或多种转座酶或其功能片段,以及序列特异性核苷酸结合系统的一种或多种组分,例如cas蛋白和指导分子。在一些实施方
案中,本公开提供了一种工程化核酸靶向系统,所述系统包含:一种或多种crispr相关转座酶蛋白或其功能片段;cas蛋白;以及能够与所述cas蛋白复合并引导指导物

cas蛋白复合物与靶多核苷酸的靶序列的序列特异性结合的指导分子。所述系统还可包含一种或多种供体多核苷酸。所述供体多核苷酸可由所述系统插入靶核酸序列中的所需位置。本公开还可包括编码此类核酸靶向系统的多核苷酸,包含一种或多种包含所述多核苷酸的载体的载体系统,以及用所述载体系统转化的一种或多种细胞。
128.系统和组合物
129.在一个方面,本公开包括包含一种或多种转座酶和一种或多种核苷酸结合分子(例如,核苷酸结合蛋白)的系统。所述核苷酸结合蛋白可以是序列特异性的。所述系统还可包含一种或多种转座酶、转座子组分或其功能片段。在一些实施方案中,本文所述的系统可包含一种或多种转座酶或转座酶亚基,其与序列特异性核苷酸结合系统相缔合、连接、结合或以其他方式能够与序列特异性核苷酸结合系统形成复合物。在某些示例实施方案中,一种或多种转座酶或转座酶亚基和序列特异性核苷酸结合系统通过共调控或表达相缔合。在其他示例实施方案中,一种或多种转座酶和/或转座酶亚基和序列特异性核苷酸结合系统通过序列特异性核苷酸结合结构域引导或募集一种或多种转座酶或转座酶亚基至插入位点的能力相缔合,其中一个或多个转座酶或转座酶亚基引导供体多核苷酸插入靶多核苷酸序列中。序列特异性核苷酸结合系统可以是序列特异性dna结合蛋白或其功能片段,和/或序列特异性rna结合蛋白或其功能片段。在一些实施方案中,序列特异性核苷酸结合组分可以是crispr

cas系统、转录激活子样效应子核酸酶、锌指核酸酶、大范围核酸酶、功能片段、其变体或它们的任何组合。因此,所述系统还可被认为包含核苷酸结合组分和转座子组分。为了便于参考,将在示例cas相关转座酶系统的上下文中讨论进一步的示例实施方案。
130.核苷酸结合系统可包含cas蛋白、其片段或其突变形式。cas蛋白可能具有降低的核酸酶活性或没有核酸酶活性。例如,dna结合结构域可以是无活性的或死的cas蛋白(dcas)。死cas蛋白可包含一个或多个突变或截短。在一些实例中,所述系统可包含dcas9和一种或多种转座酶。在一些实例中,dna结合结构域包含一种或多种1类(例如,i型、iii型、vi型)或2类(例如ii型、v型或vi型)crispr

cas蛋白。在某些实施方案中,序列特异性核苷酸结合结构域将转座子引导至包含靶序列的目标位点,并且转座酶引导供体多核苷酸序列在目标位点处的插入。
131.在某些实施方案中,所述系统可包含一个以上的cas蛋白,其中一个或多个是突变的和/或呈死亡形式。在某些情况下,cas蛋白之一或其片段可用作转座酶相互作用结构域。例如,所述系统可包含cas蛋白和cas12k的转座酶相互作用结构域。在一个特定实例中,所述系统包含dcas9、cas12k和一种或多种转座酶(例如,tn7转座酶)。在另一个实例中,所述系统包含dcas9、cas12k的转座酶相互作用结构域和一种或多种转座酶(例如,tn7转座酶)。
132.本文的系统可包含一种或多种“crispr相关转座酶”(也可与本文中的cas相关转座酶、crispr相关转座酶蛋白或cast系统互换使用)或其功能片段。crispr相关转座酶可包括任何转座酶或转座酶亚基,其可通过crispr

cas复合物与靶多核苷酸的序列特异性结合而被引导或募集至靶多核苷酸的区域。crispr相关转座酶可包括与crispr

cas系统中的一种或多种组分(例如,cas蛋白、指导分子等)相缔合(例如,形成复合物)的任何转座酶。在某些示例实施方案中,crispr相关转座酶可与crispr

cas系统中的一种或多种组分(例如,
cas蛋白、指导分子等)融合或拴系(例如通过接头)。
133.转座酶亚基或转座酶复合物可与本文的cas蛋白相互作用。在一些实例中,转座酶或转座酶复合物与cas蛋白的n末端相互作用。在某些实例中,转座酶或转座酶复合物与cas蛋白的c末端相互作用。在某些实例中,转座酶或转座酶复合物与其n末端和c末端之间的cas蛋白片段相互作用。
134.转座子和转座酶
135.本文的系统可包含转座子的一种或多种组分和/或一种或多种转座酶。如本文所用,术语“转座子”是指可被转座酶或整合酶识别并且是能够转座的功能性核酸

蛋白质复合物(例如转座体)的组分的多核苷酸(或核酸区段)。如本文所用,术语“转座酶”是指一种酶,其是能够转座并介导转座的功能性核酸

蛋白质复合物的组分。转座酶可包含单一蛋白质或包含多个蛋白质亚基。转座酶可以是能够与转座子末端或转座子末端序列形成功能复合物的酶。在某些实施方案中,术语“转座酶”也可以指整合酶。本文使用的表述“转座反应”是指其中转座酶将供体多核苷酸序列插入靶多核苷酸上的插入位点中或邻近插入位点的反应。插入位点可含有被转座酶识别的序列或二级结构和/或插入基序序列,其中转座酶在供体多核苷酸序列可插入的靶多核苷酸中切割或产生交错断裂。转座反应中的示例性组分包括转座子,其包含待插入的供体多核苷酸序列,以及转座酶或整合酶。如本文所用,术语“转座子末端序列”是指转座子远端的核苷酸序列。转座子末端序列可能负责鉴定用于转座的供体多核苷酸。转座子末端序列可以是转座酶用来形成转座体复合物并进行转座反应的dna序列。
136.转座子采用多种调控机制来维持低频率的转座,并且有时协调转座与各种细胞过程。一些原核转座子还可调动有益于宿主或以其他方式帮助维持元件的功能。某些转座子已经进化出对目标位点选择的严格控制机制,最显著的实例是tn7家族(参见peters je(2014)tn7.microbiol spectr 2:1

20)。三种转座子编码的蛋白质构成了tn7的核心转座机制:异聚转座酶(tnsa和tnsb)和调控蛋白(tnsc)。除了核心tnsabc转座蛋白外,tn7元件还编码专用的目标位点选择蛋白tnsd和tnse。与tnsabc结合,序列特异性dna结合蛋白tnsd将转座引导至称为“tn7附着位点”的保守位点atttn7。tnsd是一个大蛋白质家族的成员,该家族还包括tniq,这是一种在其他类型的细菌转座子中发现的蛋白质。tniq已被证明可靶向转座到质粒的解析位点中。
137.在一个示例实施方案中,本公开提供了包含tn7转座子系统或其组分的系统。所述转座子系统可提供包括但不限于靶标识别、靶标切割和多核苷酸插入的功能。在某些示例实施方案中,所述转座子系统不提供靶多核苷酸识别,但提供靶多核苷酸切割和供体多核苷酸向靶多核苷酸中的插入。
138.tn7或tn7样转座酶
139.本文的一种或多种转座酶可包含一种或多种tn7或tn7样转座酶。在某些示例实施方案中,tn7或tn7样转座酶包含多聚体蛋白复合物。在某些示例实施方案中,多聚体蛋白质复合物包含tnsa、tnsb和tnsc。在其他示例实施方案中,转座酶可包含tnsb、tnsc和tniq。在另一个示例实施方案中,tn7转座酶可包含tnsb、tnsc和tnsd。在某些示例实施方案中,tn7转座酶可包含tnsd、tnse或两者。如本文所用,术语“tnsab”、“tnsac”、“tnsbc”或“tnsabc”是指分别包含tnsa和tnsb、tnsa和tnsc、tnsb和tnsc、tnsa和tnsb和tnsc的转座子复合物。
在这些组合中,转座酶(tnsa、tnsb、tnsc)可彼此形成复合物或融合蛋白。类似地,术语tnsabc

tniq是指呈复合物或融合蛋白形式的包含tnsa、tnsb、tnsc和tniq的转座子。
140.在一些实例中,一种或多种转座酶或转座酶亚基是tn7样转座酶或源自tn7样转座酶。在一个特定的实施方案中,tn7样转座酶可以是tn5053转座酶。例如,tn5053转座酶包括minakhina s等人中描述的那些,tn5053家族转座子是res位点猎人,其可感知同源解析酶占据的质粒res位点。mol microbiol.1999年9月;33(5):1059

68;以及partridge sr等人,mobile genetic elements associated with antimicrobial resistance,clin microbiol rev.2018年8月1日;31(4)中的图4和相关文本,两者都通过引用整体并入本文。在一些情况下,一种或多种tn5053转座酶可包含tnia、tnib和tniq中的一者或多者。tnia也称为tnsb。tnib也称为tnsc。tniq也称为tnsd。因此,在某些实施方案中,这些tn5053转座酶亚基可分别称为tnsb、tnsc和tnsd。在某些情况下,一种或多种转座酶可包含tnsb、tnsc和tnsd。在一个实例中,cast系统包含tnia、tnib、tniq、cas12k、tracrrna和指导rna。在另一个实例中,cast系统包含tnsb、tnsc、tnsd、cas12k、tracrrna和指导rna。
141.在一些实例中,一种或多种crispr相关转座酶可包含:(a)tnsa、tnsb、tnsc和tniq,(b)tnsa、tnsb和tnsc,(c)tnsb和tnsc,(d)tnsb、tnsc和tniq,(e)tnsa、tnsb和tniq,(f)tnse,或(g)它们的任何组合。在一些情况下,tnse不与dna结合。在一些情况下,crispr相关转座酶蛋白可包含一种或多种转座酶,例如,tn7转座酶或tn7样转座酶的一种或多种转座酶亚基,例如tnsa、tnsb、tnsc和tniq中的一者或多者。在一些实例中,一种或多种转座酶包含tnsb、tnsc和tniq。
142.示例tniq
143.可用于示例实施方案的示例tniq蛋白提供于下表1中。
144.表1

tniq蛋白和物种来源.
145.146.[0147][0148]
在下面的“实施例”部分中提供了更多示例转座酶亚基序列。
[0149]
tn5转座酶
[0150]
在某些实施方案中,一种或多种转座酶是一种或多种tn5转座酶。在一些实例中,转座酶可包含tnpa。转座酶可以是is200/is605家族的y1转座酶,由来自幽门螺杆菌的插入序列(is)is608、例如tnpais608编码。转座酶的实例包括barabas,o.,ronning,d.r.,guynet,c.,hickman,a.b.,tonhoang,b.,chandler,m.和dyda,f.(2008)mechanism of is200/is605 family dna transposases:activation and transposon

directed target site selection.cell,132,208

220中描述的那些转座酶。在某些示例实施方案中,转座酶是单链dna转座酶。dna转座酶可以是cas9相关转座酶。在某些示例实施方案中,单链dna转座酶是tnpa或其功能片段。cas9相关转座酶系统可包含cas9

tnpa、cas1

cas2

crispr阵列的局部构造。cas9可能具有或可能不具有与其缔合的tracrrna。cas9相关转座酶系统可编码在同一条链上,或者是更大操纵子的一部分。在某些实施方案中,cas9可赋予靶特异性,允许tnpa以序列特异性物质从其他目标位点移动多核苷酸货物。在某些示例实施方案中,
cas9相关转座酶源自颗粒黄杆菌(flavobactreium granuli)菌株dsm

19729、salinivirga cyanobacteriivorans菌株l21

spi

d4、嗜酸黄杆菌(flavobactrium aciduliphilum)菌株dsm 25663、冰川黄杆菌(flavobacterium glacii)菌株dsm 19728、niabella soli dsm 19437、salnivirga cyanobactriivorans菌株l21

spi

d4、alkaliflexus imshenetskii dsm 150055菌株z

7010或alkalitala saponilacus。
[0151]
在某些实施方案中,转座酶是单链dna转座酶。单链dna转座酶可以是tnpa、其功能片段或其变体。在某些实施方案中,转座酶是himar1转座酶、其片段或其变体。在一个实例中,所述系统包含与himar1相缔合的死cas9。
[0152]
在某些实施方案中,转座酶可以是一种或多种霍乱弧菌(vibrio cholerae)tn6677转座酶。在一个实例中,所述系统可包含变体i

f型crispr

cas系统的组分或编码其的多核苷酸。转座子可包含含有tnsa、tnsb和tnsc基因的末端操纵子。转座子还可包含tniq基因。所述tniq基因可能在cas而不是tns操纵子内编码。在某些实施方案中,转座子中可能不存在tnse。
[0153]
在某些实例中,转座酶包括mu转座酶、tniq、tnib或其功能结构域中的一种或多种。在某些实例中,转座酶包括tniq、tnib、tnpb或其功能结构域中的一种或多种。在某些实例中,转座酶包括rve整合酶、tniq、tnib、tnpb结构域或其功能结构域中的一种或多种。
[0154]
在某些实施方案中,所述系统,更具体地,转座酶不包括rve整合酶。在某些实施方案中,所述系统,更具体地,转座酶不包括mu转座酶、tniq、tnib、tnpb、istb结构域或其功能结构域中的一种或多种。在某些实施方案中,所述系统,更具体地转座酶不包括与tnib、tniq、tnpb或istb结构域中的一者或多者组合的rve整合酶。
[0155]
在某些实施方案中,所述系统不是如wo2019/09173中描述的clust.004377的cas系统、如wo2019/09175中描述的clust.009925的cas系统、或如wo2019/09174中描述的clust.009467的cas系统。
[0156]
在某些实例中,转座酶包括mu转座酶、tniq、tnib或其功能结构域中的一种或多种。在某些实例中,转座酶包括tniq、tnib、tnpb或其功能域中的一种或多种。在某些实例中,转座酶包括rve整合酶、tniq、tnib、tnpb结构域或其功能结构域中的一种或多种。
[0157]
如本文所用,右端序列元件或左端序列元件参考示例tn7转座子制成。建立了典型tn7的左端(le)和右端(re)序列元件的一般结构。tn7末端包含一系列22bp tnsb结合位点。最远端tnsb结合位点的侧翼是一个以5'

tgt

3'/3'

aca

5'结尾的8

bp末端序列。tn7的右端在~90

bp右端元件中含有四个重叠的tnsb结合位点。左端含有三个tnsb结合位点,分散在元件的~150

bp左端。tnsb结合位点的数量和分布在tn7样元件之间可能有所不同。tn7相关元件的末端序列可通过鉴定直接重复的5

bp目标位点重复、末端8

bp序列和22

bp tnsb结合位点来确定(peters je等人,2017)。示例tn7元件,包括右端序列元件和左端序列元件,包括在parks ar,plasmid,2009年1月;61(1):1

14中描述的那些。
[0158]
供体多核苷酸
[0159]
所述系统还可包含一种或多种供体多核苷酸(例如,用于插入到靶多核苷酸中)。供体多核苷酸可以是可插入或整合到目标位点的可转座元件的等同物。供体多核苷酸可以是或包含转座子的一种或多种组分。供体多核苷酸可以是任何类型的多核苷酸,包括但不限于基因、基因片段、非编码多核苷酸、调控性多核苷酸、合成多核苷酸等。供体多核苷酸可
包括转座子左端(le)和转座子右端(re)。le和re序列可以是所用cast的内源序列或者可以是所用cast可识别的异源序列,或者le或re可以是合成序列,其包含由cast识别的序列或结构特征并足以允许将供体多核苷酸插入靶多核苷酸中。在某些示例实施方案中,le和re序列被截短。在某些示例实施方案中,长度可以是100

200bp、100

190个碱基对、100

180个碱基对、100

170个碱基对、100

160个碱基对、100

150个碱基对、100

140个碱基对、100

130个碱基对、100

120个碱基对、100

110个碱基对、20

100个碱基对、20

90个碱基对、20

80个碱基对、20

70个碱基对、20

60个碱基对、20

50个碱基对、20

40个碱基对、20

30个碱基对、50至100个碱基对、60

100个碱基对、70

100个碱基对、80

100个碱基对或90

100个碱基对。
[0160]
供体多核苷酸可插入在靶多核苷酸上pam上游或下游的位置。在一些实施方案中,供体多核苷酸包含pam序列。pam序列的实例包括tttn、attn、ngtn、rgtr、vgtd或vgtr。
[0161]
供体多核苷酸可插入在靶多核苷酸上距pam序列10个碱基和200个碱基之间、例如20个碱基和150个碱基之间、30个碱基和100个碱基之间、45个碱基和70个碱基之间、45个碱基和60个碱基之间、55个碱基和70个碱基之间、49个碱基和56个碱基之间或60个碱基和66个碱基之间的位置。在一些情况下,插入处于pam序列上游的位置。在一些情况下,插入处于pam序列下游的位置。在一些情况下,插入处于pam序列下游49至56个碱基或碱基对的位置。在一些情况下,插入处于pam序列下游60至66个碱基或碱基对的位置。
[0162]
供体多核苷酸可用于编辑靶多核苷酸。在一些情况下,供体多核苷酸包含一个或多个要引入到靶多核苷酸中的突变。此类突变的实例包括取代、缺失、插入或它们的组合。突变可导致靶多核苷酸上的开放阅读框的移位。在一些情况下,供体多核苷酸改变靶多核苷酸中的终止密码子。例如,供体多核苷酸可校正提前终止密码子。可通过缺失终止密码子或向终止密码子引入一个或多个突变来实现校正。在其他示例实施方案中,供体多核苷酸通过插入或恢复基因的功能拷贝、或其功能片段、或功能调控序列或调控序列的功能片段,来解决例如在某些疾病背景中可能发生的功能缺失突变、缺失或易位。功能片段是指通过提供足够的核苷酸序列来恢复野生型基因或非编码调控序列(例如编码长非编码rna的序列)的功能的基因的不够完整拷贝。在某些示例实施方案中,本文公开的系统可用于替换缺陷基因或其缺陷片段的单个等位基因。在另一个示例实施方案中,本文公开的系统可用于替换缺陷基因或缺陷基因片段的两个等位基因。“缺陷基因”或“缺陷基因片段”是当表达时未能产生具有相应野生型基因功能的功能性蛋白质或非编码rna的基因或基因的部分。在某些示例实施方案中,这些缺陷基因可能与一种或多种疾病表型相关。在某些示例实施方案中,缺陷基因或基因片段未被替换,但本文描述的系统用于插入编码补偿或覆盖缺陷基因表达的基因或基因片段的供体多核苷酸,从而消除与缺陷基因表达相关的细胞表型或更改为不同或所需的细胞表型。
[0163]
在其他示例实施方案中,本文公开的系统可用于增强健康细胞,从而增强细胞功能和/或在治疗上是有益的。例如,本文公开的系统可用于将嵌合抗原受体(car)引入t细胞基因组的特定位点,使得t细胞能够识别和破坏癌细胞。
[0164]
在本发明的某些实施方案中,供体可包括但不限于基因或基因片段、编码蛋白或待表达的rna转录物、调控元件、修复模板等。根据本发明,供体多核苷酸可包含与介导插入的转座组分一起发挥作用的左端和右端序列元件。
[0165]
在某些情况下,供体多核苷酸操纵靶多核苷酸上的剪接位点。在一些实例中,供体多核苷酸破坏剪接位点。破坏可通过将多核苷酸插入剪接位点和/或将一个或多个突变引入剪接位点来实现。在某些实例中,供体多核苷酸可恢复剪接位点。例如,多核苷酸可包含剪接位点序列。
[0166]
待插入的供体多核苷酸可具有长度为10个碱基至50kb的大小,例如长度为50至40kb、100至30kb、100个碱基至300个碱基、200个碱基至400个碱基、300个碱基至500个碱基、400个碱基至600个碱基、500个碱基至700个碱基、600个碱基至800个碱基、700个碱基至900个碱基、800个碱基至1000个碱基、900个碱基至1100个碱基、1000个碱基至1200个碱基、1100个碱基至1300个碱基、1200个碱基至1400个碱基、1300个碱基至1500个碱基、1400个碱基至1600个碱基、1500个碱基至1700个碱基、600个碱基至1800个碱基、1700个碱基至1900个碱基、1800个碱基至2000个碱基、1900个碱基至2100个碱基、2000个碱基至2200个碱基、2100个碱基至2300个碱基、2200个碱基至2400个碱基、2300个碱基至2500个碱基、2400个碱基至2600个碱基、2500个碱基至2700个碱基、2600个碱基至2800个碱基、2700个碱基至2900个碱基、或2800个碱基至3000个碱基。
[0167]
本文系统中的组分可包含一个或多个改变其(例如转座酶)对供体多核苷酸的结合亲和力的突变。在一些实例中,突变增加转座酶和供体多核苷酸之间的结合亲和力。在某些实例中,突变降低转座酶和供体多核苷酸之间的结合亲和力。突变可能会改变cas和/或转座酶的活性。
[0168]
在某些实施方案中,本文公开的系统能够单向插入,即所述系统仅以一个方向插入供体多核苷酸。
[0169]
crispr

cas系统
[0170]
本文的系统可包含crispr

cas系统的一种或多种组分。crispr

cas系统的一种或多种组分可用作系统中的核苷酸结合组分。在某些示例实施方案中,转座子组分包括crispr

cas复合物、与crispr

cas复合物缔合、或与crispr

cas复合物形成复合物。在一个示例实施方案中,crispr

cas组分将转座子组分和/或转座酶引导至目标插入位点,其中转座子组分引导供体多核苷酸插入靶核酸序列中。
[0171]
本文的crispr

cas系统可包含cas蛋白(与crispr蛋白、crispr酶、cas效应子、crispr

cas蛋白、crispr

cas酶可互换使用)和指导分子。cas蛋白的非限制性实例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cas9、cas12(例如,cas12a、cas12b、cas12c、cas12d、cas12k等)、cas13(例如,cas13a、cas13b(例如cas13b

t1、cas13b

t2、cas13b

t3)、cas13c、cas13d等)、cas14、casx、casy,或cas蛋白的工程化形式(例如,攻击性(invective)、死亡形式、切口酶形式)。在一些实例中,crispr

cas系统是核酸酶缺陷型的。
[0172]
在一些情况下,cas蛋白可以是上述cas蛋白的直系同源物或同源物。术语“直系同源物(orthologue)”(在本文中也称为“直系同源物(ortholog)”)和“同源物(homologue)”(在本文中也称为“同源物(homolog)”)是本领域众所周知的。通过进一步的指导,如本文所用的蛋白质的“同源物”是与它是同源物的蛋白质执行相同或相似功能的相同物种的蛋白
质。同源蛋白质可以但不必在结构上相关,或仅在结构上部分相关。如本文所用,蛋白质的“直系同源物”是不同物种的蛋白质,其执行与其作为直系同源物的蛋白质相同或相似的功能。直系同源蛋白质可以但不必在结构上相关,或仅在结构上部分相关。
[0173]
可与本文公开的系统一起使用的cas蛋白的实例包括1类和2类crispr

cas系统的cas蛋白。
[0174]
i类crispr

cas系统
[0175]
在某些示例实施方案中,crispr

cas系统是1类crispr

cas系统,例如1类i型crispr

cas系统。在一些情况下,i类crispr

cas系统包含cascade(一种由3至5个蛋白质组成的多聚体复合物,其可处理crrna阵列)、cas3(具有核酸酶、解旋酶和核酸外切酶活性的蛋白质,其负责靶dna的降解)和crrna(稳定cascade复合物并将cascade和cas3引导至dna靶标)。1类crispr

cas系统可以是亚型,例如i

a型、i

b型、i

c型、i

d型、i

e型、i

f型、i

u型、iii

a型、iii

b型、iii

c型、iii

d型或iv型crispr

cas系统。
[0176]
1类i型crispr cas系统可用于催化rna指导的移动遗传元件整合到靶核酸(例如基因组dna)中。例如,本文的系统可包含cascade和转座子蛋白(例如,tn7转座子蛋白如tniq)之间的复合物。在靶核酸下游的给定距离处,可插入供体核酸(例如,dna)。插入可以是两个可能的方向之一。所述系统可用于整合所需长度的核酸序列。在一些实例中,i型crispr

cas系统是核酸酶缺陷型的。在一些实例中,i型crispr

cas系统是i

f型crispr

cas系统。
[0177]
1类i

a型crispr

cas系统可包含cas7(csa2)、cas8a1(csx13)、cas8a2(csx9)、cas5、csa5、cas6a、cas3'和/或cas3。i

b型crispr

cas系统可包含cas6b、cas8b(csh1)、cas7(csh2)和/或cas5。i

c型crispr

cas系统可包含cas5d、cas8c(csd1)和/或cas7(csd2)。i

d型crispr

cas系统可包含cas10d(csc3)、csc2、csc1和/或cas6d。i

e型crispr

cas系统可包含cse1(casa)、cse2(casb)、cas7(casc)、cas5(casd)和/或cas6e(case)。i

f型crispr

cas系统可包含cys1、cys2、cas7(cys3)和/或cas6f(csy4)。示例i

f型crispr

cas系统可包括由三个基因编码的dna靶向复合物cascade(也称为csy复合物):cas6、cas7和天然cas8

cas5融合物(下文简称为cas8)。i

f型crispr

cas系统还可包含天然crispr阵列,其包含四个重复序列和三个间隔序列,编码不同的成熟crispr rna(crrna),我们也将其称为指导rna。在一些实例中,i

f型crispr

cas系统可与本文所述的霍乱弧菌tn6677转座子的一种或多种组分相缔合。
[0178]
i型crispr组分的实例包括makarova等人,annotation and classification of crispr

cas systems,methods mol biol.2015;1311:47

75中描述的那些。
[0179]
相关的1类i型crispr系统可包含cas5f、cas6f、cas7f、cas8f以及crispr阵列。在一些情况下,i型crispr

cas系统包含cas5f、cas6f、cas7f和cas8f中的一种或多种。例如,i型crispr

cas系统包含cas5f、cas6f、cas7f和cas8f。在某些情况下,i型crispr

cas系统包含cas8f

cas5f、cas6f和cas7f中的一种或多种。例如,i型crispr

cas系统包含cas8f

cas5f、cas6f和cas7f。如本文所用,术语cas5678f是指包含cas5f、cas6f、cas7f和cas8f的复合物。
[0180]
2类crispr

cas系统
[0181]
在某些示例实施方案中,crispr

cas系统可以是2类crispr

cas系统。2类crispr

cas系统可以是亚型,例如ii

a型、ii

b型、ii

c型、v

a型、v

b型、v

c型、v

u型、vi

a型、vi

b型或vi

c型crispr

cas系统。crispr

cas系统的定义和示例性成员包括kira s.makarova和eugene v.koonin,annotation and classification of crispr

cas systems,methods mol biol.2015;1311:47

75;以及sergey shmakov等人,diversity and evolution of class 2crispr

cas systems,nat rev microbiol.2017年3月;15(3):169

182中描述的那些。
[0182]
v型crispr

cas系统
[0183]
在某些实施方案中,cas蛋白可以是2类v型crispr

cas系统的cas蛋白(v型cas蛋白)。v型cas蛋白可以是v

k型cas蛋白(本文中与v

u5型、c2c5和cas 12k可互换使用)。cas12k可以是图2a、图2b和表25的生物体。cas蛋白可包含激活突变。在一个示例实施方案中,cas12k是霍夫曼伪枝藻cas12k(shcas12k)。例如,霍夫曼伪枝藻可以是霍夫曼伪枝藻(utex b 2349)。在某些示例实施方案中,cas12k是柱孢鱼腥藻cas12k(accas12k)。例如,柱孢鱼腥藻可以是柱孢鱼腥藻(pcc 7122)。
[0184]
可用于某些实施方案的示例v

u5/c2c5 cas蛋白提供在下表2中。
[0185]
表2

v

u5/c2c5蛋白
[0186]
[0187]
[0188][0189]
在一些实施方案中,crispr

cas系统可以是如wo2019090173中所述的clust.004377之一。
[0190]
与野生型对应物相比,2类ii型cas蛋白可以是突变的cas蛋白。突变的cas蛋白可
以是突变的cas9。突变的cas9可以是cas9
d10a
。cas9中突变的其他实例包括h820a、d839a、h840a、n863a或它们的任何组合,例如d10a/h820a、d10a、d10a/d839a/h840a和d10a/d839a/h840a/n863a。这里描述的突变是关于spcas9并且还包括除spcas9之外的crispr蛋白中的类似突变。
[0191]
下面的“实施例”部分提供了更多示例cas序列。
[0192]
死cas
[0193]
在一些情况下,cas蛋白缺乏核酸酶活性。这种cas蛋白可以是不具有核酸酶活性的天然存在的cas蛋白,或者cas蛋白可以是具有降低或消除核酸酶活性的突变或截短的工程化cas蛋白。
[0194]
在某些示例实施方案中,crispr

cas蛋白是cas9或cas9样蛋白。在某些示例实施方案中,cas9样蛋白是v

u亚型蛋白(其中

u’代表

未表征的’),并且共享两个特征,以将它们与在含有cas1的crispr

cas基因座发现的ii型和v型效应子区分开来。首先,这些蛋白质比含有cas1的2类效应子小得多,包含~500个氨基酸(仅略大于tnpb的典型大小)至~700个氨基酸(介于tnpb大小和真正2类效应子的典型大小之间)。其次,与较大的i型和v型效应子相比,这些推定的效应子与tnpb蛋白的相似性水平更高。(shmakov,s.等人,2017,nat.rev.microbiol.,15:169)。在各种蓝藻中发现的一种变体(v

u5亚型)由不同的tnpb同源物组成,这些同源物在其ruvc样结构域的催化基序中具有若干突变。
[0195]
一般来说,如本文和在例如wo 2014/093622(pct/us2013/074667)的文件中所用的crispr

cas或crispr系统统称为转录物和其他参与crispr相关(“cas”)基因的表达或引导crispr相关(“cas”)基因的活性的其他元件,包括编码cas基因的序列、tracr(反式激活crispr)序列(例如tracrrna或活性部分tracrrna)、tracr配对序列(涵盖“正向重复序列”和在内源性crispr系统的上下文中tracrrna加工的部分正向重复序列)、指导序列(在内源性crispr系统的上下文中也称为“间隔子”)或如本文所用术语“rna”(例如,指导cas(例如cas9)的rna,例如crispr rna和反式激活(tracr)rna或单指导rna(sgrna)(嵌合rna))或来自crispr基因座的其他序列和转录物。一般来说,crispr系统的特征在于促进在靶序列位点形成crispr复合物的元件(在内源性crispr系统的上下文中也称为原间隔子)。参见例如shmakov等人,(2015)“discovery and functional characterization of diverse class 2 crispr

cas systems”,molecular cell,doi:dx.doi.org/10.1016/j.molcel.2015.10.008。
[0196]
在某些实施方案中,原间隔子邻近基序(pam)或pam样基序引导如本文公开的效应蛋白复合物与目标靶基因座的结合。在一些实施方案中,pam可以是5'pam(即,位于原间隔子5'端的上游)。在其他实施方案中,pam可以是3'pam(即,位于原间隔子5'端的下游)。术语“pam”可与术语“pfs”或“原间隔子侧翼位点”或“原间隔子侧翼序列”互换使用。
[0197]
在一个优选的实施方案中,crispr效应蛋白可识别3'pam。在某些实施方案中,crispr效应蛋白可识别作为5'h的3'pam,其中h是a、c或u。
[0198]
在crispr复合物形成的上下文中,“靶序列”是指指导序列被设计成具有互补性的序列,其中靶序列和指导序列之间的杂交促进了crispr复合物的形成。靶序列可包含rna多核苷酸。术语“靶rna”是指作为或包含靶序列的rna多核苷酸。换句话说,靶rna可以是rna多核苷酸或rna多核苷酸的一部分,grna的一部分(即指导序列)被设计成具有互补性并且将
定向由包含crispr效应蛋白和grna的复合物介导的效应子功能。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。
[0199]
在某些示例实施方案中,crispr效应蛋白可使用编码crispr蛋白的核酸分子来递送。编码crispr蛋白的核酸分子可以有利地是密码子优化的crispr蛋白。在这种情况下,密码子优化序列的一个实例是为在真核生物中表达而优化的序列,所述真核生物例如人类(即被优化用于在人类中表达),或如本文所讨论的另一种真核生物、动物或哺乳动物;参见例如wo 2014/093622(pct/us2013/074667)中的sacas9人类密码子优化序列。虽然这是优选的,但应理解,其他实例也是可能的,并且已知用于除人类之外的宿主物种的密码子优化,或用于特定器官的密码子优化。在一些实施方案中,编码crispr蛋白的酶编码序列是优化用于在特定细胞例如真核细胞中表达的密码子。真核细胞可以是特定生物体的真核细胞或源自特定生物体的真核细胞,所述生物体例如植物或哺乳动物,包括但不限于人类或非人类真核生物或如本文所讨论的动物或哺乳动物,例如小鼠、大鼠、兔、狗、牲畜或非人类哺乳动物或灵长类动物。在一些实施方案中,可排除用于改变人类种系遗传同一性的过程和/或用于改变可能导致动物遭受痛苦而对人类或动物没有任何实质性医学益处的动物的遗传同一性的过程,以及由这些过程产生的动物。一般来说,密码子优化是指通过用宿主细胞的基因中更频繁或最频繁使用的密码子代替天然序列的至少一个密码子(例如,约或大于约1、2、3、4、5、10、15、20、25、50个或更多个密码子)并同时保持天然氨基酸序列而在目标宿主细胞中修饰核酸序列以增强表达的过程。各种物种对特定氨基酸的某些密码子表现出特定的偏性。密码子偏性(生物体之间密码子使用的差异)通常与信使rna(mrna)的翻译效率相关,而信使rna(mrna)的翻译效率又被认为尤其取决于所翻译的密码子的特性和特定转移rna(trna)分子的可用性。所选trna在细胞中的优势通常反映了肽合成中最常使用的密码子。因此,可基于密码子优化来定制基因以在给定生物体中最佳基因表达。密码子使用表很容易获得,例如,可在kazusa.orjp/codon/的“密码子使用数据库”中获得,并且这些表格可通过多种方式进行调整。参见nakamura,y.等人,“codon usage tabulated from the international dna sequence databases:status for the year 2000”nucl.acids res.28:292(2000)。也可获得用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法,例如gene forge(aptagen;jacobus,pa)。在一些实施方案中,编码cas的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个或更多个或所有密码子)对应于特定氨基酸最常用的密码子。
[0200]
在某些实施方案中,如本文所述的方法可包括提供转基因细胞,其中提供或引入一种或多种编码一种或多种指导rna的核酸,其与包含一种或多种目标基因的启动子的调控元件在细胞中可操作地连接。如本文所用,术语“cas转基因细胞”是指其中已基因组整合cas基因的细胞,例如真核细胞。根据本发明,细胞的性质、类型或来源没有特别限制。cas转基因被引入细胞中的方式也可变化并且可以是本领域已知的任何方法。在某些实施方案中,cas转基因细胞是通过在分离的细胞中引入cas转基因而获得。在某些其他实施方案中,cas转基因细胞是通过从cas转基因生物体分离细胞而获得。举例来说,但不限于,本文所指的cas转基因细胞可源自cas转基因真核生物,例如cas敲入真核生物。参考wo 2014/093622(pct/us13/74667),其通过引用并入本文。转让给sangamo biosciences,inc.的美国专利公开第20120017290号和第20110265198号的旨在靶向rosa基因座的方法可被修改以利用
本发明的crispr cas系统。转让给cellectis的美国专利公开第20130236946号的旨在靶向rosa基因座的方法也可被修改以利用本发明的crispr cas系统。通过进一步的示例,参考platt等人,(cell;159(2):440

455(2014)),描述了cas9敲入小鼠,其通过引用并入本文。cas转基因还可包含lox

stop

polya

lox(lsl)盒,从而使cas表达可被cre重组酶诱导。或者,cas转基因细胞可通过在分离的细胞中引入cas转基因来获得。转基因的递送系统是本领域众所周知的。举例来说,cas转基因可通过载体(例如,aav、腺病毒、慢病毒)和/或粒子和/或纳米粒子递送在例如真核细胞中递送,如本文别处也描述的。
[0201]
本领域技术人员将理解,如本文所指的细胞,例如cas转基因细胞,除了具有整合的cas基因或当与能够引导cas到目标基因座的rna复合时由cas的序列特异性作用产生的突变之外,还可包含进一步的基因组改变。
[0202]
指导rna编码序列和/或cas编码序列可以功能性地或可操作地连接到调控元件并且因此调控元件驱动表达。启动子可以是组成型启动子和/或条件启动子和/或诱导型启动子和/或组织特异性启动子。启动子可选自由以下组成的组:rna聚合酶、pol i、pol ii、pol iii、t7、u6、h1、逆转录病毒劳斯肉瘤病毒(rsv)ltr启动子、巨细胞病毒(cmv)启动子、sv40启动子、二氢叶酸还原酶启动子、β

肌动蛋白启动子、磷酸甘油激酶(pgk)启动子和ef1α启动子。有利的启动子是启动子是u6。
[0203]
指导分子和tracr序列
[0204]
本文的系统可包含一个或多个指导分子。如本文所用,在crispr

cas系统上下文中的术语“指导序列”和“指导分子”包含与靶核酸序列具有足够互补性以与靶核酸序列杂交并引导核酸靶向复合物与靶核酸序列的序列特异性结合的任何多核苷酸序列。使用本文公开的方法制备的指导序列可以是全长指导序列、截短的指导序列、全长sgrna序列、截短的sgrna序列或e f sgrna序列。在一些实施方案中,当使用合适的比对算法最佳比对时,指导序列与给定靶序列的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。在某些示例实施方案中,指导分子包含可被设计成与靶序列具有至少一个错配从而在指导序列和靶序列之间形成rna双链体的指导序列。因此,互补程度优选小于99%。例如,在指导序列由24个核苷酸组成的情况下,互补程度更特别地为约96%或更小。在特定实施方案中,指导序列被设计为具有一段两个或更多个邻近错配核苷酸,从而进一步降低整个指导序列上的互补程度。例如,当指导序列由24个核苷酸组成时,互补程度更特别地为约96%或更少,更特别地为约92%或更少,更特别地为约88%或更少,更特别地为约84%或更少,更特别地为约80%或更少,更特别地为约76%或更少,更特别地为约72%或更少,取决于两个或更多个错配核苷酸的伸长段是否涵盖2、3、4、5、6或7个核苷酸等。在一些实施方案中,除了一个或多个错配核苷酸的伸长段之外,当使用合适的比对算法进行最佳比对时,互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。最佳比对可使用用于比对序列的任何合适的算法来确定,其非限制性实例包括smith

waterman算法、needleman

wunsch算法、基于burrows

wheeler变换的算法(例如,burrows wheeler aligner)、clustalw、clustal x、blat、novoalign(novocraft technologies;可在www.novocraft.com获得)、eland(illumina,san diego,ca)、soap(可在soap.genomics.org.cn获得)和maq(可在maq.sourceforge.net获得)。指导序列(在核酸靶向指导rna内)引导核酸靶向复合物与靶核酸序列的序列特异性结合的能力可通过任何
合适的测定法来评估。例如,可向具有相应靶核酸序列的宿主细胞提供足以形成核酸靶向复合物的核酸靶向crispr系统的组分,包括待测试的指导序列,例如通过用编码靶向核酸的复合物组分的载体转染,接着评估靶核酸序列内的优先靶向(例如,切割),例如通过如本文所述的surveyor测定法。类似地,可通过提供靶核酸序列、靶向核酸的复合物的组分,包括待测试的指导序列和与测试指导序列不同的对照指导序列,并且比较测试指导序列和对照指导序列反应之间在靶序列处或附近的结合或切割率,而在试管中评价靶核酸序列(或其附近的序列)的切割。其他测定法是可能的,并且对本领域技术人员而言将是显而易见的。可选择指导序列并因此选择靶向核酸的指导rna以靶向任何靶核酸序列。
[0205]
在某些实施方案中,指导分子的指导序列或间隔子长度为10至50nt。在某些实施方案中,指导rna的间隔子长度为至少10个核苷酸。在某些实施方案中,间隔子长度为12至14nt,例如12、13或14nt,15至17nt,例如15、16或17nt,17至20nt,例如17、18、19或20nt,20至24nt,例如20、21、22、23或24nt,23至25nt,例如23、24或25nt,24至27nt,例如24、25、26或27nt,27至30nt,例如27、28、29或30nt,30至35nt,例如30、31、32、33、34或35nt,或35nt或更长。在某些示例实施方案中,指导序列是10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100nt。
[0206]
在一些实施方案中,指导序列是长度在10至50nt之间的rna序列,但更特别地约20至30nt,有利地约20nt、23至25nt或24nt。选择指导序列以确保其与靶序列杂交。这将在下面更详细地描述。选择可涵盖增加功效和特异性的其他步骤。
[0207]
在一些实施方案中,指导序列具有典型长度(例如,约15

30nt)并用于与靶rna或dna杂交。在一些实施方案中,指导分子长于典型长度(例如,>30nt)并用于与靶rna或dna杂交,使得指导序列的区域与cas

指导物靶复合物之外的rna或dna链的区域杂交。这在关注额外修饰(例如核苷酸的脱氨基)的情况下可能令人感兴趣。在替代实施方案中,保持典型指导序列长度的限制是令人感兴趣的。
[0208]
在某些示例实施方案中,crispr

cas系统还包含反式激活crispr(tracr)序列或“tracrrna”。tracrrna包括与crrna序列具有足够互补性以杂交的任何多核苷酸序列。在一些实施方案中,当最佳比对时,tracrrna序列和crrna序列沿着两者中较短者的长度的互补程度为约或大于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更高。在一些实施方案中,tracr序列的长度为约或多于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230或更多个核苷酸。在某些示例实施方案中,tracr的长度为210、211、212、213、214、215、216、217、218、219或220个核苷酸。在一些实施方案中,tracr序列和crrna序列包含在单个转录物中,使得两者之间的杂交产生具有二级结构例如发夹的转录物。在本发明的一个实施方案中,转录物或转录的多核苷酸序列具有至少两个或更多个发夹。在优选的实施方案中,转录物具有两个、三个、四个或五个发夹。在本发明的另一个实施方案中,转录物具有至多五个发夹。在发夹结构中,最后一个“n”和环上游的序列5'部分对应于tracr配对序列,并且环的序列3'部分对应于tracr序列。在某些示例实施方案中,指导
分子和tracr序列是物理或化学连接的。用于本发明某些实施方案中的示例tracrrna序列在以下“实施例”部分中进一步详细描述。
[0209]
在一些实施方案中,选择指导分子的序列(正向重复序列和/或间隔子)以降低指导分子内二级结构的程度。在一些实施方案中,核酸靶向指导rna的约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核苷酸在最佳折叠时参与自互补碱基配对。最佳折叠可通过任何合适的多核苷酸折叠算法来确定。一些程序基于计算最小吉布斯自由能。一种这样的算法的实例是mfold,如zuker和stiegler(nucleic acids res.9(1981),133

148)所述。另一个示例折叠算法是使用质心结构预测算法在维也纳大学理论化学研究所开发的在线网络服务器rnafold(参见例如a.r.gruber等人,2008,cell 106(1):23

24;以及pa carr和gm church,2009,nature biotechnology 27(12):1151

62)。
[0210]
在一些实施方案中,设计或选择靶向核酸的指导物以调节指导分子之间的分子间相互作用,例如不同指导分子的茎环区域之间的相互作用。应当理解,碱基配对形成茎环的指导物内的核苷酸也能够与第二指导物碱基配对形成分子间双链体,并且这种分子间双链体不具有与crispr复合物形成相容的二级结构。因此,选择或设计dr序列以调节茎环形成和crispr复合物形成是有用的。在一些实施方案中,约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核酸靶向指导物在分子间双链体中。应当理解,茎环变异通常在dr

crispr效应子相互作用所施加的限制内。调节茎环形成或改变茎环和分子间双链体之间平衡的一种方法是改变dr茎环的茎中的核苷酸对。例如,在一个实施方案中,g

c对被a

u或u

a对代替。在另一个实施方案中,a

u对被g

c或c

g对取代。在另一个实施方案中,天然存在的核苷酸被核苷酸类似物代替。调节茎环形成或改变茎环和分子间双链体之间平衡的另一种方法是修饰dr茎环的环。不受理论的束缚,环可被视为中间序列,其侧翼是彼此互补的两个序列。当该中间序列不是自互补时,其作用将是使分子间双链体的形成失稳。同样的原则适用于当指导物多重化时:虽然靶向序列可能不同,但修改不同指导物的dr中的茎环区域可能是有利的。此外,当指导物多重化时,可通过平衡每个单独指导物的活性来调节不同指导物的相对活性。在某些实施方案中,确定了分子间茎环与分子间双链体之间的平衡。所述测定可通过物理或生物化学方式进行,并且可在存在或不存在crispr效应子的情况下进行。
[0211]
在一些实施方案中,感兴趣的是降低指导分子对rna切割的敏感性,例如通过切割rna的crispr系统的切割。因此,在特定实施方案中,指导分子被调整以避免被crispr系统或其他rna切割酶切割。
[0212]
在某些实施方案中,指导分子包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物,和/或化学修饰。优选地,这些非天然存在的核酸和非天然存在的核苷酸位于指导序列之外。非天然存在的核酸可包括例如天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可在核糖、磷酸酯和/或碱基部分进行修饰。在本发明的一个实施方案中,指导核酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施方案中,指导物包含一个或多个核糖核苷酸和一个或多个脱氧核糖核苷酸。在本发明的一个实施方案中,指导物包含一个或多个非天然存在的核苷酸或核苷酸类似物,例如具有硫代磷酸酯键的核苷酸,包含核糖环的2'和4'碳之间的亚甲基桥的锁核酸(lna)核苷酸,或桥接核酸(bna)。修饰核苷酸的其他实例包括2'

o

甲基类似物、2'

脱氧类似物或2'

氟类似
物。修饰碱基的其他实例包括但不限于2

氨基嘌呤、5



尿苷、假尿苷、肌苷、7

甲基鸟苷。指导rna化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2'

o

甲基(m)、2'

o

甲基3'

硫代磷酸酯(ms)、s

限制乙基(cet)或2'

o

甲基3'硫代pace(msp)。与未修饰的指导物相比,此类化学修饰的指导物可包括增加的稳定性和增加的活性,但在靶对脱靶特异性是不可预测的。(参见hendel,2015,nat biotechnol.33(9):985

9,doi:10.1038/nbt.3290,在线出版于2015年6月29日;ragdarm等人,2015,pnas,e7110

e7111;allerson等人,j.med.chem.2005,48:901

904;bramsen等人,front.genet.,2012,3:154;deng等人,pnas,2015,112:11870

11875;sharma等人,medchemcomm.,2014,5:1454

1471;hendel等人,nat.biotechnol.(2015)33(9):985

989;li等人,nature biomedical engineering,2017,1,0066doi:10.1038/s41551

017

0066)。在一些实施方案中,指导rna的5'和/或3'端被包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签在内的多种功能性部分修饰。(参见kelly等人,2016,j.biotech.233:74

83)。在某些实施方案中,指导物在与靶rna结合的区域中包含核糖核苷酸,并且在与v型效应子结合的区域中包含一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在本发明的一个实施方案中,将脱氧核糖核苷酸和/或核苷酸类似物并入工程化的指导物结构中,例如但不限于茎环区和种子区。在某些实施方案中,指导物的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸被化学修饰。在一些实施方案中,指导物的3'或5'端的3

5个核苷酸被化学修饰。在一些实施方案中,仅次要修饰被引入种子区,例如2'

f修饰。在一些实施方案中,在指导物的3'端引入2'

f修饰。在某些实施方案中,指导物的5'和/或3'端的三至五个核苷酸用2'

o

甲基(m)、2'

o

甲基3'硫代磷酸酯(ms)、s限制乙基(cet)或2'

o

甲基3'硫代pace(msp)进行化学修饰。这样的修饰可增强基因组编辑效率(参见hendel等人,nat.biotechnol.(2015)33(9):985

989)。在某些实施方案中,指导物的所有磷酸二酯键被硫代磷酸酯(ps)取代以增强基因破坏的水平。在某些实施方案中,指导物的5'和/或3'端的五个以上的核苷酸用2'

o

me、2'

f或s限制乙基(cet)进行化学修饰。这种化学修饰的指导物可介导增强水平的基因破坏(参见ragdarm等人,0215,pnas,e7110

e7111)。在本发明的一个实施方案中,对指导物进行修饰以在其3'和/或5'端包含化学部分。此类部分包括但不限于胺、叠氮化物、炔烃、硫代基、二苯并环辛炔(dbco)、或罗丹明、肽、核定位序列(nls)、肽核酸(pna)、聚乙二醇(peg)、三甘醇或四甘醇(teg)。在某些实施方案中,化学部分通过接头例如烷基链与指导物缀合。在某些实施方案中,化学部分通过接头例如烷基链与指导物缀合。在某些实施方案中,修饰的指导物的化学部分可用于将指导物附接到另一分子,例如dna、rna、蛋白质或纳米粒子。这种化学修饰的指导物可用于鉴定或富集由crispr系统一般性编辑的细胞(参见lee等人,elife,2017,6:e25312,doi:10.7554)。
[0213]
在一些实施方案中,3'端和5'端各自的3个核苷酸被化学修饰。在一个具体的实施方案中,修饰包括2'

o

甲基或硫代磷酸酯类似物。在一个具体的实施方案中,四环中的12个核苷酸和茎环区中的16个核苷酸被2'

o

甲基类似物代替。此类化学修饰改进了体内编辑和稳定性(参见finn等人,cell reports(2018),22:2227

2235)。在一些实施方案中,指导物的超过60或70个核苷酸被化学修饰。在一些实施方案中,该修饰包括用2'

o

甲基或2'

氟核苷酸类似物代替核苷酸或者磷酸二酯键的硫代磷酸酯(ps)修饰。在一些实施方案
中,当形成crispr复合物时,化学修饰包括延伸至核酸酶蛋白外部的指导核苷酸的2'

o

甲基或2'

氟修饰,或指导物的3'末端的20至30个或更多个核苷酸的ps修饰。在一个特定的实施方案中,化学修饰还包括在指导物的5'端的2'

o

甲基类似物或在种子和尾部区域的2'

氟类似物。这样的化学修饰提高了对核酸酶降解的稳定性并维持或增强了基因组编辑活性或效率,但是所有核苷酸的修饰可消除指导物的功能(参见yin等人,nat.biotech.(2018),35(12):1179

1187)。可通过对crispr复合物的结构的了解,包括对有限数量的核酸酶和rna2'

oh相互作用的了解,来指导此类化学修饰(参见yin等人,nat.biotech.(2018),35(12):1179

1187)。在一些实施方案中,一个或多个指导rna核苷酸可用dna核苷酸代替。在一些实施方案中,将5'端尾部/种子指导区的至多2、4、6、8、10或12个rna核苷酸用dna核苷酸代替。在某些实施方案中,将3'端的大多数指导rna核苷酸用dna核苷酸代替。在特定的实施方案中,将3'端的16个指导rna核苷酸用dna核苷酸代替。在特定的实施方案中,将5'端尾部/种子区的8个指导rna核苷酸和3'端处的16个rna核苷酸用dna核苷酸代替。在特定的实施方案中,当形成crispr复合物时,将延伸到核酸酶蛋白外部的指导rna核苷酸用dna核苷酸代替。与未修饰的指导物相比,这种用dna核苷酸代替多个rna核苷酸导致脱靶活性降低,但在靶活性相似;然而,在3'端替换所有rna核苷酸可消除指导物的功能(参见yin等人,nat.chem.biol.(2018)14,311

316)。可通过对crispr复合物的结构的了解,包括对有限数量的核酸酶和rna 2'

oh相互作用的了解,来指导此类修饰(参见yin等人,nat.chem.biol.(2018)14,311

316)。
[0214]
在一些实施方案中,指导分子形成具有单独的非共价连接序列的茎环,其可以是dna或rna。在特定的实施方案中,首先使用标准亚磷酰胺合成方案(herdewijn,p.编辑,methods in molecular biology col 288,oligonucleotide synthesis:methods and applications,humana press,new jersey(2012))来合成形成指导物的序列。在一些实施方案中,可使用本领域已知的标准方案将这些序列官能化以包含适于连接的官能团(hermanson,g.t.,bioconjugate techniques,academic press(2013))。官能团的实例包括但不限于羟基、胺、羧酸、羧酸卤化物、羧酸活性酯、醛、羰基、氯羰基、咪唑基羰基、酰肼、氨基脲、硫代氨基脲、硫醇、马来酰亚胺、卤代烷基、磺酰基、烯丙基、炔丙基、二烯、炔烃和叠氮化物。一旦该序列被官能化,就可在该序列与正向重复序列之间形成共价化学键或键联。化学键的实例包括但不限于基于以下的那些:氨基甲酸酯,醚,酯,酰胺,亚胺,脒,氨基三嗪,腙,二硫化物,硫醚,硫酯,硫代磷酸酯,二硫代磷酸酯,磺酰胺,磺酸酯,砜,亚砜,脲,硫脲,酰肼,肟,三唑,光不稳定键,c

c键形成基团如diels

alder环加成对或闭环复分解对和michael反应对。
[0215]
在一些实施方案中,这些茎环形成序列可为化学合成的。在一些实施方案中,化学合成使用利用2'

乙酰氧基乙基原酸酯(2'

ace)(scaringe等人,j.am.chem.soc.(1998)120:11820

11821;scaringe,methods enzymol.(2000)317:3

18)或2'

硫代氨基甲酸酯(2'

tc)化学(dellinger等人,j.am.chem.soc.(2011)133:11540

11546;hendel等人,nat.biotechnol.(2015)33:985

989)的自动化固相寡核苷酸合成机。
[0216]
在某些实施方案中,指导分子包含(1)能够与靶基因座杂交的指导序列和(2)tracr配对序列或正向重复序列,由此所述正向重复序列位于指导序列的上游(即5')或下游(即3')。在一个特定实施方案中,指导序列的种子序列(即识别和/或与靶基因座处的序
列杂交所必需的序列)大约在指导序列的前10个核苷酸内。
[0217]
在一个特定的实施方案中,指导分子包含与正向重复序列连接的指导序列,其中正向重复序列包含一个或多个茎环或优化的二级结构。在特定实施方案中,正向重复序列具有16nt的最小长度和单个茎环。在其他实施方案中,正向重复序列的长度大于16nt,优选大于17nt,并且具有多于一个的茎环或优化的二级结构。在特定的实施方案中,指导分子包含与全部或部分的天然正向重复序列连接的指导序列或由与全部或部分的天然正向重复序列连接的指导序列组成。典型的v型或vi型crispr

cas指导分子包含(在3'至5'方向上或在5'至3'方向上):指导序列、第一互补伸长段(“重复序列”)、环(其长度通常为4或5个核苷酸)、第二互补伸长段(“反重复序列”与重复序列互补)和poly a(在rna中通常为poly u)尾部(终止子)。在某些实施方案中,正向重复序列保留其天然构造并形成单个茎环。在特定实施方案中,指导物构造的某些方面可例如通过特征的添加、减去或取代来修饰,而指导物构造的某些其他方面得以保持。工程化的指导分子修饰的优选位置,包括但不限于插入、缺失和取代,包括指导物末端和与crispr

cas蛋白和/或靶标复合时暴露的指导分子区域,例如正向重复序列的茎环。
[0218]
在特定的实施方案中,茎包含至少约4bp,其包含互补的x和y序列,但是也考虑具有更多个例如5、6、7、8、9、10、11或12个或更少个例如3、2个碱基对的茎。因此,可考虑例如x2

10和y2

10(其中x和y代表核苷酸的任何互补集合)。在一个方面,由x和y核苷酸构成的茎与环一起将在整个二级结构中形成完整的发夹;并且,这可能是有利的,并且碱基对的数量可以是形成完整发夹的任何数量。在一个方面,只要保留整个指导分子的二级结构,任何互补的x:y碱基配对序列(例如,关于长度)都是容许的。在一个方面,连接由x:y碱基对形成的茎的环可以是相同长度(例如4或5个核苷酸)或更长的任何序列,其不中断指导分子的整体二级结构。在一个方面,茎环还可包括例如ms2适体。在一个方面,茎包含约5

7bp,其包含互补的x和y序列,但是也考虑具有更多或更少碱基对的茎。在一个方面,考虑了非watson crick碱基配对,其中这种配对否则通常在该位置保留茎环的构造。
[0219]
在特定的实施方案中,指导分子的天然发夹或茎环结构被延伸或被延伸的茎环代替。已经证明茎的延伸可增强指导分子与crispr

cas蛋白的组装(chen等人,cell.(2013);155(7):1479

1491)。在特定的实施方案中,茎环的茎延伸至少1、2、3、4、5个或更多个互补碱基对(即对应于在指导分子中添加2、4、6、8、10个或更多个核苷酸)。在特定的实施方案中,它们位于茎的末端,邻近茎环的环。
[0220]
在特定的实施方案中,可通过稍微修饰指导分子的序列而不影响其功能来降低指导分子对rna酶的敏感性或对降低的表达的敏感性。例如,在特定的实施方案中,可通过修饰指导分子序列中的假定的pol

iii终止子(4个连续的u)来去除转录的提前终止,例如u6pol

iii的提前转录。当在指导分子的茎环中需要这种序列修饰时,优选通过碱基对翻转来确保。
[0221]
在一个特定的实施方案中,正向重复序列可被修饰以包含一个或多个蛋白结合rna适体。在一个特定的实施方案中,可包括一个或多个适体,例如优化的二级结构的一部分。此类适体可能能够结合如本文进一步详述的噬菌体外壳蛋白。
[0222]
在一些实施方案中,指导分子与包含至少一个待编辑的靶胞嘧啶残基的靶dna形成双链体。在指导rna分子与靶rna杂交后,胞苷脱氨酶与双链体中的单链rna结合,通过指
导序列中的错配而可接近,并催化包含在错配核苷酸伸长段内的一个或多个靶胞嘧啶残基的脱氨基。
[0223]
可选择指导序列并因此选择靶向核酸的指导rna以靶向任何靶核酸序列。靶序列可以是mrna。
[0224]
在某些实施方案中,靶序列应与pam(原间隔子邻近基序)或pfs(原间隔子侧翼序列或位点)相缔合;也就是说,由crispr复合物识别的短序列。取决于crispr

cas蛋白的性质,所述靶序列应当进行选择,使得其在dna双链体中的互补序列(本文中也称为非靶序列)在pam的上游或下游。在crispr

cas蛋白为cas13蛋白的本发明的实施方案中,靶序列的互补序列在pam的下游或3'或者pam的上游或5'。pam的精确序列和长度要求因所使用的cas13蛋白而异,但pam通常是与原间隔子邻近的2

5个碱基对序列(即靶序列)。下文提供了用于不同cas13直系同源物的天然pam序列的实例,并且技术人员将能够鉴定用于给定cas13蛋白的其他pam序列。
[0225]
此外,对pam相互作用(pi)结构域的工程化可允许对pam特异性进行编程,改善目标位点识别保真度并增加crispr

cas蛋白的多功能性,例如如kleinstiver bp等人,engineered crispr

cas9 nucleases with altered pam specificities.nature.2015年7月23日;523(7561):481

5.doi:10.1038/nature14592中关于cas9所述。如本文进一步详述,技术人员将理解,可类似地修饰cas13蛋白。
[0226]
在特定的实施方案中,指导物是护送的指导物。“护送的”是指将crispr

cas系统或复合物或指导物递送至细胞内的选定时间或位置,从而在空间上或时间上控制crispr

cas系统或复合物或指导物的活性。例如,3crispr

cas系统或复合物或指导物的活性和目的可由对适体配体具有结合亲和力的护送rna适体序列控制,例如细胞表面蛋白或其他局部细胞组分。或者,护送适体可例如对细胞上或细胞中的适体效应子作出反应,例如瞬时效应子,例如在特定时间施加于细胞的外部能源。
[0227]
护送的crispr

cas系统或复合物具有指导分子,该指导分子的功能结构被设计为改善指导分子的结构、构造、稳定性、基因表达或它们的任何组合。这样的结构可包括适体。
[0228]
适体是可被设计或选择与其他配体紧密结合的生物分子,例如使用一种被称为通过指数富集的配体系统进化的技术(selex;tuerk c,gold l:“systematic evolution of ligands by exponential enrichment:rna ligands to bacteriophage t4dna polymerase.”science 1990,249:505

510)。核酸适体可例如选自随机序列寡核苷酸池,其对范围广泛的生物医学相关靶标具有高结合亲和力和特异性,表明对适体的范围广泛的治疗效用(keefe,anthony d.,supriya pai和andrew ellington."aptamers as therapeutics."nature reviews drug discovery 9.7(2010):537

550)。这些特性还表明适体作为药物递送媒介物的范围广泛的用途(levy

nissenbaum,etgar等人,"nanotechnology and aptamers:applications in drug delivery."trends in biotechnology 26.8(2008):442

449;以及hicke bj,stephens aw.“escort aptamers:a delivery service for diagnosis and therapy.”j clin invest 2000,106:923

928)。还可构建用作分子开关的适体,其通过改变性质来作出响应,例如结合荧光团以模拟绿色荧光蛋白活性的rna适体(paige,jeremy s.,karen y.wu和samie r.jaffrey."rna mimics of green fluorescent protein."science 333.6042(2011):642

646)。还已经提出,适体
可用作靶向sirna治疗性递送系统的组分,例如靶向细胞表面蛋白(zhou,jiehua和john j.rossi."aptamer

targeted cell

specific rna interference."silence 1.1(2010):4)。
[0229]
因此,在特定的实施方案中,例如通过一个或多个适体来修饰指导分子,所述适体被设计成改善指导分子递送,包括跨细胞膜的递送、递送至细胞内隔室或递送至细胞核中。除了一个或多个适体之外或不使用这样的一个或多个适体,这样的结构可包括一个或多个部分,以使得指导分子可递送、可诱导或可响应于选定的效应子。因此,本发明包括对正常或病理生理状况有响应的指导分子,包括但不限于ph、缺氧、o2浓度、温度、蛋白质浓度、酶浓度、脂质结构、曝光、机械破坏(例如超声波)、磁场、电场或电磁辐射。
[0230]
可诱导系统的光响应性可经由隐花色素

2(cryptochrome

2)和cib1的激活和结合来实现。蓝光刺激在隐花色素

2中诱导活化的构象变化,从而导致其结合伴侣cib1的募集。这种结合是快速且可逆的,在脉冲刺激后的<15秒内达到饱和,并且在刺激结束后的<15分钟内恢复到基线。这些快速结合动力学导致系统在时间上仅受转录/翻译和转录物/蛋白质降解速度的约束,而不是诱导剂的摄取和清除。隐花色素

2激活也是高度敏感的,从而允许使用低光强度刺激并减轻光毒性的风险。此外,在例如完整的哺乳动物脑的情况下,可变的光强度可用于控制受激区域的大小,从而可提供比单独的载体递送更大的精度。
[0231]
本发明考虑了例如电磁辐射、声能或热能的能量源以诱导指导物。有利的是,电磁辐射是可见光的组分。在一个优选的实施方案中,光是波长为约450至约495nm的蓝光。在一个尤其优选的实施方案中,波长为约488nm。在另一个优选的实施方案中,光刺激是经由脉冲进行的。光功率可在约0

9mw/cm2的范围内。在一个优选的实施方案中,每15秒低至0.25秒的刺激范例应导致最大的激活。
[0232]
化学或能量敏感性指导物在诱导时可能会通过化学源的结合或通过能量而发生构象变化,使其充当指导物并具有cas13crispr

cas系统或复杂功能。本发明可包括施加化学源或能量以具有指导功能和cas13crispr

cas系统或复杂功能;以及任选地进一步确定基因组基因座的表达已改变。
[0233]
该化学诱导系统存在若干不同的设计:1.脱落酸(aba)可诱导的基于abi

pyl的系统(参见例如stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2),2.雷帕霉素(或基于雷帕霉素的相关化学物质)可诱导的基于fkbp

frb的系统(参见例如www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html),3.赤霉素(ga)可诱导的基于gid1

gai的系统(参见例如www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html)。
[0234]
化学诱导系统可以是4

羟基他莫昔芬(4oht)可诱导的基于雌激素受体(er)的系统(参见例如www.pnas.org/content/104/3/1027.abstract)。称为ert2的雌激素受体的一种突变的配体结合结构域在与4

羟基他莫昔芬结合后易位到细胞核中。在本发明的其他实施方案中,任何核受体、甲状腺激素受体、视黄酸受体、雌激素受体、雌激素相关受体、糖皮质激素受体、孕激素受体、雄激素受体的任何天然存在的或工程化的衍生物都可用于与基于er的可诱导系统类似的可诱导系统中。
[0235]
另一种可诱导系统是基于使用可通过能量、热或无线电波诱导的基于瞬时受体电势(trp)离子通道的系统的设计(参见例如www.sciencemag.org/content/336/6081/604)。
这些trp家族蛋白对不同的刺激(包括光和热)做出响应。当这种蛋白质被光或热激活时,离子通道将打开,并允许例如钙的离子进入质膜。离子的这种流入将结合至与多肽连接的细胞内离子相互作用伴侣,所述多肽包括crispr

cas复合物或系统的指导物和其他组分,并且所述结合将诱导多肽的亚细胞定位改变,从而导致整个多肽进入细胞核。一旦进入细胞核内部,crispr

cas复合物的指导蛋白和其他组分将具活性并调节细胞中靶基因的表达。
[0236]
尽管光激活可以是一个有利的实施方案,但是有时对于光可能不穿透皮肤或其他器官的体内应用而言可能是不利的。在这种情况下,可考虑其他的能量激活方法,特别是具有类似作用的电场能量和/或超声。
[0237]
优选在体内条件下使用约1伏/厘米至约10千伏/厘米的一个或多个电脉冲,基本上如本领域中所述施用电场能量。代替脉冲或除了脉冲之外,电场可以连续的方式传递。电脉冲可施加持续1μs至500毫秒,优选地1μs至100毫秒。可连续地或以脉冲方式施加电场持续约5分钟。
[0238]
如本文所用,“电场能”是细胞暴露于其中的电能。优选地,电场在体内条件下具有约1伏/厘米至约10千伏/厘米或更高的强度(参见wo97/49450)。
[0239]
如本文所用,术语“电场”包括在可变电容和电压下的一个或多个脉冲,并且包括指数和/或方波和/或调制波和/或调制方波形式。对电场和电的提及应被认为包括对电池环境中存在电势差的提及。如本领域中已知的,可通过静电、交流电(ac)、直流电(dc)等来建立这样的环境。电场可以是均匀的、不均匀的或其他方式,并且可以时间依赖性方式改变强度和/或方向。
[0240]
电场的单次或多次施加以及超声的单次或多次施加也是可能的,可以是任何顺序和任何组合。超声和/或电场可作为单个或多个连续施加或作为脉冲来传递(脉冲传递)。
[0241]
电穿孔已用于体外和体内程序中,以将外来物引入活细胞。在体外应用中,首先将活细胞样品与目标剂混合并放置在电极(例如平行板)之间。然后,电极向细胞/植入物混合物施加电场。进行体外电穿孔的系统的实例包括electro cell manipulator ecm600产品和electro square porator t820,它们均由genetronics,inc的btx部门制造(参见美国专利第5,869,326号)。
[0242]
通过向位于治疗区域周围的电极施加短暂的高压脉冲,已知的电穿孔技术(体外和体内)均起作用。电极之间产生的电场使细胞膜暂时变为多孔的,随后目标剂的分子进入细胞。在已知的电穿孔应用中,该电场包括约100μs持续时间的大约1000v/cm的单个方波脉冲。例如,在electro square porator t820的已知应用中可产生这样的脉冲。
[0243]
优选地,在体外条件下,电场的强度为约1v/cm至约10kv/cm。因此,电场的强度可为1v/cm、2v/cm、3v/cm、4v/cm、5v/cm、6v/cm、7v/cm、8v/cm、9v/cm、10v/cm、20v/cm、50v/cm、100v/cm、200v/cm、300v/cm、400v/cm、500v/cm、600v/cm、700v/cm、800v/cm、900v/cm、1kv/cm、2kv/cm、5kv/cm、10kv/cm、20kv/cm、50kv/cm或更高。在体外条件下更优选为约0.5kv/cm至约4.0kv/cm。优选地,在体内条件下电场的强度为约1v/cm至约10kv/cm。然而,在传递到目标部位的脉冲数量增加的情况下,电场强度可能会降低。因此,设想在较低的场强下以脉冲方式输送电场。
[0244]
优选地,电场的施加形式为多个脉冲,例如具有相同强度和电容的双脉冲或具有变化强度和/或电容的顺序脉冲。如本文所用,术语“脉冲”包括处于可变电容和电压并且包
括指数和/或方波和/或调制波/方波形式的一个或多个电脉冲。
[0245]
优选地,电脉冲作为选自指数波形、方波形式、调制波形和调制方波形式的波形来传递。
[0246]
一个优选的实施方案采用低压直流电。因此,申请人公开了以1v/cm至20v/cm之间的场强施加于细胞、组织或组织块的电场的使用,持续100毫秒或更长、优选15分钟或更长的时期。
[0247]
超声有利地以约0.05w/cm2至约100w/cm2的功率水平施用。可使用诊断或治疗超声或它们的组合。
[0248]
如本文所用,术语“超声”是指一种能量形式,其由机械振动组成,该机械振动的频率如此高以至于它们超出人类听力的范围。超声波频谱的频率下限通常可取为约20khz。超声的大多数诊断应用采用的频率范围为1至15mhz(摘自ultrasonics in clinical diagnosis,p.n.t.wells编辑,第2版,publ.churchill livingstone[edinburgh,london&ny,1977])。
[0249]
超声已用于诊断和治疗应用。当用作诊断工具(“诊断超声”)时,尽管已使用了高达750mw/cm2的能量密度,但超声通常在至多约100mw/cm2(fda推荐)的能量密度范围内使用。在物理疗法中,超声通常被用作高达约3至4w/cm2范围内的能源(who建议)。在其他治疗应用中,可采用更高强度的超声,例如,以100w/cm至1kw/cm2(或甚至更高)的高强度聚焦超声(hifu)持续更短时期。如本说明书中所用的术语“超声”旨在涵盖诊断、治疗和聚焦超声。
[0250]
聚焦超声(fus)允许在不使用侵入式探头的情况下传递热能(参见morocz等人,1998 journal of magnetic resonance imaging第8卷,第1期,第136

142页)。聚焦超声的另一种形式是高强度聚焦超声(hifu),由moussatov等人在ultrasonics(1998)第36卷,第8期,第893

900页以及tranhuuhue等人在acustica(1997)第83卷,第6期,第1103

1106页中进行了综述。
[0251]
优选地,采用诊断超声和治疗超声的组合。然而,该组合并非旨在进行限制,并且本领域读者将理解,可使用超声的任何多种组合。另外,能量密度、超声频率和暴露时间可改变。
[0252]
优选地,暴露于超声能量源的功率密度为约0.05至约100wcm

2。甚至更优选地,暴露于超声能量源的功率密度为约1至约15wcm

2。
[0253]
优选地,暴露于超声能量源的频率为约0.015至约10.0mhz。更优选地,暴露于超声能量源的频率为约0.02至约5.0mhz或约6.0mhz。最优选地,超声以3mhz的频率施加。
[0254]
优选地,暴露时间为约10毫秒至约60分钟。优选地,暴露时间为约1秒至约5分钟。更优选地,施加超声约2分钟。然而,取决于要被破坏的特定靶细胞,暴露可持续更长的持续时间,例如15分钟。
[0255]
有利的是,将靶组织暴露于声功率密度为约0.05wcm

2至约10wcm

2且频率范围为约0.015至约10mhz的超声能量源(参见wo 98/52609)。然而,替代方式也是可能的,例如,暴露于声功率密度高于100wcm

2的超声能量源,但时间段缩短,例如,1000wcm

2持续毫秒范围或更短的时段。
[0256]
优选地,超声的施加为多个脉冲的形式;因此,可以任何组合使用连续波和脉冲波(超声的脉冲传递)。例如,可施加连续波超声,接着是脉冲波超声,反之亦然。可以任何顺序
和组合将其重复任何数量的次数。可在连续波超声的背景下施加脉冲波超声,并且可以任何数量的组使用任何数量的脉冲。
[0257]
优选地,超声可包括脉冲波超声。在一个高度优选的实施方案中,以0.7wcm

2或1.25wcm

2的功率密度作为连续波施加超声。如果使用脉冲波超声,则可采用更高的功率密度。
[0258]
超声的使用是有利的,因为像光一样,超声可精确地聚焦在目标上。此外,超声是有利的,因为它可与光不同地更深地聚焦到组织中。因此,它更适合于整个组织的渗透(例如但不限于肝叶)或整个器官(例如但不限于整个肝脏或整个肌肉,例如心脏)治疗。另一个重要的优点在于超声是一种非侵入性刺激,其可用于广泛多种诊断和治疗应用。举例来说,超声在医学成像技术中以及另外在骨科治疗中是众所周知的。此外,适用于将超声施加到受试脊椎动物的仪器是广泛可用的,并且其使用在本领域中是众所周知的。
[0259]
在特定的实施方案中,通过二级结构修饰指导分子以增加crispr

cas系统的特异性,并且所述二级结构可保护免受核酸外切酶活性并允许向指导序列的5'添加,在本文中也称为受保护的指导分子。
[0260]
在一个方面,本发明提供了使“保护rna”与指导分子的序列杂交,其中“保护rna”是与指导分子的3'端互补的rna链,从而产生部分双链指导rna。在本发明的一个实施方案中,用完全互补的保护序列来保护错配的碱基(即,不形成指导序列一部分的指导分子的碱基)降低了靶rna结合于3'端错配碱基对的可能性。在本发明的特定实施方案中,在指导分子内还可能存在包含延长长度的其他序列,使得所述指导物在指导分子内包含保护序列。该“保护序列”确保了指导分子除“暴露序列”(包含与靶序列杂交的指导序列的一部分)之外还包含“受保护的序列”。在特定的实施方案中,通过保护指导物的存在来修饰指导分子以包括二级结构如发夹。有利的是,存在三个或四个至三十个或更多个,例如约10个或更多个具有与受保护序列、指导序列或两者互补的连续碱基对。有利的是,受保护部分不妨碍crispr

cas系统与其靶标相互作用的热力学。通过提供包括部分双链的指导分子的这种延伸,所述指导分子被认为是受保护的并且导致改善的crispr

cas复合物的特异性结合,同时保持特异性活性。
[0261]
在特定的实施方案中,使用了截短指导物(tru

guide),即包含指导序列的长度相对于典型的指导序列长度被截短的指导分子。如nowak等人(nucleic acids res(2016)44(20):9555

9564)所述,此类指导物可允许具有催化活性的crispr

cas酶结合其靶标而不切割靶dna。在特定的实施方案中,使用截短的指导物,其允许靶标的结合,但仅保留crispr

cas酶的切口酶活性。
[0262]
上文讨论的指导分子和tracr分子可包括dna、rna、dna/rna杂合体、核酸类似物,例如但不限于肽核酸(pna)、锁核酸(lna)、解锁核酸(una)或三唑连接的dna。
[0263]
额外的crispr

cas开发和使用的考虑因素
[0264]
可基于以下文章中所述的crispr

cas开发和使用的方面进一步说明和扩展本发明,特别是涉及crispr蛋白复合物的递送以及rna指导的核酸内切酶在细胞和生物体中的用途:
[0265]
使用crispr/cas系统的多重基因组工程(multiplex genome engineering using crispr/cas systems).cong,l.,ran,f.a.,cox,d.,lin,s.,barretto,r.,habib,
n.,hsu,p.d.,wu,x.,jiang,w.,marraffini,l.a.和zhang,f.science 2月15日;339(6121):819

23(2013);
[0266]
使用crispr/cas系统的rna指导的细菌基因组编辑(rna

guided editing of bacterial genomes using crispr

cas systems).jiang w.,bikard d.,cox d.,zhang f,marraffini la.nat biotechnol 3月;31(3):233

9(2013);
[0267]
通过crispr/cas介导的基因组工程一步生成多个基因中携带突变的小鼠(one

step generation of mice carrying mutations in multiple genes by crispr/cas

mediated genome engineering).wang h.,yang h.,shivalila cs.,dawlaty mm.,cheng aw.,zhang f.,jaenisch r.cell 5月9日;153(4):910

8(2013);
[0268]
哺乳动物内源转录和表观遗传状态的光学控制(optical control of mammalian endogenous transcription and epigenetic states).konermann s,brigham md,trevino ae,hsu pd,heidenreich m,congl,platt rj,scott da,church gm,zhang f.nature.8月22日;500(7463):472

6.doi:10.1038/nature12466.电子出版于2013年8月23日(2013);
[0269]
用于增强基因组编辑特异性的rna指导的crispr cas9的双重切刻(double nicking by rna

guided crispr cas9 for enhanced genome editing specificity).ran,fa.,hsu,pd.,lin,cy.,gootenberg,js.,konermann,s.,trevino,ae.,scott,da.,inoue,a.,matoba,s.,zhang,y.和zhang,f.cell 8月28日.pii:s0092

8674(13)01015

5(2013

a);
[0270]
rna指导的cas9核酸酶的dna靶向特异性(dna targeting specificity of rna

guided cas9 nucleases).hsu,p.,scott,d.,weinstein,j.,ran,fa.,konermann,s.,agarwala,v.,li,y.,fine,e.,wu,x.,shalem,o.,cradick,tj.,marraffini,la.,bao,g.和zhang,f.nat biotechnol doi:10.1038/nbt.2647(2013);
[0271]
使用crispr

cas9系统进行基因组工程(genome engineering using the crispr

cas9 system).ran,fa.,hsu,pd.,wright,j.,agarwala,v.,scott,da.,zhang,f.nature protocols 11月;8(11):2281

308(2013

b);
[0272]
人类细胞中的基因组规模crispr

cas9敲除筛选(genome

scale crispr

cas9knockout screening in human cells).shalem,o.,sanjana,ne.,hartenian,e.,shi,x.,scott,da.,mikkelson,t.,heckl,d.,ebert,bl.,root,de.,doench,jg.,zhang,f.science 12月12日.(2013).[印刷版之前的电子版];
[0273]
cas9与指导rna和靶dna的复合物的晶体结构(crystal structure of cas9 in complex with guide rnaand target dna).nishimasu,h.,ran,fa.,hsu,pd.,konermann,s.,shehata,si.,dohmae,n.,ishitani,r.,zhang,f.,nureki,o.cell 2月27日,156(5):935

49(2014);
[0274]
crispr核酸内切酶cas9在哺乳动物细胞中的全基因组结合(genome

wide binding of the crispr endonuclease cas9in mammalian cells).wu x.,scott da.,kriz aj.,chiu ac.,hsu pd.,dadon db.,cheng aw.,trevino ae.,konermann s.,chen s.,jaenisch r.,zhang f.,sharp pa.nat biotechnol.4月20日.doi:10.1038/nbt.2889
(2014);
[0275]
用于基因组编辑和癌症建模的crispr

cas9敲入小鼠(crispr

cas9 knockin mice for genome editing and cancer modeling).platt rj,chen s,zhou y,yim mj,swiech l,kempton hr,dahlman je,parnas o,eisenhaure tm,jovanovic m,graham db,jhunjhunwala s,heidenreich m,xavier rj,langer r,anderson dg,hacohen n,regev a,feng g,sharp pa,zhang f.cell 159(2):440

455doi:10.1016/j.cell.2014.09.014(2014);
[0276]
用于基因组工程的crispr

cas9的开发和应用(development and applications of crispr

cas9for genome engineering),hsu pd,lander es,zhang f.,cell.6月5日;157(6):1262

78(2014);
[0277]
使用crispr/cas9系统对人类细胞进行遗传筛选(genetic screens in human cells using the crispr/cas9 system),wang t,wei jj,sabatini dm,lander es.,science.1月3日;343(6166):80

84.doi:10.1126/science.1246981(2014);
[0278]
用于crispr

cas9介导的基因失活的高活性sgrna的合理设计(rational design of highly active sgrnas for crispr

cas9

mediated gene inactivation),doench jg,hartenian e,graham db,tothova z,hegde m,smith i,sullender m,ebert bl,xavier rj,root de.,(2014年9月3日在线出版)nat biotechnol.dec;32(12):1262

7(2014);
[0279]
使用crispr

cas9进行哺乳动物脑中基因功能的体内质询(invivo interrogation of gene function in the mammalian brain using crispr

cas9),swiech l,heidenreich m,banerjee a,habib n,li y,trombetta j,sur m,zhang f.,(2014年10月19日在线出版)natbiotechnol.1月;33(1):102

6(2015);
[0280]
工程化crispr

cas9复合物的基因组规模转录激活(genome

scale transcriptional activation by an engineered crispr

cas9 complex),konermann s,brigham md,trevino ae,joung j,abudayyeh oo,barcena c,hsu pd,habib n,gootenberg js,nishimasu h,nureki o,zhang f.,nature.1月29日;517(7536):583

8(2015);
[0281]
用于诱导型基因组编辑和转录调节的split

cas9构造(asplit

cas9 architecture for inducible genome editing and transcriptionmodulation),zetsche b,volz se,zhang f.,(2015年2月02日在线出版)nat biotechnol.2月;33(2):139

42(2015);
[0282]
肿瘤生长和转移的小鼠模型中的全基因组crispr筛选(genome

wide crispr screen in a mouse model of tumor growth and metastasis),chen s,sanjana ne,zheng k,shalem o,lee k,shi x,scott da,song j,pan jq,weissleder r,lee h,zhang f,sharp pa.cell 160,1246

1260,2015年3月12日(小鼠中的多重筛选),和
[0283]
使用金黄色葡萄球菌cas9进行体内基因组编辑(in vivo genome editing using staphylococcus aureus cas9),ran fa,cong l,yan wx,scott da,gootenberg js,kriz aj,zetsche b,shalem o,wu x,makarova ks,koonin ev,sharp pa,zhang f.,
(2015年4月01日在线出版),nature.4月9日;520(7546):186

91(2015)。
[0284]
shalem等人,“使用crispr

cas9的高通量功能基因组学(high

throughput functional genomics using crispr

cas9),”nature reviews genetics 16,299

311(2015年5月)。
[0285]
xu等人,“改进的crispr sgrna设计的序列决定子(sequence determinants of improved crispr sgrna design),”genome research 25,1147

1157(2015年8月)。
[0286]
parnas等人,“全基因组crispr筛选原代免疫细胞以剖析调控网络(a genome

wide crispr screen in primary immune cells to dissect regulatory networks),”cell 162,675

686(2015年7月30日)。
[0287]
ramanan等人,“crispr/cas9切割病毒dna可有效抑制乙型肝炎病毒(crispr/cas9 cleavage of viral dna efficiently suppresses hepatitis b virus),”scientific reports 5:10833.doi:10.1038/srep10833(2015年6月2日)
[0288]
nishimasu等人,“金黄色葡萄球菌cas9的晶体结构(crystal structure of staphylococcus aureus cas9),”cell 162,1113

1126(2015年8月27日)
[0289]
通过cas9介导的原位饱和诱变对bcl11a增强子进行剖析(bcl11a enhancer dissection by cas9

mediated in situ saturating mutagenesis),canver等人,nature 527(7577):192

7(2015年11月12日)doi:10.1038/nature15521.电子出版于2015年9月16日。
[0290]
cpf1是2类crispr

cas系统的单个rna指导的核酸内切酶(cpf1is a single rna

guided endonuclease of a class 2 crispr

cas system),zetsche等人,cell 163,759

71(2015年9月25日)。
[0291]
各种2类crispr

cas系统的发现和功能表征(discovery and functional characterization of diverse class 2 crispr

cas systems),shmakov等人,molecular cell,60(3),385

397doi:10.1016/j.molcel.2015.10.008电子出版于2015年10月22日。
[0292]
具有改进的特异性的合理工程化的cas9核酸酶(rationally engineered cas9 nucleases with improved specificity),slaymaker等人,science 2016年1月1日351(6268):84

88doi:10.1126/science.aad5227.电子出版于2015年12月1日.[印刷版之前的电子版]。
[0293]
gao等人,“具有改变的pam特异性的工程化的cpf1酶(engineered cpf1 enzymes with altered pam specificities),”biorxiv 091611;doi:dx.doi.org/10.1101/091611(2016年12月4日)
[0294]
在本发明的实践中可考虑将所述文献中的每一者通过引用并入本文,并在下面简要讨论:
[0295]
cong等人设计了基于嗜热链球菌(streptococcus thermophilus)cas9以及化脓性链球菌cas9的真核细胞中使用的ii型crispr

cas系统,并证实cas9核酸酶可被短rna引导以在人类和小鼠细胞中诱导dna的精确切割。他们的研究进一步表明,cas9转化为切刻酶可用于以最小的诱变活性促进真核细胞中的同源性定向修复。此外,他们的研究表明可将多个指导序列编码到单个crispr阵列中,以便能够同时编辑哺乳动物基因组内的内源基
因组基因座位点中的几个,从而证明了rna指导的核酸酶技术的易编程性和广泛适用性。利用rna编程细胞中序列特异性dna切割的这种能力定义了一类新的基因组工程工具。这些研究进一步表明,其他crispr基因座可能也可移植到哺乳动物细胞中,并且还可介导哺乳动物基因组切割。重要的是,可设想,可进一步改进crispr

cas系统的几个方面以提高其效率和多功能性。
[0296]
jiang等人利用成簇规则间隔短回文重复序列(crispr)相关的cas9核酸内切酶与双重rna复合,在肺炎链球菌和大肠杆菌的基因组中引入了精确的突变。所述方法依赖于靶向基因组位点处的双重rna:cas9定向切割来杀死未突变的细胞,并且避免了对可选择标志物或反向选择系统的需求。研究报道,通过改变短crispr rna(crrna)的序列以在编辑模板上进行单核苷酸和多核苷酸改变,对双重rna:cas9特异性进行重新编程。研究表明,同时使用两种crrna能够进行多重诱变。此外,当所述方法与重组工程组合使用时,在肺炎链球菌中,使用所述方法回收的细胞中几乎有100%含有所需的突变,而在大肠杆菌中,回收的细胞中有65%含有所述突变。
[0297]
wang等人(2013)使用crispr

cas系统一步生成在多个基因中带有突变的小鼠,这些基因传统上是通过带有单突变的小鼠的胚胎干细胞连续重组和/或耗时的交叉杂交而在多个步骤中产生的。crispr

cas系统将极大地加速功能冗余基因和上位基因相互作用的体内研究。
[0298]
konermann等人(2013)解决了本领域对通用和稳健技术的需求,这些技术能够对基于crispr cas9酶的dna结合结构域以及转录激活子如效应子进行光学和化学调节
[0299]
ran等人(2013

a)描述了一种将cas9切口酶突变体与配对指导rna结合以引入靶向双链断裂的方法。这解决了来自微生物crispr

cas系统的cas9核酸酶通过指导序列靶向特定基因组基因座的问题,所述序列可容许与dna靶标的某些错配,从而促进不期望的脱靶诱变。由于基因组中的各个切口均以高保真度进行修复,因此双链断裂需要经由适当偏移的指导rna同时切刻,并扩展了特异性识别的用于靶标切割的碱基的数目。作者证实,使用配对切刻可在细胞系中将脱靶活性降低50至1,500倍,并促进小鼠受精卵中的基因敲除,而不会牺牲在靶切割效率。这种通用策略能够实现需要高特异性的广泛多种基因组编辑应用。
[0300]
hsu等人(2013)对spcas9在人类细胞中的靶向特异性进行了表征,以告知目标位点的选择并避免脱靶效应。所述研究评价了293t和293ft细胞中>100个预测的基因组脱靶基因座的>700个指导rna变体和spcas9诱导的插入/缺失突变水平。作者认为,spcas9可以序列依赖性方式容许指导rna和靶dna之间在不同位置的错配,对错配的数量、位置和分布敏感。作者进一步表明,spcas9介导的切割不受dna甲基化的影响,并且可对spcas9和grna的剂量进行滴定,以最大程度地减少脱靶修饰。另外,为促进哺乳动物基因组工程应用,作者报道提供了一种基于web的软件工具,以指导靶序列的选择和验证以及脱靶分析。
[0301]
ran等人(2013

b)描述了一组经由哺乳动物细胞中的非同源末端连接(nhej)或同源性定向修复(hdr)进行cas9介导的基因组编辑的工具,以及生成修饰细胞系用于下游功能研究。为了最大程度地减少脱靶切割,作者进一步描述了使用具有cas9切口酶突变体与配对指导rna的双重切刻策略。作者提供的方案通过实验得出用于选择目标位点、评价切
割效率和分析脱靶活性的指南。研究表明,从靶标设计开始,基因修饰可在短短的1

2周内完成,并且修饰的克隆细胞系可在2

3周内获得。
[0302]
shalem等人描述了一种在全基因组范围内质询基因功能的新方法。他们的研究表明,通过靶向具有64,751个独特指导序列的18,080个基因的基因组规模的crispr

cas9基因敲除(gecko)文库的递送,能够实现人类细胞中的阴性和阳性选择筛选。首先,作者表明使用gecko文库来鉴定癌症和多能干细胞中细胞活力所必需的基因。接下来,在黑色素瘤模型中,作者筛选了基因丢失与维拉非尼抗药性有关的基因,维拉非尼是一种抑制突变蛋白激酶braf的治疗剂。他们的研究表明,排名最高的候选物包括先前验证的基因nf1和med12,以及新型命中物nf2、cul3、tada2b和tada1。作者观察到靶向同一基因的独立指导rna之间的高度一致性和较高的命中率验证,从而证明了用cas9进行基因组规模筛选的希望。
[0303]
nishimasu等人报道了化脓性链球菌cas9与sgrna及其靶dna的复合物的晶体结构,分辨率为2.5a
°
。所述结构揭示了由靶标识别和核酸酶叶组成的双叶构造,将sgrna:dna异双链体容纳在其界面带正电荷的凹槽中。识别叶对于结合sgrna和dna是必不可少的,而核酸酶叶含有hnh和ruvc核酸酶结构域,它们适当定位以分别切割靶dna的互补链和非互补链。核酸酶叶还含有一个羧基末端结构域,其负责与原间隔子邻近基序(pam)的相互作用。这种高分辨率的结构和伴随的功能分析揭示了cas9靶向rna指导的dna的分子机制,从而为合理设计新的通用基因组编辑技术铺平了道路。
[0304]
wu等人绘制了在小鼠胚胎干细胞(mesc)中负载有单指导rna(sgrna)的来自化脓性链球菌的非催化活性cas9(dcas9)的全基因组结合位点。作者表明,所测试的四个sgrna各自将dcas9靶向数十至数千个基因组位点,通常以sgrna中的5个核苷酸种子区域和ngg原间隔子邻近基序(pam)为特征。染色质的不可及性降低了dcas9与具有匹配种子序列的其他位点的结合;因此,70%的脱靶位点与基因相缔合。作者表明,在用催化活性cas9转染的mesc中,对295个dcas9结合位点进行靶向测序,仅鉴定出一个高于背景水平突变的位点。作者提出了cas9结合和切割的两种状态模型,其中种子匹配触发了结合,但切割需要与靶dna进行广泛配对。
[0305]
platt等人建立了cre依赖性cas9敲入小鼠。作者表明了在神经元、免疫细胞和内皮细胞中使用腺相关病毒(aav)、慢病毒或粒子介导的指导rna进行体内以及离体基因组编辑。
[0306]
hsu等人(2014)是一篇综述文章,其总体讨论了crispr

cas9从酸奶到基因组编辑的历史,包括细胞的遗传筛选。
[0307]
wang等人(2014)涉及使用基因组规模的慢病毒单指导rna(sgrna)文库的适用于阳性和阴性选择的合并的功能丧失的基因筛选方法。
[0308]
doench等人创建了一个sgrna池,将一组六个内源性小鼠和三个内源性人类基因的所有可能目标位点拼接在一起,并通过抗体染色和流式细胞术定量评估了它们产生靶基因无效等位基因的能力。作者表明,优化pam可提高活性,并且还提供了用于设计sgrna的在线工具。
[0309]
swiech等人证实aav介导的spcas9基因组编辑可实现大脑中基因功能的反向遗
传研究。
[0310]
konermann等人(2015)讨论了在指导物(例如带有或不带有接头的茎或四环)的适当位置附接多个效应子结构域(例如转录激活子、功能和表观基因组调控因子)的能力。
[0311]
zetsche等人证实cas9酶可分为两部分并因此可控制cas9的激活组装。
[0312]
chen等人涉及多重筛选,通过证明小鼠中的全基因组体内crispr

cas9筛选揭示了调节肺转移的基因。
[0313]
ran等人(2015)涉及sacas9及其编辑基因组的能力,并证明了不能从生化测定进行外推。
[0314]
shalem等人(2015)描述了无催化活性cas9(dcas9)融合物用于合成阻遏(crispri)或激活(crispra)表达的方式,显示了cas9在用于基因组规模筛选(包括阵列筛选和合并筛选),使基因组基因座失活的敲除方法以及调节转录活性的策略方面的进展。
[0315]
xu等人(2015)在基于crispr的筛选中评估了有助于提高单指导rna(sgrna)效率的dna序列特征。作者探索了crispr/cas9敲除的效率和切割位点处的核苷酸偏好。作者还发现,crispri/a的序列偏好与crispr/cas9敲除的偏好大不相同。
[0316]
parnas等人(2015)将全基因组合并的crispr

cas9文库引入树突状细胞(dc)中,以鉴定控制细菌脂多糖(lps)诱导肿瘤坏死因子(tnf)的基因。鉴定了tlr4信号传导的已知调控剂和以前未知的候选物,并将其分为三个功能模块,这些功能模块对lps的典型响应具有明显的影响。
[0317]
ramanan等人(2015)证明了感染细胞中病毒附加型dna(cccdna)的裂解。hbv基因组以被称为共价闭合环状dna(cccdna)的3.2kb双链附加型dna物质形式存在于被感染的肝细胞核中,这是hbv生命周期中的关键组成部分,其复制不受当前疗法的抑制。作者表明,特异性靶向hbv高保守区的sgrna可强有力地抑制病毒复制和耗尽的cccdna。
[0318]
nishimasu等人(2015)报道了sacas9与单指导rna(sgrna)及其双链dna靶标的复合物的晶体结构,其含有5'

ttgaat

3'pam和5'

ttgggt

3'pam。sacas9与spcas9的结构比较突出显示了结构保守性和差异性,解释了它们独特的pam特异性和直系同源sgrna识别。
[0319]
canver等人(2015)说明了基于crispr

cas9的非编码基因组元件的功能研究。作者开发了合并的crispr

cas9指导rna文库,以进行人类和小鼠bcl11a增强子的原位饱和诱变,揭示了增强子的关键特征。
[0320]
zetsche等人(2015)报道了cpf1的表征,cpf1是来自新凶手弗朗西斯菌(francisella novicida)u112的2类crispr核酸酶,其具有与cas9不同的特征。cpf1是一种缺少tracrrna的单rna指导的核酸内切酶,利用了富含t的原间隔子邻近基序,并经由交错的dna双链断裂来切割dna。
[0321]
shmakov等人(2015)报道了三种不同的2类crispr

cas系统。两种系统crispr酶(c2c1和c2c3)包含与cpf1远缘的ruvc样核酸内切酶结构域。与cpf1不同,c2c1依赖于crrna和tracrrna进行dna切割。第三种酶(c2c2)包含两个预测的hepn rna酶结构域并且不依赖tracrrna。
[0322]
slaymaker等人(2016)报道了使用结构指导的蛋白质工程来改进化脓性链球菌cas9(spcas9)的特异性。作者开发了“增强特异性”spcas9(espcas9)变体,该变体保持了稳固的在靶切割并降低了脱靶效应。
[0323]
本文提供的方法和工具以某些v型效应子为例。可使用本领域描述的方法鉴定具有相似特性的其他v型核酸酶(shmakov等人,2015,60:385

397;abudayeh等人,2016,science,5;353(6299))。在特定的实施方案中,用于鉴定新型crispr效应蛋白的此类方法可包括以下步骤:从数据库中选择编码种子的序列,所述种子鉴定出crispr cas基因座的存在,鉴定选定序列中位于包含开放阅读框(orf)的种子的10kb内的基因座,从中选择包含orf的基因座,其中只有一个orf编码一种新型crispr效应子,该效应子具有多于700个氨基酸并且与已知的crispr效应子的同源性不超过90%。在特定的实施方案中,种子是crispr

cas系统共有的蛋白质,例如cas1。在其他实施方案中,crispr阵列用作种子以鉴定新的效应蛋白。
[0324]
包含v型效应子和crrna的预组装重组crispr

v型效应子复合物可进行转染,例如通过电穿孔进行转染,从而导致高突变率并且没有可检测到的脱靶突变,正如某些其他crispr效应子所证明的那样。hur,j.k.等人,targeted mutagenesis in mice by electroporation of cpf1ribonucleoproteins,nat biotechnol.2016年6月6日.doi:10.1038/nbt.3596.[印刷版之前的电子版]。全基因组分析表明cpf1具有高度特异性。通过一项措施,在人类hek293t细胞中为spcas9确定的体外切割位点显著少于spcas9。kim,d.等人,genome

wide analysis reveals specificities of cpf1 endonucleases in human cells,nat biotechnol.2016年6月6日.doi:10.1038/nbt.3609.[印刷版之前的电子版]。在果蝇中已经证实了使用cpf1的高效多重系统,所述系统使用了从含有本发明trna的阵列中加工得到的grna。port,f.等人,expansion of the crispr toolbox in an animal with trna

flanked cas9 and cpf1 grnas.doi:dx.doi.org/10.1101/046417。
[0325]
此外,“用于高度特异性基因组编辑的二聚体crispr rna指导的foki核酸酶(dimeric crispr rna

guided foki nucleases for highly specific genome editing)”,shengdar q.tsai,nicolas wyvekens,cyd khayter,jennifer a.foden,vishal thapar,deepak reyon,mathew j.goodwin,martin j.aryee,j.keith joung nature biotechnology 32(6):569

77(2014),涉及二聚体rna指导的foki核酸酶,该酶识别扩展序列并可在人类细胞中高效编辑内源基因。
[0326]
关于crispr

cas系统、其组件以及此类组件的递送的一般信息,包括方法、材料、递送媒介物、载体、粒子、aav及其制造和使用,包括关于数量和制剂,在本发明的实践中所有有用者,参考:美国专利第8,697,359号、第8,771,945号、第8,795,965号、第8,865,406号、第8,871,445号、第8,889,356号、第8,889,418号、第8,895,308号、第8,906,616号、第8,932,814号、第8,945,839号、第8,993,233号和第8,999,641号;美国专利公开us 2014

0310830(美国申请系列号14/105,031)、us 2014

0287938 a1(美国申请系列号14/213,991)、us 2014

0273234 a1(美国申请系列号14/293,674)、us2014

0273232 a1(美国申请系列号14/290,575)、us 2014

0273231(美国申请系列号14/259,420)、us 2014

0256046 a1(美国申请系列号14/226,274)、us 2014

0248702 a1(美国申请系列号14/258,458)、us 2014

0242700 a1(美国申请系列号14/222,930)、us 2014

0242699 a1(美国申请系列号
14/183,512)、us 2014

0242664 a1(美国申请系列号14/104,990)、us 2014

0234972 a1(美国申请系列号14/183,471)、us 2014

0227787 a1(美国申请系列号14/256,912)、us 2014

0189896 a1(美国申请系列号14/105,035)、us 2014

0186958(美国申请系列号14/105,017)、us 2014

0186919 a1(美国申请系列号14/104,977)、us 2014

0186843 a1(美国申请系列号14/104,900)、us 2014

0179770 a1(美国申请系列号14/104,837)和us 2014

0179006 a1(美国申请系列号14/183,486)、us 2014

0170753(美国申请系列号14/183,429);us 2015

0184139(美国申请系列号14/324,960);14/054,414欧洲专利申请ep 2 771 468(ep13818570.7)、ep 2 764 103(ep13824232.6)和ep 2 784 162(ep14170383.5);以及pct专利公开wo 2014/093661(pct/us2013/074743)、wo 2014/093694(pct/us2013/074790)、wo 2014/093595(pct/us2013/074611)、wo 2014/093718(pct/us2013/074825)、wo 2014/093709(pct/us2013/074812)、wo 2014/093622(pct/us2013/074667)、wo 2014/093635(pct/us2013/074691)、wo 2014/093655(pct/us2013/074736)、wo 2014/093712(pct/us2013/074819)、wo 2014/093701(pct/us2013/074800)、wo 2014/018423(pct/us2013/051418)、wo 2014/204723(pct/us2014/041790)、wo 2014/204724(pct/us2014/041800)、wo 2014/204725(pct/us2014/041803)、wo 2014/204726(pct/us2014/041804)、wo 2014/204727(pct/us2014/041806)、wo 2014/204728(pct/us2014/041808)、wo 2014/204729(pct/us2014/041809)、wo 2015/089351(pct/us2014/069897)、wo 2015/089354(pct/us2014/069902)、wo 2015/089364(pct/us2014/069925)、wo 2015/089427(pct/us2014/070068)、wo 2015/089462(pct/us2014/070127)、wo 2015/089419(pct/us2014/070057)、wo 2015/089465(pct/us2014/070135)、wo 2015/089486(pct/us2014/070175)、pct/us2015/051691、pct/us2015/051830。还参考了分别于2013年1月30日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日和2013年5月28日提交的美国临时专利申请61/758,468;61/802,174;61/806,375;61/814,263;61/819,803和61/828,130。还参考了2013年6月17日提交的美国临时专利申请61/836,123。另外参考了各自于2013年6月17日提交的美国临时专利申请61/835,931、61/835,936、61/835,973、61/836,080、61/836,101和61/836,127。进一步参考了2013年8月5日提交的美国临时专利申请61/862,468和61/862,355;2013年8月28日提交的美国临时专利申请61/871,301;2013年9月25日提交的美国临时专利申请61/960,777和2013年10月28日提交的美国临时专利申请61/961,980。此外还参考了:2014年10月28日提交的pct/us2014/62558和美国临时专利申请系列号:61/915,148、61/915,150、61/915,153、61/915,203、61/915,251、61/915,301、61/915,267、61/915,260和61/915,397,各自于2013年12月12日提交;61/757,972和61/768,959,于2013年1月29日和2013年2月25日提交;62/010,888和62/010,879,都于2014年6月11日提交;62/010,329、62/010,439和62/010,441,各自于2014年6月10日提交;61/939,228和61/939,242,各自于2014年2月12日提交;61/980,012,于2014年4月15日提交;62/038,358,于2014年8月17日提交;62/055,484、62/055,460和62/055,487,各自于2014年9月25日提交;以及62/069,243,于2014年10月27日提交。参考2014年6月10日提交的pct申请(尤其指定美国申请)第pct/us14/41806号。参考2014年1月22日提交的美国临时专利申请61/930,214。参考2014年6月10日提交的pct申请(尤其指定美国申请)第pct/us14/41806号。
[0327]
还提及美国申请62/180,709,2015年6月17日,protected guide rnas(pgrnas);
linked functional

crispr complexes;美国申请62/087,475,2014 年12月4日,和62/181,690,2015年6月18日,functional screening with optimized functional crispr

cas systems;美国申请62/055,487,2014年9月25日,functional screening with optimized functional crispr

cas systems;美国申请62/087,546,2014年12月4日,和62/181,687,2015年6月18日,multifunctional crispr complexes and/or optimized enzyme linked functional

crispr complexes;以及美国申请62/098,285,2014年12月30日,crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis。
[0328]
提及了美国申请62/181,659,2015年6月18日,和62/207,318,2015年8月19日,engineering and optimization of systems,methods,enzyme and guide scaffolds of cas9orthologs and variants for sequence manipulation。提及了美国申请62/181,663,2015年6月18日,和62/245,264,2015年10月22日,novel crispr enzymes and systems;美国申请62/181,675,2015年6月18日,62/285,349,2015年10月22日,62/296,522,2016年2月17日,和62/320,231,2016年4月8日,novel crispr enzymes and systems;美国申请62/232,067,2015年9月24日,美国申请14/975,085,2015年12月18日,欧洲申请号16150428.7,美国申请62/205,733,2015年8月16日,美国申请62/201,542,2015年8月5日,美国申请62/193,507,2015年7月16日,和美国申请62/181,739,2015年6月18日,各自名称为novel crispr enzymes and systems;以及美国申请62/245,270,2015年10月22日,novel crispr enzymes and systems。还提及了美国申请61/939,256,2014年2月12日,和wo 2015/089473(pct/us2014/070152),2014年12月12日,各自名称为engineering of systems,methods and optimized guide compositions with new architectures for sequence manipulation。还提及了pct/us2015/045504,2015年8月15日,美国申请62/180,699,2015年6月17日,和美国申请62/038,358,2014年8月17日,各自名称为genome editing using cas9 nickases。
[0329]
另外,提及了pct申请pct/us14/70057,代理人案号47627.99.2060和bi

2013/107,名称为“delivery,use and therapeutic applications of the crispr

cas systems and compositions for targeting disorders and diseases using particle delivery components”(要求以下美国临时专利申请中的一者或多者或全部的优先权:62/054,490,于2014年9月24日提交;62/010,441,于2014年6月10日提交;以及61/915,118、61/915,215和61/915,148,各自于2013年12月12日提交)(“particle delivery pct”),通过引用并入本文;以及pct申请pct/us14/70127,代理人案号47627.99.2091和bi

2013/101,名称为“delivery,use and therapeutic applications of the crispr

cas systems and compositions for genome editing”(要求以下美国临时专利申请中的一者或多者或全部的优先权:61/915,176;61/915,192;61/915,215;61/915,107,61/915,145;61/915,148;和61/915,153,各自于2013年12月12日提交)(“eye pct”),通过引用并入本文,关于制备含sgrna和v型效应蛋白的粒子的方法,所述方法包括将包含sgrna和v型效应蛋白的混合物(和任选地hdr模板)与包含以下或基本上由以下组成或由以下组成的混合物混合:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇;以及来自所述方法的粒子。例如,其中v型效应蛋白和sgrna在合适的温度(例如15

30℃,例如20

25℃,例如室温)下以合适的摩尔比
(例如3:1至1:3或2:1至1:2或1:1)混合在一起,持续合适的时间,例如15

45分钟,例如30分钟,有利地在无菌的无核酸酶的缓冲液例如1x pbs中。单独地,粒子组分例如或包含:表面活性剂,例如阳离子脂质,例如1,2

二油酰基
‑3‑
三甲基铵

丙烷(dotap);磷脂,例如二肉豆蔻酰基磷脂酰胆碱(dmpc);可生物降解的聚合物,例如乙二醇聚合物或peg,和脂蛋白,例如低密度脂蛋白(例如胆固醇),将其溶于醇,有利的是c1

6烷基醇如甲醇、乙醇、异丙醇,例如100%乙醇中。将两种溶液混合在一起以形成含有cas9

sgrna复合物的粒子。因此,可将sgrna与v型效应蛋白预先复合,然后将整个复合物配制成粒子。可用不同摩尔比的不同组分来制备制剂,所述组分已知可促进核酸向细胞内的递送(例如1,2

二油酰基
‑3‑
三甲基铵

丙烷(dotap),1,2

双十四烷酰基

sn

甘油
‑3‑
磷酸胆碱(dmpc),聚乙二醇(peg)和胆固醇)。例如,dotap:dmpc:peg:胆固醇摩尔比可为dotap 100、dmpc 0、peg 0、胆固醇0;或dotap 90、dmpc 0、peg 10、胆固醇0;或dotap 90、dmpc 0、peg 5、胆固醇5;dotap 100、dmpc 0、peg 0、胆固醇0。所述申请相应地包括将sgrna、v型效应蛋白和形成粒子的组分混合;以及由这种混合产生的粒子。本发明的各方面可涉及粒子;例如,使用类似于particle delivery pct或eye pct的方法的粒子,例如,通过将本发明中包含sgrna和/或v型效应子的混合物与形成粒子的组分混合,如在particle delivery pct或eye pct中,形成粒子和由这种混合形成的粒子(或者,当然,如本发明中涉及sgrna和/或v型效应子的其他粒子)。
[0330]
其他示例性核苷酸结合系统和蛋白质
[0331]
在某些示例实施方案中,核苷酸结合分子可以是并非crispr

cas系统的系统的一种或多种组分。其他核苷酸结合分子的实例可以是转录激活子样效应子核酸酶(talen)、锌指核酸酶、大范围核酸酶、其功能片段、其变体或它们的任何组合的组分。
[0332]
tale系统
[0333]
在一些实施方案中,所述系统可包含转录激活子样效应子核酸酶、其功能片段或其变体。本公开还可包括是或编码tale系统的一种或多种组分的核苷酸序列。如本文所公开的,可通过转录激活子样效应子核酸酶(talen)系统进行编辑。转录激活子样效应子(tale)可被工程化以几乎结合任何所需的dna序列。使用talen系统进行基因组编辑的示例性方法可见于例如:cermak t.doyle el.christian m.wang l.zhang y.schmidt c等人,efficient design and assembly of custom talen and other tal effector

based constructs for dna targeting.nucleic acids res.2011;39:e82;zhang f.cong l.lodato s.kosuri s.church gm.arlotta p efficient construction of sequence

specific tal effectors for modulating mammalian transcription.nat biotechnol.2011;29:149

153;以及美国专利第8,450,471号、第8,440,431号和第8,440,432号,所有这些均通过引用明确并入。
[0334]
在一些实施方案中,本文提供包括分离的、非天然存在的、重组的或工程化的dna结合蛋白,其包含tale单体作为其组织结构的一部分,其能够以提高的效率和扩大的特异性靶向核酸序列。
[0335]
天然存在的tale或“野生型tale”是由多个变形菌物种分泌的核酸结合蛋白。tale多肽含有由高度保守的单体多肽的串联重复序列组成的核酸结合结构域,其长度主要为33、34或35个氨基酸,并且主要在氨基酸位置12和13上彼此不同。在有利的实施方案中,核酸是dna。如本文所用,术语“多肽单体”或“tale单体”将用于指tale核酸结合结构域内的高
度保守的重复多肽序列,并且术语“重复可变双残基”或“rvd”将用于指多肽单体的位置12和13处的高度可变的氨基酸。如本公开通篇所提供的,rvd的氨基酸残基使用氨基酸的iupac单字母代码来描绘。包含在dna结合结构域内的tale单体的一般表示是x1

11

(x12x13)

x14

33或34或35,其中下标指示氨基酸位置并且x表示任何氨基酸。x12x13指示rvd。在一些多肽单体中,位置13处的可变氨基酸缺失或不存在,并且在此类多肽单体中,rvd由单个氨基酸组成。在这些情况下,rvd可以替代地表示为x*,其中x表示x12并且(*)指示x13不存在。dna结合结构域包含tale单体的若干重复序列,并且这可表示为(x1

11

(x12x13)

x14

33或34或35)z,其中在一个有利的实施方案中,z为至少5至40。在另一个有利的实施方案中,z为至少10至26。
[0336]
tale单体具有核苷酸结合亲和力,该亲和力取决于其rvd中氨基酸的身份。例如,rvd为ni的多肽单体优先结合腺嘌呤(a),rvd为ng的多肽单体优先结合胸腺嘧啶(t),rvd为hd的多肽单体优先结合胞嘧啶(c)并且rvd为nn的多肽单体优先结合腺嘌呤(a)和鸟嘌呤(g)两者。在本发明的又一个实施方案中,rvd为ig的多肽单体优先结合t。因此,tale的核酸结合结构域中多肽单体重复序列的数量和顺序决定了其核酸靶标特异性。在本发明的更进一步的实施方案中,rvd为ns的多肽单体识别所有四个碱基对并且可结合a、t、g或c。tale的结构和功能进一步描述于例如moscou等人,science 326:1501(2009);boch等人,science 326:1509

1512(2009);以及zhang等人,nature biotechnology 29:149

153(2011),其中的每个均通过引用整体并入。
[0337]
本发明方法中使用的tale多肽是分离的、非天然存在的、重组的或工程化的核酸结合蛋白,其具有含有设计成靶向特定核酸序列的多肽单体重复序列的核酸或dna结合区。
[0338]
如本文所述,具有hn或nh的rvd的多肽单体优先结合鸟嘌呤,从而允许产生对含鸟嘌呤的靶核酸序列具有高结合特异性的tale多肽。在本发明的一个优选实施方案中,具有rvd rn、nn、nk、sn、nh、kn、hn、nq、hh、rg、kh、rh和ss的多肽单体优先结合鸟嘌呤。在本发明的一个更有利的实施方案中,具有rvd rn、nk、nq、hh、kh、rh、ss和sn的多肽单体优先结合鸟嘌呤,从而允许产生对含鸟嘌呤的靶核酸序列具有高结合特异性的tale多肽。在本发明的一个更有利的实施方案中,具有rvd hh、kh、nh、nk、nq、rh、rn和ss的多肽单体优先结合鸟嘌呤,从而允许产生对含鸟嘌呤的靶核酸序列具有高结合特异性的tale多肽。在另一个有利的实施方案中,对鸟嘌呤具有高结合特异性的rvd是rn、nh、rh和kh。此外,具有rvd nv的多肽单体优先结合腺嘌呤和鸟嘌呤。在本发明的更优选的实施方案中,具有rvd h*、ha、ka、n*、na、nc、ns、ra和s*的多肽单体以相当的亲和力结合腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶。
[0339]
核酸或dna结合结构域的一个或多个多肽单体的预定n末端至c末端顺序决定了tale多肽将结合的相应预定靶核酸序列。如本文所用,多肽单体和至少一个或多个半多肽单体被“特异性排序以靶向”目标基因组基因座或基因。在植物基因组中,天然的tale结合位点总是以胸腺嘧啶(t)开头,这可以由tale多肽的非重复n末端内的隐蔽信号指定;在一些情况下,该区域可称为重复序列0。在动物基因组中,tale结合位点不一定必须以胸腺嘧啶(t)开头,并且tale多肽可靶向以t、a、g或c开头的dna序列。tale单体的串联重复序列总是以半长重复序列或可能与重复的全长tale单体的仅前20个氨基酸共有同一性的一段序列结束,并且该半重复序列可称为半单体(图8),其包括在术语“tale单体”中。因此断定,被靶向的核酸或dna的长度等于完整多肽单体的数量加2。
[0340]
如zhang等人,nature biotechnology 29:149

153(2011)所述,tale多肽结合效率可通过在工程化的tale dna结合区的n末端或c末端位置在工程化tale中包括来自直接位于天然存在的tale的dna结合区的n末端或c末端的“加帽区”的氨基酸序列来提高。因此,在某些实施方案中,本文所述的tale多肽进一步包含n末端加帽区和/或c末端加帽区。
[0341]
n末端加帽区的示例性氨基酸序列是:
[0342]
m d p i r s r t p s p a r e l l s g p q p d g v q p t a d r g v s p
[0343]
p a g g p l d g l p a r r t m s r t r l p s p p a p s p a f s a d s
[0344]
f s d l l r q f d p s l f n t s l f d s l p p f g a h h t e a a t g
[0345]
e w d e v q s g l r a a d a p p p t m r v a v t a a r p p r a k p a
[0346]
p r r r a a q p s d a s p a a q v d l r t l g y s q q q q e k i k p
[0347]
k v r s t v a q h h e a l v g h g f t h a h i v a l s q h p a a l g
[0348]
t v a v k y q d m i a a l p e a t h e a i v g v g k q w s g a r a l
[0349]
e a l l t v a g e l r g p p l q l d t g q l l k i a k r g g v t a v
[0350]
e a v h a w r n a l t g a p l n(seq id no:392)
[0351]
c末端加帽区的示例性氨基酸序列是:
[0352]
r p a l e s i v a q l s r p d p a l a a l t n d h l v a l a c l g
[0353]
g r p a l d a v k k g l p h a p a l i k r t n r r i p e r t s h r
[0354]
v a d h a q v v r v l g f f q c h s h p a q a f d d a m t q f g m
[0355]
s r h g l l q l f r r v g v t e l e a r s g t l p p a s q r w d r
[0356]
i l q a s g m k r a k p s p t s t q t p d q a s l h a f a d s l e
[0357]
r d l d a p s p m h e g d q t r a s(seq id no:393)
[0358]
如本文所用,n末端加帽区、包含重复tale单体的dna结合结构域和c末端加帽区的预定“n末端”至“c末端”方向为本发明的d

tale或多肽中的不同结构域的组织提供结构基础。
[0359]
整个n末端和/或c末端加帽区并非增强dna结合区的结合活性所必需的。因此,在某些实施方案中,n末端和/或c末端加帽区的片段包括在本文所述的tale多肽中。
[0360]
在某些实施方案中,本文所述的tale多肽含有n末端加帽区片段,其包括n末端加帽区的至少10、20、30、40、50、54、60、70、80、87、90、94、100、102、110、117、120、130、140、147、150、160、170、180、190、200、210、220、230、240、250、260或270个氨基酸。在某些实施方案中,n末端加帽区片段氨基酸位于n末端加帽区的c末端(dna结合区近端)。如zhang等人,nature biotechnology 29:149

153(2011)所述,包括c末端240个氨基酸的n末端加帽区片段增强了与全长加帽区相等的结合活性,而包括c末端147个氨基酸的片段保留了全长加帽区80%以上的功效,并且包括c末端117个氨基酸的片段保留了全长加帽区50%以上的活性。
[0361]
在一些实施方案中,本文所述的tale多肽含有c末端加帽区片段,其包括c末端加帽区的至少6、10、20、30、37、40、50、60、68、70、80、90、100、110、120、127、130、140、150、155、160、170、180个氨基酸。在某些实施方案中,c末端加帽区片段氨基酸位于c末端加帽区的n末端(dna结合区近端)。如zhang等人,nature biotechnology 29:149

153(2011)所述,包括c末端68个氨基酸的c末端加帽区片段增强了与全长加帽区相等的结合活性,而包括c末
端20个氨基酸的片段保留了全长加帽区50%以上的功效。
[0362]
在某些实施方案中,本文描述的tale多肽的加帽区不需要与本文提供的加帽区序列具有相同的序列。因此,在一些实施方案中,本文所述的tale多肽的加帽区具有与本文提供的加帽区氨基酸序列至少50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一或共享同一性的序列。序列同一性与序列同源性有关。同源性比较可通过肉眼进行,或者更通常的是借助现成的序列比较程序进行。这些可商购的计算机程序可计算两个或多个序列之间的同源性百分比(%),并且还可计算两个或更多个氨基酸或核酸序列共有的序列同一性。在一些优选的实施方案中,本文所述的tale多肽的加帽区具有与本文提供的加帽区氨基酸序列至少95%同一或共享同一性的序列。
[0363]
序列同源性可由本领域已知的多种计算机程序中的任一种产生,所述计算机程序包括但不限于blast或fasta。也可使用用于进行比对的合适的计算机程序,如gcg wisconsin bestfit软件包。一旦软件产生了最佳比对,就可以计算同源性%,优选序列同一性%。软件通常将此作为序列比较的一部分并生成数值结果。
[0364]
在本文所述的一些实施方案中,本发明的tale多肽包括与一个或多个效应结构域连接的核酸结合结构域。术语“效应结构域”或“调节和功能结构域”是指具有不同于与核酸结合结构域识别的核酸序列结合的活性的多肽序列。通过将核酸结合结构域与一个或多个效应结构域组合,本发明的多肽可用于将由效应结构域介导的一种或多种功能或活性靶向核酸结合结构域特异性结合的特定靶dna序列。
[0365]
在本文所述的tale多肽的一些实施方案中,由效应结构域介导的活性是生物活性。例如,在一些实施方案中,效应结构域是转录抑制剂(即阻遏结构域),例如msin相互作用结构域(sid)。sid4x结构域或kr
ü
ppel相关框(krab)或krab结构域的片段。在一些实施方案中,效应结构域是转录增强子(即激活结构域),例如vp16、vp64或p65激活结构域。在一些实施方案中,核酸结合例如与效应结构域连接,所述效应结构域包括但不限于转座酶、整合酶、重组酶、解离酶、转化酶、蛋白酶、dna甲基转移酶、dna脱甲基酶、组蛋白乙酰化酶、组蛋白脱乙酰酶、核酸酶、转录阻遏子、转录激活子、转录因子募集、蛋白质核定位信号或细胞摄取信号。
[0366]
在一些实施方案中,效应结构域是表现出活性的蛋白质结构域,所述活性包括但不限于转座酶活性、整合酶活性、重组酶活性、解离酶活性、转化酶活性、蛋白酶活性、dna甲基转移酶活性、dna脱甲基酶活性、组蛋白乙酰酶活性、组蛋白脱乙酰酶活性、核酸酶活性、核定位信号活性、转录阻遏子活性、转录激活子活性、转录因子募集活性或细胞摄取信号活性。本发明的其他优选实施方案可包括本文描述的活性的任何组合。
[0367]
锌指核酸酶
[0368]
在一些实施方案中,所述系统可包含锌指核酸酶、其功能片段或其变体。组合物可包含一种或多种锌指核酸酶或编码其的核酸。在一些情况下,核苷酸序列可包含锌指核酸酶的编码序列。在本发明的上下文中使用的用于基因组编辑的其他优选工具包括锌指系统和tale系统。一种可编程dna结合结构域是由人工锌指(zf)技术提供的,所述技术涉及zf模块阵列,以靶向基因组中的新dna结合位点。zf阵列中的每个锌指模块都靶向三个dna碱基。定制的单个锌指结构域阵列组装成zf蛋白(zfp)。
[0369]
zfp可包含功能结构域。第一合成锌指核酸酶(zfn)是通过将zf蛋白与iis型限制
id no:395)(ggggs)3(seq id no:396))或5、6、7、9或甚至12或更多的重复序列中使用ggs、gsg、gggs或ggggs(seq id no:373)接头,以提供合适的长度。在一些情况下,接头可以是(ggggs)3‑
15
,例如,在一些情况下,接头可以是(ggggs)3‑
11
,例如ggggs、(ggggs)2(seq id no:397)、(ggggs)3、(ggggs)4(seq id no:398)、(ggggs)5(seq id no:399)、(ggggs)6(seq id no:400)、(ggggs)7(seq id no:401)、(ggggs)8(seq id no:402)、(ggggs)9(seq id no:403)、(ggggs)
10
(seq id no:404)或(ggggs)
11
(seq id no:405)。
[0376]
在特定实施方案中,本文优选使用接头如(ggggs)3。(ggggs)6(ggggs)9或(ggggs)
12
(seq id no:406)可优选用作替代方案。其他优选的替代方案是(ggggs)1、(ggggs)2、(ggggs)4、(ggggs)5、(ggggs)7、(ggggs)8、(ggggs)
10
或(ggggs)
11
。在又一个实施方案中,lepgekpykcpecgksfsqsgaltrhqrthtr(seq id no:407)用作接头。在特定实施方案中,crispr

cas蛋白是cas蛋白并通过lepgekpykcpecgksfsqsgaltrhqrthtr(seq id no:408)接头与转座酶或其催化结构域连接。在其他特定实施方案中,cas蛋白通过lepgekpykcpecgksfsqsgaltrhqrthtr(seq id no:409)接头在c末端连接到转座酶或其催化结构域的n末端。此外,n末端和c末端nls还可用作接头(例如,pkkkrkveasspkkrkveas(seq id no:410))。
[0377]
在又一个额外的实施方案中,接头是xten接头。接头可包含一个或多个xten接头的重复序列,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个xten接头的重复序列。
[0378]
不同的转座酶可能需要不同大小的接头以与cas蛋白相缔合。例如,当与cas蛋白相缔合时,tsnb可能需要比tnsq更长的接头。
[0379]
接头的实例显示在下表3中。
[0380]
表3
[0381][0382]
载体系统
[0383]
本公开提供包含一种或多种载体的载体系统。载体可包含一种或多种编码本文cas相关转座酶系统中的组分的多核苷酸,或它们的组合。在一个特定实例中,本公开提供包含cas相关转座酶系统的所有组分或编码所述组分的多核苷酸的单一载体。载体可包含单个启动子。在其他实施方案中,所述系统可包含多个载体,每个载体包含cas相关转座酶系统的一种或一些组分或编码所述组分的多核苷酸。
[0384]
载体系统中的一种或多种多核苷酸可包含一种或多种可操作地配置为表达多肽和/或核酸组分的调控元件,任选地其中一种或多种调控元件包含诱导型启动子。编码cas多肽的多核苷酸分子经过密码子优化以在真核细胞中表达。
[0385]
编码cas和/或转座酶的多核苷酸可被突变以减少或防止翻译的早期或提前终止。在一些实施方案中,多核苷酸编码具有poly

u伸长段的rna(例如,在5'端)。此类多核苷酸可例如在编码poly

u伸长段的序列中发生突变,以减少或防止早期或提前终止。
[0386]
如前所述和如本文所用,“载体”是允许或促进实体从一个环境转移到另一个环境的工具。它是一种复制子,例如质粒、噬菌体或粘粒,可将另一个dna区段插入其中以引起插入区段的复制。通常,当与适当的控制元件相缔合时,载体能够复制。术语“载体”包括克隆和表达载体,以及病毒载体和整合载体。“表达载体”是包括一个或多个表达控制序列的载体,并且“表达控制序列”是控制和调控另一dna序列的转录和/或翻译的dna序列。合适的表达载体包括但不限于源自例如噬菌体、杆状病毒、烟草花叶病毒、疱疹病毒、巨细胞病毒、逆转录病毒、痘苗病毒、腺病毒和腺相关病毒的质粒和病毒载体。许多载体和表达系统可从例如novagen(madison,wi)、clontech(palo alto,ca)、stratagene(la jolla,ca)和invitrogen/life technologies(carlsbad,ca)的公司商购获得。例如,重组dna技术中使用的一些载体允许实体如dna区段(例如异源dna区段,例如异源cdna区段)转移到靶细胞中。本发明包括重组载体,其可包括病毒载体、细菌载体、原生动物载体、dna载体或其重组体。关于重组和克隆方法,提及美国专利申请10/815,730,其内容通过引用整体并入本文。
[0387]
载体可具有一个或多个限制性核酸内切酶识别位点(例如,i、ii或iis型),可以可确定的方式在该位点切割序列而不损失载体的基本生物学功能,并且核酸片段可在该位点剪接或插入以实现其复制和克隆。载体还可包含一个或多个重组位点,其允许在两个核酸分子之间交换核酸序列。载体还可提供引物位点,例如用于pcr、转录和/或翻译起始和/或调控位点、重组信号、复制子、可选择标志物等。载体还可含有一种或多种适用于鉴定用载体转化的细胞的可选择标志物。
[0388]
如前所述,能够在适当的宿主细胞(例如,原核细胞、真核细胞或哺乳动物细胞)中引导基因和/或与其可操作地连接的核酸序列的表达的载体在本文中被称为“表达载体”。如果需要翻译所需的核酸序列,则载体通常还可包含适当翻译核苷酸序列所需的序列。如本文所用的关于表达载体的术语“表达”是指核酸序列产物的生物合成,即核苷酸序列的转录和/或翻译。表达还指微rna或rnai分子的生物合成,其指不需要翻译成多肽序列的rnai剂如sirna、shrna和反义dna的表达和转录。
[0389]
一般来说,可包含本文所述的本发明多肽的产生方法和组合物中有用的表达载体通常呈“质粒”形式,其指环状双链dna环,其载体形式是不与染色体结合。在本文描述的方面的一些实施方案中,给定多肽的所有组分可在单个载体中编码。例如,在一些实施方案中,可构建含有或可包含如本文所述的功能性多肽所需的所有组分的载体。在一些实施方案中,个别组分(例如,一种或多种单体单元和一种或多种效应结构域)可在不同的载体中单独编码并单独引入一种或多种细胞中。此外,本文所述的任何载体本身可在任何位置或位置的组合(例如外源核酸分子的5'、3'或5'和3'两者)包含编码组分序列的预定cas和/或逆转录转座子多肽,例如效应结构域和/或其他多肽,其可包含一种或多种组分cas和/或逆转录转座子多肽编码序列以被克隆进入。此类表达载体在本文中被称为可包含“骨架序
列”。
[0390]
本发明的若干实施方案涉及载体,包括但不限于质粒、附加体、噬菌体或病毒载体,并且此类载体可整合到宿主细胞的基因组中或在所使用的特定细胞系统中自主复制。在本文描述的组合物和方法的一些实施方案中,所使用的载体是附加型载体,即能够进行染色体外复制的核酸并且可包括来自细菌、病毒或噬菌体的序列。本发明的其他实施方案涉及源自细菌质粒、噬菌体、酵母附加体、酵母染色体元件和病毒的载体,源自它们的组合的载体,例如源自质粒和噬菌体遗传元件、粘粒和噬菌粒的那些。在一些实施方案中,载体可以是质粒、噬菌体、细菌人工染色体(bac)或酵母人工染色体(yac)。载体可以是单链或双链dna、rna或噬菌体载体。
[0391]
病毒载体包括但不限于逆转录病毒载体,例如慢病毒载体或γ逆转录病毒载体、腺病毒载体和杆状病毒载体。例如,慢病毒载体可以慢病毒粒子的形式使用。也可以使用本领域技术人员已知的提供等效功能的其他形式的表达载体。表达载体可用于稳定或瞬时表达由被表达的核酸序列编码的多肽。载体可以是自我复制的染色体外载体或整合到宿主基因组中的载体。一种类型的载体是基因组整合载体或“整合载体”,其可整合到宿主细胞、细胞系统或非细胞系统的染色体dna或rna中。在一些实施方案中,编码本文所述的cas和/或逆转录转座子多肽的核酸序列与载体序列的组分一起整合到宿主细胞、细胞系统或非细胞系统的染色体dna或rna中。
[0392]
本文使用的重组表达载体包含适合于在宿主细胞中表达核酸的形式的cas和/或逆转录转座子核酸,这表明重组表达载体包括一个或多个基于用于表达的宿主细胞选择的调控序列,其与待表达的核酸序列可操作地连接。
[0393]
在本发明的有利实施方案中,可将本文所述的表达载体引入宿主细胞,从而产生由本文所述的核酸(例如,cas和/或逆转录转座子多肽,或其变体形式)编码的蛋白质或肽,包括融合蛋白或肽。
[0394]
在一些实施方案中,可包含编码本文所述的cas和/或转座酶的核酸的重组表达载体还包含5'utr序列和/或3'utr序列,从而向从表达载体转录的核酸序列提供额外的稳定性和翻译效率。
[0395]
本发明的某些实施方案可能涉及原核载体及其变体和衍生物的用途。本发明的其他实施方案可能涉及真核表达载体的使用。关于这些原核和真核载体,提及美国专利6,750,059,其内容通过引用整体并入本文。本发明的其他实施方案可能涉及病毒载体的使用,关于所述病毒载体,提及美国专利申请13/092,085,其内容通过引用整体并入本文。
[0396]
在本文所述方面的一些实施方案中,使用酵母表达载体表达cas和/或转座酶。用于在酵母酿酒酵母(s.cerivisae)中表达的载体的实例包括但不限于pyepsec1(baldari等人,(1987)embo j.6:229

234)、pmfa(kurjan和herskowitz,(1982)cell 30:933

943)、pjry88(schultz等人,(1987)gene 54:113

123)和pyes2(invitrogen corporation,san diego,ca)。
[0397]
在本发明的其他实施方案中,使用例如杆状病毒表达载体在昆虫细胞中表达cas和/或转座酶。可用于在培养的昆虫细胞(例如sf 9细胞)中表达蛋白质的杆状病毒载体包括但不限于pac系列(smith等人,(1983)mol.cell biol.3:2156

2165)和pvl系列(lucklow和summers(1989)virology 170:31

39)。
[0398]
在本文所述方面的一些实施方案中,使用哺乳动物表达载体在哺乳动物细胞中表达cas和/或转座酶。哺乳动物表达载体的非限制性实例包括pcdm8(seed,b.(1987)nature 329:840)和pmt2pc(kaufman等人,(1987)embo j.6:187

195)。当用于哺乳动物细胞中时,表达载体的控制功能通常由病毒调控元件提供。例如,常用的启动子源自多瘤病毒、腺病毒2、巨细胞病毒和猿猴病毒40。关于病毒调控元件,提及美国专利申请13/248,967,其内容通过引用整体并入本文。
[0399]
在一些此类实施方案中,哺乳动物表达载体能够引导编码cas和/或转座酶的核酸在特定细胞类型中的表达(例如,组织特异性调控元件用于表达核酸)。组织特异性调控元件是本领域已知的,并且在这方面,提及美国专利7,776,321,其内容通过引用整体并入本文。
[0400]
可包含编码本文所述的cas和/或转座酶的核酸序列的载体可通过本领域众所周知的用于将dna和rna引入细胞中的技术作为多核苷酸,优选dna“引入”细胞。术语“转导”是指将核酸序列引入细胞的任何方法,例如通过转染,脂质转染,电穿孔(其中使用仪器在细胞质膜中在放电下瞬时产生微尺寸孔的方法,参见例如banerjee等人,med.chem.42:4292

99(1999);godbey等人,gene ther.6:1380

88(1999);kichler等人,gene ther.5:855

60(1998);birchaa等人,j.pharm.183:195

207(1999)),生物弹射(biolistics),被动摄取,脂质:核酸复合物,病毒载体转导,注射,与裸dna接触,基因枪(其中核酸与惰性固体(通常是金)的纳米粒子偶联,然后将其直接“射入”靶细胞的细胞核),磷酸钙,deae葡聚糖,lipofectin,lipofectamine,dimrie c,superfect和effectin(qiagen),unifectin,maxifectin,,dotma,dogs(transfectam;双十八烷基酰胺甘氨精胺),dope(1,2

二油酰基

sn

甘油
‑3‑
磷酸乙醇胺),dotap(1,2

二油酰基
‑3‑
三甲基铵丙烷),ddab(二甲基双十八烷基溴化铵),dhdeab(n,n



正十六烷基

n,n

二羟乙基溴化铵),hdeab(n

正十六烷基

n,n

二羟乙基溴化铵),聚凝胺,聚(乙烯亚胺)(pei),声穿孔(经由对细胞施加声波力进行转染),光学转染(其中使用高度聚焦激光在细胞的质膜中瞬时产生一个微小(约1μm直径)孔的方法),磁转染(是指一种转染方法,其使用磁力将与磁性纳米粒子偶联的外源核酸递送到靶细胞中),穿刺转染(通过与外源核酸偶联的细长纳米结构如碳纳米纤维或硅纳米线穿刺细胞来进行)等。在这方面,提及美国专利申请13/088,009,其内容通过引用整体并入本文。
[0401]
可使用本领域技术人员已知的任何方法将编码cas和/或转座酶的核酸序列或可包含编码本文所述的cas和/或转座酶的核酸序列的载体引入细胞。如本文所用,术语“转化”是指将遗传物质(例如,可包含编码cas和/或转座酶的核酸序列的载体)引入细胞、组织或生物体中。细胞的转化可以是稳定的或瞬时的。术语“瞬时转化”或“瞬时转化”是指在转基因未整合到宿主细胞基因组中的情况下将一种或多种转基因引入细胞。瞬时转化可通过例如酶联免疫吸附测定(elisa)检测,其检测由一种或多种转基因编码的多肽的存在。例如,编码cas和/或转座酶的核酸序列可进一步包含与第二输出产物如报告蛋白可操作地连接的组成型启动子。该报告蛋白的表达表明细胞已用编码cas和/或转座酶的核酸序列转化或转染。或者,或组合地,可通过检测cas和/或转座酶的活性来检测瞬时转化。术语“瞬时转化体”是指瞬时并入一种或多种转基因的细胞。
[0402]
相反,术语“稳定转化”或“稳定转化的”是指将一种或多种转基因引入并整合到细
胞或细胞系统的基因组中,优选通过减数分裂导致染色体整合和稳定遗传力。细胞的稳定转化可通过细胞的基因组dna与能够结合一种或多种转基因的核酸序列的southern印迹杂交来检测。或者,也可通过细胞基因组dna的聚合酶链反应扩增转基因序列来检测细胞的稳定转化。术语“稳定转化体”是指已将一种或多种转基因稳定整合到基因组dna中的细胞。因此,稳定转化体与瞬时转化体的区别在于,来自稳定转化体的基因组dna含有一个或多个转基因,而来自瞬时转化体的基因组dna不含转基因。转化还包括将遗传物质以涉及外染色体复制和基因表达的植物病毒载体的形式引入植物细胞,这可能在减数分裂稳定性方面表现出可变的特性。转化的细胞、组织或植物被理解为不仅涵盖转化过程的最终产物,而且涵盖其转基因后代。
[0403]
对于哺乳动物细胞的稳定转染,众所周知,根据所使用的表达载体和转染技术,只有一小部分细胞可将外来dna整合到其基因组中。为了鉴定和选择这些整合体,通常将编码可选择生物标志物(例如抗生素抗性)的基因与目标基因一起引入宿主细胞。可选择标志物包括那些赋予药物抗性的标志物,例如g418、潮霉素和甲氨蝶呤。编码可选择生物标志物的核酸可在与编码cas和/或转座酶的载体相同的载体上引入宿主细胞中,或者可在单独的载体上引入。用所引入的核酸稳定转染的细胞可通过药物选择来鉴定(例如,已并入可选择的生物标志物基因的细胞存活,而其他细胞死亡)。关于转化,提及美国专利6,620,986,其内容通过引用整体并入本文。
[0404]
调控序列和启动子
[0405]
如本文所用,术语“调控序列”旨在包括启动子、增强子和其他表达控制元件(例如,5'和3'非翻译区(utr)和聚腺苷酸化信号)。关于调控序列,提及美国专利申请10/491,026,其内容通过引用整体并入本文。
[0406]
术语“启动子”、“启动子元件”或“启动子序列”是等同物,并且如本文所用是指当与目标核苷酸序列可操作地连接时能够控制目标核苷酸序列转录成mrna的dna序列。启动子可以是组成型的、诱导型的或可调控的。用于启动子的术语“组织特异性”是指在相同目标核苷酸序列在不同类型的组织中相对不存在表达的情况下能够将目标核苷酸序列选择性表达引导到特定类型组织的启动子。启动子的组织特异性可通过本领域已知的方法评价。应用于启动子的术语“细胞类型特异性”是指在相同目标核苷酸序列在同一组织内的不同类型的细胞中相对不存在表达的情况下能够引导目标核苷酸序列在特定类型细胞中选择性表达的启动子。当应用于启动子时,术语“细胞类型特异性”还指能够促进目标核苷酸序列在单个组织内的区域中选择性表达的启动子。可使用本领域众所周知的方法,例如gus活性染色或免疫组织化学染色,评估启动子的细胞类型特异性。如本文所用,术语“最小启动子”是指可包含启动子元件同时还保持功能性启动子的最小核酸序列。最小启动子可包括诱导型、组成型或组织特异性启动子。关于启动子,提及pct公开wo 2011/028929和美国申请12/511,940,其内容通过引用整体并入本文。
[0407]
在一些情况下,启动子可能适用于编码带有poly

u伸长段的rna分子的多核苷酸。这种启动子可减少由rna中的poly

u伸长段引起的早期终止。
[0408]
在一些情况下,启动子可以是组成型启动子,例如u6和h1启动子、逆转录病毒劳斯肉瘤病毒(rsv)ltr启动子、巨细胞病毒(cmv)启动子、sv40启动子、二氢叶酸还原酶启动子、β

肌动蛋白启动子、磷酸甘油激酶(pgk)启动子、泛素c、u5snrna、u7snrna、trna启动子或
ef1α启动子。在某些情况下,启动子可以是组织特异性启动子,并且可以主要在所需的目标组织如肌肉、神经元、骨骼、皮肤、血液、特定器官(例如肝脏、胰腺)或特定细胞类型(例如淋巴细胞)中直接表达。组织特异性启动子的实例包括ick、肌细胞生成素或thy1启动子。在一些实施方案中,启动子可以时间依赖性方式,例如以细胞周期依赖性或发育阶段依赖性方式引导表达,其也可以是或可以不是组织或细胞类型特异性的。在某些情况下,启动子可以是诱导型启动子,例如,可以被化学物质如强力霉素激活。
[0409]
在一些情况下,启动子可以是细胞特异性、组织特异性或器官特异性启动子。细胞特异性、组织特异性或器官特异性启动子的实例包括肌酸激酶启动子(用于在肌肉和心脏组织中表达)、免疫球蛋白重链或轻链启动子(用于在b细胞中表达)和平滑肌α

肌动蛋白启动子。示例性的肝脏组织特异性启动子包括hmg

coa还原酶启动子、甾醇调控元件1、磷酸烯醇丙酮酸羧基激酶(pepck)启动子、人类c反应蛋白(crp)启动子、人类葡萄糖激酶启动子、胆固醇7

α水解酶(cyp

7)启动子、β

半乳糖苷酶α

2,6唾液酸转移酶启动子、胰岛素样生长因子结合蛋白(igfbp

1)启动子、醛缩酶b启动子、人类转铁蛋白启动子和i型胶原启动子。示例性的前列腺组织特异性启动子包括前列腺酸性磷酸酶(pap)启动子、前列腺分泌蛋白94(psp 94)启动子、前列腺特异性抗原复合物启动子和人类腺激肽释放酶基因启动子(hgt

1)。胃组织的示例性组织特异性启动子包括h /k

atp酶α亚基启动子。示例性的胰腺组织特异性表达元件包括胰腺炎相关蛋白启动子(pap)、弹性蛋白酶1转录增强子、胰腺特异性淀粉酶和弹性蛋白酶增强子启动子以及胰腺胆固醇酯酶基因启动子。示例性的子宫内膜组织特异性启动子包括子宫珠蛋白启动子。示例性的肾上腺细胞的组织特异性启动子包括胆固醇侧链裂解(scc)启动子。示例性的一般神经系统的组织特异性启动子包括γ

γ烯醇化酶(神经元特异性烯醇化酶,nse)启动子。示例性的大脑组织特异性启动子包括神经丝重链(nf

h)启动子。示例性的淋巴细胞组织特异性启动子包括人类cgl

1/颗粒酶b启动子、末端脱氧转移酶(tdt)、λ5、vpreb和1ck(淋巴细胞特异性酪氨酸蛋白激酶p561ck)启动子、人类cd2启动子及其3'转录增强子,以及人类nk和t细胞特异性激活(nkg5)启动子。示例性的结肠组织特异性启动子包括pp60c

src酪氨酸激酶启动子、器官特异性新抗原(osn)启动子和结肠特异性抗原

p启动子。示例性的乳腺细胞的组织特异性启动子包括人类α

乳清蛋白启动子。示例性的肺组织特异性启动子包括囊性纤维化跨膜电导调节因子(cftr)基因启动子。
[0410]
细胞特异性、组织特异性或器官特异性启动子的实例还可包括用于在特定植物组织内表达条形码或其他转录物的那些(参见例如wo2001098480a2,“用于调控植物基因表达的启动子(promoters for regulation of plant gene expression)”)。此类启动子的实例包括凝集素(vodkin,prog.clinc.biol.res.,138:87

98(1983);和lindstrom等人,dev.genet.,11:160

167(1990)),玉米醇脱氢酶1(dennis等人,nucleic acids res.,12:3983

4000(1984)),玉米光收获复合物(becker,plant mol biol.,20(1):49

60(1992);和bansal等人,proc.natl.acad.sci.u.s.a.,89:3654

3658(1992)),玉米热休克蛋白(odell等人,nature(1985)313:810

812;和marrs等人,dev.genet.,14(1):27

41(1993)),小亚基rubp羧化酶(waksman等人,nucleic acids res.,15(17):7181(1987);和berry

lowe等人,j.mol.appl.genet.,1(6):483

498(1982)),ti质粒甘露碱合酶(ni等人,plant mol.biol.,30(1):77

96(1996)),ti质粒胭脂碱合酶(bevan,nucleic acids res.,11(2):
369

385(1983)),矮牵牛查尔酮异构酶(van tunen等人,embo j.,7:1257

1263(1988)),豆类富含甘氨酸的蛋白1(keller等人,genes dev.,3:1639

1646(1989)),截短的camv 35s(odell等人,nature(1985)313:810

812),马铃薯块茎储藏蛋白(patatin)(wenzler等人,plant mol.biol.,13:347

354(1989)),根细胞(yamamoto等人,nucleic acids res.,18:7449(1990)),玉米醇溶蛋白(reina等人,nucleic acids res.,18:6425(1990);kriz等人,mol.gen.genet.,207:90

98 1987;wandelt和feix,nucleic acids res.,17:2354(1989);langridge和feix,cell,34:1015

1022(1983);和reina等人,nucleic acids res.,18:7449(1990)),球蛋白

1(belanger等人,genetics,129:863

872(1991)),α

微管蛋白,cab(sullivan等人,mol.gen.genet.,215:431

440(1989)),磷酸烯醇式丙酮酸羧化酶(pepcase)(cushman等人,plant cell,1(7):715

25(1989)),r基因复合物相关启动子(chandler等人,plant cell,1:1175

1183(1989)),和查尔酮合酶启动子(franken等人,embo j.,10:2605

2612,1991))。组织特异性启动子的实例还包括在以下参考文献中描述的那些:yamamoto等人,plant j(1997)12(2):255

265;kawamata等人,plant cell physiol.(1997)38(7):792

803;hansen等人,mol.gen genet.(1997)254(3):337);russell等人,transgenic res.(1997)6(2):157

168;rinehart等人,plant physiol.(1996)112(3):1331;van camp等人,plant physiol.(1996)112(2):525

535;canevascini等人,plant physiol.(1996)112(2):513

524;yamamoto等人,plant cell pkysiol.(1994)35(5):773

778;lam,results probl.cell differ.(1994)20:181

196;orozco等人,plant mol.biol.(1993)23(6):1129

1138;matsuoka等人,proc natl.acad.sci.usa(1993)90(20):9586

9590;和guevara

garcia等人,plant j.(1993)4(3):495

505;玉米磷酸烯醇羧化酶(pepc)已由hudspeth和grula(plant molec biol 12:579

589(1989))描述;叶特异性启动子,例如以下中描述的那些:yamamoto等人,plant j.(1997)12(2):255

265;kwon等人,plant physiol.(1994)105:357

367;yamamoto等人,plant cell physiol.(1994)35(5):773

778;gotor等人,plant j.(1993)3:509

518;orozco等人,plant mol.biol.(1993)23(6):1129

1138;和matsuoka等人,proc.natl.acad.sci.usa(1993)90(20):9586

9590。
[0411]
核定位信号
[0412]
在一些实施方案中,本文的系统和组合物还包含一种或多种核定位信号(nls),其能够在细胞核中将组分例如cas和/或转座酶的积累驱动至所需量。
[0413]
在某些实施方案中,至少一种核定位信号(nls)附接至cas和/或转座酶或编码蛋白质的多核苷酸。在一些实施方案中,附接一个或多个c末端或n末端nls(因此编码cas和/或转座酶的核酸分子可包括编码nls,使得所表达的产物已附接或连接有nls)。在一个实施方案中,附接c末端nls用于在真核细胞例如人类细胞中的表达和核靶向。
[0414]
nls的非限制性实例包括源自以下的nls序列:sv40病毒大t抗原的nls,其具有氨基酸序列pkkkrkv(seq id no:417);来自核质蛋白的nls(例如具有序列krpaatkkagqakkk(seq id no:418)的核质蛋白二分nls);具有氨基酸序列paakrvkld(seq id no:419)或rqrrnelkrs(seq id no:420)的c

myc nls;具有序列nqssnfgpmkggnfggrssgpyggggqyfakprnqggy(seq id no:421)的hrnpa1 m9 nls;来自输入蛋白

α的ibb结构域的序列rmrizfknkgkdtaelrrrrvevsvelrkakkdeqilkrrnv(seq id no:422);肌瘤t蛋白的序列vsrkrprp
(seq id no:423)和ppkkared(seq id no:424);人类p53的序列pqpkkkpl(seq id no:425);小鼠c

abl iv的序列salikkkkkmap(seq id no:426);流感病毒ns1的序列drlrr(seq id no:427)和pkqkkrk(seq id no:428);肝炎病毒δ抗原的序列rklkkkikkl(seq id no:429);小鼠mx1蛋白的序列rekkkflkrr(seq id no:430);人类聚(adp

核糖)聚合酶的序列krkgdevdgvdevakkkskk(seq id no:431);以及类固醇激素受体(人类)糖皮质激素的序列rkclqagmnlearktkk(seq id no:432)。
[0415]
在一些实施方案中,nls是异源nls。例如,nls并非天然存在于其所附接的分子(例如,cas和/或转座酶)中。
[0416]
一般来说,核定位活性的强度可能源自靶向核酸的效应蛋白中nls的数量、使用的特定nls或这些因素的组合。核中积累的检测可通过任何合适的技术进行。例如,可检测标志物可与靶向核酸的蛋白质融合,使得细胞内的位置可以被可视化,例如与用于检测细胞核位置的手段(例如,对细胞核特异的染色剂如dapi)相组合。
[0417]
在一些实施方案中,本文所述的载体(例如,包含编码cas和/或转座酶的多核苷酸的那些)包含一个或多个核定位序列(nls),例如约或多于约1、2、3、4、5、6、7、8、9、10个或更多个nls。更特别地,载体包含一种或多种非天然存在于cas和/或转座酶中的nls。最特别地,nls存在于cas和/或转座酶序列的载体5'和/或3'中。在一些实施方案中,cas和/或转座酶在氨基末端处或附近包含约或多于约1、2、3、4、5、6、7、8、9、10个或更多个nls,在羧基末端处或附近包含约或多于约1、2、3、4、5、6、7、8、9、10或更多个nls,或这些的组合(例如,在氨基末端零个或至少一个或多个nls和在羧基末端零个或至少一个或多个nls)。当存在多于一个的nls时,每个nls可独立于其他进行选择,使得单个nls可存在于多于一个拷贝中和/或与一个或多个其他nls组合存在于一个或多个拷贝中。在一些实施方案中,当nls的最近氨基酸从n末端或c末端沿着多肽链在约1、2、3、4、5、10、15、20、25、30、40、50个或更多个氨基酸内时,nls被视为在n末端或c末端附近。
[0418]
在某些实施方案中,其他定位标签可融合到cas和/或转座酶,例如但不限于定位到细胞中的特定位点,例如细胞器,例如线粒体、质体、叶绿体、囊泡、高尔基体、(核或细胞)膜、核糖体、核仁、er、细胞骨架、液泡、中心体、核小体、颗粒、中心粒等。在某些示例实施方案中,一个或多个nls附接到cas蛋白、tnsb蛋白、tnsc蛋白、tniq蛋白或它们的组合。
[0419]
插入供体多核苷酸的方法
[0420]
本公开还提供将供体多核苷酸插入细胞中的靶核酸的方法,所述方法包括向所述细胞中引入:(a)一种或多种转座酶(例如,crispr相关转座酶)或其功能片段,(b)一种或多种核苷酸结合分子。所述一种或多种核苷酸结合分子可以是序列特异性的。
[0421]
在一个示例实施方案中,所述方法包括向细胞或细胞群体中引入(a)一种或多种crispr相关转座酶或其功能片段,(b)cas蛋白,(c)能够结合靶多核苷酸上的靶序列并被设计成与所述cas蛋白形成crispr

cas复合物的指导分子,以及(d)供体多核苷酸,其包含要引入的多核苷酸序列。
[0422]
可通过递送包含编码一种或多种组分的核酸序列的递送多核苷酸将组分(a)

(d)中的一者或多者引入细胞中。编码一种或多种组分的核酸序列可从与细胞中表达的调控序列可操作地连接的核酸表达。一种或多种组分可编码在相同的递送多核苷酸上、个别递送多核苷酸上、或其一些组合上。递送多核苷酸可以是载体。下面更详细地讨论示例载体和递
送组合物。
[0423]
或者,组分(a)

(d)可作为预先形成的核糖核蛋白(rnp)复合物递送至细胞或细胞群体。在某些示例实施方案中,组分(a)

(c)作为rnp递送并且组分(d)作为多核苷酸递送。用于递送rnp的合适的示例组合物在下面进一步详细讨论。
[0424]
在某些示例实施方案中,将上述cast系统递送至原核细胞。在某些示例实施方案中,细胞是真核细胞。真核细胞可以是哺乳动物细胞、非人灵长类动物的细胞或人类细胞。在某些示例实施方案中,细胞可以是植物细胞。
[0425]
在某些示例实施方案中,cast系统可体外递送至细胞或细胞群体。
[0426]
在某些示例实施方案中,cast系统可体内递送。
[0427]
插入可发生在从核酸分子上的cas结合位点起的位置。在一些实例中,插入可发生在cas结合位点的3'侧的位置,例如在cas结合位点的3'侧上至少1bp、至少5bp、至少10bp、至少15bp、至少20bp、至少35bp、至少40bp、至少45bp、至少50bp、至少55bp、至少60bp、至少65bp、至少70bp、至少75bp、至少80bp、至少85bp、至少90bp、至少95bp或至少100bp处。在一些实例中,插入可发生在cas结合位点的5'侧的位置,例如在cas结合位点的5'侧上至少1bp、至少5bp、至少10bp、至少15bp、至少20bp、至少35bp、至少40bp、至少45bp、至少50bp、至少55bp、至少60bp、至少65bp、至少70bp、至少75bp、至少80bp、至少85bp、至少90bp、至少95bp或至少100bp处。在一个特定实例中,插入可发生在cas结合位点的3'侧上65bp处。
[0428]
在一些情况下,供体多核苷酸经由共整合机制插入到靶多核苷酸。例如,供体多核苷酸和靶多核苷酸可被切刻和融合。融合供体多核苷酸和靶多核苷酸的重复物可由聚合酶产生。在某些情况下,供体多核苷酸经由剪切和粘贴机制插入到靶多核苷酸中。例如,供体多核苷酸可包含在核酸分子中并且可被切除并插入到核酸分子中的另一个位置。
[0429]
递送和施用
[0430]
常规的基于病毒和非病毒的基因转移方法可用于将核酸引入哺乳动物细胞或靶组织中。此类方法可用于向培养中或宿主生物体中的细胞施用编码核酸靶向系统组分的核酸。非病毒载体递送系统包含dna质粒,rna(例如本文所述的载体的转录物),裸核酸和与例如脂质体的递送媒介物复合的核酸。病毒载体传递系统包含dna和rna病毒,它们在递送至细胞后具有附加型或整合型基因组。关于基因治疗程序的综述,参见anderson,science 256:808

813(1992);nabel和felgner,tibtech 11:211

217(1993);mitani和caskey,tibtech 11:162

166(1993);dillon,tibtech 11:167

175(1993);miller,nature 357:455

460(1992);van brunt,biotechnology 6(10):1149

1154(1988);vigne,restorative neurology and neuroscience 8:35

36(1995);kremer和perricaudet,british medical bulletin 51(1):31

44(1995);haddada等人,current topics in microbiology and immunology,doerfler和(编)(1995);以及yu等人,gene therapy 1:13

26(1994)。
[0431]
rna递送
[0432]
在一些实施方案中,设想将rna和/或蛋白质直接引入宿主细胞。例如,crispr效应子可作为crispr效应子编码mrna与体外转录的指导rna一起递送。此类方法可减少确保crispr效应蛋白作用的时间,并进一步防止系统组分的长期表达。
[0433]
核酸的非病毒递送方法包括脂质转染、核转染、显微注射、生物弹射、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸dna、人工病毒体和试剂增强的dna摄取。
脂质转染描述于例如美国专利第5,049,386号、第4,946,787号;和第4,897,355号中并且脂质转染试剂在商业上出售(例如transfectam
tm
和lipofectin
tm
)。适用于多核苷酸的有效受体识别脂质转染的阳离子脂质和中性脂质包括felgner,wo 91/17424;wo 91/16024的那些。可递送至细胞(例如体外或离体施用)或靶组织(例如体内施用)。
[0434]
质粒递送涉及将指导rna克隆到表达crispr效应蛋白的质粒中,并在细胞培养物中转染dna。质粒骨架可商购获得并且不需要特殊的设备。它们具有模块化的优势,能够携带不同大小的crispr效应子编码序列(包括编码更大尺寸蛋白质的序列)以及选择标志物。同时,质粒的优点在于它们可确保瞬时但持续的表达。然而,质粒的递送并不是直接的,使得体内效率通常很低。持续表达也可能是不利的,因为它可增加脱靶编辑。另外,crispr效应蛋白的过量积累可能对细胞有毒。最后,质粒始终具有dsdna在宿主基因组中随机整合的风险,更特别是考虑到产生双链断裂(在靶和脱靶)的风险。脂质:核酸复合物(包括靶向脂质体,例如免疫脂质复合物)的制备是本领域技术人员众所周知的(参见例如crystal,science 270:404

410(1995);blaese等人,cancer gene ther.2:291

297(1995);behr等人,bioconjugate chem.5:382

389(1994);remy等人,bioconjugate chem.5:647

654(1994);gao等人,gene therapy 2:710

722(1995);ahmad等人,cancer res.52:4817

4820(1992);美国专利第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号和第4,946,787号)。这将在下面更详细地讨论。
[0435]
在特定实施方案中,使用基于rna的递送。在这些实施方案中,将crispr效应蛋白的mrna与体外转录的指导rna一起递送。liang等人描述了使用基于rna的递送进行有效的基因组编辑(protein cell.2015年5月;6(5):363

372)。
[0436]
rna递送:crispr酶,例如v型效应子、转座酶和/或任何本发明的rna,例如指导rna,也可以rna的形式递送。v型效应子和转座酶mrna可使用体外转录产生。例如,可使用含有以下元件的pcr盒合成v型效应子mrna:t7_启动子

kozak序列(gccacc)

v型效应子

来自β珠蛋白的3'utr

polya尾部(一串120个或更多个腺嘌呤)。所述盒可用于t7聚合酶的转录。也可使用来自含有t7_启动子

gg

指导rna序列的盒的体外转录来转录指导rna。
[0437]
为了增强表达并降低可能的毒性,可修饰crispr酶编码序列和/或指导rna以包括一个或多个修饰的核苷,例如使用伪u或5

甲基

c。
[0438]
mrna递送方法目前尤其适用于肝脏递送。
[0439]
许多关于rna递送的临床工作都集中在rnai或反义上,但这些系统可适用于递送rna以实施本发明。应相应地阅读以下对rnai等的参考。
[0440]
系统mrna和指导rna也可能分开递送。可在指导rna之前递送mrna,从而为待表达的crispr酶留出时间。系统mrna可在指导rna施用前1

12小时(优选约2

6小时)施用。
[0441]
或者,mrna和指导rna可一起施用。有利地,可在初始施用mrna 指导rna后1

12小时(优选约2

6小时)施用第二加强剂量的指导rna。
[0442]
实际上,rna递送是一种有用的体内递送方法。可使用脂质体或粒子将v型效应子和grna(以及例如hr修复模板)递送至细胞中。因此,crispr酶如v型效应子的递送和/或本发明rna的递送可以是rna形式并经由微囊泡、脂质体或粒子。例如,可将v型效应子mrna和grna包装到脂质体粒子中以在体内递送。脂质体转染试剂,例如来自life technologies的
lipofectamine和市场上的其他试剂,可有效地将rna分子递送至肝脏中。
[0443]
脂质体
[0444]
在一些实施方案中,本发明的rna分子以脂质体或lipofectin制剂等形式递送,并且可通过本领域技术人员众所周知的方法来制备。这类方法描述于例如美国专利第5,593,972号、第5,589,466号和第5,580,859号,所述专利通过引用并入本文。已经开发了专门针对增强和改善sirna进入哺乳动物细胞的递送的递送系统(参见例如shen等人,febs let.2003,539:111

114;xia等人,nat.biotech.2002,20:1006

1010;reich等人,mol.vision.2003,9:210

216;sorensen等人,j.mol.biol.2003,327:761

766;lewis等人,nat.gen.2002,32:107

108;以及simeoni等人,nar 2003,31,11:2717

2724),并且可应用于本发明。sirna最近已成功地用于抑制灵长类动物中的基因表达(参见例如tolentino等人,retina 24(4):660),其也可应用于本发明。
[0445]
粒子递送
[0446]
rna的递送方式还包括经由粒子(cho,s.,goldberg,m.,son,s.,xu,q.,yang,f.,mei,y.,bogatyrev,s.,langer,r.和anderson,d.,lipid

like nanoparticles for small interfering rna delivery to endothelial cells,advanced functional materials,19:3112

3118,2010)或外泌体(schroeder,a.,levins,c.,cortez,c.,langer,r.和anderson,d.,lipid

based nanotherapeutics for sirna delivery,journal of internal medicine,267:9

21,2010,pmid:20059641)递送rna。实际上,已显示外泌体在递送sirna中特别有用,它是与所述系统有些相似的系统。例如,el

andaloussi s等人,(“exosome

mediated delivery of sirna in vitro and in vivo.”nat protoc.2012年12月;7(12):2112

26.doi:10.1038/nprot.2012.131.电子出版于2012年11月15日)描述了外泌体如何成为有前途的工具用于跨不同生物屏障的药物递送,并且可用于体外和体内sirna的递送。他们的方法是通过转染包含与肽配体融合的外泌体蛋白的表达载体来生成靶向外泌体。然后将外泌体纯化并从转染的细胞上清液中表征,然后将rna装载到外泌体中。根据本发明的递送或施用可用外泌体进行,特别是但不限于大脑。维生素e(α

生育酚)可与crispr cas缀合并与高密度脂蛋白(hdl)一起递送至大脑,例如,采用与uno等人(human gene therapy 22:711

719(2011年6月))类似的方式,用于向大脑递送短干扰rna(sirna)。经由充满磷酸盐缓冲盐水(pbs)或游离tocsibace或toc

sibace/hdl并与脑输注试剂盒3(alzet)连接的osmotic微型泵(型号1007d;alzet,cupertino,ca)向小鼠输注。将脑输注套管放置在前囟后面约0.5mm的中线处,以输注到第三脑室背侧。uno等人发现,通过相同的icv输注方法,低至3nmol的含hdl的toc

sirna可以相当程度诱导靶标减少。在本发明中,对于人类,可考虑缀合至α

生育酚并与靶向脑的hdl共同施用的相似剂量的crispr cas,例如,可考虑约3nmol至约3μmol的靶向脑的crispr cas。zou等人((human gene therapy 22:465

475(2011年4月))描述了一种慢病毒介导的靶向pkcγ的短发夹rna的递送方法,以在大鼠的脊髓中进行体内基因沉默。zou等人通过鞘内导管施用了约10μl的重组慢病毒,滴度为1
×
109转导单位(tu)/ml。在本发明中,人类可考虑在靶向脑的慢病毒载体中表达的相似剂量的crispr cas,例如,可考虑在滴度为1
×
109转导单位(tu)/ml的慢病毒中约10

50ml的靶向脑的crispr cas。
[0447]
rna的递送方式还优选包括经由纳米粒子(cho,s.,goldberg,m.,son,s.,xu,q.,
yang,f.,mei,y.,bogatyrev,s.,langer,r.和anderson,d.,lipid

like nanoparticles for small interfering rna delivery to endothelial cells,advanced functional materials,19:3112

3118,2010)或外泌体(schroeder,a.,levins,c.,cortez,c.,langer,r.和anderson,d.,lipid

based nanotherapeutics for sirna delivery,journal of internal medicine,267:9

21,2010,pmid:20059641)递送rna。实际上,已显示外泌体在递送sirna中特别有用,它是与所述系统有些相似的系统。例如,el

andaloussi s等人,(“exosome

mediated delivery of sirna in vitro and in vivo.”nat protoc.2012年12月;7(12):2112

26.doi:10.1038/nprot.2012.131.电子出版于2012年11月15日)描述了外泌体如何成为有前途的工具用于跨不同生物屏障的药物递送,并且可用于体外和体内sirna的递送。他们的方法是通过转染包含与肽配体融合的外泌体蛋白的表达载体来生成靶向外泌体。然后将外泌体纯化并从转染的细胞上清液中表征,然后将rna装载到外泌体中。根据本发明的递送或施用可用外泌体进行,特别是但不限于大脑。维生素e(α

生育酚)可与crispr cas缀合并与高密度脂蛋白(hdl)一起递送至大脑,例如,采用与uno等人(human gene therapy22:711

719(2011年6月))类似的方式,用于向大脑递送短干扰rna(sirna)。经由充满磷酸盐缓冲盐水(pbs)或游离tocsibace或toc

sibace/hdl并与脑输注试剂盒3(alzet)连接的osmotic微型泵(型号1007d;alzet,cupertino,ca)向小鼠输注。将脑输注套管放置在前囟后面约0.5mm的中线处,以输注到第三脑室背侧。uno等人发现,通过相同的icv输注方法,低至3nmol的含hdl的toc

sirna可以相当程度诱导靶标减少。在本发明中,对于人类,可考虑缀合至α

生育酚并与靶向脑的hdl共同施用的相似剂量的crispr cas,例如,可考虑约3nmol至约3μmol的靶向脑的crispr cas。
[0448]
anderson等人(us 20170079916)提供了一种用于向受试者递送治疗剂、预防剂和/或诊断剂的改性树枝状聚合物纳米粒子,其包含:一种或多种零至七代烷基化树枝状聚合物;一种或多种两亲聚合物;以及包封在其中的一种或多种治疗剂、预防剂和/或诊断剂。一种烷基化树枝状聚合物可选自由聚(乙烯亚胺)、聚(聚丙烯亚胺)、二氨基丁烷胺、聚丙烯亚胺四胺和聚(酰氨基胺)组成的组。治疗剂、预防剂和诊断剂可选自由蛋白质、肽、碳水化合物、核酸、脂质、小分子及它们的组合组成的组。
[0449]
anderson等人(us 20160367686)提供了式(i)的化合物:
[0450][0451]
及其盐,其中r
l
的每个实例独立地为任选取代的c6

c40烯基,以及用于将药剂递送至受试者或细胞的组合物,所述组合物包含所述化合物或其盐;药剂;以及任选地赋形剂。所述药剂可以是有机分子、无机分子、核酸、蛋白质、肽、多核苷酸、靶向剂、同位素标记的化学化合物、疫苗、免疫剂或用于生物加工的剂。所述组合物还可包含胆固醇、聚乙二醇化脂质、磷脂或载脂蛋白。
[0452]
anderson等人(us20150232883)提供了递送粒子制剂和/或系统,优选纳米粒子递
送制剂和/或系统,其包含(a)crispr

cas系统rna多核苷酸序列;或(b)cas9;或(c)crispr

cas系统rna多核苷酸序列和cas9;或(d)一种或多种含有编码(a)、(b)或(c)的核酸分子的载体,其中crispr

cas系统rna多核苷酸序列和cas9不是一起天然存在的。递送粒子制剂还可包含表面活性剂、脂质或蛋白质,其中所述表面活性剂可包含阳离子脂质。
[0453]
anderson等人(us20050123596)提供了设计成当暴露于酸性条件时释放其有效载荷的微粒的实例,其中所述微粒包含至少一种待递送的药剂、ph触发剂和聚合物,其中所述聚合物选自聚甲基丙烯酸酯和聚丙烯酸酯的组。
[0454]
anderson等人(us 20020150626)提供了用于递送核酸的脂质

蛋白质

糖粒子,其中通过使多核苷酸与脂质、蛋白质和糖接触而将多核苷酸包封在脂质

蛋白质

糖基质中;以及喷雾干燥多核苷酸、脂质、蛋白质和糖的混合物以制造微粒。
[0455]
就局部递送至大脑而言,这可通过多种方式实现。例如,材料可经纹状体内递送,例如通过注射。可经由开颅手术立体定向地进行注射。
[0456]
提高nhej或hr效率也有助于递送。优选通过共表达例如trex2的末端加工酶来提高nhej效率(dumitrache等人genetics.2011年8月;188(4):787

797)。优选通过瞬时抑制例如ku70和ku86的nhej机器来提高hr效率。hr效率也可通过共表达原核或真核同源重组酶如recbcd、reca来提高。
[0457]
载体
[0458]
在某些方面,本发明涉及载体,例如用于在细胞中递送或引入cas和/或能够将cas引导至靶基因座的rna(即指导rna),而且也用于增殖这些组分(例如在原核细胞中)。如本文所用,“载体”是允许或促进实体从一个环境转移到另一个环境的工具。它是一种复制子,例如质粒、噬菌体或粘粒,可将另一个dna区段插入其中以引起插入区段的复制。通常,当与适当的控制元件相缔合时,载体能够复制。一般来说,术语“载体”是指能够转运与其连接的另一个核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离末端、无游离末端(例如环状)的核酸分子;包含dna、rna或两者的核酸分子;以及本领域已知的其他种类的多核苷酸。一种类型的载体是“质粒”,它是指环状双链dna环,其中可插入额外的dna区段,例如通过标准分子克隆技术。另一种类型的载体是病毒载体,其中病毒衍生的dna或rna序列存在于用于包装到病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒(aav))的载体中。病毒载体还包括病毒携带的用于转染到宿主细胞中的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。在引入宿主细胞中后,将其他载体(例如,非附加型哺乳动物载体)整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够引导与其可操作连接的基因的表达。此类载体在本文中称为“表达载体”。在重组dna技术中有用的常见表达载体通常是质粒的形式。在一些实施方案中,宿主细胞用本文所述的一种或多种载体瞬时或非瞬时转染。在一些实施方案中,当细胞天然存在于受试者中时,将细胞转染,任选地将其重新引入其中。在一些实施方案中,转染的细胞取自受试者。在一些实施方案中,细胞是源自取自受试者的细胞,例如细胞系。用于组织培养的广泛多种细胞系是本领域已知的。细胞系的实例包括但不限于c8161、ccrf

cem、molt、mimcd

3、nhdf、hela

s3、huh1、huh4、huh7、huvec、hasmc、hekn、heka、miapacell、panc1、pc

3、tf1、ctll

2、c1r、rat6、cv1、rpte、a10、t24、j82、a375、arh

77、calu1、sw480、
sw620、skov3、sk

ut、caco2、p388d1、sem

k2、wehi

231、hb56、tib55、jurkat、j45.01、lrmb、bcl

1、bc

3、ic21、dld2、raw264.7、nrk、nrk

52e、mrc5、mef、hep g2、hela b、hela t4、cos、cos

1、cos

6、cos

m6a、bs

c

1猴肾上皮、balb/3t3小鼠胚胎成纤维细胞、3t3swiss、3t3

l1、132

d5人胎儿成纤维细胞;10.1小鼠成纤维细胞、293

t、3t3、721、9l、a2780、a2780adr、a2780cis、a172、a20、a253、a431、a

549、alc、b16、b35、bcp

1细胞、beas

2b、bend.3、bhk

21、br 293、bxpc3、c3h

10t1/2、c6/36、cal

27、cho、cho

7、cho

ir、cho

k1、cho

k2、cho

t、cho dhfr

/

、cor

l23、cor

l23/cpr、cor

l23/5010、cor

l23/r23、cos

7、cov

434、cml t1、cmt、ct26、d17、dh82、du145、ducap、el4、em2、em3、emt6/ar1、emt6/ar10.0、fm3、h1299、h69、hb54、hb55、hca2、hek

293、hela、hepa1c1c7、hl

60、hmec、ht

29、jurkat、jy细胞、k562细胞、ku812、kcl22、kg1、kyo1、lncap、ma

mel 1

48、mc

38、mcf

7、mcf

10a、mda

mb

231、mda

mb

468、mda

mb

435、mdck ii、mdck ii、mor/0.2r、mono

mac 6、mtd

1a、myend、nci

h69/cpr、nci

h69/lx10、nci

h69/lx20、nci

h69/lx4、nih

3t3、nalm

1、nw

145、opcn/opct细胞系、peer、pnt

1a/pnt 2、renca、rin

5f、rma/rmas、saos

2细胞、sf

9、skbr3、t2、t

47d、t84、thp1细胞系、u373、u87、u937、vcap、vero细胞、wm39、wt

49、x63、yac

1、yar及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(参见例如美国典型培养物保藏中心(atcc)(manassus,va.))。在一些实施方案中,用一种或多种本文所述的载体转染的细胞用于建立包含一种或多种载体衍生序列的新细胞系。在一些实施方案中,用如本文所述的系统的组分瞬时转染(例如通过一种或多种载体的瞬时转染,或用rna转染)并通过crispr复合物的活性修饰的细胞用于建立包含含有修饰但缺乏任何其他外源序列的细胞的新细胞系。在一些实施方案中,用一种或多种本文所述的载体瞬时或非瞬时转染的细胞,或源自此类细胞的细胞系用于评估一种或多种测试化合物。
[0459]
使用基于rna或dna病毒的系统来递送核酸利用了高度进化的过程,用于将病毒靶向体内的特定细胞并将病毒有效载荷运输到细胞核。病毒载体可直接施用于患者(体内)或者它们可用于体外处理细胞,并且可任选地将修饰的细胞施用于患者(离体)。常规的基于病毒的系统可包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。逆转录病毒、慢病毒和腺相关病毒基因转移方法可整合到宿主基因组中,通常会导致所插入的转基因的长期表达。另外,在许多不同的细胞类型和靶组织中都观察到了高转导效率。
[0460]
重组表达载体可包含适合于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着重组表达载体包括一种或多种调控元件,其可基于用于表达的宿主细胞进行选择,即与待表达的核酸序列可操作地连接。在重组表达载体内,“可操作地连接”旨在表示目标核苷酸序列以允许核苷酸序列表达的方式(例如在体外转录/翻译系统中或当载体被引入宿主细胞时在宿主细胞中)连接到调控元件。关于重组和克隆方法,提及2004年9月2日作为us 2004

0171156 a1公开的美国专利申请10/815,730,其内容通过引用整体并入本文。因此,本文公开的实施方案还可包括包含crispr效应系统的转基因细胞。在某些示例实施方案中,转基因细胞可用作单独的离散体积。换句话说,可将包含掩蔽构建体的样品递送至细胞,例如在合适的递送囊泡中,并且如果靶标存在于递送囊泡中,则crispr效应子被激活并产生可检测信号。
[0461]
载体可包括调控元件,例如启动子。载体可包含cas编码序列,和/或单个指导rna
(例如sgrna)编码序列,但也可能包含至少3或8或16或32或48或50个指导rna(例如sgrna)编码序列,例如1

2、1

3、1

4 1

5、3

6、3

7、3

8、3

9、3

10、3

18、3

16、3

30、3

32、3

48、3

50个rna(例如sgrna)。在单个载体中,每个rna(例如sgrna)可有一个启动子,有利的是存在多达约16个rna;并且,当单个载体提供超过16个rna时,一个或多个启动子可驱动多于一个rna的表达,例如,当存在32个rna时,每个启动子可驱动两个rna的表达,并且当存在48个rna时,每个启动子可驱动三个rna的表达。通过简单的运算和完善的克隆方案以及本公开内容中的教导,本领域技术人员可容易地关于合适的示例性载体如aav和合适的启动子如u6启动子的rna实践本发明。例如,aav的包装限制是~4.7kb。单个u6

grna(加上用于克隆的限制性位点)的长度为361bp。因此,技术人员可容易地在单个载体中装配约12

16个,例如13个u6

grna盒。这可通过任何合适的方式组装,例如用于tale组装的金门策略(genome

engineering.org/taleffectors/)。技术人员还可使用串联指导策略将u6

grna的数量增加约1.5倍,例如从12

16,例如13,增加到约18

24,例如约19个u6

grna。因此,本领域技术人员可容易地在单个载体例如aav载体中达到大约18

24个,例如约19个启动子

rna,例如u6

grna。增加载体中启动子和rna数量的另一种方法是使用单个启动子(例如u6)来表达由可切割序列分隔的一系列rna。并且进一步增加载体中启动子

rna数量的方法是表达由编码序列或基因的内含子中的可切割序列隔开的一系列启动子

rna;并且,在这种情况下,使用聚合酶ii启动子是有利的,其可具有增加的表达并能够以组织特异性方式转录长rna。(参见例如nar.oxfordjournals.org/content/34/7/e53.short和nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在一个有利的实施方案中,aav可包装靶向多达约50个基因的u6串联grna。因此,根据本领域的知识和本公开内容的教导,技术人员可容易地制造和使用一种或多种载体,例如单个载体,其在控制下表达多个rna或指导物,或者可操作地或功能性地连接到一个或多个启动子—尤其是关于本文讨论的rna或指导物的数量,无需任何过度实验。
[0462]
载体递送,例如质粒、病毒递送:crispr酶,例如v

u5型效应子,和/或任何本发明的rna,例如指导rna,可使用任何合适的载体递送,例如质粒或病毒载体,例如腺相关病毒(aav)、慢病毒、腺病毒或其他病毒载体类型,或它们的组合。v

u5型效应子和一种或多种指导rna可包装到一种或多种载体中,例如质粒或病毒载体。在一些实施方案中,载体例如质粒或病毒载体通过例如肌内注射递送至目标组织,而其他时候递送是经由静脉内、透皮、鼻内、口腔、粘膜或其他递送方法。这种递送可经由单剂量或多剂量进行。本领域技术人员理解,本文中要递送的实际剂量可能因多种因素而有很大改变,所述因素例如载体选择、靶细胞、生物体或组织、待治疗受试者的一般状况、寻求转化/修饰的程度、施用途径、施用模式、寻求转化/修饰的类型等。
[0463]
在可用于本发明实践的载体中,利用逆转录病毒基因转移方法整合到细胞的宿主基因组中是可能的,通常导致插入的转基因的长期表达。在一个优选的实施方案中,逆转录病毒是慢病毒。另外,在许多不同的细胞类型和靶组织中都观察到了高转导效率。逆转录病毒的趋向性可通过并入外来包膜蛋白来改变,扩大靶细胞的潜在目标群体。逆转录病毒也可被工程化以允许插入的转基因的条件性表达,使得只有某些细胞类型被慢病毒感染。细胞类型特异性启动子可用于在特定细胞类型中靶向表达。慢病毒载体是逆转录病毒载体(因此慢病毒和逆转录病毒载体均可用于本发明的实践)。此外,慢病毒载体是优选的,因为
它们能够转导或感染非分裂细胞并且通常产生高病毒滴度。因此,逆转录病毒基因转移系统的选择可取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,其包装容量高达6

10kb的外来序列。最小的顺式作用ltr足以复制和包装载体,然后将其用于将所需核酸整合到靶细胞中以提供永久表达。可用于本发明实践的广泛使用的逆转录病毒载体包括基于鼠类白血病病毒(mulv)、长臂猿白血病病毒(galv)、猿猴免疫缺陷病毒(siv)、人免疫缺陷病毒(hiv)及它们的组合的载体(参见例如buchscher等人,(1992)j.virol.66:2731

2739;johann等人,(1992)j.virol.66:1635

1640;sommnerfelt等人,(1990)virol.176:58

59;wilson等人,(1998)j.virol.63:2374

2378;miller等人,(1991)j.virol.65:2220

2224;pct/us94/05700)。zou等人通过鞘内导管施用约10μl滴度为1x109转导单位(tu)/ml的重组慢病毒。这些种类的剂量可适用于或外推到本发明中逆转录病毒或慢病毒载体的使用。
[0464]
在优选瞬时表达的应用中,可使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有非常高的转导效率并且不需要细胞分裂。使用这样的载体,已经获得了高滴度和表达水平。该载体可在相对简单的系统中大量生产。腺相关病毒(“aav”)载体也可用于用靶核酸转导细胞,例如在核酸和肽的体外生产中,以及用于体内和离体基因治疗程序(参见例如west等人,virology 160:38

47(1987);美国专利第4,797,368号;wo 93/24641;kotin,human gene therapy 5:793

801(1994);muzyczka,j.clin.invest.94:1351(1994)。重组aav载体的构建描述于许多出版物中,包括美国专利第5,173,414号;tratschin等人,mol.cell.biol.5:3251

3260(1985);tratschin等人,mol.cell.biol.4:2072

2081(1984);hermonat和muzyczka,pnas 81:6466

6470(1984);以及samulski等人,j.virol.63:03822

3828(1989)。
[0465]
逆转录病毒的趋向性可通过并入外来包膜蛋白来改变,扩大靶细胞的潜在目标群体。慢病毒载体是能够转导或感染非分裂细胞并通常产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,其包装容量高达6

10kb的外来序列。最小的顺式作用ltr足以复制和包装载体,然后将其用于将治疗基因整合到靶细胞中以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠类白血病病毒(mulv)、长臂猿白血病病毒(galv)、猿猴免疫缺陷病毒(siv)、人免疫缺陷病毒(hiv)及它们的组合的载体(参见例如buchscher等人,j.virol.66:2731

2739(1992);johann等人,j.virol.66:1635

1640(1992);sommnerfelt等人,virol.176:58

59(1990);wilson等人,j.virol.63:2374

2378(1989);miller等人,j.virol.65:2220

2224(1991);pct/us94/05700)。
[0466]
crispr蛋白的载体包装
[0467]
将本发明的v型编码核酸分子(例如dna)包装到载体(例如病毒载体)中以在体内介导基因组修饰的方法包括:
[0468]
·
为实现nhej介导的基因敲除:
[0469]
·
单一病毒载体:
[0470]
·
含有两个或更多个表达盒的载体:
[0471]
·
启动子

v型效应子编码核酸分子

终止子
[0472]
·
启动子

grna1

终止子
[0473]
·
启动子

grna2

终止子
[0474]
·
启动子

grna(n)

终止子(达到载体大小限制)
[0475]
·
双病毒载体:
[0476]
·
含有一个用于驱动v型效应子表达的表达盒的载体1
[0477]
·
启动子

v型效应子编码核酸分子

终止子
[0478]
·
含有一个或多个用于驱动一种或多种指导rna表达的表达盒的载体2
[0479]
·
启动子

grna1

终止子
[0480]
·
启动子

grna(n)

终止子(达到载体大小限制)
[0481]
为介导同源性定向修复。
[0482]
·
除了上述单病毒载体和双病毒载体方法外,还可使用额外的载体来递送同源性定向修复模板。
[0483]
用于驱动v型效应子编码核酸分子表达的启动子可包括:aavitr可用作启动子:这有利于消除对额外启动子元件(其可占据载体空间)的需要。释放的额外空间可用于驱动额外元件(grna等)的表达。此外,itr活性相对较弱,因此可用于降低由于v型效应子过表达而导致的潜在毒性。对于泛在表达,可使用的启动子包括:cmv、cag、cbh、pgk、sv40、铁蛋白重链或轻链等。
[0484]
对于大脑或其他cns表达,可使用启动子:突触蛋白i用于所有神经元,camkiiα用于兴奋性神经元,gad67或gad65或vgat用于gaba能神经元等。
[0485]
对于肝脏表达,可使用白蛋白启动子。
[0486]
对于肺表达,可使用sp

b。
[0487]
对于内皮细胞,可使用icam。
[0488]
对于造血细胞,可使用ifnβ或cd45。
[0489]
对于成骨细胞,可使用og

2。
[0490]
用于驱动指导rna的启动子可包括:pol iii启动子,例如u6或h1;使用pol ii启动子和内含子盒来表达grna。
[0491]
鉴定适当的递送载体
[0492]
在一些实施方案中,系统的组分可以各种形式递送,例如dna/rna或rna/rna或蛋白质/rna的组合。例如,v

u5型效应子可作为dna编码多核苷酸或rna编码多核苷酸或作为蛋白质递送。指导物可作为编码dna的多核苷酸或rna递送。设想了所有可能的组合,包括混合形式的递送。
[0493]
在一些方面,本发明提供了包括将一种或多种多核苷酸,例如一种或多种如本文所述的载体、其一种或多种转录物和/或从其转录的一种或多种蛋白质递送至宿主细胞的方法。
[0494]
腺相关病毒(aav)
[0495]
v型效应子和一个或多个指导rna可使用腺相关病毒(aav)、慢病毒、腺病毒或其他质粒或病毒载体类型来递送,特别是使用来自例如以下的制剂和剂量:美国专利第8,454,972号(制剂,腺病毒的剂量),美国专利第8,404,658号(制剂,aav的剂量)和美国专利第5,846,946号(制剂,dna质粒的剂量)以及涉及慢病毒、aav和腺病毒的临床试验和关于所述临床试验的出版物。例如,对于aav,施用途径、制剂和剂量可如美国专利第8,454,972号中以
及涉及aav的临床试验中所述。对于腺病毒,施用途径、制剂和剂量可如美国专利第8,404,658号中以及涉及腺病毒的临床试验中所述。对于质粒递送,施用途径、制剂和剂量可如美国专利第5,846,946号中以及涉及质粒的临床研究中所述。剂量可基于或外推至平均70kg的个体(例如成年男性),并且可针对不同体重和物种的患者、受试者和哺乳动物进行调整。施用频率在医学或兽医学专业人员(例如医师、兽医)的能力范围内,这取决于通常的因素,包括年龄、性别、总体健康状况、患者或受试者的其他状况以及要解决的特定疾患或症状。可将病毒载体注射到目标组织中。对于细胞类型特异性基因组修饰,v型效应子的表达可由细胞类型特异性启动子驱动。例如,肝特异性表达可使用白蛋白启动子,并且神经元特异性表达(例如用于靶向cns病症)可使用突触蛋白i启动子。
[0496]
本发明提供了aav,其包含以下或基本上由以下组成:编码系统的外源核酸分子,例如,多个包含第一盒或由第一盒组成的盒,所述第一盒包含以下或基本上由以下组成:启动子,编码crispr相关(cas)蛋白(推定核酸酶或解旋酶蛋白)的核酸分子,例如,cas9和终止子,以及两个或更多个,有利地多达载体的包装尺寸限制,例如,总共五个盒(包括第一盒),所述盒包含以下或基本上由以下组成:启动子,编码指导rna(grna)的核酸分子和终止子(例如,每个盒示意性表示为启动子

grna1

终止子,启动子

grna2

终止子...启动子

grna(n)

终止子(其中n是可插入的载体的包装尺寸限制的上限的数目),或两个或更多个单独的raav,每个raav含有一个或多于一个系统的盒,例如,第一raav,其含有第一盒,所述第一盒包含以下或基本上由以下组成:启动子,编码cas的核酸分子,例如cas9和终止子,和第二raav,其含有多个(四个)盒,所述盒包含以下或基本上由以下组成:启动子,编码指导rna(grna)的核酸分子和终止子(例如,每个盒示意性表示为启动子

grna1

终止子,启动子

grna2

终止子...启动子

grna(n)

终止子(其中n是可插入的载体的包装尺寸限制的上限的数目)。由于raav是dna病毒,因此本文关于aav或raav的讨论中的核酸分子有利地是dna。在一些实施方案中,启动子有利地是人突触蛋白i启动子(hsyn)。在另一个实施方案中,多个grna表达盒连同cas9表达盒可在高容量腺病毒载体(hcadv)中递送,其中所有aav编码基因已被去除。参见例如schiwon等人,“one

vector system for multiplexed crispr/cas9 against hepatitis b virus cccdna utilizing high

capacity adenoviral vectors”mol ther nucleic acids.2018年9月7日;12:242

253;和ehrke

schulz等人,“crispr/cas9 delivery with one single adenoviral vector devoid of all viral genes”sci rep.2017;7:17113。将核酸递送至细胞的其他方法是本领域技术人员已知的。参见例如us20030087817,通过引用并入本文。
[0497]
在一些实施方案中,aav载体可包括促进转导或辅助逃避宿主免疫系统的额外序列信息编码序列。在一个实施方案中,crispr

cas9可使用包含用于转导星形胶质细胞的合成表面肽的aav载体递送至星形胶质细胞。参见例如kunze等人,“synthetic aav/crispr vectors for blocking hiv

1 expression in persistently infected astrocytes”glia.2018年2月;66(2):413

427。在另一个实施方案中,crispr

cas9可在衣壳工程化的aav,例如已被工程化以在aav表面上包括“化学柄”并与脂质复合以产生对宿主中的内源性中和抗体具有抗性的“隐形aav”的aav中递送。参见例如katrekar等人,“oligonucleotide conjugated multi

functional adeno

associated viruses”sci rep.2018;8:3589。
[0498]
还考虑通过双载体系统递送。在一个实施方案中,cas9和grna的表达盒可经由双
载体系统递送。此类系统可包括例如编码grna和n末端cas9的第一aav载体和含有c末端cas9的第二aav载体。参见例如moreno等人,“in situ gene therapy via aav

crispr

cas9

mediated targeted gene regulation”mol ther.2018年7月5日;26(7):1818

1827。在另一个实施方案中,cas9蛋白可被分成单独表达和通过各种方式在细胞中重新组合的两个部分,所述方式包括使用1)grna作为cas9组装的支架;2)雷帕霉素控制的fkbp/frb系统;3)光控磁铁系统;或4)蛋白内含肽(intein)。参见例如schmelas等人,“split cas9,not hairs

advancing the therapeutic index of crispr technology”biotechnol j.2018年9月;13(9):e1700432.doi:10.1002/biot.201700432.电子出版于2018年2月2日。
[0499]
在体内递送方面,aav优于其他病毒载体的原因有以下几个:低毒性(这可能是由于纯化方法不需要对可激活免疫反应的细胞粒子进行超速离心)以及由于它不会整合到宿主基因组中而导致插入诱变的可能性低。
[0500]
aav的包装限制为4.5或4.75kb。这意味着v型效应子以及启动子和转录终止子都必须适合同一个病毒载体。大于4.5或4.75kb的构建体将导致病毒产量显著降低。
[0501]
raav载体优选在昆虫细胞,例如在无血清悬浮培养中生长的草地贪夜蛾(spodoptera frugiperda)sf9昆虫细胞中产生。无血清昆虫细胞可购自商业供应商例如sigma aldrich(ex

cell 405)。
[0502]
对于aav,aav可以是aav1、aav2、aav5或它们的任何组合。可针对要靶向的细胞选择aav的aav;例如,可选择aav血清型1、2、5或杂合衣壳aav1、aav2、aav5或它们的任何组合用于靶向脑或神经元细胞;并且可选择aav4用于靶向心脏组织。aav8可用于递送至肝脏。本文的启动子和载体是单独优选的。关于这些细胞的某些aav血清型的列表(参见grimm,d.等人,j.virol.82:5887

5911(2008))如下:
[0503]
[0504]
慢病毒
[0505]
慢病毒是复杂的逆转录病毒,其能够在有丝分裂和有丝分裂后细胞中感染并表达其基因。最通常已知的慢病毒是人类免疫缺陷病毒(hiv),它使用其他病毒的包膜糖蛋白以靶向广泛多种细胞类型。
[0506]
慢病毒可如下制备。克隆pcases10(其包含慢病毒转移质粒骨架)后,在转染前一天将低传代率(p=5)的hek293ft在t

75烧瓶中在含10%胎牛血清且无抗生素的dmem中接种至50%汇合。20小时后,将培养基更换为optimem(无血清)培养基,并在4小时后进行转染。用10μg慢病毒转移质粒(pcases10)和以下包装质粒转染细胞:5μg pmd2.g(vsv

g假型)和7.5ug pspax2(gag/pol/rev/tat)。用阳离子脂质递送剂(50ul lipofectamine 2000和100ul plus试剂)在4ml optimem中进行转染。6小时后,将培养基更换为含10%胎牛血清的无抗生素dmem。这些方法在细胞培养期间使用血清,但是无血清方法是优选的。
[0507]
慢病毒可如下纯化。48小时后收获病毒上清液。首先清除上清液中的碎片,然后通过0.45um低蛋白结合(pvdf)过滤器进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀在4c下重悬于50ul dmem中过夜。然后将它们等分并立即冷冻在

80℃。
[0508]
在另一个实施方案中,还考虑了基于马传染性贫血病毒(eiav)的最小的非灵长类慢病毒载体,尤其是用于眼基因疗法(参见例如balagaan,j gene med 2006;8:275

285)。在另一个实施方案中,还考虑了即基于马传染性贫血病毒的慢病毒基因治疗载体,其表达血管抑制蛋白内皮抑素和血管抑素,其经由视网膜下注射递送以治疗年龄相关性黄斑变性的网状形式(参见例如binley等人,human gene therapy 23:980

991(2012年9月)),并且可对该载体进行修饰以用于本发明的系统。
[0509]
在另一个实施方案中,具有靶向hiv tat/rev共有的共同外显子的sirna、核仁定位的tar诱饵和抗ccr5特异性锤头状核酶的自灭活慢病毒载体(参见例如digiusto等人,(2010)sci transl med 2:36ra43)可用于/和或适于本发明的系统。可收集每千克患者体重最少2.5
×
106个cd34 细胞,并在含有2μmol/l

谷氨酰胺、干细胞因子(100ng/ml)、flt

3配体(flt

3l)(100ng/ml)和血小板生成素(10ng/ml)(cellgenix)的x

vivo 15培养基(lonza)中预刺激16至20小时,密度为2
×
106个细胞/毫升。可在包被有纤连蛋白(25mg/cm2)(retronectin,takara bio inc.)的75cm2组织培养瓶中以5的感染复数以慢病毒转导预刺激的细胞16至24小时。
[0510]
已在帕金森病(parkinson's disease)治疗中公开了慢病毒载体,参见例如美国专利公开第20120295960号以及美国专利第7303910号和第7351585号。也已经公开了用于治疗眼病的慢病毒载体,参见例如美国专利公开第20060281180号、第20090007284号、第us20110117189号;us20090017543;us20070054961;us20100317109。慢病毒载体也已公开用于递送至脑,参见例如美国专利公开第us20110293571号、第us20110293571号、第us20040013648号、第us20070025970号、第us20090111106号以及美国专利第us7259015号。
[0511]
其他病毒载体
[0512]
在另一个实施方案中,考虑了科卡尔水疱病毒(cocal vesiculovirus)包膜假型逆转录病毒载体粒子(参见例如转让给fred hutchinson cancer research center的美国专利公开第20120164118号)。科卡尔病毒属于水疱病毒属,并且是哺乳动物中的水疱性口
biotechnol.16:4);和wang等人(2013,cell.9;153(4):910

8);eickbush dg等人,integration of bombyx mori r2sequences into the 28s ribosomal rna genes of drosophila melanogaster,mol cell biol.2000年1月;20(1):213

23;mastroianni m等人,group ii intron

based gene targeting reactions in eukaryotes,plos one.2008年9月1日;3(9):e3121.doi:10.1371/journal.pone.0003121;thornton gb等人,microinjection of vesicular stomatitis virus ribonucleoprotein into animal cells yields infectious virus,biochem biophys res commun.1983年11月15日;116(3):1160

7;zuris ja等人,cationic lipid

mediated delivery of proteins enables efficient protein

based genome editing in vitro and in vivo,nat biotechnol.2015年1月;33(1):73

80.doi:10.1038/nbt.3081;weill co等人,a practical approach for intracellular protein delivery,cytotechnology.2008年1月;56(1):41

8.doi:10.1007/s10616

007

9102

3;marschall al等人,targeting antibodies to the cytoplasm,mabs.2011年1月

2月;3(1):3

16。
[0522]
免疫正交直系同源物
[0523]
在一些实施方案中,当需要在受试者中表达或施用本文系统的一种或多种组分(例如,转座酶、核苷酸结合分子)时,可通过向受试者依序表达或施用转座子复合物的组分的免疫正交直系同源物来降低组分的免疫原性。如本文所用,术语“免疫正交直系同源物”是指具有相似或基本相同的功能或活性,但与彼此产生的免疫反应不具有交叉反应性或具有低交叉反应性的直向同源蛋白。在一些实施方案中,此类直系同源物的依序表达或施用引发低的二次免疫反应或不引发二次免疫反应。免疫正交直系同源物可避免被抗体(例如,在表达或施用直系同源物之前宿主中存在的抗体)中和。表达直系同源物的细胞可避免被宿主的免疫系统(例如,被激活的ctl)清除。在一些实例中,来自不同物种的crispr酶直系同源物可以是免疫正交直系同源物。
[0524]
可通过分析一组候选直系同源物的序列、结构和/或免疫原性来鉴定免疫正交直系同源物。在一个示例方法中,一组免疫正交直系同源物可通过以下来鉴定:a)比较一组候选直系同源物(例如,来自不同物种的直系同源物)的序列以鉴定具有低序列相似性或不具有序列相似性的候选物子集;以及b)评估候选物子集成员之间的免疫重叠以鉴定不具有免疫重叠或具有低免疫重叠的候选物。在一些情况下,候选物之间的免疫重叠可通过确定候选直系同源物和宿主的mhc(例如mhc i型和/或mhc ii)之间的结合(例如亲和力)来评估。或者或另外,候选物之间的免疫重叠可通过确定候选直系同源物的b细胞表位来评估。在一个实例中,可使用moreno am等人,biorxiv,在线出版于2018年1月10日,doi:doi.org/10.1101/245985中描述的方法来鉴定免疫正交直系同源物。
[0525]
气雾剂递送
[0526]
接受肺病治疗的受试者可例如在自主呼吸的同时接受经肺支气管内递送的药学有效量的气雾化aav载体系统。因此,一般来说,气雾化递送优选用于aav递送。腺病毒或aav粒子可用于递送。各自可操作地连接到一个或多个调控序列的合适的基因构建体可被克隆到递送载体中。
[0527]
杂合病毒衣壳递送系统
[0528]
在一个方面,本发明提供了一种粒子递送系统,其包含杂合病毒衣壳蛋白或杂合
病毒外蛋白,其中所述杂合病毒衣壳或外蛋白包含附接至非衣壳蛋白或肽的至少一部分的病毒衣壳或外蛋白。病毒的遗传物质储存在称为衣壳的病毒结构内。某些病毒的衣壳被包裹在称为病毒包膜的膜中。病毒包膜由嵌入病毒蛋白(包括病毒糖蛋白)的脂质双层组成。如本文所用,“包膜蛋白”或“外蛋白”是指暴露于病毒粒子表面的并非衣壳蛋白的蛋白质。例如,包膜或外蛋白通常包含嵌入病毒包膜中的蛋白质。外部或包膜蛋白的非限制性实例包括但不限于hiv的gp41和gp120、血凝素、神经氨酸酶和流感病毒的m2蛋白。
[0529]
在递送系统的一个示例实施方案中,非衣壳蛋白或肽具有高达兆道尔顿的分子量,或具有在110至160kda、160至200kda、200至250kda、250至300kda、300至400kda或400至500kda的范围内的分子量,并且非衣壳蛋白或肽包含crispr蛋白。
[0530]
本技术提供了一种用于将效应蛋白和至少一种crispr指导rna递送至细胞的载体,所述载体包含与编码效应蛋白的多核苷酸序列可操作地连接的最小启动子和与编码至少一种指导rna的多核苷酸序列可操作地连接的第二最小启动子,其中包含最小启动子和多核苷酸序列的载体序列的长度小于4.4kb。在一个实施方案中,病毒是腺相关病毒(aav)或腺病毒。
[0531]
在一个相关方面,本发明提供了一种用于将效应蛋白和至少一种crispr指导rna递送至细胞的慢病毒载体,所述载体包含可操作地连接到编码v型效应子的多核苷酸序列的启动子和可操作地连接到编码至少一种指导rna的多核苷酸序列的第二启动子,其中所述多核苷酸序列呈相反方向。
[0532]
在一个实施方案中,病毒是慢病毒或鼠类白血病病毒(mumlv)。在一个实施方案中,病毒是腺病毒科(adenoviridae)或细小病毒科(parvoviridae)或逆转录病毒或弹状病毒科(rhabdoviridae)或具有糖蛋白蛋白(g蛋白)的包膜病毒。在一个实施方案中,病毒是vsv或狂犬病病毒。在一个实施方案中,衣壳或外蛋白包括具有vp1、vp2或vp3的衣壳蛋白。在一个实施方案中,衣壳蛋白是vp3,并且非衣壳蛋白插入或附接到vp3环3或环6。
[0533]
在一个实施方案中,病毒被递送到细胞内部。在一个实施方案中,衣壳或外蛋白和非衣壳蛋白可在递送到细胞中后解离。
[0534]
在一个实施方案中,衣壳或外蛋白通过接头附接至蛋白质。在一个实施方案中,接头包含氨基酸。在一个实施方案中,接头是化学接头。在一个实施方案中,接头是可切割的。在一个实施方案中,接头是可生物降解的。在一个实施方案中,接头包含(ggggs)1‑3、enlyfqg或二硫化物。
[0535]
在一个实施方案中,递送系统包含蛋白酶或编码被表达的蛋白酶的核酸分子,所述蛋白酶能够切割接头,由此可以切割接头。在本发明的一个实施方案中,蛋白酶与系统的粒子组分一起递送,例如包装、混合或被脂质和或衣壳包裹。粒子进入细胞由此伴随或随后有效载荷从粒子裂解和解离。在某些实施方案中,递送编码蛋白酶的可表达核酸,由此在粒子进入细胞时或进入细胞后,存在蛋白酶表达、接头裂解和有效载荷与衣壳的解离。在某些实施方案中,有效载荷的解离伴随病毒复制发生。在某些实施方案中,有效载荷的解离在不存在生产性病毒复制的情况下发生。
[0536]
在一个实施方案中,crispr蛋白的每个末端通过接头附接到衣壳或外蛋白。在一个实施方案中,非衣壳蛋白附接到衣壳或外蛋白的外部。在一个实施方案中,非衣壳蛋白附接到衣壳或外蛋白的内部。在一个实施方案中,衣壳或外蛋白和非衣壳蛋白是融合蛋白。在
一个实施方案中,非衣壳蛋白被衣壳或外蛋白包封。在一个实施方案中,非衣壳蛋白在形成衣壳或外层蛋白之前附接到衣壳蛋白的组分或外蛋白的组分。在一个实施方案中,蛋白质在形成衣壳或外蛋白之后附接到衣壳或外蛋白。
[0537]
在一些实施方案中,非衣壳蛋白或并非病毒外蛋白或病毒包膜的蛋白(有时在本文中简称为“非衣壳蛋白”),例如crispr蛋白或其部分,其上可具有一个或多个功能部分,例如用于靶向或定位的部分,例如nls或nes,或激活子或阻遏子。
[0538]
在系统的一个实施方案中,组分或其部分可包含标签。
[0539]
在一个方面,本发明提供了包含衣壳或外蛋白的病毒粒子,所述衣壳或外蛋白具有一种或多种杂合病毒衣壳或外蛋白,所述杂合病毒衣壳或外蛋白包含附接到非衣壳蛋白或crispr蛋白的至少一部分的病毒衣壳或外蛋白。
[0540]
在一个方面,本发明提供了一种体外递送方法,所述方法包括将系统与细胞、任选地真核细胞接触,由此将递送系统的成分递送到细胞中。
[0541]
在一个方面,本发明提供了一种体外的、探究或研究的递送方法,所述方法包括将系统与细胞、任选地真核细胞接触,由此将系统的成分递送到细胞中,从所述接触获得数据或结果,并传输所述数据或结果。
[0542]
在一个方面,本发明提供了来自体外递送方法的细胞或体外递送方法的细胞,其中所述方法包括将系统与细胞、任选地真核细胞接触,由此将系统的成分递送到细胞中,并且任选地从所述接触获得数据或结果,并传输所述数据或结果。
[0543]
在一个方面,本发明提供了来自体外递送方法的细胞或体外递送方法的细胞,其中所述方法包括将系统与细胞、任选地真核细胞接触,由此将系统的成分递送到细胞中,并且任选地从所述接触获得数据或结果,并传输所述数据或结果;并且其中与未与系统接触的细胞相比,细胞产物发生了改变,例如与如果没有接触本应是野生型细胞的细胞相比发生了改变。
[0544]
在一个实施方案中,细胞产物是非人类或动物的。
[0545]
在一个实施方案中,粒子递送系统包含吸附到脂质体或脂质粒子或纳米粒子上的病毒粒子。在一个实施方案中,病毒通过静电相互作用吸附到脂质体或脂质粒子或纳米粒子上,或者通过接头共价连接。溶解在醋酸钠缓冲液(ph 5.2)或纯h2o(ph 7)中的脂质粒子或纳米粒子(1mg/ml)带正电荷。大多数病毒的等电点在3.5

7的范围内。它们在醋酸钠缓冲液(ph 5.2)或纯h2o中具有带负电荷的表面。病毒与脂质体或合成脂质纳米粒子之间的静电相互作用是驱动吸附的最重要因素。通过改变脂质纳米粒子的电荷密度,例如将中性脂质包含在脂质纳米粒子中,可调节脂质纳米粒子与病毒之间的相互作用,从而调节组装。在一个实施方案中,脂质体包含阳离子脂质。
[0546]
在一个方面,所述系统可通过一种或多种杂合病毒衣壳蛋白与脂质粒子的组合递送,其中所述杂合病毒衣壳蛋白包含附接到非衣壳蛋白的至少一部分的病毒衣壳蛋白的至少一部分。
[0547]
在一个实施方案中,递送系统的病毒衣壳蛋白附接到脂质粒子的表面。当脂质粒子是双层,例如脂质体时,脂质粒子包含外部亲水表面和内部亲水表面。在一个实施方案中,病毒衣壳蛋白通过静电相互作用或疏水相互作用附接到脂质粒子的表面。
[0548]
在一个实施方案中,粒子递送系统的直径为50

1000nm,优选100

1000nm。
[0549]
在一个实施方案中,递送系统包含非衣壳蛋白或肽,其中所述非衣壳蛋白或肽具有高达兆道尔顿的分子量。在一个实施方案中,非衣壳蛋白或肽具有110至160kda、160至200kda、200至250kda、250至300kda、300至400kda或400至500kda的分子量。
[0550]
在一个实施方案中,递送系统包含非衣壳蛋白或肽,其中所述蛋白或肽包含crispr蛋白或肽。
[0551]
在一个实施方案中,杂合衣壳蛋白与野生型衣壳蛋白的重量比为1:10至1:1,例如1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9和1:10。
[0552]
在一个实施方案中,递送系统的病毒是腺病毒科或细小病毒科或弹状病毒科或具有糖蛋白蛋白的包膜病毒。在一个实施方案中,病毒是腺相关病毒(aav)或腺病毒或vsv或狂犬病病毒。在一个实施方案中,病毒是逆转录病毒或慢病毒。在一个实施方案中,病毒是鼠类白血病病毒(mumlv)。
[0553]
在一个实施方案中,递送系统的病毒衣壳蛋白包含vp1、vp2或vp3。
[0554]
在一个实施方案中,递送系统的病毒衣壳蛋白是vp3,并且非衣壳蛋白插入或拴系或连接到vp3环3或环6。
[0555]
在一种实施方案中,递送系统的病毒被递送至细胞内部。
[0556]
在一个实施方案中,病毒衣壳蛋白和非衣壳蛋白在递送到细胞中后能够解离。
[0557]
在递送系统的一个方面,病毒衣壳蛋白通过接头附接到非衣壳蛋白。在一个实施方案中,接头包含氨基酸。在一个实施方案中,接头是化学接头。在另一个实施方案中,接头是可切割的或可生物降解的。在一个实施方案中,接头包含(ggggs)1‑3、enlyfqg(seq id no:433)或二硫化物。
[0558]
在递送系统的一个实施方案中,非衣壳蛋白的每个末端通过接头部分附接到衣壳蛋白。
[0559]
在一个实施方案中,非衣壳蛋白附接到病毒衣壳蛋白的外部。如本文所用,“外部部分”在提及病毒衣壳蛋白时是指病毒衣壳蛋白在形成的病毒衣壳中时的外表面。
[0560]
在一个实施方案中,非衣壳蛋白附接到衣壳蛋白的内部或被包封在脂质粒子内。如本文所用,“内部部分”在提及病毒衣壳蛋白时是指病毒衣壳蛋白在形成的病毒衣壳中时的内表面。在一个实施方案中,病毒衣壳蛋白和非衣壳蛋白是融合蛋白。
[0561]
在一个实施方案中,融合蛋白附接到脂质粒子的表面。
[0562]
在一个实施方案中,非衣壳蛋白在衣壳形成之前附接到病毒衣壳蛋白。
[0563]
在一个实施方案中,非衣壳蛋白在衣壳形成之后附接到病毒衣壳蛋白。
[0564]
在一个实施方案中,非衣壳蛋白包含靶向部分。
[0565]
在一个实施方案中,靶向部分包含受体配体。
[0566]
在一个实施方案中,非衣壳蛋白包含标签。
[0567]
在一个实施方案中,非衣壳蛋白包含一个或多个异源核定位信号(nls)。
[0568]
在一个实施方案中,蛋白质或肽包含ii型crispr蛋白或v型crispr蛋白。
[0569]
在一个实施方案中,递送系统还包含指导rns,任选地与crispr蛋白复合。
[0570]
在一个实施方案中,递送系统包含蛋白酶或编码被表达的蛋白酶的核酸分子,由此蛋白酶切割接头。在某些实施方案中,在不存在生产性病毒复制的情况下存在蛋白酶表达、接头裂解和有效载荷与衣壳的解离。
[0571]
在一个方面,本发明提供了包含第一杂合病毒衣壳蛋白和第二杂合病毒衣壳蛋白的递送系统,其中第一杂合病毒衣壳蛋白包含附接到蛋白质的第一部分的病毒衣壳蛋白,并且其中第二杂合病毒衣壳蛋白包含附接到蛋白质的第二部分的病毒衣壳蛋白,其中所述蛋白质的第一部分和所述蛋白质的第二部分能够缔合形成功能性蛋白。
[0572]
在一个方面,本发明提供了一种包含第一杂合病毒衣壳蛋白和第二杂合病毒衣壳蛋白的递送系统,其中第一杂合病毒衣壳蛋白包含附接到crispr蛋白的第一部分的病毒衣壳蛋白,并且其中第二杂合病毒衣壳蛋白包含附接到crispr蛋白的第二部分的第二病毒衣壳蛋白,其中crispr蛋白的第一部分和crispr蛋白的第二部分能够缔合形成功能性crispr蛋白。
[0573]
在递送系统的一个实施方案中,第一杂合病毒衣壳蛋白和第二病毒衣壳蛋白在同一病毒粒子的表面上。
[0574]
在递送系统的一个实施方案中,第一杂合病毒衣壳蛋白位于第一病毒粒子的内部,并且第二杂合病毒衣壳蛋白位于第二病毒粒子的内部。
[0575]
在递送系统的一个实施方案中,蛋白质或crispr蛋白的第一部分与配体对的第一成员连接,并且蛋白质或crispr蛋白的第二部分与配体对的第二成员连接,其中在细胞中配体对的第一部分与配体对的第二部分结合。在一个实施方案中,配体对的第一部分与配体对的第二部分的结合是可诱导的。
[0576]
在递送系统的一个实施方案中,蛋白质或crispr蛋白的第一部分和蛋白质或crispr蛋白的第二部分中的任一者或两者包含一个或多个nls。
[0577]
在递送系统的一个实施方案中,蛋白质或crispr蛋白的第一部分和蛋白质或crispr蛋白的第二部分中的任一者或两者包含一个或多个核输出信号(nes)。
[0578]
在一个方面,本发明提供了用于非天然存在的或工程化的系统、组分、蛋白质或复合物的递送系统。递送系统包含与病毒结构组分和脂质组分相缔合的非天然存在或工程化的系统、组分、蛋白质或复合物。递送系统还可包含靶向分子,例如优先将递送系统引导至目标细胞类型或表达目标靶蛋白的细胞的靶向分子。靶向分子可与病毒组分或脂质组分缔合或附接。在某些实施方案中,病毒组分优先将递送系统引导至目标靶标。
[0579]
在某些实施方案中,病毒结构组分包含一种或多种包括完整衣壳的衣壳蛋白。在某些实施方案中,例如其中病毒衣壳包含不同蛋白质的多个拷贝,递送系统可提供一种或多种相同蛋白质或此类蛋白质的混合物。例如,aav包含3种衣壳蛋白vp1、vp2和vp3,因此本发明的递送系统可包含vp1中的一种或多种,和/或vp2中的一种或多种,和/或vp3中的一种或多种。因此,本发明适用于腺病毒科内的病毒,例如富at腺病毒属(atadenovirus),例如绵羊富at腺病毒d,禽腺病毒属(aviadenovirus),例如家禽腺病毒a,鱼腺病毒属(ichtadenovirus),例如鲟鱼腺病毒a,哺乳动物腺病毒属(mastadenovirus)(其包括腺病毒,例如所有人类腺病毒),例如人乳腺病毒c,和唾液腺病毒属(siadenovirus),例如青蛙唾液腺病毒a。因此,腺病毒科内的病毒被考虑在本发明范围内,本文讨论适用于其他科成员的腺病毒。可使用或选择靶标特异性aav衣壳变体。非限制性实例包括选择与慢性髓细胞性白血病细胞、人cd34pbpc细胞、乳腺癌细胞、肺细胞、心脏细胞、真皮成纤维细胞、黑色素瘤细胞、干细胞、胶质母细胞瘤细胞、冠状动脉内皮细胞和角质形成细胞结合的衣壳变体。参见例如buning等人,2015,current opinion in pharmacology 24,94

104。根据本文关
于腺病毒修饰的教导和本领域知识(参见例如美国专利9,410,129、7,344,872、7,256,036、6,911,199、6,740,525;matthews,“capsid

incorporation of antigens into adenovirus capsid proteins for a vaccine approach,”mol pharm,8(1):3

11(2011)),以及关于aav的修饰,技术人员可容易地获得具有大有效载荷蛋白或crispr蛋白的修饰腺病毒,尽管在此之前没有预料到可在腺病毒上提供如此大的蛋白质。并且对于与本文提及的腺病毒相关的病毒,以及与本文提及的与aav相关的病毒,本文关于修饰腺病毒和aav的教导可分别应用于那些病毒,而无需根据本公开内容和本领域知识进行过度实验。
[0580]
在本发明的一个实施方案中,递送系统包含吸附到脂质组分例如脂质体上的病毒蛋白或粒子。在某些实施方案中,系统、组分、蛋白质或复合物与病毒蛋白质或粒子相关。在某些实施方案中,系统、组分、蛋白质或复合物与脂质组分相缔合。在某些实施方案中,一个系统、组分、蛋白质或复合物与病毒蛋白质或粒子相缔合,而第二个系统、组分、蛋白质或复合物与脂质组分相缔合。如本文所用,相缔合包括但不限于连接到、附着至、吸附至、包裹于其中、包裹于其中或之内、相混合等。在某些实施方案中,病毒组分和脂质组分相混合,包括但不限于病毒组分溶解或插入脂质双层中。在某些实施方案中,病毒组分和脂质组分相缔合但分离,包括但不限于吸附或附着至脂质体的病毒蛋白或粒子。在进一步包含靶向分子的本发明实施方案中,靶向分子可与病毒组分、脂质组分或病毒组分和脂质组分相缔合。
[0581]
在另一方面,本发明提供了与腺相关病毒(aav)相缔合的非天然存在的或工程化的crispr蛋白,例如包含crispr蛋白作为利用或不利用接头融合至aav衣壳蛋白如vp1、vp2和/或vp3或与aav衣壳蛋白如vp1、vp2和/或vp3的融合物的aav;并且,为了简写目的,这种非天然存在的或工程化的crispr蛋白在本文被称为“aav

crispr蛋白”。更具体地说,修改本领域的知识,例如,rybniker等人,“incorporation of antigens into viral capsids augments immunogenicity of adeno

associated virus vector

based vaccines,”j virol.dec 2012;86(24):13800

13804;lux k等人,2005.green fluorescent protein

tagged adeno

associated virus particles allow the study of cytosolic and nuclear trafficking.j.virol.79:11776

11787;munch rc等人,2012.“displaying high

affinity ligands on adeno

associated viral vectors enables tumor cell

specific and safe gene transfer.”mol.ther.[印刷版之前的电子版]doi:10.1038/mt.2012.186;以及warrington kh,jr等人,2004.adeno

associated virus type 2 vp2 capsid protein is nonessential and can tolerate large peptide insertions at its n terminus.j.virol.78:6595

6609,每个都通过引用并入,可获得本发明的修饰的aav衣壳。本领域技术人员将理解,本文所述的修饰如果插入aav帽基因中则可导致vp1、vp2和/或vp3衣壳亚基中的修饰。或者,衣壳亚基可独立表达以仅对衣壳亚基中的一者或两者(vp1、vp2、vp3、vp1 vp2、vp1 vp3或vp2 vp3)进行修饰。可修饰帽基因以在所需位置表达非衣壳蛋白,有利地是大有效载荷蛋白,例如crispr蛋白。同样,这些可以是与蛋白质例如大有效载荷蛋白的融合物,例如以类似于现有技术融合的方式融合的crispr

蛋白质。参见例如美国专利公开20090215879;nance等人,“perspective on adeno

associated virus capsid modification for duchenne muscular dystrophy gene therapy,”hum gene ther.26(12):786

800(2015)和其中引用的文件,通过引用并入本文。技术人员根据本公开内容和本领域的知识可制造和使用如本文发明中的修饰的aav或aav衣壳,并且通过本公开
内容,人们现在知道大的有效载荷蛋白可与aav衣壳融合。申请人提供了aav衣壳

crispr蛋白(例如,cas、cas9、dcas9、cpf1、cas13a、cas13b)融合物,并且那些aav

衣壳crispr蛋白(例如,cas、cas9)融合物可以是含有编码或提供crispr

cas或系统或复合物rna指导物的核酸分子的重组aav,由此crispr蛋白(例如cas、cas9)融合物递送系统(例如,通过融合物,例如vp1、vp2、pr vp3融合物,并且指导rna由重组病毒的编码提供,由此在体内、在细胞中,系统由提供指导rna的重组体的核酸分子和提供crispr

酶或cas或cas9的病毒的外表面组装而成。例如复合物在本文可被称为“aav

crispr系统”或“aav

crispr

cas”或“aav

crispr复合物”或“aav

crispr

cas复合物”。因此,本发明也适用于依赖细小病毒属(dependoparvovirus)或细小病毒科(parvoviridae)的病毒,例如aav,或阿留申细小病毒属(amdoparvovirus)的病毒,例如肉食兽阿留申细小病毒1,禽细小病毒属(aveparvovirus)的病毒,例如鸡形目禽细小病毒1,博卡细小病毒属(bocaparvovirus)的病毒,例如有蹄动物博卡细小病毒1,copiparvovirus属的病毒,例如有蹄动物copiparvovirus 1,依赖细小病毒属的病毒,例如腺相关依赖细小病毒a,红细小病毒属(erythroparvovirus)的病毒,例如灵长类红细小病毒1,原细小病毒属(protoparvovirus)的病毒,例如啮齿动物原细小病毒1,四细小病毒属(tetraparvovirus)的病毒,例如灵长类四细小病毒1。因此,细小病毒科或依赖细小病毒属或细小病毒科内的任何其他上述属内的病毒考虑在本发明范围内,在本文中关于适用于此类其他病毒的aav进行讨论。
[0582]
在一个方面,本发明提供了一种包含crispr酶的非天然存在的或工程化的组合物,所述crispr酶是aav衣壳结构域(即腺相关病毒(aav)衣壳的vp1、vp2或vp3结构域)的一部分或与其栓系。在一些实施方案中,aav衣壳结构域的一部分或栓系至aav衣壳结构域包括与aav衣壳结构域相缔合。在一些实施方案中,crispr酶可与aav衣壳结构域融合。在一些实施方案中,融合可为融合到aav衣壳结构域的n末端。因此,在一些实施方案中,crispr酶的c末端与aav衣壳结构域的n末端融合。在一些实施方案中,nls和/或接头(例如glyser接头)可位于crispr酶的c末端与aav衣壳结构域的n末端之间。在一些实施方案中,融合可为融合到aav衣壳结构域的c末端。在一些实施方案中,这不是优选的,因为aav的vp1、vp2和vp3结构域是同一rna的替代剪接,因此c末端融合可能会影响所有三个结构域。在一些实施方案中,aav衣壳结构域是截短的。在一些实施方案中,一些或全部aav衣壳结构域被去除。在一些实施方案中,一些aav衣壳结构域被去除并替换为接头(例如glyser接头),通常使aav衣壳结构域的n末端和c末端保持完整,例如前2、5或10个氨基酸。以这种方式,vp3结构域的内部(非末端)部分可被接头代替。特别优选接头与crispr蛋白融合。可使用分支接头,其中crispr蛋白融合到分支之一的末端。这允许衣壳与crispr蛋白之间有一定程度的空间分离。以这种方式,crispr蛋白成为(或融合到)aav衣壳结构域的一部分。
[0583]
或者,crispr酶可在aav衣壳结构域内(即内部)同框融合。因此,在一些实施方案中,aav衣壳结构域再次优选地保留其n末端和c末端。在这种情况下,接头是优选的,在一些实施方案中,在crispr酶的一端或两端。以这种方式,crispr酶再次成为aav衣壳结构域的一部分(或融合到aav衣壳结构域)。在某些实施方案中,crispr酶的定位使得crispr酶一旦形成就位于病毒衣壳的外表面。在一个方面,本发明提供了一种非天然存在的或工程化的组合物,其包含与腺相关病毒(aav)衣壳的aav衣壳结构域相关的crispr酶。在这里,缔合在一些实施方案中可能是指融合,或在一些实施方案中可能是指结合,或在一些实施方案中
是指栓系。在一些实施方案中,crispr蛋白可能与vp1、vp2或vp3结构域栓系。这可能是经由连接蛋白或栓系系统如生物素

链霉亲和素系统。在一个实例中,生物素化序列(15个氨基酸)因此可与crispr蛋白融合。当还提供aav衣壳结构域、尤其是aav aav衣壳结构域的n末端与链霉亲和素的融合物时,两者将因此以非常高的亲和力缔合。因此,在一些实施方案中,提供了包含crispr蛋白

生物素融合物和链霉亲和素

aav衣壳结构域排列(例如融合物)的组合物或系统。crispr蛋白

生物素和链霉亲和素

aav衣壳结构域将两部分放在一起时形成单一复合物。nls也可并入crispr蛋白与生物素之间;和/或链霉亲和素与aav衣壳结构域之间。
[0584]
另一种栓系可以是将aav衣壳结构域与衔接蛋白融合或以其他方式缔合,所述衔接蛋白结合或识别相应的rna序列或基序。在一些实施方案中,衔接子是或包含结合蛋白,该结合蛋白识别并结合(或被结合)对所述结合蛋白具有特异性的rna序列。在一些实施方案中,优选的实例是ms2(参见konermann等人,2014年12月,在下文中引用,通过引用并入本文)结合蛋白,其识别并结合(或被结合)对ms2蛋白具有特异性的rna序列。
[0585]
利用与衔接蛋白相缔合的aav衣壳结构域,crispr蛋白在一些实施方案中可栓系到aav衣壳结构域的衔接蛋白。在一些实施方案中,crispr蛋白可经由与修饰的指导物复合的crispr酶栓系到aav衣壳结构域的衔接蛋白,参见konermann等人。在一些实施方案中,修饰的指导物是sgrna。在一些实施方案中,修饰的指导物包含不同的rna序列;参见例如pct/us14/70175,通过引用并入本文。
[0586]
在一些实施方案中,不同的rna序列是适体。因此,优选相应的适体

衔接蛋白系统。一个或多个功能结构域也可与衔接蛋白相缔合。优选排列的一个实例是:
[0587]
[aav aav衣壳结构域

衔接蛋白]

[修饰的指导物

crispr蛋白]
[0588]
在某些实施方案中,crispr蛋白的定位使得crispr蛋白一旦形成就位于病毒衣壳的内表面。在一个方面,本发明提供了一种非天然存在的或工程化的组合物,其包含与aav衣壳结构域的内表面相缔合的crispr蛋白。此外,这里,缔合在一些实施方案中可以是指融合,或者在一些实施方案中是指结合,或者在一些实施方案中是指栓系。在一些实施方案中,crispr蛋白可被栓系到vp1、vp2或vp3结构域上,使得它一旦形成就位于病毒衣壳的内表面。这可经由连接蛋白或栓系系统,例如如上所述的生物素

链霉亲和素系统。
[0589]
当crispr蛋白融合物被设计为一旦形成就将crispr蛋白定位在衣壳的内表面,crispr蛋白将填充衣壳的大部分或全部内部体积。或者,crispr蛋白可被修饰或分割以占据较少的衣壳内部体积。因此,在某些实施方案中,本发明提供了分为两部分的crispr蛋白,一部分包含在一个病毒粒子或衣壳中,而第二部分包含在第二病毒粒子或衣壳中。在某些实施方案中,通过将crispr蛋白分成两部分,使空间可用于将一个或多个异源结构域连接到一个或两个crispr蛋白部分。
[0590]
分裂crispr蛋白在本文中以及在通过引用并入本文的文件中进一步详细阐述。在某些实施方案中,分裂crispr蛋白的每个部分都附接到特定结合对的成员,并且当彼此结合时,特定结合对的成员将crispr蛋白的部分保持在附近。在某些实施方案中,分裂crispr蛋白的每个部分都与诱导型结合对相缔合。诱导型结合对是一种能够被结合到诱导型结合对的两个成员的蛋白质或小分子“开启”或“关闭”的结合对。通常,根据本发明,crispr蛋白质可优选地在结构域之间分裂,使结构域保持完整。此类crispr蛋白的优选非限制性实例
包括但不限于cas9、cpf1、c2c2、cas13a、cas13b和直系同源物。分裂点的优选的非限制性的实例包括,参考spcas9:202a/203s之间的分裂位置;255f/256d之间的分裂位置;310e/311i之间的分裂位置;534r/535k之间的分裂位置;572e/573c之间的分裂位置;713s/714g之间的分裂位置;1003l/104e之间的分裂位置;1054g/1055e之间的分裂位置;1114n/1115s之间的分裂位置;1152k/1153s之间的分裂位置;1245k/1246g之间的分裂位置;或1098与1099之间的分裂。
[0591]
在一些实施方案中,任何aav血清型都是优选的。在一些实施方案中,与crispr酶缔合的vp2结构域是aav血清2型vp2结构域。在一些实施方案中,与crispr酶缔合的vp2结构域是aav血清8型vp2结构域。血清型可以是本领域已知的混合血清型。
[0592]
crispr酶可形成crispr

cas系统的一部分,其还包含指导rna(sgrna),所述指导rna(sgrna)包含能够与细胞中目标基因组基因座中的靶序列杂交的指导序列。在一些实施方案中,功能性crispr

cas系统结合于靶序列。在一些实施方案中,功能性crispr

cas系统可编辑基因组基因座以改变基因表达。在一些实施方案中,功能性crispr

cas系统可包含更多的功能结构域。
[0593]
在一些实施方案中,crispr酶是cpf1。在一些实施方案中,crispr酶是fncpf1。在一些实施方案中,crispr酶是ascpf1,但也设想了其他直系同源物。在一些实施方案中,fncpf1和ascpf1是特别优选的。
[0594]
在一些实施方案中,crispr酶位于衣壳或病毒粒子的外部。从某种意义上说,它不在衣壳内部(被衣壳包裹或包围),而是暴露在外部,以便它可接触靶基因组dna)。在一些实施方案中,crispr酶切割dna的两条链以产生双链断裂(dsb)。在一些实施方案中,crispr酶是一种切口酶。在一些实施方案中,crispr酶是一种双重切口酶。在一些实施方案中,crispr酶是一种死cpf1。在一些一般实施方案中,crispr酶与一个或多个功能结构域相缔合。在一些更具体的实施方案中,crispr酶是死cpf1并且与一个或多个功能结构域相缔合。在一些实施方案中,crispr酶包含rec2或hd2截短。在一些实施方案中,crispr酶通过融合蛋白与aav vp2结构域相缔合。在一些实施方案中,crispr酶与去稳定结构域(dd)融合。换句话说,dd可通过与所述crispr酶融合而与crispr酶相缔合。然后aav可通过核酸分子递送稳定化配体(或者这样可以其他方式递送)。在一些实施方案中,所述酶可被认为是修饰的crispr酶,其中crispr酶与至少一个去稳定结构域(dd)和vp2融合。在一些实施方案中,缔合可被认为是对vp2结构域的修饰。当本文提及修饰的vp2结构域时,则这将被理解为包括本文讨论的vp2结构域和crispr酶的任何缔合。在一些实施方案中,aav vp2结构域可经由连接蛋白与crispr酶相缔合(或拴系),例如使用诸如链霉亲和素

生物素系统的系统。因此,提供了crispr酶与对该连接子的高亲和力配体特异的连接蛋白的融合物,而aav vp2结构域与所述高亲和力配体结合。例如,链霉亲和素可能是与crispr酶融合的连接子,而生物素可能与aav vp2结构域结合。共定位后,链霉亲和素将与生物素结合,从而将crispr酶连接到aav vp2结构域。相反的排列也是可能的。在一些实施方案中,生物素化序列(15个氨基酸)因此可融合到aav vp2结构域,尤其是aav vp2结构域的n末端。在一些实施方案中,crispr酶与链霉亲和素的融合物也是优选的。在一些实施方案中,具有链霉亲和素

crispr酶的生物素化aav衣壳在体外组装。这样,aav衣壳应以简单的方式组装,并且可在衣壳组装后添加crispr酶

链霉亲和素融合物。在其他实施方案中,生物素化序列(15个氨基酸)因此
可与crispr酶融合,连同aav vp2结构域、尤其是aav vp2结构域的n末端与链霉亲和素的融合物。为简单起见,在一些实施方案中优选crispr酶和aav vp2结构域的融合物。在一些实施方案中,融合可能是融合到crispr酶的n末端。换句话说,在一些实施方案中,aav和crispr酶是经由融合缔合的。在一些实施方案中,aav和crispr酶经由包括接头在内的融合物结合。合适的接头在本文中讨论,但包括gly ser接头。在一些实施方案中,与aav vp2结构域的n末端融合是优选的。在一些实施方案中,crispr酶包含至少一种核定位信号(nls)。在一个方面,本发明提供了编码本crispr酶和相缔合的aav vp2结构域的多核苷酸。
[0595]
在此提供病毒递送载体,例如修饰的病毒递送载体。虽然aav可以有利地是用于提供系统的rna的媒介物,但另一种载体也可递送该rna,并且本文还讨论了这样的其他载体。在一个方面,本发明提供了具有vp2

crispr酶衣壳蛋白的非天然存在的修饰aav,其中crispr酶是vp2结构域的一部分或栓系到vp2结构域。在一些优选的实施方案中,crispr酶与vp2结构域融合,从而在另一方面,本发明提供具有vp2

crispr酶融合衣壳蛋白的非天然存在的修饰aav。除非另外明显,以下实施方案同样适用于任一修饰的aav方面。因此,本文提及的vp2

crispr酶衣壳蛋白还可包括vp2

crispr酶融合衣壳蛋白。在一些实施方案中,vp2

crispr酶衣壳蛋白还包含接头。在一些实施方案中,vp2

crispr酶衣壳蛋白还包含一个接头,从而使vp2

crispr酶与aav的其余部分保持距离。在一些实施方案中,vp2

crispr酶衣壳蛋白还包含至少一种蛋白质复合物,例如crispr复合物,例如靶向特定dna、tale等的crispr

cpf1复合物指导rna。在一个方面,还提供了一种crispr复合物,例如包含vp2

crispr酶衣壳蛋白和至少一种crispr复合物、例如靶向特定dna的crispr

cpf1复合物指导rna的crispr

cas系统。一般来说,在一些实施方案中,aav还包含修复模板。应当理解,包含在此可以是指涵盖在病毒衣壳内或病毒编码所包含的蛋白质。在一些实施方案中,aav载体内可包含/包括一个或多个、优选两个或更多个指导rna。在一些实施方案中,两个可能是优选的,因为它允许多重或双重切口酶方法。特别是对于多重化,可使用两个或更多个指导物。事实上,在一些实施方案中,aav中可包含/包括三个或更多个、四个或更多个、五个或更多个、或甚至六个或更多个指导rna。由于aav不再需要包含/包括crispr酶,因此在aav内释放了更多空间。在这些实例中的每一个中,修复模板也可包含/包括在aav内。在一些实施方案中,修复模板对应于dna靶标或包括dna靶标。
[0596]
在另一方面,本发明提供了包含crispr酶和相缔合的aav vp2结构域或本文所述的多核苷酸或载体的组合物。
[0597]
还提供了一种治疗有需要的受试者的方法,所述方法包括通过用编码系统或任何本发明载体的多核苷酸转化受试者来诱导基因编辑。还可提供合适的修复模板,例如由包括所述修复模板的载体递送。在一些实施方案中,单个载体通过(与病毒衣壳缔合)和以下中的至少一者来提供crispr酶:指导rna;和/或修复模板。还提供了一种治疗有需要的受试者的方法,所述方法包括通过用编码本发明或任何本发明载体的多核苷酸转化受试者来诱导转录激活或阻遏,其中所述多核苷酸或载体编码或包含无催化活性的crispr酶和一个或多个相缔合的功能结构域。还提供了用于所述治疗方法的包含本发明系统的组合物。可提供包括这样的组合物的多组分试剂盒(kit of parts)。还提供了本发明系统在制造用于此类治疗方法的药物中的用途。
[0598]
还提供了包含crispr酶的药物组合物,所述crispr酶是以下物质的一部分或栓系
至以下物质:腺相关病毒(aav)衣壳的vp2结构域;或非天然存在的修饰aav;或编码它们的多核苷酸。
[0599]
还提供了crispr酶与指导rna(例如sgrna)的复合物。所述复合物还可包括靶dna。
[0600]
可使用分裂crispr酶方法。所谓的

分裂cpf1’方法分裂cas允许以下。cas1被分裂成两部分,并且这些部分中的每个都融合到二聚体的一半。二聚化后,cas的两部分结合在一起,并且重建的cas已被证明是功能性的。因此,分裂cas的一部分可与一个vp2结构域相缔合,并且分裂cas的第二部分可与另一个vp2结构域相缔合。两个vp2结构域可在相同或不同的衣壳中。换句话说,cpf1的分裂部分可能在同一个病毒粒子上或者在不同的病毒粒子上。
[0601]
在一些实施方案中,一个或多个功能结构域可与crispr酶相缔合或栓系至crispr酶和/或可经由衔接蛋白与修饰的指导物相缔合或栓系至修饰的指导物。无论crispr酶也可通过经由识别相应衔接蛋白的适体ran序列的修饰指导物栓系到病毒外蛋白或衣壳或包膜,例如vp2结构域或衣壳,这些都可使用。
[0602]
在一些实施方案中,一个或多个功能结构域包含转录激活子、阻遏子、重组酶、转座酶、组蛋白重塑剂、去甲基化酶、dna甲基转移酶、隐花色素、光诱导/可控结构域、化学诱导/可控结构域、表观遗传修饰结构域或它们的组合。有利地,功能结构域包含激活子、阻遏子或核酸酶。
[0603]
在一些实施方案中,功能结构域可具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、rna切割活性或核酸结合活性,或具有本文鉴定的结构域的活性。
[0604]
激活子的实例包括p65,一种单纯疱疹激活结构域vp16的四聚体,称为vp64,通过修改sgrna设计和在称为协同的激活介体(sam)的系统中添加额外的辅助分子、ms2、p65和hsf1来优化vp64的使用进行激活(konermann等人,“genome

scale transcriptional activation by an engineered crispr

cas9 complex,”nature 517(7536):583

8(2015));并且阻遏子的实例包括kox1的krab(kruppel相关框)结构域或sid结构域(例如sid4x);并且适用于功能结构域的核酸酶或核酸酶结构域的实例包括fok1。
[0605]
用于实施本发明的合适的功能结构域,例如激活子、阻遏子或核酸酶也在通过引用并入的文件中讨论,包括关于系统的一般信息在本文引用并通过引用并入的专利和专利出版物。
[0606]
在一些实施方案中,crispr酶包含定位信号或基本上由定位信号组成或由定位信号组成,作为crispr酶与aav衣壳(例如vp2)之间的接头或作为其一部分。ha或flag标签作为接头以及短至gs至(ggggs)3的甘氨酸丝氨酸接头也在本发明的范围内。在这方面,提到可用于本发明的实施方案中的标签包括亲和标签,例如几丁质结合蛋白(cbp)、麦芽糖结合蛋白(mbp)、谷胱甘肽

s

转移酶(gst)、poly(his)标签;溶解标签,例如硫氧还蛋白(trx)和聚(nanp)、mbp和gst;色谱标签,例如由聚阴离子氨基酸组成的那些,例如flag标签;表位标签,例如v5标签、myc标签、ha标签、ne标签;荧光标签,例如gfp和mcherry;可允许特定酶促修饰(例如通过生物素连接酶进行生物素化)或化学修饰(例如与flash

edt2反应进行荧光成像)的蛋白质标签。
[0607]
还提供了一种治疗受试者,例如有需要的受试者的方法,所述方法包括通过用
aav

crispr酶转化受试者来诱导基因编辑,所述aav

crispr酶在体内有利地编码和表达系统的剩余部分(例如,rna、指导物)。还可提供合适的修复模板,例如由包括所述修复模板的载体递送。还提供了一种治疗受试者,例如有需要的受试者的方法,所述方法包括通过用aav

crispr酶转化受试者来诱导转录激活或阻遏,所述aav

crispr酶有利地在体内编码和表达系统的剩余部分(例如,rna、指导物);有利地,在一些实施方案中,crispr酶是无催化活性的crispr酶并且包含一个或多个相缔合的功能结构域。当任何治疗在离体发生时,例如在细胞培养物中,则将理解术语“受试者”可被短语“细胞或细胞培养物”代替。
[0608]
还提供了用于所述治疗方法的包含本发明系统的组合物。可提供包括这样的组合物的多组分试剂盒。还提供了本发明系统在制造用于此类治疗方法的药物中的用途。本发明还提供了在筛选中使用本发明系统,例如,函数增益筛选。人为强迫过表达基因的细胞能够随着时间的推移下调基因(重新建立平衡),例如通过负反馈循环。到筛选开始时,不受调控的基因可能会再次减少。
[0609]
在一个方面,本发明提供了一种工程化的、非天然存在的系统,其包含aav

cas蛋白和靶向细胞中编码基因产物的dna分子的指导rna,由此指导rna靶向编码基因产物的dna分子并且cas蛋白切割编码基因产物的dna分子,从而改变基因产物的表达;并且,其中cas蛋白和指导rna不会自然地一起出现。本发明包括包含与tracr序列融合的指导序列的指导rna。在本发明的一个实施方案中,cas蛋白是ii型crispr

cas蛋白,并且在一个优选的实施方案中,cas蛋白是cpf1蛋白。本发明进一步包括为在真核细胞中表达而密码子优化的cas蛋白编码。在一个优选的实施方案中,真核细胞是哺乳动物细胞,并且在一个更优选的实施方案中,哺乳动物细胞是人类细胞。在本发明的另一个实施方案中,基因产物的表达降低。
[0610]
在另一方面,本发明提供了一种工程化的、非天然存在的载体系统,所述系统包含一个或多个载体,所述载体包含与靶向编码基因产物和aav

cas蛋白的dna分子的crispr

cas系统指导rna可操作地连接的第一调控元件。所述组分可位于系统的相同或不同的载体上,或者可以是相同的载体,由此aav

cas蛋白也递送系统的rna。指导rna靶向编码细胞中基因产物的dna分子并且aav

cas蛋白可切割编码基因产物的dna分子(它可切割一条或两条链或者基本上不具有核酸酶活性),从而改变基因产物的表达;并且,其中aav

cas蛋白和指导rna不会自然地一起出现。本发明包括包含与tracr序列融合的指导序列的指导rna。在本发明的一个实施方案中,aav

cas蛋白是ii型aav

crispr

cas蛋白,并且在一个优选的实施方案中,aav

cas蛋白是aav

cpf1蛋白。本发明进一步包括对aav

cas蛋白进行密码子优化以在真核细胞中表达的编码。在一个优选的实施方案中,真核细胞是哺乳动物细胞,并且在一个更优选的实施方案中,哺乳动物细胞是人类细胞。在本发明的另一个实施方案中,基因产物的表达降低。
[0611]
在另一方面,本发明提供了一种在细胞中表达效应蛋白和指导rna的方法,所述方法包括根据本文公开的任何载体递送系统引入载体。在用于递送效应蛋白的载体的一个实施方案中,最小启动子是mecp2启动子、trna启动子或u6。在另一个实施方案中,最小启动子是组织特异性的。
[0612]
一种或多种多核苷酸分子可包含在一种或多种载体内。本发明包括此类多核苷酸分子,例如可操作地配置为表达蛋白质和/或核酸组分的此类多核苷酸分子,以及此类载体。
[0613]
在一个方面,本发明提供了一种包含一种或多种载体的载体系统。在一些实施方案中,所述系统包含:(a)与tracr配对序列可操作地连接的第一调控元件和用于在tracr配对序列上游插入一个或多个指导序列的一个或多个插入位点,其中当表达时,指导序列引导aav

crispr复合物与真核细胞中靶序列的序列特异性结合,其中crispr复合物包含与(1)与靶序列杂交的指导序列和(2)与tracr序列杂交的tracr配对序列复合的aav

crispr酶;以及(b)包含至少一种核定位序列和/或至少一种nes的所述aav

crispr酶;其中组分(a)和(b)位于系统的相同或不同载体上或其中。在一些实施方案中,组分(a)还包含在第一调控元件控制下的tracr配对序列下游的tracr序列。在一些实施方案中,组分(a)还包含与第一调控元件可操作地连接的两个或更多个指导序列,其中当表达时,两个或更多个指导序列中的每一个引导真核细胞中aav

crispr复合物与不同靶序列的序列特异性结合。在一些实施方案中,所述系统包含在第三调控元件例如聚合酶iii启动子控制下的tracr序列。在一些实施方案中,当最佳比对时,tracr序列沿着tracr配对序列的长度表现出至少50%、60%、70%、80%、90%、95%或99%的序列互补性。确定最佳比对在本领域技术人员的技能范围内。例如,存在公开和商业可用的比对算法和程序,例如但不限于clustalw、matlab中的smith

waterman、bowtie、geneious、biopython和seqman。在一些实施方案中,aav

crispr复合物包含一个或多个足够强度的核定位序列,以驱动所述crispr复合物在真核细胞的细胞核中以可检测的量积累。不希望受理论束缚,据认为核定位序列对于真核生物中的aav

crispr复合物活性不是必需的,但包含此类序列可增强系统的活性,尤其是针对靶向细胞核中的核酸分子和/或使分子离开细胞核。在一些实施方案中,aav

crispr酶是v

u5型aav

crispr系统酶。在一些实施方案中,aav

crispr酶是aav

c2c5酶。
[0614]
递送方法和媒介物的实例包括病毒、纳米粒子、外泌体、纳米线、脂质体、脂质(例如lnp)、超荷电蛋白、细胞透化肽和可植入装置。可使用通过引用整体并入本文的feng zhang等人(wo2016106236a1)的段落[00117]至[00278]中描述的方法将本文所述的核酸、蛋白质和其他分子以及细胞递送至细胞、组织、器官或受试者。
[0615]
靶向部分
[0616]
所述系统还可包含一种或多种靶向部分或编码其的多核苷酸。所述靶向部分可主动靶向本发明的脂质实体,例如本发明的脂质粒子或纳米粒子或脂质体或脂质双层,其包含用于主动靶向的靶向部分。
[0617]
关于靶向部分,提及deshpande等人,“current trends in the use of liposomes for tumor targeting,”nanomedicine(lond).8(9),doi:10.2217/nnm.13.118(2013)及其引用的文件,所有这些文件都通过引用并入本文。还提及wo/2016/027264及其引用的文件,所有这些文件都通过引用并入本文。并且提及lorenzer等人,“going beyond the liver:progress and challenges of targeted delivery of sirna therapeutics,”journal of controlled release,203:1

15(2015)及其引用的文件,所有这些都通过引用并入本文。
[0618]
主动靶向脂质粒子或纳米粒子或脂质体或脂质双层递送系统(通常关于本发明的实施方案,“本发明的脂质实体”递送系统)是通过将靶向部分(包括小分子配体、肽和单克隆抗体)缀合在脂质或脂质体表面上来制备;例如,某些受体如叶酸和转铁蛋白(tf)受体(tfr)在许多癌细胞上过表达并且已被用于制造肿瘤细胞特异性的脂质体。通过与特定的
细胞表面受体相互作用,在肿瘤微环境中积累的脂质体随后可被内吞到细胞中。为了将脂质体有效地靶向细胞,例如癌细胞,靶向部分对细胞表面受体具有亲和力并且以足够的量连接靶向部分以对细胞表面受体具有最佳亲和力是有用的;并且确定这些方面在技术人员的技能范围内。在主动靶向领域中,存在许多细胞(例如肿瘤)特异性靶向配体。
[0619]
同样对于主动靶向,关于靶向细胞表面受体如癌细胞表面受体,脂质体上的靶向配体可经由非内化表位提供脂质体与细胞(例如血管细胞)的附接;并且,这可增加被递送者的细胞外浓度,从而增加递送到靶细胞的量。靶向细胞表面受体(例如癌细胞上的细胞表面受体,例如癌细胞上过表达的细胞表面受体)的策略是使用受体特异性配体或抗体。许多癌细胞类型显示出肿瘤特异性受体的上调。例如,tfr和叶酸受体(fr)被许多肿瘤细胞类型过表达,以响应其增加的代谢需求。与在活化的巨噬细胞和癌细胞(例如,某些卵巢、乳腺、肺、结肠、肾和脑肿瘤)中过表达相比,叶酸由于易于与纳米载体缀合,对fr具有高亲和力并且在正常组织中fr的频率相对较低,因此可用作专门递送的靶向配体。巨噬细胞上fr的过表达是炎症性疾病如银屑病、克罗恩病、类风湿性关节炎和动脉粥样硬化的征兆;因此,本发明的叶酸介导的靶向也可用于研究、解决或治疗炎性病症以及癌症。本发明的叶酸连接的脂质粒子或纳米粒子或脂质体或脂质双层(“本发明的脂质实体”)通过受体介导的内吞作用在细胞内递送它们的货物。细胞内运输可定向到促进货物释放的酸性隔室,并且最重要的是,货物的释放可改变或延迟,直到它到达细胞质或靶细胞器附近。使用具有靶向部分的本发明脂质实体(例如本发明的叶酸连接的脂质实体)递送货物可优于本发明的非靶向脂质实体。叶酸与脂质头基的直接附接可能不利于本发明的叶酸缀合的脂质实体的细胞内递送,因为它们与细胞的结合可能不如叶酸通过间隔子附接至本发明的脂质实体表面那样有效,可以更有效地进入癌细胞。与叶酸偶联的本发明的脂质实体可用于递送脂质(例如脂质体,例如阴离子脂质体)和病毒或衣壳或包膜或病毒外蛋白(例如本文所讨论的那些如腺病毒或aav)的复合物。tf是一种大约80kda的单体血清糖蛋白,其参与铁在全身的转运。tf与tfr结合并经由受体介导的内吞作用易位到细胞中。与正常细胞相比,tfr在某些细胞(例如肿瘤细胞)中的表达可能更高,并且与快速增殖的癌细胞中铁需求增加相关。因此,本发明包括本发明的tfr靶向脂质实体,例如,肝细胞如肝癌,乳腺细胞如乳腺癌细胞,结肠细胞如结肠癌细胞,卵巢细胞如卵巢癌细胞,头、颈和肺细胞如头、颈和非小细胞肺癌细胞,以及口腔细胞如口腔肿瘤细胞。
[0620]
同样对于主动靶向,本发明的脂质实体可以是多功能的,即,使用多于一种靶向部分如cpp,以及tf;双功能系统;例如,可提供跨血脑屏障内皮的转运的tf和聚l

精氨酸的组合。egfr是一种属于erbb受体家族的酪氨酸激酶受体,其在细胞、尤其是非癌细胞中介导细胞生长、分化和修复,但egf在某些细胞中过表达,例如许多实体瘤,包括结直肠癌,非小细胞肺癌,卵巢、肾、头、胰腺、颈和前列腺的鳞状细胞癌,尤其是乳腺癌。本发明包括与本发明的脂质实体连接的靶向egfr的单克隆抗体。her

2在乳腺癌患者中经常过表达,并且还与肺癌、膀胱癌、前列腺癌、脑癌和胃癌相关。her

2,由erbb2基因编码。本发明包括靶向her

2的本发明的脂质实体,例如抗her

2抗体(或其结合片段)

本发明的脂质实体、靶向her

2的聚乙二醇化的本发明的脂质实体(例如,具有抗her

2抗体或其结合片段),靶向her

2的马来酰亚胺

peg聚合物

本发明的脂质实体(例如,具有抗her

2抗体或其结合片段)。在细胞缔合后,受体

抗体复合物可通过形成用于递送至细胞质的内体而被内化。关于受体介导的靶
向,技术人员考虑配体/靶标亲和力和细胞表面上受体的数量,并且聚乙二醇化可作为与受体相互作用的屏障。使用本发明靶向的抗体

脂质实体可能是有利的。靶向部分的多价呈递也可增加抗体片段的摄取和信号传导特性。在本发明的实践中,技术人员考虑配体密度(例如,本发明的脂质实体上的高配体密度可能有利于增加与靶细胞的结合)。可用本发明的空间稳定的脂质实体和将配体连接到分子如peg(其锚定在本发明的脂质实体(例如,脂质粒子或纳米粒子或脂质体或脂质双层中))的末端,来解决巨噬细胞的早期预防。可靶向细胞团的微环境,例如肿瘤微环境;例如,靶向细胞群脉管系统例如肿瘤脉管系统微环境可能是有利的。因此,本发明包括靶向vegf。vegf及其受体是众所周知的促血管生成分子,并且是抗血管生成治疗的充分表征的靶标。许多受体酪氨酸激酶的小分子抑制剂,例如vegfr或碱性fgfr,已被开发作为抗癌剂,并且本发明包括将这些肽中的任何一种或多种与本发明的脂质实体偶联,例如噬菌体ivo肽(例如,经由或具有peg末端),肿瘤归巢肽aprpg如aprpg

peg修饰的。vcam,血管内皮在炎症、血栓形成和动脉粥样硬化的发病机制中起关键作用。cam与炎症性病症(包括癌症)有关,并且是逻辑靶标、e

和p

选择素、vcam

1和icam。可用于靶向本发明的脂质实体,例如,通过聚乙二醇化。基质金属蛋白酶(mmp)属于锌依赖性内肽酶家族。它们参与组织重塑、肿瘤侵袭、抗凋亡和转移。存在四种mmp抑制剂,称为timp1

4,它们决定了肿瘤生长抑制和转移之间的平衡;参与肿瘤血管的血管生成的一种蛋白质是mt1

mmp,其在新形成的血管和肿瘤组织上表达。mt1

mmp的蛋白水解活性在质膜上切割蛋白质如纤连蛋白、弹性蛋白、胶原蛋白和层粘连蛋白,并激活可溶性mmp如mmp

2,其降解基质。抗体或其片段如fab'片段可用于本发明的实践,例如用于与本发明的脂质实体连接的抗人mt1

mmp单克隆抗体,例如经由间隔子如peg间隔子连接。αβ

整联蛋白或整联蛋白是一组跨膜糖蛋白受体,其介导细胞与其周围组织或细胞外基质之间的附接。整联蛋白含有两个不同的链(异二聚体),称为α

和β

亚基。整联蛋白受体的肿瘤组织特异性表达可用于本发明中的靶向递送,例如由此靶向部分可以是rgd肽,例如环状rgd。适体是ssdna或rna寡核苷酸,它们通过静电相互作用、氢键和疏水相互作用赋予目标分子高亲和力和特异性识别,这与watson

crick碱基配对相反,后者是寡核苷酸键合相互作用的典型特征。作为靶向部分的适体与抗体相比具有优势:与抗体相比,适体可展现更高的靶抗原识别;与抗体相比,适体可以更稳定并且尺寸更小;适体可容易地合成和化学修饰以进行分子缀合;并且适体可按顺序改变以提高选择性并且可开发以识别免疫原性差的靶标。此类部分如sgc8适体可用作靶向部分(例如,经由共价连接到本发明的脂质实体,例如,经由间隔子如peg间隔子)。靶向部分可以是刺激敏感的,例如对外部施加的刺激例如磁场、超声或光敏感;也可使用ph触发,例如,可在亲水部分如peg和疏水部分如本发明的脂质实体之间使用不稳定连接,其仅在暴露于特定环境或微环境(例如内吞液泡或酸性肿瘤块)特有的相对酸性条件下才会被切割。在本发明的实施方案中也可并入ph敏感共聚物,可提供屏蔽;二原酸酯、乙烯基酯、半胱氨酸可切割的脂质聚合物、双酯和腙是ph敏感键的几个实例,它们在ph 7.5时非常稳定,但在ph 6及以下时水解相对较快,例如,末端烷基化的n

异丙基丙烯酰胺和甲基丙烯酸的共聚物,所述共聚物促进本发明的脂质实体的去稳定化并在具有降低的ph值的隔室中释放;或者,本发明包括用于产生本发明的ph响应性脂质实体的离子聚合物(例如,聚(甲基丙烯酸)、聚(甲基丙烯酸二乙氨基乙酯)、聚(丙烯酰胺)和聚(丙烯酸))。温度触发的递送也在本发明的范围内。与正常组织相比,许多病理区域,例如发炎组织和肿瘤,表现出独特的高
热。利用这种高热在癌症疗法中是一种有吸引力的策略,因为高热与增加的肿瘤渗透性和增强的吸收相关。该技术涉及局部加热所述部位以增加微血管孔径和血流量,这反过来会导致本发明的实施方案的外渗增加。本发明的温度敏感性脂质实体可由具有低临界溶液温度的热敏脂质或聚合物制备。高于低临界溶液温度(例如,在肿瘤部位或发炎组织部位等部位),聚合物沉淀,破坏脂质体释放。具有特定凝胶

液相转变温度的脂质用于制备本发明的这些脂质实体;并且热敏实施方案的脂质可以是二棕榈酰磷脂酰胆碱。热敏聚合物还可促进去稳定化然后释放,并且有用的热敏聚合物是聚(n

异丙基丙烯酰胺)。另一种温度触发系统可使用溶血脂质温度敏感性脂质体。本发明还包括氧化还原触发的递送:正常组织和发炎组织或肿瘤组织之间以及细胞内和细胞外环境之间的氧化还原电位差异已被用于递送;例如,gsh是细胞中大量存在的还原剂,尤其是在细胞溶质、线粒体和细胞核中。血液和细胞外基质中的gsh浓度分别仅是细胞内浓度的100分之一至1000分之一。这种由gsh、半胱氨酸和其他还原剂引起的高氧化还原电位差可破坏可还原键,使本发明的脂质实体不稳定并导致有效载荷的释放。二硫键可用作本发明脂质实体中的可切割/可逆接头,因为它由于二硫键

硫醇还原反应而引起对氧化还原的敏感性;可通过使用两种(例如,两种形式的二硫键缀合的多功能脂质作为二硫键的裂解(例如,经由三(2

羧乙基)膦、二硫苏糖醇、l

半胱氨酸或gsh)使本发明的脂质实体具有还原敏感性,可导致缀合物的亲水头基的去除并改变膜组织,从而导致有效载荷的释放。钙黄绿素从含有二硫键缀合物的本发明的还原敏感脂质实体中释放可能比还原不敏感的实施方案更有用。酶也可用作释放有效载荷的触发物。已发现包括mmp(例如mmp2)、磷脂酶a2、碱性磷酸酶、转谷氨酰胺酶或磷脂酰肌醇特异性磷脂酶c的酶在某些组织(例如肿瘤组织)中过表达。在这些酶的存在下,本发明的特别工程化的酶敏感性脂质实体可被破坏并释放有效载荷。mmp2可切割的八肽(gly

pro

leu

gly

ile

ala

gly

gln)可并入接头中,并且可具有抗体靶向,例如抗体2c5。本发明还包括光或能量触发的递送,例如,本发明的脂质实体可为光敏感的,使得光或能量可促进结构和构象的变化,这导致本发明的脂质实体经由膜融合、光异构、光碎裂或光聚合与靶细胞的直接相互作用;因此,这样的部分可以是苯并卟啉光敏剂。超声可以是一种触发递送的能量形式;具有少量特定气体(包括空气或全氟化烃)的本发明的脂质实体可通过超声例如低频超声(lfus)触发以释放。磁性递送:本发明的脂质实体可通过并入磁铁矿(例如fe3o4或γ

fe2o3,例如尺寸小于10nm的那些)而被磁化。然后可通过暴露于磁场来进行靶向递送。
[0621]
同样对于主动靶向,本发明还包括细胞内递送。由于脂质体遵循内吞途径,它们被截留在核内体(ph 6.5

6)中并且随后与溶酶体(ph<5)融合,在那里它们经历降解,导致治疗潜力降低。可利用低内体ph来逃避降解。融合脂质或肽,在较低的ph下构象转变/活化后使内体膜不稳定。胺在酸性ph下质子化,并通过缓冲作用导致内体膨胀和破裂。不饱和二油酰磷脂酰乙醇胺(dope)在低ph下容易采用倒六边形形状,这会导致脂质体与内体膜融合。这个过程使含有dope的脂质实体失稳并将货物释放到细胞质中;融合脂质gala、胆固醇

gala和peg

gala可能表现出高效的内体释放;成孔蛋白李斯特菌溶血素o可能提供内体逃逸机制;并且,富含组氨酸的肽具有与内体膜融合的能力,导致孔形成,并且可缓冲质子泵,导致膜裂解。
[0622]
此外,对于主动靶向,细胞穿透肽(cpp)有助于通过细胞膜吸收大分子,并因此增强cpp修饰分子在细胞内的递送。cpp可分为两类:两亲性螺旋肽,例如转运素
(transportan)和map,其中赖氨酸残基是正电荷的主要贡献者;和富含arg的肽,例如tatp、触角足突变(antennapedia)或穿透素。tatp是一种具有86个氨基酸的转录激活因子,其含有一个高度碱性(9个残基中的两个lys和六个arg)蛋白转导结构域,可实现核定位和rna结合。已用于修饰脂质体的其他cpp包括以下:触角足突变的最小蛋白质转导结构域,果蝇同源蛋白,称为穿透蛋白,它是存在于同源域的第三个螺旋中的16聚体肽(残基43

58);27个氨基酸长的嵌合cpp,含有经由lys残基结合的来自神经肽甘丙肽氨基末端的肽序列,胡蜂蜂毒肽(mastoparan),一种黄蜂毒液肽;vp22,hsv

1的主要结构组分,促进细胞内转运和转运素(18聚体)两亲性模型肽,其通过能量依赖性和非依赖性机制将肥大细胞和内皮细胞的质膜易位。本发明包括用cpp修饰的本发明脂质实体,用于细胞内递送,其可经由能量依赖性巨胞饮作用接着内体逃逸进行。本发明还包括细胞器特异性靶向。用三苯基鏻(tpp)部分表面官能化的本发明脂质实体或具有亲脂性阳离子罗丹明123的本发明脂质实体可有效地将货物递送至线粒体。dope/鞘磷脂/硬脂酰



精氨酸可经由膜融合将货物递送到线粒体内部。用趋溶酶体配体、十八烷基罗丹明b进行表面修饰的本发明的脂质实体可将货物递送至溶酶体。神经酰胺可用于诱导溶酶体膜透化;本发明包括具有神经酰胺的本发明脂质实体的细胞内递送。本发明还包括例如经由dna嵌入部分靶向细胞核的本发明的脂质实体。本发明还包括用于靶向的多功能脂质体,即将多于一个的官能团附接到本发明的脂质实体的表面,例如以增强在所需位点的积累和/或促进细胞器特异性递送和/或靶向特定类型的细胞和/或对局部刺激如温度(例如升高)、ph(例如降低)作出反应,对外部施加的刺激如磁场、光、能量、热量或超声作出反应和/或促进货物的细胞内递送。所有这些都被认为是主动靶向部分。
[0623]
所述系统的一个实施方案可包括主动靶向脂质粒子或纳米粒子或脂质体或脂质双层递送系统;或包含靶向部分的脂质粒子或纳米粒子或脂质体或脂质双层,由此存在主动靶向或其中靶向部分是主动靶向部分。靶向部分可以是一个或多个靶向部分,并且靶向部分可用于任何所需类型的靶向,例如靶向细胞,例如任何本文所述;或靶向细胞器,例如任何本文所述;或用于靶向例如针对诸如热量、能量、超声、光、ph、化学如酶促或磁刺激的物理条件的响应;或靶向以实现特定结果,例如通过细胞渗透将有效载荷递送到特定位置。
[0624]
应当理解,对于本文讨论的每个可能的靶向或主动靶向部分,本发明的一个方面是其中递送系统包含这样的靶向或主动靶向部分。同样,下表提供了可用于实施本发明的示例性靶向部分,并且对于本发明的每个方面,提供了包含这种靶向部分的递送系统。
[0625]
表4

靶向部分
[0626][0627]
因此,在一个实施方案中,靶向部分包含受体配体,例如针对cd44受体的透明质酸、针对肝细胞的半乳糖,或抗体或其片段如针对所需表面受体的结合抗体片段,并且对于每个包含受体配体、或抗体或其片段如其结合片段(例如针对所需表面受体)的靶向部分,本发明的一个方面是其中递送系统包含含有以下的靶向部分:受体配体,或抗体或其片段如其结合片段(例如针对所需表面受体),或针对cd44受体的透明质酸,针对肝细胞的半乳糖(参见例如surace等人,“lipoplexes targeting the cd44 hyaluronic acid receptor for efficient transfection of breast cancer cells,”j.mol pharm 6(4):1062

73;doi:10.1021/mp800215d(2009);sonoke等人,“galactose

modified cationic liposomes as a liver

targeting delivery system for small interfering rna,”biol pharm bull.34(8):1338

42(2011);torchilin,“antibody

modified liposomes for cancer chemotherapy,”expert opin.drug deliv.5(9),1003

1025(2008);manjappa等人,“antibody derivatization and conjugation strategies:application in preparation of stealth immunoliposome to target chemotherapeutics to tumor,”j.control.release 150(1),2

22(2011);sofou s“antibody

targeted liposomes in cancer therapy and imaging,”expert opin.drug deliv.5(2):189

204(2008);gao j等
人,“antibody

targeted immunoliposomes for cancer treatment,”mini.rev.med.chem.13(14):2026

2035(2013);molavi等人,“anti

cd30antibody conjugated liposomal doxorubicin with significantly improved therapeutic efficacy against anaplastic large cell lymphoma,”biomaterials 34(34):8718

25(2013),其中的每个和其中引用的文件均特此通过引用并入本文)。
[0628]
此外,鉴于本文的教导,技术人员可在本发明关于本发明脂质实体的实践中容易地选择和应用期望的靶向部分。本发明包括其中递送系统包含具有靶向部分的脂质实体的一个实施方案。
[0629]
剂量
[0630]
在一些实施方案中,载体,例如质粒或病毒载体通过例如肌内注射递送至目标组织,而其他时间递送是经由静脉内、透皮、鼻内、口服、粘膜或其他递送方法。这种递送可以是经由单剂量或多剂量。本领域技术人员理解,本文中所递送的实际剂量可根据多种因素而有很大变化,所述因素例如载体选择、靶细胞、生物体或组织、待治疗受试者的一般情况、所寻求的转化/修饰的程度、施用途径、施用模式、所寻求的转化/修饰的类型等。
[0631]
这样的剂量还可含有例如载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油等),稀释剂,药学上可接受的载体(例如磷酸盐缓冲盐水),药学上可接受的赋形剂和/或本领域已知的其他化合物。所述剂量还可含有一种或多种药学上可接受的盐,例如,无机酸盐如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等;以及有机酸盐如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。此外,其中还可存在辅助物质,例如润湿剂或乳化剂、ph缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球、聚合物、悬浮剂等。另外,还可存在一种或多种其他常规药物成分,例如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结块剂、填充剂、螯合剂、包衣剂、化学稳定剂等,尤其是在剂型为可复原形式时。合适的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨酸酯80、苯乙醇、氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯苯酚、明胶、白蛋白及它们的组合。药学上可接受的赋形剂的详细讨论可在通过引用并入本文的remington's pharmaceutical sciences(mack pub.co.,n.j.1991)中获得。
[0632]
基因编辑组分的相对剂量在一些应用中可能很重要。在一些实例中,涉及复合物的一种或多种组分的表达,其可以例如来自相同或独立的载体。在单一载体的情况下,通过调整效应蛋白和指导物的表达水平来改变效应蛋白:指导物比率通常是有利的。在多个载体的情况下,通过调整单独载体的剂量和/或来自载体的效应蛋白和指导物的表达水平来改变效应蛋白:指导物比率通常是有利的。在某些实施方案中,调整用于表达效应蛋白和指导物的载体的比率。例如,可调整aav

效应蛋白表达载体和aav

指导物表达载体的相对剂量。通常,剂量以每毫升(vg/ml)或每千克(vg/kg)的载体基因组(vg)表示。在某些实施方案中,aav

效应蛋白和aav

指导物的载体基因组的比率为约2:1,或约1:1,或约1:2,或约1:4,或约1:5,或约1:10,或约1:20,或约2:1至约1:1,或约2:1至约1:2,或约1:1至约1:2或约1:1至约1:4,或约1:2至约1:5,或约1:2至约1:10或约1:5至约1:20。类似地,在指导物多重化的情况下,针对每个指导物分别改变载体基因组与指导物基因组的比率可能是有利的。
[0633]
在本文的一个实施方案中,递送是经由腺病毒进行的,其可为含有至少1
×
105个腺病毒载体粒子(也称为粒子单位,pu)的单剂量或加强剂量。在本文的一个实施方案中,剂
量优选为至少约1
×
106个粒子(例如,约1
×
106‑1×
10
12
个粒子),更优选至少约1
×
107个粒子,更优选至少约1
×
108个粒子(例如约1
×
108‑1×
10
11
个粒子或约1
×
108‑1×
10
12
个粒子),并且最优选至少约1
×
10
10
个粒子(例如约1
×
109‑1×
10
10
个粒子或约1
×
109‑1×
10
12
个粒子),或甚至至少约1
×
10
10
个粒子(例如约1
×
10
10
‑1×
10
12
个粒子)的腺病毒载体。或者,所述剂量包含不超过约1
×
10
14
个粒子,优选不超过约1
×
10
13
个粒子,甚至更优选不超过约1
×
10
12
个粒子,甚至更优选不超过约1
×
10
11
个粒子,并且最优选不超过约1
×
10
10
个粒子(例如不超过约1
×
109个粒子)。因此,所述剂量可含有单剂量的腺病毒载体,其具有例如约1
×
106个粒子单位(pu)、约2
×
106pu、约4
×
106pu、约1
×
107pu、约2
×
107pu、约4
×
107pu、约1
×
108pu、约2
×
108pu、约4
×
108pu、约1
×
109pu、约2
×
109pu、约4
×
109pu、约1
×
10
10
pu、约2
×
10
10
pu、约4
×
10
10
pu、约1
×
10
11
pu、约2
×
10
11
pu、约4
×
10
11
pu、约1
×
10
12
pu、约2
×
10
12
pu或约4
×
10
12
pu的腺病毒载体。参见例如于2013年6月4日授予nabel等人的美国专利第8,454,972b2号中的腺病毒载体;通过引用并入本文,及其在第29栏第36

58行的剂量。在本文的一个实施方案中,腺病毒经由多次剂量递送。
[0634]
在本文的一个实施方案中,递送是经由aav进行的。据认为用于向人类体内递送aav的治疗有效剂量在约20至约50ml盐水溶液的范围内,所述盐水溶液含有约1
×
101至约1
×
10
10
功能aav/ml溶液。可调节剂量以平衡治疗益处与任何副作用。在本文的一个实施方案中,aav剂量通常在约1
×
105至1
×
10
50
基因组aav、约1
×
108至1
×
10
20
基因组aav、约1
×
10
10
至约1
×
10
16
基因组、或约1
×
10
11
至约1
×
10
16
基因组aav的浓度范围内。人类剂量可以是约1
×
10
13
基因组aav。这样的浓度可以约0.001ml至约100ml、约0.05至约50ml、或约10至约25ml的载体溶液递送。通过建立剂量反应曲线的常规试验,本领域普通技术人员可容易地确定其他有效剂量。参见例如2013年3月26日授予hajjar等人的美国专利第8,404,658 b2号,第27栏,第45

60行。
[0635]
在本文的一个实施方案中,递送是经由质粒进行的。在此类质粒组合物中,剂量应为足以引起应答的质粒的量。例如,质粒组合物中质粒dna的合适量可以是每70kg个体约0.1至约2mg、或约1μg至约10μg。本发明的质粒通常将包含(i)启动子;(ii)与所述启动子可操作地连接的编码crispr酶的序列;(iii)可选择标志物;(iv)复制起点;和(v)在(ii)下游并与其可操作地连接的转录终止子。所述质粒还可编码crispr复合物的rna组分,但是这些中的一者或多者可以替代地在不同的载体上编码。
[0636]
本文的剂量是基于平均70kg的个体。施用频率在医学或兽医从业者(例如,医师、兽医)或本领域技术人员的能力范围内。还应注意的是,实验中使用的小鼠通常为约20g,并且根据小鼠实验,可以扩展到70kg的个体。
[0637]
用于本文提供的组合物的剂量包括用于重复施用或重复给药的剂量。在特定的实施方案中,在数周、数月或数年的时期内重复施用。可进行合适的测定以获得最佳剂量方案。重复施用可允许使用较低剂量,这可以积极影响脱靶修饰。
[0638]
在非动物细胞类型和生物体中的应用
[0639]
本文的系统和方法可用于非动物生物体,例如植物、真菌。所述系统(例如,单个或多重化)可与作物基因组学的最新进展结合使用。本文中描述的系统可用于执行高效且具有成本效益的植物基因或基因组询问或编辑或操作—例如,用于快速调查和/或选择和/或询问和/或比较和/或操作和/或转化植物基因或基因组;例如,创造、鉴定、开发、优化或赋
予植物性状或特征或转化植物基因组。因此可提高植物、具有新的性状或特征组合的新植物或具有增强性状的新植物的产量。crispr效应蛋白系统可用于定点整合(sdi)或基因编辑(ge)或任何近反向育种(nrb)或反向育种(rb)技术中的植物。利用本文所描述的crispr效应蛋白系统的方面可能类似于在植物中使用crispr

cas(例如crispr

cas9)系统,并且提及亚利桑那大学网站“crispr

plant”(www.genome.arizona.edu/crispr/)(由宾夕法尼亚州立大学和agi支持)。本发明的实施方案可与单倍体诱导一起使用。例如,能够使花粉能触发单倍体诱导的玉米品系用编程为靶向与所需性状相关的基因的系统进行转化。花粉用于将所述系统转移到其他抗crispr转移的玉米品种。在某些实施方案中,携带crispr的玉米花粉中可编辑小麦的dna。本发明的实施方案可用于植物中的基因组编辑,或者其中先前已经使用过rnai或类似的基因组编辑;参见例如nekrasov,“plant genome editing made easy:targeted mutagenesis in model and crop plants using the crispr

cas system,”plant methods 2013,9:39(doi:10.1186/1746

4811
‑9‑
39);brooks,“efficient gene editing in tomato in the first generation using the crispr

cas9 system,”plant physiology 2014年9月第114.247577页;shan,“targeted genome modification of crop plants using a crispr

cas system,”nature biotechnology 31,686

688(2013);feng,“efficient genome editing in plants using a crispr/cas system,”cell research(2013)23:1229

1232.doi:10.1038/cr.2013.114;在线出版于2013年8月20日;xie,“rna

guided genome editing in plants using a crispr

cas system,”mol plant.2013年11月;6(6):1975

83.doi:10.1093/mp/sst119.电子出版于2013年8月17日;xu,“gene targeting using the agrobacterium tumefaciens

mediated crispr

cas system in rice,”rice 2014,7:5(2014);zhou等人,“exploiting snps for biallelic crispr mutations in the outcrossing woody perennial populus reveals 4

coumarate:coa ligase specificity and redundancy,”new phytologist(2015)(forum)1

4(仅在线获自www.newphytologist.com);caliando等人,“targeted dna degradation using a crispr device stably carried in the host genome,nature communications 6:6989,doi:10.1038/ncomms7989,www.nature.com/naturecommunications doi:10.1038/ncomms7989;美国专利第6,603,061号

agrobacterium

mediated plant transformation method;美国专利第7,868,149号

plant genome sequences and uses thereof,和us 2009/0100536

transgenic plants with enhanced agronomic traits,其中每个的所有内容和公开内容都通过引用整体并入其中。在本发明的实践中,morrell等人“crop genomics:advances and applications,”nat rev genet.2011年12月29日;13(2):85

96的内容和公开内容;其中的每个都通过引用并入本文,包括关于本文实施方案如何可用于植物。因此,除非另外显而易见,否则本文对动物细胞的提及也可比照适用于植物细胞;并且,本文具有减少的脱靶效应的酶和使用此类酶的系统可用于植物应用,包括在本文中提到的那些。
[0640]
一般来说,术语“植物”涉及植物界的任何各种光合、真核、单细胞或多细胞生物体,其特征在于通过细胞分裂而生长,含有叶绿体,并且细胞壁由纤维素组成。术语植物涵盖单子叶植物和双子叶植物。具体来说,植物意在包括但不限于被子植物和裸子植物,例如金合欢、苜蓿、苋菜红、苹果、杏、朝鲜蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、桦木、
山毛榉、黑莓、蓝莓、西兰花、布鲁塞尔芽菜、卷心菜、坎诺拉油菜(canola)、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷物、芹菜、栗子、樱桃、大白菜、柑橘、克莱门柑(clementine)、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆木、菊苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、落花生、地樱桃、橡胶树、铁杉、山核桃、羽衣甘蓝、奇异果、大头菜、落叶松、生菜、韭菜、柠檬、酸橙、洋槐、松树、铁线蕨、玉米、芒果、枫树、甜瓜、小米、蘑菇、芥菜、坚果、橡木、燕麦、油棕、秋葵、洋葱、橙、观赏植物或花或树、木瓜、棕榈、欧芹、欧洲防风草、豌豆、桃、花生、梨、泥煤、胡椒、柿子、木豆、松树、菠萝、车前草、李子、石榴、马铃薯、南瓜、意大利菊苣、萝卜、油菜籽、覆盆子、水稻、黑麦、高粱、红花、柳、大豆、菠菜、云杉、倭瓜、草莓、糖甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、番茄、树木、黑小麦、草皮草、芜菁、藤蔓、胡桃、西洋菜、西瓜、小麦、山药、紫杉和西葫芦。术语植物还涵盖藻类,它们主要是主要由于缺乏根、叶和其他代表高等植物的器官而成为一体的光合自养生物。
[0641]
使用如本文所述的系统进行基因组编辑的方法可用于在基本上任何植物上赋予期望的性状。使用本公开的核酸构建体和上述各种转化方法,可针对本文所述的所需生理和农艺学特性对广泛多种植物和植物细胞系统进行工程化。在优选的实施方案中,用于工程化的靶植物和植物细胞包括但不限于那些单子叶和双子叶植物,例如包括以下的作物:谷类作物(例如小麦、玉米、水稻、小米、大麦),水果作物(例如番茄、苹果、梨、草莓、橙),饲料作物(例如苜蓿),块根蔬菜作物(例如胡萝卜、马铃薯、糖甜菜、山药),叶菜类作物(例如生菜、菠菜);开花植物(例如矮牵牛、玫瑰、菊花),针叶树和松树(例如松、杉、云杉);植物修复中使用的植物(例如重金属累积植物);油料作物(例如向日葵、油菜籽)和用于实验目的的植物(例如拟南芥)。用于工程化的植物细胞和组织包括但不限于根、茎、叶、花和生殖结构、未分化的分生组织细胞、薄壁组织、厚角组织、厚壁组织、木质部、韧皮部、表皮和种质。因此,所述方法和系统可在广泛多种植物上使用,例如用于属于以下各目的双子叶植物:木兰目(magniolales)、八角目(illiciales)、樟目(laurales)、胡椒目(piperales)、马兜铃目(aristolochiales)、睡莲目(nymphaeales)、毛茛目(ranunculales)、罂粟目(papeverales)、瓶子草科(sarraceniaceae)、昆栏树目(trochodendrales)、金缕梅目(hamamelidales)、杜仲目(eucomiales)、塞子木目(leitneriales)、杨梅目(myricales)、壳斗目(fagales)、木麻黄目(casuarinales)、石竹目(caryophyllales)、肉穗果目(batales)、蓼目(polygonales)、白花丹目(plumbaginales)、五桠果目(dilleniales)、山茶目(theales)、锦葵目(malvales)、荨麻目(urticales)、玉蕊目(lecythidales)、堇菜目(violales)、杨柳目(salicales)、白花菜目(capparales)、杜鹃花目(ericales)、岩梅目(diapensales)、柿树目(ebenales)、报春花目(primulales)、蔷薇目(rosales)、豆目(fabales)、川草目(podostemales)、小二仙草目(haloragales)、桃金娘目(myrtales)、山茱萸目(cornales)、山龙眼目(proteales)、檀香目(santales)、大花草目(rafflesiales)、卫矛目(celastrales)、大戟目(euphorbiales)、鼠李目(rhamnales)、无患子目(sapindales)、胡桃目(juglandales)、牻牛儿苗目(geraniales)、远志目(polygalales)、伞形目(umbellales)、龙胆目(gentianales)、花葱目(polemoniales)、唇形目(lamiales)、车前目(plantaginales)、玄参目(scrophulariales)、桔梗目(campanulales)、茜草目(rubiales)、川续断目(dipsacales)和菊目(asterales);所述方法和系统可用于单子叶植物,例如属于以下各目的单子叶植物:泽泻目(alismatales)、水鳖目(hydrocharitales)、
茨藻目(najadales)、霉草目(triuridales)、鸭跖草目(commelinales)、谷精草目(eriocaulales)、帚灯草目(restionales)、禾本目(poales)、灯芯草目(juncales)、莎草目(cyperales)、香蒲目(typhales)、凤梨目(bromeliales)、姜目(zingiberales)、槟榔目(arecales)、环花目(cyclanthales)、露兜树目(pandanales)、天南星目(arales)、百合目(lilliales)和兰目(orchidales),或者用于属于裸子植物的植物,例如属于以下各目的裸子植物:松柏目(pinales)、银杏目(ginkgoales)、苏铁目(cycadales)、南洋杉目(araucariales)、柏目(cupressales)和买麻藤目(gnetales)。
[0642]
本文所述的系统和使用方法可用于广泛多种植物物种,包括以下双子叶植物、单子叶植物或裸子植物属的非限制性列表:颠茄属(atropa)、油丹属(alseodaphne)、腰果属(anacardium)、落花生属(arachis)、琼楠属(beilschmiedia)、芸薹属(brassica)、红花属(carthamus)、木防己属(cocculus)、巴豆属(croton)、黄瓜属(cucumis)、柑橘属(citrus)、西瓜属(citrullus)、辣椒属(capsicum)、长春花属(catharanthus)、椰子属(cocos)、咖啡属(coffea)、南瓜属(cucurbita)、胡萝卜属(daucus)、端心木属(duguetia)、花菱草属(eschscholzia)、榕属(ficus)、草莓属(fragaria)、海罂粟属(glaucium)、大豆属(glycine)、棉属(gossypium)、向日葵属(helianthus)、橡胶树属(hevea)、天仙子属(hyoscyamus)、莴苣属(lactuca)、卷枝藤属(landolphia)、亚麻属(linum)、木姜子属(litsea)、番茄属(lycopersicon)、羽扇豆属(lupinus)、木薯属(manihot)、马郁兰属(majorana)、苹果属(malus)、苜蓿属(medicago)、烟草属(nicotiana)、木犀榄属(olea)、银胶菊属(parthenium)、罂粟属(papaver)、鳄梨属(persea)、菜豆属(phaseolus)、黄连木属(pistacia)、豌豆属(pisum)、梨属(pyrus)、李属(prunus)、萝卜属(raphanus)、蓖麻属(ricinus)、千里光属(senecio)、风龙属(sinomenium)、千金藤属(stephania)、白芥属(sinapis)、茄属(solanum)、可可属(theobroma)、车轴草属(trifolium)、胡卢巴属(trigonella)、野豌豆属(vicia)、蔓长春花属(vinca)、葡萄属(vilis)和豇豆属(vigna);以及以下各属:葱属(allium)、须芒草属(andropogon)、剪股颖属(aragrostis)、天门冬属(asparagus)、燕麦属(avena)、狗牙根属(cynodon)、油棕属(elaeis)、羊茅属(festuca)、羊茅黑麦草属(festulolium)、萱草属(heterocallis)、大麦属(hordeum)、浮萍属(lemna)、黑麦草属(lolium)、芭蕉属(musa)、稻属(oryza)、黍属(panicum)、狼尾草属(pannesetum)、梯牧草属(phleum)、早熟禾属(poa)、黑麦属(secale)、高粱属(sorghum)、小麦属(triticum)、玉蜀黍属(zea)、冷杉属(abies)、杉木属(cunninghamia)、麻黄属(ephedra)、云杉属(picea)、松属(pinus)和黄杉属(pseudotsuga)。
[0643]
所述系统和使用方法也可用于范围广泛的“藻类”或“藻类细胞”;包括例如选自若干真核门的藻类,包括红藻门(rhodophyta)(红藻)、绿藻门(chlorophyta)(绿藻)、褐藻门(phaeophyta)(褐藻)、硅藻门(bacillariophyta)(硅藻)、真眼点藻门(eustigmatophyta)和甲藻(dinoflagellates)以及原核门的蓝藻(蓝绿藻)。术语“藻类”包括例如选自以下的藻类:双眉藻属(amphora)、鱼腥藻属、纤维藻属(anikstrodesmis)、葡萄藻属(botryococcus)、角毛藻属(chaetoceros)、衣藻属(chlamydomonas)、小球藻属(chlorella)、绿球藻属(chlorococcum)、小环藻属(cyclotella)、筒柱藻属(cylindrotheca)、杜氏藻属(dunaliella)、球石藻属(emiliana)、裸藻属(euglena)、红球藻属(hematococcus)、等鞭金藻属(isochrysis)、单鞭金藻属(monochrysis)、单针藻属
(monoraphidium)、微球藻属(nannochloris)、拟微绿球藻属(nannnochloropsis)、舟形藻属(navicula)、肾鞭藻属(nephrochloris)、肾藻属(nephroselmis)、菱形藻属(nitzschia)、节球藻属(nodularia)、念珠藻属(nostoc)、金藻属(oochromonas)、卵囊藻属(oocystis)、oscillartoria、巴夫藻属(pavlova)、褐指藻属(phaeodactylum)、扁藻属(playtmonas)、颗石藻属(pleurochrysis)、甘紫菜属(porhyra)、伪鱼腥藻属(pseudoanabaena)、塔胞藻属(pyramimonas)、裂丝藻属(stichococcus)、聚球藻属(synechococcus)、集胞藻属(synechocystis)、四鞭藻属(tetraselmis)、海链藻属(thalassiosira)和束毛藻属(trichodesmium)。
[0644]
可根据本发明的方法处理植物的一部分,即“植物组织”,以产生改良的植物。植物组织也涵盖植物细胞。如本文所用的术语“植物细胞”是指活体植物的个体单元,其在完整的整株植物中或呈在体外组织培养中、在培养基或琼脂上、以生长培养基或缓冲液中的悬浮液形式生长的分离形式或作为较高组织化单元(例如植物组织、植物器官或整株植物)的一部分。
[0645]“原生质体”是指植物细胞已经通过使用例如机械或酶促方法全或部分去除了其保护性细胞壁,从而产生了活体植物的完整的生化胜任单元,所述原生质体可重新形成其细胞壁,在适当的生长条件下增殖并再生生长成完整的植物。
[0646]
术语“转化”广义上是指通过农杆菌或多种化学或物理方法之一通过引入dna对植物宿主进行遗传修饰的过程。如本文所用,术语“植物宿主”是指植物,包括植物的任何细胞、组织、器官或后代。许多合适的植物组织或植物细胞可进行转化,并且其包括但不限于原生质体、体细胞胚、花粉、叶片、幼苗、茎、愈伤组织、匍匐茎、微块茎和芽。植物组织还指这种植物、种子、后代、繁殖体的任何克隆,无论是有性或无性繁殖的,以及任何这些的后代,例如插条或种子。
[0647]
如本文所用,术语“转化的”是指已向其中引入外来dna分子例如构建体的细胞、组织、器官或生物体。可将引入的dna分子整合到受体细胞、组织、器官或生物体的基因组dna中,使得所引入的dna分子被传递至随后的后代。在这些实施方案中,“转化的”或“转基因的”细胞或植物还可包括所述细胞或植物的后代,以及从育种程序产生的后代,所述育种程序使用这种转化的植物作为杂交中的亲本并表现出由所引入的dna分子的存在而产生的改变的表型。优选地,转基因植物是可育的并且能够通过有性繁殖将所引入的dna传递给后代。
[0648]
术语“后代”,例如转基因植物的后代,是由植物或转基因植物生出、产生或衍生的后代。所引入的dna分子也可被瞬时引入受体细胞中,使得所引入的dna分子不会被随后的后代遗传,因此不被认为是“转基因的”。因此,如本文所用,“非转基因”植物或植物细胞是不包含稳定整合到其基因组中的外来dna的植物。
[0649]
如本文所用,术语“植物启动子”是能够启动植物细胞中的转录的启动子,而不管其起源是否是植物细胞。示例性的合适的植物启动子包括但不限于从植物、植物病毒以及包含在植物细胞中表达的基因的细菌例如农杆菌或根瘤菌获得的那些。
[0650]
如本文所用,“真菌细胞”是指真菌界内的任何类型的真核细胞。真菌界内的门包括子囊菌门(ascomycota)、担子菌门(basidiomycota)、芽枝霉门(blastocladiomycota)、壶菌门(chytridiomycota)、球囊菌门(glomeromycota)、微孢子门(microsporidia)和新美
鞭菌门(neocallimastigomycota)。真菌细胞可包括酵母、霉菌和丝状真菌。在一些实施方案中,真菌细胞是酵母细胞。
[0651]
如本文所用,术语“酵母细胞”是指子囊菌门和担子菌门内的任何真菌细胞。酵母细胞可包括出芽的酵母细胞、裂变酵母细胞和霉菌细胞。不限于这些生物体,在实验室和工业环境中使用的许多类型的酵母是子囊菌门的一部分。在一些实施方案中,酵母细胞是啤酒酵母(s.cerervisiae)、马克斯克鲁维酵母(kluyveromyces marxianus)或东方伊萨酵母(issatchenkia orientalis)细胞。其他酵母细胞可包括但不限于假丝酵母属(candida)(例如白色念珠菌(candida albicans)),耶氏酵母属(yarrowia)(例如解脂耶氏酵母(yarrowia lipolytica)),毕赤酵母属(pichia)(例如巴斯德毕赤酵母(pichia pastoris)),克鲁维酵母属(kluyveromyces)(例如乳酸克鲁维酵母(kluyveromyces lactis)和马克斯克鲁维酵母(kluyveromyces marxianus)),链孢霉属(neurospora)(例如粗糙链孢霉(neurospora crassa)),镰刀菌属(fusarium)(例如尖孢镰刀菌(fusarium oxysporum))和伊萨酵母属(issatchenkia)(例如东方伊萨酵母(issatchenkia orientalis),又称为库德毕赤酵母(pichia kudriavzevii)和酸嗜热假丝酵母(candida acidothermophilum))。在一些实施方案中,真菌细胞是丝状真菌细胞。如本文所用,术语“丝状真菌细胞”是指在丝状体中生长的任何类型的真菌细胞,即菌丝或菌丝体。丝状真菌细胞的实例可包括但不限于曲霉属(aspergillus)(例如黑曲霉(aspergillus niger)),木霉属(trichoderma)(例如里氏木霉(trichoderma reesei)),根霉属(rhizopus)(例如米根霉(rhizopus oryzae))和被孢霉属(mortierella)(例如深黄被孢霉(mortierella isabellina))。
[0652]
在一些实施方案中,真菌细胞是工业菌株。如本文所用,“工业菌株”是指在工业过程中使用或分离的任何真菌细胞菌株,例如,以商业或工业规模生产产品。工业菌株可指通常在工业过程中使用的真菌物种,或者可指也可用于非工业目的(例如实验室研究)的真菌物种的分离物。工业过程的实例可包括发酵(例如,在食品或饮料产品的生产中),蒸馏,生物燃料的生产,化合物的生产以及多肽的生产。工业菌株的实例可包括但不限于jay270和atcc4124。
[0653]
在一些实施方案中,真菌细胞是多倍体细胞。如本文所用,“多倍体”细胞可指其基因组以一个以上拷贝存在的任何细胞。多倍体细胞可指以多倍体状态天然存在的细胞类型,或者其可指已经被诱导以多倍体状态存在的细胞(例如,通过特定的调控、改变、失活、活化,或减数分裂、胞质分裂或dna复制的修饰)。多倍体细胞可指其整个基因组是多倍体的细胞,或者其可指在特定的目标基因组基因座中为多倍体的细胞。不希望受理论的束缚,据认为,在多倍体细胞的基因组工程中,相比于单倍体细胞的基因组工程中,指导rna的丰度可能更通常是限速组分,因此,使用本文所述的系统的方法可利用使用某种真菌细胞类型的优势。
[0654]
在一些实施方案中,真菌细胞是二倍体细胞。如本文所用,“二倍体”细胞可指其基因组以两个拷贝存在的任何细胞。二倍体细胞可指以二倍体状态天然存在的细胞类型,或者其可指已经被诱导以二倍体状态存在的细胞(例如,通过特定的调控、改变、失活、活化,或减数分裂、胞质分裂或dna复制的修饰)。例如,酿酒酵母菌株s228c可维持在单倍体或二倍体状态。二倍体细胞可指其整个基因组是二倍体的细胞,或者其可指在目标特定基因组
基因座中为二倍体的细胞。在一些实施方案中,真菌细胞是单倍体细胞。如本文所用,“单倍体”细胞可指其基因组以一个拷贝存在的任何细胞。单倍体细胞可指以单倍体状态天然存在的细胞类型,或者其可指已经被诱导以单倍体状态存在的细胞(例如,通过特定的调控、改变、失活、活化,或减数分裂、胞质分裂或dna复制的修饰)。例如,酿酒酵母菌株s228c可维持在单倍体或二倍体状态。单倍体细胞可指其整个基因组为单倍体的细胞,或者其可指在目标特定基因组基因座中为单倍体的细胞。
[0655]
如本文所用,“酵母表达载体”是指包含一个或多个编码rna和/或多肽的序列并且还可包含控制核酸表达的任何所需元件以及能够在酵母细胞内部复制和维持表达载体的任何元件的核酸。许多合适的酵母表达载体及其特征在本领域中是已知的;例如,各种载体和技术说明于yeast protocols,第2版,xiao,w.编辑(humana press,new york,2007);以及buckholz,r.g.和gleeson,m.a.(1991)biotechnology(ny)9(11):1067

72。酵母载体可包含但不限于着丝粒(cen)序列,自主复制序列(ars),可操作地连接到目标序列或基因的启动子(例如rna聚合酶iii启动子),终止子如rna聚合酶iii终止子,复制起点和标志基因(例如营养缺陷型、抗生素或其他可选择标志物)。用于酵母的表达载体的实例可包括质粒,酵母人工染色体,2μ质粒,酵母整合质粒,酵母复制质粒,穿梭载体和附加型质粒。
[0656]
在植物和植物细胞的基因组中的稳定整合
[0657]
在特定的实施方案中,设想引入编码所述系统组分的多核苷酸以稳定整合到植物细胞的基因组中。在这些实施方案中,转化载体或表达系统的设计可根据何时、何地以及在何种条件下表达指导rna和/或cas基因来进行调节。
[0658]
在特定的实施方案中,设想将所述系统的组分稳定地引入植物细胞的基因组dna中。另外地或可替代地,设想引入所述系统的组分以稳定整合到植物细胞器的dna中,所述植物细胞器例如但不限于质体、线粒体或叶绿体。
[0659]
用于稳定整合到植物细胞的基因组中的表达系统可包含一种或多种以下元件:可用于在植物细胞中表达rna和/或crispr蛋白的启动子元件;5'非翻译区域,以增强表达;内含子元件,以进一步增强某些细胞如单子叶植物细胞中的表达;多克隆位点,为插入指导rna和/或crispr基因序列和其他所需元件提供适宜的限制性位点;以及3'非翻译区,以提供所表达的转录物的有效终止。
[0660]
表达系统的元件可在一个或多个表达构建体上,所述构建体是环状的,例如质粒或转化载体,或者是非环状的,例如线性双链dna。
[0661]
在一个特定的实施方案中,crispr表达系统至少包含:
[0662]
(a)编码与植物中的靶序列杂交的指导rna(grna)的核苷酸序列,并且其中所述指导rna包含指导序列和正向重复序列,以及
[0663]
(b)编码cas蛋白的核苷酸序列,
[0664]
其中组分(a)或(b)位于相同或不同的构建体上,并且由此不同的核苷酸序列可在植物细胞中可操作的相同或不同的调控元件的控制下。
[0665]
可通过多种常规技术将含有所述系统组分以及适当时模板序列的dna构建体引入植物、植物部分或植物细胞的基因组中。所述方法通常包括以下步骤:选择合适的宿主细胞或宿主组织,以及将构建体引入宿主细胞或宿主组织中。
[0666]
在特定的实施方案中,可使用例如但不限于植物细胞原生质体的电穿孔、显微注
射,气溶胶束注射的技术将dna构建体引入植物细胞中,或者可使用生物弹射法将dna构建体直接引入植物组织,例如dna粒子轰击(也参见fu等人,transgenic res.2000年2月;9(1):11

9)。粒子轰击的基础是被目标基因包被的粒子向细胞的加速,导致原生质被粒子穿透并且通常稳定整合到基因组中。(参见例如klein等人,nature(1987);klein等人,bio/technology(1992);casas等人,proc.natl.acad.sci.usa(1993))。
[0667]
在特定的实施方案中,可通过农杆菌介导的转化将含有所述系统组分的dna构建体引入植物中。可将dna构建体与合适的t

dna侧翼区组合,并引入常规的根癌农杆菌(agrobacterium tumefaciens)宿主载体中。通过感染植物或通过用含有一种或多种ti(诱导肿瘤)质粒的农杆菌属细菌温育植物原生质体,可将外来dna并入植物基因组中。(参见例如fraley等人,(1985);rogers等人,(1987);以及美国专利第5,563,055号)。
[0668]
植物启动子
[0669]
为了确保在植物细胞中的适当表达,本文所述的系统的组分通常置于植物启动子,即在植物细胞中可操作的启动子的控制下。设想使用不同类型的启动子。
[0670]
组成型植物启动子是能够表达在植物的所有或几乎所有发育阶段在所有或几乎所有植物组织中控制的开放阅读框(orf)的启动子(称为“组成型表达”)。组成型启动子的一个非限制性实例是花椰菜花叶病毒35s启动子。“调控的启动子”是指不是组成型地而是以时间和/或空间调控的方式引导基因表达的启动子,并且包括组织特异性的、组织优选的和诱导型的启动子。不同的启动子可引导基因在不同的组织或细胞类型中,或在不同的发育阶段,或响应于不同的环境条件而表达。在特定的实施方案中,一种或多种crispr组分在组成型启动子例如花椰菜花叶病毒35s启动子的控制下表达,组织优选的启动子可用于靶向特定植物组织内某些细胞类型(例如叶或根或种子特定细胞中的维管细胞)中的增强表达。在系统中使用的特定启动子的实例见于kawamata等人,(1997)plant cell physiol 38:792

803;yamamoto等人,(1997)plant j 12:255

65;hire等人,(1992)plant mol biol 20:207

18;kuster等人,(1995)plant mol biol 29:759

72;以及capana等人,(1994)plant mol biol 25:681

91。
[0671]
可诱导的并且允许时空控制基因编辑或基因表达的启动子的实例可使用能量的形式。能量的形式可包括但不限于声能、电磁辐射、化学能和/或热能。诱导系统的实例包括四环素诱导型启动子(tet

on或tet

off),小分子双杂合转录激活系统(fkbp、aba等)或光诱导系统(植物色素、lov结构域或隐花色素),例如光诱导型转录效应子(lite),其以序列特异性方式引导转录活性的变化。光诱导系统的组分可包括cas crispr酶、光响应性细胞色素异二聚体(例如来自拟南芥)和转录激活/阻遏结构域。可诱导的dna结合蛋白及其使用方法的其他实例提供于us 61/736465和us 61/721,283,其通过引用整体并入本文。
[0672]
在特定的实施方案中,瞬时或可诱导的表达可通过使用例如化学调控的启动子来实现,即由此外源化学物质的应用诱导基因表达。基因表达的调节还可通过化学可阻遏的启动子获得,其中化学物质的应用阻遏基因表达。化学诱导型启动子包括但不限于由苯磺酰胺除草剂安全剂激活的玉米ln2

2启动子(de veylder等人,(1997)plant cell physiol 38:568

77),被用作芽前除草剂的疏水性亲电化合物激活的玉米gst启动子(gst

ll

27,wo93/01294),以及被水杨酸激活的烟草pr

1a启动子(ono等人,(2004)biosci biotechnol biochem 68:803

7)。本文中也可使用由抗生素调控的启动子,例如四环素诱导型和四环素
阻遏型启动子(gatz等人,(1991)mol gen genet 227:229

37;美国专利第5,814,618号和第5,789,156号)。
[0673]
易位至特定植物细胞器和/或在特定植物细胞器中表达
[0674]
所述系统可包含用于易位至特定植物细胞器和/或在特定植物细胞器中表达的元件。
[0675]
叶绿体靶向
[0676]
在特定的实施方案中,设想将所述系统用于特异性修饰叶绿体基因或确保在叶绿体中表达。为此目的,使用叶绿体转化方法或将所述系统组分分隔到叶绿体。例如,在质体基因组中引入遗传修饰可减少生物安全性问题,例如通过花粉进行基因流动。
[0677]
叶绿体转化的方法是本领域已知的,并且包括粒子轰击、peg处理和显微注射。另外,可如wo2010061186中所述使用涉及将转化盒从核基因组易位至质体的方法。
[0678]
或者,设想将一种或多种系统组分靶向植物叶绿体。这是通过将编码叶绿体转运肽(ctp)或质体转运肽的序列并入表达构建体中来实现的,所述序列可操作地连接到编码cas蛋白的序列的5'区域。在易位到叶绿体期间的处理步骤中,ctp被去除。所表达蛋白质的叶绿体靶向是技术人员众所周知的(参见例如protein transport into chloroplasts,2010,annual review of plant biology,第61卷:157

180)。在这样的实施方案中,还期望将指导rna靶向植物叶绿体。可用于通过叶绿体定位序列将指导rna易位到叶绿体中的方法和构建体描述于例如us 20040142476中,其通过引用并入本文。可将这种构建体的变体并入本发明的表达系统中,以有效地易位cas

指导rna。
[0679]
在藻类细胞中引入多核苷酸
[0680]
转基因藻类(或其他植物如油菜)在生产植物油或生物燃料如醇类(尤其是甲醇和乙醇)或其他产品中可能特别有用。这些可被设计成表达或过表达用于石油或生物燃料工业的高水平的油或醇。
[0681]
us 8945839描述了一种使用cas9将微藻(莱茵衣藻(chlamydomonas reinhardtii)细胞)物种工程化的方法。使用类似的工具,本文所述系统的方法可应用于衣藻属物种和其他藻类。在特定的实施方案中,将cas和指导rna引入使用在组成型启动子例如hsp70a

rbc s2或β2

微管蛋白的控制下表达cas的载体表达的藻类中。指导rna任选地使用含有t7启动子的载体递送。或者,可将cas mrna和体外转录的指导rna递送至藻类细胞。电穿孔方案对于技术人员是可用的,例如来自geneart衣藻工程化试剂盒的标准推荐方案。
[0682]
在特定的实施方案中,本文使用的核酸内切酶是分裂cas酶。如wo 2015086795中对于cas9所描述的那样,分裂cas酶优先用于藻类中以用于靶向基因组修饰。cas分裂系统的使用特别适用于可诱导的基因组靶向方法,并且避免了cas过表达在藻类细胞内的潜在毒性作用。在特定的实施方案中,可将所述cas分裂结构域(在cas9的情况下为ruvc和hnh结构域)同时或依序地引入细胞中,以使得所述分裂cas结构域在藻类细胞中加工靶核酸序列。与野生型cas相比,分裂cas的大小减小,允许将所述系统递送至细胞的其他方法,例如使用如本文所述的细胞穿透肽。这种方法对于生成遗传修饰藻类特别令人感兴趣。
[0683]
在酵母细胞中引入多核苷酸
[0684]
在特定的实施方案中,本发明涉及所述系统在酵母细胞的基因组编辑中的用途。转化酵母细胞的方法可用于引入编码所述系统组分的多核苷酸,这是本领域技术人员众所
周知的,并且综述于kawai等人,2010,bioeng bugs.2010年11月至12月;1(6):395

403)。非限制性实例包括通过乙酸锂处理(其还可包括载体dna和peg处理)、轰击或通过电穿孔转化酵母细胞。
[0685]
crispr系统组分在植物和植物细胞中的瞬时表达
[0686]
在特定的实施方案中,设想了指导rna和/或cas基因在植物细胞中瞬时表达。在这些实施方案中,仅当指导rna和cas蛋白都存在于细胞中时,所述系统才能确保靶基因的修饰,从而可进一步控制基因组修饰。由于cas酶的表达是瞬时的,因此从此类植物细胞再生的植物通常不包含外来dna。在特定的实施方案中,cas酶由植物细胞稳定表达,并且指导序列是瞬时表达的。
[0687]
在特定的实施方案中,可使用植物病毒载体将所述系统组分引入植物细胞中(scholthof等人,1996,annu rev phytopathol.1996;34:299

323)。在其他特定实施方案中,所述病毒载体是来自dna病毒的载体。例如,双生病毒(例如卷心菜叶卷曲病毒、豆黄矮化病毒、小麦矮化病毒、番茄叶卷曲病毒、玉米条纹病毒、烟草叶卷曲病毒或番茄金黄花叶病毒)或纳米病毒(例如蚕豆坏死黄色病毒)。在其他特定的实施方案中,所述病毒载体是来自rna病毒的载体。例如,妥布病毒(例如,烟草脆裂病毒、烟草花叶病毒),马铃薯x病毒(例如马铃薯病毒x)或大麦病毒(例如大麦条纹花叶病毒)。植物病毒的复制基因组是非整合载体。
[0688]
在特定的实施方案中,用于cas crispr构建体瞬时表达的载体是例如peaq载体,该载体针对在原生质体中农杆菌介导的瞬时表达而定制(sainsbury f.等人,plant biotechnol j.2009年9月;7(7):682

93)。使用修饰的卷心菜叶卷曲病毒(calcuv)载体在表达crispr酶的稳定转基因植物中表达grna证明了基因组位置的精确靶向(scientific reports 5,文章编号:14926(2015),doi:10.1038/srep14926)。
[0689]
在特定的实施方案中,可将编码指导rna和/或cas基因的双链dna片段瞬时引入植物细胞。在这样的实施方案中,所引入的双链dna片段以足以修饰细胞的量提供,但是在经过预期的时间段之后或在一次或多次细胞分裂后不会持续存在。植物中直接dna转移的方法是技术人员已知的(参见例如davey等人,plant mol biol.1989年9月;13(3):273

85)。
[0690]
在其他实施方案中,将编码cas蛋白的rna多核苷酸引入植物细胞,然后由宿主细胞翻译和加工,产生足以修饰细胞的量的蛋白(在至少一个指导rna的存在下),但是在经过预期的时间段后或一次或多次细胞分裂后,这种作用不会持续存在。将mrna引入植物原生质体以进行瞬时表达的方法是技术人员已知的(参见例如gallie,plant cell reports(1993),13;119

122)。
[0691]
还设想了上述不同方法的组合。
[0692]
将系统组分递送至植物细胞
[0693]
在特定的实施方案中,令人感兴趣的是将所述系统的一种或多种组分直接递送至植物细胞。这对于非转基因植物的生成是尤其令人感兴趣的(参见下文)。在特定的实施方案中,一个或多个cas组分在植物或植物细胞外部制备并递送至细胞。例如,在特定的实施方案中,在引入植物细胞之前在体外制备cas蛋白。cas蛋白可通过本领域技术人员已知的多种方法制备,并且包括重组生产。表达后,将cas蛋白分离,根据需要重新折叠,纯化并任选地处理以去除任何纯化标签,例如his标签。一旦获得粗制的、部分纯化的或更完全纯化
的cas蛋白,就可将所述蛋白引入植物细胞。
[0694]
在特定的实施方案中,将cas蛋白与靶向目标基因的指导rna混合以形成预组装的核糖核蛋白。
[0695]
可经由电穿孔,通过与cas相关的基因产物包被的粒子轰击,通过化学转染或通过一些其他跨细胞膜转运的手段,将单个组分或预组装的核糖核蛋白引入植物细胞。例如,已经证明用预组装的crispr核糖核蛋白转染植物原生质体以确保对植物基因组的靶向修饰(如woo等人,nature biotechnology,2015;doi:10.1038/nbt.3389所述)。
[0696]
在特定的实施方案中,使用纳米粒子将系统组分引入植物细胞。可将作为蛋白质或核酸或它们的组合的组分上载到纳米粒子上或包装在纳米粒子中并施加到植物(例如,在wo 2008042156和us20130185823中所述)。特别地,本发明的实施方案包括用如wo2015089419中所述的编码cas蛋白的dna分子、编码指导rna和/或分离的指导rna的dna分子上载或包装的纳米粒子。
[0697]
将所述系统的一种或多种组分引入植物细胞的其他手段是通过使用细胞穿透肽(cpp)。因此,特别地,本发明的实施方案包括包含与cas蛋白连接的细胞穿透肽的组合物。在本发明的特定实施方案中,cas蛋白和/或指导rna与一种或多种cpp偶联,以有效地将其转运到植物原生质体内部;还参见ramakrishna(2014)genome res.2014年6月;24(6):1020

7,对于人类细胞中的cas9)。在其他实施方案中,cas基因和/或指导rna由一个或多个环状或非环状dna分子编码,所述环状或非环状dna分子与一种或多种cpp偶联以用于植物原生质体递送。然后将植物原生质体再生为植物细胞并进一步再生为植物。cpp通常被描述为少于35个氨基酸的短肽,其来源于蛋白质或嵌合序列,其能够以不依赖受体的方式跨细胞膜转运生物分子。cpp可以是阳离子肽,具有疏水性序列的肽,两亲性肽,具有富含脯氨酸和抗微生物序列的肽,以及嵌合或二分肽(pooga和langel2005)。cpp能够穿透生物膜并因此触发各种生物分子穿过细胞膜进入细胞质并改善它们的细胞内路径,并因此促进生物分子与靶标的相互作用。cpp的实例尤其包括:tat,hiv 1型病毒复制所需的核转录激活蛋白,penetratin,kaposi成纤维细胞生长因子(fgf)信号肽序列,整联蛋白β3信号肽序列;聚精氨酸肽args序列,富鸟嘌呤分子转运蛋白,甜箭肽等。
[0698]
产生遗传修饰的非转基因植物
[0699]
在特定的实施方案中,本文所述的系统和方法用于修饰内源基因或修饰其表达,而无需将任何外来基因(包括编码crispr组分的那些)永久引入植物的基因组中,以避免植物的基因组中外来dna的存在。由于非转基因植物的法规要求较不严格,因此这可能是令人感兴趣的。
[0700]
在特定的实施方案中,这通过所述系统组分的瞬时表达来确保。在特定的实施方案中,一种或多种系统组分在一种或多种病毒载体上表达,所述病毒载体产生足够的系统组分以根据本文所述的方法始终稳定地确保目标基因的修饰。
[0701]
在特定的实施方案中,确保了构建体在植物原生质体中的瞬时表达,因此没有整合到基因组中。有限的表达窗口可足以允许所述系统确保如本文所述的靶基因的修饰。
[0702]
在特定的实施方案中,借助于如上文所述的递送分子如纳米粒子或cpp分子的微粒,将所述系统的不同组分分别地或以混合物形式引入植物细胞、原生质体或植物组织中。
[0703]
本文系统的组分的表达可通过cas核酸酶的直接活性和任选地引入模板dna或通
过使用如本文所述的系统靶向的基因进行修饰来诱导基因组的靶向修饰。上文描述的不同策略允许cas介导的靶向基因组编辑,而无需将所述组分引入植物基因组。瞬时引入植物细胞中的组分通常在杂交时被去除。
[0704]
检测植物基因组

可选择标志物中的修饰
[0705]
在特定的实施方案中,在所述方法涉及植物基因组的内源靶基因的修饰的情况下,在用所述系统感染或转染植物、植物部分或植物细胞后,可使用任何合适的方法来确定在目标位点是否发生了基因靶向或靶向诱变。当所述方法涉及转基因的引入时,可通过选择或筛选工程化植物材料中转基因的存在或转基因编码的性状来鉴定和分离转化的植物细胞、愈伤组织、组织或植物。物理和生化方法可用于鉴定含有插入的基因构建体或内源性dna修饰的植物或植物细胞转化体。这些方法包括但不限于:1)southern分析或pcr扩增,用于检测和确定重组dna插入物或修饰的内源基因的结构;2)northern印迹,s1rna酶保护,引物延伸或逆转录酶

pcr扩增,用于检测和检查基因构建体的rna转录物;3)用于检测酶或核酶活性的酶促测定,其中此类基因产物由基因构建体编码或者表达受遗传修饰影响;4)蛋白质凝胶电泳,western印迹技术,免疫沉淀或酶联免疫测定,其中基因构建体或内源基因产物为蛋白质。其他技术,例如原位杂交、酶染色和免疫染色,也可用于检测重组构建体的存在或表达或者检测特定植物器官和组织中内源基因的修饰。进行所有这些测定的方法是本领域技术人员众所周知的。
[0706]
另外地(或可替代地),编码所述系统组分的表达系统通常被设计成包含一个或多个可选择或可检测的标志物,所述标志物提供了一种手段以在早期和大规模地分离或有效地选择含有所述系统和/或已被所述系统修饰的细胞。
[0707]
在农杆菌介导的转化的情况下,标志物盒可邻近侧翼t

dna边界或在其之间,并包含在二元载体中。在另一个实施方案中,标志物盒可在t

dna的外部。可选择的标志物盒也可在与表达盒相同的t

dna边界之内或附近,或者可在二元载体(例如2t

dna系统)上的第二t

dna内的其他地方。
[0708]
对于粒子轰击或用原生质体转化,表达系统可包含一个或多个分离的线性片段,或者可以是较大构建体的一部分,所述较大构建体可能包含细菌复制元件、细菌可选择标志物或其他可检测元件。包含编码指导物和/或cas的多核苷酸的表达盒可与标志物盒物理连接,或者可与编码标志物盒的第二核酸分子混合。标志物盒由表达可检测或可选择标志物的必要元件组成,其允许有效选择转化细胞。
[0709]
基于可选择标志物的细胞选择程序将取决于标志基因的性质。在特定的实施方案中,使用可选择的标志物,即允许基于标志物的表达直接选择细胞的标志物。可选择标志物可赋予阳性或阴性选择,并且取决于外部底物的存在是条件性或非条件性的(miki等人,2004,107(3):193

232)。最常见的是,将抗生素或除草剂抗性基因用作标志物,从而通过在含有抑制量的标志基因赋予抗性的抗生素或除草剂的培养基上生长工程化植物材料来进行选择。此类基因的实例是赋予抗生素如潮霉素(hpt)和卡那霉素(nptii)抗性的基因,以及赋予除草剂如膦丝菌素(bar)和氯磺隆(als)抗性的基因。
[0710]
还可通过筛选可见标志物的活性来鉴定转化的植物和植物细胞,所述可见标志物通常是能够处理有色底物的酶(例如,β

葡糖醛酸苷酶、荧光素酶、b或c1基因)。这样的选择和筛选方法是本领域技术人员众所周知的。
[0711]
植物培养与再生
[0712]
在特定的实施方案中,可培养具有修饰的基因组并且通过本文所述的任何方法产生或获得的植物细胞,以再生具有转化或修饰的基因型并因此具有所需表型的整株植物。常规的再生技术是本领域技术人员众所周知的。这种再生技术的具体实例依赖于在组织培养基生长培养基中某些植物激素的操纵,并且典型地依赖于已经与所需核苷酸序列一起引入的杀生物剂和/或除草剂标志物。在其他特定实施方案中,植物再生获自培养的原生质体、植物愈伤组织、外植体、器官、花粉、胚胎或其部分(参见例如evans等人,(1983),handbook of plant cell culture;klee等人,(1987)ann.rev.of plant phys.)。
[0713]
在特定的实施方案中,如本文所述的转化的或改良的植物可自花传粉以提供本发明的纯合改良植物的种子(用于dna修饰的纯合子)或与非转基因植物或不同改良植物杂交以提供杂合植物的种子。在将重组dna引入植物细胞的情况下,这种杂交的所得植物是对于重组dna分子杂合的植物。通过从改良植物杂交获得并包含遗传修饰(其可以是重组dna)的这种纯合植物和杂合植物在本文中都称为“后代”。后代植物是原始转基因植物的后代并含有通过本文提供的方法引入的基因组修饰或重组dna分子的植物。或者,也可使用cfp1酶通过上述方法之一获得遗传修饰植物,其中不将外来dna并入基因组中。通过进一步育种获得的此类植物的后代也可能包含遗传修饰。育种是通过通常用于不同农作物的任何育种方法来进行(例如allard,principles of plant breeding,john wiley&sons,ny,u.of ca,davis,ca,50

98(1960))。
[0714]
生成具有增强的农艺性状的植物
[0715]
本文提供的系统可用于引入靶向的双链或单链断裂和/或引入基因激活子和或阻遏子系统,并非限制性地,可用于基因靶向、基因置换、靶向诱变、靶向缺失或插入、靶向倒位和/或靶向易位。通过在单个细胞中共表达旨在实现多种修饰的多个靶向rna,可确保多重基因组修饰。该技术可用于具有改善特性的植物的高精度工程化,这些特性包括增强的营养质量,增强的抗病性以及对生物和非生物胁迫的抗性,以及商业上有价值的植物产品或异源化合物的产量增加。
[0716]
在特定的实施方案中,如本文所述的系统用于在内源dna序列中引入靶向双链断裂(dsb)。dsb激活细胞dna修复途径,可利用该途径在断裂位点附近实现所需的dna序列修饰。当内源基因的失活可赋予或有助于所需性状时,这是令人感兴趣的。在特定实施方案中,在dsb的位点促进具有模板序列的同源重组,以便引入目标基因。
[0717]
在特定的实施方案中,所述系统可用作与功能结构域融合或可操作地连接以激活和/或阻遏内源植物基因的通用核酸结合蛋白。示例性功能结构域可包括但不限于翻译起始子、翻译激活子、翻译阻遏子、核酸酶,特别是核糖核酸酶、剪接体、珠粒、光诱导/可控制结构域或化学诱导/可控制结构域。典型地,在这些实施方案中,cas蛋白包含至少一种突变,使得其具有不具有至少一种突变的cas蛋白的活性的不超过5%;指导rna包含能够与靶序列杂交的指导序列。
[0718]
本文所述的方法通常导致“改良植物”的生成,因为与野生型植物相比,它们具有一种或多种理想的性状。在特定的实施方案中,获得的植物、植物细胞或植物部分是转基因植物,其包含并入到植物的全部或部分细胞的基因组中的外源dna序列。在特定的实施方案中,获得非转基因的遗传修饰的植物、植物部分或细胞,因为没有外源dna序列被并入到植
物的任何植物细胞的基因组中。在这样的实施方案中,改良的植物是非转基因的。在仅确保内源基因的修饰并且在植物基因组中没有引入或维持外来基因的情况下,所得的经遗传修饰的农作物不包含外来基因,因此基本上可认为是非转基因的。所述系统对于植物基因组编辑的不同应用如下进一步详细描述。
[0719]
引入一个或多个外来基因以赋予目标农业性状
[0720]
本发明提供了基因组编辑或修饰与目标靶基因座相关或在目标靶基因座处的序列的方法,其中所述方法包括将系统引入植物细胞,由此所述系统有效地用于将dna插入物(例如编码目标外来基因)整合到植物细胞的基因组中。在优选的实施方案中,通过用具有外源引入的dna模板或修复模板的hr促进dna插入物的整合。通常,将外源引入的dna模板或修复模板与所述系统或一种组分或用于表达复合物组分的多核苷酸载体一起递送。
[0721]
本文提供的系统允许靶向基因递送。越来越显而易见的是,表达目标基因的效率在很大程度上取决于整合到基因组中的位置。本方法允许将外来基因靶向整合到基因组中的期望位置。可基于先前生成的事件的信息来选择位置,或者可通过本文其他地方公开的方法来选择位置。
[0722]
在特定的实施方案中,本文提供的方法包括(a)将包含指导rna的cas crispr复合物引入细胞中,所述指导rna包含正向重复序列和指导序列,其中所述指导序列与植物细胞内源的靶序列杂交;(b)将cas效应分子引入植物细胞,当所述指导序列与靶序列杂交时,所述cas效应分子与所述指导rna复合并在所述指导序列所靶向的序列处或其附近诱导双链断裂;以及(c)将编码hdr修复模板的核苷酸序列引入细胞中,所述hdr修复模板编码目标基因,并且由于hdr而被引入ds断裂的位置。在特定的实施方案中,引入步骤可包括将一种或多种编码cas效应蛋白、指导rna和修复模板的多核苷酸递送至植物细胞。在特定的实施方案中,多核苷酸通过dna病毒(例如双生病毒)或rna病毒(例如脆裂病毒)被递送至细胞中。在特定的实施方案中,引入步骤包括将含有编码cas效应蛋白、指导rna和修复模板的一个或多个多核苷酸序列的t

dna递送至植物细胞,其中所述递送是经由农杆菌。编码cas效应蛋白的核酸序列可以可操作地连接到启动子,例如组成型启动子(例如花椰菜花叶病毒35s启动子)或细胞特异性或诱导型启动子。在特定的实施方案中,通过微粒轰击引入多核苷酸。在特定的实施方案中,所述方法还包括在引入步骤之后筛选植物细胞,以确定是否已经引入了修复模板,即目标基因。在特定的实施方案中,所述方法包括从植物细胞再生植物的步骤。在其他实施方案中,所述方法包括使植物杂交育种以获得遗传上所需的植物谱系。下面列出了编码目标性状的外来基因的实例。
[0723]
编辑内源基因以赋予目标农业性状
[0724]
本发明提供了基因组编辑或修饰与目标靶基因座相关或在目标靶基因座处的序列的方法,其中所述方法包括将系统引入植物细胞,由此所述系统修饰植物的内源基因的表达。这可以不同的方式实现。在特定的实施方案中,消除内源基因的表达是合乎需要的,并且使用所述系统靶向和切割内源基因以修饰基因表达。在这些实施方案中,本文提供的方法包括(a)将cas crispr复合物引入植物细胞,所述cas crispr复合物包含指导rna,所述指导rna包含正向重复序列和指导序列,其中所述指导序列与植物细胞基因组中的目标基因内的靶序列杂交;以及(b)将cas效应蛋白引入细胞中,所述cas效应蛋白与指导rna结合后包含与靶序列杂交的指导序列,确保在所述指导序列所靶向的序列处或其附近的双链
断裂。在特定的实施方案中,引入步骤可包括将一种或多种编码cas效应蛋白和指导rna的多核苷酸递送至植物细胞。
[0725]
在特定的实施方案中,多核苷酸通过dna病毒(例如双生病毒)或rna病毒(例如脆裂病毒)被递送至细胞中。在特定的实施方案中,引入步骤包括将含有一个或多个编码cas效应蛋白和指导rna的多核苷酸序列的t

dna递送至植物细胞,其中所述递送是经由农杆菌。可将编码所述系统组分的多核苷酸序列可操作地连接到启动子,例如组成型启动子(例如花椰菜花叶病毒35s启动子)或细胞特异性或诱导型启动子。在特定的实施方案中,通过微粒轰击引入多核苷酸。在特定的实施方案中,所述方法还包括在引入步骤之后筛选植物细胞,以确定目标基因的表达是否已经被修饰。在特定的实施方案中,所述方法包括从植物细胞再生植物的步骤。在其他实施方案中,所述方法包括使植物杂交育种以获得遗传上所需的植物谱系。
[0726]
在上述方法的特定实施方案中,通过疾病易感性基因或编码植物防御基因的负调控子(例如mlo基因)的基因的靶向突变来获得抗病作物。在一个特定的实施方案中,通过植物基因中特定核苷酸的靶向取代产生耐除草剂作物,所述植物基因例如编码乙酰乳酸合酶(als)和原卟啉原氧化酶(ppo)的那些。在特定的实施方案中,通过对编码非生物胁迫耐受性的负调控子的基因进行靶向突变的干旱和耐盐作物,通过对waxy基因进行靶向突变的低直链淀粉谷物,通过糊粉层中的主要脂肪酶基因进行靶向突变而具有降低的酸败性的水稻或其他谷物等。在特定的实施方案中。下面列出了编码目标性状的内源基因的更广泛的列表。
[0727]
通过系统调节内源基因以赋予目标农业性状
[0728]
本文还提供了使用本文系统来调节(即激活或阻遏)内源基因表达的方法。这样的方法利用所述系统靶向植物基因组的不同rna序列。更特别地,不同的rna序列与两个或更多个衔接子蛋白(例如适体)结合,由此每个衔接子蛋白与一个或多个功能结构域相缔合,并且其中与衔接子蛋白相缔合的一个或多个功能结构域中的至少一者具有一种或多种活性,包括甲基化酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、dna整合活性、rna切割活性、dna切割活性或核酸结合活性;所述功能结构域用于调节内源植物基因的表达,以获得所需的性状。通常,在这些实施方案中,cas效应蛋白具有一个或多个突变,使得其具有不超过5%的核酸酶活性。
[0729]
在特定的实施方案中,本文提供的方法包括以下步骤:(a)将cas crispr复合物引入细胞,所述cas crispr复合物包含含有正向重复序列和指导序列的指导rna,其中所述指导序列与植物细胞内源的靶序列杂交;(b)将当指导序列与靶序列杂交时与指导rna复合的cas效应分子引入植物细胞;并且其中所述指导rna被修饰为包含与功能结构域结合的不同rna序列(适体)和/或所述cas效应蛋白被修饰为与功能结构域连接。在特定的实施方案中,引入步骤可包括将一个或多个编码(修饰的)cas效应蛋白和(修饰的)指导rna的多核苷酸递送至植物细胞。用于这些方法的系统组分的细节在本文其他地方进行了描述。
[0730]
在特定的实施方案中,多核苷酸通过dna病毒(例如双生病毒)或rna病毒(例如脆裂病毒)被递送至细胞中。在特定的实施方案中,引入步骤包括将含有一个或多个编码cas效应蛋白和指导rna的多核苷酸序列的t

dna递送至植物细胞,其中所述递送是经由农杆菌。编码所述系统的一种或多种组分的核酸序列可以可操作地连接到启动子,例如组成型
启动子(例如花椰菜花叶病毒35s启动子)或细胞特异性或诱导型启动子。在特定的实施方案中,通过微粒轰击引入多核苷酸。在特定的实施方案中,所述方法还包括在引入步骤之后筛选植物细胞,以确定目标基因的表达是否已经被修饰。在特定的实施方案中,所述方法包括从植物细胞再生植物的步骤。在其他实施方案中,所述方法包括使植物杂交育种以获得遗传上所需的植物谱系。下面列出了编码目标性状的内源基因的更广泛的列表。
[0731]
多倍体植物的修饰
[0732]
许多植物都是多倍体的,这意味着它们携带其基因组的复制拷贝,有时多达六个,如在小麦中。利用所述系统的根据本发明的方法可被“多重化”以影响基因的所有拷贝,或一次靶向数十个基因。例如,在特定的实施方案中,本发明的方法用于同时确保负责抑制疾病防御的不同基因中的功能丧失突变。在特定的实施方案中,本发明的方法用于同时抑制tamlo

al、tamlo

bl和tamlo

dl核酸序列在小麦植物细胞中的表达并由此再生小麦植物,以确保所述小麦植物对白粉病具有抗性(还参见wo2015109752)。
[0733]
赋予农艺性状的示例性基因
[0734]
如上文所述,在特定的实施方案中,本发明涵盖使用本文所述的系统来插入目标dna,包括一个或多个植物可表达基因。在其他特定的实施方案中,本发明涵盖使用如本文所述的系统用于部分或完全缺失一个或多个植物表达基因的方法和工具。在其他进一步的特定实施方案中,本发明涵盖使用如本文所述的系统的方法和工具,以确保通过一个或多个核苷酸的突变、取代、插入来修饰一个或多个植物表达基因。在其他特定的实施方案中,本发明涵盖使用如本文所述的系统,以通过引导所述基因表达的一个或多个调控元件的特异性修饰来确保修饰一个或多个植物表达基因的表达。
[0735]
在特定的实施方案中,本发明涵盖涉及外源基因的引入和/或内源基因及其调控元件的靶向的方法,例如以下所列:
[0736]
1.赋予对害虫或病害的抗性的基因:
[0737]
植物抗病基因。可用克隆的抗性基因转化植物以工程化对特定病原体菌株具有抗性的植物。参见例如jones等人,science 266:789(1994)(对黄腐枝孢菌(cladosporium fulvum)具有抗性的番茄cf

9基因的克隆);martin等人,science 262:1432(1993)(对编码蛋白激酶的丁香假单胞菌番茄致病变种(pseudomonas syringae pv.tomato)具有抗性的番茄pto基因);mindrinos等人,cell 78:1089(1994)(拟南芥可能是对丁香假单胞菌(pseudomonas syringae)具有抗性的rsp2基因)。可对病原体感染期间上调或下调的植物基因进行工程化以抵抗病原体。参见例如thomazella等人,biorxiv 064824;doi:doi.org/10.1101/064824,电子出版于2016年7月23日(具有sldmr6

1缺失的番茄植物,sldmr6

1通常在病原体感染期间被上调)。
[0738]
赋予对害虫的抗性的基因,所述害虫例如大豆孢囊线虫(soybean cyst nematode)。参见例如pct申请wo 96/30517;pct申请wo 93/19181。
[0739]
苏云金芽孢杆菌(bacillus thuringiensis)蛋白,参见例如geiser等人,gene 48:109(1986)。
[0740]
凝集素,参见例如van damme等人,plant molec.biol.24:25(1994。
[0741]
维生素结合蛋白,例如抗生物素蛋白,参见pct申请us93/06487,教导了抗生物素蛋白和抗生物素蛋白同系物作为针对虫害的杀幼虫剂的用途。
[0742]
酶抑制剂,例如蛋白酶或蛋白酶抑制剂或淀粉酶抑制剂。参见例如abe等人,j.biol.chem.262:16793(1987);huub等人,plant molec.biol.21:985(1993));sumitani等人,biosci.biotech.biochem.57:1243(1993);以及美国专利第5,494,813号。
[0743]
昆虫特异性激素或信息素,例如蜕皮类固醇或幼年激素、其变体、基于其的模拟物、或其拮抗剂或激动剂。参见例如hammock等人,nature 344:458(1990)。
[0744]
昆虫特异性肽或神经肽,其在表达时会破坏受影响害虫的生理学。例如regan,j.biol.chem.269:9(1994);和pratt等人,biochem.biophys.res.comm.163:1243(1989)。还参见美国专利第5,266,317号。
[0745]
蛇、黄蜂或任何其他生物体在自然界中产生的昆虫特有毒液。例如,参见pang等人,gene 116:165(1992)。
[0746]
引起单萜、倍半萜、类固醇、异羟肟酸、苯丙素类衍生物或另一具有杀虫活性的非蛋白质分子过度积累的酶。
[0747]
涉及生物活性分子的修饰(包括翻译后修饰)的酶;例如,糖酵解酶、蛋白水解酶、脂解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶,无论是天然的还是合成的。参见pct申请wo93/02197;kramer等人,insect biochem.molec.biol.23:691(1993);以及kawalleck等人,plant molec.biol.21:673(1993)。
[0748]
刺激信号转导的分子。例如,参见botella等人,plant molec.biol.24:757(1994);和griess等人,plant physiol.104:1467(1994)。
[0749]
病毒侵入性蛋白质或由其衍生的复合毒素。参见beachy等人,ann.rev.phytopathol.28:451(1990)。
[0750]
自然界中由病原体或寄生虫产生的发育抑制蛋白。参见lamb等人,bio/technology 10:1436(1992);和toubart等人,plant j.2:367(1992)。
[0751]
自然界中由植物产生的发育抑制蛋白。例如,logemann等人,bio/technology 10:305(1992)。
[0752]
在植物中,病原体通常是宿主特异性的。例如,一些镰刀菌物种将引起番茄萎缩,但仅侵害番茄,而其他镰刀菌物种仅侵害小麦。植物具有抵抗大多数病原体的现有和诱导防御能力。跨植物世代的突变和重组事件导致遗传变异,所述遗传变异引起易感性,尤其是因为病原体的繁殖频率高于植物。在植物中可能存在非宿主抗性,例如宿主与病原体不相容,或者对病原体的所有小种都有部分抗性,通常由许多基因控制,和/或对病原体的某些小种但不是其他小种也具有完全抗性。这种抗性通常由一些基因控制。使用所述系统的方法和组分,现在存在一种新工具,可预期诱导特定的突变。因此,人们可分析抗性基因来源的基因组,并在具有所需特性或性状的植物中,使用所述系统的方法和组分来诱导抗性基因的产生。本发明系统可以比以前的诱变剂更精确地进行,因此可加速和改善植物育种程序。
[0753]
2.涉及植物病害的基因,例如wo 2013046247中列出的基因:
[0754]
水稻病害:稻瘟病菌(magnaporthe grisea)、宫部旋孢腔菌(cochliobolus miyabeanus)、纹枯病菌(rhizoctonia solani)、稻恶苗病菌(gibberella fujikuroi);小麦病害:白粉病菌(erysiphe graminis)、禾谷镰刀菌(fusarium graminearum)、燕麦镰刀
菌(f.avenaceum)、黄色镰刀菌(f.culmorum)、雪霉镰孢菌(microdochium nivale)、条锈病菌(puccinia striiformis)、禾柄锈菌(p.graminis)、隐匿柄锈菌(p.recondita)、雪腐小赤壳(micronectriella nivale)、雪腐病菌(typhula sp.)、小麦散黑粉病菌(ustilago tritici)、小麦腥黑穗病菌(tilletia caries)、小麦基腐病菌(pseudocercosporella herpotrichoides)、禾生球腔菌(mycosphaerella graminicola)、颖枯壳多孢(stagonospora nodorum)、偃麦草核腔菌(pyrenophora tritici

repentis);大麦病害:白粉病菌、禾谷镰刀菌、燕麦镰刀菌、黄色镰刀菌、雪霉镰孢菌、条锈病菌、禾柄锈菌、大麦坚黑粉菌(p.hordei)、大麦散黑粉菌(ustilago nuda)、大麦云纹病菌(rhynchosporium secalis)、大麦网斑病菌(pyrenophora teres)、禾旋孢腔菌(cochliobolus sativus)、大麦条纹病菌(pyrenophora graminea)、纹枯病菌;玉米病害:玉蜀黍黑粉菌(ustilago maydis)、异旋孢腔菌(cochliobolus heterostrophus)、高粱胶尾孢(gloeocercospora sorghi)、多堆柄锈菌(puccinia polysora)、玉米灰斑病菌(cercospora zeae

maydis)、纹枯病菌;
[0755]
柑橘病害:柑橘间座壳菌(diaporthe citri)、柑桔痂囊腔菌(elsinoe fawcetti)、柑橘绿霉菌(penicillium digitatum)、意大利青霉(p.italicum)、寄生疫霉(phytophthora parasitica)、柑橘褐腐疫霉(phytophthora citrophthora);苹果病害:苹果链核盘菌(monilinia mali)、腐烂病菌(valsa ceratosperma)、苹果白粉病菌(podosphaera leucotricha)、苹果斑点落叶病菌(alternaria alternata apple pathotype)、苹果黑星病菌(venturia inaequalis)、炭疽菌(colletotrichum acutatum)、恶疫霉(phytophtora cactorum);
[0756]
梨病害:梨黑星菌(venturia nashicola)、洋梨黑星菌(v.pirina)、梨黑斑病菌(alternaria alternata japanese pear pathotype)、梨胶锈菌(gymnosporangium haraeanum)、恶疫霉;
[0757]
桃病害:桃褐腐病菌(monilinia fructicola)、嗜果枝孢霉(cladosporium carpophilum)、拟茎点霉(phomopsis sp.);
[0758]
葡萄病害:葡萄黑痘病菌(elsinoe ampelina)、围小丛壳(glomerella cingulata)、葡萄白粉病菌(uninula necator)、葡萄层锈菌(phakopsora ampelopsidis)、葡萄黑腐病菌(guignardia bidwellii)、葡萄生单轴霉(plasmopara viticola);
[0759]
柿病害:柿盘孢子菌(gloesporium kaki)、柿尾孢(cercospora kaki)、柿叶球腔菌(mycosphaerela nawae);
[0760]
葫芦病害:葫芦科刺盘孢(colletotrichum lagenarium)、黄瓜白粉病菌(sphaerotheca fuliginea)、黄瓜蔓枯病菌(mycosphaerella melonis)、尖孢镰刀菌、黄瓜霜霉病菌(pseudoperonospora cubensis)、疫霉菌(phytophthora sp.)、腐霉菌(pythium sp.);
[0761]
番茄病害:早疫病菌(alternaria solani)、番茄叶霉病菌(cladosporium fulvum)、致病疫霉(phytophthora infestans);丁香假单胞菌番茄致病变种;南瓜疫病菌(phytophthora capsici);黄单胞菌(xanthomonas);
[0762]
茄子病害:褐纹病菌(phomopsis vexans)、二孢白粉菌(erysiphe cichoracearum);十字花科蔬菜病害:日本链格孢菌(alternaria japonica)、白菜白斑病
菌(cercosporella brassicae)、十字花科根肿病菌(plasmodiophora brassicae)、寄生霜霉(peronospora parasitica);
[0763]
大葱病害:葱柄锈菌(puccinia allii)、葱霜霉(peronospora destructor);
[0764]
大豆病害:大豆紫斑病菌(cercospora kikuchii)、大豆痂囊腔菌(elsinoe glycines)、菜豆间座壳大豆变种(diaporthe phaseolorum var.sojae)、大豆壳针孢(septoria glycines)、大豆灰斑病菌(cercospora sojina)、大豆锈菌(phakopsora pachyrhizi)、大豆疫霉菌(phytophthora sojae)、纹枯病菌、多主棒孢菌(corynespora casiicola)、菌核病菌(sclerotinia sclerotiorum);
[0765]
芸豆病害:豆刺盘孢(colletrichum lindemthianum);
[0766]
花生病害:花生黑斑病菌(cercospora personata)、花生褐斑病菌(cercospora arachidicola)、白绢病菌(sclerotium rolfsii);
[0767]
豌豆病害豌豆:豌豆白粉菌(erysiphe pisi);
[0768]
马铃薯病害:早疫病菌、致病疫霉、马铃薯疫霉绯腐病菌(phytophthora erythroseptica)、马铃薯粉痂菌(spongospora subterranean f.sp.subterranean);
[0769]
草莓病害:草莓白粉病菌(sphaerotheca humuli)、围小丛壳;
[0770]
茶病害:网状外担菌(exobasidium reticulatum)、茶疮痂病菌(elsinoe leucospila)、拟盘多毛孢菌(pestalotiopsis sp.)、茶炭疽病菌(colletotrichum theae

sinensis);
[0771]
烟草病害:烟草赤星病菌(alternaria longipes)、二孢白粉菌、烟草炭疽病菌(colletotrichum tabacum)、烟草霜霉病菌(peronospora tabacina)、烟草疫霉(phytophthora nicotianae);
[0772]
油菜病害:菌核病菌、纹枯病菌;
[0773]
棉花病害:纹枯病菌;
[0774]
甜菜病害:甜菜生尾孢(cercospora beticola)、瓜亡革菌(thanatephorus cucumeris)、瓜亡革菌、黑腐丝囊霉(aphanomyces cochlioides);
[0775]
玫瑰病害:蔷薇双壳菌(diplocarpon rosae)、蔷薇单丝壳菌(sphaerotheca pannosa)、霜霉病菌(peronospora sparsa);
[0776]
菊花和菊科病害:莴苣盘梗霉(bremia lactuca)、菊褐斑病菌(septoria chrysanthemi

indici)、堀柄锈菌(puccinia horiana);
[0777]
各种植物的病害:瓜果腐霉(pythium aphanidermatum)、德巴利腐霉(pythium debarianum)、禾草腐霉(pythium graminicola)、畸雌腐霉(pythium irregulare)、终极腐霉(pythium ultimum)、贵腐霉菌(botrytis cinerea)、菌核病菌;
[0778]
萝卜病害:甘蓝链格孢(alternaria brassicicola);
[0779]
结缕草病害:银斑核盘菌(sclerotinia homeocarpa)、纹枯病菌;
[0780]
香蕉病害:香蕉黑条叶斑病菌(mycosphaerella fijiensis)、香蕉黄条叶斑病菌(mycosphaerella musicola);
[0781]
向日葵病害:向日葵霜霉菌(plasmopara halstedii);
[0782]
由曲霉属(aspergillus spp.)、青霉属(penicillium spp.)、镰刀菌属(fusarium spp.)、赤霉菌属(gibberella spp.)、木霉属(tricoderma spp.)、根串珠霉属
(thielaviopsis spp.)、根霉属(rhizopus spp.)、毛菌属(mucor spp.)、伏革菌属(corticium spp.)、茎点霉属(rhoma spp.)、丝核菌属(rhizoctonia spp.)、色二孢属(diplodia spp.)等引起的各种植物的种子病害或生长初期的病害;
[0783]
由多粘菌属(polymixa spp.)、油壶菌属(olpidium spp.)等介导的各种植物的病毒病。
[0784]
3.赋予除草剂抗性的基因的实例:
[0785]
对抑制生长点或分生组织的除草剂如咪唑啉酮或磺酰脲的抗性,分别例如lee等人,embo j.7:1241(1988);以及miki等人,theor.appl.genet.80:449(1990)。
[0786]
accase抑制剂编码基因的草甘膦耐受性(分别由例如突变的5

烯醇丙酮莽草酸
‑3‑
磷酸合酶(epsp)基因、aroa基因和草甘膦乙酰基转移酶(gat)基因赋予的抗性),或对其他膦酰基化合物如草铵膦(来自链霉菌属物种包括吸水链霉菌(streptomyces hygroscopicus)和产色链霉菌(streptomyces viridichromogenes)的膦丝菌素乙酰基转移酶(pat)基因)以及对吡啶氧基或苯氧基丙酸和环己酮的抗性。参见例如美国专利第4,940,835号和美国专利6,248,876;美国专利第4,769,061号;欧洲专利第0 333 033号和美国专利第4,975,374号。还参见欧洲专利第0242246号;degreef等人,bio/technology 7:61(1989);marshall等人,theor.appl.genet.83:435(1992);wo 2005012515(castle等人)和wo 2005107437。
[0787]
对抑制光合作用的除草剂的抗性,例如三嗪(psba和gs 基因)或苯甲腈(硝化酶基因)和谷胱甘肽s

转移酶,przibila等人,plant cell 3:169(1991);美国专利第4,810,648号;以及hayes等人,biochem.j.285:173(1992)。
[0788]
编码能使除草剂或突变型谷氨酰胺合酶解毒的酶的基因,所述合酶具有抑制抗性,例如美国专利申请系列号11/760,602,或者解毒酶是编码草胺膦乙酰基转移酶的酶(例如链霉菌属物种的bar或pat蛋白)。膦丝菌素乙酰基转移酶例如描述于美国专利第5,561,236号;第5,648,477号;第5,646,024号;第5,273,894号;第5,637,489号;第5,276,268号;第5,739,082号;第5,908,810号和第7,112,665号。
[0789]
羟基苯基丙酮酸双加氧酶(hppd)抑制剂,即天然存在的hppd抗性酶,或编码突变或嵌合hppd酶的基因,如wo 96/38567、wo 99/24585和wo 99/24586、wo 2009/144079、wo 2002/046387或美国专利第6,768,044号中所述。
[0790]
与非生物胁迫耐受性有关的基因的实例:
[0791]
能够降低植物细胞或植物中聚(adp

核糖)聚合酶(parp)基因的表达和/或活性的转基因,如wo 00/04173或wo/2006/045633中所述。
[0792]
能够降低植物或植物细胞的parg编码基因的表达和/或活性的转基因,如例如wo 2004/090140中所述。
[0793]
编码烟碱酰胺腺嘌呤二核苷酸挽救合成途径的植物功能性酶的转基因,所述酶包括烟碱酰胺酶、烟酸磷酸核糖基转移酶、烟酸单核苷酸腺苷酸转移酶、烟酰胺腺嘌呤二核苷酸合酶或烟碱酰胺磷酸核糖基转移酶,如例如ep 04077624.7、wo 2006/133827、pct/ep07/002,433、ep 1999263或wo 2007/107326中所述。
[0794]
碳水化合物生物合成中涉及的酶包括例如ep 0571427、wo 95/04826、ep 0719338、wo 96/15248、wo 96/19581、wo 96/27674、wo 97/11188、wo 97/26362、wo 97/
32985、wo 97/42328、wo 97/44472、wo 97/45545、wo 98/27212、wo 98/40503、wo99/58688、wo 99/58690、wo 99/58654、wo 00/08184、wo 00/08185、wo 00/08175、wo 00/28052、wo 00/77229、wo 01/12782、wo 01/12826、wo 02/101059、wo 03/071860、wo 2004/056999、wo 2005/030942、wo 2005/030941、wo 2005/095632、wo 2005/095617、wo 2005/095619、wo 2005/095618、wo 2005/123927、wo 2006/018319、wo 2006/103107、wo 2006/108702、wo 2007/009823、wo 00/22140、wo 2006/063862、wo 2006/072603、wo 02/034923、ep 06090134.5、ep 06090228.5、ep 06090227.7、ep 07090007.1、ep 07090009.7、wo 01/14569、wo 02/79410、wo 03/33540、wo 2004/078983、wo 01/19975、wo 95/26407、wo 96/34968、wo 98/20145、wo 99/12950、wo 99/66050、wo 99/53072、美国专利第6,734,341号、wo 00/11192、wo 98/22604、wo 98/32326、wo 01/98509、wo 01/98509、wo 2005/002359、美国专利第5,824,790号、美国专利第6,013,861号、wo 94/04693、wo 94/09144、wo 94/11520、wo 95/35026或wo 97/20936中所述的酶;或涉及生产多聚果糖,尤其是菊粉和果聚糖的酶,如ep 0663956、wo 96/01904、wo 96/21023、wo 98/39460和wo 99/24593中所公开;涉及生产α

1,4

葡聚糖的酶,如wo 95/31553、us 2002031826、美国专利第6,284,479号、美国专利第5,712,107号、wo 97/47806、wo 97/47807、wo 97/47808和wo 00/14249中所公开;涉及生产α

1,6分支α

1,4

葡聚糖的酶,如wo 00/73422中所公开;涉及生产alternan的酶,如例如wo 00/47727、wo 00/73422、ep 06077301.7、美国专利第5,908,975号和ep 0728213中所公开;涉及生产玻尿质酸的酶,如例如wo 2006/032538、wo 2007/039314、wo 2007/039315、wo 2007/039316、jp 2006304779和wo 2005/012529中所公开。
[0795]
改善抗旱性的基因。例如,wo 2013122472公开了功能泛素蛋白连接酶蛋白(upl)蛋白(更具体地,upl3)的缺乏或水平降低导致对所述植物的水需求减少或提高的抗旱性。具有增加的耐旱性的转基因植物的其他实例公开于例如us 2009/0144850、us 2007/0266453和wo 2002/083911中。us2009/0144850描述了由于dr02核酸的表达改变而显示出耐旱表型的植物。us 2007/0266453描述了由于dr03核酸的表达改变而表现出耐旱表型的植物,并且wo 2002/08391描述了由于在保护细胞中表达的abc转运蛋白的活性降低而对干旱胁迫具有提高的耐受性的植物。另一个实例是kasuga及其合作者(1999)的工作,他们描述了转基因植物中编码dreb1a的cdna的过表达激活了正常生长条件下许多胁迫耐受基因的表达,并导致对干旱、盐分负荷和冻结的耐受性提高。然而,dreb1a的表达在正常生长条件下也导致严重的生长迟缓(kasuga(1999)nat biotechnol 17(3)287

291)。
[0796]
在其他特定的实施方案中,可通过影响特定的植物性状来改良农作物。例如,通过开发抗农药植物,提高植物的抗病性,提高植物对昆虫和线虫的抗性,提高植物对寄生性杂草的抗性,提高植物的耐旱性,提高植物的营养价值,提高植物的胁迫耐受性,避免自花授粉,植物饲料消化率生物量,粮食产量等。下文提供了一些具体的非限制性实例。
[0797]
除了单个基因的靶向突变外,系统还可设计成在植物中允许多个基因的靶向突变,染色体片段的缺失,转基因的位点特异性整合,体内定点诱变以及精确的基因替换或等位基因交换。因此,本文描述的方法在基因发现和验证、突变和顺生育种以及杂交育种中具有广泛的应用。这些应用促进了具有各种改良的农艺性状(如除草剂抗性、抗病性、非生物胁迫耐受性、高产量和优异品质)的新一代遗传修饰作物的生产。
[0798]
产生雄性不育植物
[0799]
与自交植物相比,杂种植物通常具有有利的农艺性状。然而,对于自花授粉的植物而言,杂种的生成可能具有挑战性。在不同的植物类型中,已经鉴定了对植物育性、更特别是雄性育性重要的基因。例如,在玉米中,已鉴定出至少两个对育性至关重要的基因(amitabh mohanty international conference on new plant breeding molecular technologies technology development and regulation,2014年10月9

10日,jaipur,india;svitashev等人,plant physiol.2015年10月;169(2):931

45;djukanovic等人,plant j.2013年12月;76(5):888

99)。本文提供的方法可用于靶向雄性育性所需的基因,以产生雄性不育植物,其可容易地杂交以生成杂种。在特定的实施方案中,本文提供的系统用于细胞色素p450样基因(ms26)或大范围核酸酶基因(ms45)的靶向诱变,从而赋予玉米植物以雄性不育性。如此遗传变异的玉米植物可用于杂交育种程序。
[0800]
增加植物的生育期
[0801]
在特定的实施方案中,本文提供的系统和方法用于延长植物例如水稻植物的生育期。例如,可靶向水稻生育期基因如ehd3,以在所述基因中产生突变,并且可选择幼苗来延长再生植物生育期(如cn104004782中所述)
[0802]
在目标作物中生成遗传变异
[0803]
作物中野生种质的可用性和遗传变异是作物改良计划的关键,但作物中种质的可用多样性有限。本发明设想了在目标种质中产生多种遗传变异的方法。在所述系统的这种应用中,提供了针对植物基因组中不同位置的指导rna文库,并将其与cas效应蛋白一起引入植物细胞。以这种方式,可产生基因组规模的点突变和基因敲除的集合。在特定的实施方案中,所述方法包括从如此获得的细胞产生植物部分或植物,以及筛选所述细胞的目标性状。靶基因可包括编码区和非编码区。在特定的实施方案中,性状是胁迫耐受性,并且所述方法是用于生成胁迫耐受性作物品种的方法。
[0804]
调节果实成熟
[0805]
成熟是水果和蔬菜成熟过程中的正常阶段。成熟开始后仅几天,就使水果或蔬菜变得不可食用。这个过程给农民和消费者都造成了重大损失。在特定的实施方案中,本发明的方法用于减少乙烯的产生。通过确保以下一项或多项来确保这一点:a.acc合酶基因表达的抑制。acc(1

氨基环丙烷
‑1‑
甲酸)合酶是负责将s

腺苷甲硫氨酸(sam)转化为acc的酶;乙烯生物合成中的第二步到最后一步。当合酶基因的反义(“镜像”)或截短拷贝插入植物基因组中时,酶的表达受到阻碍;b.acc脱氨酶基因的插入。编码所述酶的基因是从常见的非致病性土壤细菌绿针假单胞菌(pseudomonas chlororaphis)获得的。它将acc转化为其他化合物,从而减少了可用于生产乙烯的acc的数量;c.sam水解酶基因的插入。这种方法类似于acc脱氨酶,其中当前体代谢物的量减少时,乙烯的生成受到阻碍;在这种情况下,sam被转化为高丝氨酸。编码所述酶的基因从大肠杆菌t3噬菌体获得,以及d.抑制acc氧化酶基因表达。acc氧化酶是催化acc氧化为乙烯的酶,这是乙烯生物合成途径的最后一步。使用本文所述的方法,acc氧化酶基因的下调导致乙烯产生的抑制,从而延迟果实成熟。在特定的实施方案中,除上述修饰之外或作为替代,本文所述的方法用于修饰乙烯受体,从而干扰果实获得的乙烯信号。在特定的实施方案中,编码乙烯结合蛋白的etr1基因的表达得到修饰,更特别是得到抑制。在特定的实施方案中,除上述修饰之外或作为替代,本文所述的方法用于修饰编码聚半乳糖醛酸酶(pg)的基因的表达,聚半乳糖醛酸酶是负责果胶分解的酶,果胶
是维持植物细胞壁的完整性的物质。果胶分解发生在成熟过程的开始,导致果实软化。因此,在特定的实施方案中,本文描述的方法用于在pg基因中引入突变或抑制pg基因的活化,以减少产生的pg酶的量,从而延迟果胶降解。
[0806]
因此,在特定的实施方案中,所述方法包括使用所述系统来确保例如上述植物细胞基因组的一种或多种修饰,以及从其再生植物。在特定的实施方案中,植物是番茄植物。
[0807]
延长植物的贮存寿命
[0808]
在特定的实施方案中,本发明的方法用于修饰影响植物或植物部分的贮存寿命的化合物生产中涉及的基因。更具体地,所述修饰位于防止马铃薯块茎中还原糖积累的基因中。经过高温处理,这些还原糖与游离氨基酸反应,产生褐色的苦味产物,并且作为潜在致癌物质的丙烯酰胺的水平升高。在特定的实施方案中,本文提供的方法用于减少或抑制液泡转化酶基因(vinv)的表达,其编码将蔗糖分解为葡萄糖和果糖的蛋白(clasen等人,doi:10.1111/pbi.12370)。
[0809]
使用所述系统来确保附加值性状
[0810]
在特定的实施方案中,所述系统用于生产营养改良的农作物。在特定的实施方案中,本文提供的方法适于产生“功能性食品”,即可提供超出其所含传统营养物的健康益处的改良食品或食品成分,和或“营养保健品”,即可被认为是食品或食品的一部分并提供健康益处(包括疾病的预防和治疗)的物质。在特定的实施方案中,营养保健品可用于预防和/或治疗癌症、糖尿病、心血管疾病和高血压中的一种或多种。
[0811]
营养改良型作物的实例包括(newell

mcgloughlin,plant physiology,2008年7月,第147卷,第939

953页):
[0812]
改变的蛋白质量、含量和/或氨基酸组成,例如关于以下描述:百喜草(bahiagrass)(luciani等人,2005,florida genetics conference poster),坎诺拉油菜(roesler等人,1997,plant physiol 113 75

81),玉米(cromwell等人,1967,1969j anim sci 26 1325

1331;o'quin等人,2000j anim sci 78 2144

2149;yang等人,2002,transgenic res 11 11

20;young等人,2004,plant j 38 910

922),马铃薯(yu j和ao,1997acta bot sin 39 329

334;chakraborty等人,2000,proc natl acad sci usa 97 3724

3729;li等人,2001,chin sci bull 46 482

484),水稻(katsube等人,1999,plant physiol 120 1063

1074),大豆(dinkins等人,2001,rapp 2002,in vitro cell dev biol plant 37 742

747),甘薯(egnin和prakash 1997,in vitro cell dev biol 33 52a)。
[0813]
必需氨基酸含量,例如关于以下描述:坎诺拉油菜(falco等人,1995,bio/technology 13 577

582),羽扇豆(white等人,2001,j sci food agric 81 147

154),玉米(lai和messing,2002,agbios 2008 gm作物数据库(2008年3月11日)),马铃薯(zeh等人,2001,plant physiol 127 792

802),高粱(zhao等人,2003,kluwer academic publishers,dordrecht,the netherlands,第413

416页),大豆(falco等人,1995 bio/technology 13 577

582;galili等人,2002 crit rev plant sci 21167

204)。
[0814]
油和脂肪酸,例如坎诺拉油菜(dehesh等人,(1996)plant j 9 167

172;del vecchio(1996)inform international news on fats,oils and related materials 7 230

243;roesler等人,(1997)plant physiol 113 75

81;froman和ursin(2002,2003)abstracts of papers of the american chemical society 223u35;james等人,(2003)
am j clin nutr 77 1140

1145[pubmed];agbios(2008,同上);棉花(chapman等人,(2001).j am oil chem soc 78 941

947;liu等人,(2002)j am coll nutr 21 205s

211s[pubmed];o'neill(2007)australian life scientist.www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2(2008年6月17日),亚麻籽(abbadi等人,2004,plant cell 16:2734

2748),玉米(young等人,2004,plant j 38 910

922),油棕(jalani等人,1997,j am oil chem soc 74 1451

1455;parveez,2003,agbiotechnet 113 1

8),水稻(anai等人,2003,plant cell rep 21 988

992),大豆(reddy和thomas,1996,nat biotechnol 14 639

642;kinney和kwolton,1998,blackie academic and professional,london,第193

213页),向日葵(arcadia,biosciences 2008)
[0815]
碳水化合物,例如果聚糖,关于以下所述:菊苣(smeekens(1997)trends plant sci 2 286

287;sprenger等人,(1997)febs lett 400 355

358;s
é
venier等人,(1998)nat biotechnol 16 843

846),玉米(caimi等人,(1996)plant physiol 110 355

363),马铃薯(hellwege等人,,1997plant j 12 1057

1065),糖甜菜(smeekens等人,1997,同上);菊粉,例如关于马铃薯所述(hellewege等人,2000,proc natl acad sci usa 97 8699

8704);淀粉,例如关于水稻所述(schwall等人,(2000)nat biotechnol 18 551

554;chiang等人,(2005)mol breed 15 125

143),
[0816]
维生素和类胡萝卜素,例如关于以下所述:坎诺拉油菜(shintani和dellapenna(1998)science 282 2098

2100),玉米(rocheford等人,(2002).j am coll nutr 21 191s

198s;cahoon等人,(2003)nat biotechnol 21 1082

1087;chen等人,(2003)proc natl acad sci usa 100 3525

3530),芥菜籽(shewmaker等人,(1999)plant j 20 401

412),马铃薯(ducreux等人,2005,j exp bot 56 81

89),水稻(ye等人,(2000)science 287 303

305),草莓(agius等人,(2003),nat biotechnol 21 177

181),番茄(rosati等人,(2000)plant j 24 413

419;fraser等人,(2001)j sci food agric 81 822

827;mehta等人,(2002)nat biotechnol 20 613

618;d
í
az de la garza等人,(2004)proc natl acad sci usa 101 13720

13725;enfissi等人,(2005)plant biotechnol j 3 17

27;dellapenna(2007)proc natl acad sci usa 104 3675

3676),
[0817]
功能性次生代谢产物,例如关于以下所述:苹果(二苯乙烯,szankowski等人,(2003)plant cell rep 22:141

149),苜蓿(白藜芦醇,hipskind和paiva(2000)mol plant microbe interact 13 551

562),猕猴桃(白藜芦醇,kobayashi等人,(2000)plant cell rep 19 904

910),玉米和大豆(类黄酮,yu等人,(2000)plant physiol 124 781

794),马铃薯(花色素苷和生物碱糖苷,lukaszewicz等人,(2004)j agric food chem 52 1526

1533),水稻(类黄酮和白藜芦醇,stark

lorenzen等人,(1997)plant cell rep 16 668

673;shin等人,(2006)plant biotechnol j 4303

315),番茄( 白藜芦醇、绿原酸、类黄酮、二苯乙烯;rosati等人,(2000)同上;muir等人,(2001)nature 19 470

474;niggeweg等人,(2004)nat biotechnol 22 746

754;giovinazzo等人,(2005)plant biotechnol j 3 57

69),小麦(咖啡酸和阿魏酸、白藜芦醇;united press international(2002));以及
[0818]
矿物质可用性,例如关于以下所述:苜蓿(植酸酶,austin

phillips等人,(1999)www.molecularfarming.com/nonmedical.html),莴苣(铁,goto等人,(2000)theor appl genet 100 658

664),水稻(铁,lucca等人,(2002)j am coll nutr 21 184s

190s),玉米、
大豆和小麦(植酸酶,drakakaki等人,(2005)plant mol biol 59 869

880;denbow等人,(1998)poult sci 77 878

881;brinch

pedersen等人,(2000)mol breed 6 195

206)。
[0819]
在特定的实施方案中,附加值性状与植物中存在的化合物的预期健康益处有关。例如,在特定的实施方案中,通过应用本发明的方法获得附加值作物,以确保一种或多种以下化合物的修饰或诱导/增加一种或多种以下化合物的合成:
[0820]
类胡萝卜素,例如存在于胡萝卜中的α

胡萝卜素,其可中和可能损害细胞的自由基;或存在于各种水果和蔬菜中的β

胡萝卜素,其可中和自由基。
[0821]
绿色蔬菜中存在的叶黄素,其有助于维持健康的视力。
[0822]
番茄和番茄制品中存在的番茄红素,据信其可降低前列腺癌的风险。
[0823]
玉米黄质,存在于柑橘和玉米中,其有助于维持健康的视力。
[0824]
膳食纤维,例如麦麸中存在的不溶性纤维,其可降低乳腺癌和/或结肠癌的风险;和燕麦中存在的β

葡聚糖,车前草(psylium)和全谷粒中的可溶性纤维,其可降低心血管疾病(cvd)的风险。
[0825]
脂肪酸,例如ω

3脂肪酸,其可降低cvd的风险并改善精神和视觉功能;共轭亚油酸,其可改善身体组成,可降低某些癌症的风险;和gla,其可降低癌症和cvd的炎症风险,可改善身体组成。
[0826]
小麦中存在的类黄酮如羟基肉桂酸酯,其具有类似抗氧化剂的活性,可降低变性疾病的风险;水果和蔬菜中存在的黄酮醇、儿茶素和丹宁酸,其可中和自由基并可降低癌症的风险。
[0827]
十字花科蔬菜(西兰花、羽衣甘蓝)、辣根中存在的芥子油苷、吲哚、异硫氰酸盐(例如萝卜硫素),其可中和自由基,可降低癌症的风险。
[0828]
酚类化合物,例如葡萄中存在的二苯乙烯,其可降低变性疾病、心脏病和癌症的风险,可能具有延年益寿的作用;蔬菜和柑桔中存在的咖啡酸和阿魏酸,其具有类似抗氧化剂的活性,可降低变性疾病、心脏病和眼病的风险;以及可可中存在的表儿茶素,其具有类似抗氧化剂的活性,可降低变性疾病和心脏病的风险。
[0829]
玉米、大豆、小麦和木油中存在的植物甾烷醇/甾醇,其可通过降低血液胆固醇水平而降低冠心病的风险。
[0830]
菊芋(jerusalem artichoke)、青葱、洋葱粉中存在的果聚糖、菊粉、低聚果糖,其可改善肠胃健康。
[0831]
大豆中存在的皂苷,其可降低ldl胆固醇。
[0832]
大豆中存在的大豆蛋白,其可降低心脏病的风险。
[0833]
大豆中存在的植物雌激素,例如异黄酮,其可减少更年期症状如潮热,可减少骨质疏松症和cvd;以及亚麻、黑麦和蔬菜中存在的木脂素,其可预防心脏病和某些癌症,可降低ldl胆固醇、总胆固醇。
[0834]
洋葱、大蒜、橄榄、韭菜和scallon中存在的硫化物和硫醇(如二烯丙基硫)以及十字花科蔬菜中存在的烯丙基甲基三硫化物、二硫代硫酮,其可降低ldl胆固醇,有助于维持健康的免疫系统。
[0835]
蔓越莓、可可中存在的丹宁,例如原花青素,其可改善尿道健康,可降低cvd和高血压的风险。
[0836]
另外,本发明的方法还设想了改变蛋白质/淀粉的功能性、保质期、口味/美学、纤维质量以及变应原、抗营养物和毒素减少性状。
[0837]
因此,本发明涵盖用于生产具有营养附加值的植物的方法,所述方法包括使用如本文所述的系统将编码参与生产附加营养价值组分的酶的基因引入植物细胞,以及从所述植物细胞再生植物,所述植物的特征在于所述附加营养价值组分的表达增加。在特定的实施方案中,所述系统用于间接修饰这些化合物的内源性合成,例如通过修饰一种或多种控制该化合物代谢的转录因子。上文描述了使用所述系统将目标基因引入植物细胞和/或修饰内源基因的方法。
[0838]
已被修饰以赋予附加值性状的植物修饰的一些具体实例是:具有修饰的脂肪酸代谢的植物,例如,通过用硬脂基

acp去饱和酶的反义基因转化植物以增加植物的硬脂酸含量。参见knultzon等人,proc.natl.acad.sci.u.s.a.89:2624(1992)。另一个实例涉及降低肌醇六磷酸的含量,例如通过克隆并且然后再引入与单个等位基因相关的dna,该dna可能造成特征在于低植酸水平的玉米突变体。参见raboy等人,maydica 35:383(1990)。
[0839]
类似地,在强启动子的控制下,玉米(zea mays)tfs c1和r的表达调控玉米糊粉层中类黄酮的产生,导致拟南芥(arabidopsis thaliana)中花色素苷的高积累率,大概是通过激活整个途径(bruce等人,2000,plant cell 12:65

80)。dellapenna(welsch等人,2007 annu rev plant biol 57:711

738)发现,tf rap2.2及其相互作用的伴侣sinat2增加了拟南芥叶片中的类胡萝卜素生成。在转基因拟南芥中表达tf dof1诱导了编码用于碳骨架生产的酶的基因的上调,氨基酸含量的显著增加以及glc水平的降低(yanagisawa,2004 plant cell physiol 45:386

391),并且dof tf atdof1.1(obp2)上调拟南芥中芥子油苷生物合成途径的所有步骤(skirycz等人,2006 plant j 47:10

24)。
[0840]
减少植物中的变应原
[0841]
在特定的实施方案中,本文提供的方法用于产生变应原水平降低的植物,从而使它们对消费者更安全。在特定的实施方案中,所述方法包括修饰负责植物变应原产生的一种或多种基因的表达。例如,在特定的实施方案中,所述方法包括下调lol p5基因在植物细胞(例如黑麦草植物细胞)中的表达并从其再生植物以降低所述植物的花粉的变应原性(bhalla等人,1999,proc.natl.acad.sci.usa第96卷:11676

11680)。
[0842]
花生过敏和对豆类过敏通常是实际和严重的健康问题。本发明的cas相关转座酶系统可用于鉴定并且然后编辑或沉默编码此类豆科植物的致敏蛋白的基因。对于这类基因和蛋白质没有限制,nicolaou等人鉴定了花生、大豆、小扁豆、豌豆、羽扇豆、青豆和绿豆中的致敏蛋白。参见nicolaou等人,current opinion in allergy and clinical immunology 2011;11(3):222)。
[0843]
目标内源基因的筛选方法
[0844]
本文提供的方法进一步允许鉴定附加营养价值组分的生产中所涉及的价值编码酶的基因或通常跨物种、门类和植物界通常影响目标农艺性状的基因。通过使用如本文所述的系统选择性地靶向例如编码植物中代谢途径的酶的基因,可鉴定出负责植物某些营养方面的基因。类似地,通过选择性地靶向可影响所需农艺性状的基因,可鉴定相关基因。因此,本发明涵盖用于编码具有特定营养价值和/或农艺性状的化合物的生产中所涉及的酶的基因的筛选方法。
[0845]
所述系统在植物和酵母中的进一步用途
[0846]
生物燃料生产
[0847]
如本文所用,术语“生物燃料”是由植物和植物来源的资源制成的替代燃料。可从有机物质中提取可再生的生物燃料,这些有机物质的能量是通过碳固定过程获得的,或者是通过利用或转化生物质制得的。该生物质可直接用于生物燃料,或者可通过热转化、化学转化和生化转化而转化为方便的含能量物质。这种生物质转化可产生固体、液体或气体形式的燃料。生物燃料有两种类型:生物乙醇和生物柴油。生物乙醇主要是通过纤维素(淀粉)的糖发酵过程生产的,纤维素大部分源自玉米和甘蔗。在另一方面,生物柴油主要由油料作物如油菜籽、棕榈和大豆产生。生物燃料主要用于运输。
[0848]
增强植物特性以生产生物燃料
[0849]
在特定的实施方案中,使用利用如本文所述的系统的方法来改变细胞壁的性质,以便于关键水解剂的进入,从而更有效地释放糖以进行发酵。在特定的实施方案中,纤维素和/或木质素的生物合成被修饰。纤维素是细胞壁的主要组分。纤维素和木质素的生物合成是共同调控的。通过减少植物中木质素的比例,可增加纤维素的比例。在特定的实施方案中,本文所述的方法用于下调植物中木质素的生物合成,从而增加可发酵的碳水化合物。更具体来说,本文所述的方法用于下调至少第一木质素生物合成基因,所述基因选自由以下组成的组:4

香豆酸3

羟化酶(c3h),苯丙氨酸氨裂合酶(pal),肉桂酸4

羟化酶(c4h),羟肉桂酰基转移酶(hct),咖啡酸o

甲基转移酶(comt),咖啡酰辅酶a 3

o

甲基转移酶(ccoaomt),阿魏酸5

羟化酶(f5h),肉桂醇脱氢酶(cad),肉桂酰基辅酶a还原酶(ccr),4

香豆酸

coa连接酶(4cl),单木酚

木质素特异性糖基转移酶和醛脱氢酶(aldh),如wo 2008064289 a2中所公开。
[0850]
在特定的实施方案中,本文所述的方法用于生产在发酵期间产生较低水平的乙酸的植物物质(也参见wo 2010096488)。更具体来说,本文公开的方法用于生成与casll同源的突变以减少多糖乙酰化。
[0851]
修饰酵母以生产生物燃料
[0852]
在特定的实施方案中,本文提供的cas酶用于通过重组微生物生产生物乙醇。例如,cas可用于将微生物如酵母工程化,以由可发酵糖生成生物燃料或生物聚合物,并且任选地能够降解源自农业废弃物的植物来源木质纤维素,作为可发酵糖的来源。更具体来说,本发明提供了将所述系统用于将生物燃料生产所需的外源基因引入微生物和/或修饰可干扰生物燃料合成的内源基因的方法。更具体来说,所述方法涉及将一种或多种编码参与丙酮酸向乙醇或另一种目标产物转化的酶的核苷酸序列引入微生物如酵母中。在特定的实施方案中,所述方法确保引入一种或多种酶,其允许微生物降解纤维素,例如纤维素酶。在其他实施方案中,cas crispr复合物用于修饰与生物燃料生产途径竞争的内源性代谢途径。
[0853]
因此,在更特定的实施方案中,本文所述的方法用于如下修饰微生物:
[0854]
引入至少一种异源核酸或增加至少一种编码植物细胞壁降解酶的内源核酸的表达,以使得所述微生物能够表达所述核酸并能够产生和分泌所述植物细胞壁降解酶;
[0855]
引入至少一种异源核酸或增加至少一种编码将丙酮酸转化为乙醛的酶的内源核酸的表达,任选地与至少一种编码将乙醛转化为乙醇的酶的异源核酸结合,使得所述宿主细胞能够表达所述核酸;和/或在所述宿主细胞的代谢途径中修饰至少一种编码酶的核酸,
其中所述途径产生除丙酮酸产生的乙醛或乙醛产生的乙醇以外的代谢产物,并且其中所述修饰导致所述代谢产物的产生减少,或引入至少一种编码所述酶的抑制剂的核酸。
[0856]
修饰藻类和植物以生产植物油或生物燃料
[0857]
例如,转基因藻类或其他植物如油菜在生产植物油或生物燃料如醇(尤其是甲醇和乙醇)中可能特别有用。这些可被工程化以表达或过表达用于石油或生物燃料工业的高水平的油或醇。
[0858]
根据本发明的特定实施方案,所述系统用于生成可用于生物燃料生产的富含脂质的硅藻。
[0859]
在特定的实施方案中,设想特异性修饰参与藻类细胞产生的脂质量和/或脂质质量的修饰的基因。编码参与脂肪酸合成途径的酶的基因的实例可编码具有例如乙酰基

coa羧化酶、脂肪酸合酶、3

酮酰基

酰基

载体蛋白合酶iii、甘油
‑3‑
磷酸去氢酶(g3pdh)、烯酰基

酰基载体蛋白还原酶(烯酰基

acp

还原酶)、甘油
‑3‑
磷酸酰基转移酶、溶血磷脂酰酰基转移酶或二酰基甘油酰基转移酶、磷脂:二酰基甘油酰基转移酶、磷脂酰磷酸酶、脂肪酸硫酯酶如棕榈酰蛋白硫酯酶或苹果酸酶活性的蛋白质。在其他实施方案中,设想生成具有增加的脂质积累的硅藻。这可通过靶向降低脂质分解代谢的基因来实现。在本发明的方法中使用特别感兴趣的是与三酰基甘油和游离脂肪酸的活化有关的基因,以及与脂肪酸的β

氧化直接有关的基因,例如酰基

coa合酶、3

酮酰基

coa硫解酶、酰基

coa氧化酶活性和磷酸葡萄糖变位酶。本文所述的系统和方法可用于特异性激活硅藻中的此类基因以增加其脂质含量。
[0860]
例如微藻的生物被广泛用于合成生物学。stovicek等人(metab.eng.comm.,2015;2:13)描述了对工业酵母(例如酿酒酵母)进行基因组编辑,以有效生产用于工业生产的稳健菌株。stovicek使用对于酵母进行密码子优化的crispr

cas9系统以同时破坏内源基因的两个等位基因和敲入异源基因。cas9和grna从基于基因组或附加型2μ的载体位置表达。作者还表明可通过优化cas9和grna的表达水平来提高基因破坏效率。hlavov
á
等人(biotechnol.adv.2015)讨论了使用例如crispr的技术开发微藻物种或菌株以靶向核和叶绿体基因来进行插入诱变和筛选。stovicek和hlavov
á
的方法可适用于本发明的cas效应蛋白系统。
[0861]
us 8,945,839描述了一种使用cas9将微藻(莱茵衣藻细胞物种)工程化的方法。使用类似的工具,本文所述的系统的方法可应用于衣藻属物种和其他藻类。在特定的实施方案中,将cas和指导rna引入使用在组成型启动子例如hsp70a

rbc s2或β2

微管蛋白的控制下表达cas的载体表达的藻类中。指导rna将使用含有t7启动子的载体递送。或者,可将cas mrna和体外转录的指导rna递送至藻类细胞。电穿孔方案遵循来自geneart衣藻工程化试剂盒的标准推荐方案。
[0862]
利用酵母菌株生成改良的木糖或纤维二糖
[0863]
在特定的实施方案中,本文公开的系统可用于利用酵母菌株选择改良的木糖或纤维二糖。易错pcr可用于扩增木糖利用或纤维二糖利用途径中涉及的一个(或多个)基因。涉及木糖利用途径和纤维二糖利用途径的基因的实例可包括但不限于ha,s.j.等人,(2011)proc.natl.acad.sci.usa 108(2):504

9和galazka,j.m.等人,(2010)science 330(6000):84

6中描述的那些。所产生的双链dna分子文库(每个文库在这样的选定基因中包
含随机突变)可与所述系统的组分共转化到酵母菌株(例如s288c)中,并且可选择具有增强的木糖或纤维二糖利用能力的菌株,如wo2015138855中所述。
[0864]
生成用于类异戊二烯生物合成的改良酵母菌株
[0865]
tadas等人描述了多重crispr/cas9系统在面包酵母酿酒酵母中的一个转化步骤中对多达5个不同基因组基因座的基因组工程化的成功应用(metabolic engineering第28卷,2015年3月,第213

222页),产生具有高甲羟戊酸生产的菌株,甲羟戊酸是工业上重要的类异戊二烯生物合成途径的关键中间体。在特定的实施方案中,所述系统可如本文所述用于多重基因组工程方法中,用于鉴定用于类异戊二烯合成的另外的高产酵母菌株。
[0866]
生成产乳酸的酵母菌株
[0867]
在另一个实施方案中,涵盖了多重系统的成功应用。与vratislav stovicek等人(metabolic engineering communications,第2卷,2015年12月,第13

22页)类似,可设计并在单个转化事件中获得改良的产乳酸菌株。在一个特定的实施方案中,所述系统用于同时插入异源乳酸脱氢酶基因以及破坏两个内源基因pdc1和pdc5基因。
[0868]
在植物中的进一步应用
[0869]
在特定的实施方案中,所述系统并且优选地本文所述的系统可用于遗传元件动力学的可视化。例如,crispr成像可使重复或非重复的基因组序列可视化,报告端粒长度变化和端粒运动,并在整个细胞周期内监测基因基因座的动力学(chen等人,cell,2013)。这些方法也可应用于植物。
[0870]
所述系统并且优选地本文所述的系统的其他应用是体外和体内靶向基因破坏阳性选择筛选(malina等人,genes and development,2013)。这些方法也可应用于植物。
[0871]
在特定的实施方案中,无活性的cas核酸内切酶与组蛋白修饰酶的融合可在复杂的表观基因组中引入定制的变化(rusk等人,nature methods,2014)。这些方法也可应用于植物。
[0872]
在特定的实施方案中,所述系统并且优选地本文所述的系统可用于纯化染色质的特定部分并鉴定相缔合的蛋白,从而阐明其在转录中的调控作用(waldrip等人,epigenetics,2014)。这些方法也可应用于植物。
[0873]
在特定的实施方案中,由于本发明能够切割病毒dna和rna,因此其可用作植物系统中病毒去除的疗法。先前在人类系统中的研究表明,已成功地利用crispr靶向单链rna病毒丙型肝炎(a.price等人,proc.natl.acad.sci,2015)以及双链dna病毒乙型肝炎(v.ramanan等人,sci.rep,2015)。这些方法也可能适于在植物中使用所述系统。
[0874]
在特定的实施方案中,本发明可用于改变基因组复杂性。在另一个特定的实施方案中,所述系统并且优选地本文所述的系统可用于破坏或改变染色体数目并生成单倍体植物,其仅包含来自一个亲本的染色体。可诱导此类植物进行染色体复制并转化为仅包含纯合等位基因的二倍体植物(karimi

ashtiyani等人,pnas,2015;anton等人,nucleus,2014)。这些方法也可应用于植物。
[0875]
在特定的实施方案中,本文所述的系统可用于自切割。在这些实施方案中,cas酶和grna的启动子可以是组成型启动子,并且第二grna被引入相同的转化盒中,但是由诱导型启动子控制。可指定该第二grna诱导cas基因中的位点特异性切割,以产生非功能性的
cas。在另一个特定的实施方案中,第二grna在转化盒的两端诱导切割,导致从宿主基因组中去除盒。该系统提供细胞暴露于cas酶的受控持续时间并进一步减少脱靶编辑。此外,crispr/cas盒的两端的切割可用于生成具有双等位基因突变的无转基因的t0植物(如关于cas9所述,例如moore等人,nucleic acids research,2014;schaeffer等人,plant science,2015)。moore等人的方法可应用于本文所述的系统。
[0876]
sugano等人(plant cell physiol.2014年3月;55(3):475

81.doi:10.1093/pcp/pcu014.电子出版于2014年1月18日)报道了crispr

cas9在地钱(marchantia polymorpha l.)中的靶向诱变的应用,地钱已成为研究陆地植物进化的模型物种。鉴定出地钱的u6启动子并克隆以表达grna。设计了grna的靶序列以破坏地钱中编码植物生长素应答因子1(arf1)的基因。使用农杆菌介导的转化,sugano等人在地钱的配子体世代中分离出稳定突变体。使用花椰菜花叶病毒35s或地钱ef1α启动子表达cas9可实现基于crispr

cas9的体内定点诱变。显示出植物生长素抗性表型的分离的突变个体不是嵌合体。此外,通过t1植物的无性繁殖产生了稳定的突变体。使用基于cripsr

cas9的靶向诱变很容易建立多个arf1等位基因。sugano等人的方法可应用于本发明的cas效应蛋白系统。
[0877]
kabadi等人(nucleic acids res.2014年10月29日;42(19):e147.doi:10.1093/nar/gku749.电子出版于2014年8月13日)开发了单一慢病毒系统来表达cas9变体、报告基因和多达四个来自独立的rna聚合酶iii启动子的sgrna,其可通过方便的golden gate克隆方法并入载体中。每个sgrna被有效表达,并且可在永生化和原代人类细胞中介导多重基因编辑和持续转录激活。kabadi等人的方法可应用于本发明的cas效应蛋白系统。
[0878]
ling等人(bmc plant biology 2014,14:327)开发了基于pgreen或pcambia骨架以及grna的crispr

cas9二元载体集。该工具包除bsai外不需要任何限制酶来生成带有玉米密码子优化的cas9和一个或多个grna的最终构建体,只需少至一个克隆步骤即可获得高效率。所述工具包已使用玉米原生质体、转基因玉米品系和转基因拟南芥品系进行了验证,并显示出高效率和特异性。更重要的是,使用该工具包,在t1代转基因幼苗中检测到了三个拟南芥基因的靶向突变。此外,多基因突变可被下一代遗传。(指导rna)模块载体集,作为植物中多重基因组编辑的工具包。lin等人的工具箱可应用于本发明的cas效应蛋白系统。
[0879]
基于methods in molecular biology系列的第1284卷的第239

255页,2015年2月10日中关于crispr

cas9系统所公开的那些,经由crispr

cas用于靶向植物基因组编辑的方案也可用。描述了设计、构建和评价使用拟南芥和本氏烟草(nicotiana benthamiana)原生质体作为模型细胞系统对双重grna进行植物密码子优化的cas9(pcocas9)介导的基因组编辑的详细程序。还讨论了将crispr

cas9系统应用于在整个植物中产生靶向基因组修饰的策略。本章中描述的方案可应用于本发明的cas效应蛋白系统。
[0880]
ma等人(mol plant.2015年8月3日;8(8):1274

84.doi:10.1016/j.molp.2015.04.007)报道了稳健的crispr

cas9载体系统,其利用植物密码子优化的cas9基因,用于在单子叶植物和双子叶植物中进行方便且高效率的多重基因组编辑。ma等人设计了基于pcr的程序以快速生成多个sgrna表达盒,可通过golden gate连接或gibson组装在一轮克隆中将其组装成二元crispr

cas9载体。利用这个系统,ma等人编辑了水稻中的46个目标位点,平均突变率为85.4%,主要是双等位基因和纯合子状态。ma等人通过同时靶向基因家族的多个(至多八个)成员,生物合成途径中的多个基因或单个基因中的多个位点,
提供了t0水稻和t1拟南芥植物中功能丧失的基因突变的实例。ma等人的方法可应用于本发明的cas效应蛋白系统。
[0881]
lowder等人(plant physiol.2015年8月21日.pii:pp.00636.2015)还开发了一种crispr

cas9工具箱,其能够对植物中表达的、沉默的或非编码基因进行多重基因组编辑和转录调控。该工具箱为研究人员提供了方案和试剂,以使用golden gate和gateway克隆方法快速且有效地组装用于单子叶植物和双子叶植物的功能性crispr

cas9t

dna构建体。它具有一整套功能,包括多重基因编辑以及植物内源基因的转录激活或阻遏。基于t

dna的转化技术是现代植物生物技术、遗传学、分子生物学和生理学的基础。因此,申请人开发了一种将cas(wt、切口酶或dcas)和grna组装到目标t

dna目的载体中的方法。所述组装方法是基于golden gate组装和multisite gateway重组。组装需要三个模块。第一个模块是cas进入载体,其含有无启动子的cas或其衍生基因,侧接attl1和attr5位点。第二个模块是grna进入载体,其含有进入grna表达盒,侧接attl5和attl2位点。第三个模块包括含有attr1

attr2的目的t

dna载体,这些载体为cas表达提供了选择的启动子。lowder等人的工具箱可应用于本发明的cas效应蛋白系统。
[0882]
wang等人(biorxiv 051342;doi:doi.org/10.1101/051342;电子出版于2016年5月12日)展示了使用具有若干grna

trna单元的多重基因编辑构建体在单个启动子的控制下对影响六倍体小麦中的重要农艺性状的四个基因的同源拷贝进行编辑。
[0883]
在一个有利的实施方案中,植物可以是树。本发明还可将本文公开的系统用于草本系统(参见例如belhaj等人,plant methods 9:39;和harrison等人,genes&development 28:1859

1872)。在一个特别有利的实施方案中,本发明的系统可靶向树木中的单核苷酸多态性(snp)(参见例如zhou等人,new phytologist,第208卷,第2期,第298

301页,2015年10月)。在zhou等人的研究中,作者使用4

香豆酸酯:coa连接酶(4cl)基因家族作为案例研究,将系统应用于多年生木本杨木中,并针对两个靶向的4cl基因实现了100%的突变效率,每个所研究的转化体均带有双等位基因修饰。在zhou等人的研究中,crispr

cas9系统对单核苷酸多态性(snp)高度敏感,因为由于靶序列中的snp而取消了对第三个4cl基因的切割。这些方法可应用于本发明的cas效应蛋白系统。
[0884]
zhou等人(new phytologist,第208卷,第2期,第298

301页,2015年10月)可如下应用于本发明。分别与木质素和类黄酮生物合成相关的两个4cl基因4cl1和4cl2被靶向用于crispr

cas9编辑。常规用于转化的杂种白杨(populus tremula
×
alba)克隆717

1b4与基因组测序的毛果杨(populus trichocarpa)不同。因此,从参考基因组设计的4cl1和4cl2 grna受到内部717 rna

seq数据的质询,以确保不存在可能限制cas效率的snp。还包括为4cl5设计的第三个grna,即4cl1的基因组复制。相应的717序列在pam附近/之内的每个等位基因中都带有一个snp,预计这两者都将消除4cl5

grna的靶向作用。所有三个grna目标位点均位于第一个外显子内。对于717转化,在二元载体中,由medicago u6.6启动子以及在camv 35s启动子的控制下的人类密码子优化的cas表达grna。利用仅cas载体的转化可用作对照。对随机选择的4cl1和4cl2系进行扩增子测序。然后处理数据,并在所有情况下确认双等位基因突变。这些方法可应用于本发明的cas效应蛋白系统。
[0885]
在植物中,病原体通常是宿主特异性的。例如,尖孢镰刀菌番茄专化型病原菌(fusarium oxysporum f.sp.lycopersici)引起番茄枯萎,但仅侵害番茄,并且香石竹尖孢
镰刀菌(f.oxysporum f.dianthii)、小麦秆锈菌(puccinia graminis f.sp.tritici)仅侵害小麦。植物具有抵抗大多数病原体的现有和诱导防御能力。跨植物世代的突变和重组事件导致遗传变异,所述遗传变异引起易感性,尤其是因为病原体的繁殖频率高于植物。在植物中可存在非宿主抗性,例如宿主与病原体不相容。还可存在水平抗性,例如,对病原体所有小种的部分抗性,通常由许多基因控制,以及垂直抗性,例如对病原体的某些小种而不是其他小种的完全抗性,通常由少数基因控制。在基因

基因水平上,植物和病原体一起进化,并且一者中的遗传变化与另一者中的遗传变化平衡。因此,利用自然变异性,育种者结合了对于产量、品质、均匀性、硬度和抗性最有用的基因。抗性基因的来源包括天然或外来品种、传家宝品种、野生植物亲缘种和诱导突变,例如用诱变剂处理植物材料。使用本发明,为植物育种者提供了诱导突变的新工具。因此,本领域技术人员可分析抗性基因来源的基因组,并且在具有所需特征或性状的品种中,利用本发明以比以前的诱变剂更精确的方式诱导抗性基因的产生,从而加速和改善植物育种程序。
[0886]
下表4提供了关于可使用crispr

cas复合物、修饰的效应蛋白、系统和优化方法来改善生物生产的其他参考文献和相关领域。
[0887]
表5
[0888][0889]
改良的植物和酵母细胞
[0890]
本发明还提供了通过本文提供的方法可获得和获得的植物和酵母细胞。通过本文所述方法获得的改良植物可通过基因的表达来用于食品或饲料生产,所述基因例如确保对植物害虫、除草剂、干旱、低温或高温、过量水等的耐受性。
[0891]
通过本文描述的方法获得的改良植物,尤其是农作物和藻类,可通过表达例如比野生型中通常可见的更高的蛋白质、碳水化合物、营养物或维生素水平而可用于食品或饲料生产。在这方面,优选改良植物,尤其是豆类和块茎。
[0892]
例如,改良的藻类或其他植物(例如油菜)在生产植物油或生物燃料如醇类(尤其是甲醇和乙醇)中特别有用。这些可被工程化以表达或过表达用于石油或生物燃料工业的高水平的油或醇。
[0893]
本发明还提供了改良的植物部分。植物部分包括但不限于叶、茎、根、块茎、种子、
胚乳、胚珠和花粉。本文所设想的植物部分可以是可存活的、不可存活的、可再生的和/或不可再生的。
[0894]
在一个实施方案中,soyk等人(nat genet.2017年1月;49(1):162

168)描述的方法,其使用crispr

cas9介导的靶向番茄中开花阻遏子sp5g的突变来产生早期产量番茄,所述方法可针对本发明公开的系统进行修饰。在一些实施方案中,所述crispr蛋白是c2c5。
[0895]
本文还涵盖提供根据本发明的方法生成的植物细胞和植物。通过传统育种方法产生的包含遗传修饰的植物的配子、种子、种质、胚胎(合子或体细胞)的后代或杂种,也包括在本发明的范围内。此类植物可包含插入在靶序列或代替靶序列的异源或外来dna序列。或者,此类植物可在一个或多个核苷酸中仅包含改变(突变、缺失、插入、取代)。因此,此类植物将仅通过存在特定修饰而与其祖先植物不同。
[0896]
因此,本发明提供了通过本方法产生的植物、动物或细胞或其后代。后代可以是所生产的植物或动物的克隆,或者可以是通过与相同物种的其他个体杂交以向其后代渗入更多所需性状而由有性繁殖产生的。在多细胞生物体、特别是动物或植物的情况下,细胞可以是体内或离体的。
[0897]
使用如本文所述的系统进行基因组编辑的方法可用于在基本上任何植物、藻类、真菌、酵母等上赋予期望的性状。使用本公开的核酸构建体和上述各种转化方法,各种各样的植物、藻类、真菌、酵母等以及植物藻类、真菌、酵母细胞或组织系统可针对本文所述的期望的生理和农艺学特性进行工程化。
[0898]
在特定的实施方案中,本文所述的方法用于修饰内源基因或修饰其表达,而无需将任何外来基因(包括编码crispr组分的外来基因)永久引入植物、藻类、真菌、酵母等的基因组中,从而避免在植物基因组中存在外来dna。由于非转基因植物的法规要求较不严格,因此这可能是令人感兴趣的。
[0899]
本文提供的系统可用于引入靶向的双链或单链断裂和/或引入基因激活子和/或阻遏子系统,并非限制性地,可用于基因靶向、基因置换、靶向诱变、靶向缺失或插入、靶向倒位和/或靶向易位。通过在单个细胞中共表达旨在实现多种修饰的多个靶向rna,可确保多重基因组修饰。该技术可用于具有改善特性的植物的高精度工程化,这些特性包括增强的营养质量,增强的抗病性以及对生物和非生物胁迫的抗性,以及商业上有价值的植物产品或异源化合物的产量增加。
[0900]
本文所述的方法通常导致“改良的植物、藻类、真菌、酵母等”的生成,因为与野生型植物相比,它们具有一种或多种理想的性状。在特定的实施方案中,获得的植物、藻类、真菌、酵母等细胞或部分是转基因植物,其包含并入全部或部分细胞的基因组中的外源dna序列。在特定的实施方案中,获得非转基因的遗传修饰的植物、藻类、真菌、酵母等部分或细胞,因为没有外源dna序列被并入到植物的任何细胞的基因组中。在这样的实施方案中,改良的植物、藻类、真菌、酵母等是非转基因的。如果仅确保内源基因的修饰,而在植物、藻类、真菌、酵母等基因组中没有引入或维持任何外来基因,则所得的遗传修饰作物不包含外来基因,因此基本上可被认为是非转基因的。所述系统对于植物、藻类、真菌、酵母等基因组编辑的不同应用包括但不限于:引入一个或多个外来基因以赋予目标农业性状;编辑内源基因以赋予目标农业性状;通过所述系统调节内源基因以赋予目标农业性状。赋予农艺性状的示例性基因包括但不限于赋予对害虫或病害的抗性的基因;涉及植物病害的基因,例如
wo 2013046247中列出的那些;赋予对除草剂、杀真菌剂等的抗性的基因;涉及(非生物)胁迫耐受性的基因。使用所述系统的其他方面包括但不限于:产生(雄性)不育植物;增加植物/藻类等的生育期;在目标作物中产生遗传变异;影响果实成熟;增加植物/藻类等的贮存寿命;减少植物/藻类等中的变应原;确保附加值性状(例如营养改善);目标内源基因的筛选方法;生物燃料、脂肪酸、有机酸等的生产。
[0901]
生成能够产生脂肪酸的微生物
[0902]
在特定的实施方案中,本发明的方法用于生成能够产生脂肪酸酯(例如脂肪酸甲酯(“fame”)和脂肪酸乙酯(“faee”))的遗传工程微生物。
[0903]
通常,宿主细胞可通过表达或过表达编码硫酯酶的基因、编码酰基辅酶a合酶的基因和编码酯合酶的基因而被工程化,以从培养基中存在的碳源(例如醇)产生脂肪酸酯。因此,本文提供的方法用于修饰微生物以过表达或引入硫酯酶基因、编码酰基辅酶a合酶的基因和编码酯合酶的基因。在特定的实施方案中,所述硫酯酶基因选自tesa、'tesa、tesb、fatb、fatb2、fatb3、fatal或fata。在特定的实施方案中,编码酰基辅酶a合酶的基因选自faddjadk、bh3103、pfl

4354、eav15023、faddl、fadd2、rpc_4074、faddd35、faddd22、faa39或编码具有相同特性的酶的鉴定基因。在特定的实施方案中,编码酯合酶的基因是来自霍霍巴(simmondsia chinensis)、不动杆菌属adp种、泊库岛食烷菌(alcanivorax borkumensis)、铜绿假单胞菌(pseudomonas aeruginosa)、fundibacter jadensis、拟南芥或真养产碱杆菌(alkaligenes eutrophus)或其变体的编码合酶/酰基

coa:二酰基甘油酰基转移酶的基因。另外或可选地,本文提供的方法用于降低编码酰基辅酶a脱氢酶的基因、编码外膜蛋白受体的基因和编码脂肪酸生物合成的转录调节因子的基因中的至少一者在所述微生物中的表达。在特定的实施方案中,例如通过引入突变使这些基因中的一个或多个失活。在特定的实施方案中,编码酰基辅酶a脱氢酶的基因是fade。在特定的实施方案中,编码脂肪酸生物合成的转录调节因子的基因编码dna转录阻遏子,例如fabr。
[0904]
另外地或可替代地,修饰所述微生物以减少编码丙酮酸甲酸裂解酶的基因、编码乳酸脱氢酶的基因中的至少一者或两者的表达。在特定的实施方案中,编码丙酮酸甲酸裂解酶的基因是pflb。在特定的实施方案中,编码乳酸脱氢酶的基因是idha。在特定的实施方案中,例如通过在其中引入突变来使这些基因中的一者或多者失活。
[0905]
在特定的实施方案中,微生物选自埃希氏菌属、芽孢杆菌属、乳杆菌属、红球菌属(rhodococcus)、聚球藻属、synechoystis、假单胞菌属、曲霉属、木霉属、链孢霉属、镰刀菌属、腐质霉菌(humicola)、根毛霉属(rhizomucor)、克鲁维酵母属、毕赤酵母属、毛菌属、myceliophtora、青霉属、原毛平革菌属(phanerochaete)、侧耳属(pleurotus)、栓菌属(trametes)、金孢属(chrysosporium)、酵母属(saccharomyces)、寡养单胞菌属(stenotrophamonas)、裂殖酵母属(schizosaccharomyces)、耶氏酵母属(yarrowia)或链霉菌属(streptomyces)。
[0906]
生成能够产生有机酸的微生物
[0907]
本文提供的方法还用于工程化能够产生有机酸的微生物,更特别是由戊糖或己糖产生有机酸的微生物。在特定的实施方案中,所述方法包括将外源ldh基因引入微生物。在特定的实施方案中,通过使编码参与内源性代谢途径的蛋白质的内源基因失活来另外地或可替代地增加所述微生物中有机酸的产生,所述内源性代谢途径产生目标有机酸以外的代
谢产物和/或其中内源性代谢途径消耗有机酸。在特定的实施方案中,修饰确保减少了除目标有机酸以外的代谢产物的产生。根据特定的实施方案,所述方法用于引入其中消耗有机酸的内源途径的至少一种工程化基因缺失和/或失活,或编码产生除目标有机酸以外的代谢产物的内源途径中涉及的产物的基因。在特定的实施方案中,至少一种工程化基因缺失或失活是在编码选自由以下组成的组的酶的一种或多种基因中:丙酮酸脱羧酶(pdc)、富马酸还原酶、醇脱氢酶(adh)、乙醛脱氢酶、磷酸烯醇丙酮酸羧化酶(ppc)、d

乳酸脱氢酶(d

ldh)、l

乳酸脱氢酶(l

ldh)、乳酸2

单加氧酶。在其他实施方案中,至少一种工程化基因缺失和/或失活是在编码丙酮酸脱羧酶(pdc)的内源基因中。
[0908]
在其他实施方案中,微生物被工程化以产生乳酸,并且至少一个工程化基因的缺失和/或失活是在编码乳酸脱氢酶的内源基因中。另外地或可替代地,微生物包含编码细胞色素依赖性乳酸脱氢酶如细胞色素b2依赖性l

乳酸脱氢酶的内源基因的至少一种工程化基因缺失或失活。
[0909]
在动物和人类中的应用
[0910]
所述系统和方法可用于非人类动物。在一个方面,本发明提供了一种非人类的真核生物;优选多细胞真核生物,其包含根据任何所述实施方案的真核宿主细胞。在其他方面,本发明提供了一种真核生物;优选多细胞真核生物,其包含根据任何所述实施方案的真核宿主细胞。在这些方面的一些实施方案中,生物体可以是动物。例如哺乳动物。此外,生物体可以是节肢动物,例如昆虫。本发明还可扩展到其他农业应用,例如农场和生产动物。例如,猪具有许多使其作为生物医学模型具有吸引力的特征,尤其是在再生医学中。特别地,具有严重的联合免疫缺陷(scid)的猪可为再生医学、异种移植(也在本文其他地方讨论)和肿瘤发展提供有用的模型,并且将有助于开发用于人类scid患者的疗法。lee等人(proc natl acad sci u s a.2014年5月20日;111(20):7260

5)利用报告物指导的转录激活子样效应子核酸酶(talen)系统以在体细胞中以高效率产生重组激活基因(rag)2的靶向修饰,包括影响两个等位基因的一些靶向修饰。v型效应蛋白可应用于类似的系统。
[0911]
lee等人(proc natl acad sci u s a.2014年5月20日;111(20):7260

5)的方法可类似地如下应用于本发明。突变猪是通过在胎儿成纤维细胞中例如在rag2中靶向插入,接着进行scnt和胚胎转移而产生的。将编码crispr cas和报告物的构建体电穿孔到胎儿来源的成纤维细胞中。48小时后,将表达绿色荧光蛋白的转染细胞以估计的每孔单细胞稀释度分选到96孔板的各个孔中。通过扩增位于任何crispr cas切割位点两侧的基因组dna片段来筛选rag2的靶向修饰,接着对pcr产物进行测序。在筛选并确保不存在异位突变后,将带有rag2靶向修饰的细胞用于scnt。除去极性体以及大概含有中期ii板的卵母细胞的邻近细胞质的一部分,并将供体细胞放置在周玻璃体中。然后将重建的胚胎电穿孔以使供体细胞与卵母细胞融合,然后进行化学激活。激活的胚胎在含0.5μm scriptaid(s7817;sigma

aldrich)的猪合子培养基3(pzm3)中温育14

16小时。然后将胚胎洗涤以除去scriptaid,并在pzm3中培养,直到将它们转移到代孕猪的输卵管中。
[0912]
本发明用于创建对动物(在一些实施方案中为哺乳动物,在一些实施方案中为人类)的疾病或病症建模的平台。在某些实施方案中,这样的模型和平台是基于啮齿动物(在非限制性实例中为大鼠或小鼠)的。这样的模型和平台可利用自交啮齿动物品系之间的区别和比较。在某些实施方案中,这样的模型和平台是基于灵长类、马、牛、绵羊、山羊、猪、狗、
猫或鸟,例如以对此类动物的疾病和病症直接建模或者产生此类动物的改性和/或改良品系。有利地,在某些实施方案中,创建基于动物的平台或模型以模拟人类疾病或病症。例如,猪与人的相似性使得猪成为模拟人类疾病的理想平台。与啮齿动物模型相比,猪模型的开发既昂贵又费时。在另一方面,猪和其他动物在遗传学、解剖学、生理学和病理生理学上与人类的相似性更高。本发明提供了用于靶向基因和基因组编辑、基因和基因组修饰以及基因和基因组调控的高效平台,以用于此类动物平台和模型。尽管伦理标准阻碍了人类模型的开发,并且在许多情况下阻碍了基于非人类灵长类动物的模型的开发,但是本发明可用于体外系统,包括但不限于细胞培养系统、三维模型和系统,以及模拟、建模和研究人类的结构、器官和系统的遗传学、解剖学、生理学和病理生理学的类器官。平台和模型提供对单个或多个靶标的操纵。
[0913]
在某些实施方案中,本发明适用于像schomberg等人(faseb journal,2016年4月;30(1):增刊571.1)的疾病模型。为了模拟遗传性疾病1型神经纤维瘤病(nf

1),schomberg使用crispr

cas9通过将crispr/cas9组分胞质显微注射到猪胚胎中,在猪神经纤维蛋白1基因中引入突变。为针对cas9靶向切割的基因内外显子上游和下游的靶向位点区域创建了crispr指导rna(grna),并通过特定的单链寡脱氧核苷酸(ssodn)模板介导了修复以引入2500bp缺失。所述系统还用于工程改造具有特定nf

1突变或突变簇的猪,并且此外可用于工程改造给定人类个体的特异性或代表性的突变。本发明类似地用于开发人类多基因疾病的动物模型,包括但不限于猪模型。根据本发明,使用多重指导物和任选地一个或多个模板同时靶向一个基因或多个基因中的多个遗传基因座。
[0914]
本发明还适用于修饰其他动物如牛的snp。tan等人(proc natl acad sci u s a.2013年10月8日;110(41):16526

16531)扩展了牲畜基因编辑工具箱,以使用质粒、raav和寡核苷酸模板来包括转录激活子样(tal)效应子核酸酶(talen)刺激的同源性定向修复(hdr)和成簇规则间隔短回文重复序列(crispr)/cas9刺激的同源性定向修复(hdr)。根据他们的方法(mali p等人,(2013)rna

guided human genome engineering via cas9.science 339(6121):823

826)将基因特异性grna序列克隆到church lab grna载体(addgene id:41824)。通过共转染hcas9质粒(addgene id:41815)或从rciscript

hcas9合成的mrna来提供cas9核酸酶。通过将来自hcas9质粒(涵盖hcas9cdna)的xbai

agei片段亚克隆到rciscript质粒中来构建这种rciscript

hcas9。
[0915]
heo等人(stem cells dev.2015年2月1日;24(3):393

402.doi:10.1089/scd.2014.0278.电子出版于2014年11月3日)报道了使用牛多能细胞和成簇规则间隔短回文重复序列(crispr)/cas9核酸酶在牛基因组中进行高效基因靶向。首先,heo等人通过yamanaka因子的异位表达以及gsk3β和mek抑制剂(2i)处理,从牛体细胞成纤维细胞生成诱导型多能干细胞(ipsc)。heo等人观察到这些牛ipsc在畸胎瘤中的基因表达和发育潜能与幼稚的多能干细胞高度相似。此外,对牛nanog基因座具特异性的crispr

cas9核酸酶显示出对牛ipsc和胚胎中牛基因组的高效编辑。
[0916]
提供了对动物如牛的概况分析,以表现和传播具有重要经济意义的经济性状的性状,例如胴体组成、胴体质量、母体和生殖性状以及平均日增重。全面的概况的分析始于dna标志物(最通常是单核苷酸多态性或snp)的发现。
概况背后的所有标志物都是由研究机构的独立科学家发现的,这些研究机构包括大学、研究组织和政府机构(例如usda)。然后在验证群体中在分析标志物。使用代表各种生产环境和生物类型的多种资源种群,通常与牛肉行业的种畜、牛犊、肥育场和/或包装部门的行业合作伙伴合作,以收集通常不可用的表型。牛基因组数据库是广泛可用的,参见例如nagrp牛基因组协调计划(www.animalgenome.org/cattle/maps/db.html)。因此,本发明可应用于靶牛snp。本领域技术人员可利用上述方案靶向snp,并将其应用于牛snp,如tan等人或heo等人所描述。
[0917]
qingjian zou等人(journal of molecular cell biology advance access,出版于2015年10月12日)证实了通过靶向狗肌肉生长抑制素(myostatin/mstn)基因的第一外显子(骨骼肌质量的负调控子)使狗的肌肉质量增加。首先,使用将靶向mstn的sgrna与cas9载体共转染到犬胚成纤维细胞(cef)中,验证了sgrna的效率。此后,通过将具有正常形态的胚胎与cas9mrna和mstn sgrna的混合物显微注射,并将受精卵自体移植到同一只雌性狗的输卵管中,生成mstn ko狗。与野生型同窝姐妹相比,敲除的幼犬在大腿上表现出明显的肌肉表型。这也可使用本文提供的v型crispr系统执行。
[0918]
牲畜


[0919]
在一些实施方案中,牲畜中的病毒靶标可包括猪cd163,例如在猪巨噬细胞上。cd163与prrsv(猪繁殖与呼吸综合征病毒,一种动脉炎病毒)感染(被认为是通过病毒细胞进入)相关。prrsv的感染,尤其是猪肺泡巨噬细胞(在肺中发现)的感染会导致先前无法治愈的猪综合征(“神秘猪病”或“蓝耳病”),在家猪中造成痛苦,包括生殖衰竭、体重减轻和高死亡率。由于通过巨噬细胞活性丧失引起的免疫缺陷,经常会出现机会性感染,例如动物性肺炎、脑膜炎和耳部水肿。由于抗生素使用的增加和经济损失(估计每年6.6亿美元),它也具有重大的经济和环境影响。
[0920]
如密苏里州大学(university of missouri)的kristin m whitworth和randall prather等人(nature biotech 3434,在线出版于2015年12月07日)与genus plc合作所报道,使用crispr

cas9靶向cd163,并且经过编辑的猪的后代在暴露于prrsv时具有抗性。繁殖了一个创始雄性和一个创始雌性,它们都在cd163的外显子7中具有突变,以产生后代。创始雄性在一个等位基因上的外显子7中具有11bp的缺失,这导致结构域5的第45位氨基酸发生移码突变和错义翻译,随后在第64位氨基酸上出现提前终止密码子。另一个等位基因在外显子7中具有2bp加成并且在前一个内含子中具有377bp缺失,这预计会导致结构域5的前49个氨基酸表达,接着是氨基酸85处提前终止密码子。母猪在一个等位基因中具有7bp添加,当翻译时预计表达结构域5的前48个氨基酸,接着在氨基酸70处提前终止密码子。母猪的其他等位基因无法扩增。预计选定的后代将是无效动物(cd163

/

),即cd163敲除。
[0921]
因此,在一些实施方案中,猪肺泡巨噬细胞可被crispr蛋白靶向。在一些实施方案中,猪cd163可被所述系统靶向。在一些实施方案中,猪cd163可通过dsb的诱导或通过插入或缺失来敲除,例如靶向外显子7的缺失或修饰,包括上述那些中的一个或多个,或在基因的其他区域中,例如外显子5的缺失或修饰。
[0922]
还设想了经编辑的猪和它们的后代,例如cd163敲除猪。这可用于牲畜、育种或建模目的(即猪模型)。还提供了包含基因敲除的精液。
[0923]
cd163是富含半胱氨酸的清道夫受体(srcr)超家族的成员。根据体外研究,所述蛋
白质的srcr结构域5是负责解包装和释放病毒基因组的结构域。因而,srcr超家族的其他成员也可被靶向以评估对其他病毒的抗性。prrsv也是哺乳动物动脉炎病毒组的成员,该组还包括鼠类乳酸脱氢酶升高病毒、猿猴出血热病毒和马动脉炎病毒。动脉炎病毒共同具有重要的发病机理性质,包括巨噬细胞嗜性和引起严重疾病和持续感染的能力。因此,例如通过猪cd163或其在其他物种中的同源物,可靶向动脉炎病毒,特别是鼠类乳酸脱氢酶升高病毒、猿猴出血热病毒和马动脉炎病毒,并且还提供了鼠类、猿猴和马模型以及敲除。
[0924]
实际上,这种方法可能会扩展到引起其他牲畜疾病的病毒或细菌,这些疾病可能会传播给人类,例如猪流感病毒(siv)株,其包括丙型流感和称为h1n1、h1n2、h2n1、h3n1、h3n2和h2n3的甲型流感亚型,以及上述肺炎、脑膜炎和水肿。
[0925]
遗传和表观遗传条件的模型
[0926]
本文的系统和方法可用于产生可用于建模和/或研究目标遗传或表观遗传条件的植物、动物或细胞,例如通过目标突变模型或疾病模型。如本文所用,“疾病”是指受试者的疾病、病症或适应症。例如,本发明的方法可用于产生在与疾病相关的一种或多种核酸序列中包含修饰的动物或细胞,或其中与疾病相关的一种或多种核酸序列的表达被改变的植物、动物或细胞。这样的核酸序列可编码疾病相关的蛋白质序列或者可以是疾病相关的控制序列。因此,应当理解,在本发明的实施方案中,植物、受试者、患者、生物体或细胞可以是非人类受试者、患者、生物体或细胞。因此,本发明提供了通过本发明方法产生的植物、动物或细胞,或其后代。所述后代可以是所产生的植物或动物的克隆,或者可通过与同一物种的其他个体杂交以将进一步所需的性状渗入其后代而通过有性繁殖产生。在多细胞生物、特别是动物或植物的情况下,细胞可以是体内的或离体的。在培养细胞的情况下,如果满足适当的培养条件并且优选地如果细胞适合于此目的(例如干细胞),则可建立细胞系。还设想了由本发明产生的细菌细胞系。因此,还设想了细胞系。
[0927]
在一些方法中,疾病模型可用于使用疾病研究中常用的措施来研究突变对动物或细胞的影响以及疾病的发展和/或进展。或者,这种疾病模型可用于研究药物活性化合物对疾病的影响。
[0928]
在一些方法中,疾病模型可用于评估潜在基因治疗策略的功效。也就是说,可修饰疾病相关基因或多核苷酸,从而抑制或减少疾病的发展和/或进展。特别地,所述方法包括修饰疾病相关基因或多核苷酸,从而产生改变的蛋白质,结果,动物或细胞具有改变的反应。因此,在一些方法中,可将遗传修饰的动物与易于疾病发展的动物进行比较,从而可评估基因治疗事件的效果。
[0929]
在另一个实施方案中,本发明提供了开发调节与疾病基因相关的细胞信号事件的生物活性剂的方法。所述方法包括将测试化合物与包含一种或多种驱动系统的一种或多种组分表达的载体的细胞接触;以及检测读出的变化,所述读出变化指示与例如细胞中所含的疾病基因的突变相关的细胞信号事件的减少或增加。
[0930]
可与本发明用于筛选细胞功能变化的方法组合来构建细胞模型或动物模型。这种模型可用于研究由本文系统和方法修饰的基因组序列对目标细胞功能的影响。例如,细胞功能模型可用于研究经修饰的基因组序列对细胞内信号或细胞外信号的影响。或者,细胞功能模型可用于研究经修饰的基因组序列对感官知觉的影响。在一些这样的模型中,与模型中的信号生化途径相关的一个或多个基因组序列被修饰。
[0931]
已经专门研究了几种疾病模型。这些包括新发自闭症风险基因chd8、katnal2和scn2a;和综合征性孤独症(安格尔曼综合征(angelman syndrome))基因ube3a。这些基因和由此产生的自闭症模型当然是优选的,但用于显示本发明跨基因和相应模型的广泛适用性。与信号生化途径相关的一个或多个基因组序列的改变的表达可通过测定在测试模型细胞和对照细胞与候选剂接触时测定它们之间相应基因的mrna水平的差异来确定。或者,与信号生化途径相关的序列的差异表达通过检测编码多肽或基因产物的水平差异来确定。
[0932]
为了测定试剂诱导的mrna转录物或相应多核苷酸水平的改变,首先根据本领域的标准方法提取样品中所含的核酸。例如,可根据sambrook等人(1989)阐述的程序使用各种裂解酶或化学溶液分离mrna,或按照制造商提供的随附说明通过核酸结合树脂提取。然后根据本领域公知的方法或基于本文示例的方法,通过扩增程序或常规杂交测定法(例如northern印迹分析)来检测提取的核酸样品中所含的mrna。
[0933]
出于本发明的目的,扩增是指使用能够以合理的保真度复制靶序列的引物和聚合酶的任何方法。扩增可通过天然或重组dna聚合酶如taqgold
tm
、t7 dna聚合酶、大肠杆菌dna聚合酶的klenow片段和逆转录酶进行。优选的扩增方法是pcr。特别是,分离的rna可进行逆转录测定,该测定与定量聚合酶链反应(rt

pcr)相结合,以量化与信号生化途径相关的序列的表达水平。
[0934]
基因表达水平的检测可在扩增测定中实时进行。在一个方面,扩增产物可用荧光dna结合剂直接观察,所述荧光dna结合剂包括但不限于dna嵌入剂和dna沟结合剂。由于并入双链dna分子中的嵌入剂的量通常与扩增的dna产物的量成正比,因此可使用本领域中的常规光学系统通过量化嵌入染料的荧光来方便地确定扩增产物的量。适用于此应用的dna结合染料包括sybr绿、sybr蓝、dapi、碘化丙锭、hoeste、sybr金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素、玫瑰红素、道诺霉素、氯喹、地霉素d、色霉素、乙菲啶(homidium)、光神霉素、多吡啶钌、蒽霉素等。
[0935]
在另一方面,其他荧光标记如序列特异性探针可用于扩增反应中以促进扩增产物的检测和定量。基于探针的定量扩增依赖于所需扩增产物的序列特异性检测。它利用荧光、靶标特异性探针(例如探针),从而提高了特异性和灵敏度。进行基于探针的定量扩增的方法是本领域中公认的并且在美国专利第5,210,015号中教导。
[0936]
在另一方面,可进行使用杂交探针的常规杂交测定,所述杂交探针和与信号生化途径相关的序列共有序列同源性。通常,在杂交反应中,允许探针与源自测试对象的生物样品内所含的与信号生化途径相关的序列形成稳定的复合物。本领域技术人员将理解,在反义用作探针核酸的情况下,选择样品中提供的靶多核苷酸以与反义核酸的序列互补。相反,当核苷酸探针是有义核酸时,选择与有义核酸序列互补的靶多核苷酸。
[0937]
杂交可在各种严格度条件下进行。用于实施本发明的合适的杂交条件使得探针和与信号生化途径相关的序列之间的识别相互作用是足够特异性并且足够稳定的。提高杂交反应严格度的条件是本领域众所周知的并且已公开。参见例如(sambrook等人,(1989);nonradioactive in situ hybridization application manual,boehringer mannheim,第二版)。杂交测定可使用固定在任何固体支撑物上的探针形成,所述固体支撑物包括但不限于硝酸纤维素、玻璃、硅和各种基因阵列。优选的杂交测定是在美国专利第5,445,934号中描述的高密度基因芯片上进行的。
[0938]
为了方便检测在杂交测定过程中形成的探针

靶标复合物,核苷酸探针与可检测标记缀合。适用于本发明的可检测标记包括可通过光化学、生物化学、光谱、免疫化学、电、光学或化学手段检测的任何组合物。多种适当的可检测标记是本领域已知的,包括荧光或化学发光标记、放射性同位素标记、酶促或其他配体。在优选的实施方案中,人们可能希望使用荧光标记或酶标签,例如地高辛、β

半乳糖苷酶、脲酶、碱性磷酸酶或过氧化物酶、抗生物素蛋白/生物素复合物。
[0939]
用于检测或量化杂交强度的检测方法将通常取决于上面选择的标记。例如,可使用照相胶片或磷光成像仪检测放射性标记。可使用光检测器来检测和量化荧光标志物以检测发射的光。通常通过为酶提供底物并测量酶对底物的作用产生的反应产物来检测酶标记;并且最后通过简单地可视化彩色标签来检测比色标签。
[0940]
与信号生化途径相关的序列表达的试剂诱导变化也可通过检查相应的基因产物来确定。确定蛋白质水平通常包括a)将生物样品中包含的蛋白质和与信号生化途径相关的蛋白质特异性结合的试剂接触;以及(b)鉴定如此形成的任何试剂:蛋白质复合物。在该实施方案的一个方面,特异性结合与信号生化途径相关的蛋白质的试剂是抗体,优选单克隆抗体。
[0941]
所述反应是通过将试剂与源自测试样品的与信号生化途径相关的蛋白质样品在允许试剂和与信号生化途径相关的蛋白质之间形成复合物的条件下接触来进行的。可根据本领域的标准程序直接或间接检测复合物的形成。在直接检测方法中,试剂带有可检测的标记并且未反应的试剂可从复合物中去除;剩余标记的量从而指示所形成的复合物的量。对于这种方法,优选选择即使在严格的洗涤条件下也能保持附接至试剂的标记。优选标记不干扰结合反应。在替代方案中,间接检测程序可使用含有化学或酶促引入的标记的试剂。理想的标记通常不干扰所得试剂:多肽复合物的结合或稳定性。然而,标记通常被设计为可接近抗体以进行有效结合并因此生成可检测信号。
[0942]
适用于检测蛋白质水平的多种标记是本领域已知的。非限制性实例包括放射性同位素、酶、胶体金属、荧光化合物、生物发光化合物和化学发光化合物。
[0943]
在结合反应期间形成的试剂:多肽复合物的量可通过标准定量测定来定量。如上所述,试剂:多肽复合物的形成可直接通过结合位点上保留的标记量来测量。在替代方案中,测试与信号生化途径相关的蛋白质与经标记的类似物竞争特定试剂上的结合位点的能力。在这种竞争性测定中,捕获的标记量与测试样品中存在的与信号生化途径相关的蛋白质序列的量成反比。
[0944]
本领域中有许多基于上述一般原理的蛋白质分析技术。它们包括但不限于放射免疫测定、elisa(酶联免疫放射测定)、“夹心”免疫测定、免疫放射测定、原位免疫测定(使用例如胶体金、酶或放射性同位素标记)、蛋白质印迹分析、免疫沉淀测定、免疫荧光测定和sds

page。
[0945]
特异性识别或结合与信号生化途径相关的蛋白质的抗体优选用于进行上述蛋白质分析。在需要时,可使用识别特定类型的翻译后修饰(例如,信号生化途径诱导修饰)的抗体。翻译后修饰包括但不限于糖基化、脂化、乙酰化和磷酸化。这些抗体可购自商业供应商。例如,可从包括invitrogen和perkin elmer在内的许多供应商处获得特异性识别酪氨酸磷酸化蛋白质的抗磷酸酪氨酸抗体。抗磷酸酪氨酸抗体特别适用于检测响应于er应激而在酪
氨酸残基上发生差异磷酸化的蛋白质。此类蛋白质包括但不限于真核翻译起始因子2α(eif

2α)。或者,可使用常规的多克隆或单克隆抗体技术通过用表现出所需翻译后修饰的靶蛋白对宿主动物或抗体产生细胞进行免疫来产生这些抗体。
[0946]
在实施主题方法时,可能需要辨别与信号生化途径相关的蛋白质在不同身体组织中、不同细胞类型中和/或不同亚细胞结构中的表达模式。这些研究可使用组织特异性、细胞特异性或亚细胞结构特异性抗体进行,这些抗体能够结合在某些组织、细胞类型或亚细胞结构中优先表达的蛋白质标志物。
[0947]
与信号生化途径相关的基因表达的改变也可通过检查基因产物相对于对照细胞的活性变化来确定。试剂诱导的与信号生化途径相关的蛋白质活性变化的测定将取决于正在研究的生物活性和/或信号转导途径。例如,当蛋白质是激酶时,其磷酸化下游底物的能力的变化可通过本领域已知的多种测定法来确定。代表性测定法包括但不限于使用识别磷酸化蛋白质的抗体如抗磷酸酪氨酸抗体的免疫印迹和免疫沉淀。另外,激酶活性可通过高通量化学发光测定法例如alphascreen
tm
(可获自perkin elmer)和etag
tm
测定法(chan

hui等人,(2003)clinical immunology 111:162

174)来检测。
[0948]
当与信号生化途径相关的蛋白质是导致细胞内ph条件波动的信号级联的一部分时,ph敏感分子如荧光ph染料可用作报告分子。在与信号生化途径相关的蛋白质是离子通道的另一个实例中,可监测膜电位和/或细胞内离子浓度的波动。许多商业试剂盒和高通量设备特别适用于快速且稳健地筛选离子通道调节剂。代表性仪器包括fliprtm(molecular devices,inc.)和vipr(aurora biosciences)。这些仪器能够同时检测微孔板的超过1000个样品孔中的反应,并在一秒或甚至一毫秒内提供实时测量和功能数据。
[0949]
在实践本文公开的任何方法时,可经由本领域中已知的一种或多种方法将合适的载体引入细胞或胚胎,包括但不限于显微注射、电穿孔、声穿孔、生物弹射、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染转染、磁转染、脂转染、穿刺转染、光学转染、专有试剂增强的核酸摄取,以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒粒子的递送。在一些方法中,通过显微注射将载体引入胚胎中。可将一个或多个载体显微注射到胚胎的细胞核或细胞质中。在一些方法中,可通过核转染将一个或多个载体引入细胞中。
[0950]
crispr复合物的靶多核苷酸可以是真核细胞内源性或外源性的任何多核苷酸。例如,靶多核苷酸可以是存在于真核细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如蛋白质)或非编码序列(例如调控性多核苷酸或垃圾dna)的序列。
[0951]
靶多核苷酸的实例包括与信号生化途径相关的序列,例如信号生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在源自受疾病影响的组织的细胞中产生异常水平或异常形式的转录或翻译产物的任何基因或多核苷酸。它可能是以异常高水平表达的基因;它可能是以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。疾病相关基因也指具有突变或遗传变异的基因,其直接负责疾病病因或与负责疾病病因的基因连锁不平衡。转录或翻译的产物可能是已知的或未知的,并且可能处于正常或异常水平。
[0952]
本文系统的靶多核苷酸可以是真核细胞内源性或外源性的任何多核苷酸。例如,靶多核苷酸可以是存在于真核细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例
如蛋白质)或非编码序列(例如调控性多核苷酸或垃圾dna)的序列。不希望受理论束缚,据认为靶序列应与pam(原间隔子邻近基序)相缔合;也就是说,被crispr复合体识别的短序列。pam的精确序列和长度要求取决于所使用的crispr酶而不同,但pam通常是与原间隔子(即靶序列)邻近的2

5个碱基对序列。pam序列的实例在下面的实施例部分给出,并且技术人员将能够鉴定与给定crispr酶一起使用的其他pam序列。
[0953]
所述系统的靶多核苷酸可包括如美国临时专利申请61/736,527和61/748,427中所列的多种疾病相关基因和多核苷酸以及信号生化途径相关基因和多核苷酸,所述临时专利申请分别广泛参考bi

2011/008/wsgr案号44063

701.101和bi

2011/008/wsgr案号44063

701.102,名称都为systems methods and compositions for sequence manipulation,分别于2012年12月12日和2013年1月2日提交;以及pct申请pct/us2013/074667,名称为delivery,engineering and optimization of systems,methods and compositions for sequence manipulation and therapeutic applications,于2013年12月12日提交,其全部内容都通过引用整体并入本文。
[0954]
靶多核苷酸的实例包括与信号生化途径相关的序列,例如信号生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在源自受疾病影响的组织的细胞中产生异常水平或异常形式的转录或翻译产物的任何基因或多核苷酸。它可能是以异常高水平表达的基因;它可能是以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。疾病相关基因也指具有突变或遗传变异的基因,其直接负责疾病病因或与负责疾病病因的基因连锁不平衡。转录或翻译的产物可能是已知的或未知的,并且可能处于正常或异常水平。
[0955]
治疗应用
[0956]
本发明还考虑使用本文所述系统来治疗多种疾病和病症。在实施方案中,本文描述的发明涉及一种治疗方法,其中通过所述系统离体编辑细胞以调节至少一个基因,随后将经编辑的细胞施用于有需要的患者。在一些实施方案中,编辑涉及敲入、敲除或敲低细胞中至少一种靶基因的表达。在特定实施方案中,所述系统将外源基因、小基因或序列插入到基因基因组位置的靶基因的基因座、热点基因座、安全港基因座中,所述外源基因、小基因或序列可包含一个或多个外显子和内含子或天然或合成的内含子,其中可在不破坏邻近基因的表达或调控的情况下引入新的基因或遗传元件,或者通过插入或缺失来校正编码靶基因调控元件的dna序列中的一个或多个突变。
[0957]
在一些实施方案中,治疗是针对器官的疾病/病症,包括肝病、眼病、肌肉疾病、心脏病、血液病、脑病、肾病,或者可包括针对自身免疫疾病、中枢神经系统疾病、癌症和其他增殖性疾病、神经退行性病症、炎症性疾病、代谢性病症、肌肉骨骼病症等的治疗。
[0958]
特定疾病/病症包括软骨发育不全、色盲、酸性麦芽糖酶缺乏症、肾上腺脑白质营养不良、aicardi综合征、α

1抗胰蛋白酶缺乏症、α

地中海贫血、雄激素不敏感综合征、apert综合征、致心律失常性右心室、发育不良、共济失调毛细血管扩张症、barth综合征、β

地中海贫血、蓝色橡皮泡痣综合征、canavan病、慢性肉芽肿病(cgd)、cri du chat综合征、囊性纤维化、dercum病、外胚层发育不良、范可尼贫血、进行性骨化纤维发育不良、脆性x综合征、半乳糖血症、gaucher病、全身性神经节苷脂沉积症(例如gm1)、血色素沉着症、β

珠蛋白(hbc)的第6个密码子中的血红蛋白c突变、血友病、亨廷顿病、hurler综合征、低磷酸酯酶
症、klinefleter综合征、krabbes病、langer

giedion综合征、脑白质营养不良、长qt综合征、marfan综合征、moebius综合征、粘多糖贮积症(mps)、指甲髌骨综合征、肾源性糖尿病尿崩症、神经纤维瘤病、neimann

pick病、成骨不全症、卟啉症、prader

willi综合征、早衰症、变形杆菌综合征、视网膜母细胞瘤、rett综合征、rubinstein

taybi综合征、sanfilippo综合征、严重联合免疫缺陷(scid)、shwachman综合征、镰状细胞病(镰状细胞性贫血)、smith

magenis综合征、stickler综合征、tay

sachs病、血小板减少伴桡骨缺失(tar)综合征、treacher collins综合征、三体综合征、结节性硬化症、turner综合征、尿素循环障碍、von hippel

landau病、waardenburg综合征、williams综合征、wilson病和wiskott

aldrich综合征。
[0959]
在一些实施方案中,所述疾病与肿瘤抗原的表达相关,例如,与肿瘤抗原表达相关的增殖性疾病、癌前疾患、癌症或非癌症相关适应症,其在一些实施方案中可包含选自以下的靶标:b2m、cd247、cd3d、cd3e、cd3g、trac、trbc1、trbc2、hla

a、hla

b、hla

c、dck、cd52、fkbp1a、ciita、nlrc5、rfxank、rfx5、rfxap、或nr3c1、havcr2、lag3、pdcd1、pd

l2、ctla4、ceacam(ceacam

1、ceacam

3和/或ceacam

5)、vista、btla、tigit、lair1、cd160、2b4、cd80、cd86、b7

h3(cd113)、b7

h4(vtcn1)、hvem(tnfrsf14或cd107)、kir、a2ar、mhc i类、mhc ii类、gal9、腺苷和tgfβ,或ptpn11 dck、cd52、nr3c1、lilrb1、cd19;cd123;cd22;cd30;cd171;cs

1(也称为cd2子集1、cracc、slamf7、cd319和19a24);c型凝集素样分子

1(cll

1或clecl1);cd33;表皮生长因子受体变体iii(egfrviii);神经节苷脂g2(gd2);神经节苷脂gd3(aneu5ac(2

8)aneu5ac(2

3)bdgalp(1

4)bdglcp(1

1)cer);tnf受体家族成员b细胞成熟(bcma);tn抗原((tn ag)或(galnaca

ser/thr));前列腺特异性膜抗原(psma);受体酪氨酸激酶样孤儿受体1(ror1);fms样酪氨酸激酶3(flt3);肿瘤相关糖蛋白72(tag72);cd38;cd44v6;癌胚抗原(cea);上皮细胞粘附分子(epcam);b7h3(cd276);kit(cd117);白细胞介素

13受体亚基α

2(il

13ra2或cd213a2);间皮素;白细胞介素11受体α(il

11ra);前列腺干细胞抗原(psca);蛋白酶丝氨酸21(睾丸素或prss21);血管内皮生长因子受体2(vegfr2);lewis(y)抗原;cd24;血小板衍生生长因子受体β(pdgfr

β);阶段特异性胚胎抗原

4(ssea

4);cd20;叶酸受体α;受体酪氨酸蛋白激酶erbb2(her2/neu);n激酶erbb2(her2/neu);细胞表面相关粘蛋白1(muc1);表皮生长因子受体(egfr);神经细胞粘附分子(ncam);前列腺酶;前列腺酸性磷酸酶(pap);突变型伸长因子2(elf2m);肝配蛋白b2;成纤维细胞活化蛋白α(fap);胰岛素样生长因子1受体(igf

i受体)、碳酸酐酶ix(caix);蛋白酶体(prosome,macropain)亚基,β型,9(lmp2);糖蛋白100(gp100);由断点簇区(bcr)和abelson鼠类白血病病毒致癌基因同源物1(abl)(bcr

abl)组成的致癌基因融合蛋白;酪氨酸酶;肝配蛋白a型受体2(epha2);岩藻糖基gm1;唾液酸路易斯粘附分子(sle);神经节苷脂gm3(aneu5ac(2

3)bdgalp(1

4)bdglcp(1

1)cer);转谷氨酰胺酶5(tgs5);高分子量黑色素瘤相关抗原(hmwmaa);邻乙酰基

gd2神经节苷脂(oacgd2);叶酸受体β;肿瘤内皮标志物1(tem1/cd248);肿瘤内皮标志物7相关(tem7r);紧密连接蛋白6(cldn6);促甲状腺激素受体(tshr);g蛋白偶联受体c类5群,成员d(gprc5d);x染色体开放阅读框61(cxorf61);cd97;cd179a;间变性淋巴瘤激酶(alk);聚唾液酸;胎盘特异性1(plac1);globoh糖神经酰胺(globoh)的六糖部分;乳腺分化抗原(ny

br

1);尿空斑蛋白2(upk2);甲型肝炎病毒细胞受体1(havcr1);肾上腺素受体β3(adrb3);泛连接蛋白3(panx3);g蛋白偶联受体20(gpr20);
淋巴细胞抗原6复合体,基因座k 9(ly6k);嗅觉受体51e2(or51e2);tcrγ替代阅读框蛋白(tarp);wilms肿瘤蛋白(wt1);癌症/睾丸抗原1(ny

eso

1);癌症/睾丸抗原2(lage

1a);黑色素瘤相关抗原1(mage

a1);位于染色体12p上的ets易位变异基因6(etv6

aml);精子蛋白17(spa17);x抗原家族,成员1a(xage1);血管生成素结合细胞表面受体2(tie 2);黑色素瘤癌症睾丸抗原

1(mad

ct

1);黑色素瘤癌症睾丸抗原

2(mad

ct

2);fos相关抗原1;肿瘤蛋白p53(p53);p53突变体;前列腺素;存活素;端粒酶;前列腺癌肿瘤抗原

1(pcta

1或半乳糖凝集素8),t细胞识别的黑色素瘤抗原1(melana或mart1);大鼠肉瘤(ras)突变体;人端粒酶逆转录酶(htert);肉瘤易位断点;黑色素瘤凋亡抑制剂(ml

iap);erg(跨膜蛋白酶,丝氨酸2(tmprss2)ets融合基因);n

乙酰氨基葡萄糖氨基转移酶v(na17);配对盒蛋白pax

3(pax3);雄激素受体;细胞周期蛋白b1;v

myc禽类骨髓增生病病毒致癌基因神经母细胞瘤衍生同源物(mycn);ras同源物家庭成员c(rhoc);酪氨酸酶相关蛋白2(trp

2);细胞色素p450 1b1(cyp1b1);ccctc结合因子(锌指蛋白)样(boris或印迹位点调节剂兄弟),t细胞识别的鳞状细胞癌抗原3(sart3);配对盒蛋白pax

5(pax5);前顶体蛋白结合蛋白sp32(oy

tes1);淋巴细胞特异性蛋白酪氨酸激酶(lck);激酶锚定蛋白4(akap

4);滑膜肉瘤,x断点2(ssx2);高级糖化终产物受体(rage

1);肾泛素1(ru1);肾泛素2(ru2);豆荚蛋白;人乳头瘤病毒e6(hpv e6);人乳头瘤病毒e7(hpv e7);肠道羧基酯酶;突变型热休克蛋白70

2(mut hsp70

2);cd79a;cd79b;cd72;白细胞相关免疫球蛋白样受体1(lair1);iga受体的fc片段(fcar或cd89);白细胞免疫球蛋白样受体亚家族a成员2(lilra2);cd300分子样家族成员f(cd300lf);c型凝集素结构域家族12成员a(clec12a);骨髓基质细胞抗原2(bst2);含有egf样模块的粘蛋白样激素受体样2(emr2);淋巴细胞抗原75(ly75);磷脂酰肌醇蛋白聚糖(glypican)

3(gpc3);fc受体样5(fcrls);和免疫球蛋白λ样多肽1(igll1)、cd19、bcma、cd70、g6pc、肌营养不良蛋白(包括通过缺失或切除修饰外显子51)、dmpk、cftr(囊性纤维化跨膜传导调节因子)。在实施方案中,靶标包括cd70,或cd33的敲入和b2m的敲除。在实施方案中,靶标包括敲除trac和b2m,或trac b2m和pd1,有或没有额外的靶基因。在某些实施方案中,疾病是囊性纤维化,靶向scnn1a基因,例如非编码或编码区,例如启动子区,或转录序列,例如内含子或外显子序列,内含子2内cftr序列的靶向敲入,例如可向其中引入编码cftr外显子3

27的cftr序列;和cftr内含子10内的序列,其中可引入编码cftr外显子11

27的序列。
[0960]
在一些实施方案中,疾病是异染性脑白质营养不良并且靶标是芳基硫酸酯酶a,疾病是wiskott

aldrich综合征并且靶标是wiskott

aldrich综合征蛋白,疾病是肾上腺脑白质营养不良并且靶标是atp结合盒di,疾病是人类免疫缺陷病毒并且靶标是受体类型5

c

c趋化因子或cxcr4基因,疾病是β

地中海贫血并且靶标是血红蛋白β亚基,疾病是x连锁严重联合id受体亚基γ并且靶标是白细胞介素

2受体亚基γ,疾病是多系统溶酶体贮积症胱氨酸病并且靶标是胱氨酸转运蛋白,疾病是diamon

blackfan贫血并且靶标是核糖体蛋白s19,疾病是范可尼贫血并且靶标是范可尼贫血互补群(例如fnaca、fnacb、fancc、fancd1、fancd2、fance、fancf、rad51c),疾病是shwachman

bodian

diamond bodian

diamond综合征并且靶标是shwachman综合征基因,疾病是gaucher病并且靶标是葡萄糖脑苷脂酶,疾病是甲型血友病并且靶标是抗血友病因子或因子viii、圣诞因子、丝氨酸蛋白酶,因子乙型血友病ix,疾病是腺苷脱氨酶缺乏症(ada

scid)并且靶标是腺苷脱氨酶,疾病是gm1神经节苷
脂沉积症并且靶标是β

半乳糖苷酶,疾病是糖原贮积病ii型、庞贝病,疾病是酸性麦芽糖酶缺乏酸并且靶标是α

葡萄糖苷酶,疾病是niemann

pick病、smpd1相关(鞘磷脂磷酸二酯酶1型或a和b型)酸并且靶标是鞘磷脂酶,疾病是krabbe病、球状细胞脑白质营养不良并且靶标是半乳糖神经酰胺酶或半乳糖神经酰胺脂沉积症并且靶标是半乳糖脑苷脂酶、人类白细胞抗原dr

15、dq

6,疾病是多发性硬化症(ms)drb1,疾病是单纯疱疹病毒1或2并且靶标是敲低rs1、rl2和/或lat基因中的一者、两者或三者。在实施方案中,疾病是一种hpv相关癌症,其治疗包括包含结合分子的编辑细胞,例如tcr或其抗原结合片段和抗体及其抗原结合片段,例如识别或结合人乳头瘤病毒的那些。疾病可以是乙型肝炎,其靶标为prec、c、x、pres1、pres2、s、p和/或sp基因中的一者或多者。
[0961]
在一些实施方案中,免疫疾病是严重联合免疫缺陷(scid)、omenn综合征,并且在一个方面,靶标是重组激活基因1(rag1)或白细胞介素

7受体(il7r)。在特定实施方案中,疾病是甲状腺素运载蛋白淀粉样变性(attr)、家族性淀粉样变心肌病,并且在一个方面,靶标是ttr基因,包括ttr基因中的一个或多个突变。在实施方案中,疾病是α

1抗胰蛋白酶缺乏症(aatd)或另一种与α

1抗胰蛋白酶有关的疾病,例如gvhd、器官移植排斥、糖尿病、肝病、copd、肺气肿和囊性纤维化,在特定实施方案中,靶标是serpina1。
[0962]
在一些实施方案中,疾病是原发性高草酸尿症,在某些实施方案中,靶标包括乳酸脱氢酶a(ldha)和羟基酸氧化酶1(hao 1)中的一者或多者。在实施方案中,疾病是原发性高草酸尿症1型(ph1)和其他丙氨酸

乙醛酸氨基转移酶(agxt)基因相关疾患或病症,例如腺癌、慢性酒精中毒、阿尔茨海默病(alzheimer's disease)、库利贫血(cooley's anemia)、动脉瘤、焦虑症、哮喘、乳腺恶性赘瘤、皮肤恶性赘瘤、肾细胞癌、心血管疾病、宫颈恶性肿瘤、冠状动脉硬化、冠心病、糖尿病(diabetes)、糖尿病(diabetes mellitus)、非胰岛素依赖型糖尿病、糖尿病肾病、子痫、湿疹、亚急性心内膜炎、胶质母细胞瘤、糖原贮积病ii型、感音神经性听力损失(病症)、肝炎、甲型肝炎、乙型肝炎、高胱氨酸尿症、1型遗传性感觉自主神经病变、醛固酮增多症、高胆固醇血症、高草酸尿症、原发性高草酸尿症、高血压病、炎症性肠病、肾结石、肾病、慢性肾功能衰竭、平滑肌肉瘤、代谢疾病、先天性代谢异常、二尖瓣脱垂综合征、心肌梗塞、赘瘤转移、肾病综合征、肥胖症、卵巢疾病、牙周炎、多囊卵巢综合征、肾功能衰竭、成人呼吸窘迫综合征、视网膜疾病、脑血管意外、turner综合征、病毒性肝炎、牙齿脱落、卵巢早衰、原发性高血压、左心室肥大、偏头痛病症、皮肤黑色素瘤、高血压性心脏病、慢性肾小球肾炎、先兆偏头痛、继发性高血压、急性心肌梗塞、主动脉粥样硬化、过敏性哮喘、松果体细胞瘤、肺部恶性赘瘤、原发性高草酸尿症i型、原发性高草酸尿症2型、炎性乳腺癌、宫颈癌、再狭窄、出血性溃疡、婴儿全身性糖原贮积病、肾石病、慢性肾移植排斥反应、尿石症、皮肤刺穿、代谢综合征x、产妇高血压、颈动脉粥样硬化、癌变、乳腺癌、肺癌、肾病、微量白蛋白尿、家族性视网膜母细胞瘤、收缩性心力衰竭缺血性中风、左心室收缩功能障碍、马尾副神经节瘤、肝癌发生、慢性肾脏疾病、多形性胶质母细胞瘤、非赘瘤性疾病、草酸钙肾石病、ablepharon

macrostomia综合征、冠状动脉疾病、肝癌、慢性肾病5期、过敏性鼻炎(病症)、crigler najjar综合征2型和缺血性脑血管意外。在某些实施方案中,治疗是靶向肝脏。在实施方案中,基因是agxt,细胞遗传学位置为2q37.3,并且基因组坐标位于2号染色体上正向链上的位置240,868,479

240,880,502。
[0963]
治疗还可靶向胶原蛋白vii型α1链(col7a1)基因相关的疾患或病症,例如皮肤恶
性赘瘤、鳞状细胞癌、结肠直肠赘瘤、克罗恩病、大疱性表皮松解症、腹股沟斜疝、瘙痒症、精神分裂症、皮肤病症、遗传性皮肤病、畸胎瘤、cockayne

touraine病、获得性大疱性表皮松解症、营养不良性大疱性表皮松解症、交界性大疱性表皮松解症、hallopeau

siemens病、大疱性皮肤病、胼胝体发育不全、指甲营养不良、水泡性口炎、大疱性表皮松解症伴先天性局部皮肤缺失和指甲畸形、青少年肌阵挛性癫痫、食道鳞状细胞癌、kindler皮肤异色病、胫前大疱性表皮松解症、显性营养不良性大疱性表皮松解症白丘疹型(病症)、局部隐性营养不良性大疱性表皮松解症、全身性营养不良性大疱性表皮松解症、皮肤鳞状细胞癌、痒疹性大疱性表皮松解症、乳腺赘瘤、单纯性浅表性大疱性表皮松解症、孤立性脚趾甲营养不良、新生儿暂时性大疱性皮肤松解症、常染色体隐性大疱性表皮松解症局限型营养不良性变种和反向型营养不良性常染色体隐性大疱性皮肤松解症。
[0964]
在一些实施方案中,疾病是急性骨髓性白血病(aml),靶向wilms肿瘤i(wti)和hla表达细胞。在实施方案中,疗法是t细胞疗法,如本文别处所述,包括具有wti特异性tcr的工程化t细胞。在某些实施方案中,靶标是aml中的cd157。
[0965]
在实施方案中,疾病是血液病。在某些实施方案中,疾病是血友病,在一个方面靶标是因子xi。在其他实施方案中,疾病是血红蛋白病,例如镰状细胞病、镰状细胞性状、血红蛋白c病、血红蛋白c性状、血红蛋白s/c病、血红蛋白d病、血红蛋白e病、地中海贫血、与氧亲和力增加的血红蛋白相关的疾患、与氧亲和力降低的血红蛋白相关的疾患、不稳定血红蛋白病、高铁血红蛋白血症。也可治疗止血以及因子x和xii缺陷。在实施方案中,靶标是bcl11a基因(例如人bcl11a基因)、bcl11a增强子(例如人bcl11a增强子)或hfph区域(例如人hpfh区域)、β球蛋白、胎儿血红蛋白、γ

珠蛋白基因(例如,hbg1、hbg2、或hbg1和hbg2)、bcl11a基因的红细胞特异性增强子(bcl11ae)或它们的组合。
[0966]
在实施方案中,靶基因座可以是以下中的一者或多者:rac、trbcl、trbc2、cd3e、cd3g、cd3d、b2m、ciita、cd247、hla

a、hla

b、hla

c、dck、cd52、fkbp1a、nlrc5、rfxank、rfx5、rfxap、nr3c1、cd274、havcr2、lag3、pdcd1、pd

l2、hcf2、pai、tfpi、plat、plau、plg、rpoz、f7、f8、f9、f2、f5、f7、f10、f11、f12、f13a1、f13b、stat1、foxp3、il2rg、dclre1c、icos、mhc2ta、galns、hgsnat、arsb、rfxap、cd20、cd81、tnfrsf13b、sec23b、pklr、ifng、sptb、spta、slc4a1、epo、epb42、csf2 csf3、vfw、serpinca1、ctla4、ceacam(例如,ceacam

1、ceacam

3和/或ceacam

5)、vista、btla、tigit、lair1、cd160、2b4、cd80、cd86、b7

h3(cd113)、b7

h4(vtcnl)、hvem(tnfrsf14或cd107)、kir、a2ar、mhc i类、mhc ii类、gal9、腺苷和tgfβ、ptpn11和它们的组合。在实施方案中,基因组核酸序列内的靶序列在chrl 1:5,250,094

5,250,237,

链,hg38;chrl l:5,255,022

5,255,164,

链,hg38;非缺失hfph区域;chrl 1:5,249,833至chrl 1:5,250,237,

链,hg38;chrl 1:5,254,738至ch rl 1:5,255,164,

链,hg38;chrl 1:5,249,833

5,249,927,

链,hg 3;chrl 1:5,254,738

5,254,851,

链,hg38;chrl 1:5,250,139

5,250,237,

链,hg38。
[0967]
在一些实施方案中,疾病与高胆固醇相关,并提供胆固醇的调控,在一些实施方案中,调控是通过靶pcsk9中的修饰来实现的。可能涉及pcsk9并因此将成为本文所述系统和方法的靶标的其他疾病包括aβ脂蛋白血症、腺瘤、动脉硬化、动脉粥样硬化、心血管疾病、胆石症、冠状动脉硬化、冠心病、非胰岛素依赖型糖尿病、高胆固醇血症、家族性高胆固醇血症、高胰岛素血症、高脂血症、家族性联合高脂血症、低β脂蛋白血症、慢性肾功能衰竭、肝
病、肝赘瘤、黑色素瘤、心肌梗塞、发作性睡病、赘瘤转移、肾母细胞瘤、肥胖症、腹膜炎、弹性假黄瘤、脑血管意外、血管疾病、黄瘤病、外周血管疾病、心肌缺血、血脂异常、糖耐量受损、黄色瘤、多基因高胆固醇血症、肝脏继发性恶性赘瘤、痴呆症、超重、慢性丙型肝炎、颈动脉粥样硬化、ha型高脂蛋白血症、颅内动脉粥样硬化、缺血性中风、急性冠状动脉综合征、主动脉钙化、心血管病状、lib型高脂蛋白血症、外周动脉疾病、ii型家族性醛固酮增多症、家族性低β脂蛋白血症、常染色体隐性高胆固醇血症、常染色体显性高胆固醇血症3、冠状动脉疾病、肝癌、缺血性脑血管意外和动脉硬化性心血管疾病nos。在实施方案中,治疗可靶向肝脏,pcsk9的主要活动位置。
[0968]
在一些实施方案中,疾病或病症是以缺陷性cd40信号传导为特征的高igm综合征或病症。在某些实施方案中,cd40l外显子的插入用于恢复适当的cd40信号传导和b细胞类开关重组。在特定实施方案中,靶标是在细胞例如t细胞或造血干细胞(hsc)中cd40l基因的外显子2

5中的一者或多者处编辑的cd40配体(cd40l)。
[0969]
在一些实施方案中,疾病是merosin缺陷型先天性肌营养不良症(mdcmd)和其他层粘连蛋白α2(lama2)基因相关的疾患或病症。治疗可靶向肌肉,例如骨骼肌、平滑肌和/或心肌。在某些实施方案中,靶标是层粘连蛋白α2(lama2),它也可以称为层粘连蛋白

12亚基α、层粘连蛋白

2亚基α、层粘连蛋白

4亚基α3、merosin重链、层粘连蛋白m链、lamm、先天性肌肉萎缩症和merosin。lama2的细胞遗传学位置为6q22.33,并且基因组坐标位于6号染色体上的正向链上的位置128,883,141

129,516,563。在实施方案中,所治疗的疾病可以是merosin缺陷型先天性肌营养不良症(mdcmd)、肌萎缩性侧索硬化、膀胱赘瘤、charcot

marie

tooth疾病、结直肠癌、挛缩、囊肿、杜氏肌营养不良症、疲劳、远视、肾血管性高血压、黑色素瘤、精神发育迟滞、肌病、肌肉萎缩症、近视、肌炎、神经肌肉疾病、周围神经病、屈光不正、精神分裂症、严重智力低下(i.q.20

34)、甲状腺赘瘤、烟草使用障碍、严重联合免疫缺陷、滑膜囊肿、肺腺癌(病症)、肿瘤进展、皮肤草莓痣、肌肉变性、小牙(病症)、walker

warburg先天性肌营养不良症、慢性牙周炎、白质脑病、认知障碍、fukuyama型先天性肌营养不良症、硬化性肌营养不良症、eichsfeld型先天性肌营养不良症、神经病、肌眼脑病、肢带型肌营养不良症、先天性肌营养不良症(病症)、肌肉纤维化、癌症复发、耐药性癫痫、呼吸衰竭、粘液样囊肿、呼吸异常、先天性merosin阴性肌营养不良症、结直肠癌、由于部分lama2缺乏导致的先天性肌营养不良症和常染色体显性颅骨干骺端发育不良。
[0970]
在某些实施方案中,靶标是aavs1(pppir12c)、alb基因、angptl3基因、apoc3基因、asgr2基因、ccr5基因、fix(f9)基因、g6pc基因、gys2基因、hgd基因、lp(a)基因、pcsk9基因、serpinal基因、tf基因和ttr基因)。评估hdr/nhej介导的cdna敲入第一个外显子的效率可利用cdna敲入“安全港”位点,例如:具有与以下区域之一同源臂的单链或双链dna,例如:apoc3(chr 11:116829908

116833071)、angptl3(chr1:62,597,487

62,606,305)、serpinal(chr14:94376747

94390692)、lp(a)(chr6:160531483

160664259)、pcsk9(chr1:55,039,475

55,064,852)、fix(chrx:139,530,736

139,563,458)、alb(chr4:73,404,254

73,421,411)、ttr(chr1 8:31,591,766

31,599,023)、tf(chr3:133,661,997

133,779,005)、g6pc(chr17:42,900,796

42,914,432)、gys2(chr12:21,536,188

21,604,857)、aavs 1(ppp1r12c)(chr19:55,090,912

55,117,599)、hgd(chr3:120,628,167

120,682,570)、ccr5(chr3:46,370,854

46,376,206)或asgr2(chr17:7,101,322

7,114,310)。
[0971]
在一个方面,靶标是可溶性超氧化物歧化酶1(sod1),其可帮助治疗与基因相关的疾病或病症。在特定实施方案中,疾病或病症与sod1相关,并且可以是例如腺癌、白蛋白尿、慢性酒精中毒、阿尔茨海默病、健忘症、淀粉样变性、肌萎缩侧索硬化、贫血、自身免疫性溶血性贫血、镰状细胞性贫血、缺氧、焦虑症、主动脉疾病、动脉硬化、类风湿性关节炎、新生儿窒息、哮喘、动脉粥样硬化、自闭症、自身免疫性疾病、barrett食管、behcet综合征、膀胱恶性赘瘤、脑赘瘤、乳腺恶性赘瘤、口腔念珠菌病、结肠恶性肿瘤、支气管癌、非小细胞肺癌、鳞状细胞癌、移行细胞癌、心血管疾病、颈动脉血栓形成、肿瘤细胞转化、脑梗塞、脑缺血、短暂性脑缺血发作、charcot

marie

tooth病、霍乱、结肠炎、结直肠癌、冠状动脉硬化、冠心病、新型隐球菌感染、耳聋、生命中止、吞咽障碍、早老性痴呆、抑郁症、接触性皮炎、糖尿病(diabetes)、糖尿病(diabetes mellitus)、实验性糖尿病、胰岛素依赖型糖尿病、非胰岛素依赖型糖尿病、糖尿病血管病、糖尿病肾病、糖尿病视网膜病变、唐氏综合征、侏儒症、水肿、日本脑炎、中毒性表皮坏死松解症、颞叶癫痫、疹病、肌束震颤、酒精性脂肪肝、胎儿生长迟缓、纤维肌痛、纤维肉瘤、脆性x综合征、贾第虫病(giardiasis)、胶质母细胞瘤、神经胶质瘤、头痛、部分听力损失、心脏骤停、心力衰竭、房间隔缺损、蠕虫病、血色病、溶血(病症)、慢性肝炎、hiv感染、亨廷顿病、高胆固醇血症、高血糖、增生、高血压疾病、甲状腺功能亢进、垂体功能减退、低蛋白血症、低血压、自然低体温症、甲状腺功能减退、免疫缺陷综合征、免疫系统疾病、炎症、炎症性肠病、流感、肠道疾病、缺血、kearns

sayre综合征、圆锥角膜、肾结石、肾脏疾病、急性肾功能衰竭、慢性肾功能衰竭、多囊肾病、白血病、骨髓性白血病、急性早幼粒细胞白血病、肝硬化、肝病、肝赘瘤、闭锁综合征、慢性阻塞性气道疾病、肺赘瘤、系统性红斑狼疮、非霍奇金淋巴瘤、machado

joseph病、疟疾、胃恶性赘瘤、动物乳腺赘瘤、marfan综合征、脑膜脊髓膨出、精神发育迟滞、二尖瓣狭窄、获得性氟斑牙、运动障碍、多发性硬化症、肌肉僵硬、肌肉痉挛、肌肉萎缩、脊髓性肌萎缩、肌病、真菌病、心肌梗塞、心肌再灌注损伤、坏死、肾病、肾病综合征、神经变性、神经系统病症、神经痛、神经母细胞瘤、神经瘤、神经肌肉疾病、肥胖症、职业病、眼高血压、少精症、退行性多关节炎、骨质疏松症、卵巢癌、疼痛、胰腺炎、papillon

lefevre病、轻瘫、帕金森病、苯丙酮尿症、垂体疾病、先兆子痫、前列腺赘瘤、蛋白质缺乏症、蛋白尿、牛皮癣、肺纤维化、肾动脉阻塞、再灌注损伤、视网膜变性、视网膜疾病、视网膜母细胞瘤、血吸虫病、曼氏血吸虫病、精神分裂症、瘙痒症、癫痫发作、年龄相关性白内障、脊髓压迫、脑血管意外、蛛网膜下腔出血、进行性核上性麻痹、破伤风、三体综合征、turner综合征、单相抑郁症、荨麻疹、白癜风、声带麻痹、肠扭转、体重增加、hmn(遗传性运动神经病)近端i型、全前脑畸形、运动神经元疾病、神经原纤维变性(形态异常)、烧灼感、冷漠、情绪波动、滑膜囊肿、白内障、偏头痛病症、坐骨神经病、感觉神经病、皮肤萎缩状况、肌肉无力、食道癌、舌面颊运动障碍、特发性肺动脉高压、脊髓侧索硬化、先兆偏头痛、混合传导性感觉神经性听力损失、缺铁性贫血、营养不良、朊病毒病、线粒体肌病、melas综合征、慢性进行性外眼肌麻痹、全身瘫痪、早衰综合征、纤颤、精神症状、记忆障碍、肌肉退化、神经系统症状、胃出血、胰腺癌、脑皮克病、肝纤维化、肺部恶性赘瘤、年龄相关性黄斑变性、帕金森病症、疾病进展、低铜血症、细胞色素

c氧化酶缺乏症、原发性震颤、家族性运动神经元病、下运动神经元病、退行性脊髓病、糖尿病性多发性神经病、肝和肝内胆道癌、波斯湾综合征(persian gulf syndrome)、老年斑、萎缩性、额颞叶痴呆、语义性痴呆、普通偏头痛、认知障碍、肝脏恶性赘瘤、胰腺恶性赘瘤、前列腺恶性赘瘤、纯自主神经功能衰竭、运动症状、
痉挛、痴呆、神经退行性病症、慢性丙型肝炎、关岛型肌萎缩性侧索硬化、四肢僵硬、多系统病症、脱发、前列腺癌、肝肺综合征、桥本病(hashimoto disease)、进行性赘瘤疾病、乳腺癌、晚期疾病、肺癌、迟发性运动障碍、淋巴结继发性恶性赘瘤、结肠癌、胃癌、中枢神经母细胞瘤、胸主动脉夹层动脉瘤、糖尿病性黄斑水肿、微量白蛋白尿、中脑动脉闭塞、中脑动脉梗塞、上运动神经元体征、额颞叶变性、记忆力减退、经典苯丙酮尿症、cadasil综合征、神经性步态障碍、脊髓小脑共济失调2型、脊髓缺血、路易体病(lewy body disease)、脊髓延髓肌肉萎缩症、21号染色体单体病、血小板增多症、皮肤斑点、药物诱导性肝损伤、遗传性leber视神经萎缩、脑缺血、卵巢赘瘤、tau蛋白病、大血管病、持续性肺动脉高压、卵巢恶性赘瘤、粘液样囊肿、脉络膜疣、肉瘤、体重下降、重度抑郁症、轻度认知障碍、退行性障碍、部分三体综合征、心血管病状、听力障碍、认知改变、输尿管结石、乳腺赘瘤、结直肠癌、慢性肾脏疾病、微小病变肾病综合征、非赘瘤性病症、x连锁球脊髓萎缩、乳腺x线密度、正常张力青光眼易感性(发现)、白癜风相关多重自身免疫疾病易感性1(发现)、肌萎缩侧索硬化和/或额颞叶痴呆1、肌萎缩侧索硬化1、散发性肌萎缩侧索硬化、单肢肌萎缩、冠状动脉疾病、转化性偏头痛、反流、尿路上皮癌、运动障碍、肝癌、蛋白质错误折叠障碍、tdp

43蛋白质病、早幼粒细胞白血病、体重增加不良事件、线粒体细胞病、特发性肺动脉高压、进行性cgvhd、感染、grn相关的额颞叶痴呆、线粒体病变和听力损失。
[0972]
在特定实施方案中,疾病与基因atxn1、atxn2或atxn3相关,这些基因可被靶向用于治疗。在一些实施方案中,靶向位于atxn1的外显子8、atxn2的外显子1或atxn3的外显子10中的cag重复区域。在实施方案中,疾病是脊髓小脑性共济失调3(sca3)、sca1或sca2和其他相关病症,例如先天性异常、阿尔茨海默病、肌萎缩性脊髓侧索硬化、共济失调、共济失调毛细血管扩张症、小脑共济失调、小脑疾病、舞蹈病、腭裂、囊性纤维化、精神抑郁、抑郁症、肌张力障碍、食道赘瘤、外斜视、心脏骤停、亨廷顿病、machado

joseph病、运动障碍、肌肉萎缩症、肌强直性营养不良、发作性睡病、神经变性、神经母细胞瘤、帕金森病、外周神经病、不宁腿综合征、视网膜变性、色素性视网膜炎、精神分裂症、shy

drager综合征、睡眠障碍、遗传性痉挛性截瘫、血栓栓塞、僵人综合征、脊髓小脑性共济失调、食管癌、多发性神经病、热效应、肌肉抽搐、锥体外系征、共济失调、神经症状、脑萎缩、帕金森病症、蛋白质s缺乏症、小脑退化、家族性淀粉样蛋白神经病变葡萄牙型、痉挛综合征、垂直性眼球震颤、眼球震颤终末位、抗凝血酶iii缺乏症、萎缩性、复杂性遗传性痉挛性截瘫、多系统萎缩、苍白球变性、肌张力障碍、纯自主神经功能障碍、血栓形成倾向、蛋白c缺乏症、先天性肌强直性营养不良、运动症状、神经病、神经退行性病症、食道恶性赘瘤、视觉障碍、活化蛋白c抵抗、绝症、肌纤维颤搐、中枢神经母细胞瘤、失眠症、阑尾共济失调、发作性睡病

猝倒综合征、i型machado

joseph病、ii型machado

joseph病、iii型machado

joseph病、齿状核

苍白球萎缩、步态共济失调、脊髓小脑共济失调1型、脊髓小脑共济失调2型、脊髓小脑共济失调6型(病症)、脊髓小脑共济失调7型、肌肉脊髓延髓萎缩、基因组不稳定、发作性共济失调2型(病症)、x连锁球脊髓萎缩、脆性x震颤/共济失调综合征、由于活化蛋白c抵抗引起的血栓形成倾向(病症)、肌萎缩侧索硬化1、神经元核内包涵体疾病、遗传性抗凝血酶iii缺乏症和迟发性帕金森病。
[0973]
在一些实施方案中,疾病与肿瘤抗原

癌症或非癌症相关适应症的表达相关,例如急性淋巴性白血病、弥漫性大b细胞淋巴瘤、滤泡性淋巴瘤、慢性淋巴细胞白血病、霍奇金淋巴瘤、非霍奇金淋巴瘤。在实施方案中,靶标可以是tet2内含子、tet2内含子

外显子连接、
chr4基因组区域内的序列。
[0974]
在一些实施方案中,可治疗神经退行性疾病。在特定实施方案中,靶标是突触核蛋白α(snca)。在某些实施方案中,所治疗的病症是疼痛相关病症,包括先天性疼痛不敏感、压迫性神经病、阵发性极度疼痛障碍、高级房室传导阻滞、小纤维神经病和家族性发作性疼痛综合征2。在某些实施方案中,靶标是钠通道、电压门控、x型α亚基(scnioa)。
[0975]
在某些实施方案中,造血干细胞和祖干细胞被编辑,包括敲入。在特定实施方案中,敲入用于治疗溶酶体贮积病、糖原贮积病、粘多糖贮积症或其中蛋白质的分泌将改善疾病的任何疾病。在一个实施方案中,疾病是镰状细胞病(scd)。在另一个实施方案中,疾病是β

地中海贫血。
[0976]
在某些实施方案中,t细胞或nk细胞用于癌症治疗并且可包括包含重组受体(例如car)和一种或多种表型标志物的t细胞,所述表型标志物选自ccr7 、4

1bb (cd137 )、tim3 、cd27 、cd62l 、cd127 、cd45ra 、cd45ro

、t

betl'w、il

7ra 、cd95 、il

2rp 、cxcr3 或lfa

1 。在某些实施方案中,用于癌症免疫疗法的t细胞编辑包括改变一种或多种t细胞表达的基因,例如fas、bid、ctla4、pdcd1、cblb、ptpn6、b2m、trac和trbc基因中的一者或多者。在一些实施方案中,编辑包括引入或接近cblb目标位点的改变,以减少t细胞中cblb基因表达以治疗增殖性疾病,并且可包括在一个或多个cblb目标位点的更大插入或缺失。tgfbr2靶序列的t细胞编辑可位于例如tgfbr2基因的外显子3、4或5中并用于癌症和淋巴瘤治疗。
[0977]
用于移植的细胞可被编辑并且可包括细胞的一种或多种免疫原性基因(例如hla基因)的等位基因特异性修饰,例如hla

a、hla

b、hla

c、hla

drb1、hla

drb3/4/5、hla

dq和hla

dp miha,以及任何其他mhc i类或ii类基因或基因座,其可包括将一个或多个匹配的接受者hla等位基因递送到原始位置,其中定位一个或多个错配的供体hla等位基因,并且可包括将一个或多个匹配的接受者hla等位基因插入到“安全港”基因座中。在一个实施方案中,所述方法还包括在基因中引入用于体内选择的化学疗法抗性基因。
[0978]
方法和系统可靶向肌强直性营养不良蛋白激酶(dmpk)进行编辑,在特定实施方案中,靶标是dmpk基因的3'非翻译区(utr)中的ctg三核苷酸重复序列。与dmpk相关的病症或疾病包括动脉粥样硬化、无精子症、肥厚性心肌病、乳糜泻、先天性染色体疾病、糖尿病、局灶性肾小球硬化、亨廷顿病、性腺功能减退症、肌肉萎缩症、肌病、肌肉萎缩症、肌强直、肌营养不良、神经肌肉疾病、视神经萎缩、轻瘫、精神分裂症、白内障、脊髓小脑性共济失调、肌肉无力、肾上腺脑白质营养不良、中央核肌病、间质纤维化、强直性肌营养不良、异常精神状态、x连锁charcot

marie

tooth病1、先天性肌营养不良、双侧萎缩(病症)、先天性纤维型歧化、肌张力障碍、多系统病症、3

甲基戊二酸尿症3型、心脏事件、心源性晕厥、先天性结构性肌病、精神障碍、肾上腺脊髓神经病、肌强直性营养不良2和智力障碍。
[0979]
在一些实施方案中,疾病是一种先天性代谢错误。疾病可选自碳水化合物代谢障碍(糖原贮积病、g6pd缺乏症)、氨基酸代谢障碍(苯丙酮尿症、枫糖浆尿病、戊二酸血症1型)、尿素循环障碍或尿素循环缺陷(氨基甲酰磷酸合酶i缺乏症)、有机酸代谢障碍(碱酸尿症、2

羟基戊二酸尿症)、脂肪酸氧化障碍/线粒体代谢障碍(中链酰基辅酶a脱氢酶缺乏症)、卟啉代谢障碍(急性间歇性卟啉症)、嘌呤/嘧啶代谢障碍(lesch

nynan综合征)、类固醇代谢障碍(脂质先天性肾上腺增生、先天性肾上腺增生)、线粒体功能障碍(kearns

sayre综合征)、过氧化物酶体功能障碍(zellweger综合征)或溶酶体贮积症(gaucher病、
niemann

pick病)。
[0980]
在一些实施方案中,靶标可包括重组激活基因1(rag1)、bcl11a、pcsk9、层粘连蛋白、α2(lama2)、atxn3、丙氨酸

乙醛酸转氨酶(agxt)、胶原蛋白vii型α1链(col7a1)、脊髓小脑共济失调1型蛋白(atxn1)、血管生成素样3(angptl3)、共济蛋白(frataxin)(fxn)、可溶性超氧化物酶歧化酶1(sod1)、突触核蛋白α(snca)、钠通道、电压门控、x型α亚基(scn10a)、脊髓小脑共济失调2型蛋白(atxn2)、肌强直性营养不良蛋白激酶(dmpk)、11号染色体上的β珠蛋白基因座、中链脂肪酸的酰基辅酶a脱氢酶(acadm)、长链脂肪酸的长链3

羟基辅酶a脱氢酶(hadha)、极长链脂肪酸的酰基辅酶a脱氢酶(acadvl)、载脂蛋白c3(apociii)、甲状腺素运载蛋白(ttr)、血管生成素样4(angptl4)、钠电压门控通道α亚基9(scn9a)、白细胞介素

7受体(il7r)、催化性葡萄糖
‑6‑
磷酸酶(g6pc)、血色病(hfe)、serpina1、c9orf72、β

珠蛋白、肌营养不良蛋白、γ

珠蛋白。
[0981]
在某些实施方案中,疾病或病症与载脂蛋白c3(apociii)相关,其可被靶向用于编辑。在实施方案中,疾病或病症可以是血脂异常、2型高α脂蛋白血症、狼疮性肾炎、wilms瘤5、病态肥胖和生精、青光眼、糖尿病性视网膜病、关节弯曲肾功能不全、胆汁淤积综合征、认知障碍、对心肌梗塞的反应改变、葡萄糖不耐受、甘油三酯生物合成过程的阳性调节、慢性肾功能不全、高脂血症、慢性肾衰竭、载脂蛋白c

iii缺乏症、冠状动脉疾病、新生儿糖尿病、新生儿具有先天性甲状腺功能亢进、高胆固醇血症常染色体显性3、高脂蛋白血症iii型、甲状腺功能亢进、冠状动脉疾病、肾动脉梗阻、代谢综合征x、家族性联合高脂血症、胰岛素抵抗、暂时性婴儿高甘油三酯血症、糖尿病肾病、糖尿病(1型)、有或没有眼部异常的肾病综合征5型和出血热伴肾综合征。
[0982]
在某些实施方案中,靶标是血管生成素样4(angptl4)。可治疗的与angptl4相关的疾病或病症包括angptl4与血脂异常、低血浆甘油三酯水平、血管生成调节剂和调节肿瘤发生以及严重的糖尿病视网膜病变(增殖性糖尿病视网膜病变和非增殖性糖尿病视网膜病变两者)相关。
[0983]
在一些实施方案中,编辑可用于治疗脂肪酸紊乱。在某些实施方案中,靶标是acadm、hadha、acadvl中的一者或多者。在实施方案中,靶向编辑是选自中链脂肪酸酰基辅酶a脱氢酶(acadm)基因、长链脂肪酸的长链3

羟基辅酶a脱氢酶(hadha)基因和极长链脂肪酸的酰基辅酶a脱氢酶(acadvl)基因的细胞中的基因活性。在一个方面,疾病是中链酰基辅酶a脱氢酶缺乏症(mcadd)、长链3

羟基辅酶a脱氢酶缺乏症(lchadd)和/或极长链酰基辅酶a脱氢酶缺乏症(vlcadd)。
[0984]
治疗病原体,如病毒病原体如hiv
[0985]
cas介导的基因组编辑可用于在体细胞组织中引入保护性突变,以对抗非遗传或复杂疾病。例如,nhej介导的淋巴细胞中ccr5受体的失活(lombardo等人,nat biotechnol.2007年11月;25(11):1298

306)可能是规避hiv感染的可行策略,而pcsk9(cohen等人,nat genet.2005年2月;37(2):161

5)或血管生成素(musunuru等人,n engl j med.2010年12月2日;363(23):2220

7)的缺失可能提供针对他汀类药物耐药性高胆固醇血症或高脂血症的治疗作用。尽管也可使用sirna介导的蛋白敲低来解决这些靶标,但nhej介导的基因失活的独特优势是无需持续治疗即可获得永久治疗益处的能力。与所有基因疗法一样,确定每种拟议的治疗用途具有有利的益处风险比当然很重要。
[0986]
将编码cas9和指导rna的质粒dna连同修复模板以流体动力学方式递送至酪氨酸血症成年小鼠模型的肝脏中,显示能够校正突变的fah基因并在250个细胞中的约1个中拯救野生型fah蛋白的表达(nat biotechnol.2014年6月;32(6):551

3)。此外,临床试验成功地使用zf核酸酶通过离体敲除ccr5受体来抵抗hiv感染。在所有患者中,hiv dna水平下降,并且在四分之一的患者中,hiv rna变得不可检测(tebas等人,n engl j med.2014年3月6日;370(10):901

10)。这些结果都证实了可编程核酸酶有望成为一种新型治疗平台。
[0987]
在另一个实施方案中,具有靶向hiv tat/rev共有的共同外显子的sirna、核仁定位的tar诱饵和抗ccr5特异性锤头状核酶的自灭活慢病毒载体(参见例如digiusto等人(2010)sci transl med 2:36ra43)可用于/和或适于本发明的系统。可收集每千克患者体重最少2.5
×
106个cd34 细胞,并在含有2μmol/l

谷氨酰胺、干细胞因子(100ng/ml)、flt

3配体(flt

3l)(100ng/ml)和血小板生成素(10ng/ml)(cellgenix)的x

vivo 15培养基(lonza)中预刺激16至20小时,密度为2
×
106个细胞/毫升。可在包被有纤连蛋白(25mg/cm2)(retronectin,takara bio inc.)的75cm2组织培养瓶中以5的感染复数用慢病毒转导预刺激的细胞16至24小时。
[0988]
利用本领域的知识和本公开的教导,技术人员可校正hsc以抵抗例如hiv/aids的免疫缺陷疾患,包括使hsc与靶向并敲除ccr5的v型crispr系统接触。使靶向并敲除含有ccr5和v型效应子的粒子的指导rna(并且有利的是双重指导方法,例如一对不同的指导rna;例如,在原代人cd4 t细胞和cd34 造血干细胞和祖细胞(hspc)中靶向两种临床相关基因b2m和ccr5的指导rna)与hsc接触。如此接触的细胞可被施用;以及任选地处理/扩增;参考cartier。还参见kiem,“hematopoietic stem cell

based gene therapy for hiv disease,”cell stem cell.2012年2月3日;10(2):137

147;通过引用并入本文以及其引用的文件;mandal等人,“efficient ablation of genes in human hematopoietic stem and effector cells using crispr/cas9,”cell stem cell,第15卷,第5期,第643

652页,2014年11月6日;通过引用并入本文以及其引用的文件。还提及了ebina,“crispr/cas9 system to suppress hiv

1expression by editing hiv

1integrated proviral dna”scientific reports|3:2510|doi:10.1038/srep02510,通过引用并入本文以及其引用的文件,作为使用crispr

v型效应子系统对抗hiv/aids的另一种手段。
[0989]
对hiv治疗进行基因组编辑的基本原理源自以下观察结果:ccr5(病毒的细胞共受体)功能丧失突变的纯合个体对感染具有很高的抵抗力并且在其他方面很健康,这表明用基因组编辑模仿这种突变可能是一种安全有效的治疗策略[liu,r.等人,cell 86,367

377(1996)]。当hiv感染的患者接受来自功能丧失ccr5突变的纯合子供体的同种异体骨髓移植,从而导致hiv水平不可检测并恢复正常的cd4t细胞计数时,这一想法在临床上得到了验证[hutter,g.等人,the new england journal of medicine 360,692

698(2009)]。尽管对于大多数hiv患者而言,骨髓移植并不是一种现实的治疗策略,但由于成本高昂和潜在的移植物抗宿主疾病,将患者自身t细胞转化为ccr5的hiv治疗是理想的。
[0990]
早期使用zfn和nhej敲除hiv人源化小鼠模型中的ccr5的研究表明,ccr5编辑的cd4t细胞的移植改善了病毒载量和cd4t细胞计数[perez,e.e.等人,nature biotechnology 26,808

816(2008)]。重要的是,这些模型还表明,hiv感染导致选择了ccr5无效细胞,这表明编辑赋予了适合性优势并可能使少量经编辑的细胞产生治疗效果。
american society of gene therapy 21,1259

1269(2013);mandal等人,cell stem cell,第15卷,第5期,第643

652页,2014年11月6日;wang等人(plos one.2014年12月26日;9(12):e115987.doi:10.1371/journal.pone.0115987);fine等人(sci rep.2015年7月1日;5:10777.doi:10.1038/srep10777);以及li等人(j gen virol.2015年8月;96(8):2381

93.doi:10.1099/vir.0.000139.电子出版于2015年4月8日),用本发明的crispr cas系统靶向ccr5。
[0997]
治疗病原体,如病毒病原体如hbv
[0998]
本发明还可用于治疗乙型肝炎病毒(hbv)。然而,必须通过例如优化剂量和序列来调整所述系统,以避免rnai的缺点,例如夸大内源性小rna途径的风险(参见例如grimm等人,nature,第441卷,2006年5月26日)。例如,考虑了低剂量,例如每人约1

10
×
10
14
个粒子。在另一个实施方案中,针对hbv的系统可在脂质体中施用,例如稳定的核酸

脂质粒子(snalp)(参见例如morrissey等人,nature biotechnology,第23卷,第8期,2005年8月)。预期每日静脉内注射约1、3或5毫克/千克/天的靶向snalp中hbv rna的crispr cas。每日治疗可能会超过约三天,然后每周治疗持续约五周。在另一个实施方案中,chen等人(gene therapy(2007)14,11

19)的系统可用于/和或适于本发明的系统。chen等人使用双链腺相关病毒8假型载体(dsaav2/8)递送shrna。单次施用带有hbv特异性shrna的dsaav2/8载体(每只小鼠1
×
10
12
个载体基因组),可有效抑制hbv转基因小鼠肝脏中的hbv蛋白、mrna和复制性dna的稳定水平,导致循环中hbv负荷下降多达2

3log
10
。施用载体后,hbv的显著抑制作用持续至少120天。shrna的治疗作用是靶序列依赖性的,并且不涉及干扰素的激活。对于本发明,可将针对hbv的系统克隆到aav载体,例如dsaav2/8载体中,并以例如每个人约1
×
10
15
个载体基因组至约1
×
10
16
载体基因组的剂量施用于人类。在另一个实施方案中,wooddell等人(molecular therapy第21卷第5期,973

985,2013年5月)的方法可用于/和或适于本发明的系统。woodell等人表明将肝细胞靶向的n

乙酰基半乳糖胺缀合的蜂毒肽样肽(nag

mlp)与靶向凝血因子vii(f7)的嗜肝胆固醇缀合的sirna(chol

sirna)简单共注射,可在小鼠和非人类灵长类动物中有效地敲低f7,而不存在临床化学或诱导细胞因子的变化。使用hbv感染的瞬时和转基因小鼠模型,wooddell等人表明,将nag

mlp与靶向保守hbv序列的有效chol

sirna单次共注射,导致病毒rna、蛋白质和病毒dna的多对数阻遏并具有长效作用。对于本发明,可设想例如约6mg/kg的nag

mlp和6mg/kg的hbv特异性crispr cas的静脉内共注射。或者,可在第一天递送约3mg/kg的nag

mlp和3mg/kg的hbv特异性crispr cas,接着在两周后施用约2

3mg/kg的nag

mlp和2

3mg/kg的hbv特异性crispr cas。
[0999]
在一些实施方案中,靶序列是hbv序列。在一些实施方案中,靶序列包含在附加型病毒核酸分子中,所述附加型病毒核酸分子没有整合到生物体的基因组中,从而操纵附加型病毒核酸分子。在一些实施方案中,附加型核酸分子是双链dna多核苷酸分子或者是共价闭合的环状dna(cccdna)。在一些实施方案中,与不提供复合物的生物体细胞中的附加型病毒核酸分子的量相比,crispr复合物能够减少生物体细胞中的附加型病毒核酸分子的量,或者能够操纵附加型病毒核酸分子以促进附加型核酸分子的降解。在一些实施方案中,靶hbv序列被整合到生物体的基因组中。在一些实施方案中,当在细胞内形成时,crispr复合物能够操纵整合的核酸以促进从生物体基因组中切除全部或部分的靶hbv核酸。在一些实施方案中,所述至少一种靶hbv核酸包含在整合到生物体基因组中的双链dna多核苷酸
cccdna分子和/或病毒dna中,并且其中crispr复合物操纵至少一种靶hbv核酸以切割病毒cccdna和/或整合的病毒dna。在一些实施方案中,所述切割包含引入病毒cccdna和/或整合的病毒dna中的一个或多个双链断裂,任选地至少两个双链断裂。在一些实施方案中,所述切割是经由引入病毒cccdna和/或整合的病毒dna中的一个或多个单链断裂,任选地至少两个单链断裂。在一些实施方案中,所述一个或多个双链断裂或所述一个或多个单链断裂导致在病毒cccdna序列和/或整合的病毒dna序列中形成一个或多个插入或缺失突变(indel)。
[1000]
lin等人(mol ther nucleic acids.2014年8月19日;3:e186.doi:10.1038/mtna.2014.38)设计了八种针对基因型a的hbv的grna。利用hbv特异性grna,crispr

cas9系统显著降低了用hbv表达载体转染的huh

7细胞中hbv核和表面蛋白的产生。在八种筛选的grna中,鉴定出两种有效的grna。靶向保守hbv序列的一种grna针对不同的基因型起作用。使用流体动力学

hbv持久性小鼠模型,lin等人进一步证明该系统可切割含肝内hbv基因组的质粒并促进其在体内的清除,从而降低血清表面抗原水平。这些数据表明,crispr

cas9系统可在体外和体内破坏表达hbv的模板,表明其在消除持久性hbv感染方面的潜力。
[1001]
dong等人(antiviral res.2015年6月;118:110

7.doi:10.1016/j.antiviral.2015.03.015.电子出版于2015年4月3日)使用crispr

cas9系统靶向hbv基因组并有效抑制hbv感染。dong等人合成了四个靶向hbv保守区域的单指导rna(指导rna)。这些带有cas9的指导rna的表达减少了huh7细胞以及hbv复制细胞hepg2.2.15中的病毒产生。dong等人进一步证实了crispr

cas9的直接切割和切割介导的诱变发生在转染细胞的hbv cccdna中。在携带hbv cccdna的小鼠模型中,经由快速尾静脉注射指导rna

cas9质粒导致低水平的cccdna和hbv蛋白。
[1002]
liu等人(j gen virol.2015年8月;96(8):2252

61.doi:10.1099/vir.0.000159.电子出版于2015年4月22日)设计了八种指导rna(grna),所述指导rna靶向不同hbv基因型的保守区域,在体外和体内都显著抑制hbv复制,以研究使用crispr

cas9系统破坏hbv dna模板的可能性。hbv特异性的grna/v型效应子系统可抑制细胞中不同基因型的hbv复制,并且病毒dna通过单个grna/v型效应子系统显著减少并通过不同grna/v型效应子系统的组合清除。
[1003]
wang等人(world j gastroenterol.2015年8月28日;21(32):9554

65.doi:10.3748/wjg.v21.i32.9554)设计了15种针对a

d基因型hbv的grna。选择了两个上述覆盖hbv调控区的grna(双重grna)的11种组合。通过测量培养上清液中的hbv表面抗原(hbsag)或e抗原(hbeag),研究了每种grna和11种双重grna在抑制hbv(基因型a

d)复制时的效率。使用聚合酶链反应(pcr)和测序方法在与双重grna和hbv表达载体共转染的huh7细胞中研究hbv表达载体的破坏,并且使用kcl沉淀、质粒安全的atp依赖性dna酶(psad)消化、滚环扩增和定量pcr组合方法研究了hepad38细胞中cccdna的破坏。这些grna的细胞毒性通过线粒体四唑鎓测定法评估。所有grna均可显著降低培养上清液中hbsag或hbeag的产生,这取决于grna所针对的区域。所有双重grna均可有效抑制基因型a

d的hbv的hbsag和/或hbeag产生,并且与单独使用的单个grna相比,双重grna抑制hbsag和/或hbeag产生的功效显著提高。此外,通过pcr直接测序,申请人证实了这些双重grna可通过去除两个使用的grna切割位点之间的片段来特异性破坏hbv表达模板。最重要的是,grna

5和grna

12组合不仅可有
效抑制hbsag和/或hbeag的产生,而且可破坏hepad38细胞中的cccdna储库。
[1004]
karimova等人(sci rep.2015年9月3日;5:13734.doi:10.1038/srep13734)鉴定了hbv基因组的s和x区域中交叉基因型保守的hbv序列,这些序列被靶向以通过cas9切口酶特异性和有效切割。这种方法不仅破坏了报告细胞系中的游离cccdna和染色体整合的hbv目标位点,而且破坏了慢性和从头感染的肝癌细胞系中的hbv复制。
[1005]
本领域技术人员可利用例如以下的上述研究:lin等人(mol ther nucleic acids.2014年8月19日;3:e186.doi:10.1038/mtna.2014.38);dong等人(antiviral res.2015年6月;118:110

7.doi:10.1016/j.antiviral.2015.03.015.电子出版于2015年4月3日);liu等人(j gen virol.2015年8月;96(8):2252

61.doi:10.1099/vir.0.000159.电子出版于2015年4月22日);wang等人(world j gastroenterol.2015年8月28日;21(32):9554

65.doi:10.3748/wjg.v21.i32.9554);以及karimova等人(sci rep.2015年9月3日;5:13734.doi:10.1038/srep13734),用于通过本发明的crispr cas系统靶向hbv。
[1006]
慢性乙型肝炎病毒(hbv)感染是普遍的、致命的,并且由于病毒游离dna(cccdna)在感染细胞中的持久性而很少治愈。ramanan等人(ramanan v,shlomai a,cox db,schwartz re,michailidis e,bhatta a,scott da,zhang f,rice cm,bhatia sn,.sci rep.2015年6月2日;5:10833.doi:10.1038/srep10833,在线出版于2015年6月2日)表明crispr/cas9系统可特异性靶向和切割hbv基因组中的保守区域,导致病毒基因表达和复制的稳健抑制。一旦cas9的持续表达和适当选择的指导rna,证实了cas9对cccdna的切割,并且cccdna以及病毒基因表达和复制的其他参数均显著降低。因此,他们表明直接靶向病毒游离dna是控制病毒并可能治愈患者的新型治疗方法。这也以the broad institute等人的名义在wo2015089465a1中描述,所述文件的内容通过引用并入本文。
[1007]
因此,在一些实施方案中优选靶向hbv中的病毒游离dna。
[1008]
本发明还可用于治疗病原体,例如细菌、真菌和寄生虫病原体。大多数研究工作都集中在开发新的抗生素,然而一旦开发出新的抗生素,它们将同样面临耐药性问题。本发明提供了克服这些困难的新颖的基于crispr的替代物。此外,与现有抗生素不同,基于crispr的治疗可使病原体具有特异性,从而在避免有益细菌的情况下诱导目标病原体的细菌细胞死亡。
[1009]
本发明也可用于治疗丙型肝炎病毒(hcv)。roelvinki等人(molecular therapy第20卷第9期,1737

1749 2012年9月)的方法可应用于crispr cas系统。例如,诸如aav8的aav载体可以是预期的载体,并且例如可预期每千克体重约1.25
×
10
11
至1.25
×
10
13
个载体基因组的剂量(vg/kg)。本发明还可用于治疗病原体,例如细菌、真菌和寄生虫病原体。大多数研究工作都集中在开发新的抗生素,然而一旦开发出新的抗生素,它们将同样面临耐药性问题。本发明提供了克服这些困难的新颖的基于crispr的替代物。此外,与现有抗生素不同,基于crispr的治疗可使病原体具有特异性,从而在避免有益细菌的情况下诱导目标病原体的细菌细胞死亡。
[1010]
jiang等人(“rna

guided editing of bacterial genomes using crispr

cas systems,”nature biotechnology第31卷,第233

9页,2013年3月)使用crispr

cas9系统来突变或杀死肺炎链球菌和大肠杆菌。这项工作将精确的突变引入基因组,它依赖于在靶向基因组位点上的双重rna:cas9定向切割来杀死未突变的细胞,从而避免了对可选择标志物
或反选择系统的需求。所述系统已用于逆转抗生素耐药性并消除菌株之间的耐药性转移。bickard等人表明,cas9经过重新编程以靶向毒力基因,杀死有毒但无毒力的金黄色葡萄球菌。重新编程核酸酶以靶向抗生素抗性基因,破坏了带有抗生素抗性基因的葡萄球菌质粒,并针对质粒携带的抗性基因的传播进行免疫。(参见bikard等人,“exploiting crispr

cas nucleases to produce sequence

specific antimicrobials,”nature biotechnology第32卷,1146

1150,doi:10.1038/nbt.3043,在线出版于2014年10月05日)。bikard显示crispr

cas9抗菌剂在体内用于杀死小鼠皮肤定植模型中的金黄色葡萄球菌。类似地,yosef等人使用crispr系统来靶向编码赋予对β

内酰胺抗生素具有抗性的酶的基因(参见yousef等人,“temperate and lytic bacteriophages programmed to sensitize and kill antibiotic

resistant bacteria,”proc.natl.acad.sci.usa,第112卷,第7267

7272页,doi:10.1073/pnas.1500107112,在线出版于2015年5月18日)。
[1011]
所述系统可用于编辑对其他遗传方法具有抗性的寄生虫基因组。例如,显示出crispr

cas9系统将双链断裂引入约氏疟原虫基因组中(参见zhang等人,“efficient editing of malaria parasite genome using the crispr/cas9system,”mbio.第5卷,e01414

14,2014年7

8月)。ghorbal等人(“genome editing in the human malaria parasite plasmodium falciparumusing the crispr

cas9 system,”nature biotechnology,第32卷,第819

821页,doi:10.1038/nbt.2925,在线出版于2014年6月1日)修饰了orc1和kelch13这两个基因的序列,其分别在基因沉默和出现青蒿素抗性方面具有推定作用。尽管没有直接选择用于修饰,但仍能以非常高的效率回收在适当位点改变的寄生虫,这表明使用这种系统可生成中性或甚至有害的突变。crispr

cas9还用于修饰其他致病性寄生虫(包括刚地弓形虫)的基因组(参见shen等人,“efficient gene disruption in diverse strains of toxoplasma gondii using crispr/cas9,”mbio第5卷:e01114

14,2014;以及sidik等人,“efficient genome engineering of toxoplasma gondii using crispr/cas9,”plos one第9卷,e100450,doi:10.1371/journal.pone.0100450,在线出版于2014年6月27日)。
[1012]
vyas等人(“a candida albicans crispr system permits genetic engineering of essential genes and gene families,”science advances,第1卷,e1500248,doi:10.1126/sciadv.1500248,2015年4月3日)使用crispr系统克服了长期存在的障碍而在白色念珠菌中进行基因工程,并在单个实验中有效地突变了若干不同基因的两个拷贝。在若干机制导致耐药性的生物体中,vyas生产了纯合的双突变体,该突变体不再展现亲本临床分离株can90所展现的对氟康唑或环己酰亚胺的高抗性。vyas还通过创建条件性等位基因而在白色念珠菌的必需基因中获得了纯合功能丧失突变。核糖体rna加工所需的dcr1无效等位基因在低温下可致死,但在高温下可存活。vyas使用了引入无义突变的修复模板并分离了无法在16℃下生长的dcr1/dcr1突变体。
[1013]
在遗传或表观遗传学方面治疗疾病
[1014]
本发明的系统可用于校正先前尝试使用talen和zfn但成功率有限的遗传突变,并且已被鉴定为cas9系统的潜在靶标,包括如editas medicine的公开申请中,所述公开申请描述了使用cas9系统来靶向基因座以用基因疗法治疗性地处理疾病的方法,包括gluckmann等人的wo 2015/048577 crispr

related methods and compositions;
gluckmann等人的wo 2015/070083 crispr

related methods and compositions with governing grnas。在一些实施方案中,提供了原发性开角型青光眼(poag)的治疗、预防或诊断。靶标优选是myoc基因。这在wo2015153780中描述,其公开内容通过引用并入本文。
[1015]
提及maeder等人的wo2015/134812 crispr/cas

related methods and compositions for treating usher syndrome and retinitis pigmentosa。通过本文的教导,本发明包括结合本文的教导应用的这些文件的方法和材料。在眼部和听觉基因疗法的一个方面,用于治疗usher综合征和色素性视网膜炎的方法和组合物可适于本发明的系统(参见例如wo 2015/134812)。在一个实施方案中,wo 2015/134812涉及通过基因编辑,例如使用crispr

cas9介导的方法来校正ush2a基因第2299位的鸟嘌呤缺失(例如,替换ush2a基因第2299位的缺失的鸟嘌呤残基),来治疗或延迟iia型usher综合征(ush2a、ush11a)和色素性视网膜炎39(rp39)的发作或进展。v型效应子可达到类似的效果。在一个相关方面,通过用一种或多种核酸酶、一种或多种切口酶或它们的组合切割来靶向突变,例如以用校正点突变(例如单核苷酸例如鸟嘌呤缺失)的供体模板来诱导hdr。突变ush2a基因的改变或校正可通过任何机制来介导。可与突变型hsh2a基因的改变(例如校正)相关的示例性机制包括但不限于非同源末端连接,微同源性介导的末端连接(mmej),同源性引导的修复(例如内源性供体模板介导的),sdsa(合成依赖性链退火),单链退火或单链入侵。在一个实施方案中,用于治疗usher综合征和色素性视网膜炎的方法可包括例如通过对ush2a基因的适当部分进行测序来获得受试者所携带的突变的知识。
[1016]
因此,在一些实施方案中,提供了色素性视网膜炎的治疗、预防或诊断。已知许多不同的基因与色素性视网膜炎相关或导致色素性视网膜炎,例如rp1、rp2等。在一些实施方案中,这些基因被靶向并且通过提供合适的模板被敲除或修复。在一些实施方案中,通过注射递送至眼睛。
[1017]
在一些实施方案中,一种或多种色素性视网膜炎基因可选自:rp1(色素性视网膜炎

1),rp2(色素性视网膜炎

2),rpgr(色素性视网膜炎

3),prph2(色素性视网膜炎

7),rp9(色素性视网膜炎

9),impdh1(色素性视网膜炎

10),prpf31(色素性视网膜炎

11),crb1(色素性视网膜炎

12,常染色体隐性),prpf8(色素性视网膜炎

13),tulp1(色素性视网膜炎

14),ca4(色素性视网膜炎

17),hprpf3(色素性视网膜炎

18),abca4(色素性视网膜炎

19),eys(色素性视网膜炎

25),cerkl(色素性视网膜炎

26),fscn2(色素性视网膜炎

30),topors(色素性视网膜炎

31),snrnp200(色素性视网膜炎33),sema4a(色素性视网膜炎

35),prcd(色素性视网膜炎

36),nr2e3(色素性视网膜炎

37),mertk(色素性视网膜炎

38),ush2a(色素性视网膜炎

39),prom1(色素性视网膜炎

41),klhl7(色素性视网膜炎

42),cngb1(色素性视网膜炎

45),best1(色素性视网膜炎

50),ttc8(色素性视网膜炎51),c2orf71(色素性视网膜炎54),arl6(色素性视网膜炎55),znf513(色素性视网膜炎58),dhdds(色素性视网膜炎59),best1(色素性视网膜炎,同轴),prph2(色素性视网膜炎,双基因型),lrat(色素性视网膜炎,青少年),spata7(色素性视网膜炎,青少年,常染色体隐性),crx(色素性视网膜炎,晚发性显性)和/或rpgr(色素性视网膜炎,x连锁,和鼻呼吸道感染,有或没有耳聋)。
[1018]
在一些实施方案中,色素性视网膜炎基因是mertk(色素性视网膜炎

38)或ush2a(色素性视网膜炎

39)。
[1019]
还提及了wo 2015/138510,并且通过本文的教导,本发明(使用crispr

cas9系统)包括提供治疗或延迟莱伯先天性黑蒙10(lca 10)的发作或进展。lca 10是由cep290基因的突变(例如,cep290基因中的c.2991 1655腺嘌呤至鸟嘌呤突变)引起的,其在内含子26中产生一个隐含的剪接位点。这是cep290的内含子26的核苷酸1655处的突变,例如a至g突变。cep290也称为:ct87;mks4;poc3;rd16;bbs14;jbts5;lcajo;nphp6;slsn6;和3h11ag(参见例如wo 2015/138510)。在基因疗法的一个方面,本发明涉及在cep290基因的至少一个等位基因中在lca靶位置的位点附近(例如,c.2991 1655;a至g)引入一个或多个断裂。改变lca10靶位置是指(1)接近或包括lca10靶位置(例如,c.2991 1655a至g)的断裂诱导的插入/缺失的引入(在本文中也称为nhej介导的插入/缺失的引入),或(2)断裂诱导的基因组序列的缺失(在本文中也称为nhej介导的缺失),包括lca10靶位置的突变(例如c.2991 1655a至g)。两种方法都导致了由于lca 10靶位置处的突变而导致的隐蔽剪接位点的丢失或破坏。因此,特别设想了在lca的治疗中使用v型crispr系统。
[1020]
研究人员正在考虑是否可将基因疗法用于治疗多种疾病。设想基于v型效应蛋白的本发明系统用于这样的治疗用途,包括但不限于进一步示例性的靶向区域和利用如下的递送方法。可使用本系统有效治疗的疾患或疾病的一些实例包括在本文包括的基因和参考文献的实例中,并且在此还提供了目前还与这些疾患相关联者。示例性的基因和疾患并不详尽。
[1021]
治疗循环系统疾病
[1022]
本发明还预期将所述系统,特别是本文所述的新型crispr效应蛋白系统,递送至血液或造血干细胞。wahlgren等人(nucleic acids research,2012,第40卷,第17期e130)的血浆外泌体先前已经描述并且可用于将所述系统递送至血液。还考虑本发明的核酸靶向系统来治疗血红蛋白病,例如地中海贫血和镰状细胞病。关于可被本发明的crispr cas系统靶向的潜在靶标,参见例如国际专利公开第wo 2013/126794号。
[1023]
通过引用并入本文的drakopoulou,“review article,the ongoi ng challenge of hematopoietic stem cell

based gene therapy for β

thalassemia,”stem cells international,第2011卷,文章id 987980,10页,doi:10.4061/2011/987980以及其引用的文件(如同全文列出一样),讨论了使用慢病毒修饰hsc的方法,所述慢病毒递送β

珠蛋白或γ

珠蛋白的基因。与使用慢病毒相反,利用本领域的知识和本公开的教导,技术人员可使用靶向和校正突变的系统针对β

地中海贫血校正hsc(例如,利用合适的hdr模板,其递送β

珠蛋白或γ

珠蛋白的编码序列,有利地为非镰刀β

珠蛋白或γ

珠蛋白的编码序列);具体来说,指导rna可靶向引起β

地中海贫血的突变,并且hdr可为β

珠蛋白或γ

珠蛋白的适当表达提供编码。使靶向包含突变和cas蛋白的粒子的指导rna与携带突变的hsc接触。所述粒子还可包含合适的hdr模板,以校正突变以适当表达β

珠蛋白或γ

珠蛋白;或者可使hsc与包含或递送hdr模板的第二粒子或载体接触。如此接触的细胞可被施用;以及任选地处理/扩增;参考cartier。在这方面,提及:cavazzana,“outcomes of gene therapy forβ

thalassemia major via transplantation of autologous hematopoietic stem cells transduced ex vivo with a lentiviralβa

t87q

globin vector.”tif2014.org/abstractfiles/jean%20antoine%20ribeil_abstract.pdf;cavazzana

calvo,“transfusion independence and hmga2 activation after gene therapy of humanβ

thalassaemia”,nature 467,318

322(2010年9月16日)doi:10.1038/nature09328;nienhuis,“development of gene therapy for thalassemia,cold spring harbor perpsectives in medicine,doi:10.1101/cshperspect.a011833(2012),lentiglobin bb305,a lentiviral vector containing an engineeredβ

globin gene(βa

t87q);以及xie等人,“seamless gene correction ofβ

thalassaemia mutations in patient

specific ipscs using crispr/cas9and piggyback”genome research gr.173427.114(2014)www.genome.org/cgi/doi/10.1101/gr.173427.114(cold spring harbor laboratory press);这是涉及人类β

地中海贫血的cavazzana研究的主题和xie研究的主题,所述文献都通过引用并入本文,以及其中引用或与其相关的所有文献。在本发明中,hdr模板可提供hsc以表达工程化的β

珠蛋白基因(例如,βa

t87q)或如xie中的β

珠蛋白。
[1024]
xu等人(sci rep.2015年7月9日;5:12065.doi:10.1038/srep12065)设计了talen和crispr

cas9来直接靶向珠蛋白基因中的内含子2突变位点ivs2

654。xu等人使用talen和crispr

cas9在ivs2

654基因组处观察到了不同频率的双链断裂(dsb),并且当与piggybac转座子供体组合时,talen介导了与crispr

cas9相比更高的同源基因靶向效率。另外,与talen相比,crispr

cas9观察到更明显的脱靶事件。最后,使用op9共培养系统选择经talen校正的ipsc克隆用于成红细胞分化,并且检测到的hbb转录相对高于未校正的细胞。
[1025]
song等人(stem cells dev.2015年5月1日;24(9):1053

65.doi:10.1089/scd.2014.0347.电子出版于2015年2月5日)使用crispr/cas9校正β

thal ipsc;经基因校正的细胞表现出正常的核型和全能性,因为人类胚胎干细胞(hesc)不显示脱靶效应。然后,song等人评价了经基因校正的β

thal ipsc的分化效率。song等人发现在造血分化期间,经基因校正的β

thal ipsc显示出胚状体比率增加和各种造血祖细胞百分比。更重要的是,与未经校正的组相比,经基因校正的β

thal ipsc品系恢复了hbb表达并减少了活性氧的产生。song等人的研究表明,一旦通过crispr

cas9系统校正,β

thal ipsc的造血分化效率就大大提高。可利用本文所述的系统,例如包含v型效应蛋白的系统,进行类似的方法。
[1026]
镰状细胞性贫血是一种常染色体隐性遗传疾病,其中红细胞变成镰刀状。它是由位于11号染色体短臂上的β

珠蛋白基因中的单个碱基取代引起的。结果,产生缬氨酸而不是谷氨酸,其引起镰刀状血红蛋白(hbs)的产生。这导致变形的红细胞形状的形成。由于这种异常形状,会阻塞小血管,从而严重损坏骨骼、脾脏和皮肤组织。这可能导致疼痛发作,频繁感染,手足综合征或甚至多器官功能衰竭。变形的红细胞也更容易溶血,导致严重的贫血。与β

地中海贫血的情况一样,镰状细胞性贫血可通过使用所述系统修饰hsc来校正。所述系统允许通过切割细胞基因组的dna并且然后使其自我修复,可对细胞的基因组进行特定的编辑。插入cas蛋白并通过rna指导物将其引导至突变点,然后在该点切割dna。同时,插入序列的健康形式。细胞自己的修复系统使用此序列来修复诱导的切割。以这种方式,crispr

cas可校正先前获得的干细胞中的突变。利用本领域的知识和本公开的教导,技术人员可使用靶向并校正突变的系统来校正关于镰状细胞性贫血的hsc(例如,使用合适的hdr模板,其递送β

珠蛋白、有利地非镰刀β

珠蛋白的编码序列);具体来说,指导rna可靶向引起镰状细胞性贫血的突变,并且hdr可为β

珠蛋白的适当表达提供编码。使靶向包含突变和cas蛋白的粒子的指导rna与携带突变的hsc接触。所述粒子还可包含合适的hdr模板,以
校正突变以适当表达β

珠蛋白;或者可使hsc与包含或递送hdr模板的第二粒子或载体接触。如此接触的细胞可被施用;以及任选地处理/扩增;参考cartier。hdr模板可提供hsc以表达工程化的β

珠蛋白基因(例如βa

t87q)或如xie中的β

珠蛋白。
[1027]
通过引用并入本文的williams,“broadening the indications for hematopoietic stem cell genetic therapies,”cell stem cell 13:263

264(2013)以及其引用的文献(如同全文列出一样)报道了慢病毒介导的基因转移至来自具有溶酶体贮积病、异染性脑白质营养不良病(mld)、由芳基硫酸酯酶a(arsa)缺乏导致神经脱髓鞘而引起的遗传性疾病的患者的hsc/p细胞中;以及慢病毒介导的基因转移至wiskott

aldrich综合征(was)患者(具有缺陷性was蛋白的患者,缺陷性was蛋白是小gtp酶cdc42的效应物,它调节血细胞谱系中的细胞骨架功能,并因此患有免疫缺陷并反复感染,自身免疫症状,和血小板减少症与血小板异常少和功能异常,导致大量出血以及白血病和淋巴瘤的风险增加)的hsc中。与使用慢病毒相反,利用本领域的知识和本公开的教导,技术人员可使用靶向并校正突变的系统来校正关于mld(芳基硫酸酯酶a(arsa)缺乏症)的hsc(芳基硫酸酯酶a(arsa)缺乏症)(例如,利用递送arsa编码序列的合适hdr模板);具体来说,指导rna可靶向引起mld(arsa缺乏)的突变,并且hdr可为arsa的适当表达提供编码。使靶向包含突变和cas蛋白的粒子的指导rna与携带突变的hsc接触。所述粒子还可包含合适的hdr模板,以校正突变以适当表达arsa;或者可使hsc与包含或递送hdr模板的第二粒子或载体接触。如此接触的细胞可被施用;以及任选地处理/扩增;参考cartier。与使用慢病毒相反,利用本领域的知识和本公开的教导,本领域技术人员可使用靶向并校正突变(was蛋白缺乏症)的系统来校正关于was的hsc(例如利用合适的hdr模板,其递送was蛋白的编码序列);具体来说,指导rna可靶向引起was(was蛋白缺乏)的突变,并且hdr可为was蛋白的适当表达提供编码。使靶向含有突变和v型蛋白的粒子的指导rna与携带突变的hsc接触。所述粒子还可包含合适的hdr模板,以校正突变以适当表达was蛋白;或者可使hsc与包含或递送hdr模板的第二粒子或载体接触。如此接触的细胞可被施用;以及任选地处理/扩增;参考cartier。
[1028]
通过引用并入本文的watts,“hematopoietic stem cell expansio n and gene therapy”cytotherapy 13(10):1164

1171.doi:10.3109/14 653249.2011.620748(2011)以及其引用的文献(如同全文列出一样)讨论了造血干细胞(hsc)基因疗法,例如病毒介导的hsc基因疗法,作为许多病症的非常有吸引力的治疗选择,所述病症包括血液疾患,免疫缺陷病(包括hiv/aids),以及其他遗传病症如溶酶体贮积病,包括scid

x1、ada

scid、β

地中海贫血,x连锁cgd、wiskott

al drich综合征、范可尼贫血(fanconi anemia)、肾上腺脑白质营养不良(a ld)和异染性脑白质营养不良(mld)。
[1029]
转让给cellectis的美国专利公开第20110225664号、第20110091441号、第20100229252号、第20090271881号和第20090222937号涉及crei变体,其中两个i

crei单体中的至少一者具有至少两个取代,laglidadg(seq id no:929)核心结构域的两个功能性子结构域中的每个分别位于i

crei的位置26至40和44至77,所述变体还能够从人白细胞介素2受体γ链(il2rg)基因(还称为共同的细胞因子受体γ链基因或γc基因)切割dna靶序列。美国专利公开第20110225664号、第20110091441号、第20100229252号、第20090271881号和第20090222937号中鉴定的靶序列可用于本发明的核酸靶向系统。
[1030]
严重的免疫缺陷综合征(scid)是由淋巴细胞t成熟缺陷引起的,所述缺陷总是与
淋巴细胞b的功能缺陷相关联(cavazzana

calvo等人,annu.rev.med.,2005,56,585

602;fischer等人,immunol.rev.,2005,203,98

109)。总体发病率估计为75,000例新生儿中有1例。未治疗scid的患者会遭受多种机会性微生物感染,并且一般不会存活超过一年。可通过来自家族供体的同种异体造血干细胞转移来治疗scid。与供体的组织相容性差异很大。在scid形式之一的腺苷脱氨酶(ada)缺乏的情况下,可通过注射重组腺苷脱氨酶来治疗患者。
[1031]
由于已证明ada基因在scid患者中发生了突变(giblett等人,lancet,1972,2,1067

1069),因此已鉴定出scid中涉及的若干其他基因(cavazzana

calvo等人,annu.rev.med.,2005,56,585

602;fischer等人,immunol.rev.,2005,203,98

109)。scid的主要原因有四个:(i)scid的最常见形式scid

x1(x连锁的scid或x

scid)是由il2rg基因的突变引起的,导致不存在成熟的t淋巴细胞和nk细胞。il2rg编码γc蛋白(noguchi等人,cell,1993,73,147

157),其是至少五种白细胞介素受体复合物的共同组分。这些受体通过jak3激酶激活若干靶标(macchi等人,nature,1995,377,65

68),这种失活导致与γc失活相同的综合征;(ii)ada基因的突变导致嘌呤代谢缺陷,其对淋巴细胞前体致死,进而导致b、t和nk细胞几乎不存在;(iii)v(d)j重组是免疫球蛋白和t淋巴细胞受体(tcr)成熟中必不可少的步骤。重组激活基因1和2(rag1和rag2)和artemis(参与此过程的三个基因)中的突变导致不存在成熟的t和b淋巴细胞;以及(iv)还已报道了参与t细胞特异性信号传导的其他基因(例如cd45)的突变,尽管它们代表了少数病例(cavazzana

calvo等人,annu.rev.med.,2005,56,585

602;fischer等人,immunol.rev.,2005,203,98

109)。自从鉴定了它们的遗传基础以来,由于两个主要原因,不同的scid形式已成为基因治疗方法的范例(fischer等人,immunol.rev.,2005,203,98

109)。首先,与所有血液疾病一样,可设想离体治疗。造血干细胞(hsc)可从骨髓中回收,并保持其多能性以进行几次细胞分裂。因此,它们可在体外进行治疗,然后重新注射到患者体内,在其中使骨髓增殖。其次,由于scid患者的淋巴细胞成熟受到损害,因此经校正的细胞具有选择优势。因此,少量的校正细胞可恢复功能性免疫系统。通过以下多次验证了这个假说:(i)与scid患者突变回复相关的免疫功能的部分恢复(hirschhorn等人,nat.genet.,1996,13,290

295;stephan等人,n.engl.j.med.,1996,335,1563

1567;bousso等人,proc.natl.,acad.sci.usa,2000,97,274

278;wada等人,proc.natl.acad.sci.usa,2001,98,8697

8702;nishikomori等人,blood,2004,103,4565

4572);(ii)体外校正造血细胞中的scid

x1缺乏(candotti等人,blood,1996,87,3097

3102;cavazzana

calvo等人,blood,1996,blood,88,3901

3909;taylor等人,blood,1996,87,3103

3107;hacein

bey等人,blood,1998,92,4090

4097);(iii)在动物模型中体内校正scid

x1(soudais等人,blood,2000,95,3071

3077;tsai等人,blood,2002,100,72

79)、jak

3(bunting等人,nat.med.,1998,4,58

64;bunting等人,hum.gene ther.,2000,11,2353

2364)和rag2(yates等人,blood,2002,100,3942

3949)缺乏;以及(iv)基因治疗临床试验的结果(cavazzana

calvo等人,science,2000,288,669

672;aiuti等人,nat.med.,2002;8,423

425;gaspar等人,lancet,2004,364,2181

2187)。
[1032]
转让给儿童医学中心公司(children's medical center corporation)和哈佛学院院长和同事的美国专利公开第20110182867号涉及经由bcl11a表达或活性抑制剂(例如rnai和抗体)调节造血祖细胞中胎儿血红蛋白表达(hbf)的方法和用途。美国专利公开第20110182867号中公开的靶标,例如bcl11a,可被本发明的crispr cas系统靶向以调节胎儿
血红蛋白表达。关于额外的bcl11a靶标,还参见bauer等人(science,2013年10月11日:第342卷第6155期,第253

257页)和xu等人(science,2011年11月18日:第334卷第6058期,第993

996页)。
[1033]
利用本领域的知识和本公开的教导,技术人员可校正关于遗传性血液病症例如β

地中海贫血、血友病或遗传溶酶体贮积病的hsc。
[1034]
hsc—造血干细胞的递送和编辑;和特定条件。
[1035]
术语“造血干细胞”或“hsc”意在广泛地包括被认为是hsc的那些细胞,例如血细胞,其产生所有其他血细胞并源自中胚层;位于包含在大多数骨骼核心中的红色骨髓中。本发明的hsc包括具有造血干细胞表型的细胞,可通过小尺寸鉴定,缺乏谱系(lin)标志物,以及属于分化系列簇的标志物,如:cd34、cd38、cd90、cd133、cd105、cd45以及c

kit(干细胞因子的受体)。造血干细胞对于用于检测谱系定型的标志物呈阴性,因此被称为lin

;并且在通过facs纯化期间,有多达14种不同的成熟血液谱系标志物,例如,对于人类,髓细胞的cd13和cd33,红系细胞的cd71,b细胞的cd19,巨核细胞的cd61等;以及b细胞的b220(鼠类cd45),单核细胞的mac

1(cd11b/cd18),粒细胞的gr

1,红系细胞的ter119,t细胞的il7ra、cd3、cd4、cd5、cd8等。小鼠hsc标志物:cd34lo/

、sca

1 、thy1.1 /lo、cd38 、c

kit 、lin

,和人类hsc标志物:cd34 、cd59 、thy1/cd90 、cd38lo/

、c

kit/cd117 和lin

。hsc通过标志物鉴定。因此,在本文讨论的实施方案中,hsc可以是cd34 细胞。hsc也可以是cd34

/cd38

的造血干细胞。在本领域中被视为hsc的细胞表面上可能缺乏c

kit的干细胞在本发明的范围内,以及在本领域中同样被视为hsc的cd133 细胞。
[1036]
可将所述系统工程化为靶向hsc中的一个或多个遗传基因座。可制备有利地对真核细胞并且尤其是哺乳动物细胞(例如人类细胞,例如hsc)进行密码子优化的cas蛋白,以及靶向hsc中的一个或多个基因座的sgrna(例如基因emx1)。这些可经由粒子递送。所述粒子可由cas蛋白和grna混合形成。可例如将grna和cas蛋白混合物与如下混合物混合,所述混合物包含以下或基本上由以下组成或由以下组成:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇,由此可形成包含grna和cas蛋白的粒子。本发明包括如此制备粒子和由这种方法制备的粒子以及其用途。
[1037]
更一般来说,可使用有效的方法来形成粒子。首先,靶向基因emx1或对照基因lacz的cas v型效应蛋白和grna可以合适的(例如3:1至1:3或2:1至1:2或1:1)摩尔比混合在一起,有利地在无菌的无核酸酶的缓冲液(例如1x pbs)中,在合适的温度(例如15

30℃,例如20

25℃,例如室温)下进行合适的时间(例如15

45,例如30分钟)。单独地,粒子组分例如为或包含:表面活性剂,例如阳离子脂质,例如1,2

二油酰基
‑3‑
三甲基铵

丙烷(dotap);磷脂,例如二肉豆蔻酰基磷脂酰胆碱(dmpc);可生物降解的聚合物,例如乙二醇聚合物或peg,以及脂蛋白,例如低密度脂蛋白,例如胆固醇,可溶于醇,有利地c1

6烷基醇,例如甲醇、乙醇、异丙醇,例如100%乙醇。可将两种溶液混合在一起以形成含有cas v型效应子

grna复合物的粒子。在某些实施方案中,粒子可包含hdr模板。这可以是与含grna cas蛋白的粒子共同施用的粒子,或者,即,除了使hsc与含grna cas蛋白的粒子接触之外,hsc还可与包含hdr模板的粒子接触;或者将hsc与包含所有grna、cas和hdr模板的粒子接触。hdr模板可通过单独的载体施用,由此在第一种情况下,粒子穿透hsc细胞并且单独的载体也穿透细胞,其中hsc基因组被grna cas修饰并且还存在hdr模板,从而通过hdr修饰基因组基因座;例
如,这可能导致校正突变。
[1038]
粒子形成后,可用每孔15ug v型效应蛋白转染96孔板中的hsc。转染后三天,可收获hsc,并且可量化emx1基因座处的插入和缺失(indel)的数量。
[1039]
这说明了可如何使用靶向hsc中一个或多个目标基因组基因座的系统来修饰hsc。待修饰的hsc可在体内,即在生物体中,例如在人类或非人类真核生物,例如动物,例如鱼,例如斑马鱼,哺乳动物,例如灵长类动物,例如猿、黑猩猩、猕猴,啮齿动物,例如小鼠、兔子、大鼠、犬或狗,牲畜(牛/牛科、绵羊/羊科、山羊或猪),禽类或家禽,例如鸡。待修饰的hsc可在体外,即在这种生物体外。并且,修饰的hsc可离体使用,即,可从生物体中获得或分离出这种生物体的一种或多种hsc,任选地,可扩增hsc,通过包含靶向hsc中的一个或多个遗传基因座的crispr

cas的组合物来修饰hsc,例如通过使hsc与所述组合物接触,例如,其中所述组合物包含含有crispr酶和一种或多种grna的粒子,所述grna靶向hsc中的一个或多个遗传基因座,例如通过将grna和cas蛋白混合物与如下混合物混合而获得或可获得的粒子,所述混合物包含以下或基本上由以下组成或由以下组成:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇(其中一个或多个grna靶向hsc中的一个或多个遗传基因座),任选地扩增所得修饰的hsc并向生物体施用所得修饰的hsc。在一些情况下,分离或获得的hsc可来自第一生物体,例如来自与第二生物体相同物种的生物体,并且第二生物体可以是对其施用所得修饰的hsc的生物体,例如第一生物体可以是第二生物体的供体(例如像父母或同胞一样的亲属)。修饰的hsc可具有遗传修饰以解决或减轻或减少个体或受试者或患者的疾病或疾患状况的症状。修饰的hsc,例如在第二生物体的第一生物体供体的情况下,可具有遗传修饰以使hsc具有一种或多种蛋白质,例如更像第二生物体的表面标志物或蛋白质。修饰的hsc可具有遗传修饰以模拟个体或受试者或患者的疾病或疾患状况,并且将其重新施用于非人类生物体以制备动物模型。根据本公开内容和本领域的知识,hsc的扩增在技术人员的能力范围内,参见例如lee,“improved ex vivo expansion of adult hematopoietic stem cells by overcoming cul4

mediated degradation of hoxb4.”blood.2013年5月16日;121(20):4082

9.doi:10.1182/blood

2012

09

455204.电子出版于2013年3月21日。
[1040]
如所指示,为提高活性,在将整个复合物配制成粒子之前,可将grna与cas蛋白预先复合。可用不同摩尔比的不同组分来制备制剂,所述成分已知可促进核酸向细胞内的递送(例如1,2

二油酰基
‑3‑
三甲基铵

丙烷(dotap),1,2

双十四烷酰基

sn

甘油
‑3‑
磷酸胆碱(dmpc),聚乙二醇(peg)和胆固醇)。例如,dotap:dmpc:peg:胆固醇摩尔比可为dotap 100、dmpc 0、peg 0、胆固醇0;或dotap 90、dmpc 0、peg 10、胆固醇0;或dotap 90、dmpc 0、peg 5、胆固醇5;dotap 100、dmpc 0、peg 0、胆固醇0。因此,本发明包括将grna、cas蛋白和形成粒子的组分混合;以及由这种混合产生的粒子。
[1041]
在一个优选的实施方案中,可通过将cas蛋白和一种或多种grna(优选1:1摩尔比的酶:指导rna)混合在一起来形成包含cas

grna复合物的粒子。单独地,将已知促进核酸递送的不同组分(例如dotap、dmpc、peg和胆固醇)溶解,优选溶解在乙醇中。将两种溶液混合在一起以形成含有cas

grna复合物的粒子。形成粒子后,可将cas

grna复合物转染到细胞(例如hsc)中。可应用条形编码。粒子、cas

9和/或grna可被条形码化。
[1042]
在一个实施方案中,本发明包括制备含grna和cas蛋白的粒子的方法,所述方法包括将grna和cas蛋白混合物与如下混合物混合,所述混合物包含以下或基本上由以下组成
或由以下组成:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇。一个实施方案包括来自所述方法的含grna和cas蛋白的粒子。在一个实施方案中,本发明包括所述粒子在通过操纵目标基因组基因座中的靶序列来修饰目标基因组基因座或生物体或非人类生物体的方法中的用途,包括使包含目标基因组基因座的细胞与其中grna靶向目标基因组基因座的粒子接触;或者通过操纵目标基因组基因座中的靶序列来修饰目标基因组基因座或生物体或非人类生物体的方法,包括使包含目标基因组基因座的细胞与其中grna靶向目标基因组基因座的粒子接触。在这些实施方案中,目标基因组基因座有利地是hsc中的基因组基因座。
[1043]
治疗应用的考虑因素:基因组编辑疗法中的考虑因素是选择序列特异性核酸酶,例如v型核酸酶的变体。每个核酸酶变体可具有自己独特的一组优点和缺点,其中的许多优点和缺点都必须在治疗情形下加以平衡,以最大化治疗益处。迄今为止,两种使用核酸酶的治疗编辑方法已显示出重大前景:基因破坏和基因校正。基因破坏涉及nhej的刺激,以在遗传元件中产生靶向的插入/缺失,通常会导致对患者有益的功能丧失突变。相反,基因校正使用hdr来直接逆转引起突变的疾病,恢复功能,同时保留所校正元件的生理调控。hdr还可用于将治疗性转基因插入基因组中定义的“安全港”基因座,以恢复缺失的基因功能。为了使特定的编辑疗法有效,必须在靶细胞群体中实现足够高水平的修饰以逆转疾病症状。这种治疗修饰“阈值”取决于处理后编辑细胞的适应性以及逆转症状所需的基因产物量。关于适应性,相对于未编辑的对应物,编辑对于经处理的细胞产生三个潜在结果:适应性增加、中性或降低。在增加适应性的情况下,例如在scid

x1的治疗中,修饰的造血祖细胞相对于其未编辑的对应物选择性地扩增。scid

x1是由il2rg基因突变引起的疾病,il2rg基因的功能是造血淋巴细胞谱系正常发育所必需的[leonard,w.j.等人,immunological reviews 138,61

86(1994);kaushansky,k.和williams,w.j.williams hematology,(mcgraw

hill medical,new york,2010)]。在接受scid

x1病毒基因治疗的患者的临床试验以及scid

x1突变的自发校正的罕见实例中,经校正的造血祖细胞可能能够克服这种发育障碍并相对于其患病的对应物扩增以介导治疗[bousso,p.等人,proceedings of the national academy of sciences of the united states of america 97,274

278(2000);hacein

bey

abina,s.等人,the new england journal of medicine 346,1185

1193(2002);gaspar,h.b.等人,lancet 364,2181

2187(2004)]。在这种情况下,在经编辑的细胞具有选择优势时,甚至可通过扩增来扩增少量的经编辑细胞,从而为患者提供治疗益处。相比之下,编辑其他造血疾病,如慢性肉芽肿性病症(cgd),将不会诱导经编辑的造血祖细胞的适应性发生变化,从而增加了治疗修饰的阈值。cgd是由编码吞噬细胞氧化酶蛋白的基因的突变引起的,嗜中性粒细胞通常使用所述基因突变来生成可杀死病原体的活性氧[mukherjee,s.&thrasher,a.j.gene 525,174

181(2013)]。由于这些基因的功能障碍不影响造血祖细胞的适应性或发育,而仅影响成熟的造血细胞类型抵抗感染的能力,因此在这种疾病中可能不会优先扩增经编辑细胞。实际上,在基因治疗试验中未观察到cgd中基因校正细胞的选择性优势,导致长期细胞植入困难[malech,h.l.等人,proceedings of the national academy of sciences of the united states of america 94,12133

12138(1997);kang,h.j.等人,molecular therapy:the journal of the american society of gene therapy 19,2092

2101(2011)]。因而,相对于其中编辑会产生对靶细胞的适应性增加的疾病,需要显著更高水平的编辑来治疗疾病像cgd,其中编辑产生中性的适应性优势。
如果编辑在适应性方面不利,如恢复癌细胞中肿瘤抑制基因功能的情况,则修饰的细胞将在与其患病的对应物的竞争中胜出,从而导致治疗益处相对于编辑率低。后一类疾病将特别难以用基因组编辑疗法治疗。
[1044]
除细胞适应性外,治疗疾病所需的基因产物量还影响为逆转症状所必须实现的治疗性基因组编辑的最低水平。乙型血友病是一种疾病,其中基因产物水平的微小变化可导致临床结果的重大变化。这种疾病是由编码因子ix的基因突变引起的,该因子是通常由肝脏分泌到血液中的一种蛋白质,在血液中它用作凝血级联的组成部分。乙型血友病的临床严重程度与因子ix活性的量有关。严重的疾病与正常活性的不足1%相关,而较轻形式的疾病与因子ix活性超过1%相关[kaushansky,k.和williams,w.j.williams hematology,(mcgraw

hill medical,new york,2010);lofqvist,t.等人,journal of internal medicine 241,395

400(1997)]。这表明可将因子ix表达恢复到肝细胞的甚至很小百分比的编辑疗法对临床结果可能会有很大影响。一项使用zfn校正出生后不久的乙型血友病小鼠模型的研究表明,3

7%的校正足以逆转疾病症状,为该假说提供了临床前证据[li,h.等人,nature 475,217

221(2011)]。
[1045]
其中基因产物水平的微小变化可影响临床结果的病症以及其中经编辑的细胞具有适应性优势的疾病,是基因组编辑疗法的理想靶标,因为治疗修饰的阈值足够低,在当前技术下有很大的成功机会。现在,利用编辑疗法靶向这些疾病已在临床前水平和i期临床试验中获得成功。需要将dsb修复途径操纵和核酸酶递送方面的改进,以将这些有希望的结果扩展到对经编辑细胞具有中性适应性优势的疾病,或者其中需要大量基因产物以进行治疗。下表6显示了基因组编辑对治疗模型的应用的一些实例,并且下表的参考文献和那些参考文献中引用的文献据此通过引用并入本文,如同全文列出一样。
[1046]
表6
[1047][1048]
根据本公开和本领域的知识,处理上述表格中的每个条件,使用所述系统通过hdr介导的突变校正或hdr介导的适当基因序列插入进行靶向,有利地经由如本文所述的递送系统(例如粒子递送系统)进行,在本领域技术人员的能力范围内。因此,一个实施方案包括将携带乙型血友病、scid(例如scid

x1、ada

scid)或遗传性酪氨酸血症突变的hsc与靶向关于乙型血友病、scid(例如scid

x1、ada

scid)或遗传性酪氨酸血症(例如,在li、genovese或yin中)的目标基因组基因座的含有grna和cas蛋白的粒子接触。所述粒子还可包含合适的hdr模板以校正突变;或者可使hsc与包含或递送hdr模板的第二粒子或载体接触。在这方面,提到乙型血友病是一种x连锁的隐性病症,其由编码因子ix(凝血级联的重要组成部分)的基因中的功能丧失突变引起。在受到严重影响的个体中,将因子ix的活性恢复
至其水平的1%以上可将疾病转化为明显更温和的形式,因为从年轻时就预防性地向此类患者输注重组因子ix以达到这种水平可大大改善临床并发症。利用本领域的知识和本公开的教导,技术人员可使用系统来校正关于乙型血友病的hsc,所述系统靶向并校正突变(x连锁隐性病症,由编码因子ix的基因中的功能丧失突变引起)(例如,利用递送因子ix编码序列的合适的hdr模板);具体来说,grna可靶向引起乙型血友病的突变,并且hdr可为因子ix的适当表达提供编码。使靶向含有突变和cas蛋白的粒子的grna与携带突变的hsc接触。所述粒子还可包含合适的hdr模板,以校正突变以适当表达因子ix;或者可使hsc与包含或递送hdr模板的第二粒子或载体接触。如此接触的细胞可被施用;以及任选地处理/扩增;参考cartier,在此讨论。
[1049]
在通过引用并入本文的cartier,“mini

symposium:x

linked adrenoleukodystrophypa,hematopoietic stem cell transplantation and hematopoietic stem cell gene therapy in x

linked adrenoleukodystrophy,”brain pathology 20(2010)857

862以及其引用的文献(如同全文列出一样)中,已经认识到,利用同种异体造血干细胞移植(hsct)将正常的溶酶体酶递送至hurler病患者的大脑,并对hsc基因疗法治疗ald进行了讨论。在两名患者中,在粒细胞集落刺激因子(g

csf)动员后收集外周cd34 细胞,并用骨髓增生性肉瘤病毒增强子、缺失的阴性对照区、dl587rev引物结合位点取代(mnd)

ald慢病毒载体转导。在低浓度细胞因子存在的情况下,在16小时期间用mnd

ald载体转导来自患者的cd34 细胞。转导后,将转导的cd34 细胞冷冻,以对5%的细胞进行各种安全性测试,其中包括特别是三种具有复制能力的慢病毒(rcl)测定。cd34 细胞的转导效率范围为35%至50%,慢病毒整合拷贝的平均数在0.65至0.70之间。在转导的cd34 细胞解冻后,用白消安和环磷酰胺进行完全的骨髓消融后,将患者重新输注超过4.106个转导的cd34 细胞/千克。将患者的hsc消融以有利于基因校正的hsc的植入。两名患者在第13至15天之间出现血液学恢复。第一位患者在12个月时并且第二位患者在9个月时,出现几乎完全的免疫学恢复。与使用慢病毒相反,利用本领域的知识和本公开的教导,技术人员可使用靶向并校正突变的crispr

cas(v型)系统(例如,使用合适的hdr模板)校正关于ald的hsc;具体来说,grna可靶向abcd1中的突变,abcd1是位于x染色体上的编码ald的基因,过氧化物酶体膜转运蛋白,并且hdr可为所述蛋白的适当表达提供编码。使靶向含有突变和cas(v型)蛋白的粒子的grna与hsc(例如,携带突变的cd34 细胞,如在cartier中)接触。所述粒子还可含有合适的hdr模板,以校正过氧化物酶体膜转运蛋白表达的突变;或者使hsc与包含或递送hdr模板的第二粒子或载体接触。如此接触的细胞任选地可如cartier中进行处理。如此接触的细胞可如cartier中进行施用。
[1050]
提及wo 2015/148860,通过本文的教导,本发明包括结合本文的教导应用的这些文献的方法和材料。在血液相关疾病基因疗法的一个方面,用于治疗β地中海贫血的方法和组合物可适于本发明的crispr

cas系统(参见例如wo 2015/148860)。在一个实施方案中,wo 2015/148860涉及例如通过改变b细胞cll/淋巴瘤11a(bcl11a)的基因来治疗或预防β地中海贫血或其症状。bcl11a基因也称为b细胞cll/淋巴瘤11a、bcl11a

l、bcl11a

s、bcl11axl、ctip1、hbfqtl5和znf。bcl11a编码参与调控珠蛋白基因表达的锌指蛋白。通过改变bcl11a基因(例如,bcl11a基因的一个或两个等位基因),可增加γ珠蛋白的水平。γ珠蛋白可代替血红蛋白复合物中的β珠蛋白,并有效地将氧气运载至组织,从而改善β地中海贫
血疾病的表型。
[1051]
还提及wo 2015/148863,并且通过本文的教导,本发明包括可适于本发明的crispr

cas系统的这些文献的方法和材料。在治疗和预防作为一种遗传性血液疾病的镰状细胞疾病的一个方面,wo 2015/148863包括改变bcl11a基因。通过改变bcl11a基因(例如,bcl11a基因的一个或两个等位基因),可增加γ珠蛋白的水平。γ珠蛋白可代替血红蛋白复合物中的β珠蛋白,并有效地将氧气运载至组织,从而改善镰状细胞疾病的表型。可类似修饰的其他靶标是myb和klf1。
[1052]
在本发明的一个方面,通过适应本发明的crispr

cas系统来包括涉及编辑靶核酸序列或调节靶核酸序列表达的方法和组合物及其在癌症免疫疗法中的应用。参考wo 2015/161276中的基因疗法的应用,其涉及可用于通过改变一种或多种t细胞表达的基因(例如,一种或多种fas、bid、ctla4、pdcd1、cblb、ptpn6、trac和/或trbc基因)来影响t细胞增殖、存活和/或功能的方法和组合物。在一个相关方面,可通过改变一个或多个t细胞表达的基因,例如cblb和/或ptpn6基因、fas和/或bid基因、ctla4和/或pdcdi和/或trac和/或trbc基因,来影响t细胞增殖。
[1053]
嵌合抗原受体(car)19 t细胞在患者的恶性疾病中表现出抗白血病作用。但是,白血病患者通常没有足够的t细胞可收集,这意味着治疗必须涉及来自供体的修饰t细胞。因此,存在建立供体t细胞库的兴趣。qasim等人(“first clinical application of talen engineered universal car19 t cells in b

all”ash 57th annual meeting and exposition,2015年12月5

8日,abstract 2046(ash.confex.com/ash/2015/webprogram/paper81653.html,在线出版于2015年11月)讨论了通过破坏t细胞受体表达和cd52靶向来修饰car19 t细胞以消除移植物抗宿主病的风险。此外,靶向cd52细胞使其对阿仑单抗(alemtuzumab)不敏感,因此允许阿仑单抗防止宿主介导的人白细胞抗原(hla)错配的car19 t细胞排斥。研究人员使用了第三代自灭活慢病毒载体,该载体编码与rqr8连接的4g7 car19(cd19 scfv
‑4‑
1bb

cd3ζ),然后将具有两对talen mrna用于多重靶向t细胞受体(tcr)α恒定链基因座和cd52基因基因座的细胞电穿孔。在离体扩增后仍表达tcr的细胞使用clinimacsα/βtcr耗尽来耗尽,产生t细胞产物(ucart19),tcr表达<1%,其中85%表达car19,并且64%变成cd52阴性。施用修饰的car19 t细胞以治疗患者的复发性急性淋巴细胞白血病。本文提供的教导提供了用于提供经修饰的造血干细胞和它们的后代的有效方法,所述造血干细胞和它们的后代包括但不限于血液的髓系和淋巴系的细胞,包括t细胞、b细胞、单核细胞、巨噬细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、红细胞、树突状细胞、和巨核细胞或血小板,以及自然杀伤细胞及其前体和祖细胞。可通过敲除、敲入或以其他方式调节靶标来修饰此类细胞,例如以如上所述除去或调节cd52以及其他靶标,例如但不限于cxcr4和pd

1。因此,本发明的组合物、细胞和方法可结合向患者施用t细胞或其他细胞的修饰而用于调节免疫应答并治疗但不限于恶性疾病、病毒感染和免疫病症。
[1054]
提及了wo 2015/148670,并且通过本文的教导,本发明包括结合本文的教导应用的该文献的方法和材料。在基因疗法的一个方面,包括了用于编辑与人类免疫缺陷病毒(hiv)和获得性免疫缺陷综合征(aids)有关或相关的靶序列的方法和组合物。在一个相关方面,本文所述的发明包括通过在5型c

c趋化因子受体(ccr5)的基因中引入一个或多个突变来预防和治疗hiv感染和aids。ccr5基因也称为ckr5、ccr

5、cd195、ckr

5、ccckr5、
cmkbr5、iddm22和cc

ckr

5。在另一方面,本文所述的发明包括预防或减少hiv感染和/或预防或降低hiv进入宿主细胞的能力,例如在已经感染的受试者中。hiv的示例性宿主细胞包括但不限于cd4细胞、t细胞、肠相关淋巴组织(galt)、巨噬细胞、树突状细胞、髓样前体细胞和小胶质细胞。病毒进入宿主细胞需要病毒糖蛋白gp41和gp120与cd4受体和共受体例如ccr5相互作用。如果宿主细胞表面上不存在共受体例如ccr5,则病毒不能结合并进入宿主细胞。因此,疾病的进展受到阻碍。通过敲除或敲低宿主细胞中的ccr5,例如通过引入保护性突变(例如ccr5δ32突变),可防止hiv病毒进入宿主细胞。
[1055]
x连锁慢性肉芽肿性疾病(cgd)是由于吞噬细胞nadph氧化酶的活性缺乏或降低引起的宿主防御性遗传病症。使用靶向并校正突变(吞噬细胞nadph氧化酶的活性缺乏或降低)的系统(例如,使用递送吞噬细胞nadph氧化酶编码序列的合适hdr模板);具体来说,grna可靶向引起cgd(缺乏吞噬细胞nadph氧化酶)的突变,并且hdr可为吞噬细胞nadph氧化酶的适当表达提供编码。使靶向含有突变和cas蛋白的粒子的grna与携带突变的hsc接触。所述粒子还可包含合适的hdr模板,以校正突变以使吞噬细胞nadph氧化酶适当表达;或者可使hsc与包含或递送hdr模板的第二粒子或载体接触。如此接触的细胞可被施用;以及任选地处理/扩增;参考cartier。
[1056]
范可尼贫血:至少15个基因(fanca、fancb、fancc、fancd1/brca2、fancd2、fance、fancf、fancg、fanci、fancj/bach1/brip1、fancl/phf9/pog、fancm、fancn/palb2、fanco/rad51c和fancp/slx4/btbd12)中的突变会引起范可尼贫血。由这些基因产生的蛋白质参与称为fa通路的细胞过程。当制造新的dna拷贝(称为dna复制)的过程由于dna损伤而被阻断时,fa通路被打开(激活)。fa通路将某些蛋白质传送到受损区域,从而触发dna修复,因此dna复制可以继续。fa通路对于称为链间交联(icl)的特定类型的dna损伤特别具响应性。当dna相反链上的两个dna结构单元(核苷酸)异常附接或连接在一起时,就会发生icl,这会终止dna复制的过程。icl可能是由体内产生的有毒物质堆积或某些癌症治疗药物的治疗引起的。与范可尼贫血相关的八种蛋白质结合在一起形成复合物,称为fa核心复合物。fa核心复合物激活两种蛋白,称为fancd2和fanci。这两种蛋白的激活将dna修复蛋白带到icl区域,因此可去除交联并且dna复制可继续。fa核心复合物。更特别地,fa核心复合物是由fanca、fancb、fancc、fance、fancf、fancg、fancl和fancm组成的核多蛋白复合物,起e3泛素连接酶的作用并介导id复合物(其是由fancd2和fanci组成的异二聚体)的活化。一旦单泛素化后,它就会与fa通路下游的经典肿瘤抑制子(包括fancd1/brca2、fancn/palb2、fancj/brip1和fanco/rad51c)相互作用,从而经由同源重组(hr)促进dna修复。80%至90%的fa病例是由于fanca、fancc和fancg这三种基因之一的突变引起的。这些基因为生产fa核心复合物的组分提供了说明。与fa核心复合物相关的此类基因中的突变将导致复合物失去功能,并破坏整个fa通路。结果,dna损伤无法得到有效修复,并且icl随着时间而积累。geiselhart,“review article,disrupted signaling through the fanconi anemia pathway leads to dysfunctional hematopoietic stem cell biology:underlying mechanisms and potential therapeutic strategies,”anemia第2012卷(2012),文章id 265790,dx.doi.org/10.1155/2012/265790讨论了fa和涉及股内注射编码fancc基因的慢病毒的动物实验,该慢病毒导致体内hsc的校正。使用靶向和与fa相关的一个或多个突变的crispr

cas(v型)系统,例如具有分别靶向fanca、fancc或fancg的一个或多个突变的grna和hdr模
板的crispr

cas(v型)系统,所述突变产生fa并提供fanca、fancc或fancg中的一者或多者的校正性表达;例如,grna可靶向关于fancc的突变,并且hdr可为fancc的适当表达提供编码。使靶向包含突变(例如,涉及fa的一种或多种,例如关于fanca、fancc或fancg中的任何一者或多者的突变)和cas(v型)蛋白的粒子的grna与携带突变的hsc接触。所述粒子还可包含合适的hdr模板,以校正突变以适当表达fa中涉及的一种或多种蛋白质,例如fanca、fancc或fancg中的任何一者或多者;或者可使hsc与包含或递送hdr模板的第二粒子或载体接触。如此接触的细胞可被施用;以及任选地处理/扩增;参考cartier。
[1057]
本文讨论中的粒子(例如,关于包含grna和cas,任选地hdr模板,或hdr模板;例如关于乙型血友病、scid、scid

x1、ada

scid、遗传性酪氨酸血症、β

地中海贫血、x连锁cgd、wiskott

aldrich综合征、范可尼贫血、肾上腺脑白质营养不良(ald)、异染性脑白质营养不良(mld)、hiv/aids、免疫缺陷病症、血液疾患或遗传溶酶体贮积病)有利地通过将grna和cas蛋白质混合物(任选地包含hdr模板或者仅当需要关于模板的单独粒子时仅包含hdr模板的这种混合物)与如下混合物混合来获得或可获得,所述混合物包含以下或基本上由以下组成或由以下组成:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇(其中一个或多个grna靶向hsc中的一个或多个遗传基因座)。
[1058]
实际上,本发明特别适合通过基因组编辑来治疗造血遗传病症,以及尤其是通过使用本文讨论的粒子技术来治疗免疫缺陷病症,例如遗传免疫缺陷病症。遗传免疫缺陷是可成功进行本发明的基因组编辑干预的疾病。原因包括:造血细胞是治疗可及的,免疫细胞是其中的一个子集。可将它们从体内移出并自体或同种异体移植。此外,某些遗传免疫缺陷,例如严重的联合免疫缺陷(scid),对免疫细胞产生了增殖性不利。校正由罕见的自发的“反向”突变引起的scid的遗传病变,表明即使校正一个淋巴细胞祖细胞也可能足以恢复患者的免疫功能.../../../users/t_kowalski/appdata/local/microsoft/windows/temporary internet files/content.outlook/ga8vy8lk/treating scid for ellen.docx

_enref_1。参见bousso,p.等人,diversity,functionality,and stability of the t cell repertoire derived in vivo from a single human t cell precursor.proceedings of the national academy of sciences of the united states of america 97,274

278(2000)。经编辑细胞的选择性优势甚至可实现低水平的编辑,从而产生治疗效果。本发明的这种效果可在scid、wiskott

aldrich综合征和本文提及的其他疾患(包括其他遗传性造血障碍如α

地中海贫血和β

地中海贫血)中看到,其中血红蛋白缺乏对红系祖细胞的适应性产生负面影响。
[1059]
nhej和hdr dsb修复的活性随细胞类型和细胞状态而显著变化。nhej不受细胞周期高度调节,并且在各种细胞类型中均有效,从而可在可接近的靶细胞群体中进行高水平的基因破坏。相比之下,hdr主要在s/g2阶段期间起作用,因此仅限于活跃分裂的细胞,从而限制了需要对有丝分裂细胞进行精确的基因组修饰的治疗方法[ciccia,a.和elledge,s.j.molecular cell 40,179

204(2010);chapman,j.r.等人,molecular cell 47,497

510(2012)]。
[1060]
经由hdr进行校正的效率可由靶向基因座的表观遗传状态或序列控制,或者由所用的特定修复模板配置(单链对双链,长同源臂对短同源臂)控制[hacein

bey

abina,s.等人,the new england journal of medicine 346,1185

1193(2002);gaspar,h.b.等人,
lancet 364,2181

2187(2004);beumer,k.j.等人,g3(2013)]。nhej和hdr机制在靶细胞中的相对活性也可能影响基因校正效率,因为这些途径可能竞争解决dsb的问题[beumer,k.j.等人,proceedings of the national academy of sciences of the united states of america 105,19821

19826(2008)]。hdr还带来了nhej策略所未见的递送挑战,因为它需要同时递送核酸酶和修复模板。在实践中,到目前为止,这些限制导致治疗相关细胞类型的hdr水平低。因此,尽管现在已经针对乙型血友病和遗传性酪氨酸血症的小鼠模型描述了概念验证的临床前hdr治疗,但临床转化因此在很大程度上聚焦于nhej策略来治疗疾病[li,h.等人,nature 475,217

221(2011);yin,h.等人,nature biotechnology 32,551

553(2014)]。
[1061]
任何给定的基因组编辑应用都可包含蛋白质、小rna分子和/或修复模板的组合,这使得这些多个部分的递送比小分子治疗剂基本上更具挑战性。已经开发出两种主要的用于递送基因组编辑工具的策略:离体和体内。在离体治疗中,患病细胞会从体内移出,进行编辑,然后移植回患者体内。离体编辑的优点是允许很好地定义靶细胞群体,并且可确定递送至细胞的治疗性分子的具体剂量。当关注脱靶修饰时,后一种考虑特别重要,因为滴定核酸酶的量可能会减少此类突变(hsu等人,2013)。离体方法的另一个优点是,由于开发了用于蛋白质和核酸进入培养细胞的有效递送系统以用于研究和基因疗法应用,可以实现通常较高的编辑率。
[1062]
离体方法可能存在这样的缺点:其应用局限在少数疾病中。例如,靶细胞必须能够在体外存活操纵。对于许多组织(如大脑)而言,在体外培养细胞是一项重大挑战,因为细胞要么无法存活,要么失去体内功能所需的特性。因此,鉴于本公开内容和本领域的知识,能够通过crispr

cas(v型)系统对具有适合于离体培养和操纵的成年干细胞群体的组织(例如造血系统)进行离体治疗。[bunn,h.f.和aster,j.pathophysiology of blood disorders,(mcgraw

hill,new york,2011)]
[1063]
体内基因组编辑涉及将编辑系统直接递送至其天然组织中的细胞类型。体内编辑允许治疗其中受影响的细胞群体不适合离体操纵的疾病。此外,将核酸酶原位递送至细胞允许治疗多种组织和细胞类型。这些特性可能使体内治疗比离体治疗更广泛地应用于疾病。
[1064]
迄今为止,体内编辑已经很大程度上通过使用具有确定的组织特异性嗜性的病毒载体来实现。此类载体目前在货物运载能力和嗜性方面受到限制,将这种治疗方式限制于有效利用临床上有用的载体进行转导的器官系统,例如肝脏、肌肉和眼睛[kotterman,m.a.和schaffer,d.v.nature reviews.genetics 15,445

451(2014);nguyen,t.h.和ferry,n.gene therapy 11增刊1,s76

84(2004);boye,s.e.等人,molecular therapy:the journal of the american society of gene therapy 21,509

519(2013)]。
[1065]
体内递送的潜在障碍是免疫应答,该免疫应答可能是对治疗所需的大量病毒的应答而产生的,但是这种现象并非基因组编辑所独有,在其他基于病毒的基因疗法中也观察到[bessis,n.等人,gene therapy 11增刊1,s10

17(2004)]。来自编辑核酸酶本身的肽也可能会呈递在mhc i类分子上,以刺激免疫反应,尽管在临床前水平上尚无证据支持这种情况。这种治疗模式的另一个主要困难是在体内控制基因组编辑核酸酶的分布并因此控制其剂量,导致可能难以预测的脱靶突变谱。然而,鉴于本公开内容和本领域的知识,包括使用
用于治疗癌症的基于病毒和粒子的疗法,hsc的体内修饰,例如通过粒子或病毒的递送,在技术人员的能力范围内。
[1066]
离体编辑疗法:长期以来在造血细胞的纯化、培养和移植方面的临床专业知识使影响血液系统的疾病(例如scid、范可尼贫血、wiskott

aldrich综合征和镰状细胞性贫血)成为离体编辑疗法的重点。关注造血细胞的另一个原因是,由于先前为血液病症设计基因疗法的努力,已经存在效率相对较高的递送系统。凭借这些优势,这种治疗模式可应用于经编辑的细胞具有适应性优势的疾病,从而使少量植入的经编辑的细胞可扩增和治疗疾病。一种这样的疾病是hiv,其中感染导致对cd4 t细胞的适应性不利。
[1067]
离体编辑疗法最近已扩展到包括基因校正策略。genovese及其同事的最新论文克服了离体hdr的障碍,他们在从患有scid

x1的患者获得的造血干细胞(hsc)中实现了突变il2rg基因的基因校正[genovese,p.等人,nature 510,235

240(2014)]。genovese等人使用多模式策略在hsc中完成了基因校正。首先,使用包含编码il2rg的治疗性cdna的hdr模板的整合缺陷型慢病毒转导hsc。转导后,用编码靶向il2rg中突变热点的zfn的mrna将细胞电穿孔,以刺激基于hdr的基因校正。为了提高hdr率,使用小分子优化培养条件以促进hsc分裂。通过优化的培养条件、核酸酶和hdr模板,可在培养中以治疗相关的速率从scid

x1患者中获得基因校正的hsc。来自未受影响个体的hsc经过相同的基因校正程序后,可维持小鼠长期造血功能,这是hsc功能的金标准。hsc能够产生所有造血细胞类型,并且可以自体移植,使其成为所有造血遗传病症的极有价值的细胞群体[weissman,i.l.和shizuru,j.a.blood 112,3543

3553(2008)]。原则上,基因校正的hsc可用于治疗广泛多种遗传性血液病症,使得这项研究成为治疗性基因组编辑的令人激动的突破。
[1068]
体内编辑疗法:根据本公开内容和本领域的知识,可有利地使用体内编辑。对于有效递送的器官系统,已经有许多令人激动的临床前治疗成功。在乙型血友病小鼠模型中证明了成功进行体内编辑疗法的第一个实例[li,h.等人,nature 475,217

221(2011)]。如前所述,乙型血友病是一种由编码因子ix(凝血级联的关键组成部分)的基因中的功能丧失突变引起的x连锁隐性病症。在受到严重影响的个体中,将因子ix的活性恢复至其水平的1%以上可将所述疾病转化为明显更温和的形式,因为从年轻时就预防性地向此类患者输注重组因子ix以达到这种水平可大大改善临床并发症[lofqvist,t.等人,journal of internal medicine 241,395

400(1997)]。因此,仅需低水平的hdr基因校正即可改变患者的临床结果。另外,因子ix由肝脏合成和分泌,肝脏是可通过编码编辑系统的病毒载体有效转导的器官。
[1069]
使用编码zfn的嗜肝腺相关病毒(aav)血清型和校正性hdr模板,在鼠肝中实现了突变的人源化因子ix基因的高达7%的基因校正[li,h.等人,nature 475,217

221(2011)]。这导致了血凝块形成动力学的改善,血凝块形成动力学是凝血级联功能的一种量度,这首次证明了体内编辑疗法不仅可行,而且有效。如本文中所讨论的,本领域技术人员根据本文的教导和本领域的知识(例如li)来定位,以利用含hdr模板和crispr

cas系统的粒子来处理乙型血友病,所述系统靶向x连锁隐性病症的突变以逆转功能丧失突变。
[1070]
在这项研究的基础上,其他小组最近使用crispr

cas对肝脏进行了体内基因组编辑,从而成功治疗了遗传性酪氨酸血症的小鼠模型并产生了可针对心血管疾病提供保护的突变。这两种截然不同的应用证明了这种方法在涉及肝功能障碍的病症中的通用性[yin,
h.等人,nature biotechnology 32,551

553(2014);ding,q.等人,circulation research 115,488

492(2014)]。必须将体内编辑应用于其他器官系统,以证明该策略可广泛应用。目前,正在进行优化病毒和非病毒载体的努力,以扩展可用这种治疗模式治疗的病症的范围[kotterman,m.a.和schaffer,d.v.nature reviews.genetics 15,445

451(2014);yin,h.等人,nature reviews.genetics 15,541

555(2014)]。如本文所讨论的,技术人员根据本文的教导和本领域的知识(例如yin)来定位,以利用含hdr模板和靶向突变的crispr

cas系统的粒子来处理遗传性酪氨酸血症。
[1071]
靶向缺失,治疗应用:基因的靶向缺失可能是优选的。因此,优选的是涉及免疫缺陷病症、血液疾患或遗传溶酶体贮积病例如乙型血友病、scid、scid

x1、ada

scid、遗传性酪氨酸血症、β

地中海贫血、x连锁cgd、wiskott

aldrich综合征、范可尼贫血、肾上腺脑白质营养不良(ald)、异染性脑白质营养不良(mld)、hiv/aids、其他代谢异常的基因,编码与疾病有关的错误折叠蛋白的基因,导致与疾病有关的功能丧失的基因;通常,使用任何本文讨论的递送系统,可在hsc中靶向的突变,其中粒子系统被认为是有利的。
[1072]
在本发明中,特别是按照tangri等人关于促红细胞生成素首先提出并且随后开发的方法,特别是可降低crispr酶的免疫原性。因此,定向进化或合理设计可用于降低宿主物种(人类或其他物种)中的crispr酶(例如v型效应子)的免疫原性。
[1073]
基因组编辑:本发明的v型crispr/cas系统可用于校正先前尝试使用talen和zfn以及慢病毒并且成功率有限的遗传突变,包括如本文所讨论的;还参见wo2013163628。
[1074]
治疗大脑、中枢神经和免疫系统的疾病
[1075]
本发明还涵盖将crispr

cas系统递送至大脑或神经元。例如,rna干扰(rnai)通过减少htt(亨廷顿病的致病基因)的表达而为该病症提供了治疗潜力(参见例如mcbride等人,molecular therapy第19卷第12期,2011年12月,第2152

2162页),因此申请人假定它可被使用/和或适于crispr

cas系统。可使用减少反义序列的脱靶潜能的算法来生成crispr

cas系统。crispr

cas序列可靶向小鼠、恒河猴或人类亨廷顿蛋白的外显子52中的序列,并在病毒载体例如aav中表达。可向动物(包括人类)每半球注射约3次显微注射(总共六次注射):前联合部的前1mm(12μl)和其余两次注射(分别为12μl和10μl),与第一次注射后尾间隔3和6mm,以约1μl/min的速率注射1e12vg/ml的aav,并且将针头留在原处另外5分钟,以使注射液从针尖扩散。
[1076]
difiglia等人(pnas,2007年10月23日,第104卷,第43期,17204

17209)观察到,向成年纹状体中单次施用靶向htt的sirna可使突变型htt沉默,减弱神经元病理并延缓在hd的快速发作病毒转基因小鼠模型中观察到的异常行为表型。difiglia将2μl的10μm的cy3标记的cc

sirna

htt或未缀合的sirna

htt经纹状体内注射给小鼠。在本发明中可考虑将类似剂量的靶向htt的crispr cas用于人类,例如,可经纹状体内注射约5

10ml的10μm靶向htt的crispr cas。
[1077]
在另一个实例中,boudreau等人(molecular therapy第17卷第6期,2009年6月)将5μl表达htt特异性rnai病毒的重组aav血清型2/1载体(4
×
10
12
病毒基因组/ml)注射到纹状体中。在本发明中可考虑将类似剂量的靶向htt的crispr cas用于人类,例如,可经纹状体内注射约10

20ml的(4
×
10
12
病毒基因组/ml)靶向htt的crispr cas。
[1078]
在另一个实例中,可连续施用靶向htt的crispr cas(参见例如yu等人,cell 150,
895

908,2012年8月31日)。yu等人利用流量为0.25ml/hr的渗透泵(2004型)来递送300毫克/天的ss

sirna或磷酸盐缓冲盐水(pbs)(sigma aldrich)持续28天,以及使用设计成流量为0.5μl/hr的泵(2002型)来递送75毫克/天的阳性对照moe aso持续14天。泵(durect公司)配备有在无菌pbs中稀释的ss

sirna或moe,然后在植入前于37℃温育24或48小时(2004型)。用2.5%异氟烷麻醉小鼠,并在颅骨底部做中线切口。使用立体定向引导器,将套管植入右侧脑室,并用loctite胶粘剂固定。将附接至alzet渗透微型泵的导管附接至套管,并将所述泵皮下置于肩胛中部区域。用5.0尼龙缝线封闭切口。在本发明中可考虑将类似剂量的靶向htt的crispr cas用于人类,例如,可施用约500至1000克/天的靶向htt的crispr cas。
[1079]
在连续输注的另一个实例中,stiles等人(experimental neurology 233(2012)463

471)将带有钛针尖的实质内导管植入右壳核中。将所述导管连接到皮下植入腹部的ii泵(medtronic neurological,minneapolis,mn)。在以6微升/天的速度输注磷酸盐缓冲盐水7天后,将泵重新装满测试物品并编程为连续递送7天。以约0.1至0.5μl/min的可变输注速率输注约2.3至11.52mg/d的sirna。在本发明中可考虑将类似剂量的靶向htt的crispr cas用于人类,例如,可施用约20至200毫克/天的靶向htt的crispr cas。在另一个实例中,也可将转让给sangamo的美国专利公开第20130253040号的方法从tales改适为用于治疗亨廷顿病的本发明的核酸靶向系统。
[1080]
在另一个实例中,也可将转让给sangamo的美国专利公开第20130253040号(wo2013130824)的方法从tales改适为用于治疗亨廷顿病的本发明的crispr cas系统。
[1081]
通过引用并入本文的以the broad institute等人名义的wo2015089354a1描述了亨廷顿病(hp)的靶标。关于亨廷顿病的crispr复合物的可能靶基因:prkce;igf1;ep300;rcor1;prkcz;hdac4;和tgm2。因此,在本发明的一些实施方案中,可选择prkce;igf1;ep300;rcor1;prkcz;hdac4;和tgm2中的一者或多者作为亨廷顿病的靶标。
[1082]
其他三核苷酸重复病症。这些可能包括以下任何一项:第i类包括亨廷顿病(hd)和脊髓小脑共济失调;第ii类扩增在表型上各不相同,异质扩增通常量值较小,但也存在于基因的外显子中;以及第iii类包括脆性x综合征,肌强直性营养不良,脊髓小脑共济失调、青少年肌阵挛性癫痫和弗里德里希共济失调中的两种。
[1083]
本发明的另一方面涉及利用所述系统来校正已经被鉴定与lafora病相关的emp2a和emp2b基因中的缺陷。lafora疾病是常染色体隐性疾患,其特征为可能开始于青春期的癫痫发作的进行性肌阵挛性癫痫。所述疾病的少数病例可能是由于尚未鉴定的基因突变引起的。所述疾病引起癫痫发作,肌肉痉挛,行走困难,痴呆,以及最终死亡。目前尚无针对疾病进展证实有效的疗法。所述系统也可靶向与癫痫相关的其他遗传异常,并且潜在遗传学进一步描述于genetics of epilepsy and genetic epilepsies,giuliano avanzini,jeffrey l.noebels编辑,mariani foundation paediatric neurology:20;2009)。
[1084]
转让给sangamo biosciences公司的涉及灭活t细胞受体(tcr)基因的美国专利公开第20110158957号的方法也可被修改为本发明的系统。在另一个实例中,转让给sangamo biosciences公司的美国专利公开第20100311124号和转让给cellectis的美国专利公开第20110225664号的方法都涉及使谷氨酰胺合酶基因表达基因失活,其也可被修改为本发明的系统。
[1085]
用于大脑的递送选择包括将crispr酶和呈dna或rna的形式的指导rna包封到脂质
体中,并与分子特洛伊木马缀合以进行跨血脑屏障(bbb)递送。分子特洛伊木马已被证明可有效地将b

gal表达载体递送至非人类灵长类动物的大脑中。相同的方法可用于递送含有crispr酶和指导rna的载体。例如,xia cf和boado rj,pardridge wm("antibody

mediated targeting of sirna via the human insulin receptor using avidin

biotin technology."mol pharm.2009年5

6月;6(3):747

51.doi:10.1021/mp800194)描述了可如何通过结合使用受体特异性单克隆抗体(mab)和抗生物素蛋白

生物素技术将短干扰rna(sirna)递送至培养细胞以及体内细胞。作者还报道,由于用抗生物素蛋白

生物素技术稳定了靶向mab与sirna之间的键,并且在静脉内施用靶向sirna后在体内观察到遥远位点(如大脑)处的rnai作用。
[1086]
zhang等人(mol ther.2003年1月;7(1):11

8.))描述了如何将编码报告物如荧光素酶的表达质粒包封在由85nm聚乙二醇化免疫脂质体组成的“人工病毒”内部,所述“人工病毒”利用针对人胰岛素受体(hir)的单克隆抗体(mab)体内靶向恒河猴脑。hirmab使携带外源基因的脂质体在静脉内注射后能够通过血脑屏障进行转胞吞作用并通过神经元质膜进行内吞作用。与大鼠相比,恒河猴脑中的荧光素酶基因表达水平高50倍。组织化学和共焦显微镜证实了灵长类动物脑中β

半乳糖苷酶基因的广泛神经元表达。作者指出,这种方法可在24小时内实现可行的可逆成人转基因。因此,优选使用免疫脂质体。这些可与靶向特定组织或细胞表面蛋白的抗体结合使用。
[1087]
阿尔茨海默病
[1088]
美国专利公开第20110023153号描述了使用锌指核酸酶来遗传修饰与阿尔茨海默病相关的细胞、动物和蛋白质。一旦修饰的细胞和动物可使用已知方法进行进一步测试,以使用ad研究中常用的措施来研究靶向突变对ad发生和/或进展的影响,例如但不限于学习和记忆、焦虑、抑郁、成瘾和感觉运动功能,以及测量行为、功能、病理、代谢和生化功能的测定法。
[1089]
本公开包括编码与ad相关的蛋白质的任何染色体序列的编辑。通常基于与ad相关的蛋白质与ad病症的实验关联来选择与ad相关的蛋白质。例如,相对于缺乏ad病症的群体,在患有ad病症的群体中,与ad相关的蛋白质的生产率或循环浓度可升高或降低。蛋白质水平的差异可使用蛋白质组学技术进行评估,所述蛋白质组学技术包括但不限于western印迹、免疫组织化学染色、酶联免疫吸附测定(elisa)和质谱法。或者,可通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定与ad相关的蛋白质,所述基因组技术包括但不限于dna微阵列分析、基因表达的系列分析(sage)和定量实时聚合酶链反应(q

pcr)。
[1090]
阿尔茨海默病相关蛋白的实例包括例如vldlr基因编码的极低密度脂蛋白受体蛋白(vldlr),uba1基因编码的泛素样修饰物激活酶1(uba1),或uba3基因编码的nedd8激活酶e1催化亚基蛋白(ube1c)。
[1091]
作为非限制性实例,与ad相关的蛋白质包括但不限于如下列出的蛋白质:染色体序列编码蛋白alas2δ

氨基乙酰丙酸合酶2(alas2),abca1atp结合盒转运蛋白(abca1),ace血管紧张素i

转化酶(ace),apoe载脂蛋白e前体(apoe),app淀粉样前体蛋白(app),aqp1水通道蛋白1蛋白(aqp1),bin1 myc盒依赖性相互作用蛋白1或桥接整合子1蛋白(bin1),bdnf脑源性神经营养因子(bdnf),btnl8嗜乳脂蛋白样蛋白8(btnl8),c1orf49染色体1开放阅读框49,cdh4钙粘蛋白

4,chrnb2神经元乙酰胆碱受体亚基β

2,cklfsf2 cklf样含marvel跨
膜结构域蛋白2(cklfsf2),clec4e c型凝集素结构域家族4成员e(clec4e),clu簇蛋白(也称为载脂蛋白j),cr1红细胞补体受体1(cr1,也称为cd35、c3b/c4b受体和免疫粘附受体),cr1l红细胞补体受体1(cr1l),csf3r粒细胞集落刺激因子3受体(csf3r),cst3胱抑素c或胱抑素3,cyp2c细胞色素p450 2c,dapk1死亡相关蛋白激酶1(dapk1),esr1雌激素受体1,iga受体的fcar fc片段(fcar,也称为cd89),igg的fcgr3b fc片段,低亲和力iiib,受体(fcgr3b或cd16b),ffa2游离脂肪酸受体2(ffa2),fga纤维蛋白原(因子i),gab2 grb2相关结合蛋白2(gab2),gab2 grb2相关结合蛋白2(gab2),galp甘丙肽样肽,gapdhs生精甘油醛
‑3‑
磷酸脱氢酶(gapdhs),gmpb gmbp,hp结合珠蛋白(hp),htr7 5

羟色胺(血清素)受体7(腺苷酸环化酶偶联),ide胰岛素降解酶,if127if127,ifi6干扰素α诱导蛋白6(ifi6),ifit2干扰素诱导的具有四肽重复序列的蛋白2(ifit2),il1rn白细胞介素

1受体拮抗剂(il

1ra),il8ra白细胞介素8受体α(il8ra或cd181),il8rb白细胞介素8受体β(il8rb),jag1锯齿状1(jag1),kcnj15钾内向整流通道亚家族j成员15(kcnj15),lrp6低密度脂蛋白受体相关蛋白6(lrp6),mapt微管相关蛋白τ(mapt),mark4map/微管亲和力调节激酶4(mark4),mphosph1 m期磷酸蛋白1,mthfr5,10

亚甲基四氢叶酸还原酶,mx2干扰素诱导的gtp结合蛋白mx2,nbn nibrin也称为nbn,ncstn nicastrin,niacr2烟酸受体2(niacr2,也称为gpr109b),nmnat3烟酰胺核苷酸腺苷酸转移酶3,ntm neurotrimin(或hnt),orm1血清类粘蛋白1(orm1)或α
‑1‑
酸糖蛋白1,p2ry13 p2y嘌呤受体13(p2ry13),pbef1烟酰胺磷酸核糖基转移酶(namprtase或nampt)也称为前b细胞集落增强因子1(pbef1)或visfatin,pck1磷酸烯醇丙酮酸羧激酶,picalm磷脂酰肌醇结合网格蛋白装配蛋白(picalm),plau尿激酶型纤溶酶原激活剂(plau),plxnc1plexin c1(plxnc1),prnp朊病毒蛋白,psen1早老蛋白1蛋白(psen1),psen2早老蛋白2蛋白(psen2),ptpra蛋白酪氨酸磷酸酶受体a型蛋白(ptpra),ralgps2具有ph结构域和sh3结合基序2的ral gef(ralgps2),rgsl2 g蛋白信号传导调节因子样2(rgsl2),selenbp1硒结合蛋白1(selnbp1),slc25a37 mitoferrin

1,sorl1含分拣蛋白(sortilin)相关受体l(dlr类)a重复序列的蛋白(sorl1),tf转铁蛋白,tfam线粒体转录因子a,tnf肿瘤坏死因子,tnfrsf10c肿瘤坏死因子受体超家族成员10c(tnfrsf10c),tnfsf10肿瘤坏死因子受体超家族成员(trail)成员10a(tnfsf10),uba1泛素样修饰物激活酶1(uba1),uba3nedd8激活酶e1催化亚基蛋白(ube1c),ubb泛素b蛋白(ubb),ubqln1泛醌蛋白

1,uchl1泛素羧基末端酯酶l1蛋白(uchl1),uchl3泛素羧基末端水解酶同工酶l3蛋白(uchl3),vldlr极低密度脂蛋白受体蛋白(vldlr)。
[1092]
在示例性实施方案中,其染色体序列被编辑的与ad相关的蛋白质可以是由vldlr基因编码的极低密度脂蛋白受体蛋白(vldlr),由uba1基因编码的泛素样修饰物激活酶1(uba1),由uba3基因编码的nedd8活化酶e1催化亚基蛋白(ube1c),由aqp1基因编码的水通道蛋白1蛋白(aqp1),由uchl1基因编码的泛素羧基末端酯酶l1蛋白(uchl1),由uchl3基因编码的泛素羧基末端水解酶同工酶l3蛋白(uchl3),由ubb基因编码的泛素b蛋白(ubb),由mapt基因编码的微管相关蛋白τ(mapt),由ptpra基因编码的蛋白质酪氨酸磷酸酶受体a型蛋白(ptpra),由picalm基因编码的磷脂酰肌醇结合网格蛋白装配蛋白(picalm),由clu基因编码的簇蛋白(也称为载脂蛋白j),由psen1基因编码的早老蛋白1蛋白,由psen2基因编码的早老蛋白2蛋白,由sorl1基因编码的含分拣蛋白相关受体l(dlr类)a重复序列的蛋白(sorl1)蛋白,由app基因编码的淀粉样前体蛋白(app),由apoe基因编码的载脂蛋白e前体
(apoe),或由bdnf基因编码的脑源性神经营养因子(bdnf)。在一个示例性实施方案中,遗传修饰的动物是大鼠,并且编码与ad相关的蛋白质的经编辑的染色体序列如下:app淀粉样前体蛋白(app)nm_019288,aqp1水通道蛋白1蛋白(aqp1)nm_012778,bdnf脑源性神经营养因子nm_012513,clu簇蛋白(也称为nm_053021载脂蛋白j),mapt微管相关蛋白nm_017212τ(mapt),picalm磷脂酰肌醇结合蛋白nm_053554网格蛋白装配蛋白(picalm),psen1早老蛋白1蛋白(psen1)nm_019163,psen2早老蛋白2蛋白(psen2)nm_031087,ptpra蛋白酪氨酸磷酸酶nm_012763a型受体蛋白(ptpra),sorl1含分拣蛋白相关受体l(dlr nm_053519,类别)a重复序列的xm_001065506蛋白(sorl1)xm_217115,uba1泛素样修饰物激活nm_001014080酶1(uba1),uba3nedd8激活酶e1 nm_057205催化亚基蛋白(ube1c),ubb泛素b蛋白(ubb)nm_138895,uchl1泛素羧基末端nm_017237酯酶l1蛋白(uchl1),uchl3泛素羧基末端nm_001110165水解酶同工酶l3蛋白(uchl3),vldlr极低密度脂蛋白nm_013155受体蛋白(vldlr)。
[1093]
所述动物或细胞可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个编码与ad相关的蛋白质的破坏染色体序列以及0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个编码与ad相关的蛋白质的染色体整合序列。
[1094]
可修饰编辑或整合的染色体序列以编码与ad相关的改变的蛋白质。与ad相关的染色体序列中的许多突变已经与ad相关。例如,app中的v7171(即位置717处的缬氨酸变成异亮氨酸)错义突变引起家族性ad。早老蛋白

1蛋白的多重突变,例如h163r(即位置163处的组氨酸变为精氨酸),a246e(即位置246处的丙氨酸变为谷氨酸),l286v(即位置286处的亮氨酸变为缬氨酸)和c410y(即位置410处的半胱氨酸变为酪氨酸)引起家族性3型阿尔茨海默病。早老蛋白2蛋白的突变,例如n141i(即位置141处的天冬酰胺变为异亮氨酸),m239v(即位置239处的甲硫氨酸变为缬氨酸)和d439a(即位置439处的天冬氨酸改变为丙氨酸)引起家族性4型阿尔茨海默病。ad相关基因和疾病中遗传变异的其他关联是本领域已知的。参见例如waring等人,(2008)arch.neurol.65:329

334,其公开内容通过引用整体并入本文。
[1095]
在某些示例实施方案中,本文公开的系统可用于插入ad风险增加变体如apoe4,或者用中性风险变体如apoe3或风险降低变体如apoe2代替ad风险增加变体如apoe4。
[1096]
分泌酶病症
[1097]
美国专利公开第20110023146号描述了锌指核酸酶用于遗传修饰与分泌酶相关病症相关的细胞、动物和蛋白质的用途。分泌酶对于将前蛋白加工成生物活性形式至关重要。分泌酶途径的各个组成部分的缺陷导致许多病症,特别是具有标志性淀粉样蛋白生成或淀粉样蛋白斑块的病症,例如阿尔茨海默病(ad)。
[1098]
分泌酶病症和与这些病症相关的蛋白质是影响众多病症的易感性、病症的存在、病症的严重程度或它们的任何组合的一组多种蛋白质。本公开包括编码与分泌酶病症相关的蛋白质的任何染色体序列的编辑。通常基于与分泌酶相关的蛋白质与分泌酶病症的发展之间的实验关联来选择与分泌酶病症相关的蛋白质。例如,相对于不具有分泌酶病症的群体,在具有分泌酶病症的群体中,与分泌酶病症相关的蛋白质的生产率或循环浓度可升高或降低。蛋白质水平的差异可使用蛋白质组学技术进行评估,所述蛋白质组学技术包括但不限于western印迹、免疫组织化学染色、酶联免疫吸附测定(elisa)和质谱法。或者,可通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定与分泌酶病症相关的蛋白
质,所述基因组技术包括但不限于dna微阵列分析、基因表达的系列分析(sage)和定量实时聚合酶链反应(q

pcr)。
[1099]
作为非限制性实例,与分泌酶病症相关的蛋白质包括psenen(早老蛋白增强子2同源物(秀丽隐杆线虫)),ctsb(组织蛋白酶b),psen1(早老蛋白1),app(淀粉样β(a4)前体蛋白),aph1b(前咽缺陷1同源物b(秀丽隐杆线虫)),psen2(早老蛋白2(阿尔茨海默病4)),bace1(β位点app切割酶1),itm2b(整合膜蛋白2b),ctsd(组织蛋白酶d),notch1(notch同源物1,易位相关(果蝇)),tnf(肿瘤坏死因子(tnf超家族,成员2)),ins(胰岛素),dyt10(肌张力障碍10),adam17(adam金属肽酶结构域17),apoe(载脂蛋白e),ace(血管紧张素i转化酶(肽基

二肽酶a)1),stn(他汀类),tp53(肿瘤蛋白p53),il6(白细胞介素6(干扰素,β2)),ngfr(神经生长因子受体(tnfr超家族,成员16)),il1b(白细胞介素1,β),ache(乙酰胆碱酯酶(yt血型)),ctnnb1(连环蛋白(钙粘蛋白相关蛋白),β1,88kda),igf1(胰岛素样生长因子1(生长调节素c)),ifng(干扰素,γ),nrg1(神经调节蛋白1),casp3(胱天蛋白酶3,凋亡相关的半胱氨酸肽酶),mapk1(有丝分裂原激活的蛋白激酶1),cdh1(钙粘蛋白1,1型,e

钙粘蛋白(上皮)),apbb1(淀粉样β(a4)前体蛋白结合,家族b,成员1(fe65)),hmgcr(3

羟基
‑3‑
甲基戊二酰

辅酶a还原酶),creb1(camp响应元件结合蛋白1),ptgs2(前列腺素

内过氧化物合酶2(前列腺素g/h合酶和环加氧酶)),hes1(发状分裂相关增强子1(果蝇)),cat(过氧化氢酶),tgfb1(转化生长因子,β1),eno2(烯醇酶2(γ,神经元)),erbb4(v

erb

a成红细胞白血病病毒致癌基因同源物4(禽类)),trappc10(运输蛋白粒子复合物10),maob(单胺氧化酶b),ngf(神经生长因子(β多肽)),mmp12(基质金属肽酶12(巨噬细胞弹性蛋白酶)),jag1(锯齿状1(alagille综合征)),cd40lg(cd40配体),pparg(过氧化物酶体增殖物激活受体γ),fgf2(成纤维细胞生长因子2(碱性)),il3(白细胞介素3(集落刺激因子,多种)),lrp1(低密度脂蛋白受体相关蛋白1),notch4(notch同源物4(果蝇)),mapk8(有丝分裂原激活的蛋白激酶8),prep(脯氨酰内肽酶),notch3(notch同源物3(果蝇)),prnp(朊病毒蛋白),ctsg(组织蛋白酶g),egf(表皮生长因子(β

尿抑胃素)),ren(肾素),cd44(cd44分子(印度血型)),selp(选择素p(颗粒膜蛋白140kda,抗原cd62)),ghr(生长激素受体),adcyap1(腺苷酸环化酶激活多肽1(垂体)),insr(胰岛素受体),gfap(胶质纤维酸性蛋白),mmp3(基质金属肽酶3(基质溶素1,前明胶酶)),mapk10(有丝分裂原激活蛋白激酶10),sp1(sp1转录因子),myc(v

myc骨髓细胞瘤病病毒致癌基因同源物(禽类)),ctse(组织蛋白酶e),ppara(过氧化物酶体增殖物激活受体α),jun(jun致癌基因),timp1(timp金属肽酶抑制剂1),il5(白细胞介素5(集落刺激因子,嗜酸性粒细胞)),il1a(白细胞介素1,α),mmp9(基质金属肽酶9(明胶酶b,92kda明胶酶,92kda iv型胶原酶)),htr4(5

羟色胺(血清素)受体4),hspg2(硫酸乙酰肝素蛋白聚糖2),kras(v

ki

ras2kirsten大鼠肉瘤病毒致癌基因同源物),cycs(细胞色素c,体细胞),smg1(smg1同源物,磷脂酰肌醇3激酶相关激酶(秀丽隐杆线虫)),il1r1(白细胞介素1受体,i型),prok1(前动力蛋白1),mapk3(有丝分裂原激活蛋白激酶3),ntrk1(神经营养性酪氨酸激酶,受体,1型),il13(白细胞介素13),mme(膜金属内肽酶),tkt(转酮醇酶),cxcr2(趋化因子(c

x

c基序)受体2),igf1r(胰岛素样生长因子1受体),rara(视黄酸受体,α),crebbp(creb结合蛋白),ptgs1(前列腺素

内过氧化物合酶1(前列腺素g/h合酶和环加氧酶)),galt(半乳糖
‑1‑
磷酸尿嘧啶转移酶),chrm1(胆碱能受体,毒蕈碱1),atxn1(ataxin 1),pawr(prkc,细胞凋亡,wt1,调节因子),notch2(notch同源物2(果蝇)),m6pr
(甘露糖
‑6‑
磷酸受体(阳离子依赖性)),cyp46a1(细胞色素p450,家族46,亚家族a,多肽1),csnk1 d(酪蛋白激酶1,δ),mapk14(有丝分裂原激活的蛋白激酶14),prg2(蛋白聚糖2,骨髓(天然杀伤细胞激活子,嗜酸性粒细胞主要碱性蛋白)),prkca(蛋白激酶c,α),l1cam(l1细胞粘附分子),cd40(cd40分子,tnf受体超家族成员5),nr1i2(核受体亚家族1,i组,成员2),jag2(锯齿状2),ctnnd1(连环蛋白(钙粘蛋白相关蛋白),δ1),cdh2(钙粘蛋白2,1型,n

钙粘蛋白(神经元)),cma1(糜酶1,肥大细胞),sort1(分拣蛋白1),dlk1(δ样1同源物(果蝇)),them4(硫酯酶超家族成员4),jup(连接桥粒斑珠蛋白),cd46(cd46分子,补体调控蛋白),ccl11(趋化因子(c

c基序)配体11),cav3(小窝蛋白3),rnase3(核糖核酸酶,rna酶a家族,3(嗜酸性粒细胞阳离子蛋白)),hspa8(热休克70kda蛋白8),casp9(胱天蛋白酶9,凋亡相关半胱氨酸肽酶),cyp3a4(细胞色素p450,家族3,亚家族a,多肽4),ccr3(趋化因子(c

c基序)受体3),tfap2a(转录因子ap

2α(激活增强子结合蛋白2α)),scp2(固醇载体蛋白2),cdk4(细胞周期蛋白依赖性激酶4),hif1a(缺氧诱导因子1,α亚基(碱性螺旋



螺旋转录因子)),tcf7l2(转录因子7

样2(t细胞特异性,hmg盒)),il1r2(白细胞介素1受体,ii型),b3galtl(β1,3

半乳糖基转移酶样),mdm2(mdm2p53结合蛋白同源物(小鼠)),rela(v

rel网状内皮病病毒致癌基因同源物a(禽类)),casp7(胱天蛋白酶7,凋亡相关的半胱氨酸肽酶),ide(胰岛素降解酶),fabp4(脂肪酸结合蛋白4,脂肪细胞),cask(钙/钙调蛋白依赖性丝氨酸蛋白激酶(maguk家族)),adcyap1r1(腺苷酸环化酶激活多肽1(垂体)i型受体),atf4(激活转录因子4(tax响应性增强子元件b67)),pdgfa(血小板衍生的生长因子α多肽),c21或f33(21号染色体开放阅读框33),scg5(分泌粒蛋白v(7b2蛋白)),rnf123(无名指蛋白123),nfkb1(b细胞1中κ轻多肽基因增强子的核因子),erbb2(v

erb

b2成红细胞白血病病毒致癌基因同源物2,神经/胶质母细胞瘤衍生的致癌基因同源物(禽类),cav1(小窝蛋白1,胞膜窖蛋白,22kda),mmp7(基质金属肽酶7(基质溶素,子宫)),tgfa(转化生长因子,α),rxra(类维生素a x受体,α),stx1a(突触融合蛋白1a(脑)),psmc4(蛋白酶体(蛋白酶体,macropain)26s亚基,atp酶,4),p2ry2(嘌呤能受体p2y,g蛋白偶联,2),tnfrsf21(肿瘤坏死因子受体超家族,成员21),dlg1(圆盘,大同源物1(果蝇)),numbl(numb同源物(果蝇)样),spn(载唾液酸蛋白),plscr1(磷脂加扰酶1),ubqln2(泛素2),ubqln1(泛素1),pcsk7(原蛋白转化酶枯草杆菌蛋白酶/kexin类型7),spon1(spondin 1,细胞外基质蛋白),silv(银同源物(小鼠)),qpct(谷氨酰胺肽环转移酶),hess(发状分裂相关增强子5(果蝇)),gcc1(包含grip和卷曲螺旋结构域的1),及它们的任何组合。
[1100]
所述经遗传修饰的动物或细胞可包含1、2、3、4、5、6、7、8、9、10个或更多个编码与分泌酶病症相关蛋白质的破坏染色体序列以及0、1、2、3、4、5、6、7、8、9、10个或更多个编码与分泌酶病症相关的破坏蛋白质的染色体整合序列。
[1101]
als
[1102]
美国专利公开第20110023144号描述了锌指核酸酶用于遗传修饰与肌萎缩性侧索硬化症(als)疾病相关的细胞、动物和蛋白质的用途。als的特征为参与随意运动的大脑皮层、脑干和脊髓中的某些神经细胞逐渐稳定退化。
[1103]
运动神经元病症和与这些病症相关的蛋白质是影响患上运动神经元病症的易感性、运动神经元病症的存在、运动神经元病症的严重程度或它们的任何组合的一组多种蛋白质。本公开包括编码与als疾病、特定运动神经元病症相关的蛋白质的任何染色体序列的
编辑。通常基于als相关蛋白与als的实验关联来选择与als相关的蛋白质。例如,相对于不具有als的群体,在具有als的群体中,与als相关的蛋白质的生产率或循环浓度可升高或降低。蛋白质水平的差异可使用蛋白质组学技术进行评估,所述蛋白质组学技术包括但不限于western印迹、免疫组织化学染色、酶联免疫吸附测定(elisa)和质谱法。或者,可通过使用基因组技术获得编码蛋白质的基因的基因表达谱,来鉴定与als相关的蛋白质,所述基因组技术包括但不限于dna微阵列分析、基因表达的系列分析(sage)和定量实时聚合酶链反应(q

pcr)。
[1104]
作为非限制性实例,与als相关的蛋白质包括但不限于以下蛋白质:sod1超氧化物歧化酶1,als3肌萎缩性侧索硬化3,setx senataxin,als5肌萎缩性侧索硬化5,fus融合在肉瘤中,als7肌萎缩性侧索硬化7,als2肌萎缩侧索dpp6二肽基肽酶6硬化2,nefh重神经丝,ptgs1前列腺素

多肽内过氧化物合酶1,slc1a2溶质载体家族1tnfrsf10b肿瘤坏死因子(神经胶质高亲和力受体超家族,谷氨酸转运蛋白)成员10b成员2,prph周围蛋白,hsp90aa1热休克蛋白90kdaα(胞质)a类成员1,gria2谷氨酸受体,ifng干扰素γ亲离子性,ampa 2s100b s100钙结合,fgf2成纤维细胞生长因子2蛋白b,aox1醛氧化酶1,cs柠檬酸合酶,tardbp tar dna结合蛋白,txn硫氧还蛋白,raph1ras关联map3k5有丝分裂原激活蛋白(raigds/af

6)和激酶5普利克底物蛋白(pleckstrin)同源结构域1,nbeal1类神经管蛋白1,gpx1谷胱甘肽过氧化物酶1,ica1l胰岛细胞自身抗原,rac1ras相关的c3肉毒杆菌毒素1.69kda样毒素底物1,mapt微管相关,itpr2肌醇1,4,5

蛋白τ三磷酸受体2型,als2cr4肌萎缩侧索gls谷氨酰胺酶硬化2(青少年)染色体区域候选物4,als2cr8肌萎缩侧索cntfr睫状神经营养因子硬化2(青少年)受体染色体区域候选物8,als2cr11肌萎缩侧索folh1叶酸水解酶1硬化2(青少年)染色体区域候选物11,fam117b具有序列p4hb脯氨酰4

羟化酶的家族相似性117成员bβ多肽,cntf睫状神经营养因子,sqstm1螯合体1,stradb ste20相关激酶naip nlr家族凋亡衔接子β抑制蛋白,ywhaq酪氨酸3

slc33a1溶质载体家族33单加氧酶/色氨酸(乙酰辅酶a转运蛋白),5

单加氧酶成员1激活蛋白,θ多肽,trak2转运蛋白同源物,sac1含驱动蛋白结合2脂质磷酸酶结构域,nif3l1 nif3ngg1相互作用ina互联蛋白神经元因子3样1中间丝蛋白,αpard3b par

3分区,cox8a细胞色素c氧化酶缺陷3同源b亚基viiia,cdk15细胞周期蛋白依赖性激酶,hecw1含hect、c2和ww 15结构域的e3泛素蛋白连接酶1,nos1一氧化氮合酶1,met met原癌基因,sod2超氧化物歧化酶2,hspb1热休克27kda线粒体蛋白1,nefl轻神经丝,ctsb组织蛋白酶b多肽,ang血管生成素,hspa8热休克70kda核糖核酸酶,rna酶a蛋白8家族,5vapb vamp(囊泡

esr1雌激素受体1相关膜蛋白)相关蛋白b和c,snca突触核蛋白α,hgf肝细胞生长因子,cat过氧化氢酶,actb肌动蛋白β,nefm中等神经丝,th酪氨酸羟化酶多肽,bcl2b细胞cll/淋巴瘤2,fas fas(tnf受体超家族,成员6),casp3凋亡胱天蛋白酶3,clu丛生蛋白相关半胱氨酸肽酶,smn1运动神经元存活,g6pd葡萄糖
‑6‑
磷酸1端粒脱氢酶,bax bcl2相关的x,hsf1热休克转录蛋白因子1,rnf19a无名指蛋白19a,jun jun致癌基因,als2cr12肌萎缩侧索hspa5热休克70kda硬化2(青少年)蛋白5染色体区域候选物12,mapk14有丝分裂原激活蛋白,il10白细胞介素10激酶14,apex1apex核酸酶,txnrd1硫氧还蛋白还原酶1(多功能dna修复酶)1,nos2一氧化氮合酶2,timp1timp金属肽酶诱导型抑制剂1,casp9凋亡胱天蛋白酶9,xiap x连锁相关半胱氨酸凋亡肽酶,glg1高尔基糖蛋白1,epo促红细胞生成素,vegfa血管内皮eln弹性蛋白生长因子a,gdnf胶质细胞衍生的nfe2l2核因子
(类胡萝卜素

神经营养因子2)样2,slc6a3溶质载体家族6hspa4热休克70kda(神经递质4蛋白转运蛋白,多巴胺)成员3,apoe载脂蛋白e,psmb8蛋白酶体(蛋白酶体,macropain)亚基β型8,dctn1动力蛋白1,timp3timp金属肽酶抑制剂3,kifap3与驱动蛋白相关的slc1a1溶质载体家族1蛋白3(神经/上皮高亲和力谷氨酸转运蛋白,系统xag)成员1,smn2运动神经元ccnc细胞周期蛋白c 2的存活,着丝粒mpp4膜蛋白,stub1含stip1同源性和u

棕榈酰化的4盒蛋白1,als2淀粉样蛋白β(a4),prdx6过氧化物酶6前体蛋白,syp突触素,cabin1钙调神经磷酸酶结合蛋白1,casp1凋亡胱天蛋白酶1,gart磷酸核糖甘氨酰胺相关的半胱氨酸甲酰基转移酶、肽酶磷酸核糖基甘氨酰胺合酶、磷酸核糖氨基咪唑合酶,cdk5细胞周期蛋白依赖性激酶5,atxn3 ataxin 3,rtn4网织蛋白4,c1qb补体成分1q亚组分b链,vegfc神经生长因子,htt亨廷顿蛋白受体,park7帕金森病7,xdh黄嘌呤脱氢酶,gfap胶质原纤维酸性,map2微管相关蛋白2,cycs体细胞细胞色素c,fcgr3b igg的fc片段低亲和力iiib,ccs铜伴侣蛋白,ubl5泛素样5超氧化物歧化酶,mmp9基质金属肽酶,slc18a3溶质载体家族18 9((囊泡乙酰胆碱)成员3,trpm7瞬时受体hspb2热休克27kda潜在阳离子通道蛋白2亚家族m成员7,akt1v

akt鼠类胸腺瘤,derl1 der1样结构域家族病毒致癌基因同源物1成员1,ccl2趋化因子(c
‑‑
c基序),ngrn neugrin,神经突配体2增长相关的gsr谷胱甘肽还原酶,tppp3微管蛋白聚合促进蛋白家族成员3,apaf1凋亡肽酶,btbd10含btb(poz)结构域激活因子1的10,glud1谷氨酸,cxcr4趋化因子(c
‑‑
x
‑‑
c基序)脱氢酶1受体4,slc1a3溶质载体家族1,flt1 fms相关酪氨酸(神经胶质高亲和力谷氨酸转运蛋白)成员3激酶1,pon1对氧磷酶1,ar雄激素受体,lif白血病抑制因子,erbb3 v

erb

b2成红细胞白血病病毒致癌基因同源物3,lgals1半乳糖苷凝集素,cd44 cd44分子结合可溶1,tp53肿瘤蛋白p53,tlr3 toll样受体3,gria1谷氨酸受体,gapdh甘油醛
‑3‑
嗜离子性,ampa 1磷酸脱氢酶,grik1 des结蛋白嗜离子性谷氨酸受体红藻氨酸1,chat胆碱乙酰基转移酶,flt4 fms相关酪氨酸激酶4,chmp2b染色质修饰bag1 bcl2相关蛋白2b永生基因,mt3金属硫蛋白3,chrna4烟碱酸胆碱能受体α4,gss谷胱甘肽合酶,bak1 bcl2

拮抗剂/杀手1,kdr激酶插入结构域,gstp1谷胱甘肽s

转移酶受体(iii型π1受体酪氨酸激酶),ogg1 8

氧鸟嘌呤dna,il6白细胞介素6(干扰素,糖基化酶β2)。
[1105]
所述动物或细胞可包含1、2、3、4、5、6、7、8、9、10个或更多个编码与als相关的蛋白质的破坏染色体序列以及0、1、2、3、4、5、6、7、8、9、10个或更多个编码与als相关的破坏蛋白质的染色体整合序列。优选的与als相关的蛋白质包括sod1(超氧化物歧化酶1),als2(肌萎缩性侧索硬化2),fus(融合在肉瘤中),tardbp(tar dna结合蛋白),vagfa(血管内皮生长因子a),vagfb(血管内皮生长因子b)和vagfc(血管内皮生长因子c)及它们的任何组合。
[1106]
孤独症
[1107]
美国专利公开第20110023145号描述了锌指核酸酶用于遗传修饰与自闭症谱系障碍(asd)相关的细胞、动物和蛋白质的用途。自闭症谱系障碍(asd)是一类以社交互动和交流中的定性损伤以及行为、兴趣和活动的受限重复性和刻板模式为特征的病症。自闭症、阿斯伯格综合征(as)和未另外说明的普遍性发育障碍(pdd

nos)这三种病症是具有不同程度的严重程度、相关的智力功能和医学状况的一系列相同病症。asd是主要由遗传决定的病症,遗传率为约90%。
[1108]
美国专利公开第20110023145号包括可被应用于本发明系统的编码与asd相关的
蛋白质的任何染色体序列的编辑。通常基于与asd相关的蛋白质与asd发生率或适应症的实验关联来选择与asd相关的蛋白质。例如,相对于缺乏asd的群体,在具有asd的群体中,与asd相关的蛋白质的生产率或循环浓度可升高或降低。蛋白质水平的差异可使用蛋白质组学技术进行评估,所述蛋白质组学技术包括但不限于western印迹、免疫组织化学染色、酶联免疫吸附测定(elisa)和质谱法。或者,可通过使用基因组技术获得编码所述蛋白质的基因的基因表达谱来鉴定与asd相关的蛋白质,所述基因组技术包括但不限于dna微阵列分析、基因表达的系列分析(sage)和定量实时聚合酶链反应(q

pcr)。
[1109]
可能和与asd相关的蛋白质有关的疾病状态或病症的非限制性实例包括自闭症,阿斯伯格综合征(as),未另外说明的普遍性发育障碍(pdd

nos),雷特氏综合征(rett's syndrome),结节性硬化症,苯丙酮尿症,smith

lemli

opitz综合征和脆性x综合征。作为非限制性实例,与asd相关的蛋白质包括但不限于以下蛋白质:atp10c氨基磷脂

met met受体转运atp酶酪氨酸激酶(atp10c),bzrap1 mglur5(grm5)代谢型谷氨酸受体5(mglur5),cdh10钙粘蛋白

10,mglur6(grm6)代谢型谷氨酸受体6(mglur6),cdh9钙粘蛋白

9,nlgn1神经连接蛋白

1,cntn4接触蛋白

4,nlgn2神经连接蛋白

2,cntnap2接触蛋白相关的sema5a神经连接蛋白

3蛋白样2(cntnap2),dhcr7 7

去氢胆固醇,nlgn4x神经连接蛋白

4x

还原酶(dhcr7)连接的doc2a双c2样结构域,nlgn4y含神经连接蛋白

4y蛋白的α连接的dpp6二肽基,nlgn5神经连接蛋白

5氨基肽酶样蛋白6,en2engrailed 2(en2),nrcam神经元细胞粘附分子(nrcam),mdga2脆性x智力低下nrxn1神经毒素

11(mdga2),fmr2(aff2)af4/fmr2家族成员2,or4m2嗅觉受体(aff2)4m2,foxp2叉头盒蛋白p2,or4n4嗅觉受体(foxp2)4n4,fxr1脆性x智力oxtr催产素受体低下常染色体(oxtr)同源物1(fxr1),fxr2脆性x智力pah苯丙氨酸低下常染色体羟化酶(pah)同源物2(fxr2),gabra1γ

氨基丁酸pten磷酸酶和受体亚基α

1张力蛋白同源物(gabra1)(pten),gabra5gabaa(γ

氨基丁酸ptprz1受体型酸)受体α5酪氨酸蛋白亚基(gabra5)磷酸酶ζ(ptprz1),gabrb1γ

氨基丁酸reln reelin受体亚基β

1(gabrb1),gabrb3gabaa(γ

氨基丁酸rpl10 60s核糖体酸)受体β3亚基蛋白l10(gabrb3),gabrg1γ

氨基丁酸sema5a脑信号蛋白

5a受体亚基γ

1(sema5a)(gabrg1),hirip3hira相互作用蛋白3,sez6l2发作相关的6同源物(小鼠)样2,hoxa1同源盒蛋白hox

a1,shank3sh3和多个(hoxa1)锚蛋白重复结构域3(shank3),il6白细胞介素

6,shbzrap1sh3和多个锚蛋白重复结构域3(shbzrap1),lamb1层粘连蛋白亚基β

1,slc6a4血清素转运蛋白(lamb1)转运蛋白(sert),mapk3有丝分裂原激活的蛋白,tas2r1味觉受体激酶3 2型成员1,tas2r1 maz myc相关的锌指tsc1结节性硬化蛋白蛋白1,mdga2含mam结构域的tsc2结节性硬化糖基磷脂酰肌醇蛋白2锚2(mdga2),mecp2甲基cpg结合ube3a泛素蛋白2(mecp2)连接酶e3a(ube3a)mecp2甲基cpg结合wnt2无翼型蛋白2(mecp2)mmtv整合位点家族成员2(wnt2)。
[1110]
其染色体序列被编辑的与asd相关的蛋白质的身份可以并且将会改变。在优选的实施方案中,其染色体序列被编辑的与asd相关的蛋白质可以是由bzrap1基因编码的苯并二氮杂卓受体(外围)相关蛋白1(bzrap1),由aff2基因编码的af4/fmr2家族成员2蛋白(aff2)(也称为mfr2),由fxr1基因编码的脆性x智力低下常染色体同源物1蛋白(fxr1),由fxr2基因编码的脆性x智力低下常染色体同源物2蛋白(fxr2),由mdga2基因编码的包含mam结构域的糖基磷脂酰肌醇锚2蛋白(mdga2),由mecp2基因编码的甲基cpg结合蛋白2(mecp2),由mglur5

1基因编码的代谢型谷氨酸受体5(mglur5)(也称为grm5),由nrxn1基因
编码的轴突蛋白1蛋白,或由sema5a基因编码的脑信号蛋白

5a蛋白(sema5a)。在一个示例性的实施方案中,基因修饰的动物是大鼠,并且编码与asd相关的蛋白质的经编辑的染色体序列如下所列:bzrap1苯二氮杂卓受体xm_002727789,(外围)相关的xm_213427,蛋白质1(bzrap1)xm_002724533,xm_001081125aff2(fmr2)af4/fmr2家族成员2xm_219832,(aff2)xm_001054673fxr1脆性x智力nm_001012179低下,常染色体同源物1(fxr1)fxr2脆性x智力nm_001100647低下,常染色体同源物2(fxr2),mdga2含mam结构域的nm_199269糖基膦酰肌醇锚2(mdga2),mecp2甲基cpg结合nm_022673蛋白2(mecp2),mglur5代谢型谷氨酸nm_017012(grm5)受体5(mglur5),nrxn1轴突蛋白

1nm_021767,sema5a脑信号蛋白

5a(sema5a)nm_001107659。
[1111]
三核苷酸重复扩增病症
[1112]
美国专利公开第20110016540号描述了锌指核酸酶在遗传修饰与三核苷酸重复扩增病症相关的细胞、动物和蛋白质中的用途。三核苷酸重复扩增病症是复杂的进行性病症,其涉及发育神经生物学并且通常会影响认知以及感觉运动功能。
[1113]
三核苷酸重复扩增蛋白是与患上三核苷酸重复扩增病症的易感性、三核苷酸重复扩增病症的存在、三核苷酸重复扩增病症的严重程度或它们的任何组合相关的多种蛋白质。三核苷酸重复序列扩增病症分为两类,由重复序列类型决定。最常见的重复序列是三联体cag,当存在于基因的编码区中时,它编码氨基酸谷氨酰胺(q)。因此,这些病症被称为多聚谷氨酰胺(polyq)病症并且包括以下疾病:亨廷顿病(hd);脊髓球肌萎缩症(sbma);脊髓小脑共济失调(sca类型1、2、3、6、7和17);和dentatorubro

pallidoluysian萎缩症(drpla)。其余的三核苷酸重复扩增病症不涉及cag三联体,或者cag三联体不在基因的编码区中,因此被称为非多聚谷氨酰胺病症。非多聚谷氨酰胺病症包括脆性x综合征(fraxa);脆性xe智力低下(fraxe);friedreich共济失调(frda);强直性肌营养不良(dm);和小脑共济失调(sca类型8和12)。
[1114]
通常基于与三核苷酸重复扩增病症相关的蛋白质与三核苷酸重复扩增病症的实验关联来选择与三核苷酸重复扩增病症相关的蛋白质。例如,相对于缺乏三核苷酸重复扩增病症的群体,在具有三核苷酸重复扩增病症的群体中,与三核苷酸重复扩增病症相关的蛋白质的生产率或循环浓度可升高或降低。蛋白质水平的差异可使用蛋白质组学技术进行评估,所述蛋白质组学技术包括但不限于western印迹、免疫组织化学染色、酶联免疫吸附测定(elisa)和质谱法。或者,可通过使用基因组技术获得编码所述蛋白质的基因的基因表达谱来鉴定与三核苷酸重复扩增病症相关的蛋白质,所述基因组技术包括但不限于dna微阵列分析、基因表达的系列分析(sage)和定量实时聚合酶链反应(q

pcr)。
[1115]
与三核苷酸重复扩增病症相关的蛋白质的非限制性实例包括ar(雄激素受体),fmr1(脆性x智力低下1),htt(亨廷顿蛋白),dmpk(营养不良性肌强直蛋白激酶),fxn(共济蛋白),atxn2(ataxin 2),atn1(肌萎缩蛋白1),fen1(flap结构特异性核酸内切酶1),tnrc6a(包含三核苷酸重复序列的6a),pabpn1(聚(a)结合蛋白,核1),jph3(亲联蛋白3),med15(介体复合物亚基15),atxn1(ataxin 1),atxn3(ataxin 3),tbp(tata盒结合蛋白),cacna1a(钙通道,电压依赖性,p/q型,α1a亚基),atxn80s(atxn8相反链(非蛋白编码)),ppp2r2b(蛋白磷酸酶2,调节亚基b,β),atxn7(ataxin 7),tnrc6b(含三核苷酸重复序列的6b),tnrc6c(含三核苷酸重复序列的6c),celf3(cugbp,elav样家族成员3),mab21l1(mab

21

样1(秀丽隐杆线虫)),msh2(muts同源物2,结肠癌,非息肉病1型(大肠杆菌)),tmem185a(跨膜蛋白185a),six5(six同源盒5),cnpy3(canopy 3同源物(斑马鱼)),fraxe(脆性位点,叶酸类型,稀有,fra(x)(q28)e),gnb2(鸟嘌呤核苷酸结合蛋白(g蛋白),β多肽2),rpl14(核糖体蛋白l14),atxn8(ataxin 8),insr(胰岛素受体),ttr(转甲状腺素蛋白),ep400(e1a结合蛋白p400),gigyf2(与grb10相互作用的gyf蛋白2),ogg1(8

氧代鸟嘌呤dna糖基化酶),stc1(斯钙素1),cndp1(肌肽二肽酶1(金属肽酶m20家族)),c10orf2(染色体10开放阅读框2),maml3主导控制样3(果蝇),dkc1(先天性角化不良1,角化不良蛋白),paxip1(pax相互作用(与转录激活结构域)蛋白1),cask(钙/钙调蛋白依赖性丝氨酸蛋白激酶(maguk家族)),mapt(微管相关蛋白τ),sp1(sp1转录因子),polg(聚合酶(dna定向),γ),aff2(af4/fmr2家族,成员2),thbs1(血小板反应蛋白1),tp53(肿瘤蛋白p53),esr1(雌激素受体1),cggbp1(cgg三联体重复结合蛋白1),abt1(基础转录激活子1),klk3(激肽释放酶相关肽酶3),prnp(朊病毒蛋白),jun(jun致癌基因),kcnn3(钾中间体/小电导钙激活通道,亚家族n,成员3),bax(与bcl2相关的x蛋白),fraxa(脆性位点,叶酸类型,稀有,fra(x)(q27.3)a(大兰花病,智力低下)),kbtbd10(含kelch重复序列和btb(poz)结构域的10),mbnl1(肌盲样(果蝇)),rad51(rad51同源物(reca同源物,大肠杆菌)(酿酒酵母)),ncoa3(核受体共激活子3),erda1(扩展重复结构域,cag/ctg 1),tsc1(结节性硬化症1),comp(软骨寡聚基质蛋白),gclc(谷氨酸

半胱氨酸连接酶,催化亚基),rrad(与糖尿病相关的ras相关),msh3(muts同源物3(大肠杆菌)),drd2(多巴胺受体d2),cd44(cd44分子(印度血型)),ctcf(ccctc结合因子(锌指蛋白)),ccnd1(细胞周期蛋白d1),clspn(claspin同源物(非洲爪蟾(xenopus laevis))),mef2a(肌细胞增强因子2a),ptpru(蛋白酪氨酸磷酸酶,受体类型,u),gapdh(甘油醛
‑3‑
磷酸脱氢酶),trim22(含三重基序的22),wt1(wilms肿瘤1),ahr(芳烃受体),gpx1(谷胱甘肽过氧化物酶1),tpmt(硫嘌呤s

甲基转移酶),ndp(norrie病(假神经胶质瘤)),arx(无芒相关同源盒),mus81(mus81核酸内切酶同源物(酿酒酵母)),tyr(酪氨酸酶(眼皮肤白化病ia)),egr1(早期生长反应1),ung(尿嘧啶

dna糖基化酶),numbl(numb同源物(果蝇)样),fabp2(脂肪酸结合蛋白2,肠),en2(engrailed同源盒2),crygc(结晶蛋白,γc),srp14(信号识别粒子14kda(同源alu rna结合蛋白)),crygb(结晶蛋白,γb),pdcd1(程序性细胞死亡1),hoxa1(同源盒a1),atxn2l(ataxin 2样),pms2(pms2减数分裂后分离增加2(酿酒酵母)),gla(半乳糖苷酶,α),cbl(cas

br

m(鼠类)亲嗜性逆转录病毒转化序列),fth1(铁蛋白,重多肽1),il12rb2(白细胞介素12受体,β2),otx2(邻牙本质同源盒2),hoxa5(同源盒a5),polg2(聚合酶(dna定向),γ2,辅助亚基),dlx2(无远端同源盒2),sirpa(信号调控蛋白α),otx1(邻牙本质同源盒1),ahrr(芳基烃受体阻遏子),manf(中脑星形胶质细胞衍生的神经营养因子),tmem158(跨膜蛋白158(基因/假基因))和ensg00000078687。
[1116]
优选的与三核苷酸重复扩增病症相关的蛋白质包括htt(亨廷顿蛋白)、ar(雄激素受体)、fxn(共济蛋白)、atxn3(ataxin)、atxn1(ataxin)、atxn2(ataxin)、atxn7(ataxin)、atxn10(ataxin)、dmpk(营养不良性肌强直蛋白激酶)、atn1(肌萎缩蛋白1)、cbp(creb结合蛋白)、vldlr(极低密度脂蛋白受体)及它们的任何组合。
[1117]
治疗听觉疾病
[1118]
本发明还预期将所述系统递送至一只或两只耳朵。
[1119]
研究人员正在研究是否可使用基因疗法来辅助目前的耳聋治疗,即耳蜗植入物。
耳聋通常是由于无法将信号传递到听觉神经元的毛细胞丧失或损坏引起的。在这些情况下,耳蜗植入物可用于响应声音并将电信号传输到神经细胞。但是,由于受损的毛细胞释放出的生长因子较少,因此这些神经元通常会退化并从耳蜗回缩。
[1120]
美国专利申请20120328580描述了例如通过使用注射器(例如单剂量注射器)将药物组合物注射入耳内(例如耳廓施用),例如注射入耳蜗的内腔(例如,中阶、前庭阶和鼓阶)。例如,本文所述的一种或多种化合物可通过鼓室内注射(例如至中耳)和/或注射至外耳、中耳和/或内耳来施用。这样的方法在本领域中是常规使用的,例如,用于将类固醇和抗生素施用于人耳。注射可例如通过耳圆窗或通过耳蜗胶囊进行。其他内耳施用方法在本领域中是已知的(参见例如salt和plontke,drug discovery today,10:1299

1306,2005)。
[1121]
在另一种施用模式中,药物组合物可经由导管或泵原位施用。导管或泵可例如将药物组合物引导到耳蜗内腔或耳圆窗和/或结肠内腔中。mckenna等人(美国公开第2006/0030837号)和jacobsen等人(美国专利第7,206,639号)描述了适合于将本文所述的一种或多种化合物施用于耳(例如人耳)的示例性药物递送装置和方法。在一些实施方案中,可在外科手术过程中将导管或泵定位在例如患者的耳(例如,外耳、中耳和/或内耳)中。在一些实施方案中,可将导管或泵定位在例如患者的耳(例如,外耳、中耳和/或内耳)中,而不需要外科手术。
[1122]
可替代地或另外地,本文所述的一种或多种化合物可与佩戴在外耳中的机械装置例如耳蜗植入物或助听器组合施用。edge等人(美国公开第2007/0093878号)描述了适用于本发明的示例性耳蜗植入物。
[1123]
在一些实施方案中,上述施用模式可以任何顺序组合并且可同时或散布。
[1124]
可替代地或另外地,本发明可根据食品和药物管理局批准的任何方法来施用,例如,如cder数据标准手册,版本号004(其可在fda.give/cder/dsm/drg/drg00301.htm获得)中所述。
[1125]
通常,在美国专利申请20120328580中描述的细胞治疗方法可用于在体外促进细胞至或向内耳的成熟细胞类型(例如毛细胞)的完全或部分分化。然后可将由这种方法得到的细胞移植或植入需要这种治疗的患者中。下文描述了实践这些方法所需的细胞培养方法,包括鉴定和选择合适细胞类型的方法,促进所选细胞的完全或部分分化的方法,鉴定完全或部分分化的细胞类型的方法,以及植入完全或部分分化的细胞的方法。
[1126]
适用于本发明的细胞包括但不限于能够完全或部分分化为内耳成熟细胞的细胞,例如毛细胞(例如内和/或外毛细胞),例如当与例如本文所述的一种或多种化合物体外接触时。能够分化为毛细胞的示例性细胞包括但不限于干细胞(例如,内耳干细胞、成年干细胞、骨髓源干细胞、胚胎干细胞、间充质干细胞、皮肤干细胞、ips细胞和脂肪衍生的干细胞),祖细胞(例如内耳祖细胞),支持细胞(例如deiters细胞、支柱细胞、内指骨细胞、顶盖细胞和hensen细胞)和/或生殖细胞。li等人(美国公开第2005/0287127号)和li等人(美国专利系列号11/953,797)描述了使用干细胞代替内耳感觉细胞。使用骨髓源干细胞代替内耳感觉细胞描述于edge等人,pct/us2007/084654中。ips细胞描述于例如takahashi等人,cell,第131卷,第5期,第861

872页(2007);takahashi和yamanaka,cell 126,663

76(2006);okita等人,nature 448,260

262(2007);yu,j.等人,science 318(5858):1917

1920(2007);nakagawa等人,nat.biotechnol.26:101

106(2008);以及zaehres和scholer,
cell 131(5):834

835(2007)。可通过分析(例如,定性或定量)一种或多种组织特异性基因的存在来鉴定此类合适的细胞。例如,可通过检测一种或多种组织特异性基因的蛋白质产物来检测基因表达。蛋白质检测技术涉及使用针对适当抗原的抗体对蛋白质染色(例如,使用细胞提取物或全细胞)。在这种情况下,适当的抗原是组织特异性基因表达的蛋白质产物。尽管原则上可标记第一抗体(即与抗原结合的抗体),但更常见(并改善可视化)的是使用针对第一抗体的第二抗体(例如抗igg)。将该第二抗体与荧光染料或用于比色反应的适当酶或金珠(用于电子显微镜)或生物素

抗生物素蛋白系统缀合,以便可识别初级抗体的位置,从而识别抗原。
[1127]
本发明的系统可通过将药物组合物直接施用于外耳而递送至耳部,所述组合物由美国公开申请20110142917改进。在一些实施方案中,将药物组合物施用于耳道。递送至耳部也可称为听觉或耳部递送。
[1128]
在一些实施方案中,本发明的rna分子以脂质体或lipofectin制剂等形式递送,并且可通过本领域技术人员众所周知的方法制备。这些方法描述于例如美国专利第5,593,972号、第5,589,466号和第5,580,859号,所述文件通过引用并入本文。
[1129]
已经开发了专门针对增强和改善sirna进入哺乳动物细胞的递送的递送系统(参见例如shen等人,febs let.2003,539:111

114;xia等人,nat.biotech.2002,20:1006

1010;reich等人,mol.vision.2003,9:210

216;sorensen等人,j.mol.biol.2003,327:761

766;lewis等人,nat.gen.2002,32:107

108;以及simeoni等人,nar 2003,31,11:2717

2724)并且可应用于本发明。sirna最近已成功地用于抑制灵长类动物中的基因表达(参见例如tolentino等人,retina 24(4):660,其也可应用于本发明。
[1130]
qi等人公开了通过新颖的蛋白质递送技术通过完整圆窗有效地将sirna转染到内耳的方法,所述蛋白质递送技术可应用于本发明的核酸靶向系统(参见例如qi等人,gene therapy(2013),1

9)。特别是,可通过完整圆窗渗透将cy3标记的sirna转染到内耳细胞(包括内和外毛细胞、壶腹嵴、椭圆囊斑和球囊斑)中的tat双链rna结合结构域(tat

drbd)成功地用于体内递送双链sirna以治疗各种内耳疾病和保持听力功能。可考虑将约40μl的10mm rna作为施用于耳朵的剂量。
[1131]
根据rejali等人(hear res.2007年6月;228(1

2):180

7),可通过很好地保留螺旋神经节神经元来改善耳蜗植入物功能,螺旋神经节神经元是植入物的电刺激靶标并且脑源性神经营养因子(bdnf)先前已被证明可增强实验性致聋耳中的螺旋神经节的存活率。rejali等人测试了耳蜗植入物电极的改良设计,其中包括由带有bdnf基因插入物的病毒载体转导的成纤维细胞涂层。为了完成这种类型的离体基因转移,rejali等人用带有bdnf基因盒插入物的腺病毒转导豚鼠成纤维细胞,并确定这些细胞分泌bdnf并且然后经由琼脂糖凝胶将bdnf分泌细胞附接到耳蜗植入物电极,并将所述电极植入鼓阶中。rejali等人确定,与对照电极相比,bdnf表达电极在植入48天后能够在耳蜗底转中保留显著更多的螺旋神经节神经元,并证明了将耳蜗植入疗法与离体基因转移结合以增强螺旋神经节神经元存活的可行性。这样的系统可应用于本发明的核酸靶向系统以递送至耳朵。
[1132]
mukherjea等人(antioxidants&redox signaling,第13卷,第5期,2010)记录了使用短干扰(si)rna敲低nox3消除了顺铂的耳毒性,如通过保护ohc免受损害和降低听觉脑干反应(abr)阈值变化来证明。向大鼠施用不同剂量的sinox3(0.3、0.6和0.9μg),并通过实时
rt

pcr评价nox3的表达。与经鼓室施用加扰的sirna或未经处理的耳蜗相比,使用的最低剂量的nox3 sirna(0.3μg)没有显示出对nox3mrna的任何抑制作用。但是,与对照加扰的sirna相比,更高剂量的nox3 sirna(0.6和0.9μg)的施用降低了nox3表达。这样的系统可以供施用于人类的约2mg至约4mg的crispr cas的剂量应用于本发明的系统以经鼓室施用。
[1133]
jung等人(molecular therapy,第21卷第4期,834

841,2013年4月)证明,在应用sirna后,椭圆囊中的hes5水平下降,并且这些椭圆囊中的毛细胞数量明显多于对照治疗。数据表明,sirna技术可用于诱导内耳的修复和再生,并且notch信号通路是特定基因表达抑制的潜在有用靶标。jung等人将通过将无菌生理盐水添加至冻干的sirna制备的2μl体积的8μg hes5 sirna注射到耳朵的前庭上皮。这样的系统可以供施用于人类的约1至约30mg的crispr cas的剂量应用于本发明的核酸靶向系统以施用于耳朵的前庭上皮。
[1134]
非分裂细胞(神经元和肌肉)中的基因靶向
[1135]
非分裂(尤其是非分裂、完全分化)的细胞类型为基因靶向或基因组工程带来了问题,例如,因为同源重组(hr)通常在g1细胞周期阶段受到抑制。但是,在研究细胞控制正常dna修复系统的机制时,durocher发现了一个以前未知的开关,该开关使hr在非分裂细胞中保持“关闭”状态,并设计了一种策略来重新打开该开关。orthwein等人(daniel durocher实验室,mount sinai hospital,ottawa,canada)最近报道(nature 16142,在线出版于2015年12月9日)显示,可解除对hr的抑制作用,并且在肾脏(293t)和骨肉瘤(u2os)细胞中成功完成了基因靶向。已知肿瘤抑制因子brca1、palb2和brac2可通过hr促进dna dsb修复。他们发现,brca1与palb2

brac2的复合物的形成受palb2上一个泛素位点的控制,从而使e3泛素连接酶对该位点起作用。这种e3泛素连接酶由keap1(与palb2相互作用的蛋白)与cullin

3(cul3)

rbx1的复合物组成。palb2泛素化会抑制其与brca1的相互作用,并被去泛素化酶usp11抵消,后者本身受细胞周期控制。brca1

palb2相互作用的恢复与dna末端切除的激活相结合足以在g1中诱导同源重组,如通过多种方法所测量,所述方法包括针对usp11或keap1的基于crispr

cas9的基因靶向测定法(已从px459载体表达)。但是,当使用keap1耗尽或palb2

kr突变体的表达在具有切除能力的g1细胞中恢复brca1

palb2相互作用时,检测到基因靶向事件的稳健增加。
[1136]
因此,在一些实施方案中,优选细胞中hr的再活化,特别是非分裂、完全分化的细胞类型。在一些实施方案中,在一些实施方案中优选促进brca1

palb2相互作用。在一些实施方案中,靶细胞是非分裂细胞。在一些实施方案中,靶细胞是神经元或肌肉细胞。在一些实施方案中,靶细胞在体内被靶向。在一些实施方案中,细胞在g1中并且hr被抑制。在一些实施方案中,优选使用keap1耗尽,例如抑制keap1活性的表达。可通过sirna来实现keap1耗尽,例如如orthwein等人中所示。或者,优选palb2

kr突变体的表达(在brca1相互作用结构域中缺少所有八个lys残基),无论是与keap1耗尽结合还是单独表达。palb2

kr与brca1相互作用都与细胞周期位置无关。因此,在一些实施方案中优选促进或恢复brca1

palb2相互作用,尤其是在g1细胞中,尤其是在靶细胞是非分裂的,或者在去除和恢复(离体基因靶向)有问题的情况下,例如神经元或肌肉细胞。keap1sirna可获自thermofischer。在一些实施方案中,可将brca1

palb2复合物递送至g1细胞。在一些实施方案中,可例如通过增加去泛素化酶usp11的表达来促进palb2去泛素化,因此可设想可提供构建体以促进或上调去泛素化酶usp11的表达或活性。
[1137]
治疗眼部疾病
[1138]
本发明还预期将所述系统递送至一只或两只眼睛。
[1139]
在本发明的特定实施方案中,所述系统可用于校正由若干遗传突变引起的眼缺陷,所述遗传突变进一步描述于genetic diseases of the eye,第二版,由elias i.traboulsi编辑,oxford university press,2012中。
[1140]
在一些实施方案中,待治疗或靶向的疾患是眼部病症。在一些实施方案中,所述眼部病症可包括青光眼。在一些实施方案中,所述眼部病症包括视网膜退行性疾病。在一些实施方案中,所述视网膜退行性疾病选自stargardt病、bardet

biedl综合征、best病、蓝锥单色症(blue cone monochromacy)、脉络膜炎、视锥视杆营养不良、先天性静止性夜盲症、增强s锥体综合征、青少年x连锁视网膜劈裂症、莱伯先天性黑蒙、malattia leventinesse、norrie病或x连锁家族性渗出性玻璃体视网膜病、pattern营养不良、sorsby营养不良、usher综合征、色素性视网膜炎、色盲或黄斑营养不良或变性、色素性视网膜炎、色盲和年龄相关性黄斑变性。在一些实施方案中,视网膜退行性疾病是莱伯先天性黑蒙(lca)或色素性视网膜炎。在一些实施方案中,所述系统任选地经由玻璃体内注射或视网膜下注射被递送至眼睛。
[1141]
对于向眼睛施用,特别优选慢病毒载体,特别是马传染性贫血病毒(eiav)。
[1142]
在另一个实施方案中,还考虑了基于马传染性贫血病毒(eiav)的最小的非灵长类慢病毒载体,特别是用于眼基因疗法(参见例如balagaan,j gene med 2006;8:275

285,在线出版于2005年11月21日,wiley interscience(www.interscience.wiley.com).doi:10.1002/jgm.845)。预期载体具有驱动靶基因表达的巨细胞病毒(cmv)启动子。前房内注射、视网膜下注射、眼内注射和玻璃体内注射都可考虑(参见例如balagaan,j gene med 2006;8:275

285,2005年11月21日,在线出版于wiley interscience(www.interscience.wiley.com).doi:10.1002/jgm.845)。眼内注射可在手术显微镜的帮助下进行。对于视网膜下和玻璃体内注射,可通过轻柔的数字化压力使眼睛脱垂,并使用由一滴耦合介质溶液滴在角膜上的隐形眼镜系统使眼底可视化,所述角膜上覆盖有玻璃显微镜滑动盖玻片。对于视网膜下注射,安装在5

μl hamilton注射器上的10mm 34号针的尖端可在直视下通过赤道上巩膜切向向后极前进,直到在视网膜下空间可见针孔。然后,可注射2μl的载体悬浮液以产生上方泡状视网膜脱离,从而确认视网膜下载体施用。这种方法产生了自动密封硬化,通常在手术后48小时内,载体悬浮液会保留在视网膜下空间中,直到被rpe吸收为止。可在下半球重复此过程,以产生下视网膜脱离。该技术导致约70%的神经感觉视网膜和rpe暴露于载体悬浮液。对于玻璃体内注射,可将针尖穿过巩膜推进至角膜巩膜缘后1mm,并将2μl载体悬浮液注射到玻璃体腔中。对于前房内注射,针尖可通过角膜巩膜角膜缘穿刺术前进,直接朝向角膜中央,并且可注射2μl载体悬浮液。对于前房内注射,针尖可通过角膜巩膜角膜缘穿刺术前进,直接朝向角膜中央,并且可注射2μl载体悬浮液。这些载体可以1.0

1.4
×
10
10
或1.0

1.4
×
109转导单位(tu)/ml的滴度注射。
[1143]
在另一个实施方案中,还考虑了基于马传染性贫血病毒的慢病毒基因治疗载体该载体表达血管抑制蛋白内皮素和血管抑制素,其经由视网膜下注射递送以治疗年龄相关性黄斑变性的网状形式(参见例如binley等人,human gene therapy 23:980

991(2012年9月))。可对本发明的系统修饰这样的载体。每只眼睛都可用
进行处理,剂量为每只眼睛1.1
×
105转导单位(tu/眼睛),总体积为100μl。
[1144]
在另一个实施方案中,可考虑缺失e1、部分e3、e4的腺病毒载体以递送至眼睛。对28名晚期新血管性年龄相关性黄斑变性(amd)患者给予表达人色素上皮衍生因子(adpedf.ll)的缺失e1、部分e3、e4的腺病毒载体的玻璃体内单次注射(参见例如campochiaro等人,human gene therapy 17:167

176(2006年2月))。研究了范围从106至109.5粒子单位(pu)的剂量,并且不存在与adpedf.ii相关的严重不良事件和剂量限制性毒性(参见例如campochiaro等人,human gene therapy 17:167

176(2006年2月))。腺病毒载体介导的眼基因转移似乎是治疗眼部病症治疗的可行方法并且可应用于所述系统。
[1145]
在另一个实施方案中,rxi pharmaceuticals的系统可用于/和或适于将所述系统递送至眼睛。在这种系统中,玻璃体内单次施用3μg sd

rxrna可导致ppib mrna水平的序列特异性降低持续14天。可将系统应用于本发明的核酸靶向系统,考虑向人类施用约3至20mg的crispr剂量。
[1146]
millington

ward等人(molecular therapy,第19卷第4期,642

649,2011年4月)描述了腺相关病毒(aav)载体,该载体可递送基于rna干扰(rnai)的视紫红质抑制因子和经密码子修饰的视紫红质替代基因,其抵抗由于在rnai目标位点简并位置上的核苷酸改变的抑制作用。millington

ward等人将6.0
×
108vp或1.8
×
10
10
vp aav的注射液注入经视网膜下注射到眼睛中。可将millington

ward等人的aav载体应用于本发明的系统,考虑施用于人类的约2
×
10
11
至约6
×
10
13
vp的剂量。
[1147]
dalkara等人(sci transl med 5,189ra76(2013))还涉及体内定向进化以形成一种aav载体,该载体在向眼睛的玻璃体液中无害注射后,可在整个视网膜中递送野生型的缺陷基因。dalkara描述了7mer肽展示文库和由来自aav1、2、4、5、6、8和9的cap基因的dna改组构建的aav文库。包装了在cag或rho启动子下表达gfp的rcaav文库和raav载体并且通过定量pcr获得抗脱氧核糖核酸酶的基因组滴度。合并文库,并进行两轮进化,每轮由初始文库多样化和接着三个体内选择步骤组成。在每个这样的步骤中,向p30rho

gfp小鼠玻璃体内注射2ml碘克沙醇纯化的磷酸盐缓冲液(pbs)透析的文库,其基因组滴度为约1
×
10
12
vg/ml。dalkara等人的aav载体可应用于本发明的核酸靶向系统,考虑施用于人类的约1
×
10
15
至约1
×
10
16
vg/ml的剂量。
[1148]
在一个特定的实施方案中,视紫红质基因可被靶向用于治疗色素性视网膜炎(rp),其中转让给sangamo biosciences公司的美国专利公开第20120204282号的系统可根据本发明的系统进行修饰。
[1149]
在另一个实施方案中,转让给cellectis的美国专利公开第20130183282号的方法,其涉及从人视紫红质基因切割靶序列的方法,也可被修改为本发明的核酸靶向系统。
[1150]
转让给academia sinica的美国专利公开第20130202678号涉及治疗视网膜病和威胁视力的眼科病症的方法,其涉及将puf

a基因(其在视网膜神经节和眼组织的色素细胞中表达并显示出独特的抗凋亡活性)递送到眼睛中的视网膜下或玻璃体内空间。特别地,理想的靶标是zgc:193933、prdm1a、spata2、tex10、rbb4、ddx3、zp2.2、blimp

1和htra2,所有这些都可被本发明的核酸靶向系统靶向。
[1151]
wu(cell stem cell,13:659

62,2013)设计了一种指导rna,其导致cas9进行单个碱基对突变,从而引起小鼠白内障,在其中诱导dna切割。然后,使用给予受精卵修复机制的
其他野生型等位基因或寡核苷酸,校正了破坏等位基因的序列并校正了突变小鼠中引起白内障的遗传缺陷。
[1152]
美国专利公开第20120159653号描述了锌指核酸酶用于遗传修饰与黄斑变性(md)相关的细胞、动物和蛋白质的用途。黄斑变性(md)是老年人视力障碍的主要原因,但也是儿童期疾病如stargardt病、sorsby眼底病和致命的儿童神经退行性疾病(发病年龄低至婴儿时期)的标志性症状。由于视网膜受损,黄斑变性导致视野中央(黄斑)的视力丧失。当前存在的动物模型不能概括所述疾病的主要特征,正如在人类中观察到的那样。包含编码与md相关的蛋白质的突变基因的可用动物模型也会产生高度可变的表型,从而使人类疾病的翻译和治疗发展成为问题。
[1153]
美国专利公开第20120159653号的一个方面涉及对编码与md相关的蛋白质的任何染色体序列的编辑,其可应用于本发明的核酸靶向系统。通常基于与md相关的蛋白质与md病症的实验关联来选择与md相关的蛋白质。例如,相对于缺乏md病症的群体,在具有md病症的群体中,与md相关的蛋白质的生产率或循环浓度可升高或降低。蛋白质水平的差异可使用蛋白质组学技术进行评估,所述蛋白质组学技术包括但不限于western印迹、免疫组织化学染色、酶联免疫吸附测定(elisa)和质谱法。或者,可通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定与md相关的蛋白质,所述基因组技术包括但不限于dna微阵列分析、基因表达的系列分析(sage)和定量实时聚合酶链反应(q

pcr)。
[1154]
作为非限制性实例,与md相关的蛋白质包括但不限于以下蛋白质:(abca4)atp结合盒亚家族a(abc1)成员4,achm1色盲(视杆单色性)1,apoe载脂蛋白e(apoe),c1qtnf5(ctrp5)c1q和肿瘤坏死因子相关蛋白5(c1qtnf5),c2补体成分2(c2),c3补体成分(c3),ccl2趋化因子(c

c基序)配体2(ccl2),ccr2趋化因子(c

c基序)受体2(ccr2),cd36分化簇36,cfb补体因子b,cfh补体因子cfh h,cfhr1补体因子h相关1,cfhr3补体因子h相关3,cngb3环状核苷酸门控通道β3,cp铜蓝蛋白(cp),crp c反应蛋白(crp),cst3胱抑素c或胱抑素3(cst3),ctsd组织蛋白酶d(ctsd),cx3cr1趋化因子(c

x3

c基序)受体1,elovl4极长链脂肪酸的延伸4,ercc6切除修复交叉互补啮齿动物修复缺陷互补组6,fbln5腓骨蛋白

5,fbln5腓骨蛋白5,fbln6腓骨蛋白6,fscn2fascin(fscn2),hmcn1半中心蛋白1,hmcn1半中心蛋白1,htra1htra丝氨酸肽酶1(htra1),htra1htra丝氨酸肽酶1,il

6白细胞介素6,il

8白细胞介素8,loc387715假设蛋白,plekha1含普利克底物蛋白同源结构域的家族a成员1(plekha1),prom1prominin 1(prom1或cd133),prph2外周蛋白

2,rpgr色素性视网膜炎gtp酶调控剂,serping1serpin肽酶抑制剂进化枝g成员1(c1

抑制剂),tcof1糖蜜,timp3金属蛋白酶抑制剂3(timp3),tlr3toll样受体3。
[1155]
与其染色体序列被编辑的md相关的蛋白质的身份可以并且将会改变。在优选的实施方案中,其染色体序列被编辑的与md相关的蛋白质可以是由abcr基因编码的atp结合盒亚家族a(abc1)成员4蛋白(abca4),由apoe基因编码的载脂蛋白e蛋白(apoe),由ccl2基因编码的趋化因子(c

c基序)配体2蛋白(ccl2),由ccr2基因编码的趋化因子(c

c基序)受体2蛋白(ccr2),由cp基因编码的铜蓝蛋白(cp),由ctsd基因编码的组织蛋白酶d蛋白(ctsd),或由timp3基因编码的金属蛋白酶抑制剂3蛋白(timp3)。在一个示例性的实施方案中,遗传修饰的动物是大鼠,并且编码与md相关的蛋白质的编辑的染色体序列可以是:(abca4)atp结合盒nm_000350亚家族a(abc1)成员4,apoe载脂蛋白e nm_138828(apoe),ccl2趋化因子
(c

c nm_031530基序)配体2(ccl2),ccr2趋化因子(c

c nm_021866基序)受体2(ccr2),cp铜蓝蛋白(cp)nm_012532,ctsd组织蛋白酶d(ctsd)nm_134334,timp3金属蛋白酶nm_012886抑制剂3(timp3)。动物或细胞可包含1、2、3、4、5、6、7个或更多个编码与md相关的蛋白质的破坏的染色体序列和0、1、2、3、4、5、6、7个或更多个编码所述与md相关的破坏蛋白质的染色体整合序列。
[1156]
可修饰经编辑或整合的染色体序列以编码与md相关的改变的蛋白质。md相关的染色体序列中的若干突变已与md相关联。与md相关的染色体序列中的突变的非限制性实例包括可能引起md的突变,包括:在abcr蛋白中,e471k(即第471位的谷氨酸变为赖氨酸),r1129l(即第1129位的精氨酸变为亮氨酸),t1428m(即第1428位的苏氨酸变为甲硫氨酸),r1517s(即第1517位的精氨酸变为丝氨酸),i1562t(即第1562位的异亮氨酸变为苏氨酸)和g1578r(即第1578位的甘氨酸变为精氨酸);在ccr2蛋白中,v64i(即第192位的缬氨酸变为异亮氨酸);在cp蛋白中,g969b(即第969位的甘氨酸变为天冬酰胺或天冬氨酸);在timp3蛋白中,s156c(即第156位的丝氨酸变为半胱氨酸),g166c(即第166位的甘氨酸变为半胱氨酸),g167c(即第167位的甘氨酸变为半胱氨酸),y168c(即第168位的酪氨酸变为半胱氨酸),s170c(即第170位的丝氨酸变为半胱氨酸),y172c(即第172位的酪氨酸变为半胱氨酸)和s181c(即第181位的丝氨酸变为半胱氨酸)。md相关基因中遗传变异与疾病的其他关联是本领域已知的。
[1157]
所述系统可用于校正由常染色体显性基因导致的疾病。例如,crispr/cas9被用于去除引起眼睛受体损失的常染色体显性基因。bakondi,b.等人,in vivo crispr/cas9 gene editing corrects retinal dystrophy in the s334ter

3 rat model of autosomal dominant retinitis pigmentosa.molecular therapy,2015;doi:10.1038/mt.2015.220。
[1158]
治疗循环系统和肌肉疾病
[1159]
本发明还考虑了将本文所述的系统例如递送至心脏。对于心脏,优选心肌嗜性腺相关病毒(aavm),特别是在心脏中显示优先基因转移的aavm41(参见例如lin

yanga等人,pnas,2009年3月10日,第106卷,第10期)。施用可以是全身性的或局部的。预期约1

10
×
10
14
个载体基因组的剂量用于全身性施用。还参见例如eulalio等人,(2012)nature 492:376和somasuntharam等人,(2013)biomaterials 34:7790。
[1160]
例如,美国专利公开第20110023139号描述了锌指核酸酶用于遗传修饰与心血管疾病相关的细胞、动物和蛋白质的用途。心血管疾病通常包括高血压、心脏病发作、心力衰竭以及中风和tia。与心血管疾病有关的任何染色体序列或由与心血管疾病有关的任何染色体序列编码的蛋白质可用于本公开中描述的方法中。通常基于与心血管有关的蛋白质与心血管疾病发展的实验关联来选择与心血管有关的蛋白质。例如,相对于缺乏心血管病症的群体,在具有心血管病症的群体中,与心血管有关的蛋白质的生产率或循环浓度可升高或降低。蛋白质水平的差异可使用蛋白质组学技术进行评估,所述蛋白质组学技术包括但不限于western印迹、免疫组织化学染色、酶联免疫吸附测定(elisa)和质谱法。或者,可通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定与心血管有关的蛋白质,所述基因组技术包括但不限于dna微阵列分析、基因表达的系列分析(sage)和定量实时聚合酶链反应(q

pcr)。
[1161]
举例来说,染色体序列可包括但不限于il1b(白细胞介素1,β),xdh(黄嘌呤脱氢酶),tp53(肿瘤蛋白p53),ptgis(前列腺素12(前列环素)合酶),mb(肌红蛋白),il4(白细胞介素4),angpt1(血管生成素1),abcg8(atp结合盒,亚家族g(white),成员8),ctsk(组织蛋白酶k),ptgir(前列腺素12(前列环素)受体(ip)),kcnj11(钾内向整流通道,亚家族j,成员11),ins(胰岛素),crp(c反应蛋白,与正五聚蛋白相关),pdgfrb(血小板衍生的生长因子受体,β多肽),ccna2(细胞周期蛋白a2),pdgfb(血小板衍生的生长因子β多肽(猿猴肉瘤病毒(v

sis)致癌基因同源物)),kcnj5(钾内向整流通道,亚家族j,成员5),kcnn3(钾中等/小电导钙激活通道,亚家族n,成员3),capn10(钙蛋白酶10),ptges(前列腺素e合酶),adra2b(肾上腺素,α

2b

,受体),abcg5(atp结合盒,亚家族g(white),成员5),prdx2(过氧化物酶2),capn5(钙蛋白酶5),parp14(聚(adp

核糖)聚合酶家族,成员14),mex3c(mex

3同源物c(秀丽隐杆线虫)),ace血管紧张素i转化酶(肽基

二肽酶a)1),tnf(肿瘤坏死因子(tnf超家族,成员2)),il6(白细胞介素6(干扰素,β2)),stn(他汀类),serpine1(serpin肽酶抑制剂,进化枝e(连接蛋白,纤溶酶原激活物抑制剂1型),成员1),alb(白蛋白),adipoq(含脂联素、c1q和胶原蛋白结构域),apob(载脂蛋白b(包括ag(x)抗原)),apoe(载脂蛋白e),lep(瘦素),mthfr(5,10

亚甲基四氢叶酸还原酶(nadph)),apoa1(载脂蛋白a

i),edn1(内皮素1),nppb(利钠肽前体b),nos3(一氧化氮合酶3(内皮细胞)),pparg(过氧化物酶体增殖物激活受体γ),plat(纤溶酶原激活物,组织),ptgs2(前列腺素

内过氧化物合酶2(前列腺素g/h合酶和环氧合酶)),cetp(胆固醇酯转移蛋白,血浆),agtr1(血管紧张素ii受体,1型),hmgcr(3

羟基
‑3‑
甲基戊二酰辅酶a还原酶),igf1(胰岛素样生长因子1(生长调节素c)),sele(选择素e),ren(肾素),ppara(过氧化物酶体增殖物激活受体α),pon1(对氧磷酶1),kng1(激肽原1),ccl2(趋化因子(c

c基序)配体2),lpl(脂蛋白脂肪酶),vwf(von willebrand因子),f2(凝血因子ii(凝血酶)),icam1(细胞间粘附分子1),tgfb1(转化生长因子,β1),nppa(利钠肽前体a),il10(白细胞介素10),epo(促红细胞生成素),sod1(超氧化物歧化酶1,可溶性),vcam1(血管细胞粘附分子1),ifng(干扰素,γ),lpa(脂蛋白,lp(a)),mpo(髓过氧化物酶),esr1(雌激素受体1),mapk1(有丝分裂原激活的蛋白激酶1),hp(触珠蛋白),f3(凝血因子iii(凝血酶原,组织因子)),cst3(胱抑素c),cog2(低聚高尔基复合体组分2),mmp9(基质金属肽酶9(明胶酶b,92kda明胶酶,92kda iv型胶原酶)),serpinc1(serpin肽酶抑制剂,进化枝c(抗凝血酶),成员1),f8(凝血因子viii,促凝血组分),hmox1(血红素加氧酶(decycling)1),apoc3(载脂蛋白c

iii),il8(白细胞介素8),prok1(前动力蛋白1),cbs(胱硫醚

β

合酶),nos2(一氧化氮合酶2,诱导型),tlr4(toll样受体4),selp(选择素p(颗粒膜蛋白140kda,抗原cd62)),abca1(atp结合盒,亚家族a(abc1),成员1),agt(血管紧张素原(serpin蛋白酶抑制剂,进化枝a,成员8)),ldlr(低密度脂蛋白受体),gpt(谷氨酸

丙酮酸转氨酶(丙氨酸氨基转移酶)),vegfa(血管内皮生长因子a),nr3c2(核受体亚家族3,c组,成员2),il18(白细胞介素18(干扰素

γ诱导因子)),nos1(一氧化氮合酶1(神经元)),nr3c1(核受体亚家族3,c组,成员1(糖皮质激素受体)),fgb(纤维蛋白原β链),hgf(肝细胞生长因子(hepapoietin a;散射因子)),il1a(白细胞介素1,α),retn(抵抗素),akt1(v

akt鼠类胸腺瘤病毒致癌基因同源物1),lipc(脂肪酶,肝),hspd1(热休克60kda蛋白1(伴侣蛋白)),mapk14(有丝分裂原激活的蛋白激酶14),spp1(分泌的磷蛋白1),itgb3(整合素,β3(血小板糖蛋白)111a,抗原cd61)),cat(过氧化氢酶),uts2(尿紧张素2),thbd
(血栓调节素),f10(凝血因子x),cp(铜蓝蛋白(铁氧化酶)),tnfrsf11b(肿瘤坏死因子受体超家族,成员11b),ednra(a型内皮素受体),egfr(表皮生长因子受体(成红细胞白血病病毒(v

erb

b)致癌基因同源物,禽类)),mmp2(基质金属肽酶2(明胶酶a,72kda明胶酶,72kda iv型胶原酶)),plg(纤溶酶原),npy(神经肽y),rhod(ras同源基因家族,成员d),mapk8(有丝分裂原激活的蛋白激酶8),myc(v

myc骨髓细胞瘤病病毒致癌基因同源物(禽类)),fn1(纤连蛋白1),cma1(糜酶1,肥大细胞),plau(纤溶酶原激活剂,尿激酶),gnb3(鸟嘌呤核苷酸结合蛋白(g蛋白),β多肽3),adrb2(肾上腺素,β
‑2‑
,受体,表面),apoa5(载脂蛋白a

v),sod2(超氧化物歧化酶2,线粒体),f5(凝血因子v(前加速素,不稳定因子)),vdr(维生素d(1,25

二羟基维生素d3)受体),alox5(花生四烯酸5

脂氧合酶),hla

drb1(主要组织相容性复合物,ii类,drβ1),parp1(聚(adp

核糖)聚合酶1),cd40lg(cd40配体),pon2(对氧磷酶2),ager(晚期糖基化终产物特异性受体),irs1(胰岛素受体底物1),ptgs1(前列腺素

内过氧化物合酶1(前列腺素g/h合酶和环加氧酶)),ece1(内皮素转化酶1),f7(凝血因子vii(血清凝血酶原转化促进剂)),urn(白细胞介素1受体拮抗剂),ephx2(环氧水解酶2,细胞质),igfbp1(胰岛素样生长因子结合蛋白1),mapk10(有丝分裂原激活的蛋白激酶10),fas(fas(tnf受体超家族,成员6)),abcb1(atp结合盒,亚家族b(mdr/tap),成员1),jun(jun致癌基因),igfbp3(胰岛素样生长因子结合蛋白3),cd14(cd14分子),pde5a(磷酸二酯酶5a,cgmp特异性),agtr2(血管紧张素ii受体,2型),cd40(cd40分子,tnf受体超家族成员5),lcat(卵磷脂

胆固醇酰基转移酶),ccr5(趋化因子(c

c基序)受体5),mmp1(基质金属肽酶1(间质胶原酶)),timp1(timp金属肽酶抑制剂1),adm(肾上腺髓质素),dyt10(肌张力障碍10),stat3(信号转导子和转录激活子3(急性期反应因子)),mmp3(基质金属肽酶3(基质溶素1,前明胶酶)),eln(弹性蛋白),usf1(上游转录因子1),cfh(补体因子h),hspa4(热休克70kda蛋白4),mmp12(基质金属肽酶12(巨噬细胞弹性蛋白酶)),mme(膜金属内肽酶),f2r(凝血因子ii(凝血酶)受体),sell(选择素l),ctsb(组织蛋白酶b),anxa5(annexin a5),adrb1(肾上腺素,β
‑1‑
,受体),cyba(细胞色素b

245,α多肽),fga(纤维蛋白原α链),ggt1(γ

谷氨酰转移酶1),lipg(脂肪酶,内皮),hif1a(低氧诱导因子1,α亚基(碱性螺旋



螺旋转录因子)),cxcr4(趋化因子(c

x

c基序)受体4),proc(蛋白c(凝血因子va和viiia的灭活剂)),scarb1(b类清道夫受体,成员1),cd79a(cd79a分子,免疫球蛋白相关α),pltp(磷脂转移蛋白),add1(内收蛋白1(α)),fgg(纤维蛋白原γ链),saa1(血清淀粉样蛋白a1),kcnh2(钾电压门控通道,亚家族h(eag相关),成员2),dpp4(二肽基

肽酶4),g6pd(葡萄糖
‑6‑
磷酸脱氢酶),npr1(利钠肽受体a/鸟苷酸环化酶a(利尿钠肽受体a)),vtn(玻连蛋白),kiaa0101(kiaa0101),fos(fbj鼠类骨肉瘤病毒致癌基因同源物),tlr2(toll类受体2),ppig(肽基脯氨酰异构酶g(亲环素g)),il1r1(白细胞介素1受体,i型),ar(雄激素受体),cyp1a1(细胞色素p450,家族1,亚家族a,多肽1),serpina1(serpin肽酶抑制剂,进化枝a(α

1抗蛋白酶,抗胰蛋白酶),成员1),mtr(5

甲基四氢叶酸

高半胱氨酸甲基转移酶),rbp4(视黄醇结合蛋白4,血浆),apoa4(载脂蛋白a

iv),cdkn2a(细胞周期蛋白依赖性激酶抑制剂2a(黑色素瘤,p16,抑制cdk4)),fgf2(成纤维细胞生长因子2(碱性)),ednrb(内皮素b型受体),itga2(整合素,α2(cd49b,vla

2受体的α2亚基)),cabin1(钙调神经磷酸结合蛋白1),shbg(性别激素结合球蛋白),hmgb1(高迁移率组盒1),hsp90b2p(热休克蛋白90kdaβ(grp94),成员2(假基因)),cyp3a4(细胞色素p450,家族3,亚家族a,多肽4),gja1(间隙连接蛋白,α1,43kda),
cav1(小窝蛋白1,胞膜窖蛋白,22kda),esr2(雌激素受体2(erβ)),lta(淋巴毒素α(tnf超家族,成员1)),gdf15(生长分化因子15),bdnf(脑源性神经营养因子),cyp2d6(细胞色素p450,家族2,亚家族d,多肽6),ngf(神经生长因子(β多肽)),sp1(sp1转录因子),tgif1(tgfb诱导的因子同源盒1),src(v

src肉瘤(schmidt

ruppin a

2)病毒致癌基因同源物(禽类)),egf(表皮生长因子(β

尿抑胃素),pik3cg(磷酸肌醇
‑3‑
激酶,催化,γ多肽),hla

a(主要组织相容性复合物,i类,a),kcnq1(钾电压门控通道,kqt样亚家族,成员1),cnr1(大麻素受体1(脑)),fbn1(原纤维蛋白1),chka(胆碱激酶α),best1(斑萎蛋白1),app(淀粉样β(a4)前体蛋白),ctnnb1(连环蛋白(钙粘蛋白相关蛋白),β1、88kda),il2(白细胞介素2),cd36(cd36分子(血小板反应蛋白受体)),prkab1(蛋白激酶,amp激活,β1非催化亚基),tpo(甲状腺过氧化物酶),aldh7a1(醛脱氢酶7家族,成员a1),cx3cr1(趋化因子(c

x3

c基序)受体1),th(酪氨酸羟化酶),f9(凝血因子ix),gh1(生长激素1),tf(转铁蛋白),hfe(血色素沉着病),il17a(白细胞介素17a),pten(磷酸酶和张力蛋白同源物),gstm1(谷胱甘肽s

转移酶μ1),dmd(肌营养不良蛋白),gata4(gata结合蛋白4),f13a1(凝血因子xiii,a1多肽),ttr(转甲状腺素蛋白),fabp4(脂肪酸结合蛋白4,脂肪细胞),pon3(对氧磷酶3),apoc1(载脂蛋白c

i),insr(胰岛素受体),tnfrsf1b(肿瘤坏死因子受体超家族,成员1b),htr2a(5

羟色胺(血清素)受体2a),csf3(集落刺激因子3(粒细胞)),cyp2c9(细胞色素p450,家族2,亚家族c,多肽9),txn(硫氧还蛋白),cyp11b2(细胞色素p450,家族11,亚家族b,多肽2),pth(甲状旁腺激素),csf2(集落刺激因子2(粒细胞

巨噬细胞)),kdr(激酶插入物结构域受体(iii型受体酪氨酸激酶)),pla2g2a(磷脂酶a2,iia组(血小板,滑液)),b2m(β
‑2‑
微球蛋白),thbs1(血小板反应蛋白1),gcg(胰高血糖素),rhoa(ras同源基因家族,成员a),aldh2(醛脱氢酶2家族(线粒体)),tcf7l2(转录因子7样2(t细胞特异性,hmg

盒)),bdkrb2(缓激肽受体b2),nfe2l2(核因子(红系衍生的2)样2),notch1(notch同源物1,易位相关(果蝇)),ugt1a1(udp葡萄糖醛酸转移酶1家族,多肽a1),ifna1(干扰素,α1),ppard(过氧化物酶体增殖物激活的受体δ),sirt1(沉默调节蛋白(沉默的交配类型信息调节2同源物)1(酿酒酵母),gnrh1(促性腺激素释放激素1(促黄体生成素释放激素)),pappa(妊娠相关血浆蛋白a,pappalysin 1),arr3(arrestin 3,视网膜(x

arrestin)),nppc(利钠肽前体c),ahsp(α血红蛋白稳定蛋白),ptk2(ptk2蛋白酪氨酸激酶2),il13(白细胞介素13),mtor(雷帕霉素的机械靶标(丝氨酸/苏氨酸激酶)),itgb2(整合素,β2(补体成分3受体3和4亚基),gstt1(谷胱甘肽s

转移酶θ1),il6st(白细胞介素6信号转导子(gp130,抑瘤素m受体)),cpb2(羧肽酶b2(血浆)),cyp1a2(细胞色素p450,家族1,亚家族a,多肽2),hnf4a(肝细胞核因子4,α),slc6a4(溶质载体家族6(神经递质转运蛋白,血清素),成员4),pla2g6(磷脂酶a2,vi组(胞质,不依赖钙)),tnfsf11(肿瘤坏死因子(配体)超家族,成员11),slc8a1(溶质载体家族8(钠/钙交换剂),成员1),f2rl1(凝血因子ii(凝血酶)受体样1),akr1a1(醛基酮还原酶家族1,成员a1(醛还原酶)),aldh9a1(醛脱氢酶9家族,成员a1),bglap(骨γ

羧基谷氨酸(gla)蛋白),mttp(微粒体甘油三酸酯转移蛋白),mtrr(5

甲基四氢叶酸

高半胱氨酸甲基转移酶还原酶),sult1a3(磺基转移酶家族,胞质,1a,酚优选,成员3),rage(肾肿瘤抗原),c4b(补体成分4b(chido血型),p2ry12(嘌呤能受体p2y,g蛋白偶联,12),rnls(肾酶,fad依赖性胺氧化酶),creb1(camp反应元件结合蛋白1),pomc(阿黑皮素原),rac1(ras相关的c3肉毒杆菌毒素底物1(rho家族,小gtp结合蛋白rac1)),lmna(lamin nc),cd59(cd59分子,补体调控
蛋白),scn5a(钠通道,电压门控,v型,α亚基),cyp1b1(细胞色素p450,家族1,亚家族b,多肽1),mif(巨噬细胞迁移抑制因子(糖基化抑制因子)),mmp13(基质金属肽酶13(胶原酶3)),timp2(timp金属肽酶抑制剂2),cyp19a1(细胞色素p450,家族19,亚家族a,多肽1),cyp21a2(细胞色素p450,家族21,亚家族a,多肽2),ptpn22(蛋白酪氨酸磷酸酶,22型非受体(淋巴样)),myh14(肌球蛋白,重链14,非肌肉),mbl2(甘露糖结合凝集素(蛋白c)2,可溶性(调理素缺陷)),selplg(选择素p配体),aoc3(胺氧化酶,含铜3(血管粘附蛋白1)),ctsl1(组织蛋白酶l1),pcna(增殖细胞核抗原),igf2(胰岛素样生长因子2(生长调节素a)),itgb1(整联蛋白,β1(纤连蛋白受体,β多肽,抗原cd29包括mdf2、msk12)),cast(钙抑素),cxcl12(趋化因子(c

x

c基序)配体12(基质细胞衍生因子1)),ighe(免疫球蛋白)重常数ε),kcne1(钾电压门控通道,isk相关家族,成员1),tfrc(转铁蛋白受体(p90,cd71)),col1a1(胶原蛋白,i型,α1),col1a2(胶原蛋白,i型,α2),il2rb(白细胞介素2受体,β),pla2g10(磷脂酶a2,x组),angpt2(血管生成素2),procr(蛋白c受体,内皮(epcr)),nox4(nadph氧化酶4),hamp(铁调素抗菌肽),ptpn11(蛋白酪氨酸磷酸酶,11型非受体),slc2a1(溶质载体家族2(促进葡萄糖转运蛋白),成员1),il2ra(白细胞介素2受体,α),ccl5(趋化因子(c

c基序)配体5),irf1(干扰素调节因子1),cflar(casp8和fadd样凋亡调控剂),calca(降钙素相关多肽α),eif4e(真核翻译起始因子4e),gstp1(谷胱甘肽s

转移酶π1),jak2(janus激酶2),cyp3a5(细胞色素p450,家族3,亚家族a,多肽5),hspg2(硫酸乙酰肝素蛋白聚糖2),ccl3(趋化因子(c

c基序)配体3),myd88(髓样分化初级应答基因(88)),vip(血管活性肠肽),soat1(甾醇o

酰基转移酶1),adrbk1(肾上腺素,β,受体激酶1),nr4a2(核受体亚家族4,a组,成员2),mmp8(基质金属肽酶8(中性粒细胞胶原酶)),npr2(利钠肽受体b/鸟苷酸环化酶b(利钠肽受体b)),gch1(gtp环水解酶1),eprs(谷氨酰

脯氨酰

trna合酶),ppargc1a(过氧化物酶体增殖物激活的受体γ,共激活子1α),f12(凝血因子xii(hageman因子)),pecam1(血小板/内皮细胞粘附分子),ccl4(趋化因子(c

c基序)配体4),serpina3(serpin蛋白酶抑制剂,进化枝a(α

1抗蛋白酶,抗胰蛋白酶),成员3),casr(钙敏感受体),gja5(间隙连接蛋白,α5,40kda),fabp2(脂肪酸结合蛋白2,肠),ttf2(转录终止因子,rna聚合酶ii),pros1(蛋白质s(α)),ctf1(心肌营养蛋白1),sgcb(肌聚糖,β(与43kda肌营养不良蛋白相关的糖蛋白)),yme1l1(yme1样1(酿酒酵母)),camp(组织蛋白酶抑制素抗菌肽),zc3h12a(含锌指ccch型的12a),akr1b1(醛酮还原酶家族1,成员b1(醛糖还原酶)),des(结蛋白),mmp7(基质金属肽酶7(基质溶素,子宫),ahr(芳基烃受体),csf1(集落刺激因子1(巨噬细胞)),hdac9(组蛋白脱乙酰基酶9),ctgf(结缔组织生长因子),kcnma1(钾大电导钙激活通道,亚家族m,α成员1),ugt1a(udp葡萄糖醛酸转移酶1家族,多肽a复合基因座),prcka(蛋白激酶c,α),comt(儿茶酚

β

甲基转移酶),s100b(s100钙结合蛋白b),egr1(早期生长反应1),prl(促乳素),il15(白细胞介素15),drd4(多巴胺受体d4),camk2g(钙/钙调蛋白依赖性蛋白激酶iiγ),slc22a2(溶质载体家族22(有机阳离子转运蛋白),成员2),ccl11(趋化因子(c

c基序)配体11),pgf(b321胎盘生长因子),thpo(血小板生成素),gp6(糖蛋白vi(血小板)),tacr1(速激肽受体1),nts(神经降压素),hnf1a(hnf1同源盒a),sst(生长抑素),kcnd1(钾电压门控通道,shal相关亚家族,成员1),loc646627(磷脂酶抑制剂),tbxas1(血栓烷a合酶1(血小板)),cyp2j2(细胞色素p450,家族2,亚家族j,多肽2),tbxa2r(血栓烷a2受体),adh1c(醇脱氢酶1c(i类),γ多肽),alox12(花生四烯酸12

脂加氧酶),ahsg(α
‑2‑
hs

糖蛋白),bhmt(甜
菜碱

高半胱氨酸甲基转移酶),gja4(间隙连接蛋白,α4,37kda),slc25a4(溶质载体家族25(线粒体载体;腺嘌呤核苷酸易位子),成员4),acly(atp柠檬酸裂解酶),alox5ap(花生四烯酸5

脂氧合酶激活蛋白),numa1(核有丝分裂器蛋白1),cyp27b1(细胞色素p450,家族27,家族b,多肽1),cysltr2(半胱氨酰白三烯受体2),sod3(超氧化物歧化酶3,细胞外),ltc4s(白三烯c4合酶),ucn(尿皮质素),ghrl(胃饥饿素/肥胖抑制素前原肽),apoc2(载脂蛋白c

ii),clec4a(c型凝集素结构域家族4,成员a),kbtbd10(含kelch重复序列和btb(poz)结构域的10),tnc(肌腱蛋白c),tyms(胸苷酸合酶),shcl(shc(含src同源性2结构域)转化蛋白1),lrp1(低密度脂蛋白受体相关蛋白1),socs3(细胞因子信号传导抑制剂3),adh1b(醇脱氢酶1b(i类),β多肽),klk3(激肽释放酶相关肽酶3),hsd11b1(羟类固醇(11

β)脱氢酶1),vkorc1(维生素k环氧化物还原酶复合物,亚基1),serpinb2(serpin肽酶抑制剂,进化枝b(卵清蛋白),成员2),tns1(张力蛋白1),rnf19a(无名指蛋白19a),epor(促红细胞生成素受体),itgam(整合素,αm(补体成分3受体3亚基)),pitx2(成对样同源结构域2),mapk7(有丝分裂原激活的蛋白激酶7),fcgr3a(igg的fc片段,低亲和力111a,受体(cd16a)),lepr(瘦素受体),eng(内皮糖蛋白),gpx1(谷胱甘肽过氧化物酶1),got2(谷氨酸

草酰乙酸

转氨酶2,线粒体(天冬氨酸氨基转移酶2)),hrh1(组胺受体h1),nr112(核受体亚家族1,i组,成员2),crh(促肾上腺皮质激素释放激素),htr1a(5

羟色胺(血清素)受体1a),vdac1(电压依赖性阴离子通道1),hpse(乙酰肝素酶),sftpd(表面活性蛋白d),tap2(转运蛋白2,atp结合盒,亚家族b(mdr/tap)),rnf123(无名指蛋白123),ptk2b(ptk2b蛋白酪氨酸激酶2β),ntrk2(神经营养性酪氨酸激酶,受体,2型),il6r(白细胞介素6受体),ache(乙酰胆碱酯酶(yt血型)),glp1r(胰高血糖素样肽1受体),ghr(生长激素受体),gsr(谷胱甘肽还原酶),nqo1(nad(p)h脱氢酶,醌1),nr5a1(核受体亚家族5,a组,成员1),gjb2(间隙连接蛋白,β2,26kda),slc9a1(溶质载体家族9(钠/氢交换剂),成员1),maoa(单胺氧化酶a),pcsk9(前蛋白转化酶枯草杆菌蛋白酶/kexin型9),fcgr2a(igg的fc片段,低亲和力iia,受体(cd32)),serpinf1(serpin肽酶抑制剂,进化枝f(α

2抗纤溶酶,色素上皮衍生因子),成员1),edn3(内皮素3),dhfr(二氢叶酸还原酶),gas6(生长停滞特异性6),smpd1(鞘磷脂磷酸二酯酶1,酸性溶酶体),ucp2(解偶联蛋白2(线粒体,质子载体)),tfap2a(转录因子ap

2α(激活增强子结合蛋白2α)),c4bpa(补体成分4结合蛋白,α),serpinf2(serpin肽酶抑制剂,进化枝f(α

2抗纤溶酶,色素上皮衍生因子),成员2),tymp(胸苷磷酸化酶),alpp(碱性磷酸酶,胎盘(regan同功酶)),cxcr2(趋化因子(c

x

c基序)受体2),slc39a3(溶质载体家族39(锌转运蛋白),成员3),abcg2(atp结合盒,亚家族g(white),成员2),ada(腺苷脱氨酶),jak3(janus激酶3),hspa1a(热休克70kda蛋白1a),fasn(脂肪酸合酶),fgf1(成纤维细胞生长因子1(酸性)),f11(凝血因子xi),atp7a(atp酶,cu 转运,α多肽),cr1(补体成分(3b/4b)受体1(knops血型),gfap(神经胶质纤维酸性蛋白),rock1(与rho相关的卷曲螺旋蛋白激酶1),mecp2(甲基cpg结合蛋白2(雷特综合征)),mylk(肌球蛋白轻链激酶),bche(丁酰胆碱酯酶),lipe(脂肪酶,对激素敏感),prdx5(过氧化物酶5),adora1(腺苷a1受体),wrn(werner综合征,recq解旋酶样),cxcr3(趋化因子(c

x

c基序)受体3),cd81(cd81分子),smad7(smad家族成员7),lamc2(层粘连蛋白,γ2),map3k5(有丝分裂原激活的蛋白激酶激酶激酶5),chga(嗜铬粒蛋白a(甲状旁腺分泌蛋白1)),iapp(胰岛淀粉样多肽),rho(视紫红质),enpp1(外核苷酸焦磷酸酶/磷酸二酯酶1),pthlh(甲状旁腺激素样激素),nrg1(神经调节蛋
白1),vegfc(血管内皮生长因子c),enpep(谷氨酰胺基肽酶(氨基肽酶a)),cebpb(ccaat/增强子结合蛋白(c/ebp),β),naglu(n

乙酰氨基葡萄糖苷酶,α

),f2rl3(凝血因子ii(凝血酶)受体样3),cx3cl1(趋化因子(c

x3

c基序)配体1),bdkrb1(缓激肽受体b1),adamts13(具有血小板反应蛋白1型基序的adam金属肽酶,13),elane(弹性蛋白酶,嗜中性粒细胞表达),enpp2(外核苷酸焦磷酸酶/磷酸二酯酶2),cish(含细胞因子诱导的sh2的蛋白质),gast(胃泌素),myoc(肌球蛋白,小梁网诱导的糖皮质激素反应),atp1a2(atp酶,na /k 转运,α2多肽),nf1(神经纤维蛋白1),gjb1(间隙连接蛋白,β1,32kda),mef2a(肌细胞增强因子2a),vcl(粘着斑蛋白),bmpr2(骨形态发生蛋白受体,ii型(丝氨酸/苏氨酸激酶)),tubb(微管蛋白,β),cdc42(细胞分裂周期42(gtp结合蛋白,25kda)),krt18(角蛋白18),hsf1(热休克转录因子1),myb(v

myb成纤维细胞病病毒致癌基因同源物(禽类)),prkaa2(蛋白激酶,amp激活,α2催化亚基),rock2(rho相关,含卷曲螺旋的蛋白激酶2),tfpi(组织因子途径抑制剂(脂蛋白相关凝结抑制剂)),prkg1(蛋白激酶,cgmp依赖性,i型),bmp2(骨形态发生蛋白2),ctnnd1(连环蛋白(钙粘蛋白相关蛋白),δ1),cth(胱硫醚酶(胱硫醚γ

裂解酶)),ctss(组织蛋白酶s),vav2(vav 2鸟嘌呤核苷酸交换因子),npy2r(神经肽y受体y2),igfbp2(胰岛素样生长因子结合蛋白2,36kda),cd28(cd28分子),gsta1(谷胱甘肽s

转移酶α1),ppia(肽基脯氨酰异构酶a(亲环蛋白a)),apoh(载脂蛋白h(β
‑2‑
糖蛋白i)),s100a8(s100钙结合蛋白a8),il11(白细胞介素11),alox15(花生四烯酸15

脂加氧酶),fbln1(腓骨蛋白1),nr1h3(核受体亚家族1,h组,成员3),scd(硬脂酰

coa去饱和酶(δ
‑9‑
去饱和酶)),gip(胃抑制多肽),chgb(嗜铬粒蛋白b(分泌粒蛋白1)),prkcb(蛋白激酶c,β),srd5a1(类固醇
‑5‑
α

还原酶,α多肽1(3

氧代



类固醇δ4

脱氢酶α1)),hsd11b2(羟基类固醇(11

β)脱氢酶2),calcrl(降钙素受体样),galnt2(udp

n

乙酰

α

d

半乳糖胺:多肽n

乙酰半乳糖胺基转移酶2(galnac

t2)),angptl4(血管生成素样4),kcnn4(钾中等/小电导钙激活通道,亚家族n,成员4),pik3c2a(磷酸肌醇
‑3‑
激酶,2类,α多肽),hbegf(肝素结合egf样生长因子),cyp7a1(细胞色素p450,家族7,亚家族a,多肽1),hla

drb5(主要组织相容性复合物,ii类,drβ5),bnip3(bcl2/腺病毒e1b 19kda相互作用蛋白3),gckr(葡萄糖激酶(己糖激酶4)调控剂),s100a12(s100钙结合蛋白a12),padi4(肽基精氨酸脱亚氨酶,iv型),hspa14(热休克70kda蛋白14),cxcr1(趋化因子(c

x

c基序)受体1),h19(h19,压印母体表达的转录物(非蛋白质编码)),krtap19

3(角蛋白相关蛋白19

3),iddm2(胰岛素依赖型糖尿病2),rac2(ras相关的c3肉毒杆菌毒素底物2(rho家族,小gtp结合蛋白rac2)),ryr1(兰尼碱受体1(骨骼)),clock(clock同源物(小鼠)),ngfr(神经生长因子受体(tnfr超家族,成员16)),dbh(多巴胺β

羟化酶(多巴胺β

单加氧酶)),chrna4(胆碱能受体,烟碱,α4),cacna1c(钙通道,电压依赖性,l型,α1c亚基),prkag2(蛋白激酶,amp激活,γ2非催化亚基),chat(胆碱乙酰基转移酶),ptgds(前列腺素d2合酶21kda(脑)),nr1h2(核受体亚家族1,h组,成员2),tek(tek酪氨酸激酶,内皮),vegfb(血管内皮生长因子b),mef2c(肌细胞增强因子2c),mapkapk2(有丝分裂原激活的蛋白激酶激活的蛋白激酶2),tnfrsf11a(肿瘤坏死因子受体超家族,成员11a,nfkb激活剂),hspa9(热休克70kda蛋白9(寿命蛋白)),cysltr1(半胱氨酰白三烯受体1),mat1a(甲硫氨酸腺苷转移酶i,α),oprl1(鸦片受体样1),impa1(肌醇(肌)

1(或4)

单磷酸酶1),clcn2(氯化物通道2),dld(二氢脂酰胺脱氢酶),psma6(蛋白酶体(蛋白酶体,macropain)亚基,α型,6),psmb8(蛋白酶体(蛋白酶体,macropain)亚基,β型,8(大型
多功能肽酶7)),chi3l1(几丁质酶3

样1(软骨糖蛋白

39)),aldh1b1(醛脱氢酶1家族,成员b1),parp2(聚(adp

核糖)聚合酶2),star(类固醇生成急性调节蛋白),lbp(脂多糖结合蛋白),abcc6(atp结合盒,亚家族c(cftr/mrp),成员6),rgs2(g蛋白信号传导调控剂2,24kda),efnb2(ephrin

b2),gjb6(间隙连接蛋白,β6,30kda),apoa2(载脂蛋白a

ii),ampd1(单磷酸腺苷脱氨酶1),dysf(dysferlin,肢带肌肉萎缩症2b(常染色体隐性)),fdft1(法呢基

二磷酸法呢基转移酶1),edn2(内皮素2),ccr6(趋化因子(c

c基序)受体6),gjb3(间隙连接蛋白,β3,31kda),il1rl1(白细胞介素1受体样1),entpd1(外核苷三磷酸二磷酸水解酶1),bbs4(bardet

biedl综合征4),celsr2(钙粘蛋白,egf lag七次g型受体2(火烈鸟同源物,果蝇)),f11r(f11受体),rapgef3(rap鸟嘌呤核苷酸交换因子(gef)3),hyal1(透明质酸氨基葡糖苷酶1),znf259(锌指蛋白259),atox1(atx1抗氧化剂蛋白1同源物(酵母)),atf6(激活转录因子6),khk(酮己糖激酶(果糖激酶)),sat1(亚精胺/精胺n1

乙酰基转移酶1),ggh(γ

谷氨酰水解酶(结合酶,叶酰多γ谷氨酰水解酶)),timp4(timp金属肽酶抑制剂4),slc4a4(溶质载体家族4,碳酸氢钠共转运蛋白,成员4),pde2a(磷酸二酯酶2a,cgmp刺激),pde3b(磷酸二酯酶3b,cgmp抑制),fads1(脂肪酸去饱和酶1),fads2(脂肪酸去饱和酶2),tmsb4x(胸腺素β4,x连锁),txnip(硫氧还蛋白相互作用蛋白),lims1(lim和衰老细胞抗原样结构域1),rhob(ras同源基因家族,成员b),ly96(淋巴细胞抗原96),foxo1(叉头盒o1),pnpla2(包patatin样磷脂酶结构域的2),trh(促甲状腺激素释放激素),gjc1(间隙连接蛋白,γ1,45kda),slc17a5(溶质载体家族17(阴离子/糖转运蛋白),成员5),fto(脂肪物质和肥胖相关),gjd2(间隙连接蛋白,δ2,36kda),psrc1(富含脯氨酸/丝氨酸的卷曲螺旋1),casp12(胱天蛋白酶12(基因/假基因)),gpbar1(g蛋白偶联胆汁酸受体1),pxk(含px结构域的丝氨酸/苏氨酸激酶),il33(白细胞介素33),trib1(tribbles同源物1(果蝇)),pbx4(前b细胞白血病同源盒4),nupr1(核蛋白,转录调节因子,1),15

sep(15kda硒蛋白),cilp2(软骨中间层蛋白2),terc(端粒酶rna组分),ggt2(γ

谷氨酰转移酶2),mt

co1(线粒体编码的细胞色素c氧化酶i)和uox(尿酸氧化酶,假基因)。这些序列中的任何一者都可以是crispr

cas系统的靶标,例如以处理突变。
[1162]
在另一个实施方案中,染色体序列可进一步选自pon1(对氧磷酶1),ldlr(ldl受体),apoe(载脂蛋白e),apo b

100(载脂蛋白b

100),apoa(载脂蛋白(a)),apoa1(载脂蛋白a1),cbs(胱硫醚b

合酶),糖蛋白iib/iib,mthrf(5,10

亚甲基四氢叶酸还原酶(nadph)及它们的组合。在一次反复操作中,与心血管疾病有关的染色体序列和由染色体序列编码的蛋白质可选自cacna1c、sod1、pten、ppar(α)、apo e、瘦素及它们的组合作为crispr

cas系统的靶标。
[1163]
治疗肝脏和肾脏疾病
[1164]
本发明还考虑了将本文所述的系统例如v型效应蛋白系统递送至肝脏和/或肾脏。诱导治疗性核酸的细胞摄取的递送策略包括物理力或载体系统,例如基于病毒、脂质或复合物的递送或纳米载体。从具有较少可能临床相关性的最初应用开始,当通过流体动力高压注射系统性地将核酸用于肾脏细胞时,已经将广泛多种基因治疗性病毒和非病毒载体应用于靶向不同动物肾脏疾病模型体内的转录后事件(csaba r
é
v
é
sz和p
é
ter hamar(2011).delivery methods to target rnas in the kidney,gene therapy applications,prof.chunsheng kang(编),isbn:978

953

307

541

9,intech,获自:
www.intechopen.com/books/gene

therapy

applications/delivery

methods

to

target

rnas

inthe

kidney)。肾脏的递送方法可包括yuan等人(am j physiol renal physiol 295:f605

f617,2008)中的方法,其研究了靶向花生四烯酸酸代谢的12/15

脂氧合酶(12/15

lo)途径的小干扰rna(sirna)的体内递送是否可改善链脲佐菌素注射的1型糖尿病小鼠模型中的肾损伤和糖尿病性肾病(dn)。为了在肾脏中获得更大的体内接近和sirna表达,yuan等人使用了与胆固醇缀合的双链12/15

lo sirna寡核苷酸。将约400μg的sirna皮下注射到小鼠中。yuang等人的方法可应用于本发明的crispr cas系统,其考虑将1

2 g与胆固醇缀合的crispr cas皮下注射至人类以递送至肾脏。
[1165]
molitoris等人(j am soc nephrol 20:1754

1764,2009)利用近端肾小管细胞(ptc)作为肾脏内寡核苷酸重吸收的位点来测试靶向p53的sirna的功效,p53是凋亡途径中的关键蛋白,以预防肾脏损伤。缺血性损伤后4小时静脉注射p53的裸合成sirna最大程度地保护了ptc和肾脏功能。molitoris等人的数据表明,静脉内施用后,sirna迅速递送至近端小管细胞。为了进行剂量反应分析,向大鼠注射sip53的剂量,在相同的四个时间点分别给予0.33、1、3或5mg/kg,导致累积剂量分别为1.32、4、12和20mg/kg。与pbs处理的缺血性对照大鼠相比,所有测试的sirna剂量在第一天就产生了scr降低作用,并且在大约五天内更高的剂量是有效的。12和20mg/kg的累积剂量提供了最佳的保护作用。molitoris等人的方法可应用于本发明的核酸靶向系统,其考虑向人类递送12和20mg/kg的累积剂量以递送至肾脏。
[1166]
thompson等人(nucleic acid therapeutics,第22卷,第4期,2012)报道了在啮齿动物和非人类灵长类动物中静脉内施用后合成的小干扰rna i5np的毒理学和药代动力学特性。i5np被设计为经由rna干扰(rnai)途径起作用,以暂时抑制促凋亡蛋白p53的表达,并且正在开发用于保护细胞免受急性缺血/再灌注损伤,例如在重大心脏外科手术时可能出现的急性肾损伤以及肾移植后可能发生的移植物功能延迟。在啮齿动物中需要800mg/kg i5np的剂量以及在非人类灵长类动物中需要1,000mg/kg i5np的剂量才会引起不良反应,所述物质在猴子中分离以引导对血液的影响,包括亚临床激活补体以及凝血时间略有增加。在大鼠中,未观察到大鼠i5np类似物的其他不良反应,表明所述作用可能代表合成rna双链体的类别作用,而不是与i5np预期药理活性有关的毒性。综上所述,这些数据支持在急性缺血/再灌注损伤后静脉内施用i5np以保持肾功能的临床测试。在猴子中未观察到的不良反应水平(noael)为500mg/kg。以高达25mg/kg的剂量水平静脉内施用后,在猴子中未观察到对心血管、呼吸和神经系统参数的影响。因此,可考虑相似剂量用于将crispr cas静脉内施用至人类的肾脏。
[1167]
shimizu等人(j am soc nephrol 21:622

633,2010)开发了一种系统,可经由基于聚(乙二醇)

聚(l

赖氨酸)的媒介物将sirna靶向递送至肾小球。sirna/纳米载体复合物的直径约为10至20nm,其大小将使其能够穿过有孔的内皮移动而进入肾小球系膜。腹膜内注射荧光标记的sirna/纳米载体复合物后,shimizu等人在血液循环中长时间检测到sirna。反复腹膜内施用有丝分裂原激活的蛋白激酶1(mapk1)sirna/纳米载体复合物抑制了肾小球肾炎小鼠模型中的肾小球mapk1mrna和蛋白质表达。为了研究sirna的积累,将与pic纳米载体复合的cy5标记的sirna(0.5ml,5nmol的sirna含量),裸露的cy5标记的sirna(0.5ml,5nmol)或包封在hvj

e中的cy5标记的sirna(0.5ml,5nmol的sirna含量)施用于
balbc小鼠。shimizu等人的方法可应用于本发明的核酸靶向系统,考虑将约1

2升的与纳米载体复合的约10

20μmol crispr cas的剂量用于腹膜内施用于人类并递送至肾脏。
[1168]
肾脏的递送方法总结如下:
[1169]
[1170]
[1171]
[1172]
[1173]
[1174]
[1175][1176]
靶向肝脏或肝细胞
[1177]
提供了靶向肝细胞。这可以是体外或体内的。肝细胞是优选的。本文系统的递送可经由病毒载体、尤其是aav(并且特别是aav2/6)载体。这些可通过静脉内注射施用。
[1178]
无论在体外或体内,肝脏的优选靶标都是白蛋白基因。这是所谓的“安全港”,因为白蛋白以很高的水平表达,因此可容许在成功的基因编辑后白蛋白产生的某些减少。由于
从白蛋白启动子/增强子可见的高水平表达允许实现有用水平的正确或转基因产生(从插入的供体模板产生),即使仅编辑少量肝细胞,这也是优选的。
[1179]
wechsler等人(在美国血液学会第57届年会和博览会上的报告,摘要可在线获自ash.confex.com/ash/2015/webprogram/paper86495.html并于2015年12月6日提交)已经表明白蛋白的内含子1为合适的目标位点。他们的工作使用锌指在该目标位点切割dna,并且可生成合适的指导序列来引导crispr蛋白在同一位点进行切割。
[1180]
如wechsler等人报道,在高表达基因(具有高活性增强子/启动子的基因)例如白蛋白中使用靶标也可允许使用无启动子的供体模板,并且这在肝脏靶向外部也广泛适用。高表达基因的其他实例是已知的。
[1181]
其他肝脏疾病
[1182]
在特定的实施方案中,本发明的系统可用于治疗肝脏病症,例如转甲状腺素蛋白淀粉样变性(attr),α

1抗胰蛋白酶缺乏症和其他基于肝的先天性代谢错误。fap是由编码转甲状腺素蛋白(ttr)的基因突变引起的。尽管它是常染色体显性疾病,但并非所有携带者都会患上该疾病。已知ttr基因中有超过100个突变与该疾病相关。常见突变的实例包括v30m。利用irna的研究已证明了基于基因沉默的ttr治疗原理(ueda等人,2014 transl neurogener.3:19)。威尔逊氏病(wd)是由编码atp7b的基因突变引起的,该基因仅在肝细胞中发现。与wd相关的突变超过500种,在特定地区(例如东亚)的患病率增加。其他实例是a1atd(一种由serpina1基因突变引起的常染色体隐性疾病)和pku(一种由苯丙氨酸羟化酶(pah)基因突变引起的常性隐性疾病)。
[1183]
肝相关性血液病症,尤其是血友病并且特别是乙型血友病
[1184]
已在小鼠(体外和体内)和非人类灵长类动物(体内)中成功完成了肝细胞的基因编辑,这表明通过基因编辑/基因组工程改造肝细胞来治疗血液病症是可行的。特别地,已经在非人类灵长类动物中显示了人类f9(hf9)基因在肝细胞中的表达,表明对于人类乙型血友病的治疗。
[1185]
wechsler等人在美国血液学会第57届年会和博览会上报道(摘要呈现于2015年12月6日并且可在线获自ash.confex.com/ash/2015/webprogram/paper86495.html),他们已经通过体内基因编辑在非人类灵长类动物中成功表达了来自肝细胞的人类f9(hf9)。使用1)靶向白蛋白基因座的内含子1的两个锌指核酸酶(zfn)和2)人f9供体模板构建体可实现这一点。zfn和供体模板在静脉内注射的单独的肝细胞性腺相关病毒血清型2/6(aav2/6)载体上编码,从而导致将hf9基因的校正拷贝靶向插入一定比例的肝细胞中的白蛋白基因座中。
[1186]
白蛋白基因座被选为“安全港”,因为这种最丰富的血浆蛋白的产量超过10克/天,并且这些水平的适度降低具有良好的耐受性。基因组编辑的肝细胞产生了治疗量的正常hfix(hf9),而不是由高活性白蛋白增强子/启动子驱动的白蛋白。显示了hf9转基因在白蛋白基因座上的靶向整合以及该基因剪接成白蛋白转录物。
[1187]
小鼠研究:经由尾静脉注射向c57bl/6小鼠施用了以1.0x10
13
载体基因组(vg)/kg编码小鼠替代试剂的媒介物(n=20)或aav2/6载体(n=25)。在经治疗的小鼠中血浆hfix的elisa分析显示,在6个月的研究持续时间内,峰值水平一直维持在50

1053ng/ml。来自小鼠血浆的fix活性的分析证实了生物活性与表达水平相当。
[1188]
非人类灵长类动物(nhp)研究:编码nhp靶向白蛋白特异性zfn的aav2/6载体和人类f9供体的单次静脉内共输注,1.2x10
13
vg/kg(n=5/组),在这个大型动物模型中导致>50ng/ml(>正常水平的1%)。在研究持续时间(3个月)内,在几只动物中使用较高的aav2/6剂量(至多1.5x10
14
vg/kg)产生的血浆hfix水平至多为1000ng/ml(或正常水平的20%),并且在单个动物中为至多2000ng/ml(或正常水平的50%)。
[1189]
所述治疗在小鼠和nhp中耐受良好,在任何剂量下在任一物种中均未与aav2/6 zfn 供体治疗相关的明显毒理学发现。此后,sangamo(ca,usa)已向fda申请并获得了进行体内基因组编辑应用的全球首个人类临床试验的许可。这是基于emea批准glybera基因疗法治疗脂蛋白脂肪酶缺乏症。
[1190]
因此,在一些实施方案中,优选使用以下的任何或全部:aav(特别是aav2/6)载体,优选通过静脉内注射施用;白蛋白作为基因编辑/转基因插入/模板的靶标,特别是在白蛋白内含子1处;人类f9供体模板;和/或无启动子的供体模板。
[1191]
乙型血友病
[1192]
因此,在一些实施方案中,优选将本发明用于治疗乙型血友病。因此,优选通过提供合适的指导rna来靶向f9(因子ix)。尽管可将它们一起或分开递送,但理想地,酶和指导物可靶向产生f9的肝脏。在一些实施方案中,提供了模板,并且其是人类f9基因。应当理解,hf9模板包含hf9的wt或“适当”版本,使得治疗是有效的。在一些实施方案中,可使用双载体系统,一个载体用于v型效应子并且一个载体用于修复模板。修复模板可包括两个或更多个修复模板,例如,来自不同哺乳动物物种的两个f9序列。在一些实施方案中,提供了小鼠和人类f9序列。这可递送至小鼠。yang yang,john white,mcmenamin deirdre和peter bell,phd(提供于第58届美国血液学会年度会议(2016年11月))报道,这提高了效力和准确性。第二个载体将因子ix的人类序列插入小鼠基因组中。在一些实施方案中,靶向插入导致嵌合的高活性因子ix蛋白的表达。在一些实施方案中,这在天然小鼠因子ix启动子的控制下。以增加的剂量将这种双组分系统(载体1和载体2)注射到新生和成年“敲除”小鼠中,导致在正常(或甚至更高)水平上稳定的ix因子活性的表达和活性超过四个月。在治疗人类的情况下,可替代地使用天然人类f9启动子。在一些实施方案中,wt表型被恢复。
[1193]
在一个替代实施方案中,可递送f9的乙型血友病形式,以便产生模型生物体、细胞或细胞系(例如鼠类或非人类灵长类模型生物体、细胞或细胞系),所述模型生物体、细胞或细胞系具有或带有乙型血友病表型(即无法产生wt f9)。
[1194]
甲型血友病
[1195]
在一些实施方案中,f9(因子ix)基因可被上述f8(因子viii)基因代替,从而导致甲型血友病的治疗(通过提供适当的f8基因)和/或产生甲型血友病模型生物体、细胞或细胞系(通过提供不适当的f8基因的甲型血友病形式)。
[1196]
丙型血友病
[1197]
在一些实施方案中,f9(因子ix)基因可被上述f11(因子xi)基因代替,从而导致丙型血友病的治疗(通过提供适当的f11基因)和/或产生丙型血友病模型生物体、细胞或细胞系(通过提供不适当的f11基因的丙型血友病形式)。
[1198]
转甲状腺素蛋白淀粉样变性
[1199]
转甲状腺素蛋白是一种蛋白质,主要在肝脏中产生,存在于血清和csf中,其携带
与视黄醇(维生素a)结合的甲状腺素激素和视黄醇结合蛋白。超过120种不同的突变可引起转甲状腺素蛋白淀粉样变性(attr),这是一种遗传性病症,其中蛋白质的突变形式聚集在组织中,尤其是周围神经系统中,引起多发性神经病。家族性淀粉样蛋白多发性神经病(fap)是最常见的ttr病症,并且在2014年,据认为该疾病影响了欧洲每100,000人中的47人。val30met的ttr基因突变被认为是最常见的突变,导致fap病例的估计50%。在没有肝移植手术(迄今为止唯一已知的治愈方法)的情况下,所述疾病通常在诊断后的十年内致命。大多数情况是单基因的。
[1200]
在attr的小鼠模型中,可通过递送crispr/cas9以剂量依赖性方式编辑ttr基因。在一些实施方案中,v型效应子作为mrna提供。在一些实施方案中,v型效应子mrna和指导rna包装在lnp中。包含v型效应子mrna和包装在lnp中的指导rna的系统在肝脏中的编辑效率高达60%,而血清ttr水平降低了高达80%。因此,在一些实施方案中,转甲状腺素蛋白是靶向的,特别是校正val30met突变。因此,在一些实施方案中,治疗attr。
[1201]
α

1抗胰蛋白酶缺乏症
[1202]
α

1抗胰蛋白酶(a1at)是一种在肝脏中产生的蛋白质,其主要功能是降低肺中性粒细胞弹性蛋白酶(一种降解结缔组织的酶)的活性。α

1抗胰蛋白酶缺乏症(attd)是由编码a1at的serpina1基因的突变引起的疾病。a1at的产生受损会导致肺结缔组织逐渐退化,从而导致肺气肿样症状。
[1203]
尽管最常见的突变是glu342lys(称为z等位基因,野生型称为m)或glu264val(称为s等位基因),但有若干突变可能会导致attd,并且每个等位基因均对疾病状态有同等的贡献,其中两个受影响的等位基因导致更明显的病理生理学。这些结果不仅导致例如肺的敏感器官的结缔组织退化,但是肝中突变体的积累会导致蛋白毒性。目前的治疗重点是通过注射从捐献的人类血浆中回收的蛋白质来代替a1at。在严重的情况下,可考虑肺和/或肝移植。
[1204]
此外,所述疾病的常见变异体是单基因的。在一些实施方案中,serpina1基因是靶向的。在一些实施方案中,校正glu342lys突变(称为z等位基因,野生型称为m)或glu264val突变(称为s等位基因)。因此,在一些实施方案中,有缺陷的基因将需要被野生型功能基因代替。在一些实施方案中,需要敲除和修复方法,因此提供了修复模板。在双等位基因突变的情况下,在一些实施方案中,纯合突变仅需要一个指导rna,但是在杂合突变的情况下,可能需要两个指导rna。在一些实施方案中,递送至肺或肝。
[1205]
先天性代谢错误
[1206]
先天性代谢错误(iem)是影响代谢过程的疾病统称。在一些实施方案中,将治疗iem。这些疾病中的大多数本质上是单基因的(例如苯丙酮尿症),并且其病理生理学是由固有毒性物质的异常积累或导致无法合成必需物质的突变引起的。根据iem的性质,可使用crispr/v型效应子单独进行敲除,或与经由修复模板代替有缺陷的基因组合使用。在一些实施方案中,可受益于crispr/v型效应子技术的示例性疾病为:原发性高草酸尿症1型(ph1)、精氨琥珀酸裂解酶缺乏症、鸟氨酸转氨甲酰酶缺乏症、苯丙酮尿症或pku,以及枫糖浆尿病。
[1207]
治疗上皮和肺部疾病
[1208]
本发明还考虑了将本文所述的系统例如cast系统递送至一个或两个肺。
[1209]
尽管最初建议将基于aav

2的载体用于cftr递送至cf气道,但其他血清型(例如aav

1、aav

5、aav

6和aav

9)在多种肺上皮模型中均表现出提高的基因转移效率(参见例如li等人,molecular therapy,第17卷第12期,2067

2077,2009年12月)。在体外转导人气道上皮细胞方面,aav

1的效率显示比aav

2和aav

5高约100倍,尽管aav

1在体内转导鼠类气管气道上皮细胞的效率与aav

5相同。其他研究表明,在体外将基因递送至人气道上皮(hae)时,aav

5的效率比aav

2高50倍,而在体内小鼠肺气道上皮中,aav

5的效率显著更高。在体外在人类气道上皮细胞中和在体内在鼠类气道中,aav

6也证明比aav

2更有效。在体内鼠类鼻和肺泡上皮中,最近的分离株aav

9被证明比aav

5具有更高的基因转移效率,检测到的基因表达超过9个月,这表明aav可在体内长期表达基因,这是cftr基因递送载体的理想特性。此外,已证明可将aav

9再次施用至鼠类肺中,而不会损失cftr表达并且免疫影响最小。cf和非cf hae培养物可在顶表面上用100μl aav载体接种数小时(参见例如li等人,molecular therapy,第17卷第12期,2067

2077,2009年12月)。moi可从1
×
103至4
×
10个载体基因组/细胞变化,取决于病毒浓度和实验目的。上述载体被考虑用于本发明的递送和/或施用。
[1210]
zamora等人(am j respir crit care med,第183卷,第531

538页,2011)报道了rna干扰治疗剂在人类感染性疾病治疗中以及呼吸道合胞病毒(rsv)感染的肺移植受者中抗病毒药物的随机试验的应用实例。zamora等人在患有rsv呼吸道感染的ltx接受者中进行了一项随机、双盲、安慰剂对照试验。允许患者接受rsv的标准护理。每天施用气雾化的aln

rsv01(0.6mg/kg)或安慰剂,持续3天。这项研究表明,靶向rsv的rnai治疗剂可安全地施用于具有rsv感染的ltx接受者。每天三剂aln

rsv01不会导致呼吸道症状的任何加重或肺功能受损,并且也不会表现出任何全身性促炎作用,例如诱导细胞因子或crp。药代动力学显示,吸入后仅具有低的短暂全身暴露,这与临床前动物数据一致,表明通过核酸外切酶介导的消化和肾脏排泄,经静脉内或通过吸入施用的aln

rsv01可迅速从循环中清除。zamora等人的方法可应用于本发明的核酸靶向系统,并且本发明可考虑例如以0.6mg/kg的剂量的气雾化的crispr cas。
[1211]
例如,在自主呼吸时,经支气管内递送的每个肺,接受肺部疾病治疗的受试者可例如接受药学有效量的气雾化aav载体系统。因此,一般来说,气雾化递送优选用于aav递送。腺病毒或aav粒子可用于递送。各自可操作地连接到一个或多个调控序列的合适的基因构建体可被克隆到递送载体中。在这种情况下,提供以下构建体作为实例:cas的cbh或ef1a启动子,指导rna的u6或h1启动子:一种优选的配置是使用cftrdelta508靶向指导物,deltaf508突变的修复模板和密码子优化的v型酶,任选地具有一个或多个核定位信号或序列(nls),例如两个nls。还设想了没有nls的构建体。
[1212]
治疗肌肉系统疾病
[1213]
本发明还考虑了将本文所述的系统例如cast系统递送至肌肉。
[1214]
bortolanza等人(molecular therapy,第19卷第11期,2055

2064,2011年11月)显示,在面肩肱型肌营养不良症(fshd)发作后,frg1小鼠中的rna干扰表达盒的系统性递送导致剂量依赖性长期frg1敲低而无毒性迹象。bortolanza等人发现,单次静脉注射5
×
10
12
vg的raav6

sh1frg1可拯救frg1小鼠的肌肉组织病理学和肌肉功能。详细地,使用25号terumo注射器将200μl含2
×
10
12
或5
×
10
12
vg载体的生理溶液注射到尾静脉中。bortolanza等人的
方法可应用于表达crispr cas的aav并以约2
×
10
15
或2
×
10
16
vg载体的剂量注射至人类中。
[1215]
dumonceaux等人(molecular therapy,第18卷第5期,881

887,2010年5月)使用针对肌生长抑制素受体acvriib mrna(sh

acvriib)的rna干扰技术抑制肌生长抑制素途径。拟肌营养不良蛋白的恢复是通过载体化的u7外显子跳跃技术(u7

dys)介导的。将单独携带sh

acvriib构建体、单独携带u7

dys构建体或两种构建体组合的腺相关载体注射入营养不良的mdx小鼠的胫前肌(ta)。用10
11
个aav病毒基因组进行注射。dumonceaux等人的方法可应用于表达crispr cas的aav并例如以约10
14
至约10
15
vg载体的剂量注射至人类中。
[1216]
kinouchi等人(gene therapy(2008)15,1126

1130)报道了通过将未化学修饰的sirna与缺端胶原蛋白(atcol)形成纳米粒子,将sirna体内递送至正常或患病小鼠骨骼肌的有效性。atcol介导的靶向肌抑制素的sirna(骨骼肌生长的负调控剂)在小鼠骨骼肌中或经静脉内的局部应用,在应用后数周内引起肌肉质量明显增加。这些结果表明,atcol介导的sirna的应用是用于包括肌肉萎缩症在内的疾病的治疗性用途的强大工具。根据制造商的说明,将mstsirna(最终浓度,10mm)与atcol(局部施用的最终浓度,0.5%)(atelogene,kohken,tokyo,japan)混合。用nembutal(25mg/kg,i.p.)麻醉小鼠(20周龄的雄性c57bl/6)后,将mst

sirna/atcol复合物注射到咬肌和股二头肌中。kinouchi等人的方法可应用于crispr cas并注射至人类中,例如以约500至1000ml的40μm溶液的剂量注射至肌肉中。hagstrom等人(molecular therapy,第10卷,第2期,2004年8月)描述了一种血管内非病毒方法,所述方法能够将核酸有效且可重复地递送至整个哺乳动物肢体肌肉中的肌细胞(肌纤维)。所述程序涉及将裸质粒dna或sirna注射到通过止血带或血压袖带暂时隔离的肢体远端静脉中。快速注入足够量的核酸有助于将核酸递送至肌纤维,以使核酸溶液渗入肌肉组织。在小型和大型动物中均以最小的毒性实现了骨骼肌中高水平的转基因表达。还获得了将sirna递送至肢体肌肉的证据。为了向恒河猴静脉内注射质粒dna,将三通旋塞阀连接到两个注射泵(型号phd 2000;harvard instruments),每个注射泵都装有一个注射器。罂粟碱注射后五分钟,以1.7或2.0ml/s的速率注射pdna(在40

100ml盐水中为15.5至25.7mg)。对于人类,可对表达本发明的crispr cas的质粒dna按比例放大,注射于800至2000ml盐水中的约300至500mg。对于大鼠中的腺病毒载体注射,注射于3ml生理盐水溶液(nss)中的2
×
109个感染性粒子。对于人类,可对表达本发明的crispr cas的腺病毒载体按比例放大,注射于10升nss中的约1
×
10
13
个感染性粒子。对于sirna,将12.5μg的sirna注射到大鼠的大隐静脉中,并将750μg的sirna注射到灵长类动物的大隐静脉中。可对本发明的crispr cas按比例放大,例如,向人类的大隐静脉中注射约15至约50mg。
[1217]
还参见例如杜克大学(duke university)的已公开申请wo2013163628a2,突变基因的遗传校正(genetic correction of mutated genes),其描述了努力校正例如导致提前终止密码子和截短基因产物的移码突变,所述突变可经由核酸酶介导的非同源末端连接来校正,例如造成杜氏肌营养不良症(“dmd”)的那些突变,杜氏肌营养不良症是一种隐性的致命的x连锁病症,其由于肌营养不良蛋白基因的突变而导致肌肉变性。引起dmd的大多数肌营养不良蛋白突变是外显子的缺失,其破坏阅读框并导致肌营养不良蛋白基因的提前翻译终止。肌营养不良蛋白是一种细胞质蛋白,可为负责调节肌肉细胞完整性和功能的细胞膜的肌营养不良蛋白聚糖复合物提供结构稳定性。如本文可互换使用的肌营养不良蛋白基因或“dmd基因”在基因座xp21处为2.2兆碱基。初级转录测量为约2,400kb,其中成熟mrna为
约14kb。79个外显子编码超过3500个氨基酸的蛋白质。外显子51在dmd患者中经常邻近破坏框架的缺失,并且已成为基于寡核苷酸的外显子跳跃的临床试验的靶标。最近,一项关于外显子51跳跃化合物eteplirsen的临床试验报道,在48周内有显著的功能益处,肌营养不良蛋白阳性纤维与基线相比为平均47%。外显子51中的突变非常适合通过基于nhej的基因组编辑进行永久校正。
[1218]
min等人,“crispr

cas9 corrects duchenne muscular dystrophy exon 44 deletion mutations in mice and human cells,”science advances 2019,第5卷第eaav4324页描述了通过编辑从患者衍生的诱导多能干细胞获得的心肌细胞来校正外显子44缺失突变以及不同相对剂量的crispr基因编辑组分的影响。可将所述方法修改为本发明的核酸靶向系统。
[1219]
转让给cellectis的美国专利公开第20130145487号的方法,其涉及从人类肌营养不良蛋白基因(dmd)切割靶序列的大范围核酸酶变体,也可被修改为用于本发明的核酸靶向系统。
[1220]
治疗皮肤疾病
[1221]
本发明还考虑了将本文所述的系统例如cast系统递送至皮肤。
[1222]
hickerson等人(molecular therapy—nucleid acids(2013)2,e129)涉及一种电动微针阵列皮肤递送装置,用于向人类和鼠类皮肤递送自递送(sd)

sirna。将基于sirna的皮肤治疗剂转化到临床的主要挑战是开发有效的递送系统。在各种皮肤递送技术中已投入大量精力,但收效甚微。在一项用sirna进行皮肤治疗的临床研究中,与皮下注射针注射相关的剧烈疼痛使该试验的其他患者无法参加,这强调了需要改善的对患者更友好(即几乎没有疼痛)的递送方法。微针代表跨主要屏障角质层递送包括sirna的大型带电货物的有效方式,并且通常被认为比传统的皮下注射针疼痛小。电动“邮票型”微针装置,包括hickerson等人使用的电动微针阵列(mmna)装置,已被证明在无毛小鼠研究中是安全的,并且几乎不会引起疼痛,如以下所证明:(i)在化妆品行业中广泛使用,和(ii)几乎所有志愿者都发现使用所述装置的疼痛比小针剂(flushot)少得多的有限测试,这表明使用该装置进行sirna递送所导致的疼痛要比以前使用皮下注射针注射进行的临床试验所经历的疼痛少得多。mmna装置(由韩国首尔的bomtech electronic公司以triple

m或tri

m销售)适于向小鼠和人类皮肤递送sirna。将sd

sirna溶液(至多300μl的0.1mg/ml rna)引入一次性tri

m针盒(bomtech)的腔室中,其深度设置为0.1mm。为了治疗人类皮肤,在治疗之前,手动拉伸未标识的皮肤(在外科手术后立即获得),并钉在软木平台上。所有皮内注射均使用带有28号0.5英寸针的胰岛素注射器进行。hickerson等人的mmna装置和方法可用于和/或适于将本发明的系统例如以至多300μl的0.1mg/ml系统的剂量递送至皮肤。
[1223]
leachman等人(molecular therapy,第18卷第2期,442

446,2010年2月)涉及用于治疗罕见皮肤病症先天性厚甲(pc)(包括致残的足底角皮病的常染色体显性综合征)的ib期临床试验,其利用第一种基于短干扰rna(sirna)的皮肤治疗剂。这种称为td101的sirna特异性且有效地靶向角蛋白6a(k6a)n171k突变体mrna,而不会影响野生型k6a mrna。
[1224]
zheng等人(pnas,2012年7月24日,第109卷,第30期,11975

11980)显示球形核酸纳米粒子缀合物(sna

nc),金核被高度定向的共价固定的sirna的致密壳包围,在应用后数小时内即可自由渗透几乎100%的体外角质形成细胞、小鼠皮肤和人类表皮。zheng等人证
明了单次应用25nm表皮生长因子受体(egfr)sna

nc持续60小时可在人类皮肤中显示有效的基因敲低。用于皮肤施用,对于固定在sna

nc中的crispr cas,可考虑类似的剂量。
[1225]
癌症
[1226]
在一些实施方案中,所述系统和方法用于癌症的治疗、预防或诊断。靶标优选是fas、bid、ctla4、pdcd1、cblb、ptpn6、trac或trbc基因中的一种或多种。癌症可以是以下中的一种或多种:淋巴瘤,慢性淋巴细胞性白血病(cll),b细胞急性淋巴细胞性白血病(b

all),急性淋巴母细胞性白血病,急性骨髓性白血病,非霍奇金淋巴瘤(nhl),弥漫性大细胞淋巴瘤(dlcl),多发性骨髓瘤,肾细胞癌(rcc),成神经细胞瘤,结直肠癌,乳腺癌,卵巢癌,黑色素瘤,肉瘤,前列腺癌,肺癌,食道癌,肝细胞癌,胰腺癌,星形细胞瘤,间皮瘤,头颈癌和髓母细胞瘤。这可用工程化的嵌合抗原受体(car)t细胞来实现。这在wo2015161276中描述,所述文件的公开内容通过引用并入本文并在下文描述。
[1227]
在一些实施方案中,适合于治疗或预防癌症的靶基因可包括wo2015048577中描述的那些,所述文件的公开内容通过引用并入本文。
[1228]
usher综合征或色素性视网膜炎

39
[1229]
在一些实施方案中,提供了对usher综合征或色素性视网膜炎

39的治疗、预防或诊断。靶标优选是ush2a基因。在一些实施方案中,提供了对位置2299处的g缺失(2299delg)的校正。这在wo2015134812a1中描述,所述文件的公开内容通过引用并入本文。
[1230]
自身免疫性和发炎性病症
[1231]
在一些实施方案中,治疗自身免疫性和发炎性病症。例如,这些病症包括多发性硬化症(ms)或类风湿关节炎(ra)。
[1232]
囊性纤维化(cf)
[1233]
在一些实施方案中,提供了囊性纤维化的治疗、预防或诊断。靶标优选是scnn1a或cftr基因。这在wo2015157070中描述,所述文件的公开内容通过引用并入本文。
[1234]
schwank等人(cell stem cell,13:653

58,2013)使用crispr

cas9校正与人类干细胞的囊性纤维化相关的缺陷。研究小组的靶标是离子通道基因,囊性纤维化跨膜导体受体(cftr)。cftr缺失会导致所述蛋白质在囊性纤维化患者中错误折叠。使用从两个患有囊性纤维化的儿童的细胞样品发育的培养的肠干细胞,schwank等人能够使用crispr以及包含待插入修复序列的供体质粒来校正缺陷。然后,研究人员将细胞培养成肠“类器官”或微型肠,并且表明它们功能正常。在这种情况下,大约一半的克隆类器官经历了适当的遗传校正。
[1235]
在一些实施方案中,例如治疗囊性纤维化。因此,优选递送至肺。优选地校正f508突变(δ

f508,全名cftrδf508或f508del

cftr)。在一些实施方案中,靶标可以是abcc7、cf或mrp7。
[1236]
杜氏肌营养不良症
[1237]
杜氏肌营养不良症(dmd)是一种隐性的与性相关的肌肉萎缩性疾病,会影响大约1/5,000的出生男性。肌营养不良蛋白基因的突变导致骨骼肌中肌营养不良蛋白的缺失,在正常情况下,肌营养不良蛋白基因的功能是将肌纤维的细胞骨架连接到基底层。肌营养不良蛋白的缺乏是由于这些突变导致过多的钙进入体细胞,导致线粒体破裂,从而破坏了细胞。当前的治疗方法着重于缓解dmd症状,并且平均预期寿命约为26年。
[1238]
在小鼠模型中已经证明了crispr/cas9作为某些类型dmd的治疗的功效。在一项此类研究中,通过敲除突变体外显子从而产生功能蛋白,小鼠中的肌营养不良症表型得到部分校正(参见nelson等人(2016)science;long等人(2016)science;和tabebordbar等人(2016)science)。
[1239]
在一些实施方案中,治疗dmd。在一些实施方案中,通过注射递送至肌肉。
[1240]
糖原贮积病,包括1a
[1241]
糖原贮积病1a是一种由于葡萄糖
‑6‑
磷酸酶缺乏引起的遗传疾病。所述缺乏会损害肝脏从糖原和糖异生产生游离葡萄糖的能力。在一些实施方案中,靶向编码葡萄糖
‑6‑
磷酸酶的基因。在一些实施方案中,治疗糖原贮积病1a。在一些实施方案中,通过将v型效应子(以蛋白质或mrna形式)包封在脂质粒子如lnp中而递送至肝脏。
[1242]
在一些实施方案中,例如通过靶向与疾患/疾病/感染相关的多核苷酸,靶向并优选治疗糖原贮积病,包括1a。相关的多核苷酸包括dna,其可包括基因(其中基因包括任何编码序列和调控元件,例如增强子或启动子)。在一些实施方案中,相关的多核苷酸可包括slc2a2、glut2、g6pc、g6pt、g6pt1、gaa、lamp2、lampb、agl、gde、gbe1、gys2、pygl或pfkm基因。
[1243]
hurler综合征
[1244]
hurler综合征,也称为i型粘多糖贮积病(mps i)、hurler病,是一种遗传病症,由于缺乏α

l异丁糖醛酸酶(一种负责降解溶酶体中粘多糖的酶)而导致糖胺聚糖(以前称为粘多糖)的积累。hurler综合征通常被分类为溶酶体贮积病,并且在临床上与hunter综合征相关。hunter综合征是x连锁的,而hurler综合征是常染色体隐性遗传的。根据症状的严重程度,mps i分为三种亚型。所有三种类型都是由于缺乏或不足的酶α

l

艾杜糖醛酸酶水平造成的。mps i h或hurler综合征是mps i亚型中最严重的一种。其他两种类型是mps i s或scheie综合征和mps i h

s或hurler

scheie综合征。mps i父母所生的孩子携带有缺陷性idua基因,该基因已被定位到4号染色体上的4p16.3位点。该基因被命名为idua的原因是其艾杜糖醛酸酶蛋白质产物。截至2001年,已显示idua基因的52个不同突变导致了hurler综合征。通过经由逆转录病毒、慢病毒、aav和甚至非病毒载体递送艾杜糖醛酸酶基因,成功治疗mps i的小鼠、狗和猫模型。
[1245]
在一些实施方案中,靶向α

l

艾杜糖醛酸酶基因并且优选提供修复模板。
[1246]
hiv和aids
[1247]
在一些实施方案中,提供了hiv和aids的治疗、预防或诊断。靶标优选是hiv中的ccr5基因。这在wo2015148670a1中描述,所述文件的公开内容通过引用并入本文。
[1248]
β地中海贫血
[1249]
在一些实施方案中,提供了β地中海贫血的治疗、预防或诊断。靶标优选是bcl11a基因。这在wo2015148860中描述,所述文件的公开内容通过引用并入本文。
[1250]
镰状细胞病(scd)
[1251]
在一些实施方案中,提供了镰状细胞病(scd)的治疗、预防或诊断。靶标优选是hbb或bcl11a基因。这在wo2015148863中描述,所述文件的公开内容通过引用并入本文。
[1252]
单纯疱疹病毒1和2
[1253]
疱疹病毒科是由具有75

200个基因的线性双链dna基因组组成的病毒家族。出于
基因编辑的目的,最常研究的家族成员是单纯疱疹病毒

1(hsv

1),这种病毒比其他病毒载体具有多种明显优势(在vannuci等人(2003)中综述)。因此,在一些实施方案中,病毒载体是hsv病毒载体。在一些实施方案中,hsv病毒载体是hsv

1。
[1254]
hsv

1具有大约152kb双链dna的大型基因组。该基因组包含超过80个基因,其中许多可被代替或去除,从而允许30

150kb的基因插入物。衍生自hsv

1的病毒载体通常分为3组:具有复制能力的减毒载体,无复制能力的重组载体和依赖于缺陷性辅助的载体,称为扩增子。先前已经证明了使用hsv

1作为载体的基因转移,例如用于治疗神经性疼痛(参见例如wolfe等人(2009)gene ther)和类风湿性关节炎(参见例如burton等人(2001)stem cells)。
[1255]
因此,在一些实施方案中,病毒载体是hsv病毒载体。在一些实施方案中,hsv病毒载体是hsv

1。在一些实施方案中,载体用于递送一种或多种crispr组分。对于递送v型效应子和一个或多个指导rna,例如2个或更多个、3个或更多个、或4个或更多个指导rna,可能特别有用。因此,在一些实施方案中,载体在多重系统中是有用的。在一些实施方案中,该递送用于治疗神经性疼痛或类风湿性关节炎。
[1256]
在一些实施方案中,提供了hsv

1(单纯疱疹病毒1)的治疗、预防或诊断。靶标优选是hsv

1中的ul19、ul30、ul48或ul50基因。这在wo2015153789中描述,所述文件的公开内容通过引用并入本文。
[1257]
在其他实施方案中,提供了hsv

2(单纯疱疹病毒2)的治疗、预防或诊断。靶标优选是hsv

2中的ul19、ul30、ul48或ul50基因。这在wo2015153791中描述,所述文件的公开内容通过引用并入本文。
[1258]
在一些实施方案中,提供了原发性开角型青光眼(poag)的治疗、预防或诊断。靶标优选是myoc基因。这在wo2015153780中描述,所述文件的公开内容通过引用并入本文。
[1259]
过继细胞疗法
[1260]
本发明还考虑了使用本文所述的系统来修饰细胞以进行过继疗法。因此,本发明的方面涉及对选定抗原例如肿瘤相关抗原具特异性的免疫系统细胞如t细胞的过继转移(参见maus等人,2014,adoptive immunotherapy for cancer or viruses,annual review of immunology,第32卷:189

225;rosenberg和restifo,2015,adoptive cell transfer as personalized immunotherapy for human cancer,science,第348卷第6230期第62

68页;以及restifo等人,2015,adoptive immunotherapy for cancer:harnessing the t cell response.nat.rev.immunol.12(4):269

281;以及jenson和riddell,2014,design and implementation of adoptive therapy with chimeric antigen receptor

modified t cells.immunol rev.257(1):127

144)。例如,可通过改变t细胞受体(tcr)的特异性,例如通过引入具有选定肽特异性的新tcrα和β链,采用各种策略来遗传修饰t细胞(参见美国专利第8,697,854号;pct专利公开:wo2003020763、wo2004033685、wo2004044004、wo2005114215、wo2006000830、wo2008038002、wo2008039818、wo2004074322、wo2005113595、wo2006125962、wo2013166321、wo2013039889、wo2014018863、wo2014083173;美国专利第8,088,379号)。
[1261]
在一些实施方案中,本文系统可用于添加一种或多种编码抗原受体(例如tcr)的供体多核苷酸。所述系统可用于向细胞添加一种或多种编码tcr的供体多核苷酸。在一些实
例中,所述系统可用于向细胞添加一种或多种编码工程化例如嵌合抗原受体的多核苷酸。
[1262]
作为tcr修饰的替代或补充,可使用嵌合抗原受体(car)来生成对选定的靶标(例如恶性细胞)具有特异性的免疫应答细胞(例如t细胞),其中已经描述了广泛多种受体嵌合体构建体(参见美国专利第5,843,728号;第5,851,828号;第5,912,170号;第6,004,811号;第6,284,240号;第6,392,013号;第6,410,014号;第6,753,162号;第8,211,422号;以及pct公开wo9215322)。可选的car构建体可表征为属于连续的世代。第一代car通常由对抗原具有特异性的抗体的单链可变片段组成,例如包含与特定抗体的vh连接的vl,通过柔性接头,例如通过cd8α铰链结构域和cd8α跨膜结构域,连接到cd3ζ或fcrγ的跨膜和细胞内信号传导结构域(scfv

cd3ζ或scfv

fcrγ;参见美国专利第7,741,465号;美国专利第5,912,172号;美国专利第5,906,936号)。第二代car结合一个或多个共刺激分子的细胞内结构域,例如胞内域内的cd28、ox40(cd134)或4

1bb(cd137)(例如scfv

cd28/ox40/4

1bb

cd3ζ;参见美国专利第8,911,993号;第8,916,381号;第8,975,071号;第9,101,584号;第9,102,760号;第9,102,761号)。第三代car包括共刺激胞内域例如cd3ζ链、cd97、gdi la

cd18、cd2、icos、cd27、cd154、cds、ox40、4

1bb或cd28信号传导结构域的组合(例如scfv

cd28
‑4‑
1bb

cd3ζ或scfv

cd28

ox40

cd3ζ;参见美国专利第8,906,682号;美国专利第8,399,645号;美国专利第5,686,281号;pct公开第wo2014134165号;pct公开第wo2012079000号)。或者,可通过以下来协调共刺激:在抗原特异性t细胞中表达car,选择所述抗原特异性t细胞以使其在天然αβtcr接合后被激活并扩增,例如通过专业抗原呈递细胞上的抗原,伴随着共刺激。另外,可在免疫应答细胞上提供其他工程化的受体,例如以改善对t细胞攻击的靶向和/或最小化副作用。
[1263]
替代技术可用于转化靶免疫应答细胞,例如原生质体融合、脂转染、转染或电穿孔。可使用广泛多种载体,例如逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、质粒或转座子,例如睡美人转座子(参见美国专利第6,489,458号;第7,148,203号;第7,160,682号;第7,985,739号;第8,227,432号),可用于引入car,例如使用通过cd3ζ以及cd28或cd137信号传导的第二代抗原特异性car。病毒载体可例如包括基于hiv、sv40、ebv、hsv或bpv的载体。
[1264]
被靶向用于转化的细胞可包括例如t细胞,自然杀伤(nk)细胞,细胞毒性t淋巴细胞(ctl),调节性t细胞,人胚胎干细胞,肿瘤浸润淋巴细胞(til)或可能分化出淋巴样细胞的多能干细胞。表达期望的car的t细胞可例如通过与共表达癌症抗原和共刺激分子的经γ照射的激活和增殖细胞(aapc)共培养来选择。可例如通过在可溶性因子如il

2和il

21存在下在aapc上共培养来扩增工程化的car t细胞。例如,可进行这种扩增以便提供记忆性car t细胞(可例如通过非酶数字阵列和/或多板流式细胞术进行测定)。以这种方式,可提供对带有抗原的肿瘤具有特异性细胞毒性活性的car t细胞(任选地与所需趋化因子例如干扰素

γ的产生相结合)。这种car t细胞可例如用于动物模型中,例如威胁肿瘤异种移植物。
[1265]
例如前述的方法可适于提供治疗和/或增加患有疾病例如瘤形成的受试者的方法,例如通过施用有效量的包含识别结合所选抗原的受体的抗原的免疫应答细胞,其中所述结合激活免疫应答细胞,从而治疗或预防疾病(例如瘤形成、病原体感染、自身免疫性疾病或同种异体移植反应)。car t细胞疗法中的给药可例如包括以106至109个细胞/千克的
剂量施用,存在或不存在淋巴衰竭过程,例如用环磷酰胺。
[1266]
在一个实施方案中,可将所述治疗施用于进行免疫抑制治疗的患者中。由于编码这种免疫抑制剂的受体的基因的失活,可使细胞或细胞群体对至少一种免疫抑制剂具有抗性。不受理论的束缚,免疫抑制治疗应有助于在患者体内选择和扩增根据本发明的免疫应答或t细胞。
[1267]
根据本发明的细胞或细胞群体的施用可以任何适宜的方式进行,包括通过气雾吸入、注射、摄取、输液、植入或移植。可经皮下、经皮内、经肿瘤内、经结节内、经髓内、经肌内,通过静脉内或淋巴内注射,或经腹膜内向患者施用细胞或细胞群体。在一个实施方案中,本发明的细胞组合物优选通过静脉内注射施用。
[1268]
细胞或细胞群体的施用可包括施用104

109个细胞/千克体重,优选105

106个细胞/千克体重,包括那些范围内的细胞数的所有整数值。car t细胞疗法中的给药可例如包括以106至109个细胞/千克的剂量施用,存在或不存在淋巴衰竭过程,例如用环磷酰胺。可以一个或多个剂量施用细胞或细胞群体。在另一个实施方案中,有效量的细胞以单剂量施用。在另一个实施方案中,在一段时间内以多于一个剂量的方式施用有效量的细胞。施用时间在主治医师的判断范围内,并取决于患者的临床状况。细胞或细胞群体可从任何来源获得,例如血库或供体。尽管个体需求变化,但是针对特定疾病或疾患的给定细胞类型的有效量的最佳范围的确定在本领域技术人员的能力范围内。有效量是指提供治疗或预防益处的量。施用的剂量将取决于接受者的年龄、健康状况和体重,同时进行的治疗的种类(如果有的话),治疗的频率和所需效果的性质。
[1269]
在另一个实施方案中,肠胃外施用有效量的细胞或包含那些细胞的组合物。施用可以是静脉内施用。可通过在肿瘤内注射直接进行施用。
[1270]
为了防止可能的不良反应,工程化的免疫应答细胞可配备转基因安全开关,其形式为使细胞易于暴露于特定信号的转基因。例如,单纯疱疹病毒胸苷激酶(tk)基因可通过这种方式使用,例如通过在干细胞移植后引入同种异体t淋巴细胞中用作供体淋巴细胞输注(greco等人,improving the safety of cell therapy with the tk

suicide gene.front.pharmacol.2015;6:95)。在此类细胞中,施用例如更昔洛韦或阿昔洛韦的核苷前药会导致细胞死亡。可选的安全开关构建体包括可诱导的胱天蛋白酶9,例如由小分子二聚体的施用触发,该小分子二聚体将两个无功能的icasp9分子聚集在一起形成活性酶。已经描述了用于实现细胞增殖控制的广泛多种替代方法(参见美国专利公开第20130071414号;pct专利公开wo2011146862;pct专利公开wo2014011987;pct专利公开wo2013040371;zhou等人,blood,2014,123/25:3895

3905;di stasi等人,the new england journal of medicine 2011;365:1673

1683;sadelain m,the new england journal of medicine 2011;365:1735

173;ramos等人,stem cells 28(6):1107

15(2010))。
[1271]
在过继疗法的进一步改进中,可使用如本文所述的系统进行基因组编辑以使免疫应答细胞适应替代的实现方式,例如提供经编辑的car t细胞(参见poirot等人,2015,multiplex genome edited t

cell manufacturing platform for"off

the

shelf"adoptive t

cell immunotherapies,cancer res 75(18):3853)。例如,可编辑免疫应答细胞以缺失ii型和/或i型hla分子中的一些或全部的表达,或者敲除可能抑制所需免疫应答的选定基因,例如pd1基因。
[1272]
可使用如本文所述的任何系统及其使用方法来编辑细胞。系统可通过本文描述的任何方法递送至免疫细胞。在优选的实施方案中,将细胞离体编辑并转移至有需要的受试者。可编辑免疫应答细胞、car t细胞或用于过继细胞转移的任何细胞。可进行编辑以消除潜在的同种异体反应性t细胞受体(tcr),破坏化学治疗剂的靶标,阻断免疫检查点,激活t细胞和/或增加功能耗竭或功能异常的cd8 t细胞的分化和/或增殖(参见pct专利公开:wo2013176915、wo2014059173、wo2014172606、wo2014184744和wo2014191128)。编辑可能导致基因失活。
[1273]
通过使基因失活,预期目标基因不以功能蛋白形式表达。在一个特定的实施方案中,所述系统特异性催化一个靶向基因的切割,从而使所述靶向基因失活。引起的核酸链断裂通常通过同源重组或非同源末端连接(nhej)的独特机制修复。但是,nhej是一个不完善的修复过程,通常会导致切割位点的dna序列发生变化。经由非同源末端连接(nhej)进行的修复通常会导致小插入或缺失(插入/缺失),并且可用于产生特定的基因敲除。可通过本领域众所周知的方法鉴定和/或选择发生切割诱导的诱变事件的细胞。
[1274]
t细胞受体(tcr)是响应于抗原呈递而参与t细胞激活的细胞表面受体。tcr通常由两条链α和β构成,它们组装形成异二聚体并与cd3转导亚基缔合,形成存在于细胞表面上的t细胞受体复合物。tcr的每条α和β链均由免疫球蛋白样的n末端可变(v)和恒定(c)区、疏水跨膜结构域和短细胞质区域组成。关于免疫球蛋白分子,α和β链的可变区是通过v(d)j重组产生的,从而在t细胞群体内产生了多种多样的抗原特异性。但是,与识别完整抗原的免疫球蛋白相反,t细胞被经加工的肽片段与mhc分子缔合而被激活,从而为t细胞的抗原识别引入了一个额外的维度,称为mhc限制。通过t细胞受体识别供体和受体之间的mhc差异会导致t细胞增殖以及移植物抗宿主病(gvhd)的潜在发展。tcrα或tcrβ的失活可导致t细胞表面tcr的消除,从而阻止对同种异体抗原和因此gvhd的识别。但是,tcr破坏通常会导致cd3信号传导组分的消除,并改变进一步t细胞扩增的方式。
[1275]
同种异体细胞被宿主免疫系统迅速排斥。已经证明,存在于非照射的血液制品中的同种异体白细胞将持续不超过5至6天(boni,muranski等人,2008 blood 1;112(12):4746

54)。因此,为了防止同种异体细胞排斥,通常必须在一定程度上抑制宿主的免疫系统。然而,在过继细胞转移的情况下,使用免疫抑制药物也对引入的治疗性t细胞具有有害作用。因此,为了在这些情况下有效地使用过继免疫疗法方法,引入的细胞将需要对免疫抑制治疗具有抗性。因此,在一个特定的实施方案中,本发明还包括修饰t细胞以使其对免疫抑制剂具有抗性的步骤,优选通过使至少一个编码免疫抑制剂靶标的基因失活来进行。免疫抑制剂是通过若干作用机制之一抑制免疫功能的剂。免疫抑制剂可以是但不限于钙调神经磷酸酶抑制剂,雷帕霉素的靶标,白细胞介素2受体α链阻滞剂,肌苷单磷酸脱氢酶抑制剂,二氢叶酸还原酶抑制剂,皮质类固醇或免疫抑制性抗代谢物。本发明允许通过使t细胞中的免疫抑制剂的靶标失活而赋予针对t细胞的免疫抑制抗性以用于免疫疗法。作为非限制性实例,免疫抑制剂的靶标可以是免疫抑制剂的受体,例如:cd52、糖皮质激素受体(gr)、fkbp家族基因成员和亲环蛋白家族基因成员。
[1276]
免疫检查点是可减慢或停止免疫反应并防止免疫细胞的不受控制的活性对组织造成过多损害的抑制途径。在某些实施方案中,靶向的免疫检查点是程序性死亡

1(pd

1或cd279)基因(pdcd1)。在其他实施方案中,靶向的免疫检查点是细胞毒性t淋巴细胞相关抗
原(ctla

4)。在另外的实施方案中,靶向的免疫检查点是cd28和ctla4ig超家族的另一个成员,例如btla、lag3、icos、pdl1或kir。在其他另外的实施方案中,靶向的免疫检查点是tnfr超家族的成员,例如cd40、ox40、cd137、gitr、cd27或tim

3。
[1277]
其他免疫检查点包括含src同源性2结构域的蛋白酪氨酸磷酸酶1(shp

1)(watson ha等人,shp

1:the next checkpoint target for cancer immunotherapy?biochem soc trans.2016年4月15;44(2):356

62)。shp

1是一种广泛表达的抑制蛋白酪氨酸磷酸酶(ptp)。在t细胞中,它是抗原依赖性激活和增殖的负调控剂。它是一种胞质蛋白,因此不适合抗体介导的疗法,但它在激活和增殖中的作用使其成为过继转移策略中遗传操纵的有吸引力的靶标,例如嵌合抗原受体(car)t细胞。免疫检查点还可包括具有ig和itim结构域(tigit/vstm3/wucam/vsig9)和vista的t细胞免疫受体(lemercier i等人,(2015)beyond ctla

4 and pd

1,the generation z of negative checkpoint regulators.front.immunol.6:418)。
[1278]
wo2014172606涉及mt1和/或mt1抑制剂在增加耗竭的cd8 t细胞的增殖和/或活性和减少cd8 t细胞耗竭(例如,减少功能性耗竭或无反应性的cd8 免疫细胞)中的用途。在某些实施方案中,金属硫蛋白通过过继转移的t细胞中的基因编辑而被靶向。
[1279]
在某些实施方案中,基因编辑的靶标可以是参与免疫检查点蛋白表达的至少一个靶向基因座。此类靶标可包括但不限于ctla4、ppp2ca、ppp2cb、ptpn6、ptpn22、pdcd1、icos(cd278)、pdl1、kir、lag3、havcr2、btla、cd160、tigit、cd96、crtam、lair1、siglec7、siglec9、cd244(2b4)、tnfrsf10b、tnfrsf10a、casp8、casp10、casp3、casp6、casp7、fadd、fas、tgfbrii、tgfrbri、smad2、smad3、smad4、smad10、ski、skil、tgif1、il10ra、il10rb、hmox2、il6r、il6st、eif2ak4、csk、pag1、sit1、foxp3、prdm1、batf、vista、gucy1a2、gucy1a3、gucy1b2、gucy1b3、mt1、mt2、cd40、ox40、cd137、gitr、cd27、shp

1或tim

3。在优选的实施方案中,靶向与pd

1或ctla

4基因的表达有关的基因座。在其他优选的实施方案中,靶向基因的组合,例如但不限于pd

1和tigit。
[1280]
在其他实施方案中,至少两个基因被编辑。基因对可包括但不限于pd1和tcrα,pd1和tcrβ,ctla

4和tcrα,ctla

4和tcrβ,lag3和tcrα,lag3和tcrβ,tim3和tcrα,tim3和tcrβ,btla和tcrα,btla和tcrβ,by55和tcrα,by55和tcrβ,tigit和tcrα,tigit和tcrβ,b7h5和tcrα,b7h5和tcrβ,lair1和tcrα,lair1和tcrβ,siglec10和tcrα,siglec10和tcrβ,2b4和tcrα,2b4和tcrβ。
[1281]
无论是在t细胞遗传修饰之前还是之后,通常可使用例如美国专利6,352,694;6,534,055;6,905,680;5,858,358;6,887,466;6,905,681;7,144,575;7,232,566;7,175,843;5,883,223;6,905,874;6,797,514;6,867,041;和7,572,631中所述的方法来激活和扩增t细胞。t细胞可在体外或体内扩增。
[1282]
除非另有说明,否则本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组dna的常规技术,它们在本领域技术范围内。参见molecular cloning:a laboratory manual,第2版(1989)(sambrook,fritsch和maniatis);molecular cloning:a laboratory manual,第4版(2012)(green和sambrook);current protocols in molecular biology(1987)(f.m.ausubel等人编辑);methods in enzymology系列(academic press,inc.);pcr 2:a practical approach(1995)
(m.j.macpherson,b.d.hames和g.r.taylor编辑);antibodies,a laboratory manual(1988)(harlow和lane编辑);antibodies a laboratory manual,第2版(2013)(e.a.greenfield编辑);以及animal cell culture(1987)(r.i.freshney编辑)。
[1283]
除非另有说明,否则本发明的实践采用常规技术来生成遗传修饰小鼠。参见marten h.hofker和jan van deursen,transgenic mouse methods and protocols,第2版(2011)。
[1284]
在一些实施方案中,本文所述的发明涉及过继免疫疗法的方法,其中通过crispr离体编辑t细胞以调节至少一个基因,并且随后施用于有需要的患者。在一些实施方案中,crispr编辑包括敲除或敲低经编辑的t细胞中至少一种靶基因的表达。在一些实施方案中,除了调节靶基因之外,还通过crispr离体编辑t细胞以(1)敲入编码嵌合抗原受体(car)或t细胞受体(tcr)的外源基因,(2)敲除或敲低免疫检查点受体的表达,(3)敲除或敲低内源性tcr的表达,(4)敲除或敲低人类白细胞抗原类别i(hla

i)蛋白的表达,和/或(5)敲除或敲低编码受外源car或tcr靶向的抗原的内源基因的表达。
[1285]
在一些实施方案中,使t细胞与编码crispr效应蛋白的腺相关病毒(aav)载体和包含可与靶序列杂交的指导序列、tracr配对序列和可与tracr配对序列杂交的tracr序列的指导分子离体接触。在一些实施方案中,使t细胞(例如通过电穿孔)与包含与指导分子复合的crispr效应蛋白的核糖核蛋白(rnp)离体接触,其中所述指导分子包含可与靶序列杂交的指导序列、tracr配对序列以及可与tracr配对序列杂交的tracr序列。参见rupp等人,scientific reports 7:737(2017);liu等人,cell research 27:154

157(2017)。在一些实施方案中,使t细胞(例如通过电穿孔)与编码crispr效应蛋白的mrna以及包含可与靶序列杂交的指导序列、tracr配对序列和可与tracr配对序列杂交的tracr序列的指导分子离体接触。参见eyquem等人,nature543:113

117(2017)。在一些实施方案中,t细胞不与慢病毒或逆转录病毒载体离体接触。
[1286]
在一些实施方案中,所述方法包括通过crispr离体编辑t细胞以敲入编码car的外源基因,从而允许经编辑的t细胞基于位于细胞表面上的特定蛋白的表达来识别癌细胞。在一些实施方案中,通过crispr离体编辑t细胞以敲入编码tcr的外源基因,从而允许经编辑的t细胞识别源自癌细胞表面或内部的蛋白质。在一些实施方案中,所述方法包括提供外源car编码或tcr编码序列作为供体序列,其可通过同源性定向修复(hdr)整合到由crispr指导序列靶向的基因组基因座中。在一些实施方案中,将外源car或tcr靶向内源tcrα恒定(trac)基因座可减少tonic car信号传导并促进在单次或重复暴露于抗原后car的有效内在化和重新表达,从而延迟效应t细胞分化和耗竭。参见eyquem等人,nature 543:113

117(2017)。
[1287]
在一些实施方案中,所述方法包括通过crispr离体编辑t细胞以阻断一种或多种免疫检查点受体以减少癌细胞的免疫抑制。在一些实施方案中,通过crispr离体编辑t细胞以敲除或敲低参与程序性死亡

1(pd

1)信号通路的内源基因,例如pd

1和pd

l1。在一些实施方案中,通过crispr离体编辑t细胞以突变pdcd1基因座或cd274基因座。在一些实施方案中,使用靶向pd

1的第一个外显子的一个或多个指导序列,通过crispr离体编辑t细胞。参见rupp等人,scientific reports 7:737(2017);liu等人,cell research 27:154

157(2017)。
population mod ification of the malaria vector mosquito anopheles stephensi,pnas 2015,印刷版之前的电子版,2015年11月23日,doi:10.1073/pnas.1521077112;esvelt等人,2014,concerning rna

guided gene drives for the alteration of wild populations elife 2014;3:e03401)。在选定的实施方案中,可选择在基因组中几乎没有脱靶位点的靶序列。使用多个指导rna靶向靶基因座内的多个位点,可能会增加切割频率并阻碍抗驱动等位基因的进化。截短的指导rna可能会减少脱靶切割。可使用成对的切口酶代替单个核酸酶,以进一步提高特异性。基因驱动构建体可包括编码转录调节因子的货物序列,例如以激活同源重组基因和/或阻遏非同源末端连接。可在必需基因中选择目标位点,以便非同源末端连接事件可能导致致死性,而不是产生抗驱动等位基因。基因驱动构建体可经工程化以在一定温度范围下在多种宿主中发挥功能(cho等人,2013,rapid and tunable control of protein stabi lity in caenorhabditis elegans using a small molecule,plos one 8(8):e72393.doi:10.1371/journal.pone.0072393)。
[1293]
异种移植
[1294]
本发明还考虑了本文所述的系统提供适合使用的rna指导的dna核酸酶以提供用于移植的修饰组织的用途。例如,rna指导的dna核酸酶可用于敲除、敲低或破坏动物(例如转基因猪(例如人血红素加氧酶

1转基因猪系))中的选定基因,例如通过破坏编码由人类免疫系统识别的表位的基因即异种抗原基因的表达。用于破坏的候选猪基因可例如包括α(1,3)

半乳糖基转移酶和胞苷单磷酸

n

乙酰神经氨酸羟化酶基因(参见pct专利公开wo 2014/066505)。另外,编码内源性逆转录病毒的基因,例如编码所有猪内源性逆转录病毒的基因,可能会被破坏(参见yang等人,2015,genome

wide inactivation of porcine endogenous retroviruses(pervs),science,2015年11月27日:第350卷第6264期,第1101

1104页)。另外,rna指导的dna核酸酶可用于靶向异种移植供体动物中其他基因的整合位点,例如人类cd55基因,以提高针对超急性排斥的保护。
[1295]
通用基因疗法的考虑因素
[1296]
疾病相关基因和多核苷酸以及疾病特定信息的实例可获自在万维网上可用的mckusick

nathans institute of genetic medicine,johns hopkins university(baltimore,md.)和national center for biotechnology information,national library of medicine(bethesda,md.)。
[1297]
这些基因和途径中的突变可导致产生不当的蛋白质或不当量的蛋白质,从而影响功能。基因、疾病和蛋白质的其他实例在此通过从2012年12月12日提交的美国临时申请61/736,527引用而并入。此类基因、蛋白质和途径可以是本发明的crispr复合物的靶多核苷酸。疾病相关基因和多核苷酸的实例列于表7和表8。信号传导生化途径相关的基因和多核苷酸的实例列于表9。
[1298]
表7
[1299]
[1300][1301]
表8:
[1302]
[1303]
[1304]
[1305]
[1306][1307]
表9:
[1308]
[1309]
[1310]
[1311]
[1312]
[1313]
[1314]
[1315]
[1316]
[1317]
[1318]
[1319]
[1320]
[1321][1322]
本发明的实施方案还涉及与敲除基因、扩增基因和修复与dna重复不稳定性和神经系统病症相关的特定突变有关的方法和组合物(robert d.wells,tetsuo ashizawa,genetic instabilities and neurological diseases,第二版,academic press,2011年10月13日,

medical)。已发现串联重复序列的特定方面与超过二十种人类疾病有关(new insights into repeat instability:role of rna
·
dna hybrids.mcivor ei,polak u,napierala m.rna biol.2010年9

10月;7(5):551

8)。可利用本发明的效应蛋白系统来校正基因组不稳定性的这些缺陷。
[1323]
本发明的若干其他方面涉及校正与广泛范围的遗传疾病相关的缺陷,所述遗传疾病在美国国立卫生研究院的网站上的“遗传病症”小节下有进一步描述(网站health.nih.gov/topic/geneticdisorders)。遗传性脑疾病可包括但不限于肾上腺脑白质营养不良、胼胝体发育不良(agenesis of the corpus callosum)、爱卡迪综合征(aicardi syndrome)、阿尔珀斯病(alpers'disease)、阿尔茨海默病、巴特综合征(barth syndrome)、
巴滕病(batten disease)、cadasil、小脑变性、法布里氏病(fabry's disease)、格斯特曼

施特劳斯勒

舍因克病(gerstmann

straussler

scheinker disease)、亨廷顿病和其他三联体重复病症、雷氏病(leigh's disease)、lesch

nyhan综合征、孟克斯病(menkes disease)、线粒体肌病和ninds空洞脑。这些疾病在美国国立卫生研究院网站“遗传性脑病症”小节中有进一步描述。
[1324]
应用的其他实施方案
[1325]
在特定的实施方案中,本文描述的方法可涉及靶向一个或多个目标多核苷酸靶标。目标多核苷酸靶标可以是与特定疾病或其治疗有关,与给定的目标性状的产生有关或与目标分子的产生有关的靶标。当提到“多核苷酸靶标”的靶向时,这可包括靶向一个或多个编码区、内含子、启动子和任何其他5'或3'调控区,例如终止区、核糖体结合位点、增强子、沉默子等。所述基因可编码任何目标蛋白质或rna。因此,靶标可以是可被转录成mrna、trna或rrna的编码区,但也可以是参与其复制、转录和调控的蛋白质的识别位点。
[1326]
在特定的实施方案中,本文所述的方法可涉及靶向一个或多个目标基因,其中至少一个目标基因编码长的非编码rna(lncrna)。尽管已经发现lncrna对于细胞功能至关重要。由于已发现每种细胞类型所必需的lncrna均不同(c.p.fulco等人,2016,science,doi:10.1126/science.aag2445;n.e.sanjana等人,2016,science,doi:10.1126/science.aaf8325),因此本文提供的方法可能涉及确定与目标细胞的细胞功能相关的lncrna的步骤。
[1327]
在通过整合外源多核苷酸模板修饰靶多核苷酸的示例性方法中,通过crispr复合物将双链断裂引入基因组序列中,经由同源重组外源多核苷酸模板修复该断裂,以便将模板整合到基因组中。双链断裂的存在促进了模板的整合。
[1328]
在其他实施方案中,本发明提供了一种修饰多核苷酸在真核细胞中表达的方法。所述方法包括通过使用与多核苷酸结合的crispr复合物来增加或减少靶多核苷酸的表达。
[1329]
在一些方法中,可使靶多核苷酸失活以影响细胞中表达的修饰。例如,当crispr复合物与细胞中的靶序列结合时,靶多核苷酸被灭活,使得所述序列不被转录,不产生编码蛋白,或者所述序列不用作野生型序列。例如,可使蛋白质或微小rna编码序列失活,从而不产生蛋白质。
[1330]
在一些方法中,可使控制序列失活,因此其不再起控制序列的作用。如本文所用,“控制序列”是指影响核酸序列的转录、翻译或可及性的任何核酸序列。控制序列的实例包括启动子、转录终止子,并且增强子是控制序列。失活的靶序列可包括缺失突变(即,一个或多个核苷酸的缺失),插入突变(即,一个或多个核苷酸的插入)或无义突变(即,一个核苷酸被另一核苷酸取代以便引入终止密码子)。在一些方法中,靶序列的失活导致靶序列的“敲除”。
[1331]
本文还提供了功能基因组学的方法,所述方法涉及通过引入多个组合扰动来鉴定细胞相互作用,以及将观察到的基因组、遗传、蛋白质组学、表观遗传和/或表型效应与在单个细胞中检测到的扰动相关联,也称为“扰动测序(perturb

seq)”。在一个实施方案中,这些方法结合了单细胞rna测序(rna

seq)和基于成簇规则间隔短回文重复序列(crispr)的扰动(dixit等人,2016,cell 167,1853

1866;adamson等人,2016,cell 167,1867

1882)。通常,这些方法涉及向细胞群体中的多个细胞引入许多组合扰动,其中多个细胞中的每个
细胞接受至少一种扰动,检测单个细胞中与一个或多个没有受到任何扰动的细胞相比的基因组、遗传、蛋白质组、表观遗传和/或表型差异,并检测单个细胞中的扰动;以及通过应用考虑到测量差异的协变量的模型来确定与扰动有关的测量差异,从而推断出细胞间和/或细胞内网络或回路。更特别地,单细胞测序包括细胞条形码,由此记录每个rna的起源细胞。更具体地,单细胞测序包括独特的分子标识符(umi),由此确定单个细胞中所测量信号的捕获率,例如转录物拷贝数或探针结合事件。
[1332]
这些方法可用于细胞回路的组合探测,剖析细胞回路,描绘分子途径和/或鉴定用于治疗发展的相关靶标。更具体地,这些方法可用于基于细胞的分子谱来鉴定细胞群。有机状态(例如疾病)和诱导状态(例如通过小分子)之间基因表达谱的相似性可鉴定临床上有效的疗法。
[1333]
因此,在特定的实施方案中,本文提供的治疗方法包括:使用如上所述的扰动测序,针对从受试者分离的细胞群体,确定最佳的治疗靶标和/或治疗剂。
[1334]
在特定的实施方案中,本文在其他地方提及的扰动测序方法用于确定分离的细胞或细胞系中可能影响目标分子的产生的细胞回路。
[1335]
本发明可用作其中传输结果或数据的研究程序的一部分。计算机系统(或数字设备)可用于接收、传输、显示和/或存储结果,分析数据和/或结果,和/或产生结果和/或数据和/或分析的报告。计算机系统可被理解为可从介质(例如软件)和/或网络端口(例如从互联网)读取指令的逻辑装置,其可任选地连接到具有固定介质的服务器。计算机系统可包括以下中的一者或多者:cpu,磁盘驱动器,例如键盘和/或鼠标的输入设备以及显示器(例如监视器)。数据通信,例如指令或报告的传输,可通过通信介质到达本地或远程位置的服务器来实现。通信介质可包括发送和/或接收数据的任何手段。例如,通信介质可以是网络连接、无线连接或互联网连接。这样的连接可提供通过万维网(world wide web)的通信。可预想,与本发明有关的数据可通过这样的网络或连接(或用于发送信息的任何其他合适的手段,包括但不限于邮寄物理报告,例如打印件)来传输以供接收者接收和/或审查。接收器可以是但不限于个人或电子系统(例如一台或多台计算机和/或一台或多台服务器)。在一些实施方案中,计算机系统包括一个或多个处理器。处理器可与计算机系统的一个或多个控制器、计算单元和/或其他单元相关联,或者根据需要植入固件中。如果以软件实施,则例程可存储在任何计算机可读存储器中,例如ram、rom、闪存、磁盘、激光盘或其他合适的存储介质中。同样,可经由任何已知的传递方法将该软件传递给计算设备,例如,通过例如电话线、互联网、无线连接等的通信信道,或者经由可移动介质如计算机可读磁盘、闪存驱动器等。各个步骤可被实现为各种区块、操作、工具、模块和技术,而这些区块、操作、工具、模块和技术又可以硬件、固件、软件或者硬件、固件和/或软件的任意组合来实现。当以硬件实现时,一些或全部区块、操作、技术等可例如以定制集成电路(ic)、专用集成电路(asic)、现场可编程逻辑阵列(fpga)、可编程逻辑阵列(pla)等来实现。客户端

服务器、关系数据库架构可在本发明的实施方案中使用。客户端

服务器架构是其中网络上的每台计算机或处理器都是客户端或服务器的网络架构。服务器计算机通常是专用于管理磁盘驱动器(文件服务器)、打印机(打印服务器)或网络流量(网络服务器)的功能强大的计算机。客户端计算机包括用户在其上运行应用程序的pc(个人计算机)或工作站,以及如本文所公开的示例输出设备。客户端计算机依靠服务器计算机来获取资源,例如文件、设备甚至处理能力。在本发明
的一些实施方案中,服务器计算机处理所有数据库功能。客户端计算机可具有处理所有前端数据管理的软件,并且还可以接收来自用户的数据输入。包括计算机可执行代码的机器可读介质可采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,例如任何计算机中的任何存储设备等,例如可用于实现附图中所示的数据库等。易失性存储介质包括动态存储器,例如这种计算机平台的主存储器。有形的传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内总线的电线。载波传输介质可采用电信号或电磁信号或声波或光波的形式,例如在射频(rf)和红外(ir)数据通信期间生成的那些。因此,计算机可读介质的常见形式包括例如:软盘,软磁盘,硬盘,磁带,任何其他磁性介质,cd

rom,dvd或dvd

rom,任何其他光学介质,打孔卡纸磁带,带孔图案的任何其他物理存储介质,ram,rom,prom和eprom,flash

eprom,任何其他存储芯片或盒带,传输数据或指令的载波,传输此类载波的电缆或链接,或计算机可从中读取编程代码和/或数据的任何其他介质。这些形式的计算机可读介质中的许多可能涉及将一个或多个指令的一个或多个序列传送给处理器以执行。因此,本发明包括执行本文所讨论的任何方法以及存储和/或传输数据和/或由此产生的结果和/或其分析,以及执行本文所讨论的任何方法的产物,包括中间体。
[1336]
在一些实施方案中,所述系统或复合物可靶向核酸分子,例如,crispr

v型效应复合物可靶向并切割或切刻或简单地位于靶dna分子上(取决于v型效应子是否具有使其成为切口酶或“死”的突变)。这样的系统或复合物适用于实现候选疾病基因的组织特异性和时间控制的靶向缺失。实例包括但不限于参与胆固醇和脂肪酸代谢的基因、淀粉样蛋白疾病、显性阴性疾病、潜伏病毒感染以及其他疾病。因此,此类系统或复合物的靶序列可在候选疾病基因中,例如:
[1337]
表10
[1338]
[1339][1340]
试剂盒
[1341]
在另一方面,本公开包括试剂盒和多组分试剂盒。在整个本说明书中使用的术语“多组分试剂盒”和“试剂盒”是指包含执行指定方法(例如,如本文所教导的检测、定量或分离免疫细胞的方法)所必需的组分的产品,包装以便允许它们的运输和储存。适合于包装包含在试剂盒中的组分的材料包括晶体、塑料(例如聚乙烯、聚丙烯、聚碳酸酯)、瓶子、烧瓶、小瓶、安瓿、纸、封套或其他类型的容器、载体或支撑物。当试剂盒包含多种组分时,所述组分的至少子集(例如,多种组分中的两种或更多种)或所有组分可物理分离,例如包含在分离的容器、载体或支撑物中或之上。包含在试剂盒中的组分对于执行指定的方法可能足够或可能不足够,使得外部试剂或物质对于执行所述方法可能分别不需要或需要。通常,试剂盒与标准实验室设备例如液体处理设备、环境(例如温度)控制设备、分析仪器等结合使用。除了如本文教导的所列举的粘合剂之外,例如,抗体、杂交探针、扩增和/或测序引物,任选地提供在阵列或微阵列上,本发明试剂盒还可包括以下中的一些或全部:溶剂,缓冲液(例如但不限于组氨酸缓冲液、柠檬酸盐缓冲液、琥珀酸盐缓冲液、醋酸盐缓冲液、磷酸盐缓冲液、甲酸盐缓冲液、苯甲酸盐缓冲液、tris(tris(羟甲基)

氨基甲烷)缓冲液或马来酸盐缓冲液,或其混合物),酶(例如但不限于热稳定dna聚合酶),可检测标记,检测试剂,和对照制剂(阳性和/或阴性),可用于指定的方法。通常,试剂盒还可包括其使用说明,例如在印刷插页上或在计算机可读介质上。当在本上下文中使用时,所述术语可与术语“制品”互换使用,“制品”广泛地涵盖任何人造有形结构产品。
[1342]
其他实施方案
[1343]
本技术还提供了如以下编号的陈述中所阐述的方面和实施方案:
[1344]
陈述1.一种用于插入供体多核苷酸的工程化核酸靶向系统,所述系统包含:一种或多种crispr相关转座酶蛋白或其功能片段;cas蛋白;以及能够与所述cas蛋白复合并引
导指导物

cas蛋白复合物与靶多核苷酸的靶序列的序列特异性结合的指导分子。
[1345]
陈述2.如陈述1所述的系统,其中所述一种或多种crispr相关转座酶蛋白包含tnsb和tnsc。
[1346]
陈述3.如陈述1

2中任一项所述的系统,其中所述一种或多种crispr相关转座酶蛋白包含:a)tnsa、tnsb、tnsc和tniq,b)tnsa、tnsb和tnsc,c)tnsb、tnsc和tniq,d)tnsa、tnsb和tniq,e)tnse,f)tnia、tnib和tniq,g)tnsb、tnsc和tnsd,或h)它们的任何组合。
[1347]
陈述4.如陈述1

3中任一项所述的系统,其中所述一种或多种crispr相关转座酶蛋白包含tnsb、tnsc和tniq。
[1348]
陈述5.如陈述1

4中任一项所述的系统,其中所述tnsb、tnsc和tniq由表26或表27中的多核苷酸编码,或者是表28或表29中的蛋白质。
[1349]
陈述6.如陈述1

5中任一项所述的系统,其中所述tnse不与dna结合。
[1350]
陈述7.如陈述1

6中任一项所述的系统,其中所述一种或多种crispr相关转座酶蛋白是一种或多种tn5转座酶。
[1351]
陈述8.如陈述1

7中任一项所述的系统,其中所述一种或多种crispr相关转座酶蛋白是一种或多种tn7转座酶。
[1352]
陈述9.如陈述1

8中任一项所述的系统,其中所述一种或多种crispr相关转座酶蛋白包含tnpa。
[1353]
陈述10.如陈述1

9中任一项所述的系统,其中所述一种或多种crispr相关转座酶蛋白包含tnpais608。
[1354]
陈述11.如陈述1

10中任一项所述的系统,所述系统还包含用于插入所述靶多核苷酸中的供体多核苷酸。
[1355]
陈述12.如陈述11所述的系统,其中所述供体多核苷酸将被插入在所述靶多核苷酸中pam序列下游40至100个碱基之间的位置。
[1356]
陈述13.如陈述11或12所述的系统,其中所述供体多核苷酸的侧翼是右端序列元件和左端序列元件。
[1357]
陈述14.如陈述11、12或13所述的系统,其中所述供体多核苷酸:a)向所述靶多核苷酸引入一个或多个突变,b)在所述靶多核苷酸中引入或校正提前终止密码子,c)破坏剪接位点,d)恢复或引入剪接位点,e)在靶多核苷酸的一个或两个等位基因处插入基因或基因片段,或f)它们的组合。
[1358]
陈述15.如陈述14所述的系统,其中由所述供体多核苷酸引入的所述一个或多个突变包括取代、缺失、插入或它们的组合。
[1359]
陈述16.如陈述15所述的系统,其中所述一个或多个突变导致所述靶多核苷酸上的开放阅读框的移位。
[1360]
陈述17.如陈述15或16所述的系统,其中所述供体多核苷酸长度在100个碱基和30kb之间。
[1361]
陈述18.如陈述1

17中任一项所述的系统,其中所述cas蛋白是v型cas蛋白。
[1362]
陈述19.如陈述1

18中任一项所述的系统,其中所述v型cas蛋白是v

j型cas蛋白。
[1363]
陈述20.如陈述1

19中任一项所述的系统,其中所述cas蛋白是cas12。
[1364]
陈述21.如陈述20所述的系统,其中所述cas12是cas12a或cas12b。
[1365]
陈述22.如陈述20或21所述的系统,其中所述cas 12是cas12k。
[1366]
陈述23.如陈述22所述的系统,其中所述cas12k由表26或表27中的多核苷酸编码,或者是表28或表29中的蛋白质。
[1367]
陈述24.如陈述22或23所述的系统,其中所述cas12k属于图2a和图2b或表26的生物体。
[1368]
陈述25.如陈述1

24中任一项所述的系统,其中所述cas蛋白包含激活突变。
[1369]
陈述26.如陈述1

25中任一项所述的系统,其中所述cas蛋白是i型cas蛋白。
[1370]
陈述27.如陈述1

26中任一项所述的系统,其中所述i型cas蛋白包括cas5f、cas6f、cas7f和cas8f。
[1371]
陈述28.如陈述1

27中任一项所述的系统,其中所述i型cas蛋白包括cas8f

cas5f、cas6f和cas7f。
[1372]
陈述29.如陈述1

28中任一项所述的系统,其中所述i型cas蛋白是i

f型cas蛋白。
[1373]
陈述30.如陈述1

29中任一项所述的系统,其中所述cas蛋白是ii型cas蛋白。
[1374]
陈述31.如陈述30所述的系统,其中与野生型对应物相比,所述ii型cas蛋白是突变的cas蛋白。
[1375]
陈述32.如陈述31所述的系统,其中所述突变的cas蛋白是突变的cas9。
[1376]
陈述33.如陈述32所述的系统,其中所述突变的cas9是cas9d10a。
[1377]
陈述34.如陈述1

33中任一项所述的系统,其中所述cas蛋白缺乏核酸酶活性。
[1378]
陈述35.如陈述1

34中任一项所述的系统,所述系统还包含供体多核苷酸。
[1379]
陈述36.如陈述1

35中任一项所述的系统,其中所述crispr

cas系统包含dna结合结构域。
[1380]
陈述37.如陈述1

36中任一项所述的系统,其中所述dna结合结构域是死cas蛋白。
[1381]
陈述38.如陈述37所述的系统,其中所述死cas蛋白是dcas9、dcas12a或dcas12b。
[1382]
陈述39.如陈述1

38中任一项所述的系统,其中所述dna结合结构域是rna指导的dna结合结构域。
[1383]
陈述40.如陈述1

39中任一项所述的系统,其中所述靶核酸具有pam。
[1384]
陈述41.如陈述40所述的系统,其中所述pam在所述靶标的5'侧并且包含tttn或attn。
[1385]
陈述42.如陈述40或41所述的系统,其中所述pam包含ngtn、rgtr、vgtd或vgtr。
[1386]
陈述43.如陈述42所述的系统,其中所述指导分子是由表26中的多核苷酸编码的rna分子。
[1387]
陈述44.一种工程化系统,所述工程化系统包含一种或多种编码陈述1

43中任一项所述的组分(a)、(b)和/或(c)的多核苷酸。
[1388]
陈述45.如陈述44所述的系统,其中一种或多种多核苷酸可操作地连接到一种或多种调控序列。
[1389]
陈述46.如陈述44

45中任一项所述的系统,所述系统包含转座子的一种或多种组分。
[1390]
陈述47.如陈述44

46中任一项所述的系统,其中所述蛋白质和核酸组分中的一者或多者由载体包含。
[1391]
陈述48.如陈述44

47中任一项所述的系统,其中所述一种或多种转座酶包含tnsb、tnsc和tniq,并且所述cas蛋白是cas12k。
[1392]
陈述49.如陈述44

48中任一项所述的系统,其中所述一种或多种多核苷酸选自表26中的多核苷酸。
[1393]
陈述50.一种载体,所述载体包含一种或多种编码陈述1

49中任一项所述的组分(a)、(b)和/或(c)的多核苷酸。
[1394]
陈述51.一种细胞或其后代,所述细胞或其后代包含陈述50所述的载体。
[1395]
陈述52.一种细胞,所述细胞包含陈述1至50中任一项所述的系统,或其后代,所述后代包含由所述系统进行的一个或多个插入。
[1396]
陈述53.如陈述51或52所述的细胞,其中所述细胞是原核细胞。
[1397]
陈述54.如陈述51

53中任一项所述的细胞,其中所述细胞是真核细胞。
[1398]
陈述55.如陈述51

54中任一项所述的细胞,其中所述细胞是哺乳动物细胞、非人灵长类动物细胞或人类细胞。
[1399]
陈述56.如陈述51

55中任一项所述的细胞,其中所述细胞是植物细胞。
[1400]
陈述57.一种生物体或其群体,所述生物体或其群体包含陈述51

56中任一项所述的细胞。
[1401]
陈述58.一种将供体多核苷酸插入细胞中的靶多核苷酸中的方法,所述方法包括向所述细胞中引入:a)一种或多种crispr相关转座酶或其功能片段,b)cas蛋白,c)能够与靶多核苷酸上的靶序列结合并被设计成与所述cas蛋白形成crispr

cas复合物的指导分子,以及d)供体多核苷酸,其中所述crispr

cas复合物将所述crispr相关转座酶引导至所述靶序列,并且所述crispr相关转座酶将所述供体多核苷酸插入所述靶序列处或附近的所述靶多核苷酸中。
[1402]
陈述59.如陈述58所述的方法,其中所述供体多核苷酸将被插入到所述靶多核苷酸中pam序列下游40至100个碱基之间的位置。
[1403]
陈述60.如陈述59所述的方法,其中所述供体多核苷酸:a)向所述靶多核苷酸引入一个或多个突变,b)在所述靶多核苷酸中校正或引入提前终止密码子,c)破坏剪接位点,d)恢复或引入剪接位点,e)在靶多核苷酸的一个或两个等位基因处插入基因或基因片段,或f)它们的组合。
[1404]
陈述61.如陈述59或60所述的方法,其中由所述供体多核苷酸引入的所述一个或多个突变包括取代、缺失、插入或它们的组合。
[1405]
陈述62.如陈述59

61中任一项所述的方法,其中所述一个或多个突变导致所述靶多核苷酸上的开放阅读框的移位。
[1406]
陈述63.如陈述59

62中任一项所述的方法,其中所述供体多核苷酸长度在100个碱基和30kb之间。
[1407]
陈述64.如陈述59

63中任一项所述的方法,其中组分(a)、(b)和(c)中的一者或多者由与在所述细胞中表达的调控序列可操作地连接的核酸表达。
[1408]
陈述65.如陈述59

64中任一项所述的方法,其中将组分(a)、(b)和(c)中的一者或多者引入粒子中。
[1409]
陈述66.如陈述59

65中任一项所述的方法,其中所述粒子包含核糖核蛋白(rnp)。
[1410]
陈述67.如陈述59

66中任一项所述的方法,其中所述细胞是原核细胞。
[1411]
陈述68.如陈述59

67中任一项所述的方法,其中所述细胞是真核细胞。
[1412]
陈述69.如陈述59

68中任一项所述的方法,其中所述细胞是哺乳动物细胞、非人灵长类动物细胞或人类细胞。
[1413]
陈述70.如陈述59

69中任一项所述的方法,其中所述细胞是植物细胞。
[1414]
陈述71.一种用于将多核苷酸插入靶核酸中的工程化核酸靶向系统,所述系统包含:a)工程化的c2c5蛋白或其片段,其被设计成与tnsbc形成复合物并连接到可编程dna结合结构域,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向所述靶核酸的指导物,c)i)tnsa、tnsb和tniq,或ii)tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端序列元件和左端序列元件。
[1415]
陈述72.一种用于将多核苷酸插入靶核酸中的工程化核酸靶向系统,所述系统包含:a)cas5678f复合物的组分,其被设计成与tnsabc

tniq结合或与连接到可编程dna结合结构域的tnsabc结合,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向所述靶核酸的指导物,c)i)tnsa、tnsb、tnsc和tniq,或ii)tnsa、tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端序列元件和左端序列元件。
[1416]
陈述73.一种将多核苷酸插入细胞中的靶核酸中的方法,所述方法包括向所述细胞中引入:a)工程化的tnse蛋白或其片段,其被设计成与tnsabc或tnsbc形成复合物并连接到可编程dna结合结构域,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向所述靶核酸的指导物,c)i)tnsa、tnsb和tnsc,或ii)tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端序列元件和左端序列元件,其中所述指导物引导所述靶核酸的切割,由此插入所述多核苷酸。
[1417]
陈述74.一种将多核苷酸插入细胞中的靶核酸中的方法,所述方法包括向所述细胞中引入:a)工程化的c2c5蛋白或其片段,其被设计成与tnsbc形成复合物并连接到可编程dna结合结构域,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向所述靶核酸的指导物,c)i)tnsa、tnsb和tniq,或ii)tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端序列元件和左端序列元件,其中所述指导物引导所述靶核酸的切割,由此插入所述多核苷酸。
[1418]
陈述75.一种将多核苷酸插入细胞中的靶核酸中的方法,所述方法包括向所述细胞中引入:a)cas5678f复合物的组分,其被设计成与tnsabc

tniq结合或与连接到可编程dna结合结构域的tnsabc结合,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向所述靶核酸的指导物,c)i)tnsa、tnsb、tnsc和tniq,或ii)tnsa、tnsb和tnsc,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端序列元件和左端序列元件。
[1419]
陈述76.一种用于将多核苷酸插入靶核酸中的工程化核酸靶向系统,所述系统包含:a)工程化的c2c5蛋白或其片段,其被设计成与tnsbc形成复合物并连接到可编程dna结合结构域,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向所述靶核酸的指导物,c)i)tnia、tnib和tniq,或ii)tnsb和tnsc,和tnsd,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端序列元件和左端序列元件。
[1420]
陈述77.一种将多核苷酸插入细胞中的靶核酸中的方法,所述方法包括向所述细胞中引入:a)cas5678f复合物的组分,其被设计成与tnsabc

tniq结合或与连接到可编程
dna结合结构域的tnsabc结合,b)被设计成与所述可编程dna结合结构域形成复合物并将所述复合物靶向所述靶核酸的指导物,c)i)tnia、tnib和tniq,或ii)tnsb和tnsc,和tnsd,以及d)包含待插入的核酸的多核苷酸,其侧翼是右端序列元件和左端序列元件。
[1421]
陈述78.如陈述1

77中任一项所述的系统或组合物,所述系统或组合物用作治疗疾病的药物。
[1422]
陈述79.如陈述1

77中任一项所述的系统或组合物,所述系统或组合物用于治疗疾病。
[1423]
实施例
[1424]
实施例1

示例cast系统
[1425]
如图3和下表所示,蓝藻霍夫曼伪枝藻utex 2349基因组编码转座子和crispr相关基因产物:
[1426]
表11
[1427]
[1428]
[1429]
[1430]
[1431]
[1432]
[1433]
[1434]
[1435]
[1436]
[1437]
[1438]
[1439]
[1440]
[1441]
[1442]
[1443][1444]
在一个实施方案中,tnsb蛋白可以是以登录号wp_084763316.1定义的蛋白。在另一个实施方案中,tnsc蛋白可以是以登录号wp_029636336.1定义的蛋白。在另一个实施方案中,tniq蛋白可以是以登录号wp_029636334.1定义的蛋白。在另一个实施方案中,cas12k蛋白可以是以登录号wp_029636312.1定义的蛋白。
[1445]
tracrrna(参见图4和图5):表12
[1446][1447][1448]
pam测定
[1449]
确定tnf7相关crispr

cas的pam序列的一种方法是通过纯化cas5678f复合物,并将所述复合物与针对质粒文库的指导物一起温育,其中靶序列在5'或3'侧的侧翼为8nt的随机化序列。与cas5678f crrna复合物结合的dna被分离并测序,以揭示促进cas5f

8f与其靶dna复合的序列基序。为了确定c2c5的pam序列,用c2c5代替cas5678f复合物进行了类似的筛选。
[1450]
c2c5pam发现的另一种方法是使用激活的c2c5。将包含在5'或3'侧的侧翼为8nt的随机化序列的靶序列的质粒文库与c2c5crrna复合物一起温育。pam序列是通过对含有靶标的质粒进行测序来鉴定以鉴定耗尽的8bp序列来确定的。
[1451]
c2c5催化残基
[1452]
为了激活c2c5,引入催化残基以恢复核酸酶活性。可通过与同源cas12蛋白进行比较来鉴定用于取代的候选残基。
[1453]
tracrrna测定
[1454]
转录物在c2c5基因座上进行测序和映射,并鉴定了推定tracrrna。(图4a、图4b)。图4c描绘了具有正向重复序列的crrna的tracrrna_1的预测结构。
[1455]
推定tracrrna 1

4与包含序列guggguugaaag的crrna折叠(图5)。
[1456]
实施例2

在大肠杆菌中插入和pam偏好
[1457]
为了在大肠杆菌中产生插入,tnsb、tnsc、tniq和c2c5从puc19质粒连同内源性tracrrna区域和靶向fnpsp1的crrna表达(图6a)。r6k供体质粒含有带有卡那霉素抗性货物基因的t14左右转座子末端(图6a)。目标质粒含有与6n pam文库邻近的fnpsp1靶标(图6a、图6b)。
[1458]
对pam文库的插入进行深度测序,揭示了t14_c2c5的gtn pam偏好,并确认了靶标下游的插入位置(图7)。
[1459]
下表列出了表达tnsb、tnsc、tniq、c2c5和fnpsp1crrna的puc19_t14质粒和r6k_t14_kan_供体质粒的核苷酸序列。
[1460]
表13
[1461]
[1462]
[1463]
[1464]
[1465]
[1466]
[1467]
[1468]
[1469]
[1470]
[1471][1472]
实施例3

pam偏好和转座酶活性
[1473]
为了进一步研究转座机制,使用了类似于实施例7中描述的系统。在这种情况下,靶标邻近gtt pam。使用sanger测序确认插入gtt pam靶标中。t14供体插入左端连接处gcttg目标位点的下游,并证实该位点在右端连接处重复,与野生型tn7转座酶的已知活性一致(图8)。
[1474]
实施例4

tracrrna
[1475]
最初基于rnaseq特征鉴定的tracrrna候选物通过包含额外序列进行扩增,并在利用crrna、c2c5和转座酶的体外测定中测试活性(图9)。在存在crrna下,tracrrna 2.8和2.11的活性最大。下表14显示了tracrrna 2.8和2.11以及被设计成并入crrna和tracrrna 2.11的sgrna的核苷酸序列。具有crrna的tracrrna 2.11和基于tracrrna 2.11的sgrna的模型描绘于图10中。
[1476]
表14
[1477][1478]
[1479]
实施例5

rna指导插入
[1480]
rna指导插入的体外条件。插入是特异于crrna靶序列的,并且存在5'ggtt pam而不是aacc pam或乱序靶标。插入依赖于所有四种蛋白质组分(tnsb、tnsc、tniq和c2c5),并且去除任何因子都会消除活性(图11)。在25、30和37℃产生插入,在37℃观察到最高活性(图11)。
[1481]
实施例6

sgrna设计和转座活性
[1482]
设计并测试了包含长度为约159个核苷酸(sgrna_6)至约218个核苷酸(sgrna_9)的tracers序列的sgrna,所述tracers序列通过接头在3'端接合到短的crrna序列。示例性接头包含约4至5个核苷酸,包括3

4个a核苷酸和一个或两个u核苷酸,设计为通过短crrna与tracr的3'区碱基配对形成的茎环的环核苷酸。显示了sgrna_10的示例性结构(图12c)。
[1483]
表15
[1484]
[1485]
[1486][1487]
在体外rna指导的转座(图12a)和大肠杆菌中的转座(图12b)中评价了sgrna的活性。
[1488]
实施例7

使用crispr

cas转座酶进行rna指导的dna插入
[1489]
rna指导的crispr

cas核酸酶已成为操作核酸的强大工具。然而,dna的靶向插入仍然是一个主要挑战,因为它依赖于宿主细胞的内源性修复机制。在此,申请人表征了crispr相关转座酶(cast)并阐明了其分子机制。来自蓝藻霍夫曼伪枝藻的cast由tn7样转座酶亚基和v

j型crispr效应子(cas12j)以及相关的crispr rna(crrna)组成。shcast通过以cas12j依赖性方式在crrna识别位点下游60

66bp处单向插入外来dna区段来催化crrna指导的dna转座。申请人证明,shcast介导的rna指导的dna插入不依赖宿主因素,例如dna双链断裂修复机制,并且可在体外用纯化蛋白质和rna组分完全重建。shcast以高达80%的频率有效地靶向dna并将其整合到大肠杆菌基因组中的独特位点,而无需阳性选择。这项工作扩展了对系统功能多样性的理解,并建立了精确基因组编辑的新范例。
[1490]
原核成簇规则间隔短回文重复序列(crispr)和crispr相关蛋白(cas)系统经由指导物

rna依赖性dna或rna核酸酶活性提供针对外来遗传元件的适应性免疫(1

3)。crispr效应子,例如cas9和cas12,已被用于基因组编辑(4

8)并在基因组中产生靶向dna双链断裂,然后使用内源性dna损伤修复途径进行修复。cas9切割后修复的结果是生成由非同源末端接合引起的小插入和缺失,通常导致基因破坏。尽管可通过同源重组(9)或非同源末端接合(10、11)在cas9切割后实现新dna的精确整合,但这些过程可能效率低下并且取决于细胞类型而有很大变化。同源重组修复也可能与细胞分裂有关,使其不适合于大量由生物体所含的有丝分裂后细胞。此外,碱基编辑也可能限于核苷酸取代,因此将dna高效且靶向整合到基因组中仍然是一个重大挑战。
[1491]
为了克服这些限制,申请人试图利用自给自足的dna插入机制,例如转座子。申请人探索了crispr

cas效应子促进dna转座的生物工程方法(图19)。cas9与dna结合产生r环结构,并暴露出作用于单链dna的酶的底物。通过将cas9栓系到来自幽门螺杆菌is608的单链dna转座酶tnpa(16、17),申请人观察到体外靶向dna插入,其依赖于tnpa转座酶活性、cas9 sgrna和置换的dna链中存在tnpa插入位点。
[1492]
迄今为止,还没有关于转座子编码系统的功能数据的报道。在这里,申请人表明tn7样转座子可经由crrna指导的靶向定向到目标位点,并阐明了crrna指导的tn7转座的分子机制。申请人进一步证明,tn7转座可重新编程以将dna插入大肠杆菌的内源基因组中,突出了使用rna指导的tn7样转座子作为基因组编辑新方法的潜力。
[1493]
与v型crispr系统相关的转座子的表征
[1494]
在转座子编码的crispr

cas变体中,v

j亚型的变体是最具吸引力的实验系统,因为它们含有单个蛋白质crispr

cas效应子(18、20、26)。对于实验表征,申请人从蓝藻中选择了两个编码v

j亚型crispr

cas系统(下文为cast、crispr相关转座酶)的tn7样转座子。选定的cast基因座长度为20

25kb,并在具有crispr阵列的转座子的一端含有tn7样转座酶基因,并在另一端含有cas12j,位于内部货物基因的侧翼(图13a、图20a、图20b)。申请人首先培养了天然生物体霍夫曼伪枝藻(utex b 2349,图13b)和柱孢鱼腥藻(pcc7122)并进行了小rna测序以确定crispr

cas系统是否表达和有活性。对于两个基因座,申请人鉴定了一个长的推定tracrrna,其映射到cas12j和crispr阵列之间的区域,并且在霍夫曼伪枝藻(shcast)的情况下,申请人检测到28

34nt长的crrna(图13c、图20c)。检测到的crrna由11

14nt的正向重复(dr)序列和17

20nt的间隔子组成。
[1495]
为了研究shcast和accast是否作为rna指导的转座酶发挥作用,申请人将四个cast基因(tnsb、tnsc、tniq和cas12j)与tracrrna和靶向合成原间隔子(psp1)的crrna的表达盒一起克隆到辅助质粒(phelper)中。申请人通过搜索被重复的插入位点(18)包围的tgtaca样末端重复序列来预测tn7样转座子的末端,并构建了含有卡那霉素抗性基因的供体质粒(pdonor),所述卡那霉素抗性基因侧翼是转座子左端(le)和右端(re)。鉴于crispr

cas效应子需要原间隔子邻近基序(pam)来识别靶dna(27),申请人生成了目标质粒(ptarget)文库,其含有psp1序列,侧翼是原间隔子上游的6n基序。申请人将phelper、pdonor和ptarget共电穿孔到大肠杆菌中并在16小时后提取质粒dna(图14a)。申请人通过针对shcast和accast的pcr检测到目标质粒中的插入,并且产物的深度测序证实了le插入到ptarget中。pinsert质粒中的pam序列分析揭示了shcast和accast系统都偏好gtn pam,表明这些事件是由cas12j靶向引起的(图14a、图15a、图15b)。申请人接下来检查了供体在pinsert产物中相对于原间隔子的位置。对于shcast,在pam下游60

66bp的小窗口内检测到插入,而对于accast,在pam下游49

56bp的小窗口内检测到插入(图14c)。对于任一系统,在相反方向均未检测到插入,表明cast单向起作用。尽管dna插入可能源于大肠杆菌中的基因重组,但相关pam序列的发现和插入的受限位置反对这种可能性。
[1496]
为了验证这些发现,申请人用shcast phelper和pdonor质粒以及含有ggtt pam、aacc pam和乱序非靶序列的目标质粒转化大肠杆菌。申请人通过定量液滴数字pcr(ddpcr)评估插入事件,其揭示仅在phelper和含有ggtt pam和crrna匹配的原间隔子序列的pdonor存在下供体的插入(图14d)。使用16个pam序列的额外实验证实了对ngtn基序的偏好(图21c)。作为进一步验证,申请人回收了pinsert产物并对le和re连接处都进行了sanger测序。所有测序的插入都位于距pam 60

66bp处,并含有位于插入dna侧翼的5bp重复插入基序(图22),与由tn7生成的交错dna断裂一致(28)。由于tn7在其附接位点下游插入cccgc基序,申请人假设插入窗口内的序列可能对cast功能也很重要。申请人生成了具有位于距pam55bp的8n基序的第二靶标文库,并再次将所述文库与shcast phelper和pdonor共转化到大肠杆菌中,接着进行深度测序(图23a)。申请人仅观察到pinsert中le上游的较小序列偏好,插入位点上游3个碱基有轻微的t/a偏好(图23b

23d)。因此,shcast可以最少的靶向规则靶向范围广泛的dna序列。这些结果共同表明accast和shcast催化异源宿主中的dna插入,并且这些插入依赖于靶向原间隔子和不同的pam序列。
[1497]
rna指导插入的遗传要求
[1498]
申请人接下来试图确定shcast插入在大肠杆菌中的遗传要求,并为此构建了一系列具有每个元件缺失的phelper质粒。插入ptarget中需要所有四种cast蛋白(tnsb、tnsc、tniq和cas12j)以及tracrrna区域(图15a)。为了更好地理解tracrrna序列,申请人用pj23119启动子驱动的tracrrna变体补充了phelperδtracrrna。216

nt tracrrna变体6的表达足以恢复dna插入到ptarget中,而所有其他截短在体内均未表现出活性(图15b)。预计tracrrna的3'端与含有14 nt dr序列的crrna杂交,并且为了简化系统,申请人设计了单指导rna(sgrna)来测试tracrrna和crrna序列之间的两个接头。两种设计都支持在tracrrna变体6背景下的插入活性(图15c)。申请人观察到,与天然基因座相比,用pj23119启动子表达tracrrna或sgrna导致插入活性增加5倍,这表明rna水平在异源表达期间是限速的。最后,申请人研究了pdonor中包含的le和re转座子末端序列对dna插入的要求。去除所有侧翼基因组序列或5bp重复目标位点对插入频率几乎没有影响,并且shcast容许le和re分别截短至113bp和155bp(图15d)。去除额外的供体序列完全消除了转座酶活性,这与预测的tn7tnsb样结合基序的丢失一致(图24)。
[1499]
shcast的体外重建
[1500]
尽管数据强烈表明shcast介导了rna指导的dna插入,但为了排除额外宿主因素的要求,申请人接下来试图在体外重建反应。申请人纯化了所有四种shcast蛋白(图25a)并使用pdonor、ptarget和纯化的rna进行了体外反应(图16a)。添加所有四种蛋白质组分、crrna和tracrrna导致通过le和re连接pcr检测到dna插入,含有四种蛋白质组分和sgrna的反应也是如此(图16b)。与在大肠杆菌中观察到的活性相比,截短的tracrrna变体5也能够支持体外dna插入。shcast催化的体外转座发生在37

50℃之间,并取决于atp和mg2 (图25b、图25c)。为了确认体外插入实际上是靶向的,申请人用含有ggtt pam、aacc pam和乱序非靶序列的目标质粒进行反应,并且只能检测到具有靶序列的ggtt pam底物中的dna插入(图16c)。体外dna转座依赖于所有四种cast蛋白,尽管申请人在不存在tniq的情况下鉴定出微弱但可检测的插入(图16c)。鉴于大肠杆菌中的shcast活性需要tniq,该结果表明体外条件可能通过相对于细胞内浓度显著更高的蛋白质组分浓度来补偿tniq的缺乏。
[1501]
与预测的cas12j缺乏核酸酶活性一致,申请人无法在cas12j和sgrna存在下在一系列缓冲液条件下检测到dna切割(图25d)。这些结果共同支持了cas12j在rna指导的dna转座中发挥靶向作用并且对dna链切割没有贡献的假设。为了确定其他crispr

cas效应子是否也可刺激dna转座,申请人用tnsb、tnsc和tniq以及dcas9和靶向相同ggtt pam底物的sgrna进行反应。申请人在dcas9温育后无法检测到任何插入(图16e),表明cas12j的作用不限于一般的dna结合,并且cast的dna转座并不简单地发生在r环结构处。作为最终验证,申请人将体外反应产物转化到大肠杆菌中进行扩增,并使用供体特异性引物进行sanger以确定le和re连接处。所有测序的供体都位于距pam 60

66bp的ptarget中并含有重复的5bp插入位点,证明shcast与纯化组分完全重建。
[1502]
shcast在大肠杆菌中介导有效且精确的基因组插入
[1503]
为了测试shcast是否可重新编程为dna插入工具,申请人在含有ngtn pam和共转化的表达靶向sgrna的pdonor和phelper质粒的大肠杆菌基因组中选择了48个靶标(图17a)。申请人通过pcr在48个位点中的29个(60.4%)处检测到插入,并选择了10个位点进行
339,823

826(2013).
[1516]
6.b.zetsche et al.,cpf1 is a single rna

guided endonuclease of a class 2 crispr

cas system.cell 163,759

771(2015).
[1517]
7.j.strecker et al.,engineering of crispr

cas12b for human genome editing.nat commun 10,212(2019).
[1518]
8.f.teng et al.,repurposing crispr

cas12b for mammalian genome engineering.cell discovery 4,63(2018).
[1519]
9.m.jasin,r.rothstein,repair of strand breaks by homologous recombination.cold spring harb perspect biol 5,a012740(2013).
[1520]
10.j.l.schmid

burgk,k.honing,t.s.ebert,v.hornung,crispaint allows modular base

specific gene tagging using a ligase
‑4‑
dependent mechanism.nat commun 7,12338(2016).
[1521]
11.k.suzuki et al.,in vivo genome editing via crispr/cas9 mediated homology

independent targeted integration.nature 540,144

149(2016).
[1522]
12.l.s.qi et al.,repurposing crispr as an rna

guided platform for sequence

specific control of gene expression.cell 152,1173

1183(2013).
[1523]
13.a.c.komor,y.b.kim,m.s.packer,j.a.zuris,d.r.liu,programmable editing of a target base in genomic dna without double

stranded dna cleavage.nature 533,420

424(2016).
[1524]
14.n.m.gaudelli et al.,programmable base editing of a*t to g*c in genomic dna without dna cleavage.nature 551,464

471(2017).
[1525]
15.k.nishida et al.,targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems.science 353,aaf8729

aaf8729(2016).
[1526]
16.c.guynet et al.,in vitro reconstitution of a single

stranded transposition mechanism of is608.mol cell 29,302

312(2008).
[1527]
17.o.barabas et al.,mechanism of is200/is605 family dna transposases:activation and transposon

directed target site selection.cell 132,208

220(2008).
[1528]
18.j.e.peters,k.s.makarova,s.shmakov,e.v.koonin,recruitment of crispr

cas systems by tn7

like transposons.p natl acad sci usa 114,e7358

e7366(2017).
[1529]
19.g.faure et al.,crispr

cas in mobile genetic elements:counter

defense and beyond.nat rev microbiol in press,(2019).
[1530]
20.s.shmakov et al.,diversity and evolution of class 2 crispr

cas systems.nat rev microbiol 15,169

182(2017).
[1531]
21.r.j.sarnovsky,e.w.may,n.l.craig,the tn7 transposase is a heteromeric complex in which dna breakage and joining activities are distributed between different gene products.embo j 15,6348

6361(1996).
[1532]
22.j.e.peters,n.l.craig,tn7:smarter than we thought.nat rev mol cell biol 2,806

814(2001).
[1533]
23.c.s.waddell,n.l.craig,tn7 transposition:recognition of the atttn7 target sequence.proc natl acad sci u s a 86,3958

3962(1989).
[1534]
24.c.s.waddell,n.l.craig,tn7 transposition:two transposition pathways directed by five tn7

encoded genes.genes dev 2,137

149(1988).
[1535]
25.j.e.peters,n.l.craig,tn7 recognizes transposition target structures associated with dna replication using the dna

binding protein tnse.genes dev 15,737

747(2001).
[1536]
26.s.hou et al.,crispr

cas systems in multicellular cyanobacteria.rna biol 16,518

529(2019).
[1537]
27.f.j.mojica,c.diez

villasenor,j.garcia

martinez,c.almendros,short motif sequences determine the targets of the prokaryotic crispr defence system.microbiology 155,733

740(2009).
[1538]
28.r.bainton,p.gamas,n.l.craig,tn7 transposition in vitro proceeds through an excised transposon intermediate generated by staggered breaks in dna.cell 65,805

816(1991).
[1539]
29.m.sadelain,e.p.papapetrou,f.d.bushman,safe harbours for the integration of new dna in the human genome.nat rev cancer 12,51

58(2011).
[1540]
材料和方法
[1541]
蓝藻rna测序
[1542]
将霍夫曼伪枝藻(utex b 2349)和柱孢鱼腥藻(pcc 7122)在bg

11培养基(thermofisher)中在25℃下培养,光照周期为14小时开,10小时关。使用mirneasy mini试剂盒(qiagen)分离rna并用dna酶i(neb)处理。使用ribominus(thermofisher)去除rrna。使用nebnext small rna library prep set for illumina(neb)从去除rrna的rna制备rna文库。
[1543]
rna测序分析
[1544]
使用nextseq 500/550 high output试剂盒v2(75次循环)(illumina)对rna文库进行测序。使用bwa(1)将配对末端读段与其各自的参考基因组比对,并使用bedtools提取整个转录物。使用geneious prime 2019.0.4分析所得的转录物序列。
[1545]
异源质粒的生成
[1546]
使用dneasy blood and tissue试剂盒(qiagen)制备来自霍夫曼伪枝藻和柱孢鱼腥藻的纯化gdna。随后,使用kapa hifi hotstart readymix(kapa biosystems)从纯化的gdna扩增cast基因座(不包括货物基因)并克隆到puc19中。在cast转座酶基因和cas12j基因前面放置了一个lac启动子,并且在具有两个正向重复序列的缩短的crispr阵列前面添加了一个j23119启动子。阵列中的第一个内源间隔子被fncpf1原间隔子1(psp1)序列(5'

gagaagtcatttaataaggccactgttaaaa

3'(seq id no:483))代替。cast开放阅读框(orf)和下游tracr区域没有变化。所有细菌表达质粒的序列可见于表15。
[1547]
pam和基序筛选
[1548]
使用合成的ssdna寡核苷酸(idt)生成随机化目标pam和插入基序文库,其中psp1上游有6个随机化碱基并且间隔子下游55bp处开始有8个随机化碱基。寡核苷酸用于生成pcr产物,用于随后的gibson组装(neb)到pacyc184载体中。将gibson产物电穿孔到endura电感受态细胞(lucigen)中,恢复1小时,并且接种在氯霉素板上。接种后16小时收获细胞,并使用maxi

prep试剂盒(macherey

nagel)收获质粒dna。将100ng文库靶dna与100ng phelper和pdonor共电穿孔到transformax ec100d pir 大肠杆菌中。将细胞恢复1小时并接种在含有氨苄青霉素、卡那霉素和氯霉素的平板上。使用miseq试剂盒v2(300次循环)(illumina)扩增含有随机化pam序列或基序序列的插入产物并测序。另外,文库靶标中的pam和基序序列与插入样品一起被扩增和测序。
[1549]
pam和基序发现管道
[1550]
对于序列验证的插入事件,随机化的pam区域和基序区域被提取、计数并相对于来自相应样品的读段总数归一化。给定随机化序列的富集由其在插入样品中与其在文库靶标中的丰度的比率确定。这些比率用于使用kronos plot(github.com/marbl/krona/wiki)(2)创建pam轮。收集分别高于log2富集阈值4和1的pam和基序并用于生成序列标识。
[1551]
液滴数字pcr(ddpcr)
[1552]
将ddpcr supermix for probes(biorad)、引物、产物特异性探针和样品组合到20l反应中,并使用qx200液滴生成器(biorad)生成液滴。使用插入pcr特异性引物和供体特异性探针量化插入事件(表17)。使用靶标特异性pcr引物和相应的探针对靶标进行量化(表17)。ddpcr反应的热循环条件如下:1次循环,95℃,10分钟;40次循环,94℃,30秒,60℃,1分钟;1次循环,98℃,10分钟;4℃保持;每一步以2℃/秒匀速变化。ddpcr板用箔热封(biorad)密封,并用qx200液滴读取器读取。使用quantasoft(v1.6.6.0320)确定插入物和靶标的绝对浓度,并通过插入物/(插入物 靶标)计算插入频率。
[1553]
大肠杆菌质粒靶向测定
[1554]
通过将phelper、pinsert和ptarget各5ng转化到one shot pir1化学感受态大肠杆菌(invitrogen)中进行向目标质粒中的靶向转座。将细胞恢复1小时并接种在含有氨苄青霉素、卡那霉素和氯霉素的平板上。接种后16小时收获细胞并在含有氨苄青霉素、卡那霉素和氯霉素的lb培养基中生长8小时。使用qiaprep miniprep试剂盒(qiagen)分离质粒dna,稀释约500倍,并使用如上所述的ddpcr进行定量。
[1555]
shcast蛋白的纯化
[1556]
将shcast基因克隆到细菌表达质粒(t7

twinstrep

sumo

nls

cas12b

nls

3xha)中,并在含有plyss

trna质粒(来自novagen#70956)的bl21(de3)细胞(neb#c2527h)中表达。细胞在terrific broth中生长至对数中期并且温度降至20℃。在0.6od下用0.25mm iptg诱导表达16

20小时,然后收获并在

80℃下冷冻细胞。将细胞糊重新悬浮在补充有不含edta的complete蛋白酶抑制剂(roche)的裂解缓冲液(50mm tris ph 7.4、500mm nacl、5%甘油、1mm dtt)中。使用lm20微流化装置(microfluidics)裂解细胞,并将澄清的裂解物与strep

tactin superflow plus树脂(qiagen)结合。使用裂解缓冲液洗涤树脂,并用补充有5mm脱硫生物素的裂解缓冲液洗脱蛋白质,但tniq除外。twinstrep

sumo标签通过在4℃下用自制的sumo蛋白酶ulp1以1:100的蛋白酶与靶标重量比进行过夜消化来去除。tnib、tnic和cas12j蛋白用50mm tris ph 7.4、50mm nacl稀释至200mm nacl的终浓度,并使用
hitrap heparin hp柱在akta pure 25 l(ge healthcare life sciences)上以200mm

1m nacl梯度纯化。将含有蛋白质的级分合并并浓缩并装载到superdex 200 increase柱(ge healthcare life sciences)上,最终储存缓冲液为25mm tris ph 7.4、500mm nacl、0.5mm edta、10%甘油、1mm dtt。在4℃下用sumo蛋白酶ulp1从strep

tactin superflow plus树脂上切割tniq,并装载到superdex 200 increase柱上,最终储存缓冲液为25mm tris ph 7.4、500mm nacl、0.5mm edta、10%甘油、1mm dtt。将所有蛋白质浓缩至1mg/ml原液并在液氮中快速冷冻,然后在

80℃下储存。
[1557]
体外转座测定
[1558]
纯化的蛋白质在25mm tris ph 8、500mm nacl、1mm edta、1mm dtt、25%甘油中稀释至2um。通过将含有所需rna反向互补序列的dna寡核苷酸与短t7寡核苷酸退火或通过经由pcr添加t7启动子来生成所有rna。使用hiscribe t7 high yield rna合成试剂盒(neb)在37℃下进行体外转录持续8

12小时,并使用agencourt ampure rna clean珠粒(beckman coulter)纯化rna。
[1559]
在如先前针对tn7(3)所述补充有15mm mgoac2的26mm hepes ph 7.5、4.2mm tris ph 8、50ug/ml bsa、2mm atp、2.1mm dtt、0.05mm edta、0.2mm mgcl2、28mm nacl、21mm kcl、1.35%甘油的最终反应缓冲液中用50nm的每种蛋白质(如所示)、20ng ptarget质粒、100ng pdonor、600nm最终rna浓度进行体外转座反应。总反应体积为20ul并且反应在指定温度下温育2小时,并在细菌转化或pcr读出之前使用qiagen pcr纯化柱进行纯化。
[1560]
大肠杆菌基因组靶向测定
[1561]
在大肠杆菌基因组的非编码区(表17)中随机选择48个带有ngtn pam的指导物并克隆到具有sgrna配置的phelper中。将5ng靶向基因组的phelper构建体转化到带有pdonor的pir1细胞中,恢复15分钟,并接种在含有氨苄青霉素和卡那霉素的平板上。通过使用kapa hifi hotstart readymix(kapa biosystems)进行套式菌落pcr鉴定成功插入。接种后16小时收获剩余的细胞,并使用dneasy blood and tissue试剂盒(qiagen)纯化gdna用于进一步分析。
[1562]
基因组插入通过插入特异性扩增进行序列验证,并使用miseq试剂盒v2(150次循环)(illumina)进行测序。修剪供体序列的配对末端读段并使用bwa(1)映射到基因组。所得序列用于确定相对于指导序列的插入位置。用如上所述的ddpcr用指导物特异性正向引物确定基因组插入频率(表17)。
[1563]
大肠杆菌特异性分析
[1564]
如前所述进行转座事件的无偏检测。从大肠杆菌基因组靶向测定中纯化的gdna用tn5标记,接着进行qiaquick pcr纯化(qiagen)。使用tn5衔接子特异性引物和dna供体内的套式引物,使用kod热启动dna聚合酶(millipore)进行两轮pcr来扩增标记的dna样品。使用nextseq v2试剂盒(75次循环)对所得文库进行测序。修剪供体序列的配对末端读段并使用bwa映射到基因组。所得序列用于确定大肠杆菌基因组中的插入位置。
[1565]
表16.dna序列
[1566]
[1567]
[1568]
[1569][1570]
表17.rna序列
[1571]
[1572]
[1573][1574]
表18.基因组靶标
[1575]
(seq id no:493

636,其中指导序列为seq id no:493,正向引物为seq id no:494,并且反向引物为seq id no:495等)
[1576]
[1577]
[1578]
[1579][1580]
表19.ddpcr探针
[1581]
插入探针ctgtcgtcggtgacagattaatgtcattgtgac(seq id no:637)靶探针tgggcagcgcccacatacgcagcgatttc(seq id no:638)
[1582]
补充参考文献
[1583]
1.h.li,r.durbin,fast and accurate short read alignment with burrows

wheeler transform.bioinformatics 25,1754

1760(2009).
[1584]
2.r.t.leenay et al.,identifying and visualizing functional pam diversity across crispr

cas systems.molecular cell 62,137

147(2016).
[1585]
3.r.j.bainton,k.m.kubo,j.n.feng,n.l.craig,tn7 transposition:target dna recognition is mediated by multiple tn7

encoded proteins in a purified in vitro system.cell 72,931

943(1993).
[1586]
4.j.strecker et al.,engineering of crispr

cas12b for human genome editing.nat commun 10,212(2019).
[1587]
实施例9

死cas 单链转座酶
[1588]
利用单链转座酶进行精确的dna插入。
[1589]
cas9及其指导rna与靶dna的结合导致r环的形成1,从而暴露出一小段单链dna。
[1590]
为了促进精确的dna插入,申请人研究了使用单链dna中间体转座的细菌转座酶的huh家族3‑5。这些酶可自主地破坏和重新接合dna,并且可独立于宿主修复机制将环状供体分子插入单链dna中3‑5。通过与cas9融合靶向这些酶允许dna整合到暴露的dna链中,并且使用cas9
d10a
切口酶突变体导致仅在相反链上切割并促进填充合成(图31)。
[1591]
首先,申请人利用了来自幽门螺杆菌插入序列is608的转座酶tnpa,其将单链供体插入到ttac序列3‑5的5'位置中并且其被重新编程以靶向替代位点6。申请人创建了tnpa
is608
与cas9
d10a
的n末端和c末端的融合物,用于在hek293细胞中表达和在大肠杆菌中生产蛋白
质。申请人使用dna底物与哺乳动物裂解物和纯化蛋白质进行体外反应,以优化蛋白质设计,包括方向和肽接头长度。
[1592]
申请人接下来鉴定了与tnpa
is608
相关的直系同源物,并测试了dna插入的活性和特异性增加。高活性转座酶在自然界中可能处于阴性选择下,因为它们可能会损害宿主的生存能力。申请人因此进行蛋白质blast搜索以鉴定共有tnpa序列并测试将tnpa
is608
回复为共有序列以提高插入效率的突变。
[1593]
一旦在体外优化,申请人就使用基于脂质的dna转染和纯化蛋白质

dna复合物的核转染将tnpa

cas9
d10a
构建体引入哺乳动物细胞,以测试各种位点和基因组环境的基因组整合和长期稳定性。虽然可通过下一代测序轻松测量在靶插入频率,但申请人还使用tn5进行基因组片段化,以无偏方式鉴定所有插入位点。这种表征对于确定整合特异性很重要。为了减少潜在的脱靶整合,这些工具进一步与提高靶标特异性8的cas9变体或在zhang实验室中表征的新crispr蛋白相结合。
[1594]
这项技术的成功开发提供了一种将dna整合到哺乳动物细胞基因组中的强大方法。这个过程独立于宿主dsb修复因子,并且应该只需要从宿主中填充dna合成,这一过程发生在核苷酸切除修复过程中,即使在非分裂细胞中也是如此。精确整合转基因的能力可用于向细胞提供肿瘤阻遏基因,而无需随机整合现有方法,例如病毒整合或双链转座酶方法如piggybac。使用tnpa

dcas9融合物在剪接受体位点整合dna也可通过提供替换外显子来修复内源性基因突变。
[1595]
这里的方法用于独立于细胞修复途径来精确插入dna。
[1596]
结果示于图30a

41中。
[1597]
图30a显示了用于体外转座酶反应的134bp双链dna底物的示意图。来自幽门螺杆菌is608的转座酶tnpa将单链dna 5'插入到ttac位点。图30b显示了用于在哺乳动物细胞中表达的构建体的示意图。来自is608的tnpa作为二聚体起作用,并且构建体是将tnpa单体融合到cas9

d10a(tnpa

cas9)、融合到cas9

d10a的tnpa串联二聚体(tnpa
x2

cas9)或单独的游离tnpa而制成。xten
16
和xten
32
分别是16和32个氨基酸的蛋白质接头。图30c显示了用含有tnpa的哺乳动物细胞裂解物插入外来dna。与a组中的134bp底物、合成sgrna以及来自表达指定构建体的哺乳动物细胞的裂解物进行体外反应。所有反应中包括的所提供供体是200bp环状ssdna分子,其含有is608的左发夹和右发夹以及90bp外来内部dna。pcr e1扩增了完整底物,而插入特异性pcr e2和e3含有一个侧翼引物和一个对供体序列具特异性的引物。观察到的产物与供体插入一致,并且与183bp(e2)和170bp(e3)的预测大小相匹配。无法在总反应中或pcr e1中检测到334bp条带表明整体插入率较低。当tnpa存在于任何不依赖于sgrna的裂解物中时,pcr e2和e3表明供体插入。图30d显示了指示供体dna插入位点的e2产物的ngs测序。tnpa的非特异性整合发生在阵列中所有可能的整合位点,由相距4bp的峰指示。与tnpa
x2

cas9

d10a裂解物温育导致单链dna 5'靶向整合到距pam的15和19bp位置,其方式取决于指导rna的存在和目标位点。
[1598]
图31a显示了克隆到puc19中的用于体外转座酶反应的280bp双链dna底物的示意图。底物含有ttacx6tnpa插入位点的两个阵列,其中一个被cas9 sgrna靶向。质粒底物用t5核酸外切酶处理以去除污染的单链dna。图31b显示了用含有tnpa的哺乳动物细胞裂解物插入外来dna。与a组中的280bp底物、合成sgrna以及来自表达指定构建体的哺乳动物细胞的
裂解物进行体外反应。供体dna是一个160bp环状ssdna分子,其含有is608的左发夹和右发夹以及90bp外来dna。pcr e1扩增了完整底物,而插入特异性pcr e2和e3含有一个侧翼引物和一个对供体序列具特异性的引物。与tnpa
is608 x2

cas9
d10a
而非单独tnpa温育后可检测到250bp pcr产物,并且取决于供体和sgrna的存在。图31c显示了从匹配的大肠杆菌中纯化重组tnpa
is608 x2

cas9
d10a
。考马斯染色的sds

page显示纯化蛋白质的两种稀释度。图31d显示了使用哺乳动物细胞裂解物与纯化蛋白质的体外dna插入的比较。与a组中的280bp底物、合成sgrna和来自表达指定构建体的哺乳动物细胞的裂解物或来自c组的纯化蛋白质进行体外反应。供体dna是一个160bp环状ssdna分子,其含有is608的左发夹和右发夹以及90bp外来dna。pcr e1扩增了完整底物,而插入特异性pcr e2和e3含有一个侧翼引物和一个对供体序列具特异性的引物。添加tnpa
is608 x2

cas9
d10a
裂解物和蛋白质后,250bp的e2产物微弱可见,而pcr e3检测到更强大的插入产物。与240bp条带相比,152bp处的较暗条带与定向插入到cas9靶向ttac阵列一致,预测为第二个ttac阵列中非靶向插入的大小。152bp e3插入特异性pcr产物依赖于供体dna和sgrna。
[1599]
图32显示了展示示例性方法的示意图。cas9用于暴露单链dna底物。huh转座酶被栓系以插入单链dna。相对的链被切刻并允许填充dna合成。
[1600]
图33显示了哺乳动物表达构建体的示意图,其中来自幽门螺杆菌is608的tnpa与d10a切口酶cas9融合。xten
16
和xten
32
是两种不同的多肽接头。底物1的示意图,一种双链dna底物(互补链未显示),具有12个ttac插入位点的阵列并被两个cas9 sgrna靶向。细胞裂解物来自转染的hek293细胞。所述步骤使用134bp dsdna供体(退火寡核苷酸)和200bp环状ssdna供体。
[1601]
图34显示了体外插入反应。底物1与指定的哺乳动物细胞裂解物、200bp环状单链dna供体和sgrna一起温育。pcr e2和e3通过使用一种供体特异性引物跨越插入连接处来检测插入产物。
[1602]
图35显示了来自滑动片7中突出显示的e2反应的插入位点的ngs。在不存在指导物的情况下,在阵列中的所有可能位置检测到插入。在反应中添加sgrna1或sgrna2会使插入事件偏向于底物中两个更突出的位点。
[1603]
图36显示了对应于来自各个sgrna的pam的位置16和20的突出插入位点。ttac 3'的dna插入位于sgrna中的位置16和20。
[1604]
图37显示了来自多种细菌物种的tnpa

cas9融合物的新融合物的示意图和表达。ggs
32
和xten
32
是多肽接头。来自幽门螺杆菌的ishp608、来自肉毒杆菌的iscbt1、来自念珠藻属的isnsp2、来自蜡状芽孢杆菌的isbce3、来自鼠疫耶尔森氏菌的is200g、来自马氏甲烷八叠球菌的ismma22、来自霍乱弧菌的is1004。利用底物1的实验揭示了单独使用tnpa的插入产物,这可能是底物的单链dna污染造成的。用六个ttac插入位点的两个阵列构建了第二质粒底物(底物2)。通过t5核酸外切酶消化去除单链dna。该步骤侧重于tnpa与cas9的串联二聚体融合。从底物上去除ssdna。
[1605]
图38显示了体外插入反应。底物2与指定的哺乳动物细胞裂解物、160bp环状单链dna供体和sgrna1一起温育。pcr e2检测预测大小为247bp的插入事件。插入产物依赖于cas9、供体和sgrna。
[1606]
图39显示了tnpa

cas9纯化蛋白的sds

page(左图,显示了两种稀释度)。与哺乳动
物细胞裂解物和纯化蛋白质的体外反应都揭示了依赖于供体和sgrna的插入事件。
lin
供体表示线性供体。
[1607]
图40显示了来自滑动片12中突出显示的反应的插入位点的ngs。在不存在指导物的情况下,在整个阵列中检测到低水平的插入。添加sgrna2导致指导序列内的靶向插入,最突出的是在距pam的第16位。cas9靶向插入3'到ttac位于sgrna中的第16位。
[1608]
图41显示了具有被不同tnpa直系同源物识别的插入位点的质粒底物(底物3)。与哺乳动物裂解物、160bp环状单链dna供体和sgrna的体外反应。来自is608的tnpa插入在ttac序列之后并且靶向底物的其他区域不会导致可检测的插入。sgrna内需要正确的tnpa插入位点。
[1609]
y1huh转座酶用于靶向插入。dsdna中的插入事件似乎取决于cas9、sgrna和tnpa插入位点的存在。
[1610]
实施例10

使用crispr相关转座酶进行rna指导的dna插入
[1611]
crispr

cas核酸酶是操作核酸的强大工具,然而,dna的靶向插入仍然是一个挑战,因为它需要宿主细胞修复机制。在此申请人表征了来自蓝藻霍夫曼伪枝藻的crispr相关转座酶(cast),其由tn7样转座酶亚基和v

k型crispr效应子(cas12k)组成。shcast通过在原间隔子下游单向插入60

66bp的dna区段来催化rna指导的dna转座。shcast以高达80%的频率将dna整合到大肠杆菌基因组中的独特位点,而无需阳性选择。这项工作扩展了对crispr

cas系统功能多样性的理解,并建立了精确基因组编辑的新范例。
[1612]
原核成簇规则间隔短回文重复序列(crispr)和crispr相关蛋白(cas)系统经由指导物

rna依赖性dna或rna核酸酶活性提供针对外来遗传元件的适应性免疫(1

3)。crispr效应子,例如cas9和cas12,已被用于基因组编辑(4

8)并在基因组中产生靶向dna双链断裂,然后使用内源性dna损伤修复途径进行修复。尽管可通过同源重组(9)或非同源末端接合(10、11)在cas9切割后实现新dna的精确整合,但这些过程可能效率低下并且取决于细胞类型而有很大变化。同源重组修复也可能与活性细胞分裂有关,使其不适合于大量由生物体所含的有丝分裂后细胞。最近,已经开发出一种在dna上进行点突变的替代方法,该方法依赖于使用死cas9(12)募集胞苷或腺嘌呤脱氨酶来实现基因组dna的碱基编辑(13

15)。然而,碱基编辑限于核苷酸取代,因此将dna高效且靶向整合到基因组中仍然是一个重大挑战。
[1613]
为了克服这些限制,申请人试图利用自给自足的dna插入机制,例如转座子。探索了促进dna转座的crispr

cas效应子的生物工程方法(图47a

47f)。cas9与dna结合产生r环结构,并暴露出作用于单链dna(ssdna)的酶的底物。通过将cas9(d10a)栓系到来自幽门螺杆菌is608的ssdna转座酶tnpa(16、17),申请人观察到体外和大肠杆菌中的靶向dna插入,其依赖于tnpa转座酶活性、cas9sgrna和ssdna内存在插入位点。
[1614]
最近,据报道tn7样转座子与i

f亚型、i

b亚型或v

k亚型(以前称为v

u5)crispr

cas系统之间存在关联(18、19)。所有转座子编码的crispr

cas系统都缺乏活性核酸酶结构域;i型基因座编码cascade复合物但不编码cas3解旋酶

核酸酶,而v

k亚型基因座含有cas12k效应子(以前称为c2c5),其在预测的ruvc样核酸酶活性位点中含有突变(20),表明这些crispr

cas系统只能结合但不能切割dna。crispr

cas相关的tn7样转座子含有tnsa、tnsb、tnsc和tniq基因(18),类似于典型的tn7异源三聚体tnsabc复合物(21、22)。tn7经由
两种替代途径靶向dna,分别由tnsd和tnse介导,tnsd是一种序列特异性dna结合蛋白,可识别tn7附接位点(23、24),而tnse有助于转座到接合质粒中并复制dna(25)。
[1615]
在v

k亚型的情况下,crispr

cas基因座的位置在预测的转座子中是严格保守的,这表明crispr

cas是转座所必需的(19)。相反,除了转座酶机制外,典型的tn7转座子通常携带对宿主细胞有益的货物基因(22),这增加了cas12k可能是另一个货物基因的可能性。迄今为止,尚未报告转座子编码的crispr

cas系统的功能数据。在此,申请人表明tn7样转座子可经由crrna指导的靶向作用定向到目标位点,并阐明了crrna指导的tn7转座的分子机制。申请人进一步证明了tn7转座可重新编程以将dna插入大肠杆菌的内源基因组中,突出了使用rna指导的tn7样转座子进行基因组编辑的潜力。
[1616]
与v型crispr系统相关的转座子的表征
[1617]
在转座子编码的crispr

cas变体中,v

k亚型是最具吸引力的实验系统,因为它们含有单个蛋白质crispr

cas效应子(18、20、26)。迄今为止,v

k亚型系统仅限于蓝藻,并且最新的非冗余集包括63个基因座,在cas12k的系统发育树中,这些基因座分为4个主要分支,涵盖了蓝藻的广泛分类范围(19)。所有v

k系统都嵌入在预测的tn7样可转座元件中,没有额外的cas基因,这表明,如果它们是活跃的crispr

cas系统,则它们可能依赖于反式提供的适应模块。在分析的560个v

k间隔子中,仅鉴定了6个原间隔子匹配:3个来自蓝藻质粒,并且3个来自is200或is650家族的单链转座子(19)。
[1618]
对于实验表征,申请人选择了两个编码v

k亚型crispr

cas系统(以下称为cast、crispr相关转座酶)的tn7样转座子。所选的cast基因座长度为20

25kb,并在转座子的一端含有tn7样转座酶基因,在另一端含有crispr阵列和cas12k,位于内部货物基因的侧翼(图42a、图48a、图48b)。申请人首先培养了天然生物体霍夫曼伪枝藻(utex b 2349;图42b)和柱孢鱼腥藻(pcc 7122)并进行小rna测序以确定crispr

cas系统是否表达和有活性。对于两个基因座,申请人鉴定了一个长的推定tracrrna,其映射到cas12k和crispr阵列之间的区域,并且在霍夫曼伪枝藻(shcast)的情况下,申请人检测到28

34nt长的crrna,其由11

14nt的正向重复(dr)序列和17

20nt的间隔子组成(图42c、图48c)。
[1619]
为了研究shcast和accast是否作为rna指导的转座酶发挥作用,申请人将四个cast基因(tnsb、tnsc、tniq和cas12k)与内源性tracrrna区域和靶向合成原间隔子(psp1)的crrna一起克隆到辅助质粒(phelper)中。申请人通过搜索被重复的插入位点(18)包围的tgtaca样末端重复序列来预测转座子的末端,并构建含有卡那霉素抗性基因的供体质粒(pdonor),所述卡那霉素抗性基因的侧翼是转座子左端(le)和右端(re)。鉴于crispr

cas效应子需要原间隔子邻近基序(pam)来识别靶dna(27),申请人生成了目标质粒(ptarget)文库,其含有psp1序列,侧翼是原间隔子上游的6n基序。申请人将phelper、pdonor和ptarget共电穿孔到大肠杆菌中并在16小时后提取质粒dna(图42d)。申请人通过针对shcast和accast的pcr检测到目标质粒中的插入,并且深度测序证实了le插入到ptarget中。pinsert质粒中的pam序列分析揭示了shcast和accast系统都偏好gtn pam,表明这些插入由cas12k靶向产生(图42e、图49a、图49b)。申请人接下来检查了供体在pinsert产物中相对于原间隔子的位置。对于shcast,在pam下游60

66bp的小窗口内检测到插入,而对于accast,在pam下游49

56bp的小窗口内检测到插入(图42f)。对于任一系统,在相反方向均未检测到插入,表明cast单向起作用。尽管dna插入可能源于大肠杆菌中的基因重组,但相
关pam序列的发现和插入的受限位置反对这种可能性。
[1620]
为了验证这些发现,申请人用shcast phelper和pdonor质粒以及含有ggtt pam、aacc pam和乱序非靶序列的目标质粒转化大肠杆菌。申请人通过定量液滴数字pcr(ddpcr)评估插入事件,其揭示仅在phelper和含有ggtt pam和crrna匹配的原间隔子序列的ptarget存在下供体的插入(图42g)。使用16个pam序列的额外实验证实了对ngtn基序的偏好(图49c)。作为进一步验证,申请人回收了pinsert产物并对le和re连接处进行了sanger测序。所有测序的插入都位于距pam 60

66bp处,并含有位于插入dna侧翼的5bp重复插入基序(图50),与由tn7生成的交错dna断裂一致(28)。由于tn7在其附接位点下游插入cccgc基序,申请人假设插入窗口内的序列可能对cast功能也很重要。申请人生成了具有位于距pam55bp的8n基序的第二靶标文库,并再次将所述文库与shcast phelper和pdonor共转化到大肠杆菌中,接着进行深度测序(图51a)。申请人仅观察到pinsert中le上游的较小序列偏好,插入位点上游3个碱基有轻微的t/a偏好(图51b

51d)。因此,shcast可以最少的靶向规则靶向范围广泛的dna序列。这些结果共同表明accast和shcast催化异源宿主中的dna插入,并且这些插入依赖于靶向原间隔子和不同的pam序列。
[1621]
rna指导插入的遗传要求
[1622]
申请人接下来试图确定shcast插入在大肠杆菌中的遗传要求,并为此构建了一系列具有每个元件缺失的phelper质粒。插入ptarget中需要所有四种cast蛋白和tracrrna区域(图43a)。为了更好地表征tracrrna序列,申请人用pj23119启动子驱动的各种tracrrna补充了phelperδtracrrna。216

nt tracrrna变体6的表达单独足以恢复dna转座(图43b)。预计tracrrna的3'端与含有14nt dr序列的crrna杂交,并且申请人设计了单指导rna(sgrna)来测试tracrrna和crrna序列之间的两个接头。两种设计都支持在tracrrna变体6背景下的插入活性(图43c)。申请人观察到,与天然基因座相比,用pj23119启动子表达tracrrna或sgrna导致插入活性增加5倍,这表明rna在异源表达期间是限速的。
[1623]
由于shcast在dna插入时不会破坏原间隔子,申请人询问是否会在ptarget中发生多次插入,或者这些插入是否像典型tn7一样被抑制(29、30)。申请人生成了含有le re或单独的le的目标质粒,并在6个附近原间隔子处测量了shcast转座活性。申请人观察到对距le 62bp的原间隔子转座的强抑制作用(小于ptarget相对活性的1%),而距le 542bp只有5.7%的相对活性(图43d),表明cast转座子末端顺式作用以防止多次插入。单独le的存在导致较弱的抑制作用并且申请人在距转座子末端542bp处观察到61.1%的活性(图52a、图52b)。
[1624]
原始pdonor含有2.2kb的货物dna,并且申请人接下来测试了供体长度对shcast活性的影响,范围为500bp至10kb。申请人观察到,与原始pdonor相比,500bp供体的插入率高2倍,并且10kb有效载荷的插入率相似(图52c)。申请人在大肠杆菌转座期间无法检测到重新接合的pdonor骨架(图52d、图52e),这表明形成了线性供体骨架,而不是重新接合的产物,这与典型tn7的已知反应产物一致(28、31)。最后,申请人研究了pdonor中包含的le和re转座子末端序列对转座的要求。去除所有侧翼基因组序列或5bp重复目标位点对插入频率几乎没有影响,并且shcast容许le和re分别截短至113bp和155bp(图53a)。去除额外的供体序列完全消除了转座酶活性,这与预测的tn7tnsb样结合基序的丢失一致(图53b、图53c)。
[1625]
shcast的体外重建
[1626]
尽管数据强烈表明shcast介导了rna指导的dna插入,但为了排除额外宿主因素的要求,申请人接下来试图在体外重建反应。申请人纯化了所有四种shcast蛋白(图54a)并使用pdonor、ptarget和纯化的rna进行了体外反应(图44a)。添加所有四种蛋白质组分、crrna和tracrrna导致通过le和re连接pcr检测到dna插入,含有四种蛋白质组分和sgrna的反应也是如此(图44b)。与在大肠杆菌中观察到的活性相反,截短的tracrrna变体5也能够支持体外dna插入。shcast催化的体外转座发生在37

50℃之间并取决于atp和mg2 (图54b、图54c)。为了确认体外插入实际上是靶向的,申请人用含有ggtt pam、aacc pam和乱序非靶序列的目标质粒进行反应,并且只能检测到具有靶序列的ggtt pam底物中的dna插入(图44c)。体外dna转座依赖于所有四种cast蛋白,尽管申请人在不存在tniq的情况下鉴定了微弱但可检测的插入(图44d)。
[1627]
与预测的cas12k核酸酶活性缺乏一致,申请人无法在cas12k和sgrna存在的情况下在一系列缓冲液条件下检测到dna切割(图54d)。为了确定其他crispr

cas效应子是否也可刺激dna转座,申请人与tnsb、tnsc和tniq以及dcas9和靶向相同ggtt pam底物的sgrna进行了反应。申请人在dcas9温育后无法检测到任何插入(图44e),表明cas12k的功能不仅仅是dna结合,而且cast的dna转座并不简单地发生在r环结构处。作为最终验证,申请人将体外反应产物转化到大肠杆菌中并进行sanger测序以确定le和re连接处。所有测序的供体都位于ptarget中,距pam 60

66bp,并含有重复的5bp插入位点,证明shcast与纯化组分完全重建。
[1628]
shcast在大肠杆菌中介导有效且精确的基因组插入
[1629]
为了测试shcast是否可重新编程为dna插入工具,申请人在大肠杆菌基因组中选择了48个靶标并共转化了表达靶向sgrna的pdonor和phelper质粒(图45a)。申请人通过pcr在48个位点中的29个(60.4%)处检测到插入,并选择了10个位点进行额外验证(图55a)。申请人在16小时后进行了ddpcr以定量插入频率,并在psp42和psp49处测量到高达80%的插入率(图45b)。考虑到插入事件不是通过抗生素抗性选择的,这种高插入效率令人惊讶,因此申请人进行了目标位点的pcr以确认。引人注目的是,申请人在转化群体中检测到了2.5kb插入产物(图45c)。重新划线转化的大肠杆菌产生纯单菌落,其中大多数含有靶向插入(图55b),并且利用各种供体dna长度保持高整合效率(图55c)。申请人通过le和re连接处的靶向深度测序分析了基因组插入的位置,并在所有10个位点处观察到60

66bp窗口内的插入(图45d、图56a)。
[1630]
申请人接下来测定了rna指导的dna转座的特异性。申请人在gdna的tn5标记后对供体插入位点进行无偏测序。申请人在每个样品中观察到一个突出的插入位点,其映射到目标位点,并且含有超过50%的总插入读段(图45e)。剩余的脱靶读段分散在整个基因组中,并且对顶部脱靶位点的分析揭示了样品之间的强烈重叠,揭示这些事件与指导序列无关(图56b,表24)。最高的脱靶位点位于核糖体基因、丝氨酸

trna连接酶和烯醇化酶等附近,尽管这些区域中的插入频率都低于在靶位点的1%(表24)。申请人在靶向psp42后鉴定了一种潜在的rna指导的脱靶,其含有与指导序列的4个错配(图56c)。总之,这些结果表明shcast稳健且精确地将dna插入目标位点。
[1631]
讨论
[1632]
在此,申请人表征了与tn7样转座子相关的crispr

cas系统,并提供了在大肠杆菌
biol 16,518

529(2019).
[1664]
27.f.j.mojica,c.diez

villasenor,j.garcia

martinez,c.almendros,short motif sequences determine the targets of the prokaryotic crispr defence system.microbiology 155,733

740(2009).
[1665]
28.r.bainton,p.gamas,n.l.craig,tn7 transposition in vitro proceeds through an excised transposon intermediate generated by staggered breaks in dna.cell 65,805

816(1991).
[1666]
29.z.skelding,j.queen

baker,n.l.craig,alternative interactions between the tn7 transposase and the tn7 target dna binding protein regulate target immunity and transposition.embo j 22,5904

5917(2003).
[1667]
30.a.e.stellwagen,n.l.craig,avoiding self:two tn7

encoded proteins mediate target immunity in tn7 transposition.embo j 16,6823

6834(1997).
[1668]
31.m.c.biery,f.j.stewart,a.e.stellwagen,e.a.raleigh,n.l.craig,a simple in vitro tn7

based transposition system with low target site selectivity for genome and gene analysis.nucleic acids res 28,1067

1077(2000).
[1669]
32.m.sadelain,e.p.papapetrou,f.d.bushman,safe harbours for the integration of new dna in the human genome.nat rev cancer 12,51

58(2011).
[1670]
数据可用性:表达质粒可在ubmta下从addgene获得;支持论坛和计算工具可经由zhang实验室网站(zlab.bio/)获得。
[1671]
材料和方法
[1672]
蓝藻rna测序
[1673]
将霍夫曼伪枝藻(utex b 2349)和柱孢鱼腥藻(pcc 7122)在bg

11培养基(thermofisher)中在25℃下培养,光照周期为14小时开,10小时关。使用mirneasy mini试剂盒(qiagen)分离rna并用dna酶i(neb)处理。使用ribominus(thermofisher)去除rrna。使用nebnext small rna library prep set for illumina(neb)从去除rrna的rna制备rna文库。
[1674]
rna测序分析
[1675]
使用nextseq 500/550 high output试剂盒v2(75次循环)(illumina)对rna文库进行测序。使用bwa(33)将配对末端读段与其各自的参考基因组比对,并使用bedtools提取整个转录物。使用geneiousprime 2019.0.4分析所得的转录物序列。
[1676]
生成异源质粒
[1677]
使用dneasy blood and tissue试剂盒(qiagen)制备来自霍夫曼伪枝藻和柱孢鱼腥藻的纯化gdna。随后,使用kapa hifi hotstart readymix(kapa biosystems)从纯化的gdna扩增cast基因座(不包括货物基因)并克隆到puc19中。在cast转座酶基因和cas12k基因前面放置了一个lac启动子,并且在具有两个正向重复序列的缩短的crispr阵列前面添加了一个j23119启动子。阵列中的第一个内源间隔子被fncpf1原间隔子1(psp1)序列(5'

gagaagtcatttaataaggccactgttaaaa

3'(seq id no:639))代替。cast开放阅读框(orf)和下游tracr区域没有变化。所有细菌表达质粒的序列可见于表21中。
[1678]
pam和基序筛选
[1679]
使用合成的ssdna寡核苷酸(idt)生成随机化目标pam和插入基序文库,其中psp1上游有6个随机化碱基并且间隔子下游55bp处开始有8个随机化碱基。寡核苷酸用于生成pcr产物,用于随后的gibson组装(neb)到pacyc184载体中。将gibson产物电穿孔到endura电感受态细胞(lucigen)中,恢复1小时,并且放置在氯霉素板上。接种后16小时收获细胞,并使用maxi

prep试剂盒(macherey

nagel)收获质粒dna。将100ng文库目标dna与100ng phelper和pdonor共电穿孔到transformax ec100d pir 大肠杆菌中。将细胞恢复1小时并接种在含有氨苄青霉素、卡那霉素和氯霉素的平板上。使用miseq试剂盒v2(300次循环)(illumina)扩增含有随机化pam序列或基序序列的插入产物并测序。另外,文库靶标中的pam和基序序列与插入样品一起被扩增和测序。
[1680]
pam和基序发现管道
[1681]
对于序列验证的插入事件,随机化的pam区域和基序区域被提取、计数并相对于来自相应样品的读段总数归一化。给定随机化序列的富集由其在插入样品中与其在文库靶标中的丰度的比率确定。这些比率用于使用kronos plot(github.com/marbl/krona/wiki)(34)创建pam轮。收集分别高于log2富集阈值4和1的pam和基序并用于生成序列标识。
[1682]
液滴数字pcr(ddpcr)
[1683]
将ddpcr supermix for probes(biorad)、引物、产物特异性探针和样品组合到20ul反应中,并使用qx200液滴生成器(biorad)生成液滴。使用插入pcr特异性引物和供体特异性探针量化插入事件(表23)。使用靶标特异性pcr引物和相应的探针对靶标进行量化(表23)。ddpcr反应的热循环条件如下:1次循环,95℃,10分钟;40次循环,94℃,30秒,60℃,1分钟;1次循环,98℃,10分钟;4℃保持;每一步以2℃/秒匀速变化。ddpcr板用箔热封(biorad)密封,并用qx200液滴读取器读取。使用quantasoft(v1.6.6.0320)确定插入物和靶标的绝对浓度,并通过插入物/(插入物 靶标)计算插入频率。
[1684]
大肠杆菌质粒靶向测定
[1685]
通过将phelper、pinsert和ptarget各5ng转化到one shot pir1化学感受态大肠杆菌(invitrogen)中进行向目标质粒中的靶向转座。将细胞恢复1小时并接种在含有氨苄青霉素、卡那霉素和氯霉素的平板上。接种后16小时收获细胞并在含有氨苄青霉素、卡那霉素和氯霉素的lb培养基中生长8小时。使用qiaprep miniprep试剂盒(qiagen)分离质粒dna,稀释约500倍,并使用如上所述的ddpcr进行定量。
[1686]
shcast蛋白的纯化
[1687]
将shcast基因克隆到细菌表达质粒(t7

twinstrep

sumo

nls

cas12b

nls

3xha)中,并在含有plyss

trna质粒(来自novagen#70956)的bl21(de3)细胞(neb#c2527h)中表达。细胞在terrific broth中生长至对数中期并且温度降至20℃。在0.6od下用0.25mm iptg诱导表达16

20小时,然后收获并在

80℃下冷冻细胞。将细胞糊重新悬浮在补充有不含edta的complete蛋白酶抑制剂(roche)的裂解缓冲液(50mm tris ph 7.4、500mm nacl、5%甘油、1mm dtt)中。使用lm20微流化装置(microfluidics)裂解细胞,并将澄清的裂解物与strep

tactin superflow plus树脂(qiagen)结合。使用裂解缓冲液洗涤树脂,并用补充有5mm脱硫生物素的裂解缓冲液洗脱蛋白质,但tniq除外。twinstrep

sumo标签通过在4℃下用自制的sumo蛋白酶ulp1以1:100的蛋白酶与靶标重量比进行过夜消化来去除。tnib、
tnic和cas12k蛋白用50mm tris ph 7.4、50mm nacl稀释至200mm nacl的终浓度,并使用hitrap heparin hp柱在akta pure 25l(ge healthcare life sciences)上以200mm

1m nacl梯度纯化。将含有蛋白质的级分合并并浓缩并装载到superdex 200 increase柱(ge healthcare life sciences)上,最终储存缓冲液为25mm tris ph 7.4、500mm nacl、0.5mm edta、10%甘油、1mm dtt。在4℃下用sumo蛋白酶ulp1从strep

tactin superflow plus树脂上切割tniq,并装载到superdex 200 increase柱上,最终储存缓冲液为25mm tris ph 7.4、500mm nacl、0.5mm edta、10%甘油、1mm dtt。将所有蛋白质浓缩至1mg/ml原液并在液氮中快速冷冻,然后在

80℃下储存。
[1688]
体外转座测定
[1689]
纯化的蛋白质在25mm tris ph 8、500mm nacl、1mm edta、1mm dtt、25%甘油中稀释至2um。通过将含有所需rna反向互补序列的dna寡核苷酸与短t7寡核苷酸退火或通过经由pcr添加t7启动子来生成所有rna。使用hiscribe t7 high yield rna合成试剂盒(neb)在37℃下进行体外转录持续8

12小时,并使用agencourt ampure rna clean珠粒(beckman coulter)纯化rna。
[1690]
在如先前针对tn7(3)所述补充有15mm mgoac2的26mm hepes ph 7.5、4.2mm tris ph 8、50ug/ml bsa、2mm atp、2.1mm dtt、0.05mm edta、0.2mm mgcl2、28mm nacl、21mm kcl、1.35%甘油的最终反应缓冲液(最终ph 7.5)中用50nm的每种蛋白质(如所示)、20ng ptarget质粒、100ng pdonor、600nm最终rna浓度进行体外转座反应。总反应体积为20ul并且反应在指定温度下温育2小时,并在细菌转化或pcr读出之前使用qiagen pcr纯化柱进行纯化。
[1691]
大肠杆菌基因组靶向测定
[1692]
在大肠杆菌基因组的非编码区(表22)中随机选择48个带有ngtn pam的指导物并克隆到具有sgrna配置的phelper中。将5ng靶向基因组的phelper构建体转化到带有pdonor的pir1细胞中,恢复15分钟,并接种在含有氨苄青霉素和卡那霉素的平板上。通过使用kapa hifi hotstart readymix(kapa biosystems)进行套式菌落pcr鉴定成功插入。接种后16小时收获剩余的细胞,并使用dneasy blood and tissue试剂盒(qiagen)纯化gdna用于进一步分析。
[1693]
基因组插入通过插入特异性扩增进行序列验证,并使用miseq试剂盒v2(150次循环)(illumina)进行测序。修剪供体序列的配对末端读段并使用bwa(33)映射到基因组。所得序列用于确定相对于指导序列的插入位置。用如上所述的ddpcr用指导物特异性正向引物确定基因组插入频率(表20)。使用指导特异性引物(表22)和qx200ddpcr evagreen supermix(bio

rad)通过目标序列的ddpcr扩增来确定靶标丰度。
[1694]
大肠杆菌特异性分析
[1695]
将100ng带有靶向psp15、psp42或psp49的sgrna的phelper与100ng带有温度敏感psc101来源的修饰pdonor一起电穿孔到endura电感受态细胞中。恢复1小时后,细胞在含有氨苄青霉素和卡那霉素的lb培养基中于30℃生长6小时。回收的细胞接种在含有氨苄青霉素的培养基上并在43℃下生长12小时。使用dneasy blood and tissue试剂盒纯化gdna。如前所述(7)进行转座事件的无偏检测。纯化的gdna用tn5标记,接着进行qiaquick pcr纯化(qiagen)。使用tn5衔接子特异性引物和dna供体内的套式引物,使用kod热启动dna聚合酶
(millipore)进行两轮pcr扩增标记的dna样品。使用nextseq v2试剂盒(75次循环)对所得文库进行测序。由于低质量或扩增假象,配对末端读段被过滤以去除与供体序列不匹配的序列。修剪供体序列的剩余读段并使用bwa(33)映射到基因组以确定插入位置。具有两个以上独特读段的插入位置称为基因组插入,用于后续分析。在靶率定义为与映射到基因组插入的所有读段相比,映射到靶向原间隔子下游55

75bp区域的读段数量。
[1696]
示例性具体参考文献
[1697]
1.r.barrangou,p.horvath,a decade of discover:crispr functions and applications.nat microbiol 2,17092(2017).
[1698]
2.p.mohanraju et al.,diverse evolutionary roots and mechanistic variations of the crispr

cas systems.science 353,aad5147(2016).
[1699]
3.l.a.marraffini,crispr

cas immunity in prokaryotes.nature 526,55

61(2015).
[1700]
4.l.cong et al.,multiplex genome engineering using crispr/cas systems.science 339,819

823(2013).
[1701]
5.p.mali et al.,rna

guided human genome engineering via cas9.science 339,823

826(2013).
[1702]
6.b.zetsche et al.,cpf1 is a single rna

guided endonuclease of a class 2 crispr

cas system.cell 163,759

771(2015).
[1703]
7.j.strecker et al.,engineering of crispr

cas12b for human genome editing.nat commun 10,212(2019).
[1704]
8.f.teng et al.,repurposing crispr

cas12b for mammalian genome engineering.cell discovery 4,63(2018).
[1705]
9.m.jasin,r.rothstein,repair of strand breaks by homologous recombination.cold spring harb perspect biol 5,a012740(2013).
[1706]
10.j.l.schmid

burgk,k.honing,t.s.ebert,v.hornung,crispaint allows modular base

specific gene tagging using a ligase
‑4‑
dependent mechanism.nat commun 7,12338(2016).
[1707]
11.k.suzuki et al.,in vivo genome editing via crispr/cas9 mediated homology

independent targeted integration.nature 540,144

149(2016).
[1708]
12.l.s.qi et al.,repurposing crispr as an rna

guided platform for sequence

specific control of gene expression.cell 152,1173

1183(2013).
[1709]
13.a.c.komor,y.b.kim,m.s.packer,j.a.zuris,d.r.liu,programmable editing of a target base in genomic dna without double

stranded dna cleavage.nature 533,420

424(2016).
[1710]
14.n.m.gaudelli et al.,programmable base editing of a*t to g*c in genomic dna without dna cleavage.nature 551,464

471(2017).
[1711]
15.k.nishida et al.,targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems.science 353,aaf8729

aaf8729(2016).
selectivity for genome and gene analysis.nucleic acids res 28,1067

1077(2000).
[1728]
32.m.sadelain,e.p.papapetrou,f.d.bushman,safe harbours for the integration of new dna in the human genome.nat rev cancer 12,51

58(2011).
[1729]
33.h.li,r.durbin,fast and accurate short read alignment with burrows

wheeler transform.bioinformatics 25,1754

1760(2009).
[1730]
34.r.t.leenay et al.,identifying and visualizing functional pam diversity across crispr

cas systems.molecular cell 62,137

147(2016).
[1731]
35.r.j.bainton,k.m.kubo,j.n.feng,n.l.craig,tn7 transposition:target dna recognition is mediated by multiple tn7

encoded proteins in a purified in vitro system.cell 72,931

943(1993).
[1732]
36.b.ton

hoang et al.,transposition of ishp608,member of an unusual family of bacterial insertion sequences.embo j 24,3325

3338(2005).
[1733]
表20.dna序列
[1734]
[1735]
[1736]
[1737]
[1738][1739]
表21.rna序列
[1740]
[1741][1742]
表22.基因组靶标和引物
[1743]
(seq id no:649

792,其中指导序列为seq id no:649,正向引物为seq id no:650,并且反向引物为seq id no:651等)
[1744]
[1745]
[1746]
[1747][1748]
表23.ddpcr引物和探针
[1749][1750]
表24.脱靶插入
[1751]
[1752][1753]
表25.ngs引物
[1754][1755]
实施例11

cas12k与人类细胞中dna的结合
[1756]
本实施例展示了cas12k与人类细胞中dna的结合。测试了两个cas12k直系同源物
(shcas12k和accas12k)。
[1757]
将构建体转染到293hek细胞中。每个基因都由cmv启动子驱动。指导物被设计为靶向驱动gluc的上游启动子区域。accas12k显示出报告基因的显著激活。每个cas12k测试了四个不同的指导物,每个指导物都具有ggtt pam。在相同条件下,信号相对于非靶向指导物进行归一化。
[1758]
cas12k

vp64在cas12k和vp64之间插入了一个nls。所有条件都具有标记的tniq,并且每个直系同源物的两个条件代表 /

tnsc。结合信号在稍后的时间点更强。例如,cas9在稍后的时间点达到约50

100倍的激活。结果示于图59a

59b中。
[1759]
实施例12

真核细胞中cast介导的基因编辑
[1760]
hek293t细胞用40ng每种cast蛋白(cas12k

nls、tniq

nls、nls

tnsb或tnsb,和tnsc)、40ng u6

sgrna和10ng目标质粒与0.6μl mirus transit

lti转染。24小时后,用0.3μl mirus transit

lti转染100ng含有le和re以及5'硫代磷酸酯修饰的线性双链dna供体。在供体转染后96小时收获细胞,并通过用le特异性引物对靶向质粒进行pcr扩增并接着进行深度测序来检测插入。图60显示了靶标(dnmt1、emx1、vegfa、grin2b)中的插入产物。
[1761]
在illumina miseq仪器上对扩增子进行配对末端测序(75bp正向,35bp反向)。对于每个靶标(dnmt1、emx1、grin2b、vegfa),将配对读段组装到各自的目标质粒中,估计插入位置在原间隔子邻近基序(pam)下游62bp处,约束条件是正向和反向读段必须精确匹配估计的插入产物。对于每个靶标,显示了超过14,000个读段映射到估计的插入产物。图61a

61d分别显示dnmt1、emx1、vegfa、grin2b的读段的映射。
[1762]
实施例13

示例cast系统
[1763]
示例性的cas相关转座酶系统,包括编码tnsb、tnsc、tniq、cas12k、指导rna、左端序列元件和右端序列元件的序列,显示在下表26中。
[1764]
表26
[1765]
[1766]
[1767]
[1768]
[1769]
[1770]
[1771]
[1772]
[1773]
[1774]
[1775]
[1776]
[1777]
[1778]
[1779]
[1780]
[1781]
[1782]
[1783]
[1784]
[1785]
[1786]
[1787]
[1788]
[1789]
[1790]
[1791]
[1792]
[1793]
[1794]
[1795]
[1796]
[1797]
[1798]
[1799]
[1800]
[1801]
[1802]
[1803]
[1804]
[1805]
[1806]
[1807]
[1808]
[1809]
[1810]
[1811]
[1812]
[1813]
[1814]
[1815]
[1816]
[1817]
[1818]
[1819]
[1820]
[1821]
[1822]
[1823]
[1824]
[1825]
[1826]
[1827]
[1828]
[1829]
[1830]
[1831]
[1832]
[1833]
[1834]
[1835]
[1836]
[1837]
[1838]
[1839]
[1840]
[1841]
[1842]
[1843]
[1844]
[1845]
[1846]
[1847]
[1848]
[1849]
[1850]
[1851]
[1852]
[1853]
[1854]
[1855]
[1856]
[1857]
[1858]
[1859]
[1860]
[1861]
[1862]
[1863]
[1864]
[1865]
[1866]
[1867]
[1868]
[1869]
[1870]
[1871]
[1872]
[1873]
[1874]
[1875]
[1876]
[1877]
[1878]
[1879]
[1880]
[1881]
[1882]
[1883]
[1884]
[1885]
[1886]
[1887]
[1888]
[1889]
[1890]
[1891]
[1892]
[1893]
[1894]
[1895]
[1896]
[1897]
[1898]
[1899]
[1900]
[1901]
[1902]
[1903]
[1904]
[1905]
[1906]
[1907]
[1908]
[1909]
[1910]
[1911]
[1912]
[1913]
[1914]
[1915]
[1916]
[1917]
[1918]
[1919]
[1920]
[1921]
[1922]
[1923]
[1924]
[1925]
[1926]
[1927]
[1928]
[1929]
[1930]
[1931]
[1932]
[1933]
[1934]
[1935]
[1936]
[1937]
[1938]
[1939]
[1940][1941]
实施例14

示例性cas相关蛋白酶系统的dr、左端和右端元件序列和pam序列
[1942]
示例性cas相关蛋白酶系统的dr、左端和右端元件序列和pam序列显示在下表27中。
[1943]
表27
[1944]
(seq id no:804

827;其中dr为seq id no:804,供体le为seq id no:805,并且供体re为seq id no:806等)
[1945]
[1946]
[1947]
[1948]
[1949]
[1950]
[1951]
[1952]
[1953][1954]
实施例15

探索在哺乳动物细胞中起作用的cast系统
[1955]
在n末端和/或c末端带有nls标签的cas12k、tniq、tnsb和tnsc在293细胞中转染,并通过pcr检测插入。使用pureexpress进行了快速测试。293t细胞用cast组分、sgrna、供体(线性或环状)和目标质粒转染。在该条件下通过pcr未检测到插入(图62)。
[1956]
tniq和cas12k表达不佳。msgfp融合用于增加表达/稳定性。每个组分的人类细胞裂解物在体外具有可检测的活性,但并非全部都具有(图63)。测试了具有纯化tnsb/c/tniq的cas12k裂解物。
[1957]
一个示例性的野生型shcast,其在不同温度下显示出特定浓度的镁的偏好(图64)。
[1958]
生物信息学分析用于探索可能在哺乳动物细胞中起作用的cast系统。guihem(ncbi原核数据库和jgi宏基因组)鉴定了149个候选基因座。候选物被缩减到41个具有所有组分和可检测le/re元件的系统(图65)。申请人合成为人类密码子优化的细菌phelper质粒。
[1959]
预测了供体末端(图53b、图53c和图66)。针对一般的ngtn pam偏好和原间隔子下游的插入测试鉴定的cast(图67)。一些cast系统表现出双向插入(图68)。还预测了新的sgrna(图69)。
[1960]
使用各种测定鉴定了15种新的功能系统(图70)。进行细菌测定以确认sgrna活性。对于使用裂解物、优化nls标签(tnsc)和质粒/基因组靶向的体外测试进行了哺乳动物表达测定。进行生化表征以纯化所有cast系统(35/72),确定mg
2
和温度偏好,以及rnp递送到细胞中。所述测定用于高活性变体的筛选系统(图71)。推定的命中和故障排除cast(特别是cas12k)对细胞有毒。使用用于共整合和纳米孔测序的遗传测定来评价插入产物(图45a

45c和图72)。
[1961]
实施例16
[1962]
示例性的cas相关转座酶系统,包括tnsb、tnsc、tniq和cas12k的dna和蛋白质序列,显示在下表28中。
[1963]
表28
[1964]
[1965]
[1966]
[1967]
[1968]
[1969]
[1970]
[1971]
[1972]
[1973]
[1974]
[1975]
[1976]
[1977]
[1978]
[1979]
[1980]
[1981]
[1982]
[1983]
[1984]
[1985]
[1986]
[1987]
[1988]
[1989]
[1990]
[1991]
[1992]
[1993]
[1994]
[1995]
[1996]
[1997]
[1998]
[1999]
[2000]
[2001]
[2002]
[2003]
[2004][2005]
实施例17

[2006]
示例性cast(系统id t21,依沙矛丝藻charlie

1)的注释显示在图73中,并且序列示于下表29中。
[2007]
表29
[2008]
[2009]
[2010]
[2011]
[2012][2013]
实施例18

[2014]
本实施例显示了对实施例13中讨论的cast系统t59(cp003548/念珠藻属物种pcc 7107)的测试。将t59 nls

b、c、nls

q和nls

k或nls

b、c、nls

gfp

q和nls

gfp

k共转染到hek

293细胞中。两天后,收获细胞,并将来自这些细胞的裂解物添加到存在或不存在靶向fnpsp1的sgrna的体外转座测定中。凝胶显示了来自该测定的插入产物的pcr检测结果(图74a)。使用ngs对来自上述反应的pcr条带进行测序,证明了在pam区域下游约60bp处验证插入了rgtr pam(图74b)。
[2015]
实施例19哺乳动物细胞中的质粒靶向
[2016]
使用lipofectamine 2000将来自t59(cp003548/念珠藻属物种pcc 7107)的n末端nls标记的tnsb、无标签tnsc、nls

sfgfp标记的tniq和n末端sfgfp标记的cas12k与t59供体质粒、体外转录的指导rna和含有用于相应单指导rna的靶标的质粒一起共转染到hek293t细胞中。示意图示于图75中。72小时后,使用lucigenquickextract从细胞中提取dna,并对插入产物进行pcr。ngs序列(图76a

d)显示了来自哺乳动物细胞中质粒靶向测定的经验证的质粒插入。在两个不同的质粒区域中,对于4个不同的具有agta和ggtg原间隔子邻近基序(pam)的原间隔子,在pam序列下游59

64bp处发现插入。
[2017]
表30
[2018]
[2019]
[2020][2021]
表31
[2022][2023]
表32
[2024]
[2025]
[2026]
[2027]
[2028]
[2029]
[2030]
[2031]
[2032]
[2033]
[2034]
[2035]
[2036]
[2037]
[2038]
[2039]
[2040]
[2041]
[2042]
[2043][2044]
实施例16
[2045]
twinstrep

sumo标记的q在大肠杆菌中存在或不存在tnsb/tnsc/cas12k的情况下
进行纯化。当tniq与tnsb/tnsc/cas12k共表达时,存在~70kd蛋白质条带,而单独纯化q时则不存在。纯化的cas12k在同一凝胶上操作,以帮助揭示新条带的可能身份。结果示于图77中。
[2046]
含有t59蛋白的构建体在cmv启动子下从单个载体共表达,其中c末端gfp标记的cas12k使用t2a连接到nls

xten

tnsc(v5/v7)或nls

gs

tnsc(v6/v8),接着是一个内部核糖体进入位点(ires)。ires之后是使用t2a连接到nls

tnsb的n末端gfp标记的tniq(v5/v6)或nls

tniq(v7/v8)。构建体被命名为t59

t2a

v5至t59

t2a

v8。序列和图谱如下所示。
[2047]
表33
[2048]
[2049]
[2050]
[2051]
[2052]
[2053]
[2054]
[2055]
[2056]
[2057]
[2058]
[2059]
[2060]
[2061]
[2062]
[2063]
[2064]
[2065][2066]
申请人还测试了dcas9和cas12k的融合物。在这些实验中,dcas9融合到t59 cas12k的n或c末端。ruvc dcas9融合物进行类似设计,不同之处在于从构建体中去除了cas12k的失活ruvc结构域。实验中使用的构建体的序列和图谱如下所示。
[2067]
表34
[2068]
[2069]
[2070]
[2071]
[2072]
[2073]
[2074]
[2075]
[2076]
[2077]
[2078]
[2079]
[2080]
[2081]
[2082]
[2083]
[2084]
[2085]
[2086]
[2087]
[2088][2089]
***
[2090]
在不脱离本发明的范围和精神的情况下,本发明的所述方法、药物组合物和试剂盒的各种修改和变化对于本领域技术人员来说将是显而易见的。尽管本发明已经结合特定实施方案进行了描述,但是应当理解,它能够进行进一步的修改并且所要求保护的本发明不应被过度地限制于这些具体实施方案。实际上,对于本领域技术人员显而易见的所描述的用于实施本发明的模式的各种修改预期都在本发明的范围内。本技术旨在涵盖总体遵循本发明的原理且包括相比于本公开在本发明所属领域内的已知惯用实践内并且可应用于本文前文所述的必要特征的这样的偏离的本发明的任何变化、用途或改编。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜