多重引导rna
1.本技术是中国专利申请201480076396.6的分案申请,原申请201480076396.6的申请日为2014年09月18日,其名称为“多重引导rna”。
2.相关申请的交叉引用
3.本技术要求于2013年12月26日提交的临时专利申请61/921,007;2014年3月14日提交的临时专利申请14/211,117;2014年3月14日提交的pct/us 2014/029068;2014年3月14日提交的pct/us 2014/028630;2014年3月23日提交的pct/us 2014/035162;和2014年3月14日提交的pct/us 2014/029304的权益。所有以上内容均通过引用结合在此。
4.联邦资助的研究或进展
5.本发明是由国立卫生研究院授予的在授权号dp1 gm105378下的政府支持所完成的。政府在本发明中享有一定的权利。
技术领域
6.描述的是用于任选地在哺乳动物细胞中将高活性crispr引导rna(grna)从rna聚合酶ii和iii启动子进行多重表达的方法和构建体。
7.背景
8.cas9核酸酶形成了可编程rna引导的成簇规律间隔短回文重复(crispr)/crispr关联的(cas)系统(wiedenheft(魏登赫夫特)等人,自然(nature)482,331
‑
338(2012);horvath(霍瓦特)等人,科学(science)327,167
‑
170(2010);terns(腾斯)等人,微生物学当前观点(curr opin microbiol)14,321
‑
327(2011)),在体外、在哺乳动物细胞中、和在活模式生物,例如斑马鱼中,该系统可以用于产生靶dna序列中的位点特异性断裂(王(wang)等人,细胞(cell)153,910
‑
918(2013);沈(shen)等人,细胞研究(cell res)(2013);迪卡洛(dicarlo)等人,核酸研究(nucleic acids res)(2013);姜(jiang)等人,自然生物技术(nat biotechnol)31,233
‑
239(2013);季聂克(jinek)等人,elife 2,e00471(2013);黄(hwang)等人,自然生物技术(nat biotechnol)31,227
‑
229(2013);丛(cong)等人,科学(science)339,819
‑
823(2013);马里(mali)等人,科学(science)339,823
‑
826(2013c);丘(cho)等人,自然生物技术(nat biotechnol)31,230
‑
232(2013);格拉茨(gratz)等人,遗传学(genetics)194(4):1029
‑
35(2013))。短的大约100nt引导rna(grna)与cas9复合并且指导核酸酶至特异性靶dna位点;靶向是由在grna的5’端的至少17
‑
20个核苷酸(nt)的序列介导的,该序列被设计为经由工程化的grna的前17
‑
20个核苷酸和紧接前间区序列邻近基序(pam),例如匹配序列ngg或nag的pam定位的感兴趣的靶基因组dna序列的互补链之间的简单碱基对互补性互补和相互作用(沈(shen)等人,细胞研究(cell res)(2013);迪卡洛(dicarlo)等人,核酸研究(nucleic acids res)(2013);姜(jiang)等人,自然生物技术(nat biotechnol)31,233
‑
239(2013);季聂克(jinek)等人,elife 2,e00471(2013);黄(hwang)等人,自然生物技术(nat biotechnol)31,227
‑
229(2013);丛(cong)等人,科学(science)339,819
‑
823(2013);马里(mali)等人,科学(science)339,823
‑
826(2013c);丘(cho)等人,自然生物技术(nat biotechnol)31,230
‑
232(2013);季聂克(jinek)等人,科学
(science)337,816
‑
821(2012))。grna还可以指导催化失活的cas9蛋白(称为dcas9,参见季聂克(jinek)等人,科学(science)337:816
–
821(2012)),该蛋白进而与效应物结构域(例如转录活化结构域)融合,参见例如2013年3月15日提交的ussn 61/799,647,和2013年6月21日提交的61/838,148,将这二者通过引用结合在此。后面的系统使得异源效应物结构域的rna引导的募集能够到达感兴趣的基因组座位。
9.概述
10.本发明至少部分地基于csy4的发现,csy4是一种内切核糖核酸酶,该内切核糖核酸酶识别短rna发夹序列,可以用于切下在单个较长rna转录物上编码的多功能grna(产生自rna pol ii或iii启动子),在该较长rna转录物中的各个grna由csy4切割位点隔开。
11.因此,在一个第一方面,本发明提供了脱氧核糖核酸(dna)分子,该dna分子包括编码引导rna(grna)的多个序列,其中每个grna侧翼是至少一个csy4切割序列,该csy4切割序列包括序列gttcactgccgtataggcag(seq id no:1)或gttcactgccgtataggcagctaagaaa(seq id no:2)或由其组成。
12.在一些实施例中,该dna分子可操作地连接至启动子序列。
13.在一些实施例中,该dna分子包括两个、三个、或更多个grna序列,每个序列侧翼是至少一个csy4切割序列。
14.在一些实施例中,该启动子序列是rna聚合酶ii(pol ii)启动子或pol iii启动子,优选是rna pol ii启动子。在一些实施例中,该pol ii启动子选自下组,该组由以下各项组成:cag、ef1a、caggs、pgk、ubic、cmv、b29、结蛋白、内皮因子、flt
‑
1、gfpa、和syn1启动子。
15.在另一方面,本发明提供了dna分子,该dna分子包括与一个、两个、三个或更多个盒连接的启动子序列,这些盒包括:编码引导rna的序列,即约100nt的序列,例如95
‑
300nt,例如对于基于酿脓链球菌的系统是95
‑
105nt,该序列连接至csy4切割位点,例如seq id no:1或2。
16.在一些实施例中,该dna分子包括pol ii启动子,该pol ii启动子可操作地连接至编码第一引导rna的第一序列,该第一序列连接至一个csy4切割位点,该csy4切割位点连接至编码第二引导rna的第二序列,该第二序列连接至一个csy4切割位点,该csy4切割位点连接至编码第三引导rna的第三序列,该第三序列连接至csy4切割位点。在一些实施例中,包括连接至csy4切割位点的另外的引导rna。例如,该dna分子可以具有以下结构:启动子
‑
c4
–
grna
–
c4
–
grna
–
c4
–
grna
–
c4启动子
‑
c4
–
grna
–
c4
–
grna
–
c4
–
grna
–
c4
–
grna
–
c4启动子
‑
c4
–
grna
–
c4
–
grna
–
c4
–
grna
–
c4
–
grna
–
c4
–
grna c4诸如此类。在这一例示中,c4是编码csy4 rna切割位点的序列并且grna是编码引导rna的序列。
17.在一些实施例中,cas9 sgrna包括以下序列:
18.(x
17
‑
20
)guuuuagagcuaugcuguuuug(x
n
)(seq id no:4);
19.(x
17
‑
20
)guuuuagagcua (seq id no:5);
20.(x
17
‑
20
)guuuuagagcuaugcuguuuug(seq id no:6);
21.(x
17
‑
20
)guuuuagagcuaugcu(seq id no:7);
22.(x
17
‑
20
)guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccg
23.(x
n
)(seq id no:8);
24.(x
17
‑
20
)guuuuagagcuaugcugaaaagcauagcaaguuaaaauaaggcuaguccguuauc(x
n
)(seq id no:9);
25.(x
17
‑
20
)guuuuagagcuaugcuguuuuggaaacaaaacagcauagcaaguuaaaauaaggcuaguccguuauc(x
n
)(seq id no:10);
26.(x
17
‑
20
)guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(x
n
)(seq id no:11),
27.(x
17
‑
20
)guuuaagagcuagaaauagcaaguuuaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(seq id no:12);
28.(x
17
‑
20
)guuuuagagcuaugcuggaaacagcauagcaaguuuaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(seq id no:13);或
29.(x
17
‑
20
)guuuaagagcuaugcuggaaacagcauagcaaguuuaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(seq id no:14),
30.其中x
17
‑
20
是与靶序列的、优选是紧接前间区序列邻近基序(pam)的5’的靶序列的17
‑
20个连续核苷酸的互补链互补的序列,并且x
n
是并不干扰核糖核酸与cas9的结合的任何序列。尽管在此用酿脓链球菌cas9系统例证了x
17
‑
20
的序列,但是还可以使用较长的序列,例如,如合乎其他系统的话。
31.在一些实施例中,该dna分子还包括编码功能性csy4酶的序列。
32.在此还提供的是包括在此描述的dna分子的载体,例如,任选地包括编码功能性csy4酶的序列的载体。在此还提供的是由这些dna分子生产的多重转录物,例如仍未用csy4切割的完整rna。
33.仍在另一方面,在此提供的是用于在细胞中生产多个引导rna的方法。这些方法包括在细胞中表达在此描述的dna分子。
34.在一些实施例中,该细胞是哺乳动物细胞,并且该细胞还表达外源功能性csy4酶序列,或该方法进一步包括给予功能性csy4酶或编码功能性csy4酶的核酸。
35.在另一方面,本发明提供了用于在细胞中改变一个或多个靶基因的表达的方法。这些方法包括表达如在此描述的dna分子,例如包括编码引导rna(grna)的多个序列的dna分子,其中每个grna包括与一个或多个靶基因的至少17
‑
20nt互补的可变序列,并且每个grna侧翼是至少一个csy4切割序列,该csy4切割序列包括序列gttcactgccgtataggcag(seq id no:1)或gttcactgccgtataggcagctaagaaa(seq id no:2)或由其组成。
36.在本发明的方法和组合物中,grna可以是,如在此描述的,包括融合的tracrrna和crrna的单个引导rna,或可以只包括crrna,并且可以从相同或不同的dna分子表达tracrrna。因此,在一些实施例中,在此描述的dna分子还包括编码tracrrna的序列。在一些实施例中,这些方法包括在细胞中表达分开的tracrrna,例如使这些细胞与表达tracrrna的载体或dna分子接触。
37.除非另外定义,在此所使用的全部技术术语和科学术语具有与本发明所属领域之内的普通技术人员通常所理解的相同的意思。本文描述了用于本发明的方法和材料;还可使用本领域已知的其他合适的方法和材料。这些材料、方法、以及实例仅是说明性的,并且不旨在进行限制。本文提及的所有出版物、专利申请、专利、序列、数据库条目和其他参考文献通过引用以其整体结合。在有矛盾的情况下,将以本说明书(包括定义)为准。
38.本发明的其他特征和优点将从下列详述和附图以及从权利要求中显而易见。
附图说明
39.图1是用于如下初始多重实验的示意性例示构建体:
40.1 2:同向重复crrna阵列和cas9,具有分开的tracrrna
41.3 4:通过csy4位点分开的短crrna阵列,具有csy4、cas9、和分开的tracrrna
42.5 6:通过csy4位点分开的全长嵌合grna。
43.7:nls
‑
flag标签化的cas9
44.图2是示出在表达图1中示出的构建体的细胞中的实验结果的柱状图。csy4位点 完整grna(构建体5和6)是最有效的多重框架。
45.图3是示例性标准和基于多重csy4的grna框架,和它们生产的转录物的示意性概览和比较。注意到,csy4使得能够使用rna pol ii启动子(例如cag)作为u6的替代物,u6是一种rna pol iii启动子。
46.图4是示出在人类细胞中,csy4切割产生具有更高活性的grna的截短识别位点的柱状图。截短位点的加工还留下一个干净的5’端,有效除去了由u6启动子强加的对grna靶序列的5’g限制。
47.图5a
‑
c是示出在单个人类细胞中编辑的2
‑
靶多重的证据的序列。在目的位点2或3观察到单个缺失。对于位点2和3,观察到在同一序列上的多个缺失。还观察到跨位点2和3的缺失。
48.图6是使用基于csy4的系统,示出三个grna的成功多重表达的示意图。
49.图7是示出通过csy4,从rna pol ii转录的mrna切除的grna可以有效募集cas9核酸酶至人类细胞中的特定靶标。在这些实验中,在从rna pol ii cag启动子制成的较长mrna转录物中表达grna。
50.详述
51.cas9系统的一个潜在优点是募集核酸酶活性或异源效应物结构域至细胞中的多于一个基因组座位或靶位点的能力。然而,此类多重应用需要在细胞中有效表达多于一个grna的能力。对于哺乳动物细胞,已经使用rna聚合酶iii启动子(例如u6启动子)来表达单个短grna。用来在人类细胞中从单个转录物表达多个grna组分的先前尝试未被证明有效。
52.对于cas9系统,另外的所希望的能力是产生组分的可诱导版本并且实现组分的组织特异性表达。先前已经描述了可诱导的和/或组织特异性的rna聚合酶ii启动子。然而,尽管cas9或dcas9蛋白可以从此类rna pol ii启动子表达,但是短的、限定的grna不能以此方式表达,因为来自rna pol ii的转录的起始和停止位点是不精确的。事实上,至今所有grna都已经从rna聚合酶iii启动子表达,并且这些启动子都理想地适合短rna的表达。
53.如在此所证明,csy4是一种内切核糖核酸酶,该内切核糖核酸酶识别短rna发夹序列,可以用于切下在单个较长rna转录物上编码的多功能grna(产生自rna pol ii或iii启动子)盒,在该较长rna转录物中的各个grna由csy4切割位点隔开。可以从较长rna转录物成功切割功能grna,这些rna转录物是从rna pol ii启动子表达的。
54.grna/csy4多聚盒
55.因此,在此描述的是编码较长的rna转录物的dna分子,该较长的rna转录物在此称
为多聚盒,该多聚盒包括两个或更多个grna序列,其中每个grna侧翼是csy4切割序列。该dna分子还可以包括启动子,并且可以任选地包括一个或多个其他转录调节序列,例如增强子、沉默子、隔离子、和聚a序列。参见,例如,徐(xu)等人,基因(gene),2001年7月11日;272(1
‑
2):149
‑
56。
56.启动子
57.本领域已知可以用于本发明的方法的多个启动子。在一些实施例中,该启动子是polii或pol iii启动子,优选是pol ii启动子。已经描述了不同pol ii启动子,并且这些pol ii启动子可以用于本发明的组合物和方法,包括cag启动子(参见例如亚历克斯奥波罗(alexopoulou)等人,bmc细胞生物学(bmc cell biology)9:2,2008;宫崎(miyazaki)等人,基因(gene)79(2):269
–
77(1989);丹羽(niwa)等人,基因(gene)108(2):193
–
9(1991));另外的启动子包括ef1a、caggs、pgk、ubic和cmv启动子,连同组织特异性启动子,例如除其他之外,b29、结蛋白、内皮因子、flt
‑
1、gfpa、syn1;多个启动子的序列是本领域已知的。例如,可以分别从psicor和psicor pgk扩增cmv和pgk启动子(凡吐拉(ventura)等人,美国国家科学院院刊(proc natl acad sci u s a)101:10380
–
10385(2004)),可以从pdsl_hpugih(atcc)扩增ubic启动子,可以从pcaggs(bccm)扩增caggs启动子,并且可以从pef6载体(英杰公司(invitrogen))扩增ef1a启动子。在巴特勒(butler)和角永(kadonaga),基因和发育(genes&dev.)16:2583
‑
2592(2002)中描述了pol ii核心启动子。由pol ii表达驱动的较大转录物切下grna使得人们能够生产grna,该grna具有在最5'
‑
位置的任何核苷酸(来自u6或其他rna聚合酶iii启动子的标准表达对这一核苷酸的身份加以限制)。
58.在一些实施例中,使用组织特异性启动子,并且可以离开rna
‑
pol ii转录物加工短的限定的grna序列。
59.本领域已知多个pol iii启动子,包括u6小核(sn)rna启动子、7sk启动子、和h1启动子。参见,例如,罗(ro)等人,生物技术(biotechniques)38(4):625
–
627(2005)。
60.引导rna
61.通过使用在其与基因组dna靶位点互补的5’端携带至少17
‑
20nt的单个grna,cas9核酸酶可以被引导至携带序列ngg的另外的近端前间区序列邻近基序(pam)的至少17
‑
20nt的特定基因组靶。
62.因此,在此描述的组合物可以包括编码单个引导rna(sgrna)的序列,该单个引导rna(sgrna)包括融合至正常反式编码的tracrrna的crrna,该单个引导rna例如是单个cas9引导rna,如在马里(mali)等人,科学(science)2013年2月15日;339(6121):823
‑
6中描述,其中在5’端的序列与紧接前间区序列邻近基序(pam),例如ngg、nag或nngg的5’的靶序列的17
‑
20个核苷酸(nt)互补。
63.设计和表达引导rna的方法是本领域已知的。引导rna总而言之归于两个不同系统:1)系统1使用分开的crrna和一起发挥功能的tracrrna,以便引导用cas9切割;以及2)系统2使用组合在单个系统中的两个分开的引导rna的嵌合crrna
‑
tracrrna杂合体(季聂克(jinek)等人2012)。tracr
‑
rna可以被可变地截短,并且已经示出在分开系统(系统1)和嵌合grna系统(系统2)二者中发挥功能的长度范围。参见例如季聂克(jinek)等人,科学(science)2012;337:816
–
821;马里(mali)等人,科学(science)2013年2月15日;339(6121):823
‑
6;丛(cong)等人,科学(science)2013年2月15;339(6121):819
‑
23;以及黄
(hwang)和付(fu)等人,自然生物技术(nat biotechnol.)2013年三月;31(3):227
‑
9;季聂克(jinek)等人,elife 2,e00471(2013))。对于系统2,通常,较长长度的嵌合grna已经示出更大上靶活性,但是,不同长度grna的相对特异性目前仍未限定,并且因此在某些实例中可能希望使用较短grna。在一些实施例中,grna与转录起始位点上游约100
‑
800bp内的区域互补,该区域例如在转录起始位点上游约500bp,包括转录起始位点,或在转录起始位点下游约100
‑
800bp,例如约500bp内。在一些实施例中,使用编码多于一个grna的载体(例如质粒),例如编码2、3、4、5、或更多个grna的质粒,这些grna被定向到靶基因的同一区域中的不同位点。在题为针对rna引导的基因组编辑的增加的特异性(increasing specificity for rna
‑
guided genome editing)的临时专利申请序列号61/838,178中描述了增加基因组编辑的特异性的另外的引导rna和方法。
64.在一些实施例中,该grna包括以下序列或由其组成:
65.(x
17
‑
20
)guuuuagagcuaugcuguuuug(x
n
)(seq id no:4);
66.(x
17
‑
20
)guuuuagagcua (seq id no:5);
67.(x
17
‑
20
)guuuuagagcuaugcuguuuug(seq id no:6);
68.(x
17
‑
20
)guuuuagagcuaugcu(seq id no:7);
69.(x
17
‑
20
)guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccg
70.(x
n
)(seq id no:8);
71.(x
17
‑
20
)guuuuagagcuaugcugaaaagcauagcaaguuaaaauaaggcuaguccguuauc(x
n
)(seq id no:9);
72.(x
17
‑
20
)guuuuagagcuaugcuguuuuggaaacaaaacagcauagcaaguuaaaauaaggcuaguccguuauc(x
n
)(seq id no:10);
73.(x
17
‑
20
)guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(x
n
)(seq id no:11),
74.(x
17
‑
20
)guuuaagagcuagaaauagcaaguuuaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(seq id no:12);
75.(x
17
‑
20
)guuuuagagcuaugcuggaaacagcauagcaaguuuaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(seq id no:13);或
76.(x
17
‑
20
)guuuaagagcuaugcuggaaacagcauagcaaguuuaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(seq id no:14),
77.其中x
17
‑
20
是与靶序列的至少17
‑
20个连续核苷酸的互补链互补的序列(尽管在一些实施例中,这一互补性区域可以是大于20nt,例如21、22、23、24、25、26、27、28、29、或30或更多个nt,例如17
‑
30nt)的、优选紧接前间区序列邻近基序(pam)的5’处的靶序列,例如ngg、nag、或nngg。x
n
是任何序列,其中n(在rna中)可以是并不干扰核糖核酸与cas9的结合的0
‑
300或0
‑
200,例如0
‑
100、0
‑
50、或0
‑
20。在一些实施例中,该rna包括在该分子的3’端的一个或多个u,例如1至8个或更多个u(例如u、uu、uuu、uuuu、uuuuu、uuuuuu、uuuuuuu、uuuuuuuu),这是由于用作用来终止rna poliii转录的终止信号的一个或多个t的任选存在。在一些实施例中,该rna包括在并不与靶序列互补的该rna分子的5’端的一个或多个,例如高达3个,例如一个、两个、或三个、或更多个另外的核苷酸。任选地,该rna核苷酸中的一个或多个被修饰,例如锁定(2
’‑
o
‑4’‑
c亚甲基桥),是5'
‑
甲基胞苷,是2'
‑
o
‑
甲基
‑
假尿苷,
或其中磷酸核糖主链已经被聚酰胺链,例如序列x
17
‑
20
内的核苷酸中的一个或多个,序列x
n
内的核苷酸中的一个或多个,或该grna的任何序列内的核苷酸中的一个或多个替换。
78.例如,在一些实施例中,可以使用在季聂克(jinek)等人(科学(science).337(6096):816
‑
21(2012))中描述的嵌合引导rna,例如,
79.(x
17
‑
20)
guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccg(seq id no:8);(x
17
‑
20)
guuuuagagcuagaaauagcaaguuaaaauaagg(seq id no:9);在一些实施例中,使用携带有与靶dna序列互补的5
′‑
末端17
‑
20个核苷酸序列的sgrna,以及cas9结合必需的42个核苷酸的3
′‑
末端茎环结构(描述在季聂克(jinek)等人,elife.2:e00471(2013)中),例如(x
17
‑
20)
guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccg(seq id no:8)。
80.在一些实施例中,该引导rna包括在3’端上的一个或多个腺嘌呤(a)或尿嘧啶(u)核苷酸。
81.尽管在此描述的实例利用单个grna,但是还可以与双重grna(例如在天然存在的系统中发现的crrna和tracrrna)一起使用这些方法。在这一情况下,将结合使用本系统,例如以下项(注意对于rna,在此t应被理解为u)表达的多个不同crrna,使用单个tracrrna:
82.crrna序列:x
17
‑
20
‑
gttttagagctagaaa(seq id no:15)
83.tracrrna序列:tagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc(seq id no:16)。在这一情况下,在此处描述的方法和分子中,crrna被用作引导rna,并且可以从相同或不同的dna分子表达tracrrna。
84.此外,尽管在此例证了具有互补性的17
‑
20个核苷酸的序列的引导rna,但是在一些实施例中,可以使用较长的序列,例如21、22、23、24、25、26、27、28、29、或30或更多nt,例如17
‑
30nt代替17
‑
20nt。
85.csy4切割序列
86.在此处描述的方法和组合物中,将csy4切割序列插入该dna分子中,这样使得每个引导rna侧翼是切割序列,其中一个或至少一个切割序列在每个引导rna之间。示例性csy4切割序列包括gttcactgccgtataggcag(截短的20nt)(seq id no:1)和gttcactgccgtataggcagctaagaaa(完整28nt)(seq id no:2)。如在此所证明,在人类细胞中,与使用标准位点相比,使用截短的csy4切割位点(seq id no:1)更有效。据本发明的诸位发明人所知,这是在人类细胞中利用csy4活性的第一个证明。
87.功能性csy4酶序列
88.在此处描述的方法中,在细胞中还表达了能够在csy4切割位点切割转录物的的功能性csy4酶。
89.示例性csy4序列来自csy4同系物,这些csy4同系物来自绿脓假单胞菌ucbpp
‑
pa14(pa14),鼠疫杆菌aam85295(yp),大肠杆菌uti89(ec89),节瘤偶蹄菌(dichelobacter nodosus)vcs1703a(dn),鲍氏不动杆菌ab0057(ab),南极细菌属(moritella sp.)pe36(mp1、mp01),希瓦氏菌属w3
‑
18
‑
1(sw),多杀性巴氏杆菌败血亚种pm70(pm),植物腐败菌(pectobacterium wasabiae)(pw),和菊欧文氏菌(dickeyadadantii)ech703(dd),都列出在胡尔维茨(haurwitz)等人,科学(science)329(5997):1355
–
1358(2010)的图s6中。在优选的实施例中,csy4来自绿脓假单胞菌。
90.在一些实施例中,csy4还用于共价连接异源效应物结构域至grna。csy4被认为是
单一转换酶,并且在切割后保留结合至其靶发夹序列(斯腾伯格(sternberg)等人,rna.2012年4月;18(4):661
‑
72)。因此,预期csy4保留结合至每个切割的grna的3’端。因为如在此所证明,切割的grna似乎在人类细胞中发挥功能,但是这一csy4蛋白在grna的3'端的存在似乎并不影响grna与cas9复合的能力并且指导cas9活性。因此,假定这些grna
‑
csy4融合还将能够指导携带突变的cas9突变体,这些突变灭活其催化核酸酶活性(dcas9蛋白)。因此,人们可以将异源功能域(hfd)融合至csy4(csy4
‑
hfd),并且然后dcas9:sgrna:csy4
‑
hfd复合物可以指导此类结构域至特定基因组座位。此类hfd的实例可以包括其他核酸酶结构域,例如来自foki的、转录激活因子的或阻遏蛋白的结构域的结构域,或修饰组蛋白或dna甲基化状态的其他结构域。
91.通过将异源功能域(例如转录活化结构域,例如来自vp64或nf
‑
κbp65)融合至csy4的n
‑
末端或c
‑
末端,其中使用或不使用中介连接子,例如约5
‑
20或13
‑
18个核苷酸的连接子,来产生csy4
‑
hfd。可以将转录活化结构域融合在csy4的n或c末端上。除了转录活化结构域,还可以使用如本领域中已知的其他异源功能域(例如转录阻遏蛋白(例如krab、sid、和其他阻遏蛋白)或沉默子,例如异染色质蛋白1(hp1,也称为swi6),例如hp1α或hp1β;可以募集融合至固定rna结合序列的长非编码rna(lncrna)的蛋白或肽,例如通过ms2外壳蛋白、内切核糖核酸酶csy4、或λn蛋白结合的那些;修饰dna的甲基化状态的酶(例如dna甲基转移酶(dnmt)或tet蛋白);或修饰组蛋白亚基的酶(例如组蛋白乙酰转移酶(hat)、组蛋白脱乙酰酶(hdac)、组蛋白甲基转移酶(例如用于赖氨酸或精氨酸残基的甲基化),或组蛋白脱甲基化酶(例如用于赖氨酸或精氨酸残基的脱甲基作用)。此类结构域的多个序列是本领域已知的,例如催化dna中甲基化的胞嘧啶的羟基化作用的结构域。示例性蛋白包括十
‑
十一易位(tet)1
‑
3家族,在dna中转化5
‑
甲基胞嘧啶(5
‑
mc)为5
‑
羟甲基胞嘧啶(5
‑
hmc)的酶。参见例如wo/2014/144761。
92.人类tet1
‑
3的序列是本领域中已知的,并且在下表中示出:
[0093][0094]
*变体(1)表示较长转录物并且编码较长亚型(a)。与变体1相比,变体(2)差别在于5'utr和在于3'utr以及编码序列。与亚型a相比,所得亚型(b)更短并且具有不同c末端。
[0095]
在一些实施例中,可以包括催化结构域的全长序列的全部或一部分,例如包括富半胱氨酸延伸和由7个高度保守的外显子编码的2ogfedo结构域的催化模块,例如包括氨基酸1580
‑
2052的tet1催化结构域,包括氨基酸1290
‑
1905的tet2,和包括氨基酸966
‑
1678的tet3。参见例如伊耶(iyer)等人,细胞周期(cell cycle).2009年6月1日;8(11):1698
‑
710的图1。电子出版物2009年6月27日针对例示了所有三种tet蛋白中的关键催化残基的比对,及其针对全长序列的补充材料(在ftp站点ftp.ncbi.nih.gov/pub/aravind/dons/supplementary_material_dons.html可得)(参见例如seq 2c);在一些实施例中,该序列包
括tet1的氨基酸1418
‑
2136或tet2/3中的相应区域。
[0096]
其他催化模块可以例如来自伊耶(iyer)等人,2009年鉴定的蛋白。
[0097]
在一些实施例中,融合蛋白包括csy4和异源功能域之间的连接子。可以用于这些融合蛋白(或在连接的结构中的融合蛋白之间)的连接子可以包括并不干扰融合蛋白的功能的任何序列。在优选的实施例中,该连接子是短的,例如2
‑
20个氨基酸,并且典型地是柔性的(即包括具有高自由度的氨基酸,例如甘氨酸、丙氨酸、和丝氨酸)。在一些实施例中,该连接子包括由gggs(seq id no:3)或ggggs(seq id no:17)组成的一个或多个单元,例如gggs(seq id no:3)或ggggs(seq id no:17)单元的两个、三个、四个、或更多个重复。还可以使用其他连接子序列,例如ggs、ggsg(seq id no:22)、sgsetpgtsesa(seq id no:23)、sgsetpgtsesatpes(seq id no:24)、或sgsetpgtsesatpeggsggs(seq id no:25)。
[0098]
cas9
[0099]
在此处描述的方法中,还在细胞中表达cas9。多种细菌表达cas9蛋白变体。目前最长使用来自酿脓链球菌的cas9;一些其他cas9蛋白具有与酿脓链球菌cas9的高水平的序列一致性,并且使用相同引导rna。其他cas9是更多样化的,使用不同grna,并且也识别不同pam序列(由邻近该rna指定的序列的蛋白指定的2
‑
5个核苷酸序列)。切林斯基(chylinski)等人将来自大组的细菌的cas9蛋白分类(rna生物学10:5,1
–
12;2013),并且在其补充图1和补充表1中列出了大量cas9蛋白,将其通过引用结合在此。在此描述的构建体和方法可以包括使用那些cas9蛋白中的任一种,及其相应引导rna或其他相容的引导rna。在丛(cong)等人(科学(science)39,819(2013))中,已经示出来自嗜热链球菌lmd
‑
9crispr1系统的cas9在人类细胞中发挥功能。另外,季聂克(jinek)等人示出在体外,来自嗜热链球菌和英诺克李斯特菌(但不是来自脑膜炎奈瑟氏球菌或空肠弯曲菌,它们可能使用不同引导rna)的cas9直向同源物可以由双重酿脓链球菌grna引导,以便切割靶质粒dna,尽管具有略微降低的效率。
[0100]
在一些实施例中,本系统利用来自酿脓链球菌的cas9蛋白,作为在细菌中编码,或被密码子优化用于在哺乳动物细胞中表达。融合至ha表位(氨基酸序列daypydvpdyasl(seq id no:18))和核定位信号(氨基酸序列pkkkrkvedpkkkrkvd(seq id no:19))的酿脓链球菌cas9的示例性序列(残基1
–
1368)如下:
[0101]
[0102][0103]
参见季聂克(jinek)等人,2013,同上。
[0104]
在一些实施例中,使用包含d10a和h840a突变之一的cas9序列,以便致使核酸酶成为切口酶,或使用包含d10a和h840a突变这二者的cas9序列,以便致使蛋白的核酸酶部分催化失活。可以用于在此描述的方法和组合物的催化失活酿脓链球菌cas9(dcas9)的序列如下;突变处于粗体并且加下划线。
[0105]
[0106][0107]
参见,例如马里(mali)等人,2013,同上;和季聂克(jinek)等人,2012,同上。可替代地,cas9可以是dcas9
‑
杂功能域融合(dcas9
‑
hfd),如在2013年6月21日提交的题为至特定基因组座位的遗传学和表观遗传学调节蛋白的rna引导的靶向(rna
‑
guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci)的美国临时专利申请,和指定序列号61/838,148中,和在pct/us 2014/027335中所描述。
[0108]
如在此所述,可以从表达载体,例如包括编码cas9的序列,例如cas9cdna或基因的染色体外质粒或病毒载体表达cas9;可以从已经整合进细胞的基因组的外源cas9 cdna或基因表达cas9;可以从编码cas9的mrna表达cas9;cas9可以是实际cas9蛋白自身;或在非哺乳动物细胞的情况下,可以是外源cas9。
[0109]
表达系统
[0110]
可以使用包括表达载体的核酸分子,例如用于在此描述的csy4/引导rna构建体的体内或体外表达。用于表达多个grna的载体(潜在地,以可诱导的或组织
‑
/细胞
‑
型特异性方式)可以用于研究和治疗应用。
[0111]
为了使用在此描述的融合蛋白和多聚引导rna盒,可能希望从编码它们的核酸表达它们。这可以按多种方式进行。例如,可以将编码引导rna盒或csy4或cas9蛋白的核酸克隆进中间载体,用于转化进原核细胞或真核细胞,以便复制和/或表达。中间载体典型地是原核生物载体,例如质粒,或穿梭载体,或昆虫载体,用于编码融合蛋白的核酸的储存或操纵或用于生产融合蛋白。还可以将编码引导rna或融合蛋白的核酸克隆进表达载体,用于给予至植物细胞、动物细胞,优选是哺乳动物细胞或人类细胞,真菌细胞,细菌细胞,或原生动物细胞。
[0112]
为了获得表达,典型地将编码引导rna或融合蛋白的序列亚克隆进包含用来指导转录的启动子的表达载体。适合的细菌和真核启动子是本领域熟知的,并且例如在萨姆布鲁克(sambrook)等人,分子克隆实验指南(molecular cloning,a laboratory manual)(第3版,2001);克里格勒(kriegler),基因转移和表达:实验室手册(gene transfer and expression:a laboratory manual)(1990);和分子生物学现代方法(current protocols in molecular biology)(奥苏贝尔(ausubel)等人编辑,2010)中描述。用于表达工程蛋白的细菌表达系统是可得的,例如在大肠杆菌、芽孢杆菌、和沙门氏菌属中(帕尔瓦(palva)等人,1983,基因(gene)22:229
‑
235)。用于此类表达系统的试剂盒是可商购的。用于哺乳动物细胞、酵母、和昆虫细胞的真核生物表达系统是本领域熟知的,并且也是可商购的。
[0113]
多个适合的载体是本领域已知的,例如病毒载体,包括重组反转录病毒、慢病毒、腺病毒、腺病毒伴随病毒、和单纯疱疹病毒1、腺病毒源载体,或重组细菌或真核质粒。例如,表达构建体可以包括:编码区;启动子序列,例如限制表达至所选择的细胞类型的启动子序列,条件启动子,或强一般启动子;增强子序列;未翻译调节序列,例如5'未翻译区(utr)、3'utr;聚腺苷酸化位点;和/或隔离子序列。此类序列是本领域已知的,并且技术人员将能够选择适合的序列。参见例如分子生物学现代方法(current protocols in molecular biology)(奥苏贝尔(ausubel)f.m.等人(编辑)格林出版联合公司(greene publishing associates),(1989),9.10
‑
9.14节段和其他标准实验室手册。在一些实施例中,如本领域已知,使用组织特异性启动子,表达可以被限制至具体细胞类型。
[0114]
如以上所描述,用于表达引导rna的载体可以包括rna pol ii或pol iii启动子,以便驱动引导rna的表达。这些人类启动子允许在质粒转染后,在哺乳动物细胞中,表达grna。可替代地,可以使用t7启动子,例如用于体外转录,并且rna可以在体外转录并且纯化。用于指导核酸的表达的启动子取决于具体应用。例如,典型地,强组成型启动子用于融合蛋白的表达和纯化。相比之下,当体内给予融合蛋白用于基因调节时,可以使用组成型启动子或诱导型启动子,取决于融合蛋白的具体用途。此外,用于给予融合蛋白的优选启动子可以是弱启动子,例如hsv tk,或具有类似活性的启动子。该启动子还可以包括响应转录激活的元件,例如缺氧反应元件、gal4反应元件、乳糖抑制体反应元件、和小分子控制系统,例如四环素调节系统和ru
‑
486系统(参见例如哥森(gossen)&布雅德(bujard),1992,美国国家科学院院刊(proc.natl.acad.sci.usa),89:5547;奥利吉诺(oligino)等人,1998,基因治疗(gene ther.),5:491
‑
496;王(wang)等人,1997,基因治疗(gene ther.),4:432
‑
441;尼英(neering)等人,1996,血液(blood),88:1147
‑
55;和伦德尔(rendahl)等人,1998,自然生物技术(nat.biotechnol.),16:757
‑
761)。
[0115]
除了启动子,表达载体典型地包含转录单位或表达盒,该转录单位或表达盒包含核酸在宿主细胞(原核的或真核的)中表达所需的所有另外的元件。因此,典型的表达盒包含可操作地连接至,例如编码融合蛋白,和例如转录物的有效聚聚腺苷酸化、转录终止、核糖体结合位点、或翻译终止所需的任何信号的核酸序列的启动子。盒的另外的元件可以包括,例如增强子,和异源剪接固有信号。
[0116]
关于融合蛋白的预期用途选择用于运输遗传信息进细胞的具体表达载体,预期用途例如是在植物、动物、细菌、真菌、原生动物等中表达。标准细菌表达载体包括质粒,例如基于pbr322的质粒,pskf、pet23d、和可商购的标签融合表达系统,例如gst和lacz。优选的
标签融合蛋白是麦芽糖结合蛋白(mbp)。此类标签融合蛋白可以用于纯化工程化的tale重复蛋白。还可以添加表位标签至重组蛋白,以便提供分离的方便方法,用于监测表达,并且用于监测细胞的和亚细胞的定位,例如c
‑
myc或flag。
[0117]
包含来自真核病毒的调节元件的表达载体通常用于真核表达载体,例如sv40载体、乳头瘤病毒载体、和源自埃
‑
巴二氏病毒的载体。其他示例性真核载体包括pmsg、pav009/a 、pmto10/a 、pmamneo
‑
5、杆状病毒pdsve以及允许在以下启动子的指导下表达蛋白的任何其他载体:sv40早期启动子、sv40晚期启动子、金属硫蛋白启动子、鼠类乳腺肿瘤病毒启动子、劳斯肉瘤病毒启动子、多角体蛋白启动子,或示出对在真核细胞中的表达有效的其他启动子。
[0118]
一些表达系统具有用于选择稳定转染细胞系的标记,例如胸苷激酶、潮霉素b磷酸转移酶、和二氢叶酸还原酶。高产率表达系统也是适合的,例如在昆虫细胞中使用杆状病毒载体,具有在多角体蛋白启动子或其他强杆状病毒启动子的指导下的融合蛋白编码序列。
[0119]
典型地包括在表达载体中的元件还包括在大肠杆菌中发挥功能的复制子、编码用来允许选择容纳重组质粒的细菌的抗生素抗性的基因、和用来允许重组序列的插入的在质粒的非必需区中的独特限制酶切位点。
[0120]
使用标准转染方法来产生表达大量蛋白的细菌的、哺乳动物的、酵母的或昆虫的细胞系,然后使用标准技术纯化这些蛋白(参见例如科莱(colley)等人,1989,生物化学杂志(j.biol.chem.),264:17619
‑
22;在酶学方法中对蛋白纯化的引导(guide to protein purification,in methods in enzymology),182卷(多伊彻(deutscher),编辑,1990))。根据标准技术,进行真核细胞和原核细胞的转化(参见例如莫里森(morrison),1977,细菌学杂志(j.bacteriol.)132:349
‑
351;克拉克(clark)
‑
柯蒂斯(curtiss)&柯蒂斯(curtiss),酶学方法(methods in enzymology)101:347
‑
362(吴(wu)等人,编辑,1983))。
[0121]
用于将外源核苷酸序列引入宿主细胞的任何已知程序都是可以使用的。这些包括使用磷酸钙转染、凝聚胺(polybrene)、原生质体融合、电穿孔、核转染、脂质体、微注射、裸dna、质粒载体、病毒载体,附加型和整合型二者,和用于将克隆的基因组dna、cdna、合成dna、或其他外源基因材料引入宿主细胞的任何其他熟知方法(参见例如萨姆布鲁克(sambrook)等人,同上)。只需要使用能够成功地将至少一个基因引入能够表达选择的蛋白的宿主细胞中的具体遗传工程化程序。
[0122]
在一些实施例中,cas9或csy4蛋白包括提供蛋白易位至细胞核的核定位结构域。已知若干核定位序列(nls),并且可以使用任何适合的nls。例如,很多nls具有多个碱性氨基酸,称为双向碱性重复(在加西亚(garcia)
‑
比斯托(bustos)等人,1991,生物化学与生物物理学学报(biochim.biophys.acta),1071:83
‑
101中综述)。包含双向碱性重复的nls可以位于嵌合蛋白的任何部分中,并且导致嵌合蛋白定位在细胞核内。在优选实施例中,核定位结构域被整合进最终融合蛋白,因为在此描述的融合蛋白的最后功能将典型地需要将蛋白定位在细胞核中。然而,在其中蛋白具有固有的核易位功能的情况下,可能不需要添加分开的核定位结构域。
[0123]
本发明包括载体和包含载体的细胞。
[0124]
文库
[0125]
还在此提供的是grna的组合文库,例如在用于研究应用的可诱导的、组织或细胞
型特异性多重载体中,这些应用例如是用于筛选潜在药物靶标或用来限定在基因水平的相互作用。
[0126]
使用方法
[0127]
描述的方法可以包括在细胞中表达,或使细胞与如在此描述的多聚盒接触,加上可以由缩短的grna引导的核酸酶,例如,如以上描述的cas9核酸酶,和如以上描述的csy4核酸酶。
[0128]
对于同时修饰多个外源基因的表达,或对于靶向单个基因的多个部分,描述的系统是有用且通用的工具。为实现这一点,当前方法需要使用针对待靶向的每一位点的分开的grna编码转录物。对于细胞群的多重基因组编辑而言,分开的grna并不是最佳的,因为不可能保证每个细胞将表达每个grna;使用多个转录物,细胞得到grna的复杂并且不均匀的随机混合物。然而,本系统允许来自单个转录物的多个grna表达,这允许通过表达多个grna,在基因组中靶向多个位点。此外,使用单个转录物系统,每个细胞应表达具有类似化学计量的所有grna。因此,这一系统可以容易地用于同时改变大量基因的表达,或用于募集多个cas9或hfd至单个基因、启动子、或增强子。这一能力具有广泛应用,例如用于基础生物学研究,其中它可以用于研究基因功能,并且操纵多个基因在单个通路中的表达,并且用于合成生物学,其中它将使得研究人员能够在细胞中产生响应于多个输入信号的回路。这一技术可以被实施并且适合于多重复用是相对容易的,这将使其成为具有很多广泛应用的广泛有用的技术。
[0129]
在此描述的方法包括使细胞与编码在此针对一个或多个基因描述的多聚grna盒的核酸、以及编码csy4和cas9的核酸接触,由此调整该一个或多个基因的表达。
[0130]
实例
[0131]
本发明在以下实例中进一步说明,这些实例不得限制权利要求书中所描述的本发明的范围。
[0132]
实例1.使用crispr/cas9进行多重编辑
[0133]
使用从单个转录物表达的crrna或sgrna的阵列的crispr/cas9,带着进行多重编辑的目标,尝试三种策略:
[0134]
1.同向重复侧翼的crrna阵列和cas9,具有分开的tracrrna
[0135]
2.通过csy4位点分开的短crrna阵列,与csy4、cas9、和分开的tracrrna一起表达
[0136]
3.通过csy4位点分开的全长单个引导rna(sgrna)
[0137]
针对有效破坏u2os
‑
egfp破坏阵列中的egfp的能力,测试每组构建体(图1中例示的)。结果示出于表2中。在egfp破坏阵列中,甚至是对于单个靶标,使用策略1和2设计的构建体显示最低活性;因此进一步实验(以下描述)集中在优化策略3上。
[0138]
实例2.在哺乳动物细胞中,高活性crispr引导rna自rna聚合酶ii和iii启动子的多重表达
[0139]
在图3中示出,使用csy4核酸酶,用于从较长转录物切下grna的示例性策略的示意性概览。在用来证明概念验证的初始试验中,针对在人类细胞中的切割,测试csy4切割的rna发夹位点的两个版本。为了实现这一点,表达侧翼是两个csy4切割位点之一的grna:
[0140]
1.gttcactgccgtataggcagctaagaaa(全28nt)(seq id no:2)
[0141]
2.gttcactgccgtataggcag(截短的20nt)(seq id no:1)
[0142]
结果示出,在哺乳动物细胞中,与侧翼是较长的28nt序列的那些相比,在其5’和3’端侧翼有截短的20nt序列的grna更具活性(图4)。据本发明的诸位发明人所知,这是在活人类细胞中,csy4核酸酶可以用于加工rna转录物的第一个证明。20nt截短位点的一个重要的另外的优点是,不像较长的28nt序列,它并不在从较长转录物加工的grna的5’端上留下任何另外的核苷酸(图4)。这使得能够表达在最5’位置具有任何希望的核苷酸的grna。相对于从具有在最5’位置对于特定的一个或多个核苷酸的需要的rna聚合酶iii启动子表达grna,这是一个改进。
[0143]
使用这一基于csy4的系统,证明了两个和三个不同grna的有效表达(图5和6)。使用这一方法同时表达grna诱导在人类细胞中,在预期位点处的改变。
[0144]
这些结果还证明,这一基于csy4的策略可以与在通过rna pol ii启动子生产的较长mrna上编码的grna一起使用(图7)。在这些实验中,在通过cag启动子(一种rna pol ii启动子)生产的mrna上编码侧翼是截短csy4位点的三种不同的单个grna之一。如在图7中所示,在人类细胞中,所有这三种构建体都能够产生可以指导cas9核酸酶的功能grna,但是这只是在csy4存在时才如此。观察到的目标cas9活性的水平与当使用标准rna pol iii启动子单独表达这些grna时,或作为来自rna pol iii启动子的csy4侧翼转录物时观察到的结果可比较(尽管在某种程度上更低)(图7)。
[0145]
总之,本发明的结果证明:1)当通过csy4切割位点分开时并且在人类细胞中存在csy4下,可以从单个rna pol iii转录物产生高达三种功能grna,2)多种csy4加工的grna可以用于指导cas9核酸酶以诱导在单个人类细胞中的多重变化,以及3)可以通过csy4核酸酶,从由rna聚合酶ii启动子制成的较长mrna转录物切除侧翼是csy4切割位点的功能grna。
[0146]
其他实施方案
[0147]
应理解,虽然已经结合其详细描述,对本发明进行了描述,但前面的描述旨在说明而非限制本发明的范围,本发明的范围由所附的权利要求书的范围限定。其他方面、优点以及修改都在以下权利要求书的范围之内。
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。