一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

使用基因组编辑产生显性等位基因的方法和组合物与流程

2022-02-22 07:43:47 来源:中国专利 TAG:

使用基因组编辑产生显性等位基因的方法和组合物
1.相关申请的交叉引用
2.本技术要求2019年5月29日提交的美国临时申请号62/854,142;2019年8月14日提交的美国临时申请号62/886,726;和2019年8月14日提交的美国临时申请号62/886,732的权益,所有这些临时申请都以引用的方式整体并入本文。
发明领域
3.本公开涉及经由靶向编辑基因组产生显性等位基因的方法和组合物。
4.序列表的并入
5.包含在名为“p34497wo00_sl.txt”的文件中的序列表为172,842字节(在ms-中测量)并于2020年5月28日创建,随此以电子方式提交并以引用的方式整体并入。


背景技术:

6.显性等位基因是掩蔽同一基因座处第二等位基因的贡献的等位基因。显性等位基因可以是显性负等位基因或显性正等位基因。显性负等位基因或反效等位基因是与正常等位基因功能相反作用的等位基因。例如,显性负等位基因通常消除处于杂合或纯合状态的等位基因的正常功能。显性正等位基因可以增加正常基因功能(例如,超效等位基因)和/或为基因提供拓宽的或新的功能(例如,新效等位基因)。
7.已经使用自然发生的和随机的诱变技术(例如,磺酸乙基甲基酯和t-dna插入)以在多种细胞类型中产生突变。然而,显性突变以低频率发生并且难以在给定的目标基因中获得。因此,选择性编辑基因组以产生显性负等位基因或显性正等位基因的方法和组合物将是有益的。


技术实现要素:

8.在一个方面,本公开提供一种在细胞中产生基因的显性负等位基因的方法,其包括使用靶向编辑技术使所述基因的一部分倒位,产生能够触发未修饰的等位基因的阻抑的反义rna转录物。
9.在一个方面,本公开提供一种在细胞中产生基因的显性负等位基因的方法,其包括使用靶向编辑技术缺失染色体在第一基因区域与第二基因区域之间的部分,其中在所述染色体的所述部分缺失之后产生所述第一基因区域的反义rna转录物。
10.在一个方面,本公开提供一种在一种或多种细胞中产生基因的显性负等位基因的方法,其包括:(a)诱导侧接所述基因的被靶向区域的第一双链断裂和第二双链断裂;(b)鉴定包含所述基因的所述被靶向区域的倒位的一种或多种细胞,其中所述倒位导致由所述被靶向区域产生反义rna转录物;和(c)选择包含所述基因的所述被靶向区域的所述倒位的一种或多种细胞。
11.在一个方面,本公开提供一种降低细胞中蛋白质的表达的方法,其包括:(a)诱导
侧接染色体的被靶向区域的第一双链断裂和第二双链断裂;和(b)鉴定在所述染色体的被靶向区域中包含倒位的一种或多种细胞,其中与在所述被靶向区域中不包含所述倒位的对照细胞相比,所述蛋白质的表达降低。
12.在一个方面,本公开提供一种方法,其包括:(a)鉴定包含第一基因区域和第二基因区域的染色体区域,所述第一基因区域包含第一启动子和第一编码区域,所述第二基因区域包含第二启动子和第二编码区域,其中所述第一编码区域和所述第二编码区域由间插区域分开,并且其中所述第一启动子和所述第二启动子以相反取向定位;(b)诱导侧接被靶向区域的第一双链断裂和第二双链断裂;(c)鉴定包含所述染色体的被靶向区域的缺失的一种或多种细胞;和(d)选择包含所述染色体的被靶向区域的所述缺失的一种或多种细胞。
13.在一个方面,本公开提供一种降低至少一种细胞中基因的表达的方法,其包括:(a)使用靶向编辑技术在所述基因的靶位点处诱导双链断裂;(b)在所述双链断裂处插入供体序列,其中所述供体序列包含组织特异性或组织优选的启动子,并且其中所述供体序列插入所述靶位点中,使得所述组织特异性或组织优选的启动子与所述基因相比处于反向取向;和(b)鉴定包含所述供体序列以反向取向的插入的至少一种细胞,其中与不包含所述供体序列的插入的对照细胞相比,所述基因的表达降低。
14.在一个方面,本公开提供一种修饰基因表达的方法,其包括:(a)使用靶向编辑技术在靶位点处诱导双链断裂;(b)在所述双链断裂处插入供体序列,其中所述供体序列包含能够诱导所述基因的增加或异位表达的内源(例如,启动子、增强子或启动子/增强子片段)或设计的元件;和(c)鉴定包含所述供体序列的至少一种细胞,其中与不包含所述供体序列的对照细胞相比,靶基因的表达在至少一种组织中增加。
15.在一个方面,本公开提供一种增强基因表达的方法,其包括:(a)使用靶向编辑技术在靶位点处诱导双链断裂;(b)在所述双链断裂处插入供体序列,其中所述供体序列包含能够诱导所述基因的增加或异位表达的内源(例如,启动子、增强子或启动子/增强子片段)或设计的元件;和(c)鉴定包含所述供体序列的至少一种细胞,其中与不包含所述供体序列的对照细胞相比,靶基因的表达在至少一种组织中增加。
16.在一个方面,本公开提供一种产生显性正等位基因的方法,其包括:(a)使用靶向编辑技术在靶位点处诱导双链断裂;(b)在所述双链断裂处插入供体序列,其中所述供体序列包含内源基因的序列;和(c)鉴定包含所述供体序列的至少一种细胞,其中与不包含所述供体序列的对照细胞相比,所述基因的表达在至少一种组织中增加。
17.在一个方面,本公开提供一种降低细胞中基因的表达的方法,其包括:(a)鉴定包含第一基因区域和第二基因区域的染色体区域,所述第一基因区域包含第一启动子和第一编码区域,所述第二基因区域包含第二启动子和第二编码区域,其中所述第一编码区域和所述第二编码区域由间插区域分开,并且其中所述第一启动子和所述第二启动子以相反取向定位;(b)使用靶向编辑技术诱导侧接被靶向区域的第一双链断裂和第二双链断裂,其中所述被靶向区域包含所述第二编码区域和所述间插区域;和(c)鉴定包含所述被靶向区域的缺失的一种或多种细胞,其中所述第二启动子产生所述第一编码区域的至少一种反义rna,并且其中与不包含所述被靶向区域的缺失的对照细胞相比,所述第一编码区域的表达降低。
18.在一个方面,本公开提供一种降低细胞中目标蛋白质的表达的方法,其包括:(a)
鉴定包含编码所述目标蛋白质的基因区域的染色体区域和第二染色体区域,所述基因区域包含第一启动子和所述蛋白质的编码区域,所述第二染色体区域包含第二启动子和间插区域,其中所述目标蛋白质的编码区域和所述第二启动子由所述间插区域分开,并且其中所述第一启动子和所述第二启动子以相反取向定位;(b)使用靶向编辑技术诱导侧接所述间插区域的第一双链断裂和第二双链断裂;和(c)鉴定包含所述间插区域的缺失的一种或多种细胞,并且其中与不包含所述间插区域的缺失的对照细胞相比,所述目标蛋白质的表达降低。
19.在一个方面,本公开提供一种在基因的被靶向区域中产生倒位的方法,其包括:(a)向一种或多种细胞提供至少一种rna引导核酸酶或编码至少一种rna引导核酸酶的一种或多种载体,其中所述至少一种rna引导核酸酶能够结合到侧接所述基因的被靶向区域的第一靶位点和第二靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述第一靶位点和所述第二靶位点是连接的,其中所述至少一种rna引导核酸酶在所述基因中在所述第一靶位点和所述第二靶位点处产生双链断裂;(b)鉴定在所述基因的被靶向区域中包含倒位的一种或多种细胞,其中所述倒位导致由所述被靶向区域产生反义rna转录物;和(c)选择在所述基因的被靶向区域中包含所述倒位的一种或多种细胞。
20.一种方法,其包括:(a)鉴定包含第一基因区域和第二基因区域的染色体区域,所述第一基因区域包含第一启动子和第一编码区域,所述第二基因区域包含第二启动子和第二编码区域,其中所述第一编码区域和所述第二编码区域由间插区域分开,并且其中所述第一启动子和所述第二启动子以相反取向定位;(b)向一种或多种细胞提供至少一种rna引导核酸酶或编码至少一种rna引导核酸酶的一种或多种载体,其中所述至少一种rna引导核酸酶能够结合到侧接染色体的被靶向区域的第一靶位点和第二靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述被靶向区域包含所述第二编码区域和所述间插区域,其中所述rna引导核酸酶在所述染色体中在所述第一靶位点和所述第二靶位点处产生双链断裂;(c)鉴定包含所述被靶向区域的缺失的一种或多种细胞;和(d)选择包含所述被靶向区域的缺失的一种或多种细胞。
21.在一个方面,本公开提供一种方法,其包括:(a)向一种或多种细胞提供至少一种rna引导核酸酶和至少一种供体分子,或编码至少一种rna引导核酸酶和至少一种供体分子的一种或多种载体,其中所述至少一种rna引导核酸酶能够结合到至少一种基因的靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述供体分子包含设计的元件,其中所述rna引导核酸酶在所述靶位点处产生双链断裂,并且其中所述设计的元件在所述双链断裂处插入;(b)鉴定在所述靶位点处包含所述设计的元件的插入的一种或多种细胞;和(c)选择在所述靶位点处包含所述设计的元件的插入的一种或多种细胞。
22.在一个方面,本公开提供一种方法,其包括:(a)向一种或多种细胞提供至少一种rna引导核酸酶和至少一种供体分子,或编码至少一种rna引导核酸酶和至少一种供体分子的一种或多种载体,其中所述至少一种rna引导核酸酶能够结合到至少一种基因的靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至
少26个连续核苷酸,其中所述供体分子包含编码组织特异性或组织优选的启动子的序列,其中所述rna引导核酸酶在所述靶位点处产生双链断裂,并且其中所述编码所述组织特异性或组织优选的启动子的序列在所述双链断裂处插入;(b)鉴定一种或多种细胞,所述细胞在所述靶位点处包含所述编码所述组织特异性或组织优选的启动子的序列的插入使得所述编码所述组织特异性或组织优选的启动子的序列与所述基因相比处于反向取向;和(c)选择在所述靶位点处包含所述编码所述组织特异性或组织优选的启动子的序列的插入的一种或多种细胞。
23.在一个方面,本公开提供一种方法,其包括:(a)向一种或多种细胞提供一种或多种rna引导核酸酶或编码一种或多种rna核酸酶的一种或多种载体,其中所述一种或多种rna引导核酸酶能够结合到靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述一种或多种rna引导核酸酶在所述靶位点处产生双链断裂;(b)鉴定在所述靶位点处包含插入或缺失的至少一种细胞,其中在所述靶位点处的所述插入或缺失导致所述至少一种基因的显性负等位基因的产生;和(c)选择包含所述至少一种基因的显性负等位基因的一种或多种细胞。
24.在一个方面,本公开提供一种方法,其包括:(a)向一种或多种细胞提供一种或多种rna引导核酸酶或编码一种或多种rna核酸酶的一种或多种载体,其中所述一种或多种rna引导核酸酶能够结合到靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述一种或多种rna引导核酸酶在所述靶位点处产生双链断裂;(b)鉴定在所述靶位点处包含插入或缺失的至少一种细胞,其中在所述靶位点处的所述插入或缺失导致所述至少一种基因的显性正等位基因的产生;和(c)选择包含所述至少一种基因的显性正等位基因的一种或多种细胞。
25.在一个方面,本公开提供一种方法,其包括:(a)使用靶向编辑技术在细胞中在基因的第一等位基因中产生第一双链断裂(dsb)和第二dsb;(b)使用靶向编辑技术在所述细胞中在所述基因的第二等位基因中产生第三dsb;和(c)鉴定在所述第二等位基因中在所述第三dsb位点处包含以倒位取向的所述第一等位基因的区域的插入的细胞,由此产生修饰的第二等位基因。
26.在一个方面,本公开提供一种产生基因的显性负等位基因的方法,其包括使用靶向编辑技术将至少一个非编码rna靶位点引入所述基因中。
27.在一个方面,本公开提供一种产生基因的显性等位基因的方法,其包括使用靶向编辑技术在所述基因中引入无义突变以在所述突变下游产生具有改变的氨基酸组成的一种或多种截短的蛋白质。这种技术还可以与第二靶向编辑突变配对以恢复初始突变下游的正常氨基酸序列的框架,从而在多肽内部产生无义区域。
28.在一个方面,本公开提供一种方法,其包括:(a)向细胞提供工程化三角状五肽重复(ppr)蛋白或可操作地连接到启动子的编码所述工程化ppr蛋白的载体,其中所述工程化ppr蛋白能够结合到靶基因的rna转录物;(b)选择来自步骤(a)的表达所述工程化ppr蛋白的一种或多种细胞;和(c)鉴定在步骤(b)中选择的包含所述靶基因的改变的表达的一种或多种细胞。
29.在一个方面,本公开提供一种在细胞中产生基因的显性负等位基因的方法,其包括使用靶向编辑技术邻近所述基因的天然拷贝插入所述基因或其一部分的倒位拷贝,以产
生能够产生所述基因或其一部分的反义rna转录物的倒位重复序列。
30.在一个方面,本公开提供一种在细胞中产生基因的显性负或显性正等位基因的方法,其包括使用靶向编辑技术缺失基因的一部分,其中在缺失所述基因的所述部分之后产生微蛋白。
31.在一个方面,本公开提供一种在细胞中产生基因的显性负或显性正等位基因的方法,其包括使用靶向编辑技术缺失基因间区域的一部分,使得所述缺失致使所述基因在上游启动子的控制之下。在一些实施方案中,所述上游启动子驱动所述基因的表达增加。在一些实施方案中,上游启动子驱动基因的表达降低。在一些实施方案中,上游启动子驱动基因的时间表达改变。在一些实施方案中,上游启动子驱动基因的组织特异性表达改变。
32.在一个方面,本公开提供一种在至少一种细胞中产生至少一种基因的显性负等位基因的方法,其包括:(a)向所述至少一种细胞引入基因组编辑系统,所述基因组编辑系统包含:(i)位点特异性核酸酶或编码位点特异性核酸酶的分子,(ii)单引导rna(sgrna)或编码sgrna的分子,和(iii)至少第一系链引导寡核苷酸(tgoligo)和第二tgoligo或编码第一tgoligo和第二tgoligo的一种或多种分子,其可操作地连接到至少一个启动子;(b)在所述至少一种基因中产生第一双链断裂(dsb)和第二dsb,其中所述第一tgoligo和所述第二tgoligo与所述第一dsb和所述第二dsb处相反链的3’自由端杂交,其中所述至少一种基因的至少1个、至少2个、至少3个、至少4个、至少5个、至少10个、至少25个、至少50个、至少100个、至少250个、至少500个、至少750个、至少1000个、至少2500个或至少5000个核苷酸缺失,由此产生所述基因的编码截短的蛋白质的显性负等位基因;和(c)鉴定和选择包含所述截短的蛋白质的至少一种细胞。
33.在一个方面,本公开提供一种在至少一种细胞中产生至少一种基因的显性负等位基因的方法,其包括:(a)向所述至少一种细胞中引入一种或多种载体,所述载体编码:(i)至少一种位点特异性核酸酶,(ii)至少一种单引导rna(sgrna),和(iii)至少第一系链引导寡核苷酸(tgoligo)和第二tgoligo,其可操作地连接到至少一个启动子;(b)在所述基因中产生第一双链断裂(dsb)和第二dsb,其中所述第一tgoligo和所述第二tgoligo与所述第一dsb和所述第二dsb处相反链的3’自由端杂交,其中所述至少一种基因在所述第一dsb和所述第二dsb之间的区域在取向上是倒位的,由此产生所述至少一种基因的编码所述基因的反义rna转录物的显性负等位基因;和(c)鉴定和选择包含所述至少一种基因的所述反义rna转录物的至少一种细胞。
34.在一个方面,本公开提供一种修饰的植物细胞,其在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。
35.在一个方面,本公开提供一种修饰的染色体,其在基因的内源基因座处包含所述基因或其一部分的非转座子介导的缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。
36.在一个方面,本公开提供一种修饰的植物或其部分,其在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。
37.在一个方面,本公开提供一种修饰的细胞,其包含(a)在至少一种基因的内源基因
座处所述至少一种基因或其一部分的非转座子介导的基因组缺失,或(b)非转座子介导的和非t-dna介导的多核苷酸序列到所述至少一种基因中的插入,其中所述缺失或插入产生所述至少一种基因的显性正等位基因。
38.在一个方面,本公开提供一种修饰的细胞,其在至少一种基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因的天然转录物序列互补的序列的rna转录物。
39.在一个方面,本公开提供一种修饰的细胞,其包含至少一种基因或其一部分的靶向编辑,其中所述靶向编辑产生与所述基因的天然转录物序列互补的rna转录物。
40.在一个方面,本公开提供一种修饰的细胞,其包含通过靶向编辑技术产生的至少一种基因的至少一种显性负等位基因,其中所述等位基因产生当转录所述至少一种显性负等位基因时能够形成发夹环二级结构的rna转录物。
41.在一个方面,本公开提供一种修饰的细胞,其包含基因的非转基因显性负等位基因,所述显性负等位基因在所述基因的内源基因座中包含异源非编码rna靶位点。
42.在一个方面,本公开提供一种修饰的细胞,其包含基因的非转基因显性正等位基因,所述显性正等位基因在所述基因的内源基因座中包含异源非编码rna靶位点。
43.在一个方面,本公开提供一种修饰的细胞,其包含通过靶向编辑技术产生的在至少一种基因的内源基因座处的至少一个插入或缺失,其中所述插入或缺失导致截短的蛋白质的表达。
44.在一个方面,本公开提供一种修饰的细胞,其包含至少一种基因的显性负等位基因,所述显性负等位基因在所述基因的内源基因座处邻近所述基因的天然拷贝包含所述基因的倒位拷贝。
附图说明
45.图1包括分图a和分图b。分图a显示偶联至两种rna引导核酸酶的两种srna可以与相同或不同链上的靶dna杂交,以通过产生两个双链断裂(dsb)分离dna区域与一个或多个dna链的其余部分。分图b显示在两种rna引导核酸酶在dna中产生两个dsb后可能有的不同结果。天然细胞机器可以通过缺失dsb之间的整个区域、通过缺失从5’端或3'端的区域的一小部分或通过使在dsb之间的区域倒位来修复两个dsb。
46.图2包括分图a和分图b。分图a显示ga20氧化酶_5基因附近的玉米基因组区域的表示。如分图a中显示,甲基转移酶/samt基因邻近ga20氧化酶_5基因,但取向相反。在samt启动子和ga20氧化酶_5编码基因之间的间插区域在每个端产生双链断裂后缺失。分图b显示在间插区域缺失后区域的结构。通过去除间插区域,samt启动子可以驱动反义ga20氧化酶_5rna转录物的表达,所述反义ga20氧化酶_5rna转录物可以与由天然ga20氧化酶_5启动子产生的有义ga20氧化酶_5rna转录物形成双链rna。
47.图3包括分图a、分图b、分图c和分图d。分图a显示拟南芥(arabidopsis thaliana)植物的gus染色,其证明天然3启动子仅在根组织中表达gus。分图b显示天然3启动子和gus转基因周围的基因组结构。分图c显示在天然3tata盒上游插入天然基因组表达元件如增强子元件或设计的表达元件后扩大的gus染色。分图d显示在靶向插入天然增强子或设计的元件后天然3启动子周围的基因组结构。
48.图4包括分图a、分图b、分图c和分图d。分图a显示目标基因的结构,并且表明双链断裂可以紧邻目标基因的3'-utr中的聚腺苷酸化位点的上游产生。分图b显示在双链断裂位点处插入反义启动子。所述启动子可以是基因的天然启动子或任何目标启动子。分图c显示围绕目标基因的天然启动子任选产生两个双链断裂,导致所述启动子缺失(分图d)。
49.图5包括分图a、分图b、分图c和分图d。分图a显示在天然3启动子的控制之下包含gus转基因的拟南芥植物的gus染色。gus在整个植物中表达。分图b显示在天然3启动子和gus转基因周围的基因组区域。分图c显示当在gus转基因的下游插入叶特异性启动子使得其转录反义gus rna时gus染色降低。分图d显示在插入反义叶特异性启动子后在天然3启动子和gus转基因周围的基因组区域。
50.图6显示蛋白质截短的潜在结果。上面的流程显示正常的蛋白质相互作用,其使所有编码的组分以正确的构象集合以允许蛋白质复合物发挥功能。中间的流程显示蛋白质组分之一截短,其去除了蛋白质的功能单元,但保留了仍可以结合相互作用蛋白质并阻断来自截短的蛋白质的完整的完全功能型式的相互作用位点的相互作用结构域。在中间的情况下,这将充当显性负等位基因。下面的流程显示编码用于活性的调控元件的蛋白质的部分的策略性缺失,并保持功能结构域和相互作用结构域完整,从而导致蛋白质复合物处于组成型活性状态或活性阻抑状态。
51.图7包括分图a、分图b、分图c、分图d和分图e。分图a显示杂合基因组基因座。分图b显示核酸酶(由剪刀表示)在第一等位基因中产生一个dsb。分图c显示核酸酶在第二等位基因中产生两个dsb。在一个可能的结果(分图d)中,在第二等位基因上的两个dsb之间的区域(分图c)被倒位并插入第一等位基因中的单个dsb中。分图e显示转录分图d中的等位基因结构产生的发夹rna转录物。
52.图8提供在目标基因中非编码rna靶位点插入的示意图。这种插入可以导致产生瞬时二级sirna,以下调目标基因(goi)。
53.图9提供cas9介导的双链断裂(dsb)和结合到靶dna位点的系链引导寡核苷酸(tgoligo)的示意图。cas9-pam相互作用发生在非靶链上;sgrna-dna退火发生在靶链上。cas9切割位点处的平端由cas9在非靶链的5'端(pam位置)和靶链的两个切割端(3'和5')保持就位。非靶链的3'切割端是自由的,并且向周围

翻起’。非靶链的3’自由

瓣'端可以是多达35个核苷酸,这可以足以用于特异性互补性结合。可以包括tgoligo(例如,ssdna模板)用于整合所期望的核苷酸修饰。在随后的图中遵循这里使用的绘图方案。
54.图10描绘cas9与同二聚体结构域(顶部)和异二聚体结构域(中间和右下)缀合以促进二聚化。显示同二聚体和异二聚体结构域的配体(左下)。在随后的图中遵循这里使用的绘图方案;例如,配体、同二聚体或异二聚体结构域、ssdna结合结构域。cas9/sgrna复合物的每个组分和靶dna如图9中所示显示。在随后的图中遵循这里对于不同二聚化结构域使用的绘图方案。
55.图11描绘使用催化失活的cas9(dcas9)来增加基因组编辑效率。分图1示出dcas9在由grna指定的靶位点结合到dna,并产生可用于基于模板的编辑的环结构。分图2示出经由与ssdna结合结构域缀合的dcas9进一步促进基于模板的编辑的修改的方案。与分图1中的编辑效率相比,预期用这种修改的方案的编辑效率更高,因为ssdna模板结合到dcas9复合物,并且将被带到grna靶的附近。
56.图12提供含有cas9、grna和tgoligo的示例性构建体。rz代表核酶,即裂解在rna中的15bp识别位点(rz位点)的酶。
57.图13提供用于改善基因组编辑效率的各种方法的图示。使用二聚化结构域(参见图10)、tgoligo(参见图9)或两者的组合可以增强侧接有两个grna靶位点的基因组区域的完全敲除(缺失)的恢复。分图1显示二聚化增强的敲除(ko)事件。分图2显示tgoligo增强的ko事件。分图3显示经由二聚化和tgoligo的组合增强的ko事件。分图4显示tgoligo增强的倒位事件。分图5显示二聚化增强的倒位事件。分图6显示由cas9二聚化/失活和tgoligo的组合辅助的倒位事件。仅显示两种grna识别靶dsdna的不同链的构型。相同的概念同样适用于其中两种grna识别靶dsdna的相同链的其他构型。
58.图14提供编辑玉米br2基因以经由基因组倒位产生显性敲除等位基因的图示。使用两种示例性grna。第一grna(左侧显示)靶向br2的第一外显子的末端;第二grna(右侧显示)识别相邻grmzm2g491632基因的起始密码子区域。侧接有这两种grna的基因组区段的倒位可以导致br2反义部分转录物(参见转录物1)。这种br2反义转录物是经由grmzm2g491632启动子活性产生的。调整这两种grna的相对位置可以在天然br2启动子的控制之下实现br2反义完整转录物(例如,移动左侧的第一grna以靶向br2基因的起始密码子区域)或br2反义转录物(例如,移动右侧的第二grna以靶向br2基因的终止密码子区域)。
59.图15提供在单个位置(分图1和分图2)或多个位置(分图3)二聚化增强的基于模板的编辑或定点整合(sdi),和二聚化/tgoligo增强的基于模板的编辑或sdi(分图4)的图示。
60.图16提供模板编辑(分图1)、定点整合(分图2)和/或与tgoligo重组(分图3)的图示。
61.图17提供将倒位的y1基因头尾堆叠以产生反义转录物从而沉默基因表达的图示。这种方法可以产生用于正常隐性性状的显性突变y1等位基因。这种显性等位基因仍然由天然y1启动子控制。
62.图18提供微蛋白的图示。微蛋白的靶通常是作为活性同二聚体结合到dna的转录调控子。微蛋白通过形成不能结合到dna的非功能性异二聚体复合物干扰其靶。dbd,dna结合结构域;ppi,蛋白质-蛋白质相互作用结构域。
63.图19包括分图a和分图b。分图a显示mir1基因附近玉米基因组区域的表示。如分图a中显示,grmzm2g150302基因邻近ga20氧化酶_5基因并在其上游。在grmzm2g150302启动子和mir1编码基因之间的间插区域在每个端产生双链断裂后缺失。分图b显示在间插区域缺失后区域的结构。通过去除间插区域,grmzm2g150302启动子可以驱动mir1基因的表达。
64.图20提供通过经由基因组编辑缺失在zm.ga20ox5和其以相反方向取向的邻近基因zm.samt之间的基因组区域产生靶向zm.ga20ox5基因和zm.ga20ox3基因的反义rna分子的说明性实例。
65.图21示出在用于在zm.ga20ox5基因和其邻近zm.samt基因之间产生基因组缺失的三种示例性载体中各种引导rna靶位点的基因组位置。
66.图22描绘野生型植物和纯合编辑的植物的以英寸计的平均高度(y轴)。
67.图23描绘野生型植物和纯合或杂合编辑的植物的以英寸计的平均高度(y轴)。
68.图24描绘编辑的植物和对照植物中ga12和ga9的以pmol/g计的浓度(y轴)。
69.图25描绘编辑的植物和对照植物中ga20和ga53的以pmol/g计的浓度(y轴)。
70.图26描绘编辑的植物和对照植物中活性赤霉酸ga1、ga3和ga4的以pmol/g计的浓度(y轴)。
71.图27提供用于产生zm.ga20ox3基因座的基因组修饰以编码具有倒位序列的rna转录物的说明性实例,所述倒位序列可以与所述rna转录物的对应序列杂交以产生茎环结构,从而引起内源zm.ga20ox3基因座和zm.ga20ox5基因座处一种或两种拷贝或等位基因的阻抑。
72.图28描绘野生型玉米植物和杂合编辑的玉米植物的平均高度。
73.图29描绘每百万个读段中21聚体小rna的数目(y轴),所述小rna定位到编辑的茎环的茎中包含来自ga20ox5的倒位序列和编辑的ga20ox3基因的对应序列的区域,所述区域在来自含有编辑的ga20ox3等位基因的植物的样品中检测到。
74.图30描绘编辑的玉米植物和对照玉米植物中ga12和ga9的以pmole/g计的浓度(y轴)。
75.图31描绘编辑的玉米植物和对照玉米植物中ga20和ga53的以pmole/g计的浓度(y轴)。
76.图32描绘编辑的玉米植物和对照玉米植物中ga1和ga3以及ga4的以pmole/g计的浓度(y轴)。
具体实施方式
77.除非另外定义,否则本文所使用的技术和科学术语都具有如本领域的普通技术人员通常所理解的含义相同的含义。本领域的技术人员将认识到许多方法可以用于本公开的实践。实际上,本公开绝不限于所描述的方法和材料。出于本公开的目的,以下术语定义如下。
78.本说明书提供用于在包括植物、动物、真菌和原生动物的广泛范围的生物体中使用靶向编辑技术产生显性等位基因的方法和组合物。显性等位基因是掩蔽同一基因座处第二等位基因的贡献的等位基因。显性等位基因可以是“显性负等位基因”或“显性正等位基因”。显性负等位基因或反效等位基因是与正常等位基因功能相反作用的等位基因。显性负等位基因通常不能正常发挥功能,并且直接抑制野生型蛋白的活性(例如,通过二聚化)或抑制野生型蛋白正常功能需要的第二蛋白(例如,通路的激活剂或下游组分)的活性。例如,显性负等位基因消除或降低处于杂合或纯合状态的等位基因的正常功能。显性正等位基因可以增加或扩大正常基因功能(例如,超效等位基因)或为基因提供新的功能(例如,新效等位基因)。当等位基因杂合的个体中连锁表型的外显率小于在等位基因纯合的个体中观察到的外显率时,出现半显性等位基因。
79.除非另外指明,否则本公开的实施采用在本领域技术范围内的生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和生物技术的常规技术。参见green和sambrook,molecular cloning:a laborator y manual,第4版(2012);current protocols in molecular biology(f.m.ausubel等编,(1987));the series methods in enzymology(academic press,inc.):pcr 2:a practical approach(m.j.macpherson,b.d.hames和g.r.taylor编(1995));harlow和lane编(1988)antibodies,a laboratory manual;animal cell culture(r.i.freshney编,(1987));recombinant p rotein purification:
principles and methods,18-1142-75,ge healthcare life sciences;c.n.stewart,a.touraev,v.citovsky,t.tzfira编(2011)pla nt transformation technologies(wiley-blackwell);以及r.h.smith(2013)plant tissue culture.techniques and experiments(academic press,inc.)。
80.本文引用的任何参考文献,包括例如所有专利、公开的专利申请和非专利出版物,均以引用的方式整体并入。
81.如本文所用,除非上下文另外清楚地指出,否则单数形式“一个”、“一种”和“所述”包括复数个/种指代物。例如,术语“一种化合物”或“至少一种化合物”可以包括多种化合物,包括其混合物。
82.当在两个或更多个项目的列表中使用时,术语“和/或”是指所列项目中的任一个可以单独采用或与所列项目中的任一个或多个组合采用。例如,表述“a和/或b”意图指a和b中的任一者或两者,即,单独的a、单独的b或组合的a和b。表述“a、b和/或c”意图指单独的a、单独的b、单独的c、组合的a和b、组合的a和c、组合的b和c或组合的a、b和c。
83.本文提供的核酸分子包括脱氧核糖核酸(dna)和核糖核酸(rna)及其功能类似物,诸如互补dna(cdna)。本文提供的核酸分子可以是单链的或双链的。核酸分子包含核苷酸碱基腺嘌呤(a)、鸟嘌呤(g)、胸腺嘧啶(t)、胞嘧啶(c)。尿嘧啶(u)替换rna分子中的胸腺嘧啶。符号“n”可以用于表示任何核苷酸碱基(例如,a、g、c、t或u)。如本文所用,“编码”是指多核苷酸编码多肽的氨基酸。一系列三个核苷酸碱基编码一个氨基酸。如本文所用,“表达的(expressed)”、“表达(expression)”或“表达(expressing)”是指rna从dna分子的转录。如本文所用,术语“多肽”、“肽”和“蛋白质”可互换地用以指氨基酸残基的聚合物。所述术语还适用于其中一种或多种氨基酸是对应天然存在氨基酸的化学类似物或修饰衍生物的氨基酸聚合物。“信使rna”或“mrna”是指从多核苷酸转录的rna转录物,其中所述rna转录物能够被翻译成蛋白质。通常,dna编码mrna,mrna编码蛋白质。当dna被rna聚合酶转录以最终产生蛋白质时,有义mrna链通常通过rna聚合酶由反义dna链产生。dna或rna的有义链从5'到3',而反义链从3'到5'。同一多核苷酸的有义链和反义链彼此互补。
84.在一个方面,本文提供的核酸分子包含针对真核细胞进行密码子优化的蛋白质编码核酸分子。在另一个方面,蛋白质编码核酸分子针对植物细胞进行密码子优化。在另一个方面,蛋白质编码核酸分子针对单子叶植物物种进行密码子优化。在一个另外的方面,蛋白质编码核酸分子针对玉米或大豆细胞进行密码子优化。
85.如本文关于两个或更多个核苷酸或蛋白质序列使用的术语“同一性百分比(percent identity)”或“同一百分比(percent identical)”通过以下方式计算:(i)在比较窗口上比较两个最佳比对的序列(核苷酸或蛋白质),(ii)确定两个序列中出现相同核酸碱基(对于核苷酸序列)或氨基酸残基(对于蛋白质)的位置数以得到匹配位置数,(iii)将匹配位置数除以比较窗口中的总位置数,以及然后(iv)将这个商乘以100%以得到同一性百分比。如果“同一性百分比”是在不指定特定比较窗口的情况下相对于参考序列计算,则通过将比对区域上的匹配位置数除以参考序列的总长度来确定同一性百分比。因此,出于本技术的目的,当两个序列(查询和主题)是最佳比对的(允许其比对中的缺口)时,查询序列的“同一性百分比”等于两个序列之间的相同位置数除以查询序列在其长度(或比较窗口)上的总位置数,然后乘以100%。当关于蛋白质使用序列同一性的百分比时,应当认识
到,不相同的残基位置通常因保守氨基酸取代而不同,其中氨基酸残基被具有相似化学特性(例如,电荷或疏水性)的其他氨基酸残基取代并且因此不改变分子的功能特性。当序列的不同之处在于保守取代时,序列同一性百分比可以向上调整以针对取代的保守性质加以校正。因这类保守取代而不同的序列被称为具有“序列相似性”或“相似性”。
86.为了序列的最佳比对以计算其同一性百分比,本领域已知各种成对或多重序列比对算法和程序,诸如clustalw或basic local alignment search(blast)等,其可以用于比较两个或更多个核苷酸或蛋白质序列之间的序列同一性或相似性。尽管其他比对和比较方法是本领域已知的,但两个序列之间的比对和同一性百分比(包括上述同一性百分比范围)可以通过clustalw算法确定,参见,例如chenna r.等,“multiple sequence alignment with the clustal series of programs,”nucleic acids research 31:3497-3500(2003);thompson jd等,“clustal w:improving the sensitivity of progressive multiple sequence alignment through sequence weighting,position-specific gap penalties and weight matrix choice,”nucleic acids research 22:4673-4680(1994);larkin ma等,“clustal w and clustal x version 2.0,”bioinformatics 23:2947-48(2007);以及altschul,s.f.,gish,w.,miller,w.,myers,e.w.和lipman,d.j.(1990)“basic local alignment search tool.”j.mol.biol.215:403-410(1990),其全部内容和公开内容以引用的方式并入本文。
87.本文关于两个核苷酸序列使用的术语“互补性百分比(percent complementarity)”或“互补百分比(percent complementary)”类似于同一性百分比的概念,但是当查询序列和主题序列线性布置且最佳碱基配对而无二级折叠结构如环、茎或发夹时,是指查询序列的与主题序列的核苷酸最佳碱基配对或杂交的核苷酸百分比。这种互补性百分比可以是在两条dna链之间、在两条rna链之间或在一条dna链和一条rna链之间。“互补性百分比”可以通过以下计算:(i)在比较窗口上使两个核苷酸序列以线性和完全延伸的布置(即,没有折叠或二级结构)最佳地碱基配对或杂交,(ii)确定在比较窗口上两个序列之间碱基配对的位置数以得到互补位置数,(iii)将互补位置数除以比较窗口中的总位置数,和(iv)将这个商乘以100%以得到两个序列的互补性百分比。两个序列的最佳碱基配对可以基于通过氢结合的核苷酸碱基的已知配对如g-c、a-t和a-u来确定。如果“互补性百分比”是在不指定特定比较窗口的情况下相对于参考序列计算,则同一性百分比通过将两个线性序列之间的互补位置数除以参考序列的总长度来确定。因此,出于本技术的目的,当两个序列(查询和主题)是最佳碱基配对(允许错配或未碱基配对的核苷酸)的时,查询序列的“互补性百分比”等于两个序列之间碱基配对位置的数目除以查询序列在其长度上的总位置数,然后乘以100%。
88.术语“可操作地连接”是指启动子或其他调控元件与基因(或转基因)的相关可转录dna序列或编码序列之间的功能性连接,使得启动子等用以启动、辅助、影响、引起和/或促进相关可转录dna序列或编码序列至少在某些组织、某些发育阶段和/或某些状况中的转录和表达。除启动子之外,调控元件包括但不限于增强子、前导序列、转录起始位点(tss)、接头、5'和3'非翻译区(utr)、内含子、聚腺苷酸化信号和终止区域或序列等,它们对于调控或允许基因或可转录dna序列在细胞中的表达是合适的、必需的或优选的。这类额外调控元件可以是任选的,并且用于增强或优化基因或可转录dna序列的表达。出于本技术的目的,“增强子”与“启动子”的区别可以在于增强子通常缺少转录起始位点、tata盒或等同序列,并且因此不足以单独驱动转录。如本文所用,“前导序列”通常可以定义为在基因(或转基因)的转录起始位点(tss)和可转录dna序列或蛋白质编码序列起始位点的5'端之间的基因5'-utr的dna序列。
89.如本领域通常理解的,术语“启动子”是指含有rna聚合酶结合位点、转录起始位点和/或tata盒并辅助或促进相关可转录多核苷酸序列和/或基因(或转基因)的转录和表达的dna序列。启动子可以从已知或天然存在的启动子序列或其他启动子序列合成产生、改变或衍生。启动子也可以包括包含两个或更多个异源序列的组合的嵌合启动子。因此,本技术的启动子可以包括与本文已知或提供的其他启动子序列在组成上相似但不相同的启动子序列的变体。启动子可以根据与可操作地连接到启动子的相关编码或可转录序列或基因(包括转基因)的表达模式有关的多种标准进行分类,如组成型、发育型、组织特异性、诱导型等。驱动在植物的所有或大多数组织中的表达的启动子被称为“组成型”启动子。驱动在某些发育时期或阶段期间的表达的启动子被称为“发育型”启动子。相对于其他植物组织,驱动在植物的某些组织中的增强表达的启动子被称为“组织增强”或“组织优选”启动子。因此,“组织优选”启动子在植物的特定组织中引起相对较高或优先的表达,但在植物的其他组织中具有较低的表达水平。在植物的特定组织内表达而在其他植物组织中很少表达或不表达的启动子被称为“组织特异性”启动子。“诱导型”启动子是响应环境刺激如寒冷、干旱或光或其他刺激如伤害或化学应用而启动转录的启动子。启动子还可以根据其来源分类,如异源的、同源的、嵌合的、合成的等。“异源”启动子是相对于其相关可转录序列、编码序列或基因(或转基因)具有不同来源和/或非天然存在于待转化的植物物种中的启动子序列。
90.描述可以在本文中使用的启动子的实例包括但不限于美国专利号6,437,217(玉米rs81启动子)、美国专利号5,641,876(稻肌动蛋白启动子)、美国专利号6,426,446(玉米rs324启动子)、美国专利号6,429,362(玉米pr-1启动子)、美国专利号6,232,526(玉米a3启动子)、美国专利号6,177,611(组成型玉米启动子)、美国专利号5,322,938、5,352,605、5,359,142和5,530,196(35s启动子)、美国专利号6,433,252(玉米l3油质蛋白启动子)、美国专利号6,429,357(稻肌动蛋白2启动子以及稻肌动蛋白2内含子)、美国专利号5,837,848(根特异性启动子)、美国专利号6,294,714(光诱导型启动子)、美国专利号6,140,078(盐诱导型启动子)、美国专利号6,252,138(病原体诱导型启动子)、美国专利号6,175,060(缺磷诱导型启动子)、美国专利号6,635,806(γ-coixin启动子)和美国专利申请序列号09/757,089(玉米叶绿体醛缩酶启动子)。可以使用的额外启动子是胭脂碱合酶(nos)启动子(ebert等,1987),章鱼碱合酶(ocs)启动子(其携带于根癌农杆菌的肿瘤诱导质粒上),花椰菜花叶病毒组启动子如花椰菜花叶病毒(camv)19s启动子(lawton等,plant molecular biology(1987)9:315-324)、camv 35s启动子(odell等,nature(1985)313:810-812),无花果花叶病毒35s-启动子(美国专利号6,051,753;5,378,619),蔗糖合酶启动子(yang和russell,proceedings of the national academy of sciences,usa(1990)87:4144-4148),r基因复合物启动子(chandler等,plant cell(1989)1:1175-1183),和叶绿素a/b结合蛋白基因启动子pc1sv(美国专利号5,850,019)和agrtu.nos(genbank accession v00087;depicker等,journal of molecular and applied genetics(1982)1:561-573;bevan等,1983)启动子。
91.也可以使用并构建启动子杂合体以增强转录活性(参见美国专利号5,106,739),或组合期望的转录活性、可诱导性和组织特异性或发育特异性。在植物中发挥功能的启动子包括但不限于为诱导型、病毒型、合成型、组成型、时间调控型、空间调控型和时空调控型的启动子。为组织增强、组织特异性或发育调控的其他启动子也是本领域已知的,并且设想这些启动子在本公开的实践中有用。
92.如本文所用,关于启动子的术语“异源”是相对于其相关可转录dna序列、编码序列或基因(或转基因)具有不同来源和/或非天然存在于待转化的植物物种中的启动子序列。术语“异源”可以更广泛地指两个或更多个dna分子或序列如启动子和相关可转录dna序列、编码序列或基因的组合,只要这样的组合是人造的并且通常在自然界中找不到。
93.另外,关于多核苷酸(dna或rna)分子、蛋白质、构建体、载体等的术语“重组”是指人造的并且通常在自然界中找不到和/或存在于通常在自然界中找不到的背景中的多核苷酸或蛋白质分子或序列,包括包含在没有人为干预的情况下不会邻接或紧密接近地一起天然存在的多核苷酸或蛋白质序列的组合的多核苷酸(dna或rna)分子、蛋白质、构建体等,和/或包含至少两个相对于彼此异源的多核苷酸或蛋白质序列的多核苷酸分子、蛋白质、构建体等。重组多核苷酸或蛋白质分子、构建体等可以包含(i)与在自然界中彼此接近存在的其他多核苷酸或蛋白质序列分开,和/或(ii)与彼此非自然接近的其他多核苷酸或蛋白质序列相邻(或邻接)的多核苷酸或蛋白质序列。这样的重组多核苷酸分子、蛋白质、构建体等也可以指已经在细胞外被基因工程改造和/或构建的多核苷酸或蛋白质分子或序列。例如,重组dna分子可以包含任何合适的质粒、载体等,并且可以包括线性或环状dna分子。这类质粒、载体等可以含有各种维持元件,包括原核复制起点和选择标志,以及除植物选择标志基因之外可能的一种或多种转基因或表达盒等。
94.如本文所用,“相邻”是指核酸序列紧密接近或紧邻另一核酸序列。在一个方面,相邻的核酸序列是物理连接的。在另一个方面,相邻的核酸序列或基因彼此紧邻,使得在第一核酸序列的末端和第二核酸序列的起点之间没有间插核苷酸。在一个方面,如果第一基因和第二基因被少于50,000、少于25,000、少于10,000、少于9000、少于8000、少于7000、少于6000、少于5000、少于4000、少于3000、少于2500、少于2000、少于1750、少于1500、少于1250、少于1000、少于900、少于800、少于700、少于600、少于500、少于400、少于300、少于200、少于100、少于75、少于50、少于25、少于20、少于10、少于5、少于4、少于3、少于2或少于1个核苷酸分开,则它们彼此相邻。
95.在一个方面,本文提供的方法和组合物包含载体。如本文所用,术语“载体”或“质粒”可互换使用并且是指与染色体dna物理分开的环状双链dna分子。在一个方面,本文所用的质粒或载体能够体内复制。如本文所用的“转化载体”是能够转化植物细胞的质粒。在一个方面,本文提供的质粒是细菌质粒。在另一个方面,本文提供的质粒是农杆菌ti质粒或来源于农杆菌ti质粒。
96.在一个方面,本文提供的质粒或载体是重组载体。如本文所用,术语“重组载体”是指通过实验室遗传重组方法如分子克隆形成的载体。在另一个方面,本文提供的质粒是合成质粒。如本文所用,“合成质粒”是能够具有与自然质粒(例如,ti质粒)相同的功能(例如,复制)的人工产生的质粒。不受限制地,本领域技术人员可以经由通过单独的核苷酸合成质粒或通过将来自不同的预先存在的质粒的核酸分子剪接在一起从头产生合成质粒。
97.如本文所用,“修饰的”在植物、种子、植物组分、植物细胞和植物基因组的背景下是指含有从其自然或天然状态的改变或变化的状态。例如,基因的“天然转录物”是指由未修饰的基因产生的rna转录物。通常,天然转录物是有义转录物。修饰的植物或种子在其遗传物质中含有分子改变,包括遗传修饰或表观遗传修饰。通常,修饰的植物或种子或其亲本或祖细胞系经历了诱变、基因组编辑(例如,但不限于经由使用位点特异性核酸酶的方法)、遗传转化(例如,但不限于经由农杆菌转化或微粒轰击的方法)或其组合。在一个方面,本文提供的修饰的植物不包含非植物遗传物质或序列。在又另一个方面,本文提供的修饰的植物不包含种间遗传物质或序列。在一个方面,本公开提供与修饰的植物、种子、植物组分、植物细胞和由修饰的植物、种子、植物部分和植物细胞制成的产品相关的方法和组合物。在一个方面,本文提供的修饰的种子产生本文提供的修饰的植物。在一个方面,本文提供的修饰的植物、种子、植物组分、植物细胞或植物基因组包含本文提供的重组dna构建体或载体。在另一个方面,本文提供的产品包含本文提供的修饰的植物、植物组分、植物细胞或植物染色体或基因组。本公开提供具有期望的或增强的特性的修饰的植物,所述特性例如但不限于疾病、昆虫或害虫耐受性(例如,病毒耐受性、细菌耐受性、真菌耐受性、线虫耐受性、节肢动物耐受性、腹足动物耐受性);除草剂耐受性;抗环境压力;质量改善,诸如产量、营养增强、环境或压力耐受性;植物生理学、生长、发育、形态或植物产品的任何期望的改变,包括淀粉生产、改性油生产、高油生产、改性脂肪酸含量、高蛋白质生产、果实成熟、增强的动物和人营养、生物聚合物生产、药物肽和可分泌肽生产;改善的加工性状;改善的可消化性;低棉子糖;工业酶生产;改善的风味;固氮;杂交种子生产;和纤维生产。
98.如本文所用,“基因组编辑”或编辑是指使用靶向编辑技术在基因组中目标核苷酸序列的靶向诱变、插入、缺失、倒位、取代或易位。目标核苷酸序列可以具有任何长度,例如,至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少75个、至少100个、至少250个、至少500个、至少1000个、至少2500个、至少5000个、至少10,000个或至少25,000个核苷酸。如本文所用,“靶向编辑技术”是指允许对基因组中的具体位置进行精确和/或靶向编辑(例如,编辑不是随机的)的任何方法、协议或技术。非限制性地,位点特异性核酸酶的使用是靶向编辑技术的一个实例。靶向编辑技术的另一个非限制性实例是使用一种或多种系链引导寡核苷酸(tgoligo)。如本文所用,“靶向编辑”是指由靶向编辑技术引起的靶向诱变、插入、缺失、倒位或取代。目标核苷酸序列可以是内源基因组序列或转基因序列。
99.在一个方面,“靶向编辑技术”是指允许对基因组中的具体位置进行精确和/或靶向编辑(例如,编辑不是随机的)的任何方法、协议或技术。非限制性地,位点特异性核酸酶的使用是靶向编辑技术的一个实例。
100.在一个方面,靶向编辑技术用于编辑内源基因座或内源基因。在另一个方面,靶向编辑技术用于编辑转基因。如本文所用,“内源基因”或基因的“天然拷贝”是指源自给定生物体、细胞、组织、基因组或染色体内的基因。“内源基因”或基因的“天然拷贝”是先前未被人为修饰的基因。
101.如本文所用,“基因座”是指在染色体或其他核酸分子上的具体位置。非限制性地,基因座可以包含编码蛋白质或rna的多核苷酸。基因座也可以包含非编码rna。基因座可以
包含基因。基因座可以包含启动子、5'-非翻译区(utr)、外显子、内含子、3'-utr或其任何组合。基因座可以包含编码区域。
102.如本文所用,“物理连接”是指定位在同一核酸分子上的两个或更多个基因座。
103.如本文所用,“编码区域”、“基因区域”或“基因”是指可以产生功能单元(例如,但不限于,例如蛋白质或非编码rna分子)的多核苷酸。“编码区域”、“基因”或“基因区域”可以包含启动子、增强子序列、前导序列、转录起始位点、转录终止位点、聚腺苷酸化位点、一个或多个外显子、一个或多个内含子、5'-utr、3'-utr或其任何组合。“编码区域序列”、“基因序列”或“基因区域序列”可以包含编码启动子、增强子序列、前导序列、转录起始位点、转录终止位点、聚腺苷酸化位点、一个或多个外显子、一个或多个内含子、5'-utr、3'-utr或其任何组合的多核苷酸序列。在一个方面,“基因”编码非编码rna分子或其前体。在另一个方面,“基因”编码蛋白质。
104.非编码rna分子的非限制性实例包括微小rna(mirna)、mirna前体(pre-mirna)、小干扰rna(sirna)、小rna(18-26nt长度)及编码其的前体、异染色质sirna(hc-sirna)、piwi相互作用rna(pirna)、发夹双链rna(发夹dsrna)、反式作用sirna(ta-sirna)、天然存在的反义sirna(nat-sirna)、crispr rna(crrna)、示踪rna(tracrrna)、引导rna(grna)和单引导rna(sgrna)。在一个方面,本文提供的非编码rna选自由微小rna、小干扰rna、二级小干扰rna、转移rna、核糖体rna、反式作用小干扰rna、天然存在的反义小干扰rna、异染色质小干扰rna及其前体组成的组。在另一个方面,本文提供的非编码rna选自由mirna、pre-mirna、sirna、hc-sirna、pirna、发夹dsrna、ta-sirna、nat-sirna、crrna、tracrrna、grna和sgrna组成的组。非编码rna通常与非编码rna靶位点100%互补,或至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%互补。非编码rna靶位点可以存在于dna分子或rna分子中。非编码rna靶位点可以与非编码rna杂交(或结合)以实现各种结果。例如,一些非编码rna(非限制性地,例如,mirna、sirna、ta-sirna)辅助裂解包含互补非编码rna靶位点的mrna转录物。或者,非编码rna(非限制性地,例如,mirna、sirna、ta-sirna)可以通过结合到mrna中的非编码rna靶位点来辅助抑制mrna转录物的蛋白质翻译。一些非编码rna(非限制性地,例如,hc-sirna)辅助诱导dna的表观遗传改变。在一个方面,非编码rna靶位点是mirna靶位点或sirna靶位点。在另一个方面,本文提供的基因包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个非编码rna靶位点。在另一个方面,本文提供的基因包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个异源非编码rna靶位点。在另一个方面,本文提供的显性负等位基因包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个非编码rna靶位点。在另一个方面,本文提供的显性负等位基因包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个异源非编码rna靶位点。在一个方面,本文提供的内源基因经修饰以包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个异源非编码rna靶位点。
105.如本文所用,“等位基因”是指基因组中给定基因座或基因的变体。如果细胞中染
色体对的两条染色体上存在相同的等位基因,则认为所述细胞在给定基因座处是纯合的。如果染色体对的每个成员对于给定基因座包含不同的等位基因,则所述细胞对于所述基因座是杂合的。对于给定基因座可能最少有一个等位基因,尽管通常对于基因组中的任何给定基因座可能有多个等位基因。
106.如本文所用,术语“阻抑”、“抑制”和“下调”定义为本领域已知的或本文所述的降低基因产物(例如,mrna、蛋白质、非编码rna)的表达或功能的任何方法。“抑制”可以是在两种细胞之间如修饰的细胞相对对照细胞比较的背景下。基因产物的表达或功能的抑制还可以是在同一植物内的植物细胞、细胞器、器官、组织或植物组分之间或在不同植物之间比较的背景下,并且包括在同一植物或植物组分内的发育或时间阶段之间或在植物或植物组分之间的比较。“抑制”包括目标基因产物的功能或产生的任何相对减弱,直至且包括所述基因产物的功能或产生的完全消除。术语“抑制”包括下调靶基因产物的翻译和/或转录或靶基因产物的功能活性的任何方法或组合物。“抑制”不必包括基因产物表达的完全消除。在一个方面,本文提供的修饰细胞中的基因产物包含比对照细胞中基因产物的表达低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或100%的表达。在另一个方面,本文提供的修饰细胞中的基因产物包含比对照细胞中的基因产物的表达低1%至100%、1%至95%、1%至90%、1%至80%、1%至70%、1%至60%、1%至50%、1%至40%、1%至30%、1%至25%、1%至20%、1%至15%、1%至10%、1%至5%、5%至25%、5%至50%、5%至75%、5%至100%、10%至25%、10%至50%、10%至75%、10%至100%、25%至50%、25%至75%、25%至100%或50%至100%的表达。
107.如本文所用,“靶位点”是指多核苷酸序列结合到位点特异性核酸酶并被其裂解从而将双链断裂引入核酸骨架中的位置。在另一个方面,靶位点包含至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少29个或至少30个连续核苷酸。在另一个方面,本文提供的靶位点是至少10个、至少20个、至少30个、至少40个、至少50个、至少75个、至少100个、至少125个、至少150个、至少200个、至少250个、至少300个、至少400个或至少500个核苷酸。在一个方面,位点特异性核酸酶结合到靶位点。在另一个方面,位点特异性核酸酶经由引导非编码rna(即,诸如而非限制性地crispr rna或单引导rna(两者均在下文详细描述))结合到靶位点。在一个方面,本文提供的非编码rna与靶位点互补。应理解,非编码rna结合到靶位点不需要完美互补性;可以容忍靶位点和非编码rna之间有至少1个、至少2个、至少3个、至少4个或至少5个、至少6个、至少7个或至少8个错配。如本文所用,“靶区域”或“被靶向区域”是指期望被修饰的多核苷酸序列。在一个方面,“靶区域”、“被靶向区域”或“靶基因”侧接有两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个或十个或更多个靶位点。“靶基因”是指编码期望被修饰的基因的多核苷酸序列。在一个方面,包含靶基因的多核苷酸序列还包含一个或多个靶位点。在另一个方面,靶区域包含一个或多个、两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个或十个或更多个靶基因。非限制性地,在一个方面,靶区域可以经历缺失或倒位。如本文所用,“侧接”当用于描述靶区域时,是指物理上围绕靶区域的两个
或更多个靶位点,其中在靶区域的每一侧上有一个靶位点。
108.靶位点可以定位在编码前导序列、增强子、转录起始位点、启动子、5'-utr、外显子、内含子、3'-utr、聚腺苷酸化位点或终止序列的多核苷酸序列中。应理解,靶位点也可以定位在编码前导序列、增强子、转录起始位点、启动子、5'-utr、外显子、内含子、3'-utr、聚腺苷酸化位点或终止序列的序列的上游或下游。在一个方面,靶位点定位在编码前导序列、增强子、转录起始位点、启动子、5'-utr、外显子、内含子、3'-utr、多聚腺苷酸化位点、基因或终止序列的多核苷酸的10、20、30、40、50、75、100、125、150、200、250、300、400、500、600、700、800、900、1000、1250、1500、2000、2500、5000、10,000或25,000个核苷酸内。
109.如本文所用,“上游”是指核酸序列定位在连接的核酸序列的5'端之前。如本文所用,“下游”是指核酸序列定位在连接的核酸序列的3'端之后。如本文所用,“5'”是指编码dna序列的起点或rna分子的开始。如本文所用,“3'”是指编码dna序列的末端或rna分子的末端。应理解,“倒位”是指反转给定多核苷酸序列的取向。例如,如果样品序列5'-atgatc-3'被倒位,则其将以反向取向的5'-ctagta-3'读取。另外,认为样品序列5'-atgatc-3'与样品序列5'-ctagta-3'处于“相反取向”。
110.如本文所用,“供体分子”被定义为已被选择用于定点、靶向插入基因组中的核酸序列。在一个方面,供体分子包含“供体序列”。在一个方面,本文提供的靶向编辑技术包括使用一个或多个、两个或更多个、三个或更多个、四个或更多个或五个或更多个供体分子或供体序列。本文提供的供体分子或供体序列可以具有任何长度。例如,本文提供的供体分子或供体序列的长度是2至50,000、2至10,000、2至5000、2至1000、2至500、2至250、2至100、2至50、2至30、15至50、15至100、15至500、15至1000、15至5000、18至30、18至26、20至26、20至50、20至100、20至250、20至500、20至1000、20至5000或20至10,000个核苷酸。供体分子或供体序列可以包含编码主动转录和/或翻译的基因序列的一种或多种基因。这类转录序列可以编码蛋白质或非编码rna。在一个实施方案中,供体分子或供体序列可以包含多核苷酸序列,所述多核苷酸序列不包含功能基因或完整基因(即,供体分子可以简单地包含调控序列,如启动子),或不包含任何可鉴定的基因表达元件或任何主动转录的基因序列。此外,供体分子或供体序列可以是线性或环状的,并且可以是单链或双链的。其可以作为裸核酸、作为与一种或多种递送剂(例如,脂质体、泊洛沙姆、用蛋白质包封的t链等)的复合物或以包含在分别如根癌农杆菌或双生病毒(geminivirus)的细菌或病毒递送媒介物中的形式递送至细胞。在另一个方面,本文提供的供体分子或供体序列可操作地连接到启动子。在再一个方面,本文提供的供体分子或供体序列被转录成rna。在另一个方面,本文提供的供体分子或供体序列不与启动子可操作地连接。
111.在一个方面,本文提供的供体分子或供体序列可以包含至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种基因。在一个方面,本文提供的供体分子或供体序列不包含基因。非限制性地,本文提供的基因可以包括杀昆虫剂抗性基因、除草剂耐受性基因、氮利用效率基因、水利用效率基因、营养品质基因、dna结合基因、选择标志基因、rnai构建体、位点特异性基因组修饰酶基因、crispr/cas9系统的单一引导rna、基于双生病毒的表达盒或植物病毒表达载体系统。在一个方面,供体分子或供体序列包含编码启动子的多核苷酸。在另一个方面,本文提供的供体分子或供体序列包含编码组织特异性或组织优选启动子的多核苷酸。在再另一个方面,本文提供的供
体分子或供体序列包含编码组成型启动子的多核苷酸。在另一个方面,本文提供的供体分子或供体序列包含编码诱导型启动子的多核苷酸。在另一个方面,供体分子或供体序列包含编码选自由前导序列、增强子、转录起始位点、5'-utr、外显子、内含子、3'-utr、聚腺苷酸化位点、转录终止位点、启动子、全长基因、部分基因、基因或非编码rna组成的组的结构的多核苷酸。在一个方面,本文提供的供体分子或供体序列包含一个或多个、两个或更多个、三个或更多个、四个或更多个或五个或更多个设计的元件。
112.如本文所用,“供体模板”可以是重组dna供体模板,其被定义为具有核酸模板或插入序列的核酸分子,所述核酸模板或插入序列用于经由修复植物细胞的基因组中的切口或双链dna断裂而定点、靶向插入或重组到植物细胞的基因组中。例如,“供体模板”可以用于定点整合编码目标反义序列的dna区段,或作为模板将突变如插入、缺失等引入植物的基因组内的靶位点中。本文提供的靶向基因组编辑技术可以包括使用一个或多个、两个或更多个、三个或更多个、四个或更多个或五个或更多个供体模板。“供体模板”可以是单链或双链dna或rna分子或质粒。供体模板的“插入序列”是设计用于靶向插入植物细胞的基因组中的序列,其可以具有任何合适的长度。例如,供体模板的插入序列的长度可以是2至50,000、2至10,000、2至5000、2至1000、2至500、2至250、2至100、2至50、2至30、15至50、15至100、15至500、15至1000、15至5000、18至30、18至26、20至26、20至50、20至100、20至250、20至500、20至1000、20至5000、20至10,000、50至250、50至500、50至1000、50至5000、50至10,000、100至250、100至500、100至1000、100至5000、100至10,000、250至500、250至1000、250至5000或250至10,000个核苷酸或碱基对。供体模板还可以具有至少一个同源序列或同源臂,诸如两个同源臂,以指导突变或插入序列经由同源重组整合到植物的基因组内的靶位点中,其中所述同源序列或同源臂与植物的基因组内的靶位点处或附近的序列相同或互补或具有同一性百分比或互补性百分比。当供体模板包含一个或多个同源臂和插入序列时,所述一个或多个同源臂将侧接或包围供体模板的插入序列。
113.供体模板可以是线性或环状的,并且可以是单链或双链的。供体模板可以作为裸核酸(例如,经由粒子轰击)、作为与一种或多种递送剂(例如,脂质体、蛋白质、泊洛沙姆、用蛋白质包封的t链等)的复合物或以包含在如分别为根癌农杆菌或双生病毒的细菌或病毒递送媒介物中的形式递送至细胞。本文提供的供体模板或插入序列的插入序列可以包含可以转录成rna分子的全部或部分如rna分子的反义序列或部分的可转录dna序列或区段。
114.如本文所用,“设计的元件”是指能够诱导可操作地连接的多核苷酸的所期望表达模式的多核苷酸。在一个方面,设计的元件包含至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少1500个、至少2000个、至少2500个、至少3000个、至少4000个或至少5000个核苷酸。在另一个方面,设计的元件包含20-50个核苷酸。在再另一个方面,设计的元件包含10至5000、10至2500、10至1000、10至500、10至100、20至50、20至100、20至500、20至1000、20至2000、20至5000、50至100、50至500、50至1000或50至5000个核苷酸。在一个方面,设计的元件包含组成型启动子。在另一个方面,设计的元件包含诱导型启动子。在另一个方面,设计的元件包含组织特异性或组织优选启动子。在另一个方面,设计的元件
包含天然启动子。在另一个方面,设计的元件包含非天然启动子。在另一个方面,设计的元件包含组织特异性或组织优选启动子元件。在另一个方面,设计的元件包含转录增强子元件。在另一个方面,设计的元件包含转录阻遏物元件。
115.本技术的一个方面涉及针对靶向编辑筛选和选择细胞的方法以及选择包含靶向编辑的细胞的方法。核酸可以使用各种技术分离。例如,核酸可以使用包括但不限于重组核酸技术和/或聚合酶链反应(pcr)的任何方法分离。一般的pcr技术描述于例如pcr primer:a laboratory manual,dieffenbach和dveksler编,cold spring harbor laboratory press,1995中。重组核酸技术包括,例如,限制酶消化和连接,其可以用于分离核酸。分离的核酸也可以作为单个核酸分子或作为一系列寡核苷酸化学合成。多肽可以通过已知方法如deae离子交换、凝胶过滤和羟基磷灰石色谱从自然来源(例如,生物样品)纯化。多肽也可以例如通过在表达载体中表达核酸来纯化。另外,纯化的多肽可以通过化学合成获得。多肽的纯度程度可以使用任何适当的方法,例如柱色谱、聚丙烯酰胺凝胶电泳或hplc分析来测量。
116.在一个方面,本公开提供检测修饰的植物细胞和未修饰的植物细胞中的重组核酸和多肽的方法。非限制性地,核酸也可以使用杂交检测。核酸之间的杂交在sambrook等(1989,molecular cloning:a laboratory manual,第2版,cold spring harbor laboratory press,cold spring harbor,ny)中详细讨论。
117.多肽可以使用抗体检测。使用抗体检测多肽的技术包括酶联免疫吸附测定(elisa)、western印迹、免疫沉淀和免疫荧光。本文提供的抗体可以是多克隆抗体或单克隆抗体。对本文提供的多肽具有特异性结合亲和力的抗体可以使用本领域众所周知的方法产生。本文提供的抗体可以使用本领域已知的方法附着到固体支撑物如微量滴定板。
118.可以使用可检测标记完成(例如,扩增产物、杂交复合物、多肽的)检测。术语“标记”意图包括使用直接标记以及间接标记。可检测标记包括酶、辅基、荧光材料、发光材料、生物发光材料和放射性材料。
119.可以通过本领域普通技术人员已知的任何方法筛选和选择修饰的、工程化的或转基因的植物或植物细胞。筛选和选择方法的实例包括但不限于southern分析、用于检测多核苷酸的pcr扩增、northern印迹、rna酶保护、引物延伸、用于检测rna转录物的rt-pcr扩增、sanger测序、新一代测序技术(例如,illumina、pacbio、ion torrent、454)、用于检测多肽和多核苷酸的酶或核酶活性的酶测定,以及用于检测多肽的蛋白凝胶电泳、western印迹、免疫沉淀和酶联免疫测定。其他技术如原位杂交、酶染色和免疫染色也可以用于检测多肽和/或多核苷酸的存在或表达。用于执行所有提及技术的方法是已知的。
120.基因组编辑或靶向编辑可以经由使用一种或多种位点特异性核酸酶来实现。位点特异性核酸酶可以在基因组序列的靶位点处诱导双链断裂(dsb),所述双链断裂然后通过同源重组(hr)或非同源末端连接(nhej)的自然过程修复。序列修饰如插入、缺失可以经由nhej修复在dsb位置发生。如果产生了侧接一个靶区域的两个dsb,则这些断裂可以通过反转被靶向dna的取向(也称为“倒位”)经由nhej修复。hr可以用于将供体核酸序列整合到靶位点中。不受任何理论的限制,为了将供体核酸序列(或供体分子)整合到dsb中,供体分子包含侧接有第一同源区域和第二同源区域的目标多核苷酸,其中第一同源区域和第二同源区域与靶位点处dsb的每一侧同源。然后细胞中的同源重组机器通过将供体分子整合到靶位点中来修复dsb。在一个方面,本文提供的双链断裂通过nhej修复。在另一个方面,本文提
供的双链断裂通过hr修复。
121.尽管双链断裂仅在每条链上的两个核苷酸之间发生,但是双链断裂位点可以包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少75个、至少80个、至少90个或至少100个核苷酸。如本文所用,“双链断裂位点”是指被位点特异性核酸酶或引导rna识别和结合的多核苷酸序列。
122.在一个方面,本文提供的载体或构建体包含编码至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或至少10种位点特异性核酸酶的多核苷酸。在另一个方面,本文提供的细胞已经包含位点特异性核酸酶。在一个方面,本文提供的编码位点特异性核酸酶的多核苷酸被稳定地转化到细胞中。在另一个方面,本文提供的编码位点特异性核酸酶的多核苷酸被瞬时转化到细胞中。在另一个方面,编码位点特异性核酸酶的多核苷酸处于可调控启动子、组成型启动子、组织特异性启动子或任何可用于表达位点特异性核酸酶的启动子的控制之下。
123.在一个方面,载体顺式包含编码位点特异性核酸酶的盒和供体分子,使得当与细胞的基因组接触时,位点特异性核酸酶能够实现供体分子的位点特异性整合。在一个方面,第一载体包含编码位点特异性核酸酶的盒,且第二载体包含供体分子,使得当与细胞的基因组接触时,反式提供的位点特异性核酸酶能够实现供体分子的位点特异性整合。
124.本文提供的位点特异性核酸酶可以用作靶向编辑技术的一部分。用于本文提供的方法和/或组合物中的位点特异性核酸酶的非限制性实例包括大范围核酸酶、锌指核酸酶(zfn)、转录激活因子样效应物核酸酶(talen)、rna引导核酸酶(例如,cas9和cpf1)、重组酶(非限制性地,例如附接到dna识别基序的丝氨酸重组酶、附接到dna识别基序的酪氨酸重组酶)、转座酶(非限制性地,例如附接到dna结合结构域的dna转座酶)或其任何组合。在一个方面,本文提供的方法包括使用一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种位点特异性核酸酶以在一个、两个、三个、四个、五个或多于五个靶位点处诱导一个、两个、三个、四个、五个或多于五个dsb。
125.在一个方面,将位点特异性核酸酶蛋白提供给细胞。在另一个方面,将编码位点特异性核酸酶蛋白的核酸序列(例如,载体)提供给细胞。在另一个方面,将位点特异性核酸酶蛋白和引导rna单独地提供给细胞。在另一个方面,将位点特异性核酸酶蛋白和引导rna作为复合物提供给细胞。在一个方面,位点特异性核酸酶蛋白和引导rna在体外、体内或离体组装成复合物。
126.在一个方面,本文提供的基因组编辑系统(例如,大范围核酸酶、zfn、talen、crispr/cas9系统、crispr/cpf1系统、重组酶、转座酶)或本文提供的基因组编辑系统的组合用于将一个或多个插入、缺失、取代或倒位引入细胞中的基因座以产生显性负等位基因或显性正等位基因的方法中。
127.位点特异性核酸酶如大范围核酸酶、zfn、talen、argonaute蛋白(argonaute蛋白的非限制性实例包括嗜热栖热菌(thermus thermophilus)来源的argonaute(ttago)、激烈热球菌(pyrococcus furiosus)来源的argonaute(pfago)、格氏嗜盐碱杆菌(natronobacterium gregoryi)来源的argonaute(ngago)、其同源物或其修饰型式)、cas9核酸酶(rna引导核酸酶的非限制性实例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas6、
cas7、cas8、cas9(也称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cpf1、casx、casy、其同源物或其修饰型式)在基因组序列的靶位点处诱导双链dna断裂,所述双链dna断裂然后通过hr或nhej的自然过程修复。然后在裂解位点发生序列修饰,这可能包括倒位、缺失或插入,在nhej的情况下会导致基因破坏,或通过hr整合核酸序列。
128.在一个方面,本文提供的位点特异性核酸酶选自由锌指核酸酶、大范围核酸酶、rna引导核酸酶、tale核酸酶、重组酶、转座酶或其任何组合组成的组。在另一个方面,本文提供的位点特异性核酸酶选自由cas9或cpf1组成的组。在另一个方面,本文提供的位点特异性核酸酶选自由以下组成的组:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cpf1、casx、casy、其同源物或其修饰型式。在另一个方面,本文提供的rna引导核酸酶选自由cas9或cpf1组成的组。在另一个方面,本文提供的rna引导核酸酶选自由以下组成的组:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cpf1、casx、casy、其同源物或其修饰型式。在另一个方面,本文提供的rna引导核酸酶是cas9核酸酶或其同源物或修饰型式。在一个方面,rna引导核酸酶是来自酿脓链球菌、嗜热链球菌、金黄色葡萄球菌、脑膜炎奈瑟菌(neisseria meningitides)或齿垢密螺旋体(treponema denticola)的cas9蛋白或其修饰型式。在另一个方面,rna引导核酸酶是cpf1或其同源物或修饰型式。
129.在另一个方面,本文提供的方法和/或组合物包含至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种位点特异性核酸酶。在又另一个方面,本文提供的方法和/或组合物包含编码至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种位点特异性核酸酶的至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种多核苷酸。
130.在一个方面,本文所述的靶向编辑技术包括重组酶的使用。在一个方面,附接到本文提供的dna识别基序的酪氨酸重组酶选自由cre重组酶、gin重组酶、flp重组酶和tnp1重组酶组成的组。在一个方面,本文提供的cre重组酶或gin重组酶被拴系到锌指dna结合结构域。flp-frt定点重组系统来自面包酵母酿酒酵母中的2μ质粒。在这个系统中,flp重组酶(翻转酶)重组在翻转酶识别靶(frt)位点之间的序列。frt位点包含34个核苷酸。flp结合到frt位点的“臂”(一个臂处于反向取向)并在间插核酸序列的任一端裂解frt位点。裂解后,flp重组在两个frt位点之间的核酸序列。cre-lox是来源于噬菌体p1的定点重组系统,其与flp-frt重组系统相似。cre-lox可以用于使核酸序列倒位、缺失核酸序列或易位核酸序列。在这个系统中,cre重组酶重组一对lox核酸序列。lox位点包含34个核苷酸,前和后13个核苷酸(臂)呈回文结构。在重组期间,cre重组酶蛋白结合到不同核酸上的两个lox位点,并在所述lox位点处裂解。裂解的核酸被剪接在一起(相互易位)并且重组完成。在另一个方面,
本文提供的lox位点是loxp、lox 2272、loxn、lox 511、lox 5171、lox71、lox66、m2、m3、m7或m11位点。
131.在另一个方面,附接至本文提供的dna识别基序的丝氨酸重组酶选自由phic31整合酶、r4整合酶和tp-901整合酶组成的组。在另一个方面,附接至本文提供的dna结合结构域的dna转座酶选自由tale-piggybac和tale-mutator组成的组。
132.在一个方面,本文所述的靶向编辑技术包括使用锌指核酸酶(zfn)。zfn是由融合到foki限制核酸酶的裂解结构域的工程化锌指dna结合结构域组成的合成蛋白。zfn可以设计成裂解双链dna的几乎任何长段以用于修饰锌指dna结合结构域。zfn从单体形成二聚体,所述单体由与经工程改造以结合靶dna序列的锌指阵列融合的foki核酸酶的非特异性dna裂解结构域组成。
133.zfn的dna结合结构域通常由3-4个锌指阵列组成。可以改变和定制相对于锌指∞-螺旋的起点在位置-1、 2、 3和 6的、有助于与靶dna的位点特异性结合的氨基酸以使其适应特异性靶序列。其他氨基酸形成共有骨架以产生具有不同序列特异性的zfn。选择zfn的靶序列的规则是本领域已知的。
134.foki核酸酶结构域需要二聚化以裂解dna,并因此需要两个具有c末端区域的zfn来结合裂解位点的相反dna链(由5-7nt分开)。如果两个zf结合位点呈回文结构,则zfn单体可以切割靶位点。如本文所用,术语zfn是宽泛的,并且包括能够在没有来自另一zfn的辅助的情况下裂解双链dna的单体zfn。术语zfn还用于指一对zfn的一个或两个成员,所述一对zfn经工程改造来一起起作用以在同一位点裂解dna。
135.不受任何科学理论的限制,因为锌指结构域的dna结合特异性原则上可以使用多种方法中的一种进行再工程改造,所以理论上可以构建定制的zfn以靶向几乎任何基因序列。用于工程改造锌指结构域的公开可用的方法包括上下文依赖组装(coda)、寡聚池工程改造(open)和模块化组装。
136.在一个方面,本文提供的方法和/或组合物包含一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种zfn。在另一个方面,本文提供的zfn能够产生靶向dsb。在一个方面,包含编码一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种zfn的多核苷酸的载体通过本领域已知的转化方法(例如,非限制性地,病毒转染、粒子轰击、peg介导的原生质体转染或农杆菌介导的转化)提供给细胞。
137.在一个方面,本文所述的靶向编辑技术包括使用大范围核酸酶。通常在微生物中鉴定的大范围核酸酶是独特的酶,具有高活性和长识别序列(>14nt),从而导致靶dna的位点特异性消化。天然存在的大范围核酸酶的工程化型式通常具有延伸的dna识别序列(例如,14-40nt)。大范围核酸酶的工程改造可能比zfn和talen的工程改造更具挑战性,因为大范围核酸酶的dna识别和裂解功能交织在单个结构域中。诱变和高通量筛选的专门方法已用于产生识别独特序列并具有改善的核酸酶活性的新型大范围核酸酶变体。
138.在一个方面,本文提供的方法和/或组合物包含一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种大范围核酸酶。在另一个方面,本文提供的大范围核酸酶能够产生靶向dsb。在一个方面,包含编码一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种大范围核酸酶的多核苷酸的载体通过本领域已知的转化方法(例如,非限制性地,病毒转染、粒子轰击、peg介导的原生质体转染或农杆菌介导的转
化)提供给细胞。
139.在一个方面,本文所述的靶向编辑技术包括使用转录激活因子样效应物核酸酶(talen)。talen是通过将转录激活因子样效应物(tale)dna结合结构域融合到foki核酸酶结构域产生的人工限制酶。当talen对的每个成员结合到侧接靶位点的dna位点时,foki单体二聚化并引起靶位点处的双链dna断裂。除了野生型foki裂解结构域之外,已设计了具有突变的foki裂解结构域的变体来改善裂解特异性和裂解活性。foki结构域充当二聚体,其需要两个构建体,所述构建体具有针对目标基因组中具有适当取向和间隔的位点的独特dna结合结构域。在talen dna结合结构域和foki裂解结构域之间的氨基酸残基的数目和在两个单独的talen结合位点之间的碱基的数目两者都是实现高水平活性的参数。
140.talen是通过将转录激活因子样效应物(tale)dna结合结构域融合到核酸酶结构域产生的人工限制酶。在一个方面,所述核酸酶选自由pvuii、muth、tevi和foki、alwi、mlyi、sbfi、sdai、stsi、cledorf、clo051、pept071组成的组。当talen对的每个成员结合到侧接靶位点的dna位点时,foki单体二聚化并引起靶位点处的双链dna断裂。
141.如本文所用,术语talen是宽泛的,并且包括能够在没有来自另一talen的辅助的情况下裂解双链dna的单体talen。术语talen还用于指一对talen的一个或两个成员,所述一对talen一起起作用以在同一位点裂解dna。
142.转录激活因子样效应物(tale)可以经工程改造以结合几乎任何dna序列。tale蛋白是来源于黄单胞菌属(xanthomonas)的各种植物细菌病原体的dna结合结构域。x病原体在感染期间将tale分泌到宿主植物细胞中。tale移动到细胞核,其在细胞核中识别并结合到宿主基因组中特定基因的启动子区域中特定dna序列的启动子区域中的特定dna序列。tale具有由33-34个氨基酸的13-28个重复单体构成的中央dna结合结构域。除了位置12和13处的高变氨基酸残基,每个单体的氨基酸都是高度保守的。这两个可变氨基酸被称为重复可变双残基(rvd)。rvd的氨基酸对ni、ng、hd和nn分别优先识别腺嘌呤、胸腺嘧啶、胞嘧啶和鸟嘌呤/腺嘌呤,并且rvd的调节可以识别连续的dna碱基。在氨基酸序列和dna识别之间的这种简单关系允许通过选择含有适当rvd的重复区段的组合来工程改造具体dna结合结构域。
143.除了野生型foki裂解结构域之外,已设计了具有突变的foki裂解结构域的变体来改善裂解特异性和裂解活性。foki结构域充当二聚体,其需要两个构建体,所述构建体具有针对目标基因组中具有适当取向和间隔的位点的独特dna结合结构域。在talen dna结合结构域和foki裂解结构域之间的氨基酸残基的数目和在两个单独的talen结合位点之间的碱基的数目两者都是实现高水平活性的参数。pvuii、muth和tevi裂解结构域是用于与tale一起使用的foki和foki变体的有用替代物。pvuii在偶联至tale时充当高度特异性裂解结构域(参见yank等,2013.plos one.8:e82539)。muth能够在dna中引入链特异性切口(参见gabsalilow等,2013.nucleic acids research.41:e83)。tevi在dna中在被靶向位点处引入双链断裂(参见beurdeley等,2013.nature communications.4:1762)。
144.在tale结合结构域的氨基酸序列和dna识别之间的关系允许可设计的蛋白质。可以使用软件程序如dna works设计tale构建体。设计tale构建体的其他方法是本领域技术人员已知的。参见doyle等,nucleic acids research(2012)40:w117-122;cermak等,nucleic acids research(2011).39:e82;以及tale-nt.cac.cornell.edu/about。
145.在一个方面,本文提供的方法和/或组合物包含一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种talen。在另一个方面,本文提供的talen能够产生靶向dsb。在一个方面,包含编码一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种talen的多核苷酸的载体通过本领域已知的转化方法(例如,非限制性地,病毒转染、粒子轰击、peg介导的原生质体转染或农杆菌介导的转化)提供给细胞。
146.在一个方面,本文所述的靶向编辑技术包括使用rna引导核酸酶。crispr/cas9系统或crispr/cpf1系统是基于foki的方法zfn和talen的替代系统。crispr系统基于rna引导工程化核酸酶,其使用互补碱基配对来识别靶位点处的dna序列。
147.在一个方面,本文提供的载体可以包含编码rna引导核酸酶(rna引导核酸酶的非限制性实例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cpf1、casx、casy、其同源物或其修饰型式)的核酸序列;和任选地靶向相应核酸酶所必需的引导rna的任意组合。如本文所用,术语“引导rna”或grna通常是指可以结合到rna引导核酸内切酶并帮助将核酸酶靶向于靶多核苷酸(例如,dna)内的具体位置的rna分子(或统称一组rna分子)。
148.尽管不受任何特定科学理论的限制,crispr/cas核酸酶是细菌和古细菌的适应性免疫系统的一部分,通过以序列依赖性方式裂解靶dna来保护它们免受侵入性核酸如病毒的影响。通过在crispr基因座(crispr阵列)的近端约20个核苷酸长的crispr重复序列之间整合侵入性dna的短片段(称为间隔区)来获得免疫。一种充分描述的cas蛋白是cas9核酸酶(也称为csn1),其是酿脓链球菌中2类ii型crispr/cas系统的一部分。参见makarova等,nature reviews microbiology(2015)doi:10.1038/nrmicro3569。cas9包含在其氨基末端的ruvc样核酸酶结构域和定位在蛋白质中间的hnh样核酸酶结构域。cas9蛋白还含有pam相互作用(pi)结构域、识别叶(rec)和bh结构域。cpf1核酸酶(另一ii型系统)以类似于cas9的方式起作用,但cpf1不需要tracrrna。参见cong等,science(2013)339:819-823;zetsche等,cell(2015)doi:10.1016/j.cell.2015.09.038;美国专利公开号2014/0068797;美国专利公开号2014/0273235;美国专利公开号2015/0067922;美国专利号8,697,359;美国专利号8,771,945;美国专利号8,795,965;美国专利号8,865,406;美国专利号8,871,445;美国专利号8,889,356;美国专利号8,889,418;美国专利号8,895,308;以及美国专利号8,906,616,其各自以引用的方式整体并入本文。
149.当cas9或cpf1裂解被靶向dna时,内源性双链断裂(dsb)修复机制得到激活。dsb可以经由非同源末端连接进行修复,其可以将插入或缺失(indel)并入被靶向基因座中。如果产生了侧接一个靶区域的两个dsb,则可以通过反转被靶向dna的取向来修复断裂。或者,如果提供与靶dna序列具有同源性的供体多核苷酸,则可以经由同源定向修复来修复dsb。这种修复机制允许将供体多核苷酸精确地整合到被靶向dna序列中。
150.虽然不受任何特定科学理论的限制,但是在2类ii型crispr/cas系统中,包括间隔区的crispr阵列在遇到识别的侵入性dna期间被转录并且被加工成小干扰crispr rna(crrna),其长度为大约40个核苷酸。crrna与反式激活crrna(tracrrna)杂交以激活cas9核酸酶并将其引导至靶位点。本文提供的核酸分子可以将crrna和tracrrna组合成一个核酸
分子,其在本文中被称为“单链引导rna(sgrna)”。cas9裂解靶位点的先决条件是在靶dna下游存在保守的前间隔区相邻基序(pam),其通常具有序列5-ngg-3,但较少出现nag。特异性由pam上游大约12个碱基的所谓“种子序列”提供,所述种子序列必须在rna和靶dna之间匹配。cpf1以类似于cas9的方式起作用,但cpf1不需要tracrrna。因此,在利用cpf1的一个方面,sgrna可以被crrna替换。cpf1的pam基序在靶位点的上游。另外,对于cpf1直系同源物lbcpf1和ascpf1,pam序列是5-tttv-3,其中v可以是a、c或g。在一个方面,当本文提供两种或更多种sgrna时,第一sgrna和第二sgrna与双链dna分子的不同链互补。在另一个方面,当本文提供两种或更多种sgrna时,第一sgrna和第二sgrna与双链dna分子的同一链互补。如本文所用,“前间隔区相邻基序”(pam)是指紧邻crispr复合物的靶序列上游或下游的2-6个碱基对dna序列。在另一个方面,第一grna和第二grna靶向不同的pam序列。在另一个方面,第一grna和第二grna靶向相同的pam序列。
151.在一个方面,本文提供的方法和/或组合物包含一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种cas9核酸酶。在一个方面,本文提供的方法和/或组合物包含编码一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种cas9核酸酶的一种或多种多核苷酸。在另一个方面,本文提供的cas9核酸酶能够产生靶向dsb。在一个方面,本文提供的方法和/或组合物包含一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种cpf1核酸酶。在一个方面,本文提供的方法和/或组合物包含编码一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种cpf1核酸酶的一种或多种多核苷酸。在另一个方面,本文提供的cpf1核酸酶能够产生靶向dsb。
152.当cas9核酸酶经由sgrna与靶位点杂交时,cas9在双链dna中产生两个平端切口。双链dna的“靶链”与sgrna互补,而“非靶链”包含与非靶链上的切割位点相邻并位于其3'端的pam基序。cas9将靶链和pam基序保持在一起,但非靶链的3’切割端是自由的,并且被称为“3'瓣”。在一个方面,3'瓣包含至少10个、至少15个、至少20个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少34个、至少35个、至少36个、至少37个、至少38个、至少39个或至少40个核苷酸。
153.在一个方面,包含编码位点特异性核酸酶的多核苷酸和任选地一种或多种、两种或更多种、三种或更多种或四种或更多种sgrna的载体通过本领域已知的转化方法(例如,非限制性地,粒子轰击、peg介导的原生质体转染或农杆菌介导的转化)提供给植物细胞。在一个方面,包含编码cas9核酸酶的多核苷酸和任选地一种或多种、两种或更多种、三种或更多种或四种或更多种sgrna的载体通过本领域已知的转化方法(例如,非限制性地,粒子轰击、peg介导的原生质体转染或农杆菌介导的转化)提供给植物细胞。在另一个方面,包含编码cpf1的多核苷酸和任选地一种或多种、两种或更多种、三种或更多种或四种或更多种crrna的载体通过本领域已知的转化方法(例如,非限制性地,病毒转染、粒子轰击、peg介导的原生质体转染或农杆菌介导的转化)提供给植物细胞。
154.在一个方面,本文提供的rna引导核酸酶选自由以下组成的组:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cpf1、casx、casy、其同源物或其修饰型式、argonaute(argonaute蛋白的非限制
性实例包括嗜热栖热菌来源的argonaute(ttago)、激烈热球菌来源的argonaute(pfago)、格氏嗜盐碱杆菌来源的argonaute(ngago)、其同源物、其修饰型式)、argonaute蛋白的dna向导及其组合。在另一个方面,本文提供的rna引导核酸酶选自由cas9和cpf1组成的组。本文提供的rna引导核酸酶包含cas9。在一个方面,本文提供的rna引导核酸酶选自由以下组成的组:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cpf1、casx、casy、其同源物或其修饰型式。在一个方面,位点特异性核酸酶选自由以下组成的组:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cpf1、casx、casy、ttago、pfago和ngago。在另一个方面,rna引导核酸酶选自由以下组成的组:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cpf1、casx、casy、ttago、pfago和ngago。
155.核酸酶如cas9也可以经工程改造以形成催化失活形式,诸如催化失活的cas9(dcas9)。dcas9在由grna指定的靶位点结合到dna,并产生可用于基于模板的编辑的环结构(图11,分图1)。dcas9可以经进一步修饰以与ssdna结合结构域形成融合物,用于进一步促进基于模板的编辑(图11,分图2)。与单独dcas9的方法相比,预期用这种修改的dcas9-ssdna结合方案的编辑效率更高,因为ssdna模板与dcas9复合物结合,并将被带到grna靶的附近。如本文所用,“失活的cas核酸酶”(dcas)是指能够结合dna但不能裂解dna的cas核酸酶蛋白的酶促失活形式。在一个方面,本文提供的核酸酶是dcas。在另一个方面,本文提供的位点特异性核酸酶是dcas。
156.在一个方面,本文提供的方法和组合物可以用于编辑真核细胞中的基因座。在一个方面,本文提供的真核细胞是多细胞真核生物体的一部分。在另一个方面,本文提供的真核细胞是单细胞生物体。在另一个方面,本文提供的真核细胞选自由动物细胞、植物细胞、真菌细胞和原生动物细胞组成的组。在一个方面,本文提供的动物细胞选自由以下组成的组:昆虫细胞、蛛形纲动物细胞、节肢动物细胞、甲壳动物细胞、轮虫细胞、刺胞动物细胞、扁形动物细胞、软体动物细胞、腹足动物细胞、线虫细胞、环节动物细胞、脊椎动物细胞、哺乳动物细胞、禽类细胞、鱼类细胞、爬行动物细胞和两栖动物细胞。在另一个方面,本文提供的植物细胞是单子叶植物细胞或双子叶植物细胞。在再另一个方面,本文提供的植物细胞是藻类细胞。在又另一个方面,本文提供的植物细胞选自由玉米细胞、小麦细胞、高粱细胞、油菜(canola)细胞、大豆细胞、苜蓿细胞、棉花细胞和水稻细胞组成的组。在再另一个方面,本文提供的植物细胞选自由以下组成的组:金合欢细胞、苜蓿细胞、莳萝细胞、苹果细胞、杏细胞、朝鲜蓟细胞、芝麻菜细胞、芦笋细胞、鳄梨细胞、香蕉细胞、大麦细胞、豆细胞、甜菜细胞、黑莓细胞、蓝莓细胞、西蓝花细胞、抱子甘蓝细胞(brussels sprout cell)、卷心菜细胞、油菜细胞、哈密瓜细胞、胡萝卜细胞、木薯细胞、花椰菜细胞、芹菜细胞、大白菜细胞、樱桃细
胞、香菜细胞、柑橘细胞、克莱门氏小柑橘细胞(clementine cell)、咖啡细胞、玉米细胞、棉花细胞、黄瓜细胞、花旗松细胞、茄子细胞、菊苣细胞、阔叶菊苣细胞、桉树细胞、茴香细胞、无花果细胞、林木细胞、葫芦细胞、葡萄细胞、葡萄柚细胞、蜜露细胞、豆薯细胞、猕猴桃细胞、生菜细胞、韭菜细胞、柠檬细胞、酸橙细胞、火炬松细胞(loblolly pine cell)、芒果细胞、枫树细胞、甜瓜细胞、蘑菇细胞、油桃细胞、坚果细胞、燕麦细胞、秋葵细胞、洋葱细胞、橙子细胞、观赏植物细胞、木瓜细胞、欧芹细胞、豌豆细胞、桃细胞、花生细胞、梨细胞、胡椒细胞、柿子细胞、松树细胞、菠萝细胞、车前草细胞、李子细胞、石榴细胞、杨树细胞、马铃薯细胞、南瓜细胞(pumpkin cell)、榅桲细胞、辐射松细胞、意大利菊苣细胞、萝卜细胞、芥菜籽细胞(rapeseed cell)、覆盆子细胞、水稻细胞、黑麦细胞、高粱细胞、南方松细胞(southern pine cell)、大豆细胞、菠菜细胞、南瓜细胞(squash cell)、草莓细胞、甜菜细胞、甘蔗细胞、向日葵细胞、甜玉米细胞、甘薯细胞、枫香树细胞、橘子细胞、茶细胞、烟草细胞、番茄细胞、草皮细胞、藤蔓细胞、西瓜细胞、小麦细胞、山药细胞和西葫芦细胞。在另一个方面,本文提供的植物细胞选自由玉米细胞、大豆细胞、油菜细胞、棉花细胞、小麦细胞和甘蔗细胞组成的组。
157.在再另一个方面,本文提供的工程化植物是藻类。在又另一个方面,本文提供的工程化植物或种子选自由玉米植物、小麦植物、高粱植物、油菜植物、大豆植物、苜蓿植物、棉花植物和水稻植物组成的组。在再另一个方面,本文提供的工程化植物或种子选自由以下组成的组:金合欢植物、苜蓿植物、莳萝植物、苹果植物、杏植物、朝鲜蓟植物、芝麻菜植物、芦笋植物、鳄梨植物、香蕉植物、大麦植物、豆植物、甜菜植物、黑莓植物、蓝莓植物、西蓝花植物、抱子甘蓝植物、卷心菜植物、油菜植物、哈密瓜植物、胡萝卜植物、木薯植物、花椰菜植物、芹菜植物、大白菜植物、樱桃植物、香菜植物、柑橘植物、克莱门氏小柑橘植物、咖啡植物、玉米植物、棉花植物、黄瓜植物、花旗松植物、茄子植物、菊苣植物、阔叶菊苣植物、桉树植物、茴香植物、无花果植物、林木植物、葫芦植物、葡萄植物、葡萄柚植物、蜜露植物、豆薯植物、猕猴桃植物、生菜植物、韭菜植物、柠檬植物、酸橙植物、火炬松植物、芒果植物、枫树植物、甜瓜植物、蘑菇植物、油桃植物、坚果植物、燕麦植物、秋葵植物、洋葱植物、橙子植物、观赏植物植物、木瓜植物、欧芹植物、豌豆植物、桃植物、花生植物、梨植物、胡椒植物、柿子植物、松树植物、菠萝植物、车前草植物、李子植物、石榴植物、杨树植物、马铃薯植物、南瓜植物(pumpkin plant)、榅桲植物、辐射松植物、意大利菊苣植物、萝卜植物、芥菜籽植物、覆盆子植物、水稻植物、黑麦植物、高粱植物、南方松植物、大豆植物、菠菜植物、南瓜植物(squash plant)、草莓植物、甜菜植物、甘蔗植物、向日葵植物、甜玉米植物、甘薯植物、枫香树植物、橘子植物、茶植物、烟草植物、番茄植物、草皮植物、藤蔓植物、西瓜植物、小麦植物、山药植物和西葫芦植物。在另一个方面,本文提供的植物选自由玉米植物、大豆植物、油菜植物、棉花植物、小麦植物和甘蔗植物组成的组。
158.在再另一个方面,本文提供的修饰的植物是藻类。在又另一个方面,本文提供的修饰的植物选自由玉米植物、小麦植物、高粱植物、油菜植物、大豆植物、苜蓿植物、棉花植物和水稻植物组成的组。在再另一个方面,本文提供的修饰的植物选自由以下组成的组:金合欢植物、苜蓿植物、莳萝植物、苹果植物、杏植物、朝鲜蓟植物、芝麻菜植物、芦笋植物、鳄梨植物、香蕉植物、大麦植物、豆植物、甜菜植物、黑莓植物、蓝莓植物、西蓝花植物、抱子甘蓝植物、卷心菜植物、油菜植物、哈密瓜植物、胡萝卜植物、木薯植物、花椰菜植物、芹菜植物、
大白菜植物、樱桃植物、香菜植物、柑橘植物、克莱门氏小柑橘植物、咖啡植物、玉米植物、棉花植物、黄瓜植物、花旗松植物、茄子植物、菊苣植物、阔叶菊苣植物、桉树植物、茴香植物、无花果植物、林木植物、葫芦植物、葡萄植物、葡萄柚植物、蜜露植物、豆薯植物、猕猴桃植物、生菜植物、韭菜植物、柠檬植物、酸橙植物、火炬松植物、芒果植物、枫树植物、甜瓜植物、蘑菇植物、油桃植物、坚果植物、燕麦植物、秋葵植物、洋葱植物、橙子植物、观赏植物植物、木瓜植物、欧芹植物、豌豆植物、桃植物、花生植物、梨植物、胡椒植物、柿子植物、松树植物、菠萝植物、车前草植物、李子植物、石榴植物、杨树植物、马铃薯植物、南瓜植物、榅桲植物、辐射松植物、意大利菊苣植物、萝卜植物、芥菜籽植物、覆盆子植物、水稻植物、黑麦植物、高粱植物、南方松植物、大豆植物、菠菜植物、南瓜植物、草莓植物、甜菜植物、甘蔗植物、向日葵植物、甜玉米植物、甘薯植物、枫香树植物、橘子植物、茶植物、烟草植物、番茄植物、草皮植物、藤蔓植物、西瓜植物、小麦植物、山药植物和西葫芦植物。
159.在又另一个方面,本文提供的修饰的种子选自由玉米种子、小麦种子、高粱种子、油菜种子、大豆种子、苜蓿种子、棉花种子和水稻种子组成的组。在再另一个方面,本文提供的修饰的种子选自由以下组成的组:金合欢种子、苜蓿种子、莳萝种子、苹果种子、杏种子、朝鲜蓟种子、芝麻菜种子、芦笋种子、鳄梨种子、香蕉种子、大麦种子、豆种子、甜菜种子、黑莓种子、蓝莓种子、西蓝花种子、抱子甘蓝种子、卷心菜种子、油菜种子、哈密瓜种子、胡萝卜种子、木薯种子、花椰菜种子、芹菜种子、大白菜种子、樱桃种子、香菜种子、柑橘种子、克莱门氏小柑橘种子、咖啡种子、玉米种子、棉花种子、黄瓜种子、花旗松种子、茄子种子、菊苣种子、阔叶菊苣种子、桉树种子、茴香种子、无花果种子、林木种子、葫芦种子、葡萄种子、葡萄柚种子、蜜露种子、豆薯种子、猕猴桃种子、生菜种子、韭菜种子、柠檬种子、酸橙种子、火炬松种子、芒果种子、枫树种子、甜瓜种子、蘑菇种子、油桃种子、坚果种子、燕麦种子、秋葵种子、洋葱种子、橙子种子、观赏种子种子、木瓜种子、欧芹种子、豌豆种子、桃种子、花生种子、梨种子、胡椒种子、柿子种子、松树种子、菠萝种子、车前草种子、李子种子、石榴种子、杨树种子、马铃薯种子、南瓜种子、榅桲种子、辐射松种子、意大利菊苣种子、萝卜种子、芥菜籽种子、覆盆子种子、水稻种子、黑麦种子、高粱种子、南方松种子、大豆种子、菠菜种子、南瓜种子、草莓种子、甜菜种子、甘蔗种子、向日葵种子、甜玉米种子、甘薯种子、枫香树种子、橘子种子、茶种子、烟草种子、番茄种子、草皮种子、藤蔓种子、西瓜种子、小麦种子、山药种子和西葫芦种子。
160.在再另一个方面,本文提供的修饰的染色体是藻类。在又另一个方面,本文提供的修饰的染色体选自由玉米染色体、小麦染色体、高粱染色体、油菜染色体、大豆染色体、苜蓿染色体、棉花染色体和水稻染色体组成的组。在再另一个方面,本文提供的修饰的染色体选自由以下组成的组:金合欢染色体、苜蓿染色体、莳萝染色体、苹果染色体、杏染色体、朝鲜蓟染色体、芝麻菜染色体、芦笋染色体、鳄梨染色体、香蕉染色体、大麦染色体、豆染色体、甜菜染色体、黑莓染色体、蓝莓染色体、西蓝花染色体、抱子甘蓝染色体、卷心菜染色体、油菜染色体、哈密瓜染色体、胡萝卜染色体、木薯染色体、花椰菜染色体、芹菜染色体、大白菜染色体、樱桃染色体、香菜染色体、柑橘染色体、克莱门氏小柑橘染色体、咖啡染色体、玉米染色体、棉花染色体、黄瓜染色体、花旗松染色体、茄子染色体、菊苣染色体、阔叶菊苣染色体、桉树染色体、茴香染色体、无花果染色体、林木染色体、葫芦染色体、葡萄染色体、葡萄柚染色体、蜜露染色体、豆薯染色体、猕猴桃染色体、生菜染色体、韭菜染色体、柠檬染色体、酸橙
染色体、火炬松染色体、芒果染色体、枫树染色体、甜瓜染色体、蘑菇染色体、油桃染色体、坚果染色体、燕麦染色体、秋葵染色体、洋葱染色体、橙子染色体、观赏染色体染色体、木瓜染色体、欧芹染色体、豌豆染色体、桃染色体、花生染色体、梨染色体、胡椒染色体、柿子染色体、松树染色体、菠萝染色体、车前草染色体、李子染色体、石榴染色体、杨树染色体、马铃薯染色体、南瓜染色体、榅桲染色体、辐射松染色体、意大利菊苣染色体、萝卜染色体、芥菜籽染色体、覆盆子染色体、水稻染色体、黑麦染色体、高粱染色体、南方松染色体、大豆染色体、菠菜染色体、南瓜染色体、草莓染色体、甜菜染色体、甘蔗染色体、向日葵染色体、甜玉米染色体、甘薯染色体、枫香树染色体、橘子染色体、茶染色体、烟草染色体、番茄染色体、草皮染色体、藤蔓染色体、西瓜染色体、小麦染色体、山药染色体和西葫芦染色体。
161.在一个方面,本文提供的细胞是修饰的细胞。在另一个方面,本文提供的植物是修饰的植物。在又另一个方面,本文提供的植物细胞是修饰的植物细胞。在再另一个方面,本文提供的种子是修饰的种子。在一个另外的方面,本文提供的染色体是修饰的染色体。
162.根据一个方面,本文提供的修饰的植物、植物细胞、细胞、种子或染色体包含通过靶向编辑技术产生的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个缺失。根据一个方面,本文提供的修饰的植物、植物细胞、细胞、种子或染色体包含通过靶向编辑技术产生的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个插入。根据一个方面,本文提供的修饰的植物、植物细胞、细胞、种子或染色体包含通过靶向编辑技术产生的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个倒位。根据一个方面,本文提供的修饰的植物、植物细胞、细胞、种子或染色体包含通过靶向编辑技术产生的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个缺失;通过靶向编辑技术产生的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个插入;通过靶向编辑技术产生的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个倒位;或其任何组合。在再另一个方面,本文提供的修饰的植物、植物细胞、细胞、种子或染色体包含通过靶向编辑技术产生的至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种显性负等位基因。在再另一个方面,本文提供的修饰的植物、植物细胞、细胞、种子或染色体包含通过靶向编辑技术产生的至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种显性正等位基因。在再另一个方面,本文提供的经修饰的植物、植物细胞、细胞、种子或染色体包含通过靶向编辑技术产生的至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种显性负等位基因;通过靶向编辑技术产生的至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种显性正等位基因;或其任何组合。
163.根据本技术的另一个方面,提供修饰的植物、植物细胞、种子、染色体和植物部分,其在其至少一种植物细胞的基因组中包含基因组编辑事件,所述基因组编辑事件包含被靶向基因座的插入、缺失、取代或倒位。
164.根据一个方面,本公开提供一种通过本文提供的任一种方法产生的修饰的植物细
胞。在另一个方面,本公开提供一种通过本文提供的任一种方法产生的修饰的染色体。在再另一个方面,本公开提供一种包含本文提供的修饰的染色体的修饰的细胞。在再一个另外的方面,本公开提供一种由本文提供的修饰的细胞再生的修饰的植物或修饰的植物组织。在再另一个方面,本公开提供一种包含本文提供的修饰的染色体的产品。在一个方面,本公开提供一种包含本文提供的修饰的细胞的产品。如本文所用,“产品”是指意图供人类使用、人类消费、动物使用或动物消费的任何制品或物质,其包括包含本文提供的修饰的细胞或修饰的染色体的任何组分、部分或附件。
165.本文提供的方法和组合物能够编辑基因组中的任何基因座。本文还提供通过使用本文提供的方法和组合物编辑的染色体。在一个方面,本文提供的基因组是核基因组、线粒体基因组或质体基因组。在另一个方面,本文提供的质体基因组包含叶绿体基因组。在一个方面,本文提供的方法在染色体上产生双链断裂。在一个方面,本文提供的染色体是核染色体、线粒体染色体或叶绿体染色体。在另一个方面,本文提供的染色体是超数染色体或人工染色体。超数或b染色体是细胞中除染色体的正常二倍体补体之外见到的额外染色体。超数染色体是可有可无的,并且不是细胞或生物体正常发育所必需的。在一个方面,本文提供的超数染色体是玉米超数染色体或黑麦超数染色体。
166.本文公开的靶向编辑的方法可以涉及目标细胞(例如,植物细胞)的瞬时转染或稳定转化。根据本技术的一个方面,提供用包含可操作地连接到启动子的可转录dna序列或转基因的重组dna分子或构建体转化细胞、组织或外植体以产生转基因或基因组编辑细胞的方法。根据本技术的另一个方面,提供用包含可操作地连接到植物可表达启动子的可转录dna序列或转基因的重组dna分子或构建体转化植物细胞、组织或外植体以产生转基因或基因组编辑植物或植物细胞的方法。如本文所用,“转基因”是指已通过本领域已知的任何方法转移到基因组中的多核苷酸。
167.用重组dna分子或构建体转化植物细胞中的染色体或质体的许多方法是本领域已知的,所述方法可以根据本技术的方法使用以产生转基因植物细胞和植物。本领域已知的任何合适的用于转化植物细胞的方法或技术都可以根据本发明的方法使用。用于转化植物的有效方法包括细菌介导的转化,诸如农杆菌介导的或根瘤菌介导的转化,和微弹轰击(microprojectile bombardment)介导的转化。用于经由细菌介导的转化或微弹轰击用转化载体转化外植体,然后对这些外植体进行培养等以使转基因植物再生或发育的各种方法是本领域已知的。用于植物转化的其他方法,诸如显微注射、电穿孔、真空渗入、加压、声波处理、碳化硅纤维搅拌、peg介导的转化等,也是本领域已知的。根据所用的方法和外植体,通过这些转化方法产生的转基因植物对于转化事件可以是嵌合的或非嵌合的。
168.转化植物细胞的方法是本领域普通技术人员众所周知的。例如,通过用重组dna包被的粒子进行微弹轰击来转化植物细胞的具体说明在美国专利号5,550,318;5,538,880;6,160,208;6,399,861;和6,153,812中找到,并且农杆菌介导的转化描述于美国专利号5,159,135;5,824,877;5,591,616;6,384,301;5,750,871;5,463,174;和5,188,958中,所有这些文献都以引用的方式并入本文。用于转化植物的额外方法可以在例如compendium of transgenic crop plants(2009)blackwell publishing中找到。本领域技术人员已知的任何适当的方法都可以用于用本文提供的任何核酸分子转化植物细胞。
169.用于转化的受体细胞或外植体靶包括但不限于种子细胞、果实细胞、叶细胞、子叶
细胞、下胚轴细胞、分生组织细胞、胚细胞、胚乳细胞、根细胞、嫩芽细胞、茎细胞、荚细胞、花细胞、花序细胞、柄细胞、花梗细胞、花柱细胞、柱头细胞、花托细胞、花瓣细胞、萼片细胞、花粉细胞、花药细胞、花丝细胞、子房细胞、胚珠细胞、果皮细胞、韧皮部细胞、芽细胞或维管组织细胞。在另一个方面,本公开提供一种植物叶绿体。在一个另外的方面,本公开提供表皮细胞、气孔细胞、毛状体细胞、根毛细胞、贮藏根细胞或块茎细胞。在另一个方面,本公开提供一种原生质体。在另一个方面,本公开提供一种植物愈伤组织细胞。任何可以从中再生可育植物的细胞都被认为是用于实施本发明的有用受体细胞。愈伤组织可以从包括但不限于未成熟胚或胚的部分、幼苗顶端分生组织、小孢子等的各种组织来源起始。那些能够增殖为愈伤组织的细胞可以充当用于转化的受体细胞。用于制备本公开的转基因植物的实用转化方法和材料(例如,各种培养基和受体靶细胞、未成熟胚的转化和可育转基因植物的随后再生)公开于例如美国专利6,194,636和6,232,526以及美国专利申请公开2004/0216189中,所有这些文献都以引用的方式并入本文。可以对转化的外植体、细胞或组织进行如本领域已知的额外培养步骤,诸如愈伤组织诱导、选择、再生等。含有重组dna插入的转化的细胞、组织或外植体可以根据本领域已知的方法在培养物、塞子或土壤中生长、发育或再生为转基因植物。在一个方面,本公开提供不是繁殖材料并且不介导植物的自然繁殖的植物细胞。在另一个方面,本公开还提供是繁殖材料且介导植物的自然繁殖的植物细胞。在另一个方面,本公开提供不能经由光合作用维持自身的植物细胞。在另一个方面,本公开提供植物体细胞。与生殖细胞相反,体细胞不介导植物繁殖。在一个方面中,本公开提供一种非繁殖植物细胞。
170.可以使修饰的植物进一步与它们自身或其他植物杂交以产生修饰的种子和子代。修饰的植物也可以通过使包含重组dna序列插入的第一植物与缺乏所述插入的第二植物杂交来制备。例如,可以将重组dna序列引入适于转化的第一株系中,然后可以使第一株系与第二株系杂交以使重组dna序列渗入第二株系中。修饰的植物也可以通过使修饰的植物与未修饰的植物杂交来制备。这些杂交的子代可以进一步多次回交成更期望的品系,诸如经过6至8代或回交,以产生具有与原始亲本品系基本上相同的基因型但引入了重组dna构建体或修饰序列的子代植物。
171.本文提供的修饰的植物、细胞或外植体可以是优良品种或优良品系。优良品种或优良品系是指由育种和针对优异的农艺性状表现进行选择所产生的任何品种。本文提供的修饰的植物、细胞或外植体可以是杂交植物、细胞或外植体。如本文所用,“杂交体”通过使来自不同品种、品系或物种的两种植物杂交,使得子代包含来自每个亲本的遗传物质而产生的。本领域技术人员认识到,也可以产生更高阶的杂交体。例如,可以通过使品种c与品种d杂交以产生c x d杂交体来制备第一杂交体,并且可以通过使品种e与品种f杂交以产生e x f杂交体来制备第二杂交体。可以使第一杂交体和第二杂交体进一步杂交以产生包含来自所有四个亲本品种的遗传信息的更高阶杂交体(c x d)x(e x f)。本文提供的修饰的植物是可育的。本文提供的修饰的植物是雄性或雌性不育修饰植物,其在没有人为干预的情况下不能繁殖。在一个方面,本文提供的修饰的植物经由无性或营养繁殖进行繁殖。在再另一个方面,本文提供的修饰的植物经由有性繁殖来繁殖。
172.本技术的重组dna分子或构建体可以包含或包括在用于转化靶植物细胞、组织或外植体的dna转化载体内。本技术的这种转化载体通常可以包含对于有效转化必需或有益
的序列或元件,以及至少一种选择标志基因、编码一种或多种位点特异性核酸酶的至少一种表达盒和/或可转录dna序列,和任选地一种或多种sgrna或crrna。对于农杆菌介导的转化,转化载体可以包含具有侧接至少可转录dna序列或转基因的两个边界序列:左边界(lb)和右边界(rb)的工程化转移dna(或t-dna)区段或区域,使得t-dna插入植物基因组将产生可转录dna序列、转基因或表达盒的转化事件。换句话说,转基因,编码位点特异性核酸酶的可转录dna序列、转基因或表达盒,和/或sgrna或crrna可能与额外转基因或表达盒如植物选择标志转基因和/或能够对植物赋予农学目标的性状或表型的农学目标的其他基因一起位于t-dna的左右边界之间。根据一个替代方面,编码至少一种位点特异性核酸酶的可转录dna序列、转基因或表达盒,任何必需的sgrna或crrna,以及植物选择标志转基因(或农学目标的其他基因)可以存在于相同或不同重组dna分子上的分开的t-dna区段中,诸如用于共转化。转化载体或构建体还可以包含原核维持元件,对于农杆菌介导的转化,其可以位于t-dna区域外的载体骨架中。
173.由于存在选择剂如抗生素或除草剂,本技术的转化载体或构建体中的植物选择标志转基因可以用于辅助选择转化的细胞或组织,其中所述植物选择标志转基因提供对选择剂的耐受性或抗性。因此,选择剂可以偏向或有利于表达植物选择标志基因的转化的细胞的存活、发育、生长、增殖等,诸如增加r0植物中转化的细胞或组织的比例。常用的植物选择标志基因包括,例如,赋予对抗生素如卡那霉素和巴龙霉素(paromomycin)(nptii)、潮霉素b(aph iv)、链霉素或壮观霉素(aada)和庆大霉素(aac3和aacc4)的耐受性或抗性的那些,或赋予对除草剂如草铵膦(glufosinate)(bar或pat)、麦草畏(dicamba)(dmo)和草甘膦(glyphosate)(aroa或cp4-epsps)的耐受性或抗性的那些。也可以使用植物筛选标志基因,其提供视觉筛选转化体的能力,诸如荧光素酶或绿色荧光蛋白(gfp),或表达β葡糖醛酸糖苷酶的基因或uida基因(gus),已知其多种生色底物。在一个方面,本文提供的载体或多核苷酸包含选自由nptii、aph iv、aada、aac3、aacc4、bar、pat、dmo、epsps、aroa、gfp和gus组成的组的至少一种标志基因。
174.根据本技术的一个方面,用重组dna分子或构建体转化植物细胞、组织或外植体的方法还可以包括使用位点特异性核酸酶的定点或靶向整合。根据这些方法,可以将重组dna供体分子的一部分(即,插入序列)插入或整合到基因组内的所期望位点或基因座处。供体模板的插入序列可以包含转基因或构建体,诸如设计的元件或组织特异性启动子。供体分子还可以具有侧接插入序列的一个或两个同源臂以通过同源重组和/或同源定向的修复促进靶向插入事件。因此,本技术的重组dna分子还可以包括供体模板,所述供体模板用于将转基因或构建体(诸如转基因或编码设计的元件或组织特异性启动子的可转录dna序列)定点或靶向整合到基因组中。
175.如本文所用,核酸序列或分子的“部分”是指小于核酸序列全长的任何数目的核苷酸。例如,100个核苷酸的核酸序列的一部分可以是1至99个核苷酸的任何数目的核苷酸。或者,核酸序列的“部分”是指给定核酸序列全长的0.01%至99.99%的任何地方。
176.本文提供使用靶向编辑技术产生基因区域的显性等位基因的方法。本文还提供通过这样的方法产生的细胞和在这样的方法中使用的组合物。本说明书还提供从经历本文提供的方法的细胞再生的修饰的植物。在一个方面,本文提供的显性负等位基因能够阻抑处于杂合状态的基因座或基因的转录。在另一个方面,本文提供的显性负等位基因能够阻抑
处于纯合状态的基因座或基因的转录。
177.基因区域的显性负等位基因可以降低或消除处于杂合状态的基因区域产物的功能。非限制性地,显性负等位基因可以通过编辑基因区域的等位基因产生,使得编码所述基因区域的多核苷酸的至少一部分以倒位取向(例如,基因的一部分翻转到3'至5’取向,而基因的其余部分保持处于5'至3’取向)。基因区域的经编辑的等位基因的表达将包含与由未编辑的基因区域表达的有义rna互补的反义rna区段。不受任何科学理论的约束,在基因区域rna的有义部分和反义部分之间的互补区段可以通过细胞天然的rna沉默机制加工,以显性负方式降低编辑的基因区域等位基因和未编辑的基因区域等位基因的表达。在一个方面,本文提供的反义rna转录物能够阻抑互补有义rna转录物。在另一个方面,本文提供的反义rna转录物阻抑互补有义rna转录物。
178.在一个方面,本公开提供一种在细胞中产生基因的显性负等位基因的方法,其包括使用靶向编辑技术使所述基因的一部分倒位,产生能够触发未修饰的等位基因的阻抑的反义rna转录物。在一个方面,与不包含反义rna转录物的对照细胞相比,未修饰的等位基因的表达降低。在另一个方面,本文提供的靶向编辑技术包括使用至少一种位点特异性核酸酶。在一个方面,本文提供的反义rna转录物是部分反义rna转录物。在另一个方面,本文提供的反义rna转录物是完全反义rna转录物。非限制性地,部分反义rna转录物可以通过仅使基因的一个区域倒位而不是将整个基因倒位而产生。例如,如果mrna转录物由三个外显子编码,则仅将第二外显子倒位将能够实现部分反义rna转录物的产生。应理解,将小于整个基因区域长度的基因区域的任何数目的核苷酸反向可以产生部分反义rna转录物。例如,如果基因区域包含500个核苷酸,则将200个核苷酸区域倒位将产生部分反义rna转录物。如果所有500个核苷酸都被倒位,则将产生完全反义rna转录物。在一个方面,本文提供的反义rna转录物能够阻抑互补核酸序列的表达。在一个方面,本文提供的反义rna转录物能够阻抑至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种基因的表达。在一个方面,本文提供的反义rna转录物能够阻抑第一基因区域的表达。在一个方面,本文提供的反义rna转录物能够阻抑由互补核酸序列编码的蛋白质的表达。本领域技术人员将认识到,在反义rna转录物和第二核酸之间的100%互补性不是诱导第二核酸的阻抑表达所必需的。例如,包含与第二核酸序列具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%互补性的反义rna转录物能够阻抑第二核酸序列的表达。
179.在一个方面,由本文提供的显性负等位基因转录的反义rna转录物能够下调其自身的表达。在另一个方面,由本文提供的显性负等位基因转录的反义rna转录物能够下调同一基因座的未修饰的等位基因的表达。在一个方面,与不包含反义rna转录物的对照细胞相比,未修饰的等位基因的表达降低。
180.在一个方面,本公开提供一种在一种或多种细胞中产生基因的显性负等位基因的方法,其包括:a)诱导侧接所述基因的被靶向区域的第一双链断裂和第二双链断裂;b)鉴定包含所述基因的被靶向区域的倒位的一种或多种细胞,其中所述倒位导致由所述基因的被靶向区域产生反义rna转录物;和c)选择包含所述基因的被靶向区域的倒位的一种或多种
细胞。
181.在另一个方面,本公开提供一种降低细胞中蛋白质的表达的方法,其包括:a)诱导侧接染色体的被靶向区域的第一双链断裂和第二双链断裂;和b)鉴定在所述染色体的被靶向区域中包含倒位的一种或多种细胞,其中与在所述被靶向区域中不包含倒位的对照细胞相比,所述蛋白质的表达降低。
182.在一个另外的方面,本公开提供一种在基因的被靶向区域中产生倒位的方法,其包括:a)向一种或多种细胞提供至少一种rna引导核酸酶或编码rna引导核酸酶的一种或多种载体,其中所述至少一种rna引导核酸酶能够结合到侧接所述基因的被靶向区域的第一靶位点和第二靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述第一靶位点和所述第二靶位点是连接的,其中所述至少一种rna引导核酸酶在所述基因中在所述第一靶位点和所述第二靶位点处产生双链断裂;b)鉴定在所述基因的被靶向区域中包含倒位的一种或多种细胞,其中所述倒位导致由所述被靶向区域产生反义rna转录物;和c)选择在所述基因的被靶向区域中包含所述倒位的一种或多种细胞。
183.在一个方面,本文提供的方法或组合物包含至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种位点特异性核酸酶。在另一个方面,本文提供的方法或组合物包含至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种sgrna。在一个另外的方面,本文提供的方法或组合物包含至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种tgoligo。在另一个方面,本文提供的方法或组合物包含至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种供体分子。在另一个方面,本文提供的方法或组合物包含至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种供体序列。
184.在另一个方面,本文提供的方法或组合物包含编码至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种位点特异性核酸酶的至少一种、至少两种、至少三种、至少四种、至少六种、至少七种、至少八种、至少九种或至少十种载体。在另一个方面,本文提供的方法或组合物包含编码至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种sgrna的至少一种、至少两种、至少三种、至少四种、至少六种、至少七种、至少八种、至少九种或至少十种载体。在另一个方面,本文提供的方法或组合物包含编码至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种tgoligo的至少一种、至少两种、至少三种、至少四种、至少六种、至少七种、至少八种、至少九种或至少十种载体。在另一个方面,本文提供的方法或组合物包含编码至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种供体分子的至少一种、至少两种、至少三种、至少四种、至少六种、至少七种、至少八种、至少九种或至少十种载体。在另一个方面,本文提供的方法或组合物包含编码至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种供体序列的至少一种、至少两种、至少三种、至少四种、至少六种、至少七种、至少八种、至少九
种或至少十种载体。
185.在一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种位点特异性核酸酶。在一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种rna引导核酸酶。在另一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种sgrna。在一个方面,本文提供的方法或组合物包含一种或多种载体,所述载体包含第一sgrna和第二sgrna。在一个另外的方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种供体分子。
186.在一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种位点特异性核酸酶和至少一种、至少两种、至少三种、至少四种或至少五种sgrna。在另一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种rna引导核酸酶和至少一种、至少两种、至少三种、至少四种或至少五种sgrna。在一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种sgrna和至少一种、至少两种、至少三种、至少四种或至少五种供体分子。
187.在另一个方面,本文提供的载体编码至少一种rna引导核酸酶、第一sgrna和第二sgrna。在一个另外的方面,至少一种rna引导核酸酶、第一sgrna和第二sgrna由两种或更多种或三种或更多种载体编码。在另一个方面,本文提供的载体编码至少一种rna引导核酸酶、sgrna和供体分子。在一个另外的方面,至少一种rna引导核酸酶、sgrna和供体分子由两种或更多种或三种或更多种载体编码。
188.在另一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种位点特异性核酸酶和至少一种、至少两种、至少三种、至少四种或至少五种供体分子。在一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种rna引导核酸酶和至少一种、至少两种、至少三种、至少四种或至少五种供体分子。在另一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种位点特异性核酸酶,至少一种、至少两种、至少三种、至少四种或至少五种sgrna,和至少一种、至少两种、至少三种、至少四种或至少五种供体分子。在另一个方面,本文提供的载体编码至少一种、至少两种、至少三种、至少四种或至少五种rna引导核酸酶,至少一种、至少两种、至少三种、至少四种或至少五种sgrna,和至少一种、至少两种、至少三种、至少四种或至少五种供体分子。在另一个方面,本文提供的载体编码至少一种位点特异性核酸酶、至少一种供体分子和至少一种sgrna。在另一个方面,本文提供的载体编码至少一种rna引导核酸酶、至少一种供体分子和至少一种sgrna。
189.在一个方面,本文提供的一种或多种位点特异性核酸酶、一种或多种sgrna和一种或多种供体分子由一种载体编码。在一个方面,本文提供的一种或多种位点特异性核酸酶、一种或多种sgrna和一种或多种供体分子由两种或更多种或三种或更多种载体编码。在再另一个方面,本文提供的一种或多种sgrna和一种或多种供体分子由两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种或十种或更多种载体编码。在一个方面,至少一种rna引导核酸酶、第一sgrna和第二sgrna由一种载体编码。在另一个方面,至少一种rna引导核酸酶、第一sgrna和第二sgrna由两种或更多种或三种或更多种载体编码。在一个方面,至少一种位点特异性核酸酶、第一sgrna和第二sgrna由一种载体编码。在另一个方面,至少一种位点特异性核酸酶、第一
sgrna和第二sgrna由两种或更多种或三种或更多种载体编码。在一个方面,至少一种rna引导核酸酶、至少一种sgrna和至少一种供体分子由一种载体编码。在一个方面,至少一种rna引导核酸酶、至少一种sgrna和至少一种供体分子由两种或更多种或三种或更多种载体编码。在一个方面,至少一种位点特异性核酸酶、至少一种sgrna和至少一种供体分子由一种载体编码。在一个方面,至少一种位点特异性核酸酶、至少一种sgrna和至少一种供体分子由两种或更多种或三种或更多种载体编码。
190.在一个方面,本文提供的一种或多种cas9核酸酶、一种或多种sgrna和一种或多种供体分子由一种载体编码。在一个方面,本文提供的一种或多种cas9核酸酶、一种或多种sgrna和一种或多种供体分子由两种或更多种或三种或更多种载体编码。在一个方面,至少一种cas9核酸酶、第一sgrna和第二sgrna由一种载体编码。在另一个方面,至少一种cas9核酸酶、第一sgrna和第二sgrna由两种或更多种或三种或更多种载体编码。在一个方面,至少一种cas9核酸酶、至少一种sgrna和至少一种供体分子由一种载体编码。在一个方面,至少一种cas9核酸酶、至少一种sgrna和至少一种供体分子由两种或更多种或三种或更多种载体编码。
191.在再另一个方面,本文所述的任何载体进一步编码至少一种、至少两种、至少三种、至少四种或至少五种标志基因。在一个方面,本文提供的标志基因选自由nptii、aph iv、aada、aac3、aacc4、bar、pat、dmo、epsps、aroa、gfp和gus组成的组。
192.可以使用靶向编辑技术以将基因组基因座转化成当编辑的基因座被转录成rna时能够产生rnai诱导发夹的基因座。在目标基因座处杂合的细胞中(例如,存在两种多态性等位基因),使用两种或更多种核酸酶以在第一等位基因中产生两个双链断裂(例如,第一双链断裂和第二双链断裂)并且在第二等位基因中产生一个双链断裂(例如,第三双链断裂)。当核酸酶切割等位基因时,侧接有第一双链断裂和第二双链断裂的第一等位基因的部分从基因组dna释放。在一种结果中,将第一等位基因的释放部分倒位并整合到第二等位基因中的第三双链断裂中,由此产生编辑的基因座,当所述编辑的基因座被转录时,其能够产生rnai诱导发夹。
193.本公开提供一种方法,其包括:a)使用靶向编辑技术在细胞中在基因的第一等位基因中产生第一双链断裂和第二双链断裂;使用靶向编辑技术在所述细胞中在所述基因的第二等位基因中产生第三双链断裂;和c)鉴定在所述第二等位基因中在所述第三双链断裂位点处包含以倒位取向的所述第一等位基因的区域的插入的细胞,由此产生修饰的第二等位基因。在一个方面,修饰的第二等位基因是显性负等位基因。在另一个方面,修饰的第二等位基因是显性正等位基因。在一个方面,第一双链断裂和第二双链断裂在第一等位基因和第二等位基因中的相同核苷酸序列或相同核苷酸位置。在一个方面,第一双链断裂和第二双链断裂在第一等位基因和第二等位基因中在相同的核苷酸序列处。在一个方面,第一双链断裂和第二双链断裂在第一等位基因和第二等位基因中的相同核苷酸位置。在一个方面,第一等位基因的核苷酸序列与第二等位基因的核苷酸序列不相同(例如,细胞对于基因座是杂合的)。在一个方面,在第二等位基因中在第三双链断裂位点处的核苷酸序列不存在于第一等位基因中。在一个方面,本文提供的修饰的第二等位基因转录能够形成发夹环二级结构的rna。在一个方面,第一等位基因的区域可以包含任何数目的核苷酸,直到且包括第一等位基因的全长。在一个方面,第一等位基因的区域包含至少10个、至少15个、至少16
个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少34个、至少35个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个、至少5000个或至少10,000个核苷酸。在另一个方面,第一等位基因的区域包含18至5000、18至4000、18至3000、18至2000、18至1000、18至500、18至400、18至300、18至200、18至100、18至50、18至30、50至500、50至1000、100至500、100至1000或500至5000个核苷酸。
194.在一个方面,本公开提供一种修饰的细胞,其包含通过靶向编辑技术产生的至少一种基因的至少一种显性负等位基因,其中所述等位基因产生当所述至少一种显性负等位基因被转录时能够形成发夹环二级结构的rna转录物。
195.本公开提供一种在细胞中产生基因的显性负等位基因的方法,其包括使用靶向编辑技术邻近所述基因的天然拷贝插入所述基因或其一部分的倒位拷贝,以产生能够产生所述基因或其一部分的反义rna转录物的倒位重复序列。在一个方面,倒位重复序列能够形成发夹环二级结构。在另一个方面,显性负等位基因产生能够形成发夹环二级结构的至少一种rna转录物。在一个方面,基因的倒位拷贝和基因的天然拷贝被间隔区序列分开。在一个方面,间隔区序列包含至少1个、至少2个、至少3个、至少4个、至少5个、至少10个、至少25个、至少50个、至少75个、至少100个、至少150个、至少250个、至少500个或至少1000个核苷酸。在又另一个方面,显性负等位基因与基因的天然拷贝的启动子可操作地连接。
196.在另一个方面,本公开提供一种修饰的细胞,其包含至少一种基因的显性负等位基因,所述显性负等位基因在所述基因的内源基因座处邻近所述基因的天然拷贝包含所述基因的倒位拷贝。
197.显性负等位基因也可以通过编辑基因组以缺失第一基因区域和第二相邻基因区域之间的dna区域而产生,其中第一基因区域和第二基因区域以相反取向存在于染色体上(例如,第一基因区域以5'至3’取向存在,而第二基因区域以3'至5’取向存在于染色体的相同dna链上)。不受任何科学理论的约束,这种缺失允许通过第二基因区域的启动子表达第一基因区域的反义rna转录物,而第一基因区域的天然启动子表达有义rna转录物。有义rna转录物和反义rna转录物彼此互补,并且可以通过细胞天然的rna沉默机制加工,以显性负方式降低编辑的第一基因区域等位基因和未编辑的第一基因区域等位基因的表达。不受任何科学理论的约束,还预期从内源基因或基因座的突变或编辑的等位基因转录的反义rna分子可以通过不同的机制影响基因的表达水平,所述机制例如无义介导的衰变、不终止衰变、不进行衰变、dna或组蛋白甲基化或其他表观遗传改变、转录和/或翻译的抑制或效率降低、核糖体干扰、干扰mrna加工或剪接和/或经由蛋白酶体的泛素介导的蛋白质降解。参见,例如nickless,a.等,“control of gene expression through the nonsense-mediated rna decay pathway”,cell biosci 7:26(2017);karamyshev,a.等,“lost in translation:ribosome-associated mrna and protein quality controls”,frontiers in genetics 9:431(2018);inada,t.,“quality controls induced by aberrant translation”,nucleic acids res 48:3(2020);以及szadeczky-kardoss,i.等,“the nonstop decay and the rna silencing systems operate cooperatively in plants”,
nucleic acids res 46:9(2018),其全部内容和公开内容以引用的方式并入本文。这些不同机制中的每一种都可以作为rna干扰(rnai)、转录基因沉默(pgs)和/或转录后基因沉默(ptgs)机制的替代或补充而起作用。参见,例如wilson,r.c.等,“molecular mechanisms of rna interference”,annu rev biophysics 42:217-39(2013);以及guo,q.等,“rna silencing in plants:mechanism,technologies and applications in horticulture crops”,current genomics 17:476-489(2016),其全部内容和公开内容以引用的方式并入本文。上述机制中的一些可以降低编辑的等位基因本身的表达,而其他机制还可以降低内源基因座或基因的其他拷贝或等位基因的表达。对基因的这样的显性或半显性作用可以通过非规范阻抑机制起作用,所述非规范阻抑机制不涉及rnai和/或显著或可检测水平的靶向小rna的形成。
198.在一个方面,本公开提供一种在细胞中产生基因的显性负等位基因的方法,其包括使用靶向编辑技术缺失染色体在第一基因区域与第二基因区域之间的部分,其中在所述染色体的所述部分缺失之后产生所述第一基因区域的反义rna转录物。在另一个方面,本文提供的靶向编辑技术包括使用至少一种位点特异性核酸酶。在一个方面,本文提供的反义rna转录物是部分反义rna转录物。在一个方面,部分反义rna转录物比对应的有义rna转录物短。在一个方面,部分反义rna转录物比对应的有义rna转录物短至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少1500个、至少2000个或至少2500个核苷酸。在另一个方面,部分反义rna转录物比对应的有义rna转录物短至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%。在另一个方面,本文提供的反义rna转录物是完全反义rna转录物。在一个方面,完全反义rna转录物与对应的有义rna转录物长度相同。在一个方面,本文提供的反义rna转录物阻抑第一基因区域的表达。在一个方面,本文提供的反义rna转录物能够阻抑第一基因区域的表达。
199.在另一个方面,本公开提供一种方法,其包括:a)鉴定包含第一基因区域和第二基因区域的染色体区域,所述第一基因区域包含第一启动子和第一编码区域,所述第二基因区域包含第二启动子和第二编码区域,其中所述第一编码区域和所述第二编码区域由间插区域分开,并且其中所述第一启动子和所述第二启动子以相反取向定位;b)诱导侧接被靶向区域的第一双链断裂和第二双链断裂;c)鉴定包含所述染色体的被靶向区域的缺失的一种或多种细胞;和d)选择包含所述染色体的被靶向区域的所述缺失的一种或多种细胞。
200.如本文所用,“间插区域”或“间插序列”是指物理连接的第一多核苷酸序列和第二多核苷酸序列之间的多核苷酸序列。在一个方面,间插区域或间插序列在第一基因和第二基因之间。在一个方面,间插区域或间插序列在第一基因区域和第二基因区域之间。在一个方面,间插区域或间插序列在第一编码区域和第二编码区域之间。在另一个方面,间插区域或间插序列在第一靶位点和第二靶位点之间。在一个方面,间插区域或间插序列在第一靶基因和第二靶基因之间。在一个方面,间插区域或间插序列的全部或部分经由靶向编辑技术倒位。在另一个方面,间插区域或间插序列的全部或部分经由靶向编辑技术缺失。在一个
方面,间插区域或间插序列包含至少1个、至少2个、至少3个、至少4个、至少5个、至少10个、至少25个、至少50个、至少100个、至少150个、至少200个、至少250个、至少500个、至少1000个、至少1250个、至少1500个、至少1750个、至少2000个、至少2500个、至少3000个、至少4000个、至少5000个、至少6000个、至少7000个、至少8000个、至少9000个、至少10,000个、至少15,000个、至少20,000个、至少25,000个或至少50,000个核苷酸。在一个方面,间插区域或间插序列包含至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种基因。在一个方面,间插区域或间插序列定位在染色体上。在一个方面,间插区域或间插序列定位在载体上。在一个方面,间插区域或间插序列包含dna序列。在一个方面,间插区域或间插序列包含rna序列。在一个方面,间插区域或间插序列包含内源核酸序列。在另一个方面,间插区域或间插序列包含转基因核酸序列。在一个方面,间插区域或间插序列包含内源核酸序列和转基因核酸序列。
201.在一个方面,第一基因区域选自由ga20氧化酶基因区域、ga3氧化酶基因区域、短枝(brachytic)2基因区域和y1基因区域组成的组。在另一个方面,第一基因区域是ga20氧化酶基因区域或ga3氧化酶基因区域。在一个另外的方面,第一基因区域是ga20氧化酶基因区域。在一个方面,第一基因区域是ga3氧化酶基因区域。在再另一个方面,第一基因区域是短枝2基因区域。在另一个方面,第一基因区域是y1基因区域。
202.谷类植物中的ga氧化酶由相关ga氧化酶基因的家族组成。例如,玉米具有至少九种ga20氧化酶基因的家族,所述家族包括ga20氧化酶_1、ga20氧化酶_2、ga20氧化酶_3、ga20氧化酶_4、ga20氧化酶_5、ga20氧化酶_6、ga20氧化酶_7、ga20氧化酶_8和ga20氧化酶_9。ga20氧化酶_3和ga20氧化酶_5中的每一种的以seq id no表示的dna和蛋白质序列提供于表1中。
203.表1.通过序列标识符识别玉米中的ga20氧化酶_3基因和ga20氧化酶_5基因的dna和蛋白质序列。
[0204][0205]
来自参考基因组的ga20氧化酶_3基因座的野生型基因组dna序列提供在seq id no:27中,且来自参考基因组的ga20氧化酶_5基因座的野生型基因组dna序列提供在seq id no:31中。
[0206]
对于玉米ga20氧化酶_3基因(也称为zm.ga20ox3),seq id no:27提供ga20氧化酶_3 5'-utr上游(5')的3000个核苷酸;核苷酸3001-3096对应于5'-utr;核苷酸3097-3665对应于第一外显子;核苷酸3666-3775对应于第一内含子;核苷酸3776-4097对应于第二外显子;核苷酸4098-5314对应于第二内含子;核苷酸5315-5584对应于第三外显子;且核苷酸
5585-5800对应于3'-utr。seq id no:27还提供3'-utr末端下游(3')的3000个核苷酸(核苷酸5801-8800)。
[0207]
对于玉米ga20氧化酶_5基因(也称为zm.ga20ox5),seq id no:31提供ga20氧化酶_5起始密码子上游的3000个核苷酸(核苷酸1-3000);核苷酸3001-3791对应于第一外显子;核苷酸3792-3906对应于第一内含子;核苷酸3907-4475对应于第二外显子;核苷酸4476-5197对应于第二内含子;核苷酸5198-5473对应于第三外显子;且核苷酸5474-5859对应于3'-utr。seq id no:31还提供3'-utr末端下游(3')的3000个核苷酸(核苷酸5860-8859)。
[0208]
在玉米基因组中,zm.ga20ox5基因位于zm.samt基因附近。这两个基因被约550bp的基因间区域分开,其中zm.samt基因定位在下游并且相对于zm.ga20ox5基因以相反取向来取向。包括zm.ga20ox5基因和zm.samt基因的区域的参考基因组序列提供在seq id no.35和36中。seq id no.35表示包括zm.ga20ox5基因和zm.samt基因两者的zm.ga20ox5基因的有义链的序列(表2中的“ga20ox5_samt基因组序列”)。seq id no:35与seq id no:31部分重叠,并且与seq id no:31相比,具有更短的zm.ga20ox5上游序列和更长的zm.ga20ox5下游序列。seq id no.36表示包括zm.ga20ox5基因和zm.samt基因两者的zm.samt基因的有义链(即,zm.ga20ox5基因的反义链)的序列(表2中的“samt_ga20ox5基因组序列”)。参考基因组zm.ga20ox5/zm.samt序列的元件或区域在下表2中通过参考seq id no.35或36中的那些元件或区域的核苷酸坐标来注释。
[0209]
先前已经表明,经由转基因阻抑(例如,ga20氧化酶_3基因和ga20氧化酶_5基因两者的人工微小rna介导的阻抑)阻抑一种或多种ga20氧化酶基因和/或靶向一种或多种ga氧化酶基因的亚组可以有效获得矮小、半矮小表型,具有增加的抗倒伏性,但没有抽穗中的生殖畸形。参见pct申请号pct/us2017/047405和美国申请号15/679,699,这两个申请都在2017年8月17日提交,并且分别公开为wo/2018/035354和us20180051295。此外,经由基因组编辑敲除ga20氧化酶_3、ga20氧化酶_5或这两种基因也可以引起株高降低和抗倒伏性增加,并且影响ga激素水平。参见pct申请号pct/us2019/018128、pct/us2019/018131和pct/us2019/018133,所有这些申请都在2019年2月15日提交。
[0210]
在一个方面,第一基因区域包含与选自由seq id no:(插入ga20cdna序列)组成的组的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%同一性或互补性的多核苷酸序列。
[0211]
在另一个方面,第一基因区域包含与选自由seq id no:(插入br2cdna序列)组成的组的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%同一性或互补性的多核苷酸序列。
[0212]
在一个方面,第一基因区域包含与选自由seq id no:(插入ga3cdna序列)组成的组的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%同一性或互补性的多核苷酸序列。
[0213]
在一个方面,第一基因区域包含与选自由seq id no:(插入y1 cdna序列)组成的
组的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%同一性或互补性的多核苷酸序列。
[0214]
在一个方面,本文提供的缺失包含第二基因区域的全部或部分。在另一个方面,本文提供的缺失包含第二基因区域的全部。在再另一个方面,本文提供的缺失包含第二基因区域的部分。
[0215]
在再另一个方面,本公开提供一种降低细胞中基因的表达的方法,其包括:a)鉴定包含第一基因区域和第二基因区域的染色体区域,所述第一基因区域包含第一启动子和第一编码区域,所述第二基因区域包含第二启动子和第二编码区域,其中所述第一编码区域和所述第二编码区域由间插区域分开,并且其中所述第一启动子和所述第二启动子以相反取向定位;b)使用靶向编辑技术诱导侧接被靶向区域的第一双链断裂和第二双链断裂,其中所述被靶向区域包含所述第二编码区域和所述间插区域;和c)鉴定包含染色体的被靶向区域的缺失的一种或多种细胞,其中所述第二启动子产生所述第一编码区域的至少一种反义rna,并且其中与不包含所述被靶向区域的缺失的对照细胞相比,所述第一编码区域的表达降低。在一个方面,缺失导致第一编码区域的一部分以反向取向转录。
[0216]
在一个另外的方面,本公开提供一种方法,其包括:a)鉴定包含第一基因区域和第二基因区域的染色体区域,所述第一基因区域包含第一启动子和第一编码区域,所述第二基因区域包含第二启动子和第二编码区域,其中所述第一编码区域和所述第二编码区域由间插区域分开,并且其中所述第一启动子和所述第二启动子以相反取向定位;b)向一种或多种细胞提供至少一种rna引导核酸酶或编码至少一种rna引导核酸酶的一种或多种载体,其中所述至少一种rna引导核酸酶能够结合到侧接染色体的被靶向区域的第一靶位点和第二靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述被靶向区域包含所述第二编码区域和所述间插区域,其中所述rna引导核酸酶在所述染色体中在所述第一靶位点和所述第二靶位点处产生双链断裂;b)鉴定包含所述被靶向区域的缺失的一种或多种细胞;和c)选择包含所述被靶向区域的缺失的一种或多种细胞。
[0217]
在一个方面,本公开提供一种修饰的植物或其部分,其在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。在一个方面,本公开提供一种修饰的植物细胞,其在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。在另一个方面,本公开提供一种修饰的植物或修饰的植物组织,其在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。
[0218]
本领域已知转座子或转座元件是可以改变其在基因组内的位置的dna序列。转座子可以在基因组中产生插入、缺失或倒位。在一个方面,本文提供的方法、组合物和细胞不包括使用转座子(例如,“非转座子介导的”)。
[0219]
在一个方面,本公开提供一种修饰的染色体,其在基因的内源基因座处包含所述
基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。在一个方面,本公开提供一种修饰的细胞,其在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。在另一个方面,本公开提供一种修饰的细胞,其包含修饰的染色体,所述修饰的染色体在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。
[0220]
在一个方面,本公开提供一种产品,其包含修饰的染色体,所述修饰的染色体在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。在一个方面,本公开提供一种产品,其包含修饰的植物或其部分,所述修饰的植物或其部分在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。在一个方面,本发明提供一种产品,其包含修饰的植物细胞,所述修饰的植物细胞在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。在一个方面,本发明提供一种产品,其包含修饰的细胞,所述修饰的细胞在基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因或其部分的天然转录物序列互补的序列的rna转录物。在一个方面,产品包含来源于植物、植物部分或植物细胞的青贮饲料、面粉、纤维素、糖、淀粉、脂肪、糖浆或蛋白质。
[0221]
在一个方面,本公开提供一种修饰的细胞,其包含a)在至少一种基因的内源基因座处所述至少一种基因或其一部分的非转座子介导的基因组缺失,或b)非转座子介导的和非t-dna介导的多核苷酸序列到所述至少一种基因中的插入,其中所述缺失或插入产生所述至少一种基因的显性正等位基因。在一个方面,插入包含调控元件。在另一个方面,调控元件选自由启动子序列、转录起始位点序列、转录终止位点序列、增强子序列和设计的元件组成的组。
[0222]
在另一个方面,本公开提供一种修饰的细胞,所述修饰的细胞在至少一种基因的内源基因座处包含所述至少一种基因或其部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位产生所述至少一种基因的显性负等位基因。在再另一个方面,本公开提供一种修饰的细胞,其在至少一种基因的内源基因座处包含所述基因或其一部分的非转座子介导的基因组缺失或倒位,其中所述缺失或倒位导致产生包含与所述基因的天然转录物序列互补的序列的rna转录物。在一个方面,本公开提供一种修饰的细胞,其包含至少一种基因或其一部分的靶向编辑,其中所述靶向编辑产生与所述基因的天然转录物序列互补的rna转录物。在一个方面,rna转录物是完全反义转录物。在另一个方面,rna转录物是部分反义转录物。在一个另外的方面,rna转录物是部分有义转录物。在再另一个方面,rna转录物是完整有义转录物。在另一个方面,rna转录物是基因的天然转录物。在一个另外的方面,基因的天然转录物是部分或完整的有义转录物。
[0223]
基因区域的显性等位基因也可以通过将设计的元件插入基因区域的启动子中以诱导基因区域的组成型表达来产生。
[0224]
在一个方面,本公开提供一种修饰基因表达的方法,其包括:a)使用靶向编辑技术在基因的靶位点处诱导双链断裂;b)在所述双链断裂处插入供体序列,其中所述供体序列包含能够诱导所述基因的增加或异位表达的设计的元件;和c)鉴定包含所述供体序列的插入的至少一种细胞,其中与不包含所述供体序列的插入的对照细胞相比,基因的表达在至少一种组织中增加。
[0225]
在另一个方面,本公开提供一种方法,其包括:a)向一种或多种细胞提供至少一种rna引导核酸酶和至少一种供体分子,或编码至少一种rna引导核酸酶和至少一种供体分子的一种或多种载体,其中所述至少一种rna引导核酸酶能够结合到至少一种基因的靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述供体分子包含设计的元件,其中所述rna引导核酸酶在所述靶位点处产生双链断裂,并且其中所述供体分子在所述双链断裂处插入;b)鉴定在所述靶位点处包含所述供体分子的插入的一种或多种细胞;和c)选择在所述靶位点处包含所述供体分子的插入的一种或多种细胞。
[0226]
在一个方面,靶位点定位在基因上游的tata盒的下游。在一个方面,靶位点定位在基因上游的tata盒的上游。在一个方面,靶位点定位在可操作地连接到至少一种基因的tata盒的上游。在另一个方面,靶位点定位在可操作地连接到至少一种基因的tata盒的下游。在一个方面,靶位点定位在可操作地连接到至少一种基因的tata盒的10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500或5000个核苷酸内。在再另一个方面,靶位点定位在可操作地连接到至少一种基因的tata盒的10个核苷酸至5000个核苷酸之间、10个核苷酸至2500个核苷酸之间、10个核苷酸至1500个核苷酸之间、10个核苷酸至1000个核苷酸之间、10个核苷酸至750个核苷酸之间、10个核苷酸至500个核苷酸之间、10个核苷酸至250个核苷酸之间、10个核苷酸至100个核苷酸之间、20个核苷酸至100个核苷酸之间、20个核苷酸至250个核苷酸之间、20个核苷酸至500个核苷酸之间或50个核苷酸至500个核苷酸之间。在再另一个方面,靶位点定位在基因的启动子的10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500或5000个核苷酸内。在再另一个方面,靶位点定位在基因上游的起始元件的上游。在再另一个方面,靶位点定位在基因上游的起始元件的下游。在再另一个方面,靶位点定位在基因的起始元件的10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500或5000个核苷酸内。
[0227]
在一个方面,“tata盒”包含5'-tataaa-3'的核心dna序列或其变体,并且通常与真核基因的启动子相关。通常,但不总是,tata盒定位在基因的转录起始位点上游大约25至35个核苷酸处。tata盒通常用作转录因子的结合位点以能够实现可操作地连接的基因的表达,或用作组蛋白以阻断可操作地连接的基因的表达。在一个方面,tata盒是起始元件。起始元件是有利于转录因子的结合以促进可操作地连接的基因的表达的核心启动子。在一个方面,本文提供的起始序列包含5
’‑
[c/t][c/t]an[a/t][c/t][c/t]-3’的序列。
[0228]
显性负等位基因也可以通过编辑基因组以包含基因区域的组织特异性或组织优选启动子,使得所述组织特异性或组织优选启动子处于靶向基因的相反取向来产生。例如,
将组织特异性启动子以反向取向置于基因区域的3'-utr的下游将允许组织特异性启动子产生完整的反义基因区域rna转录物。不受任何理论的约束,由反义组织特异性启动子表达的反义基因区域rna转录物能够以组织特异性方式阻抑基因区域的表达。
[0229]
在一个方面,本公开提供一种降低至少一种细胞中基因的表达的方法,所述方法包括:a)使用靶向编辑技术在所述基因的靶位点处诱导双链断裂;b)在所述双链断裂处插入供体序列,其中所述供体序列包含组织特异性或组织优选的启动子,并且其中所述供体序列插入所述靶位点中,使得所述组织特异性或组织优选的启动子与所述基因相比处于反向取向;和c)鉴定包含所述供体序列以反向取向的插入的至少一种细胞,其中与不包含所述供体序列的插入的对照细胞相比,所述基因的表达降低。在一个方面,本文提供的方法还包括使用靶向编辑技术来去除基因的天然启动子。如本文所用,“天然启动子”是指产生可操作地连接的基因的有义mrna转录物的启动子。
[0230]
在另一个方面,本公开提供一种方法,其包括:a)向一种或多种细胞提供至少一种rna引导核酸酶和至少一种供体分子,或编码至少一种rna引导核酸酶和至少一种供体分子的一种或多种载体,其中所述至少一种rna引导核酸酶能够结合到至少一种基因的靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述供体分子包含编码组织特异性或组织优选的启动子的序列,其中所述rna引导核酸酶在所述靶位点处产生双链断裂,并且其中所述供体分子在所述双链断裂处插入;b)鉴定在所述靶位点处包含所述供体分子的插入的一种或多种细胞,使得所述组织特异性或组织优选的启动子与所述基因相比处于反向取向;和c)选择在所述靶位点处包含所述供体分子的插入的一种或多种细胞。
[0231]
在一个方面,靶位点定位在基因的3'-utr下游。在另一个方面,靶位点定位在基因的3'-utr内。在另一个方面,靶位点定位在基因的内含子内。在一个另外的方面,靶位点定位在基因的外显子内。在一个方面,靶位点定位在基因的5'-utr。在另一个方面,靶位点定位在基因的5'-utr的上游。在再一个另外的方面,靶位点定位在基因的启动子内。
[0232]
在一个方面,供体分子包含编码启动子的多核苷酸。在一个方面,供体分子包含编码启动子的多核苷酸,所述启动子选自由组织特异性启动子、组织优选的启动子、组成型启动子和诱导型启动子组成的组。在另一个方面,本文提供的供体分子包含编码组织特异性或组织优选的启动子的多核苷酸。在再另一个方面,本文提供的供体分子包含编码组成型启动子的多核苷酸。在另一个方面,本文提供的供体分子包含编码诱导型启动子的多核苷酸。
[0233]
在一个方面,组织特异性或组织优选的启动子选自由以下组成的组:叶特异性启动子、叶优选的启动子、茎特异性启动子、茎优选的启动子、维管特异性启动子、维管优选的启动子、根特异性启动子、根优选的启动子、花序特异性启动子、花序优选的启动子、花粉特异性启动子、花粉优选的启动子、花药特异性启动子、花药优选的启动子、胚珠特异性启动子、胚珠优选的启动子、种子特异性启动子、种子优选的启动子、胚特异性启动子、胚优选的启动子、胚乳特异性启动子、胚乳优选的启动子、果皮特异性启动子、果皮优选的启动子、糊粉特异性启动子、糊粉优选的启动子、分生组织特异性启动子、分生组织优选的启动子、果实特异性启动子、果实优选的启动子、荚特异性启动子、荚优选的启动子、表皮特异性启动子、表皮优选的启动子、线粒体特异性启动子、线粒体优选的启动子、叶绿体特异性启动子
rev.mol.cell.biol.,6:376-385中的图1。
[0238]
mirna(无论是天然存在的序列还是人工序列)的转基因表达可以用于调控一种或多种mirna靶基因的表达。mirna的识别位点在mrna的所有区域中已被验证,这些区域包括5'非翻译区域、编码区域和3'非翻译区域,表明mirna靶位点相对于编码序列的位置可能未必一定影响阻抑(参见,例如jones-rhoades和bartel(2004).mol.cell,14:787-799;rhoades等,(2002)cell,110:513-520;allen等,(2004)nat.genet.,36:1282-1290;sunkar和zhu(2004)plant cell,16:2001-2019)。因为mirna是真核生物中的重要调控元件,所以mirna的转基因阻抑可用于操纵生物学通路和反应。mir基因的启动子可以具有高度特异性的表达模式(例如,细胞特异性、组织特异性、时间特异性或诱导型),因此可用于重组构建体中以诱导与其可操作地连接的dna序列的这种特异性转录。mirna、其前体、其识别位点及其启动子的各种效用详细描述于美国专利申请公开2006/0200878a1中,其以引用的方式并入本文。这些效用的非限制性实例包括:(1)表达天然mirna或mirna前体序列以阻抑靶基因;(2)表达人工mirna或mirna前体序列以阻抑靶基因;(3)表达具有mirna识别位点的转基因,其中当表达成熟mirna时,所述转基因被阻抑;(4)表达由mirna启动子驱动的转基因。
[0239]
设计人工mirna序列可以与取代与对于mirna前体的mirna茎区域中的核苷酸预期的靶互补的序列一样简单,如zeng等(2002)mol.cell,9:1327-1333所证明。用于确定天然mirna序列中的核苷酸改变以产生工程化mirna前体的一般方法的一个非限制性实例包括以下步骤:(a)例如通过使用序列比对工具如blast(参见,例如altschul等,(1990)j.mol.biol.,215:403-410;altschul等,(1997)nucleic acids res.,25:3389-3402)选择例如烟草cdna数据库和基因组dna数据库的对靶基因具有特异性的至少18个核苷酸的独特靶序列,以鉴定靶转录物直系同源物和任何与无关基因的潜在匹配,由此避免非靶序列的无意沉默;(b)分析靶基因的不需要的序列(例如,与来自非靶物种的序列的匹配),并且对每个潜在的19聚体区段的gc含量、雷诺得分(reynolds score)(参见reynolds等(2004)nature biotechnol,22:326-330)和以自由能负差(".delta..delta.g”或“δδg”)为特征的功能不对称性进行评分(参见khvorova等(2003)cell,115:209-216)。优选地,选择具有所有或大多数以下特征的19聚体:(1)雷诺得分>4,(2)gc含量在约40%至约60%之间,(3)负δδg,(4)末端腺苷,(5)缺少连续的4个或更多个相同核苷酸;(6)定位在靶基因的3'末端附近;(7)与mirna前体转录物的差异最小。已报道sirna中每三个核苷酸的位置在影响rnai功效方面尤其重要,并且算法“siexplorer”在rna.chem.t.u-tokyo.ac.jp/siexplorer.htm上是公开可得的(参见katoh和suzuki(2007)nucleic acids res.,10.1093/nar/gkl1120);(c)确定选择的19聚体的反向互补序列以用于制备修饰的成熟mirna。位置20处的额外核苷酸优选与选择的靶序列匹配,并且位置21处的核苷酸优选被选择为未配对的以防止沉默在靶转录物上扩散,或与靶序列配对以促进沉默在靶转录物上扩散;和(d)将人工mirna转化到植物中。
[0240]
sirna通路包括较长的双链rna中间体(rna双链体)的非定相裂解,形成小干扰rna(sirna)。sirna的大小或长度范围是约19至约25个核苷酸或碱基对,但是常见的sirna类型包括含有21个碱基对或24个碱基对的sirna。因此,本技术的可转录dna序列或阻抑元件可以编码长度为至少约19至约25个核苷酸,诸如长度为19、20、21、22、23、24或25个核苷酸的rna分子。
[0241]
在ta-sirna通路中,mirna用于在需要rna依赖性rna聚合酶以产生双链rna前体的过程中引导sirna初级转录物的同相加工;ta-sirna定义为缺乏二级结构、起始双链rna产生的mirna靶位点、需要dcl4和rna依赖性rna聚合酶(rdr6)以及产生具有与2-核苷酸3'突出端完美匹配的双链体的多个完美定相的约21-nt小rna(参见allen等,(2005)cell,121:207-221)。ta-sirna的大小或长度范围为约20至约22个核苷酸或碱基对,但最通常为21个碱基对。因此,本技术的供体分子或载体可以编码长度为至少约20至约22个核苷酸,诸如长度为20、21或22个核苷酸的rna分子。本文提供的供体分子和载体还可以包含ta-sirna支架。关于构建合适ta-sirna支架的方法,参见美国专利号9,309,512,其以引用的方式整体并入本文。
[0242]
本公开提供一种产生基因的显性负等位基因的方法,其包括使用靶向编辑技术将至少一个非编码rna靶位点引入所述基因中。在一个方面,与不包含至少一个非编码rna靶位点的基因的等位基因相比,所述基因的显性负等位基因下调。在另一个方面,产生与所述基因互补的二级sirna。在另一个方面,所述至少一个非编码rna靶位点是mirna靶位点或sirna靶位点。在一个另外的方面,将所述至少一个非编码rna靶位点引入选自由5'-utr、外显子、内含子和3'-utr组成的组的基因区域。在另一个方面,将所述至少一个非编码rna靶位点引入所述基因的外显子中。在另一个方面,将所述至少一个非编码rna靶位点引入所述基因的内含子中。在另一个方面,将所述至少一个非编码rna靶位点引入所述基因的5'-utr中。在再另一个方面,将所述至少一个非编码rna靶位点引入所述基因的3'-utr中。
[0243]
在另一个方面,本公开提供一种修饰的细胞,其包含基因的非转基因显性负等位基因,所述显性负等位基因在所述基因的内源基因座中包含异源非编码rna靶位点。
[0244]
显性等位基因也可以通过编辑蛋白质编码基因区域的等位基因,使得产生截短的蛋白质而产生,其中编辑的截短的蛋白质干扰野生型蛋白质的活性并产生显性效应。在一个方面,向蛋白质编码基因引入靶向编辑以产生截短的蛋白质产生显性正等位基因。在一个方面,向蛋白质编码基因引入靶向编辑以产生截短的蛋白质产生显性负等位基因。在一个方面,本文提供的截短的蛋白质干扰蛋白质-蛋白质结合、dna-蛋白质结合或rna-蛋白质结合。在一个方面,本文提供的截短的蛋白质是微蛋白。如本文所用,微蛋白是指仅编码蛋白质-蛋白质相互作用或结合结构域的约100-200氨基酸长蛋白质(参见,例如seo等,trends in plant sciences,2011,10:541-549)。微蛋白通常由经历突变以消除功能蛋白质结构域的功能基因进化而来。在一个方面,微蛋白的长度为至少50个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个或至少225个氨基酸。在一个方面,微蛋白阻抑细胞中至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种蛋白质的活性。在另一个方面,微蛋白增强细胞中至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种蛋白质的活性。非限制性地,微蛋白可以与第二蛋白质竞争第三蛋白质中的结合位点。在一个方面,微蛋白阻断第二蛋白质与第三蛋白质的结合,可以发生活性的阻抑。或者,在另一个方面,微蛋白与第三蛋白质而不是第二蛋白质的结合增强了第三蛋白质的活性。
[0245]
在一个方面,包含编码微蛋白的显性负等位基因的植物包含选自由开花时间、分生组织大小、昆虫抗性、除草剂耐受性和避荫性组成的组的性状的改善。在一个方面,包含编码微蛋白的显性正等位基因的植物包含选自由开花时间、分生组织大小、昆虫抗性、除草
剂耐受性和避荫性组成的组的性状的改善。
[0246]
在一个方面,本文提供的截短的蛋白质选自由以下组成的组:截短的clavata蛋白、截短的coryne蛋白、截短的bam受体、截短的受体样蛋白激酶2(rpk2)蛋白和截短的g蛋白β-亚基1(agb1)蛋白。在另一个方面,本文提供的clavata蛋白是clavata1蛋白、clavata2蛋白或clavata3蛋白。
[0247]
在一个方面,本公开提供一种产生基因的显性负等位基因的方法,其包括a)使用靶向编辑技术在至少一种细胞的基因组中在基因的靶位点处诱导双链断裂,其中所述双链断裂通过非同源末端连接修复;和b)鉴定在所述靶位点处包含插入或缺失的至少一种细胞,其中在所述靶位点处的插入或缺失导致所述基因的显性负等位基因的产生。
[0248]
在再另一个方面,本公开提供一种修饰的细胞,其包含通过靶向编辑技术产生的在至少一种基因的内源基因座处的至少一个插入或缺失,其中所述插入或缺失导致截短的蛋白质的表达。
[0249]
在另一个方面,本公开提供一种方法,其包括a)向一种或多种细胞提供至少一种rna引导核酸酶或编码至少一种rna引导核酸酶的一种或多种载体,其中所述至少一种rna引导核酸酶能够结合到至少一种基因的靶位点的至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述rna引导核酸酶在所述靶位点处产生双链断裂;b)鉴定在所述靶位点处包含插入或缺失的至少一种细胞,其中在所述靶位点处的所述插入或缺失导致所述至少一种基因的显性负等位基因的产生;和c)选择包含所述至少一种基因的显性负等位基因的一种或多种细胞。
[0250]
本公开还提供一种产生基因的显性等位基因的方法,其包括使用靶向编辑技术在所述基因中引入无义突变以产生截短的蛋白质。在一个方面,所述截短的蛋白质是微蛋白。在一个方面,所述靶向编辑技术包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少25个、至少50个、至少75个、至少100个、至少150个、至少200个、至少250个、至少500个、至少1000个、至少2500个或至少5000个核苷酸的缺失。在一个方面,所述靶向编辑技术包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少25个、至少50个、至少75个、至少100个、至少150个、至少200个、至少250个、至少500个、至少1000个、至少2500个或至少5000个核苷酸的插入。在一个方面,所述靶向编辑技术包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少25个、至少50个、至少75个、至少100个、至少150个、至少200个、至少250个、至少500个、至少1000个、至少2500个或至少5000个核苷酸的倒位。
[0251]
在一个方面,向蛋白质编码基因引入靶向编辑以产生截短的蛋白质产生显性正等位基因。在一个方面,本公开提供一种产生基因的显性正等位基因的方法,其包括a)使用靶向编辑技术在至少一种细胞的基因组中在基因的靶位点处诱导双链断裂,其中所述双链断裂通过非同源末端连接修复;和b)鉴定在所述靶位点处包含插入或缺失的至少一种细胞,其中在所述靶位点处的插入或缺失导致所述基因的显性正等位基因的产生。
[0252]
在另一个方面,本公开提供一种方法,其包括a)向一种或多种细胞提供一种或多种载体,其中所述一种或多种载体包含编码至少一种rna引导核酸酶的至少一种多核苷酸,其中所述至少一种rna引导核酸酶能够结合到至少一种基因的靶位点的至少18个、至少19
个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或至少26个连续核苷酸,其中所述rna引导核酸酶在所述靶位点处产生双链断裂,并且其中所述双链断裂通过非同源末端连接修复;b)鉴定在所述靶位点处包含插入或缺失的至少一种细胞,其中在所述靶位点处的所述插入或缺失导致所述至少一种基因的显性正等位基因的产生;和c)选择包含所述至少一种基因的显性正等位基因的一种或多种细胞。
[0253]
在一个方面,本文提供的插入或缺失消除内含子/外显子剪接位点。内含子/外显子剪接位点是指基因中在内含子和外显子之间的边界。在真核生物中,内含子通常但不总是由剪接体从rna转录物中加工出来以产生仅包含外显子序列的mrna转录物。如果内含子/外显子剪接位点受到干扰,剪接体则可能无法适当地去除内含子序列,导致具有产生过早终止密码子的一个或多个无义突变的蛋白质。在一个方面,无义突变产生截短的蛋白质。在一个方面,截短的蛋白质包含比由缺乏无义突变的基因编码的内源蛋白少至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少125个、至少150个、至少175个、至少200个、至少225个、至少250个、至少275个、至少300个、至少350个、至少400个、至少450个或至少500个氨基酸。
[0254]
在一个方面,无义突变是导致转录mrna中的过早终止密码子的突变。在另一个方面,本文提供的插入或缺失位于外显子中。在另一个方面,本文提供的插入或缺失位于内含子中。在另一个方面,本文提供的插入或缺失位于5'-utr或3'-utr中。在一个方面,本文提供的插入或缺失位于选自由内含子/外显子剪接位点、外显子、内含子、5'-utr和3'-utr组成的组的结构中。在再另一个方面,本文提供的显性负等位基因包含一个或多个、两个或更多个、三个或更多个、四个或更多个或五个或更多个插入和/或缺失。在再另一个方面,本文提供的显性正等位基因包含一个或多个、两个或更多个、三个或更多个、四个或更多个或五个或更多个插入和/或缺失。
[0255]
在另一个方面,本文提供的无义突变位于外显子中。在一个方面,本文提供的插入或缺失位于选自由内含子/外显子剪接位点和外显子组成的组的结构中。本文提供的插入或缺失可以产生具有一个或多个、两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个或十个或更多个无义突变的蛋白质。
[0256]
在一个方面,本文提供的显性负等位基因包含与对照等位基因的多核苷酸相比包含过早终止密码子的多核苷酸。过早终止密码子是定位在基因的正常终止密码子上游的终止密码子。过早终止密码子产生截短的蛋白质。终止密码子是mrna中指示自mrna的蛋白质翻译终止的核苷酸三联体。在一个方面,本文提供的显性负等位基因包含编码截短的蛋白质的多核苷酸。在一个方面,本文提供的截短的蛋白质比全长蛋白质短至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少125个、至少150个、至少175个、至少200个、至少225个、至少250个、至少275个、至少300个、至少400个或至少500个氨基酸。在一个方面,本文提供的截短的蛋白质通过插入或缺失至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8
个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少400个、至少500个、至少1000个、至少1500个或至少2000个核苷酸而产生。
[0257]
在一个方面,本文提供的显性正等位基因包含与对照等位基因的多核苷酸相比包含过早终止密码子的多核苷酸。过早终止密码子是定位在基因的正常终止密码子上游的终止密码子。过早终止密码子产生截短的蛋白质。终止密码子是mrna中指示自mrna的蛋白质翻译终止的核苷酸三联体。在一个方面,本文提供的显性正等位基因包含编码截短的蛋白质的多核苷酸。在一个方面,本文提供的截短的蛋白质比全长蛋白质短至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少125个、至少150个、至少175个、至少200个、至少225个、至少250个、至少275个、至少300个、至少400个或至少500个氨基酸。在一个方面,本文提供的截短的蛋白质通过插入或缺失至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少400个、至少500个、至少1000个、至少1500个或至少2000个核苷酸而产生。
[0258]
本公开提供一种在细胞中产生基因的显性负等位基因的方法,其包括使用靶向编辑技术缺失基因的一部分,其中在缺失所述基因的所述部分之后产生微蛋白。在一个方面,截短的蛋白质是微蛋白。在另一个方面,本文提供的显性负等位基因编码微蛋白。在一个另外的方面,本文提供的显性正等位基因编码微蛋白。如本文所用,“微蛋白”是指具有干扰较大多结构域蛋白的能力的短的单结构域蛋白。在一个方面,本文提供的微蛋白干扰至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种其他蛋白质。在一个方面,本文提供的微蛋白能够防止第二蛋白质与核酸分子结合。在另一个方面,本文提供的微蛋白能够防止第二蛋白质与第三蛋白质结合。第三蛋白质可以与第二蛋白质相同或不同。在另一个方面,本文提供的微蛋白能够结合到至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种其他蛋白质。在一个方面,本文提供的微蛋白可以与至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种其他蛋白质形成异二聚体。在另一个方面,本文提供的微蛋白能够形成同二聚体。如本文所用,“同二聚体”是指两个相同分子(例如,蛋白质a和蛋白质a)杂交或结合,而“异二聚体”是指两个不同的大分子(例如,蛋白质a和蛋白质b;蛋白质a和dna;蛋白质a和rna)杂交或结合。
[0259]
三角状五肽重复(ppr)基因家族的成员在植物基因组中是常见的。许多ppr蛋白能够以序列特异性方式结合rna分子。ppr蛋白包含2-30个ppr基序,每个基序与rna分子中的单个核苷酸对齐。在ppr基序内,存在于两个或三个具体位置的氨基酸赋予核苷酸特异性。例如,非限制性地,当苏氨酸在位置6且天冬酰胺在1'位置时,ppr基序结合腺嘌呤核苷酸;当苏氨酸在位置6且天冬氨酸在位置1'时,ppr基序结合鸟嘌呤核苷酸;当天冬酰胺在位置6且天冬氨酸在位置1'时,ppr基序结合尿嘧啶(或胸腺嘧啶)核苷酸;并且当天冬酰胺在位置
6且天冬酰胺或丝氨酸在1’位置时,ppr基序结合胞嘧啶核苷酸。
[0260]
非限制性地,工程化ppr蛋白可以通过至少两种建构策略产生。在第一策略中,ppr蛋白通过将每个ppr基序作为单独的块处理来构建,从而通过将多个期望的基序按顺序排列来构建ppr蛋白。然后,所得工程化ppr蛋白能够结合靶rna分子。然而,这种策略可能不总是起作用,因为每个ppr基序在1’位置和6位置之间包含内部支架,并且所述基序内支架在不同ppr蛋白质之间并不共享。第二策略利用预先存在的基序内支架。在第二策略中,1’位置和6位置的定点诱变用于编辑现有的ppr蛋白,使得其将对于新靶rna分子将具有特异性。
[0261]
如本文所用,“工程化ppr蛋白”、“工程化ppr基序”是指合成产生的ppr蛋白或ppr基序,其不存在于自然界中并且能够以位点特异性方式结合rna序列。
[0262]
本公开提供一种方法,其包括:a)向细胞提供可操作地连接到启动子的工程化ppr蛋白或编码所述工程化ppr蛋白的载体,其中所述工程化ppr蛋白能够结合到靶基因的rna转录物;b)选择来自步骤(a)的表达所述工程化ppr蛋白的一种或多种细胞;和c)鉴定在步骤(b)中选择的包含所述靶基因的改变的表达的一种或多种细胞。在一个方面,工程化ppr蛋白能够结合到rna转录物的至少一个非编码rna靶位点。在一个方面,工程化ppr蛋白结合到rna转录物的至少一个非编码rna靶位点。在一个方面,改变的表达是增加的表达。在另一个方面,改变的表达是降低的表达。在一个方面,启动子是靶基因的天然启动子。在另一个方面,启动子选自由组成型启动子、组织特异性启动子、组织优选的启动子和诱导型启动子组成的组。
[0263]
在一个方面,本文提供的工程化ppr蛋白结合到靶rna分子的非编码rna靶位点,并阻断非编码rna裂解靶rna或抑制靶rna的翻译。在另一个方面,本文提供的工程化ppr蛋白指导靶rna分子的降解。在一个方面,本文提供的工程化ppr蛋白包含至少一个rna核酸酶结构域。在另一个方面,本文提供的rna核酸酶结构域是nyn核酸酶结构域或小muts相关(smr)结构域。
[0264]
在一个方面,本文提供的工程化ppr蛋白或工程化ppr基序结合到rna分子的至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少34个或至少35个核苷酸。在另一个方面,本文提供的工程化ppr蛋白或工程化ppr基序结合到rna分子的5至35、5至30、5至25、5至20、5至15、5至14、5至13、5至12、5至11、5至10、10至35、10至30、10至25、10至20、10至15、10至14、10至13、10至12或15至30个核苷酸。
[0265]
在一个方面,本文提供的工程化ppr蛋白能够充当显性负等位基因。在一个方面,本文提供的工程化ppr蛋白能够充当显性正等位基因。
[0266]
在一个方面,工程化ppr蛋白靶向线粒体或叶绿体。在另一个方面,工程化ppr蛋白靶向细胞核。在再另一个方面,工程化ppr蛋白靶向细胞的细胞质。不受任何理论的限制,蛋白质可以通过在蛋白质的n末端添加或编辑转运肽而靶向具体细胞结构。
[0267]
在一个方面,本文提供的基因组编辑系统包含tgoligo作为系链分子。在另一个方面,系链分子是偶联至核酸酶或dna靶向引导分子的交联剂。在一个另外的方面,系链分子是偶联至核酸酶的二聚化结构域。
[0268]
在一个方面,系链分子能够拴系结合到两个基因组基因座的两个或更多个dna结合机器。在另一个方面,系链分子能够拴系结合到位于单个染色体中侧接靶基因组区域的两个基因组基因座的两个或更多个dna结合机器。在另一个方面,系链分子能够拴系结合到在单独染色体上的两个基因组基因座的两个或更多个dna结合机器。
[0269]
在一个方面,本公开提供一种在至少一种细胞中产生至少一种基因的显性负等位基因的方法,其包括:a)向所述至少一种细胞引入基因组编辑系统,所述基因组编辑系统包含:i)位点特异性核酸酶或编码位点特异性核酸酶的分子,ii)sgrna或编码sgrna的分子,和iii)至少第一系链引导寡核苷酸(tgoligo)和第二tgoligo或编码第一tgoligo和第二tgoligo的一种或多种分子,其可操作地连接到至少一个启动子;b)在所述至少一种基因中产生第一双链断裂和第二双链断裂,其中所述第一tgoligo和所述第二tgoligo与所述第一双链断裂和所述第二双链断裂处相反链的3’自由端杂交,其中所述至少一种基因的至少1个、至少2个、至少3个、至少4个、至少5个、至少10个、至少25个、至少50个、至少100个、至少250个、至少500个、至少750个、至少1000个、至少2500个或至少5000个核苷酸缺失,由此产生所述基因的编码截短的蛋白质的显性负等位基因;和c)鉴定和选择包含所述截短的蛋白质的至少一种细胞。
[0270]
在一个方面,本公开提供一种在至少一种细胞中产生至少一种基因的显性负等位基因的方法,其包括:a)向所述至少一种细胞引入基因组编辑系统,所述基因组编辑系统包含:i)位点特异性核酸酶或编码位点特异性核酸酶的分子,ii)sgrna或编码sgrna的分子,和iii)至少第一系链引导寡核苷酸(tgoligo)和第二tgoligo或编码第一tgoligo和第二tgoligo的一种或多种分子,其可操作地连接到至少一个启动子;b)在所述至少一种基因中产生第一双链断裂和第二双链断裂,其中所述第一tgoligo和所述第二tgoligo与所述第一双链断裂和所述第二双链断裂处相反链的3’自由端杂交,其中所述至少一种基因的1至5000、5至5000、10至5000、25至2500、25至1000、25至750、25至500、25至100、50至5000、50至1000、50至500、100至1000或1000至5000个核苷酸缺失,由此产生所述基因的编码截短的蛋白质的显性负等位基因;和c)鉴定和选择包含所述截短的蛋白质的至少一种细胞。
[0271]
在另一个方面,本公开提供一种在至少一种细胞中产生至少一种基因的显性负等位基因的方法,其包括:a)向所述至少一种细胞中引入一种或多种载体,所述载体编码:i)至少一种位点特异性核酸酶,ii)至少一种sgrna,和iii)可操作地连接到至少一个启动子的至少第一tgoligo和第二tgoligo;b)在所述基因中产生第一双链断裂和第二双链断裂,其中所述第一tgoligo和所述第二tgoligo与所述第一双链断裂和所述第二双链断裂处相反链的3’自由端杂交,其中所述至少一种基因在第一双链断裂和第二双链断裂之间的区域在取向上是倒位的,由此产生所述至少一种基因的编码所述基因的反义rna转录物的显性负等位基因;和c)鉴定和选择包含所述至少一种基因的所述反义rna转录物的至少一种细胞。
[0272]
如本文所用,“系链引导寡核苷酸”(tgoligo)是指包含能够与被crispr grna-cas复合物识别并裂解的双链dna分子的非靶链的3'自由端(此3'自由端也称为3’自由瓣)杂交的序列区段的寡核苷酸。当tgoligo识别并杂交于grna的靶位点的非靶链的3'自由端时,所述tgoligo对应于所述grna。tgoligo可以是dna分子、rna分子或核苷酸的混合物。杂交tgoligo是可以识别由两种单独的crispr grna-cas复合物产生的两个非靶3’自由端并与
其杂交的tgoligo。
[0273]
如本文所用,“系链引导rna”(tgrna)是指包含引导rna(grna)序列和系链rna序列两者的rna分子,其中所述系链rna序列能够与所期望基因组位点(所述位点称为“系链位点”)杂交。
[0274]
在一个方面,本文提供的方法包括使用一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种或十种或更多种tgoligo。在一个方面,tgoligo是dna分子。在另一个方面,tgoligo是rna分子。在再一个另外的方面,tgoligo是dna分子和rna分子的混合物。在一个方面,tgoligo是单链的。在另一个方面,tgoligo是双链的。在一个方面,至少一种或至少两种tgoligo与至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种位点特异性核酸酶同时使用。在另一个方面,至少一种tgoligo不与位点特异性核酸酶同时使用。在一个方面,至少一种或至少两种tgoligo栓系到至少一种或至少两种cas9蛋白。在一个方面,第一tgoligo栓系到第一cas9蛋白,且第二tgoligo栓系到第二cas9蛋白。在另一个方面,至少一种或至少两种tgoligo栓系到至少一种或至少两种失活的cas9蛋白。
[0275]
在再另一个方面,本文提供的tgoligo包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少500个、至少1000个、至少2500个、至少5000个、至少10,000个或至少25,000个核苷酸。在一个另外的方面,本文提供的tgoligo包含5至25,000个核苷酸、5至10,000个核苷酸、5至5000个核苷酸、20至10,000个核苷酸、20至5000个核苷酸、20至1000个核苷酸、20至500个核苷酸、20至250个核苷酸、50至2500个核苷酸、50至1000个核苷酸、50至500个核苷酸、50至250个核苷酸、100至2500个核苷酸、100至1000个核苷酸、100至500个核苷酸或1000至10,000个核苷酸。
[0276]
在一个方面,第一tgoligo和第二tgoligo彼此至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%互补。在一个方面,第一tgoligo和第二tgoligo对于至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少500个、至少1000个、至少2500个或至少5000个核苷酸彼此至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%互补。在一个方面,第一tgoligo包含有义链,且第二tgoligo包含反义链。
[0277]
在一个方面,将tgoligo提供给细胞。在另一个方面,tgoligo由载体编码。在另一个方面,位点特异性核酸酶和tgoligo由一种载体编码。在又另一个方面,位点特异性核酸酶和tgoligo由两种或更多种载体编码。
[0278]
本文提供的方法适合产生蛋白质编码基因和非编码rna的显性等位基因。非限制
性地,在植物基因组中由本公开所预期的靶基因的实例将包括对于疾病、昆虫或害虫耐受性、除草剂耐受性的基因;对于以下的基因:质量改善如产量、营养增强、环境或压力耐受性;或在植物生理学、生长、发育、形态学或植物产品方面的任何所需变化,包括淀粉生产(美国专利号6,538,181;6,538,179;6,538,178;5,750,876;6,476,295);改性油生产(美国专利号6,444,876;6,426,447;6,380,462);高油生产(美国专利号6,495,739;5,608,149;6,483,008;6,476,295);改性脂肪酸含量(美国专利号6,828,475;6,822,141;6,770,465;6,706,950;6,660,849;6,596,538;6,589,767;6,537,750;6,489,461;6,459,018);高蛋白生产(美国专利号6,380,466);果实成熟(美国专利号5,512,466);增强的动物和人营养(美国专利号6,723,837;6,653,530;6,5412,59;5,985,605;6,171,640);或生物聚合物(美国专利号re37,543;6,228,623;5,958,745和美国专利公开号us20030028917)。还有抗环境压力性(美国专利号6,072,103);药物肽和可分泌肽(美国专利号6,812,379;6,774,283;6,140,075;6,080,560);改善的加工性状(美国专利号6,476,295);改善的消化性(美国专利号6,531,648);低棉子糖(美国专利号6,166,292);工业酶生产(美国专利号5,543,576);改善的风味(美国专利号6,011,199);固氮(美国专利号5,229,114);杂交种子生产(美国专利号5,689,041);纤维生产(美国专利号6,576,818;6,271,443;5,981,834;5,869,720);和生物燃料生产(美国专利号5,998,700)。
[0279]
在一个方面,通过本文提供的方法编辑的基因选自由y1基因、短枝2基因、ga3氧化酶基因和ga20氧化酶基因组成的组。在另一个方面,通过本文提供的方法编辑的基因编码非编码rna。在一个方面,通过本文提供的方法编辑的非编码rna选自由微小rna、小干扰rna、转移rna、核糖体rna、反式作用小干扰rna、天然存在的反义小干扰rna、异染色质小干扰rna及其前体组成的组。在再另一个方面,通过本文提供的方法编辑的基因编码mirna。在一个另外的方面,通过本文提供的方法编辑的基因编码前体mirna(pre-mirna)。
[0280]
在一个方面,本文提供的ga20氧化酶基因由编码与选自由seq id no:(ga20的插入蛋白序列)组成的组的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%同一性的蛋白质的mrna编码。在另一个方面,本文提供的短枝2基因由编码与选自由seq id no:(br2的插入蛋白序列)组成的组的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%同一性的蛋白质的mrna编码。
[0281]
在一个方面,本文提供的未修饰的等位基因包含与选自由seq id no:(列表ga和br2序列)组成的组的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%同一性或互补性的多核苷酸序列。
[0282]
在另一个方面,通过本文提供的方法编辑的非编码rna选自由微小rna、小干扰rna、转移rna、核糖体rna、反式作用小干扰rna、天然存在的反义小干扰rna、异染色质小干扰rna及其前体组成的组。
[0283]
实施例
[0284]
实施例1.经由靶向基因组倒位产生ga20氧化酶的显性等位基因
[0285]
产生crispr/rna引导核酸酶系统的两种功能性引导rna(grna),以靶向玉米基因
组中ga20氧化酶_5基因的侧接区域(左靶位点和右靶位点)。参见图1,分图a。这两个靶位点中的每一个在玉米基因组内都是独特的。植物激素赤霉素在包括萌发、细胞伸长、开花、胚胎发生和种子发育的许多植物发育过程中起重要作用。ga通路中的某些生物合成酶(例如,ga20氧化酶和ga3氧化酶)和分解酶(例如,ga2氧化酶)对于影响植物组织中的ga水平是关键的。
[0286]
使用适用于农杆菌转化的转移dna(t-dna)载体。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述两种grna的多核苷酸。
[0287]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,grna将核酸酶引导到ga20氧化酶_5基因中两个靶位点中的每一个,其中核酸酶在每个靶位点处产生双链断裂。
[0288]
在大多数事件中,靶位点之间的区域缺失,并且非同源末端连接修复机制连接侧接区域。不太频繁地,一些事件在左靶位点、右靶位点或两者处产生插入/缺失突变。而在其他事件中,使整个被靶向区域倒位,这被称为“完全倒位”。参见图1,分图b。使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含完全倒位的转化事件。选择在ga20氧化酶_5基因的5'端包含靶向完全倒位的转化胚,并使用本领域中的标准技术将其用于再生修饰的植物。
[0289]
不受任何科学理论的束缚,在ga20氧化酶_5的一个等位基因中存在完全倒位在天然ga20氧化酶_5启动子的控制之下产生反义mrna群。编辑的ga20氧化酶_5等位基因mrna的倒位区域与未编辑的ga20氧化酶_5等位基因mrna中的对应区域彼此互补,并且能够形成dsrna。因此,即使修饰的玉米植物对于编辑的ga20氧化酶_5等位基因可以是杂合的,编辑的等位基因也能够降低修饰的玉米植物中ga20氧化酶_5基因的表达。
[0290]
从被鉴定为包含ga20氧化酶_5基因的被靶向区域的完全倒位的修饰的玉米植物中提取rna。还从缺乏完全倒位的对照玉米植物中提取rna。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序)以证实ga20氧化酶_5的下调在包含被靶向区域的完全倒位的修饰的玉米植物中发生。
[0291]
实施例2.经由靶向基因组倒位产生br2的显性等位基因
[0292]
产生rna引导核酸酶系统的两种功能性引导rna(grna),以靶向玉米基因组中brachytic2(br2)基因的侧接区域(左靶位点和右靶位点)。这两个靶位点中的每一个在玉米基因组内都是独特的。
[0293]
使用适用于根癌农杆菌转化的转移dna(t-dna)载体。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到
编码上述两种grna的多核苷酸。
[0294]
将未成熟的玉米胚与含有t-dna载体的根癌农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,grna将crispr核酸内切酶引导到br2基因中两个靶位点中的每一个,其中crispr核酸内切酶在每个靶位点处产生双链断裂。
[0295]
在大多数事件中,靶位点之间的区域缺失,并且非同源末端连接修复机制连接侧接区域。不太频繁地,一些事件在左靶位点、右靶位点或两者处产生插入/缺失突变。而在其他事件中,使整个被靶向区域倒位,这被称为“完全倒位”。使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含完全倒位的转化事件。选择在br2基因的5'端包含靶向完全倒位的转化胚,并使用本领域中的标准技术将其用于再生植物。
[0296]
不受任何科学理论的束缚,在br2基因的一个等位基因中存在完全倒位在天然br2启动子的控制之下产生反义mrna群。编辑的br2等位基因mrna的倒位区域与未编辑的br2等位基因mrna中的对应区域彼此互补,并且能够形成dsrna。因此,即使玉米植物对于编辑的br2等位基因可能是杂合的,编辑的等位基因也能够降低玉米植物中br2基因的两个等位基因的表达,并因此导致短枝表型。
[0297]
实施例3.经由靶向基因组缺失产生ga20氧化酶的显性等位基因以使ga20氧化酶基因在两个反向取向的启动子的控制之下
[0298]
编码ga20氧化酶_5(也称为ga20ox5)的基因位于玉米染色体8上。其与编码s-腺苷-l-甲硫氨酸依赖性甲基转移酶超家族蛋白(下文中称为“samt”)的玉米基因grmzm2g049269相邻。samt是大的、冗余的基因家族的成员,并且没有报道在玉米或拟南芥属中存在与此基因的突变相关的表型。samt基因与ga20氧化酶_5基因相比以相反取向定位(即,samt基因被取向为从5'到3'读取,而ga20氧化酶_5基因被取向为在相同dna链上从3'到5'读取)。参见图2,分图a。
[0299]
产生了用于rna引导核酸酶系统的两种功能性引导rna(grna),以靶向ga20氧化酶_5基因和samt基因之间的基因组dna区域。第一grna靶向samt基因的转录起始位点附近的区域,并且第二grna靶向ga20氧化酶_5基因的转录终止位点附近的区域。这两个靶位点中的每一个在玉米基因组内都是独特的。使用适用于农杆菌转化的转移dna(t-dna)载体。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述两种grna的多核苷酸。
[0300]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,grna将核酸酶引导到在ga20氧化酶_5基因和samt基因之间的基因组dna区域中两个靶位点中的每一个,其中核酸酶在每个靶位点处产生双链断裂。
[0301]
在大多数事件中,靶位点之间的区域缺失,并且非同源末端连接修复机制连接侧接区域。使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含完全缺失的转化事件。选择在ga20氧化酶_5基因和samt基因之间包含靶向缺失的转化
胚,并使用本领域中的标准技术将其用于再生修饰的植物。
[0302]
不受任何科学理论的约束,通过去除ga20氧化酶_5基因和samt启动子之间的基因组dna,天然samt启动子可以产生ga20氧化酶_5基因的反义mrna转录物,而天然ga20氧化酶_5启动子产生ga20氧化酶_5基因的有义mrna转录物。ga20氧化酶_5基因的互补有义mrna转录物和反义mrna转录物能够形成dsrna,所述dsrna可以通过玉米细胞天然的rna沉默机制加工。参见图2,分图b。加工的dsrna然后可以阻抑两种ga20氧化酶_5等位基因的表达。另外,因为编码ga20氧化酶_3的mrna与有义ga20氧化酶_5转录物如此相似,预期samt启动子和ga20氧化酶_5基因之间的缺失也将下调ga20氧化酶_3的表达。还预期作为任何rnai或ptgs形式的阻抑的替代或补充,ga20氧化酶_5基因的阻抑或沉默可以通过如本文提供的其他机制(例如,无义介导的衰变)发生。
[0303]
从被鉴定为在samt启动子和ga20氧化酶_5基因之间包含靶向缺失的修饰的玉米植物中提取rna。还从缺乏所述缺失的对照玉米植物中提取rna。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序)以证实ga20氧化酶_5和/或ga20氧化酶_3的下调在包含被靶向区域的缺失的修饰的玉米植物中发生。
[0304]
实施例4.经由靶向基因组缺失产生br2的显性等位基因以使br2基因处于两个反向取向的启动子的控制之下
[0305]
编码br2的基因位于玉米染色体1上。其与在与br2相反的取向上表达的玉米基因grmzm2g491632相邻。产生了用于rna引导核酸酶系统的两种功能性引导rna(grna),以靶向br2基因和grmzm2g491632基因之间的基因组dna区域。第一grna靶向br2基因外显子1末端附近的区域,并且第二grna靶向grmzm2g491632基因外显子1的编码序列开始附近的区域。
[0306]
使用适用于农杆菌转化的转移dna(t-dna)载体。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述两种grna的多核苷酸。
[0307]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,grna将核酸内切酶引导到br2基因和grmzm2g491632基因之间的基因组dna区域中的两个靶位点中的每一个,其中核酸内切酶在每个靶位点处产生双链断裂。
[0308]
在大多数事件中,靶位点之间的区域缺失,并且非同源末端连接修复机制连接侧接区域。使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含缺失的转化事件。选择在br2基因和grmzm2g491632基因之间包含靶向缺失的转化胚,并使用本领域中的标准技术将其用于再生植物。
[0309]
不受任何科学理论的约束,通过去除br2基因和grmzm2g491632启动子之间的基因组dna,天然grmzm2g491632启动子可以产生br2基因的反义mrna转录物,而天然br2启动子产生br2基因的有义mrna转录物。br2基因的互补有义mrna转录物和反义mrna转录物可以形成dsrna,所述dsrna可以通过玉米细胞天然的rnai机器加工。然后,加工的dsrna可以阻抑两种br2等位基因的表达,导致短枝表型。
[0310]
实施例5.使用基因组编辑技术将设计的元件插入天然启动子中以产生显性等位基因。
[0311]
在拟南芥基因组中鉴定了包含根特异性启动子的基因。参见图3,分图a。此启动子用于驱动在植物根中gus的表达。参见图3,分图b。设计功能性grna以靶向根特异性启动子的tata盒上游的区域(“靶位点”)。使用适用于农杆菌转化的转移dna(t-dna)载体以将grna引入拟南芥属中。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述grna的多核苷酸。第二t-dna构建体包含编码供体分子的多核苷酸,所述供体分子包含将在lb序列和rb序列之间的靶位点处插入的设计的元件。在一个实施方案中,供体分子包含侧接有同源区域的设计的元件,所述同源区域与在靶位点任一侧上存在的序列同源。当将设计的元件插入基因的启动子区域中时,设计的元件能够使先前的根特异性基因在植物的所有组织中组成型表达。在另一个实施方案中,供体分子包含侧接有被t-dna载体1中的grna靶向的靶位点的设计的序列。
[0312]
使用上述载体,用浸花法转化拟南芥属。参见clough和bent,1998,plant j,16:735-743,其整体并入本文。在整合的多核苷酸表达后,grna将核酸酶引导到靶位点并在靶位点处产生双链断裂。对于包含侧接有同源臂的设计的序列的供体分子,拟南芥属细胞天然的同源修复机制在双链断裂的位点处插入设计的元件。对于包含侧接有grna靶位点的设计的序列的供体分子,grna引导核酸酶以在第二t-dna内产生双链断裂,由此释放设计的序列,然后所述设计的序列可以经由nhej(非同源末端连接)修复机制整合在基因组靶位点内。在插入事件的子集中,启动子以所期望取向插入。不受任何特定理论的约束,在tata盒上游存在设计的元件诱导基因在整个修饰的植物中的组成型表达,由此产生基因的显性等位基因。
[0313]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含设计的元件以所期望取向的靶向插入的转化事件。选择并进一步检查在靶位点处包含设计的元件的转化的拟南芥属植物。
[0314]
使用本领域的标准技术检查鉴定为在tata盒上游包含设计的元件的植物的gus表达(参见图3,分图d)。包含设计的元件的植物在整个植物中展现gus表达。参见图3,分图c。另外,从鉴定为包含设计的元件的修饰的拟南芥属植物的各种组织(例如,根、茎、叶、花序)中提取rna。还从缺乏设计的元件的对照拟南芥属植物中提取rna。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序)以证实gus在修饰的拟南芥属植物中更广泛地表达和/或更强烈地表达。
[0315]
实施例6.使用基因组编辑技术插入组织特异性阻抑元件以产生显性等位基因。
[0316]
使用本领域的标准技术产生拟南芥植物,其包含在启动子的控制之下在叶、维管和根组织中发挥功能的gus转基因。参见图4,此实施例中提供的概念的总体概述;和图5,分图a和分图b。设计功能性grna以靶向gus基因下游的区域(“靶位点”)。使用适用于农杆菌转化的转移dna(t-dna)载体以将grna引入拟南芥属中。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述
启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述grna的多核苷酸。第二t-dna构建体包含供体分子,所述供体分子在lb序列和rb序列之间包含叶特异性启动子,诸如coolair启动子(参见chen和penfield,science,2018,360:6392)。在一个实施方案中,供体分子包含侧接有同源区域的以反义取向的启动子,所述同源区域与在靶位点任一侧上存在的序列同源。反义取向的叶特异性启动子能够实现在表达启动子的组织(例如,叶组织)中gus反义mrna的表达。不受任何特定理论的约束,gus基因的反义rna转录物导致gus在叶组织中而不是在根组织中沉默。在另一个实施方案中,供体分子包含侧接有被t-dna载体1中的grna靶向的靶位点的启动子序列。
[0317]
使用上述载体,用浸花法转化拟南芥属。参见clough和bent,1998,plant j,16:735-743,其整体并入本文。在多核苷酸表达后,grna将核酸酶引导到靶位点并在靶位点处产生双链断裂。对于包含侧接有同源臂的反义取向的启动子的供体分子,拟南芥属细胞天然的同源修复机制在gus基因下游的双链断裂位点处插入叶特异性启动子,由此将启动子以gus基因的反义取向布置。对于包含侧接有grna靶位点的启动子的供体分子,grna引导核酸酶以在第二t-dna内产生双链断裂,由此释放启动子序列,然后所述启动子序列可以经由nhej(非同源末端连接)修复机制整合在基因组靶位点内。在插入事件的子集中,启动子以反义取向插入。不受特定理论的约束,反义叶特异性启动子的存在诱导在植物的整个叶组织中gus的表达降低,由此产生所述基因的显性等位基因。
[0318]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含启动子以所期望取向的靶向插入的转化事件。选择并进一步检查在靶位点处包含叶特异性启动子的转化的拟南芥属植物。
[0319]
使用本领域的标准技术检查鉴定为在gus基因下游包含以gus基因的反义取向的叶特异性启动子的植物的gus表达(参见图5,分图d)。包含以gus基因的反义取向的叶特异性启动子的植物仅在根组织中展现出gus表达。参见图5,分图c。另外,从鉴定为包含叶特异性启动子的修饰的拟南芥属植物的各种组织(例如,根、茎、叶、花序)中提取rna。还从缺乏以gus基因的反义取向的叶特异性启动子的对照拟南芥属植物中提取rna。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序)以证实叶组织中gus的表达降低。
[0320]
实施例7.使用基因组编辑技术插入组织特异性阻抑元件以产生显性ga20氧化酶_5等位基因。
[0321]
设计功能性grna以靶向ga20氧化酶_5基因的3'-utr下游的区域(“靶位点”)。使用适用于农杆菌转化的转移dna(t-dna)载体以将grna引入玉米细胞中。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述grna的多核苷酸。第二t-dna构建体包含供体分子,所述供体分子在lb序列和rb序列之间包含rtbv启动子。在一个实施方案中,供体分子包含侧接有同源区域的以反
义取向的rtbv启动子,所述同源区域与在靶位点任一侧上存在的序列同源。在另一个实施方案中,供体分子包含侧接有被t-dna载体1中的grna靶向的靶位点的启动子序列。反义取向的rtbv启动子能够实现在表达rtbv的组织(例如,茎和维管组织)中ga20氧化酶_5反义mrna的表达。不受任何特定理论的约束,ga20氧化酶_5基因的反义rna转录物导致ga20氧化酶_5和ga20氧化酶_3两者在茎和维管组织中的沉默。
[0322]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。在多核苷酸表达后,grna将核酸酶引导到靶位点并在靶位点处产生双链断裂。对于包含侧接有同源臂的反义取向的rtbv启动子的供体分子,玉米细胞天然的同源修复机制在ga20氧化酶_5基因的3'端下游的靶位点处插入反义rtbv启动子。对于包含侧接有grna靶位点的启动子的供体分子,grna引导核酸酶以在第二t-dna内产生双链断裂,由此释放启动子序列,然后所述启动子序列可以经由nhej(非同源末端连接)修复机制整合在基因组靶位点内。在插入事件的子集中,启动子以反义取向插入。
[0323]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含反义rtbv启动子的靶向插入的转化事件。选择在靶位点处包含反义rtbv启动子的转化胚,并使用本领域的标准技术将其用于再生修饰的植物。
[0324]
从鉴定为包含反义rtbv启动子的修饰的玉米植物的各种组织(例如,根、茎、叶、花序)中提取rna。还从在靶位点处缺乏反义rtbv启动子的对照玉米植物中提取rna。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序)以证实在包含反义rtbv启动子的修饰的玉米植物中在茎和维管组织中ga20氧化酶_5和/或ga20氧化酶_3的表达与对照玉米植物相比降低。
[0325]
实施例8.使用基因组编辑技术工程改造截短的蛋白质以产生显性等位基因。
[0326]
a)工程改造ga20氧化酶截短的蛋白质:导致截短的蛋白质或蛋白质的无义突变的基因的靶向编辑可以产生显性等位基因。参见图6。玉米ga20氧化酶_5基因和ga20氧化酶_3基因在序列和结构方面高度相似。两种基因都包含三个外显子。grna被设计成在两种基因的外显子中引入编辑。
[0327]
使用适用于农杆菌转化的转移dna(t-dna)载体以将grna引入玉米细胞中。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述grna的多核苷酸。
[0328]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,grna将核酸酶引导到靶位点并在靶位点处产生双链断裂。不受特定理论的约束,细胞天然的非同源末端连接修复机制经常不完美地修复这类断裂,这可能导致一个或多个核苷酸的插入或缺失。这些对外显子的插入或缺失可以产生过早终止密码子(其将产生截短的蛋白质)或无义突变。过早终止密码子具有产生ga20氧化酶_5和ga20氧化酶_3的显性等位基因的能力。
[0329]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定在ga20氧化酶_5和/或ga20氧化酶_3基因中包含靶向插入或缺失的转化事件。选择在靶位点
处包含能够引入引起截短的蛋白质的过早终止密码子或无义突变的插入或缺失的转化胚并使用本领域的标准技术将其用于再生修饰的植物。
[0330]
从鉴定为包含鉴定的插入/缺失的修饰的玉米植物中提取蛋白质。使用本领域已知的合适方法(例如,western印迹;hplc;lc/ms;elisa;免疫沉淀)以证实已将截短的蛋白质或无义突变引入ga20氧化酶_5和/或ga20氧化酶_3基因。如bensen等,plant physiol.1990,94:77-84中所述进行额外的实验以证实茎和/或维管组织中赤霉酸的减少,所述文献以引用的方式整体并入本文。
[0331]
b)工程改造短枝2(br2)截短的蛋白质:设计grna以在来自玉米的短枝2基因的外显子内引入编辑。
[0332]
使用适用于农杆菌转化的转移dna(t-dna)载体以将grna引入玉米细胞中。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述grna的多核苷酸。
[0333]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,grna将核酸酶引导到靶位点,其中所述核酸酶在靶位点处产生双链断裂。不受特定理论的约束,细胞天然的非同源末端连接修复机制经常不完美地修复这类断裂,这可能导致一个或多个核苷酸的插入或缺失。这些对外显子的插入或缺失可以产生过早终止密码子(其将产生截短的蛋白质)或无义突变。过早终止密码子具有产生短枝2(br2)的显性等位基因的能力。
[0334]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定在br2基因中包含靶向插入或缺失的转化事件。选择包含能够在靶位点引入过早终止密码子(引起截短的蛋白质)或无义突变的插入或缺失的转化胚并使用本领域的标准技术将其用于再生修饰的植物。
[0335]
从鉴定为包含鉴定的插入/缺失的修饰的玉米植物中提取蛋白质。使用本领域已知的合适方法(例如,western印迹;hplc;lc/ms;elisa;免疫沉淀)以证实产生了br2截短的蛋白质。
[0336]
实施例9.在靶基因内产生倒位重复序列
[0337]
可以使用靶向编辑技术以将基因组基因座转化成当编辑的基因座被转录成rna时能够产生rnai诱导发夹的基因座。参见图7。在目标基因座处杂合的细胞中(例如,存在两种多态性等位基因),使用一种或多种核酸酶以在第一等位基因中产生两个双链断裂(例如,第一双链断裂和第二双链断裂)并且在第二等位基因中产生一个双链断裂(例如,第三双链断裂)。当核酸酶切割第一等位基因和第二等位基因时,侧接有第一双链断裂和第二双链断裂的第一等位基因的部分从基因组dna释放。在一种结果中,将第一等位基因的释放部分在取向上倒位并整合到第二等位基因中的第三双链断裂中,由此产生编辑的基因座,当所述编辑的基因座被转录时,其能够产生rnai诱导发夹。
[0338]
产生rna引导核酸酶系统的第一功能性引导rna和第二功能性引导rna(grna)。第一grna和第二grna分别与侧接玉米基因组中ga20氧化酶_5基因的第一等位基因的一部分
的第一靶位点和第二靶位点互补。第一grna还在第三靶位点(其与第一靶位点同源)与ga20氧化酶_5基因的第二等位基因互补,但由于第二靶位点处第一ga20氧化酶_5等位基因与第二ga20氧化酶_5等位基因之间的多态性,第二grna不与第二等位基因互补。
[0339]
构建适用于农杆菌转化的转移dna(t-dna)载体。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述第一grna和第二grna的多核苷酸。
[0340]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。在多核苷酸表达后,grna将核酸酶引导到ga20氧化酶_5基因中三个靶位点中的每一个,其中核酸酶在每个靶位点处产生双链断裂。
[0341]
在大多数事件中,第一ga20氧化酶_5等位基因中第一靶位点和第二靶位点之间的区域缺失,并且非同源末端连接修复机制连接侧接区域。不太频繁地,一些事件在第一靶位点、第二靶位点或两者处产生插入/缺失突变。而在其他事件中,第一等位基因的整个被靶向区域以倒位取向整合到第三靶位点处的双链断裂中。参见图7,分图d。使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定在第二ga20氧化酶_5等位基因中包含倒位的转化事件。选择在第二ga20氧化酶_5等位基因中包含倒位的转化胚,并使用本领域中的标准技术将其用于再生修饰的植物。
[0342]
不受任何科学理论的约束,在ga20氧化酶_5的一个等位基因中存在倒位产生了能够形成发夹结构的rna转录物群。这种发夹诱导细胞中的rnai机器,其导致ga20氧化酶_5rna转录物以显性方式下调(例如,编辑的等位基因和未编辑的等位基因两者都下调)。
[0343]
从鉴定为在第二等位基因中包含能够产生发夹rna转录物的倒位的修饰的玉米植物中提取rna。还从缺乏编辑的ga20氧化酶_5等位基因的对照玉米植物中提取rna。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序)以证实ga20氧化酶_5的下调在第二等位基因中包含能够产生发夹rna转录物的倒位的修饰的玉米植物中发生。另外,由于在ga20氧化酶_5和ga20氧化酶_3之间的序列相似性,ga20氧化酶_5的第二等位基因中的倒位也引起ga20氧化酶_3rna转录物的下调。
[0344]
实施例10.将mirna靶位点插入所期望基因组基因座中
[0345]
可以使用靶向编辑技术以将供体分子插入基因组基因座中的靶位点中。参见图8。如果将包含非编码rna靶位点的供体分子插入目标基因的5'-utr、外显子、内含子或3'-utr,则目标基因的rna转录或蛋白质翻译可以通过互补非编码rna阻抑。当目标基因是非编码rna(例如,mirna或sirna)的靶时,从目标基因裂解的mrna可以产生二级sirna,其可以进一步阻抑目标基因的转录或翻译。这种二级阻抑可以以显性方式起作用,因为二级sirna与插入和不插入非编码rna靶位点的等位基因互补。
[0346]
产生功能性引导rna(grna),其与ga20氧化酶_5基因3'-utr中的靶位点互补。构建适用于农杆菌转化的转移dna(t-dna)载体。所述t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含在植物细胞中可操作的启动子,所述启动子可操作地连接到编码以下的多核苷酸:a)rna引导/核酸酶;b)cp4-epsps标志基因;c)上述grna;和d)供体分子。供体分
子包含与mir166同源的21核苷酸序列,以及与在靶位点任一侧上的ga20氧化酶_5基因的3'-utr同源的第一同源区域和第二同源区域。
[0347]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。在多核苷酸表达时,grna将核酸酶引导到ga20氧化酶_5 3'-utr中的靶位点,其中核酸酶产生双链断裂。然后同源重组修复机制将供体分子插入靶位点,由此将mir166靶位点并入ga20氧化酶_5基因的3'-utr。
[0348]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含将mir166靶位点插入ga20氧化酶_5基因的3'-utr的转化事件。选择包含将mir166靶位点插入ga20氧化酶_5基因的3'-utr的转化胚,并使用本领域中的标准技术将其用于再生修饰的植物。
[0349]
不受任何科学理论的约束,ga20氧化酶_5中mirna结合位点的存在产生能够以显性负方式阻抑ga20氧化酶_5rna转录的二级sirna转录物群。
[0350]
从被鉴定为在ga20氧化酶_5基因的3'-utr中包含mir166靶位点插入的修饰的玉米植物中提取rna。还从缺乏编辑的ga20氧化酶_5基因的对照玉米植物中提取rna。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序)以证实ga20氧化酶_5的下调在修饰的玉米植物中发生。另外,由于ga20氧化酶_5和ga20氧化酶_3之间的序列相似性,ga20氧化酶_5基因中的mirna靶位点也能够引起ga20氧化酶_3rna转录物的下调。
[0351]
实施例11.通过产生截短的蛋白质产生显性负等位基因
[0352]
导致截短的蛋白质(例如,无义突变)的基因的靶向编辑可以产生显性负等位基因。在一个实施方案中,靶向基因编码蛋白质,所述蛋白质具有蛋白质:蛋白质相互作用结构域。参见图6。已知在多种植物物种中显性截短的蛋白质的实例。例如,对于在水稻中的faz1和在拟南芥中的agamous和soc1已知由截短的蛋白质引起的显性突变表型。肽clavata3(clv3)被加工成信号传导肽(cle),其被受体样激酶clv1和coryne(crn)以及受体样蛋白clv2结合以调控wuschel(wus)在分生组织中的表达。包含clv2的突变等位基因的玉米植物通常展现具有增加的籽粒行数的穗。不受特定理论的限制,当clv2突变时,wus表达可以增加,这导致分生组织大小增加,进而引起穗上籽粒行数增加。clv2包含细胞外结构域和跨膜结构域,其与crn形成复合物。截短的clv2蛋白可以以显性方式起作用以增加玉米中的分生组织大小。
[0353]
设计grna以在玉米中clv2的胞外结构域中引入终止密码子。使用适用于农杆菌转化的转移dna(t-dna)载体以将grna引入玉米细胞中。所述t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含在植物细胞中可操作的启动子,所述启动子可操作地连接到编码以下的多核苷酸:a)rna引导核酸酶;b)cp4-epsps标志基因;和c)上述grna。
[0354]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,grna将核酸酶引导到靶位点并在靶位点处产生双链断裂。不受任何理论的约束,细胞天然的非同源末端连接修复机制经常不完美地修复这类断裂,这可能导致一个或多个核苷酸的插入或缺失。这些对外显子的插入或缺失可以产生过早终止密码子(其将产生截短的蛋白质)或无义突变。这种突变可以产生clv2的显性负等位基因。
[0355]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定在
clv2基因中包含靶向插入或缺失的转化事件。选择在靶位点包含能够引起截短的蛋白质的插入或缺失的转化胚并使用本领域的标准技术将其用于再生修饰的植物。
[0356]
从鉴定为包含鉴定的插入/缺失的修饰的玉米植物中提取蛋白质。使用本领域已知的合适方法(例如,western印迹;hplc;lc/ms;elisa;免疫沉淀)以证实无义突变已被引入clv2基因。针对分生组织大小的增加进行穗籽粒行的额外表型筛选。还对来自修饰的植物和对照植物的切片分生组织进行光学显微镜检查以定量分生组织大小的增加。
[0357]
实施例12.使用工程化ppr蛋白防止靶基因的裂解
[0358]
三角状五肽重复(ppr)基因家族的成员在植物基因组中是常见的。许多ppr蛋白能够以序列特异性方式结合rna分子。ppr蛋白包含2-30个ppr基序,每个基序与rna分子中的单个核苷酸对齐。在ppr基序内,存在于两个或三个具体位置的氨基酸赋予核苷酸特异性。例如,非限制性地,当苏氨酸在位置6且天冬酰胺在1'位置时,ppr基序结合腺嘌呤核苷酸;当苏氨酸在位置6且天冬氨酸在位置1'时,ppr基序结合鸟嘌呤核苷酸;当天冬酰胺在位置6且天冬氨酸在位置1'时,ppr基序结合尿嘧啶(或胸腺嘧啶)核苷酸;并且当天冬酰胺在位置6且天冬酰胺或丝氨酸在1’位置时,ppr基序结合胞嘧啶核苷酸。
[0359]
非限制性地,工程化ppr蛋白可以通过至少两种建构策略产生。在第一策略中,ppr蛋白通过将每个ppr基序作为单独的块处理来构建,从而通过将多个期望的基序按顺序排列来构建ppr蛋白。然后,所得工程化ppr蛋白能够结合靶rna分子。然而,这种策略可能不总是起作用,因为每个ppr基序在1’位置和6位置之间包含内部支架,并且所述基序内支架在不同ppr蛋白质之间并不共享。第二策略利用预先存在的基序内支架。在第二策略中,1’位置和6位置的定点诱变用于编辑现有的ppr蛋白,使得其将对于新靶rna分子将具有特异性。
[0360]
工程改造包含ppr基序的工程化ppr蛋白,使得ppr蛋白可以特异性地结合到合适基因的mirna靶位点的核苷酸,并且ppr蛋白靶向细胞质。将编码工程化ppr蛋白的核酸序列插入适用于农杆菌转化的转移dna(t-dna)载体中。编码工程化ppr蛋白的核酸序列可操作地连接到靶基因的启动子或组成型启动子,以确保工程化ppr蛋白和靶基因mrna的重叠表达。编码工程化ppr蛋白和可操作地连接的启动子的核酸分子在t-dna构建体内定位在左边界(lb)序列和右边界(rb)序列之间。
[0361]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,工程化ppr蛋白得以表达并结合到互补的靶mrna。
[0362]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含编码工程化ppr蛋白的核酸分子的插入的转化事件。选择包含编码工程化ppr蛋白的核酸分子的插入的转化胚,并使用本领域的标准技术再生修饰的植物。
[0363]
不受任何科学理论的约束,工程化ppr蛋白结合到靶基因mrna,并防止微小rna阻抑靶基因。
[0364]
从鉴定为包含工程化ppr蛋白的修饰的玉米植物中提取rna和蛋白质。还从缺乏工程化ppr蛋白的对照玉米植物中提取rna和蛋白质。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序、western印迹、hplc、lc/ms、elisa、免疫沉淀)以证实与未修饰的对照玉米植物相比,在修饰的玉米植物中靶基因的表达增加。
[0365]
实施例13.使用与核酸酶偶联的工程化ppr蛋白裂解靶基因转录物
[0366]
如实施例12中所述工程改造包含nyn核酸酶结构域和ppr基序的工程化ppr蛋白,使得ppr蛋白可以特异性地结合到靶基因的某些核苷酸,并且ppr蛋白靶向细胞核。将编码工程化ppr蛋白的核酸序列插入适用于农杆菌转化的转移dna(t-dna)载体中。编码工程化ppr蛋白的核酸序列可操作地连接到靶基因的启动子或组成型启动子,以确保工程化ppr蛋白和靶基因mrna的重叠表达。编码工程化ppr蛋白和可操作地连接的启动子的核酸分子在t-dna构建体内定位在左边界(lb)序列和右边界(rb)序列之间。
[0367]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,工程化ppr蛋白得以表达并结合到互补的靶mrna。
[0368]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含编码工程化ppr蛋白的核酸分子的插入的转化事件。选择包含编码工程化ppr蛋白的核酸分子的插入的转化胚,并使用本领域的标准技术再生修饰的植物。
[0369]
不受任何科学理论的约束,工程化ppr蛋白结合到靶基因mrna,并且nyn核酸酶结构域裂解靶基因mrna。因此,靶基因的表达降低。
[0370]
从鉴定为包含工程化ppr蛋白的修饰的玉米植物中提取rna和蛋白质。还从缺乏工程化ppr蛋白的对照玉米植物中提取rna和蛋白质。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序、western印迹、hplc、lc/ms、elisa、免疫沉淀)以证实与未修饰的对照玉米植物相比,在修饰的玉米植物中靶基因的表达降低。
[0371]
实施例14.使用工程化ppr蛋白阻断靶基因转录物的翻译
[0372]
工程改造包含ppr基序的工程化ppr蛋白,使得ppr蛋白可以特异性地结合到由靶基因[基因x]编码的mrna的特异性核苷酸,并且ppr蛋白靶向细胞质。将编码工程化ppr蛋白的核酸序列插入适用于农杆菌转化的转移dna(t-dna)载体中。编码工程化ppr蛋白的核酸序列可操作地连接到靶基因的启动子或组成型启动子,以确保工程化ppr蛋白和靶基因mrna的重叠表达。编码工程化ppr蛋白和可操作地连接的启动子的核酸分子在t-dna构建体内定位在左边界(lb)序列和右边界(rb)序列之间。
[0373]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,工程化ppr蛋白得以表达并结合到互补的靶mrna。
[0374]
使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含编码工程化ppr蛋白的核酸分子的插入的转化事件。选择包含编码工程化ppr蛋白的核酸分子的插入的转化胚,并使用本领域的标准技术再生修饰的植物。
[0375]
不受任何科学理论的约束,工程化ppr蛋白结合到靶基因mrna,并防止mrna翻译成蛋白质。因此,靶基因的蛋白质翻译降低。
[0376]
从鉴定为包含工程化ppr蛋白的修饰的玉米植物中提取蛋白质。还从缺乏工程化ppr蛋白的对照玉米植物中提取蛋白质。使用本领域已知的合适方法(例如,western印迹、hplc、lc/ms、elisa、免疫沉淀)以证实在修饰的玉米植物中靶基因的蛋白质翻译降低。
[0377]
实施例15.系链引导寡核苷酸(tgoligo)的设计。
[0378]
cas9/sgrna复合物结合到包含靶链和非靶链的dsdna分子(图9)。cas9-pam相互作用发生在非靶链上;grna-dna退火发生在靶链上。ruvc(his840)和hnh(asp10)核酸酶结构
域分别切割非靶链和靶链(三角形)。cas9切割位点处的平端由cas9在非靶链的5'端(pam位置)和靶链的两个切割端(3'和5')保持就位。非靶链的3'切割端是自由的,并且向周围

翻起’。非靶链的3’自由

瓣'端可以是多达35个核苷酸,这可以足以用于特异性互补性结合。设计tgoligo(例如,与3'自由

瓣’端互补的ssdna分子),并且其可以用作整合所期望核苷酸修饰的模板。根据编辑的需要和设计,tgoligo可以是dna、rna或核苷酸的混合物。在核酸酶(例如,cpf1)提供从双链断裂(dsb)切割的突出端的情况下,突出端可以代替tgoligo或与tgoligo结合起作用。
[0379]
实施例16.cas9样核酸酶的工程改造。
[0380]
核酸酶如cas9可以重新用于植物中的结构和功能基因组学。各种二聚化结构域可以缀合到cas9以实现二聚化(图10)。例如,可以使用来自clonetech同二聚化或异二聚化idimerize系统的诱导型二聚化结构域来实现cas9二聚化。可以使用额外的二聚化系统,诸如andersen等,scientific reports 6,article number:27766(2016);以及miyamoto等,nature chemical biology 8(5):465-70(2012)中所述的那些。
[0381]
核酸酶如cas9也可以经工程改造以形成催化失活形式,诸如催化失活的cas9(dcas9)。dcas9在由grna指定的靶位点结合到dna,并产生可用于基于模板的编辑的环结构(图1)。dcas9可以经进一步修饰以与来自affymetrix或neb的ssdna结合结构域形成融合物,用于进一步促进基于模板的编辑(图1)。与单独dcas9的方法相比,预期用这种修改的dcas9-ssdna结合方案的编辑效率更高,因为ssdna模板与dcas9复合物结合,并将被带到grna靶的附近。
[0382]
实施例17.多个tgoligo和grna分子的引入。
[0383]
可以使用多种方法以将tgoligo与编辑组分(例如,核酸酶、grna)并入。基本上,可以以任何可用于递送核酸酶和grna的方式(转染、转化等)并入tgoligo。最佳方法取决于编辑组分递送系统和待编辑的靶生物体。例如,在rnp(核糖核蛋白-核酸酶和grna的复合物)可以在细胞膜上转染的哺乳动物系统中,tgoligo可以同时转染。或者,可以使用单个转录单元(stu)将核酸酶(cas9)和grna在同一转基因构建体中并入。类似地,tgoligo可以在相似的设计中并入(图12)。也可以使用多种构建体,诸如一种构建体用于核酸酶,一种构建体用于grna,以及一种构建体用于tgoligo-或者从包容性构建体到组合构建体和转染递送的其任何组合。对于包括在构建体中的tgoligo(诸如图12),这些将是基于rna的tgoligo。为了利用基于dna或混合核苷酸(dna rna)的tgoligo,可能将需要转染或其他递送机制。同样,如果任何tgoligo设计导致tgoligo含有与原始grna靶位点相同的grna pam识别位点,则可以修饰tgoligo序列以消除pam。
[0384]
实施例18.基于双grna方法的基因组编辑。
[0385]
设计侧接靶基因组区域的两种核酸酶/grna复合物,用于实现被侧接基因组区域的indel或完全倒位。(图1)。对于两种核酸酶/grna复合物,最常缺失被侧接基因组区域,并且nhej修复将两个切割位点重新组合在一起。在任一核酸酶 grna侧接位点处还存在indel(插入/缺失)突变。也可以以较低频率恢复被侧接基因组区域的完全倒位。
[0386]
实施例19.双grna方法的增强。
[0387]
对来自实施例18的双grna方法进行修改以提高基因组编辑效率。使用二聚化结构域(参见图10)、tgoligo(参见图9)或其组合可以增强侧接有两个grna靶位点的基因组区域
的完全敲除(缺失)的恢复(图13)。图13的分图1显示二聚化增强的敲除(ko)事件。图13的分图2显示tgoligo增强的ko事件。图13的分图3显示经由二聚化和tgoligo的组合增强的ko事件。图13的分图4显示tgoligo增强的倒位事件。不受任何理论的约束,tgoligo可以通过使用系链部分与被侧接区段的相对端的互补性促进倒位事件的恢复。tgoligo可以在长度上变化,用于与非靶链的3’瓣的互补以及超出瓣互补的模板系链延伸。
[0388]
与核酸酶(例如:cas9)或死核酸酶(例如:dcas9)(单独或与tgoligo结合)偶联的配对二聚化结构域也可以用于促进被侧接序列靶的倒位。图13的分图5显示二聚化增强的倒位事件。图13的分图6显示由核酸酶(例如:cas9)二聚化/失活和tgoligo的组合辅助的倒位事件。
[0389]
实施例20.通过tgoligo辅助的基因组倒位方法对玉米br2基因的基因组编辑。
[0390]
使用tgoligo辅助的倒位方法(如图13的分图4中所示)来编辑玉米br2基因,以产生显性敲除(ko)突变等位基因。基于基因组倒位的显性ko突变方法的基本原理描绘在图14中。实质上,使用两种grna。第一grna(左侧显示)靶向br2的第一外显子的末端;第二grna(右侧显示)识别相邻grmzm2g491632基因的起始密码子区域。侧接有这两种grna的基因组区段的倒位可以导致br2反义部分转录物。这种br2反义转录物是经由grmzm2g491632启动子活性产生的。调整这两种grna的相对位置可以在天然br2启动子的控制之下实现br2反义完整转录物(例如,移动左侧的第一grna以靶向br2基因的起始密码子区域)或br2反义转录物(例如,移动右侧的第二grna以靶向br2基因的终止密码子区域)。
[0391]
对于br2,参考序列列于seq id no:1(ncbi登录号ay366085)中,并且对于grmzm2g491632,参考序列列于seq id no:2(来自玉米gdb)中。grmzm2g491632是紧邻br2注释的基因;并且这两种基因彼此处于反向取向。seq id no:3是在br2近端的有义链的grna。seq id no:4是在grmzm2g491632近端的反义链的grna。
[0392]
设计对应于br2 grna(seq id no:3)的第一rna tgoligo以互补侧接grna靶位点的有义链,长度通常为约20nt。任选地,添加靶位点上游的20nt区段。br2 rna tgoligo的实例包括如seq id no:5所示的dna互补区段(用作dsb 3'瓣互补区域),其互补于seq id no:3,其中包括来自上游的10nt。接着,选择以反义链grna(seq id no:4)的pam的第一个碱基开始的具有至少20nt的序列,以产生包括pam的50nt序列(seq id no:6,用作系链区域)。随后,将3’瓣互补序列(seq id no:5)反转并附接至系链(seq id no:6)的末端以形成互补于有义grna和用于倒位的来自反义grna区段的模板的完整tgoligo(seq id no:7)。
[0393]
如下设计对应于grmzm2g491632grna (seq id no:4)的第二rna tgoligo:a)自参考序列(seq id no:2)反向互补侧接grna靶位点的反义链;b)选择以有义链grna(seq id no:3)的pam的第一碱基开始的至少20nt并反向互补。此实例是50nt,包括pam(seq id no:9);c)将3’瓣互补序列(seq id no:8)附接到系链(seq id no:9)的末端,以完成互补于有义grna和用于倒位的来自反义grna区段的模板的tgoligo设计(seq id no:10)。
[0394]
使用两种grna和第一tgoligo和第二tgoligo的组合编辑玉米br2基因座,以实现基因组倒位。预期br2和grmzm2g491632的所得倒位形成与seq id no:11具有高相似性(95% )的序列。
[0395]
实施例21.基于模板的基因组编辑或定点整合(sdi)的增强。
[0396]
可以使用核酸酶二聚化或失活、tgoligo或其组合以增强基于模板的编辑或定点
整合(sdi)在单个位置或多个位置的靶向。各种代表性方案描绘在图15中。在这些方案中,模板分子(不管其与基因组中的靶位点的同源性)通过具有二聚化结构域的核酸酶(cas9)复合物(图15的分图1至分图3)、tgoligo(未单独示出)或其组合(图15的分图4)被带到靶位点附近。dcas9可以用在模板上(图15的分图1)或者活性cas9可以帮助促进模板的整合(图15的分图2至分图4)。
[0397]
实施例22.对玉米y1基因的基因组编辑以产生显性等位基因。
[0398]
在产生传统隐性性状的显性等位基因方面测试图15中描绘的增强的基因组编辑方案。以下是玉米y1基因(seq id no:12)的分子设计的概述。
[0399]
对于y1,来自seq id no:12的第一外显子显示在seq id no:13中。为了制备反义模板,将seq id no:13反向互补成用作用于编辑的模板序列的seq id no:14(对应于图15的分图1和分图2中描绘的dcas9复合物和cas9复合物之间的模板序列)。y1(seq id no:12)的有义链grna在5-utr(seq id no:15)中。y1(seq id no:12)的反义链grna在3-utr(seq id no:16)中。这两个grna之间的区域对应于图15的分图1、分图2和分图4中描绘的cas9复合物之间的待替换的基因组序列。
[0400]
为了提供用于整合的模板(如图15的分图1和分图2中所描绘),在被(seq id no:15和16)靶向的grna靶位点之间添加seq id no:14。所得seq id no:17包含具有上游10nt的有义链grna位点seq id no:14和具有下游10nt的反义链grna位点。
[0401]
然后将此模板分子(seq id no:17)与grna(seq id no:15和16)配对,并用于遵循图15的分图1和分图2中描绘的方案进行编辑。为了利用tgoligo来进一步帮助促进模板(seq id no:17)的整合(参见图15的分图4),并入两个tgoligo(seq id no:18和19)。
[0402]
实施例23.对玉米br2基因的基因组编辑以产生显性等位基因。
[0403]
还在产生玉米br2基因(seq id no:1)的显性等位基因方面测试图15中描绘的增强的基因组编辑方案。以下是对于br2的分子设计的概述。
[0404]
设计新grna以能够类似于实施例20中所述的y1概念用反义模板替换br2基因。有义链grna提供在seq id no:20中并且反义链grna提供在seq id no:21中。这两个grna之间的区域对应于图15的分图1、分图2和分图4中描绘的cas9复合物之间的待替换的基因组序列。
[0405]
将br2基因的前250nt编码序列(seq id no:22)制成反义模板。使seq id no:22反向互补以产生br2外显子1反义序列模板(seq id no:23)。
[0406]
为了提供用于整合的模板(如图15的分图1和分图2中所描绘),将seq id no:23添加在由grna seq id no:20和21靶向的grna靶位点之间。seq id no:24包含具有上游3nt的有义链grna位点seq id no:23和具有下游10nt的反义链grna位点。
[0407]
然后将此模板分子(seq id no:23)与grna(seq id no:20和21)配对并用于遵循图15的分图1和分图2中描绘的方案进行编辑。为了利用tgoligo来进一步帮助促进模板(seq id no:24)的整合(参见图15的分图4),并入两个tgoligo(seq id no:25和26)。
[0408]
可以遵循上面对于编辑y1和br2玉米基因所示的实施例,以设计相邻的模板编辑或整合,如图15的分图3中所示。还将显而易见的是,虽然对于y1和br2提供的实施例使用这些基因的第一外显子的反义模板,但模板整合可能更细微,诸如改变核苷酸以改变天然蛋白质中的氨基酸,或更复杂,诸如整合非天然序列或基因。这在图16中进一步示出。
[0409]
如上所述在y1和br2的天然基因组区域中产生反义模板的潜在优点是使用天然启动子和基因表达元件来调控反义转录物以适当地实现杂合生物体中天然等位基因的基因沉默(例如,以显性方式)。
[0410]
实施例24.经由倒位y1基因头尾堆叠的基于基因组编辑的显性突变等位基因。
[0411]
上述实施例中描述的tgoligo和核酸酶二聚化概念也可以用于将倒位基因头尾堆叠在天然拷贝旁边。这将导致反义转录物以使基因表达沉默,并因此产生正常隐性性状的显性突变等位基因(例如,玉米y1基因、玉米br2基因、玉米ga20氧化酶基因(参见图17)。
[0412]
实施例25.基因组编辑以触发微蛋白干扰和显性阻抑。
[0413]
微蛋白是具有干扰较大多结构域蛋白的能力的短的单结构域蛋白。参见图6和图18。微蛋白的靶通常是作为活性同二聚体结合到dna的转录调控子。微蛋白通过形成不能结合到dna的非功能性异二聚体复合物干扰其靶。
[0414]
拟南芥微蛋白athb17在玉米中的表达展现显性表型(例如,抽穗时的穗重增加)。参见rice等,2014,plos one,9(4):e94238,其整体并入本文。不受任何理论的约束,athb17微蛋白与玉米转录阻遏蛋白形成无功能的异二聚体。异二聚体是无功能的,因此增加玉米基因的转录,所述玉米基因在不存在athb17微蛋白的情况下通常将被阻遏。
[0415]
选择athb17的玉米同源物zmhdz18作为基因组编辑的靶,以产生玉米微蛋白。zmhdz18是hd-zip ii成员,其包含紧邻亮氨酸拉链结构域的同源结构域、假定的n-末端阻遏结构域和氧化还原传感基序。不受特定理论的约束,zmhdz18微蛋白将与转录阻遏蛋白形成无功能的异二聚体,以增加通常受阻遏的基因的表达并展现显性表型。
[0416]
产生crispr/核酸酶系统的第一功能性引导rna和第二功能性引导rna(grna)。第一grna和第二grna分别与侧接玉米基因组中zmhdz18基因的一部分的第一靶位点和第二靶位点互补。侧接部分编码正常zmhdz18蛋白的氨基末端。
[0417]
构建适用于农杆菌转化的转移dna(t-dna)载体。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述两种grna的多核苷酸。
[0418]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,grna将核酸酶引导到zmhdz18基因中的靶位点,其中核酸酶在每个靶位点处产生双链断裂。
[0419]
在大多数事件中,zmhdz18基因中第一靶位点和第二靶位点之间的区域缺失,并且非同源末端连接修复机制连接侧接区域。使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定在zmhdz18基因中第一靶位点和第二靶位点之间包含缺失的转化事件。选择包含所述缺失的转化胚,并使用本领域中的标准技术将其用于再生修饰的植物。
[0420]
不受任何科学理论的约束,所述缺失产生编码zmhdz18微蛋白的显性zmhdz18等位基因。这种微蛋白可以与其他蛋白质形成同二聚体和异二聚体,以干扰玉米基因的转录,从而导致显性表型。
[0421]
从鉴定为在能够编码微蛋白的zmhdz18等位基因中包含缺失的修饰的玉米植物中提取rna和蛋白质。还从在zmhdz18中缺乏缺失的对照玉米植物中提取rna和蛋白质。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序)以证实玉米基因在zmhdz18下游的通路中的表达改变。使用额外的合适方法(例如,western印迹、hplc、lc/ms、elisa、免疫沉淀)以证实zmhdz18中的缺失产生微蛋白。
[0422]
根据本公开的详细描述,将显而易见的是,在不偏离如本文和所附权利要求中描述的本公开的精神和范围的情况下,可以有修改、变化和等效方面。此外,应当理解,本公开中的所有实施例都作为非限制性实施例提供。本文引用的所有参考文献都以引用的方式整体并入本文。
[0423]
实施例26:经由靶向基因组缺失产生mir1的显性正等位基因以使mir1基因处于上游启动子的控制之下。
[0424]
编码mir1蛋白(seq id no:100)的grmzm2g150276基因(seq id no:99)位于玉米染色体6上。预测mir1参与昆虫抗性并编码半胱氨酸蛋白酶,所述半胱氨酸蛋白酶响应于幼虫取食对一些鳞翅目害虫有抗性的玉米基因型而在螺层中积累(参见pechan等,plant cell.,2000(7):1031-40)。mir1基因邻近基因grmzm2g150302,并且以相同取向表达。参见图19,分图a。grmzm2g150302基因是木聚糖合酶的大的、冗余的基因家族的成员。假设grmzm2g150302启动子(seq id no:101)与限制于螺层的天然mir1基因表达相比具有更宽/扩大的表达谱。
[0425]
产生了用于rna引导核酸酶系统的两种功能性引导rna(grna),以靶向mir1基因和grmzm2g150302基因之间的基因组dna区域。第一grna靶向mir1基因的转录起始位点附近的区域,并且第二grna靶向grmzm2g150302基因的转录起始位点附近的区域。这两个靶位点中的每一个在玉米基因组内都是独特的。使用适用于农杆菌转化的转移dna(t-dna)载体。t-dna构建体在左边界(lb)序列和右边界(rb)序列之间包含几个表达盒。第一表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码rna引导核酸酶的多核苷酸。第二表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到cp4-epsps标志基因。所述构建体还包含以下表达盒,所述表达盒包含可在植物细胞中操作的启动子,所述启动子可操作地连接到编码上述两种grna的多核苷酸。
[0426]
将未成熟的玉米胚与含有t-dna载体的农杆菌共培养三天。将在lb序列和rb序列之间的多核苷酸整合到未成熟玉米胚的核基因组中。在整合的多核苷酸表达后,grna将核酸酶引导到在mir1基因和grmzm2g150302基因之间的基因组dna区域中两个靶位点中的每一个,其中核酸酶在每个靶位点处产生双链断裂。
[0427]
在大多数事件中,靶位点之间的区域缺失,并且非同源末端连接修复机制连接侧接区域。使用本领域已知的合适方法(例如,pcr、dna杂交(southern)印迹、测序)以鉴定包含完全缺失的转化事件。选择在mir1基因和grmzm2g150302基因之间包含靶向缺失的转化胚,并使用本领域中的标准技术将其用于再生修饰的植物。
[0428]
不受特定理论的约束,通过去除mir1基因和grmzm2g150302基因之间的基因组dna,天然grmzm2g150302启动子(seq id no:101)可以驱动mir1基因(seq id no:99)的转录,由此拓宽/扩展mir1基因的表达谱。参见图19,分图b。
[0429]
从来自被鉴定为在mir1基因和grmzm2g150302基因之间包含靶向缺失的修饰的玉
米植物的各种组织类型(例如,根、茎、叶、花序)中提取rna。还从缺乏所述缺失的对照玉米植物中提取rna。使用本领域已知的合适方法(例如,定量逆转录酶pcr、逆转录酶pcr、rna测序)以证实mir1基因在包含被靶向区域的缺失的修饰的玉米植物中更广泛地表达和/或更强烈地表达。
[0430]
实施例27.用于产生显性负缺失突变等位基因的构建体
[0431]
内源zm.ga20ox5基因在玉米基因组中由约550bp的基因间区域或如果在终止密码子之间测量,由1170bp的基因间区域与内源zm.samt基因分开,其中zm.samt基因定位在下游并且相对于zm.ga20ox5基因以相反取向来取向。包含zm.ga20ox5基因和zm.samt基因的基因组基因座或区域的序列提供在seq id no.35和36中。seq id no.35表示对应于zm.ga20ox5基因的有义链且包含zm.ga20ox5基因和zm.samt基因两者的ga20ox5-samt基因组基因座的序列(表2中的“ga20ox5_samt基因组序列”)。seq id no.36表示对应于zm.samt基因的有义链(zm.ga20ox5基因的反义链)且包含zm.ga20ox5基因和zm.samt基因两者的ga20ox5-samt基因组基因座的序列(表2中的“samt_ga20ox5基因组序列”)。包含zm.ga20ox5基因和zm.samt基因两者的基因组序列的元件或区域在下表2中通过参考seq id no.35和36中每一个的那些元件或区域的核苷酸坐标来注释。如本文所提出,如果在相邻zm.ga20ox5基因和zm.samt基因之间的基因组区域(可能包括那些基因的全部或部分)被缺失,则内源zm.samt基因启动子可以通过zm.ga20ox5基因的全部或部分驱动反义rna转录物的表达,所述反义rna转录物可以与自zm.ga20ox5基因和/或zm.ga20ox3基因的拷贝或等位基因中的一种或两种表达的单独rna转录物杂交。因为zm.ga20ox3基因和zm.ga20ox5基因在其各自的外显子编码区域中共有高水平的核苷酸序列相似性,所以从相反取向的zm.samt基因启动子表达的反义rna转录物可以与两种ga20氧化酶基因的转录物杂交并引起zm.ga20ox3基因和/或zm.ga20ox5基因中的一种或两种的阻抑或沉默。因此,在zm.ga20ox5基因和zm.samt基因之间具有缺失的突变等位基因可以通过引起内源zm.ga20ox5基因的一种或两种(野生型和/或突变体)拷贝或等位基因的阻抑或沉默而表现为显性或半显性负突变或等位基因,另外可能有内源zm.ga20ox3基因的一种或两种拷贝或等位基因的进一步阻抑或沉默。
[0432]
表2.zm.ga20ox5基因组区域和zm.samt基因组区域的基因组序列元件的注释
[0433]
[0434][0435]
图20示出通过经由基因组编辑缺失在zm.ga20ox5基因和其在相反方向取向的相邻zm.samt基因之间的基因组区域来产生靶向zm.ga20ox5基因的反义rna分子的概念。可以使用在基因组中在预期缺失的两端产生双链断裂的两种或更多种引导rna来产生缺失。自相反取向的zm.samt基因启动子产生的反义rna分子随后可以与有义zm.ga20ox5 rna转录物杂交并触发内源zm.ga20ox5基因的一种或两种拷贝或等位基因(野生型或突变体)的阻抑或沉默。图20提供可以通过rna干扰产生小rna的实施方案。然而,可以设想作为任何rnai或ptgs形式的阻抑的替代或补充,zm.ga20ox5基因的阻抑或沉默可以通过如本文提供的其他机制发生。假定zm.ga20ox3基因和zm.ga20ox5基因在其各自的编码区域共有高水平的核苷酸序列相似性,反义rna转录物也可以与zm.ga20ox3基因的rna转录物杂交并引起zm.ga20ox3基因和/或zm.ga20ox5基因中的一种或两种的阻抑或沉默。因此,在zm.ga20ox5
基因和zm.samt基因之间的缺失可以充当zm.ga20ox3基因和/或zm.ga20ox5基因中的一种或两种的显性或半显性负突变或等位基因。
[0436]
在图20中提供的说明性实施例中,使用一对引导rna,其包括具有设计成靶向zm.ga20ox5基因中的位点的靶向或间隔区序列的一种引导rna和具有设计成靶向zm.samt基因中的位点的靶向或间隔区序列的另一种引导rna。缺失的大小和在缺失末端的两个断裂点的位置可以通过选择与rna引导核酸内切酶一起使用哪些引导rna以产生基因组断裂来确定。通过在两个靶位点处产生双链断裂,可以产生间插区域的缺失,其将凝缩基因组基因座并使相反取向的zm.samt基因启动子更接近ga20ox5基因,使得zm.samt基因启动子可以驱动读过ga20ox5基因的至少一部分的反义rna转录物的表达。即使可能缺失ga20ox5基因的3'部分,ga20ox5基因的剩余5'部分也可以足以在zm.samt基因启动子的控制之下产生反义rna转录物或分子,所述反义rna转录物或分子引起zm.ga20ox3基因和/或ga20ox5基因的阻抑或沉默。因此,缺失突变体的单个拷贝或等位基因的存在可以以显性或半显性负方式起作用,以使玉米植物具有矮小、抗倒伏表型。
[0437]
zm.ga20ox5/zm.samt基因组区域中的缺失使用三种不同的用于转化的质粒载体构建体产生。每种载体构建体包含用于表达cpf1(或cas12a)的功能盒,并且除了选择标志基因和质粒维持元件之外,还包含用于表达引导rna的一个或两个功能盒。对于载体-1构建体和载体-2构建体,cpf1(或cas12a)表达盒包含玉米泛素启动子(seq id no:37),所述玉米泛素启动子可操作地连接到编码融合到两个核定位信号(seq id no:40和41)的野生型毛螺菌科细菌cpf1 rna引导核酸内切酶的序列(seq id no:38)。野生型cpf1表达盒还含有提供起始密码子的合成序列(atggcg)。对于载体-3构建体,cpf1(或cas12a)表达盒包含玉米泛素启动子(seq id no:37),所述玉米泛素启动子可操作地连接到编码融合到两个核定位信号(seq id no:42和43)的毛螺菌科细菌g532r/k595r突变体cpf1 rna引导核酸内切酶的序列(seq id no:39)。参见,例如gao,l.等,nature biotechnol.35(8):789-792(2017),其全部内容和公开内容以引用的方式并入本文。
[0438]
下表3提供由各载体构建体中的引导rna盒编码的各引导rna的靶位点、间隔区和靶向/间隔区序列。引导rna盒内的每个引导rna单元包含与lbcpf1酶相容的引导rna支架序列以及与其预期靶位点互补的独特间隔区或靶向序列。对于载体-2构建体,引导rna表达盒包含玉米rna聚合酶iii(pol3)启动子(seq id no:44),所述玉米rna聚合酶iii(pol3)启动子可操作地连接到编码具有由下表3中的sp1b dna序列和sp1f dna序列编码的靶向/间隔区序列的两种引导rna的序列,其中一种引导rna(sp1b)靶向zm.samt基因的第一外显子中的位点,并且另一种引导rna(sp1f)靶向zm.ga20ox5基因的第一内含子中的位点(还参见图21(上部分图),显示sp1b和sp1f(samt_408和ga20ox5_6531)的两个引导rna靶位点相对于包含内源zm.ga20ox5基因和zm.samt基因的基因组区域的布置)。
[0439]
载体-1构建体具有两个引导rna表达盒。载体-1构建体的一个引导rna表达盒包含玉米pol3启动子(seq id no:44),所述玉米pol3启动子可操作地连接到编码具有由下表3中的sp2f1 dna序列和sp2f2 dna序列编码的靶向/间隔区序列的两种引导rna的序列,其中一种引导rna(sp2f1)靶向zm.ga20ox5基因的第一外显子中的位点,且另一种引导rna(sp2f2)靶向zm.ga20ox5基因的第二外显子中的位点。载体-1构建体的另一个引导rna表达盒包含合成启动子,所述合成启动子可操作地连接到编码具有由下表3中的sp2b1 dna序列
和sp2b2 dna序列编码的靶向/间隔区序列的两种引导rna的序列,其中每种引导rna(sp2b1和sp2b2)靶向zm.samt基因的第一外显子中的不同位点。对于载体-1构建体,还参见图21的中间分图,其显示sp2f1、sp2f1、sp2b1和sp2b2(ga20ox5_7090、ga20ox5_1654、samt_304和samt_161)的四个引导rna靶位点相对于包含内源zm.ga20ox5基因和zm.samt基因的基因组区域的布置。
[0440]
载体-3构建体具有两个引导rna表达盒。载体-3构建体的一个引导rna表达盒包含玉米pol3启动子(seq id no:74),所述玉米pol3启动子可操作地连接到编码具有由下表3中的sp3f1 dna序列和sp3f2 dna序列编码的靶向/间隔区序列的两种引导rna的序列,其中每种引导rna(sp3f1和sp3f2)靶向zm.ga20ox5基因的第二内含子中的不同位点。载体-1构建体的另一个引导rna表达盒包含合成启动子,所述合成启动子可操作地连接到编码具有由下表3中的sp3b1 dna序列和sp3b2 dna序列编码的靶向/间隔区序列的两种引导rna的序列,其中一种引导rna(sp3b1)靶向zm.samt基因的第一外显子中的位点,且另一种引导rna(sp3b2)靶向zm.samt基因的5’utr中的位点。对于载体-3构建体,还参见图21的下部分图,其显示sp3f1、sp3f1、sp3b1和sp3b2(ga20ox5_1695_tyc、ga20ox5_1732_tyc、samt_8110_tyc和samt_8165_tyc)的四个引导rna靶位点相对于包含内源zm.ga20ox5基因和zm.samt基因的基因组区域的布置。
[0441]
表3.转基因构建体及其各自的靶位点和引导rna间隔区
[0442][0443][0444]
实施例28.ga20ox5基因的缺失突变等位基因的表征
[0445]
经由农杆菌介导的转化,用具有上面在实施例27中所述的构建体中的一种的转化载体转化近交玉米株系。使转化的植物组织生长到成熟的r0植物。使具有一种或多种独特基因组编辑的r0植物自交,以产生r1植物。为了表征所述编辑并回收在ga20ox5基因和samt基因之间具有缺失的植物,使用一对侧接预期缺失区域的pcr引物进行基于pcr的测定。对于表3中的所有三种载体使用相同的引物对(seq id no:55和56)。如果在ga20ox5基因和samt基因之间存在缺失,pcr测定将导致可以被测序的扩增子。然而,由于预期缺失的大尺寸,pcr测定在不存在较大缺失的情况下将不产生pcr产物。对于每种pcr测定,使用15μl pcr反应体积,其含有来自thermo fisher scientific的phusion pcr主混合物、3μl基因组dna模板和两种pcr引物。pcr扩增后,将3μl pcr混合物添加到21μl tris-edta缓冲液中,然后在zag仪器上分析是否存在表明ga20ox5-samt缺失的pcr产物。对pcr产物进行测序以确定ga20ox5-samt基因组基因座周围的每个缺失中产生的连接序列(参见表4)。
[0446]
选择在ga20ox5基因和samt基因之间具有缺失的r0植物,并且使其自交以产生r1植物。对r1植物进行定量pcr测定以确定ga20ox5-samt基因组基因座的接合性(参见表5)。对每株r1植物进行测序以确定ga20ox5-samt基因组基因座周围的所有缺失编辑。由于具有给定构建体的多种grna,多个缺失可以发生在r0植物的同一染色体上,并因此存在于r1植物中,其对于包含一个或多个基因组缺失的突变等位基因可以是纯合的或杂合的(参见表5)。在表5中,“纯合(homo)”是指对于突变等位基因是纯合的,而“杂合(hetero)”是指对于突变等位基因是杂合的。
[0447]
表4.使用表3中的载体进行的编辑的单独的缺失连接序列。
[0448]
[0449][0450]
表5.r0植物和r1植物的缺失编辑和基因型。
[0451]
[0452]
[0453]
[0454][0455]
实施例29.具有编辑的等位基因的玉米植物的降低的株高。
[0456]
使对于ga20氧化酶5基因的编辑的等位基因纯合或杂合(如实施例28中鉴定)的r1玉米植物以及野生型对照植物生长至成熟以测量其株高。将r1种子种植在土壤中,并在温室中在85
°
/70
°
的日/夜温度和16/8小时的光周期下使用玉米植物生长和发育的标准营养和光照条件生长至成熟。在r2生长阶段,从土壤水平线到最上面的完全展开的叶子的基部测量r1植物的株高(pht)。
[0457]
表6提供对于使用实施例27中所述的载体-2构建体或载体-1构建体形成的在ga20ox5基因和samt基因之间的缺失编辑纯合的单独r1植物以及野生型(wt)对照植物的株高。wt和各纯合缺失编辑的平均株高也提供在表6中(还参见图22,显示具有误差条的平均株高)。这些株高证明,相对于wt对照的78.5英寸的平均株高,对于在ga20ox5基因和samt基
因之间包含缺失的编辑的ga20氧化酶5等位基因纯合的植物对于具有编辑的等位基因的植物具有在57.3英寸和70.1英寸之间的显著降低的平均株高。
[0458]
表7提供对于使用实施例27中所述的载体-2构建体形成的在ga20ox5基因和samt基因之间的缺失编辑纯合或杂合的单独r1植物以及野生型(wt)对照植物的株高(还参见图23,显示具有误差条的平均株高)。表7中的数据与表6重叠,因为对于使用载体-2构建体形成的缺失编辑纯合的r1植物和野生型对照植物与表6中的植物相同。这些株高证明,相对于wt对照植物的78.5英寸的平均株高,对于包含在ga20ox5基因和samt基因之间且使用载体-2构建体形成的缺失的编辑的ga20氧化酶5等位基因杂合或纯合的植物对于对这些编辑的等位基因纯合的植物具有在57.3英寸和64英寸之间的显著降低的平均株高,和对这些编辑的等位基因杂合的植物具有在60.5英寸和67英寸之间的显著降低的平均株高。株高的降低在对于缺失编辑等位基因纯合和杂合的植物之间是相似的,但是对于包含缺失编辑等位基因的植物而言,不管接合性如何,株高总体上显著低于野生型对照植物的株高。
[0459]
此实施例中描述的株高数据证明,与野生型对照植物相比,对于对编辑的缺失等位基因纯合或杂合的植物,在ga20ox5基因和samt基因之间的区域的缺失引起株高降低,这表明ga20氧化酶5基因的这些缺失等位基因以显性或半显性方式起作用,产生降低株高表型(半矮小或矮小的玉米植物),特别是因为已经显示没有反义或倒位序列的单独ga20氧化酶3基因或ga20氧化酶5基因的编辑的功能缺失等位基因不产生矮小的玉米植物。参见,例如公开的pct申请号wo/2019/161149、wo/2019/161147和wo/2019/161144,其全部内容和公开内容以引用的方式并入本文。将在后续世代中进行进一步的株高测量以证实较矮株高表型。
[0460]
表6.使用载体-2和载体-1的纯合r1植物的株高。
[0461]
[0462][0463]
表7.使用载体-2的纯合r1植物和杂合r1植物的株高。
[0464]
[0465][0466]
实施例30.用于分子测定的来自r2植物的样品的收集。
[0467]
对于来自载体-1构建体的e220141和e221089缺失编辑,使对那些缺失编辑纯合的r1植物(分别地p43596991和p43596831)自交,以产生纯合的近交r2植物。使含有e220141和
e221089编辑之一的r2近交植物和相同近交系的野生型对照植物在温室中在标准条件下生长,并且在v2生长阶段取样以用于下文所述的分子测定。将植物在刚好高于土壤水平线之处切割,并且将植物的整个地上部分置于50ml锥形管中并立即在液氮中冷冻。每个样品含有一株或两株相同基因型的同胞植物。用于每种测定和基因型的样品的数目提供在表8中。研磨冷冻样品并将其用于以下实施例31和32中所述的小rna测定和ga激素测定。
[0468]
表8.用于小rna测定和ga激素测定的样品的描述。
[0469][0470]
实施例31.具有编辑的缺失等位基因的植物中的小rna的检测。
[0471]
为了产生用于测序的小rna文库,根据制造商的协议(文献#15004197v02)使用illumina的truseq小rna文库制备试剂盒,其中在文库纯化步骤进行了修改。在上述实施例30中鉴定用于这个小rna测定实验的每种基因型的样品。cdna扩增后,使用6%novex tbe page凝胶对单独的文库进行凝胶纯化,用于大小分离。用1xsybr gold染色凝胶20分钟。在illumina的nextseq平台上对最终文库产物进行测序,其中每个样品具有3百万个读段的最小深度。测序后,通过以下步骤加工读段:修剪测序衔接子;去除匹配管家非编码rna的读段,并将文库标准化为每百万的读段。对于每种基因型测定1至9个样品。
[0472]
预测含有e220141和e221089缺失编辑的突变的ga20氧化酶5(ga20ox5)基因在下游天然samt启动子的控制之下以反向取向产生跨越ga20ox5基因的编码序列的全部或部分的反义rna转录物,所述反义rna转录物可以与自野生型和/或突变ga20氧化酶5等位基因和/或ga20氧化酶3基因或等位基因表达的mrna转录物杂交。由于反义rna序列可以触发rna干扰(rnai)和编码相同或同源rna序列的基因的阻抑,因此对于小rna的存在,测定含有缺失编辑的植物。预期双链rna的加工将产生对应于ga20ox5基因的编码序列的长度为约21、22或24个核苷酸的小rna。在此实验中,编辑的r2植物以及野生型对照植物在21、22或24-核苷酸的小rna范围内没有显示对应于ga20ox5基因的小rna的显著积累,其测量为每百万个总测序读段中有0或1个读段(数据未显示)。这些数据表明,编辑的植物在此实施例中取样的v2生长阶段没有产生小rna,或者通过不同的显性负机制起作用。然而,与ga20氧化酶5基因的编辑序列的全部或部分互补的反义rna转录物的表达模式也依赖于samt基因启动子,其可能在v2生长阶段不驱动表达(或足够高水平的表达)从而对小rna的水平产生可测量影响。不受理论的束缚,有可能来自内源ga20ox5基因的编辑的缺失等位基因的反义转录物的表达在发育的后期阶段可能更稳健,并且因此在那些后期阶段对小rna水平和rnai阻抑具有更大或更可测量的影响。
[0473]
将来的实验也将试图确定ga20ox3和/或ga20ox5 mrna转录物的水平在对于在ga20ox5基因和samt基因之间具有缺失的编辑的ga20ox5等位基因为纯合或杂合的植物中相对于对照是否降低。
[0474]
实施例32.具有编辑的缺失等位基因的植物中的ga激素的检测
[0475]
ga20氧化酶基因的表达降低可以改变玉米植物中ga激素的水平,其反过来可以影
响株高,其中较低水平的活性ga潜在地降低株高。在含有编辑的ga20ox5等位基因的植物中测量生物活性ga激素及其前体的水平。ga20氧化酶在ga生物合成通路中是有活性的,并且催化代谢中间体ga12和ga53分别依次氧化成ga9和ga20(“早期13-羟基化通路”和“非13-羟基化通路”)。ga的主要生物活性形式包括ga1、ga3和ga4,它们在生物合成通路中是ga20氧化酶活性以及的ga9和ga20中间体的更下游(3')。ga20氧化酶基因的表达水平和/或酶功能的降低或阻抑,如用ga20ox5缺失编辑可预期的,可以引起下游代谢物(ga20和ga9)的减少和上游前体(ga53和ga12)的积累。
[0476]
对于此实验,如以上实施例30中所提供收集样品。提取新鲜冷冻的植物样品组织,并使用waters固相提取max套筒板清洁。使用与absciex5500质谱耦联的uplc,用mrm方法分析ga激素和2种内标。基于校准曲线用absciex软件multi-quan计算最终ga激素值。每条ga激素校准曲线都有良好的线性拟合,r2线性回归>0.99。对于每种激素还包括每个96孔板8种技术对照物,并且在分析过程中评价以满足标准。ga水平以皮摩尔/克样品组织测量。
[0477]
如图24中显示,相对于野生型对照植物,ga12的水平在对编辑的e221089等位基因纯合的近交植物中增加,但在对编辑的e220141等位基因纯合的近交植物中在统计学上是中性的或未改变的。如图24中进一步显示,相对于野生型对照植物,ga9的水平在对编辑的e220141等位基因纯合的近交植物中降低,但在对编辑的e221089等位基因纯合的近交植物中是中性的。
[0478]
如图25中显示,相对于野生型对照植物,在对编辑的等位基因(e221089或e220141)中任一种纯合的近交植物中ga20的水平降低。如图25中进一步显示,相对于野生型对照植物,在对编辑的等位基因(e221089或e220141)中任一种纯合的近交植物中ga53的水平增加。
[0479]
图26提供相对于野生型对照,在编辑的近交植物的v2生长阶段收集的样品中测量的活性ga(ga1、ga3和ga4)的水平的结果。如图26中显示,除了在对编辑的等位基因(e221089或e220141)中任一种纯合的近交植物中ga4增加之外,这些活性ga的水平在对编辑的等位基因(e221089或e220141)纯合的近交植物中总体在统计学上是未改变的。
[0480]
这些数据支持如下理论:反义转录物可以从在相邻ga20氧化酶5基因和samt基因之间具有缺失的编辑的ga20氧化酶5基因、等位基因或基因座表达,这可以降低ga20氧化酶5基因和/或ga20氧化酶3基因的表达水平,并因此影响含有编辑的等位基因的植物中ga激素的水平。此实验中的数据显示,在含有编辑的ga20氧化酶5等位基因的植物中,ga12和ga53前体在ga20氧化酶活性上游(5')的积累增加并且ga20氧化酶活性的ga9和ga20产物的水平降低,尽管在编辑的e220141和e221089近交植物中ga12和ga9的水平分别未改变。
[0481]
尽管在此实施例中未显示生物活性ga的水平降低,但这可能是由于在收集植物组织样品用于此实验时的早期v2生长阶段。实际上,与ga20氧化酶5基因的编辑序列的全部或部分互补的反义rna转录物的表达模式依赖于samt基因启动子,其可能在早期v2生长阶段不驱动表达(或足够高水平的表达)从而对活性ga的水平产生可测量影响。不受理论的束缚,有可能来自内源ga20ox5基因的编辑的缺失等位基因的反义转录物在内源samt基因启动子的控制之下的表达在发育的后期阶段可能更稳健,并且因此在那些后期阶段对活性ga的水平具有更大或更可测量的影响。活性ga也是ga20氧化酶活性的更下游而不是直接的产物。未来的实验将确定在对在ga20ox5基因和samt基因之间包含缺失的编辑的ga20氧化酶5
基因座杂合或纯合的植物中在发育的后期阶段是否观察到较低的活性ga水平,这得到此实施例中在早期v2生长阶段观察到的ga前体水平改变的支持。
[0482]
实施例33.通过基因组编辑产生显性等位基因以产生含发夹的转录物
[0483]
图27提供用于通过靶向基因编辑产生zm.ga20ox3基因座的基因组修饰以编码具有倒位序列的rna转录物的说明性实例,所述倒位序列可以与所述rna转录物的对应序列杂交以产生茎环结构,从而引起内源zm.ga20ox3基因座和zm.ga20ox5基因座处拷贝或等位基因中的一种或两种的阻抑。zm.ga20ox3基因和zm.ga20ox5基因在其各自的外显子区域具有高水平的核苷酸序列相似性。因此,与zm.ga20ox3基因的对应序列共有充分的序列同一性或同源性的zm.ga20ox5基因的片段在对应zm.ga20ox3序列附近以反向取向插入zm.ga20ox3基因中的预选位点,所述片段可以与对应序列杂交以形成茎环结构并触发zm.ga20ox3基因和zm.ga20ox5基因的阻抑。通过设计指导双链基因组dna裂解的引导rna来确定插入位点。不受任何特定理论的约束,编辑的zm.ga20ox3基因产生能够形成茎环结构的转录物,所述转录物可以诱导zm.ga20ox3基因和zm.ga20ox5基因的野生型或其他等位基因的阻抑或基因沉默。在此实施例中,插入的zm.ga20ox5片段可以从内源zm.ga20ox5基因的拷贝或等位基因切除。这种类型的编辑被称为跨片段靶向(tft)编辑,因为所述片段源自内源zm.ga20ox5基因。切除片段的边界由一对适当设计的引导rna限定。根据此实施例,插入的zm.ga20ox5片段也可以从供体模板切除,所述供体模板是包含所期望zm.ga20ox5片段且侧接有引导rna的靶位点的双链dna分子。侧接grna靶位点可以是相同的,利用相同的grna,或不同的,并且根据一些实施方案,取向为限制裂解后dna插入片段中包括的grna靶位点的量。这些靶位点可以与内源基因组匹配,是人工衍生的,或者相对于待编辑的植物的内源基因组,与非内源基因组匹配。根据一些实施方案,侧接用于插入内源基因座的待切除的供体模板的插入片段的靶位点相对于天然或内源基因组可以是异源的,使得内源基因组内的任何脱靶dna裂解可以最小化或消除。当与被靶向以从内源zm.ga20ox5基因座中切除片段的引导rna组合进行时,这种方法被称为“模板辅助的”。相反地,zm.ga20ox3片段可以经由tft从zm.ga20ox3基因的拷贝或等位基因和/或从供体模板(例如,模板辅助方法)切除并插入内源zm.ga20ox5基因的预选位点以产生倒位重复序列,所述倒位重复序列可以转录成包含茎环结构的rna转录物,所述rna转录物触发zm.ga20ox3基因和/或zm.ga20ox5基因的野生型或其他等位基因的rna介导的阻抑或沉默。
[0484]
然而,使用这些方法中的任一种,有可能形成其他类型的编辑或突变,诸如缺失和/或倒位,这取决于在grna或编辑靶位点处产生的dna切割或断裂以及插入那些切割位点之中或之间的片段。插入的dna片段可以源自zm.ga20ox3基因或zm.ga20ox5基因的拷贝或等位基因或者源自dna模板分子。因此,通过切割一个或多个靶位点可以产生缺失,和/或通过相对于编辑的zm.ga20氧化酶基因的编码序列以相反、反向或反义取向插入dna片段可以产生倒位序列。所述倒位可以存在于具有或不具有对应序列的编辑的基因中,所述对应序列在表达时可以与从编辑的基因转录的mrna的编码的倒位序列杂交以形成rna发夹或茎环结构。没有对应序列的反义倒位序列和所得发夹或茎环结构的存在可以足以通过规范或非规范rna机制触发zm.ga20ox3基因和zm.ga20ox5基因中的一种或两种的阻抑。
[0485]
设计植物转化构建体(载体-4)以在zm.ga20ox3基因中产生双链断裂(dsb),以允许来自内源zm.ga20ox5基因座或外源提供的供体模板的zm.ga20ox5基因的反义dna片段的
插入。在此实施例中,构建体总体含有4个与基因编辑和在编辑的基因中产生插入(例如,倒位)有关的功能区域或盒:cpf1或cas12a变体蛋白的表达,zm.ga20ox3基因基因座的三种引导rna的表达,zm.ga20ox5基因基因座的额外三种引导rna的表达,和包含zm.ga20ox5基因片段的供体模板区域,其用于自供体模板插入zm.ga20ox5基因片段(长度为大约400个核苷酸)的模板辅助方法。每个引导rna单元含有与cpf1突变体相容的共同支架和与其预期靶位点互补的独特间隔区/靶向序列。
[0486]
cpf1表达盒包含玉米泛素启动子(seq id no:37),所述玉米泛素启动子可操作地连接到编码融合到两个核定位信号(seq id no:42和43)的毛螺菌科细菌g532r/k595r突变体cpf1 rna引导核酸内切酶的序列(seq id no:39)。参见,例如gao,l.等,nature biotechnol.35(8):789-792(2017),其全部内容和公开内容以引用方式并入本文。
[0487]
一个表达盒包含编码三种引导rna的序列(两种引导rna具有由下表9中的sp1 dna序列和sp2 dna序列编码的靶向/间隔区序列(也参见图27),所述靶向/间隔区序列靶向zm.ga20ox3基因的外显子1中两个紧密间隔的位点;且另一种引导rna具有由下表9中的sp3 dna序列编码的靶向/间隔区序列(也参见图27),所述靶向/间隔区序列靶向zm.ga20ox5基因的外显子1中的位点),所述序列可操作地连接到玉米rna聚合酶iii(pol3)启动子(seq id no:44)。间隔区序列sp1和sp2靶向zm.ga20ox3的外显子-1中的两个替代断裂位点,所述断裂位点间隔约68个核苷酸,并且任一断裂位点能够接受反向互补插入片段,或者所述插入片段可以替换sp1和sp2之间的序列。还有可能插入片段可以在sp1靶位点和sp2靶位点二者处整合。
[0488]
另一个表达盒包含编码额外三种引导rna的序列(两种引导rna具有由表9中的sp4 dna序列和sp5 dna序列编码的靶向/间隔区序列(也参见图27),所述靶向/间隔区序列靶向zm.ga20ox5基因的外显子1中两个紧密间隔的靶位点;且另一种引导rna具有由表9中的sp6 dna序列编码的靶向/间隔区序列(也参见图27),所述靶向/间隔区序列靶向侧接供体模板区域中的zm.ga20ox5基因片段的两个相同的工程化位点),所述序列可操作地连接到合成启动子。间隔区序列sp3或sp4靶向内源zm.ga20ox5基因的外显子-1中的两个替代断裂位点,所述断裂位点间隔约83个核苷酸,而间隔区序列sp5靶向内源zm.ga20ox5基因的外显子-1中的另一个断裂点,所述断裂点与sp4间隔区的裂解位点间隔约577个核苷酸的更大距离。靶向/间隔区序列sp6来源于大豆pds基因,其已被单独证明与cpf1组合作用以指导大豆植物的内源pds基因中靶位点的裂解。
[0489]
设计另一种几乎相同的植物转化构建体(载体-5)以在zm.ga20ox3基因中产生双链断裂(dsb),以允许zm.ga20ox5基因的反义dna片段的插入,但此第二构建体不编码具有由用于模板辅助方法的sp6 dna序列编码的靶向/间隔区序列的引导rna,使得所述片段将源自zm.ga20ox5基因的内源拷贝。
[0490]
对于此实施例中所述的构建体,具有间隔区sp3和sp4的引导rna可以与具有间隔区sp5的引导rna组合起作用,将由内源zm.ga20ox5基因的外显子-1产生约500bp至700bp的片段,所述片段可以以反向互补取向插入内源zm.ga20ox3基因的外显子-1内的位点,使得从内源zm.ga20ox3基因转录的rna分子形成rna转录物中的茎环结构,所述茎环结构可以触发内源zm.ga20ox3基因和/或zm.ga20ox5基因的一种或多种其他拷贝或等位基因的阻抑或沉默。所得片段可以被称为sp3-sp5片段(seq id no:76)或sp4-sp5片段(seq id no:77),
id no表示)。为了避免重复,仅在表10和表11的第一行中为每个编辑id提供倒位类型以及编码和倒位序列。表10中的编辑id e270933和e271059用载体-4构建体产生,并且表11中的编辑id e376333和e376314(以及编辑id e376274)使用载体-5构建体产生。额外的编辑用这些构建体产生,但在r1植物/种子中没有回收到,具有其他t-dna插入和/或不产生小rna,因此被丢弃且不进行进一步测试。用包含插入ga20ox3 sp1靶位点的倒位ga20ox5 sp4-sp5片段的载体-5构建体产生的编辑id e376274在r1植物/种子中没有回收到,因此未进一步使用。对于ga20氧化酶3基因的编辑id e376274具有seq id no:97的基因组编码序列和seq id no:98的倒位序列。
[0498]
表10和表11还提供关于可以存在于ga20氧化酶5基因中的可能的简单/小或大的编辑或缺失的信息。简单或小的缺失也可以在内源ga20氧化酶5(ga20ox5)基因中在单独的sp3、sp4和sp5靶位点中的一个或多个处存在,并且大的缺失可以在内源ga20ox5基因中跨越sp3/sp5或sp4/sp5靶位点之间存在。对于载体-5构建体,表11提供根据编辑id分组的r1植物的汇总信息和数目。如表10和表11中可见,r0植物和r1植物在许多情况下在ga20ox5基因座中确实含有一个或多个编辑或缺失,尽管并未确定一些r1植物(在表中以“未知”表示)在ga20ox5基因中含有编辑或缺失。在其他情况下,没有确定编辑的ga20ox5等位基因的接合性,因此将其以“纯合或杂合”表示。然而,存在于r0植物和r1植物中的编辑的ga20ox5等位基因在后续世代中被去除并与编辑的ga20ox3等位基因分离。
[0499]
表10.对于载体-4在r0植物和r1植物中的编辑倒位和接合性
[0500]
[0501][0502]
表11.对于载体-5在r0植物和r1植物中的编辑倒位和接合性
[0503]
[0504][0505]
实施例35.具有编辑的等位基因的玉米植物的降低的株高
[0506]
使对于具有实施例34中鉴定的对应倒位的ga20氧化酶3基因的编辑的等位基因杂合的r1玉米植物以及野生型对照植物生长至成熟以测量其株高。将r1种子种植在土壤中,并在温室中在85℉/70℉(29.4℃/21.1℃)的日/夜温度和16小时光/8小时暗的光周期下使用玉米植物生长和发育的标准营养和光照条件生长至成熟。在r2生长阶段,从土壤水平线到最上面的完全展开的叶子的基部测量这些r1植物的株高(pht)。表12提供对于两个发夹倒位编辑之一杂合的单独r1植物以及野生型对照植物的株高。还提供对于wt和每个编辑的平均株高(还参见图28,显示具有误差条的平均株高)。
[0507]
这些株高证明,相对于wt对照的64.2英寸的平均株高,对于包含倒位序列的编辑的ga20氧化酶3等位基因杂合的植物对于这两种编辑的等位基因具有平均54.0英寸或57.3英寸的降低的株高。
[0508]
此实施例中显示的株高数据证明,与野生型对照植物相比,对于包含反义倒位序列的ga20氧化酶3基因的编辑的等位基因杂合的植物具有显著降低的株高,这表明ga20氧化酶3基因的这些编辑的发夹倒位等位基因以显性或半显性方式起作用,以产生株高降低表型(即,半矮小或矮小玉米植物),特别是因为已证实没有反义或倒位序列的单独ga20氧化酶3基因或ga20氧化酶5基因的编辑的功能缺失等位基因不产生矮小的玉米植物。参见,例如公开的pct申请号wo/2019/161149、wo/2019/161147和wo/2019/161144,其全部内容和公开内容以引用的方式并入本文。然而,这些r1植物中的许多对于编辑的ga20ox5等位基因也可以是纯合的或杂合的(参见表10)。对于r1植物中的许多,编辑的ga20ox5等位基因的存在和接合性是未知的,但是对于e270933编辑id,r1植物id p758040、p757888、p757932和p757985对于ga20ox5基因中的大缺失是杂合的,r1植物id p758352对于ga20ox5基因中的小缺失是纯合的,r1植物id p758343含有在ga20ox5基因中的小缺失和t-dna插入,并且p758336对于ga20ox5基因中的小缺失是纯合的或杂合的。因此,ga20ox5基因中的额外突变也有可能能够对r1株高产生影响。将在已去除编辑的ga20ox5等位基因的后续世代中进行进一步的株高测量以证实较矮株高表型。
[0509]
表12.对于zm.ga20ox3的编辑的倒位等位基因杂合的r1植物的株高
[0510][0511][0512]
实施例36.用于分子测定的来自r2植物或r3植物的样品的收集。
[0513]
对于来自载体-4构建体的e270933倒位编辑,使对于e270933编辑杂合的r1植物(p757982)自交(自花授粉),以获得选择的纯合r2植物,其本身(i)自花授粉,以产生纯合近交r3植物,或(ii)与另一优良亲本品系杂交,以产生杂合杂交r3植物。对于来自载体-5构建体的e376333倒位编辑,使对于在ga20ox5基因中含有大缺失的e376333编辑纯合的r1植物(p127584)(i)自花授粉以产生纯合近交r2植物或(ii)与另一优良亲本品系杂交以产生杂合杂交r2植物。通过分离和选择,在r2植物和r3植物中去除存在于r1植物中的编辑的ga20ox5等位基因。使含有e270933编辑的r3植物、含有e376333编辑的r2植物和相同亲本品系的野生型对照植物在温室中在标准条件下生长,并在v2生长阶段取样,用于下文所述的分子测定。将植物在刚好高于土壤水平线之处切割,并且将植物的整个地上部分置于50ml
锥形管中并立即在液氮中冷冻。每个样品含有一株或两株相同基因型的同胞植物。用于每种测定和基因型的样品的数目提供在表13中。将冷冻的样品研磨并用于以下实施例37和实施例38中描述的小rna测定和ga激素测定。
[0514]
表13.用于小rna测定和ga激素测定的样品的描述。
[0515][0516]
实施例37.具有编辑的倒位等位基因的植物中的小rna的检测。
[0517]
为了产生用于测序的小rna文库,根据制造商的协议(文献#15004197v02)使用illumina的truseq小rna文库制备试剂盒,其中在文库纯化步骤进行了修改。在上述实施例36中鉴定用于这个小rna测定实验的每种基因型的样品。cdna扩增后,使用6%novex tbe page凝胶对单独的文库进行凝胶纯化,用于大小分离。用1x sybr gold染色凝胶20分钟。在illumina的nextseq平台上对最终文库产物进行测序,其中每个样品具有3百万个读段的最小深度。测序后,通过以下步骤加工读段:修剪测序衔接子;去除匹配管家非编码rna的读段,并将文库标准化为每百万的读段。对于每种基因型测定1至9个样品。
[0518]
预测自含有e270933和e376333倒位编辑的编辑的ga20氧化酶3基因表达的mrna产生发夹或茎环rna结构,所述发夹或茎环rna结构包含倒位序列和与倒位序列互补且可以与倒位序列杂交的在ga20氧化酶3基因中的天然序列。由于双链rna发夹或茎环结构可以触发rna干扰(rnai)和编码相同或同源rna序列的基因的阻抑,因此针对小rna的存在,测定含有倒位编辑的植物。预期rnai将由茎环结构的茎产生长度为约21个核苷酸的小rna(21聚体),所述茎环结构在此实施例中由ga20ox5倒位序列和ga20ox3天然序列组成。
[0519]
如图29中显示,在来自含有编辑的ga20ox3等位基因的植物的样品中检测到对应于在包含来自ga20ox5的倒位序列和编辑的ga20ox3基因的对应序列的编辑的茎环的茎中的区域的小21聚体rna,这表明在来自这些编辑的植物的组织中存在小rna,而在野生型对照植物中不存在所述小rna。这些小rna的丰度被测量为每百万总测序读段的读段数目。小rna存在于对编辑的等位基因纯合的近交植物和对编辑的等位基因杂合的杂交植物中,这些小rna的范围在每百万19个读段至84个读段之间。小rna的丰度似乎与编辑的ga20ox3等位基因的拷贝数一致,因为与纯合近交植物相比,杂合杂交植物产生更少的小rna。
[0520]
这些样品中对应于编辑的ga20ox3基因的编辑的互补茎区域的小rna的存在与编辑的ga20ox3倒位等位基因触发ga20ox3基因以及可能还有ga20ox5基因的rnai阻抑相一致。额外实验将确定,相对于对照,在对于含有倒位序列的编辑的ga20ox3等位基因或ga20ox5等位基因纯合或杂合的植物中,ga20ox3 mrna转录物和/或ga20ox5 mrna转录物的水平是否降低。
[0521]
实施例38.具有编辑的倒位等位基因的植物中的ga激素的检测。
[0522]
ga20氧化酶基因的表达降低可以改变玉米植物中ga激素的水平,其反过来可以影响株高,其中较低水平的活性ga潜在地降低株高。在含有编辑的ga20ox3等位基因的植物中测量生物活性ga激素及其前体的水平。ga20氧化酶在ga生物合成通路中是有活性的,并且催化代谢中间体ga12和ga53分别依次氧化成ga9和ga20(“早期13-羟基化通路”和“非13-羟基化通路”)。ga的主要生物活性形式包括ga1、ga3和ga4,它们在生物合成通路中是ga20氧化酶活性以及ga9和ga20中间体的更下游。ga20氧化酶基因的表达水平和/或酶功能的降低或阻抑,如用ga20ox3倒位编辑可预期的,可以引起下游代谢物(ga20和ga9)的减少和上游前体(ga53和ga12)的积累。
[0523]
对于此实验,如以上实施例36中所提供收集样品。提取新鲜冷冻的植物样品组织,并使用waters固相提取max套筒板清洁。使用与absciex5500质谱耦联的uplc,用mrm方法分析ga激素和两种内标。基于校准曲线用absciex软件multi-quan计算最终ga激素值。每条ga激素校准曲线都有良好的线性拟合,r2线性回归>0.99。对于每种激素还包括每个96孔板八种技术对照,并且在分析过程中进行评价以满足标准。ga水平以皮摩尔/克样品组织测量。
[0524]
如图30中显示,相对于野生型对照植物,ga12的水平在对编辑的等位基因(e270933和e376333)纯合的近交植物中增加,但在对编辑的e270933和e376333等位基因杂合的杂交植物中在统计学上是中性的或未改变的。如图30中进一步显示,ga9的水平在对编辑的等位基因之一(e270933)纯合的近交植物中增加,但在对其他编辑的等位基因(e376333)纯合的近交植物中是中性的,并且ga9的水平在对编辑的等位基因杂合的杂交植物中是中性的(e270933)或降低的(e376333),均是相对于野生型对照植物而言。
[0525]
如图31中显示,ga20的水平在对编辑的等位基因之一(e376333)纯合的近交植物中降低,但在对其他编辑的等位基因(e270933)纯合的近交植物中增加,并且ga20的水平在对这些编辑的等位基因杂合的杂交植物中是中性的(e270933)或降低的(e376333),均是相对于野生型对照植物而言。如图31中进一步显示,相对于野生型对照植物,在对每种编辑的等位基因(e270933和e376333)纯合的近交植物中和在对每种编辑的等位基因(e270933和e376333)杂合的杂交植物中ga53的水平都是增加的。
[0526]
图32提供了相对于野生型对照,在编辑的近交和杂交植物的v2生长阶段收集的样品中测量的活性ga(ga1、ga3和ga4)的水平的结果。如图32中显示,除了在对编辑的等位基因之一(e270933)纯合的近交植物中ga4小幅增加之外,这些活性ga的水平在含有编辑的等位基因中的每一种(e270933和e376333)的近交和杂交植物中总体在统计学上未改变。
[0527]
这些数据支持如下理论:含有倒位序列并编码可以形成rna茎环结构的转录物的编辑的ga20氧化酶3基因能够影响在含有编辑的等位基因的近交和杂交植物中ga激素的水平。尽管混合了此实验中的数据,但支持在含有编辑的ga20氧化酶3等位基因的植物中,在ga20氧化酶活性上游的ga12和ga53前体的积累增加并且ga20氧化酶活性的ga9和ga20产物的水平降低,尽管一些样品具有增加的下游ga9和ga20产物水平。在此实施例中,通过上游ga12和ga53前体的积累水平,提供在存在编辑的ga20氧化酶3等位基因的情况下ga20氧化酶表达和/或活性降低的更大支持。在来自具有编辑的ga20氧化酶3等位基因的植物的样品中ga12是中性至增加的,并且在来自具有编辑的ga20氧化酶3等位基因的植物的所有样品中ga53增加。
[0528]
尽管在此实施例中未显示生物活性ga的水平降低,但这可能是由于在收集植物组织样品时的早期v2生长阶段。自含有倒位、反义或茎环序列的转录物的内源ga20氧化酶3基因座的表达模式也依赖于内源ga20氧化酶3基因启动子,其可能在v2生长阶段不驱动表达(或足够高水平的表达)从而产生对ga激素水平的可测量影响。不受理论的束缚,有可能来自内源ga20ox3基因或ga20ox5基因的编辑的等位基因的含倒位/发夹的转录物在相应ga20ox3内源启动子或ga20ox5内源启动子的控制之下的表达在发育的后期阶段更大,并且因此在那些后期阶段对ga激素的水平具有更大的影响。活性ga也是ga20氧化酶活性的更下游而不是直接的产物。将来的实验将确定在对编辑的ga20氧化酶3等位基因或ga20氧化酶5等位基因杂合或纯合的植物的发育后期阶段,是否观察到较低活性ga水平。这得到了此实施例中在早期v2生长阶段观察到的ga前体水平改变的支持。
[0529]
根据本公开的详细描述,将显而易见的是,在不偏离如本文和所附权利要求中描述的本公开的精神和范围的情况下,可以有修改、变化和等效方面。此外,应当理解,本公开中的所有实施例都作为非限制性实施例提供。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献