一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

植物避荫反应的抑制的制作方法

2022-11-14 12:03:22 来源:中国专利 TAG:

植物避荫反应的抑制
1.关于序列表的电子提交的声明
2.根据37 c.f.r.
§
1.821提交的ascii文本格式的序列列表,标题为1499.17.wo_st25.txt,大小为465,868字节,于2021年1月28日生成,并通过efs网站提交,以替代纸质副本。该序列表据此通过引用并入其公开内容的说明书。
3.优先权声明
4.本技术根据35 u.s.c.
§
119(e)要求2020年1月31日提交的美国临时申请第62/968,596号的权益,其全部内容通过引用并入本文。
技术领域
5.本发明涉及用于修饰同源结构域-亮氨酸拉链(hd-zip)转录因子以抑制植物中避荫反应的组合物和方法。本发明还涉及使用本发明的方法和组合物产生的植物。
技术背景
6.避荫反应(sar)是对可用光的质量或数量下降的反应(kebrom和brutnell,j exp bot58:3079

3089(2007)),其中植物试图通过向资源(主要是光)生长来胜过邻近的植物。植物过度拥挤会导致其中植物缺乏活力并产量下降的避荫综合症(sas)。避光涉及植物环境中红光与远红光的相对比例(ballare等人science,247:329-332(1990))。植物吸收大部分它们可利用的红光,但反射远红光,包括将这种光反射到附近的植物上。当植物在其环境中检测到持续的远红光时,其将经历形态学和生理学反应。这些反应包括分枝减少、植株高度增加、叶片面积减小、生长素重新分配、乙烯产生增加以及开花加速。sas的特征是根冠比增加,株高增加,单株产量降低。在典型的单作作物环境中,通过避荫进行的植物间竞争被认为是一种浪费的生存机制。


技术实现要素:

7.本发明的一个方面提供了在内源同源结构域-亮氨酸拉链(hd-zip)转录因子中包含至少一个非天然突变的植物或其植物部分,其中该突变破坏了hd-zip转录因子与dna的结合。
8.本发明的另一方面提供了包含编辑系统的植物细胞,所述编辑系统包含:(a)crispr相关效应蛋白;和(b)具有与编码hd-zip转录因子的内源靶基因互补的间隔子序列的引导核酸(grna、gdna、crrna、crdna)。
9.本发明的另一方面提供了植物细胞,其包含在hd-zip转录因子基因的dna结合位点内的非天然突变,该突变防止或减少hd-zip转录因子与dna的结合,其中该突变是使用编辑系统引入的取代、插入和/或缺失,该编辑系统包含与hd-zip转录因子基因中的靶位点结合的核酸结合结构域,其中hd-zip转录因子基因编码:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与以下氨基酸序列具有至少80%序列同一性的序列的多肽:rkklrlskdqsavledsfrehptlnprqkaalaqqlglrprqv
evwfqnrrartklkqtevdceylkrccetlteenrrlqkevqelralklvsphlymhmsppttltmcpscerv(seq id no:1)(玉蜀黍hb53)或rkklrlskdqaavleesfkehntlnpkqkaalakqlnlkprqvevwfqnrrartklkqtevdceflkrccetlteenrrlqrevaelrvlklvaphhyarmpppttltmcpscerl(seq id no:2)(玉蜀黍hb78);(c)包含与氨基酸序列lakqlnlkprqvevwfqnrrartklkqtevdceflkrccetlteenrrlqrev(seq id no:3)具有至少80%序列同一性的序列的多肽;(d)包含与核苷酸序列rqvevwfqnrrartklkqtevdce(seq id no:4)具有至少95%序列同一性的序列的多肽;(e)包含具有氨基酸序列rqvevwfqnrrartkxkqtevdce(seq id no:5)的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列kklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,以及x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,以及x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,以及x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有vwfqnrra(seq id no:9)所示氨基酸序列的序列的多肽。
10.本发明的另一方面提供了在内源hd-zip转录因子中包含突变(例如,至少一个突变)的植物或其部分,该突变降低了内源hd-zip转录因子对dna的结合,其中内源hd-zip转录因子包含多肽,所述多肽包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列;其中所述突变是seq id no:1或seq id no:2的氨基酸序列的氨基酸残基45-52(vwfqnrra(seq id no:9))的至少一个氨基酸残基的缺失、取代和/或插入,任选地其中所述突变是非天然突变。
11.本发明的另一方面提供了包含hd-zip转录因子基因的植物或其部分,所述基因编码seq id no:201的氨基酸序列。
12.本发明的另一方面提供了包含hd-zip转录因子基因的玉米植物,所述基因包含seq id no:201的氨基酸序列。
13.本发明的另一方面提供了包含hd-zip转录因子基因的植物或其部分,所述基因包含seq id no:202的核苷酸序列。
14.本发明的另一方面提供了包含hd-zip转录因子基因的玉米植物,所述基因包含seq id no:202的核苷酸序列。
15.本发明还提供了生产/培育无转基因的基因组编辑的植物的方法,其包括:(a)将本发明的植物与无转基因的植物杂交,从而将本发明植物中存在的突变引入无转基因的植物中;以及(b)选择包含突变但无转基因的子代植物,从而产生无转基因的基因组编辑的植物。
16.本发明的另一方面提供了编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式切割植物细胞中内源hd-zip转录因子基因内的靶位点,所述内源hd-zip转录因子基因编码:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列seq id no:1或seq id no:2具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是
zip转录因子基因中的靶位点结合,其中hd-zip转录因子基因编码:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列seq id no:1或seq id no:2具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,从而产生包含至少一个在内源hd-zip转录因子基因中具有突变的细胞的植物或其部分。
20.在又一方面,提供了产生包含具有降低的dna结合的突变型内源hd-zip转录因子的植物或其部分的方法,所述方法包括将植物或植物部分中的内源hd-zip转录因子基因中的靶位点与包含切割结构域和dna结合结构域的核酸酶接触,其中dna结合结构域与hd-zip转录因子基因中的靶位点结合,其中hd-zip转录因子基因编码:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列seq id no:1或seq id no:2具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,从而产生具有dna结合减少的突变内源hd-zip转录因子的植物或其部分。
21.本发明的另外方面提供了与hd-zip转录因子基因中靶位点结合的引导核酸,该靶位点包含编码以下序列的核苷酸序列:(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。
22.本发明的另外方面提供了系统,其包含本发明的引导核酸和与引导核酸缔合的crispr-cas效应蛋白。
23.本发明的另一方面提供了基因编辑系统,其包含与引导核酸缔合的crispr-cas效应蛋白,其中引导核酸包含与hd-zip转录因子基因结合的间隔子序列。
24.本发明的另一方面提供了包含crispr-cas效应蛋白的复合物,所述crispr-cas效应蛋白包含切割结构域和引导核酸,其中所述引导核酸与hd-zip转录因子基因中的靶位点结合,所述基因编码(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,其中切割结构域切割hd-zip转录因子基因中的靶链。
25.本发明的另外方面提供了编码具有突变的dna结合位点的hd-zip转录因子的核酸,其中突变的dna结合位点包含破坏dna结合的突变。
26.还提供了在其基因组中包含一种或多种突变的hd-zip转录因子的植物以及用于制备本发明植物的多肽、多核苷酸、核酸构建体、表达盒和载体,所述转录因子与通过本发明方法产生的dna结合的能力降低。
27.在下面的发明描述中更详细地阐述本发明的这些和其他方面将。
28.序列的简要描述
29.seq id no:1显示了玉蜀黍hb 53转录因子的一部分(seq id no:38的氨基酸残基173-288)。
30.seq id no:2显示了玉蜀黍hb 78转录因子的一部分(seq id no:83的氨基酸残基76-191)。
31.seq id no:3-9是hd-zip转录因子的部分序列。
32.seq id no:10-54是来自多种不同植物物种的hb53转录因子的实例。
33.seq id no:55-98和303是来自多种不同植物物种的hb78转录因子的实例。
34.seq id no:99-134是来自多种不同植物物种的hb53转录因子的cdna序列。
35.seq id no:135-174是来自多种不同植物物种的hb78转录因子的cdna序列。
36.seq id no:175-182显示了用于引导核酸靶向hb78和hb53转录因子的示例性间隔子序列。
37.seq id no:183-194是可用于本发明的示例性胞嘧啶脱氨酶氨基酸序列。
38.seq id no:195是可用于本发明的示例性尿嘧啶-dna糖基化酶抑制剂(ugi)。
39.seq id no:196-197是编码启动子和内含子的示例性调控序列。
40.seq id no:198-200提供了v型crispr-cas12a核酸酶的前间隔子相邻基序位置的实例。
41.seq id no:201提供了使用本发明的方法和组合物产生的示例性hb78突变氨基酸序列。
42.seq id no:202提供了使用本发明的方法和组合物产生的示例性hb78突变核苷酸序列。seq id no:202编码seq id no:201的氨基酸序列。
43.seq id no:203-246和302是图1a-1b中比对中所示的不同植物物种的hb78氨基酸序列的部分。
44.seq id no:247-291是图2a-2d中比对中所示的不同植物物种的hb53氨基酸序列的部分。
45.seq id no:292-294是图6所示的hb53序列。
46.seq id no:295-297是图8所示的hb78序列。
47.seq id no:298-301是图9所示的hb78序列。
48.seq id no:304和seq id no:305分别提供了来自玉蜀黍的野生型hb78基因组序列和cdna(对应于seq id no:83的wt hb78氨基酸序列和seq id no:171的wt hb78编码序列)。
49.seq id no:306-309分别提供了具有17个碱基对缺失的编辑的hb78的蛋白质序列、基因组序列、编码序列和cdna。
50.seq id no:310和seq id no:311分别提供了来自玉蜀黍的野生型hb53基因组序列和cdna(对应于seq id no:38的wt hb53氨基酸序列和seq id no:132的wt hb53编码序列)。
51.seq id no:312-315分别提供了具有11个碱基对缺失的编辑的hb53的蛋白质序列、基因组序列、编码序列和cdna。
52.seq id no:316-319分别提供了具有8个碱基对缺失的编辑的hb53的蛋白质序列、基因组序列、编码序列和cdna。
53.seq id no:320-329是图10-图12中所示的序列。
附图说明
54.图1提供了来自44种不同植物物种的hd-zip(hb78)氨基酸序列的比对。所述序列是来自全长hb78序列的连续氨基酸(53个氨基酸残基)的一部分。
55.图2提供了来自45种不同植物物种的hd-zip(hb53)氨基酸序列的比对。所述序列是来自全长hb53序列的连续氨基酸残基的一部分(例如,约116个氨基酸残基)。
56.图3提供了说明玉米种植密度与产量之间关系的实例。增加种植密度会增加植物产量,直至出现拐点(箭头-最佳经济播种率)。遮荫减弱的变体在较高的种植密度下会有拐点。
57.图4提供了说明显性失活策略(dominant negative strategy)的实例。通过去除双功能蛋白的dna结合能力,二聚化复合物将不会激活基因表达。
58.图5显示了hdlz ii类蛋白之间的关系。
59.图6提供了玉蜀黍中hb53的dna结合结构域的编辑的实例,并在方框中显示了用于修饰的目标示例性氨基酸残基。显示了编码seq id no:292)链和非编码链(seq id no:293)以及hb53氨基酸序列(seq id no:294)。
60.图7提供了具有示例性引导核酸的注释的hb78基因。
61.图8提供了hb78基因(seq id no:295)中缺失的实例,显示了例如外显子2中的缺
失(seq id no:297)导致删除外显子3、外显子4和dna结合结构域的截短。还显示了缺失位点处的蛋白质序列(seq id no:296)。
62.图9提供了编辑的植物的代表性基因组序列(编码链(seq id no:298)和非编码链(seq id no:299)),显示了hb78 dna结合结构域上游的提前终止。显示了由该提前终止产生的蛋白质序列(seq id no:300和seq id no:301)。
63.图10提供了显示引导pwsp227以及在玉蜀黍hb53中得到的编辑(共有序列seq id no:320;玉蜀黍seq id no:321;ce28392、ce28403、ce28409、ce28382、ce28390 seq id no:322;ce28492、ce28505、ce28514、ce28517、ce28522、ce28534、ce28544、ce28547seq id no:320);ce28456、ce28477、ce28483 seq id no:323)的位置的比对。
64.图11提供了显示引导pwsp227和pwsp225以及在玉蜀黍hb53中得到的编辑(共有(共有序列seq id no:324;玉蜀黍seq id no:325;ce28330

8d seq id no:326;ce28350

11d seq id no:327)的位置的比对。
65.图12提供了显示引导pwsp230和pwsp232以及在玉蜀黍hb78中得到的编辑(共有序列seq id no:328;z.maysseq id no:329;ce28330 seq id no:328;ce28350 seq id no:328)的位置的比对。
66.图13提供了靶向hb53(上图)和hb78(下图)的实例。质粒pwise443和pwise444经显示了具有相应的间隔子。质粒pwise445含有对于hb53所示的所有4个间隔子。质粒pwise446和pwise447经显示具有相应的间隔子。质粒pwise448包含对于hb78显示的所有4个间隔子。质粒pwise451包含所有8个间隔子(4个用于hb53,4个用于hb78,如图13所示)。
67.图14提供了hb53敲除和hb53/hb78敲除的示例性e2避荫测定的结果,其显示当在荫蔽中生长时,在编辑的品系中没有茎伸长。
68.图15提供了异型分析(off-type analysis),没有显示编辑的植物中形态学异型或发育延迟的任何证据。
具体实施方式
69.现在将在下文中参考附图和示例来描述本发明,在所述附图和示例中示出了本发明的实施方案。该描述并不旨在成为其中可实施本发明的所有不同方式或者可以添加到本发明中的所有特征的详细目录。例如,关于一个实施方案说明的特征可被并入其他实施方案,并且关于特定实施方案说明的特征可以从该实施方案中删除。因此,本发明设想在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。另外,对于本领域技术人员来说,根据本公开内容,对本文提出的各种实施方案的许多变化和添加将是显而易见的,所述变化和添加不偏离本发明。因此,以下描述旨在说明本发明的一些特定实施方案,而不是详尽地说明其所有排列、组合和变化。
70.除非另有定义,否则本文使用的所有技术和科学术语都具有与本发明所属领域的普通技术人员通常理解的相同的含义。在本发明的描述中使用的术语仅仅是为了描述特定的实施方案,而不是为了限制本发明。
71.本文引用的所有公布、专利申请、专利和其他参考文献通过引用以其整体并入,以用于与其中呈现该引用的句子和/或段落相关的教导。
72.除非上下文中另有说明,否则本文描述的本发明的各种特征可以以任意组合使
用。此外,本发明还设想在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。为了说明,如果说明书陈述了组合物包含组分a、b和c,则特别意图是a、b或c中的任一个或其组合可以被省略,并且单独地或以任意组合的形式被放弃。
73.如在本发明的描述和所附权利要求中所使用的,除非上下文清楚地另外指出,否则单数形式“一个/种(a)”、“一个/种(an)”和“该(the)”也旨在包括复数形式。
74.此外,如本文中所用,“和/或”是指并包含一个或多个相关列出项的任何和所有可能的组合,以及当以替代(“或”)解释时不存在组合。
75.如本文中所用,术语“约”,当指可测量的值诸如量或浓度等时,意味着包括指定值的
±
10%、
±
5%、
±
1%、
±
0.5%或甚至
±
0.1%的变化以及指定值。例如,“约x”(其中x是可测量的值)意味着包括x以及x的
±
10%、
±
5%、
±
1%、
±
0.5%或甚至
±
0.1%的变化。本文提供的可测量值的范围可以包括任何其它范围和/或其中的单个值。
76.如本文中所用,诸如“在x与y之间”和“在约x与y之间”等短语应该解释为包括x和y。如本文中所用,诸如“在约x与y之间”的短语意指“在约x与约y之间”,而诸如“从约x到y”的短语意指“从约x至约y”。
77.除非本文中另有说明,否则本文中数值范围的叙述仅旨在用作单独提及落入该范围内的每个单独数值的速记方法,并且每个单独数值都被并入说明书中,如同其在本文中被单独叙述一样。例如,如果公开了范围10至15,那么也公开了11、12、13和14。
78.如本文中所用,术语“包含(comprise)”、“包含(comprises)”和“包含(comprising)”指定所述特征、整数、步骤、操作、元件和/或组件的存在,但是不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。
79.如本文中所用,过渡短语“基本上由......组成”意指权利要求的范围应被解释为包括权利要求中所述的特定材料或步骤,以及那些不会实质上影响所要求保护的发明的一个或多个基本和新颖特征的材料或步骤。因此,当在本发明的权利要求中使用时,术语“基本上由.......组成”不旨在解释为等同于“包含”。
80.如本文中所用,术语“增加(increase)”、“增加(increasing)”、“增加(increased)”、“增强(enhance)”、“增强(enhanced)”、“增强(enhancing)”和“增强(enhancement)”(及其语法变型)描述与对照相比,至少约15%、20%、25%、50%、75%、100%、150%、200%、300%、400%、500%或更多的升高。
81.如本文中所用,术语“降低(reduce)”、“降低(reduced)”、“降低(reducing)”、“降低(reduction)”、“减小(diminish)”和“减少(decrease)”(及其语法变型)描述例如与对照相比,减少至少约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%。在特定的实施方案中,所述减少可导致没有或基本上没有(即,可忽略的量,例如,小于约10%或甚至5%)可检测的活性或量。
82.如本文中所用,关于核酸分子和/或核苷酸序列(例如,rna或dna)的术语“表达(express)”、“表达(expresses)”、“表达(expressed)”或“表达(expression)”等表示核酸分子和/或核苷酸序列被转录,以及任选地被翻译。因此,核酸分子和/或核苷酸序列可以表达目标多肽,或者例如功能性非翻译rna。
[0083]“异源的”或“重组的”核苷酸序列是不与其所被引入的宿主细胞天然相关联的核
苷酸序列,包括天然存在的核苷酸序列的非天然存在的多个拷贝。
[0084]“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在或内源的核酸、核苷酸序列、多肽或氨基酸序列。因此,例如,“野生型mrna”是天然存在于参考生物体中的mrna或是参考生物体的内源mrna。
[0085]
如本文中所用,术语“杂合的”是指其中不同的等位基因位于同源染色体上的相应基因座的遗传状态。
[0086]
如本文中所用,术语“纯合的”是指其中相同的等位基因位于同源染色体上的相应基因座的遗传状态。
[0087]
如本文中所用,术语“等位基因”是指在特定基因座处出现的两种或更多种不同核苷酸或核苷酸序列之一。
[0088]“基因座”是染色体上基因或标记或等位基因所在的位置。在一些实施方案中,基因座可包含一个或多个核苷酸。
[0089]
如本文中所用,术语“所需等位基因”、“靶等位基因”和/或“目标等位基因”可以互换使用,是指与所需性状相关联的等位基因。在一些实施方案中,根据所需表型的性质,所需等位基因可以与给定性状的或给定性状中的增加或减少(相对于对照)相关联。在本发明的一些实施方案中,短语“所需等位基因”、“靶等位基因”或“目标等位基因”是指相对于不具有一个或多个靶等位基因的对照植物,在非水胁迫条件下与植物产量增加相关联的一个或多个等位基因。
[0090]
当性状与标记连锁时,并且当该标记的存在是包含该标记的植物/种质中所需性状或性状形式是否会出现和/或出现到何种程度的指标时,所述标记与所述性状“相关联”。类似地,当标记与等位基因或染色体间隔连锁时,并且当所述标记的存在是等位基因或染色体间隔是否存在于包含所述标记的植物/种质中的指标时,所述标记与所述等位基因或染色体间隔“相关联”。
[0091]
如本文中所用,术语“回交(backcross)”和“回交(backcrossing)”是指子代植物与其亲本之一回交一次或多次(例如,1次、2次、3次、4次、5次、6次、7次、8次等)的过程。在回交方案中,“供体”亲本是指具有待渗入的所需基因或基因座的亲本植物。“供体”亲本是指具有待渐渗入的所需基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座渐渗入其中的亲本植物。例如,参见ragot,m.等人marker-assisted backcrossing:a practical example,intechniques et utilisations des marqueurs moleculaires les colloques,第72卷,第45-56页(1995);和openshaw等人,marker-assisted selection in backcross breeding,inproceedings of the symposium"analysis of molecular marker data,”第41-43页(1994)。最初的杂交产生了f1代。术语“bc1”是指循环亲代的第二次使用,“bc2”是指循环亲代的第三次使用,依此类推。
[0092]
如本文中所用,术语“杂交(cross)”或“杂交(crossed)”是指配子通过授粉融合产生后代(例如细胞、种子或植物)。该术语包括有性杂交(一株植物对另一株植物的授粉)和自交(自花授粉,例如当花粉和胚珠来自同一株植物时)。术语“杂交”是指通过授粉融合配子产生后代的行为。
[0093]
如本文中所用,术语“渐渗(introgression)”、“渐渗(introgressing)”和“渐渗
(introgressed)”是指一个或多个基因座的所需等位基因或所需等位基因的组合从一个遗传背景到另一个遗传背景的自然和人工传递。例如,特定基因座的所需等位基因可以通过同一物种的两个亲本间的有性杂交传递给至少一个后代,其中至少一个亲本在其基因组中具有所需等位基因。或者,例如,等位基因的传递可以例如在融合的原生质体中通过两个供体基因组之间的重组发生,其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需等位基因可以是标记、qtl、转基因等的选定等位基因。包含所需等位基因的后代可以与具有所需遗传背景的品系回交一次或多次(例如,1次、2次、3次、4次或更多次),选择所需等位基因,结果是所需等位基因变成固定在所需遗传背景中。例如,与非水胁迫条件下产量增加相关联的标记可从供体渐渗入不包含该标记且在非水胁迫条件下不显示产量增加的轮回亲本。然后可以将得到的后代回交一次或多次,并进行选择,直至后代具有与在轮回亲本背景下非水分胁迫条件下产量增加相关联的遗传标记。
[0094]“遗传图谱”是对给定物种中一条或多条染色体上的基因座之间的遗传连锁关系的描述,通常以图表或表格的形式描述。对于每个遗传图谱,基因座之间的距离通过它们之间的重组频率来测量。可以使用多种标记检测基因座之间的重组。遗传图谱是作图群体、所用标记类型和不同群体间每个标记的多态性潜力的产物。基因座之间的顺序和遗传距离可以因遗传图谱的不同而不同。
[0095]
如本文中所用,术语“基因型”是指如与可观察和/或可检测和/或表现的性状(表型)形成对比的个体(或个体群体)在一个或多个基因座的遗传组成。基因型由个体从其亲本遗传的一个或多个已知基因座的一个或多个等位基因定义。术语基因型可用于指个体在单个基因座、多个基因座的遗传组成,或者更一般地,术语基因型可用于指个体基因组中所有基因的个体遗传组成。基因型可以例如使用标记间接表征和/或通过核酸测序直接表征。
[0096]
如本文中所用,术语“种质”指个体(例如,植物)、个体群(例如,植物品系、品种或家族)或源自品系、品种、物种或培养物的克隆的遗传物质,或来自其的遗传物质。种质可以是生物体或细胞的一部分,或者可以与生物体或细胞分离。一般来说,种质提供了具有特定遗传组成的遗传物质,所述遗传物质为生物体或细胞培养物的一些或全部遗传性质提供了基础。如本文中所用,种质包括可从其生长出新植物的细胞、种子或组织,以及可培养成完整植物的植物部分(例如,叶、茎、芽、根、花粉、细胞等)。
[0097]
如本文中所用,术语“栽培品种”和“品种”是指一组相似的植物,它们通过结构或遗传特征和/或性能可以与同一物种内的其它品种相区别。
[0098]
如本文中所用,术语“外来的”、“外来品系”和“外来种质”是指任何非优良的植物、品系或种质。一般来说,外来植物/种质不源自任何已知的优良植物或种质,而是被选择来将一种或多种所需遗传元件引入育种程序(例如,以将新颖等位基因引入育种程序)。
[0099]
如本文中所用,植物育种上下文中的术语“杂种”是指通过不同品系或品种或物种的植物杂交(包括但不限于两个近交系之间的杂交)产生的遗传上相异的亲本的后代。
[0100]
如本文中所用,术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上纯合的植物或植物品种,或者就特别感兴趣的基因组部分而言基本上纯合的植物或植物品种。
[0101]“单倍型”是个体在多个基因座的基因型,即等位基因的组合。通常,定义单倍型的遗传基因座是物理和遗传连锁的,即在同一染色体片段上。术语“单倍型”可以指特定基因
座处的多态性,诸如单个标记基因座,或沿染色体区段的多个基因座处的多态性。
[0102]
如本文中所用,术语“异源的”是指源自外来物种的核苷酸/多肽,或者,如果源自同一物种,则是通过有意的人为干预,在组成和/或基因组基因座上对其天然形式进行了实质性的修饰。
[0103]
如本文中所用,“避荫反应”被定义为植物响应低红光∶远红光(r∶fr)比率的生长。对避荫的抑制是指对响应低r:fr光比率的生长变化的抑制。一方面,可以通过测量包含本发明性状(例如,如本文所述的hd-zip的突变)的植物和不含该性状的同基因植物在低r∶fr光比率的受控环境中的高度来显示对避荫反应的抑制。当在r∶fr比为0.16的相同条件下生长时,包含本发明性状的植物将比不包含该性状的等基因植物矮(例如,在胚芽鞘、v1鞘或v2鞘处测量的高度)至少5%(例如,矮约5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%或更多,或其中的任何范围或值;例如约矮5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%至约26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%或更多)(例如,矮约5%至约10%、矮5%至约15%、矮5%至约20%、矮5%至约25%、矮5%至约30%、矮5%至约40%、矮5%至约50%、矮10%至约20%、矮10%至约30%、矮10%至约50%、矮10%至约70%、矮15%至约20%、矮15%至约30%、矮15%至约50%、矮20%至约30%、矮20%至约50%、矮20%至约70%、矮40%至约50%、矮40%至约60%、矮40%至约80%、矮40%至约100%、矮50%至约70%、矮50%至约100%、矮50%至约125%、矮75%至约100%、矮75%至约120%、矮75%至约140%等)。
[0104]
显示sar的植物表现出下胚轴和节间的过度伸长、更长的叶子、受损的根生长、提早开花和降低的结实、低光合作用效率、增强的绿抽梢、高的倒伏率、加速的衰老、降低的籽粒灌浆;以及疾病的主动抑制和草食反应机制。
[0105]
与不包含sar的降低的植物相比,其中sar如本文所述降低的植物可具有增加的产量。如本文中所用,“增加的产量”是指与生长相关联的任何植物性状,例如,生物量、产量、氮利用效率(nue)、花序尺寸/重量、果实产量、果实质量、果实尺寸、种子尺寸、种子数量、叶组织重量、结瘤数、结瘤质量、结瘤活性、种子头数、分蘖数、花数、块茎数、块茎质量、球茎质量、种子数、总种子质量、出叶率、分蘖出苗率(rate of tiller emergence)、出苗率、根的长度、根的数量、根团的尺寸和/或重量,或其任意组合。因此,在一些方面,“增加的产量”可
包括但不限于与对照植物或其部分(例如,不包含编码如本文所述的hd-zip转录因子的突变内源核酸的植物,其在具有低r:fr光比率的环境(例如,遮蔽环境;例如,约0.16的r:fr比率)中生长,包括当与其它植物紧邻生长时)相比,增加的花序产生,增加的果实产生(例如,增加的果实的数量、重量和/或尺寸;例如,增加的例如玉米的穗的数量、重量和/或尺寸)、增加的果实品质、增加的根的数量、尺寸和/或重量、增加的分生组织尺寸、增加的种子尺寸、增加的生物量、增加的叶尺寸、增加的氮利用效率、增加的高度和/或增加的节间长度。在一些方面,增加的产量可以表示为单位土地面积上生产的谷物数量(例如,每英亩土地的蒲式耳数)。
[0106]“种子重量”由籽粒形态性状诸如种子长度、种子宽度和种子厚度以及籽粒灌浆共同决定,这些性状都受数量遗传学控制。
[0107]
如本文中所用,“降低的高度”意指响应富集的远红光而抑制茎伸长。
[0108]
如本文中所用,“降低的茎:根比率”是指地上生物量相对于地下生物量的比例降低。
[0109]
如本文中所用,术语“核酸”、“核酸分子”、“核苷酸序列”和“多核苷酸”指线性或分支的、单链或双链的rna或dna,或其杂交体。该术语还包括rna/dna杂交体。当合成产生dsrna时,不太常见的碱基,诸如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤等也可用于反义、dsrna和核酶配对。例如,含有尿苷和胞苷的c-5丙炔类似物的多核苷酸已经显示出以高亲和力结合rna,并且是基因表达的强效反义抑制剂。也可以进行其他修饰,诸如对磷酸二酯骨架或rna的核糖基团中的2
’‑
羟基的修饰。
[0110]
如本文中所用,术语“核苷酸序列”是指核苷酸的杂聚物或这些核苷酸从核酸分子的5’末端至3'末端的序列,包括dna或rna分子,包括cdna、dna片段或部分、基因组dna、合成的(例如,化学合成的)dna、质粒dna、mrna和反义rna,其中任一种都可以是单链或双链的。术语“核苷酸序列”、“核酸”、“核酸分子”、“核酸构建体”、“寡核苷酸”和“多核苷酸”在本文中也可互换使用,是指核苷酸的杂多聚体。本文提供的核酸分子和/或核苷酸序列在本文中以从左至右的5’至3’方向呈现,并且使用美国测序规则37 cfr
§§
1.821-1.825和世界知识产权组织(wipo)标准st.25中阐述的用于表示核苷酸特征的标准代码来表示。如本文中所用,“5’区”可以指多核苷酸的最靠近多核苷酸5’末端的区域。因此,例如,多核苷酸的5’区中的元件可以位于从位于多核苷酸的5’末端的第一个核苷酸至位于多核苷酸中间的核苷酸的任何位置。如本文中所用,“3’区”可以指多核苷酸的最靠近多核苷酸3’末端的区域。因此,例如,多核苷酸的3’区中的元件可以位于从位于多核苷酸的3’末端的第一个核苷酸至位于多核苷酸中间的核苷酸的任何位置。
[0111]
如本文中关于核酸所使用的,术语“片段”或“部分”是指相对于参考核酸长度缩短(例如,缩短1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或更多个核苷酸)的核酸,并且其包含与参考核酸的相应部分相同或几乎相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续核苷酸的核苷酸序列、基本上由所述核苷酸序列组成和/或由所述核苷酸序列组成。如果合适,这种核酸片段可以包含在其为其组分的更大的多核苷酸中。例如,本发明的引导核酸的重复序列可以包含野生型crispr-cas重复序列(例
如,野生型crisr-cas重复序列;例如,来自例如cas9、cas12a(cpf1)、cas12b、cas12c(c2c3)、cas12d(casy)、cas12e(casx)、cas12g、cas12h、cas12i、c2c4、c2c5、c2c8、c2c9、c2c10、cas14a、cas14b和/或cas14c等的crispr cas系统的重复)的一部分。在一些实施方案中,核酸片段可以包含编码hd-zip转录因子的核苷酸序列的约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、125个、150个、175个、200个、225个、250个、300个、350个、400个、450个、500个、550个、600个、660个、700个、750个、800个、850个、900个、950个、1000个、1050个、1100个、1150个、1200个、1250个、1300个、1350个、1400个、1450个、1500个、1550个、1600个、1650个、1700个、1750个、1800个、1850个、1900个、1950个、2000个或更多个连续核苷酸,基本由所述连续核苷酸组成或由所述连续核苷酸组成,所述hd-zip转录因子的活性降低(例如,dna结合的降低)可导致植物中避荫反应的降低。
[0112]
在一些实施方案中,片段或部分可以是hd-zip转录因子的片段或部分。在一些实施方案中,核酸的片段或部分可以是编码以下任一氨基酸序列的核酸片段或其部分:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列seq id no:1或seq id no:2具有至少80%序列同一性的序列的多肽:(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,其中所述片段或部分包含编码上述(a)-(g)的多肽中的任一种的核酸的约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、130个、140个、150个、175个、200个、225个、250个、300个、350个或更多个连续核苷酸或其中的任何范围或值的连续核苷酸。在一些实施方案中,“部分”可以与从多肽中删除的氨基酸数量相关。因此,例如,hd-zip转录因子的一部分的缺失可以包含编码包含seq id no:9(vwfqnrra)的氨基酸序列的hd-zip转录因子多肽的核苷酸序列的至少两个连续核苷酸(例如,2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个)的缺失。在一些实施方案中,缺失可包含hd-zip转录因子的一部分,该部分包含外显子3和外显子4,其中外显子3编码hd-zip dna结合
区。在一些实施方案中,缺失可包含hd-zip转录因子的一部分,其中该部分包含外显子3和外显子4的全部,以及任选地,外显子2的一部分。在一些实施方案中,缺失可包含编码hd-zip多肽的c-末端部分约最后96至125个连续氨基酸残基的hd-zip多核苷酸的部分。
[0113]
在一些实施方案中,“序列特异性dna结合结构域”可与编码本文所述的hd-zip转录因子的核苷酸序列的一个或多个片段或部分结合。
[0114]
如本文关于多肽所使用的,术语“片段”或“部分”可指相对于参考多肽长度缩短的多肽,其包与参考多肽的相应部分相同或几乎相同(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续氨基酸的氨基酸序列或基本上由所述氨基酸序列组成或由所述氨基酸序列组成。在适当的情况下,这种多肽片段可以包含在其为其构成部分的更大的多肽中。在一些实施方案中,多肽片段包含参考多肽的至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、125个、150个、175个、200个、225个、250个、300个、350个、400个或更多个连续氨基酸,基本上由所述连续氨基酸组成或由所述连续氨基酸组成。在一些实施方案中,多肽片段可包含hd-zip转录因子的约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、125个、150个、175个、200个、225个、250个、300个、350个、400个、450个、500个、550个、600个、660个、700个或更多个连续氨基酸残基,基本上由所述连续氨基酸残基组成或由所述连续氨基酸残基组成,所述连续氨基酸残基是例如(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。
[0115]
在一些实施方案中,片段或部分可以是hd-zip转录因子的片段或部分。在一些实施方案中,片段或部分可以是以下任一种的氨基酸序列的片段或部分:(a)包含与上述(a)至(g)的氨基酸序列具有至少80%序列同一性的序列的多肽,其中所述片段或部分包含(a)含有与上述(a)至(g)的氨基酸序列具有至少80%序列同一性的序列的多肽的约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、
109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、140个、150个、175个、200个、225个、250个、300个、350个或更多个连续氨基酸,或其中的任何范围或值的连续氨基酸。在一些实施方案中,“部分”可以与从多肽中删除的氨基酸数量相关。因此,例如,hd-zip转录因子的删除的“部分”可包含本文所述的任何hd-zip转录因子的seq id no:9的氨基酸序列(vwfqnrra)的至少一个氨基酸残基(例如,至少1个、2个、3个、4个、5个、6个、7个、8个氨基酸残基),和/或至少两个氨基酸残基(例如,至少2个、3个、4个、5个、6个、7个、8个氨基酸残基)。在一些实施方案中,hd-zip转录因子的一部分的缺失可包含seq id no:9的一部分连续氨基酸残基(例如,至少2个、3个、4个、5个、6个、7个或8个连续氨基酸残基)。在一些实施方案中,缺失包括seq id no:9的至少一部分连续氨基酸残基(例如,至少1个、2个、3个、4个、5个、6个、7个或8个连续氨基酸残基),其中缺失长度可以是hd-zip转录因子的至少1个氨基酸残基至约120个氨基酸残基(例如,至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个或更多个连续氨基酸残基长至hd-zip转录因子的全长,以及其中的任何范围或值的连续氨基酸残基),并且其中至少1个删除的氨基酸残基来自hd-zip转录因子的dna结合区。在一些实施方案中,缺失可以是包括seq id no:9的至少一部分连续氨基酸残基(例如,至少1个、2个、3个、4个、5个、6个、7个或8个连续氨基酸残基)的截短。在一些实施方案中,截短可以是c-末端截短,并且包含至少96个连续氨基酸残基的长度。在一些实施方案中,截短可以是c-末端截短,并且包含约96个氨基酸残基至约125个氨基酸残基(例如,hd-zip转录因子的至少96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、121个、122个、123个、124个、125个或更多个连续氨基酸残基长至全长,以及其中的任何范围或值的连续氨基酸残基)的长度,并且其中至少1个被截短的氨基酸残基来自hd-zip转录因子的dna结合区。在一些实施方案中,缺失可以包括外显子3的缺失,其包含hd-zip转录因子的dna结合区(例如,hd-zip转录因子的被删除的部分长度可以是约27个氨基酸残基)。在一些实施方案中,截断可以是外显子2(例如,外显子2的一部分)中的缺失的结果,所述缺失导致外显子2编码的氨基酸残基的一部分和缺失后的所有剩余氨基酸被截断,从而,例如,截断外显子3和外显子4编码的所有氨基酸。因此,在一些实施方案中,缺失可导致hd-zip转录因子多肽的c-末端区域的截短,所述c-末端区域包括dna结合区或至少一部分dna结合区。
[0116]
在一些实施方案中,缺失可引起移码突变,导致终止密码子和hd-zip转录因子多肽的c末端的截短。在一些实施方案中,c-末端截短可导致包含207个氨基酸的多肽(例如,删除或截短的部分包括氨基酸残基207之后的所有氨基酸残基;参见,例如,玉米hd-zip编
辑的多肽seq id no:201)。
[0117]
在一些实施方案中,“序列特异性dna结合结构域”可与编码本文所述的hd-zip转录因子的核苷酸序列的一个或多个片段或部分结合。
[0118]
如本文关于核酸所使用的,术语“功能性片段”是指编码多肽的功能性片段的核酸。
[0119]
如本文中所用,术语“基因”是指能够用于产生mrna、反义rna、mirna、抗微小rna反义寡脱氧核糖核苷酸(amo)等的核酸分子。基因可以用于或可以不用于产生功能性蛋白质或基因产物。基因可以包括编码区和非编码区(例如,内含子、调控元件、启动子、增强子、终止序列和/或5’和3’非翻译区)。基因可以是“分离的”,其是指核酸大体上或基本上不含通常被发现与以其天然状态存在的所述核酸结合的组分。此类组分包括来自重组生产的其他细胞材料、培养基和/或用于化学合成核酸的各种化学物质。
[0120]
术语“突变”是指点突变(例如,错义或无义,或导致移码的单个碱基对的插入或缺失)、插入、缺失和/或截短。当突变是氨基酸序列中的残基被另一个残基取代,或者序列中一个或多个残基的缺失或插入时,通常通过鉴定原始残基,随后鉴定该残基在序列中的位置以及新取代的残基的身份来描述突变。在一些实施方案中,缺失可导致移码突变,产生提前终止密码子,从而截短蛋白质。
[0121]
如本文中所用,术语“互补的”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的天然结合。例如,序列“a-g-t”(5’至3’)与互补序列“t-c-a”(3’至5’)结合。两个单链分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在完全互补性时,互补性可以是完全的。核酸链之间的互补程度对核酸链之间杂交的效率和强度有显著影响。
[0122]
如本文中所用,“互补”可以指与比较核苷酸序列的100%互补性,或者其可以指与比较核苷酸序列的小于100%互补性(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等的互补性)。
[0123]
具有同源性的不同核酸或蛋白质在本文中被称为“同源物”。术语同源物包括来自相同物种和其他物种的同源序列以及来自相同物种和其他物种的直向同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列之间以位置同一性百分比(即,序列相似性或同一性)表示的相似性水平。同源性也指不同核酸或蛋白质之间相似功能特性的概念。因此,本发明的组合物和方法还包含与本发明核苷酸序列和多肽序列的同源物。如本文中所用,“直向同源”是指在物种形成期间从共同的祖先基因产生的不同物种中的同源核苷酸序列和/或氨基酸序列。本发明核苷酸序列的同源物与本发明的所述核苷酸具有基本序列同一性(例如,至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
[0124]
如本文中所用,“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在整个组分(例如,核苷酸或氨基酸)比对窗口中不变的程度。“同一性”可以通过已知的方法容易地计算,所述方法包括但不限于在以下文献中描述的方法:computational molecular biology(lesk,a.m.,编辑)oxford university press,new york(1988);biocomputing:
informatics and genome projects(smith,d.w.,编辑)academic press,new york(1993);computer analysis of sequence data,part i(griffin,a.m.和griffin,h.g.,编辑)humana press,new jersey(1994);sequence analysis in molecular biology(von heinje,g.,编辑)academic press(1987);和sequence analysis primer(gribskov,m.和devereux,j.,编辑)stockton press,new york(1991)。
[0125]
如本文中所用,术语“序列同一性百分比”或“同一性百分比”是指当两个序列最佳比对时,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列与测试(“受试”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中,“同一性百分比”可以指与参照多肽相比,氨基酸序列中相同氨基酸的百分比。
[0126]
如本文中所用,在两个核酸分子、核苷酸序列或多肽序列的上下文中,短语“基本同一的”或“基本同一性”是指两个或更多个序列或亚序列在就最大对应性进行比较和比对时,具有如使用以下序列比较算法之一或通过目测检查所测量的至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%核苷酸或氨基酸残基同一性。在本发明的一些实施方案中,基本同一性存在于本发明核苷酸序列的连续核苷酸区域中,所述连续核苷酸区域的长度为约10个核苷酸至约20个核苷酸、约10个核苷酸至约25个核苷酸、约10个核苷酸至约30个核苷酸、约15个核苷酸至约25个核苷酸、约30个核苷酸至约40个核苷酸、约50个核苷酸至约60个核苷酸、约70个核苷酸至约80个核苷酸、约90个核苷酸至约100个核苷酸或更多个核苷酸,以及其中的任何范围,直至序列的全长。在一些实施方案中,核苷酸序列可以在至少约20个核苷酸(例如,约20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个核苷酸)上基本相同。在本发明的一些实施方案中,大体同一性存在于本发明多肽的连续氨基酸残基区域,其为长度为约3个氨基酸残基至约20个氨基酸残基、约5个氨基酸残基至约25个氨基酸残基、约7个氨基酸残基至约30个氨基酸残基、约10个氨基酸残基至约25个氨基酸残基、约15个氨基酸残基至约30个氨基酸残基、约20个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约50个氨基酸残基、约30个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约70个氨基酸残基、约50个氨基酸残基至约70个氨基酸残基、约60个氨基酸残基至约80个氨基酸残基、约70个氨基酸残基至约80个氨基酸残基、约90个氨基酸残基至约100个氨基酸残基,或更多个氨基酸残基,以及其中的任何范围,直至序列的全长。在一些实施方案中,多肽序列可以在至少约8个连续的氨基酸残基(例如,长度约8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、130个、140个、150个、175
ssc洗涤15分钟。对于短探针(例如,约10至50个核苷酸),严格条件通常涉及小于约1.0m na离子的盐浓度,在ph 7.0至8.3下通常为约0.01至1.0m na离子浓度(或其他盐),并且温度通常为至少约30℃。还可通过加入诸如甲酰胺等去稳定剂来达到严格条件。一般来说,在特定的杂交测定中,信噪比为对于无关探针观察的信噪比的2倍(或更高)表明检测到了特异性杂交。如果在严格条件下不相互杂交的核苷酸序列编码的蛋白质大体上相同,则所述核苷酸序列仍然是大体上相同的。例如,当使用遗传密码所允许的最大密码子简并性产生核苷酸序列的拷贝时,这可以发生。
[0132]
可为了表达对本发明的多核苷酸和/或重组核酸构建体(例如,表达盒和/或载体)进行密码子优化。在一些实施方案中,可为了在植物中表达对本发明编辑系统的多核苷酸、核酸构建体、表达盒和/或载体(例如,包含/编码序列特异性dna结合结构域(例如,来自多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应核酸酶(talen)、argonaute蛋白和/或crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)(例如,i型crispr-cas效应蛋白、ii型crispr-cas效应蛋白、iii型crispr-cas效应蛋白、iv型crispr-cas效应蛋白、v型crispr-cas效应蛋白或vi型crispr-cas效应蛋白)、核酸酶(例如,核酸内切酶(例如,fok1)、多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(talen))、脱氨酶蛋白/结构域(例如腺嘌呤脱氨酶、胞嘧啶脱氨酶)、编码逆转录酶或结构域的多核苷酸、编码5'-3’核酸外切酶多肽的多核苷酸和/或亲和多肽、肽标签等)进行密码子优化。在一些实施方案中,本发明的经密码子优化的核酸、多核苷酸、表达盒和/或载体与未经密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70%至约99.9%(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)同一性或更高高一性。
[0133]
在本文所述的任何实施方案中,本发明的多核苷酸或核酸构建体可以与多种启动子和/或其它调控元件可操作地连接,用于在植物和/或植物细胞中表达。因此,在一些实施方案中,本发明的多核苷酸或核酸构建体还可包含与一个或多个核苷酸序列可操作地连接的一个或多个启动子、内含子、增强子和/或终止子。在一些实施方案中,启动子可以与内含子(例如,ubi1启动子和内含子)可操作地相关联。在一些实施方案中,与内含子相关联的启动子可被称为“启动子区”(例如,ubi1启动子和内含子)。
[0134]
如本文中提及多核苷酸时使用的“可操作地连接”或“可操作地相关联的”是指所示元件在功能上彼此相关,并且通常在物理上也相关。因此,如本文中所用,术语“可操作地连接”或“可操作地相关联的”是指单个核酸分子上功能上相关联的核苷酸序列。因此,与第二核苷酸序列可操作连接的第一核苷酸序列意指第一核苷酸序列被放置成与第二核苷酸序列处于功能关系中时的情况。例如,如果启动子影响所述核苷酸序列的转录或表达,则所述启动子与所述核苷酸序列可操作地相关联。本领域技术人员将会理解,控制序列(例如,启动子)不需要与与其可操作地相关联的核苷酸序列连续,只要控制序列能够指导其表达即可。因此,例如,居间非翻译但仍可转录的核酸序列可存在于启动子与核苷酸序列之间,并且启动子仍然可以被认为是可与核苷酸序列“可操作地连接”。
[0135]
如本文中所用,涉及多肽时,术语“连接的”是指一种多肽与另一种多肽的附接。多肽可以直接(例如,通过肽键)或通过接头与另一种多肽(在n-末端或c-末端)连接。
[0136]
术语“接头”是本领域公认的,并且是指连接两个分子或部分(例如,融合蛋白的两个结构域,例如dna结合多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽;或dna核酸内切酶多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽)的化学基团或分子。接头可以由单个连接分子组成,或者可以包含不止一个连接分子。在一些实施方案中,接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。在一些实施方案中,接头可以是氨基酸或者其可以是肽。在一些实施方案中,接头是肽。
[0137]
在一些实施方案中,可用于本发明的肽接头的长度可为约2至约100个或更多个氨基酸,例如,约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个氨基酸(例如,长度为约2至约40个、约2至约50个、约2至约60个、约4至约40个、约4至约50个、约4至约60个、约5至约40个、约5至约50个、约5至约60个、约9至约40个、约9至约50个、约9至约60个、约10至约40个、约10至约50个、约10至约60,或长度为约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个氨基酸至约26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或更多个氨基酸(例如,长度为约105个、110个、115个、120个、130个、140个、150个或更多个氨基酸))。在一些实施方案中,肽接头可以是gs接头。
[0138]
如本文中所用,关于多核苷酸的术语“连接的”或“融合的”是指一个多核苷酸与另一个多核苷酸的附接。在一些实施方案中,两个或更多个多核苷酸分子可以通过接头连接,所述接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。多核苷酸可以通过共价或非共价键联或结合(包括例如watson-crick碱基配对)或通过一个或多个连接核苷酸与另一个多核苷酸(在5’末端或3’末端)连接或融合。在一些实施方案中,某一结构的多核苷酸基序可插入另一多核苷酸序列中(例如,引导rna中发夹结构的延伸)。在一些实施方案中,连接核苷酸可以是天然存在的核苷酸。在一些实施方案中,连接核苷酸可以是非天然存在的核苷酸。
[0139]“启动子”是控制或调节与启动子可操作地相关联的核苷酸序列(例如,编码序列)的转录的核苷酸序列。由启动子控制或调节的编码序列可以编码多肽和/或功能性rna。通常,“启动子”是指含有rna聚合酶ii结合位点并指导转录起始的核苷酸序列。通常,相对于相应编码序列的编码区的起始,启动子位于5’或上游。启动子可包含其它作为基因表达的调控子的元件;例如启动子区域。这些包括tata盒共有序列,并且通常是caat盒共有序列(breathnach和chambon,(1981)annu.rev.biochem.50:349)。在植物中,caat盒可用agga盒
代替(messing等,(1983)于genetic engineering of plants,t.kosuge,c.meredith和a.hollaender(编辑),plenum press,第211-227页中)。
[0140]
可用于本发明的启动子可包括例如组成型、诱导型、时间调控型、发育调控型、化学调控型、组织优先型和/或组织特异性启动子,用于制备重组核酸分子,例如“合成核酸构建体”或“蛋白质-rna复合物”。这些不同类型的启动子是本领域已知的。
[0141]
启动子的选择可以根据表达的时间和空间要求而变化,也可以根据待转化的宿主细胞而变化。许多不同生物体的启动子是本领域公知的。基于本领域的广泛知识,可以为特定目标宿主生物选择合适的启动子。因此,例如,对模式生物中高度组成型表达的基因上游的启动子了解很多,并且此类知识可以容易地访问并在适当的情况下于其它系统中实现。
[0142]
在一些实施方案中,在植物中有功能的启动子可以与本发明的构建体一起使用。用于在植物中驱动表达的启动子的非限制性实例包括rubisco小亚基基因1的启动子(prbcs1)、肌动蛋白基因的启动子(pactin)、硝酸还原酶基因的启动子(pnr)和复制碳酸酐酶基因1的启动子(pdca1)(参见,walker等人plant cell rep.23:727-735(2005);li等人gene 403:132-142(2007);li等人mol biol.rep.37:1143-1154(2010))。prbcs1和pactin是组成型启动子,pnr和pdca1是诱导型启动子。pnr受硝酸盐诱导,受铵抑制(li等人gene 403:132-142(2007))并且pdca1受盐诱导(li等人mol biol.rep.37:1143-1154(2010))。在一些实施方案中,可用于本发明的启动子是rna聚合酶ii(pol ii)启动子。在一些实施方案中,来自玉蜀黍的u6启动子或7sl启动子可用于本发明的构建体。在一些实施方案中,来自玉蜀黍的u6c启动子和/或7sl启动子可用于驱动引导核酸的表达。在一些实施方案中,来自大豆的u6c启动子、u6i启动子和/或7sl启动子可用于本发明的构建体。在一些实施方案中,来自大豆的u6c启动子、u6i启动子和/或7sl启动子可用于驱动引导核酸的表达。
[0143]
用于植物的组成型启动子的实例包括但不限于,cestrum病毒启动子(cmp)(美国专利第7,166,770号)、水稻肌动蛋白1启动子(wang等人(1992)mol.cell.biol.12:3399-3406;以及美国专利第5,641,876号)、camv 35s启动子(odell等人(1985)nature 313:810-812)、camv 19s启动子(lawton等人(1987)plant mol.biol.9:315-324)、nos启动子(ebert等人(1987)proc.natl.acad.sci usa 84:5745-5749)、adh启动子(walker等人(1987)proc.natl.acad.sci.usa 84:6624-6629)、蔗糖合酶启动子(yang&russell(1990)proc.natl.acad.sci.usa 87:4144-4148)和遍在蛋白启动子。来源于遍在蛋白的组成型启动子在许多细胞类型中积累已经从几种植物物种中克隆了遍在蛋白启动子用于转基因植物,例如向日葵(binet等人,1991.plant science 79:87-94)、玉米(christensen等人,1989.plant molec.biol.12:619-632)和拟南芥(norris等人1993.plant molec.biol.21:895-906)。已经在转基因单子叶植物系统中开发了玉米遍在蛋白启动子(ubip),并且在专利公布ep 0 342 926中公开了其序列和构建用于单子叶植物转化的载体。遍在蛋白启动子适用于在转基因植物,尤其是单子叶植物中表达本发明的核苷酸序列。另外,由mcelroy等人描述的启动子表达盒(mol.gen.genet.231:150-160(1991))可被容易地修饰以表达本发明的核苷酸序列,并且特别适用于单子叶宿主。
[0144]
在一些实施方案中,组织特异性/组织优先启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或优先表达模式包括但不限于绿色组织特异性或优先、根特异性或优先、茎特异性或优先、花特异性或优先或花粉特异性或优先表达模式。适于在绿色组织中
表达的启动子包括许多调节参与光合作用的基因的启动子,这些启动子中的许多启动子已被从单子叶植物和双子叶植物中克隆出来。在一个实施方案中,可用于本发明的启动子是来自磷酸烯醇羧化酶基因的玉米pepc启动子(hudspeth&grula,plant molec.biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括那些与编码种子贮藏蛋白(诸如β-伴大豆球蛋白、十字花科蛋白(cruciferin)、油菜籽蛋白(napin)和菜豆蛋白)、玉米蛋白或油体蛋白(诸如油质蛋白)、或参与脂肪酸生物合成的蛋白(包括酰基载体蛋白、硬脂酰-acp去饱和酶和脂肪酸去饱和酶(fad 2-1))的基因相关联的启动子,以及在胚胎发育期间表达的其它核酸(诸如bce4,参见,例如,kridl等人(1991)seed sci.res.1:209-219;以及欧洲专利第255378号)。用于在植物,特别是玉米中表达本发明核苷酸序列的组织特异性或组织优先启动子包括但不限于在根、髓、叶或花粉中指导表达的启动子。此类启动子公开于例如wo 93/07278(过引用以其整体并入本文)中。可用于本发明的组织特异性或组织优先启动子的其它非限制性实例:美国专利6,040,504中公开的棉花rubisco启动子;美国专利5,604,121中公开的水稻蔗糖合酶启动子;de framond(febs 290:103-106(1991);属于ciba-geigy的ep 0 452 269)描述的根特异性启动子;美国专利5,625,136(属于ciba-geigy)中描述的茎特异性启动子,其驱动玉米trpa基因的表达;wo 01/73087中公开的洋丁香属黄叶卷曲病毒启动子;和花粉特异性或优先启动子,包括但不限于来自水稻的prooslps10和prooslps11(nguyen等人plant biotechnol.reports 9(5):297-306(2015))、来自玉米的zmstk2_usp(wang等人genome 60(6):485-495(2017))、来自番茄的lat52和lat59(twell等人development 109(3):705-713(1990))、zm13(美国专利第10,421,972号)、来自拟南芥的pla
2-δ启动子(美国专利第7,141,424号)和/或来自玉米的zmc5启动子(国际pct公布第wo1999/042587号)。
[0145]
植物组织特异性/组织优先启动子的其他实例包括但不限于根毛特异性顺式元件(rhe)(kim等人the plant cell 18:2958-2970(2006))、根特异性启动子rcc3(jeong等人plant physiol.153:185-197(2010))和rb7(美国专利第5459252号)、植物凝集素启动子(lindstrom等人(1990)der.genet.11:160-167;和vodkin(1983)prog.clin.biol.res.138:87-98)、玉米醇脱氢酶1启动子(dennis等人(1984)nucleic acids res.12:3983-4000)、s-腺苷-l-甲硫氨酸合成酶(sams)(vander mijnsbrugge等人(1996)plant and cell physiology,37(8):1108-1115)、玉米光收获复合物启动子(bansal等人(1992)proc.natl.acad.sci.usa 89:3654-3658)、玉米热休克蛋白启动子(o'dell等人(1985)embo j.5:451-458;和rochester等人(1986)embo j.5:451-458)、豌豆小亚基rubp羧化酶启动子(cashmore,"nuclear genes encoding the small subunit of ribulose-l,5-bisphosphate carboxylase”第29-39页in:genetic engineering of plants(hollaender编辑,plenum press 1983;和poulsen等人(1986)mol.gen.genet.205:193-200)、ti质粒甘露碱合酶启动子(langridge等人(1989)proc.natl.acad.sci.usa 86:3219-3223)、ti质粒胭脂氨酸合酶启动子(langridge等人(1989),同上),矮牵牛查尔酮异构酶启动子(van tunen等人(1988)embo j.7:1257-1263)、大豆富含甘氨酸蛋白1启动子(keller等人(1989)genes dev.3:1639-1646)、截短的camv 35s启动子(o'dell等人(1985)nature313:810-812)、马铃薯块茎储藏蛋白(patatin)启动子(wenzler等人(1989)plant mol.biol.13:347-354)、根细胞启动子(yamamoto等人(1990)nucleic acids res.18:
7449)、玉米醇溶蛋白启动子(kriz等人(1987)mol.gen.genet.207:90-98;langridge等人(1983)cell 34:1015-1022;reina等人(1990)nucleic acids res.18:6425;reina等人(1990)nucleic acids res.18:7449;和wandelt等人(1989)nucleic acids res.17:2354)、球蛋白-1启动子(belanger等人(1991)genetics129:863-872)、α-微管蛋白cab启动子(sullivan等人(1989)mol.gen.genet.215:431-440)、pepcase启动子(hudspeth&grula(1989)plant mol.biol.12:579-589)、r基因复合物相关启动子(chandler等人(1989)plant cell 1:1175-1183)和查尔酮合酶启动子(franken等人(1991)embo j.10:2605-2612)。
[0146]
对种子特异性表达有用的是豌豆的豌豆球蛋白启动子(czako等人(1992)mol.gen.genet.235:33-40);以及美国专利第5,625,136号中公开的种子特异性启动子。用于在成熟叶中表达的有用启动子是那些在衰老开始时被转换的启动子,诸如来自拟南芥的sag启动子(gan等人(1995)science 270:1986-1988)。
[0147]
另外,可以使用在叶绿体中有功能的启动子。此类启动子的非限制性实例包括噬菌体t3基因9的5’utr和美国专利第7,579,516号中公开的其他启动子。可用于本发明的其它启动子包括但不限于s-e9小亚基rubp羧化酶启动子和kunitz胰蛋白酶抑制剂基因启动子(kti3)。
[0148]
可用于本发明的其它调控元件包括但不限于内含子、增强子、终止序列和/或5’和3’非翻译区。
[0149]
可用于本发明的内含子可以是从植物中鉴定和分离的内含子,然后被插入到用于植物转化的表达盒。如本领域技术人员所理解的,内含子可以包含自我切除所需的序列,并被框内整合到核酸构建体/表达盒中。内含子可以用作间隔子来分隔一个核酸构建体中的多个蛋白质编码序列,或者可在一个蛋白质编码序列内部使用内含子来例如稳定mrna。如果它们被用在蛋白质编码序列中,则它们被插入“框内”,其中包括切除位点。还可将内含子与启动子结合以改善或修饰表达。例如,可用于本发明的启动子/内含子组合包括但不限于玉米ubi1启动子和内含子的组合(参见,例如,seq id no:196和seq id no:197)。
[0150]
可用于本发明的内含子的非限制性实例包括来自adhi基因(例如,adh1-s内含子1、2和6)、遍在蛋白基因(ubi1)、rubisco小亚基(rbcs)基因、rubisco大亚基(rbcl)基因、肌动蛋白基因(例如,肌动蛋白-1内含子)、丙酮酸脱氢酶激酶基因(pdk)、硝酸还原酶基因(nr)、复制碳酸酐酶基因1(tdca1)、psba基因、atpa基因或其任意组合的内含子。
[0151]
在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”或可以包含在表达盒内。如本文中所用,“表达盒”意指包含例如一种或多种本发明的多核苷酸的重组核酸分子(例如,编码序列特异性dna结合结构域的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸、编码逆转录酶蛋白或结构域的多核苷酸、编码5
’‑3’
核酸外切酶多肽或结构域的多核苷酸、引导核酸和/或逆转录酶(rt)模板),其中一种或多种多核苷酸与一种或多种控制序列(例如,启动子、终止子等)可操作地相关联。因此,在一些实施方案中,可以提供一种或多种表达盒,其被设计成表达例如本发明的核酸构建体(例如,编码序列特异性dna结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶蛋白/结构域的多核苷酸、编码5
’‑3’
核酸外切酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等,或者包含引导核酸、延
伸的引导核酸和/或rt模板等)。当本发明的表达盒包含不止一个多核苷酸时,多核苷酸可以与驱动所有多核苷酸表达的单个启动子可操作地连接,或者多核苷酸可以与一个或多个单独的启动子可操作地连接(例如,三个多核苷酸可以由一个、两个或三个启动子以任意组合驱动)。当使用两种或更多种不同的启动子时,所述启动子可以是相同的启动子,也可以是不同的启动子。因此,当包含在单个表达盒中时,编码序列特异性dna结合结构域的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码crispr-cas效应蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域的多核苷酸(例如,rna依赖性dna聚合酶)、和/或编码5
’‑3’
核酸外切酶多肽/结构域的多核苷酸、引导核酸、延伸的引导核酸和/或rt模板可以各自与单个启动子或任意组合的独立启动子可操作地连接。
[0152]
包含本发明的核酸构建体的表达盒可以是嵌合的,意味着其至少一个组分相对于其至少一个其它组分是异源的(例如,来自宿主生物的启动子可操作地连接到将在宿主生物中表达的目标多核苷酸,其中所述目标多核苷酸来自不同于宿主的生物体,或者通常被发现不与该启动子相关联)。表达盒也可以是天然存在的,但已经以用于异源表达的重组形式获得的表达盒。
[0153]
表达盒可以任选地包括转录和/或翻译终止区(即终止区)和/或在所选宿主细胞中有功能的增强子区。多种转录终止子和增强子是本领域已知的,并且可获得用于表达盒中。转录终止子负责转录的终止和正确的mrna多聚腺苷酸化。终止区和/或增强子区可以原产于转录起始区,可以原产于例如编码序列特异性dna结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或者可以原产于宿主细胞,或者可以原产于另一来源(例如,对于例如启动子、编码序列特异性dna结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或对于宿主细胞或其任意组合是外来的或异源的)。
[0154]
本发明的表达盒还可包括编码选择标记的多核苷酸,其可用于选择转化的宿主细胞。如本文中所用,“选择标记”是指这样的多核苷酸序列,当其被表达时,赋予表达该标记的宿主细胞独特的表型,从而使此类转化的细胞与那些不该标记的细胞相区别。这种多核苷酸序列可以编码选择标记或可筛选的标记,这取决于该标记是否赋予可通过化学手段,诸如通过使用选择剂(例如,抗生素等)选择的性状,或者取决于该标记是否仅仅是可通过观察或测试,诸如通过筛选(例如,荧光)鉴定的性状。合适的选择性标记的许多实例是本领域已知的,并且可用于本文所述的表达盒中。
[0155]
除了表达盒之外,本文所述的核酸分子/构建体和多核苷酸序列也可与载体结合使用。术语“载体”是指用于将核酸(或多种核酸)转移、递送或引入细胞的组合物。载体包含含有待转移、递送或引入的一种或多种核苷酸序列的核酸构建体(例如一种或多种表达盒)。用于转化宿主生物体的载体是本领域公知的。一般类别的载体的非限制性实例包括呈双链或单链线性或环状形式的病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、微环或土壤杆菌(agrobacterium)二元载体,其可以是或可以不是自我传递的或可移动的。在一些实施方案中,病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合入细胞基因组或存在于染色体外(例如具有复制起点的自主复制质粒)来转化原核或真核宿主。另外还包括穿梭载体,所述穿梭载体是指能够天然地或通过设计在两种不同的宿主生
物体中复制的dna媒介物,所述宿主生物体可选自放线菌(actinomycetes)和相关物种、细菌和真核生物(例如高等植物、哺乳动物、酵母或真菌细胞)。在一些实施方案中,载体中的核酸处于合适的启动子或用于在宿主细胞中转录的其他调控元件的控制之下,并与其可操作地连接。载体可以是在多种宿主中起作用的双功能表达载体。在基因组dna的情况下,这可能包含其自身的启动子和/或其它调控元件,而在cdna的情况下,这可能处于合适的启动子和/或其它调控元件的控制之下,以便在宿主细胞中表达。因此,本发明的核酸或多核苷酸和/或包含其的表达盒可以包含在本文所述和本领域已知的载体中。
[0156]
如本文中所用,“接触(contact)”、“接触(contacting)”、“接触(contacted)”及其语法变型是指在适于进行所需反应(例如,转化、转录控制、基因组编辑、产生切口和/或切割)的条件下,将所需反应的组分放置在一起。例如,可在序列特异性dna结合蛋白、逆转录酶和脱氨酶被表达并且序列特异性dna结合蛋白与靶核酸结合的条件下,将靶核酸与序列特异性dna结合蛋白(例如,多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(talen)和/或argonaute蛋白))和脱氨酶或编码其的核酸构建体接触,并且可将逆转录酶和/或脱氨酶与序列特异性dna结合蛋白融合,或者募集到序列特异性dna结合蛋白(例如,通过与序列特异性dna结合蛋白融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签),因此,脱氨酶和/或逆转录酶位于靶核酸附近,从而修饰所述靶核酸。可以使用利用其他蛋白质-蛋白质相互作用募集逆转录酶和/或脱氨酶的其他方法,并且还可将rna-蛋白质相互作用和化学相互作用于蛋白质-蛋白质和蛋白质-核酸募集。
[0157]
如本文中所用,涉及靶核酸的“修饰(modifying)”、“修饰(modification)”、“突变(mutating)”或“突变(mutation)”(所述术语在本文中可互换使用)包括编辑(例如,突变)、共价修饰、交换/取代核酸/核苷酸碱基、删除、切割、切刻和/或改变靶核酸的转录控制。在一些实施方案中,修饰可以包括一个或多个任何类型的单碱基改变(snp)。
[0158]
在目标多核苷酸的上下文中,“引入(introducing)”、“引入(introduce)”、“引入(introduced)”(及其语法变型)是指将目标核苷酸序列(例如,多核苷酸、rt模板、核酸构建体和/或引导核酸)以使得该核苷酸序列能够进入细胞内部的方式呈递至植物、其植物部分或其细胞。
[0159]
术语“转化”或“转染”可以互换使用,并且如本文中所用,是指将异源核酸导入细胞。细胞的转化可以是稳定的或瞬时的。因此,在一些实施方案中,可用本发明的多核苷酸/核酸分子稳定转化宿主细胞或宿主生物体(例如,植物)。在一些实施方案中,可用本发明的多核苷酸/核酸分子瞬时转化宿主细胞或宿主生物体。
[0160]
多核苷酸上下文中的“瞬时转化”意指多核苷酸被引入细胞,但不整合到细胞的基因组中。
[0161]
在引入细胞的多核苷酸的上下文中,“稳定地引入(stably introducing)”或“稳定地引入(stably introduced)”旨在指引入的多核苷酸被稳定整合到细胞的基因组中,因此细胞被多核苷酸稳定地转化。
[0162]
如本文中所用,“稳定的转化”或“稳定地转化”意指将核酸分子引入细胞并整合到细胞的基因组中。因此,整合的核酸分子能够被其子代遗传,更具体地,被多个连续世代的子代遗传。如本文中所用,“基因组”包括细胞核和质体基因组,因此包括将核酸整合到例如
叶绿体或线粒体基因组中。如本文中所用,稳定的转化也可指保持在染色体外的转基因(例如,作为微小染色体或质粒)。
[0163]
瞬时转化可以通过例如酶联免疫吸附测定(elisa)或蛋白质印迹来检测,所述测定或蛋白质印迹可以检测由引入生物体的一种或多种转基因编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组dna与核酸序列的southern印迹杂交分析来检测,所述核酸序列与导入生物体(例如,植物)的转基因的核苷酸序列特异性杂交。细胞的稳定转化可以通过例如细胞的rna与核酸序列的northern印迹杂交测定来检测,所述核酸序列与引入宿主生物体的转基因的核苷酸序列特异性杂交。细胞的稳定转化还可以通过例如聚合酶链式反应(pcr)或本领域公知的其它扩增反应来检测,所述聚合酶链式反应或其它扩增反应使用与转基因的一个或多个靶序列杂交的特异性引物序列,导致转基因序列的扩增,这可以根据标准方法来检测。转化也可以通过本领域公知的直接测序和/或杂交方案来检测。
[0164]
因此,在一些实施方案中,本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以瞬时表达并且/或者它们可被稳定地整合到宿主生物体的基因组中。因此,在一些实施方案中,本发明的核酸构建体(例如,一个或多个包含如本文所述用于编辑的多核苷酸的表达盒)可被瞬时引入具有引导核酸的细胞中,因此,细胞中不保留dna。
[0165]
可以通过本领域技术人员已知的任何方法将本发明的核酸构建体引入植物细胞。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如,通过封杆菌)、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、浸润、peg介导的核酸摄取以及导致核酸引入植物细胞的任何其他电、化学、物理(机械)和/或生物机制(包括其任意组合)的转化。转化真核生物体和原核生物体的方法是本领域公知的常规方法,并在整个文献中有描述(参见,例如,jiang等人2013.nat.biotechnol.31:233-239;ran等人nature protocols 8:2281

2308(2013))。本领域已知的各种植物转化方法的一般指南包括miki等人("procedures for introducing foreign dna into plants"in methods inplant molecular biology and biotechnology,glick,b.r.和thompson,j.e.,编辑(crc press,inc.,boca raton,1993),第67-88页)和rakowoczy-trojanowska(cell.mol.biol.lett.7:849-858(2002))。
[0166]
在本发明的一些实施方案中,细胞的转化可以包括核转化。在其他实施方案中,细胞的转化可以包括质体转化(例如,叶绿体转化)。在又一另外的实施方案中,可以通过常规育种技术将本发明的核酸引入细胞。在一些实施方案中,可以通过土壤杆菌转化将多核苷酸、表达盒和/或载体中的一种或多种引入植物细胞。
[0167]
因此,可以以本领域公知的许多方式将多核苷酸引入植物、植物部分、植物细胞。本发明的方法不依赖于将一种或多种核苷酸序列引入植物的特定方法,仅依赖于它们进入细胞内部。当要引入水止一种多核苷酸时,它们可以作为单个核酸构建体的一部分装配,或者作为单独的核酸构建体装配,并且可以位于同一或不同的核酸构建体上。因此,多核苷酸可以在单个转化事件中或在单独的转化事件中被引入目标细胞中,或者,多核苷酸可以作为育种方案的一部分被整合到植物中。
[0168]
例如,玉米的产量(蒲式耳/英亩)通过高强度育种稳步增加。然而,产量的增量增
加最近已经开始达到平台期,并且需要在田间评价和育种方面进行大量投资以清楚地证明遗传增益。需要新的遗传修饰方法来显著提高产量,这是通过常规方法不可能实现的。农作物产量可以以两种截然不同的方法来提高:1)产量本身的提高,其中工程改造的植物获得了优势,诸如改善的光合作用或优化的碳水化合物分配,或2)消除了与高产农业不一致的残留存活机制。避荫反应(sar)或避荫综合征(sas)就是这样一种生存机制。sas/sar的特征在于根冠比增加,株高增加,单株产量降低,在典型的单作作物环境中,这种对竞争的反应是一种浪费的生存机制。
[0169]
因此,本发明解决了与增加的种植密度耐受性(参见,图3)和由于种植可变性引起的产量损失(以英亩为基础)减少相关联的问题。本发明描述了基因编辑修饰触发作物避荫的关键调节因子(例如,显性失活突变)的用途(参见,例如,图4)。具有此类编辑过的基因组的植物将具有降低的避荫能力。用于解决(例如,减少/减弱)sar/sas的突变的实例可以是去除二聚化为有功能的转录因子的dna结合功能的突变。在一些情况下,这种突变可以是显性失活突变(参见例如,图4)。
[0170]
hd(同源结构域)-lz(亮氨酸拉链)(hd-zip)类转录因子在植物中具有多种功能。ii型种类与光感和避荫相关联。一个特定的hd-lz ii类成员(hb53)已被证明是由遮荫处理诱导的。在玉米中,zmhb53是athb2(与拟南芥中的避荫反应密切相关的一种hdlz)的最接近的玉米同源物(carabelli等人,1996;steindler等人,1999)(参见例如,图5)。密切相关的hdlz蛋白zmhb78已被鉴定为用于减弱避荫作用的另一个靶标。一种减弱可用于本发明的转录因子(例如hb53、hb78)的dna结合能力的方法可以包括修饰单个氨基酸(缺失、插入或取代)或通过框内缺失去除全部或部分dna结合结构域。
[0171]
图1提供了来自44种不同植物物种的hd-zip(hb78)氨基酸序列的比对。图1所示的序列是来自全长hb78序列的一部分连续氨基酸(53个氨基酸残基)。还提供了来自45种不同植物物种的hd-zip(hb53)氨基酸序列的比对(图2)。图2所示的序列是来自全长hb53序列的一部分连续氨基酸残基(例如,约116个氨基酸残基)。这些比对表明在这两个基因的靶向区域中存在实质的保守性,并证明靶向内源同源结构域-亮氨酸拉链(hd-zip)转录因子的本发明(其中突变破坏了hd-zip转录因子与dna的结合)将被预测在不同的植物物种中起作用,以产生具有减弱的避荫反应的植物。
[0172]
这些基因的可能编辑的实例提供于图6、图7、图8和图9中。图6提供了玉蜀黍中hb53的dna结合结构域的编辑的实例,并在方框中显示了用于修饰的目标示例性氨基酸残基。图7提供了具有示例引导核酸的注释的hb78基因,图8提供了hb78基因(seq id no:295)中缺失的示例,显示了例如外显子2中的缺失(seq id no:297)导致删除外显子3、外显子4和dna结合结构域的截短,从而导致蛋白质序列中的缺失(seq id no:296)。图9提供了编辑的植物的代表性基因组序列(编码链(seq id no:298)和非编码链(seq id no:299)),显示了hb78 dna结合结构域上游的提前终止。图13提供了使用质粒pwise443、pwise444、pwise446和pwise447及其相应间隔子示例性靶向hb53(上图)和hb78(下图)的示意图。质粒pwise448包含对于hb78所显示的所有四个间隔子,质粒pwise445包含对于hb53所显示的所有四个间隔子,而质粒pwise451包含所有八个间隔子(hb53有四个,hb78有四个,如图13所示)。
[0173]
在一些实施方案中,本发明提供了在内源同源结构域-亮氨酸拉链(hd-zip)转录
因子中包含至少一个非天然突变的植物或其植物部分,其中所述突变破坏了hd-zip转录因子与dna的结合。在一些实施方案中,hd-zip转录因子可以是hd-zip ii型(hd-zip ii)转录因子,其中hd-zip ii转录因子能够调节植物对光照的反应(例如,调节避荫反应(sar))。在一些实施方案中,可用于本发明的hd-zip ii转录因子可包括但不限于athb2、hb53和/或hb78的直向同源物。在一些实施方案中,可用于本发明的hd-zip ii转录因子可以是同源异型框蛋白53(hb53)或同源异型框蛋白78(hb78)。可用于本发明的hd-zip转录因子是包含以下序列的hd-zip转录因子:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽;(b)包含与以下氨基酸序列具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽:rkklrlskdqsavledsfrehptlnprqkaalaqqlglrprqvevwfqnrrartklkqtevdceylkrccetlteenrrlqkevqelralklvsphlymhmsppttltmcpscerv(seq id no:1)(玉蜀黍hb53)或rkklrlskdqaavleesfkehntlnpkqkaalakqlnlkprqvevwfqnrrartklkqtevdceflkrccetlteenrrlqrevaelrvlklvaphhyarmpppttltmcpscerl seq id no:2)(玉蜀黍hb78);(c)包含与氨基酸序列lakqlnlkprqvevwfqnrrartklkqtevdceflkrccetlteenrrlqrev(seq id no:3)具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽;(d)包含与核苷酸序列rqvevwfqnrrartklkqtevdce(seq id no:4)具有至少95%序列同一性(例如,至少约95%、96%、97%、99%、99.5%或100%序列同一性)的序列的多肽;(e)包含具有氨基酸序列rqvevwfqnrrartkxkqtevdce(seq id no:5)的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。
[0174]
在一些实施方案中,本发明的植物或植物部分包含hd-zip转录因子,所述hd-zip转录因子包含:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽;(b)包含与以下氨基酸序列具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽:rkklrlskdqsavledsfrehptlnprqkaalaqqlglrprqvevwfqnrrartklkqtevdceylkrccetlteenrrlqkevqelralklvsphlymhmsppttltmcpscerv(seq id no:1)(玉蜀黍hb53)或rkklrlskdqaavleesfkehntlnpkqkaalakqlnlkprqvevwfqnrrartklkqtevdceflkrccetlteenrrlqrevaelrvlklvaphhyarmpppttltmcpscerl seq id no:2)(玉蜀黍hb78);(c)包含与氨基酸序列lakqlnlkprqvevwfqnrrartklkqtevdceflkrccetlteenrrlqrev(seq id no:3)具有至少80%序列同一性(例如,至少约80%、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、99%或100%序列同一性)的序列的多肽;(d)包含与核苷酸序列rqvevwfqnrrartklkqtevdce(seq id no:4)具有至少95%序列同一性(例如,至少约95%、96%、97%、99%、99.5%或100%序列同一性)的序列的多肽;(e)包含具有氨基酸序列rqvevwfqnrrartkxkqtevdce(seq id no:5)的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。因此,用于本发明的hd-zip转录因子可以包含seq id no:1-8或10-98中的任一个的氨基酸序列,其包含含有氨基酸序列vwfqnrra(seq id no:9)的dna结合结构域。例如,包含seq id no:38的氨基酸序列的hd-zip转录因子的残基173-288包含seq id no:9的氨基酸序列。作为另一个实例,包含seq id no:83的氨基酸序列的hd-zip转录因子的残基76-191包含seq id no:9的氨基酸序列。除了seq id no:9之外,用于本发明的hd-zip转录因子中鉴定的其它多肽结构域包括与seq id no:1和/或seq id no:2的氨基酸序列包含至少80%序列同一性的多肽,包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽,包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽,包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s,包含具有seq id no:6所示氨基酸序列的序列的多肽,其中x1是s或t,x2是d或e,x3是s或a,包含具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列的多肽,其中x1是q或h,x2是r或k,x3是v或l,和/或包含具有seq id no:8所示氨基酸序列的序列的多肽,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n。
[0175]
在一些实施方案中,植物中内源同源结构域-亮氨酸拉链(hd-zip)转录因子中的至少一个非天然突变可以是破坏hd-zip转录因子与dna结合的取代、缺失和/或插入。例如,突变可以是转录因子的一个或多个氨基酸残基的取代、缺失和/或插入。所述至少一个非天然突变可包含对a、t、g或c的碱基取代,这导致氨基酸取代,从而破坏hd-zip转录因子与dna的结合。在一些实施方案中,编码hd-zip转录因子的内源基因中的至少一个非天然突变可包括缺失。这种缺失可以包括,例如,hd-zip转录因子的dna结合结构域的全部或部分的缺失(例如,seq id no:9(vwfqnrra)的至少1个、2个、3个、4个、5个、6个、7个或8个氨基酸残基的缺失)。在一些实施方案中,缺失可以是包括seq id no:9的连续氨基酸残基的部分(例如,至少2个、3个、4个、5个、6个、7个或8个连续氨基酸残基)的截短。在一些实施方案中,缺失可以是包括seq id no:9的至少一部分连续氨基酸残基(例如,至少2个、3个、4个、5个、6个、7个或8个连续氨基酸残基)的截短。因此,缺失的长度可以是hd-zip多肽的约1个氨基酸残基至约120个氨基酸残基,或长度(例如,至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89
个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个或更多个连续氨基酸残基)直至hd-zip多肽的全长,其中缺失包括seq id no:9的至少一部分连续氨基酸残基。在一些实施方案中,缺失产生截短的hd-zip转录因子,其包含seq id no:9的至少一部分连续氨基酸残基的缺失。在一些实施方案中,hd-zip转录因子多核苷酸中的缺失可导致产生截短的hd-zip转录因子的提前终止密码子,任选地在hd-zip转录因子的c末端处截短,其中seq id no:9的至少一部分连续氨基酸残基被删除。
[0176]
用于本发明的编码hd-zip转录因子突变的内源基因中的非天然突变可以是显性隐性突变。显性失活可以去除二聚化为有功能的转录因子的dna结合功能。转录因子仍可二聚化,但将失去与下游基因调控区结合的能力,因此将失去功能。因此,通过去除双功能蛋白的dna结合能力,二聚化的复合物将不会激活基因表达(参见,例如,图5)。
[0177]
在一些实施方案中,提供了包含编辑系统的植物细胞,所述编辑系统包含:(a)crispr相关效应蛋白;和(c)具有与编码野生型hd-zip转录因子的内源靶基因互补的间隔子序列的引导核酸(grna、gdna、crrna、crdna)。野生型hd-zip转录因子可以是任何参与避荫反应的hd-zip转录因子。在一些实施方案中,hd-zip转录因子可以是hd-zip ii型转录因子,任选地是hb53转录因子或hb78转录因子。在一些实施方案中,与引导核酸的间隔子序列共享互补性的hd-zip转录因子基因可以编码(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。在一些实施方案中,本发明的编辑系统的引导核酸的间隔子序列可包含seq id no:175-182中的任一个的核苷酸序列。在一些实施方案中,可用于本发明的编辑系统的核酸结合结构域可来自多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(talen)和/或argonaute蛋白。在一些实施方案中,如本文所述编辑的植物细胞可再生为植物,从而提供具有参与避荫反应的hd-zip转录因子的突变,并具有减弱的避荫反应的植物。
[0178]
在一些实施方案中,本发明提供了植物细胞,其包含对hd-zip转录因子基因的dna结合位点的至少一个非天然发生的突变(例如,1个、2个、3个、4个、5个或更多个突变),所述突变防止或降低编码的hd-zip转录因子与dna的结合,其中突变是使用编辑系统引入的取代、插入和/或缺失,所述编辑系统包含与hd-zip转录因子基因中的靶位点结合的核酸结合结构域,并且其中hd-zip转录因子基因编码:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列seq id no:1或
seq id no:2具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,
[0179]
在一些实施方案中,提供了植物或其部分,所述植物或其部分包含内源hd-zip转录因子的突变,所述突变减少了内源hd-zip转录因子的dna结合,其中内源hd-zip转录因子包含多肽,所述多肽包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列;其中所述突变是seq id no:1或seq id no:2的氨基酸序列的氨基酸残基45-52(vwfqnrra)(seq id no:9)的至少一个氨基酸残基的缺失、取代和/或插入。在一些实施方案中,seq id no:1或seq id no:2的氨基酸序列的氨基酸残基45-52的至少一个氨基酸残基的突变是在核酸酶切割后产生的,所述核酸酶包含与靶核酸内的靶位点结合的dna结合结构域,所述靶核酸编码与seq id no:1)(玉米hb53)或seq id no:2)(玉米hb78)的氨基酸序列具有至少80%序列同一性的序列。
[0180]
植物或其部分中内源hd-zip转录因子的突变可以是至少一个氨基酸的插入、取代和/或缺失。在一些实施方案中,突变可包括内源hd-zip转录因子内dna结合结构域的全部或部分的缺失(例如,seq id no:9(vwfqnrra)的至少1个、2个、3个、4个、5个、6个、7个或8个氨基酸残基的缺失)。
[0181]
在一些实施方案中,植物或其部分的非限制性实例包括玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑树莓或芸苔属某些种。在一些实施方案中,植物部分可以是来自植物的细胞,所述植物包括但不限于玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑树莓或芸苔属某些种。在一些实施方案中,植物可由本发明的细胞或植物部分再生。在hd-zip转录因子中包含至少一个突变的本发明植物包含减弱的避荫反应(sar)。
[0182]
在一些实施方案中,本发明提供了包含hd-zip转录因子基因的植物或其植物部分,所述hd-zip转录因子基因包含seq id no:202的核苷酸序列并且/或者编码seq id no:201的任一个的氨基酸序列。在一些实施方案中,本发明提供了包含hd-zip转录因子基因的玉米植物或其植物部分,所述hd-zip转录因子基因包含seq id no:202的核苷酸序列并且/或者编码seq id no:201中的任一个的氨基酸序列。
[0183]
本发明还提供了生产/培育无转基因的基因组编辑的(例如,碱基编辑的)植物的方法,其包括:(a)将本发明的植物与无转基因的植物杂交,从而将来自本发明植物的突变
或修饰引入无转基因的植物中;以及(b)选择包含突变或修饰但无转基因的后代植物,从而产生无转基因的基因组编辑的(例如,碱基编辑的)植物。
[0184]
在一些实施方案中,提供了当多株植物中的每株植物彼此紧邻种植时提供具有增加的产量的多株植物的方法,所述方法包括彼此紧邻种植两株或更多株本发明的植物,从而提供与彼此紧邻种植的多株对照植物(例如,不具有编辑的hd-zip转录因子基因和降低的sar的植物)相比具有增加的产量的多株植物。
[0185]“紧邻”是指任何特定植物物种的高种植密度,其可导致sar。例如,在一些实施方案中,“紧邻”包括以约6.1英寸或更小的间隔(例如,间隔约6.1英寸、6英寸、5.9英寸、5.8英寸、5.7英寸、5.6英寸、5.5英寸、5.4英寸、5.3英寸、5.2英寸、5.2英寸、5.1英寸、5英寸、4.9英寸、4.8英寸、4.7英寸、4.6英寸、4.5英寸、4.4英寸、4.3英寸、4.2英寸、4.1英寸、4 3.9英寸、3.8英寸、3.7英寸、3.6英寸、3.5英寸、3.4英寸、3.3英寸、3.2英寸、3.1英寸、3英寸、2.9英寸、2.8英寸、2.7英寸、2.6英寸、2.5英寸、2.4英寸、2.3英寸、2.2英寸、2.1英寸、2英寸、1.9英寸、1.8英寸、1.7英寸、1.6英寸、1.5英寸、1.4英寸、1.3英寸、1.2英寸、1.1英寸、1英寸、0.9英寸、0.8英寸、0.7英寸、0.6英寸、0.5英寸等或其中的任何范围或值)种植植物的种子而产生的植物的密度。在一些实施方案中,高密度种植包括在36英寸和38英寸行距下约35k粒种子/英亩;或者在30英寸或更大的行距下超过35k粒种子/英亩的任何密度。如本领域技术人员所理解的,为实现高密度种植,每英亩种植的种子数量将因植物物种而异。
[0186]
在一些实施方案中,提供了编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式切割植物细胞中内源hd-zip转录因子基因内的靶位点,所述内源hd-zip转录因子基因编码:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列seq id no:1或seq id no:2具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,从而在植物细胞的内源hd-zip转录因子基因中产生编辑。编辑植物的方法还可包括从在内源hd-zip转录因子基因中包含编辑的植物细胞再生植物,以产生在内源hd-zip转录因子基因中包含编辑的植物。在一些实施方案中,编辑导致内源hd-zip转录因子基因的非天然发生的突变,所述突变产生dna结合减少的hd-zip转录因子。
[0187]
当与不包含编辑的内源hd-zip转录因子基因的对照植物相比时,包含如本文所述编辑的内源hd-zip转录因子基因、以提供具有减少的dna结合的hd-zip转录因子的植物具有减弱的避荫反应。可将包含如本文所述编辑的内源hd-zip转录因子基因的植物与在相同环境条件下生长时未被如此编辑的植物进行比较,所述环境条件是例如具有低r∶fr光比率的环境,例如遮蔽条件(例如,为约0.16的r∶fr比率;或为约0.09至约0.7的r:fr比率范围(例如,约0.09、0.10、0.11、0.12、0.13、0.14、0.15、0.16、0.17.018、0.19、0.2、0.21、0.23、
0.24、0.25至约0.26、0.27、0.28、0.29、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7或其中的任何范围或值))。
[0188]
在一些实施方案中,提供了用于制造植物的方法,所述方法包括:(a)将包含编码hd-zip转录因子的野生型内源基因的植物细胞群与靶向该野生型内源基因的核酸酶接触,其中该核酸酶与dna结合结构域连接,所述结合结构域与编码以下序列的核酸序列结合:(i)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(ii)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(iii)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(iv)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(v)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(vi)多肽,其包含:(1)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(2)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(3)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(4)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(vii)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽;(b)从所述群体中选择包含编码hd-zip转录因子的野生型内源基因的突变的植物细胞,其中所述突变是(i)-(v)中任一项的多肽中至少一个氨基酸残基的取代和/或缺失,其中所述突变降低或消除了hd-zip转录因子结合dna的能力;以及(c)使选择的植物细胞生长成植物。
[0189]
在一些实施方案中,提供了用于降低植物中的避荫反应的方法,所述方法包括(a)将包含编码hd-zip转录因子的野生型内源基因的植物细胞与靶向野生型内源基因的核酸酶接触,其中所述核酸酶与结合野生型内源基因中的靶位点的dna结合结构域连接,所述野生型内源基因编码:(i)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(ii)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(iii)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(iv)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(v)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(vi)多肽,其包含:(1)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(2)具有px1x
2 x2ltx3cpx4cer(seq id no:8)所示氨基酸序列的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(3)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(4)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(vii)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,从而产生包含编码hd-zip转录因子的野生型内源基因的突变的植物细胞;以及(b)使植物细胞生长成植物,从而减少植物中的避荫反应。
[0190]
在一些实施方案中,提供了产生包含至少一个具有突变的内源hd-zip转录因子基因的细胞的植物或其部分的方法,所述方法包括将植物或植物部分中的内源hd-zip转录因子基因中的靶位点与包含切割结构域和dna结合结构域的核酸酶接触,其中dna结合结构域与内源hd-zip转录因子基因中的靶位点结合,其中所述内源hd-zip转录因子基因编码:(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列seq id no:1或seq id no:2具有至少80%序列同一性的序列的
多肽;(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,从而产生包含至少一个在内源hd-zip转录因子基因中具有突变的细胞的植物或其部分。在一些实施方案中,具有突变的内源hd-zip转录因子基因的植物或其部分中的至少一个细胞产生具有减少的dna结合的hd-zip转录因子。
[0191]
在一些实施方案中,产生包含具有减少的dna结合的突变的内源hd-zip转录因子的植物或其部分的方法,所述方法包括将植物或植物部分中的内源hd-zip转录因子基因中的靶位点与包含切割结构域和dna结合结构域的核酸酶接触,其中dna结合结构域与hd-zip转录因子基因中的靶位点结合,其中hd-zip转录因子基因编码:
[0192]
(a)包含与seq id no:38或seq id no:83的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与氨基酸序列seq id no:1或seq id no:2具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(d)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(e)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(f)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和(iv)具有氨基酸序列vwfqnrra(seq id no:9)的序列;和/或(g)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,从而产生具有减少dna结合的突变的内源hd-zip转录因子的植物或其部分。在一些实施方案中,内源hd-zip转录因子基因编码内源hd-zip转录因子,其包含seq id no:38或seq id no:83的氨基酸序列,其中seq id no:38或seq id no:83的氨基酸序列包含氨基酸序列vwfqnrra(seq id no:9),并且突变的内源hd-zip转录因子在氨基酸序列vwfqnrra(seq id no:9)中包含突变。在一些实施方案中,内源hd-zip转录因子基因编码内源hd-zip转录因子,其包含seq id no:10-98中的任一个的氨基酸序列,其中seq id no:10-98中的任一个的氨基酸序列包含氨基酸序列vwfqnrra(seq id no:9),并且突变的内源hd-zip转录因子在氨基酸序列vwfqnrra(seq id no:9)中包含突变。
[0193]
在一些实施方案中,与在内源hd-zip转录因子基因中不包含突变的对照植物(例如植物或植物部分未曾与编辑系统接触)相比,包含本文所述的突变的内源hd-zip转录因子的植物或其部分表现出减弱/降低的避荫反应。在一些实施方案中,当在相同的环境条件(例如,遮蔽环境,例如低r:fr比率环境)下生长时,可以在编辑植物与对照植物之间进行与对照植物的比较。包含导致植物中减弱的/降低的避荫反应的突变的内源hd-zip转录因子的植物表现出包括、但不限于以下表型的表型:与和一株或多株其它植物紧邻种植的不包
含导致减弱的/降低的避荫反应的突变的内源hd-zip转录因子的植物相比,当与一株或多株其它植物紧邻种植时,其具有增加的产量、降低的高度、降低的茎:根比率、缩短的叶长;增强的茎机械强度;降低的倒伏率;延缓的衰老;提高的光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。在一些实施方案中,具有降低的sar的植物比在相同环境条件(例如,遮蔽环境,例如,低r:fr比率环境)下生长的对照植物短至少约5%(例如,或约5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%或更短,或其中的任何范围或值)。
[0194]
在一些实施方案中,接触植物细胞、植物细胞群和/或靶位点的核酸酶切割内源hd-zip转录因子基因,并且突变被引入由内源hd-zip转录因子基因编码的内源hd-zip转录因子的dna结合位点。
[0195]
在一些实施方案中,内源hd-zip转录因子基因中的突变可以是非天然发生的突变。在一些实施方案中,非天然发生的突变可以是取代、插入和/或缺失。在一些实施方案中,作为取代、插入和/或缺失的非天然发生的突变可导致由内源hd-zip转录因子基因编码的内源hd-zip转录因子中一个或多个氨基酸的取代、插入和/或缺失。可用于本发明的核酸酶包括但不限于锌指核酸酶、转录激活因子样效应核酸酶(talen)、核酸内切酶(例如,fok1)或crispr-cas效应蛋白。
[0196]
在一些实施方案中,可用于本发明的hd-zip转录因子可以是hd-zip ii型(hd-zip ii)转录因子,其中hd-zip ii转录因子能够调节植物对光照的反应(例如,避荫反应(sar))。在一些实施方案中,hd-zip ii转录因子可包括但不限于athb2、hb53和/或hb78的直向同源物。在一些实施方案中,hd-zip ii转录因子可以是同源异型框蛋白53(hb53)或同源异型框蛋白78(hb78)。
[0197]
在一些实施方案中,本发明提供了与hd-zip转录因子基因中的靶位点结合的引导核酸(例如,grna、gdna、crrna、crdna),所述靶位点包含核苷酸序列,所述核苷酸序列编码:((a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。
[0198]
本发明的引导核酸的间隔序列可以与核苷酸序列的片段或部分互补,所述核苷酸
序列编码(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。
[0199]
在一些实施方案中,靶核酸是内源hd-zip转录因子基因,其能够调节植物对光照的反应。在一些实施方案中,靶核酸中的靶位点可以编码(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。
[0200]
在一些实施方案中,引导核酸包含具有seq id no:175-182中的任一个的核苷酸序列的间隔子。在一些实施方案中,hd-zip转录因子可以是hd-zip ii型(hd-zip ii)转录因子,任选地,其中hd-zip ii转录因子可以是hb53或hb78。
[0201]
在一些实施方案中,提供了包含本发明的引导核酸和与引导核酸缔合的crispr-cas效应蛋白的系统。在一些实施方案中,所述系统还可包含与引导核酸和crispr-cas效应蛋白相关联的tracr核酸,任选地其中tracr核酸和引导核酸共价连接。
[0202]
在一些实施方案中,提供了基因编辑系统,所述基因编辑系统包含与引导核酸缔合的crispr-cas效应蛋白,其中引导核酸包含与hd-zip转录因子基因结合的间隔子序列。在一些实施方案中,可用于基因编辑系统的hd-zip转录因子基因编码:(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。在一些实施方案中,hd-zip转录因子可以是hd-zip ii型(hd-zip ii)转录因子,任选地,其中hd-zip ii转录因子可以是hb53或hb78。
[0203]
在一些实施方案中,基因编辑系统的引导核酸可包含具有与编码以下多肽的核苷酸序列互补的核苷酸序列的间隔子序列:(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。在一些实施方案中,基因编辑系统的引导核酸可以包含具有seq id no:175-182中的任一个的核苷酸序列的间隔子序列。在一些实施方案中,基因编辑系统还可包含与引导核酸和crispr-cas效应蛋白相关联的tracr核酸,任选地,其中tracr核酸与引导核酸共价连接。
[0204]
本发明还提供了包含crispr-cas效应蛋白的复合物,所述crispr-cas效应蛋白包含切割结构域和引导核酸,其中所述引导核酸与hd-zip转录因子基因中的靶位点结合,所述hd-zip转录因子基因编码(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,其中切割结构域切割hd-zip转录因子基因中的靶链。
[0205]
本文还提供了表达盒,其包含(a)编码包含切割结构域的crispr-cas效应蛋白的多核苷酸和(b)与hd-zip转录因子基因中的靶位点结合的引导核酸,其中所述引导核酸包含与编码以下多肽的核苷酸序列互补并结合的间隔子序列:(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽。在一些实施方案中,hd-zip转录因子是hd-zip ii型(hd-zip ii)转录因子,任选地其中hd-zip ii转录因子是hb53或hb78。
[0206]
在一些实施方案中,提供了编码具有突变的dna结合位点的hd-zip转录因子(例如
hd-zip ii,例如hb53或hb78)的核酸,其中hd-zip转录因子的突变的dna结合位点包含破坏hd-zip转录因子的dna结合的突变。在一些实施方案中,突变可以消除hd-zip转录因子与dna的结合,或者可以将hd-zip转录因子与dna结合的能力降低至少75%(例如,至少约75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%%、100%)。本发明还提供了包含本发明的核酸的植物或其部分。在一些实施方案中,当植物是玉米植物时,玉米植物可以包含矮小/半矮化表型。在一些实施方案中,植物可以是小麦植物或其部分,任选地,其中核酸可以包含在a基因组、b基因组、d基因组或其任意组合中。在一些实施方案中,和与一种或多种其它植物紧邻种植、不包含编码具有突变的dna结合位点的hd-zip转录因子(例如,hd-zip ii,例如hb53或hb78)的核酸、从而不包含降低的避荫反应的对照植物相比,具有降低的sar的本发明的植物、玉米植物和/或小麦植物在与一种或多种其它植物紧邻种植时可以表现出增加的产量、降低的高度、降低的茎:根比率、缩短的叶长;增强的茎机械强度;降低的倒伏率;延缓的衰老;提高的光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。在一些实施方案中,当彼此紧密种植时,包含降低的sar的本发明植物比在相同条件下(例如,遮荫环境,例如,低r:fr比环境)生长的对照植物矮至少约5%。
[0207]
在一些实施方案中,本发明的方法还可包括从在内源同源结构域-亮氨酸拉链(hd-zip)转录因子中包含至少一个非天然突变的植物细胞或植物部分再生植物,其中所述突变破坏hd-zip转录因子与dna的结合。在一些实施方案中,和与一种或多种其它植物紧邻种植、在内源同源结构域-亮氨酸拉链(hd-zip)转录因子中不包含至少一个非天然突变、从而不包含降低的避荫反应的对照植物相比,,当它们与一种或多种其它植物紧邻种植时,在内源同源结构域-亮氨酸拉链(hd-zip)转录因子中包含至少一个非天然突变的植物可具有增加的产量、降低的高度、降低的茎:根比率、缩短的叶长;增强的茎机械强度;降低的倒伏率;延缓的衰老;提高的光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。在一些实施方案中,突变是非天然发生的突变。在一些实施方案中,突变是缺失。在一些实施方案中,缺失是显性隐性突变。
[0208]
可用于本发明的编辑系统可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑系统,所述系统可以以靶特异性方式引入突变。例如,编辑系统(例如,位点特异性或序列特异性编辑系统)可以包括但不限于crispr-cas编辑系统、大范围核酸酶编辑系统、锌指核酸酶(zfn)编辑系统、转录激活因子样效应核酸酶(talen)编辑系统、碱基编辑系统和/或引物编辑系统,其中的每一种都可以包含一种或多种多肽和/或一种或多种多核苷酸,当它们在细胞中作为系统表达时,可以以序列特异性方式修饰(突变)靶核酸。在一些实施方案中,编辑系统(例如,位点特异性或序列特异性编辑系统)可以包含一种或多种多核苷酸和/或一种或多种多肽,包括但不限于核酸结合结构域(dna结合结构域)、核酸酶和/或其他多肽和/或多核苷酸。
[0209]
在一些实施方案中,编辑系统可以包含一个或多个序列特异性核酸结合结构域(dna结合结构域),其可以来自例如多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(talen)和/或argonaute蛋白。在一些实施方案中,编辑系统可包含一个或多个切割结构域(例如,核酸酶),包括但不限于核酸内切酶(例如,fok1)、多核苷酸引导的核酸内切酶、crispr-cas核酸
内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(talen)。在一些实施方案中,编辑系统可包含一种或多种多肽,所述多肽包括但不限于脱氨酶(例如,胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、dna2多肽和/或5’flap核酸内切酶(fen)。在一些实施方案中,编辑系统可以包含一种或多种多核苷酸,包括但不限于crispr阵列(crispr引导)核酸、延伸的引导核酸和/或逆转录酶模板。
[0210]
在一些实施方案中,修饰或编辑hd-zip转录因子的方法可包括将靶核酸(例如,编码hd-zip转录因子的核酸)与与脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)融合的碱基编辑融合蛋白(例如,序列特异性dna结合蛋白(例如,crispr-cas效应蛋白或结构域))和引导核酸接触,其中引导核酸能够将碱基编辑融合蛋白引导/靶向靶核酸,从而编码靶核酸内的基因座。在一些实施方案中,碱基编辑融合蛋白和引导核酸可以包含在一种或多种表达盒中。在一些实施方案中,可将靶核酸与碱基编辑融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性dna结合融合蛋白和引导核酸可以以核糖核蛋白(rnp)的形式提供。在一些实施方案中,可将细胞与不止一种碱基编辑融合蛋白和/或一种或多种引导核酸接触,所述引导核酸可以靶向细胞中的一种或多种靶核酸。
[0211]
在一些实施方案中,修饰或编辑hd-zip转录因子的方法可包括将靶核酸(例如,编码hd-zip转录因子的核酸)与与肽标签融合的序列特异性dna结合融合蛋白(例如,序列特异性dna结合蛋白(例如,crispr-cas效应蛋白或结构域)、脱氨酶融合蛋白(其包含与能够与肽标签结合的亲和多肽融合的脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶))和引导核酸接触,其中引导核酸能够将序列特异性dna结合融合蛋白引导至/靶向靶核酸,序列特异性dna结合融合蛋白能够通过肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集到靶核酸,从而编辑靶核酸内的基因座。在一些实施方案中,可将序列特异性dna结合融合蛋白结合肽标签的亲和多肽融合,以及可将脱氨酶与肽标签融合,从而将脱氨酶募集到序列特异性dna结合融合蛋白和靶核酸。在一些实施方案中,序列特异性结合融合蛋白、脱氨酶融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,可将靶核酸与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性dna结合融合蛋白、脱氨酶融合蛋白和引导核酸可以以核糖核蛋白(rnp)的形式提供。
[0212]
在一些实施方案中,诸如引物编辑等方法可用于在内源hd-zip转录因子基因中产生突变。在引物编辑中,将rna依赖性dna聚合酶(逆转录酶,rt)和逆转录酶模板(rt模板)与序列特异性dna结合结构域组合使用,所述序列特异性dna结合结构域赋予以序列特异性方式识别并结合靶标的能力,并且也能够在靶标内引起含pam链的切口。dna结合结构域可以是crispr-cas效应蛋白,并且在该情况下,crispr阵列或引导rna可以是包含延伸部分的延伸的引导核酸,所述延伸部分包含引物结合位点(psb)和待整合到基因组(模板)中的编辑。类似于碱基编辑,引物编辑可以利用各种将用于编辑的蛋白质募集到靶位点的方法,此类方法包括在基因组编辑的选定过程中使用的蛋白质与核酸之间的非共价和共价相互作用。
[0213]
在一些实施方案中,hd-zip转录因子基因的突变可以是插入、缺失和/或点突变,其产生具有减少的dna结合的hd-zip转录因子(例如,突变的hd-zip转录因子)。在一些实施方案中,植物部分可以是细胞。在一些实施方案中,植物或其植物部分可以是本文所述的任何植物或其部分。在一些实施方案中,可用于本发明的植物可以是玉米、大豆、油菜、小麦、
水稻、棉花、甘蔗、糖用甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕。芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜或芸苔属某些种。在一些实施方案中,和与一种或多种其它植物紧邻种植的、在内源同源结构域-亮氨酸拉链(hd-zip)转录因子中不包含至少一个非天然突变、从而不包含降低的避荫反应的对照植物相比,包含具有dna结合的突变的内源hd-zip转录因子的植物与一种或多种其它植物紧邻种植时,可包含增加的产量、降低的高度、降低的茎根比、降低的叶长;增加茎的机械强度;倒伏率降低;延缓衰老;提高光合作用效率和籽粒灌浆;和/或增强的对病原体和食草动物的防御反应。在一些实施方案中,植物可以是玉米植物,任选地,其中玉米植物包含矮小/半矮化表型。
[0214]
在一些实施方案中,引入内源hd-zip转录因子并导致减少的dna结合的突变可以是非天然发生的突变。在一些实施方案中,引入内源hd-zip转录因子并导致减少的dna结合的突变可以是一个或多个氨基酸残基的取代、插入和/或缺失。在一些实施方案中,被引入内源hd-zip转录因子基因中导致减少的dna结合的突变可以是缺失,任选地是seq id no:9的全部或部分氨基酸序列(例如,seq id no:9的1个、2个、3个、4个、5个、6个、7个或8个氨基酸残基)的缺失。
[0215]
在一些实施方案中,hd-zip转录因子可以是hd-zip ii型(hd-zip ii)转录因子,任选地,其中hd-zip ii转录因子可以是同源异型框蛋白53(hb53)或同源异型框蛋白78(hb78)。
[0216]
在一些实施方案中,可用于本发明的编辑系统的序列特异性核酸结合结构域(dna结合结构域)可以来自例如多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(talen)和/或argonaute蛋白。
[0217]
在一些实施方案中,序列特异性dna结合结构域可以是crispr-cas效应蛋白,任选地,其中crispr-cas效应蛋白可以来自i型crispr-cas系统、ii型crispr-cas系统、iii型crispr-cas系统、iv型crispr-cas系统、v型crispr-cas系统或vi型crispr-cas系统。在一些实施方案中,本发明的crispr-cas效应蛋白可以来自ii型crispr-cas系统或v型crispr-cas系统。在一些实施方案中,crispr-cas效应蛋白可以是ii型crispr-cas效应蛋白,例如cas9效应蛋白。在一些实施方案中,crispr-cas效应蛋白可以是v型crispr-cas效应蛋白,例如cas12效应蛋白。
[0218]
在一些实施方案中,crispr-cas效应蛋白可包括但不限于cas9、c2c1、c2c3、cas12a(也称为cpf1)、cas12b、cas12c、cas12d、cas12e、cas13a、cas13b、cas13c、cas13d、casl、caslb、cas2、cas3、cas3'、cas3"、cas4、cas5、cas6、cas7、cas8、cas9(也称为csnl和csx12)、cas10、csyl、csy2、csy3、csel、cse2、cscl、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、csbl、csb2、csb3、csxl7、csxl4、csx10、csx16、csax、csx3、csxl、csxl5、csfl、csf2、csf3、csf4(ding)和/或csf5核酸酶,任选地其中crispr-cas效应蛋白可以是cas9、cas12a(cpf1)、cas12b、cas12c(c2c3)、cas12d(casy)、cas12e(casx)、cas12g、cas12h、cas12i、c2c4、c2c5、c2c8、c2c9、c2c10、cas14a、cas14b和/或cas14c效应蛋白。
[0219]
在一些实施方案中,用于本发明的crispr-cas效应蛋白可在其核酸酶活性位点
(例如,ruvc、hnh,例如,cas12a核酸酶结构域的ruvc位点,例如,cas9核酸酶结构域的ruvc位点和/或hnh位点)包含突变。在其核酸酶活性位点具有突变,因此不再包含核酸酶活性的crispr-cas效应蛋白,通常被称为“无活力的(dead)”,例如dcas。在一些实施方案中,在其核酸酶活性位点中具有突变的crispr-cas效应蛋白结构域或多肽,与无突变的相同crispr-cas效应蛋白(例如,切口酶,例如cas9切口酶、cas12a切口酶)相比,可具有受损的活性或降低的活性。
[0220]
可用于本发明的crispr cas9效应蛋白或crispr cas9效应结构域可以是任何已知的或以后鉴定的cas9核酸酶。在一些实施方案中,crispr cas9多肽可以是来自例如链球菌属某些种(streptococcus spp.)(例如,化脓性链球菌(s.pyogenes)、嗜热链球菌(s.thermophilus))、乳杆菌属某些种(lactobacillus spp.)、双歧杆菌属某些种(bifidobacterium spp.)、坎德勒氏菌某些种(kandleria spp.)、明串珠菌属某些种(leuconostoc spp.)、酒球菌属某些种(oenococcus spp.)、片球菌属某些种(pediococcus spp.)、魏斯氏菌属某些种(weissella spp.)和/或欧陆森氏菌属某些种(olsenella spp.)的cas9多肽。
[0221]
在一些实施方案中,crispr-cas效应蛋白可以是源自化脓性链球菌的cas9多肽,并识别pam序列基序ngg、nag、nga(mali等人,science 2013;339(6121):823-826)。在一些实施方案中,crispr-cas效应蛋白可以是来源于嗜热链球菌的cas9多肽,并且识别pam序列基序nggng和/或nnagaaw(w=a或t)(参见,例如,horvath等人,science,2010;327(5962):167-170,以及deveau等人,j bacteriol 2008;190(4):1390-1400)。在一些实施方案中,crispr-cas效应蛋白可以是源自变形链球菌(streptococcus mutans)的cas9多肽,并识别pam序列基序ngg和/或naar(r=a或g)(参见,例如,deveau等人,j bacteriol 2008;190(4):1390-1400)。在一些实施方案中,crispr-cas效应蛋白可以是源自金黄色葡萄球菌(streptococcus aureus)的cas9多肽,并识别pam序列基序nngrr(r=a或g)。在一些实施方案中,crispr-cas效应蛋白可以是源自金黄色葡萄球菌(s.aureus)的cas9蛋白,其识别pam序列基序ngrrt(r=a或g)。在一些实施方案中,crispr-cas效应蛋白可以是源自金黄色葡萄球菌的cas9多肽,其识别pam序列基序n grrv(r=a或g)。在一些实施方案中,crispr-cas效应蛋白可以是cas9多肽,其源自脑膜炎奈瑟氏球菌(neisseria meningitidis)并识别pam序列基序n gatt或n gctt(r=a或g,v=a、g或c)(参见,例如,hou等人,2013,1-6)。在上述实施方案中,n可以是任何核苷酸残基,例如a、g、c或t中的任一个。在一些实施方案中,crispr-cas效应蛋白可以是源自沙氏纤毛菌(leptotrichia shahii)的cas13a蛋白,其识别单个3’a、u或c的原间隔区侧翼序列(pfs)(或rna pam(rpam))序列基序,所述序列基序可以位于靶核酸内。
[0222]
在一些实施方案中,crispr-cas效应蛋白可源自cas12a,其是v型成簇的规律间隔的短回文重复序列(crispr)-cas核酸酶。cas12a在几个方面不同于更广为人知的ii型crispr cas9核酸酶。例如,cas9识别位于其引导rna(grna、sgrna、crrna、crdna、crispr阵列)结合位点(原间隔区、靶核酸、靶dna)3’的富含g的原间隔区邻近基序(pam)(3
’‑
ngg),而cas12a识别位于靶核酸5’的富含t的pam(5
’‑
ttn、5
’‑
tttn)。事实上,cas9和cas12a结合其引导rna的方向与它们的n和c末端几乎相反。此外,cas12a酶使用单引导rna(grna,crispr阵列,crrna),而不是天然cas9系统中发现的双引导rna(sgrna(例如,crrna和tracrrna)),
并且cas12a加工其自身的grna。另外,cas12a核酸酶活性产生交错的dna双链断裂,而不是由cas9核酸酶活性产生的平端,并且cas12a依赖于单个ruvc结构域来切割两条dna链,而cas9利用hnh结构域和ruvc结构域来切割。
[0223]
可用于本发明的crispr cas12a效应蛋白/结构域可以是任何已知或后来鉴定的cas12a多肽(以前称为cpf1)(参见,例如,美国专利第9,790,490号,其就其cpf1(cas12a)序列的公开内容通过引用并入本文)。术语“cas12a”、“cas12a多肽”或“cas12a结构域”是指包含cas12a多肽或其片段的rna引导的核酸酶,其包含cas12a的引导核酸结合结构域和/或cas12a的活性、无活性或部分活性的dna切割结构域。在一些实施方案中,可用于本发明的cas12a可在核酸酶活性部位(例如,cas12a结构域的ruvc位点)中包含突变。在其核酸酶活性部位具有突变并因此不再包含核酸酶活性的cas12a结构域或cas12a多肽通常被称为deadcas12a(例如,dcas12a)。在一些实施方案中,在其核酸酶活性部位中具有突变的cas12a结构域或cas12a多肽可能具有受损的活性,例如,可能具有切口酶活性。
[0224]
任何用于碱基编辑的脱氨酶结构域/多肽都可以用于本发明。在一些实施方案中,脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见,例如,美国专利第0,167,457号和thuronyi等人nat.biotechnol.37:1070

1079(2019),其中每一篇都就其胞嘧啶脱氨酶的公开内容通过引用并入本文)。胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此,在一些实施方案中,可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域,催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶(包括但不限于灵长类动物(例如,人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠)的变体。因此,在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶具有约70%至约100%同一性(例如,与天然存在的胞嘧啶脱氨酶具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,以及其中的任何范围或值)。
[0225]
在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白b mrna编辑复合物(apobec)家族脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是apobec1脱氨酶、apobec2脱氨酶、apobec3a脱氨酶、apobec3b脱氨酶、apobec3c脱氨酶、apobec3d脱氨酶、apobec3f脱氨酶、apobec3g脱氨酶、apobec3h脱氨酶、apobec4脱氨酶、人活化诱导脱氨酶(haid)、rapobec1、ferny和/或cda1,任选地是pmcda1、atcda1(例如,at2g 19570)及其进化形式。在一些实施方案中,胞嘧啶脱氨酶可以是具有seq id no:188的氨基酸序列的apobec1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是具有seq id no:189的氨基酸序列的apobec3a脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是cda1脱氨酶,任选地是具有seq id no:190的氨基酸序列的cda1。在一些实施方案中,胞嘧啶脱氨酶可以是ferny脱氨酶,任选地是具有seq id no:191的氨基酸序列的ferny。在一些实施方案中,胞嘧啶脱氨酶可以是进化的脱氨酶,例如,seq id no:192、seq id no:193或seq id no:194。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如,进化的脱氨酶)的氨基酸序列具有约70%至约100%同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%同一性)。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可与seq id no:188、seq id no:189、seq id no:190、seq id no:191、seq id no:192、seq id no:193或seq id no:194的氨基酸序列具有约70%至约99.5%同一性(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%同一性)(例如,与seq id no:188、seq id no:189、seq id no:190、seq id no:191、seq id no:192、seq id no:193或seq id no:194的氨基酸序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性)。在一些实施方案中,可以为了在植物中表达而对编码胞嘧啶脱氨酶的多核苷酸进行密码子优化,并且经密码子优化的多肽可与参考多核苷酸具有约70%至99.5%同一性。
[0226]
在一些实施方案中,本发明的核酸构建体还可编码尿嘧啶糖基化酶抑制剂(ugi)(例如,尿嘧啶-dna糖基化酶抑制剂)多肽/结构域。因此,在一些实施方案中,编码crispr-cas效应蛋白和胞嘧啶脱氨酶结构域(例如,编码包含与胞嘧啶脱氨酶结构域融合的crispr-cas效应蛋白结构域,和/或与肽标签或能够结合肽标签的亲和多肽融合的crispr-cas效应蛋白结构域,和/或与肽标签或能够结合肽标签的亲和多肽融合的脱氨酶蛋白结构域的融合蛋白)的核酸构建体还可编码尿嘧啶-dna糖基化酶抑制剂(ugi),任选地其中可以为了在植物中表达而对ugi进行密码子优化。在一些实施方案中,本发明提供了包含crispr-cas效应多肽、脱氨酶结构域和ugi和/或编码其的一种或多种多核苷酸的融合蛋白,任选地,其中可以为了在植物中表达而对所述一种或多种多核苷酸进行密码子优化。在一些实施方案中,本发明提供了融合蛋白,其中可将crispr-cas效应多肽、脱氨酶结构域和ugi与本文所述的肽标签和亲和多肽的任意组合融合,从而将脱氨酶结构域和ugi募集到crispr-cas效应多肽和靶核酸。在一些实施方案中,可将引导核酸与募集rna基序连接,并且可将一个或多个脱氨酶结构域和/或ugi与能够与募集rna基序相互作用的亲和多肽融合,从而将脱氨酶结构域和ugi募集到靶核酸上。
[0227]
可用于本发明的“尿嘧啶糖基化酶抑制剂”可以是能够抑制尿嘧啶-dna糖基化酶碱基-切除修复酶的任何蛋白质。在一些实施方案中,ugi结构域包含野生型ugi或其片段。在一些实施方案中,可用于本发明的ugi结构域可以与天然存在的ugi结构域的氨基酸序列具有约70%至约100%同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%同一性,以及其中的任何范围或值)。在一些实施方案中,ugi结构域可包含seq id no:195的氨基酸序列或与seq id no:195的氨基酸序列具有约70%至约99.5%序列同一性(例如,与seq id no:195的氨基酸序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性)的多肽。例如,在一些实施方案中,ugi结构域可包含seq id no:195的氨基酸序列的片段,所述片段与seq id no:195的的氨基酸序列的一部分连续核苷酸(例如,10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个连续核苷酸;例如,约10个、15个、20个、25个、30个、35个、40个、45个至约50个、55个、60个、65个、70个、75个、80个连续核苷酸)具有100%同一性。在一些实施方案中,ugi结构域可
以是已知ugi(例如,seq id no:195)的变体,其与已知ugi具有约70%至约99.5%序列同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%序列同一性,以及其中的任何范围或值)。在一些实施方案中,可以为了在植物(例如,植物)中表达而对编码ugi的多核苷酸进行密码子优化,并且经密码子优化的多肽可与参考多核苷酸具有约70%至约99.5%同一性。
[0228]
可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是来自任何生物体的任何已知的或后来鉴定的腺嘌呤脱氨酶(参见,例如,美国专利第10,113,163号,其就其腺嘌呤脱氨酶的公开内容通过引用并入本文)。腺嘌呤脱氨酶可以催化腺嘌呤或腺苷的水解脱氨。在一些实施方案中,腺嘌呤脱氨酶可以分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷。在一些实施方案中,腺苷脱氨酶可以催化dna中腺嘌呤或腺苷的水解脱氨。在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶可在靶核酸的有意义(例如,“ ”;模板)链中产生a

g转换或在靶核酸的反义(如
“‑”
,互补)链中产生t

c转换。
[0229]
在一些实施方案中,腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此,在一些实施方案中,腺苷脱氨酶可以与野生型腺嘌呤脱氨酶具有约70%至100%同一性(例如,与天然存在的腺嘌吟诵脱氨酶具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,以及其中的任何范围或值)。在一些实施方案中,一种或多种脱氨酶不是天然存在的,并且可以被称为工程化的、突变的或进化的腺苷脱氨酶。因此,例如,工程化的、突变的或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域具有约70%至99.9%同一性(例如,与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%同一性,以及其中的任何范围或值)。在一些实施方案中,腺苷脱氨酶可以来自细菌(例如,大肠杆菌、金黄色葡萄球菌、流感嗜血杆菌(haemophilus influenzae)、新月柄杆菌(caulobacter crescentus)等)。在一些实施方案中,可以为了在植物中表达而对编码腺嘌呤脱氨酶多肽/结构域的多核苷酸进行密码子优化。
[0230]
在一些实施方案中,腺嘌呤脱氨酶结构域可以是野生型trna特异性腺苷脱氨酶结构域,例如trna特异性腺苷脱氨酶(tada)和/或突变/进化的腺苷脱氨酶结构域,例如突变/进化的trna特异性腺苷脱氨酶结构域(tada*)。在一些实施方案中,tada结构域可来自大肠杆菌。在一些实施方案中,tada可以被修饰,例如被截短,可以相对于全长tada缺失一个或多个n-末端和/或c-末端氨基酸(例如,可以相对于全长tada缺失1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、6个、17个、18个、19个或20个n-末端和/或c-末端氨基酸残基)。在一些实施方案中,tada多肽或tada结构域不包含n-末端甲硫氨酸。在一些实施方案中,野生型大肠杆菌tada包含seq id no:183的氨基酸序列。在一些实施方案中,突变/进化的大肠杆菌tada*包含seq id no:184-187(例如,seq id no:184、185、186或187)的氨基酸序列。在一些实施方案中,可为在植物中表达而对编码tada/tada*
的多核苷酸而进行密码子优化。
[0231]
胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体),引起基因组中的互补链中c至t的转换或g至a的转换。因此,在一些实施方案中,由本发明的多核苷酸编码的胞嘧啶脱氨酶在靶核酸的有意义(例如,“ ”;模板)链中产生c

t的转换或在靶核酸的反义(如
“‑”
,互补)链中产生g

a的转换。
[0232]
在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶在靶核酸的有意义(例如,“ ”;模板)链中产生a

g的转换或在靶核酸的反义(如
“‑”
,互补)链中产生t

c的转换。
[0233]
编码包含序列特异性dna结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的本发明核酸构建体,以及编码所述碱基编辑器的核酸构建体/表达盒/载体,可以与引导核酸组合使用,用于修饰靶核酸,包括但不限于在靶核酸中产生c

t或g

a突变,所述靶核酸包括但不限于质粒序列;在编码序列中产生c

t或g

a突变以改变氨基酸同一性;在编码序列中产生c

t或g

a突变以产生终止密码子;在编码序列中产生c

t或g

a突变以破坏起始密码子;在基因组dna中产生点突变以破坏转录因子结合;和/或在基因组dna中产生点突变以破坏剪接点。
[0234]
编码包含序列特异性dna结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的本发明的核酸构建体,以及编码所述碱基编辑器的表达盒和/或载体可以与引导核酸组合使用,用于修饰靶核酸,包括但不限于在靶核酸中产生a

g或t

c突变,所述靶核酸包括但不限于质粒序列;在编码序列中产生a

g或t

c突变以改变氨基酸同一性;在编码序列中产生a

g或t

c突变以产生终止密码子;在编码序列中产生a

g或t

c突变以破坏起始密码子;在基因组dna中产生点突变以破坏转录因子结合;和/或在基因组dna中产生点突变以破坏剪接点。
[0235]
包含crispr-cas效应蛋白或其融合蛋白的本发明核酸构建体可与引导rna(grna、crispr阵列、crispr rna、crrna)组合使用,以修饰靶核酸,所述引导rna被设计成与编码的crispr-cas效应蛋白或结构域一起发挥作用。可用于本发明的引导核酸包含至少一个间隔区序列和至少一个重复序列。引导核酸能够与由本发明的核酸构建体编码和表达的crispr-cas核酸酶结构域形成复合物,并且间隔区序列能够与靶核酸杂交,从而将复合物(例如,crispr-cas效应子融合蛋白(例如,募集脱氨酶结构域和任选的ugi的与脱氨酶结构域融合的crispr-cas效应子结构域和/或与肽标签或亲和多肽融合的crispr-cas效应子结构域)引导至靶核酸,其中靶核酸可以被脱氨酶结构域修饰(例如,切割或编辑)或调节(例如,调节转录)。
[0236]
例如,编码与胞嘧啶脱氨酶结构域连接的cas9结构域(例如,融合蛋白)的核酸构建体可与cas9引导核酸组合使用,以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑靶核酸。在另一个实例中,编码与腺嘌呤脱氨酶结构域连接的cas9结构域(例如,融合蛋白)的核酸构建体可与cas9引导核酸组合使用,以修饰靶核酸,其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨基,从而编辑靶核酸。
[0237]
同样,编码与胞嘧啶脱氨酶结构域或腺嘌脱氨酶结构域连接的cas12a结构域(或其他选定的crispr-cas核酸酶,例如c2c1、c2c3、cas12b、cas12c、cas12d、cas12e、cas13a、
cas13b、cas13c、cas13d、casl、caslb、cas2、cas3、cas3’、cas3"、cas4、cas5、cas6、cas7、cas8、cas9(也称为csnl和csx12)、cas10、csyl、csy2、csy3、csel、cse2、cscl、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、csbl、csb2、csb3、csxl7、csxl4、csx10、csx16、csax、csx3、csxl、csxl5、csfl、csf2、csf3、csf4(ding)和/或csf5)(例如,融合蛋白)的核酸构建体,可与cas12a引导核酸(或其它选定的crispr-cas核酸酶的引导核酸)组合使用,以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑靶核酸。
[0238]
如本文中所用,“引导核酸”、“引导rna”、“grna”、“crispr rna/dna”、“crrna”或“crdna”意指包含至少一个与靶dna互补(并与之杂交)的间隔区序列(例如,原间隔区)和至少一个重复序列(例如,v型cas12a crispr-cas系统的重复序列,或其片段或部分;ii型cas9 crispr-cas系统的重复序列,或其片段;v型c2c1 crispr cas系统的重复序列或其片段;例如c2c3、cas12a(也称为cpf1)、cas12b、cas12c、cas12d、cas12e、cas13a、cas13b、cas13c、cas13d、casl、caslb、cas2、cas3、cas3’、cas3"、cas4、cas5、cas6、cas7、cas8、cas9(也称为csnl和csx12)、cas10、csyl、csy2、csy3、csel、cse2、cscl、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、csbl、csb2、csb3、csxl7、csxl4、csx10、csx16、csax、csx3、csxl、csxl5、csfl、csf2、csf3、csf4(ding)和/或csf5的crispr-cas系统的重复序列或其片段)的核酸,其中重复序列可与间隔区序列的5’末端和/或3’末端连接。本发明的grna的设计可以基于i型、ii型、iii型、iv型、v型或vi型crispr-cas系统。
[0239]
在一些实施方案中,cas12a grna可以从5’至3’包含重复序列(全长或其部分(“柄(handle)”);例如,假结样结构)和间隔区序列。
[0240]
在一些实施方案中,引导核酸可包含不一个重复序列-间隔区序列(例如,2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个重复序列-间隔区序列)(例如,重复序列-间隔区序列-重复序列,例如,重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列,等等)。本发明的引导核酸是合成的、人造的且不是在自然界中发现的。grna可以相当长,可以用作适体(如在ms2募集策略中那样)或其他从间隔区垂悬的rna结构。
[0241]
如本文中所用,“重复序列”是指,例如,野生型crispr cas基因座(例如,cas9基因座、cas12a基因座、c2c1基因座等)的任何重复序列或与本发明核酸构建体编码的crispr-cas效应蛋白一起发挥功能的合成crrna的重复序列。可用于本发明的重复序列可以是crispr-cas基因座(例如,i型、ii型、iii型、iv型、v型或vi型)的任何已知或后来鉴定的重复序列,或者其可以是被设计成在i型、ii型、iii型、iv型、v型或vi型crispr-cas系统中起作用的合成重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中,重复序列可以在其5’末端形成假结样结构(即,“柄”)。因此,在一些实施方案中,重复序列可以与来自野生型i型crispr-cas基因座、ii型crispr-cas基因座、iii型crispr-cas基因座、iv型crispr-cas基因座、v型crispr-cas基因座和/或vi型crispr-cas基因座的重复序列相同或大体上相同。来自野生型crispr-cas基因座的重复序列可以通过已建立的算法,诸如使用通过crisprdb提供的crisprfinder(参见,grissa等人nucleic acids res.35(web server issue):w52-7)来确定。在一些实施方案中,重复序列或其部分在其3’末端与间隔区序列的5’末端连接,从而形成重复序列-间隔区序列(例如,引导核酸、指导rna/dna、
crrna、crdna)。
[0242]
在一些实施方案中,重复序列包含至少10个核苷酸,或基本上由至少10个核苷酸组成,或由至少10个核苷酸组成,这取决于特定的重复序列和包含该重复序列的引导核酸被加工还是未被加工(例如,约10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个至100个或更多个核苷酸,或其中的任何范围或值)。
[0243]
在一些实施方案中,重复序列包含约10至约20个、约10至约30个、约10至约45个、约10至约50个、约15至约30个、约15至约40个、约15至约45个、约15至约50个、约20至约30个、约20至约40个、约20至约50个、约30至约40个、约40至约80个、约50至约100个或更多个核苷酸,基本由所述核苷酸组成,或由所述核苷酸组成。
[0244]
与间隔区序列的5’末端连接的重复序列可以包含重复序列的一部分(例如,野生型重复序列的5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个或更多个连续核苷酸)。在一些实施方案中,与间隔区序列的5’末端连接的重复序列的一部分在长度上可以是野生型crispr cas重复核苷酸序列的约5至约10个连续核苷酸(例如,约5个、6个、7个、8个、9个、10个核苷酸),并且与野生型crispr cas重复核苷酸序列的相同区域(例如,5’末端)具有至少90%序列同一性(例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)。在一些实施方案中,重复序列的一部分可在其5’末端包含假结样结构(例如,“柄”)。
[0245]
如本文中所用,“间隔区序列”是与靶核酸(例如靶dna)(例如,原间隔区)(例如,seq id no:1-9中的任一个的连续核苷酸;例如,seq id no:175-182)互补的核苷酸序列。间隔区序列可以与靶核酸完全互补或大体上互补(例如,至少约70%(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)互补)。因此,在一些实施方案中,与靶核酸相比,间隔区序列可具有一个、两个、三个、四个或五个错配,所述错配可以是连续的或不连续的。在一些实施方案中,间隔区序列可以与靶核酸具有70%的互补性。在其他实施方案中,间隔区核苷酸序列可以与靶核酸具有80%的互补性。在其他实施方案中,间隔区核苷酸序列可与靶核酸(原间隔区)具有85%、90%、95%、96%、97%、98%、99%或99.5%的互补性等。在一些实施方案中,间隔区序列与靶核酸100%互补。间隔区序列可具有约15个核苷酸至约30个核苷酸(例如,15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸,或其中的任何范围或值)的长度。因此,在一些实施方案中,间隔区序列可以在靶核酸(例如原间隔区)的长度为至少约15个核苷酸至约30个核苷酸的区域上具有完全互补性或大体互补性。在一些实施方案中,间隔区长度约为20个核苷酸。在一些实施方案中,间隔区长度为约21个、22个或23个核苷酸。
[0246]
在一些实施方案中,引导核酸的间隔区序列的5’区域可以与靶dna相同,而间隔区的3’区域可以与靶dna(例如,v型crispr-cas)大体上互补,或者引导核酸的间隔区序列的3’区域可与靶dna相同,而间隔区的5’区域可以与靶dna(例如,ii型crispr-cas)大体上互
补,因此,间隔区序列与靶dna的总体互补性可以小于100%。因此,例如,在v型crispr-cas系统的引导核酸中,例如20个核苷酸的间隔区序列的5’区域(即,种子区域)中的前1个、2个、3个、4个、5个、6个、7个、8个、9个、10个核苷酸可以与靶dna 100%互补,而间隔区序列的3’区中的其余核苷酸与靶dna大体上互补(例如,至少约70%互补)。在一些实施方案中,间隔区序列5’末端的前1至8个核苷酸(例如,前1个、2个、3个、4个、5个、6个、7个、8个核苷酸以及其中的任何范围)可以与靶dna 100%互补,而间隔区序列3’区域的其余核苷酸与靶dna大体上互补(例如,至少约50%(例如,50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)互补)。
[0247]
作为另外的实例,在ii型crispr-cas系统的引导核酸中,例如20个核苷酸的间隔区序列的3’区域(即,种子区)中的前1个、2个、3个、4个、5个、6个、7个、8个、9个、10个核苷酸可以与靶dna100%互补,而间隔区序列的5’区域中的其余核苷酸与靶dna大体上互补(例如,至少约70%互补)。在一些实施方案中,间隔区序列3’端的前1至10个核苷酸(例如,前1个、2个、3个、4个、5个、6个、7个、8个、9个、10个核苷酸以及其中的任何范围)可以与靶dna 100%互补,而间隔区序列5’区中的其余核苷酸与靶dna大体上互补(例如,至少约50%(例如,至少约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或其中的任何范围或值)互补)。
[0248]
在一些实施方案中,间隔区的种子区长度可为约8至约10个核苷酸,长度可为约5至约6个核苷酸,或长度可为约6个核苷酸。
[0249]
如本文中所用,“靶核酸”、“靶dna”、“靶核苷酸序列”、“靶区域”或“基因组中的靶区域”是指与本发明的引导核酸中的间隔区序列完全互补(100%互补)或大体上互补(例如,至少70%(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)互补)。对crispr-cas系统有用的靶区域可以紧邻生物体基因组(例如,植物基因组)中pam序列的3’(例如,v型crispr-cas系统)或5’(例如,ii型crispr-cas系统)。靶区域可以选自紧邻pam序列定位的至少15个连续核苷酸(例如,16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个核苷酸等)的任何区域。
[0250]“原间隔区序列”是指靶双链dna,具体是指与crispr重复-间隔区序列(例如,引导核酸、crispr阵列、crrna)的间隔区序列完全互补或大体上互补(并杂交)的靶dna的部分(例如,或基因组中的靶区域)。
[0251]
在v型crispr-cas(例如,cas12a)系统和ii型crispr-cas(cas9)系统的情况下,原间隔区序列的两侧是(例如,紧邻)原间隔区邻近基序(pam)。对于iv型crispr-cas系统,pam位于非靶链的5’末端和靶链的3’末端(例如,参见下文)。
[0252][0253]3’
aaannnnnnnnnnnnnnnnnnn-5’靶链(seq id no:199)
[0254]
ꢀꢀꢀ
||||
[0255]5’
tttnnnnnnnnnnnnnnnnnnn-3’非靶链(seq id no:199)
[0256]
在ii型crispr-cas(例如,cas9)系统的情况下,pam紧邻靶区域的3’。i型crispr-cas系统的pam位于靶链的5’。没有已知的用于iii型crispr-cas系统的pam。makarova等人描述了crispr系统的所有类别、类型和亚型的命名法(nature reviews microbiology 13:722-736(2015))。引导核酸结构和pam由r.barrangou(genome biol.16:247(2015))描述。
[0257]
规范的cas12a pam富含t。在一些实施方案中,规范的cas12a pam序列可以是5
’‑
ttn、5
’‑
tttn或5’tttv。在一些实施方案中,典型的cas9(例如,化脓性链球菌)pam可以是5
’‑
ngg-3’。在一些实施方案中,可以使用非规范的pam,但是可能效率较低。
[0258]
本领域技术人员可以通过已建立的实验和计算方法确定其他pam序列。因此,例如,实验方法包括靶向两侧为所有可能的核苷酸序列的序列,并鉴定不经历靶向的序列成员,诸如通过靶质粒dna的转化(esvelt等人2013.nat.methods 10:1116-1121;jiang等人2013.nat.biotechnol.31:233-239)。在一些方面,计算方法可包括对天然间隔区进行blast搜索以鉴定噬菌体或质粒中的原始靶dna序列,并比对这些序列以确定邻近靶序列的保守序列(briner和barrangou 2014.appl. environ.microbiol.80:994-1001;mojica等人2009.microbiology 155:733-740)。
[0259]
在一些实施方案中,本发明提供了包含本发明核酸构建体的表达盒和/或载体(例如,本发明编辑系统的一个或多个组分)。在一些实施方案中,可以提供包含本发明的核酸构建体和/或一种或多种引导核酸的表达盒和/或载体。在一些实施方案中,编码碱基编辑器的本发明的核酸构建体(例如,包含crispr-cas效应蛋白和脱氨酶结构域的构建体(例如,融合蛋白))或用于碱基编辑的组分(例如,与肽标签或亲和多肽融合的crispr-cas效应蛋白,与肽标签或亲和多肽融合的脱氨酶结构域,和/或与肽标签或亲和多肽融合的ugi),可以包含在与包含同一表达盒或载体上或者包含在与包含所述一种或多种引导核酸的表达盒或载体分开的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含引导核酸的一个或多个表达盒或一个或多个载体分开的一个或多个表达盒或一个或多个载体上时,可以例如在提供(例如,与靶核酸接触)包含引导核酸的表达盒之前、与之同时或之后,将靶核酸以彼此之间的任何顺序与编码碱基编辑器或用于碱基编辑的组分的一个或多个表达盒或一个或多个载体和引导核酸接触(例如,与其一起提供)。
[0260]
如本领域已知的,本发明的融合蛋白可包含序列特异性dna结合结构域、crispr-cas多肽和/或与肽标签或与肽标签相互作用的亲和多肽融合的脱氨酶结构域,用于将脱氨酶募集到靶核酸。募集方法还可包括与rna募集基序和脱氨酶(其与能够与rna募集基序相互作用的亲和多肽融合)连接的引导核酸,从而将脱氨酶募集到靶核酸上。或者,化学相互作用可用于将多肽(例如,脱氨酶)募集到靶核酸上。
[0261]
可用于本发明的肽标签(例如,表位)可包括但不限于gcn4肽标签(例如,sun标签)、c-myc亲和标签、ha亲和标签、his亲和标签、s亲和标签、甲硫氨酸-his亲和标签、rgd-his亲和标签、flag八肽、strep标签或strep标签ii、v5标签和/或vsv-g表位。可以与多肽连接的以及对于其存在可以与另一种多肽连接的相应的亲和多肽的任何表位,都可以在本发明中用作肽标签。在一些实施方案中,肽标签可包含1个或2个或更多个拷贝的肽标签(例如,重复单元、多聚化表位(例如,串联重复))(例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24
个、25个或更多个重复单元)。在一些实施方案中,与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中,抗体可以是scfv抗体。在一些实施方案中,与肽标签结合的亲和多肽可以是合成的(例如,为亲和相互作用而进化的),包括但不限于亲和体、anticalin、单体(monobody)和/或darpin(参见,例如,sha等人,protein sci.26(5):910-924(2017));gilbreth(curr opin struc biol 22(4):413-420(2013)),美国专利第9,982,053号,所述专利中的每一篇均就与亲和体、抗anticalin、单体和/或darpin相关的教导通过引用以其整体并入。
[0262]
在一些实施方案中,引导核酸可与rna募集基序连接,待募集的多肽(例如,脱氨酶)可与与rna募集基序结合的亲和多肽融合,其中引导核酸与靶核酸结合,rna募集基序与亲和多肽结合,从而将多肽募集到引导核酸,并使靶核酸与多肽(例如,脱氨酶)接触。在一些实施方案中,两种或更多种多肽可被募集到引导核酸,从而使靶核酸与两种或更多种多肽(例如,脱氨酶)接触。
[0263]
在一些实施方案中,与亲和多肽融合的多肽可以是逆转录酶,引导核酸可以是与rna募集基序连接的延伸的引导核酸。在一些实施方案中,rna募集基序可以位于延伸的引导核酸的延伸部分的3’末端(例如,5
’‑3’
,重复序列-间隔区-延伸的部分(rt模板-引物结合位点)-rna募集基序)。在一些实施方案中,rna募集基序可以嵌入延伸的部分。
[0264]
在本发明的一些实施方案中,可将延伸的引导rna和/或引导rna与一个或两个或更多个rna募集基序(例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个基序,例如,至少10至约25个基序)连接,任选地,其中两个或更多个rna募集基序可以是相同的rna募集基序或不同的rna募集基序。在一些实施方案中,rna募集基序和相应的亲和多肽可以包括但不限于端粒酶ku结合基序(例如,ku结合发夹)和相应的亲和多肽ku(例如,ku异二聚体)、端粒酶sm7结合基序和相应的亲和多肽sm7、ms2噬菌体操纵子茎环和相应的亲和多肽ms2外壳蛋白(mcp)、pp7噬菌体操纵子茎环和相应的亲和多肽pp7外壳蛋白(pcp)、sfmu噬菌体com茎环和相应的亲和多肽com rna结合蛋白、puf结合位点(pbs)和亲和多肽pumilio/fem-3 mrna结合因子(puf),和/或合成的rna-适体和适体配体作为相应的亲和多肽。在一些实施方案中,rna募集基序和相应的亲和多肽可以是ms2噬菌体操纵子茎环和亲和多肽ms2外壳蛋白(mcp)。在一些实施方案中,rna募集基序和相应的亲和多肽可以是puf结合位点(pbs)和亲和多肽pumilio/fem-3 mrna结合因子(puf)。
[0265]
在一些实施方案中,用于募集多肽和核酸的组分可以是通过化学相互作用起作用的那些组分,所述化学相互作用包括但不限于,雷帕霉素诱导的frb

fkbp的二聚化;生物素-链霉抗生物素蛋白素;snap标签;halo标签;clip标签;由化合物诱导的dmra-dmrc异二聚体;双功能配体(例如,两种蛋白结合化学物质融合在一起,例如二氢叶酸还原酶(dhfr))。
[0266]
在一些实施方案中,为了在植物中表达而优化的本发明的核酸构建体、表达盒或载体可以与包含一种或多种相同的多核苷酸(但其未为了在植物中表达而进行过密码子优化)的核酸构建体、表达盒或载体具有约70%至100%(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)同一性。
[0267]
在一些实施方案中,本发明提供了包含本发明的一种或多种多核苷酸、引导核酸、
核酸构建体、表达盒或载体的细胞。
[0268]
在一些实施方案中,提供了编辑植物或植物部分中的内源hd-zip转录因子基因的方法,所述方法包括将植物或植物部分中的hd-zip转录因子基因中的靶位点与胞嘧啶碱基编辑系统接触,所述胞嘧啶碱基编辑系统包含胞嘧啶脱氨酶和与hd-zip转录因子中的靶位点结合的核酸结合结构域,所述hd-zip转录因子基因编码(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x2x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,从而编辑植物或其部分中的内源hd-zip转录因子基因,并产生包含至少一个在内源hd-zip转录因子基因中具有突变的细胞的植物或其部分。
[0269]
在一些实施方案中,提供了编辑植物或植物部分中的内源hd-zip转录因子基因的方法,所述方法包括将植物或植物部分中的hd-zip转录因子基因中的靶位点与腺苷碱基编辑系统接触,所述腺苷碱基编辑系统包含腺苷氨酶和与hd-zip转录因子中的靶位点结合的核酸结合结构域,所述hd-zip转录因子基因编码(a)包含与seq id no:1或seq id no:2的氨基酸序列具有至少80%序列同一性的序列的多肽;(b)包含与seq id no:3的氨基酸序列具有至少80%序列同一性的序列的多肽;(c)包含与seq id no:4的核苷酸序列具有至少95%序列同一性的序列的多肽;(d)包含具有seq id no:5所示氨基酸序列的序列的多肽,其中x是l或s;(e)多肽,其包含:(i)具有氨基酸序列rkklrlx1kx2qx3(seq id no:6)的序列,其中x1是s或t,x2是d或e,x3是s或a;(ii)具有氨基酸序列px1x
2 x2ltx3cpx4cer(seq id no:8)的序列,其中x1是p或a,x2是t或a,x3是v或m,x4是q、s或n;(iii)具有氨基酸序列enrrlx1x2ex3(seq id no:7)的序列,其中x1是q或h,x2是r或k,x3是v或l;和具有氨基酸序列vwfqnrra(seq id no:9)的序列和/或(f)包含具有氨基酸序列vwfqnrra(seq id no:9)的序列的多肽,从而编辑植物或其部分中的内源hd-zip转录因子基因,并产生包含至少一个在内源hd-zip转录因子基因中具有突变的细胞的植物或其部分。
[0270]
在一些实施方案中,提供了检测突变型hd-zip(内源hd-zip转录因子基因中的突变)的方法,所述方法包括在植物基因组中检测编码seq id no:1-98中任一个的氨基酸序列的核酸中的缺失,其中seq id no:1-98中任一个的氨基酸序列包含seq id no:9的氨基酸序列,并且该缺失在编码seq id no:9的氨基酸序列的核苷酸序列中。
[0271]
在一些实施方案中,本发明提供了检测内源hd-zip基因中的突变的方法,其包括在植物基因组中检测编码seq id no:1-98中的任一多肽序列的至少一种的核苷酸序列。
[0272]
在一些实施方案中,本发明提供了产生包含内源hd-zip转录因子基因中的突变和至少一种目标多核苷酸的植物的方法,所述方法包括将包含内源hd-zip转录因子基因中的至少一种突变的本发明植物(第一植物)与包含至少一种目标多核苷酸的第二植物杂交以产生后代植物;以及选择包含hd-zip转录因子基因的至少一个突变和至少一种目标多核苷
酸的后代植物,从而产生包含内源hd-zip转录因子基因中的突变和至少一种目标多核苷酸中的植物。
[0273]
本发明还提供了产生包含内源hd-zip转录因子基因中的突变和至少一种目标多核苷酸的植物的方法,所述方法包括将至少一种目标多核苷酸引入本发明的包含hd-zip转录因子基因中的至少一个突变的植物中,从而产生包含hd-zip转录因子基因中的至少一个突变和至少一种目标多核苷酸的植物。
[0274]
在一些实施方案中,本发明提供了产生包含内源hd-zip转录因子基因中的突变和至少一种目标多核苷酸的植物的方法,所述方法包括将至少一种目标多核苷酸引入包含内源hd-zip转录因子基因中的至少一个突变的本发明植物中,从而产生包含hd-zip转录因子基因中的至少一个突变和至少一种目标多核苷酸的植物。
[0275]
目标多核苷酸可以是能够赋予植物所需表型或以其它方式改变植物的表型或基因型的任何多核苷酸。在一些实施方案中,目标多核苷酸可以是赋予除草剂耐受性、昆虫抗性、疾病抗性、增加的产量、增加的养分利用效率或非生物胁迫抗性的多核苷酸。
[0276]
在一些实施方案中,提供了产生包含内源hd-zip转录因子基因中的突变并具有高度矮化或高度矮小表型的植物的方法,所述方法包括将在内源hd-zip转录因子基因中具有至少一个突变的本发明植物(第一植物)与包含高度矮化或高度矮小表型的第二植物杂交以产生后代植物;以及选择包含hd-zip转录因子基因中的至少一个突变和高度矮化或高度矮小表型的后代植物,从而产生具有高度矮化或高度矮小并包含内源hd-zip转录因子基因中的至少一个突变的植物。
[0277]
本发明还提供了控制包含一种或多种(多种)本发明植物的容器(例如,罐或种子托盘等)、生长室、温室、田地(例如,耕地)、休闲娱乐区、草坪和/或路边中的杂草的方法,其包括向生长在容器、生长室、田地或温室中的一种或多种(多种)本发明植物施用除草剂,从而控制其中一种或多种植物正在生长的容器、生长室、温室、田地、休闲娱乐区、草坪和/或路边的杂草。
[0278]
在一些实施方案中,提供了减少植物(或多种植物)上的昆虫捕食的方法,其包括向本发明的一种或多种(多种)植物施用杀虫剂,从而减少一种或多种(多种)植物上的昆虫捕食。在一些实施方案中,一种或多种植物可以生长在容器、生长室、田地、休闲娱乐区(例如,运动场、高尔夫球场)、草坪、路边或温室中。
[0279]
在一些实施方案中,本发明提供了减少植物上的真菌病害的方法,其包括向一种或多种(多种)本发明植物施用杀真菌剂,从而减少一种或多种(多种)植物上的真菌病害。在一些实施方案中,一种或多种植物可以生长在容器、生长室、田地、休闲娱乐区(例如,运动场、高尔夫球场)、草坪、路边或温室中。
[0280]
本发明的核酸构建体(例如,包含序列特异性dna结合结构域、crispr-cas效应子结构域、脱氨酶结构域、逆转录酶(rt)、rt模板和/或引导核酸等的构建体)和包含其的表达盒/载体可用作本发明的编辑系统,用于修饰靶核酸和/或其表达。
[0281]
可以使用本发明的多肽、多核苷酸、rnp、核酸构建体、表达盒和/或载体修饰(例如,突变,例如碱基编辑、切割、切刻等)任何植物或植物部分(或植物的分组,例如,分成属或更高级分类)的靶核酸,所述植物包括被子植物、裸子植物、单子叶植物、双子叶植物、c3植物、c4植物、cam植物、苔藓植物、蕨类植物和/或拟蕨类植物、微藻和/或大型藻类。可以如
本文所述进行修饰的植物和/或植物部分可以是任何植物物种/品种/栽培品种的植物和/或植物部分。在一些实施方案中,可以如本文所述进行修饰的植物是单子叶植物。在一些实施方案中,可以如本文所述进行修饰的植物是双子叶植物。
[0282]
如本文中所用,术语“植物部分”包括但不限于生殖组织(例如,花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花芽、胚珠、种子、胚胎、坚果、果仁、穗、穗轴和外壳);营养组织(例如,叶柄、茎(stem)、根、根毛、根尖、髓、胚芽鞘、茎(stalk)、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶);维管组织(例如,韧皮部和木质部);特化细胞,诸如表皮细胞、薄壁细胞、厚角细胞、厚壁细胞、气孔、保卫细胞、角质层、叶肉细胞;愈伤组织;和插枝。术语“植物部分”还包括植物细胞,包括在植物和/或植物部分中完整的植物细胞、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等。如本文中所用,“茎”是指包括叶和茎在内的地上部分。如本文中所用,术语“组织培养”包括组织、细胞、原生质体和愈伤组织的培养物。
[0283]
如本文中所用,“植物细胞”是指植物的结构和生理单位,其通常包括细胞壁,但也包括原生质体。本发明的植物细胞可呈分离的单细胞形式,或者可以是培养的细胞,或者可以是更高组织单位的一部分,例如植物组织(包括愈伤组织)或植物器官。在一些实施方案中,植物细胞可以是藻类细胞。“原生质体”是没有细胞壁或只有部分细胞壁的分离的植物细胞。因此,在本发明的一些实施方案中,包含本发明核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞,包括但不限于根细胞、叶细胞、组织培养细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的一些方面,植物部分可以是植物种质。在一些方面,植物细胞可以是不能再生为植物的非繁殖植物细胞。
[0284]“植物细胞培养物”意指植物单位例如原生质体、细胞培养细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、合子和不同发育阶段的胚胎的培养物。
[0285]
如本文中所用,“植物器官”是植物的独特且明显结构化和分化的部分,例如根、茎、叶、花蕾或胚。
[0286]
如本文中所用,“植物组织”是指组织成结构和功能单位的一群植物细胞。包括在植物中或培养中的任何植物组织。该术语包括但不限于完整植物、植物器官、植物种子、组织培养物和组织成结构和/或功能单位的任何植物细胞群。该术语与上面列出的或原本由本定义包含的任何特定类型的植物组织结合使用,或者在所述任何特定类型的植物组织不存在时该术语的使用,并不排除任何其他类型的植物组织。
[0287]
在本发明的一些实施方案中,提供了转基因组织培养物或转基因植物细胞培养物,其中所述转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中,可以通过将转基因植物与非转基因植物交配,并在后代中选择包含所需基因编辑但不包含用于产生所述编辑的转基因的植物,从由转基因组织或细胞发育的植物中消除转基因。
[0288]
任何包含能够调节植物避荫反应(sar)的内源hd-zip转录因子基因的植物都可以如本文所述进行修饰,以减少/减弱或消除植物中的sar。在一些实施方案中,植物可以是单子叶植物。在一些实施方案中,植物可以是双子叶植物。
[0289]
可以如本文所述进行修饰的植物的非限制性实例可包括但不限于草坪草(例如,早熟禾(bluegrass)、翦股颖、黑麦草、羊茅草)、羽状苇草(feather reed grass)、丛生毛
草、芒草、芦竹、柳枝稷、蔬菜作物,包括洋蓟、大头菜、芝麻菜、韭菜、芦笋、莴苣(例如,头、叶、长叶莴苣)、暗绿叶黄体芋(malanga)、瓜类(例如,甜瓜、西瓜、克伦肖瓜(crenshaw)、白兰瓜、罗马甜瓜)、油菜作物(例如,球芽甘蓝、卷心菜、花椰菜、西兰花、羽衣甘蓝、无头甘蓝、大白菜、小白菜)、刺菜蓟、胡萝卜、纳帕(napa)、秋葵、洋葱、芹菜、欧芹、鹰嘴豆、欧洲萝卜、菊苣、胡椒、马铃薯、葫芦科植物(例如,西葫芦、黄瓜、密生西葫芦、南瓜(pumpkin)、蜜瓜、西瓜、罗马甜瓜)、水萝卜、干球洋葱、芜菁甘蓝、茄子、婆罗门参、宽叶苦苣、青葱、菊苣、大蒜、菠菜、大葱、南瓜、绿叶蔬菜、甜菜(糖用甜菜和饲料用甜菜)、甘薯、牛皮菜、山葵、番茄、芜菁和香料;水果作物,诸如苹果、杏、樱桃、油桃、桃、梨、李子、梅子、樱桃、榅桲、无花果、坚果(例如,栗子、山核桃、开心果、榛子、开心果、花生、核桃、澳洲坚果、杏仁等)、柑橘(例如,克莱门氏小柑橘、金橘、橙子、葡萄柚、橘子、柑橘、柠檬、酸橙等)、蓝莓、黑树莓、波森莓、蔓越莓、醋栗果、醋栗、罗甘莓、覆盆子、草莓、黑莓、葡萄(葡萄酒和餐桌)、鳄梨、香蕉、奇异果、柿子、石榴、菠萝、热带水果、梨果、甜瓜、芒果、木瓜和荔枝,大田作物诸如三叶草、苜蓿、梯牧草、月见草、草地泡沫(meadow foam)、玉米/玉蜀黍(大田、甜玉米、爆米花)、啤酒花、霍霍巴、荞麦、红花、藜麦、小麦、水稻、大麦、黑麦、小米、高粱、燕麦、黑小麦、高粱、烟草、木棉、豆科植物(豆类(例如绿色和干燥的)、扁豆、豌豆、大豆)、油料植物(油菜(rape)、油菜(canola)、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油植物、可可豆、落花生、油棕)、浮萍、拟南芥、纤维植物(棉花、亚麻、大麻、黄麻)、大麻(例如,大麻(cannabis sativa)、印度大麻和莠草大麻)、樟科(肉桂、樟脑)或诸如咖啡、甘蔗、茶和天然橡胶植物等植物;和/或诸如开花植物、仙人掌、肉质植物和/或诸如开花植物、仙人掌、肉质植物等花坛植物和/或观赏植物(例如,玫瑰、郁金香、紫罗兰),以及诸如森林树木(阔叶树和常绿植物,诸如针叶树;例如,榆树、白蜡树、橡树、枫树、冷杉、云杉、雪松、松树、桦树、柏树、桉树、柳树)以及灌木和其他苗木等树木。在一些实施方案中,本发明的核酸构建体和/或编码其的表达盒和/或载体可用于修饰玉米、大豆、小麦、芸苔、水稻、番茄、辣椒或向日葵。
[0290]
在一些实施方案中,可以如本文所述进行修饰的植物可包括但不限于玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、糖用甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜或芸苔属某些种(例如,欧洲油菜、甘蓝、芜菁、芥菜型油菜和/或黑芥)。
[0291]
在一些实施方案中,可以如本文所述进行修饰的植物是玉米(即,玉米、玉蜀黍),任选地,其中玉米植物包含高度矮小/半矮化表型。
[0292]
在一些实施方案中,可以如本文所述进行修饰的植物是小麦(例如,普通小麦、硬粒小麦和/或密穗小麦(t.compactum))。在一些实施方案中,小麦植物可以在其a基因组、b基因组和/或d基因组中的内源hd-zip转录因子中包含至少一个非天然突变。
[0293]
因此,根据本发明优先处理的植物或植物栽培品种包括通过遗传修饰获得遗传物质的所有植物,所述遗传物质赋予这些植物特别有利的有用特性(“性状”)。此类特性的实例是更好的植物生长、活力、胁迫耐受性、站立能力、抗倒伏性、营养吸收、植物营养和/或产量,特别是改善的生长、对高温或低温的增强的耐受性、对干旱或水或土壤盐度水平的增强的耐受性、增强的开花性能、更容易收获、加速成熟、更高产量、收获产品的更高品质和/或更高营养价值、收获产品的更好储存寿命和/或可加工性。
[0294]
此类性质的进一步和特别强调的实例是对动物和微生物害虫,诸如对昆虫、蛛形类、线虫类、螨虫类、蛞蝓和蜗牛的增强的抗性,这归因于例如植物中形成的毒素。在编码赋予对此类动物和微生物害虫(特别是昆虫)的耐受性的蛋白质的dna序列中,将特别提及来自苏云金芽孢杆菌(bacillus thuringiensis)的编码bt蛋白质的遗传物质,其广泛描述于文献中并且为本领域技术人员所熟知。还将提及从细菌诸如发光杆菌属(photorhabdus)中提取的蛋白质(wo97/17432和wo98/08932)。具体而言,将提及bt cry或vip蛋白质,其包括cryla、cryiab、cryiac、cryiia、cryiiia、cryiiib2、cry9c cry2ab、cry3bb和cryif蛋白或其毒性片段,以及还有其杂交体或组合,尤其是crylf蛋白或衍生自crylf蛋白质的杂交体(例如,杂交cryla-crylf蛋白或其毒性片段)、cryla型蛋白或其毒性片段,优选地,crylac蛋白或衍生自crylac蛋白的杂交体(例如,杂交crylab-crylac蛋白)或crylab或bt2蛋白或其毒性片段、cry2ae、cry2af或cry2ag蛋白或其毒性片段、cryla.105蛋白或其毒性片段、vip3aa19蛋白、vip3aa20蛋白、cot202或cot203棉花事件中产生的vip3a蛋白、vip3aa蛋白或其毒性片段(如estruch等人(1996),proc natl acad sci us a.28;93(11):5389-94中所描述的)、如wo2001/47952中所述的cry蛋白、来自致病杆菌属(xenorhabdus)(如wo98/50427中所述的)、沙雷氏菌属(serratia)(特别是来自嗜虫沙雷氏菌(s.entomophila))或发光杆菌属(photorhabdus)物种菌株的杀虫蛋白,诸如wo98/08932中所述的来自发光杆菌属的tc蛋白。此外,在某些氨基酸(1-10个,优选1-5个)上不同于任何上述序列(特别是它们的毒性片段的序列)的或者与转运肽(诸如质体转运肽)或另一种蛋白质或肽融合的这些蛋白质中任一种的任何变体或突变体,也包括在本文中。
[0295]
此类性质的另一个特别强调的实例是赋予对一种或多种除草剂(例如,咪唑啉酮类、磺酰脲类、草甘膦或草丁膦)的耐受性。在编码赋予转化的植物细胞和植物对某些除草剂的耐受性的蛋白质的dna序列(即目标多核苷酸)中,将特别提及wo2009/152359中描述的bar或pat基因或天蓝色链霉菌(streptomyces coelicolor)基因(所述基因赋予对草铵膦除草剂的耐受性)、编码合适的epsps(5-烯醇丙酮酰莽草酸-3-磷酸合酶)的基因(其赋予对以epsps为靶标的除草剂,特别是诸如草甘膦及其盐等除草剂的耐受性)、编码草甘膦-n-乙酰基转移酶的基因或编码草甘膦氧化还原酶的基因。其他合适的除草剂耐受性性状包括至少一种als(乙酰乳酸合酶)抑制剂(例如,wo2007/024782)、突变的拟南芥als/ahas基因(例如,美国专利6,855,533)、编码赋予对2,4-d(2,4-二氯苯氧基乙酸)耐受性的2,4-d-单加氧酶的基因和编码赋予对麦草畏(3,6-二氯-2-甲氧基苯甲酸)的耐受性的麦草畏单加氧酶的基因。
[0296]
此类性质的进一步特别强调的实例是对植物病原性真菌、细菌和/或病毒的增强的抗性,这归因于例如系统获得性抗性(sar)、系统素、植物抗毒素、诱发剂(elicitor)以及还有抗性基因和相应地表达的蛋白质和毒素。
[0297]
可以根据本发明优先处理的转基因植物或植物栽培品种中特别有用的转基因事件包括事件531/pv-ghbk04(棉花,昆虫控制,于wo2002/040677中描述的),事件1143-14a(棉花,昆虫控制,未保藏,于wo2006/128569中描述的);事件1143-51b(棉花,昆虫控制,未保藏,于wo2006/128570中描述的);事件1445(棉花,除草剂耐受性,未保藏,于us-a 2002-120964或wo2002/034946中描述);事件17053(水稻,除草剂耐受性,以pta-9843保藏,于wo2010/117737中描述的);事件17314(水稻,除草剂耐受性,以pta-9844保藏,于wo2010/
209030保藏,于us-a 2005-188434或wo98/044140中描述的);事件gm rz13(糖用甜菜,病毒抗性,以ncimb-41601保藏,于wo2010/076212中描述的);事件h7-l(糖用甜菜,除草剂耐受性,以ncimb 41158或ncimb 41159保藏,于us-a 2004-172669或wo2004/074492中描述的);事件joplinl(小麦,疾病耐受性,未保藏,于us-a 2008-064032中描述的);事件ll27(大豆,除草剂耐受性,以ncimb41658保藏,于wo2006/108674或us-a 2008-320616中描述的);事件ll55(大豆,除草剂耐受性,以ncimb 41660保藏,于wo2006/108675或us-a 2008-196127中描述的);事件llcotton25(棉花,除草剂耐受性,以atcc pta-3343保藏,于wo2003/013224或usa 2003-097687中描述的);事件llrice06(水稻,除草剂耐受性,以atcc 203353保藏,于美国专利第6,468,747号或wo2000/026345中描述的);事件llrice62(水稻,除草剂耐受性,以atcc 20335保藏,于wo2000/026345中描述的),事件llrice601(水稻,除草剂耐受性,以atcc pta-2600保藏,于us-a 2008-2289060或wo2000/026356中描述的);事件ly038(玉米,品质性状,以atcc pta-5623保藏,于us-a 2007-028322或wo2005/061720中描述的);事件mir162(玉米,昆虫控制,以pta-8166保藏,于us-a 2009-300784或wo2007/142840中描述的);事件mir604(玉米,昆虫控制,未保藏,于us-a 2008-167456或wo2005/103301中描述的);事件mon15985(棉花,昆虫控制,以atcc pta-2516保藏,于us-a 2004-250317或wo2002/100163中描述的);事件mon810(玉米,昆虫控制,未保藏,于us-a 2002-102582中描述的);事件mon863(玉米,昆虫控制,以atcc pta-2605保藏,于wo2004/011601或us-a 2006-095986中描述的);事件mon87427(玉米,授粉控制,以atcc pta-7899保藏,于wo2011/062904中描述的);事件mon87460(玉米,胁迫耐受性,以atcc pta-8910保藏,于wo2009/111263或us-a 2011-0138504中描述的);事件mon87701(大豆,昆虫控制,以atcc pta-8194保藏,于us-a 2009-130071或wo2009/064652中描述的);事件mon87705(大豆,品质性状-除草剂耐受性,以atcc pta-9241保藏,于us-a 2010-0080887或wo2010/037016中描述的);事件mon87708(大豆,除草剂耐受性,以atcc pta-9670保藏,于wo2011/034704中描述的);事件mon87712(大豆,产量,以pta-10296保藏,于wo2012/051199中描述的),事件mon87754(大豆,品质性状,以atcc pta-9385保藏,于wo2010/024976中描述的);事件mon87769(大豆,品质性状,以atcc pta-8911保藏,于us-a 2011-0067141或wo2009/102873中描述的);事件mon88017(玉米,昆虫控制-除草剂耐受性,以atcc pta-5582保藏,于us-a 2008-028482或wo2005/059103中描述的);事件mon88913(棉花,除草剂耐受性,以atcc pta-4854保藏,于wo2004/072235或us-a 2006-059590中描述的);事件mon88302(欧洲油菜,除草剂耐受性,以pta-10955保藏,于wo2011/153186中描述的),事件mon88701(棉花,除草剂耐受性,以pta-11754保藏,于wo2012/134808中描述的),事件mon89034(玉米,昆虫控制,以atcc pta-7455保藏,于wo 07/140256或us-a 2008-260932中描述的);事件mon89788(大豆,除草剂耐受性,以atcc pta-6708保藏,于us-a 2006-282915或wo2006/130436中描述的);事件msl 1(欧洲油菜,授粉控制-除草剂耐受性,以atcc pta-850或pta-2485保藏号,于wo2001/031042中描述的);事件ms8(欧洲油菜,授粉控制-除草剂耐受性,以atcc pta-730保藏,于wo2001/041558或us-a 2003-188347中描述的);事件nk603(玉米,除草剂耐受性,以atcc pta-2478保藏,于us-a 2007-292854中描述的);事件pe-7(水稻,昆虫控制,未保藏,于wo2008/114282中描述的);事件rf3(欧洲油菜,授粉控制-除草剂耐受性,以atcc pta-730保藏,于wo2001/041558或us-a 2003-188347中描述的);事件rt73(欧洲油菜,除草剂耐受
性,未保藏,于wo2002/036831或us-a 2008-070260中描述的);事件syht0h2/syn-000h2-5(大豆,除草剂耐受性,以pta-11226保藏,于wo2012/082548中描述的),事件t227-1(糖用甜菜,除草剂耐受性,未保藏,于wo2002/44407或us-a 2009-265817中描述的);事件t25(玉米,除草剂耐受性,未保藏,于us-a 2001-029014或wo2001/051654中描述的);事件t304-40(棉花,昆虫控制-除草剂耐受性,以atcc pta-8171保藏,于us-a 2010-077501或wo2008/122406中描述的);事件t342-142(棉花,昆虫控制,未保藏,于wo2006/128568中描述的);事件tc1507(玉米,昆虫控制-除草剂耐受性,未保藏,于us-a 2005-039226或wo2004/099447中描述的);事件vip1034(玉米,昆虫控制-除草剂耐受性,以atcc pta-3925保藏,于wo2003/052073中描述的),事件32316(玉米,昆虫控制-除草剂耐受性,以pta-11507保藏,于wo2011/084632中描述的),事件4114(玉米,昆虫控制-除草剂耐受性,以pta-11506保藏,于wo2011/084621中描述的),任选地与事件ee-gm1/ll27或事件ee-gm2/ll55(wo2011/063413a2)叠加的事件ee-gm3/fg72(大豆,除草剂耐受性,atcc登录号pta-11041),事件das-68416-4(大豆,除草剂耐受性,atcc录号pta-10442,wo2011/066360al),事件das-68416-4(大豆,除草剂耐受性,atcc登录号pta-10442,wo2011/066384al),事件dp-040416-8(玉米,昆虫控制,atcc登录号pta-11508,wo2011/075593al),事件dp-043a47-3(玉米,昆虫控制,atcc登录号pta-11509,wo2011/075595al),事件dp-004114-3(玉米,昆虫控制,atcc登录号pta-11506,wo2011/084621al),事件dp-032316-8(玉米,昆虫控制,atcc登录号pta-11507,wo2011/084632a1)、事件mon-88302-9(欧洲油菜,除草剂耐受性,atcc登录号pta-10955,wo2011/153186al),事件das-21606-3(大豆,除草剂耐受性,atcc登录号pta-11028,wo2012/033794a2),事件mon-87712-4(大豆,品质性状,atcc登录号pta-10296,wo2012/051199a2),事件das-44406-6(大豆,叠加的除草剂耐受性,atcc登录号pta-11336,wo2012/075426al),事件das-14536-7(大豆,叠加的除草剂耐受性,atcc登录号pta-11335,wo2012/075429al),事件syn-000h2-5(大豆,除草剂耐受性,atcc登录号pta-11226,wo2012/082548a2),事件dp-061061-7(欧洲油菜,除草剂耐受性,无保藏号可用,wo2012071039al),事件dp-073496-4(欧洲油菜,除草剂耐受性,无保藏号可用,us2012131692),事件8264.44.06.1(大豆,叠加的除草剂耐受性,登录号pta-11336,wo2012075426a2),事件8291.45.36.2(大豆,叠加的除草剂耐受性,登录号登录号pta-11335,wo2012075429a2),事件syht0h2(大豆,atcc登录号号pta-11226,wo2012/082548a2),事件mon88701(棉花,atcc登录号pta-11754,wo2012/134808al),事件kk179-2(苜蓿,atcc登录号pta-11833,wo2013/003558al),事件pdab8264.42.32.1(大豆,叠加的除草剂耐受性,atcc登录号pta-11993,wo2013/010094al),事件mzdt09y(玉米,atcc登录号pta-13025,wo2013/012775al)。
[0298]
赋予所述所需性状的基因/事件(例如,目标多核苷酸)也可以在转基因植物中彼此组合存在。可以提及的转基因植物的实例是重要的作物植物,诸如谷类(小麦、水稻、黑小麦、大麦、黑麦、燕麦)、玉米、大豆、马铃薯、糖用甜菜、甘蔗、番茄、豌豆和其他类型的蔬菜、棉花、烟草、欧洲油菜以及水果植物(诸如苹果、梨等水果、柑橘类水果和葡萄),其中特别强调的是玉米、大豆、小麦、水稻、马铃薯、棉花、甘蔗、烟草和欧洲油菜。特别强调的性状是植物对昆虫、蛛形类、线虫类、蛞蝓和蜗牛的增强的抗性,以及植物对一种或多种除草剂的增强的抗性。
[0299]
可根据本发明优先处理的此类植物、植物部分或植物种子的商购可得的实例包括以以ribroundupvt doublevt triplebollgardroundup ready 22roundup2 xten
dtm
、intacta rr2vistive和/或xtendflex
tm
商品名销售或分销的商品,诸如植物种子。
[0300]
现在将参考以下实施例描述本发明。应该理解的是,这些实施例并不旨在限制本发明的权利要求的范围,而是旨在作为某些实施方案的示例。技术人员想到的示例性方法的任何变化都落入本发明的范围内。
[0301]
实施例
[0302]
实施例1.hb53和hb78的基因组编辑构建体的设计
[0303]
zm00001d002754(hb53)和zm00001d029934(hb78)(玉蜀黍)的基因组序列是从专有的玉米品系中鉴定的。从这条参考品系中,鉴定了间隔区序列seq id no:175-182。编辑构建体(靶向hb53的pwise444和靶向hb53/hb78的pwise451)包含crispr-cas效应蛋白(图13,pwise451包括来自所示pwise的所有引导核酸)。crispr-cas效应蛋白与对玉米的hb53/hb78转录因子的dna序列特异的间隔区核酸缔合。使用cpf1切割酶对基因靶标的dna结合域进行独特的破坏。
[0304]
实施例2.编辑的e0植物的转化和选择
[0305]
使用土壤杆菌转化干燥的离体玉米胚以递送编辑构建体。选择健康的非嵌合植物(e0)并插在生长托盘中。进行e0植物的基因分型以评估转基因拷贝和编辑功效。将被鉴定为(1)健康的、非嵌合的和可育的,具有(2)低转基因拷贝和(3)被破坏的dna结合结构域的植物了递进至下一代。将满足所有上述标准的e0植物自交以产生e1代。
[0306]
对于pwise444,110株e0植物源自单个转化实验。从这个e0植物库中,我们鉴定了具有导致hb53 dna结合域破坏的框外缺失的植物。表1提供了植物标识符,鉴定的缺失和最终递进的e1等位基因。图10显示了来自递进的e0亲本的e1后代的基因型。
[0307]
表1.hb53 e0亲本植物和鉴定的等位基因
[0308]
e0亲本e0等位基因e1等位基因(递进的)ce-9775杂合的(5bp和7bp缺失)纯合的5bp缺失ce-9787杂合的(11bp和14bp缺失)纯合的11bp缺失ce-9778het-wt(23bp缺失)纯合的23bp缺失
[0309]
对于pwise451,单个转化实验产生了44个e0事件。其中,对具有所需框外缺失的单一e0植物进行了改良。图11和图12分别显示了hb53和hb78 e1后代的编辑性质。
[0310]
除了pwise444和pwise451之外,其他转化实验在hb78上产生了所需的编辑。图9显示了代表性编辑的植物的基因组序列。其表明靶dna结合结构域上游的10bp框外缺失导致了提前终止密码子,因此丢失了dna结合结构域。
[0311]
实施例3.性状活动的表型评估
[0312]
对于每个e1家庭,种植100粒种子并进行筛选。将被鉴定为(1)健康的、非嵌合的和可育的,(2)无转基因的,(3)具有被破坏的dna结合结构域的植物推进到下一代。性状活性
通常在e2阶段进行评估。为了评估递进的所需编辑的性状活性,将10日龄的幼苗暴露于模拟的遮荫环境中。定制的照明阵列由12个补充有超过330个带有bluefish控制器的2.25v cree远红led(720-740)的cree 6500k 36v cob构成。其他类似的照明可用来模拟遮荫环境。
[0313]
编辑的玉米幼苗和对照(野生型和gus对照)玉米幼苗生长在具有模拟遮荫环境的生长棚中,其中在400μmol m-2 s-1
par(光合有效辐射)下,它们经历0.15的红光波长与远红光波长的比率。经编辑的玉米幼苗和对照玉米幼苗也在单独的生长棚中生长,在那里它们经历1.3的红光与远红光的比率和400μmol m-2 s-1
par(无遮荫)。在三个高度标记(胚芽鞘、v1鞘、v2鞘)处测量植物高度,并在模拟遮荫和非遮荫环境中比较对照植物与经编辑的植物。当生长在模拟遮荫下的经编辑的植物比对照植物(野生型)矮5%、10%、15%(或更多)时,编辑事件被认为是性状活性的。
[0314]
实施例4.内源玉米同源结构域-亮氨酸拉链(hd-zip)转录因子的修饰抑制避荫反应。
[0315]
hd-zip转录因子的编辑抑制了茎在模拟遮荫条件下的过度伸长。hd-zip转录因子hb53和hb53/hb78的纯合编辑表现出统计学上显著的受抑制的避荫反应,如v2阶段所示(图14),但没有显著的异型(图15)。相反,野生型植物(01dkd2对照)和用无引导核酸的载体转化的植物(gus对照)显示出统计学上显著的避荫反应。除了从pwise444(hb53)和pwise451(hb53/hb78)产生的编辑的等位基因之外,还测试了纯合的hb78编辑(图8和图9)。我们的结果表明在e1阶段存在性状活性(即,无避荫反应),但是在e2阶段未编辑的hb78对比经编辑的hb78之间在植物高度上没有显著差异。由于两项测试(e1阶段对比e2阶段)在生长室位置上有所不同,因此需要进一步的测试。
[0316]
综上所述,我们的结果表明hd-zip转录因子是避荫反应的高效调节因子。此外,我们已经证明,编辑这些转录因子导致对遮荫的进化保守的过度反应的抑制。
[0317]
前述内容是对本发明的说明,不应理解为对本发明的限制。本发明由以下权利要求限定,其中权利要求的等同物包括在其中。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献