一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

通过禁用黑芥子酶/硫代葡萄糖苷系统改变消费作物的风味特征的制作方法

2022-07-14 01:53:02 来源:中国专利 TAG:
通过禁用黑芥子酶/硫代葡萄糖苷系统改变消费作物的风味特征1.关于序列表电子提交的声明2.根据37c.f.r.§1.821提交的于2020年8月14日生成并通过efs-web提交的标题为1499-40wo_st25.txt、大小为1,312,790字节ascii文本格式的序列表提供用于代替纸质副本。该序列表的公开内容在此通过引用并入本说明书。3.优先权4.本技术根据35u.s.c.§119(e)要求2019年8月14日提交的美国临时申请第62/886,458号的权益,其全部内容通过引用并入本文。5.领域6.本发明涉及下一代植物育种以向消费作物提供所需的性状,特别是减少的刺激性风味、苦味和/或气味性状。7.背景8.蔬菜在粮食和营养安全方面发挥着重要作用。特别是,绿叶蔬菜被认为是维生素、矿物质和酚类化合物的特殊来源。9.与主食谷物相比,叶菜中的铁和钙等矿物质营养素含量更高。然而,疾病控制和预防中心(cdc)最近报告说,只有十分之一的成年人符合水果和蔬菜的每日摄入量建议。对于消费者而言,新鲜农产品的消费选择存在多种潜在障碍,例如:新鲜农产品的成本、便利性、可用性和适口性/风味。在新鲜农产品中,生菜通常用作沙拉的主要成分,并为三明治和汉堡提供添加剂选择。虽然生菜随处可见,并且由消费者普遍购买,但相对于其他绿叶蔬菜而言,其营养价值不足。10.近年来,绿叶蔬菜诸如羽衣甘蓝(kale)作为“超级食品”而广受欢迎,并成为注重健康的消费者的营养丰富的蔬菜来源。在南部各州,芜菁、芥菜和羽衣甘蓝(collard)是饮食的常见部分。然而,为了尽量减少与绿叶蔬菜相关的不良属性,例如纤维状/坚硬的叶子、苦味、褶边质地和/或刺激性,消费者经常将绿叶蔬菜煮熟以软化组织并通过加入脂肪和其他成分来改变风味/气味特征。因此,由于烹饪过程,许多与营养相关的益处减少了,消费者从一开始就被剥夺了食用新鲜农产品的许多直接益处。11.在可供消费者选择的最营养丰富的绿叶蔬菜中,芥菜(brassicajuncea)的特征是种内多样性,具有多种叶片特征如颜色、大小、质地和抽穗形态。如果新鲜食用,芥菜由于黑芥子酶与其硫代葡萄糖苷底物(也称为“芥菜弹”)的反应而具有刺激性。因此,芥菜要么煮熟以最小化刺激性,要么少量新鲜食用,或者作为幼叶(babygreen)食用。12.因此,本发明涉及改变植物如芥菜的不良属性,以增加新鲜健康绿叶蔬菜和新鲜农产品的消费。13.概述14.本公开内容提供了一种新的植物育种方法,用于促进人类食用的新鲜绿叶植物。该育种方法能够产生其中芥菜弹反应被解除的芥菜植物和/或在风味和/或气味方面具有降低的刺激性和/或苦味的植物。本公开内容提供了通过例如本文教导的基因编辑系统在感兴趣的植物中对与风味和/或气味性状遗传相关的基因组靶标的修饰。因此,采用基因编辑方法来精确操纵基因组靶标,这允许生产具有较少刺激性和/或较少苦味风味和/或气味的芥菜植物,这将增加消费者对例如绿叶蔬菜的消费。此外,本公开内容还教导了一种生产不含外源dna和/或转基因的基因编辑植物的方法。15.本发明的一个方面提供了一种芥菜(例如芸苔属)植物或其部分,其在编码细胞色素p450单加氧酶(即cyp79f1,高甲硫氨酸(homomethionine)n-单加氧酶;ec1.14.14.42)的内源基因、编码2-氧代酸依赖性双加氧酶(2-oxoacid-dependentdioxygenase)(即aop2,2-氧代戊二酸依赖性双加氧酶;ec1.14.11.m8)的内源基因和/或编码黑芥子酶(即,葡糖苷酶(glucosinolase)、硫葡糖苷酶(thioglucosidase)(例如,β-硫葡糖苷酶)、硫代葡萄糖苷葡糖水解酶;ec3.2.1.147(ec3.2.3.1转移到3.2.1.147))的内源基因中包含至少一个非天然突变。芥菜植物可具有多于一个拷贝的黑芥子酶基因,其中至少一个(例如,1、2、3、4或更多个)黑芥子酶基因包含一个或多个突变(例如,1、2、3、4或更多个突变)。芥菜植物可具有多于一个拷贝的aop2基因,其中至少一个(例如,1、2、3、4或更多个)aop2基因包含一个或多个突变(例如,1、2、3、4或更多个突变)。16.本发明的第二方面提供了一种芥菜植物细胞,其包含编辑系统,该系统包含:(a)crispr相关效应蛋白;(b)引导核酸(grna、gdna、crrna、crdna、sgrna、sgdna),其包含与编码cyp79f1的内源性靶基因、编码aop2的内源性靶基因和/或编码黑芥子酶的内源性靶基因互补的间隔序列。17.本发明的第三方面提供了一种芥菜植物或其部分(例如植物细胞),其在风味和/或气味方面具有降低的刺激性或苦味(例如,硫代葡萄糖苷的水解减少和/或烯基硫代葡萄糖苷和/或脂肪族硫代葡萄糖苷的量/产生减少)(与不包含该编辑并在相同条件下生长的植物相比),其在内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中包含至少一个非天然突变,其中至少一个突变是使用编辑系统引入的替换、插入或缺失,该编辑系统包含与内源黑芥子酶基因、内源aop2基因或内源cyp79f1基因中的靶位点结合的核酸结合结构域。18.本发明的第四方面提供了一种生产/培育无转基因的编辑的芥菜植物的方法,包括:将本发明的芥菜植物与无转基因芥菜植物杂交,从而将至少一个非天然突变引入无转基因的芥菜植物中;和选择包含至少一个非天然突变且无转基因的后代芥菜植物,从而产生无转基因的编辑的芥菜植物。19.本发明的第五个方面提供了一种提供多种芥菜植物的方法,该植物表现出降低的刺激性或苦味,该方法包括在生长区域(例如,一个田地(例如耕地、农田)、生长室、温室、休闲区、草坪和/或路边等)种植两种或更多种权利要求1-21或24-42中任一项的植物,从而提供与不包含突变并且在相同条件下生长的多种对照芥菜植物相比表现出降低的刺激性或苦味的多种芥菜植物。20.本发明的第六方面提供了一种在芥菜黑芥子酶基因、aop2基因和/或cyp79f1基因中产生变异的方法,包括:将编辑系统引入芥菜植物细胞中,其中该编辑系统靶向于黑芥子酶基因的区域、aop2基因的区域和/或cyp79f1基因的区域;和将黑芥子酶基因、aop2基因和/或cyp79f1基因的区域与编辑系统接触,从而将突变引入黑芥子酶基因、aop2基因和/或cyp79f1基因中并在芥菜黑芥子酶基因、aop2基因和/或cyp79f1基因中产生变异。21.本发明的第七方面提供了一种编辑芥菜植物细胞基因组中的特定位点的方法,该方法包括:以位点特异性方式切割内源性黑芥子酶基因、内源性aop2基因和/或内源cyp79f1基因内的靶位点,从而在植物细胞的内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中产生编辑。22.第八方面提供了制备芥菜植物的方法,包括:(a)将包含编码野生型内源黑芥子酶、野生型内源aop2和/或野生型内源cyp79f1的dna序列的芥菜植物细胞群与连接至结合野生型内源性黑芥子酶、野生型内源性aop2或野生型内源性cyp79f1中的靶序列的dna结合结构域(例如,编辑系统)的核酸酶接触,(b)从所述群体中选择其中编码野生型内源性黑芥子酶、野生型内源性aop2和/或野生型内源性cyp79f1的至少一个dna序列已被突变的芥菜植物细胞,其中所述突变包括所述至少一个dna序列中至少一个核苷酸的缺失;和(c)将选定的植物细胞生长成芥菜植物。23.第九方面提供了一种用于降低芥菜植物或其部分的风味或香气中的刺激性和/或苦味的方法,包括(a)将包含野生型内源黑芥子酶基因、野生型内源aop2基因和/或野生型内源性cyp79f1基因的芥菜植物细胞与靶向野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因的核酸酶接触,其中所述核酸酶与结合野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因中的靶位点的dna结合结构域连接,以产生包含野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因中的突变的植物细胞;和(b)将植物细胞培养成包含野生型内源性黑芥子酶基因、野生型内源性aop2基因和/或野生型内源性cyp79f1基因中的突变的植物,从而降低芥菜植物或其部分的风味或香气中的刺激性和/或苦味。24.第十方面提供了产生具有降低的刺激性和/或降低的苦味的表型的芥菜植物的方法,包括(a)将包含野生型内源黑芥子酶基因、野生型内源aop2基因和/或野生型内源性cyp79f1基因的芥菜植物细胞与靶向野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因的核酸酶接触,其中所述核酸酶与结合野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因中的靶位点的dna结合结构域连接,(b)将植物细胞培养成芥菜植物,由此产生与不包含该编辑并在相同条件下生长的植物相比具有减少的刺激性和/或减少的苦味的表型的芥菜植物。25.本发明的第十一方面提供了生产包含具有突变的内源黑芥子酶基因、突变的内源aop2基因和/或突变的内源cyp79f1基因的至少一个细胞的芥菜植物或其部分的方法,该方法包括将芥菜植物或植物部分中的内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中的靶位点与包含切割结构域和dna结合结构域的核酸酶接触,其中所述dna结合结构域结合内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中的靶位点,从而产生包含具有突变的内源黑芥子酶基因、突变的内源aop2基因和/或突变的内源cyp79f1基因的至少一个细胞的植物或其部分。26.本发明的第十二方面提供了一种生产芥菜植物或其部分的方法,该芥菜植物或其部分包含突变的内源黑芥子酶基因、突变的内源aop2基因和/或突变的内源cyp79f1基因并且具有降低的刺激性和/或苦味的表型,所述方法包括使内源性黑芥子酶基因、内源性aop2基因和/或内源性cyp79f1基因中的靶位点与包含切割结构域和dna结合结构域(例如,编辑系统)的核酸酶接触,所述dna结合结构域包含结合内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中的靶位点的dna结合结构域,从而产生包含突变的内源黑芥子酶基因、突变的内源aop2基因和/或突变的内源cyp79f1基因和与不包含该编辑并在相同条件下生长的植物相比具有降低的刺激性和/或苦味的芥菜植物或其部分。27.第十三方面提供了与内源黑芥子酶基因、内源aop2基因或内源cyp79f1基因中的靶位点结合的引导核酸(例如,grna、gdna、crrna、crdna)。28.在第十四方面,提供了一种系统,其包含本发明的引导核酸和与本发明的引导核酸结合的crispr-cas效应蛋白。29.第十五方面提供了一种基因编辑系统,其包含与引导核酸结合的crispr-cas效应蛋白,其中引导核酸包含与内源性黑芥子酶基因、内源性aop2基因或内源性cyp79f1基因结合的间隔序列。30.在第十六方面,一种复合物,其包含含有切割结构域的crispr-cas效应蛋白和引导核酸,其中引导核酸结合内源性黑芥子酶基因、内源性aop2基因或内源性cyp79f1基因中的靶位点,其中切割结构域切割内源黑芥子酶基因、内源aop2基因或内源cyp79f1基因中的靶标链。31.在第十七方面,提供了一种表达盒,该表达盒包含(a)编码包含切割结构域的crispr-cas效应蛋白的多核苷酸和(b)与内源黑芥子酶基因、内源性aop2基因或内源性cyp79f1基因中的靶位点结合的引导核酸。32.本发明的第十八方面提供了编码黑芥子酶、cyp79f1或aop2的无效等位基因的核酸。33.在另一个方面,提供了包含本发明的核酸的芥菜植物或其部分。34.在另一方面,提供了一种芥菜植物或其部分,与在相同条件下生长的不包含该编辑的植物(或其部分)相比,其在风味和/或香气方面表现出降低的刺激性和/或降低的苦味。35.进一步提供了在其基因组中包含一种或多种突变的黑芥子酶基因、一种或多种突变的aop2基因和/或cyp79f1基因的芥菜植物(通过本发明的方法产生)以及用于制造本发明的植物的多肽、多核苷酸、核酸构建体、表达盒和载体。36.本发明的这些和其他方面在以下本发明的描述中更详细地阐述。37.序列简述38.seqidno:1-17是可用于本发明的示例性cas12a氨基酸序列。39.seqidno:18-20是可用于本发明的示例性cas12a核苷酸序列。40.seqidno:21-22是编码启动子和内含子的示例性调节序列。41.seqidno:23-29是可用于本发明的示例性胞嘧啶脱氨酶序列。42.seqidno:30-34是可用于本发明的示例性腺嘌呤脱氨酶氨基酸序列。43.seqidno:35是可用于本发明的示例性尿嘧啶-dna糖基化酶抑制子(ugi)序列。44.seqidno:36-38提供了v型crispr-cas12a核酸酶的前间隔区相邻基序位置的示例。45.seqidno:39-41提供了可用于本发明的示例肽标签和亲和多肽。46.seqidno:42-52提供了可用于本发明的示例性rna募集基序和相应的亲和多肽。47.seqidno:53-54是可用于本发明的示例性cas9多肽序列。48.seqidno:55-65是可用于本发明的示例性cas9多核苷酸序列。49.seqidno:66-78是示例性野生型黑芥子酶基因组序列(cdna)。50.seqidno:79-92是示例性野生型黑芥子酶编码序列(cds)。51.seqidno:93-105是示例性野生型黑芥子酶多肽。52.seqidno:106-112是靶向黑芥子酶基因的示例性crispr引导物。53.seqidno:113是示例性野生型cyp79f1基因组序列(cdna)。54.seqidno:114是示例性野生型cyp79f1编码序列(cds)。55.seqidno:115是示例性野生型cyp79f1多肽。56.seqidno:116-117是靶向cyp79f1基因的示例性crispr引导物。57.seqidno:118-122是示例性野生型aop2基因组序列(cdna)。58.seqidno:123-127是示例性野生型aop2编码序列(cds)。59.seqidno:128-132是示例性野生型aop2多肽。60.seqidno:133-140是靶向aop2基因的示例性crispr引导物。61.seqidno:141-599是黑芥子酶多核苷酸序列的示例性编辑区域。62.seqidno:600-616是aop2多核苷酸序列的示例性编辑区域。63.seqidno:617-658是示例性野生型黑芥子酶多肽序列。64.seqidno:659-673是示例性野生型aop2多肽序列。65.seqidno:674-679是示例性野生型cyp79f1多肽序列。66.seqidno:680-721是示例性野生型黑芥子酶多核苷酸序列(cdna)。67.seqidno:722-736是示例性野生型aop2多核苷酸序列(cdna)。68.seqidno:737-742是示例性野生型cyp79f1多核苷酸序列(cdna)。69.seqidno:743-775是示例性黑芥子酶直向同源物。70.seqidno:776-781是示例性aop2直向同源物。71.seqidno:782-787是示例性cyp79f1直向同源物。72.seqidno:788-799是cyp79f1多核苷酸序列的示例性编辑区域。73.seqidno:800-816是aop2多核苷酸序列的示例性编辑区域。附图说明74.图1提供了来自芥菜的带有对齐的示例性引导物的十三个示例性黑芥子酶基因。75.图2提供了来自芥菜的带有示例性对齐的引导物的示例性黑芥子酶基因。76.图3提供了来自芥菜的带有对齐的示例性引导物的五个示例性aop2基因。77.图4提供了来自芥菜的带有对齐的示例性引导物的示例性aop2基因。78.图5提供了来自芥菜的带有对齐的示例性引导物的示例性cyp79f1基因。79.图6说明通过黑芥子酶的硫代葡萄糖苷代谢和硫代葡萄糖苷n-硫酸氢盐的产生。80.图7提供了通过黑芥子酶敲除降低植物中的刺激性的示例性策略的卡通图。如图所示,终产物可用作黑芥子酶活性降低和刺激性降低的量度。81.图8说明通过检测葡萄糖来比色检测黑芥子酶活性。通过评估各种葡萄糖浓度的标准曲线来制备葡萄糖检测范围。将天然含有黑芥子酶/硫代葡萄糖苷反应系统(芥菜)的叶材料(芥菜)与缺乏反应能力的叶材料(大豆)进行比较。82.图9显示了11个编辑的黑芥子酶基因相对参考野生型基因的葡萄糖释放测定吸光度(平均值和平均值的标准误差)(sem))。83.图10以不同的格式提供与图9相同的信息。84.详细描述85.最近的育种工作集中在开发用于生物燃料(例如乙醇、生物柴油、生物喷气燃料)、生物工业用途(例如生物塑料、润滑剂)和特种脂肪酸(例如芥酸)的新油籽原料作物。它作为饲料添加剂的局限性在于其相对较高的硫代葡萄糖苷含量。因此,已经培育出低硫代葡萄糖苷水平的芸苔属植物,例如埃塞俄比亚芥(brassicacarinata)、欧洲油菜(brassicanapus)、芜菁(brassicarapa)和芥菜(brassicajuncea),用于生产油籽和饲料粉(用于动物消费)。使用传统的植物育种方法和/或基因工程技术(例如t-dna插入和rnai),大多数努力都集中在培育用于油籽生产和饲料(用于动物和牲畜)的低硫代葡萄糖苷品种。然而,这些努力并非旨在促进用于人类消费的新鲜绿叶蔬菜。86.本公开内容提供了一种用于生产芥菜植物(即十字花科植物)的方法,该芥菜植物保持良好的营养价值并施加较少刺激性和/或苦味和/或气味特征以促进例如新鲜绿叶蔬菜的人类消费。尤其是,本公开内容教导了防止上文所述的“芥菜弹”反应,这使刺激性最小化。本公开内容提供了生产产生所需性状例如减少的刺激性和/或减少的苦味的基因编辑的芥菜植物的技术方案。此外,本公开内容提供了与植物细胞的修饰相关的组合物、方法和产品,以通过解除本文教导的芥菜弹反应来减少刺激性和/或苦味并诱导令人愉悦的风味和/或气味,以努力促进新鲜超级蔬菜的消费,从而导致从新鲜农产品中获得营养价值。87.现在将在下文中参考附图和实施例来描述本发明,其中示出了本发明的实施方案。该描述并非旨在成为可以实施本发明的所有不同方式或可以添加到本发明的所有特征的详细目录。例如,关于一个实施方案举例说明的特征可以并入其他实施方案中,并且关于特定实施方案举例说明的特征可以从该实施方案中删除。因此,本发明设想在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征组合。此外,根据本公开内容,对本文提出的各种实施方案的许多变化和添加对于本领域技术人员来说将是明显的,它们不脱离本发明。因此,以下描述旨在举例说明本发明的一些特定实施方案,而不是详尽地指定其所有排列、组合和变化。88.除非另有定义,本文使用的所有技术和科学术语与本发明所属领域的普通技术人员通常理解的含义相同。在本文的本发明的描述中使用的术语仅用于描述特定实施方案的目的,并不旨在限制本发明。89.本文引用的所有出版物、专利申请、专利和其他参考文献关于与在其中呈现参考文献的句子和/或段落相关的教导通过引用整体并入。90.除非上下文另有说明,否则本文所述的本发明的各种特征特别旨在可以以任何组合形式使用。此外,本发明还设想在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征组合。为了举例说明,如果说明书声明组合物包含组分a、b和c,则特别意在a、b或c中的任何一个或其组合可以单独或以任何组合被省略和丢弃。91.术语“一个”或“一种”是指该实体的一个或多个,即,可以指复数所指对象。因此,术语“一个”或“一种”、“一个或多个”和“至少一个”在本文中可互换使用。此外,不定冠词“一个”或“一种”对“元素”的引用并不排除存在多个元素的可能性,除非上下文明确要求存在一个且只有一个元素。92.如在本说明书中使用的,除非另有说明,否则在本公开内容中使用的术语“和/或”表示“和”或“或”,并且包括一个或多个相关列出的项目的任何和所有可能的组合,以及在替代(“或”)中解释时组合的缺乏。93.如本文所用,术语“包括”、“包含”和“含有”指定了所述特征、整数、步骤、操作、元素和/或组件的存在,但不排除一种或多种其他特征、整数、步骤、操作、元素、组件和/或它们的组的存在或添加。94.如本文所用,过渡短语“基本上由……组成”是指权利要求的范围应解释为包括权利要求中列举的具体材料或步骤,以及那些不实质影响要求保护的本发明的基本和新颖特征的材料或步骤。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”并不旨在解释为等同于“包括”。95.如在本技术中使用的,术语“约”和“大约”被用作等同物。本技术中使用的带有或不带有约/大约的任何数字意在覆盖相关领域的普通技术人员理解的任何正常波动。在某些实施方案中,术语“约”或“大约”是指落在规定参考值的任一方向(大于或小于)上的10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小之内的值的范围,除非另有说明或从上下文中明显看出(除了该数字超过可能值的100%)。因此,如本文所用的术语“约”在提及可测量值诸如量或浓度时,意在涵盖规定值的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化以及规定值。例如,其中x是可测量的值的“约x”意在包括x以及x的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。此处提供的可测量值的范围可以包括任何其他范围和/或其中的个体值。96.如本文所用,诸如“在x和y之间”和“在约x和y之间”的短语应当被解释为包括x和y。如在本文中使用的,诸如“约x和y之间”的短语意指“约x和约y之间”并且诸如“从约x到y”的短语意指“从约x到约y”。97.除非在本文中另有说明,否则本文中数值范围的列举仅旨在用作单独引用落入该范围内的每个单独值的速记方法,并且每个单独的值被并入说明书中,就好像它在本文中单独列举一样。例如,如果公开了范围10到15,则还公开了11、12、13和14。98.如本文所用,术语“增加”、“增加的”、“增加了”、“增强”、“增强的”、“增强了”和“增强”(及其语法变体)描述了与对照相比至少约5%、10%、15%、20%、25%、50%、75%、100%、150%、200%、300%、400%、500%或更多的升高。99.如本文所用,术语“降低”、“降低的”、“降低了”、“减少”、“减小”和“减轻”(及其语法变体)描述例如与对照相比至少约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的降低。在特定实施方案中,降低可导致没有或基本上没有(即,微不足道的量,例如,小于约10%或甚至5%)可检测的活性或量。例如,在编码如本文所述的参与硫代葡萄糖苷代谢(生物合成或分解代谢(例如,硫代葡萄糖苷分解))的酶(例如,黑芥子酶、aop2和/或cyp79f1)的基因中包含突变的植物可以表现出降低的刺激性和/或降低的苦味,其与在相同环境条件下生长的植物相比降低。100.如本文所用,关于核酸分子和/或核苷酸序列(例如,rna或dna)的术语“表达”、“表达的”、“表达了”或“表达”等表示核酸分子和/或核苷酸序列被转录和任选地被翻译。因此,核酸分子和/或核苷酸序列可以表达感兴趣的多肽或例如功能性非翻译rna。101.术语“基因工程化的宿主细胞”、“重组宿主细胞”和“重组菌株”在本文中可互换使用,是指已经通过本公开内容的方法进行基因工程化的宿主细胞。因此,这些术语包括已经被遗传改变、修饰或工程化的宿主细胞(例如,细菌、酵母细胞、真菌细胞、cho、人类细胞、植物细胞、源自植物的原生质体、愈伤组织等),使得与衍生它的天然宿主细胞相比,它表现出改变、修饰或不同的基因型和/或表型(例如,当遗传修饰影响编码核酸序列时)。应当理解,这些术语不仅指所讨论的特定重组宿主细胞,而且指这种宿主细胞的后代或潜在后代。102.术语“基因工程化”可以指对宿主细胞基因组的任何操作(例如通过核酸的插入或缺失)。103.术语“下一代植物育种”是指当今育种者可用的大量植物育种工具和方法。下一代植物育种的一个关键区别特征是育种者不再局限于依赖观察到的表型变异,以推断给定性状的潜在遗传原因。相反,下一代植物育种可包括利用分子标记和标记辅助选择(mas),这样育种者可以直接观察到感兴趣的等位基因和遗传元件从育种群体中的一种植物到另一种植物的移动,而不仅限于仅观察表型。此外,下一代植物育种方法并不局限于利用植物群体中发现的天然遗传变异。相反,使用下一代植物育种方法的育种者可以使用大量现代基因工程工具,这些工具可以有针对性地直接改变/变化/编辑植物的潜在遗传结构,以产生感兴趣的表型性状。在一些方面,用下一代植物育种方法培育的植物与以传统方式培育的植物没有区别,因为理论上可以通过任何一种方法培育最终产物植物。在特定方面,下一代植物育种方法可以产生一种植物,该植物包括:遗传修饰,其是任何大小的缺失(例如,导致截短);遗传修饰,其是单碱基对替换;遗传修饰,其是从植物的天然基因库(例如可以与感兴趣的植物杂交或繁殖的任何植物)或从植物中的核酸序列的编辑引入核酸序列,以对应于已知存在于植物的天然基因库中的序列;和所述植物的后代。104.术语“传统植物育种”是指利用植物群体中发现的天然变异作为等位基因和遗传变异的来源,这些变异赋予给定植物感兴趣的性状。传统的育种方法利用主要依赖于观察到的表型变异来推断致病等位基因关联的杂交程序。也就是说,传统的植物育种依赖于观察给定植物的表达表型来推断潜在的遗传原因。这些观察结果用于为育种程序提供信息,以便将等位基因变异转移到感兴趣的种质中。此外,传统植物育种的特征还包括随机诱变技术,可用于将遗传变异引入给定种质。这些随机诱变技术可以包括化学和/或辐射为基础的诱变程序。因此,传统植物育种的一个关键特征是育种者不使用基因工程工具针对性地直接改变/变化/编辑植物的潜在遗传结构,以引入遗传多样性并产生感兴趣的表型性状。105.本文可互换使用的术语“多核苷酸”、“核酸”和“核苷酸序列”是指任何长度的核苷酸的聚合形式,核糖核苷酸或脱氧核糖核苷酸或其类似物。该术语是指分子的一级结构,因此包括双链和单链dna,以及双链和单链rna。该术语包括但不限于单链、双链或多链dna或rna、基因组dna、cdna、dna-rna杂合体或包含嘌呤和嘧啶碱基或其他天然、化学或生化修饰、非-天然或衍生的核苷酸碱基的聚合物。它还包括修饰的核酸例如甲基化和/或加帽的核酸、含有修饰碱基、主链修饰的核酸等。“寡核苷酸”通常是指单链或双链dna的约5至约100个核苷酸的多核苷酸。然而,为了本公开内容的目的,寡核苷酸的长度没有上限。寡核苷酸也称为“寡聚体”或“低聚核苷酸”,并且可以从基因中分离,或通过本领域已知的方法化学合成。如适用于所描述的实施方案,术语“多核苷酸”、“核酸”和“核苷酸序列”应理解为包assistedselectioninbackcrossbreeding,inproceedingsofthesymposium"analysisofmolecularmarkerdata,"pp.41-43(1994)。最初的杂交产生了f1代。术语“bc1”是指回交亲本的第二次使用,“bc2”是指回交亲本的第三次使用,依此类推。119.如本文所用,术语“杂交”或“杂交的”是指配子通过授粉融合以产生后代(例如,细胞、种子或植物)。该术语包括有性杂交(一种植物由另一种植物授粉)和自交(自花授粉,例如,当花粉和胚珠来自同一植物时)。术语“杂交”是指通过授粉融合配子以产生后代的行为。120.如本文所用,术语“基因渗入”、“基因渐渗”和“基因渗入的”是指遗传基因座的所需等位基因或所需等位基因组合从一种遗传背景到另一种遗传背景的天然和人工传递。例如,可以通过同一物种的两个亲本之间的有性杂交将特定基因座处的所需等位基因传递给至少一个后代,其中至少一个亲本在其基因组中具有所需等位基因。或者,例如,等位基因的传递可以通过两个供体基因组之间的重组发生,例如在融合的原生质体中,其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需等位基因可以是标记、qtl、转基因等的选定等位基因。包含所需等位基因的后代可以与具有所需遗传背景的品系回交一次或多次(例如,1、2、3、4或更多次),选择所需等位基因,结果是所需等位基因固定在所需的遗传背景中。例如,与在非水胁迫条件下增加的产生相关的标记可以从供体渗入到不包含该标记并且在非水胁迫条件下不表现出增加的产生的回交亲本中。然后可以将所得后代回交一次或多次并进行选择,直到后代具有回交亲本背景中的与非水胁迫条件下的产生增加相关的遗传标记。[0121]“遗传图谱”是对给定物种内一条或多条染色体上基因座之间遗传连锁关系的描述,通常以图解或表格形式描绘。对于每个遗传图谱,基因座之间的距离通过它们之间的重组频率来衡量。可以使用多种标记检测基因座之间的重组。遗传图谱是对群体、使用的标记类型以及不同群体之间每个标记的多态性潜力作图的产物。基因座之间的顺序和遗传距离可以从一个遗传图谱到另一个遗传图谱不同。[0122]如本文所用,术语“基因型”是指个体(或个体群体)在一个或多个遗传基因座处的遗传构成,与可观察和/或可检测和/或表现的性状(表型)形成对比。基因型由个体从其亲本继承的一个或多个已知基因座的等位基因定义。术语基因型可用于指个体在单个基因座、多个基因座处的遗传构成,或更一般地,术语基因型可用于指个体基因组中所有基因的遗传构成。基因型可以间接表征,例如使用标记,和/或通过核酸测序直接表征。[0123]如本文所用,术语“种质”是指来自或来源于个体(例如植物)、个体群体(例如植物品系、品种或科)的遗传物质,或源自品系、品种、物种或培养物的克隆。种质可以是生物体或细胞的一部分,或者可以与生物体或细胞分离。一般来说,种质提供了具有特定的遗传组成的遗传物质,其为生物体或细胞培养物的部分或全部遗传特性提供了基础。如本文所用,种质包括可从其生长新植物的细胞、种子或组织,以及可培养成整株植物的植物部分(例如,叶、茎、芽、根、花粉、细胞等)。.[0124]如本文所用,术语“栽培品种”和“品种”是指通过结构或遗传特征和/或性能可与同一物种内的其他品种区分开来的一组相似植物。[0125]如本文所用,术语“外来的”、“外来品系”和“外来种质”是指非优良的任何植物、品系或种质。一般而言,外来植物/种质不源自任何已知的优良植物或种质,而是被选择以将一种或多种所需遗传元件引入育种程序中(例如,将新等位基因引入育种程序中)。[0126]如本文所用,植物育种上下文中的术语“杂种”是指作为通过杂交不同品系或品种或物种的植物(包括但不限于两个近交系之间的杂交)产生的遗传不同亲本的后代的植物。[0127]如本文所用,术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上是纯合的或者就特别感兴趣的基因组的一部分而言基本上是纯合的植物或植物品种。[0128]在一些实施方案中,“部分”可以编码用于产生所需表型(例如,与未进行编辑并在相同环境条件下生长的植物相比,减少的刺激性和/或减少的苦味)的靶区域。因此,关于核酸,术语“片段”或“部分”是指相对于参考核酸的相应部分长度减少(例如减少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、400、450、500、550、600、650、660、670、680、690或700个或更多个核苷酸或其中的任何范围或值)和包括、基本上由和/或由与参考核酸的相应部分相同或几乎相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)的连续核苷酸的核苷酸序列组成的核酸。在适当的情况下,这样的核酸片段可以包含在更大的多核苷酸中,该核酸片段是该多核苷酸的组成部分。例如,本发明的引导核酸的重复序列可以包含野生型crispr-cas重复序列(例如,野生型crisr-cas重复;例如,来自例如cas9、cas12a(cpf1)、cas12b、cas12c(c2c3)、cas12d(casy)、cas12e(casx)、cas12g、cas12h、cas12i、c2c4、c2c5、c2c8、c2c9、c2c10、cas14a、cas14b和/或cas14c等的crisprcas系统的重复)的“部分”。在一些实施方案中,核酸片段可包含、基本上由以下组成或由以下组成:编码黑芥子酶核酸、aop2核酸和/或cyp79f1核酸的核酸的约5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400、450、500、550、600、或650、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2250、2300、2350、2400、2450、2500、2550、2600、2650、2700、2750、2800、2900、3000、3500、4000、4500、5000、5500或更多个连续核苷酸或其中的任何范围或值。[0129]在一些实施方案中,黑芥子酶基因(即,葡糖苷酶、硫葡糖苷酶(例如,β-硫葡糖苷酶)、硫代葡萄糖苷葡糖水解酶;ec3.2.1.147(ec3.2.3.1转移到3.2.1.147))、aop2基因(即,2-氧代酸依赖性双加氧酶;ec1.14.11.m8)和/或cyp79f1基因(即,细胞色素p450单加氧酶,高甲硫氨酸n-单加氧酶;ec1.14.14.42)的核酸片段可能是从编码黑芥子酶蛋白、aop2蛋白或cyp79f1蛋白的基因的3'端、5'端和/或从内部的核苷酸的缺失的结果。在一些实施方案中,编码黑芥子酶蛋白、aop2蛋白或cyp79f1蛋白的基因的一部分的缺失可以包括从黑芥子酶基因、aop2基因或cyp79f1基因的5'端、3'端、从内部或从5'端直到3'端的末端的连续核苷酸的一部分的缺失。在一些实施方案中,编码黑芥子酶蛋白的基因、编码aop2蛋白的基因或编码cyp79f1蛋白的基因的一部分的缺失可以包括从黑芥子酶基因、aop2基因或cyp79f1基因的5'端、3'端、从内部或从5'端直到3'端的末端的至少2个连续核苷酸的部分的缺失。在一些实施方案中,基因的一部分的缺失可以是从基因的5'末端缺失并延伸到基因的3'末端(任选地延伸到基因或编码序列的末端)的连续核苷酸的一部分。在一些实施方案中,编码黑芥子酶蛋白、aop2蛋白或cyp79f1蛋白的基因的一部分的缺失可以包括至少3个连续核苷酸的部分直至整个基因的缺失。在一些实施方案中,编码黑芥子酶蛋白的基因、编码aop2蛋白的基因或编码cyp79f1蛋白的基因的一部分的缺失可能导致不产生蛋白质或可能导致产生非功能性蛋白质(例如,肽)。[0130]在一些实施方案中,黑芥子酶基因的一部分的缺失可包括从与seqidno:66-92或680-721中任一项的核苷酸序列具有至少80%序列同一性的核苷酸序列的如本文所述的连续核苷酸的一部分的缺失。在一些实施方案中,aop2基因的一部分的缺失可以包括从与seqidno:118-127或722-736中任一项的核苷酸序列具有至少80%序列同一性的核苷酸序列的如本文所述的连续核苷酸的一部分的缺失。在一些实施方案中,cyp79f1基因的一部分的缺失可包括从与seqidno:113、114或737-742中任一项的核苷酸序列具有至少80%序列同一性的核苷酸序列的如本文所述的连续核苷酸的一部分的缺失。在一些实施方案中,从与seqidno:66-92或668-721、seqidno:118-127或722-736或seqidno:113、114或737-742中任一项的核苷酸序列具有至少80%序列同一性的核苷酸序列的核苷酸的一部分的缺失可导致编码蛋白质的截短和不产生蛋白质或产生非功能性蛋白质。[0131]在一些实施方案中,黑芥子酶基因(即,葡糖苷酶、硫代葡糖苷酶(例如,β-硫葡糖苷酶)、硫代葡萄糖苷葡糖水解酶;ec3.2.1.147(ec3.2.3.1转移至3.2.1.147))、aop2基因(即,2-氧代酸依赖性双加氧酶;ec1.14.11.m8)和/或cyp79f1基因(即,细胞色素p450单加氧酶、高甲硫氨酸n-单加氧酶;ec1.14.14.42)基因中的这样的缺失可能导致无效等位基因,当包含在植物中时,与不包含编辑并在相同环境条件下生长的植物相比,其可导致降低的刺激性和/或降低的苦味的表型。在一些实施方案中,这样的缺失可以是显性抑制等位基因、半显性等位基因、弱功能丧失等位基因、无效等位基因或亚等位基因突变,其当包含在植物中时可导致降低的刺激性和/或降低的苦味的表型。[0132]类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,直至全长多肽。待使用或删除的部分的长度将取决于特定的应用。用作表位的多肽的一部分可以短至4个氨基酸。发挥全长多肽功能的多肽的一部分通常长于4个氨基酸。在一些实施方案中,多肽或多核苷酸的片段包含参考多肽或多核苷酸全长的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%或99%。[0133]此外,关于多肽,术语“片段”或“部分”可以指相对于参考多肽长度减少并且包含、基本上由和/或由与参考多肽的相应部分相同或几乎相同(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续氨基酸的氨基酸序列组成的多肽。在适当的情况下,这样的多肽片段可以包含在它是其组成部分的更大的多肽中。[0134]在一些实施方案中,多肽片段包含、基本上由或由参考多肽的至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400或更多个连续氨基酸组成。在一些实施方案中,黑芥子酶多肽、aop2多肽和/或cyp79f1多肽的长度可以减少约5、6、7、8、9、10、11、12、13、14、15、20、25,30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、115、120、125、130、135、140、145、150、155、160、165、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、500、510、520、530或540个或更多个连续氨基酸残基(或其中的任何范围或值)。在一些实施方案中,黑芥子酶多肽、aop2多肽和/或cyp79f1多肽的长度可以减少到使得其不能被检测到(例如,不存在)或者剩余部分是非功能性的。在一些实施方案中,如本文所述的具有减少的长度的这种多肽可以是显性抑制等位基因、半显性等位基因、弱功能丧失等位基因、无效等位基因或亚等位基因突变,其当包含在植物中时导致在与不包含突变并在相同环境条件下生长的植物相比表现出降低的刺激性和/或降低的苦味的植物。[0135]在一些实施方案中,与seqidno:93-105、115、128-132、617-679或743-786的氨基酸序列中的任一个具有至少80%序列同一性的多肽的长度可减少约5至约540个或更多个连续氨基酸残基(或其中的任何范围或值)直至多肽的全长。在一些实施方案中,多肽的长度可以减少到使得它不能被检测到(例如,不存在)或者剩余的部分是非功能性的。[0136]在一些实施方案中,“部分”可以与从多肽中缺失的氨基酸数量相关。因此,例如,诸如黑芥子酶多肽(即,葡糖苷酶、硫葡糖苷酶(例如,β-硫葡糖苷酶)、硫代葡萄糖苷葡糖水解酶;ec3.2.1.147(ec3.2.3.1转移至3.2.1.147))、aop2多肽(即,2-氧代酸依赖性双加氧酶;ec1.14.11.m8)和/或cyp79f1多肽(即,细胞色素p450单加氧酶、高甲硫氨酸n-单加氧酶;ec1.14.14.42)的缺失的“部分”可以包含至少一个氨基酸残基(例如,至少1,或至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、115、120、125、130、135、140、145、150、155、160、165、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、500、510、520、530、或540或更多个连续氨基酸残基(或其中的任何范围或值)。在一些实施方案中,可以从与seqidno:93-105、115、128-132、617-679或743-786中的任一个具有至少80%序列同一性的多肽中删除氨基酸的一部分。在一些实施方案中,黑芥子酶多肽、aop2多肽和/或cyp79f1多肽的一部分的缺失可以包括从与seqidno:93-105、115、128-132、617-679或743-786中的任一个具有至少80%序列同一性的多肽的n-或c-末端、该多肽内或从该多肽的n端直至c端的末端的连续氨基酸残基的一部分的缺失。在一些实施方案中,这样的缺失可以是显性抑制等位基因、半显性等位基因、弱功能丧失等位基因、无效等位基因或亚等位基因突变,当包含在植物中时,与不包含突变并在相同环境条件下生长的植物相比,植物表现出降低的刺激性和/或降低的苦味。在一些实施方案中,这样的缺失是无效等位基因,当包含在植物中时,与不包含突变并在相同环境条件下生长的植物相比,植物表现出降低的刺激性和/或降低的苦味。[0137]如本文所用,术语“基因”是指与生物学功能相关的任何dna片段。因此,基因包括但不限于编码序列和/或它们的表达所需的调节序列。基因也可以包括非表达的dna片段,其例如形成其他蛋白质的识别序列。基因可以从多种来源获得,包括从感兴趣的来源克隆或从已知或预测的序列信息合成,并且可以包括设计成具有所需参数的序列。[0138]如本文所用,术语“内源性”或“内源性基因”是指天然存在的基因,处于其在宿主细胞基因组中天然存在的位置。如本文所述的内源基因可以包括已经根据本公开内容的任何方法突变的天然存在的基因的等位基因,即,内源基因可以先前已经通过传统植物育种方法和/或下一代植物育种方法进行修饰。[0139]如本文所用,术语“外源”是指来自不同于其天然来源或位置的某种来源的物质。例如,术语“外源性蛋白质”或“外源性基因”或“外源性核酸”是指来自非天然来源的蛋白质或核酸,并且其已被人工提供给生物系统。[0140]“异源”或“重组”核苷酸序列是与其引入的宿主细胞不天然相关的核苷酸序列,包括天然存在的核苷酸序列的非天然存在的多个拷贝。在一些实施方案中,术语“外源的”与术语“异源的”可互换使用。在一些实施方案中,术语“异源核酸”是指非天然存在于特定生物体中的核酸序列。例如,术语“异源启动子”可以指已经从一种来源生物中获取并在其中该启动子不是天然存在的另一种生物中使用的启动子。然而,术语“异源启动子”也可以指来自同一来源生物体但已被移动到其中所述启动子通常不位于其中的新位置的启动子。[0141]可以通过使用“表达载体”将异源基因序列引入靶细胞,该“表达载体”可以是真核表达载体,例如植物表达载体。用于构建载体的方法为本领域技术人员所熟知并在各种出版物中有所描述。特别地,在现有技术中综述了用于构建合适载体的技术,包括对功能组件诸如启动子、增强子、终止和多聚腺苷酸化信号、选择标记、复制起点和剪接信号的描述。[0142]如本文所用,术语“同源的”或“同源物”或“直向同源物”是本领域已知的并且是指共有共同祖先或家族成员并基于序列同一性程度确定的相关序列。当同源序列被推断遗传自由物种形成事件分开的同一祖先序列时,它们是直向同源的:当一个物种分化为两个独立的物种时,两个所得物种中的单个基因的拷贝被称为直向同源的。“直向同源物”或“直向同源基因”是通过纵向血统起源于最后一个共同祖先的单个基因的不同物种中的基因。术语“同源”、“同源性”、“基本相似”和“基本对应”在本文中可互换使用。它们是指核酸片段,其中一个或多个核苷酸碱基的变化不影响核酸片段介导基因表达或产生某种表型的能力。这些术语还指本公开内容的核酸片段的修饰,例如一个或多个核苷酸的缺失或插入,其相对于初始的未修饰片段基本上不改变所得核酸片段的功能特性。因此,如本领域技术人员将理解的,应当理解,本公开内容不仅仅包括具体的示例性序列。这些术语描述了在一个物种、亚种、品种、栽培品种或品系中发现的基因与在另一物种、亚种、品种、栽培品种或品系中的相应或等效基因之间的关系。为了本公开内容的目的,比较同源序列。“同源序列”或“同源物”或“直向同源物”被认为、相信或已知在功能上相关。功能关系可以以多种方式中的任一种来表示,包括但不限于:(a)序列同一性程度和/或(b)相同或相似的生物学功能。优选地,指示(a)和(b)两者。可以使用本领域容易获得的软件程序确定同源性,例如currentprotocolsinmolecularbiology(f.m.ausubel等人,eds.,1987)supplement30,section7.718,table7.71中讨论的那些。一些比对程序是macvector(oxfordmolecularltd,oxford,u.k.)、alignplus(scientificandeducationalsoftware,pennsylvania)和alignx(vectornti,invitrogen,carlsbad,ca)。另一个比对程序是使用默认参数的sequencher(genecodes,annarbor,michigan)和muscle(multiplesequencecomparisonbylog-expection;作为公共领域许可的计算机软件)。[0143]如本文所用,术语“多核苷酸修饰”是指例如碱基取代、缺失和/或插入,如本领域所熟知的。如本文所用,术语“蛋白质修饰”是指例如本领域熟知的氨基酸修饰、氨基酸取代、缺失和/或插入。[0144]如本文所用,术语“密码子优化”是指dna或rna的密码子使用,其经调整以适应于感兴趣的细胞或生物体的密码子使用以提高所述重组核酸在感兴趣的细胞或生物体中的转录率。本领域技术人员非常清楚,由于密码子简并性,靶核酸可以在一个位置被修饰,而这种修饰在翻译后仍会导致该位置的相同氨基酸序列,这是通过密码子优化以考虑到靶细胞或生物体的物种特异性密码子使用来实现的。在一些实施方案中,本发明的编辑系统(例如,包含/编码序列特异性dna结合结构域(例如,来自多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应核酸酶(talen)、argonaute蛋白和/或crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)(例如,i型crispr-cas效应蛋白、ii型crispr-cas效应蛋白、iii型crispr-cas效应蛋白、iv型crispr-cas效应蛋白、v型crispr-cas效应蛋白或vi型crispr-cas效应蛋白)的序列特异性dna结合结构域)、核酸酶(例如,核酸内切酶(例如,fok1)、多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(talen))、脱氨酶蛋白质/结构域(例如,腺嘌呤脱氨酶、胞嘧啶脱氨酶)、编码逆转录酶蛋白质或结构域的多核苷酸、编码5'-3'核酸外切酶多肽的多核苷酸和/或亲和多肽、肽标签等)的多核苷酸、核酸构建体、表达盒和/或载体可以经密码子优化以用于在植物中表达。在一些实施方案中,本发明的密码子优化的核酸、多核苷酸、表达盒和/或载体与没有经过密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70%至约99.9%(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)的同一性或更高。[0145]如本文所用,如应用于核酸、多肽、细胞或生物体的术语“天然存在的”是指在自然界中发现的核酸、多肽、细胞或生物体。术语“天然存在的”可以指源自天然存在的来源的基因、多核苷酸或多肽。因此,为了本公开内容的目的,“非天然”或“非天然存在的”序列是已被合成、突变、工程化、编辑或以其他方式修饰以具有与已知天然序列不同的序列的序列。在一些实施方案中,修饰可以在蛋白质水平(例如氨基酸修饰,例如取代、缺失或添加/插入)。在其他实施方案中,修饰可以在dna水平(例如核苷酸或碱基修饰,例如取代、缺失或插入)。“非天然的”是指在自然界中不存在(例如,非天然突变)或不以所描述的特定组合存在于自然界中的核酸、多肽、细胞或生物体。[0146]术语“突变”是指点突变(例如,错义或无义,或导致移码的单个碱基对的插入或缺失)、插入、缺失和/或截短。当突变是氨基酸序列中的一个残基被另一个残基取代,或者是序列中一个或多个残基的缺失或插入时,突变通常通过识别原始残基,然后是该残基在序列中的位置以及新取代的残基的身份来描述。截短可以包括在多肽的c-末端或在多肽的n-末端的截短,或者可以是从n-末端延伸到c-末端的截短。多肽的截短可以是编码多肽的基因的相应5'端或3'端缺失的结果,或者可以是编码多肽的基因的5'端到3'端的大部分或全部的缺失。在一些实施方案中,黑芥子酶基因、aop2基因和/或cyp79f1基因的截短可以是导致框内突变或框外突变的突变,例如碱基缺失、添加或替换。在一些实施方案中,黑芥子酶基因、aop2基因和/或cyp79f1基因的截短可以是导致过早终止密码子的突变,从而产生编码多肽的截短。[0147]如本文所用,短语“重组构建体”、“表达构建体”、“嵌合构建体”、“异源构建体”和“重组dna构建体”在本文中可互换使用。重组构建体包含核酸片段(例如自然界中不一起发现的调节和编码序列)的人工组合。例如,嵌合构建体可包含源自不同来源的调节序列和编码序列,或源自相同来源但以不同于自然界中发现的方式排列的调节序列和编码序列。这样的构建体可以单独使用或者可以与载体结合使用。如果使用载体,那么载体的选择取决于将用于转化宿主细胞的方法,如本领域技术人员所熟知的。例如,可以使用质粒载体。本领域技术人员非常了解必须存在于载体上以便成功地转化、选择和繁殖包含本公开内容的任何分离的核酸片段的宿主细胞的遗传元件。本领域技术人员还将认识到不同的独立转化事件将导致不同的表达水平和模式(jones等人,(1985)emboj.4:2411-2418;dealmeida等人,(1989)mol.gen.genetics218:78-86),因此必须筛选多个事件以获得显示所需表达水平和模式的品系。这种筛选可以通过dna的southern分析、mrna表达的northern分析、蛋白质表达的免疫印迹分析或表型分析等来完成。载体可以是质粒、病毒、噬菌体、前病毒、噬菌粒、转座子、人工染色体等,它们自主复制或可以整合到宿主细胞的染色体中。载体还可以是裸rna多核苷酸、裸dna多核苷酸、由同一链内的dna和rna组成的多核苷酸、多赖氨酸缀合的dna或rna、肽缀合的dna或rna、脂质体缀合的dna或类似物,其是非自主复制的。如本文所用,术语“表达”是指功能性终产物例如mrna或蛋白质(前体或成熟)的产生。[0148]在本文所述的任何实施方案中,本发明的多核苷酸或核酸构建体可以与多种启动子和/或其他调节元件可操作地关联以在植物和/或植物细胞中表达。因此,在一些实施方案中,本发明的多核苷酸或核酸构建体可以进一步包含与一种或多种核苷酸序列可操作地连接的一种或多种启动子、内含子、增强子和/或终止子。在一些实施方案中,启动子可以与内含子(例如,ubi1启动子和内含子)可操作地关联。在一些实施方案中,与内含子关联的启动子可以称为“启动子区域”(例如,ubi1启动子和内含子)。[0149]如本文所用,关于多核苷酸的“可操作地连接”或“可操作地关联”是指所示元件在功能上彼此相关,并且通常也是物理相关的。因此,如本文所用,术语“可操作地连接”或“可操作地关联”是指单个核酸分子上核苷酸序列起功能地关联。因此,与第二核苷酸序列可操作地连接的第一核苷酸序列是指当第一核苷酸序列与第二核苷酸序列处于功能关系时的情况。例如,如果启动子影响所述核苷酸序列的转录或表达,则启动子与核苷酸序列可操作地关联。本领域技术人员将理解,控制序列(例如,启动子)不需要与其可操作地连接的核苷酸序列连续,只要控制序列的功能是指导其表达即可。因此,例如,插入的非翻译但转录的核酸序列可以存在于启动子和核苷酸序列之间,并且启动子仍然可以被认为“可操作地连接”到核苷酸序列。[0150]如本文所用,关于多肽的术语“连接”是指一种多肽与另一种多肽的连接。多肽可以直接(例如,通过肽键)或通过接头与另一多肽(在n-末端或c-末端)连接。[0151]术语“接头”是本领域公认的并且是指化学基团,或连接两个分子或部分(例如融合蛋白的两个结构域)的分子,例如dna结合多肽或结构域和肽标签和/或逆转录酶和亲和多肽(与肽标签结合);或dna核酸内切酶多肽或结构域和肽标签和/或逆转录酶和亲和多肽(与肽标签结合)。接头可以由单个连接分子组成或可以包含多于一个连接分子。在一些实施方案中,接头可以是有机分子、基团、聚合物或化学部分,例如二价有机部分。在一些实施方案中,接头可以是氨基酸或者它可以是肽。在一些实施方案中,接头是肽。[0152]在一些实施方案中,可用于本发明的肽接头长度可为约2至约100个或更多个氨基酸,例如约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、403:132-142(2007)),pdca1由盐诱导(li等人molbiol.rep.37:1143-1154(2010))。在一些实施方案中,可用于本发明的启动子是rna聚合酶ii(polii)启动子。在一些实施方案中,来自玉米的u6启动子或7sl启动子可用于本发明的构建体。在一些实施方案中,来自玉米的u6c启动子和/或7sl启动子可用于驱动引导核酸的表达。在一些实施方案中,来自大豆的u6c启动子、u6i启动子和/或7sl启动子可用于本发明的构建体。在一些实施方案中,来自大豆的u6c启动子、u6i启动子和/或7sl启动子可用于驱动引导核酸的表达。[0158]可用于植物的组成型启动子的实例包括但不限于:cestrum病毒启动子(cmp)(美国专利号7,166,770)、水稻肌动蛋白1启动子(wang等人(1992)mol.cell.biol.12:3399-3406;以及美国专利号5,641,876)、camv35s启动子(odell等人(1985)nature313:810-812)、camv19s启动子(lawton等人(1987)plantmol.biol.9:315-324)、nos启动子(ebert等人(1987)proc.natl.acad.sciusa84:5745-5749)、adh启动子(walker等人(1987)proc.natl.acad.sci.usa84:6624-6629)、蔗糖合酶启动子(yang&russell(1990)proc.natl.acad.sci.usa87:4144-4148)和泛素启动子。源自泛素的组成型启动子在许多细胞类型中积累。泛素启动子已经从几种植物物种(例如向日葵(binet等人,1991.plantscience79:87-94)、玉米(christensen等人,1989.plantmolec.biol.12:619-632)和拟南芥(norris等人1993.plantmolec.biol.21:895-906))中克隆出来用于转基因植物。玉米泛素启动子(ubip)已在转基因单子叶植物系统中开发,其序列和构建用于单子叶植物转化的载体在专利公开ep0342926中公开。泛素启动子适用于本发明的核苷酸序列在转基因植物,尤其是单子叶植物中的表达。此外,mcelroy等人(mol.gen.genet.231:150-160(1991))描述的启动子表达盒可以容易地被修饰以表达本发明的核苷酸序列并且特别适用于单子叶植物宿主。[0159]在一些实施方案中,组织特异性/组织优选启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或优选表达模式包括但不限于绿色组织特异性或优选、根特异性或优选、茎特异性或优选、花特异性或优选或花粉特异性或优选。适合在绿色组织中表达的启动子包括许多调节参与光合作用的基因的启动子,其中许多已从单子叶植物和双子叶植物中克隆。在一个实施方案中,可用于本发明的启动子是来自磷酸烯醇羧化酶(phosphoenolcarboxylase)基因的玉米pepc启动子(hudspeth&grula,plantmolec.biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括与编码种子贮藏蛋白(例如β-伴大豆球蛋白、cruciferin、napin和菜豆蛋白)、玉米醇溶蛋白或油体蛋白(例如油质蛋白)或涉及脂肪酸生物合成的蛋白质(包括酰基载体蛋白、硬脂酰-acp去饱和酶和脂肪酸去饱和酶(fad2-1))的基因相关的那些启动子,以及在胚胎发育过程中表达的其他核酸(例如bce4,参见例如kridl等人(1991)seedsci.res.1:209-219;以及ep专利号255378)。可用于在植物,特别是玉米中表达本发明的核苷酸序列的组织特异性或组织优先启动子包括但不限于直接在根、髓、叶或花粉中表达的那些。此类启动子公开于例如wo93/07278中,其通过引用整体并入本文。可用于本发明的组织特异性或组织优选启动子的其他非限制性实例是美国专利6,040,504中公开的棉花rubisco启动子;美国专利5,604,121中公开的水稻蔗糖合酶启动子;deframond(febs290:103-106(1991);ciba-geigy的ep0452269)描述的根特异性启动子;在美国专利5,625,136(ciba-geigy)中描述的茎特异性启动子,其驱动玉米trpa基因的表达;wo01/73087中公开的certrum黄卷叶病毒启动子;和花粉特异性或优选启动子,包括但不限于来自水稻的prooslps10和prooslps11(nguyen等人plantbiotechnol.reports9(5):297-306(2015)),来自玉米的zmstk2_usp(wang等人genome60(6):485-495(2017))、来自番茄的lat52和lat59(twell等人development109(3):705-713(1990))、来自拟南芥的zm13(美国专利号10,421,972)、pla2-δ启动子(美国专利号7,141,424)和/或来自玉米的zmc5启动子(国际pct公开号wo1999/042587。[0160]植物组织特异性/组织优选启动子的其他例子包括但不限于根毛特异性顺式元件(rhe)(kim等人theplantcell18:2958-2970(2006))、根特异性启动子rcc3(jeong等人plantphysiol.153:185-197(2010))和rb7(美国专利号5459252),凝集素启动子(lindstrom等人(1990)der.genet.11:160-167;和vodkin(1983)prog.clin.biol.res.138:87-98),玉米醇脱氢酶1启动子(dennis等人(1984)nucleicacidsres.12:3983-4000),s-腺苷-l-甲硫氨酸合成酶(sams)(vandermijnsbrugge等人(1996)plantandcellphysiology,37(8):1108-1115),玉米光收获复合启动子(bansal等人(1992)proc.natl.acad.sci.usa89:3654-3658)、玉米热休克蛋白启动子(o'dell等人(1985)emboj.5:451-458;和rochester等人(1986)emboj.5:451-458)、豌豆小亚基rubp羧化酶启动子(cashmore,"nucleargenesencodingthesmallsubunitofribulose-l,5-bisphosphatecarboxylase"pp.29-39in:geneticengineeringofplants(hollaendered.,plenumpress1983;和poulsen等人(1986)mol.gen.genet.205:193-200),ti质粒甘露碱合酶启动子(langridge等人(1989)proc.natl.acad.sci.usa86:3219-3223),ti质粒胭脂碱合酶启动子(langridge等人(1989),同上)、矮牵牛查尔酮异构酶启动子(vantunen等人(1988)emboj.7:1257-1263)、豆甘氨酸富集蛋白1启动子(keller等人(1989)genesdev.3:1639-1646),截短的camv35s启动子(o'dell等人(1985)nature313:810-812)、马铃薯patatin启动子(wenzler等人(1989)plantmol.biol.13:347-354)、根细胞启动子(yamamoto等人(1990)nucleicacidsres.18:7449),玉米玉米醇溶蛋白启动子(kriz等人(1987)mol.gen.genet.207:90-98;langridge等人(1983)cell34:1015-1022;reina等人(1990)nucleicacidsres.18:6425;reina等人(1990)nucleicacidsres.18:7449;和wandelt等人(1989)nucleicacidsres.17:2354),球蛋白-1启动子(belanger等人(1991)genetics129:863-872)、α-微管蛋白cab启动子(sullivan等人(1989)mol.gen.genet.215:431-440)、pepcase启动子(hudspeth&grula(1989)plantmol.biol.12:579-589)、r基因复合物相关启动子(chandler等人(1989)plantcell1:1175-1183)和查耳酮合酶启动子(franken等人(1991)emboj.10:2605-2612)。[0161]可用于种子特异性表达的是豌豆球蛋白启动子(czako等人(1992)mol.gen.genet.235:33-40;以及美国专利号5,625,136中公开的种子特异性启动子。可用于在成熟叶中的表达是在衰老开始时被切换的那些,例如来自拟南芥的sag启动子(gan等人(1995)science270:1986-1988)。[0162]此外,可以使用在叶绿体中起作用的启动子。此类启动子的非限制性实例包括噬菌体t3基因95'utr和其他启动子(美国专利号7,579,516中公开)。可用于本发明的其他启动子包括但不限于s-e9小亚基rubp羧化酶启动子和kunitz胰蛋白酶抑制剂基因启动子(kti3)。[0163]可用于本发明的其他调节元件包括但不限于内含子、增强子、终止序列和/或5'和3'非翻译区。[0164]可用于本发明的内含子可以是在植物中鉴定和分离的内含子,然后插入到表达盒中以用于植物的转化。如本领域技术人员将理解的,内含子可包含自我切除所需的序列,并以符合阅读框的方式并入核酸构建体/表达盒中。内含子可用作间隔区以分隔一个核酸构建体中的多个蛋白质编码序列,或者内含子可用于一个蛋白质编码序列内以例如稳定mrna。如果它们在蛋白质编码序列中使用,它们被插入“框内”并包含切除位点。内含子也可以与启动子关联以改善或修饰表达。例如,可用于本发明的启动子/内含子组合包括但不限于玉米ubi1启动子和内含子的组合(参见例如seqidno:21和seqidno:22)。[0165]可用于本发明的内含子的非限制性实例包括来自adhi基因(例如,adh1-s内含子1、2和6)、泛素基因(ubi1)、rubisco小亚基(rbcs)基因、rubisco大亚基(rbcl)基因、肌动蛋白基因(例如,肌动蛋白-1内含子)、丙酮酸脱氢酶激酶基因(pdk)、硝酸还原酶基因(nr)、重复碳酸酐酶基因1(tdca1)、psba基因、atpa基因的内含子或其任意组合。[0166]在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”或可以包含在表达盒内。如本文所用,“表达盒”是指重组核酸分子,其包含例如一种或多种本发明的多核苷酸(例如,编码序列特异性dna结合结构域的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸,编码逆转录酶蛋白质或结构域的多核苷酸、编码5'-3'外切核酸酶多肽或结构域的多核苷酸、引导核酸和/或逆转录酶(rt)模板),其中多核苷酸与一个或多个控制序列(例如,启动子、终止子等)可操作地关联。因此,在一些实施方案中,可以提供一种或多种表达盒,其被设计为表达例如本发明的核酸构建体(例如,编码序列特异性dna结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白质/结构域的多核苷酸、编码逆转录酶蛋白质/结构域的多核苷酸、编码5'-3'外切核酸酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等,或包含引导核酸、延伸的引导核酸和/或rt模板等)。当本发明的表达盒包含多于一个多核苷酸时,多核苷酸可以与驱动所有多核苷酸表达的单个启动子可操作地连接,或者多核苷酸可以与一个或多个单独的启动子(例如三个多核苷酸可以由一个、两个或三个任意组合的启动子驱动)可操作地连接。当使用两个或更多个单独的启动子时,启动子可以是相同的启动子或者它们可以是不同的启动子。因此,编码序列特异性dna结合结构域的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码crispr-cas效应蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域(例如,rna依赖性dna聚合酶)的多核苷酸和/或编码5'-3'外切核酸酶多肽/结构域的多核苷酸、引导核酸、延伸的引导核酸和/或rt模板(当包含在单个表达盒中时可以各自可操作地连接到单个启动子),或任何组合的单独的启动子。[0167]包含本发明的核酸构建体的表达盒可以是嵌合的,这意味着它的至少一种成分相对于它的至少一种其他成分是异源的(例如,来自宿主生物的启动子可操作地连接到要在宿主生物体中表达的感兴趣的多核苷酸,其中感兴趣的多核苷酸来自与宿主不同的生物体或通常不与该启动子关联)。表达盒也可以是天然存在的但已经以可用于异源表达的重组形式获得的表达盒。[0168]表达盒可以任选地包括在所选宿主细胞中起作用的转录和/或翻译终止区(即终止区)和/或增强子区。多种转录终止子和增强子是本领域已知的并且可用于表达盒。转录终止子负责转录的终止和正确的mrna多聚腺苷酸化。终止区和/或增强子区对于转录起始区可以是天然的,对于例如编码序列特异性dna结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等可以是天然的,或者对于宿主细胞可以是天然的,或者对于另一来源(例如,对于例如启动子、对于编码序列特异性dna结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或对于宿主细胞或其任何组合来说是外来的或异源的)可以是天然的。[0169]本发明的表达盒还可包括编码可选择标记的多核苷酸,其可用于选择转化的宿主细胞。如本文所用,“可选择标记”是指多核苷酸序列,其在表达时赋予表达该标记的宿主细胞不同的表型,从而允许将此类转化的细胞与不具有该标记的细胞区分开来。这样的多核苷酸序列可以编码可选择的或可筛选的标记,这取决于标记是否赋予可以通过化学手段(例如通过使用选择剂(例如抗生素等))选择的性状,或者取决于是否标记只是一种可以通过观察或测试来识别的性状,例如通过筛选(例如,荧光)。合适的可选择标记的许多例子是本领域已知的并且可以用于本文所述的表达盒中。[0170]除了表达盒之外,本文所述的核酸分子/构建体和多核苷酸序列可以与载体结合使用。术语“载体”是指用于将核酸(或多种核酸)转移、递送或引入细胞中的组合物。载体包含含有待转移、递送或引入的核苷酸序列的核酸构建体(例如表达盒)。用于宿主生物转化的载体在本领域是众所周知的。一般类型的载体的非限制性实例包括双链或单链线性或环状形式的病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、小环或农杆菌双元载体,其可以或者可无法自我传播或移动。在一些实施方案中,病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合到细胞基因组中或存在于染色体外(例如具有复制起点的自主复制质粒)来转化原核或真核宿主。另外包括穿梭载体,其意指能够在两种不同宿主生物(其可以选自放线菌和相关物种、细菌和真核生物(例如高等植物、哺乳动物、酵母或真菌细胞))中(天然或通过设计)复制的dna载体。在一些实施方案中,载体中的核酸在合适启动子或其他调节元件的控制下并且可操作地与其连接以用于宿主细胞中转录。该载体可以是在多个宿主中起作用的双功能表达载体。在基因组dna的情况下,这可以包含其自身的启动子和/或其他调节元件,而在cdna的情况下,这可以在合适的启动子和/或其他调节元件的控制下以用于在宿主细胞中表达。多种包含多核苷酸可操作连接至的克隆位点的真核表达载体在本领域中是众所周知的,并且一些可从诸如stratagene,lajolla,calif.;invitrogen,carlsbad,calif.;promega,madison,wis.或bdbiosciencesclontech,paloalto,calif的公司商购获得。在一个实施方案中,表达载体包含至少一种核酸序列,该核酸序列是编码感兴趣的肽/多肽/蛋白质的核苷酸序列的转录和翻译所必需的调节序列。因此,本发明的核酸或多核苷酸和/或包含其的表达盒可以包含在如本文所述和本领域已知的载体中。[0171]如本文所用,“接触”、“接触的”、“接触了”及其语法变体是指将所需反应的组分一起放在适合进行所需反应(例如,转化、转录控制、基因组编辑、切口和/或切割)的条件下。例如,靶核酸可以与序列特异性dna结合蛋白(例如,多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶、类转录激活效应子核酸酶(talen)和/或argonaute蛋白))和脱氨酶或编码其的核酸构建体在表达序列特异性dna结合蛋白、逆转录酶和/或脱氨酶并且序列特异性dna结合蛋白与靶核酸结合的条件下接触,逆转录酶和/或脱氨酶可以与序列特异性dna结合蛋白融合或募集到序列特异性dna结合蛋白上(例如,通过与序列特异性dna结合蛋白融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签),因此脱氨酶和/或逆转录酶位于靶核酸附近,从而修饰靶核酸。可以使用利用其他蛋白质-蛋白质相互作用的募集逆转录酶和/或脱氨酶的其他方法,并且rna-蛋白质相互作用和化学相互作用也可以用于蛋白质-蛋白质和蛋白质-核酸募集。[0172]如本文所用,关于靶核酸的“修饰”或“修饰的”包括编辑(例如突变)、共价修饰、交换/取代核酸/核苷酸碱基、删除、切割、切口和/或改变靶核酸的转录控制。在一些实施方案中,修饰可以包括任何类型的一个或多个单碱基改变(snp)。[0173]在感兴趣的多核苷酸的上下文中,“引入”、“引入了”、“引入的”(及其语法变体)是指将感兴趣的核苷酸序列(例如,多核苷酸、rt模板、核酸构建体和/或引导核酸)以使得核苷酸序列能够进入细胞内部的方式呈递给植物、其植物部分或其细胞。[0174]术语“转化”或“转染”可以互换使用,并且如本文所用,是指将异源核酸引入细胞。细胞的转化可以是稳定的或瞬时的。因此,在一些实施方案中,宿主细胞或宿主生物体(例如植物)可以用本发明的多核苷酸/核酸分子稳定转化。在一些实施方案中,宿主细胞或宿主生物体可以用本发明的多核苷酸/核酸分子瞬时转化。[0175]在多核苷酸的上下文中,“瞬时转化”是指多核苷酸被引入细胞中并且不整合到细胞的基因组中。[0176]在将多核苷酸引入细胞中的上下文中,“稳定地引入”或“稳定地引入的”意指引入的多核苷酸被稳定地掺入细胞的基因组中,因此细胞被多核苷酸稳定地转化。[0177]如本文所用,“稳定转化”或“稳定转化的”是指将核酸分子引入细胞中并整合到细胞的基因组中。因此,整合的核酸分子能够被其后代,更具体地,被多个连续世代的后代遗传。如本文所用,“基因组”包括核基因组和质体基因组,因此包括将核酸整合到例如叶绿体或线粒体基因组中。如本文所用,稳定转化还可以指在染色体外维持的转基因,例如,作为微染色体或质粒。[0178]瞬时转化可以通过例如酶联免疫吸附测定(elisa)或蛋白质印迹来检测,其可以检测由引入生物体的一种或多种转基因编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞的基因组dna与核酸序列的southern印迹杂交测定来检测,所述核酸序列与引入生物体(例如植物)中的转基因的核苷酸序列特异性杂交。细胞的稳定转化可以通过例如细胞的rna与核酸序列的northern印迹杂交测定来检测,所述核酸序列与引入宿主生物的转基因的核苷酸序列特异性杂交。细胞的稳定转化也可以通过例如聚合酶链式反应(pcr)或本领域熟知的其他扩增反应来检测,使用与转基因的靶序列杂交的特异性引物序列,导致转基因序列的扩增,其可以根据标准方法检测。转化也可以通过本领域公知的直接测序和/或杂交方案检测。[0179]因此,在一些实施方案中,本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以瞬时表达和/或它们可以稳定地掺入宿主生物的基因组中。因此,在一些实施方案中,本发明的核酸构建体(例如,一种或多种包含用于如本文所述进行编辑的多核苷酸的表达盒)可以与引导核酸一起瞬时引入细胞中,因此,没有dna保持在细胞。因此,术语“瞬时”转化是指引入分子工具的方式,所述分子工具包括至少一种核酸(dna、rna、单链或双链或其混合物)和/或至少一种氨基酸序列,任选地包含合适的化学或生物试剂,以实现转移到细胞的至少一个感兴趣区室中,包括但不限于细胞质、细胞器,包括细胞核、线粒体、液泡、叶绿体,或转移到膜中,导致引入的至少一种分子的转录和/或翻译和/或缔合和/或活性,而没有实现稳定的整合或掺入和因此引入细胞基因组中的相应的至少一种分子的遗传。术语“无转基因”是指在感兴趣的宿主细胞或组织或生物体的基因组中不存在或发现转基因的情况。[0180]可以通过本领域技术人员已知的任何方法将本发明的核酸构建体引入植物细胞中。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如,通过农杆菌)、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、渗透、peg介导的核酸摄取以及导致将核酸引入植物细胞的任何其他电学、化学、物理(机械)和/或生物机制的转化,包括其任何组合。用于转化真核生物和原核生物的程序在本领域中是众所周知的并且是常规的并且在整个文献中都有描述(参见,例如,jiang等人2013.nat.biotechnol.31:233-239;ran等人natureprotocols8:2281–2308(2013))。本领域已知的各种植物转化方法的一般指南包括miki等人("proceduresforintroducingforeigndnaintoplants"inmethodsinplantmolecularbiologyandbiotechnology,glick,b.r.andthompson,j.e.,eds.(crcpress,inc.,bocaraton,1993),pages67-88)和rakowoczy-trojanowska(cell.mol.biol.lett.7:849-858(2002))。[0181]在本发明的一些实施方案中,细胞的转化可以包括核转化。在其他实施方案中,细胞的转化可以包括质体转化(例如,叶绿体转化)。在更进一步的实施方案中,可以通过常规育种技术将本发明的核酸引入细胞中。在一些实施方案中,可以通过农杆菌转化将一种或多种多核苷酸、表达盒和/或载体引入植物细胞中。[0182]因此,可以以本领域公知的许多方式将多核苷酸引入植物、植物部分、植物细胞中。本发明的方法不依赖于将一个或多个核苷酸序列引入植物的特定方法,只要它们能够进入细胞内部。在要引入多于多核苷酸的情况下,它们可以组装为单个核酸构建体的一部分,或作为单独的核酸构建体,并且可以位于相同或不同的核酸构建体上。因此,可以在单个转化事件中或在单独的转化事件中将多核苷酸引入感兴趣的细胞,或者,作为育种方案的一部分,可以将多核苷酸掺入植物中。[0183]术语“序列同一性”是指两个多核苷酸或多肽序列之间相同且处于相同相对位置的碱基或氨基酸的百分比。因此,一个多核苷酸或多肽序列与另一多核苷酸或多肽序列相比具有一定百分比的序列同一性。对于序列比较,通常一个序列充当参考序列,测试序列与之进行比较。术语“参考序列”是指测试序列与之进行比较的分子。同一性可以很容易地通过已知方法计算,包括但不限于以下描述的那些:computationalmolecularbiology(lesk,a.m.,ed.)oxforduniversitypress,newyork(1988);biocomputing:informaticsandgenomeprojects(smith,d.w.,ed.)academicpress,newyork(1993);computeranalysisofsequencedata,parti(griffin,a.m.,andgriffin,h.g.,eds.)humanapress,newjersey(1994);sequenceanalysisinmolecularbiology(vonheinje,g.,ed.)academicpress(1987);和sequenceanalysisprimer(gribskov,m.anddevereux,j.,eds.)stocktonpress,newyork(1991)。[0184]如本文所用,术语“序列同一性百分比”或“同一性百分比”是指当两个序列最佳比对时,与测试(“主题”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中,“同一性百分比”可以指与参考多肽相比,氨基酸序列中相同氨基酸的百分比。[0185]如本文所用,在两个核酸分子、核苷酸序列或多肽序列的上下文中的短语“基本相同”或“基本同一性”是指当针对最大对应比较和对齐时,具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目视检查所测量的。在本发明的一些实施方案中,基本同一性存在于本发明的核苷酸序列的连续核苷酸区域上,其长度为约10个核苷酸至约20个核苷酸、约10个核苷酸至约25个核苷酸、约10个核苷酸至约30个核苷酸,约15个核苷酸至约25个核苷酸、约30个核苷酸至约40个核苷酸、约50个核苷酸至约60个核苷酸、约70个核苷酸至约80个核苷酸、约90个核苷酸至约100个核苷酸、约100个核苷酸至约200个核苷酸、约100个核苷酸至约300个核苷酸、约100个核苷酸至约400个核苷酸、约100个核苷酸至约500个核苷酸、约100个核苷酸至约600个核苷酸、约100个核苷酸至约800个核苷酸、约100个核苷酸至约900个核苷酸或更多,或其中的任何范围,直到序列的全长。在一些实施方案中,核苷酸序列可以在至少约20个核苷酸(例如,约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70、80、90、100、150、200、300、400、500、600、700、800或900个核苷酸或更多)上是基本相同的。[0186]在本发明的一些实施方案中,基本同一性存在于本发明多肽的连续氨基酸残基区域上,其长度为约3个氨基酸残基至约20个氨基酸残基、约5个氨基酸残基至约25个氨基酸残基、约7个氨基酸残基至约30个氨基酸残基、约10个氨基酸残基至约25个氨基酸残基、约15个氨基酸残基至约30个氨基酸残基、约20个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约50个氨基酸残基、约30个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约70个氨基酸残基、约50个氨基酸残基至约70个氨基酸残基、约60个氨基酸残基至约80个氨基酸残基、约70个氨基酸残基至约长度为80个氨基酸残基、约90个氨基酸残基至约100个氨基酸残基或更多个氨基酸残基,以及其中的任何范围,直至序列的全长。在一些实施方案中,多肽序列可以在至少约8个连续氨基酸残基(例如,长度为约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、130、140、150、175、200、225、250、300、350、400、450或500个或更多个氨基酸或更多个连续氨基酸残基)上是彼此基本相同的。在一些实施方案中,两种或更多种黑芥子酶多肽、两种或更多种aop2多肽或两种或更多种cyp79f1多肽可以彼此相同(100%)或基本上相同(例如,至少70%至99.9%相同;例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%相同或其中的任何范围或值)。在一些实施方案中,两种或更多种黑芥子酶多肽、两种或更多种aop2多肽或两种或更多种cyp79f1多肽蛋白质可以在10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39至约40、41、42、43、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、275、300、325、350、375、400、425、450、475、500、525、540或更多个连续氨基酸残基上基本相同。在一些实施方案中,两种或更多种黑芥子酶多肽、两种或更多种aop2多肽或两种或更多种cyp79f1多肽蛋白质可以在seqidno:93-105、115、128-132、617-679或743-786的氨基酸序列中的任一个的10、15、20、25、30至350、400、450、500或540或更多内基本相同。[0187]“互补”或“互补性”是指通过碱基堆叠和特异性氢键键合在包含天然或非天然碱基或其类似物的两个序列之间配对的能力。例如,如果核酸的一个位置的碱基能够与靶标的相应位置的碱基形成氢键,则认为在该位置的碱基相互互补。核酸可包含通用碱基或惰性无碱基间隔区,它们对氢键键合没有正或负贡献。碱基配对可以包括规范的watson-crick碱基配对和非watson-crick碱基配对(例如wobble碱基配对和hoogsteen碱基配对)。应理解,对于互补碱基配对,腺苷型碱基(a)与胸苷型碱基(t)或尿嘧啶型碱基(u)互补,胞嘧啶型碱基(c)与鸟苷型碱基互补(g),并且通用碱基如3-硝基吡咯或5-硝基吲哚可以与任何a、c、u或t杂交并被认为是互补的。nichols等人,nature,1994;369:492-493和loakes等人,nucleicacidsres.,1994;22:4039-4043。肌苷(i)在本领域中也被认为是一种通用碱基并且被认为与任何a、c、u或t互补。参见watkinsandsantalucia,nucl.acidsresearch,2005;33(19):6258-6267。[0188]如本文所指,“互补核酸序列”是包含核苷酸序列的核酸序列,该核苷酸序列使其能够在温度和溶液离子强度的适当的体外和/或体内条件下以序列特异性、反平行的方式(即核酸特异性地与互补核酸结合)与另一种核酸非共价结合。两个单链分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在完全互补性时,它可以是完全的。核酸链之间的互补程度对核酸链之间杂交的效率和强度有显著影响。[0189]如本文所用,“互补”可以表示与比较核苷酸序列100%互补,或者它可以表示与比较核苷酸序列的小于100%的互补性(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等的互补性)。[0190]用于比较和确定百分比序列同一性和百分比互补性的序列比对方法是本领域众所周知的。可以进行用于比较的序列的最佳比对,例如,通过needlemanandwunsch,(1970)j.mol.biol.48:443的同源比对算法,通过pearsonandlipman,(1988)proc.nat'l.acad.sci.usa85:2444的相似性方法搜索,通过这些算法的计算机化实施(在wisconsingeneticssoftwarepackage,geneticscomputergroup,575sciencedr.,madison,wi中的gap、bestfit、fasta和tfasta),通过手动对齐和目视检查(参见,例如,brent等人,(2003)currentprotocolsinmolecularbiology),通过使用本领域已知的算法,包括分别在altschul等人,(1977)nuc.acidsres.25:3389-3402;和altschul等人,(1990)j.mol.biol.215:403-410中描述的blast和blast2.0算法。执行blast分析的软件可通过国家生物技术信息中心公开获得。一些比对程序是macvector(oxfordmolecularltd,oxford,u.k.),alignplus(scientificandeducationalsoftware,pennsylvania)和alignx(vectornti,invitrogen,carlsbad,ca)。另一个比对程序是使用默认参数的sequencher(genecodes,annarbor,michigan)和muscle(multiplesequencecomparisionbylog-expection;一种作为公共领域许可的计算机软件)。[0191]如本文所用,术语“杂交”是指互补核苷酸碱基之间的配对(例如,腺嘌呤(a)与dna分子中的胸腺嘧啶(t)和rna分子中的尿嘧啶(u)形成碱基对,而鸟嘌呤(g)与dna和rna分子中的胞嘧啶(c)形成碱基对)以形成双链核酸分子。(参见,例如,wahl和berger(1987)methodsenzymol.152:399;kimmel,(1987)methodsenzymol.152:507)。此外,本领域还已知,对于两个rna分子(例如,dsrna)之间的杂交,鸟嘌呤(g)碱基与尿嘧啶(u)配对。例如,在trna反密码子碱基与mrna中的密码子配对的情况下,g/u碱基配对是遗传密码简并性(即冗余)的部分原因。在本公开内容的上下文中,引导rna分子的蛋白质结合区段(dsrna双体(duplex))的鸟嘌呤(g)被认为与尿嘧啶(u)互补,反之亦然。因此,当g/u碱基对可以在给定的核苷酸位置形成引导rna分子的蛋白质结合片段(dsrna双体)时,该位置不被认为是非互补的,而是被认为是互补的。本领域应理解,多核苷酸的序列不需要与其靶核酸的序列100%互补以特异性杂交。此外,多核苷酸可以在一个或多个区段上杂交,使得插入或相邻区段不参与杂交事件(例如,环结构或发夹结构)。多核苷酸可包含与它们所靶向的靶核酸序列内的靶区域至少70%、至少80%、至少90%、至少95%、至少99%或100%的序列互补性。[0192]如本文所用,术语“基因编辑的植物”、“基因编辑的植物部分”或“基因编辑的植物细胞”是指包含一个或多个由基因编辑系统编辑的内源基因的植物、其部分或细胞。本发明的基因编辑系统包括靶向元件和/或编辑元件。靶向元件能够识别靶基因组序列。编辑元件能够修饰靶基因组序列,例如,通过替换或插入一个或多个核苷酸到基因组序列中、删除基因组序列中的一个或多个核苷酸、改变基因组序列以包括调节序列、插入转基因到安全港基因组位点或基因组中的其他特定位置,和/或其任何组合。靶向元件和编辑元件可以在相同的核酸分子或不同的核酸分子上。在一些实施方案中,编辑元件能够通过使用直接或间接融合至crispr-cas效应蛋白的碱基编辑器如胞嘧啶碱基编辑器(cbe)和/或腺嘌呤碱基编辑器(abe)替换单个核苷酸来进行精确的基因组编辑。[0193]分子和细胞生物化学的一般方法可以在诸如以下的标准教科书中找到:molecularcloning:alaboratorymanual,3rded.(sambrook等人,harborlaboratorypress2001);shortprotocolsinmolecularbiology,4thed.(ausubel等人eds.,johnwiley&sons1999);proteinmethods(bollag等人,johnwiley&sons1996);nonviralvectorsforgenetherapy(wagner等人eds.,academicpress1999);viralvectors(kaplift&loewyeds.,academicpress1995);immunologymethodsmanual(i.lefkovitsed.,academicpress1997);和cellandtissueculture:laboratoryproceduresinbiotechnology(doyle&griffiths,johnwiley&sons1998),其公开内容通过引用并入本文。[0194]如本文所用,术语“植物”是指整株植物。术语“植物部分”包括分化的和未分化的组织,包括但不限于:植物器官、植物组织、根、茎、芽、砧木、接穗、托叶、花瓣、叶、花、胚珠、花粉、苞片、叶柄、节间、树皮、短柔毛、分蘖、根茎、叶状体、叶片、雄蕊、果实、种子、肿瘤组织和植物细胞(例如,单细胞、原生质体、胚胎和愈伤组织)。植物细胞包括但不限于来自种子、悬浮培养物、胚胎、分生组织区、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子的细胞。植物组织可以在植物中或在植物器官、组织或细胞培养物中。因此,本文使用的术语“植物部分”包括但不限于生殖组织(例如,花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花蕾、胚珠、种子和胚胎);营养组织(例如,叶柄、茎、根、根毛、根尖、髓、胚芽鞘、茎、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶);维管组织(例如韧皮部和木质部);特化细胞,例如表皮细胞、薄壁细胞、胆壁细胞(chollenchymacells)、厚壁细胞(schlerenchymacell)、气孔、保卫细胞、角质层、叶肉细胞;愈伤组织;和插条。术语“植物部分”还包括植物细胞,包括在植物和/或植物部分、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等中完整的植物细胞。如本文所用,“芽”是指地上部分,包括叶和茎。如本文所用,术语“组织培养物”包括组织、细胞、原生质体和愈伤组织的培养物。如本文所用,术语“茎”是指植物的地上结构轴,由节(例如,叶和花)和节间(例如,节之间的连接材料)组成。[0195]如本文所用,“植物细胞”是指植物的结构和生理单位,其通常包括细胞壁,但也包括原生质体。本发明的植物细胞可以是分离的单细胞的形式,或者可以是培养的细胞,或者可以是更高组织单元例如植物组织(包括愈伤组织)或植物器官的一部分。“原生质体”是没有细胞壁或仅具有部分细胞壁的分离的植物细胞。因此,在本发明的一些实施方案中,包含本发明的核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞,包括但不限于根细胞、叶细胞、组织培养细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的一些方面,植物部分可以是植物种质。在一些方面,植物细胞可以是不再生成植物的非繁殖植物细胞。[0196]“植物细胞培养物”是指植物单元(例如原生质体、细胞培养细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、合子和处于不同发育阶段的胚胎)的培养物。[0197]术语“植物器官”是指植物组织或构成植物的形态和功能上不同的部分的一组组织,例如根、茎、叶、花蕾或胚。[0198]如本文所用,“植物组织”是指组织成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。该术语包括但不限于整株植物、植物器官、植物种子、组织培养物和组织成结构和/或功能单元的任何植物细胞群。该术语与以上列出的或本定义所包含的任何特定类型的植物组织结合或不结合使用时,并不旨在排除任何其他类型的植物组织。[0199]如本文所用,术语“组织培养物”表示组合物,其包含相同或不同类型的分离的细胞,或组织成植物部分的此类细胞的集合。示例性类型的组织培养物是原生质体、愈伤组织、植物团块和植物细胞,它们可以产生在植物或植物部分中完整的组织培养物,例如胚胎、花粉、花、种子、叶、茎、根、根尖、花药、雌蕊、分生细胞、腋芽、子房、种皮、胚乳、下胚轴、子叶等。在本发明的一些实施方案中,提供了转基因组织培养物或转基因植物细胞培养物,其中转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中,可以通过使转基因植物与非转基因植物育种并在后代中选择包含所需基因编辑而不是用于产生该编辑的转基因的植物,可以从由转基因组织或细胞发育而来的植物中消除转基因。[0200]如本文所用,“后代”包括植物的任何后续世代。[0201]如本文所用,术语“绿植”、“绿叶植物”或“绿叶蔬菜”是指植物中维生素、矿物质和纤维含量高但热量低的部分。示例性的非限制性绿叶植物包括羽衣甘蓝(kale)、散叶甘蓝(collardgreens)、菠菜、卷心菜、甜菜、豆瓣菜、长叶莴苣、瑞士甜菜、芝麻菜、菊苣、白菜、芜菁甘蓝(turnipgreens)、芥菜卷心菜、西兰花、花椰菜、球芽甘蓝和大头菜。[0202]包含包括黑芥子酶、cyp79f1或aop2中的一种或多种的硫代葡萄糖苷途径的任何植物或植物部分都可以用于本发明。在一些实施方案中,植物或植物部分是芥菜植物(例如十字花科(brassicaceae))。在一些实施方案中,可用于本发明的植物或植物部分可包括来自番木瓜科(caricaceae)的植物(例如,木瓜(papaya),例如番木瓜(caricapapaya))。在一些实施方案中,可用于本发明的植物或植物部分可以包括来自辣木科(moringaceae)的植物(例如,辣木属的几个种(moringaspp.);例如,大辣木(m.arborea),草辣木(m.borziana),m.concanensis,象腿辣木(m.drouhardii),m.hildebrantii,长管辣木(m.longituba),印度辣木(m.oleifera).荒漠辣木(m.ovalifolia),m.peregrine,矮辣木(m.pygmaea),暗花辣木(m.rivae),埃塞俄比亚辣木(m.ruspoliana),或m.stenopetala)。[0203]示例性芥菜植物(或其部分)(例如十字花科植物或其部分)包括但不限于羽衣甘蓝植物或其部分、散叶甘蓝植物或其部分、菠菜植物或其部分、卷心菜植物或其部分其、甜菜植物或其部分、豆瓣菜物或其部分、莴苣植物或其部分(例如长叶莴苣)、瑞士甜菜植物或其部分、芝麻菜植物或其部分、菊苣植物或其部分、白菜植物或其部分、芜菁甘蓝植物或其部分、芜菁植物或其部分、芥菜植物或其部分、卷心菜植物或其部分、西兰花植物或其部分、花椰菜植物或其部分、球芽甘蓝植物或其部分、萝卜植物或其部分或大头菜植物或其部分。在一些实施方案中,芥菜植物或其部分可包括但不限于甘蓝(brassicaoleracea)(例如,b.oleraceavar.oleracea、b.oleraceavar.capitata、b.oleraceavar.botrytis、b.oleraceavar.gemmifera、b.oleraceavar.sabauda、b.oleraceavar.gongyiodes、b.oleraceavar.italic、b.oleraceavar.sabellica、b.oleraceavar.acephala)、芥菜(brassicajuncea)、芜菁(brassicarapa)(b.rapasubsp.pekinensis、b.rapasubsp.chinensis、b.rapasubsp.rapa)、brassicanapas、埃塞俄比亚芥(brassicacarinata)、芸苔(brassicacampestris)、黑芥(brassicanigra)或野芥菜(raphanusraphanistrum)(例如raphanusraphanistrumsubsp.sativus)。[0204]蔬菜被称为人类饮食中的“保护食品”,由于富含维生素、必需脂肪酸、矿物质、氨基酸和膳食纤维以及各种必需的生物活性化合物,包括由抗氧化剂和酚类化合物组成的促进健康的植物次生代谢物,因此具有多种健康益处。在全球范围内,蔬菜作物的作物多样性和营养价值对于改善粮食和营养安全具有特殊意义。[0205]植物是许多生物活性化合物的主要来源,这些化合物统称为植物化学物质,据报道它们对身体健康至关重要。植物化学物质的组成非常独特,并且在植物中差异很大。例如,属于葱科的蔬菜(如洋葱、大蒜、青葱、韭菜、大葱、细香葱等)的特征在于硫代硫化物和类黄酮。属于十字花科的十字花科蔬菜(如球芽甘蓝、卷心菜、花椰菜、芥菜、羽衣甘蓝、西兰花等)含有大量硫代葡萄糖苷,而属于葫芦科的蔬菜(如南瓜、倭瓜、黄瓜、甜瓜、苦瓜等)富含类胡萝卜素和生育酚。其他含有较高水平硫代葡萄糖苷的植物包括番木瓜科和辣木科。[0206]十字花科(cruciferae)(又称十字花科(cruciferae)),称芥菜科。芸苔属是芥菜科中芸苔科(tribe)的成员(warwick,s.i.,a.francisandr.k.gugel(2009),“guidetowildgermplasm:brassicaandalliedcrops(tribebrassiceae,brassicaceae)”,thirdedition,brassica.info/info/publications/guidewild-germplasm.php)。芸苔属包括许多经济上重要的植物,例如叶菜和根菜、油籽和调味品作物,以及模式植物拟南芥。十字花科蔬菜被广泛种植,有许多属、种和栽培品种,包括埃塞俄比亚芥(b.carinata)(埃塞俄比亚芥菜)、芥菜(b.juncea)(褐芥菜、绿芥菜)、欧洲油菜(b.napus)(油菜、阿根廷油菜、油菜籽和芜菁甘蓝)、黑芥(b.nigra)(黑芥菜)、芜菁(b.rapa)(田芥菜、波兰油菜、大白菜(chinesecabbage)、芥菜(chinesemustard)、白菜和芜菁)、甘蓝(b.oleracea)粮食作物(卷心菜、西兰花、花椰菜、球芽甘蓝、大头菜和羽衣甘蓝)和萝卜(raphanussativus)(萝卜(radish))。[0207]芸苔属植物作为饲料添加剂和/或新鲜绿叶蔬菜的局限性在于其相对较高的硫代葡萄糖苷含量。本发明旨在减少“芥菜弹”反应并生产具有减少的刺激性和/或减少的苦味和/或气味的绿叶蔬菜,从而鼓励更广泛地食用新鲜健康的绿叶蔬菜。此外,本发明涉及改进在其他蔬菜中发现的类似的化学草食防御系统,以促进对较少刺激性和/或较少苦味的另外新鲜蔬菜的消费。[0208]硫代葡萄糖苷[0209]硫代葡萄糖苷构成了一个由100多个相关分子组成的大家族,这些分子具有共同的含硫核心结构以及不同大小和化学性质的侧链(fahey等人,(2001)phytochemistry56:5-51;halkierandgershenzon,(2006)ann.rev.plantbiology57(1):303-333)。虽然硫代葡萄糖苷存在于许多植物结构(例如叶、维管组织、茎、根和花)中,但它们在种子中以高浓度积累(bellostas等人,(2004)agroindustria3(3):5-10)。芸苔属植物尤其如此。这些化合物及其代谢物可影响膳食的风味,降低其适口性,并且在某些情况下(取决于存在的硫代葡萄糖苷和硫代葡萄糖苷代谢物的类型)也可以直接和/或间接影响消费者的健康。[0210]硫代葡萄糖苷(其中已鉴定出具有不同取代基的近200种类型)根据不同氨基酸前体的结构分为三类:脂肪族硫代葡萄糖苷、吲哚硫代葡萄糖苷和芳香族硫代葡萄糖苷。[0211]示例性脂肪族硫代葡萄糖苷包括但不限于黑芥子苷、屈曲花苷、glucoiberverin、芝麻菜苷(glucoerucin)、脱氢芥子素(dehydroerucin)、萝卜硫苷、萝卜苷、葡萄糖芫菁芥素(gluconapin)、前告伊春、glucoberteroin、葡萄糖庭荠素、glucobrassicanapin和gluconapoleiferin。[0212]在一些实施方案中,吲哚硫代葡萄糖苷包括但不限于芸苔葡糖硫苷、4-羟基芸苔葡糖硫苷、4-甲氧基芸苔葡糖硫苷和新芸苔葡糖硫苷。[0213]在一些实施方案中,芳族硫代葡萄糖苷包括但不限于含葡萄糖豆瓣菜素(gluconasturtiin)。[0214]硫代葡萄糖苷作为几乎所有十字花目植物的次生代谢产物存在。十字花科中是例如经济上重要的十字花科以及白花菜科(capparaceae)、辣木科和番木瓜科。除十字花目外,羽柱果科(putranjivaceae)的核果木属(drypetes)和假黄杨属(putranjiva)也生产硫代葡萄糖苷。硫代葡萄糖苷存在于各种可食用植物中,例如卷心菜(白菜、大白菜、西兰花)、西洋菜、辣根、刺山柑和萝卜,其中分解产物通常构成独特风味的重要部分。在这些植物的种子中也发现了硫代葡萄糖苷。[0215]硫代葡萄糖苷是许多刺激性植物如芥菜、卷心菜和辣根的天然成分。这些植物的刺激性(和/或苦味)是由于当植物材料被咀嚼、切割或以其他方式损坏时由硫代葡萄糖苷产生的芥子油。这些天然化学物质最有可能有助于植物抵御害虫和疾病,并赋予十字花科蔬菜特有的苦味特性。[0216]独特的次级代谢产物硫代葡萄糖苷(s-吡喃葡萄糖基硫代羟肟酸盐(s-glucopyranosylthiohydroximate))是天然存在的s-连接糖苷,主要存在于十字花科植物中,但也存在于番木瓜科和辣木科的植物中。它们被酶水解以产生硫酸根离子、d-葡萄糖和特征降解产物,例如异硫氰酸盐。植物中硫代葡萄糖苷的功能尚不清楚,但具有刺鼻性或刺激性风味和气味的异硫氰酸盐可能与植物抵御微生物有关。[0217]本公开内容提供了在风味和气味方面具有降低的刺激性和/或苦味的植物和用于通过改变和/或调节芥菜弹反应来生产在风味和气味方面具有降低的刺激性和/或苦味的植物的方法。[0218]芥菜弹反应[0219]为了应对生物挑战,植物已经进化出多种防御机制。植物利用诱导防御形成了物理和化学屏障,其中之一是硫代葡萄糖苷-黑芥子酶系统(图6),也称为“芥子油炸弹”或“芥菜弹”反应。十字花科植物(如十字花科中的植物(如芸苔属的几个种))和其他产生硫代葡萄糖苷的植物物种合成硫代葡萄糖苷,这是一类植物次生化合物,其共有由β-硫代葡萄糖部分和磺化肟组成的核心,但不同之处在于衍生自几种氨基酸之一的可变侧链。然而,完整的硫代葡萄糖苷具有有限的生物活性。当植物组织受损并且硫代葡萄糖苷与植物黑芥子酶(一种β-硫葡糖苷酶)接触时,它们的效力就会出现。在完整组织中,该酶与硫代葡萄糖苷分开储存(matilep.h.matilep.h.(1980)biochem.physiol.pflanz.175,722-731;bonesa.m.bonesa.m.&rossiter,j.t.(1996)physiol.plant.97,194-208)。黑芥子酶从硫代葡萄糖苷中去除β-葡萄糖部分,导致形成不稳定的中间体,并最后形成各种有毒的分解产物。这些化合物具有从遏食到刺激性味道/风味的多种生物活性。[0220]在十字花科中,已经进化出一种特殊的化学反应,它由空间分离的酶(黑芥子酶)和底物池(硫代葡萄糖苷)介导。在组织损伤(即食草)时,黑芥子酶与硫代葡萄糖苷接触,并可产生各种降解产物;其中一些具有强烈刺激性(即异硫氰酸烯丙酯;aitc)(图6)。因此,该反应已演变为一种抗食草机制。[0221]使用t-dna插入的基因工程方法被用来解除芥菜弹反应并在功能上表征芥菜弹反应。具体而言,拟南芥t-dna插入突变体的表征确定了3种已知i型黑芥子酶中的2种在调节化学反应中的关键作用(barthandjander,plantj.46(4)549-562(2006))。在芥菜中,调节因子(myb28,aop2)的rnai介导的沉默参与硫代葡萄糖苷的次级代谢(augustineandbisht,phytochem.117:43-50(2015));augustine等人,plantbiotechnolj.11(7):855-866(2013))。欧洲油菜(b.napus)的84份登记(accession)材料的表征就种子中硫代葡萄糖苷含量而言将myb28与qtl遗传关联(harper等人naturebiotechnol.30,798–802(2012))。[0222]减少植物中的硫代葡萄糖苷降解产物(例如,异硫氰酸酯)是本发明的一个目标,并且包括降低的产生硫代葡萄糖苷降解产物的能力的植物可以具有显著的营养益处。因此,本公开内容涉及靶向基因编辑方法以通过敲除编码黑芥子酶(参见例如图6和图7)、aop2酶和/或cyp79f1酶来破坏硫代葡萄糖苷代谢来解除芥菜弹反应。在一些实施方案中,脂肪族硫代葡萄糖苷代谢被基因编辑系统破坏。在一些实施方案中,吲哚硫代葡萄糖苷代谢被基因编辑系统破坏。在一些实施方案中,芳香族硫代葡萄糖苷代谢被基因编辑系统破坏。[0223]在一些实施方案中,编码黑芥子酶(即,葡萄糖苷酶、硫葡糖苷酶(例如,β-硫葡糖苷酶)、硫代葡萄糖苷葡糖水解酶;ec3.2.1.147(ec3.2.3.1转移到3.2.1.147))的基因被靶向敲除,使得靶基因在宿主植物细胞、组织和/或整株植物中不功能性起作用。在一些实施方案中,编码aop2酶(即,2-氧代酸依赖性双加氧酶;ec1.14.11.m8)的基因被靶向敲除,使得靶基因在宿主植物细胞、组织和/或整株植物中不功能性起作用。在一些实施方案中,编码cyp79f1酶(即,细胞色素p450单加氧酶、高甲硫氨酸n-单加氧酶;ec1.14.14.42)的基因被靶向敲除,使得靶基因在宿主植物细胞、组织和/或整株植物中不功能性起作用。[0224]在芸苔属的几个种以及这些物种内的栽培品种中存在显著的多样性。例如,在芥菜中,在栽培品种之间叶子形状、颜色、质地和物候特征存在很大差异。本公开内容教导了可用的多叶芥菜栽培品种在食用新鲜叶子时伴随着刺激性和/或苦味,这被认为是在消费者空间中广泛采用新鲜多叶蔬菜例如芥菜的潜在障碍。然而,与其他易获得的莴苣选择(如长叶莴苣和冰山莴苣)相比,食用新鲜的绿叶芸苔属蔬菜将为消费者提供更大的营养益处。[0225]根据本发明,如本文所述的修饰的植物细胞表现出一种或多种内源靶基因的改变的表达或功能。在一些实施方案中,特定途径中的内源靶基因(例如,硫代葡萄糖苷生物合成或硫代葡萄糖苷分解,例如,内源黑芥子酶基因、内源cyp79f1基因和/或内源aop2基因)在修饰的植物细胞中的表达降低。在一些实施方案中,特定途径中多个(例如,两个或更多个)内源靶基因的表达在修饰的植物细胞中降低。例如,可以降低特定途径中2、3、4、5、6、7、8、9、10、11、12、13或14个或更多个内源靶基因的表达。在一些实施方案中,在一个途径中内源靶基因的表达和在另一途径中的内源靶基因的表达可以在修饰的植物细胞中降低。在一些实施方案中,在一个途径中的多个内源靶基因的表达和在另一个途径中的多个内源靶基因的表达可以在修饰的植物细胞中降低。例如,可以降低一个途径中2、3、4、5、6、7、8、9、10、11、12、13或14个或更多个内源性靶基因的表达,并且可以降低另一途径中的2、3、4、5、6、7、8、9、10、11、12、13或14个或更多个内源性靶基因的表达。在一些实施方案中,可以降低多个途径中的多个内源靶基因的表达。例如,来自多个途径(例如,2、3、4、5、6、7、8、9、10、11、12、13或14或更多个途径)中的每一个的一个内源基因的表达可以被减少。在一些方面,来自多个途径(例如,2、3、4、5、6、7、8、9、10、11、12、13或14个或更多个途径)的每一个的多个内源基因(例如,2、3、4、5、6、7、8、9、10、11、12、13或14或更多个基因)的表达可以被减少。[0226]在一些实施方案中,由内源靶基因编码的蛋白质在特定途径(例如,硫代葡萄糖苷生物合成或分解)中的功能在修饰的植物细胞中被改变。在一些实施方案中,由特定途径中的多个(例如,两个或更多个)内源靶基因编码的蛋白质的功能在修饰的植物细胞中被改变(例如,硫代葡萄糖苷生物合成或分解)。例如,在特定途径中由2、3、4、5、6、7、8、9、10、11、12、13或14个或更多个内源性靶基因编码的蛋白质的功能可以被改变。在一些实施方案中,在一个途径中由内源靶基因编码的蛋白质的功能和在另一途径中内源靶基因的功能在修饰的植物细胞中被改变。在一些实施方案中,在一个途径中由多个内源靶基因编码的蛋白质的功能和在另一途径中由多个内源靶基因编码的蛋白质的功能在修饰的植物细胞中被改变。例如,在一个途径中由2、3、4、5、6、7、8、9、10、11、12、13或14个或更多个内源性靶基因编码的蛋白质的功能可以被改变,并且在另一个特定途径中由2、3、4、5、6、7、8、9、10、11、12、13或14个或更多个内源性靶基因编码的蛋白质的功能可以被改变。在一些实施方案中,在多个途径中由多个内源靶基因编码的蛋白质的功能被改变。例如,来自多个途径(例如,2、3、4、5、6、7、8、9、10、11、12、13或14或更多个途径)的每一个的一个内源基因编码的蛋白质的功能可以被改变。在另外的方面,来自多个途径(例如,2、3、4、5、6、7、8、9、10、11、12、13或14或更多个途径)的每一个的多个内源基因(例如,2、3、4、5、6、7、8、9、10、11、12、13或14个或更多个基因)编码的蛋白质的功能可以被改变。[0227]在一些实施方案中,本文所述的修饰的植物细胞表现出编码黑芥子酶(即,葡萄糖苷酶、硫葡糖苷酶(即,β-硫葡糖苷酶)、硫代葡萄糖苷葡糖水解酶;ec3.2.1.147(ec3.2.3.1转移至3.2.1.147))、编码2-氧代戊二酸依赖性双加氧酶(即aop2;ec1.14.11.m8)或编码细胞色素p450单加氧酶(即cyp79f1,高甲硫氨酸n-单加氧酶;ec1.14.14.42)和/或与硫代葡萄糖苷代谢有关的一种或多种内源靶基因的改变的表达或功能。[0228]十字花科的各种植物含有分为几个亚科的多种形式(直向同源物)的黑芥子酶基因(rask等人,(2000)plantmol.biol.42,93–113;thangstad等人,(1993)plantmol.biol.23,511–524;xue等人,(1992)plantmol.biol.18,387–398)。然而,拟南芥中仅存在一个黑芥子酶基因家族(tgg1–tgg6)(xu等人,(2004)plantmol.biol.55,343–367)。在这里,有两组配对的黑芥子酶,每组都有一个功能未知的插入基因:tgg1(at5g26000)和tgg2(at5g25980),以及tgg5(at1g51470)和tgg6(at1g51490)。tgg3(at5g48375)和tgg4(at1g47600)是单基因。[0229]在一些实施方案中,用于在芥菜植物中进行基因编辑的候选基因可以选自拟南芥黑芥子酶基因(i型和ii型)的直向同源物,每种类型总共三个。生产异硫氰酸烯丙酯(aitc)需要两种i型黑芥子酶(tgg1和tgg2)(barth和jander,plantj.46(4)549-562(2006))。[0230]在一些实施方案中,使用生物信息学方法来鉴定黑芥子酶直向同源物,例如,鉴定出与拟南芥中的i型黑芥子酶(tgg1和tgg2)密切相关的总共七种芥菜黑芥子酶直向同源物。在一些实施方案中,表达分析可用于鉴定编码显示叶特异性表达的黑芥子酶的候选基因。[0231]在一些实施方案中,用于在芥菜植物中进行基因编辑的候选基因选自拟南芥黑芥子酶基因的同源物和/或直向同源物,选自tgg1、tgg2、tgg3、tgg4、tgg5和tgg6,以及其所述同源物和/或直向同源物的片段。[0232]为了确保最有可能破坏酶特性的精确靶突变,相对于已知的活性位点进行序列分析(参见,例如burmeister等人,structure5,663–675(1997))。发明人还鉴定了对应于tgg4/tgg5/tgg6(ii型黑芥子酶)的4种同源物/直向同源物。因此,在一些实施方案中,用于如本文所述靶向的黑芥子酶基因可以是与seqidno:66-92或680-721的任一核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性或编码与seqidno:93-105、617-658或743-775的任一氨基酸序列具有至少具有80%的序列同一性的序列的核酸。在一些实施方案中,可用于如本文所述靶向的黑芥子酶基因可以包含seqidno:66-92或680-721的任何一种核苷酸序列或编码seqidno:93-105、617-658或743-775的任何一种氨基酸序列。在一些实施方案中,植物可包含多于一个黑芥子酶基因(例如,1、2、3、4、5、6、7、8、9、10、11、12或13个或更多个)并且可以靶向多于一个黑芥子酶基因用于编辑。在一些实施方案中,编辑一个黑芥子酶基因以从该经编辑的基因产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑至少两个黑芥子酶基因以从每个编辑的基因产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑两个黑芥子酶基因以从两个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑三个黑芥子酶基因以从三个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑四个黑芥子酶基因以从四个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑五个黑芥子酶基因以从五个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑六个黑芥子酶基因以从六个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑七个黑芥子酶基因以从七个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑八个黑芥子酶基因以从八个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑九个黑芥子酶基因以从九个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑十个黑芥子酶基因以从十个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑十一个黑芥子酶基因以从十一个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑十二个黑芥子酶基因以从十二个编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。在一些实施方案中,编辑十三个黑芥子酶基因以从十三个经编辑的黑芥子酶基因中的每一个产生减少量的黑芥子酶多肽或不产生黑芥子酶多肽。[0233]在一些实施方案中,黑芥子酶基因中靶位点的基因编辑可以通过使用例如crispr-cas效应蛋白(例如cpf1或cas9)的靶向插入/缺失方法进行。这种方法可以提供空间背景,并且可以确保蛋白质功能的破损、破坏和/或损坏,任选地在酶的高度保守和已知的功能区域内。[0234]在一些实施方案中,黑芥子酶基因中的靶向缺失导致框内或框外缺失。在一些实施方案中,黑芥子酶基因中的靶向缺失导致产生过早终止密码子和任选截短的多肽的框内或框外缺失。在一些实施方案中,靶向缺失是无效等位基因。在一些实施方案中,无效等位基因可以是完全敲除突变黑芥子酶等位基因,其中完全敲除突变黑芥子酶等位基因导致产生非功能性黑芥子酶蛋白或不产生黑芥子酶蛋白。[0235]在一些实施方案中,黑芥子酶基因中的靶位点的基因编辑可以通过使用例如包含crispr-cas效应蛋白和胞苷脱氨酶或腺苷脱氨酶的碱基编辑融合蛋白的稳定和靶向碱基编辑方法进行。这种方法可用于选择性和精确地引导碱基编辑方法,其靶向编码黑芥子酶多肽中例如活性位点内的特定残基的核苷酸。[0236]硫代葡萄糖苷是源自氨基酸和糖的富含氮和硫的次级代谢物。它们代表了十字花科中已知最大的次级代谢物组之一,并在人类和动物健康方面引起了极大的关注。对于人类而言,硫代葡萄糖苷及其分解产物通常与健康益处相关。相反,对于动物饲料,它们通常被认为是抗营养化合物和致甲状腺肿的。[0237]在一些实施方案中,用于芥菜植物中基因编辑的候选基因选自与脂肪族硫代葡萄糖苷代谢相关的基因。在其他实施方案中,用于在芥菜植物中进行基因编辑的候选基因选自与吲哚硫代葡萄糖苷代谢相关的基因。在进一步的实施方案中,用于在芥菜植物中进行基因编辑的候选基因选自与芳族硫代葡萄糖苷代谢相关的基因。在一些实施方案中,与脂肪族、吲哚或芳香族硫代葡萄糖苷代谢相关的基因中的靶位点的基因编辑通过使用crispr-cas效应蛋白(例如,cpf1或cas9)的靶向插入/缺失方法发生,任选地缺失产生截短的蛋白质,任选地完全敲除突变(例如,不产生蛋白质或产生非功能性蛋白质)。这种方法提供了空间背景,并且可以确保蛋白质功能的破损、破坏和/或损坏,任选地跨越酶的高度保守和已知的功能区域。[0238]在一些实施方案中,与脂肪族、吲哚或芳香族硫代葡萄糖苷代谢相关的靶位点的基因编辑可以通过使用包含crispr-cas效应蛋白和碱基编辑器(例如,胞苷脱氨酶或腺苷脱氨酶)的碱基编辑融合蛋白的稳定和靶向碱基编辑方法进行。这种方法可以选择性地和精确地指导碱基编辑方法,其靶向活性位点内的特定残基,或者可用于改变密码子并产生例如过早终止密码子和截短的蛋白质。[0239]myb转录因子[0240]使用拟南芥作为模型,myb转录因子被揭示为硫代葡萄糖苷生物合成的主要正转录调节因子,其中myb28调节基因参与脂肪族硫代葡萄糖苷生物合成(gigolashvili等人,plantj.51(2):247-261(2007))。黑芥子苷是芥菜中主要的硫代葡萄糖苷,并且是产生刺激性aitc化合物的底物,源自硫代葡萄糖苷生物合成的脂肪族分支中的甲硫氨酸。先前在芥菜中使用基于rnai的方法的努力已在功能上证明了myb28在调节脂肪族硫代葡萄糖苷池中的作用(augustine等人,plantbiotechnolj.11(7):855-866(2013))。在欧洲油菜、甘蓝和芜菁中进行了额外的研究。[0241]在一些实施方案中,通过生物信息学分析鉴定了芥菜中的六个myb28基因。保守区域被鉴定用于通过例如crispr-cas复合物进行靶向,以产生例如破坏蛋白质功能的插入/缺失(indel),或用于通过碱基编辑系统靶向在至少一个位点的稳定和靶向的单核苷酸替换/缺失/添加。[0242]在一些实施方案中,myb29转录因子可具有部分冗余功能。例如,脂肪族硫代葡萄糖苷化合物的生物合成可由部分冗余的转录因子myb28和myb29调节。(theimpactoftheabsenceofaliphaticglucosinolatesoninsectherbivoryinarabidopsis.beekwilder,jules;wesselvanleeuwen;vandam,nicolem;bertossi,monica;grandi,valentina;等人plosone;sanfranciscovol.3,iss.4,(apr2008):e2068)。[0243]因此,在一些实施方案中,用于芥菜植物中基因编辑的候选基因选自与脂肪族硫代葡萄糖苷代谢相关的基因,其包括在芥菜中鉴定的六个myb28基因。在进一步的实施方案中,通过使用例如cpf1或cas9的靶向插入/缺失方法对芥菜myb28和/或myb29基因中的靶位点进行基因编辑。这种方法提供了空间背景,并且可以确保蛋白质功能的破损、破坏和/或损坏,任选地在例如酶的高度保守和已知的功能区域内。在一些实施方案中,通过使用包含crispr-cas效应蛋白和胞苷脱氨酶或腺苷脱氨酶的碱基编辑融合蛋白的稳定和靶向碱基编辑方法对芥菜myb28和/或myb29基因中的靶位点进行基因编辑。这种方法可以提供选择性和精确的指导碱基编辑,其中特定残基可以在例如活性位点内靶向。本公开内容教导了基因编辑可以产生对(1)编码黑芥子酶的基因、(2)调节硫代葡萄糖苷(例如myb28和/或myb29)的次级代谢池的转录因子或(3)编码负责将硫代葡萄糖苷转化为其最终降解产物的酶的基因的破坏的完全破坏的精确控制。[0244]gsl-alk(aop)酶[0245]硫代葡萄糖苷(gsl)是氨基酸衍生的次级代谢物,总是存在于芸苔属植物中,其对健康和农业有益。关于来源于其分解产物(已知具有抗癌特性的萝卜硫素)的健康益处,萝卜硫苷(gra)是研究最多的硫代葡萄糖苷。gra大量存在于许多十字花科物种中,例如西兰花具有含量最高的gra。甘蓝的其他成员例如芥蓝、卷心菜和球芽甘蓝也含有大量的gra。然而,为油籽或叶食用而栽培的许多芸苔属栽培品种含有可忽略不计或少量的gra,包括芥菜。葡糖苷(gna)、黑芥子苷(sin)和芸苔葡糖硫苷(gbn)是芥菜中存在的主要脂肪族硫代葡萄糖苷。[0246]gsl-alk或aop2(即,2-氧代戊二酸依赖性双加氧酶,2-氧代酸依赖性双加氧酶;ec1.14.11.m8)在脂肪族(甲硫氨酸衍生的)硫代葡萄糖苷的次级修饰中起作用,即转化甲基亚磺酰基烷基硫代葡萄糖苷以形成烯基硫代葡萄糖苷,并且还影响脂肪族硫代葡萄糖苷的积累。(参见例如,zhang等人j.exp.bot.66(2):6205-6218(2015);agnieska等人nat.commun.7:13390(2016);neal等人bmcplantbiol10:170(2010);burow等人mol.plant8:1201-1212(2015))。aop2催化有益的萝卜硫苷转化为前告伊春和葡糖苷的有害的分解产物;其在芥菜和大多数栽培的芸苔属植物中以高水平存在。重要的是,aop2还将屈曲花苷(glucoiberin)转化为黑芥子苷的分解产物,其用作黑芥子酶的底物以产生刺激性化合物异硫氰酸烯丙酯(aitc)。[0247]靶向地减少芥菜中的aop2同源物可以带来双重好处;首先,促进萝卜硫苷的积累;其次,防止黑芥子苷的积累。重要的是,对芥菜中四种aop2酶的基于rnai的抑制导致黑芥子苷的急剧减少和萝卜硫苷的显著富集;而对生长没有不想要的影响(augustine和bisht,phytochem.117:43-50(2015))。[0248]在一些实施方案中,aop2基因中靶位点的基因编辑可以通过使用例如crispr-cas效应蛋白(例如cpf1或cas9)的靶向插入/缺失方法进行。这种方法可以提供空间背景,并且可以确保蛋白质功能的破损、破坏和/或损坏,任选地在酶的高度保守和已知的功能区域内。[0249]在一些实施方案中,aop2基因(例如,芥菜aop2基因)中的靶位点的基因编辑可以通过使用包含crispr-cas效应蛋白和例如胞苷脱氨酶或腺苷脱氨酶的碱基编辑融合蛋白的稳定和靶向的碱基编辑方法进行。使用这种方法,可以选择性地和精确地对特定残基进行碱基编辑。[0250]因此,如本文所公开的,硫代葡萄糖苷代谢诸如aop2基因的靶向改变可用于减少芥菜植物的刺激性和/或苦味。在一些实施方案中,用于在芥菜植物(例如绿叶蔬菜)中进行基因编辑的基因可以是例如编码芥菜aop2酶的基因(例如bjua.gslalk-1,bjua.gslalk-2,bjub.gslalk-1,bjub.gslalk-2)。在一些实施方案中,可被修饰以降低芥菜植物中的刺激性和/或苦味的aop2基因可以包括编码与seqidno:128、129、130、131、132、659-673或776-781的任一氨基酸序列具有至少80%(例如,约80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)的序列同一性的多肽或包含与seqidno:118、119、120、121、122、123、124、125、126、127或722-736的任一核苷酸序列具有至少80%序列同一性的序列的aop2基因。在一些实施方案中,可被修饰(例如,编辑)以降低芥菜植物中的刺激性和/或苦味的aop2基因可以包括编码seqidno:128-132、659-673或776-781的任一氨基酸序列或包含seqidno:118-127或722-736的任一核苷酸序列的aop2基因。[0251]在一些实施方案中,编辑一个aop2基因以从该编辑的基因产生减少量的aop2多肽或不产生aop2多肽。在一些实施方案中,编辑至少两个aop2基因以从每个编辑的基因产生减少量的aop2多肽或不产生aop2多肽。在一些实施方案中,编辑两个aop2基因以从两个编辑的aop2基因中的每一个产生减少量的aop2多肽或不产生aop2多肽。在一些实施方案中,编辑三个aop2基因以从三个编辑的aop2基因中的每一个产生减少量的aop2多肽或不产生aop2多肽。在一些实施方案中,编辑四个aop2基因以从四个编辑的aop2基因中的每一种产生减少量的aop2多肽或不产生aop2多肽。在一些实施方案中,编辑五个aop2基因以从五个编辑的aop2基因中的每一个产生减少量的aop2多肽或不产生aop2多肽。[0252]在一些实施方案中,aop2基因中的靶向缺失导致框内或框外缺失。在一些实施方案中,aop2基因中的靶向缺失导致产生过早终止密码子和任选截短的多肽的框内或框外缺失。在一些实施方案中,这种靶向缺失是无效等位基因。在一些实施方案中,无效等位基因可以是完全敲除突变aop2等位基因,其中完全敲除突变aop2等位基因导致产生非功能性aop2蛋白或不产生aop2蛋白。[0253]细胞色素p450单加氧酶(cyp79)家族[0254]在一些实施方案中,核心硫代葡萄糖苷生物合成可被抑制以降低刺激性和/或苦味。在一些实施方案中,硫代葡萄糖苷生物合成酶细胞色素p450单加氧酶(cyp79f1)(即高甲硫氨酸n-单加氧酶)(reintanz等人plantcell13(2):351-167(2001);hansen等人j.biol.chem276(14):1178-11085(2001);chen等人plantj.33:923-937(2003);sharma等人plosone11(2):e)150060pages1-17(2016);yin等人molecules20(11):20254-20267(2015))(它调节甲硫氨酸衍生的((等人trendsplantsci.,15:283-290(2010))和支链氨基酸衍生的硫代葡萄糖苷的链延长后的合成通量)可以被靶向用于修饰。例如,拟南芥中cyp79f1的敲除阻止了短链脂肪族硫代葡萄糖苷的合成(reintanz等人plantcel13(2):351-367(2001))。在芥菜中,由于基因内的转座因子插入导致的功能丧失突变导致几乎不含黑芥子苷的植物(sharma等人plosone11(2):e)150060pages1-17(2016))。[0255]因此,本公开内容涉及对硫代葡萄糖苷生物合成的靶向抑制。在一些实施方案中,用于在芥菜植物(例如绿叶蔬菜)中进行基因编辑的候选基因可以是与脂肪族硫代葡萄糖苷的生物合成有关的那些基因,其包括但不限于细胞色素p450单加氧酶家族(cyp79,即高甲硫氨酸n-单加氧酶),例如cyp79f1和cyp79f2。在一些实施方案中,植物中的基因编辑可以是cyp79f1。[0256]在一些实施方案中,cyp79f1和/或cyp79f2同源物或直向同源物中靶位点的基因编辑可以通过使用cpf1或cas9的靶向插入/缺失方法进行。这种方法提供了空间背景,并且可以确保在酶的高度保守和已知的功能区域内蛋白质功能的破损、破坏和/或损坏。[0257]在进一步的实施方案中,cyp79f1和/或cyp79f2同源物或直向同源物中靶位点的基因编辑通过使用包含crispr-cas效应蛋白和胞苷脱氨酶或腺苷脱氨酶的碱基编辑融合蛋白的稳定和靶向碱基编辑方法进行。这种方法可以选择性地和精确地指导靶向特定残基的碱基编辑方法。[0258]在一些实施方案中,cyp79f1基因中靶位点的基因编辑可以通过使用例如crispr-cas效应蛋白(例如cpf1或cas9)的靶向插入/缺失方法进行。这种方法可以提供空间背景,并且可以确保蛋白质功能的破损、破坏和/或损坏,任选地在酶的高度保守和已知的功能区域内。[0259]在一些实施方案中,cyp79f1基因(例如,芥菜cyp79f1基因)中的靶位点的基因编辑可以通过使用包含crispr-cas效应蛋白和例如胞苷脱氨酶或腺苷脱氨酶的碱基编辑融合蛋白的稳定和靶向碱基编辑方法进行。使用这种方法,可以选择性地和精确地对特定残基进行碱基编辑。[0260]因此,如本文所公开的,硫代葡萄糖苷代谢诸如cyp79f1基因的靶向改变可用于减少芥菜植物的刺激性和/或苦味。在一些实施方案中,用于在芥菜植物(例如绿叶蔬菜)中进行修饰以降低刺激性和/或苦味的基因可以是例如编码芥菜cyp79f1酶的基因。在一些实施方案中,可被编辑以减少芥菜植物中的刺激性和/或苦味的cyp79f1基因可以包括编码与seqidno:115、674-679或782-786的任一氨基酸序列具有至少80%(例如,约80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)的序列同一性的多肽的cyp79f1或可以是与seqidno:113,114或737-742的核苷酸序列具有至少80%序列同一性的基因。在一些实施方案中,可被编辑以降低芥菜植物中的刺激性的cyp79f1基因包含seqidno:113,114或737-742的核苷酸序列或编码seqidno:115、674-679或782-786的氨基酸序列。[0261]在一些实施方案中,cyp79f1基因中的靶向缺失导致框内或框外缺失。在一些实施方案中,cyp79f1基因中的靶向缺失导致产生过早终止密码子和任选截短的多肽的框内或框外缺失。在一些实施方案中,这种靶向缺失是无效等位基因。在一些实施方案中,无效等位基因可以是完全敲除突变cyp79f1等位基因,其中完全敲除突变cyp79f1等位基因导致产生非功能性cyp79f1蛋白。[0262]基因编辑通常是指修饰基因组的核苷酸序列的过程,优选以精确或预先确定的方式。本文所述的基因编辑方法的实例包括使用定点核酸酶在基因组中的精确目标位置切割脱氧核糖核酸(dna),从而在基因组内的特定位置产生单链或双链dna断裂的方法。这种断裂可以是并经常是通过天然的内源性细胞过程进行修复,例如同源定向修复(hdr)和非同源末端连接(nhej)。这两个主要的dna修复过程由一系列可替代途径组成。nhej直接连接双链断裂导致的dna末端,有时会丢失或添加核苷酸序列,其可能会破坏或增强基因表达。hdr利用同源序列或供体序列作为模板,在断点处插入定义的dna序列。同源序列可以在内源基因组中,例如姐妹染色单体。或者,供体可以是外源核酸,例如质粒、单链寡核苷酸、双链寡核苷酸、双寡核苷酸或病毒,其具有与核酸酶切割的基因座高度同源的区域,但其还可以包含额外的序列或序列变化,包括可以并入切割的靶基因座中的缺失。第三种修复机制可以是微同源介导的末端连接(mmej),也称为“替代nhej”,其中遗传结果与nhej相似,因为小的缺失和插入可以发生在切割位点。mmej可以利用dna断裂位点两侧的几个碱基对的同源序列来驱动更有利的dna末端连接修复结果,最近的报道进一步阐明了这一过程的分子机制;参见,例如,cho和greenberg,nature518,174-76(2015);kent等人,naturestructuralandmolecularbiology,adv.onlinedoi:10.1038/nsmb.2961(2015);mateos-gomez等人,nature518,254-57(2015);ceccaldi等人,nature528,258-62(2015)。在某些情况下,可根据对dna断裂部位的潜在微同源性的分析来预测可能的修复结果。[0263]“重组”是指在两个多核苷酸之间交换遗传信息的过程,包括但不限于通过非同源末端连接(nhej)和同源重组的供体捕获。为了本公开内容的目的,“同源重组(hr)”是指这种交换的特殊形式,其例如在通过同源定向修复(hdr)机制修复细胞中的双链断裂期间发生。这个过程需要核苷酸序列同源性,使用“供体”分子作为模板来修复“靶标”分子(即经历双链断裂的分子),并被不同地称为“非交换型基因转换”或“短道基因转换”,因为它导致遗传信息从供体转移到靶标。不希望受任何特定理论的束缚,这种转移可以涉及在断裂的靶和供体之间形成的异源双dna的错配校正,和/或合成依赖性链退火,其中供体用于重新合成遗传信息,其将成为靶标和/或相关过程的一部分。这种专门的hr通常导致靶分子序列的改变,使得供体多核苷酸的部分或全部序列掺入靶多核苷酸中。[0264]在各种实施方案中考虑的基因编辑方法包括工程化的核酸酶,其被设计用于结合和切割感兴趣的基因(例如参与硫代葡萄糖苷生物合成或分解的基因(例如,黑芥子酶、aop2和/或cyp79f1))中的靶dna序列。在特定实施方案中考虑的工程化的核酸酶可用于在靶多核苷酸序列中引入双链断裂,该双链断裂可(i)在不存在多核苷酸模板例如供体修复模板的情况下通过非同源末端连接(nhej)修复,或(ii)在存在供体修复模板的情况下通过同源定向修复(hdr)即同源重组修复。在某些实施方案中考虑的工程化的核酸酶也可以被工程化为切口酶,其产生可以使用细胞的碱基切除修复(ber)机制或同源重组(在供体修复模板的存在下)修复的单链dna断裂。[0265]通过序列特异性核酸酶进行基因编辑是本领域已知的。参见例如,(1)carroll,d.(2011)genomeengineeringwithzinc-fingernucleases.genetics,188,773-82;(2)wood,a.j.等人(2011)targetedgeneeditingacrossspeciesusingzfnsandtalens.science(newyork,n.y.),333,307;(3)perez-pinera,p.等人(2012)advancesintargetedgeneediting.currentopinioninchemicalbiology,16,268-77,其各自通过引用整体并入本文。[0266]基因组中核酸酶介导的双链dna(dsdna)断裂可以通过两种主要机制进行修复:非同源末端连接(nhej),它经常导致引入非特异性插入和缺失(indel),或同源定向修复(hdr),它掺入一条同源链作为修复模板。参见例如symington,l.s.和gautier,j.(2011)annualreviewofgenetics,45,247-71,其通过引用整体并入本文。[0267]当序列特异性核酸酶与包含所需突变的同源供体dna构建体一起递送时,与仅供体构建体相比,基因靶向效率提高了1000倍。例如,参见urnov等人(2005)highlyefficientendogenoushumangenecorrectionusingdesignedzinc-fingernucleases.nature,435,646-51,其通过引用整体并入本文。[0268]在一些实施方案中,本公开内容的基因编辑技术用于使用任何基因编辑工具(包括但不限于:zfn、talens、crispr和大范围核酸酶技术)修饰的植物。在一些实施方案中,本公开内容的基因编辑工具包含已定制设计以靶向并切割特定脱氧核糖核酸(dna)序列的蛋白质或多核苷酸。在一些实施方案中,基因编辑蛋白能够直接识别和结合选定的dna序列。在其他实施方案中,本公开内容的基因编辑工具形成复合物,其中核酸酶组分依赖核酸分子将复合物结合和募集至靶dna序列。[0269]在一些实施方案中,单组分基因编辑工具包含能够识别植物基因组中特定dna序列的结合结构域和切割双链dna的核酸酶。本公开内容中教导的基因编辑技术的基本原理是使用允许在植物基因组中引入位点特异性突变或基因的位点特异性整合的工具。[0270]许多方法可用于将基因递送到植物细胞中,例如转染、电穿孔、病毒载体和农杆菌介导的转移。基因可以从质粒载体中瞬时表达。一旦表达,基因产生靶向突变,该突变将稳定遗传,即使在含有该基因的质粒降解后也如此。[0271]可定制的核酸酶可用于在活细胞中制造靶向双链断裂(dsb),其的修复可用于诱导所需的序列变化。两种相互竞争的途径在大多数细胞包括植物细胞中实现修复。通过非同源末端连接(nhej)进行的核酸酶诱导的dsb修复导致高频引入插入/缺失突变(indel)。相比之下,通过使用用户提供的“供体模板”dna的同源定向修复(hdr)进行dsb修复可以导致引入特定的改变(例如,点突变和插入)或将突变序列校正回野生型。[0272]在一些实施方案中,芥菜植物、植物部分或细胞可以通过基因编辑来修饰,该基因编辑利用靶向促成感兴趣的靶基因例如参与硫代葡萄糖苷生物合成或分解的基因(例如,黑芥子酶、aop2和/或cyp79f1)的一个或多个基因座的工程化的核酸酶。不希望受限于任何特定理论,设想工程化的核酸酶被设计为通过基因编辑精确破坏一个或多个感兴趣的靶基因,并且一旦验证核酸酶活性和特异性,导致靶基因表达和/或功能的可预测的破坏(例如,破坏例如在植物中参与硫代葡萄糖苷生物合成或分解的基因(例如,黑芥子酶、aop2和/或cyp79f1)的表达,从而降低植物的刺激性和/或苦味。[0273]本文所述的工程化的核酸酶在靶序列中产生单链dna切口或双链dna断裂(dsb)。此外,可以通过使用两种产生单链缺口的核酸酶(切口酶)在靶dna中实现dsb。每个切口酶切割一条dna链,并且使用两个或更多个切口酶可以在靶dna序列中产生双链断裂(例如,交错的双链断裂)。在其他实施方案中,核酸酶与供体修复模板组合使用,该供体修复模板通过dsb处的同源重组被引入到dna断裂位点处的靶序列中。[0274]适用于基因编辑的本文所述的工程化的核酸酶包含一个或多个dna结合结构域和一个或多个dna切割结构域(例如,一个或多个核酸内切酶和/或核酸外切酶结构域),以及任选地,一个或多个本文考虑的接头。“工程化的核酸酶”是指包含一个或多个dna结合结构域和一个或多个dna切割结构域的核酸酶,其中核酸酶已被设计和/或修饰以结合与dna切割靶序列相邻的dna结合靶序列。工程化的核酸酶可以从天然存在的核酸酶或从先前工程化的核酸酶设计和/或修饰。[0275]可经工程化以结合和切割靶序列的核酸酶的示例性例子包括但不限于归巢核酸内切酶(大范围核酸酶)、megatal、转录激活因子样效应核酸酶(talen)、锌指核酸酶(zfn)和聚集的规则间隔短回文重复序列(crispr)/cas核酸酶系统。[0276]在一些实施方案中,本文考虑的核酸酶包含一个或多个异源dna结合和切割结构域(例如,zfn、talen、megatal),(boissel等人nucleicacidsres42:2591–2601(2014);christian等人genetics186:757–761(2010))。在一些实施方案中,可改变天然存在的核酸酶的dna结合结构域以结合选定的靶位点(例如,已被工程化以结合与同源结合位点不同的位点的大范围核酸酶)。例如,大范围核酸酶已被设计为结合与其同源结合位点不同的靶位点(boissel等人nucleicacidsres42:2591–2601(2014))。在一些实施方案中,核酸酶需要核酸序列以将核酸酶靶向至靶位点(例如,crispr/cas)。[0277]“talen”是指工程化核酸酶,其包含本文其他地方考虑的工程化taledna结合结构域和核酸内切酶结构域(或其核酸内切酶半结构域),并且任选地包含一个或多个接头和/或附加功能结构域,例如末端加工酶的末端加工酶结构域,其表现出5-3'外切核酸酶、5-3'碱性外切核酸酶、3-5'外切核酸酶(例如trex2)、5'瓣状内切核酸酶、解旋酶或不依赖模板的dna聚合酶活性。因此,转录激活因子样效应核酸酶(talen)包含与dna结合结构域融合的非特异性dna切割核酸酶(例如,foki切割结构域),该dna结合结构域可以容易地工程化,使得talen基本上可以靶向任何序列(参见,例如,joungandsander,naturereviewsmolecularcellbiology14:49-55(2013))。用于产生工程化talen的方法在本领域中是已知的,参见,例如u.s.ser.no.61/610,212和reyon等人,naturebiotechnology30,460-465(2012)中描述的基于快速连接的可自动化固相高通量(flash)系统;以及以下描述的方法:bogdanove&voytas,science333,1843-1846(2011);bogdanove等人,curropinplantbiol13,394-401(2010);scholze&boch,j.curropinmicrobiol(2011);boch等人,science326,1509-1512(2009);moscou&bogdanove,science326,1501(2009);miller等人,natbiotechnol29,143-148(2011);morbitzer等人,t.procnatlacadsciusa107,21617-21622(2010);morbitzer等人,nucleicacidsres39,5790-5799(2011);zhang等人,natbiotechnol29,149-153(2011);geissler等人,plosone6,e19509(2011);weber等人,plosone6,e19722(2011);christian等人,genetics186,757-761(2010);li等人,nucleicacidsres39,359-372(2011);mahfouz等人,procnatlacadsciusa108,2623-2628(2011);mussolino等人,nucleicacidsres(2011);li等人,nucleicacidsres39,6315-6325(2011);cermak等人,nucleicacidsres39,e82(2011);wood等人,science333,307(2011);hockemeye等人natbiotechnol29,731-734(2011);tesson等人,natbiotechnol29,695-696(2011);sander等人,natbiotechnol29,697-698(2011);huang等人,natbiotechnol29,699-700(2011);和zhang等人,natbiotechnol29,149-153(2011);其中的每一个都以全文引用的方式并入本文。在一些实施方案中,talen结合并切割促成感兴趣的靶基因的基因座的靶区域,该感兴趣的靶基因可用于产生具有减少的刺激性和/或减少的苦味的植物,例如参与硫代葡萄糖苷生物合成或分解的基因(例如,黑芥子酶、aop2和/或cyp79f1)。[0278]在一些实施方案中,可以通过转录激活因子样(tal)效应核酸酶(talen)修饰感兴趣的植物。talens多肽包含能够识别和结合特定核酸区域的重复多肽臂。通过工程化多肽臂以识别选定的靶序列,tal核酸酶可用于将双链dna断裂引导至特定基因组区域。然后可以通过重组来修复这些断裂,以编辑、删除、插入或以其他方式修改宿主生物的dna。在一些实施方案中,talens单独用于基因编辑(例如,用于基因的缺失或破坏)。在其他实施方案中,tal与供体序列和/或其他重组因子蛋白结合使用,这将有助于非同源末端连接(nhej)过程以替换靶向dna区域。关于本公开内容的tal介导的基因编辑组合物和方法的更多信息,参见美国专利号8,440,432;8,440,432;us8,450,471;us8,586,526;us8,586,363;us8,592,645;us8,697,853;8,704,041;8,921,112;和8,912,138,每个都通过引用并入本文。[0279]“megatal”是指包含工程化的taledna结合结构域和工程化的大范围核酸酶的工程化核酸酶,并且任选地包含一个或多个接头和/或额外的功能结构域,例如末端加工酶的末端加工酶结构域,其表现出5-3'外切核酸酶、5-3'碱性外切核酸酶、3-5'外切核酸酶、5'瓣状内切核酸酶、解旋酶或不依赖模板的dna聚合酶活性。在一些实施方案中,通过靶向参与硫代葡萄糖苷生物合成或分解的基因(例如,黑芥子酶、aop2和/或cyp79f1),可以使用结合并切割促成感兴趣的靶基因的基因座的靶区域的megatal核酸酶来产生具有降低的刺激性和/或降低的苦味的芥菜植物。[0280]“taledna结合结构域”是转录激活物样效应物(tale或tal-效应物)的dna结合部分,其模拟植物转录激活物以操纵植物转录组(参见例如kay等人,2007.science318:648-651)。在特定实施方案中考虑的taledna结合结构域是从头工程化的或来自天然存在的tale。用于衍生和设计dna结合结构域的tale蛋白的说明性实例公开于美国专利号9,017,967和其中引用的参考文献,其通过引用整体并入本文。[0281]在一些实施方案中,感兴趣的植物通过megatal进行修饰。在一些实施方案中,megatal是能够靶向选定的dna序列并诱导dna断裂的工程化内切核酸酶。[0282]“大范围核酸酶”或“归巢核酸内切酶”(he)是源自多种生物体例如细菌、酵母、藻类和植物细胞器的序列特异性核酸内切酶。许多大范围核酸酶是本领域已知的,参见例如wo2012010976(大范围核酸酶变体切割tert基因的dna靶序列);美国专利号8,021,867;8,119,361和8,119,381(i-crei大范围核酸酶);美国专利号7,897,372(具有修饰的特异性的i-crei大范围核酸酶变体),其每一个都通过引用整体并入本文。[0283]在一些实施方案中,归巢核酸内切酶或大范围核酸酶经工程化以结合促成感兴趣的靶基因例如参与硫代葡萄糖苷生物合成或分解的基因(例如,黑芥子酶、aop2和/或cyp79f1)的一个或多个基因座并在该基因座中引入单链切口或双链断裂(dsb)。“归巢核酸内切酶”和“大范围核酸酶”可互换使用,是指识别12-45个碱基对切割位点的天然存在的核酸酶或工程化大范围核酸酶,通常根据序列和结构基序分为五个家族:laglidadg、giy-yig、hnh、his-cys盒和pd-(d/e)xk。[0284]工程化的he在自然界中不存在,并可以通过重组dna技术或随机诱变获得。工程化的he可以通过在天然存在的he或先前工程化的he中进行一种或多种氨基酸改变,例如突变、取代、添加或缺失一个或多个氨基酸来获得。在一些实施方案中,工程化的he包含对dna识别界面的一个或多个氨基酸改变。在特定实施方案中考虑的工程化的he可以进一步包含一个或多个接头和/或额外的功能结构域,例如显示5-3'核酸外切酶、5-3'碱性核酸外切酶,3-5'外切核酸酶、5'瓣状内切核酸酶、解旋酶或不依赖模板的dna聚合酶活性的末端加工酶的末端加工酶结构域。[0285]在一些实施方案中,可以使用大范围核酸酶修饰芥菜植物。在一些实施方案中,大范围核酸酶是经改造的核酸内切酶,其能够靶向选定的dna序列并诱导dna断裂。在一些实施方案中,靶向特定区域的新的大范围核酸酶是通过结合来自各种其他鉴定的核酸酶的dna结合基序的重组技术开发的。在其他实施方案中,通过半原理突变分析产生新的大范围核酸酶,其试图修改现有结合结构域的结构以获得对额外序列的特异性。有关使用大范围核酸酶进行基因组编辑的更多信息,参见silva等人,2011currentgenetherapy11pg11-27;和stoddard等人,2014mobiledna5pg7,其各自通过引用并入本文。[0286]“锌指核酸酶”(zfn)由与非特异性dna切割结构域(例如foki切割结构域)连接的可编程的序列特异性锌指dna结合模块(见上文)组成。制备和使用zfn的方法是本领域已知的,参见例如(maeder等人,2008,mol.cell,31:294-301;joung等人,2010,nat.methods,7:91-92;isalan等人,2001,nat.biotechnol.,19:656-660;sander等人,natmethods.8(1):67-9,2011;bhakta等人,genomeres.23(3):530-8,2013)。在一些实施方案中,zfn在wo2011/017293或wo2004/099366中描述或如在wo2011/017293或wo2004/099366中描述产生,其各自通过引用并入本文。其他合适的zfn描述于美国专利号6,511,808、6,013,453、6,007,988和6,503,717和美国专利申请2002/0160940,其各自通过引用并入本文。[0287]“zfn”是指包含一个或多个锌指dna结合结构域和内切核酸酶结构域(或其内切核酸酶半结构域)的工程化核酸酶,并且任选地包含一个或多个接头和/或另外的功能结构域,例如末端加工酶的末端加工酶结构域,其表现出5-3'外切核酸酶、5-3'碱性外切核酸酶、3-5'外切核酸酶、5'瓣状内切核酸酶、解旋酶或不依赖模板的dna聚合酶活性。在一些实施方案中,锌指核酸酶(zfn)结合并切割促成感兴趣的靶基因(例如参与硫代葡萄糖苷生物合成或分解的基因(例如,黑芥子酶、aop2和/或cyp79f1))的基因座的靶区域。因此,可用于修饰植物以降低其刺激性和/或苦味。[0288]在一些实施方案中,使用两个zfn实现靶向双链切割,每个zfn包含核酸内切酶半结构域可用于重构催化活性切割结构域。在一些实施方案中,用包含一个或多个锌指dna结合结构域和两个核酸内切酶半结构域的单一多肽实现靶向双链切割。[0289]在一些实施方案中,zfn包含如本文讨论的taledna结合结构域、锌指dna结合结构域和如本文讨论的核酸内切酶结构域(或核酸内切酶半结构域)。在一些实施方案中,zfn包含锌指dna结合结构域和大范围核酸酶,如本文所讨论的。[0290]在一些实施方案中,zfn包含具有一个、两个、三个、四个、五个、六个、七个或八个或更多个锌指基序的锌指dna结合结构域和核酸内切酶结构域(或核酸内切酶半结构域)。通常,单个锌指基序的长度约为30个氨基酸。锌指基序包括标准的c2h2锌指和非标准的锌指,例如c3h锌指和c4锌指。[0291]锌指结合结构域可以设计为结合任何dna序列。已经鉴定了给定的3bpdna靶序列的候选锌指dna结合结构域,并且已经设计了模块化组装策略以用于将多个结构域连接成靶向相应复合dna靶序列的多指肽。本领域已知的其他合适方法也可用于设计和构建编码锌指dna结合结构域的核酸,例如噬菌体展示、随机诱变、组合文库、计算机/原理设计、亲和选择、pcr、从cdna或基因组文库克隆、合成结构等。(参见,例如,美国专利号5,786,538;wu等人,pnas92:344-348(1995);jamieson等人,biochemistry33:5689-5695(1994);rebar&pabo,science263:671-673(1994);choo&klug,pnas91:11163-11167(1994);choo&klug,pnas91:11168-11172(1994);desjarlais&berg,pnas90:2256-2260(1993);desjarlais&berg,pnas89:7345-7349(1992);pomerantz等人,science267:93-96(1995);pomerantz等人,pnas92:9752-9756(1995);liu等人,pnas94:5525-5530(1997);griesman&pabo,science275:657-661(1997);desjarlais&berg,pnas91:11-99-11103(1994))。[0292]个体锌指基序与三个或四个核苷酸序列结合。锌指结合结构域被工程化以结合的序列(例如,靶序列)的长度将决定工程化锌指结合结构域中锌指基序的数量。例如,对于锌指基序不与重叠亚位点结合的zfn,六个核苷酸的靶序列由二指结合结构域结合;九个核苷酸的靶序列由三指结合结构域结合等。在特定的实施方案中,靶位点中个体锌指基序的dna结合位点不必是连续的,而是可以被一个或几个核苷酸分开,这取决于多指结合结构域中锌指基序之间的接头序列的长度和性质。[0293]在一些实施方案中,感兴趣的植物通过使用锌指核酸酶进行修饰。zfn技术的三种变型在植物基因组工程化中得到认可(应用范围从在zfn-1和-2技术的情况下产生单突变或短缺失/插入到在zfn-3技术的情况下靶向引入新基因):(1)zfn-1:编码zfn的基因在没有修复模板的情况下被传递到植物细胞。zfn与植物dna结合并产生位点特异性双链断裂(dsb)。天然的dna修复过程(通过非同源末端连接nhej发生)导致位点特异性突变,在一个或仅几个碱基对中,或者导致短的缺失或插入。(2)zfn-2:编码zfn的基因连同与靶向区域同源的修复模板(跨越几千个碱基对)一起被传递到植物细胞。zfn与植物dna结合并产生位点特异性dsb。天然基因修复机制产生位点特异性点突变,例如通过同源重组和修复模板的复制改变一个或几个碱基对。(zfn-3):编码zfn的基因与一段dna一起被传递到植物细胞,其可为数千个碱基对,并且其末端与切割位点两侧的dna序列同源。结果,dna区段以位点特异性方式插入植物基因组中。[0294]“foki”是一种ii型限制性核酸内切酶,包含dna识别结构域和催化(核酸内切酶)结构域。本文所述的融合蛋白可以包括所有foki或仅催化内切核酸酶结构域,例如genbankaccno.aaa24927.1的氨基酸388-583或408-583,例如如wo95/09233,li等人,nucleicacidsres.39(1):359-372(2011);cathomenandjoung,mol.ther.16:1200-1207(2008)中所述的,或miller等人natbiotechnol25:778-785(2007);szczepek等人,natbiotechnol25:786-793(2007);或bitinaite等人,proc.natl.acad.sci.usa.95:10570-10575(1998)中所述的突变形式的foki。还参见tsai等人,natbiotechnol.2014june;32(6):569-76。在一些实施方案中,感兴趣的植物通过foki核酸内切酶进行修饰。[0295]如本文所用,术语“靶向碱基编辑系统”是指蛋白质、核酸或其组合,其能够在被引入细胞时在靶位点取代单个核苷酸并修饰内源性靶dna序列,从而导致一个或多个氨基酸取代。适用于本公开内容的方法的许多基因编辑系统包括但不限于锌指核酸酶系统、talen系统和crispr/cas系统。在一些实施方案中,具有碱基脱氨酶活性的核酸酶灭活的crispr/cas系统用于靶向碱基编辑。在其他方面,使用切口酶。[0296]在一些实施方案中,本发明的“靶向碱基编辑系统”可以介导内源性靶基因序列的改变,例如,通过将一个或多个点突变引入内源性靶序列,例如通过将内源靶序列中的c替换为t(或g替换为a)或a替换为g(或t替换为c)。[0297]在一些实施方案中,靶向碱基编辑系统可以介导由内源靶基因编码的蛋白质表达的变化。在这样的实施方案中,靶向碱基编辑系统可以通过修饰内源性靶dna序列或通过作用于由dna序列编码的mrna产物来调节编码的蛋白质的表达。在一些实施方案中,靶向碱基编辑系统可以导致修饰的内源蛋白质的表达。在一些实施方案中,与未修饰的植物细胞中的相应内源蛋白相比,由靶向碱基编辑系统介导的对内源dna序列的修饰导致修饰的内源蛋白的功能改变。在这样的实施方案中,修饰的内源蛋白的表达水平可以增加、降低或者可以与相应的内源蛋白在未修饰的植物细胞中的表达水平相同或基本相似。[0298]本发明提供了一种靶向碱基编辑系统以编辑植物基因组中的靶核苷酸序列,包括例如以下之一:i)碱基编辑融合蛋白,以及引导核酸;ii)表达构建体,其包含编码碱基编辑融合蛋白的核苷酸序列,和引导核酸;iii)碱基编辑融合蛋白,以及包含编码引导核酸的核苷酸序列的表达构建体;iv)包含编码碱基编辑融合蛋白的核苷酸序列的表达构建体,和包含编码引导核酸的核苷酸序列的表达构建体;v)包含编码碱基编辑融合蛋白的核苷酸序列和编码引导核酸的核苷酸序列的表达构建体;其中碱基编辑融合蛋白包含crispr-cas效应蛋白或其结构域,以及任选地脱氨酶蛋白和/或结构域,并且引导rna可以将所述基因编辑融合蛋白靶向到植物基因组中的靶序列。在一些实施方案中,靶向的碱基编辑融合蛋白包含核酸酶灭活的crispr-cas效应结构域和胞苷脱氨酶结构域。在一些实施方案中,靶向的碱基编辑融合蛋白包含核酸酶灭活的crispr-cas效应结构域和腺苷脱氨酶结构域。[0299]在一些实施方案中,本文所述的靶向基因编辑系统包含作为crispr-cas效应结构域的crispr(聚集的规则间隔短回文重复序列)/cas(crispr关联的)核酸酶系统。在一些实施方案中,crispr/cas系统是2类系统。2类crispr/cas系统分为三种类型:ii型、v型和vi型系统。在一些实施方案中,crispr/cas系统是2类ii型系统,利用cas9蛋白。在一些实施方案中,定点修饰多肽是cas9dna内切核酸酶(或其变体)。[0300]在一些实施方案中,crispr/cas系统是包含cas12蛋白(例如,cas12a(也称为cpf1)、cas12b(也称为c2c1)、cas12c(也称为c2c3)、cas12d(也称为作为casy)和cas12e(也称为casx))的2类v型系统。在一些实施方案中,定点修饰多肽是cas12dna内切核酸酶(或其变体)。在一些实施方案中,crispr/cas系统是2类和vi型系统,利用cas13蛋白(例如,cas13a(也称为c2c2)、cas13b和cas13c)。(参见pyzocha等人,acschemicalbiology,13(2),347-356)。在一些实施方案中,定点修饰多肽是cas13rna核糖核酸内切酶。[0301]cas多肽是指可以与引导分子(例如,grna、sgrna)相互作用并且与引导分子配合地归巢或定位于靶核酸序列(例如,dna靶序列或rna靶序列)的多肽。cas多肽包括天然存在的cas蛋白和工程化的、改变的或以其他方式修饰的cas蛋白,其与天然存在的cas序列在一个或多个氨基酸残基上不同。[0302]引导rna(grna)包含两个片段,dna结合片段和蛋白质结合片段。在一些实施方案中,grna的蛋白质结合片段包含在一个rna分子中并且dna结合片段包含在另一个单独的rna分子中。这样的实施方案在本文中称为“双分子grna”或“两分子grna”或“双grna”。在一些实施方案中,grna是单个rna分子并且在本文中被称为“单引导rna”或“sgrna”。术语“引导rna”或“grna”是包含性的,指的是双分子引导rna和sgrna两者。图1-5提供了来自与黑芥子酶基因序列、aop2基因序列和cyp79f1基因序列比对的引导核酸的间隔序列的图示。[0303]grna的蛋白质结合片段部分包含两个互补的核苷酸片段,它们相互杂交以形成双链rna双体(dsrna双体),其促进与cas蛋白的结合。grna的核酸结合片段(或“核酸结合序列”)包含与特定靶核酸序列互补并能够与其结合的核苷酸序列。grna的蛋白质结合区段与cas多肽相互作用,并且grna分子和定点修饰多肽的相互作用导致cas与内源核酸序列结合并在靶核酸序列内或周围产生一种或多种修饰。靶修饰位点的精确位置由(i)grna和靶核酸序列之间的碱基配对互补性;和(ii)被称为前间隔区相邻基序(pam)的短基序在靶dna序列(称为靶rna序列中的前间隔区侧翼序列(pfs))中的位置来决定。cas与靶核酸序列结合需要pam/pfs序列。多种pam/pfs序列是本领域已知的并且适合与特定的cas内切核酸酶(例如cas9内切核酸酶)一起使用(参见例如natmethods.2013nov;10(11):1116–1121和scirep.2014;4:5405)。在一些实施方案中,pam序列位于靶dna序列中靶修饰位点的50个碱基对内。在一些实施方案中,pam序列位于靶dna序列中靶修饰位点的10个碱基对内。这种方法可以靶向的dna序列仅受pam序列与靶修饰位点的相对距离以及介导序列特异性、grna介导的cas结合的独特的20碱基对序列的存在的限制。在一些实施方案中,pfs序列位于靶rna序列的3'端。在一些实施方案中,靶修饰位点位于靶基因座的5'末端。在一些实施方案中,靶修饰位点位于靶基因座的3'端。在一些实施方案中,靶修饰位点位于靶基因座的内含子或外显子内。[0304]在一些实施方案中,本公开内容提供了编码grna的多核苷酸。在一些实施方案中,grna编码核酸包含在表达载体,例如重组表达载体中。在一些实施方案中,本公开内容提供了编码定点修饰多肽的多核苷酸。在一些实施方案中,编码定点修饰多肽的多核苷酸包含在表达载体,例如重组表达载体中。[0305]在一些实施方案中,添加尿嘧啶dna糖基化酶(glycosylase)(ugi)结构域可以进一步提高碱基编辑效率。在一些实施方案中,本发明的靶向碱基编辑系统还包含碱基切除修复(ber)抑制子。针对dna中u:g配对的存在的细胞dna修复反应可能是植物细胞中核碱基编辑效率降低的原因。尿嘧啶dna糖基化酶在植物细胞中催化从dna去除尿嘧啶,这可启动碱基切除修复,使得u:g对反转为c:g。在一些实施方案中,ber抑制子是尿酰糖基化酶抑制子或其活性结构域。[0306]在一些实施方案中,ber抑制子是尿嘧啶dna糖基化酶(udg)的抑制子。在一些实施方案中,ber抑制子是udg的抑制子。在一些实施方案中,ber抑制子是多肽抑制子。在一些实施方案中,ber抑制子是结合单链dna的蛋白质。例如,ber抑制子可以是塔斯曼尼亚欧文氏菌(erwiniatasmaniensis)单链结合蛋白。在一些实施方案中,ber抑制子是结合尿嘧啶的蛋白质。在一些实施方案中,ber抑制子是结合dna中的尿嘧啶的蛋白质。在一些实施方案中,ber抑制子是无催化活性的udg或其结合结构域。在一些实施方案中,ber抑制子是不从dna切除尿嘧啶的催化失活的udg或其结合结构域。能够抑制(例如,空间阻断)udg的其他蛋白质在本公开内容的范围内。此外,阻断或抑制碱基切除修复的任何蛋白质也在本公开内容的范围内。[0307]碱基切除修复可以被结合编辑的链、阻断编辑的碱基、抑制尿嘧啶dna糖基化酶、抑制碱基切除修复、保护编辑的碱基和/或促进非靶向链的固定的分子抑制。因此,使用本文所述的ber抑制子可以提高能够催化c到u变化的胞苷脱氨酶的编辑效率。[0308]在一些实施方案中,本发明的碱基编辑系统可以包括以下结构域;i)crispr-cas蛋白(dcas9或ncas9)和ii)胞苷脱氨酶,其可融合或连接至ber抑制剂(例如,尿嘧啶dna糖基化酶的抑制剂)。[0309]“尿嘧啶-dna糖基化酶”(udg)是一种恢复dna中的突变的酶。最常见的突变是胞嘧啶脱氨为尿嘧啶。udg修复这些突变,并且udg在dna修复中至关重要。存在各种尿嘧啶-dna糖基化酶和相关的dna糖基化酶(ec),例如尿嘧啶-dna糖基化酶、嗜热尿嘧啶-dna糖基化酶、g:t/u错配特异性dna糖基化酶(mug)和单链选择性单功能尿嘧啶-dna糖基化酶(smug1)。[0310]尿嘧啶dna糖基化酶从dna中去除尿嘧啶,这可能是由于胞嘧啶的自发脱氨基作用或与da相对的du的错误掺入(dna复制过程中)而产生的。该家族的原型成员是大肠杆菌udg,它是最早发现的糖基化酶之一。已在哺乳动物细胞中鉴定出四种不同的尿嘧啶-dna糖基化酶活性,包括ung、smug1、tdg和mbd4,它们的底物特异性和亚细胞定位各不相同。smug1偏好单链dna作为底物,但也从双链dna中去除u。除了未修饰的尿嘧啶外,smug1还可以切除c5环上带有氧化基团的5-羟基尿嘧啶、5-羟基甲基尿嘧啶和5-甲酰基尿嘧啶。[13]tdg和mbd4对双链dna具有严格的特异性。tdg可以去除在与鸟嘌呤相对存在时的胸腺嘧啶二醇,以及在碳5处具有修饰的u的衍生物。[0311]tdg和smug1是负责修复由自发胞嘧啶脱氨引起的u:g错配的主要酶,而通过du错误掺入在dna中产生的尿嘧啶主要由ung处理。mbd4被认为校正由cpg位点中5-甲基胞嘧啶脱氨为胸腺嘧啶而引起的t:g错配。[0312]通过多步碱基切除修复(ber)途径主动去除dna中由于dump错误掺入或胞嘧啶脱氨而产生的尿嘧啶。尿嘧啶的ber由尿嘧啶dna糖基化酶(udg)活性(其切割n-糖苷键并将尿嘧啶切除作为游离碱基,在dna中产生无碱基(无嘌呤/无嘧啶,ap)位点)引发。修复通过后续步骤完成,包括ap部位的切口、间隙剪裁、修复合成和连接。[0313]在一些实施方案中,添加尿嘧啶-dna糖基化酶(udg)例如尿嘧啶n-糖基化酶(ung)可以在靶碱基处诱导各种突变。在一些实施方案中,靶向碱基编辑系统还包含尿嘧啶-dna糖基化酶(udg)。对dna中u:g配对的存在的细胞dna修复反应可能是植物细胞中核碱基编辑效率降低的原因。尿嘧啶dna糖基化酶催化从植物细胞中的dna中去除尿嘧啶,这可启动碱基切除修复,从而使u:g对反转为c:g。在一些实施方案中,对于c:g配对,植物细胞中从dna去除尿嘧啶并不总是逆转为c,而是随机化为其他碱基,例如t、a和g。[0314]在一些实施方案中,可以将尿嘧啶-dna糖基化酶(udg)融合到本发明的靶向碱基编辑系统中,以在感兴趣的靶基因例如编码参与硫代葡萄糖苷生物合成或分解的酶(例如,黑芥子酶、cyp79f1和aop2)的基因中引入稳定和靶向的但随机的单核苷酸取代。[0315]使用本文所述的udg可以增加靶基因(例如,编码参与硫代葡萄糖苷生物合成或分解的酶(例如,黑芥子酶、cyp79f1和aop2)的基因)的靶向的单核苷酸中的碱基随机化。[0316]在一些实施方案中,udg以顺式提供。在一些实施方案中,udg以反式提供。在一些实施方案中,将udg融合到本公开内容中描述的碱基编辑器(或碱基编辑系统)。在其他实施方案中,udg触发dna复制停滞(stall)用于碱基随机化。在其他实施方案中,udg通过dna复制触发dna修复,从而包括碱基随机化。在进一步的实施方案中,天然存在的udg变体可以用作udg结构域。在进一步的实施方案中,非天然存在的udg变体可以用作udg结构域。在进一步的实施方案中,可以对udg进行基因工程化以增强功能性udg活性。[0317]可能还需要“核定位信号”(nls)或任何其他细胞器靶向信号来确保复合物的正确靶向。本公开内容涉及修饰感兴趣的靶基因座中的胞嘧啶,由此靶基因座在植物细胞内。为了改进本公开内容的方法中使用的crispr-cas蛋白和/或胞苷脱氨酶蛋白或其催化结构域对细胞核的靶向,可能有利的是向这些组分中的一种或两种提供一种或多种核定位序列(nls)。[0318]在一些实施方案中,nls对于待定位于核酸酶的蛋白质可以是异源的。通常,nls由一个或多个暴露在蛋白质表面上的带正电荷的赖氨酸或精氨酸的短序列组成,但其他类型的nls也是本领域已知的。在一些实施方案中,基因编辑融合蛋白的n末端包含具有氨基酸序列的nls。在一些实施方案中,基因编辑融合蛋白的c端包含nls。[0319]取决于待编辑的dna的位置,碱基编辑融合蛋白还可以包括其他定位序列,例如细胞质定位序列、叶绿体定位序列、线粒体定位序列等。为了在植物中获得有效表达,在一些实施方案中,编码碱基编辑融合蛋白的核苷酸序列针对待碱基编辑的植物进行密码子优化。[0320]密码子优化是指通过替换天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50或更多个密码子)为在宿主细胞的基因中使用更频繁或最频繁的密码子同时保持天然氨基酸序列来修饰核酸序列以用于在宿主细胞中增加表达的过程。各种物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏倚(生物体之间密码子使用的差异)通常与信使rna(mrna)的翻译效率相关,而信使rna(mrna)的翻译效率又被认为取决于(除其他以外)被翻译的密码子的性质和特定转运rna(trna)分子的可用性。细胞中所选trna的优势通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以在给定生物体中实现最佳基因表达。密码子使用表很容易获得,例如,在www.kazusa.orjp/codon/上可用的“密码子使用数据库”中,这些表可以以多种方式进行调整。参见nakamura,y.,等人"codonusagetabulatedfromtheinternationaldnasequencedatabases:statusfortheyear2000"nucl.acidsres.28:292(2000)。[0321]在一些实施方案中,本文提供了编码碱基编辑融合蛋白的密码子优化的核苷酸序列。在一些实施方案中,引导rna是单一引导rna(sgrna)。根据给定的靶序列构建合适的sgrna的方法是本领域已知的。参见例如wang,y.等人nat.biotechnol.32,947-951(2014);shan,q.等人nat.biotechnol.31,686-688(2013);liang,z.等人jgenetgenomics.41,63-68(2014)。[0322]包含含有一种或多种黑芥子酶、cyp79f1或aop2的硫代葡萄糖苷途径的任何植物或植物部分都可以用于本发明。在一些实施方案中,可用于本发明的植物或植物部分可以属于十字花目。在一些实施方案中,可用于本发明的植物可以属于十字花科、辣木科(例如辣木属)和/或番木瓜科(例如木瓜(c.papaya))。在一些实施方案中,植物是芸苔属的物种,包括但不限于巴利阿里芸苔(b.balearica)(马洛卡卷心菜(mallorcacabbage))、埃塞俄比亚芥(b.carinata)(阿比西尼亚芥菜(abyssinianmustard)或阿比西尼亚卷心菜,用于生产生物柴油)、长叶芥菜(b.elongata)(细长芥菜))、b.fruticulosa(地中海卷心菜)、b.hilarionis(sthilarion卷心菜)、芥菜(b.juncea)(印度芥菜、棕色和叶芥菜、sarepta芥菜)、甘蓝油菜(b.napus)(油菜籽、菜籽、大头菜、西伯利亚羽衣甘蓝(瑞典甘蓝、瑞典芜菁,芜菁甘蓝)),塌棵菜(b.narinosa)(塌棵芥菜),黑芥(b.nigra)(黑芥菜),甘蓝(b.oleracea)(羽衣甘蓝(kale),卷心菜,散叶甘蓝(collardgreen),西兰花,花椰菜,芥兰,球芽甘蓝,大头菜),b.perviridis(嫩绿菜(tendergreen),芥菜菠菜),芜菁(b.rapa)(同义词芸苔(b.campestris))(大白菜,萝卜,西洋菜台,小松菜),b.rupestris(棕色芥菜)和b.tournefortii(亚洲芥菜)。[0323]在一些实施方案中,植物或植物部分是芥菜植物。示例芥菜植物(或其部分)包括但不限于羽衣甘蓝植物或其部分、散叶甘蓝植物或其部分、菠菜植物或其部分、卷心菜植物或其部分、甜菜植物或其部分、豆瓣菜物或其部分、莴苣植物或其部分(例如长叶莴苣)、瑞士甜菜植物或其部分、芝麻菜植物或其部分、菊苣植物或其部分、白菜植物或其部分、芜菁甘蓝植物或其部分、芜菁植物或其部分、芥菜植物或其部分、卷心菜植物或其部分、西兰花植物或其部分、花椰菜植物或其部分、球芽甘蓝植物或其部分、萝卜植物或其部分或大头菜植物或其部分。在一些实施方案中,芥菜植物或其部分可包括但不限于甘蓝(brassicaoleracea)(例如,b.oleraceavar.oleracea、b.oleraceavar.capitata、b.oleraceavar.botrytis、b.oleraceavar.gemmifera、b.oleraceavar.sabauda、b.oleraceavar.gongyiodes、b.oleraceavar.italic、b.oleraceavar.sabellica、b.oleraceavar.acephala)、芥菜(brassicajuncea)、芜菁(b.rapasubsp.pekinensis、b.rapasubsp.chinensis、b.rapasubsp.rapa)、brassicanapas、埃塞俄比亚芥(brassicacarinata)、芸苔(brassicacampestris)、黑芥(brassicanigra)或野芥菜(raphanusraphanistrum)(例如raphanusraphanistrumsubsp.sativus)。[0324]如本文所述的靶向基因编辑系统的方法可用于赋予基本上任何植物所需的性状。可以使用本公开内容的核酸构建体和各种转化方法对多种植物和植物细胞系统进行工程化以获得本文所述的所需生理学和农艺学特征。在优选的实施方案中,用于基因编辑的靶植物和植物细胞包括但不限于十字花科植物,包括但不限于巴利阿里芸苔(b.balearica)(马洛卡卷心菜(mallorcacabbage))、埃塞俄比亚芥(b.carinata)(阿比西尼亚芥菜(abyssinianmustard)或阿比西尼亚卷心菜,用于生产生物柴油)、长叶芥菜(b.elongata)(细长芥菜))、b.fruticulosa(地中海卷心菜)、b.hilarionis(sthilarion卷心菜)、芥菜(b.juncea)(印度芥菜、棕色和叶芥菜、sarepta芥菜)、甘蓝油菜(b.napus)(油菜籽、菜籽、大头菜、西伯利亚羽衣甘蓝(瑞典甘蓝、瑞典芜菁,芜菁甘蓝)),塌棵菜(b.narinosa)(塌棵芥菜),b.rapab.nigra(黑芥菜),甘蓝(b.oleracea)(羽衣甘蓝(kale),卷心菜,散叶甘蓝(collardgreen),西兰花,花椰菜,芥兰,球芽甘蓝,大头菜),b.perviridis(嫩绿菜(tendergreen),芥菜菠菜),b.carinata,b.campestris,芜菁(b.rapa)(同义词芸苔(b.campestris))(大白菜,萝卜,西洋菜台,小松菜),b.rupestris(棕色芥菜)和b.tournefortii(亚洲芥菜)或野芥菜。[0325]本公开内容提供了用于在植物细胞、组织、器官或植物中进行靶向编辑的方法。一方面,本公开内容提供了通过基因编辑系统的瞬时表达来生产基因编辑植物的方法。本公开内容教导了一种基因编辑的植物,其也是无转基因的,没有外源dna的任何整合。[0326]本发明还提供了一种通过使用rnp介导的转染编辑工具的的无dna递送和原生质体再生来生产基因编辑植物的方法。[0327]在一些实施方案中,如本文所述的靶向基因编辑系统用于引入靶向突变,例如插入、缺失或取代,从而导致无义突变(例如,过早终止密码子)或错义突变(例如,编码不同的氨基酸残基)。在某些内源基因中的单核苷酸突变可以赋予或促成所需性状的情况下,这是令人感兴趣的。[0328]本文所述的方法导致产生与野生型植物相比具有一种或多种所需性状的基因编辑植物。[0329]在一些实施方案中,获得了非转基因的基因编辑的植物、植物部分或细胞,其中没有将外源dna序列掺入植物的任何植物细胞的基因组中。在这样的实施方案中,基因编辑的植物是非转基因的。在仅确保对内源基因进行修饰而没有在植物基因组中引入或保持外源基因的情况下,所得的遗传修饰的作物不含外源基因,因此基本上可以认为是非转基因的。[0330]在一些实施方案中,通过在植物细胞中引入或产生碱基编辑融合蛋白和引导核酸可简单地实现对靶序列的修饰,并且该修饰可以稳定遗传,而不需要用碱基编辑系统稳定转化植物。[0331]在一些实施方案中,多核苷酸通过dna病毒(例如双生病毒)或rna病毒(例如烟草脆裂病毒)递送到细胞中。在其他实施方案中,引入步骤包括向植物细胞递送包含编码crispr-cas蛋白、胞苷脱氨酶和引导核酸的一个或多个多核苷酸序列的t-dna,其中通过农杆菌进行递送。编码胞苷脱氨酶偶联的crispr/cas系统的组分的多核苷酸序列可以可操作地连接至启动子,例如组成型启动子(例如,花椰菜花叶病毒35s启动子),或本文描述的感兴趣的植物细胞中的细胞特异性或诱导型启动子。在其他实施方案中,通过微粒轰击引入多核苷酸。[0332]在一些实施方案中,核酸的引入可以在没有选择压力的情况下进行,从而避免外源核苷酸序列在植物基因组中的整合。在一些实施方案中,引入包括将碱基编辑系统转化到分离的植物细胞或组织中,然后将转化的植物细胞或组织再生为完整的植物。优选地,再生在没有选择压力的情况下进行,即在组织培养期间不使用针对表达载体上携带的选择基因的选择剂。在不使用选择剂的情况下,可以提高植物的再生效率以获得不含外源核苷酸序列的修饰的植物。[0333]在一些实施方案中,碱基编辑系统可以通过本领域已知或以后开发的任何方法引入植物,包括但不限于粒子轰击、peg介导的原生质体转化、农杆菌介导的转化、植物病毒介导的转化、花粉管和子房注射。[0334]在一些实施方案中,本公开内容的基因编辑系统可以转化到完整植物上的特定位点,例如叶、芽尖、花粉管、幼穗或下胚轴。这特别适用于难以通过组织培养再生的植物的转化。在一些实施方案中,将体外表达的蛋白质和/或体外转录的rna分子直接转化到植物中。蛋白质和/或rna分子能够在植物细胞中实现基因编辑,随后被细胞降解以避免外源核苷酸序列整合到植物基因组中。[0335]在一些实施方案中,靶序列与植物性状如所需性状相关,因此基因编辑导致植物相对于野生型植物具有改变的性状。在本公开内容中,待修饰的靶序列可以位于基因组中的任何位置,例如,在功能基因诸如蛋白质编码基因内,或者,例如,可以位于基因表达调节区,例如启动子区域或增强子区域中,从而完成所述基因的功能修饰或完成基因表达的修饰。[0336]在一些实施方案中,该方法进一步包括获得基因编辑植物的后代,其也可以是非转基因的。在另一方面,本发明还提供了一种基因编辑的植物或其后代或其部分,其中该植物是通过上述方法获得的。[0337]在一些方面,本公开内容还提供了一种植物育种方法,包括将通过本公开内容的上述方法获得的第一基因编辑植物与不含所述遗传修饰的第二植物杂交,从而将所述遗传修饰引入到所述第二植物中。在一些实施方案中,包含如本文所述的第一编辑基因的第一非转基因植物和包含如本文所述的第二编辑基因的第二非转基因植物可以彼此杂交,其中所包含的后代被选择为同时包含第一和第二编辑基因。因此,例如,在黑芥子酶基因(一个或多个黑芥子酶基因)中包含非天然突变的第一非转基因植物可以与在aop2基因(一个或多个aop2基因)和/或cyp79f1基因(一个或多个cyp79f1基因)中包含非天然突变的第二非转基因植物杂交,并选择包含黑芥子酶基因和aop2基因和/或cyp79f1基因中的非天然突变的后代。[0338]在一些实施方案中,该方法可以包括从植物细胞再生植物的步骤。在进一步的实施方案中,该方法包括杂交植物以获得遗传所需的植物谱系。例如,本发明的植物可以与本发明的另一种植物杂交以提供包含在一个或多个黑芥子酶基因、一个或多个cyp79f1基因和/或一个或多个aop2基因中的非天然突变的后代植物。如本领域技术人员将理解的,包含其他所需基因的植物可以杂交到本发明的植物中。[0339]本发明涉及用于生产在风味和/或气味方面具有降低的刺激性和/或苦味的植物或其部分(例如,十字花目植物或其部分)的方法和组合物。在一些实施方案中,本发明提供了用于生产在风味和/或气味方面具有降低的刺激性和/或苦味的芥菜植物的方法和组合物。因此,本发明提供了一种芥菜植物(例如十字花科,例如芸苔属)、辣木科植物和/或番木瓜科植物或其部分,其在编码细胞色素p450单加氧酶(即cyp79f1,高甲硫氨酸n-单加氧酶;ec1.14.14.42)的内源基因、编码2-氧代酸依赖性双加氧酶(即aop2,2-氧代戊二酸依赖性双加氧酶;ec1.14.11.m8)的内源基因和/或编码黑芥子酶(即,葡萄糖苷酶、硫葡糖苷酶(例如,β-硫葡糖苷酶)、硫代葡萄糖苷葡糖水解酶;ec3.2.1.147(ec3.2.3.1转移至3.2.1.147))的内源基因中包含至少一个非天然突变。在一些实施方案中,在内源基因中包含至少一个非天然突变的芥菜植物或其部分表现出活性降低,例如编码cyp79f1的内源基因、编码aop2的内源基因和/或编码黑芥子酶的内源基因的转录活性或翻译活性降低(例如,产生的蛋白质的量减少(例如,减少约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100%)和/或由内源基因产生的蛋白质的活性降低(例如,活性降低约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、或100%))。[0340]在一些实施方案中,与在相同的环境条件下生长的植物(或其部分)相比,在内源基因中包含至少一个非天然突变的芥菜植物或其部分表现出减少的硫代葡萄糖苷水解和在风味和香气方面减少的刺激性和/或减少的苦味。在一些实施方案中,在编码黑芥子酶的内源基因中包含至少一个非天然突变的芥菜植物或其部分表现出减少的硫代葡萄糖苷水解。如本文所用,“减少的硫代葡萄糖苷水解”是指硫氰酸盐的减少的产生或硫氰酸盐的减少的量,任选地其中异硫氰酸盐是烯丙基异硫氰酸盐,和/或是指黑芥子苷(即,烯丙基硫代葡萄糖苷或2-丙烯基硫代葡萄糖苷)的减少的水解和导致葡萄糖的减少的产生。[0341]在一些实施方案中,在内源基因中包含至少一个天然突变的芥菜植物或其部分表现出烯基硫代葡萄糖苷的减少的量或减少的产生,其中芥菜植物或其部分与在相同环境条件下生长的植物相比表现出在味道和香气方面减少的刺激性和/或减少的苦味。在一些实施方案中,与在相同环境条件下生长的植物(或其部分)相比,在编码aop2的内源基因中包含至少一个非天然突变的芥菜植物或其部分表现出烯基硫代葡萄糖苷的减少的量或减少的产生。[0342]在一些实施方案中,在内源基因中包含至少一个非天然突变的芥菜植物或其部分表现出脂肪族硫代葡萄糖苷的减少的量/产生,其中芥菜植物或其部分与在相同环境条件下生长的植物(或其部分)相比表现出在风味和香气方面降低的刺激性和/或降低的苦味。在一些实施方案中,与在相同环境条件下生长的植物(或其部分)相比,在编码cyp79f1的内源基因中包含至少一个非天然突变的芥菜植物或其部分表现出烯基硫代葡萄糖苷的减少的量或减少的产生。[0343]在一些实施方案中,本发明的芥菜植物与不包含相同突变且在相同环境条件下生长的植物相比表现出降低的刺激性。在一些实施方案中,与在相同环境条件下生长的不包含相同突变的植物相比,本发明的芥菜植物表现出降低的苦味。在一些实施方案中,本发明的芥菜植物表现出降低的刺激性和降低的苦味。在一些实施方案中,本发明的芥菜植物在至少一种黑芥子酶基因中包含突变并且表现出降低的苦味。在一些实施方案中,本发明的芥菜植物在至少一种aop2基因中包含突变并且与不包含相同突变并且在相同环境条件下生长的植物相比表现出降低的刺激性和降低的苦味。在一些实施方案中,本发明的芥菜植物在至少一个cyp79f1基因中包含突变并且与不包含相同突变并且在相同环境条件下生长的植物相比表现出降低的刺激性和降低的苦味。[0344]本发明进一步提供一种芥菜植物或其部分(例如植物细胞),其在风味或香气方面具有降低的刺激性或苦味(例如,硫代葡萄糖苷的减少的水解和/或烯基硫代葡萄糖苷和/或脂肪族硫代葡萄糖苷的减少的量/产生)(与不包含相同突变且在相同环境条件下生长的植物相比),其在内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中包含至少一个非天然突变,其中所述至少一个突变是使用编辑系统引入的取代、插入或缺失,该编辑系统包含与内源黑芥子酶基因、内源aop2基因或内源cyp79f1基因中的靶位点结合的核酸结合结构域。[0345]因此,在一些实施方案中,本发明的芥菜植物表现出降低的刺激性。在一些实施方案中,本发明的芥菜植物表现出降低的苦味。在一些实施方案中,本发明的芥菜植物表现出降低的刺激性和降低的苦味。在一些实施方案中,本发明的芥菜植物在至少一个黑芥子酶基因中包含突变并且表现出降低的苦味。在一些实施方案中,本发明的芥菜植物在至少一个aop2基因中包含突变并且表现出降低的刺激性和降低的苦味。在一些实施方案中,本发明的芥菜植物在至少一个cyp79f1基因中包含突变并且表现出降低的刺激性和降低的苦味。降低的刺激性和降低的苦味是与不包含相同突变且在相同环境条件下生长的对照植物相比较的。[0346]在一些实施方案中,至少一个非天然突变是显性抑制等位基因、半显性等位基因、弱功能丧失等位基因、无效等位基因、超等位基因突变或亚等位基因突变。在一些实施方案中,至少一个非天然突变是无效等位基因。在一些实施方案中,无效等位基因是完全敲除突变cyp79f1等位基因、完全敲除突变aop2等位基因和/或完全敲除突变黑芥子酶等位基因。如本文所用,“完全敲除突变等位基因”导致产生非功能性蛋白质或不产生蛋白质(由至少一个非天然突变编码),例如产生非功能性cyp79f1蛋白质或不产生cyp79f1,产生非功能性aop2蛋白或不产生aop2蛋白,和/或产生非功能性黑芥子酶蛋白或不产生黑芥子酶蛋白。[0347]芥菜植物或其部分(包括例如植物细胞)的黑芥子酶基因、aop2基因或cyp79f1基因中的突变可以是任何类型的突变,包括碱基置换、缺失和/或插入。在一些实施方案中,非天然突变是点突变。在一些实施方案中,非天然突变可以是至少一个碱基对的取代、至少一个碱基对的缺失或至少一个碱基对的插入。在一些实施方案中,非天然突变可包括对a、t、g或c的碱基取代。在一些实施方案中,碱基取代可产生过早终止密码子,从而不产生蛋白质或截短的蛋白质,任选其中截短的蛋白质是非功能性的。在一些实施方案中,碱基的缺失可导致框内或框外突变,任选地其中框内或框外突变导致过早终止密码子。在一些实施方案中,导致过早终止密码子的基因突变不产生多肽或产生非功能性多肽,任选地其中非功能性多肽是截短的多肽。[0348]在一些实施方案中,突变可包括缺失黑芥子酶基因的至少1个碱基对至约1000、1500、2000或2500个或更多个碱基对(例如,1、3、6、9、15、20、30、40、50、100、150、200、300、400或500个碱基对至约600、700、800、900、1000、1500、2000或2500个碱基对或更多,或其中的任何范围或值,任选地其中缺失的碱基对是连续的碱基对)。在一些实施方案中,黑芥子酶基因中的缺失可导致框内或框外突变,任选地其中框内或框外突变导致过早终止密码子。在一些实施方案中,缺失可以是黑芥子酶基因全长的缺失。在一些实施方案中,缺失位于黑芥子酶基因的5'端。在一些实施方案中,可用于本发明的缺失可导致包含该缺失的基因不产生黑芥子酶蛋白或可导致非功能性的截短的黑芥子酶蛋白(例如,无效突变或无效等位基因),任选地其中蛋白质的截短包括从蛋白质的c端截短至少约50至约300个连续氨基酸残基或更多(例如,多肽的c端氨基酸残基至约50至约300个连续氨基酸残基)(例如,约50、55、60、65、70、75、80、85、90、95、100、120、140、160、180、200、220、240、260、280、300个或更多个连续氨基酸残基)。可用于本发明的植物可包含编码黑芥子酶多肽的多个基因座。在一些实施方案中,多个基因座(例如,2、3、4、5、6、7、8、9、10、11、12、13或更多个)中的一个或两个或更多个基因座或所有基因座可被编辑以包含如本文所述的非天然突变。[0349]在一些实施方案中,在黑芥子酶基因中包含碱基取代的非天然突变可以产生过早终止密码子,其中过早终止密码子导致通过突变的黑芥子酶基因不产生黑芥子酶蛋白或产生截短的黑芥子酶蛋白(例如,无效突变或无效等位基因),任选地其中截短的黑芥子酶蛋白是非功能性的。在一些实施方案中,由黑芥子酶基因中的碱基取代产生的截短的黑芥子酶多肽包含距蛋白质的c-末端至少约50至约300个连续氨基酸残基或更多(例如,多肽的c-末端氨基酸残基至约50至约300个连续氨基酸残基)(例如,约50、55、60、65、70、75、80、85、90、95、100、120、140、160,180、200、220、240、260、280、300或更多个连续氨基酸残基)的截短。[0350]在一些实施方案中,黑芥子酶基因中的至少一个非天然突变(例如,三个或更多个连续碱基对的缺失或一个或多个碱基对的取代)导致从突变的黑芥子酶基因产生的黑芥子酶多肽的至少一个氨基酸残基的缺失(例如,至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、220、250、300、320、350、360、370、380、390、400、410、420、440、445、450、451、452、453、454、455、456、457、458、459或460个氨基酸,或其中的任何范围或值)。在一些实施方案中,黑芥子酶基因中的缺失导致来自黑芥子酶多肽的两个或更多个连续氨基酸残基的缺失。[0351]在一些实施方案中,植物可包含一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13或更多个),或两个或更多个内源性黑芥子酶基因(例如,2、3、4、5、6、7、8、9、10、11、12、13或更多个)。在一些实施方案中,包含一个或多个内源黑芥子酶基因的本发明的植物或其部分可以在至少一个内源黑芥子酶基因中包含非天然突变,其中所述突变导致产生减少的量的黑芥子酶或不产生黑芥子酶以及具有降低的刺激性的植物或其部分。在一些实施方案中,包含一个或多个内源黑芥子酶基因的本发明的植物或其部分可以包含一个内源黑芥子酶基因的非天然突变,其中该突变导致产生减少的量的黑芥子酶或不产生黑芥子酶以及具有降低的刺激性的植物或其部分。在一些实施方案中,本发明的植物或其部分可以包含两个内源黑芥子酶基因中的非天然突变,其中两个基因中的突变导致产生减少的量的黑芥子酶或没有产生黑芥子酶以及具有降低的刺激性的植物或其部分。在一些实施方案中,本发明的植物或其部分可包含三个内源黑芥子酶基因中的非天然突变,其中三个基因中的突变导致产生减少的量的黑芥子酶或没有产生黑芥子酶以及具有降低的刺激性的植物或其部分。在一些实施方案中,本发明的植物或其部分可包含四个内源黑芥子酶基因中的非天然突变,其中四个基因中的突变导致产生减少的量的黑芥子酶或没有产生黑芥子酶,以及具有降低的刺激性的植物或其部分。[0352]在一些实施方案中,本发明的植物或其部分可包含五个内源黑芥子酶基因中的非天然突变,其中五个基因中的突变导致产生减少的量的黑芥子酶或没有产生黑芥子酶,以及具有降低的刺激性的植物或其部分。在一些实施方案中,本发明的植物或其部分可包含六个内源黑芥子酶基因中的非天然突变,其中所述六个基因中的突变导致产生减少的量的黑芥子酶或不产生黑芥子酶,以及具有降低的刺激性的植物或其部分。在一些实施方案中,本发明的植物或其部分可包含7、8、9、10、11、12或13或更多个内源黑芥子酶基因中的非天然突变,其中7、8、9、10、11、12或13个或更多个基因的每一个中的突变导致产生减少的量的黑芥子酶或不产生黑芥子酶,以及具有降低的刺激性的植物或其部分。降低的刺激性是与不包含相同突变且在相同环境条件下生长的对照植物相比较的。[0353]在一些实施方案中,编码黑芥子酶的内源基因包含与seqidno:66-92、680-721的核苷酸序列中的任一个具有至少80%(例如,约80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:93-105、617-658或743-775的氨基酸序列中的任一个具有至少80%序列同一性的多肽。[0354]在一些实施方案中,突变可包括缺失aop2基因的至少1个碱基对至约1000、1500、1750、2000、2500、3000、3500、4000、4500、5000或5600个碱基对或更多(例如、1、3、6、9、15、20、30、40、50、100、150、200、300、400、500、600、700、800、900个碱基对至约1000、1500、2000、2500、3000、3500、4000、4500、5000或5600个碱基对或其中的任何范围或值,任选地其中缺失的碱基对是连续的碱基对)。在一些实施方案中,aop2基因中的缺失可导致框内或框外突变,任选地其中框内或框外突变导致过早终止密码子。在一些实施方案中,缺失可以是aop2基因全长的缺失。在一些实施方案中,缺失位于aop2基因的5'端。在一些实施方案中,可用于本发明的缺失可导致包含缺失的基因不产生aop2蛋白或可导致非功能性的截短的aop2蛋白(例如,无效突变或无效等位基因),任选地其中蛋白质的截短包括从蛋白质的c末端截短至少约50至约300个连续氨基酸残基或更多(例如,多肽的c末端氨基酸残基至约50至约300个连续氨基酸残基)(例如,约50、55、60、65、70、75、80、85、90、95、100、120、140、160、180、200、220、240、260、280,300个或更多个连续氨基酸残基,或其中的任何范围或值)。[0355]在一些实施方案中,在aop2基因中包含碱基取代的非天然突变可以产生过早终止密码子,其中过早终止密码子导致通过突变的aop2基因不产生aop2蛋白或产生截短的aop2蛋白(例如,无效突变或无效等位基因),任选地其中截短的aop2蛋白是非功能性的。在一些实施方案中,由aop2基因中的碱基取代产生的截短的aop2多肽包含从蛋白质的c-末端至少约50至约300个连续氨基酸残基或更多(例如,多肽的c-末端氨基酸残基至约50至约300个连续氨基酸残基)(例如,约50、55、60、65、70、75、80、85、90、95、100、120、140、160,180、200、220、240、260、280、300或更多个连续氨基酸残基)的截短。[0356]在一些实施方案中,aop2基因中的至少一个非天然突变(例如,三个或更多个连续碱基对的缺失或一个或多个碱基对的取代)导致从突变的黑芥子酶基因产生的aop2多肽的至少一个氨基酸残基的缺失(例如,1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、220、250、300、320、350、360、370、380、390、400、410、420、425、430、431、432、433、434、435、436、437、438或439个氨基酸,或其中的任何范围或值)。在一些实施方案中,aop2基因中的缺失导致来自aop2多肽的两个或更多个连续氨基酸残基的缺失。[0357]在一些实施方案中,编码aop2的内源基因包含与seqidno:118-127或722-736的任何一个核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:128-132、659-673或776-781的任一氨基酸序列具有至少80%序列同一性的多肽。[0358]在一些实施方案中,突变可包括缺失cyp79f1基因的至少1个碱基对至约1000、1500、2000或2100个碱基对或更多(例如,1、3、6、9、15、20、30、40、50、100、150、200、300、400、500、600、700、800、900个碱基对至约1000、1200、1400、1600、1800、1900、2000或2100个碱基对或更多,或任何其中的范围或值,任选地其中缺失的碱基对是连续的碱基对)。在一些实施方案中,cyp79f1基因中的缺失可导致框内或框外突变,任选地其中框内或框外突变导致过早终止密码子。在一些实施方案中,缺失可以是cyp79f1基因全长的缺失。在一些实施方案中,缺失位于cyp79f1基因的5'端。在一些实施方案中,可用于本发明的缺失可导致包含缺失的基因不产生cyp79f1蛋白或可导致非功能性的截短的cyp79f1蛋白(例如,无效突变或无效等位基因),任选地其中蛋白质的截短包括从蛋白质的c末端截短至少约50至约350个连续氨基酸残基或更多(例如,多肽的c末端氨基酸残基至约50至约300个连续氨基酸残基)(例如,约50、55、60、65、70、75、80、85、90、95、100、120、140、160、180、200、220、240、260、280、300、320、340或350个或更多个连续氨基酸残基)。[0359]在一些实施方案中,在cyp79f1基因中包含碱基取代的非天然突变可以产生过早终止密码子,其中过早终止密码子导致通过突变的cyp79f1基因不产生cyp79f1蛋白或截短的cyp79f1蛋白(例如,无效突变或无效等位基因),任选地其中截短的cyp79f1蛋白是非功能性的。在一些实施方案中,由cyp79f1基因中的碱基取代产生的截短的cyp79f1多肽包含从蛋白质的c-末端至少约50至约350个或更多连续氨基酸残基的截短(例如,多肽的c末端氨基酸残基至约50至约300个连续氨基酸残基)(例如,约50、55、60、65、70、75、80、85、90、95、100、120、140、160,180、200、220、240、260、280、300、320、340、350或更多个连续氨基酸残基)。[0360]在一些实施方案中,cyp79f1基因中的至少一个非天然突变(例如,三个或更多个连续碱基对的缺失或一个或多个碱基对的取代)导致从突变的cyp79f1基因产生的cyp79f1多肽的至少一个氨基酸残基的缺失(例如,1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、220、250、300、320、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、531、532、534、535、536、537、538、539、540或541个氨基酸,或其中的任何范围或值)。在一些实施方案中,cyp79f1基因中的缺失导致来自cyp79f1多肽的两个或更多个连续氨基酸残基的缺失。[0361]在一些实施方案中,植物可包含一个或多个(例如,1、2、3、4、5个或更多个),或两个或更多个内源aop2基因(例如,2、3、4、5个或更多个)。在一些实施方案中,包含一个或多个内源性aop2基因的本发明的植物或其部分可包含至少一个内源aop2基因中的非天然突变,其中所述突变导致产生减少的量的aop2或不产生aop2和具有降低的刺激性和/或苦味的植物或其部分。在一些实施方案中,包含一个或多个内源aop2基因的本发明的植物或其部分可以包含一个内源aop2基因的非天然突变,其中该突变导致产生减少的量的aop1或不产生aop2,以及具有降低的刺激性和/或苦味的植物或其部分。在一些实施方案中,本发明的植物或其部分可包含两个aop2基因中的非天然突变,其中两个基因中的突变导致产生减少的量的aop2或没有产生aop2,以及具有降低的刺激性和/或苦味的植物或其部分。在一些实施方案中,本发明的植物或其部分可以包含三个内源aop2基因中的非天然突变,其中这三个基因中的突变导致产生减少的量的aop2或没有产生aop2,以及具有降低的刺激性和/或苦味的植物或其部分。在一些实施方案中,本发明的植物或其部分可包含四个内源aop2基因中的非天然突变,其中四个基因中的突变导致产生减少的量的aop2或没有产生aop2,以及具有降低的刺激性和/或苦味的植物或其部分。在一些实施方案中,本发明的植物或其部分可包含五个内源aop2基因中的非天然突变,其中五个基因中的突变导致产生减少的量的aop2或没有产生aop2,以及具有降低的刺激性和/或苦味的植物或其部分。刺激性和/或苦味的降低是与不包含相同突变且在相同环境条件下生长的对照植物相比较的。[0362]在一些实施方案中,编码cyp79f1的内源基因包含与seqidno:113、114或737-742的任何一个核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:115、674-679或782-786的任一氨基酸序列具有至少80%序列同一性的多肽。[0363]在一些实施方案中,提供了包含碱基编辑系统的芥菜植物细胞,该碱基编辑系统包含:(a)crispr相关效应蛋白;(b)胞苷脱氨酶或腺苷脱氨酶;和(c)具有与编码cyp79f1的内源性靶基因、编码aop2的内源性靶基因和/或编码黑芥子酶的内源性靶基因互补的间隔序列的引导核酸(grna)。在一些实施方案中,碱基编辑系统的grna包含与seqidno:116或seqidno:117的核苷酸序列具有至少80%同一性的间隔序列,其中间隔序列与cyp79f1基因互补(完全或基本上(例如,至少70%)互补)。在一些实施方案中,碱基编辑系统的grna包含与seqidno:133-140的任何一个核苷酸序列具有至少80%同一性的间隔序列,其中间隔序列与aop2基因互补(完全或基本上(例如,至少70%)互补)。在一些实施方案中,碱基编辑系统的grna包含与seqidno:106-112的任何一个核苷酸序列具有至少80%同一性的间隔序列,其中间隔序列与黑芥子酶基因互补(完全或基本上(例如,至少70%)互补)。图1-5举例说明来自引导核酸的间隔序列与黑芥子酶基因序列、aop2基因序列和cyp79f1基因序列的比对。[0364]在一些实施方案中,可用于本发明的编辑系统的核酸结合结构域来自多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶、转录激活物样效应核酸酶(talen)和/或argonaute蛋白。[0365]进一步提供了一种生产/培育无转基因的碱基编辑的芥菜植物的方法,包括:(a)将本发明的植物与无转基因芥菜植物杂交,从而引入至少一个突变、突变或修饰到无转基因的芥菜植物;和(b)选择包含至少一个单核苷酸取代但无转基因的后代植物,从而产生无转基因的碱基编辑的芥菜植物。[0366]在一些实施方案中,无转基因植物是通过本文描述的方法产生的植物并且在一个或多个黑芥子酶基因、一个或多个aop2基因和/或一个或多个cyp79f1基因中包含非天然突变。在一些实施方案中,本发明提供了产生具有降低的刺激性和/或苦味的无转基因植物的方法,该方法包括将包含如本文所述的黑芥子酶基因中的非天然突变的第一植物与包含如本文所述的aop2基因和/或cyp79f1基因中的非天然突变的第二植物杂交,选择包含黑芥子酶基因中的非天然突变和aop2基因和/或cyp79f1基因中的非天然突变的后代,从而产生具有降低的刺激性和/或苦味的无转基因植物。在一些实施方案中,本发明提供了产生具有降低的刺激性和/或苦味的无转基因植物的方法,该方法包括将包含如本文所述的aop2基因中的非天然突变的第一植物与包含如本文所述的黑芥子酶基因和/或cyp79f1基因中的非天然突变的第二植物杂交,选择包含aop2基因中的非天然突变和黑芥子酶基因和/或cyp79f1基因中的非天然突变的后代,从而产生具有降低的刺激性和/或苦味的无转基因植物。在一些实施方案中,本发明提供了产生具有降低的刺激性和/或苦味的无转基因植物的方法,该方法包括将包含如本文所述的cyp79f1基因中的非天然突变的第一植物与包含如本文所述的黑芥子酶基因和/或aop2基因中的非天然突变的第二植物杂交,选择包含cyp79f1基因中的非天然突变和黑芥子酶基因和/或aop2基因中的非天然突变的后代,从而产生具有降低的刺激性和/或苦味的无转基因植物。[0367]还提供了提供表现出降低的刺激性或苦味的多种芥菜植物的方法,该方法包括在生长区域(例如,田地(例如,耕地、农田)、生长室、温室、休闲区、草坪和/或路边等)种植两种或更多种本发明的植物,从而提供与不包含突变并在相同条件下生长的多种对照芥菜植物相比表现出降低的刺激性或苦味的多种芥菜植物。[0368]本发明的另一方面是用于编辑芥菜植物细胞基因组中特定位点的方法,该方法包括:以位点特异性方式切割内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因内的靶位点,从而在植物细胞的内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中产生编辑,并产生包含内源性黑芥子酶基因、内源性aop2基因和/或内源性cyp79f1基因中的编辑的植物细胞。在一些实施方案中,将包含内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中的编辑的植物细胞再生为植物,其中所述植物与从不包含所述编辑并在相同条件下生长的植物细胞再生的植物相比表现出降低的刺激性和/或苦味。在一些实施方案中,编辑导致非天然突变。芥菜植物或其部分(包括例如植物细胞)的黑芥子酶基因、aop2基因或cyp79f1基因中的非天然突变可以是任何类型的突变,包括碱基取代、缺失和/或插入。在一些实施方案中,非天然突变是点突变。在一些实施方案中,非天然突变可以是至少一个碱基对的取代、至少一个碱基对的缺失或至少一个碱基对的插入。在一些实施方案中,非天然突变可包括对a、t、g或c的碱基取代。在一些实施方案中,碱基取代可产生过早终止密码子,从而不产生蛋白质或产生截短的蛋白质,任选其中截短的蛋白质是非功能性的。在一些实施方案中,碱基的缺失可导致框内或框外突变,任选地其中框内或框外突变导致过早终止密码子。在一些实施方案中,导致过早终止密码子的基因突变不产生多肽或产生非功能性多肽,任选地其中非功能性多肽是截短的多肽。在一些实施方案中,非天然突变可以是显性抑制等位基因、半显性等位基因、弱功能丧失等位基因、无效等位基因、超等位基因突变或亚等位基因突变。在一些实施方案中,突变是无效等位基因。在一些实施方案中,突变可以是导致产生非功能性cyp79f1蛋白或不产生cyp79f1、产生非功能性aop2蛋白或不产生aop2蛋白和/或产生非功能性黑芥子酶蛋白或不产生黑芥子酶蛋白的完全敲除突变cyp79f1等位基因、完全敲除突变aop2等位基因和/或完全敲除突变黑芥子酶等位基因。[0369]本发明进一步提供了一种制备芥菜植物的方法,包括:(a)将包含编码野生型内源性黑芥子酶、野生型内源性aop2和/或野生型内源性cyp79f1的dna序列的芥菜植物细胞群与连接至与野生型内源性黑芥子酶、野生型内源性aop2或野生型内源性cyp79f1中的靶序列结合的核酸结合结构域(例如,编辑系统)的核酸酶接触,其中(b)从所述群体中选择芥菜植物细胞,其中编码野生型内源性黑芥子酶、野生型内源性aop2和/或野生型内源性cyp79f1的至少一个dna序列已经突变,其中所述突变包括至少一个dna序列中至少一个核苷酸的缺失;和(c)将选定的植物细胞培养成芥菜植物。[0370]另外提供了一种生产芥菜植物或其部分的方法,该芥菜植物或其部分包括其中内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因被突变的至少一个细胞,该方法包括将芥菜植物或植物部分中的内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中的靶位点与连接至与靶位点结合的核酸结合结构域(例如,编辑系统)的核酸酶接触,由此产生包含在内源性黑芥子酶基因、内源性aop2基因和/或内源性cyp79f1基因中具有突变的至少一个细胞的芥菜植物或其部分。[0371]还提供了一种生产具有降低的刺激性和/或降低的苦味表型的芥菜植物的方法,该方法包括(a)将包含野生型内源黑芥子酶基因、野生型内源aop2基因和/或野生型内源性cyp79f1基因的芥菜植物细胞与靶向野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因的核酸酶接触,其中所述核酸酶与结合野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因中的靶位点的dna结合结构域连接,和(b)将植物细胞培养成芥菜植物,由此产生具有降低的刺激性味和/或降低的苦味表型的芥菜植物。降低的刺激性是与不包含相同突变且在相同环境条件下生长的对照植物相比较的。[0372]另外提供了一种用于降低芥菜植物或其部分的风味或香气中的刺激性和/或苦味的方法,包括(a)将包含野生型内源黑芥子酶基因、野生型内源aop2基因和/或野生型内源性cyp79f1基因的芥菜植物细胞与靶向野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因的核酸酶接触,其中所述核酸酶与结合野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因中的靶位点的dna结合结构域连接,以产生包含野生型内源性黑芥子酶基因、野生型内源性aop2基因或野生型内源性cyp79f1基因中的突变的植物细胞;和(b)将植物细胞培养成包含野生型内源性黑芥子酶基因、野生型内源性aop2基因和/或野生型内源性cyp79f1基因中的突变的植物,从而降低芥菜植物或其部分的风味或香气中的刺激性和/或苦味。[0373]本发明进一步提供了一种生产包含具有突变的内源黑芥子酶基因、突变的内源aop2基因和/或突变的内源cyp79f1基因的至少一个细胞的芥菜植物或其部分的方法,该方法包括将芥菜植物或植物部分中的内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中的靶位点与包含切割结构域和dna结合结构域的核酸酶接触,其中所述dna结合结构域结合内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中的靶位点,从而产生包含具有突变的内源黑芥子酶基因、突变的内源aop2基因和/或突变的内源cyp79f1基因的至少一个细胞的植物或其部分。[0374]提供了一种生产包含突变的内源黑芥子酶基因、突变的内源aop2基因和/或突变的内源cyp79f1基因并且具有降低的刺激性和/或苦味的表型的芥菜植物或其部分的方法,该方法包括使内源性黑芥子酶基因、内源性aop2基因和/或内源性cyp79f1基因中的靶位点与核酸酶接触,其包含切割结构域和dna结合结构域(例如,编辑系统)接触,所述dna结合结构域包含结合内源黑芥子酶基因、内源aop2基因和/或内源cyp79f1基因中的靶位点的核酸结合结构域,从而产生包含突变的内源黑芥子酶基因、突变的内源aop2基因和/或突变的内源cyp79f1基因和与在相同条件下生长且不包含突变的对照芥菜植物(或其部分)相比具有降低的刺激性和/或苦味的芥菜植物或其部分。[0375]在一些实施方案中,内源性(例如,野生型)黑芥子酶基因包含与seqidno:66-92或680-721的任何一种核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:93-105、617-658或743-775的任一氨基酸序列具有至少80%序列同一性的多肽。在一些实施方案中,内源性(例如,野生型)aop2基因包含与seqidno:118-127或722-736的任何一种核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:128-132、659-673或776-781的任一氨基酸序列具有至少80%序列同一性的多肽。在一些实施方案中,内源性(例如,野生型)cyp79f1基因包含与seqidno:113、114或737-742的任一核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:115、674-679或782-786的任一氨基酸序列具有至少80%序列同一性的多肽。[0376]在一些实施方案中,靶向野生型内源性黑芥子酶基因的核酸酶、包含切割结构域和dna结合结构域的核酸酶、与结合靶位点的核酸结合结构域(例如,编辑系统)连接的核酸酶和/或与结合靶序列的核酸结合结构域(例如,编辑系统)连接的核酸酶切割内源性黑芥子酶基因、内源性aop2基因和/或内源性cyp79f1基因,从而将突变引入内源性黑芥子酶基因、内源性aop2基因和/或内源性cyp79f1基因。在一些实施方案中,核酸酶是锌指核酸酶、转录激活因子样效应核酸酶(talen)、核酸内切酶(例如fok1)或crispr-cas效应蛋白。在一些实施方案中,dna结合结构域是锌指、转录激活因子样dna结合结构域(tal)、argonaute或crispr-cas效应dna结合结构域。[0377]在一些实施方案中,引入的突变可以是非天然突变,任选地其中非天然突变是显性抑制等位基因、半显性等位基因、弱功能丧失等位基因、无效等位基因、超等位基因突变或亚等位基因突变。在一些实施方案中,引入的突变导致无效等位基因。在一些实施方案中,突变是碱基取代、碱基插入或碱基缺失,任选地其中碱基缺失可以是框内缺失或框外缺失。在一些实施方案中,非天然突变导致过早终止密码子。在一些实施方案中,非天然突变是完全敲除突变cyp79f1等位基因、完全敲除突变aop2等位基因和/或完全敲除突变黑芥子酶等位基因,任选地其中完全敲除突变cyp79f1等位基因导致产生非功能性cyp79f1蛋白或不产生cyp79f1蛋白,完全敲除突变aop2等位基因导致产生非功能性aop2蛋白或不产生aop2蛋白,完全敲除突变黑芥子酶等位基因导致产生非功能性黑芥子酶蛋白或不产生黑芥子酶蛋白。在一些实施方案中,内源黑芥子酶基因、内源aop2基因或内源cyp79f1基因的突变分别导致截短的cyp79f1蛋白、截短的aop2蛋白或截短的黑芥子酶蛋白。在一些实施方案中,如本文所述的非天然突变产生的植物(或其部分)与对照植物(例如,不包含所述非天然突变,并且在与包含所述非天然突变的植物相同的环境条件下生长)相比具有风味或香气中的降低的刺激性和/或降低的苦味的表型。[0378]在一些实施方案中,本发明的芥菜植物表现出降低的刺激性。在一些实施方案中,本发明的芥菜植物表现出降低的苦味。在一些实施方案中,本发明的芥菜植物表现出降低的刺激性和降低的苦味。在一些实施方案中,本发明的芥菜植物在至少一个黑芥子酶基因中包含突变并且表现出降低的苦味。在一些实施方案中,本发明的芥菜植物在至少一个aop2基因中包含突变并且表现出降低的刺激性和降低的苦味。在一些实施方案中,本发明的芥菜植物在至少一个cyp79f1基因中包含突变并且表现出降低的刺激性和降低的苦味。降低的刺激性和/或苦味是与不包含相同突变并且在与包含突变的芥菜植物相同的环境条件下生长的对照植物相比较的。[0379]可用于本发明的芥菜植物或其部分(例如十字花科植物,即十字花科(cruciferae)或芥菜科)包括包含硫代葡萄糖苷的任何芥菜植物(例如,产生硫代葡萄糖苷或分解(代谢)硫代葡萄糖苷的植物;例如,包含至少一个黑芥子酶基因的植物或具有至少一个aop2基因和/或至少一个cyp79f1基因的植物)。在一些实施方案中,芥菜植物或其部分包括但不限于羽衣甘蓝植物或其部分、散叶甘蓝植物或其部分、菠菜植物或其部分、卷心菜植物或其部分、甜菜植物或其部分、豆瓣菜物或其部分、莴苣植物或其部分(例如长叶莴苣)、瑞士甜菜植物或其部分、芝麻菜植物或其部分、菊苣植物或其部分、白菜植物或其部分、芜菁甘蓝植物或其部分、芜菁植物或其部分、芥菜植物或其部分、卷心菜植物或其部分、西兰花植物或其部分、花椰菜植物或其部分、球芽甘蓝植物或其部分、萝卜植物或其部分或大头菜植物或其部分。在一些实施方案中,芥菜植物或其部分包括,但不限于,甘蓝(brassicaoleracea)(例如,b.oleraceavar.oleracea、b.oleraceavar.capitata、b.oleraceavar.botrytis、b.oleraceavar.gemmifera、b.oleraceavar.sabauda、b.oleraceavar.gongyiodes、b.oleraceavar.italic、b.oleraceavar.sabellica、b.oleraceavar.acephala)、芥菜(brassicajuncea)、芜菁(b.rapasubsp.pekinensis、b.rapasubsp.chinensis、b.rapasubsp.rapa)、brassicanapas、埃塞俄比亚芥(brassicacarinata)、芸苔(brassicacampestris)、黑芥(brassicanigra)或野芥菜(raphanusraphanistrum)(例如raphanusraphanistrumsubsp.sativus)。[0380]在一些实施方案中,植物(例如芥菜植物)可以从本发明的任何植物部分(包括植物细胞)再生,其包含编码细胞色素p450单加氧酶(即cyp79f1、高甲硫氨酸n-单加氧酶;ec1.14.14.42)的内源基因、编码2-氧代酸依赖性双加氧酶(即aop2,2-氧代戊二酸依赖性双加氧酶;ec1.14.11.m8)的内源基因和/或编码黑芥子酶(即,葡萄糖苷酶、硫葡糖苷酶(例如,β-硫葡糖苷酶)、硫代葡萄糖苷葡糖水解酶;ec3.2.1.147(ec3.2.3.1转移至3.2.1.147))的内源基因的突变。在一些实施方案中,再生的芥菜植物表现出降低的刺激性。在一些实施方案中,再生的植物表现出降低的苦味。在一些实施方案中,再生的芥菜植物表现出降低的刺激性和降低的苦味。在一些实施方案中,再生的芥菜植物在至少一种黑芥子酶基因中包含突变并且表现出降低的苦味。在一些实施方案中,再生的芥菜植物在至少一种aop2基因中包含突变并且表现出降低的刺激性和降低的苦味。在一些实施方案中,再生的芥菜植物在至少一个cyp79f1基因中包含突变并且表现出降低的刺激性和降低的苦味。降低的刺激性是与不包含相同突变且在与包含所述突变的植物相同的环境条件下生长的对照植物相比较的。[0381]本发明进一步提供了与内源性黑芥子酶基因、内源性aop2基因或内源性cyp79f1基因中的靶位点结合的引导核酸(例如,grna、gdna、crrna、crdna)。在一些实施方案中,引导核酸包含与seqidno:116或seqidno:117的核苷酸序列具有至少80%同一性的间隔序列,其中间隔序列与cyp79f1基因互补(完全或基本上(例如,至少70%))。在一些实施方案中,碱基编辑系统的grna包含与seqidno:133-140的任何一个核苷酸序列具有至少80%同一性的间隔序列,其中间隔序列与aop2基因互补(完全或基本上(例如,至少70%))。在一些实施方案中,碱基编辑系统的grna包含与seqidno:106-112的任何一个核苷酸序列具有至少80%同一性的间隔序列,其中间隔序列与黑芥子酶基因互补(完全或基本上(例如,至少70%))。在一些实施方案中,引导核酸包含具有seqidno:116或seqidno:117、seqidno:106-112中的任一个或seqidno:133-140中的任一个的核苷酸序列的间隔序列。[0382]在一些实施方案中,包含引导核酸结合的靶位点的内源黑芥子酶基因包含与seqidno:66-92或680-721的核苷酸序列中的任一个具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:93-105、617-658或743-775的任一氨基酸序列具有至少80%序列同一性的多肽。在一些实施方案中,包含引导核酸结合的靶位点的内源性aop2基因包含与seqidno:118-127或722-736的任一核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:128-132、659-673或776-781的任一氨基酸序列具有至少80%序列同一性的多肽。在一些实施方案中,包含引导核酸结合的靶位点的内源性cyp79f1基因包含与seqidno:113、114或737-742的任一核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列,或编码与seqidno:115、674-679或782-786的任一氨基酸序列具有至少80%的序列同一性的多肽。[0383]本发明还提供了一种系统,其包含本发明的引导核酸和与该引导核酸缔合的crispr-cas效应蛋白。在一些实施方案中,系统进一步包含与引导核酸和crispr-cas效应蛋白缔合的tracr核酸,任选地其中tracr核酸和引导核酸共价连接。[0384]在一些实施方案中,本发明提供了包含与引导核酸缔合的crispr-cas效应蛋白的基因编辑系统,其中引导核酸包含如本文所述的与内源性黑芥子酶基因、在内源性aop2基因或在内源性cyp79f1基因中结合的间隔序列。在一些实施方案中,本发明的基因编辑系统可以进一步包含tracr核酸,其缔合引导核酸和crispr-cas效应蛋白,任选地其中tracr核酸和引导核酸共价连接。[0385]在一些实施方案中,本发明的基因编辑系统的间隔序列所结合的内源性黑芥子酶基因包含与seqidno:66-92或680-721的任何一种核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的no:114、seqidno:118-127或seqidno:68-742任一的核苷酸序列具有至少80%序列同一性的序列的至少一部分具有至少80%序列同一性的序列互补并与其结合的间隔序列,任选其中一部分的长度是约2至约22个连续核苷酸。[0389]另外提供了编码黑芥子酶基因、cyp79f1基因或aop2基因的显性抑制等位基因、半显性等位基因、弱功能丧失等位基因、无效等位基因、超等位基因突变或亚等位基因突变的核酸。在一些实施方案中,核酸编码无效等位基因。在一些实施方案中,编码无效等位基因的核酸是完全敲除突变cyp79f1等位基因、完全敲除突变aop2等位基因和/或完全敲除突变黑芥子酶等位基因。在一些实施方案中,完全敲除突变cyp79f1等位基因导致产生非功能性cyp79f1蛋白或不产生cyp79f1蛋白。在一些实施方案中,完全敲除突变aop2等位基因导致产生非功能性aop2蛋白或不产生aop2蛋白。在一些实施方案中,完全敲除突变黑芥子酶等位基因导致产生非功能性黑芥子酶蛋白或不产生黑芥子酶蛋白。在一些实施方案中,本发明提供了一种芥菜植物,其包含编码黑芥子酶基因、cyp79f1基因或aop2基因的无效等位基因的核酸。在一些实施方案中,包含本发明的编码无效等位基因的核酸的芥菜植物表现出降低的刺激性。在一些实施方案中,包含本发明的编码无效等位基因的核酸的芥菜植物表现出降低的苦味。在一些实施方案中,包含本发明的编码无效等位基因的核酸的芥菜植物表现出降低的刺激性和降低的苦味。在一些实施方案中,包含本发明的编码至少一种黑芥子酶无效等位基因的核酸的芥菜植物表现出降低的苦味。在一些实施方案中,包含本发明的编码至少一种aop2无效等位基因的核酸的芥菜植物表现出降低的刺激性和降低的苦味。在一些实施方案中,包含本发明的编码至少一种cyp79f1无效等位基因的核酸的芥菜植物表现出降低的刺激性和降低的苦味。降低的刺激性和/或苦味是与不包含相同突变(例如,相同无效等位基因)并且在与包含无效等位基因的芥菜植物相同的环境条件下生长的对照植物相比较的。[0390]本发明进一步提供了一种产生芥菜植物的方法,该芥菜植物具有至少一个黑芥子酶基因和/或至少一个aop2基因和/或cyp79f1基因,并具有至少一个黑芥子酶、至少一个aop2或cyp79f1的降低的表达(例如,降低5%-100%)和/或降低的产生(例如,减少5%-100%),该方法包括(a)将包含编码野生型内源性黑芥子酶、野生型内源性aop2和/或野生型内源性cyp79f1的dna序列的芥菜植物细胞群与(i)与核酸结合结构域(例如,编辑系统)连接的核酸酶,该核酸结合结构域与野生型内源性黑芥子酶、野生型内源性aop2或野生型内源性cyp79f1中的靶序列结合,(ii)靶向野生型内源性黑芥子酶、野生型内源性aop2或野生型内源性cyp79f1的rnai,或(iii)靶向野生型内源性黑芥子酶、野生型内源性aop2或野生型内源性cyp79f1的sirna接触,(b)从所述群体中选择具有至少一个黑芥子酶基因、至少一个aop2基因或cyp79f1基因的降低的表达和/或至少一个黑芥子酶、至少一个aop2或cyp79f1的降低的产生的芥菜植物细胞;和(c)将选定的植物细胞培养成芥菜植物。还提供了通过该方法生产的芥菜植物,任选地其中与对照植物相比,所述芥菜植物包含降低的刺激性和/或苦味。[0391]本发明进一步提供了一种芥菜植物,其包含与至少一个黑芥子酶基因、至少一个aop2基因和/或cyp79f1基因互补的rnai或sirna和至少一个黑芥子酶基因、至少一个aop2基因和/或cyp79f1基因降低的表达。[0392]芥菜植物或其部分可包括但不限于羽衣甘蓝植物或其部分、散叶甘蓝植物或其部分、菠菜植物或其部分、卷心菜植物或其部分、甜菜植物或其部分、豆瓣菜物或其部分、莴苣植物或其部分(例如长叶莴苣)、瑞士甜菜植物或其部分、芝麻菜植物或其部分、菊苣植物或其部分、白菜植物或其部分、芜菁甘蓝植物或其部分、芜菁植物或其部分、芥菜植物或其部分、卷心菜植物或其部分、西兰花植物或其部分、花椰菜植物或其部分、球芽甘蓝植物或其部分、萝卜植物或其部分或大头菜植物或其部分。在一些实施方案中,芥菜植物或其部分包括,但不限于,甘蓝(brassicaoleracea)(例如,b.oleraceavar.oleracea、b.oleraceavar.capitata、b.oleraceavar.botrytis、b.oleraceavar.gemmifera、b.oleraceavar.sabauda、b.oleraceavar.gongyiodes、b.oleraceavar.italic、b.oleraceavar.sabellica、b.oleraceavar.acephala)、芥菜(brassicajuncea)、芜菁(b.rapasubsp.pekinensis、b.rapasubsp.chinensis、b.rapasubsp.rapa)、brassicanapas、埃塞俄比亚芥(brassicacarinata)、芸苔(brassicacampestris)、黑芥(brassicanigra)或野芥菜(raphanusraphanistrum)(例如raphanusraphanistrumsubsp.sativus)。[0393]在一些实施方案中,被sirna或rnai靶向或包含核酸结合结构域结合的靶位点的野生型内源性黑芥子酶基因包含与seqidno:66-92或680-721的任何一种核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:93-105、617-658或743-775的任一氨基酸序列具有至少80%序列同一性的多肽。在一些实施方案中,被sirna或rnai靶向或包含核酸结合结构域结合的靶位点的野生型内源性aop2基因包含与seqidno:seqidno:118-127或722-736的任何一种核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码与seqidno:128-132、659-673或776-781的任一氨基酸序列具有至少80%序列同一性的多肽。在一些实施方案中,被sirna或rnai靶向或包含核酸结合结构域结合的靶位点的野生型内源性cyp79f1基因包含与seqidno:113、114或737-742的任何一种核苷酸序列具有至少80%(例如,80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%)序列同一性的核苷酸序列;或编码包含与seqidno:115、674-679或782-786的任一氨基酸序列具有至少80%序列同一性的多肽。[0394]可用于本发明的编辑系统可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑系统,该系统可以以靶特异性方式引入突变。例如,编辑系统(例如,位点或序列特异性编辑系统)可以包括但不限于,crispr-cas编辑系统、大范围核酸酶编辑系统、锌指核酸酶(zfn)编辑系统、转录激活因子样效应核酸酶(talen)编辑系统、碱基编辑系统和/或引导编辑系统(primeeditingsystem),其各自可以包含当在细胞中作为系统表达时可以以序列特异性方式修饰(突变)靶核酸的一种或多种多肽和/或一种或多种多核苷酸。在一些实施方案中,编辑系统(例如,位点或序列特异性编辑系统)可以包含一种或多种多核苷酸和/或一种或多种多肽,包括但不限于核酸结合结构域(dna结合结构域)、核酸酶和/或其他多肽和/或多核苷酸。[0395]在一些实施方案中,编辑系统可以包含一个或多个序列特异性核酸结合结构域(dna结合结构域),其可以来自例如多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(talen)和/或argonaute蛋白。在一些实施方案中,编辑系统可以包含一个或多个切割结构域(例如,核酸酶),包括但不限于,核酸内切酶(例如,fok1)、多核苷酸引导的核酸内切酶、crispr-cas核酸内切酶(例如,crispr-cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(talen)。在一些实施方案中,编辑系统可以包含一种或多种多肽,其包括但不限于脱氨酶(例如胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、dna2多肽和/或5'瓣状核酸内切酶(fen)。在一些实施方案中,编辑系统可包含一种或多种多核苷酸,包括但不限于crispr阵列(crispr引导)核酸、延伸的引导核酸和/或逆转录酶模板。[0396]在一些实施方案中,修饰或编辑内源基因的方法可以包括将靶核酸(例如,编码内源黑芥子酶基因、aop2基因或cyp79f1基因的核酸)与碱基编辑融合蛋白(例如,与脱氨酶结构域(例如腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)融合的序列特异性dna结合蛋白(例如crispr-cas效应蛋白或结构域)和引导核酸接触,其中引导核酸能够将碱基编辑融合蛋白引导/靶向至靶核酸,从而编辑靶核酸内的基因座。在一些实施方案中,碱基编辑融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,靶核酸可以与碱基编辑融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性dna结合融合蛋白和引导物可以作为核糖核蛋白(rnp)提供。在一些实施方案中,细胞可以与多于一种碱基编辑融合蛋白和/或可以靶向细胞中的一种或多种靶核酸的一种或多种引导核酸接触。[0397]在一些实施方案中,修饰或编辑内源性黑芥子酶基因、aop2基因和/或cyp79f1基因的方法可以包括将靶核酸(例如,编码内源性黑芥子酶基因、aop2基因和/或cyp79f1基因的核酸)与融合至肽标签的序列特异性dna结合融合蛋白(例如,序列特异性dna结合蛋白(例如,crispr-cas效应蛋白或结构域)、包含融合到能够结合肽标签的亲和多肽的脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)的脱氨酶融合蛋白和引导核酸接触,其中引导核酸能够将序列特异性dna结合融合蛋白引导/靶向至靶核酸并且序列特异性dna结合融合蛋白能够通过肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集到靶核酸,从而编辑靶核酸内的基因座。在一些实施方案中,序列特异性dna结合融合蛋白可融合至结合肽标签的亲和多肽,并且脱氨酶可融合至肽标签,从而将脱氨酶募集至序列特异性dna结合融合蛋白和靶核酸。在一些实施方案中,序列特异性结合融合蛋白、脱氨酶融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,靶核酸可以与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性dna结合融合蛋白、脱氨酶融合蛋白和引导物可以作为核糖核蛋白(rnp)提供。[0398]在一些实施方案中,诸如引导编辑的方法可用于在内源性黑芥子酶基因、aop2基因和/或cyp79f1基因中产生突变。在引导编辑中,rna依赖性dna聚合酶(逆转录酶,rt)和逆转录酶模板(rt模板)与序列特异性dna结合结构域组合使用,该序列特异性dna结合结构域赋予以序列特异性方式识别和结合靶标的能力,并且也可能导致靶标内含pam的链的缺口。dna结合结构域可以是crispr-cas效应蛋白,并且在这种情况下,crispr阵列或引导rna可以是延伸的引导物,其包含延伸的部分,该延伸的部分包含引物结合位点(psb)和待整合到基因组(模板)中的编辑器。与碱基编辑类似,引导编辑可以利用招募蛋白质的各种方法用于编辑靶位点,这些方法包括基因组编辑的选定过程中使用的蛋白质和核酸之间的非共价和共价相互作用。[0399]如本文所用,“crispr-cas效应蛋白”是裂解或切割核酸、结合核酸(例如,靶核酸和/或引导核酸)和/或鉴定、识别或结合本文定义的引导核酸的蛋白质或多肽或其结构域。在一些实施方案中,crispr-cas效应蛋白可以是酶(例如,核酸酶、核酸内切酶、切口酶等)或其部分和/或可以用作酶。在一些实施方案中,crispr-cas效应蛋白是指crispr-cas核酸酶多肽或其结构域,其包含核酸酶活性或其中核酸酶活性已被降低或消除,和/或包含切口酶活性或其中切口酶已被减少或消除,和/或包含单链dna切割活性(单链dna酶活性)或其中单链dna酶活性已降低或消除,和/或包含自加工rna酶活性或其中自加工rna酶活性已降低或消除。crispr-cas效应蛋白可以与靶核酸结合。因此,如本文所用的“crispr相关效应物”或“crispr-cas效应蛋白”可以定义为与crispr(聚集规则间隔短回文重复)相关的任何核酸酶、切口酶或重组酶,具有将单链或双链切割引入基因组靶位点能力,或具有将靶向修饰(包括点突变、插入或缺失)引入感兴趣的基因组靶位点的能力。crispr-cas效应蛋白可以单独地或作为分子复合物的一部分与其他分子组合地发挥作用。crispr-cas效应蛋白可以是融合分子,或者可以作为通过共价或非共价相互作用中的至少一种与引导(grna)和/或靶位点缔合或被其缔合的个体分子提供,使得crispr相关复合物的组分在物理上非常接近。[0400]在一些实施方案中,序列特异性dna结合结构域可以是crispr-cas效应蛋白。在一些实施方案中,crispr-cas效应蛋白可以来自i型crispr-cas系统、ii型crispr-cas系统、iii型crispr-cas系统、iv型crispr-cas系统、v型crispr-cas系统或vi型crispr-cas系统。在一些实施方案中,本发明的crispr-cas效应蛋白可以来自ii型crispr-cas系统或v型crispr-cas系统。在一些实施方案中,crispr-cas效应蛋白可以是ii型crispr-cas效应蛋白,例如cas9效应蛋白。在一些实施方案中,crispr-cas效应蛋白可以是v型crispr-cas效应蛋白,例如cas12效应蛋白。[0401]在一些实施方案中,crispr-cas效应蛋白或其结构域可以包括但不限于来源于以下的cas蛋白:化脓性链球菌(s.pyogenes)、金黄色葡萄球菌(s.aureus)、脑膜炎奈瑟菌(n.meningitidis)、嗜热链球菌(s.thermophiles)、燕麦食酸菌(acidovoraxavenae)、胸膜肺炎放线杆菌(actinobacilluspleuropneumoniae)、产琥珀酸放线杆菌(actinobacillussuccinogenes)、猪放线杆菌(actinobacillussuis)、放线菌属种(actinomycessp.)、反硝化嗜环菌(cycliphilusdenitrificans)、嗜氨单胞菌(aminomonaspaucivorans)、蜡状芽孢杆菌(bacilluscereus)、史密斯芽孢杆菌(bacillussmithii)、苏云金芽孢杆菌(bacillusthuringiensis)、拟杆菌属种(bacteroidessp.)、滨海芽生螺旋菌(blastopirellulamarina)、慢生根瘤菌属种(bradyrhizobiumsp.)、侧孢短芽孢杆菌(brevibacilluslaterosporus)、大肠弯曲杆菌(campylobactercoli)、空肠弯曲杆菌(campylobacterjejuni)、红嘴鸥弯曲杆菌(campylobacterlari)、candidatuspuniceispirillum、解纤维梭菌(clostridiumcellulolyticum)、产气荚膜梭菌(clostridiumperfringens)、拥挤棒杆菌(corynebacteriumaccolens)、白喉棒状杆菌(corynebacteriumdiphtheria)、马氏棒状杆菌(corynebacteriummatruchotii)、dinoroseobactershibae、细长真杆菌(eubacteriumdolichum)、伽马变形菌(gammaproteobacterium)、固氮葡萄糖乙酸杆菌(gluconacetobacterdiazotrophicus)、副流感嗜血杆菌(haemophilusparainfluenzae)、痰嗜血杆菌(haemophilussputorum)、加拿大幽门螺杆菌(helicobactercanadensis)、同性恋螺杆菌(helicobactercinaedi)、雪貂螺杆菌(helicobactermustelae)、营养泥杆菌(ilyobacterpolytropus)、金格杆菌(kingellakingae)、卷曲乳杆菌(lactobacilluscrispatus)、依氏李斯特菌(listeriaivanovii)、单核细胞增多性李斯特氏菌(listeriamonocytogenes)、李斯特氏菌科(listeriaceae)细菌、甲基孢子菌属(methylocystissp.)、甲基弯曲菌(methylosinustrichosporium)、羞怯动弯杆菌(mobiluncusmulieris)、杆菌状奈瑟菌(neisseriabacilliformis)、灰色奈瑟球菌(neisseriacinerea)、金黄奈瑟氏球菌(neisseriaflavescens)、乳糖奈瑟氏球菌(neisserialactamica)、脑膜炎奈瑟氏菌(neisseriameningitidis)、奈瑟氏菌属种(neisseriasp.)、瓦兹沃氏奈瑟菌(neisseriawadsworthii)、亚硝化单胞菌属种(nitrosomonassp.)、parvibaculumlavamentivorans、多杀性巴氏杆菌(pasteurellamultocida)、琥珀酸嗜酸杆菌(phascolarctobacteriumsuccinatutens)、梅毒雷氏菌(ralstoniasyzygii)、沼泽红假单胞菌(rhodopseudomonaspalustris)、小红卵菌属种(rhodovulumsp.)、米氏西蒙斯氏菌(simonsiellamuelleri)、鞘氨醇单胞菌属种(sphingomonassp.)、葡萄芽孢杆菌(sporolactobacillusvineae)、金黄色葡萄球菌(staphylococcusaureus)、表皮葡萄球菌(staphylococcuslugdunensis)、链球菌属种(streptococcussp.)、subdoligranulumsp.、运动替斯崔纳菌(tistrellamobilis)、密螺旋体属种(treponemasp.)或艾森氏蠕形杆菌(verminephrobactereiseniae)。[0402]在一些实施方案中,crispr-cas效应蛋白可以包括天然存在的cas蛋白。在其他实施方案中,cas蛋白可以是工程化的cas蛋白。在一些实施方案中,crispr-cas效应蛋白可以包括但不限于cas9、c2c1、c2c3、cas12a(也称为cpf1)、cas12b、cas12c、cas12d、cas12e、cas13a、cas13b、cas13c、cas13d、casl、caslb、cas2、cas3、cas3'、cas3"、cas4、cas5、cas6、cas7、cas8、cas9(也称为csnl和csx12)、cas10、csyl、csy2、csy3、csel、cse2、cscl、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、csbl、csb2、csb3、csxl7、csxl4、csx10、csx16、csax、csx3、csxl、csxl5、csfl、csf2、csf3、csf4(ding)和/或csf5核酸酶,任选其中crispr-cas效应蛋白可以是cas9、cas12a(cpf1)、cas12b、cas12c(c2c3)、cas12d(casy)、cas12e(casx)、cas12g、cas12h、cas12i、c2c4、c2c5、c2c8、c2c9、c2c10、cas14a、cas14b和/或cas14c效应蛋白。[0403]在一些实施方案中,crispr-cas效应蛋白或其结构域是核糖核酸内切酶,例如cas13蛋白。在一些实施方案中,cas13蛋白是cas13a(abudayyeh等人,nature550(2017),280-284),cas13b(cox等人,science(2017)358:6336,1019-1027),cas13c(cox等人,science(2017)358:6336,1019-1027),或cas13d(zhang等人,cell175(2018),212-223)蛋白。[0404]在一些实施方案中,可用于本发明的crispr-cas效应蛋白可以在其核酸酶活性位点(例如,ruvc、hnh,例如,cas12a核酸酶结构域的ruvc位点;例如,cas9核酸酶结构域的ruvc位点和/或hnh位点)中包含突变。在其核酸酶活性位点具有突变并因此不再包含核酸酶活性的crispr-cas效应蛋白通常被称为“死”,例如dcas。在一些实施方案中,与没有突变的相同crispr-cas效应蛋白(例如切口酶,例如cas9切口酶,cas12a切口酶)相比,在其核酸酶活性位点具有突变的crispr-cas效应蛋白结构域或多肽可能具有受损的活性或降低的活性。[0405]在一些实施方案中,cas多肽包含一种或多种以下活性:(a)切口酶活性,即切割核酸分子的单链,例如非互补链或互补链的能力;(b)双链核酸酶活性,即切割双链核酸的两条链并产生双链断裂的能力,其在一个实施方案中是存在两种切口酶活性;(c)核酸内切酶活性;(d)核酸外切酶活性;和/或(e)解旋酶活性,即解开双链核酸的螺旋结构的能力。在其他实施方案中,cas蛋白可以是死的或无活性的(例如dcas)。[0406]在一些实施方案中,cas多肽与具有例如碱基脱氨酶活性的异源多肽/蛋白质融合。[0407]可用于本发明的crisprcas9效应蛋白或crisprcas9效应结构域可以是任何已知的或后来鉴定的cas9核酸酶。在一些实施方案中,crisprcas9多肽可以是来自例如链球菌属的几个种(例如,化脓性链球菌、嗜热链球菌)、乳杆菌属的几个种(lactobacillusspp.)、双歧杆菌属的几个种(bifidobacteriumspp.)、坎德勒氏菌属的几个种(kandleriaspp.)、明串珠菌属的几个种(leuconostocspp.)、酒球菌属的几个种(oenococcusspp.)、片球菌属的几个种(pediococcusspp.)、魏斯氏菌属的几个种(weissellaspp.)和/或奥森氏菌属的几个种(olsenellaspp.)的cas9多肽。示例性cas9序列包括但不限于seqidno:53和seqidno:54的氨基酸序列或seqidno:55-65的核苷酸序列。[0408]在一些实施方案中,crispr-cas效应蛋白可以是源自化脓性链球菌并且识别pam序列基序ngg、nag、nga的cas9多肽(mali等人,science2013;339(6121):823-826)。在一些实施方案中,crispr-cas效应蛋白可以是源自嗜热链球菌并且识别pam序列基序nggng和/或nnagaaw(w=a或t)的cas9多肽(参见例如horvath等人,science,2010;327(5962):167-170,anddeveau等人,jbacteriol2008;190(4):1390-1400)。在一些实施方案中,crispr-cas效应蛋白可以是源自变形链球菌并且识别pam序列基序ngg和/或naar(r=a或g)的cas9多肽(参见例如deveau等人,jbacteriol2008;190(4):1390-1400)。在一些实施方案中,crispr-cas效应蛋白可以是源自金黄色葡萄球菌并识别pam序列基序nngrr(r=a或g)的cas9多肽。在一些实施方案中,crispr-cas效应蛋白可以是源自金黄色葡萄球菌的cas9蛋白,其识别pam序列基序ngrrt(r=a或g)。在一些实施方案中,crispr-cas效应蛋白可以是源自金黄色葡萄球菌的cas9多肽,其识别pam序列基序ngrrv(r=a或g)。在一些实施方案中,crispr-cas效应蛋白可以是源自脑膜炎奈瑟菌并且识别pam序列基序ngatt或ngctt(r=a或g,v=a、g或c)的cas9多肽(参见,例如,hou等人,pnas2013,1-6)。在上述实施方案中,n可以是任何核苷酸残基,例如a、g、c或t中的任何一个。在一些实施方案中,crispr-cas效应蛋白可以是源自沙氏纤毛菌(leptotrichiashahii)的cas13a蛋白,其识别单个3'a、u或c的前间隔区侧翼序列(pfs)(或rnapam(rpam))序列基序,其可能位于靶核酸内。[0409]在一些实施方案中,crispr-cas效应蛋白可以源自cas12a,其是v型聚集规则间隔短回文重复序列(crispr)-cas核酸酶,参见例如seqidno1-20)。cas12a在几个方面与更知名的ii型crisprcas9核酸酶不同。例如,cas9识别富含g的前间隔区邻近基序(pam),它位于其引导rna(grna、sgrna、crrna、crdna、crispr阵列)结合位点(前间隔区、靶核酸、靶dna)的3'(3'-ngg),而cas12a识别位于靶核酸的5'的富含t的pam(5'-ttn,5'-tttn。事实上,其中cas9和cas12a结合其引导rna的方向关于其n和c末端是非常几乎相反的。此外,cas12a酶使用单引导rna(grna、crispr阵列、crrna),而不是在天然cas9系统中发现的双引导rna(sgrna(例如crrna和tracrrna)),并且cas12a加工其自身的grna。此外,cas12a核酸酶活性产生交错的dna双链断裂,而不是由cas9核酸酶活性产生的平末端,并且cas12a依赖于单个ruvc结构域来切割两条dna链,而cas9利用hnh结构域和ruvc结构域用于切割。[0410]可用于本发明的crisprcas12a效应蛋白/结构域可以是任何已知的或后来鉴定的cas12a多肽(以前称为cpf1)(参见例如美国专利号9,790,490,其关于cpf1(cas12a)序列的公开内容通过引用并入本文)。术语“cas12a”、“cas12a多肽”或“cas12a结构域”是指包含cas12a多肽或其片段的rna引导的核酸酶,其包含cas12a的引导核酸结合结构域和/或cas12a的活性、非活性或部分活性dna切割结构域。在一些实施方案中,可用于本发明的cas12a可包含核酸酶活性位点(例如,cas12a结构域的ruvc位点)中的突变。在其核酸酶活性位点中具有突变并因此不再包含核酸酶活性的cas12a结构域或cas12a多肽通常被称为无活性cas12a(deadcas12a)(例如,dcas12a)。在一些实施方案中,在其核酸酶活性位点中具有突变的cas12a结构域或cas12a多肽可能具有受损的活性,例如,可能具有切口酶活性。[0411]在实施方案中,针对例如植物基因组,例如芥菜植物基因组,例如芸苔属的几个种,对crispr相关效应蛋白或其结构域进行了密码子优化。[0412]在一些实施方案中,crispr相关效应物是核酸酶,例如crispr核酸酶,包括但不限于cas9或cpfl(cas12a)核酸酶。可用于本发明的示例性cas12a多肽包括但不限于seqidno:1-17。可用于本发明的示例性cas9多肽包括但不限于seqidno:53和seqidno:54。可用于本发明的示例性cas9多核苷酸包括但不限于seqidno:55-65。[0413]在一些实施方案中,crispr-cas效应蛋白是cas多肽或其结构域。在一些实施方案中,crispr-cas效应蛋白是cas多肽,其中cas多肽包含与至少一个碱基编辑器连接的位点特异性dna结合结构域。在一些实施方案中,crispr-cas效应蛋白或编码其的核酸序列包括但不限于(i)cas9,包括spcas9、sacas9、sakkh-cas9、vqr-cas9、stlcas9,(ii)cpfl,包括ascpfl、lbcpfl、fncpfl,(iii)casx或(iv)casy,或crispr-cas效应蛋白的任何变体或衍生物,优选其中crispr-cas效应蛋白与各自的野生型序列相比包含突变,使得将所得crispr-cas效应蛋白转化为单链特异性dna切口酶,或转化为缺乏所有dna切割能力的dna结合效应物,如下所述。因此,在一些实施方案中,设想了人工修饰的crispr核酸酶,其实际上可能不是双链切割酶意义上的任何“核酸酶”,而是切口酶或无核酸酶活性(nuclease-dead)变体,其仍然具有固有的dna识别和因此结合能力。[0414]在一些实施方案中,可对用作如上所述的crispr-cas效应蛋白的cas多肽进行工程化以改变该cas多肽的一种或多种特性。例如,在一些实施方案中,cas多肽包含改变的酶特性,例如改变的核酸酶活性(与天然存在的或其他参考cas分子相比)或改变的解旋酶活性。在一些实施方案中,工程化的cas多肽可以具有改变其大小的改变,例如,减少其大小而不显著影响cas多肽的另一特性的氨基酸序列的缺失。在一些实施方案中,工程化的cas多肽包含影响pam识别的改变。例如,可以改变工程化的cas多肽以识别不是由相应的野生型cas蛋白识别的pam序列的pam序列。在一些实施方案中,靶向碱基编辑系统包含cas蛋白作为crispr相关效应结构域。[0415]可以以多种方式制备具有所需特性的cas多肽,包括改变天然存在的cas多肽或亲本cas多肽,以提供具有所需特性的突变或改变的cas多肽。例如,可以将一种或多种突变引入亲本cas多肽(例如,天然存在的或工程化的cas多肽)的序列中。此类突变和差异可以包括取代(例如,保守取代或非必需氨基酸的取代);插入;或缺失。在一些实施方案中,突变cas多肽包含相对于亲本cas多肽的一个或多个突变(例如,至少1、2、3、4、5、10、15、20、30、40或50个突变)。[0416]在一个实施方案中,突变cas多肽包含不同于天然存在的cas多肽的切割特性。在一些实施方案中,cas是失活的cas(dcas)突变体,其在催化性上是死亡的。在此类实施方案中,cas多肽不包含任何内在酶活性并且不能介导靶核酸切割。在此类实施方案中,dcas与能够以非基于切割的方式修饰靶核酸的异源蛋白融合。在一些实施方案中,靶向碱基编辑系统包含cas蛋白作为crispr相关效应结构域。[0417]在一些实施方案中,dcas是dcas9突变体。在一些实施方案中,dcas蛋白与碱基脱氨酶结构域(例如胞苷脱氨酶或腺苷脱氨酶)融合。在一些这样的情况下,dcas融合蛋白被grna靶向到靶核酸中的特定位置(即序列),并施加基因座特异性修饰,例如如果融合蛋白具有胞苷脱氨酶活性则用t代替c(或用a代替g)或如果融合蛋白具有腺苷脱氨酶活性则用g代替a(或用c代替t)。[0418]在一些实施方案中,dcas是dcas13突变体(konermann等人,cell173(2018),665-676)。然后可以将这些dcas13突变体与修饰rna的酶融合,包括腺苷脱氨酶(例如adar1和adar2)。腺苷脱氨酶将腺嘌呤转化为肌苷,其被翻译机制视为鸟嘌呤,从而在靶序列中产生功能性a到g的变化。[0419]在一些实施方案中,crispr相关效应蛋白是cas9核酸内切酶。在一些实施方案中,crispr相关效应蛋白是crispr-cas变体,其是dcas9突变体或ncas9切口酶突变体。cas9核酸内切酶具有包含两个子结构域:i)切割非互补单链链的ruvc子结构域和ii)切割与grna互补的链的hnh核酸酶子结构域的dna切割结构域。这些子结构域中的突变可以使cas9核酸内切酶失活以形成失活的cas9(dcas9),其与“催化死亡的cas9”互换使用。核酸酶失活的cas9保留了由grna指导的dna结合能力。因此,原则上,当与额外的蛋白质融合时,dcas9可以通过与适当的引导rna共表达简单地将所述额外的蛋白质靶向到几乎任何dna序列。例如,含有使其核酸酶活性失活的asp10ala(d10a)和his840ala(h840a)突变的催化死亡的cas9(dcas9)保留其以引导rna编程方式结合dna的能力,但不切割dna主链(komor等人,nature(2016),vol533:420-424)。在一些实施方案中,dcas9与介导一个碱基向另一个碱基的直接转化的酶或化学催化剂的缀合可以实现rna编程的dna碱基编辑。[0420]在一些实施方案中,突变cas9是cas9切口酶(ncas9)突变体。cas9切口酶突变体仅包含一个催化活性结构域(ruvc结构域(d10a)或hnh结构域(h840a))。cas9切口酶突变体保留基于grna特异性的dna结合,但只能切割dna的一条链,导致单链断裂(例如“切口”)。在一些实施方案中,两种互补的cas9切口酶突变体(例如,具有失活的ruvc结构域的一种cas9切口酶突变体和具有失活的hnh结构域的一种cas9切口酶突变体)在具有对应于两种相应靶序列的两种grna的相同细胞中表达;一个靶序列在有义dna链上,一个靶序列在反义dna链上。这种双切口酶系统导致交错的双链断裂并且可以增加靶特异性,因为不太可能的是两个脱靶切口将足够接近地产生以产生双链断裂。在一些实施方案中,cas9切口酶突变体与核酸修复模板共表达以促进通过同源定向修复掺入外源核酸序列。[0421]本公开内容的dcas9可以来源于不同物种的cas9,例如来源于化脓性链球菌cas9(spcas9)。spcas9的ruvc子结构域和hnh核酸酶子结构域中的突变(包括例如d10a和h840a突变)使化脓性链球菌cas9核酸酶失活,导致核酸酶死亡/催化死亡cas9(dcas9)。在本公开内容的一些实施方案中,核酸酶失活的cas9包含dcas9。在一些优选的实施方案中,核酸酶失活的cas9包括。[0422]通过突变使子结构域之一失活允许cas9获得切口酶活性,即,产生cas9切口酶(ncas9),例如,仅具有d10a突变的ncas9。[0423]在一些实施方案中,核酸酶失活的cas9相对于野生型cas9包含氨基酸取代d10a和/或h840a。在一些实施方案中,本公开内容的核酸酶失活的cas9完全失去核酸酶活性,其在催化上是死亡的。在这样的实施方案中,核酸酶失活的cas9是具有d10a和h840a的dcas9。因此,术语“核酸酶失活的cas9”是指dcas9和/或ncas9。[0424]在一些实施方案中,可用于本发明的核酸酶失活的cas9可包含切口酶活性。在一些实施方案中,核酸酶失活的cas9是cas9切口酶,其保留cas9的hnh子结构域的切割活性,而ruvc子结构域的切割活性是失活的。例如,核酸酶失活的cas9相对于野生型cas9含有氨基酸取代d10a。在一些实施方案中,核酸酶失活的cas9是仅具有d10a的ncas9。在一些实施方案中,核酸酶失活的cas9包含ncas9。[0425]在一些实施方案中,本文所述的cas多肽可以被工程化以改变cas多肽的pam/pfs特异性。在一些实施方案中,突变cas多肽具有不同于亲本cas多肽的pam/pfs特异性的pam/pfs特异性。例如,可以修饰天然存在的cas蛋白以改变突变cas多肽识别的pam/pfs序列,以减少脱靶位点、提高特异性或消除pam/pfs识别要求。在一些实施方案中,可以修饰cas蛋白以增加pam/pfs识别序列的长度。在一些实施方案中,pam识别序列的长度为至少4、5、6、7、8、9、10或15个氨基酸。可以使用定向进化生成识别不同pam/pfs序列和/或具有降低的脱靶活性的cas多肽。可用于cas多肽定向进化的示例性方法和系统在例如esvelt等人nature2011,472(7344):499-503中有所描述。示例性的cas突变体描述于国际pct公开号wo2015/161276和konermann等人,cell173(2018),665-676,其通过引用整体并入本文。[0426]术语“crispr复合物”、“crispr核酸内切酶复合物”、“crisprcas复合物”或“crispr-grna复合物”在本文中可互换使用。“crispr复合物”是指例如与引导rna(grna)复合的cas9核酸酶和/或其他crispr相关效应物(例如,cas12a/cpf1)。因此,术语“crispr复合物”是指能够在crispr着陆位点诱导双链断裂的crispr核酸内切酶和引导rna(以及任何其他crispr核苷酸序列/多肽)的组合。在一些实施方案中,本公开内容的“crispr复合物”是指催化上死亡的cas9蛋白和引导rna的组合,其能够靶向靶序列但不能在crispr着陆位点诱导双链断裂(因为它失去了核酸酶活性)。在其他实施方案中,本公开内容的“crispr复合物”是指cas9切口酶和能够在dna中引入grna靶向的单链断裂而不是由野生型cas酶产生的双链断裂的引导rna的组合。[0427]如本文所用,在crispr复合物的上下文中术语“引导序列特异性结合”是指引导rna将crispr核酸内切酶和/或crispr-cas效应蛋白募集到crispr着陆位点的能力。[0428]如本文所用,术语“脱氨酶”是指催化脱氨反应的酶。在本发明的一些实施方案中,脱氨酶是指胞苷脱氨酶,其分别催化胞苷或脱氧胞苷脱氨为尿嘧啶或脱氧尿苷。在本公开内容的其他实施方案中,脱氨酶是指腺苷脱氨酶,其催化腺嘌呤脱氨以形成次黄嘌呤(以其核苷肌苷的形式),其被dna聚合酶解读为鸟嘌呤。[0429]在一些实施方案中,脱氨酶结构域与核酸酶失活的cas9结构域的n端融合。在一些实施方案中,脱氨酶结构域与核酸酶失活的cas9结构域的c端融合。在一些实施方案中,脱氨酶结构域和核酸酶失活的cas9结构域通过接头融合。接头可以是非功能性氨基酸或氨基酸序列,任选地不具有二级或更高级结构,n-末端和在c-末端的一个或多个nls。在存在不止一个nls的情况下,每个nls可以独立于其他nls来选择。在一些实施方案中,靶向碱基编辑融合蛋白可以包含两个nls,例如,两个nls分别位于n端和c端。[0430]在一些实施方案中,靶向碱基修饰是将任何核苷酸c、a、t或g转化为任何其他核苷酸。c、a、t或g核苷酸中的任何一个可以以由碱基编辑器或其催化活性片段介导的定点方式交换为另一种核苷酸。碱基编辑复合物可以包含任何碱基编辑器,或碱基编辑器结构域或其催化活性片段,其可以以靶向方式将感兴趣的核苷酸转化为任何其他感兴趣的核苷酸。[0431]在一些实施方案中,crispr-cas效应蛋白可以暂时或永久连接至至少一个碱基编辑器以形成靶向碱基编辑复合物,其是碱基编辑融合蛋白,其中碱基编辑复合物介导至少一个靶向碱基修饰。crispr相关效应物可以非共价(临时)或共价(永久)连接至至少一个碱基编辑器。至少一个碱基编辑器的任何组分可以暂时或永久地连接到至少一个crispr相关效应物。[0432]在一些实施方案中,根据本公开内容的碱基编辑复合物可包含至少一个胞苷脱氨酶或其催化活性片段。至少一个碱基编辑复合物可包含胞苷脱氨酶或其催化活性片段形式的结构域作为碱基编辑器。在一些实施方案中,根据本公开内容的碱基编辑结构域可以包含至少一个腺嘌呤脱氨酶或其催化活性片段。至少一个碱基编辑复合物可包含腺嘌呤脱氨酶或其催化活性片段形式的结构域作为碱基编辑器。[0433]可用于碱基编辑的任何脱氨酶结构域/多肽可用于本发明。在一些实施方案中,脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。[0434]可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见例如美国专利号10,167,457和thuronyi等人nat.biotechnol.37:1070–1079(2019),其各自关于其胞嘧啶脱氨酶的公开内容通过引用并入本文)。在一些实施方案中,胞苷脱氨酶包含胞嘧啶脱氨酶的野生型氨基酸序列。在一些实施方案中,胞苷脱氨酶在胞嘧啶脱氨酶序列中包含一个或多个突变,使得根据具体需要改变胞嘧啶脱氨酶的编辑效率和/或底物编辑偏好。[0435]在kim等人,naturebiotechnology(2017)35(4):371-377andharris等人mol.cell(2002)10:1247-1253中描述了apobec1和apobec3蛋白的某些突变,其各自通过引用整体并入本文。wo2017/070632和wo2018/213726中公开了另外的胞苷脱氨酶,其各自通过引用整体并入本文。[0436]胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此,在一些实施方案中,可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域,其催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶的变体,包括但不限于灵长类动物(例如人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠。因此,在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶约70%至约100%相同(例如,与天然存在的胞嘧啶脱氨酶约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,以及其中的任何范围或值)。[0437]胞苷脱氨酶能够靶向dna单链中的胞嘧啶。在一些实施方案中,胞嘧啶脱氨酶可以在存在于结合组分(例如结合的cas9和/或casl3)之外的单链上进行编辑。在一些实施方案中,胞嘧啶脱氨酶可以在局部泡处进行编辑,例如由在靶编辑位点但引导序列的错配形成的局部泡。[0438]在一些实施方案中,胞苷脱氨酶蛋白识别dna-rna异源双体的单链泡中的一个或多个靶胞嘧啶残基并将其转化为尿嘧啶残基。在一些实施方案中,胞苷脱氨酶蛋白识别dna-rna异源双体的单链泡上的结合窗口。在一些实施方案中,结合窗口包含至少一个靶胞嘧啶残基。在一些实施方案中,结合窗口在约3bp至约100bp的范围内。在一些实施方案中,结合窗口在约5bp至约50bp的范围内。在一些实施方案中,结合窗口在约10bp至约30bp的范围内。在一些实施方案中,结合窗口为约1bp、2bp、3bp、5bp、7bp、10bp、15bp、20bp、25bp、30bp、40bp、45bp、50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp或100bp。[0439]在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白bmrna-编辑复合物(apobec)家族脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是apobec1脱氨酶、apobec2脱氨酶、apobec3a脱氨酶、apobec3b脱氨酶、apobec3c脱氨酶、apobec3d脱氨酶、apobec3f脱氨酶、apobec3g脱氨酶、apobec3h脱氨酶、apobec4脱氨酶、人活化诱导脱氨酶(haid)、rapobec1、ferny和/或cda1,任选地pmcda1、atcda1(例如,at2g19570),以及它们的进化形式(例如,seqidno:27或seqidno:28)。在一些实施方案中,胞苷脱氨酶包含人apobec1全蛋白(hapobecl)或其脱氨酶结构域(hapobecl-d)或其c末端截短形式(hapobec-t)。在一些实施方案中,胞苷脱氨酶是与hapobecl、hapobec-d或hapobec-t同源的apobec家族成员。在一些实施方案中,胞苷脱氨酶包含人aid1全蛋白(haid)或其脱氨酶结构域(haid-d)或其c末端截短形式(haid-t)。在一些实施方案中,胞苷脱氨酶是与haid、haid-d或haid-t同源的aid家族成员。在一些实施方案中,haidt是在c末端截短约20个氨基酸的haid。在一些实施方案中,胞嘧啶脱氨酶可以是apobec1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是apobec3a脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是cda1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是ferny脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是具有seqidno:23的氨基酸序列的apobec1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是具有seqidno:24的氨基酸序列的apobec3a脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是cda1脱氨酶,任选地是具有seqidno:25的氨基酸序列的cda1。在一些实施方案中,胞嘧啶脱氨酶可以是ferny脱氨酶,任选地是具有seqidno:26的氨基酸序列的ferny。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如进化的脱氨酶)的氨基酸序列约70%至约100%相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%相同)。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可与seqidno:23、seqidno:24、seqidno:25或seqidno:26的氨基酸序列约70%至约99.5%相同(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%相同)(例如,与seqidno:23、seqidno:24、seqidno:25、seqidno:26、seqidno:27或seqidno:28的氨基酸序列至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同)。在一些实施方案中,可以对编码胞嘧啶脱氨酶的多核苷酸进行密码子优化以用于在植物中表达,并且密码子优化的多肽可以与参考多核苷酸约70%至99.5%相同。[0440]如本文所用,术语“糖基化酶”是指参与碱基切除修复的酶家族,分类在ec编号ec3.2.2下。碱基切除修复是去除和替换dna中受损碱基的机制。dna糖基化酶催化这一过程的第一步。它们去除受损的含氮碱基,同时保持糖-磷酸主链完整,形成无嘌呤/无嘧啶位点,通常称为ap位点。这是通过从双螺旋中去除受损碱基,然后切割n-糖苷键来实现的。在一些实施方案中,为了提供不同于脱氨酶等的突变引入倾向,可以使用通过dna的n-糖苷键的水解的碱基切除反应,然后在细胞的修复过程中诱导突变引入。在一些方面,可以使用具有胞嘧啶-dna糖基化酶(cdg)活性或胸腺嘧啶-dna糖基化酶(tdg)活性的酶。在一些方面,酵母线粒体尿嘧啶-dna糖基化酶(ung1)的突变体可以用作进行这种碱基切除反应的酶。nishida等人于2017年11月9日公开的us2017/0321210a1通过引用并入本文。[0441]碱基切除修复可以被结合编辑的链、阻断编辑的碱基、抑制尿嘧啶dna糖基化酶、抑制碱基切除修复、保护编辑的碱基和/或促进非靶向链的固定的分子抑制。因此,使用本文所述的碱基切除修复(ber)抑制子可以提高能够催化c到u变化的胞苷脱氨酶的编辑效率。[0442]因此,本发明的核酸构建体可以进一步编码尿嘧啶糖基化酶抑制子(ugi)(例如,尿嘧啶-dna糖基化酶抑制子)多肽/结构域。因此,在一些实施方案中,编码crispr-cas效应蛋白和胞嘧啶脱氨酶结构域的核酸构建体(例如,编码包含与胞嘧啶脱氨酶结构域融合的crispr-cas效应蛋白结构域的融合蛋白,和/或与肽标签或能够结合肽标签的亲和多肽融合的crispr-cas效应蛋白结构域和/或与肽标签或能够结合肽标签的亲和多肽融合的脱氨酶蛋白结构域)可以进一步编码尿嘧啶-dna糖基化酶抑制子(ugi),任选地其中ugi可以被密码子优化以用于在植物中表达。在一些实施方案中,本发明提供了包含crispr-cas效应多肽、脱氨酶结构域和ugi的融合蛋白和/或一种或多种编码它们的多核苷酸,任选地其中所述一种或多种多核苷酸可以被密码子优化以用于在植物中表达。在一些实施方案中,本发明提供了融合蛋白,其中crispr-cas效应多肽、脱氨酶结构域和ugi可以与本文所述的肽标签和亲和多肽的任何组合融合,从而将脱氨酶结构域和ugi募集到crispr-cas效应多肽和靶核酸。在一些实施方案中,引导核酸可以与募集rna基序连接,并且脱氨酶结构域和/或ugi中的一个或多个可以与能够与募集rna基序相互作用的亲和多肽融合,从而将脱氨酶结构域和ugi募集到靶核酸。[0443]可用于本发明的“尿嘧啶糖基化酶抑制子”可以是能够抑制尿嘧啶-dna糖基化酶碱基切除修复酶的任何蛋白质。[0444]合适的尿嘧啶糖基化酶抑制子(ugi)蛋白和核苷酸序列在本文中提供,并且其他合适的ugi序列是本领域技术人员已知的,并且包括例如以下公开的那些:wang等人j.biol.chem.264:1163-1171(1989);lundquist等人,j.biol.chem.272:21408-21419(1997);ravishankar等人nucleicacidsres.26:4880-4887(1998);和putnam等人j.mol.biol.287:331-346(1999),其各自以引用的方式并入本文。尿嘧啶糖基化酶抑制子(ugi)的其他实施方案在wo2018/086623、wo2018/205995、wo2017/70632和wo2018/213726中公开,它们各自以全文引用的方式并入本文。[0445]在一些实施方案中,尿嘧啶糖基化酶抑制子是枯草芽孢杆菌噬菌体pbs1的尿嘧啶dna糖基化酶抑制子或其活性片段,例如枯草芽孢杆菌噬菌体pbs1的83残基蛋白。在一些实施方案中,ugi结构域包括野生型ugi或ugi。在一些实施方案中,本文提供的ugi蛋白包括ugi片段和与ugi或ugi片段同源的蛋白。[0446]其他蛋白质可以是尿嘧啶糖基化酶抑制子。例如,能够抑制(例如,空间阻断)尿嘧啶-dna糖基化酶碱基切除修复酶的其他蛋白质在本公开内容的范围内。此外,阻断或抑制碱基切除修复的任何蛋白质也在本公开内容的范围内。在一些实施方案中,使用结合dna的蛋白质。在另一个实施方案中,使用ugi的替代品。在一些实施方案中,尿嘧啶糖基化酶抑制子是结合单链dna的蛋白质。例如,尿嘧啶糖基化酶抑制子可以是塔斯曼尼亚欧文氏菌单链结合蛋白。在一些实施方案中,尿嘧啶糖基化酶抑制子是结合尿嘧啶的蛋白质。在一些实施方案中,尿嘧啶糖基化酶抑制子是结合dna中的尿嘧啶的蛋白质。在一些实施方案中,尿嘧啶糖基化酶抑制子是无催化活性的尿嘧啶dna-糖基化酶蛋白。在一些实施方案中,尿嘧啶糖基化酶抑制子是不从dna中切除尿嘧啶的催化失活的尿嘧啶dna-糖基化酶蛋白。作为另一个例子,尿嘧啶糖基化酶抑制子是无催化活性的udg。[0447]在一些实施方案中,ugi结构域包含野生型ugi或其片段。在一些实施方案中,可用于本发明的ugi结构域可以与天然存在的ugi结构域的氨基酸序列约70%至约100%相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%相同以及其中的任何范围或值)。在一些实施方案中,ugi结构域可包含seqidno:35的氨基酸序列或与seqidno:35的氨基酸序列具有约70%至约99.5%序列同一性的多肽(例如,与seqidno:35的氨基酸序列具有至少80%,至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的同一性)。例如,在一些实施方案中,ugi结构域可以包含seqidno:35的氨基酸序列的片段,其与seqidno:35的氨基酸序列的连续核苷酸的一部分(例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个连续核苷酸;例如,约10、15、20、25、30、35、40、45至约50、55、60、65,70、75、80个连续核苷酸)100%相同。在一些实施方案中,ugi结构域可以是与已知ugi具有约70%至约99.5%序列同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%序列同一性,以及其中的任何范围或值)的已知ugi(例如,seqidno:35)的变体。在一些实施方案中,编码ugi的多核苷酸可以针对在植物(例如植物)中表达进行密码子优化,并且密码子优化的多肽可以与参考多核苷酸具有约70%至约99.5%的同一性。[0448]可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是来自任何生物体的任何已知的或以后鉴定的腺嘌呤脱氨酶(参见例如美国专利号10,113,163,其关于其腺嘌呤脱氨酶的公开内容通过引用并入本文)。可用于本发明的腺苷脱氨酶(例如工程化的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体,例如细菌。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体的天然存在的脱氨酶的变体。在一些实施方案中,脱氨酶或脱氨酶结构域在自然界中不存在。例如,在一些实施方案中,脱氨酶或脱氨酶结构域与天然存在的脱氨酶至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,腺苷脱氨酶来自细菌,例如大肠杆菌(e.coli)、金黄色葡萄球菌(s.aureus)、伤寒沙门氏菌(s.typhi)、腐败希瓦氏菌(s.putrefaciens)、流感嗜血杆菌(h.influenzae)或新月柄杆菌(c.crescentus)。[0449]腺嘌呤脱氨酶催化腺嘌呤或腺苷的水解脱氨。在一些实施方案中,腺嘌呤脱氨酶可分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷。在一些实施方案中,腺苷脱氨酶可以催化dna中腺嘌呤或腺苷的水解脱氨。在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶可以在靶核酸的有义链(例如“ ”;模板)中产生a→g转换或在靶核酸的反义链(例如,“‑”,互补的)中产生t→c转换。[0450]在一些实施方案中,腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此,在一些实施方案中,腺苷脱氨酶可以与野生型腺嘌呤脱氨酶具有约70%至100%的同一性(例如,与天然存在的腺嘌呤脱氨酶约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,以及其中的任何范围或值)。在一些实施方案中,一种或多种脱氨酶在自然界中不存在并且可以被称为工程化的、突变的或进化的腺苷脱氨酶。因此,例如,工程化的、突变的或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域具有约70%至99.9%的同一性(例如,与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%相同,以及其中的任何范围或值)。在一些实施方案中,腺苷脱氨酶可以来自细菌(例如,大肠杆菌、金黄色葡萄球菌、流感嗜血杆菌、新月柄杆菌等)。在一些实施方案中,编码腺嘌呤脱氨酶多肽/结构域的多核苷酸可以进行密码子优化以用于在植物中表达。[0451]在一些实施方案中,可用于本发明的腺苷脱氨酶包括但不限于被称为作用于rna的腺苷脱氨酶(adar)的酶家族的成员、被称为作用于trna的腺苷脱氨酶(adat)的酶家族的成员和其他含有腺苷脱氨酶结构域(adad)的家族成员。根据本公开内容,腺苷脱氨酶能够靶向rna/dna异源双体中的腺嘌呤。实际上,zheng等人(nucleicacidsres.2017,45(6):3369-3377)已经证明adar可以对rna/dna异源双体进行腺苷到肌苷的编辑反应。在特定实施方案中,腺苷脱氨酶已被修饰以增加其编辑rna/dna异源双体中的dna的能力。[0452]在一些实施方案中,腺苷脱氨酶可来源于一种或多种后生动物物种,包括但不限于哺乳动物、鸟类、青蛙、鱿鱼、鱼、苍蝇和蠕虫。[0453]在一些实施方案中,腺苷脱氨酶是人、鱿鱼或果蝇腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶是人adar,包括hadar1、hadar2、hadar3。在一些实施方案中,腺苷脱氨酶是秀丽隐杆线虫adar蛋白,包括adr-1和adr-2。在一些实施方案中,腺苷脱氨酶是果蝇adar蛋白,包括dadar。在一些实施方案中,腺苷脱氨酶是鱿鱼长翼鱿鱼(loligopealeii)adar蛋白,包括sqadar2a和sqadar2b。在一些实施方案中,腺苷脱氨酶是人adat蛋白。在一些实施方案中,腺苷脱氨酶是果蝇adat蛋白。在一些实施方案中,腺苷脱氨酶是人adad蛋白,包括ter(hadad1)和terl(hadad2)。在一些实施方案中,腺苷脱氨酶是小鼠ada(参见grunebaum等人,curr.opin.allergyclin.immunol.13:630-638(2013))或人adat2(参见fukui等人,j.nucleicacids2010:260512(2010)),其各自以引用的方式整体并入本文。腺苷脱氨酶的其他实施方案在美国专利号us10,113,163和wo2018/213708中公开,其各自通过引用整体并入本文。[0454]在一些实施方案中,腺嘌呤脱氨酶结构域可以是野生型trna特异性腺苷脱氨酶结构域,例如trna特异性腺苷脱氨酶(tada)和/或突变/进化的腺苷脱氨酶结构域,例如突变/进化的trna特异性腺苷脱氨酶结构域(tada*)。在一些实施方案中,tada结构域可以来自大肠杆菌。在一些实施方案中,tada可以被修饰,例如截短,相对于全长tada缺失一个或多个n端和/或c端氨基酸(例如,相对于全长tada,可能缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端和/或c端氨基酸残基。在一些实施方案中,tada多肽或tada结构域不包含n-末端甲硫氨酸。在一些实施方案中,tada多肽或tada结构域不包含n-末端甲硫氨酸。在一些实施方案中,腺苷脱氨酶是tada脱氨酶。在一些实施方案中,tada脱氨酶是大肠杆菌tada脱氨酶(ectada)。在一些实施方案中,tada脱氨酶是截短的大肠杆菌tada脱氨酶。例如,截短的ectada可能相对于全长ectada缺少一个或多个n端氨基酸。在一些实施方案中,腺苷脱氨酶如gaudelli等人(natbiotechnol(2020)(doi.org/10.1038/s41587-020-0491-6))和richter等人(natbiotechnol(2020)(doi.org/10.1038/s41587-020-0453-z))所述。在一些实施方案中,截短的ectada可能相对于全长ectada缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端氨基酸残基。在一些实施方案中,截短的ectada可能相对于全长ectada缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个c端氨基酸残基。在一些实施方案中,ectada脱氨酶不包含n端甲硫氨酸。[0455]在一些实施方案中,野生型大肠杆菌tada包含seqidno:30的氨基酸序列。在一些实施方案中,突变/进化的大肠杆菌tada*包含seqidno:31-34(例如,seqidno:31、32、33或34)的氨基酸序列。在一些实施方案中,编码tada/tada*的多核苷酸可以进行密码子优化以用于在植物中表达。[0456]胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体),导致基因组中互补链中的c到t转换或g到a转换。因此,在一些实施方案中,由本发明的多核苷酸编码的胞嘧啶脱氨酶在靶核酸的有义链(例如“ ”;模板)中产生c→t转换或在靶核酸的反义链(例如、"-"、互补的)中产生g→a转换。[0457]在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶在靶核酸的有义链(例如“ ”;模板)中产生a→g转换或在靶核酸的反义链(例如、"-"、互补的)中产生t→c转换。[0458]在一些方面,提供了用于靶核酸(更具体地,在感兴趣的基因座中(例如,编码参与硫代葡萄糖苷生物合成或分解的酶的基因,例如,黑芥子酶基因、cyp79f1基因和/或aop2基因))中的腺嘌呤或胞苷的靶向脱氨的方法。腺苷脱氨酶(ad)蛋白和/或胞苷脱氨酶(cd)蛋白可通过可特异性结合靶序列的crispr-cas复合物特异性募集至感兴趣的基因座中的靶腺嘌呤或胞苷。为了实现这一点,腺苷脱氨酶蛋白和/或胞苷脱氨酶蛋白可以与crispr-cas酶共价连接,或者可以作为单独的蛋白提供,但经过调整以确保其募集到crispr-cas复合物。[0459]在一些实施方案中,通过将腺苷脱氨酶或其催化结构域和/或胞嘧啶脱氨酶或其催化结构域与crispr-cas蛋白融合来确保将腺苷脱氨酶和/或胞苷脱氨酶募集到靶基因座,所述crispr-cas蛋白是cas或cpfl蛋白。从两种分离的蛋白质产生融合蛋白质的方法是本领域已知的并且通常涉及使用间隔区或接头。crispr-cas蛋白可以与腺苷脱氨酶蛋白或其催化结构域和/或胞嘧啶脱氨酶或其催化结构域在其n-或c-末端融合。在一些实施方案中,crispr-cas蛋白是cas或cpfl蛋白并且连接到脱氨酶蛋白或其催化结构域的n端。[0460]本发明的编码包含序列特异性dna结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的核酸构建体,以及编码其的核酸构建体/表达盒/载体,可以与引导核酸组合使用以用于修饰靶标核酸包括但不限于在靶核酸(包括但不限于质粒序列)中产生c→t或g→a突变;在编码序列中产生c→t或g→a突变以改变氨基酸同一性;在编码序列中产生c→t或g→a突变以产生终止密码子;在编码序列中产生c→t或g→a突变以破坏起始密码子;在基因组dna中产生点突变以破坏功能;和/或在基因组dna中产生点突变以破坏剪接点。[0461]本发明的编码包含序列特异性dna结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的核酸构建体,以及编码其的表达盒和/或载体,可以与引导核酸组合使用以用于修饰靶核酸,包括但不限于在靶核酸(包括但不限于质粒序列)中产生a→g或t→c突变;在编码序列中产生a→g或t→c突变以改变氨基酸同一性;在编码序列中产生a→g或t→c突变以产生终止密码子;在编码序列中产生a→g或t→c突变以破坏起始密码子;在基因组dna中产生点突变以破坏功能;和/或在基因组dna中产生点突变以破坏剪接点。[0462]包含crispr-cas效应蛋白或其融合蛋白的本发明的核酸构建体可以与引导rna(grna、crispr阵列、crisprrna、crrna)组合使用,该引导rna被设计成与编码的crispr-cas效应蛋白或结构域一起发挥作用以修饰靶核酸。可用于本发明的引导核酸包含至少一个间隔序列和至少一个重复序列。引导核酸能够与由本发明的核酸构建体编码和表达的crispr-cas核酸酶结构域形成复合物,并且间隔序列能够与靶核酸杂交,从而引导复合物(例如,crispr-cas效应融合蛋白(例如,与脱氨酶结构域融合的crispr-cas效应结构域和/或与肽标签或亲和多肽融合的crispr-cas效应结构域以募集脱氨酶结构域和任选地ugi)至靶核酸,其中靶核酸可以被脱氨酶结构域修饰(例如,切割或编辑)或调节(例如,调节转录)。[0463]例如,编码与胞嘧啶脱氨酶结构域连接的cas9结构域(例如,融合蛋白)的核酸构建体可以与cas9引导核酸组合使用以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑靶核酸。在另一个实例中,编码与腺嘌呤脱氨酶结构域连接的cas9结构域(例如,融合蛋白)的核酸构建体可与cas9引导核酸组合使用以修饰靶核酸,其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨基,从而编辑靶核酸。[0464]同样,编码与胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域连接的cas12a结构域(或其他选定的crispr-cas核酸酶,例如c2c1、c2c3、cas12b、cas12c、cas12d、cas12e、cas13a、cas13b、cas13c、cas13d、cas1、cas1b、cas2、cas3、cas3'、cas3"、cas4、cas5、cas6、cas7、cas8、cas9(也称为csnl和csx12)、cas10、csyl、csy2、csy3、csel、cse2、cscl、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、csbl、csb2、csb3、csxl7、csxl4、csx10、csx16、csax、csx3、csxl、csxl5、csfl、csf2、csf3、csf4(ding)、和/或csf5)(例如,融合蛋白)可与cas12a引导核酸(或其他选定的crispr-cas核酸酶的引导核酸)组合使用以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨基,从而编辑靶核酸。[0465]本文还提供了将定点修饰多肽引导至特定靶核酸序列的“引导核酸”(例如,引导rna、“grna”、“crisprrna/dna”、“crispr”、“crrna”或“crdna”)。引导核酸包含核酸靶向区段和蛋白质结合区段。引导核酸的核酸靶向区段包含与靶核酸序列中的序列互补的核苷酸序列。因此,引导核酸的核酸靶向区段通过杂交(即碱基配对)以序列特异性方式与靶核酸相互作用,并且核酸靶向区段的核苷酸序列决定了引导核酸将结合的在靶核酸内的位置。可以修饰(例如,通过基因工程化)引导核酸的核酸靶向区段以与靶核酸序列内的任何所需序列杂交。[0466]引导核酸的蛋白质结合区段与定点修饰多肽(例如,cas蛋白、cas12a蛋白)相互作用以形成复合物。引导核酸通过上述核酸靶向区段将结合的多肽引导至靶核酸内的特定核苷酸序列。引导核酸的蛋白质结合区段包含彼此互补并形成双链rna双体的两段核苷酸。[0467]在一些实施方案中,引导核酸包含两个单独的核酸(rna、dna分子。在这样的实施方案中,两个核酸分子中的每一个可以包含彼此互补的一段核苷酸,使得两个分子的互补核苷酸杂交以形成蛋白质结合区段的双链核酸双体。在一些实施方案中,引导核酸包含单个引导rna分子(sgrna)(例如,crispr和tracr)。[0468]因此,本文所用的“引导核酸”是指包含至少一个与靶dna(例如,前间隔区)互补(和杂交)的间隔序列和至少一个重复序列(例如,v型cas12acrispr-cas系统的重复序列,或其片段或部分;ii型cas9crispr-cas系统的重复序列,或其片段;v型c2c1crisprcas系统的重复序列,或其片段;例如c2c3、cas12a(也称为cpf1)、cas12b、cas12c、cas12d、cas12e、cas13a、cas13b、cas13c、cas13d、casl、caslb、cas2、cas3、cas3'、cas3"、cas4、cas5、cas6、cas7、cas8、cas9(也称为csnl和csx12)、cas10、csyl、csy2、csy3、csel、cse2、cscl、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、csbl、csb2、csb3、csxl7、csxl4、csx10、csx16、csax、csx3、csxl、csxl5、csfl、csf2、csf3、csf4(ding)、和/或csf5的crispr-cas系统的重复序列,或其片段)的核酸,其中重复序列可以连接到间隔序列的5'端和/或3'端。本发明的grna的设计可以基于i型、ii型、iii型、iv型、v型或vi型crispr-cas系统。[0469]在一些实施方案中,靶向编辑系统(例如碱基编辑系统)包含一个或两个或更多个grna分子,每个grna分子包含dna结合区段,其中至少一个核酸结合区段结合编码硫代葡萄糖苷生物合成酶或分解或异化硫代葡萄糖苷的酶(例如黑芥子酶、aop2和cyp79f1)的靶基因的靶dna序列,可用于产生本公开内容的植物。在一些实施方案中,引导rna是单一引导rna(sgrna)。根据给定的靶序列构建合适的sgrna的方法是本领域已知的。参见例如,wang,y.等人simultaneouseditingofthreehomoeoallelesinhexaploidbreadwheatconfersheritableresistancetopowderymildew.nat.biotechnol.32,947-951(2014);shan,q.等人targetedgenomemodificationofcropplantsusingacrispr-cassystem.nat.biotechnol.31,686-688(2013);liang,z.等人targetedmutagenesisinzeamaysusingtalensandthecrispr/cassystem.jgenetgenomics.41,63-68(2014)。[0470]在一些实施方案中,cas12a引导核酸可以从5'到3'包含重复序列(全长或其部分(“柄”);例如,假结样结构)和间隔序列。[0471]在一些实施方案中,引导核酸可以包含多于一个重复序列-间隔序列(例如,2、3、4、5、6、7、8、9、10或更多个重复序列-间隔序列)(例如,重复序列-间隔序列-重复序列,例如,重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列等)。本发明的引导核酸是合成的、人造的并且在自然界中不存在。引导核酸可以很长,并且可以用作适体(如在ms2募集策略中)或拉开(hangingoff)间隔区的其他rna结构。[0472]如本文所用,“重复序列”是指例如野生型crisprcas基因座(例如,cas9基因座、cas12a基因座、c2c1基因座等)的任何重复序列或与本发明的核酸构建体编码的crispr-cas效应蛋白一起起作用的合成crrna。可用于本发明的重复序列可以是crispr-cas基因座的任何已知或以后鉴定的重复序列(例如,i型、ii型、iii型、iv型、v型或vi型),或者它可以是设计在i、ii、iii、iv、v或vi型crispr-cas系统中起作用的合成的重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中,重复序列可以在其5'端形成假结样结构(即,“柄”)。因此,在一些实施方案中,重复序列可以与来自野生型i型、crispr-cas基因座、ii型crispr-cas基因座、iii型crispr-cas基因座、iv型crispr-cas基因座、v型crispr-cas基因座和/或vi型crispr-cas基因座的重复序列相同或基本相同。来自野生型crispr-cas基因座的重复序列可以通过已建立的算法来确定,例如使用通过crisprdb提供的crisprfinder(参见grissa等人nucleicacidsres.35(webserverissue):w52-7)。在一些实施方案中,重复序列或其部分在其3'末端连接到间隔序列的5'末端,从而形成重复间隔序列(例如,引导核酸、引导rna/dna、crrna、crdna)。[0473]在一些实施方案中,重复序列包含、基本上由或由至少10个核苷酸组成,这取决于特定的重复序列以及包含重复序列的引导核酸是加工的还是未加工的(例如,约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50至100个或更多个核苷酸,或其中的任何范围或值)。在一些实施方案中,重复序列包含、基本上由或由约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100或更多个的核苷酸组成。[0474]与间隔序列的5'末端连接的重复序列可以包含重复序列的一部分(例如,野生型重复序列的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35个或更多个连续核苷酸)。在一些实施方案中,与间隔序列的5'末端连接的重复序列的一部分的长度可以是约5至约10个连续核苷酸(例如,约5、6、7、8、9、10个核苷酸)并且与野生型crisprcas重复核苷酸序列的相同区域(例如,5'端)具有至少90%的序列同一性(例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多(例如,99.1、99.2、99.3、99.4、99.5、99.6、99.7、99.8、99.9或100%))。在一些实施方案中,重复序列的一部分可以在其5'端包含假结样结构(例如,“柄”)。[0475]如本文所用,“间隔序列”是与靶核酸(例如,靶dna)(例如,前间隔区)(例如,黑芥子酶基因、cyp79f1基因或aop2基因的连续核苷酸)互补的核苷酸序列。在一些实施方案中,可用于本发明的间隔序列可以与与seqidno:66-92、seqidno:113、seqidno:114、seqidno:118-127或seqidno:680-742的任一核苷酸序列具有至少80%序列同一性的序列互补;或与编码与seqidno:93-105、115、128-132、617-679或743-786的任一氨基酸序列具有至少80%序列同一性的序列的连续核苷酸的一部分互补。在一些实施方案中,间隔序列可包括但不限于与seqidno:116或seqidno:117、seqidno:133-140和/或seqidno:106-112的任一核苷酸序列具有至少80%同一性的序列。[0476]引导核酸对靶基因座的特异性由核酸结合区段的序列(例如,间隔序列)介导,其包含与靶基因座内的靶核酸序列互补的序列。间隔序列可以与靶核酸完全互补或基本上互补(例如,至少约70%互补(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多(例如,99.1、99.2、99.3、99.4、99.5、99.6、99.7、99.8、99.9或100%))。因此,在一些实施方案中,与靶核酸相比,间隔序列可以具有一个、两个、三个、四个或五个错配,这些错配可以是连续的或不连续的。在一些实施方案中,间隔序列可以与靶核酸具有70%的互补性。在其他实施方案中,间隔核苷酸序列可以与靶核酸具有80%的互补性。在其他实施方案中,间隔核苷酸序列可以与靶核酸(前间隔区)具有85%、90%、95%、96%、97%、98%、99%或99.5%的互补性等。在一些实施方案中,间隔序列与靶核酸100%互补。间隔序列可具有约15个核苷酸至约30个核苷酸(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸或其中的任何范围或值)的长度。因此,在一些实施方案中,间隔序列可在长度为至少约15个核苷酸至约30个核苷酸的靶核酸(例如,前间隔区)的区域上具有完全互补性或基本互补性。在一些实施方案中,间隔区的长度约为20个核苷酸。在一些实施方案中,间隔区的长度约为21、22或23个核苷酸。[0477]在一些实施方案中,引导核酸的间隔序列的5'区域可以与靶dna相同,而间隔区的3'区域可以与靶dna(例如,v型crispr-cas)基本上互补,或引导核酸的间隔序列的3'区域可以与靶dna相同,而间隔区的5'区域可以与靶dna(例如ii型crispr-cas)基本上互补,并且因此,间隔序列与靶dna的总体互补性可能低于100%。因此,例如,在v型crispr-cas系统的引导物中,例如20个核苷酸的间隔序列的5'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶dna100%互补,而间隔序列的3'区域中的剩余核苷酸与靶dna基本上互补(例如,至少约70%互补)。在一些实施方案中,间隔序列的5'端的前1至8个核苷酸(例如,前1、2、3、4、5、6、7、8个核苷酸以及其中的任何范围)可以与靶dna100%互补,而间隔序列3'区中的剩余核苷酸与靶dna基本上互补(例如,至少约50%互补(例如,50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多))。[0478]作为另一个例子,在ii型crispr-cas系统的引导物中,例如20个核苷酸的间隔序列的3'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶dna100%互补,而间隔序列的5'区域中的剩余核苷酸与靶dna基本上互补(例如,至少约70%互补)。在一些实施方案中,间隔序列的3'端的前1至10个核苷酸(例如,前1、2、3、4、5、6、7、8、9、10个核苷酸,以及其中的任何范围)可以与靶dna100%互补,而间隔序列的5'区域的剩余核苷酸与靶dna基本上互补(例如,至少约50%互补(例如,至少约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或其中的任何范围或值))。[0479]在一些实施方案中,间隔区的种子区可以是约8至约10个核苷酸的长度、约5至约6个核苷酸的长度或约6个核苷酸的长度。[0480]术语“tracrrna”是指小的反式编码的rna。tracrrna与crrna互补并与其碱基配对以形成crrna/tracrrna杂交体,能够将crispr核酸内切酶和/或crispr相关效应物募集到靶序列。[0481]如本文所用,“靶核酸”、“靶dna”、“靶rna”、“靶核苷酸序列”、“靶区域”或“基因组中的靶区域”是指植物基因组中与本发明的引导核酸中的间隔序列完全互补(100%互补)或基本互补(例如,至少70%互补(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多))的区域。可用于crispr-cas系统的靶区域可以紧邻生物体基因组(例如植物基因组)中的pam序列的3'(例如,v型crispr-cas系统)或紧邻其5'(例如ii型crispr-cas系统)定位。靶区域可以选自紧邻pam序列定位的至少15个连续核苷酸(例如,16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸等)的任何区域。在一些实施方案中,靶核酸序列是rna靶序列。在一些实施方案中,靶核酸序列是dna靶序列。[0482]“前间隔序列”是指靶双链dna,并且特别是指与crispr重复序列-间隔序列(例如,引导核酸、crispr阵列、crrna)完全或基本上互补(和杂交)的靶dna(例如,或基因组中的靶区域)的部分。[0483]在v型crispr-cas(例如,cas12a)系统和ii型crispr-cas(cas9)系统的情况下,前间隔序列的两侧是(例如,紧邻)前间隔区相邻基序(pam)。对于iv型crispr-cas系统,pam位于非靶标链的5'端和靶标链的3'端(例如,见下文)。[0484][0485]在ii型crispr-cas(例如cas9)系统的情况下,pam紧邻靶区域的3'定位。i型crispr-cas系统的pam位于靶标链的5'。没有已知的用于iii型crispr-cas系统的pam。makarova等人描述了crispr系统的所有类别、类型和亚型的命名法(naturereviewsmicrobiology13:722–736(2015))。r.barrangou(genomebiol.16:247(2015))描述了引导物结构和pam。[0486]典型的cas12apam富含t。在一些实施方案中,典型的cas12apam序列可以是5'-ttn、5'-tttn或5'-tttv。在一些实施方案中,典型的cas9(例如,化脓性链球菌)pam可以是5'-ngg-3'。在一些实施方案中,可以使用非典型pam,但效率可能较低。[0487]本领域技术人员可以通过已建立的实验和计算方法确定另外的pam序列。因此,例如,实验方法包括靶向侧接所有可能的核苷酸序列的序列并识别不经历靶向的序列成员,例如通过靶质粒dna的转化(esvelt等人2013.nat.methods10:1116-1121;jiang等人2013.nat.biotechnol.31:233-239)。在一些方面,计算方法可以包括对天然间隔区进行blast搜索以鉴定噬菌体或质粒中的原始靶dna序列,并比对这些序列以确定与靶序列相邻的保守序列(brinerandbarrangou.2014.appl.environ.microbiol.80:994-1001;mojica等人2009.microbiology155:733-740)。[0488]在一些实施方案中,本发明提供了包含本发明的核酸构建体(例如,本发明的编辑系统的一种或多种组分)的表达盒和/或载体。在一些实施方案中,可以提供包含本发明的核酸构建体和/或一种或多种引导核酸的表达盒和/或载体。在一些实施方案中,编码碱基编辑器(例如,包含crispr-cas效应蛋白和脱氨酶结构域(例如,融合蛋白)的构建体)的本发明的核酸构建体或用于碱基编辑的组分(例如,与肽标签或亲和多肽融合的crispr-cas效应蛋白、与肽标签或亲和多肽融合的脱氨酶结构域、和/或与肽标签或亲和多肽融合的ugi)可以包含在相同的表达盒或载体上或在与包含一种或多种引导核酸的表达盒或载体分开的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含引导核酸的表达盒或载体不同的表达盒或载体上时,靶核酸可以以彼此任何顺序接触(例如,与其一起提供)编码碱基编辑器或用于碱基编辑的组分的表达盒或载体和引导核酸,例如,在提供包含引导核酸的表达盒的表达盒(例如,与靶核酸接触)之前、同时或之后。[0489]本发明的融合蛋白可以包含与如本领域已知的肽标签或与肽标签相互作用的亲和多肽融合的序列特异性dna结合结构域、crispr-cas多肽和/或脱氨酶结构域,用于募集脱氨酶到靶核酸。募集方法还可以包括与rna募集基序连接的引导核酸和与能够与rna募集基序相互作用的亲和多肽融合的脱氨酶,从而将脱氨酶募集至靶核酸。或者,化学相互作用可用于将多肽(例如脱氨酶)募集到靶核酸。[0490]可用于本发明的肽标签(例如表位)可以包括但不限于gcn4肽标签(例如sun-tag)、c-myc亲和标签、ha亲和标签、his亲和标签、s亲和标签、甲硫氨酸-his亲和标签、rgd-his亲和标签、flag八肽、strep标签或strep标签ii、v5标签和/或vsv-g表位。可以与多肽连接并且存在可以与另一多肽连接的相应亲和多肽的任何表位可用于本发明作为肽标签。在一些实施方案中,肽标签可包含1或2或更多个拷贝的肽标签(例如,重复单元、多聚化表位(例如,串联重复))(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个重复单元。在一些实施方案中,与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中,抗体可以是scfv抗体。在一些实施方案中,与肽标签结合的亲和多肽可以是合成的(例如,进化用于亲和相互作用),包括,但不限于,affibody、anticalin、monobody和/或darpin(参见,例如,sha等人,proteinsci.26(5):910-924(2017));gilbreth(curropinstrucbiol22(4):413-420(2013)),美国专利号9,982,053,其各自关于affibody、anticalin、monobody和/或darpin的教导内容通过引用整体并入本文。示例性肽标签包括但不限于不限于seqidno:39-41。[0491]在一些实施方案中,引导核酸可与rna募集基序连接,待募集的多肽(例如脱氨酶)可与结合rna募集基序的亲和多肽融合,其中引导物与靶核酸结合且rna募集基序与亲和多肽结合,从而将多肽募集到引导物并使靶核酸与多肽(例如脱氨酶)接触。在一些实施方案中,可以将两种或更多种多肽募集到引导核酸,从而使靶核酸与两种或更多种多肽(例如,脱氨酶)接触。[0492]在一些实施方案中,与亲和多肽融合的多肽可以是逆转录酶并且引导核酸可以是与rna募集基序连接的延伸的引导核酸。在一些实施方案中,rna募集基序可以位于延伸的引导核酸的延伸部分的3'末端(例如,5'-3',重复序列-间隔区-延伸部分(rt模板-引物结合位点)-rna募集基序)。在一些实施方案中,rna募集基序可以嵌入延伸部分中。[0493]在本发明的一些实施方案中,延伸的引导rna和/或引导rna可以与一个或两个或更多个rna募集基序(例如,1、2、3、4、5、6、7、8、9、10个或更多个基序;例如,至少10至约25个基序)连接,任选地其中两个或更多个rna募集基序可以是相同的rna募集基序或不同的rna募集基序。在一些实施方案中,rna募集基序和相应的亲和多肽可以包括但不限于端粒酶ku结合基序(例如,ku结合发夹)和相应的亲和多肽ku(例如,ku异二聚体),端粒酶sm7结合基序和相应的亲和多肽sm7、ms2噬菌体操纵子茎环和相应的亲和多肽ms2外壳蛋白(mcp)、pp7噬菌体操纵子茎环和相应的亲和多肽pp7外壳蛋白(pcp)、sfmu噬菌体com茎环和相应的亲和多肽comrna结合蛋白、puf结合位点(pbs)和亲和多肽pumilio/fem-3mrna结合因子(puf),和/或合成的rna适体和适体配体作为相应的亲和多肽。在一些实施方案中,rna募集基序和相应的亲和多肽可以是ms2噬菌体操纵子茎环和亲和多肽ms2外壳蛋白(mcp)。在一些实施方案中,rna募集基序和相应的亲和多肽可以是puf结合位点(pbs)和亲和多肽pumilio/fem-3mrna结合因子(puf)。示例性募集基序包括但不限于seqidno:42-52。[0494]在一些实施方案中,用于募集多肽和核酸的组分可以是通过化学相互作用起作用的那些组分,其可以包括但不限于雷帕霉素诱导的frb-fkbp二聚化;生物素-链霉亲和素;snap标签;halo标签;clip标签;化合物诱导的dmra-dmrc异二聚体;双功能配体(例如,两种蛋白质结合化学物质一起的融合体;例如二氢叶酸还原酶(dhfr)。[0495]在一些实施方案中,经优化以用于在植物中表达的本发明的核酸构建体、表达盒或载体可以与包含相同多核苷酸但尚未针对在植物中的表达进行密码子优化的核酸构建体、表达盒或载体约70%至100%相同(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。[0496]本文进一步提供了包含本发明的一种或多种多核苷酸、引导核酸、核酸构建体、表达盒或载体的细胞。[0497]现在将参考以下实施例描述本发明。应当理解,这些实施例并非旨在将权利要求的范围限制于本发明,而是旨在作为某些实施方案的示例。本领域技术人员想到的示例性方法的任何变化都旨在落入本发明的范围内。实施例[0498]给出以下实施例的目的是为了举例说明本公开内容的各种实施方案,并不意味着以任何方式限制本公开内容。如权利要求的范围所定义的,其中的变化和包含在本公开内容的精神内的其他用途对于本领域技术人员来说是明显的。[0499]实施例1.芥菜中黑芥子酶和myb转录因子的鉴定[0500]芥菜的基因组组装版本v1.5和基因注释从芸苔属数据库(brad,brassicadb.org/brad/)下载并用于基因组分析。此外,来自phytozome数据库的拟南芥基因组(组装版本tair10)和来自brad的芥菜-芜菁(brassicarapa)和黑芥(brassicanigra)-的基因组起源用于比较分析。[0501]首先,我们使用基因家族系统发育分析对芥菜中的黑芥子酶、aop2和cyp79f1进行了直向同源推断,该分析利用了来自各自基因组注释的预测基因模型。我们使用blast(blastp版本2.5.0;参数:‘‑segno-max_hsps1-max_target_seqs40-use_sw_tback’)和通过了e值《1e-10截止值的提取的蛋白质序列blast命中,使用来自表1的拟南芥基因标识符的蛋白质编码序列查询了物种蛋白质组-基于基因组注释中的预测基因模型。使用所有通过的blast命中作为查询序列执行blast搜索的第二次迭代,以生成用于聚类的倒数e值分数。使用hcluster_sg程序进行聚类(lih.constructingthetreefamdatabase.phdthesis,chineseacademyofsciencesbeijing.2006;ver.0.5.1,参数:“‑m750-w0-s0.34”)。使用具有默认参数设置的多序列比对程序t-coffee比对序列(notredame等人.2000.t-coffee:anovelmethodformultiplesequencealignments.jmb,302(205-217)doi:10.1006/jmbi.2000.4042;version_11.00.8cbe486)。对于系统发育树重建,在使用emboss包中的tranalign软件工具(rice等人emboss:theeuropeanmolecularbiologyopensoftwaresuite.(2000).trendsingenetics16,(6)pp276—277;ver.6.6.0.0)进行反向翻译后使用dna编码序列,我们使用modelfinder用于替代模型选择(kalyaanamoorthy等人(2017)modelfinder:fastmodelselectionforaccuratephylogeneticestimates.nat.methods,14:587-589)和iq-tree用于使用超快自举近似的树推理和分支支持估计(hoang等人(2018)ufboot2:improvingtheultrafastbootstrapapproximation.mol.biol.evol.,35:518–522,nguyen等人mol.biol.evol.,32:268-274(2015);iq-treeversion1.5.5;parameters:“‑bb1000”)。aop2和cyp79f1的直向同源物是通过检查树拓扑和鉴定来自多个物种的基因聚类发现的,其中最常见的祖先节点是物种形成事件。然而,该分析并未从芥菜中的黑芥子酶基因中鉴定出直向同源物。该分析依赖于基因组注释中的预测基因模型,任何未注释的基因都将无法发现。鉴于此限制,使用表1中的黑芥子酶基因id对整个基因组组装进行blast搜索。过滤blast搜索结果以保留至少70%查询覆盖率和e值《1e-10的序列命中。然后使用clustalomega(sievers&higgins(2018)clustalomegaformakingaccuratealignmentsofmanyproteinsciences.proteinsci27:135-145)在(版本2020.1.2)中进行系统发育分析,用于序列比对和相邻连接方法用于树推理。黑芥子酶的直向同源物是通过检查树拓扑和鉴定来自多个物种的基因聚类发现的,其中最常见的祖先节点是物种形成事件。使用与基因组组装(ncbi数据集:srp064721、srp137085、srp041526)的ngs短读数和长读数比对的视觉检查对所得基因进行手动注释。使用与基因组组装(ncbi数据集:srp058895)的下一代短(ngs)短读数比对的视觉检查进行基因序列抛光。[0502]表1-用于查询的基因id[0503][0504]实施例2.植物的基因编辑[0505]解除武装的根癌农杆菌用于引入表达选择性标记和靶向以在黑芥子酶、aop2或cyp79f1基因编码序列中产生双链断裂的crisprcas基因编辑组件的t-dna表达盒。t-dna进一步表达了crrna,其被编程以靶向芥菜(l.)黑芥子酶、aop2或cyp79f1酶编码基因。pcr和下一代测序用于确认实现了预期的遗传变化。从叶组织中分离出基因组dna,并将其作为使用对靶向的基因特异的引物的pcr反应中的模板。随后对扩增产物进行测序和表征以确认遗传变化。感兴趣的事件是发展的(advanced)和从分离群体中选择的后代。seqidno:141-599提供了使用本文所述的编辑系统实现的突变的一些实例。表2(见实施例末尾)提供了每个示例编辑伴随植物识别号(ceid)、相关编辑基因座、栽培品种和等位基因编辑百分比。seqidno:679-741是每个基因座的栽培品种野生型基因组(cdna)序列。可以看出,实现了各种各样的编辑。包含表2(实施例的结尾)中提供的突变/编辑的植物是无刺激性的或刺激性降低的。表5(实施例的结尾)提供了greenwave、redgiant和southerngiantcurl的芸苔品种中每个靶向基因座的野生型序列。[0506]黑芥子酶途径[0507]主要e0候选事件首先通过对野生型和其他编辑的e0材料的杂交比较口味评估来确定。主要e0候选者的特点是总共三名研究人员的一致的非刺激性味觉评估。这些编辑的事件随后被无性繁殖,并在以后通过定量黑芥子酶活性测定通过测量由于向叶提取物外源供应的黑芥子苷的水解而产生的葡萄糖释放进行评估。从主要e0事件中收获种子,并部署大型e1后代筛选来评估性状的遗传性并帮助将潜在基因座与性状的生化评估联系起来。在多个时间点对e1后代进行采样,以用于对葡萄糖释放活性的交叉比较评估,以鉴定继续在产品开发路径上前进的候选者。[0508]aop2路径[0509]主要非刺激性e0事件(ce35423和ce34664)通过与野生型和其他编辑材料的交叉比较口味评估来鉴定。在随后的组成分析中,从主要事件中收获叶材料,冻干并用hplc评估以测定硫代葡萄糖苷组成。根据在消耗新鲜组织时植物材料的非刺激性观察结果,与表现出温和刺激性的其他编辑植物和野生型植物材料相比,观察到黑芥子苷浓度的降低(表3)。因此,黑芥子苷是黑芥子酶水解后异硫氰酸烯丙酯的刺激性分解产物的硫代葡萄糖苷前体;支持在ce35423和ce34664中降低的刺激性的感官观察。[0510]表3.编辑的和野生型植物的黑芥子苷浓度和刺激性的比较[0511][0512]实施例3.编辑的植物的功能分析[0513]葡萄糖作为黑芥子酶与硫代葡萄糖苷底物的水解反应的产物释放。dosz等人,jagricfoodchem.62(32):8094-100(2014))报道,相对简单的测定可用于量化葡萄糖的发射,作为黑芥子酶活性的快速指标。作为对照,通过葡萄糖的比色检测来测试黑芥子酶活性,如图7和图8所示。通过评估各种葡萄糖浓度的标准曲线,制备了一系列葡萄糖检测。为了证明释放的葡萄糖是由内源性黑芥子酶/硫代葡萄糖苷反应系统产生的,将天然含有该酶系统的叶材料(芥菜)与缺乏反应能力的叶材料(大豆)进行了比较。[0514]一旦证实转化的植物具有预期的黑芥子酶破坏以减少芥菜中的刺激性和/或苦味,则使用比色检测测定法进行交叉比较分析,以表征与其可检测的黑芥子酶活性水平相关的感兴趣的事件。可以采用类似的植物编辑策略来追求其他植物物种,以改变所需的感兴趣的消费作物(即萝卜、西兰花、花椰菜和木瓜)的风味/气味特征。这种方法可以成为收集额外功能证据的快速途径,以将这一机会扩展到芥菜之外。[0515]表4(参见实施例末尾)提供了编辑的植物的表型数据(葡萄糖释放测定)和野生型中葡萄糖释放测定的结果。[0516]实施例4.编辑的植物的硫代葡萄糖苷谱[0517]通过提取硫代葡萄糖苷然后进行hplc分析来完成硫代葡萄糖苷谱。从已通过冻干完全干燥的新鲜组织中提取硫代葡萄糖苷。对于每个样品,冻干约1-10g组织。将冻干的组织研磨成细而均匀的粉末,每个样品称取0.1g。向0.1g磨碎的冻干组织中加入25ml沸水,将混合物煮沸10分钟,然后在70℃孵育4小时。然后将样品离心,然后对剩余的上清液进行hplc分析。表3提供了在aop2基因座编辑的植物和同一栽培品种的野生型对照的表型数据(黑芥子苷含量)。[0518]实施例5.编辑的黑芥子酶基因座关联的统计模型和对叶组织中硫代葡萄糖苷代谢的相应影响[0519]当植物的基因座内的任何引导间隔比对区域具有超过5%的非野生型读数比对时,每个黑芥子酶基因座和e0代植物的分子数据被总结至“编辑”标签。“wt”(野生型)标签被给予到e0植物内不满足规定要求但具有映射到基因座内的至少一个间隔比对区域的超过100个读数的所有基因座。“不足够的读数”标签应用于植物内的没有映射到基因座内的至少一个间隔比对区域的至少100个读数的所有基因座。[0520]然后将e0植物的每个基因座的汇总调用与从同一e0植物收集的叶样品上测量的相关定量葡萄糖释放测定吸光度值(gra)配对。较低的gra值被证实与植物中较低的黑芥子酶表达相关。因此,如果分子编辑的黑芥子酶基因座与较低的gra值相关,则可以推断该编辑的基因座也与植物中较低的黑芥子酶活性有关。[0521]在这项研究中,所有带有“不足够的读数”标签的数据都从分析中删除。最终数据集由来自一组27个独特的编辑的e0植物和未经编辑的redgiant和southerngiantcurled对照材料的2个重复的11个基因座(a01.1、a02.1、a02.2、a03.1、a09.1、b04_cl1.1、b04_cl1.2、b04_cl1.3、b04_cl1.4、b04_cl2.1、b07.1)的23到31个数据点组成。计算每个基因座的gra评分的平均值和标准误差。对每个基因座进行2样本t检验,并使用hochberg多重检验校正,因为它对非负相关检验有效。11个基因座中的每一个都与叶组织中的功能性黑芥子酶活性呈正相关,如由外源提供的黑芥子苷的水解定量评估的。[0522]表2编辑的植物[0523][0524][0525][0526][0527][0528][0529][0530][0531][0532][0533][0534][0535][0536][0537][0538][0539][0540][0541][0542][0543][0544][0545][0546][0547][0548][0549][0550][0551][0552][0553][0554][0555][0556][0557][0558][0559][0560][0561][0562][0563][0564][0565]表4:表型数据[0566][0567][0568][0569][0570][0571]表5:三个芥菜品种中的基因座和相关的序列标识符[0572][0573][0574]当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献