一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

鉴定、选择和产生炭疽茎腐病抗性作物的方法与流程

2022-04-02 02:24:17 来源:中国专利 TAG:


1.本领域涉及植物育种以及鉴定和选择对炭疽茎腐病(anthracnose stalk rot)具有抗性的植物的方法。提供了鉴定编码提供对炭疽茎腐病具有植物抗性的蛋白质的新颖基因的方法及其用途。这些疾病抗性基因通过育种、转基因修饰或基因组编辑可用于抗性植物的产生。
2.对经由efs-web以文本文件提交的序列表的引用
3.按照美国信息交换标准码(ascii),该序列表的官方副本经由efs-web作为文本文件与本说明书同时提交,其中文件名为8054_seq_list.txt,创建日期为2019年8月22日,并且大小为63kb。经由efs-web提交的该序列表是说明书的一部分并通过引用以其全文并入本文。


背景技术:

4.由真菌病原体禾生炭疽病菌(colletotrichum graminicola(ces.)wils)(cg)引起的炭疽茎腐病是玉蜀黍(maize,zea mays l.)中主要的茎腐病之一。由于产量、谷物重量和质量的显著下降,炭疽茎腐病成为主要关注的问题。未成熟植物死亡(中断籽粒灌浆)以及茎秆折断和倒伏(导致谷穗损失在田中)导致产量损失。炭疽茎腐病发生在所有的玉米种植区域中并且可能导致10%至20%的损失。
5.虽然农民可以通过使用杀真菌剂抵抗真菌感染(如炭疽病),但是这些杀真菌剂对环境具有副作用并且需要田间监测和诊断技术以确定哪种真菌引起感染,从而可以使用正确的杀真菌剂。如果可以将负责抗性的基因并入优良、高产种质中而不降低产量,则使用携带抗性的基因来源或转基因来源的玉米品系更具实用性。已经描述了cg抗性的基因来源(white,等人(1979)annu.corn sorghum res.conf.proc.[玉米高粱研究大会年鉴]34:1-15;carson.1981.sources of inheritance of resistance to anthracnose stalk rot of corn.[玉米炭疽茎腐病抗性的遗传来源]ph.d.thesis,university of illinois,urbana-champaign[伊利诺伊大学尚佩恩分校博士论文];badu-apraku等人,(1987)phytopathology[植物病理学]77:957-959;toman等人1993.phytopathology[植物病理学],83:981-986;cowen,n等人(1991)maize genetics conference abstracts[玉蜀黍遗传学会议摘要]33;jung,等人,1994.theoretical and applied genetics[理论与应用遗传学],89:413-418)。然而,抗性的渗入可能非常复杂。
[0006]
通过使用与炭疽茎腐病抗性性状相关联的分子标记进行选择,允许仅基于子代的基因组成的选择。结果,植物育种可以更迅速地发生,由此产生商业上可接受的、具有更高水平的炭疽茎腐病的玉蜀黍植物。存在多个控制炭疽茎腐病抗性的qtl(例如4号染色体上的rcg1和rcg1b基因(wo 2008157432和wo 2006107931)),每个qtl对性状具有不同的作用。因此,令人希望的是提供用于鉴定和选择具有新赋予的或增强的炭疽茎腐病抗性的玉蜀黍植物的组合物和方法。持续需要疾病抗性植物和寻找疾病抗性基因的方法。


技术实现要素:

[0007]
本文提供了在鉴定和选择植物疾病抗性基因,或“r基因”中有用的组合物和方法。所述组合物和方法可用于选择疾病抗性植物,产生转基因抗性植物和/或产生抗性基因组编辑的植物。本文还提供了与对照植物相比具有新赋予的或增强的各种植物疾病抗性的植物。在一些实施例中,所述组合物和方法可用于选择炭疽茎腐病(antrot)疾病抗性植物,产生转基因炭疽茎腐病抗性植物,和/或产生炭疽茎腐病抗性基因组编辑的植物。
[0008]
可以将炭疽茎腐病抗性植物与第二植物杂交,以获得具有所述抗性基因等位基因的子代植物。相对于不具有所述有利的等位基因的对照植物,所述疾病抗性可以是新赋予的或增强的。可以将炭疽茎腐病r基因等位基因进一步精制至由定义的标记定义并包括定义的标记的染色体区间。在一些实施例中,提出了用于鉴定和/或选择具有炭疽茎腐病抗性的植物的方法。在一些实施例中,鉴定和/或选择具有炭疽茎腐病抗性的植物的所述方法包括检测或选择包含seq id no:3(来自玉蜀黍品系tzi8)或seq id no:5(来自玉蜀黍品系ms14)的基因组区域,所述基因组区域具有seq id no:4的启动子和终止子。相对于不具有所述有利的等位基因的对照植物,所述炭疽茎腐病抗性可以是新赋予的或增强的。在另一个实施例中,炭疽茎腐病抗性区域包含编码nlr02多肽的基因,所述nlr02多肽赋予或增强炭疽茎腐病抗性(“nlr02基因”)。在一些实施例中,所述nlr02多肽包含seq id no:2中所示的氨基酸序列。
[0009]
在另一个实施例中,提供了鉴定和/或选择具有antrot抗性的植物的方法,其中在植物中检测到与以下任一种连锁并相关联的一个或多个标记等位基因:左侧翼(保守)_标记104处的“c”(参考序列seq id no:6的位置51);右侧翼(保守)_标记015处的“a”(参考序列seq id no:7的位置51);左侧翼(优化)_标记115处的“t”(参考序列seq id no:8的位置35);和右侧翼(优化)_标记157处的“c”(参考序列seq id no:9的位置30),并选择具有所述一个或多个标记等位基因的植物。所述一个或多个标记等位基因可以在基于单次减数分裂的遗传图谱上以10cm、9cm、8cm、7cm、6cm、5cm、4cm、3cm、2cm、1cm、0.9cm、0.8cm、0.7cm、0.6cm、0.5cm、0.4cm、0.3cm、0.2cm或0.1cm或更少连锁。可以将选择的植物与第二植物杂交,以获得子代植物,所述子代植物具有与以下任一种连锁且相关联的一个或多个标记等位基因:左侧翼(保守)_标记104处的“c”(参考序列seq id no:6的位置51);右侧翼(保守)_标记015处的“a”(参考序列seq id no:7的位置51);左侧翼(优化)_标记115处的“t”(参考序列seq id no:8的位置35);和右侧翼(优化)_标记157处的“c”(参考序列seq id no:9的位置30)。
[0010]
在另一个实施例中,本文中提出了渗入与炭疽茎腐病抗性相关联的qtl的方法。在这些方法中,用一个或多个标记筛选植物群体以确定是否所述植物中的任一株均具有与炭疽茎腐病抗性相关联的qtl,并且从所述群体中选择至少一株具有与炭疽茎腐病抗性相关联的qtl的植物。所述qtl包含左侧翼(保守)_标记104处的“c”(参考序列seq id no:6的位置51);右侧翼(保守)_标记015处的“a”(参考序列seq id no:7的位置51);左侧翼(优化)_标记115处的“t”(参考序列seq id no:8的位置35);和右侧翼(优化)_标记157处的“c”(参考序列seq id no:9的位置30)。
[0011]
在一些实施例中,炭疽茎腐病抗性基因从抗性品系渗入易感品系可以通过标记辅助性状基因渗入、转基因或基因组编辑方法来实现。
applied genetics[理论与应用遗传学],109:1434-1447),而在水稻中,已经预测了大约500种nlr基因(monosi,(2004)同上)。r基因的nbs-lrr类由两个亚类组成。1类nlr基因在其n’末端含有tir-toll/白介素-1样结构域;迄今为止仅在双子叶植物中发现了它们(meyers,(2003)同上;monosi,(2004)同上)。nbs-lrr的第二类在其n末端含有卷曲螺旋结构域或(nt)结构域(bai,等人(2002)genome research[基因组研究],12:1871-1884;monosi,(2004)同上;pan,等人,(2000),journal of molecular evolution[分子进化杂志],50:203-213)。在双子叶植物和单子叶植物物种中都发现了2类nbs-lrr。(bai,(2002)同上;meyers,(2003)同上;monosi,(2004)同上;pan,(2000)同上)。
[0021]
所述基因的nbs结构域似乎在植物防御机制的信号传导中起作用(van der biezen,等人,(1998),current biology[当代生物学]:cb,8:r226-r227)。lrr区域似乎是与病原体avr产物相互作用的区域(michelmore,等人,(1998),genome res.[基因组研究],8:1113-1130;meyers,(2003)同上)。与nb-arc(nbs)结构域相比,该lrr区域承受着更大的选择压力以多样化(michelmore,(1998)同上;meyers,(2003)同上;palomino,等人,(2002),genome research[基因组研究],12:1305-1315)。lrr结构域也可以发现于其他背景中;这些20-29个残基的基序在许多蛋白质中串联排列,这些蛋白质具有多种功能,例如激素-受体相互作用、酶抑制、细胞粘附和细胞运输。最近的许多研究表明,lrr蛋白参与了哺乳动物的早期发育、神经发育、细胞极化、基因表达的调节和细胞凋亡信号传导。
[0022]
当等位基因是影响性状表达的dna序列或等位基因的一部分或与其连锁时,该等位基因与该性状“相关”。所述等位基因的存在是所述性状将如何表达的指标。
[0023]
如本文所用,“疾病抗性”或“对疾病具有抗性”是指与对照植物相比显示出对疾病的增加的抗性的植物。疾病抗性可以表现为更少和/或更小的病变、增加的植物健康、增加的产量、增加的根质量、增加的植物活力、更少或没有褪色、增加的生长、减少的坏死面积或减少的枯萎。在一些实施例中,等位基因可以显示抗一种或多种疾病。
[0024]
影响玉蜀黍植物的疾病包括但不限于细菌性叶枯病和茎腐病(bacterial leaf blight and stalk rot);细菌性叶斑病(bacterial leaf spot);细菌性条斑病(bacterial stripe);蚕豆赤斑病(chocolate spot);高斯细菌性枯萎病和疫病(goss

s bacterial wilt and blight);绒毛草叶斑病(holcus spot);叶鞘紫斑病(purple leaf sheath);种子腐烂-幼苗枯萎病(seed rot-seedling blight);细菌性枯萎病(bacterial wilt);玉蜀黍矮缩病(corn stunt);炭疽叶枯病(anthracnose leafblight);炭疽茎腐病(anthracnose stalk rot);曲霉属穗和籽粒腐病(aspergillus ear and kernel rot);带状叶和叶鞘斑病(banded leafand sheath spot);黑束病(black bundle disease);黑粒腐病(black kernel rot);白边病(borde blanco);褐斑病(brown spot);黑斑病(black spot);茎腐病(stalk rot);头孢霉粒腐病(cephalosporium kernel rot);木炭腐病(charcoal rot);伏革菌穗腐病(corticium ear rot);弯孢霉叶斑病(curvularia leaf spot);亚隔孢壳叶斑病(didymella leaf spot);色二孢穗腐和茎腐病(diplodia ear rot and stalk rot);色二孢穗腐病(diplodia ear rot);种子腐烂病(seed rot);玉米幼苗枯萎病(corn seedling blight);色二孢叶斑或叶条斑病(diplodia leaf spot or leaf streak);霜霉病(downy mildews);褐条霜霉病(brown stripe downy mildew);疯顶霜霉病(crazy top downy mildew);绿穗霜霉病(green ear downy mildew);禾生霜霉病
mold rot);黑腐病(black root);褐色环剥根腐病(brown girdling root rot);尾孢菌叶斑病(cercospora leaf spot);根瘤病(clubroot);霜霉病(downy mildew);镰刀菌属枯萎病(fusarium wilt);灰霉病(gray mold);丝腐病(head rot);叶斑病(leaf spot);浅叶斑病(light leaf spot);荚果腐病(pod rot);白粉病(powdery mildew);环斑病(ring spot);根腐病(root rot);核盘菌茎腐病(sclerotinia stem rot);种子腐烂猝倒病(seed rot,damping-off);根黑瘤病(root gall smut);南方叶枯病(southern blight);轮枝孢枯萎病(verticillium wilt);白叶枯病(white blight);白叶斑病(white leaf spot);枯丝病(staghead);枯黄病(yellows);皱果病毒(crinkle virus);花叶病毒(mosaic virus);枯黄病毒(yellows virus);
[0028]
影响向日葵植物的疾病包括但不限于顶端萎黄病(apical chlorosis);细菌性叶斑病(bacterial leaf spot);细菌性枯萎病(bacterial wilt);冠瘤病(crown gall);欧文氏菌茎腐和丝腐病(erwinia stalk rot and head rot);链格孢叶枯、茎斑和丝腐病(1ternaria leafblight,stem spot and head rot);葡萄孢丝腐病(botrytis head rot);木炭腐病(charcoal rot);霜霉病(downy mildew);镰刀菌属茎腐病(fusarium stalk rot);镰刀菌属枯萎病(fusarium wilt);漆斑菌叶和茎腐病(myrothecium leaf and stem spot);瓶霉枯黄病(phialophora yellows);茎点霉黑茎病(phoma black stem);磷霉褐茎溃疡(phomopsis brown stem canker);瘤梗孢根腐病(phymatotrichum root rot);疫霉茎腐病(phytophthora stem rot);白粉病(powdery mildew);腐霉苗枯和根腐病(pythium seedling blight and root rot);丝核菌苗枯病(rhizoctonia seedling blight);根霉丝腐病(rhizopus head rot);向日葵锈病(sunflower rust);菌核基底茎和根腐病(sclerotium basal stalk and root rot);壳针孢叶斑病(septoria leaf spot);轮枝孢枯萎病(verticillium wilt);白锈病(white rust);条锈病(yellow rust);短剑形;针形;病变;肾形;根瘤病;和褪绿斑驳病(chlorotic mottle);
[0029]
影响高粱植物的疾病包括但不限于细菌性叶斑病(bacterial leaf spot);细菌性叶条斑病(bacterial leaf streak);细菌性叶条斑病(bacterial leaf stripe);枝顶孢枯萎病(acremonium wilt);炭疽病(anthracnose);木炭腐病(charcoal rot);疯顶霜霉病(crazy top downy mildew);猝倒和种子腐烂病(damping-off and seed rot);麦角症(ergot);镰刀菌属丝枯、根和茎腐病(fusarium head blight,root and stalk rot);谷物储存霉病(grain storage mold);灰叶斑病(gray leaf spot);后叶斑病(latter leaf spot);叶枯病(leaf blight);米洛病(milo disease);卵形叶斑病(oval leaf spot);甘蔗梢腐病(pokkah boeng);腐霉根腐病(pythium root rot);粗糙叶斑病(rough leaf spot);锈病(rust);苗枯和种子腐烂病(pythium seedling blight and root rot);覆盖粒黑穗病(smut,covered kernel);丝黑穗病(smut,head);松散粒黑穗病(smut,loose kernel);黑条斑病(sooty stripe);霜霉病(downy mildew);黑肿病(tar spot);靶斑病(target leaf spot);以及桑轮叶斑和纹枯病(zonate leafspot and sheath blight)。
[0030]
具有疾病抗性的植物与对照植物相比可具有5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95或100%的增加的抗性。在一些实施例中,植物在疾病存在下与对照植物相比可具有5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95或
100%增加的植物健康。
[0031]
如本文所使用的,术语“染色体区间”是指存在于植物单一染色体上的基因组dna的连续线性跨度。位于单条染色体区间上的遗传元件或基因是物理连锁的。染色体区间的大小没有特别的限制。在一些方面,位于单条染色体区间内的遗传元件是遗传连锁的,通常具有例如小于或等于20cm,或者可替代地,小于或等于10cm的遗传重组距离。也就是说,单条染色体区间内的两个遗传元件以小于或等于20%或10%的频率进行重组。
[0032]
在本技术中,短语“紧密连锁”是指两个连锁的基因座之间的重组以等于或小于约10%(即,在遗传图谱上分隔不超过10cm)的频率发生。换言之,该紧密连锁的基因座有至少90%的机会发生共分离。当标记基因座显示与所需的性状(例如,对antrot的抗性)发生共分离(连锁)的显著概率时,所述标记基因座对于本公开的主题是特别有用的。紧密连锁的基因座(例如标记基因座和第二基因座)可以显示10%或更低、优选约9%或更低、还更优选约8%或更低、又更优选约7%或更低、还更优选约6%或更低、又更优选约5%或更低、还更优选约4%或更低、又更优选约3%或更低、以及还更优选约2%或更低的基因座间重组频率。在非常优选的实施例中,相关基因座显示约1%或更低,例如约0.75%或更低、更优选约0.5%或更低、或又更优选约0.25%或更低的重组频率。定位于相同染色体并且具有使得两个基因座之间的重组以小于10%(例如,约9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%或更少)的频率发生的距离的所述两个基因座也被认为是彼此“邻近的”。在某些情况下,两个不同的标记可以具有相同的遗传图谱坐标。在这种情况下,所述两个标记彼此非常邻近,以至于二者之间的重组以不可检测的这种低频发生。
[0033]
术语“杂交的”或“杂交”是指有性杂交,并且涉及通过授粉将两种单倍体配子融合以产生二倍体子代(例如细胞、种子或植物)。该术语涵盖一株植物被另一株植物授粉和自交(或自体授粉,例如当花粉和胚珠来自同一植物时)二者。
[0034]“良种系”是针对优良农艺性状表现的育种而产生的任何品系。
[0035]“外来品种”、“热带品系”或“外来种质”是衍生自不属于可利用的优良品系或种质品种的植物的品种。在两个植物或种质品种之间杂交的情况下,外来种质的后代与它杂交的优良种质不是密切相关的。最普遍的是,所述外来种质不是衍生自任何已知的优良品系,而是被选择用来将新的遗传元件(通常是新的等位基因)引入育种程序中。
[0036]“有利的等位基因”是特定基因座的等位基因(标记、qtl、基因等),所述等位基因赋予或有助于农学上所需的表型(例如疾病抗性),并且允许鉴定具有该农学上所需表型的植物。标记的有利等位基因是与所述有利表型分离的标记等位基因。
[0037]“遗传标记”是在群体中多态的核酸,并且所述遗传标记的等位基因可以通过一种或多种分析方法(例如rflp、aflp、同工酶、snp、ssr等)来检测和区分。该术语还指与用作探针的基因组序列(例如核酸)互补的核酸序列。可以通过本领域中公认的方法检测对应于群体成员之间的遗传多态性的标记。这些方法包括,例如基于pcr的序列特异性扩增方法、限制性片段长度多态性检测(rflp)、同功酶标记检测、通过等位基因特异性杂交(ash)进行的多核苷酸多态性检测、植物基因组的扩增可变序列检测、自主序列复制检测、简单重复序列检测(ssr)、单核苷酸多态性检测(snp)、或扩增片段长度多态性检测(aflp)。已知公认的方法也用于检测表达的序列标签(est)和衍生自est序列的ssr标记,以及随机扩增多态性dna(rapd)。
[0038]“种质”是指遗传物质,其属于或来自于个体(例如,植株)、个体的组(例如,植物品系、品种或家族)或者衍生自品系、品种、物种或培养物的克隆,或者更概括地,某一物种或多个物种的全部个体(例如,玉蜀黍种质集合(maize germplasm collection)或andean种质集合(andean germplasmcollection))。所述种质可以是生物体、细胞的一部分,或者可以分离自所述生物体或细胞。一般而言,种质提供了具有特定的分子构成的遗传物质,所述特定的分子构成为生物体或细胞培养物的某些或全部遗传品质提供物理基础。如本文所使用的,种质包括由此可以生长出新植物的细胞、种子或组织,或者可以培养成完整植物的植物部分,例如叶、茎、花粉或细胞。
[0039]“单倍型”是个体在多个遗传基因座处的基因型,即等位基因的组合。典型地,由单倍型描述的遗传基因座在物理和遗传上是连锁的,即在同一染色体区段上。
[0040]
术语“异质性”用于指示所述群组内的个体在一个或多个特定基因座处的基因型不同。
[0041]
材料的杂种优势应答或“杂种优势”可以通过当与其他不相似或不相关的群组杂交时超过亲本(或高亲本(high parent))的平均值的表现来定义。
[0042]“杂种优势组”包含一组当与来自不同的杂种优势组的基因型杂交时表现良好的基因型(hallauer等人(1998)corn breeding[玉米育种],第463-564页.在g.f.sprague和j.w.dudley(编辑)corn and corn improvement[玉米和玉米的改良]中)。近交系分为杂种优势组,并根据几个标准(如谱系、基于分子标记的关联和杂交体组合中的表现)进一步细分为杂种优势组中的家族(smith等人(1990)theor.appl.gen.[理论与应用遗传学]80:833-840)。在美国,两个应用最广泛的杂种优势群组称为“爱荷华刚性茎秆合成群(iowa stiff stalk synthetic)”(本文中也称为“刚性茎杆”)和“兰卡斯特(lancaster)”或“兰卡斯特修尔作物(lancaster sure crop)”(有时称为nss或非刚性茎杆)。
[0043]
有些杂种优势群组具备成为母本所需的性状,并且另一些具备成为父本所需的性状。例如,在玉蜀黍中,来自称为bsss(爱荷华刚性茎秆合成群体)的群体释放的公开近交系的产量结果导致这些近交系及其衍生物成为中部玉米带中的雌性库。bsss近交系已经与其他近交系(例如,sd 105和玉蜀黍阿曼巴(maiz amargo))杂交,而这个材料的一般组已经以刚性茎秆合成(stiff stalk synthetics,sss)闻名,即使并非所有的近交系都衍生自原始的bsss群体(mikel and dudley(2006)crop sci[作物科学]:46:1193-1205)。默认情况下,所有与所述sss近交系良好结合的其他近交系被分配到雄性库,因缺乏更好的名称而被命名为nss,即非刚性茎秆。这个群组包括几个主要的杂种优势群组,例如兰卡斯特修尔作物(lancaster surecrop)、艾顿(iodent)和利明玉米(leaming corn)。
[0044]
术语“同质性”表示群组的成员在一个或多个特定基因座处具有相同的基因型。
[0045]
术语“杂交体”是指在至少两个遗传上不同的亲本的杂交之间获得的子代。
[0046]
术语“近交系”是指已经进行育种以获得遗传同质性的品系。
[0047]
术语“插入缺失(indel)”是指插入或缺失,其中一个品系可以称为相对于第二品系具有插入的核苷酸或dna碎片,或所述第二品系可以称为相对于所述第一品系具有缺失的核苷酸或dna碎片。
[0048]
术语“渗入”是指遗传基因座的期望等位基因从一种遗传背景传递到另一种遗传背景的现象。例如,可以经由相同物种的两个亲本之间的有性杂交将指定基因座处的所需
等位基因的渗入传递给至少一个子代,其中所述亲本中的至少一个在其基因组内具有所述所需的等位基因。可替代地,例如等位基因的传递可以通过两个供体基因组之间的重组而发生,例如在融合原生质体中,其中至少其中一个供体原生质体在其基因组中具有所希望的等位基因。所需的等位基因可以,例如通过与表型相关联的标记,在qtl、转基因等处进行检测。包含所述所需等位基因的后代可以反复与具有所需遗传背景的品系回交并选择所需等位基因,以产生固定在选择的遗传背景中的等位基因。
[0049]
当“渗入”重复两次或更多次时,该方法通常被称为“回交”。
[0050]“品系”或“品种”是一组具有相同亲本的个体,其通常在一定程度上是近交的,并且在大多数基因座处通常是纯合和同质的(同基因的或接近同基因的)。“亚系”是指遗传上不同于起源于相同祖先的其他类似近交系亚群的近交系亚群。
[0051]
如本文所使用的,术语“连锁”用于描述一种标记基因座与另一种标记基因座或一些其他基因座的相关联程度。分子标记与影响表型的基因座之间的连锁关系以“概率”或“调整的概率”表示。连锁可以表示为所需的限制或范围。例如,在一些实施例中,当任何标记与任何其他标记在单次减数分裂图谱(基于已经进行一轮减数分裂的群体(例如像,f2)的遗传图谱;ibm2图谱由多次减数分裂组成)上分隔小于50、40、30、25、20或15个图距单位(或cm)时,所述标记是连锁的(遗传上或物理上)。在一些方面,限定加括号的连锁范围是有利的,例如,在10cm和20cm之间、在10cm和30cm之间、或在10cm和40cm之间。标记与第二基因座的连锁越紧密,标记对第二基因座的指示效果越好。因此,“紧密连锁的基因座”,例如标记基因座和第二基因座显示10%或更低、优选约9%或更低、还更优选约8%或更低、又更优选约7%或更低、还更优选约6%或更低、又更优选约5%或更低、还更优选约4%或更低、又更优选约3%或更低、以及还更优选约2%或更低的基因座间重组频率。在非常优选的实施例中,相关基因座显示约1%或更低,例如约0.75%或更低、更优选约0.5%或更低、或又更优选约0.25%或更低的重组频率。定位于相同染色体并且具有使得两个基因座之间的重组以小于10%(例如,约9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%或更少)的频率发生的距离的所述两个基因座也被认为是彼此“邻近”。因为一个cm是显示1%的重组频率的两个标记之间的距离,因此任何标记与紧密相邻(例如,以等于或小于10cm的距离)的任何其他标记紧密连锁(遗传上和物理上)。在相同染色体上的两个紧密连锁的标记可相互定位为9、8、7、6、5、4、3、2、1、0.75、0.5或0.25cm或更近。
[0052]
术语“连锁不平衡”是指遗传基因座或性状(或两者)的非随机分离。在任一情况下,连锁不平衡意味着相关的基因座沿着一段染色体在物理上足够接近,以便它们以高于随机(即非随机)的频率一起分离。显示连锁不平衡的标记被认为是连锁的。连锁的基因座有超过50%的机会(例如约51%至约100%的机会)发生共分离。换句话说,共分离的两个标记具有小于50%(并且根据定义,在相同连锁群上分隔小于50cm)的重组频率。如本文所使用的,连锁可以存在于两个标记之间,或可替代地,标记和影响表型的基因座之间。标记基因座可以与性状“相关联”(连锁)。标记基因座和影响表型性状的基因座的连锁程度例如通过该分子标记与所述表型共分离的统计学概率(例如,f统计或lod评分)进行测量。
[0053]
连锁不平衡最常见地用量度r2评估,所述量度r2使用以下文献中的公式计算:hill,w.g.和robertson,a,theor.appl.genet.[理论与应用遗传学]38:226-231(1968)。当r2=1时,两个标记基因座间存在完全的ld,意味着所述标记还未进行重组分离并且具有相
同的等位基因频率。所述r2值依赖于所使用的群体。r2值大于1/3显示了用于定位的足够强的ld(ardlie等人,nature reviews genetics[遗传学自然评论]3:299-309(2002))。因此,当成对标记基因座间的r2值大于或等于0.33、0.4、0.5、0.6、0.7、0.8、0.9、或1.0时,等位基因处于连锁不平衡。
[0054]
如本文所使用的,“连锁平衡”描述其中两个标记独立地分离的情况,即,在子代中随机分配。显示连锁平衡的标记被认为是不连锁的(无论它们是否位于相同染色体上)。
[0055]“基因座”是在染色体上的位置,例如,核苷酸、基因、序列或标记所处的位置。
[0056]“优势对数(lod)值”或“lod评分”(risch,science[科学]255:803-804(1992))用于遗传区间定位以描述两个标记基因座之间的连锁程度。两个标记间lod评分为三指示连锁概率比无连锁的概率高1000倍,而lod评分为二指示连锁概率比无连锁的概率高100倍。大于或等于二的lod评分可以用于检测连锁。lod评分还可以用于在“数量性状基因座”定位中显示标记基因座和数量性状之间的关联强度。在这一情况下,lod评分大小取决于所述标记基因座与影响所述数量性状的基因座之间的紧密度,以及所述数量性状效应的大小。
[0057]
术语“植物”包括整个植株、植物细胞、植物原生质体、可从其中再生植株的植物细胞或组织培养物、植物愈伤组织、植物丛生物和植物中的完整植物细胞或植物部分,如种子、花、子叶、叶、茎、芽、根、根尖等。如本文所用,“经修饰的植物”意指由于人为干预而具有遗传变化的任何植物。经修饰的植物可具有通过植物转化、基因组编辑或常规植物育种引入的遗传变化。
[0058]“标记”是发现遗传或物理图谱上的位置或发现标记与性状基因座(影响性状的基因座)之间的连锁的方式。标记所检测的位置可通过检测多态性等位基因及其遗传定位而获知,或通过对已经进行物理标测的序列进行杂交、序列匹配或扩增而获知。标记可以是dna标记(检测dna多态性)、蛋白质(检测编码的多肽的变异)或简单遗传的表型(诸如“腊质”表型)。可从基因组核苷酸序列或从表达的核苷酸序列(例如,从剪接的rna或cdna)开发dna标记。根据dna标记技术,所述标记可由侧接于所述基因座的互补性引物和/或与所述基因座处的多态性等位基因杂交的互补性探针组成。dna标记或遗传标记还可用于描述所述染色体自身上的基因、dna序列或核苷酸(而非用于检测所述基因或dna序列的组分),并且其通常在所述dna标记与人遗传学中的特定性状相关联时使用(例如乳腺癌标记)。术语标记基因座是该标记所检测的基因座(基因、序列或核苷酸)。
[0059]
标记可由其所检测的多态性的类型以及用于检测所述多态性的标记技术所定义。标记类型包括但不限于:限制性片段长度多态性检测(rflp)、同功酶标记检测、随机扩增的多态性dna(rapd)、扩增片段长度多态性检测(aflp)、简单重复序列检测(ssr)、植物基因组的扩增可变序列检测、自主序列复制检测、或单核苷酸多态性检测(snp)。snp可通过,例如,通过dna测序、基于pcr的序列特异性扩增方法、通过等位基因特异性杂交(ash)进行的多核苷酸多态性检测、动态等位基因特异性杂交(dash)、分子信标、微阵列杂交、寡核苷酸连接酶分析、flap核酸内切酶、5’核酸内切酶、引物延伸、单链构象多态性(sscp)或温度梯度凝胶电泳(tgge)进行检测。dna测序(诸如焦磷酸测序技术)具有能够检测组成单倍型的一系列连锁snp等位基因的优点。单倍型倾向于比snp更具信息性(检测更高水平的多态性)。
[0060]“标记等位基因”,可替代地“标记基因座的等位基因”可以指群体中标记基因座处发现的多个多态性核苷酸序列中之一。
[0061]“标记辅助选择”(mas)是基于标记基因型选择个体植物的方法。
[0062]“标记辅助反向选择”是借以使用标记基因型鉴定将不被选择的植物的方法,使得所述植物从育种程序或种植中去除。
[0063]“标记单倍型”是指标记基因座处的等位基因的组合。
[0064]“标记基因座”是物种基因组中的特定染色体定位,在该定位处可发现特异标记。标记基因座可用于追踪第二连锁基因座(例如影响表型性状表达的连锁基因座)的存在。例如,标记基因座能够用于监控在遗传上或物理上连锁的基因座处的等位基因的分离。
[0065]
如上所述,当鉴定连锁基因座时,术语“分子标记”可以用于指遗传标记,或其用作参照点的编码产物(例如,蛋白质)。标记能够衍生自基因组核苷酸序列或衍生自表达的核苷酸序列(例如衍生自剪接的rna、cdna等),或衍生自编码的多肽。该术语也指与标记序列互补或与其侧接的核酸序列,如用作探针或能够扩增所述标记序列的引物对的核酸。“分子标记探针”是可以用于鉴定标记基因座存在与否的核酸序列或分子,例如与标记基因座序列互补的核酸探针。可替代地,在某些方面,标记探针是指能够区别存在于标记基因座处的特定等位基因的任何类型(即基因型)的探针。当核酸在溶液中特异性杂交时,它们是“互补的”。当位于插入缺失区域,例如本文所述的非共线区域时,本文所述标记中的一些也称为杂交标记。这是因为,根据定义,所述插入区域是关于无所述插入的植物的多态性。因此,该标记仅需要指示所述插入缺失区域是否存在。任何合适的标记检测技术都可以用于鉴定此类杂交标记,例如在本文提供的实例中使用snp技术。
[0066]
当等位基因与性状连锁时,以及当等位基因的存在是所需性状或性状形式将不出现在包含所述等位基因的植物中的指示时,所述等位基因与所述性状“负”相关。
[0067]
术语“表型”、“表型性状”或“性状”可以指基因或基因系列的可观测表达。表型对于肉眼、或通过任何其他评估方式(例如称重、计数、测量(长度、宽度、角度等)、显微法、生化分析或机电测定)可以是可观测的。在某些情况下,表型直接受控于单个基因或遗传基因座,即,“单基因性状”或“简单遗传性状”。在缺少大水平环境变化的情况下,单基因性状可以在群体中分离,以给出“质量”或“离散”分布,即,所述表型归于离散的类别。在其他情况下,表型是多种基因的结果并且可以被认为是“多基因性状”或“复杂性状”。多基因性状在群体中分离以给出“数量”或“连续”分布,即,所述表型不能分离成离散的类别。单基因性状和多基因性状均可受到其表达所处的环境的影响,但是多基因性状倾向于具有更大的环境组分。
[0068]
基因组的“物理图谱”是显示染色体dna上可鉴定的标志(包括基因、标记等)的线性顺序的图谱。然而,与遗传图谱相比,标志间的距离是绝对的(例如以碱基对或者分离的和重叠的连续基因片段测量)并且不基于基因重组(所述基因重组可在不同的群体中有所变化)。
[0069]“多态性”是群体内2个或更多个个体之间的dna中的变异。多态性在群体中优选地具有至少1%的频率。有用的多态性可以包括单核苷酸多态性(snp)、简单重复序列(ssr)、或插入/缺失多态性(本文中也称为“插入缺失”)。
[0070]“生产标记”或“生产snp标记”是已经为高通量目的而开发的标记。生产snp标记被开发用于检测特异性多态性,并且被设计与多种化学反应和平台一起使用。
[0071]
术语“数量性状基因座”或“qtl”是指在至少一种遗传背景下(例如在至少一个育
apolipoprotein-e type-2 allele for late-onset alzheimer-disease[载脂蛋白e 2型等位基因对迟发型阿尔茨海默病的保护作用],”nat genet[自然遗传学]7:180-184;hastbacka等人(1992)“linkage disequilibrium mapping in isolated founder populations:diastrophic dysplasia in finland[在孤立的建立者群体中的连锁不平衡定位:芬兰的畸型发育不良],”nat genet[自然遗传学]2:204-211;kerem等人(1989)“identification of the cystic fibrosis gene:genetic analysis[鉴定囊性纤维化基因:遗传分析],”science[科学]245:1073-1080)和玉蜀黍(remington等人,(2001)“structure of linkage disequilibrium and phenotype associations in the maize genome[玉蜀黍基因组中连锁不平衡和表型关联的结构],”proc natl acad sci usa[美国科学院院报]98:11479-11484;thornsberry等人(2001)“dwarf8 polymorphisms associate with variation in flowering time[矮秆8多态性与开花时间的变化相关联],”nat genet[自然遗传学]28:286-289;由flint-garcia等人综述(2003)“structure of linkage disequilibrium in plants[植物中连锁不平衡的结构],”annu rev plant biol.[植物生物学年评]54:357-374),其中杂合子之间的重组频繁并导致ld的快速衰减。在近交物种中,纯合基因型之间的重组不是遗传学上可检测的,ld的程度更大(即,较大的连锁标记块一起遗传)并且这大大提高了关联定位的检测能力(wall和pritchard,(2003)“haplotype blocks and linkage disequilibrium in the human genome[人类基因组中的单倍型阻断和连锁不平衡],”nat rev genet[自然遗传学综述]4:587-597)。
[0082]
群体的重组和突变历史是交配习惯以及群体的有效大小和年龄的函数。较大的群体大小为检测重组提供了增强的可能性,而较老的群体通常与较高水平的多态性相关,这两者都促进可观察到的ld衰退速率的显著增加。另一方面,较小的有效群体大小,例如那些已经经历了最近遗传瓶颈的群体,倾向于表现出较慢的ld衰退速率,导致更广泛的单倍型保守性(flint-garcia等人,(2003)“structure of linkage disequilibrium in plants[植物连锁不平衡的结构],”annu rev plant biol.[植物生物学年评]54:357-374)。
[0083]
优良育种品系为关联分析提供了宝贵的起点。关联分析在该分析中使用定量表型评分(例如,对于每个品系,疾病耐受性等级从一至九)(而不是在分析的组间等位基因分布类型中只考虑耐受性与抗性等位基因频率分布)。多年来通过育种程序收集的详细表型性能数据的可用性和大量优良品系的环境为遗传标记关联定位分析提供了有价值的数据集。这为研究和应用之间的无缝整合铺平了道路,并利用了历史积累的数据集。然而,了解多态性与重组之间的关系对于开发用于从这些资源中有效提取最大信息的适当策略是有用的。
[0084]
这种类型的关联分析既不产生也不需要任何图谱数据,而是独立于图谱位置。这种分析将植物的表型评分与不同基因座处的基因型进行比较。随后,使用先前确定的这些标记的图谱定位,可以任选地使用任何合适的图谱(例如,复合图谱)来帮助观察经鉴定的qtl标记和/或qtl标记簇的分布。
[0085]
传统的连锁分析基于相同的原理;然而,ld通过从少量建立者创建群体而生成。选择创建者以最大化结构化群体内的多态性水平,并且评估多态性位点与给定表型的共分离水平。已经使用大量统计学方法来鉴定显著的标记-性状关联。一种此类方法是区间定位方法(lander和botstein,genetics[遗传学]121:185-199(1989),其中针对控制目的性状的基因位于该位置的概率来测试沿遗传图谱(比如说以1cm的区间)的许多位置中的每一个位
置。基因型/表型数据用于计算每个测试位置的lod评分(概率比率的对数)。当lod评分大于阈值时,存在控制目的性状的基因位于遗传图谱上的该定位处的显著证据(将位于两个特定标记基因座之间)。
[0086]
本文提供了如通过传统的连锁分析和全基因组关联分析确定的、显示与疾病抗性性状的统计学上显著的共分离的标记基因座。这些基因座或另外的连锁的基因座的检测可以用于标记辅助育种程序,以产生具有疾病抗性的植物。
[0087]
标记辅助育种程序中的活动可以包括但不限于:根据历史基因型和农艺性状关联在新的育种群体中选择以鉴定哪个群体具有最高的有利核酸序列频率、在育种群体中的子代中选择有利的核酸序列、基于子代性能的预测在亲本品系中进行选择、以及根据有利的核酸序列的存在在种质改良活动中推进品系。
[0088]
染色体区间
[0089]
提供了与疾病抗性性状相关联的染色体区间。多种方法可用于鉴定染色体区间。此类染色体区间的边界扩展到涵盖将与控制目的性状的一个或多个基因连锁的标记。换句话说,扩展染色体区间,这样使得位于区间内的任何标记(包括限定区间的边界的末端标记)可以用作疾病抗性性状的标记。
[0090]
相反地,例如如果非常接近的两个标记显示与期望表型性状共分离,则有时分不清楚是否那些标记中的每一个鉴定相同基因或两个不同的基因或多个基因。无论如何,关于在特定物理/基因组区间内有多少个基因的知识对于制定或实践哪个在本公开中呈现是不必要的。
[0091]
染色体6区间可能涵盖本文鉴定为与antrot抗性性状相关联的任何标记,包括左侧翼(保守)_标记104处的“c”(参考序列seq id no:6的位置51);右侧翼(保守)_标记015处的“a”(参考序列seq id no:7的位置51);左侧翼(优化)_标记115处的“t”(参考序列seq id no:8的位置35);和右侧翼(优化)_标记157处的“c”(参考序列seq id no:9的位置30)。位于这些区间内的任何标记可以用作antrot抗性的标记,并且可以用于本文提出的方法的上下文中以鉴定和/或选择具有antrot抗性的植物,不管所述抗性与对照植物相比是否是新赋予的或增强的。在某些实施例中,位于nlr02基因位置的上游和下游的标记在遗传上和物理上非常紧密地连锁,因此可以用于选择nlr02基因用于性状基因渗入和产品开发。
[0092]
染色体区间也可以由与疾病抗性基因连锁的标记(与其表现出连锁不平衡)所限定,并且r2是关联性研究的上下文中连锁不平衡(ld)的常见量度。如果目的区间中的7号染色体标记基因座与另一个紧密相邻的7号染色体标记基因座之间的ld的r2值大于1/3(ardlie等人,nature reviews genetics[遗传学自然评论]3:299-309(2002)),则这两个基因座彼此连锁不平衡。
[0093]
标记和连锁关系
[0094]
连锁的常见量度是性状共分离的频率。这可以以共分离百分比(重组频率)表示,或以厘摩(cm)表示。cm是遗传重组频率的量度单位。一个cm等于有1%的机会,一个遗传基因座处的性状会由于单代中的杂交而与另一个基因座处的性状分离(意味着这些性状总共有99%的机会发生分离)。由于染色体距离与性状之间的杂交事件的频率大致成正比,因此存在与重组频率相关联的近似物理距离。
[0095]
标记基因座本身是性状,并且在分离期间能够通过跟踪该标记基因座、根据标准
连锁分析对其进行评估。因此,一个cm等于有1%的机会,一个标记基因座会由于单代中的杂交而与另一个基因座分离。
[0096]
标记距离控制目的性状的基因越近,则该标记作为所述所需性状的指示越有效和有利。紧密连锁的基因座显示约10%或更低、优选约9%或更低、还更优选约8%或更低、又更优选约7%或更低、还更优选约6%或更低、又更优选约5%或更低、还更优选约4%或更低、又更优选约3%或更低、以及还更优选约2%或更低的基因座间杂交频率。在高度优选的实施例中,相关基因座(例如标记基因座和靶基因座)显示约1%或更低、例如约0.75%或更低、更优选地约0.5%或更低、或又更优选地约0.25%或更低的重组频率。因此,所述基因座分开距离为约10cm、9cm、8cm、7cm、6cm、5cm、4cm、3cm、2cm、1cm、0.75cm、0.5cm或0.25cm或更低。换言之,定位于相同染色体并且具有使得两个基因座之间的重组以小于10%(例如,约9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%或更少)的频率发生的距离的所述两个基因座被认为是彼此“邻近的”。
[0097]
尽管特定的标记等位基因可以与疾病抗性性状共分离,重要的是注意所述标记基因座不一定引起所述疾病抗性表型的表达。例如,该标记多核苷酸序列是产生疾病抗性表型的基因的一部分(例如,是基因可读框的一部分)不是必需条件。特异标记等位基因与疾病抗性性状之间的关联性,是由于在所述等位基因所起源的祖先品系中,所述标记等位基因和所述等位基因之间的初始“偶联”相连锁。最后通过反复重组,所述标记和遗传基因座之间的杂交事件能够改变这种取向。由于这个原因,所述有利的标记等位基因可以根据存在于具有疾病抗性的亲本中的用于创建分离群体的连锁相发生改变。这不改变可以使用所述标记来监测表型分离的事实。它仅仅改变在给定分离群体中哪个标记等位基因被认为是有利的。
[0098]
本文提出的方法包括检测植物中与疾病抗性相关联的一个或多个标记等位基因的存在,并且然后鉴定和/或选择在那些标记基因座处具有有利等位基因的植物。标记已经在本文中被鉴定为与疾病抗性性状相关联,并且因此可以用于预测植物中的疾病抗性。50cm、40cm、30cm、20cm、15cm、10cm、9cm、8cm、7cm、6cm、5cm、4cm、3cm、2cm、1cm、0.75cm、0.5cm或0.25cm内的任何标记(基于单个减数分裂的遗传图谱)也可以用于预测植物的疾病抗性。
[0099]
标记辅助选择
[0100]
分子标记可以用于多种植物育种应用(例如,参见staub等人(1996)hortscience[园艺科学]31:729-741;tanksley(1983)plant molecular biology reporter.[植物分子生物学导报]1:3-8)。受关注的主要领域之一是使用标记辅助选择(mas)增加回交和基因渗入的效率。展示出与影响所需表型性状的基因座连锁的分子标记为在植物群体中选择性状提供了有用工具。在表型难以测定的情况下尤其如此。由于dna标记测定比田间表型分析更省力并且占用的物理空间更小,可测定更大的群体,增加了发现具有从供体品系移动至受体品系的靶区段的重组体的概率。连锁越紧密,标记越有用,这是因为重组不太可能发生于所述标记和引起该性状的基因之间,所述重组可导致假阳性。由于需要双重组事件,侧接标记减少了假阳性选择发生的概率。理想情况是基因本身具有标记,使得标记和基因之间的重组不能发生。在一些实施例中,本文公开的方法在疾病抗性基因中产生标记,其中通过从保守结构域的聚类或聚类分析推断基因组位置来鉴定所述基因。
[0101]
当基因通过mas渗入时,不仅引入了基因而且引入了侧接区域(gepts.(2002).crop sci[作物科学];42:1780-1790)。这称为“连锁累赘”。在供体植物与受体植物极不相关的情况下,这些侧接区域携带可以编码农艺学上不需要的性状的另外的基因。即便与优良品系回交多个周期后,连锁累赘也可能导致产量下降或其他负面农艺学特征。这有时也称为“产量累赘”。侧接区域的大小可以通过另外的回交而减小,虽然这并不总是成功的,因为育种人员不能控制该区域或重组断点的大小(young等人,(1998)genetics[遗传学]120:579-585)。在经典育种中,通常只是偶然地,选择了有助于减小供体区段大小的重组(tanksley等人(1989).biotechnology[生物技术]7:257-264)。即使在20次此类型的回交后,可以预期找到相当大的仍然与所述基因连锁的供体染色体碎片被选择。然而如果使用标记的话,就可能选取那些在目的基因附近经历了重组的稀有个体。在150株回交植物中,有95%的机会,至少一株植物将经历该基因的1cm(基于单次减数分裂图距)内的杂交。标记使得能够明确鉴定这些个体。使用300株植物的一次另外的回交,在该基因另一侧的1cm单次减数分裂图距内有95%的杂交概率,从而产生在基于单次减数分裂图距的小于2cm的靶基因附近的区段。这用标记可以在两代中实现,而不用标记时则需要平均100代(参见tanksley等人,同上)。当基因的确切定位已知时,围绕该基因的侧接标记可用于在不同的群体大小中对重组进行选择。例如,在更小的群体中,预期重组可以进一步远离该基因,因此需要更远端的侧接标记来检测该重组。
[0102]
实施mas的主要组成是:(i)限定在其中标记-性状关联性将被测定的群体,其可以是分离群体、或随机的或结构化的群体;(ii)监测多态性标记相对于该性状的分离或关联性,并使用统计学方法确定连锁或关联性;(iii)基于统计学分析的结果限定一组所需标记,以及(iv)使用和/或外推该信息至当前的育种种质组中,以使得能够作出基于标记的选择决定。本公开中描述的标记,以及其他标记类型,例如ssr和flp,可以用于标记辅助选择方案中。
[0103]
ssr可以被定义为长度6bp或更小的串联重复dna的相对较短序列(tautz(1989)nucleic acid research[核酸研究]17:6463-6471;wang等人(1994)theoretical and applied genetics[理论和应用遗传学],88:1-6)。多态性由于重复单元数目的变化而产生,这可能是由于dna复制过程中的滑移引起的(levinson和gutman(1987)mol biol evol[分子生物学与进化]4:203-221)。重复长度的变化可以通过设计pcr引物至保守的非重复侧接区域来检测(weber和may(1989)am j hum genet.[美国人类遗传学]44:388-396)。因为ssr是多等位基因的、共显性的、可再生的、并适合于高通量自动化,所以非常适合定位和mas(rafalski等人(1996)generating and using dna markers in plants.[在植物中生成和使用dna标记]在:non-mammalian genomic analysis:a practical guide.[非哺乳动物基因组分析:实用指南]academic press.[学术出版社]第75-135页中)。
[0104]
可以产生各种类型的ssr标记,并且可以通过扩增产物的凝胶电泳获得ssr谱。标记基因型的评分基于扩增片段的大小。
[0105]
也可以生成各种类型的flp标记。最常见地,使用扩增引物来生成片段长度多态性。除了通过引物扩增的区域通常不是高度重复的区域之外,这样的flp标记在许多方面与ssr标记相似。通常由于插入或缺失,扩增区域或扩增子在种质间仍具有足够的可变性,使得由扩增引物产生的片段能够在多态性个体中被区分,并且已知此类插入缺失常常发生于
玉蜀黍中(bhattramakki等人(2002).plant mol biol[植物分子生物学]48,539-547;rafalski(2002b),同上)。
[0106]
snp标记检测单碱基对核苷酸取代。在所有分子标记类型中,snp是最丰富的,因此具有提供最高遗传图谱分辨率的潜力(bhattramakki等人,2002plant molecular biology[植物分子生物学]48:539-547)。由于snp不需要大量的dna并且测定的自动化可以是直接的,所以可以以所谓的“超高通量”方式,以甚至比ssr更高的通量水平测定snp。snp也有可能成为相对低成本的系统。这三个因素一起使得将snp用于mas中具有高度的吸引力。可利用如下几种方法用于snp基因分型,包括但不限于:杂交、引物延伸、寡核苷酸连接、核酸酶切割、微测序和编码球(coded sphere)。如下文献中已经对这些方法进行了综述:gut(2001)hum mutat[人类基因突变]17第475-492页;shi(2001)clin chem[临床化学]47,第164-172页;kwok(2000)pharmacogenomics[药物基因组学]1,第95-100页;以及bhattramakki和rafalski(2001)discovery and application of single nucleotide polymorphism markers in plants.[单核苷酸多态性标记在植物中的发现与应用]在:r.j.henry,编辑,plant genotyping:the dna fingerprinting of plants,cabi publishing,wallingford.[植物基因分型:植物的dna指纹识别,cabi出版社,瓦林福德]中。广泛的可商购的技术利用这些和其他方法来检测snp,所述可商购的技术包括:masscode.tm.(凯杰公司(qiagen))、(第三波技术公司(third wave technologies))和invadertechnologies))和invader(应用生物系统公司(applied biosystems))、(应用生物系统公司)以及(依诺米那公司(illumina))。
[0107]
可以使用序列内或跨连锁序列的许多snp来描述任何特定基因型的单倍型(ching等人(2002),bmc genet.[bmc遗传学]3:19 pp gupta等人2001,rafalski(2002b),plant science[植物科学]162:329-333)。单倍型可以比单个snp更具信息性,并且可以更详细地描述任何特定的基因型。例如,单一的snp可能是具有疾病抗性的特定品系或品种的等位基因“t”,但在用于轮回亲本的育种群体中也可能出现等位基因“t”。在这种情况下,单倍型(例如连锁的snp标记处的等位基因的组合)可能更具信息性。一旦将唯一单倍型分配给供体染色体区域,该单倍型可以用于该群体或其任何亚群中以确定个体是否具有特定的基因。使用自动化高通量标记检测平台使得该方法高效且有效。
[0108]
本文提出的许多标记可以容易地用作单核苷酸多态性(snp)标记以选择nlr02基因。利用pcr,将引物用于扩增代表目的群体多样性的个体(优选近交系)的dna区段。将pcr产物直接在一个或两个方向上测序。将得到的序列进行比对并鉴定多态性。所述多态性不限于单核苷酸多态性(snp),而且包括插入缺失、caps、ssr和vntr(可变数量的串联重复序列)。具体地讲,针对本文所述的精细图谱信息,人们可易于使用本文提供的信息来获得在通过本文公开的引物扩增的区域内的另外的多态性snp(和其他标记)。所描述的图谱区域内的标记可以与bac或其他基因组文库杂交,或者与基因组序列进行电子比对,以在与所述标记相同的大致定位中找到新的序列。
[0109]
除上述的ssr、flp和snp外,其他类型的分子标记也被广泛使用,包括但不限于:表达的序列标签(est)、衍生自est序列的ssr标记、随机扩增的多态性dna(rapd)和其他基于核酸的标记。
[0110]
同工酶谱和连锁形态特征在某些情况下也可以间接用作标记。尽管它们不直接检测dna差异,但它们往往受到特定遗传差异的影响。然而,检测dna变异的标记比同工酶或形态学标记多得多且更多态(tanksley(1983)plant molecular biology reporter:[植物分子生物学导报]1:3-8)。
[0111]
序列比对或重叠群还可以用于发现本文所列特异标记的上游或下游的序列。然后使用接近于本文所述的标记的这些新序列来发现和开发功能上等效的标记。例如,对不同的物理和/或遗传图谱进行比对以定位未在本公开中描述但位于相似区域内的等效标记。这些图谱可能在物种内,或者甚至跨越进行遗传上或物理上比对的其他物种。
[0112]
一般来说,mas使用多态性标记,所述标记已被鉴定为具有与antrot疾病抗性性状等性状共分离的显著可能性。推测这样的标记在图谱上位于给予植物疾病抗性表型的一个或多个基因附近,并被认为是所需性状或标记的指示。测试植物中标记中所需的等位基因的存在,并且预期在一个或多个基因座处含有所需基因型的植物将所需基因型连同所需表型一起转移至其子代。因此,可以通过检测一个或多个标记等位基因来选择具有antrot疾病抗性的植物,并且此外,还可以选择衍生自这些植物的子代植物。因此,获得在给定染色体区域中含有所需基因型(即与疾病抗性相关联的基因型)的植物,并且然后与另一植物杂交。然后使用一种或多种标记对这种杂交的子代进行基因型评估,并且然后将在给定染色体区域中具有相同基因型的子代植物选择为具有疾病抗性。
[0113]
可以单独或组合使用snp(即snp单倍型)来选择与antrot疾病抗性相关联的有利的抗性基因等位基因。例如,以下的snp单倍型:左侧翼(保守)_标记104处的“c”(参考序列seq id no:6的位置51);右侧翼(保守)_标记015处的“a”(参考序列seq id no:7的位置51);左侧翼(优化)_标记115处的“t”(参考序列seq id no:8的位置35);和右侧翼(优化)_标记157处的“c”(参考序列seq id no:9的位置30),或其组合。
[0114]
本领域技术人员会预期在本文公开的方法鉴定的染色体标记中的及其附近的标记基因座处可能存在另外的多态性位点,其中一个或多个多态性位点与该单倍型中的多态性位点中的一个或多个处的等位基因处于连锁不平衡(ld),并且因此可以用于标记辅助选择程序中以渗入目的基因等位基因或目的基因组片段。如果所述位点中的一个处的等位基因的存在倾向于预测同一染色体上其他位点处的等位基因存在,则认为不同多态性位点处的两个特定等位基因处于ld(stevens,mol.diag.[分子诊断]4:309-17(1999))。该标记基因座可以位于疾病抗性性状qtl的5cm、2cm、或1cm内(在基于单次减数分裂的遗传图谱上)。
[0115]
技术人员将理解等位基因频率(进而单倍型频率)可因种质库不同而不同。由于成熟度差异、杂种优势分组、地理分布等原因,种质库存在差异。因此,某些种质库中的snp和其他多态性可能不具有信息性。
[0116]
植物组合物
[0117]
通过上述方法中的任何一种鉴定、修饰和/或选择的植物也是令人感兴趣的。
[0118]
蛋白质及其变体和片段
[0119]
本公开涵盖了nlr02多肽。如本文所用,“nlr02多肽”和“nlr02蛋白”可互换地使用,是指具有antrot抗性活性的一种或多种多肽,并且与seq id no:2的nlr02多肽充分相同。考虑了多种nlr02多肽。
[0120]
如本文所用的“充分相同”是指具有至少约70%、71%、72%、73%、74%、75%、
76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大序列同一性的氨基酸序列。在一些实施例中,所述序列同一性针对多肽的全长序列。在本文中与序列同一性百分比一起使用时,术语“约”意指 /-1.0%。
[0121]
本文所用的“重组蛋白”是指不再处于其天然环境中(例如处于体外或重组细菌或植物宿主细胞中)的蛋白质;从多核苷酸表达的蛋白质,所述多核苷酸已从其天然版本进行编辑;或由相对于天然序列在不同基因组位置的多核苷酸表达的蛋白质。
[0122]
如本文所用的“基本上不含细胞材料”是指包括具有小于约30%、20%、10%或5%(以干重计)的非靶蛋白(在本文中也称为“污染蛋白”)的蛋白制剂的多肽。
[0123]“片段”或“生物活性部分”包括多肽片段或多核苷酸片段,所述多肽片段或多核苷酸片段包含分别与nlr02多肽或多核苷酸充分相同的序列,并且当在植物中表达时表现出疾病抗性。
[0124]
如本文所用的“变体”是指具有与亲本氨基酸序列具有至少约50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性的氨基酸序列的蛋白质或多肽。
[0125]
在一些实施例中,nlr02多肽包含与seq id no:2的氨基酸序列的全长或片段具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列,其中当在植物中表达时所述nlr02多肽具有antrot抗性。
[0126]
用于此类操作的方法是本领域通常已知的。例如,可以通过dna中的突变来制备nlr02多肽的氨基酸序列变体。这也可以通过若干种诱变形式中的一种来完成,像例如位点特异性双链断裂技术,和/或定向进化。在一些方面,在所述氨基酸序列中所编码的改变将基本上不影响所述蛋白质的功能。此类变体将具有所需活性。然而,应当理解,可以通过对本公开的组合物使用这些技术改进nlr02多肽赋予疾病抗性的能力。
[0127]
核酸分子及其变体和片段
[0128]
提供了包含编码nlr02多肽或其生物活性部分的核酸序列的分离或重组核酸分子,以及足以用作杂交探针以鉴定编码具有序列同源性区域的蛋白质的核酸分子的核酸分子。如本文所用的,术语“核酸分子”是指dna分子(例如,重组dna、cdna、基因组dna、质粒dna、线粒体dna)和rna分子(例如,mrna)以及使用核苷酸类似物而产生的dna或rna的类似物。核酸分子可以是单链的或双链的,但优选地是双链的dna。
[0129]
本文所用的“分离的”核酸分子(或dna)是指不再处于其天然环境中(例如处于体外)的核酸序列(或dna)。本文所用的“重组的”核酸分子(或dna)是指在重组细菌或植物宿主细胞中的核酸序列(或dna);所述核酸序列已从其天然序列进行编辑;或所述核酸序列位于与天然序列不同的位置。在一些实施例中,“分离的”或“重组的”核酸不含有在衍生所述核酸的生物体基因组dna中天然地位于所述核酸侧接的序列(即,位于所述核酸的5

和3

端的序列)(优选编码蛋白质的序列)。出于本公开的目的,“分离的”或“重组的”当用于指核酸
分子时排除分离的染色体。例如,在不同实施例中,编码nlr02多肽的重组核酸分子可以含有小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核酸序列,所述核酸序列在源自所述核酸的细胞的基因组dna中天然地位于所述核酸分子的侧翼。
[0130]
在一些实施例中,与天然或基因组核酸序列相比,编码nlr02多肽的分离的核酸分子在核酸序列中具有一个或多个改变。在一些实施例中,天然或基因组核酸序列的改变包括但不限于:由于遗传密码的简并性造成的核酸序列改变;与天然或基因组序列相比,由于氨基酸取代、插入、缺失和/或添加造成的核酸序列的改变;一个或多个内含子的去除;一个或多个上游或下游调节区的缺失;和与基因组核酸序列相关的5

和/或3

非翻译区的缺失。在一些实施例中,编码nlr02多肽的核酸分子是非基因组序列。
[0131]
考虑了编码nlr02多肽或相关蛋白质的多种多核苷酸。当可操作地连接到合适的启动子、转录终止和/或聚腺苷酸化序列上时,此类多核苷酸可用于在宿主细胞中产生nlr02多肽。这类多核苷酸还可用作用于分离编码nlr02多肽或相关蛋白质的同源或基本上同源的多核苷酸的探针。
[0132]
在一些实施例中,编码nlr02多肽的核酸分子是具有在seq id no:2中所示序列的多核苷酸、及其变体、片段和互补序列。本文所用的“互补序列”是指与给定核酸序列充分互补的核酸序列,使得其可以与所述给定核酸序列杂交从而形成稳定的双链体。本文所用的“多核苷酸序列变体”是指除遗传密码的简并性之外编码相同多肽的核酸序列。
[0133]
在一些实施例中,编码nlr02多肽的核酸分子是非基因组核酸序列。如本文所用的,“非基因组核酸序列”或“非基因组核酸分子”或“非基因组多核苷酸”是指与天然或基因组核酸序列相比,在所述核酸序列上具有一个或多个改变的核酸分子。在一些实施例中,天然或基因组核酸分子的改变包括但不限于:由于遗传密码的简并性造成的核酸序列改变;用于在植物中表达的核酸序列的优化;与天然或基因组序列相比,引入至少一个氨基酸取代、插入、缺失和/或添加的核酸序列的改变;去除与所述基因组核酸序列相关的一个或多个内含子;插入一个或多个异源内含子;缺失与所述基因组核酸序列相关的一个或多个上游或下游调节区;插入一个或多个异源上游或下游调节区;缺失与所述基因组核酸序列相关的5

和/或3

非翻译区;插入异源5

和/或3

非翻译区;和聚腺苷酸化位点的修饰。在一些实施例中,非基因组核酸分子是合成的核酸序列。
[0134]
在一些实施例中,编码本文所公开的nlr02多肽的核酸分子是具有如下核苷酸序列的非基因组多核苷酸,所述核苷酸序列与seq id no:2的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性,其中当在植物中表达时所述nlr02多肽具有antrot抗性活性。
[0135]
在一些实施例中,所述核酸分子编码nlr02多肽变体,所述变体包含对seq id no:2的氨基酸序列的一个或多个氨基酸取代。
[0136]
作为编码nlr02多肽的这些核酸序列的片段的核酸分子也涵盖在实施例中。如本文所用的“片段”是指编码nlr02多肽的核酸序列的一部分。核酸序列的片段可以编码nlr02多肽的生物活性部分,或者它可以是可以使用下文公开的方法用作杂交探针或pcr引物的
片段。作为编码nlr02多肽的核酸序列的片段的核酸分子包含至少约150、180、210、240、270、300、330、360、400、450或500个连续核苷酸或高至存在于编码由本文公开方法鉴定的nlr02多肽的全长核酸序列中的核苷酸数目,这取决于预期用途。本文所用的“连续核苷酸”是指彼此紧邻的核苷酸残基。实施例的核酸序列的片段将编码保留nlr02多肽的生物活性并因此保留疾病抗性的蛋白质片段。本文所用的“保留疾病抗性”是指具有seq id no:2中所示全长nlr02多肽的至少约10%、至少约30%、至少约50%、至少约70%、80%、90%、95%或更高的疾病抗性的多肽。
[0137]
相对于参考序列(主题序列),“序列同一性百分比(%)”被确定为在比对序列并引入空位(如果需要)以实现最大百分比序列同一性后,并且不考虑作为序列同一性的一部分的任何氨基酸保守取代,候选序列(查询序列)中与参考序列中的相应氨基酸残基或核苷酸相同的氨基酸残基或核苷酸的百分比。用于确定序列同一性百分比目的而进行的比对能以各种方式实现,例如,使用公共可用的计算机软件,例如blast、blast-2。本领域的技术人员可以确定用于比对序列的适当参数,包括在进行比较的序列的全长度上实现最大比对所需的任何算法。两个序列之间的同一性百分比是序列共有的相同位置的数目的函数(例如,查询序列的同一性百分比=查询序列和主题序列之间的相同位置的数目/查询序列的位置总数
×
100)。
[0138]
在一些实施例中,nlr02多核苷酸编码包含与贯穿seq id no:2的氨基酸序列的整个长度具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性的氨基酸序列的nlr02多肽。在一些实施例中,nlr02多核苷酸包含基因组序列,所述基因组序列包括内含子、调节元件、和非翻译区。
[0139]
实施例还涵盖编码nlr02多肽变体的核酸分子。编码核酸序列的nlr02多肽的“变体”包括编码由本文公开的方法鉴定的nlr02多肽但是由于遗传密码的简并性以及如上所述的充分相同的那些序列而存在保守差异的那些序列。可以通过使用熟知的分子生物学技术鉴定天然存在的等位基因变体,如聚合酶链式反应(pcr)和如下文概述的杂交技术。变体核酸序列还包括经合成衍生的核酸序列,所述核酸序列已经例如通过使用定点诱变而产生,但是仍然编码本文公开的nlr02多肽。
[0140]
技术人员将进一步了解,可以通过核酸序列的突变引入变化,从而导致编码的nlr02多肽的氨基酸序列的变化,而不改变蛋白质的生物活性。因此,变体核酸分子可以通过以下方式产生:将一个或多个核苷酸取代、添加和/或缺失引入本文公开的相应的核酸序列中,这样使得将一个或多个氨基酸取代、添加或缺失引入所编码的蛋白质中。通过标准技术可以引入突变,如定向诱变和pcr介导的诱变。此类变体核酸序列也被本公开所涵盖。
[0141]
可替代地,可以通过沿编码序列的全部或部分随机引入突变(如通过饱和诱变)来制备变体核酸序列,并且可以筛选所得突变体赋予活性以鉴定保留活性的突变体的能力。在诱变之后,所编码的蛋白质可以进行重组表达,并且所述蛋白质的活性可以使用标准的测定技术来确定。
[0142]
本公开的多核苷酸及其片段任选用作各种重组和递归(recursive)重组反应的底物,除了例如ausubel、berger和sambrook所述的标准克隆方法之外,即,以产生具有所需特性的另外的多肽同源物及其片段。各种此类反应是已知的。用于生产本文列出的任何核酸
的变体的方法(这些方法包括将此类多核苷酸与第二(或更多)多核苷酸递归重组,从而形成变体多核苷酸文库)也是本公开的实施例,所产生的文库、包含所述文库的细胞和通过此类方法产生的任何重组多核苷酸也是如此。另外,此类方法任选地包括基于活性从此类文库中选择变体多核苷酸,正如其中此类递归重组在体外或体内进行。
[0143]
各种多样性产生方案(包括核酸递归重组方案)是可获得的。所述程序可以单独和/或组合使用以产生核酸或核酸集合的一种或多种变体,以及所编码蛋白质的变体。单独地或整体地,这些程序提供了产生多样化核酸和核酸集合(包括例如核酸文库)的稳健且广泛适用的方式,所述方式可用于,例如,具有新的和/或改善的特征的核酸、蛋白质、途径、细胞和/或生物体的工程化或快速进化。
[0144]
虽然为清除起见,在随后的讨论过程中作出了区分和分类,但是应当理解,所述技术通常不是相互排斥的。实际上,各种方法可以单独使用或组合、平行或串联使用,以便取得不同的序列变体。
[0145]
本文所述的任何多样性产生程序的结果可以是一种或多种核酸的产生,其可以选择或筛选具有或赋予所需特性的核酸或编码具有或者赋予所需特性的蛋白质的核酸。通过本文的或技术人员以其他方式可用的一种或多种方法进行多样化之后,可以针对所需的活性或特性(例如,在所需的ph下的这种活性等)选择所产生的任何核酸。这可以包括通过本领域任何测定来鉴定可以例如以自动化或可自动化形式检测的任何活性。各种相关(或甚至不相关)的特性可以由执业者酌情串联或平行评估。
[0146]
实施例的核苷酸序列也可用于从不同来源中分离相应的序列。以这种方式,可以使用如pcr、杂交等方法来鉴定此类序列(基于其与由本文公开的方法鉴定的序列的序列同源性)。实施例涵盖基于与本文所示全部序列或其片段的序列同一性选择的序列。此类序列包括作为所述序列的直向同源物的序列。术语“直向同源物”是指衍生自共同祖先基因并且由于物种形成而在不同物种中发现的基因。当其核苷酸序列和/或其编码的蛋白序列共有如本文其他地方所定义的基本同一性时,在不同物种中发现的基因被认为是直向同源物。
[0147]
在pcr方法中,可以设计寡核苷酸引物用于pcr反应,以从由任何目的生物体提取的cdna或基因组dna扩增相应的dna序列。用于设计pcr引物以及pcr克隆的方法公开于以下文献中:sambrook,等人,(1989)molecular cloning:a laboratory manual[分子克隆:实验室手册](第2版,cold spring harbor laboratory press[冷泉港实验室出版社],plainview[普莱恩维尤],纽约),以下为“sambrook”。还参见,innis,等人编辑(1990)pcr protocols:a guide to methods and applications[pcr方案:方法与应用指南](academic press[学术出版社],纽约);innis和gelfand编辑(1995)pcr strategies[pcr策略](academic press[学术出版社],纽约);以及innis和gelfand编辑(1999)pcr methods manual[pcr方法手册](academic press[学术出版社],纽约)。已知的pcr方法包括但不限于:使用成对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。
[0148]
在杂交方法中,全部或部分核酸序列可用于筛选cdna或基因组文库。用于构建此类cdna和基因组文库的方法公开于sambrook和russell,(2001),同上。所谓的杂交探针可以是基因组dna片段、cdna片段、rna片段或其他寡核苷酸,并且可以用一个可检测基团(如32p或任何其他可检测的标记,如其他放射性同位素、荧光化合物、酶或酶辅因子)进行标
记。用于杂交的探针可以通过标记基于本文公开的编码已知的多肽的核酸序列的合成的寡核苷酸来制备。可以另外使用简并引物,所述简并引物是基于在所述核酸序列或所编码的氨基酸序列中的保守核苷酸或氨基酸残基而设计的。这种探针典型地包含以下核酸序列的区域,所述核酸序列区域在严格条件下与编码多肽的核酸序列或其片段或变体的至少约12个、至少约25个、至少约50、75、100、125、150、175或200个连续核酸进行杂交。用于制备用于杂交的探针的方法和严格条件公开于sambrook和russell,(2001),同上中。
[0149]
核苷酸构建体、表达盒和载体
[0150]
本文使用术语“核苷酸构建体”并不旨在将实施例限制为包含dna的核苷酸构建体。本领域普通技术人员将认识到,核苷酸构建体,特别是由核糖核苷酸构成的多核苷酸和寡核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合也可用于本文公开的方法中。实施例的核苷酸构建体、核酸和核苷酸序列另外涵盖这种构建体、分子和序列的所有互补形式。此外,实施例的核苷酸构建体、核苷酸分子和核苷酸序列涵盖能用于实施例的转化植物方法的所有核苷酸构建体、分子和序列,包括但不限于由脱氧核糖核苷酸、核糖核苷酸及其组合所构成的那些。这种脱氧核糖核苷酸和核糖核苷酸既包括天然存在的分子也包括合成的类似物。实施例的核苷酸构建体、核酸和核苷酸序列还涵盖核苷酸构建体的所有形式,所述形式包括但不限于单链形式、双链形式、发夹、茎环结构等。
[0151]
另外的实施例涉及经转化的生物体,如选自以下的生物体:植物细胞、细菌、酵母、杆状病毒、原生动物、线虫和藻的生物体。经转化的生物体包含:实施例的dna分子、包含dna分子的表达盒或包含表达盒的载体,它可以稳定地并入经转化的生物体的基因组。
[0152]
在dna构建体中提供实施例的序列,用于在目的生物体中表达。所述构建体将包括可操作地连接到实施例的序列的5

和3

的调节序列。如本文使用的,术语“可操作地连接”是指启动子和/或调节序列与第二序列之间的功能性连锁,其中所述启动子和/或调节序列启动、介导和/或影响相应于所述第二序列的dna序列的转录。通常,可操作地连接意味着所连接的核酸序列是连续的,并且在必要时在相同阅读框中连接两个蛋白质编码区域。所述构建体可以另外含有待共转化进生物体的至少一个另外的基因。可替代地,可以在多个dna构建体上提供一个或多个另外的基因。
[0153]
提供的这种dna构建体具有用于插入本公开的多肽基因序列的多个限制性位点,该多肽基因序列将位于调节性区域的转录调节之下。dna构建体可以另外包含选择性标记基因。
[0154]
一般来说,dna构建体在5

至3

的转录方向上将包括:转录和翻译起始区(即启动子)、实施例的dna序列、以及在作为宿主的生物体中起作用的转录和翻译终止区(即终止区)。针对实施例的宿主生物体和/或序列,转录起始区(即,启动子)可以是天然的、类似的、外源的或异源的。此外,所述启动子或调节序列可以是天然序列,或可替代地,是合成序列。如本文使用的,术语“外源”表示在引入启动子的天然生物体中没有发现启动子。如本文所用的,关于序列的术语“异源”意指序列源于外来物种,或者,如果源于相同物种的话,则是通过蓄意人为干预从其在组合物和/或基因组基因座中的天然形式进行实质性修饰得到的序列。如本文使用的,嵌合基因包含与转录起始区可操作地连接的编码序列,所述转录起始区对于所述编码序列是异源的。当所述启动子是天然(native或natural)序列时,可操作地连接的序列的表达从野生型表达变化,这导致表型的改变。
[0155]
在一些实施例中,所述dna构建体包含编码实施例的nlr02多肽的多核苷酸。在一些实施例中,所述dna构建体包含多核苷酸,所述多核苷酸编码包含实施例的nlr02多肽的融合蛋白。
[0156]
在一些实施例中,dna构建体还可以包括转录增强子序列。如本文所用的,术语“增强子”是指可以刺激启动子活性的dna序列,并且可以是插入以增强启动子的水平或组织特异性的启动子的先天元件或异源元件。也可以使用各种增强子,所述增强子例如包括在植物中具有基因表达增强特性的内含子(美国专利申请公开号2009/0144863)、泛素内含子(即,玉蜀黍泛素内含子1(参见,例如,ncbi序列s94464))、ω增强子或ω主要增强子(gallie,等人,(1989)molecular biology of rna[rna的分子生物学],编辑:cech(liss公司,纽约)237-256和gallie,等人,(1987)gene[基因]60:217-25)、camv 35s增强子(参见,例如,benfey,等人,(1990)embo j.[欧洲分子生物学学会杂志]9:1685-96)和美国专利号7,803,992的增强子。以上转录增强子的列表并不意指是限制性的。任何适当转录增强子都可用于实施例中。
[0157]
终止区对于转录起始区可以是天然的,对于可操作地连接的目的dna序列可以是天然的,对于植物宿主可以是天然的,或者可以衍生自另一种来源(即,对于启动子、目的序列、植物宿主、或其任何组合而言是外源的或异源的)。
[0158]
方便的终止区可获自根癌农杆菌(a.tumefaciens)的ti质粒,如章鱼碱合酶和胭脂碱合酶终止区。还参见guerineau等人,(1991)mol.gen.cenet.[分子遗传学和普通遗传学]262:141-144;proudfoot,(1991)cell[细胞]64:671-674;sanfacon等人,(1991)genes dev.[基因与发育]5:141-149;mogen等人,(1990)plant cell[植物细胞]2:1261-1272;munroe等人,(1990)gene[基因]91:151-158;ballas等人,(1989)nucleic acids res.[核酸研究]17:7891-7903以及joshi等人,(1987)nucleic acid res.[核酸研究]15:9627-9639。
[0159]
适当时可以优化核酸以增加在宿主生物体中的表达。因此,在宿主生物体是植物的情况下,合成核酸可以使用植物偏好性密码子来合成以改善表达。有关宿主偏好性使用的讨论,参见,例如campbell和gowri,(1990)plant physiol.[植物生理学]92:1-11。例如,虽然实施例的核酸序列在单子叶和双子叶植物物种中均可以表达,但是可以修饰序列,以考虑单子叶或双子叶植物的特定偏好和gc含量偏好,因为这些偏好已经表现出了差异(murray等人(1989)nucleic acids res.[核酸研究]17:477-498)。因而,特定氨基酸的植物偏好性可以衍生自植物的已知基因序列。
[0160]
已知有另外的序列修饰能增强细胞宿主中的基因表达。这些包括消除以下序列:编码假聚腺苷酸化信号的序列、编码外显子-内含子剪接位点信号的序列、编码转座子样重复序列的序列和得到充分表征的、可能不利于基因表达的其他序列。可以将序列的gc含量调整至给定细胞宿主的平均水平,如通过参考在所述宿主细胞中表达的已知基因而计算的。如本文使用的,术语“宿主细胞”是指包含载体并支持表达载体的复制和/或表达的细胞。宿主细胞可以是原核细胞如大肠杆菌,或真核细胞如酵母、昆虫、两栖类或哺乳动物细胞、或单子叶或双子叶植物细胞。单子叶宿主细胞的实例是玉蜀黍宿主细胞。当可能时,修饰序列以避免出现可预见的发夹二级mrna结构。
[0161]
在制备表达盒时,可以操作各种dna片段,以提供处于适当方向以及合适时,处于
适当阅读框中的dna序列。为此,可采用衔接子(adapter)或接头以连接dna片段,或可以涉及其他操作以提供方便的限制性位点、去除多余的dna、去除限制性位点等。为此目的,可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再取代(例如转换和颠换)。
[0162]
许多启动子可用于实施所述实施例。可基于所需结果,选择启动子。核酸可与组成型、组织偏好性、诱导型或其他启动子组合用于在宿主生物体中的表达。
[0163]
植物转化
[0164]
所述实施例的方法涉及将多肽或多核苷酸引入植物。如本文所用的,“引入”意指将所述多核苷酸或多肽呈送给所述植物,以此类方式使得所述序列进入所述植物细胞的内部。所述实施例的方法不取决于用于将一个或多个多核苷酸或一个或多个多肽引入植物中的具体方法,只要所述多核苷酸或多肽进入所述植物的至少一个细胞的内部即可。将一种或多种多核苷酸或一种或多种多肽引入植物的方法包括但不限于稳定转化法、瞬时转化法和病毒介导法。
[0165]
如本文所用的,“稳定转化”意指引入植物中的核苷酸构建体整合到所述植物的基因组中,并且能够被其子代遗传。如本文所用的,“瞬时转化”意指将多核苷酸引入所述植物中并且不整合到所述植物的基因组中,或者将多肽引入植物中。如本文所用的,“植物”是指整株植物、植物器官(例如叶、茎、根等)、种子、植物细胞、繁殖体、及其胚胎和子代。植物细胞可以是分化的或未分化的(例如愈伤组织、悬浮培养细胞、原生质体、叶子细胞、根细胞、韧皮部细胞和花粉)。
[0166]
转化方案以及将核苷酸序列引入植物中的方案可以根据要靶向转化的植物或植物细胞的类型(即,单子叶植物或双子叶植物)而异。将核苷酸序列引入到植物细胞中并随后插入到植物基因组中的合适方法包括显微注射(crossway等人,(1986)biotechniques[生物技术]4:320-334)、电穿孔(riggs等人,(1986)proc.natl.acad.sci.usa[美国科学院院报]83:5602-5606)、农杆菌介导的转化(美国专利号5,563,055和5,981,840)、直接基因转移(paszkowski等人,(1984)embo j[欧洲分子生物学学会杂志]3:2717-2722)以及弹道粒子加速(参见,例如美国专利号4,945,050;5,879,918;5,886,244和5,932,782;tomes,等人,(1995)在plant cell,tissue,and organ culture:fundamental methods[植物细胞、组织和器官培养:基本方法]中,gamborg和phillips编辑(springer-verlag,berlin[德国柏林施普林格出版公司]);和mccabe等人,(1988)biotechnology[生物技术]6:923-926);以及lecl转化法(wo 00/28058)。对于马铃薯转化法,参见tu等人,(1998)plant molecular biology[植物分子生物学]37:829-838和chong等人,(2000)transgenic research[转基因研究]9:71-78。可以在以下文献中找到另外的转化方法:weissinger等人,(1988)ann.rev.genet.[遗传学年鉴]22:421-477;sanford等人,(1987)particulate science and technology[微粒科学与技术]5:27-37(洋葱);christou等人,(1988)plant physiol.[植物生理学]87:671-674(大豆);mccabe等人,(1988)bio/technology[生物/技术]6:923-926(大豆);finer和mcmullen,(1991)in vitro cell dev.biol.[体外细胞生物学和发育生物学]27p:175-182(大豆);singh等人,(1998)theor.appl.genet.[理论与应用遗传学]96:319-324(大豆);datta等人,(1990)biotechnology[生物技术]8:736-740(水稻);klein等人,(1988)proc.natl.acad..sci.usa[美国科学院院报]85:4305-4309(玉蜀黍);klein等人,(1988)biotechnology[生物技术]6:559-563(玉蜀黍);美国专利号5,240,855;5,
322,783和5,324,646;klein等人,(1988)plant physiol.[植物生理学]91:440-444(玉蜀黍);fromm等人,(1990)biotechnology[生物技术]8:833-839(玉蜀黍);hooykaas-van slogteren等人,(1984)nature[自然](伦敦)311:763-764;美国专利号5,736,369(谷类);bytebier等人,(1987)proc.natl.acad.sci.usa[美国科学院院报]84:5345-5349(百合科(liliaceae));de wet等人,(1985)the experimental manipulation of ovule tissues[胚珠组织的实验操作],chapman等人编辑(longman[朗文出版社],纽约),第197-209页(花粉);kaeppler等人,(1990)plant cell reports[植物细胞报告]9:415-418和kaeppler等人,(1992)theor.appl.genet.[理论与应用遗传学]84:560-566(晶须介导的转化);d

halluin等人,(1992)plant cell[植物细胞]4:1495-1505(电穿孔);li等人,(1993)plant cell reports[植物细胞报告],12:250-255以及christou和ford,(1995)annals of botany[植物学年报]75:407-413(水稻);osjoda等人,(1996)nature biotechnology[自然生物技术]14:745-750(经由根癌农杆菌的玉蜀黍)。
[0167]
将基因组编辑技术引入植物的方法
[0168]
在一些实施例中,可以使用基因组编辑技术将多核苷酸组合物引入植物的基因组中,或者可以使用基因组编辑技术编辑植物基因组中先前引入的多核苷酸。例如,可以通过使用双链断裂技术(如talen、大范围核酸酶、锌指核酸酶、crispr-cas等)将所鉴定的多核苷酸引入植物基因组中需要的位置上。例如,为了位点特异性插入的目的,可以使用crispr-cas系统将所鉴定的多核苷酸引入基因组中需要的位置上。植物基因组中需要的位置可以是任何对于插入来说需要的靶位点,如适于育种的基因组区域,或者可以是位于具有现有的目的性状的基因组窗口中的靶位点。现有的目的性状可能是内源性状或先前引入的性状。
[0169]
在一些实施例中,在已在基因组中鉴定antrot抗性nlr02基因等位基因的情况下,可以使用基因组编辑技术来改变或修饰的多核苷酸序列。可以引入所需的nlr02基因等位基因多核苷酸中的位点特异性修饰包括使用用于引入位点特异性修饰的任何方法产生的修饰,所述方法包括但不限于通过使用基因修复寡核苷酸(例如美国公开2013/0019349),或通过使用双链断裂技术,如talen、大范围核酸酶、锌指核酸酶、crispr-cas等。此类技术可用于通过在引入的多核苷酸内的核苷酸的插入、缺失或取代来修饰先前引入的多核苷酸。可替代地,可以使用双链断裂技术向引入的多核苷酸中添加另外的核苷酸序列。可以添加的另外的序列包括另外的表达元件(如增强子序列和启动子序列)。在另一个实施例中,基因组编辑技术可用于在植物的基因组内将另外的疾病抗性蛋白定位在nlr02多核苷酸组合物附近,以产生疾病抗性蛋白的分子堆叠物。
[0170]“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”和“修饰的靶序列”在本文中可互换地使用,并且意指如本文公开的靶序列,当与未改变的靶序列相比时,所述靶序列包含至少一个改变。此类“改变”包括,例如:(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。
[0171]
实例
[0172]
提供下列实例以说明但不限制所要求保护的主题。应当理解,本文所述实例和实施例仅用于说明目的,并且本领域的技术人员将认识到在不脱离本公开精神或所附权利要求范围的情况下可改变多种试剂或参数。
[0173]
实例1.qtl定位
[0174]
由真菌病原体禾生炭疽病菌引起的炭疽茎腐病(antrot)是玉蜀黍最常见的茎病害。作为我们鉴定可赋予antrot抗性的天然玉蜀黍基因的努力的一部分,我们通过将antrot抗性品系tzi8与(中度)易感品系phi12p9杂交,创造了f1群体。将所述材料与phi12p9回交以产生bc1定位群体。对这一定位群体的工作与专利申请wo/2015/088970中描述的努力结合进行,所述申请保护了从近交系ph14j中鉴定的类似基因座。在开花后约10天,用禾生炭疽病菌孢子悬浮液(约5 x 105个孢子/m1)注射茎秆,并且约4-6周后进行分离。用snp标记对单个植物进行基因分型,并使用视觉评分对antrot的严重程度:antsum进行表型。根据1-10的视觉评分确定严重程度,1表示抗性最高,10表示高度易感。1-3的评分被认为非常具有抗性,4-6分之间为中间值,并且7-10分被归类为易感的。我们最初的定位将antrot抗性的数量性状基因座(qtl)置于chr06上的23.38与125.58cm之间,相关峰值在82.67cm(mza4127-4)。
[0175]
实例2.qtl精细定位和候选基因鉴定
[0176]
为了精细定位抗性基因,将我们的定位群体进一步与易感亲本ph12p9回交,以产生bc4分离群体,并使用先前描述的方法对这些植物进行表征。使用56k snp的组合以及为tzi8和ph12p9收集的外显子组捕获数据,产生了另外的snp标记用于精细定位。
[0177]
对于约3,500个分离bc4个体重组的群体,基因型与表型之间的峰值相关性在chr06上为78.88cm(p值为1.45e-118)。具有78.88cm的tzi8等位基因的植物的antsum评分比具有ph12p9等位基因的植物的antsum评分低约2分(表1)。我们的保守和优化区间的侧翼标记如下所示(表2)。使用kruskal-wallis方法用wallis方法用软件包(版本7.11.0)分析定位数据,以比较数值变量和类别变量。
[0178]
表1.chr06 tzi8 antrot qtl精细定位区间。
[0179][0180]
呈现的p值代表给定遗传位置的基因型与antrot表型(antsum)的相关性。遗传位
置基于corteva b73基因组(版本2)。表2中列出的侧翼标记用*标记(在随后的实验后添加了优化的右侧翼标记)。基因型和表型之间的峰值相关性发生在chr06上的78.88cm并以粗体显示。
[0181]
表2.chr06 tzi8 antrot qtl的侧翼标记位置。
[0182][0183][0184]
位置基于corteva b73基因组(版本2),并且公共b73基因组(版本4)也包括物理位置。
[0185]
为了在我们的定位区间内获得候选基因,在chr06区域使用从近等基因系(nil)生成的全基因组序列,其中tzi8作为供体,并且ph12p9作为轮回亲本。基于fgenesh基因模型预测,在我们指定的保守遗传区间中有两个核苷酸结合位点-富含亮氨酸重复(nlr)基因和一个壁相关的激酶(wak)。这些是我们基因家族区间中唯一在宿主防御病原体中具有已知作用的基因。将来自tzi8nil的rnaseq读数与所述基因组比对,以确认我们预测的基因模型。
[0186]
两个nlr基因之一(nlr02)是两个nlr的独特融合,所述融合在tzi8中具有出人意料的表达证据,但在b73中似乎没有功能。这是我们优化的定位区间中唯一的基因候选物。我们指出的优化的侧翼标记排除了其他nlr(nlr01)和wak。
[0187]
由于所述两个nlr紧邻,很难在这两个基因之间找到重组。只有四个个体重组表明nlr01在我们的qtl区间之外,保持该基因可能与tzi8基因座抗性有关的可能性。然而,nlr01与几个易感品系,包括b73和ph1v69,在基因和蛋白水平上均具有100%同一性。因此,所述nlr01基因在测试中并不先进。三个重组家族表明qtl在标记157的左侧,排除了wak。如上所述,此标记在一个非常小的区间内出现两次(表1)。两个位置都在wak的左测。然而,我们比较保守的区间仍然包括此基因。
[0188]
实例3.其他c6供体系中的qtl定位
[0189]
除了tzi8外,在chr06上已鉴定出具有非常相似的antrot抗性qtl的另外两个品系。所述qtl区域类似于专利申请wo/2015/088970中描述的从ph14j中鉴定的区域。
[0190]
将另外两个品系供体渗入易感品系,然后回交三次进入ph1tw8和/或ph2sna。然后如实例1中所述对分离群体进行antrot评分。以下呈现的当前精细定位区间(表3)是我们的基于从多个家族中分离个体的这些品系的保守区间。
[0191]
表3.其他供体中chr06 qtl的侧翼标记位置。
[0192]
供体遗传区间(cm)物理区间(bp)近交系achr06-78.11-81.52131752260-134517145ph14jchr06-78.11-79.52131752260-134183792近交系bchr06-78.11-81.52131752260-134517145
[0193]
位置基于corteva b73基因组(版本2),并且公共b73基因组(v4)也包括物理位置。
[0194]
实例4.nlr02候选基因的转基因验证
[0195]
用含有nlr02的构建体转化易感品系以验证所述基因。设计了两种不同的nlr02构建体:1)具有天然tzi8启动子的基因插入和2)具有组成型h2b启动子的cdna插入。
[0196]
将t1分离种子在温室中测试(如下所述),并将在田间进行测试并且对antsum评分(如实例1中所述)以鉴定易感品系的抗性转化体。与空值相比,预期nlr02基因改善易感背景中的antsum评分。当渗入易感品系时,与所述易感品系相比,tzi8 chr06区间的(nil)阳性具有减少的antrot症状。
[0197]
将在ph1v69背景中分离出的tzi8转基因的t1幼苗,使用叶鞘测定法在温室中接种antrot。对于所述测定,以1-9的等级对幼苗进行评分,其中9分为最具抗性,1分为最易感的。与空值相比,表达nlr02的一个或两个拷贝的植物在易感背景中具有减少的antrot症状(图2,表4)。箭头表示antrot感染部位(图2)。t1种子也将在田间进行测试,以确认温室测定的验证结果。
[0198]
表4.php94983(h2b tzi8 cds)对温室中炭疽茎腐病的功效。
[0199][0200]
在基于温室的叶鞘测定中,具有tzi8基因(h2b tzi8 cds)的一个或两个拷贝的植物对antrot感染具有更强的抗性。对于所述测定,以1-9的等级对幼苗进行评分,其中9分为最具抗性,1分为最易感的。
[0201]
比对rnaseq实验的读数以确定ph14j和ph1v69在我们的chr06区间中是否具有与nlr02的tzi8相同的等位基因。ph14j具有相似的预测基因模型,但在所述预测编码区具有几个snp的独特等位基因,这已通过远距离pcr和桑格测序确认。除了上述tzi8等位基因外,
还将在转基因植物中构建和测试载体以测试nlr02的ph14j等位基因(seq id no:5)的功效。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献