一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

介导植物基因组稳定整合的丝氨酸重组酶的制作方法

2021-11-05 20:25:00 来源:中国专利 TAG:

介导植物基因组稳定整合的丝氨酸重组酶
关于序列表
1.本技术引入了一个序列表(如下所示)以供参考,该序列表通过美国专利局的电子提交系统(efs)以文本文件格式同时提交。本文提交的序列表的文本文件副本标记为“inx00466us

v4_st25.txt”,文件大小为84947字节,创建于2019 年10月14日。该序列表全部纳入本文以供参考。


背景技术:

2.位点特异性重组酶在原核生物和低等真核生物中很常见,但在高等多细胞真核生物如植物中不存在。位点特异性重组酶催化含有短特异性序列的两个 dna片段之间的重组反应。这个过程不同于依赖于同源性的重组酶,其催化两个较大的同源序列之间的重组。
3.位点特异性重组酶大致分为两大类:酪氨酸重组酶(也称为λ整合酶系统)和丝氨酸重组酶(也称为解离酶或整合酶家族)。这两个重组酶家族在不同的重组机制下操作,没有序列或结构上的相似性。每个家族似乎都是独立进化的。
4.酪氨酸重组酶广泛存在于大多数原核生物、真菌和纤毛虫中。已知1000 多个成员,包括来自噬菌体p1的cre

lox系统和来自酵母的flp

frt系统。cre

lox 和flp

frt被广泛应用于外来基因的位点特异性整合以及切除通过重组酶位点侧接的不需要的基因盒。酪氨酸重组酶具有可逆重组反应,因此可用于整合和切除。酪氨酸重组需要将重组酶位点人工工程改造到植物染色体中,以整合所需的基因盒。lox位点包含两个13bp反向重复序列之间的8bp间隔子,而frt包含两个13bp 重复序列之间的8bp间隔子。frt和lox位点之间没有序列相似性。工程改造的植物和动物中存在这类重组位点是基因工程改造中的额外步骤。
5.丝氨酸重组酶由噬菌体编码,并进化为利用噬菌体特异性attp(噬菌体) 位点将噬菌体基因组整合到细菌染色体中(smith&thorpe综述,molecularmicrobiology(2002),44299

307)。成功整合需要细菌宿主染色体中存在第二个位点attb(细菌)。attp和attb之间的重组修饰位点并产生attl(左)和attr(右) (如图1所示),其不能被丝氨酸重组酶单独切除,需要额外的重组定向性因子 (rdf)。因此,在没有关联rdf的情况下,丝氨酸重组是不可逆和单向的。attb 和attp位点都是整合所必需的,并且特定的attp/attb对通常对特定的重组酶具有特异性或者仅对接近的家族成员起作用。存在超过72种不同的丝氨酸重组酶,它们沿着系统发育线归类成三个主要家族,称为(a)大丝氨酸重组酶(b)解离酶/ 转化酶和(c)is607样(smith&thorpe,同上)。
6.丝氨酸重组酶的定向和不可逆重组使其成为一种有吸引力的工具,用于真核生物染色体中的基因整合、合成生物学应用(如定向基因堆叠(stacking))和从染色体中整合的基因盒切除不需要的基因。att位点通常很小(<50bp),可以被引入基因组或克隆盒中的所需位置。如果attb和attp位点都存在(通常需要将att 位点人工工程改造到目标物种中),那么丝氨酸重组酶能够在酵母、植物和动物中发挥作用(groth等,2000;kapusi等,2012年;thomson等,2012年;mandali 等,2013年;collier等,2018年)。
7.intrexon已经表征了属于大丝氨酸重组酶更广泛类型的六种不同的丝氨酸重组
酶(φrv1、φc31、bxb1、sf370.1、a118和spβc2)。已显示有几个成员将大片段dna(高达300kb)整合到哺乳动物的染色体中,这使得它们成为一个很有吸引力的工具,用于在所需生物体中工程改造整个代谢途径。intrexon还鉴定了哺乳动物染色体中存在的几个原核att位点样序列。为了区分哺乳动物att位点样序列和原核att位点,这些哺乳动物att位点被称为假位点(pseudosite)。使用spβc2 和sf370.1证明了推定的att位点样序列具有活性并且可用于将该基因直接整合到哺乳动物染色体中(us20060172377a1)。
8.在植物中;植物基因组中人工工程改造的原核att位点上不同类型的丝氨酸重组酶已证明了成功重组(thomson等,2012;kapusi等,2012年;collier等, 2018年)。没有证据表明,丝氨酸重组酶可以将外来dna整合到植物基因组中,而不需要人工工程改造基因组中的原核att位点。发明概述
9.描述了用于植物遗传操作的组合物和方法。这样的丝氨酸重组酶具有许多优势,所述丝氨酸重组酶通过外来dna上attp或attb位点的非同源重组将外来 dna的大区段整合到植物染色体中,不需要对植物染色体上的相应attb或attp位点先进行工程改造。
10.描述了一种用于将外源dna纳入植物中的方法,包括向植物细胞中共同递送:包含attp或attb位点的外源dna和编码丝氨酸重组酶的多核苷酸,其操作性地连接到植物中具有活性的启动子。该方法还可包括选择将外源dna整合到植物染色体上的一个或多个att位点,特别是假attb或假attp位点。
11.在相关方法中,描述了一种获得外源dna位点特异性插入到植物细胞基因组中的方法,所述方法包括在原核丝氨酸重组酶多肽存在下使外源dna上的第一附接位点与植物细胞基因组上的第二附接位点接触,从而导致所述基因组和外源附接位点之间的重组,其中所述植物附接位点是假att位点,外源重组位点为attp 或attb。
12.外源dna可高达25kb、高达50kb、高达75kb、高达100kb、高达150 kb、高达200kb、高达250kb或高达300kb。外源dna优选包含attp位点,优选具有seq id no:7的序列。
13.在本文的方法和组合物中,丝氨酸重组酶具有与seq id no:1至少65%、 70%、75%、80%、85%、90%、95%、98%或99%相同的氨基酸序列;并且还可以具有与seq id no:1至少75%、80%、85%、90%、95%、98%、99%相似的氨基酸序列。丝氨酸复合酶可能是spβc2。丝氨酸重组酶可直接提供给细胞,或可在与外源dna共转染到细胞中的核酸(例如质粒)上编码。
14.本文中的方法可在任何植物细胞上实施。优选地,该细胞是原生质体。本发明涵盖根据本文的方法制备的转基因原生质体。可培养转基因原生质体或其它植物细胞以获得转基因植物。因此,本发明包括根据本文中任一方法获得的转基因植物。
15.在相关方法中,丝氨酸重组酶可用于在多核苷酸构建体插入attp或attb 位点,使得整合的核苷酸包含attl和attr位点。该方法包括将包含感兴趣的基因或感兴趣的盒并且还编码第二丝氨酸重组酶和关联重组酶定向性因子(rdf)的多核苷酸引入植物细胞,其中第二丝氨酸重组酶和rdf受控于诱导型启动子或基因开关。活化后,启动子驱动第二丝氨酸重组酶和rdf的表达,从植物基因组中切除外源dna。
16.在一些实施方式中,丝氨酸重组酶和关联rdf与感兴趣的基因或感兴趣的盒一起共转染。在其它实施方式中,通过与组成性表达丝氨酸重组酶和rdf的植物有性杂交引入丝
氨酸重组酶和rdf,或其中丝氨酸重组酶和rdf受控于诱导型启动子或基因开关。在其它实施方式中,通过顺序转染植物细胞引入丝氨酸重组酶和rdf。在这些实施方式中,丝氨酸重组酶和rdf可组成性表达或可受控于诱导型启动子或基因开关。
17.在一些实施例中,第二丝氨酸重组酶是spβc2。在一些实施方式中,诱导型启动子通过温度、干旱、铜、发育过程或化学配体活化。在一些实施方式中, rdf包含seq id no:31的氨基酸序列。
18.在另一相关方法中,丝氨酸重组酶用于在多核苷酸构建体插入attp或attb 位点,使得整合的核苷酸包含att和attr位点。该方法包括共同递送包含感兴趣的基因或感兴趣的盒并且还编码丝氨酸重组酶的关联重组酶定向性因子(rdf)的多核苷酸,其中rdf和关联丝氨酸重组酶受控于诱导型启动子或基因开关。活化后,启动子驱动丝氨酸重组酶和rdf的表达,从植物基因组中无痕地切除外源dna。
19.在一些实施方式中,丝氨酸重组酶是spβc2。在一些实施方式中,丝氨酸重组酶及其关联rdf表达为融合蛋白。在一些实施方式中,诱导型启动子通过温度、干旱、铜、发育过程或化学配体活化。在一些实施方式中,rdf包含seq idno:31的氨基酸序列。
20.在相关方法中,本文提供了一种用于获得植物细胞中位点特异性重组的方法,所述方法包括:a、提供包含第一附接位点和第二附接位点的植物细胞;b、将第一和第二重组位点与原核丝氨酸重组酶多肽接触,导致重组位点之间的重组,其中,所述丝氨酸重组酶多肽介导所述第一和第二附接位点之间的重组,所述第一重组位点为attp或attb,所述第二重组位点为假附接位点,所述丝氨酸重组酶为spβc2丝氨酸重组酶。
21.本文另一相关方法提供在植物细胞中获得位点特异性重组,包括令植物细胞接触:a、包含attp或attb位点的外源dna和b、在植物中具有活性的丝氨酸重组酶多肽。
22.本文还提供一种基因表达系统,其包含编码操作性地连接到在植物细胞中可操作的启动子的感兴趣的基因的多核苷酸和用于将基因表达系统整合到植物细胞中的att位点。例如,att位点可以是与spβc2丝氨酸重组酶关联的attp或attb。启动子可以是例如35s启动子、泛素启动子、19s启动子、nos启动子、adh启动子、蔗糖合成酶启动子、r复合物启动子或叶绿素a/b结合蛋白启动子。该基因表达系统可进一步包含诱导型启动子,包括但不限于通过应激和化学配体活化的启动子。
23.基因表达系统可进一步包括可操作性地连接到第二启动子的选择性标志物基因,并且第二启动子可与操作性地连接到感兴趣的基因的启动子相同或不同。
24.该基因表达系统可进一步包含增强子。增强子可以是例如玉米(zeamays)booster1基因的hepta重复序列、拟南芥(arabidopsis thaliana)开花基因座 (flowering locus,ft)的c区块,拟南芥(arabidopsis thaliana)侧抑制子(lateralsuppressor,las)的c区域,豌豆(pisum sativum)p268 pete,玉米(zea mays)pi

rr 远端增强子,玉米(zea mays)营养体到生殖体1,豌豆(pisum sativum)ab80增强子,豌豆(pisum sativum)增强子
no:100的[共有]序列。在其他实施例中,权利要求68所述的方法,其中所述植物att假位点包含seq id nos:66

96中任何一个的序列。
[0033]
在一些实施方式中,丝氨酸重组酶是spβc2丝氨酸重组酶,植物是稻属 (genus oryza)的植物。在某些实施方式中,att假位点包含seq id no:107、seqid no:108、seq id no:109或seq id no:110的核酸序列。在一些实施方式中,所述植物是水稻(oryza sativa)。
[0034]
在一些实施方式中,丝氨酸重组酶是spβc2丝氨酸重组酶,植物是莴苣属(genus lactuca)植物。在某些实施方式中,att假位点包含seq id no:111、seqid no:112、seq id no:113、seq id no:114、seq id no:115或seq id no:116 的核酸序列。在一些实施方式中,所述植物是莴苣(lactuca sativa)。
[0035]
在一些实施方式中,丝氨酸重组酶是spβc2丝氨酸重组酶,植物是烟草属(genus nicotiana)植物。在一些实施方式中,att假位点包含seq id no:132、 seq id no:133、seq id no:134、seq id no:135、seq id no:136、seq idno:137、seq id no:138或seq id no:139的核酸序列。在一些实施方式中,所述植物是本氏烟草(nicotiana benthamiana)。
[0036]
在其它实施方式中,丝氨酸重组酶是sf370丝氨酸重组酶。在某些实施方式中,att假位点包含seq id no:124的核酸序列。在其它实施方式中,att假位点包含seq id no:123的核酸序列。
[0037]
本发明还提供一种编码融合蛋白的多核苷酸,所述融合蛋白包含编码大丝氨酸重组酶的第一核酸序列,所述第一核酸序列操作性地连接到编码所述大丝氨酸重组酶的关联重组酶定向性因子(rdf)的第二核酸序列。在一些实施方式中,第一核酸和所述第二核酸通过多核苷酸接头(liner)连接。在某些实施方式中,第一核酸编码seq id no:41的氨基酸序列。在一些实施方式中,第一核酸序列包含seq id no:36的核酸序列。在某些实施方式中,第二核酸编码seq id no:31的氨基酸序列。在一些实施方式中,第二核酸序列包含seq id no:29的核酸序列。在一些实施方式中,多核苷酸进一步包含编码ha和nls标签的第三核酸。在一些实施方式中,多核苷酸编码seq id no:40的氨基酸序列。在一些实施方式中,多核苷酸包含seq id no:35的核酸序列。
附图说明
[0038]
图1是丝氨酸重组酶介导的特异性attp和attb位点之间整合的示意图,该整合将噬菌体基因组插入细菌染色体,启动生长的溶原性阶段,并产生attl和 attr位点。仅丝氨酸重组酶不使attl和attr作用。在噬菌体生长的裂解周期中,丝氨酸重组酶和重组定向性因子(rdf)的共同表达逆转了整合。
[0039]
图2a

b:表达重组酶的效应物质粒(参见实施例1)。图2a是表达重组酶融合蛋白的效应物构建体的示意图。每种重组酶都用c末端ha(流感血凝素) 肽和sv40核定位信号(nls)修饰。表达受控于花椰菜花叶病毒(camv)35s 启动子和胭脂碱合酶(nos)终止子。五种重组酶融合蛋白各自的预期大小如表2 所示。作为对照,用氯霉素乙酰转移酶(cat)基因替换重组酶。图2b是spβc2 效应物质粒的完整图谱,包括载体主链(seq id no:5)。
[0040]
图3:显示莴苣原生质体中不同重组酶表达的蛋白质印迹,如针对ha表位的蛋白质印迹所示。sf370.1以低水平表达。所有其他重组酶在莴苣原生质体中以高水平表达(见实
施例1)。
[0041]
图4显示了报告质粒(参见实施例1)。图4a是检测重组酶作用于特定 attb或attp位点的能力的报告质粒的示意图。每个报告质粒含有绿色荧光蛋白 (gfp)报告物,其受控于花椰菜花叶病毒(camv)35s启动子和胭脂碱合酶(nos) 终止子。每个质粒还含有新霉素磷酸转移酶ii(nptii)基因,其赋予对新霉素和卡那霉素的抗性,受控于木薯叶脉花叶病毒(csvmv)启动子和f3r(马铃薯ubi3 基因的3'utr)。修改常规设计以在gfp报告基因的5’添加attp(1)或attb(2) 位点,而对照质粒(3)缺少任何att位点。因为每个丝氨酸重组酶识别特定的关联attp/attb,所以每个报告质粒的attp或attb与关联丝氨酸重组酶相适应。图4b 是报告质粒的完整图谱,包含spβc2重组酶的attp位点,并且包括载体主链(seqid no:4)。
[0042]
图5a

5b显示了带有attp的报告质粒在spβc2存在的情况下被纳入莴苣基因组中。莴苣叶肉原生质体与报告物(带有attp或无att位点)和效应质粒(表达spβc2重组酶或氯霉素转移酶(cat)作为对照)共转染(见实施例3)。图 5a:转染5周后测定集落速量,结果与无dna相比表明转染对活力有负面影响,但不同质粒之间的活力没有显著差异。图5b:培养5周后,检测gfp的表达。 attp spβc2重组酶共转染的原生质体的gfp集落数比对照多至少20倍。
[0043]
图6a

6b:spβc2介导的莴苣染色体整合优先作用于attp。用报告质粒(无位点、attb或attp)和表达spβc2或氯霉素乙酰转移酶(cat)的质粒转染原生质体,并作为微集落培养(见实施例3)。图6a:在22天的亚培养中,每个质粒组获得的gfp阳性珠表明attp spβc2比起转染其它dna的原生质体保留gfp的表达。图6b:attp cat转染后可观察到少量表达gfp的微集落,但他们都对卡那霉素没有抗性。与attp cat相比,转染attp spβc2在没有卡那霉素选择的情况下生长后可获得42倍表达gfp的集落。表达gfp的微集落对卡那霉素具有抗性,如在8至15天(转染后)施用卡那霉素(35或50μg/ml)所示。5周后对计数gfp 和卡那霉素阳性集落。
[0044]
图7:利用attp报告质粒和spβc2重组酶产生的转基因莴苣愈伤组织对 attp报告质粒中存在的两个标志物基因(nptii和gfp)均为阳性。将具有attp的报告质粒与表达spβc2或氯霉素乙酰转移酶(cat)的质粒一起转染。原生质体在含或不含卡那霉素的情况下都生长成微集落。在亮光下或用gfp滤光片拍摄愈伤组织的图像。在无spβc2的情况下,用attp报告基因不能获得gfp阳性集落(参见实施例3)。
[0045]
图8a

d:转基因莴苣愈伤组织表明,spβc2介导的对莴苣染色体整合优先作用于attp。报告质粒(attb或attp)与表达spβc2或氯霉素乙酰转移酶 (cat)的质粒一起转染入莴苣原生质体细胞,这些细胞来源于7天龄的幼苗(见实施例3)。图8a:用attp报告质粒,spβc2而不是cat产生卡那霉素抗性、 gfp阳性的菌落。图8b在spβc2存在下由attb报告质粒获得单个卡那霉素抗性gfp阳性愈伤组织。图8c显示了转染后在非选择性培养基上生长的愈伤组织数。图8d显示了转基因愈伤组织对卡那霉素抗性和gfp表达均为阳性。
[0046]
图9a

b:利用attp报告质粒和spβc2重组酶产生的转基因植物含有卡那霉素和gfp标志物基因(见实施例3)。图9a:基因组dna的pcr证明nptii 和gfp区域的存在。图9b:荧光显示gfp在转基因莴苣中表达,而在野生型莴苣中不表达。
[0047]
图10a

c:pcr证实转基因已经纳入莴苣染色体中(见实施例3)。图 10a显示了attp报告质粒图谱上引物的位置。图10b显示了预期扩增子表,和图 10c显示了转基因莴苣植株
(tg)、野生型(wt)莴苣和质粒对照的pcr扩增结果的凝胶。
[0048]
图11:spβc2重组酶和attp报告质粒产生表达gfp的烟草亲缘本氏烟草的愈伤组织集落。烟草与attp报告基因和spβc2而不是cat的共转染产生表达 gfp的微愈伤组织。左栏显示了白光下的愈伤组织,右栏显示了gfp荧光(见实施例4)。
[0049]
图12:利用spβc2重组酶和attp报告基因产生的转基因6周龄的本氏烟草愈伤组织表达gfp,并能在达至少100μg/ml卡那霉素上生长。在最上面的两行中,用attp报告质粒和cat质粒(即spβc2(

))转染的愈伤组织在递增的卡那霉素剂量上培养。随着卡那霉素增加,集落数迅速减少,荧光集落数也迅速减少。在最下面的两行中,用attp报告质粒和spβc2质粒转染的细胞显示出稳健生长和gfp 荧光,即使在100μg/ml生长后(见实施例4)。
[0050]
图13:φc31不介导报告质粒的纳入。将报告物和效应物构建体(在图侧示出)转染到莴苣叶肉原生质体中,并检测所得集落的gfp表达。在表达φc31 蛋白的原生质体细胞中观察到有限的或没有细胞分裂(见实施例5)。
[0051]
图14:图14a显示了插入的转基因的示意图,其含有35s启动子 (35s

pro);绿色荧光蛋白(gfp)编码序列;胭脂碱合酶终止序列(no

s);木薯叶脉花叶病毒启动子(cavsv pro);puc复制起始点(puc

origin);以及大观霉素抗性(大观霉素抗性)的编码序列。插入物两侧的本氏烟草基因组dna (gdna)显示为“benthi gdna”。图14b显示了获自与环形attp载体对齐的转基因整合位点左侧和右侧边界的序列谱图。图14c显示了与wt本氏烟草参比基因组对齐的相同序列谱图。图14d和e显示了来自6个独立转基因事件的attp载体的相同线性化。
[0052]
图15:在侧接植物基因组dna和正向和反向基因组引物位置(分别为基因组f引物和基因组r引物)之间插入的外源载体以及用于多重pcr实验以确定转基因的跨代分离和遗传(结果如图16所示)的质粒正向引物位置(质粒正向引物) 的示意图。
[0053]
图16:显示了多重pcr结果的代表性凝胶,所述多重pcr使用基因组f 引物、基因组r引物和质粒正向引物(见图15),以确定来源于自交本氏烟草和莴苣转基因t0植物的野生型(wt)、半合子或纯合子。对于本氏烟草事件 niben101scf11415,wt子代在约1.5kb处有单个条带,纯合子代在凝胶约1kb处显示单个条带,而半合子代在pcr凝胶的1kb和1.5kb处显示两条条带。对于本氏烟草事件niben101scf05124,wt子代在约0.9kb处有一条带,纯合子代在1.5kb 处有一条带,半合子代在0.9kb和1.5kb处有两条条带。对于莴苣事件 lg2:207599470,wt子代有742bp的条带,纯合子代有600bp的条带,半合子代在742bp和600bp处有两条条带。右表显示了从每个事件的t1幼苗后代获得的示例结果。
[0054]
图17:4156bp dna的spβ2rdf表达载体的示意图。
[0055]
图18:pcr策略的示意图,使用横跨整个整合的外源dna的引物(引物 a和d),横跨插入的外源dna的5'端和左侧接本氏烟草基因组dna的引物(引物a和b)(约1kb),横跨插入的外源dna的3'端和右侧接本氏烟草基因组 dna的引物(引物c和d)(约1.2kb)。在外源dna插入物的5'和3'末端的attl 和attr序列被标出。通过引物a和d扩增wt基因组基因座(右下角所示),并在凝胶上产生约1.5kb的条带。切下的环形外源dna(左下角所示)可通过引物 b和c扩增,但当整合到基因组dna中时不能被扩增。
[0056]
图19:分离pcr反应产物的凝胶,所述pcr使用含有整合的外源dna 的dna(亲本dna)和由含有整合的外源dna的细胞制备的dna,所述细胞未经dna(无dna)处理,单独用重
组酶(rec)处理,或用重组酶和rdf(rec rdf) 处理。用引物a b扩增左边界;用引物c d扩增右边界;用引物a d扩增wt 基因座。重组酶和rdf处理细胞后,才能观察到wt基因座。图b显示了wt扩增子(仅在rec rdf共转染后恢复)和左侧边界扩增子的sanger序列谱图。序列与本氏烟草参比基因组序列和原始attp整合载体比对,来说明整合dna的无痕切除。
[0057]
图20:gdna:插入物连接测序数据的示例。下一代测序在1627

17a
‑4‑
1 事件中发现ls7493878中有id373插入。gdna:插入物连接被pcr扩增,sanger 测序,并映射到id373环形载体(a图)和天然7493878(b图)中。注意的是插入位点的左侧和右侧边界与天然位点形成连续的对齐,表明在整合过程中基因组序列没有丢失。在多个独特事件中左侧(d图)和右侧(e图)的gdna:插入物连接的测序中检测到了莴苣位点7493878处spβc2介导的重组中att位点线性化的两种不同可能性。突出显示的核苷酸表明attp位点可能整合到莴苣假位点7493878的两个位置。图c显示了gdna:插入物,其中箭头显示用于测序的引物。
[0058]
图21:spβc2 rec

rdf融合蛋白介导attr转基因的完全无痕切除。图a 显示了用于单向attl/attr切除的rec

rdf融合蛋白的示意图,其由spβc2重组酶, 6个氨基酸的接头序列,spβc2 rdf、ha表位标签和核定位信号(nls)组成。图b和图c显示了代表性pcr结果,表明rec rdf共转染或用rec

rdf融合蛋白单次转染后由纯合本氏烟草和莴苣t1幼苗恢复wt基因座。图d显示了莴苣和本氏烟草中spβc2 rec

rdf的完全无痕切除的sanger序列确认。深色底纹中的序列与原始wt基因座相同,而加框序列与attp整合载体相同。
[0059]
图22:spβc2 rec

rdf切除报告载体图谱。左:spβc2报告载体图谱。 spβc2 attl和attr位点如箭头所示,其中虚线连接spβc2

rec

rdf融合蛋白存在时的预期重组位点。右:在spβc2

rec

rdf切除后,预计会有两种不同的环形产物,其中顶部产物包含荧光素酶orf,现在连接到cmylcv启动子,而底部产物包含复制起始点(puc

ori)、大观霉素抗性基因(specr)和卡那霉素抗性基因 (nptii)。
[0060]
图23:spβc2 rec

rdf融合蛋白介导attl/attr重组,活化荧光素酶表达。在莴苣叶肉原生质体中,特异性地在用切除报告载体 spβc2 rec

rdf融合蛋白表达载体共转染后检测到荧光素酶表达。
[0061]
图24:spβc2 rec

rdf介导的载体切除的pcr确认。从转染的原生质体中分离出总基因组dna,并用两组不同的引物进行查询,其中全长切除报告载体或切除的环形产物的预期大小如图a所示。图b显示了切除报告载体图,并在环形载体图谱外侧用箭头显示了大致引物位置。图c显示了仅在切除报告载体 spβc2 rec

rdf融合表达载体共转染后观察到具有预期切除产物扩增子的pcr结果。
[0062]
图25:spβc2 rec

rdf介导的载体切除和典型attp/b产生的序列确认。 attl/attr切除报告载体和rec

rdf表达载体共转染后获得的切除特异性扩增子的 sanger测序。图a显示了新形成的attp位点,侧接cmylcv启动子和荧光素酶 orf。图b显示了主链小质粒内新形成的attb位点。图c

f显示了典型spβc2 attp、 attb、attl和attr位点(改造自abe等(2014)plos genetics,10(10),e1004636)。
[0063]
图26:基因开关控制的spβc2 rec

rdf配体诱导型载体图谱。spβc2 rec

rdf融合orf和配体反应性蜕皮激素受体(cfecrvy)和rxr

edll结构域一起被克隆到具有gal4

dna结合位点(fs

gal4

dbs)的经修饰的基因开关启动子下游。
[0064]
图27.spβc2 rec

rdf在莴苣和鳄梨原生质体中的配体诱导型表达。切除报告载体
与35s

rec、35s

rec

rdf或基因开关rec

rdf共转染到wt莴苣或鳄梨原生质体中,并且每种处理都与或不与甲氧虫酰肼(mtf)孵育。在莴苣中,转染后3天,荧光素酶试验显示在mtf存在下基因开关的诱导为4

5倍,而在配体存在下所有其他处理没有变化或显示荧光素酶活性降低(图a)。在鳄梨中,与不含配体的对照处理相比,mtf存在下基因开关

rec

rdf诱导约为10倍(图b)。
[0065]
图28:attp

gfp

nptii整合载体加spβc2表达载体轰击3周后gfp荧光体细胞胚的形成。诱导轰击的玉米胚经历体细胞胚胎发生。最上图显示了在亮视野下观察到的轰击后三周的胚胎。当在gfp滤光片下观察时,在轰击后3周,gfp 荧光区清晰可见(底部图,如箭头所示)。
[0066]
图29:选择再生的玉米事件的pcr预筛选的例子。在选择条件下诱导推定的转化体细胞胚萌发,并收获营养组织进行gdna分离。用pcr对所有萌发事件进行预筛选,以鉴定gfp和nptii表达盒稳定转化的事件。箭头表示为向前推进用于基因组步移分析(genome walker analysis)的事件。
[0067]
图30:gdna::attp载体连接的直接pcr扩增及序列验证。图a是示意图,其显示了连接特异性pcr扩增的引物设计。图b显示了pcr结果,其显示了转基因::gdna连接的事件特异性扩增。attr列出的两条带是来自同一胚胎的姐妹事件。图c显示了来自(从上到下)wt基因组参比序列、wt扩增的序列、attp 载体序列、连接特异性pcr扩增子和基因组步移试验(genome walker assay)的序列。图d显示了玉米attr整合的假位点序列,其中连接位点用下划线和粗体表示。
[0068]
图31:从1周龄黄化水稻幼苗中分离原生质体,并用35s

gfp

nos质粒转染。转染后16小时,在亮视野(左)或在蓝光下用gfp滤光片(右)下可视化原生质体。
[0069]
图32:从pacbio扩增子读数鉴定attr连接。图a显示装配到完整 spβc2 attp位点的pacbio ccs序列读数参照。加框读数表示attp位点内推定的 gdna连接。图b显示了针对水稻基因组进行blast搜索并与基因组序列(顶部) 和spβc2 attp整合载体(底部)比对的选定扩增子读数。图c显示了水稻spβc2 假位点(连接位置用粗体和下划线标记)。
[0070]
图33:水稻、莴苣和本氏烟草中spβc2 attr介导的连接的跨物种比对。 attr介导的水稻、莴苣和本氏烟草转化衍生的多个转基因::gdna连接的比对。在比对的顶部的序列标记表示每个核苷酸位置上存在的序列多样性。第一行对齐的序列显示了典型spβc2 attp位点以供参考。突出显示的核苷酸配对表示典型spβc2 attp重组位点。
[0071]
图34:图a显示了整合到莴苣基因组位点1的sf370 attp载体的示意图。箭头表示用于直接扩增转基因:gdna边界序列的引物。图b显示了两个sf370事件以及未经选择再生的无dna对照的pcr结果。图c显示了预期的扩增子大小,其中灰色字体表示成功扩增。
[0072]
图35:wt莴苣sf370假位点1(顶部)和假位点2(底部)与转基因:gdna序列谱图和典型sf370 attp位点的比对。每个比对上方的箭头表示连接位点。
[0073]
图36:显示了16个玉米匹配的比对。比对下方的“*”符号表示比对每个位置的核苷酸相似性。如果所有核苷酸都相同,则显示10个“*”符号。对于比对中的九个位置,所有核苷酸都是相同的。所有其他位置的比对有较低的核苷酸相似性。
[0074]
图37:显示了43个大豆(glycine max)匹配的比对。比对下方的“*符号表示比对每个位置的核苷酸相似性。”如果所有核苷酸都相同,则显示10个“*”符号。对于比对中的九个
位置,所有核苷酸都是相同的。所有其他位置的比对有较低的核苷酸相似性。
[0075]
图38:pcr筛选策略图,用于识别反向的任何插入物。发明的具体实施方式定义
[0076]
在本公开中,使用了许多术语和缩写。提供了以下定义,并且应该有助于理解本发明的范围和实践。
[0077]
术语“约”通常涵盖所示值上至10%的范围。
[0078]
除非另有规定,否则本文所用的“重组酶”是指能够促进确定位点之间的位点特异性重组的一组酶,其中所述位点在单个dna分子上物理分离或所述位点位于分离的dna分子上。
[0079]
本文特别感兴趣的是“丝氨酸重组酶”家族,其具有特定类型的重组位点和特定作用机制。许多丝氨酸重组酶是已知的,它们沿着系统发育线归类成三个主要家族,称为(a)大丝氨酸重组酶、(b)解离酶/转化酶和(c)is607样(smith&thorpe,同上)。代表性的丝氨酸重组酶包括bxb1、sf370.1、spβc2,a188,tp901

1, tn3,γδ。“丝氨酸重组酶”包括融合蛋白,其包含重组酶和其他元件,其包括核定位信号(nls),用于识别蛋白质或协助纯化的标签,例如流感病毒血凝素(ha)。
[0080]
特别令人感兴趣的是重组酶与nls的融合物,因为nls“标记”通过核运输导入细胞核的蛋白质。nls通常由一个或多个带正电的赖氨酸或精氨酸短序列组成。nls一个家族的共有序列是k

k/r

x

k/r。nls的例子包括sv40大t抗原,核浆蛋白(nucleoplasmin)(avkrpaatkkagqakkkkld(seq id no:16)),egl

13(msrrrkanptklsenakklakeven(seq id no:17)),c

myc (paakrvkld(seq id no:18))和tus蛋白(klkikrpvk(seq id no:19))。
[0081]
如下所示,已经发现“spβc2重组酶”具有一种令人惊讶的能力,其能够促进带有attp的dna位点特异性重组到植物基因组中,而无需添加典型attb位点。“spβc2重组酶“也可被称为yoka,并且可以通过具有seq id no:1的氨基酸序列的蛋白质来举例说明。“spβc2重组酶”还包括含有seq id no:1的融合蛋白和具有与seq id no:1至少95%相同的氨基酸的蛋白质。
[0082]
如本文所用,“spβc2家族重组酶“包括那些与seq id no:1在氨基酸序列上至少60、65、70、75、80、85、90或95%相同的重组酶。它还可以包括至少75%、 80%、85%、90%或95%类似于seq id no:1的那些。表1中列出了具有高度序列相同性和/或相似性的重组酶。在c端部分观察到大多数序列变化。表1:选择与spβc2具有序列相同性和相似性的蛋白质
[0083]
丝氨酸重组酶需要一对“重组附接位点”,它们是由重组酶识别和作用的特异性多核苷酸序列。这些可以通称为“att位点”或“att”。丝氨酸重组酶最初由噬菌体编码并进化为将噬菌体基因组整合到细菌染色体中,并需要“attp”位点(最初来自噬菌体)和第二“attb”位点(来自细菌宿主染色体)。attp和attb位点不同源。 attp和attb之间的重组修饰位点并产生attl(左)和attr(右),其不能被丝氨酸重组酶单独切除,需要额外的重组定向性因子(rdf)(smith&thorpe综述,分子微生物学(2002),44,299

307)。
[0084]
不仅attb和attp位点不同,而且attp和attb位点对每个丝氨酸重组酶具有相对特异性,是丝氨酸重组酶或密切相关的丝氨酸重组酶的底物。因此,att位点也可由作用于其上的丝氨酸重组酶来表示。例如,spβc2识别并重组“spβc2 attp”和“spβc2 attb”。
[0085]
在结构上,重组位点通常包括由核心区或间隔子区域分隔的左右臂。因此,attb重组位点由bob

组成,其中b和b

分别是左右臂,o是核心区。类似地, attp是pop

,其中p和p

是臂,o是核心区域。在attb和attp位点之间重组,并伴随着靶标处核酸整合后,整合的dna两侧的重组位点称为“attl”和“attr”。因此,使用上述术语,attl和attr位点分别由bop'和pob'组成。在本文的一些代表中,省略“o”,并且例如,将attb和attp分别命名为bb

和pp


[0086]“假附接位点”是这样的位点,其一个不符合典型附接位点序列,但可以作为重组位点,通常频率较低或在特定情况下。例如,“假attb”可以与attp重组;假 attp可与attb重组;但频率低于attp/attb重组。
[0087]“靶att位点”是将与关联att位点重组的位点。例如,attb是attp的靶标, attp是attb的靶标。
[0088]
如本文所用,“关联”涉及丝氨酸重组酶识别特定attp位点和attb位点并介导重组的能力。有成千上万个可能的attp和attb位点(和假位点),但是,对于任何给定的attp位点和给定的丝氨酸重组酶,数量非常有限的attb位点将重组。如果这些attb位点重组,则它们与attp位点“关联”。同样,丝氨酸重组酶与attp 和attb对关联。同源和非同源att位点的使
是已经通过转化方法引入基因组的基因。
[0098]“异源”dna指非天然位于细胞中或细胞的染色体位点中的dna。优选异源dna包括对细胞而言外来的基因。
[0099]
术语“基因组”包括染色体以及线粒体、叶绿体和病毒dna或rna。
[0100]
当核酸分子的单链形式可以在适当的温度和溶液离子强度条件下与其他核酸分子退火时,核酸分子与另一个核酸分子(如cdna、基因组dna或rna) 是“可杂交的”,(参见sambrook(见“分子克隆:实验室手册”,第二版,由sambrook、 fritsch和manatis编辑,冷泉港实验室,(1989))。杂交和洗涤条件在sambrook 等(1989年)中是众所周知的并举例说明,特别是在其中的第11章和表11.1(通过引用完全纳入本文中)。温度和离子强度的条件决定了杂交的“严格性”。
[0101]“引物”是与靶核酸序列杂交以产生双链核酸区域的寡核苷酸,所述双链核酸区域在合适的条件下可以用作dna合成的起始点。这种引物可用于聚合酶链反应。
[0102]“聚合酶链式反应”是pcr的缩写,意指是酶促扩增特定核酸序列的体外方法,并且涉及变性、退火和延伸的重复循环。
[0103]
dna“编码序列”是这样的双链dna序列,其在适当的调控序列控制下时转录并翻译成多肽。“合适的调控序列”指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列)的核苷酸序列,并且其影响相关联的编码序列的转录、 rna加工或稳定性,或者翻译。调控序列可以包括启动子,翻译前导序列,内含子,聚腺苷酸化识别序列,rna加工位点,效应物结合位点和茎

环结构。编码序列的边界由5'(氨基)末端的起始密码子和3'(羧基)末端的翻译终止密码子确定。编码序列可以包括但不限于:原核序列,来自mrna的cdna,基因组dna序列,甚至是合成dna序列。如果旨在使编码序列在真核细胞中表达,那么聚腺苷酸化信号和转录终止序列将通常位于该编码序列的3'端。
[0104]“开放阅读框”缩写为orf并且意指这样的核酸序列(dna、cdna或 rna)长度,其包含翻译起始信号或起始密码子(如atg或aug)和终止密码子,并且可以潜在地翻译成多肽序列。
[0105]
术语“下游”指位于参比核苷酸序列3'的核苷酸序列。具体地,下游核苷酸序列通常涉及转录起始点后的序列。例如,基因的翻译起始密码子位于转录起始位点的下游。术语“上游”指位于参比核苷酸序列5'的核苷酸序列。具体地,上游核苷酸序列通常涉及位于转录起始点或编码序列5'侧的序列。例如,大多数启动子位于转录起始位点的上游。
[0106]
术语“限制性核酸内切酶”和“限制性酶”指在双链dna内的特定核苷酸序列内结合和切割的酶。
[0107]“同源重组”是指将外来dna序列插入到与之具有显著的序列同源性区段的另一dna分子中。该过程由例如细菌中的reca和真核生物中的rad51介导。更长的同源性区域和更大程度的序列相似性可以增加同源重组的效率。
[0108]
本领域已知的几种方法可用于增殖根据本发明的多核苷酸。一旦建立了合适的宿主系统和生长条件,就可以大量增殖和制备重组表达载体。
[0109]“载体”是用于将核酸克隆和/或转移到宿主细胞中的任何手段。载体可以是复制子,另一个dna区段可以与其连接,从而导致连接的区段复制。“复制子”是在体内充当dna复制自主单位(即能够在其自身的控制下复制)的任何遗传元件 (例如,质粒、噬菌体、粘粒、
染色体、病毒)。术语“载体”包括用于将核酸分子体外、体内或离体引入细胞中的病毒和非病毒手段。本领域已知多种载体可以用于操纵核酸,将反应元件和启动子纳入基因等。可能的载体包括例如质粒或修饰的病毒,包括例如,噬菌体例如λ衍生物,或者质粒,如pbr322或puc质粒衍生物,或者bluescript载体。例如,可以通过将适当的dna片段连接到选定的具有互补的粘性末端的的载体中来实现将对应于反应元件和启动子的dna片段插入适当的载体中。或者,可以通过酶促修饰dna分子的末端,或者可以通过将核苷酸序列 (接头)连接到dna末端来产生任何位点。这类载体可以经工程改造以包含选择性标志物基因,所述选择性标志物基因提供对于标志物已纳入细胞基因组中的细胞的选择。这类标志物允许鉴定和/或选择纳入并表达由标志物编码的蛋白质的宿主细胞。
[0110]
术语“质粒”指染色体外元件,其通常携带不属于部分细胞中心代谢的基因,并且通常处于环状双链dna分子的形式。
[0111]“克隆载体”是“复制子”,其是单位长度的核酸,优选dna,其将依次复制并包含复制起点,如质粒、噬菌体或粘粒,其可以连接另一个核酸区段,从而引起所连接的区段的复制。克隆载体可以能够在一种细胞类型中复制并在另一种细胞类型中表达(“穿梭载体”)。
[0112]
dna可通过本领域已知的方法引入所需细胞。例如农杆菌 (agrobacterium)介导的ti转移;聚乙二醇介导转染;电穿孔;还有基因枪。
[0113]
术语“转染”指通过细胞摄取外源或异源rna或dna。当这类rna或 dna已被引入细胞内部时,视细胞为已经外源或异源rna或dna“转染”。术语“共转染”指用一种以上的异源rna或dna转染的细胞。
[0114]
术语“遗传区域”将指包含编码多肽的基因的核酸分子或核苷酸序列的区域。
[0115]
此外,包含根据本发明的多核苷酸的重组载体可以包括在其中需要其扩增或表达的细胞宿主中的一个或多个复制起点、标志物或选择性标志物。
[0116]
术语“报告基因”指编码识别因子的核酸,所述识别因子能够基于报告基因的作用而被识别,其中所述作用用于追踪感兴趣的核酸的遗传,以鉴定遗传了感兴趣的核酸的细胞或生物体,和/或以测量基因表达诱导或转录。本领域已知和使用的报告基因的示例包括:荧光素酶(luc),绿色荧光蛋白(gfp),红色荧光蛋白(rfp),氯霉素乙酰基转移酶(cat),β

半乳糖苷酶(lacz),β

葡萄糖醛酸酶(gus)等。报告基因的一类是选择性标志物。
[0117]
术语”选择性标志物”指能够基于标志物基因的作用(即对抗生素的抗性,对除草剂的抗性,比色标志物,酶,荧光标志物等)进行选择的识别因子,通常是抗生素或化学抗性基因,其中所述作用用于追踪感兴趣的核酸的遗传和/或鉴定已经遗传感兴趣的核酸的细胞或生物。本领域已知和使用的选择性标志物的示例包括:提供对氨苄青霉素,链霉素,庆大霉素,卡那霉素,潮霉素,双丙氨磷除草剂,磺酰胺等的抗性的基因;以及用作表型标志物的基因,即花青素调控基因,异戊烷酰基转移酶基因等。
[0118]
另一种选择性标志物是营养缺陷型标志物,它允许细胞在缺乏必需成分的培养基中生长时合成必需成分(如氨基酸)。
[0119]“启动子”是指能够控制编码序列或功能性rna表达的dna序列。通常,启动子序列通常位于编码序列的5'。“启动子序列”是这样的dna调控区域,其能够结合细胞中的rna聚合酶并启动下游(3

方向)编码序列的转录。出于限定本发明的目的,启动子序列在其3'末端与转录起始位点结合,并向上游(5'方向)延伸,以包括在高于背景的可检测水平启动转
录所必需的最小数目的碱基或元件。在启动子序列内将发现转录起始位点(例如,通过用核酸酶si映射来方便地界定) 以及负责rna聚合酶结合的蛋白质结合结构域(共有序列)。
[0120]
启动子可以整体衍生自天然基因,或者包含衍生自天然存在的不同启动子的不同元件,或甚至包含合成的dna区段。不同的启动子可以指导基因在不同的组织或细胞类型中,或在不同的发育阶段,或响应在不同的环境或生理条件中表达。导致基因在大多数时间在大多数细胞类型中表达的启动子通常被称为“组成型启动子”。导致基因在特定细胞类型中表达的启动子通常被称为“细胞特异性启动子”或“组织特异性启动子”。导致基因在发育或细胞分化的特定阶段表达的启动子通常被称为“发育特异性启动子”或“细胞分化特异性启动子”。这样的启动子通常被称为“诱导型启动子”或“可调节启动子”,所述启动子在用试剂、生物分子、化学制品、配体、光或诱导启动子的其他物质对细胞进行暴露或处理后将被诱导并导致基因表达。进一步认识到,由于在大多数情况下调控序列的确切边界尚未完全确定,因此不同长度的dna片段可具有相同的启动子活性。
[0121]
当rna聚合酶将编码序列转录成mrna,然后将其反式剪接(如果编码序列包含内含子)并翻译成由所述编码序列编码的蛋白质时,所述编码序列“受控于”细胞中的转录和翻译控制序列。
[0122]“转录和翻译控制序列”是提供用于宿主细胞中编码序列表达的dna调控序列,如启动子、增强子、终止子等。在真核细胞中,聚腺苷酸化信号是控制序列。
[0123]
术语“操作性地连接”指单个核酸片段上的核酸序列的联合,从而使一个的功能被另一个所影响。例如,当启动子能够影响编码序列的表达时(即,编码序列在启动子的转录控制下),启动子与该编码序列操作性地连接。编码序列可以以正义或反义方向与调控序列操作性地连接。
[0124]
本文所用术语“表达”指源自核酸或多核苷酸的正义(mrna)或反义rna 的转录和稳定积累。表达还可以指将mrna翻译成蛋白质或多肽。
[0125]
术语“盒”、“表达盒”和“基因表达盒”指这样的dna区段,其可以在特定限制性位点或通过同源重组插入核酸或多核苷酸中。dna的区段包含编码感兴趣的多肽的多核苷酸,并且设计盒和限制性位点,以确保将盒插入适当阅读框中,用于进行转录和翻译。“转化盒”指这样的特定载体,其包含编码感兴趣的多肽的多核苷酸并且除了促进特定宿主细胞转化的多核苷酸之外还具有元件。本发明的盒、表达盒、基因表达盒和转化盒还可以包含允许增强宿主细胞中编码感兴趣的多肽的多核苷酸表达的元件。这些元件包括但不限于:启动子、最小启动子、增强子、反应元件、终止子序列、聚腺苷酸化序列等。
[0126]
术语“调节”和“调控”指诱导、减少或抑制核酸或基因表达,从而分别导致诱导、减少或抑制蛋白质或多肽产生。
[0127]
根据本发明的质粒或载体可以还包含适用于驱动宿主细胞中基因表达的至少一个启动子。术语“表达载体”指设计成能够在转化入宿主后表达插入的核酸序列的载体、质粒或载剂。通常将克隆的基因,即插入的核酸序列置于控制元件如启动子、最小启动子、增强子等的控制下。能够用于驱动所需宿主细胞中核酸表达的起始控制区或启动子众多并为本领域技术人员所熟知。实际上,任何能够驱动这些基因的启动子都适用于本发明。花椰菜花叶病毒(camv)35s和opine启动子(包括胭脂碱合酶(nos)、章鱼碱合酶(oct)和甘露碱合酶(mas))来源于植物病原体并且可用于多种物种。在单子叶植物中,泛素(ubi)、水稻肌动
蛋白1(act

1) 和玉米醇脱氢酶1(adh

1)是最常用的。
[0128]
另外,这些表达序列可以通过添加增强子或调控序列等来修饰。
[0129]
可以用于本发明实施方式的增强子包括玉米(zea mays)booster1基因的 hepta重复序列、拟南芥(arabidopsis thaliana)开花基因座(ft)的c区块,拟南芥(arabidopsis thaliana)的侧抑制子(las)的c区域,豌豆(pisum sativum)p268pete,玉米(zea mays)pi

rr远端增强子,玉米(zea mays)营养体到生殖体1,豌豆 (pisum sativum)ab80增强子或豌豆(pisum sativum)增强子样元件。
[0130]
终止控制区域,即终止子或聚腺苷酸化序列,也可以衍生自原始来自优选宿主的多种基因。在本发明的优选实施方式中,终止控制区可衍生自nos、 af3r、35s和泛素基因。
[0131]
术语“3'非编码序列”或“3'非翻译区(utr)”指位于编码序列下游(3')的 dna序列,并且可以包含聚腺苷酸化[多聚(a)]识别序列以及编码能够影响mrna 加工或基因表达的调节信号的其他序列。聚腺苷酸化信号的特征通常在于影响向 mrna前体的3'末端添加聚腺苷酸片段。
[0132]“调控区”指调控第二核酸序列表达的核酸序列。调控区可以包括天然负责表达特定核酸的序列(同源区),或者可以包括负责表达不同蛋白质或甚至合成蛋白的不同来源的序列(异源区)。具体地,序列可以是原核、真核或病毒基因的序列或衍生序列,其以特异性或非特异性的方式并以可诱导或不可诱导的方式刺激或抑制基因的转录。调控区包括复制起点,rna剪接位点,启动子,增强子,转录终止序列和指导多肽进入靶细胞分泌途径的信号序列。
[0133]
来自“异源来源”的调控区指与所表达的核酸天然不相关联的调控区。在异源调控区中包括来自不同物种的调控区,来自不同基因的调控区,杂合调控序列以及天然不存在但由本领域普通技术人员设计的调控序列。
[0134]“rna转录本”指由rna聚合酶催化的dna序列转录产生的产物。当 rna转录本是dna序列的完美互补拷贝时,其被称为初级转录本,或者其可以是衍生自初级转录本转录后加工的rna序列,并被称为成熟rna。“信使rna (mrna)”指没有内含子且可以被细胞翻译成蛋白质的rna。“cdna”指与mrna 互补并衍生自mrna的双链dna。“正义”rna指这样的rna转录本,其包括 mrna并因此可以被细胞翻译成蛋白质。反义“rna”指与靶初级转录本或mrna 完全或部分互补并阻断靶标基因表达的rna转录本。反义rna的互补性可以与特定基因转录本的任何部分互补,即5'非编码序列、3'非编码序列或编码序列处。“功能性rna”指反义rna,核酶rna或尚未翻译但仍对细胞过程有影响的其他 rna。
[0135]“多肽”是由共价连接的氨基酸残基组成的聚合化合物。“蛋白质”是在活细胞中起结构或功能作用的多肽。“分离的多肽”或“分离的蛋白质”指这样的多肽或蛋白质,其基本上不含在天然状态下通常与之相关联的那些化合物(例如,其他蛋白质或多肽、核酸、碳水化合物、脂质)。“分离的”并不意指排除与其他化合物的人工或合成混合物,或者存在不干扰生物活性的杂质,并且其可能是由于,例如,纯化不完全、添加稳定剂或混入药学上可接受的制剂而存在。
[0136]
多肽或蛋白质的“变体”是衍生自多肽或蛋白质并且保留了多肽或蛋白质的至少一种生物学特性的任何类似物、片段、衍生物或突变体。多肽或蛋白质的不同变体可以自然存在。这些变体可以是等位基因变异,其特征在于编码蛋白质的结构基因的核苷酸序列中
的差异,或者可以涉及差异性剪接或翻译后修饰。本领域技术人员可以产生具有单个或多个氨基酸取代、缺失、添加或替代的变体。这些变体可以包括,尤其是:(a)其中一个或多个氨基酸残基被保守或非保守氨基酸取代的变体,(b)其中一个或多个氨基酸被添加至多肽或蛋白质的变体,(c)其中一个或多个氨基酸包括取代基的变体,和(d)其中多肽或蛋白质与另一种多肽如血清白蛋白融合的变体。本领域普通技术人员已知获得这些变体的技术,包括遗传(抑制、缺失、突变等)、化学和酶促技术。
[0137]“异源蛋白质”是指细胞中不天然产生的蛋白质。
[0138]“成熟蛋白”是指翻译后加工的多肽;即在初级翻译产物中存在的任何前体肽(prepeptide)或前肽(propeptide)被移除的一种。“前体”蛋白指mrna翻译的初级产物;即前体肽和前肽仍然存在。前体肽和前肽可能是但不限于胞内定位信号。
[0139]
术语“信号肽”是指在分泌的成熟蛋白质之前的氨基末端多肽。信号肽是从成熟蛋白中切割出来的,因此不存在于成熟蛋白中。信号肽具有跨细胞膜定相和转运分泌蛋白的功能。信号肽又称为信号蛋白。
[0140]
在将表达于细胞表面的蛋白质的编码序列的开始处包括“信号序列”。该序列编码信号肽,n端到成熟的多肽,引导宿主细胞使多肽易位。这里使用术语“易位信号序列”来指代这种信号序列。易位信号序列与真核生物和原核生物的多种蛋白质有关,通常在这两种生物中都有功能。
[0141]
两种多肽序列的相同性百分数和相似性百分数的概念是本领域众所周知的。例如,三个氨基酸位置(例如,在位置1、3和5处)不同的长度为10个氨基酸的两种多肽被称为具有70%的相同性百分比。然而,如果例如在位置5处,氨基酸部分虽然不相同但“相似”(即,具有相似生化特性的保守氨基酸取代物),则相同的两种多肽将被认为具有80%的相似性百分比。许多用于分析核苷酸或氨基酸序列相似性的程序,例如fast和blast,将匹配区域的相同性百分比具体列为输出参数。
[0142]
两条多肽的“相似性%”指通过使用bestfit程序(威斯康星序列分析软件包 (wisconsin sequence analysis package),unix版本8,遗传学计算机组,universityresearch park,575science drive,威斯康星州麦迪逊.53711)以及用于确定相似性的默认设置比较两条多肽的氨基酸序列产生的相似性评分。bestfit利用smith和 waterman的局部同源性算法(advances in applied mathematics 2:482

489,1981),以找到两条序列之间的最佳相似性区段。
[0143]
如本文所用,术语“同源”的其所有语法形式和拼写变形指具有“共同进化起源”的蛋白质之间的关系,包括来自超家族的蛋白质(例如,免疫球蛋白超家族)和来自不同物种的同源性蛋白(例如,肌球蛋白轻链等)(reeck等,cell 50:667(1987))。同源蛋白通常具有较高的序列相同性和相似性。同源dna序列通常具有高度相同性,变异最常见于冗余密码子。
[0144]
此外,本领域技术人员认识到,本发明所涵盖的基本相似的序列也由它们在严格条件(0.1
×
ssc,0.1%sds,65℃,然后用2
×
ssc,0.1%sds洗涤,再用0.1xssc,0.1%sds洗涤)下与本文所例举的序列杂交的能力确定。本发明的基本相似的核酸片段是其dna序列与本文报告的核酸片段的dna序列至少70%相同的那些核酸片段。本发明优选的基本相似的核酸片段是其dna序列与本文报告的核酸片段的dna序列至少80%相同的那些核酸片段。更
优选的核酸片段与本文报告的核酸片段的dna序列至少90%相同。甚至更优选的核酸片段与本文报告的核酸片段的dna序列至少95%相同。
[0145]
本文所用术语对应于“/与
……
对应”指相似或同源序列,无论确切位置与测量相似性或同源性的分子是相同的还是不同的。核酸或氨基酸序列比对可以包括空格。因此,术语对应于“/与
……
对应指序列相似性,而不是氨基酸残基或核苷酸碱基的编号。”[0146]“大部分”氨基酸或核苷酸序列包含足够的多肽的氨基酸序列或基因的核苷酸序列,以推定地鉴定该多肽或基因,这可以通过本领域技术人员对序列的手动评估来进行,或通过使用算法诸如blast(basic local alignment search tool; altschul等,j.mol.biol.215:403(1993);另见ncbi.nlm.nih.gov/blast/)的计算机自动序列比较和鉴定。通常,需要10个或更多个连续氨基酸或者30个或更多个核苷酸的序列,以便推定地鉴定与已知的蛋白质或基因同源的多肽或核酸序列。此外,就核苷酸序列而言,包含20

30个连续核苷酸的基因特异性寡核苷酸探针可以用于基因鉴定(例如southern杂交)和分离(例如细菌菌落或噬菌斑的原位杂交)的序列依赖性方法。此外,可以将12

15个碱基的短寡核苷酸用作pcr中的扩增引物,以获得包含引物的特定核酸片段。因此,“大部分”核苷酸序列包含足够的序列,以特异性地鉴定和/或分离包含该序列的核酸片段。
[0147]
本领域所知的“百分比相同性”是通过比较序列确定的两个或多个多肽序列或两个或多个多核苷酸序列之间的关系。在本领域中,“相同性”还表示多肽或多核苷酸序列之间的序列相关性程度,视情况而定,这取决于这类序列串之间的匹配。“相同性”和“相似性”可以通过已知的方法容易地计算,包括但不限于《计算机分子生物学》(computational molecular biology)(lesk,a.m.,等),牛津大学出版社 (oxford university press),纽约,(1988);《生物运算:信息学和基因组工程》 (biocomputing:informatics and genome projects)(smith,d.w.编著),学术出版社 (academic press),纽约,(1993);《序列数据的计算机分析》(computer analysisof sequence data),第i部分(griffin,a.m.和griffin,h.g.编著),胡马纳出版社(humana press),新泽西州,(1994);《分子生物学的序列分析》(sequence analysisin molecular biology),(von heine,g.编著),学术出版社,(1987);和《序列分析引物》(sequence analysis primer)(gribskov,m.和devereux),j.编著,m斯托克顿出版社(m stockton press),纽约,(1991)中所述的那些。确定相同性的优选方法旨在为经测试的序列之间给出最佳匹配。鉴定相同性和相似性的方法已编入可公开获得的计算机程序中。可以使用lasergene生物信息学计算套件(dnastar有限公司(dnastar inc.),威斯康辛州麦迪逊)的megaalign程序软件进行序列比对和相同性百分比计算。可以使用具有默认参数(缺口罚分(gap penalty)= 10,缺口长度罚分(gap length penalty)=10)的clustal比对方法(higgins 和sharp(1989),cabios.5:151

153)进行序列的多重比对。使用clustal方法的成对比对的默认参数可以选为:ktuple 1,缺口罚分=3,窗口(window)=5和 diagonals saved=5。
[0148]
术语“序列分析软件”是指用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。“序列分析软件”可以是市售可及的或独立开发的。典型的序列分析软件包括但不限于gcg程序套件(威斯康星州软件包9.0版,遗传学计算机组 (gcg),威斯康星州麦迪逊),blastp,blastn,blastx(altschul等,j. mol.biol.215:403

410(1990)和dnastar(dnastar有限公司.1228s.park st. 威斯康辛州麦迪逊.53715usa)。在本技术的文本中,
应理解的是,除非另有规定,否则在使用序列分析软件进行分析的情况下,分析的结果将基于所引用程序的“默认值”。本文使用的“默认值”指第一次初始化时软件原始加载的任何值或参数集。
[0149]“合成基因”可由使用本领域技术人员已知的方法化学合成的寡核苷酸构建块组装而成。这些构建块经连接和退火,形成基因取代,然后将其酶促组装以构建整个基因。与dna序列相关的“化学合成”意味着组成核苷酸是在体外组装的。 dna的人工化学合成可以使用已经建立的方法来完成,或者可以使用许多可商购机器中的一种来执行自动化学合成。因此,基于核苷酸序列的优化,可以定制基因以获得最佳的基因表达来反映宿主细胞的密码子偏好。如果密码子的使用偏向于宿主所偏爱的那些密码子,则熟练的技术人员理解成功基因表达的可能性。优选密码子的确定可以基于对来自宿主细胞的基因的调查,其中序列信息是可得的。
[0150]“sf370重组酶”是指化脓性链球菌(streptococcus pyogenes)噬菌体370.1大丝氨酸重组酶(例如,以登录id:wp_010922052.1提供的)。将dna引入植物基因组的组合物和方法
[0151]
将dna导入植物基因组的主要方法是利用农杆菌(agrobacterium)。然而,使用农杆菌系统有许多缺点。首先,农杆菌介导的基因转移伴随着被转移dna 末端的缺失,缺失的大小和几率随着被转移dna的大小而增加,实际上限在25kb 左右。其次,农杆菌介导的转移导致转基因在基因组的不同位置随机整合。结果,通常有必要对100

1000个转基因事件进行筛选,以鉴定插入了整个外来dna区段并位于基因组中合适位置的那些转基因事件。这一要求增加了构建转基因植物的时间和金钱。最后,农杆菌法不会将下一个转基因重新定向到同一基因座。
[0152]
与农杆菌相比,丝氨酸重组酶具有优势。整合dna大区段的能力仅受到将dna转移到细胞中的能力的限制。整合由att位点匹配的存在控制,因此只发生在具有预先存在的att位点的位置。最后,如果整合到染色体中的外来dna携带另一个不同的att位点,就有可能将更多的dna添加到同一基因座。
[0153]
迄今,丝氨酸重组酶介导整合到植物是不可能的,因为植物染色体中缺少合适的att位点。因此,能够在植物上进行丝氨酸重组酶介导的转化之前,必须首先对植物进行工程改造,以在染色体上添加合适的att位点。
[0154]
这一额外步骤的要求不仅成本高且耗时长,而且在不同背景的筛查中尤其成问题。例如,在同一物种的不同品种之间,给定的转基因在植物中的作用可能不同。如果每个品种必须进行两次工程改造(一次添加att位点,另一次添加转基因),则很难筛选多个品种。
[0155]
本发明提供用于将dna纳入植物的组合物和方法,其克服了农杆菌介导的修饰和先前丝氨酸重组酶方法的问题。申请者发现带有att位点尤其是spβc2 attp 位点的dna,能够在spβc2重组酶存在的情况下纳入植物。本公开还证明sf370 丝氨酸重组酶能够将dna整合到植物细胞中,其中待纳入的dna包括sf370 attp 位点。本公开有助于将外源dna大区段简单地一步引入一个或有限数量的位点。插入大小为最高达20kb、高达30kb、高达40kb、高达50kb、高达75kb、高达100kb和高达150kb。该方法的简单性使得筛选多个品种来鉴定与外源dna有惊人相互作用的那些品种成为可能。
[0156]
此外,丝氨酸重组酶(如spβc2和sf370)在重组酶介导的整合中的使用是单向的,催化两个互补重组位点之间的重组,但不能催化由这种重组形成的杂交位点之间的重组。由于本发明方法中使用的重组酶不能催化逆向反应,因此整合是稳定的。例如,这些方法对于获得存在于质粒上的转基因真核染色体的稳定整合是有用的。反应的单向性比酪氨酸重组酶(如cre

lox或flp

frt系统)更有利。
[0157]
此外,还可以通过添加重组酶和同等特异性重组定向性因子(rdf)来特异性去除外源dna。重组酶和rdf的表达可能导致整个外源dna或部分外源 dna的特异性无痕切除,这取决于attl/attr位点在外源dna中的位置。在一个实施方式中,一个重组酶变体可用于在假attb位点将attp载体整合到植物基因组中,而不同的重组酶及其关联rdf变体可用于通过人工attl和attr位点切除部分转基因盒(例如选择性标志物),这些位点被工程改造入载体,侧接丝氨酸重组酶 /关联rdf对识别的待切除部分。例如,除spβc2以外的丝氨酸重组酶可用于将基因构建物整合到细胞基因组中。例如,在转基因事件再生后,可通过spβc2丝氨酸重组酶及其关联rdf(作用于侧接选择性标志物的attr和attl位点)的共表达去除选择性标志物。这些策略也可以与其他基本转化策略兼容,例如农杆菌转化或粒子轰击。移除选择性标志物将允许使用相同的选择性标志物来进一步操作细胞,而在不移除选择性标志物的情况下,将需要不同的选择性标志物来进一步操作。
[0158]
在一实施方式中,本发明提供将外源dna可逆引入植物细胞基因组的方法,包括:在细胞中引入:(a)包含感兴趣的多核苷酸序列和attp和/或attb位点的外源dna;(b)编码丝氨酸重组酶的多核苷酸,其操作性地连接到植物中具有活性的启动子;和(c)编码丝氨酸重组酶的关联重组酶定向性因子(rdf)的多核苷酸,其操作性地连接到植物中具有活性的诱导型启动子或基因开关。序列可以存在于一个多核苷酸构建物或两个或更多个多核苷酸构建物上。当表达时,丝氨酸重组酶指导外源dna引入植物细胞基因组。当rdf被诱导(或者开关被“打开”) 时,丝氨酸重组酶和rdf的组合从植物细胞中切除外源dna。
[0159]
在一些实施方式中,丝氨酸重组酶蛋白质可代替编码丝氨酸重组酶的多核苷酸被共同引入细胞中。
[0160]
本方法的多核苷酸可通过本领域已知的任何方法引入,例如但不限于农杆菌法、丝氨酸重组酶法、电穿孔、核糖核苷酸蛋白质(rnp)法或生物弹射法。
[0161]
在一些实施方式中,诱导型启动子被温度、干旱、铜、发育过程或化学配体活化。
[0162]
在一些实施例中,丝氨酸重组酶是spβc2。在一些实施方式中,当丝氨酸重组酶是spβc2,rdf可具有包含seq id no:31的氨基酸序列。
[0163]
感兴趣的多核苷酸序列可以是任何感兴趣的序列,例如编码多核苷酸的序列,例如dsrna、反义rna、人工mirna或向导rna(grna),或者编码蛋白质的序列包括选择性标志物的编码序列、基因编辑核酸酶、在植物中表达的蛋白质的编码序列中的至少一种。例如,grna和基因编辑核酸酶的表达可用于编辑植物基因组。例如,感兴趣蛋白质的表达可以赋予植物在转化前没有的表型特征。
[0164]
本发明的方法涉及将真核细胞中存在的一对重组附接位点attb和attp(或 att假位点)与相应的重组酶接触。重组酶随后介导重组附接位点之间的重组。根据重组附接位点的相对位置,许多事件中的任何一个都可以作为重组的结果发生。例如,如果重组附接位点存在于不同的核酸分子上,则重组可导致一个核酸分子整合到第二个分子中。因此,可以将
包含一个重组位点的质粒整合到包含相应重组位点的真核细胞染色体中。重组附接位点也可以存在于同一核酸分子上。在这种情况下,生成的产物通常取决于附接位点的相对方向。例如,平行或直接朝向的位点之间的重组通常会导致位于重组附接位点之间的任何dna被切除。相反,反向的附接位点之间的重组可以导致间插dna的反转。同样,由此产生的重排核酸是稳定的,因为在没有通常由特定噬菌体和/或由重组酶来源的噬菌体的宿主细胞编码的额外因子或因素的情况下,重组是不可逆的,而这种因素或因子通常在真核细胞中不存在。该方法有用的应用的一个实例涉及在重组附接位点之间安置启动子。如果启动子最初与将由启动子表达的编码序列处于相反方向并且侧接启动子的重组位点处于反转方向,则接触重组附接位点将导致启动子反转,从而将启动子置于正确的方向以驱动编码序列的表达。类似地,如果启动子最初处于正确的表达方向并且重组附接位点处于相同的方向,则将重组附接位点与重组酶接触可导致启动子片段的切除,从而停止编码序列的表达。
[0165]
本发明的方法也可用于获得染色体易位。例如,在这些实施方式中,一个重组附接位点被置于一条染色体上,并且可以用作与第一重组附接位点进行重组的底物的第二重组附接位点被置于第二染色体上。当重组附接位点与重组酶接触时,发生重组,导致两条染色体臂的交换。例如,可以构建生物体的两个株系,其中一个株系包括第一重组附接位点,第二株系包括第二重组附接位点。然后将这两个株系杂交,得到包含两个重组附接位点的子代株系。当附接位点与重组酶接触时,发生染色体臂交换。重组酶
[0166]
本发明的实践中使用的重组酶可以在靶向载体引入之前、同时或之后引入靶细胞。重组酶可以直接作为蛋白质引入细胞,例如,使用脂质体、包覆颗粒或微注射。或者,可以使用合适的表达载体将编码重组酶的多核苷酸(dna或信使 rna)引入细胞。上述靶向载体组件可用于构建包含编码感兴趣的重组酶的序列的表达盒。然而,重组酶的表达可通过其它方式调节,例如,通过将重组酶的表达置于可调节启动子(即,其表达可被选择性诱导或抑制的启动子)的控制下,或通过使用基因开关。
[0167]
重组酶多肽和编码本发明重组酶多肽的核酸在实施例中描述,并且可以使用本领域技术人员已知的常规方法获得。
[0168]
spβc2具有氨基酸序列seq id no:1,并且可以由具有seq id no:3的核苷酸15到1649的序列的核苷酸编码。spβc2也可以作为融合蛋白发挥作用,例如与核转移因子和基序融合以促进蛋白质的识别和纯化。合适的spβc2融合蛋白可以具有seq id no:2的氨基酸序列并且由具有seq id no:3的序列的核苷酸编码。seq id no:3还包含sbf1限制性位点(cctgcag)、kozak序列(gccacc)、 ha标签序列(seq id no:34)、nls序列(seq id no:33)和clai限制性站点 (atcgat)。
[0169]
重组酶还可以具有与seq id no:1至少65%、75%、80%、85%、90%95%、 98%或99%相同的氨基酸序列。重组酶还可以具有与seq id no:1至少75%、80%、 85%、90%95%、98%或99%相似的氨基酸序列。
[0170]
重组附接位点包含分离的多核苷酸序列,其包含与seq id no:6或seqid no:7,优选seq id no:7至少90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%或100%相同的核酸。
[0171]
sf370具有seq id no:125的氨基酸序列。该氨基酸序列可由诸如seqid no:126
的核酸序列编码。载体/构建物
[0172]
本文的靶向和效应构建物可包含诸如控制序列、标志物序列、选择序列等的额外核酸片段。
[0173]
一般而言,靶向构建物将具有以下一个或多个特征:启动子、启动子增强序列、选择性标志物序列、复制起始点、诱导型元件序列、表位

标记序列等。
[0174]
启动子和启动子增强子序列是rna聚合酶结合并启动转录的dna序列。启动子通过指定要转录的链来确定转录物的极性。细菌启动子由共有序列组成,相对于转录起始的

35和

10个核苷酸,由特定的sigma因子和rna聚合酶结合。真核启动子更为复杂。在表达载体中使用的大多数启动子是由rna聚合酶ii转录的。一般转录因子(gtfs)首先结合起始点附近的特定序列,然后招募rna聚合酶ii的结合。除了这些最小的启动子元件外,小序列元件还被调节给定启动子活性的模块化dna结合/反式激活蛋白(例如ap

1、sp

1)特异性地识别。病毒启动子与细菌或真核生物启动子具有相同的功能,或者提供反式的特异性rna聚合酶(噬菌体t7),或者招募细胞因子和rna聚合酶(sv40、rsv、cmv)。病毒启动子可能是首选的,因为它们通常是特别强的启动子。
[0175]
此外,启动子可以是组成型的或调节型的(即,诱导型的或抑制型的)。诱导型元件是dna序列元件,其与启动子连接并结合抑制子(如大肠杆菌的 laco/lac iq抑制子系统)或诱导物(如酵母中的gall/gal4诱导物系统)。在任一种情况下,转录被“关闭”,直到启动子被抑制或诱导,此时转录被“开启”。
[0176]
组成型启动子的例子包括35s camv启动子、木薯脉花叶病毒(dcsvmv) 启动子、玄参花叶病毒(dfmv)启动子、紫茉莉(mirabilis)花叶病毒(dmmv) 启动子、花生褪绿条纹病毒(dpclsv)启动子、u6启动子、19s启动子、nos 启动子、adh启动子、蔗糖合酶启动子,r复合物启动子、叶绿素a/b结合蛋白启动子和肌动蛋白启动子。选择用于本发明的示例性启动子,使得它们在被引入的细胞类型(和/或动物或植物)中具有功能。
[0177]
因为靶向质粒在植物中是不可复制的,所以复制靶向dna的唯一方法就是将其纳入植物基因组中。“报告物”是一种元件,其提供了一种手段,以确定转染细胞和靶向质粒已插入的那些细胞。术语“报告基因”指编码识别因子的核酸,所述识别因子能够基于报告基因的作用而被识别,其中所述作用用于追踪感兴趣的核酸的遗传,以鉴定遗传了感兴趣的核酸的细胞或生物体,和/或以测量基因表达诱导或转录。本领域技术人员可根据其在感兴趣系统中的相对优点来选择报告基因。例如,荧光蛋白如gfp和rfp可以很容易地用荧光检测,但可能干扰正常的代谢功能。β

葡糖醛酸酶(gus)非常灵敏,但需要比色指示剂。一类报告基因是选择性标志物,如对抗生素或除草剂的抗性。其他种类的选择性标志物包括发育基因如 bbm或wus和激素合成基因如ipt。
[0178]
构建物包含一个复制起始点。通常,复制起始点在一种宿主中起作用,但在另一种宿主中不起作用。优选地,复制起始点将在用于产生构建物的生物体(例如细菌或酵母)中起作用,但不会在受基因操纵的生物体(例如植物)中生长。这些在细菌或酵母中可以说是“允许的”,在植物中可以说是“不允许的”。本文中用于构建物的适当复制起始点包括大肠杆菌oric,cole1质粒起始点,2μ和ars(两者都适用于酵母系统)。
[0179]
表位标签是由表位特异性抗体识别的短肽序列。包含重组蛋白和表位标签的融合
蛋白可以使用结合到色谱树脂的抗体简单和容易地纯化。此外,表位标签的存在允许在后续分析(例如蛋白质印迹)中检测重组蛋白,而不必产生对重组蛋白本身具有特异性的抗体。常用表位标签的例子包括v5、谷胱甘肽

s

转移酶 (gst)、血凝素(ha)、肽phe

his

his

thr

thr(seq id no:20)、几丁质结合域、ha和nls标签的组合(seq id no:44)等。
[0180]
构建物还可以包含多克隆位点或多聚接头,以便于在特定位置将dna克隆到载体中。构建物可能包含用于作物改良、防止害虫等的基因组分。
[0181]
鉴于说明书的教导,可以利用分子生物学领域中已知的方法(例如,参见ausubel或manatis)来构建所述构建物。如上所述,通过将重组附接位点,编码操作性地连接到感兴趣的启动子的感兴趣序列的多核苷酸,以及可选地编码正选择标志物的序列插入到合适的载体主链中来组装靶向构建体。合适的原核载体包括质粒,诸如能够在大肠杆菌中复制的那些(例如,pbr322、cole1、psc101、pacyc 184、itvx、prset、pbad(英杰公司,加利福尼亚州卡尔斯巴德)等)。见上文sambrook 1989同上。芽孢杆菌(bacillus)质粒包括pc194、pc221、pt127等,并由gryczan公开(见:《芽孢杆菌的分子生物学》,学术出版社,ny(1982),第 307

329页)。
[0182]
获得包括适当调控序列(例如启动子)的多核苷酸的优选方法是pcr。 pcr的一般程序在macpherson等,《pcr:一种实用的方法》(pcr:a practicalapproach),(牛津大学irl出版社,(1991))中教导。每个应用反应的pcr 条件可根据经验确定。许多参数影响反应的成功。这些参数包括退火温度和时间,延伸时间,mg
2
和atp浓度,ph,以及引物,模板和脱氧核糖核酸的相对浓度。扩增后获得的片段可以通过琼脂糖凝胶电泳检测,然后用溴乙锭染色和紫外线照射显示。基因表达构建物
[0183]
将外源dna容易地纳入植物染色体的能力可用于植物基因表达系统。基因表达系统可以包含:编码感兴趣的基因的多核苷酸,其操作性地连接到植物细胞中可操作的启动子,和用于将基因表达系统整合到植物细胞中的att位点。例如, att位点可以是与spβc2丝氨酸重组酶关联的attp或attb。在其它实施发生中,例如,att位点是与sf370重组酶关联的attp或attb。启动子可以是组成型的、诱导型的或由基因开关调控的。基因表达系统可进一步包含其它调控元件,例如增强子。基因表达系统的插入和追踪可由报告基因(例如选择性标志物)促进。这种报告基因操作性地与第二启动子相连,第二启动子可能与操作性地连接到感兴趣的基因的启动子相同或不同的启动子。
[0184]
在一些实施方式中,编码丝氨酸重组酶的核酸序列实际上编码丝氨酸重组酶与其关联rdf的融合蛋白,该融合蛋白任选地由接头序列连接。因此,丝氨酸重组酶rdf融合多肽可由多核苷酸编码,所述多核苷酸包含编码大丝氨酸重组酶的第一核酸序列,其操作性地连接到编码所述大丝氨酸重组酶的关联重组酶定向因子(rdf)的第二核酸序列。在一些实施方式中,第一核酸和所述第二核酸通过多核苷酸接头(liner)连接。在一些实施方式中,第一核酸编码seq id no:41的氨基酸序列。能够编码seq id no:41的氨基酸序列的第一核酸序列包括但不限于 seq id no:36的核酸序列。在一些实施方式中,第二核酸编码seq id no:31的氨基酸序列。可编码该氨基酸序列的多核苷酸包括但不限于seq id no:29的核酸序列。
[0185]
在一些实施方式中,多核苷酸还包含编码ha和nls标签的第三核酸(例如,ha和nls
标签具有seq id no:40的氨基酸序列,其可由例如seq id no:35 的多核苷酸序列编码)。
[0186]
在一些实施方式中,丝氨酸重组酶

rdf融合蛋白受控于诱导型启动子或基因开关的控制下,以在添加刺激物(包括但不限于化学配体)时调控切除。在一些实施方式中,丝氨酸重组酶

rdf融合蛋白通过植物细胞的后续转化(依次)或通过与组成型表达丝氨酸重组酶

rdf融合蛋白的品系有性杂交来递送。植物工程改造系统
[0187]
容易地将外源dna纳入植物染色体的能力也可用于促进其它外源dna 的添加。已建立的基因交换方法要求存在插入新外源dna的靶位点,例如酪氨酸位点特异性重组酶附接位点(例如loxp、frt)和丝氨酸重组酶附接位点attb和 attp)。植物并不自然拥有这样的位点。本发明的方法和构建体提供了一种植物工程改造系统,该系统具有容易地将这样的靶位点添加到染色体中以供进一步操作的能力。
[0188]
具体而言,该植物工程改造系统包括含有spβc2 att位点的多核苷酸,用于纳入植物染色体,并且还包括至少一个用于进一步插入外源dna的靶位点。如本文所使用的“用于进一步插入外源dna的靶位点”包括loxp的位点,frt,attb 和attp位点,前提是任何attb或attp位点与用于纳入植物染色体的spβc2 att位点不同且不关联。
[0189]
因此,一种方法涉及共转染植物细胞与(a)编码丝氨酸重组酶的dna 和(b)植物工程改造系统dna,其包含(i)用于纳入植物染色体的spβc2 att位点和(ii)用于进一步插入外源dna的靶位点。转染后,培养和筛选植物细胞,以确认植物工程改造系统的存在。转基因植物细胞可生长为转基因植物,并用于进一步插入外源dna。
[0190]
在其他实施方式中,方法涉共转染植物细胞与(a)编码丝氨酸重组酶的 dna和(b)植物工程改造系统dna,其包含(i)用于纳入植物染色体的sf370 att 位点和(ii)用于进一步插入外源dna的靶位点。转染后,培养和筛选植物细胞,以确认植物工程改造系统的存在。转基因植物细胞可生长为转基因植物,并用于进一步插入外源dna。方法
[0191]
本文公开了用于将感兴趣的多核苷酸(或一个或多个核酸序列)靶向插入到基因组中的手段,通过例如(i)提供重组酶,其中所述重组酶能够促进第一重组位点和第二重组位点之间的重组,(ii)提供具有第一重组序列和感兴趣的多核苷酸的靶向构建体,(iii)将重组酶和靶向构建体引入在其核酸中含有第二重组位点的细胞中,其中所述引入是在允许所述重组酶促进所述第一和第二重组位点之间的重组事件的条件下进行的。
[0192]
还描述了一种用于位点特异性重组的相关方法,包括:提供第一重组位点和第二重组位点;将所述第一和第二重组位点与原核重组酶多肽接触,导致所述重组位点之间的重组,其中所述重组酶多肽可介导所述第一和第二重组位点之间的重组,所述第一重组位点为attp或attb,所述第二个重组位点是attb、attp或假 att位点,并且所述重组酶是spβc2和/或与seq id no:1的氨基酸序列至少65%、 70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同,前提是当所述第一重组附接位点为attb时,所述第二重组附接位点为attp或假attp,并且当所述第一重组附接位点为attp时,所述第二重组附接位点为attb或假attb;或者两个位点都是假att位点。
[0193]
本发明还包括用于获得具有稳定整合的多核苷酸序列的植物细胞的方法,所述方法包括:将包含第一重组att位点的多核苷酸引入包含核酸序列和第二重组att位点的植物
细胞中,以及使所述第一和第二重组位点与原核重组酶多肽接触,其中所述重组酶多肽能够介导所述第一和第二重组位点之间的位点特异性重组,所述重组酶为spβc2和/或与seq id no:1至少65%、70%、75%、80%、85%、 90%、95%、96%、97%、98%或99%相同,和/或至少75%、80%、85%、90%、 95%、96%、97%、98%或99%相似,其中第一att位点为attp,第二att位点为关联假attb。在其它实施方式中,重组酶为sf370和/或与seq id no:125至少65%、 70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同,和/或至少 75%、80%、85%、90%、95%、96%、97%、98%或99%相似,其中第一att位点为attp,第二att位点为关联假attb。靶向细胞和植物的用途
[0194]
转基因植物细胞具有经修饰的基因组,其中靶向dna已插入植物染色体上的靶位点。这种转基因细胞和植物有多种用途,包括筛选、产生代谢物或小分子、产生新的蛋白质、改善抗病性、改善生长、改善营养状况等等。筛选
[0195]
转基因细胞和植物可用作工具,以筛选能够调节由感兴趣的核酸片段编码的蛋白质活性的物质。一般来说,筛选大量转基因细胞比较容易。因此,本文提供了筛选方法,包括将本发明的基因工程改造的细胞与测试物接触,并监测与未接触测试物的测试细胞相比,细胞表型、细胞增殖、细胞分化、蛋白质的酶活性或蛋白质与蛋白质的天然结合伙伴之间的相互作用的改变。
[0196]
可以使用本发明的基因工程改造的细胞来评估各种测试物,包括肽、蛋白质、抗体、低分子量有机化合物、来自例如真菌或植物细胞的天然产物等。“低分子量有机化合物”是指分子量通常小于500

1000的化学物质。测试物的来源是本领域普通技术人员所熟知的。
[0197]
本领域技术人员还熟知使用细胞的各种分析方法。例如,它们包括酶活性的测定(hirth等,美国专利第5,763,198号,1998年6月9日授权),测试物与基因工程改造的细胞表达的蛋白质结合的测定,报告基因转录激活的测定等。
[0198]
通过本发明的方法修饰的细胞可以在以下条件下维持,例如,(i)使它们存活但不促进生长,(ii)促进细胞生长,和/或(iii)使细胞分化或去分化。细胞培养条件通常允许重组酶在细胞中的作用,尽管重组酶活性的调控也可由培养条件(例如,升高或降低培养细胞的温度)来调节。对于给定的细胞、细胞类型、组织或生物体,培养条件是本领域已知的。进一步修饰
[0199]
转基因细胞可用于进一步修饰。例如,当外源dna携带允许在第二att位点处插入染色体的第一att位点时,外源dna可进一步携带与第一和第二att位点不关联的第三att位点。第三att通常也与染色体上的任何其他att位点或假位点不关联。因此,第三att位点可用作附接位点,以便用不同的丝氨酸重组酶进一步修饰。转基因植物
[0200]
在另一实施方式中,本发明包括转基因植物和获得此类植物的方法。“转基因”植物是一种基因工程改造的植物,含有至少一种不相关生物体的物质。转基因植物包括发育的所有阶段,包括胚胎、种子、成熟植物和工程改造的植物子代。术语“嵌合”植物用于指其中植物的一些细胞(并非所有细胞)具有异源基因的植物。本文所使用的术语转基因还包括
其基因组已通过体外操作改变以诱导特定基因敲除的任何生物体。本文所使用的术语“基因敲除”是指通过使用本发明载体在体内实现的具有功能丧失的基因的靶向破坏。
[0201]
转基因植物可用于筛选与药物、病原体或其他外部因素的相互作用。转基因植物也可用于由一种或多种转基因介导的改变的特性。
[0202]
合适的植物可包括,例如,苜蓿芽、苹果、杏子、朝鲜蓟、亚洲梨、芦笋、杂交番荔枝(atemoyas)、鳄梨、竹笋、香蕉、豆类、豆芽、甜菜、比利时菊苣、苦瓜、甜椒、黑莓、蓝莓、小白菜、甘薯、波森莓、绿西兰花、花椰菜、花椰菜苗、孢子甘蓝、奶油生菜、卷心菜、哈密瓜、杨桃、胡萝卜、卡萨巴瓜(casabamelons)、菜花、芹菜、佛手瓜、番荔枝、樱桃、椰子、咖啡、绿衣甘蓝、玉米、蔓越莓、黄瓜、枣、茄子、菊苣、茅菜(escarole)、菲油果、茴香、无花果、大蒜、醋栗、葡萄柚、葡萄、绿豆、葱、绿衣甘蓝(collard greens)、芥菜、番石榴、玉米糊(hominy)、蜜瓜、火参果、甜瓜、卷心莴苣、菊芋(jerusalem artichokes)、豆薯、羽衣甘蓝、奇异果、球茎甘蓝、金橘、韭葱、青柠、莴苣、利马豆、莱柠、龙眼、枇杷、荔枝、柑桔、黄肉芋、大麻、橙、芒果、桑葚、蘑菇、大白菜(napa)、油桃、秋葵、洋葱、橙子、木瓜、防风草、西番莲、番木瓜、桃子、花生、梨、甜脆豆、青豆、辣椒、柿子、菠萝、大蕉、李子、石榴、土豆、仙人掌果、柚子、南瓜、榅桲、红菊苣、辣根、覆盆子、红卷心菜、大黄、罗马莴苣、大头菜、火葱、荷兰豆、大豆、菠菜、芽菜、南瓜、草莓、四季豆、红薯、橘柚、小橘子(tangerines)、黏果酸浆、西红柿、芜菁、丑橘、西瓜、荸荠、豆瓣菜、蜡豆、山药、黄南瓜、丝瓜/木薯、西葫芦、非洲雏菊、百子莲(agapanthus)、熊耳草(ageratum houstonianum)、羽衣草(alchemilla)、葱(allium)、庭荠(alyssum)、苋属(amaranthus)、朱顶红(amaryllis)、银莲花(anemone)、天使花(angelonia)、红掌(anthurium)、蒿属(artemisia)、乳草(asclepias syriaca)、紫菀属(aster)、落新妇属(astilbe)、星芹属(astrantia)、南庭芥(aubreita deltoidea)、满天星、矢车菊、桔梗花、香蜂草、秋海棠属、风铃草、天人菊、岩白菜属(bergenia)、黑心金光菊、天人菊、矮百合、荷包百合、蓝铃草、蓝眼庭菖蒲、蓝星花、寒丁子、九重葛、金雀花、醉鱼草,树牵牛、毛茛、马利筋(butterfly weed)、大叶醉鱼草、金盏花、花菱草、马蹄莲、朱缨花、茶花、风铃草、屈曲花(candytuft)、美人蕉、菫兰、红花半边莲、康乃馨、猫薄荷、青箱(celosia)、菊花、山字草、苜蓿、铁线莲、鸡冠花、耧斗菜、金花菊、珊瑚钟、金鸡菊、波斯菊、栒子、番红花、福禄考(creeping phlox)、香鸢尾属(crocosmia)、雄黄兰、花贝母、杜鹃花、仙客来、大丽花、黄花菜、金针花、飞燕草、蓝蓟、英国蓝铃草、飞蓬、月见草、大戟属植物、法绒花、亚麻花、藿香蓟、勿忘我、连翘、毛地黄、鸡蛋花、小苍兰、灯笼花、栀子、天竺葵、白鲜、山桃草、蛇鞭菊、非洲菊、剑兰(gladiolus)、金莲花、黄花、葡萄风信子、丝石竹、石南、长阶花、堆心菊、天芥菜、铁筷子、火麻、朱槿、蜀葵、金银花、玉簪、风信子、绣球、金丝桃、耐寒天竺葵、杂交茶香月季、冰岛罂粟、冰叶松叶菊、冬青、凤仙花、花韭(ipheion uniflorum)、鸢尾花、小鸢尾、龙船花、春茄(jaborosa) 花荵、照蜡花(jamesia americana)、茉莉花、红缬(jupiter’s beard)、君子兰、山月桂、袋鼠爪、棣棠、马其顿木薯(knautia macedonica)、火炬花(kniphofia)、蝟实(kolkwitzia)、皇后杓兰(lady's slipper)、野芝麻(lamium)、马缨丹(lantana)、燕草属植物(larkspur)、花葵(lavatera)、薰衣草、花环花(lechenaultia)、丁香、百合、铃兰、柳穿鱼、洋桔梗、半边莲、珍珠菜、莲花、缎花属(lunaria)、羽扇豆、木兰,剪秋罗(maltese cross)、双腺藤(mandevilla)、雏菊(marguerite daisy)、万寿菊、紫罗兰、北美山枇杷柴(mayflower)、绿绒蒿、含羞草、鱼花茑萝(mina lobate)、山梅花、附子草(monk's hood)、月
光花、牵牛花、葡萄风信子(muscari)、水仙、旱金莲、龙面花(nemesia)、粉蝶花(nemophila)、石蒜(nerine)、新几内亚凤仙、烟草、赛亚麻(nierembergia)、黑种草(nigella)、假茄属(nolana)、夹竹桃、兰花、亚洲百合、大花罂粟、蓝眼菊(osteospermum)、紫万年青、牛眼菊、花环菊、三色堇、西番莲、白鹤芋、天竺葵、钓钟柳、牡丹、花毛茛(persian buttercup)、秘鲁百合、碧冬茄、针垫花、粉红杓兰、一品红、西洋报春花、欧洲银莲花、大花马齿苋、报春花、矢车菊、蕾丝花、单花七筋菇、绣线菊、刺梅、风雨兰、毛茛、杜鹃花、岩茨、朗德木、玫瑰、木槿花(rose of sharon)、一串红(salvia splendens)、石碱草、蓝盆花、蓝扇花(scaevola)、香叶天竺葵、绵枣儿、景天、大滨菊、灌木玫瑰、蝇子草(silene)、花蓼(silver lace vine)、金鱼草、荚迷花(snowball bush)、雪钟花、雪片莲、海石竹(statice)、麦秆菊、月见草、向日葵、甜豌豆、丁香、茶香月季、虎斑花、卷丹、肿柄菊(tithonia)、延龄草(trillium)、紫灯花(triteleia)、观音兰(tritonia crocata)、连理藤(trumpetvine)、晚香玉、郁金香、珊瑚菠萝、熊菊属(ursinia)、熊果属(uva ursi)、马鞭草、金鸡菊(veronica)、兰香草、长春花、三色堇(viola tri

colour)、紫罗兰、五叶地锦(virginia creeper)、桂竹香、万寿花、睡莲、沃森花(watsonia)、球兰、蟛蜞菊、锦带花、野玫瑰、野堇草、菟葵、冬青、冬梅、迎春花、蓝猪耳(wishboneflower)、紫藤、毛紫罗兰、旱叶百合、长寿兰、柞木、蓍、黄天使、黄钟花、黄眼草、文冠花、粉姬木(zenobia)、百日菊(zinnia)、大麦、荞麦、布格麦、玉米、硬粒小麦、单粒小麦、二粒小麦、法老小麦、福尼奥米(fonio)、卡姆麦(kamut)、粟米、燕麦、水稻、黑麦、粗粒小麦、高粱、斯佩耳特小麦、苔麸、小黑麦、小麦、竹笋、大麦草、柠檬草、甘蔗、小麦草、苋菜、鸡冠花(coxcomb)、青葙、山楂、藜麦、奇亚、金合欢子、澳洲金合欢、荆芥、肯塔基蓝草(kentucky bluegrass)、多年生黑麦草、高羊茅、细羊茅、匍匐剪股颖(creeping bent grass)、匍匐红羊茅、硬羊茅、紫羊茅(chewings fescue)、狗牙根、水牛草,花狼尾草(kikuyu grass),圣奥古斯丁草(st.augustine)和结缕草。特别是,本发明的基因表达系统和方法可用于在水果中引入品质性状,例如但不限于苹果、梨、樱桃和鳄梨中的褐变;水果的抗病性状,如抗欧文氏病的苹果、抗柑桔绿化的柑桔等柑橘类水果;自受精性状,如樱桃和李子;以及无籽或减少种子大小的性状,例如芒果、桃子和鳄梨;生长快/开花早(适用于大多数果树)。
[0203]
有价值的农业植物包括水稻、小麦、大豆、西红柿、甘蔗、玉米(玉米)、土豆、蔬菜,在他处未指定的葡萄、棉花、苹果、香蕉、木薯(丝兰)、芒果、山竹、番石榴、咖啡、油棕、洋葱、大豆、花生、橄榄、油菜籽、辣椒和胡椒(青辣椒和干辣椒)、橡胶、茶、橙子、黄瓜、山药、桃子、油桃、莴苣、菊苣、可可(巧克力)、葵花籽、甜菜、西瓜、芦笋、胡萝卜、芜菁、椰子、橘子、杏仁、柠檬、青柠、草莓、核桃。
[0204]
鉴于公众对gmo(转基因)食品的担忧,转基因植物用于工业生产或不用于人类食品的障碍通常较低。这类植物包括草,如竹子、芒草(misacanthus)和柳枝稷、麻疯树、火麻、蓖麻和亚麻。转基因特性
[0205]
转基因特性包括对害虫的抗性,例如但不限于昆虫、真菌和细菌;还有杀虫剂。也可以产生转基因植物,敲除不需要的基因或添加或改变与开花、抗旱、抗除草剂、抗虫、抗病、花色、花色强度、花香、特定营养物质的积累、水果香气、味道、营养价值或者表达外源基因有关的性状。
[0206]
例如,带有spβc2 att位点的质粒还可以用来改变基因的表达,从而改善植物储藏期、风味、香气和外观。与延长储藏期有关的基因包括降低乙烯水平和/ 或敏感性的基因(例如1

氨基环丙烷
‑1‑
羧酸合酶(acs)基因、乙烯受体、乙烯氧化),减少衰老的基因(例如ef

1、dhs)、降低切开的水果和蔬菜褐变的基因 (例如多酚氧化酶,ppo或苯丙氨酸解氨酶,pal基因)。与风味和味道有关的基因包括增加植物组织中糖含量(糖和有机酸生物合成和运输的基因)或减少苦味的基因(如倍半萜途径的基因)。与香气和外观有关的基因包括负责产生芳香挥发物的那些基因,这些挥发物是通过氨基酸和类胡萝卜素的生物合成途径产生的。与植物营养价值有关的基因可能是上调类胡萝卜素(如psy)和生育酚(例如,尿黑酸香叶基香叶基转移酶;尿黑酸植基转移酶;以及尿黑酸茄尼基转移酶)生产的基因。
[0207]
带有spβc2 att位点的质粒也可用于作物、水果和蔬菜的性状工程改造应用。可以在植物中工程改造并表达与改善农艺性状,如抗旱、抗寒和耐热有关的基因,与通过改善光合效率或养分利用来提高产量有关的基因或与增加植物生物量有关的基因。这些基因可以单独表达,也可以组合多种基因或性状表达。
[0208]
其他农艺性状包括耐除草剂和保护作物免受虫害的基因。耐除草剂基因包括对除草剂解毒的那些基因(例如麦草畏单加氧酶)或增加对除草剂作用不敏感的基因(5

烯醇式丙酮酸莽草酸3

磷酸合酶,epsp)。作物保护基因可以是杀虫蛋白(如cry家族毒素,例如bt毒素),也可以是防御各种植物病害的蛋白(如防御素家族、dsrna等)。
[0209]
纳入大区段dna的能力使得本发明特别适用于代谢基因簇的转移。代谢基因簇(mgc)是特定代谢途径的基因组共定位和潜在的共调节基因。这些簇中的一些编码分子涉及防御害虫,食草动物和/或病原体。例如,拟南芥(arabidopsisthaliana)的marneral基因簇(50kb)和拟南芥宁醇(thalianol)基因簇(70kb);水稻 (oryza sativa)的莫米内酯(momilactone,180kb)和phytocassane(250kb)基因簇;玉米(zea mays)的dimboa(250kb)基因簇;番茄(solanum lycopersicum)的萜烯基因簇(100kb),茄碱/番茄碱基因簇(150和30kb);马铃薯(solanum tuberosum) 的茄碱/番茄碱基因簇(250和30kb)。
[0210]
有许多技术可以用来克隆大基因簇。基于f质粒ori的细菌人工染色体 (bac)可用于150

350kb的克隆;基于p1噬菌体的相关p1衍生人工染色体(pac) 通常包含100

300kb片段;酵母人工染色体(yac)的大小可能在100

1000kb之间。因此,例如,可以将来自玉米的dimboa基因簇克隆到例如bac中并用于转移对害虫和病原体的抗性表达。或者,通过从cdna中克隆部分或全部相关基因,可以减少很大的dna区段,从而去除操纵子。利用该策略从燕麦(avena sp.) 中克隆了3个介导抗真菌化合物燕麦根皂苷产生的基因。将燕麦根皂苷基因转移到不产生燕麦根皂苷的长颖燕麦(avena longiglumis),也转移了真菌禾顶囊壳小麦变种(gaeumannomyces graminis var.tritici)的抗性。
[0211]
一个有用的例子是dimboa(2,4

二羟基
‑7‑
甲氧基

1,4

苯并恶嗪
‑3‑
酮) 的生产,它是一种天然存在的化合物,是存在于玉米和相关禾本科植物中的一种强大的抗生素,并对害虫(包括真菌和细菌)以及欧洲玉米螟幼虫提供防御。dimboa 生产通常在幼苗中最高,但随着植物年龄的增长而减少。因此,如果将dimboa 相关基因置于继续在成年期表达根特异性启动子(参见 dl.sciencesocieties.org/publications/tpg/articles/9/1/plantgenome2015.04.0025中的示范性根特异性基因)的控制下,并转染到玉米中,由此产生的植物将在成熟植物的根中表达更高水平的dimboa,并对玉米螟提供天然防御。
[0212]
另一个例子是生产c4水稻。水稻天然使用c3碳固定。c4固定是c3的细化过程,需要其它基因,其编码修饰的光合途径和改变叶片结构,从而将co2集中在rubisco。与c3相比,c4光合作用更有效地固定碳,二氧化碳水平更低,水含量也明显减少。因此,c4植物在更高的温度下生长更快,而且更能抵御干旱。将水稻转化为c4将是全球粮食生产的重大进展。
[0213]
有益的是,在c3植物中已经发现了c4光合作用所需的许多酶和结构特征,c4光合作用在至少18个植物科中至少独立进化了66次(schuler等,“在合成生物学时代将c4光合作用改造成c3底座(engineering c
4 photosynthesis into c
3 chassis in the synthetic biology age)”,the plant journal,2016;87,第51

65页,第55页)。schuler认为,转录组研究表明c4的工程改造需要对抑制整个c4循环的基因进行移除或抑制。至于新基因,最多9个基因被成功引入植物,而c4的转基因的预测数量预计会更多。将需要基因组着陆坪来引入多基因构建体。
[0214]
由于本发明能够将大dna区段直接整合到不同物种的染色体中,因此它对于c4水稻计划特别有用。插入物可以提供(a)一套调控rna以抑制干扰整个 c4周期的基因的表达,(b)c4所需的转基因,和(c)额外的“着陆点”以促进其它基因和调节物的插入。丝氨酸重组酶介导的整合的假位点
[0215]
用于将核酸整合到植物基因组中的假位点包括但不限于以下:烟草烟草属(nicotiana)中spβc2假attb位点的例子包括但不限于:gttatagtcagttgaattcaaactctctgactcatcattagagaaacaattaaatagattatagtattacttacaat gcgcgcgacgcattgtatgaacc(seq id no:132)ttgctgtcttttcatacttttctaagttgaaagtacttgaaagtacgaccaagaaaatgattatatttgacacagaa aatgcaaggtactttgaatgtga(seq id no:133)ggataagggagggtttagatattttgaaagggttaaggggtaaaatcactaagggggaattaacaatgcacactagg gttgccttaaaagtgcctatata(seq id no:134)ctaatatacattgacagtgttaaaaaaaatctattaacgacaatatagagaagagagtacttacatgaatgacgtct actttgactccgtcaattccaac(seq id no:135)taggcttacattcctgatgtactatcccattatgcaataataaagatgcaaaataggaaatgtcattgacagctacg agatctatctttattgattcact(seq id no:136)acatggagcaatgatggagaaaaatggtggtcattactactgaagttgtcaaagcaaagctgtcaggtaacatcaaa tgatctctaaatcaattagtctt(seq id no:137)gccacaacctaggccaggcaaaggtttcactaatacctgtgatgtttgtcaaaggagtctcctcgactccttcagat tctgctctcttggctgtaaggta(seq id no:138)gaagagacgattacatatatgtgtacgcgttggataatcatttgaaccttaaagtctgtctctctcttaacatgtgt tcaatagcaatacaaagtgtata(seq id no:139)在一些实施方式中,烟草属物种是本氏烟草(nicotiana benthamiana)。莴苣莴苣属(lactuca)中spβc2假attb位点的例子包括但不限于:attaaggaggagaatataacatgtattttgtgtgtatcatgagaaacaattagaaggtacctataattatgaagtca aagcacaaggatattcttgtaaa(seq id no:140)
caatggtgaatatagtccggcgaccaactctgtccactatcagcaacgataaaaaggtcatgctaagacccacaagc ccagtcaccactgctgacataag(seq id no:141)ataagtttagatcttattgaactaggcttgtggtgcttgtttaaggccataaatcgccttattcaagcgacaaaaat gagacgaataggtggagtcttca(seq id no:142)tccgtcacaaattgcatcactacgactaagatcttcatcaatgattctattaaggagattcttacattgaaggagaa gttacataaattctttattattt(seq id no:143)tgaatttcttatgaaggttacaacgcatcgtggattacaagcaattctgtttagtctgttatgttgttgaatttgaa tggatcttgtcctcagttactca(seq id no:144)cacaaaaaattgaccatttctagcaacttcctatgatacgttgatactttctaaacattaattacaatgacaaaatg aagtctaccaaatcattcataga(seq id no:145)tatttgtgatgtgacatgacaaataatgatgttacaatattatgtacctctaaatgagatctagcattgaagattgc atgaatattcttgagtgtgttatt(seq id no:146)在一些实施方式中,莴苣属物种是莴苣(lactuca sativa)。对于莴苣和烟草鉴定的可能的att位点:莴苣和烟草中att位点的例子包括但不限于:gtgcttgtttaaggccataaatcgccttattcaagcga(seq id no:66)gtgcttgtttaaggccataaatcgccttattcaagcga(seq id no:67)gttaaggggtaaaatcactaagggggaattaacaatgc(seq id no:68)gttaaggggtaaaatcactaagggggaattaacaatgc(seq id no:69)tccactatcagcaacgataaaaaggtcatgctaagacc(seq id no:70)tccactatcagcaacgataaaaaggtcatgctaagacc(seq id no:71)tccactatcagcaacgataaaaaggtcatgctaagacc(seq id no:72)tccactatcagcaacgataaaaaggtcatgctaagacc(seq id no:73)tccactatcagcaacgataaaaaggtcatgctaagacc(seq id no:74)tccactatcagcaacgataaaaaggtcatgctaagacc(seq id no:75)tccactatcagcaacgataaaaaggtcatgctaagacc(seq id no:76)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:77)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:78)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:79)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:80)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:81)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:82)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:83)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:84)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:85)tgtatcatgagaaacaattagaaggtacctataattat(seq id no:86)catcattagagaaacaattaaatagattatagtattac(seq id no:87)catcattagagaaacaattaaatagattatagtattac(seq id no:88)catcattagagaaacaattaaatagattatagtattac(seq id no:89)
catcattagagaaacaattaaatagattatagtattac(seq id no:90)catcattagagaaacaattaaatagattatagtattac(seq id no:91)catcattagagaaacaattaaatagattatagtattac(seq id no:92)ttcatcaatgattctattaaggagattcttacattga(seq id no:93)ttcatcaatgattctattaaggagattcttacattga(seq id no:94)acttgaaagtacgaccaagaaaatgattatatttga(seq id no:95)acttgaaagtacgaccaagaaaatgattatatttga(seq id no:96)spβc2假位点的共有序列是:ccaaagtagt aagtatctta aaaaacagatwr(seq id no:130);和ccaaagtagt aagtatctta aaaaacagatwr(seq id no:131)。因此,莴苣和烟草中的spβc2 假位点包含seq id no:130或seq id no:131的共有元件。莴苣中sf370的假位点的例子是:cagcctaacg attattatag attgtgttgg ccgacccttt ttgccagcct tataggtaat aaagttataa gacaatatta caataggtct ttgacatcaa(seq id no:64)ataaataaat aaaagagggg ttagggcttt gagtcctttt gtcttcgtct gattggagag aaagggaacg aacgaaagca gcaacaattt gtcccatgat(seq id no:65)水稻稻属(oryza)中spβc2假attb位点的例子包括但不限于:tccgattgaagtttagtaggagtatagtgtagtgttagtgtacactgtctttaagatcacattaagaactaatagac ctgtaaaccctttcatctagcag(seq id no:107).ggtaaaggcgatgatgtgtactcttgggttgcctattgggtgcatatccttggcagggctcatgttgttcagttaat aaagatattaagtagctaccta(seq id no:108).tacctttaatttagtacatgacattgtgaacatcagcataagtatcgtcttattgagatacatattttatctcacgt tagcacgtttttttaagtacta(seq id no:109).accgaatgctgcgtggagtacattgttcagatcgtaggtggcgctgtcttgtctgcccgcccatttaacttccttcc gccatcacgaacctgatcaacg(seq id no:110).在一些实施方式中,稻属物种是水稻(oryza sativa)。玉米玉蜀黍属(zea)中spβc2假attb位点的例子包括但不限于:ataacgaaag atttggccat gactgcagca ttgccaccat acgaagatac tgttgcttcg tagctcatca aaaactgctt cgggtctgag tggccatca(seq id no:56)在一些实施方式中,玉蜀黍属物种是玉米(zea mays)。在一些实施方式中,玉蜀黍属中的att位点是mhrdhnndwn wrmaachatw aadnnghdhh whnvadhnhn(seq id no:98)的共有序列具有核心序列:mhrdhnndwn wrmaachatw aadnnghdhh w(seq id no:99)。大豆大豆属(glycine)中spβc2假attb位点的例子包括但不限于:nnnnnnnnnw nhaachatwa hdnnrnnnnn nnnwddnnn(seq id no:100)
auxin response elements)”plant cell 9,1963

1971)。将cat基因克隆到35s

t7

烟草花叶病毒(tmv)

3'胭脂碱合酶载体(即,具有重复增强子35s 启动子的camv 355与t7噬菌体启动子组合,接着是tmv r翻译增强子和3'胭脂碱合酶非翻译区)中。2.丝氨酸重组酶在植物细胞中表达
[0222]
表达丝氨酸重组酶的效应构建体在大肠杆菌中生长,并使用商业dna提取试剂盒(如qiagen dna提取试剂盒)提取。使用qiagen endo

free maxi试剂盒 (目录号12361,凯杰有限公司(qiagen inc.),加利福尼亚州)制备用于转染的质粒。
[0223]
从3

5周龄无菌生长的莴苣植株中分离出叶肉原生质体,如tiwari等所述(“用含有整合的报告基因的原生质体转染分析(transfection assays withprotoplasts containing integrated reporter genes)”,methods mol biol,2006; 323:237

44)。纯化的原生质体用表达重组酶的质粒转染,使用如tiwari(同上)所述的标准聚乙二醇法。
[0224]
培养18小时后,收获原生质体,在sds缓冲液中裂解,在sds

聚丙烯酰胺凝胶上分离蛋白质并转移用于蛋白质印迹。使用ha表位抗体(大鼠抗ha克隆3f10(sigma#21319000))检测凝胶中重组酶的存在。图3显示重组酶表达的蛋白质印迹,产生预期大小的蛋白质。sf370.1以低水平表达。所有其他重组酶在莴苣原生质体中高水平表达。3.报告质粒的构建
[0225]
在pbr322主链上构建报告质粒构建,用于在细菌中复制,但在不纳入植物染色体中的情况下无法在植物中复制。为了确定质粒是否已纳入到染色体中,质粒携带了两个报告基因:新霉素磷酸转移酶ii(nptii)基因,该基因赋予对新霉素和卡那霉素的抗性,以及绿色荧光蛋白(gfp)。如图4所示,每个报告基因受控于植物中具有活性的启动子和终止子:对于gfp为花椰菜花叶病毒(camv) 35s启动子和胭脂碱合酶(nos)终止子;对于nptii为木薯脉花叶病毒(csvmv) 启动子和f3r终止子。
[0226]
图4还显示了报告质粒,其在gfp报告物5’还包含attp(1)、attb(2) 或无位点(3)。seq id no:4显示报告质粒在5598

6331位置带有spβc2 attp位点。该区域在缺少att位点的质粒中被删除,或被适当的attp或attb序列取代。由于每个丝氨酸重组酶识别特定的关联attp/attb,每个报告质粒的attp或attb对关联丝氨酸重组酶进行改变,如下表3所示。
[0227]
因为丝氨酸重组酶只有在识别attp/attb对的情况下才会介导报告质粒纳入植物染色体,所以带有attp或attb的报告质粒能够确定其相应的attb或attp在染色体上的存在。无att的质粒控制随机整合。表3:丝氨酸重组酶及其关联attb和attp序列
实施例2.对莴苣和烟草基因组的genbank筛选没有发现attp或attb位点
[0228]
对公共基因组数据库进行attb、attp和可能的假att位点的筛选。检测了phytozome数据库(来自美国能源联合基因组研究所,可从 phytozome.jgi.doe.gov/pz/portal.html获得)中的莴苣(lactuca sativa)和本氏烟草(nicotiana benthamiana)基因组。拟南芥基因组在arabidopsis.org上搜索,该数据库由拟南芥信息来源(tair)建立。
[0229]
在这些数据库中搜索表3中列出的attb和attp序列,允许2个核苷酸错配或间隔子,以来解释可能的att“假”位点。在us9034650中鉴定的att假位点也针对莴苣和烟草基因组进行了筛选。
[0230]
在拟南芥、莴苣和烟草中未发现attp或attb位点或典型假位点。因此,丝氨酸重组酶不能将带有attp或attb的报告质粒纳入到莴苣或烟草的染色体中。实施例3.spβc2重组酶将含有attp而不含attb的6.3kb质粒整合到莴苣基因组中1.方法
[0231]
培养分别含有效应物或报告质粒的大肠杆菌,并使用qiagen endo

freemaxi试剂盒(目录号12361,凯杰有限公司,加利福尼亚州)提取dna。
[0232]
从3

5周龄无菌生长的莴苣植株中分离出叶肉原生质体,如tiwari等, 2006所述(tiwari等,“用含有整合的报告基因的原生质体转染分析”,methods molbiol,2006;323:237

44)。纯化的原生质体用表达重组酶的质粒转染,使用如tiwari 2006(同上)所述的标准聚乙二醇法。
[0233]
转染原生质体的继代培养和再生的方案如前所述(jie等,“myo

肌醇提高了甘蓝(brassica oleracea var.capitata)子叶原生质体的铺板效率(myo

inositolincreases the plating efficiency of protoplast derived from cotyledon of cabbage (brassica oleracea var.capitata))”j plant biotechnol(2011)38:69

76;armas等,“莴苣(lactuca sativa l.)快速有效的体外再生系统”,plant methods(2017)13:58)。简而言之,将转染的原生质体在液体培养基中黑暗培养48小时。然后将原生质体包裹在明胶
珠中,在黑暗中生长3周。7天后,在包埋的原生质体中观察细胞分裂情况。在3周内观察到小的微集落。3周后,珠溶解,幼小的小菌落在黑暗中生长一周,转移到光照下。微集落再生为愈伤组织(5

7周),随后再生为植株。在一些实验中,小集落(4周龄)生长在卡那霉素(25

100μg/ml)上,杀死不含报告质粒的细胞。在生长的每个阶段监测gfp荧光。用对两个标志物(绿色荧光蛋白和卡那霉素(kan)抗性)显示阳性的愈伤组织进行随后的分子分析。
[0234]
从转基因愈伤组织和植物分离基因组dna。利用对报告质粒不同区域具有特异性的pcr引物确定莴苣染色体中整合的质粒的存在。pcr引物序列列于表 4。表4:针对报告质粒的pcr引物2.筛选鉴定出spβc2和attp组合在莴苣中具有活性
[0235]
为了确定给定的重组酶是否能将报告质粒整合到莴苣基因组中(无需人工工程改造att位点),将莴苣原生质体与表达重组酶的效应质粒和带有attp、attb 或无位点的报告质粒共转染。将原生质体培养成微集落3周,计数gfp阳性集落数。
[0236]
在评估是否发生整合时,应注意的是,仅卡那霉素抗性和仅gfp表达都不是卡那霉素和gfp报告质粒整合到染色体的确切证据。植物可能表现出部分卡那霉素抗性,可能是由于药物外排泵的上调所致。此外,gfp信号可以在转染的原生质体中检测到,这是由于保留在细胞内而没有整合到基因组的报告质粒中gfp 的表达,尽管这种信号会随着细胞生长而消失。因此,gfp抗性与卡那霉素的组合,gfp水平和/或卡那霉素抗性水平以及藉由pcr的确认是更可靠的稳定插入的指标。
[0237]
在我们初步筛选中,没有观察到用报告质粒和表达a118、sf370和bxb1 的质粒共转染的原生质体与对照相比任何稳定的gfp信号。
[0238]
包含attp位点的报告质粒和产生spβc2重组酶的效应质粒产生27个集落,而带有attb或不含att的spβc2效应质粒各自仅产生一个集落。因此,attp与 spβc2是产生相比对照显著增加gfp阳性集落数的唯一组合。
[0239]
为了证实该结果,将含有attp位点或无位点(缺位点(siteless))的报告质粒与表达spβc2重组酶或cat(对照)的另一效应质粒共转染到莴苣原生质体中。原生质体被培养成
微集落。5周时测定集落数,表明共转染对活力有负面影响,但不同质粒之间的活力没有显著差异(图5a)。每一个报告构建体(缺位点和 attp位点)相当数量的微集落生长5周,对gfp荧光集落数进行计数。
[0240]
如图5b所示,在存在spβc2重组酶的情况下,含有attp位点的报告质粒中,发现gfp阳性集落数至少增加了20倍。只有少数gfp阳性集落出现在缺位点报告物或无spβc2重组酶的情况下(标记为cat)。这些集落被认为是由于没有纳入染色体的报告质粒的残余活性。3.spβc2优先作用于attp而不是attb,以将报告质粒纳入莴苣基因组中
[0241]
我们进一步测试了attb位点是否也能将质粒整合到莴苣基因组中。具有 attp和attb位点的报告质粒分别与或不与spβc2重组酶在莴苣叶肉原生质体中共转染,并包封于明胶珠中。如图6a所示,在有或无spβc2重组酶存在,或在没有 spβc2的attp报告物存在的情况下,转染attb报告质粒的原生质体的gfp阳性珠数在22天内下降到20%以下。相比之下,转染spβc2和attp质粒的原生质体表达 gfp的珠数维持在60%左右。
[0242]
第22天时,含有共转染spβc2和attp的原生质体的gfp阳性珠通过在 cacl2溶液中悬浮来溶解,以释放细胞并在含35或50μg/ml卡那霉素的选择培养基上生长8或15天。作为对照,将含有转染attp cat或无dna的原生质体的珠破开,并使细胞在卡那霉素上生长。
[0243]
转染后5

6周对gfp阳性集落数进行计数。如图6b所示,相比重组酶不存在情况下在那霉素不存在情况下生长时,attp报告质粒在spβc2重组酶存在下产生42倍以上的gfp阳性集落。当在卡那霉素存在下生长时,只有转染attp spβc2 的原生质体得到gfp阳性集落(图6b)。
[0244]
这一结果表明,卡那霉素抗性(nptii)和gfp标志物基因整合到染色体中,卡那霉素可用于增加转基因细胞数。
[0245]
我们进一步通过在较高浓度的卡那霉素(25

50μg/ml)和较长周期(>7 周)的时间培养珠中的集落来进一步验证了上述结果。图7显示了在转染attp报告质粒而没有spβc2重组酶的细胞中gfp信号弱的集落。卡那霉素筛选后,未发现gfp阳性细胞。转染attp和spβc2质粒转染的细胞产生大量gfp信号弱的细胞和少数gfp信号强的细胞。在25μg/ml选择后,仅观察到强gfp信号的细胞。因此,attp报告质粒完全整合到莴苣基因组中,并且卡那霉素可用于富集整合子。
[0246]
表5显示了在50μg/ml卡那霉素中生长后gfp阳性菌落的计数结果。与转染时原生质体的初始数量相比,约0.06%转染attp和spβc2质粒的原生质体在5 周后呈gfp和kan阳性。attp cat和无dna对照未观察到信号。表5:整合频率(5周后gfp阳性细胞/转染中使用细胞的总数) 转染的dnaattp catattp spβc2无dna整合频率%00.06104.来自7日龄幼苗的细胞的确认
[0247]
对莴苣(lactuca sativa)变种的种子进行萌发,并由1周龄幼苗制备原生质体。根据woo(2015)nature biotechnology第33卷,第11期进行幼苗原生质体分离、转染和植株再生。
[0248]
在spβc2重组酶或cat存在下,用attp或attb报告质粒共转染原生质体。7日龄幼苗原生质体的结果与先前叶片原生质体的结果基本一致。如图8a所示,用attp报告质粒,spβ
c2而不是cat产生卡那霉素抗性gfp阳性集落。在 spβc2存在下,由attb报告质粒获得单个卡那霉素抗性gfp阳性的愈伤组织(图 8b)。对非选择性培养基上5周(图8c)和用卡那霉素选择后(图8d)的愈伤组织数进行计数,表明转基因愈伤组织对卡那霉素抗性和gfp表达呈阳性。
[0249]
用attb报告物对单个阳性愈伤组织的观察表明,植物中可能存在attp样靶向序列。正在进一步分析attb报告物衍生的愈伤组织,以确认它包含插入染色体的报告质粒。5.spβc2重组酶和attp报告质粒产生的转基因植株
[0250]
由如上所述制备的莴苣叶肉原生质体细胞再生转基因莴苣植株,并用 spβc2重组酶和attp报告基因转染。使用表4所述的引物进行pcr,证明莴苣叶基因组dna中同时存在nptii和gfp信号,扩增子的大小与从报告质粒获得的扩增子的大小相同(图9a)。八氢番茄红素去饱和酶(pds)基因用作植物dna的阳性对照。
[0251]
通过对全部叶子中gfp表型的观察进一步证实了pcr的结果。转基因植物的叶子在紫外光下发荧光,这与gfp的产生一致,而野生型莴苣则没有(图9b)。因为报告质粒是不可复制的,所以需要报告质粒整合到染色体才能使整个叶片发出 gfp荧光。
[0252]
用pcr进一步证实整个6.3kb的attp质粒被整合到莴苣基因组中,且整合通过质粒的attp区和植物染色体上的attb样位点之间的重组发生。图10a是报告质粒的示意图,其显示了相关位置的基因和用于长转录本pcr扩增的引物。图 10b显示转录本的预期大小和pcr结果。在转基因莴苣植株(tg)和质粒中,鉴定了gfp通过nptii和nptii到specr的扩增子。因此,整个报告质粒存在于转基因莴苣中。从specr到gfp的扩增,通过attp传递,从质粒而不是从转基因莴苣产生转录本(图10c)。这表明报告质粒已插入染色体并在attp处线性化。野生型(wt)莴苣的转基因标志物为阴性,而tg和wt莴苣的pds对照基因为阳性。实施例4.spβc2重组酶将带有attp的报告质粒整合到烟草植物细胞中
[0253]
为了测试spβc2重组酶在其它植物中是否具有活性,我们测试了烟草(本氏烟草(nicotiana benthamiana))中的重组。采用与莴苣相同的方法,制备烟草植株原生质体,并用具有attp的报告质粒和spβc2重组酶效应质粒转染,并用cat 编码质粒进行对照共转染。attp报告质粒与spβc2的共转染产生表达gfp的微愈伤组织。见图11。在没有spβc2重组酶(简称cat)的情况下,未观察到报告质粒的整合。
[0254]
通过实验并在0、20、40、60、80和100μg/ml的卡那霉素上培养推定的转基因愈伤组织7周,同时监测gfp荧光,证实了该结果。结果总结在表6中。“kan”是卡那霉素,单位为mg/l,“tot”是微愈伤组织总数,“gfp”是gfp 微愈伤组织数表6:转染后7周gfp和卡那霉素阳性烟草微愈伤组织数。
[0255]
如图12所示,在转染attp和cat质粒的细胞中未观察到gfp荧光微愈伤组织。相反,转染attp和spβc2质粒的细胞产生可在高达100μg/ml卡那霉素上生长的微愈伤组织,均产
生gfp。gfp和nptii标记物的同时存在表明整个具有 attp的质粒已整合到烟草染色体中。我们得出这样的结论:spβc2能够将带有attp 的dna整合到烟草基因组中。实施例5.φc31重组酶可能的毒性作用
[0256]
如实施例1所报道,在最初的研究中,a118、sf370.1、φc31和bxb1 重组酶相比对照不产生稳定的gfp信号。进一步分析认为φc31可能允许报告质粒整合到莴苣基因组中,但产生的原生质体细胞没有分裂。如图12所示,与cat 对照组相比,用attp或attb报告质粒共转染的φc31与9天后更高数量的gfp表达细胞相关。然而,这些细胞不能进一步分裂。
[0257]
φc31重组酶的表达显著高于其他重组酶,并且可能已经能够诱导报告质粒随机或半随机整合到基因组中,但会进一步损伤dna。多项研究表明φc31能诱导动物细胞中的dna损伤反应和染色体重排。例如,见liu j“φc31整合酶诱导成人成纤维细胞中的dna损伤反应和染色体重排(φc31integrase induces a dnadamage response and chromosomal rearrangements in human adult fibroblasts)”,bmcbiotechnol.2009 9:31。如果φc31在植物中诱导dna损伤,它可以将报告质粒随机整合到染色体中,但有发生严重和不可控突变的风险。
[0258]
用在弱组成型启动子后表达φc31重组酶基因的效应质粒重复实验。实施例6.整合位点的鉴定及侧翼同源性靶向的改进1.假attb位点的鉴定
[0259]
由于对莴苣和烟草基因组的生物信息学搜索没有发现典型attb位点,我们得出这样的结论:报告质粒已纳入到假attb位点中。通过基因组测序鉴定了假 attb位点的序列。简而言之,从转基因愈伤组织和植物制备基因组dna,然后构建文库。以部分质粒序列为诱饵,富集侧接插入质粒的染色体dna。通过 illumina

hiseq平台对分离的dna片段进行测序,以鉴定来自植物的attb假位点。
[0260]
或者,培养含有整合的报告质粒的植物细胞,并提取基因组dna,并用在报告质粒中不切割的限制性内切酶消化dna。然后稀释dna,与dna连接酶孵育,使质粒再环化并转化入大肠杆菌。鉴定抗大观霉素抗性菌落并从attp区域测序。
[0261]
或者,在称为“基因组步移试验”的方法中,培养含有整合的报告质粒的植物细胞,提取基因组dna,用限制性内切酶消化,并将衔接子序列连接到基因组片段上。然后用衔接子特异性引物和对插入的dna序列具有特异性的引物通过 pcr查询该文库。可以使用内部间隔的引物进行第二次“巢式”pcr,用于进一步扩增低丰度扩增子。然后对pcr产物进行测序,以鉴定与天然染色体序列连接的转基因。
[0262]
在鉴定了attb假位点序列后,其在莴苣基因组中的位置从先前公开的基因组序列中鉴定,并通过用侧接假attb位点并在报告质粒内部的引物进行pcr扩增来证实。然后在其他转基因莴苣克隆上使用相同的引物组,以鉴定在存在外源 attp dna和spβc2的情况下是否一个以上的位点作为假attb位点。如上文所述,对其它假attb位点进行测序和鉴定。
[0263]
已经鉴定出一个以上的假attb位点,进行新的attp dna和spβc2转染,并筛选产生的转基因集落,以确定插入一个假attb位点相对于另一个假attb位点的相对频率。2.利用侧翼同源性选择靶特异性整合
[0264]
给定的假attb位点可能会优先于另一个位点,原因包括
·
基因内的位置,使报告质粒的插入破坏正常的蛋白质表达;
·
染色体结构,使转基因在一个位点比在另一个位点得到更好的表达;
·
染色体定位,使所需的转基因与其他所需的基因共同遗传。实施例7.β胡萝卜素基因转移到莴苣中
[0265]
莴苣是亚洲部分地区饮食的重要组成部分,占全球消费量的一半以上。维生素a缺乏也是亚洲的一个问题。增加β胡萝卜素的摄入可以纠正维生素a摄入量的不足。众所周知,莴苣能产生适量的β胡萝卜素,但直到现在,还没有被认为是β胡萝卜素的重要来源。
[0266]
图4(1)的报告质粒带有spβc2重组酶的attp位点,通过在attp和 35s启动子之间(a)和specr基因的3'(b)插入lox位点进行修饰。在最后一个 lox位点3’处添加psy基因和35s启动子。psy基因编码八氢番茄红素合成酶,是莴苣中β胡萝卜素合成和积累的限速酶。
[0267]
该质粒与表达spβc2重组酶的质粒共转染莴苣原生质体,产生的细胞在 25μg/ml愈伤组织中的卡那霉素上生长。
[0268]
2周后,检测细胞gfp表达,阳性细胞继续生长1周,筛选gfp和卡那霉素抗性的稳定高水平表达,然后进行pcr确认质粒插入物的存在。阳性愈伤组织被培育成熟莴苣植株。成熟植株表达gfp、卡那霉素抗性和过表达psy。
[0269]
从成熟莴苣制备原生质体,然后用编码cre重组酶的质粒转染该原生质体,使其作用于插入物中的lox位点。然后原生质体在没有卡那霉素筛选的情况下生长,并筛选gfp表达的丧失。鉴定原生质体的gfp表达缺失和卡那霉素敏感性,用pcr证实转基因psy的存在。
[0270]
产生的原生质体被培育成莴苣植株,拥有完整的且具有功能的psy基因。
[0271]
这种技术可以用于较大的基因簇。农杆菌介导的基因转移常常导致截短的产物,并且需要产生大量的转基因事件来获得所需的完整转基因。较大的质粒甚至更难用农杆菌法转染,并且通常限制在20kb以下。这些问题并不存在于丝氨酸重组酶介导的整合中,并且仅受到能够可靠地转染到细胞中的dna的大小限制。实施例8.丝氨酸重组酶在基因组缺失中的应用
[0272]
已经证明植物染色体上有至少一个spβc2重组酶假att位点,有可能利用这个假位点特异性地删除假att位点周围的dna。
[0273]
首先,在植物细胞中,识别出在假att位点的一个位点处存在缺失感兴趣的区域之后,spβc2重组酶attp位点插入到感兴趣区域的另一侧。attp位于外源 dna中,该外源dna进一步包含报告基因并且任选地包含与spβc2非关联的第三att位点(“att3”)。利用同源位点特异性重组将外源dna引入染色体,通过检测转染植物细胞中报告物的缺失来鉴定插入的存在。
[0274]
第二,表达spβc2重组酶的载体被引入植物细胞,使得染色体上的假att 位点和外源dna上的attp位点之间发生重组,得到一个新的attr/attl位点。通过筛选转染子中位于外源dna上报告基因的丢失检测缺失。然后用pcr检测得到的植物细胞,以确认基因组缺失已经发生。
[0275]
在另一实施例中,外源dna进一步具有att3位点,其位置使得染色体上的假att位点和外源dna上的attp位点之间重组,从而使att3留在染色体上。然后att3位点可用于引入新的外源dna,例如与缺失区域互补的修饰dna。实施例9.进一步插入外源dna的植物工程改造系统
[0276]
带有spβc2 attp的质粒被进一步修饰以包含bxb1的attb位点,产生的植物工程改
造系统与spβc2共转化入原生质体。在鉴定含有植物基因工程改造系统的转化的原生质体之后,将原生质体与(a)带有bxb1 attp位点的外源dna 和(b)表达bxb1的外源dna共转化。实施例10:1.用spβc2重组酶产生本氏烟草转化体
[0277]
通过共转染spβc2表达载体(或控制填充载体:cat)加上含有gfp、 nptii和spβc2附接位点(attp、attb或缺位点对照)的靶整合载体产生野生烟草相关的本氏烟草(benthi)事件。在卡那霉素梯度存在下再生集落以检测nptii,并且通过蓝色“生物光”照明和适当的滤光片来确定gfp的存在(图1)。与莴苣中先前的实验一致,attp/spβc2 dna组合导致卡那霉素抗性和gfp阳性集落数显著高于其他dna组合。转基因集落增强的再生在10到65倍之间变化,并且取决于用于选择的卡那霉素浓度。当卡那霉素浓度为60mg/l时,attp/spβc2转染条件下产生65 个转基因集落,而其它条件下均为0

1个。在这65个attp/spβc2集落中,60个呈 gfp表达阳性,而60mg/l卡那霉素时,其它转染条件下的集落均不显示gfp表达。值得注意的是,44个attp/spβc2集落中有13个(约30%)在没有任何选择的情况下呈gfp表达阳性。这些结果突出了spβc2不仅能增强attp转基因在植物基因组中的整合,而且提高了整合的保真度,导致多个转基因在有选择或无选择的情况下的阳性表达。只有极少数gfp阳性的卡那霉素抗性集落来自attb/spβc2或缺位点/spβc2条件,表明与植物假attb位点的相互作用依赖于attp位点。同样,与 attp/spβc2组合相比,来自attp/cat组合的少数阳性集落证明植物基因组中的位点特异性整合依赖于spβc2重组酶。由91个独特愈伤组织事件再生了总计126株植株,移栽到土壤中,并推进至种子收集(表7)。1.整合位点的鉴定
[0278]
基于阳性gfp信号和/或在卡那霉素选择下的产生来选择十株再生的attp/spβc2植物用于gdna提取和taqman试验。具有高质量基因组dna的5个低拷贝事件被用于基因组步移。为了用taqman拷贝数预测证实,使用基因组步移分析(未显示)从5个事件中鉴定出7个独特的插入位点。另外一个整合位点 niben101scf03735是通过在从64个再生att/spβc2植物(代表55个独特事件)中提取的gdna池上进行基因组步移来确定的。为了证实基因组步移
的结果,在插入位点上游和下游的基因组区域设计引物,并用于,其中左侧(35s侧)和右侧(specr 侧)gdna:插入物连接进行直接pcr和sanger测序(表8)。除一个位点外的所有位点确认有gdna:插入物连接。跨越天然基因座的扩增显示所有的插入物都是半合子。事件特异性扩增子的直接sanger测序证实,这些是与大丝氨酸重组酶位点特异性重组机制一致的转基因连接,所有attp载体在attp位点中间线性化,整合后未观察到载体或宿主基因组序列的丢失(图14b

e)。
[0279]
为了确定基因组步移鉴定的任何位点是否被优先用于spβc2重组酶整合,用终点pcr筛选64attp/spβc2再生事件中左侧(35s侧)gdna:插入物边界的扩增。在筛选出的8个位点中,发现3个位点在多个独特事件中重复出现(表9)。表9本氏烟草中鉴定出的spβc2假attb位点
参比基因组为solgenomics’v1.0.1支架 nrcontigs blast数据组序列中的粗体和下划线字符表示插入位点
[0280]
在原始基因组步移分析的事件以外的5个独特事件中鉴定出最常重复的插入位点niben101scf05124。对来自另外5个其它事件的左侧和右侧gdna:插入物边界扩增子进行测
序。与原始基因组步移结果一致,插入构建体和假位点在att 位点内的同一位置线性化。在插入构建体或假位点中未观察到插入或缺失(图14d 和e)。
[0281]
还查询了事件中是否存在重组酶表达构建体(id363);在benthi事件群中,最初转染id363的71个恢复事件中有5个对于id363呈pcr阳性(数据未显示)。实施例11.用重组酶定向性因子(rdf)逆转整合
[0282]
分离本氏烟草原生质体,通过原生质体转染和spβc2介导的attp供体载体的基因渗入(introgression)产生attr事件。用刀片将叶组织切成薄片,置于酶溶液(1%纤维素酶r10、0.25%离析酶r10、0.4m甘露醇、20mm kcl、20mmmes ph 5.7、10mm cacl2和0.1%bsa)中,在弱光下真空渗透20分钟。真空渗透后,室温下在黑暗中温和搅拌进行消化。消化3

4小时,然后用等体积w5(2mmmes ph 5.7,154mm nacl,125mm cacl2,5mm kcl)稀释,并通过100μm尼龙过滤器过滤。将细胞在113
×
g下沉淀2分钟,用w5洗涤一次,并在黑暗中在 w5中冰上孵育。在冰上30分钟后,沉淀细胞并以3x 105再悬浮于mmg(0.4mm 甘露醇、15mm mgcl2和4mm mes,ph 5.7)中。
[0283]
peg介导的转染在48孔深培养皿板中进行,根据实验需要增加或减少复制孔的数量。每孔中,100μl细胞与9

18μg插入dna以及4.5

9μg重组酶表达 dna混合(实验细节见附录)。添加100ul peg(40%peg,0.4m甘露醇,0.1mca(no3)2,调节至ph 10)并通过振摇充分混合。在黑暗中培养18分钟后,缓慢添加800ul w5,并在充分混合前进行8分钟驯化。细胞在805x g下沉淀5分钟,在150ul wi(4mm mes ph 5.7,20mm kcl和0.5mm甘露醇)中再悬浮,并在25℃下黑暗中培养最多3天。
[0284]
taqman证实整合是作为一个单一拷贝的半合子事件发生的。插入的构建体如图14所示,并且包含在35s启动子控制下的gfp序列。基因组步移分析鉴定了一个与本氏烟草基因组匹配的具有侧接dna序列的单一插入位点。用设计侧接用于野生型扩增的插入位点的引物进行pcr分析(预期1.5kb的扩增子)。采用 phusion green hot start ii高保真pcr mastermix(thermo#f566)进行pcr,遵守制造商关于反应设置和循环条件的建议。用zymo dna clean&concentrator 5 (#d4014)或qiagen qiaquick pcr&gel cleanup试剂盒(#28506)纯化感兴趣的pcr产物,并提交给genewiz进行sanger测序。测序结果用geneious分析。用 primer3设计引物序列。基因组r引物与插入特异性f引物配对产生预期的1.0kb 的扩增子。用图15所示的三种引物进行多重pcr,得到图16凝胶中所示的扩增子模式。萌发转化的本氏烟草的60粒t1种子,分离gdna,采用多重pcr以确定spβc2转基因在子代中的分离。结果如表10所示。表12
[0285]
用3’ha标签序列和核定位信号(nls)(seq id no:33)产生了植物密码子优化的rdf开放阅读框(seq id no:29)。翻译后的开放阅读框和rdf/ha 标签/nls序列的氨基酸序列分别提供为seq id no:31和seq id no:32。在35s 启动子和胭脂碱合酶终止序列的控制下,用rdf构建体生成载体(图17)。
[0286]
从分离分析中选出10株上述本氏烟草的纯合t1幼苗。第二次多重 pcr分析确认基
因型,以确认不存在wt插入位点。将原生质体分离、合并并等分为4份,并用以下一种方法转染每个等分:(1)无dna对照;(b)spβc2重组酶; (c)spβc2 rdf;或(d)spβc2重组酶和rdf。从转染的原生质体中分离基因组dna,并使用对wt位点(引物a d)、右边界(引物c d)和左边界(引物a b)特异性的引物组进行pcr分析,如图18所示。对pcr扩增子进行测序以确认其特性。
[0287]
pcr分析证实重组酶和rdf的共表达从基因组中切除了整合的载体(图19a)。sanger测序证实重组酶和rdf共表达后获得的wt基因座与原始的未转化基因组基因座相同,表明整合载体的切除是无痕的(图19b)。实施例13
[0288]
与attb、缺位点和负重组酶对照相比,罗马莴苣(romaine lettuce)中 attp/spβc2组合可显著增加gfp阳性和卡那霉素抗性事件的形成。attp/spβc2de的转染与培养被放大以再生一群事件,以鉴定优选的整合位点(表11)。
[0289]
通过对5个愈伤组织和1个再生植株进行下一代测序,确定了莴苣事件中的整合位点。再生植株中的位点经基因组步移证实。对于本氏烟草事件,设计了插入位点上游和下游基因组区域的引物,并用于gdna:插入物连接的直接pcr和sanger测序(表12)。直接pcr随后对扩增子进行sanger测序证实了通过下一代测序鉴定的9个整合位点中7个的gdna:插入边界(图20a和图20b)。表12:用于鉴定莴苣中spβc2插入位点的诊断引物组。
[0290]
用taqman分析了20个再生gfp阳性、卡那霉素抗性attp事件的叶组织 dna样本,以估计nptii的拷贝数。包括5个无质粒转染事件和3个推定的空事件(gfp

负和/或非卡那霉素选择)作为阴性对照。
[0291]
一个事件被任意设置为单拷贝参照,但无论哪个事件被设置为参照,rq 值都归入3组,分别为零拷贝、低拷贝和高拷贝。无质粒转染事件和推定的空事件都属于零拷贝类型。在gfp阳性卡那霉素抗性事件中,4例为高拷贝,其余16例为低拷贝(数据未显示)。
[0292]
除了20个gfp阳性卡那霉素抗性的再生事件外,还对35个gfp阳性卡那霉素抗性愈伤组织进行gdna提取和插入分析。由于愈伤组织中存在环状非整合质粒的可能性,这些事件没有通过qpcr分析npt

ii拷贝数。通过终点pcr筛选55个gfp阳性卡那霉素抗性的attp/spβc2事件中7个先前鉴定的整合位点各自的右侧gdna:插入物连接(specr侧)。在多个独特事件中鉴定出7个插入位点中的4个,整合位点之一在8个事件中被发现,包括通过下一代测序鉴定出的2 个事件(表13)。在7493878位点整合的3个事件中对来自左侧和右侧gdna:插入物边界的扩增子进行sanger测序,发现了与最初确定的边界相比在插入物:gdna 重组位点中有1bp的差异(图20c

e)。如在benthi中进行的,还对群体中重组酶表达构建体(id363)存在进行了筛选;在20个再生的attp/spβc2事件中发现了 2个(数据未显示)。表13莴苣中鉴定出的spβc2 attb位点
参照基因组是加州大学戴维斯分校基因组中心michelmore实验室的未掩蔽vv8。序列中的粗体和下划线字符表示插入位点。实施例14
[0293]
制备了另一构建体,提供了spβc2丝氨酸重组酶通过接头与带有ha和 nls标签的spβc2rdf融合的融合蛋白。该构建体的核酸序列为seq id no:35,氨基酸序列为seq id no:40。组成的核酸序列包括spβc2密码子优化的丝氨酸重组酶(seq id no:36),spβc2 rdf(seq id no:38)、接头序列(seq id no:37) 以及ha和nls标签(seq id no:37)。对应于这些的氨基酸序列为:spβc2密码子优化的丝氨酸重组酶(seq id no:41),spβc2 rdf(seq id no:42)、接头序列(seq id no:43)以及ha和nls标签(seq id no:44)。该构建体的示意图如图21a所示。如上所述,多重pcr用于鉴定莴苣事件和benthi事件具有特征性整合位点的纯合子后代。原生质体是分离的纯合个体,合并并用spβc2重组酶或重组酶rdf融合构建体转染。从转染的原生质体中分离基因组dna,并使用对wt基因座(引物a d)、右边界(引物c d)和左边界(引物a b)特异性的引物组进行pcr分析,如图18所示。对pcr扩增子进行测序以确认其特性。如上图所示,使用本氏烟草(图21b)和莴苣(图21c)的融合构建体进行的pcr 的
例子证明了用融合重组酶

rdf构建体转染后天然位点的扩增。sanger测序证实在本氏烟草和莴苣中转染spβc2重组酶/rdf融合构建体后野生型序列完美恢复 (图21d,分别为顶部和底部)。实施例15.rdf

介导的切除的荧光酶分析
[0294]
创建了一个切割报告质粒以证明rdf介导的切割(图22)。图22(左) 显示了spβc2切除报道载体图谱,其中spβc2 attl和attr位点用蓝色虚线表示,连接spβc2

rec

rdf融合蛋白存在时的预期重组位点。在spβc2 rec rdf切除后预期有两种不同的环形产物,其中含荧光素酶orf的荧光素酶表达微环(顶部),其在切除后与cmylcv启动子连接,激活报告基因表达,而主链微质粒(底部,右侧)产物含有复制起始点(puc ori)、大观霉素抗性基因(specr)和卡那霉素抗性基因(nptii)。
[0295]
对于检测rdf介导的切除的荧光素酶分析,将50ul的d

荧光素溶液(10 mg/ml,溶于wi缓冲液)与50ul转染原生质体溶液一起添加到白色96孔板中。样品用带有大口径尖端的移液管混合,并使用fluostar omega平板阅读器立即测量发光。结果如图23所示,特别是在与切除报告载体 spβc2 rec

rdf融合蛋白表达载体共转染后,在莴苣叶肉原生质体中检测到荧光素酶表达,但是当原生质体仅含切除报告载体或切除报告载体 spβc2重组酶时,或当原生质体未转染任何构建体时,未检测到荧光素酶表达。这说明rdf介导的切割是特异性和精确的。
[0296]
为了确认切除报告载体中rdf介导的切除的特异性,从转染的原生质体中分离总基因组dna并用两组不同的引物进行查询,全长切除报告载体或切除的环状产物的预期大小如图24a所示。图24b显示了切除报告载体图谱,并用载体外侧的箭头表示大致的引物位置。图24c显示实验的pcr结果,仅在切除报告载体 spβc2 rec

rdf融合表达载体共转染后观察到预期的切除产物扩增子。
[0297]
图25显示了与attl/attr切除报告载体和rec

rdf表达载体共转染后获得的切除特异性扩增子的sanger测序结果。图25a显示了新形成的attp位点,侧接cmylcv启动子和荧光素酶orf。图25b显示了主链小质粒内新形成的attb 位点。图25c

f显示典型spβc2 attp、attb、attl和attr位点,黑框和灰框分别对应于attp和attb位点的序列元件(改编自abe等2014)。实施例16.基因开关控制的rdf介导的切除
[0298]
为了证明按需控制rdf介导的切除的能力,将spβc2 rec_rdf融合orf 克隆以及配体反应性蜕皮激素受体(cfecrvy)和rxr_edll结构域克隆到基因开关启动子前面,该启动子具有gal4 dna结合位点(gs

gal4 dbs)(图26)。在莴苣和鳄梨原生质体中测试了该基因开关控制rdf介导的切除的能力。莴苣原生质体的分离如实施例10所述。对于鳄梨,用刀片将叶组织切成薄片,置于酶溶液(1%纤维素酶r10、0.25%离析酶r10、0.4m甘露醇、20mm kcl、20mm mesph 5.7、10mm cacl2和0.1%bsa)中,在弱光下真空渗透20分钟。真空渗透后,室温下在黑暗中温和搅拌进行消化。在1mg/ml mes中用酶溶液(2%纤维素酶rs、 1%半纤维素酶、1%离析酶r10和0.5%果胶酶)进行消化,并真空渗透20分钟。消化过夜,原生质体随后滤过40微米滤器以去除碎片,并洗涤2次以去除残余酶。如实施例11所述进行peg介导的转染。
[0299]
切除报告载体与35s

rec、35s

rec

rdf或基因开关/rec

rdf共转染到野生型莴苣
或鳄梨原生质体中,每种处理都与或不与甲氧虫酰肼(mtf)孵育。在莴苣中,转染后3天,荧光素酶试验显示在mtf存在下基因开关的诱导率为4

5 倍,而在配体存在下所有其他处理没有变化或显示荧光素酶活性降低(图27a)。在鳄梨中,与对照(未经mtf处理)相比,mtf存在下基因开关/rec

rdf的诱导约为10倍(图27b)。实施例17单子叶植物中丝氨酸重组酶介导的转基因事件1.玉米
[0300]
以玉米未成熟胚(zea mays(玉米)b105)为胚性组织源,评估通过金颗粒生物弹射传递spβc2 attp整合载体和重组酶表达载体在整合后的attr。
[0301]
在温室条件下栽培玉米植物(zea mays(玉米)b105),授粉后11天收获幼穗,4℃储藏直到切除胚,通常在收获后3

7天。去皮去丝,两头各切2~3cm,穗用70%乙醇浸泡并温和振摇10分钟。然后用无菌去离子水冲洗穗3次,从果仁中取出胚,并从剩余的胚乳中分离出来。胚被移植到诱导培养基上,子叶侧朝上,并在黑暗中28℃培养5天。
[0302]
为了尽量减少来自基因组剪切或随机整合的生物弹射事件的数目,进行了初步实验,以确定在轰击后24小时持续诱导gfp荧光灶所需的最小dna量(未显示)。利用pds

100/he颗粒轰击系统,用0.6μm金微载体和1100psi破裂膜片如前所述将spβc2重组酶表达和attp整合的质粒导入玉米未成熟胚中(lowe,b.a., prakash,n.s.,way,m.,mann,m.t.,spencer,t.m.,和boddupalli,r.s.(2009)。通过使用少量dna的颗粒轰击增强玉米中的单拷贝整合事件。transgenic research, 18(6),831)。最终浓度为10ng的每个载体(attp

gfp

nptii整合载体和重组酶表达载体)/次轰击用于随后的实验。轰击后72小时,当attp

gfp

nptii整合载体单独或与spβc2表达载体联合传递时,gfp灶数目或强度无明显差异(未显示)。
[0303]
每周收集未成熟胚并进行联合轰击,用两种载体联合轰击了共1120个胚。颗粒轰击后,胚被转移到休整培养基上,子叶侧朝上,并在黑暗中28℃培养5天。将胚转移到选择培养基中,于28℃在黑暗中培养28天。选择培养基上出现的健康愈伤组织转移到芽增殖培养基上,于28℃培养7天,明暗比为18:6。然后将愈伤组织转移到芽伸长培养基中,于28℃培养14~28天,明暗比为18:6。最后,≥2cm 的芽被移入生根培养基中,培养至形成健壮的根。
[0304]
在轰击后3周,组织正在进行体细胞胚胎发生,gfp荧光部分在蓝光下用适当滤光片清晰可见(图28)。在nptii选择下诱导体细胞胚萌发,并从个体事件中收集叶组织进行表征。选择在nptii选择上再生的总共20个attp spβc2事件进行初步分析。在液氮下研磨冷冻的叶片组织,并在60℃在2x ctab缓冲液(2%十六烷基三甲基溴化铵,100mm tris ph 8.0,20mm edta,1.4m nacl和1%pvpmw 40k)中孵育30分钟。沉淀碎片,用rna酶a在37℃下处理澄清的裂解物15分钟,然后氯仿萃取和乙醇沉淀。dna沉淀在水中重新水合,通过纳米液滴定量,并在0.6%tbe琼脂糖凝胶上可视化。用nptii和gfp的基因特异性引物组筛选两种转基因的存在。采用phusion green hot start ii高保真pcr mastermix (thermo#f566)进行pcr,遵守制造商关于反应设置和循环条件的建议。使用 clontech universal genomewalker
tm
2.0试剂盒(#636405)根据制造商的说明进行基因组步移。用neb的drai制备文库。表14列出了用于玉米事件遗传特征的所有引物。
用zymo dna clean&concentrator 5(#d4014)或qiagen qiaquick pcr&gelcleanup试剂盒(#28506)纯化感兴趣的pcr产物,并提交给genewiz进行sanger 测序。使用ncbi上可及的geneious和玉米(zea mays)参照基因组分析测序结果。用primer3消化基因组侧翼序列的引物。用pcr预筛选鉴定两个转基因盒稳定整合的事件(图29),并用基因组步移分析(clontech)鉴定载体整合基因座。通过基因组步移分析和直接pcr扩增,发现一个单一事件具有与spβc2 attr整合机制一致的转基因::gdna连接(图30)。图30a显示用于连接特异性pcr扩增的引物设计的示意图。图30b显示这样的 pcr结果,其显示转基因::gdna连接的事件特异性扩增。attr中列出的两个条带是来自同一胚胎@@的姐妹事件。图30c显示了这样的序列,其源自(从上到下)wt基因组参照序列、wt扩增的序列、attp载体序列、连接特异性pcr扩增子和基因组步移分析。图30d显示了玉米attr与连接位点整合的假位点序列。2.水稻
[0305]
carolina gold水稻种子(baker creek heirloom seeds)脱壳并用75%乙醇灭菌1分钟,用3%次氯酸钠和吐温20灭菌1小时,然后用无菌去离子水漂洗5 次,在第4次和第5次漂洗之间浸泡20分钟。吸干种子,并放置在phytatrays中的1/2ms与7g/l phytoblend中,24小时避光25℃。通过35s

gfp

nos表达验证了黄化水稻幼苗的原生质体分离和dna转染(图31)。将黄化幼苗的茎和鞘组织用刀片切成薄片,置于酶溶液(1.5%纤维素酶rs、0.75%离析酶r10、0.6m甘露醇、10mm mes ph 5.7、10mm cacl2和0.1%bsa)中,在弱光下真空渗透20分钟。真空渗透后,室温下在黑暗中温和搅拌进行消化。在酶溶液中孵育4小时后,温和添加等体积w5溶液(154mm nacl、125mm cacl2、5mm kcl和2mm mesph 5.7),并通过40μm尼龙
细胞过滤器过滤消化物。通过在201xg离心3分钟使细胞沉淀,用w5溶液洗涤一次,并以1.6x106细胞/ml在mmg(400mm甘露醇、 15mm mgcl2和4mm mes ph 5.7)中重新悬浮。
[0306]
peg介导的转染在48孔深培养皿板中进行,根据实验需要增加或减少复制孔的数量。每孔100ul细胞与9μg插入dna以及4.5μg重组酶表达dna混合。加入100ul peg(40%peg4000,0.2m甘露醇,0.1m cacl2),振摇充分混合。在黑暗中孵育15分钟后,缓慢添加440ul w5,并在充分混合前进行8分钟驯化。细胞在805x g下沉淀5分钟,在150ul wi(4mm mes ph 5.7,20mm kcl 和0.5mm甘露醇)中再悬浮,并在25℃下黑暗中孵育3天。用spβc2

attp整合载体和重组酶表达载体共转染共计290万个水稻原生质体。共转染3天后从转染的原生质体池中分离基因组dna,并直接对合并的原生质体dna进行基因组步移分析。简单说,从用spβc2表达载体和spβc2

attp整合载体共转染的水稻原生质体池中分离总gdna:通过在尿素缓冲液(6.9m尿素、350mm氯化钠、50mm tris

clph8、20mm edta ph8和1%sarkosyl)中裂解细胞,用苯酚和氯仿萃取,并用异丙醇预沉淀。如上所述进行基因组步移分析,合并来自左右边界的一级和二级扩增子,并清洗柱。
[0307]
使用pacbio sequel仪ii和扩增子测序工作流程,将基因组步移扩增子“涂片”发送给genewiz进行下一代测序。总ccs读数是组装至完整spβc2

attp位点的参考,潜在的gdna::转基因连接通过视觉识别。利用blast针对ncbi参照基因组来查询attp位点内具有推定连接的扩增子读取,以鉴定基因组整合基因座。 attr连接的跨物种比对用默认设置的clustal算法在geneious中进行。图32a显示pacbio ccs序列读取参照组装到完整spβc2 attp位点。加框区域显示attp位点内推定的gdna连接。图32b显示了针对水稻基因组进行blast搜索并与基因组序列(顶部)和spβc2 attp整合载体(底部)比对的选定扩增子读数。图32c显示了水稻spβc2假位点(连接位置用粗体和下划线标记)。所选的水稻扩增子读数与先前鉴定的莴苣和本氏烟草连接位点的比对与attr大丝氨酸重组酶整合机制一致(图33)。实施例18.sf370大丝氨酸重组酶介导dna整合入细胞
[0308]
评估sf370大丝氨酸重组酶的表达中整合含有关联att位点的载体的增强,包括将两个质粒共转染到莴苣叶肉原生质体中:(1)重组酶表达载体或cat 填充对照,以及(2)包含gfp、nptii和关联attp、attb或缺位点对照的整合载体。所有载体在有或没有卡那霉素的情况下再生,使用蓝色“生物光”和适当的发射滤光片评估gfp的表达。
[0309]
用罗马莴苣研究了sf370将dna整合入植物的能力。用刀片将叶组织切成薄片,置于酶溶液(1%纤维素酶r10、0.25%离析酶r10、0.4m甘露醇、20mmkcl、20mm mes ph 5.7、10mm cacl2和0.1%bsa)中,在弱光下真空渗透20 分钟。真空渗透后,室温下在黑暗中温和搅拌进行消化。
[0310]
在酶溶液中孵育2小时后,温和添加一半体积的200mm cacl2,并通过 70um尼龙细胞过滤器过滤消化物。通过163
×
g离心3分钟沉淀细胞,用francheschi 溶液(0.4m甘露醇,1.5mm cacl2,5mm hepes,1g/l bsa ph 5.7)洗涤细胞一次,然后在黑暗中冰上在francheschi溶液中孵育30分钟。冰孵育30分钟后,沉淀细胞,以3x 105个细胞/ml再悬浮在mamg(0.4m甘露醇,15mm mgcl2) 中。
[0311]
peg介导的转染在48孔深培养皿本中进行,根据实验需要增加或减少复制孔的数量。每孔100ul细胞与9ug插入dna以及4.5重组酶表达dna混合。添加100ul peg(40%peg,0.4m甘露醇,0.1m ca(no3)2,调节至ph 10)并通过振摇充分混合。在黑暗中培养18分钟后,
缓慢添加800ul w5,并在充分混合前进行8分钟驯化。细胞在805x g下沉淀5分钟,在150ul wi(4mm mes ph 5.7, 20mm kcl和0.5mm甘露醇)中再悬浮,并在25℃下黑暗中孵育过夜。转染后6 周记录集落计数(表15)。
[0312]
为了鉴定载体整合位点,对来自该条件的5个独立集落进行了基因组步移。基于基因组步移分析,对两个事件鉴定转基因:gdna边界,并设计插入特异性引物,以直接扩增和对每个事件的左右边界测序(图34a)。箭头表示用于直接扩增转基因:gdna边界序列的引物。由于两个推定的整合位点都位于重复区域内,因此为每个左和右边界设计了两个独立的引物。图34b显示了两个sf370事件的 pcr结果以及未经选择再生的无转基因事件(无dna对照)。图34c显示了预期的扩增子大小,灰色字体表示成功扩增。
[0313]
两个事件的两个边界的sanger序列分析与大丝氨酸重组酶位点特异性整合机制一致,其中sf370 attp载体在attp位点中间线性化,整合后未观察到载体或宿主基因组序列的丢失。图35显示了wt莴苣sf370假位点1(顶部)和假位点2(底部)与转基因:gdna序列谱图和典型sf370 attp位点的比对。每个比对上方的箭头表示连接位点。左右边界的谱图可用于两个位点,但每个位点仅显示一个边界。根据加州大学戴维斯分校基因组中心(uc davis genome center)的未掩蔽 vv8莴苣基因组,列出了莴苣整合基因座(sf370假attb位点)的完整序列和基因组位置(表16)。莴苣中鉴定的sf370 attb位点在表17中示出,以黑体字和下划线突出显示连接位点。表16:用于确认莴苣中sf370位点的诊断引物组。
表17莴苣中鉴定的sf370 attb位点参照基因组是加州大学戴维斯分校基因组中心michelmore实验室的未掩蔽vv8。序列中的粗体和下划线字母表示插入位点。实施例19.植物中丝氨酸重组酶介导整合的假位点分析
[0314]
基于spβc2介导的dna整合中获得的数据,对重复发现的7个所选插入位点在插入位点周围 /

20bp区域进行了保守性分析。核苷酸分布矩阵由序列组生成,其中插入位点根据事件数(共31个序列)重复。
[0315]
为了分析高频出现的插入序列,根据事件的数目将插入序列多次添加到输入序列文件中。这就产生了一个序列文件,总共包含31个序列。用这31条序列 ( /

20bp围绕插入
位点)作为matdefine的输入(quandt,k等(1995)《核酸研究》23:4878

4884;cartharius,k等(2005年)《生物信息学》21:2933

2942),其具有未锚定的序列比对。为了从所有序列中定义一个矩阵,矩阵中包含的最小矩阵相似性被降低到0.6。结果如表18所示。结果如表18所示。iupac共有序列中标记为红色的碱基对显示高信息含量(ci值>60)。大写的碱基对
表示当用该核苷酸分布矩阵搜索序列时matinspector使用的核心序列。
[0316]
matinspector程序(quandt等(1995年);cartharius等(2005年)) 用于搜索所有20个插入序列(插入位点周围 /

30bp)和三个植物基因组(拟南芥、玉米和大豆)中与所限定的核苷酸分布矩阵的匹配。matinspector已经使用不同的搜索阈值(核心相似性、矩阵相似性)运行了多次。选择阈值是为了找到所有选定的七个插入序列,优选是找到两次以上的三个插入序列,并减少基因组匹配的数量。
[0317]
表19显示了具有矩阵匹配的插入序列的数量(来自所有序列和所选序列)。最后一栏列出了matinspector使用给定参数找到的所选插入序列。
[0318]
为了检查所定义的核苷酸分布矩阵是否适用于鉴定优选插入位点,用 matinspector使用扫描20条插入序列所用的相同参数集扫描了三个植物基因组的基因组序列。扫描的基因组是:(1)拟南芥(tair10.1,总长度=119,668,634bp);(2) 玉米(b73 refgen v4,总长度=2,135,083,061bp);和(3)大豆(大豆v2.1,总长度=979,046,046bp)。用31条序列定义的矩阵进行检索,得到了表20中的结果。
[0319]
该表包括,当使用仅识别两个以上事件中发现的三个插入序列的高阈值进行检索时,由矩阵(由重复的插入序列定义)发现的匹配数非常特异性。由于在玉米和大豆基因组
中发现的匹配可能是候选的优选插入位点,因此对这些匹配进行了进一步调查。
[0320]
利用genomatixsuite任务“注释与统计”对玉米中的16个矩阵匹配和大豆中的43个矩阵匹配进行了注释。此外,已提取了匹配序列并与多重比对程序 dialign(morgenstern,b.等(1996)proc.natl.acd.sci.usa 93:12098

12103; morgenstern,b.等(1998)bioinformatics 14:290

294;morgenstern,b.(1998) bioinformatics 15:211

218)进行了比对。序列比对是为了排除匹配是基因组重复的可能性。
[0321]
玉米中16个匹配的注释如表21所示。
[0322]
部分外显子意味着该区域与外显子重叠。启动子位于基因间区,因此额外注释。玉米基因组的10条染色体中有8条(染色体1、3、4、5、7、8、9、10) 存在匹配。
[0323]
大豆中43个匹配的注释如表22所示。大豆中43个匹配的注释如表22所示。
[0324]
部分外显子意味着该区域与外显子重叠。启动子位于基因间区,因此额外注释。在
大豆基因组的20条染色体中,有18条染色体是匹配的(除了染色体 18和20以外的所有染色体)。
[0325]
图36显示了16个玉米匹配的比对。图36的共有序列是:mhrdhnndwn wrmaachatw aadnnghdhh whnvadhnhn(seq id no:98)其具有核心序列:mhrdhnndwn wrmaachatw aadnnghdhh w(seq id no:99)。
[0326]
图37显示了43个大豆匹配的比对。图37的共有序列是: nnnnnnnnnw nhaachatwa hdnnrnnnnn nnnwddnnn(seq id no:100)其具有核心序列:wnhaachatw ahdnnr(seq id no:101)。
[0327]
比对下方的“*”符号表示每个比对位置的核苷酸相似性。如果所有核苷酸都相同,则显示10个“*”符号。在玉米比对中,对于比对中的9个位置,所有核苷酸都是相同的。在大豆比对中,对于比对中的6个位置,所有核苷酸都是相同的。所有其他位置的比对有较低的核苷酸相似性。实施例20.翻转插入物
[0328]
为了确定插入物是否总是以相同的方向整合,还通过终点pcr将插入物对侧上的引物与原始内源性引物配对来筛选群体。例如,引物3与引物4配对,以在原始朝向上筛选右边界(specr侧)。引物2与引物4配对,以在“翻转”朝向上筛选右边界(35s侧)(图38)。对莴苣和本氏烟草的多个事件中重复的所有7个“优选”整合位点进行翻转插入的筛选。在莴苣7493878位点的3个事件中发现了翻转插入物;在筛选出的位点中,这是唯一一个有翻转插入物的位点。
[0329]
当id373以原始朝向插入7493878位点时,插入物或gdna序列均未出现增加或丢失,但在id373以翻转朝向插入的事件之一中,从左侧(35s侧)gdna: 插入物边界可看到350bp的缺口。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献