一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

内源性植物表达增强子的制作方法

2021-11-20 07:09:00 来源:中国专利 TAG:


1.本发明涉及在植物中有活性的表达增强子。本发明还涉及在植物中表达目的蛋白质,并且提供了用于在植物中产生目的蛋白质的方法和组合物。


背景技术:

2.植物作为重组蛋白质的产生系统具有巨大潜力。在植物中产生外源蛋白质的一种方法是产生稳定的转基因植物品系。然而,这是耗时且劳动密集的过程。转基因植物的一种替代方法是使用基于植物病毒的表达载体。基于植物病毒的载体可使蛋白质在植物中快速、高水平、瞬时表达。
3.使用基于rna植物病毒的载体已经获得了植物中外源蛋白质的高水平瞬时表达,该病毒包括豇豆花叶病毒属病毒,诸如豇豆花叶病毒(cpmv;参见例如wo2007/135480;wo2009/087391;us2010/0287670,sainsbury f.等人,2008,plant physiology;148:121

1218;sainsbury f.等人,2008,plant biotechnology journal;6:82

92;sainsbury f.等人,2009,plant biotechnology journal;7:682

693;sainsbury f.等人,2009,methods in molecular biology,recombinant proteins from plants,第483卷:25

39)。
4.当豇豆花叶病毒(cpmv)的rna

2的5’utr发生修饰时,与野生型cpmv 5’utr相比产生了额外的表达增强子活性(如由目的核酸或目的蛋白质的表达水平确定)。例如,cpmv rna

2载体(u162c;ht)中第161位起始密码子的突变提高了由在第512位起始密码子之后插入的序列编码的蛋白质的表达水平。这使得不需要病毒复制产生就可以产生高水平外源蛋白质,称为cpmv

ht系统(wo2009/087391;sainsbury和lomonossoff,2008,plant physiol.148,1212

1218)。在peaq表达质粒(sainsbury等人,2009,plant biotechnology journal,7,682~693页;us 2010/0287670)中,待表达的序列位于5’utr和3’utr之间。peaq系列中的5’utr带有u162c(ht)突变。
5.已经描述了cpmv 5’utr区的其他修饰,其进一步提高了植物中目的核酸的表达。例如“cmpv ht ”(包含cpmv 5’utr的核苷酸1

160,在位置115

117和位置161

163处具有修饰的atg;wo2015/143567;其通过引用并入本文)以及“cpmvx”(长度为x=160、155、150或114个核酸;wo2015/103704;其通过引用并入本文)。cmpvx的一个实例是表达增强子“cpmv 160”。与使用操作性地连接“cpmv ht”表达增强子的相同核酸序列产生相同目的蛋白质相比,操作性地连接“cpmv ht ”的核酸序列的表达导致由该核酸序列编码的目的蛋白质的产生显著增加(参见wo2015/143567的图2和图3)。此外,使用操作性地连接“cpmv ht ”表达增强子的相同核酸序列产生相同目的蛋白质相比,操作性地连接“cpmv 160”表达增强子的核酸序列的表达导致该核酸序列编码的目的蛋白质的产生显著增加(参见wo2015/143567的图2和图3)。
6.diamos等人(frontiers in plant science,2016,第7卷1

15页;其通过引用并入本文)描述了几种表达增强子,其可用于提高植物中蛋白质的产量(参见diamos等人的表2,包括表达增强子nbpsak2 3’)。如diamos等人(2016)的图4所示,与操作性地连接其他截短
的psak表达增强子的相同核酸序列编码的相同蛋白质的产生相比,操作性地连接nbpsak2 3’的核酸编码的目的蛋白质的产生导致增强蛋白质的产生。


技术实现要素:

7.本发明涉及在植物中有活性的表达增强子。本发明还涉及在植物中表达目的蛋白质,本发明还提供了在植物中产生目的蛋白质的方法和组合物。
8.本发明的目的是提供一种在植物中有活性的改善表达增强子。
9.根据本发明,提供了在植物中有活性的分离的表达增强子,该表达增强子选自由以下各项组成的组:
10.nbepi42(seq id no:1);
11.nbsns46(seq id no:2);
12.nbcsy65(seq id no:3);
13.nbhel40(seq id no:4);
14.nbsep44(seq id no:5);以及
15.与seq id no:1

5中任一个所述的核苷酸序列具有90~100%的序列一致性的核酸。其中,当该表达增强子操作性地连接到目的核酸(例如目的异源核酸)时使得该目的核酸表达。此外,与未操作性地连接表达增强子或者例如操作性地连接到现有技术表达增强子cpmv 160(seq id no:6)的相同目的核酸或异源核酸的表达水平相比,当该表达增强子操作性地连接到目的核酸(例如目的异源核酸)时,可提高目的核酸或目的异源核酸的表达水平。
16.本发明还提供了一种核酸序列,其包含如上所述的分离的表达增强子中的一种,所述表达增强子与编码目的蛋白质的异源核苷酸序列操作性地连接。该异源核苷酸序列可以编码病毒蛋白质或抗体,例如,不被认为其是限制性的,病毒蛋白质可以是流感蛋白质或诺如病毒蛋白质。如果目的蛋白质是流感蛋白质,那么它可以包括m2、血凝素蛋白质,其选自由以下各项组成的组:h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16、b型流感血凝素,或其组合。如果目的蛋白质是诺如病毒蛋白质,则其可以包括vp1蛋白质、vp2蛋白质或其组合,选自由以下各项组成的组:gi.1、gi.2、gi.3、gi.5、gi.7、gii.1、gii.2、gii.3、gii.4、gii.5、gii.6、gii.7、gii.12、gii.13、gii.14、gii.17和gii.21。
17.本发明还提供了一种植物表达系统,该植物表达系统包含一个或多个上述核酸序列。该植物表达系统可以进一步包含豇豆花叶病毒的3’utr。
18.本发明还提供了一种植物表达系统,该植物表达系统包含上述与异源核酸或核苷酸序列操作性地连接的一个或多个分离的核酸序列。该植物表达系统可以进一步包含豇豆花叶病毒的3’utr。
19.本文还公开了在植物或植物的一部分中产生目的蛋白质的方法,该方法包含:将上述植物表达系统引入植物或植物的一部分中,并在允许每个编码目的蛋白质的异源核苷酸序列表达的条件下培养该植物、植物的一部分或植物细胞,所述植物表达系统包含一个或多个核酸序列。例如,目的蛋白质可以是病毒蛋白质,诸如流感蛋白质或诺如病毒蛋白质。如果目的蛋白质是流感蛋白质,那么它可以包括m2、血凝素蛋白质,其选自由以下各项组成的组:h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16、b型流感血凝
素、及其组合。如果目的蛋白质是诺如病毒蛋白质,则其可以包括vp1蛋白质、vp2蛋白质或其组合,选自由以下各项组成的组:gi.1、gi.2、gi.3、gi.5、gii.1、gii.2、gii.3、gii.4、gii.5、gii.6、gii.7、gii.12、gii.13、gii.14、gii.17和gii.21。
20.本文还描述了产生目的多聚体蛋白质的方法。该方法涉及以稳定或瞬时的方式在植物、植物的一部分或植物细胞中共表达两个或多于两个的上述核酸序列,其中所述两个或多于两个的每个核酸序列编码多聚体蛋白质的成分,并在允许每个编码目的多聚体蛋白质的异源核苷酸序列表达的条件下培育植物、植物的一部分或植物细胞。
21.本文还提供了用上述植物表达系统瞬时转化或稳定转化的植物、植物的一部分或植物细胞。
22.包含如本文所述的表达增强子的基于植物的表达系统导致目的核酸的表达。此外,包含如本文所述的表达增强子的基于植物的表达系统导致提高或增强了编码与该表达增强子操作性地连接的异源开放阅读框的核苷酸序列的表达。可通过将使用本文所述的表达增强子获得的表达水平与编码异源开放阅读框但未与表达增强子操作性地连接或者例如与现有技术的表达增强子cpmv 160(seq id no:6)操作性地连接的相同核苷酸序列的表达水平进行比较,来确定表达增加。
23.包含一种或多种如本文所述的表达增强子的基于植物的表达系统、载体、构建体和核酸还可具有多种性质,例如含有用于目的基因或核苷酸序列的合适的克隆位点,它们可以用于以经济有效的方式容易地转化植物,它们可以引起接种植物的有效局部或系统转化。此外,植物的转化可提供有用蛋白质材料的良好产量。
24.本发明内容不必描述本发明的所有特征。
附图说明
25.通过以下参考附图的描述,本发明的这些和其他特征将变得更加明确,其中:
26.图1a是现有技术,并且示出了通过表达编码以下每一种蛋白质的核酸而在植物中产生的流感h1加利福尼亚、h3维多利亚、h5印度尼西亚和b威斯康星的相对滴度,其中核酸操作性地连接cpmv ht表达增强子(描述于wo2009/087391)或cpmv 160 表达增强子(描述于wo2015/103704)。图1b是现有技术,并且示出了通过表达编码以下每一种蛋白质的核酸而在植物中产生的h1加利福尼亚、h3维多利亚、b布里斯班、b布里斯班 h1tm、b马萨诸塞、b马萨诸塞 h1tm、b威斯康星和b威斯康星 h1tm的相对滴度,其中核酸操作性地连接cpmv ht表达增强子(描述于wo2009/087391)或cpmv 160 表达增强子(描述于wo2015/103704)。
27.图2a示出了通过表达编码dasher蛋白质的核酸而在植物中产生的dasher蛋白质(dasher gfp;fpb

27 269;来自atum)(一种胞质蛋白质)的荧光活性,其中编码dasher蛋白质的核酸操作性地连接到:表达增强子cpmv 160(seq id no:6;描述于wo2015/103704)、nbmt78(seq id no:7;描述于2018年3月14日提交的美国临时申请号62/643,053);athsp69(seq id no:8;描述于2018年3月14日提交的美国临时申请号62/643,053);nbepi42(seq id no:1);nbsns46(seq id no:2);nbcsy65(seq id no:3);nbhel40(seq id no:4);和nbsep44(seq id no:5)。图2b示出了胞质诺如病毒gii.4/sydney 2012vp1病毒样颗粒(vlp)的相对产量,在梯度离心后,通过表达编码诺如病毒vp1蛋白质的核酸,在植物中产生vlp,其中每个编码vp1蛋白质的核酸操作性地连接到:表达增强子cpmv 160(seq id no:6;
atsns46

vp1(gii.4syd12)

cpmv 3’utr/nos);图5f示出了构建体6215(2x35s
‑5’
utr atcsy65

vp1(gii.4syd12)

cpmv 3’utr/nos);图5g示出了构建体6216(2x35s
‑5’
utr athel40

vp1(gii.4syd12)

cpmv 3’utr/nos);图5h示出了构建体6217(2x35s
‑5’
utr atsep44

vp1(gii.4syd12)

cpmv 3’utr/nos)。
31.图6示出了编码igg1(利妥昔单抗)的构建体:图6a示出了构建体4641(2x35s
‑5’
utr cpmv 160

sppdi

hc igg1

cpmv 3’utr/nos);图6b示出了构建体4642(2x35s
‑5’
utr cpmv 160

sppdi

lc igg1

cpmv3’utr/nos);图6c示出了构建体6600(2x35s
‑5’
utr nbmt78

sppdi

lc igg1

cpmv 3’utr/nos);图6d示出了构建体6601(2x35s
‑5’
utr nbmt78

sppdi

hc igg1

cpmv 3’utr/nos);图6e示出了构建体6602(2x35s
‑5’
utr athsp69

sppdi

lc igg1

cpmv 3’utr/nos);图6f示出了构建体6603(2x35s
‑5’
utr athsp69

sppdi

hc igg1

cpmv3’utr/nos);图6g示出了构建体6604(2x35s
‑5’
utr nbepi42

sppdi

lc igg1

cpmv 3’utr/nos);图6h示出了构建体6605(2x35s
‑5’
utr nbepi42

sppdi

hc igg1

cpmv 3’utr/nos);图6i示出了构建体6606(2x35s
‑5’
utr nbsns46

sppdi

lc igg1

cpmv 3’utr/nos);图6j示出了构建体6607(2x35s
‑5’
utr nbsns46

sppdi

hc igg1

cpmv3’utr/nos);图6k示出了构建体6608(2x35s
‑5’
utr nbcsy65

sppdi

lc igg1

cpmv 3’utr/nos);图6l示出了构建体6609(2x35s
‑5’
utr nbcsy65

sppdi

hc igg1

cpmv 3’utr/nos);图6m示出了构建体6610(2x35s
‑5’
utr nbhel40

sppdi

lc igg1

cpmv3’utr/nos);图6n示出了构建体6611(2x35s
‑5’
utr nbhel40

sppdi

hc igg1

cpmv 3’utr/nos);图6o示出了构建体6612(2x35s
‑5’
utr nbsep44

sppdi

lc igg1

cpmv 3’utr/nos);图6p示出了构建体6613(2x35s
‑5’
utr nbsep44

sppdi

hc igg1

cpmv3’utr/nos);sp:信号肽。
32.图7示出了编码h1

a/michigan/45/2015的构建体:图7a示出了构建体3703(2x35s
‑5’
utr cpmv 160

sppdi

h1 a

mich

45

2015

cpmv3’utr/nos);图7b示出了构建体4703(2x35s
‑5’
utr nbmt78

sppdi

h1a

mich

45

2015

cpmv 3’utr/nos);图7c示出了构建体4704(2x35s
‑5’
utr nbhsp69

sppdi

h1 a

mich

45

2015

cpmv3’utr/nos);图7d示出了构建体6700(2x35s
‑5’
utr nbepi42

sppdi

h1a

mich

45

2015

cpmv 3’utr/nos);图7e示出了构建体6701(2x35s
‑5’
utr nbsns46

sppdi

h1 a

mich

45

2015

cpmv3’utr/nos);图7f示出了构建体6702(2x35s
‑5’
utr nbcsy65

sppdi

h1a

mich

45

2015

cpmv 3’utr/nos);图7g示出了构建体6703(2x35s
‑5’
utr nbhel40

sppdi

h1 a

mich

45

2015

cpmv3’utr/nos);图7h示出了构建体6704(2x35s
‑5’
utr nbsep44

sppdi

h1a

mich

45

2015

cpmv 3’utr/nos);sp:信号肽。
33.图8示出了编码h3

a/singapore/19/0019

16的构建体:图8a示出了构建体4008(2x35s
‑5’
utr cpmv 160

sppdi

h3a

sing

19

0019

16

cpmv 3’utr/nos);图8b示出了构建体6134(2x35s
‑5’
utr nbmt78

sppdi

h3 a

sing

19

0019

16

cpmv3’utr/nos);图8c示出了构建体6136(2x35s
‑5’
utr nbhsp69

sppdi

h3a

sing

19

0019

16

cpmv 3’utr/nos);图8d示出了构建体6705(2x35s
‑5’
utr nbepi42

sppdi

h3 a

sing

19

0019

16

cpmv3’utr/nos);图8e示出了构建体6706(2x35s
‑5’
utr nbsns46

sppdi

h3a

sing

19

0019

16

cpmv 3’utr/nos);图8f示出了构建体6707(2x35s
‑5’
utr nbcsy65

sppdi

h3 a

sing

19

0019

16

cpmv3’utr/nos);图8g示出了构建体6708(2x35s
‑5’
utr nbhel40

sppdi

h3a

sing

19

0019

16

cpmv 3’utr/nos);图8h示出了构建体6709(2x35s
‑5’
utr nbsep44

id no:47);图12j示出了athsp69_sppdi.c的核酸序列(seq id no:48);图12k示出了nbepi42 pdi.c的核酸序列(seq id no:49);图12l示出了nbsns46 pdi.c的核酸序列(seq id no:50);图12m示出了nbcsy65 pdi.c的核酸序列(seq id no:51);图12n示出了nbhel40 pdi.c的核酸序列(seq id no:52);图12o示出了nbsep44 pdi.c的核酸序列(seq id no:53)。
38.图13示出了与h1 a michigan 45/2015构建体有关的核酸序列:图13a示出了if

h1ctmct.s1

4r的核酸序列(seq id no:54);图13b示出了cpmv 160 5'utr

pdi h1 mich dna序列的核酸序列(seq id no:55);图13c示出了pdi h1 mich dna序列的核酸序列(seq id no:56);图13d示出了pdi h1 mich蛋白质序列的氨基酸序列(seq id no:57)。
39.图14示出了与h3 a/singapore 19

0019

16构建体有关的核酸序列:图14a示出了if

h3minn15.r的核酸序列(seq id no:58);图14b示出了cpmv 160 5'utr

pdi h3 sing dna序列的核酸序列(seq id no:59);图14c示出了pdi h3 sing dna序列的核酸序列(seq id no:60);图14d示出了pdi h3 sing蛋白质序列的氨基酸序列(seq id no:61)。
40.图15示出了克隆载体、构建体1666、4467、4160和4170的核酸序列:图15a示出了克隆载体1666从左t

dna至右t

dna的核酸序列(seq id no:62);图15b示出了构建体4467从2x35s启动子至nos终止子的核酸序列(seq id no:63);图15c示出了克隆载体4160从左t

dna至右t

dna的核酸序列(seq id no:64);图15d示出了克隆载体4170从左t

dna至右t

dna的核酸序列(seq id no:65)。
41.图16a示出了构建体1666;图16b示出了构建体4160;图16c示出了构建体4170。
具体实施方式
42.以下描述是优选实施方案。
43.如本文中所使用,术语“包含”、“具有”、“包括”和“含有”及其语法变型是包括性的或开放式的,并且不排除附加的、未叙述的要素和/或方法步骤。当在本文中与用途或方法结合使用时,术语“基本上由
……
组成”表示可以存在附加的要素和/或方法步骤,但是这些添加实质上不影响所列举的方法或用途的作用方式。当在本文中结合用途或方法使用时,术语“由
……
组成”排除了附加要素和/或方法步骤的存在。在某些实施方案中,本文描述为包含某些要素和/或步骤的用途或方法也可以基本上由那些要素和/或步骤组成,而在其他实施方案中,由那些要素和/或步骤组成,无论这些实施方案是否被具体提及。另外,除非另有说明,单数的使用包括复数,并且“或”表示“和/或”。如本文所用,术语“多个”指不止一个,例如两个或更多个、三个或更多个、四个或更多个等。除非本文另外定义,否则本文使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。如本文所用,术语“约”是指距给定值约 /

10%的变化。应当理解,无论是否特别提及,此类变化总是包括于本文提供的任何给定值中。当在本文中与术语“包含”结合使用时,词语“一”或“一个”的使用可以表示“一个”,但是它也与“一个或多个”、“至少一个”和“一个或多个”的含义一致。
44.如本文所用,术语“植物”、“植物的一部分”、“植物部分”,“植物物质”、“植物生物质”、“植物材料”、“植物提取物”或“植物叶片”可以包含能够提供用于表达本文所述的一种或一种以上核酸的转录、翻译和翻译后修饰机制以及/或者可从中提取并纯化表达的目的蛋白质或vlp的整个植物、组织、细胞或其任何部分,细胞内植物成分、细胞外植物成分、植
物的液体或固体提取物或其组合。植物可以包括但不限于农作物,包括例如油菜籽、芸苔属、玉米、烟草属(烟草)(例如本氏烟(nicotiana benthamiana)、黄花烟草(nicotiana rustica)、普通烟草(nicotiana,tabacum)、花烟草(nicotiana alata))、拟南芥、苜蓿、马铃薯、甘薯(ipomoea batatus)、人参、豌豆、燕麦、大米、大豆、小麦、大麦、向日葵、棉花、玉米、黑麦(secale cereale)、高粱(sorghum bicolor,sorghum vulgare)、红花(carthamus tinctorius)。
45.如本文所用,术语“植物部分”是指植物的任何部分,包括但不限于叶、茎、根、花、果实、愈伤组织或细胞培养的植物组织、植物细胞簇(例如从叶、茎、根、花、果实中获得的植物细胞、植物细胞簇或愈伤组织或培养的植物组织)、从叶、茎、根、花、果实中获得的植物提取物,或其组合。术语“植物细胞”是指被质膜限制并且可以包含或可以不包含细胞壁的植物细胞。植物细胞包括原生质体(或原生质球),其包含酶消化的细胞,并且可以使用本领域众所周知的技术获得(例如davey mr等人,2005,biotechnology advances 23:131

171;其通过引用并入本文)。可以使用本领域众所周知的方法产生植物愈伤组织或培养的植物组织(例如,mk razdan第二版,科学出版社,2003;其通过引用并入本文)。本文所用的术语“植物提取物”是指在以物理方式(例如冷冻,然后在合适的缓冲液中提取)、以机械方式(例如通过研磨或均质化植物或植物的一部分,然后在合适的缓冲液中提取)、以酶促方式(例如使用细胞壁降解酶)、以化学方式(例如使用一种或多种螯合剂或缓冲剂),或其组合来处理植物、植物的一部分、植物细胞或其组合之后获得的来源于植物的产品。可以进一步处理植物提取物以去除不希望的植物成分,例如细胞壁碎片。可获得植物提取物以帮助从植物、植物的一部分或植物细胞中回收一种或多种组分,例如来自植物、植物的一部分或植物细胞的蛋白质(包括蛋白质复合物、蛋白质超结构和/或vlp)、核酸、脂质、碳水化合物或其组合。如果植物提取物包含蛋白质,则其可以被称为蛋白质提取物。蛋白质提取物可以是粗植物提取物、部分纯化的植物或蛋白质提取物或纯化产物,其包含来自植物组织的一种或多种蛋白质、蛋白质复合物、蛋白质超结构和/或vlp。如果需要,可以使用本领域技术人员已知的技术来部分纯化蛋白质提取物或植物提取物,例如,可以对提取物进行盐或ph沉淀、离心、梯度密度离心、过滤、层析,例如尺寸排阻色谱法、离子交换色谱法、亲和色谱法或其组合。也可以使用本领域技术人员已知的技术来纯化蛋白质提取物。
[0046]“目的核苷酸(或核酸)序列”或“目的编码区”是指在植物、植物的一部分或植物细胞中表达以产生目的蛋白质的任何核苷酸序列或编码区(这些术语可互换使用)。此类目的核苷酸序列可以编码但不限于用于饲料、食品或同时用于饲料和食品的天然或修饰的蛋白质、工业酶或修饰的工业酶、农业蛋白质或修饰的农业蛋白质、辅助蛋白质、蛋白质补充剂、药学活性蛋白质、营养保健品、增值产品或其片段。
[0047]
目的蛋白质可以包含天然或非天然信号肽;非天然信号肽可以是来源于植物的。例如,认为是非限制性的,非天然信号肽可获自苜蓿蛋白质二硫键异构酶(pdi sp;登录号z11499的核苷酸32

103)、马铃薯糖蛋白质(pata sp;genbank登录号a08215的位点1738~1806的核苷酸)、猕猴桃碱(act)、烟草半胱氨酸蛋白质酶3前体(cp23)、玉米δzein(δzein)、木瓜蛋白质酶i(papain;pap)和阿拉伯芥(thale cress)半胱氨酸蛋白质酶rd21a(rd21)。天然信号肽可以对应于所表达的目的蛋白质的信号肽。
[0048]
目的核苷酸序列或目的编码区还可以包括编码药学活性蛋白质的核苷酸序列,该
蛋白质例如生长因子、生长调节剂、抗体、抗原及其片段,或其可用于免疫或预防接种的衍生物等。此类蛋白质包括但不限于是人类病原体的蛋白质、病毒蛋白质,例如但不限于病毒样颗粒(vlp)形成的抗原、来自以下的一种或多种蛋白质:诺如病毒、呼吸道合胞病毒(rsv)、轮状病毒、流感病毒、人免疫缺陷病毒(hiv)、狂犬病病毒、人乳头瘤病毒(hpv)、肠病毒71(ev71)或白介素(例如il

1至il

24、il

26和il 27的一种或多种)、细胞因子、促红细胞生成素(epo)、胰岛素、g

csf、gm

csf、hpg

csf、m

csf或其组合、干扰素(例如干扰素α、干扰素β、干扰素γ)、凝血因子(例如因子viii、因子ix或tpa hgh)、受体、受体激动剂、抗体(例如但不限于利妥昔单抗)、神经多肽、胰岛素、疫苗、生长因子(例如但不限于表皮生长因子、角质形成细胞生长因子、转化生长因子、生长调节剂)、抗原、自身抗原、其片段或其组合。
[0049]
目的蛋白质可以包括流感血凝素(ha;参见wo2009/009876、wo2009/076778、wo2010/003225,其通过引用并入本文)。ha是同型三聚体膜i型糖蛋白质,通常包含信号肽、ha1结构域和ha2结构域,该ha2结构域在c末端具有跨膜的锚定位点和小的胞质尾。编码ha的核苷酸序列是众所周知的并且是可获得的(参见例如biodefense和公共卫生数据库(流感研究数据库;squires等人,2008,nucleic acids research36:d497

d503)网址:biohealthbase.org/gsearch/home.do?decorator=influenza或由国家生物技术信息中心维护的数据库(请参见网址:ncbi.nlm.nih.gov),两者均通过引用并入本文)。
[0050]
ha蛋白质可以是a型流感、b型流感,或是选自由以下各项组成的组:h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16、h17和h18的a型流感ha的亚型。在本发明的一些方面、ha可以来自a型流感、其选自由以下各项组成的组:h1、h2、h3、h5、h6、h7和h9。以上列出的ha的片段也可以视为目的蛋白质。此外,可以将来自以上列出的ha类型或亚型的结构域进行组合以产生嵌合ha(参见例如wo2009/076778,其通过引用并入本文)。
[0051]
包含ha蛋白质的亚型的实例包含a/newcaledonia/20/99(h1n1)、a/indonesia/5/2006(h5n1)、a/puertorico/8/34(h1n1)、a/brisbane/59/2007(h1n1)、a/solomonislands3/2006(h1n1)、a/california/04/2009(h1n1)、a/california/07/2009(h1n1)、a/chicken/newyork/1995、a/singapore/1/57(h2n2)、a/herringgull/de/677/88(h2n8)、a/texas/32/2003、a/mallard/mn/33/00、a/duck/shanghai/1/2000、a/northernpintail/tx/828189/02、a/brisbane10/2007(h3n2)、a/wisconsin/67/2005(h3n2)、a/victoria/361/2011(h3n2)、a/texas/50/2012(h3n2)、a/hawaii/22/2012(h3n2)、a/newyork/39/2012(h3n2)、a/perth/16/2009(h3n2)、c/johannesburg/66、a/anhui/1/2005(h5n1)、a/vietnam/1194/2004(h5n1)、a/teal/hongkong/w312/97(h6n1)、a/equine/prague/56(h7n7)、a/turkey/ontario/6118/68(h8n4)、h7a/hangzhou/1/2013、a/anhui/1/2013(h7n9)、a/shanghai/2/2013(h7n9)、a/shoveler/iran/g54/03、a/hongkong/1073/99(h9n2)、a/chicken/germany/n/1949(h10n7)、a/duck/england/56(h11n6)、a/duck/alberta/60/76(h12n5)、a/gull/maryland/704/77(h13n6)、a/mallard/gurjev/263/82、a/duck/australia/341/83(h15n8)、a/black

headedgull/sweden/5/99(h16n3)、b/malaysia/2506/2004、b/florida/4/2006、b/brisbane/60/08、b/massachusetts/2/2012类病毒(yamagata系)、b/wisconsin/1/2010(yamagata系)或b/lee/40。
[0052]
该ha也可以是修饰的或嵌合的ha,例如,该ha的天然跨膜结构域可以被异源跨膜
结构域取代(wo 2010/148511,其通过引用并入本文),该ha可以包含嵌合的胞外域(wo 2012/083445,其通过引用并入本文),或ha可以包含蛋白质水解环缺失(wo 2014/153647,其通过引用并入本文)。
[0053]
目的蛋白质还可以包括如wo 2018/170603(其通过引用并入本文)或美国临时申请62/593,006(2017年11月11日提交;其通过引用并入本文)中所述的诺如病毒蛋白质或修饰的诺如病毒蛋白质。诺如病毒是杯状病毒科的诺如病毒属的无包膜病毒株,其表征为具有单链的正义链rna。诺如病毒株可以包括任何已知的诺如病毒株,还可以包括随着时间而定期地产生的对已知的诺如病毒株的修饰。例如,诺如病毒株可以包括gi.1、gi.2、gi.3、gi.5、gi.7、gii.1、gii.2、gii.3、gii.4、gii.5、gii.6、gii.7、gii.12、gii.13、gii.14、gii.17和gii.21,例如但不限于hu/gi.1/united states/norwalk/1968、hu/gi.2/leuven/2003/bel、hu/gi.3/s29/2008/lilla edet/sweden、hu/gi.5/siklos/hun5407/2013/hun、hu/gii.1/ascension208/2010/usa、hu/gii.2/cgmh47/2011/tw、hu/gii.3/jingzhou/2013402/chn、hu/gii.4/sydney/nsw0514/2012/au、us96/gii.4/dresden174/1997/de_ay741811、fh02/gii.4/farmingtonhills/2002/us_ay502023、hnt04:gii.4/hunter

nsw504d/2004/au_dq078814、2006b:gii.4/shellharbour

nsw696t/2006/au_ef684915、no09:gii.4/orange

nsw001p/2008/au_gq845367、hu/gii.5/albertaei390/2013/ca、hu/gii.6/ohio/490/2012/usa、gii.7/musa/2010/all73774、hu/gii.12/hs206/2010/usa、gii.13/va173/2010/h9awu4、gii.14_saga_2008_jpn_ade28701原生vp1、hu/gii.17/kawasaki323/2014/jp和hu/gii.21/salisbury150/2011/usa。诺如病毒株还包括与任何上述诺如病毒株具有与vp1蛋白质、vp2蛋白质或vp1和vp2蛋白质两者约30~100%或其间任一值的氨基酸序列一致性的菌株。
[0054]
当提及特定序列时,使用术语“相似度百分比”、“序列相似度”、“一致性百分比”或“序列一致性”,例如在威斯康星大学gcg软件程序中所阐述的,或通过手动比对和目视检查(参见,例如《分子生物学实验指南》(current protocols in molecular biology),ausubel等人,1995增补版)。用于比较的序列比对方法是本领域众所周知的。可以使用例如smith和waterman的算法(1981,adv.appl.math.2:482)、needleman和wunsch的比对算法(1970,j.mol.biol.48:443),通过搜索pearson和lipman的相似性方法(1988,proc.natl.acad.sci.usa 85:2444)、通过这些算法的计算机化实现(例如:威斯康星遗传学软件包中的gap、bestfit、fasta和tfasta,来自位于威斯康星州麦迪逊市科学大道575号的遗传学计算机公司(gcg,genetics computer group)),进行用于比较的序列的最佳比对。
[0055]
适用于确定百分比序列一致性和序列相似性的算法的实例是blast和blast 2.0算法,其分别描述于altschul等人(1977,nuc.acids res.25:3389

3402)和altschul等人(1990,j.mol.biol.215:403

410)。具有本文所述参数的blast和blast 2.0用于确定本发明的核酸和蛋白质的序列一致性百分比。例如,blastn程序(用于核苷酸序列)可以默认使用字长(w)11、期望值(e)10、m=5、n=

4以及两条链的比较作为默认值。对于氨基酸序列,blastp程序可以使用字长3、期望值(e)10以及blosum62评分矩阵(参见henikoff和henikoff,1989,proc.natl.acad.sci.usa 89:10915)比对值(b)50、期望值(e)10、m=5、n=

4以及两条链的比较作为默认值。可通过国家生物技术信息中心(参见网址:
ncbi.nlm.nih.gov/)公开获得进行blast分析的软件。
[0056]
如本文所用,术语“核酸片段”是指编码目的蛋白质的核酸序列。除核酸序列外,核酸片段还包含与核酸序列操作性地连接的调控区和终止子。调控区可包含启动子以及与启动子操作性地连接的增强子元件(表达增强子)。
[0057]
如本文所用,术语“核酸复合物”是指两个或多于两个核酸片段的组合。单个核酸中可以存在两个或多于两个的核酸片段,从而核酸复合物包含两个或多于两个的核酸片段,每个核酸片段都在调控区和终止子的控制下。可替代地,核酸复合物可以包含两个或更多个分离的核酸,每个核酸包含一个或多个一个核酸片段,其中每个核酸片段在调控区和终止子的控制下。例如,核酸复合物可以包含一个核酸,该一个核酸包含两个核酸片段,核酸复合物可以包含两个核酸,每个核酸包含一个核酸片段,或者核酸复合物可以包含两个或多于两个核酸,每个核酸包含一个或多个核酸片段。
[0058]
如本文所用,术语“载体”或“表达载体”是指用于将外源核酸序列转移到宿主细胞(例如植物细胞)中并指导宿主细胞中外源核酸序列表达的重组核酸。可以将载体直接引入植物、植物的一部分或植物细胞中,或者可以将载体作为植物表达系统的一部分引入植物、植物的一部分或植物细胞中。该载体或表达载体包含构建体或表达构建体。该构建体或表达构建体包含核苷酸序列,该核苷酸序列包含在合适的启动子、表达增强子或用于在宿主细胞中转录目的核酸的其他调控元件的控制下以及与其可操作地(或操作性地)连接的目的核酸。如本领域技术人员将理解的,构建体或表达框架可包含终止序列(终止子),其是在植物宿主中有活性的任何序列。例如,终止序列可以衍生自二重(bipartite)rna病毒的rna

2基因组片段,例如豇豆黄花叶病毒。终止序列可以是nos终止子,该终止子序列可以从苜蓿质体蓝素基因的3’utr或其组合中获得。
[0059]
本发明的构建体可以进一步包含3’非翻译区(utr)。3’非翻译区含有多腺苷酸化信号和任何其他能够影响mrna加工或基因表达的调节信号。多腺苷酸化信号的特征通常是通过在mrna前体的3’末端添加聚腺苷酸径迹(tracks)来实现的。多腺苷酸化信号通常是通过与5’aataaa
‑3’
的规范形式存在同源性来识别的,尽管变体并不罕见。合适的3’区域的非限制性实例是含有农杆菌肿瘤诱导(ti)质粒基因的多腺苷酸化信号的3’转录的非翻译区域,该基因诸如胭脂碱合酶(nos基因)和诸如大豆贮藏蛋白质基因的植物基因、核糖1,5

二磷酸羧化酶基因的小亚基(ssrubisco;us4,962,028;其通过引用并入本文)、用于调节质体蓝素表达的启动子和/或终止子。
[0060]
例如,不被认为是限制性的,cpmv 3’utr nos终止子可以用作3’utr序列,其操作性地连接至编码目的蛋白质的核酸序列的3’端。
[0061]“调控区”、调控元件”或“启动子”是指核酸的一部分,通常但并非总是在基因的蛋白质编码区的上游,其可以由dna或rna组成,或由dna和rna二者组成。当调控区有活性并且与目的核苷酸序列操作性地关联或操作性地连接时,可导致目的核苷酸序列的表达。调控元件可能能够介导器官特异性,或控制发育或时序基因激活。“调控区”包括启动子元件、表现出基础启动子活性的核心启动子元件、响应于外部刺激而可诱导的元件、介导启动子活性的元件(诸如负调控元件或转录增强子)。如本文所用,“调控区”还包括在转录后有活性的元件,例如调节基因表达的调控元件,诸如翻译和转录增强子、翻译和转录阻遏物、上游激活序列和mrna不稳定性决定簇。这些后面的元件中的几个可以位于编码区的近端。
[0062]
在本发明的上下文中,术语“调控元件”或“调控区”通常是指dna序列,通常但不总是在结构基因的编码序列的上游(5’),通过提供对rna聚合酶和/或从特定位点开始转录所需的其他因子的识别,来控制编码区的表达。然而,应理解,位于内含子内或该序列的3’的其他核苷酸序列也可有助于调节目的编码区的表达。提供对rna聚合酶或其他转录因子的识别以确保在特定位点起始的调控元件的实例是启动子元件。大多数但并非全部的真核启动子元件都含有tata盒,这是一个保守的核酸序列,该核酸序列由腺苷和胸苷核苷酸碱基对组成,通常位于转录起始位点上游约25个碱基对。启动子元件可包括负责转录起始的基础启动子元件,以及修饰基因表达的其他调控元件。
[0063]
有几种类型的调控区,包括受发育调控的、可诱导的或组成性的。在器官或组织的某些发育过程中的特定时间,在某些器官或器官的组织内激活了调控区,该调控区是受发育调控的,或控制受其控制的基因的差异表达。然而,一些受发育调控的调控区域可能在特定发育阶段优先在某些器官或组织内有活性,它们也可能以受发育调控的方式或在植物内其他器官或组织的基础水平上有活性。组织特异性调控区(例如种子特异性调控区)的实例包括napin启动子和十字花科素启动子(rask等人,1998,j.plant physiol.152:595

599;bilodeau等人,1994,plant cell 14:125

130)。叶特异性启动子的实例包括质体蓝素启动子(参见us7,125,978,其通过引用并入本文)。
[0064]
诱导型调控区是能够响应于诱导剂而直接或间接激活一个或多个dna序列或基因的转录区域。在没有诱导物的情况下,dna序列或基因将不会被转录。通常,特异性结合可诱导的调控区以激活转录的蛋白质因子可以以无活性形式存在,然后通过诱导剂直接或间接转化为活性形式。然而,蛋白质因子也可能不存在。诱导剂可以是化学试剂,诸如蛋白质、代谢产物、生长调节剂、除草剂或酚类化合物,也可以是由热、冷、盐或有毒元素直接施加或通过病原体或疾病因子(诸如病毒)激活的生理胁迫。通过将诱导物从外部施加到细胞或植物上,诸如通过喷雾、浇水、加热或类似方法,可将含有诱导性调控区的植物细胞暴露于诱导物。诱导型调控元件可源自植物或非植物基因(例如,gatz,c.和lenk,i.r.p.,1998,trends plant sci.3,352

358)。潜在的诱导型启动子的实例包括但不限于四环素诱导型启动子(gatz,c.,1997,ann.rev.plant physiol.plant mol.biol.48,89

108)、类固醇诱导型启动子(aoyama,t.和chua,nh,1997,plant j.2,397

404)和乙醇诱导型启动子(salter,m.g.等人,1998,plant journal 16,127

132;caddick,m.x.等人,1998,nature biotech.16,177

180)细胞分裂素诱导性ib6和cki1基因(brandstatter,i.和kieber,j.j.,1998,plant cell 10,1009

1019;kakimoto,t.,1996,science 274,982

985)和生长素诱导元件dr5(ulmasov,t.等人,1997,plant cell 9,1963

1971)。
[0065]
组成性调控区指导基因在植物的各个部分中表达以及在整个植物发育中连续地表达。已知的组成性调控元件的实例包括与camv 35s转录物相关的启动子(p35s;odell等人,1985,nature,313:810

812;其通过引用并入本文)、水稻肌动蛋白1(zhang等人,1991,plant cell,3:1155

1165)、肌动蛋白2(an等人,1996,plant j.,10:107

121)或tms 2(us 5,428,147)和磷酸三糖异构酶1(xu等人,1994,plant physiol.,106:459

467)基因、玉米泛素1基因(cornejo等人,1993,plant mol.biol.,29:637

646)、拟南芥泛素1和6基因(holtorf等人,1995,plant mol.biol.,29:637

646)、烟草翻译起始因子4a基因(mandel等人,1995plant mol.biol.,29:995

1004)、木薯花叶病毒启动子pcas(verdaguer等人,
1996)、核糖二磷酸羧化酶小亚基的启动子prbcs(outchkourov等人,2003)、pubi(用于单子叶植物和双子叶植物)。
[0066]
本文所用的术语“组成性”不一定指示在组成性调控区控制下的核苷酸序列均以相同水平在所有细胞类型中表达,而是该序列在多种细胞类型中表达,尽管经常观察到丰度的变化。
[0067]
如上所述的构建体或表达构建体可以存在于载体(或表达载体)中。载体可以包含边界序列,其允许表达框架转移并整合到生物体或宿主的基因组中。该构建体可以是植物二元载体,例如基于ppzp的二元转化载体(hajdukiewicz等人,1994)。构建体的其他实例包括pbin19(参见frisch,d.a.,l.w.harris

haller等人,1995,plant molecular biology 27:405

409)。
[0068]
编码蛋白质的目的核苷酸序列需要存在位于要表达的基因上游的“翻译起始位点”或“起始位点”或“翻译开始位点”或“开始位点”或“起始密码子”。此类起始位点可以作为增强子序列的一部分或作为编码目的蛋白质的核苷酸序列的一部分。
[0069]
如本文所用,术语“天然”、“天然蛋白质”或“天然结构域”是指具有与野生型相同的一级氨基酸序列的蛋白质或结构域。天然蛋白质或结构域可以由与野生型序列具有100%序列相似性的核苷酸序列编码。与野生型核苷酸序列相比,天然氨基酸序列还可以由人类密码子(hcod)优化的核苷酸序列或包含增加的gc含量的核苷酸序列编码,条件是由hcod核苷酸序列编码的氨基酸序列具有与天然氨基酸序列100%的序列一致性。
[0070]
核苷酸序列为“人类密码子优化的”或“hcod”核苷酸序列,这是指选择合适的dna核苷酸以合成寡核苷酸序列或其片段,该寡核苷酸序列或其片段邻近通常在人核苷酸序列的寡核苷酸序列发现使用的密码子。“增加的gc含量”是指选择合适的dna核苷酸用于合成寡核苷酸序列或其片段,以便接近密码子使用,当与相应的天然寡核苷酸序列相比时,该密码子使用包含gc含量的增加,例如为寡核苷酸序列的编码部分的长度的约1%至约30%,或它们之间的任何量。例如,为寡核苷酸序列的编码部分的长度的约1、2、4、6、8、10、12、14、16、18、20、22、24、26、28、30%或它们之间的任何量。如下所述,人密码子优化的核苷酸序列或包含增加的gc含量的核苷酸序列(当与野生型核苷酸序列相比时)与非人类优化(或较低的gc含量)核苷酸序列的表达相比,在植物、植物的一部分或植物细胞内表现出增加的表达。
[0071]
如本文所用,术语“单个构建体”或“单构建体”是指包含单个核酸序列的核酸。如本文所用,术语“双构建体”或“双重构建体”是指包含两个核酸序列的核酸。
[0072]
共表达是指引入和表达两个或更多个核苷酸序列,两个或更多个核苷酸序列中的每一个编码植物、植物的一部分或植物细胞中的目的蛋白质或目的蛋白质的片段。可以在一个载体内将两个或更多个核苷酸序列引入植物、植物的一部分或植物细胞中,使得两个或更多个核苷酸序列中的每一个都处于单独的调控区的控制下(例如包含双重构建体)。可替代地,可在单独的载体(例如包含单个构建体)内将两个或更多个核苷酸序列引入到植物、植物的一部分或植物细胞中,并且每个载体包含用于表达相应核酸的合适的调控区。例如在真空渗透之前,可以通过将每种根癌农杆菌宿主的悬浮液以期望的体积(例如相等的体积,或每种根癌农杆菌可被替代的比例)混合来共表达两个核苷酸序列,每个核苷酸序列位于单独的载体上并被引入单独的根癌农杆菌宿主中。以这种方式,多种根癌农杆菌悬浮
液的共渗入允许多个转基因的共表达。
[0073]
如本文所述,编码目的蛋白质的核酸可进一步包含增强目的蛋白质在植物、植物的一部分或植物细胞中表达的序列。本文描述了增强表达的序列,并且例如可以包括一种或多种从编码分泌蛋白质(spee)的核酸获得的表达增强元件或从编码胞质蛋白质(cpee)的核酸获得的表达增强元件,其与编码目的蛋白质的核酸有效结合。如本文所述使用表达增强子表达分泌蛋白质的非限制性实例包括任何目的蛋白质,该目的蛋白质包含将目的蛋白质靶向细胞外室的信号肽或信号序列,例如抗体(参见图3c),或已知从质膜上萌发的病毒样颗粒(vlp),例如ha流感(参见图3a和3b)。胞质产生的蛋白质的非限制性实例包括那些不包含分泌肽或信号序列(参见例如图2)的任何目的蛋白质,或已知在胞质溶胶中产生并保留在其内的vlp,例如诺如病毒(参见图2b)。
[0074]
还可以针对人类密码子使用、增加的gc含量或其组合来优化编码目的蛋白质的序列。共表达编码第二种目的蛋白质的核酸可导致功能性多聚体蛋白质,例如包含重链和轻链成分的抗体,或增加蛋白质的产量。如果目的蛋白质导致产生vlp,则两种或更多种蛋白质的共表达可导致包含目的蛋白质的vlp的产量增加、密度增加、完整性提高或其组合。可以通过将使用本文所述的表达增强子获得的产量、密度、完整性或其组合与编码异源开放阅读框但不与表达增强子操作性地连接或者例如当与现有技术表达增强子cpmv 160(seq id no:6)操作性地连接时的相同核苷酸序列的产量、密度、完整性或其组合进行比较,来确定产量、密度、完整性或其组合的增加。
[0075]
还提供了一种植物表达系统,其包含核酸,该核酸包含与本文所述的一个或多个表达增强子操作性地连接的调控区以及目的核苷酸序列。该植物表达系统可以包含一种或多种载体、一种或多种构建体或一种或多种核酸,其包含与一种或多种本文所述的表达增强子和核苷酸序列或目的核酸操作性地连接的调控区,以及可引入到植物、植物的一部分或植物细胞中的其他成分。例如,植物表达系统还可以包含:附加的载体、构建体或核酸;包含用于共表达的载体、构建体或核酸的其他农杆菌;一种或多种改变转化效率的化合物;其他成分;或其组合。
[0076]
此外,描述了一种核酸,其包含启动子(调控区)序列,该启动子(调控区)序列与包括本文所述的表达增强子的表达增强子、以及目的核苷酸序列操作性地连接。核酸可以进一步包含编码3’utr(例如豇豆花叶病毒3’utr或质体蓝素3’utr)的序列和终止子序列(例如nos终止子),以便将目的核苷酸序列从3’utr的上游插入。
[0077]
当本文中所指的“表达增强子”、“增强子序列”或“增强子元件”与目的核酸(例如目的异源核酸)操作性地连接时,导致目的核酸的表达。表达增强子还可增强或增加它们所连接的下游异源开放阅读框(orf)的表达。表达增强子可以在增强子序列的5’末端与在植物中有活性的调控区操作性地连接,并在表达增强子的3’末端与目的核苷酸序列操作性地连接,以驱动目的核苷酸序列在宿主(例如植物、植物的一部分或植物细胞)内的表达。本文所述的表达增强子包括衍生自以下序列、与以下核苷酸序列具有序列相似性的序列以及选自以下序列的核苷酸序列:nbepi42(seq id no:1);nbsns46(seq id no:2);nbcsy65(seq id no:3);nbhel40(seq id no:4);和nbsep44(seq id no:5)。
[0078]“操作性地连接”是指特定序列直接或间接相互作用以实现预期的功能,诸如介导或调节核酸序列的表达。操作性地连接的序列的相互作用可以例如由与操作性地连接的序
列相互作用的蛋白质介导。
[0079]
术语“5’utr”或“5’非翻译区”或“5’前导序列”是指未翻译的mrna区域。5’utr通常在转录起始位点开始,并在翻译起始位点或编码区的起始密码子(通常是mrna中的aug、dna序列中的atg)前结束。5’utr可能会调节mrna转录物的稳定性和/或翻译。如果需要,可以通过突变(例如5’utr的取代、缺失或插入)来改变5’utr的长度。
[0080]
表达增强子可以进一步包含一个或多个“一个或多个限制位点”或“一个或多个限制识别位点”、“多克隆位点”、“mcs”、“一个或多个克隆位点”、“多接头序列”或“多接头”,以促进目的核苷酸插入植物表达系统。限制位点是被限制酶识别的特定序列基序,并且是本领域众所周知的。表达增强子可以包含一个或多个位于5’utr下游(3’)的限制位点或克隆位点。多接头序列(多克隆位点)可以包含可用于向5’utr的3’末端添加和去除核酸序列的任何核酸序列,包括编码目的蛋白质的核苷酸序列。多接头序列可包含4至约100个或其间的任何数量的核酸。如对本领域技术人员显而易见的,可以使用任何多克隆位点(mcs)或不同长度(较短或更长)的mcs。
[0081]
还提供了使用一种或多种本文所述的表达增强子在植物中产生一种或多种目的蛋白质的表达系统或载体。本文所述的表达系统包括一种表达盒,该表达盒包含一种或多种表达增强子,或一种序列,该序列具有与一种或多种表达增强子80

100%或其间的任何量的序列相似性。包含表达增强子的表达盒可以进一步包含在植物中有活性的调控区域,该调控区域操作性地连接到表达增强子的5’末端。目的核苷酸序列可以操作性地连接至表达框架的3’末端,使得当被引入到植物、植物的一部分或植物细胞内时,可以实现目的核苷酸序列在植物内的表达。
[0082]
本发明还提供了植物、植物的一部分、植物细胞、植物组织、整个植物、接种物、核酸、包含编码目的蛋白质的目的核苷酸序列的构建体、包含一种或多种如上所述的表达增强子的表达框架或表达系统、以及在植物、植物的一部分或植物细胞中表达目的蛋白质的方法。
[0083]
可以使用多种方法将目的核苷酸序列与包含植物调控区的增强子序列融合(操作性地连接)。例如,不被认为是限制性的,可以将编码目的蛋白质的目的核苷酸序列融合到紧邻5’utr序列后面的表达增强子的3’末端。
[0084]
可以使用ti质粒、ri质粒、植物病毒载体、直接dna转化、显微注射、电穿孔、浸润等以稳定或瞬时的方式将本发明的构建体引入植物细胞。对于此类技术的综述,参见例如weissbach和weissbach,植物分子生物学方法(methods for plant molecular biology),学术出版社,纽约viii,第421

463页(1988);geierson和corey,植物分子生物学(plant molecular biology),第二版(1988);以及miki和iyer,《植物代谢(plant metabolism)》中“植物基因转移的基本原理(fundamentals of gene transfer in plants)”,第二版,dt.dennis,dh turpin,dd lefebrve,db layzell(编著),艾迪生

韦斯利朗曼(addison

wesley,langmans)出版公司,伦敦,第561

579页(1997)。其他方法包括直接dna摄取、使用脂质体、电穿孔(例如使用原生质体)、显微注射、微粒或晶须以及真空浸润。参见例如bilang等人,(gene 100:247

250,1991)、scheid等人(mol.gen.genet.228:104

112,1991)、guerche等人(plant science 52:111

116,1987)、neuhause等人,(theor.appl genet.75:30

36,1987)、klein等人(nature 327:70

73,1987)、howell等人(science 208:
1265,1980);horsch等人(science 227:1229

1231,1985)、deblock等人(plant physiology 91:694

701,1989、植物分子生物学方法(methods for plant molecular biology)(weissbach和weissbach编著,学术出版社,1988)、植物分子生物学方法(methods for plant molecular biology)(schuler和zielinski编著,学术出版社,1989)、liu和lomonossoff(j.virol meth,105:343

348,2002)、美国专利号4,945,050、5,036,006、5,100,792、6,403,865、5,625,136(其全部内容通过引用并入本文)。
[0085]
瞬时表达方法可用于表达本发明的构建体(参见liu和lomonossoff,2002,journal of virological methods,105:343

348;其通过引用并入本文)。可替代地,可以使用基于真空的瞬时表达方法(如kapila等人所述,1997,其通过引用并入本文)。这些方法可以包括例如但不限于农杆菌接种或农杆菌渗入的方法,然而,如上所述,也可以使用其他瞬时方法。通过农杆菌接种或农杆菌渗入,包含所需核酸的农杆菌混合物进入组织的细胞间空间,例如叶、植物的中空部分(包括茎、叶和花)、植物的其他部分(茎、根、花)或整个植物。穿过表皮后,农杆菌感染并将t

dna拷贝转移到细胞中。t

dna被游离转录,mrna被翻译,从而在感染的细胞中产生目的蛋白质,但是t

dna在细胞核内的传递是瞬时的。
[0086]
如果目的核苷酸序列编码对植物有直接或间接毒性的产物,那么通过使用本发明的方法,可以通过在植物中选择性表达目的核苷酸序列来在所需的组织或植物发育的所需阶段降低整个植物的这种毒性。另外,由瞬时表达导致的有限表达时间可减小在植物中产生有毒产物时的作用。诱导型启动子、组织特异性启动子或细胞特异性启动子可用于选择性地指导目的序列的表达。
[0087]
美国临时申请号62/643,053(2018年3月14日提交;其通过引用并入本文)描述了使用多聚体分析鉴定的15种植物来源的表达增强子元件(utr)的鉴定。本文中包括了这些utr中的两个(nbmt78,seq id no:7;和athsp69,seq id no:8)用于比较。通过分析使用美国临时申请号62/643,053中描述的多聚体分析鉴定的utr的5’区域,来鉴定本文所述的表达增强子(内源性表达增强子)。然而,本文所述的内源性表达增强子未在作为多聚体分析结果鉴定的utr组中鉴定(描述于美国临时申请号62/643,053),本文所述的内源性表达增强子也未使用多聚体分析鉴定。
[0088]
本文所述的表达增强子(内源性表达增强子)的实例包括:
[0089]
nbepi42(seq id no:1);
[0090]
actttaatttgctgattttcaacaaaatcaagaatttcagca;
[0091]
nbsns46(seq id no:2);
[0092]
attcagtgcttaactggttattgagtaagttatcaaaaagcaaaaa;
[0093]
nbcsy65(seq id no:3);
[0094]
acttttctaatcaatcatcaaacagaacgcagaaaatttcctaaaaacaaaaaaaaggcatacaa;
[0095]
nbhel40(seq id no:4);
[0096]
actccatttgaatctatcaaaccaaaacacattgagcaaa;
[0097]
nbsep44(seq id no:5);
[0098]
acttcaatcactccacactttattctctttcaaaacctacactc;
[0099]
增强子序列可以选自seq id no:1

5中的任一个,或呈现出与seq id no:1

15中任一项所述的序列具有100%、99%、98%、97%、96%、95%或90%或其间任意量的序列一
致性的核苷酸序列,其中,当操作性地连接目的核酸时,表达增强子导致与未操作性地连接表达增强子的相同目的核酸或例如与现有技术表达增强子cpmv 160(seq id no:6)操作性地连接时,目的核酸的表达水平增加。可以使用本领域技术人员已知的方法,包括删除、插入和/或替换增强子序列的一个或多个核苷酸,修饰seq id no:1

5中所示的每个增强子序列,以产生导致类似或增加的增强子活性的表达增强子,或导致另一有益特性的表达增强子(参见例如diamos等人,frontiers in plant science.2016,第7卷,第1

15页;dvir s.等人,2013,pnas,在线发表于2013年7月15日;leppek k等人,2018,nature reviews mol.cell biol.19:158

174;其通过引用并入本文)。例如,有益特性可以包括改善的转录起始、改善的mrna稳定性、改善的mrna翻译或其组合。
[0100]
观察到使用一种或多于一种的上述seq id no:1

5的表达增强子导致目的核酸的表达,或导致目的核酸,或参考图2至图5所示的目的蛋白质的表达增加(目的蛋白质的产量、活性,或产量和活性两者增加)。
[0101]
参考图2a、图2b、图3a和图3b,当每个表达增强子nbepi42(seq id no:1)、nbsns46(seq id no:2)、nbcsy65(seq id no:3)、nbhel40(seq id no:4)和nsep44(seq id no:5)与编码目的蛋白质的核酸序列操作性地连接时,当与操作性地连接至编码相同目的蛋白质的相同核酸序列在相似条件下或指定的位置表达的现有技术表达增强子序列cmpv 160(seq id no:6;wo 2015/103704)的活性进行比较时,或者其中指示,与操作性地连接至编码目的蛋白质的相同核酸序列并在相似的条件下表达的nbmt78或athspace69的活性相比(均描述于2018年3月14日提交的美国临时申请号62/643,053中,该申请通过引用并入本文),观察到导致类似或增加的蛋白质表达,dasher(dasher gfp;fpob

27e

269;atum.bio;图2a),诺如病毒(gii.4/syd/12;图2b),流感血凝素(h3 a/sing 19

0019

16,图3a;h1 a/mich/45/15,图3b)。
[0102]
图1a和图1b中示出了与编码目的蛋白质的核酸序列操作性地连接的现有技术表达增强子cpmv 160(seq id no:6)相对于现有技术表达增强子cpmv

ht增强子元件的活性。该cpmv

ht增强子元件是指编码调节豇豆花叶病毒(cpmv)rna2多肽或修饰的cpmv序列的5’utr的核苷酸序列,如wo2009/087391中所述;sainsbury f.和lomonossoff g.p.(2008年,plant physiol.148:1212

1218页)。cpmv 160表达增强子是指包含来自cpmv rna2的截短的5’utr的核苷酸序列,如wo2015/103704中所述。cpmv 160和cpmv 160 表达增强子均包含cmpv rna2的5’utr的前160个核酸,但是cpmv 160 表达增强子在3’末端还包含多克隆位点和植物kozak序列。
[0103]
因此,本文描述的表达增强子可以在植物表达系统中使用,该植物表达系统包括与表达增强子序列和目的核苷酸序列操作性地连接的调控区。
[0104]
例如,本发明提供了产生目的蛋白质或增加目的蛋白质产量的方法,该目的蛋白质例如但不限于植物中的流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或经修饰的诺如病毒蛋白质。该方法包括将包含本文所述的表达增强子的核酸操作性地连接至编码目的蛋白质(例如流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或经修饰的诺如病毒蛋白质)的核苷酸序列引入植物、植物的一部分或植物细胞中,并以瞬时或稳定的方式在植物、植物的一部分或植物细胞中表达蛋白质。其中,可通过对操作性地连接至表达增强子的核苷酸序列的表达水平与未可操作性地连接至表达增强子或者例如当与现有技术的表
达增强子cpmv 160(seq id no:6)操作性地连接时的相同核苷酸序列的表达水平进行比较,来确定表达的增加。可替代地,该方法可以包含提供植物、该植物的一部分或植物细胞,其包含本文所述的表达增强子,该表达增强子与编码目的蛋白质(例如流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质、修饰的诺如病毒蛋白质或多聚体蛋白质)的核苷酸序列操作性地连接,并以瞬时或稳定的方式在植物、植物的一部分或植物细胞中表达编码该蛋白质的核酸。
[0105]
此外,本发明提供了包含目的蛋白质(例如流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或经修饰的诺如病毒蛋白质)的植物物质、植物提取物或蛋白质提取物。植物物质、植物提取物或蛋白质提取物可用于诱导例如针对受试者的流感或诺如病毒感染的免疫。可替代地,可以纯化或部分纯化目的蛋白质,例如流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或修饰的诺如病毒蛋白质,并且纯化或部分纯化的制剂可用于诱导免疫力,例如针对受试者中的流感或诺如病毒感染。可替代地,目的蛋白质(例如流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或修饰的诺如病毒蛋白质)可以用于诱导免疫应答的组合物和药学上可接受的载体、佐剂、载剂或赋形剂中。
[0106]
本文所述的表达增强子可以用于产生任何目的蛋白质或用于产生病毒样颗粒(vlp)。例如,参考图2b、图3a和图3b,示出了本文所述的几种表达增强子对于产生诺如病毒vlp是有效的。
[0107]
因此,本发明还提供了在植物中产生或增加vlp(包含流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或经修饰的诺如病毒蛋白质)的方法。例如,该方法可以包括以瞬时或稳定的方式将包含操作性地连接编码流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或修饰的诺如病毒蛋白质的核苷酸序列的本文所述的表达增强子的核酸引入植物、植物的一部分或植物细胞中,并在植物、植物一部分或植物细胞的中表达该蛋白质,以产生包含流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或修饰的诺如病毒蛋白质的vlp。可通过比较操作性地连接至表达增强子的核苷酸序列的表达水平与未可操作性连接至表达增强子或者例如操作性地与现有技术的表达增强子cpmv 160(seq id no:6)连接的相同核苷酸序列的表达水平,来确定表达的增加。可替代地,该方法可包含提供一种植物、该植物的一部分或植物细胞,其包含本文所述的表达增强子,该表达增强子与编码流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或修饰的诺如病毒蛋白质的核苷酸序列操作性地连接,并表达编码该蛋白质的核酸以产生包含流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或经修饰的诺如病毒蛋白质的vlp。
[0108]
此外,本发明提供包含vlp的植物物质、植物提取物或蛋白质提取物,该vlp包含流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或经修饰的诺如病毒蛋白质。植物物质、植物提取物或蛋白质提取物可用于在受试者中诱导对诺如病毒感染的免疫。可替代地,可纯化或部分纯化包含流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或修饰的诺如病毒蛋白质的vlp,并且纯化或部分纯化的制剂可用于在受试者中诱导对诺如病毒感染的免疫力,或者包含流感ha蛋白质、修饰的流感ha蛋白质、诺如病毒蛋白质或经修饰的诺如病毒蛋白质的vlp可以用于诱导免疫应答的组合物以及药学上可接受的载体、佐剂、载剂或赋形剂中。
[0109]
本文所述的表达增强子也可以用于产生目的蛋白质的多聚体,例如抗体。如参考
图3c所示,当每个核酸序列与本文所述的相同或不同的表达增强子操作性地连接时,可以在植物中共表达编码抗体(例如利妥昔单抗)的轻链(lc)和重链(hc)的两条核酸。例如,分别共表达第一核酸(编码利妥昔单抗的hc,并操作性地连接至表达增强子nbepi42(seq id no:1)、nbsns46(seq id no:2)、nbcsy65(seq id no:3)、nbhel40(seq id no:4)和nbsep44(seq id no:5))和第二核酸(编码利妥昔单抗的lc,并操作性地连接至任一相同的表达增强子nbepi42(seq id no:1)、nbsns46(seq id no:2)、nbcsy65(seq id no:3)、nbhel40(seq id no:4)和nbsep44(seq id no:5)),使得当与编码相同hc和lc序列的第一核酸和第二核酸的共表达相比时,导致多聚体蛋白质的表达或多聚体蛋白质的表达增加,但是第一核酸和第二核酸中的每一个都与现有技术的表达增强子cpmv 160(seq id no:6)操作性地连接。第一核酸和第二核酸也可以使用本文描述的表达增强子的其他组合,以与美国临时申请号62/643,053(2018年3月14日提交,其通过引用并入本文)中描述的类似方式共表达。
[0110]
因此,本发明还提供了在植物中产生或增加多聚体蛋白质产生的方法。例如,该方法可以涉及以瞬时或稳定的方式将第一核酸(包含与编码第一蛋白质组分的核苷酸序列操作性地连接的如本文所述的表达增强子)和第二核酸(包含与编码第二种蛋白质成分的核苷酸序列操作性地连接的如本文所述的表达增强子)引入植物、植物的一部分或植物细胞中,并在植物、植物的一部分或植物细胞中共表达第一核酸和第二核酸,从而产生多聚体蛋白质。可通过将各自操作性地连接至表达增强子的第一核酸和第二核酸的表达水平与相同的第一核酸和第二核酸的表达水平进行比较,来确定表达的提高,该相同的第一核酸和第二核酸的每一个不与表达增强子操作性地连接,或者例如当与现有技术表达增强子cpmv 160(seq id no:6)操作性地连接时。可替代地,该方法可以包括提供植物、植物的一部分或植物细胞,其包含第一核酸(包含与编码第一蛋白质组分的核苷酸序列操作性地连接的如本文所述的表达增强子)和第二核酸(包含与编码第二蛋白质组分的核苷酸序列操作性地连接的如本文所述的表达增强子),并共表达第一核酸和第二核酸序列以产生多聚体蛋白质。
[0111]
此外,本发明提供了包含多聚体蛋白质的植物物质、植物提取物或蛋白质提取物,或者该多聚体蛋白质可以被纯化或部分纯化。
[0112]
如本文所述,提供了核酸构建体,其包含与编码目的蛋白质的目的核苷酸序列操作性地连接的表达增强子序列。还提供了植物表达系统和载体,其包含构建体或一种或多种包含如本文所述的增强子序列的核酸。还提供了一种植物表达系统、载体、构建体或核酸,其包含与可操纵地连接至目的核苷酸序列的增强子序列操作性地联接的植物调控区,该目的核苷酸序列编码目的蛋白质。该增强子序列可以选自seq id no:1

5中的任一个,或呈现出与seq id no:1

5中任一项所述的序列具有100%、99%、98%、97%、96%、95%或90%或其间任意量的序列一致性的核苷酸序列,其中当与目的核酸操作性地连接时,与未操作性地连接表达增强子或例如与现有技术表达增强子cpmv 160(seq id no:6)操作性地连接的相同目的核酸的表达水平相比,表达增强子导致目的核酸的表达或目的核酸的表达水平提高。
[0113]
可以使用本领域技术人员已知的方法修饰seq id no:1

5中任一项的增强子序列,包括缺失、插入和/或取代增强子序列的一个或多个核苷酸序列,以产生表达增强子,其导致相似或提高的增强子活性,或导致表达增强子的另一种有益特性。例如,有益特性可以
包括改善的转录起始、改善的mrna稳定性、改善的mrna翻译或其组合。
[0114]
本发明的增强子序列可以用于在宿主生物(例如植物)中表达目的蛋白质。在这种情况下,目的蛋白质对于所述的宿主生物也可以是异源的,并使用本领域已知的转化技术引入植物细胞。生物体中的异源基因可以替代内源等效基因,即通常执行相同或相似功能的基因,或者插入的序列可以是内源基因或其他序列的补充。
[0115]
本发明还提供了一种表达盒,其包含串联连接的启动子或植物调控区,该启动子或植物调控区与本文所述的表达增强子序列操作性地连接,该表达增强子序列与目的核苷酸序列、3’utr序列和终止子序列融合。增强子序列可以限定为seq id no:1

5中的任何一个,或表现出与seq id no:1

5中的任何一个序列具有100%、99%、98%、97%、96%、95%或90%或其间任意量的序列一致性的核苷酸序列。也可以使用本领域技术人员已知的技术修饰增强子序列,条件是增强子序列导致目的核酸的表达或提高目的核苷酸序列的表达水平,例如通过比较操作性地连接至表达增强子的核苷酸序列的表达水平与未可操作性连接至表达增强子或例如当操作性地与现有技术表达增强子cpmv 160(seq id no:16)相连接时的相同核苷酸序列的表达水平来确定。
[0116]
表1列出了本技术所述的序列。
[0117]
表1:核酸和氨基酸序列列表:
[0118]
id no:63;图15b)。dasher荧光蛋白的氨基酸序列示于seq id no:13中;图10e。图4b中示出了构建体4467。
[0124]
表2中给出了本文所述的所有构建体的引物、模板以及核酸和蛋白质序列。
[0125]
对于流感h1构建体,使用了上述用于dasher荧光蛋白的相同克隆方法。
[0126]
对于流感h3构建体,除了基于2x35s启动子 cpmv 3’utr/nos的表达盒外,所用的克隆载体还整合了苜蓿质体蓝素启动子和终止子控制下的流感m2离子通道基因。用aatii和stui限制酶酶解4160号质粒(seq id no:64;图15c),并以与上述dasher荧光蛋白相似的克隆方法用于融合反应。
[0127]
对于诺如病毒vp1构建体,使用的克隆载体除了基于2x35s启动子 cpmv 3’utr/nos的表达盒外,还整合了来自烟草rb7基因的在nos终止子后面的基质附着区(mar)调控元件。用aatii和stui限制酶酶解4170号质粒(seq id no:65;图15d),并用于融合反应。
[0128]
表2:用于构建体制备的引物、模板和目的序列(soi)
[0129]
[0130]
[0131][0132]
*soa:目的序列;引物1:引物1(用于融合克隆);引物2:引物2(构建片段1以用引物3扩增goi);引物3:引物3(用于融合克隆)
[0133]
实施例2:方法
[0134]
根癌农杆菌转染
[0135]
使用d’aoust等人,2008(plant biotech.j.6:930

40)描述的方法,通过电穿孔用不同的表达载体转染(转化)根癌农杆菌菌株agl1。将转染的农杆菌在添加10mm 2

(n

吗啉代)乙烷磺酸(mes)和50μg/ml卡那霉素、ph为5.6的lb培养基中生长,使其od600在0.6至1.6之间,并以100μl等分试样冷冻。
[0136]
植物生物量、接种物和农杆菌渗入的制备
[0137]
在填充有商业泥炭藓基质的平地中播种,种植本氏烟。使植物在16/8光周期和白
天25℃/夜晚20℃的温度条件下在温室中生长。播种后三周,挑选出单独的小植株,移植到花盆中,并在相同的环境条件下在温室中生长三周。
[0138]
用每种表达载体转染(转化)的农杆菌在添加10mm 2

(n

吗啉代)乙磺酸(mes)和50μg/ml卡那霉素、ph为5.6的lb培养基中生长,直到它们的od600达到0.6和1.6之间。使用前将农杆菌悬浮液离心,然后重悬于渗透培养基(10mm mgcl2和10mm mes ph 5.6)中,并在4℃下保存过夜。在渗入当天,将培养批次稀释至2.5个培养体积,并在使用前加热。将本氏烟草的整株植物倒置放在不透气的不锈钢罐中的细菌悬浮液中,真空度为20~40托,持续2分钟。将植物放回温室中温育6或9天,直到收获。
[0139]
收获叶和提取总蛋白质
[0140]
温育后,收获植物的地上部分,在

80℃下冷冻并压碎成碎片。通过在2倍体积的冷的50mm tris缓冲液ph 8.0 500mm nacl、0.4μg/ml的偏亚硫酸氢盐和1mm的苯基甲磺酰氟中均化(polytron)冷冻破碎的植物材料的每个样品,来提取总可溶性蛋白质。均质化后,将浆液在4℃下以10,000g离心10分钟,并将这些澄清的粗提物(上清液)保留下来进行分析。
[0141]
使用牛血清白蛋白质作为参考标准,通过bradford测定法(bio

rad,加利福尼亚州赫拉克勒斯)测定澄清的粗提物的总蛋白质含量。使用criteriontmtgx stain

freetm预制凝胶(bio

rad实验室,加利福尼亚州赫拉克勒斯)在还原条件下通过sds

page分离蛋白质。通过用考马斯亮蓝对凝胶染色使蛋白质可视化。可替代地,可使用gel doctmez成像系统(bio

rad实验室,加利福尼亚州赫拉克勒斯)使蛋白质可视化,然后将其电转移到聚偏二氟乙烯(pvdf)膜(罗氏诊断公司,印第安纳州印第安纳波利斯)上进行免疫检测。免疫印迹之前,用含5%脱脂奶粉和0.1%tween

20的tris缓冲盐水(tbs

t)在4℃下将膜封闭16

18小时。
[0142]
通过直接荧光测定粗提取物中的dasher表达
[0143]
通过直接测量粗提取物中的荧光来定量dasher表达。使用50mm tris 150mm nacl ph 7.4提取缓冲液,通过机械提取法提取冷冻的生物质,并在10000g下于4℃离心10分钟以去除不溶性碎片。将澄清的粗提取物在pbs中稀释1/16、1/48和1/144,并使用fluoroskan(ascent)仪器使用485nm作为激发滤光片和518nm作为发射滤光片来测量荧光。
[0144]
使用血凝试验(ha滴度)确定ha表达
[0145]
血凝测定法基于nayak和reichl(2004,j.virol.methods 122:9

15)所述的方法。在含有100μl pbs的v型底96孔微量滴定板中对测试样品进行连续的双重稀释(100μl),每孔保留100μl稀释样品。将100微升的0.25%的火鸡红细胞悬液(bio link公司,纽约州锡拉丘兹;用于所有b株,h1、h5和h7)或0.5%的豚鼠红细胞悬液(用于h3)添加到孔板,并在室温下孵育2小时。记录显示出完全血凝的最高稀释度的倒数为ha活性。
[0146]
凝胶密度法测定的利妥昔单抗表达
[0147]
为了进行利妥昔单抗表达分析,通过在150mm tris、具有150mm nacl的ph 7.4缓冲液中进行机械提取,从叶中产生粗蛋白质提取物(2g生物量/eu),并在非还原条件下在sds

page上对提取物进行电泳,用于凝胶内光密度测定法定量对应于抗体的完全组装的h2l2形式的条带。在bio

rad的无污凝胶中进行蛋白质电泳,并使用gel doc xr 系统(包括用于图像分析和凝胶内定量的image lab软件)进行凝胶成像系统。
[0148]
vlp形成/碘克沙醇梯度的分析
[0149]
通过在具有2倍体积的提取缓冲液(100mm磷酸盐缓冲液ph 7.2 150mm nacl)的混合器中进行机械提取,从冷冻的生物质中提取蛋白质。将浆液通过大孔尼龙过滤器过滤以除去大的碎屑,并在4℃下以5000g离心5分钟。收集上清液,并以5000g再次离心30分钟(4℃)以除去其他碎屑。然后将上清液加载在不连续的碘克沙醇密度梯度上。如下进行分析密度梯度离心:制备38ml试管,其在乙酸盐缓冲液中含有不连续的碘克沙醇密度梯度(1ml浓度为45%,2ml浓度为35%,2ml浓度为33%,2ml浓度为31%,2ml浓度为29%以及5ml为25%的碘克沙醇),并用25ml含有病毒样颗粒的提取物覆盖。将梯度以175000g离心4小时(4℃)。离心后,从底部到顶部收集1ml馏分,并通过sds

page结合蛋白质染色或蛋白质印迹来分析馏分。
[0150]
实施例3:在植物中产生蛋白质
[0151]
如实施例2中所述,本氏烟草的叶片真空浸润根癌农杆菌,该根癌农杆菌包含编码目的蛋白质的表达载体,该表达载体操作性地连接至限定的表达增强子,使得目的蛋白质表达,并检查了叶片是否产生目的蛋白质。渗入(dpi)9天后,从叶片匀浆中制备总粗蛋白质提取物,并如上所述测定血凝素滴度。
[0152]
参考图2,观察到与操作性地连接至编码相同目的蛋白质的相同核酸序列在类似条件下表达的现有技术表达增强子序列cmpv 160(wo2015/103704)的活性相比,编码dasher的核酸序列操作性地连接的每个表达增强子nbepi42(seq id no:1)、nbsns46(seq id no:2)、nbcsy65(seq id no:3)、nbhel40(seq id no:4)和nbsep44(seq id no:5)导致蛋白质表达增加。这些增强子元件的活性与表达增强子nbmt78和athsp69相同或更高(描述于2018年3月14日提交的美国临时申请号62/643,053,该申请通过引用并入本文)。
[0153]
参考图3a和图3b,观察到与操作性地连接至编码相同目的蛋白质的相同核酸序列在类似条件下表达的现有技术表达增强子序列cmpv 160(wo2015/103704)的活性相比,操作性地连接至编码h3 a/singapore或h1 michigan/45/15的核酸序列的每个表达增强子nbepi42(seq id no:1)、nbsns46(seq id no:2)、nbcsy65(seq id no:3)、nbhel40(seq id no:4)和nbsep44(seq id no:5)导致蛋白质表达类似或略微增加。这些增强子元件的活性与表达增强子nbmt78和athsp69相同或更高(描述于2018年3月14日提交的美国临时申请号62/643,053,该申请通过引用并入本文)。
[0154]
这些结果证明本文所述的表达增强子序列可用于在植物、植物的一部分或植物细胞中表达目的蛋白质,该目的蛋白质与表达增强子操作性地连接。
[0155]
实施例4:在植物中产生诺如病毒vp1蛋白质和vlp
[0156]
如实施例2所述,用包含编码来自gii.4基因型的诺如病毒vp1的表达载体的根癌农杆菌真空浸润本氏烟的叶片,并检查叶是否产生vlp。渗入(dpi)9天后,通过sds

page分离总粗蛋白质提取物,并用考马斯染色(vp1产生),或使用上述实施例2中所述的不连续碘克沙醇密度梯度分离(vlp产生)。使用考马斯染色的sds

page检查密度梯度的馏分。诺如病毒vp1蛋白质出现在大约55~60kda的条带上。vp1蛋白质在部分密度梯度中的出现指示了在密度梯度离心过程中vlp平衡到的部分。还确定了密度梯度离心后从峰馏分获得的vlp产量。
[0157]
如图2b所示,观察到与操作性地连接至编码相同目的蛋白质的相同核酸序列在类似条件下表达的现有技术表达增强子序列cmpv 160(wo2015/103704)的活性相比,与编码
诺如病毒gii.4/syd/12vp1的核酸序列操作性地连接的每个表达增强子nbepi42(seq id no:1)、nbsns46(seq id no:2)、nbcsy65(seq id no:3)、nbhel40(seq id no:4)和nbsep44(seq id no:5)导致蛋白质表达类似或略微增加。这些增强子元件的活性与表达增强子nbmt78和athsp69相同或更高(描述于2018年3月14日提交的美国临时申请号62/643,053,该申请通过引用并入本文)。
[0158]
实施例5:在植物中产生多聚体蛋白质
[0159]
本文所述的表达增强子也可以用于产生目的多聚体蛋白质,例如抗体。如实施例2所述,用根癌农杆菌真空浸润本氏烟草的叶片,该根癌农杆菌包含编码目的蛋白质的表达载体,该表达载体操作性地连接至限定的表达增强子,以允许目的蛋白质表达,并检查叶片中是否产生目的蛋白质。渗入(dpi)后9天后,如上所述,从叶匀浆中制备总粗蛋白质提取物,并通过sds

page分离,然后通过凝胶内密度法测定完整igg的表达水平。
[0160]
如图3c所示,共表达两种核酸,第一核酸编码利妥昔单抗轻链(lc),操作性地连接至以下表达增强子之一:nbepi42(seq id no:1)、nbsns46(seq id no:2)、nbcsy65(seq id no:3)、nbhel40(seq id no:4)和nbsep44(seq id no:5);第二核酸编码利妥昔单抗重链(hc),操作性地连接至以下表达增强子之一:nbepi42(seq id no:1)、nbsns46(seq id no:2)、nbcsy65(seq id no:3)、nbhel40(seq id no:4)和nbsep44(seq id no:5),与编码相同hc和lc利妥昔单抗序列的第一核酸及和第二核酸(其中第一核酸和第二核酸中的每一个与现有技术表达增强子cpmv 160操作性地连接)的共表达相比,导致植物中多聚体蛋白质的产量相同或增加。这些增强子元件的活性与表达增强子nbmt78和athsp69相同或更高(描述于2018年3月14日提交的美国临时申请号62/643,053,该申请通过引用并入本文)。
[0161]
这些结果证明,本文所述的表达增强子可用于产生多聚体蛋白质,诸如抗体,并且与本文所述相同或不同的表达增强子可操作性地连接至用于编码多聚体蛋白质的成分的每个核酸序列。
[0162]
所有引文均通过引用并入本文。
[0163]
已经参照一个或多个实施方案描述了本发明。然而,对于本领域技术人员将显而易见的是,在不脱离权利要求书所限定的本发明的范围的情况下,可以进行多种改变和修改。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献