一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

突变的PGLB寡糖基转移酶的制作方法

2022-03-19 18:23:28 来源:中国专利 TAG:

突变的pglb寡糖基转移酶
发明领域
1.本发明涉及改进的pglb寡糖基转移酶及其在蛋白质的糖基化和/或与糖链缀合的载体蛋白的产生中的用途。本发明还包括编码改进的pglb寡糖基转移酶的多核苷酸和包含所述多核苷酸的宿主细胞。
2.发明背景
3.糖结合疫苗因其预防许多危及生命的细菌感染的能力而得到广泛认可。糖结合疫苗通常被认为是有效和安全的,并且已经在人类中使用了30多年。常规的糖疫苗生产通常涉及用病原菌的多糖抗原对免疫原性载体蛋白进行化学修饰。然而,最近,出现了用于生产糖结合疫苗的生物技术方法,这有望降低生产成本并进一步提高糖结合疫苗制剂的均质性以及可能的效力和安全性。
4.在真核细胞中,n-连接糖基化是涉及多种酶的关键翻译后蛋白质修饰机制。在原核细胞中,n-连接糖基化由某些细菌n-寡糖基转移酶(n-ost)催化。空肠弯曲杆菌(c.jejuni)的蛋白质糖基化基因簇包括pglb基因,该基因编码膜结合的n-ost(pglb
cj
)。pglb可以在标准细菌宿主,例如,大肠杆菌(e.coli)中表达,并且可以糖基化共表达的周质蛋白,这些蛋白携带至少一个表面暴露的d/e-z
1-n-z
2-s/t(z1和z2≠p)糖基化基序。pglb可以将细菌多糖抗原转移到某些空肠弯曲杆菌蛋白以及其他含有工程化的糖基化位点的生物体的免疫原性载体蛋白上。pglb可以转移寡糖,并在一定程度上转移革兰氏阴性菌的o-抗原脂多糖结构和革兰氏阳性菌的荚膜抗原多糖。然而,pglb的寡糖基转移酶活性的效率可以根据糖与含有所需共有序列的蛋白质共价结合的性质而变化。因此需要改进的pglb蛋白,其能够催化具有与在空肠弯曲杆菌中转移的那些不同的结构的糖类的有效转移至含有所需糖基化基序的蛋白质。
5.本公开提供了工程化的pglb寡糖基转移酶,其已被修饰以在转移一系列未转移到空肠弯曲杆菌细胞中的蛋白质的糖时提高pglb的效率。
6.因此,提供了包含与seq id no:1或2所示氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的pglb寡糖基转移酶(ost)多肽或其功能片段,其中pglb寡糖基转移酶多肽氨基酸序列包含以下特征:至少一个选自于氨基酸57、63、94、101、176、191、193、233、234、286、301、319、397、402、435、446、462、479、523、532、605、610、645、676和695的残基被置换为与在seq id no:1或2中该位置处发现的氨基酸不同的氨基酸。在优选的实施方式中,氨基酸序列与seq id no:2至少90%相同。
7.在第二实施方式中,提供了编码本发明的突变的pglb寡糖基转移酶多肽的多核苷酸。
8.在第三实施方式中,提供了包含至少一种本发明的pglb寡糖基转移酶或编码至少一种本发明的pglb ost的多核苷酸的组合物或宿主细胞(例如,原核宿主细胞或大肠杆菌宿主细胞)。
9.在第四实施方式中,提供了用于制备糖基化蛋白的方法,包括以下步骤:
10.(a)在适合生产蛋白质的条件下培养包含本发明的pglb和/或编码本发明的pglb
的多核苷酸的本发明的宿主细胞;和
11.(b)从宿主细胞中分离糖基化蛋白。
12.在第五实施方式中,提供了用于制备糖基化蛋白的体外方法,包括以下步骤;
13.i)将以下混合在一起:
14.a)本发明的pglb寡糖基转移酶;
15.b)包含至少一个糖基化共有序列的蛋白质,所述糖基化共有序列包含氨基酸序列asp/glu-z
1-asn-z
2-ser/thr,其中z1和z2可以是除pro之外的任何天然氨基酸;和
16.c)被pglb识别的脂质载体上的糖链;
17.ii)在适合pglb的酶促活性的条件下孵育以将糖链转移至蛋白质的该至少一个糖基化共有序列,从而获得糖基化蛋白;和
18.iii)分离糖基化蛋白。
19.在第六实施方式中,提供了通过本发明的方法制备的糖基化蛋白。
20.在第七实施方式中,提供了本发明的pglb寡糖基转移酶或其功能片段在生产其中糖连接至糖基化共有序列的n残基的糖基化蛋白中的用途,所述糖基化共有序列包含氨基酸序列asp/glu-z
1-asn-z
2-ser/thr,其中z1和z2可以是蛋白质的除pro之外的任何天然氨基酸,从而形成糖基化蛋白。
21.附图简述
22.图1-当将肺炎链球菌(s.pneumoniae)血清型8的荚膜糖转移至蛋白质时,pglb中的突变导致更高的寡糖基转移酶活性。图a显示了当使用来自第1、2、3、4、5、6和7轮的pglb将肺炎链球菌的荚膜糖转移到epa载体蛋白时,产量的复合倍数增加。图b显示蛋白质印迹和考马斯染色的凝胶,其表明在不同轮次的突变后,用肺炎链球菌血清型8糖进行糖基化的epa的增加。图c显示考马斯染色的凝胶和用抗肺炎链球菌血清型8抗体探测的蛋白质印迹,其证明在使用点突变的pglb
cj
进行生物偶联后,含有肺炎链球菌血清型8糖的偶联物的产生增加。
23.图2-突变的pglb还具有增加的将肺炎链球菌血清型22f转移到蛋白质的活性。图a显示elisa结果,其显示第3、4和5轮pglb在将肺炎链球菌血清型22f的荚膜糖转移到蛋白质的活性增加。图b显示了第3、4和5轮的pglb的用血清型22f荚膜糖糖基化的epa产量增加的蛋白质印迹结果。
24.图3

突变的pglb具有提高的将肺炎链球菌血清型23a和35b转移到蛋白质的活性。图a显示考马斯凝胶和蛋白质印迹的结果,其显示当使用第4、5和7轮pglb催化转移时,epa用肺炎链球菌血清型23a多糖的糖基化的增加。图b显示与使用野生型pglb相比,当使用第3轮的pglb转移肺炎链球菌血清型35b的荚膜糖时,epa的糖基化增加。
25.图4

突变的pglb具有提高的将肺炎链球菌血清型19a转移到蛋白质的活性。用肺炎链球菌血清型19a糖基化的epa量的考马斯蓝和蛋白质印迹结果,其使用:泳道1-失活的pglb,泳道2-含有y77r、n311v和h479m突变的pglb,泳道3

第6轮pglb,泳道4-10

各种第7轮pglb突变。
26.图5

肺炎链球菌荚膜多糖重复单元的结构。深色圆圈表示葡萄糖残基,浅色圆圈表示半乳糖残基,带有“f”的浅色圆圈表示呋喃半乳糖,深色方块表示n-乙酰基葡糖胺,浅色方块表示n-乙酰基半乳糖胺,三角形表示鼠李糖,带有深色顶部的水平分割的菱形表示
葡萄糖醛酸,椭圆形表示甘油,星形表示核糖醇,深色方块表示n-乙酰基岩藻糖胺,中等方块表示n-乙酰基甘露糖胺,对角分割的方块表示4-氨基-n-乙酰基岩藻糖胺,以及水平分割的菱形表示半乳糖醛酸。
27.图6

b群链球菌荚膜糖重复单元的结构。
28.图7

来自大肠弯曲杆菌菌株的pglb ost序列的氨基酸序列比对,其显示efm37568有些差异,而eia90085和cdg57218更相似。
29.发明详述
30.本公开提供了高效的pglb寡糖基转移酶,其能够催化将糖添加到含有至少一个糖基化共有序列d/e-z
1-n-z
2-s/t(z1和z2≠p)的蛋白质中。这种高效的pglb寡糖基转移酶是通过pglb工程化来实现的。例如,通过单独或组合地选择有利的点突变,这导致n-糖基化蛋白的产生增加。
31.确认本文所述的pglb ost的活性的分析法是技术人员熟知的(例如,elisa、蛋白质印迹)并且包括实施例2和3中描述的分析法。在一些实施方式中,pglb ost是工程化的pglb,其任选地在宿主细胞中表达,任选地在异源宿主细胞(即不是弯曲杆菌细胞的宿主细胞)中表达。
32.寡糖和多糖可以包含本文所述的任何寡糖或多糖。
33.载体蛋白可以包含本文所述的任何载体蛋白。
34.在一些实施方式中,pglb ost包含在例如两个或更多的、三个或更多的、四个或更多的、五个或更多的、六个或更多的、七个或更多的、八个或更多的、九个或更多的或者十个或更多的氨基酸中的修饰(例如,氨基酸置换或编码pglb的多核苷酸中的核苷酸取代),例如,2-30、3-25、4-20、5-20、6-20、7-20或10-20个氨基酸置换。在一个实施方式中,置换在对应于seq id no:1的以下残基的位置处:
35.57;77;57和77;311和77;462和479(这些位置的突变协同以增加pglb的活性);57、77和311;57和462;57、462和479;57、462、479、77和311;57、462、479、300、301、308和570;57、462、479、300、301、308、570和77;57、462、479、300、301、308、570、77和311。
36.在一个实施方式中,以下置换存在于对应于seq id no:1的以下残基的位置处(其中,“/”表示“或”):
37.a57r/t;y77r;a57r/t和y77r;a57r和y77r;n311v和y77r;y462w和h479m(协同突变);a57r/t、y77r和n311v;a57r、y77r和n311v;a57r/t和y462p/c/w/t/n;a57r/t和y462w/t/n;a57r和y462w;y462p/c/w/t/n和h479m(协同突变);a57r/t、y462p/c/w/t/n和h479m;a57r/t、y462w/t/n和h479m;a57r、y462w和h479m;a57r/t、y462p/c/w/t/n、h479m、y77r和n311v;a57r/t、y462w/t/n、h479m、y77r和n311v;a57r、y462w、h479m、y77r和n311v;a57r/t、y462p/c/w/t/n、h479m、l301p/g/f和l570r/v;a57r、y462w、h479m、l301p和l570r;a57r/t、y462p/c/w/t/n、h479m、n300l、l301p/g/f、f308w/f和l570r/v;a57r、y462w、h479m、n300l、l301p、f308w和l570r;a57r/t、y462p/c/w/t/n、h479m、l301p/g/f、l570r/v和y77r;a57r、y462w、h479m、l301p、l570r和y77r;a57r/t、y462p/c/w/t/n、h479m、n300l、l301p/g/f、f308w/f、l570r/v和y77r;a57r、y462w、h479m、n300l、l301p、f308w、l570r和y77r;a57r/t、y462p/c/w/t/n、h479m、l301p/g/f、l570r/v、y77r和n311v;a57r、y462w、h479m、l301p、l570r、y77r和n311v;a57r/t、y462p/c/w/t/n、h479m、n300l、l301p/g/f、f308w/f、l570r/v、
y77r和n311v;a57r、y462w、h479m、n300l、l301p、f308w、l570r、y77r和n311v;a57r、y462w、h479m、n300l、l301p、f308w、l570r、y77r、s80d和n311v。
38.在一些实施方式中,工程化的pglb中的单一点突变可以提高载体蛋白用多糖的糖基化的效率,从而导致糖基化蛋白的比较产率的增加。可以通过将由含有特定氨基酸置换的工程化pglb ost产生的糖基化蛋白的产率除以由不包含该氨基酸置换的相应pglb ost产生的糖基化蛋白的产率来测定比较产率的增加。在一个实施方式中,与缺乏该特定点突变的相应pglb的比率相比,在工程化pglb中引入单一点突变可以使比较产率增加约1.1倍至约10倍、约1.2倍至约7倍、约1.3倍至约5倍、约1.5倍至约2.5倍或约1.5倍至约6倍。当在pglb中组合为多个点突变时,单一点突变的积极效果可以倍增。在一些实施方式中,工程化pglb可以包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸置换,与使用未引入点突变组合的相应pglb(原始pglb)获得的产率相比,其将糖基化蛋白的比较产率提高2倍以上、5倍以上、10倍以上、50倍以上、100倍以上、200倍以上、500倍以上、700倍以上、1,000倍以上、2,000倍以上、3,000倍以上、4,000倍以上、5,000倍以上、6,000倍以上、7,000倍以上、8,000倍以上、10,000倍以上。
39.在一些实施方式中,可以通过比较工程化pglb的和原始的pglb的蛋白质用缺少还原末端的n-乙酰基糖的多糖或寡糖的糖基化产率来比较工程化pglb和工程化pglb的未突变形式的蛋白质糖基化产率。例如,具有还原末端的葡萄糖的糖,例如,肺炎链球菌荚膜多糖或b群链球菌荚膜糖,例如图5和6中描述的那些。在一个实施方式中,缺少还原末端的n-乙酰基糖的多糖或寡糖是肺炎链球菌血清型8的荚膜糖。
40.在一些实施方式中,工程化pglb的蛋白质用缺少还原末端的n-乙酰基糖的多糖或寡糖的糖基化产率与未突变的pglb的用具有还原末端的n-乙酰基糖的多糖或寡糖的糖基化蛋白质的产率进行比较。例如,具有还原末端的葡萄糖的糖,例如肺炎链球菌荚膜多糖或b群链球菌荚膜糖,例如,图5和6中描述的那些。在一个实施方式中,缺少还原末端n-乙酰基糖的多糖或寡糖是肺炎链球菌血清型8的荚膜糖。
41.在一些实施方式中,工程化pglb的用肺炎链球菌血清型8荚膜糖糖基化的蛋白质的糖基化产率相对于未突变的pglb增加至少1.1倍、1.2倍、1.3倍、1.5倍、1.7倍、2倍,2.5倍、3倍、5倍、10倍、100倍、500倍或1,000倍。
42.在一些实施方式中,与工程化pglb的未突变形式所获得的产率相比,工程化pglb可以使蛋白质用肺炎链球菌血清型8荚膜糖的体内或体外糖基化产率增加约1.2倍至约5,000倍,约1.5倍至约2,000倍、约2倍至约1,000倍、约2倍至约20倍或约20倍至约2,000倍。
43.在一些实施方式中,工程化pglb可以产生约1%至约70%、约3%至约65%、约5%至约60%、约5%至约55%、约10%至约50%、约15%至约45%、约20%至约40%或者约25%至约35%的蛋白质体内糖基化水平或体外糖基化水平。在一些实施方式中,工程化pglb可以产生至少1%、至少3%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%或至少70%的载体蛋白体内糖基化水平或体外糖基化水平。
44.工程化pglb可以来自任何具有pglb的生物体。在一些实施方式中,工程化pglb来自原核生物体。在一些实施方式中,工程化pglb来自空肠弯曲杆菌(campylobacter jejuni,c.jejuni)、大肠弯曲杆菌(campylobacter coli,c.coli)、红嘴鸥弯曲杆菌
(campylobacter lari,c.lari)、乌普萨拉弯曲杆菌(campylobacter upsaliensis,c.upsaliensis)、曲形弯曲杆菌(campylobacter curvus,c.curvus)、简要弯曲杆菌(campylobacter concisus,c.concisus)、人弯曲杆菌(campylobacter hominis,c.hominis)、纤细弯曲杆菌(campylobacter gracilis,c.gracilis)、昭和弯曲杆菌(campylobacter showae,c.showae)、自养硫单胞菌(sulfurimonas autotrophica,s.autotrophica)、sulfurimonas denitrificans(s.denitrificans)、sulfurospirillum deleyianum(s.deleyianum)、sulfuricurvum kujiense(s.kujiense)、nautilia profundicola(n.profundicola)、sulfuvorum sp.nbc37-1、产琥珀酸沃廉菌(wolinalla succinogenes,w.succinogenes)、caminibacter mediatlanticus(c.mediatlanticus)、nitratiruptor sp.sb155-2、helicobacter pullorum(h.pullorum)、helicobacter canadensis(h.canadensis)、helicobacter winghamensis(h.winghamensis)、desulfurobacterium thermolithotr(d.thermolithotr)、杆状脱硫微菌(desulfomicrobium baculatum,d.baculatum)、普通脱硫弧菌(desulfovibrio vulgaris,d.vulgaris)、嗜碱脱硫弧菌(desulfovibrio alkaliphilus,d.alkaliphilus)、desulfohalobium retbaense(d.retbaense)、脱硫铁杆菌(deferribacter desulfuricans,d.desulfuricans)、desulfovibrio salexigenes(d.salexigenes)、desulfovibrio piger(d.salexigenes)、desulfovibrio aespoeensis(d.aespoeensis)、cand.puniceispirillum marinum、calditerrivibrio nitroreducens(c.nitroreducens)或炽热甲烷嗜热菌(methanothermus fervidus,m.fervidus)。
45.本文鉴定的点突变通常是在来自空肠弯曲杆菌的pglb序列中发现的那些(例如,seq id no:1的来自空肠弯曲杆菌的pglb)。本发明的另一方面是来自以上鉴定的任何物种的pglb,其含有与seq id no:1的空肠弯曲杆菌pglb所公开的那些突变相对应的突变。
46.在一些实施方式中,pglb ost多肽是工程化的pglb、工程化的pglb同源物或天然存在的pglb变体的工程化形式。pglb
cj
同源物可以包含天然存在的pglb
cj
同源物和非天然存在的pglb
cj
同源物。pglb
cj
同源物可包含与seq id no:1的pglb
cj
具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的蛋白质。可以使用needleman和wunsch的同源性比对算法、clustalw程序或blastp算法确定序列同一性的程度。使用全局比对(needleman和wunsch)的算法是优选的。
47.在一些实施方式中,工程化的pglb是工程化的pglb
cl
、工程化的pglb
cl
同源物或天然存在的pglb
cl
变体的工程化形式。pglb
cl
同源物可以包含天然存在的pglb
cl
同源物和非天然存在的pglb
cl
同源物。pglb
cl
同源物可包含与seq id no:2的pglb
cl
具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的蛋白质。可以通过needleman和wunsch的同源性比对算法、clustalw程序或blastp算法确定序列同一性的程度。使用全局比对(needleman和wunsch)的算法是优选的。
48.在一些实施方式中,工程化的pglb包含pglb片段,例如,pglb
cj
片段。在一些实施方式中,pglb片段包含全长pglb(例如,seq id no:1)的至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600个或至少650个连续氨基酸。
49.pglb
cj
修饰
50.在一些实施方式中,本文所述的工程化的pglb ost是修饰的野生型n-ost,例如野生型pglb
cj
。在一些实施方式中,野生型pglb
cj
是seq id no:9的野生型pglb
cj
或其天然存在的变体:
[0051][0052]
在一些实施方式中,seq id no:1的氨基酸x57、x63、x94、x101、x172、x176、x191、x193、x233、x234、x255、x286、x295、x301、x319、x397、x402、x425、x435、x446、x462、x479、x523、x532、x601、x605、x606、x610、x645、x676和x695中的一个或多个或其任何组合被修饰。在一个实施方式中,x57、x301、x319、x462、x479和x523中的一个或多个或其任何组合被修饰,例如通过置换。在一个实施方式中,x57、x462和x479中的一个或多个被修饰。在一个实施方式中,x57被修改。在一个实施方式中,x462和x479被修改。在一个实施方式中,x57、x462和x479被置换。在一个实施方式中,进行了a57r置换。在一个实施方式中,进行了a57r、y462w和h479m置换。
[0053]
(a)pglb
cl
修饰
[0054]
在一些实施方式中,本文所述的修饰的pglb ost是修饰的野生型pglb ost,例如野生型pglb
cl
(红嘴鸥弯曲杆菌的pglb)。在一些实施方式中,野生型pglb
cj
是seq id no:10的野生型pglb
cl
或其天然存在的变体:
[0055][0056]
在另一个实施方式中,本文提供了包含n314v置换和y79r置换的工程化的pglb
cl
。在进一步的实施方式中,提供了包含a59r突变的工程化的pglb
cl
。在进一步的实施方式中,提供了包含y468w和h485m突变的工程化的pglb
cl
。在进一步的实施方式中,提供了包含
a59r、y468w和h485m置换的工程化的pglb
cl
。在进一步的实施方式中,提供了包含n314v、y79r、a59r、y468w和h485m置换的工程化的pglb
cl

[0057]
大肠弯曲杆菌pglb
[0058]
本发明的另一方面是天然的pglb,特别是来自大肠弯曲杆菌,已发现其对于将某些糖类转移至含有asp/glu-z
1-asn-z
2-ser/thr(其中z1和z2可以是除pro之外的任何天然氨基酸)糖基化共有序列的载体蛋白有更大的活性。在来自大肠弯曲杆菌菌株efm37568的pglb(seq id no:12)的情况下,已发现用于转移至少福氏志贺氏菌(s.flexneri)2a、3a和6,加大肠杆菌o18的ost活性高于天然空肠弯曲杆菌pglb(seq id no:1)。
[0059]
测试了来自大肠弯曲杆菌菌株cdg57218的pglb(seq id no:13)在将大肠杆菌o18糖转移到含有糖基化共有序列的蛋白质中的活性。这种ost活性在空肠弯曲杆菌的pglb和seq id no:13的pglb之间是相同的。
[0060]
测试了来自大肠弯曲杆菌菌株eia90085的pglb(seq id no:14)在将大肠杆菌o18糖转移到含有糖基化共有序列的蛋白质中的活性。这种ost活性略高于空肠弯曲杆菌的pglb。我们得出结论,来自大肠弯曲杆菌的几个菌株的野生型pglb对于催化糖转移到含有用于pglb的糖基化共有序列的蛋白质与来自空肠弯曲杆菌的pglb相当或更优。图7显示了三个大肠弯曲杆菌菌株pglb的的序列,且菌株efm37568 pglb序列与另外两个测试的pglb的氨基酸序列略有不同。大肠弯曲杆菌efm37568 pglb给出了特别好的结果。
[0061]
本发明的另一个实施方式提供了来自大肠弯曲杆菌的pglb寡糖基转移酶(ost)或其功能片段(pglb
c.coli
)在生产糖基化蛋白(其中糖连接至糖基化共有序列的n残基上)中的用途,其中糖基化共有序列包含氨基酸序列asp/glu-z
1-asn-z
2-ser/thr,其中z1和z2可以是除pro之外的任何天然氨基酸。在一个实施方式中,使用具有与seq id no:12、13或14至少80%、85%、90%、95%、97%、99%或100%同一性的氨基酸序列的大肠弯曲杆菌pglb。任选地,大肠弯曲杆菌pglb具有与seq id no:12至少80%、85%、90%、95%、97%、99%或100%同一性的氨基酸序列。
[0062]
本发明的另一个实施方式公开了将本文所述的氨基酸置换引入到大肠弯曲杆菌pglb中。在一个实施方式中,大肠弯曲杆菌pglb含有至少一个选自于氨基酸x57、x63、x94、x101、x172、x176、x191、x193、x233、x234、x255、x286、x295、x301、x319、x397、x402、x426、x436、x447、x463、x480、x524、x533、x602、x606、x607、x611、x646、x677和x696的残基被置换为与在seq id no:12中该位置处发现的氨基酸不同的氨基酸。在一个实施方式中,提供了在对应于seq id no:12的氨基酸x57、x463和x480的任何一个残基处含有置换的pglb
c.coli
寡糖基转移酶多肽或功能片段;任选地,置换是a57r、y463w和h480m中的至少一个。在一个实施方式中,pglb
c.coli
在残基x57、x77、x311、x462和/或x480处含有至少一个氨基酸置换。在一个实施方式中,氨基酸置换位于这些位置的1、2、3、4或5个处。在一个实施方式中,置换是残基a57r、y77r、n311v、y463w和/或h480m处的至少一个氨基酸置换。在一个实施方式中,将这些突变中的一个、两个、三个、四个或五个引入到大肠弯曲杆菌pglb的氨基酸序列(任选地具有seq id no:12的序列)中。
[0063]
寡糖和多糖
[0064]
可通过本文提供的工程化的pglb ost连接到蛋白质的寡糖可具有约2至约100个单糖单元,例如,2、4、6、8、10、15、20、25、30、40、50、60、70、80、90或100个或者4至90、6至80、
8至70、10至60、15至50、20至40或25至40个单糖单元。可通过本文提供的工程化的pglb ost连接到蛋白质的多糖可具有超过100个单糖单元,例如,至少101、110、150、200、300、400、500、600、700、800、900、1,000个单糖单元或更多。例如,100至500、100至300或100至200个单糖单元。
[0065]
蛋白质或pglb ost可包含本文公开的任何pglb ost或任何蛋白质。
[0066]
在一些实施方式中,寡糖或多糖的还原末端的糖是戊糖、己糖或庚糖。在一些实施方式中,寡糖或多糖的还原末端的糖是戊醛糖或戊酮糖。在一些实施方式中,戊糖是d-阿拉伯糖、d-来苏糖、d-核糖、d-木糖、d-核酮糖或d-木酮糖。在一些实施方式中,寡糖或多糖的还原末端的糖是己醛糖或己酮糖。在一些实施方式中,己糖是例如,d-阿洛糖、d-阿卓糖、d-葡萄糖、d-甘露糖、d-古洛糖、d-艾杜糖、d-半乳糖、d-塔罗糖、d-阿洛酮糖、d-果糖,d-山梨糖或d-塔格糖。在一些实施方式中,寡糖或多糖的还原末端的糖是脱氧糖或二脱氧糖,例如,鼠李糖、岩藻糖或阿比可糖。在一些实施方式中,寡糖或多糖的还原末端的糖是庚醛糖或庚酮糖。在一些实施方式中,庚糖是甘露庚酮糖。在一个优选的实施方式中,寡糖或多糖还原末端的糖是葡萄糖。
[0067]
可以通过本文提供的工程化的pglb ost连接至蛋白质的n残基的寡糖和多糖可以是通常在任何生物体(例如,原核生物体或真核生物体)中发现的那些。在一些实施方式中,寡糖或多糖来自病原生物体,例如,人类病原体或动物病原体(例如,农场动物或宠物)。在一些实施方式中,寡糖或多糖来自细菌生物体。在一些实施方式中,寡糖或多糖可以来自大肠杆菌(e.coli)、松内志贺氏菌(shigella sonnei)、福氏志贺氏菌(shigella flexneri)、痢疾志贺氏菌(shigella dysenteriae)、沙门氏菌(salmonella sp,例如,肠道沙门氏菌(s.enterica)enterica亚种、肠道沙门氏菌salamae亚种、肠道沙门氏菌arizonae亚种、肠道沙门氏菌diarizonae亚种、肠道沙门氏菌houtenae亚种、s.bongori和肠道沙门氏菌indica亚种)、假单胞菌(pseudomonas sp)(铜绿假单胞菌,p.aeruginosa)、克雷伯氏菌(klebsiella sp.,例如,肺炎克雷伯菌(k.pneumonia))、不动杆菌(acinetobacter)、沙眼衣原体(chlamydia trachomatis)、霍乱弧菌(vibrio cholera)、李斯特菌(listeria sp.,例如,单核细胞增生李斯特菌(l.monocytogenes))、嗜肺军团菌(legionella pneumophila)、副百日咳博德特氏菌(bordetella parapertussis)、鼻疽伯克霍尔德氏菌(burkholderia mallei)和类鼻疽伯克霍尔德氏菌(burkholderia pseudomallei)、土拉弗朗西斯菌(francisella tularensis)、弯曲杆菌(campylobacter sp.)(空肠弯曲杆菌,c.jejuni);艰难梭菌(clostridium difficile)、金黄色葡萄球菌(staphylococcus aureus)、肺炎链球菌(streptococcus pneumoniae)、化脓性链球菌(streptococcus pyogenes)、大肠杆菌、无乳链球菌(streptococcus agalacticae)、脑膜炎奈瑟菌(neisseria meningitidis)、白色念珠菌(candida albicans)、流感嗜血杆菌(haemophilus influenza)、粪肠球菌(enterococcus faecalis)、伯氏疏螺旋体(borrelia burgdorferi)、奈瑟淋球菌(neisseria gonorrhoea)、流感嗜血杆菌、硕大利什曼原虫(leishmania major)。
[0068]
在一些实施方式中,寡糖或多糖包含在人或动物(例如,农场动物或宠物)中具有免疫原性的抗原,例如,表位。在一些实施方式中,寡糖或多糖包含以下大肠杆菌的o抗原(例如,o1、o2、o3、o4、o5、o6、o7、o8、o9、o10、o11、o12、o13、o14、o15、o16、o17、o18、o19、o20、
o21、o22、o23、o24、o25、o26、o27、o28、o29、o30、o32、o33、o34、o35、o36、o37、o38、o39、o40、o41、o42、o43、o44、o45、o46、o48、o49、o50、o51、o52、o53、o54、o55、o56、o57、o58、o59、o60、o61、o62、o63、o64、o65、o66、o68、o69、o70、o71、o73、o74、o75、o76、o77、o78、o79、o80、o81、o82、o83、o84、o85、o86、o87、o88、o89、o90、o91、o92、o93、o95、o96、o97、o98、o99、o100、o101、o102、o103、o104、o105、o106、o107、o108、o109、o110、o111、o112、o113、o114、o115、o116、o117、o118、o119、o120、o121、o123、o124、o125、o126、o127、o128、o129、o130、o131、o132、o133、o134、o135、o136、o137、o138、o139、o140、o141、o142、o143、o144、o145、o146、o147、o148、o149、o150、o151、o152、o153、o154、o155、o156、o157、o158、o159、o160、o161、o162、o163、o164、o165、o166、o167、o168、o169、o170、o171、o172、o173、o174、o175、o176、o177、o178、o179、o180、o181、o182、o183、o184、o185、o186、o187)、福氏志贺氏菌o1a、o1b、o2a、o3a、o6、松内志贺氏菌o抗原、痢疾志贺氏菌o1、沙门氏菌(肠道沙门氏菌enterica亚种、肠道沙门氏菌salamae亚种、肠道沙门氏菌arizonae亚种、肠道沙门氏菌diarizonae亚种、肠道沙门氏菌houtenae亚种、s.bongori或肠道沙门氏菌indica亚种)抗原和o型1-67,详见[44]、假单胞菌(铜绿假单胞菌o血清型1-20[45])、克雷伯氏菌(例如,肺炎克雷伯菌血清型o1、o2(和亚血清型)、o3、o4、o5、o6、o7、o8、o9、o10、o11、o12,[46])、不动杆菌o抗原(例如,[47]中鉴定的鲍曼不动杆菌(a.baumannii)o抗原)、沙眼衣原体o抗原(血清型a、b、c、d、e、f、g、h、i、j、k、l1、l2、l3)、霍乱弧菌o抗原o1至155、李斯特菌,特别是单核细胞增生李斯特菌1、2、3、4型及其亚血清型、嗜肺军团菌血清型1至15o抗原、副百日咳博德特氏菌o抗原、鼻疽和类鼻疽伯克霍尔德氏菌o抗原、土拉弗朗西斯菌、弯曲杆菌(空肠弯曲杆菌);艰难梭菌(血清型a、g、h、k、s1、s4、d、cd-5、k,toma等1988和产气荚膜梭菌(c.perfringens)血清型a、b、c、d或e)的荚膜多糖、来自血清型5或血清型8的金黄色葡萄球菌荚膜糖、来自血清型1、2、3、4、5、6a、6b、6c、7f、8、9a、9l、9n、9v、10a、11a、12f、14、15a、15b、16f、18c、19a、19f、22f、23f、33f、35b的肺炎链球菌荚膜糖、化脓性链球菌(来自血清型ia、ib、ii、iii、iv、v、vi、vii或viii的b群链球菌荚膜血清型多糖)、无乳链球菌(a群链球菌荚膜多糖)、脑膜炎奈瑟菌(血清组a、b、c、w、y、x)、白色念珠菌、流感嗜血杆菌、粪肠球菌荚膜多糖i-v型;和其他表面多糖结构,例如,伯氏疏螺旋体糖脂、脑膜炎奈瑟菌菌毛o聚糖和脂寡糖(los)、流感嗜血杆菌los、硕大利什曼原虫磷脂聚糖、肿瘤相关糖抗原(疟疾糖基磷脂酰肌醇、结核分枝杆菌阿拉伯甘露聚糖。
[0069]
在一些实施方式中,寡糖或多糖是金黄色葡萄球菌(s.aureus)或肠道沙门氏菌亚种(s.enterica sv.)多糖。在一些实施方式中,多糖是金黄色葡萄球菌cp5或cp8或者肠道沙门氏菌鼠伤寒亚种lt2多糖。
[0070]
在一些实施方式中,寡糖或多糖在还原末端包含n-乙酰基糖。在一些实施方式中,在还原末端包含n-乙酰基糖的寡糖或多糖可以包含,例如,大肠杆菌的o抗原(例如,o1、o2、o3、o4、o5、o6、o7、o8、o9、o10、o11、o12、o13、o14、o15、o16、o17、o18、o19、、o21、o22、o23、o24、o25、o26、o27、o28、o29、o30、o32、o33、o34、o35、o36、o37、o38、o39、o40、o41、o42、o43、o44、o45、o46、o48、o49、o50、o51、o52、o53、o54、o55、o56、o57、o58、o59、o60、o61、o62、o63、o64、o65、o66、o68、o69、o70、o71、o73、o74、o75、o76、o77、o78、o79、o80、o81、o82、o83、o84、o85、o86、o87、o88、o89、o90、o91、o92、o93、o95、o96、、o98、o99、o100、o101、o102、o103、o104、o105、o106、o107、o108、o109、o110、o111、o112、o113、o114、o115、o116、o117、o118、
o119、o120、o121、o123、o124、o125、o126、o127、o128、o129、o130、o131、o132、o133、o134、o135、o136、o137、o138、o139、o140、o141、o142、o143、o144,o145、o146、o147、o148、o149、o150、o151、o152、o153、o154、o155、o156、o157、o158、o159、o160、o161、o162、o163、o164、o165、o166、o167、o168、o169、o170、o171、o172、o173、o174、o175、o176、o177、o178、o179、o180、o181、o182、o183、o184、o185、o186、o187)、金黄色葡萄球菌(s.aureus)的荚膜多糖(例如,cp5或cp8)、土拉弗朗西斯菌schu4的荚膜多糖、肺炎链球菌荚膜的荚膜多糖(例如,cp1、4、5、12、25、38、44、45或46)、脑膜炎奈瑟氏菌菌毛o聚糖、鼻疽和类鼻疽伯克霍尔德氏菌o抗原、副百日咳博德特氏菌o抗原、嗜肺军团菌血清型1至15o抗原、李斯特菌o抗原,特别是单核细胞增生李斯特菌1、2、3、4型的o抗原、假单胞菌的o抗原(铜绿假单胞菌o血清型1-20)、克雷伯氏菌的o抗原(例如,肺炎克雷伯菌血清型o1、o2(和亚血清型)、o3、o4、o5、o6、o7、o8、o9、o10、o11、o12)、志贺氏菌的o抗原(例如,痢疾志贺氏菌、松内志贺氏菌、福氏志贺氏菌、s.boydii)、不动杆菌o抗原(例如,鲍曼不动杆菌o抗原)或李斯特菌的o抗原。
[0071]
n-乙酰基糖可以在糖的一个或多个碳原子处包含氨基-乙酰基(n-乙酰基)取代基。例如,n-乙酰基糖可以在单糖单元例如葡萄糖单元(n-乙酰葡糖胺)的c2-原子上包含n-乙酰基取代基。
[0072]
在一些实施方式中,寡糖或多糖在还原末端包含未被n-乙酰化的糖。在一些实施方式中,在还原末端包含非n-乙酰化糖的寡糖或多糖可以包含例如,大肠杆菌o20、沙门氏菌(例如,肠道沙门氏菌enterica亚种、肠道沙门氏菌salamae亚种、肠道沙门氏菌arizonae亚种、肠道沙门氏菌diarizonae亚种、肠道沙门氏菌houtenae亚种、s.bongori或肠道沙门氏菌indica亚种或伤寒沙门氏菌(s.typhi))的抗原、1-67型的o抗原、a群链球菌(化脓链球菌(s.pyrogenes))、b群链球菌和肺炎链球菌cps血清型(在其荚膜基因簇中编码wcha、wcjg或wcjh,即除cp1、4、5、12、25、38、44、45、46以外的所有血清型)的荚膜多糖或肠道沙门氏菌亚种(s.enterica sv.)o抗原。
[0073]
在一些实施方式中,寡糖或多糖包含金黄色葡萄球菌cp5或cp8或肠道沙门氏菌鼠伤寒亚种lt2多糖、霍乱弧菌o抗原(例如,o1至155)或李斯特菌o抗原(例如,单核细胞增生李斯特菌1、2、3、4型)。
[0074]
在一些实施方式中,寡糖或多糖在其还原末端包含d-n-乙酰基岩藻糖胺(d-fucnac)残基,如例如,金黄色葡萄球菌血清型5、8或铜绿假单胞菌o抗原血清型o2、o5、o11,o16的荚膜多糖。
[0075]
在一些实施方式中,寡糖或多糖在其还原末端包含4-氨基-d-n-乙酰基岩藻糖胺(d-fucnac4n)残基,如例如,来自肺炎链球菌(如血清型1)的某些寡糖或多糖、松内志贺氏菌o抗原或类志贺邻单胞菌(plesiomonas shigelloides)o17。
[0076]
在一些实施方式中,寡糖或多糖在其还原末端包含d-n-乙酰基奎诺糠胺(acetylquinosamine)(d-quinac)残基,如例如,像铜绿假单胞菌o抗原血清型o6、o1,或土拉弗朗西斯菌血清型schu4。
[0077]
在一些实施方式中,寡糖或多糖在其还原末端包含半乳糖残基,如例如,肠道沙门氏菌lt2。
[0078]
在一些实施方式中,寡糖或多糖包含肺炎链球菌荚膜多糖血清型5,大肠杆菌o1、o2,阪崎肠杆菌(cronobacter sakazakii)o5,即具有β构型的1-4连接至l-鼠李糖的还原末
端d-glcnac的多糖和寡糖。
[0079]
蛋白质
[0080]
通过本发明的工程化的pglb ost进行糖基化的蛋白质是含有至少一个位于糖基化共有序列d/e-z
1-n-z
2-s/t(z1和z2≠p)中的n残基的蛋白质。在一些实施方式中,蛋白质是载体蛋白质。工程化的pglb ost的活性能够将糖免疫原共价结合到载体蛋白上。载体蛋白提供t细胞表位,其允许连接的糖免疫原产生t依赖性免疫反应。在一些实施方式中,蛋白质是生物药物蛋白质,本发明的工程化的pglb ost向其添加至少一种糖以实现生物药物蛋白质的正确糖基化或正确折叠或者增加的稳定性。在一个实施方式中,生物药物蛋白是单克隆抗体,能够结合抗原的单克隆抗体的片段。在一个实施方式中,生物药物蛋白是促红细胞生成素、生长激素、人胰岛素、因子viii、因子ix、组织纤溶酶原激活剂、胰高血糖素、促性腺激素、集落刺激因子、干扰素α、β或γ、白细胞介素(例如,白细胞介素2)或肿瘤坏死因子。
[0081]
载体蛋白可以通过本文提供的工程化的pglb ost连接到寡糖或多糖。
[0082]
载体蛋白可以是任何天然载体蛋白(来自与pglb ost相同的生物体)或任何异源载体蛋白(来自与pglb ost不同的生物体)。在一些实施方式中,载体蛋白是免疫原。载体蛋白可以是全长蛋白或其片段。示例性载体蛋白包含但不限于铜绿假单胞菌的外毒素a(epa)、crm197、白喉类毒素、破伤风类毒素、金黄色葡萄球菌的脱毒溶血素a、凝集因子a、凝集因子b、大肠杆菌fimh、大肠杆菌fimhc、大肠杆菌热不稳定肠毒素、大肠杆菌热不稳定肠毒素的脱毒变体、霍乱毒素b亚基(ctb)、霍乱毒素、霍乱毒素的脱毒变体、大肠杆菌sat蛋白、大肠杆菌sat蛋白的乘客结构域(passenger domain)、空肠弯曲杆菌acra和空肠弯曲杆菌天然糖蛋白。在一些实施方式中,载体蛋白是铜绿假单胞菌(epa)的外毒素a。
[0083]
在一些实施方式中,通过本文所述的工程化pglb ost进行n-糖基化的载体蛋白被修饰,例如,以使得该蛋白质毒性较小和或更易于糖基化等的方式被修饰。在一些实施方式中,载体蛋白被修饰而使得载体蛋白中糖基化位点的数量以允许施用较低浓度的蛋白质的方式最大化,例如,在免疫原性组合物中,以其生物缀合物形式。因此,在某些实施方式中,本文所述的载体蛋白被修饰以包含比通常与载体蛋白相关的1、2、3、4、5、6、7、8、9、10或更多个糖基化位点(例如,相对于与其原始/天然(例如,“野生型”)状态的载体蛋白相关的糖基化位点的数量)。在一些实施方式中,糖基化位点的引入通过在蛋白质一级结构中的任何位置插入糖基化共有序列(例如,(i)共有序列asn-z-ser(thr),其中z独立地选自除pro之外的任何氨基酸;或(ii)共有序列d/e-z
1-n-z
2-s/t,其中z1和z2独立地选自除pro之外的任何氨基酸)完成。此类糖基化位点的引入可以通过例如向蛋白质的一级结构添加新氨基酸(全部或部分添加糖基化位点)或通过修饰蛋白质中的现有氨基酸以产生糖基化位点(氨基酸不添加到蛋白质中,但蛋白质的选定氨基酸发生突变以形成糖基化位点)完成。本领域技术人员将认识到,可以使用本领域已知的方法容易地修饰蛋白质的氨基酸序列,例如,包含修饰编码蛋白质的核酸序列的工程化方法。在具体的实施方式中,糖基化共有序列被引入载体蛋白的特定区域中,例如蛋白质的表面结构、蛋白质的n或c末端和/或在蛋白质基质处通过二硫键稳定的环中。在某些实施方式中,经典的5氨基酸糖基化共有序列可以通过赖氨酸残基延伸以进行更有效的糖基化,并因此插入的共有序列可以编码应该插入或替代受体蛋白氨基酸的5、6或7个氨基酸。
[0084]
pglb ost可以包含本文公开的任何n-ost。
[0085]
在一些实施方式中,载体蛋白包含“标签”,即允许分离和/或鉴定载体蛋白的氨基酸序列。例如,向本文所述的载体蛋白添加标签可用于纯化该蛋白质,和因此可用于纯化包含标记的载体蛋白的结合疫苗。可用于本文的示例性标签包含但不限于,组氨酸(his)标签(例如,六组氨酸标签或6xhis-标签)、flag-tag和ha标签。在某些实施方式中,一旦它们不再需要,例如,在蛋白质已经被纯化之后,本文使用的标签是可去除的,例如,通过化学试剂或通过酶手段去除。
[0086]
核酸
[0087]
在另一个方面,本文提供了编码来自任何弯曲杆菌物种(包括如本文提供的空肠弯曲杆菌、红嘴鸥弯曲杆菌和大肠弯曲杆菌)的突变的pglb寡糖基转移酶的多核苷酸。
[0088]
在一些实施方式中,核酸编码工程化的pglb
cj
,其中氨基酸57、63、94、101、176、191、193、233、234、286、301、319、397、402、435、446、462、479、523、532、605、610、645、676或695中的一个或者多个被修饰。
[0089]
在一个实施方式中,提供了编码pglb寡糖基转移酶的多核苷酸,其中对应于seq id no:1的311的氨基酸被置换,例如,被缬氨酸残基置换(n311v)。在一个实施方式中,311置换补充有对应于seq id no:1中77的氨基酸置换,例如,被精氨酸残基置换(y77r)。在一个实施方式中,编码pglb ost的多核苷酸在对应于seq id no:1中的57的氨基酸处具有置换,例如被精氨酸残基置换(a57r)。57置换与311和77置换组合或独立置换。在一个实施方式中,多核苷酸编码具有n311v、y77r和a57r置换的pglb ost。
[0090]
在一个实施方式中,提供了编码在seq id no:1的残基462或479或者462和479处含有置换(例如,y462w或h479m或者y462w和h479m)的pglb ost的多核苷酸。这些突变任选地与对应于seq id no:1的残基311、77和/或57的突变组合,例如,n311v、y77r和a57r。在一个实施方式中,提供了编码在57、462和479处具有突变(例如a57r、y462w和h479m)的pglb ost的核酸。在一个实施方式中,提供了编码在对应于seq id no:1的77、57、462和479的残基处具有置换(例如y77r、a57r、y462w和h479m)的pglb ost的多核苷酸。
[0091]
在一些实施方式中,本发明的多核苷酸编码在例如两个或更多、三个或更多、四个或更多、五个或更多、六个或更多、七个或更多、八个或更多、九个或更多或者十个或更多个氨基酸中包含修饰(例如,氨基酸置换或编码pglb的多核苷酸中的核苷酸取代)的pglb ost,例如,2-30、3-25、4-20、5-20、6-20、7-20或10-20个氨基酸置换。在一个实施方式中,置换是在编码seq id no:1的以下残基的位置:
[0092]
57;77;57和77;311和77;57、77和311;57和462;57、462和479;57、462、479、77和311;57、462、479、300、301、308和570;57、462、479、300、301、308、570和77;57、462、479、300、301、308、570、77和311。
[0093]
在一个实施方式中,以下置换存在于编码seq id no:1的以下残基的位置(其中“/”表示“或”):
[0094]
a57r/t;y77r;a57r/t和y77r;a57r和y77r;n311v和y77r;a57r/t、y77r和n311v;a57r、y77r和n311v;a57r/t和y462p/c/w/t/n;a57r/t和y462w/t/n;a57r和y462w;a57r/t、y462p/c/w/t/n和h479m;a57r/t、y462w/t/n和h479m;a57r、y462w和h479m;a57r/t、y462p/c/w/t/n、h479m、y77r和n311v;a57r/t、y462w/t/n、h479m、y77r和n311v;a57r、y462w、h479m、y77r和n311v;a57r/t、y462p/c/w/t/n、h479m、l301p/g/f和l570r/v;a57r、y462w、
h479m、l301p和l570r;a57r/t、y462p/c/w/t/n、h479m、n300l、l301p/g/f、f308w/f和l570r/v;a57r、y462w、h479m、n300l、l301p、f308w和l570r;a57r/t、y462p/c/w/t/n、h479m、l301p/g/f、l570r/v和y77r;a57r、y462w、h479m、l301p、l570r和y77r;a57r/t、y462p/c/w/t/n、h479m、n300l、l301p/g/f、f308w/f、l570r/v和y77r;a57r、y462w、h479m、n300l、l301p、f308w、l570r和y77r;a57r/t、y462p/c/w/t/n、h479m、l301p/g/f、l570r/v、y77r和n311v;a57r、y462w、h479m、l301p、l570r、y77r和n311v;a57r/t、y462p/c/w/t/n、h479m、n300l、l301p/g/f、f308w/f、l570r/v、y77r和n311v;a57r、y462w、h479m、n300l、l301p、f308w、l570r、y77r和n311v。
[0095]
宿主细胞
[0096]
在另一个方面,本文提供了包含本文提供的突变的pglb ost或野生型或突变的大肠弯曲杆菌pglb ost的宿主细胞。在一个实施方式中,宿主细胞是异源宿主细胞(例如,不是弯曲杆菌)。在一个实施方式中,宿主细胞是大肠杆菌。在一些实施方式中,宿主细胞包含两种或更多种本文提供的工程化的pglb ost(例如,2、3、4、5、6、7、8、9、10或更多种工程化的pglb ost)。
[0097]
在另一个方面,本文提供了包含本文提供的核酸(例如,编码本文提供的工程化的pglb ost)的宿主细胞。在一些实施方式中,宿主细胞包含两种或更多种本文提供的核酸(例如,2、3、4、5、6、7、8、9、10或更多种核酸)。
[0098]
在一些实施方式中,宿主细胞包含一种或多种可用于生物缀合物生产或蛋白质n-糖基化的其他酶(例如,糖基转移酶)。在一些实施方式中,可用于生物缀合物生产的其他酶中的至少一种是重组酶(recombinant enzyme)。在一些实施方式中,宿主细胞包含两种或更多种可用于生物缀合物生产的其他酶(例如,2、3、4、5、6、7、8、9、10种或更多种其他酶)。
[0099]
在一些实施方式中,宿主细胞是原核细胞。在一些实施方式中,宿主细胞是大肠杆菌细胞。在一些实施方式中,宿主细胞包含本文提供的工程化的pglb ost。在一些实施方式中,宿主细胞包含含有至少一种糖基化共有序列的蛋白质和本文提供的工程化的n-ost。在一些实施方式中,宿主细胞包含含有至少一种糖基化共有序列的蛋白质、本文提供的工程化的pglb ost和重组糖基转移酶。在一些实施方式中,工程化的pglb ost是工程化的空肠弯曲杆菌pglb。
[0100]
在某些实施方式中,用于产生本文所述的生物缀合物的宿主细胞被工程改造为包含异源核酸,例如,编码一种或多种包含至少一种糖基化共有序列的蛋白质的异源核酸,和/或编码一种或多种蛋白质的异源核酸(例如,编码一种或多种酶的基因)。在一些实施方式中,将编码参与糖基化途径(例如,原核和/或真核糖基化途径)的蛋白质的异源核酸引入本文所述的宿主细胞中。此类核酸可以编码蛋白质,包括但不限于,寡糖基转移酶和/或糖基转移酶。可以使用本领域的技术人员已知的任何方法(例如,电穿孔、通过热休克的化学转化、自然转化、噬菌体转导和缀合)将异源核酸(例如,编码含有至少一种糖基化共有序列的蛋白质的核酸和/或编码其他蛋白质,例如参与糖基化的蛋白质的核酸)引入本文所述的宿主细胞中。在一些实施方式中,使用质粒将异源核酸引入本文所述的宿主细胞中,例如,异源核酸通过质粒(例如,表达载体)在宿主细胞中表达。在一些实施方式中,使用国际专利申请公开号wo 2014/057109中描述的插入方法将异源核酸引入本文所述的宿主细胞中。
[0101]
在某些实施方式中,可以将额外的修饰引入(例如,使用重组技术)到本文所述的
宿主细胞中。例如,可以在宿主细胞背景(基因组)中以使它们失活/功能失调的方式删除或修饰编码形成可能竞争或干扰糖基化途径的一部分(例如,竞争或干扰被重组引入宿主细胞中的参与糖基化的一种或多种异源基因)的蛋白质的宿主细胞核酸(例如基因)(即,删除/修饰的宿主细胞核酸不编码功能性蛋白质或不编码任何蛋白质)。在某些实施方式中,当核酸从本文提供的宿主细胞的基因组中删除时,它们被期望的序列(例如,对糖蛋白生产有用的序列)替代。
[0102]
可以在宿主细胞中删除(并且在一些情况下,用其他所需的核酸序列替代)的示例性基因包括参与糖脂生物合成的宿主细胞的基因,例如waal(参见,例如,feldman等,2005,pnas usa 102:3016-3021)、脂质a核心生物合成簇(waa)、半乳糖簇(gal)、阿拉伯糖簇(ara)、可拉酸(colanic acid)簇(wca)、荚膜多糖簇、参与核苷酸活化糖生物合成的代谢酶、肠杆菌共同抗原簇(wec)和前噬菌体o抗原修饰簇,如gtrabs簇。
[0103]
本文所述的宿主细胞可产生本文所述的n-糖基化载体蛋白。在一些实施方式中,由本文所述宿主细胞产生的n-糖基化载体蛋白是抗原,例如可用于疫苗的病毒或细菌抗原。在一些实施方式中,由本文所述的宿主细胞产生的n-糖基化载体蛋白可以是含有本文所述的糖基化共有序列的任何蛋白,其中所述蛋白被本文所述的宿主细胞修饰以具有一种或更多种有益特性,例如,蛋白质是n-糖基化的。
[0104]
下面的某些实施例描述了本文所述方法在革兰氏阴性大肠杆菌宿主细胞中的应用;然而,本领域技术人员已知的任何宿主细胞都可用于产生n-糖基化载体蛋白,包括古细菌、大肠杆菌以外的原核宿主细胞和真核宿主细胞。
[0105]
可根据本文所述方法使用的示例性原核宿主细胞包括但不限于,埃希氏菌(escherichia)物种、志贺氏菌(shigella)物种、克雷伯氏菌(klebsiella)物种、黄色单胞菌(xhantomonas)物种、沙门氏菌(salmonella)物种、耶尔森氏菌(yersinia)物种、乳球菌(lactococcus)物种、乳杆菌(lactobacillus)物种、假单胞菌(pseudomonas)物种、棒状杆菌(corynebacterium)物种、链霉菌(streptomyces)物种、链球菌(streptococcus)物种、葡萄球菌(staphylococcus)物种、芽孢杆菌(bacillus)物种和梭菌(clostridium)物种。
[0106]
在某些实施方式中,本文所述的宿主细胞包含已将一种或多种dna序列引入其中的基因组,其中所述dna序列编码蛋白质或包含参与蛋白质n-糖基化的操纵子/基因簇。例如,在一些实施方式中,本文所述的宿主细胞包含已向其中插入以下的一种或多种的基因组:编码工程化的pglb ost的dna、编码糖基转移酶的dna、编码含有至少一种糖基化序列的蛋白质的dna、包含rfb基因簇的dna、包含荚膜多糖基因簇的dna和/或编码差向异构酶的dna。
[0107]
宿主细胞可以包含本文提供的工程化的pglb ost或大肠弯曲杆菌pglb ost,或编码本文提供的工程化的pglb ost或大肠弯曲杆菌pglb ost的核酸,由此工程化的pglb ost可以来自任何具有n-ost的生物体,包括原核生物。在一些实施方式中,pglb ost蛋白或pglb ost编码核酸来自弯曲杆菌属(例如,来自空肠弯曲杆菌的pglb基因)。
[0108]
本文所述的宿主细胞可包含本领域已知的糖基转移酶或编码本领域已知的糖基转移酶的核酸序列。在一些实施方式中,糖基转移酶是在国际专利申请公开号wo 2011/138361中描述的糖基转移酶,其公开内容以引用的方式整体并入本文。在一些实施方式中,糖基转移酶来自革兰氏阳性细菌,例如,糖基转移酶来自肺炎链球菌,例如来自肺炎链球菌
血清型1、2、3、4、5、6a、6b、6c、7f、8、9a、9l、9n、9v、10a、11a、12f、14、15a、15b、16f、18c、19a、19f、22f、23f、33f、35b(优选来自血清型8),或来自化脓链球菌(来自血清型ia、ib、ii、iii、iv、v、vi、vii或viii的b群链球菌荚膜血清型多糖。在一些实施方式中,糖基转移酶是来自金黄色葡萄球菌的荚膜多糖5。在一些实施方式中,糖基转移酶是来自金黄色葡萄球菌的荚膜多糖8。在一些实施方式中,糖基转移酶来自革兰氏阴性细菌,例如大肠杆菌或福氏志贺氏菌或松内志贺氏菌。
[0109]
本文所述的宿主细胞可包含或产生含有至少一个糖基化共有位点的蛋白质或者包含编码含有至少一个本领域已知的糖基化共有序列的蛋白质的核酸序列。由本文所述的宿主细胞产生的蛋白质包含至少一个n-糖基化共有序列,例如,共有序列(i)asn-z-ser(thr),其中z独立地选自除pro之外的任何氨基酸;或(ii)d/e-z
1-n-z
2-s/t,其中z1和z2独立地选自除pro之外的任何氨基酸。因此,宿主细胞可以包含编码n-糖基化共有序列的dna序列。宿主细胞可以包含本领域已知的任何蛋白质,包含本文所述的这些。在一些实施方式中,蛋白质是载体蛋白质,例如铜绿假单胞菌的外毒素a(epa),包括已被修饰以包含至少一个n-糖基化共有序列的epa。在一些实施方式中,所述蛋白质是载体蛋白,其是霍乱毒素b。在一些实施方式中,所述载体蛋白是acra。在一些实施方式中,载体蛋白是h1a。在一些实施方式中,载体蛋白是clfa。在一些实施方式中,载体蛋白是crm197。
[0110]
生物缀合物
[0111]
本文所述的生物缀合物是在宿主细胞中制备的蛋白质(例如,本文所述的任何载体蛋白)和寡糖或多糖(例如,本文所述的任何寡糖或多糖)之间的缀合物,其中宿主细胞机构将寡糖或多糖与蛋白质连接(例如,n-链接)。在一些实施方式中,寡糖或多糖是抗原(例如,本文所述的任何抗原)。糖缀合物可以包括生物缀合物以及通过其他方式制备的糖抗原(例如寡糖和多糖)-蛋白质缀合物,例如通过蛋白质和糖抗原的化学连接。
[0112]
可将本文所述的工程化的pglb ost或大肠弯曲杆菌pglb ost引入细胞(例如革兰氏阴性细菌细胞)中以产生宿主细胞(其产生包含n-糖基化载体蛋白的生物缀合物)。在一些实施方式中,本文提供了生物缀合物,其包含用本文所述的抗原(例如,寡糖或多糖)n-糖基化的载体蛋白。在一些实施方式中,载体蛋白是epa。本文所述的生物缀合物可以,例如但不限于,包含本文所述的任何载体蛋白。本文所述的生物缀合物可以,例如但不限于,包含本文所述的任何寡糖或多糖。
[0113]
在一个实施方式中,异源糖基化载体蛋白是肺炎链球菌血清型12f-epa、肺炎链球菌血清型8-epa、肺炎链球菌血清型19a-epa、肺炎链球菌血清型22f-epa、肺炎链球菌血清型23a-epa或肺炎链球菌血清型35b-epa。在一个实施方式中,异源糖基化载体蛋白是附接于载体蛋白(例如epa、crm197、dt或tt)的肺炎链球菌荚膜糖或b群链球菌荚膜糖。
[0114]
在一个实施方式中,异源糖基化载体蛋白是与epa、crm197、dt、tt或葡萄球菌蛋白(如clfa或hla)缀合的5型金黄色葡萄球菌荚膜多糖,或者与epa、crm197、dt、tt或葡萄球菌蛋白(例如,clfa或hla)或松内志贺氏菌-epa缀合的8型金黄色葡萄球菌荚膜多糖。
[0115]
在一些实施方式中,本文提供了一种生物缀合物,其包含epa和本文所述的一种或多种不同的寡糖或多糖。
[0116]
在一些实施方式中,本文提供了包含与大肠杆菌o1、o2、o4、o6、o7、o8、o11、o15、o16、o17、o18、o20、o22、o25、o73、o75和/或o83中的一种或多种缀合的载体蛋白的生物缀合
glycans from microgram quantities of glycoproteins.anal biochem.2002may 1;304(1):70-90),在glycosep-n柱(gl sciences)上分离标记的多糖。得到的荧光色谱图指示了多糖的长度和重复单元的数量。可以通过收集单个峰并随后执行ms/ms分析来获取结构信息。从而可以确认单糖组成和重复单元的序列,和另外还可以确定多糖组成的同质性。可以通过maldi-ms/ms分析低分子量的特定峰,并将结果用于确认聚糖序列。每一个峰对应于由一定数量的重复单元组成的聚合物及其片段。因此,色谱图允许测量聚合物长度分布。洗脱时间是聚合物长度的指标,荧光强度与相应聚合物的摩尔丰度相关。
[0127]
在另一个实施方式中,sds-page或毛细管凝胶电泳可用于评估聚糖和糖缀合物。此处合成的o抗原聚糖的聚合物长度由线性组装的重复单元的数量定义。这意味着典型的梯状模式是构成聚糖的不同重复单元数的结果。因此,在sds page或其他按大小分离的技术中,两个相邻的条带仅相差单一重复单元。在分析糖蛋白的聚糖大小时利用这些离散性差异:未糖基化的载体蛋白和具有不同聚合物链长度的糖缀合物根据它们的电泳迁移率而分离。测量糖缀合物上存在的第一可检测重复单元数(n1)和平均重复单元数(n
平均
)。这些参数可用于证明批次间的一致性或多糖稳定性。
[0128]
在另一个实施方式中,可以应用高质量ms和尺寸排阻hplc来测量完整糖缀合物的尺寸。
[0129]
在另一个实施方式中,蒽酮-硫酸分析可用于测量多糖产率(leyva a,quintana a,s
á
nchez m,rodr
í
guez en,cremata j,s
á
nchez jc.rapid and sensitive anthrone-sulfuric acid assay in microplate format to quantify carbohydrate in biopharmaceutical products:method development and validation.biologicals.2008mar;36(2):134-41.epub2007nov 26)。
[0130]
糖基化位点使用的变化
[0131]
为了显示特定蛋白质中的位点使用发生了变化,可以量化糖基化位点的使用。下面列出了用于这一目的的方法。
[0132]
糖肽lc-ms/ms:用蛋白酶消化糖缀合物,和通过合适的色谱方法(c18、亲水相互作用hplc hilic、glycosepn柱、se hplc、ae hplc)分离肽,并使用ms/ms鉴定不同的肽。可以在有或没有之前通过化学(史密斯降解)或酶促方法缩短糖链的情况下使用该方法。使用215至280nm的紫外检测对糖肽峰进行定量可以相对确定糖基化位点的使用。
[0133]
尺寸排阻hplc:通过来自se hplc柱的较早洗脱时间反映较高的糖基化位点使用率。也参见(a)。
[0134]
同质性
[0135]
可以使用测量聚糖长度和流体动力学半径的方法来评估糖缀合物的同质性(连接的糖残基的同质性)。
[0136]
益处
[0137]
本文提供的工程化的pglb ost和大肠弯曲杆菌pglb以及本文提供的使用本文提供的工程化的pglb ost或大肠弯曲杆菌pglb的方法具有特别的商业重要性和意义,因为它们允许快速、高产率、大规模和低成本的高度均质糖基化蛋白质制剂(包含例如,糖缀合物制剂或结合疫苗制剂)的发酵。本文提供的工程化的pglb ost和大肠杆菌pglb使得能够以经济可行的方式生产具有商业和治疗价值的糖基化蛋白质,例如结合疫苗。此外,本发明的
工程化的pglb ost和大肠弯曲杆菌pglb提供更有效的蛋白质n-糖基化,特别是在其中聚糖不是由野生型pglb天然转移的情况下。例如,在待转移至蛋白质n残基的寡糖在还原末端不具有glcnac残基的情况中,例如,其中寡糖的还原末端是葡萄糖残基。使用本文提供的工程化的pglb ost的生物技术生物缀合物生产方法的可重复性和稳健性预计有助于降低生产成本。一般认为,尤其是生物治疗性结合疫苗的同质性会影响药物产品的临床安全性。
[0138]
缩写和定义
[0139]
出于本文描述的目的,用于遗传编码氨基酸的缩写是常规的并且如下表1中所示:
[0140]
表1
[0141][0142]
当使用三字母缩写时,除非特别以“l”或“d”开头或从使用缩写的上下文中清楚,否则氨基酸可以是关于α-碳(cα)的l-或d-构型。例如,“ala”表示丙氨酸而没有指定关于α碳的构型,而“d-ala”和“l-ala”分别表示d-丙氨酸和l-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳的l-构型的氨基酸,小写字母表示关于α-碳的d-构型的氨基酸。例如,“a”表示l-丙氨酸,而“a”表示d-丙氨酸。当肽序列呈现为一串单字母或三字母缩写(或其混合)时,序列按照惯例以n

c方向呈现。
[0143]
除非另外明确定义,否则本文描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义。因此,以下术语旨在具有以下含义。本文提及的所有美国专利和公
开的美国专利申请,包括在此类专利和专利申请中公开的所有序列,均通过引用明确并入。
[0144]“酸性氨基酸或残基”是指当氨基酸包含在肽或多肽中时,具有显示小于约6的pk值的侧链的亲水性氨基酸或残基。由于失去氢离子,酸性氨基酸通常在生理ph下具有带负电荷的侧链。在遗传上,编码的酸性氨基酸包括l-glu(e)和l-asp(d)。
[0145]
如本文所公开的多肽的上下文中使用的“氨基酸”或“残基”是指序列位置处的特定单体(例如,p5表示seq id no:2的位置5处的“氨基酸”或“残基”是脯氨酸。)
[0146]“氨基酸差异”或“残基差异”是指当与参考序列相比时,多肽序列的特定位置处的残基的变化。存在特定氨基酸或氨基酸变化(“残基差异”)的多肽序列位置有时在本文中描述为“xn”或“位置n”,其中n指相对于参考序列的残基位置。
[0147]
例如,其中参考序列具有丝氨酸的位置x8处的残基差异是指位置x8处的残基变为丝氨酸以外的任何残基。如本文所公开的,酶可以包含相对于参考序列的一个或多个残基差异,其中多个残基差异通常由相对于参考序列进行改变的特定位置的列表指示(例如,“与seq id no:1相比在以下残基位置处的一个或多个残基差异:x27、x30、x35、x37、x57、x75、x103、x185、x207、x208、x271、x286或x296”)。
[0148]
特定置换突变,即参考序列中的特定残基被不同的指定残基取代,可以用常规符号“x(数字)x'”表示,其中x是参考序列中残基的单字母标识符,“数字”是参考序列中的残基位置,x'是工程化序列中残基置换的单字母标识符。
[0149]“脂肪族氨基酸或残基”是指具有脂肪族烃侧链的疏水性氨基酸或残基。遗传编码的脂肪族氨基酸包括l-ala(a)、l-val(v)、l-leu(l)和l-ile(i)。
[0150]“芳香族氨基酸或残基”是指具有包含至少一个芳香环或杂芳香环的侧链的亲水或疏水氨基酸或残基。遗传编码的芳香族氨基酸包括l-phe(f)、l-tyr(y)和l-trp(w)。尽管由于其杂芳族氮原子的pka,l-his(h)有时被归类为碱性残基,或由于其侧链包含杂芳环而被归类为芳香族残基,但此处组氨酸被归类为亲水残基或“受限残基(constrained residue)”(见下文)。
[0151]“碱性氨基酸或残基”是指当氨基酸包含在肽或多肽中时,具有显示大于约6的pka值的侧链的亲水性氨基酸或残基。由于与水合氢离子缔合,碱性氨基酸通常在生理ph下具有带正电荷的侧链。遗传编码的碱性氨基酸包括l-arg(r)和l-lys(k)。
[0152]“密码子优化的”是指编码蛋白质的多核苷酸的密码子改变为特定生物体中优先使用的密码子,使得编码的蛋白质在感兴趣的生物体中有效表达。尽管遗传密码是简并的(因为大多数氨基酸由几个密码子表示,称为“同义”或“同义的”密码子),但众所周知,特定生物体的密码子使用是非随机的,并且偏向于特定的密码子三联体。与给定基因、具有共同功能或祖先起源的基因、高表达蛋白质与低拷贝数蛋白质以及生物体基因组的聚合蛋白质编码区相关,这种密码子使用偏向可能更高。在一些实施方式中,可以对编码pglb寡糖基转移酶的多核苷酸进行密码子优化,以便从选择用于表达的宿主生物体中进行最佳生产。
[0153]“比较窗口”是指至少约20个连续核苷酸位置或氨基酸残基的概念片段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中比较窗口中的序列部分与参考序列(其不包含添加或缺失)相比,可以包含20%或更少的添加或缺失(即,空位)用于两个序列的最佳比对。比较窗口可以长于20个连续残基,并且任选地包括30、40、50、100或更长的窗口。
[0154]“保守”氨基酸置换或突变是指具有相似侧链的残基的互换性,和因此通常涉及用相同或相似定义的氨基酸类别内的氨基酸置换多肽中的氨基酸。然而,如本文所用,在一些实施方式中,保守突变不包含从亲水性到亲水性、疏水性到疏水性、含羟基到含羟基或者小到小的残基的置换,如果保守突变可以替代地是来自脂肪族到脂肪族、非极性到非极性、极性到极性、酸性到酸性、碱性到碱性、芳香族到芳香族或者受限的至受限残基的置换。此外,如本文所用,a、v、l或i可以保守突变为另一个脂肪族残基或另一个非极性残基。下面的表2显示了示例性的保守置换。
[0155]
表2
[0156][0157]“受限的氨基酸或残基”是指具有受限的几何形状的氨基酸或残基。在此,受限残基包含l-pro(p)和l-his(h)。组氨酸具有受限的几何形状,因为它具有相对较小的咪唑环。脯氨酸有受限的几何形状,因为它也有五元环。
[0158]“控制序列”在本文中定义为包含对于本公开的多核苷酸和/或多肽的表达而言必需或有利的所有组分。每一个控制序列对于目的多核苷酸可以是天然的或外来的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。
[0159]
当在给定氨基酸或多核苷酸序列编号的上下文中使用时,“对应于”、“参考”或“相对于”是指当给定氨基酸或多核苷酸序列与参考序列进行比较时,特定参考序列的残基的编号。换言之,给定聚合物的残基编号或残基位置是相对于参考序列指定的,而不是通过残基在非参考序列的给定氨基酸或多核苷酸序列内的实际数字位置来指定。例如,给定的氨基酸序列,例如工程化的pglb寡糖基转移酶的氨基酸序列,可以通过引入空位以优化两个序列之间的残基匹配来与参考序列进行比对。在这些情况下,尽管存在空位,但给定氨基酸或多核苷酸序列中残基的编号是相对于它已与之比对的参考序列进行的。
[0160]“半胱氨酸”或l-cys(c)的不寻常之处在于它可以与其他l-cys(c)氨基酸或其他含硫烷基或巯基的氨基酸形成二硫键。“半胱氨酸样残基”包括半胱氨酸和其他含有可用于
形成二硫键的巯基部分的氨基酸。l-cys(c)(和其他具有含-sh侧链的氨基酸)以还原的游离-sh或氧化的二硫键桥接形式存在于肽中的能力影响l-cys(c)是否有助于肽的净疏水或亲水特性。虽然根据eisenberg的归一化共有尺度(eisenberg等,1984,同上)l-cys(c)显示出0.29的疏水性,但应理解,为了本公开的目的,l-cys(c)被分类到其自己独特的组。
[0161]“删除”是指通过从参考多肽去除一个或多个氨基酸来修饰多肽。删除可以包含去除1个或多个氨基酸、2个或更多的氨基酸、5个或更多的氨基酸、10个或更多的氨基酸、15个或更多的氨基酸或者20个或更多的氨基酸,构成多肽的氨基酸总数的最多10%,氨基酸总数的最多20%,或氨基酸总数的最多30%,同时保留酶活性和/或保留工程化的pglb寡糖基转移酶的改进性质。删除可针对多肽的内部部分和/或末端部分。在各种实施方式中,删除可以包含连续节段或可以是不连续的。
[0162]
如本文在工程化酶的上下文中使用的“衍生自”确定工程化所基于的起源酶和/或编码这种酶的基因。例如,通过突变seq id no:2的pglb寡糖基转移酶获得seq id no:4的工程化的寡糖基转移酶。因此,seq id no:4的这种工程化的pglb寡糖基转移酶“衍生自”seq id no:2的多肽。
[0163]
如本文所用,“工程化的pglb寡糖基转移酶”是指已经被系统地修饰的pglb寡糖基转移酶型蛋白质,其中通过在其参考序列中插入新氨基酸、删除其参考序列中存在的氨基酸或将其参考序列中的氨基酸突变为替代氨基酸,或者通过随机诱变随后选择具有特定特性的突变体的过程或通过有意将特定氨基酸变化引入蛋白质序列中。
[0164]
如本文所用,“片段”是指具有氨基末端和/或羧基末端缺失但其中剩余氨基酸序列与序列中的相应位置相同的多肽。片段可以是至少14个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长,以及高达70%、80%、90%、95%、98%和99%或更多的全长pglb寡糖基转移酶多肽,例如seq id no:4的多肽。
[0165]
可互换使用的“功能片段”或“生物活性片段”在本文中是指具有氨基末端和/或羧基末端缺失和/或内部缺失,但是其中剩余的氨基酸序列与其所比较的序列中的相应位置相同并且基本上保留了全长多肽的所有活性的多肽。功能片段包含至少100、200、300、400或500个连续氨基酸。
[0166]“异源”多核苷酸是指通过实验室技术引入宿主细胞中的任何多核苷酸,并包括从宿主细胞中取出、进行实验室操作和然后再引入宿主细胞中的多核苷酸。
[0167]“杂交严格性”涉及核酸杂交中的杂交条件,例如洗涤条件。通常,在较低严格性的条件下进行杂交反应,然后进行不同但较高严格性的洗涤。术语“中等严格杂交”是指允许靶-dna结合互补核酸的条件,该互补核酸与靶dna具有约60%同一性,优选约75%同一性,约85%同一性,或具有与靶多核苷酸大于约90%的同一性。示例性的中等严格条件是相当于在42℃下,在50%甲酰胺、5x denhart溶液、5x盐水-磷酸钠-edta(sspe)、0.2%十二烷基硫酸钠(sds)中杂交,然后在42℃下的0.2
×
sspe、0.2%sds中洗涤的条件。“高严格性杂交”通常是指与在用于确定的多核苷酸序列的溶液条件下测定的热解链温度tm相差约10℃或更少的条件。在一些实施方式中,高严格性条件是指仅允许在65℃下在0.018m nacl中形成稳定杂交体的那些核酸序列杂交的条件(即,如果杂交体在65℃下0.018m的nacl中不稳定,那么它在高严格性条件下也不稳定,如本文所设想的)。可以提供高严格性条件,例如,通过在相当于在42℃下50%甲酰胺、5x denhart溶液、5x sspe、0.2%sds的条件下杂交,然后在
65℃下的0.1x sspe和0.1%sds中洗涤的条件下杂交。另一种高严格性条件是在相当于在65℃下在含有0.1%(w:v)sds的5x ssc中杂交并在65℃下在含有0.1%sds的0.1x ssc中洗涤的条件下进行杂交。其他高严格性杂交条件,以及中等严格条件,如在上面引用的参考文献中描述。
[0168]“亲水性氨基酸或残基”是指具有表现出根据eisenberg等,1984,j.mol.biol.179:125-142的标准化共有疏水性尺度小于零的疏水度的侧链的氨基酸或残基。遗传编码的亲水性氨基酸包括l-thr(t)、l-ser(s)、l-his(h)、l-glu(e)、l-asn(n)、l-gln(q)、l-asp(d)、l-lys(k)和l-arg(r)。“疏水性氨基酸或残基”是指具有表现出根据eisenberg等,1984,j.mol.biol.179:125-142的标准化共有疏水性尺度大于零的疏水度的侧链的氨基酸或残基。在遗传上,编码的疏水性氨基酸包括l-pro(p)、l-ile(i)、l-phe(f)、l-val(v)、l-leu(l)、l-trp(w)、l-met(m)、l-ala(a)和l-tyr(y)。
[0169]“含羟基的氨基酸或残基”是指含有羟基(-oh)部分的氨基酸。遗传编码的含羟基氨基酸包括l-ser(s)、l-thr(t)和l-tyr(y)。
[0170]“改进的酶特性”是指与在参考酶中发现的特性相比,对于特定目的变得更好或更理想的任何酶特性。对于本文所述的工程化的pglb寡糖基转移酶多肽,通常与不包含提高酶效率的特定突变的参考pglb寡糖基转移酶进行比较,尽管在一些实施方式中,参考pglb寡糖基转移酶可以是另一种改进的工程化的pglb寡糖基转移酶。可以进行改进的酶特性包括但不限于酶活性(其可以用n-糖基化蛋白的产率表示)、热稳定性、溶剂稳定性、ph活性曲线、辅酶要求、对抑制剂(例如,产物抑制)的耐受性、立体定向性和酸副产物产生的抑制。
[0171]“插入”是指通过向参考多肽添加一个或多个氨基酸来修饰多肽。在一些实施方式中,改进的工程化的pglb寡糖基转移酶包含向天然存在的pglb寡糖基转移酶多肽插入一个或多个氨基酸以及向其他改进的pglb寡糖基转移酶多肽插入一个或多个氨基酸。插入可以在多肽的内部或者在羧基或氨基末端。如本文所用的插入包括本领域已知的融合蛋白。插入可以是天然存在的多肽中连续的氨基酸节段或被一个或多个氨基酸分隔。
[0172]“分离的多肽”是指基本上与天然伴随的其他污染物(例如,蛋白质、脂质和多核苷酸)分离的多肽。该术语包含已从其天然存在的环境或表达系统(例如,宿主细胞或体外合成)去除或纯化的多肽。改进的pglb寡糖基转移酶可以存在于细胞内,存在于细胞介质中,或以各种形式制备,例如,裂解物或分离的制剂。因此,在一些实施方式中,改进的pglb寡糖基转移酶可以是分离的多肽。
[0173]“非保守置换”是指用具有显著不同侧链性质的氨基酸置换或突变多肽中的氨基酸。非保守置换可以使用在上面列出的定义组之间而不是在组中的氨基酸。在一个实施方式中,非保守突变影响:(a)置换区域中肽骨架的结构(例如,脯氨酸替代甘氨酸);(b)电荷或疏水性;或(c)侧链的体积。
[0174]“非极性氨基酸”或“非极性残基”是指侧链在生理ph下不带电,并且具有其中两个原子共有的电子对通常为由两个原子中的每一个相等地保持的键(即,侧链不是极性的)的疏水性氨基酸或残基。遗传编码的非极性氨基酸包括l-gly(g)、l-leu(l)、l-val(v)、l-ile(i)、l-met(m)和l-ala(a)。
[0175]“序列同一性百分比”、“百分同一性”和“同一性百分比”在本文中用于指多核苷酸序列或多肽序列之间的比较,并且通过在比较窗口内比较两个最佳比对的序列来确定,其
中与参考序列相比,比较窗口中的多核苷酸或多肽序列部分可以包含添加或缺失(即,空位)以实现两个序列的最佳比对。计算百分比是通过测定在两个序列中出现的相同核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位比对的位置的数量以产生匹配位置的数量,将匹配位置的数量除以比较窗口中的位置总数和将结果乘以100,以产生序列同一性的百分比。使用blast和blast 2.0算法(参见例如,1990,j.mol.biol.215:403-410和altschul等,1977,nucleic acids res.3389-3402)执行最佳比对和百分比序列同一性的测定。用于执行blast分析的软件可通过国家生物技术信息中心(national center for biotechnology information)网站公开获得。
[0176]
简而言之,blast分析首先涉及通过识别查询序列中长度w的短字来识别高评分序列对(hsp),当与数据库序列中相同长度的字比对时,其匹配或满足某个正值阈值分数t。t称为邻域字评分阈值(altschul等,同上)。这些初始邻域字命中充当启动搜索以查找包含它们的较长hsp的种子。然后沿着每一个序列的两个方向扩展字命中,直到可以增加累积比对评分。对于核苷酸序列,使用参数m(一对匹配残基的奖励分数;总是》0)和n(错配残基的惩罚分数;总是《0)计算累积评分。对于氨基酸序列,评分矩阵用于计算累积评分。在以下情况下,字命中在每一个方向上的扩展将停止:累积比对评分从其最大获得值下降了x量;由于一个或多个负分数残基比对的累积,累积评分变为零或更低;或到达任一序列的末端。blast算法参数w、t和x确定比对的灵敏度和速度。blastn程序(用于核苷酸序列)默认使用11的字长(w)、10的期望值(e)、m=5、n=-4,以及两条链的比较。对于氨基酸序列,blastp程序默认使用3的字长(w)、10的期望值(e)和blosum62评分矩阵(见henikoff和henikoff,1989,proc natl acad sci usa 89:10915)。
[0177]
在为两个序列提供百分比同一性方面,许多可用的其他算法的功能类似于blast。可以进行用于比较的序列的最佳比对,例如,通过smith和waterman,1981,adv.appl.math.2:482的局部同源性算法,通过needleman和wunsch,1970,j.mol.biol.48:443的同源性比对算法,通过pearson和lipman,1988,proc.natl.acad.sci.usa85:2444的相似性搜索方法,通过这些算法的计算机化实现(gcg wisconsin软件包中的gap、bestfit、fasta和tfasta),或通过目视检查(一般参见,current protocols in molecular biology,f.m.ausubel,等,编辑,current protocols,a joint venture between greene publishing associates,inc.和john wiley&sons,inc.,(1995年增补)(ausubel))。此外,序列比对和百分比序列同一性的确定可以使用gcg wisconsin软件包(accelrys,madison wi)中的bestfit或gap程序,使用提供的默认参数。clustalw程序也适用于确定同一性。
[0178]“极性氨基酸或残基”是指其侧链在生理ph下不带电荷的亲水性氨基酸或残基,但其具有至少一个其中两个原子共有的电子对更紧密地由原子之一保持的键。遗传编码的极性氨基酸包括l-asn(n)、l-gln(q)、l-ser(s)和l-thr(t)。
[0179]“优选的、最佳的、高密码子使用偏向密码子”可互换地指在蛋白质编码区中使用频率高于编码相同氨基酸的其他密码子的密码子。可以根据单个基因、一组具有共同功能或起源的基因、高表达的基因中的密码子使用、整个生物体的集合蛋白质编码区中的密码子频率、相关生物体的集合蛋白质编码区的密码子频率或其组合来确定优选的密码子。其频率随基因表达水平增加的密码子通常是用于表达的最佳密码子。已知有多种方法用于确定特定生物体中的密码子频率(例如,密码子使用、相对同义密码子使用)和密码子偏好,包
括多变量分析,例如,使用聚类分析或对应性分析,以及在基因中使用的密码子的有效数量(参见,gcg codonpreference,genetics computer group wisconsin package;codonw,john peden,university of nottingham;mcinerney,j.o,1998,bioinformatics 14:372-73;stenico,等,1994,nucleic acids res.222437-46;wright,f.,1990,gene 87:23-29)。密码子使用表对于越来越多的生物体列表是可得的(参见例如,wada等,1992,nucleic acids res.20:2111-2118;nakamura,等,2000,nucl.acids res.28:292;duret等,同上;henaut和danchin,“escherichia coli and salmonella,”1996,neidhardt,等,编辑,asm press,washington d.c.,2047-2066页)。用于获得密码子使用的数据源可依赖于任何能够编码蛋白质的可用核苷酸序列。这些数据集包括实际上已知编码表达的蛋白质的核酸序列(例如,完整的蛋白质编码序列-cds)、表达的序列标签(est)或基因组序列预测编码区域(参见例如,mount,d.,bioinformatics:sequence and genome analysis,chapter 8,cold spring harbor laboratory press,cold spring harbor,n.y.,2001;uberbacher,e.c.,1996,methods enzymol.266:259-281;tiwari等,1997,comput.appl.biosci.13:263-270)。
[0180]“蛋白质”、“多肽”和“肽”在本文中可互换使用以表示通过酰胺键共价连接的至少两个氨基酸的聚合物,无论长度或翻译后修饰(例如,糖基化、磷酸化、脂化、内豆蔻酰化(myristilation)、泛素化等)。该定义包括d-和l-氨基酸,以及d-和l-氨基酸的混合物。
[0181]“参考序列”是指另一个(例如,改变的)序列与其进行比较的限定序列。参考序列可以是较大序列的子集,例如,全长基因或多肽序列的片段。通常,参考序列是至少20个核苷酸或氨基酸残基的长度、至少25个残基长度、至少50个残基长度或者核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包含在两个序列之间相似的序列(即,完整序列的一部分),和(2)可以进一步包含在两个序列之间相异的序列,通常通过在比较窗口上比较两个多核苷酸的序列以鉴定和比较序列相似性的局部区域来进行两个(或更多个)多核苷酸或多肽之间的序列比较
[0182]
术语“参考序列”不旨在限于野生型序列,并且可以包括工程化的或改变的序列。例如,在一些实施方式中,“参考序列”可以是先前工程化的或改变的氨基酸序列。例如,“基于seq id no:2在x12位具有甘氨酸残基的参考序列”是指对应于seq id no:2在x12处具有甘氨酸残基的参考序列(seq id no:2的未改变版本在x12处有天冬氨酸)。
[0183]“小氨基酸”或“小残基”是指具有由总共三个或更少的碳和/或杂原子(不包括α-碳和氢)组成的侧链的氨基酸或残基。根据上述定义,小氨基酸或残基可进一步分类为脂肪族、非极性、极性或酸性小氨基酸或残基。遗传编码的小氨基酸包括l-ala(a)、l-val(v)、l-cys(c)、l-asn(n)、l-ser(s)、l-thr(t)和l-asp(d)。
[0184]“实质同一性”是指与参考序列相比,在至少20个残基位置的比较窗口上,通常在至少30-50个残基的窗口上具有至少80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或更多的百分比的序列同一性的多核苷酸或多肽序列,其中序列同一性百分比是通过将参考序列与包含缺失或添加的序列进行比较来计算的,其中缺失或添加在比较窗口内总共占参考序列的20%或更少。在应用于多肽的具体实施方式中,术语“基本同一性”是指两个多肽序列,当最佳比对时,例如通过程序gap或bestfit使用默认空位权重,共有至少80%的序列同一性,优选至少89%的序列同一性,至少95%的序列同一性或更多(例
如,99%的序列同一性)。优选地,不相同的残基位置因保守氨基酸置换而不同。
[0185]“基本上纯的多肽”是指其中多肽种类是存在的主要种类的组合物(即,在摩尔或重量基础上,它比组合物中的任何其他单个大分子种类更丰富),并且当目标种类占存在的大分子物质的至少约50%(按摩尔或重量百分比计)时,通常是基本上纯化的组合物。通常,基本上纯的pglb寡糖基转移酶组合物将按摩尔或重量百分比计占组合物中存在的所有大分子物质的约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多、约96%或更多、约97%或更多、约98%或更多或者约99%或更多。在一些实施方式中,目标种类被纯化至基本上同质(即,通过常规检测方法不能在组合物中检测到污染种类),其中组合物基本上由单一大分子种类组成。溶剂种类和元素离子种类不被认为是大分子种类。在一些实施方式中,分离的改进的pglb寡糖基转移酶多肽是基本上纯的多肽组合物。
[0186]
本发明在以下段落中进一步公开:
[0187]
1.一种pglb寡糖基转移酶(ost)多肽或其功能片段,其包含与seq id no:1或2中所示氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列,其中pglb寡糖基转移酶多肽氨基酸序列包含以下的特征:至少一个选自氨基酸x57、x63、x94、x101、x172、x176、x191、x193、x233、x234、x255、x286、x295、x301、x319、x397、x402、x425、x435、x446、x462、x479、x523、x532、x601、x605、x606、x610、x645、x676和x695的残基被置换为与在seq id no:1中该位置处发现的氨基酸不同的氨基酸。
[0188]
2.如段落1所述的pglb寡糖基转移酶多肽或其功能片段,其中该氨基酸序列包含至少一个选自以下组成的列表的特征:
[0189]
x57对应的残基是亲水残基;
[0190]
x63对应的残基选自极性残基和疏水残基;
[0191]
x94对应的残基是极性残基;
[0192]
x101对应的残基选自酸性残基、非极性残基、亲水残基、受限残基和芳香族残基;
[0193]
x172对应的残基是酸性残基;
[0194]
x176对应的残基选自非极性残基和酸性残基;
[0195]
x191对应的残基选自亲水残基和芳香族残基;
[0196]
x193对应的残基选自非极性残基、亲水残基和芳香族残基;
[0197]
x233对应的残基是脂肪族残基:
[0198]
x234对应的残基选自小残基、亲水残基和芳香族残基;
[0199]
x255对应的残基是亲水残基;
[0200]
x286对应的残基选自疏水残基和极性残基;
[0201]
x295对应的残基是酸性的或脂肪族的;
[0202]
x301对应的残基选自受限残基、非极性残基和芳香族残基;
[0203]
x319对应的残基选自亲水残基和脂肪族残基;
[0204]
x397对应的残基选自亲水残基和疏水残基;
[0205]
x402对应的残基是亲水残基;
[0206]
x425对应的残基是极性残基;
[0207]
x435对应的残基选自亲水残基和疏水残基;
[0208]
x446对应的残基是非极性残基;
[0209]
x462对应的残基选自芳香族残基、受限残基和小残基;
[0210]
x479对应的残基是疏水残基;
[0211]
x523对应的残基是碱性残基;
[0212]
x532对应的残基是亲水残基;
[0213]
x601对应的残基是疏水残基;
[0214]
x605对应的残基是酸性残基;
[0215]
x606对应的残基是受限残基;
[0216]
x610对应的残基选自亲水残基和疏水残基;
[0217]
x645对应的残基选自脂肪族残基和亲水性残基;
[0218]
x676对应的残基选自芳香族残基、亲水残基和非极性残基;
[0219]
x695对应的残基选自极性残基和脂肪族残基。
[0220]
3.如段落1或2的pglb寡糖基转移酶多肽或其功能片段,其中氨基酸序列包含至少一个选自于下列的特征:残基x57选自t和r;残基x63选自l和q;残基x94是n;残基x101选自w、e、h、p、r、m和g;残基x172是e;残基x176选自e和g;残基x191选自h、d、r和y;残基x193选自t、h、g和f;x233是v;残基x234选自h、c和w;残基x255是h;残基x286选自a、q和l;残基x295是e或l;残基x301选自p、g和f;残基x319选自a、q、l和t;残基x397选自n、l和q;残基x402选自r和h;残基x425是s;残基x435选自a、l、f、h和r;残基x446是g;残基x462选自p、c、w、t和n;残基x479是m;残基x523是r;残基x532是h;残基x601是g;残基x605是d;残基x606是p;残基x610选自p、l、r、d和a;残基x645选自l、s和h;残基x676选自q、w和g;和残基x695选自i和q。
[0221]
4.如段落1-3中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中所述氨基酸序列包含至少一个选自由以下组成的列表的特征:对应于seq id no:1的氨基酸57的残基突变为r;对应于seq id no:1的氨基酸101的残基突变为m;对应于seq id no:1的氨基酸191的残基突变为h、d、r或y(优选为y);对应于seq id no:1的氨基酸462的残基突变为p或w;对应于seq id no:1的氨基酸479的残基突变为m,和对应于seq id no:1的氨基酸676的残基突变为w。
[0222]
5.如段落1-4中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸57的残基被突变为r或k或t,优选地为r或t,更优选地为r。
[0223]
6.如段落5的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸57的残基突变为r。
[0224]
7.如段落1-6中任一项所述的pglb寡糖基转移酶多肽及其功能片段,其中所述pglb寡糖基转移酶多肽氨基酸序列包含以下特征:至少一个选自氨基酸x78、x84、a155、x293、x300、x301、x306、x308、x462、x464、x479、x523和x570的残基被置换为与在seq id no:1中该位置处发现的氨基酸不同的氨基酸。
[0225]
8.如段落7的pglb ost多肽及其功能片段,其中所述氨基酸序列包含至少一个选自于以下的特征:
[0226]
对应于x78的残基是含羟基的残基;
[0227]
对应于x84的残基是芳香族残基;
[0228]
对应于x155的残基是极性残基;
[0229]
对应于x293的残基是小残基;
[0230]
对应于x300的残基是脂肪族残基;
[0231]
对应于x301的残基选自受限残基和非极性残基;
[0232]
对应于x306的残基是亲水残基;
[0233]
对应于x308的残基是芳香族残基;
[0234]
对应于x462的残基选自芳香族残基和极性残基;
[0235]
对应于x464的残基是脂肪族残基;
[0236]
对应于x479的残基是疏水残基;
[0237]
对应于x523的残基是碱性残基;和
[0238]
对应于x570的残基选自碱性残基和脂肪族残基。
[0239]
9.如段落7-8中任一项所述的pglb ost多肽及其功能片段,其中所述氨基酸序列包含至少一个选自下列的特征:x78突变为t;x84突变为w;x155突变为q;x293突变为c;x300突变为l;x301突变为p或g;x306突变为h;x308突变为w;x462突变为w、n或t;x464突变为l;x479突变为m;x523突变为r;x570突变为r或v。
[0240]
10.如段落7-9中任一项所述的pglb ost,其中所述氨基酸序列包含至少一个选自于下列的特征:氨基酸x300突变为l;氨基酸x301突变为p,氨基酸x308突变为w,氨基酸x462突变为w,氨基酸x479突变为m,和氨基酸x570突变为r。
[0241]
11.如段落7-10中任一项所述的pglb ost,其中所述氨基酸序列包含至少一个选自于下列的特征:对应于seq id no:1的氨基酸x301的残基突变为p;对应于seq id no:1的氨基酸x462的残基突变为n或w,和对应于seq id no:1的氨基酸x479的残基突变为m。
[0242]
12.如段落7-11中任一项所述的pglb ost,其中所述氨基酸序列含有对应于seq id no:1的氨基酸x479的残基处至m的突变。
[0243]
13.如段落7-12中任一项所述的pglb,其中所述氨基酸序列在对应于seq id no:1的氨基酸x462的残基处含有突变。
[0244]
14.如段落7-13中任一项所述的pglb,其中所述氨基酸序列含有在对应于seq id no:1的氨基酸x462的残基处至w的突变和在对应于seq id no:1的氨基酸x479的残基处至m的突变。
[0245]
15.如段落7-14中任一项所述的pglb ost,其含有下列特征中的至少2、3、4、5或6个:对应于seq id no:1的x300的氨基酸突变为l;对应于seq id no:1的x301的氨基酸突变为p,对应于seq id no:1的x308的氨基酸突变为w,对应于seq id no:1的x462的氨基酸突变为w,对应于seq id no:1的x479的氨基酸突变为m,和对应于seq id no:1的x570的氨基酸突变为r。
[0246]
16.如段落15的pglb ost,其中氨基酸x300突变为l;氨基酸x301突变为p,氨基酸x308突变为w,氨基酸x462突变为w,氨基酸x479突变为m,和氨基酸x570突变为r。
[0247]
17.如段落1-16中任一项所述的pglb ost,其中所述氨基酸序列与seq id no:1所示氨基酸序列相比,在选自于下列的至少一个残基位置包含至少一个残基差异:氨基酸x12、x51、x104、x130、x176、x177、x186、x191、x218、x234、x286、x295、x306、x308、x319、x382、x482和x523。
[0248]
18.如段落17的pglb ost,其中所述氨基酸序列包含至少一个选自于下列的特征:
[0249]
对应于氨基酸x12的残基是含羟基的残基;
[0250]
对应于氨基酸x51的残基是脂肪族残基;
[0251]
对应于氨基酸x104的残基是脂肪族残基;
[0252]
对应于氨基酸x130的残基是脂肪族残基;
[0253]
对应于氨基酸x176的残基是酸性残基;
[0254]
对应于氨基酸x177的残基是脂肪族残基;
[0255]
对应于氨基酸x186的残基是脂肪族残基;
[0256]
对应于氨基酸x191的残基是芳香族残基;
[0257]
对应于氨基酸x218的残基是小残基;
[0258]
对应于氨基酸x234的残基选自芳香族残基和小残基;
[0259]
对应于氨基酸x286的残基选自极性残基和脂肪族残基;
[0260]
对应于氨基酸x295的残基是脂肪族残基;
[0261]
对应于氨基酸x306的残基是亲水性残基;
[0262]
对应于氨基酸x308的残基是芳香族残基;
[0263]
对应于氨基酸x319的残基选自脂肪族残基和极性残基;
[0264]
对应于氨基酸x382的残基是小残基;
[0265]
对应于氨基酸x482的残基是碱性残基;
[0266]
对应于氨基酸x523的残基是碱性残基。
[0267]
19.如段落17或18的pglb ost或其功能片段,其中氨基酸序列包含至少一个选自于下列的特征:残基x12是s;残基x51是l;残基x104是l;残基x130是l;残基x176是e;残基x177是v;残基x186是l;残基x191是y;残基x218是a;残基x234选自c和w;残基x286选自q和l;残基x295是l或e;残基x306是h;残基x308是f;残基x319选自l和q;残基x382是s;残基x482是r;和残基x523是r。
[0268]
20.如段落17-19中任一项所述的pglb ost或其功能片段,其中所述氨基酸序列包含至少一个选自于下列的特征:对应于seq id no:1的氨基酸x218的残基是a和对应于seq id no:1的氨基酸x382的残基是s。
[0269]
21.如段落17-20中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中所述氨基酸序列包含以下特征:氨基酸x191是y;氨基酸x286是q;氨基酸x295是l或e;氨基酸x382是s;氨基酸x482是r;氨基酸x523是r。
[0270]
22.如段落1-21中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中所述氨基酸序列与seq id no:1所示氨基酸序列相比在选自于下列的至少一个残基位置包含残基差异:氨基酸x21、氨基酸x27、氨基酸x42、氨基酸x44、氨基酸x53、氨基酸x80、氨基酸x97、氨基酸x297、氨基酸x317、氨基酸x341、氨基酸x383、氨基酸x388、氨基酸x410、氨基酸x421、氨基酸x480和氨基酸x486。
[0271]
23.如段落22的pglb寡糖基转移酶多肽或其功能片段,其中所述氨基酸序列包含至少一个选自于以下的特征:
[0272]
对应于氨基酸x21的残基选自含羟基残基和脂肪族残基;
[0273]
对应于氨基酸x27的残基选自含羟基残基和疏水残基;
[0274]
对应于氨基酸x42的残基选自芳香族残基和小残基;
[0275]
对应于氨基酸x44的残基选自疏水残基和亲水残基;
[0276]
对应于氨基酸x52的残基选自亲水残基和脂肪族残基;
[0277]
对应于氨基酸x80的残基是小残基;
[0278]
对应于氨基酸x97的残基是脂肪族残基;
[0279]
对应于氨基酸x297的残基选自碱性残基和含羟基残基;
[0280]
对应于氨基酸x317的残基是小残基;
[0281]
对应于氨基酸x341的残基是脂肪族残基;
[0282]
对应于氨基酸x421的残基是非极性残基;
[0283]
对应于氨基酸x480的残基选自亲水残基和疏水残基;和
[0284]
对应于氨基酸x486的残基是小残基、亲水残基和脂肪族残基。
[0285]
24.如段落22或23所述的pglb寡糖基转移酶多肽或其功能片段,其中该氨基酸序列包含至少一个选自于下列的特征:氨基酸x21选自s和l;氨基酸x27选自m、s、a和w;氨基酸x42选自w和c;氨基酸x44选自m和h;氨基酸x53选自s、i和h;氨基酸x80选自a和d;氨基酸x97是i;氨基酸x297选自k、r、s和y;氨基酸x317选自s和a;氨基酸x341是l;氨基酸x383是m;氨基酸x388选自m和i;氨基酸x410是i;氨基酸x421是g;氨基酸x480选自w、n、q、i、t和m;和氨基酸x486选自c、n、l、h和v。
[0286]
25.如段落22-24中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中所述氨基酸序列包含以下特征:x297是r。
[0287]
26.如段落1-25中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中所述氨基酸序列在对应于seq id no:1的氨基酸x300、x301、x308、x462、x479或x570的残基处含有至少一个进一步的点突变。
[0288]
27.如段26的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x462的残基从y突变为w。
[0289]
28.如段落26-27的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x479的残基从h突变为m。
[0290]
29.如段落26-28中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x300的残基从n突变为l。
[0291]
30.如段落26-29中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x301的残基从l突变为p。
[0292]
31.如段落26-30中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x308的残基从f突变为w。
[0293]
32.如段落26-31中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x570的残基从l突变为r。
[0294]
33.如段落26-32中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x191的残基从l突变为y。
[0295]
34.如段落26-33中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x286的残基从y突变为q。
[0296]
35.如段落26-34中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x295的残基从s突变为l或e。
[0297]
36.如段落26-35中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应
于seq id no:1的氨基酸x382的残基从a突变为s。
[0298]
37.如段落26-36中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x482的残基从k突变为r。
[0299]
38.如段落26-37中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x523的残基从t突变为r。
[0300]
39.如段落26-38中任一项所述的pglb寡糖基转移酶或其功能片段,其中对应于seq id no:1的氨基酸x297的残基从e突变为r。
[0301]
40.如段落26-39中任一项所述的pglb寡糖基转移酶或其功能片段,其中对应于seq id no:1的氨基酸x80的残基从s突变为d。
[0302]
41.如段落26-40中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x187的残基从i突变为v。
[0303]
42.如段落26-41中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x359的残基从i突变为q。
[0304]
43.如段落26-42中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x406的残基从n突变为i。
[0305]
44.如段落1-43中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x77的残基是r并且对应于seq id no:1的氨基酸x311的残基是v。
[0306]
45.如段落1的pglb寡糖基转移酶多肽或其功能片段,其具有如seq id no:2、3、4、5、6、7或8中任一项所示的氨基酸序列。
[0307]
46.如段落1-44中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x57、x462和x479的残基用与在seq id no:1中该位置处发现的氨基酸不同的氨基酸置换;任选地置换为a57r、y462w和h479m。
[0308]
47.如段落1-46中任一项所述的pglb寡糖基转移酶多肽或其功能片段,其中对应于seq id no:1的氨基酸x57、x300、x301、x308、x462、x479和x570的残基用与在seq id no:1中该位置处发现的氨基酸不同的氨基酸置换;任选地置换为a57r、n300l、l301p、f308w、y462w、h479m和l570r。
[0309]
48.如段落1-47中任一项所述的pglb寡糖基转移酶多肽,其中该pglb寡糖基转移酶多肽是全长的,任选地具有712、713或714个氨基酸的长度。
[0310]
49.如段落1-48中任一项所述的pglb寡糖基转移酶多肽,其中所述pglb寡糖基转移酶来自空肠弯曲杆菌。
[0311]
50.如段落1-48中任一项所述的pglb寡糖基转移酶多肽,其中所述pglb寡糖基转移酶来自红嘴鸥弯曲杆菌。
[0312]
51.如段落1-48中任一项所述的pglb寡糖基转移酶多肽,其中所述pglb寡糖基转移酶来自大肠弯曲杆菌。
[0313]
52.如段落1-49中任一项所述的pglb寡糖基转移酶多肽组合物,其中pglb寡糖基转移酶是工程化的。
[0314]
53来自大肠弯曲杆菌的pglb(pglb
c.coli
),其中对应于seq id no:12的氨基酸x57的残基用与在seq id no:12中该位置处发现的氨基酸不同的氨基酸置换;任选地置换为a57r。
[0315]
54.如段落53的来自大肠弯曲杆菌的pglb(pglb
c.coli
),其中对应于seq id no:12的氨基酸x463的残基用与在seq id no:12中的该位置处发现的氨基酸不同的氨基酸置换;任选地置换为y463w。
[0316]
55.如段落53或54的来自大肠弯曲杆菌的pglb(pglb
c.coli
),其中对应于seq id no:12的氨基酸x480的残基用与在seq id no:12中的该位置处发现的氨基酸不同的氨基酸置换;任选地置换为h480m。
[0317]
56.如段落53-55中任一项所述的来自大肠弯曲杆菌的pglb(pglb
c.coli
),其中对应于seq id no:12的氨基酸x311的残基用与在seq id no:12中的该位置处发现的氨基酸不同的氨基酸置换;任选地置换为n311v。
[0318]
57.如段落53-56中任一项所述的来自大肠弯曲杆菌的pblb(pglb
c.coli
),其中对应于seq id no:12的氨基酸x77的残基用与在seq id no:12中的该位置处发现的氨基酸不同的氨基酸置换;任选地置换为y77r。
[0319]
58.编码如前述段落的任一项中存在的突变的pglb寡糖基转移酶多肽的多核苷酸。
[0320]
59.一种组合物或宿主细胞(例如,原核宿主细胞或大肠杆菌宿主细胞),其包含至少一种段落1-57中任一项所述的pglb寡糖基转移酶或段落58的多核苷酸。
[0321]
60.如段落59的组合物或宿主细胞,其中该至少一种pglb寡糖基转移酶是工程化的。
[0322]
61.一种包含多核苷酸的宿主细胞,其中所述多核苷酸编码段落58的突变的pglb寡糖基转移酶或具有与seq id no:12、13或14至少85%、90%、95%、97%、98%、99%或100%相同的氨基酸序列的来自大肠弯曲杆菌的pglb。
[0323]
62.如段落61的宿主细胞,其是原核宿主细胞,任选地是大肠杆菌宿主细胞。
[0324]
63.如段落61或62的宿主细胞,其中编码pglb的多核苷酸被整合到宿主细胞基因组中或由质粒表达。
[0325]
64.如段落61、62或63所述的宿主细胞,其包含编码含有至少一个糖基化位点的蛋白质的另外的多核苷酸,所述糖基化位点包含氨基酸序列asp/glu-z
1-asn-z
2-ser/thr,其中z1和z2可以是除pro外的任意天然氨基酸。
[0326]
65.如段落61-64中任一项所述的宿主细胞,其中含有至少一个糖基化位点的蛋白质选自铜绿假单胞菌的外毒素a(epa)、crm197、白喉类毒素、破伤风类毒素、金黄色葡萄球菌的脱毒溶血素a、凝集因子a、凝集因子b、大肠杆菌fimh、大肠杆菌fimhc、大肠杆菌热不稳定肠毒素、大肠杆菌热不稳定肠毒素的脱毒变体、霍乱毒素b亚基(ctb)、霍乱毒素、霍乱毒素的脱毒变体、大肠杆菌sat蛋白、大肠杆菌sat蛋白的乘客结构域、空肠弯曲杆菌acra和空肠弯曲杆菌天然糖蛋白。
[0327]
66.如段落65的宿主细胞,其中含有至少一个糖基化位点的蛋白质是铜绿假单胞菌的外蛋白a(epa)。
[0328]
67.如段落61-66中任一项所述的宿主细胞,其中含有至少一个糖基化位点的蛋白质含有2、3或4个糖基化位点。
[0329]
68.如段落61-67中任一项所述的宿主细胞,其包含至少一种编码糖基转移酶的多核苷酸,该糖基转移酶是将特定寡糖组装在十一民戊烯基(undecaprenyl)脂质载体上所必
需的。
[0330]
69.如段落61-68中任一项所述的宿主细胞,其中特定的寡糖是抗原,例如,细菌o抗原或细菌荚膜糖抗原。
[0331]
70.如段落69所述的宿主细胞,其中特定的寡糖包含大肠杆菌o-抗原、沙门氏菌o-抗原、假单胞菌o-抗原、克雷伯氏菌o-抗原、不动杆菌o抗原、沙眼衣原体抗原、霍乱弧菌抗原、李斯特菌抗原、嗜肺军团菌血清型1至15抗原、副百日咳博德特氏菌抗原、鼻疽或类鼻疽伯克霍尔德氏菌抗原、土拉弗朗西斯菌抗原、弯曲杆菌抗原;艰难梭菌抗原、无乳链球菌抗原、脑膜炎奈瑟菌抗原、白色念珠菌抗原、流感嗜血杆菌抗原、粪肠球菌抗原、伯氏疏螺旋体抗原、金黄色葡萄球菌荚膜糖抗原、流感嗜血杆菌抗原、硕大利什曼原虫抗原、志贺氏菌或肺炎链球菌荚膜糖抗原(例如,血清型cp1、cp2、cp3、cp4、cp5、cp6(a和b)、cp7(a、b、c)、cp8、cp9(a、l、n、v)、cp10(a、b、c、f)、cp11(a、b、c、d、f)、cp12(a、b、f)、cp13、cp14、cp15(a、b、c、f)、cp16(a、f)、cp17(a、f)、cp18(a、b、c、f)、cp19(a、b、c、f)、cp20、cp21、cp22(a、f)、cp23(a、b、f)、cp24(a、b、f)、cp25(a、f)、cp26、cp27、cp28(a、f)、cp29、cp31、cp32(a、f)、cp33(a、b、c、d、f)、cps34、cp35(a、b、c、d、f)、cp36、cp37、cp38、cp39、cp40、cp41(a、f)、cp42、cp43、cp44、cp45、cp46、cp47(a、f)、cps48)。
[0332]
71.如段落61-70中任一项所述的宿主细胞,其中所述特定寡糖在所述寡糖的还原末端包含不是glcnac的残基。
[0333]
72.如段落61-71中任一项所述的宿主细胞,其中所述特定寡糖在还原末端包含葡萄糖残基。
[0334]
73.一种用于制备糖基化蛋白的方法,包含以下步骤:
[0335]
(a)在适合生产蛋白质的条件下培养段落61-72中任一项所述的宿主细胞;和
[0336]
(b)从宿主细胞中分离糖基化蛋白。
[0337]
74.一种用于制备糖基化蛋白的体外方法,包括以下步骤:
[0338]
i)将下列混合在一起:
[0339]
a)如段落1-57中任一项所述的pglb寡糖基转移酶;
[0340]
b)包含至少一个糖基化共有序列的蛋白质,其中所述糖基化共有序列包含氨基酸序列asp/glu-z
1-asn-z
2-ser/thr,其中z1和z2可以是除pro之外的任何天然氨基酸;和
[0341]
c)被pglb识别的脂质载体上的糖链;
[0342]
ii)在适合pglb的酶促活性的条件下孵育以将糖链转移至蛋白质的至少一个糖基化共有序列,从而获得糖基化蛋白;和
[0343]
iii)分离糖基化蛋白。
[0344]
75.通过段落73或74的方法制备的糖基化蛋白。
[0345]
76.如段落1-57中任一项所述的pglb寡糖基转移酶或其功能片段在生产糖基化蛋白中的用途,其中糖连接至糖基化共有序列的n残基,所述糖基化共有序列包含氨基酸序列asp/glu-z
1-asn-z
2-ser/thr,其中z1和z2可以是蛋白质的除pro之外的任何天然氨基酸。
[0346]
77.如段落76的用途,其中与糖基化序列的n残基共价连接的糖的糖残基不是n-乙酰基糖,例如n-乙酰基葡糖胺。
[0347]
78.如段落76或77的pglb寡糖基转移酶的用途,其中糖中的葡萄糖残基与糖基化序列的n残基共价连接。
[0348]
79.如段落76-78中任一项所述的用途,其中所述糖是细菌抗原,任选地细菌荚膜多糖抗原或细菌o-抗原。
[0349]
80.如段落76-79中任一项所述的用途,其中所述糖是革兰氏阳性细菌荚膜多糖抗原。
[0350]
81.如段落76-80中任一项所述的用途,其中所述糖是大肠杆菌o抗原、沙门氏菌抗原、假单胞菌抗原、克雷伯氏菌抗原、不动杆菌o抗原、沙眼衣原体抗原、霍乱弧菌抗原、李斯特菌抗原、嗜肺军团菌血清型1至15抗原、百日咳博德特氏菌(bordetella pertussis)抗原、副百日咳博德特氏菌抗原、鼻疽或类鼻疽伯克霍尔德氏菌抗原、土拉弗朗西斯菌抗原、弯曲杆菌抗原、艰难梭菌抗原、化脓性链球菌抗原、无乳链球菌抗原、粪肠球菌抗原、伯氏疏螺旋体抗原、脑膜炎奈瑟菌抗原、流感嗜血杆菌抗原、硕大利什曼原虫抗原、志贺氏菌抗原、金黄色葡萄球菌抗原、肠道沙门氏菌抗原或肺炎链球菌抗原。
[0351]
82.如段落81的用途,其中糖是肺炎链球菌荚膜糖抗原。
[0352]
83.如段落82的用途,其中肺炎链球菌荚膜糖抗原来自血清型1、4、19a、22f、23a、35b或8,优选来自血清型8。
[0353]
84.如段落76-83中任一项所述的用途,其中所述蛋白质是包含至少1、2或3个糖基化共有序列的载体蛋白。
[0354]
85.如段落84的用途,其中载体蛋白是铜绿假单胞菌外蛋白a(epa)、白喉类毒素、crm197、破伤风类毒素、肺炎链球菌溶血素。
[0355]
86.如段落76-85中任一项所述的用途,其中pglb寡糖基转移酶或其功能片段与具有seq id no:1的序列的相应的pglb寡糖基转移酶相比,能够将蛋白质与糖进行糖基化以产生糖基化蛋白的产率提高至少1.5-倍、2-倍、3-倍、5-倍、10-倍、20-倍、50-倍、100-倍、200-倍、500-倍、700-倍、1,000-倍。
[0356]
87.如段落76-86中任一项所述的用途,其中pglb寡糖基转移酶或其功能片段能够使至少10%、20%、30%、40%、50%、60%、70%、80%或90%的蛋白质用糖进行糖基化,其中糖的葡萄糖残基与糖基化共有序列的n残基共价结合。
[0357]
88.来自大肠弯曲杆菌的pglb寡糖基转移酶(ost)或其功能片段(pglb
c.coli
)在生产糖基化蛋白质中的用途,其中糖连接至糖基化共有序列的n残基,其中所述糖基化共有序列包含氨基酸序列asp/glu-z
1-asn-z
2-ser/thr,其中z1和z2可以是蛋白质的除pro之外的任何天然氨基酸。
[0358]
89.如段落88的用途,其中pglb
c.coli
具有与seq id no:12、13或14(任选地与seq id no:12)至少85%、90%、95%、97%、98%或99%序列同一性的氨基酸序列。
[0359]
90.如段落88或89的用途,其中糖选自于福氏志贺氏菌2a、3a和6,以及大肠杆菌o18。
实施例
[0360]
在以下代表性实施例中说明了本公开的各种特征和实施方式,这些实施例旨在是说明性的,而不是限制性的。
[0361]
实施例1
[0362]
用于评估pglb变体活性的质粒和菌株
[0363]
如在wo 14/057109a1中描述的,在具有基因缺失的大肠杆菌w3110衍生物中测试了pglb变体的活性。基于wo2014057109a1中详述的方法,将荚膜多糖编码基因座稳定整合到大肠杆菌染色体中。从质粒pext21(spec抗性、iptg-诱导的)、pext22(kan抗性、iptg-诱导的)、pec415(kan抗性、阿拉伯糖诱导的)或plafr(tet抗性,组成型)或其衍生物不同地表达其他必需的元件,包括pglb、载体蛋白、补充生物合成酶和调节蛋白。
[0364]
质粒:
[0365]
名称来源pext21dykxhoorne等,1996gene 177:133

136pext22dykxhoorne等,1996gene 177:133

136pec415schulz等,1998science 281,1197

1200plafr1friedman等,1982gene 18(3):289-96
[0366]
实施例2
[0367]
通过elisa从小规模培养物检测糖基化
[0368]
使用对应于肺炎链球菌血清型8的多糖,测试pglb的变体催化含有d/e-z
1-n-z
2-s/t糖基化位点(其中z1和z2不是p)的来自铜绿假单胞菌的外蛋白a(epa)的糖基化的能力。因此,用编码构建肺炎链球菌血清型8荚膜多糖所需的糖基转移酶基因、变体pglb基因和含有糖基化位点的epa的质粒转化大肠杆菌宿主细胞。如下使用iptg和阿拉伯糖诱导基因的表达,并且使大肠杆菌宿主细胞生长过夜以允许糖基转移酶、pglb和epa的表达和epa的糖基化。
[0369]
向96孔深孔板的孔中填充1ml tb培养基,且每个孔接种单一宿主细胞大肠杆菌菌落,并在37摄氏度下孵育过夜。使用每个孔的样品将主培养物接种在含有1ml补充有10mm的mgcl2和适当的抗生素的tb的96孔深孔板中,并使其生长直至od600达到1.3-1.5。将细胞与1mm iptg和0.1%阿拉伯糖在37摄氏度下孵育过夜。
[0370]
通过将板离心、去除上清液并加入0.2ml 50mm的tris-hcl ph 7.5、175mm nacl、5mm edta,随后在4℃振摇以悬浮细胞来制备周质提取物。将10μl的10mg/ml多粘菌素b添加到每个孔中,并将细胞在4摄氏度下孵育1小时。将板离心并去除上清液。
[0371]
为了从周质提取物中分离糖基化的蛋白质,将120μl 25%的imac树脂在30mm tris ph 8.0、10mm咪唑、500mm nacl中的浆液添加到96孔过滤板(acroprep advance)的每个孔中,然后置于nunc elisa板的顶部。将板离心并弃去流过液。将150μl周质提取物和37.5ml的5x结合缓冲液(150mm tris ph 8.0、50mm咪唑、2.5m nacl)添加到每个孔中。将样品在室温下孵育30分钟。将板离心并弃去流过液,再进行三个洗涤步骤。最后,用30mm tris ph 8.0、500mm咪唑、200mm nacl洗脱糖基化蛋白,准备用于elisa测定。
[0372]
通过用在pbs中稀释的识别糖基化蛋白的糖部分的抗体(例如,抗肺炎链球菌血清型8的单克隆抗体)涂覆96孔板的孔来进行夹心elisa。将板在4℃下孵育过夜以允许涂覆。然后用含有0.1%tween的pbs洗涤板。然后在室温下使用pbst中的5%牛血清白蛋白将板封闭2小时。将板在pbst中洗涤。将样品在含有1%bsa的pbst中稀释,并在涂覆的孔中室温下孵育1小时。在洗涤检测抗体后,例如,在含有1%bsa的pbst中稀释的抗histag-辣根过氧化物酶被添加到每个孔中,并在室温下孵育一小时。然后洗涤板,之后加入3,3',5,5'-四甲基联苯胺液体底物,supersensitive,用于elisa(sigma-aldrich)。几分钟后,通过加入2m硫
酸终止反应。通过读取450nm处的od获得结果。
[0373]
结果
[0374]
作为起点,在已经包含n311v突变的pglb中产生突变。第一轮变体生成将y77r鉴定为进一步增加pglb的ost活性的突变(参见图1)。对含有n311v和y77r突变的pglb进行突变,并如上所述选择有希望的变体、测序和分析ost活性。计算每一个变体的寡糖基转移酶活性增加的倍数,结果见表3。
[0375]
表3通过elisa测定的在将肺炎链球菌8糖转移至蛋白质中的工程化pglb ost活性的改进
[0376]
第2轮
[0377]
[0378][0379]
突变57t、57r、63l、63q、94n、101w、101e、101h、101p、101r、101m、101g、172e、176e、176g、191h、191d、101r、101y、193t、193h、193g、193f、233v、234h、234c、234w、255h、286a、286q、286l、301p、301g、301f、319a、319q、319l、319t、397n、397l、397q、402r、402h、425s、435a、435l、435f、435h、435r、446g、462,p、462c、462w、462t、462n、479m、523r、532h、601g、605d、606p、610p、610l、610r、610d、610a、645l、645s、645h、676q、676w、676g、695i和695q被注明为出现在几种pglb变体中的突变,这些变体能够增强将肺炎链球菌血清型8糖添加至载体蛋白的催化作用。其中,a57r突变因其ost活性的高增加、在有希望的变体中出现的频率以及其在pglb结构中的位置而被选为有希望的突变以进入到进一步的轮次。
[0380]
当两个残基都突变时,残基462和479协同以产生更高倍数的ost活性增加的能力如下表所示,该表显示了个体的结果:
[0381][0382]
[0383]
在进一步的实验轮次中,有利的a57r突变被添加到y77r和n311v突变。将进一步的突变添加到具有a57r、y77r和n311v突变的pglb。使用肺炎链球菌ps8作为添加到epa的糖,通过elisa测试新突变的pglb活性增加。结果如下表4所示。
[0384]
表4

通过elisa测定的在将肺炎链球菌8糖转移到蛋白质中的工程化pglb ost活性的改进
[0385]
第3轮
[0386][0387]
从这一轮中,在52个单独的pglb变体中发现了462w和479m的组合,使ost活性增加高达15倍,或8-12倍,其中这些突变是唯一存在的新突变。这些突变被认为对于提高pglb用于蛋白质用在糖的还原末端含有葡萄糖残基的糖进行糖基化的效率很重要。
[0388]
突变n300l、l301p、f308w和l570r也被注明为出现在几个pglb变体中的突变,这些变体能够增强对将肺炎链球菌血清型8糖添加到载体蛋白的催化。
[0389]
n300l、l301p、f308w、y462w、h479m和l570r被选择为有希望的突变以进行到进一步轮次的突变/选择,因为它们增加ost活性的能力、它们在有效pglb变体中出现的频率以及它们在pglb的分子结构中的位置。这些残基添加到y77r、n311v和a57r突变,并测试了进一步的点突变对于提高pglb将肺炎链球菌血清型8糖添加到蛋白质中的活性的能力。结果如下表5所示。
[0390]
表5

通过elisa测定的在将肺炎链球菌8糖转移到蛋白质中的工程化pglb ost活性的改进
[0391]
第4轮
[0392][0393]
从这一轮将l191y、y286q、s295l、a382s、k482r和t523r突变添加到先前测试的突变,从而得到包含以下突变的参考pglb:y77r、n311v、a57r、n300l、l301p、f308w、y462w、h479m、l570r、l191y、y286q、s295l、a382s、k482r和t523r。在下一轮中,测试了进一步的突变对于进一步提高含有y77r、n311v、a57r、n300l、l301p、f308w、y462w、h479m、l570r、进一步l191y、y286q、s295l、a382s、k482r和t523r轮的pglb的效率的能力,且结果如下表6所示。
[0394]
表6-通过elisa测定的在将肺炎链球菌8糖转移至蛋白质中的工程化pglb ost活性的提高
[0395]
第5轮
[0396][0397]
从这一轮中选择了e297r,因为在该突变存在的情况下产生的活性增加以及该突变的出现频率。s80d突变也被选择为有前景的残基,因为它在具有较高ost活性水平的变体
中出现的频率。
[0398]
进化的总结
[0399]
在本研究的过程中,在将肺炎链球菌血清型8糖添加到含有糖基化共有序列的蛋白质中的情况下,pglb的活性增加了超过三个数量级(图1)。将a57r引入pglb中,到已经含有y77r和n311v突变的pglb酶中,导致pglb活性增加24倍。n300l、l301p、f308w、y462w、h479m和l750r的进一步添加导致活性累积增加360倍。进一步并入l191y、y286q、s295l、a382s、k482r和t523r导致活性累积增加2520倍,而进一步包含e297r突变导致活性累积增加5040倍。进一步的进化轮次允许pglb活性的小幅增加,但是在第1-3轮中实现了最大的活性增加(见图1)。
[0400]
实施例3
[0401]
在摇瓶体积下测量pglb活性
[0402]
一些突变的pglb酶用于较大规模的测定,以确认在用肺炎链球菌血清型8糖对含有3个糖基化共有序列的epa蛋白进行糖基化时活性的增加。
[0403]
通过电穿孔用所需的质粒转化电感受态大肠杆菌菌株。使细胞恢复1小时并铺板到含有适当抗生素和2mm mgcl2的琼脂板上。将板孵育过夜。通过用来自板的细胞接种含有适当抗生素和10mm mgcl2的tb培养基并孵育过夜来进行预培养。
[0404]
通过在含有适当抗生素和10mm mgcl2的tb培养基中将预培养物稀释至0.1的od600nm开始主培养。培养物生长至0.8-1.0的od600nm,细胞然后使用适当的诱导剂(例如,阿拉伯糖或iptg)诱导。然后将细胞孵育过夜。
[0405]
通过以下过程制备周质提取物。将培养物离心以沉淀大肠杆菌。弃去上清液,将沉淀重悬于30mm tris-hcl ph 8.5、1mm edta、20%蔗糖中。加入溶菌酶至终浓度为1mg/ml,并将细胞与溶菌酶一起在4℃下伴随振摇孵育25分钟。离心后,保留周质提取物。
[0406]
将1ml周质提取物与0.25ml的150mm tris ph8.0、50mm咪唑、2.5m nacl和20mm mgcl2混合。加入0.2ml的50%的浆液或预平衡的ninta琼脂糖(qiagen),并将样品在室温下伴随振摇孵育20分钟。imac树脂离心并弃去上清液。添加0.5ml的30mm tris ph 8.0、10mm咪唑、500mm nacl和0.1%正十二烷基-b-麦芽糖,树脂离心并弃去上清液。用30mm tris ph 8.0、10mm咪唑、500mm nacl将树脂进一步洗涤3次。向树脂中加入0.2ml洗脱缓冲液(30mm tris ph8.0、10mm咪唑、50mm nacl)并在室温下孵育5分钟。回收洗脱液并用于进一步分析。
[0407]
通过sds-page和蛋白质印迹评估糖基化的量。在sds-page上运行样品后,将蛋白质转移到硝基纤维素膜上。用10%的乳封闭膜至少10分钟。封闭后,将膜与第一抗体(例如,抗肺炎链球菌血清型8的小鼠单克隆抗体)在含有1%乳的pbs-t中孵育1小时。用pbs-t洗涤后,将膜在含有1%乳的pbs-t中与第二抗体-hrp偶联物(抗小鼠igg fc hrp)一起孵育1小时。将膜在pbs-t中洗涤并使用biofx tmb one component hrp膜底物显色。
[0408]
结果
[0409]
图1显示了凝胶,其中获得了用肺炎链球菌血清型8荚膜糖进行糖基化的epa的水平增加。ost活性最重要的增加是在第1-3轮中实现的,在随后的轮次中实现了较小的活性倍数增加。在摇瓶规模下,实现了远超过1,000倍的产率增加。
[0410]
实施例4
[0411]
突变的pglb寡糖基转移酶显示出增强的催化其他糖类的糖基化的效率
[0412]
进行了进一步的实验以研究来自每一轮的修饰的pglb ost是否可以在不同的糖与epa蛋白键合的情况下产生更高的其他生物缀合物的产率。
[0413]
实施例2和3的方案用于制备肺炎链球菌血清型22f与修饰的epa共价键合的生物缀合物。elisa和蛋白质印迹的结果表明,使用从实施例2的第3、4和5轮产生的修饰的pglb可以实现肺炎链球菌血清型22f-epa缀合物的良好产率。使用具有a57r、y77r和n311v的突变的第3轮pglb的产率是良好的,但通过使用包含在n300l、l301p、f308w、y462w、h479m和l570r处的额外点突变的第4轮的pglb,产率得到了进一步提高。通过使用含有在l191y、y286q、s295l和a382s处的进一步突变的第5轮pglb,产率进一步提高。
[0414]
如图3a所示,突变的pglb ost在催化将肺炎链球菌血清型23a糖添加到蛋白质方面也是高效的。如图3b所示,突变的pglb ost在催化将肺炎链球菌血清型35b添加到蛋白质方面也是高效的。包含在a57r、y77r和n311v处的置换导致图3b中所示的改进的活性。
[0415]
如图4所示,突变的pglb ost还可以有效地催化将肺炎链球菌血清型19a添加到蛋白质中。
[0416]
序列表
[0417]
seq id no:1
[0418]
来自空肠弯曲杆菌的野生型pglb(plmtb1937)
[0419]
mlkkeylknpylvlfamiilayvfsvfcrfywvwwasefneyffnnqlmiisndgyafaegardmiagfhqpndlsyygsslsaltywlykitpfsfesiilymstflsslvviptillaneykrplmgfvaallasiansyynrtmsgyydtdmlvivlpmfilffmvrmilkkdffslialplfigiylwwypssytlnvaliglfliytlifhrkekifyiavilssltlsniawfyqsaiivilfalfaleqkrlnfmiigilgsatliflilsggvdpilyqlkfyifrsdesanltqgfmyfnvnqtiqevenvdlsefmrrisgseivflfslfgfvwllrkhksmimalpilvlgflalkgglrftiysvpvmalgfgfllsefkaimvkkysqltsnvcivfatiltlapvfihiynykaptvfsqneasllnqlknianredyvvtwwdygypvryysdvktlvdggkhlgkdnffpsfalskdeqaaanmarlsveyteksfyapqndilktdilqammkdynqsnvdlflaslskpdfkidtpktrdiylymparmslifstvasfsfinldtgvldkpftfstaypldvkngeiylsngvvlsddfrsfkigdnvvsvnsiveinsikqgeykitpiddkaqfyifylkdsaipyaqfilmdktmfnsayvqmfflgnydknlfdlvinsrdakvfklki
[0420]
seq id no:2
[0421]
含有n311v和y77r突变的空肠弯曲杆菌pglb(plmtb4028)
[0422]
mlkkeylknpylvlfamiilayvfsvfcrfywvwwasefneyffnnqlmiisndgyafaegardmiagfhqpndlsrygsslsaltywlykitpfsfesiilymstflsslvviptillaneykrplmgfvaallasiansyynrtmsgyydtdmlvivlpmfilffmvrmilkkdffslialplfigiylwwypssytlnvaliglfliytlifhrkekifyiavilssltlsniawfyqsaiivilfalfaleqkrlnfmiigilgsatliflilsggvdpilyqlkfyifrsdesanltqgfmyfnvvqtiqevenvdlsefmrrisgseivflfslfgfvwllrkhksmimalpilvlgflalkgglrftiysvpvmalgfgfllsefkaimvkkysqltsnvcivfatiltlapvfihiynykaptvfsqneasllnqlknianredyvvtwwdygypvryysdvktlvdggkhlgkdnffpsfalskdeqaaanmarlsveyteksfyapqndilktdilqammkdynqsnvdlflaslskpdfkidtpktrdiylymparmslifstvasfsfinldtgvldkpftfstaypldvkngeiylsngvvlsddfrsfkigdnvvsvnsiveinsikqgeykitpiddkaqfyifylkdsaipyaqfilmdktmfnsayvqmfflgnydknlfdlvinsrdakvfklki
[0423]
seq id no:3
[0424]
具有a57r、y77r和n311v突变的空肠弯曲杆菌pglb(plmtb4768)
[0425]
mlkkeylknpylvlfamiilayvfsvfcrfywvwwasefneyffnnqlmiisndgyrfaegardmiagfhqpndlsrygsslsaltywlykitpfsfesiilymstflsslvviptillaneykrplmgfvaallasiansyynrtmsgyydtdmlvivlpmfilffmvrmilkkdffslialplfigiylwwypssytlnvaliglfliytlifhrkekifyiavilssltlsniawfyqsaiivilfalfaleqkrlnfmiigilgsatliflilsggvdpilyqlkfyifrsdesanltqgfmyfnvvqtiqevenvdlsefmrrisgseivflfslfgfvwllrkhksmimalpilvlgflalkgglrftiysvpvmalgfgfllsefkaimvkkysqltsnvcivfatiltlapvfihiynykaptvfsqneasllnqlknianredyvvtwwdygypvryysdvktlvdggkhlgkdnffpsfalskdeqaaanmarlsveyteksfyapqndilktdilqammkdynqsnvdlflaslskpdfkidtpktrdiylymparmslifstvasfsfinldtgvldkpftfstaypldvkngeiylsngvvlsddfrsfkigdnvvsvnsiveinsikqgeykitpiddkaqfyifylkdsaipyaqfilmdktmfnsayvqmfflgnydknlfdlvinsrdakvfklki
[0426]
seq id no:4
[0427]
具有a57r、y77r、n300l、l301p、f308w、n311v、y462w、h479m、l570r突变的空肠弯曲杆菌pglb(plmtb5298)
[0428]
mlkkeylknpylvlfamiilayvfsvfcrfywvwwasefneyffnnqlmiisndgyrfaegardmiagfhqpndlsrygsslsaltywlykitpfsfesiilymstflsslvviptillaneykrplmgfvaallasiansyynrtmsgyydtdmlvivlpmfilffmvrmilkkdffslialplfigiylwwypssytlnvaliglfliytlifhrkekifyiavilssltlsniawfyqsaiivilfalfaleqkrlnfmiigilgsatliflilsggvdpilyqlkfyifrsdesalptqgfmywnvvqtiqevenvdlsefmrrisgseivflfslfgfvwllrkhksmimalpilvlgflalkgglrftiysvpvmalgfgfllsefkaimvkkysqltsnvcivfatiltlapvfihiynykaptvfsqneasllnqlknianredyvvtwwdygwpvryysdvktlvdggkmlgkdnffpsfalskdeqaaanmarlsveyteksfyapqndilktdilqammkdynqsnvdlflaslskpdfkidtpktrdiylymparmsrifstvasfsfinldtgvldkpftfstaypldvkngeiylsngvvlsddfrsfkigdnvvsvnsiveinsikqgeykitpiddkaqfyifylkdsaipyaqfilmdktmfnsayvqmfflgnydknlfdlvinsrdakvfklki
[0429]
seq id no:5
[0430]
具有a57r、y77r、l191y、y286q、s295l、n300l、l301p、f308w、n311v、a382s、y462w、h479m、k482r、t523r、l570r突变的空肠弯曲杆菌pglb(plmtb5685)
[0431]
mlkkeylknpylvlfamiilayvfsvfcrfywvwwasefneyffnnqlmiisndgyrfaegardmiagfhqpndlsrygsslsaltywlykitpfsfesiilymstflsslvviptillaneykrplmgfvaallasiansyynrtmsgyydtdmlvivlpmfilffmvrmilkkdffslialplfigiyywwypssytlnvaliglfliytlifhrkekifyiavilssltlsniawfyqsaiivilfalfaleqkrlnfmiigilgsatliflilsggvdpilqqlkfyifrldesalptqgfmywnvvqtiqevenvdlsefmrrisgseivflfslfgfvwllrkhksmimalpilvlgflalkgglrftiysvpvmslgfgfllsefkaimvkkysqltsnvcivfatiltlapvfihiynykaptvfsqneasllnqlknianredyvvtwwdygwpvryysdvktlvdggkmlgrdnffpsfalskdeqaaanmarlsveyteksfyapqndilkrdilqammkdynqsnvdlflaslskpdfkidtpktrdiylymparmsrifstvasfsfinldtgvldkpftfstaypldvkngeiylsngvvlsddfrsfkigdnvvsvnsiveinsikqgeykitpiddkaqfyifylkdsaipyaqfilmdktmfnsayvqmfflgnydknlfdlvinsrdakvfklki
[0432]
seq id no:6
[0433]
具有a57r、y77r、l191y、y286q、s295l、e297r、n300l、l301p、f308w、n311v、a382s、
y462w、h479m、k482r、t523r、l570r突变的空肠弯曲杆菌pglb(plmtb5967)
[0434]
mlkkeylknpylvlfamiilayvfsvfcrfywvwwasefneyffnnqlmiisndgyrfaegardmiagfhqpndlsrygsslsaltywlykitpfsfesiilymstflsslvviptillaneykrplmgfvaallasiansyynrtmsgyydtdmlvivlpmfilffmvrmilkkdffslialplfigiyywwypssytlnvaliglfliytlifhrkekifyiavilssltlsniawfyqsaiivilfalfaleqkrlnfmiigilgsatliflilsggvdpilqqlkfyifrldrsalptqgfmywnvvqtiqevenvdlsefmrrisgseivflfslfgfvwllrkhksmimalpilvlgflalkgglrftiysvpvmslgfgfllsefkaimvkkysqltsnvcivfatiltlapvfihiynykaptvfsqneasllnqlknianredyvvtwwdygwpvryysdvktlvdggkmlgrdnffpsfalskdeqaaanmarlsveyteksfyapqndilkrdilqammkdynqsnvdlflaslskpdfkidtpktrdiylymparmsrifstvasfsfinldtgvldkpftfstaypldvkngeiylsngvvlsddfrsfkigdnvvsvnsiveinsikqgeykitpiddkaqfyifylkdsaipyaqfilmdktmfnsayvqmfflgnydknlfdlvinsrdakvfklki
[0435]
seq id no:7
[0436]
具有a57r、y77r、s80d、l191y、y286q、s295l、e297r、n300l、l301p、f308w、n311v、a382s、y462w、h479m、k482r、t523r、l570r突变的空肠弯曲杆菌pglb(plmtb6274)
[0437]
mlkkeylknpylvlfamiilayvfsvfcrfywvwwasefneyffnnqlmiisndgyrfaegardmiagfhqpndlsrygdslsaltywlykitpfsfesiilymstflsslvviptillaneykrplmgfvaallasiansyynrtmsgyydtdmlvivlpmfilffmvrmilkkdffslialplfigiyywwypssytlnvaliglfliytlifhrkekifyiavilssltlsniawfyqsaiivilfalfaleqkrlnfmiigilgsatliflilsggvdpilqqlkfyifrldrsalptqgfmywnvvqtiqevenvdlsefmrrisgseivflfslfgfvwllrkhksmimalpilvlgflalkgglrftiysvpvmslgfgfllsefkaimvkkysqltsnvcivfatiltlapvfihiynykaptvfsqneasllnqlknianredyvvtwwdygwpvryysdvktlvdggkmlgrdnffpsfalskdeqaaanmarlsveyteksfyapqndilkrdilqammkdynqsnvdlflaslskpdfkidtpktrdiylymparmsrifstvasfsfinldtgvldkpftfstaypldvkngeiylsngvvlsddfrsfkigdnvvsvnsiveinsikqgeykitpiddkaqfyifylkdsaipyaqfilmdktmfnsayvqmfflgnydknlfdlvinsrdakvfklki
[0438]
seq id no:8
[0439]
具有a57r、y77r、s80d、i187v、l191y、y286q、s295l、e297r、n300l、l301p、f308w、n311v、i359q、a382s、n406i、y462w、h479m、k482r、t523r、l570r突变的空肠弯曲杆菌pglb(plmtb6526)
[0440]
mlkkeylknpylvlfamiilayvfsvfcrfywvwwasefneyffnnqlmiisndgyrfaegardmiagfhqpndlsrygdslsaltywlykitpfsfesiilymstflsslvviptillaneykrplmgfvaallasiansyynrtmsgyydtdmlvivlpmfilffmvrmilkkdffslialplfvgiyywwypssytlnvaliglfliytlifhrkekifyiavilssltlsniawfyqsaiivilfalfaleqkrlnfmiigilgsatliflilsggvdpilqqlkfyifrldrsalptqgfmywnvvqtiqevenvdlsefmrrisgseivflfslfgfvwllrkhksmimalpqlvlgflalkgglrftiysvpvmslgfgfllsefkaimvkkysqltsivcivfatiltlapvfihiynykaptvfsqneasllnqlknianredyvvtwwdygwpvryysdvktlvdggkmlgrdnffpsfalskdeqaaanmarlsveyteksfyapqndilkrdilqammkdynqsnvdlflaslskpdfkidtpktrdiylymparmsrifstvasfsfinldtgvldkpftfstaypldvkngeiylsngvvlsddfrsfkigdnvvsvnsiveinsikqgeykitpiddkaqfyifylkdsaipyaqfilmdktmfnsayvqmfflgnydknlfdlvinsrdakvfklki
[0441]
seq id no:9空肠弯曲杆菌的pglb
[0442][0443]
seq id no:10红嘴鸥弯曲杆菌的pglb
[0444][0445]
seq id no:11
[0446]
mlkkeylknpylvlfamiilayvfsvfcrfywvwwasefneyffnnqlmiisndgyafaegardmiagfhqpndlshygsslsaltywlykitpfsfesiilymstflsslvviptillaneykrplmgfvaallasiansyynrtmsgyydtdmlvivlpmfilffmvrmilkkdffslialplfigiylwwypssytlnvaliglfliytlifhrkekifyiavilssltlsniawfyqsaiivilfalfaleqkrlnfmiigilgsatliflilsggvdpilyqlkfyifrsdesanltqgfmyfnvvqtiqevenvdlsefmrrisgseivflfslfgfvwllrkhksmimalpilvlgflalkgglrftiysvpvmalgfgfllsefkaimvkkysqltsnvcivfatiltlapvfihiynykaptvfsqneasllnqlknianredyvvtwwdygypvryysdvktlvdggkhlgkdnffpsfalskdeqaaanmarlsveyteksfyapqndilktdilqammkdynqsnvdlflaslskpdfkidtpktrdiylymparmslifstvasfsfinldtgvldkpftfstaypldvkngeiylsngvvlsddfrsfkigdnvvsvnsiveinsikqgeykitpiddkaqfyifylkdsaipyaqfilmdktmfnsayvqmfflgnydknlfdlvinsrdakvfklki
[0447]
seq id no:12来自大肠弯曲杆菌_jv20.asm14683v1的pglbefm37568
[0448]
mlkkeyfknptfillafiilayvfsvlcrfywifwasefneyffnnelmiisndgyafaegardmiagfhqpndlsyygsslstltywfykitpfslesifiyistflsslvviplilianeykrplmgfvaallasiansyynrtmsgyydtdmlvivlammivffmirlilkkdllslitlplfvgiylwwypssytlnvallglffiytlvfhikektlymaiilasitlsniawfyqsaiivilfslfvlqnkrfsfallgilglatlvflilsggidpilyqlkfyifrsdesanlaqgfmyfnvnqtiqevesidlsifmqrisgselvffvsligfiflvrkhksmilalpmlalgflalksglrftiya
vpvlalgfgflmsllqerkqknnntywwanigvfiftflslipmfyhinnykaptvfsqneatkldelkkiaqredyvvtwwdygypiryysdvktladggkhlgkdnffpsfvlskdqvaaanmarlsveyteksfyaplndilkndllqammkdynqnnvdlflaslskpdfkinmpktrdvyiymparmslifstvasfsfvdletgeinkpftfsaaypldvkngeiylsngialsddfrsfkinnstisvnsiieinsikqgeykitpiddmaqfyifylkdstipyaqfilmdktmfnsayvqmfflgnydknlydlvinardakvfklki
[0449]
seq id no:13来自大肠弯曲杆菌_76339.3s的pglb cdg57218
[0450]
mlkkeyfknptfilltliilayafsvlcrfywvfwasefneyffnnelmiisndgyafaegardmiagfhqpndlsyygsslstltywfykitpfslesifiyistflsslvvvplilianeykrplmgfvaallasiansyynrtmsgyydtdmlvivlammivffmirlilrkdllslialplfvgiylwwypssytlnvallgllfiytlvfhikektlymaiilasitlsniawfyqsaiivilfslfvlqnkrfsfallgflglatlvflilsggvdpilyqlkfyifrsdesanlaqgfmyfnvnqtiqevesidlsifmkrisgselvffisligfiflvrkhksmilalpmlalgflalkgglrftiyavpvlalgfgflmsllqerkwknkniywasvsiftflsllpmfyhiinykaptvfsqneaskldelkkiaqredyvvawwdygypiryysdvktladggkhlgkdnffpsfilskdqtaaanmarlsveyteksfyapsndilkndllkammkdykqnnvdlflaslskpdfkintpktrdvyiymparmslifstvasfsfvdldtgkidkpftfsaaypldvkngeiylsngivlsddfrsfkinhntipvnsiievssikqgeykitpiddtaqfyilylkdstipyaqfilmdkamfnsayvqmfflgnydknlydlvintrdtkvfklki
[0451]
seq id no:14来自大肠弯曲杆菌_317_04.asm25395v3的pglbeia90085
[0452]
mlkkeyfknptfillafiilayvfsvlcrfywvfwasefneyffnnelmiisndgyafaegardmiagfhqpndlsyygsslstltywfykitpfslesifiyistflsslvviplilianeykrplmgfvaallasiansyynrtmsgyydtdmlvivlammivffmirlilkkdllslialplfvgiylwwypssytlnvallglffiytlvfhikektlymaiilasitlsniawfyqsaiivilfslfvlqnkrfsfallgilglatlvflilsggidpilyqlkfyifrsdesanlaqgfmyfnvnqtiqevesidlsifmqrisgselvffvsligfiflvrkhksmilalpmlalgflalksglrftiyavpvlalgfgflmsllqerkqknnntywwanigvfiftflslipmfyhinnykaptvfsqneatkldelkkiaqredyvvawwdygypiryysdvktladggkhlgkdnffpsfvlskdqvaaanmarlsveyteksfyaplndilkndllqammkdynqnnvdlflallskpdfkintpktrdvyiymparmslifstvasfsfvdlgtgeinkpftfsaaypldvkngeiylsngivlsddfrsfkinnstisvnsiieinsikqgeykitpiddtaqfyifylkdstipyaqfilmdktmfnsayvqmfflgnydknlydlvinardakvfklkf
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献