一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

前导序列的制作方法

2022-02-22 11:17:47 来源:中国专利 TAG:

前导序列
1.本发明涉及前导序列,以及前导序列用于将分子包装成蛋白质复合物的用途。
2.生物分子(例如肽、蛋白质和核酸)具有作为广泛适用的治疗剂的巨大潜力。实际上,近年来,制药工业存在从“小分子”药物转向更复杂的大分子治疗剂(又名“生物制剂”)的趋势。此类生物制剂包括基于蛋白质的治疗剂(特别是抗体、激素、生长因子和细胞因子)和基于核酸的治疗剂(如短干扰rna、dna/rna疫苗和基因疗法)。
3.虽然近年来生物制剂市场已经显著发展,但是有效递送系统(以及用于制造此类递送系统的可行方法)的低可用性限制了此类生物治疗剂的分子靶标的多样性,特别是当靶标是胞质时。实际上,市场上大多数批准的肽治疗剂通过靶向胞外组分来起作用,如膜受体或分泌的分子(例如,存在于间隙空间中)。例如,humira(最成功的治疗性单克隆抗体)靶向胞外分泌的细胞因子tnfα。胰岛素通过结合其存在于细胞膜上的同源受体起作用(其他激素肽治疗剂也是相同的情况)。
4.类似的问题存在于农业工业中,其中基于蛋白质的杀虫剂通常是必须靶向害虫细胞的胞外组分的毒素。举例来说,苏云金芽孢杆菌(bacillus thuringiensis)毒素是常用的天然杀虫剂,其必须结合膜受体以发挥其毒性作用。
5.已经开发了胞质递送生物分子的方法用于实验室研究,其通常涉及在将其有效载荷排空到胞质之前,递送与细胞质膜融合的脂质载体内的分子。然而,此类方法在医学和兽医中的用途有限,例如由于它们将分子递送至细胞的非特异性性质。
6.考虑到细菌分泌系统将分子分泌(或更具体地“注射”)到靶细胞中的天然能力,细菌分泌系统已被研究作为潜在的递送系统。研究最多的此类分泌系统是iii型分泌系统(t3ss),一种在几种革兰氏阴性细菌中发现的“蛋白质附属物”。然而,这些系统的显著缺点是它们始终保持与细菌膜结合,需要使用实际的细菌细胞(包含分泌系统)作为递送系统。因此,难以完全控制什么分子从细菌转移到靶细胞(即使当目标生物制剂过表达时),因为这些分泌系统通过在细菌的胞质和靶细胞的胞质之间提供连接(例如通道)来起作用,其他组分(可能对宿主有害)可以通过该连接流动。
7.因此,不仅需要改进的递送系统,而且还需要用于生产此类系统的方法,所述系统发现与具有一系列尺寸和分子性质的分子(有效载荷)是相容的。
8.本发明解决了上述问题中的一个或多个。
9.本发明基于以下令人惊讶的发现:光杆状菌属(photorhabdus)细菌的产毒性光杆状菌毒力盒(pvc)效应子蛋白包含先前未知的“前导序列”(或“前导肽”),其用于将pvc效应子包装(或“负载”)到所谓的pvc针状复合物(例如“纳米注射器”)中,所述pvc针状复合物随后将pvc效应子递送至靶细胞,在那里它发挥其产毒作用(pvc效应子代表这种纳米注射器的有效载荷)。此外,本发明人已经发现,这样的前导序列实际上可以用于引导与其连接的有效载荷被包装到pvc针状复合物(和相关/同源复合物)中,这是一种充分表征的光杆状菌的分子递送系统。因此,新发现的前导序列令人惊讶地起到以分子有效载荷(或“弹头”)负载pvc针状复合物的作用。
10.除了这一发现之外,发明人已经开发了这种前导序列用于将“异源”有效载荷(包
50是内源性的)的(例如完整的)pvc效应子序列。野生型pvc效应子的实例可包含选自seq id no.:1-seq id no.:46的一个或多个序列的氨基酸序列(或基本上由其组成)。因此,本文所述的本发明的融合体/效应子融合体不同于pvc效应子蛋白(例如野生型pvc效应子蛋白),因为前导序列不与在野生型pvc效应子蛋白的情况下它可以与之融合的效应子部分融合。举例来说,融合体/效应子融合体可以包含与hvna(基因plu1649)pvc效应子蛋白的效应子部分(例如seq id no.:46的氨基酸51-295)融合的“pnf”pvc效应子蛋白的前导序列(例如seq id no.:78的前导序列),但不旨在指与pnf pvc效应子蛋白的效应子部分(例如seq id no.:32的氨基酸51-340)融合的“pnf”pvc效应子蛋白的前导序列(例如seq id no.:78的前导序列)。
25.另一方面,融合体/效应子融合体可以包含与非效应子部分(例如非光杆状菌蛋白,如ore重组酶)融合的例如“pnf”pvc效应子蛋白的前导序列(例如seq id no.:78的前导序列)。因此,前导序列可用于将一系列例如异源(非野生型)物质包装到pvc针状复合物中,打开了使用pvc针状复合物作为模块化、多样化递送系统的可能性,首次用于不仅将天然效应子而且将“非天然”有效载荷递送至细胞。因此,可以制造具有选择的有效载荷的pvc针状复合物。
26.本发明的另一个方面提供了一种用于制造包括有效载荷的pvc针状复合物的方法(例如,换句话说,一种用于制造包装的pvc针状复合物的方法),该方法包括:
27.a.使pvc针状复合物与效应子融合体接触(例如在宿主细胞内),所述效应子融合体包含与有效载荷融合的pvc效应子前导序列;
28.b.其中有效载荷是选自多肽、核酸或其组合的一种或多种(优选多肽);和
29.c.其中该效应子融合体不同于野生型pvc效应子蛋白。
30.本发明的一个方面提供了一种用于制造包含有效载荷的pvc针状复合物的方法(例如,换句话说,一种用于制造包装的pvc针状复合物的方法),该方法包括:
31.a.使pvc针状复合物与融合体接触(例如在宿主细胞内),所述融合体包含与有效载荷融合的pvc效应子前导序列,其中前导序列和有效载荷形成不同于pvc效应子蛋白(例如野生型pvc效应子蛋白)的融合体;和
32.b.其中有效载荷是选自多肽、核酸或其组合的一种或多种(优选多肽)。
33.在一个实施方案中,所述接触可以在细胞(例如细菌宿主细胞)内、在细胞裂解物中或在纯化的细胞裂解物中(优选在细胞内)发生。在一个实施方案中,所述接触可以在无细胞表达系统内发生。类似地,本文所述的用途可以包括在细胞(例如细菌宿主细胞)内、在细胞裂解物、无细胞表达系统中或在纯化的细胞裂解物中(优选在细胞内,更优选在细菌宿主细胞内)发生的(在融合体/效应子融合体和pvc针状复合物之间的)接触步骤。
34.编码pvc针状复合物的盒(操纵子)可以与第一启动子可操作地连接,并且编码融合体/效应子融合体(有效载荷)的基因可以与第二(优选不同的)启动子可操作地连接。在一个实施方案中,所述第一和/或第二启动子是诱导型启动子(例如阿拉伯糖诱导型启动子,如pbad和/或iptg诱导型启动子)。因此,本发明包括表达系统,其中编码pvc的操纵子存在于第一载体/质粒内(任选地与第一启动子可操作地连接),并且编码效应子融合体的序列(与有效载荷融合的前导序列)存在于第二(优选不同的)质粒内(任选地与第二启动子连接)。
是指具有包装的效应子融合体的pvc针状复合物,或者换句话说,与效应子融合体一起包装的pvc针状复合物。
57.术语“包装的效应子融合体”、“融合体”和“效应子融合体”(例如其中融合体/效应子融合体不同于野生型pvc效应子蛋白)包括pvc效应前导序列和包装到pvc针状复合物中后保持接触(例如融合)的有效载荷的组合(例如前导序列尚未从有效载荷切割出来),以及pvc效应前导序列和不再直接接触(例如不再融合,如前导序列从有效载荷切割后)的有效载荷的组合。
58.如本文所用的术语“治疗(treat)”或“治疗(treating)”涵盖预防性治疗(例如预防疾病发作)以及矫正性治疗(治疗已经患有疾病的受试者)。优选,如本文所用的“治疗(treat)”或“治疗(treating)”意指矫正性治疗。术语“治疗(treat)”或“治疗(treating)”涵盖治疗疾病及其症状两者。在一些实施方案中,“治疗(treat)”或“治疗(treating)”是指疾病的症状。
59.因此,pvc针状复合物可以以治疗有效量或预防有效量施用于受试者。
[0060]“治疗有效量”是(包装/负载的)pvc针状复合物的任何量,其在单独或组合(例如,与另一种治疗剂,并行或连续施用并且叠加或协同作用)施用于受试者以治疗疾病(或其症状)时足以实现疾病或其症状的这种治疗。
[0061]“预防有效量”是(包装/负载的)pvc针状复合物的任何量,其在单独或组合(例如,与另一种治疗剂,并行或连续施用并且叠加或协同作用)施用于受试者时,抑制或延迟疾病(或其症状)的发作或复发。在一些实施方案中,预防有效量完全预防疾病的发作或复发。“抑制”发作意指降低疾病发作(或其症状)的可能性,或完全预防发作。
[0062]
在相关方面中,提供了一种(包装的)pvc针状复合物,其包含(例如,容纳/与其一起包装)效应子融合体;
[0063]
a.其中所述效应子融合体包含(或基本上由其组成)与有效载荷融合的pvc效应前导序列(或换句话说,其中所述效应子融合体由pvc效应前导序列和有效载荷形成);
[0064]
b.其中所述有效载荷是选自多肽、核酸或其组合的一种或多种;和
[0065]
c.其中该效应子融合体不同于野生型pvc效应子蛋白。
[0066]
换句话说,本发明的一个方面提供了一种(包装的)pvc针状复合物,其容纳(例如与其一起包装)融合体;
[0067]
a.其中所述融合体包含(或基本上由其组成)与有效载荷融合的pvc效应子前导序列(或换句话说,其中所述融合体由pvc效应子前导序列和有效载荷形成);
[0068]
b.其中所述有效载荷是选自多肽、核酸或其组合的一种或多种(优选多肽);和
[0069]
c.其中该融合体不同于pvc效应子蛋白(例如野生型pvc效应子蛋白)。
[0070]
在优选实施方案中,(包装的)pvc针状复合物是分离的(例如非天然的)pvc针状复合物。
[0071]
如下所述,pvc针状复合物通常在自然界中起作用以将产毒的pvc效应子递送至昆虫靶标。通过极大地扩展可以包装到pvc针状复合物中的有效载荷的数量和种类,本发明同时扩展了可以被靶向和杀灭的无脊椎动物(例如害虫)的数量和种类,如变形虫、线虫、蠕虫和昆虫。
[0072]
在本发明的再一个方面中,提供了一种用于抑制害虫的方法,该方法包括:
[0073]
a.使害虫或包含害虫的目标区域与包含(例如容纳/包装有)效应子融合体的(包装的)pvc针状复合物接触;
[0074]
b.其中效应子融合体包含(或基本上由其组成)与有效载荷融合的pvc效应子前导序列(或换句话说,其中所述效应子融合体由pvc效应子前导序列和有效载荷形成);
[0075]
c.其中所述有效载荷是选自多肽、核酸或其组合的一种或多种(优选多肽);和
[0076]
d.其中该效应子融合体不同于野生型pvc效应子蛋白。
[0077]
本发明的一个方面提供了一种用于抑制害虫的方法,该方法包括:
[0078]
a.使害虫或包含害虫的目标区域与容纳(例如包装有)融合体的(包装的)pvc针状复合物接触;
[0079]
b.其中融合体包含(或基本上由其组成)与有效载荷融合的pvc效应子前导序列(或换句话说,其中所述融合体由pvc效应子前导序列和有效载荷形成);
[0080]
c.其中所述有效载荷是选自多肽、核酸或其组合的一种或多种(优选多肽);和
[0081]
d.其中该融合体不同于pvc效应子蛋白(例如野生型pvc效应子蛋白)。
[0082]
术语“pvc针状复合物容纳效应子融合体”和“包含效应子融合体的pvc针状复合物”意指具有包装的效应子融合体的pvc针状复合物。
[0083]
术语“目标区域”是指存在害虫和/或可能(例如,预期或怀疑)存在害虫的区域。
[0084]
因此,在一个实施方案中,可以在存在害虫之前和/或存在害虫时接触目标区域。目标区域可以在害虫附近(例如,非常接近)。可替代地,目标区域可以是用户希望保护免受害虫影响的区域。例如,目标区域可以包括植物和/或植物产品。
[0085]
术语“遏制害虫”包括“害虫防治”、“抑制害虫生长”、“抑制害虫增殖”和/或“害虫死亡”。
[0086]
此类害虫的实例包括一种或多种昆虫、螨虫、猪蝽、大蝽、蜈蚣、软体动物、千足虫、原生生物、真菌、蠕虫和/或血源性寄生虫。害虫可以处于任何发育阶段,例如可以是幼虫和/或成年害虫(例如成虫)。
[0087]
本发明可用于靶向各种农业、商业、家庭和花园害虫。
[0088]
在一个实施方案中,害虫是昆虫、螨虫、猪蝽、大蝽、蜈蚣、软体动物和/或千足虫。合适地,害虫可以是昆虫和/或螨虫(优选昆虫)。
[0089]
合适的昆虫的实例包括鳞翅目(lepidoptera)、鞘翅目(coleoptera)、双翅目(diptera)、蜚蠊目(blattodea)、膜翅目(hymenoptera)、等翅目(isoptera)、直翅目(orthoptera)、缨尾目(thysanura)和/或革翅目(dermaptera)的昆虫。在一个实施方案中,鳞翅目的昆虫可以是蛾和/或蝴蝶中的一种或多种。合适的蛾包括烟草天蛾(manduca sexta)和/或大蜡螟(galleria mellonella)。
[0090]
在一个实施方案中,鞘翅目昆虫可以是欧洲金龟子蛴螬、北方伪装金龟子蛴螬、南方伪装金龟子蛴螬、日本甲虫蛴螬、六月甲虫蛴螬、黑藤象鼻虫、草莓根象鼻虫、粘土色象鼻虫、科罗拉多马铃薯甲虫和/或金针虫中的一种或多种。在另一个实施方案中,双翅目昆虫可以是长脚蝇的蛆(例如大蚊的幼虫)、洋葱蛆、卷心菜蛆、胡萝卜锈病蝇蛆、真菌幼虫和/或蚊子中的一种或多种。在另一个实施方案中,蜚蠊目昆虫可以是蟑螂,合适地选自美洲蟑螂和/或德国蟑螂的一种或多种蟑螂。
[0091]
在一个实施方案中,膜翅目昆虫可以是蚂蚁。合适地,蚂蚁可以是木蚁、有气味的
家蚁、铺道蚁、阿根廷蚁、法老蚁、黄褐色疯狂蚁、收获蚁、进口红火蚁、南方火蚁、欧洲火蚁和/或小火蚁中的一种或多种。在另一个实施方案中,膜翅目昆虫可以是黄蜂。
[0092]
在一个实施方案中,等翅目昆虫可以是白蚁。合适地,白蚁可以是湿木白蚁、干木白蚁和/或地下白蚁中的一种或多种。在另一个实施方案中,直翅目昆虫可以是蟋蟀、蝗虫和/或蝗虫中的一种或多种。在一个实施方案中,缨尾目昆虫可以是衣鱼。在另一个实施方案中,革翅目昆虫可以是蠼螋。
[0093]
合适的软体动物的实例包括蛞蝓和/或蜗牛。
[0094]
在一个实施方案中,害虫是原生生物。在一个实施方案中,所述原生生物是选自巨形变形虫(chaos carolinense)、变形阿米巴(amoeba proteus)、福氏内格里阿米巴原虫(naegleria fowleri)、盘基网柄菌(dictyostelium discoideum)、溶组织内阿米巴(entamoeba histolytica)、阴道毛滴虫(trichomonas vaginalis)、人芽囊原虫(blastocystis hominis)、利什曼原虫属(leishmania spp.)和兰伯贾第鞭毛虫giardia lamblia中的一种或多种。在一个实施方案中,所述原生生物是fonticula alba、盘基网柄菌(dictyostelium discoideum)、莱茵衣藻(chlamydomonas reinhardtii)、crytomonas paramedium、载色宝琳虫(paulinella chromatophora)、nannochloropsis gaditana和/或四膜虫属(tetrahymena spp.)的一种或多种。
[0095]
在一个实施方案中,害虫是真菌。在一个实施方案中,所述真菌是选自兔脑炎原虫(encephalitozoan cuniculi)、nasema apis、东方蜜蜂微孢子虫(namema ceranae)、vittaforma carneae、enterocytosoan bieneusi、spraguea lophii、vavra culiculis、edharzardia aedes、nematocida parisii、razella spp.、parasitella parasitica、lichteimia ramose、sporisorium scitamineum、变色栓菌(trametes versicolor)和/或粗环点革菌(punctularia strigosozonata)的一种或多种真菌。
[0096]
在一个实施方案中,所述真菌是假丝酵母属(candida spp.)。所述假丝酵母属可以是选自白色假丝酵母(c.albicans)、阿斯卡拉蚜假丝酵母(c.ascalaphidarum)、两栖假丝酵母(c.amphixiae)、南极假丝酵母(c.antarctica)、阿根廷假丝酵母(c.argentea)、大西洋假丝酵母(c.atlantica)、大气假丝酵母(c.atmosphaerica)、耳假丝酵母(c.auris)、钝顶假丝酵母(c.blattae)、凤梨假丝酵母(c.bromeliacearum)、嗜果假丝酵母(c.carpophila)、香芹假丝酵母(c.carvajaiis)、天牛假丝酵母(c.cerambycidarum)、查氏假丝酵母(c.chauliodes)、延胡索假丝酵母(c.corydalis)、多西假丝酵母(c.dosseyi)、都柏林假丝酵母(c.dubliniensis)、c.ergatensis、果实假丝酵母(c.fructus)、光滑假丝酵母(c.glabrata)、发酵假丝酵母(c.fermentati)、吉利蒙假丝酵母(c.guilliermondii)、希木龙假丝酵母(c.haemulonii)、扁平云假丝酵母(c.humilis)、昆虫门假丝酵母(c.insectamens)、昆虫假丝酵母(c.insectorum)、中型假丝酵母(c.intermedia)、杰弗里希假丝酵母(c.jeffresii)、乳酒假丝酵母(c.kefyr)、煤油假丝酵母(c.keroseneae)、克鲁斯氏假丝酵母(c.krusei)、葡萄牙假丝酵母(c.lusitaniae)、c.lyxosophila、麦芽糖假丝酵母(c.maltose)、海生假丝酵母(c.marina)、膜醭假丝酵母(c.membranifaciens)、蒙奇假丝酵母(c.mogii)、橄榄假丝酵母(c.oleophila)、俄勒冈假丝酵母(c.oregonensis)、近平滑假丝酵母(c.parapsilosis)、橡树假丝酵母(c.quercitrusa)、柱状假丝酵母(c.rugose)、清酒假丝酵母(c.sake)、休哈塔假丝酵母(c.shehatea)、c.temnochilae、纤维
假丝酵母(c.tenuis)、c.theae、c.tolerans、c.tropicalis(热带假丝酵母)、c.tsuchiyae、c.sinolaborantium、大豆假丝酵母(c.sojae)、c.subhashii、维斯假丝酵母(c.viswanathii)、产朊假丝酵母(c.utilis)、c.ubatubensis和/或泽普林假丝酵母(c.zemplinina)的一种或多种。合适地,所述假丝酵母属可以是白色假丝酵母。
[0097]
在另一个实施方案中,害虫是蠕虫。所述蠕虫可以是选自环节动物门(annelida)、扁形动物门(platyhelminthes)、线虫门(nematoda)和/或棘头动物门(acanthocephala)的一种或多种。在一个实施方案中,所述蠕虫是寄生性扁虫。所述寄生性扁虫可以是选自绦虫属(cestoda)、吸虫属(trematoda)和/或单殖吸虫属(monogenea)的一种或多种。在一个实施方案中,所述蠕虫是寄生性线虫。所述寄生性线虫可以是选自蛔虫(蛔虫属(ascaris))、丝虫、钩虫、蛲虫(蛲虫属(enterobius))和/或鞭虫(毛首鞭虫(trichuris trichiura))的一种或多种。
[0098]
在一个实施方案中,害虫是血源性寄生虫。所述血源性寄生虫可以是选自锥虫属(trypanosoma spp)(例如布氏锥虫(trypanosoma brucei)和/或克氏锥虫(t.cruzi))、巴贝虫属(babesia spp)(例如田鼠巴贝虫(babesia microti))、利什曼原虫属(leishmania spp)、疟原虫属(plasmodium spp)(例如恶性疟原虫(p.falciparum))和/或弓形虫属(toxoplasma spp)(例如刚地弓形虫(toxoplasma gondii)的一种或多种。
[0099]
用于害虫防治的pvc针状复合体合适地是环境安全的(例如环境安全的杀虫组合物)。
[0100]
其他有利的效用包括例如在实验室研究期间将有效载荷递送至细胞。这样的细胞可以是体外细胞系的一部分,或者可以是动物(例如研究动物模型)的细胞。另外地或可替代地,细胞可以包含在离体系统(例如类器官)内。
[0101]
本发明的另一个方面提供了用于将有效载荷递送到细胞中的体外(和/或离体)方法,所述方法包括:
[0102]
a.使细胞与(包装的)pvc针状复合物接触,所述pvc针状复合物包含(例如容难/包装有)效应子融合体;
[0103]
b.其中效应子融合体包含(或基本上由其组成)与有效载荷融合的pvc效应子前导序列(或换句话说,其中所述效应子融合体由pvc效应子前导序列和有效载荷形成);
[0104]
c.其中所述有效载荷是选自多肽、核酸或其组合的一种或多种(优选多肽);和
[0105]
d.其中该效应子融合体不同于野生型pvc效应子蛋白。
[0106]
本发明的一个方面提供了用于将有效载荷递送到细胞中的体外(和/或离体)方法,该方法包括:
[0107]
a.使细胞与容纳(例如包装有)融合体的(包装的)pvc针状复合物接触;
[0108]
b.其中融合体包含(或基本上由其组成)与有效载荷融合的pvc效应子前导序列(或换句话说,其中所述融合体由pvc效应子前导序列和有效载荷形成);
[0109]
c.其中所述有效载荷是选自多肽、核酸或其组合的一种或多种(优选多肽);和
[0110]
d.其中融合体不同于pvc效应子蛋白(例如野生型pvc效应子蛋白)。
[0111]
在一个方面中,本发明提供了效应子融合体,其包含(或基本上由其组成)与有效载荷融合的pvc效应子前导序列(或换句话说,由pvc效应子前导序列和有效载荷形成的效应子融合体);
[0112]
a.其中所述有效载荷是选自多肽、核酸或其组合的一种或多种;和
[0113]
b.其中该效应子融合体不同于野生型pvc效应子蛋白。
[0114]
本发明的一个方面提供了融合体,其包含(或基本上由其组成)与有效载荷融合的pvc效应子前导序列(或换句话说,由pvc效应子前导序列和有效载荷形成的融合体);
[0115]
a.其中所述有效载荷是选自多肽、核酸或其组合的一种或多种(优选多肽);和
[0116]
b.其中该融合体不同于pvc效应子蛋白(例如野生型pvc效应子蛋白)。
[0117]
在一个实施方案中,融合体/效应子融合体是分离的融合体/效应子融合体(例如分离的非天然存在的融合体/效应子融合体)。
[0118]
本发明包括包含编码融合体/效应子融合体的核苷酸序列的核酸,和/或包含所述核酸的表达载体。还包括包含所述核酸和/或表达载体的宿主细胞。
[0119]
如上所述,本发明人首次发现并实际利用了本文所述的前导序列。
[0120]
因此,本发明的另一个方面提供了分离的pvc效应子前导序列(例如,其中分离的pvc效应子前导序列能够将有效载荷包装到pvc针状复合物中)。
[0121]
在相关方面中,提供了分离的核酸,其包含编码pvc效应子前导序列的核苷酸序列。
[0122]
分离的pvc效应子前导序列可以是重组的、合成的和/或纯化的。编码pvc效应子前导序列的分离的核酸可以是重组的、合成的和/或纯化的。
[0123]
下面提供了关于本发明背景和本文使用的术语的更多详细内容。
[0124]
光杆状菌是肠杆菌属(enterobacteriace)的细菌,由三种正式公认的(迄今)物种为代表-即发光光杆状菌(p.luminescens)、不对称光杆状菌(p.asymbiotica)和温度光杆状菌(p.temperata)。重要的菌株包括不对称光杆状菌南极(australis)亚种和发光光杆状菌laumondii亚种。目前可用的基因组序列可在genbank上获得(不对称光杆状菌atcc43949完整基因组-genbank登录号:fm162591.1;photorhabdus laumondii laumondii亚种菌株tt01染色体,完整基因组-genbank登录号:cp024901.1)。
[0125]
提及“发光光杆状菌laumondii亚种”,在本文可与“发光光杆状菌laumondii亚种tt01”、“photorhabdus laumondii laumondii亚种菌株tt01”和“发光杆菌tt011”互换使用。
[0126]
wilkinson等描述了另一种不对称光杆状菌菌株,即不对称光杆状菌kingscliff的基因组序列(fems microbiology letters,volume 309,issue 2,2010年8月,第136-143页),其通过引用并入本文中。更多的基因组序列描述于thanwisai等(plos one 7(9):e43835),其通过引用并入本文中。
[0127]
这些物种中的每一种包含至少一个称为光杆状菌毒力盒(pvc)操纵子的操纵子,其编码pvc针状复合物,其在本文中可称为“纳米注射器”。鉴于光杆状菌通常在自然界中从(共生)昆虫病原性异小杆线虫属物种(heterorhabditis sp.)线虫回流后作为杀昆虫细菌被发现(例如为了避免与昆虫竞争食物和资源),可以理解pvc针状复合物在自然界中起到抑制昆虫的作用。实际上,已经显示出分离的pvc针状复合物(容纳/包装有天然效应子毒素,例如pnf)可用于杀死昆虫幼虫-参见实施例2。光杆状菌毒力盒代表至少四种充分表征的光杆状菌毒素递送系统中的一种。光杆状菌蛋白杀虫毒素的其他主要类别包括“毒素复合物”(tcs)、“二元pirab毒素”和“使毛虫松软”(mcf)毒素。
[0128]
术语“光杆状菌毒力盒”(pvc)(在本文中与术语“pvc操纵子”同义使用)意指光杆状菌基因组的离散操纵子,所述基因组包含编码多肽亚基的基因,所述多肽亚基在表达时组装以提供大分子pvc针状复合物。这些盒的分子结构已经得到充分表征和描述,例如在the molecular biology of photorhabdus bacteria(springer international publishing ag 2017,isbn:978-3-319-52714-7,第10章,第159-177页)中,通过引用并入本文中。pvc(操纵子)通常包含约16个编码结构蛋白的基因(pvd-pvc16),所述结构蛋白组装以提供“pvc针状复合物”,其通常随后是在3'末端的一个或多个基因,其编码具有毒性活性的pvc效应子基因(并且通常是典型的t3ss样效应子的同源物)。光杆状菌基因组通常包含多个这样的盒(例如至少四个),其通常与不同的效应子有效载荷或甚至多个效应子有效载荷相关联。
[0129]
已经在光杆状菌属和其他属的成员的基因组中观察到三类pvc结构操纵子(i、ii和iii类)。每个类别内的pvc在编码它们含有的结构蛋白的基因的数量和类型方面是相似的(参见图1(b))。更详细地,i类pvc(其在本文中可称为“原型pvc”)包含16个保守基因(pvc 1-16)。ii类缺少pvc13宿主细胞结合纤维和pvc3,(不希望受理论束缚)发明人认为其可能是将pvc13纤维蛋白附着到pvc针状复合物(纳米注射器)上的次要特化鞘亚基。因此,认为该类别可以是“非特异性的”,将有效载荷注射到多种(潜在的任何)细胞类型中。iii类类似于i类,但在(未知功能)操纵子的起始处具有另外的pvc0基因,以及在pvc13和pvc14之间编码的两个另外的基因,其类似于“侵袭”型蛋白基因。该类别通常见于光杆状菌属的人临床分离菌株中-发明人已经表明,菌株(携带编码pvc iii类操纵子的pvc操纵子)在37℃下生长并暴露于人血清时,可能发生pvc iii类的最佳转录,表明该类别可能是pvc针状复合物的哺乳动物适应形式。
[0130]
图1(d)中显示了示例性盒(pvc),其显示了不对称光杆状菌atcc43949(可从atcc获得,登录号:atcc 43949)的模型“i类”pvc操纵子的图谱,所述操纵子与下游效应子基因“pau_03332”(编码pnf蛋白效应子,例如seq id no.:32)相关。这种模型操纵子称为pa
atcc43949
pvcpnf。这个操纵子包含十六个个结构基因(pvc1-16)和两个编码效应子的基因(3'末端)(在这种情况下,为pvc17/rhs样,编码rhs样效应子,和pvc21,编码pnf效应子)。所述基因pvc1-16对应于genbank登录号fm 162591.1的序列的基因pau_03353至pau_03338,并且由seq id no.:93的序列来表示。
[0131]
实例pvc操纵子(例如编码结构基因,但不编码pvc效应子)在seq id no:93(其编码图1(d)中示意性地显示的操纵子)中提供,其他实例是seq id no:94和seq id no:95。这些序列在pvc盒/操纵子的第一个结构基因(pvc1)的atg起始密码子处开始,并且在最终结构基因(pvc16)的taa终止密码子处结束。
[0132]
来自类别i-iii中任一类别的pvc针状复合物可用于各种应用。然而,某种类别的pvc针状复合物可能特别适合于递送至限定的细胞类型。例如,用于将有效载荷递送至哺乳动物细胞的pvc针状复合物可以合适地是iii类成员。用于将有效载荷递送至昆虫细胞(例如递送至昆虫)的pvc针状复合物可以合适地是i类成员(例如由seq id no.:93编码的不对称光杆状菌pvcpnf,例如在大肠杆菌中从粘粒克隆表达)。
[0133]
因此,如本领域技术人员将理解的,术语“pvc针状复合物”(在本文中与术语“pvc针状复合物递送系统”和“纳米注射器”同义使用)意指包含由光杆状菌属细菌的pvc(操纵
子)编码的多肽亚基的大分子蛋白复合物。pvc针状复合物以纳米注射器结构组装,具有与抗菌r型绿脓菌素类似的物理结构(表面上)(参见图3)。功能和分子研究表明,pvc针状复合物包装有(载有)一种或多种pvc效应子蛋白(即,pvc效应子蛋白被包装在其中或其上),包装的pvc针状复合物从细菌释放,然后将pvc效应子注射到靶细胞中,使得pvc效应子蛋白可以发挥毒性。
[0134]
术语“pvc针状复合物”优选涵盖由操纵子编码的pvc针状复合物样结构/复合物,所述操纵子包含与光杆状菌pvc操纵子的基因同源的基因。pvc样元件不限于光杆状菌,并且在昆虫病原细菌嗜虫沙雷氏菌(serratia entomophila)的padap质粒上存在充分表征的同源操纵子(pvc操纵子)。此外,细菌藤黄假单胞菌(pseudoaiteromonas luteoviolacea)采用类似的和(至少部分)同源的pvc样“注射体”针状复合物系统(例如用于控制海洋蠕虫秀丽水蚤(hydroides elegans)的变态)。结构存在于其他肠杆菌科(如耶尔森氏菌属(yersinia spp.))中,其由与pvc操纵子具有同源性的操纵子编码,并且可以与本文所述的前导序列一起使用。这些(pvc样)结构中的每一种都包含在本文所用的术语“pvc针状复合物”中。
[0135]
因此,pvc针状复合物是“纳米注射器”复合物,其中由效应子基因编码的多肽被包装(负载)在pvc针状复合物内或在pvc针状复合物的末端(尖端)处,因此代表pvc针状复合物的“有效载荷”或“弹头”。本发明人已经证明,在与靶细胞的膜相互作用并将有效载荷注射到细胞胞质中前,pvc针状复合物本身(具有仍然负载的有效载荷)从光杆状菌细胞自由释放(例如分泌)。实际上,在分离/纯化pvc针状复合物并使用它们抑制(例如杀灭)昆虫幼虫之前,发明人已经成功地在异源表达系统中表达和负载pvc针状复合物(参见实施例2)。因此,pvc针状复合物充当长程蛋白质递送系统。
[0136]
在一个实施方案中,pvc针状复合物由与选自seq id no.:93、seq id no.:94和seq id no.:95的序列(例如,seq id no.:93)具有至少75%序列同一性(优选至少85%序列同一性;更优选至少95%序列同一性)的序列编码。
[0137]
在一个实施方案中,pvc针状复合物由选自seq id no.:93、seq id no.:94和seq id no.:95的序列(例如,seq id no.:93)编码。
[0138]
前导序列/信号序列通常是肽,通常为10-30个氨基酸长,存在于大多数(新)表达的蛋白质的n-末端,其注定走向分泌途径(例如,用于将所述蛋白质引导至细胞膜上的蛋白质传导通道)。许多蛋白质需要进入高尔基体或内质网的信号序列。
[0139]
在本文的“pvc效应子前导序列”的内容中使用的术语“前导序列”(在本文中与术语“前导肽”、“信号序列”、“靶向信号”、“定位信号”、“定位序列”和“转运肽”可互换使用)意指用于将pvc效应子指引到pvc针状复合物的内部或末端(尖端)中的多肽序列-因此,前导序列用于将pvc效应子包装到pvc针状复合物中。pvc针状复合物随后可以将pvc效应子递送(例如注射)到靶细胞中。pvc针状复合物可以是组装的pvc针状复合物。术语“pvc针状物复合物”可以指pvc针状物复合物的片段(例如,其中前导序列接触所述片段,并且任选地pvc针状物复合物围绕前导序列-有效载荷“效应子融合体”组装)。
[0140]
pvc前导序列通常存在于pvc效应子或其同系物的n-末端(特征在于头50个氨基酸或包含在头50个氨基酸内)。然而,本发明包括pvc效应子和pvc效应子同源物的前导序列,其可以在除此类pvc效应子/同源物的n-末端区域之外的区域中(例如在c-末端区域中)被
发现。
[0141]
在一个实施方案中,前导序列包含(或基本上由其组成)pvc效应子(例如pvc效应子蛋白)的氨基酸残基1-50。提及“氨基酸残基1-50”包括“氨基酸残基2-50”,其中n-末端甲硫氨酸被省略,例如已被切割。前导序列可以是pvc效应子的n-末端50个氨基酸的片段(例如,包含≤45、≤35、≤25或≤15个氨基酸的片段或基本上由其组成的片段),条件是该片段能够将有效载荷包装到pvc针状复合物中。
[0142]
在一个实施方案中,本发明的前导序列(例如,分离的前导序列)包含(或基本上由其组成)与选自seq id no.:47-seq id no.:92的一个或多个序列(优选seq id no.:50、seq id no.:68、seq id no.:71、seq id no.:76、seq id no.:78或seq id no.:92)具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%序列同一性的氨基酸序列-例如条件是前导序列能够将有效载荷包装到pvc针状复合物中。在一个优选的实施方案中,前导序列包含(或基本上由其组成)与选自seq id no.:47-seq id no.:92的一个或多个序列(优选seq id no.:50、seq id no.:68、seq id no.:71、seq id no.:76、seq id no.:78或seq id no.:92)具有至少60%序列同一性的氨基酸序列-例如条件是前导序列能够将有效载荷包装到pvc针状复合物中。在更优选的实施方案中,前导序列包含(或基本上由其组成)选自seq id no.:47-seq id no.:92的一个或多个的氨基酸序列(优选seq id no.:50、seq id no.:68、seq id no.:71、seq id no.:76、seq id no.:78或seq id no.:92)。在一个实施方案中,前导序列包含(或基本上由其组成)选自seq id no.:47-seq id no.:92的氨基酸序列(优选seq id no.:50、seq id no.:68、seq id no.:71、seq id no.:76、seq id no.:78或seq id no.:92)。
[0143]
在一个实施方案中,前导序列包含(或基本上由其组成)选自seq id no.:50、seq id no.:68、seq id no.:71、seq id no.:76、seq id no.:78和seq id no.:92的氨基酸序列。
[0144]
在一个实施方案中,前导序列包含seq id no.:50的氨基酸序列(或基本上由其组成)。在一个实施方案中,前导序列包含seq id no.:68的氨基酸序列(或基本上由其组成)。在一个实施方案中,前导序列包含seq id no.:71的氨基酸序列(或基本上由其组成)。在一个实施方案中,前导序列包含seq id no.:76的氨基酸序列(或基本上由其组成)。在一个实施方案中,前导序列包含seq id no.:78的氨基酸序列(或基本上由其组成)。在一个实施方案中,前导序列包含seq id no.:92的氨基酸序列(或基本上由其组成)。
[0145]
不希望受理论束缚,认为前导序列基于氨基酸性质共享“化学组成共有序列”。更具体地,前导序列包含相似的电荷模式,该模式包含2
×
个带负电荷的区域,每个之后是带正电荷的区域(例如[-ve][ ve][-ve][ ve])-参见图9。这与2型分泌系统的毒素的前导序列一致,其包含[ ve][疏水性][ ve][c]的电荷/性质模式。进一步的理论认为前导序列共享典型的“螺旋-转角-螺旋”结构。另一种理论是前导序列形成由存在于pvc针状复合物内部或末端(例如尖端)的atp酶(例如由图1(d)的模型操纵子中的基因pau_03339(pvc15)编码)识别的结构。
[0146]
术语“pvc效应子”(与术语“pvc操纵子编码的效应子”和“pvc效应子蛋白”同义使用)意指由光杆状菌pvc操纵子编码的效应子多肽,更特别地(并且通常)在所述操纵子的结构基因的下游(3')不远处被发现(优选地在pvc16的下游的不远处或就在pvc16的下游,并
且通常在5kb内)。术语“pvc效应子”优选包括其同系物。因此,前导序列也可以来自由编码pvc效应子的基因的同源物的基因编码的多肽-这类同源物的实例参见表1。实际上,通过检测pvc16下游基因与已知毒素多肽(例如编码所述毒素多肽的基因)的同源性来辅助pvc效应子的鉴定。如本领域技术人员将理解的,术语“同源物”优选意指源自相同祖先基因并且共享相似功能的基因-这样的基因(或由其编码的多肽)与编码pvc效应子的基因同源。同源物可以来自光杆状菌属物种的基因组或来自光杆状菌属物种以外的物种。合适的同源物的实例概述于表1中。
[0147]
本发明人已经详细阐明和表征了在光杆状菌属的三种最常见(最佳表征的)菌株以及不对称光杆状菌泰国菌株pb68.1中编码这些pvc针状复合物的pvc效应子的基因。这是基于分析遗传连锁与操纵子的pvc结构基因的3'端的接近性以及效应子(例如已知效应子/毒素蛋白的同源物)的蛋白质序列的预测功能来进行的。更详细地,pvc效应子(例如编码pvc效应子的基因)通常被鉴定为与编码已知毒素多肽的基因(例如表1中概述的同源物)具有同源性的开放阅读框(orf),并且通常存在于pvc操纵子(例如pvc16)的最终结构基因下游1千碱基至5千碱基(kb)的距离内(例如1kb内)(通常具有很少或没有间插基因)。通常,在操纵子末端(编码pvc针状复合物)和pvc效应子基因之间没有“非毒素样”orf。尽管在这些区域中可能存在(例如一个或两个)其他小的预测基因,但这些其他基因不被指定为pvc效应子(由于与已知的效应子/毒素基因缺乏同源性,如上所述)。
[0148]
为了将推定的pvc效应子基因(例如在5kb的距离内的orf,例如在pvc操纵子的最终结构基因下游1kb内)指定为pvc效应基因,发明人使用了blastp和hhpred(https://toolkit.tuebingen.mpg.de/#/tools/hhpred)的组合。基于与已知毒素编码基因的直接同源性、与毒素蛋白家族的相似性、与pvc操纵子的接近性(例如在pvc操纵子pvc16的最终结构基因下游1-5kb内)和/或基于预测的二级结构与已知毒素的二级结构的结构域相似性,将推定的pvc效应子基因指定为pvc效应子基因。
[0149]
因此,可以通过(i)鉴定pvc16(例如通过与已知pvc16的序列同源性),(ii)鉴定pvc16的3'orf,优选pvc16下游≤5kb),和(iii)通过鉴定与编码毒素多肽(例如,表1中标记为“同源物”的列中描述的毒素蛋白)的已知基因的序列同源性来确认所述orf编码pvc效应子来鉴定(在光杆状菌属基因组内的)pvc效应子(基因)。
[0150]
举例来说,pvc效应子基因pau_03337(由于与毒力sep基因同源,在本文中称为“sepc”)位于pvc操纵子的pvc16(pau_03338)下游的325个碱基对(bp)处,所述pvc操纵子在本文中称为pvcpnf(例如seq id no.93的),其存在于不对称光杆状菌atcc43949中。也就是说,pau_03337的起始密码子开始于pau_03338的终止密码子末端下游325bp。
[0151]
这可以通过参考可通过genbank登录号fm162591.1获得的不对称光杆状菌atcc43949完整基因组来说明(还参见例如wilkinson等,bmc genomics 10,文章号:302(2009),通过引用并入本文中),其中效应子基因pau_03337被注释为如下位于基因组中:补体(3913237..3914247)-即,在核苷酸位置3913237..3914247;并且pau_03338注释为如下位于基因组中:补体(3914573..3915454)。在这两个基因之间没有发现其他orf(编码效应子或其他)。
[0152]
与pvc操纵子相关的另一个pvc效应子基因在本文中称为pvcpnf(例如seq id no.93),即pau_03332(在本文中称为“pnf”),位于pvc16(pau_03338)的下游3535bp处。
[0153]
pvc效应子基因pau_02095(由于与毒性rhs毒素基因同源,在本文中称为“rhs样毒素效应子”)位于存在于不对称光杆状菌atcc43949中的在本文中称为pvclopt(例如seq id no.94的)的pvc操纵子的pvc16(pau_02099)的下游3961bp处。也就是说,pau_02095的起始密码子开始于pau_02099的终止密码子末端下游3961bp。
[0154]
在再一个实例中,基因pau_02009的pvc效应子(由于预测的作为细胞周期抑制因子/atp/gtp结合蛋白的功能,在本文中称为“cif”)位于在不对称光杆状菌atcc43949中发现的相关pvc操纵子(在本文中称为pvccif)的pvc16(pau_02008)下游157bp处。
[0155]
在更进一步的实例中:关于发光光杆状菌tt01的pvc操纵子(在本文中称为pvcunit4操纵子),pvc效应子基因“pvc17”(例如“plu1651”)位于pvc16(基因“plu1655”)下游104bp处;且关于温度光杆状菌temperata亚种的pvc操纵子meg1(在本文中称为pvccif操纵子),pvc效应子基因“cif毒素效应子”(例如meg1 draft_03529)位于相关pvc16基因下游4216bp处。
[0156]
这些实施例说明编码pvc效应子的基因通常位于pvc操纵子(例如pvc16)的最终基因下游≤5kb的距离内,更通常位于pvc操纵子的最终基因下游≤1kb的距离内。
[0157]
总之,在这四种菌株中已经鉴定了46种pvc效应子(基于当前可用的序列数据)(参见表1)。这些pvc效应子中的每一种的头50个氨基酸代表(或涵盖)其内源性前导序列,并且发明人已经证明了前导序列可以克隆并融合至多种有效载荷以包装到pvc针状复合物中-参见实施例3和4。因此,pvc效应子(翻译时)包含至少两个主要结构域:前导序列(氨基酸1至50)和实际效应子多肽(氨基酸51至c-末端氨基酸)-其后者在本文中可称为“效应子”(例如“效应子部分”)或“有效载荷”。
[0158]
尽管光杆状菌基因组序列持续被修改,但是这个pvc效应子基因的综合列表代表了对此类效应子的全面描述,并且是基于目前可获得的最常见(最佳表征的)光杆状菌菌株的序列数据,并且为技术人员提供了对术语“pvc效应子”以及这些pvc效应子的序列(以及如何搜索/挖掘更多的pvc效应子,例如在替代(基因组)序列中)的理解。如上所述,发明人已经发现了pvc效应子蛋白包含前导序列,其对于引导pvc效应子蛋白(例如有效载荷)被包装/负载到pvc针状复合物中是必需的(并且足够的)。
[0159]
表1
[0160]
[0161]
[0162]
[0163]
id no:33)、plu1651(seq id no:34)、plu1671(seq id no:35)、plu1672(seq id no:36)、plu1690(seq id no:37)、plu1691(seq id no:38)、plu1712(seq id no:39)、plu1713(seq id no:40)、plu1714(seq id no:41)、plu2400(seq id no:42)、plu2401(seq id no:43)、plu2514(seq id no:44)、plu2515(seq id no:45)、plu1649(seq id no:46)或其组合。如上所述,这些基因名称对应于可通过genbank获得的光杆状菌基因组序列中pvc效应子基因的“基因座标签”。pat和pak基因座标签由本发明的发明人生成,使得术语与公众可获得的基因组序列的pau和plu基因座标签一致。
[0170]
因此,pvc效应子可以由上述一个或多个基因编码。
[0171]
在一个实施方案中,pvc效应子由选自以下的一个或多个基因编码(括号中为编码的pvc效应子蛋白的seq id no):pak_02075(seq id no:4)、pau_02009(seq id no:22)、pau_02096(seq id no:25)、pau_02806(seq id no:30)、pau_03332(seq id no:32)、plu1651(seq id no:34)、plu1649(seq id no:46)或其组合。
[0172]
在优选实施方案中,pvc效应子由选自以下的一个或多个基因编码(括号中为编码的pvc效应子蛋白的seq id no):pau_02806(seq id no:30)、pau_03332(seq id no:32)、plu1651(seq id no:34)、plu1649(seq id no:46)或其组合。
[0173]
pvc效应子可以具有与选自seq id no:1-seq id no:46的氨基酸序列具有至少80%序列同一性(优选至少90%序列同一性;更优选100%序列同一性)的序列。例如,pvc效应子可以具有与选自seq id no:22-seq id no:46的氨基酸序列具有至少80%序列同一性(优选至少90%序列同一性;更优选100%序列同一性)的序列。
[0174]
本发明的发明人已经将gogb1(pau_02806)和pnf(pau_03332)pvc效应子的前导序列鉴定为在将(融合的)有效载荷包装到pvc针状复合物中特别有效。在一个实施方案中,pvc效应子由pau_02806编码(例如具有seq id no:30的氨基酸序列)。在一个实施方案中,pvc效应子由pau_03332编码(例如具有seq id no:32的氨基酸序列)。
[0175]
在一个实施方案中,pvc效应子包含(或基本上由其组成)选自seq id no:1-seq id no:46(例如seq id no:22-seq id no:46)的一个或多个的氨基酸序列,或其组合。例如,pvc效应子可以包含(或基本上由其组成)选自seq id no:4、seq id no:22、seq id no:25、seq id no:30、seq id no:32和seq id no:46的序列。
[0176]
在一个实施方案中,pvc效应子包含(或基本上由其组成)seq id no.:4的氨基酸序列。在一个实施方案中,pvc效应子包含(或基本上由其组成)seq id no.22的氨基酸序列。在一个实施方案中,pvc效应子包含(或基本上由其组成)seq id no.25的氨基酸序列。在一个实施方案中,pvc效应子包含(或基本上由其组成)seq id no:30的氨基酸序列。在一个实施方案中,pvc效应子包含(或基本上由其组成)seq id no:32的氨基酸序列。在一个实施方案中,pvc效应子包含(或基本上由其组成)seq id no.46的氨基酸序列。
[0177]
术语“包装”(与术语“反式包装”和“负载”同义使用)意指通过本发明的前导序列(有效载荷与其连接/融合)将有效载荷引导到组装的pvc针状复合物的内部或末端(尖端)中,使得pvc针状复合物随后配置成用于将有效载荷递送(例如注射)到靶细胞中。因此,有效载荷可以包装在pvc针状复合物内,或者可以包装在pvc针状复合物的末端(或尖端)(例如,有效载荷的至少一部分可以在pvc针状复合物的外部)。
[0178]
术语“有效载荷”(在本文中与术语“弹头”同义使用)意指包装到组装的pvc针状复
合物的内部或末端(尖端)中,并且随后递送(例如注射)到(靶)细胞中的分子。在野生型光杆状菌中,有效载荷是pvc效应子(更具体地,所述pvc效应子的效应子部分),由pvc操纵子的结构基因下游(3')的基因编码(如上所述)。例如,参见图1(d)的模型pvc操纵子,其具有编码腺苷酸环化酶效应子(例如seq id no.:33)的效应子基因pau_03337(列为pvcpnf 17);和编码pnf效应子(例如seq id no.:32)的pau_03332(列为pvcpnf 21)。
[0179]
本发明的前导序列和有效载荷形成“不同于(例如野生型)pvc效应子”(例如由表1中概述的基因之一编码的多肽)的“效应子融合”(或简称“融合”)。例如,效应子融合体可以是嵌合体,其由来自第一pvc效应子的前导序列融合到第二(不同的)pvc效应子(的效应子部分)(优选所述第二pvc效应子的氨基酸51至c末端氨基酸)形成,其中所述第一pvc效应子和所述第二pvc效应子是不同的。效应子融合体可以是嵌合体,其包含(或基本上由其组成)与非pvc效应多肽融合的本文所述的前导序列。效应子融合体可以是嵌合体,其包含(或基本上由其组成)与非光杆状菌属多肽融合的本文所述的前导序列。效应子融合体可以是前导序列-核酸融合体(优选缀合物),其包含与核酸融合的本文所述的前导序列。
[0180]
效应子融合体不限于包含与毒性有效载荷融合的前导序列的融合复合体(例如前导序列可以与治疗性有效载荷融合)。因此,如在“效应子融合体”的内容中使用的术语“效应子”意指包装到pvc针状复合物中的有效载荷(其可以提供各种作用,包括产毒和/或治疗效果)。因此,术语“效应子融合体”可与本文中的术语“融合体”互换使用。
[0181]
术语“效应子融合体”可以与术语“前导序列-有效载荷融合体”和/或“前导序列-有效载荷复合体”同义使用。
[0182]
可选地或另外地,有效载荷可以不同于pvc效应子蛋白(例如,不同于pvc效应子的氨基酸51至c-末端氨基酸)。例如,有效载荷可以是在野生型光杆状菌属细菌中未发现的多肽或核酸。
[0183]
对由光杆状菌编码的各种天然pvc效应子有效载荷的大小(例如多肽长度)和结构的分析显示,存在多种不同的pvc效应子长度和结构,证明本发明的pvc针状复合物递送系统的适用性不受目标有效载荷的大小或性质的限制。总之,不需要特定的二级结构、生物物理性质或货物长度,证实pvc针状复合物可以用作通用多功能递送载体。
[0184]
有效载荷可以是选自多肽(例如多肽有效载荷)、核酸(例如核酸有效载荷)的一种或多种,或其组合。在优选实施方案中,有效载荷是多肽。
[0185]
多肽有效载荷的实例包括抗体(例如抗mdm抗体)、纳米抗体、肽疫苗(例如酪氨酸酶相关蛋白2(trp2)肽疫苗)、核因子-κb抑制剂、t3ss有效载荷(例如抑制nf-κb和/或mapk途径的t3ss有效载荷)、抗凋亡肽(例如bh4)、烟酰胺腺嘌呤二核苷酸醌内部氧化还原酶(ndi1)、phox复合物亚基、肌管蛋白、核酸(优选dna)修饰酶或其组合。合适的核酸修饰酶的实例包括重组酶(例如cre重组酶)、转座酶、cas酶(例如cas9)和/或mad7(优选mad7,更优选cre重组酶)。有效载荷可以是例如tbid(seq id no.:109)和/或baxbh3肽(aa59-73)(seq id no.:111)。
[0186]
具有酶活性的任何多肽可以是有效载荷。
[0187]
核酸有效载荷可以与本发明的前导序列缀合/交联。例如,无铜点击化学(例如应变促进的叠氮炔环加成(spaac))可用于将核酸与前导序列交联。核酸有效载荷的实例包括引物、mrna、核酸类似物、适体、小干扰rna(sirna)、微rna治疗抑制剂(antimir)、微rna治疗
模拟物(promir)、长非编码rna调节剂、单指导rna(sgrna)或其组合。
[0188]
前导序列可以直接或间接(例如通过间隔区)与有效载荷融合。前导序列可以与有效载荷共价或非共价融合。在优选实施方案中,前导序列与有效载荷共价融合。例如,融合体/效应子融合体可以是(重组)融合蛋白,其包含(或基本上由其组成)与(多肽)有效载荷融合的pvc效应前导序列。
[0189]
本发明的另一个方面提供了分离的核酸,其包含编码本发明的pvc效应子前导序列的核苷酸序列。本发明的另一个方面提供了分离的核酸,其包含编码本发明的效应子融合体(例如融合体)的核苷酸序列,和任选编码pvc针状复合物的核苷酸序列。
[0190]
本发明的另一个方面提供了表达载体,其包含:核酸(优选分离的核酸),所述核酸包含编码本发明的pvc效应子前导序列的核苷酸序列的。本发明的另一个方面提供了表达载体,其包含:核酸(优选分离的核酸),所述核酸包含编码本发明的效应子融合体(例如融合体)的核苷酸序列,和任选编码pvc针状复合物的核苷酸序列。
[0191]
本发明的另一个方面提供了包含分离的核酸的宿主细胞,所述分离的核酸包含编码本发明的pvc效应子前导序列的核苷酸序列。本发明的另一个方面提供了包含分离的核酸的宿主细胞,所述分离的核酸包含编码本发明的效应子融合体(例如融合体)的核苷酸序列,以及任选编码pvc针状复合物的核苷酸序列。
[0192]
术语“核酸”可以与术语“多核苷酸”同义使用。
[0193]
本发明的另一个方面提供了包含表达载体的宿主细胞,所述表达载体包含编码本发明的pvc效应子前导序列的核苷酸序列。本发明的另一方面提供了包含表达载体的宿主细胞,所述表达载体包含编码本发明的效应子融合体(例如融合体)的核苷酸序列,以及任选编码pvc针状复合物的核苷酸序列。
[0194]
所述宿主细胞可以是哺乳动物细胞、昆虫细胞、酵母细胞、细菌细胞(例如大肠杆菌)或植物细胞。在优选的实施方案中,宿主细胞是细菌细胞(优选大肠杆菌)。
[0195]
在一个实施方案中,宿主细胞是光杆状菌属细胞,任选其中光杆状菌属细胞包含与诱导型启动子可操作地连接的pvc操纵子(例如参见实施例3)。pvc操纵子对于光杆状菌属细胞可以是内源性的(例如,pvc操纵子可以是pvcu4)。合适地,光杆状菌属细胞可以从atcc以登录号atcc 29999获得。
[0196]
本发明的序列(例如前导序列和/或核酸序列)包括已经从其天然存在的环境中取出的序列、重组或克隆(例如dna)的分离物,以及化学合成的类似物或由异源系统生物合成的类似物。
[0197]
本发明的前导序列和/或多核苷酸可以通过本领域已知的任何方法制备。例如,可以通过在合适的宿主细胞中复制和/或表达来产生大量的前导序列和/或多核苷酸。通常将编码所需片段的天然或合成dna片段结合到能够引入原核或真核细胞中并在其中复制的重组核酸构建体(通常是dna构建体)中。通常,dna构建体将适合于在单细胞宿主(如酵母或细菌)中自主复制,但也可以用于引入并整合到培养的细菌、昆虫、哺乳动物、植物或其他真核细胞系的基因组中。
[0198]
本发明的前导序列和/或多核苷酸也可以通过化学合成来产生,例如通过亚磷酰胺方法或三酯方法产生多核苷酸,并且可以在商业自动化寡核苷酸合成仪上进行。双链(例如dna)片段可以通过合成互补链并在适当的条件下将链退火在一起或通过使用dna聚合酶
与适当的引物序列添加互补链而从化学合成的单链产物获得。
[0199]
应用于前导序列或核酸序列时,在本

技术实现要素:
中的术语“分离的”表示前导序列和/或多核苷酸序列已从其天然遗传环境中取出,因此不含其他外来或不需要的编码序列(但可以包括天然存在的5'和3'非翻译区,如启动子和终止子),并且是以适用于基因工程化蛋白质生产系统的形式。此类分离的分子是从其天然环境中分离的分子。
[0200]
序列同源性
[0201]
可以使用多种序列比对方法中的任一种来确定同一性百分比,包括但不限于全局方法、局部方法和杂交方法,如,例如,区段逼近方法。确定同一性百分比的方案是本领域技术人员范围内的常规程序。全局方法从分子的开始到结束比对序列,并通过将各个残基对的得分相加并通过施加缺口罚分来确定最佳比对。非限制性方法包括例如clustal w,参见例如julie d.thompson等,clustal w:improving the sensitivity of progressive multiple sequence alignment through sequence weighting,position-specific gap penalties and weight matrix choice,22(22)nucleic acids research 4673-4680(1994);和迭代精修,参见例如significant improvement in accuracy of multiple protein.sequence alignments by iterative refinement as assessed by reference to structural alignments,264(4)j.moi.biol.823-838(1996)。局部方法通过鉴定由所有输入序列共享的一个或多个保守基序来比对序列。非限制性方法包括例如匹配框,参见例如eric depiereux和ernest feytmans,match-box:a fundamentally new algorithm for the simultaneous alignment of seumber protein sequences,8(5)cabios 501-509(1992);gibbs取样,参见例如c.e.lawrence等,detecting subtle sequence signals:a gibbs sampling strategy for multiple alignment,262(5131)science 208-214(1993);align-m,参见例如ivo van walle等,align-m-a new algorithm for multiple alignment of highly divergent sequences,20(9)bioinformatics:1428-1435(2004)。
[0202]
因此,通过常规方法测定序列同一性百分比。参见,例如,altschul等bull.math.bio.48:603-16,1986以及henikoff和henikoff,proc.natl.acad.sci.usa 89:10915-19,1992。简而言之,使用缺口开放罚分10、缺口延伸罚分1和如下所示的henikoff和henikoff(同上)的“blosum 62”评分矩阵(氨基酸由标准单字母代码表示)比对两个氨基酸序列以优化比对评分。
[0203]
两个或更多个核酸或氨基酸序列之间的“序列同一性百分比”是序列共有的相同位置的数目的函数。因此,%同一性可以计算为相同核苷酸/氨基酸的数目除以核苷酸/氨基酸的总数,乘以100。序列同一性%的计算还可以考虑缺口的数量,以及需要引入以优化两个或更多个序列的比对的每个缺口的长度。序列比较和两个或更多个序列之间的同一性百分比的确定可以使用本领域技术人员熟悉的特定数学算法(例如blast)进行。
[0204]
用于确定序列同一性的比对评分
[0205][0206][0207]
然后将同一性百分比计算为:
[0208][0209]
基本上同源的多肽的特征在于具有一个或多个氨基酸取代、缺失或添加。这些变化优选具有次要性质,即保守氨基酸取代(参见下文)和不显著影响多肽的折叠或活性的其他取代;小缺失,通常为1至约30个氨基酸;和小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基、多达约20-25个残基的小接头肽,或亲和标签。
[0210]
保守氨基酸取代
[0211]
碱性:精氨酸、赖氨酸、组氨酸
[0212]
酸性:谷氨酸、天冬氨酸
[0213]
极性:谷氨酰胺、天冬酰胺
[0214]
疏水性:亮氨酸、异亮氨酸、缬氨酸
[0215]
芳香族:苯丙氨酸、色氨酸、酪氨酸
[0216]
小的:甘氨酸、丙氨酸、丝氨酸、苏氨酸、甲硫氨酸
[0217]
除了20种标准氨基酸之外,非标准氨基酸(如4-羟基脯氨酸、6-n-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代本发明多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代多肽氨基酸残基。本发
明的多肽还可以包含非天然存在的氨基酸残基。
[0218]
非天然存在的氨基酸包括但不限于反式-3-甲基脯氨酸、2,4-亚甲基-脯氨酸、顺式-4-羟基脯氨酸、反式-4-羟基-脯氨酸、n-甲基甘氨酸、别苏氨酸、甲基-苏氨酸、羟基-乙基半胱氨酸、羟基乙基高半胱氨酸、硝基-谷氨酰胺、高谷氨酰胺、哌啶酸、叔亮氨酸、正缬氨酸、2-氮杂苯丙氨酸、3-氮杂苯丙氨酸、4-氮杂苯丙氨酸和4-氟苯丙氨酸。本领域已知用于将非天然存在的氨基酸残基结合到蛋白质中的几种方法。例如,可以采用体外系统,其中使用化学氨基酰化的抑制剂trna抑制无义突变。用于合成氨基酸和氨酰化trna的方法是本领域已知的。含有无义突变的质粒的转录和翻译在包含大肠杆菌s30提取物和市售酶和其他试剂的无细胞系统中进行。通过色谱法纯化蛋白质。参见,例如,robertson等,j.am.chem.soc.113:2722,1991;ellman等,methods enzymol.202:301,1991;chung等,science 259:806-9,1993;和chung等,proc.natl.acad.sci.usa 90:10145-9,1993。在第二种方法中,通过微注射突变的mrna和化学氨基酰化的抑制剂trna在非洲爪蟾卵母细胞中进行翻译(turcatti等,j.biol.chem.271:19991-8,1996)。在第三种方法中,在不存在待替代的天然氨基酸(例如苯丙氨酸)和存在所需的非天然存在的氨基酸(例如2-氮杂苯丙氨酸、3-氮杂苯丙氨酸、4-氮杂苯丙氨酸或4-氟苯丙氨酸)的情况下培养大肠杆菌细胞。将非天然存在的氨基酸结合到多肽中以代替其天然对应物。参见,koide等,biochem.33:7470-6,1994。天然存在的氨基酸残基可以通过体外化学修饰转化为非天然存在的种类。化学修饰可以与定点诱变组合以进一步扩大取代范围(wynn和richards,protein sci.2:395-403,1993)。
[0219]
有限数量的非保守氨基酸、不由遗传密码编码的氨基酸、非天然存在的氨基酸和非天然氨基酸可以取代本发明多肽的氨基酸残基。
[0220]
本发明的多肽中的必需氨基酸可以根据本领域已知的程序鉴定,如定点诱变或丙氨酸扫描诱变(cunningham和wells,science 244:1081-5,1989)。生物相互作用的位点也可以通过结构的物理分析来确定,如通过诸如核磁共振、晶体学、电子衍射或光亲和标记的技术结合推定的接触位点氨基酸的突变来确定。参见,例如de vos等,science 255:306-12,1992;smith等,j.mol.biol.224:899-904,1992;wlodaver等,febs lett.309:59-64,1992。还可以从与本发明多肽的相关组分(例如易位或蛋白酶组分)的同源性分析推断必需氨基酸的身份。
[0221]
可以使用已知的诱变和筛选方法进行和测试多个氨基酸取代,如reidhaar-olson和sauer(science 241:53-7,1988)或bowie和sauer(proc.natl.acad.sci.usa 86:2152-6,1989)公开的那些。简而言之,这些作者公开了用于同时随机化多肽中的两个或更多个位置,选择功能性多肽,然后对诱变的多肽进行测序以确定每个位置处可允许取代谱的方法。可以使用的其他方法包括噬菌体展示(例如,lowman等,biochem.30:10832-7,1991;ladner等,美国专利号5,223,409;huse,wipo公开wo 92/06204)和区域定向诱变(derbyshire等,gene 46:145,1986;ner等,dna 7:12 7,1988)。
[0222]
可以使用已知的诱变和筛选方法进行和测试多个氨基酸取代,如reidhaar-olson和sauer(science 241:53-7,1988)或bowie和sauer(proc.natl.acad.sci.usa 86:2152-6,1989)公开的那些。简而言之,这些作者公开了用于同时随机化多肽中的两个或更多个位置,选择功能性多肽,然后对诱变的多肽进行测序以确定每个位置处可允许取代谱的方法。
可以使用的其他方法包括噬菌体展示(例如,lowman等,biochem.30:10832-7,1991;ladner等,美国专利号5,223,409;huse,wipo公开wo 92/06204)和区域定向诱变(derbyshire等,gene 46:145,1986;ner等,dna 7:12 7,1988)。
[0223]
除非另有定义,否则本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。singleton等,dictionary of microbiology and molecular biology,第20版,john wiley and sons,new york(1994)和hale&marham,the harper collins dictionary of biology,harper perennial,ny(1991)为技术人员提供了本公开中使用的许多术语的通用词典。
[0224]
本公开不受本文公开的示例性方法和材料的限制,并且与本文描述的那些类似或等同的任何方法和材料可用于实践或测试本公开的实施方案。数值范围包括限定该范围的数字。除非另有说明,否则分别地,任何核酸序列以5'至3'方向从左到右书写;氨基酸序列以氨基到羧基方向从左至右书写。
[0225]
本文提供的标题不是对本公开的各个方面或实施方案的限制。
[0226]
氨基酸在本文中使用氨基酸名称、三字母缩写或单字母缩写来提及。如本文所用,术语“蛋白质”包括蛋白质、多肽和肽。如本文所用,术语“氨基酸序列”与术语“多肽”和/或术语“蛋白质”同义。在一些情况下,术语“氨基酸序列”与术语“肽”同义。在一些情况下,术语“氨基酸序列”与术语“酶”同义。术语“蛋白质”和“多肽”在本文中可互换使用。在本公开和权利要求中,可以使用氨基酸残基的常规单字母和三字母代码。氨基酸的3字母代码符合iupaciub生物化学命名联合委员会(jcbn)定义。还应当理解,由于遗传密码的简并性,多肽可以由多于一个的核苷酸序列来编码。
[0227]
术语的其他定义可以出现在整个说明书中。在更详细地描述示例性实施方案之前,应当理解,本公开不限于所描述的特定实施方案,并且因此可以变化。还应理解,本文使用的术语仅用于描述特定实施方案的目的,并不旨在限制,因为本公开的范围将仅由所附权利要求限定。
[0228]
在提供数值范围的情况下,应当理解,除非上下文另有明确规定,否则还具体公开了该范围的上限和下限之间的每个中间值,至下限单位的十分之一。在所述范围内的任何所述值或中间值与所述范围内的任何其他所述值或中间值之间的每个较小范围都包含在本公开内。这些较小范围的上限和下限可以独立地包括在该范围内或排除在该范围之外,并且其中任一限值、没有限值或两个限值都包括在较小范围内的每个范围也包括在本公开内,受制于所述范围内的任何具体排除的限值。在所述范围包括限值中的一个或两个的情况下,排除包括限值的那些中的任一个或两个的范围也包括在本公开中。
[0229]
必须注意,除非上下文另有明确规定,否则如本文和所附权利要求中所用,单数形式“一个(a)”、“一个(an)”和“该”包括复数指代物。因此,例如,提及“一种效应子”包括多种这样的效应子,并且提及“该效应子”包括提及一种或多种效应子及其本领域技术人员已知的等同物,等等。
[0230]
提供本文所讨论的出版物仅仅是因为它们在本技术的提交日之前的公开内容。本文中的任何内容都不应被解释为承认这些出版物构成所附权利要求的现有技术。
[0231]
附图简述
[0232]
现在将参考以下附图和实施例仅通过举例的方式描述本发明的实施方案。
[0233]
图1显示(a)编码pvc针状复合物的一种pvc操纵子布局(存在于起始基因组的不同区域中的基因簇)的示意图。(b)i、ii和iii类pvc操纵子布局的示意图。类别中的同源亚基类型显示为具有相似的阴影(以灰度表示)。(c)组装的pvc针状复合物的图示。显示的编号用于将(a)中的基因簇与(c)中的结构中编码的蛋白质的位置相关联(例如,a中的帽'16'簇在(b)的最左侧帽区域中显示为'16')。(d)模型i类paatcc
43949
pvcpnf操纵子(例如由seq id no.:93编码)的图谱,显示了有效载荷区域中的两个效应子基因(rhs样腺苷酸环化酶和pau_03332)。
[0234]
图2显示了基于重叠pcr制备pvc针状复合物表达质粒的克隆程序的概述。pcr片段(具有重叠区域)由不对称光杆状菌
atcc43949
(可从atcc以登录号atcc 43949获得)的模板gdna提供,其中相关引物靶向pvc操纵子。
[0235]
图3显示了pvc针状复合物(例如,由具有上述表达载体的细胞制备)的(体外)样品的透射电子显微照片。pvc针状复合物以独特的“纳米注射器”结构组装,与其作为收缩结构的作用一致。(b)中显示了从高分辨率单粒子cryo-em断层扫描结构导出的pvc针状复合物的3d渲染模型。
[0236]
图4显示了(a)在用抗pnf(immunogold)抗体免疫金染色后包含pnf有效载荷的pvc针状复合物的透射电子显微照片,证实pnf-有效载荷毒素与pvc针状复合物(称为pvcpnf)缔合。从编码pvcpnf操纵子的大肠杆菌粘粒克隆的上清液制备pvcpnf针状复合物。使用针对pnf(tgqkpgnnewktgr,seq id no:96)表位的抗肽抗体来定位有效载荷毒素蛋白。pnf毒素只能在断裂或收缩的针状复合物的末端检测到,提供了毒素包含在复合物内的证据(箭头)。(b)蛋白质印迹分析证实,如果pvc针状复合物被化学或物理破坏,则仅可以使用抗肽抗体检测pnf蛋白(毒素)。这些制剂取自pa
atcc43949
上清液。不能检测澄清的上清液中的pnf证实所有蛋白质与pvc针状复合物富集制剂缔合。泳道1 5;超声样品,2 6;1m nacl处理,3 7;1%sds处理4 8;1m尿素处理。注意pvc针状复合物在1m nacl中显示出是稳定的。
[0237]
图5显示了来自5龄烟草天蛾的离体血细胞(昆虫巨噬细胞/嗜中性粒细胞等同物)的冷冻sem图像,所述烟草天蛾已经注射了由大肠杆菌粘粒克隆异源产生的pa
atcc43949
pvcpnf针状复合物(纳米注射器)的天然(a)或热灭活(b)富集制剂。注意到对应于pvc针状复合物(纳米注射器)(小箭头)和膜褶皱效应(大箭头)的丰富线性结构,与pnf有效载荷毒素的作用模式一致,其在对照处理中不存在。比例尺=50μm。25kv;放大倍数40k(a)和50k(b)。
[0238]
图6显示了证明与pvc针状复合物接触后的(毒性)细胞表型是由于细胞内毒素递送的实验结果。(a)将负载pnf的pvc针状复合物注射到昆虫(大蜡螟昆虫幼虫)中,对于给定剂量在15分钟内显示出有效的活性(在实施例中解释)-注意到死亡率/发病率通常与这些死亡/垂死昆虫中的“黑化”免疫应答相关。(b)注射到动物中的对照、变性(通过煮沸)的负载pnf的pvc针状复合物显示没有活性。(c)纯化的pnf(有效载荷),不存在pvc针状复合物(即pnf未包装到复合物中),没有显示出对抗动物(左)或hela细胞系(右)的活性。(d)递送到hela细胞的胞质中的pnf(有效载荷)-通过含有蛋白质的“bioporter”脂质体制剂,或通过用适当的质粒转染后的胞内表达(e)-显示出有效的活性/毒性,如通过细胞中的多核化所证明的。(f)-pvcpnf pnf对thp1衍生的人巨噬细胞的呼吸速率的影响,如通过刃天青读板测定所测量的。注意到热变性的和空的pvcpnf纳米注射器没有显示出强烈的不利影响。
通过注射到galleria幼虫中来测试这些相同的样品。pvcpnf pnf样品在几分钟内显示出超过50%的死亡率(底部两个图中变暗的幼虫),而注射热变性的和空的pvcpnf的昆虫都保持健康(顶部两个图中没有变暗的幼虫)。
[0239]
图7显示了(在计算机中)与各种pvc操纵子缔合的一系列内源性有效载荷(毒素)的预测二级结构,证明了多种结构类型。(b)相对于预测的等电点绘制的各种有效载荷(毒素)的氨基酸长度。
[0240]
图8显示了证实本发明的前导序列(例如具有50个氨基酸)对于将有效载荷蛋白/肽(反式)包装到光杆状菌中表达的pvc针状复合物(纳米注射器)中是必需和足够的。(a)1-6:嵌合效应子蛋白表达构建体(在阿拉伯糖诱导型pbad30载体中反式表达)的示意图,包括表达pnf和非天然cre重组酶和myc标签的那些。c-末端myc标签表位显示为黑色箭头。(b)使用抗myc小鼠抗体的蛋白质印迹。样品来自经纯化的pvc(u4)针状复合物(纳米注射器),其从含有(a)中所示的反式包装表达构建体1-6的染色体工程化的发光光杆状菌tt01过表达。空白pbad30质粒用作阴性对照,并且没有显示出信号。箭头显示预期产品的正确条带尺寸。
[0241]
图9显示了前导序列的比对,证明了基于氨基酸性质,前导序列之间存在化学组成共有序列。更具体地,前导序列包含类似的电荷模式,2
×
带负电荷的区域,每个带负电荷的区域后面是带正电荷的区域[-ve][ ve][-ve][ ve]。
[0242]
图10显示了(a)来自颗粒制剂(氯化铯梯度和monolith fplc制剂,如材料和方法中所述)的pvc针状复合物和有效载荷的蛋白质印迹分析。在[1](pbadpvcpnf,其中纳米注射器的pvc16是flag标记的,提供用抗flag ab可检测的pvc16::flag)中,可以看到来自“pvcpnf”(具有pnf有效载荷的pvc针状复合物)的标记帽蛋白的信号,证实了纯化级分中存在pvc针状复合物。在[2](pbadpvcpnf cre::myc,用抗myc ab可检测,cre具有pnf前导序列的n-末端融合,例如seq id no.:78)中,来自myc标记的有效载荷蛋白的信号在与(1)相同的样品中大量包装,证实了纯化的pvc针状复合物(纳米注射器)中存在cre有效载荷。在[3](pvcu4 cre::myc,用抗myc ab可检测,cre具有pnf前导序列的n-末端融合,例如seq id no.:78)中,探测不同的pvc针复合底盘(“pvcu4”)纯化的myc标记的cre,揭示了包装的(包装的myc标记的cre)相应条带。为清楚起见,这在印迹中突出显示。(b)pvc针状复合物的透射电子显微照片,显示了野生型(具有pnf有效载荷)pvc针状复合物和具有非典型(非天然)重组酶(cre)有效载荷的pvc针状复合物在任何测试的底盘中都不影响pvc针状复合物的形态,确保它们不会异常组装。图10(c)提供了(a)的数据的附加/补充数据。更详细地,(c)通过cre重组酶(反式)包装到大肠杆菌中表达的纯化pvcpnf中的蛋白质印迹分析提供了更多证据。蛋白质印迹表明,对于给定量的抗flag抗体蛋白质信号(由于pvc16::flag的结合,纳米注射器的特异性探针),检测到高得多含量的cre有效载荷(使用抗myc标签抗体)。数字表示2倍稀释。注意到稀释后,来自纳米注射器的抗flag信号丢失,而有效载荷在大多数泳道中保持强烈。cscl表示通过氯化铯密度梯度离心纯化。“mon”表示样品另外通过“monolithic”柱进行阴离子交换。“洗脱后”、“相间”、“亚相间”表示其中从纯化过程检测到信号的液体级分。d-反式包装到大肠杆菌中的pvcpnf中的cre的蛋白质印迹分析。在纳米注射器-有效载荷复合物纯化后,探测有效载荷的结合的“myc”标签(c-末端融合)。颗粒制备物的蛋白质印迹分析证实所有四种前导序列都可以有效地反式包装外源性cre酶。e-a系统发生树,证明所示例的前导序列整体分布良好,因此处于或接近最大程度地顺序多样化(参
见实施例4.2)。
[0243]
图11显示了用抗flag和抗myc抗体同时探测的在没有(1)和有(2)来自分开的质粒的(myc标记的)pnf的伴随表达的情况下表达的pvc针状复合物的蛋白质印迹分析。在标记为1的泳道中,在大肠杆菌内不存在“有效载荷质粒”(编码与前导序列连接的有效载荷蛋白的表达质粒)的情况下表达和纯化pvc针状复合物(纳米注射器)。这导致仅对应于注射器(pvc针状复合物)本身上存在的flag标签的条带。对于泳道2,采用相同的方法,但使用还包括携带标记的有效载荷(myc-pnf)的(分开的)质粒的培养物。可以看到对应于flag和myc标签的条带,证实pnf有效载荷的存在(1和2内的四个泳道是来自氯化铯梯度的简单不同的纯化级分)。
[0244]
图12显示了发光光杆状菌tt01 pvcu4过表达菌株中反式包装实验的蛋白质印迹分析。结果证明了myc标记的pvc17(plu1651whole::myc)的反式包装。
[0245]
图13显示了发光光杆状菌tt01 pvcunit4过表达菌株中的反式包装实验的进一步蛋白质印迹分析(如实施例中所解释的)。结果证明了使用pnf的前导序列(pau_03332前导序列)的myc标记的pvc17(plu 1651::myc)和单独的myc标签的反式包装,并且前导序列是必需的。(a)泳道1显示了与myc标签融合的前导序列(pau_03332::myc)的包装;泳道3显示了不存在前导序列时缺乏包装(仅myc未被包装);泳道4显示不存在前导序列时缺乏hvna(天然效应子)的包装;泳道6显示了myc标记的pau_03332::plu1649的包装,即来自pau_03332的前导序列(即pau_03332的氨基酸1-50)和来自plu1649的效应子(即氨基酸51-c-末端)的嵌合体。泳道1和6中的高强度条带证明了pnf(pau_03332)前导序列在包装有效载荷方面特别有效)。(b)泳道1显示了使用抗myc抗体蛋白质印迹的具有c-末端myc标签的plu1651的包装。
[0246]
图14显示了进一步的蛋白质印迹分析,证明了使用pau_02806(gogb)前导序列(第二泳道,不包括阶梯泳道)非常高水平的的myc标记的pnf(pau_03332::myc)的反式包装。第一泳道证明了plu1649前导序列用于包装pau_03332效应子(myc标记的plu1649::pau_03332)的用途。由于第二泳道中条带的相对强度,条带看起来较弱。该实验涉及50ml培养物的过滤灭菌,加入8m终浓度的尿素以分解pvc。从10ml上清液中收集样品。
[0247]
图15显示了进一步的蛋白质印迹分析,证明了如图13中所述的具有c-末端myc标签的plu1651(pvc17)反式包装到由光杆状菌属表达的pvcunit4中。raw代表来自上清液的颗粒制备物,be、be2和ip代表来自氯化铯梯度纯化的不同“切割”。
[0248]
图16(a)提供了cre在(实施例6的)小鼠类器官实验中的作用机制的图解说明,以及阳性对照(tam)如何促进cre活化。白色箭头显示表达tdtom荧光报告基因的细胞的位置。b-证明通过从大肠杆菌表达和纯化的pvcpnf将活性反式包装的cre重组酶递送到鼠胆管类器官中。白色圆圈显示表达荧光报告基因的细胞组的位置。上图显示了通过光学显微镜获得的图像的直接灰度转换。下图显示了具有阳性细胞的假颜色增强的相应图像,提供其以简单地帮助识别在前一灰度转换内受影响的细胞和周围未受影响的细胞之间的差异。
[0249]
图17显示了具有和不具有有效载荷(cas9样蛋白mad7)的纳米注射器表达的斑点印迹分析。在诱导前(t1)观察到iptg诱导型mad7的一些泄漏表达,这是该表达系统常见的。如预期的,在任何时间点都没有来自仅pvc样品的myc信号,并且mad7信号在~24小时内的整个表达过程中生长。如别处所述,通过超速离心纯化后维持强myc信号,表明蛋白质结合
到纳米注射器底盘系统中。flag信号在mad7样品中是稳健的,并且如预期在诱导后发生并且在纯化后持续,因为这个启动子系统具有减少的泄漏表达。得出结论,纳米注射器和mad7在表达方面彼此相容,并且迄今为止测试的最大蛋白质mad7可以包装到纳米注射器系统中。
[0250]
图18显示了蛋白质斑点印迹分析,证实了促凋亡tbid蛋白结构域和baxbh3肽(两者均具有与n-末端融合的seq id no.:78的前导序列)反式包装到纯化的从大肠杆菌表达的pvcpnf(7&8)中。显示了通过2种不同方法(5&6)纯化的具有其同源毒素“pnf”的纳米注射器作为阳性对照。图底部的印迹代表与上述图中的7&8中的相同实施例。这些印迹由相同构建体的另一次纯化制备,证明了纯化的再现性。该实验证明了可以成功地制备“tbid蛋白结构域和baxbh3肽”包装的样品(纳米注射器),例如用于实施例9中的细胞凋亡递送测定中。
[0251]
图19(a)显示了来自仅暴露于包装的纳米注射器20分钟的细胞的tunel染色显微镜分析。第一(左)条=dna酶i处理的细胞( 对照);第二条=无dna酶i或纳米注射器处理(-对照);第三条=将细胞暴露于包装有tbid(通过与n-末端融合的seq id no.:78的前导序列)的纳米注射器;第四(右)条=将细胞暴露于包装有bax_bh3结构域(通过与n-末端融合的seq id no.:78的前导序列)的纳米注射器。b-如实施例9中所述的代表性显微照片,其显示了用纳米注射器和对照处理后pbmc的tunel染色。在进行tunel染色以确定凋亡应答之前,用tbid、bax加载的纳米注射器以及阳性(dna酶i处理的细胞)和阴性(无dna酶i处理)对照在室温下处理pbmc 20分钟。在原始(非灰度)显微照片中:凋亡反应阴性的细胞显示蓝色或浅棕色染色。蓝色染色(甲基绿)或浅棕色染色指示不存在凋亡信号的健康细胞。深棕色染色表明细胞经历凋亡。
实施例
[0252]
材料和方法
[0253]
克隆
[0254]
使用本领域已知的标准分子技术制备编码pvc针状复合物的质粒。简而言之,来自不对称光杆状菌
atcc43949
的基因组dna(可依据登录号
atcc43949
从atcc获得)用于pcr(使用适当的引物)以扩增pvc操纵子的多个(例如四个)重叠区域。采用重叠/延伸pcr来制备完整操纵子,并融合(再次使用重叠pcr)到如图1中详述的适当表达载体中(使用seq id no:101-seq id no:106的引物)。
[0255]
简而言之:制备覆盖pvc操纵子(例如seq id no:93)的四个重叠pvc片段(分别用seq id no:101(f1)和seq id no:105(r1)、seq id no:102(f2)和seq id no:106(r2)、seq id no:103(f3)和seq id no:107(r3)以及seq id no:104(f4)和seq id no:108(r4)的引物产生)。在所需插入位点切割靶克隆载体。然后通过重叠pcr(使用seq id no:101和seq id no:108的引物)组装这5个dna片段,并将所得片段连接到克隆载体中。将产物转化到实验室大肠杆菌中并用载体标志物选择(例如由于氨苄青霉素抗性)回收。
[0256]
如本领域已知的,操纵子通常可操作地连接诱导型启动子(例如阿拉伯糖诱导型和/或iptg诱导型)。这通常通过克隆到pbad家族质粒(可通过阿拉伯糖诱导)(invitrogen,目录号:v43001)和pvtra(可通过iptg诱导)(biomedal,s.l.)载体中来实现(尽管相容表达载体系统的任何组合都应该是足够的)。
[0257]
pvc针状复合物可以独立于有效载荷(毒素)表达,反之亦然。分开的表达载体(例如具有不同的诱导型启动子)可以分别携带pvc针状复合物和有效载荷。
[0258]
在大肠杆菌中表达(例如实验室规模表达)/纯化pvc针状复合物
[0259]
从大肠杆菌表达菌株(用适当的表达载体/粘粒转化)的1l培养物中纯化pvc针状复合物的典型方法如下:
[0260]
1-通过从平板中挑取菌落并接种100ml lb培养基来制备细菌(用pvc needle复合物表达载体转化)的过夜培养物。
[0261]
培养物在37℃下振荡生长。
[0262]
a.通常,培养基可以常规补充0.2%d-葡萄糖,以帮助抑制遗传构建体以获得最佳细胞健康。
[0263]
b.培养基还补充有用于维持表达(pvc needle复合物)载体的相关抗生素。如果还使用有效载荷载体,则还提供该载体的相关抗生素。
[0264]
2-第二天,通过以1:100的比例稀释接种1l烧瓶过夜培养物。1l烧瓶的培养基与过夜培养基相同,但通常不含葡萄糖。
[0265]
3-培养物生长至大约指数中到后期(~0.8的od600nm),此时诱导质粒。
[0266]
a.对于pvc针状复合物(纳米注射器)质粒,通常加入0.2%阿拉伯糖以诱导表达。对于有效载荷质粒(编码有效载荷的质粒,如pnf),iptg浓度通常可以基于每个蛋白质进行优化,并且0.1mm的典型起始数字是优选的。
[0267]
4-在诱导后将培养物返回培养箱并在18℃下培养直至第二天。
[0268]
5-通过在适当的离心机/瓶/转子中5000
×
g持续30分钟离心收获培养物。
[0269]
6-然后裂解细胞沉淀物以释放pvc针状复合物(纳米注射器)。
[0270]
a.可以使用以下裂解方法:
[0271]
(i)溶菌酶温育过夜。(ii)用针式超声波仪超声处理(首先用溶菌酶处理或不用溶菌酶处理)。(iii)破碎器/均化器。
[0272]
7-任选地,可以将dna酶和蛋白酶抑制剂添加到裂解物中。
[0273]
8-通过在高速离心机中以50,000
×
g,4℃,离心20分钟除去细胞碎片。
[0274]
9-通过100,000kda mwco离心柱浓缩裂解物以减少体积并除去小蛋白质。一旦体积降至可控制的体积,离心数次,用合适的样品缓冲液,如tm(20mm tris-hcl,8mm mgcl2,20mm tris-hcl;2ph 7.4)替代截留液以进行渗析。
[0275]
通过氯化铯密度梯度纯化的后续过程如下:
[0276]
1.如下制备cscl密度溶液:
[0277]
(a)h2o中的1.7g/ml cscl;(b)h2o中的1.5g/ml cscl;(c)h2o中的1.45g/ml cscl
[0278]
2.然后在超速离心管中设置梯度(从管的底部到顶部),如下:
[0279]
(1)(管底部)-2ml密度,1.7cscl;(2)-3ml密度,1.5cscl;(3)-3ml密度,1.45cscl;(4)(管顶部)-tm缓冲液中的样品。适当地,将每个密度小心地施加到管的侧面,使得边界不与先前的密度层混合。
[0280]
3.然后将平衡的管在sw40ti摆动桶式转子中在4℃下以35,000rpm(相当于155,000
×
g)超速离心2小时。
[0281]
4.正确的梯度级分将是刚好在出现的“蓝-白”晕上方的区域。通过用注射器和针
穿刺管来提取级分。
[0282]
5.可以以这种方式获得良好纯度的pvc针状复合物,并在4℃下储存在缓冲液中。适当地,渗析回tm缓冲液中以远离cscl。
[0283]
在cscl梯度纯化之后或代替cscl梯度纯化,可以通过monolith阴离子交换色谱法提取pvc,如下(注意所有步骤可以用蠕动泵或注射器装置手动进行,或通过f/hplc进行):
[0284]
1.除非已经进行,否则将样品提取物渗析到具有低浓度盐(20mm nacl)的结合流动相(通常为tm缓冲液)中。
[0285]
2.根据制造商的指导对柱进行平衡,简要地:
[0286]
a.至少5个柱体积(cv)的dh2o;
[0287]
b.至少5cv的结合缓冲液(tm,低盐);
[0288]
c.至少5cv的洗脱缓冲液(tm,高盐,》=1m nacl);
[0289]
d.再次至少10cv的结合缓冲液。
[0290]
3.以低流速(1-2ml/min)将样品施加到柱上
[0291]
4.用至多200mm含nacl的tm缓冲液洗涤柱。
[0292]
5.用含有1m nacl的tm缓冲液洗脱(或者,如果使用fplc机器,则使用梯度洗脱)。
[0293]
6.pvc针状复合物存在于洗脱级分中。如果使用级分收集器,则可能需要随后的sds-page或类似操作来鉴定正确的级分。
[0294]
(例如步骤2的)柱是cimmultus(
tm
)季胺阴离子交换柱(bia separations d.o.o.)。例如,cimmultus
tm
qa-1,其是具有1.3μm通道尺寸和1ml柱体积的整体柱。
[0295]
或者,可以使用deae(弱阴离子交换剂)柱。
[0296]
或者,为了与光杆状菌表达系统一起使用,可以以及/代替细胞沉淀物从上清液中纯化pvc针状复合物,使用如下添加/修改:
[0297]
1.从上述标准方案收获细胞后,将上清液转移到pyrex瓶中,并且如果需要,可以任选地通过100,000mwco柱浓缩。
[0298]
a.可以任选地添加dna酶(0.25u/ml)和蛋白酶抑制剂。
[0299]
2.加入nacl至终浓度为0.5m,并且还加入80g/l的peg6000。将溶液在4℃下混合过夜。
[0300]
3.将溶液在8000
×
g,4℃下离心30min以沉淀peg6000。
[0301]
4.将沉淀物重悬于小体积(~5ml)tm缓冲液(或类似物)中,并在室温下振荡孵育2小时。
[0302]
5.通过以13,000
×
g离心10min来沉淀,并将上清液收集到新管中。进行选择的纯化方法。
[0303]
用于纯化pvc针状复合物的其他方法已经在其他地方描述,例如在yang等(j bacteriol.2006 mar;188(6):2254-2261)中,其通过引用并入本文。
[0304]
用于发光光杆状菌tt01 pvcunit4(由基因plu1667-plu1652编码的底座)的阿拉伯糖诱导型过表达菌株的构建
[0305]
使用染色体重组将选择的pvc(操纵子)(作为实例,本文使用了编码pvcunit4针状复合物的操纵子)置于阿拉伯糖诱导型转录启动子的控制下来制备过表达pvc针状复合物的光杆状菌属菌株。然后用效应子表达质粒(例如,基于阿拉伯糖诱导型表达载体pbad30)
对重组菌株进行遗传转化,以简单地通过添加阿拉伯糖来促进pvc针状复合物过表达、pvc效应子表达、pvc效应子反式包装和整个复合物的分泌。
[0306]
重组光杆状菌pvc过表达菌株的构建
[0307]
使用来自发光光杆状菌djc(也称为菌株tt01)的基因组dna作为模板,使用引物pvcpromf(5'-tatcatatgtctacaactccagaacaaattgc tg-3',seq id no:97)和pvcpromr(5'-atctctagaacagatattccagccagc-3',seq id no:98),来扩增pvcunit4的启动子区。合适的发光光杆状菌菌株可依据登录号atcc 29999从atcc获得。用ndei和xbai消化pcr产物,并使用大肠杆菌dh5αλ-pir(biomedal s.l.)作为载体菌株,通过连接引入自杀载体pcep中(thermofisher,目录号:v04450)。将所得质粒转移到大肠杆菌供体菌株s17.1λ-pir中(biomedal s.l.),用于缀合到光杆状菌属中。简而言之,将供体菌株和发光光杆状菌djc的利福平抗性(rifr)分离株的过夜培养物在补充有10mm mgso4的lb中稀释,并生长至指数中期(od600~0.5)。然后,收获3ml的每种培养物,洗涤两次并重悬于100μl补充有10mm mgso4的lb中。将80μl发光光杆状菌djc rifr与20μl供体细菌混合(导致受体与供体比率为4:1)并置于补充有0.1%丙酮酸和10mm mgso4的lb琼脂平板的中心。将板在30℃下孵育过夜,并在1.5ml lb中收获所得生长物。将等分试样涂布于含有利福平(50μg/ml)和氯霉素(25μg/ml)的平板上以选择反式缀合物,并将板在30℃下孵育3天。使用引物parainf(5'-ggcgtcacactttgctatg-3',seq id no:99)和tpvcpr(5'-tcggtggcagtaaattgtcc-3',seq id no:100)将可能的反式缀合物重新划线并通过pcr确认。
[0308]
来自光杆状菌的pvc针状复合体的过表达和纯化
[0309]
将发光光杆状菌djc pvcunit4::pcep的过夜培养物在补充有氯霉素(25μg/ml)的2
×
250mllb中稀释,并在28℃、180rpm下孵育。2-3h后,加入阿拉伯糖(0.2%),并将培养物返回培养箱中另外26h。通过离心(7000g,30min)沉淀细胞并收集上清液。将dna酶i以0.25u/ml的浓度加入上清液中以降解任何胞外dna。在室温下孵育30min后,加入聚乙二醇8000(8%)和nacl(0.5m)以沉淀蛋白质。将上清液在4℃下搅拌孵育过夜。然后通过在4℃下以8000g离心30min来收集沉淀的蛋白质。将沉淀物重悬于8ml tm缓冲液(20mm trishcl,20mm mgcl2,ph7.4)中,并在室温下轻轻振荡孵育2h。通过以13000g离心10min来除去任何剩余的碎片,并将含有pvc针状复合物的上清液施用于cscl密度梯度,并在beckman coulter optima l-90k或xpn-80k超速离心机中以35000rpm离心2h。cscl密度梯度通过从管的底部分别以p=1.7(2ml)、1.5(3ml)和1.45(3ml)分层含有cscl的tm缓冲液来制备。收集含有pvc针状复合物的级分,并使用ultracemook装置(amicon)除去cscl,并将缓冲液更换为tms(20mm trishcl,8mm mgso4,ph7.4)。使用cimmultus
tm
季胺2μm孔阴离子交换柱(biasparations)进一步纯化pvc针状复合物。用含有200mm nacl的tms缓冲液洗涤柱,并在含有1m nacl的tms中洗脱pvc针状复合物。使用ultracemook装置通过缓冲液交换除去nacl,并将样品施加到cimmultus
tm
deae 2μm孔柱(biaseparations)上进行最终纯化。将柱在含有200mm nacl的tms中洗涤,并将样品在含有500mm nacl的tms中洗脱。
[0310]
可以在有和没有(例如,因为pvc针状复合物似乎从活细胞分泌,并且可以收集在上清液中)细胞裂解(以释放pvc针状复合物)的情况下进行这一点。
[0311]
透射电子显微镜
[0312]
对于透射电子显微镜(tem),使用涂覆有细碳层的聚乙烯醇缩醛覆盖的300目铜网
格作为蛋白质级分的衬底。优选的水性负染剂是3%甲胺钨酸盐。将涂覆的网格在使用前立即暴露于uv光16h,以确保衬底的适当润湿。将10μl液滴施加到tem网格上,并使蛋白质沉降5min。用滤纸从网格边缘吸收液体,并立即用10μl滤过的负染剂替换。用滤纸部分地除去液滴,并且使网格充分风干,然后用在80kv下运行的jeol1200ex透射电子显微镜(jeol,东京,日本)观察它们。
[0313]
bioporter测定和肌动蛋白应力纤维分析。
[0314]
对于bioporter测定(genlantis),将80μl纯化的野生型和突变体pnf蛋白(500μg ml-1)或pbs作为阴性对照加入一个bioporter管(genlantis)中并重悬于920μl dmem中。将样品加入在6孔板中生长的hela细胞中并孵育4h。用新鲜的完全培养基替换bioporter/蛋白质或pbs混合物,并将细胞孵育20-48h。为了使细胞形态和肌动蛋白细胞骨架可视化,将细胞在4%pbs-甲醛中固定15min,用0.1%triton x-100透化,并用四甲基罗丹明b异硫氰酸酯(tritc)-鬼笔环肽(sigma)和dapi二盐酸盐(sigma)染色。用lsm510共聚焦显微镜(leica)获取图像。
[0315]
实施例1
[0316]
pvc针状复合物的克隆和表达
[0317]
发明人已经成功地从宿主细菌发光杆状菌属切除(克隆)所需的表达基因(例如,其包含在seq id no:93、seq id no.:94和/或seq id no:95内),并且已经设计了如上所述的在实验室大肠杆菌中可靠的、可扩展的表达系统。已经证明了在分开的质粒上的反式表达使得能够将有效载荷(例如pnf)结合到注射器中,从而形成多质粒(模块化)平台。
[0318]
从大肠杆菌纯化后,电子显微镜分析证明了纯化的pvc针状复合物保留正确的“纳米注射器”结构(参见图3)。此外,pvc针状复合物在纯化后保持与有效载荷(例如pnf)正确缔合(参见图4),证明发明人已经成功制备了具有用于将有效载荷递送至细胞的正确结构的pvc针状复合物(纳米注射器)。
[0319]
此外,电子显微镜分析证明了纯化的复合物适当地定位于细胞的细胞表面,并且具有pnf有效载荷的pvc针状复合物诱导效应子(pvc)与假定机制一致的表型(褶皱)-参见图5。
[0320]
实施例2
[0321]
2.1证明pvc针状复合物通过效应子的胞内递送发挥作用
[0322]
如下将多肽pnf鉴定为pvc效应子。这在不对称光杆状菌atcc43949完整基因组-genbank登录号:fm 162591.1内得到了鉴定。
[0323]
鉴定了pvc操纵子(不对称光杆状菌atcc43949 pvcpnf操纵子,其具有seq id no:93的序列)的最终基因,即pvc16(例如pau_03338)。pvc基因座的pvc16基因的位置示于图1(a)、(b)和(d)中。鉴定了pvc16的3'不远处(例如在pvc16下游约5kb内)的orf-一个这样的orf(pau_03332)在pvc16下游3535bp。由该推定的效应子orf编码的多肽(具有seq id no.:32的序列)的预测功能通过blastp和hhpred(https://toolkit.tuebingen.mpg.de/#/tools/hhpred)的组合获得。然后可以基于与已知细菌毒素(例如来自大肠杆菌的cnf1家族)的直接同源性将该orf指定为pvc效应子。
[0324]
然后根据实施例1制备负载pnf的pvc针状复合物。
[0325]
发明人已经证明了这些包装的(例如负载的)pvc针状复合物发挥与其携带的货物
的来源一致的细胞效应。举例来说,暴露于负载有细胞骨架毒素pnf的pvc针状复合物的细胞和整个昆虫动物以与细胞骨架毒性一致的方式经历细胞死亡。
[0326]
通过注射10μl上清液来进行注射实验(注射到昆虫幼虫中),所述上清液在大肠杆菌培养物的过夜培养物(通常为1l)离心(沉淀)后提供,所述大肠杆菌培养物携带编码具有pnf的pvc针状复合物(pvcpnf)的粘粒克隆-例如由seq id no.:93编码的pvc,其包装有seq id no.:32的pvc效应子。
[0327]
证明pvc针状复合物是由于pnf有效载荷的胞内递送(例如注射)而导致表型的原因,只有当相同的蛋白质(pnf)提供另一种途径以进入细胞胞质(表达质粒的转染和表达,或通过含有蛋白质的脂质体制剂的电导)时,才能重建毒性作用-参见图6。相反,变性(通过煮沸)pvc针状复合制剂、覆盖在组织培养细胞上的毒素蛋白或注射到整个动物中的毒素蛋白显示没有活性。
[0328]
2.2.毒性效应子酶pnf递送到培养的人巨噬细胞中的证据
[0329]
为了补充上述数据,发明人进行了另外的实验,提供了将毒性效应子酶pnf递送到培养的人巨噬细胞中的更多证据。
[0330]
概念:发明人在培养的人thp1衍生的巨噬细胞上测试了从(反式)包装有天然pnf毒素的大肠杆菌表达和纯化的pvcpnf。与pnf毒素在昆虫模型中的致死作用不同,先前的脂质体介导的pnf蛋白转染实验表明了在人hela细胞中更精细的表型。在那些实验中,细胞在24h时显示出肌动蛋白应力纤维形成,并且在48h时显示出多核化。因此,发明人使用刃天青比色测定测试了容纳/包装有pnf pvc效应子的纯化pvcpnf(纳米注射器)对巨噬细胞呼吸速率的影响。
[0331]
方法:
[0332]
刃天青测定背后的背景。研究蓝色化合物刃天青用于测定pvc对巨噬细胞(m0)的活性的测定。刃天青在细胞线粒体中代谢还原,产生粉红色和高荧光化合物试卤灵。pvc对巨噬细胞代谢的影响可以通过将刃天青引入培养基中来确定。受pvc影响的巨噬细胞的数量可以通过将测量的荧光与细胞密度优化曲线的荧光进行比较来推断(参见czekanska,methods in molecular biology,2011,740,27-32,通过引用并入本文中)。
[0333]
刃天青用于thp1衍生的巨噬细胞的优化。在不同的接种密度下评估巨噬细胞在18h内的代谢,以确定使用pvc进行该测定的最佳细胞密度。将30ml thp-1细胞培养物以1000rpm沉淀4min,然后重悬于2ml rpmi培养基(还含有10%fbs(v/v)和2mm l-谷氨酰胺)中。使用细胞血细胞计数器计数细胞,然后在培养基中稀释至2
×
106细胞ml-1
的密度。然后在涂布前立即用佛波醇12-肉豆蔻酸酯-13-乙酸酯(pma)活化thp-1细胞。将200μl细胞一式四份涂布在96孔板中,并进行2倍连续稀释直至达到1.5625
×
103细胞ml-1
的最终细胞密度。将125μl起始细胞稀释液一式四份涂布在同一板上,进行5倍连续稀释,直至达到0.32
×
103细胞ml-1
的细胞密度。还制备了四个空白孔,其含有rpmi和pma。将板在37℃、5%co2下孵育48h。从孔中吸出培养基并用新鲜rpmi替换,并将巨噬细胞再孵育24h。将刃天青片剂(vwr)溶解于rpmi(12.5mg/ml)中,并快速连续地向每个孔中加入10μl(孔浓度为1.25mg/ml)。在板读数器上每30分钟测量产生的荧光,持续18h(激发:530-570nm,发射:580-620nm,保持在37℃和5%co2下)。然后确定随时间的最佳细胞密度以与pvc一起使用。
[0334]
使用测定进行pvc测试。将稀释至1.25
×
105ml-1
thp-1细胞活化并接种于96孔板
中,其中孔含有100μl细胞,最终孔密度为1.25
×
104细胞ml-1
。还一式四份制备了空白孔,其含有细胞而不含pvc样品,以及仅含有培养基和pma的孔。将板在37℃、5%co2下孵育48h。然后用新鲜rpmi替换培养基,然后加入10μl每种pvc样品。将板再孵育24h,然后向每个孔中加入10μl刃天青(12.5mg/ml),并且每30min测量荧光,持续18h(激发:530-570nm,发射:580-620nm,保持在37℃和5%co2下)。
[0335]
结果:图6f显示了用pvcpnf pnf挑战确实降低了巨噬细胞的呼吸速率,而热变性的或空的pvcpnf纳米注射器没有强烈的副作用。然而,没有添加样品的对照细胞仍然显示出最佳的呼吸速率。对巨噬细胞的影响与昆虫注射毒性测定相关。在这种情况下,两种pvcpnf pnf制剂对超过一半的昆虫群显示出致死性,而注射热变性的和空的pvcpnf的昆虫都保持健康。
[0336]
实施例3
[0337]
证明前导序列负责有效载荷包装到pvc针状复合物中
[0338]
令人惊讶地,发明人已经发现了,优选在有效载荷(毒素)蛋白的n-末端上,提供“前导”肽序列可以将有效载荷引导至pvc复合物并允许(例如触发)将有效载荷包装到pvc针状复合物中。发明人已经证明了pvc效应子蛋白的氨基酸残基1-50是/包含前导序列。
[0339]
为了证明这一点,制备了表达构建体(在染色体工程化的发光光杆状菌tt01中过表达),其中前导序列(n-末端氨基酸残基1-50)被消融,使得由plu1649表达的有效载荷(在图中称为“hvna”,并且具有seq id no.:46的序列)(出于检测目的为myc标记的)不存在前导序列(参见图8a-构建体1)。在表达(有效载荷和pvc针状复合物两者)和分离pvc针状复合物(并在凝胶上运行其组分,其包括任何包装的有效载荷)后,通过蛋白质印迹分析在pvc针状复合物内未检测到(myc标记的)plu1649(“hvna”),证明有效载荷(不存在前导序列)未包装到复合物中(参见图8b,泳道1),并且因此不与分离的复合物缔合。然而,对于保留前导序列的hvna,观察到成功的包装,参见泳道2(注意到由于泳道3的条带的相对强度,条带看起来弱)。
[0340]
令人惊讶地,具有来自不同(非hvna)pvc效应子的前导序列(即对应于来自pau_03332效应子的n-末端氨基酸残基1-50)的hvna(参见图8a,构建体3)被正确包装到复合物中,并且在分离/纯化后保持与pvc针状复合物缔合,如通过myc标记的hvna的蛋白质印迹检测所证明的(参见图8b,泳道3)。因此,发明人已经证明了

pau_03332’前导序列(其与不同的有效载荷pnf缔合)的令人惊讶的用于包装hvna有效载荷(即与pau_03332的有效载荷不同的有效载荷)的能力。这证明了交换pvc效应子的前导序列的能力,允许使用最佳前导序列(具有最佳包装活性)进行包装。
[0341]
实施例4
[0342]
4.1证明前导序列指引非典型/外源有效载荷的包装(到pvc针状复合物中)
[0343]
在本发明的意想不到的技术效果中,发明人已经发现了将本文所述的前导序列与外源(非光杆状菌属)多肽(优选地在n-末端)融合允许将所述外源多肽包装到pvc针状复合物中,其中外源多肽在分离/纯化时保持与pvc针状复合物缔合。举例来说,参见图8b(泳道4),其证明了与前导序列融合时,非光杆状菌

myc’多肽(《10kda)包装到pvc针状复合物中,以及泳道6,证明了大得多的非光杆状菌“cre-重组酶”多肽(32kda)同样可以适当地包装到pvc针状复合物中。
pvcpnf操纵子(实线箭头)或发光光杆状菌tt01 pvcunit4操纵子(虚线箭头)或两者来阐述。
[0355]
从图10e的树可以看出,所示例的前导序列整体分布良好,因此处于或接近最大程度地顺序多样化。
[0356]
实施例5
[0357]
尾纤维/结合结构域修饰
[0358]
已知pvc针状复合物包含尾纤维(参见3d呈现的pvc结构,最右侧图像的最左侧星号),其被认为允许pvc复合物的细胞类型特异性靶向。发明人已经成功地证明了结合到非天然氨基酸中的尾纤维区域的修饰(例如,野生型序列中的氨基酸取代20种标准氨基酸中的替代氨基酸)不影响尾纤维的表达。
[0359]
实施例6
[0360]
证明用前导序列包装的pvc针状复合物将活性(外源)酶/有效载荷物递送到离体鼠类器官中
[0361]
概念:获得用于将外源功能性酶递送至哺乳动物组织的数据。发明人已经证明了将称为“cre”的反式包装的噬菌体衍生的重组酶蛋白递送到离体小鼠胆管类器官中。类器官源自小鼠品系,其中染色体编码的红色荧光蛋白(rfp)报告子的表达通常被侧翼为cre-重组酶的loxp识别位点的终止信号阻止。如果存在重组酶,则终止信号被重组出来,然后细胞继续表达报告蛋白。这个实验证明背后的一般原理总结在图16a中。
[0362]
方法:胆管类器官制备:按照huch等(regen med.2013年7月;8(4):385-7.pmid:23826690;doi:10.2217/rme.13.39)方案,使用“bd扩增培养基”在matrigel中将鼠原代胆管分离并扩增12代成为类器官。然后将细胞以2d接种中并在bd扩增培养基中培养。小鼠基因型:rosa26基因座中的lsl-tom报告子 axin2crert(在4oht处理后可诱导)。将细胞在未包被的聚苯乙烯板中以10,000个细胞/孔的接种密度培养。将纳米注射器制备为在pbs 70%培养基中的30%体积注射器制剂。总体积为100μl/孔。阳性对照代表1:1000(v/v)的500nm 4oht(在乙醇中)作为重组的阳性对照。阴性对照仅表示1:1000(v/v)乙醇稀释。将细胞接种并生长48h,加入纳米注射器,然后再培养24小时,然后固定(4%pfa rt固定15min)并染色以进行显微镜检查。染色:来自rockland的一抗抗rfp(1:1000)。二抗为抗兔568(以1:500v/v使用)。在激光共聚焦显微镜上观察样品。
[0363]
结果:图16b包括来自这些实验的代表性显微照片,证明用加载cre的pvcpnf纳米注射器处理时,可以在许多细胞中检测到rfp蛋白的信号。由于这些是离体类器官,而不是简单的细胞单层,因此预期给药的细胞数量具有一定的随机性,并且甚至在阳性对照中观察到这一点,阳性对照是小分子诱导物(而不是大的蛋白质复合物)。预期由于这些是类器官,因此将存在一定水平的细胞分化,这可能改变纳米注射器的结合特征。来自该初步运行的另一个有趣的观察结果是,虽然尚未获得关于应用于系统的纳米注射器总量的信息,但发明人证明tam小分子诱导物似乎不具有比纳米注射器明显更大的组织穿透,表明它们的分布能力不主要是受它们尺寸的阻碍。
[0364]
其他解释:总之,发明人已经证明了将外源酶递送(例如给药)至细胞靶标的能力。此外,通过证明提供导致转化细胞的dna改变的能力,该“纳米注射器 cre”实验是有前景的生物技术工具/辅助概念的证明。因此,该实验证明了外源有效载荷(病毒而不是细菌的蛋
白质),特别是核酸修饰酶的用途。显然,cre酶以功能性方式递送,并且能够穿过细胞内部到达核以影响其dna修饰改变。
[0365]
实施例7
[0366]
将mad7位点特异性重组酶(外源有效载荷)反式包装到大肠杆菌中表达的pvcpnf纳米注射器中
[0367]
概念:与(实施例6的)cre数据和本文提供的包装的有效载荷的其他实例一样,发明人已经证明了通过前导序列将cas-样酶mad7包装到纳米注射器中。这是本文所述的有效载荷的最大外源实例(mad7=147.9kda)。
[0368]
方法:简而言之,在大肠杆菌中同时表达(在诱导后)底盘基因和mad7基因(后者用c-末端myc标签标记用于检测,以及本文所述的用于纳米注射器结合的前导序列)。在收获和纯化纳米注射器复合物后,通过斑点印迹分析探测有效载荷包装(例如,用于检测myc标签)。本文所述的纯化方法(使用超速离心)可用于选择(例如过度)高分子量蛋白质复合物/生物物质,使得能够回收纳米注射器和它们携带的任何货物(有效载荷)。“松散的”/未包装的有效载荷保留在溶液中并且不经受足够的离心力,因此在纯化期间损失,除非包含在大得多的纳米注射器“壳”内(即,成功包装时)。图17证明了mad7的成功包装。
[0369]
实施例8
[0370]
将凋亡诱导有效载荷反式包装到在大肠杆菌中表达的pvc pnf中
[0371]
使用图10c中描述的大肠杆菌pvcpnf前导序列::有效载荷::myc反式包装系统(pvcpnf前导序列=seq id no.:78),发明人证明了反式包装至少两种促凋亡人源担保之序列或肽(例如seq id no.:109和seq id no.:111的序列)的能力。将pnf效应子蛋白前导序列(例如seq id no.:78)与n-末端融合,并且将myc表位标签与c-末端融合。蛋白质斑点印迹分析(类似于实施例7)证实了这些人源蛋白质在纯化的纳米注射器中的存在(图18)。
[0372]
实施例9
[0373]
通过纳米注射器递送(反式)包装的促凋亡人多肽在培养的离体人细胞中诱导凋亡的证明
[0374]
初步测试已经证实了使用在大肠杆菌中产生的pvcpnf纳米注射器递送反式包装的人蛋白质序列(例如根据实施例8包装的)并诱导来自人供体的离体循环pbmc细胞凋亡的能力。该测定是来自仅暴露于包装的纳米注射器20分钟的细胞的tunel染色显微镜分析。结果显示在图19a中,证明(通过成功诱导凋亡)tbid p15片段和baxbh3结构域的递送。
[0375]
·
tbid p15片段(seq id no:109)是正常人细胞凋亡调节途径的一部分。细胞效应:bcl-2家族的促凋亡成员。bid的c-末端部分(tbid)易位至线粒体,在那里它诱导细胞色素c的释放。bid通常被胱天蛋白酶8从其潜在的胞质全长pro-bid形式切割。
[0376]
·
baxbh3(aa59-73)(seq id no:111)是最小bh3结构域合成肽,其包含限定的bax bh3结构域的关键的15个残基。细胞效应:这15个残基含有足够的信息以结合并功能性地拮抗bcl-xl并特异性地诱导bax/bak。似乎消除了bak/bcl-2相互作用-释放促凋亡因子。
[0377]
现在描述更详细的将促凋亡人肽递送到离体外周血单核细胞(pbmc)中的测试。本研究的目的是研究负载促凋亡肽的pvc纳米注射器是否可以在离体人外周血单核细胞中诱导凋亡。首先使用台盼蓝染料排除测定评估纳米注射器的任何即时细胞毒性,然后通过使用tunel测定评估凋亡反应。
[0378]
细胞生存力的台盼蓝排除试验:台盼蓝是通常用于选择性着色死组织或细胞的重氮染料,因此,死细胞在显微镜下显示为独特的蓝色,而具有完整细胞膜的活细胞或组织保持无色。由于活细胞被排除在染色之外,因此该染色方法也被描述为染料排除方法。台盼蓝通常用于评估组织或细胞生存力。将合适数量的细胞(2
×
105)暴露于纳米注射器和空纳米注射器20分钟。将合适体积的细胞(30μl)加入等体积的0.4%台盼蓝中,并使用血细胞计数器计数存活(未染色)和死亡(染色)细胞的数量。在3个浓度下测试每种化合物。针对每种化合物在每种浓度下测试来自两个独立人类供体的血细胞,并且每种样品一式两份测试。
[0379]
用于显微镜检查的细胞的处理和制备:在2个独立测试中,在3个测试浓度下,用两个嵌合纳米注射器(例如,负载有外源促凋亡肽)处理20分钟后,测定来自两个独立健康人供体的外周血单核细胞(pbmc)的生存力。通过离心收获pbmc,并以1
×
106个细胞/ml重悬于培养基中。将细胞在2.5%福尔马林中固定并在室温下孵育20min。通过用70%乙醇喷雾并使其风干来制备聚-l-赖氨酸包被的载玻片。将细胞离心30秒。除去上清液,将细胞重悬于200ml dh2o中。向每个载玻片/固定中加入5ml细胞悬浮液。每个载玻片进行两次固定以允许一式两份进行染色。使细胞悬浮液风干。
[0380]
pbmc细胞生存力测定的结果:台盼蓝活力测定证实了pvc制剂本身对取自健康人供体的pbmc没有立即毒性(表2)。纳米注射器处理显示》60%活力,表明在最大剂量浓度下的低毒性(表2)。然后,发明人继续测试嵌合纳米注射器诱导细胞凋亡的能力。
[0381][0382]
表2.在3个测试浓度(v/v稀释)下暴露于每种化合物20分钟后,来自两个独立人类血液供体的外周血单核细胞(pbmc)的生存力。pbmc对照未处理。
[0383]
使用tunel测定测试嵌合纳米注射器诱导的细胞凋亡:然后使用tunel测定来鉴定固定在载玻片上的单细胞悬浮液中的凋亡细胞核。在该测定中,末端脱氧核苷酸转移酶(tdt)与响应凋亡信号因子而产生的dna片段暴露的3'-oh端结合。这又催化生物素标记的脱氧核苷酸的添加,其可以使用链霉抗生物素蛋白-辣根过氧化物(hrp)缀合物来检测。二氨基联苯胺(dab)与hrp标记的样品反应,在dna片段化位点产生不溶性棕色底物。甲基绿复染能够使正常细胞和凋亡细胞可视化。
[0384]
测定了人pmbc暴露于纳米注射器后凋亡的诱导。tunel测定试剂盒(abcam)用于检测凋亡细胞。按照制造商的说明书进行测定。简而言之,用100μl蛋白酶k溶液覆盖载玻片5分钟,用1
×
tris缓冲盐水(tbs)冲洗载玻片。纳米注射器或dna酶i阳性试剂盒对照的处理
在室温下进行20分钟。用tbs冲洗载玻片。然后将载玻片与tdt平衡缓冲液一起孵育30分钟,然后加入tdt标记反应混合物。将载玻片在37℃下孵育19分钟。然后用tbs洗涤载玻片,然后施加终止缓冲液并在室温下孵育5分钟。再次用tbs洗涤载玻片,然后在室温下加入封闭缓冲液10分钟。通过将缀合物应用于样品30分钟来进行检测。用tbs冲洗载玻片,然后施加dab溶液15分钟。用dh2o冲洗载玻片,然后用甲基绿复染。将载玻片在100%乙醇中脱水,然后在二甲苯中脱水,并用玻璃盖玻片固定。所有染色一式两份进行。指示细胞凋亡检测测定中阳性染色的凋亡终点由深棕色(dab)信号表示。较浅的棕色阴影和/或蓝色/绿色至绿色/棕色阴影表示凋亡的非反应性阴性细胞。
[0385]
通过在载玻片上选择5个随机细胞切片进行分析,计数阳性染色细胞(深棕色)和阴性染色细胞(蓝色或浅棕色),并确定显示凋亡小体的细胞的百分比。
[0386]
为了产生阳性对照,在下文详述的蛋白酶k处理步骤之后,在室温下用1μg/ml dna酶i(试剂盒阳性对照)处理载玻片20分钟。dna酶i处理使正常细胞中的dna片段化以产生与凋亡期间产生的那些相同的游离3'oh基团。通过在处理阶段期间在反应混合物中用dh2o替代dna酶i来产生阴性对照。
[0387]
pmbc细胞凋亡测定的结果:在用完整的tbid和bax加载的纳米注射器处理后,用适当的阳性和阴性试剂盒对照,进行使用pbmc的tunel染色。进行处理20min以确定纳米注射器是否引发凋亡信号。包括阳性对照(dna酶i处理)和阴性对照(无dna酶i处理)。结果显示含有tbid或bax的两种纳米注射器在pbmc上显示强凋亡信号(分别为89%和78%阳性)。阳性对照显示了强凋亡信号(79%),而阴性对照未显示凋亡信号(100%阴性)。还观察到纳米注射器处理的样品中附着细胞数量的显著损失,推测表明快速和全面的细胞凋亡反应,并且在洗涤后不能保留。注意到这种效果比试剂盒阳性对照甚至更明显,表明反应更快。代表性显微照片显示在图19b中。
[0388]
结论:推断负载tbid和bax的纳米注射器能够快速诱导人外周血单核细胞的广泛凋亡。此外,台盼蓝染料排除测定已经证实了这些嵌合纳米注射器不会对细胞造成快速致死裂解或广泛的膜损伤。
[0389]
实施例10
[0390]
前导序列和pvc针状复合物的实际效用的示例-非典型(非光杆状菌属)有效载荷的胞内递送
[0391]
(1)抗mdm(p53抑制剂)抗体与本文所述的前导序列连接,并与pvc针状复合物一起表达以包装在其中。将分离的pvc针状复合物(包含抗体有效载荷)与肿瘤接触以用于抗体的胞内递送(所述肿瘤细胞的特征在于具有用于mdm抑制的p53活性的高mdm抑制)。肿瘤被抗mdm抗体的活性抑制。
[0392]
(2)pvc针状复合物用于(胞内)递送抗肿瘤肽疫苗以激活mhc-i依赖性细胞毒性t细胞淋巴细胞(ctl)应答。递送酪氨酸酶相关蛋白2(trp2)肽疫苗以增强对ctl的交叉呈递发生和针对表达trp2的肿瘤的抗肿瘤作用。肿瘤被肽疫苗的活性抑制。
[0393]
(3)pvc针状复合物用于(胞内)将核因子-kb抑制剂(其用于控制炎性病症,如类风湿性关节炎)递送至细胞。该细胞随后证明了促炎细胞因子的表达降低。
[0394]
(4)pvc针状复合物用于(胞内)递送t3ss有效载荷(其抑制nf-κb和mapk途径)。这用分离的(纯化的)pvc针状复合物完成,而不需要pvc针状复合物保持与其来源的细菌细胞
相缔合。
[0395]
(5)pvc针状复合物用于(胞内)向细胞递送抗凋亡肽,包括bh4、bcl-xl-蛋白和/或c-jun n-末端激酶的肽抑制剂(其可以保护心脏和脑免受缺血性损伤(对组织的血液供应的限制,导致细胞代谢所需的氧和葡萄糖短缺))。例如,通过jun激酶的20个氨基酸结合基序的jun激酶抑制是足够的。例如细胞色素c在细胞中的释放被抑制。
[0396]
(6)pvc针状复合物用于(胞内)递送烟酰胺腺嘌呤二核苷酸醌内部氧化还原酶(ndi1),复合物i的单亚基酵母类似物(其提供显著的心脏保护作用)至复合物i缺陷型突变细胞。ndi1蛋白正确地靶向线粒体内膜的基质侧,并将nadh氧化酶活性恢复到复合物i缺陷型细胞。
[0397]
(7)pvc针状复合物用于将phox复合物(其用于酶替代疗法以恢复慢性肉芽肿病中ros的产生)的两个必需亚基之一递送至慢性肉芽肿病细胞。观察到ros产生的恢复。
[0398]
(8)pvc针状复合物用于(胞内)递送(例如肌内)肌管蛋白(其用于改善x连锁肌管肌病患者的局部和远处肌肉性能)。观察到磷脂酰肌醇3-磷酸和磷脂酰肌醇(3,5)-二磷酸的肌管蛋白-脱磷酸化。
[0399]
(9)pvc针状复合物用于(胞内)将重组酶“cre”(其能够切除限定的遗传盒)递送到小鼠细胞系中,其中基因组具有侧接mcherry基因上游的终止信号的loxp重组位点。cre有效载荷切除重组位点,并去除终止信号,允许mcherry基因在细胞中表达。
[0400]
(10)pvc针状复合物用于(胞内)递送对胞内组分具有亲和力的~15kda纳米抗体(抗体片段)。检测纳米抗体-胞内复合物。
[0401]
(11)pvc针状复合物用于胞内递送(例如递送到昆虫细胞中)用于昆虫作物害虫和动物寄生虫的非典型(非光杆状菌属)多肽毒素。观察害虫的抑制。
[0402]
(12)pvc针状复合物用于(胞内)将核酸酶(例如cas9和/或mad7)递送到包含指导rna的靶细胞中。核酸酶进行定点基因失活。
[0403]
上述说明书中提及的所有出版物均通过引用并入本文中。在不脱离本发明的范围和精神的情况下,本发明的所述方法和系统的各种修改和变化对于本领域技术人员将是显而易见的。尽管已经结合具体的优选实施方案描述了本发明,但是应当理解,所要求保护的发明不应不适当地限于这些具体实施方案。实际上,对于生物化学和生物技术或相关领域的技术人员显而易见的用于实施本发明的所述方式的各种修改旨在落入所附权利要求的范围内。
[0404]
序列
[0405]
在任何以下seq id no中指示初始met氨基酸残基或相应的初始密码子的情况中,所述残基/密码子可以是任选的。
[0406]
seq id no:1(pak_1985)
[0407]
mmreysneddfikektnlvksenveadnyleteyltylakligmterenhhlnsikliddiielhndrkgnkllwndnwqdkiidrdlqsifkkidemvsefggleaykdivgenpydptepvcgysaqnifklmtegeyavdpvkmaktgkingnqfaeklehlnssnnyvalindhrlghmflvdipstnrervgyiyqsdlgdgalpalkiadwlksrgkesinvnklkkflndeftmlpdneqkgliaeifdlnkdidsvksgkikkdkavdiylreydindfisnieklktkla
[0408]
seq id no:2(pak_1987)
[0409]
mfqnrirnekttqsgkgktldrmtdslyleipnveavtlayqkltskyrkfdnktklildssdefsqlk
sekqrkgfsksglknngvsdrkfiytknalknfaahagyehnghyedefvnfkdnnknlakgklfpgislierrklsivknkegkwehketdeaeaykvtdiekfisgvrsmylqgntflhaktealirkhiannenilptmagiaglhaevqalnnlfisgdkgtkkrekwkyirnmlessiftqrlttgqagkdfaachncsgilsspvnvitgkvesagdnflstlsryktsqespi
[0410]
seq id no:3(pak_1988)
[0411]
mereysekqknpsklsrktaiseriaalersglsnsnqpvpqfarpytsnrpvvninpgrssiavatanstspvniptpapaspdkllpstscdttssilivgkynleltsqgkivvfrgdnrtpeqivaaggfypwskqdvgkikkelidefieigpsahmmghvrspnknyvstgmnmdsggfgeqsnylykmeipglkpqdmnertlgekirqdkrginyphflmshltlaesefvamiparseeltfitpiplsyitsyrkrgtntwlpmplkk
[0412]
seq id no:4(pak_2075)
[0413]
msnyeydivtqhdtyqikdneytvvngkywqyeqegnknnnkvsislmkenqndpvwitsdikeislyiienlfsyhkfsaelqhtlknavkavfneyseikysellhninnifnlffikiyntsdidtainiltakieiydklekinqdktdsnntnvdiweelginaeepllkiyrqafstgdiddevysdalltfmsdgnlelgdkeksdynqrikdktdlfesykkgiekvaslittnninpgipitypeteksinigddlllaqlakeeialkkqnrteysqqdifelqtlqaakyhllilsslgallyqiapnvekmtkghgdyrdiifsqeqaeslfkkhniqydtnhvlsqeskhiemegciiltaaiiyrmrkenatveqalnystletiklfendkkklnpfntnnvkpagyfsfidfkkrdkfdsqynfneqfnvyknkyshyesisfsklilsspaaqltaeeivnppeeaflysveqgmgnvamikmyqgnwlvistiqggvkakkysrqqvdsnptlramskpnalflierkmetgmgilmpnmmvntgkrlfptgyeraktlsgfaetsryknsynafwndyygitsgmnvgisftgspkfnfykeenllsvtatiiqqglndiaikskqalditsgwhiaatilipfynviyksttdseyeltgedigsivfdtanvllvvatlgmsltesmaakvtqttlrlrqagltgralitavvrtlpehgiitlrqssgiilgglidlieplpirstltltyrgvinavgamrnsikleksfadifgkstrglgklknewkvsnlpleeivphsnggeiykgiysirptnpetavkqnfyikeaganyqvkwddanhtwrvvnptypeqfsywpavkldknghwvthadvsnkflileqskridqeleaahsninndnildafihintafkdcerydidklsditdtlthffekslkpgdkkaifsteimsiqqawirevilplqnnssisiekinaiktelpyllrktfpiesqlpnqlvankialaieeipntripkytsgnisktvqytsllennhvdippvgititgndtfinqvtrvlseideipsgniviqelekqglniqpptmndivrekngqfyannsagshiafdpenhligteeklidepwrtrepaialyhemlhiyynryptwftsidnkvidqkvsggfslleesrivgtkyyvndkntlfdfndsdyllennsalltenrfraeyaifknkseyvirpysgkgdsqipltktkinineshrnvmgvgsgkpekmpnesatdyrnrvrewrkankqpeadigtgdmrktkaearvkllkenypqfepqkielggafqlwtvpnepanklmlsshgyffsdsaatqvpagktiqflgphgktlleapenplyspfdvtlgnsgftvqpyatiesgnkaglgsvkigdktftvndiqniatddvenyllatgveanasnhgkvrnygikyyekmpdeevkaaiwknradetsthkydallvspeagnrkklsdifalmktdermskydeitfvacreelnrinmksihdtglgggyepkleptvilsrrrreatftadgaiiysiiavnlhhnfiteeivgiapflfinn
[0414]
seq id no:5(pak_2077)
[0415]
meheynekekqrnsaiklndairnneenmdmtsplelnfqntnrksrglrerfsatlqrnlpghsmldrelttdgqknqesrfspgmimdrlmhfgvrtrlgkvrnsaskyggqvtfkfaqtkgtfldqimkhkdtsggvcesisahwisahakgdsifnqlyvggkkgkfhidtlfsikqlqmdgylddeqstmteywlgtqgmqpniqrnddtdehsskvvgetgnrgtkdllhaildtgdkgsgykkisflgkmaghtvaayvddqkgvtffdpnfgefsfpdktsfshwftddfwpkswysleiglgqefevfnyapeap
[0416]
seq id no:6(pak_2892)
[0417]
mpnkkysenthqgkkplmkseannehdiqnsslgigldlnsmmgnsstslshiqdysfwkeniseyykwmvvvkahlkqldwtlksmdspesagtniakntgttalqtllntggsiagaaiggaigsaiapgvgtiagmgigalagtglnylndtvieklnekleiaypypktrnmifdinnydknpiikaikkktnkdnlkvtagssltsqlvgkvtspikfpaykladlaialaglssdkarhildftdsirevlneshsdavafmrknygdnamglaglssrik
[0418]
seq id no:7(pak_2893)
[0419]
mereysekekhkkrpiqlrnsieqheeetannslglgldlnqatnppkvpkdnyneengdlfyglanqrgryiksvnpnfdpdkinsspmiidvynnnvsntilnkypldklvklsgnpqkyannikvenslqqdvasskrgwyplwndyfktgnenkkfniadiyketrnqygsdyyhtwhtptgaapkllwkrgsklgiemaasnektkihfvldglniqevvnkqkgstpleqgrgesitaselryayrnrerlagkihfyendqetvapwekspelwqnyipknknqnesstpqrnngtlyrlggpfrklraslrkrs
[0420]
seq id no:8(pak_2894)
[0421]
mmeheyskeeekkrqqskpnnathdesnlplelekhfnartpatahskwftyendteveltterikeifsnkqpkiiiagdghnkppfqyaknipdvnssfdagtlqlyieatdeqinennpeyipkefmakpglftnknrraeivgwedselsnamkemfelsdkstrekltpeetssfyklhetairhffrpefnqlrdeffeilakagsnreldkialemigftsgtwrdeyinptlaekiakhaaekenhtfvvsigdahlsenpmqeylnkrrnggefkhqiiftrdkrpilpdnmktgnkns
[0422]
seq id no:9(pak_3525)
[0423]
mlkyanpqavptqrtkntakkpsssssfdgqlelsngewskhsemglkrgglinsirrriarngnigrfnelidseakkwpsepvdknihmiwigtrnisekniklsidtakknpdyntsiiydsgisghegarnfmlekfegsnvnxslafpkgigvmreyapeagkatafpntpiavtknnpiinktldlavgnyqrgeknvlklagpdvftqalyqeipglnskvlnaqldqfelakrqalglplekpksfadekltsvekekinrpyqsmrglsghvmngadhswavdtevlgh
[0424]
seq id no:10(pat_00148)
[0425]
mmreysneddctkektnlvksenveadnylemehltylaklismterenhhlnsikliddiielhndrkgnkllwndnwqdkiidrdlqsifkkidemvsefggleaykdivgespydptepvcgysaqnifklmtegeyavdpvkmaktgkingnqfaeklehlnssnnyvalindhrlghmflvdipstnrervgyiyqsdlgdgalpalkiadwlksrgkesinvnklkkflndeftmlpeneqkgliaeifdlnkdidsvksgkikkdkavdiylreydindfisnveklktkla
[0426]
seq id no:11(pat_00149)mifkmlnlavfyllgnifhylicqkficyfcsvlksvtmfltkvavqialylnilptmagiaglhaevqalnnlfisgdrgtekrenwkyirnmlestiftqrltagqagkdfaachncsgilsspvnvitgkvesaggnffiniisi
[0427]
seq id no:12(pat_00150)
[0428]
mereysekpknlsqlsrktaiserramfernassnneqpvpqfarsytsnrsvvninpgrssiavvtanstspvnistpaaaspdkllpstscdttsstltvgkykleltsqgkvvvfrgdnrtpeqivaaggfgeqsnylykmeipglkpqdmnertlgekirqdsrgn
[0429]
seq id no:13(pat_00152)
[0430]
mkydprlrtwveddfdyeknfkkqtdyinykdlekqlkenvdyyalldeneaiiflkelgcdiksflndtafpvtdvlsnfagnikdalgvfkvaknfkpinigiftyiinelkgkgikaieylgkngeryikltdrpgirkylnatrylinnkkimevgigsvamegsivkgarfgviysaayrsvelmfkseydltnffvnlsmdmakiivatiiakstvaaatsfvvtaalsttaiaigvfiigalvvwglmwlddefkisetiirrlkehkvktpistyhsdqifnawgryyrg
[0431]
seq id no:14(pat_02308)
[0432]
mpnkkhsenthqgrkplikseannehdiensslgigldlnstignnsaslsqiqdysfwkeniseyykwmvvvkahlkqldwtlksmdssesagtniaknigttalqtllntggsiaggaiggaigsaiapgvgtiagmgigalagtglnylndtvieklnekleiaypypktrnmifdinnydknpiikaikkktnkdnlkvtagssltsqlvgkvtspikfpayklsdlaishnralaglssdkarhildftdsirevlneshsdavafmrknygdnamglsglssrikgekltlatlartrnkienrinsinkqtlklssknsne
[0433]
seq id no:15(pat_02309)
[0434]
mereysekekhkkrpiqlrnsieqheeetannslglgldlnqatnppkvpkdnyneengdlfyglatqrgryiksvnpnfdpdkinsspmiidvynnnvsntilnkypldklvklsgnpqkyannikvennlqqdvasskrgwyplwndyfkignenkkfniadiyketrnqygsdyyhtwhtptgaapkllwkrgsklgiemaasnektkihfvldglniqevvnkqkgstpleqgrgesitaselryayrnrerlagkihfyendqetvapwekspelwqnyipknknqnesstpqrnngalyrlggpfrklraslrkrs
[0435]
seq id no:16(pat_02310)
[0436]
mmeheyskeeekkrqqskpnnathdesnlplelekhsnartsatayskwftyendmevelttervreifsnkqpkiiiagdghnkppfqytknipdvnssfdagtlqlyieatdeqinennpeyipkefmakpglftnknrraeivgwedselsnamkemfelsdkstrekltpeetssfyklhetairhffrpefnqlrdeffeilakagsnreldkialemigftsgtwrdeyinptlaekiakhaaekenhtfvvsigdahlsenpmqeylnkrrnggefkhqiiftrdkrpilpdnmktgkkns
[0437]
seq id no:17(pat_02956)
[0438]
msnyeydivtqhdtyqikdneytvvngkywqyeqegnknnnkisislmkdnqndpvwitsdikeislyiienlfsyhkfsaelqhtlknavkavfneyseikysellhninnifnlffiktyntsdintainiltakieiydklekinqdktdlnntkvdiweelginaeepllkiyrqafstgdiddevysdalltfmsdgnlklgdkeksdynqrikdktdlfesykkgiekvaslittnninpgipitypeteksinigddlllaqlakeeialkkqnrteysqqdifelqtlqaakyhllilsslgallyqiapnvekmtkghgdyrdiifsqeqaeslfkkhniqydtnhvlsqeskhiemegciiltaaiiyrmrkenatveqalnystletiklfendkkklnpfntnnvkpagyfsfidfkkrdkfdsqynfneqfnvyknkyshyesisfsklilsspaaqltaeeivnppeetflysveqgmgnvamikmyqgnwlvvstiqggvkarkysqqqvdsqptlramsrpnalflierkimigigifmenqivntgkrlfptgyeraktlsgfaetsryknsynafwndyygitsgmnvgisftgspkfnfykeenllsvtatiiqqglndiaikskqalditsgwhiaatilipfynviyksttdseyeltgedigsivfdtanvllvvatlgmsltesmaakvtqttlrlrqagltgralitavvrtlpehgiitlrqssgiilgglidlieplpirstltltyrgvisavgamrnsikleksfadifgkstrglgklkhewkvsnlpleeivphsnggeiykgiysirhtnpetavkqnfyikeaganyqvkwddanhtwrvvnptypeqfsywpavkldknghwvthadisnkflilekskridqeleaahsninndnildafihintafkdcerydidklsditdtlthffekslkpgdkkaifsteimsiqqawirevilplqnnssisiekinaiktelpyllrktfpiesqlpnqlvankialaieeipntripkytsgnisktvqytsllennhvdippvgititgndtfinqvtrvlseideipsgniviqelekqglniqpptmndivrekngqfyannsagshiafdpenhligteeklidepwrtrepaialyhemlhiyynryptwftsidnkvidqkvsggfslleesrivgtkyyvndkdtlfdfndsdyllennsalltenrfraeyaifknkseyvirpysgkgdsqipltktkinineshrnvmgvgsgkpekmpnesatdyrnrvrewrkankqpeadigtgdmrktkaearvkllkenypqfepqkielggafqlwtvpnepanklmlsshgyffsdsaatqvpagktiqflgphgktlleapenplnspfdvtlgnsgftvqpyatiesgnkaglgsvkigdktftvndiqniatddvenyllatgveanasnhgkvrnygikyyekmpdeevkaaiwknradetsthkydallvspeagnrkklsdifalmktdermskydeitfvacreelnrinmksihdtglgggyepkleptvilsrrrreatftadgaiiysii
avnlhhnfiteeivgiapflfidn
[0439]
seq id no:18(pat_02957)
[0440]
meheynekekqrnsaiklndairnneenmdmtsplelnsqntnrksrglrerfsatlqrnlpghsmldrelttdgqknqesrfspgmimdrlmhfgvrtrlgkvrnsaskyggqvtfkfaqtkgtfldqimkhkdtsggvcesisahwisahakgdsifnqlyvggqkgkfhidtlfsikqlqmdgylddeqstmteywlgtqgmqpniqrnddtdehsskvvgetgtkgtkdllhaildtgdkgsgykkisflgkmaghtvaayvddqkgvtffdpnfgefsfpdktsfshwftddfwpkswysleiglgqefevfnyapkep
[0441]
seq id no:19(pat_03171)
[0442]
mfkydtsekmakfgkgktsdgmlldtlyleipdekavmsayksqildelrnfsekthsffsgkkplyskkylanlaahagyvhvtdynsignykdgfvnfkdnsrnlaegklfpgirlikrpklsivrdketerwkkqesdeadayeitdiesfisgvrdmysranvdlhpvieslirnhivnndhvlptmagiaglhaevqalnnlliladgragkivggrkieeymqdmlksfiftqrlttkqagndfaachncsgilsvpanvitgkvasagsnfslilsryknsqespi
[0443]
seq id no:20(pat_03172)
[0444]
mlkhanpqtvstqrtkstakkpsssssfdrqfelsnsenqpgegnkdwtikgwrqrfadrslnkghisplmnkgllvgseealinvpvvahrydsshqltdagplkadshsnnldpfygvvtgfrgdqvtssesgsgsigghwgkntldsnitginvvngasgtvgirialkdiqhgapvivtsgalsgctmvyavkngyffayhtgqkpgdkewktgrqgvvatyrshqalspdsepmavgeqnndlvnifasydqgiitymgkpgviidntaenvgvfnydevklekpdiragysyallakddkgkvnvkvlsedvivplgnkgktikainslkkrll
[0445]
seq id no:21(pat_03177)
[0446]
mpryanyqinpkqntknshgkssssnfssgyfsssnnslddslirqqvkrefiweghmkeieeasrlgnfavsfraaggptlralgkgaaakghdilektikpgsinkaypkdeasnvikkvqeagiegyvghwdkktgrllgiymssghglsdeqvngkiypidlnnleaslsalktkenwaalpftgdydmhdmisftgqphsvpsnsseerkiidrinrlvarsdpnrpfgdiehnvirhgaqvsypafamdkekeeikkhggivkavaepgefpvaivskgkwtiannidelnqfynsigakmkvswkpgaenpgfvsnpqrpgmarfsrkr
[0447]
seq id no:22(pau_02009)
[0448]
mmreyskeddcvkektnlaesenveadnylemdclnylaklngmperkdhslnstkliddiiklhndrkgnkllwndnwqdkiidrdlesifkkidemvsefggieiykdivgenpydptepvcgysaqnifklmtegehavdpvkmaqtgkingnefaekleqlnssnnyvalindhrlghmflvdipstnrekvgyiyqsdlgdgalpalkiadwlksrgkesinvnklkkflsneftmlseseqkeliaeifdinkdianvklgkikkdkavdvylreydlndfisnieklktklv
[0449]
seq id no:23(pau_02010)
[0450]
mpiighkedlirterssvdltrssnnrqtdnlelnipqhkrdnkdiehaviygfsqhrgpemqkafadnknpvtideynaglgimgelslsdyfrisqdlkenrlpelnekniqnhslkyfdamgvnmksadpnvkeeakeqqraytrswgfymmenkekldiqskinnlipkkksffskspgedeykkldefilknsngsnltipkqrkilmkfasaknavdvtknlsgeeqtwlkdiiataffrqtsklgmswfieqlaspdfrfvivgfngeelttdqirsnkpwkhgnrrkegaseyaepitfseirhahrkgydskinfikk
[0451]
seq id no:24(pau_02095)
[0452]
mistfdpaicagtptvtvldnrnltvreivfhrakaggdtdtlitrhqydlrgnltqsldprlydlmqkdntvqpnfywqhdllgrvlhtvsidaggtvtlsdiedrpalnvnamgvvktwqyeanslpgrllsvseqsaneavprviehfiwagnsqaekdlnlagqymrhydtagldqlnslsltgahlsqslqllkddqmpdwagdnesvwqnklknevh
ttqsttdatgapltqtdakenmqrlaynvtgqlksswltlngqleqiivkslaysesgqkireehgngvvtkysyepdtqrlinittqrskghvfsekllqdllyeydpvgnivsilnraeathfwrnqkvsprntytydslyqliqstgremadigqqnnkmptplvplssddkvyttytrtysydrgnnltkiqhrapashniytteitvsnrsnravlshngltprevdaqfdasghqislptgqnlswnqrgelqqattinrdnsatdrewyrynagsarilkvseqqtgnstqqqqvtylpglelrttksgtnttedlqvitmvetertqvrilhwsagkpndiannqvrysydnliesnvmeldtkgkiisqeeyypyggtaiwtarnqieasyktvrysgkerdktglyyyrhryyqpwlgrwlsadpagtvdglnlyrmvknnpiryqdesgtnandkaqaifkegkkiainqlkiasnflkdsknsenaleiyriffgghqdieqlpqwkkridsviygldklkttkhvhyqqdksgssstvadlnvdeykkwsegnksiyvnvyadalkrvyedpllgrehvahiaihelshgvlrtqdhkyigvlsspgshdltdllsilmppaneqdrtekqrratgarkalenadsftlsarylyytaqdpnflsslrkahrdfnnkktdrliirpperr
[0453]
seq id no:25(pau_02096)
[0454]
mereynkkekqkksaiklddavgnneenmdmtsplelnsqytnrkrpglrerfsatlqrnlpghsmldrelttdgqknqesrfspgmimdrimhlgvrtrlgkvrnsaskyggqvtfkfaqtkgtfldqimkhkdtsggvcesisahwisahakgesifdqlyvggqkgkfhidtlfsikqlqmdgylddeqstmteywlgtqgiqpnrqkndnmnehsskivgetgtrgtkdllraildtgdkgsgykkisflgkmaghtvaayvddqkgvtffdpnfgefnfpdkvsfshwftddfwpkswysleiglgqefevfnyepkep
[0455]
seq id no:26(pau_02097)
[0456]
mvyeyaktndrkrklstqsdnyeeksfspvldlsrnnqntpnmedeyetpqnfinrtgreklfrairmvasnkrdpitkdqvsvppdgnlftelkdkhldraaeykklktwpthasiiatspsantpiaqhvsgddalspyistgdkpgavqntvrnwngigpaserrlrpektwspiieidvnklpdttkifdlnkpnntffsttnsdiaqnafadkevlispeipglaitrvindpeeikqianlnpsqsliekkntipeekiifeekksvpihdsdadipsssfvfpkrkkprnirsrtds
[0457]
seq id no:27(pau_02098)
[0458]
mvfehdktverkrkpsiqlgndkeksseqalelpqskqnnpllhdlitsnnlrkeaavfakqigpsyqgildglehlhnlsgneqltagfelhrritryleehpdskrnaalrrtqtqlgdlmftgtlqevrhpllemaetrpamasqiyqiardeakgntpgltdlmvrwvkedpylaaksgyqgkipndlpfepkfhvelgdqfgefktwldtaqnqgllthtrldeqnkqvhlgysynelldmtggvesvkmavyflkeaakqaepgsaksqeaillnrfanpayltqleqgrlaqmeaiyhsshntdvaawdqqfspdaltqfnhqldnsvdlnsqlsfllkdrqglligeshgsdlnglrfveeqmdalkahgvtviglehlrsdlaqplidkfltsenepmpaelaamlktkhlsvnlfeqarskqmkiialdnnsttrpaegehslmyragaannvaverlqqlpaeekfvaiygnahlqshegidhflpgithrlglpalkvdennrftaqadninqrkcyddvvevsriqlts
[0459]
seq id no:28(pau_02230)
[0460]
mkgiegvimlshdilpekllvsekkhenvgsyfsddigeqseqtevshfnlslddafdiyadisienqqelknkdnntniwsslgrgdddhnlkkiindafkeklpqlmeyrrkgynvigldkegikklegmlkavppeiqqptmknlysaaqellntlkqhpllpenqdmiqqsnlvirnlsdaleainavskvnqvewweevhktnkaqsdrliaatleelffkvkdkrlpgsnddycqqereeterkikdlllydgyqltaehfkfgrlrksllaesrvtrlklaeylekksvgiltaardakmyamkillaqtrnngfnakdlinagqvndrllsfqqyarhiravdgeidgiilsnplvvaciketndepahikiarailpvseelgtvskvlretkekvqpskpkeelnhphqdwwnrgdelwkyikktswniketsvhvtqmvgyeasktasrakhklkessysesingavkgtalllldeiqqaenrirqipqfawdvqeaveqhssviqrtaypdelpelse
llneqlkheearwqavkkqsrdklqeliapitrlaqekwaqdlyfqlgeelrkerqdrwkdiqqfdeimaeavgqfaemareldseavrlaehghsggkelqekvakwlrdlsklkgkvkagvakitgtsldnfsrsgmlargmsewaedlkqsylqetlqegsavaaelfertlmevveenrthfakesdpeaerflkrlalalkhaaenttvypptpeeilagsrslpedirhwaekkvvsgaisaafrggfklvtgtfslpvrvvirgaktggtlyrgvrainrsvrlgqgpatqvkskfinqelsktafrltlslsplvawgmaasitagrlynekdypekiiknividlpeellwiggyaginaairahaekaiqqaiqhaldeqadklalrinkeiagksadvnveiipqetsvspaetaqstpeplsdfastsqltmpelidiqdnnsaqqpkvrrkrdvsveseisidnlniinantredkvnseikselrselkrfensdanspmsdveraifidlflyknkyevsesqqdykntwlkfrrelesqenkeikeylrfrsiieayeiydkkrldddtipeagtiikevidffqklkkenpitfmklaeamvkfqyyyeeedenedryfkmaeiyyflnktenekksktfhldiidkypnennrlldefflnknnnnpdldeiiyklqsmqekyresyemlskvenihqvlsddskneenifldnriiaaqvfdgsinislqdkkkwlnrydqirneegsdgwklmhiesilinlrrintainltamksesalllidkllnfqkkarenilhisetphedftsysqfktrkelgnddskyyaqfdnykdnhdaekeakeilsqvvaraslsfselfdkvesiklfsfvyknrdggaplaapgrtvvikfpgkdtgglvisnlflrnhvkristkemedlkpltegmytratqhrslgsyyhigsqsehtnaleilsgmnkeelkthlkkqgiwfgepalfsneypkqentghlenttlknaiigvstiqnnaaanylrstmyestgweklgdrfipfyeigrrkhydreyeinseqltldiitsiaiaypaargivatirssaipsilksglrgsalfkslslelgkmgfnaskvfggavyeliepypinshlnrhnvfnkvkdtawefhtdvglkggglkdfidrftkepkeitisgykfkrikynqenfdtmqrmaldyaynpdskgkiaqaqqayktgkedynapqydnfnglsldkkieryispdtdattkgvlagkmnesikdinafqtakdaqswkksankankvvltpqnlylkgkpseclpesvlmgwalqssqdaklskmlmgiyssnditsnplykslkelhangnaskfnasatsisninvsnlatsetklfpteissvrvdapkhtmliskiknrenkikyvfydpnygmayfdkhsdmaaffqkkmqqydfpddsvsfhpldysnvsdikisgrnlneiidgeipllykqegvqlegitprdgiyrvppkntlgvqetkhyiivnndiyqvewdqtnntwrvfdpsntnrsrptvpvkqdtngewfkhsetglkgggpiddirkyiarksaikifnqsinysatkwppepidknihmiwigtknisekniklsidtakknpdyntsiiydsgisghegakkfmlekfqdsnvniidfrkksyfsqlkqepsfayyeqviaenkyaqasdilrllvlkyeggiykdiddiqvkgfgsltfpkgigvmreyapeagkatafpntpiavtknnpiinktldlavsnyqrgeknvlklagpdvftqalyqeipgldskvlnaqlyqlelakrqalgvplekpknfadeqltsaekekinrpyqsirglsgyvengadhswavdtnipststqtstivtplapktemlppvpssstksstsapvlqekisynlatdidatdylnqlkqktninnkisspagqceslmkpvsdfmrengftdiryrgmfiwnnateqipmnhfvvvgkkvgkdyvfdvsahqfenkgmpdlngplilaaedwakkyrgattrkliyysdfknastatntynalprelvlesmegktfitspnwyqtfkrthnihpevtvsdpatfslnysvnptaenlsppppppipshgqvpktvtpppppmrsplslsqplerlpanktkpigfnpgenkasfskleeagkhyykddksrqaapvntmsdfdnrylshtteapapsnvahlapgniyntkvtakgaekpaydiyiskdgeslitsssykvddittdskfgkplpyseimfnslkksgvdpknlkrsvqasienkvtqdvisaigtriqrgqvirvsptenpdafytllgtdnckatlhmlnqhaeefghkvvtsiefkgtgylvmnigtstqtstivtpppmpgtsqlvq
[0461]
seq id no:29(pau_02805)
[0462]
mpnkkysenthqgkkplikseannehaidnsplgigldlnsilgnnsaslsqihdysfwkeniseyykwmvvvkahlkqldwtlksmdspesaganiaknigtttlqtllntggsiaggaiggaigsaiapgvgtiagmgigalagtglnylndtaieklnekleiaypypktrnmifdinnydknplikaikkktkkdnlkvmagssltsqllgritpikipaykladlavshhralaglssdkarhildftnsirevlneshsdavafmrknygdnamglsglsskikgdkltldtlartrnkienrinsinkqtlklssknsne
[0463]
seq id no:30(pau_02806)
[0464]
mereysekekhkkhpiqlrdaieqhaeetannslglgldlhqaintpkvpkdnyneengdlfyglaaqrgryiksvnpnfdpdktnsspmvidvynnhvsntilnkypldklgklygnpqkyakdikvtnslqqdvaaskrgwyplwndyfkagnenkkfniadiyketrnqygsdyyhtwheptgaapkllwkrgsklgiamaasnektkihfvldglniqevvnkqkgstpleqgrgesitaselryayrnrerlagkihfyendqetiapwekspelwqnyipknksqnesstpqrnngalyrlggpfrklraslrkrs
[0465]
seq id no:31(pau_02807)
[0466]
mvheysindrqkrhsfssanpidpevtnrensrhrfpkdnynkghgdlfyglapergkyikeanpkfdpnnpenaamiidvyndeisrvilnnnankistnrllnfiynfrknrlenlmknpekyakdikvkdnlrenispkkiekyplwndyfeagirnkkfniaeifketasqynsdyyhawhiggnsaprllwkrgsklgieiaasnqrtkihfildglkiedvvnktkgpaplkagpgesitaselryayrnrarlagrihfyengketiapwdkdpelwqkytpknrsgmel
[0467]
seq id no:32(pau_03332)
[0468]
mlkyanpqtvatqrtkntakkppsstsfdghlelsngenqpyeghkirkikglrqhladrslnkghisplmnkgllvgskdvsidipviahrydsshqltdaeplkadshsnhldpfygviagfrgdqvtssesgsgsigvhwgkntldsnimgvnvvngasgtvgirialkdiqhgspvivtsgalsgctmvysvkngyffayhtgqkpgnnewktgrqgvvatylshqalspdsepmtvgeqnndlvnifanydqsvitymgkpgvlidkmaenvgvfnydeikpekpairagysyallakddkgkvnvkvlsedvivssgkqgntvkainslkkrll
[0469]
seq id no:33(pau_03337)
[0470]
mpryanyqinpkqniknshgkssssdfssgylsfsnnslddpfirqqvkrefiweghmkeieeasrlgnfavsfraaggptlralgkgaaakghdilektikpgsinkaypkdeasdvikkvqeagiegyvghwdkktgrllgiymssghglsdeqvngkiypidlnnleaslsalkakenwaalpftgdydmhdmisftgqphsvpsnsseerkiidrinrlvarsdsnrpfgdiehnvirhgaqvsypafamdkekeeikkhggivkavaepgefpvaivskgkwtiannidelnqfynsigakmkvswkpgaenpgfvsnpqrpgmarfsrkr
[0471]
seq id no:34(plu1651)
[0472]
mpnkkysenthqgknplmksgannehdlqdsplgigldlnsmlvnsstslsqiqdysfwkeniseyykwmvvveshlkqldwtlksmdspesagtnvaknmgvtalqsllntgssiaggaiggaigsaiapgvgtiagagigalagtglnylndtamsklskkleiahpypktrnmildinnydknpiikaikknvnkdnlkvtagssltsklvgtvtspikfpaykfaelavshhraleglsddkarhildftnsirevlkeshsdavafmrknygdnamglsgfsskikrekltlntlaktkneienrinsinkqtlkvssrsrne
[0473]
seq id no:35(plu1671)
[0474]
mlstekhnkdtkhprnrekkfsiqpenstqddediknnslgvgldldqmirntsstltnapqkpedgyyyhisrgnnlqsflqngfkpqgspgptlseedfsrrkigiikliysiiattinknrkakkiskdnflmpqefwhefknfyqniptqtniddqllkksitesidkldqnkfmekhsdrkqtiinnereailqqderineiissrakmiqqreaentegyiylaphkntlleymkhlqeeknlflilavkediftekgleqdpqephgavrykgalsteelnfvnqegqicaipasigemdygdfilnqqqvidfckk
[0475]
seq id no:36(plu1672)
[0476]
mpindlkkkfeispqaaqaigaparsnsskqaehqtehleldtsknrrdrkdlnaqatpnqqhtkkletevnnggnkskaqahtpdlvmkkessvtpntrkspnekikaedifhrykdrfspsdrelpfeimneitnngiafssekapeshldkvkdkkftlrhytsgngqekptfneigsnfnlvnegiktlkrtqgsntneddwnrlgntaftffllaidgevsdrkflsntthfaeidienpaelkelgldeteffaspdllheknlsqapavkgklsdlkslllkqsgikpvqlqs
lgakgileridskfngsleikipgnvkvkewkkvek
[0477]
seq id no:37(plu1690)
[0478]
mpnskysekvnhsangaekcsihsnqyninnctlglgldlnkklrtgnerniegaqpfipfpskqkqystspiamadilnesaltsqpiitdlinpqkikmsdgvknilnnkegggdlvfkalqikpsdetlpfnalkivdtyqeempnkdmsisaywapqggyvdipaqpdisrhpqyvftpnfsgcsfvvdkmnedtlrvrhvqggqedveynnqnidhgmgmitamefrdygyheaddkvientygfaflkfnqekkqwqlhyqkiaaapniiniktksswlpfskpsieadtftfknmkvpgysrkninnn
[0479]
seq id no:38(plu1691)
[0480]
mpkltellsrfenpiqnqpnhiskknpisnskvlnnseektaplelkhddskiksqvsipnlvkknekpaasntpnnshekvkaedifnrfkskfdpydrelpfdimnkitnneikfssekskddylakvkdkkftlrhytagtgqekptfdeissnfnlvnkgiktlnrtqgsntneddwnrlgntaftfyllaidgevsnrkflsntthfaeiniedseelkelgldqaeffaspdllheknlsqapavkgklsdlkslllkrsgissvqlgrldakailksidnefgnsleikipgnvkvnkwnki
[0481]
seq id no:39(plu1712)
[0482]
mprysnsqrtptqstkntrrtspssnsstehlslsnaptndssvrqevkekfiweghweghmeaiekasilgnfavsfraagkptlealgkgaaakghdilektikpgsiekaypeneasdvikkvreagiegyvghwnketgrlegiymssghglpngqvngkiypidlnnleaslaplkekknwaalpftgdydmhdmisfttqphsvpsnsseekkiidrineyiaksdsnrpfediehnvirhgpqvsypafamdkekkeikerggivkavaepgefpvaivskgkwtiannineleqfynsigakmkaswkpgagnpgfvsnpqkpgmarfsrkk
[0483]
seq id no:40(plu1713)
[0484]
mfstysskndnqtinkinteekhentetdnhleinlehtgkskpdiepkdvttgtinagtllykttaipefldnakslglaeyekrhkdiqdylnlgkaedaeklknksqwagqyfaleksydeyaneapdsynnllknagkdllenteevkvflytfkvtkdikvlkphnnsnsyyvgdtegwekakeimndvqsqsekndnpfpelknledknflleelgekgyawmgplhakegaekgtefsyelaispnllrqhltleseellgtyknrygywdkk
[0485]
seq id no:41(plu1714)
[0486]
mkktdekygqyeykdeditsypiawtnpdngkiyiginspeyshlnnkgeselnlakiistiiheslhasshqhkglqsqtdtgadnlnydeyvtdyfarevykqilpdkdyvancftkglggenkiwggnivefmiq
[0487]
seq id no:42(plu2400)
[0488]
mvyeydktierrrnpsiqlnnneksseqalelsqnnpllhdlitsnnlrkeaavfakrigpsyqeildelehlhhlsgneqlaagfelhrrithyleehpdskrntalrrtqtqfgdlmftgtlqkirhsllemaetrpemashiyqiareevkgntpgltdlmvrwvkedpylaaktgyqgkipndlpfepkfhvelgaqfddfkkwldtaqskellthtrldeqnkqvhlgysynelldmtgvesvqmavyflkeaakqaepgstksqedillhrfanptylaqlehsrlaqieaiyhsshdtdvtawdqqfasdaltqfnhqlnntvdlnsqlslllkdrqglligeshgsdlnglrfveeqmevlkahgvtviglehlrsdlaqplidkflasgnepmpaelaallktkhlsanlfeqarskqmkiialdnnsttrptvegtqhglmyragaannvaverlrqlpagekfvaiygnahlqshegidhflpgithrlglpalkvdennrftaqvdninqrkryddvvelpriqlts
[0489]
seq id no:43(plu2401)
[0490]
meheysekekpqkcpiqlrdsiehdkedintttplelnsqytnrkraglrerfsttlqrnlpghsmldrelttdgmknqesrfspamimdrmmhfgvrtrlgkvrnsaskhggqvtfkfaqtkgtfldqimkhkdtsggvcesisa
hwisahakgesifdqlyvggqkgkfhidslvsikqlqmdsylddeqstmteywlgtqgiqpimqkndvdehsskvvgqtgnkgttdllraildtgdkgsgykkisflgkmaghtvaayvddqkgviffdpnfgefsfpsitsfsrwftddfwpkswynleiglgqqfevfnyelkks
[0491]
seq id no:44(plu2514)
[0492]
mydskkknsepttkkkfersnysqwddsinhyedmnrariknrndilttvdyfgekkktmhtfeyqsdikhdtnfnnknkslfesfaasfvlqnpsffsgvidklskklfniiskidernnfqkklydfiekdtspegqfgrftlgkneilnvlqvksdtpqlfvkkmllikslgafiidfsskdignydfifdgkgrevndiieknrptnlfkvrgrtnikssqhrsdigildtptfdslteeqksfltipeltkrrplfrtftheldaedkrvvesvfvnrtfdcdspligsvsgstscvlvaadilfpdmtmverkklaiatfaflvgggyhsatevfdvaypgldlnkeieeliennpiqenagvatlrqlignsgf
[0493]
seq id no:45(plu2515)
[0494]
mpisnlakesevravkdipcknietdnhleiglssglsrskdtskfkknsintikliddiialhndpkgnkllwndnwqdkiinrdlanifekidesvselgglemyqemvgvnpydptepvcglsaqnifklmtegehavdpvemaqtgkidgnefaesvdqlssaknyvalvndrrlghmflidipsndqetvgyiyqsdlgqgalpplkiadwlnsrgkdavslnklkkllsrefnllsddekralisetldihkdvsnveldrikrdrgvdiylteydvnnfyenietlksklsnydkklskpk
[0495]
seq id no:46(plu1649)
[0496]
mlanvlpnlasflkyeketplffiedgfnfqnlnpgrvpliktpeqrkagdtqspaflcsgvilrgtihsndykfwqpspssiksggvsfsylrkdakfkrlaygykngfiifpehiapedrvdfsvlcafpidgytneranqgcgenitkakdkgkscqeqnvtnsddwiknyrkvnsqdffqcgfnvtkdvnnpaiafyqmlesikklprtpntppkqneiristweesdpnklpiealfysensgladaqkdqrdyknatgkflpivkmllprtlnedalfkfnikdqvinp
[0497]
前导序列(例如,seq id no:47-92分别对应于seq id no:1-seq id no:46的氨基酸1-50)
[0498]
[0499][0500]
seq id no:93(不对称光杆状菌菌株atcc43949pvcpnf操纵子,pvc1-pvc16;例如,对应于genbank登录号fm162591.1的序列的基因pau03353至pau03338)
[0501]
tgagaaaattccatttaatagtgtttcaggattagatattagttatgacaccattgaataccgagatggtgttggtaattggttcaaaatgccgggtcagagtcagagcactaatatcaccttgcgtaaaggcgttttcccggggaaaacagaactgtttgattggattaactctattcagcttaatcaggtagagaaaaaggatattaccatcagtttaactaatgatgcaggtaccgaattattaatgacctggaatgtttctaatgcttttcccacttcattgacttcaccttcatt
tgatgccaccagtaatgatattgcagtacaggaaattacgctgatggcagatcgggtgattatgcaggctgtttgaagcattgatatttaatcatctcatataagggaacttttatgacaaccgttaccagttatcctggcgtttatattgaagaattaaatagcctggccttgtcagtttcaaatagcgccacagcggttcctgtttttgctgtggacgaacaaaaccaatatattagtgaagataatgcaatccgtattaattcgtggatggattatcttaatctgattggcaattttaataatgaagacaaattagatgtttctgtgcgtgcttattttgccaatggaggtggatattgttatctcgtcaaaacaacgagtttagaaaaaattattccaaccttggatgatgtaaccttattggttgctgcgggcgaagatattaaaacgacagtagatgttttatgtcagccaggaaaagggttattcgcagtctttgatggccctgaaacagagttgactatcaacggtgcggaagaggcaaaacaagcctataccgccacaccattcgctgcggtttattatccttggttgaaagcggattgggctaacatagatattccacccagtgcagtgatggcgggagtttatgcatcggtggatttatcccgtggtgtatggaaagcgcctgccaatgttgcgttgaaagggggcctggaacctaaatttttagtcacggatgaattgcagggtgaatataacactggccgcgctatcaatatgattcgtaatttcagtaacacaggtactacggtttggggtgcaagaaccctggaagataaagacaattggcgttatgttccagtgcgacgcttgtttaattctgtggagcgggatatcaagcgtgccatgagctttgctatgttcgagcctaataatcagcctacttgggagcgggtacgggcggcgattagcaactacctttatagcctgtggcaacaggggggattagctggcagcaaagaagaagacgcttattttgtgcaaattggtaaaggtataacgatgacacaggagcagattgatgcagggcaaatgattgttaaagtcggtttggctgctgtacggcctgcggaatttatcattctccagtttacgcaagatgtagaacagcgttaatcatatgattatgaggagttatcatgtctgctattctgaaagcgcctggcgtttatattgaagaagacgcttccctagcgttgtctgtcagtaacagcgcgactgccgtgcctgtttttatcggaaaatttactccgacagtggttgattcaatccaagtctgtacccgtatcagcaactggcttgaattcacttcctctttttccctagctccaacagttgagattgttgtccaatctaacactgaatctgaatctgaatctgaaacttaccactatattgagacaatcaatttatctccagctgtggaagcattgcgactctattttcaaaatggcggaggagcttgctatatctacccattaaatgatgctgaagatgaattggttctggcggccataccagaagtcattgaacagaaaggtgatattactctgttggtttgcccggaactcgatctggattacaaaactaagatctatggcgcagtgagctcactgttgaatgataacaaagtgggctatttcctgattgcggatagcaatgatggagaatctgtgtcaggagtatggaatagtgctaaggccgccgcctattatccccagttggaaactaacctaaaattttccacgttgcctggggataaggacattcgtatcagcggttatcaggatgatgatgaaacacataaaccgaaaaacttggatgagctcaggacaatcaacgaggcgttggcacaggatattgatgcaagattgctcgaggagaaacaacgtgctgtcatcattccgccaagtgctgccattgcgggcatttattgccaaacggataatcgtcgcggtgtttggaaagcgccagccaacgttgcgctcacagggatcgggagtttgcttgataaggtagacgatgaacggcagggagagatgaatgacaagggaatcaatgtcatccgttcatttaccgaccgtggttttatggtctggggagcccgtacttgtgtggacgctgccaacatcagctggcgttatattcctgttcgtcgcctgttcaattccgttgaacgagatatccgccaggcgctgcgcgctgtgttgtttgaaactaatagtcagcctacctgggtacgtgctaaggctgccgttgatcaatatctttataccctttggcagaaaaatgcattgatgggtgctcgcccggaagaagcttattttgtgcaaattggtcaggatatcaccatgtccgaggctgatattaaacagggtaagatgatcatgactgttggtttggcagcagtgcggccagctgagttcatcattctgcaatttacgcaggatgttgttcagtaatctccatgactaaacgccaggcactgtattgacagtgcctactctaaccatcttggaggaggtgatgatgatggagagactccaaccgggtgtgactttaacagaaagtataatcacgatgggtcagcaagagatacccagtgctgtgccggtgtttattggttacaccgttcgttatccggaacaatcggaagcatcagtccgtatcgacagtttggccgagtataccagcctgtttggtgacgaccatgtgatgatgtttgctgtcaggcactattttgataatggcgggcaacaggcatttgttttacccctgaaggacaatatgccatcagtggagatgaccacagctgaagcggaaaatctgatagccgcattgcgctctgctacggttagcgaagccattggtgggcatagtcagattacactgattttggtaccggatatggctcggcttaatgacagtgatattgat
gactcctcaacccaggtaagcctgtggtcccaaggctgggaggcgctgctgcaattgagtcaggttaggcccaacctctttgtgctgttagatgcgccggataatgttgaacaggcgcagaagtgtatgacaacgctatcgtcagattatcgtcaatggggggcagcatattggcctcgtctggaaactacctatcagaaagaaatatctggcaaggacaatgaatctcagggaattttccaggggactgttctgtcacccacagccgcggtcgcagcggtaattcaacgcacggataacgacgcgggtgtttggaaagcaccggccaatattgccttatcccaggttattcgacctgttaaatcttatcttcagggaagtgtactgtttaacagcagcggcacttcgctcaatgtgatccgcagtttcccaggtaagggcatacgggtatggggatgccgcactctggaaaacacggataatacgcagtggcgctatctgcaaacacgtcggctggtttcctatgtaacagcgcatttgacccaattggctcgcatgtatgtctttgagccaaataatgaacttacctggatgaagttaaaaggacaaagttacaactggttacggcaattatggttgcagggtggcttgtatggttcacaggaggatgaggcatttaacattctgttaggcgtaaacgagacgatgactgaggatgatgttcgtgcaggaaaaatgatcatgaaagttgagttggctgtgttgtttcctgccgaatttattgagatcagtttggtgtttaatacccaaacagaggcgctgtcttaagaaggaaaaagtacgatgaacgattattacacacccgtggtatcccatcgttttatggcgagttttatttttaaccgcattcccgatccgctggatattcgttttcagcgtatctctggccttagtcgggaactacaggtgactcagtacagtgagggaggagaaaatgcccgtaataactatttagctgagaaaatccaacacggtacgttgactttggaacggggcgtgatgacagtctcgccattgacctggatgtttgatcgggtattgagtggtgaaaaaatcgcttatgccgatgtggtggtgatgctactgaatgaaaattcactgccattgtccagttggacgttgagcaatgcgctgccggtacgctggcaaaccagcgactttgacgctaacagcaatgccatattggtgaatacccttgaattgcgttaccaggatatgcgctggcttggagtcaaaatatgacagtagaaatcagagagttacttatccaggcaaaggtagtgccatcaacacgaccgactgaatcagaacggcaaaaccattctttgatacaggaaagtctggatgaggcgacttgggtggaaacgataaaacgcgaagtgttggccgcattacgcgatgaggaagggtggcgtccatgagtctgattgaacgtggtttagctaagctgacaattaatgcttataaggatagggaagggaagatacgggcaggaacgttgcaggccatgtataaccctgactccttgcaactggattaccaaacggattatcagcaatcccaagcgattaatagcgaaaagcaaagtagcatttatgtacaggccaagcccgcagggttatcacttgaattaatttttgatgccacgatgccgggtaacaaaacccccattgaagagcagctcatgcagctcaagcaactgtgcagtgtggatgcaaccagtaacgagacgcgattcctgcaagttaaatggggcaaaatgcgttgggaaagtcggggttactttgctggcagggccaagagtttgtctgtgaattacactttgtttgatcgtgatgcgactcccttgagggtacgggtaatattggcattagtggctgatgaaagtctggtgttgcaggagactgaacaaaatctgcaatctccggcaaaaatcgcattacgcatacaggatggggtatctctggctctgatggcagccagtacggcatcaacattgtcaggcggtgtggattatctgacgctggcctggcaaaacggtctggataatctcaatgggttcgttccgggtgaaatattgcaggccaccaggggagacgaatcatgagccaccaactgaaaattattgcagatggtaaggcactgtcacttttggccgcggtagatgtggacacctgttatcgggttaacagtataccttctgcgacattgaaactgagcgtaccggataggccactctcttctttcagtcagacggatgttcagacagaactggcccactgtcaggtagggaaaaccctgcgtctggaattgattgatggtagcaaaaaatgggtgctgtttaatggtcttattacccgtaaggctctgagaattaagaataagcaattattgctcactctggttgtcaagcatcggttgcaactgatggtggatacccagcattcacagctgtttaaagacaaaagcgaaaaagcgatcttaagcacgctattgaatcagaccggaatcaatgctcgcttcggaaagatagcggcgttagatcaaaagcatgaacagatggtgcaatttcgttgttcagactggcattttctgttgtgccgactgtcggcaaccggtgcatggttgttacctgccatagaagacgttcagtttgttcaacctgatgctctgaaatcaaactcagcctataccttgaagagcaggggggatgagaacaaagacatcgttgtcaaggatgcttactggcagtttgacaatcaaatcaaccccgctttgctggaagtcagtggctgggatatcagtaagcagcaggtacaatcaggcggtcgctacggaaaaatcgcgttgggtaaggcggcactctctcctgatggattggcatcccttaataaaacgggttgggacatttgttatagcagtccgttaacaacccaggaaagc
ggttatctggcacagggattattgcttaaccagcgcatttctggggtgacaggagaatttttgctcaaaggagatgggcgttaccagttgggagacaacattcagctgactggatttggttcacagttagatggtacggcaagcattactgaggttcgccaccgtcttaatcggcgaattgattgggaaaccacggtgagcattggtttacaacatgaatatttgccgatattacctgatgctcccgaactacatattgcgacagtagcgaaatatcagcaggacagtgcggtgttaaaccgtatccccattattctgccggtactgaatcgtcccaatgaatttttgtgggccagattggggaaaccttatgctagccatgaaagcggtttctgtttttacccagagccaggtgacgaagttattattggtttttttgaaaatgatccgcgttatccagttattttaggtgctatgcataatccgaaaaataaggccccttttgaaccaacccaagataatagggaaaaagtattgatcgttaaaaaaggtgaagcgcaacaacaattagtcattgatggcaaagagaaaatgatccgaattaatgcgggtgaaaatcaaataatgcttcagcaagataaagacatttctctgtcaacgaaaaaagaattaacactgaaagcgcagacaatgaatgccacgatggataaatcattggcaatgtccgggaaaaacagtgttgaaatcaaaggcgcaaaaattaatcttacccaatgaaaggtgacgatgaatggaaaatcaaatactgacacaactctatggtcgtggttgggcttttcctccggtcttttcccttgaaaagggggtagagatggctgaaggggcggaagatgtgagacaaagtttgcagattctgtttagtactgagccgggggaacgtcttatgcgtgaaaattatggctgcggattaaatgattttatgtttgaaaatatccgcaatgaacttattgctgaaattgaatcccatatccatgacaacgtattacgatatgaaccccgggctgatatgactgatattcaggttcgtcaatcccctggcatggggaatactttgcaagtgcaggtcatgtatcgcctgagagggagtgatatcaatcaacaaatccagggagtacttgcactgagtgaaggccgggtgacggaggtagtatgagtgaagcgattgtggtggatggtgacgtgttacagtttgatcccaactttggcaatcggcaggtgacggttcccagcccaggaaaaattagcggcacaggacatgcgcaggtaagtggaaaaaaagtgtgtattctgggggatgagaaacaggtcagggtttctgcaacctatattacaacaacacatactacgccgggaacaggaaccattactatcagtgctctggatgctggccagcaggcccttcagtgtaccagtggggcggctttaattatcaaggggcagcaatttacggcgatgtttacgcctgaattgccagccatgaataatacagtgactccgccacaaccggatgttacgacaccttcatcaggaaaaggacgttttatcactcaacaaaattttgctaccgtaaattagagtattgactgaattaaatagaattaacgaaggtgtaaataattatttatttgctgacgaatcgctgtgacaaataaacacaggtgatgttatggaattaaatgagttaactaacaaattgtcaaatttggtgccaatgaccgattttaaattagataatcgagccagtttgcaattgcttaaatatattgaagcgtatacgaagataataccctttaattctggcgataaatattggaatgactttttctttatgtcaggaaatacgccagagaaacttgcaaaattatatcagaaagaaatagaacccaatggggagttattacctcagcaggcttttttgttggcggttttgcgtttattggaaacaccaatatccttattaaatgtattacctgctgctcatcgtgagctctattatcgggagcttttaggcttgtcttcccatgcggcacagcctgatcaggttgctttatctatggaactgaattcgacagtgatggaacagctgctccctgaaggaaccctgtttgaggctggtcaggatgaacaaggcaatgcattgcaatatgccctggatgccagtttgctggctaatcgtggatatatcagtgacttgcgctggttacggaatgacggggaaaagcaatgggttacttctgctccatgggatttacaggcacaggtgtcactgccgtctgatgggatacgattatttggtaagacaaatagtgatcagcaggtatttggtggggtgttgataacgtcatcacttctggcgatggaagcggggataaggaagatcattgttacttttgagcaggagatgaacacccaagaactggtggcacaggtcagcagtggaaatcaatggctaacattgacgtctgaggtaaataagaaagaggtcacactgacactgtcagacaaagaaccggcaatcagtgcgccagaggatctggataatctctttttcacgcaaccggtactcaggctacagggaaaggatagtcaggcactgccggaggtgacgggtatcagcgtttcggaaaaggatgatactaaggatacctcttttgagatgtatcacttaacaccatttggttatagcagtgatatagagccattggaggaaaatccagcgttatatttaggctttactgatgtaaagccagggcaaacactggcgctgtattggaaattaaaatccccgcagcaaccaaccgtttcctggtattacctggatcaacataatcaatgggctgaattggattcatgggtcagtgatggaacccagaatctgtatcaggatggtacttggcacgttgagttgcctgtggatgcatccaatcaggcagagcagatgcc
agttggacgctattggttgcgggcagtggtggaggtacccgctcatgagggggcgttggggaaggctccttggctatatggtctaatctataacgccatgacggcaaccttggttaatgtagatagcatcagtgacagccatttcttaacccctttgcctgccagcagcatacagcggcccgttgaacccatcattgtgttggcatcggtcaaccagccttgggcatcatggggtggacgtatacctgaatcctacagtgccttttttgaacggatagctcaaaacctgtctcatcgaaaccggtccttaacctggggaaatatggtgacattactcaaagagcgttatgtcagcatctttgatgttaagtatccaggtaatgatgaactcaccagagtgccagcattggagcagcagcaactaacagtgattccagcaaaccggtacaacgatagcgatgattctctgcgtccggtactgaatcctgctcgtctgcaagagatggctgattggttgcagcagaaagactctccctgggcctctattgaggtcaggaatccagaatacttggatgtgaaaatccattacgaggtgatttttaaacctgatgtgaacgaagattttggctatcgccagctacagcagcaactgtgtgaggtgtatatgccttggagcatagatgagcagcggcccgttgtattgaataacagcattaattatttccagttgttagccactattcaacagcaaccgctggttgagcgagtcactcgtctgacactacatcgggctgattcttctgatgagagtgatggtacagcatctgtggaagccaaagataatgaagtgcttattttagtctgggaagaggacgataatctgcaataccgaggaaatgactatgagtaatcaggatgcactgtttcatagcgttaaagacgatattcactttgataccttgctggaacaagctcatcaggtgattgaaaaacaggctgaaaaactgtggagtgatacggcagagcatgatccgggtatcacatttttgcagggaatcagttacggtgtgtcagatttggcttaccgacatacattacccctgaaagatttactgactccggcgccggatgagcagcagcaagagggaatttttcctgccgaatttggcccgcataatacactgacttgtgggccggtgacagcggatgattatcgcaaggcattgttagatctacacagcagcgacagcctggatggtactcagcaggatgagggggattttctgttccggagtgtgcaactggtgcgtgaaccggaaaaacagcgttatacctattggtatgatgcaaccaagagggaatatagctttgtcaacagtgaaggggctaaagagtttaccttgcgggggaattactggttgtatctggaaccaacccgttggactcagggtaatattgccgctgctaccagacaactgacagaatttttgactaaaaatcgcaatattggtgaatctgtcagcaacattatctggctacaaccggttgatctgccactgttgctggatgttgaactggatgatgatgtaggtgcacaggatgtccccggtatttttgcggcggtgtatagcaccgcagagcagtatctgatgcctggagcacagcgttaccgtacggaagtactgcaaaatgctgggatgagcaatgatcaaatcttcgaaggtccattattggaacatggctggataccagagctgccggcagcccgtgattatactcaaaggctcactctcaatcttagccggttggtaaatagtctgcttgagattgagggcattaaacatgtgaatcgtcttcgtctggatgatagcttcgataaaactgctattgaacccgttaagggggatacctggtcgtggtcgatcaaagagggctattatccacgtctttggggagaagacccacttaaccaattggcgcaacaaaatggcccgcttagggtgatagccaaaggagggattagcgtcagtgtgagtaaagagcaaatccaggccagtttacccagtcaatcactgattcaaaatgagccggtaatattggcttacggccagcaccgtgacgttggcagctattatcccgtcagtgatactttgccgccttgctatggactacaacattctttgtctgaaagtgaacacttattgccacttcatcaatttatgttgccatttgaacaattattggcctgtggttgtcaacagatagccatgctcccgcggttactggcttttcagcgcgaaggttatgaggtttggggtgatcagtggccctttaagtcaggctcagtgaatgatgacgcccatcaagattatgcccctgcattaaaggatttgttaggacagattgcgctggatagtgatcatgaattggatattattaattacttgctgggttactttggcacacagcgggcaccgcgtacctttacgacacaactcgatgattttcgtgcggtccaacagggttatctggcccagcaaccgacattgacttaccaccgctccaatattcgtatcgatcaggtatcgtcgctacaaaaacgtattgctgctcgcatggggctgggcggtgagttgtttaaacctcaaccggatctgagccaactgcctttttatttgattgaacatcgagcgttgctgccagtcaaacccaatagtcagtttgataaggaacagaaaccagcctcggtgacagaggaggggggcagccaaacaggtcaacattatgtggtcattgaacagaagggcattgatggcaagctgacacaggggcaagtgatcaatttaattctgtatgaaggagagcagggagaaacccaatttacgatacgcggtcagatggtattcaaaaccgagggggataagttttggttggatgtgaataatagtgcgcaactggaatataatctggcgcgggtaatgacagcagccaaggcgagtaaac
tcttttggcaaaacagcccggtatggatggaggatatgggctatcgtctggcctatgctagtgaccaatcctcattgcctgtgaatcaacggcgcttgacccgcacagtgcaaactccattcccgccgatggttgttgtaggtagcgaaatcaccctgttaaagcaggtggggatagtcaatttaaaaaaagcggagtcagaaaaactttatgcaaaagttgttagctttgatcgcattgaagggaccttgattattgagcgtttgggtaattccactctggcttttcctacctcggaagaggcgtggcggtatagttggtatttttcgggggagaaatatgaaaggactgaccgcttttcatttgtgattagcgtagtagtgaacagtgacttaattaaattgcccggtgttgatccctataaattggaagaatgggtgaaagaaacgattcttaccgaatttccagctcatatttctatgattatccattggatggatcgggaagcctttttaaatttcgccaatacctatcagcgttggcaaaataatggtacgccactgggggatgcggcttattccattctagaaagtttgacacttggtaaattgccatctgccttaaaaggtgttggcacaatgcgtattgccacatctagtcaaagagaagaagtggtgggtagtaatggtgatcaatggaatacagatggaataacccagaatgaattattctatgttcctaaagagagctaggaaaaataaatatctgccactaatgatgttgaattaaatatgttttctggagttaatcatgaacgaaactcgttataatgcaactgtacaagaacaacaaacattatctaatccaaaagctgttggacctgacatcgataaattaaaggataaatttaaagagggcagtattcccctgcaaaccgatttcaatgagttaattgatattgccgatattggacgtaaagcctgtggtcaagcgccacaacaaaatggcccaggagaaggattgaaattggctgatgacggtacgcttaatttaaaaataggcactttttccaataaagacttttctccattaatattaaaagatgatgttttatctgtagatcttggtagtggtctgactaatgaaaccaatggaatctgtgtcggtcagggcgatggtattacagttaacactagcaatgtagctgtaaaacaaggtaacggaattagcgttactagtagtggtggtgttgccgttaaagttagtgctaataagggacttagcgttgatagtagtggtgttgcagttaaagttaatactgataagggaattagcgttgatggtaatggtgttgcagttaaagttaatactagtaaaggaattagcgttgataatacaggtgttgcagttatagctaatgctagtaagggaattagcgttgatggtagtggtgttgcagttatagctaatactagtaaaggaattagcgttgatggtagtggtgttgcagttatagctaatactagtaaaggaattagcgttgataatacaggtgttgcagttatagctaatgctagtaagggaattagcgttgatggtagtggtgttgcagttatagctaatactagtaaaggaattagcgttgatggtagtggtgttgcagttatagctaatactagtaaaggaattagcgttgatagtagtggtgttgcagttaaagttaaagctaatggcggaattaaagtagatgctaatggtgttgcaattgatcctaataatgtactccccaagggagtgattgtaatgttctctggcagtactgcaccaactggttgggcgttatgtgatggcaataatggtacaccaaatttaatcgatcgatttattttaggtgggaaagggactgatattaatggagtgagtactaatacagcttcaggtactaaaaatagtaagttattcgatttcagttctgatgaagctacattaactattgatggtaaaacactggggagagcattatcgttacagcaaatacctaatcatgcacactttagtggaataattatggatacagagaaagttaattattatggaagtaaaaaaatcacaacaaatgtgtggggtgtaacaacaggagataatacttcagtacgatatatttataagtcatcaggtgtacttgactctaacaataatgtctccaacagtaccttaggcggaaacagtctgcagacgcacgatcatgatattaagataacgggcacaggaaaacattctcacaaaaacaaagtaacagtcccttattatattctggctttcatcataaagctttaatatatatgaaaaattgaaaatataaattatccattaataataaagaggatattagcatgacttcggagccaaatctgttaaaccggattacaattactattgaagctaataatcaacaagtagctagaaaagtattgcatggctccttgcttaatcaagctaatataaataaattatttaattcatactttaatgaatatgaaattaataggggtgtttatttagaaacattaatcctgaatcttggtacgataaatttccatgattttaattcattgtttcctactctcctaaaagctgcattgaataaagaattcagtcaatatcagataaacaaccatagggaagaaatgctatttaatgagacaatatcaaatcaagctactgataagtcttacatatttggcgataacaaattaattgatgcagagaatttcattcactttttatatcaaaagcattccacattaaatctagtagaagcaatgggaaataatggtattgaaaaattaacaaatcagttaacacaaatagaaaataaatttgcgttattattggcaaaaagttgtttgtctgaggaaggcttaaaacgactcttggctatcaaacaacccgatttattaatcgctatcaatcgcagattatctgaaagaataaatagaccac
aatatcaggagaagcttgtttcctgcggacaactgatatttagtgctctgggatatatacaacagtacaatatacaggaaattcctaaaccggatgaaaaagttattgcacgcataacaactgaacttaataataatggtttgcttaatacaatacctattattacactatttcgtcagagtgggattaacgattcatcactaaatgattggctaaagaaaatctggcaggtgagatcaatttcacagttatgcagaaagtatctttctgctaaggaataccaatatctgtcagaacattttgtttcaaagagcgtcgataaaaatagatatgatgaagagcccgtaaatcagagcatattatcaaggttgaataataattccattaaagaaggaaataatcacagtcaactctgtactctcagtagactatattctgaacccgttgtattacctgaacaaaccattctacgtcaggttagtaatacagtagatcagagcatattatcaaggttgaataatgcctccattaaagaaggaaataaccaaagtcaacttcgcactctcagtagactatattctgagcccgttgcattacctgaacaaaccattccacgtcaggttagtaatacaggtatattaattctatggccaatgctacctacactatttaaccagcttggtctacttgagaaaaagaaatttatccatcgtcaggcccagtttaatgccgttgattttcttgattacctgatttggggaaccgaagatgtgaaagtggaacgaaaggttttgaataatgttctatgtgggttaatggctgatgaaattactgaaccaatgcctattgaaccagaaaaacaatggataataattcaatggctggacgctattatctcccaactttctggctggaaaaagttaagtcgtaatgacgtccgtcaattatttctacaacgaccaggagaattactgatcaatgaacaggaaattaaaatcacaatacagcaacaaccatttgatgctctgttaactgattggccgtggccaatgaatatggcttgttttagctggttgagtcaaccattaaccattacgtggttataaccattgaccacaatgacttagtctgagtaaaaaatatgaatatatcgcctgttttttatgattcattgaatcaggataacgaccgtgatctatcgtttttatttagcgaactggaacgaatagatctcgctcttcaacaccatttttattgtgtagaaagtcagcgaagtgagctcctggatgagtttctgctcactgaggcggaagtggtgaccaggctggataagccacttggtaaacctcattggataaatgatgattatctggcgatatcgcaaaagggcaatgtaagcctaatggcagcgtccagattaatggatctgatcgaacgctttgaactgactgattttgagcgcgatgttttactattaggcttattgccccattttgatagccgctattatcgactgttttcgctgattcaagggggacaacagggtcgattaccttcttttgcgctggcattggaactgttttgccactcggcgctggagaaacaggtacagcaagcgagttttctgcaccgggcacctttgatgggttgccagctattatccatcgatactagtcaaaaaacgctggcctggctccagactccctttattactgacagcggggtatatcactttttactggggcatcactacattatgccggctttagaacattgtgctgagtggttaacaccgacagggattggctgttatcctgaaggattaaaacaagtactgggtaacgtattgttatctgacaacgataatattagaccgattgtcttattacggggaatggccggcagtgccagagcttataccattactaatatgatggcttcagaagggaagcaaacactgctggtagatatatccaaacttgctgatagcgatgaaaaaaacattattcttcagataaagcatattttgcgggaaacccgcatgcatggagcatgtttattattacggaatttttgcttgttagtggaacagaataaacaactattggactccctgtcagagttattgaatcaacctgaattaagaattgtttgcctgattgagccttattccccattggtatggctgaaaaagataccggtattactgattgagatgccacttttaacgcctgcggaaaaagccagattgttaattgccagcttaccggataattgttccgaggatattgatacgataactttaagccagcgttacacttttaacccagaaaccctgccattgattttgcaagaggcccagctttatcaacagcagcgagatccgctggatatcttgcagcaatgcgatatacgccaggcattaaatttgcgtgctcaacaaaatttcggtcaattggcacagcggattattcctaagcgctcattaaaggatttattggtatccgatgagattgctcagcagttacgggaaatactcatagcaattaagtatcgggaacaggttctggcgggagggtttaaagataaaattgcctatggcactggtatcagcgccctgttttatggtgattcaggcactggaaaaaccatggcagcagaagtgattgctgaccacattggcgttgacttaataaaagtggatttatctacagtagtgaataaatacatcggtgaaacagaaaaaaacttatcccgtattttcgatttggcggaacaggatgcaggggtattattctttgatgaagctgacgcactgtttggtaaacgcagtgaaactaaagattcccaggacagacatgccaatattgaagtttcttacttattacagcgcctggagaattacccgggtctggtcattttatccaccaataatcgtggtcatttagacagtgcttttaatcgtcgttttactttcattacccgttttacttacccggatga
aaaaatccgtaaaaaaatgtggcaggaaatttggcctagaaatataaaaatatcggaagatatcgattttaacgaattagctcaacgaacaagcgtgactggcgcgaatatccgcaatattgctttattgtcttcattctttgcttcagagcaggggaatgatgaagtcagtaatgaaaatattgaaattgcattgaagcgtgaattagctaaagtcggacgattaacattttaaaagttatcacaatgaaagtattgaaatattaaataaatttattaccaaaaagttatcacgatataatttaagagaggttttttatgttaaacacgcaaactattattgatgtcaataaggcaatggatgccatgctgcgcgcatatctgaatcaagatattgccattcgttttgatctacctgaattggatactatgcaatctgatgcgatggtaagtatctttctttatgacattcatgaagatttacagcttcgctcggcagaatcaagagggtttgatgtttatgccgggaggttattgcctggttgggtaaatattaaatgtaactatctgattacctattgggaagcttctaagccagcgactgatgccagcagtccggatagccaacctgataaccaggcaatacaagtgatgtcacaagtattaaatgccttgattaataatcgtcaattggcaggtattcctggtgcttatactcaggttgtaccgcctaaagagagtttaaatagcctggggaatttctggcaatcactgggtaatcgcccacggctttctctcaattattcagtgacagtacctgttagcctaaacgatggtcaggatagcgcgactccggttaccgcggtttcttctacagtggaacaaacggcatcgctcagtcaagaagtggttagtcatgctttacgcgaattactcattacggaattaggaggaggagaggataaccggttggtactgagtaaagttgaattatccgcagtgaaagagacgatgactcaagacagtccggctcagatgattatattgttgtctgtttcaggcattacacgacaggaatatttgaaggaaattgataatatctttgatcgttgggtaaataatgctgaagttattaccactattgatgattgtgggattagaattgaaagtataacgaaagataatcttgtaggaatttaa
[0502]
seq id no:94(不对称光杆状菌菌株atcc43949pvclopt操纵子,pvc1-pvc16;例如,对应于genbank登录号fm162591.1的序列的基因pau02112至pau02099)
[0503]
cttttaacagcgtttcggggctggatattacttatgatgtcatcgagtataaagatggcaccggtaattattataaaatgccgggtcaacgtcagttaatcaatattacactgcgtaaaggggtattccctggcgacactaaactttttgattggcttaattccattcagcttaatcaggttgagaaaaaagatgtttcaattagcttgaccaacgaagttggaactgaaattttaatgacctggagcgtagccaatgcattcccaacctcattaacatctccttcttttgatgccaccagcaatgatatcgctgttcaagaaataaaactgactgccgatcgagtcactattcaggcagcttaaagcatcacgatgattgatatatcagacgggacaaaatgatcctcaaaatttggcacaacggctacccgtccaactaaatttaccctcttacagttcacgcaaaatatcgcacaatacaattggaggcaatatgccaacaacaacttatcccggcgtttatattgaagaagacgcctcactgtcactttccgttcgctcaagtgcaacggcggtgcccgtttttaccgttgaagatgacagtcaacttcatactcctaccagagtgaatagttggttagaatatctgacaaaaaaagcagataaaaaattcaattctaccgacaaacttgatatcgcattgcgcgcttattttattaacggcggcggatatggttatctcgtcaaagcgggtgaattaacaaatcaaattccaaaacttaacgatgtcacattactggtcgcggctggagaaaatatcaaagatgctgtgagtacactttgtcaaccgggcaaaggcttatttgccattctggatggcccaaccgaagagttaaagtctgatggcaaatccagagatccgtatgatcaaagcccttttgccgccgtttattacccctggctagttgctgattgggcagacaatattccgccaagcgcggccattgccggtatctattgttcagttgaccgtacccgcggtgtctggaaagccccagcaaatgtcatattacaaggcggggtgaaaccgaagtttaaagtcaccgatgacttacaaggtatttacaacaccggtaaagccatcaatatgatccgtgaatttccgaataccggtgtcaccatctggggcgcccgcacacttaaggacgaagataactggcgttacatcccagttcgccgcctgtttaacagtgcagagcgagacattaaaaatgccatgagtttcgcggtctttgaacctaacagccaacccacctggaaagctgtacaccgagctattgataattatctctatgccctttggcaacaaggagggctagcaggaaacaaagctgaacaagcttactttgtgcaaattggtaaagggataaccatgaccgatgatgatatcaagcaagggaaaatgattgttaaagtgggtatggccgcagtgcgcccggctgaatttatcatccttcaattttcacaaaatgtagcacagtaaccgtactgaggcgcggtttaacaccgcgtccattcagtctattgaatggaggagacaataatga
taacggagataaaacagccgggcgtcaccatcacggaaaattcgatatccccgaaatcagataatgaatttatcggcgtccccgtttttattggccataccgaaaaaaattcaagccataaaacggctgttaaactaaatagcctgatggactttacccaagctttcggtgcatcaggattaacctattattcagtacgccacttttttgaaaatggtggacagcaagcttatatcttgtcactggggattaatcaacagctaaaagattttcaatcattgattaccgccctgcaatggaactgggtaaaacaagccattgccgcagaaaacgaaatcacattgattgttgtgcctgatattacccgttttaatgatctcagcgctcaaaaaagcctttggctacaactctggcaatcaatacttgaactgtgtaaaagtcggcgtggcatcatgggattactggacgcgcctgatgatccaacattagcaactgagtgtttaaaacaattctcttccactgatcgccaatggggcgccgtatactggccaaggctaaaaagtacctaccaagaaaacggtacatacattgtactttcacctactgctgcggtcgccgccgttatgcaacgcaatgacagtcagaaaggcatatggactgctcccgccaatgtggctttagccaacgtcatcggtccggtacgttcttacattgaagctggaaccttgctgaatcaagaaggcacttcgttgaatctggtgcgtagcttccccggcaaaggcattaaaatctggggctgccgcactctggataacatacctcattctccctggcgttatatccaaattcgccgtttggtttcctatatcgaagctcatataacccaacttggccgcgcctttgtctttgaacccaacaacgccatcacctggatgaaatttaaaggtcaggcccacaactggctacgtcaattatggctaaaaggtggattacggggcactcaggaagatcaagcatttgaggtgttactgggtgttaatgaatccatgagtgaaacggatatcttggccggaaaaatgatcatgaaaatcaggctggcgctgttaattccggcagaatttattgagctgagtctgacgtttgatatccgtaacaataccgtacctagctaatctaaacaggggaaaaacatgtacaacttatacaccccgtcagtatctcaccgttttatcgccagttttctgtttaacaacattcccagcccacttgatatcgcctttcagcgtatatctggcctgagccgagaactgcaaaccacccaacatagccaaggtggagaaaacgccagaaacgtctggttatccgagaagatccaacatggcagcctggtgctggagcgcggtgttatgaccatcactcccctcaccttggtttttgatcgcgtgctgcgcggtgaaaaagccgtgtatgccgatgttgtcatcatgctactgaatgaaaatgcgttacccgtggcgagctggacagtcagtaacgcgctaccggttcgttggtccaccagcgactttgatgctaatagcaacaccgtactggtgagttctctggaattacgttatcaggatatgcgctggttaggagtaaaagcatgacggtagaaattaaagaactgattattcaggctaaagtcaccgattctacgagtgatcaactcgccccaagaacattagcccaagaaaagctggataacgcccgtttgattgacatagtgaaacgggaagtgttagaggcattacgtgaaggaggccatcatgagtttaattgaacgtggtttatccagactcaccctaaccgcttttaaagaccgagaaggtaaagtttccgtgggtcgcttacaagccatgtataaccccgatacgatccagcttgactaccaaacccgctaccaacaggatgaaagtgttaatcgtgccagccaaagcagccgttatgtattatcccaacccgccggattatccttagttctgctgtttgatgcctcgatgcccgataataacatgccgatagaaacccagcttgcgaccctgaaatccctgtgtgcgattgatgccagcaccaaagtaccccacttccttaaaatcaaatggggcaaaatgcgctgggaaaacaaaggttatttcgcctgccgagccagtagcctggccgtcaactataccctgtttgaccgggatgccacaccattgcgggccagcgccactctatctctggtagcggacgaaagctttattattcaagctaccgaacggcagttaaaatcaccgccggccactgcggttagcgtaactgatatgctctccctgcctttgattgctttagatgctggagcgtctctggctggtggcattgattatctctcgctggcctggcaaaacggtctggataatcttgatgactttacccccggacaaacactgcaagcgcggggggatgcatgaagatacccatgataaccctcaaaataggtggcaaaacgctcaatcaattgactgtcatcagtctgacaataaaccatcaaatcaatggcattccctcgaccaacatcaccttggggatcgctggcgatgcgagccatattttcgacaccaaagcccaagctgaactggcaagttgtcgccccaataatgaactcaccctacagatccaaaaaaccgtggtgtttaaagggagcatcgttcgacaagcacttgaactgaaaggtcaagacagcatcattaccctgacagcaaaacatccactacaaaagttaactcatagcctccattcacaattattcagtcaacagagtgatgaagcgattatcaggaaattattcaatcaggcgggtatccaaacaacgataaagcaggctcctcaacttaaaaccgttcatgaacaaatggtgcaatttcgttgcaatgactgggcattcctaaaaagccgattgattgccactaatacctggctgtt
gcccggcaatgaatcggttactttgataacacctaaggccctgaatcaatcgacagtgcatactcttcatcgacaggccagtgctgaagatattgtgttatttgcagcggatctccaatggaataaccaatatagccctaaaacggtgagtgtacgtgcctgggatattgctcaacaaaagctttccccagcaattaatacccaaaacagtcagcttggcagtcataaattggccgtggacagtatcgccgcactggctgataaagagtggcaatgggcttacagctatccattagataatgaacaagccaaacaccttgctcaaggcattatgaataacctgcgaagccataatatatctggcagttttgaaatcgaaggtaatcaccgttatcaaccgggggatgtcttggcgttaaatggttttggtcaggggatggacggtcaagggattatcaccggagtcagtcagataattaatcagcggcaaggctggcacaccctattaaccttaggcatgttacccgatgtagaaccgccggtgcctcaggtgaaagagttgcatatcggtatcgtggaaaaataccagcaagaccgccaatcactaagccgtatcccagtcagaatacccgcattaaacttgaccaaaggtgtcctttttgcccggctaggtaaaccttatgccagtcatgaaagcggattttgcttttatcccgaaccgggagatgaagtgattatcggattctttgaatgtgatcctcgttttccagtgatattaggttccatgcataatccgaaaaataaaccaccgttagaacccagtgaaaaaaatccggtgaaaactttagttatcaagcaaggggataaacaacaagcattaatattcgataataaagaaaacacggtggcacttaatagcggcgaaaataaagtctctctgcaacaggataaaaacattacgctcaattcaactaaaaatctcatcactcaggcccaagaaattaatatacaagcggaaaaatctctgtcagccacaggaaaatctggcgtcgatattaagggcgcgaaaattaacttaacccagtaatgaggtattgaaatgacaagccaaatattagccaatatttacggttgcggctggaaatttccgccacagttttctattgaaactggcgtagaaatggccgaaggtgccgaaaacgttcgccaaagtatgaaaatcctttttttaactgaacccggtgaacgaattatgcgtgaagattatggttgtggtctgaatgattacatgtttgaaaatatcagtgatgaattattatcggagattcaaacccgcattgaagaacgagtattgcgctatgaaccccgtgctgaaatcacagatatccaagtaactcagaaaacagactcaccgaatactttacatattcaagtgacctatgccctgagaggcagccaaatcagtcaacagcttgaaggggttcttgagatcaacgaaggtcaggcaaaggtgagtctatgagcaaacaactcattattgatggcgacagcctgctattcgagccattattcggcaaccggcaggtcactattttgatgccagcgaccatcagaggcagcggacacgcgcaaatccaaggcagaaagatagcgattgtcggcgatgaaaaaaaggtacaacttcaagcgcaatacattaccccaagccacccggtacctggcataggcacagttaccattgctcaattagataccagccagcaagtcaacttttgccacagccctgccacagtgatagttgtcgggcagcaatttaccgctcgatttaccccatcacagccggcaattaatccgtcaaccgggccagatgtcacaacacccagtatgggcaaaggccgttttattgccagtcaacatactatcaacgccggataaataactctgcaaaatcattattcaataacgttcctattctgcaatagctatcagcaatatattcaaataacaggtggtataatatgggactcaccgaattaaaaaataaactctctgctatcgtactcgatacggattttaaacttgatgaaagaagtacactggatattttaaactggctacaagaatatgctaaaaaaatccctttcaatcaagagaaaaaacagttctgggatagtttctattttattcaggaaaatagtcctgagaaattagccgatctttaccaaaacgttaataaaacgaatggccatttaccggcccatcaagcttttgttttagcctttttaaaacttttagaaaccaccaaagtattatttaatacttttccggcacgacatcgtgatctttattaccgggaattattaggtctaaaacccagaaatgcccaagcagatagtgttgctttaggcattaccttaaatacagataacacagaacatcttattcctaaaggaaccttgttcgatgccgggcaggacagggccggaaatccgctacaatacgcatcaaatgcagatttactggcgaatcaaggaaaattgagcgatctgcgttggtgtcgaaaagataatgatagctggcaatctgcaatactactgaaccactcagataatattgaattacctgaaaacagtattcgactttttagtccaacgccggatgatattcccgttttatccggttatttgataacttcgtctttatttgctatgccaacgggggaacgcagtattacattgactttagcagataattggcatggtgatattaagcacatcaccgctaaaatcagttcgggagatcactggctttcactatcagtaaaaaaagaacaagacaatagtattcactatcttaaactttatttatcaaccaatgatgaccccatcggtcctcctgatgctttggataatatagcgtttgatgtaccggtattaaagctgggcactgttcagggacctatactacccaagattacgggtattgaaattagcattaacggca
acagtaatgtacattattcctctgataacggtattgaaaaaatagatgcagctagttttccctttggacaatcaccgtcaccaggttccggttttaatctgattgcccctgaatggtatggtacagaaagcgccaaaattactcttactcctcaatggactggattacccaaagaggggtttaaagagtggtatcaaggatatagttctacccccgaaaataatgcatttaaagtacaggcttatttaatcacacctcaaaagagagaaaaatttaatgaagctcagtcattatttaatgaaagtaaagacaagaaaccacaaggaaaaagcctaacttttaccttacctgcaatggattattcctttgcaaacagcccatcatctaataactggcccgcatcaatacgcatagaactaaccgaacaggattttatgcatgcccaatattggcaaaatcctacgggtaaaaaacagccctatacccccaaaatgaacacattacaaattcagttcagtgccaaagttaaacccgaacaattttccgtttattctctcacgccttttggttggggaaaaacaggagaaaatagaacatcattaacccatgatacattctatttaggttttaccgatgtattaccaggacaaactttatccctgtactggcagttagaaggtattaaaaagctccctttatcctggtcttatctgaatcaagaaaatacctggagtccattggataatcaggtgcatgaccaaacccacaacctatttgatcgaggaatctggcgtacctcattgccacatgatgcttcaaaccaagcctctcaaatgccaaaaggacaatattgggtgaaggcacacattttacaaacgaatcaagcaaccctgactgatctgtattggtatcgaaaagataatgatgtctggaaatccgcaacacctcttagcctttcaaataacatgaaattacccgcaaacggtattcagatttttagcccaacatctcatgatgttccagttcgatacggctacctaattacttcatctttattctcattcctcaagaaaggacgcaatatcacattaattttagcaggagatagctgggagggtaatcctgaaaacatcaccgctaaaatcagttcaggaaatcactggttaacactatccgtcgaatatctgagtaatactaatagtcttaagttgcaattatcagataataataatgatcccatcagcccccctaatgctctggataatatgacgtttgacacgccattgttaaaactagaagccactcaggatttcactttgccctggatttataaggtatgcgttaatagcaacaatatactctctacctctgacagctcagatgcagcgattactcgtttcccctttggccaatcaccatcgttgggttccagctttagtccgaaaatcgttttcccggaatggtttgaatctgaatacgcatcagacaccacgatcacgattacccctcaatgggttaacctgcccacagaaaacttttcatcgtggtatgacggatatattaataaacctgccgataatagcgtatttaaaatagagggttatttacttactcattatcagggaaaaatcaaactcacagaagctgagacaggaagcgaaacccaagcattattcaatggaaacaatgcaccacaaggaaaaagcctgactttcactttacctaataggtataacttctatccgcgcaaccatcagtcaatgaagatagaaataaaactcgttaaacaagactttatgcacactcaacataagagcaatcccacaggcaaaaaaccaccctataccccgcaaatcagtgccttacaggtggaattcaatgctacagctttccatcgaaaattctccgtttatcctctcacgccttttggctggggcaaaacaggagaaaatagcacaccattaattcatgatacattttatttaggcttgaccgatatatcaccagagcaaactttttctctgtattggcagctaaagggccttaaagagctacctttgtcttggttttatctaagtgaagaaaatagctggaaatcattaaatagatcaacttacaaccaaacccacaacctgtttgaatcagcagaacaaagtatcctattaccacgggatgcttcaaaccaagcctctcaaatgccattaggacggtattggctgaaagcacagatagaacaggagaaaaaacagataaagatagcgcttcctgattattatccaagaatcagggggctgttgtataacgctaccatcgccactttaatcaacgctgaagctgttgagcaatctcaccttatcaacggattggctgctaacaacattaaacaaccggttaactcatccgttgccatcaacgaagttattcaaccctggacatcctggaacggtcgcccaaaagaaaccgagtcagcattcctggcacgagttcctgcccggctctctcatcgtaaccgagtgctaagctggggtaacattgccactttattaaaagagaattttagtagcttattcgatgtcaaatacccttctgtcagtgaattaaccaaaattccagcgccagaaaagcgacaattaaccatcatccccgacaaccgctataaagataatgatgattcactacgcccagtattgaaccaagccagactgaccgagatggtcgaatggttagatcgattaagtagcccttggacaactattgaaattaaaaatcccacatatgttaacgttctgatccactatgaactgatatttacctcggatgttaaccccgattatggcctccatcagctacaacaagaactcagtcgaaaatatatgccgtggggagaaaatgcagctattggcgtaacacccggtaatcgtattgactacttccagttattagcctcaattcaacaatcaccgctggttgaacgggtcaccaacttaacgttaaaaaaaggca
gccagcctaccgtaagtgaaagtatagaagccgccgatgatgaagtactgattttagtctggtcataaaaacttccccaacctaaggaattaacaaatgaataatcgagatatgctatttcctatcattaaagacgatattacctttgattctttattcgcccaggcaaaagccgttattgaacaacaatcggggcagctctggaataatacaggtgaaaatgatcccggcattactttattagaagcctgttgttatggcgcatccgatctggcctatcgccacacattgccactgcgagatttgcttactcctcaagaaaatgaacgaatagatgatggcatttttcccaaagaatttggtccacaacaaatactgacctgcggcccaattaccgcggaagattaccgtcgagctttgttagatttgcgtagtgataacaccgttgaaggttattttttctttaatgatgcacagctcattcgtgaaccggaaaatcaacgctattcatattggtataacaaagaaaaacgcgaatacagttttactcaagaccaatacagcgaacaattacagttaacactgagaggaaactattggctctatttacttcccagtcggaaaacccagctcgataacaccctggctgaagaaagactcaacatttttctgaaagataaccgaaacttaggagaatcggtcagtaaaattatttggctagaacccattaaactgtcattgaaaattgatattcagcttgatgatgacgccaaagatattgctgatatatttgctaaagtttatatgattgcagaacaaatggtgcttgaaaaaccattacgttataccactcaagcgatgaaagaactgggttacagtcaggaacaaatatttgaaggcccttatttacaccacggttggataccgaaattacctcaaaccaaagattatactcaccctaccgtattaaatctcagtcctttaattaatcagttactggctatcaaaggggtgaaacatattacccaatttacattggataagcctgataaaaaaatttctaagttaccaaatgataattggtcttgggaaatcgctccgggatattacccaaaactatggggagatactccattagaattaattacctcaccaacaagcccactcaccatcacggcaaaagggggaattaaaattgctattactaaacaacagatagaaaaaaacataatgacagaaccactaattaatacacagccagaattattgaactggggtaaacatcgcaaagtcctggattactatccgataagcaataaattacccgcttgctatggattacaaactaatacccaacaacagctacagttgcatcaatttatgctgccttttgaacaaatgctagcgaataactgcgctgaacttgctttattgccaagactattagcttttaaacaacgaggaaatacggtacatggcattcaatggccttttaaagaaaatacggttggtcaacatgttcataaggacatagtatctaatttaaacaataatgctacgaaaatcgataataatgccgatgactacgacaaggaactcgttattctagattatttgttaagatattttggggctcaatgtgcaatcccacgactatcaccagacccaccacaatcatcattaacagaacctcagactaaaaaagattttctatctactcagcgcgaatatctggctcaacagccaaaactgacttatcagcgtaacaatattcggattgataaagtatcagcactgcaaaaacgtatcgctgcccgattaggtctgggaggagaatgtttcaaagcagagcctgacttagctcaccttcctttctacctcattgaacatcgtaggctcttaccagtaaaacctgatataaaattctatattgagcaacaacctaattctctggaaattgaaaatgataaattaaaaatcacacagaaagattcagcgggtcggttactgcaaggtcaagttattaacctggaatttcgtgagggctatgatgaatttacattgctaaacttaatgataactgaagtgacaagagatacattcaccattagcattaataatagccgtgatctcagagacaatctggacaaagtgcaacacgcgtttgaacaaacgaataatctgagctggcacaatagcttaatatggatggaagatatggattatcaattggtttatgccaatggagaacaactggaaaaagcggaaaatgaacgatggattaccattaacaatcaaagtgctttccctgctatgatcggagagaatgatgaaatcacactaaaaattcaatccgattatgaacttaaaaccaaagtcgtgcggcttgattataacaacaaaaaaattctgattataaaagatgcgacatcaataaataattttccgccaaaaagagaagcatcatattattcttgctcttctctaaaagacaatgggtacggatattcggatgaatataaatatgaacttacttatattgatacagattctacaaaagaaaatgagtgctggattactatcagcgatccaaataatttgttttctcctgatatcatcgcagagaatgacgaaattatattgaaagctaaccctaattatgagtttaaaacgcacgtagtaaaatttgatcgtattaatagacaaatattacttaggaaaaatacagacctggaaaataattttccatcagaaaacaacacatcgcactatcgctggcatttctctggtgaaaaatatgcccaaactgaccatttttcatttgttgtcagtgcagtactgaatcgagaattaattgagaggggcacagtcgatctctataaattagagtcttgggtaaaaactgagattttatctgaattacccgcgcatatctcactcgttattcattggctatcatcggaagaattcgaaaaatttgccagtacttataaagtttggcaa
aataatggcgctcctttaggtgatcacgcatataaaattctagaaacattaacacttgggaaaaaaccttctacttcagcaagaaggtccagcagctatatagaagcacagtaataattcttacagaacattaacccatatttatcttataatatcaaacatcataaaaacaatcttcagctcattataatgacatatttcatactcaggtttcttcatatctgttaattacaaagagaatattaatatgatctcagcaccaaatctgttaaatcggattatcattactattgaagcgaataacgcacaggcagctaaaaaagtattgcatggctccctgcttaatcaatccagtataaacaaactctttgattcatactttaaccaatatgttgttaatcagactatctacctgaagacactcaccctgaatcttggcgaaatacgattaaatagttttaattcacagtttgttattcggcttaatactattctgagtcaagcattgagccaatatcaggtaaataatcaaactgatattgagaaatttatttattacttatatcgaaaagattctatattaaacccaatagaggaaatcaataatcgtgaaattactgacatcaatattaagcaattaattaaccaattaccccagatacaaaacaattggacactattattggcaaaaagctgtttatccacacatagcctgaaaaaactcctggctatcaaaaaaacagctttattaaccgccattaatcgtaaattatctgaaaagatcaatatatcaccctatcagcaggaatcggtttccacctggcaattgatactgaatgcgctgaaatatatacagcgacataatacacaggaaatacctgaacccgatgcgaaagtcatatcactcattacaacggaactcaatgacaatgccattaatacagcaccaattattgcattatttcgccaagttataaccaaccattccccactgaataagtggctggaacaactgtggcaaacaaagcgaatttcacagttatgtaaaaaacagctgtcaattgaagaataccaacatctatcggagcgctttattgccaaacacgggaataaaaataaatctgataaaaaatcatccatgacttccgaaccgctgttattacctgaacaccctccaccacgtcaggtcaataatgctggaatattagttctgtggccgatgttacctactctatttaaccaattcggcctgtttgaaaaacaaaaatttattcatcgtcaagctcaatttagggctgttaatctacttgattatctcatttggggaaacgaagaaacacagacagaacgaaaaatattgaattgcgttctgtgtgggttaattgccgatgaggacacggaatcaatccctattgagccagaaaaacaacaggtaatagaacaatggttagatgcagttatcagtcaacttcctgcctggaaaaaattaagccgcaatgatagccgccaattgtttttacaacgcccgggggaattgctgacaaatgagcaggaaatcaaaattacggtacaacctcaaccattcgatgcactgttaaataactggccctggccgttaaatatcgccaaacttccctggctggatcgccctttattaatcaactggtaaaacattgacaaggtttatatgaaagaacatcaatatagaatagtcgatctacgctggatttattcccatttggagcgcatcgatctgctgttacaacgtcactattaccaaaagagagacaaatacgattcattgccagaaagttttttgcttgaagaagatgaattagaacaacgtctagcaaaaccgttgggtattcctcattggctaacagcaaataccggcgctggtgatacagaaacagaaaatcattctgcttccggcacattatcactgctagtcacgcgttttaaactcactgaatttgaacgtgatgtgttattgctaggtttattaccgcattttgacaaccgctatcatgcgttatttgctactctgcacggtaacagtaaaaaacagtggcccagttttgatttagcgattgaattatttagccaacatcaaagtaactggcaattatttcaacaccactttttaccgcaagctccattaatcaatcaccatttattacgactcaataaccaagaggaacccatttggctacaaactcaatttttaactcacaatgcagtctggtcttttttatccggtcagcgcgtcattttacctcccttaatatcctgcgcttactggcatattccaacctcacagacttggtatccaccaatccttggtcatgcatttgaaaaaatattgctgaatgaaacggacgaaatacgcccgctggtggttcttaaaggaaaacaggacagcgccagagaactggcagtcagtaatattatgggaattcacggcattaacactttaacgttcgatttatttcacctgccagatgaagagtgcaccacctcaatactcaatctgctaatagatgcaatacgagaaacccggctacataatgcctgtttattaatccgtaacttttctttgctggcagaggaaaagagaatatcgcatagagaattatcagctctactgaatcaacccaaattacgtgtggtttgtctggcagagtcagaagaatcattagcatgggttaaacacctgccgatagtgcaaattaatatgccaccggcgacgctggcagataaaaaaacgatgctggaagccagtttgccagataatgtcactaaaggaattaatataactcaattatgtcaacgtttttcatttacagcagaaacattaccgttaattatcaaggaagctcatcaataccaaatcctccgacaaccggaagatcaattgaaagaatctgatctacgtaaggcattaaattgccgcgcccaacaaaatttcggtaaattagcccagcgtatgacaccaaaacgaag
ttttaatgatttggttatttccgctgacttaactcaacagttgaaagaaatcatcgcagcaattaattaccgtgaccaaattctgggcgcaggttttcgggaaaaaatcagctatggtactggtattagcgccctattttacggtgaatccgggacggggaaaaccatggccgcagaagtgattgccagctatcttggtgttgatctgattaaggtagatctttctaccgtggtgaataaatacatcggtgaaaccgaaaaaaatatctcccgtattttcgatctggccgaagcggattccggggtgctgtttttcgatgaagccgatgccttattcggtaaacgcagtgaaaccaaagatgcccaagatagacatgccaatattgaagtttcttatttattacagcgactagaaaattatccgggattagtgattttagcgactaacaatcgcaaccatttggatagtgcgtttaatcgccgctttacctttattacccgctttacttatcccgatgaagcattacgcaaagcaatgtggcaggcaatttggcctgaacaacttaagttatcagatcaacttgattttgagcatttggctaaacaggcaaatctgaccggtgctaatatcagaaatattgccttattatcatcaatattagctacagataataatagtgatcaaattgaaaataaacatatagcgcgagcattgatacttgaattaaataaaacgggccgattgattttttaatcatttatacccaataaatttcgagttgcagcgcggcggcaagtgaacgaatccccaggagcatagataactatgtgactggggtgagtgaaagcagccaacaaagcagcaacttgaaggatgaagggtatatagaattggagtgaatatgacaaatataattaaccctaataatgcgattcttgaagttaataacgcattaaatgatattttatctcagtatttaactaatattgatatccgctttgatctaccagaaataaattcaatcccatcaacccctacagtgagtatatttctttatgatatacatgaagacctacaattacgttctgctgaaccaagaagttatcatcctaccaccagctcattattgccgggatgggtaaatattaattataactatttaattacttactggcattcaagtaatccatcaagcgacagttctacccctgatagtcaacccaataatcaagcggcacaagtcatgactgctattttaaatgcattggttaacaaccgacaattacctaaaattcctggcgcatataccagagtcattccacctcaagaaaatctaaatagcttaggtaacttttggcaagcgcttggcaatcgccctcgcctttctttattatattcaattaccgcaccggtaaaactgcaaaatattaaagatgtcataaagcccattagccaaatttccacttctgtggatcaaaaatcaaatctggataattcgcaaatcaaccaagccttatttagcaaattgggtgccgatttaggtggcacacaagatgttcgtcttgctcttgcgaaagtgaatctgacaaccaaacctgctaaagaaaataatgaaaatcaaaataataaaaatgtaattattgaagtttctggcattacccatttggattatttacccagaataaaaggtattctttcaacatgggtaaatagtcatagtgctgttgttaggataaatgatattggtattattgtttcagaatataaatatgataaattaacaggcgtttaa
[0504]
seq id no:95(不对称光杆状菌菌株atcc43949pvcpatox操纵子,pvc1-pvc16)
[0505]
atgaatacagctcaagaaattattaaccgtttatcggggagagccgttacgcttggttgggatgttgttattgcttatgaccgaaaaaaaattaacactctgttagagcaacaatatgttgaaaaggtaaaaaacggggagaacttcccgcttatcaactgggagaaccagagaaaaacacttcaatttaaagatcttcaattaggtgttccacttatttcttttgagaattcaacactggaaaattcaagggcgcttgccacgatagaatttatttcaggagctattattgaatttagtgactccgggcaaataatcaactataagaagattgaacctagtcatggttatggcatggtgctgactatcgatctcatggctggtacaggttcagtagaagaacaaggtcgggtgataataaatcttaacgaaggcgccatactcgatttgcatgttatccaacaaccgccagcagaagtggtagaatttttccgcacttggttgatggctaataaaatgacttatgaattaggtaagctggatctgagtagtcaagctggtctagtgcctcgttcttttcgtattcgtactcagcgggcgcctgaaaaaattcgtaaagcgacgagcgatgaaggaaatggcgctgttttgttgtttgttgccactaactataaccctacaagtggaactttacctgccaaggattatccgtggctaatccctgaggaatattcaggcgcattgcttatcggtaataaatgcttatttaaagacattctgaaaccgaatctggatcagttgtttgataaaggggaatggacattaaaagttcagcaaacggattctgatcaactgctgcattatctggaggcaaactctgcatatataacagataagccttatatggcagactttgaaggaactcaggatggagtctggacaggacgttataaatttgagactggccggggacattatggggtgtatgaaaatgtacgctttcctatcaatggaatgttgatgaaaccggctaaaactggattacagttatcaatagattcaccacaaag
ccatcaatttaatgttgatttcggaatgaagtggttccattgtgctaatataatgtgtggttattcctggtttaacgagacttacccattttatcttgatggaaaatcattttatcaagttcatattgaccctgataaagaggtgatttattttactgggccagatgaagatattaatattgtaggaaattacagcccgcctgcgtggtggcaatctaaatggcaaaaacatatcagtgatgattttacggatatttcctcggaaaaatttaagcgactcagtcaaataaaattgccagaaatatgcatgtttgccgtgaaccatttattatttcctggtcataatactttgctgttgaaagacgtttatttaccgggtgatatggtgattttcggtgatattaacccatcacttaccgcttttcgggttacgccattaaaagcaacagtggtggcaaagggaacccaacaatttaaagccatagaaactaattgatgattatacccttcatccttcaagttgctgctttgttggctacgttcactcaccccagtcacatagttagctatgctcccggggattcgctccctggccgtcgcgatgcatcttgaaatccatagggtatatatttaattggataagtcttttttattttaacattataacctgattctttttggataaaattaaaggattattaacatgtctattacacaagaacaaatcgctgctgaatatcctattcctagttaccgttttatggtttctataggagatgtgcaagtcccttttaatagtgtttcgggattagataggaaatatgaggttattgaatataaagatggcattggtaattattataaaatgccaggacaaatacagagggttgatattacacttcggaaaggcatattctctgggaaaaatgatttatttaattggattaattccattgaactcaatcgggtagaaaaaaaggatattacaattagtttaactaatgatactggcagtaaagtcttaatgagttgggttgtttcgaacgcctttccgagctcactgacggccccttcatttgatgcttcaagtaatgaaattgcagtacaagaaatttcattagttgctgatcgggtaacaattcaggttccctgataactaaaaactttaaggaaaaataatgtctgtacaaacaacttatcccggaatttatattgaagaagatgcatcattgtctctatctatcaataatagtccaacagcaatccctgtttttatcggtaaattttacaacttggatggttccttacctaaagtgggaacatgttctagaattaccagttggttagatttcactaaaaaattttcggtagctcctcctcaaaccatttcattgatcgcgtcgccaattgctgacacacaagaaagtgtacccaaagcagttcaatatacttataaggccgagtttgaaacctcagaaaatctggcaaatggtgcctatgcggtacaacattatttccagaatggcggtggtatttgctatatcatacctttagttagcgtgaaaaaagaggatgctgcgattgagttaacaaaattacctgaattaattgaaagacaacaagagattacgttaatcgtctgcccggaggacgataagacgctcactgttgatagcagtaaaaaatcggatgtttataacagcatcaatacattattgagtaataaggtaggttattttctcattgcagattcagatgatggcaaagcagttcctgatacgttgccggaaaaaactgcggtctattatcctggtttactaacttcttttacacaacgctatgcccgacctgccgattctgctatcaaagtgaccggtattacaaatatatcaactctggctgatattcacaccaacttggccgatgactactcaacagcaagtcaggttattaatgatgttttggaaaaaaataataagctcgcatcgtctcccattattttacctcccagcgccgctgttgctggtgcttatgccgctgttgatgtgagtcgtggtgtttggaaagcacctgcgaatgtgatgttaagtaatgccacgccaatcattagtatttccgatgcggaacaaggtgtgatgaacccattaggtattaatgctattcgtagttttactggtagaggtactttgatttggggagctcgtactctggataaaacggataactggcgctatgttcctgtacgtcgtttattcaatagcgcagagcgagatattaagttagcaatgcgttttgcagtttttgagcctaactcccaaccaatttgggaaaaggtcaaggctgctatcaatagctatttgcagtcactttggcagcaaggtgcactgcaaggcaataaacccgatgaagcctggtttgtacaaattggtaaaggcgtgaccatgacagatgatgatattaagaatgggagaatgattatcaaaatcggcatggcggcagtacgtccggcagaattcattattttacagtttacgcagaatatcgcccagtaacttaggtctataccctatagatttcaagatgcatcgcggcggcaagggagcgaatccccgggagcatatacccaatagatttcaagttgcagtgcggcggcaagtgaacgcatccccaggagcatagataactatgtgactggggtaagtgaacgcagccaacaaagcagcagcttgaaagatgaagggtatagataacgatgtgaccggggtgagtgagtgcagccaacaaagaggcaacttgaaagataacgggtatatttaatatgggcgatttattgcccatttttgtgaaaggaaatgagttatgtcgccaacgctacccggtgtaacgatgactcaggcgcagataacagcgttcggtgtcagtacattaaatatgcccgtattcatagggtattgtacgagattgcctgccttttcagcgcctgtaaaagtaaacagtttagct
gaaacagaacaaataatagggaaagaagggcgtttgtatgctctattgcgccactttttcgataacgatgggatacaagcttttattctgtcgttaggcgcacctgctggggaaaatgctaatagttggcttgaggcattacaacagcccgatttgtatgcggctgttgcagcagagccgctaattacacttttagccgtcgttgaggcaagtgaactgaaccaaaaagaaggtaatgaggctgtggaagcttggcgacagtactggaaagcagtattagcgttatgtcaggcacgcagtgacttgtttgccatattggaggcaccagatgataccgcattaatcaagcgtagtttgcaggattttcatcataaggcacgtcagtttggcgctctctactggccaaggctagaaacatcttatcaatcctctcagttaaaaattttgtctcctattggtgcagtagcagcggttattcaaagtaatgatgtccggcgaggggtaggacatgcacctgccaatatagcgttaaaacagacgattcgcccgataaagtcccgcctggaattagaagagttgtatgaagaatcggatggttcactgaatctgatttgtagttttccagctcgtggtactcgtatttggggatgtcgtacgttggcgggtattgattcaccttggcgttatattcaaacccgattattgacttcacacgtggaaaggcaactcagccagttagggtgcatgttgatgtttgaacctaataacgcagtcacttggatgaagtttaaaggccatgctgggaatctattaaggcagctttggttacaaggggtgctgtatgggcagcgtgaagatgaagccttttccgttgaaatagatgaaaacgaaacgatgactcgccaggatattgatgaaggcagaatgattgctcgtattcatttggcattgttagcaccggcagagtttatcgctgtgactttgaattttgatactcgctcaggcattgcgacgagtacataataaatcggaatatctccatgacactaccagcagagctttataccccagcggtttcacatcgttttattgttaattttctttttaaaggtttacttccttctcccgtagatattcgatttcaacgtgtttctggtttagggcgtgagttacaggttgaacagcgccatcaggggggagaaaacgcacggaatcattggttggctgaacgtatacagcataatagcttgatattagaaagaggggttatggtcgttacccctttaacactgatgtttgatcaggtgatgcggggggaaactctcaattgggcagatgtggtaattattcttctcgatcaggctcaacgtccgataacaagttggaccttgagtcatgcgctaccggttcgctggcaaacaggagatttagatgccaacagtaaccaagtgctgattaacaccttagagctgcgttatgaagatatgcgcattataggggtaaaattatgactatcgaaatccgtgaactcattgttcaagcccgtgttgtcgggactgataccaaaacaacacgaaccgttcctttatctattgtgcaaatggaaacacttatagaacaacgtctggttgaaaaagtgaagcgggagatattagacgtactccgggaagaacaaggtggtgggttatgagcttgcttgaacgaggtctggctaaactcacgattacgggttggaaggagcgtgagcgtaaacatcagattggtaaactagaagcaatgtataacccggaaacacttcaactggattatcaaactgattatctccctgatgttagcaataatcaggtaacagtgagtaaccgctacgttttgtcaaagcccgcagggttaacactatccttgttatttgatgccaatatggctggtcttacgacaaccgtcgagtcccaaatcactaccctcaaatcgctttgtttagttaatgcaagtactgatgaacccaattttttggaaattaattggggggcaatgcgttgggaaaataaaaattattttgttggtcgggctagtggattgtctctgacttatttgcgctttgatcgtaacgcaacaccattgcgtgtgagtgcgcagctcacattagtcgcagatgaaagctttgtgctccaggataaccaagccaagttagatgcgccgccggtatcagtagttaatgtcccggatctgacttcattacctgcactggcgaatatcgctagcgtaaccactatgttgggagtggattatttaatgttagcccgcaccaatgatatggataatttggatgatatgcagccaggtcagacattgcgaacaccggaggcatcatgagttttttagataacagtaacttcaagccatcagatatcaaactgttcgttaacattcagggagtggagaaggaactcaacgaactgatagtaagcgaattgaaaatctcccgacgtatcaatgccattccgcaggcagttgtaaagctaagagcgaaagagagtgaaagtggtgtatatcagtctgatgtacagcggatgttgaagagttgccgtccgggagtaaaggcagagcttcgtattttgaatacccggctattcagtggcgatattgtgcagcaaaaaacagagttagtgtatgcgaaaacacacactatcaaattggtgctacgccatgacttacagcgcatcaccggtaattttcgtaccagagtgtttgcgaatacccgtgatcgtaaagtgatagccgatctattgaataccgcaacattaaagccggcattttcggggacatcacattgggatatagatcatgagcaactggttcagtatcgttgcagtgattggcaatttttgttgcaacggctctatgctacgaatagctggttgttagctgaagaagataaagataacactcaggggaaagtgaccattattgctccaaattctttgcccctgaatgagcgttggacac
tgcaacatcaggctgatcatcaggctatccggctttacagcacggagctgatgctggataaccggtttgatacagcggaggctgttgttagtgcttgggatattgatgatcaggcattactcgtggcgtggaaagaaacccttagtcaagttgggaaagatgcgttagcgtcagataattttagccagacaaataaagattcgagtgaactgttattaagttgtccgctctctacaaaagaagttcaatttttaacgcgtagccaattagtcatgcggcgcttgacggccgttcgtggttcactgaaggttgaaggcagtactaagtaccgtttagggcatgaactgatgttgtcaggttttggtgaaaatatggatggctcacaaatactgacgggagtggatcatcgaataacggcagaagaaagttggaaaacaaccttacatgtgggattagaactgccgttaaaggcagagtatgtcactcaggttaacggtgttcatatcggcaaggttgctgattatcaatcagatagcaaaaaatgggatcgtattcctgttttgatccctgcatttggaacgaatattcccttgtttgcccgattgggaaaaccctacgccagccaccaaagtggattttgtttctatcctgaaacgggtgatgaagtcattctcagttttttggaaggggaccctcgttatcctgtcattattgattccctgcataatcctaaacaacagactccattgcaaatcagcaaagagaataatctcaaaatgttgatgattaagcagagcgataaagatgagcaacaattgttatttgatagccagcaacaaacagtcgcgttaatcggtaagaaaaatatcgaggttaaaggtgagtatatcaacctgactaaatcaaaggggactcgataatggcaaatacgcttattggccaggtatatggtcaaggatgggcttttcccattaaatttattcctgataataaagaaaccgcagatcaaacagccggtattgttatggctcaagggattgaagatgtcagtcaatcgctggaaatattatttcttaccgagcctggcgaacgaattatgcgtgaagattttggttgtggtttacaagattttgtttttgaaaatattagtgatacgctaatttctgccatcaaaaatcgtattcagcaagcaatattacgttatgaacctcgcgcatatttattgaacgttgatattcaaaccaaagaaaaccaacctggacatctgctcattcagattaattggaaattacgtggtagtgatatatctcagcgtttagacggagtgcttagactccattcaggtcaagcattggaactgttatgaccaattatattattatcgacggggatctcattcaaataaatcccaaatttgagggtgatcgaactcttacgattaatggtattcctaaaataagcgggaatggagatgcgcaaattgaaggaaaaaatatttgtgtgtcaggtgatcacttaactgtctcaattccagccatttatataacctccagacatcctgttgcaggtagtggaaaagtgaaaattacaaatttatctgacgaccaactagcagaattttgtgttagtggggatgttgtgattattgaaggcagtcagtttgaagctcagtttacaccggataagccggccactaatccaagtaaccaagatgcagataatcctgcgccttcgaatgggagtgggagatttatacactcacagaacttcgttaaggcagaaaaataaaaaattttgccgaagcggttaataagtatgaataagcggggcggataaaaacatggatcttgctgaattaaataatacgttgatgaatgacttaccaacgaccaattttaagttagaaacaaaggacccattaacgcaattaaagtggttacaacgttatacagaaaatattcgtttttatgcgaatgatgattatttctggcatcaattctggttcttaaaaaatcacacaccagaagcgctctttgctcgtttgcaaggtgaaacgttggctgatggagaattgcctcctcatcaagcgctattgctggcctttttacaacagcttaagacgccaggaatcatgcttgatactttttcagcccgtcatcggcaattgtactatcaggaattgctagggataacgcagaaagatgcacaacctgatcatgtggcgcttggcgtggtattaagtactggtattgcagaatatttattaccgacaggcacattagtggatggtggacaagacagcagcggaaattcactgcaatatgcgttggataccgatttattggttaatccagggcaattaacagatgttcgctacagctatttggatcataagacctataaaatcttcatcttgcaagatgataaagcgaatatcagttggccctcttcaggcgctcgtttatttgtagcacctgagggcaacggacaggaaaaggcacctgaacaaaagttggcactttacctgggatttgatgatatacagccagggcaaactctttctttattttggcaattcattgcatcaactcccctgacattaaaatggttttatctgaacgagataaataactgggtgaagctagatagtgtcagagataacacggatggcttttttatcagtggattatggcaagcgatattacctgatgatgcggtgaaaatgtattttccagagacaacttctgtaaaacgctactggattaaagctgaggtggaatcgcttactgaatctggcgatttgtggcaaccgctattagaaggcatcttgtataacgctcaaacagcaacgctggttgatgcagacaacacagatgaaaagcactttcatgatgggctgatgccttttagcgtgcagcatttggtcaacaccgtttcagaggtaaaaaaaattgagcagccctggtcttcttgggggggaacgccacaggaagacactactga
tttcttccatcgagcggcaacacgtcttcagcatcgccagcgtgcgttaacttgggataaccaaattgccatgttgaaggctgaatttccgcggatttatgatgtcatctcaccaaatatcacgtggatgaaccaacttcagacatcaaatacgcaaacgctgatcgttattcctgatgtgaactacagcgacaacaaggatcgcttacggccacaattcagccctgccagcttgcgacaaatgagtgactggttacagattcacactagcgcatgggcgaatccacaagtggaaaatccaatttatattgatgtctctgtgacctatgaggtgcaatttagtgcgggtgtgaatcctgattatgccctccggcaattacaacaatggttgagttcaatttatatgccatggtatcacgcagataaaaaaggtgttgccgctggcgatcaaatcgatttttaccaactgtttgcagatattcagcgagtaccttacgtggagcatgtcaaaacattgacattgaccacaaaagacacctcattaaccaatggcggggttattaaggcacagcaaaatgaagtgctggtgttggtatggcaacaaggagaacaaattaggcagggagaatcgaaatgaggcagcataatgagttatttcctgtagtaaaagacgcgataagctttgaaaacctgcaagctcagggtgagaaggttattagtgatcagtccggtaacatatggagcgataaagataaacatgatcctggtataacattactagactctttaagttacggtgtttcggatttagcgtatcggcactcattacctttaaccgatttattaaccattgctggaaaagatacgctttttccagccgaattcgggccacagcagacgctaacttgtggccctataacactggatgattaccggcgtgcgttacttgatttacatggtaatgatgcatttaaaatatcagctagtgaccccagagactttttgtttcaggatatacagttaatttgtgagccaaaaagtaagcgttataaatactatttcaatcccgaaacgcttgaatatacattcacgccaccttcaggggataaatttaaaactttaacactacgagggaattattggctttattggataccaacccgttgggcaggtaaatcagctaatttgccgttagttaagcgggtgatggaagattttctccgtgaaaatcgaaatttgggggaaaatgttgttcaagtgacacgggtgatatcaacgcctatttatcctgagctggtcattgagctggcggatgatattacagatgcggcatcagtattagcatcaatctatatgctattagaacagtgggcgatgccgatgcctgctcgctttactaccgaagcattacaggccaagggattaacaaacgaagagatctttgatgggccgtggttgcgtcatggttggatacctcagttaccgacctctcaaaactaccatacaggcatggttctgaagatgaatcatctgattaaccaattgctggcggttgaaggtataaagcgcgtagttagcctgacgttgccagaaacagaatatttgcatcagataaaagatgataattggtcctggcaattagatgttggttattatccattattatggggagctaatccactagaggtaattacagagaaaaataacaattatgtcaaattgttcgcaaaaggtggggtacgattacaacctgatcagaaaagtgttgagcggttattatcacaggaatcactcattaataatgctgcatccacgttaccggctggtaaggtgcgtgatctcaaagcctatacacctataagccgcaggttgcctgcctgttatggtttgcagaatactttgcaaaagttaaaacctgaacaacgacacttatatcagttcctattaccattggagcaaatgcttgctgatggatgtgcgcggcttgcatttttgccacatttgttagcatttagggaccgaagcggaaatatcagtgatacactctggcctttcaagaatacagaggacacaattgcccaacaggttcatcaggaatatgccggtacattaaaagcctttcaacagcaggaaattagcctgtttgatgataaaaatagaccgcatcatggcaatatcaatcgggaattagatattcttgattatctgctagggtattttggtacacaacgtgcaaagcgtccattaacgcaggatattcatgattttctgcaaacccagcgaggttatttggcacagcagccggagttgggttatcagcgtgataatatccgtattgatcgagtttcagctttacaaaaacgtatagcagcccgaattgggctagatggtactattttcaaagaatcggttgatttaagtaagttacctttttatttgattgaacatcgtcagcttttaccaaatttaccccatcttgactttcaacatgatcaaactccccaatcttttgtgatttccgacaacattgttaaagtgaaacaagcgggaatagcagataaaatcgttcgtggacagcttattgattttatagatattgaaagcaaatttaccgttcgtgcccaaatgattgtcgctgtagagggaaatgaattttctctggatacaaaaaatagtattcaacttgaaaagaatctgcagttattacaatcagcgtctgagaaaaacaatttacgatggagaaatagcacggcgtggttagaggatatgacgtatcgtatcaattatactgacgatcaggttatagacgataaaacaaaacaatgtcgtttacaaagtaatactaaatcgccttttccagccttaattgcaccaaaaaataagattacgattattaagcaatcttctccactctccagtattgctgaatttactgatgaaccagaattcaaattagttgcaacggtgacagagattgatcggattgaagggatattgactatc
gaacgggatgacaaccaactccctttcccgactaaagaagagagtaatcaatatatatggtacatatctgatgaaaactatatttcaagtgatcgtttctcttttgtggtgagcgtcgtgctgaatcgcggtttggttgaaagggaagatattgatcaatataagctagaggaatggatagagcgtgaaacacttgcagagtttcctgcacatatttcgttaattactcattggctggcatctgaaaatttcgatgattttgcgaagacatatcaacgttggcaaaacaatggggcgcagttaggggatgaatcctacaccattttggaaaaactgacattagggcatttaccaacaggacttactggcattagtaatatgtttattgctacagaagctcagcgtctagaagttgttggcgagagtggtaatgagtggaatacccaggcaattattaacaacgaactattctatgttccctcacagaatagttaataccgagtgttgtgatcaacttttattataagccggaggataaatggacaacaaaaataacaaacctactgatcaagagattctaaaaacatcacgggctgtcggagaaattccttcagcggataatttaaaaaatcgttttaaagctcgttcgattccattagagacggattttactaatctcattgaccttgctgaagttggacgattggctatcggccagtcaccatcgcagcaaagtaaaacgcctggcaccggaatggaattaacttcggatggtaaattacaagtcaaggctggggcaggtgttgatatcgataataataatcgtattactattaagtctggtcatggaattaaggttgatggaaacggcatttccgttaaaccaggttcgggtattaaggttgatagtaatggtgtaaatgtcaatattgatgatttttgggaggaaatacgcaataaaattatgcctaaaggaaccatgctgcctatttatggcacacctaacccctctgcgctgccaacaggatgggaatggtgtgatggtaaagatggcagacctaatttaaaaaaagggaaatataacttactatcaggtcagtcttcaggtactgatactttttgggcagataataagaatggagatacagagatcaacgtgttatttgtttactatatgattaaggttgtgtaatatcttaagtaatatgcattactctaaaatgaatgatttatatttaagtaacataataattaagttgtgttgtagggctgtttttatgagaaatataaaaacggaggtaataattggcttcaaaatatcagtgatgaaatagagttatttcgctttataaaaattttgttttatttcttttaataattatttatagaaggtaatgatatgtgcacacaaaaaaacgtgttagatagactgaaagatagaaatattacattgggttgggatgttgttgttgcatataaccaagaaagtgttaataagttattgaagcaacaatatgttgaaaaagtttactcaaatgaacattttgtttttaaagattggcatgatgataataaaacgaaatttattgagggattaacagtaggcgctccactagtttcatttgaggaggcgtctttatccgatgctaatgtaaaagtgacacttaactttctttctggtagatggagagttatacaagcaaataccggcacaccaattgaatggaaagaaattgttcctggcagtggctataaagcagaattagttgttccgcttaaatcaataactggtagtgtaagtaaaaaagatatcatattaaaattcaaagatgctgtcgtaaaaaaaataaatttatttgacaatcaagagcctgattttattaattatttcaagcaatcgatcagtgagggaaattatactttagggcaactggtgacagacagcacaccgggattaattcctgctgaatttcatattcgtactcaaccccatccaaaaacacgtgagcgtggttctcaatatgtaggaaatggtgcggtactgttgtttattaaaacgcaatatggcggaagtggaacattgcctgtaaatgattttgattggttaattcctgatgatcatactagcgcattagtcatttcgagtaagaccatgatggggcaaatattgccaaaacaatacaaagataaattgcctggtgatcctcagtttagcccaccaaaaagagtcaatgataaacaagactctgcttattatattacgattaccgatggtggatttgatggtaatagccctatagagaagtcatggttacgttctgattatagcaatgggatttggactggtgaacgtggtaatgctattattggtgaaaaaggaaagcggataccaccacgttttccataccaaaattttgttattaaacctcatggtgaatcgttatttcaaggatgggagaataagataaattacactcaaaagtgtgcaagatatttccgacatcatagtaatagtataactttcgaagatactgcattaatggatctcagtattggtggacaaggtagtatcaattgccagattgatggtgaacatttctatttaaaatcagatgatttttcccccaatgtcagctatgaaccaacttcattctgggataaatttatcggtggggtggatgcaaatgtgaaagatgaattcagagatgaattagcacaacaggcagaagcaaagttaaaacaggtatttaatattgaattgcctgaaatcagtctgttttctattaaacatctgctctttcctggcatggatgttatgcaacttaaacagggttatttcccaggagatttgattatctttggggatatttcacctaaattgaccacaattcaggtggctcctttggaagccatggttgcccttaaagaaaatcaaaaattcactgtcgtacctgaaaataaaaatgttagttggaagttggatcataatagtgaggctatcaa
tgatccgggaaatattgatgataaaggtatttatacggcaccgggcagaatcagatctggttctgaagtcattaaagtcactgcaactgacggcgatggaaatcaggcatcggcggcgctgacgttggttccttcttctgttgcattaacaccttcttttgcttttatctctgaagcagataagaaacctatattattattggcgaatgtcctagacggaaaagcagtaacatggaatgtggaaagctgtacaggcagccaatgtggttctgttgatcagaatgggctttatactccaccagcagggcgttttaacgatggatttacttttgcatccatcaccgcaactgcaaaagatggtagtcaagcacgaaccattatttgtctaatggcatcaatgccaggacatggtttttacaaggttgaacctaatttacgtttgaatgtgaaagtaggggaagaaattatctttaaagcgcaggcagatagctataatggtgatcctgatacttgggaaattttccctcctcgcggaaaattaagtgaacctgagtttgaacccaataatgatcctgaaactaatgatacaatttttggtcattataaggtgacctataccgcgccgactaatgttacctcacctgaattgcttgttgtccatgtatgggagaaaaataggcataatgagaaaaacaaaggtaaggcaggatatgcacttattgaaattatcccagatgataaatagaaaatttatttaaataaaaatcacagcgggtttatctcgctgtgattaaagtcatctttttttatagattgtttatctctaataataattttattttataatataaaggaaattaaaatgaataatgaatataaaaataacaccgtgaattggcgtatttcacctgatacggtaggaagtattgataataacggtttatatacagcacctaatcgggtaaagaatatcgaatttgtccaagtaatggcaagcgatgctaataataatcaatcttctgcgattattactgttattccctcttctgttgcgttaacgccatcgtttacttttatctctgaggcaaaaaaaacatcagtcacttttaaagcgacagaacttgaagggaaaaaagtgacatggagtataaataattataccagtaatcagtatggttccatcgatcaaaatggtatctacacaccaccggaaagtcgttttaacgatggatatacttttgtatctattacagcaaaagcggaaaatggcgctgaagcgcaagcgcttatttgcttgatggccaaaattccagggcatgcctttttcgatgttcagcctaatatatgtttaagtgtgaagcctggagaagaaatcatttttagagctaacgcagatcgttataatggtgatcctgattcctgggaaattttcccgtctcttggtaaattgggtgagcctgagtatataaaaaataacgatccagaaattcctatttatggatattatcaagtgaaatatattgcgccaaccaatataaattcttcccaaatactcgttgtgcgtacttgggaatatgacaaacatgatgagcataatcaaggtaaagcaggatatgcattcattgaaattgtgccagaaaatgagctttaatatatatacccaatagatttcgagccgcagcgcggcggcaagtgaatgaatccccaggagcatagataacgatgtgactggggtgagtgaacgcagccaacaaagaggtaacttgaaagataatgagtataaatgactttagtaagagaaattatggcttcattcagaactatttattagagtaattaactttataaagacatttaatggaaaatataatagaaaaatttaatattaatattgaagtctcatctgaaattattggagagagtttattaaactcccctttattgatgagtagagaaatcagcaatcaattatctgaaatattattagattataaagaatataatattgcattggataagttagtgttaaatataggagaaataccctatgaaatatttgaacaacaattctatggtcgtttgggaaaattattaaatgaaaagttaacaataataataaatgataaattattggtaaaaaacatatcaacctcgttatttcctgaatgttttagtgaaaaaagaaacccattattaaatagagtcataaaaaatttaccttctaatttggtttttgaagttcattcaatggtaaaaatagaatcagtaaataacaaaaaacaagctaatatattgacatcttatctggcttattctttttttaataaaagcaaattacaacaacatttattttccactagtaataataaattaattgagagcttatacgcactttttctaacggatcagaatcgaatacctactgctcataaaataggaaaaggtgcacttatactatctgcccttatttggctttattctaattccaatgattatctgcccaaaccagaaagcactctgttgttacaaatagaacaggatataaaacaaggatatttgcctttaacgttgttaatcactttcttccagaacagaaatggcgggcgtgttttttgcgattggcagtatgcgttatggcaaatcgatatcatcaaaaatcacttaggcattaaaataacatcgaaagaaccccatttacgggagaaaataatgttacaaccagttaatgcttctgatcgatcctctgtgctgatatcagacgaaaaattgacaataccgttaacaattacaggtgcgggattagtgcttctctggccactattaactccactattttcgtcttttgatttgttagataagaaaagtttttcagacaatttggcacaggaaatagcatttaatttattggaatggttagtctggggagatgagatgctgttacatcaggaatcatcattatctttattactctgcggaatagatcaccaaacaatactggagcgc
caggttcttattcctgagcacaaggaaaaattaaataactggttgcaaggtatttgtactcaacttttctcttggaaaaagctagggatcgatgatatgcgccaactttttttgcagcgtcaggctgcactttattatgaagatgatggccgttggttattaacggtgcagcgtgaagcttatgatgtattactgactcaaatgccttggccgtggccattgaatattgtgacattaccttggctagctgagccgattagtatcacttgggaaggtatctctgaaccaacggatttgtcattttggtaatccaatatctcattaggaactctatgcatgtacgatttatctgatgatcttgccagacagaatatttcaccggaatatgaattgacggttttgctgtctcagactgctatattggataaacgaattcgtttacgaattcaggaattaatgcaacagcaaacactattgggagaaagtggacagacgtcttttgatgatatttcattttcattcgtttcgagtgaacaacaaaaatcatcttatttggtgtcaccgcatcaaaattggacgaaagaggattttcctcctgagccgatcccatctcgtagccgtctaggacaattagttgaacggtttgacttaactcaatttgaaattgatttgattttattgtgcctgttgcctcatcttgacagacgttatctaacgttattttctcttgttccggtaagtggaggtaataacagcaaaaagcagatgttaacgttgggattggctttggagttgctttgtccgagtgtagtagagcgcaatgcgcaacgtgccagtttattaccacaggcaccgctttgggattatcgtttatttcagttgcgcggtgatatgtctgtttcctacgatgaaataccgttagcaatcgataattctcttatgcattggttattggggcatgatgctctcccgatttctcttctctcccgggctcattggcttcctgttcctgaagtgcctgatattttgcctgatttcaccaaccaattgatagaactctgccaaatggaacaagaggggatgctgacaataatcgccggcggagccggaagtggcagcaaaacaagtgttgcacgcgcagcatcacaagtagggcgctctgtattgttgttatcgttagcatcagtgacactgagtgaacatgaaactattacactgataacactggcattacgtgaagcacaactaagaaatgcctgtcttatgtttgaagctttggatgagttttgtgaagcacgccccgctttgcagctctggctaggaaatcgactggctcgttgttcgattccgctgttttgtcaattacctaagcaagcatcattattgccattggatgcaatttcacaagttgtattgtctatgccaatgccttctttaatggtgaaggctgcagcattagcttcaatgatgacgaattattttccagacaattcattggatgttgaaagtttagtgacatgtttccatccttctccattgatattgaaaaaggcccttagtgaagcagaaatttatcgccgactacggggggaaacggctagtttgagattagatgatgtgcaaatgtccctgcgttttcggttacagcagaattttggacgtttagcacagagaattacaccacaacgaacctttgatgatttgatcatcagtgaatctcaacagcaacaattacaagaaatcctggcggctattcggcaacgagataggatgctagagcaaggatttgctcgtaaagtgagctatgggacgggtatcagcacgctattttttggtgaatctggcacaggaaaaacgatggtagcagaagtgttagctggtgttttaggtgtggatttgatcaaggtagatttgtccactgtggttaacaaatatattggtgaaactgaaaaaaatctggctcgtgtttttgattatgcccaagaagacgccggggtattgttctttgatgaggcagatgcattgtttggcaaacgaagtgaaactaaagatgcaaaagatcgtcatgctaatattgaagtttcctacctattgcaacgccttgaaagttatccagggctggtgatattagccaccaattaccgtaatcatttagactcagcatttagtcgtcgcctgactttttcggtacgattctcttttccagatgtttccttacgggaacggatgtggcggattatctggccatcgggaattcaattagccgacgacatcagtttttcagcgttggcaaaacgggctgaattaacgggggcgaatatccgtaatattgcgctactcgctagttggctggcagtagatgaaggaaatgaaaaaattactatggctcatattgaatgcgcattacgacgtgaactgagtaaagttgggcgcattgatttaccttaatttttctttgtaatcgggagacaactatggttaaaaatatcaaatcagatgaaaccttactgatattaaatagtaaaatagaagatgcattaaaagcgtatttaccgggcgaagatgtcgttattcggttcgatatgtttggtaaaaatgaaaatccagattctcctaccgtgtgcgtttttctttatgatattcaggaagatctgcaattacgcgtgggagaagggcggcaatacctgcctgcgacaggaaattttgtcccgggatgtgtcaatgttcgttgtaattatcttatttcctactgggagccggaacagagcggagggcagggatcgccaaccatacgttctaatagtcaatcaatgaagataatgaactgtgtattgaatgcattaattaatcatcgttcatttcctggtttacccagaacttatacgagagttcttcctcctaatgaacaattaaatagcttaggaaacttttggcaatcattagataataagcctcgactatgtttaagttatatggtgactattcctattcaacttaccccgc
cgacagagaaggtatctcctgtcattacctcaaaaactgatattactcgaaaaccatcgcttaacttttatcttgaggcagatgaaattatccgtcaggcattagttgatgccttaatatctcaaacaacagaatctatggatacgataactagctggctggcaaaagttgttattatttgtcgaccaccagaaataatgaataaacaaatgattgaacaaactgtgaaattaattattgctggaattacagaagagggattagctggaaatataaagacaatcactcaaaagtgggtggaagagaagacgattattggtgaaatcgacgatgtttctctagttatttcccaagttgacacgacagcgttgtctgctgtaacaataccgacatctgtttaa
[0506]
seq id no:96(pnf表位)
[0507]
tgqkpgnnewktgr
[0508]
seq id no:97(pvcpromf)
[0509]
tatcatatgtctacaactccagaacaaattgctg
[0510]
seq id no:98(pvcpromr)
[0511]
atctctagaacagatattccagccagc
[0512]
seq id no:99(parainf)
[0513]
ggcgtcacactttgctatg
[0514]
seq id no:100(parainf)
[0515]
tcggtggcagtaaattgtcc
[0516]
seq id no:101(f1引物)
[0517]
atgtctacaagtacatctcaaattgcg
[0518]
seq id no:102(f2引物)
[0519]
gactcccttgagggtacgg
[0520]
seq id no:103(f3引物)
[0521]
ttctgatgagagtgatggtac
[0522]
seq id no:104(f4引物)
[0523]
tgaataaagaattcagtcaatatc
[0524]
seq id no:105(r1引物)
[0525]
tagtggctgatgaaagtctg
[0526]
seq id no:106(r2引物)
[0527]
ggaagccaaagataatgaagtg
[0528]
seq id no:107(r3引物)
[0529]
catttcttccctatggttg
[0530]
seq id no:108(r4引物)
[0531]
ttaaattcctacaagattatcttt
[0532]
seq id no:109(tbid氨基酸序列)
[0533]
rsshsrlgrieadsesqediirniarhlaqvgdsmdrsippglvnglalqlrntsrseedrnrdlataleqllqayprdmekektmlvlalllakkvashtpsllrdvfhttvnfinqnlrtyvrslarngmd
[0534]
seq id no:110(e.coli序列优化的tbid碱基)
[0535]
cggtcaagtcactcgcgtctggggagaatcgaggctgatagtgagagccaagaggatatcataagaaacatagcacgccatttggcacaggtaggcgattctatggatcgctccatcccgcctggacttgtcaatggtcttgcgcttcaacttcgtaacacttcccggtccgaggaagacagaaatcgggaccttgcgactgctctggaacaactgcttcaag
catatcctcgtgacatggagaaagaaaagactatgttagtattagctcttcttttagctaaaaaggtagcttcgcacactccaagtttattgcgggacgtttttcacaccactgttaatttcatcaatcagaacctgcgtacttatgtgagatctttggcgagaaatggtatggat
[0536]
seq id no:111(baxbh3肽(aa59

73))
[0537]
lseslkrigdeldsn
[0538]
seq id no:112(e.coli序列优化的baxbh3碱基)
[0539]
ctgtcggagagtttgaagcgtataggtgacgagctggacagcaat
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献