一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

酮还原酶多肽及多核苷酸的制作方法

2022-06-01 20:20:25 来源:中国专利 TAG:
酮还原酶多肽及多核苷酸1.本技术要求2019年9月26日提交的美国临时专利申请序列第62/906,268号的优先权,该美国临时专利申请出于所有目的通过引用以其整体并入。2.对序列表、表格或计算机程序的引用3.根据37c.f.r.§1.821,以计算机可读形式(crf)通过efs-web以文件名cx8-195wo2_st25.txt与本技术同时提交的序列表通过引用并入本文。序列表的电子拷贝于2020年9月23日生成,其文件大小为664千字节。发明领域4.本发明提供了与天然存在的野生型酮还原酶相比具有改进的特性的工程化酮还原酶,以及编码工程化酮还原酶的多核苷酸,能够表达工程化酮还原酶的宿主细胞,以及使用工程化酮还原酶的方法。5.背景6.属于酮还原酶(kred)或羰基还原酶类(ec1.1.1.184)的酶可用于从对应的前手性酮底物并通过对应的外消旋醛底物的立体选择性还原来合成光学活性醇。kred通常将酮底物和醛底物转化为对应的醇产物,但是也可以催化逆反应,将醇底物氧化为对应的酮/醛产物。酶诸如kred对酮和醛的还原以及对醇的氧化需要辅因子,最常见的是还原型烟酰胺腺嘌呤二核苷酸(nadh)或还原型烟酰胺腺嘌呤二核苷酸磷酸(nadph),以及用于氧化反应的烟酰胺腺嘌呤二核苷酸(nad )或烟酰胺腺嘌呤二核苷酸磷酸(nadp )。nadh和nadph充当电子供体,而nad 和nadp 充当电子受体。经常观察到酮还原酶和醇脱氢酶接受磷酸化或非磷酸化的辅因子(处于其氧化态和还原态),但最通常不是对两者都接受。7.为了绕过用于产生关键化合物的许多化学合成程序,酮还原酶越来越多地被用于将不同的酮底物和醛底物酶促转化为手性醇产物。这些应用可以利用表达酮还原酶的全细胞来生物催化酮和醛的还原或生物催化醇的氧化,或者在全细胞中多种酮还原酶的存在将不利地影响期望产物的立体纯度(stereopurity)和产率的那些情况下使用纯化的酶。[0008]“苦味”是啤酒的一个重要的品尝属性,通常来自于啤酒花(植物啤酒花(humuluslupulusl.)的花)的添加。异-α-酸是在酿造过程期间,由啤酒花植物的蛇麻素腺体(lupulinglands)中天然存在的化合物葎草酮的异构化而形成的。具体来说,六种主要的异-α-酸对苦味负有责任:顺式-异葎草酮、反式-异葎草酮、顺式-异辅葎草酮(cis-isocohumulone)、反式-异辅葎草酮、顺式-异近葎草酮(cis-isoadhumulone)和反式-异近葎草酮。[0009]然而,异-α-酸不是光稳定的,并且光诱导形成3-甲基-2-丁烯-1-硫醇(3-mbt)使啤酒具有明显的光击或臭鼬味和香气。这要求用棕色的瓶子或罐包装啤酒。另一个解决办法是通过还原异-α-酸的羰基基团生成相应的二氢-(ρ)-异-α-酸(dihydro-(rho)-iso-α-acids)来产生完全光稳定的啤酒。这些还原的二氢-(ρ)-异-α-酸是稳定的,并且可以装在透明瓶或绿色瓶中。[0010]然而,目前只能使用有毒、危险和非食品级化学品(例如硼氢化钠)将异-α-酸转化为二氢-(ρ)-异-α-酸。因此,将异-α-酸安全和食品级地转化为二氢-(ρ)-异-α-酸具有相当大的商业价值。[0011]发明概述[0012]本发明提供了与天然存在的野生型酮还原酶相比具有改进的特性的工程化酮还原酶,以及编码工程化酮还原酶的多核苷酸,能够表达工程化酮还原酶的宿主细胞,以及使用工程化酮还原酶的方法。[0013]本发明提供了与来自开菲尔乳杆菌(lactobacilluskefir)的天然存在的野生型酮还原酶(seqidno:2)或当与其他工程化酮还原酶(包括seqidno:4、6、80、104、172、186、194、252、270、272、286、328和/或330的工程化酮还原酶多肽)相比时,在将异-α-酸转化为相应的二氢-(ρ)-异-α-酸方面具有改进的酶活性的工程化酮还原酶(“kred”)。[0014]在一些另外的实施方案中,工程化酶除了具有改进的酶活性以外还具有一种或更多种改进的特性。酶特性的改进包括但不限于改进的跨越一系列底物的活性、改进的在高底物浓度的活性和改进的在低辅因子浓度的活性。[0015]本发明提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:4、6、80、104、172、186、194、252、270、272、286、328和/或330具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。[0016]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:4具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:12、21、87、93、97、110、145、148、152、153、194、196、197、200、206、212和226,其中所述位置参考seqidno:4编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:12i、21r、87l、93d、93m、93t、93v、97g、110i、145c、145g、145m、145s、148i、152g、152s、153c、153r、153v、194h、194n、194r、196h、196k、196r、197g、197r、200l、200q、200r、206v、212s和226l,其中所述位置参考seqidno:4编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:v12i、l21r、v87l、i93d、i93m、i93t、i93v、k97g、l110i、l145c、l145g、l145m、l145s、v148i、t152g、t152s、l153c、l153r、l153v、p194h、p194n、p194r、l196h、l196k、l196r、d197g、d197r、e200l、e200q、e200r、m206v、t212s和i226l,其中所述位置参考seqidno:4编号。[0017]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:6具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:12/110/145/152、12/145、87/110/145、87/110/145/194、87/145/194、110、110/145/152/197、110/145/194、145、145/152、145/197/226和152,其中所述位置参考seqidno:6编号。在一些实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:12i/110i/145m/152g、12i/145m、87l/110i/145m、87l/110i/145m/194h、87l/110i/145m/194n、87l/145m/194h、110i、110i/145m/152g/197g、110i/145m/194h、145m、145m/152g、145m/197g/226l和152s,其中所述位置参考seqidno:6编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:v12i/l110i/l145m/t152g、v12i/l145m、v87l/l110i/l145m、v87l/l110i/l145m/p194h、v87l/l110i/l145m/p194n、v87l/l145m/p194h、l110i、l110i/l145m/t152g/d197g、l110i/l145m/p194h、l145m、l145m/t152g、l145m/d197g/i226l和t152s,其中所述位置参考seqidno:6编号。[0018]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:80具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:17、21、46、56、72、79、95、101、110、152、162、190、198、210、211和227,其中所述位置参考seqidno:80编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:17q、17s、21a、46v、56c、72a、79l、95i、101c、101l、101t、110v、152k、152l、162g、190a、198a、198q、210f、210w、211r和227v,其中所述位置参考seqidno:80编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:l17q、l17s、l21a、k46v、v56c、k72a、e79l、v95i、d101c、d101l、d101t、i110v、t152k、t152l、a162g、p190a、d198a、d198q、t210f、t210w、l211r和c227v,其中所述位置参考seqidno:80编号。[0019]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:80具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:17、79、157、159、190/191/194、190/194、191/194、194、198和211,其中所述位置参考seqidno:80编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:17m、17q、17s、79l、157c、159t、190a/191t/194e、190a/194e、191t/194e、194e、198a、198q和211r,其中所述位置参考seqidno:80编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:l17m、l17q、l17s、e79l、n157c、s159t、p190a/i191t/p194e、p190a/p194e、i191t/p194e、p194e、d198a、d198q和l211r,其中所述位置参考seqidno:80编号。[0020]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:104具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:17/46/190、17/46/198/211、17/96/194/198、17/190/198、46/190/194/198和46/194/198,其中所述位置参考seqidno:104编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:17m/46v/190a、17m/46v/198a/211r、17m/96v/194e/198q、17m/190a/198a、17m/190a/198q、46v/190a/194e/198q和46v/194e/198q,其中所述位置参考seqidno:104编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:q17m/k46v/p190a、q17m/k46v/d198a/l211r、q17m/i96v/p194e/d198q、q17m/p190a/d198a、q17m/p190a/d198q、k46v/p190a/p194e/d198q和k46v/p194e/d198q,其中所述位置参考seqidno:104编号。[0021]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:172具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:45、101、179、194、204、226和231,其中所述位置参考seqidno:172编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:45l、101r、101y、179m、194e、204q、226v和231g,其中所述位置参考seqidno:172编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:e45l、d101r、d101y、y179m、p194e、e204q、i226v和a231g,其中所述位置参考seqidno:172编号。[0022]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:186具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:95/96/97/150/153/205、95/96/150/153/205/206/211/249、95/97/143/145/150/153/202/205、95/97/143/145/150/153/249、95/97/150/153、95/97/150/153/202/205/206、95/150/153/205/206/211、95/150/153/205/211、95/150/153/206/249、96/150/153、96/150/153/206、97/150/153、97/150/153/205、97/150/153/205/211、97/150/153/206、143/144/145/150/153/202/205/249、143/145/150/153、144/145/150/153/205/206、144/150/153、144/150/153/202/205/206、145/150/153/206/249、145/153/211、150/153/202/206/249、150/153/205/211、150/153/206/211、150/153/211和150/153/249,其中所述位置参考seqidno:186编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:95a/96a/97a/150a/153a/205a、95a/96a/150a/153a/205a/206a/211a/249a、95a/97a/143a/145a/150a/153a/202a/205a、95a/97a/143a/145a/150a/153a/249a、95a/97a/150a/153a、95a/97a/150a/153a/202a/205a/206a、95a/150a/153a/205a/206a/211a、95a/150a/153a/205a/211a、95a/150a/153a/206a/249a、96a/150a/153a、96a/150a/153a/206a、97a/150a/153a、97a/150a/153a/205a、97a/150a/153a/205a/211a、97a/150a/153a/206a、143a/144a/145a/150a/153a/202a/205a/249a、143a/145a/150a/153a、144a/145a/150a/153a/205a/206a、144a/150a/153a、144a/150a/153a/202a/205a/206a、145a/150a/153a/206a/249a、145a/153a/211a、150a/153a/202a/206a/249a、150a/153a/205a/211a、150a/153a/206a/211a、150a/153a/211a和150a/153a/249a,其中所述位置参考seqidno:186编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:v95a/i96a/k97a/d150a/l153a/m205a、v95a/i96a/d150a/l153a/m205a/m206a/l211a/w249a、v95a/k97a/s143a/m145a/d150a/l153a/w202a/m205a、v95a/k97a/s143a/m145a/d150a/l153a/w249a、v95a/k97a/d150a/l153a、v95a/k97a/d150a/l153a/w202a/m205a/m206a、v95a/d150a/l153a/m205a/m206a/l211a、v95a/d150a/l153a/m205a/l211a、v95a/d150a/l153a/m206a/w249a、i96a/d150a/l153a、i96a/d150a/l153a/m206a、k97a/d150a/l153a、k97a/d150a/l153a/m205a、k97a/d150a/l153a/m205a/l211a、k97a/d150a/l153a/m206a、s143a/i144a/m145a/d150a/l153a/w202a/m205a/w249a、s143a/m145a/d150a/l153a、i144a/m145a/d150a/l153a/m205a/m206a、i144a/d150a/l153a、i144a/d150a/l153a/w202a/m205a/m206a、m145a/d150a/l153a/m206a/w249a、m145a/l153a/l211a、d150a/l153a/w202a/m206a/w249a、d150a/l153a/m205a/l211a、d150a/l153a/m206a/l211a、d150a/l153a/l211a和d150a/l153a/w249a,其中所述位置参考seqidno:186编号。[0023]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:186具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:7/147、103/147、110、110/179/194、147和249,其中所述位置参考seqidno:186编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:7q/147i、103r/147i、110v、110v/179m/194e、147i和249y,其中所述位置参考seqidno:186编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:h7q/l147i、t103r/l147i、i110v、i110v/y179m/p194e、l147i和w249y,其中所述位置参考seqidno:186编号。[0024]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:194具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:7/12/54/110/150/153/194/205/211/249、12/54/72/110/150/152/153/194/205/211/249、12/72/101/103/110/152/249、12/72/110/147/152/204、45/54/72/110/152/194/204、72/110/147/150/152/153/194/205/211/249和110/150/153/179/194/205/211/249,其中所述位置参考seqidno:194编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:7q/12i/54s/110v/150d/153l/194e/205m/211l/249y、12i/54s/72t/110v/150d/152m/153l/194e/205m/211l/249y、12i/72s/101y/103q/110v/152m/249y、12i/72s/110v/147i/152m/204q、45l/54s/72s/110v/152m/194e/204q、72s/110v/147m/150d/152m/153l/194e/205m/211l/249y和110v/150d/153l/179m/194e/205m/211l/249y,其中所述位置参考seqidno:194编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:h7q/v12i/t54s/i110v/a150d/a153l/p194e/a205m/a211l/w249y、v12i/t54s/k72t/i110v/a150d/t152m/a153l/p194e/a205m/a211l/w249y、v12i/k72s/r101y/t103q/i110v/t152m/w249y、v12i/k72s/i110v/l147i/t152m/e204q、e45l/t54s/k72s/i110v/t152m/p194e/e204q、k72s/i110v/l147m/a150d/t152m/a153l/p194e/a205m/a211l/w249y和i110v/a150d/a153l/y179m/p194e/a205m/a211l/w249y,其中所述位置参考seqidno:194编号。[0025]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:252具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:7/12/54/179/249、7/152、12/54/72/152/179/249、40、54/72、72/147/152/179/249和249,其中所述位置参考seqidno:252编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:7q/12i/54s/179y/249y、7q/152m、12i/54s/72t/152m/179y/249y、40e、54s/72s、72s/147m/152m/179y/249y和249y,其中所述位置参考seqidno:252编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:h7q/v12i/t54s/m179y/w249y、h7q/t152m、v12i/t54s/k72t/t152m/m179y/w249y、h40e、t54s/k72s、k72s/l147m/t152m/m179y/w249y和w249y,其中所述位置参考seqidno:252编号。[0026]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:270具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:92/93、150/152、150/152/153和194/195,其中所述位置参考seqidno:270编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:92a/93e、150d/152a/153l、150y/152a、150y/152s和194s/195a,其中所述位置参考seqidno:270编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:g92a/i93e、a150d/m152a/a153l、a150y/m152a、a150y/m152s和e194s/r195a,其中所述位置参考seqidno:270编号。[0027]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:272具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:92/93/95、93、93/95、93/95/109、93/95/109/114、93/95/114、93/109/114和114,其中所述位置参考seqidno:272编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:92a/93d/95r、93a/95k/109r、93a/95r/109d/114t、93d/95r、93e/109r/114a、93m、93r/95a/114t和114a,其中所述位置参考seqidno:272编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:g92a/i93d/v95r、i93a/v95k/k109r、i93a/v95r/k109d/n114t、i93d/v95r、i93e/k109r/n114a、i93m、i93r/v95a/n114t和n114a,其中所述位置参考seqidno:272编号。[0028]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:286具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:12/45/72/109/249、12/45/93/249、12/45/249、12/109/249、45/72/249、45/109/249、45/249、96和145/150,其中所述位置参考seqidno:286编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:12i/45e/72t/109d/249y、12i/45e/93a/249y、12i/45e/249y、12i/109d/249y、45e/72t/249y、45e/109d/249y、45e/249y、96a和145a/150a,其中所述位置参考seqidno:286编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:v12i/l45e/s72t/k109d/w249y、v12i/l45e/i93a/w249y、v12i/l45e/w249y、v12i/k109d/w249y、l45e/s72t/w249y、l45e/k109d/w249y、l45e/w249y、i96a和m145a/y150a,其中所述位置参考seqidno:286编号。[0029]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:328具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:150、150/151、150/195和195,其中所述位置参考seqidno:328编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:150a、150a/151a、150a/195s、195a和195s,其中所述位置参考seqidno:328编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:y150a、y150a/p151a、y150a/r195s、r195a和r195s,其中所述位置参考seqidno:328编号。[0030]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与seqidno:330具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:12/72/109/195、17/73/200、17/115、68/72/101/152/205、68/72/124、68/72/124/152、68/101/124/152/205、68/124/205、72/109/152/195、72/109/195、72/152、72/152/195、72/195、73、73/147、79、93、93/95/145/195、93/109/114/145/195、93/195、95/195、96/108/147/200、96/194/200、101/205、145/195、147、147/200、192、194、194/200、195、198和200,其中所述位置参考seqidno:330编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:12v/72s/109k/195r、17a/73v/200p、17a/115q、68e/72d/101k/152q/205l、68r/72d/101q/152q/205l、68r/72r/124e、68r/72r/124e/152q、68r/101q/124e/152q/205l、68r/124e/205l、72d/152q、72k/152m/195r、72k/195r、72s/109k/152m/195r、72s/109k/195r、73v、73v/147i、79a、93a、93a/95r/145a/195r、93a/109k/114t/145a/195r、93a/195r、95r/195r、96p/108s/147i/200p、96p/194n/200p、101m/205l、145a/195a、147i、147i/200p、192r、194n、194n/200p、195r、198g、198r和200p,其中所述位置参考seqidno:330编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:i12v/t72s/d109k/s195r、m17a/l73v/e200p、m17a/l115q、a68e/t72d/r101k/a152q/a205l、a68r/t72d/r101q/a152q/a205l、a68r/t72r/l124e、a68r/t72r/l124e/a152q、a68r/r101q/l124e/a152q/a205l、a68r/l124e/a205l、t72d/a152q、t72k/a152m/s195r、t72k/s195r、t72s/d109k/a152m/s195r、t72s/d109k/s195r、l73v、l73v/l147i、e79a、i93a、i93a/v95r/m145a/s195r、i93a/d109k/n114t/m145a/s195r、i93a/s195r、v95r/s195r、i96p/r108s/l147i/e200p、i96p/e194n/e200p、r101m/a205l、m145a/s195a、l147i、l147i/e200p、k192r、e194n、e194n/e200p、s195r、q198g、q198r和e200p,其中所述位置参考seqidno:330编号。[0031]本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体包含含有与seqidno:4、6、80、104、172、186、194、252、270、272、286、328和/或330具有至少90%序列同一性的序列的多肽序列。在一些实施方案中,工程化酮还原酶变体包含含有与seqidno:4、6、80、104、172、186、194、252、270、272、286、328和/或330具有至少95%序列同一性的序列的多肽序列。在一些另外的实施方案中,工程化酮还原酶变体包含seqidno:4、6、80、104、172、186、194、252、270、272、286、328和/或330中列出的多肽序列。在一些另外的实施方案中,工程化酮还原酶变体包含编码表5-1、表6-1、表7-1、表8-1、表17-2、表18-1、表19-1、表19-2、表20-1、表20-2、表21-1、表22-1和/或表24-1中提供的变体的多肽序列。在一些另外的实施方案中,工程化酮还原酶变体包含选自seqidno:6至seqidno:412中列出的偶数编号的序列的多肽序列。[0032]本发明还提供了编码本文提供的工程化酮还原酶变体的工程化多核苷酸序列。在一些实施方案中,工程化多核苷酸序列包含与选自seqidno:5至seqidno:411中列出的奇数编号的序列的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多核苷酸序列。本发明还提供了包含编码本文提供的工程化酮还原酶变体的工程化多核苷酸序列的载体。在一些实施方案中,载体还包含至少一种控制序列。在一些实施方案中,载体包括seqidno:413和/或414。[0033]本发明还提供了包含载体的宿主细胞,所述载体包含编码本文提供的工程化酮还原酶变体的多核苷酸。[0034]本发明还提供了产生本文提供的工程化酮还原酶变体的方法,所述方法包括在本文提供的宿主细胞产生工程化酮还原酶变体的条件下培养所述宿主细胞。在一些实施方案中,方法还包括回收由宿主细胞产生的工程化酮还原酶变体的步骤。在一些另外的实施方案中,产生工程化酮还原酶变体的方法包括培养包含seqidno:413和/或414的载体的宿主细胞。[0035]本发明还提供了固定化的工程化酮还原酶变体。[0036]本发明还提供了包含至少一种本文提供的工程化酮还原酶变体的组合物。在一些实施方案中,组合物包含至少一种本文提供的固定化的工程化酮还原酶变体。[0037]附图简述[0038]图1提供了比较seqidno:6和seqidno:80的多肽在高底物浓度的kred活性的典型hplc反应谱(reactionprofile)。[0039]图2提供了在实施例11中描述的实验结果,所选变体在高底物和低nadp浓度的kred活性(%转化)。[0040]图3提供了描绘由seqidno:194的多肽产生的rho物质(species)的典型hplc反应谱。[0041]图4提供了比较seqidno:328和seqidno:330的多肽在高底物和低nadp浓度的kred活性的典型hplc反应谱。对于图4,实线=4g/l酶;虚线=1g/l酶;菱形=seqidno:328;空心正方形=seqidno:330。[0042]图5提供了比较seqidno:270、seqidno:328、seqidno:330、seqidno:348、seqidno:346和seqidno:356的多肽在高底物和低nadp浓度的kred活性的典型hplc反应谱。对于图5,空心三角形=seqidno:270;实心三角形=seqidno:328;空心圆形=seqidno:348;实心圆形=seqidno:356;空心正方形=seqidno:330;实心正方形=seqidno:346。[0043]发明描述[0044]本发明提供了与天然存在的野生型酮还原酶相比具有改进的特性的工程化酮还原酶,以及编码工程化酮还原酶的多核苷酸,能够表达工程化酮还原酶的宿主细胞,以及使用工程化酮还原酶的方法。[0045]定义[0046]参考本发明,本文的描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义,除非另有具体定义。因此,以下术语意在具有以下含义。本文提及的所有专利和出版物,包括这些专利和出版物中公开的所有序列,都通过引用明确并入。除非另外指示,本发明的实践包括分子生物学、发酵、微生物学和相关领域中常用的常规技术,这些技术是本领域技术人员已知的。除非本文另外定义,本文使用的所有技术和科学术语具有与本发明所属领域内的普通技术人员通常理解的相同含义。尽管与本文描述的那些相似或等效的任何方法和材料都可以用于实践或测试本发明,但描述了优选的方法和材料。实际上,不意图本发明局限于本文描述的特定方法学、方案和试剂,因为这些可以取决于使用它们的环境而变化。本文提供的标题不是对本发明的各方面或实施方案的限制。[0047]尽管如此,为了便于理解本发明,下文定义了许多术语。数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图包括落在这样的较宽数值范围内的每一较窄数值范围,如同这样的较窄数值范围在本文被全部清楚地写出。还意图本文公开的每个最大的(或最小的)数值限制包含每个较低(或较高)的数值限制,如同这样的较低(或较高)数值限制在本文被清楚地写出。[0048]如本文使用的,术语“包含(comprising)”及其同源词以其包括性意义使用(即,等同于术语“包括(including)”及其相应的同源词)。[0049]如在本文和在所附权利要求书中使用的,单数的“一(a)”、“一(an)”和“该(the)”包括复数指代物,除非上下文另外明确规定。因此,例如对“宿主细胞”的提及包括多于一个这样的宿主细胞。[0050]除非另外指示,分别地,核酸以5’至3’的方向从左向右书写,而氨基酸序列以氨基至羧基的方向从左向右书写。[0051]本文提供的标题不是对可以通过整体参考说明书而获得的本发明的各个方面或实施方案的限制。因此,下文定义的术语通过整体参考说明书被更充分地定义。[0052]“酮还原酶”和“kred”在本文中可互换使用,以指具有将羰基基团还原为其对应醇的酶促能力的多肽。更具体地,本发明的酮还原酶多肽能够将异-α-酸的混合物还原成相应的二氢-(ρ)-异-α-酸,如方案1所示。本发明的酮还原酶来源于开菲尔乳杆菌(l.kefir)的天然存在的kred(seqidno:2)。然而,术语kred和酮还原酶不限于此,并且可以指天然存在的酶或来源于各种细菌、植物、藻类和/或动物物种的酶。酶可以是合成的、人造的或通过本领域技术人员已知的各种方法产生。[0053]“异-α-酸”或“iso”在本文可互换地用于指异葎草酮的异构体、差向异构体、非对映异构体、互变异构体和对映异构体,异葎草酮是一种来源于啤酒花(啤酒花植物humuluslupulusl.的花)的化合物。“异-α-酸”或“iso”包括顺式-异葎草酮、反式-异葎草酮、顺式-异辅葎草酮、反式-异辅葎草酮、顺式-异近葎草酮和反式-异近葎草酮,但不限于此。“异-α-酸”或“iso”还包括任何天然存在或合成的异构体、差向异构体、非对映异构体、互变异构体、对映异构体或具有类似化学特性(特别地,使啤酒或其他酒精饮料或类似饮料具有苦的味道或苦味)的其他衍生物或类似化合物。这包括异葎草酮特窗酸(tetronicacid)核心的任何异构体、差向异构体、非对映异构体、对映异构体或互变异构体。[0054]“二氢-(ρ)-异-α-酸”或“rho”在本文中可互换地用于指通过还原由本文定义的“异-α-酸”或“iso”的羰基基团而生成的化合物。“二氢-(ρ)-异-α-酸”或“rho”可通过一种或更多种kred多肽的转化从“异-α-酸”或“iso”产生,如本文所述。[0055]如本文使用的,术语“蛋白”、“多肽”和“肽”在本文中可互换使用,以指通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如,糖基化、磷酸化、脂质化、豆蔻酰化(myristilation)、泛素化等)如何。此定义内包括d-氨基酸和l-氨基酸以及d-氨基酸和l-氨基酸的混合物。[0056]如本文使用的,“多核苷酸”和“核酸”指的是共价连接在一起的两个或更多个核苷。多核苷酸可以完全由核糖核苷(即rna)组成、完全由2’脱氧核糖核苷(即dna)或核糖核苷和2’脱氧核糖核苷的混合物组成。虽然核苷典型地将经由标准磷酸二酯连接连接在一起,但多核苷酸可以包括一个或更多个非标准连接。多核苷酸可以是单链或双链的,或者可以包括单链区域和双链区域二者。此外,虽然多核苷酸将通常包含天然存在的编码核碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶),但它可以包含一种或更多种修饰的和/或合成的核碱基(例如肌酐、黄嘌呤、次黄嘌呤等)。优选地,这样的修饰的或合成的核碱基将是编码核碱基。[0057]如本文使用的,“编码序列”是指核酸(例如基因)编码蛋白质的氨基酸序列的部分。[0058]如本文使用的,“天然存在的”或“野生型”是指在自然界中发现的形式。例如,天然存在的或野生型多肽或多核苷酸序列是存在于可以从自然界的来源分离的生物体中并且没有被人工操作有意修饰的序列。[0059]如本文使用的,当在本发明中关于(例如,细胞、核酸或多肽)使用时,“非天然存在的”或“工程化”或“重组”是指如下材料或与该材料的天然或自然形式对应的材料:已经以自然界本来不存在的方式被修饰或与其相同但由合成材料产生或衍生和/或通过使用重组技术操作产生。非限制性实例包括,除其他以外,表达自然(非重组)形式的细胞中未发现的基因或表达原本以不同水平表达的自然基因的重组细胞。[0060]如本文使用的,“序列同一性百分比”、“同一性百分比”和“相同百分比”指的是多核苷酸序列或多肽序列之间的比较,并且通过在比较窗上比较两个最佳比对序列来确定,其中与参考序列相比,比较窗中的多核苷酸或多肽序列的部分可以包含添加或缺失(即空位),用于这两个序列的最佳比对。百分比如下计算:通过确定两个序列中出现相同的核酸碱基或氨基酸残基,或者核酸碱基或氨基酸残基与空位比对的位置的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数,并将结果乘以100以产生序列同一性百分比。对最佳比对和序列同一性百分比的确定使用blast和blast2.0算法来进行(例如参见,altschul等人,j.mol.biol.215:403-410[1990];和altschul等人,nucleicacidsres.3389-3402[1977])。公众可通过美国国家生物技术信息中心网站获得用于进行blast分析的软件。[0061]简言之,blast分析包括首先通过识别问询序列中具有长度w的短字(word)来识别高评分序列对(hsp),该高评分序列对当与数据库序列中的相同长度的字对齐时匹配或满足某个正值阈值评分t。t被称为相邻字评分阈值(altschul等人,同上)。这些最初的邻近字击中(wordhit)充当启动搜索的种子以找到包含它们的更长hsp。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列,累积评分使用参数m(用于匹配残基对的奖励评分;总是>0)和n(用于错配残基的惩罚评分;总是<0)计算。对于氨基酸序列,评分矩阵用于计算累积评分。在以下情况时,停止字击中在每一个方向的延伸:累积比对评分从其最大达到值下降了量x;由于累积了一个或更多个负评分残基比对,累积评分达到0或小于0;或到达任一序列末端。blast算法参数w、t和x决定比对的灵敏度和速度。blastn程序(对于核苷酸序列)使用以下作为默认值:字长(w)为11、期望值(e)为10、m=5、n=-4、以及两条链的比较。对于氨基酸序列,blastp程序使用以下作为默认值:字长(w)为3、期望值(e)为10、和blosum62评分矩阵(参见例如,henikoff和henikoff,proc.natl.acad.sci.usa89:10915[1989])。[0062]许多其他算法是可获得的和本领域已知的,这些算法在提供两个序列的同一性百分比方面与blast起相似作用。用于比较的序列的最佳比对可以使用本领域已知的任何合适的方法进行(例如,通过smith和waterman,adv.appl.math.2:482[1981]的局部同源性算法;通过needleman和wunsch,j.mol.biol.48:443[1970]的同源性比对算法;通过pearson和lipman,proc.natl.acad.sci.usa85:2444[1988]的搜索相似性的方法;和/或通过这些算法的计算机化实现[gcgwisconsin软件包中的gap、bestfit、fasta和tfasta]),或通过使用本领域通常已知的方法进行目视检查。此外,序列比对和序列同一性百分比的确定可以使用所提供的默认参数,采用gcgwisconsin软件包(accelrys,madisonwi)中的bestfit或gap程序。[0063]如本文使用的,“参考序列”指的是另一序列被与之比较的确定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段(segment)。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度,或核酸或多肽的全长。由于两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即完整序列的一部分),并且(2)还可以包含两个序列之间趋异的(divergent)序列,因此两个(或更多个)多核苷酸或多肽之间的序列比较通常通过在比较窗上比较两个多核苷酸的序列来鉴定和比较序列局部区域的相似性来进行。术语“参考序列”不意图局限于野生型序列,并且可以包括工程化序列或改变的序列。例如,在一些实施方案中,“参考序列”可以是先前工程化或改变的氨基酸序列。[0064]如本文使用的,“比较窗”指的是至少约20个连续核苷酸位置或氨基酸残基的概念性区段(conceptualsegment),其中序列可以与至少20个连续核苷酸或氨基酸的参考序列比较,并且其中与参考序列(其不包含添加或缺失)相比,序列在比较窗中的部分可以包含20%或更少的添加或缺失(即空位),以用于两个序列的最佳比对。比较窗可以比20个连续残基更长,并任选地包括30、40、50、100或更长的窗。[0065]当如本文使用的,当在给定氨基酸或多核苷酸序列的编号的上下文中使用时,“对应于”、“关于”或“相对于”是指,当将给定氨基酸或多核苷酸序列与指定参考序列相比时,该参考序列的残基的编号。换言之,给定聚合物的残基编号或残基位置关于参考序列被指定,而不是通过给定氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如,可以通过引入空位将给定氨基酸序列诸如工程化酮还原酶的氨基酸序列与参考序列比对,以优化两个序列之间的残基匹配。在这些情况中,尽管存在空位,对给定氨基酸或多核苷酸序列中的残基关于与其比对的参考序列进行编号。如本文使用的,如下文进一步描述的对残基位置的提及,诸如“xn”,应被理解为指“对应于......的残基”,除非另外明确说明。因此,例如“x94”指的是多肽序列中在位置94处的任何氨基酸。[0066]如本文使用的,“立体选择性”指一种立体异构体相对于另一种立体异构体或另一组立体异构体在化学或酶促反应中的优先形成。立体选择性可以是部分的,此时一种立体异构体的形成优于另一种,或者立体选择性可以是完全的,此时仅形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映选择性,即两种对映异构体的总和中一种对映异构体的分数(通常报道为百分比)。本领域中通常可选择地将其报道(通常为百分比)为根据下式从中计算的对映异构体过量(e.e.):[主要对映异构体-次要对映异构体]/[主要对映异构体 次要对映异构体]。当立体异构体是非对映异构体时,立体选择性被称为非对映选择性,即两种非对映异构体的混合物中一种非对映异构体的分数(通常报道为百分比),通常可选择地报告为非对映异构体过量(d.e.)。对映异构体过量和非对映异构体过量是立体异构体过量的类型。还应理解,立体选择性不限于单一立体异构体,并且可以描述立体异构体的组。[0067]如本文使用的,“高立体选择性”是指能够以至少约75%的立体异构体过量将底物转化为其对应的手性醇产物的化学或酶促反应。[0068]如本文使用的,“增加的酶促活性”和“增加的活性”是指工程化酶的改进的特性,其可以通过与参考酶相比,比活性(例如,产生的产物/时间/重量蛋白)的增加或底物向产可以指位置“xn”或已经被加工以缺少起始甲硫氨酸的参考序列的对应位置(例如,位置(x-1)n)。[0074]如本文使用的,措辞“保守氨基酸取代”指的是具有相似侧链的残基的可互换性,并且因此通常包括用相同或相似的氨基酸定义类别内的氨基酸取代多肽中的氨基酸。例如但不限于,在一些实施方案中,具有脂肪族侧链的氨基酸被另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳族侧链的氨基酸被另一种具有芳族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和/或疏水氨基酸或亲水氨基酸分别被另一种疏水氨基酸或亲水氨基酸取代。示例性保守取代在表1中提供。[0075][0076]如本文使用的,措辞“非保守取代”指的是用具有显著不同的侧链特性的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而不是之内的氨基酸,并且影响:(a)取代区域中的肽骨架的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链体积。例如但不限于,示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳香族氨基酸;和用疏水氨基酸取代亲水氨基酸。[0077]如本领域技术人员将理解的,除非另外说明,否则以上定义的类别中的一些并不相互排斥。因此,具有显示两种或更多种物理化学特性的侧链的氨基酸可以被包括在多个类别中。对任何氨基酸或残基的适当分类对本领域技术人员来说将是明显的,特别是根据本文提供的详细发明。[0078]如本文使用的,“缺失”指的是通过从参考多肽去除一个或更多个氨基酸来修饰多肽。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或者20个或更多个氨基酸、多达构成多肽的氨基酸总数的10%或多达构成多肽的氨基酸总数的20%,同时保留酶促活性和/或保留工程化酶的改进的特性。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段或可以是不连续的。[0079]如本文使用的,“插入”指的是通过向参考多肽添加一个或更多个氨基酸来修饰多肽。在一些实施方案中,改进的工程化酮还原酶包括向天然存在的酮还原酶多肽插入一个或更多个氨基酸,以及向工程化酮还原酶多肽插入一个或更多个氨基酸。插入可以处于多肽的内部部分或者可以是插入到羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段或由天然存在的多肽中的一个或更多个氨基酸分开。[0080]术语“氨基酸取代集”或“取代集”是指与参考序列相比,多肽序列中的一组氨基酸取代。取代集可以具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或更多个氨基酸取代。在一些实施方案中,取代集是指存在于实施例中提供的表格中所列的变体kred的任一个中的氨基酸取代集。[0081]如本文使用的,“片段”指的是具有氨基末端和/或羧基末端缺失,但其中剩余的氨基酸序列与序列中的对应位置相同的多肽。片段通常可以具有全长酮还原酶多肽例如seqidno:4的多肽的约80%、约90%、约95%、约98%或约99%。在一些实施方案中,片段是“有生物活性的”(即,它表现出与全长序列相同的酶促活性)。[0082]如本文使用的,“分离的多肽”是指与天然伴随多肽的其他污染物,例如,蛋白、脂质和多核苷酸基本上分离的多肽。该术语包括已经从其天然存在的环境或表达系统(例如,宿主细胞或体外合成)中取出或纯化的多肽。改进的酮还原酶可以存在于细胞内、存在于细胞培养基中,或以各种形式制备,诸如裂解物或分离的制品。如此,在一些实施方案中,本发明的工程化酮还原酶多肽可以是分离的多肽。[0083]如本文使用的,“大体上纯的多肽”指的是其中多肽物质是存在的主要物质(即,以摩尔或重量计,其比组合物中的任何其他单独的大分子物质更丰富)的组合物,并且当目标物质以摩尔或%重量计构成存在的大分子物质的至少约50%时,该组合物通常为大体上纯的组合物。通常,以存在于组合物中的所有大分子物质的摩尔或%重量计,基本上纯的工程化酮还原酶多肽组合物将占约60%或更多、约70%或更多、约80%或更多、约90%或更多、约91%或更多、约92%或更多、约93%或更多、约94%或更多、约95%或更多、约96%或更多、约97%或更多、约98%或更多、或约99%。溶剂物质、小分子(《500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的改进的酮还原酶多肽是基本上纯的多肽组合物。[0084]如本文使用的,当关于核酸或多肽使用时,术语“异源的”是指正常情况下生物体(例如,野生型生物体)不表达及分泌的序列。在一些实施方案中,该术语涵盖包含两个或更多个子序列的序列,发现所述子序列彼此之间关系与在自然界中正常存在的关系不同,或所述序列被重组工程化,使得其表达水平或与细胞中的其他核酸或其他分子的物理关系或结构不是正常存在于自然界中的。例如,异源的核酸通常被重组地产生,具有以自然界中未发现的方式排列的来自不相关的基因的两个或更多个序列(例如,本发明的核酸开放阅读框(orf)可操作地连接至被插入到表达盒诸如载体中的启动子序列)。在一些实施方案中,“异源多核苷酸”指的是通过实验室技术被引入到宿主细胞中的任何多核苷酸,并且包括从宿主细胞中取出、经受实验室操作、并且然后重新引入到宿主细胞的多核苷酸。[0085]如本文使用的,“密码子优化的”是指编码蛋白的多核苷酸的密码子改变为在特定生物体中优先使用的那些密码子,使得编码的蛋白在感兴趣的生物体中有效地表达。在一些实施方案中,编码酮还原酶的多核苷酸可以被密码子优化以用于从所选择的用于表达的宿主生物体优化产生。[0086]如本文使用的,“控制序列”在本文中被定义为包括对本发明的多核苷酸和/或多肽的表达是必需或有利的所有组分。每个控制序列对于感兴趣的多核苷酸可以是天然的或外源的。这样的控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。[0087]如本文使用的,“可操作地连接”在本文中被定义为控制序列被合适地放置(即,以功能性关系)在相对于感兴趣的多核苷酸的某一位置处的配置,使得控制序列指导或调控感兴趣的多核苷酸和/或多肽的表达。[0088]如本文使用的,措辞“辅因子再生系统”或“辅因子再循环系统”是指参与使辅因子的氧化形式还原的反应(例如,nadp 至nadph)的一组反应物。通过酮还原酶催化的酮底物的还原而被氧化的辅因子通过辅因子再生系统以还原形式再生。辅因子再生系统包括化学计量还原剂,所述化学计量还原剂是还原氢等同物的来源,并且能够使辅因子的氧化形式还原。辅因子再生系统还可以包含催化剂,例如催化使辅因子的氧化形式被还原剂还原的酶催化剂。分别由nad 或nadp 再生nadh或nadph的辅因子再生系统是本领域已知的,并且可以用于本文描述的方法中。[0089]如本文使用的,“合适的反应条件”是指生物催化反应溶液中的那些条件(例如,酶载量、底物载量、辅因子载量、温度、ph、缓冲剂、共溶剂等的范围),在这些条件下本发明的酮还原酶多肽能够立体选择性地使底物化合物还原为产物化合物。在本发明中提供并通过实施例说明了示例性的“合适的反应条件”。[0090]如本文使用的,诸如“化合物载量”、“酶载量”或“辅因子载量”中的“载量”指的是在反应开始时反应混合物中组分的浓度或量。[0091]如本文使用的,在生物催化剂介导的方法的上下文中,“底物”指的是由生物催化剂作用的化合物或分子。例如,在本文公开的方法中,酮还原酶生物催化剂的示例性底物是异-α-酸。[0092]如本文使用的,在生物催化剂介导的方法的上下文中,“产物”指的是由生物催化剂的作用产生的化合物或分子。[0093]如本文使用的,本文使用的“平衡”是指如由化学或酶促反应的正向速率常数和反向速率常数确定的在化学或酶促反应中产生化学物质的稳定状态浓度的过程(例如,两种物质a和b的相互转化),包括立体异构体的相互转化。[0094]如本文使用的,“氧代”是指=o。[0095]如本文使用的,“氧基”是指二价基团-o-,其可以具有各种取代基以形成不同的氧基基团,包括醚和酯。[0096]如本文使用的,“羧基”是指-cooh。[0097]如本文使用的,“羰基”是指-c(o)-,其可以具有各种取代基以形成不同的羰基基团,包括酸、酰基卤、醛、酰胺、酯和酮。[0098]如本文使用的,“羟基”是指-oh。[0099]如本文使用的,“任选的”和“任选地”意指随后描述的事件或情形可以发生或可以不发生,并且该描述包括其中事件或情形发生的情况和其中事件或情形不发生的情况。本领域普通技术人员将理解,对于被描述为包含一个或更多个任选的取代基的任何分子,仅意在包括空间上可实现的和/或合成上可行的化合物。[0100]如本文使用的,“任选地被取代的”是指一种或一系列化学基团中的所有后续修饰对象(modifier)。例如,在术语“任选地被取代的芳基烷基”中,分子的“烷基(alkyl)”部分和“芳基”部分可以被取代或可以不被取代,并且对于一系列“任选地被取代的烷基、环烷基、芳基和杂芳基”,烷基基团、环烷基基团、芳基基团和杂芳基基团彼此独立地可以被取代或可以不被取代。[0101]工程化酶多肽[0102]酮还原酶(kred)或羰基还原酶生物催化剂(ec1.1.1.184)可用于从醛和酮合成醇,以及从对应的前立体异构体酮底物合成光学活性仲醇。kred也可以催化逆反应(即,醇底物向对应的醛/酮产物的氧化)。kred对酮和醛的还原以及对醇的氧化使用辅因子,最常见的是还原型烟酰胺腺嘌呤二核苷酸(nadh)或还原型烟酰胺腺嘌呤二核苷酸磷酸(nadph),以及用于氧化反应的烟酰胺腺嘌呤二核苷酸(nad)或烟酰胺腺嘌呤二核苷酸磷酸(nadp )。nadh和nadph充当电子供体,而nad 和nadp 充当电子受体。[0103]如本领域已知的,kred酶可见于广泛范围的细菌和酵母中(参见例如,hummel和kulaeur.j.biochem.,184:1-13[1989])。已经报道了许多kred基因和酶序列,包括木兰假丝酵母(candidamagnoliae)(genbank登录号jc7338;gi:11360538);近平滑假丝酵母(candidaparapsilosis)(genbank登录号baa24528.1;gi:2815409),赭色掷孢酵母(sporobolomycessalmonicolor)(genbank登录号af160799;gi:6539734),开菲尔乳杆菌(genbank登录号aap94029.1;gi:33112056),短乳杆菌(lactobacillusbrevis)(genbank登录号1nxq_a;gi:30749782)和布氏嗜热厌氧菌(thermoanaerobiumbrockii)(genbank登录号p14941;gi:1771790)的那些kred基因和酶序列。[0104]酮还原酶的立体选择性已经被应用于制备重要的药物构建单元(pharmaceuticalbuildingblock)(参见例如,broussy等人,org.lett.,11:305-308[2009])。天然存在或工程化的kred在产生有用的化学化合物的生物催化过程中的具体应用已针对以下被证明:4-氯乙酰乙酸酯的还原(参见例如,zhou,j.am.chem.soc.,105:5925-5926[1983];santaniello,j.chem.res.,(s)132-133[1984];美国专利第5,559,030号;美国专利第5,700,670号;和美国专利第5,891,685号)、二氧代羧酸的还原(参见例如,美国专利第6,399,339号)、叔丁基(s)-氯-5-羟基-3-氧代己酸酯的还原(参见例如,美国专利第6,645,746号;和wo01/40450)、基于吡咯并三嗪的化合物的还原(参见例如,美国申请公布第2006/0286646号);取代的苯乙酮的还原(参见例如,美国专利第6,800,477号和第8,748,143号)、以及酮噻茂烷(ketothiolane)的还原(wo2005/054491)。[0105]异-α-酸(“iso”)以顺式和反式差向异构体的复杂混合物存在。存在总共三种不同的侧链(iso上的“r”),通常称为n-、ad-和co-(分别是ibu、sbu和ipr)。此外,预计ad-iso(r=s-bu)作为一对对映体存在。n-、ad-和co-iso中的每一个也作为对应的顺式/反式-异构体对,以及潜在的由邻近待还原的酮的c4叔醇衍生的对映异构体对存在。如果不考虑特窗酸核心的互变异构体,总共存在异-α-酸的多达16种异构体(4个r的,顺式/反式和对映异构体)。[0106]酶对其作用的底物通常有很好的选择性。因此,单种酶或甚至两种酶的简单混合物可以将异-α-酸的所有16种异构体完全转化为相应的二氢-(ρ)-异α-酸是出乎意料的。令人惊讶的是,本发明包括使用一种或更多种酶和辅因子的简单混合物将异-α-酸转化为二氢-(ρ)-异-α-酸的方法。此外,利用酶(kred)进行生物转化允许将从异-α-酸制造二氢-(ρ)异-α-酸标记/认证为“天然”。[0107]本发明提供了工程化酮还原酶,这些酶能够通过区域选择性地仅还原叔醇附近异戊烯基侧链上的酮,将异-α-酸的16种主要异构体不加选择地还原为相应的二氢-(ρ)-异-α-酸,如方案1所描绘的。[0108]方案1[0109][0110]选择seqidno:4的酮还原酶多肽作为用于开发本发明提供的改进的酶的初始骨架。seqidno:4的酶来源于来自开菲尔乳杆菌的野生型酮还原酶(seqidno:2)。选择seqidno:4的多肽作为初始骨架,是由于其将异-α-酸转化为相应的二氢-(ρ)-异α-酸的高活性,以及其相对的底物混杂性和将一系列异葎草酮异构体和差向异构体转化为相应的二氢-(ρ)-异-α-酸的能力。此外,seqidno:4的多肽在各种反应条件下均表现出活性。发现seqidno:2的野生型序列在将异-α-酸转化为相应的二氢-(ρ)-异-α-酸方面不具有可检测到的活性。[0111]本发明的工程化酮还原酶多肽是与seqidno:4的工程化酮还原酶相比具有改进的特性的工程化酮还原酶。在一些实施方案中,与seqidno:4的工程化多肽相比,本发明的工程化酮还原酶多肽具有改进的将异-α-酸转化为相应的二氢-(ρ)-异-α-酸的活性。在一些其他实施方案中,与seqidno:4的工程化多肽相比,本发明的工程化酮还原酶多肽具有改进的对一系列异-α-酸底物的活性。在一些其他实施方案中,与seqidno:4的工程化多肽相比,本发明的工程化酮还原酶多肽具有改进的对一系列底物和辅因子浓度的活性。在一些其他实施方案中,与seqidno:4的工程化多肽相比,本发明的工程化酮还原酶多肽具有改进的在高底物浓度的活性。在一些其他实施方案中,与seqidno:4的工程化多肽相比,本发明的工程化酮还原酶多肽具有改进的在低辅因子浓度的活性。[0112]在一些实施方案中,工程化酮还原酶多肽具有改进的对一种或更多种底物的活性。在一些实施方案中,底物包括异-α-酸的混合物。在一些实施方案中,底物包括顺式-异葎草酮。在一些实施方案中,底物包括反式-异葎草酮。在一些实施方案中,底物包括顺式-异辅葎草酮。在一些实施方案中,底物包括反式-异辅葎草酮。在一些实施方案中,底物包括顺式-异近葎草酮。在一些实施方案中,底物包括反式-异近葎草酮。[0113]在一些实施方案中,工程化酮还原酶多肽具有改进的对一种或更多种底物的活性。在一些实施方案中,工程化酮还原酶多肽具有改进的对异-α-酸的混合物的活性。在一些实施方案中,工程化酮还原酶多肽具有改进的对顺式-异葎草酮的活性。在一些实施方案中,工程化酮还原酶多肽具有改进的对反式-异葎草酮的活性。在一些实施方案中,工程化酮还原酶多肽具有改进的对顺式-异辅葎草酮的活性。在一些实施方案中,工程化酮还原酶多肽具有改进的对反式-异辅葎草酮的活性。在一些实施方案中,工程化酮还原酶多肽具有改进的对顺式-异近葎草酮的活性。在一些实施方案中,工程化酮还原酶多肽具有改进的对反式-异近葎草酮的活性。[0114]在一些实施方案中,工程化酮还原酶多肽在存在辅因子再循环系统的情况下将底物化合物转化为产物化合物。在一些实施方案中,辅因子再循环系统包含第二酶,例如葡萄糖脱氢酶。在一些实施方案中,辅因子再循环系统包括异丙醇。[0115]在一些实施方案中,工程化酮还原酶多肽能够在合适的反应条件下以相对于参考多肽seqidno:4、6、80、104、172、186、194、252、270、272、286、328和/或330的活性增加至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍或100倍的活性将底物化合物转化为产物化合物。在一些实施方案中,工程化酮还原酶多肽能够在合适的反应条件下,以约48h、约36h、约24h的反应时间或甚至更短的时间长度,以至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、或至少约90%、至少约95%、至少约98%、至少约99%的转化率百分比将底物化合物转化为产物化合物。[0116]合适的反应条件可包括提供将底物化合物生物催化转化成相应的产物化合物的反应参数的组合。因此,在方法的一些实施方案中,反应参数的组合包括:(a)约0.1g/l至220g/l底物化合物;(b)约0.5g/l至50g/l工程化多肽;(c)约10%-60%异丙醇中约0.01g/l至10g/lnadp ;(d)约5mm至200mm三乙醇胺*h2so4;(e)约0mm至5mmmgso4或mgcl2;(f)温度为约25℃至60℃;和(g)6-10的ph。因此,在方法的一些实施方案中,反应参数的组合包括:(a)约10g/l至220g/l底物化合物;(b)约0.5g/l至50g/l工程化多肽;(c)约10%-60%异丙醇中约0.01g/l至10g/lnadp ;(d)约5mm-200mm磷酸钾或磷酸钠;(e)约0mm至5mmmgso4或mgcl2;(f)温度为约25℃至60℃;和(g)约6至10的ph。[0117]在一些实施方案中,反应参数的组合包括:(a)约80g/l底物化合物;(b)约20g/l工程化多肽;(c)40%异丙醇中约0.01g/lnadp ;(d)约100mm三乙醇胺*h2so4;(e)约2mmmgso4;(f)约40℃;和(g)约8的ph。在一些实施方案中,反应参数的组合包括:(a)约160g/l底物化合物;(b)约20g/l工程化多肽;(c)40%异丙醇中约0.01g/lnadp ;(d)约100mm磷酸钾;(e)约2mmmgso4;(f)约40℃;和(g)约8的ph。[0118]另外的示例性反应条件包括实施例中提供的测定条件。[0119]在一些实施方案中,改进的工程化酮还原酶包含天然存在的酮还原酶多肽中的氨基酸残基缺失,或其他工程化酮还原酶多肽中的氨基酸残基缺失。因此,在本发明的一些实施方案中,缺失包括酮还原酶多肽的1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸,或20个或更多个氨基酸、多达氨基酸总数的10%、多达氨基酸总数的10%、多达氨基酸总数的20%,或多达氨基酸总数的30%的缺失,只要酮还原酶的功能活性被保持。在一些实施方案中,缺失可以包括1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-11个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、1-25个、1-30个、1-35个或约1-40个氨基酸残基的缺失。在一些实施方案中,缺失的数目可以为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个、16个、18个、20个、22个、24个、26个、30个、35个或约40个氨基酸。在一些实施方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、143-羧酸;高脯氨酸(hpro);以及1-氨基环戊烷-3-羧酸。[0124]如以上描述的,被引入天然存在的多肽以产生工程化酮还原酶的各种修饰可以靶向酶的特定特性。[0125]编码工程化酶的多核苷酸[0126]在另一方面,本发明提供了编码工程化酮还原酶的多核苷酸。多核苷酸可以可操作地连接至控制基因表达的一个或更多个异源调控序列,以创建能够表达多肽的重组多核苷酸。包含编码工程化酮还原酶的异源多核苷酸的表达构建体可被引入合适的宿主细胞以表达相应的酮还原酶多肽。[0127]因为知晓对应于各种氨基酸的密码子,蛋白序列的可得性提供了对能够编码目标的所有多核苷酸的描述。其中相同氨基酸由可选择的或同义密码子编码的遗传密码的简并性允许产生极大数目的核酸,所有这些核酸编码本发明的改善的酮还原酶。因此,鉴定了特定的氨基酸序列后,本领域技术人员可以通过以不改变蛋白的氨基酸序列的方式简单修改序列的一个或更多个密码子来制备任何数目的不同核酸。在此方面,本发明特别设想了通过选择基于可能的密码子选择的组合可以进行的每个和每一个可能的多核苷酸变异,并且所有这样的变异应被认为针对本文公开的任何多肽(包括实施例中的表格中呈现的氨基酸序列)具体公开。在各种实施方案中,优选地选择适应在其中产生蛋白的宿主细胞的密码子。例如,在细菌中使用的优选的密码子被用于在细菌中表达基因;在酵母中使用的优选的密码子被用于酵母中的表达;并且在哺乳动物中使用的优选的密码子被用于在哺乳动物细胞中表达。[0128]在一些实施方案中,多核苷酸包括编码天然存在的酮还原酶多肽氨基酸序列的核苷酸序列,如seqidno:1所呈现的。在一些实施方案中,多核苷酸具有包含与seqidno:3、5、79、103、171、185、193、251、269、271、285、327和/或329的核酸序列(各自分别编码seqidno:4、6、80、104、172、186、194、252、270、272、286、328和/或330的相同多肽序列)至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的同一性的核酸序列。[0129]在一些实施方案中,酶多核苷酸编码具有酶活性与本文公开的特性的工程化多肽,其中所述多肽包含与选自本文提供的seqidno的参考序列或任何变体(例如实施例中提供的那些)的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列,和与一种或更多种参考多核苷酸或如实施例中公开的任何变体的氨基酸序列相比的一个或更多个残基差异(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸残基位置)。在一些实施方案中,参考多肽序列选自seqidno:4、6、80、104、172、186、194、252、270、272、286、328和/或330。[0130]在一些实施方案中,编码工程化酮还原酶的多核苷酸包括与选自seqidno:3、5、79、103、171、185、193、251、269、271、285、327和/或329的序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的多核苷酸序列。在一些实施方案中,编码工程化酮还原酶的多核苷酸包括seqidno:5、79、103、171、185、193、251、269、271、285、327和/或329。在一些实施方案中,编码工程化酮还原酶的多核苷酸包括与选自seqidno:5至411的序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的多核苷酸序列。在一些实施方案中,编码工程化酮还原酶的多核苷酸包括选自seqidno:5至411的多核苷酸序列。[0131]在一些实施方案中,工程化酮还原酶序列包括包含被鉴定为有益的位置的序列,如实施例中描述的。[0132]在一些实施方案中,将编码改进的酮还原酶的分离的多核苷酸以各种方式操作,以提供多肽的改进的表达和/或产生。取决于使用的表达载体,在将分离的多核苷酸插入载体前对分离的多核苷酸的操作可能是期望的或必要的。用于利用重组dna方法修饰多核苷酸和核酸序列的技术是本领域熟知的。[0133]对于细菌宿主细胞,用于指导本发明的核酸构建体的转录的合适启动子包括从以下获得的启动子:大肠杆菌(e.coli)lac操纵子、天蓝色链霉菌(streptomycescoelicolor)琼脂糖酶基因(daga)、枯草芽孢杆菌(bacillussubtilis)果聚糖蔗糖酶基因(sacb)、地衣芽孢杆菌(bacilluslicheniformis)α-淀粉酶基因(amyl)、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)麦芽糖淀粉酶基因(amym)、解淀粉芽孢杆菌(bacillusamyloliquefaciens)α-淀粉酶基因(amyq)、地衣芽孢杆菌青霉素酶基因(penp)、枯草芽孢杆菌xyla和xylb基因、及原核β-内酰胺酶基因(参见例如,villa-kamaroff等人,proc.natlacad.sci.usa75:3727-3731[1978])、以及tac启动子(参见例如,deboer等人,proc.natlacad.sci.usa80:21-25[1983])。另外的合适的启动子对于本领域技术人员是已知的。[0134]对于丝状真菌宿主细胞,用于指导本发明的核酸构建体的转录的合适启动子包括从以下的基因获得的启动子:米曲霉(aspergillusoryzae)taka淀粉酶、米黑根毛霉(rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉(aspergillusniger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(aspergillusawamori)葡糖淀粉酶(glaa)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(aspergillusnidulans)乙酰胺酶和尖孢镰刀菌(fusariumoxysporum)胰蛋白酶样蛋白酶(wo96/00787)、以及na2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体)及其突变启动子、截短启动子和杂合启动子。[0135]在酵母宿主中,可用的启动子包括但不限于来自以下的基因的启动子:酿酒酵母(saccharomycescerevisiae)烯醇化酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)和酿酒酵母3-磷酸甘油酸激酶,以及用于酵母宿主细胞的其他可用启动子(参见例如,romanos等人,yeast8:423-488[1992])。[0136]控制序列还可以是合适的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3’末端。在本发明中可以使用在所选择的宿主细胞中起作用的任何终止子。[0137]例如,用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉taka淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。[0138]用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素c(cyc1)、和酿酒酵母甘油醛-3-磷酸脱氢酶,以及本领域已知的用于酵母宿主细胞的其他可用的终止子(参见例如,romanos等人,同上)。[0139]控制序列还可以是合适的前导序列,前导序列是对宿主细胞的翻译重要的mrna的非翻译区。前导序列被可操作地连接至编码多肽的核酸序列的5’末端。可以使用在所选择的宿主细胞中有功能的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉taka淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列从以下的基因获得:酿酒酵母烯醇化酶(eno-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)。[0140]控制序列还可以是多腺苷酸化序列,多腺苷酸化序列是被可操作地连接至核酸序列的3’末端的序列,并且在转录时,其被宿主细胞识别为将多腺苷残基添加至转录的mrna的信号。在本发明中可以使用在所选择的宿主细胞中起作用的任何多腺苷酸化序列。用于丝状真菌宿主细胞的示例性多腺苷酸化序列可以来自以下的基因:米曲霉taka淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶,以及本领域已知的用于酵母宿主细胞的其他可用的多腺苷酸化序列(参见例如,guo等人,mol.cell.biol.,15:5983-5990[1995])。[0141]控制序列还可以是信号肽编码区域,其编码与多肽的氨基末端连接并指导所编码的多肽进入细胞的分泌途径的氨基酸序列。核酸序列的编码序列的5’末端可以固有地包含信号肽编码区,所述信号肽编码区符合翻译阅读框地(intranslationreadingframe)与编码分泌多肽的编码区的区段天然地连接。可选地,编码序列的5’末端可以包含对编码序列是外源的信号肽编码区。当编码序列不天然包含信号肽编码区时可能需要外源信号肽编码区。[0142]可选择地,外源信号肽编码区可以简单替换天然信号肽编码区以增加多肽的分泌。然而,指导所表达的多肽进入所选择的宿主细胞的分泌途径的任何信号肽编码区可以在本发明中使用。[0143]用于细菌宿主细胞的有效的信号肽编码区是从以下的基因获得的信号肽编码区:芽孢杆菌nclb11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprt、nprs、nprm)和枯草芽孢杆菌prsa、以及本领域已知的另外的信号肽(参见例如,simonen等人,microbiol.rev.,57:109-137[1993])。[0144]用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉taka淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(humicolainsolens)纤维素酶和绵毛状腐质霉(humicolalanuginosa)脂肪酶。用于酵母宿主细胞的可用的信号肽可以来自以下的基因:酿酒酵母α因子和酿酒酵母转化酶,以及另外的可用的信号肽编码区(参见例如,romanos等人,1992,同上)。[0145]控制序列还可以是编码定位于多肽的氨基末端的氨基酸序列的前肽编码区。所得多肽被称为酶原(proenzyme)或多肽原(或在某些情况下为酶原(zymogen))。多肽原通常是无活性的并且可以通过前肽从多肽原的催化裂解或自动催化裂解转化为成熟的有活性的多肽。前肽编码区可以从以下的基因获得:枯草芽孢杆菌碱性蛋白酶(apre)、枯草芽孢杆菌中性蛋白酶(nprt)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(myceliophthorathermophila)乳糖酶(wo95/33836)。[0146]在信号肽和前肽区域两者均存在于多肽的氨基末端时,前肽区域紧邻多肽的氨基末端定位并且信号肽区域紧邻前肽区域的氨基末端定位。[0147]添加允许相对于宿主细胞的生长来调控多肽的表达的调控序列也可能是期望的。调控系统的实例是引起基因表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些。在原核宿主细胞中,合适的调控序列包括lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调控系统包括例如adh2系统或gal1系统。在丝状真菌中,合适的调控序列包括takaα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。[0148]调控序列的其他实例是允许基因扩增的那些。在真核系统中,这些包括在氨甲蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码本发明的kred多肽的核酸序列与调控序列可操作地连接。[0149]因此,在一些实施方案中,本发明也涉及重组的表达载体,该重组的表达载体包含编码工程化酮还原酶多肽或其变体的多核苷酸,以及取决于其将要引入的宿主的类型,一个或多个表达调控区域,诸如启动子和终止子,复制起点等。以上描述的各种核酸和控制序列可以被连接在一起以产生重组表达载体,所述重组表达载体可以包括一个或更多个方便的限制性位点,以允许在这样的位点处插入或取代编码多肽的核酸序列。可选择地,本发明的核酸序列可以通过将包含该序列的核酸序列或核酸构建体插入到用于表达的适当的载体中来表达。在产生表达载体时,编码序列位于载体中,使得编码序列与用于表达的适当的控制序列可操作地连接。[0150]重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经受重组dna程序并且可以引起多核苷酸序列的表达。载体的选择通常将取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。[0151]表达载体可以是自主复制载体(即,作为染色体外实体存在的载体),其复制独立于染色体复制(例如,质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。可选择地,载体可以是当被引入宿主细胞中时被整合到基因组中并与其被整合进的染色体一起复制的载体。此外,可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总dna的两种或更多种载体或质粒、或转座子。[0152]本发明的表达载体优选地含有一个或更多个选择性标志物(selectablemarkers),其允许容易地选择转化的细胞。选择性标志物可以是基因,其产物提供杀生物剂或病毒抗性、重金属抗性、针对营养缺陷型的原养型等。细菌的选择性标志物的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标志物。用于酵母宿主细胞的合适的标志物为ade2、his3、leu2、lys2、met3、trp1和ura3。[0153]用于在丝状真菌宿主细胞中使用的选择性标志物包括但不限于amds(乙酰胺酶)、argb(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niad(硝酸盐还原酶)、pyrg(乳清酸核苷-5’‑磷酸脱羧酶)、sc(硫酸腺苷酰转移酶)和trpc(邻氨基苯甲酸合酶)及其等同物。用于在曲霉属真菌细胞中使用的实施方案包括构巢曲霉或米曲霉的amds和pyrg基因以及吸水链霉菌(streptomyceshygroscopicus)的bar基因。[0154]本发明的表达载体可以包含允许载体整合到宿主细胞的基因组中或允许载体在细胞中独立于基因组自主复制的一个或更多个元件。为了整合到宿主细胞基因组中,载体可以依赖于核酸序列,所述核酸序列编码用于通过同源或非同源重组将载体整合到基因组中的多肽或载体的任何其他元件。[0155]可选择地,表达载体可以包含用于指导通过同源重组整合到宿主细胞的基因组中的另外的核酸序列。另外的核酸序列使载体能够在一条或更多条染色体中的一个或更多个精确位置处整合到宿主细胞基因组中。为了增加在准确位置整合的可能性,整合元件应当优选地包含与对应的靶序列高度同源的足够数目的核酸,诸如100个至10,000个碱基对,优选地400个至10,000个碱基对,并且最优选地800个至10,000个碱基对,以增强同源重组的可能性。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码核酸序列。在另一方面,载体可以通过非同源重组整合到宿主细胞的基因组中。[0156]对于自主复制,载体还可以包含复制起点,使得载体能够在所讨论的宿主细胞中自主复制。细菌复制起点的实例是允许在大肠杆菌中复制的p15aori或质粒pbr322、puc19、pacyc177(该质粒具有p15aori)、或pacyc184的复制起点,和允许在芽孢杆菌中复制的pub110、pe194、pta1060或pamβ1的复制起点。用于在酵母宿主细胞中使用的复制起点的实例是2μm复制起点、ars1、ars4、ars1和cen3的组合以及ars4和cen6的组合。复制起点可以是具有使其在宿主细胞中的功能对温度敏感的突变的复制起点(参见例如,ehrlich,proc.natl.acad.sci.usa75:1433[1978])。[0157]可以将多于一个拷贝的本发明的核酸序列插入宿主细胞中以增加基因产物的产量。核酸序列拷贝数的增加可以通过将该序列的至少一个另外的拷贝整合到宿主细胞基因组中,或者通过将可扩增的选择性标志物基因包含在核酸序列中来获得,其中可以通过在合适的选择剂的存在下培养细胞来选择含有选择标志物基因的扩增的拷贝并从而含有核酸序列的另外的拷贝的细胞。[0158]本发明并不意图局限于本文公开的表达载体。本领域技术人员将认识到,任何合适的表达载体可以用于本发明。用于本发明的许多表达载体是商购可得的。合适的商业表达载体包括但不限于p3xflagtmtm表达载体(sigma-aldrich),其包括用于在哺乳动物宿主细胞中表达的cmv启动子和hgh多腺苷酸化位点以及用于在大肠杆菌中扩增的pbr322复制起点和氨苄青霉素抗性标志物。其他商购可得的合适的表达载体包括但不限于pbluescriptiisk(-)和pbk-cmv载体(stratagene),以及源自pbr322(gibcobrl)、puc(gibcobrl)、prep4、pcep4(invitrogen)或ppoly的质粒(参见,lathe等人,gene57:193-201[1987])。[0159]用于表达工程化多肽的宿主细胞[0160]本发明还提供了包含编码本发明的改进的酮还原酶多肽的多核苷酸的宿主细胞,所述多核苷酸被可操作地连接至一个或更多个控制序列以在宿主细胞中表达酮还原酶。用于表达由本发明的表达载体编码的kred多肽的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞,诸如大肠杆菌、开菲尔乳杆菌、短乳杆菌、微小乳杆菌(lactobacillusminor)、链霉菌属和鼠伤寒沙门氏菌(salmonellatyphimurium)细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(pichiapastoris)(atcc登录号201178));昆虫细胞,诸如果蝇属(drosophila)s2和夜蛾属(spodoptera)sf9细胞;动物细胞,诸如cho、cos、bhk、293和bowes黑素瘤细胞;以及植物细胞。用于上文描述的宿主细胞的适当的培养基和生长条件是本领域熟知的。[0161]用于表达酮还原酶的多核苷酸可以通过本领域已知的各种方法引入细胞中。技术包括,除其他以外,电穿孔、生物弹射粒子轰击(biolisticparticlebombardment)、脂质体介导的转染、氯化钙转染和原生质体融合。用于将多核苷酸引入细胞中的各种方法对技术人员将是明显的。[0162]大肠杆菌w3110是可用于本发明的宿主菌株,尽管并不意图本发明局限于这种特定的宿主菌株。表达载体通过将编码改进的酶的多核苷酸可操作地连接至质粒pck110900中来创建,所述编码改进的酶的多核苷酸可操作地连接至在laci阻遏物的控制下的lac启动子。表达载体还包含p15a复制起点和氯霉素抗性基因。大肠杆菌w3110中包含主题多核苷酸的细胞可以通过使细胞经受氯霉素选择来分离。[0163]产生工程化酮还原酶多肽的方法[0164]在一些实施方案中,为了制备本发明的改进的kred多核苷酸和多肽,催化还原反应的天然存在的酮还原酶从开菲尔乳杆菌获得(或来源)。在一些实施方案中,对亲本多核苷酸序列密码子优化以增强酮还原酶在指定宿主细胞中的表达。作为说明,编码开菲尔乳杆菌的野生型kred多肽的亲本多核苷酸序列由寡核苷酸构建,所述寡核苷酸基于可从genbank数据库获得的开菲尔乳杆菌kred序列的已知多肽序列来制备。对亲本多核苷酸序列进行密码子优化以用于在大肠杆菌中表达,并将密码子优化的多核苷酸克隆到表达载体中,将酮还原酶基因的表达置于lac启动子和laci阻遏物基因的控制下。鉴定在大肠杆菌中表达活性酮还原酶的克隆,并对基因测序以确认其身份。[0165]在一些实施方案中,如以上讨论的,工程化酮还原酶可以通过使编码天然存在的酮还原酶的多核苷酸经受诱变和/或定向演化方法来获得。诱变可以根据本领域已知的任何技术来进行,包括随机诱变和定点诱变。定向演化可以用本领域已知的任何技术包括重排来进行,以筛选改进的启动子变体。诱变和定向演化方法是本领域熟知的(参见例如,美国专利号5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,265,201、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,337,186、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,483,011、6,484,105、6,489,146、6,500,617、6,500,639、6,506,602、6,506,603、6,518,065、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,605,430、6,613,514、6,653,072、6,686,515、6,703,240、6,716,631、6,825,001、6,902,922、6,917,882、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,220,566、7,288,375、7,384,387、7,421,347、7,430,477、7,462,469、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,783,428、7,873,477、7,873,499、7,904,249、7,957,912、7,981,614、8,014,961、8,029,988、8,048,674、8,058,001、8,076,138、8,108,150、8,170,806、8,224,580、8,377,681、8,383,346、8,457,903、8,504,498、8,589,085、8,762,066、8,768,871、9,593,326和所有相关的非美国的对应专利;ling等人,anal.biochem.,254(2):157-78[1997];dale等人,meth.mol.biol.,57:369-74[1996];smith,ann.rev.genet.,19:423-462[1985];botstein等人,science,229:1193-1201[1985];carter,biochem.j.,237:1-7[1986];kramer等人,cell,38:879-887[1984];wells等人,gene,34:315-323[1985];minshull等人,curr.op.chem.biol.,3:284-290[1999];christians等人,nat.biotechnol.,17:259-264[1999];crameri等人,nature,391:288-291[1998];crameri,等人,nat.biotechnol.,15:436-438[1997];zhang等人,proc.nat.acad.sci.u.s.a.,94:4504-4509[1997];crameri等人,nat.biotechnol.,14:315-319[1996];stemmer,nature,370:389-391[1994];stemmer,proc.nat.acad.sci.usa,91:10747-10751[1994];wo95/22625;wo97/0078;wo97/35966;wo98/27230;wo00/42651;wo01/75767和wo2009/152336;所有这些通过引用并入本文)。[0166]对诱变处理后获得的克隆筛选具有期望的改进的酶特性的工程化酮还原酶。测量来自表达文库的酶活性可以使用标准生物化学技术来进行,所述标准生物化学技术监测随着nadh或nadph被转化为nad 或nadp ,nadh或nadph浓度的降低速率(通过吸光度或荧光的降低)。在这个反应中,当酮还原酶将酮底物还原为对应的羟基基团时,nadh或nadph被酮还原酶消耗(氧化)。如通过每单位时间吸光度或荧光的降低测量的nadh或nadph浓度的降低速率指示固定量的裂解物(或由其制成的冻干粉末)中的kred多肽的相对(酶促)活性。产物的立体化学可以通过各种已知技术来确定,并如实施例中所提供的。在期望的改进的酶特性为热稳定性时,酶活性可在将酶制品经受确定的温度和测量热处理后余下的酶促活性的量之后测量到。然后对包含编码酮还原酶的多核苷酸的克隆进行分离、测序以鉴定核苷酸序列的改变(如果有的话)、并且用于在宿主细胞中表达酶。[0167]当已知工程化多肽的序列时,编码酶的多核苷酸可以根据已知的合成方法通过标准固相方法来制备。在一些实施方案中,多达约100个碱基的片段可以被单独地合成、然后连接(例如,通过酶促连接方法或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如,本发明的多核苷酸和寡核苷酸可以通过化学合成来制备(例如,使用由beaucage等人,tet.lett.,22:1859-69[1981]描述的经典亚磷酰胺法,或由matthes等人,emboj.,3:801-05[1984]描述的方法,如自动化合成方法中通常实践的)。根据亚磷酰胺方法,寡核苷酸被合成(例如,在自动dna合成仪中)、纯化、退火、连接并克隆入适当的载体。此外,基本上任何核酸可以从各种商业来源中的任一种获得(例如,themidlandcertifiedreagentcompany,midland,tx,thegreatamericangenecompany,ramona,ca,expressgeninc.chicago,il,operontechnologiesinc.,alameda,ca,以及许多其他商业来源)。[0168]在宿主细胞中表达的工程化酮还原酶可以使用用于蛋白纯化的熟知的技术中的任一种或更多种从细胞和/或培养基回收,所述技术尤其包括溶菌酶处理、声处理(sonication)、过滤、盐析、超速离心和色谱。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的合适的溶液是以商标名cellytictm(sigma-aldrich)商购可得的。[0169]分离酮还原酶多肽的色谱技术,包括但不限于反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件将部分地取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素,并且对于本领域技术人员将是明显的。[0170]在一些实施方案中,亲和技术用于分离改进的酮还原酶。对于亲和色谱纯化,可使用特异性结合酮还原酶多肽的任何抗体。为了产生抗体,可以通过注射酮还原酶免疫接种各种宿主动物,包括但不限于兔、小鼠、大鼠等。酮还原酶多肽可以通过侧链官能基团或附接至侧链官能基团的接头的手段被附接至合适的载体诸如bsa。根据宿主物种,可以使用各种佐剂增强免疫应答,佐剂包括但不限于弗氏(完全和不完全)、矿物凝胶诸如氢氧化铝、表面活性物质诸如溶血卵磷脂、普朗尼克多元醇、聚阴离子、肽、油乳剂、钥孔血蓝蛋白(keyholelimpethemocyanin)、二硝基苯酚,以及潜在有用的人类佐剂诸如bcg(卡介苗)和短棒状杆菌(corynebacteriumparvum)。[0171]酮还原酶可以以表达酶的细胞的形式、作为粗提取物、或作为分离的或纯化的制品来制备及使用。酮还原酶可以被制备为冻干物、呈粉末形式(例如,丙酮粉末)或被制备为酶溶液。在一些实施方案中,酮还原酶可以是基本上纯的制品形式。[0172]在一些实施方案中,酮还原酶多肽可以被附接至固体基底。基底可以是固相、表面和/或膜。固体支持物可以包括有机聚合物,诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅、可控孔隙玻璃(cpg)、反相二氧化硅或金属诸如金或铂。基底的构型可以呈珠、球、颗粒(particle)、小粒(granule)、凝胶、膜或表面的形式。表面可以是平坦的、基本上平坦的或非平坦的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特征。固体支持物可以被配置为孔、凹陷(depression)或其他容器(container)、器皿(vessel)、特征或位置的形式。多于一个支持物可以被配置在阵列上于多个位置处,所述位置可用试剂的自动递送或通过检测方法和/或仪器寻址。[0173]如本领域技术人员已知的,酮还原酶催化的还原反应通常需要辅因子。由本文描述的工程化酮还原酶催化的还原反应通常也需要辅因子,尽管工程化酮还原酶的许多实施方案比用野生型酮还原酶催化的反应需要少得多的辅因子。如本文使用的,术语“辅因子”是指与酮还原酶联合运作的非蛋白化合物。适合于与本文描述的工程化酮还原酶一起使用的辅因子包括但不限于nadp (烟酰胺腺嘌呤二核苷酸磷酸)、nadph(nadp 的还原形式)、nad (烟酰胺腺嘌呤二核苷酸)和nadh(nad 的还原形式)。通常,将辅因子的还原形式添加到反应混合物中。还原的nad(p)h形式可以使用辅因子再生系统任选地由氧化的nad(p) 形式再生。术语“辅因子再生系统”是指参与使辅因子的氧化形式还原的反应(例如,nadp 到nadph)的一组反应物。通过酮还原酶催化的酮底物的还原而被氧化的辅因子通过辅因子再生系统以还原形式再生。辅因子再生系统包括化学计量还原剂,所述化学计量还原剂是还原氢等同物的来源,并且能够使辅因子的氧化形式还原。辅因子再生系统还可以包含催化剂,例如催化使辅因子的氧化形式被还原剂还原的酶催化剂。辅助因子再生系统还可以包括辅底物,诸如异丙醇。分别由nad 或nadp 再生nadh或nadph的辅因子再生系统是本领域已知的,并且可以用于本文描述的方法中。[0174]实验[0175]本发明的各种特征和实施方案在以下代表性实施例中进行了说明,这些实施例旨在说明而非限制。[0176]在以下实验公开内容中,以下缩写适用:ppm(百万分率);m(摩尔/升);mm(毫摩尔/升),um和μm(微摩尔/升);nm(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);l和l(升);ml和ml(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(分钟);h和hr(小时);u(单位);mw(分子量);rpm(转/分);℃(摄氏度);rt(室温);cds(编码序列);dna(脱氧核糖核酸);rna(核糖核酸);hplc(高效液相色谱);fiopc(相对于阳性对照的倍数改进);htp(高通量);lb(luria肉汤);kpo4(磷酸钾);kpo3(亚磷酸钾);teoa(三乙醇胺);pmbs(硫酸多粘菌素b);sigma-aldrich(sigma-aldrich,st.louis,mo);millipore(millipore,corp.,billericama);difco(difcolaboratories,bddiagnosticsystems,detroit,mi);daicel(daicel,westchester,pa);genetix(genetixusa,inc.,beaverton,or);moleculardevices(moleculardevices,llc,sunnyvale,ca);appliedbiosystems(appliedbiosystems,lifetechnologies,corp.的一部分,grandisland,ny),agilent(agilenttechnologies,inc.,santaclara,ca);thermoscientific(thermofisherscientific的一部分,waltham,ma);corning(corning,inc.,paloalto,ca);和bio-rad(bio-radlaboratories,hercules,ca)。[0177]在本发明的开发中使用了以下序列。[0178]seqidno:413:[0179][0180][0181][0182]seqidno:414:[0183][0184][0185]实施例1[0186]包含重组kred基因的大肠杆菌表达宿主[0187]用于产生本发明的变体的初始kred酶从codexis收集的商购可得kred酶小组获得。在初始筛选期间,变体seqidno:4产生最多的产物,如通过lc/ms确定的。将kred编码基因克隆到表达载体系统中,包括pck110900(参见美国专利申请公布第2006/0195947号的图3)、seqidno:413或seqidno:414中,可操作地连接到在lacl阻遏物的控制下的lac启动子。表达载体系统还包含p15a复制起点和氯霉素抗性基因。本发明并不意图局限于本文公开的表达载体。本领域技术人员将认识到,任何合适的表达载体可以用于本发明,包括但不限于p3xflagtmtm表达载体(sigma-aldrich)、pbluescriptiisk(-)和pbk-cmv载体(stratagene),以及来源于pbr322(gibcobrl)、puc(gibcobrl)、prep4、pcep4(invitrogen)或ppoly(参见,lathe等人,gene57:193-201[1987])的质粒。[0188]使用本领域已知的标准方法将所得质粒转化到大肠杆菌w3110中。如本领域已知的,通过使细胞经受氯霉素选择来分离转化体(参见例如,美国专利第8,383,346号和wo2010/144103)。[0189]实施例2[0190]htp含kred的湿细胞沉淀的制备[0191]将来自单克隆菌落的含有重组kred编码基因的大肠杆菌细胞接种到96孔浅孔微量滴定板的孔中的含有1%葡萄糖和30μg/ml氯霉素的190μllb中。将板用o2可透过的密封件(seal)密封,并使培养物在20℃、200rpm和85%湿度生长过夜。然后,将20μl的每种细胞培养物转移到含有380μltb和30μg/mlcam的96孔深孔板的孔中。将深孔板用o2可透过的密封件密封,并且在30℃、250rpm和85%湿度孵育,直到达到0.6-0.8的od600。然后将细胞培养物用达到1mm的最终浓度的iptg诱导,并且在与最初使用的相同条件下孵育过夜。然后用在4℃、4000rpm持续10分钟的离心将细胞沉淀。弃去上清液,并且在裂解前将沉淀冷冻在-80℃。[0192]实施例3[0193]htp含kred的细胞裂解物的制备[0194]首先,通过加入150μl含有100mmph8三乙醇胺*h2so4与2mmmgso4或100mmph8磷酸钾与2mmmgso4、1g/l溶菌酶和0.5g/lpmbs的裂解缓冲液裂解如实施例2所述产生的细胞沉淀。然后,在桌上型摇动器(benchtopshaker)上在室温摇动细胞沉淀2小时。将板在4℃以4000rpm离心15分钟,以去除细胞碎片。然后将上清液用于生物催化反应以确定它们的活性水平。[0195]实施例4[0196]从摇瓶(sf)培养物制备冻干裂解物[0197]摇瓶程序可用于生成工程化kred多肽摇瓶粉末(sfp),其可用于二次筛选测定和/或用于本文所述的生物催化过程。与htp测定中使用的细胞裂解物相比,酶的摇瓶粉末(sfp)制品提供了更纯化的工程化酶的制品(例如,多达总蛋白的30%),并且还允许使用更浓缩的酶溶液。首先,将如上文描述地生长的选定htp培养物铺板在具有1%葡萄糖和30μg/ml氯霉素(cam)的lb琼脂板上,并在37℃生长过夜。将来自每个培养物的单个菌落转移到6ml具有1%葡萄糖和30μg/mlcam的lb中。使培养物在30℃在250rpm生长18h,并以约1:50传代培养至250ml含30μg/mlcam的tb中,至0.05的最终od600。使培养物在30℃在250rpm生长约3小时,达到0.8-1.0之间的od600,并用1mmiptg诱导。然后使培养物在30℃在250rpm生长20h。将培养物离心(4000rpm,在4℃持续20分钟)。弃去上清液,并将沉淀重悬在35ml的50mmph8磷酸钾与2mmmgso4中。将重悬的细胞离心(4000rpm,在4℃持续20分钟)。弃去上清液,并将沉淀重悬在6ml的50mmph8磷酸钾与2mmmgso4中,并使用来自constantsystems(oneshot)的细胞破坏仪裂解细胞。使裂解物沉淀(10,000rpm,在4℃持续60min)并且将上清液冷冻并冻干以产生摇瓶(sf)酶。[0198]实施例5[0199]来源于seqidno:4的工程化多肽的演化与针对改进的kred活性的筛选[0200]基于筛选变体还原异-α-酸底物的结果,选择seqidno:4作为亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0201]编码seqidno:4的具有kred活性的多肽的工程化多核苷酸(即,seqidno:3)用于生成表5-1的另外的工程化多肽。与起始多肽相比,这些多肽显示出从异-α-酸形成二氢-(ρ)-异-α-酸的改进。使用上文描述的定向演化方法与以下表5-2所述的htp测定和分析方法一起,从seqidno:4的“骨架”氨基酸序列产生工程化多肽。[0202]定向演化始于seqidno:3中所列的多核苷酸。然后选择工程化多肽作为起始的“骨架”基因序列。工程化多肽的文库使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生并使用htp测定和分析方法进行筛选,该htp测定和分析方法测量多肽将异-α-酸底物转化为期望的二氢-(ρ)-异-α-酸产物的能力。[0203]酶测定以96孔形式在200μl总体积/孔中进行,其包括在100mmph8三乙醇胺*h2so4与2mmmgso4中的50%v/vhtp酶裂解物、8g/l异-α-酸底物(异构化啤酒花提取物溶液,kalsec)以及40体积%异丙醇(ipa)中的0.1g/lnadp。将板密封并在40℃以600rpm摇动孵育20-24小时。[0204]20-24小时后,加入1000μl的具有0.1%乙酸的乙腈。将板密封,并在4℃以4000rpm离心10分钟。将猝灭的样品在50:50乙腈:水混合物中进一步稀释4-5x,然后进行hplc分析。hplc运行参数在下表5-2中描述。[0205][0206][0207][0208][0209]实施例6[0210]来源于seqidno:6的工程化多肽的演化与针对改进的kred活性的筛选[0211]使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0212]编码seqidno:6的具有kred活性的多肽的工程化多核苷酸(即,seqidno:5)用于生成表6-1的另外的工程化多肽。与起始多肽相比,这些多肽显示出从异-α-酸形成二氢-(ρ)-异-α-酸的改进。使用上文描述的定向演化方法与表5-2中所述的htp测定和分析方法一起,从seqidno:6的“骨架”氨基酸序列产生工程化多肽。[0213]定向演化始于seqidno:5中所列的多核苷酸。然后选择工程化多肽作为起始的“骨架”基因序列。工程化多肽的文库使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生并使用htp测定和分析方法进行筛选,该htp测定和分析方法测量多肽将异-α-酸底物转化为期望的二氢-(ρ)-异-α-酸产物的能力。[0214]酶测定以96孔形式在200μl总体积/孔中进行,其包括在100mmph8三乙醇胺*h2so4与2mmmgso4中的50%v/vhtp酶裂解物、16g/l或40g/l异-α-酸底物(异构化啤酒花提取物溶液,kalsec)以及40体积%异丙醇(ipa)中的0.1g/lnadp。将板密封并在40℃以600rpm摇动孵育20-24小时。[0215]20-24小时后,加入1000μl的具有0.1%乙酸的乙腈。将板密封,并在4℃以4000rpm离心10分钟。将猝灭的样品在50:50乙腈:水混合物中进一步稀释10-20x,然后进行hplc分析。hplc运行参数在表5-2中描述。[0216][0217]实施例7[0218]来源于seqidno:80的工程化多肽的演化与针对改进的kred活性的筛选[0219]使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0220]编码seqidno:80的具有kred活性的多肽的工程化多核苷酸(即,seqidno:79)用于生成表7-1的另外的工程化多肽。与起始多肽相比,这些多肽显示出从异-α-酸形成二氢-(ρ)-异-α-酸的改进。使用上文描述的定向演化方法与表5-2中所述的htp测定和分析方法一起,从seqidno:80的“骨架”氨基酸序列产生工程化多肽。[0221]定向演化始于seqidno:79中所列的多核苷酸。然后选择工程化多肽作为起始的“骨架”基因序列。工程化多肽的文库使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生并使用htp测定和分析方法进行筛选,该htp测定和分析方法测量多肽将异-α-酸底物转化为期望的二氢-(ρ)-异-α-酸产物的能力。[0222]酶测定以96孔形式在200μl总体积/孔中进行,其在100mmph8磷酸钾与2mmmgso4中的包括25%v/vhtp酶裂解物、60g/l或80g/l异-α-酸底物(异构化啤酒花提取物溶液,kalsec)以及40体积%异丙醇(ipa)中的0.02g/lnadp。将板密封并在45℃以600rpm摇动孵育20-24小时。[0223]20-24小时后,加入1000μl的具有0.1%乙酸的乙腈。将板密封,并在4℃以4000rpm离心10分钟。将猝灭的样品在50:50乙腈:水混合物中进一步稀释20-40x,然后进行hplc分析。hplc运行参数在表5-2中描述。[0224][0225][0226]实施例8[0227]来源于seqidno:80的工程化多肽的演化与针对改进的kred活性的筛选[0228]使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0229]编码具有seqidno:80的kred活性的多肽的工程化多核苷酸(即,seqidno:79)用于生成表8-1的另外的工程化多肽。与起始多肽相比,这些多肽显示出从异-α-酸形成二氢-(ρ)-异-α-酸的改进。使用上文描述的定向演化方法与表5-2中所述的htp测定和分析方法一起,从seqidno:80的“骨架”氨基酸序列产生工程化多肽。[0230]定向演化始于seqidno:79中所列的多核苷酸。然后选择工程化多肽作为起始的“骨架”基因序列。工程化多肽的文库使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生并使用htp测定和分析方法进行筛选,该htp测定和分析方法测量多肽将异-α-酸底物转化为期望的二氢-(ρ)-异-α-酸产物的能力。[0231]酶测定以96孔形式在200μl总体积/孔中进行,其包括在100mmph8磷酸钾与2mmmgso4中的10%-20%v/vhtp酶裂解物、80g/l或160g/l异-α-酸底物(异构化啤酒花提取物溶液,kalsec)以及40体积%异丙醇(ipa)中的0.02g/lnadp。将板密封并在45℃以600rpm摇动孵育20-24小时。[0232]20-24小时后,加入1000μl的具有0.1%乙酸的乙腈。将板密封,并在4℃以4000rpm离心10分钟。将猝灭的样品在50:50乙腈:水混合物中进一步稀释20-40x,然后进行hplc分析。hplc运行参数在表5-2中描述。[0233][0234]实施例9[0235]来源于seqidno:6和seqidno:80的工程化多肽的演化与针对改进的在高底物浓度的kred活性的筛选[0236]通过将200mg酶粉末溶于5ml的100mmph8三乙醇胺*h2so4与2mmmgso4中,制备40g/l酶储备溶液。取2ml等分试样,并进行连续两次1:1v/v稀释至各自20g/l和10g/l。在空气中用搅拌棒将500μl酶储备溶液(10g/l、20g/l或40g/l)加入小瓶中。向搅拌的酶储备溶液加入100μl的在缓冲液中的1g/lnadp和在400μl异丙醇(ipa)中的25g/l异-α-酸的等分试样。最终反应组成为40%的ipa中的5g/l、10g/l或20g/l酶、10g/l异-α-酸和0.1g/lnadp。将小瓶置于25℃或40℃的加热块中,并于1h、2h、4h、8h和24h后取样,并通过hplc-uv进行分析。比较seqidno:6和seqidno:80的典型反应谱示于图1。[0237]实施例10[0238]来源于seqidno:80、104、100、136、116、132、162、150、152、144和146的工程化多肽的演化与针对改进的在高底物和低nadp浓度的kred活性的筛选[0239]通过将100mg酶粉末溶于500μl的100mmph8磷酸钾缓冲液与2mmmgso4和0.1g/lnadp,制备200g/l酶储备溶液。向96深孔板的孔加入40μl酶/nadp储备溶液、80μl异丙醇和80μl的40wt%异-α-酸水溶液。最终反应组成为40%的ipa中的40g/l酶、160g/l异-α-酸和0.02g/lnadp。将板密封并在40℃孵育24小时,并且然后猝灭,并通过hplc-uv分析。数据在表11-1示出和在图2中描绘。[0240][0241]实施例11[0242]来源于seqidno:104的工程化多肽的演化与针对改进的kred活性的筛选[0243]如实施例8所述,使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0244]编码seqidno:104的具有kred活性的多肽的工程化多核苷酸(即seqidno:103)用于生成表11-1的另外的改进的工程化多肽。[0245][0246]实施例12[0247]包含重组kred基因的大肠杆菌表达宿主[0248]用于产生本发明的变体的初始kred酶从codexis收集的商购可得的kred酶小组获得。在初始筛选期间,seqidno:172的多肽或seqidno:270的多肽产生最多的产物,如通过lc/ms确定的。将kred编码基因克隆到seqidno:413或seqidno:414的表达载体,可操作地连接到在lacl阻遏物的控制下的lac启动子。表达载体还包含p15a复制起点和氯霉素抗性基因。使用本领域已知的标准方法将所得质粒转化到大肠杆菌w3110中。如本领域已知的,通过使细胞经受三氯生选择来分离转化体(参见例如,美国专利第8,383,346号和wo2010/144103)。[0249]实施例13[0250]htp含kred的湿细胞沉淀的制备[0251]将来自单克隆菌落的含有重组kred编码基因的大肠杆菌细胞接种到96孔浅孔微量滴定板的孔中的含有1%葡萄糖和0.12μg/ml三氯生的190μllb中。将板用o2可透过的密封件密封,并使培养物在20℃、200rpm和85%湿度生长过夜。然后,将20μl的每种细胞培养物转移到含有380μltb和30μg/mlcam的96孔深孔板的孔中。将深孔板用o2可透过的密封件密封,并且在30℃、250rpm和85%湿度孵育,直到达到0.6-0.8的od600。然后将细胞培养物用达到1mm的最终浓度的iptg诱导,并且在与最初使用的相同条件下孵育过夜。然后用在4℃、4000rpm持续10分钟的离心将细胞沉淀。弃去上清液,并且在裂解前将沉淀冷冻在-80℃。[0252]实施例14[0253]htp含kred的细胞裂解物的制备[0254]首先,通过加入150μl含有100mmph8磷酸钾与2mmmgso4或者100mmph8磷酸钾与2mmmgso4、1g/l溶菌酶和0.5g/lpmbs的裂解缓冲液裂解如实施例2所述产生的细胞沉淀。然后,在桌上型摇动器上在室温摇动细胞沉淀2小时。将板在4℃以4000rpm离心15分钟,以去除细胞碎片。然后将上清液用于生物催化反应以确定它们的活性水平。[0255]实施例15[0256]从摇瓶(sf)培养物制备冻干裂解物[0257]摇瓶程序可用于生成工程化kred多肽摇瓶粉末(sfp),其可用于二次筛选测定和/或用于本文所述的生物催化过程。与htp测定中使用的细胞裂解物相比,酶的摇瓶粉末(sfp)制品提供了更纯化的工程化酶的制品(例如,多达总蛋白的30%),并且还允许使用更浓缩的酶溶液。首先,将如上文描述地生长的选定htp培养物铺板在具有1%葡萄糖和0.12μg/ml三氯生的lb琼脂板上,并在37℃生长过夜。将来自每个培养物的单个菌落转移到6ml的具有1%葡萄糖和30μg/mlcam的lb中。使培养物在30℃在250rpm生长18h,并以约1:50传代培养至250ml含0.12μg/ml三氯生的tb中,至0.05的最终od600。使培养物在30℃在250rpm生长约3小时,达到0.8-1.0之间的od600,并用1mmiptg诱导。然后使培养物在30℃在250rpm生长20h。将培养物离心(4000rpm,在4℃持续20分钟)。弃去上清液,并将沉淀重悬在35ml的50mmph8磷酸钾与2mmmgso4中。将重悬的细胞离心(4000rpm,在4℃持续20分钟)。弃去上清液,并将沉淀重悬在6ml的50mmph8磷酸钾与2mmmgso4中,并使用来自constantsystems(oneshot)的细胞破坏仪裂解细胞。使裂解物沉淀(10,000rpm,在4℃持续60min)并且将上清液冷冻并冻干以产生摇瓶(sf)酶。[0258]实施例16[0259]来源于seqidno:172的工程化多肽的演化与针对改进的kred活性的筛选[0260]基于筛选变体还原异-α-酸底物的结果,选择seqidno:172的多肽作为亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0261]编码seqidno:172的具有kred活性的多肽的工程化多核苷酸用于产生表16-1的另外的工程化多肽。与起始多肽相比,这些多肽显示出从异-α-酸形成二氢-(ρ)-异-α-酸的改进。使用上文描述的定向演化方法与以下表16-1中描述的htp测定和分析方法一起,从seqidno:172的“骨架”氨基酸序列生成工程化多肽。[0262]定向演化始于seqidno:171中所列的多核苷酸。然后选择工程化多肽作为起始的“骨架”基因序列。工程化多肽的文库使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生并使用htp测定和分析方法进行筛选,该htp测定和分析方法测量多肽将异-α-酸底物转化为期望的二氢-(ρ)-异-α-酸产物的能力。[0263]酶测定以96深孔板形式在100μl总体积/孔中进行,其包括100mmph8磷酸钾与2mmmgso4中的20%v/vhtp酶裂解物、40%v/v的40wt%异-α-酸底物水溶液(异构化啤酒花提取物溶液,kalsec)以及40vol%异丙醇(ipa)中的0.02g/lnadp。将板密封并在45℃以600rpm摇动孵育20-24小时。[0264]20-24小时后,加入1000μl的具有0.1%乙酸的乙腈。将板密封,并在4℃以4000rpm离心10分钟。将猝灭的样品在50:50乙腈:水混合物中进一步稀释4-5x,然后进行hplc分析。hplc运行参数在表5-2中描述。[0265][0266]实施例17[0267]来源于seqidno:186的工程化多肽的演化与针对改进的对反式-iso的kred活性的筛选[0268]基于筛选变体还原异-α-酸底物的结果,选择seqidno:186作为亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0269]seqidno:185的编码具有kred活性的多肽的工程化多核苷酸用于生成表17-2的另外的工程化多肽。与起始多肽相比,这些多肽显示出从异-α-酸形成二氢-(ρ)-异-α-酸的改进。使用上文描述的定向演化方法与表5-2中所述的htp测定和分析方法一起,从seqidno:186的“骨架”氨基酸序列产生工程化多肽。[0270]定向演化始于seqidno:185中所列的多核苷酸。然后选择工程化多肽作为起始的“骨架”基因序列。工程化多肽文库使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生并使用htp测定和分析方法进行筛选,该htp测定和分析方法测量多肽将异-α-酸底物转化为期望的二氢-(ρ)-异-α-酸产物的能力。[0271]酶测定以96深孔板形式在100μl总体积/孔中进行,其包括100mmph8磷酸钾与2mmmgso4中的50%v/vhtp酶裂解物、10%v/v的10g/lseqidno:186、1g/l异-α-酸底物(异构化啤酒花提取物溶液,kalsec)以及40vol%异丙醇(ipa)中的0.01g/lnadp。将板密封并在30℃以600rpm摇动孵育44-48小时。[0272]20-24小时后,加入1000μl的具有0.1%乙酸的乙腈。将板密封,并在4℃以4000rpm离心10分钟。将猝灭的样品在50:50乙腈:水混合物中进一步稀释4-5x,然后进行hplc分析。hplc运行参数在下表17-1中描述。参见图3。对反式iso显示改进的活性的变体显示在表17-2中。[0273][0274][0275][0276]实施例18[0277]来源于seqidno:186的工程化多肽的演化与针对改进的kred活性的筛选[0278]如实施例16中所述,使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0279]编码seqidno:186的具有kred活性的多肽的工程化多核苷酸(即seqidno:185)用于生成表18-1的另外的改进的工程化多肽。[0280][0281]实施例19[0282]来源于seqidno:194、seqidno:252的工程化多肽的演化与针对改进的在高底物和低nadp浓度的kred活性的筛选[0283]通过将100mg酶粉末溶于500μl的100mmph8磷酸钾缓冲液与2mmmgso4和0.1g/lnadp,制备200g/l酶储备溶液。向96深孔板中的孔加入40μl的酶/nadp储备溶液的等分试样、80μl异丙醇和80μl的40wt%异-α-酸水溶液。最终反应组成为40%ipa中的40g/l酶、160g/l异-α-酸和0.02g/lnadp。将板密封并在40℃孵育24小时,并且然后猝灭,并通过hplc-uv分析。数据在表19-1、表19-2和表19-3中示出。[0284][0285][0286][0287][0288]实施例20[0289]来源于seqidno:270和seqidno:272的工程化多肽的演化与针对改进的在高底物和低nadp浓度的kred活性的筛选[0290]如实施例18中所述,使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0291]编码seqidno:270的具有kred活性的多肽的工程化多核苷酸(即seqidno:269)和编码seqidno:272的具有kred活性的多肽的工程化多核苷酸(即seqidno:271)用于生成表20-1和表20-2的另外的改进的工程化多肽。[0292][0293][0294]实施例21[0295]来源于seqidno:286的工程化多肽的演化与针对改进的在高底物和低nadp浓度的kred活性的筛选[0296]如实施例18中所述,使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0297]编码seqidno:286的具有kred活性的多肽的工程化多核苷酸(即seqidno:285)用于生成表21-1的另外的改进的工程化多肽。[0298][0299]实施例22[0300]来源于seqidno:328的工程化多肽的演化与针对改进的kred活性的筛选[0301]基于筛选变体还原异-α-酸底物的结果,选择seqidno:328作为亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0302]seqidno:327的编码具有kred活性的多肽的工程化多核苷酸用于生成表22-1的另外的工程化多肽。与起始多肽相比,这些多肽显示出从异-α-酸形成二氢-(ρ)-异-α-酸的改进。使用上文描述的定向演化方法与表5-2中所述的htp测定和分析方法一起,从seqidno:328的“骨架”氨基酸序列产生工程化多肽。[0303]定向演化始于seqidno:327中所列的多核苷酸。然后选择工程化多肽作为起始的“骨架”基因序列。工程化多肽的文库使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生并使用htp测定和分析方法进行筛选,该htp测定和分析方法测量多肽将异-α-酸底物转化为期望的二氢-(ρ)-异-α-酸产物的能力。[0304]酶测定以96孔圆底板在200μl总体积/孔中进行,其包括100mmph8磷酸钾与2mmmgso4中的20%v/vhtp酶裂解物、40%v/v的40wt%异-α-酸底物水溶液(异构化啤酒花提取物溶液,kalsec)以及40vol%异丙醇(ipa)中的0.02g/lnadp。将板密封并在45℃以600rpm摇动孵育20-24小时。[0305]20-24小时后,加入1000μl的具有0.1%乙酸的乙腈。将板密封,并在4℃以4000rpm离心10分钟。将猝灭的样品在50:50乙腈:水混合物中进一步稀释4-5x,然后进行hplc分析。hplc运行参数在表5-2和表17-1中描述。改进的变体在表22-1中显示。[0306][0307]实施例23[0308]seqidno:328和seqidno:330在高底物和低nadp载量的性能[0309]将8g的40wt%iso水溶液的样品溶解在8ml异丙醇(ipa)和2ml100mmph8磷酸钾缓冲液中。用4nnaoh和/或10%h3po4调节ph至8。用搅拌棒并在加热块中在40℃于氮气罩下将4.5ml的经调整ph的iso/ipa/缓冲溶液加入到隔板-加盖的小瓶(septum-cappedvials)中。向溶液加入具有10mmmgso4和0.2g/lnadp的100mmph8磷酸钾缓冲液中0.5ml的10g/l或40g/lkred(最终kred和nadp载量分别为1g/l或4g/lkred和0.02g/lnadp)。在各个时间间隔,通过注射器从反应中取出20μl等分试样,用1000μl的具有0.1%乙酸的1:1乙腈/水猝灭。在20℃以4,000rpm离心5分钟后,将20μl上清液用180μl的具有0.1%乙酸的1:1乙腈/水稀释,进行hplc分析(表5-2和表17-1)。见图4。[0310]实施例24[0311]来源于seqidno:330的工程化多肽的演化与针对改进的kred活性的筛选[0312]基于筛选变体还原异-α-酸底物的结果,选择seqidno:330作为亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述地以htp产生,并且可溶性裂解物如实施例3中描述地产生。[0313]seqidno:329的编码具有kred活性的多肽的工程化多核苷酸用于生成表24-1的另外的工程化多肽。与起始多肽相比,这些多肽显示出从异-α-酸形成二氢-(ρ)-异-α-酸的改进。使用上文描述的定向演化方法与以下表24-1所述的htp测定和分析方法一起,从seqidno:330的“骨架”氨基酸序列产生工程化多肽。[0314]定向演化始于seqidno:329中所列的多核苷酸。然后选择工程化多肽作为起始的“骨架”基因序列。工程化多肽的文库使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生并使用htp测定和分析方法进行筛选,该htp测定和分析方法测量多肽将异-α-酸底物转化为期望的二氢-(ρ)-异-α-酸产物的能力。[0315]酶测定以96圆底板形式在200μl总体积/孔中进行,其包括100mmph8磷酸钾与2mmmgso4中的50%v/vhtp酶裂解物、10%v/v的40wt%异-α-酸底物水溶液(异构化啤酒花提取物溶液,kalsec)以及40vol%异丙醇(ipa)中的0.02g/lnadp。将板密封并在45℃以600rpm摇动孵育20-24小时。[0316][0317]实施例25[0318]seqidno:270、seqidno:328、seqidno:330、seqidno:348、seqidno:346和seqidno:356在高底物和低nadp载量的性能[0319]将80mg的每种变体的样品溶解在1mlnadp储备溶液中,该储备溶液由100ml的100mmph9磷酸钾和10mmmgso4中的10mgnadp组成。将储备溶液进行5次连续1:1稀释,以得到nadp储备溶液中80g/l、40g/l、20g/l、10g/l和5g/l酶的储备溶液。在圆底板中,将储备溶液的20ul等分试样加入40ul的40wt%iso溶液和40ul的ipa中,以得到20mmph8磷酸钾和2mmmgso4与0.02g/lnadp中40vol%ipa中的160g/liso的最终组成。最终酶浓度分别为16g/l、8g/l、4g/l、2g/l和1g/l。将这些板密封并置于摇动器中在40℃和600rpm持续24小时。24小时后,将板在20℃以4,000rpm离心10分钟,并将100ul上清液转移到深孔板中1ml的具有0.1%乙酸的1:1乙腈/水中。将具有猝灭的反应混合物的深孔板在20℃在4,000rpm离心10分钟,并将5ul上清液转移到200ul的具有0.1%乙酸的1:1乙腈/水中,按照表5-2和表17-1进行hplc分析。见图5。[0320]出于所有目的,本技术中引用的所有出版物、专利、专利申请和其他文件在此通过引用以其整体并入,其程度如同每个单独的出版物、专利、专利申请或其他文件被单独地指出出于所有目的通过引用并入一样。[0321]虽然已经示出和描述了各种具体的实施方案,但是将理解,可以做出各种改变而不偏离本发明的精神和范围。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献