稀土元素(REE)结合蛋白的制作方法

2022-03-02 03:17:46 来源：中国专利 TAG：

稀土元素(ree)结合蛋白
1.相关申请的交叉引用
2.本技术要求于2019年6月21日提交的标题为“稀土元素(ree)结合蛋白”的美国临时申请号62/865,090(其的整体公开内容特此通过引用被并入)的在35u.s.c
§
119(e)下的权益。
3.对经由efs-web作为文本文件提交的序列表的引用
4.本技术含有已经经由efs-web以ascii格式提交并且特此通过引用整体并入的序列表。创建于2020年6月19日的所述ascii副本名称为g091970032wo00-seq-omj.txt，并且大小为1.40兆字节。
发明领域
5.本公开涉及回收稀土元素(包含镧系元素)的方法。
6.背景
7.稀土元素(ree)是17种金属(包含镧系元素、钇(y)和钪(sc))的组。镧系化学元素包括原子序数57至71的元素(例如，镧(la)、铈(ce)、镨(pr)、钕(nd)、钷(pm)、钐(sm)、铕(eu))、钆(gd)、铽(tb)、镝(dy)、钬(ho)、铒(er)、铥(tm)、镱(yb)和镥(lu))。作为许多制成品(包含电子装置)的关键组成部分，稀土元素是备受追捧的原始材料。尽管除了放射性钷外，许多ree在地壳中相对丰富，但ree通常是分散的，并且不集中在稀土矿物中。因此，ree的经济提取一直困难。
8.概述
9.本公开至少部分地基于新型稀土元素(ree)结合蛋白的鉴别。
10.本公开的方面涉及从样品中回收稀土元素(ree)的方法。在一些实施方案中，从样品中回收ree的操作包括向样品中引入ree结合蛋白。在一些实施方案中，ree结合蛋白包括ef手型域(ef-hand domain)。在一些实施方案中，然后从样品中回收ree。在一些实施方案中，方法还包括纯化来自样品的ree。
11.本公开的另外的方面涉及宿主细胞，宿主细胞包括表达稀土元素结合蛋白的异源基因。在一些实施方案中，宿主细胞中的稀土元素结合蛋白包括ef手型域。在一些实施方案中，ree结合蛋白不包括seq id no:1。
12.本公开的另外的方面涉及试剂盒，试剂盒包括本技术中公开的宿主细胞中的任何一种和用于提取稀土元素的说明书。在一些实施方案中，ree结合蛋白包括ef手型域。
13.在一些实施方案中，ef手型域包括序列：x1x2x3x4x5x6x7x8x9x
10
x
11
x
12
(seq id no:1275)。在一些实施方案中，x表示任何氨基酸。在一些实施方案中，x1是d或k。在一些实施方案中，x2是a、d、e、f、g、h、i、k、l、p、q、r、s、t、v或y。在一些实施方案中，x3是d、e、n、q、s或t。在一些实施方案中，x4是a、d、e、g、h、k、l、n、q、r、s或t。在一些实施方案中，x5是d、n、s或t。在一些实施方案中，x6是a、e、g、k、n、q、r或s。在一些实施方案中，x7是a、d、e、f、g、h、i、k、l、m、n、q、r、s、t、v或y。在一些实施方案中，x8是a、f、i、l、m或v。在一些实施方案中，x9是a、d、e、g、l、n、q、s、t或v。在一些实施方案中，x
10
是a、d、e、f、g、h、i、k、l、m，n、p、q、r、s、t、v或y。在一些实
施方案中，x
11
是a、d、e、f、g、i、k、l、m、n、q、r、s、t、v或y。在一些实施方案中，x
12
是a、d、e、g、i、k、l、q、r、s、t或v。在一些实施方案中，ef手型域附加地包括x
13
。在一些实施方案中，x
13
是a、e、f、g、h、i、l、m、q、r、s、t、v、w或y。
14.在一些实施方案中，ef手型域包括序列：dx1x2x3x4x5x6x7x8x9x
10
x
11
(seq id no:1276)。在一些实施方案中，x1是a、d、f、g、i、k、l、p、q、r、s、t、v或y。在一些实施方案中，x2是d、n、q或s。在一些实施方案中，x3是a、d、g、h、k、n、q、r或s。在一些实施方案中，x4是d、n或s。在一些实施方案中，x5是a、e、g、k、n、q或r。在一些实施方案中，x6是a、d、e、f、h、i、k、l、m、n、q、r、s、t、v或y。在一些实施方案中，x7是a、f、i、l或v。在一些实施方案中，x8是d、e、g、n、s、t或v。在一些实施方案中，x9是a、d、e、f、g、h、i、k、l、m、n、p、q、r、s、t、v或y。在一些实施方案中，x
10
是a、d、e、f、g、i、k、l、n、q、r、s、t、v或y。在一些实施方案中，x
11
是a、d、e、g、l、q、r、s、t或v。在一些实施方案中，ef手型域附加地包括x
12
。在一些实施方案中，x
12
是a、e、f、g、h、i、l、m、q、r、s、v、w或y。
15.在一些实施方案中，ef手型域包括序列：dx1x2x3x4x5x6x7x8x9x
10
x
11
(seq id no:1277)。在一些实施方案中，x1是a、d、f、g、i、k、l、q、r、s、t、v或y。在一些实施方案中，x2是d、n、q或s。在一些实施方案中，x3是a、d、g、h、k、n、q、r或s。在一些实施方案中，x4是d、n或s。在一些实施方案中，x5是a、e、g、k、n、q或r。在一些实施方案中，x6是a、d、e、f、h、i、k、l、m、n、q、r、s、t、v或y。在一些实施方案中，x7是a、f、i、l或v。在一些实施方案中，x8是d、e、g、n、s、t或v。在一些实施方案中，x9是a、d、e、f、g、h、i、k、l、m、n、p、q、r、s、t、v或y。在一些实施方案中，x
10
是a、d、e、f、g、i、k、l、n、q、r、s、t、v或y。在一些实施方案中，x
11
是a、d、e、g、l、q、r、s、t或v。在一些实施方案中，ef手型域附加地包括x
12
。在一些实施方案中，x
12
是a、e、f、g、h、i、l、m、q、r、s、v、w或y。
16.在一些实施方案中，相对于表2中与seq id no:300-977对应的ef手型域序列，ef手型域包括不超过两个氨基酸置换。在一些实施方案中，ef手型域包括选自表2中的与seq id no:300-977对应的ef手型域序列的序列。在一些实施方案中，ef手型域包括选自seq id no:304-715的序列。在一些实施方案中，ef手型域包括选自seq id no:304-473的序列。
17.在一些实施方案中，ree结合蛋白包括至少两个ef手型域序列。在一些实施方案中，ree结合蛋白包括至少三个ef手型域序列。在一些实施方案中，ree结合蛋白包括至少四个ef手型域序列。在一些实施方案中，至少两个ef手型域序列不同。
18.在一些实施方案中，ree结合蛋白是镧系元素结合蛋白。在一些实施方案中，ree结合蛋白是钇结合蛋白。在一些实施方案中，ree结合蛋白是钪结合蛋白。在一些实施方案中，ree结合蛋白是镧系元素结合蛋白和钇结合蛋白。在一些实施方案中，ree结合蛋白是镧系元素结合蛋白和钪结合蛋白。在一些实施方案中，ree结合蛋白是钇结合蛋白和钪结合蛋白。在一些实施方案中，ree结合蛋白是镧系元素结合蛋白、钇结合蛋白和钪结合蛋白。
19.在一些实施方案中，相对于对照蛋白，ree结合蛋白具有高至少10％、20％、30％、40％、50％、60％、70％、80％、90％或100％的镧系元素结合亲和力。在一些实施方案中，对照蛋白包括seq id no:2。在一些实施方案中，对照蛋白包括seq id no:3。在一些实施方案中，使用渗析测定确定结合亲和力。在一些实施方案中，镧系元素选自由铈(ce)、镝(dy)、铒(er)、铕(eu)、钆(gd)、钬(ho)、镧(la)、镥(lu)、钕(nd)、镨(pr)、钷(pm)、钐(sm)、铽(tb)、铥(tm)、镱(yb)、以及其组合组成的组。
20.在一些实施方案中，相对于对照蛋白，ree结合蛋白具有低至少10％、20％、30％、40％、50％、60％、70％、80％、90％或100％的铁结合亲和力。在一些实施方案中，对照蛋白是trfe_human2(seq id no:298)。在一些实施方案中，对照蛋白是trfe_bovin2(seq id no:299)。在一些实施方案中，使用渗析测定确定结合亲和力。
21.在一些实施方案中，ree结合蛋白在宿主细胞中作为异源基因表达。在一些实施方案中，从宿主细胞分泌ree结合蛋白。在一些实施方案中，ree结合蛋白包括与seq id no:4-71中的任何一个至少90％一致的序列。在一些实施方案中，ree结合蛋白包括seq id no:4-71中的任何一个。在一些实施方案中，ree结合蛋白包括与seq id no:4-71中任何一个的在序列内的ef手型域范围之外的部分至少90％的一致性，并且相对于序列内的一个或多个ef手型域包括不超过两个氨基酸置换。
22.本发明的限制中的每个可以涵盖本发明的各种实施方案。因此，预期涉及任何一个要素或要素的组合的本发明的限制中的每个都可以包含在本发明的每个方面中。本发明的应用不限于在以下描述中所示或者在附图中所图示说明的构造细节和组分的布置。本发明能够具有其他实施方案并且能够以各种方式被实践或进行。此外，本公开中使用的措辞和术语是出于描述的目的，而不应当被视为限制。本公开中“包含”、“包括”、或“具有”、“含有”、“涉及”及其变体的使用意在涵盖其后列出的项目及其等同物以及附加项目。
23.附图的简要说明
24.附图并非旨在按比例绘制。附图仅是说明性的，而无需实现本公开。为了清楚起见，并非在每个附图中都标记每个组分。在附图中：
25.图1示出来自四个不同样品(样品1、样品2(尾矿)、样品3和样品4)的推定镧系元素结合蛋白中的ef手型域的总数。对于从左至右的每个数字，源对应于样品1、样品2(尾矿)、样品3和样品4。样品2(尾矿)指具有高水平的镝和其他镧系元素的样品。
26.图2是示出候选镧系元素结合蛋白的金属结合亲和力表征的概述的示意图。用编码包括一个或更多个ef手型域的候选镧系元素结合蛋白的质粒转化细胞。在初级筛选中使用基于二甲酚橙(xo)的铽竞争测定并且在二级筛选中使用渗析和色谱测定来表达、纯化和分析候选蛋白质。还表征与铁相比对铽的最高命中的结合选择性。
27.图3包含描绘用于鉴别镧系元素结合蛋白(lbp)的初级筛选的示意图。左侧示出xo竞争测定的图示说明。右侧提供示出在初级筛选中测量的蛋白质分解的饼状图。
28.图4包含两个图片，所述两个图片示出使用图3中描绘的初级筛选鉴别结合镧系元素金属铽的蛋白质。顶部图片描绘了来自全部候选镧系元素结合蛋白(其被称为“菌株”)的xo竞争测定的数据。底部图片描绘了初级筛选发现的代表性命中。在底部图片中，批次1中的菌株包含：t201150、t201097、t200855、t201015、t200947、t200901、t200881、t201161、t201209、t200928、t200955、t200879、t200862、t200769、t200987、t200701、t201213、t200733和t200949；批次2中的菌株包含：t201777、t201380、t201734、t201629、t201856、t201782、t201817、t201697、t201609、t201647、t201742、t201599、t201897、t201314、t201750、t201859、t201631、t201795和t201779；批次3中的菌株包含：t201331、t201245、t201369、t201380、t201726、t201734、t201463、t201856、t201277、t201539、t201413、t201595、t201587、t201406、t201425、t201285、t201547、t201424、t201217和t201253；并且批次4中的菌株包含：t200581、t200773、t200818、t200603、t200741、t200574、t200830、
t200594、t200701、t200586、t200753、t200666、t200795、t200784、t200791、t200770、t200832、t200729和t200628。
29.图5包含示出候选镧系元素结合蛋白的铽结合亲和力的数据。左侧图片示出来自全部蛋白质(294种候选镧系元素结合蛋白加上三种阳性对照)的渗析-板测定的结果。右侧图片示出依据蛋白质样品浓度(仅考虑蛋白质浓度大于或等于20μm的菌株(蛋白质))标准化的荧光信号。阳性对照由三个箭头表示。两个低亲和力铽结合剂对照是经设计的镧系元素结合蛋白，并且单个高亲和力对照菌株是来自利用镧系元素的细菌的镧系元素结合蛋白lanm。
30.图6包含示出镧系元素结合蛋白对镝和铁的亲和力的图片。示出在与2μm镝(左侧)或2μm铁(右侧)孵育过夜之后来自铽实验的23种最佳结合剂蛋白的渗析-板测定结果。左侧图片示出通过在320nm处激发后测量572nm处的发射、通过delfia荧光测定定量的结合镝的量。将强度信号标准化为蛋白质浓度，并且按照对镝的最低(图表的左侧)至最高(图表的右侧)亲和力的顺序排列菌株。阳性对照(箭头)与铽实验中相同。右侧图片示出通过测量560nm处的吸光度(abs560)、通过fe-菲洛嗪络合定量的铁结合。根据蛋白质浓度标准化的铁结合能力排列蛋白质。在这些测定中，高铁结合亲和力牛和人转铁蛋白(最右侧，双箭头)用作阳性对照。
31.详细说明
32.稀土元素(ree)具有多种用途，并且对于催化剂、合金、高性能磁体、玻璃和电子产品的生产是关键性的。尽管地壳中富集稀土元素，然而可开采的矿床却稀少。本公开部分地以多种ree结合蛋白的鉴别为前提。本公开中描述的ree结合蛋白可以用于从样品中回收ree(包含从加工废物和从电子废物中回收ree)。因此，本公开提供最新鉴别的ree结合蛋白、包括ree结合蛋白的宿主细胞、以及使用ree结合蛋白回收ree的方法。
33.ree包括金属的组，金属的组包含镧系元素、钇(y)和钪(sc)。镧系元素(lanthanides)(或镧系元素(lanthanoids))是原子序数57至71的元素(例如，分别为镧(la)、铈(ce)、镨(pr)、钕(nd)、钷(pm)、钐(sm)、铕(eu)、钆(gd)、铽(tb)、镝(dy)、钬(ho)、铒(er)、铥(tm)、镱(yb)和镥(lu))。镧系元素的金属半径如下：la：162pm；ce：181.8pm；pr：182.4pm；nd：181.4pm；pm：183.4pm；sm：180.4pm；eu：208.4pm；gd：180.4pm；tb：177.3pm；dy：178.1pm；ho：176.2pm；er：176.1pm；tm：175.9pm；yb：193.3pm；以及lu：173.8pm。钇是具有原子序数39和180pm的原子半径的金属。钪是具有原子序数21和162pm的原子半径的金属。稀土元素的离子半径如下：la：ce：pr：nd：pm：sm：sm：eu：gd：tb：dy：ho：er：tm：yb：lu：sc：以及y：每种稀土元素的晶体半径值也是已知的。参见，例如，shannon,acta cryst.(1976).a32,751-767。
34.稀土元素(ree)结合蛋白
35.本公开的方面提供稀土元素(ree)结合蛋白，稀土元素(ree)结合蛋白可以例如在从样品中回收ree中是有用的。在一些实施方案中，本公开的ree结合蛋白包括ef手型域。ef手型域是涉及与金属结合的基序，并且常见于钙结合蛋白中。cotruvo et al.(2018)j.am.chem.soc.140(44):15056-15061(通过引用整体并入本技术中)中进一步描述了ef手型域。不希望受任何理论束缚，ef手型域相对致密，从而表明蛋白质与镧系元素的比率将高
no:1277)的至少十二个氨基酸的连续序列，其中x表示任何氨基酸，x1是a、d、f、g、i、k、l、q、r、s、t、v或y；x2是d、n、q或s；x3是a、d、g、h、k、n、q、r或s；x4是d、n或s；x5是a、e、g、k、n、q或r；x6是a、d、e、f、h、i、k、l、m、n、q、r、s、t、v或y；x7是a、f、i、l或v；x8是d、e、g、n、s、t或v；x9是a、d、e、f、g、h、i、k、l、m、n、p、q、r、s、t、v或y；x
10
是a、d、e、f、g、i、k、l、n、q、r、s、t、v或y；x
11
是a、d、e、g、l、q、r、s、t或v；并且x
12
是a、e、f、g、h、i、l、m、q、r、s、v、w或y。
43.在一些情况下，ef手型域包括至少12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、或至少30个氨基酸的连续段。
44.在一些情况下，ef手型域包括螺旋-环-螺旋结构。在一些情况下，螺旋-环-螺旋结构中的环包括本公开中描述的ef手型域序列中的任何一种。在一些实施方案中，螺旋-环-螺旋结构中的环结合一种或更多种金属离子。在一些实施方案中，ef手型域具有与结合ca
2
的ef手型域的三级结构类似的三级结构。
45.ef手型域可以包括与表2中的ef手型域序列(例如，选自seq id no:300-977、seq id no:300-715、seq id no:304-473或seq id no:304-715的序列)至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少71％、至少72％、至少73％、至少74％、至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％一致的序列。
46.ree结合蛋白可以包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、或至少50个ef手型域。
47.在一些情况下，在包括超过1个ef手型域的ree结合蛋白中，ree结合蛋白中的至少至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、或至少50个ef手型域不同。
48.在一些情况下，在包括超过1个ef手型域的ree结合蛋白中，ree结合蛋白中的至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、或至少50个ef手型域相同。
49.ree结合蛋白可以包括与表2中的序列(例如，核酸序列或氨基酸序列)或者与选自seq id no:1-297、seq id no:1-179、seq id no:4-71、seq id no:4-179、seq id no:978-1274、seq id no:981-1274、seq id no:981-1156或seq id no:981-1048的序列至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少71％、至少72％、至少73％、至少74％、至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或
100％(包含之间的全部值)一致的序列。
50.ree结合蛋白可以能够结合一种或更多种ree。例如，ree可以能够结合镧(la)、铈(ce)、镨(pr)、钕(nd)、钷(pm)、钐(sm)、铕(eu)、钆(gd)、铽(tb)、镝(dy)、钬(ho)、铒(er)、铥(tm)、镱(yb)、镥(lu)、钇(y)、钪(sc)或其组合。在一些情况下，ree结合蛋白是镧(la)结合蛋白、铈(ce)结合蛋白、镨(pr)结合蛋白、钕(nd)结合蛋白、钷(pm)结合蛋白、钐(sm)结合蛋白、铕(eu)结合蛋白、钆(gd)结合蛋白、铽(tb)结合蛋白、镝(dy)结合蛋白、钬(ho)结合蛋白、铒(er)结合蛋白、铥(tm)结合蛋白、镱(yb)结合蛋白、镥(lu)结合蛋白、钇(y)结合蛋白、钪(sc)结合蛋白或其组合。在一些情况下，ree结合蛋白是镧系元素结合蛋白。
51.不受特定理论的束缚，金属离子价态和金属离子的尺寸可以影响ef手型金属结合亲和力。例如，钪离子和钇离子在溶液中通常是三价阳离子(就像镧系元素铽和镝一样)。钇的离子半径(104pm)与铽的离子半径(106pm)和镝的离子半径(105pm)类似，而钪稍微较小(89pm)。不受特定理论的束缚，考虑到离子半径，以高亲和力结合镧系元素的蛋白质将可能对钇具有高亲和力并且还可以结合钪。
52.ree结合蛋白可以能够结合至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、或至少50个ree离子。在一些情况下，ree结合蛋白能够结合至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、或至少50个相同类型的ree离子。在一些情况下，ree结合蛋白能够结合至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、或至少50个不同类型的ree离子。
53.应当理解的是，可以通过本领域普通技术人员已知的任何手段测量ree结合蛋白的结合亲和力。在一些实施方案中，可以使用金属竞争测定测量ree结合蛋白的结合亲和力。测量ree结合蛋白对特定金属的亲和力的测定的非限制性实例包含二甲酚橙(xo)竞争测定、渗析测定、吸收光谱、荧光光谱、x射线光谱、毛细管电泳、圆二色性和等温滴定量热法。例如，基于ree结合渗析的测定可以用于测量特定ree结合蛋白的ree结合亲和力。在一些实施方案中，ree是镧系元素。在一些实施方案中，ree是镝或铽。在一些情况下，ree结合蛋白对特定金属的亲和力被标准化为所使用的蛋白质的浓度。可以使用本领域已知的任何方法(包含菲洛嗪显色测定)测量ree结合蛋白的铁结合亲和力。也参见，例如，farrell et al.,protoplasma 1990,159,157-167；rasmussen et al.,inorg.biochem.2003,95,113-123；hebenstreit and ferreira,allergy 2005,60,1208-1211；saboury et al.,therm.anal.calorim.2006,83,175-179；以及下文用于测量金属离子对蛋白质的亲和力的方法的实例。
54.在一些情况下，金属离子m对蛋白质配体p的亲和力被定义为解离常数kd＝[m][p]/[mp]。在一些情况下，kd小于1
×
10-5
m、小于5
×
10-6
m、小于1
×
10-6
m、小于5
×
10-7
m、小于1
×
10-7
m、小于5
×
10-8
m、小于1
×
10-8
m、小于5
×
10-9
m、小于1
×
10-9
m、小于5
×
10-10
m、小于1
×
10-10
m、小于5
×
10-11
m、小于1
×
10-11
m、小于5
×
10-12
m、小于1
×
10-12
m、小于5
×
10-13
m、小于1
×
10-13
m、小于1
×
10-14
m、小于5
×
10-14
m、小于5
×
10-15
m、小于1
×
10-15
m、小于5
×
10-16
m、小于1
×
10-16
m、小于5
×
10-17
m、小于1
×
10-17
m、小于5
×
10-18
m、小于1
×
10-18
m、小于5
×
10-19
m、小于1
×
10-19
m、小于5
×
10-20
m、或小于1
×
10-20
m(包含之间的任何值)。
[0055]
也可以比较ree结合蛋白对不同金属的亲和力。ree结合蛋白对ree的亲和力可以比ree结合蛋白对另一种金属(例如，不同的ree、铁或钙)的亲和力大至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍、至少100倍、至少200倍、至少300倍、至少400倍、至少500倍、至少600倍、至少700倍、至少800倍、至少900倍、或至少1000倍(包含之间的任何值)。
[0056]
也可以将ree结合蛋白对特定金属的亲和力与对照蛋白对相同金属的亲和力进行比较。对照蛋白的非限制性实例可以包含例如seq id no:1、seq id no:2、seq id no:3、seq id no:298和seq id no:299中的一种或更多种。例如，ree结合蛋白对金属的亲和力可以比对照蛋白对相同金属的亲和力大至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍、至少100倍、至少200倍、至少300倍、至少400倍、至少500倍、至少600倍、至少700倍、至少800倍、至少900倍、或至少1000倍。
[0057]
变体
[0058]
本公开也包含本公开中描述的序列(例如，ef手型域和/或ree结合蛋白)的变体。变体可以与参考序列共有至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少71％、至少72％、至少73％、至少74％、至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％(包含之间的全部值)的核酸序列一致性和/或氨基酸序列一致性。
[0059]
在一些实施方案中，变体包含蛋白质，其中蛋白质内的一个或多个ef手型域是100％保守的，但蛋白质的其他部分可能不太保守。例如，在一些实施方案中，变体可以与参考序列的不包括一个或多个ef手型域的部分共有至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少71％、至少72％、至少73％、至少74％、至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％(包含之间的全部值)的核酸序列一致性和/或氨基酸序列一致性，同时与参考序列的一个或多个ef手型域共有100％序列一致性。
[0060]
除非另外指出，否则本领域已知的术语“序列一致性”指通过序列比较(比对)确定的两个多肽或多核苷酸的序列之间的关系。在一些实施方案中，在序列(例如，ef手型域和/或ree结合蛋白)的整个长度上确定序列一致性。在一些实施方案中，在序列(例如，ef手型
applicable to the search for similarities in the amino acid sequences of two proteins.”j.mol.biol.48:443-453)使用默认参数确定序列一致性时，发现序列(包含核酸序列或氨基酸序列)(如本技术中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
[0068]
在一些实施方案中，当使用快速最优全局序列比对算法(fogsaa)使用默认参数确定序列一致性时，发现序列(包含核酸序列或氨基酸序列)(如本技术中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
[0069]
在一些实施方案中，当使用clustal omega(sievers et al.,mol syst biol.2011oct 11；7:539)使用默认参数确定序列一致性时，发现序列(包含核酸序列或氨基酸序列)(如本技术中公开的和/或权利要求中限定的序列)与参考序列具有特定的百分比一致性。
[0070]
如本公开中所使用的，并且如本领域普通技术人员将理解的，当使用本领域已知的氨基酸序列比对工具(如，例如，clustal omega或)比对序列x和序列y且当序列“x”中的残基在序列“y”中的“z”的对应位置处时，序列“x”中的残基(如核酸残基或氨基酸残基)被称为对应于不同序列“y”中的位置或残基(如核酸残基或氨基酸残基)“z”。
[0071]
如本公开中所使用的，变体序列可以是同源序列。如本公开中所使用的，同源序列指共有一定百分比一致性(例如，至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少71％、至少72％、至少73％、至少74％、至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％(包含之间的全部值)百分比一致性)的序列(例如，核酸序列或氨基酸序列)。同源序列包含但不限于旁系同源序列或直系同源序列。旁系同源序列由物种的基因组内的基因的复制产生，而直系同源序列在物种形成事件之后趋异。
[0072]
在一些实施方案中，肽变体或多肽变体(例如，ef手型域或ree结合蛋白变体)包括与参考肽或参考多肽(例如，参考ef手型域或参考ree结合蛋白)共有二级结构(例如，α螺旋、β片层)的域。在一些实施方案中，肽变体或多肽变体(例如，ef手型域或ree结合蛋白变体)与参考肽或参考多肽(例如，参考ef手型域或参考ree结合蛋白)共有三级结构。作为非限制性实例，变体肽或变体多肽(例如，ef手型域或ree结合蛋白)与参考多肽相比可以具有低的一级序列一致性(例如，小于80％、小于75％、小于70％、小于65％、小于60％、小于55％、小于50％、小于45％、小于40％、小于35％、小于30％、小于25％、小于20％、小于15％、小于10％、或小于5％的序列一致性)，但共有一个或更多个二级结构(例如，包含但不限于环、α螺旋或β片层)，或者具有与参考ef手型域或ree结合蛋白相同的三级结构。例如，环可以位于两个α螺旋之间、或两个β片层之间。同源建模可以用于比较两个或更多个三级结构。
[0073]
任何适合的方法(包含环状变换(yu and lutz,trends biotechnol.2011jan；29(1):18-25))都可以用于产生这样的变体。在环状变换中，可以环化多肽的线性一级序列(例如，通过连接序列的n末端和c末端)，并且可以在不同位置处切断(“断裂”)多肽。因此，如由线性序列比对方法(例如，clustal omega或blast)所确定的，新多肽的线性一级序列
可以具有低的序列一致性(例如，小于80％、小于75％、小于70％、小于65％、小于60％、小于55％、小于50％、小于45％、小于40％、小于35％、小于30％、小于25％、小于20％、小于15％、小于10％、小或小于5％(包含之间的全部值))。然而，两种蛋白质的拓扑分析可以揭示两种多肽的三级结构类似。不受特定理论的束缚，通过参考多肽的环状变换创建并且具有与参考多肽的三级结构类似的三级结构的变体多肽可以共有类似的功能特性(例如，酶活性、酶动力学、底物特异性或产物特异性)。在一些情况下，环状变换可以改变二级结构、三级结构或四级结构，并且产生具有不同功能特性(例如，增加或减少的酶活性、不同的底物特异性、或不同的产物特异性)的酶。参见，例如，yu and lutz,trends biotechnol.2011jan；29(1):18-25。
[0074]
应当理解的是，在已经经历环状变换的蛋白质中，蛋白质的线性氨基酸序列将不同于尚未经历环状变换的参考蛋白质。然而，本领域普通技术人员将能够通过例如比对序列和检测保守基序、和/或通过比较蛋白质的结构或预测结构(例如，通过同源建模)容易地确定已经经历环状变换的蛋白质中的哪些残基对应于尚未经历环状变换的参考蛋白质中的残基。本技术中描述的变体包含本技术中描述的序列的经环状变换的变体。
[0075]
在一些实施方案中，本技术中描述的确定感兴趣的序列与参考序列之间的百分比一致性的算法说明了序列之间的环状变换的存在。可以使用本领域已知的任何方法(包含，例如，raspodom(weiner et al.,bioinformatics.2005apr 1；21(7):932-7))检测环状变换的存在。在一些实施方案中，在计算感兴趣的序列与本技术中描述的序列之间的百分比一致性之前，对环状变换的存在进行校正(例如，重排至少一个序列中的域)。应当理解本技术的权利要求包含在考虑序列的潜在环状变换后计算与参考序列的百分比一致性的序列。
[0076]
本公开也包含本公开中描述的重组ree结合蛋白的功能变体。例如，功能变体可以结合相同底物中的一种或更多种或者产生相同产物中的一种或更多种。可以使用本领域已知的任何方法鉴别功能变体。例如，上文描述的karlin and altschul proc.natl.acad.sci.usa 87:2264-68,1990的算法可以用于鉴别具有已知功能的同源蛋白质。
[0077]
也可以通过搜索具有功能注释域的多肽鉴别推定的功能变体。数据库(包含pfam(sonnhammer et al.,proteins.1997jul；28(3):405-20))可以用于鉴别具有特定域的多肽。
[0078]
同源建模也可以用于鉴别适合突变而不影响功能的氨基酸残基。这样的方法的非限制性实例可以包含位置特异性评分矩阵(position-specific scoring matrix)(pssm)和能量最小化协议的使用。
[0079]
位置特异性评分矩阵(pssm)使用位置权重矩阵来鉴别共有序列(例如，基序)。可以在核酸序列或氨基酸序列上进行pssm。比对序列，并且方法考虑在特定位置处观察到的特定残基(例如，氨基酸或核苷酸)的频率和所分析的序列的数量。参见，例如，stormo et al.,nucleic acids res.1982may 11；10(9):2997-3011。可以计算在给定位置处观察到特定残基的可能性。不受特定理论的束缚，具有高变异性的序列中的位置可以适合突变(例如，pssm评分≥0)以产生功能同系物。
[0080]
pssm可以与rosetta能量函数的计算配对，rosetta能量函数确定野生型与单点突变体之间的差异。rosetta能量函数将该差异计算为(δδg
calc
)。利用rosetta函数，突变的
残基与周围原子之间的键合相互作用被用于确定突变是增加还是减小蛋白质稳定性。例如，然后可以使用rosetta能量函数分析由pssm评分(例如，pssm评分≥0)指定为有利的突变，以确定突变对蛋白质稳定性的潜在影响。不受特定理论的束缚，潜在稳定化的突变对于蛋白质工程(例如，功能同系物的产生)是期望的。在一些实施方案中，潜在稳定化的突变具有小于-0.1(例如，小于-0.2、小于-0.3、小于-0.35、小于-0.4、小于-0.45、小于-0.5、小于-0.55、小于-0.6、小于-0.65、小于-0.7、小于-0.75、小于-0.8、小于-0.85、小于-0.9、小于-0.95、或小于-1.0)rosetta能量单位(r.e.u.)的δδg
calc
值。参见，例如，goldenzweig et al.,mol cell.2016jul 21；63(2):337-346.doi:10.1016/j.molcel.2016.06.012。
[0081]
在一些实施方案中，ree结合蛋白编码序列包括在与参考(例如，ree结合蛋白)编码序列对应的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或超过100个位置处的突变。在一些实施方案中，ree结合蛋白编码序列包括在与参考(例如，ree结合蛋白)编码序列对应的不超过1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、或100个位置处的突变。在一些实施方案中，相对于参考(例如，ree结合蛋白)编码序列，ree结合蛋白编码序列在编码序列的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99、100个或更多个密码子中包括突变。
[0082]
在一些实施例中，ef手型域序列包括在与参考ef手型域编码序列对应的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个位置处的突变。在一些实施方案中，ef手型域序列包括在与参考ef手型域编码序列对应的不超过1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个位置处的突变。在一些实施方案中，相对于参考ef手型域编码序列，ef手型域编码序列在编码序列的1个、2个、3个、4
个、5个、6个、7个、8个、9个或10个密码子中包括突变。在一些实施方案中，参考ef手型域编码序列选自表2中的ef手型域序列(例如，seq id no:300-977)。
[0083]
如本领域普通技术人员将理解的，由于遗传码的简并性，密码子内的突变可以改变由密码子编码的氨基酸或者可以不改变由密码子编码的氨基酸。在一些实施方案中，相对于参考多肽(例如，参考ef手型域或参考ree结合蛋白)的氨基酸序列，编码序列中的一个或更多个突变不改变编码序列(例如，ef手型域或ree结合蛋白)的氨基酸序列。
[0084]
在一些实施方案中，相对于参考多肽(例如，ef手型域或ree结合蛋白)的氨基酸序列，重组ef手型域或ree结合蛋白序列中的一个或更多个突变改变肽或多肽的氨基酸序列。在一些实施方案中，相对于参考ree结合蛋白或参考ef手型域的氨基酸序列，一个或更多个突变改变重组ree结合蛋白或ef手型域的氨基酸序列，并且相对于参考ree结合蛋白或参考ef手型域改变(增强或降低)ree结合蛋白或ef手型域的活性。
[0085]
可以使用本领域普通技术人员已知的方法测量本公开中描述的重组ree结合蛋白或ef手型域中任何一种的活性(例如，比活性)。作为非限制性实例，可以通过测量重组ree结合蛋白或ef手型域的底物特异性和/或结合一个或更多个ree的能力来确定重组ree结合蛋白或ef手型域的活性。
[0086]
本领域技术人员还将认识到，重组肽或重组多肽(例如，ef手型域或ree结合蛋白)编码序列中的突变可以造成保守氨基酸置换，以提供这样的肽或多肽的功能等效变体(即，保留相同或类似活性的变体)。如本公开中所使用的，“保守氨基酸置换”指不改变进行氨基酸置换的蛋白质的相对电荷特性或尺寸特性或功能活性的氨基酸置换。
[0087]
在一些情况下，氨基酸的特征在于其r基团(参见，例如，表1)。例如，氨基酸可以包括非极性脂族r基团、带正电荷的r基团、带负电荷的r基团、非极性芳族r基团、或极性不带电荷的r基团。包括非极性脂族r基团的氨基酸的非限制性实例包含丙氨酸、甘氨酸、缬氨酸、亮氨酸、甲硫氨酸和异亮氨酸。包括带正电荷的r基团的氨基酸的非限制性实例包含赖氨酸、精氨酸和组氨酸。包括带负电荷的r基团的氨基酸的非限制性实例包含天门冬氨酸盐和谷氨酸盐。包括非极性芳族r基团的氨基酸的非限制性实例包含苯丙氨酸、酪氨酸和色氨酸。包括极性不带电荷的r基团的氨基酸的非限制性实例包含丝氨酸、苏氨酸、半胱氨酸、脯氨酸、天门冬酰胺和谷氨酰胺。
[0088]
可以根据本领域普通技术人员已知的用于改变多肽序列的方法(如在编纂这样的方法的参考文献(例如，molecular cloning:a laboratory manual,j.sambrook,et al.,eds.,fourth edition,cold spring harbor laboratory press,cold spring harbor,new york,2012、或current protocols in molecular biology,f.m.ausubel,et al.,eds.,john wiley&sons,inc.,new york,2010)中发现的)来制备变体。
[0089]
多肽的功能等效变体的非限制性实例可以包含本技术中公开的蛋白质的氨基酸序列中的保守氨基酸置换。如本公开中所使用的，“保守置换”与“保守氨基酸置换”可互换地使用，并且指表1中提供的氨基酸置换中的任何一种。
[0090]
在一些实施方案中，在制备变体多肽时，可以改变1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或超过20个残基。在一些实施方案中，氨基酸被保守氨基酸置换替代。
[0091]
表1.保守氨基酸置换
[0092]
原始残基r基团类型保守氨基酸置换ala非极性脂族r基团cys、gly、serarg带正电荷的r基团his、lysasn极性不带电荷的r基团asp、gln、gluasp带负电荷的r基团asn、gln、glucys极性不带电荷的r基团ala、sergln极性不带电荷的r基团asn、asp、gluglu带负电荷的r基团asn、asp、glngly非极性脂族r基团ala、serhis带正电荷的r基团arg、tyr、trpile非极性脂族r基团leu、met、valleu非极性脂族r基团ile、met、vallys带正电荷的r基团arg、hismet非极性脂族r基团ile、leu、phe、valpro极性不带电荷的r基团 phe非极性芳族r基团met、trp、tyrser极性不带电荷的r基团ala、gly、thrthr极性不带电荷的r基团ala、asn、sertrp非极性芳族r基团his、phe、tyr、mettyr非极性芳族r基团his、phe、trpval非极性脂族r基团ile、leu、met、thr
[0093]
可以通过改变多肽(例如，ef手型域或ree结合蛋白)的编码序列来进行肽或多肽的氨基酸序列中的氨基酸置换以产生具有期望性质和/或活性的重组肽或重组多肽(例如，ef手型域或ree结合蛋白)变体。类似地，通常通过改变重组多肽(例如，ef手型域或ree结合蛋白)的编码序列来进行多肽的氨基酸序列中的保守氨基酸置换以产生多肽的功能等效变体。
[0094]
可以通过本领域普通技术人员已知的任何方法在核苷酸序列中进行突变(例如，置换)。例如，可以通过pcr定向突变、根据kunkel的方法(kunkel,proc.nat.acad.sci.u.s.a.82:488-492,1985)的定点突变、通过编码多肽的基因的化学合成、通过基因编辑技术、或者通过插入(如标签(例如，his标签或gfp标签)的插入)来进行突变。
[0095]
在一些情况下，ree结合蛋白与亲和标签融合，这可以在ree结合蛋白的纯化中有用。亲和标签的非限制性实例包含白蛋白结合蛋白(abp)、碱性磷酸酶(ap)、氯霉素乙酰转移酶(cat)、谷胱甘肽s-转移酶(gst)、人流感血细胞凝集素(ha)、麦芽糖结合蛋白(mbp))、myc表位、聚精氨酸(arg-标签)、聚组氨酸(his-标签)、生物素、链霉亲和素结合肽(sbp)、链霉亲和素和串联亲和纯化(tap)。
[0096]
回收ree的方法
[0097]
本公开的方面涉及编码酶的基因的重组表达、其功能修饰和变体、以及与其相关的应用。例如，通过使样品与本公开的ree结合蛋白接触，本公开中所描述的方法可以用于
从样品中回收ree。在一些情况下，宿主细胞用于分泌感兴趣的ree结合蛋白，并且宿主细胞被引入感兴趣的样品中。在一些实施方案中，从宿主细胞分泌ree结合蛋白。可以进一步纯化ree结合蛋白。在一些实施方案中，本公开的ree结合蛋白用于结合细胞内的ree。
[0098]
样品可以是任何来源材料。例如，样品包含来自土壤和水路的环境样品。在一些实施方案中，样品是溪流样品、池塘样品、土壤样品、矿山样品、河流样品、山脉样品或溪河样品。在一些实施方案中，样品是包括一种或更多种金属的合成样品。样品可以在任何位置包含任何包括ree的材料。在一些实施方案中，样品包含加工废物或者来源于加工废物。在一些实施方案中，样品包括电子废物或者来源于电子废物。
[0099]
可以通过本领域已知的任何方法将编码本公开中描述的重组多肽(例如，ree结合蛋白)中任何一种的核酸并入任何适当的运载体中。例如，运载体可以是表达载体(包含但不限于病毒运载体(例如，慢病毒运载体、逆转录病毒运载体、腺病毒运载体、或腺相关病毒运载体)、适合于瞬时表达的任何运载体、适合于组成型表达的任何运载体、或者适合于诱导型表达的任何运载体(例如，半乳糖诱导型运载体(例如，包括p
gal
启动子)或强力霉素诱导型运载体))。在一些实施方案中，运载体是乳糖诱导的运载体。
[0100]
在一些实施方案中，运载体在细胞中自主复制。运载体可以含有一个或更多个核酸内切酶限制性位点，核酸内切酶限制位点被限制性核酸内切酶切割以插入和连接含有本公开中描述的基因的核酸，以产生能够在细胞中复制的重组运载体。运载体通常由dna组成，尽管rna运载体也是可用的。克隆运载体包含(但不限于)：质粒、f黏粒(fosmid)、噬菌粒、病毒基因组和人工染色体。如本公开中所使用的，术语“表达运载体”或“表达构建体”指重组或合成生成的、具有一系列容许特定核酸在宿主细胞(例如，微生物)(如细菌细胞或酵母细胞)中转录的指定核酸元件的核酸构建体。在一些实施方案中，将本公开中描述的基因的核酸序列插入克隆运载体中，使得其可操作地连接至调控序列，并且在一些实施方案中表达为rna转录物。在一些实施方案中，运载体含有一种或更多种标志物(如本公开中描述的可选择的标志物)，以鉴别用重组运载体转化或转染的细胞。在一些实施方案中，本公开中描述的基因的核酸序列是经密码子优化的。序列的密码子优化可以将基因产物的产量相对于未经密码子优化的参考序列增加至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、或100％(包含之间的全部值)。
[0101]
当编码序列和调控序列共价地连接并且编码序列的表达或转录受到调控序列的影响或控制时，编码序列和调控序列被称为“可操作地连接(operably joined)”或“可操作地连接(operably linked)”。如果编码序列被翻译成功能蛋白，则如果5’调控序列中启动子的诱导容许编码序列被转录，并且如果编码序列与调控序列之间的联接的性质不会(1)造成移码突变的引入；(2)干扰启动子区指导编码序列的转录的能力、或(3)干扰相应rna转录物被翻译成蛋白质的能力，则编码序列和调控序列被称为是可操作地连接。
[0102]
在一些实施方案中，编码本公开中描述的蛋白质中的任何一种的核酸受调控序列(例如，增强子序列)的控制。在一些实施方案中，核酸在启动子的控制下表达。启动子可以是天然启动子(例如，基因在其内源环境中的启动子，该启动子提供基因表达的正常调控)。可替代地，启动子可以是与基因的天然启动子不同的启动子，例如，启动子与基因在其内源环境中的启动子不同。
[0103]
在一些实施方案中，启动子是真核启动子。真核启动子的非限制性实例包含如本领域普通技术人员已知的tdh3、pgk1、pkc1、pdc1、tef1、tef2、rpl18b、ssa1、tdh2、pyk1、tpi1 gal1、gal10、gal7、gal3、gal2、met3、met25、hxt3、hxt7、act1、adh1、adh2、cup1-1、eno2和sod1(参见，例如，addgene网站：blog.addgene.org/plasmids-101-the-promoter-region)。
[0104]
在一些实施方案中，启动子是原核启动子(例如，噬菌体启动子或细菌启动子)。如本领域普通技术人员所已知的，噬菌体启动子的非限制性实例包含pls1con、t3、t7、sp6和pl。细菌启动子的非限制性实例包含apfab101、apfab92(ec-ttl-p100)、abfab71(ec-ttl-p097)、apfab45(ec-ttl-9092)、apfab29、apfab76(ec-ttl-p075)、bba_j23104(ec ttl-p054)、j23104、ec-ttl-p041、apfab436(ec-ttl-p046)、apfab332、pbad、pmgrb、ptrc2、plac/ara、ptac和pm。
[0105]
在一些实施方案中，启动子是诱导型启动子。如本公开中所使用的，“诱导型启动子”是受到分子的存在或不存在控制的启动子。诱导型启动子的非限制性实例包含化学调控的启动子和物理调控的启动子。对于化学调控的启动子，转录活性可以由一种或更多种化合物(如醇、四环素、半乳糖、类固醇、金属、或其他化合物)调控。对于物理调控的启动子，转录活性可以受现象(如光或温度)的调控。四环素调控的启动子的非限制性实例包含脱水四环素(atc)响应性启动子和其他四环素响应性启动子系统(例如，四环素阻遏蛋白(tetr)、四环素操纵子序列(teto)和四环素反式激活子融合蛋白(tta))。类固醇调控的启动子的非限制性实例包含基于大鼠糖皮质激素受体、人雌激素受体、蛾蜕皮激素受体的启动子，以及来自类固醇/类维生素a/甲状腺受体超家族的启动子。金属调控的启动子的非限制性实例包含来源于金属硫蛋白(结合并且螯合金属离子的蛋白质)基因的启动子。发病机制调控的启动子的非限制性实例包含由水杨酸、乙烯或苯并噻二唑(bth)诱导的启动子。温度/热诱导型启动子的非限制性实例包含热激启动子。光调控的启动子的非限制性实例包含来自植物细胞的光响应性启动子。在某些实施方案中，诱导型启动子是半乳糖诱导型启动子。在一些实施方案中，通过一种或更多种生理条件(例如，ph、温度、辐射、渗透压、盐水梯度、细胞表面结合、或者一种或更多种外在诱导剂或内在诱导剂的浓度)来诱导诱导型启动子。外在诱导物或诱导剂的非限制性实例包含氨基酸和氨基酸类似物、糖类和多糖、核酸、蛋白质转录激活子(activator)和阻遏子(repressor)、细胞因子、毒素、石油基化合物、含金属的化合物、盐、离子、酶底物类似物、激素或其任何组合。
[0106]
在一些实施方案中，启动子是组成型启动子。如本公开中所使用的，“组成型启动子”指允许基因的连续转录的未经调控的启动子。组成型启动子的非限制性实例包含tdh3、pgk1、pkc1、pdc1、tef1、tef2、rpl18b、ssa1、tdh2、pyk1,tpi1、hxt3、hxt7、act1、adh1、adh2、eno2和sod1。
[0107]
本公开中也预期了本领域普通技术人员已知的其他诱导型启动子或组成型启动子。
[0108]
基因表达所需的调控序列的确切性质可能在物种或细胞类型之间变化，但通常视需要包含分别涉及转录和翻译的起始的5’非转录序列和5’非翻译序列(如tata框、加帽序列、caat序列等)。特别地，这样的5’非转录调控序列将包含启动子区，该启动子区包含用于可操作地连接的基因的转录控制的启动子序列。调控序列还可以包含增强子序列或上游激
活子序列。本技术中公开的运载体可以包含5’前导序列(leader)或信号序列。调控序列还可以包含终止子序列。在一些实施方案中，终止子序列在转录期间标记dna中基因的末端。适合于诱导异源生物体中的本公开中描述的一个或更多个基因的表达的一种或更多种适当的运载体的选择和设计在本领域普通技术人员的能力和判断范围之内。
[0109]
编码一种或更多种ree结合蛋白的表达运载体还可以编码促进ree结合蛋白输出到细胞外的分泌信号肽。根据细胞类型，可以使用原核信号肽或真核信号肽。分泌信号肽通常位于多肽序列的氨基末端。细菌中的分泌信号肽的非限制性实例包含分别促进通过一般分泌(sec)输出途径或通过易位(tat)输出途径输出的一般分泌(sec)信号肽和双精氨酸易位(tat)信号肽。参见，例如，freudl microb cell fact.2018；17:52；lee et al.,annu rev microbiol.2006；60:373
–
395。sec信号肽和tat信号肽包括由三部分组成的结构，并且具有带正电荷的n区、中心疏水性h区和极性c区，极性c区具有信号肽酶识别位点(共有：a-x-a)。tat信号肽包括氨基酸共有基序(s/t-r-r-x-f-l-k，其中x通常是极性氨基酸残基)。作为非限制性实例，来自酿酒酵母前原α-因子(肽交配信息素的前体)的分泌信号可以用于从酵母分泌ree结合蛋白。也参见，例如，fitzgerald and glick,microb cell fact.2014；13:125。
[0110]
含有表达必需元件的表达运载体是可商业获得的，并且是本领域普通技术人员已知的(参见，例如，sambrook et al.,molecular cloning:a laboratory manual,fourth edition,cold spring harbor laboratory press,2012)。
[0111]
宿主细胞
[0112]
可以在宿主细胞中表达本公开的蛋白质中的任何一种。如本公开中所使用的，宿主细胞是可以用于表达至少一种异源多核苷酸(例如，编码本技术中描述的蛋白质或酶)的细胞。
[0113]
就多核苷酸(如包括基因的多核苷酸)而言，术语“异源”与术语“外源的”和术语“重组”可互换地使用，并且指：已经被人工地提供给生物系统的多核苷酸；已经在生物系统内修饰的多核苷酸、或者已经在生物系统内操纵其表达或调控的多核苷酸。被引入宿主细胞中或者在宿主细胞中表达的异源多核苷酸可以是来自与宿主细胞不同的生物体或物种的多核苷酸，或者可以是合成的多核苷酸，或者可以是也在与宿主细胞相同的生物体或物种中内源表达的多核苷酸。例如，当在宿主细胞中内源表达的多核苷酸非天然地位于宿主细胞中；在宿主细胞中稳定或瞬时重组表达；在宿主细胞内被修饰；在宿主细胞内被选择性编辑；在宿主细胞内以不同于天然存在的拷贝数的拷贝数表达；或者在宿主细胞内以非天然方式表达(如通过操纵控制多核苷酸的表达的调控区)时，在宿主细胞中内源表达的多核苷酸可以被认为是异源的。在一些实施方案中，异源多核苷酸是一多核苷酸，所述多核苷酸在宿主细胞中内源表达，但所述多核苷酸的表达由不天然调控多核苷酸表达的启动子驱动。在其他实施方案中，异源多核苷酸是一多核苷酸，所述多核苷酸在宿主细胞中内源表达，并且所述多核苷酸的表达由天然调控多核苷酸表达的启动子驱动，但所述启动子或另外的调控区被修饰。在一些实施方案中，启动子被重组激活或阻抑。例如，基于基因编辑的技术可以用于调控多核苷酸(包含内源多核苷酸)自启动子(包含内源启动子)的表达。参见，例如，chavez et al.,nat methods.2016jul；13(7):563-567。与参考多核苷酸序列相比，异源多核苷酸可以包括野生型序列或突变序列。
[0114]
任何适合的宿主细胞可以用于产生本技术中公开的重组多肽(ree结合蛋白)中的任何一种，宿主细胞包含真核细胞或原核细胞。适合的宿主细胞包含细菌细胞(例如，大肠埃希氏菌细胞或芽孢杆菌细胞)和真菌细胞(例如，酵母细胞)。细菌细胞属的非限制性实例包含耶尔森菌属、埃希氏菌属、克雷伯菌属、农杆菌属、不动杆菌属、鲍特菌属(bordetella spp.)、奈瑟氏菌属、气单胞菌属、弗朗西斯氏菌属、棒状杆菌属、柠檬酸杆菌属、衣原体属、嗜血杆菌属、布鲁氏菌属、分枝杆菌属、军团菌属、乳球菌属、红球菌属、假单胞菌属、螺杆菌属、沙门氏菌属、弧菌属、芽孢杆菌属、丹毒丝菌属、沙门氏菌属、链霉菌属、拟杆菌属、普氏菌属、梭菌属、双歧杆菌属或乳杆菌属。
[0115]
用于表达的酵母属的非限制性实例包含酵母属(例如，酿酒酵母)、毕赤酵母属、克鲁维酵母属(例如，乳酸克鲁维酵母)、汉逊酵母属和耶氏酵母属。在一些实施方案中，酵母菌株是工业多倍体酵母菌株。真菌细胞的其他非限制性实例包含获自曲霉属、青霉属、镰刀菌属、根霉属、支顶孢属、脉孢菌属、粪壳菌属、稻瘟菌属、异水霉属、黑粉菌属、葡萄孢属和木霉属的细胞。
[0116]
如本公开中所使用的，术语“细胞”可以指单个细胞或细胞群体(如属于相同细胞系或菌株的细胞群体)。不应当将单数术语“细胞”的使用解释为明确地指单个细胞而不是细胞群体。
[0117]
相对于野生型对应物，宿主细胞可以包括基因修饰。可以通过任何适合的方法(包含但不限于基因的缺失、向内源基因中引入点突变、和/或内源基因的截断)来实现基因表达的降低和/或基因失活。例如，可以使用基于聚合酶链反应(pcr)的方法(参见，例如，gardner et al.,methods mol biol.2014；1205:45-78)。作为非限制性实例，可以通过基因置换(例如，用标志物(包含选择标志物))删除基因。还可以通过转座子系统的使用来截断基因(参见，例如，poussu et al.,nucleic acids res.2005；33(12):e104)。也可以通过本领域普通技术人员已知的基因编辑技术修饰基因。
[0118]
可以使用本领域已知的任何方法将编码本公开中描述的重组多肽(例如，ree结合蛋白)中任何一种的运载体引入适合的宿主细胞中。
[0119]
hanahan methods enzymol.1991；204:63-113；gerhardt,p.r.,murray,r.g.e.,wood,w.a.&krieg,n.r.(editors)(1994).methods for general and molecular bacteriology.washington,dc:american society for microbiology；以及green,p.n.&bousfield,i.j.(1982)中描述了细菌转化方案的非限制性实例。
[0120]
gietz et al.,yeast transformation can be conducted by the liac/ss carrier dna/peg method.methods mol biol.2006；313:107-20(其为此特此通过引用被整体并入)中描述了酵母转化方案的非限制性实例。
[0121]
可以在本领域普通技术人员理解的任何适合的条件下培养宿主细胞。例如，可以使用本领域已知的任何培养基、温度和孵育条件。对于携带诱导型运载体的宿主细胞，可以用适当的诱导剂培养细胞以促进表达。
[0122]
可以在接触和/或核酸的整合之前、在接触和/或核酸的整合期间、和/或在接触和/或核酸的整合之后在任何类型(富集的或基本的)和任何组成的培养基中培养本技术中公开的任何细胞。如本领域普通技术人员所理解的，可以通过常规实验优化培养物或培养过程的条件。在一些实施方案中，选择的培养基补充有各种组分。在一些实施方案中，优化
补充组分的浓度和量。在一些实施方案中，通过常规实验优化培养基和生长条件(例如，ph、温度等)的其他方面。在一些实施方案中，优化培养基补充一种或更多种补充组分的频率、以及培养细胞的时间量。
[0123]
可以在本领域已知且使用的培养容器中进行本公开中描述的细胞的培养。在一些实施方案中，充气反应容器(例如，搅拌釜反应器)用于培养细胞。在一些实施方案中，生物反应器或发酵器用于培养细胞。因此，在一些实施方案中，在发酵中使用细胞。如本公开中所使用的，术语“生物反应器”和术语“发酵器”可互换地使用，并且指在其中发生生物反应、生物化学反应和/或化学反应(涉及活生物体或活生物体的一部分)的包围物或部分包围物。“大规模生物反应器”或“工业规模生物反应器”是用于以商业规模或准商业规模生成产物的生物反应器。大型生物反应器通常具有在升、数百升、数千升、或更大范围内的体积。
[0124]
在一些实施方案中，生物反应器包括细胞(例如，细菌细胞或酵母细胞)或细胞培养物(例如，细菌细胞培养物或酵母细胞培养物)(如本公开中描述的细胞或细胞培养物)。在一些实施方案中，生物反应器包括孢子和/或分离微生物的休眠细胞类型(例如，处于干燥状态的休眠细胞)。
[0125]
生物反应器的非限制性实例包含：搅拌釜发酵器、通过旋转混合装置搅动的生物反应器、恒化器、通过振动装置搅动的生物反应器、气升式发酵器、填充床反应器、固定床反应器、流化床生物反应器、采用波诱导的搅动的生物反应器、离心生物反应器、滚瓶、以及中空纤维生物反应器、滚转器设备(例如，台式种类、推车安装式种类、和/或自动化种类)、竖直堆叠的板、旋转瓶、搅拌瓶或摇动瓶、振动的多孔板、md瓶、方瓶、洛克斯氏瓶、多表面组织培养繁殖器、改良的发酵器、以及经涂覆的珠(例如，用血清蛋白、硝化纤维素或羧甲基纤维素涂覆的珠以防止细胞附着)。
[0126]
在一些实施方案中，生物反应器包含细胞培养系统，其中细胞(例如，细菌细胞或酵母细胞)与运动的液体和/或气泡接触。在一些实施方案中，细胞或细胞培养物悬浮生长。在其他实施方案中，细胞或细胞培养物附着于固相载体。载体系统的非限制性实例包含微载体(例如，可以是多孔或无孔的聚合物球、微珠和微盘)、带有特定化学基团(例如，叔胺基团)的交联珠(例如，右旋糖酐)、2d微载体(包含捕获在无孔聚合物纤维中的细胞)、3d载体(例如，载体纤维、中空纤维、多筒反应器(multicartridge reactor)、以及可以包括多孔纤维的半渗透膜)、具有降低的离子交换能力的微载体、微囊化细胞、毛细管、以及聚集体。在一些实施方案中，由材料(如右旋糖酐、明胶、玻璃、或纤维素)制造载体。
[0127]
在一些实施方案中，以连续模式、半连续模式或非连续模式操作工业规模的过程。操作模式的非限制性实例是分批、补料分批(fed batch)、扩展分批(extended batch)、重复分批(repetitive batch)、抽取/填充、旋转壁、旋转瓶、和/或灌注操作模式。在一些实施方案中，生物反应器允许连续或半连续补充底物原料(例如，碳水化合物来源)和/或从生物反应器连续或半连续分离产物。
[0128]
在一些实施方案中，生物反应器或发酵器包含传感器和/或控制系统以测量和/或调整反应参数。反应参数的非限制性实例包含生物学参数(例如，生长速率、细胞尺寸、细胞数量、细胞密度、细胞类型、或细胞状态等)、化学参数(例如，ph、氧化还原电位、反应底物和/或产物的浓度、溶解的气体的浓度(如氧气浓度和co2浓度)、营养物浓度、代谢物浓度、寡肽的浓度、氨基酸的浓度、维生素的浓度、激素的浓度、添加剂的浓度、血清浓度、离子强
度、离子的浓度、相对湿度、摩尔浓度、同渗容摩、其他化学物质(例如，缓冲剂、佐剂或反应副产物)的浓度)、物理/机械参数(例如，密度、传导率、搅拌程度、压力、和流速、剪切应力、剪切速率、粘度、颜色、浊度、光吸收、混合速率、转化率、以及热力学参数(如温度、光强度/质量)等)。测量本公开中描述的参数的传感器对于相关机械和电子领域的普通技术人员来说是公知的。控制系统基于来自本公开中描述的传感器的输入来调整生物反应器中的参数是生物反应器工程领域的普通技术人员公知的。
[0129]
在一些实施方案中，方法涉及分批发酵(例如，摇瓶发酵)。分批发酵(例如，摇瓶发酵)的一般考虑因素包含氧气和葡萄糖的水平。例如，分批发酵(例如，摇瓶发酵)可能受限于氧气和葡萄糖，因此在一些实施方案中，菌株在设计良好的补料分批发酵中进行的能力被低估。另外，最终产物(例如，氨基酸(包含赖氨酸))可以在溶解性、毒性、手型细胞累积和分泌方面显示出与天然存在的产物(例如，氨基酸(包含赖氨酸))的一些差异，并且在一些实施方案中可以具有不同的发酵动力学。
[0130]
在其他实施方案中，ree的回收可以在样品(如矿山或废弃溪流)处、或者在地点(如矿山或废弃溪流)附近的处理中心中进行。在一些实施方案中，可以向样品所位于的任何位置的样品施加ree结合蛋白或含有ree结合蛋白的细胞。
[0131]
在一些实施方案中，方法包括使样品与纯化的ree结合蛋白接触以回收ree。在一些情况下，宿主细胞被工程化以产生重组ree结合蛋白，然后可以使用本领域已知的方法纯化重组ree结合蛋白。例如，可以使用亲和色谱纯化包括亲和标签的ree结合蛋白。纯化策略的非限制性实例包含尺寸排阻色谱、疏水作用色谱、离子交换色谱、自由流动电泳、金属结合色谱、免疫亲和色谱和高效液相色谱。
[0132]
在一些实施方案中，方法还包括纯化与ree结合蛋白结合的至少一种ree。在一些情况下，纯化ree的操作包括提取ree。ree纯化的非限制性方法包含金属螯合剂的使用和在变性条件(例如，改变样品的ph值和/或温度)下对ree结合的ree结合蛋白的处理。
[0133]
本公开的另外的方面涉及试剂盒。试剂盒可以包含本公开中描述的任何ree结合蛋白和/或包括本公开中描述的ef手型域的任何蛋白质。试剂盒还可以包括用于ree结合蛋白的使用(如使用ree结合蛋白提取稀土元素(如镧系元素、钪或钇))的说明书。用于在试剂盒中使用的ree结合蛋白可以是在细胞中表达并且从细胞分泌的ree结合蛋白。试剂盒可以包含用于表达ree结合蛋白的细胞和/或用于产生表达ree结合蛋白的细胞或菌株所必需的任何材料。
[0134]
通过以下实施例进一步阐明本发明，但绝不应当将以下实施例解释为进一步限制。贯穿本技术所引用的全部参考文献(包含文献参考、授权专利、公布的专利申请、以及待审专利申请)的全部内容特此通过引用被明确并入。
实施例
[0135]
实施例1：候选镧系元素结合蛋白的鉴别
[0136]
为了鉴别候选稀土元素(ree)结合蛋白，从ree矿中收集环境样品(包括微生物)。分析样品以鉴别编码包括ef手型域的蛋白质的基因，ef手型域先前已经被表征为结合钙。通过测序(包含16s(基因型)测序、以及完整的宏基因组测序两者)分析样品。
[0137]
为了将长度为100-150bp的短读序组装成更长的“重叠群(contig)”，megahit工具
(li et al.,bioinformatics.2015may 15；31(10):1674-6)用于生成所谓的给定数据集中全部读序的“共同组装”。对所得到的重叠群进行长度过滤，以去除不太可能编码完整域的短序列(＜1000bp)。transdecoder(haas et al.,nat protoc.2013aug；8(8):1494-512)用于预测剩余数据集中的潜在开放阅读框。然后，将这些预测的序列与表3中描述的pfam域进行比较。
[0138]
如图1中所示，鉴别多种含有ef手型域的蛋白质。这些蛋白质中的大多数含有大约两个ef手型域，而蛋白质中的一些含有超过五个ef手型域。在全部四个数据集中观察到该现象。“尾矿”样品含有大量镝和其他镧系元素。
[0139]
进一步表征从序列研究中鉴别的包括一个或更多个ef手型域的候选镧系元素结合蛋白。图2中提供用于表征候选镧系元素结合蛋白的方法的概述。如图2中所示，库蛋白在大肠埃希氏菌bl21(de3)细胞中表达，大肠埃希氏菌bl21(de3)细胞在用乳糖代谢物诱导时表达t7 rna聚合酶。大约1600种ef手型蛋白被编码到质粒中，并且被置于t7启动子的控制下，从而允许蛋白质产生受培养基条件的控制。为了减轻对金属结合蛋白的细胞毒性的潜在担忧，选择bl21(de3)plyss以用于初级筛选。用含有含ef手型域的蛋白质的质粒转化大肠埃希氏菌bl21(de3)细胞。所得到的菌株在96深孔板中在被选择用于最大蛋白质表达的自诱导培养基中生长，然后随后沉淀并且冷冻储存。
[0140]
使用基于高通量96孔板的纯化方案利用固定化金属离子亲和色谱纯化含有ef手型域的蛋白质。含有ef手型域的蛋白质含有多组氨酸“标签”序列，从而允许通过裂解细胞并且通过多组氨酸与ni-nta树脂的选择性且高亲和力的结合分离蛋白质来纯化蛋白质。在与细胞碎片分离后，通过在咪唑缓冲液中洗脱从树脂中去除纯化的蛋白质。在全部实验测定中使用纯化的候选镧系元素结合蛋白。
[0141]
在初级筛选中，使用候选蛋白质与金属结合比色指示剂二甲酚橙(xo)之间的竞争测定来对整个蛋白质库针对铽(tb)结合进行筛选。图3描绘了以初级筛选中使用的发色团xo为特征的竞争测定。如图3的左侧图片中所示，当与tb复合时，发色团xo展现出570nm处的吸收(abs570)的增加。在弱tb结合蛋白的情况下，大部分tb与xo结合，从而导致abs570的增加(图3，左上部)。强tb结合蛋白将金属与xo隔离，这减小abs570(图3，左下部)。测量1461种候选镧系元素结合蛋白的tb亲和力。图3中的饼状图中示出对照和镧系元素结合蛋白(lbp)的分布。
[0142]
存在独特蛋白质的两个生物学复制，并且一式三份地测量每种蛋白质。筛选含有三个阳性对照、一个阴性对照和仅缓冲液的样品空白。在96孔测定板中的每个上包含这些对照，以确保实验一致性并且标准化板之间的任何系统差异。筛选中20％的样品是对照。总体而言，初级筛选包括114个96孔板上的超过10809个样品。
[0143]
图4中示出来自初级筛选的数据。为了说明样品批次与板之间的系统差异，通过将每个值标准化为板平均值和标准偏差来将abs570测量值转化为z评分。预期具有强tb结合亲和力的蛋白质将tb离子与xo隔离，这将导致abs570的减小和相应的负的z评分。事实上，存在z评分2和3标准偏差低于平均值的样品的相对富集，这与候选蛋白质(有时称为“菌株”)的tb结合一致。这些数据证实，初级筛选从在不同日期(对应于不同批次)进行的实验试验中鉴别tb结合蛋白。总体而言，数百种蛋白质显示出小于-1的平均z评分(图4，底部)。
[0144]
选择初级筛选命中(tb结合蛋白)以用于二级筛选，二级筛选使用渗析测定以直接
测量tb和镝结合亲和力以及镧系元素金属对铁的选择性结合。
[0145]
实施例2.候选镧系元素结合蛋白的表征
[0146]
基于标准(所选择的菌株必须具有2 复制以及低于平均值小于1个标准偏差的z评分)选择实施例1中鉴别的tb结合蛋白中的294种蛋白质以用于二级库。
[0147]
在开发更灵敏的二级筛选时，开发实验方法以直接测量金属结合。使用渗析-板测定对二级库针对tb结合进行筛选。对于渗析测定，蛋白质溶液在含有2μm tb的50
×
过量体积中渗析过夜。从渗析室中去除蛋白质溶液之后，通过280nm处的吸收(abs280)测量其浓度，然后用delfia试剂处理以隔离和浓缩tb以用于通过delfia荧光测定的定量。通过在320nm激发后测量545nm处的发射使用读板器收集荧光强度。插图示出96孔渗析板设置。
[0148]
筛选总计含有297种蛋白(包含294种候选镧系元素结合蛋白加上3种阳性对照)。还筛选仅样品缓冲液的空白(图5，左侧图片)。一式三份地测量每种蛋白质。所测量的强度值与蛋白质溶液中的tb浓度成正比，如果蛋白质与tb结合，则蛋白质溶液中的tb浓度将增加。值从略高于背景(图5，左侧图片的左侧)至大幅增加(左侧图片的右侧)变化，从而表明二级筛选库蛋白中的许多结合tb。为了说明菌株之间蛋白质表达水平的差异，依据蛋白质浓度标准化tb结合数据(图5，右侧图片)，并且选择浓度高于20μm的蛋白质以集中于表达良好的蛋白质并且最小化与标准化相关的人工痕迹。也参见表3。二级库蛋白中的许多具有与三种阳性对照相当的tb亲和力或者具有比三种阳性对照更好的tb亲和力，三种阳性对照包含两种经工程化的镧系元素结合蛋白和一种具有所报道的皮摩尔镧系元素结合亲和力的天然蛋白。这些结果证实了从初级筛选中选择的命中并且提供直接的实验衡量标准以对库蛋白的tb结合进行排序。
[0149]
为了确定发现的tb结合蛋白是否也结合其他镧系元素，使用镝对前23种“最佳结合”蛋白进行相同的渗析板测定(图6，左侧)。与其在tb实验中的表现一致，最佳结合剂也显示出对镝的高亲和力；其中的大多数胜过阳性对照。还对最佳结合剂进行使用过渡金属铁的渗析板测定，以评估其金属结合选择性(图6，右侧)。也参见表3。在表3中，数值的缺乏表示未测量该性质。
[0150]
还研究了tb结合蛋白是否也与铁结合。使用通常用于测量生物样品中蛋白质结合的铁的菲洛嗪显色测定试剂盒来检测铁。该测定涉及使蛋白质变性以释放结合的铁，铁然后可以与菲洛嗪形成强比色复合物。测定可以检测微摩尔(或更低)的金属浓度。最佳结合蛋白中的大多数在微摩尔浓度下不结合铁，并且因此显示出超过铁的针对镧系元素的选择性。
[0151]
初级筛选和二级筛选揭示了，包括选自seq id no:1-179的序列的蛋白质是镧系元素结合蛋白。二级筛选示出，包括选自seq id no:4-71的序列的蛋白质具有与对照镧系元素结合蛋白(seq id no:2-3)相当的结合亲和力或者具有比对照镧系元素结合蛋白(seq id no:2-3)更大的结合亲和力。观察到比对照好高达五倍的结合水平。
[0152]
二级筛选的附加的灵敏度证实了初级筛选中鉴别的蛋白质的镧系元素结合能力，并且允许镧系元素亲和力与先前报道的镧系元素结合蛋白的比较。总计鉴别了超过20种蛋白质，所述20种蛋白质比先前描述的天然镧系元素结合蛋白和经设计的镧系元素结合蛋白更好地结合铽金属和镝金属。此外，本公开中鉴别的高亲和力镧系元素结合蛋白中的大多数在微摩尔浓度下不结合铁，从而表明超过铁的针对镧系元素的选择性。
[0153]
候选镧系元素结合蛋白的序列
[0154]
表2提供实施例1和实施例2中描述的蛋白质的序列。在表2中，指出每个氨基酸序列的镧系元素(ln)结合亲和力。如测定中所检测到的，“对照”表示对照ln结合蛋白(t347901和/或t347902)，“最佳”表示与菌株t347901和/或菌株t347902相当的结合亲和力或者比菌株t347901和/或菌株t347902更高的结合亲和力，“命中”表示显著高于背景、但小于t347901和t347902的结合亲和力信号，并且“弱”表示与背景水平类似的金属结合信号。最初的初级筛选在1461种蛋白质的库上进行，并且使用t347901和t347902作为对照ln结合蛋白。初级筛选中表现最好的蛋白质(297种蛋白质)进入二级筛选。除了t347901对照和t347902对照以外，t406938也被包含在二级筛选中作为对照蛋白。基于二级筛选中进行的铽结合测定作出“最佳”命名、“命中”命名和“弱”命名。进入二级筛选的全部蛋白质在初级筛选中被测试出针对tb结合呈阳性。
[0155]
表2.序列
[0156]
[0157]
[0158]
[0159]
[0160]
[0161]
[0162]
[0163]
[0164]
[0165]
[0166]
[0167]
[0168]
[0169]
[0170]
[0171]
[0172]
[0173]
[0174]
[0175]
[0176]
[0177]
[0178]
[0179]
[0180]
[0181]
[0182]
[0183]
[0184]
[0185]
[0186]
[0187]
[0188]
[0189]
[0190]
[0191]
[0192][0193]
表3.金属结合测定的结果
[0194]
[0195]
[0196]
[0197]
[0198]
[0199]
[0200]
[0201]
[0202][0203]
等同物
[0204]
本领域技术人员仅使用常规实验就将认识到或能够确知本公开中描述的本发明的具体实施方案的许多等同物。这样的等同物旨在由以下权利要求书涵盖。
[0205]
本公开中公开的全部参考文献(包含专利文件)通过引用被整体(特别是本公开中引用的公开内容)并入本文。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

稀土元素(REE)结合蛋白的制作方法

相关文献

最热文献