一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

修饰的切割酶,及其使用和相关试剂盒的制作方法

2022-02-22 02:44:05 来源:中国专利 TAG:

修饰的切割酶,及其使用和相关试剂盒
1.相关应用
2.本技术要求于2019年3月26日提交的美国临时专利申请62/823,927、2019年3月26日提交的62/824,157和2019年11月6日提交的美国专利62/931,737的优先权,其公开内容为了所有目的,通过引用将其全部内容整体并入。
3.关于联邦资助研究的声明
4.本发明是在美国国立卫生研究院的国立普通医学科学研究所授予的政府资助下进行的,授予号为:1r43gm130185-01.根据该授予,美国政府对本发明享有某些权利。
5.ascii文本上的序列表
6.该专利或申请文件包括以计算机可读ascii文本格式提交的序列表(文件名:4614-2001340_20200323_seqlist_st25.txt,记录日期:2020年3月23日,大小:184,980字节)。序列表文件的内容通过引用整体并入本文。
技术领域
7.本公开涉及用于从肽,多肽和蛋白质(包括经修饰的肽,多肽和蛋白质)切割氨基酸的修饰的切割酶。还提供了使用修饰的切割酶处理多肽的方法,以及包括修饰的切割酶的试剂盒。在一些实施例中,所述方法和试剂盒还包括用于大分子测序和/或分析的其他组分。
8.背景
9.涉及肽和蛋白质降解的酶,例如,氨基肽酶、二肽基肽酶、羧基肽酶、内肽酶等、水解肽键(sanderink et al.,j.clin.chem.clin.biochem.(1988)26:795-807)。已经从多种生物体和各种组织中分离并发现了各种肽酶。氨基肽酶天然地以单体和多聚体酶形式存在,并且可以是金属或atp依赖性的。一些底物特异性肽酶一次从肽的氨基末端特异性去除一个或两个氨基酸残基,而另一些从蛋白质或肽的羧基末端去除。天然氨基肽酶通常具有有限的特异性,并以逐步方式消除氨基酸,一个接一个地消除一个氨基酸。
10.在一些实施例中,用于肽降解的方法可用于蛋白质分析和/或测序应用中。例如,肽测序可能涉及埃德曼降解,以通过一系列化学修饰和下游hplc分析或质谱分析实现肽上n-末端氨基酸(ntaa)的逐步降解。然而,通常,埃德曼降解肽测序可能会受到限制,例如,典型的埃德曼降解需要长时间培养高温和苛刻的化学条件(例如强酸;无水tfa)。在某些情况下,埃德曼降解可能与蛋白质分析方法的过程不兼容,其分析方法可能对苛刻的化学条件敏感,例如采用核酸(例如dna)的分析方法。
11.因此,仍然需要用于氨基酸降解的改良试剂。例如,可能需要用于从多肽中去除,消除或切割氨基酸的酶促方法。此外,还需要获得可与多肽结合并从多肽中去除所需氨基酸的另外的底物特异性酶。在某些情况下,这种用于去除氨基酸的改良试剂可用于蛋白质测序和/或分析。本公开满足这些和其他相关需求。
12.参考以下详细描述,本发明的这些和其他方面将变得显而易见。为此,本文阐述了各种参考文献,其更详细地描述了某些背景信息,程序,化合物和/或组合物,并且各自通过
引用整体并入本文。
13.简要总结
14.该概述并不旨在用于限制所要求保护的主题的范围。根据包括在附图和所附权利要求中公开的那些方面的详细描述,所要求保护的主题的其他特征,细节,效用和优点将变得显而易见。
15.本文提供一种修饰的切割酶,其包括突变,例如未修饰的切割酶中的一个或多个氨基酸修饰,其中所述修饰的切割酶衍生自二肽切割酶并且从多肽中去除或配置为去除单个标记的末端氨基酸。本文提供一种修饰的切割酶,其包括突变,例如未修饰的切割酶中的一个或多个氨基酸修饰,其中所述修饰的切割酶衍生自三肽切割酶并且从多肽中去除或配置为去除单个标记的末端氨基酸或单个标记的末端二肽。在一些实施例中,修饰的切割酶被配置为从多肽的c-末端或n-末端去除单个标记的末端氨基酸。在一些实施例中,修饰的切割酶被配置为从多肽的c-末端或n-末端去除单个标记的二肽(末端和倒数第二末端氨基酸)。在一些实施例中,修饰的切割酶衍生自野生型或未修饰的切割酶(例如,二肽切割酶或三肽切割酶)。例如,未修饰的切割酶是分类为ec 3.4.14,ec 3.4.15,merops s8,merops s9,merops s33,merops s46,merops m49或merops s53的蛋白质或其功能同源物或片段。
16.本文还提供了一种处理多肽的方法,该方法包括使多肽与包括突变的修饰的切割酶接触,例如,未修饰的切割酶中的一个或多个氨基酸修饰,其中修饰的切割酶衍生自二肽切割酶,并从多肽中除去单个标记的末端氨基酸。本文提供了一种处理多肽的方法,该方法包括使多肽与包括突变的修饰的切割酶接触,例如,未修饰的切割酶中的一个或多个氨基酸修饰,其中修饰的切割酶衍生自三肽切割酶,并从多肽中去除单个标记的末端氨基酸或从多肽中去除单个标记的末端二肽。在一些实施例中,修饰的切割酶从用修饰的切割酶处理的多肽的c-末端或n-末端去除单个标记的末端氨基酸。在一些实施例中,修饰的切割酶从用修饰的切割酶处理的多肽的c-末端或n-末端去除单个标记的二肽(末端和倒数第二个末端氨基酸)。在一些实施例中,修饰的切割酶衍生自野生型或未修饰的切割酶(例如,二肽切割酶或三肽切割酶)。例如,未修饰的切割酶是分类为ec 3.4.14,ec 3.4.15,merops s8,merops s9,merops s33,merops s46,merops m49或merops s53的蛋白质或其功能同源物或片段。在一些实施例中,该方法进一步包括使多肽与用于标记多肽的末端氨基酸的试剂接触。在一些实施例中,该方法进一步包括使多肽与能够结合至多肽的末端氨基酸的结合剂接触,其中该结合剂包括具有关于该结合剂的识别信息的编码标签。在一些实施例中,该方法还包括将编码标签的识别信息转移至附着于多肽的记录标签,从而在多肽上产生扩展记录标签。在某些情况下,该方法进一步包括去除结合剂。在一些其他实施例中,该方法还包括分析一个或多个扩展记录标签。在一些其他实施例中,该方法进一步包括将上述步骤中的一些或全部重复一次或多次。
17.本文还提供了一种用于分析多肽的方法,该方法包括以下步骤:(a)使多肽与能够与该多肽的末端氨基酸结合的结合剂接触,其中该结合剂包括编码标签,该编码标签具有关于结合剂的识别信息;(b)将编码标签的识别信息转移到与每个多肽相关联的记录标签上,以产生扩展记录标签;(c)使多肽与试剂接触以标记多肽的末端氨基酸;和(d)使多肽与修饰的切割酶接触,其包括突变,例如未修饰的切割酶中的一个或多个氨基酸修饰,其中所述修饰的切割酶衍生自二肽切割酶并从多肽中去除步骤(c)中试剂标记的单个末端氨基
酸;或者修饰的切割酶衍生自三肽切割酶,并从多肽中除去步骤(c)中试剂标记的单末端氨基酸或单末端二肽。
18.本文提供了一种用于处理多肽的试剂盒,该试剂盒包括修饰的切割酶,其包括突变,例如未修饰的切割酶中的一个或多个氨基酸修饰,和用于标记多肽的末端氨基酸的试剂。在一些方面,修饰的切割酶衍生自二肽切割酶,并从多肽中去除或被配置为去除单个标记的末端氨基酸,或修饰的切割酶衍生自三肽切割酶并从多肽中去除或被配置为去除单个标记的末端氨基酸或单个标记的末端二肽。在一些实施例中,试剂盒进一步包括一种或多种结合剂,其中每种结合剂包括带有关于结合剂的识别信息的编码标签。在一些实施例中,试剂盒还包括用于将编码标签的识别信息转移至与附着于多肽的记录标签的试剂,其中,将识别信息转移至记录标签以在多肽上产生扩展记录标签。在一些实施例中,试剂盒还包括一种或多种扩增试剂,用于扩增扩展记录标签。在一些实施例中,试剂盒进一步包括一种或多种底物或载体。在一些实施例中,试剂盒还包括用于核酸测序分析的试剂。
19.附图的简要描述
20.将参考附图通过示例的方式描述本发明的非限制性实施例,这些附图是示意性的并且不意图按比例绘制。为了说明的目的,并非在每个附图中都标记了每个组件,在没有图示以使本领域的普通技术人员理解本发明的地方,也没有示出本发明的每个实施例的每个组件。
21.图.1a-1b是描绘通过本文提供的示例性修饰的切割酶去除单个修饰的氨基酸的示意图。在图.1a的左侧,衍生自二肽切割酶的示例性未修饰的切割酶从多肽的n-末端去除两个氨基酸,切割倒数第二个(p2)和倒数第三个氨基酸(p3)残基之间的键。在右侧,衍生自二肽切割酶的示例性修饰的切割酶从多肽的n-末端去除单个标记的氨基酸,切割标记的末端氨基酸(p1;菱形表示标记)和倒数第二个氨基酸残基之间的键(p2)。在图.1b的左侧,衍生自三肽切割酶的示例性未修饰的切割酶从多肽的n-末端去除了三个氨基酸,切割了c-末端至n-末端的倒数第三个氨基酸的键(在p3和p4之间)。在图.1b的右侧,两个示例性的修饰的切割酶衍生自三肽切割酶。在上边的,修饰的三肽切割酶从多肽的n-末端去除单个标记的氨基酸,切割标记的末端氨基酸(p1;菱形表示标记)和倒数第二个氨基酸残基(p2)之间的键。在下边的,修饰的三肽切割酶从多肽的n-末端去除标记的二肽(p1-p2),切割倒数第二个末端氨基酸残基(p2)和倒数第三个氨基酸残基(p3)之间的键。
22.如图.2a-2c是描绘使用修饰的切割酶去除末端氨基酸、和末端氨基酸标记的循环的示意图。如图.2a-2b所示,通过修饰的切割酶在末端氨基酸和倒数第二个氨基酸之间的键处切割具有标记的n-末端氨基酸残基的多肽,并释放标记的末端氨基酸。如图.2c所示,新的末端氨基酸被标记,并且修饰的切割酶能够识别新的标记的末端氨基酸以进一步切割和释放。
23.图.3描绘了用于标记n-末端氨基酸的不同示例性试剂的n-末端氨基酸(ntaa)转化效率。在溶液中测试了两种不同的肽:n-末端g(nt-g)=grfsgiy(seq id no:40);n-末端w(nt-w)=wtqifga(seq id no:41)。lc-ms用于定量转化效率。
24.如图.4a-4c描绘了来自weblogo分析的具有60%序列相似性或同一性的dap bii同源物的序列保守性的结果。每个堆栈(stack)的高度指示在该位置的序列保守性(以位为单位),堆栈中符号的高度反映指示位置(参考seq id no:20)中相应氨基酸的相对频率。
25.详细描述
26.本文提供了包括突变(例如,未修饰的切割酶中的一个或多个修饰)的修饰的切割酶以及选择,工程化和使用修饰的切割酶的相关方法。本文提供了标记多肽(例如,用化学试剂)和用修饰的切割酶处理标记的多肽以从多肽去除标记的末端氨基酸的方法。还提供了包括修饰的切割酶的试剂盒。在一些实施例中,包括修饰的切割酶的试剂盒用于处理肽,多肽和蛋白质,例如用于测序和/或分析。在一些实施例中,使用修饰的切割酶的蛋白质分析采用分子识别事件的条形码和核酸编码,和/或可检测标记。在一些实施例中,试剂盒还包括用于处理多肽的其他组分,包括标签(例如,dna标签或dna记录标签),固相载体,以及用于制备多肽的其他试剂和用于多肽分析的其他试剂。
27.通过水解肽键降解肽和蛋白质的各种酶(例如,氨基肽酶,二肽基肽酶,羧基肽酶,内肽酶)已经已经在许多生物体和从各种组织中分离和发现。然而,天然氨基肽酶具有有限的特异性,并通常以逐步方式消除氨基酸,一个接一个地消除一个氨基酸。一些底物特异性肽酶一次从肽的氨基末端或羧基末端特异性去除一个或两个氨基酸残基。
28.在一些实施例中,用于肽降解的方法可用于蛋白质分析和/或测序应用中。例如,肽测序可能涉及埃德曼降解,以通过一系列化学修饰和下游hplc分析或质谱分析实现肽上n-末端氨基酸的逐步降解。然而,通常,埃德曼降解肽测序可能会受到限制,例如,典型的埃德曼降解需要长时间培养高温和苛刻的化学条件(例如强酸;无水tfa)。在某些情况下,埃德曼降解可能与蛋白质分析方法的过程不兼容,其分析方法可能对苛刻的化学条件敏感,例如采用核酸(例如dna)的分析方法。
29.因此,仍然需要用于从多肽降解氨基酸的改良试剂和技术。例如,可能需要用于从多肽中去除,消除或切割氨基酸的酶促方法。本文提供了修饰的肽酶,其满足这样的需求。在一些实施例中,本文提供了用于从多肽去除氨基酸的酶促方法和试剂。在一些情况下,通过提供的修饰的酶(例如,切割酶)去除氨基酸,所述修饰的酶用于从多肽逐步降解氨基酸。在一些实施例中,通过提供的修饰的切割酶去除氨基酸,所述修饰的酶适合于从多肽中循环去除氨基酸。在一些实施例中,修饰的切割酶去除或配置为从自多肽中去除单个标记的末端氨基酸。在一些实施例中,修饰的切割酶从多肽c-末端或n-末端中去除的单个标记末端氨基酸。例如,修饰的切割酶被配置为切割多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的肽键。在一些实施例中,修饰的切割酶被配置为从多肽的c-末端或n-末端去除单个标记的二肽(末端和倒数第二末端氨基酸)。在一些实施例中,修饰的切割酶衍生自野生型或未修饰的切割酶(例如,二肽切割酶或三肽切割酶)。例如,未修饰的切割酶是分类为ec 3.4.14,ec 3.4.15,merops s8,merops s9,merops s33,merops s46,merops m49或merops s53的蛋白质或其功能同源物或片段。例如,修饰的切割酶衍生自野生型或未修饰的切割酶(例如,二肽基肽酶,二肽基氨基肽酶,肽基-二肽酶或二肽基羧基肽酶)。
30.在一些实施例中,仅当用标记修饰时,才可以将肽酶工程化为具有对特定末端氨基酸的特异性结合或催化活性。例如,与野生型或未修饰的切割酶相比,切割酶可以被工程化或修饰,使得其仅在被化学标记物标记的情况下才消除末端氨基酸。使用这种示例性方法,修饰的切割酶消除仅从多肽的末端标记的氨基酸,并允许以期望的方式控制降解。在一些实施例中,修饰的切割酶被配置为从多肽的c-末端或n-末端中去除单个标记的末端氨基
酸。在一些实施例中,修饰的切割酶被配置为从多肽的c-末端或n-末端去除单个标记的末端二肽(末端和倒数第二末端氨基酸)。在一些实施例中,修饰的切割酶对于氨基酸残基同一性方面是非选择性的,而对标记物是选择性的(例如,将去除任何标记的末端氨基酸)。在一些其他实施例中,修饰的切割酶对某些氨基酸残基或氨基酸类别(例如,在多肽的p1和/或p2末端位置处)表现出某些偏好。在一些情况下,可以组合使用对某些氨基酸(或氨基酸类别)具有不同偏好的两个或更多个修饰的切割酶。在一些实施例中,修饰的切割酶结合并去除来自多肽n-末端的氨基酸。在一些实施例中,修饰的切割酶结合并去除来自多肽c-末端的氨基酸。
31.在一些实施例中,可以修饰已知的肽酶以实现用于结合和/或切割的特定特征。修饰酶促n-末端氨基酸(ntaa)降解的特异性的模型的示例涉及将甲硫氨酸氨基肽酶转化为亮氨酸氨基肽酶(borgo et al.,protein sci.(2014)23(3):312-320)。在另一个实例中,将氨基肽酶突变体被工程化以结合并消除标记的(生物素化的)ntaa的单个或小的基团(参见,pct公开号wo2010/065322)。本文提供了经选择或修饰以去除标记的末端氨基酸的修饰的切割酶,例如多肽上的化学修饰的(例如,ptc/dnp/乙酰基/cbz修饰的)末端氨基酸。在一些实施例中,对野生型切割酶进行工程化(例如,使用基于结构功能的设计和/或定向进化)以仅切割或去除具有作为标记存在的ptc/dnp/乙酰基/cbz基团的n-末端氨基酸。在一些实例中,要去除的末端氨基酸是cbz标记的末端氨基酸。在一些实施例中,去除的标记的末端氨基酸作为单个氨基酸或作为二肽的一部分被去除。
32.在某些实施例中,将紧密的单体金属酶氨基肽酶工程化以识别和消除异硫脲或cbz标记的ntaa。在某些情况下,修饰的肽酶是金属肽酶,需要金属离子进行活化。在一些实施例中,单体金属氨基肽酶的使用具有两个主要优点:1)紧凑的单体蛋白更易于展示和使用噬菌体展示进行筛选;2)金属氨基肽酶具有独特的优势,因为可以通过添加或去除适当的金属阳离子来随意开启/关闭其活性。未修饰的切割酶可以来自任何合适的生物。在一些实例中,野生型或未修饰的切割酶来自哺乳动物(例如智人),真菌或酵母(例如酿酒酵母),或细菌(例如拟杆菌(bacteroides thetaiotaomicron),牙龈卟啉单胞菌,假单胞菌(pseudomonas sp.),墨西哥假单胞菌(pseudoxanthomonas mexicana)或深海热线菌(caldithrix abyssi)。在某些情况下,这些酶在室温下以及ph值在或约8.0的条件下是稳定,强健和有活性的,因此与肽分析优选的温和条件兼容。在一些实施例中,优选具有能够在升高的温度下去除标记的修饰的或末端的氨基酸的嗜热切割酶,以使肽的二级结构最小化。
33.在另一个实施例中,通过将肽酶(例如,切割酶)工程化为仅在末端氨基酸标记的存在下才具有活性,来实现氨基酸的循环消除或去除。在一些实施例中,标记是化学标记。在某些情况下,标签为或包括阻断或标记的氨基酸。在一些实施例中,标记物包括外源标记的或修饰的氨基酸。此外,肽酶可以被工程化为非特异性的,使得其不能选择性地识别一个特定的氨基酸,而是识别末端具有标记的任何氨基酸。在一些实施例中,修饰的切割酶对一个或多个,两个或多个,三个或多个,四个或多个,五个或多个,十个或多个,十五个或多个,二十个或多个等氨基酸具有选择性。
34.在一些实施例中,提供的修饰的切割酶用于处理从样品中获得的多肽。在一些情况下,用其他用于加工多肽的试剂处理样品和/或从样品获得的多肽,例如消化多肽。在一
些实施例中,多肽包括获自样品的多种多肽。在一些实施例中,样品获自受试者。
35.在下面的描述中阐述了许多具体细节,以便提供对本公开的透彻理解。提供这些细节是出于示例的目的,并且可以根据权利要求来实践所要求保护的主题,而无需这些特定细节中的一些或全部。应当理解,在不脱离所要求保护的主题的范围的情况下,可以使用其他实施例并且可以进行结构上的改变。应当理解,在一个或多个单独实施例中描述的各种特征和功能的适用性不限于描述它们的特定实施例。相反,它们可以被单独地或以某种组合地应用于本公开的一个或多个其他实施例,而不管是否描述了这样的实施例,以及这些特征是否被表示为所描述的实施例的一部分。为了清楚起见,没有详细描述在与所要求保护的主题有关的技术领域中已知的技术材料,从而不会不必要地使所要求保护的主题模糊。
36.本技术中提及的所有出版物,包括专利文件,科学文章和数据库,出于所有目的通过引用全文并入本文,其程度与每个单独出版物通过引用分别并入的程度相同。引用出版物或文档并不意味着承认它们中的任何一个都是相关的现有技术,也不构成对这些出版物或文档的内容或日期的任何承认。
37.所有标题都是为了方便读者,除非另有说明,否则不应将其用于限制标题后面的文字的含义。
38.定义
39.除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。如果本节规定的定义与通过引用并入本文的专利、申请、已发布申请和其他出版物中规定的定义相反或不一致,则本节规定的定义优先于通过引用并入本文的定义。
40.如本文所使用的,单数形式的“一个”,“一种”和“该”包括复数指示物,除非上下文另外明确指出。因此,例如,提及“一种肽”包括一个或多个肽,或肽的混合物。而且,除非在本文中使用特别说明或从上下文显而易见,否则术语“或”应理解为是包括性的,并且涵盖“或”和“与”两者。
41.如本文所用,术语“约”是指本技术领域的技术人员容易知道的各个值的通常误差范围。本文中对“约”值或参数的提及包括(并描述)针对该值或参数本身的实施例。例如,提及“约x”的描述包括“x”的描述。
42.本文中术语“抗体”以最广义使用,包括多克隆和单克隆抗体、包括完整抗体和功能性(抗原结合)抗体片段、包括片段抗原结合(fab)片段、f(ab')2片段、fab'片段、fv片段、重组igg(rigg)片段、包括单链可变片段(scfv)的单链抗体片段和单结构域抗体(例如、sdab、sdfv、纳米抗体)片段。该术语涵盖基因工程和/或其他形式的免疫球蛋白形式,例如体内抗体、肽抗体、嵌合抗体、完全人类抗体、人源化抗体和杂缀合物抗体、多特异性抗体、例如双特异性抗体、双抗体、三抗体和四抗体、串联di-scfv、串联tri-scfv。除非另有说明,否则术语“抗体”应理解为包括其功能性抗体片段。该术语还涵盖完整或全长抗体,包括任何类别或亚类的抗体,包括igg及其亚类、igm、ige、iga和igd。
[0043]“个体”或“受试者”包括哺乳动物。哺乳动物包括但不限于家养动物(例如牛,绵羊,猫,狗和马),灵长类动物(例如人和非人类灵长类动物,例如猴子),兔子和啮齿动物(例如小鼠和大鼠)。“个人”或“受试者”可包括鸟类(例如鸡),脊椎动物(例如鱼)和哺乳动物
(例如小鼠、大鼠、兔子、猫、狗、猪、牛、牛、牛、绵羊、山羊、马、猴子和其他非人类灵长类动物)。在某些实施例中,个体或受试者是人。
[0044]
如本文所用,术语“样品”是指可能包含需要对其进行分析物测定的分析物的任何物质。如本文所用,“样品”可以是溶液、悬浮液、液体、粉末、糊剂、水性、非水性或其任何组合。样品可以是生物样品,例如生物流体或生物组织。生物流体的例子包括尿液、血液、血浆、血清、唾液、精液、粪便、痰、脑脊髓液、眼泪、粘液、羊水等。生物组织是细胞的集合体,通常是特定种类的细胞及其细胞间物质,它们形成人,动物,植物,细菌,真菌或病毒结构的一种结构材料,包括结缔组织,上皮,肌肉和神经组织。生物组织的实例还包括器官,肿瘤,淋巴结,动脉和单个细胞。
[0045]
在一些实施例中,样品是生物样品。本公开的生物样品包括溶液、悬浮液、液体、粉末、糊剂、水性样品或非水性样品形式的样品。如本文所用,“生物样品”包括从活的或病毒(或朊病毒)来源或大分子和生物分子的其它来源获得的任何样品,并且包括受试者的任何细胞类型或组织,从所述受试者可以获得核酸、蛋白质和/或其它大分子。生物样品可以是直接从生物来源获得的样品或经过处理的样品。例如,扩增的分离核酸构成生物学样品。生物样品包括但不限于体液,例如血液,血浆,血清,脑脊液,滑液,尿液和汗液,动植物的组织和器官样品以及由此衍生的加工样品。在一些实施例中,样品可以衍生自组织或体液,例如结缔组织、上皮、肌肉或神经组织;例如、组织或体液。一种组织、选自脑、肺、肝、脾、骨髓、胸腺、心脏、淋巴液、血液、骨骼、软骨、胰腺、肾脏、胆囊、胃、肠、睾丸、卵巢、子宫、直肠、神经系统、腺体和内部血管;或选自血液、尿液、唾液、骨髓、精子、腹水及其亚组分的体液、例如血清或血浆。
[0046]
术语“水平”用于指靶标的存在和/或数量,例如,作为疾病或病症病因一部分的一种物质或一种生物,可以定性或定量地确定。靶标水平的“定性”改变是指从正常对照获得的样品中检测不到或存在的靶标出现或消失。当与健康对照相比时,一个或多个靶标水平的“定量”变化是指靶标水平的可测量的增加或减少。
[0047]
如本文所用,术语“多肽”涵盖肽和蛋白质,并且是指包括通过肽键连接的两个或更多个氨基酸的链的分子。在一些实施例中,多肽包括2至50个氨基酸,例如,具有多于20至30个氨基酸。在一些实施例中,肽不包括二级,三级或更高结构。在一些实施例中,多肽是蛋白质。在一些实施例中,蛋白质包括30个或更多个氨基酸,例如,具有超过50个氨基酸。在一些实施例中,除一级结构外,蛋白质还包括二级,三级或更高级结构。多肽的氨基酸最典型地是l-氨基酸,但也可以是d-氨基酸,修饰的氨基酸,氨基酸类似物,氨基酸模拟物或其任何组合。多肽可以是天然存在的,合成产生的或重组表达的。多肽可以合成产生,分离,重组表达或通过上述方法论的组合产生。多肽还可包括修饰氨基酸链的其他基团,例如,通过翻译后修饰添加的官能团。该聚合物可以是直链或支链的,它可以包括修饰的氨基酸,并且可以被非氨基酸中断。该术语还包括天然修饰或通过干预修饰的氨基酸聚合物。例如,二硫键的形成,糖基化,脂质化,乙酰化,磷酸化或任何其他操作或修饰,例如与标记组分的缀合。
[0048]
如本文所用,术语“氨基酸”是指包括胺基,羧酸基和对每个氨基酸特异的侧链的有机化合物,其用作肽的单体亚基。氨基酸包括20种标准氨基酸,天然氨基酸或规范氨基酸以及非标准氨基酸。标准的天然氨基酸包括丙氨酸(a或ala)、半胱氨酸(c或cys)、天冬氨酸(d或asp)、谷氨酸(e或glu)、苯丙氨酸(f或phe)、甘氨酸(g或gly)、组氨酸(h或his)、异亮氨
酸(i或ile)、赖氨酸(k或lys)、亮氨酸(l或leu)、蛋氨酸(m或met)、天冬酰胺(n或asn)、脯氨酸(p或pro))、谷氨酰胺(q或gln)、精氨酸(r或arg)、丝氨酸(s或ser)、苏氨酸(t或thr)、缬氨酸(v或val)、色氨酸(w或trp)和酪氨酸(y或tyr)。氨基酸可以是l-氨基酸或d-氨基酸。非标准氨基酸可以是天然存在或化学合成的修饰氨基酸,氨基酸类似物,氨基酸模拟物,非标准蛋白原氨基酸或非蛋白原氨基酸。非标准氨基酸的实例包括但不限于硒代半胱氨酸,吡咯赖氨酸,和n-甲酰基甲硫氨酸,β-氨基酸,同位氨基酸,脯氨酸和丙酮酸衍生物,3-取代的丙氨酸衍生物,甘氨酸衍生物,环-取代的苯丙氨酸和酪氨酸衍生物,线性核心氨基酸,n-甲基氨基酸。
[0049]
如本文所用,术语“翻译后修饰”是指在其翻译(例如,通过核糖体的翻译)完成之后在肽上发生的修饰。翻译后修饰可以是共价化学修饰或酶修饰。翻译后修饰的实例包括但不限于酰化、乙酰化、烷基化(包括甲基化)、生物素化、丁酰化、氨基甲酰化、羰基化、脱酰胺基、脱亚氨基、二苯甲酰胺形成、二硫键形成、消除、黄素附着、甲酰化、γ-羧化、谷氨酰化、糖基化(glycylation)、糖基化(glycosylation)、糖基磷脂酰肌醇化(glypiation)、血红素c附着、羟基化、乙酰化形成、碘化、异戊二烯基化、脂质化、脂酰化、丙二酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化、聚乙二醇化、磷酸戊二烯酰化、再磷酸化、预甲基化席夫碱形成、s-谷胱甘肽化、s-亚硝基化、s-亚磺酰化、硒化、琥珀酰化、硫化、泛素化和c-末端酰胺化。翻译后修饰包括肽的氨基末端和/或羧基末端的修饰。末端氨基的修饰包括但不限于:脱氨基,n-低级烷基,n-二-低级烷基和n-酰基修饰。末端羧基的修饰包括但不限于酰胺,低级烷基酰胺,二烷基酰胺和低级烷基酯修饰(例如,其中低级烷基为c
1-c4烷基)。翻译后修饰还包括落在氨基和羧基末端之间的氨基酸的修饰,例如但不限于上述修饰。术语翻译后修饰还可包括包括一种或多种可检测标记的肽修饰。
[0050]
如本文所用,术语“结合剂”是指与结合靶标(例如,多肽或多肽的组分或特征)结合、缔合、联合,识别或结合的核酸分子、肽、多肽、蛋白质、碳水化合物或小分子。结合剂可以与多肽或多肽的组分或特征形成共价缔合或非共价缔合。结合剂也可以是由两种或更多种类型的分子组成的嵌合结合剂,例如核酸分子-肽嵌合结合剂或碳水化合物-肽嵌合结合剂。结合剂可以是天然存在的,合成产生的或重组表达的分子。结合剂可以结合多肽的单个单体或亚基(例如,多肽的单个氨基酸)或结合多肽的多种连接的亚基(例如,二肽,三肽,或更长的肽,多肽或蛋白质分子的高阶肽)。结合剂可以结合线性分子或具有三维结构(也称为构象)的分子。例如,抗体结合剂可以结合线性肽,多肽或蛋白质,或结合构象肽,多肽或蛋白质。结合剂可结合至肽,多肽或蛋白质分子的n-末端肽,c-末端肽或中间肽。结合剂可以结合肽分子的n-末端氨基酸,c-末端氨基酸或中间氨基酸。相比未结合未修饰或未标记的氨基酸,结合剂可优选结合化学修饰或标记的氨基酸(例如,已被包括如本文所述的式(i)-(iv)中任一者的化合物的试剂标记的氨基酸)。例如,相比未结合未修饰或未标记的氨基酸,结合剂可以优选地与已经被标记或修饰的氨基酸结合。结合剂可以结合肽分子的翻译后修饰。结合剂可表现出与多肽成分或特征的选择性结合(例如,结合剂可选择性结合20个可能的天然氨基酸残基之一,并以非常低的亲和力或根本不结合其他19个氨基酸残基天然氨基酸残基)。结合剂可以表现出较少的选择性结合,其中结合剂能够结合或被配置为结合多肽的多种组分或特征(例如,结合剂可以以相似的亲和力结合至两个或更多个不同的氨基酸残留物)。结合剂可以包括编码标签,其可以通过接头与结合剂连接。
[0051]
如本文所用,术语“接头”是指用于连接两个分子的核苷酸,核苷酸类似物,氨基酸,肽,多肽,聚合物或非核苷酸化学部分中的一个或多个。接头可用于将结合剂与编码标签,记录标签与多肽,多肽与固相载体,记录标签与固相载体等连接。在某些实施例中,接头通过酶促反应或者化学反应连接两个分子(例如,点击化学)。
[0052]
本文所用的术语“配体”是指与本文所述的化合物连接的任何分子或部分。“配体”可以指附着于化合物的一种或多种配体。在一些实施例中,配体是侧基或结合位点(例如,结合剂结合的位点)。
[0053]
如本文所用,术语“蛋白质组”可以包括在任何时间由任何生物的基因组,细胞,组织或生物表达的整套蛋白质,多肽或肽(包括其缀合物或复合物)。一方面,它是在给定时间,在给定条件下在给定类型的细胞或生物中表达的蛋白质的集合。蛋白质组学是对蛋白质组的研究。例如,“细胞蛋白质组”可以包括在特定的一组环境条件下(例如暴露于激素刺激下)在特定细胞类型中发现的蛋白质的集合。生物体的完整蛋白质组可能包括来自所有各种细胞蛋白质组的蛋白质的完整集合。蛋白质组还可以包括某些亚细胞生物系统中蛋白质的集合。例如,病毒中的所有蛋白质都可以称为病毒蛋白质组。如本文所用,术语“蛋白质组”包括蛋白质组的子集,包括但不限于激酶组;分泌组;受体组(例如,gpcrome);免疫蛋白质组;营养蛋白质组;通过翻译后修饰(例如,磷酸化,泛素化,甲基化,乙酰化,糖基化,氧化,脂质化和/或亚硝基化)定义的蛋白质组子集,例如磷酸化蛋白质组(例如,磷酸酪氨酸蛋白质组,酪氨酸蛋白质组和酪氨酸磷酸化蛋白质组),糖蛋白组等;与组织或器官,发育阶段或生理或病理状况相关的蛋白质组子集;与细胞过程有关的蛋白质组子集,例如细胞周期,分化(或去分化),细胞死亡,衰老,细胞迁移,转化或转移;或其任何组合。如本文所用,术语“蛋白质组学”是指对蛋白质组在细胞,组织和体液内的定量分析,以及蛋白质组在细胞内和组织内的相应空间分布。此外,蛋白质组学研究还包括蛋白质组的动态状态,其随生物学和特定的生物学或化学刺激而不断变化的时间。
[0054]
具有游离氨基的肽或多肽链的一端的末端氨基酸在本文中被称为“n-末端氨基酸”(ntaa)。在链的另一端具有游离羧基的末端氨基酸在本文中被称为“c-末端氨基酸”(ctaa)。构成肽的氨基酸可以按顺序编号,其中肽的长度为“n”个氨基酸。如本文所用,ntaa被认为是第n个氨基酸(本文也称为“n ntaa”)。使用此命名法,下一个氨基酸是n-1个氨基酸,然后是n-2个氨基酸,依此类推,即从n-末端到c-末端沿着肽段的长度递减。在某些实施例中,ntaa,ctaa或两者可以被修饰或用部分或化学部分标记。
[0055]
如本文所用,术语“条形码”是指约2至约30个碱基(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个碱基)的核酸分子,其提供多肽、结合剂、来自结合循环的结合剂集合、样品多肽、样品组、隔室内的多肽(例如,小滴、珠或分开的位置)、隔室内的多肽、多肽组分(fraction)组、空间区域或空间区域组、多肽文库或结合剂文库的独特标识符标签或来源信息。条形码可以是人工序列或自然存在的序列。在某些实施例中,一组条形码中的每个条形码是不同的。在其他实施例中,条形码群中的一部分条形码是不同的,例如,在条形码群中至少约10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或99%的条形码是不同的。条形码的数量可以是随机生成的,也可以是非随机生成的。在某些实施例中,条形码群是纠错条形码。条形码可用于对解复用的测序数据进行反卷积运算,并
识别衍生自单个多肽,样品,文库等的序列读数。条形码还可用于对已分布到小隔室中的多肽集合进行反卷积以增强映射。例如,不是将肽映射回蛋白质组,而是将肽映射回其起源的蛋白质分子或蛋白质复合物。
[0056]
如本文所用,术语“编码标签”是指具有任何合适的长度的多核苷酸,例如,约2个碱基至约100个碱基的核酸分子,包括包括2和100以及其间的任何整数,其包括其相关联的结合剂的识别信息。“编码标签”也可以由“可测序的聚合物”制成(参见,例如,niu et al.,2013,nat.chem.5:282-292;roy et al.,2015,nat.commun.6:7237;lutz,2015,macromolecules 48:4759-4767;其中的每一个都通过引用整体并入)。编码标签可以包括编码器序列,其任选地在一侧上侧接一个间隔子,或者可选地在每一侧上侧接间隔子。编码标签还可以包括可选的umi和/或可选的结合循环(binding cycle)特定的条形码。编码标签可以是单链或双链的。双链编码标签可包括平末端,突出末端或两者。编码标签可以指直接附着于结合剂的编码标签,指与直接附着于结合剂的编码标签杂交的互补序列(例如,用于双链编码标签),或指存在于扩展记录标签的编码标签信息。在某些实施例中,编码标签可以进一步包括结合循环特异性间隔子或条形码,唯一分子标识符,通用引发位点或其任何组合。
[0057]
如本文所用,术语“间隔子”(sp)是指长度约1个碱基至约20个碱基(例如1、2、3、4、5、6、7、8、9、10、11,12、13、14、15、16、17、18、19或20个碱基)的核酸分子,其出现在记录标签或编码标签的末端。在某些实施例中,间隔子序列侧接于编码标签的编码器序列一端或两端。结合剂与多肽结合后,分别在其相关联的编码标签和记录标签上的互补间隔子序列之间进行退火,可以通过引物延伸反应或连接将结合信息转移至记录标签,编码标签或双标签结构。sp'是指与sp互补的间隔子序列。优选地,结合剂文库中的间隔子序列具有相同数目的碱基。可以在结合剂库中使用通用(共享或相同)的间隔子。间隔子序列可以具有“循环特异性”序列,以便追踪在特定结合循环中使用的结合剂。间隔子序列(sp)在所有结合循环中可以是恒定的,对于特定类别的多肽是特异性的,或者可以是结合循环数特异性的。多肽类别特异性间隔子允许存在于来自完整的结合/延伸循环的扩展记录标签中的同源结合剂的编码标签信息与在后续结合循环中通过类别特异性间隔子识别相同类别多肽的另一结合剂的编码标签退火。只有正确的同源对的顺序结合才能导致相互作用的间隔子元件和有效的引物延伸。间隔子序列可以包括足够数量的碱基,以与记录标签中的互补间隔子序列退火,以启动引物延伸(也称为聚合酶延伸)反应,或为连接反应提供“夹板(splint)”,或介导“粘性末端”的连接反应。间隔子序列可以包括比编码标签内的编码器序列数量更少的碱基。
[0058]
如本文所用,术语“记录标签”是指部分(例如,化学偶联部分),核酸分子或可测序的聚合物分子(参见例如,niu et al.,2013,nat.chem.5:282-292;roy et al.,2015,nat.commun.6:7237;lutz,2015,macromolecules 48:4759-4767;其中的每一个都通过引用整体并入),可以将编码标签的识别信息转移到该标签,或者可以将与记录标签相关联的大分子的识别信息(例如umi信息)从该标签转移到该编码标签。识别信息可以包括表征分子的任何信息,例如与样品,组分(fraction),分区,空间位置,相互作用的相邻分子,循环数等有关的信息。此外,umi信息的存在也可以归类为识别信息。在某些实施例中,在结合剂与多肽结合之后,来自与结合剂连接的编码标签的信息可在结合剂与多肽结合之时被转移
至与多肽相关联的记录标签。在其他实施例中,在结合剂与多肽结合之后,来自与多肽相关联的记录标签的信息可在结合剂与多肽结合之时被转移至与结合剂连接的编码标签。编码标签可以直接连接至多肽,可以通过多功能接头与多肽连接,也可以由于其在固相载体上的邻进性(或共定位性)而与多肽结合。记录标签可以通过其5'端或3'端或内部位置链接,只要该链接与用于将编码标签信息传输到记录标签的方法兼容,反之亦然。记录标签可以进一步包括其他功能组件,例如,通用引发位点,唯一分子标识符,条形码(例如样品条形码,组分条形码,空间条形码,隔室标签等),间隔子序列,其与编码标签的间隔子序列互补的序列,或其任何组合。在其中聚合酶延伸用于将编码标签信息转移至记录标签的实施例中,记录标签的间隔子序列优选在记录标签的3'末端。
[0059]
如本文所用,术语“引物延伸”,也称为“聚合酶延伸”,是指由核酸聚合酶(例如,dna聚合酶)催化的反应,由此退火到互补链的核酸分子(例如,寡核苷酸引物、间隔子序列)以互补链为模板由聚合酶延伸。
[0060]
如本文所用,术语“唯一分子标识符”或“umi”是指长度约3至约40个碱基的核酸分子(3、4、5、6、7、8、9、10、11、12、13,14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个碱基)提供了每个与umi连接的大分子,多肽或结合剂的唯一标识符标签。多肽umi可用于对来自多个扩展记录标签的测序数据进行计算反卷积,以鉴定源自单个多肽的扩展记录标签。通过将ngs读段折叠为唯一的umi,可以使用多肽umi准确地计数起源的多肽分子。结合剂umi可用于鉴定与特定多肽结合的每个单独的分子结合剂。例如,umi可用于识别对于特定肽分子发生的对单个氨基酸的特异性结合剂的单个结合事件的数目。应当理解,当在结合剂或多肽的上下文中均提及umi和条形码时,条形码指的是除单个结合剂或多肽的umi以外的识别信息(例如,样品条形码,隔室条形码,结合循环条码)。
[0061]
如本文所用,术语“通用引发位点”或“通用引物”或“通用引发序列”是指可以用于文库扩增和/或用于测序反应的核酸分子。通用引发位点可包括但不限于用于pcr扩增的引发位点(引物序列),与可在某些下一代测序平台中进行桥扩增的流通池表面上的互补寡核苷酸退火的流通池衔接子序列,测序引发位点,或其组合。通用引发位点可用于其他类型的扩增,包括通常与下一代数字测序结合使用的那些。例如,扩展记录标签分子可以被环化(circularized),并且通用引发位点用于滚环扩增以形成可用作测序模板的dna纳米球(drmanac et al.,2009,science 327:78-81)。或者,记录标签分子可通过从通用引发位点通过聚合酶延伸直接环化并直接测序(korlach et al.,2008,proc.natl.acad.sci.105:1176-1181)。当与“通用引发位点”或“通用引物”一起使用时,术语“正向”也可以称为“5”或“有义”。当与“通用引发位点”或“通用引物”一起使用时,术语“反向”也可以称为“3'”或“反义”。
[0062]
如本文所用,术语“扩展记录标签”是指在结合剂与多肽结合之后至少一种结合剂的编码标签(或其互补序列)的信息已被转移至的记录标签。编码标签的信息可以直接(例如,连接)或间接(例如,引物延伸)转移到记录标签。编码标签的信息可以酶或化学方式转移至记录标签。扩展记录标签可以包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65,70、75、80、85、90、95、100、125、150、175、200或更多编码标签的结合剂信息。扩展
记录标签的碱基序列可以反映由其编码标签识别的结合剂的结合的时间和序列顺序(sequential order),可以反映由编码标签识别的结合剂的结合的部分序列顺序,或者可以不反映任何由编码标签识别的结合剂的结合顺序。在某些实施例中,扩展记录标签中存在的编码标签信息表示至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性所分析的多肽序列。在某些扩展记录标签不代表以100%同一性分析多肽序列的某些实施例中,错误可能是由于结合剂脱靶结合或“缺失”结合循环(例如,由于结合剂由于引物延伸反应失败,或在结合周期中未能结合至多肽),或两者兼而有之。
[0063]
如本文所用的,术语“扩展编码标签”是指至少一个记录标签(或其互补序列)的信息在与编码标签连接的结合剂结合到与记录标签相关联的多肽之后被转移到其上的编码标签。记录标签的信息可以直接(例如,连接)或间接(例如,引物延伸)转移到编码标签。记录标签的信息可以酶或化学方式转移。在某些实施例中,扩展的编码标签包括反映一个结合事件的一个记录标签的信息。如本文所用,术语“双标签”或“双标签构建体”或“双标签分子”是指至少一个记录标签(或其互补序列)和至少一个编码标签(或其互补序列)的信息,在与编码标签连接的结合剂结合到与记录标签相关联的多肽之后被转移到其上的核酸分子。记录标签和编码标签的信息可以间接地转移到双标签(例如,引物延伸)。记录标签的信息可以酶或化学方式转移。在某些实施例中,双标签包括记录标签的umi,记录标签的隔室标签,记录标签的通用引发位点,编码标签的umi,编码标签的编码器序列,结合循环特定条形码,编码标签的通用引发位点或其任何组合。
[0064]
如本文所用,术语“固相载体”,“固体表面”或“固体底物”或“测序底物”或“底物”是指多肽所针对的任何固体材料,包括多孔和无孔材料。可以通过本领域已知的任何方式直接或间接缔合,包括共价和非共价相互作用,或其任何组合。固相载体可以是二维的(例如,平面)或三维的(例如,凝胶基质或珠子)。固相载体可以是任何载体表面,包括但不限于珠、微珠、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、ptfe膜、ptfe膜、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、尼龙、硅晶片芯片、流通芯片、流通池、包括信号转导电子器件的生物芯片、通道、微量滴定孔、elisa板、旋转干涉仪圆盘、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、聚合物基质、纳米颗粒或微球。固相载体的材料包括但不限于丙烯酰胺、琼脂糖、纤维素、右旋糖酐、硝酸纤维、玻璃、金、石英、聚苯乙烯、聚乙酸乙烯酯、聚丙烯、聚酯、聚甲基丙烯酸酯、聚丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、聚乙烯醇(pva)、聚四氟乙烯、碳氟化合物、尼龙、硅橡胶、聚酸酐、聚乙醇酸、聚氯乙烯、聚乳酸、聚原酸酯、官能化硅烷、聚丙莫酸酯、胶原蛋白、糖胺聚糖、聚氨基酸、右旋糖酐或其任意组合。固相载体进一步包括薄膜、膜、瓶、盘、纤维、编织纤维、成形聚合物、例如管、颗粒、珠、微球、微粒或其任何组合。例如,当固体表面是珠子时,该珠子可以包括但不限于陶瓷珠子、聚苯乙烯珠子、聚合物珠子、聚丙烯酸酯珠子、甲基苯乙烯珠子、琼脂糖珠子、纤维素珠子、右旋糖酐。珠、丙烯酰胺珠、实心珠、多孔珠、顺磁性珠、玻璃珠、可控孔珠、二氧化硅基珠或它们的任意组合。珠子可以是球形的或不规则形状的。珠子或载体可以是多孔的。珠子的尺寸可以在纳米级(例如100nm)至毫米级(例如1mm)的范围内。在某些实施例中,珠的尺寸范围为约0.2微米至约200微米,或约0.5微米至约5微米。在一些实施例中,珠子的直径可以是大约1、1.5、2、2.5、2.8、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、15或20微米。在某些实
施例中,“珠子”固相载体可以指单个珠子或多个珠子。在一些实施例中,固体表面是纳米颗粒。在某些实施例中,纳米颗粒的尺寸范围为直径约1nm至约500nm、例如介于约1nm至约20nm、介于约1nm至约50nm、介于约1nm至约100nm、介于约10nm至约50nm之间、介于约10nm至约100nm之间、介于约10nm至约200nm之间、介于约50nm至约100nm之间、介于约50nm至约150之间、介于约50nm至约200nm、介于约100nm与约200nm之间、或介于约200nm与约500nm之间。在一些实施例中,纳米颗粒的直径可以为约10nm、约50nm、约100nm、约150nm、约200nm、约300nm或约500nm。在一些实施例中,纳米颗粒的直径小于约200nm。
[0065]
如本文所用,术语“核酸分子”或“多核苷酸”是指含有通过3'-5'磷酸二酯键连接的脱氧核糖核苷酸或核糖核苷酸的单链或双链多核苷酸,以及多核苷酸类似物。核酸分子包括但不限于dna,rna和cdna。多核苷酸类似物可以具有除天然多核苷酸中发现的标准磷酸二酯键以外的主链,以及任选地具有除核糖或脱氧核糖以外的修饰的糖部分或多个部分。多核苷酸类似物包括能够通过watson-crick碱基配对与标准多核苷酸碱基氢键合的碱基,其中类似物主链以允许在寡核苷酸类似分子和标准多核苷酸中的碱基之间以序列特异性方式形成这种氢键的方式呈现碱基。多核苷酸类似物的例子包括但不限于异种核酸(xna)、桥连核酸(bna)、二醇核酸(gna)、肽核酸(pna)、γpnas、吗啉代多核苷酸、锁核酸(lna)、苏糖核酸(tna)、2'-o-甲基多核苷酸、2'-o-烷基核糖基取代的多核苷酸、硫代磷酸酯多核苷酸和硼酸磷酸酯多核苷酸。多核苷酸类似物可具有嘌呤或嘧啶类似物、包括例如7-脱氮嘌呤类似物、8-卤代嘌呤类似物、5-卤代嘧啶类似物或可与任何碱基配对的通用碱基类似物、包括次黄嘌呤、硝基唑、异卡比丁酮类似物、唑羧酰胺、芳香族三唑类似物或具有其他功能的碱基类似物、例如用于亲和结合的生物素部分。在一些实施例中,核酸分子或寡核苷酸是修饰的寡核苷酸。在一些实施例中,核酸分子或寡核苷酸是具有伪互补碱基的dna、具有受保护碱基的dna、rna分子、bna分子、xna分子、lna分子、pna分子、γpna分子或吗啉代dna或其组合。在一些实施例中,核酸分子或寡核苷酸是主链修饰的,糖修饰的或核碱基修饰的。在一些实施例中,核酸分子或寡核苷酸具有核碱基保护基团例如alloc,亲电保护基团例如硫烷,乙酰基保护基团,硝基苄基保护基团,磺酸盐保护基团或传统的碱基不稳定的保护基。
[0066]
如本文所用,“核酸测序”是指确定核酸分子或核酸分子样品中核苷酸的顺序。
[0067]
如本文所用,“下一代测序”是指允许并行测序数百万至数十亿个分子的高通量测序方法。下一代测序方法的实例包括合成测序,连接测序,杂交测序,polony测序,离子半导体测序和焦磷酸测序。通过将引物附着到固体底物上,并将互补序列连接到核酸分子上,可以通过引物将核酸分子与固体底物杂交,然后可以使用聚合酶扩增在固体底物的离散区域中产生多个拷贝(这些分组有时称为聚合酶菌落或克隆)。因此,在测序过程中,可以对特定位置的核苷酸进行多次测序(例如数百或数千次)

这种覆盖深度称为“深度测序”。高通量核酸测序技术的示例包括illumina、bgi、qiagen、thermo-fisher和roche提供的平台、包括诸如平行磁珠阵列、通过合成进行测序、通过连接进行测序、毛细管电泳、电子微芯片、“生物芯片”、微阵列、平行微芯片和单分子阵列(参见例如,service,science(2006)311:1544-1546)。
[0068]
如本文所用,“单分子测序”或“第三代测序”是指下一代测序方法,其中通过对单个dna分子进行测序来产生来自单分子测序仪器的读数。与依靠扩增来并行克隆许多dna分
子以分阶段进行测序的下一代测序方法不同,单分子测序可以询问dna的单分子,并且不需要扩增或同步。单分子测序包括在每个碱基掺入后需要暂停测序反应的方法(“洗涤和扫描”循环)和不需要在读取步骤之间停止的方法。单分子测序方法的示例包括单分子实时测序(pacific biosciences),基于纳米孔的测序(oxford nanopore),双重中断纳米孔测序以及使用高级显微镜技术对dna进行直接成像。
[0069]
如本文所用,“分析”多肽是指鉴定,检测,定量,表征,区分或其组合,多肽的全部或部分组分。例如,分析肽,多肽或蛋白质包括确定肽的全部或部分氨基酸序列(连续或非连续)。分析多肽还包括多肽成分的部分鉴定。例如,多肽蛋白质序列中氨基酸的部分鉴定可以识别蛋白质中的氨基酸属于可能的氨基酸的子集。分析通常从对n ntaa的分析开始,然后进行到肽的下一个氨基酸(即n-1,n-2,n-3等)。这是通过消除n ntaa,从而将肽的n-1氨基酸转化为n-末端氨基酸(在本文中称为“n-1ntaa”)来实现的。分析肽还可以包括确定肽上翻译后修饰的存在和频率,其可以包括或可以不包括关于肽上翻译后修饰的序列顺序的信息。分析肽还可以包括确定肽中表位的存在和频率,其可以包括或可以不包括关于表位在肽内的序列顺序或位置的信息。分析肽可以包括组合不同类型的分析,例如获得表位信息,氨基酸序列信息,翻译后修饰信息或其任何组合。
[0070]
本文所用的术语“未修饰的”(也称为“野生型”或“天然的”)与诸如核酸分子和蛋白质(例如,切割酶)之类的生物材料关联,是指在自然界中发现且人为干预修饰的。
[0071]
所用的术语“修饰的”(或“变异”或“突变”)关于核酸分子和蛋白质,例如,通过人为干预产生的修饰的切割酶。变异,突变或修饰的切割酶是相对于未修饰的或野生型切割酶具有改变了的氨基酸序列的多肽。变异或修饰的切割酶是与野生型切割酶序列的不同之处在于一个或多个氨基酸取代,缺失,添加或其组合的多肽。与野生型切割酶相比,变异,突变或修饰的切割酶可包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多的氨基酸差异(例如,突变)。变异或修饰的切割酶多肽通常表现出与相应的野生型或未修饰的切割酶具有至少50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。非天然存在的氨基酸以及天然存在的氨基酸都包括在允许的取代或添加的范围内。变异,突变体或修饰的切割酶不限于通过特定的制备方法制备或产生的任何变体,突变体或修饰的切割酶,包括例如通过遗传选择,蛋白质工程,定向进化,从头重组dna技术(de novo recombinant dna techniques)或其组合来制备或产生的任何变体,突变体或修饰的切割酶。突变,变异或修饰的切割酶多肽通过氨基酸残基的取代,添加或缺失来改变一级氨基酸序列。在变异或修饰的切割酶的上下文中,术语“变体”不解释为对产生变体或修饰的切割酶的任何特定起始组合物或方法施加任何条件。因此,变异或修饰的切割酶表示组合物,不一定表示通过任何给定方法产生的产物。可以采用多种技术,包括遗传选择,蛋白质工程,重组方法,化学合成或其组合。
[0072]
术语“对应于”是指蛋白质、多肽或多核苷酸的位置或蛋白质、多肽或多核苷酸内的位置,例如核苷酸或氨基酸位置“对应于”公开序列中的核苷酸或氨基酸位置的叙述,例如序列表中所示,是指基于结构序列比对或使用标准比对算法例如gap算法,在与公开序列比对后鉴定的核苷酸或氨基酸位置。例如,可以通过如本文所述的结构比对方法,通过与参考序列如seq id no:5-8、10-16、20所示的比对,确定相应的残基。通过比对序列,本领域技
术人员可以例如使用保守且相同的氨基酸残基作为指导来鉴定相应的残基。
[0073]
如本文所用,结构域(例如氨基酸残基的序列)是指分子的一部分,例如蛋白质或编码核酸,其在结构和/或功能上与分子的其他部分不同并且是可识别的。例如,结构域包括多肽链的那些部分,其可以在由一个或多个结构基序组成的蛋白质内形成独立折叠的结构和/或由于功能活性(例如结合活性而被识别。蛋白质可以具有一个或多个不同的结构域。例如,可以通过一级序列或结构与相关家族成员的同源性,例如与基序的同源性,来鉴定,定义或区分结构域。在另一个实例中,结构域可以通过其功能来区分,例如其与分子(例如同源结合伴侣)的相互作用的能力。结构域独立地可以表现出生物学功能或活性,使得该结构域独立地或与另一分子稠合可以进行活性,例如结合。结构域可以是氨基酸的线性序列或氨基酸的非线性序列。许多多肽包括多种结构域。这样的结构域是已知的,并且可以被本领域技术人员鉴定。为了此处的示例,提供了定义,但是应理解,在本领域技术范围内通过名称识别特定结构域。如果需要,可以使用适当的软件来标识结构域。
[0074]
如本文所用,术语“序列同一性”是指分别在核苷酸或氨基酸水平上的基因或蛋白质之间的序列同一性。“序列同一性”是在氨基酸水平上的蛋白质之间的同一性的度量,以及在核苷酸水平上的核酸之间的同一性的度量。当序列比对时,可以通过比较每个序列中给定位置的氨基酸序列来确定蛋白质序列同一性。类似地,当序列比对时,可以通过比较每个序列中给定位置的核苷酸序列来确定核酸序列同一性。用于比较的序列比对的方法是本领域众所周知的,这些方法包括gap,bestfit,blast,fasta和tfasta。blast算法计算序列同一性百分比,并对两个序列之间的相似性进行统计分析。可通过国家生物技术信息中心(ncbi)网站公开获得进行blast分析的软件。
[0075]
如本文所用,术语“烷基”是指并包括具有指定碳原子数(即,c
1-c
10
或c
1-10
表示1至10个碳)的饱和的直链和支链一价烃结构及其组合。特定的烷基是具有1至20个碳原子的那些(“c
1-c
20
烷基”)。更特别的烷基是具有1至8个碳原子(“c
1-c8烷基”),3至8个碳原子(“c
3-c8烷基”),1至6个碳原子(“c
1-c6烷基”),1至5个碳原子(“c
1-c5烷基”)或1至4个碳原子(“c
1-c4烷基”)的烷基,除非另外特别说明,否则烷基实例包括但不限于,诸如甲基,乙基,正丙基,异丙基,正丁基,叔丁基,异丁基,仲丁基,例如正戊基,正己基,正庚基,正辛基等的同系物和异构体的基团。
[0076]
本文所用的“烯基”是指不饱和的直链或支链一价烃链或其组合,其具有至少一个烯键式不饱和位点(即,具有至少一个式c=c的部分)并且具有所指定的碳原子数(即,c
2-c
10
表示2至10个碳原子)。烯基可以为“顺式”或“反式”构型,或者为“e”或“z”构型。特定的烯基是具有2至20个碳原子的那些(“c
2-c
20
烯基”),具有2至8个碳原子(“c
2-c8烯基”),具有2至6个碳原子的那些(“c
2-c6烯基”)。或具有2-4个碳原子(“c
2-c4烯基”)。烯基的实例包括但不限于诸如乙烯基(或乙烯基),丙-1-烯基,丙-2-烯基(或烯丙基),2-甲基丙-1-烯基,丁-1-烯基,丁-2-烯基,丁-3-烯基,丁-1,3-二烯基,2-甲基丁-1,3-二烯基,其同系物和异构体等。
[0077]
术语“氨基烷基”是指被一个或多个-nh2基团取代的烷基。在某些实施例中,氨基烷基被1、2、3、4、5或更多个-nh2基团取代。氨基烷基可任选被一个或多个本文所述的其他取代基取代。
[0078]
如本文所用,“芳基”或“ar”是指具有单个环(例如,苯基)或多个稠和的环(例如,
萘基或蒽基)的不饱和芳族碳环基,所述稠和的环可以是或可以不是芳族的。在一个变体中,芳基包括6至14个环状碳原子。具有一个以上环的芳基基团可以在芳族环位置或在非芳族环位置连接至母体结构,其中至少一个环为非芳族。在一个变体中,具有一个以上环的芳基基团在芳族环位置连接至母体结构,其中至少一个环是非芳族的。在一些实施例中,苯基是优选的芳基基团。
[0079]
如本文所用,术语“芳基烷基”是指经由如本文定义的烷基与母体分子部分附加的如本文定义的芳基基团。芳基烷基的代表性实例包括但不限于苄基,2-苯乙基,3-苯丙基,2-萘-2-基乙基等。
[0080]
如本文所用,术语“环烷基”是指并包括环状一价烃结构,其可以是完全饱和的,单不饱和或多不饱和的,但是是非芳香族的,具有指定的碳原子数(例如,c
1-c
10
表示1到10个碳)。环烷基可以由一个环(如环己基)组成,或由多个环(如金刚烷基)组成,但不包括芳基。包括多于一个环的环烷基可以是稠合的,螺环或桥连的,或它们的组合。在一些实施例中,环烷基是具有3至13个环状碳原子的环烃。在一些实施例中,环烷基是具有3至8个环状碳原子的环烃(“c
3-c8环烷基”)。环烷基的实例包括但不限于环丙基,环丁基,环戊基,环己基,1-环己烯基,3-环己烯基,环庚基,降冰片基等。
[0081]
如本文所用,“卤素”代表氯,氟,溴或碘。术语“卤代”表示氯,氟,溴或碘。
[0082]
术语“卤代烷基”是指如上所述的烷基,其中烷基基团上的一个或多个氢原子已被卤素取代。此类基团的实例包括但不限于氟烷基,例如氟乙基,三氟甲基,二氟甲基,三氟乙基等。
[0083]
如本文所用,术语“杂芳基”是指并包括具有1至10个环状碳原子和至少一个环状杂原子的不饱和芳族环状基团,包括但不限于诸如氮,氧和硫的杂原子,其中氮和硫原子被任选地氧化,并且氮原子被任选地季铵化。应当理解,杂芳基环中杂原子的选择和顺序必须符合标准化合价要求并提供芳族环特征,并且还必须提供对于在本文所述的反应中使用而言足够稳定的环。通常,杂芳基环具有5-6个环原子和1-4个杂原子,除非另外说明,否则它们选自n,o和s;双环杂芳基基团包括两个5-6元环,它们共享一个键并包括选自n,o和s的至少一个杂原子和至多5个作为环成员。杂芳基基团可以在环状碳或环状杂原子处附着于分子的其余部分,在这种情况下,杂原子通常为氮。杂芳基可包括另外的稠合环(例如1至3个环),包括另外的稠合芳基,杂芳基,环烷基和/或杂环基环。杂芳基的实例包括但不限于吡唑基,咪唑基,三唑基,吡咯基,吡啶基,嘧啶基,吡嗪基,哒嗪基,三嗪基,噻吩基,呋喃基,噻唑基等。
[0084]
如本文所用,术语“杂环(heterocycle)”,“杂环(heterocyclic)”或“杂环基”是指具有1至10个环状碳原子和1至4个环状杂原子的饱和或不饱和非芳族基团,例如氮,硫或氧等,其中氮和硫原子被任选地氧化,并且氮原子被任选地季铵化。杂环基可以具有一个环或多个稠合环,但不包括杂芳基。包括多于一个环的杂环可以是稠合的,螺环的或桥连的,或其任何组合。在稠合环系统中,一个或多个稠合环可以是芳基或杂芳基。杂环基的实例包括但不限于四氢吡喃基,二氢吡喃基,哌啶基,哌嗪基,吡咯烷基,噻唑啉基,噻唑烷基,四氢呋喃基,四氢噻吩基,2,3-二氢苯并[b]噻吩-2-基,4-氨基-2-氧嘧啶-1(2h)-基等。
[0085]
术语“取代的”是指指定的基团或部分带有一个或多个取代基代替未取代基团的氢原子,取代基包括但不限于,例如烷氧基,酰基,酰氧基,羰基烷氧基,酰基氨基,氨基,氨
基酰基,氨基羰基氨基,氨基羰基氧基,环烷基,环烯基,芳基,杂芳基,芳氧基,氰基,叠氮基,卤素,羟基,硝基,羧基,硫醇,硫代烷基,环烷基,环烯基,烷基,烯基,炔基,杂环基,芳烷基,氨基磺酰基,磺酰基氨基,磺酰基,氧代,羰基亚烷基烷氧基等。术语“未取代的”是指指定的基团不带有取代基。术语“任选地被取代”是指指定的基团未被取代或被一个或多个取代基取代,因此包括该基团的取代和未取代的形式。在使用术语“取代的”来描述结构系统时,该取代意在发生在系统上的任何化合价允许位置。
[0086]
如本领域中众所周知的,本文描述或描绘的结构可能能够形成多个互变异构体。存在的特定互变异构体通常取决于溶剂,ph和其他环境因素以及结构本身。此处显示一个互变异构的例子,其中至少可以绘制三种不同的互变异构体来代表一种化合物:
[0087][0088]
当化合物能以不止一种互变异构体形式存在时,通常描绘或描述一种互变异构体,并且应理解该结构为代表每种稳定的互变异构体以及互变异构体的混合物。特别地,被羟基或胺基取代的胍基和杂芳基通常能够存在于多个互变异构体中,并且一个互变异构体的描述或描绘应理解为包括同一化合物的其他互变异构体。
[0089]
应当理解,本文所述的本发明的方面和实施例包括“由...组成”和/或“基本上由...构成”。
[0090]
在整个本公开中,以范围格式呈现了本发明的各个方面。应当理解,范围格式的描述仅是为了方便和简洁,而不应被解释为对本发明范围的不灵活的限制。因此,应该认为范围的描述已经具体公开了所有可能的子范围以及该范围内的各个数值。例如,对范围从1到6的描述应视为已明确公开的子范围如从1到3,从1到4,从1到5,从2到4,从2到6,3到6等,以及该范围内的单个数字,例如1、2、3、4、5和6。无论范围的广度如何,这都适用。
[0091]
通过以下结合附图的说明,本发明的其他目的,优点和特征将变得显而易见。
[0092]
i.修饰的切割
[0093]
本文提供一种修饰的切割酶,其包括突变,例如未修饰的切割酶中的一个或多个氨基酸修饰,其中所述修饰的切割酶衍生自二肽切割酶并且从多肽中去除或配置为去除单个标记的末端氨基酸。本文提供一种修饰的切割酶,其包括突变,例如未修饰的切割酶中的一个或多个氨基酸修饰,其中所述修饰的切割酶衍生自三肽切割酶并且从多肽中去除或配置为去除单个标记的末端氨基酸或单个标记的末端二肽。在一些实施例中,修饰的切割酶被配置为从多肽的c-末端或n-末端去除单个标记的末端氨基酸。在一些实施例中,修饰的切割酶被配置为从多肽的c-末端或n-末端去除单个标记的二肽(末端和倒数第二末端氨基酸)。在一些实施例中,修饰的切割酶衍生自野生型或未修饰的切割酶(例如,二肽切割酶或三肽切割酶)。在某些情况下,末端标记的氨基酸残基是n-末端氨基酸。在一些实施例中,末端标记的氨基酸残基是c-末端氨基酸。在一些实施例中,去除的标记的末端氨基酸作为单个氨基酸或作为二肽的一部分被去除。在一些方面,标记的氨基酸是通过用化学试剂处理
而修饰的末端氨基酸。在一些具体实例中,去除的单标记的末端氨基酸或单标记的末端二肽包括酰胺键。在一些方面,修饰的切割酶包括与酰胺键(例如,多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的酰胺键)相互作用的活性位点。在一些实施例中,所述突变是或包括氨基酸取代,缺失,添加或其任何组合。
[0094]
在一些实施例中,修饰的切割酶表现出与未修饰的或野生型切割酶的活性不同的活性。如本文所用,“未修饰的切割酶”或“野生型切割酶”是指具有催化活性以从多肽的末端去除二肽或三肽的任何天然或野生型肽外肽酶(例如,来自多肽的c-末端或n-末端)。未修饰或野生型切割酶可以是外肽酶,其催化倒数第二个肽键的切割以从肽链释放二肽,或催化倒数第三肽键的切割以从肽链释放三肽。未修饰的或野生型切割酶可以是蛋白水解酶,例如氨基肽酶或羧基肽酶。本文所述的未修饰的切割酶可用于指由酶学委员会(ec)分类为ec3.4.14,ec 3.4.15,merops s8,merops s9,merops s33,merops s46,merops m49或merops s53的蛋白质,或其功能同源物或片段。本文所述的未修饰的切割酶可用于指二肽基肽酶,二肽基氨基肽酶,肽基-二肽酶,二肽基羧基肽酶,sedolisin或三肽基肽酶。
[0095]“修饰的切割酶”或“变异切割酶”是指已经从所述的未修饰的或野生型切割酶修饰的任何外肽酶。修饰或变异的切割酶可以衍生自未修饰的或野生型二肽切割酶(例如,二肽基肽酶,二肽基氨基肽酶,肽基-二肽酶,二肽基羧基肽酶)或未经修饰或野生型的三肽切割酶(例如sedolisin,或三肽基肽酶)。与一次从肽中将p1-p2末端氨基酸作为二肽去除的未修饰或野生型二肽切割酶相比,衍生自二肽切割酶的修饰的切割酶一次仅从肽处去除了标记的p1末端氨基酸。与一次从肽中将p1-p2-p3末端氨基酸作为三肽去除的未修饰或野生型三肽切割酶相比,衍生自三肽切割酶的修饰切割酶每次从肽中去除标记的p1末端氨基酸或每次从肽中去除标记的p1-p2二肽。(例如参见图.1a-1b)
[0096]
在一些实施例中,修饰的切割酶去除标记的末端氨基酸,例如,标记的n-末端氨基酸(ntaa)。在某些情况下,修饰的切割酶会去除标记的c-末端氨基酸(ctaa)。在一些实施例中,去除的标记的末端氨基酸作为单个氨基酸或作为二肽的一部分被去除。在一些实施例中,衍生自二肽切割酶或三肽切割酶的修饰的切割酶被配置为切割多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的肽键。在一些实施例中,衍生自三肽切割酶的修饰的切割酶被配置为切割多肽的倒数第二个末端标记的氨基酸残基和倒数第三个末端氨基酸残基之间的肽键。
[0097]
可从诸如merops和/或brenda酶信息系统之类的数据库中获得关于各种已知的未修饰或野生型外肽酶的信息(参见例如,schomburg et al.,j biotechnol.(2017)261:194-206)。可以使用一个以上的分类系统对蛋白质进行分类。酶学委员会(ec)使用国际生物化学和分子生物学联合会(iubmb)命名委员会的建议建立了一种基于特异性的酶分类系统,用于描述ec(酶学委员会)编号已经提供的每种类型的表征酶(characterized enzyme)(参见,例如,bairoch a.,(2000)nucleic acids res.28:304-305)。在某些方面,未修饰的或野生型切割酶是分类为ec 3.4.14,ec 3.4.15,merops s8,merops s9,merops s33,merops s46,merops m49或merops s53的蛋白质,或其同系物。在一些方面,未修饰的或野生型切割酶是在表1、2、3、4、5、6、7和8a-8b中提供的蛋白质。在一些实施例中,修饰的切割酶衍生自分类为ec 3.4.14,ec 3.4.15,merops s8,merops s9,merops s33,merops s46,merops m49或merops s53的蛋白质,或其功能同源物或片段(如表1、2、3、4、5、6、7和8a-8b
所示)。
[0098]
[0099]
[0100][0101]
已经鉴定了各种肽酶(例如,切割酶),其从寡肽的未被取代的n-末端顺序地切割出二肽或三肽。一些肽酶将二肽从三肽切割成十肽。本文所述的切割酶是指分类于酶学委员会(ec)水解酶类3(the enzyme commission(ec)class 3of hydrolases)的酶。二肽基肽酶和三肽基肽酶(dpp和tpp,分别来自酶学委员会编号3.4.14;表1)是一类外肽酶,其通常以渐进方式,从肽的n-末端开始消化二肽(两个氨基酸残基,p1-p2)或三肽(三个氨基酸残基,p1-p2-p3)。肽基二肽酶也称为二肽基羧基肽酶(ec 3.4.15;表2)从c-末端开始以渐进的方式除去二肽。在一些实施例中,未修饰的或野生型切割酶是外氨基肽酶或外肽酶。在一些方面,未修饰的或野生型切割酶是金属肽酶,例如,锌依赖性金属肽酶或锌依赖性水解酶。在一些方面,未修饰的或野生型切割酶是丝氨酸外肽酶或丝氨酸蛋白酶。dpp通常识别n-末端的α胺基,并切割多肽(p2-p3)的倒数第二个和倒数第三个氨基酸残基之间的肽键。参见例如sanderink et al.,j.clin.chem.clin.biochem.(1988)26:795-807)and baral et al.,j biol chem(2008)283(32):22316-22324。还已经鉴定出了从多肽(例如,tpp)的末端去除三肽的各种肽酶。例如,三肽基肽酶a,b和c被归类为merops家族s33(meropss33.002,s33.006,s33.007)。sedolisins也称为丝氨酸羧基肽酶,是蛋白水解酶merops家族的肽酶,s53(参见例如wlodaweret al.,acta biochim pol.2003;50(1):81-102)。
[0102]
在一些实施例中,修饰的切割酶表现出包括从多肽或蛋白质(例如,从n-末端或c-末端)去除末端氨基酸的活性。末端氨基酸可以作为单个氨基酸或作为二肽的一部分从多肽中除去。通常,肽酶活性能够从肽,多肽或蛋白质的末端去除氨基酸xaa1和/或xaa2,其中
xaa可以代表选自ala,arg,asn,asp,cys,gln,glu,gly,his,ile,leu,lys,met,phe,pro,ser,thr,trp,tyr和val的氨基酸末端残基。将理解的是,本发明的修饰的切割酶对于要切割的肽,多肽或蛋白质的氨基酸序列可能是非特异性的。在一些实施例中,修饰的切割酶是部分特异性或选择性的。在一些方面,修饰的切割酶相对于其他位点,优先切割或除去肽的p1或p2位置上的一些氨基酸。在一些情况下,修饰的切割酶相对于其他氨基酸,优先切割或去除一类氨基酸,例如,优先去除疏水性氨基酸而不是其他种类的氨基酸。在一些方面,修饰的切割酶还可优选在距末端氨基酸第二,第三,第四,第五等位置的一个或多个氨基酸。在一些情况下,修饰的切割酶对氨基酸的亚组表现出特异性,并且与其他氨基酸相比,优先去除1、2、3、4、5、6、7、8、9、10、15或更多个特异性末端氨基酸。
[0103]
在一些实施例中,修饰的切割酶是相对于未修饰的或野生型切割酶具有改变了的氨基酸序列的多肽。在一些情况下,修饰的切割酶是多肽,其与野生型切割酶序列的区别在于一个或多个氨基酸的取代,缺失,添加或其组合。与野生型切割酶相比,变异或修饰的切割酶可包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个修饰或突变,例如氨基酸差异。
[0104]
在一些实施例中,变异或修饰的切割酶多肽通常表现出与相应的野生型或未修饰的切割酶具有至少50%,60%,70%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列同一性。在一些实施例中,野生型或未修饰的切割酶包括seq id no:5-8、10-16、20中任一项的氨基酸序列,其成熟序列或其包括活性位点的部分。在一些实施例中,变异或修饰的切割酶多肽通常表现出与seq id no:5-8、10-16、20中所示的野生型或未修饰的切割酶,或其同源物具有至少50%,60%,70%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更多的序列同一性。
[0105]
本领域技术人员能够鉴定切割酶多肽(包括其部分)中的突变或修饰(例如氨基酸取代)的相应位置,例如通过与参考序列比对。在一些实施例中,未修饰的或参考的切割酶多肽通常表现出与seq id no:5-8和10-16、20中列出的任何序列具有至少50%,60%,70%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更多的序列同一性。例如,通过使用已知的对比方法,将参考序列与本文提供的序列(例如,seq id no:5-8、10-16、20所示的序列或其功能同源物或片段)进行比对来确定相应的残基。通过比对序列,本领域技术人员可以例如使用保守且相同的氨基酸残基作为指导来鉴定相应的残基。在某些情况下,尽管本文提供的残基编号可能与参考序列不同,但使用比对方法可确定相应的残基。
[0106]
在一些实施例中,在未修饰的切割酶中修饰的切割酶包括突变,例如一个或多个氨基酸修饰,其中未修饰的切割酶是二肽基肽酶3。二肽基肽酶3(也称为二肽基肽酶iii,二肽基氨基肽酶iii,二肽基芳基酰胺酶iii,脑啡肽酶b,红细胞血管紧张素酶,dpp3或dpp iii)是一种金属蛋白酶(锌依赖性),可依次去除来自短肽的n-末端二肽(两个氨基酸残基)。野生型或未修改的dpp3被归类为m49家族(merops数据库标识符m49.001)。在一些情况下,未修饰的二肽基肽酶3与seq id no:5中列出的uniprot登录号q9ny33、seq id no:6中列出的uniprot登录号q08225、seq id no:7中列出的uniprot登录号q8a6n1、seq id no:8中列出的uniprot登录号h1xw48或seq id no:15中列出的uniprot登录号o55096表现出至
少50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。(参见,例如,prajapati et al.,febs j.2011;278(18):3256-276;fukasawa et al.,biochem j.1998jan 15;329(pt 2):275

282;fukasawa et al.,j amino acids.2011;2011:574816)dpp3优先消化长度为3至10个氨基酸的肽。dpp3带有独特的hexxgh催化基序(seq id no:1)。该基序中的两个组氨酸与第二个保守的eexrae/d基序的谷氨酸残基一起参与锌配位(seq id no:2)。在某些情况下,c-末端肽修饰不会影响dpp3酶的活性。参见kumaret al.,sci rep.(2016)6:23787。已解决了dpp3的几种底物结合结构,包括与具有n-末端酪氨酸的肽复合的结构。n-末端酪氨酸在结构上类似于异硫氰酸苯酯(pitc)、硝基-pitc、磺基-pitc或这些改性剂的异氰酸苯酯形式,这些底物结合的结构可用于靶标活性位点设计方法。在一些实施例中,提供了衍生自二肽基肽酶3的修饰的切割酶,其切割标记的末端氨基酸残基,例如标记的n-末端氨基酸残基。
[0107]
在一些实施例中,在未修饰的切割酶中修饰的切割酶包括突变,例如一个或多个氨基酸修饰,其中未修饰的切割酶是二肽基肽酶5。二肽基肽酶5也被称为过敏原(allergen)tri m 4(须发癣菌)、过敏原tri r4(红色发癣菌)、过敏原tri t 4(tonsurans发癣菌)、二肽基肽酶v、dpp v和分泌型丙氨酰二肽基肽酶(米曲霉)。野生型或未修饰的二肽基肽酶5归类于肽酶家族s9(merops数据库标识符s09.012)。已观察到野生型或未修饰的二肽基肽酶5在中性ph最佳条件下催化x-ala,his-ser和ser-tyr二肽的水解(参见例如,beauvais et al.,jbiol chem.1997;272(10):6238-44)。野生型或未修饰的二肽基肽酶5被描述为一种分泌的二肽基肽酶,其包括非经典丝氨酸蛋白酶催化位点的共有序列(consensus sequences)。在某些情况下,未修饰的切割酶与seq id no:10中所列的uniprot登录号的p0c959或seq id no:16中所列的uniprot登录号b2rit0具有至少50%,60%,70%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列同一性。在一些实施例中,修饰的切割酶中的突变,例如一种或多种氨基酸修饰(例如,取代,缺失,添加),是参考seq id no:10或seq id no:16的编号列出的氨基酸序列。
[0108]
在一些实施例中,在未修饰的切割酶中,修饰的切割酶包括突变,例如一个或多个氨基酸修饰,其中所述未修饰的切割酶是二肽基肽酶7(dpp7)。野生型或未修饰的dpp7被分类为s46蛋白酶家族(merops数据库标识符s46.001)。已观察到野生型或未修饰的dpp7可以催化从寡肽n-末端去除二肽,包括对p1位置的脂肪族和芳族残基均具有广泛的特异性,其中该位置不接受甘氨酸或脯氨酸(参见例如banbula et al.,j.biol.chem.2001,276:6299-6305)。已显示dpp7表现出切割合成底物met-leu-甲基香豆基-7-酰胺(met-leu-mca),leu-arg-mca和lys-ala-mca的活性(rouf et al.,febs open bio.2013;3:177-83)。在某些情况下,未修饰的切割酶与seq id no:11中所列出的uniprot登录号b2rkv3具有至少50%,60%,70%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%97%,98%,99%或更高的序列同一性。在一些实施例中,修饰的切割酶中的突变,例如一种或多种氨基酸修饰(例如,取代,缺失,添加),是参考seq id no:11的编号所列出的氨基酸序列。
[0109]
在一些实施例中,在未修饰的切割酶中修饰的切割酶包括突变,例如一个或多个氨基酸修饰,其中未修饰的切割酶是二肽基肽酶11。二肽基肽酶11也称为asp/glu特异性二
肽基肽酶或dpp11。野生型或未修饰的二肽基肽酶11被分类为s46蛋白酶家族(merops数据库标识符s46.002),并且与二肽基肽酶7共享38.7%的序列同一性。已经观察到野生型或未修饰的二肽基肽酶11催化从寡肽的n-末端去除二肽,包括从具有倒数第二个n-末端asp和glu的寡肽中去除二肽,并且对疏水性残基具有p2-位置偏好(参见例如,ohara-nemoto et al.,j biol chem.2011;286(44):38115-27)。在某些情况下,未修饰的切割酶与seq id no:12中所列的uniprot登录号b2rid1和seq id no:14中所列的uniprot登录号f8wqk8具有至少50%,60%,70%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列同一性。在一些实施例中,修饰的切割酶中的突变,例如,一个或多个氨基酸修饰(例如,取代,缺失,添加),是参考seq id no:12的编号列出的氨基酸序列。在一些实施例中,修饰的切割酶中的突变,例如,一种或多种氨基酸修饰(例如,取代,缺失,添加),是参考seq id no:14的编号列出的氨基酸序列。
[0110]
在一些实施例中,在未修饰的切割酶中,修饰的切割酶包括突变,例如,一个或多个氨基酸修饰,其中未修饰的切割酶是二肽基氨基肽酶bii(dap bii或二肽基肽酶bii)。野生型或未修饰的dap bii催化从肽的氨基末端去除二肽(参见例如ogasawara et al.,j.bacteriol.1996,178:6288

6295;sakamoto et al.,scientific reports 2014,4:4977)。dap bii是一种丝氨酸蛋白酶,属于丝氨酸肽酶家族s46(merops数据库标识符s46.003)。dap bii催化单元的氨基酸序列与家族pa内肽酶中的氨基酸序列显示出显着相似性。在某些情况下,未修饰的切割酶与seq id no:13中所列的uniprot登录号v5ym14具有至少50%,60%,70%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%97%,98%,99%或更高的序列同一性。在一些实施例中,在未修饰的dap bii的催化结构域中,修饰的切割酶在其中包括一个或多个氨基酸修饰(例如,seq id no:13的残基1-252和残基550至698)。在一些实施例中,修饰的切割酶中的突变,例如一种或多种氨基酸修饰(例如,取代,缺失,添加),是参考seq id no:13的编号列出的氨基酸序列。已显示未修饰的或野生型dap bii从寡肽和小蛋白的n-末端水解肽,当第二个(p1)残基为ala,leu,ile,phe,tyr,arg或his(但不包括pro)时切割二肽单元(nh2-p2-p1-)(参见例如sakamoto et al.,scientific reports 2014,4:4977)。
[0111]
在一些实施例中,修饰的切割酶衍生自dap bii,并且从多肽中去除或被配置为去除标记的末端单个氨基酸。在一些实施例中,在未修饰的dap bii切割酶或其片段中,修饰的切割酶具有一个或多个氨基酸修饰(例如,取代,缺失,添加或其组合),参照seq id no:13的编号,其对应于位置126、188、189、190、191、192、196、238、302、306、307、
[0112]
310、525、528、546、604、650、651、665和/或692中的任何一个或多个。在一些实施例中,修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,对应于位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、665和/或692,参照seq id no:13的编号,并且包括的氨基酸序列与seq id no:17-19、23-28或31-39中的任何一个具至少30%的同一性,至少40%的同一性,至少50%的同一性,至少60%的同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0113]
在一些实施例中,在未修饰的dap bii切割酶或其片段中,修饰的切割酶具有一个或多个氨基酸修饰(例如,取代,缺失,添加或其组合),参照seq id no:13的编号,其对应于位置183、184,185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、
201和/或202中的任何一个或多个。在一些实施例中,在未修饰的dap bii切割酶或其片段中,修饰的切割酶具有一种或多种氨基酸修饰(例如,取代,删除,添加或其组合),参照seq id no:13的编号,其对应于位置188、189、190、191、192、302和/或310中的任何一个或多个。在一些实施例中,在未修饰的dap bii切割酶或其片段中,修饰的切割酶具有一种或多种氨基酸修饰(例如,取代,删除,添加或其组合),参照seq id no:13的编号,其对应于位置191、192、196、306和/或650位中任何一个或多个的。在一些实施例中,在未修饰的dap bii切割酶或其片段中,修饰的切割酶具有一种或多种氨基酸修饰(例如,取代,删除,添加或其组合),参照seq id no:13的编号,其对应于位置323-544中的任何一个或多个。在一些实施例中,在未修饰的dap bii切割酶或其片段中,修饰的切割酶具有一种或多种氨基酸修饰(例如,取代,删除,添加或其组合),参照seq id no:13的编号,其对应于位置310、651、655和/或656中的任何一个或多个。在一些实施例中,在未修饰的dap bii切割酶或其片段中,修饰的切割酶具有一种或多种氨基酸修饰(例如,取代,删除,添加或其组合),参照seq id no:13的编号,其对应于位置627、628、630、648、651、655和/或669中的任何一个或多个。
[0114]
在一些实施例中,修饰的切割酶衍生自dap bii,并且从多肽中去除或被配置为去除标记的末端单个氨基酸。在一些实施例中,在未修饰的dap bii切割酶或其片段中,修饰的切割酶具有一种或多种氨基酸修饰(例如,取代,删除,添加或其组合),参照seq id no:13的编号,其对应于位置位置126、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、238、302、306、307、310、525、528、546、604、627、628、630、648、650、651、655、656、665、669和/或692中的任何一个或多个。
[0115]
在一些实施例中,参考seq id no:13的编号,修饰的切割酶具有一个或多个选自a126t,d188v,i189a,d190s,n191c,n191f,n191l,n191m,n191r,n191s,n191t,n191v,w192f,w192g,w192l,r196h,r196k,r196s,r196t,r196v,g238v,a302w,n306a,n306g,n306r,n306s,t307k,n310d,n310g,n310k,n310l,n525k,a528v,f546l,a604v,d650a,d650g,d650s,g651h,g651t,g651v,g651y,s655g,s655t,v656e,v656g,v656s,k665i和k692n或其保守氨基酸取代。在一些实施例中,一个或多个氨基酸修饰是n191m/w192g/r196v/n306r/d650a,d188v/i189a/d190s/n191l/w192g/r196s/a302w/n310k/d650a,n191m/w192g/r196t/n306r/t307k/d650a,n191m/w192g/r196t/n306r/n525k/a528v/a604v/d650a/k692n,a126t/n191m/w192g/r196t/g238v/n306r/d650a,n191m/w192g/r196t/n306r/f546l/d650a,n191m/w192g/r196t/n306r/d650a/g651v/k665i,n191m/w192g/r196t/n306r/d650a/g651v,n191c/w192l/r196k/n306r/n310d/g651y/s655g/v656g,n191c/w192l/n306r/n310d/g651y/s655g/v656g,n191f/w192f/n306r/n310g/g651h/v656e,n191r/w192l/n306s/n310l/g651t/s655t/v656s,n191s/r196h/n306a/d650g,n191t/r196h/n306a/d650g,n191m/r196h/n306a/d650g,n191v/n306a/d650s,或n191s/n306g/d650s。
[0116]
在一些实施例中,修饰的切割酶具有的氨基酸序列与seq id no:17-19、23-28、31-39或其特异性结合片段具有至少20%的同一性,至少30%的同一性,至少40%的同一性,至少50%的同一性,至少60%的同一性,至少70%的同一性,至少80%的同一性,或至少90%或更多的同一性。在一些实施例中,特异性结合片段的长度范围为约10个氨基酸至约400个氨基酸,约10个氨基酸至约300个氨基酸,约10个氨基酸至约200个氨基酸,约10个氨
基酸大约100个氨基酸,或大约10个氨基酸至大约50个氨基酸。在一些实例中,修饰的切割酶包括seq id no:17-19、23-28或31-39中提供的一个或多个氨基酸取代。在一些具体实例中,修饰的切割酶包括seq id no:17-19、23-28、31-39中任一个所列的氨基酸序列,或与氨基酸序列与seq id no:17-19、23-28、31-39中的任何一个或其特异性结合片段具有至少95%的序列同一性。在一些方面,参考seq id no:13的编号,修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,对应于位置188、189、190、191、192、196、302、306、310和/或650,并且所示的氨基酸序列与seq id no:17-19、23-28、31-39中的任何一个具有至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%同一性,至少80%的或至少90%或更多的同一性。在一些方面,参考seq id no:13的编号,修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,对应于位置191、192、196、306和/或650,并且所示的氨基酸序列与seq id no:17-19、23-28、31-39中的任何一个具有至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%同一性,至少80%的或至少90%或更多的同一性。在一些实施例中,修饰的切割酶具有seq id no:17-19、23-28或31-39中任一序列的底物特异性。在一些实施例中,修饰的切割酶具有seq id no:17-19、23-28或31-39中任一序列的切割活性。
[0117]
在一些实施例中,修饰的切割酶具有包括催化结构域的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的催化结构域具有至少20%同一性,至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。在一些实施例中,修饰的切割酶具有包括胺基结合位点的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的胺基结合位点具有至少20%同一性,至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。在一些实施例中,修饰的切割酶具有包括环结构域的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的环结构域具有至少20%同一性,至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0118]
在一些特定的实例中,所需的修饰的切割酶可以表现出对多肽的p1或p2位置中的特定氨基酸的减少的偏倚。在一些实施例中,可以通过在基因选择中靶向野生型或未修饰的酶的p1或p1口袋来获得此类修饰的切割酶。在一些情况下,参考seq id no:13的编号的残基n310,g651,s655和/或v656可以被靶向以减少偏倚。在一些情况下,参考seq id no:13的编号的残基n215,w216,r220,n330和/或d674可以被靶向以减少偏倚。
[0119]
表9还提供了通过参考用于示例性修饰的切割酶的seq id no的示例性序列。在一些实例中,在表9提供了含有一个或多个氨基酸氨基酸取代的修饰的切割酶。
[0120]
[0121][0122]
在一些实施例中,去除的氨基酸被化学试剂或酶试剂标记或修饰。例如,标记的氨基酸作为单个末端氨基酸或作为二肽的一部分被去除。在一些实施例中,标记是或包括“模仿”末端氨基酸(例如,n-末端氨基酸)的大小/形状的改性剂或标记。在一些实施例中,用氨基酸(例如,外源氨基酸),修饰的氨基酸,氨基酸的一部分,被阻断或保护的氨基酸或其任何组合标记去除的氨基酸。在一些实施例中,附着于末端氨基酸的标记是n-末端阻断的(无α胺基)氨基酸。在一些实施例中,用衍生自二肽切割酶的适当工程化或修饰的切割酶选择适当的标记能够去除单个标记的末端氨基酸残基。在一些实施例中,用衍生自三肽切割酶的适当工程化或修饰的切割酶选择适当的标记能够切割标记的末端二肽。在一些实施例中,未修饰的切割酶的活性位点和/或氨基酸结合位点被修饰。在一些实施例中,修饰的切割酶包括在其底物结合位点内,在底物结合位点的边界,在催化结构域内,在p1或p2口袋中,在胰凝乳蛋白酶折叠中,在胺基结合位点处,在环结构域中,或其组合的修饰或突变。
[0123]
在一些实施例中,在活性位点内,标记-p1取代了肽的天然p1-p2残基,使得修饰的切割酶中的切割随后发生在p1和p2之间(衍生自二肽切割酶的修饰的切割酶)而不是在p2和p3之间(天然二肽切割酶)。(参见例如图.1a)。在一些实施例中,在活性位点内,标记-p1取代了肽或其部分的天然p1-p2-p3残基,使得修饰的切割酶中的切割随后发生在p1和p2之间(衍生自三肽切割酶的修饰的切割酶),而不是在p3和p4之间(天然三肽切割酶)(例如,参见图1b右上方)。在一些实施例中,在活性位点内,标记-p1-p2取代了肽或其部分的天然p1-p2-p3残基,使得修饰的切割酶中的切割随后发生在p2和p3之间(衍生自的修饰的切割酶三肽切割酶)而不是在p3和p4之间(天然三肽切割酶)(参见例如图1b右下方)。在一些实施例中,修饰的切割酶衍生自二肽切割酶(例如,二肽基肽酶,二肽基氨基肽酶,肽基-二肽酶或二肽基羧基肽酶)和适合用于去除的二肽的一个残基的未修饰的切割酶的空间之一在修饰的切割酶中被配置改为以适合标签(例如,化学标签或化学修饰)。在一些实施例中,修饰的切割酶衍生自三肽切割酶(例如,sedolisin或三肽基肽酶),并且适合用于去除三肽的一个或两个残基的未修饰的切割酶的一个或两个空间在修饰的切割酶中被配置改为以适合标签(例如,化学标签或化学修饰)。
[0124]
在一些实施例中,在胰凝乳蛋白酶折叠切割酶中,与野生型切割酶多肽相比,修饰的切割酶包括氨基酸突变(例如,修饰,取代,缺失,添加或其组合)。在一些实施例中,在胺基结合位点处,与野生型切割酶多肽相比,修饰的切割酶包括氨基酸突变(例如,修饰,取代,缺失,添加或其组合)。在一些实施例中,在环结构域中,与野生型切割酶多肽相比,修饰的切割酶包括氨基酸突变(例如,修饰,取代,缺失,添加或其组合)。在一些方面,与野生型
切割酶多肽相比,修饰的切割酶包含氨基酸突变(例如,修饰,取代,缺失,添加或其组合),以改善对修饰的切割酶活性位点的可及性。在一些情况下,与未修饰的切割酶相比,修饰的切割酶表现出底物(例如多肽)对活性位点的更大可及性。例如,修饰的切割酶可以允许更大的底物进入活性位点。
[0125]
在一些实施例中,在活性位点处,或在切割酶的催化结构域中,或在切割酶的结合口袋中,与野生型切割酶多肽相比,修饰的切割酶包括氨基酸突变(例如,修饰,取代,缺失,添加或其组合)。在一些实施例中,在切割酶的铰链区中,与野生型切割酶多肽相比,修饰的切割酶包括氨基酸突变(例如,取代,缺失,添加或其组合)。在一些实施例中,在切割酶的结合裂口中,与野生型切割酶多肽相比,修饰的切割酶包括氨基酸突变。在一些情况下,在切割酶的叶间裂中,与野生型切割酶多肽相比,修饰的切割酶包括氨基酸突变。在一些实施例中,在切割酶的α胺基结合区中,与野生型切割酶多肽相比,修饰的切割酶包括氨基酸突变。例如,与野生型切割酶多肽相比,修饰的切割酶表现出α胺基结合的降低。参见例如kumaret al.,sci rep.(2016)6:23787。
[0126]
在一些实施例中,与未修饰的切割酶相比,修饰的切割酶表现出改变了的活性,底物结合能力或切割特性。在一些实施例中,修饰的切割酶在未修饰的切割酶的催化基序或催化结构域中被修饰(例如,seq id no:1中所列的hexxgh催化基序)。在一些实施例中,突变,例如,一种或多种氨基酸修饰(例如,取代,缺失,添加)参考seq id no:5的编号对应于位置316、391或394。在一些实施例中,突变,例如,一个或多个氨基酸修饰(例如,取代,缺失,添加)参考seq id no:5的编号对应于位置氨基酸残基419、420、421、422、423、424、425、426,或其组合。
[0127]
在一些实施例中,未修饰的切割酶是金属肽酶。在一些实施例中,修饰的切割酶是金属肽酶。在一些实施例中,修饰的切割酶是锌依赖性金属肽酶或锌依赖性水解酶或由其衍生。一些已知的金属肽酶的特征在于存在常规的催化签名基序hexxh。在一些方面,hexxh基序的两个his残基有助于配位二价金属离子(例如,zn
2
,mn
2
,co
2
,ni
2
,cu
2
)。例如,修饰的切割酶需要特定金属离子(例如,锌离子,氯离子)的存在或与特定金属离子接触以进行活化。在一些实施例中,可以通过存在或不存在金属离子,或通过与金属螯合剂接触来调节或控制修饰的切割酶的功能。
[0128]
在一些实施例中,与未修饰的切割酶相比,修饰的切割酶表现出对特定底物的改变了的结合亲和力和/或特异性。例如,与未修饰的切割酶相比,修饰的切割酶对标记的末端氨基酸表现出增强的结合亲和力和/或特异性。在一些实施例中,与未修饰的切割酶相比,修饰的切割酶对底物表现出降低的结合亲和力和/或特异性。在一些实施例中,修饰的切割酶表现出一种或多种期望的特性,例如结合速率,水解速率,释放速率。在一些实施例中,修饰的切割酶可以以期望的速率从多肽中去除或释放。
[0129]
在任何此类实施例中的一些实施例中,可以通过将经修饰的切割酶募集至标记的末端氨基酸来增强与经修饰的切割酶的反应。例如,可通过互补通用引发序列,与修饰的切割酶相关的dna标签或序列,以及与用修饰的切割酶处理的多肽相关联的dna标签或序列的杂交,可将一种或多种修饰的切割酶募集至多肽的标记的末端氨基酸。该杂交步骤可以提高修饰的切割酶对标记的末端氨基酸(例如,ntaa)的有效亲和力。在某些情况下,在除去标记的末端氨基酸后,它可能扩散掉,并且可以通过剥离杂交的dna标签来去除相关联的修饰
的切割酶。
[0130]
在一些实施例中,修饰的切割酶附着于锚定序列。在某些情况下,修饰的切割酶直接或间接附着于锚定序列。在某些情况下,锚定序列与附着于多肽的序列互补。在一些实施例中,锚定序列是通用序列或通用dna标签。在一些实施例中,多肽还附着于通用序列。在一些实例中,修饰的切割酶上的锚定序列使酶接近多肽。在一些实施例中,锚定序列使酶接近或共定位修饰的切割酶至多肽。在一些实施例中,修饰的切割酶和多肽的这种共定位有助于从所述多肽结合和/或去除单个标记的氨基酸或二肽。
[0131]
在本文提供的任何实施例中,可通过嵌合修饰的切割酶和嵌合末端氨基酸改性剂来增强一个或多个修饰的切割酶到多肽的末端氨基酸的募集,其中所述嵌合修饰的切割酶和嵌合末端氨基酸(例如ntaa)改性剂各自包括能够彼此结合反应的部分(例如,生物素-链霉抗生物素蛋白)。例如,修饰的切割酶可以是低亲和力的酶(>μmkd),并且使用链霉抗生物素蛋白-嵌合的修饰的切割酶将其募集至与生物素相关联的标记的ntaa。在一些情况下,由于生物素-链霉抗生物素蛋白相互作用的有效局部浓度的增加,可以提高修饰的切割酶去除标记的末端氨基酸的效率。在某些情况下,这种方法有效地增加了亲和力kd从μm到亚皮摩尔(subpicomolar)。也可以采用许多其他的生物偶联招募策略。叠氮化物修饰的pitc是市售的(4-叠氮苯基异硫氰酸酯,sigma),允许通过与炔烃-生物素的点击化学反应将叠氮化物-pitc进行许多简单的转化为pitc的其他生物缀合物,例如生物素-pitc。在一些方面,在除去标记的末端氨基酸之后,它可以与相关联的修饰的切割酶一起从多肽中扩散出去。
[0132]
在一些实施例中,修饰的切割酶可以是单条多肽链或至少两条多肽链的多聚体(二聚体或更高阶的多聚体)。因此,单体,二聚体和更高阶的多聚体修饰的切割酶多肽都在所定义术语的范围内。多聚体多肽可以是(相同多肽链的)同源多聚体或(不同多肽链的)异源多聚体。在一些实施例中,修饰的切割酶是单体酶。在一些实施例中,修饰的切割酶是融合分子或嵌合分子。例如,修饰的切割酶可以直接或经由接头间接附着于或缔合至寡核苷酸。在某些特定情况下,可以将修饰的切割酶连接至诸如spytag/spycatcher或snooptag/snoopcatcher的部分。
[0133]
a.标记的末端氨基酸
[0134]
在一些实施例中,被修饰的切割酶去除的肽的末端氨基酸被标记或修饰。标签可以包括任何合适的材料或部分。为此目的,可以使用任何合适的分子或材料,包括蛋白质,氨基酸,核酸,碳水化合物,化学部分和小分子。在一些实施例中,合适的标记能够装配在修饰的切割酶的结合口袋中。在一些方面,以核酸相容的方式进行末端氨基酸的标记(例如,以不损害核酸的方式进行标记)。在一些实施例中,合适的标记物使修饰的切割酶能够从多肽中去除单个标记的末端氨基酸残基或二肽。多肽的末端氨基酸可以通过任何合适的方法标记。在一些实例中,末端氨基酸被化学或酶标记。在一些实施例中,末端氨基酸被试剂标记,该试剂是或包括化学试剂,酶和/或生物试剂。在某些情况下,末端氨基酸被化学标记或化学部分标记。在一些实例中,末端氨基酸用阻断的或修饰的氨基酸标记。
[0135]
在一些实施例中,使前体多肽(例如,未标记的多肽)与用于标记前体多肽的末端氨基酸的试剂接触,以提供准备用修饰的切割酶处理的多肽。在一些情况下,在使前体多肽与修饰的切割酶接触之前,使前体多肽与用于标记末端氨基酸的试剂接触。在一些方面,使
修饰的切割酶与已被标记或修饰的多肽接触。在一些情况下,前体多肽与用于标记末端氨基酸的试剂的接触以及多肽与修饰的切割酶的接触是同时或基本同时进行的。
[0136]
1.化学标记
[0137]
在一些实施例中,被修饰的切割酶去除的氨基酸用化学标记物标记。在一些实例中,用化学试剂标记通过修饰的切割酶去除的氨基酸。在一些方面,通过用化学试剂处理来标记末端氨基酸以核酸相容的方式进行(例如,标记在不损害核酸的条件下进行)。
[0138]
在一些实施例中,修饰的切割酶去除标记的氨基酸,例如多肽上化学修饰或标记的(例如,ptc/dnp/乙酰基/cbz修饰或标记的)氨基酸。在某些情况下,去除的氨基酸是单个标记的末端氨基酸。在某些情况下,去除的氨基酸是末端二肽的一部分。在一些实施例中,修饰的切割酶(例如,二肽切割酶)去除具有ptc/dnp/乙酰基/cbz基团作为标记物的n-末端氨基酸。
[0139]
在一些实施例中,被修饰的切割酶去除的氨基酸,所述氨基酸可以是被切割酶去除的二肽的单个末端氨基酸或末端氨基酸,可以是选自由苯基异硫氰酸酯(pitc)、硝基pitc、磺基pitc、苯基异氰酸酯(pic)、硝基pic、磺基pic、苄氧羰基氯或碳苯甲酰氯(cbz-cl)、n-(苄氧羰基氧基)琥珀酰亚胺(cbz-osu或cbz-o-nhs)、羧基活化的氨基阻断氨基酸(例如、cbz-氨基酸-osu)、1-氟-2,4-二硝基苯(桑格氏试剂、dnfb)、丹磺酰氯(dns-cl或1-二甲基氨基萘-5-磺酰氯)、4-磺酰基-2-硝基氟苯(snfb)、酸酐、2-吡啶甲醛、2-甲酰基苯基硼酸、2-乙酰基苯基硼酸、1-氟-2,4-二硝基苯、4-氯-7-硝基苯并呋喃酯、五氟苯基异硫氰酸酯、4-(三氟甲氧基)-异硫氰酸苯酯、4-(三氟甲基)-异硫氰酸苯酯、3-(羧酸)-异硫氰酸苯酯、3-(三氟甲基)-异硫氰酸苯酯、1-萘基异硫氰酸酯、n-硝基咪唑-1-羧酰亚胺、n,n'-双(新戊酰)-1h-吡唑-1-羧脒、n,n
’‑
双(苄氧羰基)-1h-吡唑-1-甲脒乙酰化试剂、胍基化试剂、硫代酰化试剂、硫代乙酰化试剂、硫代苄基化试剂、双杂环甲胺试剂或其衍生物组成的组的试剂标记。
[0140]
在一些实施例中,被修饰的切割酶去除的末端氨基酸,其可以是将被切割酶去除的二肽的末端胺基,被酸酐或其衍生物标记。在一些实施例中,用于标记被修饰的切割酶去除的氨基酸的试剂选自:s-乙酰基巯基琥珀酸酐、顺式乙酸酐、4-氨基-1,8-萘酸酐、内双环[2.2.2]辛-5-烯-2,3-二羧酸酐、5-溴靛红酸酐(5-bromoisatoic anhydride)、溴马来酸酐、4-溴-1,8-萘酐、柠康酸酐、巴豆酸酐、反式-1,2-环己烷二羧酸酐、1-环戊烯-1,2-二羧酸酐、2,3-二氯马来酸酐、3,6-二氯邻苯二甲酸酐、3,6-二氟邻苯二甲酸酐、二乙醇酸酐、2,2-二甲基戊二酸酐、3,3-二甲基戊二酸酐、2,3-二甲基马来酸酐、2,2-二甲基琥珀酸酐、(2-十二烯-1-基)琥珀酸酐、十二碳烯基琥珀酸酐、戊二酸酐、六氟戊二酸酐、六氢-4-甲基邻苯二甲酸酐、同邻苯二甲酸酐、3-羟基邻苯二甲酸酐、衣康酸酐、马来酸酐、3-甲基戊酸酐、n-甲基异戊酸酐、甲基琥珀酸酐、1,8-萘酸酐、3-硝基-1,8-萘酸酐、4-硝基-1,8-萘酸酐、3-硝基邻苯二甲酸酐、4-硝基邻苯二甲酸酐、2-辛基-1-基琥珀酸酐、2,5-恶唑烷二酮、2-苯基戊二酸酐、苯基马来酸酐、苯基琥珀酸酐、n-邻苯二甲酰基-dl-谷氨酸酐、2,3-吡嗪二羧酸酐、3,4-吡啶二羧酸酐、琥珀酸酸酐、4-磺基-1,8-萘酐、四溴邻苯二甲酸酐、四氯邻苯二甲酸酐、四氟邻苯二甲酸酐、3,4,5,6-四氢邻苯二甲酸酐、3,3-四亚甲基戊二酸酐、偏苯三甲酰氯氯化物和2-(三苯基正膦亚基)琥珀酸酐。见例如staigeret al.,j.org.chem.1959,24,9,1214-1219;jiang et al.j.org.chem.2019,84,4,2022-2031;美国专利号9,867,883。
[0141]
在一些实例中,在准备用本发明的修饰的切割酶处理时,用化学试剂处理多肽,该化学试剂包括等靛红酸酐(isatoic anhydride),异烟酸酐,氮杂靛红酸酐(azaisatoic anhydride),琥珀酸酐或其中之一的衍生物,多肽的末端氨基酸被化学试剂修饰或标记。用本发明的修饰的切割酶处理的多肽的末端氨基酸的标记的具体实例包括:
[0142][0143]
其中:
[0144]g1-g4各自独立地选自ch,cx和n;
[0145]
每次出现的x独立地选自c
1-c2烷基,no2,c
1-c2卤代烷基,c
1-c2卤代烷氧基,卤素,-or2,-n(r2)2,-sr2,so2r3,so3r2,-b(or2)2,c(=o)r2,cn,con(r2)2,-coor2,-c(-o)ar和四唑;
[0146]
r代表氨基酸的侧链,例如,20个常见氨基酸的侧链之一;
[0147]
r1选自h,r3,c(-o)r2,-c(=o)n(r2)2,-c(=o)ar和-so2n(r2)2;
[0148]
r2在每次出现时独立地选自h和c
1-c2烷基;
[0149]
r3在每次出现时独立地选自c
1-c2烷基;
[0150]
ar在每次出现时独立地选自苯基,吡啶基,嘧啶基,哒嗪基和吡嗪基,它们各自任选地被选自卤素,cn,no2,c
1-c2烷基,c
1-c2卤代烷基,c
1-c2卤代烷氧基和-or2的一个或两个基团取代;和
[0151]
pp代表多肽的一部分,特别是制备用于用本发明的修饰的切割酶处理的多肽的部分,不包括n-末端氨基酸。因此,式(c)的化合物通常是用于本发明方法的多肽,并且r代表该多肽的末端氨基酸的侧链。
[0152]
在优选的实施例中,当r不是h时,式(c)所示的末端氨基酸为l-构型。
[0153]
式(b)的化合物是多肽,有时指标记的多肽,其已经制备用于本文所述的修饰的切割酶反应中。
[0154]
在一些方面,被修饰的切割酶除去的氨基酸用衍生自靛红酸酐(isatoic anhydride),异烟酸酐或氮杂靛红酸酐(azaisatoic anhydride),特别是本文所述的式(a)化合物的示例性试剂标记。在一些实施例中,通过修饰的切割酶去除的氨基酸,用选自以下的示例性试剂标记:n-甲基-靛红酸酐、n-乙酰基-靛红酸酐、4-羧酸靛红酸酐、5-甲氧基-靛红酸酐、5-硝基-靛红酸酐、4-氯-靛红酸酐、4-氟-靛红酸酐、6-氟-靛红酸酐酐、n-苄基-靛红酸酐、4-三氟甲基-靛红酸酐、5-三氟甲基-靛红酸酐、4-硝基-靛红酸酐、4-甲氧基-靛红酸酐和5-氨基-2-氟-异烟酸酐(6-氟-1h-吡啶并[3,4-d][1,3]恶嗪-2,4-二酮)或其衍生物。在一些实例中,通过本发明的修饰的切割酶的作用除去的标记的氨基酸或二肽包括任
选取代的苯甲酰胺,通常是衍生自本文公开的任选取代的靛红酸酐的任何一种,包括本文所述的式(b)的化合物。
[0155]
在本发明的其他有利的实施例中,在本准备发明的修饰的切割酶处理时,用包括琥珀酸酐,邻苯二甲酸酐,吡嗪二羧酸酐或其中之一的衍生物的化学试剂处理该多肽,末端氨基酸被化学试剂修饰或标记。
[0156]
用于标记待用本发明的修饰的切割酶处理的多肽的末端氨基酸的反应的其他具体实例包括:
[0157][0158]
其中:
[0159]
n为0或1;
[0160]
环cy表示可能不存在或存在的5或6元环或8-10元双环。当存在时,环cy可以是饱和,不饱和或芳族的,并且虚线键可以是单键,双键或芳族的键;
[0161]
当存在cy时,它可以是碳环,或者可以包括一个或两个选自n,o和s的杂原子作为环成员;
[0162]
当存在环cy时,其任选地被选自卤素,cn,no2,c
1-c2烷基,c
1-c2卤代烷基,c
1-c2卤代烷氧基和-or4的1-6个基团(或当cy为芳族时用1-4个基团)取代;
[0163]
当不存在环cy时,虚线键可以是单键或双键,并且虚线键任选地被选自卤素,cn,c
1-c2烷基,c
1-c2卤代烷基,c
1-c2卤代烷氧基,co2r4和-or4的一个或两个基团取代;
[0164]
r代表氨基酸的侧链,例如,20个常见氨基酸的侧链之一;
[0165]
r4在每次出现时均独立地选自h,c
1-c2烷基和c
1-c2卤代烷基;
[0166]
r5在每次出现时独立地选自h,卤素,c
1-c2烷基,c
1-c2卤代烷基,c
1-c2烷氧基和c
1-c2卤代烷氧基。
[0167]
pp代表多肽的一部分,特别是制备用于用本发明的修饰的切割酶处理的多肽的部分,不包括n-末端氨基酸。因此,式(c)的化合物通常是用于本发明方法的多肽,并且r代表该多肽的末端氨基酸的侧链。
[0168]
在式(d)的这些试剂的优选实施例中,当n为1时不存在环cy。在式(d)的化学试剂的另外的优选实施例中,存在环cy并且为苯环或2,3-吡嗪环,它们各自如上所述被任选地取代,并且n为0。
[0169]
在优选的实施例中,当r不是h时,式(c)所示的末端氨基酸为l-构型。
[0170]
式(e)的化合物是多肽,有时指标记的多肽,其已经为用于本文所述的修饰的切割酶的反应而制备。
[0171]
在一些实施例中,用衍生自琥珀酸酐或式(d)的化合物的示例性试剂标记通过修饰的切割酶除去的氨基酸,其中环cy不存在并且虚线键表示单键。在一些实施例中,试剂是3,6,二氟邻苯二甲酸酐,2,3吡嗪二羧酸酐或琥珀酸酐。在一些实例中,去除的标记的氨基酸或二肽包括4-羧基丁酰胺。
[0172]
在一些实施例中,在准备用本发明的修饰的切割酶处理时,用能够与多肽n-末端的α-胺基形成酰胺键的任何合适的化学试剂处理多肽。许多化学试剂与多肽的末端胺基反应以形成具有酰胺键的修饰的多肽,该酰胺键将多肽连接至修饰。该n-末端修饰的多肽可以是修饰的切割酶的底物。从肽偶联领域已知与胺基反应以形成酰胺键的化学试剂,包括但不限于酰基卤(氯化物、氟化物、溴化物)、酰基咪唑、o-酰基异脲、活化的酯[n-羟基琥珀酰亚胺(nhs或hosu)、n-羟基磺基琥珀酰亚胺(磺基-nhs)对硝基苯基(pnp)、五氟苯基(pfp)、4-磺基-2,3,5,6、-四氟苯基、2,4,5-三氯苯酚、n-羟基-5-降冰片烯-2,3-二甲叉酰亚胺(honb)、3-羟基-4-氧代-3,4-二氢-1,2,3-苯并三嗪(hodhbt)、羟基苯并三唑(hobt)、1-羟基-7-氮杂苯并三唑(hoat)、1-羟基-1h-1,2,3-三唑-4-羧酸盐(hoct)]、乙基(2z)-2-氰基-2-羟基亚氨基乙酸乙酯(oxyma)]、烷基酯、碳二亚胺等等。(hermanson(2013)bioconjugation techniques,academic press;montalbetti et al.,(2005)tetrahedron 61:10827-10852;montalbetti et al.,wiley encyclopedia of chemical biology:1-17.de figueiredo et al.,(2016)chem rev 116(19):12029-12122;每一个均通过引用整体并入本文。n-末端修饰也可以安装有经由酶促方法连接至多肽的酰胺键(philpott et al.,(2018)green chemistry 20(15):3426-3431,通过引用整体并入本文)。具有4-硝基苯基邻氨基苯甲酸酯的pnp酯标记多肽的实例,其可以在以下条件下用于标记多肽:将邻氨基苯甲酸4-硝基苯酚(pnpa)以100mm的浓度溶于dmso;和pnpa以10mm与1mm肽在1
×
pbs中(ph 8.5)或100mm nahco3碳酸盐缓冲液(ph 8.5)在10%dmso中在37℃使用1小时。产生的所得肽产物等同于用靛红酸酐标记肽,并且生成2-氨基苯甲酰胺修饰的如表11所示,适合作为修饰的切割酶底物的肽(例如,衍生自dap bii)。
[0173]
在一些实例中,在准备用本发明的修饰的切割酶处理时,用包含胺基保护的活化酯的化学试剂处理多肽以形成酰胺键,并且用化学试剂修饰或标记多肽的末端氨基酸。然后可以进一步对该修饰的多肽进行适当的处理以除去指定的保护基团,从而得到用于用修饰的切割酶处理的修饰的多肽。
[0174]
用本发明的修饰的切割酶处理的多肽的末端氨基酸的标记的具体实例包括:
[0175][0176]
其中:
[0177]g1-g4各自独立地选自ch,cx和n;
[0178]
每次出现的x独立地选自h,c
1-c2烷基,no2,c
1-c2卤代烷基,c
1-c2卤代烷氧基,卤素,-or2,-n(r2)2,-sr2,so2r3,so3r2,-b(or2)2,c(=o)r2,cn,con(r2)2,-coor2,-c(-o)ar和四唑;
[0179]
r代表氨基酸的侧链,例如,20个常见氨基酸的侧链之一;
[0180]
r1选自h,r3,c(-o)r2,-c(=o)n(r2)2,-c(=o)ar和-so2n(r3)2;
[0181]
r2在每次出现时独立地选自h和c
1-c2烷基;
[0182]
r3在每次出现时独立地选自c
1-c2烷基;
[0183]
ar在每次出现时独立地选自苯基,吡啶基,嘧啶基,哒嗪基和吡嗪基,它们各自任选地被选自卤素,cn,no2,c
1-c2烷基,c
1-c2卤代烷基,c
1-c2卤代烷氧基和-or2的一个或两个基团取代;
[0184]
l是离去基团,其选自卤素,n-羟基琥珀酰亚胺(nhs),n-羟基苯并三唑,磺基n-羟基琥珀酰亚胺(sulfonhs),2,3,4,5,6-五氟苯酚(pfp),4-磺基-2,3,5,6-四氟苯酚,氯,4-硝基苯酚和-o(c=)-o-(c1-6烷基);
[0185]
可选地,-nr
1-pg可以被-n3代替;和
[0186]
pg为h或氮保护基,其可选自
[0187]
叔丁氧羰基(boc),2,2,2-三氯乙氧羰基(troc),2-(三甲基甲硅烷基)乙氧羰基(teoc),羧基苄基(cbz),对硝基羧基苄基(p-no2cbz),烯丙氧羰基(alloc),9-芴基甲氧羰基(fmoc),对叠氮基羧基苄基(p-n3cbz),2,2,6,6-四甲基哌啶-1-基氧羰基(tempoc)和其他n-保护基团。
[0188]
在一些实例中,在准备用本发明的修饰的切割酶处理时,用4-硝基苯基邻氨基苯甲酸酯处理多肽。
[0189]
在一些实施例中,用于修饰或标记要被修饰的切割酶去除的氨基酸的化学试剂是本文所述的式(a)或(d)的任何化合物中的一种或多种,或其盐或缀合物。
[0190]
在一些实施例中,用于修饰或标记要被修饰的切割酶去除的氨基酸的化学试剂是本文所述的式(i),(ii),(iii),(iv)或(ab)的任何化合物的一种或多种,或其盐或缀合物。
[0191]
在一些实施例中,用于修饰或标记通过修饰的切割酶去除的氨基酸的试剂包括选自式(i)的化合物的化合物:
[0192][0193]
或其盐或缀合物,
[0194]
其中
[0195]
r1和r2各自独立地为h,c
1-6
烷基,环烷基,-c(o)ra,-c(o)orb或-s(o)2rc;
[0196]
ra,rb和rc各自独立地为h,c
1-6
烷基,c
1-6
卤代烷基,芳基烷基,芳基或杂芳基,其中c
1-6
烷基,c
1-6
卤代烷基,芳基烷基,芳基,和杂芳基各自未取代的或取代的;
[0197]
r3是杂芳基,-nrdc(o)ore或

srf,其中杂芳基未取代的或取代的;
[0198]
rd,re和rf各自独立地为h或c
1-6
烷基。
[0199]
在某些实施例中,当r3是r1和r2都不都是h。在式(i)的一些实施例中,r1和r2都是h。在一些实施例中,r1和r2都不是h。在一些实施例中,r1和r2之一为c
1-6
烷基。在一些实施例中,r1和r2中的一个为h,另一个为c
1-6
烷基,环烷基,-c(o)ra,-c(o)orb或-s(o)2rc。在
一些实施例中,r1和r2中的一个或两个都为c
1-6
烷基。在一些实施例中,r1和r2中的一个或两个都为环烷基。在一些实施例中,r1和r2中的一个或两个都为-c(o)ra。在一些实施例中,r1和r2中的一个或两个都为-c(o)orb。在一些实施例中,r1和r2中的一个或两个都为-s(o)2rc。在一些实施例中,r1和r2中的一个或两个为-s(o)2rc,其中rc为c
1-6
烷基,c
1-6
卤代烷基,芳基烷基,芳基或杂芳基。在一些实施例中,r1为在一些实施例中,r2为在一些实施例中,r1和r2均为在一些实施例中,r1或r2为
[0200]
在式(i)的化合物的一些实施例中,r3是单环杂芳基。在式(i)的一些实施例中,r3是5-或6-元单环杂芳基。在式(i)的一些实施例中,r3是含有一个或多个n的5元或6元单环杂芳基。优选地,r3选自吡唑,咪唑,三唑和四唑,并且经由吡唑,咪唑,三唑或四唑环的氮原子连接至式(i)的脒基,并且r3任选地被选自卤素,c
1-3
烷基,c
1-3
卤代烷基和硝基的基团取代。在一些实施例中,r3为其中g1是n,ch或cx(其中x是卤素),c
1-3
烷基,c
1-3
卤代烷基或硝基。在一些实施例中,r3为或,其中x是me,f,cl,cf3或no2。在一些实施例中,r3为其中g1是n或ch。在一些实施例中,r3为在一些实施例中,r3是双环杂芳基。在一些实施例中,r3是9元或10元双环杂芳基。在一些实施例中,r3为或者
[0201]
在一些实施例中,式(i)的化合物为在一些实施例中,式(i)的化合物不是
[0202]
在一些实施例中,式(i)的化合物选自下组:
还可以任选地包括(n-boc,n'-三氟乙酰基-吡唑甲脒,n,n'-双乙酰基-吡唑甲脒,n-甲基-吡唑甲脒,n,n'-双乙酰-n-甲基-吡唑甲脒,n,n'-双乙酰-n-甲基-4-硝基-吡唑甲脒,和n,n
′‑
双乙酰基-n-甲基-4-三氟甲基-吡唑甲脒),或它们的盐或缀合物。
[0203]
在一些实施例中,化学试剂还包括mukaiyama试剂(2-氯-1-甲基碘化碘鎓)。在一些实施例中,试剂包括至少一种式(i)的化合物和mukakaiyama氏试剂。
[0204]
在一些实施例中,包括氰酰胺衍生物的化学试剂用于标记多肽的一个或多个氨基酸。(参见,例如,kwon et al.,org.lett.2014,16,6048-6051,通过引用整体并入本文)。
[0205]
在一些实施例中,化学试剂包括选自式(ii)中的化合物的化合物:
[0206][0207]
或其盐或缀合物,
[0208]
其中
[0209]
r4为h,c
1-6
烷基,环烷基,-c(o)rg或-c(o)org;和
[0210]
rg为h,c
1-6
烷基,c
2-6
烯基,c
1-6
卤代烷基或芳基烷基,其中c
1-6
烷基,c
2-6
烯基,c
1-6
卤代烷基和芳基烷基各自为未取代的或取代的。
[0211]
在一些实施例中,包括异硫氰酸酯衍生物的试剂用于标记多肽的末端氨基酸(例如,ntaa)。(参见,例如,martin et al.,organometallics.2006,34,1787-1801,通过引用整体并入本文)。
[0212]
在一些实施例中,化学试剂包括选自式(iii)的化合物的化合物:
[0213]r5-n=c=s
ꢀꢀꢀ
(iii)
[0214]
或其盐或缀合物,
[0215]
其中
[0216]
r5为c
1-6
烷基,c
2-6
烯基,环烷基,杂环基,芳基或杂芳基;
[0217]
其中c
1-6
烷基,c
2-6
烯基,环烷基,杂环基,芳基或杂芳基各自由一个或多个选自卤素,-nrhri,-s(o)2rj或杂环基的基团未取代的或取代的;
[0218]
rh,ri和rj各自独立地为h,c
1-6
烷基,c
1-6
卤代烷基,芳基烷基,芳基或杂芳基,其中c
1-6
烷基,c
1-6
卤代烷基,芳基烷基,芳基,和杂芳基各自未取代的或取代的。
[0219]
在式(iii)的一些实施例中,r5是取代的苯基。在一些实施例中,r5是被一个或多个选自卤素,-nrhri,-s(o)2rj或杂环基的基团取代的取代苯基。在一些实施例中,r5是未取代的c
1-6
烷基。在一些实施例中,r5是取代的c
1-6
烷基。在一些实施例中,r5是取代的c
1-6
烷基,被一个或多个选自卤素,-nrhri,-s(o)2rj或杂环基的基团取代。在一些实施例中,r5是未取代的c
2-6
烯基。在一些实施例中,r5为c
2-6
烯基。在一些实施例中,r5是取代的c
2-6
烯基,被一个或多个选自卤素,-nrhri,-s(o)2rj或杂环基的基团取代。在一些实施例中,r5是未取代的芳基。在一些实施例中,r5是取代的芳基。在一些实施例中,r5是被一个或多个选自卤素,-nrhri,-s(o)2rj或杂环基的基团取代的芳基。在一些实施例中,r5是未取代的环烷基。在一些实施例中,r5是取代的环烷基。在一些实施例中,r5是被一个或多个选自卤素,-nrhri,-s(o)2rj或杂环基的基团取代的环烷基。在一些实施例中,r5是未取代的杂环基。在一些实施例中,r5是取代的杂环基。在一些实施例中,r5是杂环基,被一个或多个选自卤素,-nrhri,-s(o)2rj或杂环基的基团取代。在一些实施例中,r5是未取代的杂芳基。在一些实施例中,r5是取代的杂芳基。在一些实施例中,r5是杂芳基,被一个或多个选自卤素,-nrhri,-s(o)2rj或杂环基的基团取代。
[0220]
在一些实施例中,式(iii)的化合物是三甲基甲硅烷基异硫氰酸酯(tmsitc)或五氟苯基异硫氰酸酯(pfpitc)。
[0221]
在一些实施例中,该化合物不是三氟甲基异硫氰酸酯,异硫氰酸烯丙基酯,二甲基氨基偶氮苯异硫氰酸酯,4-磺苯基异硫氰酸酯,3-吡啶基异硫氰酸酯,2-哌啶基乙基异硫氰酸酯,3-(4-吗啉代)丙基异硫氰酸酯或3-(二乙基氨基)丙基异硫氰酸酯。
[0222]
在一些实施例中,试剂是或包括烷基胺基。在一些实施例中,试剂另外包括dipea,三甲胺,吡啶和/或n-甲基哌啶。在一些实施例中,试剂另外在乙腈中包括吡啶和三乙胺。在一些实施例中,试剂另外包括在水和/或甲醇中的n-甲基哌啶。
[0223]
在一些实施例中,多肽还与碳二亚胺化合物接触。
[0224]
在一些实施例中,化学试剂包括碳二亚胺衍生物(参见,例如,chi et al.,2015,chem.eur.j.2015,21,10369-10378,通过引用整体并入)。
[0225]
在一些实施例中,多肽的ntaa通过酰化标记。(参见,例如,protein science(1992),i,582-589,通过引用整体并入)。
[0226]
在一些实施例中,化学试剂包括选自式(iv)的化合物的化合物:
[0227][0228]
或其盐或缀合物,
[0229]
其中
[0230]
r8为卤素或-orm;
[0231]rm
为h,c
1-6
烷基或杂环基;和
[0232]
r9是氢,卤素或c
1-6
卤代烷基。
[0233]
在式(iv)的一些实施例中,r8是卤素。在一些实施例中,r8为氯。在一些实施例中,r8在一些实施例中,r9为氢。在一些实施例中,r9是卤素,例如溴。在一些实施例中,式(iv)的化合物选自乙酰氯,乙酰酐和乙酰基-nhs。在一些实施例中,该化合物不是乙酰酸酐或乙酰基-nhs。
[0234]
在一些实施例中,多肽还与肽偶联剂接触。在一些实施例中,肽偶联剂是碳二亚胺化合物。在一些实施例中,碳二亚胺化合物是二异丙基碳二亚胺(dic)或1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(edc)。在一些实施例中,该方法包括使至少一种式(i)的化合物与碳二亚胺化合物如dic或edc接触。
[0235]
在一些实施例中,化学试剂包括金属络合物。(参见,例如,bentley et al.,biochem.j.1973(135),507-511;bentley et al.,biochem.j.1976(153),137-138;huo et al.,j.am.chem.soc.2007,139,9819-9822;wu et al.,j.am.chem.soc.2016,138(44),14554-14557,其整体通过引用并入)。在一些实施例中,金属络合物是金属导向/螯合基团。在一些实施例中,金属络合物包括螯合至金属中心的一种或多种配体。在一些实施例中,配体是单齿配体。在一些实施例中,所述配体是二齿或多齿配体。在一些实施例中,金属络合物包括选自co,cu,pd,pt,zn和ni的金属。
[0236]
在一些实施例中,化学试剂包括式(i),式(ii),式(iii)或式(iv)的缀合物。在一些实施例中,用于修饰多肽的末端氨基酸的试剂包括与配体缀合的式(i),式(ii),式(iii)或式(iv)的化合物。
[0237]
在一些实施例中,化学试剂包括式(i)-q,式(ii)-q,式(iii)-q或式(iv)-q的缀合物,其中式(i)-(iv)如上述定义,并且q是配体。
[0238]
在一些实施例中,配体q是侧基或结合位点(例如,结合剂结合的位点)。在一些实施例中,多肽与结合剂共价结合。在一些实施例中,多肽包括末端氨基酸,该末端氨基酸包括能够与结合剂共价结合的配体基团。在某些实施例中,所述多肽包括具有式(i)-q,式(ii)-q,式(iii)-q或式(iv)-q的化合物的标记的ntaa,其中所述q共价结合于结合剂。在一些实施例中,进行偶联反应以在多肽和结合剂之间产生共价键(例如,在配体q和结合剂上的官能团之间的共价键)。
[0239]
在一些实施例中,化学试剂包括式(i)-q的缀合物
[0240][0241]
其中r1,r2和r3如上所定义并且q是配体。
[0242]
在一些实施例中,化学试剂包括式(ii)-q的缀合物
[0243]
[0244]
其中r4如上所定义,且q为配体。
[0245]
在一些实施例中,化学试剂包括式(iii)-q的缀合物
[0246][0247]
其中r5如定义上述和q是配体。
[0248]
在一些实施例中,化学试剂包括式(iv)-q的缀合物
[0249][0250]
其中r8和r9为如上定义,并且q是配体。
[0251]
在一些实施例中,q选自-c
1-6
烷基,-c
2-6
烯基,-c
2-6
炔基,芳基,杂芳基,杂环基,-n=c=s,-cn,-c(o)rn,-c(o)oro,-sr
p
或-s(o)2rq;其中-c
1-6
烷基,-c
2-6
烯基,-c
2-6
炔基,芳基,杂芳基和杂环基分别为未取代或取代的,且rn,ro,r
p
和rq分别为独立地选自-c
1-6
烷基,-c
1-6
卤代烷基,-c
2-6
烯基,-c
2-6
炔基,芳基,杂芳基和杂环基。在一些实施例中,q选自:炔基,芳基,杂芳基和杂环基。在一些实施例中,q选自:
[0252]
在一些实施例中,q是荧光团。在一些实施例中,q选自镧系元素,铕,铽,xl665,d2,量子点,绿色荧光蛋白,红色荧光蛋白,黄色荧光蛋白,荧光素,罗丹明,曙红,德克萨斯红,花青,吲哚碳菁,奥卡碳菁(ocacarbocyanine),硫代碳菁(thiacarbocyanine),部花菁(merocyanine),吡啶基恶唑(pyridyloxadole),苯并恶二唑,级联蓝(cascade blue),尼罗红,恶嗪170,吖啶橙,普罗拉文(proflavin),金胺,孔雀石绿结晶紫,卟啉酞菁和胆红素。
[0253]
在其他方面,提供了用于用一种以上的标记物标记末端氨基酸或被修饰的切割酶去除的氨基酸的试剂。
[0254]
在一些实施例中,标记末端氨基酸(例如,ntaa)或通过修饰的切割酶去除的氨基酸包括使用第一试剂和第二试剂。在一些实施例中,末端氨基酸被第一试剂和第二试剂同时或顺序地标记。在一些实施例中,如本文所述,第一试剂包括选自式(i),(ii),(iii)和(iv)的化合物或其盐或缀合物的化合物。
[0255]
在一些实施例中,第二试剂包括式(va)或(vb)的化合物:
[0256][0257]
或其盐或缀合物,
[0258]
其中
[0259]r13
为h,c
1-6
烷基,芳基,杂芳基,环烷基或杂环基,其中c
1-6
烷基,芳基,杂芳基,环烷基和杂环基各自为未取代或取代的;或者
[0260]r13-x
ꢀꢀꢀ
(vb)
[0261]
其中
[0262]r13
为c
1-6
烷基,芳基,杂芳基,环烷基或杂环基,其各自为未取代的或取代的;并且x是卤素。
[0263]
在式(va)的一些实施例中,r
13
为h。在一些实施例中,r
13
为甲基。在一些实施例中,r
13
为乙基,丙基,异丙基,丁基,异丁基,仲丁基,戊基或己基。在一些实施例中,r
13
为取代的c
1-6
烷基。在一些实施例中,r
13
为被芳基,杂芳基,环烷基或杂环基取代的c
1-6
烷基。在一些实施例中,r
13
为被芳基取代的c
1-6
烷基。在一些实施例中,r
13


ch2ch2ph,

ch2ph,

ch(ch3)ph或

ch(ch3)ph。
[0264]
在式(vb)的一些实施例中,r
13
是甲基。在一些实施例中,r
13
为乙基,丙基,异丙基,丁基,异丁基,仲丁基,戊基或己基。在一些实施例中,r
13
为取代的c
1-6
烷基。在一些实施例中,r
13
为被芳基,杂芳基,环烷基或杂环基取代的c
1-6
烷基。在一些实施例中,r
13
为被芳基取代的c
1-6
烷基。在一些实施例中,r
13


ch2ch2ph,

ch2ph,

ch(ch3)ph或

ch(ch3)ph。
[0265]
在一些实施例中,用于修饰或标记末端氨基酸或被修饰的切割酶去除的氨基酸的试剂包括甲醛。在一些实施例中,用于修饰或标记末端氨基酸的试剂包括碘甲烷。
[0266]
在一些实施例中,多肽还与还原剂接触。在一些实施例中,还原剂包括硼氢化物,例如nabh4,kbh4,znbh4,nabh3cn或libu3bh。在一些实施例中,还原剂包括铝或锡化合物,例如lialh4或sncl。在一些实施例中,还原剂包括硼烷复合物,例如b2h6和二甲基胺硼烷。在一些实施例中,试剂另外包括nabh3cn。
[0267]
在一些实施例中,可用于标记末端氨基酸的试剂(例如,ntaa)包括:4-硫代苯基异硫氰酸酯(磺基-pitc)、4-硝基苯基异硫氰酸酯(硝基-pitc)、3-吡啶基异硫氰酸酯(pyitc)、异氰酸苯酯(pic)、硝基pic、磺基pic、羧基活化的氨基阻断氨基酸、酸酐(例如、靛红酸酐、异烟酸酐、氮杂靛红酸酐、琥珀酸酐)、2-哌啶基乙基异硫氰酸酯(peitc)、3-(4-吗啉代)异硫氰酸丙酯(mpitc)、3-(二乙氨基)丙基异硫氰酸酯(deptic)(wang et al.,2009,anal chem 81:1893-1900)、(1-氟-2,4-二硝基苯(sanger's试剂、dnfb)、丹磺酰氯(dns-cl或1-二甲基氨基萘-5-磺酰氯)、4-磺酰基-2-硝基氟苯(snfb)、乙酰化试剂、酰胺化(胍基化)试剂(包括pca和pca衍生物)、2-羧基-4,6-二硝基氯苯、7-甲氧基香豆素乙酸、硫代酰化试剂、硫代乙酰化试剂和/或硫代苄基化试剂。这些试剂中有许多与dna无反应或具有最小的反应性,包括pitc,硝基pitc,磺基pitc,pyitc和胍基化试剂(例如,pca化合物)。如果氨基酸被阻止标记,则有许多方法可以解除对末端的保护,例如用酰基肽水解酶(aph)去除n-乙酰基(farries,harris et al.,1991,eur.j.biochem.196:679-685)。解开肽的n-末端的方法是本领域已知的(参见,例如,krishna et al.,1991,anal.biochem.199:45-50;leone et al.,2011,curr.protoc.protein sci.,chapter 11:unit11.7;fowler et al.,2001,
curr.protoc.protein sci.,chapter 11:unit 11.7,其每一个都通过引用整体并入本文)。
[0268]
丹磺酰氯与肽的游离胺基反应生成ntaa的丹磺酰衍生物。dnfb和snfb与α肽的α-胺基反应,分别产生dnp-ntaa和snp-ntaa。此外,dnfb和snfb也会与赖氨酸残基的ε-胺基反应。dnfb也与酪氨酸和组氨酸氨基酸残基反应。在一些实施例中,snfb对胺基的选择性比dnfb更好。(carty et al.,j biol chem(1968)243(20):5244-5253)。在某些实施例中,赖氨酸ε-胺基在多肽蛋白酶消化成肽之前,先用有机酐将其预阻断。
[0269]
已显示在离子液体存在下,异硫氰酸酯与伯胺的反应性增强。离子液体在有机化学反应中是极好的溶剂(并用作催化剂),并且可以增强异硫氰酸酯与胺基的反应形成硫脲。此外,离子液体可以充当微波辐射的吸收剂,以进一步增强反应性(martinez-palou,j.mex.chem.soc(2007)51(4):252-264)。一个例子是使用离子液体四氟硼酸1-丁基-3-甲基咪唑鎓[bmim][bf4]将苯基异硫氰酸酯(pitc)快速有效地官能化芳族和脂族胺基(le,chen et al.2005)。
[0270]
在一些实施例中,可以通过用如下式所示的包括式(ab)的化合物的化学试剂处理来标记该肽:
[0271][0272]
在一些实施例中,用化学试剂处理以修饰肽的n-末端氨基酸(ntaa)的肽,用二杂环甲胺试剂来处理。在一些实施例中,用于修饰或标记末端氨基酸或被修饰的切割酶去除的氨基酸的试剂包括式(ab)的化合物:
[0273]
[0274]
其中:
[0275]
r2为h,r4,oh,or4,nh2或-nhr4;
[0276]
r4是c
1-6
烷基,其任选地被一个或两个选自卤素,c
1-3
烷基,c
1-3
烷氧基,c
1-3
卤代烷基,苯基,5-元杂芳基和6-元杂芳基,其中每个苯基,5元杂芳基和6元杂芳基任选地被选自卤素,-oh,c
1-3
烷基,c
1-3
烷氧基,c
1-3
卤代烷基,no2,cn,coor”和con(r”)2中的一个或两个成员所取代,
[0277]
其中每个r”独立地为h或c
1-3
烷基;
[0278]
环a和环b各自独立地为5元杂芳基环,其中包括至多三个n原子且各自任选地稠合至另外的苯基上,或为5-6元杂芳基环,并且其中5元杂芳基环和任选地稠合苯基或5-6元杂芳基环各自任选地被选自c
1-4
烷基,c
1-4
烷氧基,-oh,卤素,c
1-4
卤代烷基,no2,coor,conr2,-so2r*,-nr2,苯基和5-6元杂芳基的一个或两个基团取代;
[0279]
其中每个r独立地选自h和任选地被oh,or*,-nh2,-nhr*或-nr*2取代的c
1-3
烷基;和
[0280]
每个r*为c
1-3
烷基,任选地被oh,氧代,c
1-2
烷氧基或cn取代;
[0281]
其中相同n上的两个r或两个r”或两个r*可以任选地结合形成4-7元杂环,任选地包括选自n,o和s的另外的杂原子作为环成员,和任选地被选自卤素,c
1-2
烷基,oh,氧代,c
1-2
烷氧基或cn的一个或两个基团所取代。
[0282]
或其盐。在一些实施例中,环a和环b都不都是未取代的咪唑,并且环a和环b也不都是未取代的苯并三唑;
[0283]
在该实施例的一个实例中,r2为h或r4。在这些实施例中,在这些实施例中,当5-元杂芳基存在时,其可以是包括一至三个选自n,o和s的杂原子作为环成员的5-元环,并且当6-元杂芳基存在时,其可以是包括一至三个氮原子作为环成员的6-元环。在这些实施例的一些中,环a和环b都不是未取代的咪唑或未取代的苯并三唑。在一些实施例中,r2是h。在这些实施例中的一些中,环a和环b都不是未取代的咪唑或未取代的苯并三唑。
[0284]
在一些实施例中,环a和环b是不同的。在一些实施例中,环a和环b相同。该实施例的特定化合物包括:
[0285][0286]
在一些方面,每个5-6元杂芳基环是独立选择的,并且含有1或2个选自n,o和s的杂
原子作为环成员。在这些实施例中,存在的每个5-元杂芳基可以是包括一个或两个选自n,o和s的杂原子作为环成员的5-元环,并且6-元杂芳基可以是包括一个到两个氮原子作为环成员的6-元环。
[0287]
在一些特定的实施例中,环a和环b选自:
[0288][0289]
其中:
[0290]
每个r
x
,ry和rz独立地选自h,卤素,c
1-2
烷基,c
1-2
卤代烷基,no2,so2(c
1-2
烷基),coor
#
和c(o)n(r
#
)2,和任选被选自卤素,c
1-2
烷基,c
1-2
卤代烷基,no2,so2(c
1-2
烷基),coor
#
和c(o)n(r
#
)2的一个或两个基团所取代的苯基,
[0291]
环的相邻原子上的两个r
x
,ry或rz可以任选地一起形成形成苯基,5元杂芳基或稠合到该环上的6元杂芳基团,以及稠合的苯基,5元杂芳基,或6元杂芳基团可任选被选自卤素,c
1-2
烷基,c
1-2
卤代烷基,no2,so2(c
1-2
烷基),coor
#
和c(o)n(r
#
)2的一个或两个基团所取代;
[0292]
其中每个r
#
独立地为h或c
1-2
烷基;并且其中相同氮上的两个r
#
可以任选地一起形成4-7元杂环,其任选地包括选自n,o和s的另外的杂原子作为环成员,其中所述4-7元杂环被任选地被选自卤素,oh,ome,me,氧代,nh2,nhme和nme2中的一个或两个基团所取代;
[0293]
或其盐。
[0294]
在这些实施例中,存在的每个5元杂芳基可以是包括一个到三个选自n,o和s的杂原子作为环成员的5元环,并且6-元杂芳基可以是包括一个到三个氮原子作为环成员的6-元环。
[0295]
在一些实施例中,环a和环b相同并且选自:
[0296][0297][0298]
实施例30的化合物,其选自以下:
[0299][0300]
2.其他标签
[0301]
在一些实施例中,标记是能够被修饰的切割酶识别或结合的任何标记。在一些实施例中,末端氨基酸标记是或包括“模拟”末端氨基酸(例如,n-末端氨基酸)的大小/形状的标记。在一些实施例中,标记是修饰的氨基酸,氨基酸的一部分,受保护的氨基酸,被阻断的氨基酸或其任何组合。在一些实施例中,附着于末端氨基酸的标记是n-末端阻断的(无α胺基)氨基酸。
[0302]
在一些实施例中,标记物包括氨基酸,其是天然存在的或合成的任何氨基酸。在一些实施例中,标记是合成的阻断的氨基酸。通常,可以使用任何合适的引入氨基酸阻断基团的方法。在一些实施例中,通过使氨基酸与引入阻断基团的试剂反应来引入阻断基团。任何合适的活化和阻断的氨基酸均可用于标记末端氨基酸。参见,例如,kruse et al.,j.org.chem.(1985)50(15):2792-2794。例如,包括一个或多个外源性氨基酸的合成标记(例如,-xaa-标记或-xaa-xaa-标记)可以用作标记,并附着于多肽上,以用修饰的切割酶处理。
[0303]
在一些实施例中,氨基酸阻断基团可以是单价或二价的合适基团,包括酰基,例如低级烷酰基(如乙酰基),取代的低级烷酰基(举例如低级卤代烷酰基如氯乙酰基),芳基低级烷酰基(如苯基乙酰基),以及芳酰基(例如苯甲酰基或邻苯二甲酰基);低级烷氧羰基(例如乙氧羰基,异丁氧羰基或叔丁氧羰基)和取代的低级烷氧羰基(举例如低级卤代烷氧羰基如2,2,2-三氯乙氧羰基);芳基-低级烷氧羰基(例如苄氧羰基);磺酰基(例如低级烷基磺酰基如甲磺酰基)和芳基磺酰基(举例如苯磺酰基或对甲苯磺酰基);通过与形成席夫斯碱的醛和酮反应形成的亚烷基,例如苯甲醛,水杨醛或乙酰乙酸酯;并且-二价基团,使得氮原子形成二氢吡啶环的一部分,这样的保护基团例如通过与甲醛和β-酮酸酯(如乙酰乙酸酯)反应而获得。
[0304]
在任何此类实施例中的一些实施例中,用于去除的肽的标记(例如ntaa的标记)包括将包括氨基酸的标记与标记连接。例如,标记的氨基酸是市售的,例如cbz-氨基酸(例如,n-cbz-dl-丝氨酸,n-cbz-l-天冬氨酸)或n-保护的氨基酸。在一些实施例中,用于去除的末端氨基酸的标记包括将cbz-氨基酸作为标记附着于用于去除的末端氨基酸。在一些特定的实施例中,标记包括将包括两个氨基酸的标记与标记连接。例如,包括-xaa-xaa-标记(例如,z-gly-gly-osu)的合成标记可以用作标记,并附着于肽上,以用修饰的切割酶处理。
[0305]
在一些实施例中,标记物包括具有ac保护的胺基的氨基酸。在一些实例中,标记物包括被fmoc,boc或cbz保护的氨基酸。在其他实例中,标记的氨基酸包括带有胺基的氨基酸,该胺基为二烷基。在其他实例中,标记的氨基酸的羧酸是游离的,并且使用标准的肽偶联剂例如hatu diea或edc diea hobt将氨基酸偶联。在其他实例中,标记包括可以是d或l手性的氨基酸。
[0306]
在一些实施例中,其中包括一种或多种外源性氨基酸的合成标记被作为标记使用并附着于多肽上,修饰的切割酶从多肽中去除二肽,该二肽包括多肽的一个氨基酸和作为标记一部分添加的一个外源性氨基酸。在某些情况下,外源性氨基酸xaa可能代表选自ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、tyr和val的任何氨基酸残基。例如,如果在n-末端的多肽具有-p3-p2-p1,则将包括xaa-标记的标记物添加至在该末端的多肽以形成-p3-p2-p1-xaa-标记。然后将示例性的修饰的切割酶与标记的多肽接触以从多肽切割包括-p1-xaa-标记的二肽,从而从多肽的n-末端去除p1氨基
酸。在一些特定的实施例中,衍生自未修饰或野生型三肽切割酶的修饰的切割酶可以从多肽中除去包括p2-p1-xaa-标记的三肽,从而从多肽的n-末端除去p1和p2氨基酸。
[0307]
在一些实施例中,其中包括两个外源性氨基酸(例如,-xaa-xaa-标记)的合成标记用作标记并连接到多肽,修饰的切割酶可以从多肽中除去三肽,所述三肽包括多肽的一个氨基酸和作为标记的一部分添加的两个外源性氨基酸。例如,如果在n-末端的多肽具有-p3-p2-p1,则将包括xaa-xaa-标记的标记添加至在末端的多肽以形成-p3-p2-p1-xaa-xaa-标记。然后将示例性的修饰的切割酶与标记的多肽接触以从多肽切割包括-p1-xaa-xaa-标记的三肽,从而从多肽的n-末端去除p1氨基酸。
[0308]
b.工程化与遗传选择
[0309]
在一些实施例中,可以使用任何合适的方法来制备,分离,工程化或选择本文提供的修饰的切割酶。在某些情况下,这通过引入一个或多个氨基酸残基的取代,添加或缺失,与野生型或未修饰的切割酶相比,变异的或修饰的切割酶多肽的一级氨基酸序列发生改变。在一些实施例中,修饰的切割酶通过工程化和遗传选择,衍生自野生型或未修饰的切割酶(例如,二肽基肽酶、二肽基氨基肽酶、肽基-二肽酶、二肽基羧基肽酶、sedolisin、三肽基肽酶或分类为ec 3.4.14、ec 3.4.15、merops s8、merops s9、merops s33、merops s46、merops m49或merops s53的蛋白质或其功能同源物或其片段)。可以采用多种技术,包括遗传选择,蛋白质工程,重组方法,化学合成或其组合。
[0310]
在一些实施例中,使用用于选择活性,底物结合能力或其他切割特征的合理设计方法来工程化修饰的切割酶。在一些实施例中,合理的设计方法是基于未修饰的切割酶的晶体结构。在一些实例中,合理的设计方法是基于未修饰的切割酶与底物的晶体结构,以鉴定用于修饰的靶氨基酸残基。在某些情况下,修饰可以靶向未修饰的切割酶的特定结构域的残基(参见例如sakamoto et al.,scientific reports 2014,4:4977)。在一些实施例中,合理的设计用于在未修饰的切割酶的底物结合结构域中的修饰的氨基酸工程化修饰的切割酶。在一些实施例中,参考seq id no:5的编号或人二肽基肽酶3(dpp3)的序列或其同源物,突变,例如一个或多个氨基酸修饰(例如,取代,添加,缺失)对应于位置316、391、394或其组合。在一些实施例中,合理的设计用于工程化修饰的切割酶,与未修饰的切割酶相比,该修饰的切割酶能够结合或切割长度增加的多肽。在一些实施例中,参考seq id no:5的编号,突变,例如一个或多个氨基酸修饰(例如,取代,添加,缺失)对应于一个或多个位置氨基酸残基419、420、421、422、423、424、425、426,或其组合。在一些实施例中,合理的设计用于用未修饰的切割酶的铰链区中的修饰的氨基酸工程化修饰的切割酶。
[0311]
在一些实施例中,遗传选择或其他工程化方法被设计为鉴定对标记的多肽(例如化学标记的多肽)有活性的修饰的切割酶。在一些实施例中,遗传选择或其他工程化方法被设计为鉴定对具有标记的n-末端氨基酸的修饰的或标记的多肽有活性的修饰的切割酶。在某些情况下,在遗传选择或其他工程化方法的设计中考虑标记多肽上部分或标记的大小或其他特征,以获得所需的修饰的切割酶。
[0312]
应当理解,提及氨基酸,包括提及如seq id no所示的用于描述野生型或修饰的切割酶的结构域组织的特定序列是为了说明性目的,而不意味着限制所提供的实施例的范围。应当理解,多肽及其结构域的描述是基于同源性分析和与相似分子的比对理论上得出的。因此,确切的基因座可以变化,并且每种蛋白质不一定相同。因此,在衍生自另一物种的
同系物或酶中,可以使用已知的分析和比对方法识别特异性结构域,例如特异性结合结构域,环结构域或其他功能性结构域。
[0313]
在一些实例中,可以使用野生型切割酶(例如,野生型dap bii)及其底物的晶体结构分析来选择在野生型二肽切割酶中修饰的氨基酸,以鉴定蛋白质相互作用界面上的接触残基和其他残基。例如,可以使用rosetta软件套件进行大分子建模来进行此分析(das et al.,annu rev biochem(2008)77:363-382)。在一些实施例中,使用所选的用于修饰的靶残基,可以使用其他生物体的野生型切割酶序列的比对来鉴定保守残基(crooks et al.,genome res(2004)14(6):1188-1190)。基于该分析,可以修饰同源物中的保守靶残基或相应残基。在一些实施例中,修饰所识别的接触残基或其他感兴趣的残基以引入新的功能。如图.4a-4c所示,对具有60%序列相似性或同一性的dap bii同源物的weblogo分析显示了跨各种残基的序列保守性。例如,参照seq id no:20所示的野生型dap bii序列,观察到dap bii的胺基结合位点处的残基的保守性,包括位置n215,w216,r220,n330和d674。在另一个实例中,参考seq id no:20中列出的野生型dap bii序列,观察到了dap bii的胺基结合位点处的残基的序列保守性,包括位置g207、k208、f209、g210、g211、d212、i213、d214、n215、w216、m217、w218、p219、r220、h221、t222、g223、a224、f225、a226、a326和/或n334。
[0314]
在一些方面,用于工程化dap bii的合理设计方法可以用于靶向结构域或残基,使得所得的修饰的切割酶使用使用dap bii与底物复合的晶体结构去除或配置成去除标记的n-末端氨基酸(ntaa)。(sakamoto et al.,scientific reports 2014,4:4977)。例如,与肽底物在残基n191、w192、r196、n306和d650(基于seq id no:13所列蛋白质的序列;uniprot登录号v5ym14)处复合的dap bii结构与肽n端胺基相互作用。另外,约20个残基的环(参考seq id no:13的残基183-202)与结合的肽底物的n-末端残基和倒数第二个残基接触。这些胺基结合残基和ntaa以及倒数第二个ntaa结合残基,单独地或组合地,可以被靶向修饰。
[0315]
在一些方面,可能需要修饰未修饰的或野生型切割酶的特异性(参见例如,sakamoto et al.,scientific reports 2014,4:4977)。在一些实例中,可以靶向dap bii的s1亚位点或口袋中的残基以优选的特异性(例如,对于用修饰的切割酶处理的多肽的p1位上的特定氨基酸残基的特异性降低)工程化修饰的切割酶。在一些实施例中,参考seq id no:13的编号,修饰的切割酶包括突变,例如,对应于位置d627,i628,g630,a648,g651,s655,m669或组合的一个或多个氨基酸修饰(例如,取代,添加,缺失)。
[0316]
在一些实施例中,可以使用遗传筛选来鉴定修饰的切割酶变体。在某些情况下,遗传筛选使用基于细胞的系统。在一些实施例中,遗传筛选使用原核细胞,例如包括大肠杆菌变体或突变体的大肠杆菌菌株。在一些实施例中,遗传筛选使用真核细胞,例如酵母双氢化物系统。在一些实施例中,遗传选择被设计为选择具有所需特征的修饰的切割酶,以结合底物,切割和/或去除标记的末端氨基酸。
[0317]
在一些实施例中,进行遗传选择筛选涉及制备各种切割酶基因(例如,二肽基肽酶,二肽基氨基肽酶,肽基-二肽酶,二肽基羧基肽酶,sedolisin或三肽基肽酶)以进行表达。一种使用本领域熟知的标准技术可以容易地构建含有编码突变或修饰的切割酶多肽的核酸序列的质粒或粘粒的质粒。在一些实施例中,任何切割酶(例如,seq id no:5-8、10-16、20中的任何一个)的表达可以进一步包括信号序列。在某些情况下,信号序列的使用可能对纯化目的有用。例如,周质靶向序列例如pelb可以包括在表达构建体中。重组载体可以
使用本领域已知的任何重组技术来产生。
[0318]
在一些实施例中,载体可包括原核复制起点和/或基因的表达赋予可检测或选择标记以在原核系统中繁殖和/或选择的基因。一旦已经准备好用于表达的包括构建体的载体或dna序列,就可以将dna构建体引入合适的宿主中。在一些实施例中,可以使用原核宿主,包括细菌,例如大肠杆菌,芽孢杆菌,链霉菌,假单胞菌,沙门氏菌,沙雷氏菌等。可以采用多种技术,例如原生质体融合,磷酸钙沉淀,电穿孔或其他常规技术。融合后,细胞在培养基中生长并筛选适当的活性。
[0319]
在一些实例中,突变的切割酶基因的文库可以通过易错pcr或合理诱变,使用切割酶的晶体结构作为指导(或其组合)来产生。也可以使用其他合适的产生突变或产生文库的方法。随后可以将突变的切割酶基因文库克隆到载体中,并转化到大肠杆菌营养缺陷型菌株中(可从耶鲁的cssc大肠杆菌遗传储备中心获得-https://cgsc2.biology.yale.edu/)。在一些实施例中,筛选包括分离在选择培养基上生长的菌落,并提取和分析质粒dna以鉴定修饰的切割酶多肽,其从多肽中去除标记的末端氨基酸或标记的末端二肽。在一些实施例中,可以进行筛选以鉴定和分离修饰的切割酶,所述切割酶切割或被配置为切割具有标记的氨基酸(例如,pitc标记的ntaa或cbz标记的ntaa)的多肽。在一些实施例中,遗传筛选旨在选择标记的结合而不是特定氨基酸的结合,因此,筛选使用具有各种标记54的末端氨基酸的多肽。在一些实施例中,选择修饰的切割酶还包括纯化,表征,评估和/或优化修饰的切割酶的活性。可以根据常规方法,例如提取、沉淀、色谱、亲和色谱、电泳等、分离和纯化修饰的切割酶。
[0320]
在一些实施例中,遗传学筛选或其他选择方法也可用于选择并获得具有改变了的切割酶的活性位点或具有改变的切割酶的结合口袋的修饰的切割。在一些实施例中,遗传学筛选或选择方法也可用于选择并获得具有改变了的切割酶的铰链区的修饰的切割酶。在一些实施例中,遗传筛选或选择方法也可用于选择并获得具有改变了的切割酶的结合裂隙的修饰的切割酶。在某些情况下,遗传筛选或选择方法也可用于选择并获得具有改变了的切割酶的叶间裂隙的修饰的切割酶。在一些实施例中,遗传筛选或选择方法也可用于选择并获得具有改变了的切割酶的α胺基结合区修饰的切割酶。例如,与野生型切割酶多肽相比,修饰的切割酶表现出降低的α胺基结合。
[0321]
在一些实施例中,遗传筛选或其他选择方法也可以用于选择并获得经修饰的切割酶,所述切割酶被配置为从各种长度的多肽中去除标记的末端氨基酸。在某些情况下,大肠杆菌外膜中的孔蛋白大小限制了可摄取的肽长度。在一些实施例中,该长度限制是由用tris-edta或能渗透大肠杆菌外膜的e.小分子mac13243简单处理的大肠杆菌来克服(例如,leive,l.(1974).ann n y acad sci 235(0):109-129;muheim,c.(2017).scientific reports 7(1):17629),并允许将肽吸收到周质空间中。在一些实施例中,修饰的切割酶能够从长度大于5个氨基酸、长度大于6个氨基酸、长度大于7个氨基酸、大于8个氨基酸、长度大于9个氨基酸、长度大于10个氨基酸、长度大于15个氨基酸、长度大于20个氨基酸、长度大于25个氨基酸或大于30个氨基酸的多肽中切割氨基酸;或被配置为从长度大于5个氨基酸、长度大于6个氨基酸、长度大于7个氨基酸、大于8个氨基酸、长度大于9个氨基酸、长度大于10个氨基酸、长度大于15个氨基酸、长度大于20个氨基酸、长度大于25个氨基酸或大于30个氨基酸的多肽中去除氨基酸。在一些实施例中,修饰的二肽基肽酶能够从长度小于30个氨
基酸、长度小于40个氨基酸、长度小于50个氨基酸、小于75个氨基酸、长度小于100个氨基酸、长度小于200个氨基酸、长度小于300个氨基酸、长度小于400个氨基酸、长度小于500个氨基酸、小于600个氨基酸长度小于700个氨基酸、长度小于800个氨基酸、长度小于900个氨基酸或长度小于1000个氨基酸长度的多肽中切割氨基酸;或被配置为从长度小于30个氨基酸、长度小于40个氨基酸、长度小于50个氨基酸、小于75个氨基酸、长度小于100个氨基酸、长度小于200个氨基酸、长度小于300个氨基酸、长度小于400个氨基酸、长度小于500个氨基酸、长度小于600个氨基酸、长度小于700个氨基酸、长度小于800个氨基酸、长度小于900个氨基酸或长度小于1000个氨基酸的多肽中去除氨基酸。在一些实施例中,修饰的切割酶能够从长度为5至100个氨基酸之间,长度为10至100个氨基酸之间,长度为20至100个氨基酸之间的多肽中去除氨基酸。长度为30至100个氨基酸,长度为5至50个氨基酸,长度为10至50个氨基酸,长度为20至50个氨基酸,长度为30至50个氨基酸,长度为5至30个氨基酸长度为10到30个氨基酸,长度为20到30个氨基酸,长度为10到20个氨基酸中切割或被配置为去除氨基酸。在一些实施例中,修饰的切割酶能够从长度为50至1000个氨基酸、长度为100至1000个氨基酸、长度为300至1000个氨基酸、长度为500至1000个氨基酸、长度为10至500个氨基酸、长度为50至500个氨基酸、长度为100至500个氨基酸、或长度为200至500个氨基酸的多肽中切割或被配置为去除氨基酸。
[0322]
在一些实施例中,修饰的切割酶能够或被配置为从部分的或消化的蛋白质和多肽(例如蛋白质或多肽片段)中去除氨基酸。在一些实施例中,修饰的切割酶能够或被配置为从完整的或未消化的蛋白质和多肽中去除氨基酸。
[0323]
在一些实施例中,修饰的切割酶通过使多肽与修饰的切割酶接触少于5分钟,少于10分钟,少于20分钟,少于30分钟,少于40分钟,少于50分钟,少于60分钟,少于2小时,少于5小时,少于8小时或少于10小时来去除单个末端氨基酸或末端二肽。
[0324]
在一些实施例中,通过用修饰的切割酶处理多肽约少于15分钟,修饰的切割酶实现了去除末端氨基酸的多肽的产率》30%、》40%、》50%、》60%、》70%、》80%、》90%、》95%、》99%或更多。在一些实施例中,通过用修饰的切割酶处理多肽约少于30分钟,修饰的切割酶实现了去除末端氨基酸的多肽的产率》30%、》40%、》50%、》60%、》70%、》80%、》90%、》95%、》99%或更多。在一些实施例中,通过用修饰的切割酶处理多肽约少于45分钟,修饰的切割酶实现了去除末端氨基酸的多肽的产率》30%、》40%、》50%、》60%、》70%、》80%、》90%、》95%、》99%或更多。在一些实施例中,通过用修饰的切割酶处理多肽约少于1小时,修饰的切割酶实现了去除末端氨基酸的多肽的产率》30%、》40%、》50%、》60%、》70%、》80%、》90%、》95%、》99%或更多。在一些实施例中,通过用修饰的切割酶处理多肽约少于2小时,修饰的切割酶实现了去除末端氨基酸的多肽的产率》30%、》40%、》50%、》60%、》70%、》80%、》90%、》95%、》99%或更多。在一些实施例中,通过用修饰的切割酶处理多肽约少于5小时,修饰的切割酶实现了去除末端氨基酸的多肽的产率》30%、》40%、》50%、》60%、》70%、》80%、》90%、》95%、》99%或更多。
[0325]
在一些实施例中,修饰的二肽或三肽切割酶能够在高于约10℃,高于约20℃,高于约30℃或高于约40℃的温度下切割末端氨基酸或起作用。在一些实施例中,修饰的二肽或三肽切割酶能够在约10℃至20℃、约10℃至30℃、约10℃至40℃。大约10℃至50℃、大约10℃至60℃、大约10℃至70℃、大约10℃至80℃、大约10℃至90℃或大约10℃到100℃;大约20
℃至30℃、大约20℃至40℃、大约20℃至50℃、大约20℃至60℃、大约20℃至70℃、大约20℃至80℃、约20℃至90℃、或约20℃至100℃;约30℃至40℃、约30℃至50℃、约30℃至60℃;约50℃至70℃、约50℃至80℃、约50℃至90℃或约50℃至100℃的温度下切割末端氨基酸或起作用。在一些实施例中,修饰的切割酶能够在多肽的二级结构被破坏的温度下切割末端氨基。在一些实施例中,修饰的切割酶在约20至25℃下起作用。在一些实施例中,该方法包括在加热的同时使修饰的切割酶与多肽接触。在一些实施例中,通过施加微波能来实现加热。在本文提供的任何方法的一些实施例中,修饰的切割酶与多肽的接触以去除末端氨基酸是在微波能存在下进行的。
[0326]
本文提供了如第一部分所述编码的任何修饰的切割酶的分离的dna分子。还提供了重组表达载体,其包括如部分i所述的编码任何修饰的切割酶的dna分子。在某些情况下,dna分子和重组表达从所述的基因工程和选择方法中分离出载体。在某些情况下,还提供了包括dna分子的宿主细胞。
[0327]
在一些实施例中,本文提供了产生修饰的或变异的切割酶的方法,包括在细胞中表达蛋白质的条件下将根据本文所述的任何实施例的核酸分子或根据本文所述的任何实施例的载体引入宿主细胞。本文还提供了产生本文提供的任何修饰的切割的方法,所述方法包括:在适于所述修饰的切割酶表达的条件下培养转化的宿主细胞,以及分离,纯化和/或回收表达所述修饰的切割酶的突变生物。在一些实施例中,本文提供了包括编码修饰的切割酶的dna分子的宿主细胞。在一些实施例中,宿主细胞包括用于表达修饰的切割酶的重组表达载体。在一些实施例中,该方法进一步包括从细胞中分离或纯化变异或修饰的切割酶。
[0328]
在一些实施例中,本文提供了工程化的细胞,其表达根据本文描述的任何实施例的变异的或修饰的切割酶多肽或编码本文描述的变体或修饰的切割酶的核酸分子,或根据本文描述的任何实施例的载体。在一些实施例中,变异的或修饰的切割酶多肽包括信号肽。
[0329]
ii.多肽
[0330]
在一些实施例中,本发明涉及用本文提供的任何修饰的切割酶处理多肽。在一些实施例中,从多肽(包括部分或片段的多肽)去除标记的末端氨基酸。
[0331]
在一些实施例中,从具有大于4个氨基酸、大于5个氨基酸、大于6个氨基酸、大于7个氨基酸、大于8个氨基酸、大于9个氨基酸、大于10个氨基酸、大于11个氨基酸、大于12个氨基酸、大于13个氨基酸、大于14个氨基酸、大于15个氨基酸、大于20个氨基酸、大于25个氨基酸酸或大于30个氨基酸的长度的多肽中去除末端氨基酸。在某些情况下,多肽的长度大于10个氨基酸。在一些实施例中,从长度小于30个氨基酸、小于40个氨基酸、小于50个氨基酸、小于75个氨基酸、小于100个氨基酸、小于200个氨基酸、小于300个氨基酸、小于400个氨基酸、小于500个氨基酸、小于600个氨基酸、小于700个氨基酸、小于800个氨基酸、小于900个氨基酸或小于1000个氨基酸的长度的多肽中去除末端氨基酸。在一些实施例中,从长度为介于5至100个氨基酸之间、介于10至100个氨基酸之间、介于20至100个氨基酸之间、介于30至100个氨基酸之间、介于5至50个氨基酸之间、介于10至50个氨基酸之间、介于20至50个氨基酸之间、介于30至50个氨基酸之间、介于5至30个氨基酸之间、介于10至30个氨基酸之间、介于20至30个氨基酸之间、介于10至20个氨基酸之间的长度的多肽中去除末端氨基酸。在一些实施例中,从长度为介于50至1000个氨基酸之间、介于100至1000个氨基酸之间、介于
300至1000个氨基酸之间、500至1000个氨基酸之间、介于10至500个氨基酸之间、介于50至500个氨基酸之间、介于100至500个氨基酸之间、或介于200至500个氨基酸之间的多肽中去除末端氨基酸。
[0332]
在一些实施例中,从部分或消化的蛋白质和多肽(例如,多肽片段)中去除末端氨基酸。在一些实施例中,末端氨基酸从完整或未消化的蛋白质和多肽中去除。
[0333]
用本文提供的修饰的切割酶和根据本文公开的方法处理的多肽可从合适的来源或样品获得,包括但不限于:生物学样品,例如细胞(原代细胞和培养的细胞系)、细胞裂解物或提取物、细胞器或囊泡、包括外泌体、组织和组织提取物;活检;粪便;体液(例如血液、全血、血清、血浆、尿液、淋巴、胆汁、脑脊液、间质液、房水或玻璃体液、初乳、痰液、羊水、唾液、肛门和阴道分泌物、汗液和精液、渗出液、分泌液(例如,从脓肿或任何其他感染或炎症部位获得的液体)或关节(正常关节或受风湿性关节炎、骨关节炎、痛风或败血性关节炎等疾病影响的关节)获得的液体几乎所有生物都是首选,尤其是哺乳动物来源的样品,包括含微生物组的样品、人类来源的样品、包括含微生物组的样品、是特别优选的;环境样品(例如空气、农业、水和土壤样品);微生物样品,包括衍生自微生物生物膜和/或群落的样品,以及微生物孢子;研究样本包括细胞外液、细胞培养的细胞外上清液、细菌中的包涵体、包括线粒体的隔室和细胞周质。
[0334]
在某些实施例中,多肽是蛋白质或蛋白质复合物。多肽的氨基酸序列信息和翻译后修饰被转导至可通过下一代测序方法分析的核酸编码文库。多肽可包括l-氨基酸,d-氨基酸或两者。多肽可包括标准的天然存在的氨基酸,修饰的氨基酸(例如,翻译后修饰),氨基酸类似物,氨基酸模拟物或其任何组合。在一些实施例中,多肽是天然存在的,合成产生的或重组表达的。在任何上述实施例中,多肽可进一步包括翻译后修饰。
[0335]
标准的天然氨基酸包括丙氨酸(a或ala)、半胱氨酸(c或cys)、天冬氨酸(d或asp)、谷氨酸(e或glu)、苯丙氨酸(f或phe)、甘氨酸(g或gly)、组氨酸(h或his)、异亮氨酸(i或ile)、赖氨酸(k或lys)、亮氨酸(l或leu)、蛋氨酸(m或met)、天冬酰胺(n或asn)、脯氨酸(p或pro)、谷氨酰胺(q或gln)、精氨酸(r或arg)、丝氨酸(s或ser)、苏氨酸(t或thr)、缬氨酸(v或val)、色氨酸(w或trp)和酪氨酸(y或tyr)。非标准氨基酸包括硒代半胱氨酸、吡咯赖氨酸、和n-甲酰甲硫氨酸、β-氨基酸、均氨基酸、脯氨酸和丙酮酸衍生物、3-取代的丙氨酸衍生物、甘氨酸衍生物、环取代的苯丙氨酸和酪氨酸衍生物、线性核氨基酸和n-甲基氨基酸。
[0336]
多肽的翻译后修饰(ptm)可以是共价修饰或酶促修饰。翻译后修饰的实例包括但不限于酰化、乙酰化、烷基化(包括甲基化)、生物素化、丁酰化、氨基甲酰化、羰基化、脱酰胺基、脱亚氨基、二苯甲酰胺形成、二硫键形成、消除、黄素附着、甲酰化、γ-羧化、谷氨酰化、糖基化、糖基化(例如、n-连接、o-连接、c-连接、磷酸糖基化)、糖基磷脂酰肌醇化、血红素c附着、羟基化、羟脯氨酸形成、碘化、异戊烯基化、脂质化、脂酰化、丙二酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化、聚乙二醇化、磷酸泛酰化、磷酸化、异戊烯化、丙酰化、亚视听席夫碱形成、s-谷胱甘肽化、s-亚硝基化、s-亚磺酰基化、硒化、琥珀酰化、硫化、泛素化和c-末端脒化。翻译后修饰包括肽,多肽或蛋白质的氨基末端和/或羧基末端的修饰。末端氨基的修饰包括但不限于:脱氨基,n-低级烷基,n-二-低级烷基和n-酰基修饰。末端羧基的修饰包括但不限于酰胺,低级烷基酰胺,二烷基酰胺和低级烷基酯修饰(例如,其中低级烷基为c
1-c4烷基)。翻译后修饰还包括落在肽、多肽或蛋白质的氨基和羧基末端之间的氨基酸的修饰,例
如但不限于上述那些修饰。翻译后修饰可以调节细胞内蛋白质的“生物学”,例如其活性,结构,稳定性或定位。磷酸化是最常见的翻译后修饰,并且在蛋白质的调节中,特别是在细胞信号传导中起重要作用(prabakaran et al.,(2012)wiley interdiscip rev syst biol med 4:565-583)。已显示向蛋白质中添加糖(例如糖基化)可促进蛋白质折叠,提高稳定性并调节调节功能。脂质附着至蛋白质使得能够靶向细胞膜。翻译后修饰还可包括包括一个或多个可检测标记的修饰。
[0337]
在某些实施例中,多肽可以被片段化。例如,片段化的多肽可以通过片段化来自样品(例如生物样品)的多肽,蛋白质或蛋白质复合物而获得。多肽,蛋白质或蛋白质复合物可以通过本领域已知的任何方式进行片段化,包括通过蛋白酶或内肽酶进行片段化。在一些实施例中,通过使用特异性蛋白酶或内肽酶靶向多肽,蛋白质或蛋白质复合物的片段化。特定蛋白酶或内肽酶以特定共有序列结合和切割(例如,对enlyfq\\s共有序列具有特异性的tev蛋白酶)。在其他实施例中,通过使用非特异性蛋白酶或内肽酶,肽,多肽或蛋白质的片段是非靶向的或随机的。非特异性蛋白酶可以结合并切割特定氨基酸残基而不是共有序列(例如,蛋白酶k是非特异性丝氨酸蛋白酶)。蛋白酶和内肽酶是本领域众所周知的,可用于将蛋白质或多肽切割成较小的肽片段的实例包括蛋白酶k、胰蛋白酶、胰凝乳蛋白酶、胃蛋白酶、嗜热菌蛋白酶、凝血酶、xa因子、弗林蛋白酶、内肽酶、木瓜蛋白酶、胃蛋白酶、枯草杆菌蛋白酶、弹性蛋白酶、肠激酶、genenase
tm
i、内蛋白酶lysc、内蛋白酶aspn、内蛋白酶gluc等。(granvogl et al.,(2007)anal bioanal chem 389:991-1002)。在某些实施例中,肽,多肽或蛋白质被蛋白酶k或任选地蛋白酶k的不耐热形式片段化以能够快速失活。蛋白酶k在变性试剂(例如尿素和sds)中非常稳定,能够消化完全变性的蛋白质。
[0338]
在一些实施例中,除了修饰的切割酶之外,使多肽与一种或多种酶接触以消除ntaa(例如,脯氨酸氨基肽酶以除去n-末端脯氨酸,如果存在的话)。在一些实施例中,该另外的酶从作为脯氨酸的多肽中消除了ntaa。在一些具体的例子中,该酶是脯氨酸氨基肽酶,脯氨酸亚肽酶(pip)或焦谷氨酸氨基肽酶(pgap)。在一些实施例中,将一种或多种修饰的切割酶与其他酶组合使用以处理多肽。在一些实施例中,首先在适合去除n-末端脯氨酸(如果存在的话)的条件下使多肽与脯氨酸氨基肽酶接触。
[0339]
化学试剂也可用于将蛋白质消化成肽片段。化学试剂可以在特定的氨基酸残基处切割(例如,溴化氰水解蛋氨酸残基c-末端的肽键)。用于将多肽或蛋白质片段化为较小肽段的化学试剂包括溴化氰(cnbr),羟胺,肼,甲酸,bnps粪臭素[2-(2-硝基苯基亚磺酰基)-3-甲基吲哚],碘代苯甲酸,
·
ntcb ni(2-硝基-5-硫代氰基苯甲酸)等。
[0340]
在某些实施例中,一些多肽可以用用于酶促或化学消除的试剂处理。在某些实施例中,在酶或化学消除之后,所得的多肽片段具有大约相同的期望长度,例如,从约10个氨基酸至约70个氨基酸、从约10个氨基酸至约60个氨基酸、从约10个氨基酸至约50个氨基酸、约10至约40个氨基酸、约10至约30个氨基酸、约20个氨基酸至约70个氨基酸、约20个氨基酸至约60个氨基酸、约20个氨基酸至约50个氨基酸、约20至约40个氨基酸、约20至约30个氨基酸、约30个氨基酸至约70个氨基酸、约30个氨基酸至约60个氨基酸、约30个氨基酸-约50个氨基酸、或约30个氨基酸-约40个氨基酸。可以优选地通过用包括含有蛋白酶或内肽酶消除位点的肽序列的短测试fret(荧光共振能量转移)多肽掺入蛋白质或多肽样品来监测消除反应,优选地是实时的。在完整的fret肽中,荧光基团和猝灭基团附着到含有消除位点的肽
序列的任一端,并且猝灭剂和荧光团之间的荧光共振能量转移导致低荧光。一旦蛋白酶或内肽酶消除测试肽后,猝灭剂和荧光团就被分离,从而大大提高了荧光强度。当达到一定的荧光强度时,可以终止消除反应,从而实现可再现的消除终点。
[0341]
a.提供连接到载体或在溶液中的多肽
[0342]
在一些实施例中,本公开的多肽连接至固相载体的表面(也称为“底物表面”)。在某些情况下,在与修饰的切割酶接触之前,将多肽与固相载体连接。在某些情况下,修饰的切割酶从(直接或间接)连接至固相载体的多肽中去除标记的末端氨基酸。在一些实施例中,标记的末端氨基酸作为单个氨基酸或作为二肽的一部分被除去。
[0343]
固相载体可以是任何多孔或无孔载体表面、包括但不限于珠、微珠、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、ptfe膜、ptfe膜、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、尼龙、硅晶片芯片、流通池、流通芯片、包括信号转导电子器件的生物芯片、微量滴定孔、elisa板、旋转干涉仪圆盘(spinning interferometry disc)、硝化纤维膜、基于硝化纤维的聚合物表面、纳米颗粒或微球。固相载体的材料包括但不限于丙烯酰胺、琼脂糖、纤维素、右旋糖苷、硝酸纤维、玻璃、金、石英、聚苯乙烯、聚乙酸乙烯酯、聚丙烯、聚酯、聚甲基丙烯酸酯、聚丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、聚乙烯醇(pva)、聚四氟乙烯、碳氟化合物、尼龙、硅橡胶、聚酸酐、聚乙醇酸、聚氯乙烯、聚乳酸、聚原酸酯、官能化硅烷、聚丙莫酸酯、胶原蛋白、糖胺聚糖、聚氨基酸或其任意组合。固相载体还包括薄膜,膜,瓶,盘,纤维,机织纤维,成形聚合物,例如管,颗粒,珠,微粒或它们的任何组合。例如,当固体表面是珠子时,该珠子可以包括但不限于聚苯乙烯珠子,聚合物珠子,聚丙烯酸酯珠子,甲基苯乙烯珠子,琼脂糖珠子,纤维素珠子,右旋糖酐珠子,丙烯酰胺珠,实心珠,多孔珠,顺磁性珠,玻璃珠,可控孔珠,二氧化硅基珠或它们的任意组合。
[0344]
在某些实施例中,固相载体是珠子,其可以指单个珠子或多个珠子。在一些实施例中,珠子与将用于下游分析的选定的下一代测序平台兼容(例如,solid或454)。在一些实施例中,固相载体是琼脂糖珠,顺磁性珠,聚苯乙烯珠,聚合物珠,丙烯酰胺珠,实心珠,多孔珠,玻璃珠或受控孔珠。在进一步的实施例中,可以用结合官能团(例如,胺基,亲和配体例如链霉抗生物素蛋白,用于结合生物素标记的多肽,抗体)包被珠以促进与多肽的结合。
[0345]
可以通过本领域已知的任何方式,包括共价和非共价相互作用,或其任何组合,将蛋白质,多肽或肽直接或间接地连接至固相载体(参见,例如,chan et al.,2007,plos one 2:e1164;cazalis et al.,bioconj.chem.15:1005-1009;soellner et al.,2003,j.am.chem.soc.125:11790-11791;sun et al.,2006,bioconjug.chem.17-52-57;decreau et al.,2007,j.org.chem.72:2794-2802;camarero et al.,2004,j.am.chem.soc.126:14730-14731;girish et al.,2005,bioorg.med.chem.lett.15:2447-2451;kalia et al.,2007,bioconjug.chem.18:1064-1069;watzke et al.,2006,angew chem.int.ed.engl.45:1408-1412;parthasarathy et al.,2007,bioconjugate chem.18:469-476;and bioconjugate techniques,g.t.hermanson,academic press(2013),并通过引用将其全部内容并入本文)。例如,可以通过连接反应将肽连接至固相载体。或者,固相载体可包括试剂或涂层,以促进将肽直接或间接连接至固相载体。为此目的,可以使用任何合适的分子或材料,包括蛋白质,核酸,碳水化合物和小分子。例如,在一个实施例中,所述试剂是亲和分子。在另一个实例中,该试剂是叠氮基团,该基团可以与另一个分子中的炔基反
应以促进固相载体和另一个分子之间的缔合或结合。
[0346]
可以使用称为“点击化学”的方法将蛋白质,多肽或肽附着到固相载体上。为此目的,可以使用任何快速且基本上不可逆的反应来将蛋白质,多肽或肽附着到固相载体。示例性反应包括叠氮化物和炔烃的铜催化反应以形成三唑(huisgen 1,3-偶极环加成)、应变促进叠氮炔环加成反应(spaac)、二烯与亲二烯体的反应(diels-alder)、应变促进的炔硝基环加成反应、应变烯烃与叠氮化物、四嗪或四唑、烯烃和叠氮化物[3 2]环加成反应、烯烃和四嗪的逆电子需量diels-alder(iedda)反应(例如,间四嗪(mtet)或苯基四嗪(ptet)和反式环辛烯(tco);或ptet和烯烃)、烯烃和四唑的光反应、叠氮化物和膦的施陶丁格连接(staudinger ligation)、以及各种置换反应、例如通过亲电原子的亲核攻击使离去基团置换(horisawa,front physiol(2014).5:457;knall,hollauf et al.,tetrahedron lett(2014)55(34):4763-4766)。示例性的置换反应包括胺基与以下物质的反应:活化的酯;和n-羟基琥珀酰亚胺酯;异氰酸酯;异硫氰酸酯,醛,环氧化物等。
[0347]
在一些实施例中,多肽和固相载体通过能够通过两个互补反应基团的反应形成的官能团连接,所述官能团例如为前述“点击”反应之一的产物的官能团。在各种实施例中,官能团可通过醛、肟、xxxerivatiz、酰肼(hydrazide)炔烃、胺基、叠氮化物、酰基叠氮化物、酰卤、腈、硝酮、巯基、二硫化物、磺酰卤化物、异硫氰酸酯、亚氨基酯(imidoester)、活化的酯(例如,n-羟基琥珀酰亚胺酯,戊酸stp酯)、酮、α,β-不饱和羰基、烯烃、马来酰亚胺、α-卤代酰亚胺、环氧化物、氮丙啶、四嗪、四唑、膦、生物素或具有互补的反应性基团的硫杂环丁烷官能团。示例性的反应是胺基(例如,伯胺)与n-羟基琥珀酰亚胺酯或异硫氰酸酯的反应。
[0348]
在一些实施例中,官能团包括烯烃、酯、酰胺、硫酯、二硫化物、碳环、杂环或杂芳基。在进一步的实施例中,官能团包括烯烃、酯、酰胺、硫酯、硫脲、二硫键、碳环、杂环或杂芳基。在其他实施例中,官能团包括酰胺或硫脲。在一些更具体的实施例中,官能团是三唑基官能团,酰胺或硫脲官能团。
[0349]
在一些实施例中,iedda点击化学用于将多肽固定在固相载体上,因为它是在低输入浓度下快速的并且递送高产量。在另一个实施例中,因为间四嗪具有改良的键稳定性,所以在iedda点击化学反应中使用间四嗪而不是四嗪。在另一个实施例中,在iedda点击化学反应中使用苯基四嗪(ptet)。
[0350]
在一些实施例中,将底物表面用tco官能化,并且将记录标签标记的蛋白质,多肽,肽经由附着的间四嗪部分固定在tco包被的底物表面上。
[0351]
在一些实施例中,多肽通过其c-末端,n-末端或内部氨基酸(例如经由胺基,羧基或巯基基团)固定在固相载体的表面上。用于与胺基偶联的标准活化的载体包括cnbr活化的载体,nhs活化的载体,醛活化的载体,a内酯活化的载体和cdi活化的载体。用于羧基偶联的标准活化的载体包括偶联至胺基载体的碳二亚胺活化的羧基部分。半胱氨酸偶联可以使用马来酰亚胺,氨基乙酰基和吡啶基二硫化物活化的载体。肽羧基末端固定化的另一种方式是使用脱水胰蛋白酶,这是一种胰蛋白酶的催化惰性衍生物,可在其c-末端结合含有赖氨酸或精氨酸残基的肽,而不切割它们。
[0352]
在某些实施例中,多肽通过固体表面结合的接头与蛋白质,多肽或肽的赖氨酸基团的共价连接而固定在固相载体上。
[0353]
在某些实施例中,首先用dna标签标记多肽,然后通过核酸杂交和连接至固相载体
的dna序列连接将嵌合dna-多肽分子固定至固相载体。在一些实施例中,可以在附着dna标签或dna记录标签之前或之后将蛋白质和多肽片段化为肽。
[0354]
b.多肽的选择性加工
[0355]
多肽样品可以在附着到固相载体之前经历蛋白质分离方法,其中蛋白质或肽通过一种或多种特性(例如细胞定位,分子量,疏水性或等电点)或蛋白质富集方法进行分离。或者,或另外地,蛋白质富集方法可以用于选择特定的蛋白质或肽(参见,例如,whiteaker et al.,(2007)anal.biochem.362:44-54)或选择特定的翻译后修饰(参见,例如,huang et al.,(2014)j.chromatogr.a 1372:1-17)。或者,一个或多个特定类别的蛋白质(例如免疫球蛋白)或免疫球蛋白(ig)同种型(例如igg)可被亲和富集或选择用于分析。就免疫球蛋白分子而言,分析与亲和力结合有关的高变序列的序列和丰度或频率是特别有意义的,特别是当它们随着疾病进展而变化或与健康、免疫和/或疾病表型相关时。也可以使用标准免疫亲和方法从样品中减去过多的蛋白质。富含蛋白质的消耗可用于血浆样品,其中超过80%的蛋白质成分是白蛋白和免疫球蛋白。有几种市售产品可用于去除血浆中蛋白质含量过高的样品,例如protia和prot20(sigma-aldrich)。
[0356]
在一些实施例中,本文提供的方法可以对已经标准化的多肽上进行。在一些实施例中,从样品中减去某些蛋白质种类(例如,高度丰富的蛋白质)。例如,这可以通过使用市售的蛋白质消耗试剂(例如sigma的prot20免疫消耗试剂盒)来完成,该试剂可以消耗血浆中前20种蛋白质。此外,采用一种将动态范围进一步减小到可管理的3-4阶的方法将很有用。在某些实施例中,可以通过使用包括电泳和液相色谱法在内的标准分离方法对蛋白质样品进行分离来调节蛋白质样品的动态范围。(zhou et al.,anal chem(2012)84(2):720-734),或将组分分配到装有有限容量蛋白结合珠/树脂(例如羟基化二氧化硅颗粒)的隔室(例如小滴)中(mccormick,anal biochem(1989)181(1):66-74)并洗脱结合的蛋白质。每个隔室化组分中的过量蛋白质将被洗掉。
[0357]
电泳方法的示例包括毛细管电泳(ce),毛细管等电聚焦(cief),毛细管等速电泳(citp),自由流电泳,凝胶洗脱液组分截留电泳(gelfree)。液相色谱蛋白质分离方法的示例包括反相(rp),离子交换(ie),尺寸排阻(se),亲水相互作用等。隔室分区的示例包括乳剂,液滴,微孔,在平坦基材上物理分离的区域,示例性的蛋白质结合珠/树脂包括二氧化硅纳米颗粒xxx用酚基或羟基活化(例如,来自安捷伦科技公司的strataclean树脂,来自labtech公司的rapidclean等)。通过限制珠子/树脂的结合能力,在给定组分中洗脱的高丰度蛋白质将仅部分结合到珠子上,多余的蛋白质将被去除。
[0358]
iii.修饰的切割酶的示例性使用及相关方法
[0359]
本文提供了一种处理一种或多种多肽的方法包括使多肽与修饰的切割酶接触。在一些实施例中,修饰的切割酶包括突变,例如,未修饰的切割酶中的一个或多个氨基酸修饰,其中修饰的切割酶衍生自二肽切割酶,并从多肽中除去单个标记的末端氨基酸。在一些实施例中,修饰的切割酶衍生自三肽切割酶,并从多肽中去除单个标记的末端氨基酸或从多肽中去除单个标记的末端二肽。在一些实施例中,使多肽与如部分i中所述的任何一个或多个修饰的切割酶接触。在一些实施例中,该方法进一步包括使多肽与用于标记末端氨基酸的试剂。在一些实施例中,与用于标记末端氨基酸的试剂接触是与在ia部分中描述的任何一种或多种试剂接触。在一些实施例中,进行一个或多个循环,例如以图2a-2c所描绘的
循环方式,使多肽与修饰的切割酶接触,并与标记末端氨基酸的试剂接触。在一些实施例中,多肽结合到载体上。在一些实施例中,该方法包括将多肽连接至固相载体(例如,直接或间接)。在一些实施例中,使用提供的修饰的切割酶从肽中去除ntaa可以与用于从肽中去除ntaa的化学方法结合,例如在pct公开号wo 2019/089846中描述的。在一些实施例中,去除的标记的末端氨基酸作为单个氨基酸或作为二肽的一部分被去除。
[0360]
在一些实施例中,本文提供的修饰的切割酶可以用于处理待分析和/或测序的多肽。在一些实施例中,该方法用于确定多肽的至少一部分的序列。在一些实施例中,所提供的方法可以在基于降解的多肽测序测定的背景下使用。在某些情况下,该方法可以包括进行国际专利公开号wo 2017/192633所公开的任何方法。在一些情况下,通过构建代表多肽序列的扩展记录标签(例如,dna序列),例如扩展记录标签,来分析多肽的序列。在某些情况下,本文提供的方法适用于proteocode分析或可与proteocode分析结合使用。在采用基于循环降解的多肽分析方法的一些实施例中,提供的修饰的切割酶提供某些优点。例如,与去除未标记氨基酸的酶相比,识别和去除标记的氨基酸可提供氨基酸去除的暂停,所述酶可在可进行测定的其它步骤之前连续地从多肽去除氨基酸(例如,通过结合剂结合ntaa以及将ntaa的信息记录到记录标签中)。因此,在某些情况下,通过识别和去除标记的氨基酸,修饰的切割酶仅在标记步骤发生后才去除ntaa。因此,与去除了未标记的氨基酸的未修饰的切割酶相比,修饰的切割酶提供了对氨基酸去除的控制。
[0361]
在一些实施例中,在不存在使核酸(例如,dna,例如记录标签)降解的条件的情况下,进行包括修饰的切割酶的方法。在一些实施例中,在不存在降解核酸的化学条件的情况下,进行包括修饰的切割酶的方法。在一些实施例中,在与基于降解的多肽测序测定法相容的条件下,进行包括修饰的切割酶的方法(例如,如国际专利公开号wo 2017/192633所描述的方法)。在某些情况下,在与核酸相容的条件下,进行包括修饰的切割酶的方法。在一些实施例中,在不存在强酸或强碱的情况下,进行包括修饰的切割酶的方法。在一些方面,强酸是强无水酸。在一些实例中,在不存在无水tfa的情况下,进行包括修饰的切割酶的方法。
[0362]
在一些实施例中,该方法包括使多肽与一种以上的修饰的切割酶接触。在某些情况下,各种修饰的切割酶割可以表现出不同的特性,例如,多肽的结合偏好和/或切割氨基酸的差异。在一些实施例中,不同的修饰的切割酶可以作为酶的混合物或各自分开地用于任何所描述的方法中。在一些实施例中,将不同的修饰的切割酶同时或顺序地与多肽接触。
[0363]
在一些实施例中,使多肽与一种或多种其他酶接触以消除ntaa(例如,脯氨酸氨基肽酶以除去n-末端脯氨酸,如果存在的话)。本发明的方法可以包括任选地在用任何提供的用于标记ntaa的化学试剂处理之前,之中或之后,用酶处理多肽以除去一种或多种ntaa(例如,脯氨酸氨基肽酶)。本发明的方法可包括任选地在用任何提供的修饰的切割酶处理之前,之中或之后,用酶处理多肽以除去一种或多种ntaa(例如,脯氨酸氨基肽酶)。在一些实施例中,该酶从作为脯氨酸的多肽中消除了ntaa。在一些具体的例子中,该酶是脯氨酸氨基肽酶,脯氨酸亚肽酶(pip)或焦谷氨酸氨基肽酶(pgap)。在一些实施例中,将一种或多种修饰的切割酶与其他酶组合使用以处理多肽。在一些特定情况下,修饰的切割酶和/或其他酶作为混合物提供。
[0364]
在一些实施例中,该方法进一步包括使多肽与一种或多种能够与多肽的末端氨基酸结合的结合剂,其中每种结合剂包括带有关于结合剂的识别信息的编码标签。在某些情
况下,结合剂可以结合多肽的标记的末端氨基酸。在一些其他实施例中,该方法进一步包括将编码标签的识别信息转移到与多肽附着的记录标签上,从而在多肽上产生扩展记录标签。在一些特定的实施例中,该方法进一步包括从多肽中去除或释放一种或多种结合剂。
[0365]
在一些实施例中,以循环方式重复使多肽与各种试剂接触的一个或多个步骤,包括例如与修饰的切割酶、与标记末端氨基酸的试剂和/或与结合剂接触。在一些实施例中,提供了一种分析多肽的方法,其包括以下步骤:(a)使多肽与能够结合至该多肽的末端氨基酸的结合剂接触,其中每个结合剂包括具有关于所述结合剂的识别信息的编码标签;(b)将编码标签的识别信息转移到与每个多肽相关联的记录标签上,以产生扩展记录标签;(c)使多肽与试剂接触以标记多肽的末端氨基酸;(d)使该多肽与修饰的切割酶接触,该酶包括突变,例如,未修饰的切割酶中的一个或多个氨基酸修饰,其中所述修饰的切割酶从多肽中除去步骤(c)中由试剂标记的单个末端氨基酸。除去的末端氨基酸可以作为单个氨基酸残基或作为二肽的一部分除去。在一些实施例中,步骤(a)-(d)重复“n”个结合循环,其中结合多肽的每种结合剂的每种编码标签的信息被转移至由前一结合循环产生的扩展记录标签,以产生n阶扩展记录标签。在一些实施例中,该方法进一步包括(b1)从多种多肽中去除或释放一种或多种结合剂。在一些实施例中,多肽包括多种多肽。在一些实施例中,使多肽与多种结合剂接触。在一些实施例中,使多肽与两种或更多种结合剂接触。
[0366]
在一些示例中,步骤(a)在步骤(b)之前进行;步骤(a)在步骤(c)之前进行;步骤(a)在步骤(d)之前进行;步骤(b)在步骤(c)之前进行;步骤(b)在步骤(d)之前进行;步骤(c)在步骤(a)之前进行;步骤(c)在步骤(b)之前进行;和/或步骤(c)在步骤(d)之前进行。在一些特定实施例中,步骤按以下顺序进行:(a),(b),(c)和(d)。在一些特定实施例中,步骤按以下顺序进行:(c),(a),(b)和(d)。在一些实施例中,该方法还包括(e)分析第n阶扩展记录标签。在一些实施例中,该方法进一步包括去除一种或多种结合剂。在一些实施例中,步骤(b1)在步骤(a)之后进行;步骤(b1)在步骤(b)之后进行;步骤(b1)在步骤(c)之前进行;和/或步骤(b1)在步骤(d)之前进行。
[0367]
在示例性的工作流程中,多肽的处理和分析如下:来自蛋白水解消化液的大量多肽(例如5000万至10亿或更多)以适当的分子内间距随机固定在单分子测序底物(例如小珠)上。在某些情况下,多肽附着在记录标签上。以循环方式,每个肽的末端氨基酸(例如,n-末端氨基酸)被标记(例如,ptc、修饰的ptc、cbz、dnp、snp、乙酰基、胍基、氨基胍基、杂环甲胺)。在某些情况下,末端氨基酸的标记可以作为后续步骤进行。每个固定肽的标记的n-末端氨基酸(例如,picc-ntaa,cbz-ntaa,dnp-ntaa,snp-ntaa,乙酰基-ntaa,胍基酰化ntaa,杂环甲胺-ntaa)通过同源的ntaa结合剂而结合,其结合剂附着于编码标签,以及来自与结合的ntaa结合剂相关联的编码标签的信息,被转移至与固定的肽相关联的记录标签,从而产生扩展记录标签。在一些实施例中,从多肽中去除或释放一种或多种结合剂。通过与能够从多肽中去除被标记的单个氨基酸的修饰的切割酶接触来去除标记的ntaa。可以进行一个或多个标记循环,与结合剂接触,转移识别信息以及去除单个氨基酸。
[0368]
在一些实例中,最终的扩展记录标签任选地在通用引发位点的两侧,以促进下游扩增和/或dna测序。前向通用引发位点(例如,illumina的p5-s1序列)可以是原始记录标签设计的一部分,而反向通用引发位点(例如,illumina的p7-s2'序列)可以作为最后一步而添加记录标签的扩展。在一些实施例中,可以独立于结合剂来完成正向和反向引物位点的
添加。
[0369]
在一些实施例中,基于降解的肽或多肽测序测定法的过程中的步骤顺序可以颠倒或以各种顺序进行。例如,在一些实施例中,可以在多肽结合至结合剂之前和/或之后进行末端氨基酸标记。在一些实施例中,在使多肽与用于标记末端氨基酸的试剂接触之前,与一种或多种结合剂接触。在一些情况下,使多肽与修饰的切割酶接触以去除标记的末端氨基酸之前,与一种或多种结合剂接触。
[0370]
在一些实施例中,可以在多肽结合至载体之前或之后进行末端氨基酸标记。在一些实施例中,可以在多肽结合至结合剂之前和/或之后进行末端氨基酸去除。在一些实施例中,在与结合剂接触之前,使多肽先与用于标记末端氨基酸的试剂接触,并且与一种或多种结合剂的接触是在多肽与修饰的切割酶接触之前。在一些实施例中,在多肽与一种或多种结合剂接触之后并且在多肽与修饰的切割酶接触之前进行识别信息的转移。
[0371]
在任何此类实施例中的一些实施例中,去除一种或多种结合剂是在将识别信息从编码标签转移至与每个多肽相关联的记录标签以产生扩展记录标签之后。在任何此类实施例中的一些实施例中,去除一种或多种结合剂是在使多肽与标记多肽的末端氨基酸的试剂接触之前。在一些实施例中,去除一种或多种结合剂是在使多肽与修饰的切割酶接触之前。
[0372]
在一些实施例中,提供的用于处理蛋白质或多肽的方法的任何步骤的顺序可以颠倒或以各种顺序进行。
[0373]
a.将记录标签附着到多肽上
[0374]
在一些实施例中,提供的方法包括使多肽与修饰的切割酶和任选的用以进行多肽分析的其他试剂接触。在一实施例中,蛋白质或多肽通过标准的胺基偶联化学用dna记录标签标记。这ε-氨基基团(例如,赖氨酸残基的氨基)和n-末端氨基特别容易受到胺基反应性偶联剂的标记,具体取决于反应的ph值(mendoza et al.,mass spectrom rev(2009)28(5):785-815)。在特定实施例中,记录标签由反应性部分(例如,用于缀合至固体表面,多功能接头或多肽),接头,通用引发序列,条形码(例如,隔室标签,分区条形码,样品条形码,组分条形码或其任意组合),可选的umi和用于促进信息转移至编码标签/从编码标签转移信息的间隔子(sp)序列组成。在一些使用连接的情况下,sp序列可以用作1-8个碱基的突出端。在某些情况下,记录标签不包括间隔子。在另一个实施例中,蛋白质可以首先用通用dna标签标记,并且随后通过酶促或化学偶联步骤将条形码-sp序列(代表样品、隔室、载玻片上的物理位置等)附着于蛋白质。通用dna标签包括用于标记多肽并且可以用作条形码的连接点(例如,隔室标签,记录标签等)的核苷酸的短序列。例如,记录标签可以在其末端包括与通用dna标签互补的序列。在某些实施例中,通用dna标签是通用引发序列。在标记的蛋白质上的通用dna标签与记录标签中的互补序列杂交后(例如,与珠子结合),可以通过引物延伸来扩展退火的通用dna标签,从而将记录标签信息转移到dna标记的蛋白质上。在一个特定的实施例中,在将蛋白酶消化成肽之前,用通用dna标签标记蛋白质。然后可以将消化物中标记肽上的通用dna标签转换为信息丰富且有效的记录标签。在一些实施例中,可以在附着dna标签或dna记录标签之前或之后将蛋白质和多肽片段化为肽。
[0375]
至少一个记录标签与多肽直接或间接缔合或共定位,并与固相载体连接。记录标签可包括dna,rna或多核苷酸类似物,包括pna、gpna、gna、hna、bna、xna、tna或其组合。记录标签可以是单链的,也可以是部分或完全双链的。记录标签的末端可能会变钝或突出。在某
些实施例中,一旦结合剂与多肽结合,结合剂的编码标签的识别信息就被转移至记录标签以产生扩展记录标签。可以在随后的结合循环中对扩展记录标签进行进一步延伸。
[0376]
记录标签可以通过本领域已知的任何方式,包括共价和非共价相互作用,或它们的任何组合,直接或间接地(例如,经由接头)连接至固相载体。例如,可以通过连接反应将记录标签连接至固相载体。或者,固相载体可包括试剂或涂层,以直接或间接地促进将记录标签连接至固相载体。将核酸分子固定到固相载体物(例如,珠子)上的策略已在美国专利5,900,481;steinberg等(2004)biopolymers 73:597-605;lund等,(1988)nucleic acids res。16:10861-10880)中描述。
[0377]
在某些实施例中,多肽和相关联的记录标签的共定位是通过将多肽和记录标签缀合到双功能接头上来实现的,其双功能接头直接是附着到固相载体表面的(steinberg et al.(2004)biopolymers 73:597-605)。在进一步的实施例中,使用三官能部分使固相载体(例如,珠子)衍生化,并且将得到的双官能部分与多肽和记录标签偶联。在其他实施例中,通过将多肽与相关联的dna记录标签偶联并将嵌合体与dna修饰的固相载体表面连接来实现多肽与相关联的记录标签的共定位。
[0378]
诸如描述用于附着多肽和固相载体的那些方法和试剂(例如,点击化学试剂和光亲和性标记试剂)也可以用于附着记录标签。
[0379]
在一个特定的实施例中,单个记录标签优选地通过连接至去阻断的n-末端氨基酸或c-末端氨基酸而连接至多肽。在另一个实施例中,多个记录标签附着至多肽,优选附着至赖氨酸残基或肽主链。在一些实施例中,用多个记录标签标记的多肽被片段化或消化成较小的肽,每个肽平均用一个记录标签标记。
[0380]
在某些实施例中,首先用dna记录标签标记多肽,然后通过核酸杂交和连接至附着于固相载体的dna序列将嵌合dna-多肽分子固定至固相载体。
[0381]
在某些实施例中,记录标签包括任选的唯一分子标识符(umi),其为与umi相关联的每个多肽提供唯一标识符标签。一个umi可以是大约3到40个碱基,或其子范围例如,约3至约30个碱基,约3至约20个碱基,或约3至约10个碱基,或约3至约8个碱基。在一些实施例中,umi为约3个碱基,4个碱基,5个碱基,6个碱基,7个碱基,8个碱基,9个碱基,10个碱基,11个碱基,12个碱基,13个碱基,14个碱基,15个碱基,16个碱基,长度为17个碱基,18个碱基,19个碱基,20个碱基,25个碱基,30个碱基,35个碱基或40个碱基的长度。umi可用于对来自多种扩展记录标签的测序数据进行反卷积,以识别来自各个多肽的序列读取。在一些实施例中,在多肽文库中,每个多肽与单个记录标签相关联,每个记录标签包括独特的umi。在其他实施例中,记录标签的多个拷贝与单个多肽相关联,记录标签的每个拷贝包括相同的umi。在一些实施例中,umi具有与结合剂的编码标签内的间隔子或编码器序列不同的碱基序列,以有助于在序列分析期间区分这些组分。
[0382]
在某些实施例中,记录标签包括条形码,例如,条形码,而不是umi(如果存在的话)。条形码是大约3到大约30个碱基的核酸分子,或其子范围例如,大约3至大约25个碱基、大约3至大约20个碱基、大约3至大约10个碱基、大约3至大约10个碱基、大约3至大约8个碱基的长度。在一些实施例中,条形码为约3个碱基、4个碱基、5个碱基、6个碱基、7个碱基、8个碱基、9个碱基、10个碱基、11个碱基、12个碱基、13个碱基、14个碱基、15个碱基、20个碱基、25个碱基、或30个碱基的长度。在一个实施例中,条形码允许对多种样品或文库进行多重测
序。条形码可用于识别多肽所源自的分区,组分,隔室,样品,空间位置或文库。条形码可用于对多路复用序列数据进行反卷积,并从单个样品或文库中识别序列读数。例如,条形码珠可用于涉及乳液和样品分配的方法,例如,用于分配蛋白质组的目的。
[0383]
条形码可以代表一个隔室标签,在例如小滴,微孔,固相载体上的物理区域等隔室中分配了唯一的条形码。隔室与特定条形码的关联可以通过多种方式来实现,例如通过将单个条形码化的珠子封装在隔室中,例如,通过将条形码化的液滴直接合并或添加到隔室中,或者通过直接打印或注入条形码试剂到隔室中等方法来实现。隔室中的条形码试剂用于将隔室-特异性条形码添加到隔室中的多肽或其片段上。条形码可用于将蛋白质分配到隔室中,可用于将分析的肽映射回隔室中的原始蛋白质分子。这可以极大地促进蛋白质鉴定。隔室条形码也可用于识别蛋白质复合物。
[0384]
在其他实施例中,代表隔室群体的子集的多个隔室可以被分配代表子集的唯一条形码。
[0385]
或者,条形码可以是样品识别条形码。样品条形码可用于在单个反应容器中或固定在单个固体底物上或固体底物集合(例如,平面载玻片,单个管子或容器中包括的珠子群等)的一组样品的多重分析。可以使用带有特定于样品的条形码的记录标签来标记来自许多不同样品的多肽,然后,在固定到固相载体,循环结合并进行记录标签分析之前,将所有样品合并在一起。或者,可以将样品分开放置,直到创建了dna编码的文库,然后在dna编码的文库的pcr扩增过程中附着样品条形码,然后在测序之前将它们混合在一起。当分析不同丰度类别的分析物(例如蛋白质)时,该方法可能有用。例如,可以对样品进行分割和条形码化(barcoded),一部分使用结合剂处理低丰度分析物,另一部分使用结合剂处理高丰度分析物。在一个特定的实施例中,该方法有助于将特定蛋白质分析物测定的动态范围调整为处于蛋白质分析物标准表达水平的“最佳点(sweet spot)”之内。
[0386]
在某些实施例中,来自多个不同样品的多肽用包括样品特异性条形码的记录标签标记。可以在循环结合反应之前将多样品条形码的多肽混合在一起。通过这种方式,可以有效地创建数字反相蛋白质阵列(rppa)的高度复用的替代方案(guo et al.,proteome sci(2012)10(1):56;assadi,lamerz et al.,mol cell proteomics(2013)12(9):2615-2622;akbani et al.2014;mol cell proteomics(2014)13(7):1625-1643;creighton et al.,drug des devel ther(2015)9:3519-3527)。类似于数字rppa的测定法的创建在翻译研究,生物标志物验证,药物发现,临床和精准医疗中具有许多应用。
[0387]
在某些实施例中,记录标签包括通用引发位点,例如,正向或5'通用引发位点。通用引发位点是可用于引发文库扩增反应和/或用于测序的核酸序列。通用引发位点可包括但不限于用于pcr扩增的引发位点,与流通池表面上的互补寡核苷酸退火的流通池衔接子序列(例如,illumina下一代测序),测序引发位点或它们的组合。通用引发位点可以是约10个碱基至约60个碱基。在一些实施例中,通用引发位点包括illumina p5引物(5'-aatgatacggcgaccaccga-3'

seq id no:3)或illumina p7引物(5'-caagcagaagacggcatacgagat

3'-seq id no:4)。
[0388]
在某些实施例中,记录标签包括在其末端(例如3'端)的间隔子。如本文所用,在记录标签的上下文中提及的间隔子序列包括与与其同源结合剂相关联的间隔子序列相同的间隔子序列,或与与其同源结合剂相关联的间隔子序列互补的间隔子序列。记录标签上的
末端(例如3'间隔子)允许在第一个结合循环中将同源结合剂的识别信息从其编码标签转移到记录标签(例如,通过对互补间隔子序列进行退火以进行引物延伸或粘性末端连接)。
[0389]
在一实施例中,间隔子序列的长度为约1-20个碱基。或其子范围,例如,约2-12个碱基,或5-10个碱基的长度。间隔子的长度可取决于诸如用于将编码标签信息转移至记录标签的引物延伸反应的温度和反应条件的因素。在一些实施例中,记录标签不包括间隔子。
[0390]
在一个优选的实施例中,将记录中的间隔子序列设计成与记录标签中的其他区域具有最小的互补性。同样地,编码标签中的间隔子序列应与编码标签中的其他区域具有最小的互补性。换句话说,记录标签和编码标签的间隔子序列应与以下成分具有最小的序列互补性:出现在记录标签或编码标签中的唯一分子标识符,条形码(例如,隔室,分区,样品,空间位置),通用引物序列,编码器序列,循环特异性序列等。
[0391]
在一些实施例中,与多肽文库相关联的记录标签共享共同的间隔子序列。在其他实施例中,与多肽文库相关联的记录标签具有与它们的同源结合剂的结合循环特异性间隔子序列互补的结合循环特异性间隔子序列,这在使用非串联的扩展记录标签时是有用的。
[0392]
在某些情况下,扩展记录标签的集合可以串联在一起。例如,在结合循环完成后,将珠固相载体置于乳液中,每个珠平均包括一个或少于一个多肽/珠,每个多肽具有共同定位在多肽位点的扩展记录标签的集合。形成乳液使得平均每个液滴最多被1个小珠占据。在乳状液中进行可选的组装pcr反应,以扩增与多肽在珠子上共定位的扩展记录标签,并通过在单独的扩展记录标签上的不同循环特异性序列之间进行引发,将它们以共线性顺序组装(xiong et al.,fems microbiol rev(2008)32(3):522-540)。之后,将乳剂破坏,并对组装好的扩展记录标签进行测序。
[0393]
在另一个实施例中,dna记录标签由通用引发序列(u1),一个或多个条形码序列(bcs)和对第一结合循环特异的间隔子序列(sp1)组成。在第一个结合循环中,结合剂采用dna编码标签,该标签由sp1互补间隔子,编码器条形码和可选的循环条形码以及第二个间隔子元件(sp2)组成。使用至少两个不同的间隔子件的实用性是,第一结合循环选择潜在的几个dna记录标签中的一个,并且单个dna记录标签被延伸,从而在扩展的dna记录标签的末端产生新的sp2间隔元件。在第二和随后的结合循环中,结合剂仅包括sp2'间隔子,而不包括sp1'。以这种方式,只有来自第一循环的单个扩展记录标签在后续循环中被扩展。在另一个实施例中,第二和随后的循环可以采用结合剂特异性的间隔子。
[0394]
在一些实施例中,记录标签包括5'至3'方向:通用正向(或5')引物序列,umi和间隔子序列。在一些实施例中,记录标签包括从5'至3'的方向:通用正向(或5')引发序列,可选的umi,条形码(例如,样品条形码,分区条形码,隔室条形码,空间条形码或(任意组合)和间隔子序列。在一些其他实施例中,记录标签包括从5'到3'的方向:通用前向(或5')引发序列,条形码(例如,样品条形码,分区条形码,隔室条形码,空间条形码或它们的任意组合),可选的umi和间隔子序列。
[0395]
组合方法可用于从修饰的dna和pna生成umi。在一个示例中,可以通过将一组短字符序列(4-15聚体)“化学连接”在一起而构建一个umi,这些短字序列已被设计为彼此正交(spiropulos and heemstra 2012)。dna模板用于指导“单词”聚合物的化学连接。dna模板由杂交臂构成,该杂交臂仅需将子成分在溶液中混合即可实现组合模板结构的组装。在某些实施例中,该设计中没有“间隔子”序列。单词空间的大小可以从10个单词到10,000个或
更多的单词不等或其子范围。在某些实施例中,选择的字符以使它们彼此不同以不交叉杂交,但具有相对均匀的杂交条件。在一个实施例中,字符的长度将在10个碱基数的量级上,在子集中具有大约1000个字符(这仅是总的10-mer字符空间约4
10
的0.1%=1百万个单词)。这些单词的集合(子集中的1000个)可以串联在一起,以生成最终的组合umi,其复杂度=1000n次幂。对于连接在一起的4个字符,这将创建10
12
个不同元素的umi多样性。这些umi序列将在单分子水平上附加至多肽。在一个实施例中,umi的多样性超过了umi所附着的多肽分子的数量。通过这种方式,umi唯一地识别了目标多肽。组合字符umi的使用有助于在高错误率测序器(例如,纳米孔测序器,纳米间隙隧道测序等)上进行读取,因为读取单个碱基长度的多个字符不需要单碱基分辨率。组合字符方法也可以用于生成记录标签或编码标签的其他身份信息组件,例如隔室标签,分区条形码,空间条形码,样本条形码,编码器序列,循环特定序列和条形码。与纳米孔测序和具有容错词(代码)的dna编码信息有关的方法是本领域已知的(参见,例如,kiah et al.,2015,codes for dna sequence profiles.ieee international symposium on information theory(isit);gabrys et al.,2015,asymmetric lee distance codes for dna-based storage.ieee symposium on information theory(isit);laure et al.,2016,coding in 2d:using intentional dispersity to enhance the information capacity of sequence-coded polymer barcodes.angew.chem.int.ed.doi:10.1002/anie.201605279;yazdi et al.,2015,ieee transactions on molecular,biological and multi-scale communications 1:230-248;and yazdi et al.,2015,sci rep 5:14138,每一个均通过引用整体并入)。因此,在某些实施例中,本文描述的任何实施例中的扩展记录标签,扩展编码标签或双标签构建体由作为纠错码de识别组分(例如,umi,编码器序列,条形码,隔室标签,循环特异性)组成。序列等)组成。在一些实施例中,纠错码选自:汉明码,李氏距离码,不对称李氏距离码,里德-所罗门码和列文施泰因-tenengolts码。对于纳米孔测序,电流或离子通量分布图和不对称碱基调用错误是所用纳米孔和生物化学类型所固有的,并且可以使用上述错误校正方法将这些信息用于设计更稳健的dna代码。替代使用稳健的dna纳米孔测序条形码的一种方法,可以直接使用条形码序列的电流或离子通量特征(signatures)(美国专利号7,060,507,以引用的方式全文并入),完全避免了dna碱基的调用,并立即识别条形码序列通过映射回预测的电流/通量特征标记(current/flux signature),如laszlo等人所述。(2014,nat.biotechnol.32:829-833,通过引用整体并入本文)。例如,laszolo等人描述了当使不同的字符串通过纳米孔时由生物纳米孔,mspa,产生的电流特征标记,以及通过将所得电流特征映射回来自序列总体的可能电流特征的计算机预测来映射和鉴定dna链的能力(laszlo et al.,(2014)nat.biotechnol.32:829-833)。相似的概念可以应用于dna编码和通过纳米间隙隧穿基于电流的dna测序产生的电信号(ohshiro et al.,2012,sci rep 2:501)。
[0396]
因此,在某些实施例中,编码标签,记录标签或两者的识别组分能够产生独特的电流或离子通量或光学特征标记,其中本文提供的任何方法的分析步骤包括检测独特的电流或离子通量或光学特征标记,以鉴定识别成分。在一些实施例中,识别组分选自编码器序列,条形码,umi,隔室标签,循环特异性序列或其任何组合。
[0397]
在某些实施例中,样品中的全部或大量的多肽(例如,至少50%、55%、60%、65%、
70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)用记录标签标记。记录标签与多肽的附着可发生在将多肽固定于固相载体之前或之后。
[0398]
在其他实施例中,样品中的多肽的子集用记录标签标记。在一个特定的实施例中,来自样品的多肽的子集经历具有记录标签的靶向(分析物特异性)标记。可以使用与短的靶特异性dna捕获探针(例如,分析物特异性条形码)连接的靶蛋白质特异性结合剂(例如抗体,适配体等)来实现蛋白质的靶记录标签标记,所述短的靶特异性dna捕获探针在记录标签中,退火到互补的靶特异性诱饵序列(例如分析物特异性条形码)。记录标签包括存在于靶蛋白上的同源反应性部分的反应性部分(例如,点击化学标记,光亲和标记)。例如,记录标签可以包括用于与炔烃衍生的蛋白质相互作用的叠氮化物部分,或者记录标签可以包括用于与天然蛋白质相互作用的二苯甲酮等。一旦靶蛋白特异性结合剂结合靶蛋白,靶蛋白和靶蛋白就通过它们相应的反应性偶联。在用记录标签标记靶蛋白后,可以通过消化与靶蛋白特异性结合剂连接的dna捕获探针来去除靶蛋白特异性结合剂。例如,可以将dna捕获探针设计为包含尿嘧啶碱基,然后将其靶向以尿嘧啶特异性切除试剂(例如,user
tm
)消化,并且可以将靶蛋白特异性结合剂与靶蛋白解离。
[0399]
在一个实例中,可用dna捕获探针标记对一组靶蛋白特异的抗体,所述dna捕获探针与用互补诱饵序列设计的记录标签杂交。蛋白质的样品特异性标记可以通过使用dna捕获探针标记的抗体与包括样品特异性条形码的记录标签上的互补诱饵序列杂交来实现。
[0400]
在另一个实例中,靶蛋白特异性适配体用于样品中蛋白的子集的靶记录标签标记。靶特异性适配体与dna捕获探针连接,该探针与记录标签中的互补诱饵序列退火。记录标签包括反应性化学或光反应化学探针(例如二苯甲酮(bp)),用于偶联至具有相应反应性部分的靶蛋白。适配体与其靶蛋白分子结合,使记录标签与靶蛋白紧密接近,从而导致记录标签与靶蛋白的偶联。
[0401]
以前已经描述了使用附着在小分子蛋白质亲和配体上的光反应化学探针进行光亲和(pa)蛋白标记(park,koh et al.2016)。典型的光反应化学探针包括基于二苯甲酮(反应性双自由基,365nm),苯基二嗪(反应性碳,365nm)和苯叠氮化物(反应性亚硝基自由基,260nm)的探针,如前所述,在辐射波长下激活(smith et al.,future med chem.(2015)7(2):159

183)。在一个优选的实施例中,使用li等人公开的方法,用包括样品条形码的记录标签来标记蛋白质样品中的靶蛋白,其中将二苯甲酮标记的记录标签中的诱饵序列与附着于同源结合剂的dna捕获探针杂交。(例如,核酸适配体(li et al.,angew chem int ed engl(2013)52(36):9544-9549)。对于光亲和标记的蛋白靶标,与抗体相比,更优选使用dna/rna适配体作为靶蛋白特异性结合剂,因为光亲和力部分可以自标记抗体而不是靶蛋白。相比之下,光亲和标记对核酸的效率不如蛋白质,因此使适配体成为dna定向化学或光标记的较好载体。与光亲和标记相似,也可以采用与rosen等人所述方法相似的方法,在适配体结合位点附近对反应性赖氨酸(或其他部分)进行dna定向化学标记。(rosen et al,nature chemistry volume(2014)6:804

809;kodal et al.,chembiochem(2016)17:1338-1342)。
[0402]
在前述实施例中,除杂交以外,其他类型的连接可用于连接靶标特异性结合剂和记录标签。例如,一旦被捕获的靶蛋白(或其他多肽)与记录标签共价连接,就可以使用被设计为切割并释放结合剂的接头将两个部分共价连接。可以将合适的接头连接到记录标签的
各种位置,例如3'端,或在连接到记录标签5'端的接头内。
[0403]
记录标签可以在固定到固相载体之前或之后附着到蛋白质,多肽或肽上。例如,可以首先用记录标签标记蛋白质,多肽或肽,然后通过包括两个用于偶联的功能部分的记录标签将其固定在固体表面上。记录标签的一个功能部分与蛋白质偶联,另一功能部分将记录标签标记的蛋白质固定在固相载体上。
[0404]
在其他实施例中,在用记录标签标记蛋白质,多肽或肽之前,将多肽固定在固相载体上。例如,可以首先用反应性基团如点击化学部分将蛋白质衍生化。然后可以将活化的蛋白质分子附着到合适的固相载体上,然后通过使用互补的点击化学部分用记录标签进行标记。例如,可以将用炔烃和mtet部分衍生的蛋白质固定在用叠氮化物和tco衍生化的珠子上,并附着在用叠氮化物和tco标记的记录标签上。
[0405]
在某些实施例中,将固相载体的表面钝化(阻断)以使对结合剂的非特异性吸收最小化。“钝化”表面是指已经用材料外层处理以最小化结合剂的非特异性结合的表面。钝化表面的方法包括荧光单分子分析文献中的标准方法,包括用诸如聚乙二醇(peg)(pan et al.,2015,phys.biol.12:045006),聚硅氧烷(例如,pluronic f-127),星形聚合物(例如,星形peg)(groll et al.,2010,methods enzymol.472:1-18),疏水二氯二甲基硅烷(dds) 自组装的tween-20(hua et al.,2014,nat.methods 11:1233-1236),类金刚石碳(dlc),dlc peg(stavis et al.,2011,proc.natl.acad.sci.usa 108:983-988)和两性离子部分(例如,美国专利申请公开us 2006/0183863)的聚合物来钝化表面。除共价表面修饰外,还可以使用多种钝化剂,包括表面活性剂(如tween-20),溶液中的聚硅氧烷(pluronic系列),聚乙烯醇(pva)以及蛋白质(如bsa和酪蛋白)。备选地,当将蛋白质,多肽或肽固定到固体基质上时,可以通过掺入竞争者或“虚拟”反应性分子来在固体基质的表面上或固体基质的体积内滴定蛋白质,多肽或肽的密度。
[0406]
在将多个多肽固定在相同固相载体上的某些实施例中,可以适当地间隔开多肽以减少或防止交叉结合或分子间事件的发生,例如,其中结合剂结合第一多肽,并且其编码标签信息被转移至与相邻多肽相关联的记录标签,而不是与第一多肽相关联的记录标签。为了控制固相载体上的多肽间隔,可以在底物表面上滴定功能性偶联基团(例如,tco)的密度。在一些实施例中,多种多肽在固相载体的表面上或在体积内(例如,多孔载体)以至少以约50nm至约500nm,或其子范围的距离隔开,例如,约50nm至约400nm、或约50nm至约300nm、或约50nm至约200nm、或约50nm至约100nm。在一些实施例中,多种多肽在固相载体的表面上以至少50nm、至少60nm、至少70nm、至少80nm、至少90nm、至少100nm、至少150nm、至少200nm、至少250nm、至少300nm、至少350nm、至少400nm、至少450nm或至少500nm的平均距离间隔开。在一些实施例中,多种多肽在固相载体的表面上以至少50nm的平均距离间隔开。在一些实施例中,多肽在固相载体的表面上或在固相载体的体积内间隔开,以使得根据经验,分子间事件相对于分子内事件的相对频率<1:10;《1:100;《1:1,000或《1:10,000。可以使用功能测定法凭经验确定合适的间隔频率(请参见国际专利公开号wo 2017/192633的实施例31),并且可以通过稀释和/或通过掺入竞争与底物表面上附着位点的“虚拟”间隔子分子来实现。
[0407]
例如,peg-5000(mw~5000)用于阻断在底物表面(例如,珠子表面)上的肽之间的间隙。另外,该肽与也与peg-5000分子附着的功能部分偶联。在一些实施例中,这通过将
nhs-peg-5000-tco nhs-peg-5000-甲基的混合物偶联至胺基衍生的珠子来实现。滴定两种peg(tco与甲基)之间的化学计量比,以在底物表面上产生适当密度的功能性偶联部分(tco基团);甲基-peg对偶联是惰性的。可以通过测量表面上tco组的密度来计算tco组之间的有效间距。在某些实施例中,固体表面上的偶联部分(例如,tco)之间的平均间隔为至少50nm,至少100nm,至少250nm或至少500nm。在珠子的peg5000-tco/甲基衍生化之后,用反应性酸酐(例如,乙酸酐或琥珀酸酐)猝灭表面上过量的nh2基团。其他mw peg也可以用于从mw约300da到超过50kda的钝化。
[0408]
在一些实施例中,间隔是通过滴定底物表面上可用附着分子的比率来实现的。在一些示例中,底物表面(例如,珠表面)被羧基(cooh)官能化,该羧基用活化剂(例如,活化剂为edc和sulfo-nhs)处理。在一些示例中,底物表面(例如,珠表面)包括nhs部分。在一些实施例中,将mpeg
n-nh 2和nh2-peg
n-mtet的混合物添加至活化的珠子(其中n为任何数目,例如1-100)。滴定mpeg
3-nh2(不可用于偶联)和nh2-peg24-mtet(可用于偶联)之间的比例,以产生可用于将分析物附着在基质表面的适当密度的功能部分。在某些实施例中,固体表面上的偶联部分(例如,nh
2-peg
4-mtet)之间的平均间隔为至少50nm,至少100nm,至少250nm或至少500nm。在一些具体的实施例中,nh
2-peg
n-mtet与mpeg
3-nh2的比率为约或大于1:1000,约或大于1:10,000,约或大于1:100,000,或约或大于1:1,000,000。在一些其他实施例中,捕获核酸附着于nh2-peg
n-mtet。
[0409]
在特定实施例中,将多肽和/或记录标签以一定密度固定在基质或载体上,使得(i)结合至第一多肽的编码剂(特别是编码标签)之间的相互作用。(ii)第二多肽和/或其记录标签被还原,最小化或完全消除。因此,可以减少,最小化或消除因“分子间”参与而产生的假阳性测定信号。
[0410]
在某些实施例中,针对每种类型的多肽确定多肽和/或底物上的记录标签的密度。例如,变性的多肽链越长,密度就应越低,以减少,最小化或防止“分子间”相互作用。在某些方面,增加多肽分子和/或记录标签之间的间隔(即,降低密度)增加了目前公开的测定的信噪比。
[0411]
在一些实施例中,所述多肽分子和/或所述记录标签以任何合适的平均密度(例如,在约0.0001分子/μm2、0.001分子/μm2、0.01分子/μm2、0.1分子/μm2、1分子/μm2、约2分子/μm2、约3个分子/μm2、约4分子/μm2、约5个分子/μm2、约6分子/μm2、约7个分子/μm2、约8个分子/μm2、约9个分子/μm2、或约10个分子/μm2的平均密度)沉积或固定在基底上。在其他实施例中,所述多肽和/或记录标签以约15、约20、约25、约30、约35、约40、约45、约50大约55、大约60、大约65、大约70、大约75、大约80、大约85、大约90、大约95、大约100、大约105、大约110、大约115、大约120、大约125、大约130、大约135、约140、约145、约150、约155、约160、约165、约170、约175、约180、约185、约190、约195、约200、或约200个分子/μm2的平均密度沉积或固定上基质。在其他实施例中、多肽和/或记录标签以约1分子/mm2、约10分子/mm2、约50分子/mm2、约100分子/mm2、约150分子/mm2、约200分子/mm2、约250个分子/mm2、约300个分子/mm2、约350分子/mm2、400分子/mm2、约450个分子/mm2、大约500分子/mm2、约550分子/mm2、约600分子/mm2、约650分子/mm2、约700分子/mm2、约750分子/mm2、约800分子/mm2、约850分子/mm2、约900分子/mm2、约950分子/mm2或约1000分子/mm2的平均密度沉积或固定。在其他实施例中,多肽和/或记录标签以约1
×
103到约0.5
×
104分子/mm2之间、约0.5
×
104和约1
×
104分
子/mm2之间、在约1
×
104和约0.5
×
105分子/mm2之间、约0.5
×
105和约1
×
105分子/mm2之间、约1
×
105和约0.5
×
106分子/mm2、或约0.5
×
106和约1
×
106分子/mm2之间的平均密度沉积或固定在基质上。在其他实施例中,多肽和/或记录标签可以以例如为约1分子/cm2至约5分子/cm2之间、大约5和大约10分子/cm2之间、大约10和大约50分子/cm2之间、大约50和大约100分子/cm2之间、大约100和大约0.5
×
103分子/cm2之间、大约0.5
×
103和大约1
×
103分子/cm2之间、1
×
103和大约0.5
×
104分子/cm2、约0.5
×
104和约1
×
104分子/cm2之间、约1
×
104和约0.5
×
105分子/cm2之间、约0.5
×
105和约1
×
105分子/cm2之间、约1
×
105和约0.5
×
106分子/cm2之间、或约0.5
×
106和大约1
×
106分子/cm2之间的平均密度沉积或固定在基质上。
[0412]
b.编码标签信息到记录标签的循环传输
[0413]
在本文所述的方法中,一旦结合剂与多肽结合,其连接的编码标签的识别信息就被转移至与该多肽相关联的记录标签,从而产生“扩展记录标签”。扩展记录标签可以包括来自结合剂的编码标签的信息,该信息表示所执行的每个结合循环。然而,扩展记录标签也可能经历“缺失的”结合循环,例如,因为结合剂不能与多肽结合,因为编码标签缺失,损坏或有缺陷,因为引物延伸反应失败。即使发生结合事件,信息从编码标签到记录标签的传输也可能不完全或准确度低于100%,例如,由于编码标签损坏或有缺陷,因为引物延伸反应中引入了错误。因此,扩展记录标签可以代表100%,或最多95%、90%、85%、80%、75%、70%、65%、60%、65%、55%、50%、45%、40%、35%、30%或其任何子范围在其相关多肽上发生的结合事件。此外,存在于扩展记录标签中的编码标签信息可与对应的编码标签具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的同一性。
[0414]
在某些实施例中,结合剂可以结合肽分子的ntaa,ctaa,居间的氨基酸,二肽(两个氨基酸的序列),三肽(三个氨基酸的序列)或更高阶的肽。在一些实施例中,结合剂文库中的每种结合剂选择性地结合特定氨基酸,例如二十种标准天然存在的氨基酸之一。标准的天然氨基酸包括丙氨酸(a或ala)、半胱氨酸(c或cys)、天冬氨酸(d或asp)、谷氨酸(e或glu)、苯丙氨酸(f或phe)、甘氨酸(g或phe)。gly)、组氨酸(h或his)、异亮氨酸(i或ile)、赖氨酸(k或lys)、亮氨酸(l或leu)、蛋氨酸(m或met)、天冬酰胺(n或asn)、脯氨酸(p或pro))、谷氨酰胺(q或gln)、精氨酸(r或arg)、丝氨酸(s或ser)、苏氨酸(t或thr)、缬氨酸(v或val)、色氨酸(w或trp)和酪氨酸(y或tyr)。在一些实施例中,结合剂结合未修饰的或天然的氨基酸。在一些实例中,结合剂结合肽分子的未修饰的或天然的二肽(两个氨基酸的序列),三肽(三个氨基酸的序列)或更高阶的肽。可以对结合剂进行工程化以使其对天然或未修饰的ntaa具有高亲和力,对天然或未修饰的ntaa具有高特异性或两者都有。在一些实施例中,可以使用噬菌体展示通过有前途的亲和支架的定向进化来开发结合剂。
[0415]
结合剂可结合至肽,多肽或蛋白质分子的n-末端肽,c-末端肽或中间肽。结合剂可以结合肽分子的n-末端氨基酸,c-末端氨基酸或中间氨基酸。结合剂可以结合至n-末端或c-末端二氨基酸部分。结合剂可以优选结合化学修饰或标记的氨基酸。例如,与不结合不具有所述部分的氨基酸相比,结合剂可优选结合在氨基上已被乙酰基部分、cbz部分、鸟苷基部分、丹磺酰基部分、ptc部分、dnp部分、snp部分、杂环甲胺部分等官能化的氨基酸。
[0416]
在某些实施例中,扩展记录标签可以包括来自表示多个,连续的结合事件的多个编码标签的信息。在这些实施例中,单个,串联的扩展记录标签可以代表单个多肽。如本文
所提到的,将编码标签信息转移到记录标签还包括转移到扩展记录标签,如在涉及多个连续的结合事件的方法中会发生的那样。
[0417]
在某些实施例中,结合事件信息以循环方式从编码标签转移到记录标签。可以在测序后通过要求至少两个不同的编码标签(识别两个或多个独立的结合事件)映射到同一类结合剂(与特定蛋白质同源)来在信息上滤出交叉反应性结合事件。可选的样品或隔室条形码可包括在记录标签中,以及可选的umi序列。编码标签还可以包括可选的umi序列以及编码器和间隔子序列。通用引发序列也可以包括在扩展记录标签中,用于扩增和ngs测序。
[0418]
可以使用多种方法将与特定结合剂相关联的编码标签信息转移到记录标签上。在某些实施例中,编码标签的信息通过引物延伸转移至记录标签(chan,mcgregor et al.2015)。通过使用退火的编码标签作为模板,记录标签或扩展记录标签的3'末端的间隔子序列与编码标签和聚合酶(例如,置换链的聚合酶)的3'末端的互补间隔序列退火,从而扩展了记录标签的序列。在一些实施例中,可以将与编码标签编码器序列和5'间隔子互补的寡核苷酸预先退火至编码标签,以防止编码标签与扩展记录标签中存在的内部编码器和间隔子序列杂交。编码标签上的3'末端间隔子保持单链,优选结合至记录标签上的末端3'间隔子。在其他实施例中,新生记录标签可以用单链结合蛋白包被,以防止编码标签退火至内部位点。或者,新生记录标签也可以用reca(或相关的同源物,例如uvsx)包被,以促进3'末端浸入完全双链的编码标签中(bell et al.,2012,nature 491:274-278)。该配置防止双链编码标签与内部记录标签元件相互作用,但是易于受到扩展记录标签的reca包被的3'尾部的链入侵((bell,et al.,2015,elife 4:e08646)。单链结合蛋白的存在可以促进链置换反应。
[0419]
在一些实施例中,用于引物延伸的dna聚合酶具有链置换活性并且具有有限的3'-5核酸外切酶活性或没有3'-5核酸外切酶活性。此类聚合酶的许多示例包括klenow exo-(dna pol 1的klenow片段)、t4 dna聚合酶exo-,t7 dna聚合酶exo(序列酶2.0)、pfu exo-、vent exo-、deep vent exo-、bst dna聚合酶大片段exo-、bca pol、9
°
n pol和phi29 pol exo-。在一个优选的实施例中,dna聚合酶在室温和高达45℃下是有活性的。在另一个实施例中,采用嗜热聚合酶的“热启动”形式,使得聚合酶被活化并在约40℃至50℃下使用。示例性的热启动聚合酶是bst 2.0热启动dna聚合酶(new england biolabs)。
[0420]
可用于链置换复制的添加剂包括细菌、病毒或真核生物来源的多种单链dna结合蛋白(ssb蛋白)中的任何一种、例如大肠杆菌的ssb蛋白、噬菌体t4基因32产品、噬菌体t7基因2.5蛋白、噬菌体pf3 ssb、复制蛋白a rpa32和rpa14亚基(wold、1997);其他dna结合蛋白、例如腺病毒dna结合蛋白、单纯疱疹蛋白icp8、bmrf1聚合酶辅助亚基、疱疹病毒ul29 ssb样蛋白;已知参与dna复制的许多复制复合蛋白中的任何一种、例如噬菌体t7解旋酶/引物酶、噬菌体t4基因41解旋酶、大肠杆菌rep解旋酶、大肠杆菌recbcd解旋酶、reca、大肠杆菌和真核拓扑异构酶(annu rev biochem.(2001)70:369-413)。
[0421]
错误引发或自引发事件,例如当再编码标签的末端间隔子序列引发延伸时,通过在引物延伸反应中包含单链结合蛋白(t4基因32,大肠杆菌ssb等)、dmso(1-10%)、甲酰胺(1-10%)、bsa(10-100ug/ml)、tmacl(1-5mm)、硫酸铵(10-50mm)、甜菜碱(1-3m)、甘油(5-40%)或乙二醇(5-40%),可以使自扩增最小化。
[0422]
大多数a型聚合酶都缺乏3'核酸外切酶活性(内源性或工程去除),例如klenow外
切酶,t7 dna聚合酶外切酶(sequenase 2.0),而taq聚合酶则催化非模板的添加核苷酸,优选地,双链扩增产物的3'钝端的腺苷碱基(较小程度的g碱基,取决于序列背景)。对于taq聚合酶,3'嘧啶(c》t)最小化非模板的腺苷添加,而3'嘌呤核苷酸(g》a)有利于非模板的腺苷添加。在一些实施例中,使用taq聚合酶进行引物延伸,在远离结合剂的间隔子序列和相邻条形码序列(例如,编码器序列或循环特异性序列)之间的编码标签中的胸腺嘧啶核苷碱基的位置可在记录标签间隔区序列的3'末端零星地包含非模板化腺苷核苷酸。以这种方式,扩展记录标签(带有或不带有非模板的腺苷碱基)可以与编码标签退火并进行引物延伸。
[0423]
或者,可以通过采用突变型聚合酶(嗜温或嗜热)减少非模板碱基的添加,其中突变的非模板末端转移酶活性由于一个或多个点突变而大大降低,尤其是在o-螺旋区域(参见美国专利7,501,237)(yang et al.,nucleic acids res.(2002)30(19):4314

4320)。pfu exo-,是3'核酸外切酶所没有的,具有链置换能力,也没有非模板末端转移酶活性。
[0424]
在另一个实施例中,聚合酶延伸缓冲液由40-120mm缓冲剂(例如ph值为6-9的tris-乙酸盐,tris-hcl,hepes等)组成。
[0425]
通过在记录/扩展记录标签中包括伪互补碱基,可以最小化由扩展记录标签的具有扩展记录标签的内部区域的终端间隔子序列的自退火发起的自启动/误启动事件(lahoud et al.,nucleic acids res.(2008)36:3409-3419),(hoshika et al.,angew chem int ed engl(2010)49(32):5554-5557)。伪互补碱基显示由于化学修饰的存在而彼此形成双链体的杂交亲和力显着降低。但是,许多伪互补修饰碱基可以与天然dna或rna序列形成强碱基对。在某些实施例中,编码标签间隔子序列由多个a和t碱基组成,并且使用亚磷酰胺寡核苷酸合成将市售的伪互补碱基2-氨基腺嘌呤和2-硫胸腺嘧啶掺入记录标签中。通过在反应中添加伪互补核苷酸,可以在引物延伸过程中将其他伪互补碱基掺入扩展记录标签中(gamper et al.,biochemistry.(2006)45(22):6978-86)。
[0426]
在一些实施例中,为了最小化溶液中编码标签标记的结合剂与固定蛋白的记录标签的非特异性相互作用,可以将与记录标签间隔子序列互补的竞争物(也称为阻断)寡核苷酸添加到结合反应中以最小化非特定的相互作用。在一些实施例中,阻断的寡核苷酸相对较短。在引物延伸之前,将过量的竞争者寡核苷酸从结合反应中冲洗掉,这可以有效地使退火的竞争者寡核苷酸与记录标签分离,尤其是在暴露于稍微升高的温度(例如,30-50℃)的情况下。阻断的寡核苷酸可在其3'端包括终止子核苷酸以防止引物延伸。
[0427]
在一些实施例中,编码标签可以包括发夹。在某些实施例中,发夹包括通过核酸链连接的相互互补的核酸区域。在一些实施例中,核酸发夹还可进一步包括从双链茎区段延伸的3'和/或5'单链区域。在一些实例中,发夹包括单链核酸。
[0428]
在某些实施例中,在引物延伸反应条件下,记录标签上的间隔子序列与编码标签上的互补间隔区序列的退火是亚稳态的(即,退火tm类似于反应温度)。这允许编码标签的间隔子序列置换退火至记录标签的间隔区序列的任何阻断的寡核苷酸。
[0429]
与特定结合剂相关联的编码标签信息也可以通过连接转移到记录标签上。连接可以是平末端连接或粘性末端连接。连接可以是酶连接反应。连接酶的例子包括但不限于cv dna连接酶(请参阅美国专利公开号us 2014/0378315)、t4 dna连接酶、t7 dna连接酶、t3dna连接酶、taq酶dna连接酶、大肠杆菌dna连接酶、9
°
n dna连接酶、或者,连接可以是化学连接反应。在图示中,通过使用“记录辅助”序列与编码标签上的臂的杂交
来实现无间隔子(spacer-less)的连接。使用标准化学连接或“点击化学”化学连接退火的补体序列(gunderson et al.,genome res(1998)8(11):1142-1153;peng et al.,european j org chem(2010)(22):4194-4197;el-sagheeret al.,proc natl acad sci u s a(2011)108(28):11338-11343;el-sagheer et al.,org biomol chem(2011)9(1):232-235;sharma et al.,anal chem(2012)84(14):6104-6109;roloff et al.,bioorg med chem(2013)21(12):3458-3464;litovchick et al.,artif dna pna xna(2014)5(1):e27896;roloff et al.,methods mol biol(2014)1050:131-141)。
[0430]
在另一个实施例中,可以使用公开的技术通过化学连接来完成pna的转移。pna的结构使得它具有一个5'n-末端胺基和一个不活泼的3'c-末端酰胺基。pna的化学连接需要修饰末端使其具有化学活性。这通常是通过半胱氨酸部分的5'n-末端衍生化和硫酯部分的3'c-末端衍生化来完成的。此类修饰的pna可以使用标准的天然化学连接条件轻松偶联(roloff et al.,(2013)bioorgan.med.chem.21:3458-3464)。
[0431]
在一些实施例中,可以使用拓扑异构酶转移编码标签信息。使用拓扑异构酶可用于将记录标签上的拓扑带电荷的3'磷酸连接至编码标签或其互补序列的5'末端(shuman et al.,1994,j.biol.chem.269:32678-32684)。
[0432]
如本文所述,结合剂可以结合翻译后修饰的氨基酸。因此,在某些实施例中,扩展记录标签包括与多肽的氨基酸序列和翻译后修饰有关的编码标签信息。在一些实施例中,在检测和消除末端氨基酸(例如ntaa或ctaa)之前完成内部翻译后修饰的氨基酸(例如,磷酸化、糖基化、琥珀酰化、泛素化、s-亚硝基化、甲基化、n-乙酰化、脂质化等)的检测。在一个实例中,使肽与用于ptm修饰的结合剂接触,并且将相关联的编码标签信息转移至记录标签。一旦完成与氨基酸修饰有关的编码标签信息的检测和转移,在检测和转移初级氨基酸序列的编码标签信息之前,可以使用n-末端或c-末端降解方法去除ptm修饰基团。因此,产生的扩展记录标签表明肽序列中存在翻译后修饰,尽管不是序列顺序,以及初级氨基酸序列信息。
[0433]
在一些实施例中,内部翻译后修饰的氨基酸的检测可以与初级氨基酸序列的检测同时进行。在一个实例中,ntaa(或ctaa)与翻译后修饰的氨基酸特异性结合剂接触,该结合剂单独或作为结合剂文库的一部分(例如,由20种标准氨基酸和所选的翻译后修饰氨基酸的结合剂组成的文库)。随后进行末端氨基酸消除和与结合剂(或结合剂文库)接触的连续循环。因此,得到的扩展记录标签表明在初级氨基酸序列的背景下翻译后修饰的存在和次序。
[0434]
在某些实施例中,每个多肽可以采用记录标签的整体,以提高编码标签信息转移的整体鲁棒性(robustness)和效率。使用与给定多肽相关联的记录标签的整体而不是单个的记录标签,由于编码标签与记录标签的潜在更高的偶联产量和更高的文库整体产量,提高了文库构建的效率。单个串联的扩展记录标签的产量直接取决于串联的逐步产量,而能够接收编码标签信息的多个记录标签的使用不会遭受串联的指数损失。
[0435]
对于涉及变性蛋白质、多肽和肽分析的实施例,结合的结合剂和退火的编码标签可以在引物延伸后通过使用高度变性条件而被除去(例如0.1-0.2n naoh,6m尿素,2.4m异硫氰酸胍,95%甲酰胺等)。
[0436]
c.通过氨基酸识别,记录标签延伸和氨基酸去除的循环回合表征多肽
[0437]
在某些实施例中,本公开中提供的用于分析多肽的方法包括多个结合循环,其中该多肽与多种结合剂接触,并且结合剂的连续结合将基于编码标签的氨基酸形式的历史结合信息转移到至少一个与多肽相关联的记录标签。以这种方式,以核酸形式产生了包括关于多个结合事件的信息的历史记录。
[0438]
在某些实施例中,控制溶液中结合剂的浓度以减少测定的背景和/或假阳性结果。
[0439]
在一些实施例中,结合剂的浓度可以处于任何合适的浓度,例如约0.0001nm、约0.001nm、约0.01nm、约0.1nm、约1nm、约2nm、约5nm、约10nm、约20nm、约50nm、约100nm、约200nm、约500nm或约1000nm。在其他实施例中,用于测定的可溶性缀合物的浓度为约0.0001nm至约0.001nm之间,约0.001nm至约0.01nm之间,约0.01nm至约0.1nm之间,约0.1nm至约1nm之间,在约1nm和约2nm之间,在约2nm和约5nm之间,在约5nm和约10nm之间,在约10nm和约20nm之间,在约20nm和约50nm之间,在约50nm至约100nm之间,约100nm至约200nm之间,约200nm至约500nm之间,约500nm至约1000nm之间或大于约1000nm。
[0440]
在一些实施例中,可溶性结合剂分子与固定的多肽和/或记录标签之间的比例可以在任何合适的范围内,例如,在约0.00001:1、约0.0001:1、约0.001:1、约0.01:1、大约0.1:1、大约1:1、大约2:1、大约5:1、大约10:1、大约15:1、大约20:1、大约25:1、大约30:1、大约35:1、大约40:1、大约45:1、大约50:1、大约55:1、大约60:1、大约65:1、大约70:1、大约75:1、大约80:1、大约85:1、约90:1、约95:1、约100:1、约104:1、约105:1、约106:1或更高,或上述所列比率之间的任何比率。可溶性结合剂分子与固定的多肽和/或记录标签之间的较高比例可用于驱使结合和/或编码标签/编码标签信息转移至完成。这对于检测和/或分析样品中的低丰度多肽可能特别有用。
[0441]
在涉及使用基于n-末端降解的方法分析肽或多肽的方法的实施例中,在第一结合剂与n氨基酸的肽的n ntaa接触并结合,并且将第一结合剂的编码标签信息转移至当与肽相关联的记录标签之后,从而产生一阶扩展记录标签时,如本文所述消除n ntaa。在一些实施例中,修饰的切割酶在多肽分析测定中的用途是去除标记的ntaa。在一些方面,可以结合使用第一部分中描述的修饰的切割酶中任何的两个或更多个,以去除标记的ntaa。例如,可以用修饰的切割酶混合物处理样品,以去除样品中肽中的各种ntaa。通过与修饰的切割酶接触而去除n标记的ntaa,将肽的n-1氨基酸转化为n-末端氨基酸,其在本文中称为n-1ntaa。使第二结合剂与肽接触并结合至n-1ntaa,并且将第二结合剂的编码标签信息转移至第一阶扩展记录标签,从而生成第二阶扩展记录标签(例如,用于生成表示肽的串联的第n阶扩展记录标签),或以不同的记录标签(例如,用于生成多个扩展记录标签,其共同代表肽)。通过修饰的切割酶消除n-1标记的ntaa可将肽的n-2氨基酸转化为n-末端氨基酸,其在本文中称为n-2ntaa。额外的结合、转移、标记和去除,可以如上所述发生,最多n个氨基酸产生第n阶扩展记录标签或n个单独的扩展记录标签。如本文所用,当涉及结合剂,编码标签或扩展记录标签使用时,n“阶”是指n个结合循环,其中使用了结合剂及其相关联的编码标签或创建扩展记录标签的n个结合循环。在一些实施例中,可以代替地使用ctaa来进行所描述的示例性方法中包括ntaa的步骤。
[0442]
在一些实施例中,第一结合剂和第二结合剂与多肽以及任选地任何其他结合剂(例如,第三结合剂,第四结合剂,第五结合剂等)的接触在同一时间进行。例如,可以将第一结合剂和第二结合剂,以及任选地任何其他阶的结合剂合并在一起,例如以形成结合剂的
文库。在另一个实例中,第一结合剂和第二结合剂,以及任选地任何其他阶的结合剂,不是被汇集在一起,而是被同时添加到多肽中。在一个实施例中,结合剂文库包括至少20种结合剂,其选择性结合20种标准的天然存在的氨基酸。
[0443]
在其他实施例中,使第一结合剂和第二结合剂,以及任选地任何其他阶的结合剂,以单独的结合循环分别与多肽接触,并按序列顺序(sequential order)加入。在某些实施例中,并行地同时使用多种结合剂。这种并行方法节省了时间并减少了非同源结合剂对同源结合剂结合的位点之间的非特异性结合(因为结合剂处于竞争状态)。
[0444]
通过本文描述的方法生成的最终扩展记录标签的长度取决于多个因素,包括编码标签的长度(例如,编码器序列和间隔子),记录标签的长度(例如,唯一分子标识符,间隔子,通用引发位点,条形码),进行结合循环数以及是否将来自每个结合循环的编码标签转移到同一扩展记录标签或多个扩展记录标签。在一些实例中,如果编码标签具有5个碱基的编码器序列,该编码器序列在每侧是5个碱基的间隔子,最终扩展记录标签上的编码标签信息代表肽的结合剂历史,是10碱基和降解周期数的乘积。
[0445]
在最终的结合循环和最终的结合剂的编码标签信息转移至扩展记录标签之后,可以通过连接,引物延伸或本领域已知的其他方法通过添加通用的反向引发位点来对标签进行封端。在一些实施例中,记录标签中的通用正向引发位点与附加到最终扩展记录标签上的通用反向引发位点兼容。在一些实施例中,通用反向引物位点是illumina p7引物(5'-caagcagaagacggcatacgagat

3'-seq id no:4)或illumina p5引物(5'-aatgatacggcgaccaccga-3'-seq id no:3)。取决于记录标签的链感(strand sense),可以附加有义或反义p7。扩展记录标签文库可以直接从固相载体(例如珠子)上切割或扩增,并用于传统的下一代测序测定和方案中。
[0446]
在一些实施例中,在单链扩展记录标签的文库上进行引物延伸反应以复制其互补链。在一些实施例中,肽测序测定法(例如,proteocode测定法)在循环过程中包括几个化学和酶促步骤。在某些情况下,单分子分析的一个优势是对各种循环化学/酶促步骤效率低下的鲁棒性。在一些实施例中,编码标签序列中存在的循环特异性条形码的使用为测定带来了好处。
[0447]
d.标签处理与分析
[0448]
扩展记录标签和代表目的多肽的任何其他标签可以使用多种核酸测序方法进行处理和分析。测序方法的实例包括但不限于链终止测序(sanger测序);下一代测序方法,例如合成测序、连接测序、杂交测序、polony测序、离子半导体测序和焦磷酸测序。以及第三代测序方法,例如单分子实时测序、基于纳米孔的测序、双链中断测序以及使用高级显微镜对dna的直接成像。
[0449]
用于本发明的合适的测序方法包括但不限于通过杂交测序,通过合成技术测序(例如hiseq tm和solexa tm,illumina),smrt tm(单分子实时)技术(pacific biosciences),真正的单分子测序(例如heliscope
tm
,helicos biosciences),大规模并行的下一代测序(例如solid
tm
,applied biosciences;solexa和hiseq
tm
,illumina),大规模并行的半导体测序(例如ion torrent),焦磷酸测序技术(例如,gs flx和gs junior系统,roche/454)和纳米孔序列(例如,oxford nanopore technologies)。
[0450]
扩展记录标签,扩展编码标签或双标签的文库可以通过各种方式进行放大。扩展
记录标签,扩展编码标签或双标签的文库可以例如通过pcr或乳液pcr进行指数扩增。已知乳液pcr可产生更均匀的扩增(hori,fukano et al.,biochem biophys res commun(2007)352(2):323-328)。或者,扩展记录标签,扩展编码标签或双标签的文库可以经历线性扩增,例如,通过使用t7 rna聚合酶的模板dna的体外转录。可以使用与其中包括的通用正向引发位点和通用反向引发位点兼容的引物扩增扩展记录标签,扩展编码标签或双标签的文库。还可以使用拖尾引物(tailed primers)扩增扩展记录标签,扩展编码标签或双标签的文库,以在扩展记录标签,扩展编码标签,或双标签的5'端,3'端或两端添加序列。可以添加到扩展记录标签,扩展编码标签或双标签的末端的序列包括特定于文库的索引序列,以允许在单个测序运行中多个文库的多路复用,衔接子序列,读取引物序列或用于与测序平台兼容的扩展记录标签,扩展编码标签或双标签文库建立的任何其他序列。为下一代测序做准备的文库扩增的例子如下:使用从~1mg珠子(~10ng)、200m dntp、1m各正向和反向扩增引物、0.5l(1u)phusion hot start酶(new england biolabs)洗脱的扩展记录标签库建立20μl pcr反应体积并置于以下循环条件下:98℃持续30秒,然后进行20个98℃持续10秒的循环,60℃持续30秒,72℃持续30秒,然后72℃持续7分钟,然后保持在4℃。
[0451]
在某些实施例中,在扩增之前,期间或之后,扩展记录标签,扩展编码标签或双标签的文库可以经历靶标富集。在一些实施例中,靶富集可用于在测序之前从扩展记录标签,扩展编码标签或双标签的文库中选择性地捕获或扩增代表目标多肽的扩展记录标签。在某些方面,用于蛋白质测序的靶标富集是具有挑战性的,因为高成本和难以产生针对靶蛋白质的高特异性结合剂。在某些情况下,众所周知,抗体是非特异性的,难以成千上万种蛋白质的大规模生产。在一些实施例中,本公开的方法通过将蛋白质密码转换成核酸密码来规避该问题,该核酸密码然后可以利用可用于dna文库的广泛的靶向dna富集策略。在某些情况下,可以通过富集目标肽段相应的扩展记录标签来富集目标肽段。靶向富集的方法是本领域已知的,包括杂交捕获测定,基于pcr的测定,例如truseq定制扩增子(illumina),挂锁探针(也称为分子倒置探针)等(请参阅mamanova et al.,(2010)nature methods 7:111-118;bodi et al.,j.biomol.tech.(2013)24:73-86;ballester et al.,(2016)expert review of molecular diagnostics357-372;mertes et al.,(2011)brief funct.genomics 10:374-386;nilsson et al.,(1994)science265:2085-8;每个都通过引用整体并入本文)。
[0452]
在一个实施例中,通过基于杂交捕获的测定来丰富扩展记录标签,扩展编码标签或双标签的文库。在基于杂交捕获的测定中,将扩展记录标签,扩展编码标签或双标签的文库与用亲和标签(例如,生物素)标记的靶标特异性寡核苷酸或“诱饵寡核苷酸”杂交。与靶向特异性寡核苷酸杂交的扩展记录标签、扩展编码标签或di标签通过其亲和力标签使用亲和力配体(例如,链霉抗生物素蛋白包被的珠)被“下拉”,并且背景(非特异性)扩展记录标签被洗掉。然后获得用于正向富集的富集的扩展记录标签,扩展编码标签或双标签(例如,从磁珠上洗脱)。
[0453]
对于通过基于阵列的“原位”寡核苷酸合成和随后的寡核苷酸池扩增而合成的诱饵寡核苷酸,可以通过在给定的寡核苷酸阵列内采用几套通用引物,将竞争性诱饵工程化到池中。对于每种类型的通用引物,生物素化引物与非生物素化引物的比例控制富集比例。几种引物类型的使用使得可以将几种富集比设计成最终的寡核苷酸诱饵池。
[0454]
诱饵寡核苷酸可被设计成与代表目的多肽的扩展记录标签,扩展编码标签或双标签互补。诱饵寡核苷酸与扩展记录标签,扩展编码标签或双标签中的间隔子序列的互补程度可以是0%至100%,并且在其之间的任何整数。通过一些富集实验可以轻松优化此参数。在一些实施例中,在编码标签设计中,相对于编码器序列的间隔子的长度被最小化,或者间隔子被设计成不可用于与诱饵序列杂交。一种方法是使用在辅因子存在下形成二级结构的间隔子。这种二级结构的一个例子是g-四联体,它是由两个或更多个鸟嘌呤四联体彼此堆叠形成的结构(bochman et al.,nat rev genet(2012)13(11):770-780)。鸟嘌呤四方体是由通过hoogsteen氢键结合的四个鸟嘌呤碱基形成的方形平面结构。g-四联体结构在阳离子(例如k 离子对li 离子)的存在下是稳定的。
[0455]
为了使所使用的诱饵寡核苷酸的数量最小化,可以通过生物信息学鉴定每种蛋白质的一组相对独特的肽,并且在杂交捕获试验中,仅使用与相关肽的相应扩展记录标签库表示互补的那些诱饵寡核苷酸。在一些实施例中,也可以用相同或不同的诱饵组进行连续的回合或富集。
[0456]
为了在代表其片段的扩展记录标签,扩展编码标签或双标签(例如,肽)的文库中富集多肽的全长,“平铺”诱饵寡核苷酸可以设计为跨整个核酸代表的蛋白质。
[0457]
在另一个实施例中,可以使用引物延伸和基于连接的介导的扩增富集(ampliseq,pcr,truseq tsca等)可用于选择和模块代表多肽子集的文库元件的富集组分。竞争性寡核苷酸也可用于调节引物延伸,连接或扩增的程度。在最简单的实施中,这可以通过混合包括通用引物尾部的靶标特异性引物和缺少5'通用引物尾部的竞争性引物来实现。在初始引物延伸后,仅具有5'通用引发序列的引物可以被扩增。具有和不具有通用引发序列的引物的比例控制扩增的靶标的组分(fraction)。在其他实施例中,包含杂交但非延伸的引物可用于调节经历引物延伸、连接或扩增的文库元件组分。
[0458]
靶向富集方法也可以在阴性选择模式下使用,以在测序前从文库中选择性去除扩展记录标签,扩展编码标签或双标签。因此,在上述使用生物素化的诱饵寡核苷酸和链霉抗生物素蛋白包被的珠子的实施例中,保留上清液用于测序,而未分析与珠子结合的诱饵-寡核苷酸:扩展记录标签,扩展编码标签或双标签杂合体。可以去除的不期望的扩展记录标签,扩展编码标签或双标签的例子是那些代表了丰富的多肽种类(例如,蛋白质,白蛋白,免疫球蛋白等)的标签。
[0459]
与靶标杂交但缺乏生物素部分的竞争性寡核苷酸诱饵也可用于杂交捕获步骤,以调节任何特定基因座富集的组分。竞争寡核苷酸诱饵与标准生物素化诱饵竞争与靶标的杂交,从而有效调节富集过程中下拉的靶标组分。可以使用这种竞争性抑制方法将蛋白质表达的10个动态范围压缩几个数量级,特别是对于白蛋白等过丰富的物种而言。因此,相对于标准杂交捕获,针对给定基因座捕获的文库元件的组分可以从100%降低到0%富集进行调节。
[0460]
此外,文库规范化技术可用于从扩展记录标签,扩展编码标签或双标签库中删除过多的物种。这种方法最适合于确定长度的文库,该文库来源于通过位点特异性蛋白酶消化产生的肽,例如胰蛋白酶,lysc,gluc等。在一个例子中,标准化可以通过变性双链库并允许库元素再退火来实现。由于双分子杂交动力学的二级速率常数,丰富的文库元素比不丰富的文库元素更快地再退火。(bochman,paeschke et al.2012)。可以使用本领域已知的方
s a(2010)107(37):16060-16065)。作为无马达di测序的替代方法,可以将间隔子元件设计为采用二级结构,例如g四联体(g-quartet),当其通过纳米孔时,将暂时停止扩展记录标签、扩展编码标签或双标签,从而能够读出相邻编码器序列(shim et al.,nucleic acids res(2009)37(3):972-982;zhang et al.,mabs(2016)8,524

535)。在经过停止之后,下一个间隔子将再次做出暂时停止,从而能够读取下一个编码器序列,依此类推。
[0466]
本文公开的方法可用于同时(多重)用于多种多肽的分析,包括检测,定量和/或测序。如本文所用,多重化是指在同一测定中分析多种多肽。多种多肽可以衍生自相同样品或不同样品。多种多肽可以衍生自相同的受试者或不同的受试者。被分析的多种多肽可以是不同的多肽,或者是衍生自不同样品的相同多肽。多种多肽包括2个或更多个多肽、5个或更多个多肽、10个或更多个多肽、50个或更多个多肽、100个或更多个多肽、500个或更多个多肽、1000个或更多个多肽、5,000个或更多个多肽、10,000个或更多个多肽、50,000或更多的多肽、100,000或更多的多肽、500,000或更多的多肽或1,000,000或更多的多肽。
[0467]
可以通过对记录标签标记的多肽样品进行预先条形码编码来实现样品多路复用。每个条形码代表一个不同的样品,可以在进行循环结合测定或序列分析之前合并样品。这样,许多条形码标记的样品可以在单个试管中同时处理。该方法是对反相蛋白质阵列(rppa)进行免疫测定的一项重大改进(akbani et al.,mol cell proteomics(2014)13(7):1625-1643;creighton et al.,drug des devel ther(2015)9:3519-3527;nishizuka et al.,drug metab pharmacokinet(2016)31(1):35-45)。以此方式,本公开实质上以简单的工作流程提供了高度数字化的样品和分析物多路复用的替代rppa测定的方法。
[0468]
iv.试剂盒和相关制造文章
[0469]
本文提供的试剂盒包括一种或多种修饰的切割酶,其包括突变,例如,未修饰的切割酶中的一个或多个氨基酸修饰以及用于或标记多肽的末端氨基酸的试剂。在一些方面,修饰的切割酶衍生自二肽切割酶并从多肽去除单个标记的末端氨基酸,或修饰的切割酶衍生自三肽切割酶并从多肽或来自多肽的单个标记的末端二肽去除单个标记的末端氨基酸。在一些实施例中,试剂盒还包括使用试剂处理多肽以进行分析和/或测序的说明书。在一些实施例中,包括一种或多种修饰的切割酶的试剂盒(例如,如在部分一中所述)用于处理肽,多肽和蛋白质以进行测序和/或分析。在一些实施例中,蛋白质分析采用分子识别事件和/或可检测标记物的条形码和核酸编码。在一些实施例中,试剂盒还包括用于处理多肽和多肽分析的其他组分,包括标签(例如dna标签或dna记录标签),固相载体和用于制备多肽的其他试剂以及用于多肽分析的试剂。
[0470]
在一些实施例中,试剂盒包括一个以上的修饰的切割酶。在某些情况下,多种修饰的切割酶可以表现出不同的特征,例如,对结合多肽和/或切割氨基酸的偏好。在一些实施例中,试剂盒中可以包括两种或更多种修饰的切割酶作为酶的混合物,或与每种修饰的切割酶分开地包括在容器中。在一些实施例中,将不同的修饰的切割酶同时或顺序地与多肽接触。
[0471]
在一些实施例中,试剂盒还包括一种或多种另外的酶以消除ntaa(例如脯氨酸氨基肽酶)。在一些具体的实例中,另外的酶是脯氨酸氨基肽酶,脯氨酸亚肽酶(pip)或焦谷氨酸氨基肽酶(pgap)。在一些实施例中,试剂盒中提供了一种或多种修饰的切割酶与其他酶的组合。在某些特定情况下,修饰的切割酶和其他酶作为试剂盒中的混合物(cocktail)提
供。
[0472]
在一些实施例中,试剂盒还包括一种或多种缓冲液或反应液,其包括底物,离子和发生所需反应所必需的因子。包括洗涤缓冲液,反应缓冲液和结合缓冲液,洗脱缓冲液等的缓冲液是本领域技术人员已知的。在一些实施例中,修饰的切割酶是金属肽酶,并且试剂盒包括缓冲液,该缓冲液包括活化修饰的切割酶所需的金属离子。在一些实例中,试剂盒包括活化修饰的切割酶所需的必需金属离子,例如,锌离子或氯离子。在一些实施例中,试剂盒还包括用于使经修饰的切割酶失活的金属螯合剂或其他试剂。在一些实施例中,试剂盒进一步包括缓冲液和其他组分,以与本文所述的其他试剂一起使用。试剂,缓冲液和其他组分可以在小瓶(例如密封的小瓶),容器,安瓿瓶,瓶子,广口瓶,软包装(例如,密封的聚酯薄膜或塑料袋)等中提供。试剂盒的任何组件都可以进行灭菌和/或密封。
[0473]
在一些实施例中,试剂盒进一步包括一种或多种结合剂,其中每种结合剂包括带有关于结合剂的识别信息的编码标签。在某些情况下,试剂盒包括两种或更多种结合剂。在一些实例中,试剂盒包括结合剂文库。在一些实施例中,两种或更多种结合剂可以在单独的容器中或作为混合物在容器中提供。在一些实施例中,试剂盒还包括用于将编码标签的识别信息转移至附着于多肽的记录标签的试剂,其中识别信息向记录标签的转移在多肽上产生延扩展记录标签。在某些情况下,用于传递识别信息的试剂是化学连接试剂或生物连接试剂。
[0474]
在一些实施例中,试剂盒进一步包括用于扩增扩展记录标签的扩增试剂。
[0475]
在一些实施例中,试剂盒还包括选自以下的底物:珠子、多孔珠子、磁性珠子、顺磁性珠子、多孔基质、阵列、表面、玻璃表面、硅表面、塑料表面、载玻片、过滤器、尼龙、芯片、硅晶片芯片、流通芯片、包括信号转导电子器件的生物芯片、孔、微量滴定板、板、elisa板、圆盘、旋转干涉仪圆盘、膜、硝酸纤维素膜、基于硝化纤维素的聚合物表面、纳米颗粒(例如、包括诸如磁性纳米颗粒(fe3o4)、金纳米颗粒和/或银纳米颗粒之类的金属)、量子点、纳米壳、纳米笼、微球或其任何组合。在一些实施例中,试剂盒包括多个底物。
[0476]
在一些实施例中,试剂盒包括一种或多种用于核酸序列分析的试剂。在一些实例中,用于序列分析的试剂用于合成测序、连接测序、杂交测序、polony测序、离子半导体测序、焦磷酸测序、单分子实时测序、基于纳米孔的测序或使用高级显微镜技术对dna直接成像或其任何组合。
[0477]
在一些实施例中,试剂盒或制品可进一步包括关于本文描述的方法和用途的说明书。在一些实施例中,说明书针对制备和处理多肽的方法,所述多肽包括本文提供的修饰的切割酶。从商业和用户的角度来看,本文所述的试剂盒还可包括其他所需材料,包括其他缓冲液、稀释剂、过滤器、注射器和包装插页、以及用于执行本文所述任何方法的说明。
[0478]
任何上述提到的试剂盒成分、以及任何分子、分子复合物或缀合物、试剂(例如化学或生物试剂、包括修饰的切割酶)、剂、结构(例如载体、表面、颗粒或珠子)、反应中间体、反应产物、结合复合物或在示例性试剂盒和方法中公开和/或使用的任何其它制品可以单独提供或以任何合适的组合提供,以便形成试剂盒。试剂盒可任选地包括使用修饰的切割酶的说明书。
[0479]
v.示例性实施例
[0480]
在所提供的实施例中包括:
[0481]
1.修饰的切割酶,其在未修饰的切割酶中包括突变,例如一个或多个氨基酸修饰,其中:
[0482]
修饰的切割酶衍生自二肽切割酶,并且从多肽中去除或被配置为从多肽中去除单个标记的末端氨基酸;或者
[0483]
修饰的切割酶衍生自三肽切割酶,并且从多肽中去除或配置成从多肽中去除单个标记的末端氨基酸或从多肽中去除单个标记的末端二肽。
[0484]
2.实施例1的修饰的切割酶,其中,衍生自二肽切割酶或三肽切割酶的修饰的切割酶被配置为切割多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的肽键。
[0485]
3.实施例1的修饰的切割酶,其中,衍生自三肽切割酶的修饰的切割酶被配置为切割该多肽的倒数第二个末端标记的氨基酸残基和倒数第三个末端氨基酸残基之间的肽键。
[0486]
4.实施例1-3中任一项的修饰的切割酶,其中,所述修饰的切割酶包括与所述多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的酰胺键相互作用的活性位点。
[0487]
5.实施例1-4中任一项的修饰的切割酶,其中,所述未修饰的切割酶选自金属肽酶、锌依赖性金属肽酶或锌依赖性水解酶。
[0488]
6.实施例1-5中任一项的修饰的切割酶,其中,所述未修饰的切割酶是分类为ec 3.4.14、ec 3.4.15、merops s8、merops s9、merops s33、merops s46、merops m49或merops s53的蛋白质、或其功能同源物或片段。
[0489]
7.实施例1-6中任一项的修饰的切割酶,其中,所述未修饰的切割酶是二肽基肽酶、二肽基氨基肽酶、肽基-二肽酶、二肽基羧基肽酶、sedolisin或三肽基肽酶。
[0490]
8.实施例1-7中任一项的修饰的切割酶,其中,所述未修饰的切割酶是二肽基肽酶3、二肽基肽酶5、二肽基肽酶7、二肽基肽酶11、二肽基氨基肽酶bii或二肽基肽酶bii。
[0491]
9.实施例1-8中任一项的修饰的切割酶,其中,所述标记的末端氨基酸或二肽包括n-末端氨基酸(ntaa)。
[0492]
10.实施例1-8中任一项的修饰的切割酶,其中,所述标记的末端氨基酸或二肽包括c-末端氨基酸(ctaa)。
[0493]
11.实施例1-10中任一项的经修饰的切割酶,其中,所述末端氨基酸被化学或酶促试剂或部分标记。
[0494]
12.实施例1-11中任一项的经修饰的切割酶,其中,所述标记物包括阻断的氨基酸。
[0495]
13.实施例1-12中任一项的经修饰的切割酶,其中,所述标记物包括外源氨基酸。
[0496]
14.实施例1-13中任一项的修饰的切割酶,其中,所述标记包括化学标记。
[0497]
15.实施例11的修饰的切割酶,其中,所述化学试剂选自异硫氰酸苯酯(pitc),硝基pitc,磺基pitc,苯基异氰酸酯(pic),硝基pic,磺基pic,cbz-cl(氯甲酸苄酯)或cbz-osu(苄氧羰基n-琥珀酰亚胺),羧基活化的氨基封闭氨基酸,酸酐,1-氟-2,4-二硝基苯(桑格氏试剂,dnfb),丹磺酰氯(dns-cl或1-二甲基氨基萘-5-磺酰氯),4-磺酰基-2-硝基氟苯(snfb),2-吡啶甲醛,2-甲酰基苯基硼酸,2-乙酰基苯基硼酸,1-氟-2,4-二硝基苯,4-氯-7-硝基苯并呋喃,五氟苯基异硫氰酸酯,4-(三氟甲氧基)-苯基异硫氰酸酯,4-(三氟甲基)-苯基异硫氰酸酯,3-(羧酸)-苯基异硫氰酸酯,3-(三氟甲基)-苯基异硫氰酸酯,1-萘基异硫氰
酸酯,n-硝基咪唑-1-羧酰亚胺,n,n'-双(新戊酰)-1h-吡唑-1-羧脒,n,n'-双(苄基(氧羰基)-1h-吡唑-1-羧脒,乙酰化试剂,胍基化试剂,硫酰化试剂,硫代乙酰化试剂,硫代苄基化试剂和二杂环甲胺试剂或其衍生物。
[0498]
16.实施例11的修饰的切割酶,其中,所述化学试剂是靛红酸酐,异烟酸酐,氮杂靛红酸酐,琥珀酸酐或其衍生物。
[0499]
17.实施例16的修饰的切割酶,其中,所述化学试剂选自由以下组成的组:4-硝基苯基邻氨基苯甲酸酯、n-甲基-靛红酸酐、n-乙酰基-靛红酸酐、4-羧酸靛红酸酐、5-甲氧基-靛红酸酐、5-硝基-靛红酸酐、4-氯-靛红酸酐、4-氟-靛红酸酐、6-氟-靛红酸酐酐、n-苄基-靛红酸酐、4-三氟甲基-靛红酸酐、5-三氟甲基-靛红酸酐、4-硝基-靛红酸酐、4-甲氧基-靛红酸酐、5-氨基-2-氟-异烟酸酐(6-氟-1h-吡啶并[3,4-d][1,3]恶嗪-2,4-二酮)、3,6,二氟邻苯二甲酸酐和2,3吡嗪二羧酸酐或其衍生物。
[0500]
18.实施例1-17中任一项的修饰的切割酶,其中,所述修饰的切割酶包括表现出与未修饰的切割酶具有至少50%同一性、至少60%同一性、至少70%同一性、至少80%同一性、至少90%或更高的同一性的氨基酸序列。
[0501]
19.实施例1-18中任一项的修饰的切割酶,其中,所述突变包括氨基酸取代、缺失、添加或其组合。
[0502]
20.实施例1-19中任一项的修饰的切割酶,其中,所述多肽的长度大于4个氨基酸、大于5个氨基酸、大于6个氨基酸、大于7个氨基酸、大于8个氨基酸、更大大于9个氨基酸、大于10个氨基酸、大于11个氨基酸、大于12个氨基酸、大于13个氨基酸、大于14个氨基酸、大于15个氨基酸、大于20个氨基酸、大于25个氨基酸或大于30个氨基酸。
[0503]
21.实施例1-20中任一项的修饰的切割酶,其中,所述多肽的长度大于10个氨基酸。
[0504]
22.实施例1-21中任一项的修饰的切割酶,其中,所述修饰的切割酶在其底物结合位点内包括修饰。
[0505]
23.实施例1-22中任一项的修饰的切割酶,其中,所述修饰的切割酶在其催化结构域内包括修饰。
[0506]
24.实施例1-23中任一项的修饰的切割酶,其中,所述修饰的切割酶在其胰凝乳蛋白酶折叠内包括修饰。
[0507]
25.实施例1-24中任一项的修饰的切割酶,其中,所述修饰的切割酶在胺基结合位点包括修饰。
[0508]
26.实施例1-25中任一项的修饰的切割酶,其中,所述修饰的切割酶在其环结构域中包括修饰。
[0509]
27.实施例1-26中任一项的修饰的切割酶,其中,所述修饰的切割酶包括用于改善对修饰的切割酶的活性位点的可及性的修饰。
[0510]
28.实施例1-27中任一项的修饰的切割酶,其中,所述修饰的切割酶衍生自如seq id no:13或20中提供的二肽基氨基肽酶bii或二肽基肽酶bii。
[0511]
29.实施例1-28中任一项的修饰的切割酶,其中,所述修饰的切割酶具有的氨基酸序列与seq id no:17-19、23-28、31-39或其特异性结合片段具有至少20%的同一性,至少30%的同一性,至少40%的同一性,至少50%的同一性,至少60%的同一性,至少70%的同
一性,至少80%的同一性,或至少90%或更多的同一性。
[0512]
30.实施例1-29中任一项的修饰的切割酶,修饰的切割酶包括seq id no:17-19、23-28中任一个所列的氨基酸序列,或氨基酸序列与seq id no:17-19、23-28、31-39中的任何一个或其特异性结合片段具有至少95%的序列同一性。
[0513]
31.实施例1-30中任一项的修饰的切割酶,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置126、188、189、190、191、192、196、238,302、306、307、310、525、528、546、604、650、651、655、656、665和/或692。
[0514]
32.实施例1-31中任一项的修饰的切割酶,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,对应于位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665和/或692,参照seq id no:13的编号,并且包括的氨基酸序列与seq id no:17-19、23-28或31-39中的任何一个具至少30%的同一性,至少40%的同一性,至少50%的同一性,至少60%的同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0515]
33.实施例1-32中任一项的修饰的切割酶,其中,一个或多个氨基酸取代a126t、d188v、i189a、d190s、n191c、n191f、n191l、n191m、n191r、n191s、n191t、n191v、w192f、w192g、w192l、r196h、r196k、r196s、r196t、r196v、g238v、a302w、n306a、n306g、n306r、n306s、t307k、n310d、n310g、n310k、n310l、n525k、a528v、f546l、a604v、d650a、d650g、d650s、g651h、g651t、g651v、g651y、s655g、s655t、v656e、v656g、v656s、k665i、k692n和/或其保守氨基酸取代。
[0516]
34.实施例1-33中任一项的修饰的切割酶,其中,一个或多个氨基酸修饰是n191m/w192g/r196v/n306r/d650a、d188v/i189a/d190s/n191l/w192g/r196s/a302w/n310k/d650a、n191m/w192g/r196t/n306r/t307k/d650a、n191m/w192g/r196t/n306r/n525k/a528v/a604v/d650a/k692n、a126t/n191m/w192g/r196t/g238v/n306r/d650a、n191m/w192g/r196t/n306r/f546l/d650a、n191m/w192g/r196t/n306r/d650a/g651v/k665i、n191m/w192g/r196t/n306r/d650a/g651v、n191c/w192l/r196k/n306r/n310d/g651y/s655g/v656g、n191c/w192l/n306r/n310d/g651y/s655g/v656g、n191f/w192f/n306r/n310g/g651h/v656e、n191r/w192l/n306s/n310l/g651t/s655t/v656s、n191s/r196h/n306a/d650g、n191t/r196h/n306a/d650g、n191m/r196h/n306a/d650g、n191v/n306a/d650s、或n191s/n306g/d650s。
[0517]
35.实施例1-34中任一项的修饰的切割酶,其中,所述修饰的切割酶表现出seq id no:17-19、23-28或31-39中的任何序列的底物特异性。
[0518]
36.实施例1-35中任一项的修饰的切割酶,其中,所述修饰的切割酶具有包括催化结构域的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的催化结构域具有至少20%同一性,至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0519]
37.实施例1-36中任一项的修饰的切割酶,其中,所述修饰的切割酶具有包括胺基结合位点的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的胺基结合位点具有至少20%同一性,至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,
至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0520]
38.实施例1-37中任一项的修饰的切割酶,其中,所述修饰的切割酶具有包括环结构域的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的环结构域具有至少20%同一性,至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0521]
39.实施例1-38中任一项的修饰的切割酶,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201和/或202。
[0522]
40.实施例1-38中任一项的修饰的切割酶,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置188、189、190、191、192、302和/或310。
[0523]
41.实施例1-38中任一项的修饰的切割酶,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置191、192、196、306、310、627、628、630、648、650、651、655、656和/或669。
[0524]
42.实施例1-38中任一项的修饰的切割酶,其中,所述修饰的切割酶包括在未修饰的切割酶中一个或多个氨基酸修饰,参考seq id no:13的编号,其对应于位置323至544中的任何一个。
[0525]
43.一种处理多肽的方法,包括使多肽与包括在未修饰的切割酶中的突变(例如一个或多个氨基酸修饰)的修饰的切割酶接触,其中:
[0526]
修饰的切割酶衍生自二肽切割酶,并且从多肽中去除或被配置为从多肽中去除单个标记的末端氨基酸;或者
[0527]
修饰的切割酶衍生自三肽切割酶,并且从多肽中去除或配置成从多肽中去除单个标记的末端氨基酸或从多肽中去除单个标记的末端二肽。
[0528]
44.实施例43的方法,其中,衍生自二肽切割酶或三肽切割酶的修饰的切割酶被配置为切割多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的肽键。
[0529]
45.实施例43或实施例44的方法,其中,所述修饰的切割酶包括与所述多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的酰胺键相互作用的活性位点。
[0530]
46.实施例43-45中任一项的方法,其中,所述单个标记的末端氨基酸或单个标记的末端二肽的去除暴露了所述多肽的新的末端氨基酸。
[0531]
47.实施例43-46中任一项的方法,其中,所述未修饰的切割酶选自金属肽酶,锌依赖性金属肽酶或锌依赖性水解酶。
[0532]
48.实施例43-47中任一项的方法,其中,所述未修饰的切割酶是分类为ec 3.4.14、ec3.4.15、merops s8、merops s9、merops s33、merops s46、merops m49或merops s53的蛋白质、或其功能同源物或片段。
[0533]
49.实施例43-48中任一项的方法,其中,所述未修饰的切割酶是二肽基肽酶、二肽基氨基肽酶、肽基-二肽酶、二肽基羧基肽酶、sedolisin或三肽基肽酶。
[0534]
50.实施例43-49中任一项的方法,其中,所述未修饰的切割酶是二肽基肽酶3、二肽基肽酶5、二肽基肽酶7、二肽基肽酶11、二肽基氨基肽酶bii或二肽基肽酶bii。
[0535]
51.实施例43-50中任一项的方法,其中,所述标记的末端氨基酸或二肽包括n-末
端氨基酸(ntaa)。
[0536]
52.实施例43-50中任一项的方法,其中,所述标记的末端氨基酸或二肽包括c-末端氨基酸(ctaa)。
[0537]
53.实施例43-52中任一项的方法,其中,所述修饰的切割酶包括表现出与未修饰的切割酶具有至少50%同一性、至少60%同一性、至少70%同一性、至少80%同一性、至少90%或更高的同一性的氨基酸序列。
[0538]
54.实施例43-53中任一项的方法,其中,所述突变包括氨基酸取代,缺失,添加或其组合。
[0539]
55.实施例43-54中任一项的方法,其中,所述多肽的长度大于4个氨基酸、大于5个氨基酸、大于6个氨基酸、大于7个氨基酸、大于8个氨基酸、更大大于9个氨基酸、大于10个氨基酸、大于11个氨基酸、大于12个氨基酸、大于13个氨基酸、大于14个氨基酸、大于15个氨基酸、大于20个氨基酸、大于25个氨基酸或大于30个氨基酸。
[0540]
56.实施例43-55中任一项的方法,其中,所述多肽的长度大于10个氨基酸。
[0541]
57.实施例43-56中任一项的方法,其中,所述修饰的切割酶在其底物结合位点内包括修饰。
[0542]
58.实施例43-57中任一项的方法,其中,所述修饰的切割酶在其催化结构域内包括修饰。
[0543]
59.实施例43-58中任一项的方法,其中,所述修饰的切割酶在其胰凝乳蛋白酶折叠内包括修饰。
[0544]
60.实施例43-59中任一项的方法,其中,所述修饰的切割酶在胺基结合位点包括修饰。
[0545]
61.实施例43-60中任一项的方法,其中,所述修饰的切割酶在其环结构域中包括修饰。
[0546]
62.实施例43-61中任一项的方法,其中,所述修饰的切割酶包括用于改善对修饰的切割酶的活性位点的可及性的修饰。
[0547]
63.实施例43-62中任一项的方法,其中,所述修饰的切割酶衍生自如seq id no:13或20中提供的二肽基氨基肽酶bii或二肽基肽酶bii。
[0548]
64.实施例43-63中任一项的方法,其中,所述修饰的切割酶具有的氨基酸序列与seq id no:17-19、23-28、31-39或其特异性结合片段具有至少20%的同一性,至少30%的同一性,至少40%的同一性,至少50%的同一性,至少60%的同一性,至少70%的同一性,至少80%的同一性,或至少90%或更多的同一性。
[0549]
65.实施例43-64中任一项的方法,其中,所述修饰的切割酶包括seq id no:17-19、23-28、31-39中任一个所列的氨基酸序列,或与氨基酸序列与seq id no:17-19、23-28、31-39中的任何一个或其特异性结合片段具有至少95%的序列同一性。
[0550]
66.实施例43-65中任一项的方法,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置126、188、189、190、191、192、196、238,302、306、307、310、525、528、546、604、650、651、655、656、665和/或692。
[0551]
67.实施例43-66中任一项的方法,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,对应于位置126、188、189、190、191、192、196、238、302、306、
307、310、525、528、546、604、650、651、655、656、665和/或692,参照seq id no:13的编号,并且包括的氨基酸序列与seq id no:17-19、23-28或31-39中的任何一个具至少30%的同一性,至少40%的同一性,至少50%的同一性,至少60%的同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0552]
68.实施例43-67中任一项的方法,其中,一个或多个氨基酸取代a126t、d188v、i189a、d190s、n191c、n191f、n191l、n191m、n191r、n191s、n191t、n191v、w192f、w192g、w192l、r196h、r196k、r196s、r196t、r196v、g238v、a302w、n306a、n306g、n306r、n306s、t307k、n310d、n310g、n310k、n310l、n525k、a528v、f546l、a604v、d650a、d650g、d650s、g651h、g651t、g651v、g651y、s655g、s655t、v656e、v656g、v656s、k665i、k692n和/或其保守氨基酸取代。
[0553]
69.实施例43-68中任一项的方法,其中,一个或多个氨基酸修饰是n191m/w192g/r196v/n306r/d650a、d188v/i189a/d190s/n191l/w192g/r196s/a302w/n310k/d650a、n191m/w192g/r196t/n306r/t307k/d650a、n191m/w192g/r196t/n306r/n525k/a528v/a604v/d650a/k692n、a126t/n191m/w192g/r196t/g238v/n306r/d650a、n191m/w192g/r196t/n306r/f546l/d650a、n191m/w192g/r196t/n306r/d650a/g651v/k665i、n191m/w192g/r196t/n306r/d650a/g651v、n191c/w192l/r196k/n306r/n310d/g651y/s655g/v656g、n191c/w192l/n306r/n310d/g651y/s655g/v656g、n191f/w192f/n306r/n310g/g651h/v656e、n191r/w192l/n306s/n310l/g651t/s655t/v656s、n191s/r196h/n306a/d650g、n191t/r196h/n306a/d650g、n191m/r196h/n306a/d650g、n191v/n306a/d650s、或n191s/n306g/d650s。
[0554]
70.实施例43-69中任一项的方法,其中,所述修饰的切割酶表现出seq id no:17-19、23-28或31-39中任何序列的序列的底物特异性。
[0555]
71.实施例43-70中任一项的方法,其中,所述修饰的切割酶具有包括催化结构域的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的催化结构域具有至少20%同一性,至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0556]
72.实施例43-71中任一项的方法,其中,所述修饰的切割酶具有包括胺基结合位点的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的胺基结合位点具有至少20%同一性,至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0557]
73.实施例43-72中任一项的方法,其中,所述修饰的切割酶具有包括环结构域的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的环结构域具有至少20%同一性,至少30%同一性,至少40%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0558]
74.实施例43-73中任一项的方法,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201和/或202。
[0559]
75.实施例43-73中任一项的方法,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置188、189、190、191、
192、302和/或310。
[0560]
76.实施例43-73中任一项的方法,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置191、192、196、306、310、627、628、630、648、650、651、655、656和/或669。
[0561]
77.实施例43-73中任一项的方法,其中,所述修饰的切割酶包括在未修饰的切割酶中一个或多个氨基酸修饰,参考seq id no:13的编号,其对应于位置323至544中的任何一个。
[0562]
78.实施例43-78中任一项的方法,其进一步包括使前体多肽与用于标记前体多肽的末端氨基酸的试剂接触,以提供准备用修饰的切割酶处理的多肽。
[0563]
79.实施例78的方法,其中,用于标记末端氨基酸的试剂是化学试剂或酶促试剂。
[0564]
80.实施例43-79中任一项的方法,其中,所述标签包括阻断的氨基酸。
[0565]
81.实施例43-80中任一项的方法,其中,所述标记物包括外源标记的氨基酸。
[0566]
82.实施例43-81中任一项的方法,其中,所述标签包括化学标签。
[0567]
83.实施例78-82中任一项的方法,其中,与用于标记末端氨基酸的试剂接触和与修饰的切割酶接触是按序列顺序进行的。
[0568]
84.实施例78-83中任一项的方法,其中,与用于标记末端氨基酸的试剂的接触和与修饰的切割酶的接触重复一次或多次。
[0569]
85.实施例79-84中任一项的方法,其中,所述化学试剂选自异硫氰酸苯酯(pitc),硝基-pitc,磺基-pitc,苯基异氰酸酯(pic),硝基-pic,磺基-pic,cbz-cl(氯甲酸苄酯)或cbz-osu(苄氧羰基n-琥珀酰亚胺),羧基活化的氨基封闭氨基酸,1-氟-2,4-二硝基苯(桑格氏试剂,dnfb),丹磺酰氯(dns-cl或1-二甲基氨基萘-5-磺酰氯),4-磺酰基-2-硝基氟苯(snfb),酸酐,2-吡啶甲醛,2-甲酰基苯基硼酸,2-乙酰基苯基硼酸,1-氟-2,4-二硝基苯,4-氯-7-硝基苯并呋喃酯,五氟苯基异硫氰酸酯,4-(三氟甲氧基)-苯基异硫氰酸酯,4-(三氟甲基)-苯基异硫氰酸酯,3-(羧酸)-苯基异硫氰酸酯,3-(三氟甲基)-苯基异硫氰酸酯,1-萘基异硫氰酸酯,n-硝基咪唑-1-羧酰亚胺,n,n'-双(新戊酰基)-1h-吡唑-1-羧脒,n,n'-双(b烯氧基氧羰基)-1h-吡唑-1-羧脒,乙酰化试剂,胍基化试剂,硫代酰化试剂,硫代乙酰化试剂,硫代苄基化试剂和二杂环甲胺试剂或其衍生物。
[0570]
86.实施例79-85中任一项的方法,其中,所述化学试剂是靛红酸酐,异烟酸酐,氮杂靛红酸酐,琥珀酸酐或其衍生物。
[0571]
87.实施例86的方法,其中所述化学试剂选自:4-硝基苯基邻氨基苯甲酸酯、n-甲基-靛红酸酐、n-乙酰基-靛红酸酐、4-羧酸靛红酸酐、5-甲氧基-靛红酸酐、5-硝基-靛红酸酐、4-氯-靛红酸酐、4-氟-靛红酸酐、6-氟-靛红酸酐酐、n-苄基-靛红酸酐、4-三氟甲基-靛红酸酐、5-三氟甲基-靛红酸酐、4-硝基-靛红酸酐、4-甲氧基-靛红酸酐、5-氨基-2-氟-异烟酸酐(6-氟-1h-吡啶并[3,4-d][1,3]恶嗪-2,4-二酮)、3,6,二氟邻苯二甲酸酐和2,3吡嗪二羧酸酐或其衍生物。
[0572]
88.任一种的方法实施例43-87的方法,其进一步包括使多肽与能够结合至多肽的末端氨基酸的结合剂接触,其中该结合剂包括具有关于该结合剂的识别信息的编码标签。
[0573]
89.实施例88的方法,其中,所述结合剂包括两种或更多种结合剂。
[0574]
90.实施例88或实施例89的方法,其中,所述结合剂结合至n-末端氨基酸(ntaa)。
[0575]
91.实施例88或实施例89的方法,其中,所述结合剂结合至c-末端氨基酸(ctaa)。
[0576]
92.实施例88-91中任一项的方法,其中,所述结合剂能够结合标记的或未标记的末端氨基酸。
[0577]
93.实施例88-92中任一项的方法,其中,与结合剂的接触为:
[0578]
在使多肽与用于标记末端氨基酸的试剂接触之前;和/或
[0579]
在使多肽与修饰的切割酶接触之前。
[0580]
94.实施例88-93中任一项的方法,其中,与结合剂的接触是在使多肽与用于标记末端氨基酸的试剂接触之后。
[0581]
95.实施例88-92中任一项的方法,其中:
[0582]
与标记末端氨基酸的试剂接触是在与结合剂接触之前;和
[0583]
与结合剂的接触是在多肽与修饰的切割酶接触之前。
[0584]
96.实施例88-95中任一项的方法,其中,所述多肽与结合剂,用于标记末端氨基酸的试剂和修饰的切割酶的接触重复一次或多次。
[0585]
97.实施例88-96中任一项的方法,其中,进一步包括将编码标签的识别信息转移至附着于多肽的记录标签,从而在多肽上产生扩展记录标签。
[0586]
98.实施例97的方法,其中,进行识别信息的转移:
[0587]
多肽与结合剂结合后;和
[0588]
在多肽与修饰的切割酶接触之前。
[0589]
99.实施例97或实施例98的方法,其中,步骤:
[0590]
(a)使多肽与结合剂接触;
[0591]
(b)将识别信息转移到记录标签上;
[0592]
(c)使多肽与用于标记末端氨基酸的试剂接触;和
[0593]
(d)使多肽与修饰的切割酶接触;
[0594]
依次重复以生成一个或多个其他扩展记录标签。
[0595]
100.实施例99的方法,其进一步包括在步骤(b)之后和步骤(c)之前除去结合剂。
[0596]
101.实施例97或实施例98的方法,其中,步骤:
[0597]
(a)使多肽与用于标记末端氨基酸的试剂接触;
[0598]
(b)使多肽与能够结合标记的末端氨基酸的结合剂接触;
[0599]
(c)将识别信息转移到记录标签上;和
[0600]
(d)使多肽与修饰的切割酶接触;
[0601]
依次重复以生成一个或多个其他扩展记录标签。
[0602]
102.实施例101的方法,其进一步包括在步骤(c)之后和步骤(d)之前除去结合剂。
[0603]
103.实施例97-102中任一实施例的方法,还包括分析一个或多个扩展记录标签。
[0604]
104.一种分析多肽的方法,包括以下步骤:
[0605]
(a)使多肽与能够结合至该多肽的末端氨基酸的结合剂接触,其中该结合剂包括具有关于该结合剂的识别信息的编码标签;
[0606]
(b)将编码标签的识别信息转移至与多肽相关联的记录标签,以产生扩展记录标签;
[0607]
(c)使多肽与试剂接触以标记多肽的末端氨基酸;和
[0608]
(d)使多肽与未修饰的切割酶中的包括突变的修饰的切割酶接触,所述突变例如一种或多种氨基酸修饰,其中:
[0609]
所述修饰的切割酶衍生自二肽切割酶,并且从多肽中去除或被配置为去除由步骤(c)中的试剂标记的单末端氨基酸;或者
[0610]
所述修饰的切割酶衍生自三肽切割酶,并且从多肽中去除或被配置为去除由步骤(c)中的试剂标记的单个末端氨基酸或单个末端二肽。
[0611]
105.实施例104的方法,其中,衍生自二肽切割酶或三肽切割酶的修饰的切割酶被配置为切割多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的肽键。
[0612]
106.实施例104的方法,其中,衍生自三肽切割酶的修饰的切割酶被配置为切割所述多肽的倒数第二个末端标记的氨基酸残基和倒数第三个末端氨基酸残基之间的肽键。
[0613]
107.实施例104-106中任一项的方法,其中所述未修饰的切割酶选自金属肽酶,锌依赖性金属肽酶或锌依赖性水解酶。
[0614]
108.实施例104-107中任一项的方法,其中,所述未修饰的切割酶是分类为ec 3.4.14、ec 3.4.15、merops s8、merops s9、merops s33、merops s46、merops m49或merops s53的蛋白质、或其功能同源物或片段。
[0615]
109.实施例104-108中任一项的方法,其中,所述未修饰的切割酶是二肽基肽酶、二肽基氨基肽酶、肽基-二肽酶、二肽基羧基肽酶、sedolisin或三肽基肽酶。
[0616]
110.实施例104-109中任一项的方法,其中,所述未修饰的切割酶是二肽基肽酶3、二肽基肽酶5、二肽基肽酶7、二肽基肽酶11、二肽基氨基肽酶bii或二肽基肽酶bii。
[0617]
111.实施例104-110中任一项的方法,其中,所述结合剂包括两种或更多种结合剂。
[0618]
112.实施例104-111中任一项的方法,其中,所述多肽包括两个或更多个多肽。
[0619]
113.实施例104-112中任一项的方法,其中,步骤(a)-(d)重复“n”个结合循环,其中结合多肽的每种结合剂的每种编码标签的识别信息被转移至由前一结合循环产生的扩展记录标签,以产生第n阶扩展记录标签。
[0620]
114.实施例104-113中任一实施例的方法,进一步包括:
[0621]
(b1)去除结合剂。
[0622]
115.实施例113或实施例114的方法,进一步包括:
[0623]
(e)分析所述第n阶扩展记录标签。
[0624]
116.实施例104-115中任一实施例的方法,其中:
[0625]
步骤(a)在步骤(b)之前进行;
[0626]
步骤(a)在步骤(c)之前进行;
[0627]
步骤(a)在步骤(d)之前进行;
[0628]
步骤(b)在步骤(c)之前进行;
[0629]
步骤(b)在步骤(d)之前进行;
[0630]
步骤(b1)在步骤(a)之后进行;
[0631]
步骤(b1)在步骤(b)之后进行;
[0632]
步骤(b1)在步骤(c)之前进行;
[0633]
步骤(b1)在步骤(d)之前进行;
[0634]
步骤(c)在步骤(a)之前进行;
[0635]
步骤(c)在步骤(b)之前进行;和/或
[0636]
步骤(c)在步骤(d)之前进行。
[0637]
117.实施例104-116中任一项的方法,其中,所述末端氨基酸是n-末端氨基酸(ntaa)。
[0638]
118.实施例104-116中任一项的方法,其中,所述末端氨基酸是c-末端氨基酸(ctaa)。
[0639]
119.实施例97-118中任一项的方法,其中所述记录标签是dna分子、rna分子、pna分子、bna分子、xna、分子、lna分子、γpna分子或其组合。
[0640]
120.实施例97-119中任一项的方法,其中,所述记录标签包括唯一分子标识符(umi)。
[0641]
121.实施例97-120中任一项的方法,其中,所述记录标签包括通用引发位点。
[0642]
122.实施例88-121中任一项的方法,其中,所述结合剂和所述编码标签通过接头连接。
[0643]
123.实施例97-122中任一项的方法,其中,将记录标签的识别信息转移至编码标签是通过引物延伸来实现的。
[0644]
124.实施例97-122中任一项的方法,其中,将记录标签的识别信息转移到编码标签是通过连接实现的。
[0645]
125.实施例88-124中任一项的方法,其中,所述编码标签包括umi。
[0646]
126.实施例88-125中任一项的方法,其中,所述编码标签包括通用引发位点。
[0647]
127.实施例43-126中任一项的方法,其中,所述多肽直接或间接连接至固相载体。
[0648]
128.实施例127的方法,其中,所述固相载体是珠、多孔珠、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶片芯片、流通芯片、包括信号转导电子器件的生物芯片、微量滴定孔、elisa板、旋转干涉仪圆盘、硝化纤维素膜、硝酸纤维素基聚合物表面、纳米颗粒或微球。
[0649]
129.实施例128的方法,其中,固相载体包括聚苯乙烯珠、聚丙烯酸酯珠、聚合物珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁性珠、玻璃珠、可控孔珠、一种基于二氧化硅的珠、或其任何组合。
[0650]
130.实施例88-129中任一项的方法,其中,所述结合剂是多肽或蛋白质。
[0651]
131.实施例130的方法其中,所述结合剂是氨基肽酶或其变体,突变体或修饰的蛋白;和氨酰基trna合成酶或其变体,突变体或修饰的蛋白;anticalin或其变体,突变体或修饰蛋白;clps,clps2或其变体,突变体或修饰蛋白;ubr box蛋白或其变体,突变体或修饰蛋白;或结合氨基酸的修饰的小分子,即万古霉素或其变体,突变体或修饰的分子;或或其抗体或其结合片段;或其任何组合。
[0652]
132.实施例88-131中任一项的方法,其中,所述结合剂结合所述单个氨基酸残基,二肽,三肽或多肽的翻译后修饰。
[0653]
133.实施例104-133的方法,其中,所述结合剂结合至n-末端氨基酸残基。
[0654]
134.实施例104-133的方法,其中,所述结合剂结合至c-末端氨基酸残基。
[0655]
135.实施例103-134中任一项的方法,其中,所述一个或多个扩展记录标签在分析
之前被扩增。
[0656]
136.实施例103-135中任一项的方法,其中,分析一个或多个扩展记录标签包括核酸测序方法。
[0657]
137.实施例136的方法,其中,所述核酸测序方法是通过合成测序、通过连接测序、通过杂交测序、polony测序、离子半导体测序或焦磷酸测序来测序的。
[0658]
138.实施例136或实施例137的方法,其中,所述核酸测序方法是单分子实时测序、基于纳米孔的测序或使用高级显微镜对dna的直接成像。
[0659]
139.实施例43-138中任一项的方法,其中,使所述多肽与所述修饰的切割酶接触少于5分钟,少于10分钟,少于20分钟,少于30分钟,少于40分钟,少于50分钟,少于60分钟,少于2小时,少于5小时,少于8小时或少于10小时来去除所述单末端氨基酸。
[0660]
140.实施例43-139中任一项的方法,其中,在不存在使核酸(例如dna,rna或其混合物或组合)降解的条件下进行。
[0661]
141.实施例140的方法,其中,降解核酸的条件是化学条件。
[0662]
142.实施例43-141中任一项的方法,其在与核酸相容的条件存在下进行。
[0663]
143.实施例140-142中任一项的方法,其在强酸或强碱不存在的情况下进行。
[0664]
144.实施例143的方法,其在强无水酸不存在的情况下进行。
[0665]
145.实施例144的方法,其中,所述强无水为无水tfa。
[0666]
146.用于处理多肽的试剂盒,包括:
[0667]
修饰的切割酶,其在未修饰的切割酶中包括突变,例如一个或多个氨基酸修饰,其中:
[0668]
修饰的切割酶衍生自二肽切割酶,并且从多肽中去除或被配置为从多肽中去除单个标记的末端氨基酸;或者
[0669]
修饰的切割酶衍生自三肽切割酶,并且从多肽中去除或配置成从多肽中去除单个标记的末端氨基酸或从多肽中去除单个标记的末端二肽。和
[0670]
用于标记多肽末端氨基酸的试剂。
[0671]
147.实施例146的试剂盒,其中,衍生自二肽切割酶或三肽切割酶的修饰的切割酶被配置为切割多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的肽键。
[0672]
148.实施例146的试剂盒,其中,衍生自三肽切割酶的修饰的切割酶被配置为切割所述多肽的倒数第二个末端标记的氨基酸残基和倒数第三个末端氨基酸残基之间的肽键。
[0673]
149.实施例146-148中任一项的试剂盒,其中,所述修饰的切割酶包括与所述多肽的末端标记的氨基酸残基和倒数第二个末端氨基酸残基之间的酰胺键相互作用的活性位点。
[0674]
150.实施例146-149中任一项的试剂盒,其中所述未修饰的切割酶选自金属肽酶,锌依赖性金属肽酶或锌依赖性水解酶。
[0675]
151.实施例146-150中任一项的试剂盒,其中所述未修饰的切割酶是分类为ec 3.4.14、ec 3.4.15、merops s8、merops s9、merops s33、merops s46、merops m49或merops s53的蛋白质,或其同源物。
[0676]
152.实施例146-151中任一项的试剂盒,其中,所述未修饰的切割酶是二肽基肽酶、二肽基氨基肽酶、肽基-二肽酶、二肽基羧基肽酶、sedolisin或三肽基肽酶。
[0677]
153.实施例146-152中任一项的试剂盒,其中,所述未修饰的切割酶是二肽基肽酶3、二肽基肽酶5、二肽基肽酶7、二肽基肽酶11、二肽基氨基肽酶bii或二肽基肽酶bii。
[0678]
154.实施例146-153中任一项的试剂盒,其中,所述标记的末端氨基酸或二肽包括n-末端氨基酸(ntaa)。
[0679]
155.实施例146-153中任一项的试剂盒,其中,所述标记的末端氨基酸或二肽包括c-末端氨基酸(ctaa)。
[0680]
156.实施例146-155中任一项的试剂盒,其中所述修饰的切割酶不切割所述多肽的倒数第二个末端氨基酸残基和倒数第三个末端氨基酸残基之间的肽键。
[0681]
157.实施例146-156中任一项的试剂盒,其中,所述修饰的切割酶包括表现出与未修饰的切割酶具有至少50%同一性、至少60%同一性、至少70%同一性、至少80%同一性、至少90%或更高的同一性的氨基酸序列。
[0682]
158.实施例146-157中任一项的试剂盒,其中,所述突变包括氨基酸取代,缺失,添加或其组合。
[0683]
159.实施例146-158中任一项的试剂盒,其中,所述多肽的长度大于4个氨基酸、大于5个氨基酸、大于6个氨基酸、大于7个氨基酸、大于8个氨基酸、更大大于9个氨基酸、大于10个氨基酸、大于11个氨基酸、大于12个氨基酸、大于13个氨基酸、大于14个氨基酸、大于15个氨基酸、大于20个氨基酸、大于25个氨基酸或大于30个氨基酸。
[0684]
160.实施例146-159中任一项的试剂盒,其中,所述多肽的长度大于10个氨基酸。
[0685]
161.实施例146-160中任一项的试剂盒,其中,所述修饰的切割酶在其底物结合位点内包括修饰。
[0686]
162.实施例146-161中任一项的试剂盒,其中,所述修饰的切割酶在其催化结构域内包括修饰。
[0687]
163.实施例146-162中任一项的试剂盒,其中,所述修饰的切割酶在其胰凝乳蛋白酶折叠内包括修饰。
[0688]
164.实施例146-163中任一项的试剂盒,其中,所述修饰的切割酶在胺基结合位点包括修饰。
[0689]
165.实施例146-164中任一项的试剂盒,其中,所述修饰的切割酶在其环结构域中包括修饰。
[0690]
166.实施例146-165中任一项的试剂盒,其中,所述修饰的切割酶包括用于改善对修饰的切割酶的活性位点的可及性的修饰。
[0691]
167.实施例146-166中任一项的试剂盒,其中,所述修饰的切割酶衍生自如seq id no:13或20中提供的二肽基氨基肽酶bii或二肽基肽酶bii。
[0692]
168.实施例146-167中任一项的试剂盒,其中,所述修饰的切割酶具有的氨基酸序列与seq id no:17-19、23-28、31-39或其特异性结合片段具有至少20%的同一性,至少30%的同一性,至少128%的同一性,至少50%的同一性,至少60%的同一性,至少70%的同一性,至少80%的同一性,或至少90%或更多的同一性。
[0693]
169.实施例146-168中任一项的试剂盒,其中,所述修饰的切割酶包括seq id no:17-19、23-28中任一个所列的氨基酸序列,或氨基酸序列与seq id no:17-19、23-28、31-39中的任何一个或其特异性结合片段具有至少95%的序列同一性。
[0694]
170.实施例146-169中任一项的试剂盒,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置126、188、189、190、191、192、196、238,302、306、307、310、525、528、546、604、650、651、655、656、665和/或692。
[0695]
171.实施例146-170中任一项的试剂盒,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,对应于位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665和/或692,参照seq id no:13的编号,并且包括的氨基酸序列与seq id no:17-19、23-28或31-39中的任何一个具至少30%的同一性,至少128%的同一性,至少50%的同一性,至少60%的同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0696]
172.实施例146-171中任一项的试剂盒,其中,一个或多个氨基酸取代a126t、d188v、i189a、d190s、n191c、n191f、n191l、n191m、n191r、n191s、n191t、n191v、w192f、w192g、w192l、r196h、r196k、r196s、r196t、r196v、g238v、a302w、n306a、n306g、n306r、n306s、t307k、n310d、n310g、n310k、n310l、n525k、a528v、f546l、a604v、d650a、d650g、d650s、g651h、g651t、g651v、g651y、s655g、s655t、v656e、v656g、v656s、k665i、k692n和/或其保守氨基酸取代。
[0697]
173.实施例146-172中任一项的试剂盒,其中,一个或多个氨基酸修饰是n191m/w192g/r196v/n306r/d650a、d188v/i189a/d190s/n191l/w192g/r196s/a302w/n310k/d650a、n191m/w192g/r196t/n306r/t307k/d650a、n191m/w192g/r196t/n306r/n525k/a528v/a604v/d650a/k692n、a126t/n191m/w192g/r196t/g238v/n306r/d650a、n191m/w192g/r196t/n306r/f546l/d650a、n191m/w192g/r196t/n306r/d650a/g651v/k665i、n191m/w192g/r196t/n306r/d650a/g651v、n191c/w192l/r196k/n306r/n310d/g651y/s655g/v656g、n191c/w192l/n306r/n310d/g651y/s655g/v656g、n191f/w192f/n306r/n310g/g651h/v656e、n191r/w192l/n306s/n310l/g651t/s655t/v656s、n191s/r196h/n306a/d650g、n191t/r196h/n306a/d650g、n191m/r196h/n306a/d650g、n191v/n306a/d650s、或n191s/n306g/d650s。
[0698]
174.实施例146-173中任一项的试剂盒,其中所述修饰的切割酶表现出seq id no:17-19、23-28或31-39中任何序列的底物特异性。
[0699]
175.实施例146-174中任一项的试剂盒,其中,所述修饰的切割酶具有包括催化结构域的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的催化结构域具有至少20%同一性,至少30%同一性,至少128%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0700]
176.实施例146-175中任一项的试剂盒,其中,所述修饰的切割酶具有包括胺基结合位点的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的胺基结合位点具有至少20%同一性,至少30%同一性,至少128%同一性,至少50%同一性,至少60%同一性,至少70%的同一性,至少80%的同一性或至少90%或更多的同一性。
[0701]
177.实施例146-176中任一项的试剂盒,其中,所述修饰的切割酶具有包括环结构域的氨基酸序列,其与seq id no:17-19、23-28或31-39中任一个的环结构域具有至少20%同一性,至少30%同一性,至少128%同一性,至少50%同一性,至少60%同一性,至少70%
的同一性,至少80%的同一性或至少90%或更多的同一性。
[0702]
178.实施例146-177中任一项的试剂盒,其中所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201和/或202。
[0703]
179.实施例146-177中任一项的试剂盒,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置188、189、190、191、192、302和/或310。
[0704]
180.实施例146-177中任一项的试剂盒,其中,所述修饰的切割酶包括在未修饰的切割酶中的一个或多个氨基酸修饰,参考seq id no:13的编号,对应于位置191、192、196、306、310、627、628、630、648、650、651、655、656和/或669。
[0705]
181.实施例146-177中任一项的试剂盒,其中,所述修饰的切割酶包括在未修饰的切割酶中一个或多个氨基酸修饰,参考seq id no:13的编号,其对应于位置323至544中的任何一个。
[0706]
182.实施例146-181中任一项的试剂盒,其中所述末端氨基酸用化学或酶促试剂或部分标记。
[0707]
183.实施例146-182中任一项的试剂盒,其中所述标记物包括阻断的氨基酸。
[0708]
184.实施例146-183中任一项的试剂盒,其中所述标记物包括外源标记的氨基酸。
[0709]
185.实施例146-184中任一项的试剂盒,其中所述标记包括化学标记。
[0710]
186.实施例182的试剂盒,其中,所述化学试剂选自异硫氰酸苯酯(pitc),硝基-pitc,磺基-pitc,苯基异氰酸酯(pic),硝基-pic,磺基-pic,cbz-cl(氯甲酸苄酯)或cbz-osu(苄氧羰基n-琥珀酰亚胺),羧基活化的氨基封闭氨基酸,1-氟-2,4-二硝基苯(桑格氏试剂,dnfb),丹磺酰氯(dns-cl或1-二甲基氨基萘-5-磺酰氯),4-磺酰基-2-硝基氟苯(snfb),酸酐,2-吡啶甲醛,2-甲酰基苯基硼酸,2-乙酰基苯基硼酸,1-氟-2,4-二硝基苯,4-氯-7-硝基苯并呋喃酯,五氟苯基异硫氰酸酯,4-(三氟甲氧基)-苯基异硫氰酸酯,4-(三氟甲基)-苯基异硫氰酸酯,3-(羧酸)-苯基异硫氰酸酯,3-(三氟甲基)-苯基异硫氰酸酯,1-萘基异硫氰酸酯,n-硝基咪唑-1-羧酰亚胺,n,n'-双(新戊酰基)-1h-吡唑-1-羧脒,n,n'-双(b烯氧基氧羰基)-1h-吡唑-1-羧脒,乙酰化试剂,胍基化试剂,硫代酰化试剂,硫代乙酰化试剂,硫代苄基化试剂和二杂环甲胺试剂或其衍生物。
[0711]
187.实施例182的试剂盒,其中,所述化学试剂是靛红酸酐,异烟酸酐,氮杂靛红酸酐,琥珀酸酐或其衍生物。
[0712]
188.实施例187的试剂盒,其中所述化学试剂选自由以下组成的组:4-硝基苯基邻氨基苯甲酸酯、n-甲基-靛红酸酐、n-乙酰基-靛红酸酐、4-羧酸靛红酸酐、5-甲氧基-靛红酸酐、5-硝基-靛红酸酐、4-氯-靛红酸酐、4-氟-靛红酸酐、6-氟-靛红酸酐酐、n-苄基-靛红酸酐、4-三氟甲基-靛红酸酐、5-三氟甲基-靛红酸酐、4-硝基-靛红酸酐、4-甲氧基-靛红酸酐、5-氨基-2-氟-异烟酸酐(6-氟-1h-吡啶并[3,4-d][1,3]恶嗪-2,4-二酮)、3,6,二氟邻苯二甲酸酐和2,3吡嗪二羧酸酐或其衍生物。
[0713]
189.实施例146-188中任一项的试剂盒,其进一步包括结合剂,其中所述结合剂包括具有关于所述结合剂的识别信息的编码标签。
[0714]
190.实施例189的试剂盒,其中,所述试剂盒包括两种或更多种结合剂。
[0715]
191.实施例189或实施例190的试剂盒,其中,所述结合剂被配置为结合未标记的末端氨基酸。
[0716]
192.实施例189或实施例190的试剂盒,其中,所述结合剂被配置为结合标记的末端氨基酸。
[0717]
193.实施例189-192中任一项的试剂盒,其中,所述结合剂结合所述单个氨基酸残基,二肽,三肽或多肽的翻译后修饰。
[0718]
194.实施例193的试剂盒,其中,所述结合剂结合至n-末端氨基酸残基。
[0719]
195.实施例193的试剂盒,其中,所述结合剂结合至c-末端氨基酸残基。
[0720]
196.实施例189-195中任一项的试剂盒,其中,所述结合剂是多肽或蛋白质。
[0721]
197.实施例189-196中任一项的试剂盒,其中所述结合剂包括氨基肽酶或其变体,突变体或修饰的蛋白;和氨酰基trna合成酶或其变体,突变体或修饰的蛋白;anticalin或其变体,突变体或修饰蛋白;clps(例如clps2)或其变体,突变体或修饰蛋白;ubr盒蛋白或其变体,突变体或修饰蛋白;或结合氨基酸的修饰的小分子,即万古霉素或其变体,突变体或修饰的分子;或或其抗体或其结合片段;或其任何组合。
[0722]
198.实施例146-197中任一项的试剂盒,其进一步包括用于将编码标签的识别信息转移至附着于多肽的记录标签的试剂,其中识别信息向记录标签的转移在多肽上产生延扩展记录标签。
[0723]
199.实施例198的试剂盒,其中,用于转移识别信息的试剂是化学连接试剂或生物连接试剂。
[0724]
200.实施例198的试剂盒,其中,用于转移识别信息的试剂是用于单链核酸或双链核酸的引物延伸的试剂。
[0725]
201.实施例198-200中任一项的试剂盒,其进一步包括用于扩增扩展记录标签的扩增试剂。
[0726]
202.实施例146-201中任一项的试剂盒,其还包括选自以下的固相载体:珠子、多孔珠子、磁性珠子、顺磁性珠子、多孔基质、阵列、表面、玻璃表面、硅表面、塑料表面、载玻片、过滤器、尼龙、芯片、硅晶片芯片、流通芯片、包括信号转导电子器件的生物芯片、孔、微量滴定板、板、elisa板、圆盘、旋转干涉仪圆盘、膜、硝酸纤维素膜、基于硝化纤维素的聚合物表面、纳米颗粒(例如、包括诸如磁性纳米颗粒(fe3o4)、金纳米颗粒和/或银纳米颗粒之类的金属)、量子点、纳米壳、纳米笼、微球或其任何组合。
[0727]
203.实施例202的试剂盒,其中固相载体包括聚苯乙烯珠,聚丙烯酸酯珠,聚合物珠,琼脂糖珠,纤维素珠,葡聚糖珠,丙烯酰胺珠,实心珠,多孔珠,顺磁性珠,玻璃珠,可控孔珠,一种基于二氧化硅的珠,或其任何组合。
[0728]
204.实施例146-203中任一项的试剂盒,其进一步包括用于核酸测序分析的试剂。
[0729]
205.实施例204的试剂盒,其中所述核酸测序分析包括合成测序、连接测序、杂交测序、polony测序、离子半导体测序、焦磷酸测序、单分子实时测序、基于纳米孔的测序或使用高级显微镜技术对dna直接成像,或其任何组合。
[0730]
vi.示例
[0731]
提供以下实施例以说明但不限制本文提供的方法,组合物和用途。
[0732]
示例1:修饰的切割酶的选择,设计和隔离
[0733]
本实施例描述了经合理设计的修饰的切割酶的选择和分离,以及二肽基肽酶3(dpp3),二肽基肽酶5(dpp5)和二肽基氨基肽酶bii(dap bii)蛋白的工程化。
[0734]
a.对修饰的ntaa肽有活性的dpp3,dpp5和dap bii变体的遗传选择
[0735]
为了鉴定最佳的工程化的切割酶(例如dpp3,dpp5和dap bii变体),使用氨基酸特异性营养缺陷型大肠杆菌菌株(可从cssc e.coli genetic stock center获得,网址为:耶鲁大学-https://cgsc2.biology.yale.edu/)进行遗传选择,仅在最小的介质板上才能幸存营养缺陷型氨基酸或含有营养缺陷型氨基酸的短肽。参见例如,neuenschwander et al.,nat biotechnol.(2007)25(10):1145-1147)。该基于细胞的分析系统用于选择在标记的多肽上起作用的变体,如下所示:切割酶基因(例如dpp3,dpp5和dap bii)在补充了cbz标记的四肽(cbz-aaar)的营养缺陷型菌株中单独表达(cba-vsar),其中在天然二肽在细胞质中摄取和切割后,c-末端二氨基酸充当营养缺陷型补充剂。短的寡肽底物通过外膜孔蛋白通道渗透到周质中,但需要通过大肠杆菌中的三个主要寡肽/二肽摄取系统(opp,tpp和dpp)主动转运到细胞质中(abouhamad et al.,mol microbiol.(1991)5(5):1035-1047);摄入细胞质后,短肽被细胞质内的内源性内肽酶消化。通过这三个系统寡肽或二肽转的运被n-末端修饰的(例如,cbz基)寡肽/二肽抑制(smith et al.,microbiology(1999)145(pt 10):2891-901;payne et al.,arch biochem biophys.(2000)384(1):9-23;fang et al.,j bacteriol.2000may;182(9):2530-2535)。cbz标记的原料上的营养缺陷型大肠杆菌的生长将受到抑制。通过使用适当的信号肽(例如,pelb)通过在周质中表达和分泌功能性蛋白来消除这种抑制,来完成遗传选择(speck et al.,protein eng des sel.(2011)24(6):473-484;thie et al.,n biotechnol.(2008)25(1):49-54)。一旦进入周质,功能性蛋白将cbz-寡肽转化为游离营养缺陷型二肽,二肽被吸收到细胞质中。
[0736]
大肠杆菌营养缺陷型氨基酸;如精氨酸、谷氨酰胺或色氨酸;用于遗传选择。其他合适的菌株也可以用于选择。用于遗传选择的生长培养基是补充mgso4,cacl2,葡萄糖和琼脂的m9基本培养基盐。在将溶液倒入板中固化之前,还将适当的cbz标记的肽添加到生长培养基中。
[0737]
测试切割酶基因家族(例如dpp3,dpp5和dap bii)的通用方法是,根据其编码蛋白的同源性在ncbi数据库簇中选择一个家族。选择一个包括每个簇代表的基因库。使用为在大肠杆菌中表达而优化的密码子合成了选定蛋白质的基因。汇集编码来自各种生物的蛋白质的基因,并通过易错pcr或使用具有已知结构的蛋白质的晶体结构进行合理诱变来生成突变基因的文库。此外,易错pcr和合理诱变的组合可用于生成其他突变文库。随后将突变基因库克隆到载体中,该载体具有与营养缺陷型菌株中的基因表达相容的启动子,例如t5或阿拉伯糖(arabinose)启动子。将突变基因的文库克隆到载体中,该载体将周质靶向信号(例如pelb)添加到编码蛋白的n-末端。然后将克隆的文库转化到大肠杆菌营养缺陷型菌株中。在富含培养基(例如soc)的转化细胞恢复后,用m9最小液体培养基洗涤细胞以去除所有痕量(trace)蛋白质,这些蛋白质将允许营养缺陷型菌株以假阳性的形式破坏遗传选择。然后将细胞铺展到含有cbz标记肽的选择培养基上。将板在25至37摄氏度的温度下温育直至观察到菌落。分离在选择培养基上生长的菌落,并提取质粒dna。然后对切割酶基因进行测序,以鉴定可以去除cbz标记的肽的蛋白质序列。
[0738]
各种长度和序列的cbz标记的肽可用于遗传选择,以产生具有特异性的酶,该酶可
bii),并使用该标签纯化。荧光或比色底物通过与分子缀合的cbz修饰氨基酸生成,在切割cbz修饰氨基酸时产生信号。使用的氨基酸缀合底物包括氨基酸-硝基苯胺,氨基酸-β-萘甲酰胺和氨基酸-氨基甲基香豆素。这些底物用于快速测定和优化所选修饰酶的活性。
[0748]
示例2:用模仿“氨基酸”样谱(like profiles)的化合物标记肽的n-末端氨基酸(ntaa)。
[0749]
该实施例描述了通过用各种化学试剂处理多肽来标记n-末端氨基酸。苄氧羰基(cbz)、异硫氰酸苯酯(pitc)或pitc衍生物向肽的n-末端的添加类似于酪氨酸或苯丙氨酸向n-末端氨基酸的添加,其是二肽基肽酶如dpp3、dpp5或dap bii的天然底物。主要区别特征是不存在n-末端胺基。测试了几种标记n-末端氨基酸的试剂有效标记n-末端的能力。还测试了用于标记氨基酸的化学试剂对修饰天然dna的作用。例如,显示了四种不同的n-末端修饰试剂:
[0750][0751]
用于标记肽的修饰试剂包括三种异硫氰酸酯(吡啶基-itc,硝基-pitc和磺基-itc)。在某些情况下,可以使用异氰酸酯代替异硫氰酸酯在最终的改性ntaa中生成尿素(氧)而不是硫脲(硫)。所示的第四种试剂是专有的胍基化衍生物。吡啶基-itc来自一类基于异硫氰酸酯的已知埃德曼修饰试剂,其产生在酸性条件下自消除的n-末端。硝基-pitc和磺基-pitc是异硫氰酸苯酯(pitc)活性更高的埃德曼衍生物。测试了所有异硫氰酸酯试剂对两个示例性肽(具有n-末端g的肽(nt-g)=grfsgiy(seq id no:40)的肽ntaa修饰;在水性条件下具有n-末端w(nt-w)=wtqifga(seq id no:41))的肽。与pitc相关的衍生化在1x pbs缓冲液中加入25mm指示试剂,于60℃进行15分钟。胍基化衍生化使用15mm的胍基化试剂,在含10%dmso的1x pbs缓冲液(ph 7.4)中,于60℃进行1小时的。溶液测定中总共使用了50当量的试剂。lc-ms用于定量各种修饰试剂对肽的转化效率。
[0752]
在所有情况下,对于用于标记所示肽的修饰试剂,在没有任何dna修饰的情况下观察到定量修饰。pitc也作为对照运行,但在测试条件下未产生完全修饰。如图3所示,用吡啶基-itc,硝基-pitc和磺基-itc对肽进行了高产率标记,并且两种肽均观察到了高产率的胍基化。
[0753]
示例3:用n-末端“保护的”氨基酸标记肽的n-末端氨基酸(ntaa)。
[0754]
该实施例描述了使用受阻断或受保护的氨基酸标记n-末端氨基酸。
[0755][0756]
将n-末端游离肽的混合物(共0.1mmol)溶解在乙腈/teaa(1ml,50mm teaa,1:1,v/
v,ph=8.5)中,将ac-phe-pfp(1mmol)添加其中。将混合物在室温搅拌1小时。减压蒸发乙腈,并将肽混合物通过c18柱过滤,得到ac-phe终止的肽
[0757]
在另一个实例中,将n-末端游离肽的混合物(总计0.1mmol)溶解在乙腈/teaa(1ml,50mm teaa,1:1,v/v,ph=8.5)中,将cbz(z)-ala-osu(1mmol,bachem)加入其中。将混合物在室温下搅拌30分钟。在减压下蒸发乙腈,并将肽混合物通过c18柱过滤,得到cbz(z)-ala终止的肽。
[0758]
在某些情况下,可以用nhs或磺基-nhs代替pfp。在其他实例中,受ac保护的氨基酸的胺基可以是fmoc,boc或cbz保护的。在其他实例中,氨基酸的胺基是二烷基。在其他实例中,氨基酸的羧酸是游离的,并且使用标准肽偶联剂例如hatu diea或edc diea hobt将氨基酸偶联。在其他实例中,氨基酸可以是d或l手性。氨基酸可以是天然存在的或合成的任何氨基酸。
[0759]
示例4:dap bii衍生的修饰的切割酶的选择,分离和评估
[0760]
该实施例描述了变体dap bii基因的文库的产生以及从遗传选择中鉴定活性修饰的切割酶。
[0761]
基本上如示例1所述产生dap bii文库,靶向选自位置191、192、196、306、310、650、651、655和656的残基的各种组合(基于seq id no:13所列的蛋白质序列)。将变体dap bii文库转化到大肠杆菌的精氨酸营养缺陷型菌株中,该菌株在arga基因中缺失(菌株jw2786-1)。切割酶基因表达为周质靶向序列pelb信号序列。使用补充有精氨酸n-末端修饰的肽的m9基本培养基琼脂平板在转化的大肠杆菌上进行遗传选择。将板在35℃下孵育直至出现菌落。在选择中,具有对n-末端修饰的精氨酸肽(aaar(seq id no:21)或araa(seq id no:29))具有活性的修饰的(例如dap bii)切割酶的细胞将切割该肽并释放精氨酸。精氨酸的这种释放将使细胞存活。各种示例性化学试剂被用于标记含精氨酸的肽的n-末端,包括靛红酸酐,5-硝基靛红酸酐和琥珀酸酐。将板在35℃下孵育直至出现菌落。随后从存活的细胞中分离质粒dna并测序,以鉴定产生识别标记氨基酸的活性修饰切割酶的突变。
[0762]
使用所述的遗传选择方法,在衍生自野生型dap bii基因的示例性活性修饰的切割酶中鉴定了dap bii中的突变。通过纯化酶变体(在溶液中进行分析),鉴定了在遗传选择中的候选物。切割酶基因编码与蛋白质的c-末端稠合的六组氨酸标签,该标签使切割酶能够通过固定的金属亲和层析纯化。在由hepes(50mm,ph 7.5),edta(1mm),切割酶(100nm对1μm),以及具有如seq id no:22(100μm)所列的序列aagvampgaeddvvgsgsk(n3)的n-末端标记的肽组成的反应混合物进行纯化的修饰的切割酶候选物的测定。将反应物在25℃至37℃之间温育30分钟至3小时。然后通过lc-ms分析反应混合物以鉴定产物。
[0763]
鉴定出去除单个标记的末端氨基酸的示例性切割酶,并且显示出表现出类似的切割活性,如表10所示。证实的活性修饰的二肽切割酶包括表11所示的突变,其中,示例性的氨基酸取代由对应于seq id no:13中所示的相应未修饰的dap bii参考序列的氨基酸位置编号指定。氨基酸位置显示在中间,相应的未修饰的(例如,野生型)氨基酸列在数字前,而鉴定出的变异的氨基酸取代列在数字后。如图所示,lc-ms数据鉴定出在切割和除去标记的末端氨基酸(a)之后,观察到的质量为836.4的产物,其与c-末端产物的预期质量agvampgaeddvvgsgsk(n3)相匹配。这些数据证明,所描述的方法修饰了野生型二肽切割酶dap bii,其天然去除了未标记的二肽,以去除了单个标记的末端氨基酸。
[0764][0765][0766]
示例5:用外源性活化的阻断氨基酸标记肽的n-末端氨基酸(ntaa)。
[0767]
该实施例描述了用于标记多肽的n-末端氨基酸(ntaa)的试剂的合成以及用从遗传选择中分离的修饰的切割酶处理标记的多肽。用于修饰多肽的ntaa的标记包括化学标记的丙氨酸残基(2-叠氮苯甲酰胺-ala-pfp)。
[0768]
a.2-叠氮基苯甲酰胺-ala-pfp(n-(2-叠氮苯甲酰基)-l-丙氨酸-五氟酚酯)的合成
[0769][0770]
圆底烧瓶包含靛红酸酐溶解在二氯甲烷(dcm)中并搅拌。于此,将溶解在dcm中的l-丙氨酸-叔丁酯盐酸盐和三乙胺的溶液滴加到搅拌的溶液中。使混合物在25℃下反应18h。完成后(通过lcms监测),将溶液在真空中浓缩,然后重新溶解在100ml的乙酸乙酯(etoac)中。有机层先后用水和盐水洗涤。分离有机层,经硫酸钠(na2so4)干燥,过滤并浓缩。将所得油状物溶解在小体积dcm中,干装载到硅胶(sio2)上,并使用快速色谱法(0-80%
no:13所列的蛋白质序列)。对于该实验,用于选择的n-末端修饰的精氨酸肽(2-氨基苯甲酰胺-aaar,seq id no:21)是通过用化学试剂,靛红酸酐处理而制备的。随后从存活的细胞中分离质粒dna并测序,以鉴定产生识别标记氨基酸的活性修饰切割酶的突变。使用所述的遗传选择方法,在衍生自野生型dap bii基因的示例性活性修饰的切割酶中鉴定了dap bii中的突变。在遗传选择中鉴定的切割酶候选物通过纯化酶变体进行确认,该酶变体进行了溶液内测定。切割酶基因编码与蛋白质的c-末端稠合的六组氨酸标签,该标签使切割酶能够通过固定的金属亲和层析纯化。在反应混合物中测定纯化的修饰的切割酶候选物。
[0779]
鉴定了三个示例性的二肽切割酶,其包括seq id no:17、18和19所示的序列,并显示出对2-氨基苯甲酰胺标记的肽具有活性。确认的活性修饰二肽切割酶包括突变d188v/i189a/d190s/n191l/w192g/r196s/a302w/n310k/d650a,n191m/w192g/r196t/n306r/d650a,or n191m/w192g/r196v/n306r/d650a,示例性的氨基酸取代由对应于seq id no:13中所示的相应未修饰的dap bii参考序列的氨基酸位置编号指定。氨基酸位置显示在中间,相应的未修饰的(例如,野生型)氨基酸列在数字前,而鉴定出的变异的氨基酸取代列在数字后。
[0780]
c.评价2-叠氮苯甲酰胺-丙氨酸-pfp作为修饰的切割酶识别和活性的修饰
[0781]
评估了从b部分所述的遗传选择中鉴定的一种示例性修饰的切割酶对用如上a部分所述合成的外源丙氨酸标记的肽的识别和活性,所述修饰的切割酶含有seq id no:18所示的氨基酸序列,具有突变n191m/w192g/r196t/n306r/d650a。用[1d]官能化合成肽(h-ihagyaw-oh;seq id no:30)以显示本标题化合物安装修饰的丙氨酸以进行选择性切割的能力的可行性。新鲜制备[1d](500mm二甲基乙酰胺;dmac)的溶液。还将肽溶解在dmac中至100mm浓度。然后在1.5ml试管中,加入50μl的0.4m mops缓冲液(ph 7.6)和25μl的乙腈。于此,加入10μl 100mm肽溶液并混合。最后,加入15μl 500mm[1d],并将试管中的溶液置于50℃的热混合器中30分钟。在培养过程中,通过制备80μl 1.25μm修饰的裂解酶(seq id no:18)在0.1m hepes缓冲液(ph 8.0)中的溶液,制备在单独的1.5ml管中的溶液。
[0782]
将ihagyaw肽孵育30分钟后,取出20μl等分试样,然后添加到含有修饰的切割酶的溶液中。然后将修饰的切割酶和标记肽的溶液在37℃下温育1-18小时。通过取反应的等分试样并注射在lcms上来监测切割事件的进程。
[0783]
[0784][0785]
如表12所示,用[1d]处理肽产生具有预期mw的产物。在18小时后,观察到现在标记的肽(2-氨基苯甲酰胺-aihagyaw)的切割完成。通过lcms观察到的仅有的切割事件是2-氨基苯甲酰胺-ai的损失。温育18小时后未观察到剩余的2-氨基苯甲酰胺-aihagyaw。这些数据表明,从遗传选择中测试的分离的修饰的切割酶从处理的多肽中除去了预期的标记的二肽,包括作为二肽(2-氨基苯甲酰胺-ai)的一部分的外源性添加的化学标记的丙氨酸。使用该示例性方法,对衍生自野生型二肽切割酶(dap bii)的经测试的经修饰的切割酶进行了修饰,以从多肽中去除单个标记的氨基酸(标记有外源性n-末端封闭的氨基酸2-氨基苯甲酰胺-a)。
[0786]
d.易错库中修饰的切割酶的生成和选择
[0787]
从如seq id no:18所列的鉴定的二肽裂解酶开始,与kunkel诱变结合的易错pcr进一步用于产生约109复杂度的文库,并在所需的突变频率范围内进行精确控制(holland et al.,j immunol methods.(2013)394(1-2):55-61)。基本上如上所述进行遗传选择,进行表达和选择。使用基本上如上所述的溶液中测定法评估鉴定和纯化的修饰的切割酶候选物,以测试2-氨基苯甲酰胺-aagvampgaeddvvgsgsk(n3)肽的切割,并进行lc-ms以鉴定产物。观察到表13中所示的确认的修饰的二肽切割酶显示出与预期的切割产物一样的切割活性,从测试的2-氨基苯甲酰胺标记肽中去除了标记的二肽。在该表中,示例性氨基酸取代由对应于seq id no:13所示的相应参考未修饰的dap bii序列的氨基酸位置编号指定。氨基酸位置显示在中间,相应的未修饰的(例如,野生型)氨基酸列在数字前,而鉴定出的变异的氨基酸取代列在数字后。在某些情况下,使用所述方法鉴定的修饰的切割酶可用于从包括外源氨基酸的肽中去除标记的二肽,从而从原始肽中净去除单个氨基酸(p1)。
[0788]
[0789]
本公开内容不旨在限于特定公开的实施例,其例如是为了说明本发明的各个方面而提供的。根据本文的描述和教导,对所描述的组合物和方法的各种修改将变得显而易见。可以实践这样的变化而不脱离本公开的真实范围和精神,并且旨在落入本公开的范围内。可以根据上述详细描述对实施例进行这些和其他改变。一般而言,在以下权利要求中,所使用的术语不应被解释为将权利要求限定于说明书和权利要求中公开的特定实施例,而应被解释为包括所有可能的实施例以及这些权利要求有权获得的等同物的全部范围。因此,权利要求不受公开内容的限制。
[0790]
序列表
[0791]
[0792]
[0793]
[0794]
[0795]
[0796]
[0797]
[0798]
[0799]
[0800]
[0801][0802]
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献