一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

标记的核苷酸类似物、反应混合物以及测序方法和系统与流程

2021-08-31 17:44:00 来源:中国专利 TAG:申请 序列 并入 引用 核苷酸
标记的核苷酸类似物、反应混合物以及测序方法和系统与流程

本申请是申请日为2016年11月21日,发明名称为“标记的核苷酸类似物、反应混合物以及测序方法和系统”的中国专利申请no.2016800796723的分案申请。

相关申请的交叉引用

本申请要求于2015年11月20日提交的美国临时申请no.62/258,416的权益,将其公开内容通过全文引用并入本文。

序列表

本申请包括2016年11月21日创建的名为“1407-00-014wo1_2016-11-21_seq_list_st25.txt”的ascii兼容文本文件中所示出的序列表,该序列表含有136,110字节,将以全文引用的方式并入本文中。



背景技术:

新型经修饰的核苷酸试剂的发展、特别是含有荧光标记的核苷酸试剂的产生,增加了核苷酸测序反应的效能,例如提供鉴定单一反应溶液中所有四种碱基的核苷酸测序反应。这种方法已被用于掺入事件(incorporationevent)的“实时”检测,其中掺入行为产生能够被检测到的信号事件。在特别优选的方法中,将标记组分偶联至在掺入事件期间被除去的核苷酸部分,从而消除了任何在添加下一个核苷酸之前对于除去这些标记组分的需要。参见(例如)eid,j.等(2009)science323:133-138。

然而,与此同时,下一代测序(包括全基因组测序和再测序、转录组谱分析、表观基因组表征、dna-蛋白质相互作用分析等)的需求则需要在每单位碱基测序成本较低的条件下提高通量。然而,较高的通量会影响所得的测序数据的质量。例如,在任意酶介导的模板依赖性测序过程中,掺入过程的总体保真度、持续合成能力和/或精确度能够对序列识别产生直接的影响。反过来,较低的精确度可能需要多重覆盖来以高的置信度水平鉴定特定序列。

因此,仍然需要提高分析系统中核苷酸测序反应的性能。具体而言,仍然需要开发在单分子实时测序反应中具有改善的动力学性质并表现出其他理想特征的经修饰的核苷酸试剂。



技术实现要素:

本公开在一个方面通过提供标记的核苷酸类似物来解决这些和其他需求,所述标记的核苷酸类似物包含:

第一亲和素蛋白,其具有四个亚基,各亚基包含一个生物素结合位点;

第一核苷酸化合物,其结合至第一亲和素蛋白,所述第一核苷酸化合物包含多磷酸酯元件、核苷元件、任选的多价中央核心元件、末端偶联元件和核苷酸接头元件,其中第一核苷酸化合物包含至少一个亲合力调节元件;以及

第一染料标记的化合物,其结合至第一亲和素蛋白,所述第一染料标记的化合物包含供体染料、受体染料、末端偶联元件和染料化合物接头元件。

在一些实施方案中,标记的核苷酸类似物还包含其他亲和素蛋白、其他核苷酸化合物或其他染料标记的化合物。

在具体实施方案中,一个或多个核苷酸化合物以及一个或多个染料标记的化合物通过一个或多个生物素部分结合至一个或多个亲和素蛋白。

在一些实施方案中,第一核苷酸化合物由结构式(i)表示:

其中

l为核苷酸接头元件,并且其包括亲合力调节元件;

p为多磷酸酯元件;

nu为核苷元件;

x为多价中央核心元件;

b”为末端偶联元件,并且其包括生物素部分;

n为1至4的整数;并且

o为0或1。

在具体实施方案中,亲合力调节元件为芳香族间隔元件或防护元件。

根据另一方面,本公开提供了标记的核苷酸类似物,其包含:

第一亲和素蛋白,其具有四个亚基,各亚基包含一个生物素结合位点;

第一核苷酸化合物,其结合至第一亲和素蛋白,所述第一核苷酸化合物包含多磷酸酯元件、核苷元件、任选的多价中央核心元件、末端偶联元件和核苷酸接头元件;以及

第一染料标记的化合物,其结合至第一亲和素蛋白,所述第一染料标记的化合物包含供体染料、受体染料、末端偶联元件、染料化合物接头元件和防护元件。

在一些实施方案中,标记的核苷酸类似物还包含其他亲和素蛋白、其他核苷酸化合物或其他染料标记的化合物。

在具体实施方案中,一个或多个核苷酸化合物以及一个或多个染料标记的化合物通过生物素部分结合至一个或多个亲和素蛋白。

在一些具体实施方案中,染料标记的化合物包含其他供体染料或受体染料。在其他具体实施方案中,染料化合物接头元件包含防护元件或侧链元件。

在一些实施方案中,第一染料标记的化合物由结构式(iiia)、(iiib)、(iiic)、(iiid)或(iiie)表示:

其中

各l’独立地为染料化合物接头元件;

各s独立地为防护元件;

各a独立地为受体染料;

各d独立地为供体染料;

各b”独立地为末端偶联元件;

各p独立地为0或1;并且

各r独立地为0至8的整数;

其中化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。

在其他实施方案中,第一染料标记的化合物由结构式(iiif)表示:

其中

各l’独立地为染料化合物接头元件;

各s独立地为防护元件;

各a独立地为受体染料;

各d独立地为供体染料;

各b”独立地为末端偶联元件;

各p独立地为0或1;并且

各r’独立地为0至4的整数;

其中化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。

还在其他实施方案中,第一染料标记的化合物由结构式(iiig)表示:

其中

各l’独立地为染料化合物接头元件;

各s独立地为防护元件;

各dye独立地为受体染料或供体染料;

各b”独立地为末端偶联元件;

各p独立地为0或1;并且

各r”独立地为0至8的整数;

s为1至6的整数;并且

t为0或1;

其中化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。

在另一方面,本公开提供了用于对核酸模板进行测序的反应混合物,其包含:

聚合酶复合物,其包含聚合酶、模板核酸和任选地与模板核酸杂交的引物,其中使聚合酶复合物固定于表面上;以及

测序试剂,其与所述表面接触并包含用于进行核酸合成的试剂,该测序试剂包括本公开的两个或多个标记的核苷酸类似物。

本公开还提供了利用本公开的标记的核苷酸类似物对核酸进行测序的方法和系统。

尽管主要根据核酸聚合酶,特别是dna聚合酶进行描述,但应该理解,提供改进的核苷酸化合物、染料标记的化合物以及包含上述化合物的标记的核苷酸类似物的方法可以有效地应用于人们可能希望实时直接观察酶反应的其他酶系统。这样的酶系统包括(例如)其他合成酶(例如,rna聚合酶、逆转录酶、核糖体聚合酶)以及其他酶系统(如激酶、磷酸酶、蛋白酶、核酸酶、连接酶等)。

附图简要说明

图1a和图1b示意性地示出了可以使用本发明的方面进行的示例性核酸测序过程。

图2a示出了与亲和素蛋白防护物相连的双生物素标记的染料组分和两个生物素标记的核苷酸组分。图2b示出了与亲和素蛋白防护物相连的双生物素标记的核苷酸组分和两个生物素标记的染料组分。图2c示出了与亲和素蛋白防护物相连的双生物素标记的染料组分和双生物素标记的核苷酸组分。图2d示出了与两个亲和素蛋白防护物相连的用两个双生物素部分标记的染料组分,其中每个生物素蛋白防护物都与包含双生物素的核苷酸组分相连。

图3a至图3o’示出了本公开的示例性的标记核苷酸类似物。

图4a至图4c示出了缺乏防护元件的示例性染料标记的化合物。

图5a至图5m示出了包括防护元件的本公开的示例性染料标记的化合物。

图6a图示了用于掺入本公开的标记的核苷酸类似物的示例性中间体结构。图6b至图6d示出了对应于图6a的中间体的示例性化学结构。

图6e示出了双生物素标记的、四供体染料(“d4”)防护的中间体化合物的化学合成和该分子的图示。图6f示出了用于本发明的标记的核苷酸类似物的组装中的示例性防护的四供体染料中间体化合物的另一个图示(左)和化学结构(右)。

图7a至图7d概述了用于本公开的标记的核苷酸类似物的合成组装的示例性路线。图7e示出了图7a至图7d所示的一些不同的中间体组分的图示之间的关系以及这些组分的化学结构。图7f示出了来自核苷酸和染料标记的中间体组分和亲和素蛋白的其他的标记的核苷酸类似物结构以及它们的组装。图7g示出了替代的有防护的中间体组分的化学结构,该组分包括四个有防护的供体染料和两个叠氮基(左)。图中还示出了可以从中间体组分生成的示例性标记的核苷酸类似物的图示(右)。

图8描绘了在具有含有disc的六磷酸类似物的突变体φ29聚合酶的晶体结构中,与1h-2,3-二氢异喹啉-8-磺基-6-羧酸(“disc”)基团的相互作用。聚合酶包含e375y和k512y置换。

图9描绘了在具有六磷酸类似物的突变体φ29聚合酶的晶体结构中,与disc和sg1基团的相互作用。聚合酶包含e375w、k512f和l142r置换。

图10描绘了在具有含有disc的六磷酸类似物的突变体φ29聚合酶的晶体结构中,与disc基团的相互作用。聚合酶包含e375w、k512h和k135r置换。

图11a描绘了在具有含有dsdc的六磷酸类似物的突变体φ29聚合酶模型中,与dsdc基团的相互作用。聚合酶包含e375y、d510r和k512y置换。

图11b描绘了在具有含有dsdc的六磷酸类似物的突变体φ29聚合酶模型中,与dsdc基团的相互作用。聚合酶包含k135r、e375y、d510r和k512y置换。

图12a和图12b示出了使用单核苷酸和二核苷酸类似物测序的精确度的比较。

图13a和图13b示出了使用单核苷酸和二核苷酸类似物的测序动力学的比较。

图14a比较了使用二核苷酸类似物和使用经修饰的单核苷酸类似物进行的测序反应,各自用dg标记。图14b示出了图14a的反应的归一化的脉冲间隔距离值。

图15a至图15c示出了二核苷酸类似物和各种经修饰的单核苷酸类似物的归一化的脉冲间隔距离、总体速率和合并误差。

图16a示出了具有各种阴离子芳香族间隔基的核苷酸类似物的归一化的脉冲间隔距离。图16b示出了ipd分布曲线,而图16c示出了相同类似物的归一化的脉冲宽度。

图17a示出了具有增加数量的侧链的核苷酸类似物的ipd分布曲线。图17b示出了相同类似物的归一化的ipd值。

图18示出了具有阴离子芳香族间隔基的单核苷酸和二核苷酸类似物的ipd分布曲线和归一化的ipd值(内插图)。

图19a图示了本公开的一些示例性类似物结构。图19b示出了归一化的脉冲间隔距离,而图19c示出了本公开的各种核苷酸类似物的聚合速率。

发明详述

标记的核苷酸类似物用于各种不同的应用。这样的应用包括(例如)在进行反应时实时观察单个分子,如单个生物分子。为了便于讨论,本文针对下列优选的用途讨论此类标记的核苷酸类似物,特别是本公开的示例性核苷酸类似物:核酸序列信息的分析,特别是单分子核酸序列分析。

在优选的应用中,实时监测单分子引物延伸反应,以识别正在进行的核苷酸向延伸产物中的掺入,从而阐明潜在的模板序列。在这种单分子实时(或smrttm)测序中,在聚合酶介导的模板依赖性引物延伸反应中的核苷酸的掺入过程在其发生时即被监测。在优选的方面,提供了模板/聚合酶引物复合物,其通常固定在光学限制区域内,如零模式波导(zmw)内,或者在透明衬底、光波导等的表面附近(参见例如,美国专利no.6,917,726和7,170,050以及美国专利申请公开no.2007/0134128,出于所有目的,将上述公开内容以全文引用的方式并入本文)。用针对待使用的标记的核苷酸的适当的激发辐射照射光学限制区域。因为复合物处于光学限制区域或非常小的照射体积内,所以只有直接围绕复合物的反应体积受到激发辐射。因此,那些(例如在掺入事件期间)与复合物相互作用的荧光标记的核苷酸在照射体积内存在充足的时间,从而将其识别为已掺入的。

该测序过程的示意性示意图示于图1a至图1b。如图1a所示,将聚合酶、模板核酸和引物序列的固定化复合物102设置在(例如)零模式波导106的光学限制的观察体积内(如虚线104所示)。作为合适的核苷酸类似物,将(例如)核苷酸108掺入到新生核酸链中,对应于掺入期间观察体积内的标记的核苷酸类似物的保留时间,对其进行照射延长的一段时间,其产生与上述保留相关的信号,例如图1b中的a轨迹所示的信号脉冲112。一旦掺入,与标记的核苷酸类似物的多磷酸酯组分相连的标记物即被释放。当下一个合适的核苷酸类似物(例如核苷酸110)与复合物接触时,该标记物也掺入,从而产生图1b的t轨迹中的相应的信号114。如模板序列的潜在互补性所指示的,通过监测碱基向新生链中的掺入,可以获得模板的序列信息的长序列。

如在pct国际公开no.wo2009/145828a2中所描述的(出于所有目的,将其全文以引用的方式并入本文),可以通过观察对应于以下反应步骤的明亮阶段和黑暗阶段来确定特定核苷酸的掺入:例如,荧光标记物与聚合酶相关联的反应步骤,以及荧光标记物与酶不相关的步骤。在某些条件下,聚合酶反应系统将显示出两个缓慢的(动力学可观察的)反应步骤,其中各步骤处于明亮阶段。在其他条件下,该系统将显示出两个动力学可观察的反应步骤,其中各步骤处于黑暗阶段。在还一些条件下,该系统将显示四个动力学可观察的(缓慢的)反应步骤,两个缓慢的步骤处于明亮阶段并且两个缓慢的步骤处于黒暗阶段。影响所观察到的动力学的因素包括聚合酶的类型、聚合酶反应条件(包括辅酶因子的类型和水平)以及反应底物。

本文公开的标记的核苷酸类似物(包括其核苷酸和染料标记的组分)包含调节聚合酶反应动力学以改善系统性能的结构特征。因此,本发明核苷酸类似物的改善的性能为这些类似物在各种分析技术中的使用提供了优势。特别地,本公开提供了标记的核苷酸类似物,其在一些情况下,除了其他有利的性质之外,还在smrttmdna测序期间显示出缩短的ipd(脉冲间隔距离)。这些类似物的聚合酶速率相应地增加。通过调节与dna测序反应中添加的类似物浓度相关的ipd,可以使类似物的浓度降低。类似物浓度的降低相应地降低了来源于类似物在zmw中的扩散的背景噪声,并因此提高了信噪比。在测序仪器需要更高的激光照射功率的情况下,这些参数和其他参数的改进就显得尤为重要。激光功率的降低转而降低了荧光团的光致漂白和其他相关的光损伤。

虽然使用smrttm测序的以上描述对本发明的标记的核苷酸类似物的有效性进行说明,但应该理解,这些类似物以及它们的核苷酸化合物组分和染料标记的化合物组分可以用于任意合适的酶促反应或结合反应,并因此在其他分析技术中将具有更广泛的用途。例如,本公开的标记的核苷酸类似物还可以用于任意类型的结合相互作用的测量,而不仅仅是试剂反应所致的结合相互作用。虽然在优选的实施方案中,如单分子实时核酸测序反应和其他核苷酸依赖性酶促反应,类似物充当酶底物并且由于相互作用而发生化学变化,但是在其他实施方案中,如(例如)标记的核苷酸类似物与抗体、受体或其他亲合剂的结合,作为相互作用的结果,类似物保持不变。可以使用公知的荧光技术和生物化学工艺对酶促反应、结合相互作用或者任意其他类型的反应或相互作用进行测量。此类技术和工艺的实例包括荧光共振能量转移(fret)、荧光相关光谱、荧光猝灭、荧光偏振、流式细胞术等。

本公开提供了用于本发明的核苷酸化合物和染料标记的化合物的化学式和特定的化学结构。在由其常规的从左向右书写的化学式来说明化学基团的情况下,化学式任选地同样涵盖从右向左书写结构所得到的基团,例如,-ch2o-也旨在叙述-och2-;-nhs(o)2-也意图任选地表示-s(o)2nh-,等等。此外,在化合物可以表示为游离酸或游离碱或它们的盐的情况下,具体形式的表示(例如,羧酸或磺酸)也公开了其他形式,例如去质子化的盐形式,例如羧酸盐或磺酸盐。盐的合适的抗衡离子为本领域中众所周知的,并且本发明盐的具体抗衡离子的选择完全在本领域普通技术人员的能力范围内。类似地,在公开了盐的情况下,该结构也公开了游离酸或游离碱形式的化合物。制备盐以及游离酸和游离碱的方法为本领域中众所周知的。

本公开的标记的核苷酸类似物通常意欲用作聚合酶的底物,在核酸测序的情况下尤其是如此。因此,通常如果核苷磷酸盐能够作为任意天然的或经修饰的聚合酶的底物,则本发明的核苷酸或核苷磷酸盐可以包括任意非天然的碱基、糖或磷酸盐。

“羧基部分的活性衍生物”和等效物质是指本发明化合物或者它们的前体或衍生物的组分上的部分,或另一试剂组分上的部分,通过羧基部分(例如,活性酯、酰基卤、酰基咪唑化物等)形式上连接含有氧或其他原子的离去基团。当进行组装时,此类活性部分可用于偶联本发明的核苷酸化合物和染料标记的化合物以及类似物的各种组分。

除非另有说明,否则术语“烷基”(其本身或作为另一个取代基的一部分)是指直链或支链或环状烃基或者它们的组合,其可以为完全饱和的、单不饱和的或多不饱和的,并且可以包括一价、二价和多价基团,其具有指定的碳原子数(即,c1-c10表示一个至十个碳)。饱和烷基的实例包括但不限于诸如甲基、亚甲基、乙基、亚乙基、正丙基、异丙基、正丁基、叔丁基、异丁基、仲丁基、环己基、(环己基)甲基、环丙基甲基之类的基团;(例如)正戊基、正己基、正庚基、正辛基等的同系物和异构体。不饱和烷基为具有一个或多个双键或三键的基团。不饱和烷基的实例包括但不限于乙烯基、2-丙烯基、巴豆基、2-异戊烯基、2-(丁二烯基)、2,4-戊二烯基、3-(1,4-戊二烯基)、乙炔基、1-丙炔基和3-丙炔基、3-丁炔基以及高级同系物和异构体。除非另有说明,否则术语“烷基”包括“亚烷基”、“炔基”和任选的下文更详细定义的那些烷基衍生物,例如“杂烷基”。

除非另有说明,否则术语“杂烷基”(其本身或与另一术语组合)是指稳定的直链或支链或环状烃基或者它们的组合,其包括所述数量的碳原子和至少一个选自由下列构成的组中的杂原子:o、n、si、p和s,并且其中可以任选地将氮原子和硫原子氧化,并且可以任选地将氮杂原子季铵化。一个或多个杂原子o、n、s、p和si可以位于杂烷基的任意内部位置处或者位于烷基与分子的其余部分连接的位置处。实例包括但不限于-ch2-ch2-o-ch3、-ch2-ch2-nh-ch3、-ch2-ch2-n(ch3)-ch3、-ch2-s-ch2-ch3、-ch2-ch2,-s(o)-ch3、-ch2-ch2-s(o)2-ch3、-ch=ch-o-ch3、-si(ch3)3、-ch2-ch=n-och3和-ch=ch-n(ch3)-ch3。多达两个杂原子可以为连续的,如(例如)-ch2-nh-och3和ch2-o-si(ch3)3。类似地,术语“杂亚烷基”其本身或作为另一个取代基的一部分是指衍生自杂烷基的二价基团,可例举但不限于-ch2-ch2-s-ch2-ch2-和-ch2-s-ch2-ch2-nh-ch2–。对于杂亚烷基,杂原子还可以占据链末端(例如亚烷氧基、亚烷二氧基、亚烷氨基、亚烷二氨基等)的任一端或两端。

除非另有说明,否则术语“环烷基”和“杂环烷基”(它们本身或与其他术语组合)分别表示“烷基”和“杂烷基”的环状形式。还包括二价和多价物质,如“环亚烷基”。此外,对于杂环烷基,杂原子可以占据杂环与分子的其余部分连接的位置。环烷基的实例包括但不限于环戊基、环己基、1-环己烯基、3-环己烯基、环庚基等。杂环烷基的实例包括但不限于1-(1,2,5,6-四氢吡啶基)、1-哌啶基、2-哌啶基、3-哌啶基、4-吗啉基、3-吗啉基、四氢呋喃-2-基、四氢呋喃-3-基、四氢噻吩-2-基、四氢噻吩-3-基、1-哌嗪基、2-哌嗪基等。

除非另有说明,否则术语“卤代”或“卤素”(它们本身或作为另一个取代基的一部分)是指氟、氯、溴或碘原子。此外,术语如“卤代烷基”意在包括单卤代烷基和多卤代烷基。例如,术语“卤代(c1-c4)烷基”意在包括但不限于诸如三氟甲基、2,2,2-三氟乙基、4-氯丁基、3-溴丙基等物质。

除非另有说明,否则术语“芳基”是指多不饱和的芳香烃取代基,其可以为单环或多环(优选1至3个环),其稠合在一起或共价连接。术语“杂芳基”是指含有1个至4个选自n、o和s的杂原子的芳基(或环),其中任选地将氮原子和硫原子氧化,并且任选地将一个或多个氮原子季铵化。杂芳基可以通过杂原子连接到分子的其余部分。芳基和杂芳基的非限制性实例包括苯基、1-萘基、2-萘基、4-联苯基、1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、2-咪唑基、4-咪唑基、吡嗪基、2-噁唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-异噁唑基、4-异噁唑基、5-异噁唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、2-噻吩基、3-噻吩基、2-吡啶基、3-吡啶基、4-吡啶基、2-嘧啶基、4-嘧啶基、5-苯并噻唑基、嘌呤基、2-苯并咪唑基、5-吲哚基、1-异喹啉基、5-异喹啉基、2-喹喔啉基、5-喹喔啉基、3-喹啉基和6-喹啉基。还包括二价和多价接头物质,如“亚芳基”。上述各芳基和杂芳基环系统的取代基选自下面描述的可接受的取代基。

为简洁起见,当与其他术语(例如,芳氧基、芳硫基、芳烷基)组合使用时,术语“芳基”包括如上定义的芳基和杂芳基环。因此,术语“芳烷基”是指包括这样的基团:其中芳基与烷基(例如,苄基、苯乙基、吡啶基甲基等)相连,所述烷基包括其中的碳原子(例如,亚甲基基团)被(例如)氧原子取代的那些烷基(例如,苯氧甲基、2-吡啶氧基甲基、3-(1-萘氧基)丙基等)。

上述各术语(例如,“烷基”、“杂烷基”、“芳基”和“杂芳基”)包括指定基团的取代和未取代形式。下面提供了各类型的基团的示例性取代基。

烷基和杂烷基的取代基(包括通常称为亚烷基、烯基、杂亚烷基、杂烯基、炔基、环烷基、杂环烷基、环烯基和杂环烯基的那些基团)可以为但不限于选自下列的各种基团的一者或多者:-or’、=o、=nr’、=n-or’、-nr’r”、-sr’、-卤素、-sir’r”r”’、-oc(o)r’、-c(o)r’、-co2r’、-conr’r”、-oc(o)nr’r”、-nr”c(o)r’、so3r’、-nr’-c(o)nr”r”’、-nr”c(o)2r’、-nr-c(nr’r”r’”)=nr””、-nr-c(nr’r”)=nr’”、-s(o)r’、-s(o)2r’、-s(o)2nr’r”、-nrso2r’、-cn和-no2,取代基的数量范围为零至(2m” 1),其中m”为该基团中的碳原子总数。r’、r”、r”’和r””各自优选独立地表示氢、取代或未取代的杂烷基、取代或未取代的芳基(例如被1至3个卤素取代的芳基)、取代或未取代的烷基、烷氧基或硫代烷氧基基团或者芳烷基。当本发明的化合物或试剂包含超过一个r基团时,独立地选择各r基团(例如),当r’、r”、r’”和r””基团存在超过一个时,这些基团各自也是一样。当r’和r”连接到相同的氮原子时,可以将r’和r”连同氮原子一起形成5-、6-或7-元环。例如,-nr’r”意在包括但不限于1-吡咯烷基和4-吗啉基。因此,根据上文对取代基的讨论,本领域普通技术人员应当理解,术语“取代的烷基”和“杂烷基”意在包括具有与除氢原子以外的基团结合的碳原子的基团,如卤代烷基(例如,-cf3和-ch2cf3)和酰基(例如,-c(o)ch3、-c(o)cf3、-c(o)ch2och3等)。

以上段落中列出的取代基在本文中被称为“烷基取代基”。

类似于对于烷基基团所描述的取代基,芳基和杂芳基的取代基为多样的并且选自(例如):卤素、-or’、=o、=nr’、=n-or’、-nr’r”、-sr’、-卤素、-sir’r”r”’、-oc(o)r’、-c(o)r’、-co2r’、-conr’r”、-oc(o)nr’r”、-nr”c(o)r’、-nr’-c(o)nr”r”’、-nr”c(o)2r’、-nr-c(nr’r”)=nr’”、-s(o)r’、-s(o)2r’、so3r’、-s(o)2nr’r”、-nrso2r’、-cn和-no2、-r’、-n3、-ch(ph)2、氟代(c1-c4)烷氧基和氟代(c1-c4)烷基,取代基的数量范围为零至芳香环系统上的开放化合价的总数;并且其中r’、r”、r”’和r””优选独立地选自卤素、(c1-c8)烷基和杂烷基、未取代的芳基和杂芳基、(未取代的芳基)-(c1-c4)烷基和(未取代的芳基)氧基-(c1-c4)烷基。当本发明的化合物或试剂包含超过一个r基团时,独立地选择各r基团,(例如)当r’、r”、r’”和r””基团存在超过一个时,这些基团各自也是一样。

芳基或杂芳基环的相邻原子上的两个取代基可以任选地被式-t-c(o)-(crr’)q-u-的取代基所取代,其中t和u独立地为-nr-、-o-、-crr’-或单键,并且q为0至3的整数。或者,芳基或杂芳基环的相邻原子上的两个取代基可以任选地被式-a-(ch2)r-b-的取代基所取代,其中a和b独立地为-crr’-、-o-、-nr-、-s-、-s(o)-、-s(o)2-、-s(o)2nr’-或单键,并且r为1至4的整数。如此形成的新环的单键中的一者可以任选地以双键代替。或者,芳基或杂芳基环的相邻原子上的两个取代基可以任选地被式-(crr’)s-j-(cr”r”’)d-的取代基所取代,其中s和d独立地为0至3的整数,并且j为-o-、-nr’-、-s-、-s(o)-、-s(o)2-或-s(o)2nr’-。取代基r、r’、r”和r”’优选独立地选自氢或者取代或未取代的(c1-c6)-烷基。

以上两段中列出的取代基在本文中被称为“芳基取代基”。

当提及本公开的化合物和类似物的组分时,术语“衍生自……的残基”是指通过第一组分上的第一反应性官能团(例如,多价中央核心元件、染料元件、防护元件、接头元件、末端偶联元件等)和第二组分上的第二反应性官能团(例如,多价中央核心元件、染料元件、防护元件、接头元件、末端偶联元件等)的反应以形成共价键,从而形成的残基。在示例性实施方案中,第一组分上的胺基与第二组分上的活性羧基反应,以形成含有一个或多个酰胺部分的残基。本发明涵盖第一和第二反应性官能团的其他排列。例如,正如本领域普通技术人员所理解的那样,通过众所周知的“点击”反应,叠氮取代的第一组分与炔取代的第二组分的铜催化反应产生含有三唑的残基。参见kolb等(2001)angew.chem.int.ed.engl.40:2004;evans(2007)aus.j.chem.60:384。

在一些实施方案中,可以将点击反应的无铜变型用于偶联第一和第二反应性基团。参见例如,baskin等(2007)proc.natlacad.sci.u.s.a.104:16793-97。例如,在没有铜催化剂的情况下,叠氮取代的第一组分可以与连接到第二组分的环炔烃(理想地为环辛炔)进行反应。这种所谓的无铜点击试剂为市售可得的。此类环炔烃的实例包括但不限于二苯并环辛炔-胺、二环[6.1.0]壬-4-炔-9-基或单氟化环辛炔。正如本领域普通技术人员所理解的那样,其他偶联化学也可以有效地用于本公开的化合物的合成中。

铜催化的和无铜的点击反应产生以下示例性连接结构,包括含三唑和环烷基的残基。因此,无论此类残基出现在何处,应该认为此类残基在本文公开的化合物的任意接头或其他亚结构的范围内。

另外,如本领域普通技术人员所理解的那样,可以预想出以上连接结构的变型,例如改变其中烷基接头基团的长度,或者以杂原子或其他插入的化学部分取代所示的结构,其中此类取代不干扰接头基团的功能。

还应该理解,根据情况,如果需要的话,通常可以将刚才描述的反应中的第一和第二反应性官能团的附着位点进行对调。例如,在“点击”反应的情况下,如上所述,第一组分可以为叠氮取代的并且第二组分可以为炔取代的,或者第一组分可以为炔取代的并且第二组分可以为叠氮取代的。反应中的这种变化对于本领域技术人员而言是已知的。

如本文所使用的,列出的整数范围包括该范围内的每个整数。例如,2至6的整数包括整数2、3、4、5和6。

标记的核苷酸类似物

本公开提供了新型标记的核苷酸类似物,其用于酶促反应和其他分子识别事件的测量和分析,如核酸的单分子实时测序。类似物包含至少一个蛋白质防护物(proteinshield),优选亲和素蛋白防护物,其与至少一个核苷酸化合物和至少一个染料标记化合物相连。如本领域众所周知的,亲和素蛋白(包括亲和素、链霉亲和素、蘑菇亲和素(tamavidin)、链霉素亲和素突变体(traptavidin)、热带爪蟾亲和素(xenavidin)、慢生大豆根瘤菌亲和素(bradavidin)、avr2、avr4以及它们的同源物)通常包含四个亚基,每个亚基包含一个生物素结合位点。因此,亲和素蛋白可以与一个或多个生物素标记的核苷酸化合物紧密结合,并且与一个或多个生物素标记的含有染料的化合物紧密结合,从而生成经染料标记的、蛋白质防护的核苷酸类似物,其实例描述于美国专利申请公开no.2013/0316912a1中,该专利公布为美国专利no.9,062,091,出于所有目的,将其通过全文引用并入本文。如图2a至图2c中所示,根据染料组分和核苷酸组分是否分别具有两个或一个生物素标记,先前描述的蛋白质防护的核苷酸类似物可以包含一个或两个染料组分以及一个或两个核苷酸组分。如图2d所示,如果将核苷酸或染料组分设计成桥接多个亲和素四聚体,则这些类似物还可以包含超过一个亲和素蛋白防护物。在图2a至图2d的图示中,染料或核苷酸组分与亲和素亚基之间的直线表示单个生物素标记的组分与一个亲和素亚基的连接,而连接两个亲和素亚基的半圆表示双生物素标记的组分与两个亲和素亚基的连接。

美国专利申请公开no.2015/0050659a1和美国专利申请公开no.2016/0237279a1描述了受保护的荧光试剂化合物(包括核苷酸类似物化合物和多聚体的受保护的荧光试剂化合物)的其他实例,出于所有目的,将上述美国专利申请通过全文引用并入本文。

图3a至图3o’示出了本公开的示例性染料标记的核苷酸类似物的高级结构。例如,在图3a中,球形组分(330)代表四聚体亲和素蛋白防护物,其含有四个生物素结合位点。在相连的核苷酸和染料标记的化合物组分上的半圆(320)代表双生物素部分。大的、对称的椭圆形球体(310)代表染料元件,而与双叶形结构相连的较小的、对称的球体(350)代表防护元件的侧链,在这种情况下,其充当核苷酸接头内的亲合力调节元件。钥匙形基团(340)相当于核苷酸(即,核苷元件加上多磷酸酯元件)。

图3e示出了本发明的核苷酸化合物和染料标记的化合物的三个其他元件。具体而言,环形结构(360)代表芳香族间隔元件,而六叶形结构(370)代表防护元件。这些组分中的每一者可以充当核苷酸化合物的核苷酸接头内的亲合力调节元件。双叶形结构(380)代表类似物的染料标记的化合物内的光保护性防护元件。将在下面对所有这些组分进行详细描述。对应于以上组分中的每一者以及其他的示例性化学结构也示于图7e和图7g。

图3a至图3o’所示的超结构示出了通过各种染料标记的组分和核苷酸标记的组分与一个或多个亲和素蛋白的组装而得到的广泛的结构多样性。例如,类似物可以包含一个(例如,图3a、图3b、图3c、图3d、图3i、图3m、图3o、图3p和图3f’)、两个(例如,图3e、图3g、图3h、图3k、图3l、图3n、图3q、图3r至图3e’和图3g’至图3o’)或三个(例如,图3f和图3j)亲和素蛋白,并且如果需要,可以组装甚至更大的超结构。类似物可以包含具有一个(例如,图3e、图3f、图3g、图3j、图3l、图3o至图3w和图3y至3o’)、两个(例如,图3a、图3b、图3c、图3d、图3h、图3i、图3k、图3m、图3n和图3x)或更多个核苷元件的核苷酸化合物。可以根据需要以各种组合的形式将其他特征包括在内,如位于核苷酸化合物的接头元件内的防护元件和/或芳香族间隔元件(例如阴离子芳香族间隔元件)的应用,以调节相连的结合蛋白质或酶的亲合力和/或动力学;以及染料标记的化合物的防护,该防护可通过防护元件和染料的直接偶联或者通过染料接头中含有防护元件和/或侧链来实现。虽然图3a至图3o’的示例性类似物全部包括通过双生物素部分连接的核苷酸化合物和染料标记的化合物,但是应该理解,如图2a至图2c的结构中那样,类似物也可以有效地由具有单个生物素部分的化合物组装而成。

因此,本发明的标记的核苷酸类似物可包含任意所需数量的亲和素四聚体、核苷酸化合物和染料标记的化合物。例如,类似物可以以任意组合的方式包含1个、2个、3个、4个、6个、10个或甚至更多个这些组分中的每一者。在具体的实施方案中,标记的核苷酸类似物包含1个至4个所述组分中的每一者。在甚至更具体的实施方案中,标记的核苷酸类似物包含1个、2个或3个亲和素蛋白、1个或2个染料标记的化合物以及1个或2个核苷酸化合物。

为了提供期望的吸收和发射的颜色和强度,特别有利的是改变标记的核苷酸类似物中的染料元件的数量和类型。此外,如下面将更详细描述的那样,类似物复合物的染料标记的化合物中的具有重叠光谱的内含物染料使得能够使用更先进的荧光技术,如(例如)荧光共振能量转移,其中将输入光信号从结构内的“供体”染料转移至相邻的“受体”染料,然后发出波长比仅由供体荧光团产生的波长更长的光信号。如果需要,改变单个标记的核苷酸类似物中的荧光染料的数量还能够以有效的方式对输出光信号的强度进行调制。

例如,当将标记的核苷酸类似物用于dna测序反应时,根据与类似物相关的核苷酸组分改变类似物的颜色或其他光学性质可能是有效的。具体而言,图3a至图3d所示的类似物的核苷酸组分可能仅在碱基基团(例如,da、dg、dc和dt)的性质方面不同。结合该变化,还可以改变类似物的染料组分,例如如不同的染料结构(310、312、314和316)所示的那样。因此,可以通过每种核苷酸类似物光输出的颜色和/或强度使其成为可唯一识别的。

用于组装本文公开的标记的核苷酸类似物的染料标记的化合物还有利地包含防护元件。如上所述并且如图2a至图2d所示,美国专利申请公开no.2013/0316912a1已经描述了蛋白质防护的染料标记的聚合酶底物。这些类似物所使用的一些染料标记的组分包含多个受体染料和供体染料,但染料标记的化合物本身不包含防护元件。未防护的染料标记的化合物的实例示于图4a至图4c,其中将受体染料指定为“a”,将供体染料指定为“d”,在这些实例中的末端偶联元件为双生物素,由半圆标示,并且染料化合物接头元件由连接结构的不同组分的线标示。图4b和图4c中所示的化合物的染料化合物接头元件中的小圆点代表由铜催化的点击反应、无铜点击反应或其他合适的偶联反应生成的三唑结构或其他残基。

可以将图4a至图4c的化合物与图5a至图5m所示的化合物(其代表包含一个或多个防护元件的染料标记的化合物)相比较。在图5a至图5m中,还如图3a至图3o’的结构所示的那样,将化合物中的防护元件的侧链指定为不对称的球体结构。

图5a至图5m的化合物示出了在本发明的染料标记的化合物的范围内可能的结构变化的广泛的多样性。具体而言,化合物可以包括但不限于单个的双生物素部分(例如,图5a、图5b和图5c)或双重的双生物素部分(例如,图5d至图5m);化合物可以包括未防护的受体和直接防护的供体(例如,图5b、图5h、图5k和图5l);化合物可以包括直接防护的受体和未防护的供体(例如,图5c、图5f、图5g、图5j和图5m);化合物可以包括直接防护的受体和直接防护的供体两者(例如,图5a和图5i);或者在其染料化合物接头元件中,化合物可以包括具有防护元件和/或侧链的化合物(例如,图5d、图5e、图5f、图5g和图5k)。应该理解的是,一些化合物可以包括以下两者:与受体和/或供体相连的防护元件;以及包括在染料化合物接头元件中的防护元件和/或侧链。还应该理解的是,虽然图5a至图5m的图示可以表示染料、防护件和接头的不同尺寸、形状和/或位置(例如,在图5g中,染料接头中受体防护元件的侧链显示为大于防护元件的侧链),但是图示中所示的任意组分的尺寸、形状和/或位置不应被认为是对实际结构的限制,除非本文中有明确描述。

图3e至图3o’所示的核苷酸类似物示出了染料标记的化合物的进一步多样化,其中染料标记的化合物包含一供体一受体化合物(“d1a1”)(图3i)、二供体一受体化合物(“d2a1”)(图3m)、二供体二受体(“d2a2”)(图3o至图3q和图3d’)、四供体一受体化合物(“d4a1”)(图3h、图3k和图3l)、四供体二受体化合物(“d4a2”)(图3e至图3g、图3j、图3n、图3r、图3z、图3a’和图3n’)、四供体四受体化合物(“d4a4”)(图3t、图3w和图3x)、六供体二受体化合物(“d6a2”)(图3s、图3y、图3c’、图3f’和图3g’)、六供体四受体化合物(“d6a4”)(图3e’)、八供体二受体化合物(“d8a2”)(图3u、图3v、图3b’、图3h’、图3i’、图3j’(其中图3i’和图3j’的核苷酸化合物之间的区别在于受体染料的结构)和图3o’)、十供体四受体化合物(“d10a4”)(图3k’和图3l’)和十二供体二受体化合物(“d12a2”)(图3m’)。如从这些图的染料标记的化合物结构显而易见的是,可以有利地改变供体染料、受体染料和防护元件的位置和数量以获得期望的性质,包括亮度、激发和发射波长、光稳定性以及在涉及dna聚合酶的自动dna测序反应中的反应动力学,如下面将进一步详细描述的那样。

为了提供这些组分中每一者的更具体描述,在下面的部分中将详细描述不同的新型核苷酸化合物和染料标记的化合物的结构和功能特性、由这些化合物向新型标记的核苷酸类似物的组装以及这些新型类似物与野生型和突变型dna聚合酶的相互作用。

核苷酸化合物

如刚才所述,本公开提供了在标记的核苷酸类似物的组装中有用的新型核苷酸化合物,所述标记的核苷酸类似物在酶促反应和其他分子识别事件(如(例如)核酸的单分子实时测序)的测量和分析中是有用的。

因此,在一个方面,本公开由此提供了结构式(i)的化合物:

其中

l为核苷酸接头元件,其包括至少一个亲合力调节元件;

p为多磷酸酯元件;

nu为核苷元件;

x为多价中央核心元件;

b”为末端偶联元件;

n为1至4的整数;并且

o为0或1。

通常,本公开的“接头”应被广义地认为是包括在给定化合物中的两个或多个组分之间提供合适的共价连接的任意化学部分。接头可以为亲水的(例如,四甘醇、六甘醇、聚乙二醇)或者接头可以为疏水的(例如,己烷、癸烷等)。示例性的接头包括取代或未取代的c6-c30烷基、多元醇类(例如甘油)、聚醚类(例如聚(乙二醇))、聚胺类、氨基酸类(例如聚氨基酸)、肽类、糖类(例如多糖)以及它们的组合。此类接头通常包含直连或支链,其中根据需要,该链可以在任意合适的位置被取代,并且其中任意碳原子可以被任意合适的杂原子所取代。如果需要的话,接头可以包含一个或多个烷基、杂烷基、环烷基、环杂烷基、芳基或杂芳基。

结构式(i)的核苷酸接头元件l更具体地将该结构的多磷酸酯元件连接至多价中央核心元件(如果存在的话),或直接连接至末端偶联元件。在具体的实施方案中,核苷酸接头元件包含c6-c20烷基,该c6-c20烷基任选地以任意组合的方式包含(例如)酰胺键、醚键、亚苯基、三唑基、另一偶联残基等。此外,在结构式(i)的本发明的核苷酸化合物中,核苷酸接头元件包含至少一个亲合力调节元件,其可以为芳香族间隔元件、防护元件或芳香族间隔元件和防护元件两者。

如下面将更详细描述的,本发明的核苷酸化合物的亲合力调节元件可以用于增强本发明的标记的核苷酸类似物与生物分子(如酶或结合蛋白质)之间的相互作用。亲合调节元件可以通过静电的、疏水的、空间的或其他的方式来增强相互作用。在一个示例性实施方案中,将标记的核苷酸类似物(在核苷酸接头元件中包括具有亲合力调节元件的核苷酸化合物)用于单分子核酸测序技术,亲合力调节元件尤其可以增强核苷酸类似物和dna聚合酶之间的相互作用,由此降低km或在其他方面影响测序反应的动力学,从而实现类似物在聚合酶上的优化停留时间或其他期望的行为。具体而言,并且无意于受理论的束缚,据认为亲合力调节元件(优选芳香族间隔元件,如阴离子芳香族间隔元件和/或防护元件)有利地与聚合酶的活性位点附近的特定氨基酸残基发生相互作用,并且这些相互作用是改善的动力学性质的原因。

因此,在结构式(i)的化合物的一些实施方案中,核苷酸接头元件包含亲合力调节元件,并且在一些该类化合物中,亲合力调节元件为芳香族间隔元件或防护元件。在一些实施方案中,芳香族间隔元件为取代或未取代的单环、双环或三环芳香族部分。

在更具体的实施方案中,芳香族间隔元件由结构式(ii)表示:

其中

a环和b环各自独立地为任选地取代的5至7个原子的环状结构,其中a环或b环中的至少一者为芳香族;并且

a环或b环任选地包含至少一个阴离子取代基。

更具体而言,任选的至少一个阴离子取代基为-so3h。

在其他具体实施方案中,芳香族间隔元件由结构式(iia)或(iib)表示:

其中

a1、a2、a3和a4基团中的一者为并且其他基团为-ch2-或键;并且

r1为h或阴离子取代基并且r2为h或阴离子取代基。

更具体而言,芳香族间隔元件可以由结构式(iic)或(iic’)表示:

其中

r1为h或阴离子取代基。

在一些可替代实施方案中,芳香族间隔元件可以由结构式(iv)表示:

其中

r1为h或阴离子取代基。

在一些具体实施方案中,芳香族间隔元件由下列结构式中的一者表示:

根据一些更具体的核苷酸化合物实施方案,所述至少一个亲合力调节元件为阴离子芳香族间隔元件。还更具体而言,阴离子芳族间隔元件为取代的双环或三环阴离子芳香族部分。甚至更具体而言,阴离子芳香族间隔元件由结构式(ii)表示:

其中

a环和b环各自独立地为5至7个原子的环状结构,其中a环或b环中的至少一者为芳香族;并且

a环或b环包括至少一个阴离子取代基。在一些该类实施方案中,所述至少一个阴离子取代基为-so3h。在一些该类实施方案中,阴离子芳香族间隔元件由结构式(iia)或(iib)表示:

其中

a1、a2、a3和a4基团中的一者为并且其他基团为-ch2-或键;并且

r1为所述至少一个阴离子取代基并且r2为h或所述至少一个阴离子取代基,包括其中阴离子取代基为-so3h的实施方案。在一些该类实施方案中,阴离子芳香族间隔元件由结构式(iic)表示:

在结构式(i)的化合物的一些实施方案中,核苷酸接头元件包括防护元件。如上所述,防护元件可以用作本发明的核苷酸化合物中的亲合力调节元件,从而调节核苷酸化合物与相关酶或结合蛋白之间的相互作用。认为防护元件的具体结构不是关键的,只要结构足够大从而调节标记的类似物与蛋白质或与类似物结合的其他目标分子之间的接触即可。如本文所公开的,防护元件可以使含有这些结构的核苷酸类似物获得改善的动力学和/或其他性质,特别是通过防护元件与酶(如dna聚合酶)或结合蛋白的相互作用。在本文公开的结构式(i)的核苷酸化合物中,防护元件不包含蛋白质。

在一些实施方案中,本发明的核苷酸化合物的防护元件优选包含防护核心元件,其为防护元件侧链提供多价附着位点,其中防护元件侧链提供防护元件部分的主要体积和电荷密度,并因此被认为是与核苷酸结合蛋白的有利相互作用的原因。

因此,在一些实施方案中,防护元件可以包括合适的核心结构,其能够使多个侧链连接至防护元件核心。在具体实施方案中,防护元件包括以下结构:

其中各y独立地为1至6的整数。

在一些实施方案中,防护核心元件具有“分层”结构,其中每个接头元件包含超过一个防护元件核心。如果需要,连接至不同防护元件核心的侧链可以任选地为不同类型的侧链。在不同层中使用不同的侧链可以在防护元件中提供不同的微环境。根据防护的化合物的所需行为和预期用途,不同的层可以(例如)包含成对的中性或带负电荷的基团。

有效地掺入本公开的核苷酸化合物中的示例性防护元件包括下列非限制性结构:

应该理解的是,如本领域普通技术人员所理解的那样,这些基团可以从任意方向插入到核苷酸接头元件或核苷酸化合物的其他组分内。核苷酸接头元件优选还包含短的烷基或环烷基,如(例如)己基或环己基,以将一个或多个防护元件连接到结构的其余部分,但其他部分可以适用于此目的。例如,接头元件可以选自本文所述的任意接头。在更具体的实施方案中,接头元件可以包含三唑。

就此而言,应当理解的是,在一些实施方案中,如(例如)美国专利申请公开no.2015/0050659a1中描述的那样,使用“点击”反应或“无铜点击”反应将防护元件合成地组装到核苷酸接头元件中。因此优选使中间体组分标记有叠氮基和乙炔基,其相互反应以形成三唑结构。然而,还应该理解的是,如本领域普通技术人员所理解的那样,可以使用其他连接方法来生成本发明范围内的本发明的类似物。

一些防护元件结构可以包括三个、四个或甚至更多个侧链“层”,例如如下列式子所示:

-sh(r1)2-sh(r2)2-sh(r3)2-;和

-sh(r1)2-sh(r2)2-sh(r3)2-sh(r4)2;

其中“sh”为防护核心元件,如(例如)并且“r1”、“r2”、“r3”和“r4”为侧链。应该理解的是,根据需要,“r1”、“r2”、“r3”和“r4”侧链基团可以以任意组合的方式为相同的或不同的侧链,以实现本发明标记的核苷酸类似物的改进的动力学性质或其他性质。在这些实例中,通过sh基团从防护元件结构的任一端将防护元件连接至接头元件。

通常,与防护元件一样,认为防护元件的侧链组分的具体结构不是关键的,只要侧链足够大以提供所期望的效果即可。在一些实施方案中,侧链包含聚乙二醇(peg)。在具体的实施方案中,聚乙二醇侧链包含具有3个至20个重复环氧乙烷单元的聚乙二醇。在更具体的实施方案中,聚乙二醇侧链包含具有4个至10个重复环氧乙烷单元的聚乙二醇。在一些实施方案中,侧链包含带负电荷的组分,如(例如)包含磺酸的组分。在一些实施方案中,侧链包含聚乙二醇和其他组分(如(例如)带负电的组分)的组合。

侧链还可以包含核心结构以提供侧链内的支化。在一些实施方案中,侧链包含取代的苯基。在具体的实施方案中,侧链包含下列结构:

其中各x独立地为1至6的整数。在更具体的实施方案中,各x独立地为1至4的整数。

在一些实施方案中,侧链可以包含树枝状大分子。树枝状大分子(或“树形分子”)为重复支化的分子,其通常围绕核心为对称的,并且可以采用球形三维形态。参见(例如)astruc等(2010)chem.rev.110:1857。将这种结构掺入本发明化合物的防护元件中,能够通过调节标记的核苷酸类似物与一种或多种与核苷酸类似物相关的生物分子之间的接触而提供有利的性质。通过分子一级结构的变化(包括树枝状大分子表面的潜在官能化)改进树枝状大分子的化学和物理性质,使得可以根据需要调节核苷酸类似物的功能特性。如本领域中众所周知的,可以通过使用范围广泛的材料和支化反应的各种技术来合成树枝状大分子,包括下面描述的那些。

有效地掺入本发明的分子侧链的示例性树枝状大分子的结构包括以下结构:

可以通过(例如)(a)链长和链的类型,(b)支化位置和支化度,以及(c)端基呈现形式(中性基团或带电荷基团、疏水基团或亲水基团等)来调整本发明化合物中所使用的树枝状大分子侧链的结构和功能特性。

在一些实施方案中,至少一个侧链包含肽链。

在一些实施方案中,至少一个侧链包含多糖。

侧链的非限制性实例包括下列结构:

(相当于peg7)和具有其他数量重复单元的聚乙二醇;

以及一些侧链实施方案可以包括任意的上述组分的组合,如(例如)下列聚乙烯和带负电侧链的组合:

在一些实施方案中,侧链的分子量为至少300、350、400、450或甚至更高。在优选的实施方案中,侧链的分子量为至少300。

在结构式(i)的化合物的优选的实施方案中,核苷酸接头元件包含阴离子芳香族间隔元件和防护元件两者,其中这些元件具有本文提供的定义。

结构式(i)的多磷酸酯元件包含焦磷酸盐或磷酸盐的高级同系物,如3聚体、4聚体、5聚体、6聚体、7聚体、8聚体等。因此多磷酸酯元件通常包含2个至10个磷酸盐。在优选的实施方案中,多磷酸酯元素包含4个、5个、6个、7个或8个磷酸盐。在一些实施方案中,亚甲基部分、nh部分或s部分可桥接两个或多个磷原子,从而以pch2p连接、pnhp连接、psp连接等代替pop连接。如果需要,可以对多磷酸酯元件进行进一步修饰,例如通过用碳或另一种杂原子来取代任意其他的氧原子,或者通过对任意非桥连的氧进行烷基化或其他类似的修饰。

本公开的核苷酸化合物还包括一个或多个核苷元件。如前所述,在诸如测序反应之类的酶促反应期间,核苷元件起到通过酶(如dna聚合酶)识别类似物的作用。如本领域已知的,核苷包含核苷碱基。除了天然存在的核糖核酸和脱氧核糖核酸的核苷碱基(即,腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶和尿嘧啶)以外,本发明的核苷酸化合物和类似物可以任选地包含经修饰的碱基。例如,本文所述的核苷元件可包括至少一个经修饰的碱基部分,其选自但不限于包括下列的组:5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨甲基-2-硫代尿苷、5-羧甲基氨甲基尿嘧啶、二氢尿嘧啶、β-d-半乳糖基鸟苷、肌苷、n6-异戊烯腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶,n6-腺嘌呤、7-甲基鸟嘌呤、5-甲氨基甲基尿嘧啶、5-甲氧基氨甲基-2-硫代尿嘧啶、β-d-甘露糖基核苷、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-n6-异戊烯腺嘌呤、尿嘧啶-5-氧基乙酸(v)、丁氧核苷(wybutoxosine)、假尿嘧啶、核苷(queosine)、2-硫代胞嘧啶、5-甲基-2-硫代尿嘧啶、2-硫代尿嘧啶、4-硫代尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5-氧基乙酸(v)、5-甲基-2-硫代尿嘧啶、3-(3-氨基-3-n-2-羧丙基)尿嘧啶、(acp3)w、硝基吲哚和2,6-二氨基嘌呤。

通常,本文所描述的核苷元件可以包含核糖或脱氧核糖。在一些实施方案中,核苷元件可以包含经修饰的糖部分,其选自包含下列但不限于此物质的组:阿拉伯糖、2-氟阿拉伯糖、木酮糖和己糖。

本发明的核苷酸化合物和类似物的核苷元件优选包含腺苷、鸟苷、胸苷、尿苷或胞苷,并且优选为脱氧核糖核苷,例如,da、dg、dt或dc。

结构式(i)的多价中央核心元件为结构的任选组分,其使得多个多磷酸酯元件和核苷元件能够连接至核苷酸化合物。从式(i)的结构可以清楚地看出,当存在多价中央核心元件时,其还起到末端偶联元件的附着位点的作用。

在一些实施方案中,多价中央核心元件包含多胺部分。多胺可以容易地与合适的亲电试剂(如亲电的核苷酸接头元件等)反应以生成核苷酸化合物或它们的中间体。应该理解的是,如本领域普通技术人员所理解的那样,这些反应的顺序可以根据期望的结果而变化。有效地用于本公开的多价中央核心元件中的多胺的非限制性实例包括下列多胺:

然而,本领域技术人员应理解的是,其他多胺可以容易地用于本公开的核苷酸化合物中。

在具体实施方案中,多价中央核心元件包含取代的环己烷,更具体地为1,3,5-三氨基-环己烷。

在其他具体实施方案中,多价中央核心元件包含取代的1,3,5-三嗪。

还在其他具体实施方案中,多价中央核心元件包含取代的苯。

在一些实施方案中,多价中央核心元件包含醚键。在一些实施方案中,多价中央核心元件包含酰基键。这种醚和酰基键的中央核心元件的实例包括下列结构:

如在下文和在美国专利申请公开no.2015/0050659a1中详细描述的那样,这些结构可以掺入本发明的核苷酸化合物中。特别地,可以用含有乙炔的基团(包括含有环炔的基团)来对醚键的中央核心元件进行修饰,并且可以使用“点击”化学或“无铜点击”化学将乙炔基团偶联至含有叠氮的试剂。同样地,可以使用合适的试剂对含有羧酸根的中央核心元件进行活化,然后根据需要将活化的酰基偶联至合适的亲核试剂。或者或此外,可以使用含有叠氮的基团对中央核心元件进行活化,并且可以使用“点击”化学或“无铜点击”化学将那些基团偶联至含有乙炔的试剂,包括含有环炔的试剂。对于本领域普通技术人员来说,此类反应是很好理解的。

结构式(i)的核苷酸化合物还进一步包括末端偶联元件。在一些实施方案中,末端偶联元件包含生物素。如本领域众所周知的,生物素与亲和素蛋白(如亲和素、链霉亲和素等)以高亲合力结合。在优选的实施方案中,末端偶联元件包含双生物素。将两个生物素部分偶联在双生物素末端偶联元件中的接头可以为任意合适的接头,包括上述接头。接头优选包括多价中央核心元件(如上述结构),从而使两个生物素部分互相偶联并用作末端偶联元件与核苷酸化合物其余部分的连接点。

包含双生物素的示例性末端偶联元件包括下列结构:

在结构式(i)的核苷酸化合物的实施方案中,n为1至4的整数,并且o为0或1。从结构可以清楚地看出,当n为1时,无需包含多价中央核心元件,所以o优选为0。此外,应当理解的是,当n为2至4时,化合物中优选包含多价中央核心元件,所以o应该为1。在具体实施方案中,n为2且o为1。在其他具体实施方案中,n为1且o为0。

在优选的实施方案中,本发明的核苷酸化合物不论是包括芳香族间隔元件、防护元件,还是包括芳香族间隔元件和防护元件两者作为亲合力调节元件,该核苷酸化合物都不包含荧光染料或任何其他可直接检测的标记物。

如从本公开应该理解的,结构式(i)的核苷酸化合物的末端偶联元件通常介导核苷酸化合物与本发明的标记的核苷酸类似物的其他组分的结合。例如,并且如下面将详细描述的,当末端偶联元件为生物素或双生物素时,核苷酸化合物可以以高亲合力与亲和素非共价地结合。在一些方面,本公开因此进一步提供了包含结构式(i)的核苷酸化合物和亲和素的组合物。在这些组合物中,应该理解的是,末端偶联元件不是通过核苷酸化合物与亲和素防护的结合而被共价修饰,并且因此该组合物明显包含原始核苷酸化合物和亲和素防护物作为单独的分子实体。

然而,在本公开的另一方面中,应该考虑的是,核苷酸化合物的末端偶联元件可以包含反应性官能团,其可以共价地结合到第二组分上的互补反应性基团上,例如在经适当修饰的接头元件、防护元件或染料标记的化合物上。与刚刚描述的非共价组合物不同,此类反应生成了由衍生自各组分的反应性基团的残基连接而成的新分子实体。如本说明书其他地方所述,这些残基可以包含(例如)衍生自胺基和适当活化的羧基的酰胺部分或由点击反应产生的残基。

本公开的又一方面提供了合成本发明核苷酸化合物(包括结构式(i)的核苷酸化合物)以及它们的中间体的方法。此类方法可以包括使整个说明书中说明的任意中间体化合物与第二中间体化合物反应以生成本发明的核苷酸化合物或中间体的步骤。示例性的合成途径示于下面的反应方案中、实施例中以及附图中。

染料标记的化合物

在又一方面中,本公开提供了染料标记的化合物,其用于生成本发明的标记的核苷酸类似物。

在根据本公开的这一方面的实施方案中,染料标记的化合物包含:

供体染料;

受体染料;

防护元件;

末端偶联元件;和

染料化合物接头元件;

其中染料化合物接头元件将末端偶联元件共价地连接至供体染料、受体染料或防护元件。

在其他实施方案中,染料标记的化合物为结构式为(iiia)、(iiib)、(iiic)、(iiid)或(iiie)的化合物:

其中

各l’独立地为染料化合物接头元件;

各s独立地为防护元件;

各a独立地为受体染料;

各d独立地为供体染料;

各b”独立地为末端偶联元件;

各p独立地为0或1;并且

各r独立地为0至8的整数;

其中化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。

在具体实施方案中,将至少一个受体染料或至少一个供体染料直接偶联到至少一个防护元件。

在其他具体实施方案中,各r独立地为0至8的整数。

在甚至更多的结构式为(iiia)、(iiib)、(iiic)、(iiid)和(iiie)的化合物的实施方案中,各r独立地为1或2。

在任意的染料标记的化合物实施方案中,应该理解的是,化合物可以包含超过一个供体染料、超过一个受体染料和/或超过一个防护元件。在具体实施方案中,化合物包含至少两个供体染料,并且在一些此类实施方案中,将各供体染料直接偶联至供体防护元件。更具体而言,化合物可以包含至少四个供体染料,并且在一些此类实施方案中,将各供体染料直接偶联至供体防护元件。甚至更具体而言,化合物可包含至少六个供体染料、至少八个供体染料、至少十个供体染料或甚至至少十二个供体染料。在一些此类实施方案中,可以将各供体染料直接偶联至供体防护元件。

在一些具体实施方案中,化合物包括至少两个受体染料,并且在一些此类实施方案中,将各受体染料直接偶联至受体防护元件。更具体而言,化合物可以包括至少四个受体染料,并且在一些此类实施方案中,可以将各受体染料直接偶联至受体防护元件上。

在一些实施方案中,化合物包括至少两个供体染料和至少两个受体染料。在更具体的实施方案中,可以将各供体染料直接偶联至供体防护元件和/或可以将各受体染料直接偶联至受体防护元件。在一些实施方案中,化合物包括至少四个供体染料和至少两个受体染料、至少六个供体染料和至少两个受体染料、至少八个供体染料和至少两个受体染料、至少十个供体染料和至少两个受体染料或者甚至至少十二个供体染料和至少两个受体染料。

在一些实施方案中,化合物还包括与一个或多个染料化合物接头元件连接而不与供体或受体染料连接的防护元件或侧链元件。特别地,可以将防护元件或侧链元件连接至两个染料化合物接头元件偶联的位置处,从而将防护元件或侧链元件置于连接到不同染料化合物接头元件上的不同染料基团之间。

还在其他实施方案中,染料标记的化合物为结构式(iiif)的化合物:

其中

各l’独立地为染料化合物接头元件;

各s独立地为防护元件;

各a独立地为受体染料;

各d独立地为供体染料;

各b”独立地为末端偶联元件;

各p独立地为0或1;并且

各r’独立地为0至4的整数;

其中化合物包括至少一个防护元件、至少一个受体染料和至少一个供体染料。

在更多的结构式(iiif)的化合物的具体实施方案中,各r’独立地为0至2的整数。

在更多的结构式(iiif)的化合物的具体实施方案中,各r’独立地为0或1。

仍在其他实施方案中,染料标记的化合物为结构式(iiig)的化合物:

其中

各l’独立地为染料化合物接头元件;

各s独立地为防护元件;

各dye独立地为受体染料或供体染料;

各b”独立地为末端偶联元件;

各p独立地为0或1;并且

各r”独立地为0至8的整数;

s为1至6的整数;并且

t为0或1;

其中化合物包括至少一个防护元件、至少一个受体染料和至少一个供体染料。

在结构式(iiig)的化合物的更具体的实施方案中,各r”独立地为0至4或0至2的整数。

在结构式(iiig)的化合物的其他更具体的实施方案中,各r”独立地为0或1。

在结构式(iiig)的化合物的一些实施方案中,s为1至4的整数。

在结构式(iiig)的化合物的一些实施方案中,化合物包含至少两个供体染料、至少四个供体染料、至少六个供体染料、至少八个供体染料、至少十个供体染料或至少十二个供体染料。在结构式(iiig)的化合物的其他更具体的实施方案中,化合物包含至少两个受体染料或至少四个受体染料。在结构式(iiig)的化合物的其他更具体的实施方案中,化合物还包含至少两个防护元件、至少四个防护元件或甚至更多个防护元件。在一些此类实施方案中,将防护元件直接偶联至供体染料或受体染料。

应该理解的是,通过“直接偶联”,供体或受体染料和防护元件相互共价地连接而没有介于中间的功能组分。然而,直接偶联可以包括短的接头基团,例如酰胺键、醚键、短烷基链等,其不会显著地使防护元件与染料分离。

本发明的染料标记的化合物的供体染料和受体染料优选为彼此之间能够发生共振能量转移的发色团。在这点上,当处于电子激发态的供体染料可通过辐射或非辐射能量转移过程将能量转移至受体染料时,认为这对染料为供体染料和受体染料。例如,发射光子的过程和涉及长程电子传递的过程都包含在共振能量转移的含义内。当供体染料和受体染料之间的距离很短时、当供体染料的发射光谱和受体染料的激发光谱充分重叠时以及当供体发射和受体激发的偶极矩彼此相对匹配时,通常发生共振能量转移。美国专利申请公开nos.2010/0255488和2012/0058469提供了fret标记的核苷酸和供体-受体配对的实例,出于所有目的,将其全部公开内容通过全文引用并入本文。

本发明的染料标记的化合物的供体染料和受体染料优选为荧光染料。虽然在一些实施方案中,染料的激发光谱和发射光谱可以在红外范围内,但是染料的激发光谱和发射光谱优选在电磁光谱的可见光区域中。本文列出的任意染料均可为作为供体或受体的fret对的组分。鉴于本公开,通过供体染料、受体染料和任意必要的防护元件和/或染料化合物接头元件上的反应性官能团使供体染料和受体染料结合,完全在本领域技术人员的能力范围内。

各种不同的荧光团为容易获得并适用于本发明的染料标记的化合物的,并且包括荧光素或罗丹明类染料、花青染料等。各种此类染料均为市售可得的,并且包括可购自gehealthcare(新泽西州皮斯卡塔韦)的cy染料,如cy3、cy5等,或可购自thermofisherscientific公司的alexa系列染料,如alexa488、500、514、532、546、555、568、594、610、633、647、660、680、700和750。这些荧光团可以作为单独的荧光团存在,或者它们可以以相互作用的对或组的形式存在,例如作为荧光共振能量转移(fret)对。

在优选的实施方案中,荧光染料为花青染料,例如下列中公开的任意花青染料:pct国际公布no.2012/027618;美国专利申请公开no.2012/0058469;美国专利申请公开no.2012/0058482;以及美国专利申请公开no.2012/0052506;出于所有目的,将其各自的公开内容通过全文引用并入本文。另外的有效地掺入本发明的染料标记的化合物的长波杂芳基花青染料公开于美国专利申请公开no.2014/0005404a1中,出于所有目的,将其全部公开内容通过引用并入本文。

如本文所用,因此术语“花青”是指聚甲炔染料,如基于花青、部花青、苯乙烯基和氧杂菁环的那些染料。花青染料包括(例如)cy3、cy3.5、cy5和cy5.5型染料。

示例性花青染料具有下式结构:

其中a环和b环独立地选自单环、双环或多环芳基或杂芳基部分。q为取代或未取代的次甲基部分(例如,-(ch=c(ru))c-ch=),其中c为选自1、2、3、4或5的整数。各ru、rw、rx、ry和rz独立地选自各种合适的取代基,并且指数w和z独立地选自0至6的整数。

在一些实施方案中,各rw和rz独立地为取代的或未取代的烷基、杂烷基、芳基或杂芳基,rw和rz直接偶联至a环或b环,或者通过羰基、酰胺、脲、酯、硫酯、醚、硫醚或氨基键偶联至a环或b环。

在一些实施方案中,各rx和ry独立地为烷基或杂烷基,任选地被磺酸、羧酸、膦酸或磷酸取代。

在一些实施方案中,各ru独立地为氢、烷基或杂烷基。

在上文列出的专利公开中更完全地描述了具体实施方案。本公开的染料标记的化合物中有效地包括的染料为表1所示的染料。

表1:示例性荧光染料。

本发明的染料标记的化合物的防护元件可以为在以上核苷酸化合物的情况下描述的任意防护元件,但不限于此。美国专利申请公开nos.2015/0050659a1和2016/0237279a1中也描述了防护元件。

在一些染料标记的化合物实施方案中,防护元件减少了染料标记的化合物或与染料标记的化合物相关的生物分子的光损伤。在一些化合物实施方案中,防护元件提高了染料标记的化合物的亮度。

在具体化合物实施方案中,防护元件包括多个侧链。在一些实施方案中,至少一个侧链的分子量为至少300。在其他实施方案中,所有侧链的分子量为至少300。在一些实施方案中,至少一个侧链包含聚乙二醇。在一些实施方案中,至少一个侧链包含带负电荷的组分。更具体而言,带负电荷的组分可以包含磺酸。在一些实施方案中,至少一个侧链包含取代的苯基,更具体地为下列结构:

其中各x独立地为1至6的整数。甚至更具体而言,各x可以独立地为1至4的整数。在一些实施方案中,至少一个侧链包含三唑,并且在一些实施方案中,至少一个侧链可以包含下列结构:

在一些染料标记的化合物实施方案中,防护元件包含下列结构:

其中各y独立地为1至6的整数。

在其他实施方案中,防护元件包含下列结构:

本发明的染料标记的化合物的防护元件可以另外或可选地包含树枝状大分子结构,包括以上在核苷酸化合物的情况下描述的任意树枝状大分子结构。用于生成本公开的含有树枝状大分子的染料标记的化合物的中间体化合物的实例如下:

该结构包含两个上述g3树枝状侧链和四个供体荧光团及其相关的防护元件。其代表图7g的左图所示的中间体化合物的高度支化的变型。

本发明的染料标记的化合物还进一步包括染料化合物接头元件。如本领域普通技术人员所理解的那样,染料化合物接头元件可以为上文定义的任意接头。染料化合物接头元件用于将一个或多个末端偶联元件与一个或多个供体染料、一个或多个受体染料以及一个或多个防护元件共价连接。如本领域技术人员在基于以下例举的染料标记的化合物的考虑所理解的,在一些化合物实施方案中,可能需要多于一个染料化合物接头元件来连接不同组分。

在一些实施方案中,染料化合物接头元件包含下列结构:

其中各z独立地为1至8的整数。在更具体的实施方案中,各z独立地为1至4的整数。如在本文所述的一些化合物实例中显而易见的,染料化合物接头元件可以进一步包含氨烷基或二氨烷基。染料化合物接头元件可以可选地或额外地包含其他接头基团,例如酰烷基、二酰烷基或任意其他合适的接头基团,包括美国专利申请公开no.2015/0050659a1和美国专利申请公开no.2016/0237279a1中描述的支化基团以及上文所述的多价中央核心元件。在一些化合物实施方案中,两个或多个染料化合物接头元件彼此共价地偶联。

在具体实施方案中,染料化合物接头元件包含下列结构:

并且在一些实施方案中包含下列结构:在一些实施方案中,染料化合物接头元件包含下列结构:一些染料化合物连接基元件可以包含超过一个以上结构,并且不同的染料化合物接头元件可以存在于本发明的化合物的单个分子中。

染料标记的化合物还进一步包含末端偶联元件。应该理解的是,末端偶联元件可以为以上在核苷酸化合物的情况下描述的任意末端偶联元件,但不限于此。在一些实施方案中,化合物包含两个末端偶联元件。在一些实施方案中,末端偶联元件包含生物素。在优选的实施方案中,末端偶联元件包含双生物素,并且特别是上文所示的双生物素结构的一者。

包含双生物素末端偶联元件、至少一个受体染料、至少一个供体染料和至少一个染料化合物接头元件的示例性染料标记的化合物包括以下化合物:

其包括一个未防护的供体染料和一个未防护的受体染料;

其包括两个未防护的供体染料和一个未防护的受体染料;

其包括两个未防护的染料和两个未防护的受体染料;

其包括两个未防护的供体染料和一个有防护的受体染料;

其包括两个有防护的供体染料和一个未防护的受体染料;

其包括两个有防护的供体染料和两个未防护的受体染料;

其包括两个未防护的供体染料和两个有防护的受体染料;

其包括两个有防护的供体染料和一个有防护的受体染料;

其包括两个有防护的供体染料和一个有防护的受体染料;以及

其包括两个有防护的供体染料和两个有防护的受体染料。

将其他示例性染料标记的化合物作为示于图3a至图3o’和图7a至图7d、图7f和图7g中的以及图示于图4a至图4c和图5a至图5m的化合物中的标记的核苷酸类似物的组分进行说明。

在优选的实施方案中,本发明的染料标记的化合物不包含多磷酸酯元件或核苷元件。

如以上在本发明的核苷酸化合物的情况下描述的,本发明的染料标记化合物的末端偶联元件通常介导染料标记的化合物与本发明的标记的核苷酸类似物的其他组分的结合。例如,并且已在本公开的其他地方描述,其中末端偶联元件为生物素或双生物素,染料标记的化合物可以以高亲合力与亲和素非共价地结合。在一些方面,本公开因此进一步提供了包括本公开的染料标记的化合物和亲和素的组合物。应该理解的是,在这些组合物中,末端偶联元件不是通过染料标记的化合物与亲和素结合而共价修饰,并且因此该组合物明显包括作为单独的分子实体的原始的染料标记的化合物和亲和素。

然而,在本公开的另一方面,应该考虑染料标记的化合物的末端偶联元件可以包含反应性官能团,其可以共价地结合到第二组分上的互补反应基团上,例如在适当经修饰的接头元件、防护元件或核苷酸化合物上。与刚刚描述的非共价组合物不同,此类反应生成了由衍生自各组分的反应性基团的残基连接而成的新分子实体。如本说明书其他地方所述,这些残基可以包含(例如)衍生自胺基团和适当活化的羧基基团的酰胺部分或由点击反应产生的残基。

本公开的又一方面提供了本发明的染料标记的化合物以及它们的中间体的合成方法。此类方法可以包括使整个说明书中说明的任意中间体化合物与第二中间体化合物反应以生成本发明的核苷酸化合物或中间体的步骤。示例性的合成途径示于下面的反应方案中、实施例中以及附图中。

核苷酸化合物和染料标记的化合物及类似物的合成与组装

另一方面,本公开提供了合成和组装本文公开的化合物和标记的核苷酸类似物的方法。这些化合物和类似物容易用标准化学技术制备。美国专利申请公开no.2015/0050659a1和美国专利申请公开no.2016/0237279a1中提供了可适用于制备本发明化合物的合成反应的详细实例。例如,可以根据方案1所示的反应来合成示例性防护元件的中央核心:

方案1

例如,根据方案2所示的反应,可以合成防护元件侧链的核心组分:

方案2

例如根据方案3-1或方案3-2,可以合成经核苷六磷酸盐修饰的防护元件:

方案3-1

方案3-2

从上文描述可以理解,方案3-1和3-2中所示的最终结构内的防护元件表示“分层的”防护元件。

在方案3-1的前两个反应循环的初始步骤中所使用的防护核心元件试剂(tfa-sh-conhs)可以通过方案1的“sh”防护核心元件与tfa–nhs反应生成,从而形成下列结构:

sg1-n3的结构为:

peg7-n3的结构为:

n3-aba-conhs的结构为:

nh2-14c-dn6p表示含有末端为氨基的14个碳(或等同的)接头链的六磷酸脱氧核苷酸。这种结构的示例性物质为:

其中碱基为胸腺嘧啶,并且c-14接头链包含酰胺键。

方案4-1至4-3概述了用于生成含有防护元件的试剂的可替代的途径,所述试剂可用于本公开的各种化合物的合成:

方案4-1

方案4-2

方案4-3

根据上述方案制备的防护元件相当于“分层的”防护物,但是如果需要,可以适当地改变合成反应以生成非分层的防护物。

方案5概述了可用于生成方案4-1至4-3的含有叠氮的侧链试剂(例如,r1-n3和r2-n3)的示例性合成反应:

方案5

应该认为所有上述防护组分中间体结构的合理变化都在本公开的范围内。

方案6示出了生成其他叠氮中间体的示例性合成方案:

方案6

方案7-1和7-2示出了用于制备刚刚描述的防护元件的组分的示例性反应:

方案7-1

方案7-2

方案8示出了用于制备本发明核苷酸化合物和染料标记的化合物的变型防护元件的组分的可替代的反应顺序,其中用一当量的烷基化试剂进行初始步骤,从而引发4-羟基处的选择性反应。如本领域已知的,选择性烷基化反应可以更普遍地用于本发明化合物的制备,以实现增加的分子多样性。

方案8

方案9示出了用于制备本发明化合物和标记的核苷酸类似物的树枝状大分子侧链取代基的示例性合成路线。

方案9

在该反应方案中,通过在所示反应的可替代形式中使用下列示例性可替代试剂可以实现结构的进一步可变性:

在方案10的合成途径中示出了作为接头的具有双官能反应性的树枝状大分子的生成,其中可以通过除去boc基团选择性地对所示产物进行脱保护:

方案10

通常应该理解的是,如本领域技术人员所理解的那样,其他偶联化学也可以证明适用于合成本公开的化合物。因此,可以使用上述合成方案中例举的反应以外的反应,对此没有限制。

图6a图示了有效地掺入本公开的染料标记的化合物和类似物中的示例性的有防护的染料标记的中间体化合物。例如,该特定中间体已被用于生成图5g所示的染料标记的化合物和图3k所示的标记的核苷酸类似物。图6b提供了对应于图6a的图示的示例性化学结构,其包括防护元件,该防护元件包括直接偶联至染料的防护的核心元件、包含两个反应性叠氮基的染料化合物接头元件中间体以及连接在染料化合物接头元件上的另一个小侧链。如将在下面说明,并示于图7a至图7d、图7f和图7g的那样,在该示例性中间体化合物中,可以使用“点击”反应将叠氮基偶联至其他染料标记的中间体化合物或偶联至末端偶联元件,如包含双生物素的末端偶联元件。如果需要,防护元件的侧链可以进一步变化。例如,图6c的示例性化学结构的侧链小于图6b的结构中的侧链,而图6d的侧链大于图6b的结构中的侧链。这些实例中侧链的不同尺寸由图6b和图6d的结构中的较大侧链中包含的一个或多个侧链核心结构引起。此处,再次应该理解的是,虽然图6a示出了两个大侧链和一个小侧链,由此对应于图6b的化学结构,但是不应该将本公开中提供的图示视为对这些图示中所表示的组分的尺寸或确切位置的限制。

图6e示出了另一种示例性有防护的染料标记的中间体化合物的合成方案,该中间体化合物含有四个有防护的供体染料和双生物素结合元件。最终产物也在图示中示出。要注意的是,该中间体化合物含有环辛炔末端基团,因此适于使用无铜点击反应与叠氮取代的组分反应。含有四个有防护的供体染料和两个叠氮末端基团的不同的示例性中间体化合物示于图6f中。

可以使用上述组分(包括核苷酸化合物、染料标记的化合物和用于合成这些化合物的化学中间体)来组装本公开的标记的核苷酸类似物,例如使用图7a至图7d和图7f中概述的步骤。如图7a所示,可以由第一染料标记的中间体化合物开始制备包含dg和dt的示例性标记的核苷酸类似物,第一染料标记的中间体化合物包括两个有防护的供体染料、末端偶联元件(例如,双生物素)以及中间带有反应性端基的染料化合物接头元件。在示例性dg核苷酸类似物的制备中,染料标记的中间体首先与以球形结构表示的亲和素复合。接着将第二个染料标记的中间体化合物偶联至部分地组装的类似物,所述中间体化合物含有由染料化合物接头元件连接的两个未防护的受体染料,所述接头元件中间带有两个反应性端基。使用过量的复合的第一染料标记的中间体和亲和素进行该偶联反应,使得第二染料标记的中间体化合物的两个反应性端基都被两个第一中间体染料标记的化合物的反应性基团所修饰。偶联反应优选为铜催化的或无铜点击反应,但是可以使用其他合适的偶联反应来生成中间体复合物。然后将该复合物(其包括两个亲和素蛋白和染料标记的化合物,该染料标记的化合物包含两个未防护的受体染料、四个有防护的供体染料、三个偶联的染料化合物接头元件和两个双生物素末端偶联元件)与过量的dg核苷酸化合物反应以生成最终的dg类似物产物。图7a和图7b所示的全部类似物中使用的核苷酸化合物包括单个核苷元件(dg、dt、da或dc)、多磷酸酯元件、包含阴离子芳香族间隔元件和防护元件的核苷酸接头元件以及双生物素末端偶联元件。

可以(例如)通过图7a右侧所示的途径来制备示例性dt核苷酸类似物。根据该途径,首先将第一染料标记的中间体偶联至第二染料标记的中间体化合物,第一染料标记的中间体包括两个有防护的供体染料、末端偶联元件(例如,双生物素)和中间具有反应性端基的染料化合物接头元件,第二染料标记的中间体化合物包括由染料化合物接头元件中间体连接的两个未防护的受体染料,所述接头元件中间体具有两个反应性端基。过量的偶联反应的产物与亲和素蛋白复合,以生成复合物,其包括一个亲和素蛋白和两个部分地偶联的染料标记的化合物中间体。接着将该复合物与过量的来自第一途径的第一亲和素蛋白复合物偶联,所述第一亲和素蛋白复合物包含一个亲和素蛋白和中间具有两个有防护的供体染料的染料标记的复合物。如图所示,该偶联反应的产物包含三个亲和素蛋白和两个上述用于dg类似物的染料标记的化合物。因为dt类似物含有两个染料标记的化合物,而dg类似物仅含有一个染料标记的化合物,所以可以通过各复合物发射的荧光信号强度的差异来相互区分dg类似物和dt类似物。dg类似物和dt类似物中的各染料标记的化合物分别包括四个有防护的供体染料和两个未防护的受体染料。

可以如图7b的示例性途径中概述的那样对da类似物和dc类似物进行组装。图7b的途径和图7a的途径之间的主要差别在于使用包括两个未防护的供体染料的第一染料标记的中间体化合物。该第一中间体在其他方面与图7a的第一染料标记的中间体(其包括包括有防护的供体染料)相同。相比于图7a的包括两个未防护的受体染料第二中间体,途径中的其他差别为使用包括两个有防护的受体染料的第二染料标记的中间化合物。因为dc类似物含有两个染料标记的化合物,而da类似物仅含有一个染料标记的化合物,所以可以通过各复合物发射的荧光信号强度的差异来相互区分da类似物和dc类似物。da类似物和dc类似物中的各染料标记的化合物分别包括四个未防护的供体染料和两个有防护的受体染料。与dg类似物和dt类似物一样,可以通过各复合物发射的荧光信号的强度差异来相互区分da类似物和dc类似物。由于有防护的染料的不同微环境,基于不同染料标记的化合物的光谱差异,dg类似物可以与da类似物相区分,并且dt类似物可以与dc类似物相区分。

图7c和图7d示出了可用于类似物的组装的可替代的途径,所述类似物包含示例性标记的dt、dg、dc和da核苷酸类似物。图7e提供了图例,用于说明图中的一些示例性图示与那些图中所示的组分的化学结构之间的关系。图7f示出了又一些示例性组分和途径,其已用于制备本公开的标记的核苷酸类似物。

聚合酶

可以优化本文公开的标记的核苷酸类似物并使其适用于特定的聚合酶,特别是通过类似物的核苷酸化合物组分的结构调节。此外,聚合酶本身可以通过定向突变而适用于本公开的类似物。具体而言,各种天然的和经修饰的聚合酶在本领域是已知的,并且这些酶的结构和功能特性是很好理解的。根据与以下物质的系统发育关系,有时可将dna聚合酶分为六个主类:(例如)大肠杆菌(e.coli)poli(a类)、大肠杆菌polii(b类)、大肠杆菌poliii(c类)、广古生菌(euryarchaeotic)polii(d类)、人polβ(x类)以及大肠杆菌umuc/dinb和真核生物的rad30/着色性干皮病的变体(y类)。关于命名法的综述,参见(例如)burgers等(2001)“eukaryoticdnapolymerases:proposalforarevisednomenclature”jbiolchem.276(47):43487-90。关于聚合酶的综述,参见(例如)hübscher等(2002)“eukaryoticdnapolymerases”annualreviewofbiochemistryvol.71:133-163;alba(2001)“proteinfamilyreview:replicativednapolymerases”genomebiology2(1):reviews3002.1-3002.4;以及steitz(1999)“dnapolymerases:structuraldiversityandcommonmechanisms”jbiolchem274:17395-17398。已经确定了许多聚合酶的基本作用机制。数以百计的聚合酶的序列为公众可获得的,并且已经确定其中许多聚合酶的晶体结构,或者可以根据与同源聚合酶的已解析晶体结构的相似性来推断它们的结构。例如,根据本发明的经修饰的亲本酶的优选类型φ29的晶体结构为可获得的。许多(例如)用于测序、标记和扩增技术的聚合酶为市售可得的。示例性的有用dna聚合酶包括taq和其他热稳定聚合酶、外切核酸酶缺陷型taq聚合酶、大肠杆菌dna聚合酶i、克列诺片段、逆转录酶、sp6dna聚合酶、t7dna聚合酶、t5dna聚合酶、t4dna聚合酶、rb69聚合酶等。

特别适用于本发明的类似物的酶包括但不限于重组φ29型dna聚合酶。“φ29型dna聚合酶”(或“phi29型dna聚合酶”)为来自φ29噬菌体或来自相关噬菌体(如φ29一样,包含用于启动dna复制的末端蛋白)中的一者的dna聚合酶。φ29型dna聚合酶与φ29dna聚合酶(例如,如seqidno:1中所列的)同源;其实例包括b103、ga-1、pza、φ15、bs32、m2y(例如,如seqidno:2中所列的;也称为m2)、nf、g1、cp-1、prd1、pze、sf5、cp-5、cp-7、pr4、pr5、pr722、l17、φ21和av-1dna聚合酶,以及它们的嵌合体。例如,经修饰的重组dna聚合酶可以同源于野生型或外切核酸酶缺陷型φ29dna聚合酶,(例如)如美国专利nos.5,001,050、5,198,543或5,576,204中所述的。关于命名法,也参见meijer等(2001)“φ29familyofphages”microbiologyandmolecularbiologyreviews,65(2):261-287。经修饰的重组φ29-型dna聚合酶包括相对于天然存在的野生型φ29型dna聚合酶的一个或多个突变,例如具有下列效果的一个或多个突变:改变与核苷酸类似物相互作用和/或掺入核苷酸类似物、提高稳定性、增加读取长度、提高精确度、提高光耐受性和/或改变另一聚合酶特性,并且可以包括对野生型φ29型dna聚合酶的额外的改变或修饰,如额外的肽或蛋白质序列(例如,用于将聚合酶固定在表面上或以其他方式标记聚合酶)的一个或多个缺失、插入和/或融合。

例如,可用于本发明类似物的重组聚合酶可以与野生型φ29型聚合酶同源(例如,具有至少60%、至少70%、至少80%、至少90%、至少95%、至少98%或甚至至少99%的同一性),例如与seqidno:1-6中的一者同源。如使用序列比较算法或通过肉眼观察所测量的,当比较和比对两个序列获得最大一致性时,即确定氨基酸残基具有同一性。优选地,同一性存在于长度为至少约50个残基的序列区域,更优选为至少约100个残基的区域,并且最优选为至少约150个残基的序列区域,或在进行比较的两个序列的全长上。

作为参考,将野生型φ29聚合酶的氨基酸序列连同几种其他的野生型φ29型聚合酶的序列一起列于表2中。

表2:示例性野生型φ29型聚合酶的氨基酸序列

相比于参照聚合酶(例如,野生型φ29型聚合酶,例如seqidnos:1-6中的一者),可用于本公开类似物的重组聚合酶(例如,重组φ29型dna聚合酶)通常包括一个或多个突变(例如,氨基酸置换、缺失或插入)。取决于特定的突变或突变的组合,聚合酶表现出可用于(例如)单分子测序用途或核酸扩增的一种或多种性质。此类聚合酶在dna扩增期间使核苷酸和/或核苷酸类似物(例如,本文所述的类似物)掺入到生长的模板拷贝中。对此类聚合酶进行修饰,使得它们相比于相应的野生型或其他亲本聚合酶(例如,通过(例如)突变由其衍生出本发明的经修饰的重组聚合酶的聚合酶)具有一种或多种理想的性质,例如,对本发明的核苷酸类似物的改进的测序性质、增加的读取长度、增强的热稳定性、增强的抗光损伤性、当掺入相关类似物时减少的支化部分的形成、改进的dna聚合酶复合物稳定性或持续合成能力、增强的共溶剂抗性、降低的外切核酸酶活性、增加的产量、改变的辅因子选择性、提高的精确度、增加或降低的速度和/或改变的动力学性质(例如,聚合酶动力学的一步或多步中速度的降低,其由(例如)聚合酶与核苷酸类似物的增强的相互作用、增强的金属配位作用所引起)。

示例性聚合酶包括重组φ29型dna聚合酶,其包括在选自由下列构成的组中的一个或多个位置上的突变(例如,氨基酸置换):a68、c106、a134、k135、l142、y224、e239、v250、l253、a256、r261、r306、r308、l326、t368、t373、e375、t421、w436、a437、y439、t441、c448、e466、d476、a484、s487、e508、d510、k512、e515、k539、p558、d570和t571,其中相对于野生型φ29聚合酶(seqidno:1)来确定这些位置。任选地,聚合酶包含在两个以上、三个以上、五个以上、10个以上、15个以上、20个以上或者甚至25个以上的这些位置上的突变。本文描述了在这些(和其他)位置处的许多示例性置换。在以下情况下,给出的氨基酸或核苷酸聚合物的编号“相当于选定的氨基酸聚合物或核酸的编号”或者“与选定的氨基酸聚合物或核酸相关”:即给出的任意聚合物组分(氨基酸残基、掺入的核苷酸等)的位置是通过参照选定的氨基酸或核苷酸聚合物中的相同残基位置而指定的,而不是通过给出的聚合物中组分的实际位置而指定的。类似地,在以下情况下,给出的氨基酸或核苷酸聚合物中的给出位置的确定“与选定的氨基酸或核苷酸聚合物有关”:即任意给出的聚合物组分(氨基酸残基、掺入的核苷酸等)的位置是通过参照选定的氨基酸或核苷酸聚合物中的残基名称和位置而指定的,而不是通过给出的聚合物中组分的实际名称和位置而指定的。通常通过比对相关的氨基酸或多核苷酸序列来确定位置的对应性。例如,相对于野生型φ29聚合酶(seqidno:1),将野生型m2y聚合酶(seqidno:2)的残基k221指定为y224位。类似地,相对于野生型φ29聚合酶(seqidno:1),将野生型m2y聚合酶(seqidno:2)的残基l138指定为v141位,由此,相对于seqidno:1,将m2y聚合酶中的l138k置换指定为v141k置换。除非另有明确说明,否则通常相对于seqidno:1来指定本文中的氨基酸位置。

作为一些实例,在e375处的突变可以包含选自由下列构成的组中的氨基酸置换:e375y(即,酪氨酸残基存在于e375位,其中相对于seqidno:1来确定位置)、e375f、e375w、e375h和e375m;k512位的突变可以包含选自由下列构成的组中的氨基酸置换:k512y、k512f、k512h、k512w、k512m和k512r;l253位的突变可以包含l253a置换;a484位的突变可以包含a484e置换;和/或d510位的突变可以包含d510k或d510r置换。其他示例性取代包括(例如)a68s、c106s、a134s、k135q、k135r、l142r、l142k、y224k、e239g、v250i、a256s、r261k、r306q、r308l、l326v、t368s、t373f、t421y、w436y、a437g、y439w、t441i、c448v、e466k、d476h、s487a、e508r、e508q、e515q、k539e、p558a、d570s和t571v;本文描述了其他的置换。

本文提到的聚合酶突变可以互相组合并且可以与基本上任何其他可获得的突变和突变策略组合,从而在以下方面得到另外的改进性质:(例如)核苷酸类似物特异性、酶持续合成能力、在聚合酶-dna-核苷酸复合物中改进的标记的核苷酸的保留时间、光耐受性等。例如,本文中的突变和突变策略可以与下列文献中的教导组合:(例如)美国专利申请公开no.2007/0196846;美国专利申请公开no.2008/0108082、美国专利申请公开no.2010/0075332、美国专利申请公开no.2010/0093555、美国专利申请公开no.2010/0112645、美国专利申请公开no.2011/0189659、美国专利申请公开no.2012/0034602、美国专利申请公开no.2013/0217007、美国专利申请公开no.2014/0094374和美国专利申请公开no.2014/0094375。出于所有目的,将这些申请中的每一个通过全文引用并入本文。突变/突变策略的此类组合可以用于赋予聚合酶以若干同时产生的改进性质(例如,对于所需类似物的增加的效用、增加读取长度、增强的光耐受性、减少的支化部分的形成、增强的特异性、改进的持续合成能力、改变的速率、改进的保留时间、封闭式复合物改进的稳定性、对特定金属辅因子的耐受性等)。此外,可以出于特殊用途的原因对聚合酶进行进一步修饰,如(例如)美国专利申请公开no.2010/0261247和美国专利申请公开no.2010/0260465(出于所有目的,将其中的每一个通过全文引用并入本文)中教导的那样,如当聚合酶结合至表面时,对酶的活性进行改进;和/或如引用文献中教导的或本领域常见的那样,进行包括纯化或处理标记。聚合酶可以包括一个或多个外源或异源特征,例如在聚合酶的n末端区域、在聚合酶的c末端区域和/或在聚合酶内部。此类特征不仅可用于重组聚合酶的纯化和/或聚合酶在基底上的固定,还可以改变聚合酶的一种或多种性质。关于此类特征的结合的其他信息,参见(例如)美国专利申请公开公开nos.2012/0034602和2014/0094375(出于所有目的,将其中的每一个通过全文引用并入本文)。类似地,本文描述的经修饰的聚合酶可以与其他策略组合使用以改善聚合酶的性质,所述策略例如,如美国专利申请公开号2009/0286245(出于所有目的将其通过全文引用并入本文)中教导的那样,用于控制聚合酶速率常数的反应条件。

如上所述,本文描述的各种突变可以在可用于本发明的重组聚合酶中组合。突变的组合可以为随机的,或者更理想的是以特定突变的特性和所得的聚合酶的所需特征为指导。还可以将另外的突变引入聚合酶中,以弥补其他所需突变的有害作用。例如,w436y置换可以减少支化部分,但会诱导暂停,y439w可以减少暂停但也会降低产量,而r261k可以提高产量;因此,w436y/y439w/r261k组合可能是理想的。

本文描述了许多示例性突变以及这些突变所赋予的性质,并且显而易见的是,这些突变可以以许多不同组合方式有利地组合。本文还(例如)在表3中提供了示例性组合,以及随后易于衍生出其他有利的组合的策略实例。为了简单起见,讨论了仅使用几个示例性突变的几个示例性组合,但显而易见的是,本文描述的任意突变均可用于此类策略,以生成具有理想性质的聚合酶。

例如,在需要将重组聚合酶掺入本发明的类似物的情况下,可以掺入一个或多个置换,其通过以下作用来增强类似物结合:与末端磷酸盐上芳香族基团的相互作用、与芳香族基团上的带电荷的取代基的相互作用和/或与类似物上其他部分的取代基的相互作用,所述置换例如在下列位置处的氨基酸置换:k135、l142、t373、e375和/或k512,例如k135q、k135r、l142r、l142k、t373f、e375y、e375f、e375w、e375h、e375m、d510r、k512y、k512f、k512h、k512w、k512m和/或k512r。如图8所示,将包括e375y和k512y置换的聚合酶中的酪氨酸残基定位成与含有disc的六磷酸盐类似物上的disc基团堆叠。此外,135位的赖氨酸与disc磺酸根基团形成盐桥。如图9所示,在包括e375w、k512f和l142r置换的聚合酶中,将色氨酸环和苯丙氨酸环定位成与disc基团堆叠,而142位的精氨酸可与类似物上其他位置的sg1基团形成盐桥。如图10所示,在包括e375w、k512h和k135r置换的聚合酶中,将色氨酸环和组氨酸环再次定位成与disc环相互作用,并且135位的精氨酸与disc磺酸根基团形成盐桥。如图11a所示,在包括e375y、k512y和d510r置换的聚合酶中,酪氨酸残基可以与4,8-二磺基萘-2,6-二羧酸(“dsdc”)间隔基团堆叠。

510位的精氨酸可以与dsdc磺酸根基团中的一者形成盐桥,并且375位的酪氨酸可以与该磺酸根形成氢键。135位的赖氨酸可以与另一个dsdc磺酸根基团形成盐桥,其也可以与512位的酪氨酸形成氢键。类似地,如图11b所示,在包括e375y、k512y、d510r和k135r置换的聚合酶中,酪氨酸残基可以与dsdc基团堆叠。510位精氨酸可以与dsdc磺酸根基团中的一者形成盐桥,其也可以与375位的酪氨酸形成氢键。135位的精氨酸可以与另一个dsdc磺酸根基团形成分叉盐桥,其也可以与512位的酪氨酸形成氢键。还可以将其他增强类似物结合的置换(例如a484e)掺入聚合酶中。

在含有mg 的单分子测序反应中,期望聚合酶掺入类似物的情况下,可以掺入一个或多个改变金属辅因子用途的置换(例如,l253a、l253h、l253c或l253s)。可以通过包含诸如a437g、e508r、e508k、l142k、d510r、d510k和/或v250i之类的置换来提高聚合酶速度。可以通过包含诸如e515q和/或a134s之类的置换来提高精确度。可以通过包含诸如d570s和/或t571v之类的置换来提高持续合成能力。可以通过包含诸如y224k、e239g和/或v250i之类的置换来提高稳定性和/或产量。还可以通过(例如)使用m2y作为亲本聚合酶和/或包括增强稳定性的外源特征(例如,c末端外源特征,例如,his10或其他聚组氨酸标签)来提高稳定性。使用大的类似物(例如,包括蛋白质部分的类似物)会不利地使脉冲宽度变窄并使脉冲间隔距离增大,因此聚合酶中可以包括一个或多个能够增加脉冲宽度(例如,p558a、a256s和/或s487a)的置换,或者能够减小脉冲间隔距离或减少暂停的取代(例如,l142k、r306q、r308l、t441i、c448v、e466k、d476h和/或e508r)。关于脉冲宽度和脉冲间隔距离的讨论,参见(例如)美国专利申请公开no.2014/0094375(出于所有目的,之前已将其通过全文引用并入本文)。

显而易见的是,涉及重组聚合酶的不同用途需要不同的聚合酶性质以及由此而来的不同的突变组合。如所理解的那样,聚合酶可以表现出前述性质中的一者,或者可以以组合的形式表现出两种或更多种性质。此外,应该理解的是,虽然可以针对特定性质对特定的突变或聚合酶进行描述,但为了便于讨论,突变或聚合酶可以具有未在每种情况下提及的另外的经修饰的性质。还应理解的是,特定的性质是在某些条件下观察到的。例如,当在热失活试验中观测时,稳定性改善突变可以(例如)赋予聚合酶-dna底物二元复合物(相比于含有缺少该突变的亲本聚合酶的该复合物)以增强的稳定性,或者当在单分子测序反应中观测时,在亲本聚合酶-dna底物二元复合物的寿命(且由此所致的读取长度)因其稳定性而受限的情况下,所述稳定性改善突变可以赋予增加的读取长度。单个突变(例如,单个氨基酸置换、缺失、插入等)可以引起一种或多种改变的性质,或者所述一种或多种性质可以由两个或多个突变造成,这些突变为赋予理想的活性而共同起作用。

表3提供了示例性突变及其组合的列表,并且本文还描述了其他的示例性突变。基本上,可以将这些突变中的任一者或其任意组合引入聚合酶中,以生成经修饰的重组聚合酶(例如,引入野生型φ29聚合酶、野生型m2聚合酶、外切核酸酶缺陷型φ29聚合酶或外切核酸酶缺陷型m2聚合酶,这仅为少数实例)。

表3:引入φ29dna聚合酶中的示例性突变。相对于seqidno:1来指定位置。

表4和5提供了具有表3的示例性突变组合的示例性重组φ29聚合酶的氨基酸序列。表4包括分子的聚合酶部分以及一个或多个位于聚合酶的c末端区域的外源特征,而表5仅包括聚合酶部分的氨基酸序列。

表4:包括c末端外源特征的示例性重组φ29聚合酶的氨基酸序列。

相对于seqidno:1来确定氨基酸位置。

表5:示例性重组φ29聚合酶的氨基酸序列。相对于seqidno:1来确定氨基酸位置。

本公开的特征为组合物、试剂盒和系统(例如,测序系统),它们包括此类重组聚合酶(例如)与一种或多种本发明标记的核苷酸类似物的组合,以及使用重组聚合酶的方法(例如,测序方法或形成dna的方法)。包括这些突变和/或本文其他地方描述的突变的许多其他此类重组聚合酶是显而易见的并且为本公开的特征。

在存在和缺乏核苷三磷酸的情况下,可得到φ29聚合酶的结构、φ29聚合酶与末端蛋白复合的结构以及φ29聚合酶与引物模板dna复合的结构;分别参见kamtekar等(2004)“insightsintostranddisplacementandprocessivityfromthecrystalstructureoftheprotein-primeddnapolymeraseofbacteriophageφ29”mol.cell16(4):609-618)、kamtekar等(2006)“thephi29dnapolymerase:protein-primerstructuresuggestsamodelfortheinitiationtoelongationtransition”emboj.25(6):1335-43和berman等(2007)“structuresofphi29dnapolymerasecomplexedwithsubstrate:themechanismoftranslocationinb-familypolymerases”emboj.26:3494-3505。可以(例如)根据与结构已经确定的聚合酶的聚合酶同源性对其他聚合酶或复合物的结构进行建模。或者,可以使用本领域已知的技术来确定给定聚合酶(例如,野生型或经修饰的聚合酶)的结构,其任选地与dna(例如,模板和/或引物)和/或核苷酸类似物等复合。参见(例如)美国专利申请公开no.2014/0094375及其中的参考文献。

可以将突变引入所需的亲本聚合酶中并且可以使用本领域已知的技术对所得的重组聚合酶进行表达、纯化和表征(例如,为了确定(例如)本发明的类似物的一个或多个特性)。参见(例如)美国专利申请公开nos.2007/0196846、2008/0108082、2010/0075332、2010/0093555、2010/0112645、2011/0189659、2012/0034602、2013/0217007、2014/0094374和2014/0094375(出于所有目的,之前已通过全文引用并入本文)和其中的参考文献。

用于核酸测序的反应混合物、方法和系统

另一方面,本公开还提供了用于核酸测序中的反应混合物。此类混合物优选包含聚合酶复合物,其包括聚合酶、模板核酸和任选的与模板核酸杂交的引物。理想地构造此类聚合酶复合物用于诸如zmw的表面之类的表面上的固定。反应混合物还包含与固定有聚合酶复合物的表面相接触的测序试剂。测序试剂包括用于进行核酸合成的核苷酸,特别是上文详细描述的两个或多个标记的核苷酸类似物。例如,美国专利申请公开no.2013/0316912a1提供了涉及反应混合物的进一步细节,包括优选的模板核酸、聚合酶、用于将聚合酶复合物固定至表面的方法、反应条件(包括缓冲液、ph、盐等)。上文描述了可有效地包括在本发明反应混合物中的示例性突变聚合酶,以及包含本发明的经修饰的核苷酸化合物的类似物。

在具体实施方案中,反应混合物的标记的核苷酸类似物包含至少一种染料标记的化合物和至少一个核苷酸化合物,其中上文描述了所述至少一种染料标记的化合物和所述至少一种核苷酸化合物。在更具体的实施方案中,各染料标记的化合物和各核苷酸化合物分别包含双生物素部分。

又一方面,本公开还进一步提供了用于对核酸模板进行测序的方法。在这些方法中,提供了聚合酶复合物,其包括聚合酶、模板核酸和任选的与模板核酸杂交的引物。在一些实施方案中,将聚合酶复合物固定在表面上。将测序试剂添加到聚合酶复合物中,其中所述试剂包括用于进行核酸合成的核苷酸,特别是上文详细描述的两个或更多个标记的核苷酸类似物。通过观察标记的核苷酸类似物与聚合酶复合物的相互作用,从而确定核苷酸在与模板核酸链互补的核酸链上的依次添加。

在具体的方法实施方案中,测序方法的标记的核苷酸类似物包括本公开的至少一种染料标记的化合物和至少一种核苷酸化合物。在更具体的方法实施方案中,所述至少一个染料标记的化合物和所述至少一个核苷酸化合物各自包含双生物素部分。

又一方面,本公开提供了用于测序核酸的系统。此类系统优选包括芯片,该芯片包含连接到其上的多个聚合酶复合物,各聚合酶复合物单独地为光学可分辨的,各聚合酶复合物包含聚合酶、模板核酸和任选地与模板核酸杂交的引物。系统还包含与表面接触的测序试剂。测序试剂包含用于进行核酸合成的试剂,其包括上文详细描述的两个或多个标记的核苷酸类似物。该系统还包括照射系统,用于照射聚合酶复合物;光学检测系统,用于在标记的核苷酸类似物与聚合酶复合物相互作用时检测来自标记的核苷酸类似物的荧光;以及计算机,用于分析由检测系统检测的信号,从而确定核苷酸在与模板核酸链互补的核酸链上的依次添加。例如,美国专利申请公开no.2013/0316912a1进一步描述了此类系统。

对于相关领域的普通技术人员而言显而易见的是,在不脱离本发明或其任意实施方案的范围的情况下,可以对本文描述的方法和用途进行其他合适的修改和调整。现已详细描述了本发明,通过参照以下实施例将更清楚地理解本发明,这些实施例仅仅是出于说明的目的而包括在内,并不意图限制本发明。

实施例

实施例1.双生物素核苷酸化合物的合成

已经合成了各种含有双生物素接头的核苷酸化合物以用于单分子实时测序反应。已经使用亲和素蛋白将这些化合物与也包含双生物素接头的染料标记的化合物或它们的中间体形式进行组装,从而生成染料标记的核苷酸类似物复合物,例如如实施例2中所述并且如图7a至图7d和图7f所示。已根据这些方法制备的标记的核苷酸类似物的另外的例子图示于图3e至图3o’。在涉及dna聚合酶的自动dna测序反应中,许多类似物表现出改进的光稳定性、亮度和反应动力学。也参见美国专利申请公开no.2013/0316912a1。实施例3中描述了组装的荧光核苷酸试剂复合物在实时测序反应中的应用。

本公开的含有双生物素的核苷酸试剂化合物可以包括两个核苷酸臂,例如如下所示的对照-sg1x4-dg2。如该结构所示,两个核苷酸臂中的每一个可以包含鸟苷核苷、六磷酸盐链、接头基团以及一对防护元件,接头基团包括由“点击”偶联反应生成的三唑部分,各防护元件包含两个侧链(“sg1”侧链,参见上文中的反应方案),每个链包含三个阴离子侧链。已经证明,当掺入荧光核苷酸试剂化合物时,这种防护元件能够防止聚合酶的光损伤并且能够在测序反应中提供其他优点。参见(例如)美国专利申请公开nos.2015/0050659a1和2016/0237279a1。在这里发现这些基团能够调节核苷酸试剂对聚合酶的亲合力和/或使用含有这些基团的核苷酸试剂能够提供聚合酶反应动力学的其他改进。示例性对照-sg1x4-dg2化合物还含有三氨基-环己基多价中央核心元件,其为两个核苷酸臂提供支化点并且也为双生物素基团提供连接位点,三氨基-环己基多价中央核心元件本身包含三氨基三嗪多价中央核心元件,其为分子的双生物素末端偶联元件提供支化点。

对照-sg1x4-dg2

如美国专利申请公开no.2015/0050659a1通常描述的那样,进行以上试剂化合物的合成。

可选的核苷酸试剂化合物可以包括仅一个核苷酸臂,例如如下所示的对照-sg1x2-dg。在该化合物中,存在单个核苷酸臂,与上文描述的对照-sg1x4-dg2二核苷酸化合物非常相似,其中核苷连接至六磷酸盐链、接头基团和一对防护元件。然而,与二核苷酸结构不同的是,在单核苷酸化合物中,有防护的核苷酸臂直接与携带双生物素末端偶联元件的三氨基三嗪多价中央核心元件偶联。

对照-sg1x2-dg

以下变型结构也含有单个核苷酸臂,但与对照-sg1x2-dg单核苷酸化合物的不同之处在于,包括额外的防护元件对或“层”(对于分层-sg1x4-dg)或两个另外的防护元件对(对于分层-sg1x6-dg)。应该理解的是,在每种情况下,化合物延伸到末端三唑部分之外,以包括核苷酸接头元件的额外的片段、线形多磷酸酯元件和核苷。

另一种变型单核苷酸化合物在每个防护元件内包含分支或“分叉(split)”,使得另外的阴离子侧链通过支化基团连接至防护元件,所述支化基团偶联至具有多个阴离子侧链的芳香族基团。以下所示的结构split-sg1x4-dg代表完整的核苷酸试剂化合物,包括完整的核苷酸接头、多磷酸酯元件和核苷(在本实例中为“dg”核苷)。

split-sg1x4-dg

单核苷酸试剂的又一种变型结构包括试剂的核苷酸臂中的阴离子芳香族“间隔”基团。示例性结构disc-sg1x2-dg如下所示。如图所示,该结构包括连接在多磷酸酯元件上的“dg”核苷。在其他方面,其与上文所示的对照-sg1x2-dg结构相同,不同之处在于其包括1h-2,3-二氢异喹啉-8-磺基-6-羧酸(“disc”)间隔元件,该间隔元件插入对照-sg1x2-dg结构的核苷酸接头的酰胺键中的一者。

disc-sg1x2-dg

在核苷酸臂中具有阴离子芳香族间隔基团的其他变型单核苷酸试剂包括这样的化合物,即其包括至少一个防护元件。例如,以下所示的disc-split-sg1x4-da化合物包括disc-sg1x2-dg的disc基团与split-sg1x4-dg的分叉防护基团的组合。在这个特定的实例中,核苷为脱氧腺苷(“da”)核苷。分子的其余部分(特别是分叉防护元件和双生物素基团)与split-sg1x4-dg相同。

disc-split-sg1x4-da

在含有阴离子芳香族间隔基团的核苷酸化合物中的防护结构的又一种变型中,所述至少一个防护元件可以包括具有另外的阴离子侧链的三重支化结构,例如如以下disc-split-sg1x6-dg中所示,从而携带6个磺酸取代的sg1侧链。

disc-split-sg1x6-dg

可以进一步延伸防护基团的分支,例如如以下disc-split-sg1x12-dg中所示,其中侧链包含另外的支化元件,使得侧链能够携带12个磺酸取代的sg1基团。已经使用已知的反应对所有上述结构进行组装,例如使用点击化学、无铜点击化学等,例如如美国专利申请公开no.2015/0050659a1中详细描述的那样。

disc-split-sg1x12-dg

对本发明核苷酸化合物的进一步修饰包括将阴离子芳香族间隔基团掺入二核苷酸化合物的两个核苷酸接头元件中,例如如以下disc2-split-sg1x12-dg2中所示。

disc2-split-sg1x12(酰胺)-dg2

在接头元件和12个sg1防护基团元件两者中都含有阴离子芳香族间隔基团的另一种示例性二核苷酸化合物在下面显示为disc2-split-sg1x12(点击)-dg2。disc2-split-sg1x12(点击)-dg2与disc2-split-sg1x12(酰胺)-dg2的不同之处在于防护元件与核苷酸接头的偶联方式,以及接头中的中央3,4,5-三氧苯甲酰基基团的取向和连接结构。

disc2-split-sg1x12(点击)-dg2.

也已在单核苷酸化合物中比较了刚刚描述的防护基团元件与核苷酸接头的备选偶联方式以及接头中的中央3,4,5-三氧苯甲酰基基团的取向和连接结构,例如如以下disc-split-sg1x6-dg和disc-split-sg1x6-dg(点击)所示。

disc-split-sg1x6-dg

disc-split-sg1x6-dg(点击)

将上文描述的核苷酸化合物组装成标记的核苷酸类似物复合物,例如如下文实施例2中所述。然后在dna测序反应中,对这些荧光核苷酸类似物进行比较,例如如下文实施例3中所述。

实施例2.染料标记的核苷酸类似物的组装

通过将核苷酸化合物与一个或多个亲和素蛋白和一个或多个染料标记的化合物或中间体组合,将上文描述的单核苷酸化合物和二核苷酸化合物组装成染料标记的核苷酸类似物。对于实施例3中描述的大多数动力学实验,使用单个亲和素蛋白和诸如图4a中图示的染料标记的化合物之类的简单的、未防护的染料标记的化合物来组装成核苷酸化合物。可以如美国专利申请公开no.2013/0316912a1中所述进行此类组装。例如使用图7a至图7d和图7f所示的路径,还组装了更复杂的类似物结构。如实施例3中所述,也已经在动力学测序试验中对这些类似物(如图19a中描绘的类似物)进行了评价。

实施例3.在实时测序反应中染料标记的核苷酸类似物的应用

在具有3000个离散芯的零模式波导(“zmw”)阵列中进行单分子实时测序反应,该反应使用实施例2中描述的荧光核苷酸类似物。使用高度多路复用共聚焦荧光显微镜观察反应,所述显微镜提供定向的照射分布,例如每个芯为独立的点。参见(例如)美国专利no.7,714,303,出于所有目的将其通过全文引用并入本文。使用emccd照相机检测来自各种zmw的荧光信号,并且对信号进行脉冲识别和碱基判定过程。参见(例如)美国专利no.8,182,993,出于所有目的将其通过全文引用并入本文。通常如eid,j等science323:133-138以及其中包括的相应补充信息所述进行测序。

对于每个测序反应,激光功率为0.5μw/μm2至2.0μw/μm2,相机帧频为100fps。如2009年3月27日提交的美国专利no.8,236,499所述,模板为约11000kb的环形vd“smrtbell”模板。如2009年3月30日提交的美国专利no.8,257,954所述,固定在零模式波导中的聚合酶为突变的φ29聚合酶。反应混合物含有bis-trispropaneph7.5缓冲液、抗氧化剂、40mm的dtt、120mm的koac以控制离子强度;30mm的mgoac和4%至8%的有机溶剂添加剂。混合物还含有一组对应于a、g、c和t的核苷酸类似物,各自的量为150nm至400nm,并且各自具有独特的染料标记的化合物,其经由亲和素蛋白复合至核苷酸化合物。得到十分钟至120分钟的测序反应影像(movies)。收集关于亮度、动力学(脉冲宽度、脉冲间隔距离(ipd))、光物理学信号稳定性、测序错误类型、读取长度和精确度的数据。

如图12a的测序反应所示,相比于可比的二核苷酸结构(情况2),简单的单核苷酸类似物结构使测序反应的精确度得到大约1%的提高(情况1)。在图12b中对数据进行直接比较,其中归一化的精确度从二核苷酸的0.893(左图)提高到单核苷酸的0.904(右图)。

同时,如图13a和图13b所示,对于四种碱基中的每一种,单核苷酸试剂和二核苷酸试剂的掺入动力学没有显着差异。作为背景技术,通常将单分子实时测序反应的动力学描述为包括可观察的阶段,其通常对应于特定阶段为可观察的时间段。明亮阶段的时间段(例如)可以由信号的脉冲宽度(pw)来表示。黑暗阶段的时间段(例如)可以由信号的脉冲间隔距离(ipd)来表示。对于各核苷酸的添加而言,各时间段的长度将不相同,从而引起这些时间段的时长分布。在一些情况下,将不会检测到时长最短的时间段,从而导致误差,例如在单分子测序中。图13a示出了比较单核苷酸类似物和二核苷酸类似物对于四种碱基(a、c、g和t)中的每一种的ipd分布曲线,其中在各组的顶部指明碱基。在这些图中,x轴与检测器帧相关,1帧等于10毫秒。y轴代表经验累积分布函数(ecdf),其为无单位的值,范围从0到1,该函数描述了以帧为单位看到某一时间段的ipd的概率。

图13b提供了每种情况的归一化ipd值,其中左边为二核苷酸类似物的情况,右边为单核苷酸类似物的情况。最左侧的一对反映出全部四种碱基的累积归一化ipd值,而其后四对反映出每个指明的脱氧核糖核苷酸各自的归一化ipd值。各碱基中的二核苷酸的浓度均为200nm,并且dc中单核苷酸为250nm,而dg、dt和da中单核苷酸为200nm。如dg的ipd分布的比较中的大箭头所示,单核苷酸略微地比二核苷酸试剂慢。

已经在单分子实时测序反应中测试了实施例1中描述的单核苷酸结构和二核苷酸结构的变型,以比较在测序反应中各种其他的结构特征对染料标记的核苷酸类似物的行为的影响。例如,图14a和图14b示出了下列类似物的掺入动力学:对照类似物(对照-sg1x4-dg2)(情况1);双层类似物(分层-sg1x4-dg)(情况2);分叉侧链类似物(split-sg1x4-dg)(情况3);以及包含disc阴离子芳香族间隔基的类似物(disc-sg1x2-dg)(情况4)。

如在图14a中显而易见的,对于含有g的单核苷酸,上述核苷酸试剂的掺入动力学以这样的顺序增大:对照-sg1x4-dg2<disc-sg1x2-dg<分层-sg1x4-dg<split-sg1x4-dg。图14b提供了这些试剂中每种的归一化ipd值的比较。如可由这些数据计算出的,相对于对照组的加速因子为:split-sg1x4-dg:1.82x;disc-sg1x2-dg:1.42x;以及分层-sg1x4-dg:1.53x。

图15a至图15c示出了掺入动力学(归一化的ipd)(图15a)、总体速率(图15b)和合并误差(图15c),其针对二核苷酸对照类似物(对照-sg1x4-dg2)(情况1)、具有六个防护基团但没有阴离子芳香族间隔基的单核苷酸类似物(情况2)、具有四个防护基团和阴离子芳香族间隔基的单核苷酸类似物(情况3)以及具有六个防护基团和阴离子芳香族间隔基的单核苷酸类似物(disc-split-sg1x6-dg)(情况4)。在每种情况下,试剂均为dg-核苷酸类似物。

从结果中显而易见的是,使类似物中包括阴离子芳香族间隔基团(情况4vs.情况2)或者将类似物中的防护基团的数量从4增加到6(情况4vs.情况3)能够获得改进的动力学,同时使含有这些经修饰的类似物中的ipd值降低约20%。类似物中包含阴离子芳香族间隔基团也能够提高测序的总体速率和精确度。

阴离子芳香族间隔基团的性质还能够影响经修饰的核苷酸类似物在测序反应中的行为。具体而言,如图16a至图16c所示,用4,8-二磺基萘-2,6-二羧酸间隔基(参见下文)取代disc-split-sg1x6-dg类似物的disc间隔基导致动力学慢大约10%(基于ipd值)但脉冲宽度稍宽。

在图16a中示出了含有四种碱基中的每一种的类似物的归一化ipd值,其针对二核苷酸对照类似物(对照-sg1x4-dg2)(情况1)、具有四个防护基团和disc间隔基团的单核苷酸类似物(disc-split-sg1x4-dg)(情况2)、具有六个防护基团和disc间隔基团的单核苷酸类似物(disc-split-sg1x6-dg)(情况3)以及具有六个防护基团和的dsdc间隔基团的单核苷酸类似物(情况4)。在图16b中对g-核苷酸类似物的ipd分布曲线进行了比较,而在图16c中对g-核苷酸类似物的归一化的脉冲宽度进行了比较。

例如,如以上在结构disc-split-sg1x12-dg中所示,可以进一步增加防护元件中侧链的数量,以及由此而来的核苷酸邻近的电荷。如图17a和图17b所示,在不同浓度下对单分子实时测序反应中含有该结构的类似物的动力学进行了分析。在这些试验中,在100nm(情况1)、150nm(情况2)或200nm(情况3)下对disc-split-sg1x12-dg类似物进行测量,并与200nm下(情况4)的disc-split-sg1x6-dg和200nm下的对照-sg1x4-dg2(情况5)进行比较。在图17a中对这些类似物的ipd分布曲线和试验情况进行了比较,而在图17b中对g-核苷酸类似物的归一化ipd值进行了比较。这些数据表明,使侧链的电荷加倍不会引起ipd的明显促进。

另外已经将阴离子芳香族间隔基团掺入两种二核苷酸类似物的两个接头基团中。具体而言,如上所示的disc2-split-sg1x12(酰胺)-dg2和disc2-split-sg1x12(点击)-dg2两者在两个接头臂的每一个中均含有disc阴离子芳香族间隔基团。已将含有这些结构的类似物与可比的三重sg单核苷酸类似物disc-split-sg1x6-dg(其在核苷酸接头中也包含disc阴离子芳香族间隔基团)进行比较。还将含有这些结构的类似物与二核苷酸类似物对照-sg1x4-dg2(其在核苷酸接头中缺少阴离子芳香族间隔基团)进行比较。如图18所示,相比于非disc二核苷酸类似物,两种含有disc的二核苷酸类似物disc2-split-sg1x12(酰胺)-dg2(情况1)和disc2-split-sg1x12(点击)-dg2(情况2)没有显示出有效不同的动力学,其中一个显示出略微较短的ipd值,而另一个显示出略微较长的ipd值。如先前所见,含有disc的单核苷酸类似物disc-split-sg1x6-dg(情况3)显示出比任意二核苷酸类似物略微较慢的动力学。

图19a示出了一些另外的含有两种亲和素的标记的核苷酸类似物结构,其使用上述核苷酸化合物和染料标记的化合物组装而成。具体而言,sg1x2-dt_4类似物包含二核苷酸结构,其中每个防护元件仅具有两个侧链且不含阴离子芳香族间隔元件。disc-split-sg1x6-dt_2类似物包含单核苷酸结构,其中每个防护元件具有6个侧链,并且在核苷酸接头中具有disc阴离子芳香族间隔元件。disc-split-sg1x6-dt_4为该结构的二核苷酸变型,其每个防护元件具有六个侧链,并且具有disc阴离子芳香族间隔元件。图19b和图19c示出了相比于在250nm下(情况1)包含具有两个侧链且缺少阴离子芳香族间隔元件的二核苷酸结构的类似物sg1x2-dt_4以及在250nm下(情况2)包含具有六个侧链和disc阴离子芳香族间隔元件的单核苷酸结构的类似物disc-split-sg1x6-dt_2,在100nm(情况3)、150nm(情况4)和250nm(情况5)的浓度下,包含disc-split-sg1x6-dt_4二核苷酸变型的类似物的归一化ipd值和聚合速率。由这些数据显而易见的是,除了提高的精确度之外,具有防护元件和阴离子芳香族间隔元件这两者作为亲合力调节元件的单核苷酸化合物具有与包含这些元件的二核苷酸化合物相当的动力学。

本文提到的所有专利、专利出版物和其他公开的参考文献在此通过全文引用并入本文,如同其已经单独地并且特别地通过引用并入本文。

虽然已经提供了具体示例,但是以上描述为说明性的而非限制性的。先前描述的实施方案的特征的任意一者或多者可以以任意的方式与本发明中的任意其他实施方案的特征的一者或多者进行组合。此外,在阅读说明书后,本发明的许多变化对于本领域技术人员而言将变得显而易见。因此,应该通过参考所附的权利要求以及它们的等同物的全部范围来确定本发明的范围。

序列表

<110>加利福尼亚太平洋生物科学股份有限公司

<120>标记的核苷酸类似物、反应混合物以及测序方法和系统

<130>1407-00-014wo1

<150>us62/258,416

<151>2015-11-20

<160>26

<170>patentinversion3.5

<210>1

<211>575

<212>prt

<213>噬菌体φ-29(bacteriophagephi-29)

<400>1

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyalapheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealalysaspphelysleuthrvalleulysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalargtyr

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglulys

225230235240

gluileglygluglymetvalpheaspvalasnserleutyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysargserargphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrsergluglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glygluglugluthrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpalaargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrgluileproaspvalilelysaspilevalaspprolyslysleu

465470475480

glytyrtrpalahisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysgluvalaspglylys

500505510

leuvalgluglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelyslysgluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysprovalgln

545550555560

valproglyglyvalvalleuvalaspaspthrphethrilelys

565570575

<210>2

<211>572

<212>prt

<213>噬菌体m2y(bacteriophagem2y)

<400>2

metserarglysmetphesercysaspphegluthrthrthrlysleu

151015

aspaspcysargvaltrpalatyrglytyrmetgluileglyasnleu

202530

aspasntyrlysileglyasnserleuaspgluphemetglntrpval

354045

metgluileglnalaaspleutyrphehisasnleulyspheaspgly

505560

alapheilevalasntrpleugluglnhisglyphelystrpserasn

65707580

gluglyleuproasnthrtyrasnthrileileserlysmetglygln

859095

trptyrmetileaspilecyspheglytyrlysglylysarglysleu

100105110

histhrvaliletyraspserleulyslysleupropheprovallys

115120125

lysilealalysasppheglnleuproleuleulysglyaspileasp

130135140

tyrhisthrgluargprovalglyhisgluilethrprogluglutyr

145150155160

glutyrilelysasnaspilegluileilealaargalaleuaspile

165170175

glnphelysglnglyleuaspargmetthralaglyseraspserleu

180185190

lysglyphelysaspileleuserthrlyslyspheasnlysvalphe

195200205

prolysleuserleuprometasplysgluilearglysalatyrarg

210215220

glyglyphethrtrpleuasnasplystyrlysglulysgluilegly

225230235240

gluglymetvalpheaspvalasnserleutyrproserglnmettyr

245250255

serargproleuprotyrglyalaproilevalpheglnglylystyr

260265270

glulysaspgluglntyrproleutyrileglnargileargpheglu

275280285

phegluleulysgluglytyrileprothrileglnilelyslysasn

290295300

prophephelysglyasnglutyrleulysasnserglyvalglupro

305310315320

valgluleutyrleuthrasnvalaspleugluleuileglngluhis

325330335

tyrgluleutyrasnvalglutyrileaspglyphelyspheargglu

340345350

lysthrglyleuphelysasppheileasplystrpthrtyrvallys

355360365

thrhisglugluglyalalyslysglnleualalysleumetleuasn

370375380

serleutyrglylysphealaserasnproaspvalthrglylysval

385390395400

protyrleulysaspaspglyserleuglypheargvalglyaspglu

405410415

glutyrlysaspprovaltyrthrprometglyvalpheilethrala

420425430

trpalaargphethrthrilethralaalaglnalacystyrasparg

435440445

ileiletyrcysaspthraspserilehisleuthrglythrgluval

450455460

progluileilelysaspilevalaspprolyslysleuglytyrtrp

465470475480

alahisgluserthrphelysargalalystyrleuargglnlysthr

485490495

tyrileglnaspiletyrvallysgluvalaspglylysleulysglu

500505510

cysserproaspglualathrthrthrlyspheservallyscysala

515520525

glymetthraspthrilelyslyslysvalthrpheaspasnpheala

530535540

valglyphesersermetglylysprolysprovalglnvalasngly

545550555560

glyvalvalleuvalaspservalphethrilelys

565570

<210>3

<211>572

<212>prt

<213>噬菌体b103(bacteriophageb103)

<400>3

metproarglysmetphesercysaspphegluthrthrthrlysleu

151015

aspaspcysargvaltrpalatyrglytyrmetgluileglyasnleu

202530

aspasntyrlysileglyasnserleuaspgluphemetglntrpval

354045

metgluileglnalaaspleutyrphehisasnleulyspheaspgly

505560

alapheilevalasntrpleugluhishisglyphelystrpserasn

65707580

gluglyleuproasnthrtyrasnthrileileserlysmetglygln

859095

trptyrmetileaspilecyspheglytyrlysglylysarglysleu

100105110

histhrvaliletyraspserleulyslysleupropheprovallys

115120125

lysilealalysasppheglnleuproleuleulysglyaspileasp

130135140

tyrhisalagluargprovalglyhisgluilethrprogluglutyr

145150155160

glutyrilelysasnaspilegluileilealaargalaleuaspile

165170175

glnphelysglnglyleuaspargmetthralaglyseraspserleu

180185190

lysglyphelysaspileleuserthrlyslyspheasnlysvalphe

195200205

prolysleuserleuprometasplysgluileargargalatyrarg

210215220

glyglyphethrtrpleuasnasplystyrlysglulysgluilegly

225230235240

gluglymetvalpheaspvalasnserleutyrproserglnmettyr

245250255

serargproleuprotyrglyalaproilevalpheglnglylystyr

260265270

glulysaspgluglntyrproleutyrileglnargileargpheglu

275280285

phegluleulysgluglytyrileprothrileglnilelyslysasn

290295300

prophephelysglyasnglutyrleulysasnserglyalaglupro

305310315320

valgluleutyrleuthrasnvalaspleugluleuileglngluhis

325330335

tyrglumettyrasnvalglutyrileaspglyphelyspheargglu

340345350

lysthrglyleuphelysglupheileasplystrpthrtyrvallys

355360365

thrhisglulysglyalalyslysglnleualalysleumetpheasp

370375380

serleutyrglylysphealaserasnproaspvalthrglylysval

385390395400

protyrleulysgluaspglyserleuglypheargvalglyaspglu

405410415

glutyrlysaspprovaltyrthrprometglyvalpheilethrala

420425430

trpalaargphethrthrilethralaalaglnalacystyrasparg

435440445

ileiletyrcysaspthraspserilehisleuthrglythrgluval

450455460

progluileilelysaspilevalaspprolyslysleuglytyrtrp

465470475480

alahisgluserthrphelysargalalystyrleuargglnlysthr

485490495

tyrileglnaspiletyralalysgluvalaspglylysleuileglu

500505510

cysserproaspglualathrthrthrlyspheservallyscysala

515520525

glymetthraspthrilelyslyslysvalthrpheaspasnphearg

530535540

valglypheserserthrglylysprolysprovalglnvalasngly

545550555560

glyvalvalleuvalaspservalphethrilelys

565570

<210>4

<211>578

<212>prt

<213>噬菌体ga-1(bacteriophagega-1)

<400>4

metalaargservaltyrvalcysaspphegluthrthrthrasppro

151015

gluaspcysargleutrpalatrpglytrpmetaspiletyrasnthr

202530

asplystrpsertyrglygluaspileaspserphemetglutrpala

354045

leuasnserasnseraspiletyrphehisasnleulyspheaspgly

505560

serpheileleuprotrptrpleuargasnglytyrvalhisthrglu

65707580

gluaspargthrasnthrprolysgluphethrthrthrilesergly

859095

metglyglntrptyralavalaspvalcysileasnthrargglylys

100105110

asnlysasnhisvalvalphetyraspserleulyslysleuprophe

115120125

lysvalgluglnilealalysglypheglyleuprovalleulysgly

130135140

aspileasptyrlyslystyrargprovalglytyrvalmetaspasp

145150155160

asngluileglutyrleulyshisaspleuleuilevalalaleuala

165170175

leuargsermetpheaspasnaspphethrsermetthrvalglyser

180185190

aspalaleuasnthrtyrlysglumetleuglyvallysglntrpglu

195200205

lystyrpheprovalleuserleulysvalasnsergluilearglys

210215220

alatyrlysglyglyphethrtrpvalasnprolystyrglnglyglu

225230235240

thrvaltyrglyglymetvalpheaspvalasnsermettyrproala

245250255

metmetlysasnlysleuleuprotyrglygluprovalmetphelys

260265270

glyglutyrlyslysasnvalglutyrproleutyrileglnglnval

275280285

argcysphephegluleulyslysasplysileprocysileglnile

290295300

lysglyasnalaargpheglyglnasnglutyrleuserthrsergly

305310315320

aspglutyrvalaspleutyrvalthrasnvalasptrpgluleuile

325330335

lyslyshistyraspilepheglugluglupheileglyglyphemet

340345350

phelysglypheileglyphepheaspglutyrileaspargphemet

355360365

gluilelysasnserproaspserseralagluglnserleuglnala

370375380

lysleumetleuasnserleutyrglylysphealathrasnproasp

385390395400

ilethrglylysvalprotyrleuaspgluasnglyvalleulysphe

405410415

arglysglygluleulysgluargaspprovaltyrthrprometgly

420425430

cyspheilethralatyralaarggluasnileleuserasnalagln

435440445

lysleutyrproargpheiletyralaaspthraspserilehisval

450455460

gluglyleuglygluvalaspalailelysaspvalileaspprolys

465470475480

lysleuglytyrtrpasphisglualathrpheglnargalaargtyr

485490495

valargglnlysthrtyrpheilegluthrthrtrplysgluasnasp

500505510

lysglylysleuvalvalcysgluproglnaspalathrlysvallys

515520525

prolysilealacysalaglymetseraspalailelysgluargile

530535540

argpheasngluphelysileglytyrserthrhisglyserleulys

545550555560

prolysasnvalleuglyglyvalvalleumetasptyrpropheala

565570575

ilelys

<210>5

<211>566

<212>prt

<213>噬菌体av-1(bacteriophageav-1)

<400>5

metvalargglnserthrilealaserproalaargglyglyvalarg

151015

argserhislyslysvalproserphecysalaaspphegluthrthr

202530

thraspgluaspaspcysargvaltrpsertrpglyileileglnval

354045

glylysleuglnasntyrvalaspglyileserleuaspglyphemet

505560

serhisilesergluargalaserhisiletyrphehisasnleuala

65707580

pheaspglythrpheileleuasptrpleuleulyshisglytyrarg

859095

trpthrlysgluasnproglyvallysgluphethrserleuileser

100105110

argmetglylystyrtyrserilethrvalvalphegluthrglyphe

115120125

argvalglupheargaspserphelyslysleuprometservalser

130135140

alailealalysalapheasnleuhisaspglnlysleugluileasp

145150155160

tyrglulysproargproileglytyrileprothrgluglnglulys

165170175

argtyrglnargasnaspvalalailevalalaglnalaleugluval

180185190

glnphealaglulysmetthrlysleuthralaglyseraspserleu

195200205

alathrtyrlyslysmetthrglylysleupheileargargphepro

210215220

ileleuserprogluileaspthrgluilearglysalatyrarggly

225230235240

glyphethrtyralaaspproargtyralalyslysleuasnglylys

245250255

glyservaltyraspvalasnserleutyrproservalmetargthr

260265270

alaleuleuprotyrglygluproiletyrsergluglyalaproarg

275280285

thrasnargproleutyrilealaserilethrphethralalysleu

290295300

lysproasnhisileprocysileglnilelyslysasnleuserphe

305310315320

asnprothrglntyrleuglugluvallysgluprothrthrvalval

325330335

alathrasnileaspilegluleutrplyslyshistyraspphelys

340345350

iletyrsertrpasnglythrpheglupheargglyserhisglyphe

355360365

pheaspthrtyrvalasphisphemetgluilelyslysasnserthr

370375380

glyglyleuargglnilealalysleuhisleuasnserleutyrgly

385390395400

lysphealathrasnproaspilethrglylyshisprothrleulys

405410415

aspasnargvalserleuvalmetasngluprogluthrargasppro

420425430

valtyrthrprometglyvalpheilethralatyralaarglyslys

435440445

thrileseralaalaglnaspasntyrgluthrphealatyralaasp

450455460

thraspserleuhisleuileglyprothrthrproproaspserleu

465470475480

trpvalaspprovalgluleuglyalatrplyshisgluserserphe

485490495

thrlysservaltyrileargalalysglntyralaglugluilegly

500505510

glylysleuaspvalhisilealaglymetproargasnvalalaala

515520525

thrleuthrleugluaspmetleuhisglyglythrtrpasnglylys

530535540

leuileprovalargvalproglyglythrvalleulysaspthrthr

545550555560

phethrleulysileasp

565

<210>6

<211>568

<212>prt

<213>噬菌体cp-1(bacteriophagecp-1)

<400>6

metthrcystyrtyralaglyaspphegluthrthrthrasngluglu

151015

gluthrgluvaltrpleusercysphealalysvalileasptyrasp

202530

lysleuaspthrphelysvalasnthrserleugluasppheleulys

354045

serleutyrleuaspleuasplysthrtyrthrgluthrglygluasp

505560

glupheileilephephehisasnleulyspheaspglyserpheleu

65707580

leuserphepheleuasnasnaspileglucysthrtyrpheileasn

859095

aspmetglyvaltrptyrserilethrleuglupheproaspphethr

100105110

leuthrpheargaspserleulysileleuasnpheserilealathr

115120125

metalaglyleuphelysmetproilealalysglythrthrproleu

130135140

leulyshislysprogluvalilelysproglutrpileasptyrile

145150155160

hisvalaspvalalaileleualaargglyilephealamettyrtyr

165170175

glugluasnphethrlystyrthrseralaserglualaleuthrglu

180185190

phelysargilephearglysserlysarglyspheargaspphephe

195200205

proileleuaspglulysvalaspaspphecysarglyshisileval

210215220

glyalaglyargleuprothrleulyshisargglyargthrleuasn

225230235240

glnleuileaspiletyraspileasnsermettyrproalathrmet

245250255

leuglnasnalaleuproileglyileprolysargtyrlysglylys

260265270

prolysgluilelysgluasphistyrtyriletyrhisilelysala

275280285

asppheaspleulysargglytyrleuprothrileglnilelyslys

290295300

lysleuaspalaleuargileglyvalargthrserasptyrvalthr

305310315320

thrserlysasngluvalileaspleutyrleuthrasnpheaspleu

325330335

aspleupheleulyshistyraspalathrilemettyrvalgluthr

340345350

leuglupheglnthrgluseraspleupheaspasptyrilethrthr

355360365

tyrargtyrlyslysgluasnalaglnserproalaglulysglnlys

370375380

alalysilemetleuasnserleutyrglylyspheglyalalysile

385390395400

ileservallyslysleualatyrleuaspasplysglyileleuarg

405410415

phelysasnaspaspgluglugluvalglnprovaltyralaproval

420425430

alaleuphevalthrserilealaarghispheileileserasnala

435440445

glngluasntyraspasnpheleutyralaaspthraspserleuhis

450455460

leuphehisseraspserleuvalleuaspileaspprosergluphe

465470475480

glylystrpalahisgluglyargalavallysalalystyrleuarg

485490495

serlysleutyrileglugluleuileglngluaspglythrthrhis

500505510

leuaspvallysglyalaglymetthrprogluilelysglulysile

515520525

thrphegluasnphevalileglyalathrphegluglylysargala

530535540

serlysglnilelysglyglythrleuiletyrgluthrthrphelys

545550555560

ilearggluthrasptyrleuval

565

<210>7

<211>650

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>7

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspileserleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvalarglysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpglyargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglyphe

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

glyglyserleuvalproargglyserglyglyglyserglyglygly

580585590

serglyglyglyserglyleuasnaspphepheglualaglnlysile

595600605

glutrphisgluglyglyglyserglyglyglyserglyglyglyser

610615620

glyleuasnaspphepheglualaglnlysileglutrphisglugly

625630635640

hishishishishishishishishishis

645650

<210>8

<211>640

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>8

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaargaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrileilethralaalaglnalaval

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysglnvalargglyhis

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

hishishishishishishishishishisglyglyglyserglygly

580585590

glyserglyglyglyserglyleuasnaspphepheglualaglnlys

595600605

ileglutrphisgluglyglyglyserglyglyglyserglyglygly

610615620

serglyleuasnaspphepheglualaglnlysileglutrphisglu

625630635640

<210>9

<211>650

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>9

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspileserleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysileserargaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrserpheglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglyphe

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

glyglyserleuvalproargglyserglyglyglyserglyglygly

580585590

serglyglyglyserglyleuasnaspphepheglualaglnlysile

595600605

glutrphisgluglyglyglyserglyglyglyserglyglyglyser

610615620

glyleuasnaspphepheglualaglnlysileglutrphisglugly

625630635640

hishishishishishishishishishis

645650

<210>10

<211>640

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>10

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealalysaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpglyargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvallysglyphe

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

glyglyserglyglyglyserglyglyglyserglyleuasnaspphe

580585590

pheglualaglnlysileglutrphisgluglyglyglyserglygly

595600605

glyserglyglyglyserglyleuasnaspphepheglualaglnlys

610615620

ileglutrphisgluglyhishishishishishishishishishis

625630635640

<210>11

<211>640

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>11

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspileserleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

glyglyserglyglyglyserglyglyglyserglyleuasnaspphe

580585590

pheglualaglnlysileglutrphisgluglyglyglyserglygly

595600605

glyserglyglyglyserglyleuasnaspphepheglualaglnlys

610615620

ileglutrphisgluglyhishishishishishishishishishis

625630635640

<210>12

<211>640

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>12

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaargaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalaspprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglyhis

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

hishishishishishishishishishisglyglyglyserglygly

580585590

glyserglyglyglyserglyleuasnaspphepheglualaglnlys

595600605

ileglutrphisgluglyglyglyserglyglyglyserglyglygly

610615620

serglyleuasnaspphepheglualaglnlysileglutrphisglu

625630635640

<210>13

<211>650

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>13

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspileserleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrphesertyrglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

glyglyserleuvalproargglyserglyglyglyserglyglygly

580585590

serglyglyglyserglyleuasnaspphepheglualaglnlysile

595600605

glutrphisgluglyglyglyserglyglyglyserglyglyglyser

610615620

glyleuasnaspphepheglualaglnlysileglutrphisglugly

625630635640

hishishishishishishishishishis

645650

<210>14

<211>640

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>14

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrsertyrglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

hishishishishishishishishishisglyglyglyserglygly

580585590

glyserglyglyglyserglyleuasnaspphepheglualaglnlys

595600605

ileglutrphisgluglyglyglyserglyglyglyserglyglygly

610615620

serglyleuasnaspphepheglualaglnlysileglutrphisglu

625630635640

<210>15

<211>640

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>15

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertyrglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpglyargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

glyglyserglyglyglyserglyglyglyserglyleuasnaspphe

580585590

pheglualaglnlysileglutrphisgluglyglyglyserglygly

595600605

glyserglyglyglyserglyleuasnaspphepheglualaglnlys

610615620

ileglutrphisgluglyhishishishishishishishishishis

625630635640

<210>16

<211>640

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>16

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertyrglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpglyargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelysgly

565570575

hishishishishishishishishishisglyglyglyserglygly

580585590

glyserglyglyglyserglyleuasnaspphepheglualaglnlys

595600605

ileglutrphisgluglyglyglyserglyglyglyserglyglygly

610615620

serglyleuasnaspphepheglualaglnlysileglutrphisglu

625630635640

<210>17

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>17

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspileserleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvalarglysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpglyargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglyphe

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

<210>18

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>18

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaargaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrileilethralaalaglnalaval

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysglnvalargglyhis

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

<210>19

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>19

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspileserleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysileserargaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrserpheglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglyphe

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

<210>20

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>20

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealalysaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpglyargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvallysglyphe

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

<210>21

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>21

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspileserleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

<210>22

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>22

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaargaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrsertrpglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalaspprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglyhis

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

<210>23

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>23

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspileserleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrphesertyrglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

<210>24

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>24

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserlysleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspvaltrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrsertyrglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatyrglyargtrpthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

<210>25

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>25

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertyrglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpglyargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

<210>26

<211>575

<212>prt

<213>人工(artificial)

<220>

<223>突变重组的φ29-型dna聚合酶

<400>26

metlyshismetproarglysmettyrsercysaspphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyserpheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealaglnaspphelysleuthrvallyslysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalarglys

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglylys

225230235240

gluileglygluglymetvalpheaspileasnseralatyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysglnserleuphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpser

355360365

tyrilelysthrthrsertyrglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glyglugluglutyrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpglyargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrlysileproaspvalilelysaspilevalhisprolyslysleu

465470475480

glytyrtrpgluhisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysargvalargglytyr

500505510

leuvalglnglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelysglugluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysalavalgln

545550555560

valproglyglyvalvalleuvalaspservalphethrilelys

565570575

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜