一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途的制作方法

2022-03-05 09:51:09 来源:中国专利 TAG:

具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途
1.本技术是申请号为201780014326.1、申请日为2017年1月12日、发明名称为“具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途”的中国发明专利申请的分案申请,原申请为国际申请号为pct/us2017/013247的国家阶段申请,该国际申请要求申请日为2016年1月13日,申请号为62/278,127的美国申请的优先权。


背景技术:

2.基于抗体的治疗剂为多种疾病的治疗提供了显著前景。正在开发各种形式,包括单克隆、鼠、嵌合、人源化的、人、全长、fab、聚乙二醇化、放射性标记的、药物缀合的、多特异性等(参见例如reichert,j.m.,2012,mabs 4:3,413-415;nixon,a.e.等人,2014,mabs 6:1,73-85;以引用的方式并入本文)。已在美国或欧洲获得上市许可的超过40种治疗性抗体试剂中,全部都用依赖通过体外(例如噬菌体展示)或体内(例如经遗传改造的动物)系统的、来自人和/或非人(例如小鼠)源的传统抗体基因的装配的技术生成。然而,结合顽固性靶的特别有效的抗体试剂的开发仍然是个挑战。


技术实现要素:

3.本文公开了以下认识:期望改造非人动物以允许用于鉴定和开发基于抗体的新治疗剂的改进体内系统,并且在一些实施例中,可用于治疗特征在于顽固性疾病靶的各种疾病的抗体试剂(例如单克隆抗体和/或其片段)。进一步地,本文公开了以下认识:期望在免疫球蛋白重链可变区(例如异源免疫球蛋白重链可变区)内具有经改造的重链多样性(dh)簇/区,特别是经改造的dh簇(或dh区)的非人动物,所述重链多样性簇/区含有并非天然存在于免疫球蛋白重链可变区内的核苷酸编码序列,和/或以其它方式表达、含有或产生含有互补决定区(cdr)的抗体,所述互补决定区的特征在于指导与特定抗原结合的多样性,例如用于鉴定和开发基于抗体的治疗剂,其可靶向例如跨膜多肽或细胞质多肽。在一些实施例中,本文公开的非人动物是用于开发用于施用于人的抗体和/或基于抗体的治疗剂的体内系统。
4.在一些实施例中,提供了非人动物,其基因组(例如种系基因组)包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的dh区,其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。
5.在另一个方面,其基因组例如种系基因组被修饰以包含免疫球蛋白重链可变区(其包括经改造的dh区)的非人动物,可被进一步修饰以表达单一重排轻链,例如共同轻链(ulc),其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。
6.可操作地连接到轻链恒定区(也称为共同或通用轻链(ulc))的单个重排的轻链可变基因序列,可由包含单个重排的v
l
:j
l
基因序列的轻链基因座编码。在一些实施例中,轻链基因座包含单个重排的v
l
:j
l
基因序列,其中v
l
序列是vκ基因序列。在一些方面,vκ序列选自
vκ1-39或vκ3-20。在一些方面,j
l
序列是jκ基因序列,例如jκ1序列、jκ2序列、jκ3序列、jκ4序列或jκ5序列等。在一些实施例中,轻链基因座包含选自vκ1-39jκ5和vκ3 20jκ1的单个重排的vκ:jκ序列。在一个实施例中,轻链基因座包含vκ1-39jκ5的单个重排的vκ:jκ序列。在另一个实施例中,轻链基因座包含vκ3-20jκ1的单个重排的vκ:jκ序列。在一些实施例中,单个重排的可变基因序列可操作地连接至非人轻链恒定区基因,例如内源性非人轻链恒定区基因。在另一个实施例中,单个重排的可变基因序列可操作地连接至人轻链恒定区基因。在一些方面,单个重排的可变基因序列是插入内源性免疫球蛋白轻链基因座的人v:j序列,使得所得到的非人动物在一个或多个轻链基因座中不包含功能性未重排的v和/或j基因区段。
7.在一些实施例中,提供了分离的非人细胞或组织,其基因组包含包括经改造的dh区的免疫球蛋白重链可变区以及任选的共同或通用轻链,其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。在一些实施例中,细胞来自淋巴或骨髓谱系。在一些实施例中,细胞为淋巴细胞。在一些实施例中,细胞选自b细胞、树突状细胞、巨噬细胞、单核细胞和t细胞。在一些实施例中,组织选自脂肪、膀胱、大脑、乳房、骨髓、眼、心、肠、肾、肝、肺、淋巴结、肌肉、胰腺、血浆、血清、皮肤、脾、胃、胸腺、睾丸、卵子以及它们的组合。
8.在一些实施例中,提供了如本文所述的由分离的非人细胞制备的永生化细胞。
9.在一些实施例中,提供了非人胚胎干(es)细胞,其基因组包含包括经改造的dh区的免疫球蛋白重链可变区以及任选的共同轻链,其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。在一些实施例中,非人胚胎干细胞是啮齿类动物胚胎干细胞。在某些实施例中,啮齿类动物胚胎干细胞是小鼠胚胎干细胞并且来自129品系、c57bl品系或它们的混合物。在某些实施例中,啮齿类动物胚胎干细胞是小鼠胚胎干细胞并且是129和c57bl品系的混合物。
10.在一些实施例中,提供了非人生殖细胞,其基因组包含包括经改造的dh区的免疫球蛋白重链可变区以及任选的共同轻链,其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。在一些实施例中,非人生殖细胞是啮齿类动物生殖细胞。在一些特定实施例中,啮齿类动物生殖细胞是小鼠生殖细胞,并且来自129品系、c57bl品系或其混合物。在一些特定实施例中,啮齿类动物生殖细胞是小鼠生殖细胞,并且是129和c57bl品系的混合物。
11.在一些实施例中,提供了如本文所述的非人胚胎干细胞或生殖细胞制备非人动物的用途。在一些特定实施例中,非人胚胎干细胞或生殖细胞是小鼠胚胎干细胞或生殖细胞,并且用于制备如本文所述包含包括经改造的dh区的免疫球蛋白重链可变区以及任选的共同轻链的小鼠。在一些特定实施例中,非人胚胎干细胞或生殖细胞是大鼠胚胎干细胞或生殖细胞,并且用于制备如本文所述包含包括经改造的dh区的免疫球蛋白重链可变区以及任选的共同轻链的大鼠。
12.在一些实施例中,提供了包含本文所述的非人胚胎干细胞、由其制备、由其获得或由其产生的非人胚胎。在某些实施例中,非人胚胎为啮齿类动物胚胎;在一些实施例中,为小鼠胚胎;在一些实施例中,为大鼠胚胎。
13.在一些实施例中,提供了本文描述的非人胚胎用于制备非人动物的用途。在一些
特定实施例中,非人胚胎是小鼠胚胎,并且用于制备如本文所述包含包括经改造的dh区的免疫球蛋白重链可变区以及任选的共同轻链基因座的小鼠。在一些特定实施例中,非人胚胎是大鼠胚胎,并且用于制备如本文所述包含包括经改造的dh区的免疫球蛋白重链可变区以及任选的共同轻链基因座的大鼠。
14.在一些实施例中,提供了试剂盒,其包含如本文所述的分离的非人细胞或组织、如本文所述的永生化细胞、如本文所述的非人胚胎干细胞、如本文所述的非人胚胎、或如本文所述的非人动物。
15.在一些实施例中,提供了如本文所述的试剂盒,用于制造和/或开发用于治疗或诊断的药物(例如,抗体或其抗原结合片段)。
16.在一些实施例中,提供了如本文所述的试剂盒,用于制备和/或开发用于治疗、预防或改善疾病、病症或状况的药物(例如,抗体或其抗原结合片段)。
17.在一些实施例中,提供了本文所述的转基因、核酸构建体、dna构建体或靶向载体。在一些特定实施例中,转基因、核酸构建体、dna构建体或靶向载体包含如本文所述的经改造的dh区。在一些特定实施例中,转基因、核酸构建体、dna构建体或靶向载体包含dna片段,其包括本文所述的一个或多个核苷酸编码序列。在一些实施例中,转基因、核酸构建体、dna构建体或靶向载体包含经改造的dh区,其包含选自表3或表4的一个或多个核苷酸编码序列,其中一个或多个核苷酸编码序列各自侧翼为选自图2的重组信号序列。在某些实施例中,转基因、核酸构建体、dna构建体或靶向载体还包含一个或多个选择性标记。在一些特定实施例中,转基因、核酸构建体、dna构建体或靶向载体还包含一个或多个位点特异性重组位点(例如lox、frt或其组合)。在一些特定实施例中,转基因、核酸构建体、dna构建体或靶向载体在图3a、3b、4a、4b、7a、7b、8a和8b中的任何一个中描绘。
18.在一些实施例中,提供了本文所述的转基因、核酸构建体、dna构建体或靶向载体用于制备非人胚胎干细胞、非人细胞、非人胚胎和/或非人动物的用途。
19.在一些实施例中,目的非免疫球蛋白多肽是趋化因子受体。在一些实施例中,趋化因子受体选自cc-趋化因子受体(或β-趋化因子受体)、cxc-趋化因子受体、cx3c-趋化因子受体和xc-趋化因子受体。在一些实施例中,趋化因子受体是非典型趋化因子受体(ackr)。在一些实施例中,ackr选自ackr1、ackr2、ackr3和ackr4。在一些特定实施例中,ackr是ackr2或d6趋化因子诱饵受体。
20.在一些实施例中,目的非免疫球蛋白多肽是毒素。在一些实施例中,毒素是在狼蛛、蜘蛛、蝎子或海葵的毒液中发现的毒素。
21.在一些实施例中,目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。在一些实施例中,芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。在一些特定实施例中,芋螺毒素是μ-芋螺毒素。在一些特定实施例中,狼蛛毒素是protxi、protxii、虎纹捕鸟蛛毒素-iv(hwtx-iv)或其组合。
22.在一些实施例中,经改造的dh区包含5、10、15、20、25个或更多个核苷酸序列,其各自编码d6趋化因子诱饵受体的细胞外部分,或各自编码芋螺毒素(例如μ-芋螺毒素)的一部分,或各自编码狼蛛毒素(例如protxi、protxii等)的一部分或其组合。
23.在一些实施例中,经改造的dh区包括各自编码d6趋化因子诱饵受体的细胞外部分的25个核苷酸序列,或包括各自编码芋螺毒素(例如μ-芋螺毒素)和/或狼蛛毒素(例如
protxi、protxii等)的一部分的26个核苷酸序列。
24.在一些实施例中,d6趋化因子诱饵受体的细胞外部分选自n末端区域、细胞外环及其组合。
25.在一些实施例中,如本文所述的芋螺毒素的一部分包括包含一个或多个二硫键的序列。在一些实施例中,如本文所述的芋螺毒素的一部分包括与自然界中出现的芋螺毒素序列(例如参考或亲本芋螺毒素序列)相比,缺乏一个或多个二硫键的序列。在一些实施例中,如本文所述的芋螺毒素的一部分包括与自然界中出现的芋螺毒素序列(例如参考或亲本芋螺毒素序列)相比,显示出相同或不同的二硫键数目和/或模式的序列。
26.在一些实施例中,如本文所述的狼蛛毒素的一部分包括包含半胱氨酸结基序的序列,所述半胱氨酸结基序在自然界中发现的狼蛛毒素序列中出现。在一些实施例中,如本文所述的狼蛛毒素的一部分包含其为或包含半胱氨酸结肽的序列。在一些实施例中,如本文所述的狼蛛毒素的一部分包括与自然界出现的狼蛛毒素序列(例如参考或亲本狼蛛毒素序列)相比,缺乏一个或多个二硫键的序列。在一些实施例中,如本文所述的狼蛛毒素的一部分包括与自然界出现的狼蛛毒素序列(例如参考或亲本狼蛛毒素序列)相比,显示出相同或不同的二硫键数目和/或模式的序列。
27.在一些实施例中,经改造的dh区包含25或26个核苷酸序列,其与表3或表4中出现的核苷酸序列至少50%、60%、70%、80%、90%、95%或至少98%相同,和/或编码表3或表4中出现的氨基酸序列。在一些实施例中,经改造的dh区包含25或26个核苷酸序列,其各自编码与表3或表4中出现的氨基酸序列基本上相同或相同的氨基酸序列,或者具有与表3或4中出现的氨基酸序列相同的功能。
28.在一些实施例中,一个或多个核苷酸序列包含增加一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。
29.在一些实施例中,经改造的dh区还包括侧接一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。在一些特定实施例中,第一重组信号序列包含与图2中出现的第一重组信号序列至少50%、60%、70%、80%、90%、95%或至少98%相同的序列。在一些特定实施例中,第一重组信号序列包含与图2中出现的第一重组信号序列基本上相同或相同的序列。在一些特定实施例中,第二重组信号序列包含与图2中出现的第二重组信号序列至少50%、60%、70%、80%、90%、95%或至少98%相同的序列。在一些特定实施例中,第二重组信号序列包含与图2中出现的第二重组信号序列基本上相同或相同的序列。在一些实施例中,第一重组信号序列和第二重组信号序列选自图2。
30.在一些实施例中,所提供的非人动物的基因组缺少一个或多个野生型内源性dh基因区段。在一些特定实施例中,所提供的非人动物的基因组缺少全部或基本上全部野生型内源性dh基因区段。在一些实施例中,所提供的非人动物的基因组缺少一个或多个野生型内源性重组信号序列。
31.在一些实施例中,经改造的dh区包含一个或多个野生型人dh基因区段。在一些特定实施例中,经改造的dh区包含人dh6-25基因区段。在一些特定实施例中,经改造的dh区缺少人dh6-25基因区段。
32.在一些实施例中,免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。
33.在一些实施例中,免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。
34.在一些实施例中,免疫球蛋白重链可变区是未重排的人免疫球蛋白重链可变区,例如包含侧接经改造的(e)dh区的至少一个人(h)未重排的vh基因区段和/或至少一个人(h)未重排的jh基因区段。在一些实施例中,免疫球蛋白重链可变区包含侧接经改造的(e)dh区的多个人(h)未重排的vh基因区段和/或多个人(h)未重排的jh基因区段。在一些实施例中,未重排的人免疫球蛋白重链可变区例如在内源性非人重链基因座处可操作地连接至免疫球蛋白重链恒定区,例如非人免疫球蛋白重链恒定区。
35.在一些实施例中,人免疫球蛋白重链可变区包含重排的人免疫球蛋白重链可变区,其中所述重排的人免疫球蛋白重链包含与经改造的(e)dh区重组的至少一个人(h)未重排的vh基因区段和/或至少一个人(h)未重排的jh基因区段,以形成重排的(h)vh/(e)dh/(h)jh基因序列,其可与重链恒定区可操作地连接。在一些实施例中,这种重组在b细胞发育期间在b细胞中发生。
36.相应地,本文所述的非人动物可包含
37.(i)包含未重排的人重链可变区的生殖细胞,
38.(a)至少一个或多个人(h)未重排的vh基因区段,
39.(b)至少一个或多个人(h)未重排的jh基因区段,和
40.(c)侧翼为(a)和(b)的经改造的(e)dh区,其中(a)、(b)和(c)重组以形成重排的人重链可变区hvh/edh/hjh序列;和
41.(ii)包含重排的人hvh/edh/hjh基因序列的体细胞,例如b细胞,其中所述重排的hvh/edh/hjh基因序列包含含有一个或多个核苷酸序列的cdr3编码序列,所述一个或多个核苷酸序列编码目的非免疫球蛋白多肽或其一部分、或其体细胞超突变的变体。在一些实施例中,人未重排或重排的人重链可变区例如在非人内源性重链基因座处可操作地连接至重链恒定区,其可为非人重链恒定区。在一些实施例中,免疫球蛋白重链可变区是人免疫球蛋白重链可变区。在一些实施例中,b细胞还将与重链恒定区可操作地连接的重排的hvh/edh/hjh基因序列表达为包含cdr3的免疫球蛋白重链样多肽,所述cdr3包含含有目的非免疫球蛋白多肽、其一部分或其体细胞超突变的变体。
42.在一些实施例中,如本文所述的非人动物还包含人源化轻链基因座。在一些实施例中,如本文公开的非人动物包含
43.(i)在生殖细胞中:
44.(a)包含未重排的免疫球蛋白重链可变区和免疫球蛋白重链恒定区的免疫球蛋白重链基因座,其中所述未重排的免疫球蛋白重链可变区包含至少一个未重排的vh基因区段(其可为人未重排的vh基因区段,例如hvh)、经改造的dh区(其可包括人dh基因区段和/或经改造的dh基因区段,例如hdh)和至少一个未重排的,任选地人jh基因区段,其中所述vh基因区段、经改造的dh区和jh基因区段可操作地连接,使得它们可例如在b细胞发育过程中在b细胞中重组,以形成与免疫球蛋白重链恒定区可操作地连接的重排的免疫球蛋白重链hvh/edh/hjh可变区基因序列,和
45.(b)包含人v
l
和/或j
l
基因区段并且可编码(人)共同轻链的免疫球蛋白轻链基因座;和
46.(ii)在体细胞例如b细胞中,
47.(a)与免疫球蛋白重链恒定区可操作地连接的重排的免疫球蛋白重链hvh/edh/hjh可变区基因序列,其中所述经改造的dh区包含编码目的非免疫球蛋白多肽或一其部分的序列,并且其中重排的hvh/edh/hjh基因序列包含含有一个或多个核苷酸序列的cdr3编码序列,所述一个或多个核苷酸序列编码目的非免疫球蛋白多肽、或其一部分或其体外超突变的变体,和
48.(b)人源化和/或共同的免疫球蛋白轻链基因座或其体细胞超突变的变体。在一些实施例中,人未重排或重排的人重链可变区例如在非人内源性重链基因座处可操作地连接至重链恒定区,其可为非人重链恒定区。在一些实施例中,免疫球蛋白重链可变区是人免疫球蛋白重链可变区。在一些实施例中,b细胞还将与重链恒定区可操作地连接的重排的hvh/edh/hjh基因序列表达为包含cdr3的免疫球蛋白重链样多肽,其包含目的非免疫球蛋白多肽、其一部分或其体外超突变的变体,并且将人(源化)和/或共同轻链表达为四聚体免疫球蛋白样抗原结合蛋白,其中所述四聚体包含免疫球蛋白重链样多肽的二聚体,其各自共价结合至人(源化)和/或共同轻链。
49.在一些实施例中,提供了制备其基因组含有免疫球蛋白重链可变区的非人动物的方法,所述免疫球蛋白重链可变区包括经改造的dh区,所述方法包括(a)将dna片段插入非人胚胎干细胞内,所述dna片段包含一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分;(b)获得(a)中生成的非人胚胎干细胞;并且(c)使用(b)的胚胎干细胞产生非人。
50.在一个实施例中,如本文公开的制备非人动物的方法包括(a)获得其基因组含有免疫球蛋白重链可变区的第一非人动物,所述免疫球蛋白重链可变区包括如本文所公开的经改造的dh区,并且(b)用第二非人动物交配(a)的第一非人动物,所述第二非人动物在一个方面可为与第一非人动物不同的品系,其中所述第二非人动物表达通用轻链,并且其中所述交配导致后代,所述后代产生(例如包含)例如在cdr3中包含非免疫球蛋白蛋白质(或其一部分)的氨基酸序列的经遗传改造的重链、以及经遗传改造的重排的轻链(单一重排的轻链;ulc)。
51.在一些实施例中,dna片段包括5、10、15、20、25个或更多个核苷酸序列,其各自编码d6趋化因子诱饵受体的细胞外部分,或者各自编码芋螺毒素(例如μ-芋螺毒素)的一部分、狼蛛毒素或其组合。在一些特定实施例中,dna片段包括各自编码d6趋化因子诱饵受体的细胞外部分的25个核苷酸序列,或包括各自编码芋螺毒素(例如μ-芋螺毒素)和/或狼蛛毒素(例如protxi、protxii等)的一部分的26个核苷酸序列。在一些特定实施例中,dna片段还包含侧接25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
52.在一些实施例中,提供了制备其基因组含有免疫球蛋白重链可变区的非人动物的方法,所述免疫球蛋白重链可变区包括经改造的dh区,所述方法包括修饰非人动物的基因组,使得它包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的dh区,所述经改造的dh区包含一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分,由此制备所述非人动物。
53.在一些实施例中,非人动物的基因组被修饰为包括5、10、15、20、25个或更多个核苷酸序列,其各自编码d6趋化因子诱饵受体的细胞外部分,或者各自编码芋螺毒素(例如μ-芋螺毒素)的一部分、狼蛛毒素或其组合。在一些特定实施例中,非人动物的基因组被修饰
为包括各自编码d6趋化因子诱饵受体的细胞外部分的25个核苷酸序列,或被修饰为包括各自编码芋螺毒素(例如μ-芋螺毒素)和/或狼蛛毒素(例如protxi、protxii等)的一部分的26个核苷酸序列。在一些特定实施例中,非人动物的基因组被修饰为还包括侧接25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
54.在一些实施例中,提供了在非人动物中产生抗体的方法,所述方法包括以下步骤:(a)用抗原免疫非人动物,所述非人动物具有包含免疫球蛋白重链可变区的基因组,所述免疫球蛋白重链可变区包括经改造的dh区,其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分;(b)将所述非人动物维持在足以使所述非人动物对抗原产生免疫应答的条件下;并且(c)从非人动物或非人动物细胞中回收结合抗原的抗体。在一些特定实施例中,非人细胞是b细胞。在一些特定实施例中,非人细胞是杂交瘤。
55.在一些实施例中,提供了非人动物,其生殖细胞基因组包含(a)人免疫球蛋白重链可变区,其包含一个或多个未重排的人vh基因区段、经改造的dh区和一个或多个未重排的人jh基因区段,所述经改造的dh区包括(i)各自编码非典型趋化因子受体(ackr)的细胞外部分的一个或多个核苷酸序列;和(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列,使得所述一个或多个未重排的人vh基因区段、经改造的dh区和一个或多个未重排的人jh基因区段例如在b细胞中重组,使得所述非人动物包含b细胞基因组,所述b细胞基因组包含含有重排的hvh/edh/hjh基因序列的人免疫球蛋白重链可变区;其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白重链恒定区基因,使得所述非人动物的特征在于当它用抗原免疫时,与免疫球蛋白重链恒定区基因可操作地连接的所述重排的hvh/edh/hjh基因序列编码抗体,所述抗体包含由人vh基因区段之一(或其一部分)编码的人重链可变结构域、经改造的dh区(或其一部分)、以及由一个或多个内源性免疫球蛋白恒定区基因编码的与非人动物重链恒定结构域可操作地连接的人jh基因区段之一(或其一部分),并且其中所述抗体显示与抗原的特异性结合。在一些实施例中,非人动物的生殖细胞和例如b细胞还包含编码共同轻链的免疫球蛋白轻链基因座,使得该抗体还包含共同轻链。
56.在一些实施例中,提供了非人动物,其生殖细胞基因组包含人免疫球蛋白重链可变区,其包含一个或多个未重排的人(h)vh基因区段、经改造的(e)dh区和一个或多个(h)人jh基因区段,所述经改造的dh区包括(i)各自编码毒素(例如,μ-芋螺毒素、狼蛛毒素或其组合)的一部分的一个或多个核苷酸序列;和(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列,使得所述一个或多个未重排的人vh基因区段、经改造的dh区和一个或多个未重排的人jh基因区段例如在b细胞中重组,使得所述非人动物包含b细胞基因组,所述b细胞基因组包含含有重排的hvh/edh/hjh基因序列的人免疫球蛋白重链可变区;其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白重链恒定区基因,使得所述非人动物的特征在于当它用抗原免疫时,与免疫球蛋白重链恒定区基因可操作地连接的所述重排的hvh/edh/hjh基因序列编码抗体,所述抗体包含由人vh基因区段之一(或其一部分)编码的人重链可变结构域、经改造的dh区(或其一部分)、以及由一个或多个内源性免疫球蛋白恒定区基因编码的与一个或多个重链恒定结构域可操作地连接的人jh基因区段之一(或其一部分),并且其中所述抗体显示与抗原的特异
性结合。在一些实施例中,非人动物的生殖细胞和例如b细胞还包含编码共同轻链的免疫球蛋白轻链基因座,使得该抗体还包含共同轻链。
57.在一些实施例中,所提供的非人动物还包含将一个或多个人v
l
基因区段和一个或多个人j
l
基因区段插入内源性轻链基因座内。在一些实施例中,人v
l
和j
l
区段是vκ和jκ基因区段,并且插入内源性κ轻链基因座内。在一些实施例中,人vκ和jκ基因区段与啮齿类动物cκ基因(例如小鼠或大鼠cκ基因)可操作地连接。在一些实施例中,人v
l
和j
l
区段是vλ和jλ基因区段,并且插入内源性λ轻链基因座内。在一些实施例中,人vλ和jλ基因区段与啮齿类动物cλ基因(例如小鼠或大鼠cλ基因)可操作地连接。在一些实施例中,单个重排的人轻链可变区基因序列可操作地连接至内源非人轻链恒定区基因。在一些实施例中,单个重排的人vκ/jκ基因序列可操作地连接至内源性cκ基因(例如小鼠或大鼠cκ基因)。在一些实施例中,单个重排的vλ/jλ基因序列可操作地连接至内源cλ基因。
58.在一些实施例中,所提供的非人动物对于如本文所述的经改造的dh区是纯合的、杂合的或半合子的。在一些实施例中,所提供的非人动物对于如本文所述的经改造的dh区是转基因的。
59.本文还公开了细胞,例如b细胞或通过与骨髓瘤细胞融合由其衍生的杂交瘤,所述细胞各自包含重排的(h)vh/edh/(h)jh序列,其可以可操作地连接至包含一个或多个重链恒定区基因的人或非人重链恒定区。这样的细胞例如b细胞可从如本文所述的非人动物,例如啮齿类动物(例如大鼠、小鼠等)中分离。
60.本文还描述了包含重排的可变(h)vh/edh/(h)jh序列的核苷酸序列,其可以可操作地连接至包含一个或多个重链恒定区基因的人或非人重链恒定区。这样的核苷酸序列可从如本文所述的非人动物,例如啮齿类动物(例如大鼠、小鼠等)或非人细胞中分离。
61.在一些实施例中,提供了如本文所述的非人动物在制造和/或开发用于医学中的药物或疫苗中,例如用作药剂的用途。
62.在一些实施例中,提供了如本文所述的非人动物在制造用于治疗疾病、病症或状况的药剂中的用途。
63.在一些实施例中,提供了如本文所述的非人动物在制造和/或开发抗体中的用途,所述抗体结合趋化因子或电压-门控钠(nav)通道。
64.在一些实施例中,提供了如本文所述的非人动物在制造用于治疗或检测疾病的药剂中的用途,所述疾病的特征在于趋化因子或电压门控钠(nav)通道表达或功能(例如,异常表达或功能)。
65.在一些实施例中,提供了如本文所述的非人动物用于制造和/或开发用于治疗或诊断的药物。
66.在一些实施例中,提供了如本文所述的非人动物用于制造用于治疗、预防或改善疾病、病症或状况的药物。
67.在一些实施例中,提供了如本文所述的非人动物用于制造和/或开发结合趋化因子或电压门控钠(nav)通道的抗体。
68.在一些实施例中,疾病、病症或状况是炎性疾病、病症或状况。在一些实施例中,疾病、病症或状况的特征在于趋化因子表达或功能(例如,异常趋化因子表达或功能)。
69.在一些实施例中,疾病、病症或状况是疼痛疾病、病症或状况。在一些实施例中,疾
病、病症或状况的特征在于离子通道表达或功能(例如,异常nav通道表达或功能)。
70.在许多实施例中,本文提供的非人动物是啮齿类动物;在一些实施例中,是小鼠;在一些实施例中,是大鼠。
71.如本技术中所用,术语"约"和"大约"可等同使用。本技术中与或不与约/大约一起使用的任何数字意在涵盖由相关领域普通技术人员所理解的任何正常波动。
72.本文公开的非人动物、细胞、核酸和组合物的其它特点、目的和优点在下述某些实施例的详细描述中是显而易见的。然而,应该理解,尽管指出了某些实施例,但详细描述仅作为说明而不是限制给出。
附图说明
73.本文中包括的由以下各图组成的附图仅用于举例说明目的而非用于限制。
74.图1a-1d显示了所选择的d6趋化因子诱饵受体编码序列的示例性优化,以包括体细胞超突变热点。图1a:具有天然(虚线填充)和人工(对角线填充)rgyw活化诱导胞苷脱氨酶(aid)热点位置的d6趋化因子诱饵受体的优化的nterm结构域;图1b:具有天然(虚线填充)和人工(对角线填充)rgyw活化诱导胞苷脱氨酶(aid)热点位置的d6趋化因子诱饵受体的优化的ec1结构域;图1c:具有天然(虚线填充)和人工(对角线填充)rgyw aid热点位置的d6趋化因子诱饵受体的优化的ec2结构域;图1d:具有天然(虚线填充)和人工(对角线填充)rgyw aid热点位置的d6趋化因子诱饵受体的优化的ec3结构域。
75.图2显示了针对每个核苷酸编码序列设计的示例性优化的5'和3'重组信号序列(rss)的表,以允许在v(d)j重组期间核苷酸编码序列的有效重组频率和相等使用。总体rss共有序列5’rss(seq id no:51);总体rss共有序列3’rss(seq id no:52);人dh共有序列5’rss(seq id no:53);人dh共有序列3’rss(seq id no:54);小鼠dh共有序列5’rss(seq id no:55);小鼠dh共有序列3’rss(seq id no:56);优化的rss 5’rss(seq id no:57);优化的rss 3’rss(seq id no:58);1-1 opt 5’rss(seq id no:59);1-1 opt 3’rss(seq id no:60);1-7 opt 5’rss(seq id no:61);1-7 opt 3’rss(seq id no:62);1-14 orf opt 5’rss(seq id no:63);1-14 orf opt 3’rss(seq id no:64);1-20 opt 5’rss(seq id no:65);1-20 opt 3’rss(seq id no:66);1-26 opt 5’rss(seq id no:67);1-26 opt 3’rss(seq id no:68);2-2*02 opt 5’rss(seq id no:69);2-2*02 opt 3’rss(seq id no:70);2-8*01 opt 5’rss(seq id no:71);2-8*01 opt 3’rss(seq id no:72);2-15 opt 5’rss(seq id no:73);2-15 opt 3’rss(seq id no:74);2-21*02 opt 5’rss(seq id no:75);2-21*02 opt 3’rss(seq id no:76);3-3*01 opt 5’rss(seq id no:77);3-3*01 opt 3’rss(seq id no:78);3-9 opt 5’rss(seq id no:79);3-9 opt 3’rss(seq id no:80);3-10*01 opt 5’rss(seq id no:81);3-10*01 opt 3’rss(seq id no:82);3-16*02 opt 5’rss(seq id no:83);3-16*02 opt 3’rss(seq id no:84);3-22 opt 5’rss(seq id no:85);3-22 opt 3’rss(seq id no:86);4-4 opt 5’rss(seq id no:87);4-4 opt 3’rss(seq id no:88);4-11 orf opt 5’rss(seq id no:89);4-11 orf opt 3’rss(seq id no:90);4-17 opt 5’rss(seq id no:91);4-17 opt 3’rss(seq id no:92);4-23 orf opt 5’rss(seq id no:93);4-23 orf opt 3’rss(seq id no:94);5-5 opt 5’rss(seq id no:95);5-5 opt 3’rss(seq id no:96);5-12 opt 5’rss(seq id no:97);5-12 opt 3’rss
(seq id no:98);5-18 opt 5’rss(seq id no:99);5-18 opt 3’rss(seq id no:100);5-24 orf opt 5’rss(seq id no:101);5-24 orf opt 3’rss(seq id no:102);6-6 opt 5’rss(seq id no:103);6-6 opt 3’rss(seq id no:104);6-13 opt 5’rss(seq id no:105);6-13 opt 3’rss(seq id no:106);6-19 opt 5’rss(seq id no:107);6-19 opt 3’rss(seq id no:108);6-25(未优化的)5’rss(seq id no:109);6-25(未优化的)3’rss(seq id no:110);7-27(未优化的)5’rss(seq id no:111);7-27(未优化的)3’rss(seq id no:112)。用于总体rss共有序列以及7-27的粗体和斜体字体指示基于来自免疫球蛋白和t细胞受体v、d和j基因区段的啮齿类动物和人rss与总体rss共有序列的匹配;用于小鼠dh共有序列的粗体字体指示与小鼠免疫球蛋白dh共有序列的匹配;用于人dh共有序列、优化的rss和所有剩余的rss(例如,1-1 opt、1-7 opt、1-20 opt等)的粗体字体指示与人免疫球蛋白dh共有序列的匹配。
76.图3a-3b显示了用于构建靶向载体的示例性策略的不按照比例的图示,所述靶向载体用于整合到啮齿类动物胚胎干(es)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的多样性簇(即dh区),所述多样性簇包括各自编码非免疫球蛋白多肽的一部分(例如d6趋化因子诱饵受体的细胞外部分)的一个或多个核苷酸序列。图3a:突出显示了四个初始步骤(1)d6编码序列的从头合成,(2)选择盒(例如新霉素)和d6 dna片段的agei/ecori消化和连接,(3)d6 dna片段的snabi消化和bac载体(pbace3.6)的noti/asci消化,和(4)消化的dna片段的一步等温装配,以产生d6趋化因子诱饵受体编码序列的连续经改造的多样性簇代替传统dh区段;图3b:用于产生用于整合到啮齿类动物es细胞的基因组内的靶向载体的另外步骤,(5)25个合成的d6趋化因子诱饵受体编码序列的pi-scei/i-ceui消化和连接到bac克隆内,以悬挂分别含有人免疫球蛋白v
h dn a和j
h dna的5'和3'同源臂。对于每个描绘的dna片段指出了各种限制酶识别位点。lp:loxp位点;neo:由泛素启动子驱动的新霉素选择盒;cm:氯霉素选择盒;frt:翻转酶识别靶序列;hyg:潮霉素选择盒;ei:鼠重链内含子增强子;igm:鼠免疫球蛋白m恒定区基因;lox:pbace3.6载体的loxp位点序列。
77.图4a-4b显示了通过顺序连接用于构建靶向载体,以装配d6趋化因子诱饵受体编码序列的替代示例性策略的不按照比例的图示,所述靶向载体用于整合到啮齿类动物胚胎干(es)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的多样性簇(即经改造的dh区),所述多样性簇包括各自编码d6趋化因子诱饵受体的细胞外部分的一个或多个核苷酸序列。图4a:突出显示了四个初始步骤(1)d6编码序列的从头合成,(2)选择盒(例如新霉素)和d6dna片段的agei/ecori消化和连接,(3)d6 dna片段的noti/asci消化和连接到bac载体(pbace3.6)内,和(4)d6片段的paci/nsi消化和连接到bac载体主链内;图4b:用于产生用于整合到啮齿类动物es细胞的基因组内的靶向载体的两个另外步骤,(5)另外的d6 dna片段的pi-scei/i-ceui消化和连接到bac载体主链内,和(6)最终的d6 dna片段的nsii/i-ceui消化和连接,以产生在bac载体主链内的25个合成的d6趋化因子诱饵受体编码序列。对于每个描绘的dna片段指出了各种限制酶识别位点;lp:loxp位点序列;neo:由泛素启动子驱动的新霉素选择盒;cm:氯霉素选择盒。
78.图5显示了通过筛选的电穿孔和核型分析后,使用抗药性克隆的遗传材料的示例性筛选策略。各种引物/探针组(参见表7)的名称和大致位置(由椭圆形包围的
线)(不按照比例)在显示的各种等位基因下方指出。hyg:由泛素启动子驱动的潮霉素选择盒;neo:由泛素启动子驱动的新霉素选择盒;l:loxp位点序列;frt:翻转酶识别靶序列。
79.图6a-6l显示了所选择的μ-芋螺毒素和狼蛛毒素编码序列的示例性优化,以包括体细胞超突变热点。图6a:具有人工(对角线填充)rgyw活化诱导胞苷脱氨酶(aid)热点位置的μ-芋螺毒素的优化的kiiia fl;图6b:具有人工(对角线填充)rgyw活化诱导胞苷脱氨酶(aid)热点位置的μ-芋螺毒素的优化的kiiia mini(上)和kiiia midi(下);图6c:具有人工(对角线填充)rgyw aid热点位置的μ-芋螺毒素的优化的piiia fl;图6d:具有人工(对角线填充)rgyw aid热点位置的μ-芋螺毒素的优化的piiia mini(上)和piiia midi(下);图6e:具有人工(对角线填充)rgyw aid热点位置的μ-芋螺毒素的优化的smiiia fl;图6f:具有人工(对角线填充)rgyw aid热点位置的μ-芋螺毒素的优化的smiiia mini(上)和smiiia midi(下);图6g:具有人工(对角线填充)rgyw aid热点位置的优化的protxii狼蛛毒素;图6h:具有人工(对角线填充)rgyw aid热点位置的优化的狼蛛毒素pro txii c1sc4s(上)、protxii c2sc5s(中)和protxii c3sc6s(下);图6i:具有人工(对角线填充)rgyw aid热点位置的μ-芋螺毒素的优化的smiiia ssrw环(左)、smiiia sskw环(中)和piiia rsrq环(右);图6j:具有人工(对角线填充)rgyw aid热点位置的dh3区段位置中,μ-芋螺毒素的优化的kiiia或smiiia mini/midi;图6k:具有人工(对角线填充)rgyw aid热点位置的dh3或dh1区段位置中,μ-芋螺毒素的优化的smiiia或piiia mini/midi;图6l:具有人工(对角线填充)rgyw aid热点位置的dh2区段位置中,μ-芋螺毒素的优化的ssrw或rsrq环。
80.图7a-7b显示了用于构建靶向载体的示例性策略的不按照比例的图示,所述靶向载体用于整合到啮齿类动物胚胎干(es)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述包括免疫球蛋白重链可变区经改造的多样性簇(即经改造的dh区),所述多样性簇包括各自编码非免疫球蛋白多肽的一部分(例如,μ-芋螺毒素和/或狼蛛毒素的一部分)的一个或多个核苷酸序列。图7a:突出显示了四个初始步骤(1)毒素编码序列的从头合成,(2)选择盒(例如新霉素)和毒素dna片段(tx-dh1166)的agei/ecori消化和连接,(3)毒素dna片段的snabi消化和bac载体(pbac e3.6)的noti/asci消化,和(4)消化的dna片段的一步等温装配,以产生经改造的多样性簇,所述经改造的多样性簇包含连续毒素编码序列代替一个或多个和任选地,所有功能性dh基因区段;图7b:用于产生用于整合到啮齿类动物es细胞的基因组内的靶向载体的另外步骤,(5)26个合成毒素编码序列的pi-scei/i-ceui消化和连接到bac克隆内,以悬挂分别含有人免疫球蛋白v
h dna和j
h dna的5'和3'同源臂。对于每个描绘的dna片段指出了各种限制酶识别位点;lp:loxp位点;neo:由泛素启动子驱动的新霉素选择盒;cm:氯霉素选择盒;frt:翻转酶识别靶序列;hyg:潮霉素选择盒;ei:鼠重链内含子增强子;igm:鼠免疫球蛋白m恒定区基因;lox:pba ce3.6载体的loxp。
81.图8a-8b显示了通过顺序连接用于构建靶向载体,以装配毒素(例如,μ-芋螺毒素和狼蛛毒素)的编码序列的替代示例性策略的不按照比例的图示,所述靶向载体用于整合到啮齿类动物胚胎干(es)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的多样性簇(即dh区),所述多样性簇包括各自编码毒素肽(例如,μ-芋螺毒素和狼蛛毒素protxii)的一部分的一个或多个核苷酸序列。图8a:突出显示了四个初始步骤(1)毒素编码序列的从头合成,(2)选择盒(例如新霉素)和毒素dna片段(tx-dh1166)的agei/ecori消化和连接,(3)毒素dna片段的noti/asci消化和连
接到bac载体(pbace3.6)内,和(4)毒素dna片段的paci/nsi消化和连接到bac载体主链内;图8b:用于产生用于整合到啮齿类动物es细胞的基因组内的靶向载体的两个另外步骤,(5)另外的毒素dna片段的pi-scei/i-ceui消化和连接到bac载体主链内,和(6)最终的毒素dna片段的nsii/i-ceui消化和连接,以产生在bac载体主链内的26个合成的毒素编码序列。对于每个描绘的dna片段指出了各种限制酶识别位点;lp:loxp位点;neo:由泛素启动子驱动的新霉素选择盒;cm:氯霉素选择盒。
82.图9a-9d显示了从(vi)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的脾中的淋巴细胞的代表性等高线图,所述小鼠对于含有毒素编码序列的经改造的dh区是纯合的(6579ho/1293ho,“tx-d
h ho”;具有基因组的啮齿类动物品系,所述基因组包含纯合的免疫球蛋白重链基因座,其含有多个人vh、包括毒素编码序列代替传统dh区段的经改造的dh区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的jh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];以及纯合的免疫球蛋白κ轻链基因座,其含有与包括啮齿类动物κ轻链增强子的啮齿类动物cκ区基因可操作地连接的人vκ和jκ基因区段)。图9a:对于单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了cd19(y轴)和cd3(x轴)的表达。图9b:对于cd19

门控的来自脾单峰的淋巴细胞的代表性等高线图,示出了免疫球蛋白d(igd,y轴)和免疫球蛋白m(igm,x轴)的表达;在每个点图上指出了成熟(cd19

igd

igm
int
)和过渡(cd19

igd
int igm)b细胞。图9c:对于cd19

门控的来自脾单峰的淋巴细胞的代表性等高线图,示出了igλ(y轴)或igκ(x轴)轻链的表达。图9d:显示了b细胞成熟的代表性等高线图,示出了对于cd19

门控的来自脾单峰的淋巴细胞,并且显示了cd93(y轴)和b220(x轴)、igm(y轴)和cd23(x轴);cd21/35(y轴)和igm(x轴)、b220(y轴)和cd23(x轴)、以及igd(y轴)和igm(x轴)[从左到右]的表达。顶部行:小鼠;底部行:tx-d
h ho(6579ho/1293ho)小鼠。每个点图上指出了特异性b细胞群体:未成熟(cd19

cd93

b220

)、成熟(cd19

cd93-b220

)、t1(cd19

cd93

b220

igm

cd23-)、t2(cd19

cd93

b220

igm

cd23

)、t3(cd19

cd93

b220

igm
int cd23

)、mz(cd19

cd93-b220

cd21/35

igm

cd23-)、mz前体(cd19

cd93-b220

cd21/35

igm

cd23

)、fol i(cd19

cd93-b220

cd21/35
int igm
int igd

)、以及fol ii(cd19

cd93-b220

cd21/35
int igm

igd

)
[0083]
图10a-10d显示了从(vi)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的骨髓中的淋巴细胞的代表性等高线图,所述小鼠对于含有毒素编码序列的经改造的dh区是纯合的(6579ho/1293ho,“tx-d
h ho”;具有基因组的啮齿类动物品系,所述基因组包含纯合的免疫球蛋白重链基因座,其含有多个人vh、包括毒素编码序列代替传统dh区段的经改造的dh区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的jh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];以及纯合的免疫球蛋白κ轻链基因座,其含有与包括啮齿类动物κ轻链增强子的啮齿类动物cκ区基因可操作地连接的人vκ和jκ基因区段)。图10a:对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图,示出了cd19(y轴)和cd3(x轴)的表达。图10b:对于cd19

igm-/low
igd

门控的来自骨髓的淋巴细胞的代表性等高线图,示出了c-kit(y轴)和cd43(x轴)的表达;在每个点图上指出了前(c-kit-cd43-)和原b(c-kit

cd43

)细胞。图10c:对于单峰门控的来自骨髓的淋巴细胞的代表
性等高线图,示出了igm(y轴)和b220(x轴)的表达;在每个点图上指出了未成熟(igm
int to
b220
int
)和成熟(igm
int to
b220

)b细胞。图10d:对于cd19

igm
int to
b220
int
(顶部行)和cd19

igm
int/
b220

(底部行)门控的来自骨髓的淋巴细胞的代表性等高线图,示出了igλ(y轴)或igκ(x轴)轻链的表达。
[0084]
图11a-11d显示了从(vi)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的脾中的淋巴细胞的代表性等高线图,所述小鼠对于含有d6编码序列的经改造的dh区是杂合的(6590het,“d6-d
h het”;具有基因组的啮齿类动物品系,所述基因组包含杂合的免疫球蛋白重链基因座,其含有多个人vh、包括d6趋化因子诱饵受体编码序列代替传统dh区段的经改造的dh区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的jh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940])。图11a:对于单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了cd19(y轴)和cd3(x轴)的表达。图11b:对于cd19

单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了igd(y轴)和igm(x轴)的表达;在每个点图上指出了成熟(cd19

igd

igm
int
)和过渡(cd19

igd
int igm

)b细胞。图11c:对于cd19

单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了igλ(y轴)或igκ(x轴)轻链的表达。图11d:显示了b细胞成熟的代表性等高线图,示出了对于cd19

单峰门控的来自脾的淋巴细胞,并且显示了cd93(y轴)和b220(x轴)、igm(y轴)和cd23(x轴);cd21/35(y轴)和igm(x轴)、b220(y轴)和cd23(x轴)、以及igd(y轴)和igm(x轴)[从左到右]的表达。顶部行:小鼠;底部行:d6-d
h het(6590het)小鼠。每个点图上指出了特异性b细胞群体:未成熟(cd19

cd93

b220

)、成熟(cd19

cd93-b220

)、t1(cd19

cd93

b220

igm

cd23-)、t2(cd19

cd93

b220

igm

cd23

)、t3(cd19

cd93

b220

igm
int cd23

)、mz(cd19

cd93-b220

cd21/35

igm

cd23-)、mz前体(cd19

cd93-b220

cd21/35

igm

cd23

)、fol i(cd19

cd93-b220

cd21/35
int igm
int igd

)、以及fol ii(cd19

cd93-b220

cd21/35
int igm

igd

)
[0085]
图12α-12d显示了从(vi)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的骨髓中的淋巴细胞的代表性等高线图,所述小鼠对于含有d6编码序列的经改造的dh区是杂合的(6590het,“d6-d
h het”;具有基因组的啮齿类动物品系,所述基因组包含杂合的免疫球蛋白重链基因座,其含有多个人vh、包括d6趋化因子诱饵受体编码序列代替传统dh区段的经改造的dh区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的jh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940])。图12a:对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图,示出了cd19(y轴)和cd3(x轴)的表达。图12b:对于cd19

igμ-to low igd

门控的来自骨髓的淋巴细胞的代表性等高线图,示出了c-kit(y轴)和cd43(x轴)的表达;在每个点图上指出了前b(c-kit-cd43-)和原b(c-kit

cd43

)细胞。图12c:对于cd19

门控的来自骨髓的淋巴细胞的代表性等高线图,示出了igm(y轴)和b220(x轴)的表达;在每个点图上指出了未成熟(igm
int to
b220
int
)和成熟(igm
int to
b220

)b细胞、前和原b细胞(igμ-to low b220
int
)。图12d:对于cd19

igm
int to
b220
int
(顶部行)和cd19

igm
int to
b220

(底部行)门控的来自骨髓的淋巴细胞的代表性等高线图,示出了igλ(y轴)或igκ(x轴)轻链的表达。
[0086]
图13α-13d显示了从(vi)和小鼠中收获,并且就各种细胞标
记物的细胞表面表达染色的脾中的淋巴细胞的代表性等高线图,所述小鼠对于含有d6编码序列的经改造的dh区是纯合的(6590ho/1293ho,“d6-d
h ho”;具有基因组的啮齿类动物品系,所述基因组包含纯合的免疫球蛋白重链基因座,其含有多个人vh、包括d6趋化因子诱饵受体编码序列代替传统dh区段的经改造的dh区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的jh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];以及纯合的免疫球蛋白κ轻链基因座,其含有与包括啮齿类动物κ轻链增强子的啮齿类动物cκ区基因可操作地连接的人vκ和jκ基因区段)。图13a:对于单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了cd19(y轴)和cd3(x轴)的表达。图13b:对于cd19

门控的来自脾的淋巴细胞的代表性等高线图,示出了igd(y轴)和igm(x轴)的表达;在每个点图上指出了成熟(cd19

igd

igm
int
)和过渡(cd19

igd
int igm

)b细胞。图13c:对于cd19

门控的来自脾的淋巴细胞的代表性等高线图,示出了igλ(y轴)或igκ(x轴)轻链的表达。图13d:显示了b细胞成熟的代表性等高线图,示出了对于cd19

单峰门控的来自脾的淋巴细胞,并且显示了cd93(y轴)和b220(x轴)、igm(y轴)和cd23(x轴);cd21/35(y轴)和igm(x轴)、b220(y轴)和cd23(x轴)、以及igd(y轴)和igm(x轴)[从左到右]的表达。顶部行:小鼠;底部行:d6-d
h ho(6590ho)小鼠。每个点图上指出了特异性b细胞群体:未成熟(cd19

cd93

b220

)、成熟(cd19

cd93-b220

)、t1(cd19

cd93

b220

igm

cd23-)、t2(cd19

cd93

b220

igm

cd23

)、t3(cd19

cd93

b220

igm
int cd23

)、mz(cd19

cd93-b220

cd21/35

igm

cd23-)、mz前体(cd19

cd93-b220

cd21/35

igm

cd23

)、fol i(cd19

cd93-b220

cd21/35
int igm
int igd

)、以及fol ii(cd19

cd93-b220

cd21/35
int igm

igd

)
[0087]
图14α-14d显示了从(vi)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的骨髓中的淋巴细胞的代表性等高线图,所述小鼠对于含有d6编码序列的经改造的ddh区是杂合的(6590ho/1293ho,“d6-dd
h ho”;具有基因组的啮齿类动物品系,所述基因组包含纯合的免疫球蛋白重链基因座,其含有多个人vdh、包括d6趋化因子诱饵受体编码序列代替传统ddh区段的经改造的ddh区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的jdh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];以及纯合的免疫球蛋白κ轻链基因座,其含有与包括啮齿类动物κ轻链增强子的啮齿类动物cκ区基因可操作地连接的人vκ和jκ基因区段)。图14a:对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图,示出了c d19(y轴)和cd3(x轴)的表达。图14b:对于cd19

igμ-to low
igd

门控的来自骨髓的淋巴细胞的代表性等高线图,示出了c-kit(y轴)和cd43(x轴)的表达;在每个点图上指出了前b(c-kit-cd43-)和原b(c-kit

cd43

)细胞。图14c:对于cd19

门控的来自骨髓的淋巴细胞的代表性等高线图,示出了igm(y轴)和b220(x轴)的表达;在每个点图上指出了未成熟(igm
int to
b220
int
)和成熟(igm
int to
b220

)b细胞、前和原b细胞(igμ-to low b220
int
)。图14d:对于cd19

igm
int to
b220
int
(顶部行)和cd19

igm
int to
b220

(底部行)门控的来自骨髓的淋巴细胞的代表性等高线图,示出了igλ(y轴)或igκ(x轴)轻链的表达。
[0088]
图15显示了来自三只6579ho/1293ho小鼠(“tx-d
h ho”,同上)的脾和骨髓(组合的所有vh家族,不反映定量vh使用)的扩增rna中的经改造的dh区中的毒素编码序列的代表性使用频率。y轴指出了经改造的dh区内每个毒素编码序列的名称。x轴指出了在分析的序列
读数中每个毒素编码序列的频率(序列的百分比)。
[0089]
图16显示了来自三只6579ho/1293ho小鼠(“tx-d
h ho”,同上)的脾和骨髓(组合的所有vh家族,不反映定量vh使用)的扩增rna中的人vh基因区段的代表性百分比使用。x轴指出了人源化的重链可变区内的每个人vh基因区段的名称。
[0090]
图17显示了来自三只6579ho/1293ho小鼠(“tx-d
h ho”,同上)的脾和骨髓(组合的所有vh家族,不反映定量jh使用)的扩增rna中的人jh基因区段的代表性百分比使用。x轴指出了在人源化的重链可变区内的每个人jh基因区段的名称。
[0091]
图18显示了来自三只6590het小鼠(“d6-d
h het”,同上)的脾和骨髓(组合的所有vh家族,不反映定量vh使用)的扩增rna中的经改造的dh区中所选择的d6编码序列的代表性使用频率。y轴指出了经改造的dh区内所选择的d6编码序列的名称。x轴指出了在分析的序列读数中d6编码序列的频率(序列的百分比)。bm:骨髓。
[0092]
图19显示了来自三只6590het小鼠(“d6-d
h het”,同上)的脾和骨髓(组合的所有vh家族,不反映定量vh使用)的扩增rna中的人vh基因区段的代表性百分比使用。x轴指出了人源化的重链可变区内的每个人vh基因区段的名称。bm:骨髓。
[0093]
图20显示了来自三只6590het小鼠(“d6-d
h het”,同上)的脾和骨髓(组合的所有vh家族,不反映定量jh使用)的扩增rna中的人jh基因区段的代表性百分比使用。x轴指出了在人源化的重链可变区内的每个人jh基因区段的名称。bm:骨髓。
[0094]
图21显示了用经改造的可溶形式的细胞表面蛋白免疫后,来自对照和6579ho/1634动物(x轴)的超过本底的滴度(y轴)。
[0095]
定义
[0096]
阅读本公开内容的本领域技术人员将意识到可能与这些所描述的实施例等价或另外在本公开内容的范围内的各种修改。一般而言,除非另外明确说明,否则本文使用的术语根据其在本领域中理解的含义。本文和下文提供了某些术语的明确定义;这些和其它术语在说明书自始至终在特定情况下的含义根据上下文对于本领域技术人员是明确的。下述术语和其它术语的另外定义在说明书各处阐述。本说明书中引用的参考文献或其相关部分以引用的方式并入本文。
[0097]
施用:指将组合物施用于受试者或系统(例如细胞、器官、组织、生物、或相关组分或其组分组)。本领域普通技术人员将了解,施用途径可根据例如组合物待施用于其的受试者或系统、组合物的性质、施用目的等而变化。例如,在一些实施例中,对动物受试者(例如人或啮齿类动物)的施用可为支气管(包括通过支气管滴注)、颊、肠、皮间(interdermal)、动脉内、皮内、胃内、髓内、肌内、鼻内、腹膜内、鞘内、静脉内、心室内、粘膜、鼻腔、口腔、直肠、皮下、舌下、局部、气管(包括通过气管内滴注)、透皮、阴道和/或玻璃体。在一些实施例中,施用可涉及间歇给药。在一些实施例中,施用可涉及连续给药(例如,灌注)至少所选择的时间段。
[0098]
术语“抗体”包括通常的免疫球蛋白分子,其包含四条多肽链,通过二硫键互连的两条重链(h)(其各自可包含由经改造的dh簇编码的氨基酸序列)和两条轻链(l)(其可为共同轻链)。该术语还包括对抗原或其片段具有反应性的免疫球蛋白。合适的抗体包括但不限于人抗体、灵长类化抗体、嵌合抗体、单克隆抗体、单特异性抗体、多克隆抗体、多特异性抗体、非特异性抗体、双特异性抗体、多重特异性抗体、人源化抗体、合成抗体、重组抗体、杂交
抗体、突变抗体、移植缀合抗体(即与其它蛋白质、放射性标记、细胞毒素缀合或融合的抗体)和体外生成的抗体。技术人员将容易地识别常见抗体同种型,例如具有选自igg、iga、igm、igd和ige及其任何亚类(例如igg1、igg2、igg3和igg4)的重链恒定区的抗体)。
[0099]
大约:当应用于一个或多个目的值时,指与所述参考值相似的值。在某些实施例中,除非另有所指或根据上下文明显不同,否则术语“大约”或“约”是指在任一方向(大于或小于)上落在所述参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小内的值的范围(除了这样的数字将超过可能值的100%的情况外)。
[0100]
生物学活性:指在生物系统中、在体外或体内(例如在生物中)具有活性的任何试剂的特征。例如,当存在于生物中时,在该生物内具有生物效应的试剂视为生物活性的。在特定实施例,当蛋白质或多肽具有生物活性时,所述该蛋白质或多肽的共享所述蛋白质或多肽的至少一种生物活性的部分通常被称为“生物活性”部分。
[0101]
可比较的:指两个或更多个试剂、实体、情况、条件组等,其可彼此不相同,但足够相似以允许在其间的比较,使得可基于观察到的差异或相似性合理地得出结论。本领域普通技术人员在上下文中将理解,在任何给定的情况下,对于两种或更多种这样的药剂、实体、情形、条件组等需要多大程度的同一性来被认为是可比较的。
[0102]
短语“互补决定区”或术语“cdr”包括由生物的免疫球蛋白基因的核酸序列编码的氨基酸序列,其通常(即在野生型动物中)出现在免疫球蛋白分子(例如抗体或t细胞受体)的轻链或重链的可变区中的两个构架区之间。cdr可由例如种系序列或者重排或未重排序列,以及例如天然或成熟的b细胞或t细胞编码。cdr可为体细胞突变的(例如,不同于动物的种系中编码的序列)、人源化的和/或用氨基酸取代、添加或缺失修饰的。在一些情况下(例如对于cdr3),cdr可由两个或更多个序列(例如,种系序列)编码,所述两个或更多个序列是不邻接的(例如,未重排的核酸序列中),但在b细胞核酸序列中是邻接的,例如由于剪接或连接序列(例如,v-d-j重组以形成重链cdr3)。
[0103]
保守:提及保守氨基酸取代,指氨基酸残基由具有含有相似化学性质(例如电荷或疏水性)的侧链r基团的另一个氨基酸残基的取代。一般来讲,保守氨基酸取代基本上不会改变蛋白质的所关注的功能性质,例如,受体结合配体的能力。具有含有相似化学性质的侧链的氨基酸组的例子包括:脂肪族侧链如甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;脂肪族-羟基侧链如丝氨酸和苏氨酸;含酰胺侧链如天冬酰胺和谷氨酰胺;芳香族侧链如苯丙氨酸、酪氨酸和色氨酸;碱性侧链如赖氨酸、精氨酸和组氨酸;酸性侧链如天冬氨酸和谷氨酸;以及含硫侧链如半胱氨酸和甲硫氨酸。保守氨基酸取代组包括例如缬氨酸/亮氨酸/异亮氨酸、苯丙氨酸/酪氨酸、赖氨酸/精氨酸、丙氨酸/缬氨酸、谷氨酸/天冬氨酸以及天冬酰胺/谷氨酰胺。在一些实施例中,保守氨基酸取代可为丙氨酸对蛋白质中的任何天然残基的取代,如例如丙氨酸扫描诱变中所使用的。在一些实施例中,制备保守取代,其在gonnet,g.h.等人,1992,science 256:1443-1445中公开的pam250对数似然矩阵中具有正值,所述参考文献以引用的方式并入本文。在一些实施例中,取代是中等保守取代,其中所述取代在pam250对数似然矩阵中具有非负值。
[0104]
对照:指“对照”是结果针对其进行比较的标准的本领域理解的含义。通常,对照通过分离变量以得出有关此类变量的结论而用于增进实验完整性。在一些实施例中,对照是
与测试反应或测定同时进行以提供对比物的反应或测定。“对照”可指“对照动物”。“对照动物”可具有如本文所述的修饰,与本文所述的修饰不同的修饰或不具有修饰(即,野生型动物)。在一个实验中,应用"测试"(即,待测试的变量)。在第二个实验中,不应用“对照”,待测试的变量。在一些实施例中,对照是历史对照(即,此前进行的测试或测定,或此前已知的量或结果)。在一些实施例中,对照是或包括印刷或以其他方式保存的记录。对照可为阳性对照或阴性对照。
[0105]
破坏:指与dna分子(例如,与内源同源序列如基因或基因基因座)的同源重组事件的结果。在一些实施例中,破坏可实现或代表插入、缺失、取代、替换、错义突变或dna序列移码或它们的组合。插入可包括插入整个基因、基因片段例如外显子(其可具有除内源序列外的起源(例如,异源序列))、或者从特定目的基因衍生或分离的编码序列。在一些实施例中,破坏可提高基因或基因产物的(例如由基因编码的蛋白质的)表达和/或活性。在一些实施例中,破坏可降低基因或基因产物的表达和/或活性。在一些实施例中,破坏可改变基因或编码的基因产物(例如编码的蛋白质)的序列。在一些实施例中,破坏可截短基因或编码的基因产物(例如编码的蛋白质)或使其片段化。在一些实施例中,破坏可延伸基因或编码的基因产物。在一些这样的实施例中,破坏可实现融合蛋白的装配。在一些实施例中,破坏可影响基因或基因产物的水平,但不影响其活性。在一些实施例中,破坏可影响基因或基因产物的活性,但不影响其水平。在一些实施例中,破坏可对基因或基因产物的水平没有显著影响。在一些实施例中,破坏可对基因或基因产物的活性没有显著影响。在一些实施例中,破坏可对基因或基因产物的水平或活性都没有显著影响。
[0106]
确定、测量、评估、评价、测定和分析:可互换使用以指任何形式的测量,并且包括确定元素是否存在。这些术语包括定量和/或定性测定。测定可为相对的或绝对的。“测定...的存在”包括确定存在的某物的量和/或确定其是否存在。
[0107]
内源性基因座或内源性基因:指在引入如本文所述的改变、破坏、缺失、插入、修饰、取代或替换之前,在亲本或参考生物中发现的遗传基因座。在一些实施例中,内源基因座全部或部分包含在自然界中发现的序列。在一些实施例中,内源性基因座为野生型基因座。在一些实施例中,参考生物是野生型生物。在一些实施例中,参考生物是经改造的生物。在一些实施例中,参考生物是实验室繁殖的生物(无论是野生型还是经改造的)。
[0108]
内源启动子指例如在野生型生物中与内源基因天然相关的启动子。
[0109]
经改造的:一般而言,指已通过人为操纵的方面。例如,在一些实施例中,当不以自然界中的顺序连接在一起的两个或更多个序列通过人为操纵而在经改造的多核苷酸中直接彼此连接时,多核苷酸可被视为“经改造的”。在一些具体的此类实施例中,经改造的多核苷酸可以包含自然界中存在的与第一编码序列可操作地结合但不与第二编码序列可操作地结合的调控序列,该调控序列通过人为连接而使得其与第二编码序列可操作地结合。可替代地或另外地,在一些实施例中,各自编码在自然界中彼此不连接的多肽元件或结构域的第一核酸序列和第二核酸序列可在单个经改造的多核苷酸中彼此连接。相比之下,在一些实施例中,如果细胞或生物已被操纵而使得其遗传信息被改变(例如,先前不存在的新遗传物质已经被引入,或者先前存在的遗传物质已被改变或移除),则该细胞或生物可以被视为“经改造的”。如通常实践并且由本领域的技术人员所理解的,即使实际的操作是对先前的实体进行的,经改造的多核苷酸或细胞的子代通常仍然被称为“经改造的”。此外,本领域
的技术人员将认识到,可以通过多种可用的方法来实现本文所述的“改造”。例如,在一些实施例中,“改造”可以涉及通过使用计算机系统进行选择或设计(例如,核酸序列、多肽序列、细胞、组织和/或生物),所述计算机系统经编程以执行分析或比较,或者分析、推荐和/或选择序列、改变等)。可替代地或另外地,在一些实施例中,“改造”可涉及使用体外化学合成方法和/或重组核酸技术,例如核酸扩增(例如,经由聚合酶链反应)、杂交、突变、转化、转染等、和/或各种受控交配方法中的任一种。如本领域技术人员了解的,各种已建立的此类技术(例如用于重组dna、寡核苷酸合成和组织培养和转化(例如电穿孔、脂转染等)是本领域众所周知的,并且在本说明书自始至终引用和/或讨论的各种一般和更具体的参考文献中描述。参见例如sambrook等人,molecular cloning:a la boratory manual(第2版,cold spring harbor laboratory press,cold spring harbor,n.y.,1989)。
[0110]
基因:指编码产物(例如,rna产物和/或多肽产物)的染色体中的dna序列。在一些实施例中,基因包括编码序列(即,编码特定产物的序列)。在一些实施例中,基因包括非编码序列。在一些特定实施例中,基因可以包括编码(例如,外显子)和非编码(例如,内含子)序列二者。在一些实施例中,基因可包括一个或多个调控序列(例如启动子、增强子等)和/或内含子序列,其例如可控制或影响基因表达的一个或多个方面(例如细胞类型特异性表达、诱导型表达等)。为了清楚起见,我们注意到,如在本专利申请中使用的,术语“基因”一般指编码多肽的核酸的一部分;该术语可任选涵盖调控序列,如根据上下文对于本领域的普通技术人员将明确的。该定义并非预期排除将术语“基因”应用于非蛋白质编码表达单元,而是为了阐明在大多数情况下,如本文件中使用的该术语指编码多肽的核酸。
[0111]
短语“基因区段”或“区段”包括提及v(轻或重)或者d或j(轻或重)免疫球蛋白基因区段,其包括在免疫球蛋白基因座处(例如在人和小鼠中)的未重排序列,所述未重排序列可参与重排(由例如内源性重组酶介导的),以形成重排的v/j(轻)或v/d/j(重)序列。除非另有说明,否则v、d和j区段包含允许根据12/23规则的v/j重组或v/d/j重组的重组信号序列(rss)。除非另有说明,否则区段还包含它们在自然界中与之结合的序列或其功能等价物(例如,对于v区段,启动子和前导序列)。
[0112]
提及免疫球蛋白核酸序列的术语“种系”包括可传递给后代的核酸序列,例如可在生殖细胞中发现的种系基因组。
[0113]
短语“重链”或“免疫球蛋白重链”包括来自任何生物的免疫球蛋白重链序列,包括免疫球蛋白重链恒定区序列。除非另有说明,否则重链可变结构域包括三个重链互补决定区(cdr)和四个fr区。重链片段包括cdr、cdr和fr及其组合。典型的重链在可变结构域之后具有(从n末端到c末端)ch1结构域、铰链、ch2结构域、ch3结构域和c
h-4结构域(在igm或ige的情况下)。重链的功能片段包括能够特异性识别表位(例如,以在微摩尔、纳摩尔或皮摩尔范围内的kd识别表位)的片段,其能够由细胞表达且分泌,以及包含至少一个cdr。重链可变结构域由可变区基因序列编码,所述可变区基因序列一般包含源自存在于种系中的vh、dh和jh区段储库的vh、dh和jh区段。可在www.imgt.org处发现的国际免疫遗传学信息系统(international immunogenetics information system)(imgt)网站上查看各种生物的v、d和j重链区段的序列、位置和命名。
[0114]
短语“轻链”包括来自任何生物的免疫球蛋白轻链序列,并且除非另有说明,否则包括人κ和λ轻链和vpreb以及替代轻链。除非另有说明,否则轻链可变结构域通常包括三个
轻链互补决定区(cdr)和四个构架(fr)区。一般地,全长轻链从氨基末端到羧基末端包括可变结构域和轻链恒定区,所述可变结构域包括fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4。轻链可变结构域由轻链可变区基因序列编码,所述轻链可变区基因序列一般包含源自种系中存在的v
l
和j
l
基因区段储库的v
l
和j
l
基因区段。可在ww w.imgt.org处发现的国际免疫遗传学信息系统(imgt)网站上查看各种生物的v和j轻链区段的序列、位置和命名。轻链包括例如不选择性结合由它们在其中出现的表位结合蛋白选择性结合的第一表位或第二表位的那些轻链。轻链还包括结合并识别、或帮助重链结合并识别由它们在其中出现的表位结合蛋白选择性结合的一个或多个表位的那些轻链。短语轻链包括“共同轻链”,也被称为“通用轻链”(ulc)。
[0115]
共同或通用轻链(ulc)包括源自免疫球蛋白轻链基因座的那些,所述免疫球蛋白轻链基因座包含与轻链恒定区可操作地连接的单个重排的免疫球蛋白轻链可变区编码序列,其中所述免疫球蛋白轻链基因座的表达仅产生源自可操作性连接至轻链恒定区的单个重排的免疫球蛋白轻链可变区的轻链,不管在免疫球蛋白轻链基因座中是否包括其它核酸序列,例如其它轻链基因区段。通用轻链包括人vκ1-39jκ基因(例如vκ1-39jκ5基因)或人vκ3-20jκ基因(例如vκ3-20jκ1基因),并且包括其体细胞突变的(例如,亲和力成熟的)形式。
[0116]
异源的:指来自不同来源的试剂或实体。例如,当用于提及存在于特定细胞或生物中的多肽、基因或基因产物时,该术语阐明相关多肽或其片段、基因或其片段、或者基因产物或其片段:1)被人为改造;2)被人为(例如,经由遗传改造)引入细胞或生物(或其前体)中;和/或3)是由相关细胞或生物(例如,相关细胞类型或生物类型)非天然地产生或非天然地存在于所述细胞或生物中。如本文使用的,术语“异源”还包括这样的多肽或其片段、基因或其片段、或者基因产物或其片段,其通常存在于特定天然细胞或生物中,但已例如通过突变或置于非天然结合以及在一些实施例中非内源性调节元件(例如启动子)的控制下进行修饰。
[0117]
宿主细胞:指异源(例如外源)核酸或蛋白质已引入其内的细胞。本领域技术人员在阅读本公开内容后将理解,此类术语不仅指特定的主题细胞,而且还用于指该细胞的子代。因为某些修饰可因突变或环境影响而在后续世代中发生,所以这样的子代事实上可不等同于亲本细胞,但仍包括在如本文中使用的术语“宿主细胞”的范围内。在一些实施例中,宿主细胞为原核或真核细胞或包含原核或真核细胞。一般来讲,宿主细胞是适于接受和/或产生异源核酸或蛋白质的任何细胞,而与所述细胞被指定所属的生命界无关。示例性细胞包括原核生物和真核生物(单细胞或多细胞)的那些、细菌细胞(例如大肠杆菌(escherichia coli)、芽孢杆菌属物种(bacillus spp.)、链霉菌属物种(streptomyces spp.)等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如酿酒酵母(saccharomyces cerevisiae)、粟酒裂殖酵母(schizosaccharomyces pombe)、巴斯德毕赤酵母(pichia pastoris)、甲醇毕赤酵母(pichia methanolica)等)、植物细胞、昆虫细胞(例如sf-9、sf-21、杆状病毒感染的昆虫细胞、粉纹夜蛾(trichoplusia ni)等)、非人动物细胞、人细胞或细胞融合物,例如杂交瘤或四源杂交瘤。在一些实施例中,细胞为人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施例中,细胞为真核细胞并且选自以下细胞:cho(例如cho k1、dxb-11cho、veggie-cho)、cos(例如cos-7)、视网膜细胞、vero、cv1、肾(例如hek293、293ebna、msr 293、mdck、hak、bhk)、hela、hepg2、wi38、mrc 5、colo205、hb 8065、hl-60、(例如
bhk21)、jurkat、daudi、a431(表皮的)、cv-1、u937、3t3、l细胞、c127细胞、sp2/0、ns-0、mmt 060562、sertoli细胞、brl 3a细胞、ht1080细胞、骨髓瘤细胞、肿瘤细胞和来源于前述细胞的细胞系。在一些实施例中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如per.细胞)。在一些实施例中,宿主细胞为分离的细胞或包含分离的细胞。在一些实施例中,宿主细胞为组织的一部分。在一些实施例中,宿主细胞为生物的一部分。
[0118]
同一性:与序列比较结合使用指如通过本领域已知的可用于测量核苷酸和/或氨基酸序列同一性的多种不同算法确定的同一性。在一些实施例中,使用clustalw v.1.83(慢)比对(利用10.0的开放缺口罚分、0.1的延伸缺口罚分)和使用gonnet相似性矩阵(macvector
tm
10.0.2,macvector inc.,2008)来确定本文所述的同一性。
[0119]
在体外:指在人工环境中,例如在试管或反应容器中,在细胞培养等中,而不是在多细胞生物内发生的事件。
[0120]
在体内:指在多细胞生物例如人和非人动物内发生的事件。在基于细胞的系统的背景下,该术语可用于指在活细胞内(与例如体外系统相反)发生的事件。
[0121]
分离的:指在最初生产时(无论在自然界中和/或在实验环境中),已(1)与它结合的至少一些组分分开,和/或(2)通过人为设计、产生、制备和/或制造的物质和/或实体。分离的物质和/或实体可与约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%的最初与其关联的其他组分分离。在一些实施例中,分离的药剂为约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%纯的。如本文所用,如果物质基本上不含其他组分,则其是“纯的”。在一些实施例中,如将被本领域技术人员所理解的,物质在与某些其他组分例如一种或多种载体或赋形剂(例如,缓冲液、溶剂、水等)组合后,仍可被认为是“分离的”或甚至“纯的”;在此类实施例中,计算物质在不包括此类载体或赋形剂情况下的分离百分比或纯度。只是给出一个实例,在一些实施例中,天然存在的生物聚合物诸如多肽或多核苷酸a)在因其衍生的起源或来源而不与在其天然状态下天然伴随其的一些或全部组分关联时;b)在其基本上不含与天然产生其的物种相同的物种的其他多肽或核酸时;c)当由不是天然产生其的物种的细胞或其他表达系统表达或以其他方式与来自所述细胞或其他表达系统的组分关联时,被认为是“分离的”。因此,例如,在一些实施例中,化学合成的或在与天然产生其的细胞系统不同的细胞系统中合成的多肽被认为是"分离的"多肽。可替代地或另外地,在一些实施例中,已历经一种或多种纯化技术的多肽在其已与a)在自然界中与其关联的;和/或b)当最初产生时与其关联的其他组分分离的程度上可被认为是“分离的”多肽。
[0122]
非人动物:指并非人的任何脊椎动物生物。在一些实施例中,非人动物为圆口纲脊椎动物、硬骨鱼、软骨鱼(例如,鲨鱼或鳐)、两栖动物、爬行动物、哺乳动物或鸟。在一些实施例中,非人哺乳动物为灵长类动物、山羊、绵羊、猪、狗、牛或啮齿类动物。在一些实施例中,非人动物为诸如大鼠或小鼠的啮齿动物。
[0123]
核酸:在其最广泛的意义上,指掺入或可掺入寡核苷酸链内的任何化合物和/或物质。在一些实施例中,“核酸”是通过磷酸二酯键联被掺入到或可被掺入到寡核苷酸链中的化合物和/或物质。从上下文可以看出,在一些实施例中,“核酸”是指单个核酸残基(例如核苷酸和/或核苷);在一些实施例中,“核酸”是指含有含单个核酸残基的寡核苷酸链。在一些
实施例中,“核酸”为rna或包含rna;在一些实施例中,“核酸”为dna或包含dna。在一些实施例中,“核酸”为一个或多个天然核酸残基、包含一个或多个天然核酸残基或由一个或多个天然核酸残基组成。在一些实施例中,“核酸”为一个或多个核酸类似物、包含一个或多个核酸类似物或由一个或多个核酸类似物组成。在一些实施例中,核酸类似物与“核酸”的差别在于其不利用磷酸二酯主链。例如,在一些实施例中,“核酸”为一个或多个“肽核酸”、包含一个或多个肽核酸、或者由一个或多个“肽核酸”组成,所述“肽核酸”是本领域已知的,并且在主链中具有肽键代替磷酸二酯键。可替代地或另外地,在一些实施例中,“核酸”具有一个或多个硫代磷酸酯和/或5
’‑
n-亚磷酰胺键而不是磷酸二酯键。在一些实施例中,“核酸”为一个或多个天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)、包含一个或多个天然核苷、或由一个或多个天然核苷组成。在一些实施例中,“核酸”为一个或多个核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、c-5丙炔基-胞苷、c-5丙炔基-尿苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基-尿苷、c5-丙炔基-胞苷、c5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、o(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、插入型碱基及其组合)、包含一个或多个核苷类似物或由一个或多个核苷类似物组成。在一些实施例中,与天然核酸中的糖相比,“核酸”包含一个或多个经修饰的糖(例如,2'-氟核糖、核糖、2
’‑
脱氧核糖、阿拉伯糖和己糖)。在一些实施例中,“核酸”具有编码功能性基因产物诸如rna或蛋白质的核苷酸序列。在一些实施例中,“核酸”具有编码多肽片段(例如肽)的核苷酸序列。在一些实施例中,“核酸”包括一个或多个内含子。在一些实施例中,“核酸”包括一个或多个外显子。在一些实施例中,“核酸”包括一个或多个编码序列。在一些实施例中,“核酸”通过下述方式中的一种或多种来制备:从天然来源分离、通过基于互补模板的聚合(体内或体外)进行的酶促合成、在重组细胞或系统中的复制、化学合成及其组合。在一些实施例中,“核酸”的长度为至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000个或更多个残基。在一些实施例中,“核酸”为单链的;在一些实施例中,“核酸”为双链的。在一些实施例中,“核酸”具有包含至少一个元件的核苷酸序列,所述至少一个元件编码多肽或其片段,或者是编码多肽或其片段的序列的互补体。在一些实施例中,“核酸”具有酶促活性。
[0124]
可操作地连接:指其中所述组分处于允许它们以其预期方式起作用的关系中的并列。与编码序列"可操作地连接"的控制序列以这样的方式连接,使得在与控制序列相容的条件下获得编码序列的表达。"可操作地连接"序列包括与所关注的基因相邻的表达控制序列和以反式方式作用或远距离作用以控制所关注的基因的表达控制序列。如本文使用的,术语“表达控制序列”指多核苷酸序列,其是影响它们与之连接的编码序列的表达和加工所必要的多核苷酸序列。“表达控制序列”包括合适的转录起始、终止、启动子和增强子序列;有效的rna加工信号例如剪接和多聚腺苷酸化信号;使细胞质mrna稳定的序列;增强翻译效率的序列(即kozak共有序列);增强蛋白稳质定性的序列;以及当需要时,增强蛋白分质泌的序列。这种控制序列的性质取决于宿主生物而不同。例如,在原核生物中,这种控制序列一般包括启动子、核糖体结合位点和转录终止序列,而在真核生物中,通常地,这种控制序
列包括启动子和转录终止序列。术语"控制序列"旨在包括其存在对于表达和加工来说是必需的组分,并且还可包括额外的组分,其存在是有利的,例如,前导序列和融合配偶体序列。
[0125]
生理条件:包括细胞或生物在其下生存和/或繁殖的其领域理解含义的参考条件。在一些实施例中,该术语指对于生物或细胞系统在自然界可发生的外部或内部环境的条件。在一些实施例中,生理条件是存在于人或非人动物体内的那些条件,尤其是存在于手术部位处和/或手术部位内的那些条件。生理条件通常包括例如20-40℃的温度范围、大气压力1、ph 6-8、1-20mm的葡萄糖浓度、以大气水平的氧浓度和如它在地球上遇到的重力。在一些实施例中,实验室中的条件在生理条件下操纵和/或维持。在一些实施例中,生理条件在生物(例如,非人动物)中遇到。
[0126]
多肽:指氨基酸的任何聚合链。在一些实施例中,多肽具有天然存在的氨基酸序列。在一些实施例中,多肽具有非天然存在的氨基酸序列。在一些实施例中,多肽具有氨基酸序列,其包含彼此单独天然存在的部分(即,来自两种或更多种不同的生物,例如,人和非人部分)。在一些实施例中,多肽具有通过人为行为进行设计和/或产生的被改造的氨基酸序列。在一些实施例中,多肽可包含多个片段或由多个片段组成,所述片段各自相对于彼此以与目的多肽中发现的那种不同的空间排列在相同亲本多肽中发现(例如在亲本中直接连接的片段可在目的多肽中在空间上分开,或反之亦然,和/或片段可在目的多肽中以与在亲本中不同的次序存在),使得目的多肽是其亲本多肽的衍生物。
[0127]
重组体:指通过重组手段设计、改造、制备、表达、产生或分离的多肽,例如使用转染到宿主细胞内的重组表达载体表达的多肽,从重组组合的人多肽文库分离的多肽(hoogenboom h.r.,1997 tib tech.15:62-70;hoogenboom h.和chames p.,2000,immunology today 21:371-378;azzazy h.和highsmith w.e.,2002,clin.biochem.35:425-445;gavilondo j.v.和larrick j.w.,2002,biotechniques 29:128-145),从对于人免疫球蛋白基因是转基因的动物(例如小鼠)中分离的抗体(参见例如taylor,l.d.等人,1992,nucl.acids res.20:6287-6295;little m.等人,2000,im munology today 21:364-370;kellermann s.a.和green l.l.,2002,current opini on in biotechnology 13:593-597;murphy,a.j.等人,2014,proc.natl.acad.sci.u.s.a.111(14):5153-5158),或者通过涉及将所选序列元件彼此剪接的任何其它手段制备、表达、产生或分离的多肽。在一些实施例中,此类选定的序列元件中的一个或多个是天然存在的。在一些实施例中,此类选定的序列元件中的一个或多个是在计算机芯片上(in silico)设计的。在一些实施例中,一个或多个此类选定的序列元件由已知序列元件的诱变(例如体内或体外)产生,所述已知序列元件例如来自天然来源或合成来源。例如,在一些实施例中,重组多肽包含在目的源生物(例如人、小鼠等)的基因组(或多肽)中发现的序列。在一些实施例中,重组多肽包含在两种不同生物(例如人和非人生物)中,在自然界中彼此分开存在的序列(即,来自两种或更多种不同生物,例如人和非人部分)。在一些实施例中,重组多肽具有来源于诱变(例如在体外或体内,例如在非人动物中)的氨基酸序列,使得重组多肽的氨基酸序列是这样的序列,其虽然源于多肽序列且与多肽序列相关,但可能并非天然存在于非人动物体内的基因组内。
[0128]
参考:预期描述试剂、动物、群组、个体、群体、样品、序列或目的值针对其进行比较的标准或对照试剂、动物、群组、个体、群体、样品、序列或值。在一些实施例中,参考试剂、动物、群组、个体、群体、样品、序列或值与试剂、动物、群组、个体、群体、样品、序列或目的值的
测试或确定基本上同时进行测试和/或确定。在一些实施例中,参考试剂、动物、群组、个体、群体、样品、序列或值是历史参考,任选在有形介质中体现。在一些实施例中,参考可指对照。如本文所用,“参考”可以指“参考动物”。“参考动物”可具有如本文所述的修饰,与本文所述的修饰不同的修饰或不具有修饰(即,野生型动物)。通常,本领域内的技术人员将理解,参考药剂、动物、群组、个体、群体、样品、序列或值一定的条件下进行测定或表征,所述条件与用来测定或表征所关注的药剂、动物(例如哺乳动物)、群组、个体、群体、样品、序列或值的条件类似。
[0129]
免疫球蛋白参与称为体细胞超突变的细胞机制,其产生特征在于对其靶的高亲和力的亲和力成熟的抗体变体。尽管体细胞超突变在很大程度上在抗体可变区的cdr内发生,但突变优先靶向称为热点的某些序列基序,例如rgyw活化诱导胞苷脱氨酶(aid)热点(参见例如li,z.等人,2004,genes dev.18:1-11;teng,g.和f.n.papavasiliou,2007,annu.rev.genet.41:107-20;在此以引用的方式并入)。本文公开的可用于生成经改造的dh区的目的非免疫球蛋白肽或其一部分可包含一个或多个天然和/或人工热点。短语“体细胞突变的”包括对来自已经历类别转换的b细胞的核酸序列的提及,其中所述类别转换的b细胞中的免疫球蛋白可变区的核酸序列(例如,编码重链可变结构域或者包括重链cdr或fr序列的核苷酸序列)与类别转换之前的b细胞中的核酸序列不同,例如没有经历类别转换的b细胞和已经历类别转换的b细胞之间的cdr或构架核酸序列中的差异。“体细胞突变的”包括对来自亲和力成熟的b细胞的核酸序列的提及,所述核酸序列与并非亲和力成熟的b细胞中的相应免疫球蛋白可变区序列(即,种系细胞的基因组中的序列)不同。短语“体细胞突变的”还包括对b细胞暴露于目的表位之后来自b细胞的免疫球蛋白可变区核酸序列的提及,其中所述核酸序列不同于b细胞暴露于目的表位之前的相应核酸序列。短语“体细胞突变的”指来自结合蛋白的序列,所述结合蛋白响应免疫原攻击在动物(例如,具有人免疫球蛋白可变区核酸序列的小鼠)中生成,并且来源于在此类动物中固有地运转的选择过程。
[0130]
基本上:指显示出目的特征或性质的总体或接近总体程度或范围的定性条件。生物学领域的普通技术人员将理解,生物和化学现象很少(如果有的话)进行至完成和/或进行至完全,或实现或避免绝对的结果。因此术语“基本上”用于捕捉潜在的在许多生物和化学现象中固有的完全性的缺乏。
[0131]
基本同源性:指氨基酸或核酸序列之间的比较。如本领域普通技术人员将理解的,如果两个序列在对应的位置上含有同源残基,则它们通常被认为是“基本上同源的”。同源残基可为相同的残基。可替代地,同源残基可为具有适当相似的结构和/或功能特征的非相同的残基。例如,如由本领域的普通技术人员所熟知的,某些氨基酸通常被归类为“疏水性”或“亲水性”氨基酸,和/或归类为具有“极性”或“非极性”侧链。一个氨基酸对另一个相同类型的氨基酸的取代可通常被认为是“同源”取代。通常的氨基酸分类在下文概括。
analysis of genes and proteins,wiley,1998;以及misener等人(编辑)bioinformatics methods and protocols(methods in molecular biology,第132卷),humana press,1998。除了鉴定同源序列以外,上文提及的程序通常还提供同源性程度的指示。在一些实施例中,如果两个序列的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的相应残基在相关的残基序列段(stretch)上是同源的,则这两个序列被认为是基本上同源的。在一些实施例中,相关序列段为完全序列。在一些实施例中,相关序列段为至少9个、10个、11个、12个、13个、14个、15个、16个、17个或更多个残基。在一些实施例中,相关序列段包括沿着完全序列的连续残基。在一些实施例中,相关序列段包括沿着完全序列的不连续残基,例如通过多肽或其一部分的折叠构象结合在一起的非连续残基。在一些实施例中,相关序列段为至少10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个残基。
[0135]
基本同一性:指氨基酸或核酸序列之间的比较。如本领域普通技术人员将理解的,如果两个序列在对应的位置上含有相同残基,则它们通常被认为是“基本上相同的”。如本领域中所熟知的,氨基酸或核酸序列可使用多种算法中的任意算法来进行比较,所述算法包括商业计算机程序中可获得的那些算法如用于核苷酸序列的blastn以及用于氨基酸序列的blastp、空位blast和psi-blast。示例性的这种程序在以下中描述:altschul,s.f.等人,1990,j.mol.biol.,215(3):403-410;altschul,s.f.等人,1997,methods in enzymology;altschul,s.f.等人,1997,nucleic acids res.,25:3389-3402;baxevanis,a.d.和b.f.f.ouellette(编辑)bioinformatics:a pract ical guide to the analysis of genes and proteins,wiley,1998;以及misener等人(编辑)bioinformatics methods and protocols(methods in molecular biology,第132卷),humana press,1998。除了鉴定相同的序列以外,上文提及的程序通常还提供同一性程度的指示。在一些实施例中,如果两个序列的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的相应残基在相关的残基序列段上是相同的,则这两个序列被认为是基本上相同的。在一些实施例中,相关序列段为完全序列。在一些实施例中,相关序列段为至少10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个残基。
[0136]
转化:指通过其将外源dna引入宿主细胞内的任何过程。转化可使用本领域众所周知的各种方法在天然或人工条件下发生。转化可依赖用于将外源核酸序列插入原核或真核宿主细胞内的任何已知方法。在一些实施例中,特定的转化方法基于待转化的宿主细胞选择,并且可包括但不限于病毒感染、电穿孔、交配、脂转染。在一些实施例中,“经转化的”细胞被稳定转化,因为插入的dna能够作为自主复制质粒或作为宿主染色体的部分复制。在一些实施例中,经转化的细胞瞬时表达引入的核酸有限的时间段。
[0137]
靶向载体或靶向构建体:指包含靶向区域的多核苷酸分子。靶向区域包含与靶细胞、组织或动物中的序列相同或基本上相同并且提供靶向构建体经由同源重组至所述细胞、组织或动物的基因组内的位置中的整合的序列。还包括使用位点特异性重组酶识别位点(例如,loxp或frt位点)靶向的靶向区域。在一些实施例中,如本文所述的靶向构建体还包含特定目的核酸序列或基因、可选择标记物、对照和/或调控序列、以及允许通过外源添加蛋白质介导的重组的其它核酸序列,所述蛋白质帮助或促进涉及此类序列的重组。在一
些实施例中,靶向构建体还包含全部或部分的目的基因,其中所述目的基因是编码全部或部分多肽的异源基因,所述多肽具有与由内源序列编码的蛋白质相似的功能。在一些实施例中,靶向构建体还包含全部或部分的目的人源化基因,其中所述目的人源化基因编码全部或部分多肽,所述多肽具有与由内源序列编码的多肽相似的功能。在一些实施例中,靶向构建体(或靶向载体)可包含由人为操纵的核酸序列。例如,在一些实施例中,可构建靶向构建体(或靶向载体),以包含含有两个或更多个序列的经改造的或重组多核苷酸,所述两个或更多个序列在自然界中未以该次序连接在一起,而是由人为操纵在经改造的或重组多核苷酸中彼此直接相互连接。
[0138]
转基因或转基因构建体:指例如通过本文所述的方法由人为引入细胞内的核酸序列(编码例如全部或部分目的多肽)。转基因对于它引入其内的转基因动物或细胞可为部分或完全异源的,即外源的。转基因可包括一个或多个转录调控序列和任何其它核酸,如内含子或启动子,这对于所选择的核酸序列的表达可能是必要的。
[0139]
转基因动物、转基因非人动物或tg

:可互换使用,并且指任何非天然存在的非人动物,其中非人动物的一种或多种细胞含有全部或部分异源核酸和/或编码目的多肽的基因。在一些实施例中,通过有意的遗传操纵,例如通过显微注射或通过用重组病毒感染,通过引入前体细胞内,将异源核酸和/或基因直接或间接地引入细胞内。术语遗传操作不包括经典育种技术,而是针对重组dna分子的引入。该分子可整合到染色体内,或者它可为染色体外复制的dna。术语“tg
”包括对于异源核酸和/或基因为杂合或纯合的动物,和/或具有异源核酸和/或基因的单拷贝或多拷贝的动物。
[0140]
变体:指这样的实体,其显示与参考实体显著的结构同一性,但与参考实体相比在一种或多种化学部分的存在或水平下在结构上参考实体。在许多实施例中,“变体”还在功能上与其参考实体不同。一般来讲,特定实体是否被适当地认为是参考实体的“变体”是基于其与参考实体的结构同一性的程度。如本领域技术人员将理解的,任何生物或化学参考实体具有某些特征性结构元件。根据定义,“变体”是共享一个或多个此类特征性结构元件的不同的化学实体。只是给出一些实例,小分子可具有特征性核结构元件(例如,大环核)和/或一个或多个特征性侧链部分,以使得小分子的变体是共享核结构元件和特征性侧链部分,但在其他侧链部分上和/或在存在于核内的键的类型(单键相对于双键,e相对于z,等)上不同的分子,多肽可具有包含在线性或三维空间中相对于彼此具有指定的位置和/或促成特定生物功能的多个氨基酸的特征性序列元件,核酸可具有包含在线性或三维空间中相对于彼此具有指定的位置的多个核苷酸残基的特征性序列元件。例如,“变体多肽”可由于氨基酸序列中的一个或多个差异和/或共价附接于多肽主链的化学部分(例如,碳水化合物、脂质等)中的一个或多个差异而与参考多肽不同。在一些实施例中,“变体多肽”显示出与参考多肽具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%的总体序列同一性。替代地或另外地,在一些实施例中,“变体多肽”不与参考多肽共享至少一个特征性序列元件。在一些实施例中,参考多肽具有一种或多种生物活性。在一些实施例中,“变体多肽”共享参考多肽的一种或多种生物活性。在一些实施例中,“变体多肽”缺乏参考多肽的一种或多种生物活性。在一些实施例中,“变体多肽”显示出相较于参考多肽降低水平的一种或多种生物活性。在许多实施例中,如果所关注的多肽具有与亲代的氨基酸序列相同但在特定位置上具有少数序列改变的氨基酸序列,则所关注的
多肽被认为是亲代或参考多肽的“变体”。通常,与亲本相比,变体中少于20%、15%、10%、9%、8%、7%、6%、5%、4%、3%或2%的残基被取代。在一些实施例中,“变体”变体相较于亲代具有10个、9个、8个、7个、6个、5个、4个、3个、2个或1个取代的残基。通常,“变体”具有极少数目(例如,少于5个、4个、3个、2个或1个)的取代的功能残基(即,参与特定生物活性的残基)。此外,相较于亲代,“变体”通常具有不超过5个、4个、3个、2个或1个添加或缺失,并且通常不具有添加或缺失。此外,任何添加或缺失通常少于约25个、约20个、约19个、约18个、约17个、约16个、约15个、约14个、约13个、约10个、约9个、约8个、约7个、约6个残基,并且通常少于约5个、约4个、约3个或约2个残基。在一些实施例中,亲代或参考多肽是天然发现的多肽。如将由本领域普通技术人员所理解的,所关注的特定多肽的多个变体通常可为天然存在的,特别是当所关注的多肽为传染原多肽时。
[0141]
载体:指能够转运它与之结合的另一种核酸的核酸分子。在一些实施例中,载体能够在宿主细胞诸如真核和/或原核细胞中进行染色体外复制和/或表达与它们连接的核酸。能够指导可操作地连接的基因表达的载体在本文中被称为“表达载体”。
[0142]
野生型:包括其领域理解的含义,其指具有如在自然界中在“正常”(与突变体、患病的、改变的等相比)状态或背景下发现的结构和/或活性的实体。本领域普通技术人员将了解,野生型基因和多肽经常以多种不同的形式(例如,等位基因)存在。
具体实施方式
[0143]
本文尤其公开了具有编码目的多肽的一个或多个部分(功能片段、结合部分等)的异源遗传材料的转基因非人动物,所述异源遗传材料被插入免疫球蛋白重链可变区的多样性簇(即dh区)内,使得异源遗传材料与重链可变(vhh)和连接(jh)区段可操作地连接。考虑此类非人动物证实生成针对难治性疾病靶的抗体的能力。还考虑此类非人动物证实这样的抗体群体,其特征在于与具有由传统免疫球蛋白dh基因区段(或自然界中出现的免疫球蛋白dh基因区段)生成的免疫球蛋白重链可变cdr3多样性的抗体群体相比,具有cdr3多样性中的增加的重链可变区。因此,本文所述的非人动物可用于开发基于抗体的治疗剂,其结合特定抗原,特别是与低免疫原性和/或弱免疫原性有关的抗原。特别地,本文公开的是将示例性核苷酸编码序列引入免疫球蛋白重链可变区的dh区内,所述核苷酸编码序列各自编码目的多肽的一部分(例如,非典型趋化因子受体的细胞外部分、芋螺毒素的一部分或狼毒毒素的一部分),导致具有由涉及插入的核苷酸编码序列的v(d)j重组生成的重链可变区,且特别是cdr3区的抗体的表达。在一些实施例中,目的多肽(例如非典型趋化因子受体(ackr)、芋螺毒素、狼蛛毒素或其组合)的插入的核苷酸编码序列替换在如本文所述的免疫球蛋白重链多样性簇(即,dh区)内的全部或基本上全部的传统dh区段(即野生型dh区段)。在一些实施例中,目的多肽(例如非典型趋化因子受体(ackr)、芋螺毒素、狼蛛毒素或其组合)的插入的核苷酸编码序列部分替换在如本文所述的免疫球蛋白重链多样性簇(即dh区)内的一个或多个传统dh区段。在一些实施例中,目的多肽(例如非典型趋化因子受体(ackr)、芋螺毒素、狼蛛毒素或其组合)的核苷酸编码序列插入如本文所述的免疫球蛋白重链多样性簇(即dh区)内的一个或多个传统dh区段内,使得所述核苷酸编码序列侧翼为在一个或多个传统dh区段通常或天然发现、或者与一个或多个传统dh区段结合的序列。在一些实施例中,一个或多个传统dh区段在如本文所述的免疫球蛋白重链多样性簇内保持完整。在一些
实施例中,一个或多个传统dh区段从如本文所述的免疫球蛋白重链多样性簇中缺失、去除或以其它方式致使无功能。在一些特定实施例中,如本文所述的免疫球蛋白重链多样性簇缺乏全部或基本上全部的传统dh区段。在一些特定实施例中,如本文所述的免疫球蛋白重链多样性簇包含使用本文所述的核苷酸编码序列制备或生成的合成dh区段。这种转基因非人动物提供了用于鉴定和开发抗体和/或基于抗体的治疗剂的体内系统,所述抗体和/或基于抗体的治疗剂结合疾病靶超出已建立的药物发现技术的靶向能力。此外,此类转基因非人动物提供了用于开发抗体和/或基于抗体的治疗剂的有用动物模型系统,所述抗体和/或基于抗体的治疗剂集中于或设计用于破坏对于影响人的各种疾病和/或疾病病理学关键的蛋白质-蛋白质相互作用。
[0144]
在一些实施例中,本文所述的非人动物包含免疫球蛋白重链可变区,其含有经改造的多样性簇(即经改造的dh区),其特征在于对应于目的多肽的一部分的一个或多个核苷酸编码序列的存在,所述目的多肽例如ackr(例如d6趋化因子诱饵受体)的细胞外结构域、毒素(例如离子通道阻断剂,例如芋螺毒素、蜘蛛毒素、狼蛛毒素、海葵毒素或蝎毒素)、g蛋白偶联受体、选择抗体的长重链cdr(例如结合病毒包括例如hiv、hcv、hpv、流感等的中和抗体)、胰高血糖素样肽1受体激动剂(例如艾塞那肽、利拉鲁肽、利西拉肽、阿必鲁肽、杜拉鲁肽(dulaglutide)、他司鲁泰等)、来自非人物种(例如鸟、鸡、牛、兔、猪等)的重链多样性(dh)基因区段等。在这样的实施例中,含有由涉及这种核苷酸编码序列的重组生成的cdr3的抗体可表征为具有增加的多样性,以指导与特定抗原(例如跨膜多肽)的结合。在一些实施例中,由本文所述的非人动物产生的抗体具有免疫球蛋白重链可变区序列,其含有对应于由一个或多个核苷酸编码序列编码的肽的cdr3区。在一些实施例中,本文所述的非人动物包含与一个或多个核苷酸编码序列可操作地连接的重链可变(vh)和连接(jh)基因区段,使得v(d)j重组发生在所述vh、jh和一个或多个核苷酸编码序列之间,以产生结合目的抗原的重链可变区。在一些实施例中,本文所述的非人动物包含在非人动物的基因组中的免疫球蛋白重链可变区处,与5、10、15、20、25个或更多个(例如多个)核苷酸编码序列可操作地连接的多个vh和jh基因区段。在许多实施例中,vh和jh区段是人vh和人jh基因区段。在一些实施例中,本文所述的非人动物还包含人或人源化的免疫球蛋白轻链基因座(例如κ和/或λ),使得非人动物产生包含人可变区(即重和轻)的抗体和非人恒定区的抗体。在一些特定实施例中,所述人或人源化的免疫球蛋白轻链基因座包含与啮齿类动物轻链恒定区(例如啮齿类动物cκ或cλ)可操作地连接的人v
l
和j
l
基因区段。在一些实施例中,本文所述的非人动物还包含如以下中描述的免疫球蛋白轻链基因座:美国专利申请公开号2011-0195454 a1、2012-0021409 a1、2012-0192300 a1、2013-0045492 a1、2013-0185821 a1、2013-0198880 a1、2013-0302836 a1、2015-0059009 a1;国际专利申请公开号wo 2011/097603、wo 2012/148873、wo 2013/134263、wo 2013/184761、wo 2014/160179、wo 2014/160202;所有这些在此以引用的方式并入)。
[0145]
下述节段中详细描述组合物和方法的各个方面。节段的使用不意味着限制任何实施例。每个节段可应用于具体描述的任何实施例。在本技术中,除非另有说明,"或"的使用意指"和/或"。
[0146]
v(d)j重组
[0147]
涉及几种遗传组分的一系列重组事件作用于从基因区段(例如v、d和j)的有序排
列装配免疫球蛋白。已知基因区段的这种装配是不精确的,并且因此,通过组合不同基因区段和经由不精确连接形成独特连接两者实现免疫球蛋白多样性。通过称为体细胞超突变的过程生成进一步的多样性,其中改变所述免疫球蛋白的可变区序列,以增加对于抗原的亲和力和特异性。免疫球蛋白是由两个相同的重链和两个相同的轻链组成的y形多肽,所述链各自具有两个结构组分:一个可变结构域和一个恒定结构域。它是由基因区段装配形成的重链和轻链的可变结构域,而恒定结构域通过rna剪接与可变结构域融合。尽管装配(或连接)基因区段的机制对于重链和轻链是相似的,但轻链只需要一个连接事件(即v与j),而重链需要两个连接事件(即d与j和v与dj)。
[0148]
用于重链和轻链可变区的基因区段的装配由保守的非编码dna序列引导,所述非编码dna序列侧接每个基因区段,称为重组信号序列(rss),其确保在相对于v、d和j编码序列的精确位置处的dna重排(参见例如ramsden,d.a.等人,1994,nuc.acids res.22(10):1785-96)。每个rss由以下组成:与编码序列(例如v区段)邻接的七个核苷酸(七聚体)的保守嵌段,随后为保守间隔物(12或23bp)和九个核苷酸(九聚体)的第二保守嵌段。尽管个体中相当大的序列趋异是耐受的,但这些序列的长度通常不改变。免疫球蛋白基因区段之间的重组遵循通常称为12/23规则的规则,其中侧翼为具有12bp间隔物的rss的基因区段通常连接至侧翼为23bp间隔物的基因区段(参见例如hiom,k.和m.gellert,1998,mol.cell.1(7):1011-9)。rss的序列已报道影响与特定基因区段重组的效率和/或频率(参见例如ramsden,d.a和g.e.wu,1991,proc.natl.acad.sci.u.s.a.88:10721-5;boubnov,n.v.等人,1995,nuc.acids res.23:1060-7;ezekiel,u.r.等人,1995,immunity 2:381-9;sadofsky,m.等人,1995,genes dev.9:2193-9;cuomo,c.a.等人,1996,mol.cell biol.16:5683-90;ramsden,d.a.等人,1996,embo j 15:3197-3206)。事实上,许多报告指出个体中的基因区段,特别是dh区段的高度偏差和可变的使用。
[0149]
在一些实施例中,本文所述的非人动物包含一个或多个rss侧接编码序列,其对于与v和/或j基因区段重组进行优化。在各种实施例中,将编码序列插入免疫球蛋白重链基因座内的传统dh基因区段(或自然界中出现的dh基因区段)的位置中。可使用本领域已知的标准技术来实现rss的优化,所述标准技术例如已知rss序列的定点诱变、或合成的rss序列的计算机芯片生成随后为从头合成。仅举一个例子,通过与和高或最佳重组效率和/或频率相关的rss比较,可优化与低或弱重组效率和/或频率相关的rss。在一些实施例中,重组效率和/或频率可通过抗体序列群体中基因区段的使用频率来确定(例如来自个体或个体组;参见例如arnaout,r.等人,2011,plos one 6(8):e22365;glanville,j.等人,2011,proc.natl.acad.sci.u.s.a.108(50):20066-71)。因此,在一些实施例中,本文所述的非人动物可包含一个或多个优化的rss侧接编码序列(或基因区段),使得编码序列(或基因区段)的重组以相等或大约相等的频率发生。示例性的优化rss在图2中阐述。
[0150]
基因区段装配以形成重链和轻链可变区导致形成免疫球蛋白的抗原结合区(或位点)。这样的抗原结合区部分特征在于高变区的存在,所述高变区通常被称为互补决定区(cdr)。对于重链和轻链两者存在三个cdr(即总共六个cdr),其中cdr1和cdr2两者完全由v基因区段编码。然而,cdr3由来源于对于轻链的v和j区段,以及对于重链的v、d和j区段连接的序列编码。因此,在重组期间采用的另外的基因区段以形成重链可变区编码序列显著增加了重链的抗原结合位点的多样性。
[0151]
趋化因子和趋化因子受体
[0152]
免疫和炎症应答是涉及几种类型的免疫细胞和分子组分的复杂生物学过程。白细胞迁移已报道为免疫和炎症应答起始、维持和解决中的重要因素,其中一些通过趋化因子及其受体的作用来实现。事实上,已报道了几种趋化因子和相应的受体。趋化因子受体具有特征在于七次跨膜结构域的结构,所述七次跨膜结构域与g蛋白偶联用于在细胞内区室中的信号转导,并且分成对应于它们结合的趋化因子亚组的多个不同家族:cc-趋化因子受体(β-趋化因子受体)、cxc-趋化因子受体、cx3c-趋化因子受体和xc-趋化因子受体。除这些传统的趋化因子受体之外,已报道了其它趋化因子受体(称为非典型趋化因子受体或ackr),其共享相似结构,但缺乏响应配体结合而起始信号传导的能力)(参见例如bonecchi,r.等人,2010,curr.top.microbiol.immuno l.341:15-36;nibbs,r.j.b.和g.j.graham,2013,nature rev.13:815-29)。
[0153]
在ackr中,ackr2(也称为ccbp2和d6趋化因子诱饵受体)是与其它g蛋白偶联受体相似,且由ccbp2基因编码的七次跨膜蛋白受体(nibbs,r.j.b.等人,1997,j.biol.chem.272(51):32078-83)。与其它趋化因子受体相反,ackr2在第二个细胞内环中含有dkyleiv基序代替经典drylaiv基序,并且不能通过gαi蛋白质信号传导。ackr2在皮肤、肠和肺的淋巴管内皮细胞以及b细胞和树突状细胞上表达。ackr是许多促炎β-趋化因子(cc-趋化因子)的混杂受体,但不结合组成性ccl趋化因子。已提出ackr2是清道夫受体,其内化cc-趋化因子并靶向其用于溶酶体降解,从而经由cc-趋化因子的清除来限制炎症应答(jamieson,t.等人,2005,nature immunol.6(4):403-11;bonecchi,r.等人,同上;hansell,c.a.h.等人,2011,immunol.cell biol.89(2):197-206;nibbs,r.j.b.和g.j.graham,同上)。
[0154]
肽毒素
[0155]
毒素是在植物和动物中发现的可对人有毒的天然存在的物质。例如,芋螺在其毒液中产生称为芋螺毒素的神经毒性肽,其调节人中各种受体的活性。特别地,几种芋螺毒素已显示调节离子通道(例如nav通道)。通常,芋螺毒素是长度10至30个氨基酸的肽,其包括一个或多个二硫键,并且基于它们作用于其的靶来表征:α-芋螺毒素(乙酰胆碱受体)、δ-芋螺毒素(电压门控钠通道)、κ-芋螺毒素(钾通道)、μ-芋螺毒素(电压门控钠通道)和ω-芋螺毒素(电压门控钙通道)。已知芋螺毒素在蜗牛物种中是高度多态性的,并且因此编码它们的基因不是保守的(参见例如terlau,h.和b.m.olivera,2004,physiol.rev.84(1):41-68;biggs,j.s.等人,2010,mol.phylogenet.evol.56(1):1-12;olivera,b.m.等人,2012,ann.n.y.acad.sci.1267(1):61-70;wong,e.s.和k.belov,2012,gene 496(1):1-7)。
[0156]
在芋螺毒素中,μ-芋螺毒素已报道具有两种类型的半胱氨酸模式,并作用于肌肉组织中的电压门控钠通道(cruz,l.j.等人,1985,j.biol.chem.260(16):9280-8;zeikus,r.d.等人,1985,j.biol.chem.260(16):9280-8;mcintosh,j.m.和r.m.jones,2001,toxicon.39(10):1447-51;nielsen,k.j.等人,2002,j.biol.chem.277(30):27247-55;floresca,c.z.,2003,toxicol.appl.pharmacol.190(2):95-101;priest,b.t.等人,2007,toxicon.49(2):194-201;schmalhofer,w.a.等人,2008,mol.pharmacol.74(5):1476-84;ekberg,j.等人,2008,int.j.biochem.cell biol.40(11):2363-8)。实际上,μ-芋螺毒素已因其潜在药理学用途而成为研究对象(参见例如olivera,b.m.和r.w.teichert,2007,
mol.interv.7(5):251-60;stevens,m.等人,2012,j.biol.chem.287(37):31382-92)。尽管已进行了几项研究来阐明各种μ-芋螺毒素的作用机制,但许多仍是未知的。
[0157]
毒素的其它例子包括海葵、蝎子、蜘蛛和狼蛛的毒液,其已报道通过抑制活化并阻断神经元传递而作用于离子通道。事实上,已鉴定了几种蝎毒素并分辨了它们的结构(参见例如rochat,h.和j.gregoire,1983,toxicon.21(1):153-62;zhou,x.h.等人,1989,biochem.j.257(2):509-17;granier,c.等人,1990,febs lett.261(2):423-6)。此外,使用来自蝎子毒液的毒素已开发了用于钾通道的基于神经毒素的文库(参见例如takacs,z.等人,2009,proc.natl.acad.sci.u.s.a.106(52):22211-6)。再举另外一个例子,来自狼蛛毒液的肽已报道特别作用于电压门控钠通道如nav1.5和nav1.7(参见例如priest,b.t.等人,2007,toxicon.49(2):194-201;xiao,y.等人,2010,mol.pharmacol.78(6):1124-34)。本文描述了以下发现:用于构建经改造的dh区的特别有用的一组核苷酸编码序列是或包含来自狼蛛毒素和μ-芋螺毒素序列的核苷酸编码序列(参见例如表4)。本文公开了作用于电压门控钠通道(例如,nav1.7)的毒素编码序列用于构建经改造的dh区的用途。根据需要,本文所述的方法可用于利用源自任何所需毒素肽的编码序列的任何集合、或来自多重(即二、三、四、五等)毒素肽的毒素肽(或毒素肽序列片段)的组合。
[0158]
提供体内系统
[0159]
本文描述了以下认识:特定抗原与低免疫原性和/或弱免疫原性相关,并且因此是基于抗体的治疗剂的弱靶。事实上,许多疾病靶(例如跨膜蛋白)已表征为难治性或不可成药的。因此,本文公开了用于开发抗体和基于抗体的治疗剂的体内系统的产生,其克服了与已建立的药物发现技术相关的缺陷。本公开内容具体证实了其基因组包含免疫球蛋白重链可变区的转基因啮齿类动物的构建,所述免疫球蛋白重链可变区包括经改造的dh区,所述经改造的dh区包括一个或多个异源核苷酸编码序列,其各自编码目的异源多肽或肽的一部分(例如细胞外部分、结合部分、功能片段等)。本文所述的方法可适于采用一组异源核苷酸编码序列,其各自编码任何目的多肽或肽(例如跨膜蛋白、毒素、g蛋白偶联受体等)的一部分用于产生经改造的dh区。一旦整合到免疫球蛋白重链可变区(即置于与v和j基因区段和/或一个或多个恒定区可操作地连接)内,经改造的dh区就提供了基因区段(即v和j)与一个或多个异源核苷酸编码序列的重组,以生成特征在于具有增加的多样性(即cdr3多样性)以指导与特定抗原结合的重链的抗体。
[0160]
本文描述了以下认识:由其设计一组核苷酸编码序列(或核苷酸编码序列的组合)用于构建如本文所述的经改造的dh区的特别有用的目的异源多肽包括趋化因子受体、芋螺毒素、狼蛛毒素和/或其组合。
[0161]
在一些实施例中,趋化因子受体包括cc-趋化因子受体、cxc-趋化因子受体、cx3c-趋化因子受体、xc-趋化因子受体及其组合。
[0162]
在一些实施例中,cc-趋化因子受体(也称为β-趋化因子受体)包括ccr1、ccr2、ccr3、ccr4、ccr5、ccr6、ccr7、ccr8、ccr9、ccr10和ccr11。
[0163]
在一些实施例中,cxc-趋化因子受体包括cxcr1、cxcr2、cxcr3、cxcr4、cxcr5、cxcr6和cxcr7。
[0164]
在一些实施例中,cx3c-趋化因子受体包括cx3cr1。
[0165]
在一些实施例中,xc-趋化因子受体包括xcr1。
[0166]
在一些实施例中,芋螺毒素包括α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
[0167]
在一些实施例中,芋螺毒素是或包含μ-芋螺毒素。
[0168]
在一些实施例中,狼蛛毒素包括protxi、protxii、虎纹捕鸟蛛毒素-iv(hwtx-iv)及其组合。
[0169]
不希望受任何特定理论束缚,我们注意到,本文提供的数据证实,在一些实施例中,其基因组包含包括经改造的dh区的免疫球蛋白重链可变基因座的啮齿类动物,特征在于包括源自异源非典型趋化因子受体(例如ackr2,也称为d6趋化因子诱饵受体)的细胞外部分的一个或多个异源核苷酸编码序列,有效地生成免疫球蛋白重链可变区基因座,其产生特征在于具有增加的多样性以结合异源非典型趋化因子受体(例如异源d6趋化因子诱饵受体)的配体的cdr3的抗体。我们还注意到,本文提供的数据证实,在一些实施例中,其基因组包含包括经改造的dh区的免疫球蛋白重链可变基因座的啮齿类动物,特征在于包括源自一种或多种毒素(例如μ-芋螺毒素和/或protxii)的一部分的一个或多个异源核苷酸编码序列,有效地生成免疫球蛋白重链可变区基因座,其产生特征在于具有增加的多样性以结合异源电压门控钠通道(例如,异源nav通道)的cdr3的抗体。
[0170]
特别地,本公开内容尤其具体证实来自人非典型趋化因子受体(ackr),例如ackr2(即,d6趋化因子诱饵受体)的示例性核苷酸编码序列,可特别用于整合到免疫球蛋白重链基因座的dh区内,用于生成特征在于具有多样性的cdr3的抗体,所述多样性来源于核苷酸编码序列与vh和jh区段的重组,并且阻断几种炎性细胞因子(例如,ccl2、ccl3、ccl4、ccl5、ccl7、ccl8、ccl11、ccl12、ccl13、ccl14、ccl17、ccl22和ccl3l1)。本公开内容还证实来自芋螺毒素(例如μ-芋螺毒素)和狼蛛毒素(例如protxii)的示例性核苷酸编码序列,可特别用于整合到免疫球蛋白重链基因座的dh区内,用于生成特征在于具有多样性的cdr3的抗体,所述多样性来源于核苷酸编码序列与vh和jh区段的重组,并且阻断和/或抑制电压门控钠通道(例如nav1.7)的激活和/或功能。因此,在至少一些实施例中,本公开内容包括开发体内系统用于生成针对治疗难治性疾病靶的抗体和/或基于抗体的治疗剂。
[0171]
示例性人ackr(连同其相关配体)在表1中阐述(参见例如nibbs,r.j.b.和g.j.graham,2013,nature reviews 13:815-29)。示例性毒素(连同其相关靶)在表2中阐述(参见例如terlau,h.和b.m.olivera,2004,physiol.rev.84(1):41-68)。
[0172]
表1
[0173]
[0174][0175]
表2
[0176][0177]
ackr2(d6趋化因子诱饵受体)编码序列
[0178]
表3中阐述了用于构建如本文所述的经改造的dh区的人ackr2(d6趋化因子诱饵受体)的示例性核苷酸编码序列(dna和氨基酸(aa))。表3中阐述的人ackr2核苷酸编码序列组的特征在于四个细胞外结构域、具有cys至ser取代以去除二硫键的四个细胞外结构域、四个cys交换(nterm-ec3、ec3-nterm、ec1-ec2、ec2-ec1)、具有cys至ser取代以去除二硫键的四个cys交换、两个环融合(具有cys保留;nterm ec3,ec1 ec2)和七个部分结构域。
[0179]
表3
[0180]
[0181]
[0182]
[0183]
[0184]
[0185][0186][0187]
下文提供了用于构建经改造的dh区、含有人ackr2(d6趋化因子诱饵受体)核苷酸编码序列的示例性dna片段。
[0188]
d6-dh1166(seq id no:131)包括在对应于dh1-1至dh6-6的位置中插入的d6编码序列:
[0189]
tacgtagccgtttcgatcctcccgaattgactagtgggtaggcctggcggccgctgccatttcattacctctttctccgcacccgacatagataccggtggattcgaattctccccgttgaagctgacctgcccagaggggcctgggcccaccccacacaccggggcggaatgtgtacaggccccggtctctgtgggtgttccgctaactggggctcccagtgctcaccccacaactaaagcgagccccagcctccagagcccccgaaggagatgccgcccacaagcccagcccccatccaggaggccccagagctcagggcgccggggcggattttgtacagccccgagtcactgtgcggaaggatgctgtggttagctttggcaaagttttcctgccaccacagtgagaaaaactgtgtcaaaaaccgtctcctggcccctgctggaggccgcgccagagaggggagcagccgccccgaacctaggtcctgctcagctcacacgacccccagcacccagagcacaacggagtccccattgaatggtgaggacggggaccagggctccagggggtcatggaaggggctggaccccatcctactgctatggtcccagtgctcctggccagaactgaccctaccaccgacaagagtccctcagggaaacgggggtcactggcacctcccagcatcaaccccaggcagcacaggcataaaccccacatccagagccgactccaggagcagagacaccccagtaccctgggggacaccgaccctgatgactccccactggaatccaccccagagtccaccaggaccaaagaccccgcccctgtctctgtccctcactcaggacctgctgcggggcgggccatgagaccagactcgggcttagggaacaccactgtggccccaacctcgaccaggccacaggcccttccttcctgccctgcggcagcacagactttggggtctgtgcagagaggaatcacagaggccccaggctgaggtggtgggggtggaagacccccaggaggtggcccacttcccttcctcccagctggaacccaccatgaccttcttaagataggggtgtcatccgaggcaggtcctccatggagctcccttcaggctcctccccggtcctcactaggcctcagtcccggctgcgggaatgcagccaccacaggcacaccaggcagcccagacccagccagcctgcagtgcccaagcccacattctggagcagagcaggctgtgtctgggagagtctgggctccccaccgcccccccgcacaccccacccacccctgtccaggccctatgcaggagggtcagagccccccatggggtatggacttagggtctcactcacgtggctcccctcctgggtgaaggggtctcatgcccagatccccacagcagagctggtcaaaggtggaggcagtggccccagggccaccctgacctggaccctcaggctcctctagccctggctgccctgctgtccctgggaggcctggactccaccagaccacaggtccagggcaccgcccataggtgctgcccacactcagttcacaggaagaagataagctccagacccccaagactgggacctgccttcctgccaccgcttgtagctccagacctccgtgcctcccccgaccacttacacacgggccagggagctgttccacaaagatcaaccccaaaccgggaccgcctggcactcgggccgctgccacttccctctccatttgttcccagcacctctgtgctccctccctcctccctccttcaggggaacagcctgtgcagcccctccctgcaccccacaccctggggaggcccaaccctgcctccagccctttctcccccgctgctcttcctgcccatccagacaaccctggggtcccatccctgcagcctacaccctggtctccacccagacccctgtctctccctccagacacccctcccaggccaaccctgcacatgcaggccctccccttttctgctgccagagcctcagtttctaccctctgtgcctaccccctgcctcctcctgcccacaactcgagctcttcctctcctggggcccctgagccatggcactgaccgtgcactcccacccccacactgcccatgccctcaccttcctcctggacactctgaccccgctcccctcttggacccagccctggtatttccaggacaaaggctcacccaagtcttccccatgcaggcccttgccctcactgcccggttacacggcagcctcctgtgcacagaagcagggagctcagcccttccacaggcagaaggcactgaaagaaatcggcctccagcaccctgatgcacgtccgcctgtgtctctcactgcccgcacctgcagggaggctcggcactccctgtaaagacgagggatccaggcagcaacatcatgggagaatgcagggctcccagacagcccagccctctcgcaggcctctcctgggaagagacctgcagccaccactgaacagccacggagcccgctggatagtaactgagtcagtgaccgacctggagggcaggggagcagtgaaccggagcccagaccatagggacagagaccagccgctgacatcccgagcccctcactggcggccccagaacaccgcgtggaaacagaacagacccacattcccacctggaacagggcagacactgctgagcccccagcaccagccctgagaaacaccaggcaacggcatcagagggggctcctgagaaagaaaggaggggaggtctccttcaccagcaagtacttcccttgaccaaaaacagggtcc
acgcaactcccccaggacaaaggaggagccccctgtacagcactgggctcagagtcctctcccacacaccctgagtttcagacaaaaaccccctggaaatcatagtatcagcaggagaactagccagagacagcaagaggggactcagtgactcccgcggggacaggaggattttgtgggggctcgtgtcactgtgctgcataccctgctggacctgcaagtattcggcaactgtgaggttagccagcatctagactatgcccacagtgacacagccccattcaaaaacccctgctgtaaacgcttccacttctggagctgaggggctggggggagcgtctgggaagtagggcctaggggtggccatcaatgcccaaaacgcaccagactcccccccagacatcaccccactggccagtgagcagagtaaacagaaaatgagaagcagctgggaagcttgcacaggccccaaggaaagagctttggcgggtgtgcaagaggggatgcgggcagagcctgagcagggccttttgctgtttctgctttcctgtgcagatagttccataaactggtgttcaagatcgatggctgggagtgagcccaggaggacagtgtgggaagggcacagggaaggagaagcagccgctatcctacactgtcatctttcaagagtttgccctgtgcccacaatgctgcatcatgggatgcttaacagctgatgtagacacagctaaagagagaatcagtgaaatggatttgcagcacagatctgaataaattctccagaatgtggagccacacagaagcaagcacaaggaaagtgcctgatgcaagggcaaagtacagtgtgtaccttcaggctgggcacagacactctgaaaagccttggcaggaactccctgcaacaaagcagagccctgcaggcaatgccagctccagagccctccctgagagcctcatgggcaaagatgtgcacaacaggtgtttctcatagccccaaactgagaatgaagcaaacagccatctgaaggaaaacaggcaaataaacgatggcaggttcatgaaatgcaaacccagacagccagaaggacaacagtgagggttacaggtgactctgtggttgagttcatgacaatgctgagtaattggagtaacaaaggaaagtccaaaaaatactttcaatgtgatttcttctaaataaaatttacagccggcaaaatgaactatcttcttaagggataaactttccactaggaaaactataaggaaaatcaagaaaaggatgatcacataaacacagtggtcgttacttctactggggaaggaagagggtatgaactgagacacacagggttggcaagtctcctaacaagaacagaacaaatacattacagtaccttgaaaacagcagttaaaattctaaattgcaagaagaggaaaatgcacacagctgtgtttagaaaattctcagtccagcactgttcataatagcaaagacattaacccaggttggataaataaacgatgacacaggcaattgcacaatgatacagacatacattcagtatatgagacattgatgatgtatccccaaagaaatgactttaaagagaaaaggcctgatatgtggtggcactcacctccctgggcatccccggacaggctgcaggcacactgtgtggcagggcaggctggtacctgctggcagctcctggggcctgatgtggagcaggcacagagccgtatccccccgaggacatatacccccaaggacggcacagttggtacattccggagacaagcaactcagccacactcccaggccagagcccgagagggacgcccatgcacagggaggcagagcccagctcctccacagccagcagcacccgtgcaggggccgccatctggcaggcacagagcatgggctgggaggaggggcagggacaccaggcagggttggcaccaactgaaaattacagaagtctcatacatctacctcagccttgcctgacctgggcctcacctgacctggacctcacctggcctggacctcacctggcctagacctcacctctgggcttcacctgagctcggcctcacctgacttggaccttgcctgtcctgagctcacatgatctgggcctcacctgacctgggtttcacctgacctgggcttcacctgacctgggcctcatctgacctgggcctcactggcctggacctcacctggcctgggcttcacctggcctcaggcctcatctgcacctgctccaggtcttgctggaacctcagtagcactgaggctgcaggggctcatccagggttgcagaatgactctagaacctcccacatctcagctttctgggtggaggcacctggtggcccagggaatataaaaagcctgaatgatgcctgcgtgatttgggggcaatttataaacccaaaaggacatggccatgcagcgggtagggacaatacagacagatatcagcctgaaatggagcctcagggcacaggtgggcacggacactgtccacctaagccaggggcagacccgagtgtccccgcagtagacctgagagcgctgggcccacagcctcccctcggtgccctgctacctcctcaggtcagccctggacatcccgggtttccccaggcctggcggtaggattttgttgaggtctgtgtcactgtgcatggcagctactgccagcccgcagccactggctactgaggatgccgattctgagaatagcagcttctactactatgactacctggatgaagtagctttcatgctctgccggaaggatgctgtggttagctttggcaaagttttcctgccaccacagtgtcacagagtccatcaaaaacccatccctgggaaccttctgccacagccctccctgtggggcaccgccgcgtgccatgttaggattttgactgaggacacagcaccatgggtatggtggctaccgcagcagtgcagcccgtgaccca
aacacacagggcagcaggcacaacagacaagcccacaagtgaccaccctgagctcctgcctgccagccctggagaccatgaaacagatggccaggattatcccataggtcagccagacctcagtccaacaggtctgcatcgctgctgccctccaataccagtccggatggggacagggctggcccacattaccatttgctgccatccggccaacagtcccagaagcccctccctcaaggctgggccacatgtgtggaccctgagagccccccatgtctgagtaggggcaccaggaaggtggggctggccctgtgcactgtccctgcccctgtggtccctggcctgcctggccctgacacctgggcctctcctgggtcatttccaagacagaagacattcccaggacagctggagctgggagtccatcatcctgcctggccgtcctgagtcctgcgcctttccaaacctcacccgggaagccaacagaggaatcacctcccacaggcagagacaaagaccttccagaaatctctgtctctctccccagtgggcaccctcttccagggcagtcctcagtgatatcacagtgggaacccacatctggatcgggactgcccccagaacacaagatggcccacagggacagccccacagcccagcccttcccagacccctaaaaggcgtcccaccccctgcatctgccccagggctcaaactccaggaggactgactcctgcacaccctcctgccagacatcacctcagcccctcctggaagggacaggagcgcgcaagggtgagtcagaccctcctgccctcgatggcaggcggagaagattcagaaaggtctgagatccccaggacgcagcaccactgtcaatgggggccccagacgcctggaccagggcctgcgtgggaaaggcctctgggcacactcagggggattttgtgaagggtcctcccactgtgcatggcagctactgccagcccgcagccactggctactgaggatgccgattctgagaatagcagcttctactactatgactacctggatgaagtagctttcatgctctgccggaaggatgctgtggttagctttggcaaagttttcctgccactgcataccctgctggacctgcaagtattcggcaactgtgaggttagccagcatctagactatgcccacagtgatgaacccagcatcaaaaaccgaccggactcccaaggtttatgcacacttctccgctcagagctctccaggatcagaagagccgggcccaagggtttctgcccagaccctcggcctctagggacatcttggccatgacagcccatgggctggtgccccacacatcgtctgccttcaaacaagggcttcagagggctctgaggtgacctcactgatgaccacaggtgccctggccccttccccaccagctgcaccagaccccgtcatgacagatgccccgattccaacagccaattcctggggccaggaatcgctgtagacaccagcctccttccaacacctcctgccaattgcctggattcccatcccggttggaatcaagaggacagcatcccccaggctcccaacaggcaggactcccacaccctcctctgagaggccgctgtgttccgtagggccaggctgcagacagtccccctcacctgccactagacaaatgcctgctgtagatgtccccacctggaaaataccactcatggagcccccagccccaggtacagctgtagagagagtctctgaggcccctaagaagtagccatgcccagttctgccgggaccctcggccaggctgacaggagtggacgctggagctgggcccatactgggccacataggagctcaccagtgagggcaggagagcacatgccggggagcacccagcctcctgctgaccagaggcccgtcccagagcccaggaggctgcagaggcctctccagggggacactgtgcatgtctggtccctgagcagccccccacgtccccagtcctgggggcccctggcacagctgtctggaccctctctattccctgggaagctcctcctgacagccccgcctccagttccaggtgtggattttgtcagggggtgtcacactgtgcagcttcttgtgcaagcacagtggtgctgcccatatcaaaaaccaggccaagtagacaggcccctgctgtgcagccccaggcctccagctcacctgcttctcctggggctctcaaggctgctgttttctgcactctcccctctgtggggagggttccctcagtgggagatctgttctcaacatcccacggcctcattcctgcaaggaaggccaatggatgggcaacctcacatgccgcggctaagatagggtgggcagcctggcggggacaggacatcctgctggggtatctgtcactgtgcctagtggggcactggctcccaaacaacgcagtccttgccaaaatccccacggcctcccccgctaggggctggcctgatctcctgcagtcctaggaggctgctgacctccagaatggctccgtccccagttccagggcgagagcagatcccaggccggctgcagactgggaggccaccccctccttcccagggttcactgcaggtgaccagggcaggaaatggcctgaacacagggataaccgggccatcccccaacagagtccaccccctcctgctctgtaccccgcaccccccaggccagcccatgacatccgacaaccccacaccagagtcactgcccggtgctgccctagggaggacccctcagcccccaccctgtctagaggactggggaggacaggacacgccctctccttatggttcccccacctggctctggctgggacccttggggtgtggacagaaaggacgcttgcctgattggcccccaggagcccagaacttctctccagggaccccagcccgagcacccccttacccaggacccagccctgcccctcctcccctctgc
tctcctctcatcaccccatgggaatccagaatccccaggaagccatcaggaagggctgagggaggaagtggggccactgcaccaccaggcaggaggctctgtctttgtgaacccagggaggtgccagcctcctagagggtatggtccaccctgcctatggctcccacagtggcaggctgcagggaaggaccagggacggtgtgggggagggctcagggccccgcgggtgctccatcttggatgagcctatctctctcacccacggactcgcccacctcctcttcaccctggccacacgtcgtccacaccatcctaagtcccacctacaccagagccggcacagccagtgcagacagaggctggggtgcaggggggccgactgggcagcttcggggagggaggaatggaggaaggggagttcagtgaagaggcccccctcccctgggtccaggatcctcctctgggacccccggatcccatcccctccaggctctgggaggagaagcaggatgggagaatctgtgcgggaccctctcacagtggaatacctccacagcggctcaggccagatacaaaagcccctcagtgagccctccactgcagtgctgggcctgggggcagccgctcccacacaggatgaacccagcaccccgaggatgtcctgccagggggagctcagagccatgaaggagcaggatatgggacccccgatacaggcacagacctcagctccattcaggactgccacgtcctgccctgggaggaacccctttctctagtccctgcaggccaggaggcagctgactcctgacttggacgcctattccagacaccagacagaggggcaggccccccagaaccagggatgaggacgccccgtcaaggccagaaaagaccaagttgcgctgagcccagcaagggaaggtccccaaacaaaccaggaggattttgtaggtgtctgtgtcactgtgcaaacccatgaaaaccccaagggagtttggaactgccatgccgatttcggcgggcatggcaccatttggaagctcttcctccggttccagcagaacctgctaccacagtgacactcgccaggtcaaaaaccccatcccaagtcagcggaatgcagagagagcagggaggacatgtttaggatctgaggccgcacctgacacccaggccagcagacgtctcctgtccacggcaccctgccatgtcctgcatttctggaagaacaagggcaggctgaagggggtccaggaccaggagatgggtccgctctacccagagaaggagccaggcaggacacaagcccccacgcgtgggctcgtagtttgacgtgcgtgaagtgtgggtaagaaagtacgta
[0190]
d6-d17613(seq id no:132)包括在对应于dh1-7至dh6-13的位置中插入的d6编码序列:
[0191]
gcggccgctgccatttcattacctctttctccgcacccgacatagattacgtaacgcgtgggctcgtagtttgacgtgcgtgaagtgtgggtaagaaagtccccattgaggctgacctgcccagagggtcctgggcccacccaacacaccggggcggaatgtgtgcaggcctcggtctctgtgggtgttccgctagctggggctcacagtgctcaccccacacctaaaacgagccacagcctccggagcccctgaaggagaccccgcccacaagcccagcccccacccaggaggccccagagcacagggcgccccgtcggattttgtacagccccgagtcactgtgcagcttcttgcacagtgagaaaagcttcgtcaaaaaccgtctcctggccacagtcggaggccccgccagagaggggagcagccaccccaaacccatgttctgccggctcccatgaccccgtgcacctggagccccacggtgtccccactggatgggaggacaagggccgggggctccggcgggtcggggcaggggcttgatggcttccttctgccgtggccccattgcccctggctggagttgacccttctgacaagtgtcctcagagagtcagggatcagtggcacctcccaacatcaaccccacgcagcccaggcacaaaccccacatccagggccaactccaggaacagagacaccccaataccctgggggaccccgaccctgatgactcccgtcccatctctgtccctcacttggggcctgctgcggggcgagcacttgggagcaaactcaggcttaggggacaccactgtgggcctgacctcgagcaggccacagacccttccctcctgccctggtgcagcacagactttggggtctgggcagggaggaacttctggcaggtcaccaagcacagagcccccaggctgaggtggccccagggggaaccccagcaggtggcccactacccttcctcccagctggaccccatgtcttccccaagataggggtgccatccaaggcaggtcctccatggagcccccttcaggctcctctccagaccccactgggcctcagtccccactctaggaatgcagccaccacgggcacaccaggcagcccaggcccagccaccctgcagtgcccaagcccacaccctggaggagagcagggtgcgtctgggaggggctgggctccccacccccacccccacctgcacaccccacccacccttgcccgggccccctgcaggagggtcagagcccccatgggatatggacttagggtctcactcacgcacctcccctcctgggagaaggggtctcatgcccagatccccccagcagcgctggtcacaggtagaggcagtggccccagggccaccctgacctggcccctcaggctcctctagccctggctgccctgctgtccctgggaggcctgggc
tccaccagaccacaggtctagggcaccgcccacactggggccgcccacacacagctcacaggaagaagataagctccagacccccaggcccgggacctgccttgctgctacgacttcctgccccagacctcgttgccctcccccgtccacttacacacaggccaggaagctgttcccacacagaccaaccccagacggggaccacctggcactcaggtcactgccatttccttctccattcacttccaatgcctctgtgcttcctccctcctccttccttcgggggagcaccctgtgcagctcctccctgcagtccacaccctggggagacccgaccctgcagcccacaccctggggagacctgaccctcctccagccctttctcccccgctgctcttgccacccaccaagacagccctggggtcctgtccctacagcccccacccagttctctacctagacccgtcttcctccctctaaacacctctcccaggccaaccctacacctgcaggccctcccctccactgccaaagaccctcagtttctcctgcctgtgcccacccccgtgctcctcctgcccacagctcgagctcttcctctcctagggcccctgagggatggcattgaccgtgccctcgcacccacacactgcccatgccctcacattcctcctggccactccagccccactcccctctcaggcctggctctggtatttctgggacaaagccttacccaagtctttcccatgcaggcctgggcccttaccctcactgcccggttacagggcagcctcctgtgcacagaagcagggagctcagcccttccacaggcagaaggcactgaaagaaatcggcctccagcgccttgacacacgtctgcctgtgtctctcactgcccgcacctgcagggaggctcggcactccctctaaagacgagggatccaggcagcagcatcacaggagaatgcagggctaccagacatcccagtcctctcacaggcctctcctgggaagagacctgaagacgcccagtcaacggagtctaacaccaaacctccctggaggccgatgggtagtaacggagtcattgccagacctggaggcaggggagcagtgagcccgagcccacaccatagggccagaggacagccactgacatcccaagccactcactggtggtcccacaacaccccatggaaagaggacagacccacagtcccacctggaccagggcagagactgctgagacccagcaccagaaccaaccaagaaacaccaggcaacagcatcagagggggctctggcagaacagaggaggggaggtctccttcaccagcaggcgcttcccttgaccgaagacaggatccatgcaactcccccaggacaaaggaggagccccttgttcagcactgggctcagagtcctctccaagacacccagagtttcagacaaaaaccccctggaatgcacagtctcagcaggagagccagccagagccagcaagatggggctcagtgacacccgcagggacaggaggattttgtgggggctcgtgtcactgtgctgcataccctgctggacctgcaagtattcggcaacagtgaggttagccagcatctagactatgcccacagtgacacagccccattcaaaaacccctactgcaaacgcattccacttctggggctgaggggctgggggagcgtctgggaaatagggctcaggggtgtccatcaatgcccaaaacgcaccagactcccctccatacatcacacccaccagccagcgagcagagtaaacagaaaatgagaagcaagctggggaagcttgcacaggccccaaggaaagagctttggcgggtgtgtaagaggggatgcgggcagagcctgagcagggccttttgctgtttctgctttcctgtgcagagagttccataaactggtgttcgagatcaatggctgggagtgagcccaggaggacagcgtgggaagagcacagggaaggaggagcagccgctatcctacactgtcatctttcgaaagtttgccttgtgcccacactgctgcatcatgggatgcttaacagctgatgtagacacagctaaagagagaatcagtgagatggatttgcagcacagatctgaataaattctccagaatgtggagcagcacagaagcaagcacacagaaagtgcctgatgcaaggacaaagttcagtgggcaccttcaggcattgctgctgggcacagacactctgaaaagccctggcaggaactccctgtgacaaagcagaaccctcaggcaatgccagccccagagccctccctgagagcctcatgggcaaagatgtgcacaacaggtgtttctcatagccccaaactgagagcaaagcaaacgtccatctgaaggagaacaggcaaataaacgatggcaggttcatgaaatgcaaacccagacagccacaagcacaaaagtacagggttataagcgactctggttgagttcatgacaatgctgagtaattggagtaacaaagtaaactccaaaaaatactttcaatgtgatttcttctaaataaaatttacaccctgcaaaatgaactgtcttcttaagggatacatttcccagttagaaaaccataaagaaaaccaagaaaaggatgatcacataaacacagtggtggttacttctgctggggaaggaagagggtatgaactgagatacacagggtgggcaagtctcctaacaagaacagaacgaatacattacagtaccttgaaaacagcagttaaacttctaaattgcaagaagaggaaaatgcacacagttgtgtttagaaaattctcagtccagcactgttcataatagcaaagacattaacccaggtcggataaataagcgatgacacaggcaattgcacaatgatacagacatatatttagtatatgagacatcgatgatgtatccccaaataaacgactttaaagagataaagggctga
tgtgtggtggcattcacctccctgggatccccggacaggttgcaggctcactgtgcagcagggcaggcgggtacctgctggcagttcctggggcctgatgtggagcaagcgcagggccatatatcccggaggacggcacagtcagtgaattccagagagaagcaactcagccacactccccaggcagagcccgagagggacgcccacgcacagggaggcagagcccagcacctccgcagccagcaccacctgcgcacgggccaccaccttgcaggcacagagtgggtgctgagaggaggggcagggacaccaggcagggtgagcacccagagaaaactgcagacgcctcacacatccacctcagcctcccctgacctggacctcactggcctgggcctcacttaacctgggcttcacctgaccttggcctcacctgacttggacctcgcctgtcccaagctttacctgacctgggcctcaactcacctgaacgtctcctgacctgggtttaacctgtcctggaactcacctggccttggcttcccctgacctggacctcatctggcctgggcttcacctggcctgggcctcacctgacctggacctcatctggcctggacctcacctggcctggacttcacctggcctgggcttcacctgacctggacctcacctggcctcgggcctcacctgcacctgctccaggtcttgctggagcctgagtagcactgagggtgcagaagctcatccagggttggggaatgactctagaagtctcccacatctgacctttctgggtggaggcagctggtggccctgggaatataaaaatctccagaatgatgactctgtgatttgtgggcaacttatgaacccgaaaggacatggccatggggtgggtagggacatagggacagatgccagcctgaggtggagcctcaggacacaggtgggcacggacactatccacataagcgagggatagacccgagtgtccccacagcagacctgagagcgctgggcccacagcctcccctcagagccctgctgcctcctccggtcagccctggacatcccaggtttccccaggcctggcggtaggattttgttgaggtctgtgtcactgtgcatggcagctactgccagcccgcagccactggctactgaggatgccgattctgagaatagcagcttctactactatgactacctggatgaagtagctttcatgctccacagtgtcacagagtccatcaaaaacccatgcctggaagcttcccgccacagccctccccatggggccctgctgcctcctcaggtcagccccggacatcccgggtttccccaggctgggcggtaggattttgttgaggtctgtgtcactgtgccaaacccatgaaaaccccaagggagtttggaacagccatgccgatttcggcgggcatggcaccatttggaagctcttcctccggttccagcagaacctgctacccacagtgtcacagagtccatcaaaaacccatccctgggagcctcccgccacagccctccctgcaggggaccggtacgtgccatgttaggattttgatcgaggagacagcaccatgggtatggtggctaccacagcagtgcagcctgtgacccaaacccgcagggcagcaggcacgatggacaggcccgtgactgaccacgctgggctccagcctgccagccctggagatcatgaaacagatggccaaggtcaccctacaggtcatccagatctggctccgaggggtctgcatcgctgctgccctcccaacgccagtccaaatgggacagggacggcctcacagcaccatctgctgccatcaggccagcgatcccagaagcccctccctcaaggctgggcacatgtgtggacactgagagccctcatatctgagtaggggcaccaggagggaggggctggccctgtgcactgtccctgcccctgtggtccctggcctgcctggccctgacacctgagcctctcctgggtcatttccaagacagaagacattcctggggacagccggagctgggcgtcgctcatcctgcccggccgtcctgagtcctgctcatttccagacctcaccggggaagccaacagaggactcgcctcccacattcagagacaaagaaccttccagaaatccctgcctctctccccagtggacaccctcttccaggacagtcctcagtggcatcacagcggcctgagatccccaggacgcagcaccgctgtcaataggggccccaaatgcctggaccagggcctgcgtgggaaaggcctctggccacactcggggattttgtgaagggccctcccactgtgccagcttcttgagccatgccgatttcggcgggcatggcaccatttggaagctcttcctccggttccagcagaacctgctaccacagtgatgaacccagtgtcaaaaaccggctggaaacccaggggctgtgtgcacgcctcagcttggagctctccaggagcacaagagccgggcccaaggatttgtgcccagaccctcagcctctagggacacctgggtcatctcagcctgggctggtgccctgcacaccatcttcctccaaataggggcttcagagggctctgaggtgacctcactcatgaccacaggtgacctggcccttccctgccagctataccagaccctgtcttgacagatgccccgattccaacagccaattcctgggaccctgaatagctgtagacaccagcctcattccagtacctcctgccaattgcctggattcccatcctggctggaatcaagaaggcagcatccgccaggctcccaacaggcaggactcccgcacaccctcctctgagaggccgctgtgttccgcagggccaggccctggacagttcccctcacctgccactagagaaacacctgccattgtcgtccccacctggaaaagaccactcgtggagcccccagccccaggtacagc
tgtagagacagtcctcgaggcccctaagaaggagccatgcccagttctgccgggaccctcggccaggccgacaggagtggacgctggagctgggcccacactgggccacataggagctcaccagtgagggcaggagagcacatgccggggagcacccagcctcctgctgaccagaggcccgtcccagagcccaggaggctgcagaggcctctccagggagacactgtgcatgtctggtacctaagcagccccccacgtccccagtcctgggggcccctggctcagctgtctgggccctccctgctccctgggaagctcctcctgacagccccgcctccagttccaggtgtggattttgtcaggcgatgtcacactgtgcagcttcttgagcaagcacagtggtgccgcccatatcaaaaaccaggccaagtagacaggcccctgctgcgcagccccaggcatccacttcacctgcttctcctggggctctcaaggctgctgtctgtcctctggccctctgtggggagggttccctcagtgggaggtctgtgctccagggcagggatgattgagatagaaatcaaaggctggcagggaaaggcagcttcccgccctgagaggtgcaggcagcaccacggagccacggagtcacagagccacggagcccccattgtgggcatttgagagtgctgtgcccccggcaggcccagccctgatggggaagcctgtcccatcccacagcccgggtcccacgggcagcgggcacagaagctgccaggttgtcctctatgatcctcatccctccagcagcatcccctccacagtggggaaactgaggcttggagcaccacccggccccctggaaatgaggctgtgagcccagacagtgggcccagagcactgtgagtaccccggcagtacctggctgcagggatcagccagagatgccaaaccctgagtgaccagcctacaggaggatccggccccacccaggccactcgattaatgctcaaccccctgccctggagacctcttccagtaccaccagcagctcagcttctcagggcctcatccctgcaaggaaggtcaagggctgggcctgccagaaacacagcaccctccctagccctggctaagacagggtgggcagacggctgtggacgggacatattgctggggcatttctcactgtcacttctgggtggtagctctgacaaaaacgcagaccctgccaaaatccccactgcctcccgctaggggctggcctggaatcctgctgtcctaggaggctgctgacctccaggatggctccgtccccagttccagggcgagagcagatcccaggcaggctgtaggctgggaggccacccctgcccttgccggggttgaatgcaggtgcccaaggcaggaaatggcatgagcacagggatgaccgggacatgccccaccagagtgcgccccttcctgctctgcaccctgcaccccccaggccagcccacgacgtccaacaactgggcctgggtggcagccccacccagacaggacagacccagcaccctgaggaggtcctgccagggggagctaagagccatgaaggagcaagatatggggcccccgatacaggcacagatgtcagctccatccaggaccacccagcccacaccctgagaggaacgtctgtctccagcctctgcaggtcgggaggcagctgacccctgacttggacccctattccagacaccagacagaggcgcaggccccccagaaccagggttgagggacgccccgtcaaagccagacaaaaccaaggggtgttgagcccagcaagggaaggcccccaaacagaccaggaggattttgtaggtgtctgtgtcactgtgcatggcagctactgccagcccgcagccactggctactgaggatgccgattctgagaatagcagcttctactactatgactacctggatgaagtagctttcatgctcagccggaaggatgctgtggttagctttggcaaagttttcctgccacccacagtgacactcacccagtcaaaaaccccattccaagtcagcggaagcagagagagcagggaggacacgtttaggatctgagactgcacctgacacccaggccagcagacgtctcccctccagggcaccccaccctgtcctgcatttctgcaagatcaggggcggcctgagggggggtctagggtgaggagatgggtcccctgtacaccaaggaggagttaggcaggtcccgagcactcttaattaaacgacgcctcgaatggaactactacaacgaatggttgctctacgtaatgcattcgctaccttaggaccgttatagttaggcgcgcc
[0192]
d6-dh114619(seq id no:133)包括在对应于dh1-14至dh6-19的位置中插入的d6编码序列:
[0193]
tacgtattaattaaacgacgcctcgaatggaactactacaacgaatggttgctctccccattgaggctgacctgcccagagagtcctgggcccaccccacacaccggggcggaatgtgtgcaggcctcggtctctgtgggtgttccgctagctggggctcacagtgctcaccccacacctaaaatgagccacagcctccggagcccccgcaggagaccccgcccacaagcccagcccccacccaggaggccccagagctcagggcgccccgtcggattttgtacagccccgagtcactgtgcaaacccatgaaaaccccaagggagtttggaaccacagtgagaatagctacgtcaaaaaccgtccagtggccactgccggaggccccgccagagagggcagcagccactctgatcccatgtcctgccggctcccatgacccccagcacgcgga
gccccacagtgtccccactggatgggaggacaagagctggggattccggcgggtcggggcaggggcttgatcgcatccttctgccgtggctccagtgcccctggctggagttgacccttctgacaagtgtcctcagagagacaggcatcaccggcgcctcccaacatcaaccccaggcagcacaggcacaaaccccacatccagagccaactccaggagcagagacaccccaataccctgggggaccccgaccctgatgacttcccactggaattcgccgtagagtccaccaggaccaaagaccctgcctctgcctctgtccctcactcaggacctgctgccgggcgaggccttgggagcagacttgggcttaggggacaccagtgtgaccccgaccttgaccaggacgcagacctttccttcctttcctggggcagcacagactttggggtctgggccaggaggaacttctggcaggtcgccaagcacagaggccacaggctgaggtggccctggaaagacctccaggaggtggccactccccttcctcccagctggaccccatgtcctccccaagataagggtgccatccaaggcaggtgctccttggagccccattcagactcctccctggaccccactgggcctcagtcccagctctggggatgaagccaccacaagcacaccaggcagcccaggcccagccaccctgcagtgcccaagcacacactctggagcagagcagggtgcctctgggaggggctgagctccccaccccacccccacctgcacaccccacccacccctgcccagcggctctgcaggagggtcagagccccacatggggtatggacttagggtctcactcacgtggctcccatcatgagtgaaggggcctcaagcccaggttcccacagcagcgcctgtcgcaagtggaggcagaggcccgagggccaccctgacctggtccctgaggttcctgcagcccaggctgccctgctgtccctgggaggcctgggctccaccagaccacaggtccagggcaccgggtgcaggagccacccacacacagctcacaggaagaagataagctccagacccccagggccagaacctgccttcctgctactgcttcctgccccagacctgggcgccctcccccgtccacttacacacaggccaggaagctgttcccacacagaacaaccccaaaccaggaccgcctggcactcaggtggctgccatttccttctccatttgctcccagcgcctctgtcctccctggttcctccttcgggggaacagcctgtgcagccagtccctgcagcccacaccctggggagacccaaccctgcctggggcccttccaaccctgctgctcttactgcccacccagaaaactctggggtcctgtccctgcagtccctaccctggtctccacccagacccctgtgtatcactccagacacccctcccaggcaaaccctgcacctgcaggccctgtcctcttctgtcgctagagcctcagtttctcccccctgtgcccacaccctacctcctcctgcccacaactctaactcttcttctcctggagcccctgagccatggcattgaccctgccctcccaccacccacagcccatgccctcaccttcctcctggccactccgaccccgccccctctcaggccaagccctggtatttccaggacaaaggctcacccaagtctttcccaggcaggcctgggctcttgccctcacttcccggttacacgggagcctcctgtgcacagaagcagggagctcagcccttccacaggcagaaggcactgaaagaaatcggcctccagcaccttgacacacgtccgcccgtgtctctcactgcccgcacctgcagggaggctccgcactccctctaaagacaagggatccaggcagcagcatcacgggagaatgcagggctcccagacatcccagtcctctcacaggcctctcctgggaagagacctgcagccaccaccaaacagccacagaggctgctggatagtaactgagtcaatgaccgacctggagggcaggggagcagtgagccggagcccataccatagggacagagaccagccgctgacatcccgagctcctcaatggtggccccataacacacctaggaaacataacacacccacagccccacctggaacagggcagagactgctgagcccccagcaccagccccaagaaacaccaggcaacagtatcagagggggctcccgagaaagagaggaggggagatctccttcaccatcaaatgcttcccttgaccaaaaacagggtccacgcaactcccccaggacaaaggaggagccccctatacagcactgggctcagagtcctctctgagacaccctgagtttcagacaacaacccgctggaatgcacagtctcagcaggagaacagaccaaagccagcaaaagggacctcggtgacaccagtagggacaggaggattttgtgggggctcgtgtcactgtgcaaacccatgaaaaccccaagggagtttggaactgcaagcacagtgacacagacccattcaaaaacccctactgcaaacacacccactcctggggctgaggggctgggggagcgtctgggaagtagggtccaggggtgtctatcaatgtccaaaatgcaccagactccccgccaaacaccaccccaccagccagcgagcagggtaaacagaaaatgagaggctctgggaagcttgcacaggccccaaggaaagagctttggcgggtgtgcaagaggggatgcaggcagagcctgagcagggccttttgctgtttctgctttcctgtgcagagagttccataaactggtgttcaagatcagtggctgggaatgagcccaggagggcagtctgtgggaagagcacagggaaggaggagcagccgctatcctacactgtcatctttcaaaagtttgccttgtgaccacactattgc
atcatgggatgcttaagagctgatgtagacacagctaaagagagaatcagtgagatgaatttgcagcatagatctgaataaactctccagaatgtggagcagtacagaagcaaacacacagaaagtgcctgatgcaaggacaaagttcagtgggcaccttcaggcattgctgctgggcacagacactctgaaaagccttggcaggatctccctgcgacaaagcagaaccctcaggcaatgccagccccagagccctccctgagagcgtcatggggaaagatgtgcagaacagctgattatcatagactcaaactgagaacagagcaaacgtccatctgaagaacagtcaaataagcaatggtaggttcatgcaatgcaaacccagacagccaggggacaacagtagagggctacaggcggctttgcggttgagttcatgacaatgctgagtaattggagtaacagaggaaagcccaaaaaatacttttaatgtgatttcttctaaataaaatttacaccaggcaaaatgaactgtcttcttaagggataaactttcccctggaaaaactacaaggaaaattaagaaaacgatgatcacataaacacagttgtggttacttctactggggaaggaagagggtatgagctgagacacacagagtcggcaagtctccaagcaagcacagaacgaatacattacagtaccttgaatacagcagttaaacttctaaatcgcaagaacaggaaaatgcacacagctgtgtttagaaaattctcagtccagcactattcataatagcaaagacattaacccaggttggataaataaatgatgacacaggcaattgcacaatgatacagacatacatttagtacatgagacatcgatgatgtatccccaaagaaatgactttaaagagaaaaggcctgatgtgtggtggcactcacctccctgggatccccggacaggttgcaggcacactgtgtggcagggcaggctggtacatgctggcagctcctggggcctgatgtggagcaagcgcagggctgtatacccccaaggatggcacagtcagtgaattccagagagaagcagctcagccacactgcccaggcagagcccgagagggacgcccacgtacagggaggcagagcccagctcctccacagccaccaccacctgtgcacgggccaccaccttgcaggcacagagtgggtgctgagaggaggggcagggacaccaggcagggtgagcacccagagaaaactgcagaagcctcacacatccacctcagcctcccctgacctggacctcacctggtctggacctcacctggcctgggcctcacctgacctggacctcacctggcctgggcttcacctgacctggacctcacctggcctccggcctcacctgcacctgctccaggtcttgctggaacctgagtagcactgaggctgcagaagctcatccagggttggggaatgactctggaactctcccacatctgacctttctgggtggaggcatctggtggccctgggaatataaaaagccccagaatggtgcctgcgtgatttgggggcaatttatgaacccgaaaggacatggccatggggtgggtagggacatagggacagatgccagcctgaggtggagcctcaggacacagttggacgcggacactatccacataagcgagggacagacccgagtgttcctgcagtagacctgagagcgctgggcccacagcctcccctcggtgccctgctgcctcctcaggtcagccctggacatcccgggtttccccaggccagatggtaggattttgttgaggtctgtgtcactgtgcatggcagctactgccagcccgcagccactggctactgaggatgccgattctgagaatagcagcttctactactatgactacctggatgaagtagctttcatgctctgcgaggttagccagcatctagactatgcccacagtgtcacacggtccatcaaaaacccatgccacagccctccccgcaggggaccgccgcgtgccatgttacgattttgatcgaggacacagcgccatgggtatggtggctaccacagcagtgcagcccatgacccaaacacacagggcagcaggcacaatggacaggcctgtgagtgaccatgctgggctccagcccgccagccccggagaccatgaaacagatggccaaggtcaccccacagttcagccagacatggctccgtggggtctgcatcgctgctgccctctaacaccagcccagatggggacaaggccaaccccacattaccatctcctgctgtccacccagtggtcccagaagcccctccctcatggctgagccacatgtgtgaaccctgagagcaccccatgtcagagtaggggcagcagaagggcggggctggccctgtgcactgtccctgcacccatggtccctcgcctgcctggccctgacacctgagcctcttctgagtcatttctaagatagaagacattcccggggacagccggagctgggcgtcgctcatcccgcccggccgtcctgagtcctgcttgtttccagacctcaccagggaagccaacagaggactcacctcacacagtcagagacaaagaaccttccagaaatccctgtctcactccccagtgggcaccttcttccaggacattcctcggtcgcatcacagcaggcacccacatctggatcaggacggcccccagaacacaagatggcccatggggacagccccacaacccaggccttcccagacccctaaaaggcgtcccaccccctgcacctgccccagggctaaaaatccaggaggcttgactcccgcataccctccagccagacatcacctcagccccctcctggaggggacaggagcccgggagggtgagtcagacccacctgccctcgatggcaggcggggaagattcagaaaggcctgagatccccaggacgcagcaccac
tgtcaatgggggccccagacgcctggaccagggcctgcgtgggaaaggccgctgggcacactcagggggattttgtgaaggcccctcccactgtgcagcttcttgtgcaagcaaacccatgaaaaccccaagggagtttggaactgccatgccgatttcggcgggcatggcaccatttggaagctcttcctccggttccagcagaacctgctaccacagtgatgaaactagcatcaaaaaccggccggacacccagggaccatgcacacttctcagcttggagctctccaggaccagaagagtcaggtctgagggtttgtagccagaccctcggcctctagggacaccctggccatcacagcggatgggctggtgccccacatgccatctgctccaaacaggggcttcagagggctctgaggtgacttcactcatgaccacaggtgccctggccccttccccgccagctacaccgaaccctgtcccaacagctgccccagttccaacagccaattcctggggcccagaattgctgtagacaccagcctcgttccagcacctcctgccaattgcctggattcacatcctggctggaatcaagagggcagcatccgccaggctcccaacaggcaggactcccgcacaccctcctctgagaggccgctgtgttccgcagggccaggccctggacagttcccctcacctgccactagagaaacacctgccattgtcgtccccacctggaaaagaccactcgtggagcccccagccccaggtacagctgtagagagactccccgagggatctaagaaggagccatgcgcagttctgccgggaccctcggccaggccgacaggagtggacactggagctgggcccacactgggccacataggagctcaccagtgagggcaggagagcacatgccggggagcacccagcctcctgctgaccagaggcccgtcccagagcccaggaggctgcagaggcctctccagggggacactgtgcatgtctggtccctgagcagccccccacgtccccagtcctgggggcccctggcacagctgtctggaccctccctgttccctgggaagctcctcctgacagccccgcctccagttccaggtgtggattttgtcagggggtgtcacactgtgctgcataccctgctggacctgcaagtattcggcaactgtcggaaggatgctgtggttagctttggcaaagttttcctgccaccacagtggtgctgcccatatcaaaaaccaggccaagtagacaggcccctgctgtgcagccccaggcctccacttcacctgcttctcctggggctctcaaggtcactgttgtctgtactctgccctctgtggggagggttccctcagtgggaggtctgttctcaacatcccagggcctcatgtctgcacggaaggccaatggatgggcaacctcacatgccgcggctaagatagggtgggcagcctggcgggggacagtacatactgctggggtgtctgtcactgtgcctagtggggcactggctcccaaacaacgcagtcctcgccaaaatccccacagcctcccctgctaggggctggcctgatctcctgcagtcctaggaggctgctgacctccagaatgtctccgtccccagttccagggcgagagcagatcccaggccggctgcagactgggaggccaccccctccttcccagggttcactggaggtgaccaaggtaggaaatggccttaacacagggatgactgcgccatcccccaacagagtcagccccctcctgctctgtaccccgcaccccccaggccagtccacgaaaaccagggccccacatcagagtcactgcctggcccggccctggggcggacccctcagcccccaccctgtctagaggacttggggggacaggacacaggccctctccttatggttcccccacctgcctccggccgggacccttggggtgtggacagaaaggacacctgcctaattggcccccaggaacccagaacttctctccagggaccccagcccgagcacccccttacccaggacccagccctgcccctcctcccctctgctctcctctcatcaccccatgggaatccggtatccccaggaagccatcaggaagggctgaaggaggaagcggggccgtgcaccaccgggcaggaggctccgtcttcgtgaacccagggaagtgccagcctcctagagggtatggtccaccctgcctggggctcccaccgtggcaggctgcggggaaggaccagggacggtgtgggggagggctcagggccctgcgggtgctcctccatcttcggtgagcctcccccttcacccaccgtcccgcccacctcctctccaccctggctgcacgtcttccacaccatcctgagtcctacctacaccagagccagcaaagccagtgcagacaaaggctggggtgcaggggggctgccagggcagcttcggggagggaaggatggagggaggggaggtcagtgaagaggcccccttcccctgggtccaggatcctcctctgggacccccggatcccatcccctcctggctctgggaggagaagcaggatgggagaatctgtgcgggaccctctcacagtggaatatccccacagcggctcaggccagacccaaaagcccctcagtgagccctccactgcagtcctgggcctgggtagcagcccctcccacagaggacagacccagcaccccgaagaagtcctgccagggggagctcagagccatgaaagagcaggatatggggtccccgatacaggcacagacctcagctccatccaggcccaccgggacccaccatgggaggaacacctgtctccgggttgtgaggtagctggcctctgtctcggaccccactccagacaccagacagaggggcaggccccccaaaaccagggttgagggatgatccgtcaaggcagacaagaccaaggggcactgac
cccagcaagggaaggctcccaaacagacgaggaggattttgtagctgtctgtatcactgtgcagcttcttgtgccatgccgatttcggcgggcatggcaccatttggaagctcttcctccggttccagcagaacctgctaccacagtgacactcgccaggtcaaaaaccccgtcccaagtcagcggaagcagagagagcagggaggacacgtttaggatctgaggccgcacctgacacccagggcagcagacgtctcccctccagggcaccctccaccgtcctgcgtttcttcaagaataggggcggcctgagggggtccagggccaggcgataggtcccctctaccccaaggaggagccaggcaggacccgagcaccgatgcatctaacgcagtcatgtaatgctgggtgacagtcagttcgcctacgta
[0194]
d6-dh120126(seq id no:134)包括在对应于dh1-20至dh1-26的位置中插入的d6编码序列:
[0195]
tacgtaatgcatctaacgcagtcatgtaatgctgggtgacagtcagttcgcctccccattgaggctgacctgcccagacgggcctgggcccaccccacacaccggggcggaatgtgtgcaggccccagtctctgtgggtgttccgctagctggggcccccagtgctcaccccacacctaaagcgagccccagcctccagagccccctaagcattccccgcccagcagcccagcccctgcccccacccaggaggccccagagctcagggcgcctggtcggattttgtacagccccgagtcactgtgcatgccgatttcggcgggcatggcaccatttggaagctcttcctccggttccagcagaacctgctaccacagtgagaaaaactgtgtcaaaaaccgactcctggcagcagtcggaggccccgccagagaggggagcagccggcctgaacccatgtcctgccggttcccatgacccccagcacccagagccccacggtgtccccgttggataatgaggacaagggctgggggctccggtggtttgcggcagggacttgatcacatccttctgctgtggccccattgcctctggctggagttgacccttctgacaagtgtcctcagaaagacagggatcaccggcacctcccaatatcaaccccaggcagcacagacacaaaccccacatccagagccaactccaggagcagagacaccccaacactctgggggaccccaaccgtgataactccccactggaatccgccccagagtctaccaggaccaaaggccctgccctgtctctgtccctcactcagggcctcctgcagggcgagcgcttgggagcagactcggtcttaggggacaccactgtgggccccaactttgatgaggccactgacccttccttcctttcctggggcagcacagactttggggtctgggcagggaagaactactggctggtggccaatcacagagcccccaggccgaggtggccccaagaaggccctcaggaggtggccactccacttcctcccagctggaccccaggtcctccccaagataggggtgccatccaaggcaggtcctccatggagcccccttcagactcctcccgggaccccactggacctcagtccctgctctgggaatgcagccaccacaagcacaccaggaagcccaggcccagccaccctgcagtgggcaagcccacactctggagcagagcagggtgcgtctgggaggggctaacctccccaccccccaccccccatctgcacacagccacctaccactgcccagaccctctgcaggagggccaagccaccatggggtatggacttagggtctcactcacgtgcctcccctcctgggagaaggggcctcatgcccagatccctgcagcactagacacagctggaggcagtggccccagggccaccctgacctggcatctaaggctgctccagcccagacagcactgccgttcctgggaagcctgggctccaccagaccacaggtccagggcacagcccacaggagccacccacacacagctcacaggaagaagataagctccagaccccagggcgggacctgccttcctgccaccacttacacacaggccagggagctgttcccacacagatcaaccccaaaccgggactgcctggcactagggtcactgccatttccctctccattccctcccagtgcctctgtgctccctccttctggggaacaccctgtgcagcccctccctgcagcccacacgctggggagaccccaccctgcctcgggccttttctacctgctgcacttgccgcccacccaaacaaccctgggtacgtgaccctgcagtcctcaccctgatctgcaaccagacccctgtccctccctctaaacacccctcccaggccaactctgcacctgcaggccctccgctcttctgccacaagagcctcaggttttcctacctgtgcccaccccctaacccctcctgcccacaacttgagttcttcctctcctggagcccttgagccatggcactgaccctacactcccacccacacactgcccatgccatcaccttcctcctggacactctgaccccgctcccctccctctcagacccggccctggtatttccaggacaaaggctcacccaagtcttccccatgcaggcccttgccctcactgcctggttacacgggagcctcctgtgcgcagaagcagggagctcagctcttccacaggcagaaggcactgaaagaaatcagcctccagtgccttgacacacgtccgcctgtgtctctcactgcctgcacctgcagggaggctccgcactccctctaaagatgagggatccagg
cagcaacatcacgggagaatgcagggctcccagacagcccagccctctcgcaggcctctcctgggaagagacctgcagccaccactgaacagccacggaggtcgctggatagtaaccgagtcagtgaccgacctggagggcaggggagcagtgaaccggagcccataccatagggacagagaccagccgctaacatcccgagcccctcactggcggccccagaacaccccgtggaaagagaacagacccacagtcccacctggaacagggcagacactgctgagcccccagcaccagccccaagaaacactaggcaacagcatcagagggggctcctgagaaagagaggaggggaggtctccttcaccatcaaatgcttcccttgaccaaaaacagggtccacgcaactcccccaggacaaaggaggagccccctgtacagcactgggctcagagtcctctctgagacaggctcagtttcagacaacaacccgctggaatgcacagtctcagcaggagagccaggccagagccagcaagaggagactcggtgacaccagtctcctgtagggacaggaggattttgtgggggttcgtgtcactgtgcaaacccatgaaaaccccaagggagtttggaacagcaagcacagtgacacaaccccattcaaaaacccctactgcaaacgcacccactcctgggactgaggggctgggggagcgtctgggaagtatggcctaggggtgtccatcaatgcccaaaatgcaccagactctccccaagacatcaccccaccagccagtgagcagagtaaacagaaaatgagaagcagctgggaagcttgcacaggccccaaggaaagagctttggcaggtgtgcaagaggggatgtgggcagagcctcagcagggccttttgctgtttctgctttcctgtgcagagagttccataaactggtattcaagatcaatggctgggagtgagcccaggaggacagtgtgggaagagcacagggaaggaggagcagccgctatcctacactgtcatcttttgaaagtttgccctgtgcccacaatgctgcatcatgggatgcttaacagctgatgtagacacagctaaagagagaatcagtgaaatggatttgcagcacagatctgaataaatcctccagaatgtggagcagcacagaagcaagcacacagaaagtgcctgatgccaaggcaaagttcagtgggcaccttcaggcattgctgctgggcacagacactctgaaaagcactggcaggaactgcctgtgacaaagcagaaccctcaggcaatgccagccctagagcccttcctgagaacctcatgggcaaagatgtgcagaacagctgtttgtcatagccccaaactatggggctggacaaagcaaacgtccatctgaaggagaacagacaaataaacgatggcaggttcatgaaatgcaaactaggacagccagaggacaacagtagagagctacaggcggctttgcggttgagttcatgacaatgctgagtaattggagtaacagaggaaagcccaaaaaatacttttaatgtgatttcttctaaataaaatttacacccggcaaaatgaactatcttcttaagggataaactttcccctggaaaaactataaggaaaatcaagaaaacgatgatcacataaacacagtggtggttacttctactggggaaggaagagggtatgagctgagacacacagagtcggcaagtctcctaacaagaacagaacaaatacattacagtaccttgaaaacagcagttaaacttctaaatcgcaagaagaggaaaatgcacacacctgtgtttagaaaattctcagtccagcactgttcataatagcaaagacattaacccaggttggataaataagcgatgacacaggcaattgcacaatgatacagacatacattcagtatatgagacatcgatgatgtatccccaaagaaatgactttaaagagaaaaggcctgatgtgtggtggcaatcacctccctgggcatccccggacaggctgcaggctcactgtgtggcagggcaggcaggcacctgctggcagctcctggggcctgatgtggagcaggcacagagctgtatatccccaaggaaggtacagtcagtgcattccagagagaagcaactcagccacactccctggccagaacccaagatgcacacccatgcacagggaggcagagcccagcacctccgcagccaccaccacctgcgcacgggccaccaccttgcaggcacagagtgggtgctgagaggaggggcagggacaccaggcagggtgagcacccagagaaaactgcagaagcctcacacatccctcacctggcctgggcttcacctgacctggacctcacctggcctcgggcctcacctgcacctgctccaggtcttgctggagcctgagtagcactgaggctgtagggactcatccagggttggggaatgactctgcaactctcccacatctgacctttctgggtggaggcacctggtggcccagggaatataaaaagccccagaatgatgcctgtgtgatttgggggcaatttatgaacccgaaaggacatggccatggggtgggtagggacagtagggacagatgtcagcctgaggtgaagcctcaggacacaggtgggcatggacagtgtccacctaagcgagggacagacccgagtgtccctgcagtagacctgagagcgctgggcccacagcctcccctcggggccctgctgcctcctcaggtcagccctggacatcccgggtttccccaggcctggcggtaggattttgttgaggtctgtgtcactgtgcatggcagctactgccagcccgcagccactggctactgaggatgccgattctgagaatagcagcttctactactatgactacctggatgaagtagctttcatgctcagcgaggttagccagcatctagactatgc
ccacagtgtcacagagtccatcaaaaacccatgcctgggagcctcccaccacagccctccctgcgggggaccgctgcatgccgtgttaggattttgatcgaggacacggcgccatgggtatggtggctaccacagcagtgcagcccatgacccaaacacacggggcagcagaaacaatggacaggcccacaagtgaccatgatgggctccagcccaccagccccagagaccatgaaacagatggccaaggtcaccctacaggtcatccagatctggctccaaggggtctgcatcgctgctgccctcccaacgccaaaccagatggagacagggccggccccatagcaccatctgctgccgtccacccagcagtcccggaagcccctccctgaacgctgggccacgtgtgtgaaccctgcgagccccccatgtcagagtaggggcagcaggagggcggggctggccctgtgcactgtcactgcccctgtggtccctggcctgcctggccctgacacctgagcctctcctgggtcatttccaagacattcccagggacagccggagctgggagtcgctcatcctgcctggctgtcctgagtcctgctcatttccagacctcaccagggaagccaacagaggactcacctcacacagtcagagacaacgaaccttccagaaatccctgtttctctccccagtgagagaaaccctcttccagggtttctcttctctcccaccctcttccaggacagtcctcagcagcatcacagcgggaacgcacatctggatcaggacggcccccagaacacgcgatggcccatggggacagcccagcccttcccagacccctaaaaggtatccccaccttgcacctgccccagggctcaaactccaggaggcctgactcctgcacaccctcctgccagatatcacctcagccccctcctggaggggacaggagcccgggagggtgagtcagacccacctgccctcaatggcaggcggggaagattcagaaaggcctgagatccccaggacgcagcaccactgtcaatgggggccccagacgcctggaccagggcctgtgtgggaaaggcctctggccacactcagggggattttgtgaagggccctcccactgtggaggttagccagcatctagactatgcccacagtgatgaaaccagcatcaaaaaccgaccggactcgcagggtttatgcacacttctcggctcggagctctccaggagcacaagagccaggcccgagggtttgtgcccagaccctcggcctctagggacacccgggccatcttagccgatgggctgatgccctgcacaccgtgtgctgccaaacaggggcttcagagggctctgaggtgacttcactcatgaccacaggtgccctggtcccttcactgccagctgcaccagaccctgttccgagagatgccccagttccaaaagccaattcctggggccgggaattactgtagacaccagcctcattccagtacctcctgccaattgcctggattcccatcctggctggaatcaagagggcagcatccgccaggctcccaacaggcaggactcccacacaccctcctctgagaggccgctgtgttccgcagggccaggccgcagacagttcccctcacctgcccatgtagaaacacctgccattgtcgtccccacctggcaaagaccacttgtggagcccccagccccaggtacagctgtagagagagtcctcgaggcccctaagaaggagccatgcccagttctgccgggaccctcggccaggccgacaggagtggacgctggagctgggcccacactgggccacataggagctcaccagtgagggcaggagagcacatgccggggagcacccagcctcctgctgaccagagacccgtcccagagcccaggaggctgcagaggcctctccagggggacacagtgcatgtctggtccctgagcagcccccaggctctctagcactgggggcccctggcacagctgtctggaccctccctgttccctgggaagctcctcctgacagccccgcctccagttccaggtgtggattttgtcagggggtgccacactgtgctgcataccctgctggacctgcaagtattcggcaacagtcggaaggatgctgtggttagctttggcaaagttttcctgccaccacagtggtgccgcccatatcaaaaaccaggccaagtagacagacccctgccacgcagccccaggcctccagctcacctgcttctcctggggctctcaaggctgctgtctgccctctggccctctgtggggagggttccctcagtgggaggtctgtgctccagggcagggatgactgagatagaaatcaaaggctggcagggaaaggcagcttcccgccctgagaggtgcaggcagcaccacagagccatggagtcacagagccacggagcccccagtgtgggcgtgtgagggtgctgggctcccggcaggcccagccctgatggggaagcctgccccgtcccacagcccaggtccccaggggcagcaggcacagaagctgccaagctgtgctctacgatcctcatccctccagcagcatccactccacagtggggaaactgagccttggagaaccacccagccccctggaaacaaggcggggagcccagacagtgggcccagagcactgtgtgtatcctggcactaggtgcagggaccacccggagatccccatcactgagtggccagcctgcagaaggacccaaccccaaccaggccgcttgattaagctccatccccctgtcctgggaacctcttcccagcgccaccaacagctcggcttcccaggccctcatccctccaaggaaggccaaaggctgggcctgccaggggcacagtaccctcccttgccctggctaagacagggtgggcagacggctgcagataggacatattgctggggcatcttgctctgtgactactg
ggtactggctctcaacgcagaccctaccaaaatccccactgcctcccctgctaggggctggcctggtctcctcctgctgtcctaggaggctgctgacctccaggatggcttctgtccccagttctagggccagagcagatcccaggcaggctgtaggctgggaggccacccctgtccttgccgaggttcagtgcaggcacccaggacaggaaatggcctgaacacagggatgactgtgccatgccctacctaagtccgcccctttctactctgcaacccccactccccaggtcagcccatgacgaccaacaacccaacaccagagtcactgcctggccctgccctggggaggacccctcagcccccaccctgtctagaggagttggggggacaggacacaggctctctccttatggttcccccacctggctcctgccgggacccttggggtgtggacagaaaggacgcctgcctaattggcccccaggaacccagaacttctctccagggaccccagcccgagcacccccttacccaggacccagccctgcccctcctcccctctgctctcctctcatcactccatgggaatccagaatccccaggaagccatcaggaagggctgaaggaggaagcggggccgctgcaccaccgggcaggaggctccgtcttcgtgaacccagggaagtgccagcctcctagagggtatggtccaccctgcctggggctcccaccgtggcaggctgcggggaaggaccagggacggtgtgggggagggctcagggccctgcaggtgctccatcttggatgagcccatccctctcacccaccgacccgcccacctcctctccaccctggccacacgtcgtccacaccatcctgagtcccacctacaccagagccagcagagccagtgcagacagaggctggggtgcaggggggccgccagggcagctttggggagggaggaatggaggaaggggaggtcagtgaagaggcccccctcccctgggtctaggatccacctttgggacccccggatcccatcccctccaggctctgggaggagaagcaggatgggagattctgtgcaggaccctctcacagtggaatacctccacagcggctcaggccagatacaaaagcccctcagtgagccctccactgcagtgcagggcctgggggcagcccctcccacagaggacagacccagcaccccgaagaagtcctgccagggggagctcagagccatgaaggagcaagatatggggaccccaatactggcacagacctcagctccatccaggcccaccaggacccaccatgggtggaacacctgtctccggcccctgctggctgtgaggcagctggcctctgtctcggacccccattccagacaccagacagagggacaggccccccagaaccagtgttgagggacacccctgtccagggcagccaagtccaagaggcgcgctgagcccagcaagggaaggcccccaaacaaaccaggaggtttctgaagctgtctgtgtcacagtcgggcatagccacggctaccacaatgacactgggcaggacagaaaccccatcccaagtcagccgaaggcagagagagcaggcaggacacatttaggatctgaggccacacctgacactcaagccaacagatgtctcccctccagggcgccctgccctgttcagtgttcctgagaaaacaggggcagcctgaggggatccagggccaggagatgggtcccctctaccccgaggaggagccaggcgggaatcccagccccctccccattgaggccatcctgcccagaggggcccggacccaccccacacacccaggcagaatgtgtgcaggcctcaggctctgtgggtgccgctagctggggctgccagtcctcaccccacacctaaggtgagccacagccgccagagcctccacaggagaccccacccagcagcccagcccctacccaggaggccccagagctcagggcgcctgggtggattttgtacagccccgagtcactgtgctgcataccctgctggacctgcaagtattcggcaaccacagtgagaaaagctatgtcaaaaaccgtctcccggccactgctggaggcccagccagagaagggaccagccgcccgaacatacgaccttcccagacctcatgacccccagcacttggagctccacagtgtccccattggatggtgaggatgggggccggggccatctgcacctcccaacatcacccccaggcagcacaggcacaaaccccaaatccagagccgacaccaggaacacagacaccccaataccctgggggaccctggccctggtgacttcccactgggatccacccccgtgtccacctggatcaaagaccccaccgctgtctctgtccctcactcagggcctgctgaggggcgggtgctttggagcagactcaggtttaggggccaccattgtggggcccaacctcgaccaggacacagatttttctttcctgccctggggcaacacagactttggggtctgtgcagggaggaccttctggaaagtcaccaagcacagagccctgactgaggtggtctcaggaagacccccaggagggggcttgtgccccttcctctcatgtggaccccatgccccccaagataggggcatcatgcagggcaggtcctccatgcagccaccactaggcaactccctggcgccggtccccactgcgcctccatcccggctctggggatgcagccaccatggccacaccaggcagcccgggtccagcaaccctgcagtgcccaagcccttggcaggattcccagaggctggagcccacccctcctcatccccccacacctgcacacacacacctaccccctgcccagtccccctccaggagggttggagccgcccatagggtgggggctccaggtctcactcactcgcttcccttcctgggcaaaggagcctcgtgccccggtc
ccccctgacggcgctgggcacaggtgtgggtactgggccccagggctcctccagccccagctgccctgctctccctgggaggcctgggcaccaccagaccaccagtccagggcacagccccagggagccgcccactgccagctcacaggaagaagataagcttcagaccctcagggccgggagctgccttcctgccaccccttcctgccccagacctccatgccctcccccaaccacttacacacaagccagggagctgtttccacacagttcaaccccaaaccaggacggcctggcactcgggtcactgccatttctgtctgcattcgctcccagcgcccctgtgttccctccctcctccctccttcctttcttcctgcattgggttcatgccgcagagtgccaggtgcaggtcagccctgagcttggggtcacctcctcactgaaggcagcctcagggtgcccaggggcaggcagggtgggggtgaggcttccagctccaaccgcttcgctaccttaggaccgttatagttaggcgcgccgtcgaccaattctcatgtttgacagcttatcatcgaatttctacgta
[0196]
毒素编码序列
[0197]
表4中阐述了用于构建如本文所述的经改造的dh区的毒素(例如μ-芋螺毒素和狼蛛毒素protxii)的示例性核苷酸编码序列(dna和氨基酸(aa))。
[0198]
表4
[0199]
[0200]
[0201]
[0202]
[0203]
[0204]
[0205][0206]
下文提供了用于构建经改造的dh区、包含毒素核苷酸编码序列的示例性dna片段。
[0207]
tx-dh1166(seq id no:232)包括在对应于dh1-1至dh6-6的位置中插入的毒素编码序列:
[0208]
tacgtagccgtttcgatcctcccgaattgactagtgggtaggcctggcggccgctgccatttcattacctctttctccgcacccgacatagataccggtggattcgaattctccccgttgaagctgacctgcccagaggggcctgggcccaccccacacaccggggcggaatgtgtacaggccccggtctctgtgggtgttccgctaactggggctcccagtgctcaccccacaactaaagcgagccccagcctccagagcccccgaaggagatgccgcccacaagcccagcccccatccaggaggccccagagctcagggcgccggggcggattttgtacagccccgagtcactgtggagagaagctgcaatggcagacgcggctgcagcagcagatggagccgcgatcatagcaggtgctgccacagtgagaaaaactgtgtcaaaaaccgtctcctggcccctgctggaggccgcgccagagaggggagcagccgccccgaacctaggtcctgctcagctcacacgacccccagcacccagagcacaacggagtccccattgaatggtgaggacggggaccagggctccagggggtcatggaaggggctggaccccatcctactgctatggtcccagtgctcctggccagaactgaccctaccaccgacaagagtccctcagggaaacgggggtcactggcacctcccagcatcaaccccaggcagcacaggcataaaccccacatccagagccgactccaggagcagagacaccccagtaccctgggggacaccgaccctgatgactccccactggaatccaccccagagtccaccaggaccaaagaccccgcccctgtctctgtccctcactcaggacctgctgcggggcgggccatgagaccagactcgggcttagggaacaccactgtggccccaacctcgaccaggccacaggcccttccttcctgccctgcggcagcacagactttggggtctgtgcagagaggaatcacagaggccccaggctgaggtggtgggggtggaagacccccaggaggtggccc
acttcccttcctcccagctggaacccaccatgaccttcttaagataggggtgtcatccgaggcaggtcctccatggagctcccttcaggctcctccccggtcctcactaggcctcagtcccggctgcgggaatgcagccaccacaggcacaccaggcagcccagacccagccagcctgcagtgcccaagcccacattctggagcagagcaggctgtgtctgggagagtctgggctccccaccgcccccccgcacaccccacccacccctgtccaggccctatgcaggagggtcagagccccccatggggtatggacttagggtctcactcacgtggctcccctcctgggtgaaggggtctcatgcccagatccccacagcagagctggtcaaaggtggaggcagtggccccagggccaccctgacctggaccctcaggctcctctagccctggctgccctgctgtccctgggaggcctggactccaccagaccacaggtccagggcaccgcccataggtgctgcccacactcagttcacaggaagaagataagctccagacccccaagactgggacctgccttcctgccaccgcttgtagctccagacctccgtgcctcccccgaccacttacacacgggccagggagctgttccacaaagatcaaccccaaaccgggaccgcctggcactcgggccgctgccacttccctctccatttgttcccagcacctctgtgctccctccctcctccctccttcaggggaacagcctgtgcagcccctccctgcaccccacaccctggggaggcccaaccctgcctccagccctttctcccccgctgctcttcctgcccatccagacaaccctggggtcccatccctgcagcctacaccctggtctccacccagacccctgtctctccctccagacacccctcccaggccaaccctgcacatgcaggccctccccttttctgctgccagagcctcagtttctaccctctgtgcctaccccctgcctcctcctgcccacaactcgagctcttcctctcctggggcccctgagccatggcactgaccgtgcactcccacccccacactgcccatgccctcaccttcctcctggacactctgaccccgctcccctcttggacccagccctggtatttccaggacaaaggctcacccaagtcttccccatgcaggcccttgccctcactgcccggttacacggcagcctcctgtgcacagaagcagggagctcagcccttccacaggcagaaggcactgaaagaaatcggcctccagcaccctgatgcacgtccgcctgtgtctctcactgcccgcacctgcagggaggctcggcactccctgtaaagacgagggatccaggcagcaacatcatgggagaatgcagggctcccagacagcccagccctctcgcaggcctctcctgggaagagacctgcagccaccactgaacagccacggagcccgctggatagtaactgagtcagtgaccgacctggagggcaggggagcagtgaaccggagcccagaccatagggacagagaccagccgctgacatcccgagcccctcactggcggccccagaacaccgcgtggaaacagaacagacccacattcccacctggaacagggcagacactgctgagcccccagcaccagccctgagaaacaccaggcaacggcatcagagggggctcctgagaaagaaaggaggggaggtctccttcaccagcaagtacttcccttgaccaaaaacagggtccacgcaactcccccaggacaaaggaggagccccctgtacagcactgggctcagagtcctctcccacacaccctgagtttcagacaaaaaccccctggaaatcatagtatcagcaggagaactagccagagacagcaagaggggactcagtgactcccgcggggacaggaggattttgtgggggctcgtgtcactgtgaggatattgtagcagcagatggtgctatacccacagtgacacagccccattcaaaaacccctgctgtaaacgcttccacttctggagctgaggggctggggggagcgtctgggaagtagggcctaggggtggccatcaatgcccaaaacgcaccagactcccccccagacatcaccccactggccagtgagcagagtaaacagaaaatgagaagcagctgggaagcttgcacaggccccaaggaaagagctttggcgggtgtgcaagaggggatgcgggcagagcctgagcagggccttttgctgtttctgctttcctgtgcagatagttccataaactggtgttcaagatcgatggctgggagtgagcccaggaggacagtgtgggaagggcacagggaaggagaagcagccgctatcctacactgtcatctttcaagagtttgccctgtgcccacaatgctgcatcatgggatgcttaacagctgatgtagacacagctaaagagagaatcagtgaaatggatttgcagcacagatctgaataaattctccagaatgtggagccacacagaagcaagcacaaggaaagtgcctgatgcaagggcaaagtacagtgtgtaccttcaggctgggcacagacactctgaaaagccttggcaggaactccctgcaacaaagcagagccctgcaggcaatgccagctccagagccctccctgagagcctcatgggcaaagatgtgcacaacaggtgtttctcatagccccaaactgagaatgaagcaaacagccatctgaaggaaaacaggcaaataaacgatggcaggttcatgaaatgcaaacccagacagccagaaggacaacagtgagggttacaggtgactctgtggttgagttcatgacaatgctgagtaattggagtaacaaaggaaagtccaaaaaatactttcaatgtgatttcttctaaataaaatttacagccggcaaaatgaactatcttcttaagggataaac
tttccactaggaaaactataaggaaaatcaagaaaaggatgatcacataaacacagtggtcgttacttctactggggaaggaagagggtatgaactgagacacacagggttggcaagtctcctaacaagaacagaacaaatacattacagtaccttgaaaacagcagttaaaattctaaattgcaagaagaggaaaatgcacacagctgtgtttagaaaattctcagtccagcactgttcataatagcaaagacattaacccaggttggataaataaacgatgacacaggcaattgcacaatgatacagacatacattcagtatatgagacattgatgatgtatccccaaagaaatgactttaaagagaaaaggcctgatatgtggtggcactcacctccctgggcatccccggacaggctgcaggcacactgtgtggcagggcaggctggtacctgctggcagctcctggggcctgatgtggagcaggcacagagccgtatccccccgaggacatatacccccaaggacggcacagttggtacattccggagacaagcaactcagccacactcccaggccagagcccgagagggacgcccatgcacagggaggcagagcccagctcctccacagccagcagcacccgtgcaggggccgccatctggcaggcacagagcatgggctgggaggaggggcagggacaccaggcagggttggcaccaactgaaaattacagaagtctcatacatctacctcagccttgcctgacctgggcctcacctgacctggacctcacctggcctggacctcacctggcctagacctcacctctgggcttcacctgagctcggcctcacctgacttggaccttgcctgtcctgagctcacatgatctgggcctcacctgacctgggtttcacctgacctgggcttcacctgacctgggcctcatctgacctgggcctcactggcctggacctcacctggcctgggcttcacctggcctcaggcctcatctgcacctgctccaggtcttgctggaacctcagtagcactgaggctgcaggggctcatccagggttgcagaatgactctagaacctcccacatctcagctttctgggtggaggcacctggtggcccagggaatataaaaagcctgaatgatgcctgcgtgatttgggggcaatttataaacccaaaaggacatggccatgcagcgggtagggacaatacagacagatatcagcctgaaatggagcctcagggcacaggtgggcacggacactgtccacctaagccaggggcagacccgagtgtccccgcagtagacctgagagcgctgggcccacagcctcccctcggtgccctgctacctcctcaggtcagccctggacatcccgggtttccccaggcctggcggtaggattttgttgaggtctgtgtcactgtggtattacgattgcaactgcagcagatggcgcgaccatagcaggtgctgctattatacccacagtgtcacagagtccatcaaaaacccatccctgggaaccttctgccacagccctccctgtggggcaccgccgcgtgccatgttaggattttgactgaggacacagcaccatgggtatggtggctaccgcagcagtgcagcccgtgacccaaacacacagggcagcaggcacaacagacaagcccacaagtgaccaccctgagctcctgcctgccagccctggagaccatgaaacagatggccaggattatcccataggtcagccagacctcagtccaacaggtctgcatcgctgctgccctccaataccagtccggatggggacagggctggcccacattaccatttgctgccatccggccaacagtcccagaagcccctccctcaaggctgggccacatgtgtggaccctgagagccccccatgtctgagtaggggcaccaggaaggtggggctggccctgtgcactgtccctgcccctgtggtccctggcctgcctggccctgacacctgggcctctcctgggtcatttccaagacagaagacattcccaggacagctggagctgggagtccatcatcctgcctggccgtcctgagtcctgcgcctttccaaacctcacccgggaagccaacagaggaatcacctcccacaggcagagacaaagaccttccagaaatctctgtctctctccccagtgggcaccctcttccagggcagtcctcagtgatatcacagtgggaacccacatctggatcgggactgcccccagaacacaagatggcccacagggacagccccacagcccagcccttcccagacccctaaaaggcgtcccaccccctgcatctgccccagggctcaaactccaggaggactgactcctgcacaccctcctgccagacatcacctcagcccctcctggaagggacaggagcgcgcaagggtgagtcagaccctcctgccctcgatggcaggcggagaagattcagaaaggtctgagatccccaggacgcagcaccactgtcaatgggggccccagacgcctggaccagggcctgcgtgggaaaggcctctgggcacactcagggggattttgtgaagggtcctcccactgtggagaggcttagctgtggcttccctaagagctgccgcagcaggcaaagcaagcctcacagatgctgccacagtgatgaacccagcatcaaaaaccgaccggactcccaaggtttatgcacacttctccgctcagagctctccaggatcagaagagccgggcccaagggtttctgcccagaccctcggcctctagggacatcttggccatgacagcccatgggctggtgccccacacatcgtctgccttcaaacaagggcttcagagggctctgaggtgacctcactgatgaccacaggtgccctggccccttccccaccagctgcaccagaccccgtcatgacagatgccccgattccaacagccaattcc
tggggccaggaatcgctgtagacaccagcctccttccaacacctcctgccaattgcctggattcccatcccggttggaatcaagaggacagcatcccccaggctcccaacaggcaggactcccacaccctcctctgagaggccgctgtgttccgtagggccaggctgcagacagtccccctcacctgccactagacaaatgcctgctgtagatgtccccacctggaaaataccactcatggagcccccagccccaggtacagctgtagagagagtctctgaggcccctaagaagtagccatgcccagttctgccgggaccctcggccaggctgacaggagtggacgctggagctgggcccatactgggccacataggagctcaccagtgagggcaggagagcacatgccggggagcacccagcctcctgctgaccagaggcccgtcccagagcccaggaggctgcagaggcctctccagggggacactgtgcatgtctggtccctgagcagccccccacgtccccagtcctgggggcccctggcacagctgtctggaccctctctattccctgggaagctcctcctgacagccccgcctccagttccaggtgtggattttgtcagggggtgtcacactgtgtacagccagaagtggatgtggacttgcgatagtgagaggaagtgcagtgagggtatggtatgccggctgtggtgtaagaagaagctctggcacagtggtgctgcccatatcaaaaaccaggccaagtagacaggcccctgctgtgcagccccaggcctccagctcacctgcttctcctggggctctcaaggctgctgttttctgcactctcccctctgtggggagggttccctcagtgggagatctgttctcaacatcccacggcctcattcctgcaaggaaggccaatggatgggcaacctcacatgccgcggctaagatagggtgggcagcctggcggggacaggacatcctgctggggtatctgtcactgtgcctagtggggcactggctcccaaacaacgcagtccttgccaaaatccccacggcctcccccgctaggggctggcctgatctcctgcagtcctaggaggctgctgacctccagaatggctccgtccccagttccagggcgagagcagatcccaggccggctgcagactgggaggccaccccctccttcccagggttcactgcaggtgaccagggcaggaaatggcctgaacacagggataaccgggccatcccccaacagagtccaccccctcctgctctgtaccccgcaccccccaggccagcccatgacatccgacaaccccacaccagagtcactgcccggtgctgccctagggaggacccctcagcccccaccctgtctagaggactggggaggacaggacacgccctctccttatggttcccccacctggctctggctgggacccttggggtgtggacagaaaggacgcttgcctgattggcccccaggagcccagaacttctctccagggaccccagcccgagcacccccttacccaggacccagccctgcccctcctcccctctgctctcctctcatcaccccatgggaatccagaatccccaggaagccatcaggaagggctgagggaggaagtggggccactgcaccaccaggcaggaggctctgtctttgtgaacccagggaggtgccagcctcctagagggtatggtccaccctgcctatggctcccacagtggcaggctgcagggaaggaccagggacggtgtgggggagggctcagggccccgcgggtgctccatcttggatgagcctatctctctcacccacggactcgcccacctcctcttcaccctggccacacgtcgtccacaccatcctaagtcccacctacaccagagccggcacagccagtgcagacagaggctggggtgcaggggggccgactgggcagcttcggggagggaggaatggaggaaggggagttcagtgaagaggcccccctcccctgggtccaggatcctcctctgggacccccggatcccatcccctccaggctctgggaggagaagcaggatgggagaatctgtgcgggaccctctcacagtggaatacctccacagcggctcaggccagatacaaaagcccctcagtgagccctccactgcagtgctgggcctgggggcagccgctcccacacaggatgaacccagcaccccgaggatgtcctgccagggggagctcagagccatgaaggagcaggatatgggacccccgatacaggcacagacctcagctccattcaggactgccacgtcctgccctgggaggaacccctttctctagtccctgcaggccaggaggcagctgactcctgacttggacgcctattccagacaccagacagaggggcaggccccccagaaccagggatgaggacgccccgtcaaggccagaaaagaccaagttgcgctgagcccagcaagggaaggtccccaaacaaaccaggaggattttgtaggtgtctgtgtcactgtgagctgcaactgcagcagcaaatggagccgcgaccatagcaggtgctgccacagtgacactcgccaggtcaaaaaccccatcccaagtcagcggaatgcagagagagcagggaggacatgtttaggatctgaggccgcacctgacacccaggccagcagacgtctcctgtccacggcaccctgccatgtcctgcatttctggaagaacaagggcaggctgaagggggtccaggaccaggagatgggtccgctctacccagagaaggagccaggcaggacacaagcccccacgcgtgggctcgtagtttgacgtgcgtgaagtgtgggtaagaaagtacgta
[0209]
tx-dh17613(seq id no:233)包括在对应于dh1-7至dh6-13的位置中插入的毒素编
码序列:
[0210]
gcggccgctgccatttcattacctctttctccgcacccgacatagattacgtaacgcgtgggctcgtagtttgacgtgcgtgaagtgtgggtaagaaagtccccattgaggctgacctgcccagagggtcctgggcccacccaacacaccggggcggaatgtgtgcaggcctcggtctctgtgggtgttccgctagctggggctcacagtgctcaccccacacctaaaacgagccacagcctccggagcccctgaaggagaccccgcccacaagcccagcccccacccaggaggccccagagcacagggcgccccgtcggattttgtacagccccgagtcactgtggagagatgcaatggcagacgcggctgcagcagatggcgcgatcatagcaggtgctgccacagtgagaaaagcttcgtcaaaaaccgtctcctggccacagtcggaggccccgccagagaggggagcagccaccccaaacccatgttctgccggctcccatgaccccgtgcacctggagccccacggtgtccccactggatgggaggacaagggccgggggctccggcgggtcggggcaggggcttgatggcttccttctgccgtggccccattgcccctggctggagttgacccttctgacaagtgtcctcagagagtcagggatcagtggcacctcccaacatcaaccccacgcagcccaggcacaaaccccacatccagggccaactccaggaacagagacaccccaataccctgggggaccccgaccctgatgactcccgtcccatctctgtccctcacttggggcctgctgcggggcgagcacttgggagcaaactcaggcttaggggacaccactgtgggcctgacctcgagcaggccacagacccttccctcctgccctggtgcagcacagactttggggtctgggcagggaggaacttctggcaggtcaccaagcacagagcccccaggctgaggtggccccagggggaaccccagcaggtggcccactacccttcctcccagctggaccccatgtcttccccaagataggggtgccatccaaggcaggtcctccatggagcccccttcaggctcctctccagaccccactgggcctcagtccccactctaggaatgcagccaccacgggcacaccaggcagcccaggcccagccaccctgcagtgcccaagcccacaccctggaggagagcagggtgcgtctgggaggggctgggctccccacccccacccccacctgcacaccccacccacccttgcccgggccccctgcaggagggtcagagcccccatgggatatggacttagggtctcactcacgcacctcccctcctgggagaaggggtctcatgcccagatccccccagcagcgctggtcacaggtagaggcagtggccccagggccaccctgacctggcccctcaggctcctctagccctggctgccctgctgtccctgggaggcctgggctccaccagaccacaggtctagggcaccgcccacactggggccgcccacacacagctcacaggaagaagataagctccagacccccaggcccgggacctgccttgctgctacgacttcctgccccagacctcgttgccctcccccgtccacttacacacaggccaggaagctgttcccacacagaccaaccccagacggggaccacctggcactcaggtcactgccatttccttctccattcacttccaatgcctctgtgcttcctccctcctccttccttcgggggagcaccctgtgcagctcctccctgcagtccacaccctggggagacccgaccctgcagcccacaccctggggagacctgaccctcctccagccctttctcccccgctgctcttgccacccaccaagacagccctggggtcctgtccctacagcccccacccagttctctacctagacccgtcttcctccctctaaacacctctcccaggccaaccctacacctgcaggccctcccctccactgccaaagaccctcagtttctcctgcctgtgcccacccccgtgctcctcctgcccacagctcgagctcttcctctcctagggcccctgagggatggcattgaccgtgccctcgcacccacacactgcccatgccctcacattcctcctggccactccagccccactcccctctcaggcctggctctggtatttctgggacaaagccttacccaagtctttcccatgcaggcctgggcccttaccctcactgcccggttacagggcagcctcctgtgcacagaagcagggagctcagcccttccacaggcagaaggcactgaaagaaatcggcctccagcgccttgacacacgtctgcctgtgtctctcactgcccgcacctgcagggaggctcggcactccctctaaagacgagggatccaggcagcagcatcacaggagaatgcagggctaccagacatcccagtcctctcacaggcctctcctgggaagagacctgaagacgcccagtcaacggagtctaacaccaaacctccctggaggccgatgggtagtaacggagtcattgccagacctggaggcaggggagcagtgagcccgagcccacaccatagggccagaggacagccactgacatcccaagccactcactggtggtcccacaacaccccatggaaagaggacagacccacagtcccacctggaccagggcagagactgctgagacccagcaccagaaccaaccaagaaacaccaggcaacagcatcagagggggctctggcagaacagaggaggggaggtctccttcaccagcaggcgcttcccttgaccgaagacaggatccatgcaactcccccaggacaaaggaggagccccttgttcagcactgg
gctcagagtcctctccaagacacccagagtttcagacaaaaaccccctggaatgcacagtctcagcaggagagccagccagagccagcaagatggggctcagtgacacccgcagggacaggaggattttgtgggggctcgtgtcactgtgaggatattgtactaatcggagcaggcagggtgtatgctatacccacagtgacacagccccattcaaaaacccctactgcaaacgcattccacttctggggctgaggggctgggggagcgtctgggaaatagggctcaggggtgtccatcaatgcccaaaacgcaccagactcccctccatacatcacacccaccagccagcgagcagagtaaacagaaaatgagaagcaagctggggaagcttgcacaggccccaaggaaagagctttggcgggtgtgtaagaggggatgcgggcagagcctgagcagggccttttgctgtttctgctttcctgtgcagagagttccataaactggtgttcgagatcaatggctgggagtgagcccaggaggacagcgtgggaagagcacagggaaggaggagcagccgctatcctacactgtcatctttcgaaagtttgccttgtgcccacactgctgcatcatgggatgcttaacagctgatgtagacacagctaaagagagaatcagtgagatggatttgcagcacagatctgaataaattctccagaatgtggagcagcacagaagcaagcacacagaaagtgcctgatgcaaggacaaagttcagtgggcaccttcaggcattgctgctgggcacagacactctgaaaagccctggcaggaactccctgtgacaaagcagaaccctcaggcaatgccagccccagagccctccctgagagcctcatgggcaaagatgtgcacaacaggtgtttctcatagccccaaactgagagcaaagcaaacgtccatctgaaggagaacaggcaaataaacgatggcaggttcatgaaatgcaaacccagacagccacaagcacaaaagtacagggttataagcgactctggttgagttcatgacaatgctgagtaattggagtaacaaagtaaactccaaaaaatactttcaatgtgatttcttctaaataaaatttacaccctgcaaaatgaactgtcttcttaagggatacatttcccagttagaaaaccataaagaaaaccaagaaaaggatgatcacataaacacagtggtggttacttctgctggggaaggaagagggtatgaactgagatacacagggtgggcaagtctcctaacaagaacagaacgaatacattacagtaccttgaaaacagcagttaaacttctaaattgcaagaagaggaaaatgcacacagttgtgtttagaaaattctcagtccagcactgttcataatagcaaagacattaacccaggtcggataaataagcgatgacacaggcaattgcacaatgatacagacatatatttagtatatgagacatcgatgatgtatccccaaataaacgactttaaagagataaagggctgatgtgtggtggcattcacctccctgggatccccggacaggttgcaggctcactgtgcagcagggcaggcgggtacctgctggcagttcctggggcctgatgtggagcaagcgcagggccatatatcccggaggacggcacagtcagtgaattccagagagaagcaactcagccacactccccaggcagagcccgagagggacgcccacgcacagggaggcagagcccagcacctccgcagccagcaccacctgcgcacgggccaccaccttgcaggcacagagtgggtgctgagaggaggggcagggacaccaggcagggtgagcacccagagaaaactgcagacgcctcacacatccacctcagcctcccctgacctggacctcactggcctgggcctcacttaacctgggcttcacctgaccttggcctcacctgacttggacctcgcctgtcccaagctttacctgacctgggcctcaactcacctgaacgtctcctgacctgggtttaacctgtcctggaactcacctggccttggcttcccctgacctggacctcatctggcctgggcttcacctggcctgggcctcacctgacctggacctcatctggcctggacctcacctggcctggacttcacctggcctgggcttcacctgacctggacctcacctggcctcgggcctcacctgcacctgctccaggtcttgctggagcctgagtagcactgagggtgcagaagctcatccagggttggggaatgactctagaagtctcccacatctgacctttctgggtggaggcagctggtggccctgggaatataaaaatctccagaatgatgactctgtgatttgtgggcaacttatgaacccgaaaggacatggccatggggtgggtagggacatagggacagatgccagcctgaggtggagcctcaggacacaggtgggcacggacactatccacataagcgagggatagacccgagtgtccccacagcagacctgagagcgctgggcccacagcctcccctcagagccctgctgcctcctccggtcagccctggacatcccaggtttccccaggcctggcggtaggattttgttgaggtctgtgtcactgtggtattacgattgcaactgcagcagatgggctcgcgaccatagcaggtgctgctattataaccacagtgtcacagagtccatcaaaaacccatgcctggaagcttcccgccacagccctccccatggggccctgctgcctcctcaggtcagccccggacatcccgggtttccccaggctgggcggtaggattttgttgaggtctgtgtcactgtggtattactatgagagatgcaatggcagacgcggctgcagcagatggcgcgatcatagcaggtgctgctattataaccacagtgtcacagagtccatc
aaaaacccatccctgggagcctcccgccacagccctccctgcaggggaccggtacgtgccatgttaggattttgatcgaggagacagcaccatgggtatggtggctaccacagcagtgcagcctgtgacccaaacccgcagggcagcaggcacgatggacaggcccgtgactgaccacgctgggctccagcctgccagccctggagatcatgaaacagatggccaaggtcaccctacaggtcatccagatctggctccgaggggtctgcatcgctgctgccctcccaacgccagtccaaatgggacagggacggcctcacagcaccatctgctgccatcaggccagcgatcccagaagcccctccctcaaggctgggcacatgtgtggacactgagagccctcatatctgagtaggggcaccaggagggaggggctggccctgtgcactgtccctgcccctgtggtccctggcctgcctggccctgacacctgagcctctcctgggtcatttccaagacagaagacattcctggggacagccggagctgggcgtcgctcatcctgcccggccgtcctgagtcctgctcatttccagacctcaccggggaagccaacagaggactcgcctcccacattcagagacaaagaaccttccagaaatccctgcctctctccccagtggacaccctcttccaggacagtcctcagtggcatcacagcggcctgagatccccaggacgcagcaccgctgtcaataggggccccaaatgcctggaccagggcctgcgtgggaaaggcctctggccacactcggggattttgtgaagggccctcccactgtggagaggctttgtggcttccctaagagctgcagcaggcaaaagcctcacagatgctgccacagtgatgaacccagtgtcaaaaaccggctggaaacccaggggctgtgtgcacgcctcagcttggagctctccaggagcacaagagccgggcccaaggatttgtgcccagaccctcagcctctagggacacctgggtcatctcagcctgggctggtgccctgcacaccatcttcctccaaataggggcttcagagggctctgaggtgacctcactcatgaccacaggtgacctggcccttccctgccagctataccagaccctgtcttgacagatgccccgattccaacagccaattcctgggaccctgaatagctgtagacaccagcctcattccagtacctcctgccaattgcctggattcccatcctggctggaatcaagaaggcagcatccgccaggctcccaacaggcaggactcccgcacaccctcctctgagaggccgctgtgttccgcagggccaggccctggacagttcccctcacctgccactagagaaacacctgccattgtcgtccccacctggaaaagaccactcgtggagcccccagccccaggtacagctgtagagacagtcctcgaggcccctaagaaggagccatgcccagttctgccgggaccctcggccaggccgacaggagtggacgctggagctgggcccacactgggccacataggagctcaccagtgagggcaggagagcacatgccggggagcacccagcctcctgctgaccagaggcccgtcccagagcccaggaggctgcagaggcctctccagggagacactgtgcatgtctggtacctaagcagccccccacgtccccagtcctgggggcccctggctcagctgtctgggccctccctgctccctgggaagctcctcctgacagccccgcctccagttccaggtgtggattttgtcaggcgatgtcacactgtgtactgccagaagtggatgtggactagcgatagtgagaggaagtgctgtgagggtatggtaagccggctgtggtgtaagaagaagctctggcacagtggtgccgcccatatcaaaaaccaggccaagtagacaggcccctgctgcgcagccccaggcatccacttcacctgcttctcctggggctctcaaggctgctgtctgtcctctggccctctgtggggagggttccctcagtgggaggtctgtgctccagggcagggatgattgagatagaaatcaaaggctggcagggaaaggcagcttcccgccctgagaggtgcaggcagcaccacggagccacggagtcacagagccacggagcccccattgtgggcatttgagagtgctgtgcccccggcaggcccagccctgatggggaagcctgtcccatcccacagcccgggtcccacgggcagcgggcacagaagctgccaggttgtcctctatgatcctcatccctccagcagcatcccctccacagtggggaaactgaggcttggagcaccacccggccccctggaaatgaggctgtgagcccagacagtgggcccagagcactgtgagtaccccggcagtacctggctgcagggatcagccagagatgccaaaccctgagtgaccagcctacaggaggatccggccccacccaggccactcgattaatgctcaaccccctgccctggagacctcttccagtaccaccagcagctcagcttctcagggcctcatccctgcaaggaaggtcaagggctgggcctgccagaaacacagcaccctccctagccctggctaagacagggtgggcagacggctgtggacgggacatattgctggggcatttctcactgtcacttctgggtggtagctctgacaaaaacgcagaccctgccaaaatccccactgcctcccgctaggggctggcctggaatcctgctgtcctaggaggctgctgacctccaggatggctccgtccccagttccagggcgagagcagatcccaggcaggctgtaggctgggaggccacccctgcccttgccggggttgaatgcaggtgcccaaggcaggaaatggcatgagcacagggatgaccgggacatgccccaccagagtgcgcccctt
cctgctctgcaccctgcaccccccaggccagcccacgacgtccaacaactgggcctgggtggcagccccacccagacaggacagacccagcaccctgaggaggtcctgccagggggagctaagagccatgaaggagcaagatatggggcccccgatacaggcacagatgtcagctccatccaggaccacccagcccacaccctgagaggaacgtctgtctccagcctctgcaggtcgggaggcagctgacccctgacttggacccctattccagacaccagacagaggcgcaggccccccagaaccagggttgagggacgccccgtcaaagccagacaaaaccaaggggtgttgagcccagcaagggaaggcccccaaacagaccaggaggattttgtaggtgtctgtgtcactgtgtgcaactgcagcagatggcgcgaccatagcaggtgctgccacagtgacactcacccagtcaaaaaccccattccaagtcagcggaagcagagagagcagggaggacacgtttaggatctgagactgcacctgacacccaggccagcagacgtctcccctccagggcaccccaccctgtcctgcatttctgcaagatcaggggcggcctgagggggggtctagggtgaggagatgggtcccctgtacaccaaggaggagttaggcaggtcccgagcactcttaattaaacgacgcctcgaatggaactactacaacgaatggttgctctacgtaatgcattcgctaccttaggaccgttatagttaggcgcgcc
[0211]
tx-dh114619(seq id no:234)包括在对应于dh1-14至dh6-19的位置中插入的毒素编码序列:
[0212]
tacgtattaattaaacgacgcctcgaatggaactactacaacgaatggttgctctccccattgaggctgacctgcccagagagtcctgggcccaccccacacaccggggcggaatgtgtgcaggcctcggtctctgtgggtgttccgctagctggggctcacagtgctcaccccacacctaaaatgagccacagcctccggagcccccgcaggagaccccgcccacaagcccagcccccacccaggaggccccagagctcagggcgccccgtcggattttgtacagccccgagtcactgtggagagatgctgcaatggcagacgcggctgcagcagcagatggtgccgcgatcatagcaggtgctgccacagtgagaatagctacgtcaaaaaccgtccagtggccactgccggaggccccgccagagagggcagcagccactctgatcccatgtcctgccggctcccatgacccccagcacgcggagccccacagtgtccccactggatgggaggacaagagctggggattccggcgggtcggggcaggggcttgatcgcatccttctgccgtggctccagtgcccctggctggagttgacccttctgacaagtgtcctcagagagacaggcatcaccggcgcctcccaacatcaaccccaggcagcacaggcacaaaccccacatccagagccaactccaggagcagagacaccccaataccctgggggaccccgaccctgatgacttcccactggaattcgccgtagagtccaccaggaccaaagaccctgcctctgcctctgtccctcactcaggacctgctgccgggcgaggccttgggagcagacttgggcttaggggacaccagtgtgaccccgaccttgaccaggacgcagacctttccttcctttcctggggcagcacagactttggggtctgggccaggaggaacttctggcaggtcgccaagcacagaggccacaggctgaggtggccctggaaagacctccaggaggtggccactccccttcctcccagctggaccccatgtcctccccaagataagggtgccatccaaggcaggtgctccttggagccccattcagactcctccctggaccccactgggcctcagtcccagctctggggatgaagccaccacaagcacaccaggcagcccaggcccagccaccctgcagtgcccaagcacacactctggagcagagcagggtgcctctgggaggggctgagctccccaccccacccccacctgcacaccccacccacccctgcccagcggctctgcaggagggtcagagccccacatggggtatggacttagggtctcactcacgtggctcccatcatgagtgaaggggcctcaagcccaggttcccacagcagcgcctgtcgcaagtggaggcagaggcccgagggccaccctgacctggtccctgaggttcctgcagcccaggctgccctgctgtccctgggaggcctgggctccaccagaccacaggtccagggcaccgggtgcaggagccacccacacacagctcacaggaagaagataagctccagacccccagggccagaacctgccttcctgctactgcttcctgccccagacctgggcgccctcccccgtccacttacacacaggccaggaagctgttcccacacagaacaaccccaaaccaggaccgcctggcactcaggtggctgccatttccttctccatttgctcccagcgcctctgtcctccctggttcctccttcgggggaacagcctgtgcagccagtccctgcagcccacaccctggggagacccaaccctgcctggggcccttccaaccctgctgctcttactgcccacccagaaaactctggggtcctgtccctgcagtccctaccctggtctccacccagacccctgtgtatcactccagacacccctcccaggcaaaccctgcacctgcaggccctgtcct
cttctgtcgctagagcctcagtttctcccccctgtgcccacaccctacctcctcctgcccacaactctaactcttcttctcctggagcccctgagccatggcattgaccctgccctcccaccacccacagcccatgccctcaccttcctcctggccactccgaccccgccccctctcaggccaagccctggtatttccaggacaaaggctcacccaagtctttcccaggcaggcctgggctcttgccctcacttcccggttacacgggagcctcctgtgcacagaagcagggagctcagcccttccacaggcagaaggcactgaaagaaatcggcctccagcaccttgacacacgtccgcccgtgtctctcactgcccgcacctgcagggaggctccgcactccctctaaagacaagggatccaggcagcagcatcacgggagaatgcagggctcccagacatcccagtcctctcacaggcctctcctgggaagagacctgcagccaccaccaaacagccacagaggctgctggatagtaactgagtcaatgaccgacctggagggcaggggagcagtgagccggagcccataccatagggacagagaccagccgctgacatcccgagctcctcaatggtggccccataacacacctaggaaacataacacacccacagccccacctggaacagggcagagactgctgagcccccagcaccagccccaagaaacaccaggcaacagtatcagagggggctcccgagaaagagaggaggggagatctccttcaccatcaaatgcttcccttgaccaaaaacagggtccacgcaactcccccaggacaaaggaggagccccctatacagcactgggctcagagtcctctctgagacaccctgagtttcagacaacaacccgctggaatgcacagtctcagcaggagaacagaccaaagccagcaaaagggacctcggtgacaccagtagggacaggaggattttgtgggggctcgtgtcactgtgaggatattgtagtggtagcagcagatggggtagctgctactcccacagtgacacagacccattcaaaaacccctactgcaaacacacccactcctggggctgaggggctgggggagcgtctgggaagtagggtccaggggtgtctatcaatgtccaaaatgcaccagactccccgccaaacaccaccccaccagccagcgagcagggtaaacagaaaatgagaggctctgggaagcttgcacaggccccaaggaaagagctttggcgggtgtgcaagaggggatgcaggcagagcctgagcagggccttttgctgtttctgctttcctgtgcagagagttccataaactggtgttcaagatcagtggctgggaatgagcccaggagggcagtctgtgggaagagcacagggaaggaggagcagccgctatcctacactgtcatctttcaaaagtttgccttgtgaccacactattgcatcatgggatgcttaagagctgatgtagacacagctaaagagagaatcagtgagatgaatttgcagcatagatctgaataaactctccagaatgtggagcagtacagaagcaaacacacagaaagtgcctgatgcaaggacaaagttcagtgggcaccttcaggcattgctgctgggcacagacactctgaaaagccttggcaggatctccctgcgacaaagcagaaccctcaggcaatgccagccccagagccctccctgagagcgtcatggggaaagatgtgcagaacagctgattatcatagactcaaactgagaacagagcaaacgtccatctgaagaacagtcaaataagcaatggtaggttcatgcaatgcaaacccagacagccaggggacaacagtagagggctacaggcggctttgcggttgagttcatgacaatgctgagtaattggagtaacagaggaaagcccaaaaaatacttttaatgtgatttcttctaaataaaatttacaccaggcaaaatgaactgtcttcttaagggataaactttcccctggaaaaactacaaggaaaattaagaaaacgatgatcacataaacacagttgtggttacttctactggggaaggaagagggtatgagctgagacacacagagtcggcaagtctccaagcaagcacagaacgaatacattacagtaccttgaatacagcagttaaacttctaaatcgcaagaacaggaaaatgcacacagctgtgtttagaaaattctcagtccagcactattcataatagcaaagacattaacccaggttggataaataaatgatgacacaggcaattgcacaatgatacagacatacatttagtacatgagacatcgatgatgtatccccaaagaaatgactttaaagagaaaaggcctgatgtgtggtggcactcacctccctgggatccccggacaggttgcaggcacactgtgtggcagggcaggctggtacatgctggcagctcctggggcctgatgtggagcaagcgcagggctgtatacccccaaggatggcacagtcagtgaattccagagagaagcagctcagccacactgcccaggcagagcccgagagggacgcccacgtacagggaggcagagcccagctcctccacagccaccaccacctgtgcacgggccaccaccttgcaggcacagagtgggtgctgagaggaggggcagggacaccaggcagggtgagcacccagagaaaactgcagaagcctcacacatccacctcagcctcccctgacctggacctcacctggtctggacctcacctggcctgggcctcacctgacctggacctcacctggcctgggcttcacctgacctggacctcacctggcctccggcctcacctgcacctgctccaggtcttgctggaacctgagtagcactgaggctgcagaagctcatccagggttggggaatgactctggaactctcc
cacatctgacctttctgggtggaggcatctggtggccctgggaatataaaaagccccagaatggtgcctgcgtgatttgggggcaatttatgaacccgaaaggacatggccatggggtgggtagggacatagggacagatgccagcctgaggtggagcctcaggacacagttggacgcggacactatccacataagcgagggacagacccgagtgttcctgcagtagacctgagagcgctgggcccacagcctcccctcggtgccctgctgcctcctcaggtcagccctggacatcccgggtttccccaggccagatggtaggattttgttgaggtctgtgtcactgtggtattatgattacgagagagcttgcaatggcagacgcggctgcagcagatgggctcgcgatcatagcaggtgctgctatcgttatacccacagtgtcacacggtccatcaaaaacccatgccacagccctccccgcaggggaccgccgcgtgccatgttacgattttgatcgaggacacagcgccatgggtatggtggctaccacagcagtgcagcccatgacccaaacacacagggcagcaggcacaatggacaggcctgtgagtgaccatgctgggctccagcccgccagccccggagaccatgaaacagatggccaaggtcaccccacagttcagccagacatggctccgtggggtctgcatcgctgctgccctctaacaccagcccagatggggacaaggccaaccccacattaccatctcctgctgtccacccagtggtcccagaagcccctccctcatggctgagccacatgtgtgaaccctgagagcaccccatgtcagagtaggggcagcagaagggcggggctggccctgtgcactgtccctgcacccatggtccctcgcctgcctggccctgacacctgagcctcttctgagtcatttctaagatagaagacattcccggggacagccggagctgggcgtcgctcatcccgcccggccgtcctgagtcctgcttgtttccagacctcaccagggaagccaacagaggactcacctcacacagtcagagacaaagaaccttccagaaatccctgtctcactccccagtgggcaccttcttccaggacattcctcggtcgcatcacagcaggcacccacatctggatcaggacggcccccagaacacaagatggcccatggggacagccccacaacccaggccttcccagacccctaaaaggcgtcccaccccctgcacctgccccagggctaaaaatccaggaggcttgactcccgcataccctccagccagacatcacctcagccccctcctggaggggacaggagcccgggagggtgagtcagacccacctgccctcgatggcaggcggggaagattcagaaaggcctgagatccccaggacgcagcaccactgtcaatgggggccccagacgcctggaccagggcctgcgtgggaaaggccgctgggcacactcagggggattttgtgaaggcccctcccactgtggagaggcttgcttgtggcttccctaagagctgcagcaggcaagctaagcctcacagatgctgccacagtgatgaaactagcatcaaaaaccggccggacacccagggaccatgcacacttctcagcttggagctctccaggaccagaagagtcaggtctgagggtttgtagccagaccctcggcctctagggacaccctggccatcacagcggatgggctggtgccccacatgccatctgctccaaacaggggcttcagagggctctgaggtgacttcactcatgaccacaggtgccctggccccttccccgccagctacaccgaaccctgtcccaacagctgccccagttccaacagccaattcctggggcccagaattgctgtagacaccagcctcgttccagcacctcctgccaattgcctggattcacatcctggctggaatcaagagggcagcatccgccaggctcccaacaggcaggactcccgcacaccctcctctgagaggccgctgtgttccgcagggccaggccctggacagttcccctcacctgccactagagaaacacctgccattgtcgtccccacctggaaaagaccactcgtggagcccccagccccaggtacagctgtagagagactccccgagggatctaagaaggagccatgcgcagttctgccgggaccctcggccaggccgacaggagtggacactggagctgggcccacactgggccacataggagctcaccagtgagggcaggagagcacatgccggggagcacccagcctcctgctgaccagaggcccgtcccagagcccaggaggctgcagaggcctctccagggggacactgtgcatgtctggtccctgagcagccccccacgtccccagtcctgggggcccctggcacagctgtctggaccctccctgttccctgggaagctcctcctgacagccccgcctccagttccaggtgtggattttgtcagggggtgtcacactgtgtactgccagaagtggatgtggacttgcgatagtgagaggaagagctgtgagggtatggtatgccggctgtggagtaagaagaagctctggcacagtggtgctgcccatatcaaaaaccaggccaagtagacaggcccctgctgtgcagccccaggcctccacttcacctgcttctcctggggctctcaaggtcactgttgtctgtactctgccctctgtggggagggttccctcagtgggaggtctgttctcaacatcccagggcctcatgtctgcacggaaggccaatggatgggcaacctcacatgccgcggctaagatagggtgggcagcctggcgggggacagtacatactgctggggtgtctgtcactgtgcctagtggggcactggctcccaaacaacgcagtcctcgccaaaatccccacagcctcccctgctaggggct
ggcctgatctcctgcagtcctaggaggctgctgacctccagaatgtctccgtccccagttccagggcgagagcagatcccaggccggctgcagactgggaggccaccccctccttcccagggttcactggaggtgaccaaggtaggaaatggccttaacacagggatgactgcgccatcccccaacagagtcagccccctcctgctctgtaccccgcaccccccaggccagtccacgaaaaccagggccccacatcagagtcactgcctggcccggccctggggcggacccctcagcccccaccctgtctagaggacttggggggacaggacacaggccctctccttatggttcccccacctgcctccggccgggacccttggggtgtggacagaaaggacacctgcctaattggcccccaggaacccagaacttctctccagggaccccagcccgagcacccccttacccaggacccagccctgcccctcctcccctctgctctcctctcatcaccccatgggaatccggtatccccaggaagccatcaggaagggctgaaggaggaagcggggccgtgcaccaccgggcaggaggctccgtcttcgtgaacccagggaagtgccagcctcctagagggtatggtccaccctgcctggggctcccaccgtggcaggctgcggggaaggaccagggacggtgtgggggagggctcagggccctgcgggtgctcctccatcttcggtgagcctcccccttcacccaccgtcccgcccacctcctctccaccctggctgcacgtcttccacaccatcctgagtcctacctacaccagagccagcaaagccagtgcagacaaaggctggggtgcaggggggctgccagggcagcttcggggagggaaggatggagggaggggaggtcagtgaagaggcccccttcccctgggtccaggatcctcctctgggacccccggatcccatcccctcctggctctgggaggagaagcaggatgggagaatctgtgcgggaccctctcacagtggaatatccccacagcggctcaggccagacccaaaagcccctcagtgagccctccactgcagtcctgggcctgggtagcagcccctcccacagaggacagacccagcaccccgaagaagtcctgccagggggagctcagagccatgaaagagcaggatatggggtccccgatacaggcacagacctcagctccatccaggcccaccgggacccaccatgggaggaacacctgtctccgggttgtgaggtagctggcctctgtctcggaccccactccagacaccagacagaggggcaggccccccaaaaccagggttgagggatgatccgtcaaggcagacaagaccaaggggcactgaccccagcaagggaaggctcccaaacagacgaggaggattttgtagctgtctgtatcactgtgtgcaactgcagcagatgggctcgcgaccatagcaggtgctgccacagtgacactcgccaggtcaaaaaccccgtcccaagtcagcggaagcagagagagcagggaggacacgtttaggatctgaggccgcacctgacacccagggcagcagacgtctcccctccagggcaccctccaccgtcctgcgtttcttcaagaataggggcggcctgagggggtccagggccaggcgataggtcccctctaccccaaggaggagccaggcaggacccgagcaccgatgcatctaacgcagtcatgtaatgctgggtgacagtcagttcgcctacgta
[0213]
tx-dh120126(seq id no:235)包括在对应于dh1-20至dh1-26的位置中插入的毒素编码序列:
[0214]
tacgtaatgcatctaacgcagtcatgtaatgctgggtgacagtcagttcgcctccccattgaggctgacctgcccagacgggcctgggcccaccccacacaccggggcggaatgtgtgcaggccccagtctctgtgggtgttccgctagctggggcccccagtgctcaccccacacctaaagcgagccccagcctccagagccccctaagcattccccgcccagcagcccagcccctgcccccacccaggaggccccagagctcagggcgcctggtcggattttgtacagccccgagtcactgtggagagagcttgcaatggcagacgcggctgcagcagatgggctcgcgatcatagcaggtgctgccacagtgagaaaaactgtgtcaaaaaccgactcctggcagcagtcggaggccccgccagagaggggagcagccggcctgaacccatgtcctgccggttcccatgacccccagcacccagagccccacggtgtccccgttggataatgaggacaagggctgggggctccggtggtttgcggcagggacttgatcacatccttctgctgtggccccattgcctctggctggagttgacccttctgacaagtgtcctcagaaagacagggatcaccggcacctcccaatatcaaccccaggcagcacagacacaaaccccacatccagagccaactccaggagcagagacaccccaacactctgggggaccccaaccgtgataactccccactggaatccgccccagagtctaccaggaccaaaggccctgccctgtctctgtccctcactcagggcctcctgcagggcgagcgcttgggagcagactcggtcttaggggacaccactgtgggccccaactttgatgaggccactgacccttccttcctttcctggggcagcacagactttggggtctgggcagggaagaactactggctggtggccaatcacagagcccccaggccg
aggtggccccaagaaggccctcaggaggtggccactccacttcctcccagctggaccccaggtcctccccaagataggggtgccatccaaggcaggtcctccatggagcccccttcagactcctcccgggaccccactggacctcagtccctgctctgggaatgcagccaccacaagcacaccaggaagcccaggcccagccaccctgcagtgggcaagcccacactctggagcagagcagggtgcgtctgggaggggctaacctccccaccccccaccccccatctgcacacagccacctaccactgcccagaccctctgcaggagggccaagccaccatggggtatggacttagggtctcactcacgtgcctcccctcctgggagaaggggcctcatgcccagatccctgcagcactagacacagctggaggcagtggccccagggccaccctgacctggcatctaaggctgctccagcccagacagcactgccgttcctgggaagcctgggctccaccagaccacaggtccagggcacagcccacaggagccacccacacacagctcacaggaagaagataagctccagaccccagggcgggacctgccttcctgccaccacttacacacaggccagggagctgttcccacacagatcaaccccaaaccgggactgcctggcactagggtcactgccatttccctctccattccctcccagtgcctctgtgctccctccttctggggaacaccctgtgcagcccctccctgcagcccacacgctggggagaccccaccctgcctcgggccttttctacctgctgcacttgccgcccacccaaacaaccctgggtacgtgaccctgcagtcctcaccctgatctgcaaccagacccctgtccctccctctaaacacccctcccaggccaactctgcacctgcaggccctccgctcttctgccacaagagcctcaggttttcctacctgtgcccaccccctaacccctcctgcccacaacttgagttcttcctctcctggagcccttgagccatggcactgaccctacactcccacccacacactgcccatgccatcaccttcctcctggacactctgaccccgctcccctccctctcagacccggccctggtatttccaggacaaaggctcacccaagtcttccccatgcaggcccttgccctcactgcctggttacacgggagcctcctgtgcgcagaagcagggagctcagctcttccacaggcagaaggcactgaaagaaatcagcctccagtgccttgacacacgtccgcctgtgtctctcactgcctgcacctgcagggaggctccgcactccctctaaagatgagggatccaggcagcaacatcacgggagaatgcagggctcccagacagcccagccctctcgcaggcctctcctgggaagagacctgcagccaccactgaacagccacggaggtcgctggatagtaaccgagtcagtgaccgacctggagggcaggggagcagtgaaccggagcccataccatagggacagagaccagccgctaacatcccgagcccctcactggcggccccagaacaccccgtggaaagagaacagacccacagtcccacctggaacagggcagacactgctgagcccccagcaccagccccaagaaacactaggcaacagcatcagagggggctcctgagaaagagaggaggggaggtctccttcaccatcaaatgcttcccttgaccaaaaacagggtccacgcaactcccccaggacaaaggaggagccccctgtacagcactgggctcagagtcctctctgagacaggctcagtttcagacaacaacccgctggaatgcacagtctcagcaggagagccaggccagagccagcaagaggagactcggtgacaccagtctcctgtagggacaggaggattttgtgggggttcgtgtcactgtgagcatattgtcggagcaggcagtgctattcccacagtgacacaaccccattcaaaaacccctactgcaaacgcacccactcctgggactgaggggctgggggagcgtctgggaagtatggcctaggggtgtccatcaatgcccaaaatgcaccagactctccccaagacatcaccccaccagccagtgagcagagtaaacagaaaatgagaagcagctgggaagcttgcacaggccccaaggaaagagctttggcaggtgtgcaagaggggatgtgggcagagcctcagcagggccttttgctgtttctgctttcctgtgcagagagttccataaactggtattcaagatcaatggctgggagtgagcccaggaggacagtgtgggaagagcacagggaaggaggagcagccgctatcctacactgtcatcttttgaaagtttgccctgtgcccacaatgctgcatcatgggatgcttaacagctgatgtagacacagctaaagagagaatcagtgaaatggatttgcagcacagatctgaataaatcctccagaatgtggagcagcacagaagcaagcacacagaaagtgcctgatgccaaggcaaagttcagtgggcaccttcaggcattgctgctgggcacagacactctgaaaagcactggcaggaactgcctgtgacaaagcagaaccctcaggcaatgccagccctagagcccttcctgagaacctcatgggcaaagatgtgcagaacagctgtttgtcatagccccaaactatggggctggacaaagcaaacgtccatctgaaggagaacagacaaataaacgatggcaggttcatgaaatgcaaactaggacagccagaggacaacagtagagagctacaggcggctttgcggttgagttcatgacaatgctgagtaattggagtaacagaggaaagcccaaaaaatacttttaatgtgatttcttctaaataaaatttacacccggcaaaatgaactatcttcttaa
gggataaactttcccctggaaaaactataaggaaaatcaagaaaacgatgatcacataaacacagtggtggttacttctactggggaaggaagagggtatgagctgagacacacagagtcggcaagtctcctaacaagaacagaacaaatacattacagtaccttgaaaacagcagttaaacttctaaatcgcaagaagaggaaaatgcacacacctgtgtttagaaaattctcagtccagcactgttcataatagcaaagacattaacccaggttggataaataagcgatgacacaggcaattgcacaatgatacagacatacattcagtatatgagacatcgatgatgtatccccaaagaaatgactttaaagagaaaaggcctgatgtgtggtggcaatcacctccctgggcatccccggacaggctgcaggctcactgtgtggcagggcaggcaggcacctgctggcagctcctggggcctgatgtggagcaggcacagagctgtatatccccaaggaaggtacagtcagtgcattccagagagaagcaactcagccacactccctggccagaacccaagatgcacacccatgcacagggaggcagagcccagcacctccgcagccaccaccacctgcgcacgggccaccaccttgcaggcacagagtgggtgctgagaggaggggcagggacaccaggcagggtgagcacccagagaaaactgcagaagcctcacacatccctcacctggcctgggcttcacctgacctggacctcacctggcctcgggcctcacctgcacctgctccaggtcttgctggagcctgagtagcactgaggctgtagggactcatccagggttggggaatgactctgcaactctcccacatctgacctttctgggtggaggcacctggtggcccagggaatataaaaagccccagaatgatgcctgtgtgatttgggggcaatttatgaacccgaaaggacatggccatggggtgggtagggacagtagggacagatgtcagcctgaggtgaagcctcaggacacaggtgggcatggacagtgtccacctaagcgagggacagacccgagtgtccctgcagtagacctgagagcgctgggcccacagcctcccctcggggccctgctgcctcctcaggtcagccctggacatcccgggtttccccaggcctggcggtaggattttgttgaggtctgtgtcactgtggtattactatgagaggcttgcttgtggcttccctaagagctgcagcaggcaagctaagcctcacagatgctgctattactaccacagtgtcacagagtccatcaaaaacccatgcctgggagcctcccaccacagccctccctgcgggggaccgctgcatgccgtgttaggattttgatcgaggacacggcgccatgggtatggtggctaccacagcagtgcagcccatgacccaaacacacggggcagcagaaacaatggacaggcccacaagtgaccatgatgggctccagcccaccagccccagagaccatgaaacagatggccaaggtcaccctacaggtcatccagatctggctccaaggggtctgcatcgctgctgccctcccaacgccaaaccagatggagacagggccggccccatagcaccatctgctgccgtccacccagcagtcccggaagcccctccctgaacgctgggccacgtgtgtgaaccctgcgagccccccatgtcagagtaggggcagcaggagggcggggctggccctgtgcactgtcactgcccctgtggtccctggcctgcctggccctgacacctgagcctctcctgggtcatttccaagacattcccagggacagccggagctgggagtcgctcatcctgcctggctgtcctgagtcctgctcatttccagacctcaccagggaagccaacagaggactcacctcacacagtcagagacaacgaaccttccagaaatccctgtttctctccccagtgagagaaaccctcttccagggtttctcttctctcccaccctcttccaggacagtcctcagcagcatcacagcgggaacgcacatctggatcaggacggcccccagaacacgcgatggcccatggggacagcccagcccttcccagacccctaaaaggtatccccaccttgcacctgccccagggctcaaactccaggaggcctgactcctgcacaccctcctgccagatatcacctcagccccctcctggaggggacaggagcccgggagggtgagtcagacccacctgccctcaatggcaggcggggaagattcagaaaggcctgagatccccaggacgcagcaccactgtcaatgggggccccagacgcctggaccagggcctgtgtgggaaaggcctctggccacactcagggggattttgtgaagggccctcccactgtggagaggctttgctgtggcttccctaagagctgccgcagcaggcaatgcaagcctcacagatgctgccacagtgatgaaaccagcatcaaaaaccgaccggactcgcagggtttatgcacacttctcggctcggagctctccaggagcacaagagccaggcccgagggtttgtgcccagaccctcggcctctagggacacccgggccatcttagccgatgggctgatgccctgcacaccgtgtgctgccaaacaggggcttcagagggctctgaggtgacttcactcatgaccacaggtgccctggtcccttcactgccagctgcaccagaccctgttccgagagatgccccagttccaaaagccaattcctggggccgggaattactgtagacaccagcctcattccagtacctcctgccaattgcctggattcccatcctggctggaatcaagagggcagcatccgccaggctcccaacaggcaggactcccacacaccctcctctgagaggccgctgtgttccgcagggccaggccgc
agacagttcccctcacctgcccatgtagaaacacctgccattgtcgtccccacctggcaaagaccacttgtggagcccccagccccaggtacagctgtagagagagtcctcgaggcccctaagaaggagccatgcccagttctgccgggaccctcggccaggccgacaggagtggacgctggagctgggcccacactgggccacataggagctcaccagtgagggcaggagagcacatgccggggagcacccagcctcctgctgaccagagacccgtcccagagcccaggaggctgcagaggcctctccagggggacacagtgcatgtctggtccctgagcagcccccaggctctctagcactgggggcccctggcacagctgtctggaccctccctgttccctgggaagctcctcctgacagccccgcctccagttccaggtgtggattttgtcagggggtgccacactgtgtactgccagaagtggatgtggacttgcgatagtgagaggaagtgctgtgagggtatggtatgccggctgtggtgtaagaagaagctctggcacagtggtgccgcccatatcaaaaaccaggccaagtagacagacccctgccacgcagccccaggcctccagctcacctgcttctcctggggctctcaaggctgctgtctgccctctggccctctgtggggagggttccctcagtgggaggtctgtgctccagggcagggatgactgagatagaaatcaaaggctggcagggaaaggcagcttcccgccctgagaggtgcaggcagcaccacagagccatggagtcacagagccacggagcccccagtgtgggcgtgtgagggtgctgggctcccggcaggcccagccctgatggggaagcctgccccgtcccacagcccaggtccccaggggcagcaggcacagaagctgccaagctgtgctctacgatcctcatccctccagcagcatccactccacagtggggaaactgagccttggagaaccacccagccccctggaaacaaggcggggagcccagacagtgggcccagagcactgtgtgtatcctggcactaggtgcagggaccacccggagatccccatcactgagtggccagcctgcagaaggacccaaccccaaccaggccgcttgattaagctccatccccctgtcctgggaacctcttcccagcgccaccaacagctcggcttcccaggccctcatccctccaaggaaggccaaaggctgggcctgccaggggcacagtaccctcccttgccctggctaagacagggtgggcagacggctgcagataggacatattgctggggcatcttgctctgtgactactgggtactggctctcaacgcagaccctaccaaaatccccactgcctcccctgctaggggctggcctggtctcctcctgctgtcctaggaggctgctgacctccaggatggcttctgtccccagttctagggccagagcagatcccaggcaggctgtaggctgggaggccacccctgtccttgccgaggttcagtgcaggcacccaggacaggaaatggcctgaacacagggatgactgtgccatgccctacctaagtccgcccctttctactctgcaacccccactccccaggtcagcccatgacgaccaacaacccaacaccagagtcactgcctggccctgccctggggaggacccctcagcccccaccctgtctagaggagttggggggacaggacacaggctctctccttatggttcccccacctggctcctgccgggacccttggggtgtggacagaaaggacgcctgcctaattggcccccaggaacccagaacttctctccagggaccccagcccgagcacccccttacccaggacccagccctgcccctcctcccctctgctctcctctcatcactccatgggaatccagaatccccaggaagccatcaggaagggctgaaggaggaagcggggccgctgcaccaccgggcaggaggctccgtcttcgtgaacccagggaagtgccagcctcctagagggtatggtccaccctgcctggggctcccaccgtggcaggctgcggggaaggaccagggacggtgtgggggagggctcagggccctgcaggtgctccatcttggatgagcccatccctctcacccaccgacccgcccacctcctctccaccctggccacacgtcgtccacaccatcctgagtcccacctacaccagagccagcagagccagtgcagacagaggctggggtgcaggggggccgccagggcagctttggggagggaggaatggaggaaggggaggtcagtgaagaggcccccctcccctgggtctaggatccacctttgggacccccggatcccatcccctccaggctctgggaggagaagcaggatgggagattctgtgcaggaccctctcacagtggaatacctccacagcggctcaggccagatacaaaagcccctcagtgagccctccactgcagtgcagggcctgggggcagcccctcccacagaggacagacccagcaccccgaagaagtcctgccagggggagctcagagccatgaaggagcaagatatggggaccccaatactggcacagacctcagctccatccaggcccaccaggacccaccatgggtggaacacctgtctccggcccctgctggctgtgaggcagctggcctctgtctcggacccccattccagacaccagacagagggacaggccccccagaaccagtgttgagggacacccctgtccagggcagccaagtccaagaggcgcgctgagcccagcaagggaaggcccccaaacaaaccaggaggtttctgaagctgtctgtgtcacagtctgctgcaactgcagcagcaaatggtgccgcgaccatagcaggtgctgccacaatgacactgggcaggacagaaaccccatcccaagtcagccga
aggcagagagagcaggcaggacacatttaggatctgaggccacacctgacactcaagccaacagatgtctcccctccagggcgccctgccctgttcagtgttcctgagaaaacaggggcagcctgaggggatccagggccaggagatgggtcccctctaccccgaggaggagccaggcgggaatcccagccccctccccattgaggccatcctgcccagaggggcccggacccaccccacacacccaggcagaatgtgtgcaggcctcaggctctgtgggtgccgctagctggggctgccagtcctcaccccacacctaaggtgagccacagccgccagagcctccacaggagaccccacccagcagcccagcccctacccaggaggccccagagctcagggcgcctgggtggattttgtacagccccgagtcactgtgggtatagtggggagaggctttgtggcttccctaagagctgcagcaggcaaaagcctcacagatgctgcagctactaccacagtgagaaaagctatgtcaaaaaccgtctcccggccactgctggaggcccagccagagaagggaccagccgcccgaacatacgaccttcccagacctcatgacccccagcacttggagctccacagtgtccccattggatggtgaggatgggggccggggccatctgcacctcccaacatcacccccaggcagcacaggcacaaaccccaaatccagagccgacaccaggaacacagacaccccaataccctgggggaccctggccctggtgacttcccactgggatccacccccgtgtccacctggatcaaagaccccaccgctgtctctgtccctcactcagggcctgctgaggggcgggtgctttggagcagactcaggtttaggggccaccattgtggggcccaacctcgaccaggacacagatttttctttcctgccctggggcaacacagactttggggtctgtgcagggaggaccttctggaaagtcaccaagcacagagccctgactgaggtggtctcaggaagacccccaggagggggcttgtgccccttcctctcatgtggaccccatgccccccaagataggggcatcatgcagggcaggtcctccatgcagccaccactaggcaactccctggcgccggtccccactgcgcctccatcccggctctggggatgcagccaccatggccacaccaggcagcccgggtccagcaaccctgcagtgcccaagcccttggcaggattcccagaggctggagcccacccctcctcatccccccacacctgcacacacacacctaccccctgcccagtccccctccaggagggttggagccgcccatagggtgggggctccaggtctcactcactcgcttcccttcctgggcaaaggagcctcgtgccccggtcccccctgacggcgctgggcacaggtgtgggtactgggccccagggctcctccagccccagctgccctgctctccctgggaggcctgggcaccaccagaccaccagtccagggcacagccccagggagccgcccactgccagctcacaggaagaagataagcttcagaccctcagggccgggagctgccttcctgccaccccttcctgccccagacctccatgccctcccccaaccacttacacacaagccagggagctgtttccacacagttcaaccccaaaccaggacggcctggcactcgggtcactgccatttctgtctgcattcgctcccagcgcccctgtgttccctccctcctccctccttcctttcttcctgcattgggttcatgccgcagagtgccaggtgcaggtcagccctgagcttggggtcacctcctcactgaaggcagcctcagggtgcccaggggcaggcagggtgggggtgaggcttccagctccaaccgcttcgctaccttaggaccgttatagttaggcgcgccgtcgaccaattctcatgtttgacagcttatcatcgaatttctacgta
[0215]
dna构建体
[0216]
通常,将含有一个或多个核苷酸编码序列(其各自编码目的非免疫球蛋白多肽或其一部分(例如,ackr2多肽的细胞外部分或毒素肽的一部分))的多核苷酸分子插入载体,优选dna载体内,以便在合适的宿主细胞中复制多核苷酸分子。
[0217]
由于其大小,一个或多个核苷酸编码序列可直接由可得自商业供应商的cdna源克隆,或基于可得自genbank的公开序列在计算机芯片上设计。可替代地,细菌人工染色体(bac)文库可提供来自目的基因(例如,异源ackr2基因或毒素编码序列)的异源核苷酸编码序列。bac文库含有100-150kb的平均插入片段大小,并且能够携带高达300kb的插入片段(shizuya等人,1992,proc.natl.acad.sci.,usa 89:8794-8797;swiatek等人,1993,genes and development 7:2071-2084;kim等人,1996,genomics 34 213-218;以引用的方式并入本文)。例如,已构建人和小鼠基因组bac文库,并且这些文库可商购获得(例如,invitrogen,carlsbad calif.)。基因组bac文库也可充当异源编码序列以及转录控制区域
源。
[0218]
可替代地,可从酵母人染色体(yac)分离、克隆和/或转移异源核苷酸编码序列。整个异源基因或基因座可以被克隆并包含在一个或几个yac内。如果使用多个yac并且它们含有重叠同源性区域,则它们可以在酵母宿主菌株内重组以产生代表整个基因座的单一构建体。yac臂可以通过改造用哺乳动物选择盒进一步修饰,以帮助通过本领域已知的和/或本文所述的方法将构建体引入胚胎干细胞或胚胎。
[0219]
如上所述,用于构建免疫球蛋白重链基因座的经改造的dh区的示例性dna和氨基酸序列分别在表3和4中提供。其它异源核苷酸编码序列也可在genbank数据库或本领域已知的其它序列数据库中找到。例如,人ackr2的mrna和氨基酸序列可分别在genbank登录号nm_001296.4和np_001287.2处找到,并且在此以引用的方式并入。另外,例如,α-芋螺毒素的dna和氨基酸序列可分别在genbank登录号jx177132.1和afr68318.1处找到;δ-芋螺毒素的dna和氨基酸序列可分别在genbank登录号kr013220.1和akd43185.1处找到;κ-芋螺毒素的dna和氨基酸序列可分别在genbank登录号dq311073.1和abd33865.1处找到;μ-芋螺毒素的dna和氨基酸序列可分别在genbank登录号ay207469.1和aao48588.1处找到;和/或ω-芋螺毒素的dna和氨基酸序列可分别在genbank登录号m84612.1和aaa81590.1处找到;所有这些在此以引用的方式并入。进一步地,例如,来自狼蛛(智利捕鸟蛛(grammostola spatulata))的毒素的序列可在genbank登录号1tyk_a和1lup_a处找到,sgtx-i的序列可在genbank登录号1la4_a处找到,虎纹捕鸟蛛毒素-iv(hwtx-iv)的序列可在genbank登录号p83303.2处找到,原毒素-i(protxi)的序列可在genbank登录号2m9l_a处找到,原毒素-2(protxii)的序列可在genbank登录号p83476.1处找到;所有这些在此以引用的方式并入。
[0220]
在一些实施例中,含有如本文所述的一个或多个核苷酸编码序列的dna构建体包含与重组信号序列(rss,即侧翼为5'rss和3’rss)可操作地连接的人ackr2dna序列,所述人ackr2 dna序列编码人ackr2多肽的细胞外部分,用于在转基因非人动物中与免疫球蛋白基因区段(例如vh和jh)重组。在一些实施例中,含有如本文所述的一个或多个核苷酸编码序列的dna构建体包含与重组信号序列(rss,即侧翼为5'rss和3’rss)可操作地连接的毒素dna序列,所述毒素dna序列编码μ-芋螺毒素和/或狼蛛毒素肽的一部分,用于在转基因非人动物中与免疫球蛋白基因区段(例如vh和jh)重组。重组信号序列可与自然界(例如基因组)中发现的重组信号序列相同或基本上相同,或者可通过人为改造(例如优化)。在一些实施例中,rss在起源中是基因组的,并且包括在自然界中发现的免疫球蛋白重链基因座(例如人或啮齿类动物免疫球蛋白重链基因座)中发现的一个或多个序列。例如,dna构建体可包括位于核苷酸编码序列的5'-侧翼区和/或3'-侧翼区中的重组信号序列,所述核苷酸编码序列编码目的非免疫球蛋白多肽或其一部分(例如,异源ackr2多肽的细胞外部分或毒素肽的一部分),以能够将核苷酸编码序列与vh和/或jh基因区段重组的方式可操作地连接至核苷酸编码序列。在一些实施例中,重组信号序列包含与传统dh基因区段(即,自然界中发现的rss)天然结合的序列。在一些实施例中,重组信号序列包含与传统dh基因区段天然不结合的序列。在一些实施例中,重组信号序列包含对于与vh和jh基因区段重组而优化的序列。在一些实施例中,与一个或多个核苷酸编码序列(其各自编码目的非免疫球蛋白多肽或其一部分(例如,ackr2多肽的细胞外部分或毒素肽的一部分))可操作地连接的重组信号序列提供处于与由其获得该序列的动物中的重组水平相似、或更高或更低的水平的重组。如果另
外的侧翼序列可用于优化一个或多个核苷酸编码序列的重组,则可使用现有序列作为探针来克隆此类序列。取决于所需结果,可从基因组序列或其它源获得用于使含有非免疫球蛋白多肽(例如,ackr2或毒素)的核苷酸编码序列的重链可变区的重组和/或表达最大化所需的另外序列。
[0221]
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自通过优化的rss侧接5'和/或3'。可使用的示例性的优化rss在图2中提供并且在实例1中描述。
[0222]
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的rss 5'侧接,所述优化的rss具有与图2中出现的5’rss至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
[0223]
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的rss 5'侧接,所述优化的rss具有与图2中出现的5’rss基本上相同或相同的序列。
[0224]
在各种实施例中,一个或多个核苷酸编码序列各自由优化的rss 3’侧接,所述优化的rss具有与图2中出现的3’rss至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
[0225]
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的rss 3’侧接,所述优化的rss具有与图2中出现的5’rss基本上相同或相同的序列。
[0226]
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的rss 5’和3’侧接,每个5’和3’rss具有与图2中出现的5’和3’rss至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
[0227]
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的rss 5’和3’侧接,每个5’和3’rss具有与图2中出现的5’和3’rss基本上相同或相同的序列。
[0228]
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由选自图2的5’和3’rss侧接。
[0229]
dna构建体可以使用本领域已知的方法制备。例如,dna构建体可以制备为较大质粒的一部分。这种制备允许以本领域已知的有效方式克隆和选择正确的构建体。含有本文所述的一个或多个核苷酸编码序列的dna片段可以定位于质粒上的简便限制性位点之间,使得它们可易于从其余的质粒序列分离,以掺入所需的动物。
[0230]
本领域已知用于制备质粒和转化宿主生物的各种方法。对于用于原核和真核细胞二者的其他合适的表达系统,以及一般重组步骤,参见molecular cloning:a laboratory manual,第2版,sambrook,j.等人编,cold spring harbor laboratory press:1989。
[0231]
具有经改造的dh区的非人动物的生产
[0232]
本发明提供了非人动物,其表达特征在于重链cdr3多样性的抗体,所述重链cdr3多样性指导与特定抗原的结合,来源于一个或多个核苷酸编码序列的整合,各自编码目的非免疫球蛋白多肽或其一部分(例如非典型趋化因子受体例如ackr2的细胞外部分、或毒素肽的一部分)的所述一个或多个核苷酸编码序列整合到非人动物的基因组中的免疫球蛋白重链可变区内。本文描述的合适的实例包括啮齿类动物,具体地讲,小鼠。
[0233]
在一些实施例中,一个或多个异源核苷酸编码序列包含来自异源物种(例如人、蜘
蛛、蝎子、蜗牛、狼蛛、海葵等)的遗传材料,其中所述异源核苷酸编码序列各自编码目的非免疫球蛋白多肽或其一部分(例如,ackr多肽的细胞外部分或毒素肽的一部分),其包含来自异源物种的遗传材料的编码部分。在一些实施例中,本文所述的异源核苷酸编码序列包含编码目的非免疫球蛋白多肽或其一部分(例如,异源ackr多肽的细胞外部分或毒素肽的一部分)的异源物种的核苷酸编码序列,目的非免疫球蛋白多肽的所述部分出现在免疫球蛋白重链,特别是重链cdr3中,其由如本文所述的非人动物的b细胞表达。还提供了非人动物、胚胎、用于制备非人动物的细胞和靶向构建体、非人胚胎和含有所述异源核苷酸编码序列的细胞。
[0234]
在各种实施例中,将一个或多个异源核苷酸编码序列插入非人动物的基因组内的免疫球蛋白重链可变区的dh区内。在一些实施例中,免疫球蛋白重链可变区的dh区(或其一部分)不是缺失的(即完整的)。{在一些实施例中,免疫球蛋白重链可变区的dh区(或其一部分)被改变、破坏、缺失或替换为一个或多个异源核苷酸编码序列(例如,一个或多个异源ackr2或者一个或多个异源毒素核苷酸编码序列)。在一些实施例中,全部或基本上全部dh区被替换为一个或多个异源核苷酸编码序列;在一些特定实施例中,一个或多个传统dh基因区段在免疫球蛋白重链可变区的dh区中不被缺失或替换。在一些实施例中,如本文所述的dh区是合成dh区,所述合成dh区包含如本文所述的一个或多个异源核苷酸编码序列。在一些实施例中,dh区是人dh区。在一些实施例中,dh区是鼠dh区。在一些实施例中,将如本文所述的经改造的dh区(或其一部分)插入免疫球蛋白重链可变区内,使得所述经改造的dh区(或其一部分)与一个或多个vh基因区段和/或一个或多个jh基因区段可操作地连接。在一些实施例中,将一个或多个异源核苷酸编码序列插入免疫球蛋白重链可变区的两个拷贝之一内,产生就一个或多个异源核苷酸编码序列(即,经改造的dh区)而言是杂合的非人动物。在一些实施例中,提供了对于一个或多个异源核苷酸编码序列(即,经改造的dh区)是纯合的非人动物。在一些实施例中,提供了对于一个或多个异源核苷酸编码序列(即,经改造的dh区)是杂合的非人动物。
[0235]
在一些实施例中,本文所述的非人动物含有人免疫球蛋白重链可变区,其包括在其基因组中含有(例如随机整合)一个或多个异源核苷酸编码序列的h区。因此,此类非人动物可被描述为具有含有经改造的dh区的人免疫球蛋白重链转基因。可使用各种方法检测经改造的dh区,所述方法包括例如pcr、蛋白质印迹、rna印迹、限制性片段长度多态性(rflp)、或者等位基因获得或丧失测定。在一些实施例中,本文所述的非人动物就如本文所述的经改造的dh区而言是杂合的。在一些实施例中,本文所述的非人动物就如本文所述的经改造的dh区而言是纯合的。在一些实施例中,本文所述的非人动物就如本文所述的经改造的dh区而言是半合子的。在一些实施例中,本文所述的非人动物含有如本文所述的经改造的dh区的一个或多个拷贝。
[0236]
在一些实施例中,本文公开的一个或多个异源ackr核苷酸编码序列是异源ackr2核苷酸编码序列。在一些实施例中,一个或多个异源ackr2核苷酸编码序列是人。
[0237]
在一些实施例中,本文所述的一个或多个异源毒素核苷酸编码序列是异源μ-芋螺毒素核苷酸编码序列、异源狼蛛毒素核苷酸编码序列和/或其组合。
[0238]
在各种实施例中,本文所述的一个或多个异源核苷酸编码序列包括一个或多个核苷酸编码序列,其各自具有与表3或表4中出现的一个或多个核苷酸编码序列至少50%(例
如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
[0239]
在各种实施例中,本文所述的一个或多个异源核苷酸编码序列包括一个或多个核苷酸编码序列,其各自具有与表3或表4中出现的一个或多个核苷酸编码序列基本上相同或相同的序列。
[0240]
在各种实施例中,本文所述的一个或多个异源核苷酸编码序列选自表3和/或表4。
[0241]
在各种实施例中,本文所述的经改造的dh区包含一个或多个异源核苷酸编码序列,其各自具有与表3或表4中出现的一个或多个核苷酸编码序列至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
[0242]
在各种实施例中,本文所述的经改造的dh区包含一个或多个异源核苷酸编码序列,其各自具有与表3或表4中出现的一个或多个核苷酸编码序列基本上相同或相同的序列。
[0243]
在各种实施例中,本文所述的经改造的dh区包含5、10、15、20或25个异源ackr2核苷酸编码序列,其各自具有与表3中出现的5、10、15、20或25个ackr2核苷酸编码序列相同的序列。
[0244]
在各种实施例中,本文所述的经改造的dh区包含5、10、15、20、25或26个异源毒素核苷酸编码序列,其各自具有与表4中出现的5、10、15、20、25或26个毒素核苷酸编码序列相同的序列。
[0245]
在各种实施例中,本文所述的经改造的dh区包含一个或多个异源核苷酸编码序列,其各自侧翼为5'重组信号序列(5’rss)和3'重组信号序列(3’rss),所述5’rss和3’rss各自具有与图2中出现的5’rss和3’rss至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
[0246]
在各种实施例中,本文所述的经改造的dh区包含一个或多个异源核苷酸编码序列,其各自侧翼为5'重组信号序列(5’rss)和3'重组信号序列(3’rss),所述5’rss和3’rss各自具有与图2中出现的5’rss和3’rss基本上相同或相同的序列。
[0247]
在各种实施例中,本文所述的经改造的dh区包含一个或多个异源核苷酸编码序列,其各自侧翼为5'重组信号序列(5’rss)和3'重组信号序列(3’rss),所述5’rss和3’rss选自图2。
[0248]
在各种实施例中,本文所述的经改造的dh区包含
[0249]
(a)由seq id no:59 5'侧接且由seq id no:60 3'侧接的seq id no:39;
[0250]
(b)由seq id no:69 5'侧接且由seq id no:70 3'侧接的seq id no:7;
[0251]
(c)由seq id no:77 5'侧接且由seq id no:78 3'侧接的seq id no:1;
[0252]
(d)由seq id no:87 5'侧接且由seq id no:88 3'侧接的seq id no:33;
[0253]
(e)由seq id no:95 5'侧接且由seq id no:96 3'侧接的seq id no:3;和
[0254]
(f)由seq id no:103 5'侧接且由seq id no:104 3'侧接的seq id no:5。
[0255]
在各种实施例中,本文所述的经改造的dh区包含
[0256]
(a)由seq id no:61 5'侧接且由seq id no:62 3'侧接的seq id no:41;
[0257]
(b)由seq id no:71 5'侧接且由seq id no:72 3'侧接的seq id no:15;
[0258]
(c)由seq id no:79 5'侧接且由seq id no:80 3'侧接的seq id no:37;
[0259]
(d)由seq id no:81 5'侧接且由seq id no:82 3'侧接的seq id no:13;
[0260]
(e)由seq id no:89 5'侧接且由seq id no:90 3'侧接的seq id no:29;
[0261]
(f)由seq id no:97 5'侧接且由seq id no:98 3'侧接的seq id no:11;和
[0262]
(g)由seq id no:105 5'侧接且由seq id no:106 3'侧接的seq id no:9;
[0263]
在各种实施例中,本文所述的经改造的dh区包含
[0264]
(a)由seq id no:63 5'侧接且由seq id no:64 3'侧接的seq id no:43;
[0265]
(b)由seq id no:73 5'侧接且由seq id no:74 3'侧接的seq id no:23;
[0266]
(c)由seq id no:83 5'侧接且由seq id no:84 3'侧接的seq id no:17;
[0267]
(d)由seq id no:91 5'侧接且由seq id no:92 3'侧接的seq id no:35;
[0268]
(e)由seq id no:99 5'侧接且由seq id no:100 3'侧接的seq id no:19;和
[0269]
(f)由seq id no:107 5'侧接且由seq id no:108 3'侧接的seq id no:21。
[0270]
在各种实施例中,本文所述的经改造的dh区包含
[0271]
(a)由seq id no:65 5'侧接且由seq id no:66 3'侧接的seq id no:45;
[0272]
(b)由seq id no:75 5'侧接且由seq id no:76 3'侧接的seq id no:31;
[0273]
(c)由seq id no:85 5'侧接且由seq id no:86 3'侧接的seq id no:25;
[0274]
(d)由seq id no:93 5'侧接且由seq id no:94 3'侧接的seq id no:49;
[0275]
(e)由seq id no:101 5'侧接且由seq id no:102 3'侧接的seq id no:27;和
[0276]
(f)由seq id no:67 5'侧接且由seq id no:68 3'侧接的seq id no:47。
[0277]
在各种实施例中,本文所述的经改造的dh区包含一个或多个dna片段,其各自具有与选自seq id no:131、seq id no:132、seq id no:133、seq id no:134及其组合的dna片段至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
[0278]
在各种实施例中,本文所述的经改造的dh区包含一个或多个dna片段,其各自具有与选自seq id no:131、seq id no:132、seq id no:133、seq id no:134及其组合的dna片段基本上相同或相同的序列。
[0279]
在各种实施例中,本文所述的经改造的dh区包含seq id no:131、seq id no:132、seq id no:133和seq id no:134中的任何一个。
[0280]
在各种实施例中,本文所述的经改造的dh区包含seq id no:131、seq id no:132、seq id no:133和seq id no:134。在一些特定实施例中,本文所述的经改造的dh区从5'到3'包含seq id no:131、seq id no:132、seq id no:133和seq id no:134。
[0281]
在各种实施例中,本文所述的经改造的dh区包含
[0282]
(a)由seq id no:59 5'侧接且由seq id no:60 3'侧接的seq id no:180;
[0283]
(b)由seq id no:69 5'侧接且由seq id no:70 3'侧接的seq id no:182;
[0284]
(c)由seq id no:77 5'侧接且由seq id no:78 3'侧接的seq id no:184;
[0285]
(d)由seq id no:87 5'侧接且由seq id no:88 3'侧接的seq id no:186;
[0286]
(e)由seq id no:95 5'侧接且由seq id no:96 3'侧接的seq id no:188;和
[0287]
(f)由seq id no:103 5'侧接且由seq id no:104 3'侧接的seq id no:190。
[0288]
在各种实施例中,本文所述的经改造的dh区包含
[0289]
(a)由seq id no:61 5'侧接且由seq id no:62 3'侧接的seq id no:192;
[0290]
(b)由seq id no:71 5'侧接且由seq id no:72 3'侧接的seq id no:194;
[0291]
(c)由seq id no:79 5'侧接且由seq id no:80 3'侧接的seq id no:196;
[0292]
(d)由seq id no:81 5'侧接且由seq id no:82 3'侧接的seq id no:198;
[0293]
(e)由seq id no:89 5'侧接且由seq id no:90 3'侧接的seq id no:200;
[0294]
(f)由seq id no:97 5'侧接且由seq id no:98 3'侧接的seq id no:202;和
[0295]
(g)由seq id no:105 5'侧接且由seq id no:106 3'侧接的seq id no:204;
[0296]
在各种实施例中,本文所述的经改造的dh区包含
[0297]
(a)由seq id no:63 5'侧接且由seq id no:64 3'侧接的seq id no:206;
[0298]
(b)由seq id no:73 5'侧接且由seq id no:74 3'侧接的seq id no:208;
[0299]
(c)由seq id no:83 5'侧接且由seq id no:84 3'侧接的seq id no:210;
[0300]
(d)由seq id no:91 5'侧接且由seq id no:92 3'侧接的seq id no:212;
[0301]
(e)由seq id no:99 5'侧接且由seq id no:100 3'侧接的seq id no:214;和
[0302]
(f)由seq id no:107 5'侧接且由seq id no:108 3'侧接的seq id no:216。
[0303]
在各种实施例中,本文所述的经改造的dh区包含
[0304]
(a)由seq id no:65 5'侧接且由seq id no:66 3'侧接的seq id no:218;
[0305]
(b)由seq id no:75 5'侧接且由seq id no:76 3'侧接的seq id no:220;
[0306]
(c)由seq id no:85 5'侧接且由seq id no:86 3'侧接的seq id no:222;
[0307]
(d)由seq id no:93 5'侧接且由seq id no:94 3'侧接的seq id no:224;
[0308]
(e)由seq id no:101 5'侧接且由seq id no:102 3'侧接的seq id no:226;
[0309]
(f)由seq id no:109 5'侧接且由seq id no:110 3'侧接的seq id no:228;和
[0310]
(g)由seq id no:67 5'侧接且由seq id no:68 3'侧接的seq id no:230。
[0311]
在各种实施例中,本文所述的经改造的dh区包含一个或多个dna片段,其各自具有与选自seq id no:232、seq id no:233、seq id no:234、seq id no:235及其组合的dna片段至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
[0312]
在各种实施例中,本文所述的经改造的dh区包含一个或多个dna片段,其各自具有与选自seq id no:232、seq id no:233、seq id no:234、seq id no:235及其组合的dna片段基本上相同或相同的序列。
[0313]
在各种实施例中,本文所述的经改造的dh区包含seq id no:232、seq id no:233、seq id no:234和seq id no:235中的任何一个。
[0314]
在各种实施例中,本文所述的经改造的dh区包含seq id no:232、seq id no:233、seq id no:234和seq id no:235。在一些特定实施例中,本文所述的经改造的dh区从5'到3'包含seq id no:232、seq id no:233、seq id no:234和seq id no:235。
[0315]
在各种实施例中,由本文所述的非人动物产生的抗体包含重链可变区,所述重链可变区包括具有氨基酸序列的cdr3,所述氨基酸序列是或包含与表3或表4中出现的氨基酸序列至少50%(例如,50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的氨基酸序列。
[0316]
在各种实施例中,由本文所述的非人动物产生的抗体包含重链可变区,所述重链
可变区包括具有氨基酸序列的cdr3,所述氨基酸序列是或包含与表3或表4中出现的氨基酸序列基本上相同或相同的氨基酸序列。
[0317]
在各种实施例中,由本文所述的非人动物产生的抗体包含重链可变区,所述重链可变区包括具有氨基酸序列的cdr3,所述氨基酸序列是氨基酸序列的变体(即,其体细胞突变的变体),所述氨基酸序列是或包含表3或表4中出现的氨基酸序列。
[0318]
本发明提供了用于制备其基因组包含免疫球蛋白重链可变区的非人动物的组合物和方法,所述免疫球蛋白重链可变区包括经改造的dh区,其中所述经改造的dh区包括一个或多个核苷酸编码序列,其各自编码目的多肽的一部分,包括目的多肽的特定多态性形式的核苷酸编码序列、目的多肽的等位基因变体(例如单个氨基酸差异)或目的多肽的可变剪接同种型,包括用于制备表达包含重链可变区的抗体的非人动物的组合物和方法,所述重链可变区包括cdr3,所述cdr3具有由来自免疫球蛋白重链基因座的此类核苷酸编码序列编码的氨基酸序列,所述免疫球蛋白重链基因座含有与一个或多个非人重链恒定区基因可操作地连接的人vh和jh基因区段。在一些实施例中,还提供了用于制备处于内源增强子和/或内源调控序列的控制下,表达此类抗体的非人动物的组合物和方法。在一些实施例中,还提供了用于制备处于异源增强子和/或异源调节序列的控制下,表达此类抗体的非人动物的组合物和方法。方法包括将一个或多个核苷酸编码序列(其各自编码目的多肽的一部分)或一个或多个dna片段(其各自含有多个核苷酸编码序列,所述多个核苷酸编码序列各自编码目的多肽的一部分)插入非人动物的基因组中,使得包括目的多肽的所述部分的抗体被表达。
[0319]
在一些实施例中,方法包括插入约10,050bp的dna(其包括对应于异源ackr2多肽的细胞外部分的六个核苷酸编码序列)、约9,768bp的dna(其包括对应于异源ackr2的细胞外部分的七个核苷酸编码序列)、约9,788bp的dna(其包括对应于异源ackr2多肽的细胞外部分的六个核苷酸编码序列)、和/或约11,906bp的dna(其包括对应于异源ackr2多肽的细胞外部分的六个核苷酸编码序列)。总之,这种dna包括对应于异源ackr2多肽的细胞外部分的25个编码序列。在一些实施例中,方法包括插入还包含重组信号序列的dna,所述重组信号序列侧接对应于异源ackr2多肽的细胞外部分的每个核苷酸编码序列。包括对应于异源ackr2多肽的细胞外部分的核苷酸编码序列和上述侧翼重组信号序列的遗传材料可插入非人动物的基因组内,从而产生具有经改造的dh区的非人动物,所述经改造的dh区含有对应于异源ackr2多肽的细胞外部分的核苷酸编码序列和必要的重组信号序列,以允许与相邻的vh和jh基因区段的重组。
[0320]
在一些实施例中,方法包括插入约9,812bp的dna(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的六个核苷酸编码序列)、约9,512bp的dna(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的七个核苷酸编码序列、约9,691bp的dna(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的六个核苷酸编码序列)、和/或约11,896bp的dna(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的七个核苷酸编码序列)。总之,这种dna包括对应于一种或多种毒素肽的一部分的26个编码序列。在一些实施例中,方法包括插入还包含重组信号序列的dna,所述重组信号序列侧接对应于一种或多种毒素肽的一部分的每个核苷酸编码序列。包括对应于一种或多种毒素肽的一部分的核苷酸编码序列和上述侧翼重组
信号序列的遗传材料可插入非人动物的基因组内,从而产生具有经改造的dh区的非人动物,所述经改造的dh区含有对应于一种或多种毒素肽的一部分的核苷酸编码序列和必要的重组信号序列,以允许与相邻的vh和jh基因区段的重组。
[0321]
适当时,对应于目的异源多肽的一部分的核苷酸编码序列可被修饰,以包括对于在非人动物中的表达进行优化的密码子(例如参见美国专利号5,670,356和5,874,304)。密码子优化的序列是合成序列,并且优选编码由非密码子优化的亲本多核苷酸编码的相同多肽(或具有与全长多肽基本上相同的活性的全长多肽的生物活性片段)。在一些实施例中,对应于目的异源多肽的一部分的核苷酸编码序列可包括改变的序列,以优化对于特定细胞类型(例如啮齿类动物细胞)的密码子使用。例如,对应于待插入非人动物(例如啮齿类动物)的基因组内的目的异源多肽的异部分的核苷酸编码序列的密码子可被优化用于在非人动物的细胞中表达。此序列可描述为密码子优化序列。
[0322]
将对应于目的异源多肽的一部分的核苷酸编码序列插入dh区内使得所述核苷酸编码序列可操作地连接至vh和jh基因区段(例如,多个vh和jh基因区段),采用基因组的相对最低限度的修饰,并且导致包含特征在于cdr3的重链的抗体在非人动物中的表达,所述cdr3具有对应于目的异源多肽的一部分的氨基酸序列。
[0323]
用于产生转基因非人动物的方法,包括敲除和敲入,是本领域熟知的(参见例如gene targeting:a practical approach,joyner编,oxford university press,inc.(2000))。例如,转基因啮齿类动物的生成可任选地涉及破坏一种或多种内源性啮齿类动物基因(或基因区段)的基因座,并且将一种或多种异源基因(或基因区段或核苷酸编码序列)引入啮齿类动物基因组内,在一些实施例中,在与内源性啮齿类动物基因(或基因区段)相同的位置处。在一些实施例中,将对应于目的异源多肽的一部分的核苷酸编码序列引入啮齿类动物的基因组中随机插入的免疫球蛋白重链基因座的dh区内。在一些实施例中,将对应于目的异源多肽的一部分的核苷酸编码序列引入啮齿类动物的基因组中的内源性免疫球蛋白重链基因座的dh区内;在一些实施例中,内源性免疫球蛋白重链基因座被改变、修饰或改造,以含有与一个或多个恒定区基因(例如人或鼠)可操作地连接的人基因区段(例如v和/或j)。
[0324]
图3a和3b中提供了用于构建靶向载体的示例性策略的示意图(不按照比例),所述靶向载体用于整合到啮齿类动物胚胎干(es)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的多样性簇(即dh区),所述多样性簇包括各自编码异源ackr2多肽的一部分(例如d6趋化因子诱饵受体的细胞外部分)的一个或多个核苷酸编码序列,或图7a和7b中提供了各自编码毒素肽的一部分(例如,μ-芋螺毒素和/或狼蛛毒素肽的一部分)。如所示的,各自含有各种数目的核苷酸编码序列的dna片段使用等温装配连同侧翼为位点特异性重组识别位点(例如loxp)的选择盒(例如新霉素)装配在一起,所述核苷酸编码序列各自编码异源ackr2多肽的细胞外部分(图3a-3b),或各自编码毒素肽的一部分(图7a-7b)。图4a和4b(对于ackr2核苷酸编码序列)以及8a和8b(对于毒素核苷酸编码序列)中分别示出了采用dna片段的序贯连接的替代策略。dna片段包括重组信号序列,其侧接(5'和3')每个核苷酸编码序列,以允许一旦整合到免疫球蛋白重链基因座内,就与vh和jh基因区段重组。重组信号序列可从基因组源获得,或者可替代地,它们可如本文所述进行优化,以提供核苷酸编码序列与可操作地连接的vh和jh基因区段的有
效重组。核苷酸编码序列本身可被优化,使得在抗体序列的亲和力成熟过程中的体细胞超突变发生的水平为、接近或高于在野生型非人动物(其包含包括传统dh基因区段的免疫球蛋白重链基因座)或非人动物(其对于包括传统人dh基因区段的人免疫球蛋白重(和/或轻链)基因座是转基因的)中观察到的体细胞超突变的水平。一旦装配,就将装配的dna片段(即,经改造的dh区)连接到bac载体内,所述bac载体含有基因组重链可变区dna(例如人),以产生用于整合到免疫球蛋白重链基因座内的靶向载体。执行连接使得经改造的dh区由vh基因组dna 5'侧接,且由jh基因组dna和非人(例如啮齿类动物)基因组重链恒定区dna(例如内含子增强子和igm恒定区基因)3'侧接。用于掺入非人细胞(例如啮齿类动物胚胎干细胞)的基因组内的最终靶向载体含有vh基因组dna(例如,含有一个或多个vh基因区段)、经改造的dh区、3'jh基因组dna和非人(例如啮齿类动物)基因组重链恒定区dna,所有这些都可操作地连接,以允许一旦整合到非人动物的基因组内,vh基因区段、经改造的dh区内的核苷酸编码序列和jh基因区段之间的重组。
[0325]
将靶向载体引入啮齿类动物(例如小鼠)胚胎干细胞内,使得靶向载体中所含的序列(即,经改造的dh区)导致非人细胞或非人动物(例如小鼠)表达含有cdr3的抗体的能力,所述cdr3具有由插入的核苷酸编码序列编码的氨基酸。
[0326]
如本文所述,当经改造的dh区已引入啮齿类动物基因组的内源性免疫球蛋白重链基因座(例如,经改造以含有人可变区基因区段的内源性免疫球蛋白重链基因座)内时,生成转基因啮齿类动物。免疫球蛋白在鼠细胞上表达,所述免疫球蛋白具有含有氨基酸的cdr3,所述氨基酸由来自经改造的dh区的核苷酸编码序列编码。免疫球蛋白还包含鼠恒定区,并且因此为啮齿类动物的免疫系统中的各种免疫细胞提供必要的效应子功能。当啮齿类动物基因组的内源性免疫球蛋白重链基因座不被靶向载体靶向时,优选将经改造的dh区插入免疫球蛋白重链基因座内的除内源性鼠免疫球蛋白重链基因座外的位置处(例如,随机插入)。在这种情况下,内源性鼠免疫球蛋白重链基因座可被缺失或以其它方式致使无功能(例如通过靶向缺失、插入、倒转等),使得由非人动物产生的抗体利用来自含有插入的经改造的dh区的免疫球蛋白重链基因座的基因区段和序列。
[0327]
在一些实施例中,本文所述的非人动物的基因组还包含一种或多种人免疫球蛋白重链和/或轻链基因(参见例如美国专利号8,502,018;美国专利号8,642,835;美国专利号8,697,940;美国专利号:8,791,323;以及美国专利申请公开号2013/0096287 a1;以引用的方式并入本文)。可替代地,可将经改造的dh区引入不同修饰的品系,例如品系(参见例如美国专利号8,502,018或美国专利号8,642,835;以引用的方式并入本文)的胚胎干细胞内。在一些实施例中,可将经改造的dh区引入修饰品系的胚胎干细胞内,如美国专利号8,697,940和8,642,835中所述;以引用的方式并入本文。
[0328]
在一些实施例中,本文所述的非人动物的基因组还包含(例如,经由交叉育种或多重靶向策略)一种或多种人免疫球蛋白轻链基因或基因座(例如转基因的、内源的等),如美国专利申请公开号2011-0195454 a1、2012-0021409 a1、2012-0192300 a1、2013-0045492 a1、2013-0185821 a1、2013-0198880 a1、2013-0302836 a1、2015-0059009 a1国际专利申请公开号wo 2011/097603、wo 2012/148873、wo 2013/134263、wo 2013/184761、wo 2014/160179、wo 2014/160202中所述;所有这些在此以引用的方式并入。
[0329]
已描述了单个重排轻链,例如包含重排轻链可变区的轻链的遗传改造。例如,在这
些小鼠中生成包含单个重排的可变基因序列v
l
:j
l
的通用轻链小鼠(ulc)和生成抗原特异性抗体在例如美国专利申请号13/022,759、13/093,156、13/412,936、13/488,628、13/798,310和13/948,818(分别为公开号2011/0195454、2012/0021409、2012/0192300、2013/0045492、us20130185821和us20130302836)中描述,所述专利各自以引用的方式并入本文。美国申请公开号2011/0195454、2012/0021409、2012/0192300和2013/0045492中描述的经改造的共同轻链小鼠包含的核酸序列编码轻链选项的有限储库,例如共同或通用轻链“ulc”,其包含不超过两个vl基因区段或单个重排的人免疫球蛋白轻链可变区序列。为了实现这种有限储库,将小鼠改造成使其制备或重排天然小鼠轻链可变结构域的能力无功能或基本上无功能。在一个方面,这例如通过缺失小鼠的轻链可变区基因区段来实现。如先前所述,内源性小鼠基因座然后可通过选择的外源性合适的轻链可变区基因区段(优选人轻链可变区基因区段)修饰,任选可操作地连接至内源性小鼠轻链恒定区,其方式使得外源性可变区基因区段可与内源性小鼠轻链恒定区基因组合,并形成重排的反向嵌合轻链基因(人可变,小鼠恒定)。在各种实施例中,轻链可变区能够体细胞突变。在各种实施例中,为了使轻链可变区获得体细胞突变的能力最大化,适当的增强子保留在小鼠中。在一个方面,在用人κ轻链基因区段修饰小鼠κ轻链基因座以替换内源性小鼠κ轻链基因区段中,小鼠κ内含子增强子和小鼠κ3'增强子在功能上得到维持或未被破坏。
[0330]
因此,本发明提供了经遗传改造的小鼠,其表达与包含由如本文所述的经遗传改造的dh区(或其一部分)编码的氨基酸的反向嵌合(人可变,小鼠恒定)重链多样性相关的反向嵌合(人可变,小鼠恒定)轻链的有限储库。在各种实施例中,缺失内源性小鼠κ轻链基因区段,并且替换为与内源性小鼠cκ基因可操作地连接的单个(或两个)重排的人轻链区。在用于使重排的人轻链区的体细胞超突变最大化的实施例中,维持小鼠κ内含子增强子和小鼠κ3'增强子。在各种实施例中,小鼠还包含无功能的κ轻链基因座或其缺失、或致使基因座不能制备κ轻链的缺失。
[0331]
因此,在一个实施例中,本文提供了非人动物(例如啮齿类动物,例如小鼠或大鼠),其在其基因组中例如在其种系中包含来自优选人轻链可变基因区段的有限储库的优选人轻链可变区、或单个重排的人轻链可变区的有限储库,其中所述非人动物在其基因组中例如在其种系中还包含免疫球蛋白重链可变区,其包括经改造的dh区,其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。
[0332]
本发明提供了经遗传改造的动物,其从人轻链可变区基因序列的有限储库表达人轻链可变结构域或单个人轻链可变结构域的有限储库。在一个实施例中,单个重排的v/j人轻链序列选自vκ1-39jκ和vκ3-20jκ,例如vκ1-39jκ5和vκ3-20jκ1。在一些实施例中,如本文公开的非人动物包含经修饰的轻链基因座,所述经修饰的轻链基因座包含所有内源性功能v
l
和所有内源性功能j
l
基因区段由单个重排的v/j轻链序列的替换,其中所述单个重排的v/j轻链序列可操作地连接至内源性轻链恒定区基因。在一些实施例中,经修饰的轻链基因座位于非人动物的种系基因组中。在一个实施例中,非人动物在其种系基因组中包含与轻链恒定区基因序列可操作地连接的单个重排的轻链可变区基因序列,其中所述单个重排的轻链可变区基因序列包含人种系v
l
和人种系j
l
基因区段,例如人种系vκ1-39和人种系jκ5或人种系vκ3-20和jκ1。在一些实施例中,如本文公开的非人动物包含b细胞,例如仍未经历类别转换的b细胞,其在其基因组中包含与内源性轻链恒定区可操作地连接的单个重排的v/j轻
链序列,其中与非人动物的种系基因组中发现的可操作地连接至内源性轻链恒定区基因的单个重排的v/j轻链序列相比,单个重排的v/j轻链不包含体细胞突变。在其它实施例中,如本文公开的非人动物包含b细胞,例如已经历类别转换的b细胞,其在其基因组中包含与内源性轻链恒定区可操作地连接的单个重排的v/j轻链序列,其中与非人动物的种系基因组中发现的可操作地连接至内源性轻链恒定区基因的单个重排的v/j轻链序列相比,单个重排的v/j轻链包含体细胞突变。
[0333]
因此,本发明提供了经遗传修饰的非人动物,连同用于制备该动物的方法和组合物,其中所述遗传修饰包含经改造的dh区和单个重排的轻链基因座,并且其中所述动物还表达经遗传改造的单个重排轻链,例如经改造的共同轻链(ulc),其可与非人动物的组织或细胞中含有由经改造的dh区编码的氨基酸的重链结合。
[0334]
基于在其基因组中经改造的dh区的存在和/或非人动物的组织或细胞中含有由核苷酸编码序列编码的氨基酸的抗体的表达,可鉴定转基因建立者非人动物。转基因建立者非人动物然后可用于育种携带经改造的dh区的另外非人动物,从而产生各自携带经改造的dh区的一个或多个拷贝的一系列非人动物。此外,根据需要,携带经改造的dh区的转基因非人动物还可与携带其它转基因(例如人免疫球蛋白基因)的其它转基因非人动物育种。
[0335]
还可产生转基因非人动物,以含有允许转基因的调控或定向表达的选择系统。示例性系统包括细菌噬菌体p1的cre/loxp重组酶系统(参见例如lakso,m.等人,1992,proc.natl.acad.sci.usa 89:6232-6236)、以及酿酒酵母的flp/frt重组酶系统(o’gorman,s.等人,1991,science 251:1351-1355)。可通过构建“双重”转基因动物来提供此类动物,例如通过使两种转基因动物交配,一种含有包含选择修饰(例如经改造的dh区)的转基因,并且另一种含有编码重组酶(例如cre重组酶)的转基因。
[0336]
本文所述的非人动物可如上所述或使用本领域已知的方法制备,以包含另外的人或人源化基因,经常取决于非人动物的预期用途。此类另外的人或人源化基因的遗传物质可通过进一步改变具有上述遗传修饰的细胞(例如,胚胎干细胞)的基因组,或通过本领域已知的繁育技术利用所需的其他基因修饰品系引入。在一些实施例中,制备本文所述的非人动物以进一步包含转基因人免疫球蛋白重链和轻链基因(参见例如murphy,a.j.等人,(2014)proc.natl.acad.sci.u.s.a.111(14):5153-5158;美国专利号8,502,018;美国专利号8,642,835;美国专利号8,697,940;美国专利号:8,791,323;和美国专利申请公开号2013/0096287 a1;以引用的方式并入本文)。在一些实施例中,制备本文所述的非人动物,以进一步包含一个或多个人免疫球蛋白轻链基因或基因座(例如,转基因的、内源的等),如美国专利申请公开号2011-0195454 a1、2012-0021409 a1、2012-0192300 a1、2013-0045492 a1、2013-0185821 a1、2013-0198880 a1、2013-0302836 a1、2015-0059009 a1;国际专利申请公开号wo 2011/097603、wo 2012/148873、wo 2013/134263、wo 2013/184761、wo 2014/160179、wo 2014/160202中所述;所有这些专利在此以引用的方式并入。
[0337]
在一些实施例中,本文所述的非人动物可通过将如本文所述的靶向载体引入来自经修饰的品系的细胞内来制备。仅举一个例子,如上所述的靶向载体可引入veloci小鼠内。小鼠表达具有完全人可变区和小鼠恒定区的抗体。在一些实施例中,制备本文所述的非人动物,以进一步包含人免疫球蛋白基因(可变区和/或恒定区基因)。在一些实施例中,本文所述的非人动物包含如本文所述的经改造的dh区和
来自异源物种(例如人)的遗传材料,其中所述遗传材料全部或部分编码一个或多个人重链和/或轻链可变区。
[0338]
例如,如本文所述,包含经改造的dh区的非人动物还可包含(例如,经由交叉育种或多重基因靶向策略)一种或多种修饰,如murphy,a.j.等人,(2014)proc.nat l.acad.sci.u.s.a.111(14):5153-5158;美国专利号8,502,018;美国专利号8,642,835;美国专利号8,697,940;美国专利号:8,791,323;美国专利申请公开号2011-0195454 a1、2012-0021409 a1、2012-0192300 a1、2013-0045492 a1、2013-0096287 a1、2013-0185821 a1、2013-0198880 a1、2013-0302836 a1、2015-0059009 a1;国际专利申请公开号wo 2011/097603、wo 2012/148873、wo 2013/134263、wo 2013/184761、wo 2014/160179或wo 2014/160202中所述,所有这些申请以引用的方式全文并入本文。在一些实施例中,将包含如本文所述的经改造的dh区的啮齿类动物与包含人源化的免疫球蛋白重链和/或轻链可变区基因座的啮齿类动物杂交(参见例如美国专利号8,502,018或美国专利号8,642,835;以引用的方式并入本文)。在一些实施例中,将如本文所述的包含经改造的dh区的啮齿类动物与包含人源化的免疫球蛋白轻链基因或基因座的啮齿类动物杂交,如美国专利申请公开号2011-0195454 a1、2012-0021409 a1、2012-0192300 a1、2013-0045492 a1、2013-0185821 a1、2013-0198880 a1、2013-0302836 a1、2015-0059009 a1;国际专利申请公开号wo 2011/097603、wo 2012/148873、wo 2013/134263、wo 2013/184761、wo 2014/160179、wo 2014/160202中所述;所有这些专利在此以引用的方式并入。
[0339]
尽管本文广泛讨论了在小鼠中使用经改造的dh区的实施例(即,具有与人vh和jh基因区段可操作地连接的经改造的dh区的小鼠,所有这些与一个或多个鼠重链恒定区基因可操作地连接),但还提供了包含经改造的dh区的其它非人动物。在一些实施例中,此类非人动物包含与内源性vh和jh基因区段可操作地连接的经改造的dh区。在一些实施例中,此类非人动物包含与人源化的vh和jh基因区段可操作地连接的经改造的dh区。此类非人动物包括可被遗传修饰以表达具有cdr3的抗体的那些中的任一种,所述cdr3包括由对应于如本文公开的目的多肽的一部分的核苷酸编码序列编码的氨基酸,所述非人动物包括例如哺乳动物,例如小鼠、大鼠、兔、猪、牛族动物(例如奶牛、公牛、水牛)、鹿、绵羊、山羊、鸡、猫、狗、雪貂、灵长类动物(例如、绒猴、恒河猴)等。例如,对于那些适当的可经遗传修饰的es细胞不容易获得的非人动物,采用其他方法来制备包含遗传修饰的非人动物。此类方法包括例如修饰非es细胞基因组(例如成纤维细胞或诱导的多能细胞)并利用体细胞核转移(scnt)来将遗传修饰的基因组转移至合适的细胞,例如去核卵母细胞,以及在适于形成胚胎的条件下在非人动物中孕育所述修饰的细胞(例如修饰的卵母细胞)。
[0340]
用于修饰非人动物基因组(例如,猪、奶牛、啮齿类动物、鸡等)的方法包括例如采用锌指核酸酶(zfn)、转录激活物样效应物核酸酶(talen)或cas蛋白(即crispr/cas系统)修饰基因组,以包括如本文所述的经改造的dh区。用于修饰非人动物的种系基因组的方法的指导可在例如美国专利申请公开号2015-0376628 a1、us 2016-0145646 a1和us 2016-0177339 a1中找到;所述专利以引用的方式并入本文。
[0341]
在一些实施例中,本文所述的非人动物是哺乳动物。在一些实施例中,本文所述的非人动物是小型哺乳动物,例如跳鼠总科(dipodoidea)或鼠总科(muroidea)的小型哺乳动物。在一些实施例中,本文所述的经遗传修饰的动物是啮齿类动物。在一些实施例中,本文
所述的啮齿类动物选自小鼠、大鼠和仓鼠。在一些实施例中,本文所述的啮齿类动物选自鼠总科。在一些实施例中,本文所述的经遗传修饰的动物来自选自以下的科:丽仓鼠科(calomyscidae)(例如,鼠样仓鼠)、仓鼠科(cricetidae)(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠科(muridae)(真小鼠和大鼠、沙鼠、棘鼠、冠鼠)、马岛鼠科(nesomyidae)(攀鼠、岩鼠、具尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(platacanthomyidae)(例如多刺睡鼠)和鼹形鼠科(spalacidae)(例如鼹鼠、竹鼠和鼢鼠)。在一些特定实施例中,本文所述的经遗传修饰的啮齿类动物选自真小鼠或大鼠(鼠科)、沙鼠、棘鼠和冠鼠。在一些特定实施例中,本文所述的经遗传修饰的小鼠来自鼠科成员。在一些实施例中,本文所述的非人动物是啮齿类动物。在一些特定实施例中,本文所述的啮齿类动物选自小鼠和大鼠。在一些实施例中,本文所述的非人动物是小鼠。
[0342]
在一些实施例中,本文所述的非人动物是啮齿类动物,其为选自c57bl/a、c57bl/an、c57bl/grfa、c57bl/kalwn、c57bl/6、c57bl/6j、c57bl/6byj、c57bl/6nj、c57bl/10、c57bl/10scsn、c57bl/10cr和c57bl/ola的c57bl品系的小鼠。在一些特定实施例中,本文所述的小鼠是选自其为129p1、129p2、129p3、129x1、129s1(例如129s1/sv、129s1/svim)、129s2、129s4、129s5、129s9/svevh、129/sv jae、129s6(129/svevtac)、129s7、129s8、129t1、129t2(参见例如festing等人,1999,mammalian genome 10:836;auerbach,w.等人,2000,biotechniques 29(5):1024-1028,1030,1032)品系的129品系。在一些特定实施例中,本文所述的经遗传修饰的小鼠是前述129品系和前述c57bl/6品系的混合物。在一些特定实施例中,本文所述的小鼠是前述129品系的混合物、或前述bl/6品系的混合物。在某些实施例中,如本文所述的混合物的129品系为129s6(129/svevtac)品系。在一些实施例中,本文所述的小鼠是balb品系,例如balb/c品系。在一些实施例中,本文所述的小鼠是balb品系和另一种前述品系的混合物。
[0343]
在一些实施例中,本文所述的非人动物是大鼠。在一些特定实施例中,本文所述的大鼠选自wistar大鼠、lea品系、sprague dawley品系、fischer品系、f344、f6和dark agouti。在某些实施例中,本文所述的大鼠品系为选自wistar、lea、sprague dawley、fischer、f344、f6和dark agouti的两个或更多个品系的混合物。
[0344]
采用具有经改造的多样性簇的非人动物的方法
[0345]
已开发了用于生产基于抗体的治疗剂的几种体外和体内技术。特别地,体内技术的特征在于产生含有人免疫球蛋白基因的转基因动物(即啮齿类动物),所述人免疫球蛋白基因随机掺入动物的基因组内(例如参见美国专利号5,569,825)或精确地置于内源性免疫球蛋白基因座处,与动物的内源性免疫球蛋白恒定区可操作地连接(例如参见美国专利号8,502,018;8,642,835;8,697,940;和8,791,323)。这两种方法在生产用于人中使用的有希望的抗体治疗候选物方面均具有成效。进一步地,这两种方法均具有超过体外方法的优点,因为抗体候选物选自体内生成的抗体储库,其包括在宿主的免疫系统的内部环境内对于抗原的亲和力和特异性选择。以这种方式,抗体结合天然存在的抗原(在相关生物表位和表面内),而不是可伴随体外技术的人工环境或计算机芯片预测。尽管从体内技术产生的强大的抗体储库,但针对复合物(例如跨膜多肽)或细胞质抗原的抗体仍是困难的。进一步地,由于免疫耐受性,生成针对在物种(例如,人和小鼠)之间共享高度序列同一性的多肽的抗体仍是挑战。
[0346]
因此,本文尤其描述了以下认识:使用各自编码目的多肽的一部分的一个或多个核苷酸编码序列(即,合成序列)可制备体内系统的构建,所述体内系统的特征在于产生在cdr中具有增加的多样性的抗体,特别是由非传统序列生成的cdr3(即不是传统dh基因区段或自然界中出现的dh基因区段)。这种增加的多样性可指导与特定抗原(例如跨膜多肽)的结合。例如,如本文所述,可通过改造为含有免疫球蛋白重链基因座的非人动物生成阻断一种或多种炎性细胞因子(例如β-趋化因子)的抗体,所述免疫球蛋白重链基因座含有经改造的dh区,所述经改造的dh区包括一个或多个核苷酸编码序列,其各自编码细胞因子受体(例如β-趋化因子受体)的细胞外部分。本文还描述了可通过改造为含有免疫球蛋白重链基因座的非人动物生成阻断或抑制离子通道(例如,nav通道)的活性和/或功能的抗体,所述免疫球蛋白重链基因座含有经改造的dh区,所述经改造的dh区包括一个或多个核苷酸编码序列,其各自编码毒素(例如,μ-芋螺毒素和/或狼蛛毒素)的一部分。在vh基因区段、核苷酸编码序列和jh基因区段重组后,形成重链可变编码序列,其含有具有部分由核苷酸编码序列编码的序列的cdr3区,并且由此指导与核苷酸编码序列相关的特定抗原的结合。
[0347]
本文所述的非人动物可用于制备人抗体,所述人抗体包含源自通过如本文所述的非人动物细胞的遗传材料编码的一个或多个可变区核酸序列的可变结构域。例如,本文所述的非人动物用β-趋化因子(或nav通道多肽,全部或部分)在一定条件下免疫一段时间,所述时间足以使非人动物发展针对所述β-趋化因子(或nav通道多肽,全部或部分)的免疫应答。从非人动物(或者一个或多个细胞,例如一个或多个b细胞)中分离抗体,并且使用各种测定进行表征,所述测定测量例如亲和力、特异性、表位作图、阻断配体-受体相互作用的能力、抑制性受体活化等。在各种实施例中,由本文所述的非人动物产生的抗体包含一个或多个人可变结构域,其源自从非人动物中分离的一个或多个人可变区核苷酸序列。在一些实施例中,抗药物抗体(例如抗独特型抗体)可在本文所述的非人动物中产生。
[0348]
本文所述的非人动物提供了用于产生可用于各种测定的人抗体的改进的体内系统和生物材料(例如细胞)源。在各种实施例中,本文所述的非人动物用于开发靶向一种或多种细胞因子和/或调节细胞因子活性和/或调节与其它结合配偶体(例如细胞因子受体)的细胞因子相互作用的治疗剂。在各种实施例中,本文所述的非人动物用于开发靶向一种或多种离子通道和/或调节离子通道活性和/或调节与其它结合配偶体的离子通道相互作用的治疗剂。在各种实施例中,本文所述的非人动物用于鉴定、筛选和/或开发候选治疗剂(例如抗体、sirna等),所述候选治疗剂结合一种或多种人细胞因子多肽或离子通道(例如钾通道、钙通道或钠通道)。在各种实施例中,本文所述的非人动物用于筛选和开发候选治疗剂(例如抗体、sirna等),所述候选治疗剂阻断一种或多种人β-趋化因子多肽的活性或者阻断一种或多种人电压门控钠(nav)通道的活性。在各种实施例中,本文所述的非人动物用于确定一种或多种人β-趋化因子多肽或者一种或多种人nav通道的拮抗剂和/或激动剂的结合概况。在一些实施例中,本文所述的非人动物用于确定一种或多种候选治疗性抗体的一个或多个表位,所述一种或多种候选治疗性抗体结合一种或多种人β-趋化因子多肽或者结合一种或多种人nav通道。
[0349]
在各种实施例中,本文所述的非人动物用于确定抗β-趋化因子或抗nav抗体的药代动力学概况。在各种实施例中,本文所述的一种或多种非人动物和一种或多种对照或参考非人动物各自暴露于以各种剂量(例如0.1mg/kg、0.2mg/kg、0.3mg/kg、0.4mg/kg、0.5mg/
kg、1mg/kg、2mg/kg、3mg/kg、4mg/kg、5mg/mg、7.5mg/kg、10mg/kg、15mg/kg、20mg/kg、25mg/kg、30mg/kg、40mg/kg、或50mg/kg或更多)的一种或多种候选治疗性抗β-趋化因子或抗nav抗体。候选治疗性抗体可经由各种所需的施用途径(包括肠胃外和非肠胃外施用途径)来给药。肠胃外途径包括例如静脉内、动脉内、门静脉内、肌内、皮下、腹膜内、脊柱内、鞘内、脑室内、颅内、胸膜内或其他注射途径。非肠胃外途径包括例如经服、经鼻、经皮、经肺、经直肠、经颊面、经阴道、经眼。施用还可通过连续输注、局部施用、从植入物(凝胶、膜等)持续释放和/或静脉内注射来进行。在多个时间点(例如0hr、6hr、1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天或最多30或更多天)从非人动物(人源化和对照组)分离血液。可使用得自如文中所述的非人动物的样品进行各种测定以确定施用的候选治疗性抗体的药代动力学性质,包括但不限于总igg、抗-治疗性抗体应答、凝集等。
[0350]
在各种实施例中,本文所述的非人动物用于测量阻断或调节β-趋化因子活性(或β-趋化因子信号转导、或β-趋化因子介导的相互作用)的疗效,以及对基因表达的作用,由于如本文所述的非人动物的细胞变化或细胞的β-趋化因子受体密度。在各种实施例中,本文所述的非人动物或由其分离的细胞暴露于结合人β-趋化因子多肽(或人β-趋化因子多肽的一部分)的候选治疗剂,并且在随后的一段时间后,分析对β-趋化因子依赖性过程(或相互作用),例如配体-受体相互作用或β-趋化因子信号传导的作用。
[0351]
在各种实施例中,本文所述的非人动物用于测量阻断或调节nav通道活性(或nav通道信号传导、或nav介导的相互作用或nav通道动作电位)的疗效,以及对基因表达的作用,由于如本文所述的非人动物的细胞变化或细胞的nav通道密度。在各种实施例中,本文所述的非人动物或由其分离的细胞暴露于结合人nav通道(或人nav通道的一部分)的候选治疗剂,并且在随后的一段时间后,分析对nav通道依赖性过程(或相互作用),例如配体-受体相互作用或nav通道动作电位的作用。
[0352]
在各种实施例中,本文所述的非人动物可用于制备作用于电压门控钠通道(例如nav1.7)的人抗体。此类人抗体可在非人动物中进行测试和/或开发,所述非人动物具有不同于本文所述那种的修饰,例如如美国专利号8,871,996和8,486,647中描述的修饰,所述专利以引用的方式并入本文。
[0353]
本文所述的非人动物表达结合一种或多种β-趋化因子(或nav通道)的抗体,因此可生成细胞、细胞系和细胞培养物,以充当用于结合和功能测定中的抗β-趋化因子(或抗nav)抗体源,例如以测定人β-趋化因子(或nav通道)拮抗剂或激动剂的结合或功能,特别是当拮抗剂或激动剂对于人β-趋化因子序列(或人nav通道序列)或表位特异性,或者可替代地,对于在配体-受体相互作用(结合)中起作用的人β-趋化因子序列(或人nav通道序列)或表位特异性时。在各种实施例中,可使用从本文所述的非人动物中分离的细胞来测定由候选治疗性抗体或sirna结合的β-趋化因子表位(或nav通道表位)。
[0354]
来自本文所述的非人动物的细胞可分离并且在特定目的基础上使用,或者可在培养中维持许多代。在各种实施例中,来自本文所述的非人动物的细胞永生化(例如,经由病毒的使用),并且在培养中(例如,在连续培养中)无限期地维持。
[0355]
本文所述的非人动物提供了用于生成抗体变体的体内系统,所述抗体结合一种或多种β-趋化因子多肽(或nav通道)。此类变体包括具有所需功能性、特异性、与由两种或更多种β-趋化因子多肽(或nav通道)共享的共同表位的低交叉反应性的抗体。在一些实施例
中,本文所述的非人动物用于生成抗体实验对象组,以生成筛选所需或改进功能性的一系列变体抗体。
[0356]
本文所述的非人动物提供了用于生成抗β-趋化因子(或抗nav)抗体文库的体内系统。此类文库提供了重链和轻链可变区序列源,其可基于所需效应子功能移植到不同的fc区上和/或使用本领域已知的技术(例如定点诱变、易错pcr等)用作可变区序列的亲和力成熟的来源。
[0357]
本文所述的非人动物提供了用于分析和测试药物或疫苗的体内系统。在各种实施例中,可将候选药物或疫苗递送至本文所述的一种或多种非人动物,随后监测非人动物,以确定对药物或疫苗的免疫应答、药物或疫苗的安全性概况、或者对疾病或状况和/或疾病或状况的一种或多种症状的作用中的一种或多种。用于确定安全性概况的示例性方法包括测量毒性、最佳剂量浓度、抗体(即抗药物)应答、药物或疫苗的功效以及可能的危险因素。此类药物或疫苗可在此类非人动物中进行改进和/或开发。
[0358]
疫苗功效可以多种方式确定。简言之,使用本领域已知的方法疫苗接种本文所述的非人动物,然后用疫苗攻击或将疫苗施用于已经感染的非人动物。非人动物对疫苗的应答可通过监测人动物(或由其分离的细胞)和/或对非人动物(或由其分离的细胞)执行一种或多种测定来测量,以确定疫苗的功效。然后使用本领域已知的和/或本文所述的一种或多种测量,将非人动物对疫苗的应答与对照动物进行比较。
[0359]
疫苗功效还可通过病毒中和测定来确定。简言之,免疫本文所述的非人动物,并且在免疫后的不同日收集血清。连续稀释的血清与病毒预温育,在此期间血清中对于病毒特异性的抗体将与其结合。然后将病毒/血清混合物加入允许细胞中,以通过噬斑测定或微量中和测定来确定感染性。如果血清中的抗体中和病毒,则存在与对照组相比较少的噬斑或较低的相对荧光素酶单位。
[0360]
本文所述的非人动物提供了用于开发和表征基于抗体的治疗剂的改进的体内系统,所述基于抗体的治疗剂用于癌症和/或炎性疾病中。炎症长期以来已与癌症相关(例如在grivennikov,s.i.等人,2010,cell 140:883-99;rakoff-nahoum,s.,2006,yale j.biol.med.79:123-30中综述)。事实上,发展中的肿瘤环境的特征部分在于各种炎症介质的浸润。此外,持续的炎症可导致发展中的癌症的更高概率。因此,在一些实施例中,本文所述的非人动物提供了用于开发和/或鉴定抗癌和/或抗炎治疗剂的体内系统。在各种实施例中,可用肿瘤(或肿瘤细胞)植入本文所述的非人动物或对照非人动物(例如,具有不同于本文所述的遗传修饰或不具有遗传修饰,即野生型),随后施用一种或多种候选治疗剂。在一些实施例中,候选治疗剂可包括多特异性抗体(例如双特异性抗体)或抗体混合物。在一些实施例中,候选治疗剂包括组合疗法,例如,序贯或同时给药的两种或更多种单特异性抗体的施用。在一种或多种候选治疗剂施用之前,可允许肿瘤在非人动物内的一个或多个位置中建立足够的时间。可在施用候选治疗之前和之后测量肿瘤细胞增殖、生长、存活等。也可根据需要在非人动物中测量候选治疗剂的细胞毒性。
[0361]
本文所述的非人动物提供了用于开发和表征基于抗体的治疗剂的改进的体内系统,所述基于抗体的治疗剂用于治疗疼痛(例如,神经性)或用作止痛剂。在一些实施例中,本文所述的非人动物提供了用于开发和/或鉴定抗疼痛治疗剂的体内系统。在各种实施例中,本文所述的非人动物或对照非人动物(例如具有不同于本文所述的遗传修饰[例如,如
美国专利号8,871,996和8,486,647中所述的修饰;所述专利以引用的方式并入本文]或不具有遗传修饰,即野生型)可经受疼痛刺激(例如切口、化学诱导等;参见例如recognition and alleviation of pain in laboratory animals.washingto n d.c.:national academies press,2009.print),随后施用一种或多种候选治疗剂。在一些实施例中,候选治疗剂可包括多特异性抗体(例如双特异性抗体)或抗体混合物。在一些实施例中,候选治疗剂包括组合疗法,例如,序贯或同时给药的两种或更多种单特异性抗体的施用。在一种或多种候选治疗剂施用之前,可允许足够的时间段。可在用候选治疗剂施用之前和用候选治疗剂施用之后,记录通常与疼痛管理和/或疼痛治疗效果评价相关的各种测量和/或测试。
[0362]
试剂盒
[0363]
本文还描述了包含一个或多个容器的包装或试剂盒,所述一个或多个容器填充有如本文所述的至少一种非人动物、非人细胞、dna片段和/或靶向载体。试剂盒可以用于任何适用的方法(例如,研究方法)。任选地与一个或多个此类容器相关的可以是由政府机构规定形式的注意事项,该注意事项规定药物或生物产品的制造、使用或销售,该注意事项反映了(a)机构关于用于人类施用的制造、使用或销售的批准,(b)使用说明或它们二者,或管理两个或更多个实体之间的材料和/或生物产品(例如,本文所述的非人动物或非人细胞)的转移的合约。
[0364]
所述实施例的其它特点将在示例性实施例的下述描述的过程中将变得显而易见,所述示例性实施例为了说明而给出,并且不预期是其限制。
[0365]
其他实施例如下:
[0366]
1.一种啮齿类动物,其基因组包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的dh区,其中所述经改造的dh区包括一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。
[0367]
2.根据权利要求1所述的啮齿类动物,其中所述免疫球蛋白重链可变区是人免疫球蛋白重链可变区。
[0368]
3.根据权利要求1或2所述的啮齿类动物,其中所述免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。
[0369]
4.根据权利要求3所述的啮齿类动物,其中所述免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。
[0370]
5.根据前述权利要求中任一项所述的啮齿类动物,其中所述目的非免疫球蛋白多肽是趋化因子受体。
[0371]
6.根据权利要求5所述的啮齿类动物,其中所述趋化因子受体是非典型趋化因子受体(ackr)。
[0372]
7.根据权利要求6所述的啮齿类动物,其中所述ackr是d6趋化因子诱饵受体。
[0373]
8.根据权利要求7所述的啮齿类动物,其中所述经改造的dh区包括5、10、15、20、25个或更多个核苷酸序列,所述核苷酸序列各自编码d6趋化因子诱饵受体的细胞外部分。
[0374]
9.根据权利要求8所述的啮齿类动物,其中所述经改造的dh区包括25个核苷酸序列,所述核苷酸序列各自编码d6趋化因子诱饵受体的细胞外部分。
[0375]
10.根据权利要求8或9所述的啮齿类动物,其中所述d6趋化因子诱饵受体的细胞外部分选自n末端区域、细胞外环及其组合。
[0376]
11.根据权利要求9所述的啮齿类动物,其中所述25个核苷酸序列各自编码与表3中出现的序列至少95%相同的序列。
[0377]
12.根据权利要求9所述的啮齿类动物,其中所述25个核苷酸序列各自编码与表3中出现的序列基本上相同的序列。
[0378]
13.根据权利要求9所述的啮齿类动物,其中所述25个核苷酸序列各自编码与表3中出现的序列相同的序列。
[0379]
14.根据前述权利要求中任一项所述的啮齿类动物,其中所述一个或多个核苷酸序列包含增加所述一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。
[0380]
15.根据权利要求1-4中任一项所述的啮齿类动物,其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。
[0381]
16.根据权利要求15所述的啮齿类动物,其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
[0382]
17.根据权利要求16所述的啮齿类动物,其中所述芋螺毒素是μ-芋螺毒素。
[0383]
18.根据权利要求17所述的啮齿类动物,其中所述经改造的dh区包括5、10、15、20、25个或更多个核苷酸序列,其各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
[0384]
19.根据权利要求18所述的啮齿类动物,其中所述经改造的dh区包括26个核苷酸序列,其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
[0385]
20.根据权利要求19所述的啮齿类动物,其中所述26个核苷酸序列各自编码与表4中出现的序列至少95%相同的序列。
[0386]
21.根据权利要求19所述的啮齿类动物,其中所述26个核苷酸序列各自编码与表4中出现的序列基本上相同的序列。
[0387]
22.根据权利要求19所述的啮齿类动物,其中所述26个核苷酸序列各自编码与表4中出现的序列相同的序列。
[0388]
23.根据权利要求15-22中任一项所述的啮齿类动物,其中所述一个或多个核苷酸序列包含增加所述一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。
[0389]
24.根据前述权利要求中任一项所述的啮齿类动物,其中所述经改造的dh区还包括侧接所述一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
[0390]
25.根据权利要求24所述的啮齿类动物,其中所述第一重组信号序列包含与图2中出现的第一重组信号序列至少95%相同的序列。
[0391]
26.根据权利要求24所述的啮齿类动物,其中所述第一重组信号序列包含与图2中出现的第一重组信号序列基本上相同的序列。
[0392]
27.根据权利要求24所述的啮齿类动物,其中所述第一重组信号序列包含与图2中出现的第一重组信号序列相同的序列。
[0393]
28.根据权利要求24所述的啮齿类动物,其中所述第二重组信号序列包含与图2中出现的第二重组信号序列至少95%相同的序列。
[0394]
29.根据权利要求24所述的啮齿类动物,其中所述第二重组信号序列包含与图2中出现的第二重组信号序列基本上相同的序列。
[0395]
30.根据权利要求24所述的啮齿类动物,其中所述第二重组信号序列包含与图2中出现的第二重组信号序列相同的序列。
[0396]
31.根据权利要求24所述的啮齿类动物,其中所述第一重组信号序列和第二重组信号序列选自图2。
[0397]
32.根据前述权利要求中任一项所述的啮齿类动物,其中所述啮齿类动物的基因组缺乏一个或多个野生型内源性dh基因区段。
[0398]
33.根据前述权利要求中任一项所述的啮齿类动物,其中所述啮齿类动物的基因组缺乏一个或多个野生型内源性重组信号序列。
[0399]
34.根据权利要求1-33中任一项所述的啮齿类动物,其中所述啮齿类动物是大鼠或小鼠。
[0400]
35.一种分离的啮齿类动物细胞或组织,其基因组包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的dh区,其中所述经改造的dh区包括一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。
[0401]
36.一种永生化细胞,其由根据权利要求35所述的分离的啮齿类动物细胞制备。
[0402]
37.一种啮齿类动物胚胎干细胞,其基因组包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的dh区,其中所述经改造的dh区包括一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。
[0403]
38.一种啮齿类动物胚胎,其由根据权利要求37所述的啮齿类动物胚胎干细胞生成。
[0404]
39.一种制备啮齿类动物的方法,所述啮齿类动物的基因组含有免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的dh区,所述方法包括
[0405]
(a)将dna片段插入啮齿类动物胚胎干细胞内,所述dna片段包含一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分;
[0406]
(b)获得(a)中生成的所述啮齿类动物胚胎干细胞;和
[0407]
(c)使用(b)的胚胎干细胞产生啮齿类动物。
[0408]
40.根据权利要求39所述的方法,其中所述目的非免疫球蛋白多肽是趋化因子受体。
[0409]
41.根据权利要求40所述的方法,其中所述趋化因子受体是非典型趋化因子受体(ackr)。
[0410]
42.根据权利要求41所述的方法,其中所述ackr是d6趋化因子诱饵受体。
[0411]
43.根据权利要求42所述的方法,其中所述dna片段包括5、10、15、20、25个或更多个核苷酸序列,所述核苷酸序列各自编码d6趋化因子诱饵受体的细胞外部分。
[0412]
44.根据权利要求43所述的方法,其中所述dna片段包括25个核苷酸序列,所述25个核苷酸序列各自编码d6趋化因子诱饵受体的细胞外部分。
[0413]
45.根据权利要求43或44所述的方法,其中所述d6趋化因子诱饵受体的细胞外部分选自n末端区域、细胞外环及其组合。
[0414]
46.根据权利要求39所述的方法,其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。
[0415]
47.根据权利要求46所述的方法,其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
[0416]
48.根据权利要求47所述的方法,其中所述芋螺毒素是μ-芋螺毒素。
[0417]
49.根据权利要求48所述的方法,其中所述dna片段包括5、10、15、20、25个或更多个核苷酸序列,所述核苷酸序列各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
[0418]
50.根据权利要求49所述的方法,其中所述dna片段包括26个核苷酸序列,所述26个核苷酸序列各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
[0419]
51.根据权利要求44或50所述的方法,其中所述dna片段还包含侧接所述25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
[0420]
52.一种制备啮齿类动物的方法,所述啮齿类动物的基因组含有免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的dh区,所述方法包括
[0421]
修饰所述啮齿类动物的基因组,使得它包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的dh区,所述经改造的dh区包含一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分,由此制备所述啮齿类动物。
[0422]
53.根据权利要求52所述的方法,其中所述目的非免疫球蛋白多肽是趋化因子受体。
[0423]
54.根据权利要求53所述的方法,其中所述趋化因子受体是非典型趋化因子受体(ackr)。
[0424]
55.根据权利要求54所述的方法,其中所述ackr是d6趋化因子诱饵受体。
[0425]
56.根据权利要求55所述的方法,其中所述啮齿类动物的基因组被修饰为包括5、10、15、20、25个或更多个核苷酸序列,所述核苷酸序列各自编码d6趋化因子诱饵受体的细胞外部分。
[0426]
57.根据权利要求56所述的方法,其中所述啮齿类动物的基因组被修饰为包括25个核苷酸序列,所述25个核苷酸序列各自编码d6趋化因子诱饵受体的细胞外部分。
[0427]
58.根据权利要求56或57所述的方法,其中所述d6趋化因子诱饵受体的细胞外部分选自n末端区域、细胞外环及其组合。
[0428]
59.根据权利要求52所述的方法,其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。
[0429]
60.根据权利要求59所述的方法,其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
[0430]
61.根据权利要求60所述的方法,其中所述芋螺毒素是μ-芋螺毒素。
[0431]
62.根据权利要求61所述的方法,其中所述啮齿类动物的基因组被修饰为包括5、10、15、20、25个或更多个核苷酸序列,其各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
[0432]
63.根据权利要求62所述的方法,其中所述啮齿类动物的基因组被修饰为包括26个核苷酸序列,其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
[0433]
64.根据权利要求57或63所述的方法,其中所述啮齿类动物的基因组被修饰为还包括侧接所述25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
[0434]
65.根据权利要求39-64中任一项所述的方法,其中所述免疫球蛋白重链可变区是人免疫球蛋白重链可变区。
[0435]
66.根据权利要求39-64中任一项所述的方法,其中所述免疫球蛋白重链可变区可
操作地连接至免疫球蛋白重链恒定区。
[0436]
67.根据权利要求66所述的方法,其中所述免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。
[0437]
68.一种在啮齿类动物中产生抗体的方法,所述方法包括以下步骤:
[0438]
(a)用抗原免疫啮齿类动物,所述啮齿类动物具有包含免疫球蛋白重链可变区的基因组,所述免疫球蛋白重链可变区包括经改造的dh区,其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分;
[0439]
(b)将所述啮齿类动物维持在足以使所述啮齿类动物对所述抗原产生免疫应答的条件下;和
[0440]
(c)从所述啮齿类动物或啮齿类动物细胞中回收结合所述抗原的抗体。
[0441]
69.根据权利要求68所述的方法,其中所述啮齿类动物细胞是b细胞。
[0442]
70.根据权利要求68所述的方法,其中所述啮齿类动物细胞是杂交瘤。
[0443]
71.根据权利要求68-70中任一项所述的方法,其中所述目的非免疫球蛋白多肽是趋化因子受体。
[0444]
72.根据权利要求71所述的方法,其中所述趋化因子受体是非典型趋化因子受体(ackr)。
[0445]
73.根据权利要求72所述的方法,其中所述ackr是d6趋化因子诱饵受体。
[0446]
74.根据权利要求73所述的方法,其中所述经改造的dh区包括5、10、15、20、25个或更多个核苷酸序列,其各自编码d6趋化因子诱饵受体的细胞外部分。
[0447]
75.根据权利要求74所述的方法,其中所述经改造的dh区包括25个核苷酸序列,其各自编码d6趋化因子诱饵受体的细胞外部分。
[0448]
76.根据权利要求74或75所述的方法,其中所述d6趋化因子诱饵受体的细胞外部分选自n末端区域、细胞外环及其组合。
[0449]
77.根据权利要求68-70中任一项所述的方法,其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。
[0450]
78.根据权利要求77所述的方法,其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
[0451]
79.根据权利要求78所述的方法,其中所述芋螺毒素是μ-芋螺毒素。
[0452]
80.根据权利要求79所述的方法,其中所述经改造的dh区包括5、10、15、20、25个或更多个核苷酸序列,其各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
[0453]
81.根据权利要求80所述的方法,其中所述经改造的dh区包括26个核苷酸序列,其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
[0454]
82.根据权利要求75或81所述的方法,其中所述经改造的dh区还包含侧接所述25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
[0455]
83.根据权利要求68-82中任一项所述的方法,其中所述免疫球蛋白重链可变区是人免疫球蛋白重链可变区。
[0456]
84.根据权利要求68-83中任一项所述的方法,其中所述免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。
[0457]
85.根据权利要求84所述的方法,其中所述免疫球蛋白重链恒定区是内源性免疫
球蛋白重链恒定区。
[0458]
86.根据权利要求39-85中任一项所述的方法,其中所述啮齿类动物是大鼠或小鼠。
[0459]
87.一种啮齿类动物,其基因组包含
[0460]
人免疫球蛋白重链可变区,所述人免疫球蛋白重链可变区包含一个或多个人vh基因区段、经改造的dh区和一个或多个人jh基因区段,所述经改造的dh区包括
[0461]
(i)各自编码非典型趋化因子受体(ackr)的细胞外部分的一个或多个核苷酸序列;和
[0462]
(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列;
[0463]
其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白恒定区基因,使得所述啮齿类动物的特征在于当它用抗原免疫时,它生成的抗体包含由所述一个或多个人vh基因区段编码的人重链可变结构域、经改造的dh区、以及可操作地连接至由一个或多个内源性免疫球蛋白恒定区基因编码的啮齿类动物重链恒定结构域的一个或多个人jh基因区段,并且其中所述抗体显示与所述抗原的特异性结合。
[0464]
88.根据权利要求87所述的啮齿类动物,其中所述ackr是d6趋化因子诱饵受体。
[0465]
89.根据权利要求88所述的啮齿类动物,其中所述经改造的dh区包括25个核苷酸序列,所述核苷酸序列各自编码d6趋化因子诱饵受体的细胞外部分。
[0466]
90.根据权利要求89所述的啮齿类动物,其中所述d6趋化因子诱饵受体的细胞外部分选自n末端区域、细胞外环及其组合。
[0467]
91.一种啮齿类动物,其基因组包含
[0468]
人免疫球蛋白重链可变区,所述人免疫球蛋白重链可变区包含一个或多个人vh基因区段、经改造的dh区和一个或多个人jh基因区段,所述经改造的dh区包括
[0469]
(i)各自编码毒素的一部分的一个或多个核苷酸序列;和
[0470]
(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列;
[0471]
其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白恒定区基因,使得所述啮齿类动物的特征在于当它用抗原免疫时,它生成的抗体包含由所述一个或多个人vh基因区段编码的人重链可变结构域、经改造的dh区、以及可操作地连接至由一个或多个内源性免疫球蛋白恒定区基因编码的啮齿类动物重链恒定结构域的一个或多个人jh基因区段,并且其中所述抗体显示与所述抗原的特异性结合。
[0472]
92.根据权利要求91所述的啮齿类动物,其中所述一个或多个核苷酸序列各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
[0473]
93.根据权利要求92所述的啮齿类动物,其中所述经改造的dh区包括26个核苷酸序列,其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
[0474]
94.根据权利要求87或91所述的啮齿类动物,其中所述一个或多个核苷酸序列包含增加所述一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。
[0475]
95.根据权利要求87-94中任一项所述的啮齿类动物,其还包含将一个或多个人v
l
基因区段和一个或多个人j
l
基因区段插入内源性轻链基因座内。
[0476]
96.根据权利要求95所述的啮齿类动物,其中所述人v
l
和j
l
区段是vκ和jκ基因区段,并且插入内源性κ轻链基因座内。
[0477]
97.根据权利要求96所述的啮齿类动物,其中所述人vκ和jκ基因区段与啮齿类动物cκ基因可操作地连接。
[0478]
98.根据权利要求95所述的啮齿类动物,其中所述人v
l
和j
l
区段是vλ和jλ基因区段,并且插入内源性λ轻链基因座内。
[0479]
99.根据权利要求98所述的啮齿类动物,其中所述人vλ和jλ基因区段与啮齿类动物cλ基因可操作地连接。
[0480]
100.根据权利要求87-99中任一项所述的啮齿类动物,其中所述啮齿类动物是大鼠或小鼠。
[0481]
实例
[0482]
提供下述实例以便向本领域普通技术人员描述如何制备和使用本文公开的方法和组合物,并且不预期限制发明人视为其发明的范围。除非另外指明,否则所给出的温度为摄氏度,压力是大气压或接近大气压。
[0483]
实例1.经改造的多样性簇的构建,所述经改造的多样性簇包括在免疫球蛋白重链可变区内的d6趋化因子诱饵受体的核苷酸编码序列
[0484]
本实例示出了构建用于插入非人动物如啮齿类动物(例如小鼠)的基因组内的靶向载体的示例性方法。特别地,本实例中描述的方法证实了用于插入啮齿类动物(例如小鼠)胚胎干(es)细胞的基因组内的靶向载体的产生,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的重链多样性(dh)区,所述经改造的dh区包括各自编码非免疫球蛋白多肽或其一部分的一个或多个核苷酸序列。在本实例中,非典型趋化因子受体(ackr)例如d6趋化因子诱饵受体的细胞外结构域的编码序列,用于构建用于整合到免疫球蛋白重链可变区内的靶向载体。如下所述,将编码序列置于与重链可变(vh)和重链连接(jh)区段的可操作地连接中,代替传统dh基因区段,使得在vdj重组后,表达具有由编码序列生成的v
h cdr3的抗体。
[0485]
使用技术(参见例如美国专利号6,586,251和valenzuela等人,2003,nature biotech.21(6):652-659;以引用的方式并入本文)和本领域已知的分子生物学技术,产生含有来自d6趋化因子诱饵受体的细胞外结构域的编码序列的靶向载体,所述编码序列用于插入免疫球蛋白重链可变区内。根据需要,本实例中描述的方法可用于利用源自任何所需多肽的编码序列的任何集合、或编码序列(或编码序列片段)的组合。在图3和4中阐述了使用来自d6趋化因子诱饵受体的细胞外结构域的编码序列,用于构建靶向载体的可替代和非限制性的示例性策略。
[0486]
简言之,通过从头ddna合成制备一系列四种dna片段(d
6-dh1116、d
6-dh17613、d
6-dh114619和d6dh120126),所述dna片段各自含有几个d6编码序列(表5;blue heron biotech,bothell,wa))。在每种dna片段的末端处包括各种限制性酶位点和/或重叠区(~40bp,其包括多重限制性酶位点),以允许随后的串联克隆(参见下文)。单个人dh区段(即dh6-25)在dh区中保持完整,所述dh区改造为含有对应于d6诱饵趋化因子受体的细胞外结构域一部分的核苷酸编码序列。在一些实施例中,免疫球蛋白基因区段(例如dh区段)可与亚最佳或缺陷的重组信号序列(例如七聚体和/或九聚体序列)结合,使得此类dh区段的使用
基本上小于与表征为野生型、正常和/或无缺陷的重组信号序列结合的dh区段的使用。因此,当改造dh区以含有各自编码目的非免疫球蛋白多肽或其一部分(例如,d6趋化因子诱饵受体)的核苷酸编码序列时,此类dh区段(例如图2中显示的dh6-25,rss序列)可保持完整或缺失。
[0487]
免疫球蛋白参与称为体细胞超突变的细胞机制,其产生特征在于对其靶的高亲和力的亲和力成熟的抗体变体。尽管体细胞超突变在很大程度上在抗体可变区的cdr内发生,但突变优先靶向称为热点的某些序列基序,例如rgyw活化诱导胞苷脱氨酶(aid)热点(参见例如li,z.等人,2004,genes dev.18:1-11;teng,g.和f.n.papavasiliou,2007,annu.rev.genet.41:107-20;在此以引用的方式并入)。每个d6编码序列的核酸序列天然含有此类热点序列,然而,将人工热点引入选择的d6编码序列内,以优化在b细胞受体的克隆选择期间的体细胞超突变的潜力。在从头合成之前,将用于shm的人工热点引入计算机芯片上的d6编码序列内。图1阐述了本文所述的d6编码序列中采用的天然和人工热点的示例性分析。
[0488]
v(d)j重组由称为重组信号序列(rss)的侧翼dna序列引导,所述侧翼dna序列确保在相对于v、d和j编码序列的精确位置处的dna重排。每个rss由以下组成:与编码序列邻接的七个核苷酸(七聚体)的保守嵌段,随后为非保守的间隔物(12或23bp)和九个核苷酸(九聚体)的第二保守嵌段。每个d6编码序列都设计有优化的rss,以允许更好的重组频率和相等的使用。简言之,d
h rss序列中的所有七聚体和九聚体都替换为共有序列(图2)。修复非功能性“仅orf”dh区段的rss序列,以允许与d6编码序列一起使用。如本文所述,“仅orf”是包括编码序列的dh区段,所述编码序列可在至少一个开放读码框中翻译,但具有至少一个非功能性rss序列(不被rag重组酶识别)。本发明人认识到,优化的七聚体和九聚体无法确保所有的d6编码序列都以相等的频率使用,至少部分是由于来自间隔物、编码末端序列、侧翼基因间序列等的不可预测的影响。如上文对于体细胞超突变热点所述,在d6 dna片段的从头合成之前,在计算机芯片上设计优化的rss。
[0489]
制备d6 dna片段用于串联装配在一起,采用设计到每个片段内的限制性酶位点和重叠区。通过使用agei和ecori的限制性消化,制备d6-dh1166片段和携带新霉素盒的质粒用于连接(图3a,上)。根据制造商的说明书,使用dna连接酶将agei/ecori消化的质粒和d6-dh1166片段连接在一起。用snabi消化连接产物和剩余的d6dna片段。将bac载体(pbace3.6)分别用noti和asci消化,以接受d6 dna片段(图3a,中)。如先前所述,使用一步等温装配来装配d6-dh1166/新霉素盒连接产物和剩余的d6 dna片段(图3a,下;barnes,w.m.,1994,proc.natl.acad.sci.91(6):2216-20;gibson,d.g.等人,2009,nat.methods 6(5):343-5;gibson,d.g.等人,2010,nat.methods 7(11):901-3)。然后将装配的d6 dna片段(图3b,上)用pi-scei和i-ceui消化,并且经由相容性末端,与含有5'和3'同源臂的bac克隆连接在一起,所述5'和3'同源臂分别含有~50kb的人可变区基因组dna和人jh簇(图3b,中)。最终的靶向载体从5'到3'含有~50kb的5'同源臂(其含有人可变区dna)、新霉素盒、含有d6趋化因子诱饵受体的25个细胞外编码序列的~41kb dna片段、人jh簇、小鼠重链内含子增强子(ei)、小鼠igm恒定区基因和lox位点(图3b,下)。
[0490]
可替代地,上述d6 dna片段可通过使用分子技术来装配,所述分子技术不同于上述那些,仍为本领域已知的。例如,因为d6 dna片段串联排列,所以根据需要通过使用设计
到片段末端内的不同限制性位点/重叠区,可实现各种不同的设计(例如编码序列的次序)。图4a和4b中阐述了通过序贯连接装配上述d6 dna片段的示例性替代方法。
[0491]
将上述d6-dh靶向载体引入小鼠胚胎干(es)细胞内,用于产生含有免疫球蛋白重链基因座的经修饰的es细胞,所述免疫球蛋白重链基因座含有经改造的多样性簇,例如经改造的dh区。
[0492]
表5
[0493]
[0494][0495]
实例2.具有经改造的多样性簇的啮齿类动物的生成,所述经改造的多样性簇包括在免疫球蛋白重链可变区内的d6趋化因子诱饵受体的核苷酸编码序列
[0496]
本实例证实了其基因组包含免疫球蛋白重链可变区的非人动物(例如啮齿类动物)的产生,所述免疫球蛋白重链可变区包括经改造的重链多样性(dh)区,其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码非免疫球蛋白多肽的一部分,特别是非典型趋化因子受体(ackr),例如d6趋化因子诱饵受体的细胞外部分。
[0497]
通过使用表6中阐述的引物的测序和在靶向载体的构建自始至终的聚合酶链反应,证实了实例1中描述的d6-dh靶向载体的正确装配和d6 dna片段靶向插入bac dna的多样性簇内。然后经由电穿孔,将通过聚合酶链反应证实的靶向bac dna引入f1杂种(129s6svevtac/c57bl6ntac)小鼠胚胎干(es)细胞内,随后为在选择培养基中的培养。用于电穿孔的es细胞具有基因组,其包括与啮齿类动物免疫球蛋白重链恒定区(例如igm)可操作地连接的人vh和jh基因区段,缺少人dh区的全部或部分(即缺失),并且含有编码一种或多种鼠adam6基因的插入序列(参见例如美国专利号8,642,835和8,697,940)。如先前所述(valenzuela等人,同上;frendewey,d.等人,2010,methods enzymol.476:295-307),使用检测d6编码序列正确整合到免疫球蛋白可变区的多样性簇内的引物/探针组(表7[f:正向引物,p:探针,r:反向引物]和图5),在电穿孔后10天挑选抗药性集落,并且通过和核型分型筛选正确靶向。
[0498]
使用方法(dechiara,t.m.等人,2010,methods enzymol.476:285-294;dechiara,t.m.,2009,methods mol.biol.530:311-324;poueymirou等人,2007,nat.biotechnol.25:91-99),其中将靶向es细胞注射到未压实的8细胞期swiss webster胚胎内,以产生健康的完全es细胞来源的f0代小鼠,其对于经改造的dh区是杂合的并且表达含有重链可变区的抗体,所述重链可变区包括由d6编码序列的重组生成的cdr3区。将f0代杂合子雄性与c57bl6/ntac雌性杂交,以生成f1杂合体,所述f1杂合体互交,以产生f2代纯合体和野生型小鼠用于表型分析。
[0499]
药物选择盒可任选通过随后添加重组酶(例如通过cre处理)或通过与cre缺失者小鼠品系育种(参见例如国际专利申请公开号wo 2009/114400)来去除,以便去除通过靶向构建体引入的任何loxed选择的盒,所述loxed选择的盒例如在es细胞期时或在胚胎中未被去除。任选地,选择盒保留在小鼠中。
[0500]
总之,本实例示出了其基因组包含免疫球蛋白重链可变区的啮齿类动物(例如小鼠)的生成,所述免疫球蛋白重链可变区包括经改造的重链多样性(dh)区,所述经改造的dh区的特征在于包括一个或多个核苷酸序列,其各自编码非典型趋化因子受体(ackr),例如d6趋化因子诱饵受体的细胞外部分。本文所述的用于将d6编码序列插入传统dh区段内的策略使得能够构建表达多种抗体的啮齿类动物,所述抗体各自包含由d6编码序列的重组生成的重链cdr3。利用人vh和jh区段的存在,本文所述的啮齿类动物提供了用于产生基于人抗体的治疗剂的体内系统,所述基于人抗体的治疗剂的特征在于结合一种或多种ccl的多样性,并且在一些实施例中,提供了用于人使用的基于抗体的消炎药。
[0501]
表6
[0502]
[0503][0504]
表7
[0505]
[0506]
[0507]
[0508][0509]
实例3.经改造的多样性簇的构建,所述经改造的多样性簇包括在免疫球蛋白重链可变区内的一种或多种毒素肽的核苷酸编码序列
[0510]
本实例示出了构建用于插入非人动物如啮齿类动物(例如小鼠)的基因组内的靶向载体的示例性方法。特别地,本实例中描述的方法证实了用于插入啮齿类动物(例如小鼠)胚胎干(es)细胞的基因组内的靶向载体的产生,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的重链多样性(dh)区,所述经改造的dh区包括各自编码非免疫球蛋白多肽的一部分的一个或多个核苷酸序列。在本实例中,两种毒素(例如芋螺毒素,例如μ-芋螺毒素和狼蛛毒素,例如protxii)的编码序列,用于构建用于整合到免疫球蛋白重链可变区内的靶向载体。如下所述,将编码序列置于与重链可变(vh)和重链连接(jh)区段的可操作地连接中,代替传统dh基因区段,使得在vdj重组后,表达具有由编码序列生成的cdr3的抗体。
[0511]
如上文实例1中所述,产生含有来自μ-芋螺毒素和狼蛛毒素(例如protxii)的编码序列的靶向载体,所述编码序列用于插入免疫球蛋白重链可变区内。根据需要,本文所述的方法可用于利用源自任何所需芋螺毒素(例如α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素和/或ω-芋螺毒素)、狼蛛毒素(例如protxi、protxii、虎纹捕鸟蛛毒素-iv[hwtx-iv]等)的编码序列的任何集合、或编码序列(或编码序列片段)的组合。在图7a和7b中阐述了使用来自μ-芋螺毒素和狼蛛毒素的编码序列用于构建靶向载体的示例性策略。
[0512]
简言之,通过从头dna合成制备一系列四种dna片段,所述dna片段各自含有几个μ-芋螺毒素(μctx)和狼蛛毒素(protxii)编码序列(表8;blue heron biotech,bothell,wa)。实例1中所述,在每种dna片段的末端处包括各种限制性酶位点和/或重叠区,以允许随后的串联克隆。总共26个毒素编码序列用于构建经改造的dh区,其包括整个dh编码序列的替换和插入dh编码序列内(即,仅部分替换dh)。用相应的毒素编码序列在dh位置1-26、2-2、2-8、2-15、2-21、3-3、3-9、3-10、3-16和3-22处进行毒素编码序列的插入,而用毒素编码序列替换dh序列在dh位置1-1、1-7、1-14、1-20、4-4、4-11、4-17、4-23、5-5、5-12、5-18、5-24、6-6、6-13、6-19和6-25处进行(参见表8)。在插入的情况下,将毒素序列插入开放读码框二(orf2)中,并且侧翼为dh共有序列(例如参见图2)。保留天然侧翼dh序列提供天然的柔性接头序列和/或使用dh2区段中的二硫键来环化编码的毒素肽。与实例1中描述的使用d6编码序列构建的经改造的dh区相比,在构建包括毒素编码序列的dh区中,dh6-25被替换为全长μctx kiiia(μctx-kiiia fl;seq id no:228,参见表8)。
[0513]
如实例1中所述,每个毒素编码序列的核酸序列天然含有此类热点序列,然而,在
从头合成之前,在计算机芯片上将人工热点引入选择的毒素编码序列内,以优化在b细胞受体的克隆选择期间的体细胞超突变的潜力(参见图6a-6l)。进一步地,在从头合成之前,每个毒素编码序列在计算机芯片上设计有优化的rss,以允许更好的重组频率和相等的使用(图2)。如实例1所述制备毒素dna片段的装配(参见图7a和7b)。
[0514]
可替代地,上述毒素dna片段可通过使用分子技术来装配,所述分子技术不同于上述那些,仍为本领域已知的。例如,因为毒素dna片段串联排列,所以根据需要通过使用设计到片段末端内的不同限制性位点/重叠区,可实现各种不同的设计(例如编码序列的次序)。图8a和8b中阐述了通过序贯连接装配上述毒素dna片段的示例性替代方法。
[0515]
将上述tx-dh靶向载体引入小鼠胚胎干(es)细胞内,用于产生含有免疫球蛋白重链基因座的经修饰的es细胞,所述免疫球蛋白重链基因座含有经改造的多样性簇。
[0516]
表8
[0517]
[0518][0519][0520]
实例4.具有经改造的多样性簇的啮齿类动物的生成,所述经改造的多样性簇包括在免疫球蛋白重链可变区内的一种或多种毒素肽的核苷酸编码序列
[0521]
本实例证实了其基因组包含免疫球蛋白重链可变区的非人动物(例如啮齿类动物)的产生,所述免疫球蛋白重链可变区包括经改造的重链多样性(h)区,其中所述经改造的h区包括一个或多个核苷酸序列,其各自编码非免疫球蛋白多肽的一部分,特别是毒素,例如芋螺毒素(例如μ-芋螺毒素)、狼蛛毒素(例如protxii)或其组合。
[0522]
通过使用表6中阐述的引物的测序和在靶向载体的构建自始至终的聚合酶链反应,证实了实例3中描述的tx-dh靶向载体的正确装配和毒素dna片段靶向插入bac dna的多样性簇内。然后经由电穿孔,将通过聚合酶链反应证实的靶向bac dna引入f1杂种(129s6svevtac/c57bl6ntac)小鼠胚胎干(es)细胞内,随后为在选择培养基中的培养。用于电穿孔的es细胞具有基因组,其包括与啮齿类动物免疫球蛋白重链恒定区(例如igm)可操作地连接的人vh和jh基因区段,缺少人dh区(即缺失),并且含有编码一种或多种鼠adam6基因的插入序列(参见例如美国专利号8,642,835和8,697,940)。如先前所述(valenzuela等人,同上;frendewey,d.等人,2010,methods enzymol.476:295-307),使用检测毒素编码序列正确整合到免疫球蛋白可变区的多样性簇内的引物/探针组(表7和图5),在电穿孔后10天挑选抗药性集落,并且通过和核型分型筛选正确靶向。
[0523]
使用方法(dechiara,t.m.等人,2010,methods enzymol.476:285-294;dechiara,t.m.,2009,methods mol.biol.530:311-324;poueymirou等人,2007,nat.biotechnol.25:91-99),其中将靶向es细胞注射到未压实的8细胞期swiss webster胚胎内,以产生健康的完全es细胞来源的f0代小鼠,其对于经改造的dh区是杂合的并且表达含有重链可变区的抗体,所述重链可变区包括由毒素编码序列的重组生成的cdr3区。将f0代杂合子雄性与c57bl6/ntac雌性杂交,以生成f1杂合体,所述f1杂合体互交,以产生f2代纯合体和野生型小鼠用于表型分析。
[0524]
药物选择盒可任选通过随后添加重组酶(例如通过cre处理)或通过与cre缺失者小鼠品系育种(参见例如国际专利申请公开号wo 2009/114400)来去除,以便去除通过靶向构建体引入的任何loxed选择的盒,所述loxed选择的盒例如在es细胞期时或在胚胎中未被去除。任选地,选择盒保留在小鼠中。
[0525]
总之,本实例示出了其基因组包含免疫球蛋白重链可变区的啮齿类动物(例如小鼠)的生成,所述免疫球蛋白重链可变区包括经改造的重链多样性(dh)区,所述经改造的dh区的特征在于包括一个或多个核苷酸序列,其各自编码毒素肽的一部分,例如μ-芋螺毒素、protxii或其组合。本文所述的用于将毒素编码序列插入传统dh区段内的策略使得能够构建表达抗体的啮齿类动物,所述抗体被配置为使得它们含有由毒素编码序列的重组生成的重链cdr3。利用人vh和jh区段的存在,本文所述的啮齿类动物提供了用于产生基于人抗体的治疗剂的体内系统,所述基于人抗体的治疗剂的特征在于指导与离子通道(例如电压门控钠通道,例如nav1.7)结合的多样性,并且在一些实施例中,提供了用于人使用的基于抗体的抗疼痛药物。
[0526]
实例5.具有经改造的多样性簇的啮齿类动物的表型评价
[0527]
本实例证实了其基因组包含免疫球蛋白重链可变区的啮齿类动物(例如小鼠)中的各种免疫细胞群的表征,所述免疫球蛋白重链可变区包括经改造的重链多样性(dh)区,其中所述经改造的dh区包括一个或多个核苷酸序列,其各自编码非免疫球蛋白多肽的一部分。在本实例中,如实例3中所述的对于包括毒素编码序列(例如μ-芋螺毒素和狼蛛毒素)的
经改造的dh区纯合的啮齿类动物,通过流式细胞术进行分析,用于鉴定在收获的脾和骨髓中的免疫细胞,使用几种荧光标记的抗体。本实例还证实了对于经改造的dh区杂合的小鼠所收获的脾和骨髓中的免疫细胞的鉴定,所述经改造的dh区如实例1中所述包括ackr2(也称为d6趋化因子诱饵受体)的细胞外部分的编码序列。如下文所述,与对照经改造的小鼠相比,如本文所述含有经改造的dh区的小鼠证实在脾和骨髓区室中相似水平的b细胞。重要的是,本实例还证实,如本文所述的含有经改造的dh区的小鼠证实b细胞的发育和成熟不含b细胞免疫应答中的任何缺陷或不足,并且产生含有由插入的编码序列重排生成的cdr3区和相邻的免疫球蛋白基因区段(即人vh和jh)的抗体。
[0528]
简言之,从小鼠(n=3,26%c57bl/6 22%129s6/svevtac 50%balb/canntac;参见例如美国专利号8,502,018和8,642,835)和6579ho/1293ho小鼠(“tx-d
h ho”,n=3;38%c57bl/6ntac 36%129s6/svevtac 25%balb/can ntac;对于免疫球蛋白重链基因座纯合的小鼠,所述免疫球蛋白重链基因座含有多个人vh,代替传统dh区段的包括毒素编码序列的经改造的dh区段,以及可操作地连接至包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区的jh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];并且对于免疫球蛋白κ轻链基因座纯合,所述免疫球蛋白κ轻链基因座含有可操作地连接至包括啮齿类动物κ轻链增强子的啮齿类动物cκ区基因的人vκ和jκ基因区段)中收获脾和股骨。通过离心从股骨中收集骨髓。用ack裂解缓冲液(gibco)裂解来自脾和骨髓制备物的红血细胞,随后用含2%fbs的1xpbs洗涤。将分离的细胞(1x106)与选择的抗体混合物在 4℃下温育30分钟:染色1:大鼠抗小鼠cd43-fitc(biolegend 121206,克隆1b11),大鼠抗小鼠c-kit-pe(biolegend 105808,克隆2b8),大鼠抗小鼠igm-pecy(ebiosciences 25-5790-82,克隆ii/41),大鼠抗小鼠igd-percp-cy5.5(biolegend 405710,克隆11-26c.2a),大鼠抗小鼠cd3-pb(biolegend 100214,克隆17-a2),大鼠抗小鼠b220-apc(ebiosciences 17-0452-82,克隆ra3-6b2),以及大鼠抗小鼠cd19-apc-h7(bd 560143克隆1d3)。染色2:大鼠抗小鼠κ-fitc(bd 550003,克隆187.1),大鼠抗小鼠λ-pe(biolegend 407308,克隆rml-42),大鼠抗小鼠igm-pecy(ebiosciences 25-5790-82,克隆ii/41),大鼠抗小鼠igd-percp-cy5.5(biolegend 405710,克隆11-26c.2a),大鼠抗小鼠cd3-pb(biolegend 100214,克隆17-a2),大鼠抗小鼠b220-apc(ebiosciences 17-0452-82,克隆ra3-6b2),以及大鼠抗小鼠cd19-apc-h7(bd 560143克隆1d3)。染色3:大鼠抗小鼠cd23-fitc(biolegend 101606克隆b3b4),大鼠抗小鼠cd93(biolegend136504,克隆aa4.1),大鼠抗小鼠igm-pecy(ebiosciences 25-5790-82,克隆ii/41),大鼠抗小鼠igd-percp-cy5.5(biolegend 405710,克隆11-26c.2a),大鼠抗小鼠cd19-v450(bd 560375,克隆1d3),大鼠抗小鼠cd21/35-apc(bd 558658,克隆7g6),以及大鼠抗小鼠b220-apc-efl780(ebioscences 47-0452-82,克隆ra3-6b2)。在染色后,将细胞洗涤并在2%甲醛中固定。数据采集在bd流式细胞仪上执行,并且用软件进行分析。代表性结果在图9a-9d和图10a-10d中阐述。
[0529]
在类似的实验中,从小鼠(n=3,26%c57bl/6 23%129sve vtac 51%balb/canntac;参见例如美国专利号8,502,018和8,642,835)和6590het小鼠(“d6-d
h het”,n=3;75%c57bl/6 25%129svevtac;对于免疫球蛋白重链基因座杂合的小
鼠,所述免疫球蛋白重链基因座含有多个人vh,代替传统dh区段的包括d6趋化因子诱饵受体编码序列的经改造的dh区段,以及可操作地连接至包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区的jh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]中收获脾和股骨;并且通过流式细胞术分析(如上所述)。代表性结果在图11a-11d和图12a-12d中阐述。
[0530]
在另一个类似的实验中,从小鼠(n=3,38%c57bl/6 36%129svevtac 25%balb/canntac;参见例如美国专利号8,502,018和8,642,835)和6590ho/1293ho小鼠(“d6-d
h ho”,n=3;38%c57bl/6 36%129svevtac 25%balb/c anntac)中收获脾和股骨,所述6590ho/1293ho小鼠是对于免疫球蛋白重链基因座纯合的小鼠,所述免疫球蛋白重链基因座含有多个人vh,代替一个或多个传统dh区段的包括d6趋化因子诱饵受体编码序列的经改造的dh区段,以及可操作地连接至包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区的jh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];并且对于免疫球蛋白κ轻链基因座纯合,所述免疫球蛋白κ轻链基因座含有可操作地连接至包括啮齿类动物κ轻链增强子的啮齿类动物cκ区基因的人vκ和jκ基因区段),并且通过流式细胞术分析(如上所述)。代表性结果在图13a-13d和图14a-14d中阐述。
[0531]
结果显示与对照经改造的小鼠相比,tx-d
h ho小鼠证实在脾和骨髓区室中相似百分比的b细胞。对于一些tx-d
h ho小鼠,观察到更高百分比的igλ阳性细胞(例如参见图9c和图10d)。总的来说,与对照经改造的小鼠相比,脾中的b细胞成熟证实在tx-d
h ho小鼠中的正常进展。
[0532]
d6-d
h het小鼠也证实脾和骨髓区室两者中相似的b细胞百分比(图11a-12d)。与对照小鼠相比,d6-d
h het小鼠看起来也具有相似的轻链比率(图11c和12d)。d6-dh也证实了b细胞的总体正常发育和成熟。
[0533]
实例6.经改造的dh区中的人基因使用和编码序列的重排
[0534]
本实例使用下一代测序(ngs)-抗体储库分析来证实如本文所述的含有经改造的dh区的啮齿类动物中的人v(d)j基因区段使用。特别地,对从小鼠(其对于含有毒素编码序列的经改造的dh区纯合)和小鼠(其对于含有ackr2编码序列的经改造的dh区杂合)的分选的脾和未分选的骨髓中分离的rna进行rt-pcr测序。如下所述,在来自具有经改造的dh区的小鼠的分析序列中观察到所有经改造的dh区段,所述经改造的dh区含有毒素编码序列代替传统dh区段。还在下文中描述,在来自具有经改造的dh区的小鼠的分析序列中观察到大部分(即25个中的16个)经改造的dh区段,所述经改造的dh区含有ackr2(d6趋化因子诱饵受体)的细胞外部分的编码序列。
[0535]
简言之,从6579ho/1293ho小鼠(“tx-d
h ho”,n=3;同上)中收获脾和骨髓,并且通过使用小鼠抗cd19磁珠和柱(miltenyi biotech)的磁性细胞分选,从总脾细胞中积极富集b细胞。根据制造商的说明书,使用rneasy plus rna分离试剂盒(qiagen),从分选的脾细胞和未分选的总骨髓中的富集b细胞中分离总rna。然后根据制造商的说明书,使用superscript iii逆转录酶(thermo fisher scientific)和小鼠igm恒定区引物(表9,igm rt),从总rna合成免疫球蛋白重链(μ链,igm)cdna。使用多路pcr策略扩增igm cdna,所述多路pcr策略采用设计为与vh前导序列退火的vh家族特异性引物(表9,vh多-1、2、3、4、5和6)的
混合物和设计为与igm恒定区退火的引物(表9,igm pcr1)。使用pippin prep(sage science)分离范围为~450-800bp的pcr产物,然后执行使用pcr2引物(表9,pcr2-f和pcr2-r,“xxxxxx”是6nt指数,以区分测序文库且允许同时测序多重文库)的第二pcr,以附着测序衔接子和指数。在加载到miseq测序仪(illumina)上用于使用miseq reagent kits v3(2x300个循环)测序之前,将范围为~490bp-800bp的pcr产物分离,纯化且通过使用kapa library quantification kit(kapa biosystems)的qpcr定量。表9阐述了用于储库文库构建的所选引物的序列。
[0536]
对于生物信息学分析,将raw illumina序列去多路化,并且基于质量、长度以及与相应的恒定区基因引物的匹配来过滤。使用定制的内部管道合并且分析重叠的配对末端读数。该管道使用igblast(ncbi,v2.2.25 )的本地安装,以将重排的轻链序列与人种系vh和jh基因区段数据库进行比对,并且指示生产性和非生产性连接连同终止密码子的存在。使用如国际免疫遗传学信息系统(imgt)中定义的边界,提取cdr3序列和预期的非模板核苷酸。代表性结果在表10(使用每种vh家族特异性引物混合物在序列读数中与毒素编码序列的总匹配)和图15-17中阐述。
[0537]
结果证实大部分分析的序列含有在vh区序列的cdr3区内的毒素序列。特别地,在具有经改造的dh区的小鼠中对应于生产性重排的约87%序列含有在cdr3区内的毒素氨基酸序列,所述经改造的dh区含有多重毒素编码序列代替传统dh区段。另外,在这些小鼠中位于传统dh区段的位置内的所有26个毒素编码序列以各种频率检测到。观察到的最高度利用的毒素编码序列是短的μctx四(4)-氨基酸环smiiia(dh位置dh2-15)、μctx-smiiia midi插入片段(dh位置dh3-16)和μctx-piiia midi(dh位置dh3-22)。
[0538]
在类似的实验中,使用如上所述的下一代测序(ngs)-抗体储库分析,在6590het小鼠(“d6-d
h het”,n=3;同上)中分析人vh、经改造的dh和人jh区段使用。使用如上所述的多路pcr策略,对从分选的脾和未分选的骨髓中分离的rna进行rt-pcr测序。代表性结果在表11中(由骨髓和脾扩增的rna中的核苷酸(nt)序列读数中的框内氨基酸(aa)序列的数目)、表12(来自脾和骨髓的扩增rna中的选择d6编码序列的百分比[合并所有vh家族,不反映定量vh使用])和图18-20中阐述。
[0539]
结果证实从骨髓和脾扩增的rna中使用的大部分d6编码序列长度为约30至40个核苷酸。特别地,在从d6-d
h het小鼠分析的序列中最初没有观察到最长(例如nterm ec3(216nt))和最短(例如ec1-n(9nt))的d6编码序列。当评价来自经改造的dh区的d6编码序列的使用时,本发明人观察到某些限制。例如,本发明人注意到,由于凝胶大小选择步骤(参见上文),含有全长(或长于全长)更长的d6编码序列(例如,d6 nterm ec3,dh位置dh4-4;seq id no:33)的igm序列可能从序列中排除,并且由于修整选择步骤,较短的d6编码序列(例如,d6ec1,dh位置dh5-5;seq id no:3)可能被排除。然而,对于较短的d6编码序列,序列的手动检查指示这些d6编码序列事实上存在于从扩增的rna获得的序列中。进一步地,由于所选jh区段(例如,jh1)和d6编码序列之间的相似性,在与数据库比较时,本发明人观察到序列的不正确比对。此类序列相似性导致了较短dh序列的鉴定以及通过某些数据库的模糊注释的可能性。因此,几个序列需要使用人为进行的比对的个别分析。在从d6-d
h het小鼠分析的所有序列中,约50-60%的氨基酸序列在框内,并且利用在扩增重链的cdr3区内的d6编码序列。进一步地,在来自rna的扩增序列中检测到25个d6经改造的dh区段中的16个(表12),而
d6 nterm(dh3-3)、d6 nterm ec3(dh4-4)、d6 ec1(dh5-5)、d6 ec1-n(dh1-7)、d6 ec1-s(dh5-12)、d6 nterm-s(dh6-13)、d6 nterm-ec3(dh3-16)、d6 ec1 ec2(dh4-17)和d6 ec3-c(dh4-23)在分析的序列中未检测到。如上所述,这些d6编码序列中的一些,特别是较长的d6编码序列的使用在所分析的序列集合中无法被证实。总的来说,并未观察到在骨髓和脾来源的样品之间d6编码序列的使用中的重大差异。此外,在分析的序列中,看起来不存在针对d6编码序列的重排的负选择偏倚。
[0540]
总之,本实例证实了具有经改造的免疫球蛋白重链基因座的小鼠,特征在于含有非免疫球蛋白多肽(例如,d6趋化因子诱饵受体或者一种或多种毒素)的编码序列代替传统dh区段的经改造的dh区的存在,能够将经改造的编码序列与相邻的人vh和jh区段重排,以形成功能性重链。进一步地,所提供的经改造的小鼠证实利用在几个人vh和jh区段家族的背景下改造到合成dh区内的多重编码序列的强大抗体储库。
[0541]
表9
[0542][0543][0544]
表10
[0545][0546]
表11
[0547][0548][0549]
表12
[0550][0551][0552]
实例7.在含有经改造的dh区的啮齿类动物中的抗体生产
[0553]
本实例证实了其基因组中包含免疫球蛋白重链可变区的啮齿类动物中的抗体生产,所述免疫球蛋白重链可变区包括如本文所述的经改造的dh区。根据需要,本实例中描述的方法和/或本领域众所周知的免疫方法,可用于用多肽或其片段(例如,源自所需表位的肽)或者多肽或其片段的组合免疫含有如本文所述的经改造的dh区的啮齿类动物。
[0554]
简言之,使用本领域已知的免疫方法,用目的抗原攻击包括如本文所述的经改造的dh区的小鼠群组。通过elisa免疫测定(即血清滴度)监测抗体免疫应答。
[0555]
包含单个重排的可变基因序列v:j的共同轻链小鼠(也称为通用轻链或ulc小鼠)(例如,vκ1-39jκ5或vκ3-20jκ1共同轻链小鼠)的生成、以及这些小鼠中抗原特异性抗体的生成,在例如美国专利申请号13/022,759、13/093,156、13/412,936、13/488,628、13/798,
310和13/948,818(分别为公开号2011/0195454、2012/0021409、2012/0192300、2013/0045492、us20130185821和us20130302836)中描述,所述专利各自以引用的方式全文并入本文。具体地,制备在其种系中表达经遗传改造的vκ1-39jκ5κ轻链(1633ho或1634ho)或经遗传改造的vκ3-20jκ1κ轻链(1635ho或1636ho)的小鼠。
[0556]
将含有单个重排的人种系轻链区(ulc vκ1-39jκ5;1633或1634)或(ulc vκ3-20jκ1;1635或1636)的小鼠与携带经修饰的igg恒定区的小鼠育种。具体地,将此类ulc小鼠与具有包含纯合的免疫球蛋白重链基因座的基因组的小鼠育种,所述纯合的免疫球蛋白重链基因座含有多个人vh、包括毒素编码序列代替传统dh区段的经改造的dh区段、以及与包括小鼠重链增强子和调控区的小鼠免疫球蛋白重链恒定区可操作地连接的jh区段,并且含有编码一种或多种鼠adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940],以获得对于包含毒素编码序列的重链基因座杂合或纯合,并且对于通用轻链杂合或纯合的后代小鼠。如图21中所示,对于含有毒素编码序列的经改造的dh区纯合并且对于通用轻链纯合的小鼠(6579ho/1634ho),在用可溶性蛋白质免疫后具有与对照动物(1460/1634)可比较的抗体应答。
[0557]
实例8.分离表达和/或编码在含有经改造的dh区的啮齿类动物中产生的抗体的核酸的细胞
[0558]
当获得所需免疫应答时,收获脾细胞(和/或其它淋巴组织)并且与小鼠骨髓瘤细胞融合,以保存其活力并形成永生的杂交瘤细胞系。杂交瘤细胞系进行筛选(例如通过elisa测定)并选择,以鉴定产生抗原特异性抗体的杂交瘤细胞系。可根据需要进一步表征杂交瘤的相对结合亲和力和同种型。使用这种技术,获得几种抗原特异性嵌合抗体(即,具有人可变结构域和啮齿类动物恒定结构域的抗体)。
[0559]
编码重链和轻链可变区的dna可被分离并连接至重链和轻链的期望同种型(恒定区),用于制备全人抗体。此类抗体蛋白质可在细胞例如cho细胞中产生。全人抗体然后就目的抗原的相对结合亲和力和/或中和活性进行表征。
[0560]
编码抗原特异性嵌合抗体或轻链和重链的可变结构域的dna可直接从抗原特异性淋巴细胞中分离。最初,分离具有人可变区和啮齿类动物恒定区的高亲和力嵌合抗体,并且针对期望特征(包括亲和力、选择性、表位等)进行表征且选择。用所需人恒定区替换啮齿类动物恒定区,以生成全人抗体。尽管所选恒定区可根据具体用途而变化,但高亲和力抗原结合和靶特异性特征存在于可变区中。还从抗原阳性b细胞(来自免疫小鼠)中直接分离抗原特异性抗体,而不融合至骨髓瘤细胞,如例如美国专利号7,582,298中所述,所述专利特别以引用的方式全文并入本文。使用这种方法,制备了几种全人抗原特异性抗体(即,具有人可变结构域和人恒定结构域的抗体)。
[0561]
等同物
[0562]
在如此地描述了本发明的至少一个实施例的若干方面后,本领域技术人员将理解,各种改变、修改和改进对于本领域技术人员来说将是容易进行的。此类改变、修改和改进旨在是本公开内容的一部分,并且旨在处于本发明的精神和范围之内。因此,上述描述和附图仅仅作为举例的方式,并且本发明通过下面的权利要求进行详细描述。
[0563]
在权利要求中使用序数术语如"第一"、"第二"、"第三"等来修饰权利要求元素,其本身并不意味着一个权利要求要素相对于另一个要素的任何优先性、优先级或顺序或者其
中执行方法行为的时间顺序,而是仅用作区分具有某一名称的一个权利要求元素与具有同一名称的另一个元素(但使用序数术语)的标记,以区分权利要求元素。
[0564]
除非明确指出相反,否则说明书和权利要求书中的冠词“一个”和“一种”应该理解为包括复数指示物。在组的一个或多个成员之间包括"或"的权利要求或描述应当被视为是满足以下情况,即组成员中的一个、多于一个或全部存在于、被应用于给定的产品或方法中,或以其他方式与给定的产品或方法相关,除非指出相反或根据上下文明显不同。本发明包括这样的实施例,其中组中的一个确切成员存在于、被应用于给定的产品或方法中,或以其他方式与给定的产品或方法相关。本发明还包括这样的实施例,其中多于一个组成员或全部组成员存在于、被应用于给定的产品或方法中,或以其他方式与给定的产品或方法相关。此外,应当理解,本发明包括涵盖所有的变型、组合和取代,其中来自一条或多条所列权利要求的一个或多个限制、要素、子句、描述性用语被引入从属于同一基础权利要求的另一个权利要求(或者相关的任何其他权利要求)中,除非另外指出或除非对于本领域普通技术人员来说明显会引起矛盾或不一致。当要素以列表的形式(例如以马库什组或类似形式)呈现时,应当理解这些要素的每个亚组也被公开,并且任何要素可从该组中去除。应当理解,通常,当本发明或本发明的方面被称为包含特定的要素、特征等时,本发明的某些实施例或本发明的方面由此类要素、特征等组成或基本上由它们组成。为了简化的目的,这些实施例并不是在每种情况下都明确用本文陈述的那么多用词来具体描述。应当理解,本发明的任何实施例或方面可明确地从权利要求排除,不管在说明书中是否描述了此类具体排除。
[0565]
本领域技术人员将理解可归因于本文中所述的测定或其他方法中获得的值的典型标准偏差或误差。
[0566]
本文引用的用以描述本发明背景以及用以提供与其实施有关的其他细节的出版物、网站和其他参考材料均据此以引用方式并入。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献