一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

核酸的随机化构型靶向整合的制作方法

2022-02-24 17:05:42 来源:中国专利 TAG:

核酸的随机化构型靶向整合
1.相关申请的交叉引用
2.本技术要求2019年6月26日提交的美国专利临时申请号62/866,893和2020年3月19日提交的美国专利临时申请号62/991,708的优先权,各申请的内容以引用方式整体并入本文,并要求各自的优先权。
技术领域
3.本公开的主题涉及

随机化构型靶向整合

(本文也称为

随机化链靶向整合(rcti)策略

),用于产生和鉴定宿主细胞,所述宿主细胞能够表达重组蛋白例如单克隆抗体,以及由其衍生的组合物例如双特异性抗体、及其他复杂形式的蛋白质例如膜蛋白复合物和其他难以表达的分子。
4.序列表
5.本说明书参照序列表(2020年6月26日以电子形式提交,文件名

00b206_0926_sl.txt

)。00b208_0926_sl.txt文件于2020年6月24日生成且大小为1,296,777位字节。序列表的全部内容以引用方式并入本文。


背景技术:

6.由于细胞生物学及免疫学的快速发展,对开发用于多种疾病(包括癌症、心血管疾病、及代谢性疾病)的新型治疗性重组蛋白(例如单克隆抗体、双特异性抗体及复合物形式蛋白质)的需求日益增加。此类生物医药候选物通常由能够表达目的蛋白的商业细胞系制造而成。举例而言,近年来,中国仓鼠卵巢(cho)细胞已广泛适用于制造单克隆抗体或双特异性抗体以及更多复合物形式蛋白质。
7.用于开发商业细胞系的传统策略通常涉及不断致力于整合关于编码目的多肽的核苷酸序列(随机或特定(

靶向

)位置),然后选择并分离产生多肽的细胞系。然而,该方法具有若干缺点。首先,虽然随机整合方法提供获得具有不同组成及比例的待表达转基因的不同克隆的可能性,但在转染后需要筛选数百、甚至数干个克隆以分离展现所期望的表达水平、产物品质属性、及生产培养效能的细胞系,是一项耗时且占用大量资源的工作。此外,由于不稳定或未能筛选足够数量的克隆,具有各种转基因最佳比例的克隆有可能不存在或无法分离出来。此外,当生产多链多肽(例如单克隆抗体)时,可能需要进一步筛选以解决编码此类多肽的核酸的数量和排列。在使用随机整合方法时,很难确定引入基因组的所有转基因的数量和位置及其排列方式,而这是在转基因排列/拷贝数与所期望产物属性之间进行合理关联的重要步骤。
8.相比之下,靶向整合方法可对各特定转基因的排列和拷贝数提供更多的控制,鉴于转基因是插入到基因组内预定的特定位置。然而,这种靶向整合方法旨在将产生不同转基因的随机组合及比例的可能性最小化。因此,如果设计的转基因排列和拷贝数恰好是次优的,那么所有衍生的克隆同样会有次优的产物品质和/或效价。为了增加使用靶向整合方法表达复杂或难以表达的分子的机会,对多种不同的转基因排列和拷贝数配置单独测试,
这导致细胞系开发(cld)的工作量和资源需求量增加。因此,本技术领域需要新的细胞系开发策略,该策略在节省资源的同时,产生的细胞系表达出与传统方法相媲美的表达水平、产物品质属性、及生产培养效能。


技术实现要素:

9.本公开的主题涉及

随机化构型靶向整合

(本文也称为

随机化链靶向整合(rcti)策略

),用于生成和鉴定宿主细胞,所述宿主细胞能够表达重组蛋白(例如单克隆抗体)及由其衍生的组合物(例如双特异性抗体)、和其他复杂形式的蛋白(例如膜蛋白复合物)、以及其他难以表达的分子。本公开所述rcti方法可用于筛选与标准细胞系开发方法相同数量(如果不是更多)的载体构型,同时使用的资源更少。通过使用本公开所述rcti方法,也可筛选较少的单个克隆。
10.在某些实施例中,本公开提供了一种用于产生和高通量筛选表达至少一个目的序列(soi)的靶向整合(ti)宿主细胞文库的方法,其包括:a)通过下列步骤产生ti宿主细胞文库,其中该文库包含表达一个或多个soi的多个ti宿主细胞;i)提供多个ti宿主细胞;ii)将多个ti宿主细胞与多个载体接触,其中该载体包含一个或多个soi;iii)将一个或多个soi引入多个ti宿主细胞中的一个或多个;b)将该文库分离成单一克隆;以及c)针对特定细胞属性或特定产物属性来筛选该克隆。
11.在某些实施例中,本公开提供了一种产生ti宿主细胞文库的方法,该宿主细胞包含多个外源性核苷酸soi,该方法包括:a)提供多个ti宿主细胞;b)将该多个ti宿主细胞与多个载体接触,其中该载体包含一个或多个soi;c)将一个或多个soi引入多个ti宿主细胞中的一个或多个。在某些实施例中,多个ti宿主细胞的一个或多个包含一个或多个外源核苷酸序列,其整合在该ti宿主细胞的基因组的一个或多个基因座处,并且外源核苷酸序列包含位于至少一个第一选择标志物的侧翼的至少两个重组酶识别序列(rrs)。在某些实施例中,该载体包含:a)至少两个rrs,其匹配经整合的外源性核苷酸序列上的至少两个rrs;以及b)一个或多个外源soi和侧接有该rrs的至少一个第二选择标志物。
12.本公开的主题也提供用于将一或多种外源性核酸rcti至宿主细胞中以促进目的序列的表达的方法。在某些实施例中,该方法包含经由重组酶介导的整合或经由基因编辑介导的整合将一或多种外源性核酸靶向整合至宿主细胞中。在某些实施例中,该方法涉及一种细胞,其包含整合在该ti宿主细胞的基因组的基因座内的一个或多个外源核苷酸序列,其中该基因座包含与选自seq id no:1-12的序列至少约90%同源的核苷酸序列。
13.在某些实施例中,本公开提供一种制备表达一个或多个soi的ti宿主细胞的方法,其包括:a)提供多个ti宿主细胞;b)使该多个ti宿主细胞与多个载体接触,其中该载体包含一个或多个soi;c)将该一个或多个soi引入该多个ti宿主细胞中的一个或多个;以及d)选择表达该一个或多个soi的该ti宿主细胞。在某些实施例中,该多个ti宿主细胞中的一个或多个包含整合在该等ti宿主细胞的基因组的一个或多个基因座处的一个或多个外源核苷酸序列,并且其中该外源核苷酸序列包含位于至少一个第一选择标志物的侧翼的至少两个rrs。在某些实施例中,该载体包含:a.至少两个rrs,其匹配经整合的外源性核苷酸序列上的至少两个rrs;以及b.一个或多个外源soi和侧接有rrs的至少一个第二选择标志物。在某些实施例中,该方法包括将一种或多种重组酶或编码重组酶的核酸引入多个ti宿主细胞中
的一个或多个,其中所述一种或多种重组酶识别所述rrs;以及d)选择表达该第二选择标志物的ti细胞,从而分离出表达目的序列的ti宿主细胞。在某些实施例中,该外源核苷酸序列包含位于至少一个第一选择标志物的侧翼的第一rrs和第二rrs,以及位于该第一rrs与该第二rrs之间的第三rrs,并且所有rrs都是异种特异性的;并且该多个载体包含:i.第一载体,其包含两个rrs,该两个rrs匹配经整合的外源核苷酸序列上的第一rrs和第三rrs并且位于至少一个第一外源soi和至少一个第二选择标志物的侧翼;ii.第二载体,其包含两个rrs,该两个rrs匹配经整合的外源核苷酸序列上的第二rrs和第三rrs并且位于至少一个第二外源soi的侧翼;以及选择表达该第二选择标志物的ti细胞,从而分离出表达该第一目的序列和该第二目的序列的ti宿主细胞。
14.在某些实施例中,本公开提供了一种表达soi的方法,其包括:a)提供多个ti宿主细胞;b)使多个ti宿主细胞与多个载体接触,其中该载体包含一个或多个soi;c)将该一个或多个soi引入多个ti宿主细胞中的一个或多个;以及d)选择表达目的序列的ti宿主细胞;e)在适合于表达来自其中的细胞的该目的序列的条件下培养d)中的该细胞。
15.在某些实施例中,本公开提供了一种表达soi的方法,其包括:a)提供多个ti宿主细胞,其中各ti宿主细胞包含整合在ti宿主细胞的基因组的一个或多个基因座处的一个或多个外源核苷酸序列,并且其中该外源核苷酸序列包含位于至少一个第一选择标志物的侧翼的至少两个rrs;b)使该多个ti宿主细胞与多个载体接触,其中该载体包含:a.至少两个rrs,其匹配经整合的外源核苷酸序列上的至少两个rrs;以及b.一个或多个外源soi和侧接有该rrs的至少一个第二选择标志物;c)引入一种或多种重组酶或编码重组酶的核酸,其中该一种或多种重组酶识别该rrs;d)选择表达该第二选择标志物的ti细胞,从而分离出表达目的序列的ti宿主细胞;以及e)在适合于表达该目的序列的条件下培养d)中的细胞,并且从其中回收该目的序列的产物。在某些实施例中,该外源核苷酸序列包含位于至少一个第一选择标志物的侧翼的第一rrs和第二rrs,以及位于该第一rrs与该第二rrs之间的第三rrs,并且所有rrs都是异种特异性的;并且该多个载体包含:i.第一载体,其包含两个rrs,该两个rrs匹配经整合的外源核苷酸序列上的第一rrs和第三rrs并且位于至少一个第一外源soi和至少一个第二选择标志物的侧翼;ii.第二载体,其包含两个rrs,该两个rrs匹配经整合的外源核苷酸序列上的第二rrs和第三rrs并且位于至少一个第二外源soi的侧翼;以及选择表达该第二选择标志物的ti细胞,从而分离出表达该第一目的序列和该第二目的序列的ti宿主细胞。
16.在某些上述实施例中,通过重组酶介导的整合,将一个或多个soi引入多个ti宿主细胞中的一个或多个。在某些上述实施例中,通过基因编辑介导的整合,将一个或多个soi引入多个ti宿主细胞中的一个或多个。
17.在某些上述实施例中,一个或多个soi可操作地连接至一个或多个可调型启动子。在某些上述实施例中,该一个或多个可调型启动子选自由sv40和cmv启动子组成的组。
18.在某些上述实施例中,该ti宿主细胞为哺乳动物宿主细胞。在某些上述实施例中,该ti宿主细胞为仓鼠宿主细胞、人宿主细胞、大鼠宿主细胞或小鼠宿主细胞。在某些上述实施例中,该ti宿主细胞为cho宿主细胞、cho k1宿主细胞、cho k1sv宿主细胞、dg44宿主细胞、dukxb-11宿主细胞、chok1s宿主细胞或cho k1m宿主细胞。
19.在某些上述实施例中,soi编码多亚基蛋白质的多肽亚基或其片段。在某些上述实
施例中,该soi编码单链抗体、抗体轻链、抗体重链、单链fv片段(scfv)、或fc融合蛋白。
20.在某些上述实施例中,该特定细胞属性选自:细胞生长、细胞效价(cell titer)、比生产力(specific productivity)、体积生产力、克隆稳定性。在某些上述实施例中,该特定产物属性选自:糖基化水平、电荷变化水平、错配减少、蛋白质/肽聚集减少、蛋白质序列异质性。
21.在某些上述实施例中,将一个或多个soi在一个或多个基因座处引入多个ti宿主细胞中的一个或多个,该一个或多个基因座与选自下列的序列至少约90%同源:seq id no.1-12;nw_006874047.1;nw_006884592.1;nw_006881296.1;nw_003616412.1;nw_003615063.1;nw_006882936.1;以及nw_003615411.1。
22.在某些上述实施例中,该至少一个目的序列包含2、3、4、5、6、7、8、9、10个目的序列。
附图说明
23.图1a至图1b是说明示例性靶向整合(ti)细胞系开发(cld)工作流程的示意图。
24.图2a至图2b是说明标准ti和

随机化构型靶向整合

(本文也称为

随机化链靶向整合

(rcti))工作流程的比较的示意图。
25.图3a至图3b描述针对在生产培养中所评价的克隆的效价和hmws%的分布以及所鉴定的构型。
26.图4显示标准ti cld与rcti方法之间的其他产物品质属性是相当的。
27.图5描绘标准cld与rcti方法之间的产物品质属性是相当的。
28.图6a至图6c说明rcti方法在保持克隆效能的同时,提供经改善的时间线弹性。
29.图7a至图7b描绘针对分子-y的标准cld与rcti方法之间的效价是相当的,但是rcti方法的克隆的比生产力高于标准cld。
30.图8a至图8g描绘针对分子-y的标准cld与rcti方法之间的产物品质属性是相当的。
31.图9a至图9b描绘针对分子-z的标准cld与rcti方法之间的效价是相当的,但是rcti方法的克隆的比生产力高于标准cld。
32.图10a至图10f描绘针对分子-z的标准cld与rcti方法之间的产物品质属性是相当的。
33.图11a至图11c是说明通过本公开的方法所表达的示例性分子的示意图。
具体实施方式
34.在某些实施例中,本文所述的宿主细胞、基因构建体(例如,载体)、组成物、以及方法可用于开发和/或使用

随机化构型靶向整合

(本文也称为

随机化链靶向整合

(rcti)策略),以更有效(例如较少时间和/或资源密集)识别表现出与传统方法相当的表达水平、产物品质属性、以及生产培养效能的宿主细胞。
35.为使公开更清晰但不作为限制,详细描述分为以下小节:
36.1.定义
37.2.宿主细胞制备&筛选策略
red、dsred单体、morange、mko、mcitrine、venus、ypet、emerald、cypet、mcfpm、cerulean和t-sapphire。可通过检测经编码多肽发出的萤光来区分含有该基因的细胞与不含该基因的细胞。
49.如本文所用,术语

可操作地连接

是指两个或更多个组分的并置,其中组分处于允许它们以其预期方式起作用的关系。例如,如果启动子和/或增强子起到调节编码序列转录的作用,则该启动子和/或该增强子与编码序列可操作地连接。在某些实施例中,

可操作地连接

的dna序列在一条染色体上是连续且相邻的。在某些实施例中,例如,当需要连接两个蛋白质编码区(例如分泌前导序列和多肽)时,序列是连续、相邻的,并且在同一读框中。在某些实施例中,可操作连接的启动子位于编码序列的上游,并且可以与其相邻。在某些实施例中,例如,关于调节编码序列的表达的增强子序列,两种组分尽管不相邻,但是可操作地连接。如果增强子增加了编码序列的转录,则该增强子可操作地连接至该编码序列。可操作地连接的增强子可位于编码序列的上游、内部或下游,并且可位于距编码序列的启动子相当远的距离。可操作地连接可通过本领域中已知的重组方法来完成,例如,使用pcr方法和/或在方便的限制位点处连接。如果不存在方便的限制位点,则可以按照常规做法使用合成的寡核苷酸衔接子或连接基。如果内部核糖体进入位点(ires)允许以5

末端独立的方式在内部位置启动orf的翻译,则认为其与开放读框(orf)可操作地连接。
50.如本文所用,术语

表达

是指转录和/或翻译。在某些实施例中,所需产物的转录水平可根据存在的相应mrna的量来确定。例如,可通过pcr或northern杂交对由目的序列转录的mrna进行定量。在某些实施例中,由目的序列编码的蛋白质可通过多种方法定量,例如通过elisa、通过测定蛋白质的生物学活性、或通过使用识别并结合蛋白质的抗体采用与该等活性无关的测定(如蛋白质印迹或放射免疫测定)来定量。
51.本文所用的术语

目的序列

是指多肽序列(或在某些情况下,是指编码多肽序列的核酸),其中该多肽序列的表达是目的。在某些实施例中,该多肽序列可包含多亚基蛋白质复合物的亚基。在某些实施例中,该多肽序列可包含该亚基的片段。在某些实施例中,该多肽序列可包含抗体序列,例如抗体重链或轻链序列。在某些实施例中,该多肽序列可包含该抗体序列的片段。
52.本文的术语

抗体

以最广泛的含义使用,并且包括各种抗体结构,包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体)、半抗体和抗体片段,只要它们表现出所需的抗原结合活性即可。
53.如本文所用,

标准抗体



标准单克隆抗体

是具有单一结合特异性的抗体或抗体片段。在某些实施例中,标准抗体的单一结合特异性是重链序列或其片段与轻链序列或其片段配对的结果。
54.如本文所用,

双特异性抗体



bsab

是可以同时结合两个不同表位的抗体,例如两个不同抗原上的两个不同表位或单个抗原上的两个不同表位。bsabs包括许多不同的结构,包括那些包含两个不同的亲代单克隆抗体的变异重链(vh)和轻链(v
l
)结构域的配对结构,从而导致bsab的一个



(即,一对vh和v
l
l)具有第一亲代抗体的结合特异性,并且bsab的第二



具有第二亲代抗体的结合特异性。bsabs是多特异性抗体的子集,其中多特异性抗体具有至少两种结合特异性(即bsabs),但也包括三特异性抗体以及具有更多重特异性的抗体。
55.如本文所用,术语

抗体片段

是指除了完整抗体以外的分子,其包括完整抗体的一部分且结合完整抗体结合的抗原。抗体片段的实例包括但不限于fv、fab、fab

、fab
′‑
sh、f(ab

)2;双体抗体;线性抗体;单链抗体分子(例如,scfv);以及由抗体片段形成的多特异性抗体。
56.如本文所用,术语

可变区



可变结构域

是指抗体重链或轻链的参与抗体与抗原结合的结构域。天然抗体的重链和轻链的可变结构域(分别为vh和v
l
)通常具有相似的结构,其中每个结构域包含四个保守框架区(fr)和三个高变区(hvr)。参见例如kindt等人,kuby immunology,第6版,w.h.freeman and co.,第91页(2007)。单个vh或v
l
结构域可足以赋予抗原结合特异性。此外,结合特定抗原的抗体可分别使用来自结合该抗原的抗体的vh或v
l
结构域来进行分离,以筛选互补v
l
或vh结构域的文库。参见例如portolano等人,j.immunol.150:880-887(1993);clarkson等人,nature 352:624-628(1991)。
57.如本文所用,术语

载体

是指一种核酸分子,其能够传送与其连接的另一种核酸。该术语包括作为自我复制核酸结构的载体以及掺入已引入该宿主细胞的基因组中的载体。在某些实施例中,载体指导与其可操作地连接的核酸的表达。该载体在本文中称为

表达载体


58.如本文所用,术语

同源序列

是指具有通过序列比对确定的显著序列相似性的序列。例如,两个序列可具有约50%、60%、70%、80%、90%、95%、99%、或99.9%的同源性。比对是通过算法和计算机程序(包括但不限于blast、fasta和hmme)执行的,其可以比较序列并基于因素诸如序列长度、序列同一性和相似性以及序列不匹配和缺口的存在与长度来计算匹配的统计显著性。同源序列可以是指dna和蛋白序列两者。
59.如本文所用,术语

侧翼

是指位于第二核苷酸序列的5

或3

末端或两端的第一核苷酸序列。侧翼核苷酸序列可与第二核苷酸序列相邻或相距给定的距离。侧翼核苷酸序列的长度无具体限制。例如,侧翼序列可包含几个碱基对或几千个碱基对。
60.如本文所用,术语

外源

表示核苷酸序列并非来源于宿主细胞,而是通过传统的dna递送方法,例如通过转染、电穿孔或转化方法引入宿主细胞中。术语

内源

是指核苷酸序列来源于宿主细胞。

外源

核苷酸序列可具有在碱基组成上相同的

内源

对应物,但是其中

外源

序列通过例如重组dna技术被引入宿主细胞中。
61.如本文所用,

整合位点

包括在宿主细胞基因组内插入外源核苷酸序列的核酸序列。在某些实施例中,整合位点在宿主细胞基因组的两个相邻核苷酸之间。在某些实施例中,整合位点包含一段核苷酸序列。在某些实施例中,整合位点位于ti宿主细胞基因组的特定基因座内。在某些实施例中,整合位点在ti宿主细胞的内源基因内。
62.如本文所用,术语

ti宿主细胞

是指包含用于表达目的序列的一个或多个基因座即整合位点的细胞。在某些实施例中,在包含两个或更多个rrs的一个或多个整合位点的外源核苷酸序列有利于将soi整合到ti宿主细胞中。在某些实施例中,能够在一个或多个整合位点编辑ti宿主细胞基因组的基因组编辑系统有利于将soi整合到ti宿主细胞中。
63.2.宿主细胞制备&筛选策略
64.标准cld策略通常涉及通过编码一个或多个目的序列的一个或多个特定的外源核酸进行多轮宿主细胞转染。如图1a所示,制备该外源核酸,例如包含抗体重链和轻链编码序列的质粒,然后在靶向经整合的背景下通过例如重组酶介导的盒式交换(rmce)进行转染。
无论整合策略如何(例如,随机或靶向整合),均可在选择和单细胞克隆(scc)之前恢复转染的宿主细胞库。然后,通过均匀时间分辨荧光(

htrf

)效价测定法进行多轮克隆分析,以缩小克隆数量,从而进行更详细的生产率和产物质量测定,例如高分子量种类含量(hmws%)、大小变化、酸性变化和糖基化变化。
65.图2a示出了基于标准靶向经整合的cld策略,其中采用多个cld循环来识别表现出所需的表达水平、产物质量属性和生产培养性能的细胞。在该实例中,通过使多个宿主细胞与编码目的序列的两种外源核酸的特定组合接触来制备每个转染细胞库。尽管图2a示出了一种策略,其中涉及将目的序列从第一个



质粒和第二个



质粒插入到宿主基因组的特定基因座中(有关双载体rcme策略的一般说明,请参见下文第5.1节),应当理解,靶向整合方法可能涉及单个目的序列或两个以上的目的序列的整合。此外,如本文所概述的,靶向整合策略不仅可以采用如图2a和2b所示的重组酶介导的soi整合,而且可以采用其他基因座特异性策略整合soi,例如基因编辑介导的soi整合。但是,如上所述,靶向整合方法的一种限定特征是它们被设计成导致特定序列以特定排列方式整合,即基因组内固定构型的转基因。根据该设计特征,如图2a所概述,有必要执行多个cld循环,以确保测定数量足够多的目的序列的拷贝数和排列方式。
66.与图2a所示的标准资源密集型多循环靶向整合cld策略相比,本专利申请的主题涉及

随机化构型靶向整合

(本文也称为

随机化链靶向整合

(rcti)策略),该策略允许单周期分析目的序列的拷贝数和排列的变化,但保留靶向经整合的基因座特异性整合优势。如图2b所示,可通过产生单个转染池来评估编码目的序列的所有相关的外源核酸。通过将编码目的序列的相关外源核酸的完整互补序列与多个宿主细胞相结合,可创建单个转染池,从中可以识别表现出所需的表达水平、产物质量属性和生产培养性能的克隆。
67.尽管示例性图2b示出采用三个



和三个



质粒(各自包含一个或多个目的序列)的实施例,其中质粒被整合到存在于宿主细胞基因组内特定基因座处的外源核苷酸序列的前或后盒中(关于该

双载体rmce

策略的完整说明,参见下文第5.1节),但是应当理解,本公开的主题涵盖该靶向整合策略的各种变型。例如,除使用包括前盒的第一质粒和包括后盒的第二质粒外,本公开还涵盖涉及单盒经整合的方法。此外,本公开还包括涉及将三个、四个、五个、六个、七个、八个、九个、十个或更多个盒整合到存在于宿主细胞基因组内特定基因座处的单个外源核苷酸序列中的方法。而且,每个盒不仅可包含一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个单独目的序列,而且每个宿主基因组可包含存在于宿主细胞基因组内的特定基因座处的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个外源核苷酸序列,可将包含目的序列的盒整合到所述序列中。因此,在示例性图2b示出了可以使用三个前盒和三个后盒来产生九个可能的目的序列转基因构型的策略的同时,本公开涵盖了用于产生更少和更多的转基因构型的策略,包括在宿主基因组中的一个以上的位点产生这些构型。
68.采用本文所概述的rcti策略可显著节省资源,包括但不限于节省成本和时间、节省人工以及缓解自动化的瓶颈。如图3-5所示,与标准cld策略相比,这种资源节省不会对期望的表达水平的分布、产物质量属性或观察到的生产培养效能产生不利影响。
69.如图6a-6c所示,rcti方法还允许在早期、中期或完全恢复阶段进行单细胞克隆。由于标准cld策略通常涉及在进行单细胞克隆之前需等到转染池完全恢复(例如,>90%的
细胞存活率),因此采用rcti策略可节省大量时间,而不影响克隆的性能(具有高效价和所需产物质量的克隆的百分比)或异质性(载体构型、效价和产物质量的范围)。
70.在某些实施例中,本公开涉及筛选表达至少一种soi的ti宿主细胞文库的基于rcti的高通量方法。在某些实施例中,该方法包括生成ti宿主细胞文库,其中所述文库包含表达一个或多个soi的多个ti宿主细胞,该方法包括以下步骤:将文库分为单个克隆,并筛选克隆中的特定细胞和/或特定产物属性。在某些实施例中,生成ti宿主细胞文库包括以下步骤:提供多个ti宿主细胞,使多个ti宿主细胞与多个载体接触,其中该载体包含一个或多个soi,以及将一个或多个soi引入多个ti宿主细胞中的一个或多个。
71.在某些实施例中,可通过重组酶介导的整合将目的序列引入本公开的宿主细胞中。在某些实施例中,可通过基因编辑介导的整合将目的序列引入本公开的宿主细胞。
72.在某些实施例中,本公开的筛选方法可包括筛选细胞中的细胞属性,这些属性可以是但不限于细胞生长、细胞效价、比生产力、体积生产力、克隆稳定性。这些细胞属性的筛选可通过本领域已知的任何技术来进行。
73.在某些实施例中,本公开的筛选方法可包括筛选细胞的产物属性,这些产物属性可以是但不限于糖基化水平、电荷变化水平、错配减少、蛋白质/肽聚集减少、蛋白质序列异质性。可以用本领域已知的任何技术筛选这些产物属性,这些技术例如但不限于体积排阻色谱(sec)、cdna测序、肽图分析、ce-sds或sds-page、hplc、基于ce的聚糖测定、ief及离子交换色谱。
74.在某些实施例中,本公开提供了一种基于rcti的方法,该方法用于生成包含多个外源核苷酸soi的ti宿主细胞库,包括使多个ti宿主细胞与具有一个或多个soi的载体接触,将一个或多个soi引入ti宿主细胞,然后选择表达一个或多个soi的ti细胞。在某些实施例中,通过本公开的方法生成的ti宿主细胞将包含整合在ti宿主细胞的基因组的一个或多个基因座处的一个或多个外源核苷酸序列。在某些实施例中,外源核苷酸序列可包含可位于一个或多个选择标志物的侧翼的至少两个rrs。
75.在某些实施例中,载体可包含一个或多个选择标志物基因,以提供表型性状,用于选择转化的宿主细胞,例如用于真核细胞培养基的二氢叶酸还原酶或新霉素抗性。在某些实施例中,宿主细胞可为高等真核细胞,例如哺乳动物细胞,也可以是较低等的真核细胞,例如酵母细胞,或者宿主细胞可为原核细胞,例如细菌细胞。在某些实施例中,可筛选文库中特定的目的序列,例如但不限于多肽序列。在某些实施例中,可筛选所得文库中的克隆,其在表型分析中对目的多肽表现出活性。在某些实施例中,可通过本领域已知的方法筛选文库中特定蛋白质(例如酶)的活性。
76.在某些实施例中,本公开涉及一种选择表达目的序列的宿主细胞的基于rcti的方法,其包括:提供多个ti宿主细胞;使多个ti宿主细胞与多个载体接触,其中该载体包含一个或多个soi及至少一个标志物;将该一个或多个soi引入该多个ti宿主细胞中的一个或多个;以及选择表达该选择标志物的ti宿主细胞,从而分离出表达目的序列的ti宿主细胞。在某些实施例中,soi可编码多亚基蛋白质的多肽亚基或其片段。在某些实施例中,soi可编码单链抗体、抗体轻链、抗体重链、单链fv片段(scfv)、或fc融合蛋白。在某些实施例中,外源核苷酸整合到其中的基因座与选自seq id no.1-7的序列具有至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%的同源性。
77.在某些实施例中,一个或多个外源核苷酸序列可整合到一个或多个基因座,其与选自以下的序列具有至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%的同源性:seq id nos.1-12;nw_006874047.1;nw_006884592.1;nw_006881296.1;nw_003616412.1;nw_003615063.1;nw_006882936.1;以及nw_003615411.1。
78.在某些实施例中,外源核苷酸所整合到的基因座与选自以下的序列至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源:美国专利号9816110的序列seq id no:1-4,对应于本公开的seq id no:8-11;或国际专利申请号pct/us2017/028555的序列seq id no:1,对应于本公开的seq id no:12。在某些实施例中,可通过重组酶介导的整合将一个或多个目的序列引入本公开的宿主细胞中。在某些实施例中,可通过基因编辑介导的整合将一个或多个目的序列引入本公开的宿主细胞中。
79.在某些实施例中,本公开所述的选择表达目的序列的宿主细胞的基于rcti的方法中所用的ti宿主细胞可各自具有整合到ti宿主细胞的基因组的一个或多个基因座处的一个或多个外源核苷酸序列。在某些实施例中,外源核苷酸序列可包含至少两个rrs,其位于至少一个第一选择标志物的侧翼。在某些实施例中,用于选择宿主细胞的基于rcti的方法中的载体可包含:至少两个rrs,其匹配经整合的外源核苷酸上的至少两个rrs;以及一个或多个外源soi以及侧接有rrs的至少一个第二选择标志物。在某些实施例中,外源核苷酸序列可包含位于至少一个第一选择标志物的侧翼的第一rrs和第二rrs,以及位于该第一rrs与该第二rrs之间的第三rrs,且所有rrs都是异种特异性的。在某些实施例中,多个载体可包含第一及第二载体。在某些实施例中,第一载体可包含:两个rrs,其匹配经整合的外源核苷酸序列上的第一rrs和第三rrs并位于至少一个第一外源soi的侧翼,以及至少一个第二选择标志物;并且第二载体可包含两个rrs,其匹配经整合的外源核苷酸序列上的第二rrs和第三rrs并位于至少一个第二外源soi的侧翼。在某些实施例中,多个载体可包含1、2、3、4、5、6、7、8、9、10个或更多个载体。
80.在某些实施例中,目的序列包含多亚基蛋白质复合物的一个或多个亚基的序列。在某些实施例中,该多肽序列可包含此类亚基序列的片段。在某些实施例中,目的序列可包含此类亚基序列的组合。例如,但并非限制性地,该组合可包含第一亚基序列中的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个和/或第二、第三、第四、第五、第六、第七、第八、第九、第十或更多亚基序列的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个序列。此外,在某些实施例中,该组合可包含第一亚基序列中的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个明显变化,和/或第二、第三、第四、第五、第六、第七、第八、第九、第十或更多亚基序列的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个明显变化。
81.在某些实施例中,多个目的序列包含一个或多个重链序列(h)和/或一个或多个抗体轻链序列(l)。如本文所用,该h和l序列可以是全长重链或轻链序列以及重链或轻链片段,包括但不限于变异区片段和互补决定区片段。在某些实施例中,目的序列可包含该h和l序列的组合。例如,但并非限制性地,该组合可包含一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个h序列和一个、两个、三个、四个、五个、六个、七个、八个、九个、
十个或更多个l序列。此外,在某些实施例中,该组合可包含一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个相同或不同的明显h

序列和/或一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个相同或不同的明显l

序列。本发明所公开的主题还包括一至十个(或更多)附加的h和l序列,例如h

、h
″′
、l

和l
″′
。示例性实施例包括但不限于包含各种不同的h序列及各种不同的l序列的任何组合的序列,例如:hl;lh;h

l;lh

;h

l

;l
′h′
;hll;hhl;llh;lhh;h

ll;h

hl;l

hh;l

lh;h
′h′
l;lh
′h′
;hlll;lllh;hlhl;lhlh;h

lll;l

llh;h

lhl;l

hlh;等。
82.在某些实施例中,本公开涉及一种表达soi的方法,其包括:提供多个ti宿主细胞;使该多个ti宿主细胞与多个载体接触,其中该载体包含一个或多个soi和至少一个标志物;将一个或多个soi引入一个或多个该多个ti宿主细胞;选择表达该目的序列的ti细胞;以及在适合于表达目的序列的条件下培养细胞并且从其中回收目的序列。
83.在某些实施例中,转染的宿主细胞将包含一个或多个目的序列,其中目的序列包含多亚基蛋白质复合物的一个或多个亚基的序列。在某些实施例中,该多肽序列可包含此类亚基序列的片段。在某些实施例中,目的序列可包含此类亚基序列的组合。例如,但并非限制性地,该组合可包含第一亚基序列中的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个和/或第二、第三、第四、第五、第六、第七、第八、第九、第十或更多亚基序列的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个序列。此外,在某些实施例中,该组合可包含第一亚基序列中的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个相同或不同的明显变化,和/或第二、第三、第四、第五、第六、第七、第八、第九、第十或更多亚基序列的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个相同或不同的明显变化。
84.在某些实施例中,转染的宿主细胞将包含一个或多个目的序列,其中目的序列包含h及l序列的组合。例如,但并非限制性地,该组合可包含一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个h序列和一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个l序列。此外,在某些实施例中,该组合可包含一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个明显的h

序列和/或一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个明显的l

序列。本发明所公开的主题还包括一至十个(或更多)附加的h和l序列,例如h

、h
″′
、l

和l
″′
。示例性实施例包括但不限于包含各种不同的h序列及各种不同的l序列的任何组合的序列,例如:hl;lh;h

l;lh

;h

l

;l
′h′
;hll;hhl;llh;lhh;h

ll;h

hl;l

hh;l

lh;h
′h′
l;lh
′h′
;hlll;lllh;hlhl;lhlh;h

lll;l

llh;h

lhl;l

hlh;等。
85.3.外源核苷酸序列
86.本发明所公开的主题提供了适合整合外源核苷酸序列的宿主细胞。在某些实施例中,外源核苷酸序列用作整合位点,例如通过包含一个或多个重组酶识别序列来实现。在某些实施例中,外源核苷酸序列编码目的序列。因此,在某些实施例中,宿主细胞将包含一个或多个外源核苷酸序列,该序列将有利于编码一个或多个目的序列的一个或多个外源核苷酸序列的靶向整合。在某些实施例中,包含整合在宿主细胞基因组的整合位点上的外源核苷酸序列的宿主细胞被称为ti宿主细胞。然后可以将编码一个或多个目的序列的外源核苷酸序列引入ti宿主细胞中,并将整合靶向到整合位点。如下文所概述,ti宿主细胞可包含多
个整合位点,这些整合位点由存在的外源核苷酸序列定义,该外源核苷酸序列包含有助于整合编码一个或多个目的序列的外源核苷酸序列的元素(例如重组酶识别序列)。
87.在某些实施例中,整合位点和/或位于整合位点的侧翼的核苷酸序列可通过实验进行识别。在某些实施例中,可通过全基因组筛选方法来识别整合位点和/或位于整合位点的侧翼的核苷酸序列,以分离出以期望的水平表达由整合到一个或多个外源核苷酸序列的一个或多个soi编码的目标多肽,其中外源序列本身被整合到宿主细胞基因组中的一个或多个基因座中。在某些实施例中,在基于转位酶的盒整合事件后,可通过全基因组筛选方法识别整合位点和/或位于整合位点的侧翼的核苷酸序列。在某些实施例中,通过强力随机整合筛选来识别整合位点和/或位于整合位点的侧翼的核苷酸序列。在某些实施例中,整合位点和/或位于整合位点的侧翼的核苷酸序列可通过常规的测序方法确定,例如靶基因座扩增(tla),然后是新一代测序(ngs)和全基因组ngs。在某些实施例中,整合位点在染色体上的位置可通过常规的细胞生物学方法诸如萤光原位杂交(fish)分析来确定。
88.在某些实施例中,宿主细胞包含整合在宿主细胞基因组中特定第一基因座内的第一整合位点处的第一外源核苷酸序列以及整合在基因组中特定第二基因座内的第二整合位点处的第二外源核苷酸序列。在某些实施例中,宿主细胞包含整合在宿主细胞基因组中的多个整合位点处的多个外源核苷酸序列。
89.3.1包含重组酶识别序列的外源序列
90.在某些实施例中,经整合的外源核苷酸序列包含一个或多个重组酶识别序列(rrs),其中rrs可由重组酶进行识别。在某些实施例中,经整合的外源核苷酸序列包含至少两个rrs。在某些实施例中,经整合的外源核苷酸序列包含两个rrs,并且这两个rrs相同。在某些实施例中,经整合的外源核苷酸序列包含两个rrs,并且这两个rrs不同。在某些实施例中,经整合的外源核苷酸序列包含三个rrs,其中第三rrs位于第一rrs与第二rrs之间。在某些实施例中,第一rrs与第二rrs相同,并且第三rrs不同于第一rrs或第二rrs。在某些实施例中,所有三个rrs均不同。在某些实施例中,经整合的外源核苷酸序列包含四个、五个、六个、七个或八个rrs。在某些实施例中,经整合的外源核苷酸序列包含多个rrs。在某些实施例中,所述两个或更多个rrs相同。在某些实施例中,所述两个或更多个rrs不同。在某些实施例中,rrs总数的子集相同,或rrs总数的子集不同。在某些实施例中,一个或多个rrs可选自由以下序列所组成的群组:loxp序列、loxp l3序列、loxp 2l序列、loxfas序列、lox511序列、lox2272序列、lox2372序列、lox5171序列、loxm2序列、lox71序列、lox66序列、frt序列、bxb1 attp序列、bxb1 attb序列、attp序列以及attb序列。
91.在某些实施例中,经整合的外源核苷酸序列包含至少一个选择标志物。在某些实施例中,经整合的外源核苷酸序列包含一个rrs和至少一个选择标志物。在某些实施例中,经整合的外源核苷酸序列包含第一rrs和第二rrs以及至少一个选择标志物。在某些实施例中,选择标志物位于第一rrs与第二rrs之间。在某些实施例中,两个rrs位于至少一个选择标志物的侧翼,即第一rrs位于上游5

端处,并且第二rrs位于选择标志物的下游3

端处。在某些实施例中,第一rrs与选择标志物的5

端相邻,并且第二rrs与选择标志物的3

端相邻。
92.在某些实施例中,选择标志物位于第一rrs与第二rrs之间,并且这两个侧翼rrs相同。在某些实施例中,位于选择标志物的侧翼的两个rrs均为loxp序列。在某些实施例中,位于选择标志物的侧翼的两个rrs均为frt序列。在某些实施例中,选择标志物位于第一rrs与
第二rrs之间,并且这两个侧翼rrs不同。在某些实施例中,第一侧翼rrs为loxp l3序列,并且第二侧翼rrs为loxp 2l序列。在某些实施例中,loxp l3序列位于选择标志物的5

端,并且loxp 2l序列位于选择标志物的3

端。在某些实施例中,第一侧翼rrs为野生型frt序列,并且第二侧翼rrs为突变型frt序列。在某些实施例中,第一侧翼rrs为bxb1attp序列,并且第二侧翼rrs为bxb1 attb序列。在某些实施例中,第一侧翼rrs为attp序列,并且第二侧翼rrs为attb序列。在某些实施例中,两个rrs处于相同的方向。在某些实施例中,两个rrs均处于正向或反向。在某些实施例中,两个rrs处于相反的方向。
93.在某些实施例中,选择标志物可为氨基糖苷磷酸转移酶(aph)(例如,潮霉素磷酸转移酶(hyg)、新霉素和g418aph)、二氢叶酸还原酶(dhfr)、胸苷激酶(tk)、谷氨酰氨合成酶(gs)、天冬酰胺合成酶、色氨酸合成酶(吲哚)、组氨醇脱氢酶(组氨醇d)以及编码对嘌呤霉素、杀稻瘟素、博莱霉素、腐草霉素、氯霉素、吉欧霉素或霉酚酸的抗性的基因。在某些实施例中,选择标志物可为gfp、egfp、合成gfp、yfp、eyfp、cfp、mplum、mcherry、tdtomato、mstrawberry、j-red、dsred单体、morange、mko、mcitrine、venus、ypet、emerald、cypet、mcfpm、cerulean、或t-sapphire标志物。
94.在某些实施例中,经整合的外源核苷酸序列包含侧接有两个rrs的两个选择标志物,其中第一选择标志物不同于第二选择标志物。在某些实施例中,两个选择标志物均选自由以下所组成的组:谷氨酰氨合成酶选择标志物、胸苷激酶选择标志物、hyg选择标志物及嘌呤霉素抗性选择标志物。在某些实施例中,经整合的外源核苷酸序列包含胸苷激酶选择标志物和hyg选择标志物。在某些实施例中,第一选择标志物选自由以下所组成的组:氨基糖苷磷酸转移酶(aph)(例如,潮霉素磷酸转移酶(hyg)、新霉素和g418 aph)、二氢叶酸还原酶(dhfr)、胸苷激酶(tk)、谷氨酰氨合成酶(gs)、天冬酰胺合成酶、色氨酸合成酶(吲哚)、组氨醇脱氢酶(组胺醇d)以及编码对嘌呤霉素、杀稻瘟素、博莱霉素、腐草霉素、氯霉素、吉欧霉素或霉酚酸的抗性的基因,并且第二选择标志物选自由以下所组成的组:gfp、egfp、合成gfp、yfp、eyfp、cfp、mplum、mcherry、tdtomato、mstrawberry、j-red、dsred单体、morange、mko、mcitrine、venus、ypet、emerald、cypet、mcfpm、cerulean、以及t-sapphire标志物。在某些实施例中,第一选择标志物为谷氨酰氨合成酶选择标志物,并且第二选择标志物为gfp标志物。在某些实施例中,位于两个选择标志物的侧翼的两个rrs相同。在某些实施例中,位于两个选择标志物的侧翼的两个rrs不同。
95.在某些实施例中,选择标志物可操作地连接至启动子序列。在某些实施例中,选择标志物可操作地连接至sv40启动子。在某些实施例中,选择标志物可操作地连接至巨细胞病毒(cmv)启动子。
96.在某些实施例中,经整合的外源核苷酸序列包含至少一个选择标志物和ires,其中ires可操作地连接至该选择标志物。在某些实施例中,可操作地连接至ires的选择标志物选自由以下所组成的组:gfp、egfp、合成gfp、yfp、eyfp、cfp、mplum、mcherry、tdtomato、mstrawberry、j-red、dsred单体、morange、mko、mcitrine、venus、ypet、emerald、cypet、mcfpm、cerulean、以及t-sapphire标志物。在某些实施例中,可操作地连接至ires的选择标志物为gfp标志物。在某些实施例中,经整合的外源核苷酸序列包含ires以及侧接有两个rrs的两个选择标志物,其中ires可操作地连接至第二选择标志物。在某些实施例中,经整
合的外源核苷酸序列包含ires以及侧接有两个rrs的三个选择标志物,其中ires可操作地连接至第三选择标志物。在某些实施例中,经整合的外源核苷酸序列包含ires以及侧接有两个rrs的三个选择标志物,其中ires可操作地连接至第三选择标志物。在某些实施例中,第三选择标志物不同于第一选择标志物或第二选择标志物。在某些实施例中,经整合的外源核苷酸序列包含可操作地连接至启动子的第一选择标志物以及可操作地连接至ires的第二选择标志物。在某些实施例中,经整合的外源核苷酸序列包含可操作地连接至sv40启动子的谷氨酰氨合成酶选择标志物以及可操作地连接至ires的gfp选择标志物。在某些实施例中,经整合的外源核苷酸序列包含可操作地连接至cmv启动子的胸苷激酶选择标志物和hyg选择标志物以及可操作地连接至ires的gfp选择标志物。
97.在某些实施例中,经整合的外源核苷酸序列包含三个rrs。在某些实施例中,第三rrs位于第一rrs与第二rrs之间。在某些实施例中,所有三个rrs均相同。在某些实施例中,第一rrs与第二rrs相同,并且第三rrs不同于第一rrs或第二rrs。在某些实施例中,所有三个rrs均不同。
98.在某些实施例中,用作整合位点的外源核苷酸序列将存在于ti宿主细胞的基因组的特定基因座内的位点。在某些实施例中,外源核苷酸所整合到的基因座与选自seq id no.1-7的序列至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源。在某些实施例中,外源核苷酸所整合到的基因座与选自以下的序列至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源:美国专利号9816110的序列seq id no:1-4,对应于本公开的seq id no:8-11;或国际专利申请号pct/us2017/028555的序列seq id no:1,对应于本公开的seq id no:12。
99.在某些实施例中,外源核苷酸序列整合在ti宿主细胞的基因组特定基因座内的位点处。在某些实施例中,外源核苷酸所整合到的基因座与选自下列的序列至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源:contigsnw_006874047.1、nw_006884592.1、nw_006881296.1、nw_003616412.1、nw_003615063.1、nw_006882936.1、以及nw_003615411.1。
100.在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点位于选自seq id no.1的数量为1-1,000bp;1,000-2,000bp;2,000-3,000bp;3,000-4,000bp;以及4,000-4,301bp的核苷酸内。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点位于选自seq id no.2的数量为1-100,000bp;100,000-200,000bp;200,000-300,000bp;300,000-400,000bp;400,000-500,000bp;500,000-600,000bp;600,000-700,000bp;以及700,000-728785bp的核苷酸内。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点位于选自seq id no.3的数量为1-100,000bp;100,000-200,000bp;200,000-300,000bp;300,000-400,000bp;以及400,000-413,983bp的核苷酸内。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点位于选自seq id no.4的数量为1-10,000bp;10,000-20,000bp;20,000-30,000bp;以及30,000-30,757bp的核苷酸内。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点位于选自seq id no.5的数量为1-10,000bp;10,000-20,000bp;20,000-30,000bp;30,000-40,000bp;40,000-50,000bp;50,000-60,000bp;以及60,000-68,962bp的核苷酸内。在某些实施例中,外源核苷酸序列整合在整合位点处,该整
合位点位于选自seq id no.6的数量为1-10,000bp;10,000-20,000bp;20,000-30,000bp;30,000-40,000bp;40,000-50,000bp;以及50,000-51,326bp的核苷酸内。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点位于选自seq id no.7的数量为1-10,000bp;10,000-20,000bp;以及20,000-22,904bp的核苷酸内。
101.在某些实施例中,紧邻经整合的外源序列5

端的核苷酸序列选自由以下所组成的组:nw_006874047.1的核苷酸41190-45269、nw_006884592.1的核苷酸63590-207911、nw_006881296.1的核苷酸253831-491909、nw_003616412.1的核苷酸69303-79768、nw_003615063.1的核苷酸293481-315265、nw_006882936.1的核苷酸2650443-2662054、或nw_003615411.1的核苷酸82214-97705,以及与其至少50%同源的序列。在某些实施例中,紧邻经整合的外源序列5

端的核苷酸序列与nw_006874047.1的核苷酸41190-45269、nw_006884592.1的核苷酸63590-207911、nw_006881296.1的核苷酸253831-491909、nw_003616412.1的核苷酸69303-79768、nw_003615063.1的核苷酸293481-315265、nw_006882936.1的核苷酸2650443-2662054、或nw_003615411.1的核苷酸82214-97705至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源。
102.在某些实施例中,紧邻经整合的外源序列3

端的核苷酸序列选自由以下所组成的组:nw_006874047.1的核苷酸45270-45490、nw_006884592.1的核苷酸207912-792374、nw_006881296.1的核苷酸491910-667813、nw_003616412.1的核苷酸79769-100059、nw_003615063.1的核苷酸315266-362442、nw_006882936.1的核苷酸2662055-2701768、或nw_003615411.1的核苷酸97706-105117,以及与其至少50%同源的序列。在某些实施例中,紧邻经整合的外源序列3

端的核苷酸序列与nw_006874047.1的核苷酸45270-45490、nw_006884592.1的核苷酸207912-792374、nw_006881296.1的核苷酸491910-667813、nw_003616412.1的核苷酸79769-100059、nw_003615063.1的核苷酸315266-362442、nw_006882936.1的核苷酸2662055-2701768、或nw_003615411.1的核苷酸97706-105117至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源。
103.在某些实施例中,经整合的外源核苷酸序列可操作地连接至选自由seq id.no.1-7所组成的组的核苷酸序列,以及与其至少50%同源的序列。在某些实施例中,可操作地连接至外源核苷酸序列的核苷酸序列与选自seq id.no.1-7的序列至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源。在某些实施例中,经整合的外源核苷酸序列包含至少一个soi。在某些实施例中,与随机经整合的soi相比,可操作地连接的核苷酸序列增加了soi的表达水平。在某些实施例中,经整合的外源soi比随机经整合的soi的表达高约20%、30%、40%、50%、100%、2倍、3倍、5倍或10倍。
104.在某些实施例中,经整合的外源序列的5

端侧接有选自由以下所组成的组的核苷酸序列:nw_006874047.1的核苷酸41190-45269、nw_006884592.1的核苷酸63590-207911、nw_006881296.1的核苷酸253831-491909、nw_003616412.1的核苷酸69303-79768、nw_003615063.1的核苷酸293481-315265、nw_006882936.1的核苷酸2650443-2662054、和nw_003615411.1的核苷酸82214-97705,以及与其至少50%同源的序列;并且3

端侧接有选自
由以下所组成的组的核苷酸序列:nw_006874047.1的核苷酸45270-45490、nw_006884592.1的核苷酸207912-792374、nw_006881296.1的核苷酸491910-667813、nw_003616412.1的核苷酸79769-100059、nw_003615063.1的核苷酸315266-362442、nw_006882936.1的核苷酸2662055-2701768、和nw_003615411.1的核苷酸97706-105117,以及与其至少50%同源的序列。在某些实施例中,位于经整合的外源核苷酸序列的5

端的侧翼的核苷酸序列与nw_006874047.1的核苷酸41190-45269、nw_006884592.1的核苷酸63590-207911、nw_006881296.1的核苷酸253831-491909、nw_003616412.1的核苷酸69303-79768、nw_003615063.1的核苷酸293481-315265、nw_006882936.1的核苷酸2650443-2662054、以及nw_003615411.1的核苷酸82214-97705至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源,并且位于经整合的外源核苷酸序列的3

端的侧翼的核苷酸序列与nw_006874047.1的核苷酸45270-45490、nw_006884592.1的核苷酸207912-792374、nw_006881296.1的核苷酸491910-667813、nw_003616412.1的核苷酸79769-100059、nw_003615063.1的核苷酸315266-362442、nw_006882936.1的核苷酸2662055-2701768、以及nw_003615411.1的核苷酸97706-105117至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源。
105.在某些实施例中,经整合的外源核苷酸整合至紧邻选自由以下序列所组成的组的序列的全部或一部分的基因座中,该序列与选自seq id no.1-7的序列至少约90%同源。
106.在某些实施例中,经整合的外源核苷酸序列邻近选自由seq id.no.1-7以及与其至少50%同源的序列所组成的组的核苷酸序列。在某些实施例中,经整合的外源核苷酸序列与选自由seq id.no.1-7以及与其至少50%同源的序列所组成的组的序列相距约100bp、约200bp、约500bp、约1kb。在某些实施例中,邻近外源核苷酸序列的核苷酸序列与选自seq id.no.1-7的序列至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源。
107.在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点邻近选自seq id no.1的数量为1-1,000bp;1,000-2,000bp;2,000-3,000bp;3,000-4,000bp;以及4,000-4,301bp的核苷酸。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点邻近选自seq id no.2的数量为1-100,000bp;100,000-200,000bp;200,000-300,000bp;300,000-400,000bp;400,000-500,000bp;500,000-600,000bp;600,000-700,000bp;以及700,000-728785bp的核苷酸。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点邻近选自seq id no.3的数量为1-100,000bp;100,000-200,000bp;200,000-300,000bp;300,000-400,000bp;以及400,000-413,983bp的核苷酸。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点邻近选自seq id no.4的数量为1-10,000bp;10,000-20,000bp;20,000-30,000bp;以及30,000-30,757bp的核苷酸。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点邻近选自seq id no.5的数量为1-10,000bp;10,000-20,000bp;20,000-30,000bp;30,000-40,000bp;40,000-50,000bp;50,000-60,000bp;以及60,000-68,962bp的核苷酸。在某些实施例中,外源核苷酸序列整合在整合位点处,该整合位点邻近选自seq id no.6的数量为1-10,000bp;10,000-20,000bp;20,000-30,000bp;30,000-40,000bp;40,000-50,000bp;以及50,000-51,326bp的核苷酸。在某些实施例中,外源核苷
酸序列整合在整合位点处,该整合位点邻近选自seq id no.7的数量为1-10,000bp;10,000-20,000bp;以及20,000-22,904bp的核苷酸。
108.在某些实施例中,包含外源核苷酸序列的整合位点的基因座不编码开放读框(orf)。在某些实施例中,包含外源核苷酸序列的整合位点的基因座包括顺式作用元件,例如启动子和增强子。在某些实施例中,包含外源核苷酸序列的整合位点的基因座不含任何增强基因表达的顺式作用元件,例如启动子和增强子。
109.在某些实施例中,外源核苷酸序列整合在外源基因内的整合位点处,该外源基因选自由loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、以及xp_003512331.2所组成的组。内源loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、以及xp_003512331.2基因包括loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、以及xp_003512331.2基因的野生型和所有同源性序列。在某些实施例中,loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、及xp_003512331.2基因的同源性序列可与野生型loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、及xp_003512331.2基因至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%、或至少约99.9%同源。在某些实施例中,loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、以及xp_003512331.2基因为野生型哺乳动物loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、以及xp_003512331.2基因。在某些实施例中,loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、以及xp_003512331.2基因为野生型人loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、以及xp_003512331.2基因。在某些实施例中,loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、以及xp_003512331.2基因为野生型仓鼠loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、以及xp_003512331.2基因。
110.在某些实施例中,整合位点可操作地连接至选自由loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、xp_003512331.2及其至少约90%同源的序列所组成的组的内源基因。在某些实施例中,整合位点侧接有选自由loc107977062、loc100768845、itpr2、ere67000.1、ubap2、mtmr2、xp_003512331.2及其至少约90%同源的序列所组成的组的内源基因。
111.表1提供了示例性ti宿主细胞整合位点:
112.表1-ti宿主细胞整合位点
[0113][0114]
3.2包含目的序列的外源核苷酸序列
[0115]
在某些实施例中,经整合的外源核苷酸序列包含至少一个外源soi。在某些实施例
中,经整合的外源核苷酸序列包含至少一个选择标志物以及至少一个外源soi。在某些实施例中,经整合的外源核苷酸序列包含至少一个选择标志物、至少一个外源soi、以及至少一个rrs。在某些实施例中,经整合的外源核苷酸序列包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个或更多soi。在某些实施例中,soi相同。在某些实施例中,soi不同。
[0116]
如上所述,在某些实施例中,soi编码多亚基蛋白质复合物的一个或多个亚基。在某些实施例中,该多肽序列可包含此类亚基序列的片段。在某些实施例中,目的序列可包含此类亚基序列的组合。例如,但并非限制性地,该组合可包含第一亚基序列中的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个和/或第二、第三、第四、第五、第六、第七、第八、第九、第十或更多亚基序列的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个序列。此外,在某些实施例中,该组合可包含第一亚基序列中的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个明显变化,和/或第二、第三、第四、第五、第六、第七、第八、第九、第十或更多亚基序列的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个明显变化。
[0117]
在某些实施例中,soi编码单链抗体或其片段。在某些实施例中,soi编码抗体重链序列或其片段。在某些实施例中,soi编码抗体轻链序列或其片段。在某些实施例中,经整合的外源核苷酸序列包含编码抗体重链序列或其片段的soi以及编码抗体轻链序列或其片段的soi。在某些实施例中,经整合的外源核苷酸序列包含编码第一抗体重链序列或其片段的soi、编码第二抗体重链序列或其片段的soi以及编码抗体轻链序列或其片段的soi。在某些实施例中,经整合的外源核苷酸序列包含编码第一抗体重链序列或其片段的soi、编码第二抗体重链序列或其片段的soi、编码抗体第一轻链序列或其片段的soi以及编码抗体轻链序列或其片段的第二soi。在某些实施例中,可选择编码重链和轻链序列的soi的数目,以实现所需的重链和轻链多肽的表达水平,例如,以实现所需量的双特异性抗体产生。在某些实施例中,可以将编码重链和轻链序列的单个soi整合到,例如,存在于单个整合位点处的单个外源核酸序列、存在于单个整合位点处的多个外源核酸序列、或整合在ti宿主细胞内不同整合位点处的多个外源核酸序列。
[0118]
在某些实施例中,经整合的外源核苷酸序列包含至少一个选择标志物、至少一个外源soi、以及一个rrs。在某些实施例中,rrs邻近至少一个选择标志物或至少一个外源soi。在某些实施例中,经整合的外源核苷酸序列包含至少一个选择标志物、至少一个外源soi、以及两个rrs。在某些实施例中,经整合的外源核苷酸序列包含至少一个选择标志物以及位于第一rrs与第二rrs之间的至少一个外源soi。在某些实施例中,位于两个选择标志物的侧翼的两个rrs与外源soi相同。在某些实施例中,位于两个选择标志物的侧翼的两个rrs与外源soi不同。在某些实施例中,第一侧翼rrs为loxp l3序列,并且第二侧翼rrs为loxp 2l序列。在某些实施例中,l3 loxp序列位于选择标志物和外源soi的5

端,并且loxp 2l序列位于选择标志物和外源soi的3

端。
[0119]
在某些实施例中,经整合的外源核苷酸序列包含三个rrs以及两个外源soi,并且第三rrs位于第一rrs与第二rrs之间。在某些实施例中,第一soi位于第一rrs与第三rrs之间,并且第二soi位于第三rrs与第三rrs之间。在某些实施例中,第一soi和第二soi不同。在某些实施例中,第一rrs与第二rrs相同,并且第三rrs不同于第一rrs或第二rrs。在某些实
施例中,所有三个rrs均不同。在某些实施例中,第一rrs为loxp l3位点,第二rrs为loxp 2l位点,第三rrs为loxfas位点。在某些实施例中,经整合的外源核苷酸序列包含三个rrs、一个外源soi以及一个选择标志物。在某些实施例中,该soi位于第一rrs与第三rrs之间,并且选择标志物位于第三rrs与第三rrs之间。在某些实施例中,经整合的外源核苷酸序列包含三个rrs、两个外源soi以及一个选择标志物。在某些实施例中,第一soi和选择标志物位于第一rrs与第三rrs之间,并且第二soi位于第三rrs与第三rrs之间。
[0120]
在某些实施例中,外源soi编码目的多肽,包括但不限于抗体、酶、细胞因子、生长因子、激素、病毒蛋白、细菌蛋白、疫苗蛋白、或具有治疗功能的蛋白质。在某些实施例中,外源soi编码抗体或其抗原结合片段。在某些实施例中,外源soi编码单链抗体、抗体轻链、抗体重链、单链fv片段(scfv)、或fc融合蛋白。在某些实施例中,外源soi可操作地连接至至少一个顺式作用元件,例如启动子或增强子。在某些实施例中,外源soi可操作地连接至cmv启动子。
[0121]
在某些实施例中,经整合的外源核苷酸序列包含两个rrs和位于两个rrs之间的至少两个外源soi。在某些实施例中,编码抗体的一条重链和一条轻链的soi位于两个rrs之间。在某些实施例中,编码抗体的一条重链和两条轻链的soi位于两个rrs之间。在某些实施例中,编码抗体的重链和轻链的拷贝的不同组合的soi位于两个rrs之间。
[0122]
在某些实施例中,经整合的外源核苷酸序列包含三个rrs和至少两个外源soi,并且第三rrs位于第一rrs与第二rrs之间。在某些实施例中,至少一个soi位于第一rrs与第三rrs之间,并且至少一个soi位于第三rrs与第三rrs之间。在某些实施例中,第一rrs与第二rrs相同,并且第三rrs不同于第一rrs或第二rrs。在某些实施例中,所有三个rrs均不同。在某些实施例中,编码第一抗体的一条重链和一条轻链的soi位于第一rrs与第三rrs之间,并且编码第二抗体的一条重链和一条轻链的soi位于第三rrs与第二rrs之间。在某些实施例中,编码第一抗体的一条重链和两条轻链的soi位于第一rrs与第三rrs之间,并且编码第二抗体的一条重链和一条轻链的soi位于第三rrs与第二rrs之间。在某些实施例中,编码第一抗体的一条重链和三条轻链的soi位于第一rrs与第三rrs之间,并且编码第一抗体的一条轻链和第二抗体的一条重链和一条轻链的soi位于第三rrs与第二rrs之间。在某些实施例中,编码第一抗体的一条重链和三条轻链的soi位于第一rrs与第三rrs之间,并且编码第一抗体的两条轻链和第二抗体的一条重链和一条轻链的soi位于第三rrs与第二rrs之间。在某些实施例中,编码多个抗体的重链和轻链拷贝的不同组合的soi位于第一rrs与第三rrs之间以及第三rrs与第二rrs之间。
[0123]
4.宿主细胞
[0124]
在某些实施例中,宿主细胞为真核宿主细胞。在某些实施例中,宿主细胞为哺乳动物宿主细胞。在某些实施例中,宿主细胞为仓鼠宿主细胞、人宿主细胞、大鼠宿主细胞、或小鼠宿主细胞。在某些实施例中,宿主细胞为中国仓鼠卵巢(cho)宿主细胞、cho k1宿主细胞、cho k1sv宿主细胞、dg44宿主细胞、dukxb-11宿主细胞、chok1s宿主细胞、或cho k1m宿主细胞。
[0125]
在某些实施例中,宿主细胞选自由以下所组成的组:由sv40(cos-7)转化的猴肾cv1系;人胚胎肾系(如graham等人,j.gen virol.36:59(1977)中所述的293或293细胞);幼仓鼠肾细胞(bhk);小鼠睾丸支持细胞(如mather,biol.reprod.23∶243-251(1980)中所述
的tm4细胞);猴肾细胞(cv1);非洲绿猴肾细胞(vero-76);人宫颈癌细胞(hela);犬肾细胞(mdck);水牛鼠肝细胞(brl 3a);人肺细胞(w138);人肝细胞(hep g2);小鼠乳腺肿瘤细胞(mmt 060562);tri细胞(如mather等人,annalsn.y.acad.sci.383∶44-68(1982)所述)、mrc 5细胞、fs4细胞、y0细胞、ns0细胞、sp2/0细胞、以及细胞。
[0126]
在某些实施例中,宿主细胞是细胞系。在某些实施例中,宿主细胞是已经培养了多代的细胞系。在某些实施例中,宿主细胞是原代细胞。
[0127]
在某些实施例中,如果在10、20、30、50、100、200或300代内表达水平维持在一定水平,提升或降低小于20%,则认为目的多肽的表达是稳定的。在某些实施例中,如果无需进行任何选择即可维持培养,则目的多肽的表达是稳定的。在某些实施例中,如果目的基因的多肽产物达到约1g/l、约2g/l、约3g/l、约4g/l、约5g/l、约10g/l、约12g/l、约14g/l、或约16g/l,则表明目的多肽的表达水平高。
[0128]
在某些实施例中,产生目的多肽并将其分泌到细胞培养基中。在某些实施例中,目的多肽得到表达并保留在宿主细胞内。在某些实施例中,目的多肽得到表达,被插入并保留在宿主细胞膜内。
[0129]
可利用常规细胞生物学方法将目的外源核苷酸或载体引入宿主细胞,这些方法包括但不限于转染、转导、电穿孔或注射。在某些实施例中,利用基于化学的转染方法将目的外源核苷酸或载体引入宿主细胞,这些方法包括基于脂质的转染方法、基于磷酸钙的转染方法、基于阳离子聚合物的转染方法或基于纳米颗粒的转染。在某些实施例中,利用病毒介导的转导方法将目的外源核苷酸引入宿主细胞,该方法包括但不限于慢病毒、逆转录病毒、腺病毒或腺相关病毒介导的转导。在某些实施例中,利用基因枪介导的注射将目的外源核苷酸引入宿主细胞。在某些实施例中,使用本文所述的方法将dna和rna分子均引入宿主细胞。
[0130]
5.靶向整合
[0131]
靶向整合方法可以将外源核苷酸序列整合到宿主细胞基因组的一个或多个预定位点。在某些实施例中,靶向整合由识别一个或多个rrs的重组酶介导。在某些实施例中,靶向整合由同源重组介导。在某些实施例中,靶向整合由外源位点特异性核酸酶介导,然后由hdr和/或nhej介导。
[0132]
5.1.通过重组酶介导的重组进行靶向整合
[0133]

重组酶识别序列

(rrs)是由重组酶识别的核苷酸序列,并且对于重组酶介导的重组事件是必要和充分的。rrs可用于定义核苷酸序列中将发生重组事件的位置。
[0134]
在某些实施例中,rrs选自由以下序列所组成的群组:loxp序列、loxp l3序列、loxp 2l序列、loxfas序列、lox511序列、lox2272序列、lox2372序列、lox5171序列、loxm2序列、lox71序列、lox66序列、frt序列、bxb1 attp序列、bxb1 attb序列、attp序列以及attb序列。
[0135]
在某些实施例中,rrs可由cre重组酶识别。在某些实施例中,rrs可由flp重组酶识别。在某些实施例中,rrs可由bxb1整合酶识别。在某些实施例中,rrs可由整合酶识别。
[0136]
在某些实施例中,当rrs为loxp位点时,宿主细胞需要cre重组酶进行重组。在某些
实施例中,当rrs为frt位点时,宿主细胞需要flp重组酶进行重组。在某些实施例中,当rrs为bxb1 attp或bxbl attb位点时,宿主细胞需要bxb1整合酶进行重组。在某些实施例中,当rrs为attp或a1attb位点时,宿主细胞需要整合酶进行重组。可使用包含酶的编码序列的表达载体将重组酶引入宿主细胞。
[0137]
cre-loxp位点特异性重组体系已广泛用于许多生物学实验系统中。cre是一种38kda位点特异性dna重组酶,可识别34bp loxp序列。cre来源于噬菌体p1,并且属于酪氨酸家族位点特异性重组酶。cre重组酶可以介导loxp序列之间的分子内和分子间重组。loxp序列由8bp的非回文核心区组成,该非回文核心区侧接有两个13bp的反向重复序列。cre重组酶与13bp重复序列结合,从而介导8bp核心区内的重组。cre-loxp介导的重组效率高,且无需任何其他宿主因子。如果将两个loxp序列以相同的方向置于同一核苷酸序列上,则cre介导的重组将切除位于两个loxp序列之间的dna序列,使其成为共价闭合环。如果两个loxp序列位于同一核苷酸序列的反向位置,则cre介导的重组将颠倒位于两个序列之间的dna序列的方向。还可以将loxp序列置于不同的染色体上,以促进不同染色体之间的重组。如果两个loxp序列位于两个不同dna分子上,并且一个dna分子是环状分子,则cre介导的重组将导致环状dna序列的整合。
[0138]
在某些实施例中,loxp序列为野生型loxp序列。在某些实施例中,loxp序列为突变型loxp序列。已开发出突变型loxp序列以提高cre介导的整合或替换的效率。在某些实施例中,突变型loxp序列选自由以下序列所组成的组:loxp l3序列、loxp 2l序列、loxfas序列、lox511序列、lox2272序列、lox2372序列、lox5171序列、loxm2序列、lox71序列、以及lox66序列。例如,lox71序列在左侧13bp重复序列中具有5bp的突变。lox66序列在右侧13bp重复序列中具有5bp的突变。野生型和突变型loxp序列均可介导cre依赖性重组。
[0139]
flp-frt位点特异性重组系统类似于cre-lox系统。其中涉及翻转酶(flp)重组酶,该酶来源于酿酒酵母的2μm质粒。flp也属于酪氨酸家族位点特异性重组酶。frt序列是一种34bp序列,由各自位于8bp间隔区的侧翼的两个13bp回文序列组成。flp与13bp回文序列结合,并在8bp间隔区内介导dna断裂、交换和连接。与cre重组酶类似,两个frt序列的位置和方向决定了flp介导的重组的结果。在某些实施例中,frt序列为野生型frt序列。在某些实施例中,frt序列为突变型frt序列。野生型和突变型frt序列均可介导flp依赖性重组。在某些实施例中,frt序列与应答性受体结构域序列诸如但不限于他莫昔芬应答性受体结构域序列融合。
[0140]
bxb1和属于丝胺酸重组酶家族。它们均来源于噬菌体,并被这些噬菌体用于确定溶原性,以促进噬菌体基因组到细菌基因组的位点特异性整合。这些整合酶催化短(40-60bp)dna基质(称为attp和attb序列)之间的位点特异性重组事件,这些基质最初分别为位于噬菌体dna和细菌dna上的附着位点。重组后,形成两个新序列,分别称为attl和attr序列,并且每个序列包含来源于attp和attb的一半序列。重组也可能发生在attl与attr之间,以将经整合的噬菌体从细菌dna中切除。两种整合酶均可催化重组,而无需任何其他宿主因子的辅助。在不存在任何辅助因子的情况下,这些整合酶介导的attp与attb之间的单向重组效率超过80%。由于可由这些整合酶识别的短dna序列及单向重组,因此将这些重组系统开发为对广泛用于基因工程目的的cre-loxp和frt-flp系统的补充。
[0141]
术语

匹配rrs

表示两个rrs之间发生重组。在某些实施例中,两个匹配rrs相同。在某些实施例中,两个rrs均为野生型loxp序列。在某些实施例中,两个rrs均为突变型loxp序列。在某些实施例中,两个rrs均为野生型frt序列。在某些实施例中,两个rrs均为突变型frt序列。在某些实施例中,两个匹配rrs为不同序列,但是可通过相同的重组酶识别。在某些实施例中,第一匹配rrs是bxb1 attp序列,并且第二匹配rrs是bxb1 attb序列。在某些实施例中,第一匹配rrs是attb序列,并且第二匹配rrs是attb序列。
[0142]
在某些实施例中,采用

单载体rmce

策略。例如,在某些实施例中,经整合的外源核苷酸序列包含两个rrs,并且载体包含两个rrs,该两个rrs匹配经整合的外源核苷酸序列上的两个rrs,即经整合的外源核苷酸序列上的第一rrs匹配载体上的第一rrs,并且经整合的外源核苷酸序列上的第二rrs匹配载体上的第二rrs。在某些实施例中,经整合的外源核苷酸序列上的第一rrs和载体上的第一rrs与经整合的外源核苷酸序列上的第二rrs和载体上的第二rrs相同。在某些实施例中,经整合的外源核苷酸序列上的第一rrs和载体上的第一rrs与经整合的外源核苷酸序列上的第二rrs和载体上的第二rrs不同。在某些实施例中,经整合的外源核苷酸序列上的第一rrs和载体上的第一rrs均为loxp l3序列,并且经整合的外源核苷酸序列上的第二rrs和载体上的第二rrs均为loxp 2l序列。
[0143]
在某些实施例中,采用

双载体rmce

策略。例如,但并非限制性地,经整合的外源核苷酸序列可包含三个rrs,例如其排列方式为第三rrs(rrs3)存在于第一rrs(rrs1)与第二rrs(rrs2)之间,而第一载体包含两个rrs,该两个rrs匹配经整合的外源核苷酸序列上的第一rrs和第三rrs,并且第二载体包含两个rrs,该两个rrs匹配经整合的外源核苷酸序列上的第三rrs和第二rrs。通过在每对rrs之间整合适当数量的soi,这两种载体rmce策略均允许引入十个或更多个soi。
[0144]
单载体和双载体rmce均允许将一个或多个供体dna分子单向整合到宿主细胞基因组的预定位点中,并使供体dna上存在的dna盒与整合位点所在的宿主基因组上的dna盒精确交换。dna盒的特征在于,位于至少一个选择标志物的侧翼的两个异种特异rrs(尽管在某些双载体rmce实例中,可使用如本文所概述的

分离选择标志物

)和/或至少一个外源soi。rmce参与靶基因组基因座内两个异种特异rrs与供体dna分子之间的重组酶催化的双重重组交换事件。rmce旨在将soi或选择标志物的拷贝引入宿主细胞基因组的预定位点。与仅涉及一个交换事件的重组不同,rmce可实施为不将原核载体序列引入宿主细胞基因组中,从而减少和/或防止不希望的宿主免疫或防御机制触发。可使用多个dna盒重复执行rmce程序,例如,在图2b中,采用rmce程序方便地引入三个不同的

前位

盒和三个不同的

后位

盒。但是,如上所述,可以采用rmce(和其他整合策略)引入少至一个盒以及多达十个或更多个盒。
[0145]
在某些实施例中,通过一次交换重组事件实现靶向整合,其中将包含与至少一个外源soi或至少一个选择标志物相邻的一个rrs的一个外源核苷酸序列整合到宿主细胞基因组的预定位点。在某些实施例中,通过一次rmce实现靶向整合,其中将包含至少一个外源soi或至少一个选择标志物(侧接有两个异种特异rrs)的dna盒整合到宿主细胞基因组的预定位点。在某些实施例中,靶向整合通过两次rmce实现,其中将各自包含至少一个外源soi或至少一个选择标志物(侧接有两个异种特异rrs)的两个不同的dna盒整合到宿主细胞基因组的预定位点。在某些实施例中,靶向整合通过多次rmce实现,其中将来自多个载体的
dna盒(各自包含至少一个外源soi或至少一个选择标志物(侧接有两个异种特异rrs))全部整合到宿主细胞基因组的预定位点。在某些实施例中,选择标志物可部分地编码在第一载体上,并且部分地编码在第二载体上,使得两次rmce的整合均允许表达选择标志物。
[0146]
在某些实施例中,通过重组酶介导的重组实现的靶向整合导致选择标志物或一个或多个外源soi与来自原核载体的序列一起整合到宿主细胞基因组的一个或多个预定整合位点。在某些实施例中,通过重组酶介导的重组实现的靶向整合导致选择标志物或一个或多个外源soi整合到宿主细胞基因组的一个或多个预定整合位点,而不包含来自原核载体的序列。
[0147]
5.2通过同源重组(hdr或nhej(进行靶向整合
[0148]
本发明所公开的主题还涉及通过同源重组或通过外源位点特异性核酸酶以及hdr或nhej介导的靶向整合。在某些实施例中,该整合在本文中称为

基因编辑介导的整合


[0149]
同源重组是具有广泛序列同源性的dna分子之间的重组。它可用于引导双链dna断裂的无错误修复,并在减数分裂过程中在配子中产生序列变异。由于同源重组涉及两个同源dna分子之间的遗传信息交换,因此不改变基因在染色体上的整体排列。在同源重组过程中,双链dna(dsdna)形成缺口或断裂,然后单链dna末端侵入同源dsdna分子,同源序列发生配对,分支迁移以形成霍利迪连结体,并最终分离霍利迪连结体。
[0150]
双链断裂(dsb)是最严重的dna损伤形式,此类dna损伤的修复对于维持所有生物体的基因组的完整性至关重要。dsb修复途径主要有两种。第一种修复途径是同源性定向修复(hdr)途径,并且同源重组是hdr中最常用的形式。由于hdr需要细胞中存在同源dna,因此该修复途径通常用于细胞周期的s和g2期,其中新复制的姐妹染色单体可作为同源模板。hdr也是修复dna复制过程中折叠的复制叉的主要修复途径。hdr被视为一种相对无错误的修复途径。针对dsb的第二修复途径是非同源末端连接(nhej)。nhej作为一种修复途径,其中将断裂dna的末端连接在一起而无需同源dna模板。
[0151]
外源位点特异性核酸酶,例如基因编辑核酸酶,然后是hdr,可以促进靶向整合。这是因为可通过在特定靶基因组位点处引入dsb来增加同源重组的频率。在某些实施例中,外源核酸酶可选自由以下各项所组成的组:锌指核酸酶(zfn)、zfn二聚体、转录激活因子样效应物核酸酶(talen)、tal效应子结构域融合蛋白、rna引导的dna核酸内切酶、工程化大范围核酸酶以及成簇的规律间隔的短回文重复序列(crispr)关联(cas)的核酸内切酶。
[0152]
crispr/cas和talen系统是两种基因组编辑工具,可提供最佳的构建简便性和高效率。crispr/cas被认为是细菌对入侵噬菌体的免疫防御机制。cas是一种核酸酶,当由合成导向rna(grna)引导时,能够与细胞中的特定核苷酸序列相关联,并且通过例如形成单链断裂、dsb和/或点突变中的一种或多种来编辑核苷酸序列内或周围的dna。talen是一种工程化位点特异性核酸酶,由tale(转录激活因子样效应物)的dna结合结构域和限制性核酸内切酶foki的催化结构域组成。通过改变dna结合结构域单体的高度可变的残基区域中存在的氨基酸,可创建不同的人工talen,以靶向各种核苷酸序列。dna结合结构域随后将核酸酶引导至靶序列,并创建dsb。
[0153]
通过同源重组或hdr进行的靶向整合涉及使同源序列存在于整合位点。在某些实施例中,同源序列存在于载体上。在某些实施例中,同源序列存在于多核苷酸上。
[0154]
在某些实施例中,同源重组在不含任何辅助因子的情况下进行。在某些实施例中,
由于能够经整合的载体的存在而促进同源重组。在某些实施例中,整合载体选自由以下各项所组成的组:腺相关病毒载体、慢病毒载体、逆转录病毒载体及噬菌体整合载体。
[0155]
5.3调控系统
[0156]
本公开的主题进一步涉及在rcti(称为

随机化构型靶向整合

(在本文中也称为

随机链调控靶向整合

(rcrti))中使用的调控系统。例如,在许多情况下,蛋白质表达水平并非最佳,主要是由于编码蛋白难以表达。难以表达的蛋白质的低表达水平可能具有不同的难以确定的原因。一种可能是宿主细胞中表达的蛋白质的毒性。在此等情况下,可使用调控表达系统来表达有毒蛋白质,其中编码蛋白质的目的序列在诱导型启动子的控制下。在这些系统中,仅当将调节剂诸如但不限于四环素或其类似物强力霉素(dox)等小分子加入培养基时,才引起难以表达的蛋白质的表达。调节有毒蛋白质的表达可减轻其毒性作用,使培养物在生产前达到所需的细胞生长。在某些实施例中,

随机化构型调控靶向整合

(本文中也称为

随机化链调控靶向整合

(rcrti)系统包含整合到特定基因座(例如包含一个或多个rrs的外源核酸序列)的soi,并在与其可操作连接的调控启动子下转录。在某些实施例中,rcrti系统可用于确定难于表达的分子(例如但不限于抗体)的蛋白质表达水平低的根本原因。在某些实施例中,可通过选择性关闭rcrti系统中soi的表达的能力将soi的表达与观察到的不良反应联系起来。
[0157]
在某些实施例中,为了在难以表达的分子的根本原因分析过程中最小化转录和细胞系变异性的影响,可使用

随机化构型调控靶向整合

(本文中也称为

随机化链调控靶向整合

(rcrti)系统。例如,但并非限制性地,可通过向培养物中添加调节剂例如多西环素来触发ti宿主中soi的表达。在某些实施例中,rcrti载体利用四环素调节的启动子表达soi,该soi可整合到例如包含rrs的外源核酸序列中,而rrs本身可整合到宿主细胞基因组的整合位点中,以实现soi的调控表达。
[0158]
在某些实施例中,与对照细胞系相比,本公开中描述的rcrti系统可用于成功确定soi例如治疗性抗体的低蛋白表达水平的根本原因。在某些实施例中,一旦确认soi(例如治疗性抗体)在rcrti细胞系中的相对表达水平较低,便可利用蛋白质翻译抑制剂治疗(例如,dox及放线菌酮)来评估soi的细胞内积累和分泌水平。
[0159]
例如,但并非限制性地,该调控可基于通过调节转录抑制因子或激活因子与组成或最小启动子的偶联来阻断或激活mrna合成的基因开关。在某些非限制性实施例中,可通过结合抑制蛋白来实现抑制,例如,该蛋白在空间上阻断转录起始,或通过抑制转录沉默子主动抑制转录。在某些非限制性实施例中,哺乳动物或无病毒增强子的最小启动子的激活可通过与激活结构域的调节式偶联来实现。
[0160]
在某些实施例中,转录抑制因子或激活因子的条件式偶联可通过使用变构蛋白质来实现,该变构蛋白质能结合启动子以响应于外部刺激。在某些实施例中,转录抑制因子或激活因子的条件式偶联可通过使用从螯合蛋白质释放的细胞内受体来实现,从而能够结合靶启动子。在某些实施例中,转录抑制因子或激活因子的条件式偶联可通过使用化学诱导的二聚体来实现。
[0161]
在某些实施例中,本公开的ti系统中所用的变构蛋白质可为响应于抗生素、细菌群体感应信使、分解代谢物或培养参数诸如温度(冷或热)而调节转录活性的蛋白质。在某些实施例中,该rcrti系统可基于分解代谢物,例如,将控制其他碳源分解代谢基因的细菌
抑制因子转移到哺乳动物细胞中。在某些实施例中,可通过抑制因子cymr的累积应答结合来抑制靶启动子。在某些实施例中,基于分解代谢物的系统可通过与单纯疱疹vp16反式激活结构域融合的原核抑制因子hdnor的6-羟基烟碱反应性结合,依赖于嵌合启动子的激活。
[0162]
在某些实施例中,ti系统可为基于群体感应的表达系统,该系统来源于原核生物,该原核生物通过群体感应分子来管理群体内和群体间交流。该群体感应分子与靶细胞中的受体结合,调节受体与同源启动子的亲和性,从而引发特定调节子开关的启动。在某些实施例中,群体感应分子可为n-(3-氧代-辛酰基)-高丝氨酸内酯,在存在该分子的情况下,trar-p65融合蛋白激活融合到trar特异性操纵子序列的最小启动子的表达。在某些实施例中,在基于天蓝色链霉菌a3(2)scbr抑制因子(在不存在scb1的情况下结合其同源操纵子oscbr)的系统中,群体感应分子可以为丁内酯scb1(外消旋2-(1
′‑
羟基-6-甲基庚基)-3-(羟甲基)-丁醇化物)。在某些实施例中,群体感应分子可以为rti系统中所用的高丝氨酸衍生诱导剂,其中铜绿假单胞菌群体感应抑制因子rhlr和lasr与sv40 t抗原核定位序列和单纯疱疹vp16结构域融合并可激活包含特定操纵子序列的启动子(las框)。
[0163]
在某些实施例中,调节本公开的rcrti系统中所用的变构蛋白质的诱导分子可以为但不限于cumate、异丙基-β-d-吡喃半乳糖苷(iptg)、大环内酯类、6-羟烟碱、强力霉素、链阳菌素、nadh、四环素。
[0164]
在某些实施例中,本公开的rcrti系统中所用的细胞内受体可以为细胞质或核受体。在某些实施例中,本公开的rcrti系统可利用通过小分子从螯合和抑制蛋白质中释放出转录因子。在某些实施例中,本公开的rcrti系统可依赖类固醇调节,其中激素受体与天然或人工转录因子融合,该天然或人工转录因子可从hsp90在细胞质中释放出来,迁移至细胞核中并激活选定的启动子。在某些实施例中,可使用由合成类固醇类似物调节的突变型受体,以免内生类固醇激素引起串扰。在某些实施例中,受体可以是对4-羟基他莫昔芬有反应的雌激素受体变体或可经ru486诱导的孕激素受体突变体。在某些实施例中,基于人核过氧化物酶体增殖物激活受体γ(pparγ)的核受体衍生的罗格列酮响应转录开关可用于本发明的rcrti系统中。在某些实施例中,rheoswitch可为类固醇反应性受体的变体,其基于修饰后的云杉色卷蛾蜕皮激素受体和融合至gal4 dna结合结构域和vp 16反式激活因子的小鼠类视色素x受体(rxr)。在存在合成蜕皮激素的情况下,rheoswitch变体可结合并激活与gal4反应元件的多个重复序列融合的最小启动子。
[0165]
在某些实施例中,本文所公开的rcrti系统可利用化学诱导的dna结合蛋白和转录激活因子的二聚作用来激活与同源操纵子融合的最小核心启动子。在某些实施例中,本文所公开的rcrti系统可利用雷帕霉素调节的frbp与frb的二聚作用。在该系统中,frb与p65反式激活因子融合,并且fkbp与锌指结构域融合,该锌指结构域特异于置于工程化最小白细胞介素12启动子上游的同源操纵子位点。在某些实施例中,fkbp可发生突变。某些实施例中,本文所公开的rcrti系统可利用细菌促旋酶b亚基(gyrb),其中在存在抗生素库马霉素的情况下gyrb发生二聚作用并与新生霉素解离。
[0166]
在某些实施例中,本公开的rcrti系统可用于受调控的sirna表达。在某些实施例中,受调控的sirna表达系统可以是四环素、大环内酯、或off和on型quorex系统。在某些实施例中,rti系统可利用xenopus末端低聚嘧啶元件(top),该元件通过在5

非翻译区形成发夹结构来阻止翻译启动。
[0167]
在某些实施例中,本公开所述的rcrti系统可利用气相控制表达例如乙醛诱导的调控(air)系统。air系统可采用构巢曲霉的alcr转录因子,其在无毒浓度的气态或液态乙醛的存在下,特异性激活由alcr特异性操纵子组装的pair启动子,该操纵子融合至最小的人类巨细胞病毒启动子。
[0168]
在某些实施例中,本公开的rcrti系统可利用tet-on或tet-off系统。在该系统中,一种或多种soi的表达可由四环素或其类似物强力霉素进行调节。
[0169]
在某些实施例中,本公开的rcrti系统可利用pip-on或pip-off系统。在该系统中,soi的表达可由例如原始霉素、四环素和/或红霉素进行调节。
[0170]
6.产物
[0171]
本公开的宿主细胞可用于表达任何目的分子。在某些实施例中,本公开的宿主细胞可用于表达多肽,例如哺乳动物多肽。此类多肽的非限制性实例包括激素、受体、融合蛋白、调节因子、生长因子、补体系统因子、酶、凝血因子、抗凝血因子、激酶、细胞因子、cd蛋白、白细胞介素、治疗性蛋白质、诊断性蛋白质及抗体。在某些实施例中,本公开的宿主细胞可用于表达分子伴侣、蛋白质修饰酶、shrna、grna或其他蛋白质或肽,同时组成性或调控地表达目的的治疗性蛋白质或分子。
[0172]
在某些实施例中,目的多肽是双特异性、三特异性或多特异性多肽,例如双特异性抗体。
[0173]
与常规细胞培养方法中所用的细胞例如非ti细胞相比,本公开的宿主细胞可在较短的时间内用于产生大量目的的分子。在某些实施例中,与常规细胞培养方法中所用的细胞例如非ti细胞相比,本公开的宿主细胞可用于提高目的分子的质量。在某些实施例中,本公开的宿主细胞可用于通过预防慢性毒性来增强种子序列的稳定性,该慢性毒性可由引起细胞应激和克隆随时间推移的不稳定性的产物而引起。在某些实施例中,本公开的宿主细胞可用于实现急性毒性产物的最佳表达。
[0174]
在某些实施例中,本公开的宿主细胞和系统可用于细胞培养过程的优化和/或流程开发。
[0175]
在某些实施例中,本公开的宿主细胞可用于治疗性分子的所选亚基的组成性表达以及同一治疗性分子的其他不同亚基的调控表达。在某些实施例中,治疗性分子可为融合蛋白。在某些实施例中,本公开的宿主细胞可用于理解每个抗体亚基在完全组装的抗体分子的表达及分泌中的作用和效应。
[0176]
在某些实施例中,本公开的宿主细胞可用作研究工具。在某些实施例中,本公开的宿主细胞可用作诊断工具,以针对各种细胞中存在问题的分子找出低蛋白表达水平的根本原因。在某些实施例中,本公开的宿主细胞可用于将观察到的现象或细胞行为与细胞中的转基因表达直接联系起来。本公开的宿主细胞还可用于证明观察到的行为在细胞中是否可逆。在某些实施例中,本公开的宿主细胞可用于识别和缓解有关转基因在细胞中转录和表达的问题。
[0177]
在某些实施例中,本公开的宿主细胞可用于将难以表达的分子的转基因亚基(例如但不限于抗体的hc和lc亚基)与系统中的平均分子的亚基交换,以识别有问题的亚基。在某些实施例中,然后可使用氨基酸序列分析来缩小范围并集中于可能导致低蛋白表达水平的氨基酸残基或区域。
[0178]
实例
[0179]
材料与方法
[0180]
细胞培养基
[0181]
通过将编码抗体的盒靶向整合至来源于cho-k1细胞系的宿主细胞系中来执行稳定的细胞系开发(crawford y.等人,biotechnol prog 2013,29,1307-1315)。将细胞置于125ml摇瓶中(转速为150rpm)或50ml管式生物反应器中(转速为225rpm),在37℃和5%co2下在专有培养基中进行培养。每3-4天以4x105个细胞/ml的接种密度传代培养的细胞。
[0182]
通过pcr反应确定表达rcti克隆的分子x的载体构型
[0183]
使用dneasy血液和组织试剂盒(目录号69506,qiagen)从2x106个细胞中提取基因组dna,并使用longamp taq预混液(目录号m0287,new england biolabs)进行pcr测定。热循环参数:在94℃下持续3分钟,40x(在94℃下持续30秒,在60℃下持续1分钟,并在65℃下持续9.75分钟),以及在65℃下持续20分钟。使用来自new englandbiolabs的酶对pcr产物进行诊断消化。使用以下引物进行pcr测定:正向引物:ggttctccttgaccaatacctcgtaag;逆向引物:gcgggactatggttgctgactaat。
[0184]
摇瓶流加培养及ambrtm生物反应器生产测定
[0185]
在摇瓶中使用专有的化学组成确定的培养基在14天的生产过程中,对单克隆抗体a(mab a)和表达molecule-z的克隆进行流加培养评估。在第0天以1x106个细胞/ml接种细胞,在第3天将培养物的温度由37℃改为35℃,并在第3、7和10天添加由专有的化学组成确定的混合物组成的大剂量进料。用vi-cell xr(beckman coulter)测量活力和活细胞计数,并使用nova bioprofile 400(nova biomedical)测定乳酸和葡萄糖水平。
[0186]
为评估表达molecule-y的克隆,在ambrtm系统(sartorius)中进行14天的生产培养(hsu,w.t.等人cytotechnology 2012,64,667-678),进行以下修改:在摇瓶中于37℃和150rpm下以1x106个细胞/ml的密度接种4天。将生产培养物以2x106个细胞/ml的密度接种,最初保持在36℃,然后在第6天将温度改为35℃。在第3、6、8和10天添加由专有的化学组成确定的混合物组成的大剂量进料。在bioprofile flex2(novabiomedical)上测量活力和细胞计数。在bioprofile flex2(nova biomedical)或abl90 flex(radiometer)上测定ph、po2、pco2、葡萄糖、乳酸盐以及其他代谢物。
[0187]
效价和产物质量的分析测定
[0188]
使用protein-a亲和色谱和uv检测测定效价。大小和电荷变化分别通过protein a phytip纯化(phynexus)、体积排阻色谱和成像毛细管等电聚焦(icief)进行测量。经icief分析之前,用羧肽酶b处理经过phytip纯化的样品。对于molecule-y,使用液相色谱-质谱(lc-ms)来定量分析正确组装的异二聚体、同二聚体、半抗体和轻链错配物种的相对量,如williams,a.j.等人所述(ind eng chem res 2017,56,1713-1722)。
[0189]
当前转染(tfx)策略与rcti的tfx策略的比较
[0190]
使用

随机化构型靶向整合

(本文也称为

随机化链靶向整合

)方法产生稳定细胞系,该稳定细胞系生成单克隆抗体a(mab a)(图11a)。在该方法中,使用三个



和三个



表达载体的文库转染宿主细胞,每个表达载体包含mab a重链或轻链序列重复序列的三种可能的组合的一。如本实例中所用,对







表达载体的引用是指在基于两个载体rcme的外源目的序列引入的背景下的上游(前)和下游(后)盒位点。有关两种基于rcme的策
略的更多细节,请参见例如上文第5.1节。顶级克隆的效价为3.4-4.7g/l,并根据效价、生产率、细胞培养性能、产物质量和流式细胞仪群体异质性进行选择。
[0191]
与之前针对mab a的细胞系开发(cld)所做的工作相比,本文所述的rcti cld方法生产的克隆的效价、产物质量和生产培养性能与标准cld方法生产的克隆相当,同时以更少的cld循环筛选更少的克隆。
[0192]
先前针对mab a的cld工作已在独立的标准cld方法工作流程中测试了前后载体的单独组合(见图2a)。总共转染了7种前后载体构型组合,并通过池生产对其进行评估。在这7种载体组合中,将4种向前推进至基于池生产效价进行scc和克隆评估。因此,执行四次独立的cld循环以及三个附加的部分cld循环,其中转染三个附加的载体组合并通过池生产对其进行评估。
[0193]
相比之下,rcti cld方法仅执行一次cld循环。表1总结了针对各种方法评估的克隆的数量,图2a和2b示出用于mab a克隆评估的rcti和标准cld工作流程的比较。
[0194]
表1.针对标准方法和rcti cld筛选的克隆总结
[0195] 标准cldrcti cld执行的cld循环次数4 a1从scc中挑选的克隆4,224704在生产测定中评估的克隆12024
[0196]a对于标准cld方法,同时执行四次独立的cld循环以及三个附加的部分cld循环,其中转染三个附加的载体组合并通过池生产对其进行评估。
[0197]
对于rcti cld方法,对三个实验组进行评估,它们分别对应于三个回收阶段的转染池:(i)早期(转染后第5天,归入选择培养基中),(ii)中期(选择后,克隆恢复大约35%的活力),或(iii)完全(选择后,克隆恢复>90%的活力)(见图6a)。为比较rcti cld方法与标准cld方法,本节仅讨论来自第三组的克隆(选择后,克隆恢复>90%的活力),因为标准cld规定池的scc活力>90%。对于标准cld方法和rcti方法,一次cld循环被定义为从转染到克隆生产培养评估的整个过程。
[0198]
对于之前的mab a cld工作,大部分具有最高效价的克隆也表达出高聚集度,即hmws高于10-15%。因此,在比较标准cld方法和rcti方法生产的克隆时,在选择顶部rcti cld克隆时同时考虑到效价和hmws%。对于通过标准cld方法生产的克隆,某些构型的hmws%分布与前后载体构型大致成簇(图3b)。例如,具有c-2构型的克隆(图3a)通常产生较低的hmws%,而具有b-2构型的克隆(图3a)产生较高的hmws%。
[0199]
对于rcti克隆,效价和hmws%的范围与标准cld克隆产生的效价范围相当(图3b),尽管筛选的克隆要少得多。由于rcti方法涉及转染前后dna载体的随机文库,因此使用长程pcr来确定生产培养中评估的克隆的前载体构型。尽管24个克隆中的3个克隆的长程pcr结果不确定,但与标准cld克隆相比,其余克隆在前载体构型和hmws%成簇方面相似。具有c前载体构型的大多数克隆表达出的hmws%低于具有b构型的克隆,而具有a前构型的克隆涵盖hmws%的范围。此处不需确定后载体构型,因为hmws%的水平仅与前载体构型直接相关。rcti克隆的第14天最高效价也与标准cld克隆(≥4.5g/l)相当。需注意,如果仅以标准cld方法测试了b-2(图3a)或a-1(图3a)构型,则可以获得具有高效价和低聚集体的组合的少数克隆(如有)。
[0200]
标准cld和rcti cld方法之间的增长、生产率及其他产物质量属性也相当。图5总结了两种cld方法在生产培养基中评估的所有克隆中各种属性的分布。同样地,由rcti cld方法产生的顶级克隆在生产培养基中的表达与通过标准cld方法产生的顶级克隆相当。在标准cld方法中测试的构型中,仅a-2和c-2构型具有高效价(≥3.6g/l),而产生的聚集度较低(hmws%≤15.4%)。通过rcti方法获得的克隆具有与标准cld方法相似的聚集度和效价范围。尽管由rcti方法得到的代表性高产克隆似乎在表2中呈c构型,如图3b所示,但也观察到来自构型a的高效价和低聚集度的克隆,尽管它们并未排在产量最高的克隆之列。表2比较了根据标准方法和rcti cld方法得到的顶级克隆的效价、生长和产物质量属性。
[0201]
表2.使用标准cld和rcti cld生产的顶级mab a克隆的比较
[0202][0203]a对于rcti克隆,在该比较中仅考虑来自第三实验组(库选择后,回收率高于90%的scc)的顶级克隆。
[0204]
与之前mab a的cld工作(使用标准cld方法)相比,rcti方法具有许多优势。首先,单个rcti cld循环可用于筛选与标准cld循环相比具有相同数量(如果不是更多)的载体构型,同时使用的资源较少。对于mab a,标准cld方法需要4次以上的cld循环来筛选9种可能的载体构型组合中的7种,而rcti方法在一次cld循环中即可筛选全部9种组合。也可以筛选较少的单个克隆。在针对mab a的所有标准cld循环中,从scc中总共挑选了4,224个克隆,并缩小为120个克隆以在生产培养基中进行筛选。相比之下,从scc中总共选择了704个克隆用于rcti方法,并在生产培养基中筛选了24个克隆。由于减少了cld循环并减少了要筛选的克隆的数量,rcti方法能够减少cld的人工需求,包括减少人工成本和执行scc、成像及匹配结果挑选的自动化资源负担。最后,尽管减少了所需的cld循环及筛选的克隆数量,但通过rcti方法产生的克隆的效价、细胞培养基性能和产物质量的分布与标准cld方法相当。通过两种方法产生的顶级克隆也相当。
[0205]
rcti cld表达双特异性抗体的评估
[0206]
评估了rcti方法对具有高临床需求的疾病适应症的双特异性抗体(molecule-y)的表达,因此需要在克隆筛选过程中分离出高效价的细胞系。双特异性抗体在单个宿主中的表达可导致不想要的副产物的组装,例如具有常见或错配轻链物的同二聚体和异二聚体(dillon m.等人,mabs2017,9,213-230;carter,p.j.,experimental cell research 2011,317,1261-1269)。因此,双特异性抗体克隆评估中的关键步骤是分离克隆,其不仅具有较高的总效价,而且具有高效的效价(所需的双特异性抗体种类),并且副产物的水平最低,难以从目标双特异性抗体中纯化出来。对于molecule-y(图11b),要纯化的最具挑战性的副产物是具有常见轻链(本文称为

常见lc bsab

)的异二聚体重链。因此,在标准ti cld过程中,尝试并行cld时使用四种不同的载体构型,并且在scc之前进行池生产评估期间,使用质谱法测量常见lc bsab以及有效效价水平。针对slc选择含量最低的常见lc bsab池,然后在针对标准ti cld方法的生产测定中(图7a,正方形)评估具有最高效价和最低lc-bsab水平的排名前62个克隆。
[0207]
由于之前已经确定,在rcti cld方法中,回收的池仍保持载体构型异质性(图6b和图6c),对于molecule-y的rcti cld,所有四个载体构型均用于转染ti宿主,并且仅在池完全回收后才进行scc。此外,在早期筛选步骤中,仅根据通过快速火焰质谱法获得的有效效价对克隆进行排名。在此过程中,在克隆选择中不考虑常见lc bsab或其他单个副产物的水平。基于这些标准,然后在生产测定中评估排名前36个rcti克隆(图7a,圆圈)。尽管在生产测定中仅评估了一半克隆,但相对于标准ti cld克隆,通过rcti cld方法可以分离出总效价(约6g/l)和有效效价(4-5.5g/l)的克隆(图7a)。此外,与标准ti克隆相比,rcti克隆总体上具有更出色的比生产力(图7b)、更高的活力(图8a)以及略低的生长(图8b)特征。由于通过流程优化可以更轻松地改善培养生长,因此相比标准ti克隆对应物,表达molecule-y的rcti克隆可能具有更高的总有效效价。rcti克隆还具有非常低的(约5%或更少)的常见lc bsab副产物,大约与标准ti克隆所观察到的结果一样低(图8c)。但是,预计标准ti克隆具有总体上较低的常见lc bsab副产物,因为他们在生产培养基中进行评估之前已经筛选出这一特质。rcti克隆的产物质量与标准ti同类产品相当或更出色。相对于标准ti克隆,表达molecule-y的rcti克隆也具有相对较低的聚集度(图8d)、较低的酸性物种(图8e)和较高的主要物种%(图8f),这些都是更理想的产物质量参数。在从这两种方法分离出的克隆之间,碱性物种%的水平相当(图8g)。
[0208]
rcti cld对复合嵌合抗体/配体分子表达的评估
[0209]
许多即将出现的用于各种疾病适应症的治疗性分子不再仅仅是常规抗体,而是具有更复杂的结构,因此更难以表达。在标准ti方法中表达一种该等复杂分子(molecule-z),需要使用六种不同的载体构型进行并行cld,然后在生产培养基中筛选96种不同的克隆,以获得具有高效效价的克隆。(图9a,正方形)。因此,包含与fc融合的配体复合的半抗体的molecule-z(图11c)被视为难以表达的分子,并且我们决定使用rcticld方法测试其表达。使用所有六种不同载体构型的混合物转染ti宿主细胞,并在一个池中选择它们,然后进行scc筛选,在生产测定中仅评估23种rcti克隆,可分离出与通过标准ti cld方法分离的顶级克隆具有相当的效价和产物质量的克隆(图9a)。与标准ti克隆相比,rcti克隆具有更高的总体比生产力(图9b)、相当的活力(图10a)、略低的生长速度(图10b)和较低的总体聚集度(图10c)。由于具有较高的比生产力(约高2倍,图9b),如果通过流程优化进一步提高细胞的
生长,rcti克隆可实现更高的有效效价。最后,rcti克隆与标准ti克隆具有相当的酸性电荷变异体(图10d)、主电荷变异体%(图10e)和碱性电荷变异体%(图10f)。总而言之,这些数据支持以下观点:rcti方法可用于分离克隆并实现与标准ti方法相当的效价和产物质量属性,但是所需的资源和工作量大大减少。
[0210]
****
[0211]
前述实例仅是对当前公开的主题的说明,而不应以任何方式视为限制。
[0212]
除了所描绘和要求保护的各种实施例之外,所公开的主题还涉及具有本文所公开和要求保护的特征的其他组合的其他实施例。这样,本文所呈现的特征可以在所公开的主题的范围内以其他方式彼此组合,使得所公开的主题包括本文所公开的特征的任何合适的组合。为了说明和描述的目的,已经呈现了所公开的主题的特定实施例的前述描述。并不旨在穷举或将所公开的主题限制为所公开的那些实施例。
[0213]
对于本领域技术人员显而易见的是,在不脱离所公开主题的精神或范围的情况下,可以对所公开主题的组合物和方法进行各种修改和变化。因此,旨在所公开的主题包括在所附权利要求及其等同物的范围内的修改和变化。
[0214]
本文引用了各种出版物、专利和专利申请,其内容通过引用以其全文并入本文。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献