一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

在细胞内产生点突变的融合蛋白、其制备及用途

2022-04-25 04:26:20 来源:中国专利 TAG:

在细胞内产生点突变的融合蛋白、其制备及用途
1.本技术是申请日为2017年6月15日,申请号为2017104514243,发明名称为“在细胞内产生点突变的融合蛋白、其制备及用途”的中国专利申请的分案申请。
技术领域
2.本发明涉及在细胞内产生点突变的融合蛋白、其制备及用途。


背景技术:

3.基因型与表型间存在密切关系。自然界中,自发突变会引起基因型的改变,从而产生多种表型。实验室中,仍然通过突变,使基因多样化,产生多种表型,从而筛选出功能突变体,研究基因与功能的相关,获得功能更强的蛋白质。自然界中,自发突变频率极低。常见生物中,人类基因组的自发突变率为5.0
×
10-10
,小鼠基因组自发突变率为1.8
×
10-10
,大肠杆菌基因组的自发突变率为5.4
×
10-10
,hiv的自发突变率为3
×
10-5
,随着生物基因组的减小,生物体的自发突变频率增高〔holmes e c.the comparative genomics of viral emergence[j].proceedings of the national academy of sciences,2010,107(4):1742-1746〕。但这种低水平的基因突变频率不能产生足够数量的表型,用以研究基因、表型与功能的关系。
[0004]
为了提高基因突变频率,实验室现有手段主要分体内突变方法和体外突变方法。体内点突变方法:1.物理方法:紫外辐射,突变频率为1
×
10-10
〔packer m s,liu d r.methods for the directed evolution of proteins[j].nature reviews genetics,2015〕。2.化学方法:enu是一种烷化剂,将乙基转移到dna的氧和氮原子上,引起错配,碱基置换或者缺失,突变频率为1-1.5
×
10-5
〔filby.zebrafish:methods and protocols.methods in molecular biology-by g.j.lieschke,a.coates and k.kawakami.[j].journal of fish biology,2010,76(7):1874-1876〕。虽然enu易于获得,但它对光、热、ph都很敏感,限制了它的应用。这两种方法均可以通过剂量改变其突变频率,但引起的点突变是随机的,突变频率低,突变图谱不均一,对生物体有害〔gu
é
net j l.chemical mutagenesis of the mouse genome:an overview[j].genetica,2004,122(1):9-24〕。3.生物方法:转座子,染色体dna上可自主复制和位移的基本单位,可引起插入突变,可以通过基因的插入导致基因敲除,基因激活,并可以通过选择不同载体来选择不同的插入位点,但其突变亲率比enu低,在每一细胞周期中,只能发生3
×
10-5
插入事件,并且需要host同时表达转座酶来完成转座〔kitada k,ishishita s,tosaka k,et al.transposon-tagged mutagenesis in the rat.[j].nature methods,2007,4(2):131-133〕。
[0005]
而在免疫系统,生发中心的b细胞,可以通过体细胞高频突变产生多样性抗体,抵抗病原的入侵〔odegard v h,schatz d g.targeting of somatic hypermutation.[j].nature reviews immunology,2006,6(8):573-583〕。体细胞高频突变指的是免疫球蛋白重轻链可变区的非模板点突变,与b细胞亲和成熟有关〔odegard v h等,同前〕。而介导这一
过程重要的酶是激活诱导的胞嘧啶脱氨酶(activation induced cytosine deaminase,aid)。aid是一种胞嘧啶脱氨酶,属于apobec家族,一种rna编辑酶家族:n端有核定位信号,c端有核输出信号,其催化结构域为apobec家族所共有〔zhenming x,hong z,pone e j,et al.immunoglobulin class-switch dna recombination:induction,targeting and beyond.[j].nature reviews immunology,2012,12(7):517-31〕。一般认为n端结构为shm所必须。aid的表达局限于生发中心的b细胞,其发挥点突变功能是有条件的,必须作用于单链的dna,并且具有序列偏好性,hotspot结构域为rgyw〔kiyotsugu y,il-mi o,tomonori e,et al.aid enzyme-induced hypermutation in an actively transcribed gene in fibroblasts[j].science,2002,296(5575):2033-2036〕。r代表a/g,y代表c/t,w代表a/t,可见aid发挥功能与dna的一级结构有关。首先将单链dna上的胞嘧啶脱氨基变为u,形成u-g错配,如果u-g未修复,在dna复制过程中会形成c-t g-a的转换突变。此外,u可被ung(尿嘧啶dna糖苷酶)切除,形成无嘧啶位点,将四种碱基随机参入〔odegard v h等,同前〕。以上过程产生的点突变对于体细胞高频突变意义重大,可以产生多样性的抗体。但其在体内引起的点突变频率为1
×
10-4-1
×
10-3
,且位点具有随机性〔masatoshi a,nesreen h,andre s,et al.accumulation of the fact complex,as well as histone h3.3,serves as a target marker for somatic hypermutation.[j].proceedings of the national academy of sciences of the united states of america,2013,110(19):7784-7789〕,仍无法满足实验筛选突变体所需。


技术实现要素:

[0006]
本文第一方面提供一种融合蛋白,所述融合蛋白含有胞嘧啶脱氨酶和核酸酶活性缺失、保留了解旋酶活性的cas酶。
[0007]
在一个或多个实施方案中,所述融合蛋白由胞嘧啶脱氨酶和核酸酶活性缺失、保留了解旋酶活性的cas酶形成。
[0008]
在一个或多个实施方案中,所述cas酶选自:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、其同源物或其修饰形式。
[0009]
在一个或多个实施方案中,所述cas酶的核酸酶活性部分缺失,使得所述cas酶仅能造成dna单链断裂;或所述cas酶的核酸酶活性全部缺失,能引起dna双链断裂。
[0010]
在一个或多个实施方案中,所述cas酶为cas9酶,选自:来自化脓链球菌的cas9(spcas9)、来自金黄色葡萄球菌的cas9(sacas9),以及来自嗜热链球菌的cas9(st1cas9)。
[0011]
在一个或多个实施方案中,所述cas酶为cas9酶,该酶的两个核酸内切酶催化结构域ruvc1和/或hnh发生突变,导致该酶核酸酶活性缺失、保留了解旋酶活性。
[0012]
在一个或多个实施方案中,所述cas9酶的ruvc1和hnh都发生突变,导致该酶核酸酶活性缺失、保留了解旋酶活。
[0013]
在一个或多个实施方案中,所述cas9酶的第10个氨基酸天冬酰胺突变为丙氨酸或其它氨基酸,第841位氨基酸组氨酸突变为丙氨酸或其它氨基酸。
[0014]
在一个或多个实施方案中,所述cas9酶的氨基酸序列如seq id no:2第42-1452所示,或如seq id no:72第42-1419位氨基酸残基所示。
[0015]
在一个或多个实施方案中,所述胞嘧啶脱氨酶为全长胞嘧啶脱氨酶或其片段,其中所述片段至少包括胞嘧啶脱氨酶的nls结构域、催化结构域和apobec样结构域。
[0016]
在一个或多个实施方案中,所述胞嘧啶脱氨酶在第10位、82位和156位氨基酸残基发生取代突变。
[0017]
在一个或多个实施方案中,所述取代突变为k10e、t82i和e156g。
[0018]
在一个或多个实施方案中,所述片段至少包含aid的第9-182位氨基酸残基,例如至少包含aid第1-182位氨基酸残基。
[0019]
在一个或多个实施方案中,所述胞嘧啶脱氨酶的氨基酸序列如seq id no:2第1457-1654位氨基酸所示,或如seq id no:68第1448-1629位氨基酸残基所示。
[0020]
在一个或多个实施方案中,所述片段至少包含seq id no:2的第1465-1638位氨基酸残基,例如至少包含seq id no:2第1457-1638位氨基酸残基。
[0021]
在一个或多个实施方案中,所述片段由第1-182位氨基酸残基组成,由第1-186位氨基酸残基组成,或由第1-190位氨基酸残基组成。
[0022]
在一个或多个实施方案中,所述融合蛋白还包含以下序列中的一种或多种:接头,核定位序列,以及为了构建融合蛋白、促进重组蛋白的表达、获得自动分泌到宿主细胞外的重组蛋白、或利于重组蛋白的纯化而引入的氨基酸残基或氨基酸序列。
[0023]
在一个或多个实施方案中,所述融合蛋白的氨基酸序列如seq id no:2、4、66、68、70或72所示,或如seq id no:2第26-1654位氨基酸所示,或如seq id no:4第26-1638位所示,或如seq id no:68第26-1629位氨基酸所示,或如seq id no:70第26-1629位氨基酸所示,或如seq id no:72第26-1638位氨基酸所示。
[0024]
本文第二方面提供一种多核苷酸序列,选自:
[0025]
(1)编码本文第一方面所述的融合蛋白的多核苷酸序列;和
[0026]
(2)(1)所述序列的互补序列。
[0027]
本发明第三方面提供核酸构建物,所述核酸构建物含有本文第二方面所述的多核苷酸序列。
[0028]
在一个或多个实施方案中,所述核酸构建物是表达载体,用于在宿主细胞中表达本文所述的融合蛋白。
[0029]
本发明第四方面提供一种宿主细胞,所述宿主细胞含有本文所述的融合蛋白、其编码序列或核酸构建物。
[0030]
本文第五方面提供一种在细胞内产生点突变的方法,所述方法包括在所述细胞中表达本文所述的融合蛋白和sgrna的步骤。
[0031]
在一个或多个实施方案中,所述方法包括将本文所述的融合蛋白或其表达载体和sgrna或其表达载体转入所述细胞内,然后筛选获得所需要的突变核酸序列的步骤。
[0032]
在一个或多个实施方案中,所述sgrna包括靶标结合区和cas蛋白识别区,所述靶标结合区能特异性结合待突变的核酸序列,所述cas蛋白识别区能被所述融合蛋白中的cas酶识别并结合。
[0033]
在一个或多个实施方案中,所述sgrna的靶标结合区与待突变的核酸序列的模板
链特异性结合,模板链上sgrna结合区域的对侧区紧邻该cas蛋白所识别的前间区序列邻近基序,或隔开10个以内的碱基。
[0034]
在一个或多个实施方案中,所述待突变的基因编码功能蛋白。
[0035]
在一个或多个实施方案中,所述功能蛋白包括疾病的发生、发展和转移中涉及的蛋白,细胞分化、增殖与凋亡中涉及的蛋白,参与新陈代谢的蛋白,发育相关的蛋白,以及各种药物靶点等等。
[0036]
在一个或多个实施方案中,所述功能蛋白选自:抗体、酶、脂蛋白、激素类蛋白、运输和贮存蛋白、运动蛋白、受体蛋白、和膜蛋白。
[0037]
本发明第六方面提供一种试剂盒,所述试剂盒含有本文所述的融合蛋白、多核苷酸序列或核酸构建物。
[0038]
本发明第七方面提供本文所述的融合蛋白、多核苷酸序列或核酸构建物在在细胞内产生点突变中的应用,或在制备用于在细胞内产生点突变的组合物或试剂盒中的应用。
附图说明
[0039]
图1:a和c分别为pcr扩增出的aid(泳道1)及aidx片段(泳道1);b为pentr11-dcas9-aid质粒琼脂糖凝胶图,其中1道为pentr11空载质粒,2道为pentr11-dcas9质粒,3-7道为pentr11-dcas9-aid质粒;d为pentr11-dcas9-aidx质粒菌液pcr结果,扩增出的片段是aidx。d中1-5泳道分别代表5个不同的阳性克隆,6号是空载质粒,作为阴性对照。
[0040]
图2:a,1道和2道分别为pcr扩增出的dcas9-aid及dcas9-aidx片段;b,酶切mo91空载质粒,其中1道为bglⅱ单酶切,2道为mo91空载质粒,3道为bglⅱ和xhoⅰ双酶切;c,mo91-dcas9-aidx质粒菌液pcr结果,扩增出的片段是aidx;d,mo91-dcas9-aid质粒菌液pcr结果,扩增出的片段是aid。
[0041]
图3:a,1道为pcr扩增出的3*flag nls片段,2道及3道分别为bglⅱ单酶切mo91-dcas9-aid质粒和mo91-dcas9-aidx质粒,4道为mo91-dcas9-aid质粒对照;b,1-4道为mo91-dcas9(3*flag,nls)-aid质粒,5道为mo91-dcas9-aid质粒,6-9道为mo91-dcas9(3*flag,nls)-aidx质粒。
[0042]
图4:egfp报告子的序列,终止密码子以粗体表示。设计的sgrna用箭头表示。
[0043]
图5:报告质粒的模式示意图。
[0044]
图6:流式检测报告细胞系。三条曲线从左到右分别表示未染色对照、报告子阴性细胞和报告子阳性细胞的thy1.1表达水平。
[0045]
图7:dcas9-aid,dcas9-aidx,aid和aidx点突变效率在报告细胞中的比较。
[0046]
图8:dcas9-aid点突变效率在报告细胞中的优化。a,dcas9-aid诱导gfp表达;b,不同aid变体的示意图以及其诱导点突变的效率;c,dcas9-aidx诱导点突变需要aid的胞嘧啶脱氨酶活性。
[0047]
图9:dcas9-aidx和aid对egfp和cmyc基因造成的点突变频率分布。
[0048]
图10:dcas9-aidx将c和g碱基随机突变为其他三种碱基。a,碱基突变类型的统计;b,dcas9-aidx诱导点突变的机制。
[0049]
图11:ugi提高dcas9-aidx系统的碱基置换频率,揭示dcas9-aidx在基因上的作用轨迹,并使碱基突变方向更加单一化。
[0050]
图12:dcas9-aidx不仅可以对外源性基因起作用,同时可以作用于内源性基因。
[0051]
图13:aid的结构功能域。
[0052]
图14:将dcas9-aidx应用于k562 bcr-abl基因的gleevec耐药性筛选的实验过程(a)及结果(b-d)。
[0053]
图15:tam(靶向胞嘧啶脱氨酶aid介导基因突变技术)突变抗hel-igg1可变区的氨基酸。
[0054]
图16:tam诱导抗hel-igg1可变区的碱基突变(上图),且可重复地诱导igg1cdr的碱基突变(下图)。
[0055]
图17:突变后的抗体对hel的亲和力增强了10倍以上。
[0056]
图18:ncas9-aidx在细菌中的表达结果。方框框出的条带为ncas9-aidx融合蛋白的条带。
[0057]
图19:不同融合蛋白的功能测试结果。对每一组数据,从左到右三根柱子依次代表mo91-aidx-xten-dcas9、mo91-dcas9-xten-aidx和mo91-dcas9-aidx的结果。
[0058]
图20:不同融合蛋白的功能测试结果。对每一组数据,从左到右三根柱子依次代表mo91-dcas9-aidx、mo91-dcas9-xten-aidx(k10e t82i e156g)和mo91-dcas9-xten-aidx的结果。
[0059]
图21:ncas9-aidx融合蛋白的功能验证结果。
具体实施方式
[0060]
本文涉及核酸酶活性缺失的cas蛋白与胞嘧啶脱氨酶aid或其突变体的融合蛋白。在sgrna的指引下,所述融合蛋白被招募到特定的dna序列,aid或其突变体对胞嘧啶脱氨基,产生尿嘧啶,而后在dna修复过程中,被随机突变成其它碱基,从而在实现定点突变的同时获得高的突变效率。
[0061]
关于cas/sgrna的内容,除本文下文所述外,还可参见cn 201380049665.5和cn 201380072752.2,本文将其全部内容以引用的方式纳入本文。
[0062]
cas蛋白
[0063]
crispr(clustered regularly interspaced short palindromic repeats)是细菌抵御病毒侵袭或躲避哺乳动物免疫反应的基因编辑系统。该系统经过改造和优化,目前已被广泛应用在体外生化反应、细胞与个体的基因编辑中。
[0064]
通常,具有核酸内切酶活性的cas蛋白与其特异性识别的sgrna形成的复合物通过sgrna的配对区与靶标dna中的模板链进行互补配对,由cas在特定位置将双链dna切断。应理解,本文中,“cas蛋白”与“cas酶”可互换使用。
[0065]
本文利用cas/sgrna的上述特性,即利用sgrna与靶标的特异性结合而将cas定位到期望的位置,在该位置由融合蛋白中的aid或其突变体对胞嘧啶脱氨基。适用于本发明的核酸酶活性部分或完全缺失,尤其是核酸内切酶活性部分或完全缺失、但保留了解旋酶活性的cas蛋白可以衍生自本领域周知的各种cas蛋白及其变异体,包括但不限于cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、
csf1、csf2、csf3、csf4、其同源物或其修饰形式。
[0066]
在一些实施方案中,使用核酸酶活性缺失的cas9酶和其特异性识别的单链sgrna。cas9酶可以是来自不同物种的cas9酶,包括但不限于来自化脓链球菌的cas9(spcas9)、来自金黄色葡萄球菌的cas9(sacas9),以及来自嗜热链球菌的cas9(st1cas9)等。可以使用cas9酶的各种变体,只要该cas9酶能特异性识别它的sgrna,并缺失核酸酶活性即可。
[0067]
可采用本领域周知的方法制备核酸酶活性缺失的cas蛋白,这些方法包括但不限于使cas蛋白中核酸内切酶的整个催化结构域缺失或使该结构域中的一个或数个氨基酸发生突变,从而产生核酸酶活性缺失的cas蛋白。突变可以是一个或数个(例如2个以上、3个以上、4个以上、5个以上、10个以上,至整个催化结构域)氨基酸残基的缺失或取代,或一个或数个新氨基酸残基(例如1个以上、2个以上、3个以上、4个以上、5个以上、10个以上,或者1~10个、1~15个不等)的插入。可采用本领域常规的方法进行上述结构域的缺失或氨基酸残基的突变,以及检测突变后的cas蛋白是否还具有核酸酶活性。例如,对于cas9,可将它的两个核酸内切酶催化结构域ruvc1和hnh分别突变,例如将该酶的第10个氨基酸(位于ruvc1结构域中)天冬酰胺突变为丙氨酸或其它氨基酸,将第841位氨基酸(位于hnh结构域中)组氨酸突变为丙氨酸或其它氨基酸。这两处突变使cas9失去核酸内切酶活性。优选的是,cas酶完全无核酸酶活性。在一个或多个实施方案中,本文使用的无核酸酶活性的cas9酶的氨基酸序列如seq id no:2第42-1452所示。在其他实施方案中,本文使用的cas酶部分缺失核酸酶活性,即该cas酶可引起dna单链断裂。这类cas酶的代表性例子可如seq id no:72第42-1419位氨基酸残基所示。
[0068]
cas/sgrna复合物行使功能需要在dna的非模板链(3’到5’)有前间区序列邻近基序(protospacer adjacent motif,pam)。不同cas酶,其对应的pam并不完全相同。例如,针对spcas9的pam通常是ngg;针对sacas9酶的pam通常是nngrr;针对st1cas9酶的pam通常是nnagaa;其中,n为a、c、t或g,r为g或a。
[0069]
在某些优选的实施方式中,针对sacas9酶的pam是nngrrt。在某些优选的实施方式中,针对spcas9的pam是tgg。
[0070]
sgrna
[0071]
sgrna通常包括两部分:靶标结合区和cas蛋白识别区。靶标结合区与cas蛋白识别区通常以5’到3’的方向连接。
[0072]
靶标结合区的长度通常为15~25个碱基,更通常为18~22个碱基,如20个碱基。靶标结合区与dna的模板链特异性结合,从而将融合蛋白招募到预定位点。通常,dna模板链上sgrna结合区域的对侧区紧邻pam,或者隔开数个碱基(例如10个以内,或8个以内,或5个以内)。因此,在设计sgrna时,通常先根据所用的cas酶确定该酶的pam,然后在dna的非模板链上寻找可作为pam的位点,之后将该非模板链(3’到5’)pam位点下游紧邻该pam位点或与该pam位点隔开10个以内(例如8个以内、5个以内等)的长15~25个碱基、更通常长18~22个碱基的片段作为sgrna的靶标结合区的序列。
[0073]
sgrna的cas蛋白识别区则根据所使用的cas蛋白而确定,这为本领域所技术人员所掌握。
[0074]
因此,本文的sgrna的靶标结合区的序列为含所选cas酶识别的pam位点的dna链下游紧邻该pam位点或与该pam位点隔开10个以内(例如8个以内、5个以内等)的长15~25个碱
基、更通常长18~22个碱基的片段;其cas蛋白识别区为所选cas酶所特异性识别。
[0075]
可采用本领域常规的方法制备sgrna,例如,采用常规的化学合成方法合成。sgrna也可经由表达载体转入细胞,在细胞内表达出该sgrna。可采用本领域周知的方法构建sgrna的表达载体。
[0076]
激活诱导的胞嘧啶脱氨酶(aid)
[0077]
aid是一种胞嘧啶脱氨酶,属于apobec家族,一种rna编辑酶家族:n端有核定位信号,c端有核输出信号,其催化结构域为apobec家族所共有。一般认为n端结构为体细胞超变(shm)所必须。aid的功能是对胞嘧啶脱氨基,将胞嘧啶变成尿嘧啶,随后的dna修复可以将尿嘧啶变成其它碱基。应理解的是,本领域周知的胞嘧啶脱氨酶或其保留了对胞嘧啶脱氨基、将胞嘧啶变成尿嘧啶的生物学活性的片段或突变体均可用于本文。
[0078]
如图14显示了aid的结构功能域。其中氨基酸9-26为核定位(nls)结构域,尤其是氨基酸13-26参与了dna的结合,氨基酸56-94为催化结构域,氨基酸109-182为apobec样结构域,氨基酸193-198为核输出(nes)结构域,氨基酸39-42与连环蛋白样蛋白1(ctnnbl1)相互作用,氨基酸113-123是hotspot识别环。
[0079]
本文可使用aid的全长序列(如seq id no:2第1457-1654位氨基酸所示),也可使用aid的片段。优选的是,所述片段至少包括nls结构域、催化结构域和apobec样结构域。因此,在某些实施方案中,所述片段至少包含aid第9-182位氨基酸残基(即seq id no:2第1465-1638位氨基酸残基)。在其他实施方案中,所述片段至少包含aid第1-182位氨基酸残基(即seq id no:2第1457-1638位氨基酸残基)。例如,在某些实施方案中,本文使用的aid片段由第1-182位氨基酸残基组成,由第1-186位氨基酸残基组成,或由第1-190位氨基酸残基组成。因此,在某些实施方案中,本文使用的aid片段由seq id no:2第1457-1638位氨基酸残基、seq id no:2第1457-1642位氨基酸残基,或由seq id no:2第1457-1646位氨基酸残组成。
[0080]
本文还可使用aid的保留了其胞嘧啶脱氨酶活的变体。例如,这样的变体相当于aid的野生型序列可具有1-10个,如1-8个,1-5个或1-3个氨基酸变异,包括氨基酸的缺失、取代和突变。优选的是,这些氨基酸变异不发生在上述nls结构域、催化结构域和apobec样结构域内,或即便发生在这些结构域内也不影响到这些结构域原本的生物学功能。例如,优选的是,这些变异不发生在aid氨基酸序列的第24、27、38、56、58、87、90、112、140等位置上。在某些实施方案中,这些变异也不发生在氨基酸39-42、氨基酸113-123之内。因此,例如,变异可发生在氨基酸1-8、氨基酸28-37、氨基酸43-55和/或氨基酸183-198之中。在某些实施方案中,变异发生在第10、82和156位。例如,在第10、82和156位发生取代突变,这类取代突变可以是k10e、t82i和e156g。在这些实施方案中,示例性的aid突变体的氨基酸序列含有如seq id no:68第1448-1629位所示的氨基酸序列,或由如seq id no:68第1448-1629位所示的氨基酸残基组成。
[0081]
融合蛋白
[0082]
本文提供融合蛋白,其含有cas酶与aid。本文的融合蛋白,cas酶通常在融合蛋白氨基酸序列的n端,aid在c端。在某些实施方案中,本文提供主要由cas酶和aid形成的融合蛋白。应理解的是,本文所述的“主要由
……
形成”的融合蛋白或类似表述并不意指融合蛋白仅包括cas酶和aid,该限定应理解为融合蛋白可仅包括cas酶和aid,或还可含有其他不
id no:46);以及类固醇激素受体(人)糖皮质激素的序列rkclqagmnlearktkk(seq id no:47);等。在某些具体实施方案中,本文使用seq id no:2第26-33位氨基酸残基所示的序列作为nls。nls可位于融合蛋白的n端、c端;也可位于融合蛋白序列中,例如位于融合蛋白中cas9酶的n端和/或c端,或位于融合蛋白中的aid的n端和/或c端。
[0087]
可以通过任何适合的技术检测本发明融合蛋白在细胞核中的积聚。例如,可将检测标记融合到cas酶上,使得在与检测细胞核的位置的手段(例如,对于细胞核特异的染料,如dapi)相结合时融合蛋白在细胞内的位置可以被可视化。在某些实施方案中,本文使用3*flag作为标记,该肽段序列可如seq id no:2第1-23位氨基酸残基所示。应理解,通常,若存在标记序列时,标记序列通常在融合蛋白的n端。标记序列与nls之间可直接连接,也可通过适当的接头序列连接。nls序列可直接与cas酶或aid连接,也可通过适当的接头序列与cas酶或aid连接。
[0088]
因此,在某些实施方案中,本文的融合蛋白由cas酶和aid组成。在其它实施方案中,本文的融合蛋白由cas酶通过接头与aid连接而成。在某些实施方案中,本文的融合蛋白nls、cas酶、aid以及cas酶和aid之间的任选的接头序列组成。在某些具体实施方案中,融合蛋白中的cas酶是前文所述的cas9酶。在某些具体实施方案中,融合蛋白中的aid的氨基酸序列如seq id no:2第1457-1654位氨基酸残基所示。在其它具体实施方案中,融合蛋白中的aid的氨基酸序列如seq id no:4第1457-1646位氨基酸残基所示。在其它具体实施方案中,融合蛋白中的aid的氨基酸序列如seq id no:68第1448-1629位氨基酸残基所示。
[0089]
在某些实施方案中,本文的融合蛋白的氨基酸序列如seq id no:2、4、66、68、70或72所示,或如seq id no:2第26-1654位氨基酸所示,或如seq id no:4第26-1638位所示,或如seq id no:68第26-1629位氨基酸所示,或如seq id no:70第26-1629位氨基酸所示,或如seq id no:72第26-1638位氨基酸所示。
[0090]
多核苷酸序列、宿主和蛋白表达
[0091]
本文包括编码本文融合蛋白的的多核苷酸序列。本文的多核苷酸可以是dna形式或rna形式。dna形式包括cdna、基因组dna或人工合成的dna。dna可以是单链的或是双链的。dna可以是编码链或非编码链。
[0092]
本文所述的核苷酸序列通常可以用pcr扩增法获得。具体而言,可根据本文所公开的核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cdna库或按本领域技术人员已知的常规方法所制备的cdna库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次pcr扩增,然后再将各次扩增出的片段按正确次序拼接在一起。例如,在某些实施方案中,编码本文所述融合蛋白的多核苷酸序列如seq id no:1、3、65、67、79或71所示,或如seq id no:1第73-4965位碱基所示,或如seq id no:3第73-4917位碱基所示,或如seq id no:67第76-4890位碱基所示,或如seq id no:70第76-4890位碱基所示,或如seq id no:72第76-4917位碱基所示。
[0093]
本文也包括包含所述多核苷酸的核酸构建物。该核酸构建物含有本文所述的融合蛋白的编码序列,以及与这些序列操作性连接的一个或多个调控序列。本发明所述的融合蛋白的编码序列可以多种方式被操作以保证所述蛋白的表达。在将核酸构建物插入载体之前可根据表达载体的不同或要求而对核酸构建物进行操作。利用重组dna方法来改变多核苷酸序列的技术是本领域已知的。
[0094]
调控序列可以是合适的启动子序列。启动子序列通常与待表达蛋白的编码序列操作性连接。启动子可以是在所选择的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合启动子,并且可以从编码与该宿主细胞同源或异源的胞外或胞内多肽的基因获得。
[0095]
调控序列也可以是合适的转录终止子序列,由宿主细胞识别以终止转录的序列。终止子序列与编码该多肽的核苷酸序列的3’末端操作性连接。在选择的宿主细胞中有功能的任何终止子都可用于本发明。
[0096]
调控序列也可以是合适的前导序列,对宿主细胞翻译重要的mrna的非翻译区。前导序列与编码该多肽的核苷酸序列的5

末端可操作连接。在选择的宿主细胞中有功能的任何终止子都可用于本发明。
[0097]
在某些实施方案中,所述核酸构建物是载体。例如,可将本文的多核苷酸序列插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其它载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。表达载体还可包括翻译起始用的核糖体结合位点和转录终止子。本文所述的多核苷酸序列可操作性地连接到表达载体中的适当启动子上,以经由该启动子指导mrna合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体pl启动子;真核启动子包括cmv立即早期启动子、hsv胸苷激酶启动子、早期和晚期sv40启动子、反转录病毒的ltrs和其它一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。标记基因可用于提供用于选择转化的宿主细胞的表型性状,包括但不限于真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(gfp),或用于大肠杆菌的四环素或氨苄青霉素抗性。当本文所述的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列,则将会使转录得到增强。增强子是dna的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。
[0098]
本领域一般技术人员清楚如何选择适当的载体、启动子、增强子和宿主细胞。可采用本领域技术人员熟知的方法构建含本文所述的多核苷酸序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组dna技术、dna合成技术、体内重组技术等。
[0099]
可将本文所述的载体转化适当的宿主细胞,以使其能够表达本文所述的融合蛋白。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;丝状真菌细胞、或是高等真核细胞,如哺乳动物细胞。宿主细胞还可以是植物细胞。宿主细胞的代表性例子有:大肠杆菌;链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母、丝状真菌;植物细胞;果蝇s2或sf9的昆虫细胞;cho、cos、293细胞、或bowes黑素瘤细胞的动物细胞等。除用于表达融合蛋白的细胞外,其它的含本文所述多核苷酸序列或载体以及sgrna或其表达载体的细胞,例如用于制备点突变蛋白的细胞,也在本文所述的宿主细胞的范围之内。
[0100]
用重组dna转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收dna的感受态细胞可在指数生长期后收获,用cacl2法处理,所用的步骤在本领域众所周知。另一种方法是使用mgcl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的dna转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
[0101]
转化宿主细胞后,获得的转化子可以用常规方法培养,以允许其表达本文所述的融合蛋白。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。可利用本领域已知的各种分离方法分离和纯化本文的重组融合蛋白。这些方法是本领域技术人员所熟知的,包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(hplc)和其它各种液相层析技术及这些方法的结合。
[0102]
因此,本文也包括含本文所述融合蛋白、其编码序列或表达载体和任选的sgrna或其表达载体的宿主细胞。这种宿主细胞可组成型表达本文所述的融合蛋白,也可在一定的诱导条件下表达本文所述的融合蛋白。如何使宿主细胞组成型表达或在诱导条件下表达本发明融合蛋白的方法是本领域周知的。例如,在某些实施方案中,使用诱导型启动子构建本发明的表达载体,从而实现融合蛋白的诱导表达。
[0103]
组合物、试剂盒
[0104]
本文的融合蛋白、其编码序列或表达载体,和/和sgrna、其编码序列或表达载体可以组合物的形式提供。例如,组合物可含有本文的融合蛋白和sgrna或sgrna的表达载体,或可含有本文融合蛋白的表达载体和sgrna或sgrna的表达载体。在组合物中,融合蛋白或其表达载体、或sgrna或其表达载体可以混合物的形式提供,或者可单独包装。组合物可以是溶液的形式,也可以是冻干形式。
[0105]
组合物可提供在试剂盒中。因此,本文提供含有本文所述组合物的试剂盒。或者,本文也提供一种试剂盒,该试剂盒含有本文的融合蛋白和sgrna或sgrna的表达载体,或含有本文融合蛋白的表达载体和sgrna或sgrna的表达载体。试剂盒中,融合蛋白或其表达载体、或sgrna或其表达载体可独立包装,或以混合物的形式提供。试剂盒中还可包括例如用于将所述融合蛋白或其表达载体和/或sgrna或其表达载体转入细胞的试剂,以及指导技术人员进行所述转入的说明书。或者,试剂盒还可包括指导技术人员采用试剂盒所含成分实施本文所述的各种方法和用途的说明书。试剂盒中还包括其它的试剂,例如用于pcr的试剂等。
[0106]
方法和用途
[0107]
本文第三方面提供一种在细胞内产生点突变的方法,所述方法包括在所述细胞内表达本文所述的融合蛋白和sgrna的步骤。在某些实施方案中,将本发明的融合蛋白或其表达载体和sgrna或其表达载体转入所述细胞内。在细胞组成型表达本文所述融合蛋白的情况下,可仅将相应的sgrna或其表达载体转入细胞中。在细胞诱导型表达本文所述融合蛋白的情况下,在转入sgrna之后,还可用诱导剂孵育细胞,或对细胞施与相应的诱导措施(例如光照)。可采用常规的转染方法将所述融合蛋白或其表达载体和/或sgrna或其表达载体转入细胞中。例如,在某些实施方案中,转染时,首先制备质粒dna-脂质体复合物,然后将该质粒dna-脂质体复合物和相应的sgrna共同转染细胞。获得产生了点突变的细胞之后,可在适于该细胞生长并表达所需蛋白的条件下培育该细胞,并通过各种常规方法(例如高通量方法)分离、分析所产生的突变体。
[0108]
因此,本文所述的在细胞内产生点突变的方法也可用于产生突变体文库,然后利用常规的技术手段对文库中的突变体进行分离和筛选,获得具有所需生物学功能的突变体。因此,本发明也提供一种构建突变体文库的方法,所述方法包括在所述细胞内表达本文
所述的融合蛋白和sgrna的步骤。
[0109]
可针对同一待突变位点设计一种或多种sgrna。当设计多种sgrna时,所设计的多种sgrna的靶标结合区不同,但具有相同的cas蛋白识别区。然后可将该一种或多种sgrna与相应的融合蛋白一同转入细胞中。
[0110]
细胞可以是任意感兴趣的细胞,包括原核细胞和真核细胞,例如植物细胞、动物细胞、微生物细胞等。尤其优选的是动物细胞,例如哺乳动物细胞、啮齿类动物细胞,包括人、马、牛、羊、鼠、兔等等。微生物细胞包括本领域周知的来自各种微生物种类的细胞,尤其是那些具有医疗研究价值、生产价值(例如燃料如乙醇的生产、蛋白质生产、油脂如dha生产)的微生物种类的细胞。细胞还可以是各种器官来源的细胞,例如来自人肝脏、肾脏、皮肤等处的细胞。细胞还可以是目前在售的各种成熟的细胞系,例如293细胞、cos细胞。在某些实施方案中,细胞是来自健康个体的细胞;在其他实施方案中,细胞是来自患病个体的患病组织的细胞,例如来自炎症组织的细胞、肿瘤细胞,诱导型多能干细胞等。细胞还可以是经基因工程改造过,以使其具有某种特定功能(例如生产感兴趣的蛋白)或产生感兴趣的表型的细胞。换言之,待突变的基因或核酸序列对于该细胞而言可以是天然就存在于该细胞内的(内源性)基因或核酸序列,也可以是外来转入的(外源性的)基因或核酸序列。外来转入的基因或核酸序列可整合入细胞的基因组序列中,也可独立于基因组之外并稳定表达。
[0111]
针对不同的细胞,可采用已知技术设计表达本文融合蛋白和sgrna的表达载体,以使这些表达载体适于在该细胞中表达。例如,可在表达载体中提供利于在该细胞中启动表达的启动子以及其他相关的调控序列。这些都可由技术人员根据实际情况加以选择和实施。
[0112]
期待产生点突变的核酸序列可以是任何感兴趣的核酸序列,例如基因序列,尤其是各种与疾病相关,或与各种感兴趣的蛋白质的生产相关,或各种与感兴趣的生物学功能相关的基因或核酸序列。这类感兴趣的基因或核酸序列包括但不限于编码各种功能蛋白的核酸序列。本文中,功能蛋白指能够完成生物体的生理功能的蛋白质,包括催化蛋白、运输蛋白、免疫蛋白和调节蛋白等。在某些具体实施方式中,所述功能蛋白包括但不限于:疾病的发生、发展和转移中涉及的蛋白,细胞分化、增殖与凋亡中涉及的蛋白,参与新陈代谢的蛋白,发育相关的蛋白,以及各种药物靶点等等。例如,功能蛋白可以是抗体、酶、脂蛋白、激素类蛋白、运输和贮存蛋白、运动蛋白、受体蛋白、膜蛋白等。因此,可利用本文所述的融合蛋白、多核苷酸、核酸构建物、细胞和方法等构建突变体文库,并进一步筛选获得具有新功能或更强功能的蛋白质,例如抗体、酶或其它功能蛋白等。
[0113]
利用本文所述的方法可在感兴趣的核酸序列上产生随机突变,或在感兴趣核酸序列的特定位点上产生突变。对于前者,可根据所用cas酶寻找模板链上的pam位点,以该pam位点下游紧邻该pam位点或与该pam位点隔开10个以内(如8个以内、5个以内或3个以内)的长15~25个碱基、更通常长18~22个碱基的片段作为sgrna的靶标识别区设计该cas酶识别的sgrna。对于后者,可在该特定位点附近寻找可作为pam的位点,根据该pam选择能识别该pam的cas酶,并依本文所述设计、制备含该cas酶的本发明融合蛋白以及相应的sgrna。
[0114]
本文的方法可以是体外方法,也可以是体内方法。当体内实施时,可采用本领域周知的手段将本文的融合蛋白或其表达载体和sgrna或其表达载体转入实验对象体内,如相应的组织细胞内,并通过观察动物表型变化筛选出感兴趣的功能变体。应理解,体内实验
时,实验对象可以是各种非人动物,尤其是本领域惯常采用的各种非人模式生物。体内实验也应满足伦理要求。
[0115]
下文将以具体实施例的方式阐述本发明。应理解,这些实施例仅仅是示例性的,而非限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如sambrook&russell所著的molecular cloning:a laboratory manual(分子克隆实验指南第三版)中所述的条件,或按照制造厂商所建议的条件。除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。
[0116]
实施例1:pentr11-dcas9-aid质粒和pentr11-dcas9-aidx质粒的构建
[0117]
1、以a20细胞株〔购买于中国科学院典型培养物保藏委员会细胞库〕rna反转录出的cdna为模板,利用seq id no:5和6所示引物及seq id no:5和7所示引物分别扩增出aid全长序列和aidx片段(从第183位氨基酸残基起截短)(见图1,a和c);
[0118]
2、构建pentr11-dcas9-tet1cd质粒:
[0119]
(1)利用pcr从dcas9质粒(addgene)扩增出dcas9目的基因片段;
[0120]
(2)利用限制性内切酶bamhⅰ和ncoⅰ对dcas9目的基因片段及pentr11质粒(invitrogen)酶切,回收上述片段;
[0121]
(3)将酶切后的dcas9片段及pentr11载体连接,然后将连接产物转化到top10感受态细胞中;
[0122]
(4)挑选阳性克隆,抽提质粒并送测序验证,至此完成了pentr11-dcas9质粒的构建;
[0123]
(5)利用pcr扩增出tet1cd目的基因片段;
[0124]
(6)利用限制性内切酶bamhⅰ和xhoⅰ对pentr11-dcas9质粒酶切,并回收片段;
[0125]
(7)利用gibson assembly方法将tet1cd克隆到pentr11-dcas9质粒中,至此完成了pentr11-dcas9-tet1cd质粒的构建;
[0126]
3、利用限制性内切酶bamhⅰ和xhoⅰ对pentr11-dcas9-tet1cd质粒、aid、aidx片段进行酶切,然后回收pentr11-dcas9载体及aid、aidx片段;
[0127]
4、分别将酶切后的aid、aidx片段与pentr11-dcas9载体连接,然后将连接产物转化到top10感受态细胞中;
[0128]
5、挑选阳性克隆,抽提质粒并送测序验证,至此完成了pentr11-dcas9-aid及pentr11-dcas9-aidx质粒的构建(图1,b和d)。
[0129]
实施例2:mo91-dcas9-aid质粒和mo91-dcas9-aidx质粒的构建
[0130]
1、利用seq id no:8和9所示引物从pentr11-dcas9-aid质粒和pentr11-dcas9-aidx质粒扩增出dcas9-aid片段和dcas9-aidx片段(图2,a);
[0131]
2、利用限制性内切酶bglⅱ和xhoⅰ对mo91质粒(addgene plasmid#19755)及aid、aidx片段进行酶切,然后回收载体、aid片段和aidx片段(图2,b);
[0132]
3、分别将酶切后的aid片段、aidx片段与mo91载体连接,然后将连接产物转化到stbl3感受态细胞中;
[0133]
4、挑选阳性克隆,抽提质粒并送测序验证,至此完成了mo91-dcas9-aid及mo91-dcas9-aidx质粒的构建(图2,c和d)。
[0134]
实施例3:mo91-dcas9(3*flag,nls)-aid质粒和mo91-dcas9(3*flag,nls)-aidx质粒的构建
[0135]
以pcw-cas9质粒(武汉淼灵生物科技有限公司)为模板,设计引物pcr扩增出3*flag nls片段,利用gibson assembly方法将3*flag nls片段分别克隆到mo91-dcas9-aid质粒和mo91-dcas9-aidx质粒的dcas9 n端,构建得到mo91-dcas9(3*flag,nls)-aid质粒和mo91-dcas9(3*flag,nls)-aidx质粒(图3)。
[0136]
实施例4:建立指示aid点突变效率的有效的报告系统
[0137]
在基因组水平造成的点突变水平需要通过简单直观的方法检测,本发明主要采用流式分析技术在蛋白水平间接检测点突变水平。egfp基因中人为插入终止密码子(tag),egfp无法正常表达。当本文的融合蛋白作用于egfp基因中的终止密码子时,使终止密码子点突变,使egfp基因突变正常表达。因此,egfp表达水平越高,点突变的效率越高。
[0138]
本实施例将含终止密码子的egfp基因(序列如图4所示)插入到mo405-thy1.1质粒(addgene)中,mscv启动基因表达。使用该质粒包毒感染293t,具体包括:
[0139]
1、铺板293t,包毒时细胞密度达到90%;
[0140]
2、24h后包毒,包毒方法和转染一样;
[0141]
3、包毒后24h换液;
[0142]
4、包毒后24h,第一次收毒,加入聚凝胺1ug/ml,800g,90min,6-8h后换液;
[0143]
5、包毒后48h,第二次收毒,加入聚凝胺1ug/ml,800g,90min,6-8h后换液;
[0144]
6、待细胞长到足够数量后,流式染色(pe-thy1.1),分选th1.1阳性细胞作为报告细胞。结果如图6所示。报告细胞的模式示意图显示在图5中。
[0145]
实施例5:sgrna的制备
[0146]
1、寻找20bp的靶标序列。如果该20bp的靶标序列的起始碱基不是g,需将一个g加到其5’端以使其能被rna聚合酶iii u6启动子有效转录。需注意的是该靶标序列不能含有xhoi或nhei的识别位点。
[0147]
2、将sgrna克隆到plx(addgene 50662)中,获得plx sgrna。需如下4个引物,其中r1和f2是sgrna特异性的:
[0148]
f1:aaactcgagtgtacaaaaaagcaggctttaaag(seq id no:10)
[0149]
r1:rc(gn
19
)ggtgtttcgtcctttcc(seq id no:11)
[0150]
f2:gn
19
gttttagagctagaaatagcaa(seq id no:12)
[0151]
r2:aaagctagctaatgccaactttgtacaagaaagctg(seq id no:13)
[0152]
其中,gn
19
=新的靶标序列,rc(gn
19
)=新靶标序列的反向互补序列。
[0153]
3、分别使用f1 r1和f2 r2扩增plx sgrna;
[0154]
4、凝胶纯化两次扩增获得的产物,合并,用于f1 r2进行第三次pcr;
[0155]
5、使用nhei和xhoi消化步骤4进行的pcr获得的产物;和
[0156]
6、连接和转化,从而制备得到sgrna的表达载体。
[0157]
四条sgrna的靶标结合区的碱基序列如下所示:
[0158]
gcatgcccgaaggctacgtcc(seq id no:14);
[0159]
gcaactagtatacccgcgccg(seq id no:15);
[0160]
gcctcgaacttcacctcggcg(seq id no:16);
[0161]
gtcagctcgatgcggttcacc(seq id no:17)。
[0162]
实施例6:crispr-cas9提高aid点突变效率
[0163]
培养实施例4所构建的报告细胞至70-90%的汇合度时进行转染。转染时,首先制备质粒dna-脂质体复合物,包括将四倍量的2000试剂稀释在培养基中,分别将mo91-dcas9(3*flag,nls)-aid质粒或mo91-dcas9(3*flag,nls)-aidx质粒稀释在培养基中,然后将稀释的质粒分别加到稀释的2000试剂中(1:1)孵育30分钟。之后将该质粒dna-脂质体复合物和实施例5制备的针对egfp终止密码子的4个sgrna共同转染实施例4所构建的报告细胞。作为对照,仅用所述质粒dna-脂质体复合物转染实施例4所构建的报告细胞。加嘌呤霉素2ug/ml和杀稻瘟菌素20ug/ml进行培育,筛选3d,分别在转染后第4天和第7天流式分析egfp表达水平。
[0164]
结果如图7所示,aid与aidx的%egfp 分别为0.14%和0.30%,而dcas9-aid sgrna和dcas9-aidx sgrna的%egfp 分别为2.14%和4.36%。
[0165]
结果表明,将aid或aidx与dcas9融合,在sgrna的导向作用下,会使aid在sgrna的靶向作用下,在aid的点突变功能局限在特异的部位,同时提高其作用浓度,提高其突变效率。
[0166]
实施例7:crispr-cas9提高aid点突变效率及优化
[0167]
采用与实施例6相同的方法,在实施例4构建的报告细胞中共转sgrna和dcas9-aid的表达载体。其中sgrna分两组,一组是针对aavs1的对照sgrna,其靶标结合区分别如下:gattcccagggccggttaatg(seq id no:18);gtcccctccaccccacagtg(seq id no:19);和ggggccactagggacaggat(seq id no:20)。另外一组是针对egfp的sgrna组(seq id no:14-17)。同时设置对照组在报告细胞中单转aid。对照sgrna的表达载体如实施例5所述方法构建。
[0168]
在转染后第8天测facs,aid组的egfp% 只有0.13%,而dcas9-aid sgrna组的egfp% 达到2.1%(图8,a),egfp% 有了16倍提高。为了进一步优化dcas9-aid系统的效率,将dcas9与不同的aid突变体融合:aid-fl(全长),aid-cd(仅含催化结构域),p182x(从第183位氨基酸残基起截短),r186x(从第187位氨基酸残基起截短),r190x(从第191位氨基酸残基起截短)。在报告细胞中共转各dcas9-aid表达载体和sgrna,其中dcas9-r186x的效率最高(图8,b和c)。因此采用dcas9-r186x进行实施例8-13的试验,在这些实施例中,将dcas9-r186x简称为dcas9-aidx。
[0169]
为了证明在dcas9-aid体系中确实是由aid与dcas9融合后,才使整个系统具有碱基置换功能,在报告细胞中分别共转cas9,dcas9,dcas9-aidx的功能突变体〔r186x(e58q)〕,dcas9-aidx和sgrna,只有dcas9-aidx和sgrna组具有egfp% ,而其他组均为0(图8,c)。也就证明确实是由aid与dcas9融合后,才使整个系统具有碱基置换功能。
[0170]
实施例8:crispr-cas9将aid点突变功能局限在sgrna靶向部位
[0171]
为研究crispr-cas9是否能将aid点突变功能局限在sgrna靶向部位,以实施例4构建的报告系统的基因组dna为模板,对含终止密码子的egfp进行pcr,构建文库,并将cmyc作为对照基因,进行miseq测序。结果如图9所示。由报告细胞的测序结果可知,miseq虽然测序通量高,滤去低质量的读数(reads)后,但仍有测序基底突变频率,egfp为0.25%,cmyc为0.15%。但即使有基底水平干扰,仍可观察到dcas9-aidx sgrna组的egfp基因点突变频率
明显高于aidx组,同样证明crispr-cas9提高aid点突变效率。并且这些高频突变位点主要集中在sgrna的靶向位点,而在cmyc基因中几乎没有发生点突变。证明dcas9与aid融合之后,sgrna将dcas9-aid靶向到sgrna的靶向位点,使aid只会对sgrna的靶向位点发挥作用,产生点突变,而不会对其他基因位点造成很大改变;并且能够大幅提高点突变频率。
[0172]
实施例9:dcas9-aidx将c和g碱基随机突变为其他三种碱基
[0173]
aidx本身会将c突变为t,将g突变为a。将dcas9与aidx融合之后,与aidx组对比,c和g的突变方向变得更加均一化。
[0174]
同时aid本身的作用是依赖于hotspot基序的wrcy(w代表a/t,r代表a/c,y代表c/t),其中最偏好的基序是agct。而将dcas9与aidx融合之后,这种基序的偏好性会明显消失。因此本发明人提出一种假设,正常情况下,aid会将胞嘧啶脱氨基,形成尿嘧啶,通过dna复制修复,将这种u-g错配保留,发生c到t、g到a的突变,另外可以通过碱基切除修复方式,将u碱基切除,随即插入四种碱基。所以dcas9与aid的融合很有可能抑制dna复制这条途径,促进碱基切除修复,使突变方向更加均一化(图10,b)。
[0175]
此外,对miseq数据进行统计分析,aidx和dcas9-aidx sgrna组在egfp上的造成点突变类型基本上与报道一致,c和g碱基突变占主要部分,a和t所占比例较少。并且g主要突变向t,c突变向a。但在dcas9-aidx组,g突变向t和c的比例增加,c突变向g或a的比例增加。因此,dcas9-aidx可以产生更均一的突变类型(图10,a)。
[0176]
实施例10:ugi提高dcas9-aidx系统的碱基置换频率,揭示dcas9-aidx在基因上的作用轨迹,并使碱基突变方向更加单一化。
[0177]
ugi是ung的抑制剂,是一种噬菌体蛋白,当噬菌体入侵大肠杆菌时,可以保护自身的基因组免受宿主ung的修复(图11,a)。在报告细胞中共转三种质粒,分别表达dcas9-aidx、单条sgrna(靶标结合区为gcctcgaacttcacctcggcg,seq id no:16)和ugi(蛋白序列:uniprotkb-p14739),用以提高在整个体系中单条sgrna的突变效率。结果显示,最高点突变效率有10倍提高(图11,b)。
[0178]
除此之外,加入ugi后,整个体系的突变方向更加单一,c到t,g到a。同时统计了dcas9-aidx的作用轨迹,整个体系在pam序列前后造成的突变频率。图11(c)是根据针对egfp位点设计的4个sgrna的数据进行的统计。都是以pam序列中ngg中的n为第一位碱基。其上游为-,下游为 ,两组数据的统计结果一致,都是对pam的上游20bp也就是在原型间隔序列区域造成突变,而且突变最高点是在pam的-12/-13位。ugi可以增加aid的整体突变频率,但会使碱基置换的比例增加,转换比例减少(图11,d)。
[0179]
实施例11:dcas9-aidx不仅可以对外源性基因起作用,同时可以作用于内源性基因。以上的实验均是在报告细胞中进行,本实施例选用内源性基因aavs1作为靶标位点,设计3个sgrna(seq id no:18-20),在293t中共转表达dcas9-aid和针对aavs1的三个sgrna的载体(如实施例7所述)。
[0180]
结果如图12所示。dcas9-aid系统同样可以对内源性基因aavs1产生碱基置换,并且这种突变也是集中在sgrna靶标位点。
[0181]
实施例12:将dcas9-aidx应用于k562 bcr-abl基因的gleevec耐药性筛选k562是来源于慢性髓样白血病人的白血病细胞系。在这种细胞中存在着一种染色体,叫做ph染色体。该染色体是由第9号和第22号染色体的长臂转座而成。第9号染色体上的abl基因含有酪
数量级(图14,b)。同时收集gleevec处理和dmso处理的细胞的dna和rna,进行高通量测序分析。测序结果表明,在30%的细胞中有t315i的突变,而此突变是已知的在病人中发现的耐药性突变,除此之外,还发现多个未报道过的点突变(图14,c和d)。
[0184]
实施例13:将dcas9-aidx应用于体外提高抗体的亲和力和特异性
[0185]
抗体可以特异性的识别抗原,作为治疗多种疾病的药物蛋白。抗体的亲和力与其在体内生发中心产生的体细胞突变成正比,一般而言,高亲和力的抗体都具有多个体细胞高频突变。因此,可以使用dcas9-aidx来针对抗体基因进行突变,筛选亲和力更强或具有其它特征(如特异性更好等)的抗体。
[0186]
使用方案如下,在293t细胞表面稳定表达抗体分子,而后针对抗体基因,设计sgrna,和dcas9-aidx同时转染293t细胞,而后进行细胞表面的染色,染色越强的细胞,其突变的抗体分子具有更强的亲和力。
[0187]
本实施例采用invitrogen公司的稳定表达一个lacz-zeocintm融合基因座的flp-in
tm-293细胞。首先合成低亲和力的抗鸡卵溶菌酶(hel)的小鼠igg1抗体(kd=2.78e-09m)的cdna序列,并连接上h2kk蛋白跨膜区序列的编码序列,以在抗体末端加入h2kk蛋白的跨膜区序列,将所得dna序列克隆如pcdna5/frt/goi载体(life science technology,usa)中。将该载体转入flp-in
tm-293细胞中,利用该flp-in
tm-293细胞所含的flp-in
tm
系统将含flp重组靶位点的该igg1编码序列通过flp重组酶整合到lacz-zeocintm融合基因座上。没有整合成功的细胞能够表达抗zeocin的蛋白;而整合成功后,抗zeocin的蛋白由于缺少起始密码子atg而不能表达,但能够表达抗潮霉素的蛋白。因此,利用潮霉素抗生素来筛选出igg1整合成功的293细胞,在这类细胞中,每个细胞只表达一个拷贝的抗hel-igg1基因。
[0188]
接着,分别针对igg1重链和轻链的各3个cdrs选择16个合适的pam序列设计如下所示的sgrna(seq id no:73-88),使每个重链或轻链的cdr至少有2条sgrna覆盖:
[0189]
igh
[0190]
cdr1_1:tccctcacctgttctgtcac(seq id no:73);
[0191]
cdr1_2:gctccagtaatcactggtga(seq id no:74);
[0192]
cdr1_3:gatccagctccagtaatcac(seq id no:75);
[0193]
cdr1_4:gtgattactggagctggatc(seq id no:76);
[0194]
cdr2_1:atggggtacgtaagctacag(seq id no:77);
[0195]
cdr2_2:gagattcgacttttgagaga(seq id no:78);
[0196]
cdr3_1:tattactgtgcaaactggga(seq id no:79);
[0197]
cdr3_2:caaactgggacggtgattac(seq id no:80);
[0198]
cdr3_3:gacggtgattactggggcca(seq id no:81);
[0199]
igl
[0200]
cdr1_1:gttgttgccaatactttggc(seq id no:82);
[0201]
cdr1_2:atagcgtcagtctttcctgc(seq id no:83);
[0202]
cdr1_3:gtattggcaacaacctacac(seq id no:84);
[0203]
cdr2_1:aggggatcccagagatggac(seq id no:85);
[0204]
cdr2_2:tatgcttcccagtccatctc(seq id no:86);
[0205]
cdr3_1:tctgtcaacagagtaacagc(seq id no:87);
[0206]
cdr3_2:gtcccccctccgaacgtgta(seq id no:88)。
[0207]
然后将sgrna序列克隆到psuper-puro质粒载体(addgene)中。将实施例3构建的mo91-dcas9(3*flag,nls)-aidx质粒和sgrna库(即16个sgrna按等量混合在一起)或对照基因aavs1的sgrna共转染到前文获得的表达igg1的293细胞中,经过嘌呤霉素和杀稻瘟菌素抗生素筛杀后,于转染后第7天进行pe抗小鼠igg和alex647-hel表面染色后进行流式分选,分选出igg强度不变而和hel抗原结合增加的细胞。经培养增殖后,首先对dna上的突变进行高通量测序分析,其结果和本文对abl基因或gfp基因的突变基本一致(图15)。dcas9-aidx诱导了抗hel igg1可变区的碱基突变并可重复地诱导igg1 cdr的碱基突变(图16)。
[0208]
而后,用pe抗小鼠igg1和647-hel表面染色在流式细胞仪上检测突变后的细胞,发现一小群细胞的igg1表达不变而和hel结合增加。而后对这群细胞进行流式分选,分选扩增后,和突变前的细胞进行比较,发现突变后的抗体对hel的亲和力增强了10倍以上(图17)。
[0209]
然后收取适量细胞抽取基因组dna进行测序,发现其亲和力增加的主要原因是由轻链的52位的甘氨酸突变为天冬氨酸(碱基为ggt改变为gat,图15)。
[0210]
实施例14:其它融合蛋白的制备
[0211]
1、质粒的构建
[0212]
(1)利用基因合成合成xten接头序列;
[0213]
(2)利用限制性内切酶对实施例2构建获得的mo91-dcas9-aidx质粒进行酶切,回收载体、aidx片段和dcas9片段;
[0214]
(3)分别将酶切后的aidx片段、dcas9片段、xten接头序列与mo91载体连接,然后将连接产物转化到stbl3感受态细胞中;
[0215]
(4)挑选阳性克隆,抽提质粒并送测序验证,至此完成了mo91-dcas9-xten-aidx质粒的构建;
[0216]
可参照上述步骤以及实施例1和2的方法构建质粒mo91-aidx-xten-dcas9,mo91-dcas9-xten-aidx(k10e t82i e156g)以及mo91-ncas9-aidx。
[0217]
在需要克隆入3*flag和/或nls片段时,可参照实施例3的方法在上述质粒中克隆入3*flag和/或nls片段,获得分别表达seq id no:66、68、70和72所示融合蛋白的质粒。这些融合蛋白中的aidx为从第183位氨基酸残基起截短的aid片段或其突变体。
[0218]
2、重组蛋白的表达和纯化
[0219]
(1)按常规方法构建质粒pet-ncas9-aidx-6his,然后用该质粒转化大肠杆菌bl21 star-感受态细胞;
[0220]
(2)将所得表达菌株在含有100μg/ml卡那霉素的lb培养基中在37℃下生长过夜。将细胞以1:100稀释到2xyt培养基中,并在37℃下生长至od 600=~0.6。培养物在2小时内冷却至4℃,加入iptg 0.5mm,诱导蛋白表达~16h;
[0221]
(3)通过在4000g离心15分钟收集细胞,并重悬于裂解缓冲液中;
[0222]
(4)细胞用细胞破碎剂(union)在800巴下裂解5分钟,离心后分离裂解物上清15分钟;
[0223]
(5)将裂解物在4℃下与ni-nta(1ml浆液/l细菌)(dp101,transgen)一起温育1小时以捕获his-标记的融合蛋白;将树脂转移到柱中,用冷洗涤缓冲液(使用考马斯g250不能观察到颜色变化的程度)广泛洗涤;
[0224]
(6)his标记的融合蛋白在洗脱缓冲液中洗脱,并通过超滤(amicon-millipore,100kda分子量截留)浓缩至1ml总体积;
[0225]
(7)将蛋白质在缓冲液a中稀释至20ml,并加载到hi-trap sp柱(29051324,ge healthcare)上并用100mm-1m nacl梯度洗脱;
[0226]
(8)将含有ncas9-aidx的洗脱级分浓缩至约1ml,并通过使用superdex 20010/300gl柱(17517501,ge医疗);
[0227]
(9)将洗脱的蛋白质浓缩至约3mg/ml,在液氮中快速冷冻并储存在-80℃。
[0228]
在细菌中诱导ncas9-aidx表达的电泳图谱见图18。
[0229]
3、不同融合蛋白的功能测试
[0230]
采用与实施例10相同的方法测试本实施例不同融合蛋白的功能。结果如图19-21所示。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献