一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

DNA结合结构域反式激活因子及其用途的制作方法

2021-11-26 21:39:00 来源:中国专利 TAG:
dna结合结构域反式激活因子及其用途1.相关申请2.本技术根据35u.s.c.§119(e)要求标题为“zincfingerproteintransactivatorsandusesthereof”且于2019年2月25日提交的美国临时申请序列号62/810,005的申请日的权益,其全部内容以引用的方式并入本文。
背景技术
::3.靶基因表达的调控已作为生物医学研究的主要领域而出现。基因表达的上调可纠正因基因表达降低而导致的单倍体不足(haploinsufficient)病状。当基因的至少一个拷贝中存在一个或多个功能丧失突变时,通常会导致单倍体不足。用于治疗与单倍体不足相关的疾病的基于aav的基因增强方法受到传统raav载体的包装能力的阻碍。技术实现要素:4.本公开的方面涉及用于基因递送的分离的核酸和重组aav载体。本公开部分地基于用于调控靶基因表达的组合物(例如,raav载体和raav)和方法,其中靶基因是单倍体不足的,诸如scn1a。在一些实施方案中,本公开提供包含dna结合结构域(诸如cys2‑his2锌指蛋白(zfp))和转录调控子结构域的融合蛋白。在一些实施方案中,本公开描述的组合物包含含有融合至转录调控子结构域的dna结合结构域(例如,zfp、转录激活因子样效应物(tale)结构域等)的融合蛋白。在一些实施方案中,本公开描述的融合蛋白增加靶基因(例如,scn1a)的表达,并因此可用于治疗与正常细胞或受试者相比,细胞或受试者中以靶基因表达缺陷为特征的疾病(例如,与靶基因的单倍体不足相关的疾病)。5.因此,在一些方面,本公开提供一种分离的核酸,其包含被配置来表达融合至至少一个转录调控子结构域的至少一个dna结合结构域的转基因,其中dna结合结构域结合至靶基因或靶基因(例如,在受试者或细胞中)的调控区(例如,增强子序列、启动子序列、阻遏子序列等),其中靶基因编码电压门控钠通道(例如,nav1.1)。在一些实施方案中,靶基因为scn1a基因。在一些实施方案中,转基因的侧翼为腺相关病毒(aav)反向末端重复序列(itr)。在一些实施方案中,至少一个dna结合结构域结合靶基因(例如,在受试者或细胞中),并且转录调控子结构域修饰(例如,上调)靶基因的表达。6.在一些方面,本公开提供一种重组aav(raav),其包含:核酸,所述核酸包含编码融合至至少一个转录调控子结构域的至少一个dna结合结构域,其中dna结合结构域结合至靶基因或靶基因(例如,在受试者或细胞中)的调控区,其中靶基因编码电压门控钠通道(例如,nav1.1);以及至少一种衣壳蛋白。在一些实施方案中,靶基因为scn1a基因。在一些实施方案中,转基因的侧翼为aav反向末端重复序列(itr)。7.在一些实施方案中,至少一个dna结合结构域结合靶基因(例如,在受试者或细胞中),并且转录调控子结构域修饰(例如,上调)受试者中靶基因的表达。8.在一些实施方案中,至少一个dna结合结构域结合到靶基因的非翻译区。在一些实施方案中,dna结合结构域结合到靶基因的调控区,任选地增强子序列、启动子序列和/或阻遏子序列。9.在一些实施方案中,dna结合结构域结合在靶基因的调控区(例如,增强子序列、启动子序列和/或阻遏子序列等)的上游2bp与2000bp或上游或下游2bp与2000bp之间。10.在一些实施方案中,至少一个dna结合结构域编码锌指蛋白(zfp)、转录激活因子样效应物(tale)、dcas蛋白(例如,dcas9或dcas12a)和/或同源结构域(homeodomain)。在一些实施方案中,至少一个dna结合结构域结合到seqidno:5‑7中的任一个中列出的核酸序列。在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含由具有seqidno:11‑16、23‑28或35‑40中的任一个中列出的序列的核酸编码的识别螺旋。在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含seqidno:17‑22、29‑34或41‑46中的任一个中列出的氨基酸序列。11.在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含由包含seqidno:11的核酸编码的识别螺旋、由包含seqidno:12的核酸编码的识别螺旋、由包含seqidno:13的核酸编码的识别螺旋、由包含seqidno:14的核酸编码的识别螺旋、由包含seqidno:15的核酸编码的识别螺旋和/或由包含seqidno:16的核酸编码的识别螺旋。在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含seqidno:57的氨基酸序列。在一些实施方案中,结合到scn1a基因的zfp包含与seqidno:57的氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性。12.在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含由包含seqidno:23的核酸编码的识别螺旋、由包含seqidno:24的核酸编码的识别螺旋、由包含seqidno:25的核酸编码的识别螺旋、由包含seqidno:26的核酸编码的识别螺旋、由包含seqidno:27的核酸编码的识别螺旋和/或由包含seqidno:28的核酸编码的识别螺旋。在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含seqidno:59的氨基酸序列。在一些实施方案中,结合到scn1a基因的zfp包含与seqidno:59的氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性。13.在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含由包含seqidno:35的核酸编码的识别螺旋、由包含seqidno:36的核酸编码的识别螺旋、由包含seqidno:37的核酸编码的识别螺旋、由包含seqidno:38的核酸编码的识别螺旋、由包含seqidno:39的核酸编码的识别螺旋和/或由包含seqidno:40的核酸编码的识别螺旋。在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含seqidno:61的氨基酸序列。在一些实施方案中,结合到scn1a基因的zfp包含与seqidno:61的氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性。14.在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含含seqidno:17的氨基酸序列的识别螺旋、含seqidno:18的氨基酸序列的识别螺旋、含seqidno:19的氨基酸序列的识别螺旋、含seqidno:20的氨基酸序列的识别螺旋、含seqidno:21的氨基酸序列的识别螺旋和/或含seqidno:22的氨基酸序列的识别螺旋。15.在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含含seqidno:29的识别螺旋、含seqidno:30的识别螺旋、含seqidno:31的识别螺旋、含seqidno:32的识别螺旋、含seqidno:33的识别螺旋和/或含seqidno:34的识别螺旋。16.在一些实施方案中,至少一个dna结合结构域为锌指蛋白,其包含含seqidno:41的识别螺旋、含seqidno:42的识别螺旋、含seqidno:43的识别螺旋、含seqidno:44的识别螺旋、含seqidno:45的识别螺旋和/或含seqidno:46的识别螺旋。17.在一些实施方案中,至少一个dna结合结构域为催化失活的crispr相关蛋白(cas蛋白)。在一些实施方案中,催化失活的cas蛋白(或“死亡cas蛋白”)为dcas9或dcas12蛋白。在一些实施方案中,核酸或raav还包含至少一种指导核酸(例如,指导rna或grna)。在一些实施方案中,指导核酸包含靶向scn1a的间隔区序列。在一些实施方案中,指导核酸包含具有seqidno:85、86、89、90、93或94中的任一个的核苷酸序列的间隔区序列。在一些实施方案中,指导核酸包含具有seqidno:83‑94中的任一个的核苷酸序列。在一些实施方案中,指导核酸由seqidno:83‑94中的任一个列出的核酸序列编码。18.在一些实施方案中,至少一个转录调控子结构域为包含vp16结构域、vp64结构域、rta结构域、p65结构域、hsf1结构域或其任何组合的反式激活因子结构域,诸如vpr结构域(vp64 p65 rta1结构域)。在一些实施方案中,至少一个转录调控子结构域由如seqidno:47中列出的核酸序列编码。在一些实施方案中,至少一个反式激活结构域包含seqidno:48中列出的氨基酸序列。19.在一些实施方案中,位于转基因侧翼的itr包含选自由以下组成的组的itr:aav1itr、aav2itr、aav3itr、aav4itr、aav5itr、aav6itr、aav8itr、aavrh8itr、aav9itr、aav10itr或aavrh10itr。在一些实施方案中,itr为δtr或mtr。20.在一些实施方案中,分离的核酸的转基因可操作地连接到启动子。在一些实施方案中,启动子为组织特异性启动子。在一些实施方案中,组织特异性启动子为神经元启动子,诸如sst、nyp、磷酸激活的谷氨酰胺酶(pag)、囊泡谷氨酸转运蛋白‑1(vglut1)、谷氨酸脱羧酶65和57(gad65、gad67)、突触蛋白i、a‑camkii、dock10、prox1、小白蛋白(pv)、生长抑素(sst)、胆囊收缩素(cck)、钙视网膜蛋白(cr)或神经肽y(npy)。21.在一些实施方案中,转基因的dna结合结构域通过接头结构域与转录调控子结构域融合。在一些实施方案中,接头结构域为柔性接头,例如富含甘氨酸的接头或甘氨酸‑丝氨酸接头;或可裂解的接头,诸如可光裂解的接头或酶(例如,蛋白酶)可裂解的接头。22.在一些实施方案中,分离的核酸包含编码多个dna结合结构域(例如,1、2、3、4、5、6、7、8、9或10个dna结合结构域)的转基因。在一些实施方案中,分离的核酸包含编码多个转录调控子结构域(例如,1、2、3、4、5、6、7、8、9或10个转录调控子结构域)的转基因。23.在一些实施方案中,分离的核酸或raav在特征在于相对于正常细胞或受试者,靶基因的异常表达或单倍体不足(例如,表达增加或表达减少)的细胞或受试者中表达。在一些实施方案中,分离的核酸或raav在特征在于相对于正常细胞或受试者,靶基因的表达不足(例如,减少)的细胞或受试者中表达。在一些实施方案中,分离的核酸或raav的靶基因为scn1a。24.在一些实施方案中,aav衣壳血清型选自由以下组成的组:aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aavrh8、aav9、aav10、aavrh10或aav.phpb。25.在一些方面,本公开提供了调控靶基因表达的方法。在一些实施方案中,本公开的方法包括向表达靶基因的细胞或受试者施用如本文所述的分离的核酸或raav,其中所述受试者对靶基因单倍体不足(例如,对scn1a单倍体不足)。例如,在一些实施方案中,靶基因(诸如scn1a)在所述细胞或受试者中的表达相对于正常细胞或受试者中的靶基因表达是缺陷的(例如,减少)。在一些实施方案中,向其施用分离的核酸或raav的细胞为神经元。在一些实施方案中,神经元为gaba能神经元。26.在一些实施方案中,施用分离的核酸或raav导致靶基因表达(例如,scn1a表达)相对于未施用分离的核酸或raav的受试者增加至少2倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。在一些实施方案中,施用分离的核酸或raav导致靶基因表达(例如,scn1a表达)相对于施用分离的核酸或raav之前受试者中的靶基因(例如,scn1a)表达增加至少2倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。27.在一些方面,本公开提供了一种调控受试者中的基因表达(例如,scn1a的表达)的方法,其中将如本文所述的分离的核酸或raav施用于表达靶基因的受试者。在一些实施方案中,相对于健康受试者,受试者中靶基因的表达是异常的(例如,增加或减少)。在一些实施方案中,相对于健康受试者,受试者关于靶基因的表达是或疑似是单倍体不足的。28.在一些实施方案中,受试者患有或疑似患有由靶基因的单倍体不足表达引起的疾病或病状。例如,在一些实施方案中,对于scn1a表达单倍体不足的受试者患有德拉韦综合征(dravetsyndrome)。在一些实施方案中,通过静脉内注射、肌肉内注射、吸入、皮下注射和/或颅内注射向受试者施用分离的核酸或raav。29.在一些方面,本公开提供了一种包含如本公开所述的分离的核酸或raav的组合物。在一些实施方案中,组合物包含药学上可接受的载剂。30.在一些方面,本公开提供了一种包含容纳如本公开所述的分离的核酸或raav的容器的试剂盒。在一些实施方案中,试剂盒包含容纳药学上可接受的载剂的容器。在一些实施方案中,分离的核酸或raav和药学上可接受的载剂容纳在同一容器中。在一些实施方案中,容器为注射器。31.在一些方面,本公开提供了一种包含如本公开所述的分离的核酸或raav的宿主细胞。在一些实施方案中,宿主细胞为真核细胞。在一些实施方案中,宿主细胞为哺乳动物细胞。在一些实施方案中,宿主细胞为人细胞,任选地为神经元,例如gaba能神经元。附图说明32.图1示出了表明人(hek)与小鼠(hepg2)scn1a基因之间的序列保守性的色谱测序数据(共有序列–seqidno:98;靶序列–seqidno:99;hep‑scn1a_r4序列(顶部)–seqidno:100;hep‑scn1a_r4序列(底部)–seqidno:10133.图2示出了人(seqidno:1)和小鼠(seqidno:2)scn1a基因的近端启动子区的序列比对,其中突出显示了保守序列。在此保守序列中的是锌指蛋白(zfp)结合区的关注的靶区,其以粗体显示(seqidno:4)。34.图3是示出scn1a基因近端启动子区中三个重叠靶zfp(zfp‑1、zfp‑2、zfp‑3)(seqidno:5‑7)结合位点的位置(seqidno:3)的示意图。35.图4a至图4d示出了zfp‑1中单个锌指(指1至指6;f1‑f6)的六个识别螺旋序列的比对,其将识别scn1a基因(seqidno:2)的近端启动子区内的单独的三个碱基区(以红色表示的dna三联体,通过“·”分隔)。图4a突出显示了zfp‑1的锌指1至6(f1‑f6)将结合的核苷酸序列(seqidno:3)。图4b示出了由zfp‑1(seqidno:17‑22)的指1至6的每个识别螺旋(七个氨基酸)识别的三个核苷酸序列。图4c示出了zfp‑1的氨基酸序列,其含有6个指,每行一个,其中指之间的接头被突出显示以指定经典(tgekp)和非经典(tgsqkp)接头序列(seqidno:65‑70)。图4d示出了zfp‑1(f1‑f6)(seqidno:102‑107)的核苷酸序列。36.图5a至图5d示出了zfp‑2中单个锌指(指1至指6;f1‑f6)的六个识别螺旋序列的比对,其将识别scn1a基因(seqidno:3)的近端启动子区内的单独的三个碱基区(以红色表示的dna三联体,通过“*”分隔)。图5a突出显示了zfp‑2的锌指1至6(f1‑f6)将结合的核苷酸序列(seqidno:3)。图5b示出了由zfp‑2(seqidno:29‑34)的指1至6的每个识别螺旋(七个氨基酸)识别的前三个核苷酸。图5c示出了zfp‑2的氨基酸序列,其含有6个指,每行一个(seqidno:69‑74),其中指之间的接头被突出显示以指定经典(tgekp)和非经典(tgsqkp)接头序列。图5d示出了zfp‑2(f1‑f6)(seqidno:108‑113)的核苷酸序列。37.图6a至图6d示出了zfp‑3中单个锌指(指1至指6;f1‑f6)的六个识别螺旋序列的比对,其将识别scn1a基因(seqidno:4)的近端启动子区内的单独的三个碱基区(以红色表示的dna三联体,通过“*”分隔)。图6a突出显示了zfp‑3的锌指1至6(f1‑f6)将结合的核苷酸序列(seqidno:3)。图6b示出了由zfp‑3(seqidno:41‑46)的指1至6的每个识别螺旋(七个氨基酸)识别的前三个核苷酸。图6c示出了zfp‑3的氨基酸序列,其含有6个指,每行一个(seqidno:75‑80),其中指之间的接头被突出显示以指定经典(tgekp)和非经典(tgsqkp)接头序列。图6d示出了zfp‑3(f1‑f6)(seqidno:114‑119)的核苷酸序列。38.图7示出了表明如通过定量实时聚合酶链反应(qrt‑pcr)所测量,图4至图6中所述的scn1a结合zfp增加hek293t细胞中的scn1a基因表达的数据。通过瞬时转染编码以下转录调控因子的表达质粒来将这些表达构建体递送至细胞:酿脓链球菌(streptococcuspyogenes)cas9 scn1a指导rna(spcas9 scn1a);无核酸内切酶活性的cas9(dcas9);vpr激活结构域 scn1a指导rna(dcas9_vpr scn1a);vpr激活结构域 zfp1(vpr_zfp1);vpr激活结构域 zpf2(vpr_zfp2);vpr激活结构域 zfp3(vpr_zfp3);spcas9 ascl1指导rna(spcas9 ascl1);三个vpr_zfp(vpr_zfp1 vpr_zfp2 vpr_zfp3)。将表达水平归一化为每个样品中通过qrt‑pcr确定的tbp表达水平。39.图8示出了表明如通过定量实时聚合酶链反应(qrt‑pcr)所测量,图4至图6中所述的scn1a结合zfp以及cas9 scn1a指导rna增加hek293t细胞中的scn1a基因表达的数据。具体实施方式40.本公开的方面涉及用于调控(例如,增加)细胞或受试者中靶基因的表达的方法和组合物,其中靶基因为单倍体不足的(即,靶基因包含一个功能拷贝)。在一些实施方案中,靶基因为scn1a。41.在一些实施方案中,本公开提供包含dna结合结构域(诸如zfp)和转录调控子结构域的融合蛋白。在一些实施方案中,本公开提供包含dna结合结构域(诸如zfp)和反式激活因子结构域(例如,vpr结构域)的融合蛋白。在一些实施方案中,dna结合蛋白结合到靶基因序列或靶基因的调控区。在一些实施方案中,调控区为增强子序列、启动子序列或阻遏子序列。在一些实施方案中,启动子序列可为内部启动子(例如,位于靶基因的内含子中)或外部启动子(例如,位于靶基因的转录起始位点的上游)。在一些实施方案中,本文所述的融合蛋白的dna结合结构域结合靶基因(例如,scn1a)的启动子区中的保守序列,因此反式激活因子结构域增加基因表达。42.在一些方面,本公开涉及用于增加细胞或受试者中靶基因(例如,scn1a)的表达的方法。在一些实施方案中,靶基因含有使细胞或受试者对靶基因单倍体不足的突变。因此,在一些实施方案中,本公开的方法和组合物可用于治疗与靶基因产物的单倍体不足相关的疾病和病症,例如德拉韦综合征,其通常是由于scn1a基因的一个拷贝中的突变导致电压门控钠通道α亚基nav1.1的单倍体不足所致。43.反式激活因子融合蛋白44.本公开的一些方面涉及包含dna结合结构域(dbd)和反式激活因子结构域的融合蛋白。如本文所用,融合蛋白包含由两个或更多个单独的氨基酸序列编码的两个或更多个连接多肽。如本文所用,嵌合蛋白为融合蛋白,其中两个或更多个连接基因来自不同物种。融合蛋白通常是重组产生的,其中编码融合蛋白的基因位于支持两个或更多个连接基因表达和将所得mrna翻译成重组蛋白的系统中。在一些实施方案中,融合蛋白在原核或真核细胞中重组产生。融合蛋白可以多种排列构造。例如,一种蛋白质(蛋白质a)位于第二种蛋白质(蛋白质b)的上游。在其他融合蛋白构型中,蛋白质b位于蛋白质a的上游。在一些实施方案中,编码dna结合结构域的核酸序列位于编码反式激活因子结构域的核酸序列的上游,并产生包含连接到反式激活因子的dbd的融合蛋白。在一些实施方案中,编码反式激活因子结构域的核酸序列位于编码dna结合结构域的核酸序列的上游,并产生包含连接到dna结合结构域的反式激活因子结构域的融合蛋白。在一些实施方案中,融合蛋白包含位于dna结合结构域上游的反式激活因子结构域。在一些实施方案中,融合蛋白包含位于反式激活因子结构域上游的dna结合结构域。45.在一些实施方案中,本公开所述的融合蛋白包含dna结合结构域。如本文所用,“dna结合结构域(dbd)”是指包含识别双链或单链dna(dsdna或ssdna)的至少一个结构基序的独立折叠蛋白质。某些dbd识别特定序列(识别序列或基序),而其他类型的dbd对dna具有一般亲和力。在一些实施方案中,本公开所述的融合蛋白包含序列特异性dbd。在一些实施方案中,dbd识别(例如,特异性结合)编码scn1a蛋白(例如nav1.1)的基因内或附近的核酸序列。含有dbd的蛋白质通常参与细胞过程,诸如转录、复制、修复和dna储存。转录因子中的dbd识别启动子区或增强子元件中的特定dna序列以促进基因表达。转录因子dbd在基因工程中用作融合蛋白来调控靶基因的表达,并且可突变以改变dna结合特异性或dna结合亲和力,从而调控所需靶基因的表达。dbd的实例包括但不限于螺旋‑转角‑螺旋基序、锌指基序(包括cys2‑his2锌指)、转录激活因子样效应物(tale)、翼螺旋基序、hmg‑盒、dcas蛋白(例如,dcas9或dcas12a)、同源结构域和ob折叠结构域。46.在一些实施方案中,本公开涉及锌指dbd融合蛋白。如本文所用,“锌指蛋白(zfp)”是指含有至少一个结构基序的蛋白质,其特征在于稳定蛋白质折叠的一种或多种锌离子的配位。锌指是在蛋白质中发现的最多样化的结构基序之一,并且高达3%的人基因编码锌指。大多数zfp含有与靶分子(包括dna、rna和小蛋白泛素)串联接触的多个锌指。“经典”锌指基序由2个半胱氨酸氨基酸和2个组氨酸氨基酸(c2h2)组成,并以序列特异性方式结合dna。这些zfp(包括转录因子iiiia(tfiiia))通常涉及基因表达。dna结合蛋白中的多个锌指基序结合并包裹在dna双螺旋的外侧。由于它们的尺寸相对较小(例如,每个指为约25‑40个,通常为27‑35个氨基酸),锌指结构域融合蛋白用于创建具有新的dna结合特异性的dbd。这些dbd可递送其他融合结构域(例如,转录激活或抑制结构域或表观遗传修饰结构域)以改变靶基因的转录调控。在一些实施方案中,锌指蛋白包含2至8个指,其中每个指含有27至40个氨基酸(例如,27、28、29、30、31、32、33、34、35、36、37、38、39或40个氨基酸)。47.在一些实施方案中,zfp包含1、2、3、4、5、6、7或8个锌指。每个锌指可包含25‑40、25‑30、30‑35、35‑40或40‑45个氨基酸。在一些实施方案中,锌指包含27‑35个氨基酸。在一些实施方案中,锌指包含27、28、29、30、31、32、33、34或35个氨基酸。锌指可特异性识别或结合在受试者中单倍体不足的靶序列,例如,靶基因或靶基因的调控区。在一些实施方案中,锌指结合到scn1a基因(例如,人scn1a,例如如seqidno:49中列出的)的靶序列。在一些实施方案中,结合到scn1a基因的靶序列的锌指包含seqidno:63‑80的一个或多个氨基酸序列或其组合。在一些实施方案中,锌指特异性识别或结合到包含三核苷酸序列的靶序列。48.在一些实施方案中,锌指包含识别或结合到靶序列(例如,包含三核苷酸序列的靶序列)的识别螺旋。在一些实施方案中,识别螺旋结合到三核苷酸。在一些实施方案中,识别螺旋包含4‑10个氨基酸。在一些实施方案中,识别螺旋包含4、6、7、8、9或10个氨基酸。在一些实施方案中,识别螺旋结合到scn1a基因的三核苷酸序列。在一些实施方案中,结合到scn1a基因的识别序列包含seqidno:17‑22、29‑34或41‑46中的任一个的氨基酸序列。在一些实施方案中,结合到scn1a基因的识别序列由seqidno:11‑16、23‑28或35‑40中的任一个编码。在一些实施方案中,锌指结合到与包含seqidno:17‑22、29‑34或41‑46中的任一个的氨基酸序列的识别螺旋相同的核苷酸序列。49.在一些实施方案中,锌指在其c末端包含接头序列,其可用于将所述锌指链接或连接至另外的锌指。在一些实施方案中,接头序列可为例如包含tgekp(seqidno:120)的氨基酸序列的经典接头。在一些实施方案中,接头序列可为例如包含tgsqkp(seqidno:121)的氨基酸序列的非经典接头。在一些实施方案中,接头序列可为2‑10个氨基酸,例如,2、3、4、5、6、7、8、9或10个氨基酸。50.在一些实施方案中,结合到靶基因(例如,scn1a基因)的zfp包含六个锌指,每个锌指识别或结合到靶基因(例如,scn1a基因)的不同三核苷酸序列。在一些实施方案中,结合到scn1a基因的zfp包含seqidno:57的氨基酸序列。在一些实施方案中,结合到scn1a基因的zfp包含含有seqidno:63、64、65、66、67和/或68的氨基酸序列的锌指。在一些实施方案中,结合到scn1a基因的zfp包含含有seqidno:17、18、19、20、21和/或22的氨基酸序列的识别螺旋。在一些实施方案中,结合到scn1a基因的zfp包含seqidno:59的氨基酸序列。在一些实施方案中,结合到scn1a基因的zfp包含含有seqidno:69、70、71、72、73和/或74的氨基酸序列的锌指。在一些实施方案中,结合到scn1a基因的zfp包含含有seqidno:29、30、31、32、33和/或34的氨基酸序列的识别螺旋。在一些实施方案中,结合到scn1a基因的zfp包含seqidno:61的氨基酸序列。在一些实施方案中,结合到scn1a基因的zfp包含含有seqidno:75、76、77、78、79和/或80的氨基酸序列的锌指。在一些实施方案中,结合到scn1a基因的zfp包含含有seqidno:41、42、43、44、45和/或46的氨基酸序列的识别螺旋。在一些实施方案中,结合到scn1a基因的zfp包含与如下所示的seqidno:57、59或61至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性。51.seqidno:57(zfp1蛋白的氨基酸序列)52.rpfqcricmrnfsqrgnlvrhirthtgekpfacdicgkkfalsfnltrhtkihtgsqkpfqcricmrnfsrsdnltrhirthtgekpfacdicgkkfadrshlarhtkihtgsqkpfqcricmrnfsqkahltahirthtgekpfacdicgrkfarsdnltrhtkihlrqkd53.seqidno:59(zfp2蛋白的氨基酸序列)54.rpfqcricmrnfsrssnltrhirthtgekpfacdicgkkfadkrtlirhtkihtgsqkpfqcricmrnfsqrgnlvrhirthtgekpfacdicgkkfalsfnltrhtkihtgsqkpfqcricmrnfsrsdnltrhirthtgekpfacdicgrkfadrshlarhtkihlrqkd55.seqidno:61(zfp3蛋白的氨基酸序列)56.rpfqcricmrnfsdrsalarhirthtgekpfacdicgkkfarsdnltrhtkihtgsqkpfqcricmrnfsqsgdltrhirthtgekpfacdicgkkfavrqtlkqhtkihtgsqkpfqcricmrnfsaagnltrhirthtgekpfacdicgrkfarsdnltrhtkihlrqkd57.在一些实施方案中,dbd为转录激活因子样效应物蛋白(tale)。tale可特异性识别或结合靶序列,例如,靶基因或靶基因的调控区。在一些实施方案中,受试者对靶基因单倍体不足。在一些实施方案中,tale结合到scn1a基因(例如,如seqidno:49中提供的人scn1a)的靶序列。tale蛋白由细菌分泌并结合宿主植物中的启动子序列,以激活有助于细菌感染的植物基因的表达。通常,tale蛋白被操纵以结合新的dna序列,因为通过由可变数量的约30‑35个氨基酸重复组成的中心重复结构域识别靶序列,其中每个重复识别靶序列内的单个碱基对。这些重复的阵列通常是识别dna序列所必需的。58.在一些实施方案中,dbd为同源结构域。同源结构域可特异性识别或结合靶序列,例如,靶基因或靶基因的调控区。在一些实施方案中,受试者对靶基因单倍体不足。在一些实施方案中,同源结构域结合到scn1a基因(例如,如seqidno:49中提供的人scn1a)的靶序列。同源结构域是负责识别靶序列的含有三个α螺旋和一个n端臂的蛋白质。同源结构域通常识别小的dna序列(约4至8个碱基对),然而这些结构域可与其他dna结合结构域(其他同源结构域或锌指蛋白)串联融合以识别更长的延伸序列(12至24个碱基对)。因此,同源结构域可为识别人基因组中的独特序列的dbd的组成部分。59.在一些实施方案中,至少一个dna结合结构域为催化失活的crispr相关蛋白(cas蛋白)。催化失活的cas蛋白(也称为dcas或“死亡cas蛋白”)为经修饰或突变使得其核酸酶活性(例如,核酸内切酶活性)降低或缺乏所有核酸酶活性(例如,核酸内切酶活性)的cas蛋白。在一些实施方案中,催化失活的cas蛋白为dcas9或dcas12蛋白。在一些实施方案中,dbd为dcas蛋白(也称为‘死亡cas’),诸如dcas9或dcas12a。dcas蛋白是已突变使得其催化失活(即不能进行核苷酸裂解)的crispr相关蛋白(cas,例如cas9或cas12a)的突变变体。dcas可特异性识别或结合靶序列,例如,靶基因或靶基因的调控区。包含dcas蛋白和指导核酸(例如,grna)的复合物可靶向和/或结合到与指导核酸互补的特定核苷酸序列或基因。在一些实施方案中,受试者对靶基因单倍体不足。在一些实施方案中,dcas结合到scn1a基因(例如,如seqidno:49中提供的人scn1a)的靶序列。然而,当结合到与所述靶dna序列互补或部分互补的指导核酸(例如,指导rna、grna或sgrna)时,dcas蛋白保留其识别和结合到靶dna序列的能力。在一些实施方案中,用于将dcas(例如,dcas9)蛋白靶向scn1a的指导核酸包含具有seqidno:85、86、89、90、93或94中的任一个的间隔区序列。在一些实施方案中,用于将dcas(例如,dcas9)蛋白靶向scn1a的指导核酸包含具有seqidno:85、86、89、90、93或94中的任一个的至少15个(例如,至少16、17、18、19或20个)连续核苷酸的间隔区序列。在一些实施方案中,用于将dcas(例如,dcas9)蛋白靶向scn1a的指导核酸包含seqidno:83、84、87、88、91或92中的任一个。在一些实施方案中,用于将dcas(例如,dcas9)蛋白靶向scn1a的指导核酸包含seqidno:83‑94中的任一个或由其组成。因此,dcas核酸内切酶可为识别人基因组中的独特序列的dbd的组成部分。在一些实施方案中,融合蛋白包含dcas9蛋白和反式激活结构域(例如,vpr结构域)。60.在一些方面,本公开涉及结合到编码电压门控钠通道(例如,nav1.1)的基因的dna结合结构域。在一些实施方案中,编码电压门控钠通道的基因为scn1a基因,并且包含seqidno:49中列出的序列。在一些实施方案中,dna结合结构域结合到靶基因的非翻译区,诸如3'‑非翻译区(3'utr)或5'‑非翻译区(5'utr)。在一些实施方案中,非翻译区包含调控序列,例如增强子、启动子、内含子或阻遏子序列。在一些实施方案中,dna结合结构域为锌指蛋白,其包含seqidno:57‑62中列出的序列。在一些实施方案中,dna结合结构域结合到seqidno:5‑7中的任一个中列出的核酸序列。61.由转基因编码的dna结合结构域的数量可变化。在一些实施方案中,转基因编码一个dna结合结构域。在一些实施方案中,转基因编码2个dna结合结构域。在一些实施方案中,转基因编码3个dna结合结构域。在一些实施方案中,转基因编码4个dna结合结构域。在一些实施方案中,转基因编码5个dna结合结构域。在一些实施方案中,转基因编码6个dna结合结构域。在一些实施方案中,转基因编码7个dna结合结构域。在一些实施方案中,转基因编码8个dna结合结构域。在一些实施方案中,转基因编码9个dna结合结构域。在一些实施方案中,转基因编码10个dna结合结构域。在一些实施方案中,转基因编码多于10个(例如,20、30、50、100个等)dna结合结构域。dna结合结构域可为相同的dna结合结构域(例如,相同dbd的多个拷贝)、不同的dna结合结构域(例如,每个dbd结合唯一序列)或其组合。62.在一些方面,本公开涉及包含反式激活因子结构域的融合蛋白。如本文所用,“反式激活结构域”是指转录因子中的支架结构域,其含有调控基因表达的其他蛋白质(诸如转录共调控因子)的结合位点。在一些实施方案中,反式激活结构域(也称为转录激活结构域)与dbd联合作用,以直接通过接触转录因子或间接通过共激活因子蛋白激活来自启动子或增强子的转录。反式激活结构域(tad)通常以其氨基酸组成命名,其中氨基酸为活性所必需的或为tad中最丰富的。tad在基因工程中被用作融合蛋白来调控靶基因的表达,并且可突变以改变转录激活水平,从而改变靶基因的表达。反式激活结构域的实例包括但不限于gal4、hap1、vp16、p65、rta和gcn4。63.在一些实施方案中,反式激活因子结构域包含vp64结构域。vp64是由单纯疱疹病毒自然表达的vp16蛋白的四个串联拷贝组成的酸性tad。当与结合在基因启动子处或其附近的dbd融合时,vp64充当强转录激活因子,并因此可用于调控靶基因(例如,scn1a)的表达。vp64结构域通常由单纯疱疹蛋白vp16的最小激活结构域的四聚体重复组成。在一些实施方案中,vp64结构域包含vp16中氨基酸残基437‑448的四个重复。在一些实施方案中,vp16蛋白由人疱疹病毒2ul48基因编码,其包含ncbi参考序列登录号:nc_001798.2中列出的序列。在一些实施方案中,vp16基因包含与由ncbi参考序列登录号:yp_009137200.1中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,vp16蛋白包含与ncbi参考序列登录号q69113‑1中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,vp16基因包含与由seqidno:51中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,vp16蛋白包含与seqidno:52中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。64.在一些实施方案中,反式激活因子结构域包含p65激活结构域。p65为nf‑κβ转录因子的亚基,其c端含有两个相邻的酸性tad。当与结合在基因启动子处或其附近的dbd融合时,p65蛋白充当强转录激活因子,并因此可用于调控靶基因的表达,例如如urlinger等人“thep65domainfromnf‑kappabisanefficienthumanactivatorinthetetracycline‑regulatablegeneexpressionsystem,”gene,2000所述。在一些实施方案中,p65蛋白由人rela基因编码,其包含ncbi参考序列登录号:nm_001145138.1、nm_001243984.1、nm_001243985.1或nm_021975.3中列出的序列。在一些实施方案中,rela基因包含与由ncbi参考序列登录号:nm_001145138.1、nm_001243984.1、nm_001243985.1或nm_021975.3中的任一个中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,p65蛋白包含与np_001138610.1、np_001230913.1、np_001230914.1和np_068110.3中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,rela基因包含与由seqidno:53中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,p65蛋白包含与seqidno:54中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。65.在一些实施方案中,反式激活因子结构域包含rta结构域。rta是衍生自爱泼斯坦巴尔病毒(epsteinbarrvirus)的疏水性tad,它是与增强子区结合以促进几种病毒基因的表达的有效的反式激活结构域。当与结合在基因启动子处或其附近的dbd融合时,rta蛋白充当强转录激活因子,并因此可用于调控靶基因的表达,例如如miyazawa等人,“il‑10promotertransactivationbytheviralk‑rtaproteininvolvesthehost‑celltranscriptionfactors,specificityproteins1and3,”journalofbiologicalchemistry,2018所述。在一些实施方案中,rta蛋白由爱泼斯坦巴尔病毒brlf1基因编码,其包含ncbi参考序列登录号:yp_041674.1中列出的序列。在一些实施方案中,brlf1基因包含与由ncbi参考seqidno:yp_041674.1中的任一个中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,rta蛋白包含与yp_041674.1中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,brlf1基因包含与由seqidno:55中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,rta蛋白包含与seqidno:56中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。66.本公开部分地基于包含杂交反式激活因子结构域的融合蛋白。如本文所用,“杂交反式激活因子结构域”是指包含多于一种转录激活蛋白或其部分(例如,2、3、4、5个或更多个转录激活蛋白或其部分)的融合蛋白。在基因工程中使用杂交反式激活结构域来增加靶基因的表达。在本公开的一些实施方案中,包含vp64‑p65‑rta(vpr)的核苷酸序列的三元杂交反式激活结构域(如描述于chavez等人“highlyefficientcas9‑mediatedtranscriptionalprogramming”,natmethods,2015,(seqidno∶47)中)用于增加靶基因(例如,scn1a)表达。67.在一些实施方案中,本文所述的融合蛋白可包含dbd(例如,zfp)和转录阻遏子蛋白。在一些方面,本公开涉及包含转录阻遏子结构域的融合蛋白。如本文所用,“转录阻遏子”蛋白通常是指下调靶基因表达的多肽。转录阻遏子的实例包括但不限于krab、smrt/trac‑2和ncor/rip‑13。在一些实施方案中,此类转录阻遏子融合蛋白可用于降低靶基因(例如,在功能获得性疾病中过度表达的基因)的表达水平。68.分离的核酸69.分离的核酸序列是指dna或rna序列。在一些实施方案中,本公开的蛋白质和核酸是分离的。如本文所用,术语“分离的”意指人工生产的。如本文中关于核酸所使用的,术语“分离的”意指:(i)通过例如聚合酶链反应(pcr)在体外扩增;(ii)通过克隆重组产生;(iii)纯化,如通过裂解和凝胶分离;或(iv)通过例如化学合成来合成。分离的核酸是通过本领域众所周知的重组dna技术易于操作的核酸。因此,包含在已知5'和3'限制位点或已公开聚合酶链反应(pcr)引物序列的载体中的核苷酸序列被认为是分离的,但以天然状态存在于自然宿主中的核酸序列不是分离的。分离的核酸可以是基本上纯化的,但不是必须的。例如,在克隆或表达载体中分离的核酸不是纯的,因为它可能仅占其所在细胞中物质的很小百分比。然而,正如本文所用的术语,此种核酸是分离的,因为通过本领域普通技术人员已知的标准技术易于操作。如本文中关于蛋白质或肽所使用的,术语“分离的”是指已从其天然环境中分离或人工生产(例如,通过化学合成、通过重组dna技术等)的蛋白质或肽。70.在一些方面,本公开涉及被配置为表达一种或多种zfp反式激活结构域融合蛋白的分离的核酸(例如,表达构建体,诸如raav载体)。在一些实施方案中,融合蛋白包含1至10个(例如,1、2、3、4、5、6、7、8、9或10个)dbd和/或1至10个(例如,1、2、3、4、5、6、7、8、9或10个)反式激活因子结构域。在一些实施方案中,融合蛋白包含多于10个dbs和/或多于10个反式激活因子结构域。71.在本公开的一些方面,dna结合结构域通过接头间接融合到转录调控子结构域。如本文所用,“接头”通常为一段多肽,其在结构上连接单个转基因内的两个不同多肽。在一些实施方案中,接头是柔性的,以允许不同多肽的移动。在一些实施方案中,柔性接头包含甘氨酸残基。在一些实施方案中,柔性接头包含甘氨酸和丝氨酸残基的混合物。在一些实施方案中,接头为可裂解的,从而允许分离多肽。在一些实施方案中,可裂解接头被蛋白酶切割。在一些实施方案中,蛋白酶为胰蛋白酶或因子x。72.在一些实施方案中,接头包含5至30个氨基酸(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸)。在一些实施方案中,接头包含3至30个氨基酸(例如,3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸)。在一些实施方案中,接头包含3至20个氨基酸(例如,3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸)。73.本公开部分地基于融合蛋白,所述融合蛋白被工程化以增加编码电压门控钠离子通道亚基蛋白(也称为scn蛋白)(例如scn1a)的基因的表达。如本文所用,“scn蛋白”是指钠离子通道蛋白,其介导可兴奋膜的电压依赖性钠离子渗透性,从而允许钠离子穿过膜。人中scn蛋白的实例包括但不限于scn1a、scn3a、scn5a、scn10a和scn11a。在一些实施方案中,scn蛋白为scn1a(也称为nav1.1),其编码1型α1离子通道亚基。在一些实施方案中,scn蛋白为scn1b蛋白,其编码1型β1离子通道亚基或scn1c蛋白。在一些实施方案中,scn蛋白为scn1a、scn1b和/或scn1c蛋白的组合。如本文所公开,scn蛋白可为scn蛋白的一部分或片段。在一些实施方案中,如本文所公开的scn蛋白为scn蛋白的变体,诸如点突变体或截短的突变体。74.在人中,scn1a由scn1a基因(基因id:6323,人)编码,所述基因在黑猩猩、恒河猴、狗、牛、小鼠、大鼠和鸡中保守。人中的scn1a基因主要在脑、肺和睾丸中表达。在一些实施方案中,scn1a蛋白包含五个结构重复(i、ii、iii、iv、q)。75.在一些实施方案中,scn1a蛋白由人scn1a基因编码,其包含ncbi参考seqidno:nm_001165963.2、nm_00165964.2、nm_001202435.2、nm_001353948.1、nm_001353949.1、nm_001353950.1、nm_00135395.1、nm_001353952.1、nm_001353954.1、nm_00353955.1、nm_001353957.1、nm_001353958.1、nm_001353960.1、nm_001353961.1或nm_006920.5中列出的序列。在一些实施方案中,scn1a蛋白由小鼠scn1a基因编码,其包含ncbi参考seqidno:nm_001313997.1或nm_018733.2中列出的序列。在一些实施方案中,scn1a蛋白包含与由ncbi参考seqidno:ng_011906.1、nm_001313997.1或nm_018733.2中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,scn1a基因包含与seqidno:50中列出的序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,人scn1a蛋白包含ncbi参考seqidno:np_001159435.1、np_0011159436.1、np_001189364.1、np_001340877.1、np_001340878.1、np_001340879.1、np_001340880.1、np_001340881.1、np_001340883.1、np_001340884.1、np_001340886.1、np_001340887.1、np_001340889.1、np_001340890.1、np_00851.3中列出的序列。在一些实施方案中,scn1a蛋白包含与由ncbi参考seqidno:ng_011906.1、nm_001313997.1或nm_018733.2中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,小鼠scn1a蛋白包含ncbi参考seqidno:np_001300926.1或np_061203.2中列出的序列。在一些实施方案中,人scn1a蛋白包含与seqidno:49中列出的核酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。76.本公开的分离的核酸可为重组腺相关病毒(aav)载体(raav载体)。在一些实施方案中,如本公开所述的分离的核酸包含含有第一腺相关病毒(aav)反向末端重复(itr)或其变体的区(例如,第一区)。可将分离的核酸(例如,重组aav载体)包装成衣壳蛋白并施用于受试者和/或递送至选定的靶细胞。“重组aav(raav)载体”通常至少由转基因及其调控序列以及5'和3'aav反向末端重复(itr)组成。如本公开别处所述,转基因可包含编码例如蛋白质和/或表达控制序列(例如,聚‑a尾)的区。77.通常,itr序列的长度为约145bp。优选地,基本上在分子中使用编码itr的整个序列,尽管允许对这些序列进行某种程度的微小修饰。修饰这些itr序列的能力在本领域技术范围内。(参见例如,文本诸如sambrook等人.,″molecularcloning.alaboratorymanual″,第2版,coldspringharborlaboratory,newyork(1989);和k.fisher等人,jvirol.,70:520532(1996))。本公开中采用的这种分子的实例是含有转基因的“顺式作用”质粒,其中选定转基因序列和相关调控元件的侧翼为5'和3'aavitr序列。aavitr序列可从任何已知的aav获得,包括目前鉴定的哺乳动物aav类型。在一些实施方案中,分离的核酸还包含含有第二aavitr的区(例如,第二区、第三区、第四区等)。78.除了上面鉴定的重组aav载体的主要元件外,载体还包括以允许其在用载体转染或用本公开产生的病毒感染的细胞中转录、翻译和/或表达的方式与转基因的元件可操作地连接的常规控制元件。如本文所用,“可操作地连接的”序列包括与关注的基因相邻的表达控制序列和反式作用或一定距离作用以控制关注的基因的表达控制序列。表达控制序列包括适当的转录起始、终止、启动子和增强子序列;有效的rna处理信号,诸如剪接和聚腺苷酸化(polya)信号;稳定细胞质mrna的序列;提高翻译效率的序列(例如,kozak共有序列);增强蛋白质稳定性的序列;以及在需要时,增强编码产物的分泌的序列。许多表达控制序列(包括天然、组成型、诱导型和/或组织特异性启动子)是本领域已知的并且可被利用。79.如本文所用,当核酸序列(例如,编码序列)和调控序列以将核酸序列的表达或转录置于调控序列的影响或控制下的方式共价连接时,它们被称为可操作地连接。如果希望将核酸序列翻译成功能性蛋白质,如果5'调控序列中启动子的诱导导致编码序列的转录,并且如果两个dna序列之间的连接的性质不会(1)导致移码突变的引入,(2)干扰启动子区指导编码序列转录的能力,或(3)干扰相应rna转录物翻译成蛋白质的能力,则两个dna序列称为可操作地连接。因此,如果启动子区能够影响该dna序列的转录,使得所得转录物可翻译成所需的蛋白质或多肽,则启动子区将可操作地连接到核酸序列。类似地,当两个或更多个编码区以它们从共同启动子的转录导致已在框内翻译的两个或更多个蛋白质的表达的方式连接时,它们可操作地连接。在一些实施方案中,可操作地连接的编码序列产生融合蛋白。80.包含转基因(例如,包含融合蛋白等)的区可位于将能够表达融合蛋白的分离的核酸的任何合适的位置。81.应当理解,在转基因编码多于一个多肽的情况下,每个多肽可位于转基因内的任何合适的位置。例如,编码第一多肽的核酸可位于转基因的内含子中,并且编码第二多肽的核酸序列可位于另一个非翻译区中(例如,在蛋白质编码序列的最后一个密码子与转基因聚‑a信号的第一个碱基之间)。[0082]“启动子”是指由需要启动基因的特异性转录的细胞的合成机械或引入的合成机械识别的dna序列。短语“可操作地连接的”、“可操作地定位”、“受控”或“受转录控制”意指启动子相对于核酸处于正确的位置和方向,以控制rna聚合酶的起始和基因的表达。[0083]对于编码蛋白质的核酸,通常在转基因序列之后和3'aavitr序列之前插入聚腺苷酸化序列。可用于本公开的raav构建体还可含有内含子,其理想地位于启动子/增强子序列与转基因之间。一种可能的内含子序列源自sv‑40,并且称为sv‑40t内含子序列。可使用的另一个载体元件为内部核糖体进入位点(ires)。ires序列用于从单个基因转录物产生多于一个多肽。ires序列将用于产生含有多于一条多肽链的蛋白质。这些和其他常见载体元件的选择是常规的,并且许多此类序列是可用的[参见例如,sambrook等人及其中在例如第3.183.26和16.1716.27页引用的参考文献,以及ausubel等人,currentprotocolsinmolecularbiology,johnwiley&sons,newyork,1989]。在一些实施方案中,口蹄疫病毒2a序列包含在多蛋白中;这是已被证明介导多蛋白的裂解的小的肽(长度为大约18个氨基酸)(ryan,md等人,embo,1994;4∶928‑933;mattion,nm等人,jvirology,1996年11月;第8124‑8127页;furler,s等人,genetherapy,2001;8∶864‑873;和halpin,c等人,theplantjournal,1999;4∶453‑459)。2a序列的裂解活性先前已在包括质粒和基因疗法载体(aav和逆转录病毒)的人工系统中得到证实(ryan,md等人,embo,1994;4:928‑933;mattion,nm等人,jvirology,1996年11月;第8124‑8127页;furler,s等人,genetherapy,2001;8∶864‑873;和halpin,c等人,theplantjournal,1999;4∶453‑459;defelipe,p等人,genetherapy,1999;6∶198‑208;defelipe,p等人,humangenetherapy,2000;11∶1921‑1931;和klump,h等人,genetherapy,2001;8∶811‑817)。[0084]组成型启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(rsv)ltr启动子(任选地具有rsv增强子)、巨细胞病毒(cmv)启动子(任选地具有cmv增强子)[参见例如,boshart等人,cell,41:521‑530(1985)]、sv40启动子、二氢叶酸还原酶启动子、β‑肌动蛋白启动子、磷酸甘油激酶(pgk)启动子和ef1α启动子[invitrogen]。在一些实施方案中,启动子为p2启动子。在一些实施方案中,启动子为鸡β‑肌动蛋白(cba)启动子。在一些实施方案中,启动子为两个cba启动子。在一些实施方案中,启动子为由cmv增强子分离的两个cba启动子。在一些实施方案中,启动子为cag启动子。[0085]诱导型启动子允许调控基因表达,并且可通过外源提供的化合物、环境因素(诸如温度)或特定生理状态(例如,急性期、细胞的特定分化状态或仅在复制细胞中)的存在来调控。诱导型启动子和诱导型系统可购自多种商业来源,包括但不限于invitrogen、clontech和ariad。已描述了许多其他系统并且本领域技术人员可容易地选择这些系统。通过外源提供的启动子调控的诱导型启动子的实例包括锌诱导型绵羊金属硫蛋白(mt)启动子、地塞米松(dex)诱导型小鼠乳腺肿瘤病毒(mmtv)启动子、t7聚合酶启动子系统(wo98/10088);蜕皮激素昆虫启动子(no等人,proc.natl.acad.sci.usa,93:3346‑3351(1996))、四环素抑制系统(gossen等人,proc.natl.acad.sci.usa,89:5547‑5551(1992))、四环素诱导型系统(gossen等人,science,268:1766‑1769(1995),也参见harvey等人,curr.opin.chem.biol.,2:512‑518(1998))、ru486诱导型系统(wang等人,nat.biotech.,15:239‑243(1997)和wang等人,genether.,4:432‑441(1997))和雷帕霉素诱导型系统(magari等人,j.clin.invest.,100:2865‑2872(1997))。在此情况下可能有用的其他类型的诱导型启动子是受特定生理状态(例如,温度、急性期、细胞的特定分化状态或仅在复制细胞中)调控的那些启动子。[0086]在另一个实施方案中,将使用转基因的天然启动子。当希望转基因的表达应模拟天然表达时,可优选天然启动子。当转基因的表达必须在时间或发育上、或以组织特异性方式、或响应特定转录刺激物时,可使用天然启动子。在另一个实施方案中,其他天然表达控制元件(诸如增强子元件、聚腺苷酸化位点或kozak共有序列)也可用于模拟天然表达。[0087]在一些实施方案中,调控序列赋予组织特异性基因表达能力。在一些情况下,组织特异性调控序列结合以组织特异性方式诱导转录的组织特异性转录因子。此类组织特异性调控序列(例如,启动子、增强子等)是本领域众所周知的。示例性组织特异性调控序列包括但不限于以下组织特异性启动子:肝特异性甲状腺素结合球蛋白(tbg)启动子、胰岛素启动子、胰高血糖素启动子、生长抑素启动子、胰腺多肽(ppy)启动子、突触素‑1(syn)启动子、肌酸激酶(mck)启动子、哺乳动物结蛋白(des)启动子、α‑肌球蛋白重链(α‑mhc)启动子或心脏肌钙蛋白t(ctnt)启动子。其他示例性启动子包括β‑肌动蛋白启动子、乙型肝炎病毒核心启动子,sandig等人,genether.,3:1002‑9(1996);甲胎蛋白(afp)启动子,arbuthnot等人,hum.genether.,7:1503‑14(1996))、骨骨钙素启动子(stein等人,mol.biol.rep.,24:185‑96(1997));骨唾液蛋白启动子(chen等人,j.boneminer.res.,11∶654‑64(1996))、cd2启动子(hansal等人,j.immunol.,161∶1063‑8(1998);免疫球蛋白重链启动子;t细胞受体α链启动子、神经元诸如神经元特异性烯醇化酶(nse)启动子(andersen等人,cell.mol.neurobiol.,13:503‑15(1993))、神经丝轻链基因启动子(piccioli等人,proc.natl.acad.sci.usa,88∶5611‑5(1991))和神经元特异性vgf基因启动子(piccioli等人,neuron,15∶373‑84(1995))以及对于本领域技术人员将是显而易见的其他启动子。[0088]在一些实施方案中,编码包含dbd和反式激活因子的融合蛋白的转基因可操作地连接到启动子。在一些实施方案中,启动子为组成型启动子。在一些实施方案中,启动子为诱导型启动子。在一些实施方案中,启动子为组织特异性启动子。在一些实施方案中,启动子对神经组织具有特异性。在一些实施方案中,启动子为sst或npy启动子。[0089]本公开的方面涉及一种包含多于一个启动子(例如,2、3、4、5个或更多个启动子)的分离的核酸。例如,在具有包含编码蛋白质的第一区和编码蛋白质的第二区的转基因的构建体的情况下,可能需要使用第一启动子序列(例如,可操作地连接到蛋白质编码区的第一启动子序列)驱动第一蛋白质编码区的表达,以及用第二启动子序列(例如,可操作地连接到第二蛋白质编码区的第二启动子序列)驱动第二蛋白质编码区的表达。通常,第一启动子序列和第二启动子序列可为相同的启动子序列或不同的启动子序列。在一些实施方案中,第一启动子序列(例如,驱动蛋白质编码区表达的启动子)为rna聚合酶iii(poliii)启动子序列。poliii启动子序列的非限制性实例包括u6和h1启动子序列。在一些实施方案中,第二启动子序列(例如,驱动第二蛋白质表达表达的启动子序列)为rna聚合酶ii(polii)启动子序列。polii启动子序列的非限制性实例包括t7、t3、sp6、rsv和巨细胞病毒启动子序列。在一些实施方案中,poliii启动子序列驱动第一蛋白质编码区的表达。在一些实施方案中,polii启动子序列驱动第二蛋白质编码区的表达。[0090]重组腺相关病毒(raav)[0091]在一些方面,本公开提供分离的腺相关病毒(aav)。如本文中关于aav所使用的,术语“分离的”是指人工生产或获得的aav。可使用重组方法生产分离的aav。此类aav在本文中称为“重组aav”。重组aav(raav)优选具有组织特异性靶向能力,使得raav的核酸酶和/或转基因将被特异性递送至一个或多个预定组织。aav衣壳是确定这些组织特异性靶向能力的重要元件。因此,可选择具有适合所靶向组织的衣壳的raav。[0092]用于获得具有所需衣壳蛋白的重组aav的方法是本领域众所周知的。(参见例如,us2003/0138772),其内容以引用的方式整体并入本文。通常,所述方法涉及培养含有编码aav衣壳蛋白的核酸序列的宿主细胞;功能性rep基因;由aav反向末端重复(itr)和转基因组成的重组aav载体;和足够的辅助功能,以允许将重组aav载体包装到aav衣壳蛋白中。在一些实施方案中,衣壳蛋白是由aav的cap基因编码的结构蛋白。aav包含三种衣壳蛋白,病毒蛋白1至3(命名为vp1、vp2和vp3),所有这些蛋白都通过选择性剪接从单个cap基因转录。在一些实施方案中,vp1、vp2和vp3的分子量分别为约87kda、约72kda和约62kda。在一些实施方案中,在翻译时,衣壳蛋白在病毒基因组周围形成球形60‑mer蛋白壳。在一些实施方案中,衣壳蛋白的功能为保护病毒基因组、递送基因组并与宿主相互作用。在一些方面,衣壳蛋白以组织特异性方式将病毒基因组递送至宿主。[0093]在一些实施方案中,aav衣壳蛋白具有选自由aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aavrh8、aav9、aav10、aavrh10和aav.php.b组成的组的aav血清型。在一些实施方案中,aav衣壳蛋白具有衍生自非人灵长类动物的血清型,例如aavrh8血清型。在一些实施方案中,aav衣壳蛋白具有为广泛且有效的cns转导而衍生的血清型,例如aav.php.b。在一些实施方案中,衣壳蛋白具有aav血清型9。[0094]待在宿主细胞中培养以将raav载体包装在aav衣壳中的组分可以反式提供给宿主细胞。替代地,所需组分(例如,重组aav载体、rep序列、cap序列和/或辅助功能)中的任何一种或多种可由稳定的宿主细胞提供,所述稳定的宿主细胞已使用本领域技术人员已知的方法被工程化以含有所需组分中的一种或多种。最合适的是,此种稳定的宿主细胞将含有在诱导型启动子控制下的一种或多种所需组分。然而,一种或多种所需组分可能在组成型启动子的控制下。在讨论适合与转基因一起使用的调控元件时,本文提供了合适的诱导型和组成型启动子的实例。在另一个替代方案中,选定的稳定宿主细胞可含有在组成型启动子控制下的一种或多种选定组分和在一个或多个诱导型启动子控制下的一种或多种其他选定组分。例如,可产生稳定的宿主细胞,其衍生自293个细胞(其含有在组成型启动子控制下的e1辅助功能),但其含有在诱导型启动子控制下的rep和/或cap蛋白。本领域技术人员还可产生其他稳定的宿主细胞。[0095]在一些实施方案中,本公开涉及含有核酸的宿主细胞,所述核酸包含编码转基因的编码序列(例如,融合至转录调控子结构域的dna结合结构域)。在一些实施方案中,宿主细胞为哺乳动物细胞、酵母细胞、细菌细胞、昆虫细胞、植物细胞或真菌细胞。[0096]生产本公开的raav所需的重组aav载体、rep序列、cap序列和辅助功能可使用任何适当的遗传元件(载体)递送至包装宿主细胞。选定的遗传元件可通过任何合适的方法递送,包括本文所述的那些方法。用于构建本公开的任何实施方案的方法是核酸操纵技术人员已知的,并且包括基因工程、重组工程和合成技术。参见例如,sambrook等人,molecularcloning:alaboratorymanual,coldspringharborpress,coldspringharbor,n.y。类似地,产生raav病毒粒子的方法是众所周知的,并且选择合适的方法不是对本公开的限制。参见例如,k.fisher等人,j.virol.,70:520‑532(1993)和美国专利号5,478,745。[0097]在一些实施方案中,重组aav可使用三重转染方法(详细描述于美国专利号6,001,650中)生产。通常,重组aav是通过用待包装成aav颗粒、aav辅助功能载体和辅助功能载体的aav载体(包含侧翼为itr元件的转基因)转染宿主细胞来生产的。aav辅助功能载体编码“aav辅助功能”序列(例如,rep和cap),其反式作用用于生产性aav复制和包装。优选地,aav辅助功能载体支持有效的aav载体生产,而不产生任何可检测的野生型aav病毒粒子(例如,含有功能性rep和cap基因的aav病毒粒子)。适合与本公开一起使用的载体的非限制性实例包括描述于美国专利号6,001,650中的phlp19和描述于美国专利号6,156,303中的prep6cap6载体,两者的全部内容以引用的方式并入本文。辅助功能载体编码aav复制所依赖的非aav衍生病毒和/或细胞功能(例如,“辅助功能”)的核苷酸序列。辅助功能包括aav复制所需的那些功能,包括但不限于参与aav基因转录的激活、阶段特异性aavmrna剪接、aavdna复制、cap表达产物的合成和aav衣壳组装的那些部分。基于病毒的辅助功能可源自任何已知的辅助病毒,诸如腺病毒、疱疹病毒(单纯疱疹病毒1型除外)和痘苗病毒。[0098]在一些方面,本公开提供转染的宿主细胞。术语“转染”用于指细胞摄取外源dna,并且当外源dna被引入细胞膜内时,细胞已被“转染”。许多转染技术是本领域公知的。参见例如,graham等人(1973)virology,52:456;sambrook等人(1989)molecularcloning,alaboratorymanual,coldspringharborlaboratories,newyork;davis等人(1986)basicmethodsinmolecularbiology,elsevier;和chu等人(1981)gene13:197。此类技术可用于将一种或多种外源核酸(诸如核苷酸整合载体和其他核酸分子)引入合适的宿主细胞。[0099]“宿主细胞”是指携带或能够携带关注的物质的任何细胞。通常,宿主细胞为哺乳动物细胞。在一些实施方案中,宿主细胞为神经元,任选地为gaba能神经元。如本文所用,“gaba能神经元”为产生γ氨基丁酸(gaba)的神经细胞。在哺乳动物中,gaba是广泛分布在神经系统中的神经递质,它结合并抑制与其结合的神经元。因此,gaba与影响神经系统的许多病症有关,包括癫痫、自闭症和焦虑。对scn1a半合子和敲除小鼠的研究观察到,脑中gaba能神经元存在严重的钠电流缺陷。宿主细胞可用作aav辅助构建体、aav小基因质粒、辅助功能载体或与重组aav生产相关的其他转移dna的受体。所述术语包括已被转染的原始细胞的子代。因此,如本文所用,“宿主细胞”可指已用外源dna序列转染的细胞。应当理解,由于天然、偶然或有意突变,单个亲本细胞的子代可不必在形态或在基因组或总dna互补序列上与原始亲本完全相同。[0100]如本文所用,术语“细胞系”是指能够在体外连续或延长生长和分裂的细胞群。通常,细胞系是源自单个祖细胞的克隆种群。本领域进一步已知,在此类克隆种群的储存或转移期间,核型可发生自发或诱导的变化。因此,源自所指细胞系的细胞可与祖先细胞或培养物不完全相同,并且所指细胞系包括此类变体。[0101]如本文所用,术语“重组细胞”是指已引入外源dna片段(诸如导致生物活性多肽转录或生物活性核酸诸如rna产生的dna片段)的细胞。[0102]如本文所用,术语“载体”包括任何遗传元件,诸如质粒、噬菌体、转座子、粘粒、染色体、人工染色体、病毒、病毒粒子等,其在与适当的控制元件相关联时能够复制并且其可在细胞之间转移基因序列。在一些实施方案中,载体为病毒载体,诸如raav载体、慢病毒载体、腺病毒载体、逆转录病毒载体等。因此,所述术语包括克隆和表达载体,以及病毒载体。在一些实施方案中,设想有用的载体是其中待转录的核酸片段位于启动子的转录控制下的那些载体。[0103]“启动子”是指由需要启动基因的特异性转录的细胞的合成机械或引入的合成机械识别的dna序列。短语“可操作地连接的”、“可操作地定位”、“受控”或“受转录控制”意指启动子相对于核酸处于正确的位置和方向,以控制rna聚合酶的起始和基因的表达。术语“表达载体或构建体”意指含有核酸的任何类型的遗传构建体,其中核酸编码序列中的部分或全部能够被转录。在一些实施方案中,表达包括核酸的转录,以例如从转录的基因产生生物活性多肽产物。用于将重组载体包装在所需aav衣壳中以产生本公开的raav的前述方法并不意味着是限制性的,并且其他合适的方法对于技术人员来说将是显而易见的。[0104]用于调控靶基因表达的方法[0105]本公开提供了用于调控细胞或受试者中基因表达的方法。方法通常涉及向细胞或受试者施用分离的核酸或raav,所述核酸或raav包含编码包含dna结合结构域(例如,zfp结构域)和反式激活结构域的融合蛋白的转基因。在一些实施方案中,融合蛋白包含zfp和vp64反式激活因子。在一些实施方案中,融合蛋白包含zfp和p65反式激活因子。在一些实施方案中,融合蛋白包含zfp和rta反式激活因子。在一些实施方案中,融合蛋白包含zfp和vpr反式激活因子。在一些实施方案中,方法涉及向细胞或受试者施用dcas9蛋白和靶向scn1a的至少一种指导核酸(例如,包含seqidno:83‑94中的任一个或由seqidno:83‑94中的任一个编码的指导核酸)。[0106]在一些实施方案中,向细胞或受试者施用编码融合蛋白(例如,包含反式激活因子的融合蛋白)的分离的核酸或raav导致靶基因(例如,scn1a)的表达增加。因此,在一些实施方案中,本公开所述的组合物和方法可用于治疗由靶基因单倍体不足引起的病状,诸如由scn1a基因单倍体不足引起的德拉韦综合征(dravetsyndrome)。[0107]如本文所用,“单倍体不足”是指其中基因(例如scn1a)的一个拷贝例如通过基因突变而失活、或缺失,并且基因的剩余功能拷贝不足以产生足以维持基因正常功能的基因产物量的遗传病状。[0108]德拉韦综合征(也称为婴儿严重肌阵挛性癫痫)是通常出现在生命的前三年的罕见的终生癫痫。德拉韦综合征的特点是长时间且频繁的癫痫发作、行为和发育迟缓、运动和平衡问题、语言和言语迟缓问题以及自主神经系统紊乱。在一些实施方案中,受试者患有与德拉韦综合征相关联的单倍体不足,诸如scn1a基因的一个拷贝发生突变,从而导致细胞或受试者中scn1a蛋白减少。大多数德拉韦综合征患者携带被翻译成截短的蛋白质的scn1a突变;与德拉韦综合征相关的其他scn1a突变,包括剪接位点和错义突变,以及随机分布在整个scn1a基因中的突变。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)scn1a基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向scna1的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)scn1a基因的指导核酸(例如,grna)。[0109]在一些实施方案中,受试者患有与med13l单倍体不足综合征相关联的单倍体不足,其中受试者仅具有med13l基因的单个功能拷贝。患有med13l单倍体不足综合征的受试者通常在med13l基因的第二个非功能拷贝中具有突变。med13l单倍体不足综合征的特征是智力障碍、言语问题、独特的面部特征和发育迟缓。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)med13l基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向med13l的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)med13l基因的指导核酸(例如,grna)。[0110]在一些实施方案中,受试者患有与骨髓增生异常综合征相关联的单倍体不足。患有骨髓增生异常综合征的受试者通常在异柠檬酸脱氢酶1(idh1)、异柠檬酸脱氢酶2(idh2)和/或gata2基因的一个拷贝中具有突变。骨髓增生异常综合征是骨髓中的未成熟血细胞不成熟为健康血细胞的一组癌症。有时,此种综合征可导致急性髓系白血病。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)idh1基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向idh1的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)idh1基因的指导核酸(例如,grna)。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)idh2基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向idh2的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)idh2基因的指导核酸(例如,grna)。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)gata2基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向gata2的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)gata2基因的指导核酸(例如,grna)。[0111]在一些实施方案中,受试者患有与狄乔治综合征(digeorgesyndrome)相关联的单倍体不足。患有狄乔治综合征的受试者通常在22号染色体中间的称为22q11.2的位置有30至40个基因的缺失。特别地,所述疾病的特征可能是tbx基因的单倍体不足。狄乔治综合征的特征是先天性心脏问题、特定面部特征、频繁感染、发育迟缓、学习问题和腭裂。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)tbx基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向tbx的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)tbx基因的指导核酸(例如,grna)。[0112]在一些实施方案中,受试者患有与charge综合征相关联的单倍体不足。在大多数情况下,患有charge综合征的受试者对chd7基因单倍体不足。charge综合征的特征是眼缺损、心脏缺陷、后鼻孔闭锁、生长和/或发育迟缓、生殖器和/或泌尿系统异常、以及耳部异常和耳聋。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)chd7基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向chd7的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)chd7基因的指导核酸(例如,grna)。[0113]在一些实施方案中,受试者患有与埃勒斯‑当洛综合征(ehlers–danlossyndrome)相关联的单倍体不足。患有埃勒斯‑当洛综合征的受试者可对col1a1、col1a2、col3a1、col5a1、col5a2、tnxb、adamts2、plod1、b4galt7、dse和/或d4st1/chst14基因单倍体不足。埃勒斯‑当洛综合征的特征是皮肤弹性过大,并且可导致主动脉夹层、脊柱侧弯和早发性骨关节炎。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)col1a1、col1a2、col3a1、col5a1、col5a2、tnxb、adamts2、plod1、b4galt7、dse或d4st1/chst14基因中的任一个的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向col1a1、col1a2、col3a1、col5a1、col5a2、tnxb、adamts2、plod1、b4galt7、dse或d4st1/chst14中的任一个的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)col1a1、col1a2、col3a1、col5a1、col5a2、tnxb、adamts2、plod1、b4galt7、dse或d4st1/chst14基因中的任一个的指导核酸(例如,grna)。[0114]在一些实施方案中,受试者患有与额颞痴呆相关联的单倍体不足。患有ftd的受试者对编码tau蛋白的mapt基因和/或grn基因单倍体不足。ftd的特征是记忆力减退、缺乏社会意识、冲动控制能力差和言语困难。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)mapt基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向mapt的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)mapt基因的指导核酸(例如,grna)。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)grn基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向grn的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)grn基因的指导核酸(例如,grna)。[0115]在一些实施方案中,受试者患有与霍尔特‑奥拉姆综合征(holt–oramsyndrome)相关联的单倍体不足。患有霍尔特‑奥拉姆综合征的受试者对tbx5基因单倍体不足。霍尔特‑奥拉姆综合征的特征是心脏并发症,包括先天性心脏缺陷和心脏传导疾病。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)tbx5基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向tbx5的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)tbx5基因的指导核酸(例如,grna)。[0116]在一些实施方案中,受试者患有与马凡综合征(marfansyndrome)相关联的单倍体不足。患有马凡综合征的受试者通常对编码fibrillin‑1蛋白的fbn1基因单倍体不足。马凡综合征的特征是肢体长度不成比例、早发性关节炎、心脏并发症和/或自主神经系统功能障碍。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)fbn1基因的zfp结构域以及反式激活结构域。在一些实施方案中,用于靶向fbn1的组合物包含(i)包含dcas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)fbn1基因的指导核酸(例如,grna)。[0117]本公开部分地基于向受试者施用如本文所述的融合蛋白的方法。在一些实施方案中,融合蛋白包含dbd和转录激活因子。在一些实施方案中,dbd为znf、tale、dcas蛋白(例如,dcas9或dcas12a)或与scn1a基因结合的同源结构域。在一些实施方案中,转录激活因子为vp64、p65、rta或包含vp64‑p65‑rta(vpr)的三元转录激活因子。在一些实施方案中,融合蛋白的侧翼为aav反向末端重复(itr)序列。在一些实施方案中,融合蛋白可操作地连接到启动子。在一些实施方案中,受试者患有或疑似患有导致scn1a蛋白质单倍体不足的scn1a突变。在一些实施方案中,受试者患有或疑似患有德拉韦综合征。[0118]在一些方面,本公开提供了调节(例如,增加、减少等)细胞中靶基因表达的方法。在一些实施方案中,本公开提供了增加细胞中靶基因(例如,scn1a)表达的方法。在一些实施方案中,细胞为哺乳动物细胞。在一些实施方案中,细胞在受试者中(例如,在体内)。在一些实施方案中,受试者为哺乳动物受试者,例如人。在一些实施方案中,细胞为神经系统细胞(中枢神经系统细胞或外周神经系统细胞),例如神经元(例如,gaba能神经元、单极神经元、双极神经元、篮细胞、betz细胞、lugaro细胞、棘神经元、浦肯野细胞、金字塔神经细胞(pyrimidalcell)、伦肖细胞(renshawcell)、颗粒细胞、运动神经元、梭形细胞等)或神经胶质细胞(例如,星形胶质细胞、少突胶质细胞、室管膜细胞、放射状胶质细胞、雪旺氏细胞、卫星细胞等)。[0119]在“正常”细胞或受试者中,靶基因(例如,scn1a)的表达足以使得细胞或受试者关于靶基因(例如,scn1a)不是单倍体不足的。在一些实施方案中,相对于未施用如本文所述的一种或多种分离的核酸、raav或组合物的细胞或受试者中转基因的表达或活性,测量转基因的“改善的”或“增加的”表达或活性。在一些实施方案中,相对于在向受试者施用(例如,在施用前和施用后测量基因表达)如本文所述的一种或多种分离的核酸、raav或组合物后受试者中转基因的表达或活性,测量转基因的“改善的”或“增加的”表达或活性。例如,在一些实施方案中,相对于未施用编码融合zfp反式激活因子的转基因的细胞或受试者,测量细胞或受试者中scn1a的“改善的”或“增加的”表达。在一些实施方案中,本公开所述的方法导致相对于未施用本公开所述的一种或多种组合物的受试者的scn1a表达和/或活性,受试者中scn1a表达和/或活性增加2倍至100倍(例如,2倍、5倍、10倍、50倍、100倍等)。[0120]如本文所用,术语“治疗(treatment/treating)”和“疗法”是指治疗性治疗和预防性(prophylactic/preventative)操作。所述术语还包括改善现有症状、预防另外的症状、改善或预防症状的根本原因、预防或逆转症状的原因,例如与单倍体不足基因(例如,单倍体不足scn1a基因)相关的症状。因此,所述术语表示已将有益结果赋予患有病症(例如,与单倍体不足基因相关的疾病或病状,例如,德拉韦综合征)或具有发展此种病症的潜力的受试者。此外,术语“治疗”还包括将剂(例如,治疗剂或治疗组合物,例如靶向或结合靶基因或靶基因的调控区的分离的核酸或raav)应用或施用于受试者或来自受试者的分离组织或细胞系,所述受试者可能患有疾病、疾病症状或疾病倾向,其目的是治疗、治愈、缓解、减少、改变、补救、缓和、改善或影响疾病、疾病症状或疾病倾向。[0121]治疗剂或治疗组合物可包括药学上可接受形式的化合物,其防止和/或减少特定疾病(例如,与单倍体不足基因相关的疾病或病状,例如德拉韦综合征)的症状。例如,治疗组合物可为防止和/或减少与单倍体不足基因相关的疾病或病状(例如,德拉韦综合征)的症状的药物组合物。设想本发明的治疗组合物将以任何合适的形式提供。治疗组合物的形式将取决于许多因素,包括如本文所述的施用模式。治疗组合物可含有稀释剂、佐剂和赋形剂以及如本文所述的其他成分。[0122]施用模式[0123]可根据本领域已知的任何适当方法将本公开的分离的核酸、raav和组合物以组合物形式递送至受试者。例如,可将优选地悬浮在生理相容载剂中(例如,组合物中)的raav施用于受试者,即宿主动物,诸如人、小鼠、大鼠、猫、狗、绵羊、兔、马、牛、山羊、猪、豚鼠、仓鼠、鸡、火鸡或非人灵长类动物(例如,猕猴)。在一些实施方案中,宿主动物不包括人。[0124]将raav递送至哺乳动物受试者可通过例如肌肉内注射或通过施用至哺乳动物受试者的血流中。可通过注射到静脉、动脉或任何其他血管导管中来施用到血流中。在一些实施方案中,通过隔离肢体灌注将raav施用到血流中,这是外科领域众所周知的技术,所述方法基本上使技术人员能够在施用raav病毒粒子之前将肢体与体循环隔离。描述于美国专利号6,177,403中的隔离肢体灌注技术的变体也可由技术人员用来将病毒粒子施用到隔离肢体的脉管系统中,以潜在地增强向肌肉细胞或组织中的转导。此外,在某些情况下,可能需要将病毒粒子递送至受试者的cns。“cns”意指脊椎动物脑和脊髓的所有细胞和组织。因此,所述术语包括但不限于神经元细胞、神经胶质细胞、星形胶质细胞、脑脊液(csf)、间隙空间、骨、软骨等。可通过使用本领域已知的神经外科技术,用针、导管或相关装置将重组aav注射到例如心室区以及纹状体(例如,纹状体的尾状核或壳核)、丘脑、脊髓和神经肌肉接头或小脑小叶来直接递送至cns或大脑,所述外科技术诸如通过立体定向注射(参见例如,stein等人,jvirol73:3424‑3429,1999;davidson等人,pnas97:3428‑3432,2000;davidson等人,nat.genet.3:219‑223,1993;以及alisky和davidson,hum.genether.11:2315‑2329,2000)。在一些实施方案中,通过静脉内注射施用如本公开所述的raav。在一些实施方案中,通过脑内注射施用raav。在一些实施方案中,通过鞘内注射施用raav。在一些实施方案中,通过纹状体内注射施用raav。在一些实施方案中,通过颅内注射递送raav。在一些实施方案中,通过大池注射递送raav。在一些实施方案中,通过脑侧脑室注射递送raav。[0125]本公开的方面涉及包含重组aav的组合物,所述重组aav包含衣壳蛋白和编码转基因的核酸,其中转基因包含编码一种或多种蛋白质的核酸序列。在一些实施方案中,核酸还包含aavitr。在一些实施方案中,组合物还包含药学上可接受的载剂。[0126]本公开的组合物可包含单独的raav或与一种或多种其他病毒的组合的raav(例如,编码具有一种或多种不同转基因的第二raav)。在一些实施方案中,组合物包含1、2、3、4、5、6、7、8、9、10种或更多种不同的raav,其各自具有一种或多种不同的转基因。[0127]鉴于raav所针对的适应症,本领域技术人员可容易地选择合适的载剂。例如,一种合适的载剂包括盐水,其可与多种缓冲溶液(例如,磷酸盐缓冲盐水)一起配制。其他示例性载剂包括无菌盐水、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油和水。载剂的选择并不是对本公开的限制。[0128]任选地,除了raav和一种或多种载剂之外,本公开的组合物还可含有其他常规药物成分,诸如防腐剂或化学稳定剂。合适的示例性防腐剂包括氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯苯酚和泊洛沙姆(非离子表面活性剂)诸如f‑68。合适的化学稳定剂包括明胶和白蛋白。[0129]以足够量施用raav,以转染所需组织的细胞,并提供足够水平的基因转移和表达,而不产生过度的副作用。常规和药学上可接受的施用途径包括但不限于直接递送至所选器官(例如,经门静脉递送至肝脏)、口服、吸入(包括鼻内和气管内递送)、眼内、静脉内、肌肉内、皮下、皮内、瘤内和其他肠胃外施用途径。如果需要,可组合施用途径。[0130]实现特定“治疗效果”所需的raav病毒粒子的剂量(例如,基因组拷贝数/每千克体重(gc/kg)的剂量单位)将根据多种因素而变化,所述因素包括但不限于:raav病毒粒子施用的途径、实现治疗效果所需的基因或rna表达水平、所治疗的特定疾病或病症以及基因或rna产物的稳定性。本领域技术人员可基于上述因素以及本领域众所周知的其他因素容易地确定治疗患有特定疾病或病症的患者的raav病毒粒子剂量范围。[0131]raav的有效量为足以靶向感染动物、靶向所需组织的量。在一些实施方案中,在溶酶体贮积疾病的症状前阶段向受试者施用有效量的raav。在一些实施方案中,溶酶体贮积疾病的症状前阶段发生在出生(例如,围产期)与4周龄之间。[0132]在一些实施方案中,配制raav组合物以减少组合物中aav颗粒的聚集,特别是在存在高raav浓度(例如,约1013gc/ml或更高)的情况下。用于减少raav聚集的方法是本领域众所周知的,并且包括例如添加表面活性剂、ph调节、盐浓度调节等。(参见例如,wrightfr等人,moleculartherapy(2005)12,171–178,其内容以引用的方式并入本文。)[0133]本领域技术人员熟知药学上可接受的赋形剂和载剂溶液的配方,以及用于在各种治疗方案中使用本文所述的特定组合物的合适剂量和治疗方案的开发。[0134]通常,这些制剂可含有至少约0.1%的活性化合物或更多,尽管一种或多种活性成分的百分比当然可变化,并且可方便地在总制剂重量或体积的约1%或2%和约70%或80%或更多之间。自然地,每种治疗上有用的组合物中活性化合物的量可以这样的方式制备,即在化合物的任何给定单位剂量中将获得合适的剂量。制备此类药物制剂领域的技术人员将设想诸如溶解度、生物利用度、生物半衰期、施用途径、产品保质期以及其他药理学考虑的因素,并且因此,多种剂量和治疗方案可为希望的。[0135]在某些情况下,需要通过皮下、胰内、鼻内、肠胃外、静脉内、肌肉内、鞘内或口服、腹膜内或通过吸入递送本文公开的适当配制的药物组合物中的基于raav的治疗构建体。在一些实施方案中,如描述于美国专利号5,543,158;5,641,515和5,399,363(各自以引用的方式整体具体并入本文)中的施用模式可用于递送raav。在一些实施方案中,优选的施用模式为通过门静脉注射。[0136]适于注射使用的药物剂型包括无菌水性溶液或分散剂以及用于临时制备无菌可注射溶液或分散剂的无菌粉末。分散体也可在甘油、液态聚乙二醇及其混合物和在油中制备。在普通的储存和使用条件下,这些制剂含有防腐剂以防止微生物的生长。在许多情况下,所述形式为无菌的且为易于注射的流体。在制造和储存条件下,所述组合物必须稳定且必须在贮存中防止诸如细菌和真菌的微生物的污染作用。载剂可为溶剂或分散介质,其含有例如水、乙醇、多元醇(例如,甘油、丙二醇和液态聚乙二醇等)、其合适的混合物和/或植物油。例如,可通过包衣(诸如卵磷脂)的使用、通过维持所需的粒子大小(在分散体的情况下)以及通过使用表面活性剂来维持适当的流动性。防止微生物作用可通过各种抗细菌和抗真菌剂(例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞(thimerosal)等)来达成。在许多情况下,将为优选的是包括等张剂,例如糖或氯化钠。延长可注射组合物的吸收可通过在组合物中使用延迟吸收的剂(例如单硬脂酸铝和明胶)来达成。[0137]例如,对于施用可注射水溶液,如果需要,可适当地缓冲溶液,并且首先使液体稀释剂与足够的盐水或葡萄糖等渗。这些特定的水溶液特别适用于静脉内、肌肉内、皮下和腹膜内施用。在此方面,可使用的无菌水介质是本领域技术人员已知的。例如,可将一个剂量溶解于1ml等渗nacl溶液中,然后添加到1000ml皮下输液中或在提议的输液部位注射,(参见例如,″remington'spharmaceuticalsciences″第15版,第1035‑1038和1570‑1580页)。取决于宿主的状况,剂量必然将存在一定的变化。在任何情况下,负责施用的人将决定各个宿主的适当剂量。[0138]无菌可注射溶液是通过将活性raav以所需量在必要时与本文列举的各种其它成分一起并入适当溶剂中,随后进行过滤灭菌来制备。通常,通过将多种灭菌活性成分并入含有碱性分散介质和来自上文所列举那些成分的所需其它成分的无菌媒剂中来制备分散体。在用于制备无菌可注射溶液的无菌粉末的情况下,优选的制备方法是真空干燥技术和冷冻干燥技术,由此产生活性成分外加来自其先前无菌过滤溶液的任何额外所需成分的粉末。[0139]本文公开的raav组合物也可配制成中性或盐形式。药学上可接受的盐包括与例如像氢氯酸或磷酸的无机酸或诸如乙酸、草酸、酒石酸、扁桃酸等的有机酸形成的酸加成盐(用蛋白质的游离氨基形成的)。用游离羧基形成的盐也可源自例如像氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁的无机碱和诸如异丙胺、三甲胺、组氨酸、普鲁卡因等的有机碱。当配制时,将以与剂量制剂相容的方式且以治疗有效量施用溶液。制剂是以诸如可注射溶液剂、药物释放胶囊剂等的多种剂型容易地施用。[0140]如本文所用,“制剂”包括任何和全部溶剂、分散介质、媒介物、包衣、稀释剂、抗菌剂和抗真菌剂、等渗剂和吸收延迟剂、缓冲剂、载剂溶液、悬浮剂、胶体等。用于药物活性物质的此类介质和剂的用途是本领域众所周知的。补充活性成分也可并入组合物中。短语“药学上可接受的”是指当施用于宿主时不产生过敏或类似不良反应的分子实体和组合物。[0141]诸如脂质体、纳米胶囊、微粒、微球、脂质颗粒、囊泡等的递送媒介物可用于将本公开的组合物引入到合适的宿主细胞中。特别地,raav载体递送的转基因可被配制用于封装在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中递送。[0142]此类制剂可优选用于引入本文公开的核酸或raav构建体的药学上可接受的制剂。脂质体的形成和使用通常是本领域技术人员已知的。最近,脂质体的开发提高了血清稳定性和循环半衰期(美国专利号5,741,516)。此外,已描述了脂质体和脂质体样制剂作为潜在药物载剂的各种方法(美国专利号5,567,434;5,552,157;5,565,213;5,738,868和5,795,587)。[0143]脂质体已成功用于通常对通过其他程序的转染具有抗性的许多细胞类型。另外,脂质体不受基于病毒的递送系统典型的dna长度限制。脂质体已被有效地用于将基因、药物、放射治疗剂、病毒、转录因子和变构效应物引入多种培养的细胞系和动物中。另外,已经完成了检查脂质体介导的药物递送有效性的几项成功的临床试验。[0144]脂质体由分散在水介质中并自发形成多层同心双层囊泡(也称为多层囊泡(mlv))的磷脂形成。mlv通常具有25nm至4μm的直径。mlv的超声处理导致形成核心中含有水溶液的直径在至至范围内的小单层囊泡(suv)。[0145]替代地,可使用raav的纳米胶囊制剂。纳米胶囊通常可以稳定且可重复的方式捕获物质。为避免由于细胞内聚合物过载而产生副作用,应使用能够在体内降解的聚合物来设计此类超细颗粒(大小为约0.1μm)。设想使用满足这些要求的可生物降解的聚氰基丙烯酸烷基酯纳米颗粒。[0146]除了上述递送方法之外,还设想以下技术作为将raav组合物递送至宿主的替代方法。超声波导入术(即超声波)已在美国专利号5,656,016号中作为提高药物渗透进入和穿过循环系统的速度和功效的装置使用和描述。设想的其他药物递送替代方案为骨内注射(美国专利号5,779,708)、微芯片装置(美国专利号5,797,898)、眼用制剂(bourlais等人,1998)、透皮基质(美国专利号5,770,219和5,783,208)和反馈控制递送(美国专利号5,697,899)。[0147]实施例[0148]实施例1.上调scn1a基因表达的锌指蛋白的设计[0149]人(hek293t细胞)和小鼠(hepg2细胞)scn1a启动子序列之间的同源区通过对在rikencage‑seq数据集中鉴定的每个物种的两个突出转录起始位点周围的序列进行比对来鉴定(图1)。人(hek)和小鼠(hepg2)之间的高度保守序列存在于scn1a的近端启动子区中(图2)。由六个指组成的三个zfp被设计为通过组装具有预定义dna结合特异性的一个指和两个指模块来结合scn1a近端启动子区中重叠的15‑22个核苷酸同源区(图3)。各自由六个指组成的三个zfp(zfp1‑zfp3)被设计成结合图3中鉴定的重叠的高度保守序列。每个指被设计为结合scn1a近端启动子的高度保守区中的三个碱基区(三联体)。[0150]zfp‑1识别scn1a基因(seqidno:2)的近端启动子区中的单独的三个碱基区(以红色表示的dna三联体,通过“·”分隔),如图4a所示。zfp‑1的指1至6的每个识别螺旋(七个氨基酸)结合三个核苷酸序列,如图4b所示。zfp‑1(seqidno:17‑22)的六个指的氨基酸序列在图4c中示出;指之间的接头被突出显示以指定经典(tgekp)和非经典(tgsqkp)接头序列。zfp‑1(seqidno:11‑16)的六个指的核苷酸序列在图4d中示出。[0151]表1.靶向scn1a的zfp‑1识别螺旋[0152][0153]zfp‑2识别scn1a基因(seqidno:3)的近端启动子区中的单独的三个碱基区(以红色表示的dna三联体,通过“·”分隔),如图5a所示。zfp‑2的指1至6的每个识别螺旋(七个氨基酸)结合三个核苷酸序列,如图5b所示。zfp‑2(seqidno:29‑34)的六个指的氨基酸序列在图5c中示出;指之间的接头被突出显示以指定经典(tgekp)和非经典(tgsqkp)接头序列。zfp‑1(seqidno:23‑28)的六个指的核苷酸序列在图5d中示出。[0154]表2.靶向scn1a的zfp‑2识别螺旋[0155][0156]zfp‑3识别scn1a基因(seqidno:4)的近端启动子区中的单独的三个碱基区(以红色表示的dna三联体,通过“·”分隔),如图6a所示。zfp‑3的指1至6的每个识别螺旋(七个氨基酸)结合三个核苷酸序列,如图6b所示。zfp‑3(seqidno:41‑46)的六个指的氨基酸序列在图6c中示出;指之间的接头被突出显示以指定经典(tgekp)和非经典(tgsqkp)接头序列。zfp‑1(seqidno:35‑40)的六个指的核苷酸序列在图6d中示出。[0157]表3.靶向scn1a的zfp‑3识别螺旋[0158][0159][0160]经设计来靶向scn1a基因近端启动子区中保守序列的另外的zfp将各自包含五个或六个指结构域,并将与在人和小鼠scn1a之间高度保守的15‑22个核苷酸的区结合。[0161]表4.靶向scn1a的锌指蛋白[0162][0163][0164]实施例2.zfp增加人细胞中scn1a基因的表达[0165]为了检查zfp1‑zfp3上调scn1a转录的能力,将zfp1‑zfp3dna结合结构域与杂交vp64、p53和rta(vpr)三元强转录激活因子结构域融合以形成嵌合反式激活因子。vpr融合激活因子结构域用于募集转录调控复合物并增加染色质可及性,并且有助于实现高水平的基因表达。因此,zfp结构域将vpr激活因子靶向至近端启动子区中的高度保守序列,以增加scn1a基因表达。[0166]通过瞬时转染将编码vpr‑zfp1、vpr‑zfp2和/或vpr‑zfp3融合蛋白的表达质粒转染到hek293细胞中,并且通过qrt‑pcr(使用tbp表达作为归一化参考)测量scn1a基因表达。vpr‑zfp融合包含融合到vpr的zfp1、zfp2和/或zfp3。含有各自融合到vpr的zfp1、zfp2和zfp3dna结合结构域的用于多重调控的三种构建体的转染导致scn1a基因表达相对于未转染细胞增加45倍,这表明vpr‑zfp嵌合反式激活因子能够通过结合在基因的启动子近端区中来增加scn1a基因表达(图7)。[0167]vpr‑[zfp1‑zfp3]融合蛋白以及其中目前正在设计zfpdna结合结构域的vpr‑zfp融合蛋白正在hela和hepg2细胞中转染,这两种细胞都具有低水平的scn1a表达。vpr‑zfp融合蛋白含有融合到vpr反式激活因子的单个zfpdna结合结构域以及多个zfpdna结合结构域的组合。通过qrt‑pcr测量scn1a基因表达,以确定这些vpr‑zfp融合是否能够增加基因表达。在腺相关病毒(aav)递送融合蛋白后,在原代小鼠皮层神经元中测试最有希望的vpr‑zfp融合候选物的增加scn1a表达的能力。[0168]正在使用细菌单杂交选择系统进一步优化zfp结构域的特异性(参见例如,meng等人,“targetedgeneinactivationinzebrafishusingengineeredzinc‑fingernucleases,”natbiotechnol,2008),以从随机文库中鉴定理想的zfp,其中对dna结合重要的残基是不同的。新选择的zfp将与vpr反式激活因子结构域融合,无论是单独的zfp还是多个zfp的组合,并在hek293、hela和hepg2细胞以及原代小鼠皮层神经元中转染,以鉴定在qrt‑pcr分析后最能增加scn1a基因表达的候选zfp结构域。[0169]实施例3.生成具有不同效力的zfpscn1a反式激活因子系列[0170]实施例2中上调scn1a基因表达的最有效zfp融合至具有预期效力的梯度的一系列人反式激活结构域(例如,rta、p65、hsf1等),以鉴定在aav感染复数(moi)范围内实现scn1a基因表达2倍上调的组装。用表达zfpscn1a融合反式激活因子的aav载体感染来自正常和scn1a /‑小鼠的小鼠原代皮层神经元。nav1.1蛋白的表达水平通过使用蛋白质印迹和qpcr进行评估。用tgf‑α处理8小时的原代神经元用作阳性对照,因为该处理使nav1.1蛋白表达增加约6至8倍(chen等人,2015,neuroinflammation12:126)。还评估了其他navα亚基基因表达水平的变化,以证明zfpscn1a反式激活的特异性。免疫荧光用于通过针对zfpscn1a(ha标签)和对gaba能神经元具有特异性的标志物(例如,小白蛋白 或生长抑素 )或通用神经元标志物(例如,neun、tubiii和/或map2)的抗体的双重免疫荧光染色来确定nav1.1表达是否仍然局限于gaba能中间神经元。zfpscn1a对scn1a基因反式激活的特异性也通过chip‑seq和rna‑seq进行评估,以绘制基因组结合位点和基因转移后产生的转录组增殖。[0171]实施例4.指导启动子活性依赖性scn1a‑zfp反式激活因子的设计的gaba能抑制剂中scn1a启动子的组蛋白组织和表观基因组的图谱[0172]zfp结合基因组靶点的能力取决于靶序列的可及性(例如,无核小体区的存在)。对dna可及性的这一要求被用来设计zfp反式激活因子,所述zfp反式激活因子仅在基于dna靶序列可及性的存在的细胞类型子集中起作用。通过使用zfp反式激活因子表达的组织特异性启动子实现对细胞类型活性的另外限制。来自河豚(红鳍东方鲀(takifugurubripes))生长抑素和神经肽y基因的小启动子已被证明在aav载体和慢病毒的背景下驱动皮质和海马抑制性中间神经元中的高度特异性转基因表达。在一些实施方案中,对dna可及性敏感的scn1a特异性zfp的基于aav的转录限制的组合导致整个大脑中抑制性中间神经元中nav1.1蛋白表达的高度特异性上调。该双重调控方法将最小化nav1.1蛋白在正常情况下不表达的细胞中异位表达可能产生的副作用。[0173]在小鼠和人gaba能抑制和谷氨酸能兴奋性神经元中分析了scn1a启动子的核小体结构和表观遗传图谱。该信息用于通过靶向仅可在该细胞类型中的scn1a基因座周围可及的序列来设计gaba能抑制性神经元限制性zfp反式激活因子。[0174]使用荧光激活细胞分选(facs)分离在gad67启动子下表达tdtomato的转基因小鼠的gaba能抑制神经元和通过emx1‑ires‑cre与rosa26/终止/egfp小鼠杂交产生的gfp阳性谷氨酸兴奋性神经元。人gaba能和兴奋性神经元由诱导多能干细胞(ips)细胞产生,并使用免疫染色和rt‑pcr确认对这些细胞类型具有特异性的标志物以及电生理活性。使用转座酶可及染色质测定(atac‑seq)表征小鼠和人神经元群中scn1a启动子周围的可及基因组区。[0175]基于抑制性和兴奋性神经元中scn1a启动子周围基因组区的差异染色质可及性设计识别仅在gaba能神经元中可及的序列的zfpscn1a反式激活因子。正在产生一系列候选zfp‑vpr反式激活因子融合,以靶向不同的scn1a可及区,其中反式激活因子的结合有望有效上调抑制区中的nav1.1表达,以及揭示兴奋性神经元中nav1.1表达的任何不希望的诱导表达。[0176]在模拟德拉韦综合征的培养的人ips衍生神经元和小鼠scn1a /‑原代神经元中进行表达研究,以确定经设计用于识别仅在抑制性神经元中可及的dna序列的zfpscn1a反式激活因子在从泛神经元人突触蛋白1或抑制性中间神经元特异性启动子下的aav载体表达时,是否提供必要的特异性。nav1.1表达水平通过qrt‑pcr、蛋白质印迹和双重免疫荧光测定,其具有抑制性gaba能(例如,gaba 、gad65/67 、生长抑素和/或小白蛋白)和兴奋性谷氨酸能(例如,cux1 、foxg1, 、gabaa受体、gaba‑)神经元的神经元类型特异性标志物。zfpscn1a反式激活因子的细胞类型特异性被设计为靶向小鼠和人scn1a启动子中的不同序列,因为同线区内的染色质结构和dna序列在物种之间不同。这些实验中的对照包括感染有类似aav载体的神经元培养物,所述aav载体编码gfp、不含反式激活结构域的zfp或不含zfpdna结合结构域的反式激活因子。[0177]微小rna(mirna)结合位点被并入zfpscn1a反式激活因子的3'非翻译区(3'utr)中,所述反式激活因子仅限于其中发生不希望的表达的细胞类型(例如,谷氨酸能兴奋性神经元)。该方法先前用于限制aav递送的转基因的表达(xie等人,“microrna‑regulated,systematicallydeliveredraav9:astepclosertocns‑restrictedtransgeneexpression,”mol.ther.2011)。gaba能抑制性神经元和其他细胞类型的mirna表达谱的差异正在通过小rna测序确定。[0178]实施例5.评价aav‑zfpscn1a基因疗法纠正患者来源的ips产生的gaba能中间神经元中钠电流缺陷的潜力[0179]开发用于德拉韦综合征的一种或多种zfpscn1a反式激活因子的关键步骤是证明这些人工反式激活因子在人神经元中具有所需的功能。为此,正在获得来自德拉韦患者(n=4‑6)和非德拉韦患者(n=4)的ips细胞。非德拉韦遗传背景在这些细胞中得以表达,无需人工操纵基因表达,并且因此ips细胞已成为生物医学研究的最先进细胞系。crispr‑cas9基因组编辑技术正用于通过将scn1a中的遗传突变修复为野生型序列,或通过将德拉韦相关突变引入对照细胞系内的正常等位基因来创建等基因细胞系。因此,等基因系消除了因比较来自不同人受试者的细胞系而产生的自然可变性,并因此对于确认和增强疾病特异性表型具有价值。已建立的抑制性神经元分化方案和验证管道正用于将ips细胞系分化为前脑gaba能抑制剂中间神经元。[0180]如通过全细胞膜片钳电生理学测量确定,来自德拉韦患者的抑制性神经元表现出减少的钠电流和受损的动作电位放电。正在进行类似的测量,以确认本文所述的德拉韦衍生神经元概括了这些疾病相关表型。钠电流缺陷发生在抑制剂中,但不发生在德拉韦患者中的兴奋性神经元中(sun等人),并且因此在本公开中仅使用抑制性神经元。德拉韦患者来源的抑制性神经元中突变诱导的钠通道缺陷可通过野生型scn1a的异位表达来挽救(参考文献20)。因此,本公开中描述的方法适用于测试zfpscn1a反式激活因子在德拉韦综合征背景下恢复野生型钠通道功能和生理机能的功效。[0181]gaba能抑制性神经元培养物在通用神经元或抑制性神经元特异性启动子下被编码zfpscn1a反式激活因子的aav载体感染。正通过蛋白质印迹法评估nav1.1表达水平的变化。与转染细胞相比,正通过未转染细胞的全细胞膜片钳来评估抑制性神经元中功能性钠电流的恢复。正在通过chip‑seq分析所有患者来源的抑制性神经元内的基因组中zfpscn1a反式激活因子的结合,并与通过rna‑seq检测到的任何鉴定的转录组变化相关。这些实验中的对照为感染有类似aav载体的神经元培养物,所述aav载体编码gfp、不含vpr反式激活结构域的zfp和不含zfpdna结合结构域的vpr反式激活因子结构域。[0182]实施例6.评估aav‑zfpscn1a干预在scn1a小鼠中不同年龄和递送途径下的治疗潜力[0183]aav的广泛趋向性是广泛表达基因的基因疗法应用的关键特性,但当关注的转基因以细胞类型特异性方式表达时,可能成为重大挑战。通过使用组织特异性启动子诸如甲状腺素结合蛋白(tbp)、肌酸激酶和肌钙蛋白t,分别在很大程度上解决了诸如肝脏、肌肉和心脏的身体中主要组织的这个问题。可将另外的控制水平叠加在组织特异性启动子上,以通过掺入在那些组织中高度丰富的微小rna的结合位点的多个拷贝(诸如肝脏中的mir‑122和骨骼肌中的mir‑1)来实现从特定组织中更高程度的脱靶。在转导广泛的细胞类型的情况下,最近描述的aav‑php.b血清型对于全身递送后的cns基因转移非常有效。此外,它对外周组织的趋向性在很大程度上与aav9的趋向性一样广泛。德拉韦综合征的基因疗法方法的目标是完全恢复gaba能抑制性中间神经元中的nav1.1表达,同时防止其他神经元和别处异位表达产生有害影响。在源自河豚(红鳍东方鲀)生长抑素(fsst)和神经肽y(fnpy)基因的小启动子下编码gfp的aav和慢病毒载体(<2.8kb)已显示在颅内注射后驱动小鼠大脑中的抑制性神经元特异性表达。携带驱动gfp表达的这些启动子的aav‑php.b载体与对照载体正在进行比较,其中转基因表达由泛在的强cag启动子和最小相对较弱的小鼠mecp2启动子驱动。通过在6周龄(尾静脉)和出生后第1天(眶后)小鼠全身施用、新生儿csf递送以及最后靶向齿状回(dg)的单侧注射递送至cns后,正在研究具有fsst和fnyp启动子的aav‑php.b‑gfp载体对gaba能抑制性中间神经元的特异性(表5)。cns基因转移的效率因递送途径的不同而有很大差异,并且因为不同年龄的scn1a /‑小鼠正在进行治疗,因此正在进行广泛的分析,以建立每个递送途径在整个cns中对gaba能抑制性中间神经元的神经元转导功效和启动子特异性的基线。从短fsst和fnyp启动子驱动gfp表达的aav载体先前已被证明对直接注射后海马中的抑制性中间神经元具有高度特异性。本公开的aav‑php.b载体正在以与后续研究相同的方式进行验证,其中正在评估恢复scn1a /‑小鼠海马形成中抑制性神经元中nav1.1表达(特别位于齿状回和颗粒细胞层内壁)的治疗影响(基本原理如下明确地表达)。正在通过将129svj与从jacksonlaboratories(barharbor,me)获得的c57bl/6小鼠交配而在umms产生的129svj/c57bl/6小鼠中进行实验。在注射后一个月对小鼠实施安乐死,并收集大脑和脊髓以使用细胞特异性标志物和gfp的抗体的双重免疫荧光对转导效率和特异性进行组织学分析。通过用针对谷氨酸脱羧酶(gad;gaba能神经元的标志物)和gfp的抗体的双重免疫荧光染色,正在评估整个大脑和脊髓中gaba能抑制性中间神经元的基因转移效率和特异性。另外,使用对那些蛋白质和gfp具有特异性的抗体评估了启动子和/或aav‑php.b对表达生长抑素(sst)、小白蛋白(pv)、钙视网膜蛋白(cr)、血管活性肠肽(vip)或神经肽y(npy)的抑制性中间神经元亚群的优先特异性。从通过全身和icv施用处理的小鼠中收集肝脏、心脏和骨骼肌,以在组织学上评估gfp表达,并且正在利用蛋白质印迹来确定外周组织中异位表达的可能性。[0184]表5.实验组[0185][0186]*各组由来自两性的相等数量的小鼠组成。[0187]#每种载体注射一窝[0188]缩写:icv–侧脑室注射;ic–颅内注射;pnd1–产后第1天[0189]向六周龄的scn1a /‑小鼠施用编码不同zfpscn1a反式激活因子蛋白的aav‑php.b载体(一种具有zfpscn1a激活结构域但没有dna结合结构域来控制单独激活因子影响的构建体)或相同体积的磷酸盐缓冲盐水(pbs)的双侧注射液到齿状回中(n=3只雄性 3只雌性/组)。这些实验中使用的单链aav载体还携带zfpscn1acdna下游的ires‑gfp盒,以促进识别转导细胞。测试了至少两种zfpscn1a反式激活因子,它们可能在多种神经元中具有更广泛的激活,以及上述两种最有希望的gaba能抑制性神经元限制性zfpscn1a反式激活因子。注射后一个月,收获大脑并解剖来自一个大脑半球的海马,以通过使用β‑肌动蛋白或微管蛋白作为负载对照的蛋白质印迹评估zfpscn1a、nav1.1、nav1.3、gad65、gad67蛋白的表达水平。通过使用连续脑切片(10μm)的组织学研究检查另一个大脑半球,以通过具有针对gad和gfp或gad和包括在所有zfpscn1a蛋白中的表位标签(ha或myc标签)的抗体的双重免疫荧光染色分析颗粒细胞层的齿状回和内小叶中转导的抑制性中间神经元%。此外,正在确定表达nav1.1和nav1.3的gad阳性神经元的百分比,以证明钠通道表达的正常模式的恢复。除了对nav1.1和nav1.3蛋白表达进行免疫荧光检测外,还使用针对nav1.1、nav1.3、zfpscn1a和gad的rnascope探针评估gaba能中间神经元中mrna水平的变化。rnascope是分析大脑内神经元中的mrna水平的高度灵敏的原位杂交技术。评估由zfpscn1a表达引起的nav1.1水平变化的这两种方法的组合提供了对中间神经元变化如何通过本公开的基因疗法方法实现的全面理解。[0190]在出生后第1天或6周龄时通过尾静脉开始的两种性别的scn1a /‑小鼠中对aav‑php.b‑zfpscn1a基因疗法的治疗功效进行分析。对照包括用aav载体处理的小鼠,所述aav载体编码不含zfpdna结合结构域的zfp样蛋白;以及年龄匹配的未处理的scn1a /‑小鼠和野生型同窝小鼠(n=每组15只雄性和15只雌性)。每组中的小鼠的子集(n=3只雄性和3只雌性)在12周龄时被安乐死,以使用蛋白质印迹法以及使用针对gad(和其他神经元类型特异性标志物,例如gad65、gad67)和zfp的抗体的免疫荧光来评估基因转移到gaba能中间神经元的效率,以及恢复整个大脑和脊髓中那些细胞中的nav1.1表达。此外,评估了zfp的异位表达以及外周组织中的nav1.1表达。每组中的其他动物子集(n=24)正在用于研究对存活率(最多1岁)、运动表现和行为的影响,从2‑12个月龄开始每两个月对其进行一次测试。由于scn1a /‑小鼠表现出由pnd21导致的前肢和后肢协调受损,使用加速旋转和波束交叉测试评估运动功能和协调性。另外,正在使用行为测试,其中scn1a /‑小鼠表现出受损的表现,包括:露天场地、高架十字迷宫、筑巢、大理石埋藏和巴恩斯迷宫,以测试scn1a /‑小鼠中似乎严重受损的空间学习和记忆。德拉韦综合征患者的自发性癫痫发作特征在scn1a /‑小鼠中也很明显,并且频率随着年龄和体温而增加。此外,scn1a /‑小鼠的过早猝死在强直阵挛发作后立即发生。因此,在2个月、6个月和12个月龄时使用连续视频监测24小时,以评估癫痫发作频率和持续时间。如果在上述测试中测量的主要结果中检测到显著变化,则考虑使用对新物体、气味和老鼠做出响应的箱偏好读数的社交互动研究。在人道终点实验收集和评估大脑、脊髓和外周器官,以进行上述分子和组织学分析。[0191]实施例7.zfp和dcas9系统增加人细胞中scn1a基因的表达[0192]为了检查zfp1‑zfp3上调scn1a转录的能力,将zfp1‑zfp3dna结合结构域与杂交vp64、p53和rta(vpr)三元强转录激活因子结构域融合以形成嵌合反式激活因子。vpr融合激活因子结构域用于募集转录调控复合物并增加染色质可及性,并且有助于实现高水平的基因表达。因此,zfp结构域将vpr激活因子靶向至近端启动子区中的高度保守序列,以增加scn1a基因表达。[0193]此外,为了检查靶向scn1a的dcas9系统上调scn1a转录的能力,将靶向scn1a的三个指导rna与dcas9蛋白复合。[0194]用以下实验条件中的一个对hek293t细胞进行瞬时转染–(1)vpr‑zfp1构建体;(2)vpr‑zfp2构建体;(3)vpr‑zfp3构建体;(4)vpr‑zfp1、vpr‑zfp2、和vpr‑zfp3构建体中的所有三个;(5)dcas9‑vpr构建体和scn1a指导rna1;(6)dcas9‑vpr构建体和scn1a指导rna2;(7)dcas9‑vpr构建体和scn1a指导rna3;(8)dcas9‑vpr构建体和scn1a指导rna1、scn1a指导rna2和scn1a指导rna3中的所有三个;和(9)不含任何指导rna的dcas9‑vpr构建体(对照)。通过qrt‑pcr测量scn1a基因表达。将scn1a的折叠激活归一化至对照实验(不含任何指导rna的dcas9‑vpr构建体)。[0195]相对于对照实验,所有测试的实验条件都产生了scn1a基因激活的增加(图8)。这些数据表明,本实施例和整个本公开中描述的锌指蛋白能够靶向scn1a以影响基因表达。这些数据进一步证明,该实施例的指导rna序列(seqidno:83‑94)能够将dcas9靶向至scn1a以影响基因表达。[0196]表6.靶向scn1a的指导核酸(间隔区序列以粗体显示)[0197][0198]当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献