一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于序列操纵的CRISPR-CAS组分系统、方法以及组合物

2022-06-18 00:06:37 来源:中国专利 TAG:
用于序列操纵的crispr-cas组分系统、方法以及组合物本技术是申请日为2013年12月12日和发明名称为“用于序列操纵的crispr-cas组分系统、方法以及组合物”的201380072868.6号发明专利申请的分案申请。相关应用和引用参考1.本技术要求分别具有博德参考号bi-2011/008/wsgr案卷号44063‑ꢀ701.101、bi-2011/008/wsgr案卷号44063-701.102,博德参考号bi‑ꢀ2011/008/vp案卷号44790.01.2003、bi-2011/008/vp案卷号44790.02.2003以及bi-2011/008/vp案卷号44790.03.2003的美国临时专利申请61/736,527,61/748,427,61/768,959,61/791,409以及61/835,931的优先权,所有标题都为ꢀ“用于序列操纵的系统、方法以及组合物”,分别提交于2012年12月12日、2013年1月2日、2013年2月25日、2013年3月15日和2013年6月17日。2.参考了美国临时专利申请61/758,468;61/769,046;61/802,174;61/806,375;61/814,263;61/819,803以及61/828,130,这些临时专利申请各自的标题为“用于序列操纵的系统、方法以及组合物的工程化以及优化”,分别提交于2013年1月30日;2013年2月25;2013年3月15;2013年3月28;2013年4月20;2013年5月6日以及2013年5月28日。还参考了美国临时专利申请61/835,936、61/836,127、61/836,101、61/836,080、61/836,123以及61/835,973,这些临时专利申请各自提交于2013年6月17日。还参考了美国临时专利申请61/842,322以及美国专利申请14/054,414,这些临时专利申请各自具有博德参考号bi-2011/008a,标题为“用于改变基因产物的表达的crispr-cas系统及方法”,分别提交于2013年7月2日和2013年10月15日。3.前述申请、以及在其中或在它们的审查程序期间引用的所有文献(“申请引用文献”)以及在这些申请引用文献中引用或参考的所有文献、以及在本文中引用或参考的所有文献(“本文引用的文献”)、在本文中引用的文献中引用或参考的所有文献,连同针对在本文中提及或通过引用结合在本文中的任何文献中的任何产品的任何制造商的说明书、说明、产品规格、和产品表,特此通过引用并入本文,并且可以在本发明的实践中采用。更具体地说,所有参考的文献均通过引用并入本文,其程度如同每个单独的文献被确切地并单独地指明通过引用而并入本文。发明领域4.本发明总体上涉及用于控制涉及序列靶向的基因表达的系统、方法、和组合物,该序列靶向例如可使用涉及规律间隔成簇短回文重复序列(crispr)及其组分的载体系统的、基因组微扰或基因编辑。关于联邦资助研究的声明5.本发明是在美国国立卫生研究院授予的nih先锋奖(pioneeraward)dp1mh100706的政府支持下完成的。美国政府享有本发明的某些权利。发明背景6.在基因组测序技术和分析方法中的最新进展显著加速了对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和映射的能力。精确的基因组靶向技术对于通过允许个体遗传元件的选择性干扰而使得因果性遗传变异的统性逆向工程成为可能、以及推进合成生物学、生物技术应用、和医学应用是需要的。虽然基因组编辑技术,如设计师锌指、转录激活子样效应因子(tale)、或归巢大范围核酸酶(homingmeganuclease)对于产生靶向的基因组干扰是可得的,但是仍然需要负担得起的、易于建立的、可扩展的、并且便于靶向真核基因组内的多个位置的新的基因组工程技术。发明概述7.对于具有一系列广泛应用的序列靶向的替代性且稳健的系统和技术存在着迫切需要。本发明着手解决这种需要并且提供了相关优点。crispr/cas或crispr-cas系统(两个术语在本技术通篇可互换地使用)不要求产生靶向特异性序列的定制蛋白,而是通过一个短rna分子识别一个特异性dna靶标,可以对单个cas酶进行程序设计,换句话说可以使用所述短rna分子将cas酶募集到一个特异性dna靶标。将该crispr-cas系统添加到基因组测序技术和分析方法的组库中可以显著使该方法论简化并且提高对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和映射的能力。为了有效而无有害作用地利用crispr-cas系统用于基因组编辑,了解这些基因组工程工具的工程化和优化方面是至关重要的,这些方面是请求保护的本发明的方面。8.在一个方面,本发明提供了包括一个或多个载体的载体系统。在一些实施例中,该系统包括:(a)一个第一调节元件,该第一调节元件可操作地连接到一个tracr配对序列以及用于在该tracr配对序列的上游插入一个或多个指导序列的一个或多个插入位点,其中当表达时,该指导序列引导crispr复合物在真核细胞中与一个靶序列的序列特异性结合,其中该crispr复合物包括与以下各项复合的一种crispr酶:(1)杂交到该靶序列的指导序列,以及(2)杂交到该tracr序列的tracr配对序列;以及(b)一个第二调节元件,该第二调节元件可操作地连接到包括一个核定位序列的、编码所述crispr酶的酶编码序列;其中组分(a)以及(b)位于该系统的相同或不同载体上。在一些实施例中,组分(a)进一步包括在该第一调节元件的控制之下在tracr配对序列的下游的tracr序列。在一些实施例中,组分(a)进一步包括可操作地连接到该第一调节元件的两个或更多个指导序列,其中当表达时,该两个或更多个指导序列中的每个引导crispr复合物在真核细胞中与一个不同靶序列的序列特异性结合。在一些实施例中,该系统包括在一个第三调节元件(诸如一个聚合酶iii启动子)控制之下的tracr序列。在一些实施例中,当进行最佳比对时,沿着该tracr配对序列的长度,该tracr序列展现至少50%、60%、70%、80%、90%、95%、或99%序列互补性。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于clustalw、matlab中的史密斯-沃特曼算法(smith‑ꢀwaterman)、bowtie、geneious、biopython以及seqman。在一些实施例中,该crispr复合物包括一个或多个核定位序列,该一个或多个核定位序列具有足够强度来在真核细胞的细胞核中驱动所述crispr复合物以可检测到的量积聚。不希望受理论限制,认为核定位序列对于真核生物中的crispr复合物活性不是必要的,但包括此类序列增强该系统的活性,尤其对于靶向细胞核中的核酸分子而言。在一些实施例中,该crispr酶是ii型crispr系统酶。在一些实施例中,该crispr酶是cas9酶。在一些实施例中,该cas9酶是肺炎链球菌、化脓链球菌、或嗜热链球菌cas9,并且可包括源自于这些生物体的突变的cas9。该酶可以是一种cas9同系物或直向同源物。在一些实施例中,该crispr酶是密码子优化的以便在真核细胞中表达。在一些实施例中,该crispr酶引导在该靶序列位置处的一条或两条链的切割。在一些实施例中,该crispr酶缺少dna链切割活性。在一些实施例中,该第一调节元件是一种聚合酶iii启动子。在一些实施例中,该第二调节元件是一种聚合酶ii启动子。在一些实施例中,该指导序列在长度上是至少15个、16个、17个、18个、19个、20个、25个核苷酸,或10-30个之间、或15-25个之间、或15-20个之间的核苷酸。通常,并且贯穿本说明书,术语“载体”是指一种核酸分子,它能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括dna、rna、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的dna片段的环状双链dna环。另一种类型的载体是病毒载体,其中病毒衍生的dna或rna序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到一种宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此被称为“表达载体”。在重组dna技术中使用的普通表达栽体通常是质粒形式。9.重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸,这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调节元件,所述调节元件可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一个或多个调节元件(例如,处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。10.术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(ires)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚u序列)。这样的调节序列例如描述于戈德尔(goeddel),《基因表达技术:酶学方法》(geneexpressiontechnology:methodsinenzymology)185,学术出版社(academicpress),圣地亚哥(sandiego),加利福尼亚州(1990)中。调节元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。调节元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中,一个载体包含一个或多个poliii启动子(例如1、2、3、4、5、或更多个poliii启动子)、一个或多个polii启动子(例如1、2、3、4、5、或更多个polii启动子)、一个或多个poli启动子(例如1、2、3、4、5、或更多个poli启动子)、或其组合。poliii启动子的实例包括但不限于u6和h1启动子。polii启动子的实例包括但不限于逆转录劳斯肉瘤病毒(rsv)ltr启动子(任选地具有rsv增强子)、巨细胞病毒(cmv)启动子(任选地具有cmv增强子)[参见,例如,波沙特(boshart)等人,《细胞》(cell)41:521-530(1985)]、sv40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(pgk)启动子、和ef1α启动子。还被术语“调节元件”涵盖的是增强子元件,如wpre;cmv增强子;在htlv-i的ltr中的r-u5’片段《分子细胞生物学》(mol.cell.biol.,第8(1)卷,第466-472页,1988);sv40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(《美国国家科学院院刊》(proc.natl.acad.sci.usa.),第78(3)卷,第1527-31页,1981)。本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的核酸编码的融合蛋白或肽(例如,规律间隔成簇短回文重复序列(crispr)转录物、蛋白质、酶、其突变体形式、其融合蛋白,等等)。[0011]有利的载体包括慢病毒以及腺相关病毒,并且也可选择此类型的载体以靶向具体类型的细胞。[0012]在一个方面,本发明提供了包括一个调节元件的载体,该调节元件可操作地连接到编码crispr酶的酶编码序列上,该crispr酶包含一个或多个核定位序列。在一些实施例中,所述调节元件驱动真核细胞中crispr酶的转录,使得所述crispr酶以可检测到的量在该真核细胞的细胞核中积聚。在一些实施例中,该调节元件是一种聚合酶ii启动子。在一些实施例中,该crispr酶是ii型crispr系统酶。在一些实施例中,该crispr酶是cas9酶。在一些实施例中,该cas9酶是肺炎链球菌、化脓链球菌或嗜热链球菌cas9,并且可包括源自于这些生物体的突变的cas9。在一些实施例中,该crispr酶是密码子优化的以便在真核细胞中表达。在一些实施例中,该crispr酶引导在该靶序列位置处的一条或两条链的切割。在一些实施例中,该crispr酶缺少dna链切割活性。[0013]在一个方面,本发明提供了一种crispr酶,该crispr酶包括一个或多个核定位序列,该一个或多个核定位序列具有足够强度来在真核细胞的细胞核中驱动所述crispr酶以可检测到的量积聚。在一些实施例中,该crispr酶是ii型crispr系统酶。在一些实施例中,该crispr酶是cas9酶。在一些实施例中,该cas9酶是肺炎链球菌、化脓链球菌或嗜热链球菌cas9,并且可包括源自于这些生物体的突变的cas9。该酶可以是一种cas9同系物或直向同源物。在一些实施例中,该crispr酶缺少切割它结合至其上的靶序列的一条或多条链的能力。[0014]在一个方面,本发明提供了一种真核宿主细胞,该真核宿主细胞包括:(a)一个第一调节元件,该第一调节元件可操作地连接到一个tracr配对序列以及用于在该tracr配对序列的上游插入一个或多个指导序列的一个或多个插入位点,其中当表达时,该指导序列引导crispr复合物在真核细胞中与一个靶序列的序列特异性结合,其中该crispr复合物包括与以下各项复合的一种crispr酶:(1)杂交到该靶序列的指导序列,以及(2)杂交到该tracr序列的tracr配对序列;和/或(b)一个第二调节元件,该第二调节元件可操作地连接到包括一个核定位序列的、编码所述crispr酶的酶编码序列。在一些实施例中,该宿主细胞包括组分(a)以及(b)。在一些实施例中,组分(a)、组分(b)、或组分(a)和(b)稳定地整合到该宿主真核细胞的一个基因组中。在一些实施例中,组分(a)进一步包括在该第一调节元件的控制之下在tracr配对序列的下游的tracr序列。在一些实施例中,组分(a)进一步包括可操作地连接到该第一调节元件的两个或更多个指导序列,其中当表达时,该两个或更多个指导序列中的每个引导crispr复合物在真核细胞中与一个不同靶序列的序列特异性结合。在一些实施例中,该真核宿主细胞进一步包括一种第三调节元件,诸如一种聚合酶iii启动子,该第三调节元件可操作地连接到所述tracr序列。在一些实施例中,当进行最佳比对时,沿着该tracr配对序列的长度,该tracr序列展现至少50%、60%、70%、80%、90%、95%、或99%序列互补性。在一些实施例中,该crispr酶包括一个或多个核定位序列,该一个或多个核定位序列具有足够强度来在真核细胞的细胞核中驱动所述crispr酶以可检测到的量积聚。在一些实施例中,该crispr酶是ii型crispr系统酶。在一些实施例中,该crispr酶是cas9酶。在一些实施例中,该cas9酶是肺炎链球菌、化脓链球菌或嗜热链球菌cas9,并且可包括源自于这些生物体的突变的cas9。该酶可以是一种cas9同系物或直向同源物。在一些实施例中,该crispr酶是密码子优化的以便在真核细胞中表达。在一些实施例中,该crispr酶引导在该靶序列位置处的一条或两条链的切割。在一些实施例中,该crispr酶缺少dna链切割活性。在一些实施例中,该第一调节元件是一种聚合酶iii启动子。在一些实施例中,该第二调节元件是一种聚合酶ii启动子。在一些实施例中,该指导序列在长度上是至少15个、16个、17个、18个、19个、20个、25个核苷酸,或10-30个之间、或15-25个之间、或15-20个之间的核苷酸。在一个方面,本发明提供一种非人的真核生物;优选地一种多细胞真核生物,包括根据所述实施例中任一个的一种真核宿主细胞。在其他方面,本发明提供一种真核生物;优选地一种多细胞真核生物,包括根据所述实施例中任一个的一种真核宿主细胞。在这些方面的一些实施例中,该生物体可以是一种动物;例如一种哺乳动物。另外,该生物体可以是一种节肢动物,诸如一种昆虫。该生物体也可以是一种植物。进一步,该生物体可以是一种真菌。[0015]在一个方面,本发明提供了一种试剂盒,该试剂盒包括在此所述的组分中的一种或多种。在一些实施例中,该试剂盒包括一种载体系统以及用于使用该试剂盒的说明书。在一些实施例中,该载体系统包括:(a)一个第一调节元件,该第一调节元件可操作地连接到一个tracr配对序列以及用于在该tracr配对序列的上游插入一个或多个指导序列的一个或多个插入位点,其中当表达时,该指导序列引导crispr复合物在真核细胞中与一个靶序列的序列特异性结合,其中该crispr复合物包括与以下各项复合的一种crispr酶:(1)杂交到该靶序列的指导序列,以及(2)杂交到该tracr序列的tracr配对序列;和/或(b)一个第二调节元件,该第二调节元件可操作地连接到包括一个核定位序列的编码所述crispr酶的酶编码序列。在一些实施例中,该试剂盒包括位于该系统的相同或不同载体上的组分(a)和(b)。在一些实施例中,组分(a)进一步包括在该第一调节元件的控制之下在tracr配对序列的下游的tracr序列。在一些实施例中,组分(a)进一步包括可操作地连接到该第一调节元件的两个或更多个指导序列,其中当表达时,该两个或更多个指导序列中的每个引导crispr复合物在真核细胞中与一个不同靶序列的序列特异性结合。在一些实施例中,该系统进一步包括一种第三调节元件,诸如一种聚合酶iii启动子,该第三调节元件可操作地连接到所述tracr序列。在一些实施例中,当进行最佳比对时,沿着该tracr配对序列的长度,该tracr序列展现至少50%、60%、70%、80%、90%、95%、或99%序列互补性。在一些实施例中,该crispr酶包括一个或多个核定位序列,该一个或多个核定位序列具有足够强度来在真核细胞的细胞核中驱动所述crispr酶以可检测到的量积聚。在一些实施例中,该crispr酶是ii型crispr系统酶。在一些实施例中,该crispr酶是cas9酶。在一些实施例中,该cas9酶是肺炎链球菌、化脓链球菌或嗜热链球菌cas9,并且可包括源自于这些生物体的突变的cas9。该酶可以是一种cas9同系物或直向同源物。在一些实施例中,该crispr酶是密码子优化的以便在真核细胞中表达。在一些实施例中,该crispr酶引导在该靶序列位置处的一条或两条链的切割。在一些实施例中,该crispr酶缺少dna链切割活性。在一些实施例中,该第一调节元件是一种聚合酶iii启动子。在一些实施例中,该第二调节元件是一种聚合酶ii启动子。在一些实施例中,该指导序列在长度上是至少15个、16个、17个、18个、19个、20个、25个核苷酸,或10-30个之间、或15-25个之间、或15-20个之间的核苷酸。[0016]在一个方面,本发明提供了修饰在一种真核细胞中的靶多核苷酸的方法。在一些实施例中,该方法包括允许一种crispr复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该crispr复合物包括与杂交到在所述靶多核苷酸内的一个靶序列上的指导序列复合的crispr酶,其中所述指导序列连接到一个tracr配对序列上,该tracr配对序列进而杂交到一个tracr序列上。在一些实施例中,所述切割包括通过所述crispr酶切割在该靶序列位置的一条或两条链。在一些实施例中,所述切割导致靶基因的转录降低。在一些实施例中,该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸,其中所述修复导致一种突变,包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中,所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施例中,该方法进一步包括将一个或多个载体递送到所述真核细胞,其中该一个或多个载体驱动以下一项或多项的表达:该crispr酶、连接到该tracr配对序列上的指导序列、以及该tracr序列。在一些实施例中,所述载体被递送到受试者内的真核细胞中。在一些实施例中,所述修饰发生在细胞培养物中的所述真核细胞中。在一些实施例中,该方法进一步包括在所述修饰之前从受试者中分离所述真核细胞。在一些实施例中,该方法进一步包括使所述真核细胞和/或从中衍生的细胞返回到所述受试者中。[0017]在一个方面,本发明提供了修饰一种多核苷酸在真核细胞中的表达的方法。在一些实施例中,该方法包括允许一种crispr复合物结合到该多核苷酸上,使得所述结合导致所述多核苷酸表达增加或减少;其中该crispr复合物包含与杂交到在所述靶多核苷酸内的一个靶序列上的指导序列复合的crispr酶,其中所述指导序列连接到一个tracr配对序列上,该tracr配对序列进而杂交到一个tracr序列上。在一些实施例中,该方法进一步包括将一个或多个载体递送到所述真核细胞,其中该一个或多个载体驱动以下一项或多项的表达:该crispr酶、连接到该tracr配对序列上的指导序列、以及该tracr序列。[0018]在一个方面,本发明提供了一种产生包含突变的疾病基因的模型真核细胞的方法。在一些实施例中,疾病基因是与患有或产生一种疾病的风险的增加相关联的任何基因。在一些实施例中,该方法包括(a)将一个或多个载体引入真核细胞中,其中该一个或多个载体驱动以下一项或多项的表达:crispr酶、连接到tracr配对序列上的指导序列、以及tracr序列;以及(b)允许一种crispr复合物结合到一个靶多核苷酸上以实施在所述疾病基因内的该靶多核苷酸的切割,其中该crispr复合物包含与(1)杂交到该靶多核苷酸内的该靶序列上的指导序列、和(2)杂交到该tracr序列上的该tracr配对序列复合的crispr酶,由此产生包含突变的疾病基因的模式真核细胞。在一些实施例中,所述切割包括通过所述crispr酶切割在该靶序列位置的一条或两条链。在一些实施例中,所述切割导致靶基因的转录降低。在一些实施例中,该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸,其中所述修复导致一种突变,包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中,所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。[0019]在一个方面,本发明提供了一种用于研发生物活性剂的方法,该生物活性剂调制与疾病基因相关的细胞信号传导事件。在一些实施例中,疾病基因是与患有或产生一种疾病的风险的增加相关联的任何基因。在一些实施例中,该方法包括(a)使一种测试化合物与所述实施例中的任一项的一种模式细胞接触;并且(b)检测读数变化,该变化指示与所述疾病基因的所述突变关联的细胞信号传导事件的减少或增加,从而开发调制与所述疾病基因关联的所述细胞信号传导事件的所述生物活性剂。[0020]在一个方面,本发明提供包括在tracr配对序列上游的指导序列的一种重组多核苷酸,其中当表达时该指导序列引导一种crispr复合物与存在于真核细胞中的一个对应的靶序列的序列特异性结合。在一些实施例中,该靶序列是存在于真核细胞中的病毒序列。在一些实施例中,该靶序列是原癌基因或癌基因。[0021]在一个方面,本发明提供了一种通过在一个或多个原核细胞中的基因中引入一个或多个突变来选择一个或多个原核细胞的方法,该方法包括:将一个或多个载体引入一个或多个原核细胞中,其中该一个或多个载体驱动以下一项或多项的表达:crispr酶、连接到tracr配对序列上的指导序列、tracr序列、以及编辑模板;其中该编辑模板包含消除crispr酶切的一个或多个突变;允许该编辑模板与在有待选择的一个或多个细胞中的靶多核苷酸同源重组;允许crispr复合物结合到靶多核苷酸上以实施在所述基因内的靶多核苷酸的切割,其中该crispr复合物包含与(1)杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列复合的crispr酶,其中该crispr复合物到该靶多核苷酸上的结合诱导细胞死亡,由此允许选择其中已经引入一个或多个突变的一个或多个原核细胞。在一个优选的实施例中,该crispr酶是cas9。在本发明的另一方面,该有待选择的细胞可以是真核细胞。本发明的方面允许选择特异细胞,而不需要选择标记或可能包括反选择系统的两步法。[0022]因此,本发明的目的在于,在本发明中不涵盖任何先前已知的产品、制造该产品的过程、或使用该产品的方法,使得申请人保留和特此披露放弃任何先前已知的产品、过程、或方法的权利。进一步指出的是,在本发明的范围之内,本发明并不旨在涵盖任何产品、过程、或该产品的制造或使用该产品的方法,其不符合uspto(35u.s.c.§112,第一段)或epo(epc的第83条)的书面说明和可实施性要求,使得申请人保留和特此公开放弃任何先前描述的产品、制造该产品的过程、或使用该产品的方法的权利。[0023]应当指出的是,在本披露中并且尤其是在权利要求书和/或段落中,术语如“包含(comprises)”、“包含(comprised)”、“包含(comprising)”等等可具有在美国专利法中属于它的含义;例如,它们可以表示“包括(includes)”、“包括(included)”、“包括(including)”等等;并且术语如“基本上由……组成(consistingessentiallyof)”和“基本上由……组成(consistsessentiallyof)”具有在美国专利法中归于它们的含义,例如,它们允许未被清楚叙述的要素,但是排除在现有技术中发现或者影响本发明的基本或新颖特征的要素。这些和其他实施例披露于以下详细说明中,或者据其显而易见并且由其涵盖。附图简要说明[0024]本发明的新颖特征在所附权利要求书中具体提出。通过参考提出说明性实施例的以下详细说明,将获得对本发明的特征和优点的更好理解,在这些实施例中利用了本发明的原理,并且在这些附图中:[0025]图1显示了该crispr系统的示意模型。来自化脓链球菌(黄色)的cas9核酸酶经由合成的指导rna(sgrna)而被靶向基因组dna,该指导rna包含一个20个nt的指导序列(蓝色)和一个支架(红色)。具有dna靶(蓝色)的指导序列碱基对,直接地在必要的5’‑ngg原型间隔子相邻基序(pam;红紫色)的上游,并且cas9在该pam(红色三角形)的上游约3bp介导了双链断裂(dsb)。[0026]图2a-f显示了一个示例性crispr系统、一个可能的作用机制、一个在真核细胞中的表达的示例性适应性改变、以及评估核定位和crispr活性的试验的结果。[0027]图3展示了一个用于在真核细胞中表达crispr系统元件的示例性表达盒、示例性指导序列的预测结构以及如在真核和原核细胞中测量的crispr系统活性。[0028]图4a-d显示了针对示例性靶标的spcas9特异性的评估结果。[0029]图5a-g显示了一个示例性载体系统以及它在指导真核细胞中的同源重组中的使用结果。[0030]图6提供了原型间隔子序列的表,并且总结了基于示例性脓链球菌和嗜热链球菌crispr系统设计的原型间隔子靶标的修饰效率结果,这些crispr系统具有针对人类和小鼠基因组中的座位的相应pam。用cas9以及前-crrna/tracrrna或嵌合rna转染细胞,在转染72小时之后进行分析。基于来自指示细胞系的surveyor分析结果,计算了indel(插入缺失)百分比(对于所有原型间隔子靶标n=3,误差为s.e.m.,n.d.表示使用surveyor测定未检测到,并且n.t.表示在本研究中未检测)。[0031]图7a-c显示了对于cas9介导的基因靶向的不同tracrrna转录本的比较。[0032]图8显示了对于双链断裂诱导的微插入和微缺失的检测的测量员核酸酶试验的示意图。[0033]图9a-b显示了用于crispr系统元件在真核细胞中的表达的示例性双顺反子表达载体。[0034]图10显示一种细菌性质粒转化干扰测定、其中使用的表达盒和质粒、以及其中使用的细胞转化率。[0035]图11a-c显示了在人类基因组中在邻近的化脓链球菌sf370座位1pam(ngg)(图10a)和嗜热链球菌lmd9座位2pam(nnagaaw)(图10b)之间的距离、以及对于每个pam就染色体而言的距离(chr)(图10c)的直方图。[0036]图12a-c显示了一个示例性crispr系统、一个在真核细胞中的表达的示例性适应性改变、以及评估crispr活性的试验的结果。[0037]图13a-c显示了用于靶向哺乳动物细胞中的基因组座位的crispr系统的示例性操纵。[0038]图14a-b显示了在哺乳动物中的crrna加工的northern印迹分析的结果。[0039]图15显示了在人pvalb和小鼠th座位中的原型间隔子的示例性筛选。[0040]图16显示了在人emx1座位中的嗜热链球菌crispr系统的示例性原型间隔子和相应pam序列靶标。[0041]图17提供了用于surveyor、rflp、基因组测序、以及northern印迹分析的引物和探针序列的表。[0042]图18a-c显示了具有嵌合rna的crispr系统的示例性操纵以及在真核细胞中的系统活性的surveyor分析的结果。[0043]图19a-b显示了在真核细胞中的crispr系统活性的surveyor分析的结果的图示。[0044]图20显示了使用ucsc基因组浏览器进行的在人类基因组中的一些化脓链球菌cas9靶位点的示例性可视化。[0045]图21显示包括指导序列、tracr配对序列、以及tracr序列的示例性嵌合rna的预测的二级结构。[0046]图22显示了用于crispr系统元件在真核细胞中的表达的示例性双顺反子表达载体。[0047]图23显示针对内源靶的cas9核酸酶活性可被用于基因组编辑。(a)使用该crispr系统的基因组编辑的概念。该crispr靶向构建体引导一种染色体座位的切割,并且与和该靶标重组的一个编辑模板共转化以防止切割。从crispr攻击幸存的卡那霉素抗性转化体包含通过该编辑模板引入的修饰。tracr,反式激活crisprrna;apha-3,卡那霉素抗性基因。(b)在无编辑模板、r6野生型srta或r6370.1编辑模板情况下在r68232.5细胞中进行的crr6mdna的转化。r6srta或r6370.1的重组通过cas9防止切割。转化率计算为集落形成单位(cfu)/μg的crr6mdna;显示了来自至少三个独立实验的平均值与标准差。在每个转化中在8个克隆上进行pcr分析。“un.”ꢀ表明菌株r68232.5的未编辑的srta座位;“ed.”显示编辑模板。r68232.5和r6370.1靶标通过eaei的限制酶切而区分开。[0048]图24显示对消除cas9切割的pam以及种子序列的分析。(a)具有随机化pam序列或随机化种子序列的pcr产物在crr6细胞中转化。这些细胞表达装载有crrna(靶向r68232.5细胞的染色体区域(以粉红色凸显))的cas9,该染色体区域自该r6基因组缺失。合并超过2×105种氯霉素抗性转化体(携带无活性的pam或种子序列),用于对该靶区进行扩增以及深度测序。(b)在crr6细胞中随机pam构建体的转化之后读数数目的相对比例(相较于r6转化体中的读数的数目)。显示了每个3-核苷酸pam序列的相对丰度。以红色示出代表性严重不足的序列(ngg);代表性部分地不足的序列以橘色示出(nag)(c)在crr6细胞中随机种子序列构建体的转化之后读数数目的相对比例(相较于r6转化体中的读数的数目)。显示了针对该原型间隔子的前20个核苷酸的每个位置的每个核苷酸的相对丰度。高丰度表明缺少由cas9进行的切割,即一种crispr钝化突变。灰色线显示野生型序列的水平。虚线代表如下水平,在此水平之上一种突变显著破坏切割(参见实例5中的“深度测序数据分析”部分)[0049]图25显示在肺炎链球菌中使用crispr系统引入单个和多个突变。(a)野生型和编辑的(绿色核苷酸;加下划线的氨基酸残基)bgaa的核苷酸以及氨基酸序列。显示了该原型间隔子、pam以及限制酶切位点。(b)在存在一种编辑模板或对照的情况下用靶向构建体转化的细胞的转化率。(c)针对每个编辑试验的8个转化体进行pcr分析,随后用btgzi(r→a)以及tsei(ne→aa)进行消化。bgaa的缺失显示为一种较小的pcr产物。(d)进行米勒(miller)测定以测量野生型和编辑的菌株的β-半乳糖苷酶的活性。(e)对于单步骤、双向缺失,该靶向构建体包含两个间隔子(在此情况下匹配srta以及bgaa)并且用两种不同的编辑模板共转化。(f)pcr分析8个转化体以检测srta以及bgaa座位的缺失。6/8的转化体包含两个基因的缺失。[0050]图26提供使用该crispr系统的编辑下潜在的机制。(a)将一个终止密码子引入红霉素抗性基因ermam以产生菌株jen53。该野生型序列可以通过以下修复:用该crispr::ermam(终止子)构建体靶向该终止密码子,并且使用ermam野生型序列作为编辑模板。(b)突变体以及野生型ermam序列。(c)从总或卡那霉素抗性(kanr)cfu计算的红霉素抗性(ermr)cfu的分数。(d)获得该crispr构建体以及该编辑模板两者的总细胞的分数。靶向构建体的crispr的共转化产生更多转化体(t检验,p=0.011)。在所有情况下,针对三个独立实验,这些值显示平均±s.d.。[0051]图27说明在大肠杆菌中用该crispr系统编辑基因组。(a)携带靶向待编辑的基因的crispr阵列(pcrispr)的一个卡那霉素抗性质粒可在包含一个氯霉素抗性质粒(包含cas9以及tracr(pcas9))连同带有指定该突变的一个寡核苷酸的hme63重组工程菌株中被转化。(b)将赋予链霉素抗性的一个k42t突变引入rpsl基因(c)从总或卡那霉素抗性(kanr)cfu计算的链霉素抗性(strepr)cfu的分数。(d)获得该pcrispr质粒以及编辑寡核苷酸两者的总细胞的分数。靶向质粒的pcrispr的共转化产生更多转化体(t检验,p=0.004)。在所有情况下,针对三个独立实验,这些值显示平均±s.d.。[0052]图28示出了crr6基因组dna的转化导致靶定的座位的编辑(a)肺炎链球菌r6的is1167元件被化脓链球菌sf370的crispr01座位替代以产生crr6菌株。此基因座编码cas9核酸酶,即具有六个间隔子的一个crispr阵列,crrna生源说所需要的tracrrna,以及cas1、cas2和csn2(对于靶向来说非必要的蛋白)。菌株crr6m包含没有cas1、cas2以及csn2的一个最低限度的功能性的crispr系统。apha-3基因编码卡那霉素抗性。来自链球菌的细菌噬菌体φ8232.5以及φ370.1的原型间隔子融合到一个氯霉素抗性基因(cat)并且整合到菌株r6的srta基因,以产生菌株r68232.5以及r6370.1。(b)左小图:crr6以及crr6m基因组dna在r68232.5和r6370.1中的转化。作为细胞感受态的一个对照,也转化了一个链霉素抗性基因。右小图:具有crr6基因组dna的的8r68232.5转化体的pcr分析。扩增srta座位的引物被用于pcr。7/8的基因分型的菌落通过来自crr6基因组dna的wt座位替代r68232.5srta座位。[0053]图29提供在此研究中获得的编辑的细胞的dna序列的色谱图。在所有情况下,指明了野生型和突变的原型间隔子以及pam序列(或其反向互补体)。当相关时,提供了由该原型间隔子编码的氨基酸序列。对于每个编辑试验,对如下所有菌株进行测序,对这些菌株而言pcr以及限制酶切分析证实引入了所希望的修饰。显示了代表性色谱图。(a)将一种pam突变引入至该r68232.5靶中的色谱图(图24a)。(b)将r》a以及ne》aa突变引入至β-半乳糖苷酶(bgaa)中的色谱图(图25c)。(c)将6664bp缺失引入bgaaorf内的色谱图(图25c以及25f)。虚线表示缺失限。(d)将729bp缺失引入srtaorf内的色谱图(图25f)。虚线表示缺失限。(e)ermam内一个早熟终止密码子的产生的色谱图(图33)。(f)大肠杆菌中的rpsl编辑(图27)。[0054]图30示出针对包含不同pam的随机肺炎链球菌靶的crispr免疫。(a)肺炎链球菌缺失导致β-半乳糖苷酶释放至上清液中。δbgaa突变体不显示活性。(d)针对8个大观霉素(spec)抗性转化体进行pcr分析以检测野生型is1167对crispr座位的替代。[0059]图35示出了肺炎链球菌中crispr的背景突变频率。(a)jen53中或crispr::erm(终止子)靶向构建体的转化,使用或不使用ermam编辑模板。以及crispr::erm(终止子)之间的kanrcfu的差异表明cas9切割杀死未编辑的细胞。以3×10-3的频率观察到在不存在编辑模板的情况下逃脱crispr干扰的突变体。(b)逃脱者的crispr座位的pcr分析显示7/8具有间隔子缺失。(c)逃脱者#2在cas9中携带点突变。[0060]图36示出了使用pcas9,化脓链球菌crispr座位1的必需元件在大肠杆菌中重组。该质粒包含tracrrna、cas9、连同驱动该crrna阵列的一个前导子序列。这些pcrispr质粒仅包含前导子以及阵列。使用退火的寡核苷酸,间隔子可被插入至该crrna阵列中bsai位点之间。寡核苷酸设计显示在底部。pcas9携带氯霉素抗性(cmr)并且是基于低拷贝pacyc184质粒骨架的。pcrispr是基于高拷贝数pze21质粒。需要两个质粒,因为使用此生物体作为克隆宿主,如果cas9也存在的话(它将杀死该宿主),不可构建包含靶向大肠杆菌染色体的间隔子的pcrispr质粒。[0061]图37示出了大肠杆菌mg1655中crispr引导的编辑。将携带赋予链霉素抗性并且废除crispr免疫两者的点突变的一个寡核苷酸(w542)和一种靶向rpsl(pcrispr::rpsl)的质粒或一个对照质粒一起共转化至包含pcas9的野生型大肠杆菌菌株mg1655中。在包含链霉素或卡那霉素的培养基上筛选转化体。虚线表明该转化测定的检出限。[0062]图38示出了大肠杆菌hme63中crispr的背景突变频率。(a)或pcrispr::rpsl质粒转化至hme63感受态细胞中。以2.6×10-4的频率观察到逃脱crispr干扰的突变体。(b)逃脱者的crispr阵列的扩增显示8/8缺失间隔子。[0063]图39a-d显示了揭示五个cas9家族的系统发生分析的环状描绘,这五个家族包括三组大的cas9(约1400个氨基酸)和两组小的cas9(约1100个氨基酸)。[0064]图40a-f显示了揭示五个cas9家族的系统发生分析的线性描绘,这五个家族包括三组大的cas9(约1400个氨基酸)和两组小的cas9(约1100个氨基酸)。[0065]图41a-m显示了在突变点位于spcas9基因内的情况下的序列。[0066]图42显示如下的一个示意性构建体,其中转录激活结构域(vp64)融合至cas9,催化结构域中有两个突变(d10以及h840)。[0067]图43a-d显示了经由同源重组进行的基因组编辑。(a)spcas9切口酶的示意图,具有在ruvci催化结构域中的d10a突变。(b)使用有义或反义单链寡核苷酸作为修复模板的代表在人emx1座位的同源重组(hr)的示意图。以上红色箭头表示sgrna切割位点;用于基因分型的pcr引物(表j和k)表示为右图中的箭头。(c)由hr修饰的区域的序列。d,对于野生型(wt)和切口酶(d10a)spcas9介导的在emx1靶标1座位的indel的surveyor分析(n=3)。箭头指示预期片段大小的位置。[0068]图44a-b显示了用于spcas9的单个载体设计。[0069]图45显示nls-csn1构建体nls-csn1、csn1、csn1-nls、nls‑ꢀcsn1-nls、nls-csn1-gfp-nls以及untfn的切割的量化。[0070]图46显示nls-cas9、cas9、cas9-nls以及nls-cas9-nls的索引频率。[0071]图47显示一种凝胶,该凝胶表明具有切口酶突变的spcas9(单独地)不诱导双链断裂。[0072]图48显示在此试验中用作同源重组(hr)模板的寡dna的一种设计以及由cas9蛋白以及hr模板的不同组合诱导的hr率的比较。[0073]图49a显示了条件型cas9、rosa26靶向载体图谱。[0074]图49b显示了组成型cas9、rosa26靶向载体图谱。[0075]图50a-h显示存在于图49a-b的载体图谱中的每个元件的序列。[0076]图51显示了在组成型和条件型cas9构建体中的重要元件的示意图。[0077]图52显示组成型和条件型cas9构建体的表达的功能性确认。[0078]图53显示通过surveyor确认cas9核酸酶活性。[0079]图54显示cas9核酸酶活性的量化。[0080]图55显示构建体设计以及同源重组(hr)策略。[0081]图56显示组成型(右)和条件型(左)构建体在两个不同凝胶暴露时间(顶行持续3min并且底行持续1min)的基因组pcr基因分型结果。[0082]图57显示了在mesc中的cas9激活。[0083]图58显示用以使用切口酶版本的cas9连同两个指导rna通过nhej介导基因敲除的策略的示意图。[0084]图59显示dna双链断裂(dsb)修复如何促进基因编辑。在易错非同源末端连接(nhej)途径中,dsb的末端由内源dna修复机构加工并重新连接在一起,可导致在连接位点的随机indel(indel)突变。发生在基因编码区内的indel突变可产生移码和提前终止密码子,导致基因敲除。可替代地,处于质粒或单链寡脱氧核苷酸(ssodn)形式的修复模板可以被提供为利用同源定向修复(hdr)途径,该途径允许高保真和精确编辑。[0085]图60显示实验的时间轴以及概要。针对试剂设计、构建、确认、以及细胞系扩增的步骤。在计算机中(insilico)通过在线设计工具(在网站genome-engineering.org/tools可获得)设计针对每个靶标的自定义sgrna(浅蓝色条)连同基因分型引物。然后将sgrna表达载体克隆至包含cas9(px330)的一个质粒中并且通过dna测序进行证实。然后将完整的质粒(pcrispr)以及促进同源定向修复的任选的修复模板转染至细胞中并且针对介导靶向切割的能力进行测定。最终,转染的细胞可以克隆性扩增以得到具有定义的突变的同基因细胞系。[0086]图61a-c显示靶筛选以及试剂制备。(a)化脓链球菌cas9,20‑ꢀbp靶标(用蓝色凸显)后面必须有5’‑ngg,其可发生在基因组dna的任一条链。我们建议使用此方案中所述的在线工具以辅助靶标筛选(www.genome-engineering.org/tools)。(b)cas9表达质粒(px165)以及pcr-扩增的u6-驱动sgrna表达盒的共转染的示意图。使用包含u6启动子的pcr模板以及固定的正向引物(u6fwd),sgrna-编码dna可附加到该u6反向引物(u6rev)上并且合成为延伸的dna寡聚物(来自idt的ultramer寡聚物)。注意,u6rev中的指导序列(蓝色n)是5’‑ngg侧翼靶序列的反向互补体。(c)指导序列寡聚物无疤(scarless)克隆至包含cas9以及sgrna支架(px330)的一个质粒中的示意图。指导寡聚物(蓝色n)包含突出端以连接至ps330上的成对bbsi位点上,顶部和底部链定向匹配该基因组靶标的那些(即,顶部寡聚物是基因组dna中在5’‑ngg之前的20-bp序列)。用bbsi消化px330允许ii型限制酶切位点(蓝色轮廓线)被退火的寡聚物的同向插入替代。值得注意地是一个额外的g被放置在该指导序列的第一个碱基之前。申请人已经发现在该指导序列的前面的一个额外的g不会不利地影响靶向率。当所选择的20-nt指导序列不以鸟嘌呤起始时,额外的鸟嘌呤将确保该sgrna被该u6启动子有效地转录,其优选是在该转录物的第一碱基中的一个鸟嘌呤。[0087]图62a-d显示针对多元nhej的预期结果。(a)用以确定indel百分数的surveyor测定的示意图。首先,通过pcr扩增来自cas9-靶细胞的异质群体的基因组dna。然后将扩增子缓慢重退火以产生异源双链体。将这些重退火的异源双链体通过surveyor核酸酶切割,而同源双链体保持完整。基于切割的dna的分数计算cas9介导的切割率(%indel),如通过凝胶条带的累积强度确定的。(b)两个sgrna(橙色以及蓝色条)被设计以靶向人grin2b以及dyrk1a座位。surveyor凝胶显示在转染细胞中两个基因座处的修饰。着色的箭头表明针对每个基因座预测的片段尺寸。(c)一对sgrna(浅蓝以及绿色条)被设计以切除人emx1座位中的外显子(深蓝色)。靶序列以及pam(红色)以各自的颜色示出,并且红色三角形表明切割位点。预测的接点如下示出。通过pcr(外fwd,外rev)测定从用sgrna3、4、或两者转染的细胞群体分离的个体克隆,反映了约270-bp的缺失。显示了没有修饰(12/23)、单等位基因修饰(10/23)以及双等位基因(1/23)修饰的代表性克隆。内fwd以及内rev引物被用以针对倒位事件进行筛选。(d)带有emx1外显子缺失的克隆系的量化。两对sgrna(3.1、3.2左侧翼sgrna;4.1、4.2右侧翼sgrna)被用以介导一个emx1外显子周围可变尺寸的缺失。转染细胞被克隆性地分离并且扩增以针对缺失以及倒位事件进行基因分型分析。筛选了105个克隆,其中分别有51(49%)以及11(10%)携带杂合的以及纯合的缺失。由于接点可以是可变的,给出了大概的缺失尺寸。[0088]图63a-c显示应用ssodn以及靶向载体以介导hr,hek293ft以及hues9细胞中cas9的野生型以及切口酶突变体两者效率范围是从1.0%‑ꢀ27%。[0089]图64显示在哺乳动物细胞中用于快速且有效的crispr靶向的一种基于pcr的方法的示意图。使用一个u6-特异性正向引物以及携带该u6启动子的部分的反向互补体、具有指导序列的sgrna( 85)支架、以及用于转录终止的7个t核苷酸的一个反向引物,将包含人rna聚合酶iii启动子u6的一个质粒进行pcr扩增。纯化所得到的pcr产物并且用携带cbh启动子驱动的cas9的一种质粒进行共递送。[0090]图65显示针对每个grna以及各自的对照,来自转基因组学公司(transgenomics)surveyor突变检测试剂盒的结果。一个阳性surveyor结果是对应于基因组的pcr的一条大的条带以及两个较小的条带,这两个较小的条带是使得双链在一个突变位点断裂的surveyor核酸酶的产物。在小鼠细胞系即neuro-n2a中通过用hspcas9进行的脂质体瞬时共转染验证每个grna。转染后72小时,使用来自epicentre的quickextractdna纯化基因组dna。进行pcr以扩增感兴趣的基因座。[0091]图66显示针对38个活的幼兽(道1-38)、1个死的幼兽(道39)以及用于比较的1个野生型幼兽(道40)的surveyor结果。将幼兽1-19用grnachd8.2进行注射,并且将幼兽20-38用grnachd8.3进行注射。该38个活的幼兽中13个针对一种突变是阳性的。这个死的幼兽也具有一种突变。在野生型样品中未检测到突变。基因组pcr测序与surveyor测定发现是一致的。[0092]图67显示不同cas9nls构建体的一种设计。所有cas9都是人-密码子-优化版本的spcas9。在n-末端或c-末端,nls序列被连接至该cas9基因。将具有不同nls设计的所有cas9变体克隆至包含ef1a启动子的一种骨架载体中,所以它由ef1a启动子驱动。在相同的载体中,存在靶向人emx1座位的由u6启动子驱动的一种嵌合rna,一起形成一个二组分系统。[0093]图68显示由具有不同nls设计的cas9变体诱导的基因组切割的效率。该百分数表明被每个构建体切割的人emx1基因组dna的部分。所有实验来自3个生物重复。n=3,误差表示为s.e.m.。[0094]图69a显示具有转录激活活性的crispr-tf(转录因子)的一种设计。该嵌合rna由u6启动子表达,而可操作地连接到三个nls以及vp64功能域的一种人-密码子-优化的双突变版本的cas9蛋白(hspcas9m)由一种ef1a启动子表达。该双突变,即d10a以及h840a,导致当由嵌合rna指导时,cas9蛋白不能够引入任何切割但维持其结合到靶dna的能力。[0095]图69b显示用crispr-tf系统(嵌合rna以及cas9-nls-vp64融合蛋白)对人sox2基因进行的转录激活。将293ft细胞用如下质粒转染,所述质粒具有两个组分:(1)u6-驱动的不同嵌合rna,靶向人sox2基因组座位内或周围的20-bp序列,以及(2)ef1a-驱动的hspcas9m(双重突变型)-nls-vp64融合蛋白。转染后96小时,收获293ft细胞,并且通过使用一种qrt-pcr测定引入mrna表达以测量激活水平。将所有表达水平针对对照组(灰色条)标准化,对照组表示来自用该crispr-tf骨架质粒(不含嵌合rna)转染的细胞的结果。用于检测sox2mrna的qrt-pcr探针是taqman人基因表达测定用探针(生命技术公司(lifetechnologies))。所有实验表示来自3个生物重复的数据,n=3,误差条显示为s.e.m.。[0096]图70描绘了针对spcas9的nls构造优化。[0097]图71显示针对nggnn序列的qq绘图。[0098]图72显示具有拟合正态分布(黑色线)以及.99分位数(虚线)的数据密度的直方图。[0099]图73a-c显示dgrna::cas9**表达的bgaa的rna指导的阻遏。a.该cas9蛋白结合到该tracrrna,并且结合到通过rna酶iii加工的前体crisprrna以形成crrna。该crrna引导cas9与该bgaa启动子的结合并且阻遏转录。b.表示了用以将cas9**引导至该bgaa启动子的靶标。假定的‑ꢀ35、-10连同该bgaa起始密码子是加粗的。c.通过米勒测定在不存在靶向的情况下并且针对四种不同的靶标测量的β半乳糖苷酶活性。[0100]图74a-e显示cas9**介导的阻遏的表征。a.gfpmut2基因及其启动子(包括-35以及-10信号)是伴随着该研究使用的不同靶位点的位置一起示出的。b.靶向编码链时的相对荧光。c.靶向非编码链时的相对荧光。d.对从t5、t10、b10或不含靶标的对照菌株提取的rna,用探针b477以及b478进行northern印迹。e.在b1、t5以及b10的crrna的5’端中,增加数目的突变的影响。[0101]本文的这些图仅仅是出于说明性的目的,并且不一定是按比例绘制的。本发明的详细说明[0102]术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和ꢀ“寡核苷酸”可互换地使用。它们是指具有任何长度的核苷酸的聚合形式,是脱氧核糖核苷酸或核糖核苷酸、或其类似物。多核苷酸可具有任何三维结构,并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、根据连接分析定义的多个座位(一个座位)、外显子、内含子、信使rna(mrna)、转运rna、核糖体rna、短干扰rna(sirna)、短发夹rna(shrna)、micro-rna(mirna)、核酶、cdna、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的dna、任何序列的分离的rna、核酸探针、和引物。多核苷酸可以包含一个或多个经修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在,可以在聚合物组装之前或之后进行核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后,如通过与标记的组分缀合来进一步修饰。[0103]在本发明的多个方面,术“嵌合rna”、“嵌合指导rna”、ꢀ“指导rna”、“单个指导rna”以及“合成指导rna”是可互换地使用的并且是指包括指导序列、tracr序列以及tracr配对序列的多核苷酸序列。术语“指导序列”是指在指定靶位点的指导rna内约20bp的序列,并且可与术语“指导”或“间隔子”互换地使用。术语“tracr配对序列”也可与术语ꢀ“(一个或多个)同向重复”互换地使用。[0104]如本文所用的术语“野生型”是本领域技术人员所理解的术语,并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。[0105]如本文所用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。[0106]术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语,当指核酸分子或多肽时,表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。[0107]“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克碱基配对或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个即为50%、60%、70%、80%、90%、和100%互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补程度,或者是指在严格条件下杂交的两个核酸。[0108]如本文使用的对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。严格条件的非限制性实例描述于蒂森(tijssen)(1993)的《生物化学和分子生物学中的实验室技术-核酸探针杂交》(laboratorytechniquesinbiochemistryandmolecularbiology-hybridizationwithnucleicacidprobes),第i部分,第二章,“杂交原理概述和核酸探针分析策略”(“overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassay”),爱思唯尔(elsevier),纽约。[0109]“杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应,该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成一个更广泛的过程(如pcr的开始、或经由一种酶的多核苷酸的切割)中的一个步骤。能够与一个给定序列杂交的序列被称为该给定序列的“互补物”。[0110]如本文使用的“表达”是指藉此从dna模板转录成多核苷酸(如转录成mrna或其他rna转录物)的过程和/或转录的mrna随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组dna,表达可以包括真核细胞中mrna的剪接。[0111]术语“多肽”、“肽”和“蛋白质”在本文可互换地使用,是指具有任何长度的氨基酸的聚合物。该聚合物可以是可以是直链或支链的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。这些术语还涵盖已经被修饰的氨基酸聚合物;这些修饰例如二硫键形成、糖基化、脂化(lipidation)、乙酰化、磷酸化、或任何其他操纵,如与标记组分的结合。如本文使用的术语“氨基酸”包括天然的和/或非天然的或者合成的氨基酸,包括甘氨酸以及d和l旋光异构体、以及氨基酸类似物和肽模拟物。[0112]术语“受试者”、“个体”和“患者”在本文中是可互换地使用的,指的是脊椎动物,优选地是哺乳动物,更加优选地是人类。哺乳动物包括但不限于鼠类、猴、人、农畜、体育用动物和宠物。也包括体内获得或体外培养的一种生物实体的组织、细胞及其子代。[0113]术语“治疗剂(therapeuticagent)”、“可用于治疗的试剂(therapeuticcapableagent)”或“处理剂(treatmentagent)”是可互换地使用的,并且是指在给予受试者时赋予某种有益影响的一种分子或化合物。该有益影响包括诊断确定的实现;改进一种疾病、症状、障碍、或病理学病况;减少或预防一种疾病、症状、障碍或病况的发作;并且总体上对抗一种疾病、症状、障碍或病理学病况。[0114]如此处使用的,“治疗(treatment)”或“进行治疗(treating)”ꢀ或“减轻”或“改善”是可互换地使用的。这些术语是指如下途径,该途径用于获得有益或希望的结果,包括但不限于一种治疗益处和/或一种预防益处。治疗益处意指治疗中的一种或多种疾病、病况、或症状上的任何治疗上相关的改进或对其的影响。对于预防益处,该组合物可给予至处于发展一种具体的疾病、病况、或症状的风险的受试者,或给予至报告了一种疾病的一个或多个生理学症状的受试者,尽管该疾病、病况、或症状可能还没有体现出来。[0115]术语“有效量”或“治疗有效量”是指一种药剂的足以实现有益或希望的结果的量。治疗有效量可依赖于正治疗的受试者和疾病病状、受试者的重量和年龄、疾病病况的严重度、给药方式等中一项或多个而改变,并可以由本领域普通技术人员容易地确定。该术语也适用通过此处描述的显像方法中的任一项提供一种检测用图像的一个剂量。具体剂量可依赖于以下中一个或多个而变化:所选择的具体药剂、所遵循的给药方案、是否与其他化合物组合给予、给予时间、待显像的组织、以及携带它的物理递送系统。[0116]除非另有说明,本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组dna的常规技术,这些在本领域的技能之内。参见萨姆布鲁克(sambrook)、弗里奇(fritsch)和马尼亚蒂斯(maniatis),《分子克隆:实验室手册》(molecularcloning:alaboratorymanual),第2次编辑(1989);《当代分子生物学实验手册》(currentprotocolsinmolecularbiology)(f.m.奥苏贝尔(f.m.ausubel)等人编辑,(1987));《酶学方法》(methodsinenzymology)系列(学术出版公司):《pcr2:实用方法》(pcr2:apracticalapproach)(m.j.麦克弗森(m.j.macpherson)、b.d.黑姆斯(b.d.hames)和g.r.泰勒(g.r.taylor)编辑(1995))、哈洛(harlow)和拉内(lane)编辑(1988)《抗体:实验室手册》(antibodies,alaboratorymanual),以及《动物细胞培养》(animalcellculture)(r.i.弗雷谢尼(r.i.freshney)编辑(1987))。[0117]本发明的若干方面涉及包括一个或多个载体的载体系统,或载体本身。载体可以被设计为用于在原核或真核细胞中表达crispr转录物(例如核酸转录物、蛋白质、或酶)。例如,crispr转录物可表达于例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中。适合的宿主细胞进一步讨论于goeddel(戈德尔),《基因表达技术:酶学方法》(geneexpressiontechnology:methodsinenzymology)185,学术出版社(academicpress),圣地亚哥(sandiego),加利福尼亚州(calif.)(1990年)中。可替代地,重组表达载体可在体外例如使用t7启动子调节序列和t7聚合酶来转录和翻译。[0118]载体可以被引入原核生物中并且在其中增殖。在一些实施例中,原核生物用来扩增有待引入真核细胞中的载体的多个拷贝,或者作为有待引入真核细胞中的载体的产生中的中间载体(例如,扩增质粒作为病毒载体包装系统的一部分)。在一些实施例中,原核生物用来扩增一个载体的多个拷贝并且表达一种或多种核酸,如提供用于递送到宿主细胞或宿主生物中的一种或多种蛋白质的来源。蛋白质在原核生物中的表达最经常在大肠杆菌中用含有指导融合或非融合蛋白的表达的组成型或诱导型启动子的载体来进行。融合载体将多个氨基酸添加到在其中编码的蛋白质上,如该重组蛋白的氨基端上。这样的融合载体可以用于一个或多个目的,如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解性;以及(iii)通过在亲和纯化中充当配体来辅助重组蛋白的纯化。通常,在融合表达载体中,将蛋白切割位点引入至融合部分与重组蛋白的接合处以使得能够在纯化融合蛋白之后将重组蛋白与融合部分分离。这类酶以及它们的同源识别序列包括因子xa、凝血酶以及肠激酶。示例性融合表达载体包括pgex(发玛西亚生物技术有限公司(pharmaciabiotechinc);史密斯和约翰逊,1988.《基因》(gene)67:31-40)、pmal(纽英伦生物技术公司(newenglandbiolabs),贝弗利(beverly),马萨诸塞州(mass.))以及prit5(发玛西亚公司,皮斯卡塔韦(piscataway),新泽西州(n.j.)),它们分别将谷胱甘肽s-转移酶(gst)、麦芽糖e结合蛋白或蛋白a融合至靶重组蛋白。[0119]适合的诱导型非融合大肠杆菌表达载体的实例包括ptrc(amrann(阿姆兰)等人,(1988年)《基因》(gene)69:301-315)以及pet11d(studier(斯图迪尔)等人,《基因表达技术:酶学方法》(geneexpressiontechnology:methodsinenzymology)185,学术出版社(academicpress),圣地亚哥(sandiego),加利福尼亚州(calif.)(1990年)60-89。[0120]在一些实施例中,载体是酵母表达载体。用于在酵母酿酒中表达的载体的实例包括pyepsec1(巴尔戴利(baldari)等人,1987.《欧洲分子生物学学会杂志》(emboj)6:229-234)、pmfa(库尔坚(kurjan)和赫斯库伍特兹(herskowitz),1982.《细胞》(cell)30:933-943)、pjry88(舒尔茨(schultz)等人,1987.《基因》(gene)54:113-123)、pyes2(invitrogencorporation(英杰公司),sandiego(圣地亚哥),calif(加利福尼亚州))、以及picz(invitrogencorp(英杰公司),sandiego(圣地亚哥),calif(加利福尼亚州))。[0121]在一些实施例中,使用杆状病毒载体,载体驱动昆虫细胞中的蛋白质表达。可用于在培养的昆虫细胞(例如,sf9细胞)中表达蛋白质的杆状病毒载体包括pac系列(史密斯(smith)等人,1983.《分子细胞生物学》(mol.cell.biol.)3:2156-2165)和pvl系列(拉克瑙(lucklow)和萨莫斯(summers),1989.《病毒学》(virology)170:31-39)。[0122]在一些实施例中,使用哺乳动物表达载体,载体能够驱动一种或多种序列在哺乳动物细胞中表达。哺乳动物表达载体的实例包括pcdm8(锡德(seed),1987.《自然》(nature)329:840)和pmt2pc(考夫曼(kaufman)等人,1987.《欧洲分子生物学学会杂志》(emboj.)6:187‑ꢀ195)。当用于哺乳动物细胞中时,表达载体的控制功能典型地由一个或多个调节元件提供。例如,常用的启动子来源于多瘤、腺病毒2、巨细胞病毒、猴病毒40、以及本文所述和本领域已知的其他病毒。对于用于原核细胞和真核细胞两者的其他适合的表达系统参见例如萨姆布鲁克(sambrook)等人的《分子克隆实验指南》(molecularcloning:alaboratorymanual.)(第2版)的第16和第17章,冷泉港实验室(coldspringharborlaboratory),冷泉港实验室出版社(coldspringharborlaboratorypress),冷泉港(coldspringharbor),纽约,1989。[0123]在一些实施例中,重组哺乳动物表达载体能够指导核酸优先在特定细胞类型中表达(例如,使用组织特异型调节元件来表达核酸)。组织特异型调节元件是本领域中已知的。适合的组织特异型启动子的非限制性实例包括白蛋白启动子(肝脏特异性的;平克特(pinkert)等人,1987.《基因发育》(genesdev.)1:268-277),淋巴特异性启动子(卡里曼(calame)和伊顿(eaton),1988.《免疫学进展》(adv.immunol)43:235-275),特别是t细胞受体的启动子(维纳图(winoto)和巴尔迪莫(baltimore),1989.《欧洲分子生物学学会杂志》(emboj.)8:729-733)和免疫球蛋白(巴纳吉(baneiji)等人,1983.《细胞》(cell)33:729-740;奎恩(queen)和巴尔迪莫(baltimore),1983.《细胞》(cell)33:741-748),神经元特异性启动子(例如,神经丝启动子;伯恩(byrne)和鲁德尔(ruddle),1989.《美国科学院院刊》(proc.natl.acad.sciusa)86:5473-5477),胰腺特异性启动子(艾德兰德(edlund)等人,1985.《科学》(science)230:912-916),以及乳腺特异性启动子(例如,乳清启动子;美国专利号4,873,316和欧洲申请公开号264,166)。还涵盖发育型调节启动子,例如,鼠科动物同源框蛋白(hox)启动子凯赛尔((kessel)和格鲁斯(gruss),1990.《科学》(science)249:374-379)和α-甲胎蛋白启动子(卡姆皮斯(campes)和蒂尔曼(tilghman),1989.《基因发育》(genesdev.)3:537-546)。[0124]在一些实施例中,调节元件可操作地连接至crispr系统的一个或多个元件,从而驱动该crispr系统的该一个或多个元件的表达。一般而言,crispr(规律间隔成簇短回文重复序列),也称为spidr(spacer间隔开的同向重复),构成通常对于特定细菌物种而言特异性的dna基因座的家族。该crispr座位包含在大肠杆菌中被识别的间隔开的短序列重复(ssr)的一个不同类(石野(ishino)等人,《细菌学杂志》(j.bacteriol.),169:5429-5433[1987];和中田(nakata)等人,《细菌学杂志》(j.bacteriol.),171:3553-3556[1989])、以及相关基因。类似的间隔开的ssr已经鉴定于地中海富盐菌(haloferaxmediterranei)、化脓链球菌、鱼腥藻属、和结核分枝杆菌中(参见,格鲁恩(groenen)等人,《分子微生物学》(mol.microbiol.),10:1057-1065[1993];霍(hoe)等人,《新发感染性疾病》(emerg.infect.dis.),5:254-263[1999];马斯波尔(masepohl)等人,《生物化学与生物物理学学报》(biochim.biophys.acta)1307:26-30[1996];以及莫吉卡(mojica)等人,《分子微生物学》,17:85-93[1995])。这些crispr座位典型地不同于其他ssr的重复结构,这些重复已被称为规律间隔的短重复(srsr)(詹森(janssen)等人,《omics:整合生物学杂志》(omicsj.integ.biol.),6:23-33[2002];以及莫吉卡(mojica)等人,《分子微生物学》(mol.microbiol.),36:244-246[2000])。一般而言,这些重复是以簇存在的短元件,其被具有基本上恒定长度的独特间插序列规律地间隔开(莫吉卡(mojica)等人,[2000],同上)。虽然重复序列在菌株之间是高度保守的,许多间隔开的重复和这些间隔区的序列一般在菌株与菌株之间不同(冯·埃姆登(vanembden)等人,《细菌学杂志》(j.bacteriol.),182:2393-2401[2000])。已经在40种以上的原核生物中鉴定出crispr座位(参见,例如,詹森(janssen)等人,《分子微生物学》(mol.microbiol.),43:1565-1575[2002];以及莫吉卡(mojica)等人,[2005]),包括但不限于:气火菌属(aeropyrum)、热棒菌属(pyrobaculum)、硫化叶菌属(sulfolobus)、古球菌属(archaeoglobus)、盐盒菌属(halocarcula)、甲烷杆菌属(methanobacterium)、甲烷球菌属(methanococcus)、甲烷八叠球菌属(methanosarcina)、甲烷火菌属(methanopyrus)、焦球菌属(pyrococcus)、嗜酸菌属(picrophilus)、热原体属(thermoplasma)、棒杆菌属(corynebacterium)、分枝杆菌属(mycobacterium)、链霉菌属(streptomyces)、产水菌属(aquifex)、紫单胞菌属(porphyromonas)、绿菌属(chlorobium)、栖热菌属(thermus)、芽孢杆菌属(bacillus)、利斯特菌属(listeria)、葡萄球菌属(staphylococcus)、梭菌属(clostridium)、好热厌氧杆菌属(thermoanaerobacter)、支原体属(mycoplasma)、梭杆菌属(fusobacterium)、固氮弓菌属(azarcus)、色杆菌属(chromobacterium)、奈瑟球菌属(neisseria)、亚硝化单胞菌属(nitrosomonas)、脱硫弧菌属(desulfovibrio)、地杆菌属(geobacter)、粘球菌属(myxococcus)、弯曲杆菌属(campylobacter)、类杆菌属(wolinella)、不动杆菌属(acinetobacter)、欧文菌属(erwinia)、埃希菌属(escherichia)、军团菌属(legionella)、甲基球菌属(methylococcus)、巴斯德菌属(pasteurella)、发光细菌属(photobacterium)、沙门菌属(salmonella)、黄单胞菌属(xanthomonas)、耶尔森菌属(yersinia)、密螺旋体属(treponema)、和栖热袍菌属(thermotoga)。[0125]一般而言,“crispr系统”统称为转录物和涉及crispr相关(“cas”)基因的表达或指导其活性的其他元件,包括编码cas基因的序列、tracr(反式激活crispr)序列(例如tracrrna或活性部分tracrrna)、tracr配对序列(涵盖“同向重复”和在内源crispr系统背景下的tracrrna加工的部分同向重复)、指导序列(在内源crispr系统背景下也称为“spacer”)、或来自crispr座位的其他序列和转录物。在一些实施例中,crispr系统的一个或多个元件来源于i型、ii型、或iii型crispr系统。在一些实施例中,crispr系统的一个或多个元件来源于包含内源crispr系统的特殊生物,如化脓链球菌。一般而言,crispr系统的特征为促进在靶序列的位点处的crispr复合物(在内源crispr系统的背景下也称为原型间隔子)的形成的元件。在crispr复合物形成的背景下,“靶序列”是指一个指导序列被设计为对其具有互补性的序列,其中在靶序列与指导序列之间的杂交促进crispr复合物的形成。完全互补性不是必需的,条件是存在足够互补性以引起杂交并且促进一种crispr复合物的形成。一个靶序列可以包含任何多核苷酸,如dna或rna多核苷酸。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。在一些实施例中,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包括该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或ꢀ“编辑序列”。在本发明的方面,外源的模板多核苷酸可被称为编辑模板。在本发明的一个方面,该重组是同源重组。[0126]典型地,在内源crispr系统的背景下,crispr复合物(包含杂交到靶序列上并且与一种或多种cas蛋白复合的指导序列)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条链或两条链的切割。不希望受到理论的束缚,该tracr序列(其可以包含或其组成为野生型tracr序列的全部或部分(例如野生型tracr序列的约或多于约20、26、32、45、48、54、63、67、85个、或更多个核苷酸))也可以形成crispr复合物的一部分,如通过沿着该tracr序列的至少一部分杂交到与该指导序列可操作地连接的tracr配对序列的全部或部分上。在一些实施例中,该tracr序列与一个tracr配对序列具有足够的互补性以进行杂交,并参与一种crispr复合物的形成。至于该靶序列,据信不需要完全互补性,只要足以具备功能性。在一些实施例中,当进行最佳比对时,沿着该tracr配对序列的长度,该tracr序列具有至少50%、60%、70%、80%、90%、95%、或99%序列互补性。在一些实施例中,将驱动crispr系统的一个或多个元件的表达的一个或多个载体引入到宿主细胞中,使得该crispr系统的这些元件的表达在一个或多个靶位点指导crispr复合物的形成。例如,cas酶、连接到tracr配对序列上的指导序列、以及tracr序列可以各自可操作地连接到在分开的载体上的分开的调节元件上。可替代地,从相同或不同调节元件表达的二个或更多个元件可以结合在单个载体中,其中提供该crispr系统的任何组分的一个或多个另外的载体不包括在第一载体中。结合在单个载体中的crispr系统元件可以按照任何适合的取向排列,如一个元件相对于第二元件位于5’(“上游”)或3’(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的同一条链或相对链上,并且取向为相同或相对的方向。在一些实施例中,单个启动子驱动编码crispr酶的转录物以及该指导序列、tracr配对序列(任选地可操作地连接到该指导序列上)、和嵌入在一个或多个内含子序列之内(例如,各自在不同的内含子中,两个或更多个在至少一个内含子中,或者全部都在单个内含子中)的tracr序列中的一者或多者的表达。在一些实施例中,该crispr酶、指导序列、tracr配对序列、和tracr序列可操作地连接到相同的启动子上并且从其表达。[0127]在一些实施例中,一个载体包含一个或多个插入位点,如限制性核酸内切酶识别序列(也称为“克隆位点”)。在一些实施例中,一个或多个插入位点(例如,约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个插入位点)位于一个或多个载体的一个或多个序列元件的上游和/或下游。在一些实施例中,一个载体包含在tracr配对序列的上游、并且任选地在可操作地连接到该tracr配对序列上的调节元件的下游的插入位点,使得在将指导序列插入到该插入位点中之后并且在表达时该指导序列指导crispr复合物与真核细胞中的靶序列的序列特异性结合。在一些实施例中,一个载体包含一个或多个插入位点,每个插入位点位于两个tracr配对序列之间,从而允许在每个位点插入指导序列。在这样一种安排中,两个或更多个指导序列可以包含两个或更多个拷贝的单指导序列、两个或更多个不同的指导序列、或这些的组合。当使用多个不同的指导序列时,可以使用单个表达构建体使crispr活性靶向到细胞内的多个不同的相应靶序列。例如,单个载体可以包含约或多于约1、2、3、4、5、6、7、8、9、10、15、20个、或更多个指导序列。在一些实施例中,可以提供约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个这样的含有靶序列的载体,并且任选地将其递送到细胞中。[0128]在一些实施例中,一个载体包含可操作地连接到编码crispr酶(如cas蛋白)的酶编码序列上的调节元件。cas蛋白的非限制性实例包括:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8,cas9(也称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、其同系物、或其修饰形式。这些酶是已知的;例如,化脓链球菌cas9蛋白的氨基酸序列可见于swissprot数据库登录号q99zw2下。在一些实施例中,未修饰的crispr酶如cas9具有dna切割活性。在一些实施例中,该crispr酶是cas9,并且可以是来自化脓链球菌或肺炎链球菌的cas9。在一些实施例中,该crispr酶指导在靶序列位置处(例如在该靶序列之内和/或在该靶序列的互补物之内)的一条链或两条链的切割。在一些实施例中,该crispr酶指导距离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个、或更多个碱基对之内的一条链或两条链的切割。在一些实施例中,一个载体编码相对于相应的野生型酶被突变的crispr酶,使得该突变的crispr酶缺乏切割含有一个靶序列的靶多核苷酸的一条链和两条链的能力。例如,在来自化脓链球菌的cas9的ruvci催化结构域中的天冬氨酸到丙氨酸取代(d10a)将cas9从切割两条链的核酸酶转化成切口酶(切割单条链)。致使cas9为切口酶的其他突变实例包括而不限于h840a、n854a、和n863a。在一些实施例中,一种cas9切口酶可与一个或多个指导序列组合使用,例如,两个指导序列,其分别靶向该dna靶标的有义以及反义链。此组合允许两条链被切口并且用以诱导nhej。申请人已证明(数据未显示)两种切口酶靶标(即,在相同位置靶向dna的不同链的sgrna)在诱导诱变的nhej方面的效力。一种单切口酶(具有单个sgrna的cas9‑ꢀd10a)不能够诱导nhej并且建立indel(indel),但申请人已经显示,双切口酶(cas9-d10a以及在相同位置靶向不同链的两个sgrna)在人胚胎干细胞(hesc)中可以这样做。该效率在hesc中是约50%的核酸酶(即,不具有d10突变的常规cas9)。[0129]作为一个另外的实例,cas9的两个或更多个催化结构域(ruvci、ruvcii、和ruvciii)可以被突变为产生实质上缺乏所有dna切割活性的突变的cas9。在一些实施例中,d10a突变与h840a、n854a、或n863a突变的一者或多者相组合,以便产生实质上缺乏所有dna切割活性的cas9酶。在一些实施例中,当该突变的crispr酶的dna切割活性比它的非突变形式低约25%、10%、5%、1%、0.1%、0.01%、或更少时,则该酶被考虑为实质上缺乏所有dna切割活性。其他突变可能是有用的;其中cas9或其他crispr酶是来自除化脓链球菌外的物种,可产生相应氨基酸的突变以实现类似效果。[0130]在一些实施例中,编码crispr酶的酶编码序列经密码子优化,以便在特定的细胞如真核细胞中表达。这些真核细胞可以是特定生物的那些或来源于特定生物,如哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗、或非人类灵长动物。一般而言,密码子优化是指通过用在宿主细胞的基因中更频繁地或者最频繁地使用的密码子代替天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50个、或更多个密码子同时维持该天然氨基酸序列而修饰一个核酸序列以便增强在感兴趣宿主细胞中的表达的方法。不同的物种对于具有特定氨基酸的某些密码子展示出特定的偏好。密码子偏好性(在生物之间的密码子使用的差异)经常与信使rna(mrna)的翻译效率相关,而该翻译效率则被认为依赖于(除其他之外)被翻译的密码子的性质和特定的转运rna(trna)分子的可用性。细胞内选定的trna的优势一般反映了最频繁用于肽合成的密码子。因此,可以将基因定制为基于密码子优化在给定生物中的最佳基因表达。密码子利用率表可以容易地获得,例如在密码子使用数据库(“codonusagedatabase”)中,并且这些表可以通过不同的方式调整适用。参见,中村y.(nakamuray.)等人,“从国际dna序列数据库中制表的密码子使用:2000年的状态”ꢀ(codonusagetabulatedfromtheinternationaldnasequencedatabases:statusfortheyear2000)《核酸研究》(nucl.acidsres.)28:292(2000年)。用于密码子优化特定的数列以便在特定的宿主细胞中表达的计算机算法也是可得的,如基因制造(geneforge)(aptagen公司;雅各布斯(jacobus),pa),也是可得的。在一些实施例中,在编码crispr酶的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个、或更多个、或所有密码子)相应于对于特定氨基酸最频繁使用的密码子。[0131]在一些实施例中,一种载体编码包含一个或多个核定位序列(nls)如约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个nls的crispr酶。在一些实施例中,该crispr酶包含在或接近于氨基端的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个nls,在或接近于羧基端约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个nls,或这些的组合(例如在氨基端的一个或多个nls以及在羧基端的一个或多个nls)。当存在多于一个nls时,每一个可以被选择为不依赖于其他nls,使得在多于一个拷贝中可以存在单个nls和/或与在一个或多个拷贝中存在一个或多个其他nls相组合。在本发明的一个优选实施例中,该crispr酶包含至多6个nls。在一些实施例中,当nls的最近的氨基酸是在从n端或c端沿着该多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个、或更多个氨基酸之内时,nls可以被视为接近该n端或c端。典型地,nls由暴露于蛋白表面上的带正电的赖氨酸或精氨酸的一个或多个短序列组成,但其他类型的nls是已知的。nls的非限制性实例包括来源于以下项的nls序列:sv40病毒大t抗原的nls,其具有氨基酸序列pkkkrkv;来自核质蛋白的nls(例如,具有序列krpaatkkagqakkkk的核质蛋白二分nls);c-mycnls,其具有氨基酸序列paakrvkld或rqrrnelkrsp;hrnpa1m9nls,其具有序列nqssnfgpmkggnfggrssgpyggggqyfakprnqggy;来自输入蛋白-α的ibb结构域的序列rmrizfknkgkdtaelrrrrvevsvelrkakkdeqilkrrnv;肌瘤t蛋白的序列vsrkrprp和ppkkared;人p53的序列popkkkpl;小鼠c-abliv的序列salikkkkkmap;流感病毒ns1的序列drlrr和pkqkkrk;肝炎病毒δ抗原的序列rklkkkikkl;小鼠mx1蛋白的序列rekkkflkrr;人聚(adp-核糖)聚合酶的序列krkgdevdgvdevakkkskk;以及类固醇激素受体(人)糖皮质激素的序列rkclqagmnlearktkk。[0132]一般而言,该一个或多个nls具有足够的强度,以便在真核细胞的核中驱动该crispr复合物以可检测到的量积聚。一般而言,核定位活性的强度可以驱动在该crispr酶中的nls的数目、所使用的一个或多个特定的nls、或这些因素的组合。可以通过任何适合的技术进行细胞核中积聚的检测。例如,一种检测标记可以融合到crispr酶上,使得细胞内的位置可以被可视化,如与检测细胞核的位置的手段(例如,对于细胞核特异的染料,如dapi)相结合。可检测标记物的实例包括荧光蛋白(例如绿色荧光蛋白,或gfp;rfp;cfp),以及表位标签(ha标签,flag标签,snap标签)。还可以将细胞核从细胞中分离出来,然后可以通过任何适合的用于检测蛋白质的方法分析其内容物,如免疫组织化学、western印迹或酶活性测定。如通过测定crispr复合物形成的作用(例如,测定在靶序列处的dna切割或突变、或测定由于crispr复合物形成和/或crispr酶活性的影响而改变的基因表达活性),与没有暴露于crispr酶或复合物、或暴露于缺乏该一个或多个nls的crispr酶的对照相比较,还可以间接地确定细胞核中的积聚。[0133]一般而言,指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且指导crispr复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中,当使用适合的比对算法进行最佳比对是,在指导序列与其相应的靶序列之间的互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼(smith‑ꢀwaterman)算法、尼德曼-翁施(needleman-wunsch)算法、基于伯罗斯-惠勒变换(burrows-wheelertransform)的算法(例如伯罗斯-惠勒比对工具(burrowswheeleraligner))、clustalw、clustalx、blat、novoalign(novocraft技术公司)、eland(亿明达公司(illumina),圣地亚哥,加利福尼亚州)、soap(在soap.genomics.org.cn可获得)、以及maq(在maq.sourceforge.net可获得)。在一些实施例中,一个指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸。在一些实施例中,一个指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸。可以通过任何适合的测定法来评估指导序列指导crispr复合物与靶序列的序列特异性结合的能力。例如,足以形成crispr复合物的crispr系统的组分,包括有待测试的指导序列在内,可以例如通过用编码该crispr序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过如本文所述的测量员测定来评估在该靶序列之内的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的crispr复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处的结合或切割率,可以在一个试管中评估靶多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。[0134]一个指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在细胞的基因组内的序列。示例性靶序列包括在靶基因组中为独特的那些。例如,对于化脓链球菌cas9,在基因组中的独特靶序列可以包括形式mmmmmmmmnnnnnnnnnnnnxgg的cas9靶位点,其中nnnnnnnnnnnnxgg(n是a、g、t、或c;并且x可以是任何物)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式mmmmmmmmmnnnnnnnnnnnxgg的化脓链球菌cas9靶位点,其中nnnnnnnnnnnxgg(n是a、g、t、或c;并且x可以是任何物)在该基因组中单次出现。对于嗜热链球菌crispr1cas9,在基因组中的独特靶序列可以包括形式mmmmmmmmnnnnnnnnnnnnxxagaaw的cas9靶位点,其中nnnnnnnnnnnnxxagaaw(n是a、g、t、或c;x可以是任何物;并且w是a或t)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式mmmmmmmmmnnnnnnnnnnnxxagaaw的嗜热链球菌crispr1cas9靶位点,其中nnnnnnnnnnnxxagaaw(n是a、g、t、或c;x可以是任何物;并且w是a或t)在该基因组中单次出现。对于化脓链球菌cas9,在基因组中的独特靶序列可以包括形式mmmmmmmmnnnnnnnnnnnnxggxg的cas9靶位点,其中nnnnnnnnnnnnxggxg(n是a、g、t、或c;并且x可以是任何物)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式mmmmmmmmmnnnnnnnnnnnxggxg的化脓链球菌cas9靶位点,其中nnnnnnnnnnnxggxg(n是a、g、catgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaatttttt;(3)nnnnnnnnnnnnnnnnnnnngtttttgtactctcagaaatgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttttt;(4)nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt;(5)nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtgttttttt;以及(6)nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtccgttatcatttttttt。在一些实施例中,序列(1)到(3)与来自嗜热链球菌crispr1的cas9结合使用。在一些实施例中,序列(4)到(6)与来自化脓链球菌crispr1的cas9结合使用。在一些实施例中,该tracr序列是一个与包含该tracr配对序列的转录物分开的转录物(例如在图13b的顶部部分中所示的)。[0137]在一些实施例中,还提供了重组模板。重组模板可以是如本文所述的另一个载体的组分,其被包含在一个分开的载体中,或者被提供为一个分开的多核苷酸。在一些实施例中,重组模板被设计为用作在同源重组中的模板,如在被作为crispr复合物的一部分的crispr酶切开或切割的靶序列之内或在其附近。模板多核苷酸可以具有任何适合的长度,如约或多于约10、15、20、25、50、75、100、150、200、500、1000个、或更多个核苷酸长度。在一些实施例中,该模板多核苷酸与包含该靶序列的多核苷酸的一部分互补。当进行最佳比对时,模板多核苷酸能够与靶序列的一个或多个核苷酸(例如约或多于约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100个、或更多个核苷酸)重叠。在一些实施例中,当一个模板序列与包含靶序列的多核苷酸进行最佳比对时,该模板多核苷酸的最近的核苷酸在距离该靶序列的约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000个、或更多个核苷酸之内。[0138]在一些实施例中,该crispr酶是包含一个或多个异源蛋白结构域(例如除了该crispr酶之外的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个结构域)的融合蛋白的一部分。crispr酶融合蛋白可以包含任何其他蛋白质,以及任选地在任何两个结构域之间的连接序列。可以融合到crispr酶上的蛋白质结构域的实例包括但不限于,表位标签、报告基因序列、以及具有下列活性的一者或多者的蛋白质结构域:甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、rna切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(his)标签、v5标签、flag标签、流感病毒血凝素(ha)标签、myc标签、vsv-g标签、和硫氧还蛋白(trx)标签。报告基因的实例包括,但不限于,谷胱甘肽-s-转移酶(gst)、辣根过氧化物酶(hrp)、氯霉素乙酰转移酶(cat)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、萤光素酶、绿色荧光蛋白(gfp)、hcred、dsred、青荧光蛋白(cfp)、黄色荧光蛋白(yfp)、以包括蓝色荧光蛋白(bfp)的自发荧光蛋白。crispr酶可以融合到编码一种蛋白质或蛋白质片段的基因序列上,所述蛋白质或蛋白质片段结合dna分子或结合其他细胞分子,其包括,但不限于,麦芽糖结合蛋白(mbp)、s‑ꢀtag、lexadna结合结构域(dbd)融合物、gal4dna结合结构域融合物、以及单纯疱疹病毒(hsv)bp16蛋白融合物。可以形成包含crispr酶的融合蛋白的一部分的另外的结构域描述于us20110059502中,通过引用将其并入本文。在一些实施例中,使用标记的crispr酶来鉴定靶序列的位置。[0139]在一些方面,本发明提供了以下方法,这些方法包括向宿主细胞递送一个或多个多核苷酸,如或如在此描述的一个或多个载体、其一个或多个转录本和/或一个或自其转录的蛋白。在一些方面,本发明进一步提供了通过这样的方法产生的细胞以及包括这样的细胞或由这样的细胞产生的生物体(例如动物、植物、或真菌)。在一些实施例中,将与(并且任选地与其复合)指导序列组合的crispr酶递送至细胞。可以使用常规的病毒和非病毒基的基因转移方法将核酸引入哺乳动物细胞或靶组织中。可以使用这样的方法向培养物中或宿主生物中的细胞给予编码crispr系统的组分的核酸。非病毒载体递送系统包括dna质粒、rna(例如在此描述的载体的转录本)、裸核酸以及与递送赋形剂(如脂质体)复合的核酸。病毒载体递送系统包括dna和rna病毒,在被递送至细胞后它们具有游离型或整合型基因组。关于基因疗法程序的综述,参见安德森(anderson),《科学》(science)256:808-813(1992);纳贝尔(nabel)&费尔格纳(felgner),tibtech11:211-217(1993);三谷(mitani)&卡斯基(caskey),tibtech11:162‑ꢀ166(1993);狄龙(dillon),tibtech11:167-175(1993);米勒(miller),《自然》(nature)357:455-460(1992);范·布朗特(vanbrunt),《生物技术》(biotechnology)6(10):1149-1154(1988);维涅(vigne),《恢复神经学和神经科学》(restorativeneurologyandneuroscience)8:35-36(1995);克雷默(kremer)&佩里科德特(perricaudet),《英国医学公报》(britishmedicalbulletin)51(1):31-44(1995);哈嗒嗒(haddada)等人,在《微生物学和免疫学当前主题》(currenttopicsinmicrobiologyandimmunology)中多尔夫勒(doerfler)和博姆(编辑)(1995);以及余(yu)等人,《基因疗法》(genetherapy)1:13-26(1994)。[0140]核酸的非病毒递送方法包括脂转染、核转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸共轭物、裸dna、人工病毒体以及dna的试剂增强性摄取。脂转染描述于例如美国专利号5,049,386、4,946,787和4,897,355中并且脂转染试剂是市售的(例如,transfectamtm和lipofectintm)。适于多核苷酸的有效的受体识别脂转染的阳离子和中性脂质包括felgner(费尔格纳),wo91/17424;wo91/16024的那些。递送可以针对细胞(例如体外或离体给予)或靶组织(例如体内给予)。[0141]脂质:核酸复合物(包括靶向的脂质体,如免疫脂质复合物)的制备是本领域的技术人员熟知的(参见例如,克丽丝特尔(crystal),《科学》(science)270:404-410(1995);布莱泽(blaese)等人,《癌症基因疗法》(cancergenether.)2:291-297(1995);贝尔(behr)等人,《生物共轭化学》(bioconjugatechem.)5:382-389(1994);雷米(remy)等人,《生物共轭化学》5:647-654(1994);高(gao)等人,《基因疗法》(genetherapy)2:710-722(1995);艾哈迈德(ahmad)等人,《癌症研究》(cancerres.)52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及4,946,787)。[0142]使用rna或dna病毒基的系统递送核酸利用将病毒靶向体内的特定细胞并将病毒有效负荷(payload)运至细胞核中的高度进化的过程。可以将病毒载体直接给予至患者(体内)或可以使用它们在体外处理细胞,并且任选地,可以将修饰的细胞给予至患者(离体)。常规的病毒基的系统可以包括用于基因转移的逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体以及单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法整合进宿主基因组中是可能的,这通常导致插入转基因的长期表达。另外,已经在不同细胞类型和靶组织中观察到高转导效率。[0143]可以通过掺入外源包膜蛋白,扩展靶细胞的潜在靶群而改变逆转录病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并典型地产生较高病毒效价的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将依赖于靶组织。逆转录病毒载体由顺式作用长末端重复组成,这些长末端重复具有包装多达6-10kb的外源序列的能力。最低量的顺式作用ltr对于载体的复制和包装而言是足够的,然后使用这些载体将治疗基因整合进靶细胞中,以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(mulv)、长臂猿白血病病毒(galv)、猴免疫缺陷病毒(siv)、人类免疫缺陷病毒(hiv)及其组合的那些(参见例如,布赫谢尔(buchscher)等人,《病毒学杂志》(j.virol.)66:2731-2739(1992);约翰(johann)等人,《病毒学杂志》66:1635-1640(1992);佐姆内尔费尔特(sommnerfelt)等人,《病毒学》(virol.)176:58-59(1990);威尔逊(wilson)等人,《病毒学杂志》63:2374-2378(1989);米勒(miller)等人,《病毒学杂志》65:2220-2224(1991);pct/us94/05700)。在瞬时表达是优选的应用中,可以使用腺病毒基系统。腺病毒基载体在许多细胞类型中能够具有非常高的转导效并且无需细胞分裂。用这样的载体,已经获得了较高的效价和表达水平。可以在相对简单的系统中大量地产生此载体。还可以使用腺相关病毒(“aav”)载体转导具有靶核酸的细胞,例如,在体外产生核酸和肽,以及用于体内和离体基因疗法程序(参见例如,韦斯特(west)等人,《病毒学》(virology)160:38-47(1987);美国专利号4,797,368;wo93/24641;科丁(kotin),《人类基因疗法》(humangenetherapy)5:793-801(1994);缪斯科斯卡(muzyczka),《临床研究杂志》(j.clin.invest.)94:1351(1994))。重组aav载体的构建描述于多个出版物中,包括美国专利号5,173,414;特拉特斯金(tratschin)等人,《分子与细胞生物学》(mol.cell.biol.)5:3251-3260(1985);特拉特斯金等人,《分子与细胞生物学》4:2072-2081(1984);埃尔莫奈特(hermonat)&缪斯科斯卡(muzyczka),《美国国家科学院院刊》(pnas)81:6466-6470(1984);以及萨穆尔斯基(samulski)等人,《病毒学杂志》(j.virol.)63:03822-3828(1989)。[0144]典型地使用包装细胞形成能够感染宿主细胞的病毒粒子。这样的细胞包括包装腺病毒的293细胞和包含逆转录病毒的ψ2细胞或pa317细胞。在基因疗法中使用的病毒载体通常由将核酸载体包装进病毒粒子的细胞系产生。这些载体典型地包含包装并且随后整合进宿主所需的最低量序列,其他病毒序列由用于有待表达的一个或多个多核苷酸的表达盒替换。失去的病毒功能典型地由包装细胞系反式地提供。例如,在基因疗法中使用的aav载体典型地仅具有来自aav基因组的itr序列,这些序列为包装并整合进宿主基因组所需。将病毒dna包装进以下细胞系中,该细胞系包含编码辅助质粒的其他aav基因,即rep和cap,但缺少itr序列。该细胞系还可以被作为辅助者的腺病毒感染。该辅助病毒促进aav载体的复制和从辅助质粒表达aav基因。由于缺少itr序列,未以显著的量包装该辅助质粒。可以通过例如与aav相比腺病毒更加敏感的热处理减少腺病毒的污染。用于将核酸递送至细胞的另外的方法是本领域的技术人员已知的。参见例如通过引用结合在此的us20030087817。[0145]在一些实施例中,用一个或多个在此描述的载体瞬时地或非瞬时地转染宿主细胞。在一些实施例中,当细胞天然地出现在受试者体内时将其转染。在一些实施例中,被转染的细胞取自受试者。在一些实施例中,该细胞来源于取自受试者的细胞,如细胞系。用于组织培养的多种多样的细胞系在本领域是已知的。细胞系的实例包括但不限于,c8161、ccrf-cem、molt、mimcd-3、nhdf、hela-s3、huh1、huh4、huh7、huvec、hasmc、hekn、heka、miapacell、panc1、pc-3、tf1、ctll-2、c1r、rat6、cv1、rpte、a10、t24、j82、a375、arh-77、calu1、sw480、sw620、skov3、sk-ut、caco2、p388d1、sem-k2、wehi-231、hb56、tib55、jurkat、j45.01、lrmb、bcl-1、bc-3、ic21、dld2、raw264.7、nrk、nrk-52e、mrc5、mef、hepg2、海拉b、海拉t4、cos、cos‑ꢀ1、cos-6、cos-m6a、bs-c-1猴肾上皮细胞、balb/3t3小鼠胚胎成纤维细胞、3t3swiss、3t3-l1、132-d5人类胎儿成纤维细胞;10.1小鼠成纤维细胞、293-t、3t3、721、9l、a2780、a2780adr、a2780cis、a172、a20、a253、a431、a-549、alc、b16、b35、bcp-1细胞、beas-2b、bend.3、bhk-21、br293、bxpc3、c3h-10t1/2、c6/36、cal-27、cho、cho-7、cho-ir、cho-k1、cho-k2、cho-t、chodhfr-/-、cor-l23、cor‑ꢀl23/cpr、cor-l23/5010、cor-l23/r23、cos-7、cov-434、cmlt1、cmt、ct26、d17、dh82、du145、ducap、el4、em2、em3、emt6/ar1、emt6/ar10.0、fm3、h1299、h69、hb54、hb55、hca2、hek-293、hela、hepa1c1c7、hl-60、hmec、ht-29、jurkat、jy细胞、k562细胞、ku812、kcl22、kg1、kyo1、lncap、ma-mel1-48、mc‑ꢀ38、mcf-7、mcf-10a、mda-mb-231、mda-mb-468、mda-mb-435、mdckii、mdckii、mor/0.2r、mono-mac6、mtd-1a、myend、nci‑ꢀh69/cpr、nci-h69/lx10、nci-h69/lx20、nci-h69/lx4、nih-3t3、nalm-1、nw-145、opcn/opct细胞系、peer、pnt-1a/pnt2、renca、rin-5f、rma/rmas、saos-2细胞、sf-9、skbr3、t2、t-47d、t84、thp1细胞系、u373、u87、u937、vcap、维洛(vero)细胞、wm39、wt-49、x63、yac-1、yar及其转基因变种。细胞系可获得自本领域的技术人员已知的多种来源(参见例如,美国典型培养物保藏中心(americantypeculturecollection)(atcc)(马纳萨斯(manassus),弗吉尼亚州))。在一些实施例中,使用用一个或多个在此描述的载体转染的细胞建立新的细胞系,该新的细胞系包括一个或多个载体来源的序列。在一些实施例中,使用用如在此描述的crispr系统的组分转染(如通过用一个或多个载体进行瞬时转染或用rna进行转染)且通过crispr复合物的活性修饰的细胞建立新的细胞系,该新的细胞系包括以下细胞,这些细胞包含吸水但是缺少任何其他外源序列。在一些实施例中,在评估一种或多种测试化合物中使用用一个或多个在此描述的载体瞬时或非瞬时转染的细胞或来源于这样的细胞的细胞系。[0146]在一些实施例中,使用一个或多个在此描述的载体产生非人转基因动物或转基因植物。在一些实施例中,该转基因动物是一种哺乳动物,如小鼠、大鼠或兔。在某些实施例中,该生物体或受试者是植物。在某些实施例中,该生物体或受试者或植物是藻类。用于产生转基因植物和动物的方法在本领域是已知的,并且通常以如在此描述的细胞转染方法开始。[0147]在一个方面,本发明提供了用于修饰在一种真核细胞中的靶多核苷酸的方法。在一些实施例中,该方法包括允许一种crispr复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该crispr复合物包括与杂交到在所述靶多核苷酸内的一个靶序列上的指导序列复合的crispr酶,其中所述指导序列连接到一个tracr配对序列上,该tracr配对序列进而杂交到一个tracr序列上。[0148]在一个方面,本发明提供了修饰一种多核苷酸在真核细胞中的表达的方法。在一些实施例中,该方法包括允许一种crispr复合物结合到该多核苷酸上,使得所述结合导致所述多核苷酸表达增加或减少;其中该crispr复合物包含与杂交到在所述靶多核苷酸内的一个靶序列上的指导序列复合的crispr酶,其中所述指导序列连接到一个tracr配对序列上,该tracr配对序列进而杂交到一个tracr序列上。[0149]随着作物基因组学的最新进展,使用crispr-cas系统进行有效且符合成本效益的基因编辑和操纵的能力将允许快速筛选并比较单个和多元遗传操作,以转化这样的基因组,以便改善生产并增强性状。在此方面,参考美国专利和出版物:美国专利号6,603,061-农杆菌介导的植物转化法(agrobacterium-mediatedplanttransformationmethod);美国专利号7,868,149-植物基因组序列及其用途(plantgenomesequencesandusesthereof)以及us2009/0100536-转具有增强的农艺性状的基因植物(transgenicplantswithenhancedagronomictraits),将每者的所有内容和披露通过引用以其全文结合在此。在本发明的实践中,莫雷尔(morrell)等人ꢀ“作物基因组学:进展与应用(cropgenomics:advancesandapplications)”ꢀ《遗传学自然评论》(natrevgenet.)2011年12月29日;13(2):85-96的内容和披露也通过引用以其全文结合在此。在本发明的一个有利实施例中,该crispr/cas9系统被用以工程化微藻类(实例15)。因此,加上必要的变更,此处对动物细胞的提及也可适用植物细胞,除非另外是显然的。[0150]在一个方面,本发明提供了修饰真核细胞中的靶多核苷酸的方法,这些方法可以在体内、离体或在体外进行。在一些实施例中,该方法包括从人或非人动物或植物(包括微藻)取样细胞或细胞群,并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物或植物(包括微藻)中。[0151]在植物中,病原体常常是宿主特异性的。例如,番茄尖镰孢菌番茄专化型(fusariumoxysporumf.sp.lycopersici)引起番茄枯萎病,而且只攻击番茄,并且香石竹尖镰孢禾柄锈菌小麦专化型(f.oxysporumf.dianthiipucciniagraminisf.sp.tritici)只攻击小麦。植物具有抵抗大多数病原体的现有的和诱导性的防御。跨植物代的突变和重组事件导致产生敏感性的遗传变异性,特别是当病原体以比植物更高的频率繁殖时。在植物中可以存在非宿主抗性,例如,该宿主和病原体是不相容的。还可以存在水平抗性,例如典型地由许多基因控制的针对所有种的病原体的部分抗性,以及垂直抗性,例如典型地由很少的基因控制的针对病原体的某些种而不是其他种的完全抗性。在基因对基因水平中,植物和病原体一起演化,并且在一者中的遗传变化使在另一者中的变化平衡。因此,使用自然变异,育种者针对产率、质量、均匀性、耐性、抗性将最有用的基因进行结合。抗性基因的来源包括天然或外来品种、传家宝品种(heirloomvarieties)、近缘野生植物、以及诱导的突变,例如用诱变剂处理植物材料。利用本发明,向植物育种者提供了一种新的诱导突变的工具。因此,本领域的技术人员可以分析抗性基因的来源的基因组,并且在具有所希望的特征或性状的品种方面,采用本发明来诱导抗性基因的发生,这样具有比诱变剂更好的精确性,并且因此加速并改良植物育种计划。[0152]在一个方面,本发明提供了以下试剂盒,这些试剂盒包含披露于以上方法和组合物中的元件中的任何一个或多个。在一些实施例中,该试剂盒包括一种载体系统以及用于使用该试剂盒的说明书。在一些实施例中,该载体系统包括:(a)一个第一调节元件,该第一调节元件可操作地连接到一个tracr配对序列以及用于在该tracr配对序列的上游插入一个指导序列的一个或多个插入位点,其中当表达时,该指导序列引导crispr复合物在真核细胞中与一个靶序列的序列特异性结合,其中该crispr复合物包括与以下各项复合的一种crispr酶:(1)杂交到该靶序列的指导序列,以及(2)杂交到该tracr序列的tracr配对序列;和/或(b)一个第二调节元件,该第二调节元件可操作地连接到包括一个核定位序列的编码所述crispr酶的酶编码序列。元件可以单独地或组合地提供,并且可以被提供于任何适合的容器中,如小瓶、瓶子或管。在一些实施例中,该试剂盒包括一种或多种语言,例如多于一种语言的说明书。[0153]在一些实施例中,试剂盒包括一种或多种用于在利用在此描述的元件中的一种或多种的方法中使用的试剂。试剂可以被提供于任何适合的容器中。例如,试剂盒可以提供一种或多种反应或存储缓冲液。可以按在具体测定中可用的形式或按在使用之前需要添加一种或多种其他组分的形式(例如按浓缩或冻干形式)提供试剂。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、tris缓冲液、mops缓冲液、hepes缓冲液及其组合。在一些实施例中,该缓冲液是碱性的。在一些实施例中,该缓冲液具有从约7至约10的ph。在一些实施例中,该试剂盒包括一个或多个寡核苷酸,该一个或多个寡核苷酸对应于一个用于插入进载体中的指导序列,以便可操作地连接该指导序列和一个调节元件。在一些实施例中,该试剂盒包括一个同源重组模板多核苷酸。[0154]在一个方面,本发明提供了用于使用crispr系统的一个或多个元件的方法。本发明的crispr复合物提供了用于修饰靶多核苷酸的有效手段。本发明的crispr复合物具有多种多样的实用性,包括修饰(例如,缺失、插入、转位、失活、激活)多种细胞类型中的靶多核苷酸。正因为如此,本发明的crispr复合物在例如基因疗法、药物筛选、疾病诊断以及预后中具有广阔的应用谱。示例性crispr复合物包括与一个指导序列复合的crispr酶,该指导序列与靶多核苷酸内的靶序列杂交。该指导序列与tracr配对序列连接,该tracr配对序列进而与一个tracr序列杂交。[0155]crispr复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用dna)。不希不希望被理论所束缚,据信该靶序列应该与pam(原型间隔子相邻基序)相关;也就是说,由crispr复合物识别的短序列相关。对pam的精确序列和长度要求取决于使用的crispr酶而不同,但是pam典型地是临近原型间隔子(也就是说,靶序列)的2-5个碱基对序列。在以下实例部分中给出pam序列的实例,并且熟练人员将能够鉴定与给定的crispr酶一起使用的另外的pam序列。[0156]crispr复合物的靶多核苷酸可以包括多个疾病相关基因和多核苷酸以及信号传导生化途径相基因和多核苷酸,如分别提交于2012年12月12日和2013年1月2日、标题均为“用于序列操纵的系统方法和组合物”ꢀ(systemsmethodsandcompositionsforsequencemanipulation)的分别具有博德参考号bi-2011/008/wsgr案卷号44063‑ꢀ701.101和bi-2011/008/wsgr案卷号44063-701.102的美国临时专利申请61/736,527和61/748,427中所列举,将所有这些申请的内容通过引用以其全文结合在此。[0157]靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是一个以异常高的水平被表达的基因;它可以是一个以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。[0158]疾病相关基因和多核苷酸的实例可获得自约翰斯·霍普金斯大学的麦考斯克-纳森遗传医学研究所(mckusick-nathansinstituteofgeneticmedicine,johnshopkinsuniversity)(巴尔的摩,马里兰州)和国立医学图书馆的国家生物技术信息中心(nationalcenterforbiotechnologyinformation,nationallibraryofmedicine)(贝塞斯达,马里兰州)。[0159]疾病相关基因和多核苷酸的实例列于表a和b中。在万维网上可获得的疾病具体信息可获得自约翰斯·霍普金斯大学的麦考斯克-纳森遗传医学研究所(mckusick-nathansinstituteofgeneticmedicine,johnshopkinsuniversity)(巴尔的摩,马里兰州)和国立医学图书馆的国家生物技术信息中心(nationalcenterforbiotechnologyinformation,nationallibraryofmedicine)(贝塞斯达,马里兰州)。信号传导生化途径相关基因和多核苷酸的实例列于表c中。[0160]这些基因和途径的突变可以导致产生不当的蛋白质或以不当的量影响功能的蛋白质。通过引用而特此结合来自于2012年12月12日提交的美国临时申请61/736,527和2013年2月2日提交的61/748,427的基因、疾病和蛋白质的另外的实例。这样的基因、蛋白质和途径可以是crispr复合物的靶多核苷酸。表a表b:表c:[0161]本发明的实施例还涉及与敲除基因、扩增基因以及修复与dna重复不稳定性和神经障碍相关的具体突变有关的方法和组合物(罗伯特d.·威尔斯(robertd.wells)、芦沢哲夫(tetsuoashizawa),遗传不稳定性与神经疾病(geneticinstabilitiesandneurologicaldiseases),第二版,学术出版社(academicpress),2011年10月13日-《医学》(medical))。已经发现串联重复序列的特定方面对超过二十种人类疾病负责(重复不稳定新见:rna·dna杂交体的作用(newinsightsintorepeatinstability:roleofrna·dnahybrids),麦基弗ei(mcivorei)、波拉克u(polaku)、纳皮尔拉拉m(napieralam),《rna生物学》(rnabiol.)2010年9月-10月;7(5):551-8)。可以利用crispr-cas系统修正基因组不稳定性缺陷。[0162]本发明的一个另外的方面涉及利用crispr-cas系统修正emp2a和emp2b基因缺陷,这些基因已经被鉴定为与拉福拉病(laforadisease)相关。拉福拉病是一种由可以作为青年期的癫痫发作而开始的进行性肌阵挛性癫痫表征的常染色体隐性病症。该疾病的少数病可以由尚未鉴定的基因的突变引起。该疾病引起发作、肌肉痉挛、行走困难、痴呆,并且最终引起死亡。当前没有疗法被证明有效对抗疾病进展。与癫痫相关的其他遗传异常还可以靶向crispr-cas系统并且基础遗传学进一步描述于由朱利亚诺阿文济尼(giulianoavanzini)、杰弗里l.诺贝尔斯(jeffreyl.noebels)编辑的《癫痫与遗传癫痫遗传学》(geneticsofepilepsyandgeneticepilepsies),马里亚尼儿科神经学基金会(marianifoundationpaediatricneurology):20;2009)中。[0163]在本发明的又另一个方面,该crispr-cas系统可以用来矫正几种基因突变引起的眼部缺陷,其进一步描述于《眼的遗传疾病》(geneticdiseasesoftheeye),第二次编辑,由伊莱亚斯(elias)i.特拉布勒西(traboulsi)编辑,牛津大学出版社,2012年。[0164]本发明的若干另外的方面涉及修正与范围广泛的遗传性疾病相关的缺陷,这些遗传性疾病在专题小节遗传性障碍(geneticdisorders)下被进一步描述于国立卫生研究院的网站(网址为health.nih.gov/topic/geneticdisorders)。遗传性脑病可以包括但不限于,肾上腺脑白质营养不良、胼胝体发育不全、艾卡尔迪综合征(aicardisyndrome)、阿尔佩斯病(alpers'disease)、阿尔茨海默病、巴特综合征(barthsyndrome)、巴藤病(battendisease)、cadasil、小脑变性、费波瑞病(fabry'sdisease)、格斯特曼-施特劳斯纳病(gerstmann-straussler‑ꢀscheinkerdisease)、亨廷顿病以及其他三联体重复障碍、莱氏病(leigh'sdisease)、莱施-奈恩综合征、门克斯病、线粒体肌病以及ninds空洞脑(colpocephaly)。这些疾病在小节遗传性脑部障碍(geneticbraindisorders)下被进一步描述于国立卫生研究院的网站。[0165]在一些实施例中,该病症可以是瘤形成。在一些实施例中,在该病症是瘤形成的情况下,有待被靶向的基因是列于表a中的那些基因中的任一种(在这种情况下是pten等)。在一些实施例中,该病症可以是年龄相关性黄斑变性。在一些实施例中,该病症可以是一种精神分裂症障碍。在一些实施例中,该病症可以是一种三核苷酸重复障碍。在一些实施例中,该病症可以是脆性x综合征。在一些实施例中,该病症可以是一种分泌酶相关障碍。在一些实施例中,该病症可以是一种朊病毒相关障碍。在一些实施例中,该病症可以是als。在一些实施例中,该病症可以是一种药物成瘾。在一些实施例中,该病症可以是自闭症。在一些实施例中,该病症可以是阿尔茨海默病。在一些实施例中,该病症可以是炎症。在一些实施例中,该病症可以是帕金森病。[0166]与帕金森病相关的蛋白质的实例包括但不限于α-突触核蛋白、dj‑ꢀ1、lrrk2、pink1、帕金蛋白、uchl1、synphilin-1以及nurr1。[0167]成瘾相关的蛋白质的实例可以包括例如abat。[0168]炎症相关蛋白的实例可以包括例如由ccr2基因编码的单核细胞趋化蛋白-1(mcp1)、由ccr5基因编码的c-c趋化因子受体类型5(ccr5)、由fcgr2b基因编码的igg受体iib(fcgr2b,亦称cd32)或由fcer1g基因编码的fcεr1g(fcer1g)蛋白。[0169]心血管疾病相关蛋白的实例可以包括例如il1b(白介素1,β)、xdh(黄嘌呤脱氢酶)、tp53(肿瘤蛋白p53)、ptgis(前列腺素i2(前列腺环素)合酶)、mb(肌红蛋白)、il4(白介素4)、angpt1(血管生成素1)、abcg8(atp-结合盒,亚家族g(white),成员8)或ctsk(组织蛋白酶k)。[0170]阿尔茨海默病相关蛋白的实例可以包括例如由vldlr基因编码的极低密度脂蛋白受体蛋白(vldlr)、由uba1基因编码的泛素样改性剂激活酶1(uba1)或由uba3基因编码的nedd8-激活酶e1催化亚基蛋白(ube1c)。[0171]自闭症谱系障碍相关蛋白的实例可以包括例如由bzrap1基因编码的苯二氮卓受体(外周)相关蛋白1(bzrap1)、由aff2基因编码的af4/fmr2家族成员2蛋白(aff2)(亦称mfr2)、由fxr1基因编码的脆性x智力迟钝常染色体同系物1蛋白(fxr1)或由fxr2基因编码的脆性x智力迟钝常染色体同系物2蛋白(fxr2)。[0172]黄斑变性相关蛋白的实例可以包括例如由abcr基因编码的atp‑ꢀ结合盒,亚家族a(abc1)成员4蛋白(abca4)、由apoe基因编码的载脂蛋白e蛋白(apoe)或由ccl2基因编码的趋化因子(c-c基序)配体2蛋白(ccl2)。[0173]精神分裂症相关蛋白的实例可以包括nrg1、erbb4、cplx1、tph1、tph2、nrxn1、gsk3a、bdnf、disc1、gsk3b及其组合。syndrome);mapt相关障碍;遗传性朊病毒病;德拉韦综合征(dravetsyndrome);早期发病家族性阿尔茨海默病;弗里德赖希共济失调[frda];多发性畸形;岩藻糖苷贮积症;福山(fukuyama)先天性肌营养不良;半乳糖唾液酸贮积症;戈谢病(gaucherdisease);有机酸血症;噬血细胞淋巴组织细胞增生症;早衰症;粘脂贮积症ii;婴儿游离唾液酸贮积病;pla2g6相关神经变性;耶韦尔和朗格-尼尔森综合征(jervellandlange-nielsensyndrome);结合性大疱性表皮松解;亨廷顿病;克拉伯病(krabbedisease)(婴儿的);线粒体dna相关雷吉综合征(mitochondrialdna-associatedleighsyndrome)和narp;莱施-奈恩综合征;lis1相关无脑回;洛氏综合征(lowesyndrome);槭糖尿病;mecp2复制综合征;atp7a相关铜转运障碍;lama2相关肌营养不良;芳基硫酸酯酶a缺乏;i、ii或iii型粘多糖贮积症;过氧化物酶体生物发生障碍,齐薇格谱系综合征(zellwegersyndromespectrum);伴随脑铁累积障碍的神经变性;酸性鞘磷脂酶缺乏;c型尼曼-皮克病;甘氨酸脑病;arx相关障碍;尿素循环障碍;col1a1/2相关成骨不全;线粒体dna缺失综合征;plp1相关障碍;佩里综合征(perrysyndrome);费伦-麦克德米德综合征(phelan-mcdermidsyndrome);ii型糖原贮积症(蓬佩病(pompedisease))(婴儿的);mapt相关障碍;mecp2相关障碍;1型肢近端型点状软骨发育不全(rhizomelicchondrodysplasiapunctatatype1);罗伯茨综合征(robertssyndrome);桑德霍夫病(sandhoffdisease);辛德勒病(schindlerdisease)-1型;腺苷脱氨酶缺乏;史-伦-奥三氏综合征;脊髓性肌萎缩;婴儿发病脊髓小脑性共济失调;己糖胺酶a缺乏;1型致死性发育不良;胶原vi型相关障碍;i型乌谢尔综合征(ushersyndrome);先天性肌营养不良;沃尔夫-赫奇霍恩综合征(wolf-hirschhornsyndrome);溶酶体酸脂酶缺乏;以及着色性干皮病。[0184]如将是显而易见的,设想的是可以使用本发明系统靶向任何感兴趣的多核苷酸序列。使用本发明系统进行治疗可能是有用的病症或疾病的一些实例被包括在上表中并且当前与那些病症相关的基因的实例也被提供于此。然而,示例的基因并不是穷尽性的。实例[0185]以下实例出于说明本发明的不同实施例的目的而给出并且并不意在以任何方式限制本发明。本发明实例连同在此描述的方法目前代表优选的实施例,是示例性的,并且并不旨在限制本发明的范围。涵盖在如由权利要求书的范围所定义的本发明的精神内的在此的变化以及其他用途是本领域普通技术人员可以想到的。实例1:真核细胞的细胞核中的crispr复合物活性[0186]一个示例性ii型crispr系统是来自化脓链球菌sf370的ii型crispr座位,该座位包含四个基因cas9、cas1、cas2和csn1的聚簇以及两个非编码rna元件tracrrna和由非重复序列的短段(间隔子,每个约30bp)间隔开的重复序列(同向重复)的特征性阵列。在此系统中,以四个连续步骤产生靶向的dna双链断裂(dsb)(图2a)。第一步,从crispr座位转录两个非编码rna、前-crrna阵列和tracrrna。第二步,将tracrrna杂交到前-crrna的同向重复上,然后将其加工成含有单独的间隔子序列的成熟crrna。第三步,该成熟crrna:tracrrna复合物经由在crrna的间隔子区与原型间隔子dna之间形成异源双链体而将cas9指向由原型间隔子和对应的pam组成的dna靶标。最后,cas9介导pam上游的靶dna的切割,以在原型间隔子内产生一个dsb(图2a)。此实例描述了一种用于将此rna可编程的核酸酶系统适配成指导真核细胞的细胞核中的crispr复合物活性的示例性过程。[0187]细胞培养和转染[0188]在37℃下,伴随5%co2孵育,将人类胚肾(hek)细胞系hek293ft(生命技术公司)维持在补充有10%胎牛血清(海可隆公司(hyclone))、2mmglutamax(生命技术公司)、100u/ml青霉素及100μg/ml链霉素的杜尔贝科改良伊格尔培养基(dulbecco’smodifiedeagle’smedium)(dmem)中。在37℃下,在5%co2下,用补充有5%胎牛血清(海可隆公司)、2mmglutamax(生命技术公司)、100u/ml青霉素及100μg/ml链霉素的dmem维持小鼠neuro2a(n2a)细胞系(atcc)。[0189]在转染前一天,将hek293ft或n2a细胞以200,000个细胞/孔的密度接种到24孔板(康宁公司(corning))中。遵循制造商推荐的方案,使用lipofectamine2000(生命技术公司)转染细胞。对于24孔板的每个孔,使用总共800ng的质粒。[0190]基因组修饰的surveyor测定和测序分析[0191]如上所述,用质粒dna转染hek293ft或n2a细胞。转染后,在基因组dna提取之前,将细胞在37℃下孵育72小时。遵循制造商的方案,使用quickextractdna提取试剂盒(epicentre)提取基因组dna。简言之,将细胞重悬于quickextract溶液中并在65℃下孵育15分钟并且在98℃下孵育10分钟。将提取的基因组dna立即加工或存储在-20℃下。[0192]对于每个基因而言,pcr扩增围绕crispr靶位点的基因组区域,并且遵循制造商的方案,使用qiaquickspin柱(凯杰公司(qiagen))纯化产物。将总共400ng的纯化的pcr产物与2μl10xtaq聚合酶pcr缓冲液(enzymatics公司)和超纯水混合,至终体积为20μl,并使其经受重退火过程,以使得可以形成异源双链体:95℃持续10min,以-2℃/s95℃降至85℃,以-0.25℃/s85℃降至25℃,并且在25℃保持1分钟。重退火后,遵循制造商推荐的方案,将产物用surveyor核酸酶和surveyor增强子s(转基因组学公司(transgenomics))处理,并且在4%-20%novextbe聚丙烯酰胺凝胶(生命技术公司)上进行分析。将凝胶用sybrgolddna染色剂(生命技术公司)染色30分钟并用geldoc凝胶成像系统(伯乐公司(bio‑ꢀrad))成像。定量是基于作为切割的dna的部分的量度的相对条带强度。图8提供了此surveyor测定的一个示意图。[0193]用于检测同源重组的限制性片段长度多态性测定[0194]将hek293ft和n2a细胞用质粒dna转染,并且如上所述,在基因组dna提取之前,将其在37℃下孵育72小时。使用引物在同源重组(hr)模板的同源臂外pcr扩增靶基因组区域。将pcr产物分离在1%琼脂糖凝胶上并用minelutegelextraction试剂盒(凯杰公司)提取。将纯化产物用hindiii(费尔芒斯公司(fermentas))消化并在6%novextbe聚丙烯酰胺凝胶(生命技术公司)上进行分析。[0195]rna二级结构预测和分析[0196]使用质心结构预测算法,使用由维也纳大(universityofvienna)的理论化学研究所(institutefortheoreticalchemistry)研发的在线网络服务器rnafold进行rna二级结构预测(参见例如a.r.格鲁伯(a.r.gruber)等人,2008,《细胞》(cell)106(1):23-24;以及pa卡尔(pacarr)和gm丘奇(gmchurch),2009,《自然生物技术》(naturebiotechnology)27(12):1151-62)。[0197]细菌性质粒转化干扰测定[0198]使用pcrispr质粒在大肠杆菌中重组足以用于crispr活性的化脓链球菌crispr座位1的元件(示意性地说明于图10a中)。pcrispr包含tracrrna、spcas9、以及驱动crrna阵列的一个前导子序列。使用退火的寡核苷酸,间隔子(也称为“指导序列”)被插入至该crrna阵列中bsai位点之间,如所示的。在干扰测定中使用的激发质粒是通过如下构建的,将原型间隔子序列(也称为“靶序列”)连同一个邻近的crispr基序序列(pam)插入至puc19中(参见图10b)。该激发质粒包含氨苄青霉素抗性。图10c提供该干扰测定的示意性表示。将已携带pcrispr以及适合的间隔子的化学感受态的大肠杆菌菌株用包含相应的原型间隔子-pam序列的激发质粒进行转化。puc19被用以评估每个携带pcrispr的感受态菌株的转化率。crispr活性导致携带该原型间隔子ppsp质粒的切割(排除另外由缺少该原型间隔子的puc19赋予的氨苄青霉素抗性)。图10d示出在图4c中所示的测定中使用的每个携带pcrispr的大肠杆菌菌株的感受态。[0199]rna纯化[0200]将hek293ft细胞如上所述地维持和转染。通过胰酶消化收获细胞,随后在磷酸盐缓冲生理盐水(pbs)中洗涤。遵循制造商的方案,用tri试剂(西格玛公司)提取总细胞rna。使用naonodrop(赛默飞世尔科技公司(thermoscientific))对提取的总rna进行定量并标准化至同一浓度。[0201]哺乳动物细胞中的crrna和tracrrna表达的northern印迹分析[0202]将rna与等体积的2x加样缓冲液(ambion)混合,加热至95℃持续5min,在冰上冷冻1min,并且然后在将凝胶预跑胶至少30分钟后,加样到8%变性聚丙烯酰胺凝胶(sequagel,国立诊断公司(nationaldiagnostics))上。将样品以40w极限电泳1.5小时。之后,在室温下,将rna转移到半干转移设备(伯乐公司(bio-rad))中的300ma的hybondn 膜(通用电气医疗公司(gehealthcare))上,持续1.5小时。使用stratageneuvcrosslinkerthestratalinker(stratagene)上的自动交联按钮将rna交联到该膜上。在42℃下,伴随旋转,将该膜在ultrahyb-oligo杂交缓冲液(ambion)中预杂交30min,并且然后添加探针并杂交过夜。探针订购自idt并将其用具有t4多核苷酸激酶(新英格兰生物实验室(newenglandbiolabs)))的[γ-32p]atp(珀金埃尔默公司)标记。将该膜用预加温的(42℃)2xssc、0.5%sds洗涤一次,持续1min,随后在42℃下洗涤两次,每次持续30分钟。将该膜在室温下向荧光屏暴露一小时或过夜并且然后用感光成像仪(typhoon)扫描。[0203]细菌crispr系统构建和评价[0204]从具有用于吉布森拼接(gibsonassembly)的侧翼同源臂的化脓链球菌sf370基因组dnapcr扩增crispr座位元件(包括tracrrna、cas9和前导子)。将两个bsai类型iis位点引入在两个同向重复之间,以促进间隔子的方便插入(图9)。使用gibsonassemblymastermix(neb)将pcr产物克隆进ecorv-消化的pacyc184中,在tet启动子的下游。省略其他内源crispr系统元件,csn2的最后50bp除外。将编码具有互补突出端的间隔子的寡聚物(整合dna技术公司(integrateddnatechnology))克隆进bsai-消化的载体pdc000(neb)中并且然后用t7连接酶(enzymatics公司)连接,以产生pcrispr质粒。通过将携带兼容的突出端的杂交的寡核苷酸(整合dna技术公司)连接至bamhi消化的puc19中来产生包含间隔子(携带有pam序列(此处也称为“crispr基序序列”))的激发质粒。所有构建体的克隆都是在大肠杆菌菌株jm109(zymo研究公司)中进行。[0205]根据制造商说明,使用z-感受态大肠杆菌转化试剂盒以及缓冲液套组(zymo研究公司,t3001)使携带pcrispr的细胞变为感受态。在该转化测定中,将50ul等分试样的、携带pcrispr的感受态细胞在冰上解冻并且用1ng的间隔子质粒或puc19在冰上转化30分钟,随后在42℃下热激45秒并且在冰上热激2分钟。接着,添加250ulsoc(英杰公司(invitrogen)),随后在37℃摇动孵育1小时,并且将100ul的soc后生成物铺板于双筛选板(12.5ug/ml氯霉素,100ug/ml氨苄西林)上。为了获得cfu/ng的dna,总菌落数目乘以3。[0206]为了改进crispr组分在哺乳动物细胞中的表达,来自化脓链球菌(streptococcuspyogenes/s.pyogenes)的sf370基因座1的两个基因是密码子优化的cas9(spcas9)以及rna酶iii(sprna酶iii)。为了促进核定位,在spcas9以及sprna酶iii两者的氨基(n)-或羧基(c)-末端包括一个核定位信号(nls)(图2b)。为了促进蛋白表达的可视化,在两种蛋白的n‑ꢀ或c-末端也包括一种荧光蛋白标记物(图2b)。也产生了具有附接至n-以及c-末端(2xnls-spcas9)两者的nls的一个版本的spcas9。将包含nls融合的spcas9以及sprna酶iii的构建体转染至293ft人胚肾(hek)细胞中,并且发现该nls与spcas9以及sprna酶iii的相对定位影响其核定位效率。而该c-末端nls足以将sprna酶iii靶向该细胞核,在此系统中,单拷贝的这些具体的nls与spcas9的n-或c-末端的附接不能够实现充分的核定位。在此实例中,该c-末端nls是核质蛋白(krpaatkkagqakkkk)的c-末端nls,并且该c-末端nls是sv40大型t-抗原(pkkkrkv)的c-末端nls。在测试的该版本的spcas9中,仅2xnls-spcas9展现核定位(图2b)。[0207]来自化脓链球菌sf370的crispr座位的tracrrna具有两个转录起始位点,导致两种转录物,89-核苷酸(nt)以及171nt,这两种转录物随后被加工成相同的75nt成熟tracrrna。选择较短的89nttracrrna用于在哺乳动物细胞中表达(图7a中所示出的表达构建体,其中功能性是如显示于图7b中的surveyor测定的结果所确定的)。将转录起始位点标为 1,并且还指示了转录终止子和通过northern印迹探测的序列。还通过northern印迹确认了加工的tracrrna的表达。图7c显示了提取自293ft细胞的总rna的northern印迹分析的结果,用携带长或短tracrrna以及spcas9和dr‑ꢀemx1(1)-dr的u6表达构建体转染这些细胞。左图和右图分别是来自用或没用sprna酶iii转染的293ft细胞。u6指示用靶向人类u6snrna的探针进行印迹的加样对照。短tracrrna表达构建体的转染产生丰富水平的加工形式的tracrrna(约75bp)。在northern印迹上检测极低量的长tracrrna。[0208]为了促进转录精确起始,选择rna聚合酶iii基的u6启动子,以驱动tracrrna的表达(图2c)。类似地,研发u6启动子基的构建体,以表达包含侧翼为两个同向重复(dr,还被术语“tracr配对序列”所涵盖;图2c)的单个间隔子的前-crrna阵列。将起始间隔子设计成靶向人emx1座位(图2c)中的33-碱基对(bp)靶位点(满足cas9的ngg识别基序的30-bp原型间隔子加3-bpcrispr基序(pam)序列),该座位是大脑皮层的发育中的一个关键基因。[0209]为了测试crispr系统(spcas9、sprna酶iii、tracrrna以及前‑ꢀcrrna)在哺乳动物细胞中的异源表达是否可以实现哺乳动物染色体的靶向切割,用crispr组分的组合转染hek293ft细胞。由于哺乳动物细胞核中的dsb通过导致形成indel的非同源末端连接(nhej)途径而部分地修复,使用surveyor测定检测靶emx1座位处的潜在的切割活性(图8)(参见例如格斯钦(guschin)等人,2010,《分子生物学方法》(methodsmolbiol)649:247)。所有四种crispr组分的共转染能够在原型间隔子中诱导高达5.0%切割(参见图2d)。所有crispr组分(减去sprna酶iii)的共转染在原型间隔子中也诱导高达4.7%indel,表明可能存在能够辅助crrna成熟的内源性哺乳动物rna酶,如例如相关的切丁酶(dicer)和drosha酶。除去剩余的三种组分中的任何组分消除crispr系统的基因组切割活性(图2d)。包含已证实切割活性的靶座位的扩增子的桑格测序:在43个测序的克隆中,发现5个突变的等位基因(11.6%)。使用多种指导序列的类似实验产生了高达29%的indel百分比(参见图4-7、12和13)。这些结果定义了一种在哺乳动物细胞中的有效的crispr介导的基因组修饰的三组分系统。为了优化切割效率,申请人还测试了tracrrna的不同亚型是否影响切割效率并且发现,在实例系统中,仅仅短(89-bp)转录本形式能够介导人类emx1基因组座位的切割(图7b)。[0210]图14提供了哺乳动物细胞中的crrna加工的另外的northern印迹分析。图14a示出了一个示意图,显示了侧翼为两个同向重复(dr‑ꢀemx1(1)-dr)的单个间隔子的表达载体。靶向人emx1座位原型间隔子1(参见图6)的30bp间隔子和同向重复序列显示于图14a下方的序列中。直线指示其反向互补系列用于产生供emx1(1)crrna检测用的northern印迹探针的区域。图14b显示了提取自293ft细胞的总rna的northern印迹分析,用携带dr-emx1(1)-dr的u6表达构建体转染这些细胞。左图和右图分别是来自使用或未使用sprna酶iii转染的293ft细胞。dr-emx1(1)-dr仅在存在spcas9和短tracrrna的情况下被加工为成熟crrna并且不依赖于sprna酶iii的存在。检测的来自转染的293ft总rna的成熟crrna是约33bp并且比来自化脓链球菌的39-42bp成熟crrna短。这些结果证明,crispr系统可以被移植进真核细胞中并被重新编程,以促进内源哺乳动物靶多核苷酸的切割。[0211]图2示出了描述于此实例中的细菌crispr系统。图2a示出了一个示意图,显示了来自化脓链球菌sf370的crispr座位和通过此系统crispr介导的dna切割的建议机制。加工自同向重复-间隔子阵列的成熟crrna指导cas9到以下基因组靶标,这些靶标由互补原型间隔子和原型间隔子相邻基序(pam)组成。靶标-间隔子碱基配对后,cas9介导靶dna中的双链断裂。图2b示出了具有使得导入到哺乳动物细胞核中成为可能的核定位信号(nls)的化脓链球菌cas9(spcas9)和rna酶iii(sprna酶iii)的工程化。图2c示出了由组成型ef1a启动子驱动的spcas9和sprna酶iii以及由rnapol3启动子u6驱动的tracrrna和前-crrna阵列(dr-间隔子‑ꢀdr)的哺乳动物表达,上述启动子促进转录精确起始和终止。将来自具有令人满意的pam序列的人emx1座位的原型间隔子用作前-crrna阵列中的间隔子。图2d示出了spcas9介导的次要插入和缺失的surveyor核酸酶测定。使用和不使用sprna酶iii、tracrrna以及携带emx1-靶间隔子的前-crrna阵列表达spcas9。图2e示出了靶座位与emx1-靶向crrna之间的碱基配对的一个示意表示以及一个显示了与spcas9切割位点邻近的微小缺失的示例性色谱图。图2f示出了从43个克隆扩增子的测序分析鉴定出的突变的等位基因,这些扩增子显示出多种微小插入和缺失。破折号指示缺失的碱基,并且非比对或错配碱基指示插入或突变。比例尺=10μm。[0212]为了进一步简化该三组分系统,改编嵌合的crrna-tracrrna杂交体设计,其中成熟crrna(包括一个指导序列)经由茎-环而融合到部分tracrrna上,以模拟天然的crrna:tracrrna双链体(图3a)。为了增加共递送效率,产生双顺反子表达载体,以驱动嵌合rna和spcas9在转染细胞中的共表达(图3a和8)。平行地,使用该双顺反子载体表达前-crrna(dr-指导序列-dr)与spcas9,以诱导用分开表达的tracrrna加工为crrna(比较图13b的顶图和底图)。图9提供了前-crrna阵列(图9a)或嵌合的crrna(由图9b中的指导序列插入位点的下游和ef1α启动子的上游的短线表示)与hspcas9的双顺反子表达载体的示意图,显示了各种元件的位置和指导序列插入点。图9b中的围绕指导序列插入位点的位置的展开的序列还显示了部分dr序列(gtttagagcta)和部分tracrrna序列(tagcaagttaaaataaggctagtccgttttt)。可以使用退火的寡核苷酸将指导序列插入在bbsi位点之间。寡核苷酸的序列设计显示在图9中的示意图的下方,其中指示了适当的连接适配子。wpre表示土拨鼠肝炎病毒转录后调节元件。通过靶向与上述相同的emx1座位而测试嵌合rna介导的切割效率。使用扩增子的surveyor测定和桑格测序两者,申请人确认嵌合rna设计以大约4.7%的修饰率促进人emx1座位的切割(图4)。[0213]通过设计靶向人emx1和pvalb以及小鼠th座位中的多个位点的嵌合rna,通过靶向人类和小鼠细胞两者中的另外的基因组座位而测试crispr介导的切割在真核细胞中的普遍性。图15示出了人类pvalb(图15a)和小鼠th(图15b)座位中的一些另外的靶向原型间隔子的筛选。提供了各自的最后的外显子内的基因座位位和三个原型间隔子的位置的示意图。加下划线的序列包括30bp的原型间隔子序列和对应于pam序列的3’端处的3bp。分别在dna序列的上方和下方指示了正义链和反义链上的原型间隔子。人类pvalb和小鼠th座位分别达到了6.3%和0.75%的修饰率,证明了crispr系统跨多种生物在修饰不同座位方面的广阔适用性(图3b和6)。虽然对于每个座位而言,使用嵌合的构建体仅检测到三分之一的间隔子的切割,但是当使用共表达的前-crrna安排时,所有靶序列都被切割,伴随达到27%的有效的indel产生(图6)。[0214]图13提供了可以被重新编程为靶向哺乳动物细胞中的多个基因组座位的spcas9的另外的图解。图13a提供了人emx1座位的示意图,显示了五个原型间隔子的位置,由加下划线的序列指示。图13b提供了前‑ꢀcrrna/trcrrna复合物的示意图,显示了前-crrna和tracrrna的同向重复区之间的杂交(顶部),以及嵌合rna设计的示意图,包括一个20bp指导序列和由部分同向重复组成的tracr配对和tracr序列以及以发夹结构杂交的tracrrna序列(底部)。比较人emx1座位中的五个原型间隔子处的cas9介导的切割的效率的surveyor测定的结果示于图13c中。使用加工的前‑ꢀcrrna/tracrrna复合物(crrna)或嵌合的rna(chirna)靶向每个原型间隔子。[0215]由于rna的二级结构对于分子间相互作用可以是决定性的,使用基于最小自由能和玻尔兹曼(boltzmann)加权结构集合的结构预测算法比较基因组靶向实验(图3b)中使用的所有指导序列的假定的二级结构(参见例如格鲁贝尔(gruber)等人,2008,《核酸研究》(nucleicacidsresearch),36:w70)。分析揭示到在大多数情况下,在嵌合的crrna背景下有效的指导序列基本上不含二级结构基序,而无效的指导序列更可能形成可以阻止与靶原型间隔子dna进行碱基配对的内部二级结构。因此,可能的是,当使用嵌合的crrna时,间隔子二级结构的变异性可能影响crispr介导的干扰的效率。[0216]图3示例了实例表达载体。图3a提供了用于驱动一种合成crrna‑ꢀtracrrna嵌合体(嵌合rna)连同spcas9的表达的一种双顺反子载体的示意图。该嵌合指导rna包含相应于基因组的靶位点中的原型间隔子的一个20-bp指导序列。图3b提供显示靶向人emx1、pvalb、以及小鼠th基因座的指导序列,连同其预测的二级结构的示意图。表明在每个靶位点的修饰效率低于该rna二级结构图(emx1,n=216个扩增子测序读数;pvalb,n=224个读数;th,n=265个读数)。折叠算法产生一个输出,其中每个碱基根据其假定该预测二级结构的可能性着色,如通过在图3b中以灰色标度复现的彩虹标度(rainbowscale)表明的。spcas9的另外的载体设计显示于图44中,示出了掺入连接到指导寡核苷酸的插入位点的u6启动子和连接到spcas9编码序列上的cbh启动子的单个表达载体。显示于图44b中的载体包括一个连接到h1启动子上的tracrrna编码序列。[0217]为了测试包含二级结构的间隔子是否能够在crispr天然操作的原核细胞中起作用,在异源表达化脓链球菌sf370crispr基因座1的大肠杆菌菌株中测试具有原型间隔子的质粒的转化干扰(图10)。将该crispr座位克隆至一种低拷贝大肠杆菌表达载体中,并且该crrna阵列被侧翼为一对dr(pcrispr)的一个单间隔子替代。将包含不同pcrispr质粒的大肠杆菌菌株用包含相应的原型间隔子以及pam序列的激发质粒进行转化(图10c)。在细菌测定中,所有的间隔子均促进有效的crispr干扰(图4c)。这些结果表明,可能存在影响哺乳动物细胞中的crispr活性效率的另外的因素。[0218]为了研究crispr介导的切割的特异性,使用一系列具有单点突变的emx1-靶向嵌合的crrna分析指导序列中的单核苷酸突变对哺乳动物基因组中的原型间隔子切割的影响(图4a)。图4b示出了比较当与不同突变的嵌合的rna配对时cas9的切割效率的surveyor核酸酶测定的结果。pam的5’的高达12-bp的单碱基错配基本上消除了由spcas9进行的基因组切割,而在离上游位置更远处具有突变的间隔子保留针对原始原型间隔子靶标的活性(图4b)。除pam之外,spcas9在间隔子的最后12-bp内具有单碱基特异性。此外,crispr能够像一对靶向同一emx1原型间隔子的tale核酸酶(talen)一样有效地介导基因组切割。图4c提供了一个示意图,显示了靶向emx1的talen的设计并且图4d显示了比较talen和cas9的效率的surveyor凝胶(n=3)。[0219]已经通过易错nhej机制建立了一套用于在哺乳动物细胞中实现crispr介导的基因编辑的组分,测试crispr刺激同源重组(hr)的能力,同源重组是一种用于使得基因组中的编辑精确的高保真基因修复途径。野生型spcas9能够介导位点特异的dsb,这些dsb可以通过nhej和hr两者进行修复。另外,将spcas9的ruvci催化结构域中的天冬氨酸至丙氨酸取代(d10a)工程化,以将核酸酶转化为切口酶(spcas9n;示于图5a中)(参见例如萨普拉诺萨克斯(sapranauskas)等人,2011,《核酸研究》(nucleicacidsresearch),39:9275;加索纳斯(gasiunas)等人,2012,《美国国家科学院院刊》(proc.natl.acad.sci.usa),109:e2579),这样使得带切口的基因组dna经历高保真同源定向修复(hdr)。surveyor测定确认到,spcas9n在emx1原型间隔子靶标处不产生indel。如图5b所示,emx1-靶向嵌合的crrna与spcas9的共表达在靶位点中产生indel,而与spcas9n的共表达不产生indel(n=3)。此外,327个扩增子的测序未检测到由spcas9n诱导的任何indel。选择相同的座位,以通过用靶向emx1、hspcas9或hspcas9n的嵌合rna以及用于在原型间隔子附近引入一对限制酶切位点(hindiii和nhei)的hr模板共转染hek293ft细胞而测试crispr介导的hr。图5c提供了hr策略的示意图,包含重组点的相对位置和引物退火序列(箭头)。spcas9和spcas9n的确催化将hr模板整合进emx1座位中。pcr扩增靶区域,随后用hindiii进行限制酶切消化揭示了对应于期望片段尺寸的切割产物(显示于图5d中的限制性片段长度多态性分析中的箭头),其中spcas9和spcas9n介导类似水平的hr效率。申请人使用基因组扩增子的桑格测序进一步证实了hr(图5e)。这些结果证明了crispr促进哺乳动物基因组中的靶向基因插入的实用性。鉴于14-bp(来自间隔子的12-bp和来自pam的2-bp)特异地靶向medium)(dmem)中。在转染前24小时,将293ft细胞以150,000个细胞/孔的密度接种到24孔板(康宁公司(corning))上。遵循制造商推荐的方案,使用lipofectamine2000(生命技术公司)转染细胞。对于24孔板的每个孔,使用总共500ng的质粒。[0228]基因组修饰的surveyor测定[0229]如上所述,用质粒dna转染293ft细胞。转染后,在基因组dna提取之前,将细胞在37℃下孵育72小时。遵循制造商的方案,使用quickextractdna提取溶液(epicentre)提取基因组dna。简言之,将丸状的细胞重悬于quickextract溶液中并在65℃下孵育15分钟并且在98℃下孵育10分钟。对于每个基因而言,pcr扩增(引物列于表e中)在crispr靶位点侧翼的基因组区域,并且遵循制造商的方案,使用qiaquickspin柱(凯杰公司(qiagen))纯化产物。将总共400ng的纯化的pcr产物与2μl10xtaqdna聚合酶pcr缓冲液(enzymatics公司)和超纯水混合,至终体积为20μl,并使其经受重退火过程,以使得可以形成异源双链体:95℃持续10min,以-2℃/s从95℃降至85℃,以-0.25℃/s从85℃降至25℃,并且在25℃保持1分钟。重退火后,遵循制造商推荐的方案,将产物用surveyor核酸酶和surveyor增强子s(转基因组学公司(transgenomics))处理,并且在4%-20%novextbe聚丙烯酰胺凝胶(生命技术公司)上进行分析。将凝胶用sybrgolddna染色剂(生命技术公司)染色30分钟并用geldoc凝胶成像系统(伯乐公司(bio-rad))成像。基于相对条带强度进行量化。表e:引物名称基因组靶标引物序列(5’至3’)sp-emx1-femx1aaaaccacccttctctctggcsp-emx1-remx1ggagattggagacacggagagsp-pvalb-fpvalbctggaaagccaatgcctgacsp-pvalb-rpvalbggcagcaaactccttgtcct[0230]独特的crispr靶位点的计算机鉴定[0231]为了鉴定针对人、小鼠、大鼠、斑马鱼、果蝇、以及秀丽隐杆线虫基因组中的化脓链球菌sf370cas9(spcas9)酶的独特的靶位点,我们开发了一个软件包以扫描一个dna序列的两条链并且鉴定所有可能的spcas9靶位点。对于此实例,每个spcas9靶位点操作上定义为一个20bp序列,随后定义一个ngg原型间隔子相邻基序(pam)序列,并且我们鉴定了所有染色体上满足此5’‑n20-ngg-3’定义的所有序列。为了预防非特异性基因组编辑,在鉴定所有潜在的位点后,基于序列在相关参比基因组中出现的次数,过滤所有靶位点。为了利用一个‘种子’序列(其可以是,例如,从该pam序列5’开始大约11-12bp序列)赋予的cas9活性的序列特异性,5’‑ꢀnnnnnnnnnn-ngg-3’序列被选择为在该相关基因组中是独特的。从ucsc基因组浏览器(人类基因组hg19,小鼠基因组mm9,大鼠基因组rn5,斑马鱼基因组danrer7,果蝇基因组dm4以及秀丽隐杆线虫基因组ce10)下载所有基因组序列。使用ucsc基因组浏览器信息能够获得全面检索结果。一些靶位点在人类基因组中的示例性可视化提供于图21中。[0232]初始,靶向人hek293ft细胞中的emx1座位内的三个位点。使用surveyor核酸酶测定评估每种chirna的基因组修饰效率,该测定检测由dna双链断裂(dsb)及其通过非同源末端连接(nhej)dna损伤修复途径进行的随后修复造成的突变。co被指定为chirna( n)的构建体指示,野生型tracrrna的直达第 n个核苷酸被包括在嵌合的rna构建体中,其中48、54、67和85的值用于n。嵌合的rna在所有三个emx1靶位点处都包含长片段的野生型tracrrna(chirna( 67)和chirna( 85))介导的dna切割,其中chirna( 85)尤其展示出比以分开的转录本形式表达指导序列和tracr序列的对应的crrna/tracrrna杂交体显著更高水平的dna切割(图18b和19a)。还使用chirna靶向pvalb座位中的两个位点,其不产生使用杂交体系统(作为分开的转录本而表达的指导序列和tracr序列)的可检测的切割。chirna( 67)和chirna( 85)能够在两个pvalb原型间隔子处介导显著的切割(图18c和19b)。[0233]对于emx1和pvalb座位中的所有五个靶标,伴随增加的tracr序列长度观察到一致增加的基因组修饰效率。不希望受任何理论的束缚,由tracrrna的3’端形成的二级结构可以在增强crispr复合物形成率方面发挥一定作用。图21中提供了在此实例中使用的嵌合rna中每个的预测二级结构的图解。使用最小自由能以及配分函数算法,使用rna折叠(http://rna.tbi.univie.ac.at/cgi-bin/rnafold.cgi)预测该二级结构。每个碱基的假色(以灰度复现)表明成对的可能性。因为具有更长的tracr序列的chirna能够切割未被天然crisprcrrna/tracrrna杂交体切割的靶标,可能的是,嵌合rna可比其天然杂交体配对物更有效地装载到cas9上。为了促进cas9在真核细胞以及生物体中应用于位点特异性基因组编辑,在人、小鼠、大鼠、斑马鱼、秀丽隐杆线虫、以及果蝇基因组中计算机鉴定该化脓链球菌cas9的所有预测的独特的靶位点。嵌合rna可以针对来自其他微生物的cas9酶进行设计以扩展crisprrna可编程的核酸酶的靶空间。[0234]图22示出了用于表达包括野生型tracrrna序列的高达 85核苷酸以及带有核定位序列的spcas9的嵌合rna的示例性双顺反子表达载体的示意图。spcas9是从一种cbh启动子表达的并被bghpolya信号(bghpa)终止。紧接着该示意图所示的扩展的序列对应于该指导序列插入位点周围的区域,并且从5’至3’包括u6启动子(第一遮蔽区)的3’‑部分、bbsi切割位点(箭头)、部分同向重复(tracr配对序列gttttagagcta,加下划线)、环序列gaaa、以及 85tracr序列(环序列后加下划线的序列)。在该指导序列插入位点之后示出了一个示例性的指导序列插入片段,针对所选择的靶标,指导序列的核苷酸由“n”表示。[0235]以上实例中所述的序列如下(多核苷酸序列是5’至3’):[0236]u6-短tracrrna(化脓链球菌sf370):[0237][0237](粗体=tracrrna序列;下划线=终止序列)[0238]u6-长tracrrna(化脓链球菌sf370):[0239]gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccggtagtattaagtattgttttatggctgataaatttctttgaatttctccttgattatttgttataaaagttataaaataatcttgttggaaccattcaaaacagcatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[0240]u6-dr-bbsi骨架-dr(化脓链球菌sf370):[0241]gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgggttttagagctatgctgttttgaatggtcccaaaacgggtcttcgagaagacgttttagagctatgctgttttgaatggtcccaaaac[0242]u6-嵌合rna-bbsi骨架(化脓链球菌sf370)[0243]gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataaggctagtccg[0244]nls-spcas9-egfp:[0245]mdykdhdgdykdhdidykddddkmapkkkrkvgihgvpaadkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdaaavskgeelftgvvpilveldgdvnghkfsvsgegegdatygkltlkficttgklpvpwptlvttltygvqcfsrypdhmkqhdffksampegyvqertiffkddgnyktraevkfegdtlvnrielkgidfkedgnilghkleynynshnvyimadkqkngikvnfkirhniedgsvqladhyqqntpigdgpvllpdnhylstqsalskdpnekrdhmvllefvtaagitlgmdelyk[0246]spcas9-egfp-nls:[0247]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdaaavskgeelftgvvpilveldgdvnghkfsvsgegegdatygkltlkficttgklpvpwptlvttltygvqcfsrypdhmkqhdffksampegyvqertiffkddgnyktraevkfegdtlvnrielkgidfkedgnilghkleynynshnvyimadkqkngikvnfkirhniedgsvqladhyqqntpigdgpvllpdnhylstqsalskdpnekrdhmvllefvtaagitlgmdelykkrpaatkkagqakkkk[0248]nls-spcas9-egfp-nls:[0249]mdykdhdgdykdhdidykddddkmapkkkrkvgihgvpaadkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdaaavskgeelftgvvpilveldgdvnghkfsvsgegegdatygkltlkficttgklpvpwptlvttltygvqcfsrypdhmkqhdffksampegyvqertiffkddgnyktraevkfegdtlvnrielkgidfkedgnilghkleynynshnvyimadkqkngikvnfkirhniedgsvqladhyqqntpigdgpvllpdnhylstqsalskdpnekrdhmvllefvtaagitlgmdelykkrpaatkkagqakkkk[0250]nls-spcas9-nls:[0251]mdykdhdgdykdhdidykddddkmapkkkrkvgihgvpaadkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdkrpaatkkagqakkkk[0252]nls-mcherry-sprna酶3:[0253]mflflsltsflsssrtlvskgeednmaiikefmrfkvhmegsvnghefeiegegegrpyegtqtaklkvtkggplpfawdilspqfmygskayvkhpadipdylklsfpegfkwervmnfedggvvtvtqdsslqdgefiykvklrgtnfpsdgpvmqkktmgweassermypedgalkgeikqrlklkdgghydaevkttykakkpvqlpgaynvniklditshnedytiveqyeraegrhstggmdelykgskqleellstsfdiqfndltlletafthtsyanehrllnvshnerleflgdavlqliiseylfakypkktegdmsklrsmivreeslagfsrfcsfdayiklgkgeeksggrrrdtilgdlfeaflgallldkgidavrrflkqvmipqvekgnfervkdyktclqeflqtkgdvaidyqvisekgpahakqfevsivvngavlskglgkskklaeqdaaknalaqlsev[0254]sprna酶3-mcherry-nls:[0255]mkqleellstsfdiqfndltlletafthtsyanehrllnvshnerleflgdavlqliiseylfakypkktegdmsklrsmivreeslagfsrfcsfdayiklgkgeeksggrrrdtilgdlfeaflgallldkgidavrrflkqvmipqvekgnfervkdyktclqeflqtkgdvaidyqvisekgpahakqfevsivvngavlskglgkskklaeqdaaknalaqlsevgsvskgeednmaiikefmrfkvhmegsvnghefeiegegegrpyegtqtaklkvtkggplpfawdilspqfmygskayvkhpadipdylklsfpegfkwervmnfedggvvtvtqdsslqdgefiykvklrgtnfpsdgpvmqkktmgweassermypedgalkgeikqrlklkdgghydaevkttykakkpvqlpgaynvniklditshnedytiveqyeraegrhstggmdelykkrpaatkkagqakkkk[0256]nls-spcas9n-nls(d10a切口酶突变是小写字母):[0257]mdykdhdgdykdhdidykddddkmapkkkrkvgihgvpaadkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdkrpaatkkagqakkkk[0258]hemx1-hr模板-hindii-nhei:[0259]gaatgctgccctcagacccgcttcctccctgtccttgtctgtccaaggagaatgaggtctcactggtggatttcggactaccctgaggagctggcacctgagggacaaggccccccacctgcccagctccagcctctgatgaggggtgggagagagctacatgaggttgctaagaaagcctcccctgaaggagaccacacagtgtgtgaggttggagtctctagcagcgggttctgtgcccccagggatagtctggctgtccaggcactgctcttgatataaacaccacctcctagttatgaaaccatgcccattctgcctctctgtatggaaaagagcatggggctggcccgtggggtggtgtccactttaggccctgtgggagatcatgggaacccacgcagtgggtcataggctctctcatttactactcacatccactctgtgaagaagcgattatgatctctcctctagaaactcgtagagtcccatgtctgccggcttccagagcctgcactcctccaccttggcttggctttgctggggctagaggagctaggatgcacagcagctctgtgaccctttgtttgagaggaacaggaaaaccacccttctctctggcccactgtgtcctcttcctgccctgccatccccttctgtgaatgttagacccatgggagcagctggtcagaggggaccccggcctggggcccctaaccctatgtagcctcagtcttcccatcaggctctcagctcagcctgagtgttgaggccccagtggctgctctgggggcctcctgagtttctcatctgtgcccctccctccctggcccaggtgaaggtgtggttccagaaccggaggacaaagtacaaacggcagaagctggaggaggaagggcctgagtccgagcagaagaagaagggctcccatcacatcaaccggtggcgcattgccacgaagcaggccaatggggaggacatcgatgtcacctccaatgacaagcttgctagcggtgggcaaccacaaacccacgagggcagagtgctgcttgctgctggccaggcccctgcgtgggcccaagctggactctggccactccctggccaggctttggggaggcctggagtcatggccccacagggcttgaagcccggggccgccattgacagagggacaagcaatgggctggctgaggcctgggaccacttggccttctcctcggagagcctgcctgcctgggcgggcccgcccgccaccgcagcctcccagctgctctccgtgtctccaatctcccttttgttttgatgcatttctgttttaatttattttccaggcaccactgtagtttagtgatccccagtgtcccccttccctatgggaataataaaagtctctctcttaatgacacgggcatccagctccagccccagagcctggggtggtagattccggctctgagggccagtgggggctggtagagcaaacgcgttcagggcctgggagcctggggtggggtactggtggagggggtcaagggtaattcattaactcctctcttttgttgggggaccctggtctctacctccagctccacagcaggagaaacaggctagacatagggaagggccatcctgtatcttgagggaggacaggcccaggtctttcttaacgtattgagaggtgggaatcaggcccaggtagttcaatgggagagggagagtgcttccctctgcctagagactctggtggcttctccagttgaggagaaaccagaggaaaggggaggattggggtctgggggagggaacaccattcacaaaggctgacggttccagtccgaagtcgtgggcccaccaggatgctcacctgtccttggagaaccgctgggcaggttgagactgcagagacagggcttaaggctgagcctgcaaccagtccccagtgactcagggcctcctcagcccaagaaagagcaacgtgccagggcccgctgagctcttgtgttcacctg[0260]nls-stcsn1-nls:[0261]mkrpaatkkagqakkkksdlvlgldigigsvgvgilnkvtgeiihknsrifpaaqaennlvrrtnrqgrrlarrkkhrrvrlnrlfeesglitdftkisinlnpyqlrvkgltdelsneelfialknmvkhrgisylddasddgnssvgdyaqivkenskqletktpgqiqleryqtygqlrgdftvekdgkkhrlinvfptsayrsealrilqtqqefnpqitdefinryleiltgkrkyyhgpgneksrtdygryrtsgetldnifgiligkctfypdefraakasytaqefnllndlnnltvptetkklskeqknqiinyvknekamgpaklfkyiakllscdvadikgyridksgkaeihtfeayrkmktletldieqmdretldklayvltlnteregiqealehefadgsfsqkqvdelvqfrkanssifgkgwhnfsvklmmelipelyetseeqmtiltrlgkqkttsssnktkyidekllteeiynpvvaksvrqaikivnaaikeygdfdniviemaretneddekkaiqkiqkankdekdaamlkaanqyngkaelphsvfhghkqlatkirlwhqqgerclytgktisihdlinnsnqfevdhilplsitfddslankvlvyatanqekgqrtpyqaldsmddawsfrelkafvresktlsnkkkeyllteediskfdvrkkfiernlvdtryasrvvlnalqehfrahkidtkvsvvrgqftsqlrrhwgiektrdtyhhhavdaliiaassqlnlwkkqkntlvsysedqlldietgelisddeykesvfkapyqhfvdtlkskefedsilfsyqvdskfnrkisdatiyatrqakvgkdkadetyvlgkikdiytqdgydafmkiykkdkskflmyrhdpqtfekviepilenypnkqinekgkevpcnpflkykeehgyirkyskkgngpeikslkyydsklgnhiditpkdsnnkvvlqsvspwradvyfnkttgkyeilglkyadlqfekgtgtykisqekyndikkkegvdsdsefkftlykndlllvkdtetkeqqlfrflsrtmpkqkhyvelkpydkqkfeggealikvlgnvansgqckkglgksnisiykvrtdvlgnqhiiknegdkpkldfkrpaatkkagqakkkk[0262]u6-st_tracrrna(7-97):[0263]gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgttacttaaatcttgcagaagctacaaagataaggcttcatggctattaccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgacgctgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattagctgagcaagaggtaagggtttaagggatggttggttggtggggtattaatgtttaattacctggagcacctgcctgaaatcactttttttcaggttggaccggtgccaccatggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgacaagaagtacagcatcggcctggacatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggcaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggcgactttctttttcttagcttgaccagctttcttagtagcagcaggacgctttaa(下划线=nls‑ꢀhspcas9-nls)[0276]针对嗜热链球菌lmd-9crispr1cas9的实例嵌合rna(具有nnagaaw的pam)[0277](n=指导序列;第一下划线=tracr配对序列;第二下划线=tracr序列;粗体=终止子)[0278]针对嗜热链球菌lmd-9crispr1cas9的实例嵌合rna(具有nnagaaw的pam)[0279][0279](n=指导序列;第一下划线=tracr配对序列;第二下划线=tracr序列;粗体=终止子)[0280]针对嗜热链球菌lmd-9crispr1cas9的实例嵌合rna(具有nnagaaw的pam)[0281][0281](n=指导序列;第一下划线=tracr配对序列;第二下划线=tracr序列;粗体=终止子)[0282]针对嗜热链球菌lmd-9crispr1cas9的实例嵌合rna(具有nnagaaw的pam)[0283](n=指导序列;第一下划线=tracr配对序列;第二下划线=tracr序列;粗体=终止子)[0284]针对嗜热链球菌lmd-9crispr1cas9的实例嵌合rna(具有nnagaaw的pam)[0285][0285](n=指导序列;第一下划线=tracr配对序列;第二下划线=tracr序列;粗体=终止子)[0286]针对嗜热链球菌lmd-9crispr1cas9的实例嵌合rna(具有nnagaaw的pam)[0287][0287](n=指导序列;第一下划线=tracr配对序列;第二下划线=tracr序列;粗体=终止子)[0288]针对嗜热链球菌lmd-9crispr1cas9的实例嵌合rna(具有nnagaaw的pam)[0289](n=指导序列;第一下划线=tracr配对序列;第二下划线=tracr序列;粗体=终止子)[0290]针对嗜热链球菌lmd-9crispr1cas9的实例嵌合rna(具有nnagaaw的pam)[0291][0291](n=指导序列;第一下划线=tracr配对序列;第二下划线=tracr序列;粗体=终止子)[0292]针对嗜热链球菌lmd-9crispr1cas9的实例嵌合rna(具有nnagaaw的pam)[0293][0293](n=指导序列;第一下划线=tracr配对序列;第二下划线=tracr序列;粗体=终止子)[0294]针对嗜热链球菌lmd-9crispr3cas9的实例嵌合rna(具有nggng的pam)[0295][0295](n=指导序列;第一加下划线的=tracr配对序列;第二加下划线的=tracr序列;加粗的=终止子)[0296]来自嗜热链球菌lmd-9crispr3基因座的密码子优化版本的cas9(在5’以及3’两端都具有一个nls)[0297]atgaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaagaccaagccctacagcatcggcctggacatcggcaccaatagcgtgggctgggccgtgaccaccgacaactacaaggtgcccagcaagaaaatgaaggtgctgggcaacacctccaagaagtacatcaagaaaaacctgctgggcgtgctgctgttcgacagcggcattacagccgagggcagacggctgaagagaaccgccagacggcggtacacccggcggagaaacagaatcctgtatctgcaagagatcttcagcaccgagatggctaccctggacgacgccttcttccagcggctggacgacagcttcctggtgcccgacgacaagcgggacagcaagtaccccatcttcggcaacctggtggaagagaaggcctaccacgacgagttccccaccatctaccacctgagaaagtacctggccgacagcaccaagaaggccgacctgagactggtgtatctggccctggcccacatgatcaagtaccggggccacttcctgatcgagggcgagttcaacagcaagaacaacgacatccagaagaacttccaggacttcctggacacctacaacgccatcttcgagagcgacctgtccctggaaaacagcaagcagctggaagagatcgtgaaggacaagatcagcaagctggaaaagaaggaccgcatcctgaagctgttccccggcgagaagaacagcggaatcttcagcgagtttctgaagctgatcgtgggcaaccaggccgacttcagaaagtgcttcaacctggacgagaaagccagcctgcacttcagcaaagagagctacgacgaggacctggaaaccctgctgggatatatcggcgacgactacagcgacgtgttcctgaaggccaagaagctgtacgacgctatcctgctgagcggcttcctgaccgtgaccgacaacgagacagaggccccactgagcagcgccatgattaagcggtacaacgagcacaaagaggatctggctctgctgaaagagtacatccggaacatcagcctgaaaacctacaatgaggtgttcaaggacgacaccaagaacggctacgccggctacatcgacggcaagaccaaccaggaagatttctatgtgtacctgaagaagctgctggccgagttcgagggggccgactactttctggaaaaaatcgaccgcgaggatttcctgcggaagcagcggaccttcgacaacggcagcatcccctaccagatccatctgcaggaaatgcgggccatcctggacaagcaggccaagttctacccattcctggccaagaacaaagagcggatcgagaagatcctgaccttccgcatcccttactacgtgggccccctggccagaggcaacagcgattttgcctggtccatccggaagcgcaatgagaagatcaccccctggaacttcgaggacgtgatcgacaaagagtccagcgccgaggccttcatcaaccggatgaccagcttcgacctgtacctgcccgaggaaaaggtgctgcccaagcacagcctgctgtacgagacattcaatgtgtataacgagctgaccaaagtgcggtttatcgccgagtctatgcgggactaccagttcctggactccaagcagaaaaaggacatcgtgcggctgtacttcaaggacaagcggaaagtgaccgataaggacatcatcgagtacctgcacgccatctacggctacgatggcatcgagctgaagggcatcgagaagcagttcaactccagcctgagcacataccacgacctgctgaacattatcaacgacaaagaatttctggacgactccagcaacgaggccatcatcgaagagatcatccacaccctgaccatctttgaggaccgcgagatgatcaagcagcggctgagcaagttcgagaacatcttcgacaagagcgtgctgaaaaagctgagcagacggcactacaccggctggggcaagctgagcgccaagctgatcaacggcatccgggacgagaagtccggcaacacaatcctggactacctgatcgacgacggcatcagcaaccggaacttcatgcagctgatccacgacgacgccctgagcttcaagaagaagatccagaaggcccagatcatcggggacgaggacaagggcaacatcaaagaagtcgtgaagtccctgcccggcagccccgccatcaagaagggaatcctgcagagcatcaagatcgtggacgagctcgtgaaagtgatgggcggcagaaagcccgagagcatcgtggtggaaatggctagagagaaccagtacaccaatcagggcaagagcaacagccagcagagactgaagagactggaaaagtccctgaaagagctgggcagcaagattctgaaagagaatatccctgccaagctgtccaagatcgacaacaacgccctgcagaacgaccggctgtacctgtactacctgcagaatggcaaggacatgtatacaggcgacgacctggatatcgaccgcctgagcaactacgacatcgaccatattatcccccaggccttcctgaaagacaacagcattgacaacaaagtgctggtgtcctccgccagcaaccgcggcaagtccgatgatgtgcccagcctggaagtcgtgaaaaagagaaagaccttctggtatcagctgctgaaaagcaagctgattagccagaggaagttcgacaacctgaccaaggccgagagaggcggcctgagccctgaagataaggccggcttcatccagagacagctggtggaaacccggcagatcaccaagcacgtggccagactgctggatgagaagtttaacaacaagaaggacgagaacaaccgggccgtgcggaccgtgaagatcatcaccctgaagtccaccctggtgtcccagttccggaaggacttcgagctgtataaagtgcgcgagatcaatgactttcaccacgcccacgacgcctacctgaatgccgtggtggcttccgccctgctgaagaagtaccctaagctggaacccgagttcgtgtacggcgactaccccaagtacaactccttcagagagcggaagtccgccaccgagaaggtgtacttctactccaacatcatgaatatctttaagaagtccatctccctggccgatggcagagtgatcgagcggcccctgatcgaagtgaacgaagagacaggcgagagcgtgtggaacaaagaaagcgacctggccaccgtgcggcgggtgctgagttatcctcaagtgaatgtcgtgaagaaggtggaagaacagaaccacggcctggatcggggcaagcccaagggcctgttcaacgccaacctgtccagcaagcctaagcccaactccaacgagaatctcgtgggggccaaagagtacctggaccctaagaagtacggcggatacgccggcatctccaatagcttcaccgtgctcgtgaagggcacaatcgagaagggcgctaagaaaaagatcacaaacgtgctggaatttcaggggatctctatcctggaccggatcaactaccggaaggataagctgaactttctgctggaaaaaggctacaaggacattgagctgattatcgagctgcctaagtactccctgttcgaactgagcgacggctccagacggatgctggcctccatcctgtccaccaacaacaagcggggcgagatccacaagggaaaccagatcttcctgagccagaaatttgtgaaactgctgtaccacgccaagcggatctccaacaccatcaatgagaaccaccggaaatacgtggaaaaccacaagaaagagtttgaggaactgttctactacatcctggagttcaacgagaactatgtgggagccaagaagaacggcaaactgctgaactccgccttccagagctggcagaaccacagcatcgacgagctgtgcagctccttcatcggccctaccggcagcgagcggaagggactgtttgagctgacctccagaggctctgccgccgactttgagttcctgggagtgaagatcccccggtacagagactacaccccctctagtctgctgaaggacgccaccctgatccaccagagcgtgaccggcctgtacgaaacccggatcgacctggctaagctgggcgagggaaagcgtcctgctgctactaagaaagctggtcaagctaagaaaaagaaataa实例5:使用crispr-cas系统的细菌基因组的rna指导的编辑。[0298]申请人使用crispr-相关的内切核酸酶cas9以在肺炎链球菌以及大肠杆菌的基因组中引入精确的突变。该途径依赖于在靶位点处的cas9-指导的切割以杀死未突变的细胞,并且回避对选择性标记或反选择系统的需要。cas9特异性是通过改变短crisprrna(crrna)的序列的重新编程的,以使得在编辑模板上发生单以及多核苷酸改变。同时使用两个crrna使得多元诱变成为可能。在肺炎链球菌中,将近100%的从cas9切割幸存的细胞包含所希望的突变,并且当在大肠杆菌中与重组工程组合使用时是65%。申请人全面分析了cas9靶标需求以定义可靶定序列的范围,并且显示不满足这些需求的编辑位点的策略,表明了细菌基因组工程的这种技术的多样性。[0299]理解基因功能依赖于以受控的方式改变细胞内的dna序列的可能性。真核生物中的位点特异性诱变是使用序列特异性核酸酶实现的,这些核酸酶促进包含感兴趣的突变的一种模板dna的同源重组。锌指核酸酶(zfn)、转录激活子样效应因子核酸酶(talen)以及归巢大范围核酸酶(homingmeganuclease)可以被编程以切割特异性位置中的基因组,但这些途径需要针对每个靶序列的新的酶的工程化。在原核生物体中,诱变方法在该编辑的基因座中引入一种选择标记或需要一个包括反选择系统的两步法。最近,噬菌体重组蛋白已被用于重组工程,这是促进线性dna或寡核苷酸的同源重组的一种技术。然而,因为不存在对突变的筛选,重组工程化效率可能是相对低的(从针对点突变的0.1%-10%低至针对更大的修饰的10-5-10-6),在许多情况下需要筛选大数目的菌落。因此,仍存在对可承受的、容易使用并且有效的新的技术的需求,以用于真核以及原核生物体两者中的基因工程化。[0300]对原核生物的crispr(规律间隔成簇短回文重复序列)适应性免疫系统的最近工作已导致鉴定序列特异性被小rna程序化的核酸酶。crispr基因座是由被‘间隔子’序列分离的一系列重复序列构成的,这些重复序列匹配细菌噬菌体以及其他可动遗传因子的基因组。该重复-间隔子阵列被转录为一个长前体并且在重复序列内被加工以产生小crrna,该小crrna指定被crispr系统切割的靶序列(也被称为原型间隔子)。对切割而言必要地是恰好在该靶区域的下游的序列基序的存在,该序列基序被称为原型间隔子相邻基序(pam)。crispr-相关(cas)基因通常在该重复-间隔子阵列侧翼并且编码对crrna生源说以及靶向负责的酶机构。cas9是一种dsdna内切核酸酶,使用一种crrna指导以指定切割位点。该crrna指导向cas9上的装载发生在加工该crrna前体过程中并且需要反义于该前体的一个小rna、tracrrna、以及rna酶iii。与用zfn或talen编辑的基因组相比,改变cas9靶特异性不需要蛋白质工程化而只需要短crrna指导的设计。[0301]申请人最近揭示在肺炎链球菌中,引入靶向一个染色体基因座的一种crispr系统导致杀死这些转化细胞。观察到偶然的幸存者在靶区域包含突变,表明可使用针对内源靶标的cas9dsdna内切核酸酶活性用于基因组编辑。申请人揭示,无标记物突变可以通过将在该基因组中重组并且将消除cas9靶识别的一个模板dna片段的转化来引入。具有若干不同crrna的cas9的特异性的引导允许在相同的时间引入多个突变。申请人也详细表征了cas9靶向的序列需求,并且揭示该途径可以与重组工程组合,用于在大肠杆菌中进行基因组编辑。[0302]结果:通过一个染色体靶标的cas9切割进行基因组编辑[0303]肺炎链球菌菌株crr6包含一个基于cas9的crispr系统,该系统切割存在于细菌噬菌体φ8232.5中的一个靶序列。此靶标被整合至一种第二菌株r68232.5的srta染色体基因座中。在pam区域包含一种突变的一个改变的靶序列被整合至一种第三菌株r6370.1的srta基因座中,导致此菌株对crispr切割‘免疫’(图28a)。申请人用来自crr6细胞的基因组dna转化r68232.5以及r6370.1细胞,期望成功转化r68232.5细胞会导致该靶基因座的切割以及细胞死亡。与此期望相反,申请人分离r68232.5转化体,尽管其比r6370.1转化体具有少大约10倍的效率(图28b)。八个r68232.5转化体的遗传分析(图28)揭示大多数是双重组事件的产物,通过将φ8232.5靶标用crr6基因组的野生型srta基因座替换,该双重组事件消除cas9靶向的毒性,该消除不包含cas9识别所需要的原型间隔子。这些结果是如下的证据,并行引入靶向一个基因组座位的一个crispr系统(靶向构建体)连同用以重组至靶定的基因座中的一个模板(编辑模板)导致靶定的基因组编辑(图23a)。[0304]为了建立用于基因组编辑的一个简化系统,通过缺失cas1、cas2以及csn2,即已显示对于crispr靶向来说可有可无的的基因,申请人修饰菌株crr6中的crispr座位,产生菌株crr6m(图28a)。此菌株保留crr6的相同特性(图28b)。为了增加基于cas9的编辑的效率并且表明所选择的一个模板dna可用以控制引入的突变,申请人用野生型srta基因或突变体r6370.1靶标的pcr产物共转化r68232.5细胞,这两个靶标中任一个应该对cas9的切割具有抗性。这导致转化频率相较于单独的基因组crr6dna的5至10倍增加(图23b)。编辑的效率也实质性增加,8/8所测试的转化体包含一个野生型srta拷贝,并且7/8包含存在于该r6370.1靶标中的pam突变(图23b以及图29a)。一起考虑,这些结果显示cas9辅助基因组编辑的可能性。[0305]对cas9靶需求的分析:为了在该基因组中引入特异性改变,必须使用携带消除cas9介导的切割的突变的一个编辑模板,从而防止细胞死亡。当寻求靶标缺或其被另一个序列(基因插入)替代时这是容易实现的。当目标是产生基因融合或产生单核苷酸突变时,cas9核酸酶活性的消除仅在通过在改变pam或原型间隔子的编辑模板中引入突变时有可能。为了确定crispr介导的编辑的约束,申请人全面分析了废止crispr靶向的pam以及原型间隔子突变。[0306]前述研究提出,化脓链球菌cas9需要恰好在该原型间隔子的下游的一个nggpam。然而,因为迄今为止仅描述了非常有限数目的pam钝化突变,申请人进行了一个系统性分析,从而发现在消除crispr切割的原型间隔子之后的所有5-核苷酸序列。申请人使用随机化寡核苷酸产生在转化至crr6或r6细胞中的一种异质pcr产物中的所有可能的1,024个pam序列。预期携带功能性pam的构建体被crr6(而不是r6细胞)中的cas9识别并破坏(图24a)。超过2×105个菌落汇集在一起以提取dna,用于用作共扩增所有靶标的模板。对pcr产物进行深度测序并且发现包含所有1,024个序列,覆盖范围从5至42,472个读数(参见“深度测序数据分析”部分)。将每个pam的功能通过其在crr6样品中与r6样品中的读数的相对比例进行估计。pam的前三个碱基的分析(经最后两个碱基平均)清楚地显示,ngg型在crr6转化体中是非代表性的(图24b)。此外,后两个碱基对nggpam没有可检测到的影响(参见“深度测序数据分析”部分),表明nggnn序列足以许可cas9活性。针对nagpam序列观察到部分靶向(图24b)。另外,该nnggn型部分地钝化crispr靶向(表g),表明该ngg基序当移位1bp时仍可通过cas9以降低的效率被识别。这些数据阐明cas9靶识别的分子机制,并且它们揭示ngg(或互补链上的ccn)序列足以靶向cas9,并且在该编辑模板中应避免ngg至nag或nnggn突变。由于这些三核苷酸序列的高频率(每隔8bp一次),这意味着该基因组的几乎任何位置都可以被编辑。确实,申请人测试了十个随机选取的携带不同pam的靶标并且发现所有都是功能性的(图30)。[0307]破坏cas9介导的切割的另一个方式是在该编辑模板的原型间隔子区域引入突变。已知‘种子序列’(恰邻近于该pam的8至10个原型间隔子核苷酸)内的点突变可消除crispr核酸酶进行的切割。然而,此区域的精确长度是未知的,并且不清楚该种子中是否突变为任何核苷酸均可破坏cas9靶识别。申请人遵循上述相同的深度测序途径以随机化整个涉及到与该crrna接触的碱基对中的原型间隔子,并且确定所有破坏靶向的序列。存在于r68232.5细胞中的spc1靶标中的20个匹配核苷酸(14)的每个位置(图23a)被随机化并且转化至crr6以及r6细胞中(图24a)。与一个种子序列的存在一致,仅恰好在该pam的上游的12个核苷酸的突变废止cas9进行的切割(图24c)。然而,不同突变展现显著不同的影响。该种子(12至7)的末端(从该pam开始)位置耐受大部分突变并且仅一个具体的碱基取代废止靶向。相比之下,在近端位置(6至1,除3之外)突变为任何核苷酸消除cas9活性,尽管每个具体取代处于不同的水平。在位置3,仅两个取代影响crispr活性并且是以不同强度。申请人推断,尽管种子序列突变可防止crispr靶向,但存在关于可以在种子的每个位置发生的核苷酸变化的限制。此外,这些限制最可能针对不同间隔子序列而变化。因此申请人认为该pam序列上的突变,如果可能,应该是优选的编辑策略。可替代地,该种子序列上的多个突变可被引入以防止cas9核酸酶活性。[0308]肺炎链球菌中cas9介导的基因组编辑:为了研发一种用于靶定的基因组编辑的快速且有效的方法,申请人工程化菌株crr6rk,这是间隔子可容易通过pcr引入其中的一种菌株(图33)。申请人决定编辑肺炎链球菌的β-半乳糖苷酶(bgaa)基因,其活性可以容易地测量。申请人在此酶的活性位点中引入氨基酸的丙氨酸取代:r481a(r→a)以及n563a,e564a(ne→aa)突变。为了说明不同编辑策略,申请人设计该pam序列以及该原型间隔子种子两者的突变。在两种情况下,使用具有与邻近于tggpam序列的β-半乳糖苷酶基因的一个区域互补的crrna相同的靶向构建体(互补链中的cca,图26)。该r→a编辑模板在该原型间隔子种子序列上产生一个三核苷酸错配(cgt至gca,也引入一个btgzi限制酶切位点)。在该ne→aa编辑模板中,申请人同时引入一个同义突变,该同义突变产生一个钝化pam(tgg至ttg)连同在该原型间隔子区域的218nt下游的突变(aatgaa至gctgca,也产生一个tsei限制酶切位点)。后一种编辑策略表明使用一个远端pam在如下位置制造突变的可能性,在该位置处可能难以选择一个适合的靶标。例如,尽管肺炎链球菌r6基因组(其具有39.7%gc含量)平均每隔12bp包含一个pam基序,一些pam基序被分离成高达194bp(图33)。此外申请人设计了6,664bp的一种δbgaa框内缺失。在所有三种情况下,靶向以及编辑模板的共转化比用一种包含野生型bgaa序列的对照编辑模板共转化产生多10倍的卡那霉素抗性细胞(图25b)。申请人对24个转化体(每个编辑试验为8个)进行基因分型,并且发现除一个外全部结合所希望的改变(图25c)。dna测序也证实在该靶区不仅存在引入的突变而且也不存在继发性突变(图29b,c)。最终,申请人测量β-半乳糖苷酶活性以证实所有编辑的细胞都展现所期望的表型(图25d)。[0309]cas9介导的编辑也可用以产生多个突变用以研究生物通路。针对锚定表面蛋白至革兰氏阳性菌的包膜的分选酶依赖性通路,申请人决定说明这一点。申请人通过一个氯霉素抗性靶向构建体以及一个δsrta编辑模板的共转化而引入一个分选酶缺失(图33a,b),随后使用替代前述那个的一种卡那霉素抗性靶向构建体引入一个δbgaa缺失。在肺炎链球菌中,β-半乳糖苷酶通过分选酶共价连接至该细胞壁。因此,srta的缺失导致表面蛋白被释放至上清液中,而该双缺失不具有可检测到的β-半乳糖苷酶活性(图34c)。这样的顺序筛选可根据需要重复许多次,直到产生多个突变。[0310]这两个突变也可在相同的时间引入。申请人设计一种包含两个间隔子、一个匹配srta以及另一个匹配bgaa的靶向构建体,并且用两个编辑模板在相同的时间进行共转化(图25e)。转化体的遗传分析显示,在6/8的情况下编辑发生(图25f)。值得注意地,剩下的两个克隆各自包含一个δsrta或一个δbgaa缺失,表明使用cas9进行组合诱变的可能性。最终,为了消除该crispr序列,申请人引入包含该bgaa靶标以及一个大观霉素抗性基因连同来自野生型菌株r6的基因组dna的一个质粒。保留该质粒的大观霉素抗性转化体消除了该crispr序列(图34a,d)。[0311]编辑的机制和效率:为了理解使用cas9进行的基因组编辑的潜在机制,申请人设计一个试验,其中编辑效率是独立于cas9切割而测量的。申请人在该srta基因座中整合该ermam红霉素抗性基因,并且使用cas9介导的编辑引入一个早熟终止密码子(图33)。所得的菌株(jen53)包含一个ermam(终止子)等位基因并且是红霉素敏感的。此菌株可被用于评估如下效率,在此效率该ermam基因通过测量在有或没有使用cas9切割的情况下恢复抗生素抗性的细胞的分数得以修复。jen53是用一个恢复该野生型等位基因的编辑模板转化的,连同一个靶向该ermam(终止子)等位基因的卡那霉素抗性crispr构建体(crispr::ermam(终止子))或一个不具间隔子的对照构建体(图26a,b)。在不存在卡那霉素筛选的情况下,编辑的菌落的分数近似于10-2(红霉素抗性cfu/总cfu)(图26c),表示在没有针对未编辑的细胞进行cas9介导的筛选的情况下重组的基线频率。然而,如果应用卡那霉素筛选并且该对照crispr构建体被共转化,编辑的菌落的分数增加至约10-1(卡那霉素-以及红霉素抗性cfu/卡那霉素抗性cfu)(图26c)。此结果显示对针对独立于该基因组的cas9切割在该ermam基因座中重组的该crispr座位共筛选的重组的筛选,表明一个亚群的细胞更容易转化和/或重组。该crispr::ermam(终止子)构建体的转化随后是卡那霉素筛选导致红霉素抗性、编辑的细胞的分数增加至99%(图26c)。为了确定此增加是否是由未编辑的细胞的杀死引起的,申请人比较了用该crispr::ermam(终止子)或构建体共转化jen53细胞之后获得的这些卡那霉素抗性菌落形成单位(cfu)。[0312]申请人在该ermam(终止子)构建体的转化之后对卡那霉素抗性菌落进行的计数少了5.3倍(2.5×104/4.7×103,图35a),该结果表明cas9靶向一个染色体基因座确实导致未编辑的细胞的杀死。最终,因为已知在该细菌染色体中引入dsdna断裂引发增加受损的dna的重组率的修复机制,申请人研究了cas9进行的切割是否诱导该编辑模板的重组。申请人用该crispr::erm(终止)构建体共转化之后比用该构建体的情况对菌落的计数多了2.2倍(图26d),表明存在对重组的适度诱导。一起考虑,这些结果显示可转化细胞的共筛选、通过cas9介导的切割对重组的诱导以及针对未编辑的细胞的筛选各自贡献肺炎链球菌中高效率的基因组编辑。[0313]因为cas9对该基因组的切割会杀死未编辑的细胞,技术人员将不期望恢复包含cas9盒而无该编辑模板的接受卡那霉素抗性的任何细胞。然而,在不存在该编辑模板的情况下,申请人在该crispr::ermam(终止子)构建体的转化之后恢复许多卡那霉素抗性菌落(图35a)。这些‘逃脱’crispr诱导的死亡的细胞产生确定该方法的限制的一个背景。此背景频率可被计算为在此试验中crispr::ermam(终止子)/cfu,2.6×10-3(7.1×101/2.7×104)的比率,意味着如果该编辑模板的重组频率少于此值,在此背景上,crispr筛选可能不会有效地恢复希望的突变体。为了理解这些细胞的起源,申请人对8个背景菌落进行基因分型并且发现7个包含靶向间隔子的缺失(图35b)并且一个在cas9中包含一个假定钝化突变(图35c)。[0314]用cas9在大肠杆菌中进行基因组编辑:仅可能在高重组发生的生物体中通过crispr-cas系统的染色体整合激活cas9靶向。为了研发一个适用于其他微生物的更通用的方法,申请人决定在大肠杆菌中使用一个基于质粒的crispr-cas系统进行基因组编辑。构建了两个质粒:携带该tracrrna、cas9以及一个氯霉素抗性盒的一个pcas9质粒(图36),以及携带该crispr间隔子的阵列的一个pcrispr卡那霉素抗性质粒。为了测量独立于crispr筛选的编辑效率,申请人寻求在该rpsl基因中引入一个a至c颠换,这赋予链霉素抗性。申请人构建包含一个间隔子的一个pcrispr::rpsl质粒,其将指导该野生型而不是突变的rpsl等位基因的cas9切割(图27b)。首先将该pcas9质粒引入至大肠杆菌mg1655中,并且将所得的菌株用该pcrispr::rpsl质粒以及w542(包含该a至c突变的一个编辑寡核苷酸)共转化。在该pcrispr::rpsl质粒的转化之后仅恢复了链霉素抗性菌落,表明cas9切割诱导该寡核苷酸的重组(图37)。然而,链霉素抗性菌落的数目比卡那霉素抗性菌落的数目低两个量级,推测其是逃脱cas9的切割的细胞。因此,在这些条件下,cas9的切割促进突变引入,但效率不足以在‘逃脱者’的背景上选择突变细胞。[0315]为了改进大肠杆菌中的基因组编辑效率,申请人应用其crispr系统进行重组工程化,使用cas9诱导的细胞死亡以选择所希望的突变。该pcas9质粒被引入至工程化菌株hme63(31)中,该菌株包含□‑红色噬菌体的gam、exo以及β功能。将所得的菌株用该pcrispr::rpsl质粒(或一种对照)以及该w542寡核苷酸共转化(图27a)。工程化效率是5.3×10-5,计算为当使用该对照质粒时变为链霉素抗性的总细胞的分数(图27c)。相比之下,用该pcrispr::rpsl质粒转化增加突变细胞的百分数至65%±14%(图27c以及29f)。申请人观察到,在该pcrispr::rpsl质粒的转化之后相比于该对照质粒,cfu的数目减少约三个数量级(4.8×105/5.3×ꢀ102,图38a),表明起因于未编辑的细胞的crispr诱导的死亡的筛选。为了测量cas9切割被钝化的比率(申请人的方法的一个重要参数),申请人用pcrispr::rpsl或不具有该w542编辑寡核苷酸的对照质粒转化细胞(图38a)。crispr‘逃脱者’的背景(测量为pcrispr::rpsl/cfu的比率),是2.5×10-4(1.2×102/4.8×105)。对这些逃脱者中的八个进行基因分型揭示,在所有情况下,存在该靶间隔子的缺失(图38b)。此背景高于该rpsl突变的重组工程效率,5.3×10-5,表明为了获得65%的编辑的细胞,cas9切割必须诱导寡核苷酸重组。为了证实这一点,申请人比较了在pcrispr::rpsl或的转化之后卡那霉素以及链霉素抗性cfu的数目(图27d)。和肺炎链球菌的情况一样,申请人观察到对重组的适度诱导,约6.7倍(2.0×10-4/3.0×10-5)。一起考虑,这些结果表明,该crispr系统提供用于通过重组工程化引入选择性突变的方法。[0316]申请人揭示,crispr-cas系统可被用于在细菌中靶向通过共引入杀死野生型细胞的一个靶向构建体以及消除crispr切割并引入所希望的突变两者的一个编辑模板而编辑的基因组。可产生不同类型的突变(插入、缺失或无疤单核苷酸置换)。多个突变可在相同的时间引入。使用该crispr系统进行的编辑的特异性以及多样性依赖于该cas9内切核酸酶的若干独特的特性:(i)其靶特异性可被一个小rna程序化,不需要酶工程,(ii)靶特异性是非常高的,由与低可能性的非靶识别相互作用的20bprna-dna相互作用确定,(iii)几乎可靶定任何序列,仅需要存在一个相邻的ngg序列,(iv)几乎该ngg序列中的任何突变,连同该原型间隔子的种子序列中的突变都消除了靶向。[0317]申请人显示,使用该crispr系统进行的基因组工程化不仅在高度引起重组的细菌诸如肺炎链球菌,也在大肠杆菌中起作用。大肠杆菌中的结果表明,该方法可适用于质粒可被引入的其他微生物。在大肠杆菌中,该途径补充了诱变寡核苷酸的重组工程化。为了在重组工程是不可能的微生物中使用此方法,可通过在一个质粒上提供该编辑模板使用该宿主同源重组机构。此外,因为积累的证据表明crispr介导的染色体的切割在许多细菌以及古生菌中导致至细胞死亡,能够预想使用内源crispr-cas系统用于编辑目的。[0318]在肺炎链球菌以及大肠杆菌两者中,申请人观察到,尽管可转化细胞的共筛选以及通过cas9切割在该靶位点对重组的小诱导促进编辑,向编辑贡献最多的机制是针对未编辑的细胞进行的筛选。因此,该方法的主要限制是逃脱crispr诱导的细胞死亡并且缺少所希望的突变的细胞的背景的存在。申请人显示,这些‘逃脱者’主要通过该靶向间隔子的缺失出现,大概在侧翼于该靶向间隔子的重复序列重组之后。进一步改进可聚集于仍可支持功能性crrna的生源说但与彼此充分不同以消除重组的侧翼序列的工程化。可替代地,可探索嵌合的crrna的直接转化。在大肠杆菌的具体情况下,该crispr-cas系统的构建是不可能的,如果此生物体也被用作克隆宿主的话。通过将cas9以及该tracrrna放置于一个不同于crispr阵列的质粒,申请人解决了这个问题。可诱导系统的工程化也可避免此限制。[0319]尽管新的dna合成技术提供成本有效地建立具有高通量的任何序列的能力,在活细胞中整合合成dna以建立功能性基因组仍是一个挑战。最近,显示共筛选mage策略通过筛选具有在给定的基因座处或周围实现重组的增加的可能性的一个亚群的细胞来改进重组工程的突变效率。在此方法中,引入可选择的突变,用以增加产生附近的不可选择的突变的机会。与此策略提供的间接筛选相反,使用该crispr系统使得能够直接筛选所希望的突变并且以高效率恢复它。这些技术加上遗传工程师的工具箱,并且连同dna合成,它们可实质性地推进破译基因功能和操控生物体两方面的能力,以用于生物技术的目的。两个其他研究也涉及哺乳动物基因组的crispr相关的工程。预期这些crrna指导的基因组编辑技术可广泛有用于基础和医药科学。[0320]菌株和培养条件。肺炎链球菌菌株r6是由亚历山大托马斯(alexandertomasz)博士提供。在前述研究中出现了菌株crr6。肺炎链球菌的液体培养物生长于thye培养基(30g/ltodd-hewitt琼脂,5g/l酵母提取物)。将细胞铺板于补充有5%去纤维蛋白的绵羊血液的胰胨豆胨琼脂(tsa)上。当适合时,如下添加抗生素:卡那霉素(400μg/ml),氯霉素(5μg/ml),红霉素(1μg/ml)链霉素(100μg/ml)或大观霉素(100μg/ml)。使用如之前所述的米勒测定(millerassay)来测量β-半乳糖苷酶活性。[0321]分别通过杰夫罗伯茨(jeffroberts)以及唐纳德考特(donaldcourt)提供大肠杆菌菌株mg1655以及hme63(源自于mg1655,δ(argf‑ꢀlac)u169λci857δcro-bioagalktyr145uagmuts《》amp)(31)。大肠杆菌的液体培养物生长于lb培养基(difco)中。当适合时,如下添加抗生素:氯霉素(25μg/ml),卡那霉素(25μg/ml)以及链霉素(50μg/ml)。[0322]肺炎链球菌转化。如在前(23)所述制备感受态细胞。对于所有基因组编辑转化,将细胞在冰上缓慢解冻并且重悬于10体积的m2培养基(补充有100ng/ml的感受态刺激肽csp1(40)),并且随后添加编辑构建体(编辑构建体是以0.7ng/μl至2.5μg/ul之间的最终浓度添加到细胞中的)。在添加2μl的靶向构建体之前将细胞在37℃孵育20min,并且然后在37℃孵育40min。将连续稀释的细胞铺板于适合的培养基以确定集落形成单位(cfu)计数。[0323]大肠杆菌λ-红重组工程。针对所有重组工程实验使用菌株hme63。制备重组工程细胞并且根据之前公开的方案(6)进行处理。简而言之,使由从板上获得的单菌落接种的2ml过夜培养物(lb培养基)生长于30℃。将该过夜培养物稀释100倍并伴随摇动(200rpm)生长于30℃直至该od600是从0.4-0.5(大约3小时)。对于λ-红诱导,将该培养物转移至42℃水浴以在200rpm摇动15min。恰在诱导之后,使该培养物旋流于冰-水浆中并且在冰上冷冻5-10min。然后洗涤细胞并且根据该方案等分。为了电转化,将50μl的细胞与1mm的无盐寡核苷酸(idt)或100-150ng的质粒dna(通过qiaprepspinminiprep试剂盒,凯杰公司(qiagen)制备)混合。将细胞使用1mm基因脉冲发生器小池(genepulsercuvette)(伯乐公司(bio-rad))在1.8kv进行电穿孔并且立即重悬于1ml的室温lb培养基中。在铺板于具有适合的抗生素抗性的lb琼脂之前,将细胞在30℃恢复1‑ꢀ2小时,并且在32℃孵育过夜。[0324]肺炎链球菌基因组dna的制备。为了转化目的,使用wizard基因组dna纯化试剂盒提取肺炎链球菌基因组dna,遵循由制造商(普洛麦格(promega))提供的说明。为了基因分型的目的,使700ul的过夜肺炎链球菌培养物沉淀,重悬于60ul的溶菌酶溶液(2mg/ml)中并且在37℃孵育30min。使用qiaprepspinminiprep试剂盒(凯杰公司(qiagen))提取基因组dna。[0325]菌株构建。在此研究中使用的所有引物提供在表g中。为了产生肺炎链球菌crr6m,制备一种中间菌株,lam226。在此菌株中,邻近于肺炎链球菌crr6菌株的crispr阵列的apha-3基因(提供卡那霉素抗性)被一个cat基因(提供氯霉素抗性)替代。简而言之,分别使用引物l448/l444以及l447/l481扩增crr6基因组dna。使用引物l445/l446从质粒pc194扩增该cat基因。每种pcr产物都是凝胶纯化的并且通过基因拼接(soeing)pcr用引物l448/l481融合所有三种。将所得的pcr产物转化至感受态肺炎链球菌crr6细胞中,并且筛选氯霉素抗性转化体。为了产生肺炎链球菌crr6m,通过pcr分别使用引物l409/l488以及l448/l481扩增肺炎链球菌crr6基因组dna。每种pcr产物都是凝胶纯化的并且通过基因拼接(soeing)pcr用引物l409/l481融合它们。将所得的pcr产物转化至感受态肺炎链球菌lam226细胞中,并且筛选卡那霉素抗性转化体。[0326]为了产生肺炎链球菌crr6rc,通过pcr使用引物l430/w286扩增肺炎链球菌crr6m基因组dna,并且通过pcr使用引物w288/l481扩增肺炎链球菌lam226基因组dna。每种pcr产物都是凝胶纯化的并且通过基因拼接(soeing)pcr用引物l430/l481融合它们。将所得的pcr产物转化至感受态肺炎链球菌crr6m细胞中,并且筛选氯霉素抗性转化体。[0327]为了产生肺炎链球菌crr6rk,通过pcr分别使用引物l430/w286以及w287/l481扩增肺炎链球菌crr6m基因组dna。每种pcr产物都是凝胶纯化的并且通过基因拼接(soeing)pcr用引物l430/l481融合它们。将所得的pcr产物转化至感受态肺炎链球菌crr6rc细胞中,并且筛选卡那霉素抗性转化体。[0328]为了产生jen37,通过pcr分别使用引物l430/w356以及w357/l481扩增肺炎链球菌crr6rk基因组dna。每种pcr产物都是凝胶纯化的并且通过基因拼接(soeing)pcr用引物l430/l481融合它们。将所得的pcr产物转化至感受态肺炎链球菌crr6rc细胞中,并且筛选卡那霉素抗性转化体。[0329]为了产生jen38,分别使用引物l422/l461以及l459/l426扩增r6基因组dna。43使用引物l457/l458从质粒pfw15扩增ermam基因(指定红霉素抗性)。每种pcr产物都是凝胶纯化的并且通过基因拼接(soeing)pcr用引物l422/l426融合所有三种。将所得的pcr产物转化至感受态肺炎链球菌crr6rc细胞中,并且筛选红霉素抗性转化体。[0330]肺炎链球菌jen53是以两个步骤产生的。首先如在图33中所示的,构建jen43。jen53是通过将jen25的基因组dna转化至感受态jen43细胞中并且在氯霉素以及红霉素两者上进行筛选产生的。[0331]为了产生肺炎链球菌jen62,通过pcr分别使用引物w256/w365以及w366/l403扩增肺炎链球菌crr6rk基因组dna。将每种pcr产物纯化并且通过吉布森拼接连接。将拼接产物转化至感受态肺炎链球菌crr6rc细胞中,并且筛选卡那霉素抗性转化体。[0332]质粒构建。pdb97是通过磷酸化作用以及对寡核苷酸b296/b297退火,随后在由ecori/bamhi消化的plz12spec中连接构建的。申请人完全测序了plz12spec并且将其序列保存于基因库(登记号:kc112384)。[0333]pdb98是在克隆该crispr之后获得的,连同一个重复-间隔子-重复单位一起将前导子序列克隆至plz12spec中。这是通过用引物b298/b320以及b299/b321扩增crr6rcdna,随后进行两种产物的基因拼接pcr并且以限制酶切位点bamhi/ecori克隆到plz12spec中实现的。以此方式,pdb98中的间隔子序列被工程化以包含两个处于相反方向的bsai限制酶切位点,这允许无疤克隆新的间隔子。[0334]pdb99至pdb108是通过退火寡核苷酸b300/b301(pdb99)、b302/b303(pdb100)、b304/b305(pdb101)、b306/b307(pdb102)、b308/b309(pdb103)、b310/b311(pdb104)、b312/b313(pdb105)、b314/b315(pdb106)、b315/b317(pdb107)、b318/b319(pdb108),随后在pdb98切口通过bsai连接来构建的。[0335]该pcas9质粒是如下构建的。从具有供吉布森拼接(gibsonassembly)的侧翼同源臂的化脓链球菌sf370基因组dna扩增必需的crispr元件。用寡核苷酸hc008以及hc010扩增该tracrrna以及cas9。hc011/hc014以及hc015/hc009扩增前导子以及crispr序列,以将两个bsai类型iis位点引入在两个同向重复之间,以促进间隔子的方便插入。[0336]pcrispr是通过在pze21-mcs1中通过用寡聚物b298 b299扩增亚克隆pcas9crispr阵列并用ecori以及bamhi限制来构建的。rpsl靶向间隔子是如下克隆的,通过退火寡聚物b352 b353并且在该bsai切口pcrispr进行克隆,给出pcrispr::rpsl。[0337]靶向以及编辑构建体的产生。用于基因组编辑的靶向构建体是通过左pcr和右pcr的吉布森拼接制备的(表g)。当可适用时编辑构建体是通过基因拼接pcr融合pcr产物a(pcra)、pcr产物b(pcrb)以及pcr产物c(pcrc)制备的(表g)。以及crispr::ermam(终止子)靶向构建体是分别通过jen62以及crr6基因组dna(具有寡聚物l409以及l481)的pcr扩增产生的。[0338]具有随机化的pam或原型间隔子的靶标的产生。该间隔子1靶标后的5个核苷酸通过用引物w377/l426扩增r68232.5基因组dna被随机化。然后此pcr产物与用引物l422/w376从相同的模板扩增的cat基因以及srta上游区域拼接。80ng的拼接dna被用以转化菌株r6以及crr6。用于该随机化靶标的样品是使用以下引物制备的:b280-b290/l426以随机化该靶标的碱基1-10以及b269-b278/l426以随机化碱基10-20。引物l422/b268以及l422/b279被用以扩增分别待与最初以及最后10个pcr产物拼接的cat基因以及srta上游区域。将这些拼接构建体汇集在一起并且在r6以及crr6中转化30ng。转化之后,将细胞铺板于氯霉素筛选板上。对于每个样品,超过2ꢀ×105个细胞一起被汇集在1ml的thye中,并且用普洛麦格(promega)wizard试剂盒提取基因组dna。引物b250/b251被用以扩增该靶区域。标记pcr产物并且使用300个循环在一个亿明达(illumina)miseq双末端泳道上跑胶。[0339]深度测序数据分析[0340]随机化pam:对于随机化pam试验,针对crr6获得3,429,406个读数并且针对r6获得3,253,998个读数。期望它们中仅一半对应于该pam‑ꢀ靶标而另一半将对pcr产物的另一端进行测序。1,623,008个crr6读数以及1,537,131个r6读数含有一个无误差靶序列。这些读数中每个可能的pam的发生示于补充文件中。为了评估pam的功能性,计算crr6样品中与r6样品中的相对比例并且表示为rijklm,其中i、j、k、l、m是这4个可能碱基中的一个。构建以下统计模型:[0341]log(rijklm)=μ b2i b3j b4k b2b3i,j b3b4j,k εijklm,[0342]其中ε是残差,b2是pam的第2个碱基的作用,b3是第三个碱基的作用,b4是第四个碱基的作用,b2b3是第二和第三碱基之间的相互作用,b3b4是第三和第四碱基之间的相互作用。进行方差分析:[0343]anova表[0344]当添加到此模型时,b1或b5看起来不显著并且除包含的那些外的其他相互作用也可舍弃。模型选择是使用r中的anova方法或多或少通过完整模型的连续比较进行的。tukey显著性检验(tukey’shonestsignificancetest)被用以确定各影响之间成对发生的差异是否显著。[0345]nggnn型与所有其他型显著不同,并且具有最强影响(参见下表)。[0346]为了显示位置1、4或5不影响该nggnn型,申请人仅着眼于这些序列。它们的影响看起来是正态分布的(参见图71中的qq绘图),并且使用r中的anova方法进行的模型比较显示空(null)模型是最好的一个,即,不存在b1、b4以及b5的显著作用。[0347]针对该nggnn序列使用r中的anova方法进行的模型比较[0348]nagnn以及nnggn型的部分干扰[0349]nagnn型与所有其他型显著不同但具有比nggnn小得多的影响(参见以下的tukey显著性检验)。[0350]最终,ntggn以及ncggn型是类似的并且显示比ntghn以及ncghn(其中h是a、t或c)型显著更多的crispr干扰,如通过邦费罗尼(bonferroni)调节的成对学生检验显示的。[0351]使用t检验以汇集的sd成对比较b4对nygnn序列的影响[0352]一起考虑,这些结果允许推断,通常nnggn型在ngggn的情况下产生完全干扰,或在naggn、ntggn或ncggn的情况下产生部分干扰。[0353]平均值的tukey多重比较:95%多重比较(family-wise)置信水平[0354]随机化靶标[0355]对于随机化靶标试验,针对crr6获得540,726个读数并且针对r6获得753,570个读数。如前所述,仅预期这些读数中一半对该pcr产物的感兴趣的端进行测序。在过滤之后,对于携带一个靶标的无误差或具有单个点突变的读数针对crr6以及r6分别保留217,656个和353,141个。计算了该crr6样品中每个突变体与该r6样品中的相对比例(图24c)。该种子序列(距离该pam13-20个碱基)外的所有突变显示完全干扰。那些序列被用作一个参考以确定该种子序列内的其他突变是否可以被认为是显著破坏干扰。使用massr软件包的fitdistr函数对这些序列拟合正态分布。在图24c中,该拟合的分布的0.99分位点显示为一条虚线。图72显示具有拟合正态分布(黑色线)以及.99分位数(虚线)的数据密度的直方图。[0356]表f.crr6/r6样品中pam序列的相对丰度(经碱基1和5进行平均)。[0357]表g.这项研究中使用的引物。[0358]表h.在此研究中使用的靶向以及编辑构建体的设计实例6:对化脓链球菌cas9(称为spcas9)的指导rna的优化。[0359]申请人使该tracrrna以及同向重复序列突变,或使该嵌合指导rna突变以增强细胞中的rna。[0360]该优化是基于以下观察,在该tracrrna以及指导rna中存在胸腺嘧啶(t)的延伸,这能够通过pol3启动子导致早期转录终止。因此申请人生成以下优化序列。优化的tracrrna以及对应的优化的同向重复是成对显示的。[0361]优化的tracrrna1(突变加下划线):[0362]ggaaccattcataacagcatagcaagttataataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttt[0363]优化的同向重复1(突变加下划线):[0364]gttatagagctatgctgttatgaatggtcccaaaac[0365]优化的tracrrna2(突变加下划线):[0366]ggaaccattcaatacagcatagcaagttaatataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttt[0367]优化的同向重复2(突变加下划线):[0368]gtattagagctatgctgtattgaatggtcccaaaac[0369]为了真核细胞中的最佳活性,申请人还优化了嵌合指导rna。[0370]原始的指导rna:[0371]nnnnnnnnnnnnnnnnnnnngttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[0372]优化的嵌合指导rna序列1:[0373]nnnnnnnnnnnnnnnnnnnngtattagagctagaaatagcaagttaatataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[0374]优化的嵌合指导rna序列2:[0375]nnnnnnnnnnnnnnnnnnnngttttagagctatgctgttttggaaacaaaacagcatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[0376]优化的嵌合指导rna序列3:[0377]nnnnnnnnnnnnnnnnnnnngtattagagctatgctgtattggaaacaatacagcatagcaagttaatataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[0378]申请人揭示,优化的嵌合指导rna更好地起作用,如在图3中表明的。通过用cas9以及一个u6-指导rnadna盒共转染293ft细胞进行该试验,以表达以上所示的四个rna形式之一。该指导rna的靶标在人emx1座位中是同一个靶位点:“gtcacctccaatgactaggg”实例7:嗜热链球菌lmd-9crispr1cas9(称为st1cas9)的优化。[0379]申请人设计如图4中所示的指导嵌合rna。[0380]通过断裂多胸腺嘧啶(t)进行延伸,该st1cas9指导rna可经受如针对spcas9指导rna进行的相同类型的优化。实例8:cas9多样性以及突变[0381]crispr-cas系统是一种由跨细菌和古生菌的相异物种利用的针对侵入型外源dna的获得性免疫机制。ii型crispr-cas9系统由一套编码负责将外源dna“捕获(acquisition)”进crispr座位中的蛋白质的基因以及一套编码负责“执行(execution)”dna切割机制的蛋白质的基因组成;这些包括dna核酸酶(cas9)、非编码反式激活cr-rna(tracrrna)以及侧翼为同向重复的外源dna衍生的间隔子阵列(crrna)。当被cas9成熟后,tracrna和crrna双链体指导cas9核酸酶到由间隔子指导序列规定的靶dna序列,并且在靶dna中介导短序列基序附近的dna中的双链断裂,该导短序列基序为切割所需并且对于每种crispr-cas系统而言是特异的。ii型crispr-cas系统发现在整个细菌界中并且在用于靶标切割的cas9蛋白序列和尺寸、tracrrna和crrna同向重复序列、这些元件的基因组组织以及基序要求方面高度相异。一个物种可以具有多种相异的crispr-cas系统。[0382]申请人评价了来自基于与已知cas9的序列同源性和与已知亚结构域直向同源的结构鉴定的细菌种类的207个假定的cas9,这些亚结构域包括hnh内切核酸酶结构域和ruvc内切核酸酶结构域[信息来自尤金库宁(eugenekoonin)和基拉马卡洛娃(kiramakarova)]。基于此套的蛋白质序列保守的系统发生分析揭示了五个cas9家族,包括三组大的cas9(约1400个氨基酸)和两组小的cas9(约1100个氨基酸)(参见图39和40a-f)。[0383]在此实例中,申请人显示以下突变可以将spcas9转化为切口酶:d10a、e762a、h840a、n854a、n863a、d986a。[0384]申请人提供了显示出序列突变点位于spcas9基因内何处的序列(图41)。申请人还揭示,这些切口酶仍能够介导同源重组(图2中指出的测定)。此外,申请人揭示,具有这些突变的spcas9(单独地)不诱导双链断裂(图47)。实例9:对rna指导的cas9核酸酶的dna靶向特异性的补充[0385]细胞培养和转染[0386]在37℃下,伴随5%co2孵育,将人类胚肾(hek)细胞系293ft(生命技术公司)维持在补充有10%胎牛血清(海可隆公司(hyclone))、2mmglutamax(生命技术公司)、100u/ml青霉素及100μg/ml链霉素的杜尔贝科改良伊格尔培养基(dulbecco’smodifiedeagle’smedium)(dmem)中。[0387]在转染之前24小时将293ft细胞种到6孔板、24孔板、或96孔板(康宁公司(corning))上。遵循制造商推荐的方案,使用lipofectamine2000(生命技术公司)以80%-90%融合转染细胞。对于6孔板的每个孔,使用总共1ug的cas9 sgrna质粒。对于24孔板的每个孔,使用总共500ngcas9 sgrna质粒,除非另外指明。对于96孔板的每个孔,以与u6-sgrnapcr产物1:1摩尔比率使用65ng的cas9质粒。[0388]人胚胎干细胞系hues9(哈佛干细胞研究所中心(harvardstemcellinstitutecore))维持在补充有100ug/mlnormocin(invivogen)的mtesr培养基(干细胞技术(stemcelltechnologies))中geltrex(生命技术公司)上的无进料器的条件中。遵循制造商方案用amaxap3原代细胞4-d核转染仪试剂盒(lonza)转染hues9细胞。[0389]用于基因组修饰的surveyor核酸酶测定[0390]如上所述,用质粒dna转染293ft细胞。转染后,在基因组dna提取之前,将细胞在37℃下孵育72小时。遵循制造商的方案,使用quickextractdna提取溶液(epicentre)提取基因组dna。简言之,将丸状的细胞重悬于quickextract溶液中并在65℃下孵育15分钟并且在98℃下孵育10分钟。[0391]对于每个基因而言,pcr扩增(引物列于表j和k中)在crispr靶位点侧翼的基因组区域,并且遵循制造商的方案,使用qiaquickspin柱(凯杰公司(qiagen))纯化产物。将总共400ng的纯化的pcr产物与2μl10xtaqdna聚合酶pcr缓冲液(enzymatics公司)和超纯水混合,至终体积为20μl,并使其经受重退火过程,以使得可以形成异源双链体:95℃持续10min,以-2℃/s从95℃降至85℃,以-0.25℃/s从85℃降至25℃,并且在25℃保持1分钟。重退火后,遵循制造商推荐的方案,将产物用surveyor核酸酶和surveyor增强子s(转基因组学公司(transgenomics))处理,并且在4%-20%novextbe聚丙烯酰胺凝胶(生命技术公司)上进行分析。将凝胶用sybrgolddna染色剂(生命技术公司)染色30分钟并用geldoc凝胶成像系统(伯乐公司(bio-rad))成像。基于相对条带强度进行量化。[0392]人细胞中的tracrrna表达的northern印迹分析[0393]如前所述进行northern印迹。1简言之,在装载于8%变性多丙烯酰胺凝胶(sequagel,国立诊断公司(nationaldiagnostics))上之前,将rna加热至95℃持续5min。之后,将rna转移至一种预杂交的hybondn 膜(通用电气医疗公司(gehealthcare))并且与stratageneuv交联剂(stratagene)交联。将探针用具有t4多核苷酸激酶(新英格兰生物实验室(newenglandbiolabs)))的[γ-32p]atp(珀金埃尔默公司)标记。在洗涤后,将膜暴露于荧光屏一小时并且用感光成像仪(typhoon)扫描。[0394]亚硫酸氢盐测序以评估dna甲基化状态[0395]如上所述,用cas9转染hek293ft细胞。将基因组dna以dneasy血液&组织试剂盒(凯杰公司(qiagen))分离并且用ezdna甲基化闪电试剂盒(methylation-lightningkit)(zymo研究公司)进行亚硫酸氢盐转化。使用kapa2grobusthotstartdna聚合酶(kapa生物系统)进行亚硫酸氢盐pcr,其中使用亚硫酸氢盐引物探索者(bisulfiteprimerseeker)(zymo研究公司,表j以及k)设计引物。将所得的pcr扩增子进行凝胶纯化,用ecori以及hindiii消化,并且在转化之前连接至puc19骨架中。然后将个体克隆进行桑格测序以评估dna甲基化状态。[0396]体外转录以及切割测定[0397]如上所述,用cas9转染hek293ft细胞。然后用补充有蛋白酶抑制剂混合液(罗氏公司(roche))的一种裂解缓冲液(20mmhepes,100mmkcl,5mmmgcl2,1mmdtt,5%甘油,0.1%tritonx-100)制备全细胞裂解液。遵循制造商建议的方案,使用自定义的寡聚物(实例10)以及hiscribet7体外转录试剂盒(neb)体外转录t7驱动的sgrna。为了制备甲基化靶位点,将puc19质粒通过m.sssi甲基化并且然后通过nhei线性化。如下进行体外切割测定:对于一种20ul切割反应,将10ul的细胞裂解液用2ul切割缓冲液(100mmhepes,500mmkcl,25mmmgcl2,5mmdtt,25%甘油)、体外转录的rna、以及300ngpuc19质粒dna孵育。[0398]深度测序以评估靶向特异性[0399]在基因组dna提取之前,将铺板于96孔板的hek293ft细胞用cas9质粒dna以及单个指导rna(sgrna)pcr盒转染72小时(图72)。通过一种融合pcr方法以将亿明达p5适配子连同独特的样品特异性条形码附接至该靶扩增子,针对每个基因的侧翼crispr靶位点的基因组区域进行扩增(图74,(实例10)(图73中示意性描述)。遵循制造商建议的方案,将pcr产物使用econospin96孔滤板(时代生命科学公司(epochlifesciences))纯化。[0400]将带条形码并纯化的dna样品通过quant-itpicogreendsdna测定试剂盒或qubit2.0荧光计(生命技术公司)定量并且以等摩尔比率汇集。然后用亿明达miseq个人测序仪(生命技术公司)对测序文库进行深度测序。[0401]测序数据分析以及indel检测[0402]将miseq读数通过至少23的平均phred质量(q得分)连同与条形码以及扩增子正向引物匹配的完美序列过滤。通过首先针对包括靶位点(总共120bp)的上游以及下游的50个核苷酸的扩增子序列进行史密斯-沃特曼(smith-waterman)比对,分析来自中靶(on-target)以及脱靶(off‑ꢀtarget)基因座的读数。同时,针对从靶位点(总共30bp)的上游5个核苷酸到下游5个核苷酸的indel来分析比对。如果其比对的部分落到该miseq读数本身外,或如果匹配的碱基对包括少于其总长的85%,则所分析的靶区域被舍弃。[0403]针对每个样品的阴性对照提供了将indel的包含或排除作为假定的切割事件的一个量规。针对每个样品,仅在如果其质量得分超过μ-σ的时候对一个indel进行计数,其中μ是相应于该样品的该阴性对照的平均质量得分,并且σ是其标准差。这产生针对阴性对照及其对应样品两者的整个靶区域indel率。使用该阴性对照的每靶区域每读数(per-target-region-per-read)误差率,q,该样品的观察到的indel计数n,及其读数计数r(即具有真实indel的靶区域的读数分数的极大似然估计)p是通过应用一个二项误差模型导出的,如下所示。[0404]使一个具有不正确地计数为具有至少1个indel的靶区域的样品中的读数的(未知)数目是e,我们可将其书写为(不对真实indel的数目做任何假定)[0405]因为r(1-p)是具有无真实indel的靶区域的读数的数目。同时,因为观察到具有indel的读数的数目是n,n=e rp,换句话说,有误差但无真实indel的靶区域的读数的数目加上靶区域正确地具有indel的读数的数目。然后我们可重写以上等式为[0406]使具有真实indelp的靶区域的频率的所有值与先验同等可能,prob(n|p)∝prob(p|n)。因此将对具有真实indel的靶区域的频率的极大似然估计(mle)设为最大化prob(n|p)的p的值。在数字上对此进行评价。[0407]为了对测序文库本身中的真实indel读数频率设置误差界限,考虑到针对真实indel靶区域rp的mle估计,以及读数的数目r,针对每个样品计算威尔逊(wilson)得分间隔(2)。明确地,将下限l以及上限u计算为[0408]其中z,方差1的正态分布中需要的置信度的标准得分被设置为1.96,意味着95%的置信度。[0409]相对cas9以及sgrna表达的qrt-pcr分析[0410]将铺板于24孔板的293ft细胞如上进行转染。转染后72小时,用mirneasy微试剂盒(凯杰公司(qiagen))收获总rna。用qscriptflexcdna试剂盒(vwr)以及自定义的第一链合成引物(表j以及k)进行针对sgrna的反向链合成。用快速sybr绿色预混合液(fastsybrgreenmastermix)(生命技术公司)以及自定义的引物(表j以及k),使用gapdh作为内源对照进行qpcr分析。通过δδct法计算相对定量。[0411]表i|靶位点序列。针对具有必备的pam的化脓链球菌ii型crispr系统,测试靶位点。针对每个靶标,用cas9以及crrna-tracrrna或嵌合sgrna转染细胞。嵌合sgrna转染细胞。[0412]表j|引物序列surveyor测定引物名称基因组靶标引物序列(5’至3’)sp-emx1-f1emx1aaaaccacccttctctctggcsp-emx1-r1emx1ggagattggagacacggagagsp-emx1-f2emx1ccatccccttctgtgaatgtsp-emx1-r2emx1ggagattggagacacggagasp-pvalb-fpvalbctggaaagccaatgcctgacsp-pvalb-rpvalbggcagcaaactccttgtcctqrt-pcr,用于cas9以及sgrna表达亚硫酸氢盐pcr和测序[0413]表k|测试sgrna构造的引物的序列。引物杂交至该u6启动子的反向链,除非另外表明。u6引发位点是斜体的,该指导序列被表示为一段n,该同向重复序列是加粗凸显的,并且该tracrrna序列是加了下划线的。每个sgrna构造的二级结构示于图43中。[0414]表l|用以测试cas9的pam特异性的具有交替的pam的靶位点发现用于pam特异性测试的所有靶位点在人emx1座位内。实例10:补充序列[0415]所有序列均处于5’至3’方向。对于u6转录,加下划线的一串t充当转录终止子。[0416]》u6-短tracrrna(化脓链球菌sf370)[0417][0417][0418](tracrrna序列被加粗)[0419]》u6-dr-指导序列-dr(化脓链球菌sf370)[0420][0421](同向重复序列是以灰色凸显的并且指导序列是加粗的n)[0422]》sgrna,包含 48tracrrna(化脓链球菌sf370)[0423][0424](指导序列是加粗的n并且tracrrna片段被加粗)[0425]》sgrna,包含 54tracrrna(化脓链球菌sf370)[0426][0427](指导序列是加粗的n并且tracrrna片段被加粗)[0428]》sgrna,包含 67tracrrna(化脓链球菌sf370)[0429][0430](指导序列是加粗的n并且tracrrna片段被加粗)[0431]》sgrna,包含 85tracrrna(化脓链球菌sf370)[0432][0433](指导序列是加粗的n并且tracrrna片段被加粗)[0434]》cbh-nls-spcas9-nls[0435][0436](nls-hspcas9-nls是以加粗凸显的)[0437]》测序扩增子,用于emx1指导1.1、1.14、1.17[0438]ccaatggggaggacatcgatgtcacctccaatgactagggtgggcaaccacaaacccacgagggcagagtgctgcttgctgctggccaggcccctgcgtgggcccaagctggactctggccac[0439]》测序扩增子,用于emx1指导1.2、1.16[0440]cgagcagaagaagaagggctcccatcacatcaaccggtggcgcattgccacgaagcaggccaatggggaggacatcgatgtcacctccaatgactagggtgggcaaccacaaacccacgag[0441]》测序扩增子,用于emx1指导1.3、1.13、1.15[0442]ggaggacaaagtacaaacggcagaagctggaggaggaagggcctgagtccgagcagaagaagaagggctcccatcacatcaaccggtggcgcattgccacgaagcaggccaatggggaggacatcgat[0443]》测序扩增子,用于emx1指导1.6[0444]agaagctggaggaggaagggcctgagtccgagcagaagaagaagggctcccatcacatcaaccggtggcgcattgccacgaagcaggccaatggggaggacatcgatgtcacctccaatgactagggtgg[0445]》测序扩增子,用于emx1指导1.10[0446]cctcagtcttcccatcaggctctcagctcagcctgagtgttgaggccccagtggctgctctgggggcctcctgagtttctcatctgtgcccctccctccctggcccaggtgaaggtgtggttcca[0447]》测序扩增子,用于emx1指导1.11、1.12[0448]tcatctgtgcccctccctccctggcccaggtgaaggtgtggttccagaaccggaggacaaagtacaaacggcagaagctggaggaggaagggcctgagtccgagcagaagaagaagggctcccatcaca[0449]》测序扩增子,用于emx1指导1.18、1.19[0450]ctccaatgactagggtgggcaaccacaaacccacgagggcagagtgctgcttgctgctggccaggcccctgcgtgggcccaagctggactctggccactccctggccaggctttggggaggcctggagt[0451]》测序扩增子,用于emx1指导1.20[0452]ctgcttgctgctggccaggcccctgcgtgggcccaagctggactctggccactccctggccaggctttggggaggcctggagtcatggccccacagggcttgaagcccggggccgccattgacagag[0453]》t7启动子f引物,用于靶链退火[0454]gaaattaatacgactcactataggg[0455]》包含puc19靶位点1的寡聚物,用于甲基化(t7反向)[0456]aaaaaagcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgctatttctagctctaaaacaacgacgagcgtgacaccaccctatagtgagtcgtattaatttc[0457]》包含puc19靶位点2的寡聚物,用于甲基化(t7反向)[0458]aaaaaagcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgctatttctagctctaaaacgcaacaattaatagactggacctatagtgagtcgtattaatttc实例11:寡聚物介导的cas9诱导的同源重组[0459]寡聚物同源重组测试是跨不同cas9变体和不同的hr模板的效率的比较(寡聚物对质粒)。[0460]使用293ft细胞。spcas9=野生型cas9并且spcas9n=切口酶cas9(d10a)。该嵌合rna靶标是与在实例5、9以及10中相同的emx1原型间隔子靶标1并且使用page纯化通过idt合成寡聚物。[0461]图44描绘了在此试验中用作同源重组(hr)模板的寡dna的一种设计。长寡聚物包含与emx1座位以及hindiii限制酶切位点100bp同源性。用以下各项共转染293ft细胞:第一,包含一种靶向人emx1座位以及野生型cas9蛋白的嵌合rna的一种质粒,以及第二,作为hr模板的寡dna。样品来自用lipofectamine2000转染96小时后收集的293ft细胞。将所有产物用一种emx1hr引物扩增,凝胶纯化,随后用hindiii消化以检测hr模板整合至人类基因组中的效率。[0462]图45以及46描绘了由cas9蛋白以及hr模板的不同组合诱导的hr效率的比较。使用的cas9构建体是野生型cas9或切口酶版本的cas9(cas9n)。使用的hr模板是:反义寡dna(上图中的反义寡聚物),或有义寡dna(上图中的有义寡聚物),或质粒hr模板(上图中的hr模板)。该有义/反-有义定义是,具有相应于转录的mrna的序列的有效转录的链被定义为基因组的有义链。hr效率显示为hindiii消化条带对所有基因组pcr扩增产物的百分数(底数)。实例12:孤独症小鼠[0463]最近的大规模测序项目已产生大量的与疾病相关联的基因。基因的发现仅是理解该基因做了什么以及它如何导致病态表型的开始。研究候选基因的当前技术以及途径是缓慢且费力的。基因靶向以及遗传敲除的黄金标准需要在财政和研发人员两项上在时间以及资源上进行大量投资。申请人着手利用hspcas9核酸酶以靶向许多基因并且以相较于任何其他技术更高的效率和更低的周转时间如此进行。因为hspcas9的高效率,申请人可将rna注射至小鼠合子中,并且立即获得基因组修饰的动物而不需要在mesc中进行任何初步的基因靶向。[0464]克罗莫结构域螺旋酶dna结合蛋白8(chd8)是一种参与早期脊椎发育以及形态发生的关键基因。缺少chd8的小鼠在胚胎发育过程中死亡。该chd8基因的突变已与人的自闭症谱系障碍相关联。这种关联是在《自然》(nature)中以三篇不同文章同时公开的。相同的三项研究鉴定了种类繁多的与自闭症谱系障碍相关联的基因。申请人的目标是针对在所technologies))。所有实验表示来自3个生物重复的数据,n=3,误差条显示为s.e.m.。实例14:nls:cas9nls[0471]将293ft细胞用包含两种组分的质粒转染:(1)ef1a启动子,驱动具有不同nls设计的cas9(野生型人-密码子优化spcas9)的表达,(2)u6启动子,驱动靶向人emx1座位的相同的嵌合rna。[0472]遵循制造商方案,在转染后72h时间点收集细胞,并且然后用50μl的quickextract基因组dna提取溶液进行提取。将靶emx1基因组dna进行pcr扩增,并且然后用1%琼脂糖凝胶进行凝胶纯化。遵循制造商方案,将基因组pcr产物重退火并且经受surveyor测定。不同构建体的基因组切割效率使用sds-page在一种4%-12%tbe-page凝胶(生命技术公司)上进行测量,分析并且用imagelab(伯乐公司(bio-rad))软件定量,全部操作遵循制造商方案。[0473]图69描绘了不同cas9nls构建体的一种设计。所有cas9都是人‑ꢀ密码子-优化版本的spcas9。在n-末端或c-末端,nls序列被连接至该cas9基因。将具有不同nls设计的所有cas9变体克隆至包含ef1a启动子的一种骨架载体中,所以它由ef1a启动子驱动。在相同的载体中,存在靶向人emx1座位的由u6启动子驱动的一种嵌合rna,一起形成一个二组分系统。[0474]表m.cas9nls设计测试结果。通过surveyor测定对不同cas9-nls构建体的基因组切割进行定量。[0475]图70描绘了由具有不同nls设计的cas9变体诱导的基因组切割的效率。该百分数表明被每个构建体切割的人emx1基因组dna的部分。所有实验来自3个生物重复。n=3,误差表示为s.e.m.。实例15:使用cas9工程化微藻[0476]递送cas9的方法[0477]方法1:申请人使用在组成型启动子(如hsp70a-rbcs2或β2-微管蛋白)的控制之下表达cas9的载体递送cas9和指导rna。[0478]方法2:申请人使用在组成型启动子(如hsp70a-rbcs2或β2-微管蛋白)的控制之下表达cas9和t7聚合酶的载体递送cas9和t7聚合酶。将使用包含驱动指导rna的t7启动子的载体递送该指导rna。[0479]方法3:申请人将cas9mrna和体外转录的指导rna递送到藻类细胞中。rna可以在体外转录。cas9mrna将由cas9的编码区以及来自的cop1的3’utr组成,以保证cas9mrna的稳定。[0480]用于同源重组,申请人提供了一个另外的同源定向修复模板。[0481]在位于cop1的3’utr之后的β-2微管蛋白启动子的控制之下驱动cas9的表达的盒的序列。[0482]tctttcttgcgctatgacacttccagcaaaaggtagggcgggctgcgagacggcttcccggcgctgcatgcaacaccgatgatgcttcgaccccccgaagctccttcggggctgcatgggcgctccgatgccgctccagggcgagcgctgtttaaatagccaggcccccgattgcaaagacattatagcgagctaccaaagccatattcaaacacctagatcactaccacttctacacaggccactcgagcttgtgatcgcactccgctaagggggcgcctcttcctcttcgtttcagtcacaacccgcaaacatgtacccatacgatgttccagattacgcttcgccgaagaaaaagcgcaaggtcgaagcgtccgacaagaagtacagcatcggcctggacatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggcaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggcgacagccccaagaagaagagaaaggtggaggccagctaaggatccggcaagactggccccgcttggcaacgcaacagtgagcccctccctagtgtgtttggggatgtgactatgtattcgtgtgttggccaacgggtcaacccgaacagattgatacccgccttggcatttcctgtcagaatgtaacgtcagttgatggtact[0483]在位于cop1的3’utr之后的β-2微管蛋白启动子的控制之下驱动t7聚合酶的表达的盒的序列:[0484]tctttcttgcgctatgacacttccagcaaaaggtagggcgggctgcgagacggcttcccggcgctgcatgcaacaccgatgatgcttcgaccccccgaagctccttcggggctgcatgggcgctccgatgccgctccagggcgagcgctgtttaaatagccaggcccccgattgcaaagacattatagcgagctaccaaagccatattcaaacacctagatcactaccacttctacacaggccactcgagcttgtgatcgcactccgctaagggggcgcctcttcctcttcgtttcagtcacaacccgcaaacatgcctaagaagaagaggaaggttaacacgattaacatcgctaagaacgacttctctgacatcgaactggctgctatcccgttcaacactctggctgaccattacggtgagcgtttagctcgcgaacagttggcccttgagcatgagtcttacgagatgggtgaagcacgcttccgcaagatgtttgagcgtcaacttaaagctggtgaggttgcggataacgctgccgccaagcctctcatcactaccctactccctaagatgattgcacgcatcaacgactggtttgaggaagtgaaagctaagcgcggcaagcgcccgacagccttccagttcctgcaagaaatcaagccggaagccgtagcgtacatcaccattaagaccactctggcttgcctaaccagtgctgacaatacaaccgttcaggctgtagcaagcgcaatcggtcgggccattgaggacgaggctcgcttcggtcgtatccgtgaccttgaagctaagcacttcaagaaaaacgttgaggaacaactcaacaagcgcgtagggcacgtctacaagaaagcatttatgcaagttgtcgaggctgacatgctctctaagggtctactcggtggcgaggcgtggtcttcgtggcataaggaagactctattcatgtaggagtacgctgcatcgagatgctcattgagtcaaccggaatggttagcttacaccgccaaaatgctggcgtagtaggtcaagactctgagactatcgaactcgcacctgaatacgctgaggctatcgcaacccgtgcaggtgcgctggctggcatctctccgatgttccaaccttgcgtagttcctcctaagccgtggactggcattactggtggtggctattgggctaacggtcgtcgtcctctggcgctggtgcgtactcacagtaagaaagcactgatgcgctacgaagacgtttacatgcctgaggtgtacaaagcgattaacattgcgcaaaacaccgcatggaaaatcaacaagaaagtcctagcggtcgccaacgtaatcaccaagtggaagcattgtccggtcgaggacatccctgcgattgagcgtgaagaactcccgatgaaaccggaagacatcgacatgaatcctgaggctctcaccgcgtggaaacgtgctgccgctgctgtgtaccgcaaggacaaggctcgcaagtctcgccgtatcagccttgagttcatgcttgagcaagccaataagtttgctaaccataaggccatctggttcccttacaacatggactggcgcggtcgtgtttacgctgtgtcaatgttcaacccgcaaggtaacgatatgaccaaaggactgcttacgctggcgaaaggtaaaccaatcggtaaggaaggttactactggctgaaaatccacggtgcaaactgtgcgggtgtcgacaaggttccgttccctgagcgcatcaagttcattgaggaaaaccacgagaacatcatggcttgcgctaagtctccactggagaacacttggtgggctgagcaagattctccgttctgcttccttgcgttctgctttgagtacgctggggtacagcaccacggcctgagctataactgctcccttccgctggcgtttgacgggtcttgctctggcatccagcacttctccgcgatgctccgagatgaggtaggtggtcgcgcggttaacttgcttcctagtgaaaccgttcaggacatctacgggattgttgctaagaaagtcaacgagattctacaagcagacgcaatcaatgggaccgataacgaagtagttaccgtgaccgatgagaacactggtgaaatctctgagaaagtcaagctgggcactaaggcactggctggtcaatggctggcttacggtgttactcgcagtgtgactaagcgttcagtcatgacgctggcttacgggtccaaagagttcggcttccgtcaacaagtgctggaagataccattcagccagctattgattccggcaagggtctgatgttcactcagccgaatcaggctgctggatacatggctaagctgatttgggaatctgtgagcgtgacggtggtagctgcggttgaagcaatgaactggcttaagtctgctgctaagctgctggctgctgaggtcaaagataagaagactggagagattcttcgcaagcgttgcgctgtgcattgggtaactcctgatggtttccctgtgtggcaggaatacaagaagcctattcagacgcgcttgaacctgatgttcctcggtcagttccgcttacagcctaccattaacaccaacaaagatagcgagattgatgcacacaaacaggagtctggtatcgctcctaactttgtacacagccaagacggtagccaccttcgtaagactgtagtgtgggcacacgagaagtacggaatcgaatcttttgcactgattcacgactccttcggtacgattccggctgacgctgcgaacctgttcaaagcagtgcgcgaaactatggttgacacatatgagtcttgtgatgtactggctgatttctacgaccagttcgctgaccagttgcacgagtctcaattggacaaaatgccagcacttccggctaaaggtaacttgaacctccgtgacatcttagagtcggacttcgcgttcgcgtaaggatccggcaagactggccccgcttggcaacgcaacagtgagcccctccctagtgtgtttggggatgtgactatgtattcgtgtgttggccaacgggtcaacccgaacagattgatacccgccttggcatttcctgtcagaatgtaacgtcagttgatggtact[0485]由t7启动子驱动的指导rna的序列(t7启动子,n表示靶向序列):[0486][0487]基因递送:[0488]来自衣藻资源中心(chlamydomonasresourcecenter)的莱茵衣藻株cc-124和cc-125将被用于电穿孔。电穿孔方案遵循来自geneartchlamydomonasengineering试剂盒的标准推荐方案。[0489]而且,申请人产生组成性地表达cas9的莱茵衣藻系。这可以通过使用pchlamy1(使用pvui线性化)并选择潮霉素抗性菌落而完成。以下是包含cas9的pchlamy1的序列。以此方式实现基因敲除,简单地需要递送指导rna的rna。对于同源重组,申请人递送了指导rna以及线性化同源重组模板。[0490]pchlamy1-cas9:[0491]tgcggtatttcacaccgcatcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgttgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggtcgctgaggcttgacatgattggtgcgtatgtttgtatgaagctacaggactgatttggcgggctatgagggcgggggaagctctggaagggccgcgatggggcgcgcggcgtccagaaggcgccatacggcccgctggcggcacccatccggtataaaagcccgcgaccccgaacggtgacctccactttcagcgacaaacgagcacttatacatacgcgactattctgccgctatacataaccactcagctagcttaagatcccatcaagcttgcatgccgggcgcgccagaaggagcgcagccaaaccaggatgatgtttgatggggtatttgagcacttgcaacccttatccggaagccccctggcccacaaaggctaggcgccaatgcaagcagttcgcatgcagcccctggagcggtgccctcctgataaaccggccagggggcctatgttctttacttttttacaagagaagtcactcaacatcttaaaatggccaggtgagtcgacgagcaagcccggcggatcaggcagcgtgcttgcagatttgacttgcaacgcccgcattgtgtcgacgaaggcttttggctcctctgtcgctgtctcaagcagcatctaaccctgcgtcgccgtttccatttgcaggagattcgaggtaccatgtacccatacgatgttccagattacgcttcgccgaagaaaaagcgcaaggtcgaagcgtccgacaagaagtacagcatcggcctggacatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggcaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggcgacagccccaagaagaagagaaaggtggaggccagctaacatatgattcgaatgtctttcttgcgctatgacacttccagcaaaaggtagggcgggctgcgagacggcttcccggcgctgcatgcaacaccgatgatgcttcgaccccccgaagctccttcggggctgcatgggcgctccgatgccgctccagggcgagcgctgtttaaatagccaggcccccgattgcaaagacattatagcgagctaccaaagccatattcaaacacctagatcactaccacttctacacaggccactcgagcttgtgatcgcactccgctaagggggcgcctcttcctcttcgtttcagtcacaacccgcaaacatgacacaagaatccctgttacttctcgaccgtattgattcggatgattcctacgcgagcctgcggaacgaccaggaattctgggaggtgagtcgacgagcaagcccggcggatcaggcagcgtgcttgcagatttgacttgcaacgcccgcattgtgtcgacgaaggcttttggctcctctgtcgctgtctcaagcagcatctaaccctgcgtcgccgtttccatttgcagccgctggcccgccgagccctggaggagctcgggctgccggtgccgccggtgctgcgggtgcccggcgagagcaccaaccccgtactggtcggcgagcccggcccggtgatcaagctgttcggcgagcactggtgcggtccggagagcctcgcgtcggagtcggaggcgtacgcggtcctggcggacgccccggtgccggtgccccgcctcctcggccgcggcgagctgcggcccggcaccggagcctggccgtggccctacctggtgatgagccggatgaccggcaccacctggcggtccgcgatggacggcacgaccgaccggaacgcgctgctcgccctggcccgcgaactcggccgggtgctcggccggctgcacagggtgccgctgaccgggaacaccgtgctcaccccccattccgaggtcttcccggaactgctgcgggaacgccgcgcggcgaccgtcgaggaccaccgcgggtggggctacctctcgccccggctgctggaccgcctggaggactggctgccggacgtggacacgctgctggccggccgcgaaccccggttcgtccacggcgacctgcacgggaccaacatcttcgtggacctggccgcgaccgaggtcaccgggatcgtcgacttcaccgacgtctatgcgggagactcccgctacagcctggtgcaactgcatctcaacgccttccggggcgaccgcgagatcctggccgcgctgctcgacggggcgcagtggaagcggaccgaggacttcgcccgcgaactgctcgccttcaccttcctgcacgacttcgaggtgttcgaggagaccccgctggatctctccggcttcaccgatccggaggaactggcgcagttcctctgggggccgccggacaccgcccccggcgcctgataaggatccggcaagactggccccgcttggcaacgcaacagtgagcccctccctagtgtgtttggggatgtgactatgtattcgtgtgttggccaacgggtcaacccgaacagattgatacccgccttggcatttcctgtcagaatgtaacgtcagttgatggtact[0492]对于所有修饰的莱茵衣藻细胞而言,申请人使用了pcr、surveyor核酸酶测定和dna测序,以验证成功的修饰。实例16:在细菌中使用cas9作为转录阻遏子[0493]人工控制转录的能力对于研究基因功能以及具有希望的特性的合成基因网络的构建两者是至关重要的。申请人在此处描述了使用rna指导的cas9蛋白作为一种可编程的转录阻遏子。[0494]申请人先前已表明如何使用化脓链球菌sf370的cas9蛋白在肺炎链球菌中引导基因组编辑。在此研究中,申请人工程化包含一个最低限度crispr系统的crr6rk菌株,该系统由以下各项组成:cas9、tracrrna以及一个重复。将d10a-h840突变引入至此菌株中的cas9中,给出菌株crr6rk**。靶向bgaaβ-半乳糖苷酶基因启动子的不同位置的四个间隔子被克隆到之前所述的pdb98质粒携带的crispr阵列中。申请人观察到β-半乳糖苷酶活性的x至y倍降低依赖于该靶向位置,表明cas9作为一种可编程的阻遏子的可能性(图73)。[0495]为了实现大肠杆菌中的cas9**阻遏,构建一种绿色荧光蛋白(gfp)报告基因质粒(pdb127)以从组成型启动子表达gfpmut2基因。设计该启动子以在两条链上携带若干npppam,以测量结合在不同位置的cas9**的影响。申请人将d10a-h840突变引入至pcas9中,针对新间隔子的简单克隆设计携带该tracrrna、cas9以及一个最低限度crispr阵列的、所描述的质粒。设计二十二个不同的间隔子以靶向gfpmut2启动子以及开放阅读框的不同区域。在靶向重叠或邻近于-35以及-10启动子元件以及邻近于该夏因-达尔加诺序列(shine-dalgarnosequence)的区域后观察到荧光的大约20倍减少。在两条链上的靶标显示类似的阻遏水平。这些结果表明,cas9**与该启动子区域的任何位置的结合防止了转录起始,这大概是通过rnap结合的空间抑制实现的。[0496]为了确定cas9**是否可防止转录延伸,申请人将其定向到gpfmut2的阅读框。在靶向的编码和非编码链两者上观察到萦光的减少,表明cas9结合实际足够强以代表对运行rnap的障碍。然而,而当该编码链是靶标时观察到表达的40%减少,对于非编码链观察到20倍降低(图74b-74c,将t9、t10以及t11与b9、b10以及b11进行比较)。为了直接确定cas9**结合对转录的影响,申请人从携带该t5、t10、b10或一个不靶向pdb127的对照构建体的菌株提取rna,并且使用在该b10以及t10靶位点之前(b477)或之后(b510)结合的一种探针使其经受northern印迹分析。与申请人的萦光方法一致,当cas9**被定向至该启动子区域(t5靶标)时未检测到gfpmut2转录并且在该t10区域的靶向之后观察到转录。有意思地是,用该b477探针观察到更小的转录物。此条带对应于期望尺寸的会被cas9**中断的一种转录物,并且是由结合到该编码链的dgrna::cas9**引起的转录终止的直接显示。令人惊讶地,当靶向该非编码链(b10)时申请人未检测到转录物。由于结合到该b10区域的cas9**不可能干扰转录起始,此结果表明该mrna退化。dgrna::cas9显示体外结合ssrna。申请人推测,结合可通过宿主核酸酶引发mrna的降解。的确,核糖体停顿可诱导在大肠杆菌中翻译的mrna的切割。[0497]一些应用需要精确协调基因表达而不是完全阻遏。申请人寻求通过引入将弱化crrna/靶相互作用的错配,实现中间阻遏水平。申请人建立基于b1、t5以及b10构建体的一系列的间隔子,这些构建体在crrna的5’端具有增加数目的突变。b1以及t5中高达8个突变不影响该阻遏水平,并且针对额外的突变观察到荧光的渐进增加。[0498]以crrna及其靶标之间仅8nt匹配观察到的阻遏增加了使用cas9**作为转录调节子的脱靶作用的问题。由于对于cas9结合也需要良好的pam(ngg),匹配以获得某一水平的呼吸作用的核苷酸的数目是10。10nt匹配每隔约1mbp随机发生一次,并且因此甚至很可能在小的细菌性基因组中发现此类位点。然而,为了有效地阻遏转录,此类位点需要在基因的启动子区域中,其使得更少可能脱靶。申请人也显示基因表达可受影响,如果靶向一种基因的非编码链的话。为了让此发生,随机的靶标必须处于正确取向,但此类事件相对更可能发生。事实上,在此研究的进程中,申请人不能够构建在pcas9**上设计的间隔子之一。申请人之后发现此间隔子在必需的murc基因中显示邻接良好的pam的12bp匹配。此类脱靶可容易地通过所设计的间隔子的系统爆炸避免。[0499]在以下编号的段落中进一步说明本发明的多个方面:1.一种包括一个或多个载体的载体系统,其中该系统包括a.一个第一调节元件,该第一调节元件可操作地连接到一个traer配对序列以及用于在该traer配对序列的上游插入一个指导序列的一个或多个插入位点,其中当表达时,该指导序列引导crispr复合物在真核细胞中与一个靶序列的序列特异性结合,其中该crispr复合物包括与以下各项复合的一种crispr酶:(1)杂交到该靶序列的指导序列,以及(2)杂交到该traer序列的traer配对序列;和b.一个第二调节元件,该第二调节元件可操作地连接到编码所述crispr酶的酶编码序列上,该crispr酶包含一个核定位序列;其中组分(a)和(b)位于该系统的相同或不同载体上。2.如段落1所述的载体系统,其中组分(a)进一步包括在该第一调节元件的控制之下在traer配对序列的下游的traer序列。3.如段落1所述的载体系统,其中组分(a)进一步包括可操作地连接到该第一调节元件的两个或更多个指导序列,其中当表达时,该两个或更多个指导序列中的每个引导crispr复合物在真核细胞中与一个不同靶序列的序列特异性结合。4.如段落1所述的载体系统,其中该系统包括在一个第三调节元件控制之下的traer序列。5.如段落1所述的载体系统,其中当进行最佳比对时,沿着该traer配对序列的长度,该traer序列展现至少50%序列互补性。6.如段落1所述的载体系统,其中该crispr酶包括一个或多个核定位序列,该一个或多个核定位序列具有足够强度来在真核细胞的细胞核中驱动所述crispr酶以可检测到的量积聚。7.如段落1所述的载体系统,其中该crispr酶是一种ii型crispr系统酶。8.如段落1所述的载体系统,其中该crispr酶是一种cas9酶。9.如段落1所述的载体系统,其中该crispr酶进行了密码子优化以便在真核细胞中表达。10.如段落1所述的载体系统,其中该crispr酶引导在该靶序列位置处的一条或两条链的切割。11.如段落1所述的载体系统,其中该crispr酶缺少dna链切割活性。12.如段落1所述的载体系统,其中该第一调节元件是一种聚合酶iii启动子。13.如段落1所述的载体系统,其中该第二调节元件是一种聚合酶ii启动子。14.如段落4所述的载体系统,其中该第三调节元件是一种聚合酶iii启动子。15.如段落1所述的载体系统,其中该指导序列在长度上是至少15个核苷酸。16.如段落1所述的载体系统,其中在最佳地折叠时,该指导序列的少于50%的核苷酸参与自我互补碱基配对。17.一种载体,包括一个调节元件,该调节元件可操作地连接到编码crispr酶的酶编码序列上,该crispr酶包含一个或多个核定位序列,其中所述调节元件驱动真核细胞中crispr酶的转录,使得所述crispr酶以可检测到的量在该真核细胞的细胞核中积聚。18.如段落17所述的载体,其中所述调节元件是一种聚合酶ii启动子。19.如段落17所述的载体,其中所述crispr酶是一种ii型crispr系统酶。20.如段落17所述的载体,其中所述crispr酶是一种cas9酶。21.如段落17所述的载体,其中所述crispr酶缺少切割它结合至其上的靶序列的一条或多条链的能力。22.一种crispr酶,该酶包括一个或多个核定位序列,该一个或多个核定位序列具有足够强度来在真核细胞的细胞核中驱动所述crispr酶以可检测到的量积聚。23.如段落22所述的crispr酶,其中所述crispr酶是一种ii型crispr系统酶。24.如段落22所述的crispr酶,其中所述crispr酶是一种cas9酶。25.如段落22所述的crispr酶,其中所述crispr酶缺少切割它结合至其上的靶序列的一条或多条链的能力。26.一种真核宿主细胞,包括:a.一个第一调节元件,该第一调节元件可操作地连接到一个traer配对序列以及用于在该traer配对序列的上游插入一个指导序列的一个或多个插入位点,其中当表达时,该指导序列引导crispr复合物在真核细胞中与一个靶序列的序列特异性结合,其中该crispr复合物包括与以下各项复合的一种crispr酶:(1)杂交到该靶序列的指导序列,以及(2)杂交到该traer序列的traer配对序列;和/或b.一个第二调节元件,该第二调节元件可操作地连接到编码所述crispr酶的酶编码序列上,该crispr酶包含一个核定位序列。27.如段落26所述的真核宿主细胞,其中所述宿主细胞包括组分(a)以及(b)。28.如段落26所述的真核宿主细胞,其中组分(a)、组分(b)、或组分(a)和(b)稳定地整合到该宿主真核细胞的一个基因组中。29.如段落26所述的真核宿主细胞,其中组分(a)进一步包括在该第一调节元件的控制之下在traer配对序列的下游的traer序列。30.如段落26所述的真核宿主细胞,其中组分(a)进一步包括可操作地连接到该第一调节元件的两个或更多个指导序列,其中当表达时,该两个或更多个指导序列中的每个引导crispr复合物在真核细胞中与一个不同靶序列的序列特异性结合。31.如段落26所述的真核宿主细胞,进一步包括可操作地连接到所述traer序列的一个第三调节元件。32.如段落26所述的真核宿主细胞,其中当进行最佳比对时,沿着该traer配对序列的长度,该traer序列展现至少50%序列互补性。33.如段落26所述的真核宿主细胞,其中该crispr酶包括一个或多个核定位序列,该一个或多个核定位序列具有足够强度来在真核细胞的细胞核中驱动所述crispr酶以可检测到的量积聚。34.如段落26所述的真核宿主细胞,其中该crispr酶是一种ii型crispr系统酶。35.如段落26所述的真核宿主细胞,其中该crispr酶是一种cas9酶。36.如段落26所述的真核宿主细胞,其中该crispr酶进行了密码子优化以便在真核细胞中表达。37.如段落26所述的真核宿主细胞,其中该crispr酶引导在该靶序列位置处的一条或两条链的切割。38.如段落26所述的真核宿主细胞,其中该crispr酶缺少dna链切割活性。39.如段落26所述的真核宿主细胞,其中该第一调节元件是一种聚合酶iii启动子。40.如段落26所述的真核宿主细胞,其中该第二调节元件是一种聚合酶ii启动子。41.如段落31所述的真核宿主细胞,其中该第三调节元件是一种聚合酶iii启动子。42.如段落26所述的真核宿主细胞,其中该指导序列在长度上是至少15个核苷酸。43.如段落26所述的真核宿主细胞,其中在最佳地折叠时,该指导序列的少于50%的核苷酸参与自我互补碱基配对。44.一种非人的动物,该动物包括段落26-43中任一项所述的真核宿主细胞。45.一种试剂盒,包括一种载体系统以及用于使用所述试剂盒的说明书,该载体系统包括:a.一个第一调节元件,该第一调节元件可操作地连接到一个traer配对序列以及用于在该traer配对序列的上游插入一个指导序列的一个或多个插入位点,其中当表达时,该指导序列引导crispr复合物在真核细胞中与一个靶序列的序列特异性结合,其中该crispr复合物包括与以下各项复合的一种crispr酶:(1)杂交到该靶序列的指导序列,以及(2)杂交到该traer序列的traer配对序列;和/或b.一个第二调节元件,该第二调节元件可操作地连接到编码所述crispr酶的酶编码序列上,该crispr酶包含一个核定位序列。46.如段落45所述的试剂盒,其中所述试剂盒包括位于该系统的相同或不同载体上的组分(a)和(b)。47.如段落45所述的试剂盒,其中组分(a)进一步包括在该第一调节元件的控制之下在traer配对序列的下游的traer序列。48.如段落45所述的试剂盒,其中组分(a)进一步包括可操作地连接到该第一调节元件的两个或更多个指导序列,其中当表达时,该两个或更多个指导序列中的每个引导crispr复合物在真核细胞中与一个不同靶序列的序列特异性结合。49.如段落45所述的试剂盒,其中该系统包括在一个第三调节元件控制之下的traer序列。50.如段落45所述的试剂盒,其中当进行最佳比对时,沿着该traer配对序列的长度,该traer序列展现至少50%序列互补性。51.如段落45所述的试剂盒,其中该crispr酶包括一个或多个核定位序列,该一个或多个核定位序列具有足够强度来在真核细胞的细胞核中驱动所述crispr酶以可检测到的量积聚。52.如段落45所述的试剂盒,其中该crispr酶是一种ii型crispr系统酶。53.如段落45所述的试剂盒,其中该crispr酶是一种cas9酶。54.如段落45所述的试剂盒,其中该crispr酶进行了密码子优化以便在真核细胞中表达。55.如段落45所述的试剂盒,其中该crispr酶引导在该靶序列位置处的一条或两条链的切割。56.如段落45所述的试剂盒,其中该crispr酶缺少dna链切割活性。57.如段落45所述的试剂盒,其中该第一调节元件是一种聚合酶iii启动子。58.如段落45所述的试剂盒,其中该第二调节元件是一种聚合酶ii启动子。59.如段落49所述的试剂盒,其中该第三调节元件是一种聚合酶iii启动子。60.如段落45所述的试剂盒,其中该指导序列在长度上是至少15个核苷酸。61.如段落45所述的试剂盒,其中在最佳地折叠时,该指导序列的少于50%的核苷酸参与自我互补碱基配对。62.一种计算机系统,用于在通过一种crispr复合物进行靶向的真核细胞中的核酸序列内选择候选靶序列,该系统包括:a.一个存储单元,被配置成接受和/或储存所述核酸序列;以及b.一个或多个单独或组合的处理器,被编码为(i)将一个crispr基序序列定位于所述核酸序列内,以及(ii)选择邻近于所述定位的crispr基序序列的一个序列作为该crispr复合物结合至其上的候选靶序列。63.如段落62所述的计算机系统,其中所述定位步骤包括鉴定与所述靶序列距离少于约500个核苷酸定位的一个crispr基序序列。64.如段落62所述的计算机系统,其中所述候选靶序列在长度上是至少10个核苷酸。65.如段落62所述的计算机系统,其中在该候选靶序列的3’端的核苷酸被定位成离该crispr基序序列上游不超过约10个核苷酸。66.如段落62所述的计算机系统,其中该真核细胞中的核酸序列对该真核基因组来说是内源的。67.如权利要求62所述的计算机系统,其中该真核细胞中的核酸序列对该真核基因组来说是外源的。68.一种计算机可读介质,包括如下编码,所述编码在通过一个或多个处理器执行时,实施在通过一种crispr复合物进行靶向的真核细胞中的核酸序列内选择候选靶序列的方法,所述方法包括:(a)将一个crispr基序序列定位于所述核酸序列内,以及(b)选择邻近于所述定位的crispr基序序列的一个序列作为该crispr复合物结合至其上的候选靶序列。69.如段落68所述的计算机可读介质,其中所述定位包括与所述靶序列距离少于约500个核苷酸来定位一个crispr基序序列。70.如段落68所述的计算机可读物,其中所述候选靶序列在长度上是至少10个核苷酸。71.如段落68所述的计算机可读物,其中在该候选靶序列的3’端的核苷酸被定位成离该crispr基序序列上游不超过约10个核苷酸。72.如段落68所述的计算机可读物,其中该真核细胞中的核酸序列对该真核基因组来说是内源的。73.如段落68所述的计算机可读物,其中该真核细胞中的核酸序列对该真核基因组来说是外源的。74.在真核细胞中修饰靶多核苷酸的一种方法,该方法包括允许一种crispr复合物结合到该靶多核苷酸上以实现所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该crispr复合物包括与杂交到所述靶多核苷酸内的一个靶序列上的指导序列复合的crispr酶,其中所述指导序列连接到一个traer配对序列上,该traer配对序列进而杂交到一个traer序列上。75.如段落74所述的方法,其中所述切割包括通过所述crispr酶切割在该靶序列位置处的一条或两条链。76.如段落74所述的方法,其中所述切割导致靶基因的转录降低。77.如段落74所述的方法,进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸,其中所述修复导致一个突变,该突变包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。78.如段落77所述的方法,其中所述突变在由包含该靶序列的基因表达的蛋白质中导致一个或多个氨基酸改变。79.如段落74所述的方法,进一步包括将一个或多个载体递送到所述真核细胞,其中该一个或多个载体驱动以下一项或多项的表达:crispr酶、连接到traer配对序列上的指导序列、以及traer序列。80.如段落79所述的方法,其中所述载体被递送到受试者内的真核细胞中。81.如段落74所述的方法,其中所述修饰发生在细胞培养物中的所述真核细胞中。82.如段落74所述的方法,进一步包括在所述修饰之前从受试者中分离所述真核细胞。83.如段落82所述的方法,进一步包括使所述真核细胞和/或从中衍生的细胞返回到所述受试者中。84.一种修饰多核苷酸在真核细胞中的表达的方法,该方法包括允许一种crispr复合物结合到该多核苷酸上,使得所述结合导致所述多核苷酸表达增加或减少;其中该crispr复合物包含与杂交到所述靶多核苷酸内的一个靶序列上的指导序列复合的crispr酶,其中所述指导序列连接到一个traer配对序列上,该traer配对序列进而杂交到一个traer序列上。85.如段落74所述的方法,进一步包括将一个或多个载体递送到所述真核细胞,其中该一个或多个载体驱动以下一项或多项的表达:crispr酶、连接到traer配对序列上的指导序列、以及traer序列。86.产生包括一个突变疾病基因的模式真核细胞的方法,该方法包括:a.将一个或多个载体引入一个真核细胞中,其中该一个或多个载体驱动以下一项或多项的表达:crispr酶、连接到traer配对序列上的指导序列、以及traer序列;并且b.允许一种crispr复合物结合到一个靶多核苷酸上以实施在所述疾病基因内的该靶多核苷酸的切割,其中该crispr复合物包含与(1)杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)杂交到该traer上的该traer配对序列复合的crispr酶,由此产生包含突变的疾病基因的模式真核细胞。87.如段落86所述的方法,其中所述切割包括通过所述crispr酶切割在该靶序列位置处的一条或两条链。88.如段落86所述的方法,其中所述切割导致靶基因的转录降低。89.如段落86所述的方法,进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸,其中所述修复导致一个突变,该突变包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。90.如段落89所述的方法,其中所述突变在由包含该靶序列的基因表达的蛋白质中导致一个或多个氨基酸改变。91.一种研发生物活性剂的方法,该生物活性剂调制与疾病基因相关的细胞信号传导事件,该方法包括:a.使一种测试化合物与段落86-90中任一项所述的一种模式细胞接触;并且b.检测读数变化,该变化指示与所述疾病基因的所述突变关联的细胞信号传导事件的减少或增加,从而开发调制与所述疾病基因关联的所述细胞信号传导事件的所述生物活性剂。92.一种重组多核苷酸,包括在traer配对序列上游的指导序列,其中该指导序列当表达时引导一种crispr复合物与存在于真核细胞中的一个对应的靶序列的序列特异性结合。93.如段落89所述的重组多核苷酸,其中该靶序列是存在于真核细胞中的病毒序列。94.如段落89所述的重组多核苷酸,其中该靶序列是原癌基因或癌基因。[0500]虽然已经在此示出并描述了本发明的优选实施例,但是对本领域的普通技术人员而言应该显而易见是这样的实施例仅以举例方式提供。在不偏离本发明的情况下众多变化、改变和取代现在将被本领域的普通技术人员想到。应该理解的是,在实践本发明中可以采用在此描述的本发明的实施例的不同替代方案。旨在按照以下权利要求限定本发明的范围,并且在这些权利要求范围内的方法和结构及其等同物也包括在本发明的范围内。[0501]参考文献:1.乌尔诺夫,f.d.(urnov,f.d.)、雷巴尔,e.j.(rebar,e.j.)、福尔摩斯,m.c.(holmes,m.c.)、张,h.s.(zhang,h.s.)&格雷戈里,p.d.(gregory,p.d.)用工程化的锌指核酸酶进行的基因组编辑(genomeeditingwithengineeredzincfingernucleases).《遗传学自然评论》(natrevgenet)11,636-646(2010)。2.保达诺夫,a.j.(bogdanove,a.j.)&沃伊塔斯,d.f.(voytas,d.f.)tal效应物:用于dna靶向的可定制蛋白(taleffectors:customizableproteinsfordnatargeting).《科学》(science)333,1843-1846(2011)。3.斯托达德,b.l.(stoddard,b.l.)归巢内切核酸酶结构以及功能(homingendonucleasestructureandfunction).《生物物理学季评》(q.rev.biophys.)38,49-95(2005)。4.贝,t.(bae,t.)&施内温德,o.(schneewind,o.)用诱导型反选择在金黄色葡萄球菌中进行的等位基因置换(allelicreplacementinstaphylococcusaureuswithinduciblecounter-selection).《质粒》(plasmid)55,58-63(2006)。5.孙,c.k.(sung,c.k.),李,h.(li,h.),克拉维瑞斯,j.p.(claverys,j.p.)&莫里森,d.a.(morrison,d.a.)一种rpsl盒,janus,用于通过阴性筛选在肺炎链球菌中进行基因置换(anrpslcassette,janus,forgenereplacementthroughnegativeselectioninstreptococcuspneumoniae).《应用与环境微生物学》(appl.environ.microbiol).67,5190-5196(2001)。6.沙兰,s.k.(sharan,s.k.),托马森,l.c.(thomason,l.c.),库兹涅佐夫,s.g.(kuznetsov,s.g.)&考特,d.l.(court,d.l.)重组工程:基于同源重组的基因工程方法(recombineering:ahomologousrecombination-basedmethodofgeneticengineering).《自然方案》(nat.protoc.)4,206-223(2009)。7.季聂克,m.(jinek,m.)等人获得性细菌免疫中的可编程的双rna指导的dna内切核酸酶(aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity).《科学》(science)337,816‑ꢀ821(2012)。8.德沃,h.(deveau,h.)、加尔诺,j.e.(garneau,j.e.)&莫万诺,s.(moineau,s.)crispr-cas系统及其在噬菌体细菌相互作用中的作用(crispr-cassystemanditsroleinphage-bacteriainteractions).《微生物学年评》(annurevmicrobiol)64,475-493(2010)。9.霍瓦特,p.(horvath,p.)&巴郎镐,r.(barrangou,r.)crispr-cas,细菌和古生菌的免疫系统(crispr-cas,theimmunesystemofbacteriaandarchaea).《科学》(science)327,167-170(2010)。10.特恩斯,m.p.(terns,m.p.)&特恩斯,r.m.(terns,r.m.)基于crispr的获得性免疫系统(crispr-basedadaptiveimmunesystems).《微生物学现行观点》(curr.opin.microbiol.)14,321-327(2011)。11.范德奥斯特,j.,(vanderoost,j.,)捷雷,m.m.(jore,m.m.),韦斯特拉,e.r.(westra,e.r.),伦德格伦,m.(lundgren,m.)&布龙斯,s.j.(brouns,s.j.)在原核生物中基于crispr的获得性以及可遗传性免疫(crispr-basedadaptiveandheritableimmunityinprokaryotes).《生物化学科学趋势》(trends.biochem.sci.)34,401-407(2009)。12.布龙斯,s.j.(brouns,s.j.)等人,在原核生物中小crisprrna指导抗病毒防御(smallcrisprrnasguideantiviraldefenseinprokaryotes).《科学》(science)321,960-964(2008)。13.卡特,j.(carter,j.),王,r.(wang,r.),李,h.(li,h.),特恩斯,r.m.(terns,r.m.)&特恩斯,m.p.(terns,m.p.)cas6是在原核生物中产生指导rna用于入侵物防御的内切核糖核酸酶(cas6isanendoribonucleasethatgeneratesguidernasforinvaderdefenseinprokaryotes).《基因发育》(genesdev.)22,3489-3496(2008)。14.德尔特科娃,e.(deltcheva,e.)等人通过反式编码的小rna和宿主因子rnaseiii熟化crisprrna(crisprrnamaturationbytrans‑ꢀencodedsmallrnaandhostfactorrnaseiii).《自然》(nature)471,602‑ꢀ607(2011)。15.哈托姆-阿斯兰,a.(hatoum-aslan,a.),曼伊夫,i.(maniv,i.)&马拉菲尼,l.a.(marraffini,l.a.)成熟的规律间隔成簇短回文重复序列rna(crrna)长度是通过在前体加工位点锚定的标尺机构测量的(matureclustered,regularlyinterspaced,shortpalindromicrepeatsrna(crrna)lengthismeasuredbyarulermechanismanchoredattheprecursorprocessingsite).《美国国家科学院院刊》(proc.natl.acad.sci.usa.)108,21218-21222(2011)。16.华维茨,r.e.(haurwitz,r.e.),吉耐克,m.(jinek,m.),m.,威登赫夫特,b.(wiedenheft,b.),周,k.(zhou,k.)&杜德那,j.a.(doudna,j.a.)通过crispr内切核酸酶进行序列-以及结构-特异性rna加工(sequence-andstructure-specificrnaprocessingbyacrisprendonuclease).《科学》(science)329,1355-1358(2010)。17.德沃,h.(deveau,h.)等人,在嗜热链球菌中对crispr编码的抗性的噬菌体响应(phageresponsetocrispr-encodedresistanceinstreptococcusthermophilus).《细菌学杂志》(j.bacteriol.)190,1390-1400(2008)。18.加斯诺斯,g.(gasiunas,g.)、巴郎镐,r.(barrangou,r.)、霍瓦特,p.(horvath,p.)&西克斯尼斯(siksnys,v.)cas9-crrna核糖核蛋白复合体在细菌中针对获得性免疫介导特异的dna切割(cas9-crrnaribonucleoproteincomplexmediatesspecificdnacleavageforadaptiveimmunityinbacteria).《美国国家科学院院刊》(proc.natl.acad.sci.usa.),e2579‑ꢀ2586(2012)。19.马卡洛夫,k.s.(makarova,k.s.),阿韦德,l.(aravind,l.),沃尔夫,y.i.(wolf,y.i.)&库宁,e.v.(koonin,e.v.)cas蛋白家族的统一以及crispr-cas系统的起源和进化的简单情境(unificationofcasproteinfamiliesandasimplescenariofortheoriginandevolutionofcrispr-cassystems).《生物学导向》(biol.direct.)6,38(2011)。20.巴郎镐,r.(barrangou,r.)rna介导的可编程dna切割(rna-mediatedprogrammablednacleavage).《自然生物技术》(nat.biotechnol.)30,836-838(2012)。21.布龙斯,s.j.(brouns,s.j.)分子生物学.免疫学瑞士军刀(molecularbiology.aswissarmyknifeofimmunity).《科学》(science)337,808-809(2012)。22.卡罗尔,d.(carroll,d.)基因靶向的一种crispr途径(acrisprapproachtogenetargeting).《分子疗法》(mol.ther.)20,1658‑ꢀ1660(2012)。23.碧卡尔德,d.(bikard,d.),哈托姆-阿斯兰,a.(hatoum‑ꢀaslan,a.),穆奇达,d.(mucida,d.)&马拉菲尼,l.a.(marraffini,l.a.)crispr干扰可防止在体内细菌感染过程中的天然转化和毒力获取(crisprinterferencecanpreventnaturaltransformationandvirulenceacquisitionduringinvivobacterialinfection).《细胞宿主微生物》(cellhostmicrobe)12,177-186(2012)。24.萨普拉诺斯卡斯(sapranauskas,r.)等人嗜热链球菌crispr-cas系统在大肠杆菌中提供免疫力(thestreptococcusthermophiluscrispr-cassystemprovidesimmunityinescherichiacoli).《核酸研究》(nucleicacidsres)(2011)。25.塞梅诺娃,e.(semenova,e.)等人规律间隔成簇短回文重复序列(crispr)rna的干扰是由种子序列支配的(interferencebyclusteredregularlyinterspacedshortpalindromicrepeat(crispr)rnaisgovernedbyaseedsequence).《美国国家科学院院刊》(proc.natl.acad.sci.usa.)(2011)。26.威登赫夫特,b.(wiedenheft,b.)等人来自细菌性免疫系统的rna指导复合体通过种子序列相互作用增强靶识别(rna-guidedcomplexfromabacterialimmunesystemenhancestargetrecognitionthroughseedsequenceinteractions).《美国国家科学院院刊》(proc.natl.acad.sci.usa.)(2011)。27.扎娜,d.(zahner,d.)&哈肯贝克,r.(hakenbeck,r.)肺炎链球菌β-半乳糖苷酶是一种表面蛋白(thestreptococcuspneumoniaebeta‑ꢀgalactosidaseisasurfaceprotein).《细菌学杂志》(j.bacteriol.)182,5919‑ꢀ5921(2000)。28.马拉夫尼l.a.(marraffini,l.a.),迪登特,a.c.(dedent,a.c.)&施内温德,o.(schneewind,o.)将蛋白锚定到革兰氏阳性菌的包膜的分选酶和技术(sortasesandtheartofanchoringproteinstotheenvelopesofgram-positivebacteria).《微生物学分子生物学综述》(microbiol.mol.biol.rev.)70,192-221(2006)。29.莫塔梅迪,m.r.(motamedi,m.r.),兹格提,s.k.(szigety,s.k.)&罗森伯格,s.m.(rosenberg,s.m.)大肠杆菌中的双链断裂修复重组:体内dna复制机制的物理证据(double-strand-breakrepairrecombinationinescherichiacoli:physicalevidenceforadnareplicationmechanisminvivo).《基因发育》(genesdev.)13,2889-2903(1999)。30.霍萨卡,t.(hosaka,t.)等人核糖体蛋白s12中的新的突变k87e在大肠杆菌的后期生长阶段过程中增强蛋白合成活性(thenovelmutationk87einribosomalproteins12enhancesproteinsynthesisactivityduringthelategrowthphaseinescherichiacoli).《分子遗传学基因组学》(mol.genet.genomics)271,317-324(2004)。31.科斯坦蒂诺,n.(costantino,n.)&考特,d.l.(court,d.l.)在错配修复突变体中增强水平的λ红介导的重组体(enhancedlevelsoflambdared-mediatedrecombinantsinmismatchrepairmutants).《美国国家科学院院刊》(proc.natl.acad.sci.usa)100,15748-15753(2003)。32.埃德加,r.(edgar,r.)&奇姆龙,u.(qimron,u.)大肠杆菌crispr系统保护溶素原免受λ溶源化作用以及原噬菌体诱导(theescherichiacolicrisprsystemprotectsfromlambdalysogenization,lysogens,andprophageinduction).《细菌学杂志》(j.bacteriol.)192,6291-6294(2010)。33.马拉夫尼l.a.(marraffini,l.a.)&松塞摩尔,e.j.(sontheimer,e.j.)在crisprrna指导的免疫过程中的自我辨别对非自我辨别(selfversusnon-selfdiscriminationduringcrisprrna-directedimmunity).《自然》(nature)463,568-571(2010)。34.费舍尔,s.(fischer,s.)等人古生菌免疫系统可检测多个原型间隔子相邻基序(pam)以靶向入侵物dna(anarchaealimmunesystemcandetectmultipleprotospaceradjacentmotifs(pams)totargetinvaderdna).《生物化学杂志》(j.biol.chem.)287,33351-33363(2012)。35.歌德博格斯道蒂尔,s.(gudbergsdottir,s.)等人当用载体传播的病毒和质粒基因以及原型间隔子激发时,硫化裂片菌crispr/cas以及crispr/cmr系统的动态性能(dynamicpropertiesofthesulfolobuscrispr/casandcrispr/cmrsystemswhenchallengedwithvector-borneviralandplasmidgenesandprotospacers).《分子微生物学》(mol.microbiol.)79,35-49(2011)。36.王,h.h.(wang,h.h.)等人通过共筛选mage进行的基因组规模启动子工程(genome-scalepromoterengineeringbycoselectionmage).《自然方法》(natmethods)9,591-593(2012)。37.丛,l.(cong,l.)等人使用crispr-cas系统的多元基因组工程化(multiplexgenomeengineeringusingcrispr-cassystems).《科学-正在评论中》(scienceinpress)(2013)。38.玛丽,p.(mali,p.)等人经由cas9的rna指导的人类基因组工程(rna-guidedhumangenomeengineeringviacas9).《科学-正在评论中》(scienceinpress)(2013)。39.霍斯金斯,j.(hoskins,j.)等人细菌肺炎链球菌菌株r6的基因组(genomeofthebacteriumstreptococcuspneumoniaestrainr6).《细菌学杂志》(j.bacteriol.)183,5709-5717(2001)。40.哈维尔斯泰因,l.s.(havarstein,l.s.),库马拉斯瓦米,g.(coomaraswamy,g.)&莫里森,d.a.(morrison,d.a.)未修饰的十七肽信息素诱导针对肺炎链球菌中的遗传转化的感受态(anunmodifiedheptadecapeptidepheromoneinducescompetenceforgenetictransformationinstreptococcuspneumoniae).《美国国家科学院院刊》(proc.natl.acad.sci.usa.)92,11140-11144(1995)。41.堀之内,s.(horinouchi,s.)&维斯布卢姆,b.(weisblum,b.)指定诱导型氯霉素抗性的一种质粒pc194的核苷酸序列以及功能性图谱(nucleotidesequenceandfunctionalmapofpc194,aplasmidthatspecifiesinduciblechloramphenicolresistance).《细菌学杂志》(j.bacteriol.)150,815-825(1982)。42.荷顿,r.m.(horton,r.m.)dna的体外重组和诱变:基因拼接连同专用的基因(invitrorecombinationandmutagenesisofdna:soeingtogethertailor-madegenes.).《分子生物学方法》(methodsmol.biol.)15,251-261(1993)。43.波德比尔斯基,a.(podbielski,a.),斯佩莱博格,b.(spellerberg,b.),沃伊施尼克,m.(woischnik,m.),波尔(pohl,b.)&鲁提肯,r.(lutticken,r.)用于a组链球菌(gas)中的基因失活以及表达分析的新系列的质粒载体(novelseriesofplasmidvectorsforgeneinactivationandexpressionanalysisingroupastreptococci(gas)).《基因》(gene)177:137-147(1996)。44.胡斯曼,l.k.(husmann,l.k.),斯科特,j.r.(scott,j.r.),林达尔,g.(lindahl,g.)&斯坦伯格,l.(stenberg,l.)arp蛋白,即m蛋白家族的一员的表达不足以抑制化脓链球菌的吞噬作用(expressionofthearpprotein,amemberofthemproteinfamily,isnotsufficienttoinhibitphagocytosisofstreptococcuspyogenes).《传染与免疫》(infectionandimmunity)63,345-348(1995)。45.吉布森,d.g.(gibson,d.g.)等人数十万碱基的dna分子的酶拼接(enzymaticassemblyofdnamoleculesuptoseveralhundredkilobases),《自然方法》(natmethods):6,343-345(2009)。优选的实施方式:1.一种非天然存在的或工程化的组合物,包含一种载体系统,该载体系统包含一个或多个载体,该一个或多个载体包含i.一个第一调节元件,该第一调节元件可操作地连接到crispr-cas系统嵌合rna(chirna)多核苷酸序列上,其中该多核苷酸序列包含(a)一个指导序列,该指导序列能够杂交到真核细胞中的靶序列上,(b)一个tracr配对序列,和(c)一个tracr序列,以及ii.一个第二调节元件,该第二调节元件可操作地连接到编码crispr酶的酶编码序列上,在该crispr酶的一个末端附近包含至少一个或多个核定位序列(nls),其中(a)、(b)和(c)以5’到3’方向排列,其中组分i和ii位于该系统的相同或不同载体上,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导crispr复合物与该靶序列的序列特异性结合,其中该crispr复合物包含与以下各项复合的crispr酶:(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列,并且其中该嵌合rna多核苷酸序列包括两个或更多个发夹。2.如项目1所述的组合物,其中使用多个chirna多核苷酸序列以提供一种多元系统。3.一种多元crispr酶系统,其中该系统包含一个载体系统,该载体系统包含一个或多个载体,该一个或多个载体包含i.一个第一调节元件,该第一调节元件可操作地连接到crispr-cas系统嵌合rna(chirna)多核苷酸序列上,其中该多核苷酸序列包含(a)一个指导序列,该指导序列能够杂交到真核细胞中的靶序列上,(b)一个tracr配对序列,和(c)一个tracr序列,以及ii.一个第二调节元件,该第二调节元件可操作地连接到编码crispr酶的酶编码序列上,在该crispr酶的一个末端附近包含至少一个或多个核定位序列(nls),其中(a)、(b)和(c)以5’到3’方向排列,其中组分i和ii位于该系统的相同或不同载体上,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导crispr复合物与该靶序列的序列特异性结合,其中该crispr复合物包含与以下各项复合的crispr酶:(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列,其中该chirna多核苷酸序列包括两个或更多个发夹,并且其中在该多元系统中使用多个chirna多核苷酸序列。4.如项目1、2或3所述的组合物或系统,其中该第一调节元件是一种聚合酶iii启动子。5.如前述项目中任一项所述的组合物或系统,其中该第二调节元件是一种聚合酶ii启动子。6.如前述项目中任一项所述的组合物或系统,其中该crispr酶包括一个或多个nls,该一个或多个nls具有足够强度来在真核细胞的细胞核中驱动所述crispr酶以可检测到的量积聚。7.如前述项目中任一项所述的组合物或系统,其中当进行最佳比对时,沿着该tracr配对序列的长度,该tracr序列展现至少50%序列互补性。8.如前述项目中任一项所述的组合物或系统,其中该crispr酶是一种ii型crispr系统酶。9.如前述项目中任一项所述的组合物或系统,其中该crispr酶是一种cas9酶。10.如前述项目中任一项所述的组合物或系统,其中该crispr酶进行了密码子优化以便在真核细胞中表达。11.如前述项目中任一项所述的组合物或系统,其中该指导序列在长度上是至少15个核苷酸。12.如前述项目中任一项所述的组合物或系统,其中该嵌合rna多核苷酸序列包括两个、三个、四个或五个发夹。13.一种非天然存在的或工程化的组合物,包含一种载体系统,该载体系统包含一个或多个载体,该一个或多个载体包含i.一个第一调节元件,该第一调节元件可操作地连接至(a)一个指导序列,该指导序列能够杂交到真核细胞中的靶序列上,和(b)一个tracr配对序列,ii.一个第二调节元件,该第二调节元件可操作地连接到编码crispr酶的酶编码序列上,在该crispr酶的一个末端附近包含至少一个或多个核定位序列(nls),以及iii.一个第三调节元件,该第三调节元件可操作地连接至一个tracr序列,其中组分i、ii和iii位于该系统的相同或不同载体上,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导crispr复合物与该靶序列的序列特异性结合,并且其中该crispr复合物包含与以下各项复合的crispr酶:(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列。14.如项目13所述的组合物,其中使用多个指导序列以及单个tracr序列以提供一种多元系统。15.一种多元crispr酶系统,其中该系统包含一个载体系统,该载体系统包含一个或多个载体,该一个或多个载体包含i.一个第一调节元件,该第一调节元件可操作地连接至(a)一个指导序列,该指导序列能够杂交到真核细胞中的靶序列上,和(b)一个tracr配对序列,ii.一个第二调节元件,该第二调节元件可操作地连接到编码crispr酶的酶编码序列上,在该crispr酶的一个末端附近包含至少一个或多个核定位序列(nls),以及iii.一个第三调节元件,该第三调节元件可操作地连接至一个tracr序列,其中组分i、ii和iii位于该系统的相同或不同载体上,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导crispr复合物与该靶序列的序列特异性结合,其中该crispr复合物包含与以下各项复合的crispr酶:(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列,并且其中在该多元系统中使用多个指导序列以及单个tracr序列。16.如项目13至15中任一项所述的组合物或系统,其中该第一调节元件是一种聚合酶iii启动子。17.如项目13至16中任一项所述的组合物或系统,其中该第二调节元件是一种聚合酶ii启动子。18.如项目13至17中任一项所述的组合物或系统,其中该第三调节元件是一种聚合酶iii启动子。19.如项目13至18中任一项所述的组合物或系统,其中该crispr酶包括一个或多个nls,该一个或多个nls具有足够强度来在真核细胞的细胞核中驱动所述crispr酶以可检测到的量积聚。20.如项目13至19中任一项所述的组合物或系统,其中当进行最佳比对时,沿着该tracr配对序列的长度,该tracr序列展现至少50%序列互补性。21.如项目13至20中任一项所述的组合物或系统,其中该crispr酶是一种ii型crispr系统酶。22.如项目13至21中任一项所述的组合物或系统,其中该crispr酶是一种cas9酶。23.如项目13至22中任一项所述的组合物或系统,其中该crispr酶进行了密码子优化以便在真核细胞中表达。24.如项目13至23中任一项所述的组合物或系统,其中该指导序列在长度上是至少15个核苷酸。25.一种真核宿主细胞,包含如前述项目中任一项所述的组合物或系统。26.一种生物体,包含如项目25所述的真核宿主细胞。27.一种非人生物体,包含如项目25所述的真核宿主细胞。28.一种试剂盒,包含如项目1至24中任一项所述的组合物以及用于使用所述试剂盒的说明书。29.一种改变感兴趣的基因组座位在真核细胞中的表达的方法,该方法包括使该基因组座位与如项目1至24中任一项所述的组合物接触,并且确定该基因组座位的表达是否已发生改变。30.如项目29所述的方法,其中基于一种crispr基序序列的存在,该指导序列引导该crispr复合物与靶序列的序列特异性结合。31.如项目30所述的方法,其中该crispr基序序列是nag。32.通过在一个或多个原核细胞中引入一个或多个基因突变来筛选一个或多个原核细胞的方法,该方法包括:将一个或多个载体引入该一个或多个原核细胞中,其中该一个或多个载体驱动以下一项或多项的表达:crispr酶、连接到tracr配对序列上的指导序列、tracr序列、以及编辑模板;其中该编辑模板包含消除crispr酶切的一个或多个突变;允许该编辑模板与靶多核苷酸在有待筛选的一个或多个细胞中进行同源重组;允许crispr复合物结合到靶多核苷酸上,以实现靶多核苷酸在所述基因内的切割,其中该crispr复合物包含与以下各项复合的crispr酶:(1)杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列,其中该crispr复合物与该靶多核苷酸的结合诱导细胞死亡,由此允许对其中已经引入一个或多个突变的一个或多个原核细胞进行筛选。33.如项目32所述的方法,其中该crispr酶是一种ii型crispr系统酶。34.如项目33所述的方法,其中该crispr酶是cas9。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献