一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

使用腺苷酸脱氨酶碱基编辑器破坏疾病相关基因的剪接受体位点,包括用于治疗遗传性疾病的制作方法

2022-03-16 01:16:17 来源:中国专利 TAG:
使用腺苷酸脱氨酶碱基编辑器破坏疾病相关基因的剪接受体位点,包括用于治疗遗传性疾病1.相关申请的交叉引用2.本技术主张2019年2月13日提交的美国专利临时申请号62/805,271、2019年5月23日提交的美国专利临时申请号62/852,228、2019年5月23日提交的美国专利临时申请号62/852,224、2019年7月11日提交的美国专利临时申请号62/873,140、2019年7月11日提交的美国专利临时申请号62/873,144、2019年11月6日提交的美国专利临时申请号62/931,722、2019年11月27日提交的美国专利临时申请号62/941,569、2020年1月27日提交的美国专利临时申请号62/966,526的权益,上述美国专利临时申请的公开内容通过引用而以其整体并入本文。3.通过引用并入4.本说明书中提及的全部出版物、专利和专利申请通过引用并入本文,其并入程度与各独立的出版物、专利或专利申请具体且独立地指明以待通过引用并入相同。如果不另外指明,则本说明书中提及的出版物、专利和专利申请通过引用而以其整体并入本文。
背景技术
::5.核酸序列的靶向编辑,例如,基因组dna的靶向裂解或靶向修饰,是用于研究基因功能的一种很有前景的方法,并且也具有提供针对人类遗传性疾病的新疗法的潜力。目前可用的碱基编辑器包括将靶标c·g碱基对转化为t·a的胞苷碱基编辑器(例如,be4)和将a·t转化为g·c的腺苷碱基编辑器(例如,abe7.10)。本领域需要能够以更高的特异性和效率诱导靶序列中的修饰的改进碱基编辑器。技术实现要素:6.本发明提供包含新颖腺苷碱基编辑器(例如,abe8)的效率增加的组合物以及使用包含腺苷脱氨酶变体的碱基编辑器编辑靶序列的方法。7.在一些方面,本文提供一种治疗有需要的受试者的神经疾患的方法,所述方法包括:向所述受试者给药:(i)腺苷碱基编辑器或编码腺苷碱基编辑器的核酸序列,和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中腺苷碱基编辑器包含可编程dna结合结构域和腺苷脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于受试者的与神经疾患相关的靶基因剪接位点处的单个核碱基修饰,从而治疗受试者的神经疾患。8.在一些实施方案中,腺苷脱氨酶包含位于如seqidno:2中编号的氨基酸位置82或166处的氨基酸置换或其相应置换。在一些实施方案中,单个核碱基修饰造成由述靶基因编码的转录物的选择性剪接。在一些实施方案中,选择性剪接导致由靶基因编码的经截短的或非功能性的蛋白质。在一些实施方案中,单个核碱基修饰导致靶基因在受试者体内的表达降低。在一些实施方案中,靶基因为超氧化物歧化酶1(sod1)基因,并且其中神经疾病为肌萎缩性脊髓侧索硬化症(als)。在一些实施方案中,靶基因为雄激素受体(ar)基因,并且其中神经疾病为脊髓延髓肌肉萎缩症(sbma)。9.在一些方面,本文提供一种治疗有需要的受试者的肌萎缩性脊髓侧索硬化症(als)的方法,所述方法包括:向所述受试者给药:(i)碱基编辑器或编码碱基编辑器的核酸序列,和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于受试者的超氧化物歧化酶1(sod1)基因剪接位点处的单个核碱基修饰,从而治疗所述受试者的als。10.在一些方面,本文提供一种治疗有需要的受试者的肌萎缩性脊髓侧索硬化症(als)的方法,所述方法包括:向所述受试者给药:(i)碱基编辑器或编码碱基编辑器的核酸序列,和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,其中向导多核苷酸引导腺苷碱基编辑器以实现位于受试者的超氧化物歧化酶1(sod1)基因中的单个核碱基修饰,并且其中单个核碱基修饰导致sod1基因中的提前终止密码子,从而治疗所述受试者的als。11.在一些实施方案中,脱氨酶是腺苷脱氨酶,其包含位于如seqidno:2中编号的氨基酸位置82或166处的氨基酸置换或其相应置换。在一些实施方案中,单个核碱基修饰是a替换为g的修饰。在一些实施方案中,单个核碱基修饰位于sod1基因的剪接受体位点处。在一些实施方案中,剪接位点为sod1基因的外显子的剪接受体位点5′。在一些实施方案中,sod1基因的外显子为对应于seqidno:3的外显子3或其变体。在一些实施方案中,sod1基因的外显子3与位于sod1多核苷酸序列中如seqidno:3中编号的核苷酸位置6828处的剪接受体ag相邻,或为其变体。在一些实施方案中,sod1基因的外显子为对应于seqidno:3的外显子4或其变体。在一些实施方案中,单个核碱基修饰产生转录产物,所述转录产物缺少对应于seqidno:3的人sod1基因的外显子3-5或其变体。在一些实施方案中,在给药之后,sod1基因在受试者体内的表达降低至少40%。12.在一些实施方案中,向导多核苷酸包含与sod1基因的剪接受体核酸序列或剪接供体核酸序列互补的核酸序列。在一些实施方案中,向导多核苷酸包含选自表19或表23的任何一个核酸序列。在一些实施方案中,向导多核苷酸包含选自由5′‑uuaaaggaaaguaauggaccagu-3′、5′‑uaaauaggcuguaccagugcagg-3′、5′‑uucauuauuaggcauguuggaga-3′、5′‑aaauaggcuguaccagugcaggu-3′、5′‑uauuaggcauguuggagacuugg-3′及其互补序列所组成的组的核酸序列。13.在一些方面,本文提供一种治疗受试者的脊髓延髓肌肉萎缩症(sbma)的方法,所述方法包括:向所述受试者给药:(i)碱基编辑器或编码碱基编辑器的核酸序列,和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于受试者的雄激素受体(ar)基因剪接位点处的单个核碱基修饰,从而治疗所述受试者的sbma。14.在一些方面,本文提供一种治疗受试者的脊髓延髓肌肉萎缩症(sbma)的方法,所述方法包括:向所述受试者给药:(i)碱基编辑器或编码碱基编辑器的核酸序列,和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中腺苷碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于受试者的雄激素受体(ar)基因中的单个核碱基修饰,并且其中单个核碱基修饰导致ar基因中的提前终止密码子,从而治疗所述受试者的sbma。15.在一些实施方案中,核碱基修饰造成ar基因中的cag-tag密码子变化。在一些实施方案中,密码子变化处于所述ar基因的外显子1或外显子2中。在一些实施方案中,脱氨酶是腺苷脱氨酶,其包含位于如seqidno:2中编号的氨基酸位置82或166处的氨基酸置换。在一些实施方案中,单个核碱基修饰是a替换为g的修饰。在一些实施方案中,a替换为g的核碱基修饰位于ar基因的剪接受体位点处。在一些实施方案中,剪接位点为ar基因的外显子的剪接受体位点5′。在一些实施方案中,ar基因的外显子为对应于seqidno:4的外显子2或其变体。在一些实施方案中,剪接位点为ar基因的外显子的剪接供体位点3′。在一些实施方案中,ar基因的外显子为对应于seqidno:4的外显子1或其变体。在一些实施方案中,在给药之后,ar基因在受试者体内的表达降低至少40%。16.在一些实施方案中,向导多核苷酸包含与ar基因的剪接受体核酸序列或剪接供体核酸序列互补的核酸序列。在一些实施方案中,向导多核苷酸包含选自表41a或表41b的核酸序列。在一些实施方案中,向导多核苷酸包含选自由5′‑acuuaccgcauguccccguaagg-3′、5′‑agugcaguuagggcugggaaggg-3′、5′‑aagugcaguuagggcugggaagg-3′及其补体所组成的组的核酸序列。17.一些实施方案中,受试者是哺乳动物或人。在一些实施方案中,给药是通过递送至受试者中枢神经系统(cns)细胞执行的。在一些实施方案中,细胞是运动神经元。18.在一些方面,本文提供一种修饰与神经疾患相关的靶基因或其调节元件的方法,所述方法包括:令靶基因或其调节元件与以下项接触:(i)腺苷碱基编辑器或编码腺苷碱基编辑器的核酸序列和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中腺苷碱基编辑器包含可编程dna结合结构域和腺苷脱氨酶结构域,其中向导多核苷酸引导所述腺苷碱基编辑器以实现位于靶基因剪接位点处的单个核碱基改变。19.在一些实施方案中,腺苷脱氨酶包含位于如seqidno:2中编号的氨基酸位置82或166处的氨基酸置换。在一些实施方案中,单个核碱基改变导致由靶基因编码的转录物的选择性剪接、由靶基因编码的经截短的和/或非功能性的蛋白质、和/或当在细胞中表达时靶基因的表达降低。在一些实施方案中,靶基因为超氧化物歧化酶1(sod1)基因,并且其中神经疾病为肌萎缩性脊髓侧索硬化症(als)。在一些实施方案中,靶基因为雄激素受体(ar)基因,并且其中神经疾病为脊髓延髓肌肉萎缩症(sbma)。20.在一些方面,本文提供一种调控超氧化物歧化酶(sod1)基因表达的方法,所述方法包括:令sod1基因或其调节元件与以下项接触:(i)碱基编辑器或编码碱基编辑器的核酸序列和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于超氧化物歧化酶1(sod1)基因剪接位点处的单个核碱基改变。21.在一些方面,本文提供一种修饰超氧化物歧化酶(sod1)基因的方法,所述方法包括:令sod1基因或其调节元件与以下项接触:(i)碱基编辑器或编码碱基编辑器的核酸序列和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中向导多核苷酸引导腺苷碱基编辑器以实现位于受试者的超氧化物歧化酶1(sod1)基因剪接位点处的单个核碱基改变,并且其中单个核碱基改变导致sod1基因中的提前终止密码子。22.在一些实施方案中,单个核碱基改变是a改变为g。在一些实施方案中,核碱基改变位于sod1基因的剪接受体位点处。在一些实施方案中,剪接位点为sod1基因的外显子的剪接受体位点5′。在一些实施方案中,sod1基因的外显子为对应于seqidno:3的外显子3或其变体。在一些实施方案中,sod1基因的外显子3与位于sod1多核苷酸序列中如seqidno:3中编号的核苷酸位置6828处的剪接受体相邻,或为其变体。在一些实施方案中,sod1基因的外显子为对应于seqidno:4的外显子3或其变体。在一些实施方案中,单个核碱基改变产生转录产物,所述转录产物缺少对应于seqidno:3的sod1基因的外显子3-5或其变体。23.在一些实施方案中,向导多核苷酸包含与sod1基因的剪接受体核酸序列或剪接供体核酸序列互补的核酸序列。在一些实施方案中,向导多核苷酸包含选自表19或表23的核酸序列。在一些实施方案中,向导多核苷酸包含选自由5′‑uuaaaggaaaguaauggaccagu-3′、5′‑uaaauaggcuguaccagugcagg-3′、5′‑uucauuauuaggcauguuggaga-3′、5′‑aaauaggcuguaccagugcaggu-3′、5′‑uauuaggcauguuggagacuugg-3′所组成的组的核酸序列。24.在一些方面,本文提供一种调控雄激素受体(ar)基因表达的方法,所述方法包括:令ar基因或其调节元件与以下项接触:(i)碱基编辑器或编码碱基编辑器的核酸序列和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于雄激素受体(ar)基因剪接位点处的单个核碱基改变。25.在一些方面,本文提供一种修饰雄激素受体(ar)基因的方法,所述方法包括:令ar基因或其调节元件与以下项接触:(i)碱基编辑器或编码碱基编辑器的核酸序列和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于受试者的雄激素受体(ar)基因剪接位点处的单个核碱基改变,并且其中单个核碱基改变导致ar基因中的提前终止密码子。26.在一些实施方案中,脱氨酶是腺苷脱氨酶,其包含位于如seqidno:2中编号的氨基酸位置82或166处的氨基酸置换。在一些实施方案中,脱氨酶是胞苷脱氨酶。在一些实施方案中,单个核碱基改变是c改变为t。在一些实施方案中,核碱基的改变造成ar基因中的cag-tag密码子变化。在一些实施方案中,密码子变化处于所述ar基因的外显子1或外显子2中。在一些实施方案中,单个核碱基改变是a改变为g。在一些实施方案中,a替换为g的核碱基改变位于ar基因的剪接受体位点处。27.在一些实施方案中,剪接位点为ar基因的外显子的剪接受体位点5′。在一些实施方案中,ar基因的外显子为对应于seqidno:4的外显子2或其变体。在一些实施方案中,剪接位点为ar基因的外显子的剪接供体位点3′。在一些实施方案中,ar基因的外显子为对应于seqidno:4的外显子1或其变体。28.在一些实施方案中,向导多核苷酸包含选自表41a或表41b的核酸序列。在一些实施方案中,向导多核苷酸包含与ar基因的剪接受体核酸序列或剪接供体核酸序列互补的核酸序列。在一些实施方案中,向导多核苷酸包含选自表41a或表41b的核酸序列。在一些实施方案中,向导多核苷酸包含选自由5′‑acuuaccgcauguccccguaagg-3′、5′‑agugcaguuagggcugggaaggg-3′、5′‑aagugcaguuagggcugggaagg-3′及其补体所组成的组的核酸序列。29.在一些实施方案中,接触在细胞中进行。在一些实施方案中,单个核碱基修饰导致细胞基因组中少于15%的插入缺失。在一些实施方案中,单个核碱基修饰导致细胞基因组中少于5%的插入缺失。在一些实施方案中,单个核碱基修饰导致细胞基因组中少于2%的插入缺失。在一些实施方案中,细胞是哺乳动物细胞或人细胞。在一些实施方案中,细胞是中枢神经系统细胞。在一些实施方案中,细胞是运动神经元。30.在一些实施方案中,接触在细胞群中进行。在一些实施方案中,至少40%的细胞群在接触之后包含单个核碱基修饰。31.在一些实施方案中,至少50%的细胞群在接触之后包含单个核碱基修饰。在一些实施方案中,至少60%的细胞群在接触之后包含单个核碱基修饰。在一些实施方案中,至少85%的细胞群在接触之后存活。在一些实施方案中,细胞群是哺乳动物细胞或人细胞。在一些实施方案中,细胞群是中枢神经系统细胞。在一些实施方案中,细胞群是运动神经元。32.在一些实施方案中,腺苷脱氨酶包含tada脱氨酶。在一些实施方案中,腺苷脱氨酶是tada7.10。在一些实施方案中,腺苷脱氨酶为tada,其包含如seqidno:2中编号的v28s突变或t166r突变或其相应突变。33.在本文提供的多个方面和实施方案中,腺苷脱氨酶包含以下一种或多种的突变:如seqidno:2中编号的y147t、y147r、q154s、y123h和q154r或其相应突变。在本文提供的多个方面和实施方案中,腺苷脱氨酶包含选自由以下组成的组的突变的组合:如seqidno:2中编号的y147t q154r、y147t q154s、y147r q154s、v82s q154s、v82s y147r、v82s q154r、v82s y123h、i76y v82s、v82s y123h y147t、v82s y123h y147r、v82s y123h q154r、y147r q154r y123h、y147r q154r i76y、y147r q154r t166r、y123h y147r q154r i76y、v82s y123h y147r q154r和i76y v82s y123h y147r q154r,或其相应突变。34.在一些实施方案中,腺苷脱氨酶包含c端的缺失,该缺失起始于选自由以下所组成的组的残基:149、150、151、152、153、154、155、156和157。在一些实施方案中,腺苷脱氨酶包含tada二聚体。在一些实施方案中,腺苷脱氨酶包含腺苷脱氨酶单体。35.在本文提供的多个方面和实施方案中,多核苷酸可编程dna结合结构域是cas9结构域。在一些实施方案中,cas9结构域是cas9切口酶结构域。在一些实施方案中,cas9结构域包含spcas9结构域。在一些实施方案中,spcas9结构域包含如seqidno:1中编号的d10a和/或h840a氨基酸置换或其相应氨基酸置换。在一些实施方案中,cas9结构域包含sacas9结构域。在一些实施方案中,cas9结构域具有针对改变的pam的特异性。在一些实施方案中,cas9结构域具有针对选自由以下所组成的组的pam序列的特异性:ngg、nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn和ngc,其中n为a、g、c或t,并且其中r为a或g。36.在一些方面,本文提供了通过本文所述方法生产的细胞群。37.在一些方面,本文提供一种碱基编辑器系统,其包含:(i)碱基编辑器或编码碱基编辑器的核酸序列和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于超氧化物歧化酶1(sod1)剪接位点处的单个核碱基修饰。38.在一些方面,本文提供一种碱基编辑器系统,其包含:(i)碱基编辑器或编码碱基编辑器的核酸序列,和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,其中向导多核苷酸引导腺苷碱基编辑器以实现位于超氧化物歧化酶1(sod1)基因中的单个核碱基修饰,并且其中单个核碱基修饰导致sod1基因中的提前终止密码子。39.在一些实施方案中,脱氨酶是腺苷脱氨酶,其包含位于如seqidno:2中编号的氨基酸位置82或166处的氨基酸置换。在一些实施方案中,脱氨酶是胞苷脱氨酶。在一些实施方案中,单个核碱基修饰是a替换为g的修饰。在一些实施方案中,a替换为g的核碱基修饰位于sod1基因的剪接受体位点处。在一些实施方案中,剪接位点为sod1基因的外显子的剪接受体位点5′。在一些实施方案中,sod1基因的外显子为对应于seqidno:3的外显子3或其变体。在一些实施方案中,sod1基因的外显子3与位于sod1多核苷酸序列中如seqidno:3中编号的核苷酸位置6828处的剪接受体ag相邻,或为其变体。在一些实施方案中,sod1转录物的选择性剪接产生转录产物,所述转录产物缺少对应于seqidno:3的sod1基因的外显子3-5或其变体。在一些实施方案中,sod1基因的外显子为对应于seqidno:4的外显子3或其变体。40.在一些实施方案中,向导多核苷酸包含与sod1基因的剪接受体核酸序列或剪接供体核酸序列互补的核酸序列。在一些实施方案中,向导多核苷酸包含选自表19或表23的核酸序列。在一些实施方案中,向导多核苷酸包含选自由5′‑uuaaaggaaaguaauggaccagu-3′、5′‑uaaauaggcuguaccagugcagg-3′、5′‑uucauuauuaggcauguuggaga-3′、5′‑aaauaggcuguaccagugcaggu-3′、5′‑uauuaggcauguuggagacuugg-3′及其互补序列所组成的组的核酸序列。41.在一些方面,本文提供一种碱基编辑器系统,其包含:(i)碱基编辑器或编码碱基编辑器的核酸序列和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于雄激素受体(ar)剪接位点处的单个核碱基修饰。42.在一些方面,本文提供一种碱基编辑器系统,其包含:(i)碱基编辑器或编码碱基编辑器的核酸序列,和(ii)向导多核苷酸或编码向导多核苷酸的核酸序列,其中腺苷碱基编辑器包含可编程dna结合结构域和脱氨酶结构域,并且其中向导多核苷酸引导腺苷碱基编辑器以实现位于受试者的雄激素受体(ar)基因中的单个核碱基修饰,并且其中单个核碱基修饰导致ar基因中的提前终止密码子。43.在一些实施方案中,脱氨酶是腺苷脱氨酶,其包含位于如seqidno:2中编号的氨基酸位置82或166处的氨基酸置换。在一些实施方案中,脱氨酶是胞苷脱氨酶。在一些实施方案中,单个核碱基修饰更是c替换为t的修饰。在一些实施方案中,单个核碱基修饰造成ar基因中的cag-tag密码子变化。在一些实施方案中,密码子变化处于ar基因的对应于seqidno:4的外显子1或外显子2或其变体中。在一些实施方案中,单个核碱基修饰是a替换为g的修饰。在一些实施方案中,a替换为g的核碱基修饰位于ar基因的剪接受体位点处。在一些实施方案中,剪接位点为ar基因的外显子的剪接受体位点5′。在一些实施方案中,ar基因的外显子为对应于seqidno:4的外显子2或其变体。在一些实施方案中,剪接位点为ar基因的外显子的剪接供体位点3′。在一些实施方案中,ar基因的外显子为对应于seqidno:4的外显子1或其变体。44.在一些实施方案中,向导多核苷酸包含与ar基因的剪接受体核酸序列或剪接供体核酸序列互补的核酸序列。在一些实施方案中,向导多核苷酸包含选自表41a或表41b的核酸序列。在一些实施方案中,向导多核苷酸包含选自由5′‑acuuaccgcauguccccguaagg-3′、5′‑agugcaguuagggcugggaaggg-3′、5′‑aagugcaguuagggcugggaagg-3′及其补体所组成的组的核酸序列。45.在一些实施方案中,腺苷脱氨酶包含tada脱氨酶。在一些实施方案中,腺苷脱氨酶是tada7.10。在一些实施方案中,腺苷脱氨酶为tada,其包含如seqidno:2中编号的v28s突变或t166r突变或其相应突变。在一些实施方案中,腺苷脱氨酶包含以下一种或多种的突变中:如seqidno:2中编号的y147t、y147r、q154s、y123h和q154r或其相应突变。在一些实施方案中,腺苷脱氨酶包含选自由以下组成的组的突变的组合:如seqidno:2中编号的y147t q154r、y147t q154s、y147r q154s、v82s q154s、v82s y147r、v82s q154r、v82s y123h、i76y v82s、v82s y123h y147t、v82s y123h y147r、v82s y123h q154r、y147r q154r y123h、y147r q154r i76y、y147r q154r t166r、y123h y147r q154r i76y、v82s y123h y147r q154r和i76y v82s y123h y147r q154r,或其相应突变。46.在一些实施方案中,腺苷脱氨酶包含c端的缺失,该缺失起始于选自由以下所组成的组的残基:149、150、151、152、153、154、155、156和157。在一些实施方案中,腺苷脱氨酶包含tada二聚体。在一些实施方案中,腺苷脱氨酶包含腺苷脱氨酶单体。47.在一些实施方案中,多核苷酸可编程dna结合结构域是cas9结构域。在一些实施方案中,cas9结构域是cas9切口酶结构域。在一些实施方案中,cas9结构域包含spcas9结构域。在一些实施方案中,spcas9结构域包含如seqidno:1中编号的d10a和/或h840a氨基酸置换或其相应氨基酸置换。在一些实施方案中,cas9结构域包含sacas9结构域。在一些实施方案中,cas9结构域具有针对改变的pam的特异性。在一些实施方案中,cas9结构域具有针对选自由以下所组成的组的pam序列的特异性:ngg、nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn和ngc,其中n为a、g、c或t,并且其中r为a或g。48.在一些方面,本文提供了一种载体,其包含编码本文所述的碱基编辑器系统中的多核苷酸可编程dna结合结构域的核酸序列和编码腺苷脱氨酶结构域的核酸序列。在一些实施方案中,载体进一步包含编码向导多核苷酸的核酸序列。在一些实施方案中,载体是病毒载体。49.在一些方面,本文提供了一种细胞,其包含本文所述的碱基编辑器系统或载体。在一些实施方案中,细胞是哺乳动物细胞、人细胞或运动神经元。在一些实施方案中,细胞是体内的、离体的或体外的。在一些实施方案中,细胞是从受试者分离的自体细胞。在一些实施方案中,细胞是同种异体细胞。50.在一些方面,本文提供了一种细胞群,其包含本文所述的碱基编辑器系统或载体。在一些实施方案中,细胞群是哺乳动物细胞、人细胞或运动神经元。在一些实施方案中,细胞群是体内的、离体的或体外的。在一些实施方案中,细胞是从受试者分离的自体细胞。51.在一些方面,本文提供一种药物组合物,其包含本文所述的碱基编辑器、载体或细胞以及药学可接受的载剂。在一个实施方案中,本文所述的药物组合物进一步包含脂质。在另一实施方案中,本文所述的药物组合物进一步包含病毒。52.在一些方面,本文提供了一种试剂盒,其包含本文所述的碱基编辑器系统或载体。53.在本文所述方法的多个实施方案中,向导多核苷酸的至少一个核苷酸包含非天然出现的修饰。在本文所述方法的多个实施方案中,核酸序列的至少一个核苷酸包含非天然出现的修饰。在本文所述方法的多个实施方案中,碱基编辑器系统的核酸序列的至少一个核苷酸包含非天然出现的修饰。在一些实施方案中,非天然出现的修饰是化学修饰。在一些实施方案中,化学修饰之2'-o-甲基化。在一些实施方案中,核酸序列包含硫代磷酸酯。54.本文的说明和实施例详细地例示性说明本公开的实施方案。应理解,本公开不限于本文所述的特定实施方案并因此可变。本领域技术人员应了解,存在大量关于本公开的改变和修改,而这些改变和修改还该在本公开范畴内。55.除非另做指定,否则本文所公开的一些实施方案的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组和重组dna的传统技术,这些技术属于本领域的技术。参见,例如,sambrook和green的《分子克隆:实验室手册(第四版)》(molecularcloning:alaboratorymanual,4thedition(2012));f.m.ausubel等人编撰的《分子生物学实验指南》丛书(theseriescurrentprotocolsinmolecularbiology);《酶学方法》丛书(theseriesmethodsinenzymology(academicpress,inc.));m.j.macpherson\b.d.hames和g.r.taylor编撰的《pcr2:实用方法》(pcr2:apracticalapproach(1995));harlow和lane编撰的《抗体,实验室手册》((1988)antibodies,alaboratorymanual)以及r.i.freshney编撰的《动物细胞培养:基本技术和专业应用手册》(cultureofanimalcells:amanualofbasictechniqueandspecializedapplications,6thedition(2010))。56.本文使用的章节标题仅用于组织性目的,而不视为限制所描述的主题。57.尽管本公开的多个特征可以在单实施方案上下文中描述,但这些特征也可以单独提供或以任何合适的组合方式提供。相反,尽管为了清楚起见,本公开可以在本文的单独实施方案上下文中描述,但本公开也可以在单实施方案中实现。本文使用的章节标题仅用于组织性目的,而不视为限制所描述的主题。58.本公开的特征在所附权利要求书中具体阐述。参考以下阐述例示性实施方案的具体实施方式(其中利用了本公开的原理),并且参照如下文所述的附图,可以获得对本公开的特征和优点的更佳理解。59.定义60.以下定义补充了本领域中的定义且针对本技术,并且不归咎于任何相关或不相关的情况,例如,任何共同拥有的专利或申请。尽管与本文中揭示者类似或等效的方法和材料可用于测试本公开的实践中,但优选的方法和材料在本文中描述。据此,本文所使用的技术仅用于描述特定实施方案的目的,而非试图限制。61.除非另做定义,否则本文中使用的所有科技术语均具有本发明所属领域技术人员所一般理解的意义。下述参考文献对技术人员提供本发明中使用的多个术语的一般性定义:singleton等人所著《微生物学和分子生物学词典(第二版)》(singleton等人,dictionaryofmicrobiologyandmolecularbiology(2nded.1994));《剑桥科技词典》(thecambridgedictionaryofscienceandtechnology(walkered.,1988));rieger等人编撰的《遗传性术语表(第五版)》(theglossaryofgenetics,5thed.,r.rieger等人(eds.),springerverlag(1991));以及hale和marham所著《哈珀·柯林斯生物学词典》(hale&marham,theharpercollinsdictionaryofbiology(1991)).62.在本技术中,除非具体地另做指定,否则单数的使用包括复数。必须注意,如本说明书中所用,除非上下文中明确排除,否则单数形式“一(a)”、“一(an)”和“该(the)”包括复数个对象。在本技术中,除非另做指定,否则“或”的使用意为“和/或”并且理解为包含性的。此外,术语“包括(including)”以及其他形式(诸如“包括(include)”、“包括(includes)”和“包括(included)”)不是限制性的。63.如本说明书和权利要求书中所用,词语“包含(comprising)”(以及其他形式的包含,诸如“包含(comprise)”和“包含(comprises)”)、“具有(having)”(以及其他形式的具有,诸如“具有(have)”和“具有(has)”)、“包括(including)”(以及其他形式的包括,诸如“包括(includes)”和“包括(include)”)或“含有(containing)”(以及其他形式的含有,诸如“含有(contains)”和“含有(contain)”)是包含性的或开放性的,并且不排除另外的、未引用的元件或方法步骤。设想本说明书中讨论的任何实施方案可以关于本公开的任何方法或组合物来实现,反之亦然。此外,本公开的组合物可用来实现本公开的方法。64.术语“约(about)”或“大约(approximately)”意为处于特定数值的可接受的误差范围内,如由本领域技术人员所确定的,其将部分地取决于该数值如何测量或测定,即,测量系统的限制。例如,根据本领域的实践,“约”可以意为处于1个或超过1个标准差内。另选地,“约”可以意为给定值的至多20%、至多10%、至多5%或至多1%的范围。另选地,特别是关于生物系统或过程,该术语可以意为处于数量级内,诸如处于数值的5倍以内或2倍以内。如果在申请和权利要求中描述特定数值,除非另做指定,否则应假设术语“约”意为处于该特定数值的可接受的误差范围内。65.本文中提供的范围理解为该范围内所有值的略写。例如,1至50的范围理解为包括来自由1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50所组成的组的任意数位、数位组合或子范围。66.说明书中对“一些实施方案”、“实施方案”、“一个实施方案”或“其他实施方案”的引用意味着,与这些实施方案关联描述的特定特征、结构或特点包括在本公开的至少一些实施方案中,但不必包括在全部实施方案中。[0067]“脱碱基的碱基编辑器(abasicbaseeditor)”意为能够切除核碱基并且插入dna核碱基(a、t、c或g)的试剂。脱碱基的碱基编辑器包含核酸糖苷酶多肽或其片段。在一个实施方案中,核酸糖苷酶是突变人尿嘧啶dna糖苷酶或其活性片段,其包含位于以下序列中氨基酸204处或位于尿嘧啶dna糖苷酶中相应位置处的asp(例如,替换位于氨基酸204处的asn)并且具有胞嘧啶-dna糖苷酶活性。在一个实施方案中,核酸糖苷酶是突变人尿嘧啶dna糖苷酶或其活性片段,其包含位于以下序列中氨基酸147处或位于尿嘧啶dna糖苷酶中相应位置处的ala、gly、cys或ser(例如,替换位于氨基酸147处的tyr)并且具有胸腺嘧啶-dna糖苷酶活性。示例性人尿嘧啶-dna糖苷酶亚型1的序列如下:[0068][0069]人尿嘧啶-dna糖苷酶亚型2的序列如下:[0070][0071]在其他实施方案中,脱碱基编辑器是pct/jp2015/080958和us20170321210中描述的脱碱基编辑器中的任何一种,该专利通过引用并入本文。在特定实施方案中,脱碱基编辑器包含位于上述序列中粗体显示且具有底线的位置处的突变,或位于本领域中已知的任何其他脱碱基编辑器或尿嘧啶脱糖基酶中相应氨基酸处的突变。在一个实施方案中,脱碱基编辑器包含位于y147、n204、l272和/或r276或相应位置处的突变。在另一实施方案中,脱碱基编辑器包含y147a或y147g突变或相应突变。在另一实施方案中,脱碱基编辑器包含n204d突变或相应突变。在另一实施方案中,脱碱基编辑器包含l272a突变或相应突变。在另一实施方案中,脱碱基编辑器包含r276e或r276c突变或相应突变。[0072]“腺苷脱氨酶”意为能够催化腺嘌呤或腺苷的水解性脱氨反应的多肽或其片段。在一些实施方案中,脱氨酶或脱氨酶结构域是催化腺苷到肌苷的水解性脱氨反应或腺苷到去氧肌苷的去氧反应的腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶催化去氧核糖核酸(dna)中的腺嘌呤或腺苷的水解性脱氨反应。本文提供的腺苷脱氨酶(例如,经工程化的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体诸如细菌。[0073]在一些实施方案中,腺苷脱氨酶是tada脱氨酶。在一些实施方案中,tada脱氨酶是tada变体。在一些实施方案中,tada变体是tada*8。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体诸如人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠的天然出现脱氨酶的变体。在一些实施方案中,脱氨酶或脱氨酶结构域不出现在自然界中。例如,在一些实施方案中,脱氨酶或脱氨酶结构域与天然出现的脱氨酶具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%atleast80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%的同一性。例如,脱氨酶结构域在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用而整体并入本文。也参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017))和rees,h.a.等人,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1,其整体内容通过引用并入本文。[0074]野生型tada(wt)腺苷脱氨酶具有以下序列(也称为tada参考序列):[0075]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd(seqidno:2)。[0076]在一些实施方案中,腺苷脱氨酶包含以下序列中的改变:[0077]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0078](也称为tada*7.10)。[0079]在一些实施方案中,tada*7.10包含至少一个改变。在一些实施方案中,tada*7.10包含位于氨基酸82和/或166处的改变。在特定实施方案中,上文述参考的序列的变体包含以下改变变中的一种或多种:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。本文中,改变y123h也称为h123h(tada*7.10中的改变h123y修复为y123h(wt))。在其他实施方案中,tada*7.10序列的变体包含选自由以下组成的组的改变的组合:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h;i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;andi76y v82s y123h y147r q154r。[0080]在其他实施方案中,本发明提供包括缺失的腺苷脱氨酶,例如,tada*8,其包含起始于残基149、150、151、152、153、154、155、156或157的c端缺失。在其他实施方案中,腺苷脱氨酶变体是tada(例如,tada*8)单体,其包含以下改变中的一种或多种:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。在其他实施方案中,腺苷脱氨酶变体是tada8(例如,tada*8)单体,其包含选自由以下组成的组的改变的组合:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h;i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;andi76y v82s y123h y147r q154r。[0081]在又其他实施方案中,腺苷脱氨酶变体是均二聚体,其包含两个腺苷脱氨酶结构域(例如,tada*8),每个腺苷脱氨酶结构域具有以下一种或多种的突变:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。在其他实施方案中,腺苷脱氨酶变体是聚而具体,其包含两个腺苷脱氨酶结构域(例如,tada*8),每个腺苷脱氨酶结构域具有选自由以下组成的组的改变的组合:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h;i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;andi76y v82s y123h y147r q154r。[0082]在其他实施方案中,腺苷脱氨酶变体是异二聚体,其包含野生型tada腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如,tada*8),所述腺苷脱氨酶变体结构域包含以下一种或多种的突变中:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。在其他实施方案中,腺苷脱氨酶变体是异二聚体,其包含野生型tada腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如,tada*8),所述腺苷脱氨酶变体结构域包含选自由以下组成的组的改变的组合:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h;i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;andi76y v82s y123h y147r q154r。[0083]在其他实施方案中,腺苷脱氨酶变体是异二聚体,其包含tada*7.10结构域和腺苷脱氨酶变体结构域(例如,tada*8),所述腺苷脱氨酶变体结构域包含以下一种或多种的突变中:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。在其他实施方案中,腺苷脱氨酶变体是异二聚体,其包含tada*7.10结构域和腺苷脱氨酶变体结构域(例如,tada*8),所述腺苷脱氨酶变体结构域包含以下改变的组合:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h;i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;ori76y v82s y123h y147r q154r。[0084]在一个实施方案中,腺苷脱氨酶是tada*8,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[0085]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd。[0086]在一些实施方案中,tada*8是经截短的。在一些实施方案中,相对于全长度tada*8,经截短的tada*8失去了1、2、3、4、5,6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端氨基酸残基。在一些实施方案中,相对于全长度tada*8,经截短的tada*8失去了1、2、3、4、5,6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个c端氨基酸残基。在一些实施方案中,腺苷脱氨酶变体是全长度tada*8。[0087]在特定实施方案中,腺苷脱氨酶异二聚体包含tada*8结构域和选自以下的腺苷脱氨酶结构域:[0088]在特定实施方案中,腺苷脱氨酶异二聚体包含tada*8结构域和选自以下的腺苷脱氨酶结构域:[0089]大肠杆菌(escherichiacoli)tada:[0090]mrrafitgvfflsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd[0091]大肠杆菌tada(n端截短):[0092]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd[0093]金黄色葡萄球菌(staphylococcusaureus(s.aureus))tada:[0094]mgshmtndiyfmtlaieeakkaaqlgevpigaiitkddeviarahnlretlqqptahaehiaieraakvlgswrlegctlyvtlepcvmcagtivmsriprvvygaddpkggcsgslmnllqqsnfnhraivdkgvlkeacstllttffknlrankkstn[0095]枯草芽孢杆菌(bacillussubtilis(b.subtilis))tada:[0096]mtqdelymkeaikeakkaeekgevpigavlvingeiiarahnlreteqrsiahaemlvideackalgtwrlegatlyvtlepcpmcagavvlsrvekvvfgafdpkggcsgtlmnllqeerfnhqaevvsgvleeecggmlsaffrelrkkkkaarknlse[0097]鼠伤寒沙门氏菌(salmonellatyphimurium(s.typhimurium))tada:[0098]mppafitgvtslsdveldheywmrhaltlakrawderevpvgavlvhnhrvigegwnrpigrhdptahaeimalrqgglvlqnyrlldttlyvtlepcvmcagamvhsrigrvvfgardaktgaagslidvlhhpgmnhrveiiegvlrdecatllsdffrmrrqeikalkkadraegagpav[0099]腐败希瓦氏菌(shewanellaputrefaciens(s.putrefaciens))tada:[0100]mdeywmqvamqmaekaeaagevpvgavlvkdgqqiatgynlsisqhdptahaeilclrsagkklenyrlldatlyitlepcamcagamvhsriarvvygardektgaagtvvnllqhpafnhqvevtsgvlaeacsaqlsrffkrrrdekkalklaqraqqgie[0101]流感嗜血杆菌(haemophilusinfluenzae)f3031(h.influenzae)tada:[0102]mdaakvrsefdekmmryaleladkaealgeipvgavlvddarniigegwnlsivqsdptαηaeiialrngakniqnyrllnstlyvtlepctmcagailhsrikrlvfgasdyktgaigsrfhffddykmnhtleitsgvlaeecsqklstffqkrreekkiekallkslsdk[0103]新月柄杆菌(caulobactercrescentus(c.crescentus))tada:[0104]mrtdesedqdhrmmrlaldaaraaaeagetpvgavildpstgeviatagngpiaahdptahaeiaamraaaaklgnyrltdltlvvtlepcamcagaisharigrvvfgaddpkggavvhgpkffaqptchwrpevtggvladesadllrgffrarrkaki[0105]硫还原地杆菌(geobactersulfurreducens(g.sulfurreducens))tada:[0106]msslkktpirddaywmgkaireaakaaardevpigavivrdgavigrghnlregsndpsahaemiairqaarrsanwrltgatlyvtlepclmcmgaiilarlervvfgcydpkggaagslydlsadprlnhqvrlspgvcqeecgtmlsdffrdlrrrkkakatpalfiderkvppep[0107]tada*7.10[0108]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0109]预期作为具有tada*8的异二聚体组分的其他tada7.10或tada7.10变体包括:[0110]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0111]tada7.10cp65[0112]tahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdp[0113]tada7.10cp83[0114]yrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqn[0115]tada7.10cp136[0116]mnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypg[0117]tada7.10c端截短[0118]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfn[0119]tada7.10c端截短2[0120]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprq[0121]tada7.10δ59-66 c端截短[0122]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfn[0123]tada7.10δ59-66[0124]gssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0125]在一些实施方案中,腺苷脱氨酶变体包含tada7.10中的改变。在一些实施方案中,tada7.10包含位于氨基酸82或166处的改变。在特定实施方案中,上文述参考的序列中的变体包含以下改变中的一种或多种:y147t、y147r、q154s、y123h、v82s、t166r和q154r。在其他实施方案中,腺苷脱氨酶变体包含选自由以下所组成的组的改变的组合:y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y147t q154r;y147t q154s;以及y123h y147r q154r i76y。[0126]在其他实施方案中,本发明提供包括缺失的腺苷脱氨酶,例如,tada*7.10,其包含起始于残基149、150、151、152、153、154、155、156或157的c端缺失。在其他实施方案中,腺苷脱氨酶变体是tada单体,其包含以下改变中的一种或多种:y147t、y147r、q154s、y123h、v82s、t166r、q154r。在其他实施方案中,腺苷脱氨酶变体是单体,其包含以下改变:y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y147t q154r;y147t q154s;以及y123h y147r q154r i76y。在又其他实施方案中,腺苷脱氨酶变体是均二聚体,其包含两个腺苷脱氨酶结构域,每个腺苷脱氨酶结构域具有以下一种或多种的突变:y147t、y147r、q154s、y123h、v82s、t166r、q154r。在其他实施方案中,腺苷脱氨酶变体是异二聚体,其包含野生型腺苷脱氨酶结构域或tada7.10和腺苷脱氨酶变体结构域,所述腺苷脱氨酶变体结构域包含以下一种或多种的突变:y147t、y147r、q154s、y123h、v82s、t166r、q154r。在其他实施方案中,腺苷脱氨酶变体是异二聚体,其包含tada7.10结构域和tada7.10的腺苷脱氨酶变体,所述腺苷脱氨酶变体结构域包含以下改变:y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y147t q154r;y147t q154s;以及y123h y147r q154r i76y。[0127]本文中,“给药(administering)”是指向患者或受试者提供本文所述的一种或多种组合物。举例而言且并非限制,可通过静脉内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹膜内(i.p.)注射或肌肉内(i.m.)注射来执行组合物给药(例如,注射)。可采用一种或多种此类途径。例如,可通过单次快速注射或通过随时间渐进灌注进行肠胃外给药。在一些实施方案中,肠胃外给药包括血管内、静脉内、肌肉内、动脉内、鞘内、肿瘤内、皮内、腹膜内、经气管、皮下、表皮下、关节内、被膜下、蛛网膜下和胸骨内输液或注射。另选地,或同时,可通过口服途径给药。[0128]“剂”意为任何小分子化学化合物、抗体、核酸分子、或肽、或其片段。[0129]“改变”意为基因或多肽的结构、表达水准或活性的变化(增加或减少),如通过该领域已知的方法如本文所述的那些方法所检测。如本文中所用,改变包括多核苷酸或多肽序列中的变化或表达水准的变化,诸如10%的变化、25%的变化、40%的变化、50%的变化或更高。[0130]“缓解”意为减少、阻抑、衰减、缩减、迟滞或稳定化疾病的发展或进展。[0131]“类似物”意为不相同但具有类似的功能或结构特征的分子。例如,多核苷酸或多肽类似物保留相对应的天然多核苷酸或多肽的生物学活性,但具有某些令该类似物功能相对于天然多核苷酸或多肽增强的修饰。此类修饰将会增加类似物对于dna的亲和性、效率、特异性、蛋白酶或核酸酶耐药性、膜渗透性和/或半衰期,而不改变例如配体结合。类似物可以包括非天然核苷酸或氨基酸。[0132]“碱基编辑器(baseeditor,be)”或“核碱基编辑器(nucleobaseeditor,nbe)意为结合多核苷酸并且具有核碱基修饰活性的试剂。在多个实施方案中,碱基编辑器包含核碱基修饰多肽(例如,脱氨酶)和核酸可编程核苷酸结合结构域,其与向导多核苷酸(例如,向导rna)协力。在多个实施方案中,该试剂是生物分子复合物,其包含具有碱基编辑活性的蛋白结构域,即能够修饰核酸分子(例如,dna)中的碱基(例如,a、t、c、g或u)的结构域。在一些实施方案中,多核苷酸可编程dna结合结构域融合或连接至脱氨酶结构域。在一个实施方案中,该试剂是融合蛋白,其包含具有碱基编辑活性的结构域。在另一实施方案中,具有碱基编辑活性的蛋白结构域连接至向导rna(例如,经由向导rna上的rna结合基序和融合至脱氨酶的rna结合结构域)。在一些实施方案中,具有碱基编辑活性的结构域能够将核酸分子内的碱基脱氨。在一些实施方案中,碱基编辑器能够将dna分子内的一个或多个碱基脱氨。在一些实施方案中,碱基编辑器能够将dna内的腺苷(a)脱氨。在一些实施方案中,碱基编辑器是腺苷碱基编辑器(abe)。[0133]“胞苷脱氨酶”意为能够催化将氨基转化为羰基的脱氨反应的多肽或其片段。在一些实施方案中,胞苷脱氨酶与apobec或aid具有至少约85%的同一性。在一个实施方案中,胞苷脱氨酶将胞嘧啶转化为尿嘧啶或将5-甲基胞嘧啶转化为胸腺嘧啶。来源于海七鳃鳗(petromyzonmarinus)的pmcda1(海七鳃鳗胞嘧啶脱氨酶1,“pmcda1”)、来源于哺乳动物(例如,人、猪、牛、马、猴等)的aid(启动诱导胞苷脱氨酶;aicda)和apobec是示例性的胞苷脱氨酶。[0134]在一些实施方案中,碱基编辑器是融合至脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)的可重新程式设计碱基编辑器。在一些实施方案中,碱基编辑器是融合至脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)的cas9。在一些实施方案中,碱基编辑器是融合至脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)的核酸酶失活cas9(dcas9)。在一些实施方案中,cas9是环状高突变(permutant)的cas9(例如,spcas9或sacas9)。环状高突变的cas9是本领域中已知的,并且在例如oakes等人,cell176,254–267,2019中有所描述。在一些实施方案中,碱基编辑器融合至碱基切除修复(ber)的抑制剂,例如,ugi结构域或disn结构域。在一些实施方案中,融合蛋白包含融合至脱氨酶的cas9切口酶和碱基切除修复的抑制剂诸如ugi结构域或disn结构域。在其他实施方案中,碱基编辑器是脱碱基的碱基编辑器。[0135]在一些实施方案中,碱基编辑器是腺苷碱基编辑器(abe)。在一些实施方案中,腺苷脱氨酶是从tada进化的。在一些实施方案中,本发明的碱基编辑器包含具有内部融的催化(例如,脱氨酶)结构域的napdnabp结构域。在一些实施方案中,napdnabp是具有内部融合脱氨酶结构域的cas12a(cpf1)。在一些实施方案中,napdnabp是具有内部融合脱氨酶结构域的cas12b(c2c1)。在一些实施方案中,napdnabp是具有内部融合脱氨酶结构域的cas12c(c2c3)。在一些实施方案中,napdnabp是具有内部融合脱氨酶结构域的cas12d(casx)。在一些实施方案中,napdnabp是具有内部融合脱氨酶结构域的cas12e(casy)。在一些实施方案中,napdnabp是具有内部融合脱氨酶结构域的cas12g。在一些实施方案中,napdnabp是具有内部融合脱氨酶结构域的cas12h。在一些实施方案中,napdnabp是具有内部融合脱氨酶结构域的cas12i。在一些实施方案中,碱基编辑器是融合至脱氨酶结构域的催化死亡cas12(dcas12)。在一些实施方案中,碱基编辑器是融合至脱氨酶结构域的cas12切口酶(ncas12)。[0136]在一些实施方案中,通过将腺苷脱氨酶变体(例如,tada*8)克隆到包括环状高突变的cas9(例如,spcas9或sacas9)和二分体核定位序列的支架中而产生碱基编辑器(例如,abe8)。环状高突变的cas9是本领域中已知的,并且在例如oakes等人,cell176,254–267,2019中有所描述。示例性的环状高突变物如下,其中粗体序列指示来源于cas9的序列,斜体序列表示连接子序列,而底线序列表示二分体核定位序列。[0137]cp5(具有msp“ngc=具有规则cas9突变如ngg的pam变体”、pid=蛋白质相互作用结构域和“d10a”切口酶):[0138][0139][0140]在一些实施方案中,abe8选自来自上文表6-9、13或14的碱基编辑器。在一些实施方案中,abe8含有从tada进化的腺苷脱氨酶变体。在一些实施方案中,abe8的腺苷脱氨酶变体是如上文表7、9、13或14中所述的tada*8变体。在一些实施方案中,腺苷脱氨酶变体是tada*7.10变体(例如,tada*8),其包含选自由以下项所组成的组的一种或多种改变:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。在多个实施方案中,abe8包含tada*7.10变体(例如,tada*8),其具有选自由以下所组成的组的改变组合:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h、i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;以及i76y v82s y123h y147r q154r。在一些实施方案中,abe8是单体构建体。在一些实施方案中,abe8是异二聚体构建体。一些实施方式中,abe8碱基编辑器包含序列:[0141]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd.[0142]在一些实施方案中,多核苷酸可编程dna结合结构域是crispr相关(例如,cas或cpf1)酶。在一些实施方案中,碱基编辑器是融合至脱氨酶结构域的催化死亡cas9(dcas9)。在一些实施方案中,碱基编辑器是融合至脱氨酶结构域的cas9切口酶(ncas9)。在一些实施方案中,碱基编辑器融合至碱基切除修复(ber)的抑制剂。在一些实施方案中,碱基切除修复的抑制剂是尿嘧啶dna糖苷酶抑制剂(ugi)。在一些实施方案中,碱基切除修复的抑制剂是肌苷碱基切除修复抑制剂。[0143]碱基编辑器的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用而整体并入本文。也参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017))和rees,h.a.等人,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1,其整体内容通过引用并入本文。[0144]举例而言,如本文所述的碱基编辑组合物、系统和方法中使用的胞苷碱基编辑器具有如下文提供的以下核酸序列(8877个碱基对)(addgene,watertown,ma.;komorac等人,2017,sciadv.,30;3(8):eaao4774.doi:10.1126/sciadv.aao4774)。也包括与be4核酸序列具有至少95%或更高同一性的多核苷酸序列。[0145][0146][0147][0148][0149]be4氨基酸序列:[0150]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglksggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggspkkkrk[0151]举例而言,如本文所述的碱基编辑组合物、系统和方法中使用的腺苷碱基编辑器(abe)具有如下文提供的核酸序列(8877个碱基对)(addgene,watertown,ma.;gaudellinm,等人,nature.2017nov23;551(7681):464-471.doi:10.1038/nature24644;koblanlw等人,natbiotechnol.2018oct;36(9):843-846.doi:10.1038/nbt.4172.)。也包括与abe核酸序列具有至少95%或更高同一性的多核苷酸序列。[0152]atatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtctctgaagtcgagtttagccacgagtattggatgaggcacgcactgaccctggcaaagcgagcatgggatgaaagagaagtccccgtgggcgccgtgctggtgcacaacaatagagtgatcggagagggatggaacaggccaatcggccgccacgaccctaccgcacacgcagagatcatggcactgaggcagggaggcctggtcatgcagaattaccgcctgatcgatgccaccctgtatgtgacactggagccatgcgtgatgtgcgcaggagcaatgatccacagcaggatcggaagagtggtgttcggagcacgggacgccaagaccggcgcagcaggctccctgatggatgtgctgcaccaccccggcatgaaccaccgggtggagatcacagagggaatcctggcagacgagtgcgccgccctgctgagcgatttctttagaatgcggagacaggagatcaaggcccagaagaaggcacagagctccaccgactctggaggatctagcggaggatcctctggaagcgagacaccaggcacaagcgagtccgccacaccagagagctccggcggctcctccggaggatcctctgaggtggagttttcccacgagtactggatgagacatgccctgaccctggccaagagggcacgcgatgagagggaggtgcctgtgggagccgtgctggtgctgaacaatagagtgatcggcgagggctggaacagagccatcggcctgcacgacccaacagcccatgccgaaattatggccctgagacagggcggcctggtcatgcagaactacagactgattgacgccaccctgtacgtgacattcgagccttgcgtgatgtgcgccggcgccatgatccactctaggatcggccgcgtggtgtttggcgtgaggaacgcaaaaaccggcgccgcaggctccctgatggacgtgctgcactaccccggcatgaatcaccgcgtcgaaattaccgagggaatcctggcagatgaatgtgccgccctgctgtgctatttctttcggatgcctagacaggtgttcaatgctcagaagaaggcccagagctccaccgactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacactcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatc[0153]“碱基编辑活性”意为发挥作用以化学地改变多核苷酸内的碱基。在一个实施方案中,将第一碱基转化为第二碱基。在一个实施方案中,碱基编辑活性是胞苷脱氨酶活性,例如,将靶标c·g转化为t·a。在另一实施方案中,碱基编辑活性是腺苷或腺嘌呤脱氨酶活性,例如,将a·t转化为g·c。在另一实施方案中,碱基编辑活性是胞苷脱氨酶活性,例如,将靶标c·g转化为t·a,以及腺苷或腺嘌呤脱氨酶活性,例如,将a·t转化为g·c。在一些实施方案中,通过编辑的效率评估碱基编辑活性。碱基编辑效率可以通过任何合适的手段测量,例如,通过sanger测序或下一代测序测量。在一些实施方案中,碱基编辑效率通过具有碱基编辑器所致的核碱基转化的测序读取的总百分比测量,例如,具有靶标a.t碱基对被转化为g.c碱基对的测序读取的总百分比。在一些实施例中,当在细胞群中执行碱基编辑时,碱基编辑效率通过具有碱基编辑器所致的核碱基转化的细胞的总百分比测量。[0154]术语“碱基编辑器系统”是指用于编辑靶标核苷酸序列的核碱基的系统。在多种实施方案中,碱基编辑器系统包含:(1)多核苷酸可编程核苷酸结合结构域(例如,cas9);(2)用于将所述核碱基脱氨的脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶);和(3)一种或多种向导多核苷酸(例如,向导rna)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,碱基编辑器是腺嘌呤或腺苷碱基编辑器(abe)。一些实施方式中,碱基编辑器是abe8。[0155]在一些实施方案中,碱基编辑器系统包含超过一个碱基编辑组分。例如,碱基编辑器系统可以包括超过一种脱氨酶。在一些实施方案中,碱基编辑器系统可以包括一种或多种腺苷脱氨酶。在一些实施方案中,单向导多核苷酸可用将不同的脱氨酶靶向靶标核酸序列。在一些实施方案中,一对向导多核苷酸可用将不同的脱氨酶靶向靶标核酸序列。[0156]碱基编辑器系统的脱氨酶结构域和多核苷酸可编程核苷酸结合组分可以彼此共价或非共价地缔合,或者是其缔合和相互作用的任意组合。例如,在一些实施方案中,脱氨酶结构域可以通过多核苷酸可编程核苷酸结合结构域被靶向至靶标核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至脱氨酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以通过与脱氨酶结构域非共价地相互作用或缔合而将脱氨酶结构域靶向至核苷酸序列。例如,在一些实施方案中,脱氨酶结构域可以包含额外的异源部分或结构域,该异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外异源部分或结构域相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够结合至向导多核苷酸。在一些实施方案中,额外异源部分可以能够结合至多肽连接子。在一些实施方案中,额外异源部分可以能够结合至多核苷酸连接子。额外异源部分可以是蛋白结构域。在一些实施方案中,额外异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmu外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[0157]碱基编辑器系统可以进一步包含向导多核苷酸组分。应知悉,碱基编辑器系统的组分可以彼此经由共价键彼此缔合、非共价相互作用、或其缔合及相互作用的任何组合。在一些实施方案中,脱氨酶结构域可以通过向导多核苷酸被靶向至靶标核苷酸序列。例如,在一些实施方案中,脱氨酶结构域可以包含额外异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白),该额外异源部分或结构域能够与向导多核苷酸的部分或链段(例如,多核苷酸基序)相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白)可以融合或连接至脱氨酶结构域。在一些实施方案中,额外异源部分可以能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够结合至向导多核苷酸。在一些实施方案中,额外异源部分可以能够结合至多肽连接子。在一些实施方案中,额外异源部分可以能够结合至多核苷酸连接子。额外异源部分可以是蛋白结构域。在一些实施方案中,额外异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmu外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[0158]在一些实施方案中,碱基编辑器系统可以进一步包含碱基切除修复(ber)组分的抑制剂。应知悉,碱基编辑器系统的组分可以彼此经由共价键彼此缔合、非共价相互作用、或其缔合及相互作用的任何组合。ber组分的抑制剂可以包含ber抑制剂。在一些实施方案中,ber的抑制剂是尿嘧啶dna糖苷酶抑制剂(ugi)。在一些实施方案中,ber的抑制剂是肌苷ber抑制剂。在一些实施方案中,ber的抑制剂可以通过多核苷酸可编程核苷酸结合结构域被靶向至靶标核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至ber的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至脱氨酶结构域和ber的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以通过与ber的抑制剂非共价地相互作用或缔合而将ber的抑制剂靶向至核苷酸序列。例如,在一些实施方案中,ber组分的抑制剂可以包含额外的异源部分或结构域,该异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外异源部分或结构域相互作用、缔合或形成复合物。[0159]在一些实施方案中,ber的抑制剂可以通过向导多核苷酸被靶向至靶标核苷酸序列。例如,在一些实施方案中,ber的抑制剂可以包含额外异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白),该额外异源部分或结构域能够与向导多核苷酸的部分或链段(例如,多核苷酸基序)相互作用、缔合或形成复合物。在一些实施方案中,向导多核苷酸的额外异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白)可以融合或连接至ber的抑制剂。在一些实施方案中,额外异源部分可以能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够结合至向导多核苷酸。在一些实施方案中,额外异源部分可以能够结合至多肽连接子。在一些实施方案中,额外异源部分可以能够结合至多核苷酸连接子。额外异源部分可以是蛋白结构域。在一些实施方案中,额外异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[0160]术语“cas9”或“cas9结构域”是指包含cas9蛋白的rna引导的核酸酶或其片段(例如,一种蛋白质,其包含cas9的活性、失活或部分活性的dna裂解结构域和/或cas9的grma结合结构域)。cas9核酸酶有时也称为casn1核酸酶或crispr(clusteredregularlyinterspacedshortpalindromicrepeat,规律成簇间隔短回文重复序列)相关核酸酶。crispr是适应性免疫系统,其提供针对可动遗传因数(病毒、转座因子和接合质粒)的保护。crispr簇含有间隔序列、与先行移动元件互补的序列和侵入靶标的核酸。crispr簇被转录并加工为crisprrna(crrna)。在ii型crispr系统中,正确加工pre-crrna需要反式编码的小rna(tracrrna)、内源核糖核酸酶3(rnc)和cas9蛋白。tracrrna在核糖核酸酶3辅助的pre-crrna加工中充当向导。随后,cas9/crrna/tracrrna核酸内切溶解地裂解与间隔序列互补的线性或环状dsdna靶标。不与crrna互补的靶标链首先被核酸内切溶解地切割,然后被3′‑5′核酸外切溶解地修剪。本质上中,dna结合和裂解通常需要蛋白质和两种rna。但是,单向导rna(“sgrna”或简称为“gnra”)可以工程化改造,以将crrna和tracrrna两者的各个方面合并到单个rna物种中。参见例如,jinekm.等人,science337:816-821(2012),其整体内容通过引用并入本文。cas9识别crispr重复序列中的短基序(pam或前间隔序列邻近基序)以帮助区分自我与非自我。cas9核酸酶序列和结构是本领域技术人员已知的(参见例如,“completegenomesequenceofanm1strainofstreptococcuspyogenes.”ferretti等人,proc.natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.等人,nature471:602-607(2011);和“aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.等人,science337:816-821(2012),其各自的整体内容通过引用并入本文)。cas9直接同源物已经在多种物种中描述,包括但不限于化脓性链球菌和嗜热链球菌。基于本公开,其他合适的cas9核酸酶和序列对于本领域技术人员将是显而易见的,并且此类cas9核酸酶和序列包括来自生物体的cas9序列和以下文献中公开的基因座:chylinski,rhun,andcharpentier,“thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737;其整体内容通过引用并入本文。[0161]示例性cas9是化脓性链球菌(streptococcuspyogenes)cas9(spcas9),其氨基酸序列提供于下:[0162][0163][0164](单底线:hnh结构域;双底线:ruvc结构域)[0165]经核酸酶灭活的cas9蛋白可以互换地称为“dcas9”蛋白(对于核酸酶“死亡的”cas9)或无催化活性的cas9。用于产生具有无活性的dna裂解结构域的cas9蛋白(或其片段)的方法是已知的(参见例如,jinek等人,science.337:816-821(2012);qi等人,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression”(2013)cell.28;152(5):1173-83,其各自的整体内容通过引用并入本文)。例如,cas9的dna裂解结构域已知包括两个亚结构域,hnh核酸酶亚结构域和ruvc1亚结构域。hnh亚结构域裂解与grna互补的链,而ruvc1亚结构域裂解非互补链。这些亚结构域中的突变可以静默cas9的核酸酶活性。例如,突变d10a和h840a将化脓性链球菌cas9的核酸酶活性完全灭活(jinek等人,science.337:816-821(2012);qi等人,cell.28;152(5):1173-83(2013))。在一些实施方案中,cas9核酸酶具有无活性的(例如,灭活的)dna裂解结构域,换言之,cas9是切口酶,称为“ncas9”蛋白(对于“切口酶”cas9)。在一些实施方案中,提供了包含cas9的片段的蛋白质。例如,在一些实施方案中,蛋白质包含一个或两个cas9结构域:(1)cas9的grna结合结构域;或(2)cas9的dna切割结构域。在一些实施方案中,包含cas9或其片段的蛋白质称为“cas9变体”。cas9变体享有与cas9或其片段的同源性。例如,cas9变体与野生型cas9至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,与野生型cas9相比,cas9变体可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多氨基酸变化。在一些实施方案中,cas9变体包含cas9的片段(例如,grna结合结构域或dna切割结构域),使得该片段与野生型cas9的相应片段至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,该片段是相应野生型cas9的氨基酸长度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%。[0166]在一些实施方案中,该片段为至少100个氨基酸的长度。一些实施方式中,该片段为至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250个或至少1300个氨基酸的长度。[0167]在一些实施方案中,野生型cas9对应于来自化脓性链球菌(streptococcuspyogenes)的cas9(ncbi参考序列:nc_017053.1,核苷酸和氨基酸序列如下)。[0168]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttggcagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggcagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaatctacaatcaattatttgaagaaaaccctattaacgcaagtagagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagagaaatggcttgtttgggaatctcattgctttgtcattgggattgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatagtgaaataactaaggctcccctatcagcttcaatgattaagcgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgagggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggcgcctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggggatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagatattcaaaaagcacaggtgtctggacaaggccatagtttacatgaacagattgctaacttagctggcagtcctgctattaaaaaaggtattttacagactgtaaaaattgttgatgaactggtcaaagtaatggggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctacaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttcattaaagacgattcaatagacaataaggtactaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0169][0170][0171](单底线:hnh结构域;双底线:ruvc结构域)[0172]在一些实施方案中,野生型cas9对应于或包含以下核苷酸和/或氨基酸序列:[0173]atggataaaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctgcagga[0174][0175][0176](单底线:hnh结构域;双底线:ruvc结构域)[0177]在一些实施方案中,野生型cas9对应于来自化脓性链球菌(streptococcuspyogenes)的cas9(ncbi参考序列:nc_002737.2(核苷酸序列如下);和uniprot参考序列:q99zw2(氨基酸序列如下))。[0178]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgaatataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccctattaacgcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaatctcattgctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttcaatgattaaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagtttacatgaacatattgcaaatttagctggtagccctgctattaaaaaaggtattttacagactgtaaaagttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0179][0180](单底线:hnh结构域;双底线:ruvc结构域)[0181]在一些实施方案中,cas9是指来自以下微生物的cas9:溃疡棒状杆菌(corynebacteriumulcerans)(ncbirefs:nc_015683.1,nc_017317.1);白喉棒状杆菌(corynebacteriumdiphtheria)(ncbirefs:nc_016782.1,nc_016786.1);螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1);中间普雷沃菌(prevotellaintermedia)(ncbiref:nc_017861.1);中国台湾螺原体(spiroplasmataiwanense,china)(ncbiref:nc_021846.1);海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1);拟杆菌(belliellabaltica)(ncbiref:nc_018010.1);扭曲冷弯曲菌(psychroflexustorquisi)(ncbiref:nc_018721.1);嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1);无害李斯特菌(listeriainnocua)(ncbiref:np_472073.1);空肠弯曲菌(campylobacterjejuni)(ncbiref:yp_002344900.1)或脑膜炎双球菌(neisseriameningitidis)(ncbiref:yp_002342100.1),或者是指来至任何其他生物体的cas9。[0182]在一些实施方案中,dcas9部分地或完整地对应于或包含具有一个或多个突变的cas9氨基酸序列,该突变将cas9核酸酶活性灭活。例如,在一些实施方案中,dcas9结构域包含d10a和h840a突变或另一cas9中的相应突变。在一些实施方案中,dcas9包含dcas9的氨基酸序列(d10a和h840a):[0183][0184][0185](单底线:hnh结构域;双底线:ruvc结构域)。[0186]在一些实施方案中,cas9结构域包含d10a突变,而位于位置840处的残基保持为上文提供的氨基酸序列中的组氨酸,或者位于本文提供的任何氨基酸序列中的相应位置处。[0187]在其他实施方案中,提供了具有除d10a和h840a之外的突变的dcas9变体,该突变例如导致经核酸酶灭活的cas9(dcas9)。举例而言,此类突变包括位于d10和h840处的其他氨基酸置换,或cas9的核酸酶结构域内的其他置换(例如,hnh核酸酶亚结构域和/或ruvc1亚结构域中的置换)。在一些实施方案中,提供了dcas9的变体或同源物,该变体或同源物至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,提供了dcas9的变体,该变体的氨基酸序列更短或更长,短了或长了约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多。[0188]在一些实施方案中,如本文所提供的cas9融合蛋白包含cas9蛋白的全长度氨基酸序列,例如,本文所提供的cas9序列之一。然而,在其他实施方案中,如本文所提供的融合蛋白不包含全长度cas9序列,而仅包含其一个或多个片段。合适的cas9结构域和cas9片段的示例性氨基酸序列在本文中提供,并且cas9结构域和片段的其他合适的序列对于本领域技术人员而言将会是显而易见的。[0189]应知悉,其他cas9蛋白(例如,核酸酶死亡的cas9(dcas9)、cas9切口酶(ncas9)或核酸酶活性的cas9),包括其变体和同源物,处于本公开的范畴内。示例性cas9蛋白包括而不限于下文提供的那些。在一些实施方案中,cas9蛋白是核酸酶死亡的cas9(dcas9)。在一些实施方案中,cas9蛋白是cas9切口酶(ncas9)。在一些实施方案中,cas9蛋白是核酸酶活性的cas9。[0190]示例性无催化活性的cas9(dcas9):[0191]dkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0192]示例性催化cas9切口酶(ncas9):[0193]dkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0194]示例性催化活性cas9:[0195]dkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd.[0196]在一些实施方案中,cas9是指来自古生菌(例如,纳古菌)的cas9,其构建单细胞原核微生物的结构域和界。在一些实施方案中,cas9是指casx或casy,它们已经在例如burstein等人,"newcrispr-cassystemsfromuncultivatedmicrobes."cellres.2017feb21.doi:10.1038/cr.2017.21中有所描述,该文献的整体内容通过引用并入本文。使用基因组解析的宏基因组学,鉴定了大量crispr-cas系统,包括在古生菌生命结构域中首次报导的cas9。这种趋异cas9蛋白是作为活性crispr-cas系统的一部分在很少研究的纳古菌中被发现的。在细菌中,发现了两种先前未知的系统,crispr-casx和crispr-casy,它们是迄今为止所发现的最紧凑的系统之一。在一些实施方案中,cas9是指casx或casx的变体。在一些实施方案中,cas9是指casy或casy的变体。应知悉,其他rna引导的dna结合蛋白可以用作核酸可编程dna结合蛋白(napdnabp),并且处于本公开的范畴内。[0197]在特定实施方案中,可用于本发明方法的napdnabp包括环状高突变物,其是本领域中已知的并且例如通过oakes等人,cell176,254–267,2019描述。示例性的环状高突变物如下,其中粗体序列指示来源于cas9的序列,斜体序列表示连接子序列,而底线序列表示二分体核定位序列。[0198]cp5(具有msp“ngc=具有规则cas9突变如ngg的pam变体”、pid=蛋白质相互作用结构域和“d10a”切口酶):[0199][0200][0201]可并入碱基编辑器中的多核苷酸可编程核苷酸结合结构域的非限制性示例包括源自crispr蛋白的结构域、限制性核酸酶、大范围核酸酶、tal核酸酶(talen)和锌指核酸酶(zfn)。[0202]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是casx或casy蛋白。在一些实施方案中,napdnabp是casx蛋白。在一些实施方案中,napdnabp是casy蛋白。在一些实施方案中,napdnabp包含氨基酸序列,所述氨基酸序列与天然出现的casx或casy蛋白为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,napdnabp是天然出现的casx或casy蛋白。在一些实施方案中,napdnabp包含氨基酸序列,所述氨基酸序列与本文描述的任何casx或casy蛋白为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应知悉,来自其他细菌物种的cas12b/c2c1、casx和casy也可以根据本公开使用。[0203]cas12b/c2c1(uniprot.org/uniprot/t0d7a2#2)[0204]sp|t0d7a2|c2c1_aliagcrispr相关核酸内切酶c2c1os=嗜酸耐热菌(alicyclobacillusacido-terrestris)(菌株atcc49025/dsm3922/cip106132/ncimb13137/gd3b)gn=c2c1pe=1sv=1[0205]mavksikvklrlddmpeiraglwklhkevnagvryytewlsllrqenlyrrspngdgeqecdktaeeckaellerlrarqvenghrgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekekaetrksadrtadvlraladfglkplmrvytdsemssvewkplrkgqavrtwdrdmfqqaiermmsweswnqrvgqeyaklveqknrfeqknfvgqehlvhlvnqlqqdmkeaspgleskeqtahyvtgralrgsdkvfekwgklapdapfdlydaeiknvqrrntrrfgshdlfaklaepeyqalwredasfltryavynsilrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgerrhairfhkllkvengvarevddvtvpismseqldnllprdpnepialyfrdygaeqhftgefggakiqcrrdqlahmhrrrgardvylnvsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnskgrvpfffpikgndnlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpvdaanhmtpdwreafenelqklkslhgicsdkewmdavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyakdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyaldergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqelinqaqvhdllvgtmyaafssrfdartgapgircrrvparctqehnpepfpwwlnkfvvehtldacplraddliptgegeifvspfsaeegdfhqihadlnaaqnlqqrlwsdfdisqirlrcdwgevdgelvliprltgkrtadsysnkvfytntgvtyyerergkkrrkvfaqeklseeeaellveadeareksvvlmrdpsgiinrgnwtrqkefwsmvnqriegylvkqirsrvplqdsacentgdi[0206]casx(uniprot.org/uniprot/f0nn87;uniprot.org/uniprot/f0nh53)[0207]》tr|f0nn87|f0nn87_sulihcrispr相关casx蛋白os=冰岛硫化叶菌(sulfolobusislandicus)(菌株hve10/4)gn=sih_0402pe=4sv=1[0208]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefyefgrspgmvertrrvklevephyliiaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvriytisdavgqnpttinggfsidltkllekryllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg[0209]》tr|f0nh53|f0nh53_sulircrispr相关蛋白,casxos=冰岛硫化叶菌(sulfolobusislandicus)(菌株rey15a)gn=sire_0771pe=4sv=1[0210]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefykfgrspgmvertrrvklevephylimaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvsiytisdavgqnpttinggfsidltkllekrdllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg[0211]δ变形菌casx[0212]mekrinkirkklsadnatkpvsrsgpmktllvrvmtddlkkrlekrrkkpevmpqvisnnaannlrmllddytkmkeailqvywqefkddhvglmckfaqpaskkidqnklkpemdekgnlttagfacsqcgqplfvykleqvsekgkaytnyfgrcnvaeheklillaqlkpvkdsdeavtyslgkfgqraldfysihvtkesthpvkplaqiagnryasgpvgkalsdacmgtiasflskyqdiiiehqkvvkgnqkrleslrelagkenleypsvtlppqphtkegvdayneviarvrmwvnlnlwqklklsrddakpllrlkgfpsfpvverrenevdwwntinevkklidakrdmgrvfwsgvtaekrntilegynylpnendhkkregslenpkkpakrqfgdlllylekkyagdwgkvfdeaweridkkiagltshiereearnaedaqskavltdwlrakasfvlerlkemdekefyaceiqlqkwygdlrgnpfaveaenrvvdisgfsigsdghsiqyrnllawkylengkrefyllmnygkkgrirftdgtdikksgkwqgllygggkakvidltfdpddeqliilplafgtrqgrefiwndllsletgliklangrviektiynkkigrdepalfvaltferrevvdpsnikpvnligvargenipavialtdpegcplpefkdssggptdilrigegykekqraiqaakeveqrraggysrkfasksrnladdmvrnsardlfyhavthdavlvfanlsrgfgrqgkrtfmterqytkmedwltaklayegltsktylsktlaqytsktcsncgftityadmdvmlvrlkktsdgwattlnnkelkaeyqityynrykrqtvekelsaeldrlseesgnndiskwtkgrrdealfllkkrfshrpvqeqfvcldcghevhaaeqaalniarswlflnsnstefksyksgkqpfvgawqafykrrlkevwkpna[0213]casy(ncbi.nlm.nih.gov/protein/apg80656.1)[0214]》apg80656.1crispr相关蛋白casy[未培养的俭菌菌群细菌][0215]mskrhprisgvkgyrlhaqrleytgksgamrtikyplysspsggrtvpreivsainddyvglyglsnfddlynaekrneekvysvldfwydcvqygavfsytapgllknvaevrggsyeltktlkgshlydelqidkvikflnkkeisrangsldklkkdiidcfkaeyrerhkdqcnkladdiknakkdagaslgerqkklfrdffgiseqsendkpsftnplnltccllpfdtvnnnrnrgevlfnklkeyaqkldknegslemweyigignsgtafsnflgegflgrlrenkitelkkammditdawrgqeqeeelekrlrilaaltiklrepkfdnhwggyrsdingklsswlqnyinqtvkikedlkghkkdlkkakeminrfgesdtkeeavvssllesiekivpddsaddekpdipaiaiyrrflsdgrltlnrfvqredvqealikerleaekkkkpkkrkkksdaedeketidfkelfphlakplklvpnfygdskrelykkyknaaiytdalwkavekiyksafssslknsffdtdfdkdffikrlqkifsvyrrfntdkwkpivknsfapycdivslaenevlykpkqsrsrksaaidknrvrlpsteniakagialarelsvagfdwkdllkkeeheeyidlielhktalalllavtetqldisaldfvengtvkdfmktrdgnlvlegrflemfsqsivfselrglaglmsrkefitrsaiqtmngkqaellyiphefqsakittpkemsrafldlapaefatslepeslseksllklkqmryyphyfgyeltrtgqgidggvaenalrlekspvkkreikckqyktlgrgqnkivlyvrssyyqtqflewflhrpknvqtdvavsgsflidekkvktrwnydaltvalepvsgservfvsqpftifpeksaeeegqrylgidigeygiaytaleitgdsakildqnfisdpqlktlreevkglkldqrrgtfampstkiarireslvhslrnrihhlalkhkakivyelevsrfeegkqkikkvyatlkkadvyseidadknlqttvwgklavaseisasytsqfcgackklwraemqvdetittqeligtvrvikggtlidaikdfmrppifdendtpfpkyrdfcdkhhiskkmrgnsclficpfcranadadiqasqtiallryvkeekkvedyferfrklknikvlgqmkki[0216]术语“cas12”或“cas12结构域”是指包含cas12蛋白的rna引导的核酸酶或其片段(例如,一种蛋白质,其包含cas12的活性、失活或部分活性的dna裂解结构域和/或cas12的grma结合结构域)。cas12属于2类v型crispr/cas系统。cas12核酸酶有时也称为crispr(规律成簇间隔短回文重复序列)相关核酸酶。示例性外村尚芽孢杆菌(bacillushisashii)cas12b(bhcas12b)cas12结构域的序列提供于下:[0217]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkk。[0218]与bhcas12b氨基酸序列具有至少85%或更高同一性的氨基酸序列也可用于本发明的方法中。[0219]“胞苷脱氨酶”意为能够催化将氨基转化为羰基的脱氨反应的多肽或其片段。在一个实施方案中,胞苷脱氨酶将胞嘧啶转化为尿嘧啶或将5-甲基胞嘧啶转化为胸腺嘧啶。来源于海七鳃鳗(petromyzonmarinus)的pmcda1(海七鳃鳗胞嘧啶脱氨酶1,“pmcda1”)、来源于哺乳动物(例如,人、猪、牛、马、猴等)的aid(启动诱导胞苷脱氨酶;aicda)和apobec是示例性的胞苷脱氨酶。[0220]术语“保守氨基酸置换”或“保守突变”是指一种氨基酸被另一种具有共同特性的氨基酸替换。一种定义个体氨基酸之间的共同特性的功能性途径是分析同源生物体的相应蛋白质之间的氨基酸变化的标准化频率(schulz,g.e.andschirmer,r.h.,principlesofproteinstructure,springer-verlag,newyork(1979))。根据此类分析,可定义多组氨基酸,其中一个组内的氨基酸优先彼此交换,并因此在对于总体蛋白质结构的影响中与彼此最为类似(schulz,g.e.andschirmer,r.h.,如前)。保守突变的非限制性示例包括以下氨基酸的氨基酸置换:例如,氨基酸置换精氨酸且反之亦然,使得正电荷可得以保持;谷氨酸置换天冬氨酸且反之亦然,使得负电荷可得以保持;丝胺酸置换苏氨酸,使得游离–oh可得以保持;以及谷氨酰胺置换天冬酰胺,使得游离–nh2可得以保持。[0221]如本文中可互换使用的术语“编码序列”或“蛋白质编码序列”是指编码蛋白质的多核苷酸链段。该区域或序列的起始密码子在5'末端附近合,并且终止密码子在3'末端附近。编码序列也可以称为开放阅读框。[0222]如本文中所用,术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或酶。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺嘌呤至次黄嘌呤的水解性脱氨反应。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺苷或腺嘌呤(a)至肌苷(i)的水解性脱氨反应。在一些实施方案中,脱氨酶或脱氨酶结构域是分别催化腺苷或去氧肌苷到肌苷或去氧肌苷的去氧反应的腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶催化去氧核糖核酸(dna)中的腺苷的水解性脱氨反应。本文提供的腺苷脱氨酶(例如,经工程化的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体诸如细菌。在一些实施方案中,腺苷脱氨酶来自细菌,诸如大肠杆菌(escherichiacoli)、金黄色葡萄球菌(staphylococcusaureus)、鼠伤寒沙门氏菌(salmonellatyphimurium)、腐败希瓦氏菌(shewanellaputrefaciens)、流感嗜血杆菌(haemophilusinfluenzae)或新月柄杆菌(caulobactercrescentus)。[0223]在一些实施方案中,腺苷脱氨酶是tada脱氨酶。在一些实施方案中,tada脱氨酶是tada变体。在一些实施方案中,tada变体是tada*8。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体诸如人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠的天然出现脱氨酶的变体。在一些实施方案中,脱氨酶或脱氨酶结构域不出现在自然界中。例如,在一些实施方案中,脱氨酶或脱氨酶结构域与天然出现的脱氨酶具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%atleast80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%的同一性。例如,脱氨酶结构域在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用而整体并入本文。也参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017))和rees,h.a.等人,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1,其整体内容通过引用并入本文。[0224]“检测”指的是证实待检测的被分析物的存在、不存在或量。在一种实施方案中,检测了多核苷酸或多肽中的序列改变。在另一实施方案中,检测了插入缺失(indel)的存在。[0225]“可检测的标记”意为一种组合物,当连接至感兴趣的分子时,该组合物使得后者可经由光谱学、光化学、生物化学、免疫化学或化学手段检测。例如,有用的标记包括放射性同位素、磁性微珠、金属微珠、胶体离子、萤光染料、高电子密度试剂、酶(例如,一般用于酶联免疫吸收试验(elisa))、生物素、地高辛或半抗原。[0226]“疾病”意为损害或干扰细胞、组织或器官的正常功能的任何病症或病变。[0227]如本文中所用,术语“有效量”是指生物活性剂的足以引起所希望的生物学回应的量。用来实践本发明的用于治疗性处理疾病的活性化合物的有效量可变,取决于给药模式以及受试者的年龄、体重和一般健康情况。基本上,主治医生或兽医将决定适宜的量和用药方案。这一量被称为“有效”量。在一种实施方案中,有效量是本发明的碱基编辑器(例如,包含可编程dna结合蛋白、核碱基编辑器和grna的融合蛋白)的足以向细胞(例如,体外或体内的细胞)内的感兴趣基因引入改变的量。在一些实施方案中,本文所提供的融合蛋白(例如,包含ncas9结构域和脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶)的核碱基编辑器)的有效量,可以指融合蛋白的足以诱导对于通过该核碱基编辑器特异性地结合并编辑的靶标位点进行编辑的量。在一种实施方案中,有效量是实现治疗效果(例如,削弱或控制疾病或症状或状况)所需的碱基编辑器的量。此类治疗效果不必足以改变受试者、组织或器官中所有细胞中的感兴趣的基因,而仅改变受试者、组织或器官中存在的大约1%、5%、10%、25%、50%、75%或更多的细胞中的感兴趣的基因。[0228]在一些实施方案中,本文所提供的融合蛋白(例如,包含ncas9结构域和脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶)的核碱基编辑器)的有效量,是指融合蛋白的足以诱导对于通过本文所述的核碱基编辑器特异性地结合并编辑的靶标位点进行编辑的量。如本领域技术人员将会知悉的,药剂例如融合蛋白、核碱基、杂交蛋白、蛋白二聚体、蛋白质(或蛋白二聚体)与多核苷酸的复合物、或多核苷酸的有效量可以基于多种因素而变,例如,基于所希望的生物学回应,例如,基于待编辑的具体等位基因、基因组或靶标为点,基于所靶向的细胞或组装,和/或基于所使用的药剂。[0229]“片段”意为多肽或核酸分子的一部分。这一部分含有参考核酸分子或多肽总长度的至少约10%、20%、30%、40%、50%、60%、70%、80%或90%。片段可包含10、20、30、40、50、60、70、80、90、或100、200、300、400、500、600、700、800、900、或1000个核苷酸或氨基酸。[0230]“向导rna(guiderna)”或“grna”意为多核苷酸,其可以对于靶标序列为特异性的并且可与多核苷酸可编程核苷酸结合结构域蛋白(例如,cas9或cpf1)形成复合物。在一种实施方案中,向导多核苷酸是向导rna(grna)。grna可作为两种或更多种rna的复合物存在,或作为单rna分子存在。作为单rna分子存在的grna可以称为单向导rna(sgrna),但“grna”用来可互换地指代作为单分子存在或作为两个或更多个分子的复合物存在的向导rna。典型地,作为单rna物质存在的grna包含两个结构域:(1)与靶标核酸共用同源性的结构域(例如,并且引导cas9复合物结合至靶标);和(2)结合cas9蛋白的结构域。在一些实施方案中,结构域(2)对应于作为tracrrna而为人所知的序列,并且包括茎环结构。例如,在一些实施方案中,结构域(2)与jinek等人,science337:816-821(2012)中提供的tracrrna相同或同源,该文献的整体内容通过引用并入本文。grna(例如,包括结构域(2)的那些)可以见于2013年9月6日提交的题为《switchablecas9nucleasesandusesthereof》的美国临时专利申请号61/874,682和《deliverysystemforfunctionalnucleases》的美国临时专利申请号61/874,746,该临时专利申请各自的整体内容通过引用而以其整体并入本文。在一些实施方案中,grna包含两个或更多个结构域(1)和(2),并且可以称为“扩展的grna”。扩展的grna将会在两个或更多个不同的区域结合两个或更多个cas9蛋白并且结合靶标核酸,如本文所述。grna包含与靶标位点互补的核苷酸序列,该核苷酸序列介导核酸酶/rna复合物与所述靶标位点的结合,提供核酸酶:rna复合物的序列特异性。[0231]“杂交”意为互补核碱基之间的氢键键合,其可以是沃森-克里克(watson-crick)、胡斯坦(hoogsteen)和反向胡斯坦氢键键合。例如,腺嘌呤和胸腺嘧啶是通过形成氢键而配对的互补核碱基。[0232]术语“碱基修复的抑制剂”或“ibr”是指一种蛋白质,其能够抑制核酸修复酶(例如,碱基切除修复(ber)酶)的活性。在一些实施方案中,ibr是肌苷碱基切除修复的抑制剂。示例性的碱基修复抑制剂包括ape1、endoiii、endoiv、endov、endoviii、fpg、hoggl、hneill、t7endol、t4pdg、udg、hsmugl和haag的抑制剂。在一些实施方案中,ibr是endov或haag的抑制剂。在一些实施方案中,ibr是无催化活性的endov或无催化活性的haag。在一些实施方案中,碱基修复抑制剂是endov或haag的抑制剂。在一些实施方案中,碱基修复抑制剂是无催化活性的endov或无催化活性的haag。[0233]在一些实施方案中,碱基修复抑制剂是尿嘧啶糖苷酶抑制剂(ugi)。ugi是指一种蛋白质,其能够抑制尿嘧啶-dna糖苷酶碱基切除修复酶。在一些实施方案中,ugi结构域包含野生型ugi或野生型ugi的片段。在一些实施方案中,本文所提供的ugi蛋白包括ugi的片段和与ugi或ugi片段同源的蛋白质。在一些实施方案中,碱基修复抑制剂是肌苷碱基切除修复的抑制剂。在一些实施方案中,碱基修复抑制剂是“无催化活性的肌苷特异性核酸酶”或“死亡的肌苷特异性核酸酶”。不欲受缚于任何特定理论,无催化活性的肌苷糖苷酶(例如,烷基腺嘌呤糖苷酶(aag))可以结合肌苷,但不能创建无碱基位点或移除该肌苷,从而在空间上阻断dna损坏/修复机制对新形成的肌苷部分的影响。在一些实施方案中,无催化活性的肌苷特异性核酸酶可以能够结合核酸内的肌苷但不裂解该核酸。非限制性的示例性无催化活性的肌苷特异性核酸酶包括例如来自人的无催化活性的烷基腺苷糖苷酶(aag核酸酶),和例如来自大肠杆菌的无催化活性的核酸内切酶v(endov核酸酶)。在一些实施方案中,无催化活性的aag核酸酶包含e125q突变或另一aag核酸酶中的相应突变。[0234]“增加”意为至少10%、25%、50%、75%或100%的正向改变。[0235]“内含肽(intein)”是蛋白质的片段,在一个名为蛋白质剪接的过程中,其能够切除自身并且将剩余片段(外显肽)通过肽键接合。内含肽也称为“蛋白质内含子”。内含肽切除自身并且将蛋白质的剩余部分接合的过程在本文中称为“蛋白质剪接”或“内含肽介导的蛋白质剪接”。在一些实施方案中,前体蛋白质(在内含肽介导的蛋白质剪接之前的含有内含肽的蛋白质)的内含肽来自两个基因。本文中,此类内含肽称为分裂内含肽(例如,分裂内含肽-n和分裂内含肽-c)。例如,在蓝细菌(cyanobacteria)中,dnae(dna聚合酶iii的催化性亚基)由两个独立的基因(dnae-n和dnae-c)编码。由dnae-n基因编码的内含肽在本文中可以称为“内含肽-n”。由dnae-c基因编码的内含肽在本文中可以称为“内含肽-c”。[0236]也可使用其他内含肽系统。例如,基于dnae内含肽的合成内含肽,cfa-n(例如,分裂内含肽-n)和cfa-c(例如,分裂内含肽-c)内含肽对,已经有所描述(例如,在stevens等人,jamchemsoc.2016feb.24;138(7):2162-5中,该文献通过引用并入本文)。可根据本公开使用的内含肽对的非限制性示例包括:cfadnae内含肽、sspgyrb内含肽、sspdnax内含肽、terdnae3内含肽、terthyx内含肽、rmadnab内含肽和cneprp8内含肽(例如,如美国专利号8,394,604中所述,该专利通过耐用并入本文)。[0237]提供了内含肽的示例性核苷酸和氨基酸序列。[0238]dnae内含肽-ndna:[0239]tgcctgtcatacgaaaccgagatactgacagtagaatatggccttctgccaatcgggaagattgtggagaaacggatagaatgcacagtttactctgtcgataacaatggtaacatttatactcagccagttgcccagtggcacgaccggggagagcaggaagtattcgaatactgtctggaggatggaagtctcattagggccactaaggaccacaaatttatgacagtcgatggccagatgctgcctatagacgaaatctttgagcgagagttggacctcatgcgagttgacaaccttcctaat[0240]dnae内含肽-n蛋白:[0241]clsyeteiltveygllpigkivekriectvysvdnngniytqpvaqwhdrgeqevfeycledgsliratkdhkfmtvdgqmlpideifereldlmrvdnlpn[0242]dnae内含肽-cdna:[0243]atgatcaagatagctacaaggaagtatcttggcaaacaaaacgtttatgatattggagtcgaaagagatcacaactttgctctgaagaacggattcatagcttctaat[0244]内含肽-c:mikiatrkylgkqnvydigverdhnfalkngfiasn[0245]cfa-ndna:[0246]tgcctgtcttatgataccgagatacttaccgttgaatatggcttcttgcctattggaaagattgtcgaagagagaattgaatgcacagtatatactgtagacaagaatggtttcgtttacacacagcccattgctcaatggcacaatcgcggcgaacaagaagtatttgagtactgtctcgaggatggaagcatcatacgagcaactaaagatcataaattcatgaccactgacgggcagatgttgccaatagatgagatattcgagcggggcttggatctcaaacaagtggatggattgcca[0247]cfa-n蛋白:[0248]clsydteiltveygflpigkiveeriectvytvdkngfvytqpiaqwhnrgeqevfeycledgsiiratkdhkfmttdgqmlpideifergldlkqvdglp[0249]cfa-cdna:[0250]atgaagaggactgccgatggatcagagtttgaatctcccaagaagaagaggaaagtaaagataatatctcgaaaaagtcttggtacccaaaatgtctatgatattggagtggagaaagatcacaacttccttctcaagaacggtctcgtagccagcaac[0251]cfa-c蛋白:[0252]mkrtadgsefespkkkrkvkiisrkslgtqnvydigvekdhnfllknglvasn[0253]内含肽-n和内含肽-c可以分别融合至分裂cas9的n端部分和分裂cas9的c端部分,以将分裂cas9的n端部分和分裂cas9的c端部分接合。例如,在一些实施方案中,内含肽-n融合至分裂cas9的n端部分的c端,即,以形成n‑‑[分裂cas9的n端部分]-[内含肽-n]‑‑c的结构。在一些实施方案中,内含肽-c融合至分裂cas9的c端部分的n端,即,以形成n-[内含肽-c]‑‑[分裂cas9的c端部分]-c的结构。用于将内含肽所融合的蛋白质(例如,分裂cas9)接合的内含肽介导的蛋白质剪接的机制是本领域中已知的,例如,如shah等人,chemsci.2014;5(1):446-461中所述,该文献通过引用并入本文。用于设计和使用内含肽的方法是本领域中已知的,并且在例如wo2014004336、wo2017132580、us20150344549和us20180127780中描述,该专利各自通过引用而以其整体并入本文。[0254]术语“分离的(isolated)”、“纯化的(purified)”或“生物学纯的(biologicallypure)”指的是材料没有不同程度的在其天然状态下发现的正常伴生组分。“分离”表示与原始来源或周围物质分隔的程度。“纯化”表示高于“分离”的分隔程度。“纯化的”或“生物学纯的”蛋白质足够不含其它物质,使得任何杂质均不在物质上影响该蛋白质的生物学性质或不造成其它负面后果。换言之,如果本发明的核酸或肽基本上在通过重组dna技术生产时不含细胞物质、病毒物质或培养基,或者当化学合成时不含化学前体或其它化学品,则该核酸或肽是纯化的。典型使用分析化学技术例如聚丙烯酰胺凝胶电泳或高效液相色谱来测定纯度和均质性。术语“纯化的”可表示核酸或蛋白质在电泳凝胶中给出实质上的一条谱带。对于可进行修饰如磷酸化或糖基化的蛋白质,不同的修饰可给出不同的分离的蛋白,它们可独立纯化。[0255]“分离的多核苷酸”意为一种核酸(例如,dna),其不含在本发明的核酸分子所源自的有机体的天然出现的基因组中位于该基因侧翼的基因。该术语因此包括,举例而言,重组dna,其被并入载体内、并入自主复制质粒或病毒内、或并入原核生物或真核生物的基因组dna内,或作为独立于其它序列的单独分子而存在(举例而言,通过pcr或限制性内切酶消化制备的cdna或基因组或cdna片段)。此外,该术语包括从dna分子转录的rna分子,以及作为编码附加多肽序列的杂交基因的一部分的重组dna。[0256]“分离的多肽”意为已经与其天然伴随组分分离的本发明的多肽。典型地,以重量计,当多肽的至少60%不含其天然关联的蛋白质和天然出现的有机分子时,则该多肽是分离的。以重量计,优选该制剂含有至少75%、更优选至少90%、最优选99%的本发明的多肽。可通过例如从天然来源提取、编码多肽的重组核酸的表达、或化学合成蛋白质来获得本发明的分离的多肽。可通过任何适宜的方法例如柱层析、聚丙烯酰胺凝胶电泳或hplc分析来测量纯度。[0257]如本文中所用,术语“连接子(linker)”可以指共价连接子(例如,共价键)、非共价连接子、化学基团或分子,其连接两个分子或部分,例如,蛋白复合网或核糖核酸复合物的两个组分,或者融合蛋白的两个结构域,例如,多核苷酸可编程dna结合结构域(例如,dcas9)和脱氨酶结构域(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)、或者napdnabp结构域(例如,cas12b)和脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶)。在特定实施方案中,连接子位于插入在cas蛋白或其片段内的脱氨酶结构域的侧翼。连接子可以接合碱基编辑器系统的不同组分或者多个组分的不同部分。例如,在一些实施方案中,连接子可以接合多核苷酸可编程核苷酸接合结构域的向导多核苷酸接合结构域与脱氨酶的催化结构域。在一些实施方案中,连接子可以接合crispr多肽与脱氨酶。在一些实施方案中,连接子可以接合cas9与脱氨酶。在一些实施方案中,连接子可以接合dcas9与脱氨酶。在一些实施方案中,连接子可以接合ncas9与脱氨酶。例如,在一些实施方案中,连接子可以接合cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h或cas12i与脱氨酶。在一些实施方案中,连接子可以接合向导多核苷酸与脱氨酶。在一些实施方案中,连接子可以接合碱基编辑器系统的脱氨组分与多核苷酸可编程核苷酸结合组分。在一些实施方案中,连接子可以结合碱基编辑器的脱氨组分的rna结合部分与napdnabp组分。在一些实施方案中,连接子可以结合碱基编辑器的脱氨组分的rna结合部分与多核苷酸可编程核苷酸结合组分。在一些实施方案中,连接子可以结合碱基编辑器的脱氨组分的rna结合部分与多核苷酸可编程核苷酸结合组分的rna结合部分。连接子可以定位在两个基团、分子或其他部分之间或者侧翼具有两个基团、分子或其他部分,并且经由共价键或非共价相互作用与每个基团、分子或其他部分连结,从而将两者连结。在一些实施方案中,连接子可以是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子可以是多核苷酸。在一些实施方案中,连接子可以是dna连接子。在一些实施方案中,连接子可以是rna连接子。在一些实施方案中,连接子可以包含能够结合至配体的适体。在一些实施方案中,配体可以是碳水化合物、肽、蛋白质或核酸。在一些实施方案中,连接子可以包含可以衍生自核糖开关的适体。适体自其衍生的核糖开关可以选自茶碱核糖开关、硫胺素焦磷酸(tpp)核糖开关、腺苷钴胺素(adocbl)核糖开关、s-腺苷甲硫氨酸(sam)核糖开关、sah核糖开关、黄素单核苷酸(fmn)核糖开关、四氢叶酸核糖开关、赖氨酸核糖开关、甘氨酸核糖开关、嘌呤核糖开关、glms核糖开关或前-去氮鸟苷1(pre-queosine1(preq1))核糖开关。在一些实施方案中,连接子可以包含键合之多肽或蛋白质结构域诸如多肽配体的适体。在一些实施方案中,多肽配体可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmu外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。在一些实施方案中,多肽配体可以是碱基编辑器系统组分的一部分。例如,核碱基编辑组分可以包含脱氨酶结构域和rna识别基序。[0258]在一些实施方案中,连接子可以是氨基酸或多个氨基酸(例如,肽或蛋白质)。一些实施方式中,连接子可以是约5-100个氨基酸的长度,例如,约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20-30、30-40、40-50、50-60、60-70、70-80、80-90或90-100个氨基酸的长度。在一些实施方案中,连接子可以是约100-150、150-200、200-250、250-300、300-350、350-400、400-450或450-500个氨基酸的长度。也可以设想更长或更短的连接子。[0259]在一些实施方案中,连接子接合rna可编程核酸酶的grna接合结构域(包括cas9核酸酶结构域)与核酸编辑蛋白(例如,胞苷或腺苷脱氨酶)的催化结构域。在一些实施方案中,连接子接合dcas9与核酸编辑蛋白。例如,连接子可以定位在两个基团、分子或其他部分之间或者侧翼具有两个基团、分子或其他部分,并且经由共价键与每个基团、分子或其他部分连结,从而将两者连结。在一些实施方案中,连接子是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子为5-200个氨基酸的长度,例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、65、70、75、80、85、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190或200个氨基酸的长度。也设想了更长或更短的连接子。[0260]在一些实施方案中,核碱基编辑器的多个结构域经由连接子融合,该连接子包含sggssgsetpgtsesatpessggs、sggssggssgsetpgtsesatpessggssggs或ggsggspgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepatsggsggs的氨基酸序列。在一些实施方案中,核碱基编辑器的多个结构域经由连接子融合,该连接子包含氨基酸序列sgsetpgtsesatpes,其也可称为xten连接子。在一些实施方案中,连接子包含氨基酸序列sggs。在一些实施方案中,连接子包含(sggs)n、(gggs)n、(ggggs)n、(g)n、(eaaak)n、(ggs)n、sgsetpgtsesatpes或(xp)n基序,或者这些基序中任何基序的组合,其中n独立地为介于1至30之间的整数,并且其中x是任何氨基酸。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。[0261]在一些实施方案中,连接子为24个氨基酸的长度。在一些实施方案中,连接子包含氨基酸序列sggssggssgsetpgtsesatpes。在一些实施方案中,连接子为40个氨基酸的长度。在一些实施方案中,连接子包含氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggs。在一些实施方案中,连接子为64个氨基酸的长度。在一些实施方案中,连接子包含氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggssgsetpgtsesatpessggssggs。在一些实施方案中,连接子为92个氨基酸的长度。在一些实施方案中,连接子包含氨基酸序列pgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepats。[0262]“标记物”意为任意蛋白质或多核苷酸,其在表达水准或活性上有与疾病或病变相关的改变。[0263]如本文中所用,术语“突变”是指序列(例如,核酸或氨基酸序列)内的残基被置换为另一残基,或序列内一个或多个残基的缺失或插入。典型地,本文中通过下述来描述突变:鉴定原始残基,然后鉴定该残基在序列内的位置和新置换的残基的身份。用于进行本文所提供的氨基酸置换(突变)的方法是本领域中众所周知的,并且提供在例如《分子克隆:实验室手册(第四版)》(greenandsambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2012)))中。在一些实施方案中,本文公开的碱基编辑器可以在核酸(例如,受试者基因组内的核酸)中有效地产生“预期突变”诸如点突变,而不产生显著数量的非预期突变诸如非预期点突变。在一些实施方案中,预期突变是通过结合至向导多核苷酸(例如,grna)的特异性碱基编辑器(例如,胞苷碱基编辑器或腺苷碱基编辑器)产生的突变,该特异性碱基编辑器经过特异性地涉及以产生预期突变。[0264]通常,在序列(例如,本文所述的氨基酸序列)中进行或鉴定的突变是相对于参考(或野生型)序列即不含有该突变的序列进行编号的。本领域技术人员将会容易地理解如何相对于参考序列确定氨基酸序列和核酸序列中突变的位置。[0265]术语“非保守突变”包括不同组之间的氨基酸置换,例如,赖氨酸置换色氨酸,或苯丙氨酸置换丝氨酸等。在这种情况下,优选该非保守氨基酸置换不干扰或抑制功能性变体的生物学活性。非保守氨基酸置换可以增强功能性变体的生物学活性,使得该功能性变体的生物学活性比野生型蛋白质增加。[0266]术语“核定位元序列”、“核定位元信号”或“nls”是指促使蛋白质进入细胞核内的氨基酸序列。核定位序列是本领域中已知的,并且在例如plank等人在2000年11月23日提交的国际pct申请pct/ep2000/011690并且在2001年5月31日公布为wo/2001/038547中有所描述,该专利通过引用其对于示例性核定位元序列的公开内容而并入本文。在其他实施方案中,nls是经优化的nls,例如,koblan等人,naturebiotech.2018doi:10.1038/nbt.4172中所述。在一些实施方案中,nls包含氨基酸序列krtadgsefespkkkrkv、krpaatkkagqakkkk、kktelqttnaenktkkl、krgindrnfwrgengrktr、rksgkiaaivvkrprk、pkkkrkv或mdsllmnrrkflyqfknvrwakgrretylc。[0267]如本文中所用,术语“核酸”和“核酸分子”是指一种化合物,其包含核碱基和酸性部分,例如,核苷、核苷酸或核苷酸的聚合物。典型地,包含三个或更多个核苷酸的聚合性核酸(例如,核酸分子)是线性分子,其中相邻的核苷酸经由磷酸二酯连结而彼此连接。在一些实施方案中,“核酸”是指个体核酸残基(例如,核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含三个或更多个个体核苷酸残基的寡核苷酸链。如本文中所用,术语“寡核苷酸”和“多核苷酸”可以互换地使用,是指核苷酸的聚合物(例如,一串至少三个核苷酸)。在一些实施方案中,“核酸”涵盖rna以及单链和/或双链dna。核酸可以天然地出现在例如基因组、转录物、mrna、trna、rrna、sirna、snrna、质粒、粘粒、染色体、染色单体或其他天然出现的核酸分子的情境中。另一方面,核酸分子可以是非天然出现的分子,例如,重组dna或rna、人工染色体、经工程化的基因组、或其片段,或者合成dna、rna、dna/rna杂交物,或者包括非天然出现的核苷酸或核苷。此外,术语“核酸”、“dna”、“rna”和/或类似术语包括核酸类似物,例如,具有除磷酸二酯以外的主链的类似物。核酸可以从天然来源纯化,使用重组表达系统生产并任选地进行纯化,化学地合成等。如果合适,例如,在化学合成的分子的情况下,核酸可以包含核苷类似物诸如具有经化学修饰的碱基或糖以及主链修饰的类似物。除非另做说明,否则核酸序列以5'至3'方向呈现。在一些实施方案中,核酸是或包含天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、去氧腺苷、去氧胸苷、去氧尿苷和去氧胞苷);核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基尿苷、c5-丙炔基胞苷、c5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、o(6)-甲基鸟嘌呤和2-硫代胞苷);经化学修饰的碱基;经生物学修饰的碱基(例如,经甲基化的碱基);经插入的碱基;经修饰的糖(2'修饰,例如,氟核糖、核糖、2'-去氧核糖、阿拉伯糖和己糖);和/或经修饰的磷酸酯基团(例如,硫代磷酸酯和5'-n-亚磷酰胺连结)。[0268]术语“核酸可编程dna结合蛋白(nucleicacidprogrammablednabindingprotein)”或“napdnabp”可以与“多核苷酸可编程核苷酸结合结构域”互换地使用,是指与核酸缔合的蛋白质(例如,dna或rna),诸如将napdnabp引导至具体核酸序列的向导核酸或向导多核苷酸(例如,grna)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程rna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cas9蛋白。cas9蛋白可以与将该cas9蛋白引导至具体dna序列的向导rna缔合,该dna序列与向导rna互补。在一些实施方案中,napdnabp是cas9结构域,例如,核酸酶活性cas9、cas9切口酶(ncas9)或无核酸酶活性的cas9(dcas9)。核酸可编程dna结合蛋白的非限制性示例包括cas9(例如,dcas9和ncas9)、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12i。cas酶的非限制性示例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas8a、cas8b、cas8c、cas9(也称为csn1或csx12)、cas10、cas10d、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csx11、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、ii型cas效应蛋白、v型cas效应蛋白、vi型cas效应蛋白、carf、ding、其同源物、或其经修饰或工程化的版本。其他核酸可编程dna结合蛋白也处于本公开范畴内,但它们可能没有具体地列在本公开中。参见,例如,makarova等人“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprj.2018oct;1:325-336.doi:10.1089/crispr.2018.0033;yan等人,“functionallydiversetypevcrispr-cassystems”science.2019jan4;363(6422):88-91.doi:10.1126/science.aav7271,其各自的整体内容通过引用并入本文。[0269]本文中,术语“核碱基”、“含氮碱基”或“碱基”可互换地使用,是指含有氮的生物化合物,其形成核苷,核苷继而成为核苷酸的组分。核碱基形成碱基对并且一个接一个堆迭的能力直接导致长链螺旋结构,诸如核糖核酸(rna)和去氧核糖核酸(dna)。五种核碱基,即,腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)和尿嘧啶(u),被称为基本碱基或标准碱基。腺嘌呤和鸟嘌呤衍生自嘌呤,而胞嘧啶、尿嘧啶和胸腺嘧啶衍生自嘧啶。dna和rna也可以含有经修饰的其他(非基本)碱基。非限制性的示例性经修饰的核碱基可以包括次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶(m5c)和5-羟甲基胞嘧啶。次黄嘌呤和黄嘌呤可以通过诱变剂的存在而产生,两者都是通过脱氨反应(将氨基替换为羰基)产生的。次黄嘌呤可以从腺嘌呤修饰而得。黄嘌呤可以从鸟嘌呤修饰而得。尿嘧啶可以从胞嘧啶的脱氨反应获得。“核苷”由核碱基和五碳糖(或核糖或去氧核糖)组成。核苷的示例包括腺苷、鸟苷、尿苷、胞苷、5-甲基尿苷(m5u)、去氧腺苷、去氧鸟苷、胸苷、去氧尿苷和去氧胞苷。具有经修饰的核碱基的核苷的示例包括肌苷(i)、黄苷(x)、7-甲基鸟苷(m7g)、二氢尿苷(d)、5-甲基胞苷(m5c)和假尿苷(ψ)。“核苷酸”由核碱基、五碳糖(或核糖或去氧核糖)和至少一个磷酸酯基团组成。[0270]术语“核酸可编程dna结合蛋白”或“napdnabp”是指与核酸缔合的蛋白质(例如,dna或rna),诸如将napdnabp引导至具体核酸序列的向导核酸。例如,cas12蛋白可以与将该cas12蛋白引导至具体dna序列的向导rna缔合,该dna序列与向导rna互补。在一些实施方案中,napdnabp是cas12结构域,例如,核酸酶活性cas12结构域。napdnabp的示例包括cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12i。其他napdnabp也处于本公开范畴内,但它们可能没有具体地列在本公开中。参见,例如,makarova等人“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprj.2018oct;1:325-336.doi:10.1089/crispr.2018.0033;yan等人,“functionallydiversetypevcrispr-cassystems”science.2019jan4;363(6422):88-91.doi:10.1126/science.aav7271,其各自的整体内容通过引用并入本文。[0271]如本文中所用,术语“核碱基编辑结构域”或“核碱基编辑蛋白”是指一种蛋白质或酶,其可以催化rna或dna中的核碱基修饰,诸如胞嘧啶(或胞苷)到尿嘧啶(或尿苷)或胸腺嘧啶(或胸苷)以及腺嘌呤(或腺苷)到次黄嘌呤(或肌苷),以及非范本化的核苷酸加成和插入。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域(例如,腺嘌呤脱氨酶或腺苷脱氨酶;或者胞苷脱氨酶或胞嘧啶脱氨酶)。在一些实施方案中,核碱基编辑结构域是超过一个脱氨酶结构域(例如,腺嘌呤脱氨酶或腺苷脱氨酶;以及胞苷或胞嘧啶脱氨酶)。在一些实施方案中,核碱基编辑结构域可以是天然出现的核碱基编辑结构域。在一些实施方案中,核碱基编辑结构域可以是从天然出现的核碱基编辑结构域工程化或进化的核碱基编辑结构域。核碱基编辑结构域可以来自任何生物体,诸如细菌、人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠。例如,核碱基编辑蛋白在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用而整体并入本文。也参见,komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017)和komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),其整体内容通过引用并入本文。[0272]如本文中所用,如“获得一剂(obtaininganagent)”中的“获得(obtaining)”包括合成、购买或以其它方法取得该剂。[0273]如本文中所用,“患者(patient)”或“受试者(subject)”是指哺乳动物受试者或个体,其被诊断患有疾病或疾患、处于患有或发展出疾病或疾患的风险下或易患或发展出疾sambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2012)))中描述的那些,该文献的整体内容通过引用并入本文。[0279]本文所公开的多肽和蛋白质(包括其功能性部分和功能性变体)可以包含合成氨基酸来代替一个或多个天然出现的氨基酸。此类合成氨基酸是本领域中已知的,并且包括例如氨基环己烷甲酸、正亮氨酸、α-氨基正癸酸、高丝氨酸、s-乙酰基氨基甲基-半胱氨酸、反式-3-和反式-4-羟基脯氨酸、4-氨基苯丙氨酸、4-硝基苯丙氨酸、4-氯苯丙氨酸、4-羧基苯丙氨酸、β-苯基丝氨酸、β-羟基苯丙氨酸、苯基甘氨酸、α-萘基丙氨酸、环己基丙氨酸、环己基甘氨酸、吲哚啉-2-甲酸、1,2,3,4-四氢异喹啉-3-甲酸、氨基阿洛糖酸、氨基阿洛糖酸单酰胺、n'-苄基-n'-甲基-赖氨酸、n',n'-二苄基-赖氨酸、6-羟基赖氨酸、鸟氨酸、α-氨基环戊烷甲酸、α-氨基环己烷甲酸、α-氨基环庚烷甲酸、α-(2-氨基-2-降莰烷)-甲酸、α,γ-二氨基丁酸、α,β-二氨基丙酸、高苯丙氨酸和α-叔丁基甘氨酸。多肽和蛋白质可以与多肽构建体的一个或多个氨基酸的转录后修饰缔合。转录后修饰的非限制性示例包括磷酸化、酰化(包括乙酰化和甲酰化)、糖基化(包括n-联糖基化和o-联糖基化)、酰胺化、羟基化、烷基化(包括甲基化和乙基化)、泛素化、吡咯烷酮甲酸的加成、二硫桥的形成、硫酸化、豆蔻酰化、棕榈酰化、异戊二烯化、法尼基化、香叶基化、糖基磷脂酰肌醇化、脂化和碘化。[0280]术语“多核苷酸可编程核苷酸结合结构域”或“核酸可编程dna结合结构域(napdnabp)”是指与核酸(例如,dna或rna)缔合的蛋白质,诸如将多核苷酸可编程核苷酸结合结构域引导至具体核酸序列的向导多核苷酸(例如,向导rna)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程rna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cas12蛋白。[0281]如本文所用,术语“重组”在蛋白质或核酸的语境中是指不出现在自然界中而是作为人工工程化产物的蛋白质或核酸。例如,在一些实施方案中,重组蛋白质或核酸包含氨基酸或核苷酸序列,与任何天然出现的序列相比,该氨基酸或核苷酸序列包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个突变。[0282]“降低”意为至少10%、25%、50%、75%或100%的负向改变。[0283]“参考”意为标准或对照条件。在一种实施方案中,参考是野生型或健康的细胞。在其他实施方案中且并非限制,参考是未经处理的细胞,其未经历测试条件,或经历了安慰剂或不携带感兴趣的多核苷酸的生理盐水、培养基、缓冲液和/或对照载体。[0284]“参考序列”是用作序列比对基础的定义序列。参考序列可以是特定序列的一部分或整体;例如,全长度cdna或基因序列的链段、或完整的cdna或基因序列。对于多肽,参考多肽序列的长度将通常为至少约16个氨基酸、至少约20个氨基酸、至少约25个氨基酸、约35个氨基酸、约50个氨基酸或约100个氨基酸。对于核酸,参考核酸序列的长度将通常为至少约50个核苷酸、至少约60个核苷酸、至少约75个核苷酸、约100个核苷酸或约300个核苷酸或与之接近或之间的任何整数。在一些实施方案中,参考序列是感兴趣的蛋白质的野生型序列。在其他实施方案中,参考序列是编码野生型蛋白质的多核苷酸序列。[0285]术语“rna可编程核酸酶”和“rna引导的核酸酶”与并非裂解靶标的一种或多种rna合用(例如,与之结合或缔合)。在一些实施方案中,当与rna复合时,rna可编程核酸酶可以称为核酸酶:rna复合物。典型地,所结合的rna称为向导rna(grna)。grna可作为两种或更多种rna的复合物存在,或作为单rna分子存在。作为单rna分子存在的grna可以称为单向导rna(sgrna),但“grna”用来可互换地指代作为单分子存在或作为两个或更多个分子的复合物存在的向导rna。典型地,作为单rna物质存在的grna包含两个结构域:(1)与靶标核酸共用同源性的结构域(例如,并且引导cas9复合物结合至靶标);和(2)结合cas9蛋白的结构域。在一些实施方案中,结构域(2)对应于作为tracrrna而为人所知的序列,并且包括茎环结构。例如,在一些实施方案中,结构域(2)与jinek等人,science337:816-821(2012)中提供的tracrrna相同或同源,该文献的整体内容通过引用并入本文。grna(例如,包括结构域(2)的那些)可以见于2013年9月6日提交的题为《switchablecas9nucleasesandusesthereof》的美国临时专利申请序号61/874,682和《deliverysystemforfunctionalnucleases》的美国临时专利申请序号61/874,746,该临时专利申请各自的整体内容通过引用而以其整体并入本文。在一些实施方案中,grna包含两个或更多个结构域(1)和(2),并且可以称为“扩展的grna”。例如,扩展的grna将会例如在两个或更多个不同的区域结合两个或更多个cas9蛋白并且结合靶标核酸,如本文所述。grna包含与靶标位点互补的核苷酸序列,该核苷酸序列介导核酸酶/rna复合物与所述靶标位点的结合,提供核酸酶:rna复合物的序列特异性。[0286]在一些实施方案中,rna可编程核酸酶是(crispr相关系统)cas9内切酶,例如,来自化脓性链球菌的cas9(casnl)(参见,例如,completegenomesequenceofanmlstrainofstreptococcuspyogenes.ferrettij.j.等人,proc.natl.acad.sci.u.s.a.98:4658-4663(2001);crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.deltchevae.等人,nature471:602-607(2011))。[0287]因为rna可编程核酸酶(例如,cas9)使用rna:dna杂交作用来靶向dna裂解位点,所以这些蛋白质原则上能够被靶向至向导rna所特异化的任何序列。使用rna可编程核酸酶诸如cas9进行位点特异性裂解(例如,以修饰基因组)的方法是本领域中已知的(参见,例如,cong,l.等人,multiplexgenomeengineeringusingcrispr/cassystems.science339,819-823(2013);mali,p.等人,rna-guidedhumangenomeengineeringviacas9.science339,823-826(2013);hwang,w.y.等人,efficientgenomeeditinginzebrafishusingacrispr-cassystem.naturebiotechnology31,227-229(2013);jinek,m.等人,rna-programmedgenomeeditinginhumancells.elife2,e00471(2013);dicarlo,j.e.等人,genomeengineeringinsaccharomycescerevisiaeusingcrispr-cassystems.nucleicacidsresearch(2013);jiang,w.等人,rna-guidededitingofbacterialgenomesusingcrispr-cassystems.naturebiotechnology31,233-239(2013);其各自的整体内容通过引用并入本文)。[0288]术语“单核苷酸多态性(snp)”是发生在基因组具体位置处的单核苷酸变异,其中每种变异在群体内以某种可感知的程度(例如,》1%)存在。例如,在人类基因组中的一个具体碱基位置处,c核苷酸可以出现在大多数个体中,但在少数个体中,该位置被a占据。这意味着在这一具体位置处存在snp,并且两种可能的核苷酸变异,即c或a,被称为这一位置的等位基因。snp构成了对疾病的易感性差异的基础。疾病的严重程度和我们的身体响应治疗的方式也是基因变异的表现。snp可以落入基因的编码区、基因的非编码区内,或落入基因间区(基因之间的区域)内。在一些实施方案中,由于基因密码的简并性,编码序列内的snp不一定改变所生产蛋白质的氨基酸序列。编码区中的snp有两种类型:同义snp和非同义snp。同义snp不影响蛋白质序列,而非同义snp改变蛋白质的氨基酸序列。非同义snp有两种类型:错义和无义。不在蛋白质编码区中的snp可能仍然影响基因剪接、转录因数结合、信使rna降解、或非编码rna的序列。受这一类型snp影响的基因表达称为esnp(表达snp)并且可以位于基因的上游或下游。单核苷酸变体(snv)是单核苷酸中的变异,没有任何频率限制,并且可出现在体细胞中。体细胞单核苷酸变异也可以称为单核苷酸改变。[0289]“特异性地结合”意为核酸分子、多肽或其复合物(例如,核酸可编程dna结合结构域和向导核酸)、化合物或分子识别并且结合本发明的多肽和/或核酸分子,但它们基本上不识别并且结合样品例如生物样品中的其他分子。[0290]可用于本发明方法的核酸分子包括编码本发明的多肽或其片段的任何核酸分子。此类核酸分子无须与内源性核酸序列100%一致,但典型将会展现基本一致性。具有与内源性序列“基本一致性”的多核苷酸典型能与双链核酸分子的至少一条链杂交。可用于本发明方法的核酸分子包括编码本发明的多肽或其片段的任何核酸分子。此类核酸分子无须与内源性核酸序列100%一致,但典型将会展现基本一致性。具有与内源性序列“基本一致性”的多核苷酸典型能与双链核酸分子的至少一条链杂交。“杂交”意为在互补多核苷酸序列(例如,本文所述的基因)或其部分在多种严格条件下配对以形成双链分子。(参见,例如,wahl,g.m.ands.l.berger(1987)methodsenzymol.152:399;kimmel,a.r.(1987)methodsenzymol.152:507)。[0291]举例而言,严格的盐浓度一般为少于约750mmnacl和75mm柠檬酸三钠,优选少于约500mmnacl和50mm柠檬酸三钠,且更优选少于约250mmnacl和25mm柠檬酸三钠。低严格度杂交可在不存在有机溶剂如甲酰胺的情况下获得,而高严格度杂交可在存在至少约35%甲酰胺且更优选至少约50%甲酰胺的情况下获得。严格的温度条件一般将包括至少约30℃,更优选至少约37℃,且最优选至少约42℃的温度。可变的附加因素,如杂交时间、洗涤剂如十二烷基硫酸钠(sds)的浓度、以及包含或不饱和载剂dna,是该领域技术人员所周知的。通过按需要组合这些多种条件来实施各种水准的严格度。在一种实施方案中,杂交将出现在30℃的750mmnacl、75mm柠檬酸三钠和1%sds中。在另一实施方案中,杂交将出现在37℃的500mmnacl、50mm柠檬酸三钠、1%sds、35%甲酰胺和100μg/ml变性鲑鱼精dna(ssdna)中。在另一实施方案中,杂交将出现在42℃的250mmnacl、25mm柠檬酸三钠、1%sds、50%甲酰胺和200μg/mlssdna中。对这些条件的有用改变对于该领域技术人员是显而易见的。[0292]对于大多数应用,杂交后的洗涤步骤的严格度也将改变。可通过盐浓度和温度来界定洗涤严格度条件。如上,可通过降低盐浓度或增加温度来增加洗涤严格度。举例而言,洗涤步骤的严格的盐浓度优选为少于约30mmnacl和3mm柠檬酸三钠,且最优选少于约15mmnacl和1.5mm柠檬酸三钠。用于洗涤步骤的严格的温度条件一般将包括至少约25℃,更优选至少约42℃,且甚至更优选至少约68℃的温度。在一种实施方案中,洗涤步骤将出现在25℃的30mmnacl、3mm柠檬酸三钠和0.1%sds中。在更优选的实施方案中,洗涤步骤将出现在42℃的15mmnacl、1.5mm柠檬酸三钠和0.1%sds中。在更优选的实施方案中,洗涤步骤将出现在68℃的15mmnacl、1.5mm柠檬酸三钠和0.1%sds中。对这些条件的额外改变对于该领域技术人员是显而易见的。杂交技术是该领域技术人员所周知的,且揭示在例如bentonanddavis(science196:180,1977);grunsteinandhogness(proc.natl.acad.sci.,usa72:3961,1975);ausubel等人(currentprotocolsinmolecularbiology,wileyinterscience,newyork,2001));《分子克隆技术指南》(bergerandkimmel(guidetomolecularcloningtechniques,1987,academicpress,newyork));以及《分子克隆:实验室手册》(sambrook等人,molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,newyork)中。[0293]“分裂”意为分为两个或更多个片段。[0294]“分裂cas9蛋白”或“分裂cas9”是指一种cas9蛋白,其作为由两个独立的核苷酸序列编码的n端片段和c端片段而提供。对应于cas9蛋白的n端部分和c端部分的多肽可以被分裂以形成“重建”cas9蛋白。在特定实施方案中,cas9蛋白被分为处于该蛋白质的无序区内的两个片段,例如,如nishimasu等人,cell,volume156,issue5,pp.935-949,2014中所述或如jiang等人(2016)science351:867-871.pdbfile:5f9r中所述,其各自通过引用并入本文。在一些实施方案中,在位于spcas9的介于大约氨基酸a292-g364、f445-k483或e565-t637之间的区域内的任何c、t、a或s处,或在任何其他cas9、cas9变体(例如,ncas9、dcas9)或其他napdnabp的相应位置处,将蛋白质分为两个片段。在一些实施方案中,在spcas9t310、t313、a456、s469或c574处,将蛋白质分为两个片段。在一些实施方案中,将蛋白质分为两个片段的过程称为“剪接”该蛋白质。[0295]在其他实施方案中,cas9蛋白的n端部分包含化脓性链球菌cas9野生型(spcas9)(ncbi参考序列:nc_002737.2,uniprot参考序列:q99zw2)的氨基酸1-573或1-637,并且cas9蛋白的c端部分包含spcas9野生型的氨基酸574-1368或638-1368部分。[0296]分裂cas9的c端部分可以与分裂cas9的n端部分接合以形成完全的cas9蛋白。在一些实施方案中,cas9蛋白的c端部分始于cas9蛋白的n端部分结束之处。因此,在一些实施方案中,分裂cas9的c端部分包含spcas9的氨基酸(551-651)-1368部分。“(551-651)-1368”意为始于氨基酸551-651(含)之间的氨基酸处并且终于氨基酸1368处。例如,分裂cas9的c端部分可包含spcas9的氨基酸551-1368、552-1368、553-1368、554-1368、555-1368、556-1368、557-1368、558-1368、559-1368、560-1368、561-1368、562-1368、563-1368、564-1368、565-1368、566-1368、567-1368、568-1368、569-1368、570-1368、571-1368、572-1368、573-1368、574-1368、575-1368、576-1368、577-1368、578-1368、579-1368、580-1368、581-1368、582-1368、583-1368、584-1368、585-1368、586-1368、587-1368、588-1368、589-1368、590-1368、591-1368、592-1368、593-1368、594-1368、595-1368、596-1368、597-1368、598-1368、599-1368、600-1368、601-1368、602-1368、603-1368、604-1368、605-1368、606-1368、607-1368、608-1368、609-1368、610-1368、611-1368、612-1368、613-1368、614-1368、615-1368、616-1368、617-1368、618-1368、619-1368、620-1368、621-1368、622-1368、623-1368、624-1368、625-1368、626-1368、627-1368、628-1368、629-1368、630-1368、631-1368、632-1368、633-1368、634-1368、635-1368、636-1368、637-1368、638-1368、639-1368、640-1368、641-1368、642-1368、643-1368、644-1368、645-1368、646-1368、647-1368、648-1368、649-1368、650-1368或651-1368中任一者的部分。在一些实施方案中,分裂cas9蛋白的c端部分包含spcas9的氨基酸574-1368或638-1368部分。[0297]“受试者”意为哺乳动物,包括但不限于人类和非人哺乳动物,诸如牛、马、犬、羊或猫科动物。受试者包括用于产生劳力和提供商品诸如食品的家畜、驯养动物,包括而不限于,牛、山羊、鸡、马、猪、兔和绵羊。[0298]“基本相同”意为多肽或核酸分子表现出与参考氨基酸序列(例如,任何一种本文所述的氨基酸序列)或核酸序列(例如,任何一种本文所述的核酸序列)的至少50%一致性。在一种实施方案中,此序列在氨基酸水准或核酸水准上与用于比较的序列的一致性为至少60%、80%或85%、90%、95%或甚至99%。[0299]通常使用序列分析软体(例如,威斯康辛大学生物技术中心的遗传学电脑公司(geneticscomputergroup,universityofwisconsinbiotechnologycenter,1710universityavenue,madison,wis.53705)的序列分析套装软体blast、bestfit、gap、或pileup/prettybox程式)测量序列一致性。该软体通过设定多种替换、删除、及/或其它修饰的同源性程度来匹配一致或相似的序列。保守替换典型包括下述各组的组内替换:甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;以及苯丙氨酸、酪氨酸。在例示性的测定一致性程度的途径中,可使用blast程式,其中介于e-3与e-100之间的可能性得分指示密切相关的序列。[0300]使用了例如具有以下参数的cobalt:[0301]a)比对参数:空位罚分为-11、-1,并且末端空位罚分为-5、-1,[0302]b)cdd参数:使用rpsblast开启;blaste-值0.003;找到保存的列并重新计算(findconservedcolumnsandrecompute)开启,和[0303]c)查询聚类参数:使用查询簇开启;字长4;最大簇间距离0.8;自体风格为regular。[0304]使用了例如具有以下参数的embossneedle:[0305]a)基质:blosum62;[0306]b)空位开头(gapopen):10;[0307]c)空位延长(gapextend):0.5;[0308]d)输出格式:对;[0309]e)末端空位罚分:错;[0310]f)末端空位开头:10;和[0311]g)末端空位延长:0.5。[0312]术语“靶标位点”是指核酸分子内的被核碱基编辑器修饰的序列。在一种实施方案中,靶标位点被脱氨酶或包含脱氨酶(例如,胞苷或腺嘌呤脱氨酶)的融合蛋白脱氨基。[0313]如本文中所用,“治疗(treat)”、“治疗(treating)”、“治疗(treatment)”等指的是减轻或缓解与其相关的病变和/或症状或者获得所希望的药理学和/或生理学效果。应知晓,尽管未排除,但治疗病症或症状并不需要完全消除与该病症或症状相关的病症、症状或症状。在一些实施方案中,该效果是治疗性的,即,而不限于,部分地或完全地削弱、减少、废止、减弱、减轻、降低疾病和/或可归因于疾病的不良症状的强度或治愈该疾病和/或可归因于疾病的不良症状。在一些实施方案中,该效果是预防性的,即,保护或防止疾病或病症的发作或复发的效果。就此而言,本发明公开的方法包括给药治疗有效量的如本文所述的组合物。[0314]“尿嘧啶糖苷酶抑制剂(uracilglycosylaseinhibitor)”或“ugi”意为抑制尿嘧啶切除修复系统的药剂。在一种实施方案中,该药剂是蛋白质或其片段,其结合宿主尿嘧啶-dna糖苷酶并且防止尿嘧啶残基被从dna中移除。在一种输送法南干中,ugi是指一种蛋白质、其片段或结构域,其能够抑制尿嘧啶-dna糖苷酶碱基切除修复酶。在一些实施方案中,ugi结构域包含野生型ugi或其经修饰的版本。在一些实施方案中,ugi结构域包含下文详述的示例性氨基酸序列的片段。在一些实施方案中,ugi片段包含氨基酸序列,所述氨基酸序列包含下文提供的示例性ugi序列的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。在一些实施方案中,ugi包含与示例性gi氨基酸序列或其片段同源的氨基酸序列,如下文详述。在一些实施方案中,ugi或其部分与野生型ugi或ugi序列或其部分为至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.9%或100%相同,如下文详述。示例性ugi包含以下氨基酸序列:[0315]》splp14739iungi_bppb2尿嘧啶-dna糖苷酶抑制剂[0316]mtnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikml.[0317]术语“载体(vector)”是指将核酸序列引入细胞内而获得转化细胞的意义。载体包括质粒、转座子、噬菌体、病毒、脂质体和附加体。“表达载体”是核酸序列,其包含待于接纳者细胞内表达的核苷酸序列。表达载体可以包括额外的核酸序列以促进和/或促使所引入的序列的表达,诸如起始子、终止子、启动子和分泌序列。[0318]本文中提供的任何组合物或方法可与本文中提供的一种或多种任何其它组合物和方法组合。[0319]dna编辑已经成为一种可行的手段,用来通过在基因水准上校正致病突变而修正疾病状态。直到最近,所有的dna编辑平台都是通过将dna双链断裂(dsb)引入特定基因组位点并且依靠内源性dna修复途径以半随机方式确定产物结局而发挥功能,导致基因产物的复杂群体。尽管可以通过同源定向修复(hdr)途径实现精确的、用户定义的修复结局,但存在的众多挑战阻止了使用hdr在治疗相关细胞类型中实现高效率修复。在实践中,相对于竞争性的、易出错的非同源末端接合途径,这一途径效率低下。再者,hdr被严格地限定在细胞周期的g1期和s期,阻止了有丝分裂后细胞中的精确修复。结果,已经证实难以或不可能在这些群体中以使用者定义的可编程方式高效率地改变基因组序列。[0320]超氧化物歧化酶1(sod1)是由sod1基因编码的酶性蛋白质。在整个身体中,sod1酶在细胞内大量存在。sod1酶结合铜(cu)和锌(zn)以降解被称为超氧自由基或反应性氧物质(ros)的有毒性的、带电的氧分子,这些氧分子是正常细胞过程的副产物,必须定期降解以避免细胞损害、转化或死亡。已经发现,sod1基因中有至少200个突变造成肌萎缩性脊髓侧索硬化症(als),这是一种以进行性肌无力、肌肉品质损失和不能控制运动为特征的病症。这些突变中的大多数改变超氧化物歧化酶中的一个氨基酸。在全世界范围内,sod1基因突变造成15%至20%的家族性als。所有患有由sod1基因突变造成的als的美国人中,大约一半具有位于该酶位置5处的氨基酸残基丙氨酸(a)替换为氨基酸残基缬氨酸(v)的特定突变,即,ala5val或a5v。与由其他基因突变造成的als相比,由a5v突变造成的als通常与更短的预期寿命关联。[0321]als是由控制肌肉运动的神经细胞(运动神经元)的死亡造成的。目前尚不清楚为什么运动神经元对于sod1基因突变特别敏感,但这些类型的神经元的大尺寸可能导致它们对正常sod1酶功能的破坏更为敏感。被改变的sod1酶可能藉以造成运动神经元死亡的几种方式包括:(i)细胞中特别是溶酶体和/或蛋白酶体中有害的超氧自由基的增加;(ii)其他类型的有毒自由基生产的增加和细胞死亡的增加;和/或(iii)可能对细胞具有毒性的错误折迭的超氧化物歧化酶的团块(聚集体)的蓄积。[0322]“sod1蛋白”意为一种多肽或其片段,其与ncbi登录号np_000445具有至少约95%的氨基酸序列一致性并且具有去甲基酶活性。示例性的人sod1氨基酸序列提供于下。[0323]1matkavcvlkgdgpvqgiinfeqkesngpvkvwgsikglteglhgfhvhefgdntagcts[0324]61agphfnplsrkhggpkdeerhvgdlgnvtadkdgvadvsiedsvislsgdhciigrtlvv[0325]121hekaddlgkggneestktgnagsrlacgvigiaq[0326]“sod1多核苷酸”意为编码sod1蛋白或其片段的核酸分子。可以ncbi登录号nc_000021.9:31659622-31668931(智人染色体21,grch38.p13基本组装体)获得的示例性的人sod1多核苷酸的基因组序列提供于下(seqidno:3)。[0327][0328][0329][0330][0331][0332]在上述sod1基因组核酸序列中,位于sod1基因的外显子3的5'末端处的“ag”剪接受体位点以粗体字表示。在上述sod1基因组序列中,sod1基因的外显子3的核酸序列以斜体并加双底线表示。[0333]示例性的人sod1多核苷酸的mrna/cdna序列(其可以ncbi参考序列:nm_000454.4获得)提供于下:[0334][0335]“雄激素受体(ar)多核苷酸”意为编码雄激素受体多肽的任何多核苷酸。示例性的雄激素受体多核苷酸提供于下(seqidno:4):[0336]智人雄激素受体(ar),转录物变体1,mrna(nm_000044.6)[0337]atggaagtgcagttagggctgggaagggtctaccctcggccgccgtccaagacctaccgaggagctttccagaatctgttccagagcgtgcgcgaagtgatccagaacccgggccccaggcacccagaggccgcgagcgcagcacctcccggcgccagtttgctgctgctgcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcaagagactagccccaggcagcagcagcagcagcagggtgaggatggttctccccaagcccatcgtagaggccccacaggctacctggtcctggatgaggaacagcaaccttcacagccgcagtcggccctggagtgccaccccgagagaggttgcgtcccagagcctggagccgccgtggccgccagcaaggggctgccgcagcagctgccagcacctccggacgaggatgactcagctgccccatccacgttgtccctgctgggccccactttccccggcttaagcagctgctccgctgaccttaaagacatcctgagcgaggccagcaccatgcaactccttcagcaacagcagcaggaagcagtatccgaaggcagcagcagcgggagagcgagggaggcctcgggggctcccacttcctccaaggacaattacttagggggcacttcgaccatttctgacaacgccaaggagttgtgtaaggcagtgtcggtgtccatgggcctgggtgtggaggcgttggagcatctgagtccaggggaacagcttcggggggattgcatgtacgccccacttttgggagttccacccgctgtgcgtcccactccttgtgccccattggccgaatgcaaaggttctctgctagacgacagcgcaggcaagagcactgaagatactgctgagtattcccctttcaagggaggttacaccaaagggctagaaggcgagagcctaggctgctctggcagcgctgcagcagggagctccgggacacttgaactgccgtctaccctgtctctctacaagtccggagcactggacgaggcagctgcgtaccagagtcgcgactactacaactttccactggctctggccggaccgccgccccctccgccgcctccccatccccacgctcgcatcaagctggagaacccgctggactacggcagcgcctgggcggctgcggcggcgcagtgccgctatggggacctggcgagcctgcatggcgcgggtgcagcgggacccggttctgggtcaccctcagccgccgcttcctcatcctggcacactctcttcacagccgaagaaggccagttgtatggaccgtgtggtggtggtgggggtggtggcggcggcggcggcggcggcggcggcggcggcggcggcggcggcggcggcgaggcgggagctgtagccccctacggctacactcggccccctcaggggctggcgggccaggaaagcgacttcaccgcacctgatgtgtggtaccctggcggcatggtgagcagagtgccctatcccagtcccacttgtgtcaaaagcgaaatgggcccctggatggatagctactccggaccttacggggacatgcgtttggagactgccagggaccatgttttgcccattgactattactttccaccccagaagacctgcctgatctgtggagatgaagcttctgggtgtcactatggagctctcacatgtggaagctgcaaggtcttcttcaaaagagccgctgaagggaaacagaagtacctgtgcgccagcagaaatgattgcactattgataaattccgaaggaaaaattgtccatcttgtcgtcttcggaaatgttatgaagcagggatgactctgggagcccggaagctgaagaaacttggtaatctgaaactacaggaggaaggagaggcttccagcaccaccagccccactgaggagacaacccagaagctgacagtgtcacacattgaaggctatgaatgtcagcccatctttctgaatgtcctggaagccattgagccaggtgtagtgtgtgctggacacgacaacaaccagcccgactcctttgcagccttgctctctagcctcaatgaactgggagagagacagcttgtacacgtggtcaagtgggccaaggccttgcctggcttccgcaacttacacgtggacgaccagatggctgtcattcagtactcctggatggggctcatggtgtttgccatgggctggcgatccttcaccaatgtcaactccaggatgctctacttcgcccctgatctggttttcaatgagtaccgcatgcacaagtcccggatgtacagccagtgtgtccgaatgaggcacctctctcaagagtttggatggctccaaatcaccccccaggaattcctgtgcatgaaagcactgctactcttcagcattattccagtggatgggctgaaaaatcaaaaattctttgatgaacttcgaatgaactacatcaaggaactcgatcgtatcattgcatgcaaaagaaaaaatcccacatcctgctcaagacgcttctaccagctcaccaagctcctggactccgtgcagcctattgcgagagagctgcatcagttcacttttgacctgctaatcaagtcacacatggtgagcgtggactttccggaaatgatggcagagatcatctctgtgcaagtgcccaagatcctttctgggaaagtcaagcccatctatttccacacccag附图说明[0338]图1a至1c描述质粒。图1a是编码tada7.10-dcas9碱基编辑器的表达载体。图1b是包含编码蛋白质的核酸分子的质粒,其导致氯霉素耐药性(camr)和大观霉素耐药性(spectr)。该质粒也包含通过两个点突变而丧失能力的卡那霉素耐药基因。图1c是包含编码蛋白质的核酸分子的质粒,其导致氯霉素耐药性(camr)和大观霉素(spectinomycin)耐药性(spectr)。该质粒也包含通过三个点突变而丧失能力的卡那霉素耐药基因。[0339]图2是以图1中示出的表达载体转导的细菌菌落的图像,其包括缺陷性卡那霉素耐药基因。使用易错pcr生成含有abe7.10变体的载体。收集表达这些“进化的”abe7.10变体的细菌细胞,使用递增浓度的卡那霉素进行卡那霉素耐药性测试。表达具有腺苷脱氨酶活性的abe7.10变体的细菌能够校正被引入卡那霉素耐药基因中的突变,从而修复卡那霉素耐药性。收集卡那霉素耐药细胞进行进一步分析。[0340]图3a和3b示出了对血红蛋白亚基γ(hgb1)基因座的调节区的编辑,该基因座是用于上调胎儿血红蛋白的治疗相关位点。图3a是hgb1基因的调节区的一部分的图。图3b将腺苷脱氨酶变体的效率和特异性定量。在hek293t细胞中的血红蛋白亚基γ1(hgb1)基因座处测定编辑,该基因座是用于上调摊儿血红蛋白的治疗相关位点。上图描述了hgb1基因的调节序列中的靶标区域中的核苷酸残基。a5、a8、a9和a11表示hgb1中的经编辑的腺苷残基。[0341]图4示出了包含识别非经典pam序列的dcas9的腺苷碱基编辑器的相对有效性。上图示出了血红蛋白亚基的编码序列。下图是说明具有不同长度的向导rna的腺苷脱氨酶变体碱基编辑器的效率的图。[0342]图5是示出abe8碱基编辑器的效率和特异性的图。将在预期靶标核苷酸和非预期靶标核苷酸(旁观者)处的编辑百分比定量。[0343]图6是示出abe8碱基编辑器的效率和特异性的图。将在预期靶标核苷酸和非预期靶标核苷酸(旁观者)处的编辑百分比定量。[0344]图7a至7d示出了第八代腺嘌呤碱基编辑器在人细胞仲介导杰出的a·t到g·c的转化。图7a示出了腺嘌呤碱基编辑的概述:i)abe8在基因组中的sgrna所靶向的位点处产生r环;ii)tada*脱氨酶经由水解脱氨反应将该r环的ss-dna部分上的腺嘌呤化学地转化为肌苷;iii)cas9的d10a切口酶将与含肌苷的链相对的链切口;iv)含肌苷的链可以在dna复制期间用作范本;v)在dna聚合酶的情境下,肌苷优先与胞苷进行碱基配对;以及,vi)复制会后,可将肌苷替换为鸟苷。图7b示出了abe8.x-m和abe8.x-d的架构。图7c示出了大肠杆菌tada脱氨酶(pdb1z3a)与复合有trnaarg2(pdb2b3j)的金黄色葡萄球菌tada(未显示)进行比对的三个透视图。突出显示了在第八轮进化中鉴定的突变。图7d是图表,示出了在hek293t细胞中,跨八个基因组位点,核心abe8构建体相对于abe7.10构建体的a·t到g·c碱基编辑效率。数值和误差条反映了在不同日期执行的三个独立生物学重复的均值和标准差。[0345]图8a至8c示出了cas9pam变体abe8和催化上死亡的cas9abe8变体在人细胞仲介导比相应abe7.10变体高的a·t到g·c转化。数值和误差条反映了在不同日期执行的三个独立生物学重复的均值和标准差。图8a是示出在hek293t中使用ng-cas9abe8(-ngpam)进行a·t到g·c转化的图。图8b是示出在hek293t中使用sa-cas9abe8(-nngrrtpam)进行a·t到g·c转化的图。图8c是示出在hek293t中使用没有催化活性的dcas9-abe8(化脓性链球菌cas9中的d10a、h840a)进行a·t到g·c转化的图。[0346]图9a至9e示出了在hek293t细胞中,abe7.10、abemax和具有一种bpnls的abemax之间的上靶编辑频率与脱靶编辑频率之间的比较。显示了单个资料点,并且误差条表示在不同日期执行的n=3个独立生物学重复的标准差。图9a和9b是示出上靶dna编辑频率的图。图9b和9c是示出sgrna引导的dna脱靶编辑频率的图。图9e是示出rna脱靶编辑频率的图。[0347]图10a至10b示出了tada(c端α-螺旋截短abe构建体)在hek293t细胞中的a·t到g·c转化的中值和相应的插入缺失形成。图10a是示出跨8个基因组位点的a·t到g·c中值编辑转化的热图。图10b是示出插入缺失形成的热图。δ残基值对应于tada中的缺失位置。中值数值从n=3个生物学重复生成。[0348]图11是热图,示出了在hek293t细胞中,跨8个基因组位点,40种abe8构建体的a·t到g·c转化的中值。中值数值从两个或更多个生物学重复确定。[0349]图12是热图,示出了在hek293t细胞中,跨8个基因组位点,40种abe8构建体的插入缺失%的中值。中值数值从两个或更多个生物学重复确定。[0350]图13是示出编辑中倍数变化的图,abe8:abe7。表示在hek293t细胞中,跨八个不同基因组位点的靶标内的全部a位置,abe8:abe7的a·t到g·c编辑的平均值。位置2-12表示20-nt前间隔序列内靶标腺嘌呤的位置,其中位置20直接为-nggpam的5'。[0351]图14示出了abe8的系统树图。选择核心abe8构建体以用于以黑体强调的进一步研究。[0352]图15是热图,示出了在hek293t细胞中,跨8个基因组位点,八种核心abe8构建体的a·t到g·c转化的中值。中值数值从三个或更多个生物学重复确定。[0353]图16是热图,示出了在hek293t细胞中的8个基因组位点处测试的8种核心abe8的中值插入缺失频率。[0354]图17是热图,示出了在hek293t细胞中的六个基因组位点处,核心ng-abe8构建体9(-ngpam)的a·t到g·c转化的中值。中值数值从n=3个生物学重复生成。[0355]图18是热图,示出了在hek293t细胞中的六个基因组位点处测试的核心ng-abe8的中值插入缺失频率。中值数值从n=3个生物学重复生成。[0356]图19是热图,示出了在hek293t细胞中的六个基因组位点处,核心sa-abe8构建体(-nngrrtpam)的a·t到g·c转化的中值。位点位置在22-nt前间隔序列内从-2到20(5'到3')编号。位置20对于nngrrtpam而言为5'。中值数值从n=3个生物学重复生成。[0357]图20是热图,示出了在hek293t细胞中的8个基因组位点处测试的核心sa-abe8的中值插入缺失频率。中值数值从n=3个生物学重复生成。[0358]图21是热图,示出了在hek293t细胞中的八个基因组位点处,核心dc9-abe8-m构建体的a·t到g·c转化的中值。死亡的cas9(dc9)定义为化脓性链球菌cas9中的d10a突变和h840a突变。中值数值从n≥3个生物学重复生成。[0359]图22是热图,示出了在hek293t细胞中的八个基因组位点处,核心dc9-abe8-d构建体的a·t到g·c转化的中值。死亡的cas9(dc9)定义为化脓性链球菌cas9中的d10a突变和h840a突变。中值数值从n≥3个生物学重复生成。[0360]图23a和23b示出了在hek293t细胞中的8个基因组位点处测试的核心dc9-abe8的中值插入缺失频率。中值数值从n≥3个生物学重复生成。图23a是热图,示出了针对相对于abe7.10的dc9-abe8-m变体显示的插入缺失频率。图23b是热图,示出了针对相对于abe7.10的dc9-abe8-d变体显示的插入缺失频率。[0361]图24是图表,示出了使用经abe8和abe7.10处理的hek293t细胞进行的c·g到t·a编辑。每个位元点的编辑频率跨靶标内的全部c位置取平均。前间隔序列内的胞嘧啶以阴影表示。[0362]图25a至25h示出了通过abe8构建体和具有tada突变的abe8构建体来改善对于dna的特异性的dna上靶和sgrna-依赖性dna脱靶编辑。显示了单个资料点,并且误差条表示在不同日期执行的n=3个独立生物学重复的标准差。图25a和25b是图表,示出了核心abe8构建体与abe7相比的上靶dna编辑频率。图25c和25d是图表,示出了具有改善rna脱靶编辑的突变的abe8的上靶dna编辑频率。图25e和25f是图表,示出了核心abe8构建体与abe7相比的sgrna引导的dna脱靶编辑频率。图25g和25h是图表,示出了具有改善rna脱靶编辑的突变的abe8的sgrna引导的dna脱靶编辑频率。[0363]图26是图表,示出了在人类细胞中12个先前鉴定的sgrna依赖性cas9脱靶基因座处的插入缺失频率。显示了单个资料点,并且误差条表示在不同日期执行的n=3个独立生物学重复的标准差。[0364]图27a和27b示出了原代细胞中的a·t到g·c转化和表型结果。图27a是图表,示出了在使用abe处理的来自两个独立供体的cd34 细胞中的-198hbg1/2位点处的a·t到g·c转化。在处理后48小时和144小时的时间点执行ngs分析。-198hbg1/2靶标区域以a7强调显uv-vis示踪(220nm)和积分。注意:供体2对于镰状细胞疾病而言是杂合的。[0383]图46示出了经abe8.13-m处理的分化cd34 细胞(供体2)的珠蛋白链水准的uhplcuv-vis示踪(220nm)和积分。注意:供体2对于镰状细胞疾病而言是杂合的。[0384]图47示出了经abe8.13-d处理的分化cd34 细胞(供体2)的珠蛋白链水准的uhplcuv-vis示踪(220nm)和积分。注意:供体2对于镰状细胞疾病而言是杂合的。[0385]图48示出了经abe8.17-m处理的分化cd34 细胞(供体2)的珠蛋白链水准的uhplcuv-vis示踪(220nm)和积分。注意:供体2对于镰状细胞疾病而言是杂合的。[0386]图49示出了经abe8.17-d处理的分化cd34 细胞(供体2)的珠蛋白链水准的uhplcuv-vis示踪(220nm)和积分。注意:供体2对于镰状细胞疾病而言是杂合的。[0387]图50示出了经abe8.20-m处理的分化cd34 细胞(供体2)的珠蛋白链水准的uhplcuv-vis示踪(220nm)和积分。注意:供体2对于镰状细胞疾病而言是杂合的。[0388]图51a至51e描述了使用abe8.8在两个独立位点处进行编辑,在去核前红细胞分化后第11天达到90%以上的编辑,并且在红细胞分化后第18天γ珠蛋白比α珠蛋白或总β家族珠蛋白多约60%。图51a是图表,示出了在2个独立实验中,在2个健康供体中的平均abe8.8编辑。使用区分hbg1与hbg2的引物测量编辑效率。图51b是图表,示出了在2个独立实验中,在1个健康供体中的平均。使用识别hbg1和hbg2两者的引物测量编辑效率。图51c是图表,示出了abe8.8在具有杂合e6v突变的供体中的编辑。图51d和51e是图表,示出了经abe8.8编辑的细胞中的γ珠蛋白增加。[0389]图52a和52b示出了使用abe变体来校正镰状细胞突变的编辑百分比。图52a是图表,示出了对于在scd患者成纤维细胞中具有约70%编辑的不同编辑器变体的筛选。图52b是图表,示出了使用前导abe变体编辑的来自健康供体的cd34细胞,该变体靶向相邻脯氨酸中的同义突变a13,该同义突变位于编辑视窗内并且充当编辑scd突变的指示器。abe8变体在指示器a13处显示40%作用的平均编辑效率。[0390]图53a和53b示出了rna扩增子测序以检测对于与abe处理相关的rna的细胞内a到i的编辑。显示了单个资料点,并且误差条表示在不同日期执行的n=3个独立生物学重复的标准差。图53a是图表,示出了核心abe8构建体与abe7和cas9(d10a)切口酶对照的在所靶向的rna扩增子中的a到i的编辑频率。图53b是图表,示出了abe8在所靶向的rna扩增子中的a到i的编辑频率,该abe8具有已经被报导改善rna脱靶编辑的突变。[0391]图54是柱状图,示出了通过所检测的腺苷碱基编辑器(abe8变体)与对照物实现的在剪接受体靶标位点(ag核酸位点)处的a到g碱基编辑的总百分比。用于所评估的abe的前间隔序列pam序列是nggabe。[0392]图55示出了sod1基因组核酸序列的外显子3剪接受体的图解,该剪接受体作为a到g核苷酸变化以造成sod1外显子3的转录的剪接中断的靶标。图中显示了sod1核酸序列的外显子3区域中的大量基因组dna位置(上图);外显子3区域中的sod1基因组核酸序列、外显子3的内含子核酸序列5';以及外显子3的靶标剪接受体核酸序列5';以及相应向导rna(grna)的核酸序列,其中剪接受体(“ag”)核酸紧邻sod1外显子3的5',以向上的箭头指示。还应注意该图中的旁观者腺苷(a)核碱基(方框内),其位于内含子序列中接近sod1外显子3的ag剪接受体5'处。[0393]图56是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。显示了sod1基因组核酸序列的外显子3的5'处的靶标剪接受体(ag)核酸序列中的精确a到g核碱基变化(改变)的效率百分比,如通过对已经发生碱基编辑的细胞中的基因组dna进行pcr后进行深度测序(myseq)所检测的。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。该表显示,使用本文所述的abe8碱基编辑器以及系统和方法,在剪接受体核酸位点(沿着靶标位点的位置6)处的a到g转化效率为约81%(80.77%)。与对剪接受体核酸序列中的靶标a的编辑相比,旁观者a核碱基到g核碱基(在显示于所靶向的剪接受体的a核碱基左侧方框内的位置2、3和4处)的改变极小。[0394]图57a至57l是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0395]图58是柱状图,示出了通过所检测的具有向导20的腺苷碱基编辑器(abe8变体)与对照物实现的在剪接受体靶标位点(ag核酸位点)的靶标位置6处的a到g碱基编辑的百分比。用于所评估的abe的前间隔序列pam序列是nggabe。[0396]图59是柱状图,示出了通过所检测的具有向导42的腺苷碱基编辑器(abe8变体)与对照物实现的在剪接受体靶标位点(ag核酸位点)的靶标位置5处的a到g碱基编辑的百分比(左图)以及在剪接受体靶标位点(ag核酸位点)的位置2、5、9处的a到g碱基编辑的总百分比(右图)。用于所评估的abe的前间隔序列pam序列是nggabe。[0397]图60a是柱状图,示出了通过所检测的具有向导41的腺苷碱基编辑器(pv变体)与对照物实现的在剪接受体靶标位点(ag核酸位点)的靶标位置5处的a到g碱基编辑的百分比。用于所评估的abe的前间隔序列pam序列是ngtabe。图60b是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0398]图61是柱状图,示出了通过所检测的具有向导24的腺苷碱基编辑器(pv变体)与对照物实现的在剪接受体靶标位点(ag核酸位点)处的a到g碱基编辑的总百分比。用于所评估的abe的前间隔序列pam序列是ngaabe。[0399]图62显示了使用abe8.8或具有向导20的abe7.10编辑的hek297t细胞中的sod1蛋白质水准(左图:蛋白质印迹;右图:定量)。使用β肌动蛋白作为对照。[0400]图63是柱状图,示出了通过所检测的具有向导19的胞苷碱基编辑器(pv变体)与对照物实现的在剪接受体靶标位点(ag核酸位点)的靶标位置8处的c到t碱基编辑的百分比。用于所评估的abe的前间隔序列pam序列是ngccbe。[0401]图64a是柱状图(左图),示出了通过所检测的具有向导41的腺苷碱基编辑器(pv变体)与对照物实现的在剪接受体靶标位点(ag核酸位点)的靶标位置5处的a到g碱基编辑的百分比。用于所评估的abe的前间隔序列pam序列是ngtabe。右图是图解,描述了sod1核酸序列的外显子3区域中的大量基因组dna位置,向导41、20、40和21被设计为结合至这些位置处。也参见前文图55。图64b是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0402]图65是柱状图(左图),示出了通过所检测的具有向导42的腺苷碱基编辑器(abe变体)与对照物实现的在剪接受体靶标位点(ag核酸位点)处的a到g碱基编辑的总百分比。用于所评估的abe的前间隔序列pam序列是nggabe。右图是图解,描述了sod1核酸序列的外显子3区域中的大量基因组dna位置,向导42、24和25被设计为结合至这些位置处。也参见前文图55。[0403]图66a是柱状图,示出了通过所测定的具有向导40的胞苷碱基编辑器(be4vrqr)与对照物实现的c到t碱基编辑的总百分比。用于所评估的cbe的前间隔序列pam序列是ngacbe。图66b是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0404]图67a是柱状图,示出了通过所检测的具有向导18的腺苷碱基编辑器(pv变体)与对照物实现的在剪接受体靶标位点(ag核酸位点)的靶标位置5处的a到g碱基编辑的百分比。用于所评估的abe的前间隔序列pam序列是ngtabe。[0405]图68是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0406]图69是柱状图,示出了通过所测定的具有向导16的胞苷碱基编辑器(be4vrqr)与对照物实现的c到t碱基编辑的总百分比。用于所评估的cbe的前间隔序列pam序列是ngacbe。[0407]图70是柱状图,示出了通过所测定的具有向导17的胞苷碱基编辑器(be4vrqr)与对照物实现的在靶标位置4处的c到t碱基编辑的百分比。用于所评估的cbe的前间隔序列pam序列是ngacbe。[0408]图71是柱状图,示出了通过所测定的具有向导21的胞苷碱基编辑器(be4vrqr)与对照物实现的在靶标位置5处的c到t碱基编辑的百分比。用于所评估的cbe的前间隔序列pam序列是ngacbe。[0409]图72a至72l是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0410]图73a至73c是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0411]图74a至74c是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0412]图75a至75d是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0413]图76a至76l是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0414]图77a至77l是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0415]图78a至78d是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0416]图79a至79l是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。也参见前文图56。[0417]图80显示,当使用胞苷碱基编辑器(cbe)来靶向“cag”时,终止密码子被引入雄激素受体的外显子1中。[0418]图81提供两张图表。左侧图表显示通过具体的胞苷碱基编辑器进行的c到t的编辑的百分比。右侧图表显示通过每种胞苷碱基编辑器的插入缺失率的百分比。[0419]图82a至82i是表,示出了使用cbe碱基编辑器变体在ar核酸序列中的c到t的编辑的效率百分比,如通过对已经发生碱基编辑的细胞内的基因组dna进行pcr后进行深度测序(myseq)所检测的。图82a-82i示出了在ar核酸靶标位点中位置6处的c到t碱基编辑的百分比。显示了其中使用水代替cbe的对照反应。[0420]图83提供两张图表。左侧图表显示,将提前终止密码子引入外显子1中在大部分细胞中导致雄激素受体的功能性敲除。中间图表显示通过每种胞苷碱基编辑器的插入缺失率的百分比。右图是图解,描述了ar核酸序列的外显子1区域中的大量基因组dna位置,向导8被设计为结合至这些位置处。也参见前文图80。图83b是表,示出了使用cbe碱基编辑器变体在ar核酸序列中的c到t的编辑的效率百分比,如通过对已经发生碱基编辑的细胞内的基因组dna进行pcr后进行深度测序(myseq)所检测的。图83b示出了在ar核酸靶标位点中靶标位置处的c到t碱基编辑的百分比。显示了其中使用水代替cbe的对照反应。[0421]图84a是柱状图(左图),示出了通过所测定的具有向导10的胞苷碱基编辑器(bgx5、bgx27、bgx29和btx448)与对照物实现的在靶标位置6处的c到t碱基编辑的百分比;以及以百分比表示的插入缺失率(中图)。用于所评估的cbe的前间隔序列pam序列是nggcbe。右图是图解,描述了ar核酸序列的外显子1区域中的大量基因组dna位置,向导9和10被设计为结合至这些位置处。也参见前文图80。图84b是表,示出了使用cbe碱基编辑器变体在ar核酸序列中的c到t的编辑的效率百分比,如通过对已经发生碱基编辑的细胞内的基因组dna进行pcr后进行深度测序(myseq)所检测的。图83b示出了在ar核酸靶标位点中位置6处的c到t碱基编辑的百分比。显示了其中使用水代替cbe的对照反应。[0422]图85是柱状图,示出了通过所检测的具有向导8的腺苷碱基编辑器(abe8变体)(左图)或向导14(右图)与对照物实现的在剪接受体靶标位点(ag核酸位点)处的a到g碱基编辑的总百分比。用于所评估的abe的前间隔序列pam序列是nggabe。[0423]图86a是柱状图(上)和总结表(下),示出了通过所测定的具有向导11的胞苷碱基编辑器(be4vrqr)与对照物实现的在靶标位置8处的c到t碱基编辑的百分比。用于所评估的cbe的前间隔序列pam序列是ngacbe。图86b是表,示出了使用cbe碱基编辑器变体在ar核酸序列中的c到t的编辑的效率百分比,如通过对已经发生碱基编辑的细胞内的基因组dna进行pcr后进行深度测序(myseq)所检测的。图86b示出了在ar核酸靶标位点中位置8处的c到t碱基编辑的百分比。显示了其中使用水代替cbe的对照反应。[0424]图87a是柱状图(上)和总结表(下),示出了通过所测定的具有向导12的胞苷碱基编辑器(be4vrqr)与对照物实现的在靶标位置5处的c到t碱基编辑的百分比。用于所评估的cbe的前间隔序列pam序列是ngacbe。图87b是表,示出了使用cbe碱基编辑器变体在ar核酸序列中的c到t的编辑的效率百分比,如通过对已经发生碱基编辑的细胞内的基因组dna进行pcr后进行深度测序(myseq)所检测的。图87b示出了在ar核酸靶标位点中位置5处的c到t碱基编辑的百分比。显示了其中使用水代替cbe的对照反应。[0425]图88是柱状图,示出了通过所测定的具有向导15的胞苷碱基编辑器(be4vrqr)与对照物实现的c到t碱基编辑的总百分比。用于所评估的cbe的前间隔序列pam序列是ngacbe。[0426]每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。[0427]图89a至89d是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。显示了ar基因组核酸序列的外显子1的靶标核酸序列中的精确c到t或a到g核碱基变化(改变)的效率百分比,如通过对已经发生碱基编辑的细胞中的基因组dna进行pcr后进行深度测序(myseq)所检测的。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。[0428]图90a至90c是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。显示了ar基因组核酸序列的外显子1的靶标核酸序列中的精确c到t或a到g核碱基变化(改变)的效率百分比,如通过对已经发生碱基编辑的细胞中的基因组dna进行pcr后进行深度测序(myseq)所检测的。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。[0429]图91a至91c是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。显示了ar基因组核酸序列的外显子1的靶标核酸序列中的精确c到t或a到g核碱基变化(改变)的效率百分比,如通过对已经发生碱基编辑的细胞中的基因组dna进行pcr后进行深度测序(myseq)所检测的。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。[0430]图92a和92b是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。显示了ar基因组核酸序列的外显子1的靶标核酸序列中的精确c到t或a到g核碱基变化(改变)的效率百分比,如通过对已经发生碱基编辑的细胞中的基因组dna进行pcr后进行深度测序(myseq)所检测的。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。[0431]图93a至93x是表,示出了使用本文所述碱基编辑器系统和方法并且在dna的pcr和深度测序后获得的靶标核酸序列中靶标位点核碱基改变的效率。显示了ar基因组核酸序列的外显子1的靶标核酸序列中的精确c到t或a到g核碱基变化(改变)的效率百分比,如通过对已经发生碱基编辑的细胞中的基因组dna进行pcr后进行深度测序(myseq)所检测的。每种核碱基a、c、g、t沿着表的左侧边缘纵向列出,并且沿着表的底部显示其在沿着靶标位点核酸(以碱基对(bp)表示)的dna中的位置。具体实施方式[0432]本发明提供包含新颖腺苷碱基编辑器(例如,abe8)的效率增加的组合物以及使用它们在靶标核碱基序列中产生修饰的方法。[0433]核碱基编辑器[0434]本文公开了一种用于编辑、修饰或改变多核苷酸的靶标核苷酸序列的碱基编辑器或核碱基编辑器。在特定实施方案中,本发明的碱基编辑器修饰sod1多核苷酸。在特定实施方案中,本发明的碱基编辑器将终止密码子引入ar多核苷酸或中断ar多核苷酸的剪接位点。本文描述了核碱基编辑器或碱基编辑器,其包含多核苷酸可编程核苷酸结合结构域(例如,cas9)和核碱基编辑结构域(例如,腺苷脱氨酶)。当与向导多核苷酸(例如,grna)结合时,多核苷酸可编程核苷酸结合结构域(例如,cas9)可以特异性地结合至靶标多核苷酸序列(即,经由所结合的向导核酸的碱基与靶标多核苷酸序列的碱基之间的互补碱基配对),并因此将碱基编辑器定位在希望进行编辑的靶标核酸序列处。在一些实施方案中,靶标多核苷酸序列包含单链dna或双链dna。在一些实施方案中,靶标多核苷酸序列包含rna。在一些实施方案中,靶标多核苷酸序列包含dna-rna杂交物。[0435]多核苷酸可编程核苷酸结合结构域[0436]应知悉,多核苷酸可编程核苷酸结合结构域也可以包括结合rna的核酸可编程蛋白质。例如,多核苷酸可编程核苷酸结合结构域可以与核酸缔合,该核酸将该多核苷酸可编程核苷酸结合结构域引导至rna。其他核酸可编程dna结合蛋白也处于本公开的范畴内,但它们不在本公开中具体地列举。[0437]碱基编辑器的多核苷酸可编程核苷酸结合结构域自身可以包含一个或多个结构域。例如,多核苷酸可编程核苷酸结合结构域可以包含一个或多个核酸酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域的核酸酶结构域可以包含核酸内切酶或核酸外切酶。本文中,术语“核酸外切酶”是指能够从游离末端消化核酸(例如,rna或dna)的蛋白质或多肽,而术语“核酸内切酶”是指能够催化(例如,裂解)核酸(例如,dna或rna)中的内部区域的蛋白质或多肽。在一些实施方案中,核酸内切酶可以裂解双链核酸的一条链。在一些实施方案中,核酸内切酶可以裂解双链核酸分子的两条链。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以是去氧核糖核酸酶。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以是核糖核酸酶。[0438]在一些实施方案中,多核苷酸可编程核苷酸结合结构域的核酸酶结构域可以切割靶标多核苷酸的零、一或两条链。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以包含切口酶结构域。本文中,术语“切口酶”是指包含核酸酶结构域的多核苷酸可编程核苷酸结合结构域,其能够仅裂解双螺旋核酸分子(例如,dna)中的两条链中的一条链。在一些实施方案中,切口酶可以通过经一个或多个突变引入活性多核苷酸可编程核苷酸结合结构域中而衍生自完全催化活性(例如,天然)形式的多核苷酸可编程核苷酸结合结构域。例如,如果多核苷酸可编程核苷酸结合结构域包含衍生自cas9的切口酶结构域,则衍生自cas9的切口酶结构域可以包括d10a突变和位于位置840处的组氨酸。在此类实施方案中,残基h840保持催化活性并且因此可以裂解核酸双螺旋的一条链。在另一实施例中,衍生自cas9的切口酶结构域可以包含h840a突变,而位于位置10处的氨基酸保持为d。在一些实施方案中,切口酶可以通过去除切口酶活性所不需要的全部或部分核酸酶结构域而衍生自完全催化活性(例如,天然)形式的多核苷酸可编程核苷酸结合结构域。例如,如果多核苷酸可编程核苷酸结合结构域包含衍生自cas9的切口酶结构域,则衍生自cas9的切口酶结构域可以包含ruvc结构域或hnh结构域的全部或部分缺失。[0439]示例性的催化活性cas9的氨基酸序列如下:[0440]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd.[0441]包含具有切口酶结构域的多核苷酸可编程核苷酸结合结构域的碱基编辑器能够在具体的(例如,通过所结合的向导核酸的互补序列确定的)多核苷酸靶标序列处产生单链dna断裂(切口)。在一些实施方案中,被包含切口酶结构域(例如,衍生自cas9的切口酶结构域)的碱基编辑器裂解的核酸双螺旋靶标多核苷酸序列的链是没有通过该碱基编辑器编辑的链(即,被碱基编辑器裂解的链与包含待编辑甲基的链相对)。在其他实施方案中,包含切口酶结构域(例如,衍生自cas9的切口酶结构域)的碱基编辑器可以裂解被靶向以进行编辑的dna分子的链。在此类实施方案中,非靶向链不被裂解。[0442]本文中还提供包含碱基编辑器,其包含催化上死亡(即,不能够裂解靶标多核苷酸序列)的多核苷酸可编程核苷酸结合结构域。本文中,术语“催化上死亡的(catalyticallydead)”和“核酸酶死亡的(nucleasedead)”可互换使用,并且是指一种多核苷酸可编程核苷酸结合结构域,其具有一个或多个突变和/或缺失,导致其失去了裂解核酸的链的能力。在一些实施方案中,作为一个或多个核酸酶结构域中特异性点突变的结果,催化上死亡的多核苷酸可编程核苷酸结合结构域甲基编辑器可能缺乏核酸酶活性。例如,在碱基编辑器包含cas9结构域的情况下,该cas9可以包含d10a突变和h840a突变两者。此类突变令两个核酸酶结构域失去活性,从而导致核酸酶活性的丧失。在其他实施方案中,催化上死亡的多核苷酸可编程核苷酸结合结构域可以包含全部或部分的催化结构域(例如ruvc1结构域和/或hnh结构域)的一个或多个缺失。在进一步的实施方案中,催化上死亡的多核苷酸可编程核苷酸结合结构域包含点突变(例如,d10a或h840a)以及全部或部分的核酸酶结构域的缺失。[0443]本文还设想了能够从多核苷酸可编程核苷酸结合结构域的先前功能性版本产生催化上死亡的多核苷酸可编程核苷酸结合结构域的突变。例如,在催化上死亡的cas9(“dcas9”)的情况下,提供了具有除d10a和h840a外的突变的变体,其得到无核酸酶活性的cas9。举例而言,此类突变包括位于d10和h840处的其他氨基酸置换,或cas9的核酸酶结构域内的其他置换(例如,hnh核酸酶亚结构域和/或ruvc1亚结构域中的置换)。基于本公开和本领域的知识,其他合适的无核酸酶活性的dcas9结构域对于本领域技术人员是显而易见的,并且处于本公开的范畴内。此类其他示例性的合适的无核酸酶活性的cas9结构域包括但不限于,d10a/h840a、d10a/d839a/h840a和d10a/d839a/h840a/n863a突变结构域(参见例如,prashant等人,cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.naturebiotechnology.2013;31(9):833-838,其整体内容通过引用并入本文)。[0444]可并入碱基编辑器中的多核苷酸可编程核苷酸结合结构域的非限制性示例包括源自crispr蛋白的结构域、限制性核酸酶、大范围核酸酶、tal核酸酶(talen)和锌指核酸酶(zfn)。在一些实施方案中,碱基编辑器包含具有天然或修饰的蛋白质或其部分的多核苷酸可编程核苷酸结合结构域,在crispr(即,规律成簇间隔短回文重复序列)介导的核酸修饰期间,其能够经由所结合的向导核酸结合至核酸序列。本文中,此类蛋白质称为“crispr蛋白”。据此,本文公开了包含具有全部或部分的crispr蛋白的多核苷酸可编程核苷酸结合结构域的碱基编辑器(即,包含全部或部分的crispr蛋白作为结构域的碱基编辑器,该结构域也称为碱基编辑器的“衍生自crispr蛋白的结构域”)。与crispr蛋白的野生型或天然版本相比,被并入碱基编辑器中的衍生自crispr蛋白的结构域可以经修饰。例如,如下文所述,衍生自crispr蛋白的结构域可以包含性对于crispr蛋白的野生型或天然版本的一个或多个突变、插入、缺失、重排和/或重组。[0445]crispr是适应性免疫系统,其提供针对可动遗传因数(病毒、转座因子和接合质粒)的保护。crispr簇含有间隔序列、与先行移动元件互补的序列和侵入靶标的核酸。crispr簇被转录并加工为crisprrna(crrna)。在ii型crispr系统中,正确加工pre-crrna需要反式编码的小rna(tracrrna)、内源核糖核酸酶3(rnc)和cas9蛋白。tracrrna在核糖核酸酶3辅助的pre-crrna加工中充当向导。随后,cas9/crrna/tracrrna核酸内切溶解地裂解与间隔序列互补的线性或环状dsdna靶标。不与crrna互补的靶标链首先被核酸内切溶解地切割,然后被3'-5'核酸外切溶解地修剪。本质上中,dna结合和裂解通常需要蛋白质和两种rna。但是,单向导rna(“sgrna”,或简称为“gnra”)可以工程化改造,以将crrna和tracrrna两者的各个方面合并到单个rna物种中。参见例如,jinekm.等人,science337:816-821(2012),其整体内容通过引用并入本文。cas9识别crispr重复序列中的短基序(pam或前间隔序列邻近基序)以帮助区分自我与非自我。[0446]在一些实施方案中,本文所述的方法可以利用经工程化的cas蛋白。向导rna(grna)是短合成rna,由cas结合所必需的支架序列和使用者定义的约20个核苷酸的定义待修饰的基因组靶标的间隔序列构成。因此,技术人员可以改变cas蛋白的基因组靶标,特异性部分地由grna靶向序列对于基因组靶标与基因组剩余部分的特异性如何而决定。[0447]在一些实施方案中,grna支架序列如下:guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。[0448]在一些实施方案中,被并入碱基编辑器中的衍生自crispr蛋白的结构域是核酸内切酶(例如,去氧核糖核酸酶或核糖核酸酶),当与所结合的向导核酸协同作用时,该核酸内切酶能够结合靶标多核苷酸。在一些实施方案中,被并入碱基编辑器中的衍生自crispr蛋白的结构域是切口酶,当与所结合的向导核酸协同作用时,该切口酶能够结合靶标多核苷酸。在一些实施方案中,被并入碱基编辑器中的衍生自crispr蛋白的结构域是催化上死亡的结构域,当与所结合的向导核酸协同作用时,该催化上死亡的结构域能够结合靶标多核苷酸。在一些实施方案中,本衍生自碱基编辑器的crispr蛋白结合的靶标多核苷酸是dna。在一些实施方案中,本衍生自碱基编辑器的crispr蛋白结合的靶标多核苷酸是rna。[0449]本文中可使用的cas蛋白包括1类和2类。cas蛋白的非限制性示例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas9(也称为csn1或csx12)、cas10、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、cas12a/cpf1、cas12b/c2c1、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12i、carf、ding、其同源物、或其经修饰的版本。未经修饰的crispr酶可能具有dna裂解活性,诸如cas9,其具有两个功能性核酸内切酶结构域:ruvc和hnh。crispr酶可以引导一条或两条链在靶标序列处(诸如靶标序列内和/或靶标序列的补体内)的裂解。例如,crispr酶可以引导从靶标序列的第一个或最后一个核苷酸起约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个或更多个碱基对内的一条或两条链。[0450]可以使用一种载体,该载体编码crispr酶,该酶被关于野生型酶突变以使得经突变的crispr酶缺乏裂解含有靶标序列的靶标多核苷酸的一条或两条链的能力。cas9可以指与野生型示例性cas9多肽(例如,来自化脓性链球菌的cas9)具有至少或至少约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性和/或序列同源性的多肽。cas9可以指与野生型示例性cas9多肽(例如,来自化脓性链球菌)具有至多或至多约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性和/或序列同源性的多肽。cas9可以指野生型或经修饰形式的cas9蛋白,其可以包含氨基酸变化诸如缺失、插入、置换、变异、突变、融合、嵌合或其任意组合。[0451]在一些实施方案中,碱基编辑器的衍生自crispr蛋白的结构域可以包括来自以下的cas9的全部或部分:溃疡棒状杆菌(corynebacteriumulcerans)(ncbirefs:nc_015683.1,nc_017317.1);白喉棒状杆菌(corynebacteriumdiphtheria)(ncbirefs:nc_016782.1,nc_016786.1);螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1);中间普雷沃菌(prevotellaintermedia)(ncbiref:nc_017861.1);中国台湾螺原体(spiroplasmataiwanense,china)(ncbiref:nc_021846.1);海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1);拟杆菌(belliellabaltica)(ncbiref:nc_018010.1);扭曲冷弯曲菌(psychroflexustorquis)(ncbiref:nc_018721.1);嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1);无害利斯特菌(listeriainnocua)(ncbiref:np_472073.1);空肠弯曲杆菌(campylobacterjejuni)(ncbiref:yp_002344900.1);脑膜炎双球菌(neisseriameningitidis)(ncbiref:yp_002342100.1);化脓性链球菌(streptococcuspyogenes)或金黄色葡萄球菌(staphylococcusaureus)。[0452]核碱基编辑器的cas9结构域[0453]cas9核酸酶序列和结构是本领域技术人员已知的(参见例如,“completegenomesequenceofanm1strainofstreptococcuspyogenes.”ferretti等人,proc.natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.等人,nature471:602-607(2011);和“aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.等人,science337:816-821(2012),其各自的整体内容通过引用并入本文)。cas9直接同源物已经在多种物种中描述,包括但不限于化脓性链球菌和嗜热链球菌。基于本公开,其他合适的cas9核酸酶和序列对于本领域技术人员将是显而易见的,并且此类cas9核酸酶和序列包括来自生物体的cas9序列和以下文献中公开的基因座:chylinski,rhun,andcharpentier,“thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737;其整体内容通过引用并入本文。[0454]在一些实施方案中,核酸可编程dna结合蛋白(napdnabp)是cas9结构域。本文中提供了非限制性的示例性cas9结构域。cas9结构域可以是核酸酶活性cas9结构域、无核酸酶活性的cas9结构域(dcas9)或cas9切口酶(ncas9)。在一些实施方案中,cas9结构域是核酸酶活性结构域。例如,cas9结构域可以是切割双螺旋核酸的两条链(例如,双螺旋dna分子的两条链)的cas9结构域。在一些实施方案中,cas9结构域包含本文所详述的任何一个氨基酸序列。在一些实施方案中,cas9结构域包含氨基酸序列,所述氨基酸序列与本文详述的任何一个氨基酸序列为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或99.5%相同。在一些实施方案中,cas9结构域包含氨基酸序列,与本文详述的任何一个氨基酸序列相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,cas9结构域包含氨基酸序列,与本文详述的任何一个氨基酸序列相比,该氨基酸序列具有至少10个、至少15个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少1100个或至少1200个相同的毗邻氨基酸残基。[0455]在一些实施方案中,提供了包含cas9的片段的蛋白质。例如,在一些实施方案中,蛋白质包含一个或两个cas9结构域:(1)cas9的grna结合结构域;或(2)cas9的dna切割结构域。在一些实施方案中,包含cas9或其片段的蛋白质称为“cas9变体”。cas9变体享有与cas9或其片段的同源性。例如,cas9变体与野生型cas9至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,与野生型cas9相比,cas9变体可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多氨基酸变化。在一些实施方案中,cas9变体包含cas9的片段(例如,grna结合结构域或dna切割结构域),使得该片段与野生型cas9的相应片段至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,该片段是相应野生型cas9的氨基酸长度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%。在一些实施方案中,该片段为至少100个氨基酸的长度。一些实施方式中,该片段为至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250个或至少1300个氨基酸的长度。[0456]在一些实施方案中,如本文所提供的cas9融合蛋白包含cas9蛋白的全长度氨基酸序列,例如,本文所提供的cas9序列之一。然而,在其他实施方案中,如本文所提供的融合蛋白不包含全长度cas9序列,而仅包含其一个或多个片段。合适的cas9结构域和cas9片段的示例性氨基酸序列在本文中提供,并且cas9结构域和片段的其他合适的序列对于本领域技术人员而言将会是显而易见的。[0457]cas9蛋白可以与将该cas9蛋白引导至具体dna序列的向导rna缔合,该dna序列与向导rna互补。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cas9结构域,例如,核酸酶活性cas9、cas9切口酶(ncas9)或无核酸酶活性的cas9(dcas9)。核酸可编程dna结合蛋白的示例包括但不限于,cas9(例如,dcas9和ncas9)、casx、casy、cpf1、cas12b/c2c1和cas12c/c2c3。[0458]在一些实施方案中,野生型cas9对应于来自化脓性链球菌(streptococcuspyogenes)的cas9(ncbi参考序列:nc_017053.1,核苷酸和氨基酸序列如下)。[0459]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttggcagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggcagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaatctacaatcaattatttgaagaaaaccctattaacgcaagtagagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagagaaatggcttgtttgggaatctcattgctttgtcattgggattgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatagtgaaataactaaggctcccctatcagcttcaatgattaagcgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgagggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggcgcctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggggatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagatattcaaaaagcacaggtgtctggacaaggccatagtttacatgaacagattgctaacttagctggcagtcctgctattaaaaaaggtattttacagactgtaaaaattgttgatgaactggtcaaagtaatggggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctacaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttcattaaagacgattcaatagacaataaggtactaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0460][0461][0462](单底线:hnh结构域;双底线:ruvc结构域)[0463]在一些实施方案中,野生型cas9对应于或包含以下核苷酸和/或氨基酸序列:[0464]atggataaaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctgcagga[0465][0466][0467](单底线:hnh结构域;双底线:ruvc结构域)。[0468]在一些实施方案中,野生型cas9对应于来自化脓性链球菌(streptococcus[0469]pyogenes)的cas9(ncbi参考序列:nc_002737.2(核苷酸序列如下);和uniprot参考序列:q99zw2(氨基酸序列如下)):[0470]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgaatataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccctattaacgcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaatctcattgctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttcaatgattaaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagtttacatgaacatattgcaaatttagctggtagccctgctattaaaaaaggtattttacagactgtaaaagttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0471][0471](单底线:hnh结构域;双底线:ruvc结构域)[0472]在一些实施方案中,cas9是指来自以下的cas9:溃疡棒状杆菌(corynebacteriumulcerans)(ncbirefs:nc_015683.1,nc_017317.1);白喉棒状杆菌(corynebacteriumdiphtheria)(ncbirefs:nc_016782.1,nc_016786.1);螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1);中间普雷沃菌(prevotellaintermedia)(ncbiref:nc_017861.1);中国台湾螺原体(spiroplasmataiwanense,china)(ncbiref:nc_021846.1);海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1);拟杆菌(belliellabaltica)(ncbiref:nc_018010.1);扭曲冷弯曲菌(psychroflexustorquisi)(ncbiref:nc_018721.1);嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1);无害利斯特菌(listeriainnocua)(ncbiref:np_472073.1);空肠弯曲杆菌(campylobacterjejuni)(ncbiref:yp_002344900.1);脑膜炎双球菌(neisseriameningitidis)(ncbiref:yp_002342100.1)或者是指来自任何其他生物体的cas9。[0473]应知悉,其他cas9蛋白(例如,核酸酶死亡的cas9(dcas9)、cas9切口酶(ncas9)或核酸酶活性的cas9),包括其变体和同源物,处于本公开的范畴内。示例性cas9蛋白包括而不限于下文提供的那些。在一些实施方案中,cas9蛋白是核酸酶死亡的cas9(dcas9)。在一些实施方案中,cas9蛋白是cas9切口酶(ncas9)。在一些实施方案中,cas9蛋白是核酸酶活性的cas9。[0474]在一些实施方案中,cas9结构域是无核酸酶活性的cas9结构域(dcas9)。例如,dcas9结构域可以结合至双螺旋核酸分子(例如,经由grna分子)而不裂解该双螺旋核酸分子的任何链。在一些实施方案中,无核酸酶活性的dcas9结构域包含本文所详述的氨基酸序列的d10x突变和h840x突变,或本文所提供的任何氨基酸序列的相应突变,其中x为任何氨基酸变化。在一些实施方案中,无核酸酶活性的dcas9结构域包含本文所详述的氨基酸序列的d10a突变和h840a突变,或本文所提供的任何氨基酸序列的相应突变。作为一个示例,无核酸酶活性的cas9结构域包含克隆载体pplattet-grna2(登录号bav54124)中详述的氨基酸序列。[0475]示例性的无催化活性的cas9(dcas9)的氨基酸序列如下:[0476]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0477](参见例如,qi等人,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression.”cell.2013;152(5):1173-83,其整体内容通过引用并入本文)。[0478]基于本公开和本领域的知识,其他合适的无核酸酶活性的dcas9结构域对于本领域技术人员将是显而易见的,并且处于本公开的范畴内。此类其他示例性的合适的无核酸酶活性的cas9结构域包括但不限于,d10a/h840a、d10a/d839a/h840a和d10a/d839a/h840a/n863a突变结构域(参见例如,prashant等人,cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.naturebiotechnology.2013;31(9):833-838,其整体内容通过引用并入本文)。[0479]在一些实施方案中,cas9核酸酶具有无活性的(例如,灭活的)dna裂解结构域,换言之,cas9是切口酶,称为“ncas9”蛋白(对于“切口酶”cas9)。经核酸酶灭活的cas9蛋白可以互换地称为“dcas9”蛋白(对于核酸酶“死亡的”cas9)或无催化活性的cas9。用于产生具有无活性的dna裂解结构域的cas9蛋白(或其片段)的方法是已知的(参见例如,jinek等人,science.337:816-821(2012);qi等人,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression”(2013)cell.28;152(5):1173-83,其各自的整体内容通过引用并入本文)。例如,cas9的dna裂解结构域已知包括两个亚结构域,hnh核酸酶亚结构域和ruvc1亚结构域。hnh亚结构域裂解与grna互补的链,而ruvc1亚结构域裂解非互补链。这些亚结构域中的突变可以静默cas9的核酸酶活性。例如,突变d10a和h840a将化脓性链球菌cas9的核酸酶活性完全灭活(jinek等人,science.337:816-821(2012);qi等人,cell.28;152(5):1173-83(2013))。[0480]在一些实施方案中,dcas9结构域包含氨基酸序列,所述氨基酸序列与本文提供的任何一个dcas9结构域为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或99.5%相同。在一些实施方案中,cas9结构域包含氨基酸序列,与本文详述的任何一个氨基酸序列相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,cas9结构域包含氨基酸序列,与本文详述的任何一个氨基酸序列相比,该氨基酸序列具有至少10个、至少15个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少1100个或至少1200个相同的毗邻氨基酸残基。[0481]在一些实施方案中,dcas9部分地或完整地对应于或包含具有一个或多个突变的cas9氨基酸序列,该突变将cas9核酸酶活性灭活。例如,在一些实施方案中,dcas9结构域包含d10a和h840a突变或另一cas9中的相应突变。[0482]在一些实施方案中,dcas9包含dcas9的氨基酸序列(d10a和h840a):[0483][0483][0483](单底线:hnh结构域;双底线:ruvc结构域)。[0484]在一些实施方案中,cas9结构域包含d10a突变,而位于位置840处的残基保持为上文提供的氨基酸序列中的组氨酸,或者位于本文提供的任何氨基酸序列中的相应位置处。[0485]在其他实施方案中,提供了具有除d10a和h840a之外的突变的dcas9变体,该突变例如导致经核酸酶灭活的cas9(dcas9)。举例而言,此类突变包括位于d10和h840处的其他氨基酸置换,或cas9的核酸酶结构域内的其他置换(例如,hnh核酸酶亚结构域和/或ruvc1亚结构域中的置换)。在一些实施方案中,提供了dcas9的变体或同源物,该变体或同源物至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,提供了dcas9的变体,该变体的氨基酸序列更短或更长,短了或长了约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多。[0486]在一些实施方案中,cas9结构域是cas9切口酶。cas9切口酶可以是能够仅裂解双螺旋核酸分子(例如,双螺旋dna分子)的一条链的cas9蛋白。在一些实施方案中,cas9切口酶裂解双螺旋核酸分子的靶标链,意味着cas9切口酶裂解与结合至cas9的grna(例如,sgrna)碱基配对(互补)的链。在一些实施方案中,cas9切口酶包含d10a突变并且具有位于位置840处的组氨酸。在一些实施方案中,cas9切口酶裂解双螺旋核酸分子的非靶标、未经碱基编辑的链,意味着cas9切口酶裂解与结合至cas9的grna(例如,sgrna)不进行碱基配对(互补)的链。在一些实施方案中,cas9切口酶包含h840a突变并且具有位于位置10处的天冬氨酸残基,或相应突变。在一些实施方案中,cas9切口酶包含氨基酸序列,所述氨基酸序列与本文提供的任何一个cas9切口酶为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或99.5%相同。基于本公开和本领域的知识,其他合适的cas9切口酶对于本领域技术人员将是显而易见的,并且处于本公开的范畴内。[0487]示例性的催化cas9切口酶(ncas9)的氨基酸序列如下:[0488]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0489]在一些实施方案中,cas9是指来自古生菌(例如,纳古菌)的cas9,其构建单细胞原核微生物的结构域和界。在一些实施方案中,可编程核苷酸结合蛋白可以是casx或casy蛋白,它们已经在例如burstein等人,"newcrispr-cassystemsfromuncultivatedmicrobes."cellres.2017feb21.doi:10.1038/cr.2017.21中有所描述,该文献的整体内容通过引用并入本文。使用基因组解析的宏基因组学,鉴定了大量crispr-cas系统,包括在古生菌生命结构域中首次报导的cas9。这种趋异cas9蛋白是作为活性crispr-cas系统的一部分在很少研究的纳古菌中被发现的。在细菌中,发现了两种先前未知的系统,crispr-casx和crispr-casy,它们是迄今为止所发现的最紧凑的系统之一。子啊一些实施方案中,在本文所述的碱基编辑器系统中,cas9被替换为casx或casx的变体。子啊一些实施方案中,在本文所述的碱基编辑器系统中,cas9被替换为casy或casy的变体。应知悉,其他rna引导的dna结合蛋白可以用作核酸可编程dna结合蛋白(napdnabp),并且处于本公开的范畴内。[0490]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是casx或casy蛋白。在一些实施方案中,napdnabp是casx蛋白。在一些实施方案中,napdnabp是casy蛋白。在一些实施方案中,napdnabp包含氨基酸序列,所述氨基酸序列与天然出现的casx或casy蛋白为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,可编程核苷酸结合蛋白是天然出现的casx或casy蛋白。在一些实施方案中,可编程核苷酸结合蛋白包含氨基酸序列,所述氨基酸序列与本文描述的任何casx或casy蛋白为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应知悉,来自其他细菌物种的casx和casy也可以根据本公开使用。[0491]示例性casx((uniprot.org/uniprot/f0nn87;uniprot.org/uniprot/f0nh53)tr|f0nn87|f0nn87_sulihcrispr-相关casx蛋白os=冰岛硫化叶菌(菌株hve10/4)gn=sih_0402pe=4sv=1)氨基酸序列如下:[0492]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefyefgrspgmvertrrvklevephyliiaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvriytisdavgqnpttinggfsidltkllekryllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg。[0493]示例性casx(》tr|f0nh53|f0nh53_sulircrispr相关蛋白,casxos=冰岛硫化叶菌(sulfolobusislandicus)(菌株rey15a)gn=sire_0771pe=4sv=1)氨基酸序列如下:[0494]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefykfgrspgmvertrrvklevephylimaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvsiytisdavgqnpttinggfsidltkllekrdllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg。[0495]δ变形菌casx[0496]mekrinkirkklsadnatkpvsrsgpmktllvrvmtddlkkrlekrrkkpevmpqvisnnaannlrmllddytkmkeailqvywqefkddhvglmckfaqpaskkidqnklkpemdekgnlttagfacsqcgqplfvykleqvsekgkaytnyfgrcnvaeheklillaqlkpvkdsdeavtyslgkfgqraldfysihvtkesthpvkplaqiagnryasgpvgkalsdacmgtiasflskyqdiiiehqkvvkgnqkrleslrelagkenleypsvtlppqphtkegvdfayneviarvrmwvnlnlwqklklsrddakpllrlkgfpsfpvverrenevdwwntinevkklidakrdmgrvfwsgvtaekrntilegynylpnendhkkregslenpkkpakrqfgdlllylekkyagdwgkvfdeaweridkkiagltshiereearnaedaqskavltdwlrakasfvlerlkemdekefyaceiqlqkwygdlrgnpfaveaenrvvdisgfsigsdghsiqyrnllawkylengkrefyllmnygkkgrirftdgtdikksgkwqgllygggkakvidltfdpddeqliilplafgtrqgrefiwndllsletgliklangrviektiynkkigrdepalfvaltferrevvdpsnikpvnligvargenipavialtdpegcplpefkdssggptdilrigegykekqraiqaakeveqrraggysrkfasksrnladdmvrnsardlfyhavthdavlvfanlsrgfgrqgkrtfmterqytkmedwltaklayegltsktylsktlaqytsktcsncgftityadmdvmlvrlkktsdgwattlnnkelkaeyqityynrykrqtvekelsaeldrlseesgnndiskwtkgrrdealfllkkrfshrpvqeqfvcldcghevhaaeqaalniarswlflnsnstefksyksgkqpfvgawqafykrrlkevwkpna[0497]示例性casy((ncbi.nlm.nih.gov/protein/apg80656.1)》apg80656.1crispr-相关蛋白casy[未培养的parcubacteria组细菌])氨基酸序列如下:[0498]mskrhprisgvkgyrlhaqrleytgksgamrtikyplysspsggrtvpreivsainddyvglyglsnfddlynaekrneekvysvldfwydcvqygavfsytapgllknvaevrggsyeltktlkgshlydelqidkvikflnkkeisrangsldklkkdiidcfkaeyrerhkdqcnkladdiknakkdagaslgerqkklfrdffgiseqsendkpsftnplnltccllpfdtvnnnrnrgevlfnklkeyaqkldknegslemweyigignsgtafsnflgegflgrlrenkitelkkammditdawrgqeqeeelekrlrilaaltiklrepkfdnhwggyrsdingklsswlqnyinqtvkikedlkghkkdlkkakeminrfgesdtkeeavvssllesiekivpddsaddekpdipaiaiyrrflsdgrltlnrfvqredvqealikerleaekkkkpkkrkkksdaedeketidfkelfphlakplklvpnfygdskrelykkyknaaiytdalwkavekiyksafssslknsffdtdfdkdffikrlqkifsvyrrfntdkwkpivknsfapycdivslaenevlykpkqsrsrksaaidknrvrlpsteniakagialarelsvagfdwkdllkkeeheeyidlielhktalalllavtetqldisaldfvengtvkdfmktrdgnlvlegrflemfsqsivfselrglaglmsrkefitrsaiqtmngkqaellyiphefqsakittpkemsrafldlapaefatslepeslseksllklkqmryyphyfgyeltrtgqgidggvaenalrlekspvkkreikckqyktlgrgqnkivlyvrssyyqtqflewflhrpknvqtdvavsgsflidekkvktrwnydaltvalepvsgservfvsqpftifpeksaeeegqrylgidigeygiaytaleitgdsakildqnfisdpqlktlreevkglkldqrrgtfampstkiarireslvhslrnrihhlalkhkakivyelevsrfeegkqkikkvyatlkkadvyseidadknlqttvwgklavaseisasytsqfcgackklwraemqvdetittqeligtvrvikggtlidaikdfmrppifdendtpfpkyrdfcdkhhiskkmrgnsclficpfcranadadiqasqtiallryvkeekkvedyferfrklknikvlgqmkki。[0499]在一些实施方案中,cas9是脑膜炎双球菌cas9(nmecas9)或其变体。如edraki等人mol.cell.(2019)73(4):714-726中所述的nmecas9特征和pam序列通过引用以其整体并入本文。[0500]例示性的nme1cas9氨基酸序列提供于下:[0501]typeiicrisprrna-guidedendonucleasecas9[neisseriameningitidis]wp_002235162.1[0502][0503]例示性的nme2cas9氨基酸序列提供于下:[0504]ii型crisprrna引导的核酸内切酶cas9[脑膜炎双球菌]wp_002230835.1[0505][0506][0507]cas9核酸酶具有两个功能性核酸内切酶结构域:ruvc和hnh。当靶向结合核酸酶结构域的那些位置以裂解靶标dna的相对链时,cas9经历构型变化。cas9介导的dna裂解的最终结果是靶标dna内(pam序列上游大约3-4个核苷酸)的双链断裂(dsb)。然后,通过两种常规修复途径中的一种修复所得dsb:(1)高效但易错的非同源末端接合(nhej)途径;或(2)低效但高保真同源导向的修复(hdr)途径。[0508]非同源末端接合(nhej)和/或同源导向的修复(hdr)的“效率”可以通过任何传统方法计算。例如,在一些实施方案中,效率可以表达为成功的hdr的百分比。例如,检验员核酸酶测定可用来产生裂解结果,并且产物与底物的比率可以用来计算该百分比。例如,可以使用检验员核酸酶,该核酸酶直接裂解含有新并入的限制序列的作为成功hdr的结果的dna。更多被裂解的底物表明更高百分比的hdr(更高的hdr效率)。作为说明性示例,可以使用以下方程计算hdr的分数(百分比):[(裂解产物)/(底物加上裂解产物)](例如,(b c)/(a b c),其中“a”是dna底物的条带强度,而“b”和“c”是裂解产物)。[0509]在一些实施方案中,效率可以表达为成功的nhej的百分比。例如,t7核酸内切酶i测定可用来产生裂解结果,并且产物与底物的比率可以用来计算该百分比nhej。t7核酸内切酶i裂解误配的异源双螺旋dna,其来自野生型与突变dna链的杂交(nhej在原始段落的位点处产生小的随机插入或缺失(插入缺失(indel))。更多裂解表明更高百分比的nhej(更高的nhej效率)。作为说明性示例,可使用以下方程计算nhej的分数(百分比):(1-(1-(b c)/(a b c))1/2)×100,其中“a”是dna底物的条带强度,而“b”和“c”是裂解产物(ranet.al.,cell.2013sep.12;154(6):1380-9;和ran等人,natprotoc.2013nov.;8(11):2281–2308)。[0510]nhej修复途径是最具活性的修复机制,并且它经常在dsb位点处造成小核苷酸插入或缺失(indel)。nhej介导的dsb修复的随机性具有重要的实践意义,因为表达cas9和grna的细胞群或向导多核苷酸可以导致多样化的突变。在大多数实施方案中,nhej在靶标dna中给出了小插入缺失,其导致氨基酸缺失、插入或框移突变,这些突变导致所靶向基因的开放阅读框(orf)内的提取终止密码子。理想的最终结果是所靶向的基因内的失能性突变。[0511]尽管nhej介导的dsb修复常常中断基因的开放阅读框,当同源导向的修复(hdr)可以用来产生从单个核苷酸变化到大插入如添加萤光团或标签范围内的特异性核苷酸变化。[0512]为了利用hdr进行基因编辑,可以使用grna以及cas9或cas9切口酶将含有所希望序列的dna修复范本递送至感兴趣的细胞类型中。修复范本可以含有所希望的编辑以及位于紧邻靶标的上游或下游的额外同源序列(称为左侧同源臂和右侧同源臂)。每个同源臂的长度可能取决于所引入的变化尺寸,越大的插入需要越长的同源臂。修复范本可以是单链寡核苷酸、双链寡核苷酸或双链dna质粒。即便在表达cas9、grna和外源息服务范本的细胞中,hdr的效率通常也较低(《10%的经修饰的等位基因)。hdr的效率可以通过将细胞同步化而提升,因为hdr在细胞周期的s期和g2期发生。nhej中牵涉的化学或遗传学地抑制基因也可能增加hdr频率。[0513]在一些实施方案中,cas9是经修饰的cas9。贯穿存在部分同源性的基因组范围内,给定的grna靶向序列可能具有额外位点。这些位点称为脱靶,并且在设计grna时需要考虑这些位元点。除了优化grna设计之外,crispr特异性也可应通过对cas9的修饰而得以增加。cas9通过两个核酸酶结构域ruvc和hnh的组合活性而产生双链断裂(dsb)。cas9切口酶,spcas9的d10a突变体,保留一个核酸酶结构域并且产生dna切口而非dsb。该切口酶系统也可以与hdr介导的基因编辑组合以进行特异性基因编辑。[0514]在一些实施方案中,cas9是变体cas9蛋白。变体cas9多肽具有当与野生型cas9蛋白的氨基酸序列比较时相异一个氨基酸(例如,具有缺失、插入、置换、融合)的氨基酸序列。在一些实例中,变体cas9多肽具有降低cas9多肽的核酸酶活性的氨基酸变化(例如,缺失、插入或置换)。例如,在一些实例中,变体cas9多肽具有相应野生型cas9蛋白的低于50%、低于40%、低于30%、低于20%、低于10%、低于5%或低于1%的核酸酶活性。在一些实施方案中,变体cas9蛋白没有实质性的核酸酶活性。当受试cas9蛋白是没有实质性核酸酶活性的变体cas9蛋白时,它可以称为“dcas9”。[0515]在一些实施方案中,变体cas9蛋白具有降低的核酸酶活性。例如,变体cas9蛋白表现出野生型cas9蛋白(例如,野生型cas9蛋白)的低于约20%、低于约15%、低于约10%、低于约5%、低于约1%或低于约0.1%的核酸内切酶活性。[0516]在一些实施方案中,变体cas9蛋白可以裂解向导靶标序列的互补链,但裂解双链向导靶标序列的非互补链的能力降低。例如,变体cas9蛋白可以具有降低ruvc结构域的功能的突变(氨基酸置换)。作为非限制性示例,在一些实施方案中,变体cas9蛋白具有d10a(在氨基酸位置10处的天冬氨酸变为丙氨酸),并且因此可以裂解双链向导靶标序列的互补链但裂解双链向导靶标序列的非互补链的能力降低(因此,当该变体cas9蛋白裂解双链靶标核酸时,导致单链断裂(ssb)而非双链断裂(dsb))(参见例如,jinek等人,science.2012aug.17;337(6096):816-21)。[0517]在一些实施方案中,变体cas9蛋白可以裂解双链向导靶标序列的非互补链,但裂解该向导靶标序列的互补链的能力降低。例如,变体cas9蛋白可以具有降低hnh结构域(ruvc/hnh/ruvc结构域基序)的功能的突变(氨基酸置换)。作为非限制性示例,在一些实施方案中,变体cas9蛋白具有h840a(在氨基酸位置840处的组氨酸变为丙氨酸)突变,并且因此可以裂解该向导靶标序列的非互补链但裂解该向导靶标序列的互补链的能力降低(因此,当该变体cas9蛋白裂解靶标序列时,导致ssb而非dsb)。此类cas9蛋白裂解向导靶标序列(例如,单链向导靶标序列)的能力降低,但保留结合向导靶标序列(例如,单链向导靶标序列)的能力。[0518]在一些实施方案中,变体cas9蛋白裂解双链靶标dna的互补链和非互补链两者的能力降低。作为非限制性示例,在一些实施方案中,变体cas9蛋白荷有d10a和h840a两种突变,使得该多肽裂解双链靶标dna的互补链和非互补链的能力降低。此类cas9蛋白裂解靶标dna(例如,单链靶标dna)的能力降低,但保留结合靶标dna(例如,单链靶标dna)的能力。[0519]作为另一种非限制性示例,在一些实施方案中,变体cas9蛋白荷有w476a和w1126a突变,使得该多肽裂解靶标dna的能力降低。此类cas9蛋白裂解靶标dna(例如,单链靶标dna)的能力降低,但保留结合靶标dna(例如,单链靶标dna)的能力。[0520]作为另一种非限制性示例,在一些实施方案中,变体cas9蛋白荷有p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得该多肽裂解靶标dna的能力降低。此类cas9蛋白裂解靶标dna(例如,单链靶标dna)的能力降低,但保留结合靶标dna(例如,单链靶标dna)的能力。[0521]作为另一种非限制性示例,在一些实施方案中,变体cas9蛋白荷有h840a、w476a和w1126a突变,使得该多肽裂解靶标dna的能力降低。此类cas9蛋白裂解靶标dna(例如,单链靶标dna)的能力降低,但保留结合靶标dna(例如,单链靶标dna)的能力。作为另一种非限制性示例,在一些实施方案中,变体cas9蛋白荷有h840a、d10a、w476a和w1126a突变,使得该多肽裂解靶标dna的能力降低。此类cas9蛋白裂解靶标dna(例如,单链靶标dna)的能力降低,但保留结合靶标dna(例如,单链靶标dna)的能力。在一些实施方案中,变体cas9具有位于cas9hnh结构域中位置840处的经修复的his残基(a840h)。[0522]作为另一种非限制性示例,在一些实施方案中,变体cas9蛋白荷有h840a、p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得该多肽裂解靶标dna的能力降低。此类cas9蛋白裂解靶标dna(例如,单链靶标dna)的能力降低,但保留结合靶标dna(例如,单链靶标dna)的能力。作为另一种非限制性示例,在一些实施方案中,变体cas9蛋白荷d10a、有h840a、p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得该多肽裂解靶标dna的能力降低。此类cas9蛋白裂解靶标dna(例如,单链靶标dna)的能力降低,但保留结合靶标dna(例如,单链靶标dna)的能力。在一些实施方案中,当变体cas9蛋白荷有w476a和w1126a突变时或当变体cas9蛋白荷有p475a、w476a、n477a、d1125a、w1126a和d1127a突变时,变体cas9蛋白不与pam序列有效地结合。因此,在一些此类实施方案中,当在结合方法中使用此类变体cas9蛋白时,该方法不需要pam序列。换言之,在一些实施方案中,当在接恶化方法中使用此类变体cas9蛋白时,该方法可以包括向导rna,但该方法可以在不存在pam序列的情况下执行(因此,由向导rna的靶向链段提供结合的特异性)。可以突变其他残基以实现上述效果(即,将一个或另一股核酸酶部分灭活)。作为非限制性示例,可以改变(即,置换)残基d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987。而且,除丙氨酸置换之外的突变是合适的。[0523]在一些实施方案中,具有降低的催化活性的变体cas9蛋白(例如,当cas9蛋白具有d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987突变例如d10a、g12a、g17a、e762a、h840a、n854a、n863a、h982a、h983a、a984a和/或d986a时),变体cas9蛋白仍可以位元点特异性的方式结合至靶标dna(因为它仍然被向导rna引导至靶标dna序列),只要它保留与向导rna相互作用的能力即可。[0524]在一些实施方案中,变体cas蛋白可以是spcas9、spcas9-vrqr、spcas9-vrer、xcas9(sp)、sacas9、sacas9-kkh、spcas9-mqkser、spcas9-lrkiqk或spcas9-lrvsql。[0525]在一些实施方案中,使用了包括氨基酸置换d1135m、s1136q、g1218k、e1219f、a1322r、d1332a、r1335e和t1337r(spcas9-mqkfraer)并且具有针对改变的pam5'-ngc-3'的特异性的经修饰的spcas9。[0526]作为化脓性链球菌cas9的替代品,可以包括来自cpf1家族的rna引导的核酸内切酶,其在哺乳动物细胞中展示裂解活性。来自普雷沃菌属和弗朗西斯菌属1的crispr(crispr/cpf1)是crispr/cas9系统的dna编辑技术同源物。cpf1是ii类crispr/cas系统的rna引导的核酸内切酶。这一获得性免疫机制见于普雷沃菌属和弗朗西斯菌属细菌中。cpf1基因与crispr基因座缔合,编码使用向导rna来发现并裂解病毒dna的核酸内切酶。cpf1是比cas9更小且更简单的核酸内切酶,克服了crispr/cas9系统的一些限制。不同于cas9核酸酶,cpf1介导的dna裂解结果是具有短3'核苷酸的双链断裂。cpf1的交错裂解模式可以打开定向基因转移的可能性,类似于传统的限制酶克隆,这可能增加基因编辑的效率。与上述cas9变体和直系同源物类似,cpf1也可以扩充能被crispr靶向至富at区域或富at基因组的位元点的数目,该区域或基因组缺乏spcas9所青睐的nggpam位点。cpf1基因座含有混合的α/β结构域、后面跟随一个螺旋区域的ruvc-i、ruvc-ii和锌指样结构域。cpf1蛋白具有类似于cas9的ruvc结构域的ruvc样核酸内切酶结构域。此外,cpf1不具有hnh核酸内切酶结构域,并且cpf1的n端不具有cas9的α-螺旋识别叶。cpf1crispr-cas结构域架构显示,cpf1在功能上是独特的,归类为2类v型crispr系统。cpf1基因座编码cas1、cas2和cas4蛋白,相较于ii型系统,更类似于i型和iii型系统。功能性cpf1不需要反向启动crisprrna(tracrrna),因此,仅需要crispr(crrna)。这有益于基因组编辑,因为cpf1不仅比cas9小,而且它具有较小的sgrna分子(核苷酸数大约为cas9的一半)。与被cas9靶向的富g的pam不同,cpf1-crrna复合物通过鉴定前间隔序列邻近基序5'-ytn-3'来裂解靶标dna或rna。在鉴定pam之后,cpf1引入4或5个核苷酸突出的粘性末端样dna双链断裂。[0527]核碱基编辑器的cas12结构域[0528]典型地,微生物crispr-cas系统被分为1类系统和2类系统。1类系统具有多亚基效应子复合物,而2类系统具有单蛋白效应子。例如,cas9和cpf1是2类效应子,但属于不同的类型(分别为ii型和v型)。除了cpf1之外,2类v型crispr-cas系统还包含cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12i。参见例如,shmakov等人,“discoveryandfunctionalcharacterizationofdiverseclass2crisprcassystems,”mol.cell,2015nov.5;60(3):385-397;makarova等人,“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprjournal,2018,1(5):325-336;和yan等人,“functionallydiversetypevcrispr-cassystems,”science,2019jan.4;363:88-91;各自的整体内容通过引用并入本文。v型cas蛋白含有ruvc(或ruvc样)核酸内切酶结构域。尽管成熟crisprrna(crrna)的产生通常不依赖于tracrrna,但是,例如,cas12b/c2c1需要tracrrna来产生crrna。cas12b/c2c1依赖crrna和tracrrna两者进行dna裂解。[0529]本发明设想的核酸可编程dna结合蛋白包括被归类为2类v型的cas蛋白(cas12蛋白)。2类v型cas蛋白的非限制性示例包括cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12i、其同源物或其经修饰的版本。如本文所用,cas12蛋白也可以称为cas12核酸酶、cas12结构域或cas12蛋白结构域。在一些实施方案中,本发明的cas12蛋白包含被内部融合的蛋白结构域诸如脱氨酶结构域打断的氨基酸序列。[0530]在一些实施方案中,cas12结构域是无核酸酶活性的cas12结构域或cas12切口酶。在一些实施方案中,cas12结构域是核酸酶活性结构域。例如,cas12结构域可以是将双螺旋核酸(例如,双螺旋dna分子)的一条链切口的cas12结构域。在一些实施方案中,cas12结构域包含本文所详述的任何一个氨基酸序列。在一些实施方案中,cas12结构域包含氨基酸序列,所述氨基酸序列与本文详述的任何一个氨基酸序列为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或99.5%相同。在一些实施方案中,cas12结构域包含氨基酸序列,与本文详述的任何一个氨基酸序列相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、dnaseactivity,”science360:436-439(2018))。在一些情况下,cas12蛋白是变体cas12蛋白。(参见,strecker等人,naturecommunications,2019,10(1):art.no.:212)。在一种实施方案中,变体cas12多肽具有当与野生型cas12蛋白的氨基酸序列比较时相异1、2、3、4、5或更多个氨基酸(例如,具有缺失、插入、置换、融合)的氨基酸序列。在一些实例中,变体cas12多肽具有降低cas12多肽的活性的氨基酸变化(例如,缺失、插入或置换)。例如,在一些实例中,变体cas12多肽是cas2b多肽,其具有相应野生型cas9蛋白的低于50%、低于40%、低于30%、低于20%、低于10%、低于5%或低于1%的核酸酶活性。在一些情况下,变体cas12b蛋白没有实质性的切口酶活性。[0535]在一些情况下,变体cas12b蛋白具有降低的切口酶活性。例如,变体cas12蛋白表现出野生型cas12b蛋白的低于约20%、低于约15%、低于约10%、低于约5%、低于约1%或低于约0.1%的切口酶活性。[0536]在一些实施方案中,cas12蛋白包括来自cas12a/cpf1家族的rna引导的核酸内切酶,其在哺乳动物细胞中展示活性。来自普雷沃菌属和弗朗西斯菌属1的crispr(crispr/cpf1)是crispr/cas9系统的dna编辑技术同源物。cpf1是ii类crispr/cas系统的rna引导的核酸内切酶。这一获得性免疫机制见于普雷沃菌属和弗朗西斯菌属细菌中。cpf1基因与crispr基因座缔合,编码使用向导rna来发现并裂解病毒dna的核酸内切酶。cpf1是比cas9更小且更简单的核酸内切酶,克服了crispr/cas9系统的一些限制。不同于cas9核酸酶,cpf1介导的dna裂解结果是具有短3'核苷酸的双链断裂。cpf1的交错裂解模式可以打开定向基因转移的可能性,类似于传统的限制酶克隆,这可能增加基因编辑的效率。与上述cas9变体和直系同源物类似,cpf1也可以扩充能被crispr靶向至富at区域或富at基因组的位元点的数目,该区域或基因组缺乏spcas9所青睐的nggpam位点。cpf1基因座含有混合的α/β结构域、后面跟随一个螺旋区域的ruvc-i、ruvc-ii和锌指样结构域。cpf1蛋白具有类似于cas9的ruvc结构域的ruvc样核酸内切酶结构域。此外,不同于cas9,cpf1不具有hnh核酸内切酶结构域,并且cpf1的n端不具有cas9的α-螺旋识别叶。cpf1crispr-cas结构域架构显示,cpf1在功能上是独特的,归类为2类v型crispr系统。cpf1基因座编码的cas1、cas2和cas4蛋白,相较于ii型系统,更类似于i型和iii型系统。功能性cpf1不需要反向启动crisprrna(tracrrna),因此,仅需要crispr(crrna)。这有益于基因组编辑,因为cpf1不仅比cas9小,而且它具有较小的sgrna分子(核苷酸数大约为cas9的一半)。与被cas9靶向的富g的pam不同,cpf1-crrna复合物通过鉴定前间隔序列邻近基序5'-ytn-3'或5'-tttn-3'来裂解靶标dna或rna。在鉴定pam之后,cpf1引入具有4或5个核苷酸突出的粘性末端样dna双链断裂。[0537]在本发明的一些方面,可以使用一种载体,该载体编码crispr酶,该酶被关于野生型酶突变以使得经突变的crispr酶缺乏裂解含有靶标序列的靶标多核苷酸的一条或两条链的能力。cas12可以指与野生型示例性cas12多肽(例如,来自外村尚芽孢杆菌的cas12)具有至少或至少约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性和/或序列同源性的多肽。cas12可以指与野生型示例性cas12多肽(例如,来自外村尚芽孢杆菌(bhcas12b)、来自芽孢杆菌属v3-13(bvcas12b)和来自嗜酸性脂环酸芽孢杆菌(alicyclobacillusacidiphilus)(aacas12b))具有至多或至多约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性和/或序列同源性的多肽。cas12可以指野生型或经修饰形式的cas12蛋白,其可以包含氨基酸变化诸如缺失、插入、置换、变异、突变、融合、嵌合或其任意组合。[0538]核酸可编程dna结合蛋白[0539]本公开的一些方面提供包含充当核酸可编程dan结合蛋白的结构域的融合蛋白,其可以被用来将蛋白质诸如碱基编辑器引导至特定核酸(例如,dna或rna)序列。在特定实施方案中,融合蛋白包含核酸可编程dna结合蛋白结构域或脱氨酶结构域。核酸可编程dna结合蛋白的非限制性示例包括cas9(例如,dcas9和ncas9)、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12i。cas酶的非限制性示例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas8a、cas8b、cas8c、cas9(也称为csn1或csx12)、cas10、cas10d、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csx11、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、ii型cas效应蛋白、v型cas效应蛋白、vi型cas效应蛋白、carf、ding、其同源物、或其经修饰或工程化的版本。其他核酸可编程dna结合蛋白也处于本公开范畴内,但它们可能没有具体地列在本公开中。参见,例如,makarova等人“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprj.2018oct;1:325-336.doi:10.1089/crispr.2018.0033;yan等人,“functionallydiversetypevcrispr-cassystems”science.2019jan4;363(6422):88-91.doi:10.1126/science.aav7271,其各自的整体内容通过引用并入本文。[0540]具有不同于cas9的pam特异性的核酸可编程dna结合蛋白的一个示例是来自普雷沃菌属和弗朗西丝菌属1(cpf1)的规律成簇间隔短回文重复序列。类似于cas9,cpf1也是2类crispr效应子。已经显示,cpf1介导强劲的dna干扰,其特征与cas9截然不同。cpf1是单个rna引导的核酸内切酶缺乏性tracrrna,并且其利用富t的前间隔序列邻近基序(ttn、tttn或ytn)。此外,cpf1经由交错的dna双链断裂来裂解dna。16种cpf1家族蛋白质中,来自氨基酸球菌属(acidaminococcus)和毛螺菌科(lachnospiraceae)的两种酶显示在人类细胞中具备有效的基因组编辑活性。cpf1蛋白是本领域中已知的,并且先前已经描述在例如yamano等人,“crystalstructureofcpf1incomplexwithguidernaandtargetdna.”cell(165)2016,p.949-962中,其整体内容通过引用并入本文。[0541]可用于本发明组合物和方法中的是无核酸酶活性的cpf1(dcpf1)变体,这些变体可以用作向导核苷酸序列可编程dna结合蛋白结构域。cpf1蛋白具有类似于cas9的ruvc结构域的ruvc样核酸内切酶结构域但不具有hnh核酸内切酶结构域,并且cpf1的n端不具有cas9的α-螺旋识别叶。zetsche等人,cell,163,759-771,2015(其通过引用并入本文)中显示,cpf1的ruvc样结构域的主要责任是裂解两条dna链,并且ruvc样结构域的灭活将cpf1核酸酶活性灭活。例如,对应于新弗朗西斯菌(francisellanovicida)cpf1中的d917a、e1006a或d1255a的突变将cpf1核酸酶活性灭活。在一些实施方案中,本公开的dcpf1包含对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a或d917a/e1006a/d1255a的突变。应理解,任何将cpf1的ruvc结构域灭活的突变,例如,置换突变、缺失或插入,均可根据本公开使用。[0542]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是cpf1蛋白。在一些实施方案中,cpf1蛋白是cpf1切口酶(ncpf1)。在一些实施方案中,cpf1蛋白是无核酸酶活性的cpf1(dcpf1)。在一些实施方案中,cpf1、ncpf1或dcpf1包含氨基酸序列,所述氨基酸序列与本文公开的cpf1序列为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,dcpf1包含氨基酸序列,所述氨基酸序列与本文公开的cpf1序列为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同,并且包含对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a或d917a/e1006a/d1255a的突变。应知悉,来自其他细菌物种的cpf1也可以根据本公开使用。[0543]野生型新弗朗西斯菌cpf1(d917、e1006和d1255加粗并加底线)[0544][0545]新弗朗西斯菌cpf1d917a(a917、e1006和d1255加粗并加底线)[0546][0547]新弗朗西斯菌cpf1e1006a(d917、a1006和d1255加粗并加底线)[0548][0549][0550]新弗朗西斯菌cpf1d1255a(d917、e1006和a1255加粗并加底线)[0551][0552][0553]新弗朗西斯菌cpf1d917a/e1006a(a917、a1006和d1255加粗并加底线)[0554][0555][0556]新弗朗西斯菌cpf1d917a/d1255a(a917、e1006和a1255加粗并加底线)[0557][0558][0559]新弗朗西斯菌cpf1e1006a/d1255a(d917、a1006和a1255加粗并加底线)[0560][0560][0561]新弗朗西斯菌cpf1d917a/e1006a/d1255a(a917、a1006和a1255加粗并加底线)[0562][0563]在一些实施方案中,存在于融合蛋白中的cas9结构域之一可以替换为不需要pam序列的向导核苷酸序列可编程dna结合蛋白结构域。[0564]在一些实施方案中,cas9结构域是来自金黄色葡萄球菌(staphylococcusaureus)的cas9结构域(sacas9)。在一些实施方案中,sacas9结构域是核酸酶活性sacas9、无核酸酶活性的sacas9(sacas9d)或sacas9切口酶(sacas9n)。在一些实施方案中,sacas9包含n579a突变,或本文所提供的任何氨基酸序列中的相应突变。[0565]在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可以结合至具有非经典pam的核酸序列。在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可以结合至具有nngrrt或nngrrtpam的核酸序列。在一些实施方案中,sacas9结构域包含e781x、n967x和r1014x突变中的一种或多种,或本文所提供的任何氨基酸序列的相应突变,其中x是任何氨基酸。在一些实施方案中,sacas9结构域包含e781k、n967k和r1014h突变中的一种或多种,或本文所提供的任何氨基酸序列的相应突变。在一些实施方案中,sacas9结构域包含e781k、n967k或r1014h突变,或本文所提供的任何氨基酸序列的相应突变。[0566]示例性sacas9序列[0567][0568][0569]上述加底线并以粗体显示的残基n579,可以经突变(例如,突变为a579)以得到sacas9切口酶。[0570]示例性sacas9n序列[0571][0572]上述可以从n579突变以得到sacas9切口酶的残基a579加底线并以粗体显示。[0573]示例性sakkhcas9[0574][0575]上述可以从n579突变以得到sacas9切口酶的残基a579加底线并以粗体显示。上述可以从e781、n967和r1014突变以得到sakkhcas9的残基k781、k967和h1014加底线并以斜体显示。[0576]在一些实施方案中,napdnabp是环状高突变的。在下述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,而底线序列表示二分体核定位序列。[0577]cp5(具有msp“ngc”pid和“d10a”切口酶):[0578][0579][0580]在一些实施方案中,核酸可编程dna结合蛋白(napdnabp)是微生物crispr-cas系统的单个效应子。微生物crispr-cas系统的单个效应子包括而不限于,cas9、cpf1、cas12b/c2c1和cas12c/c2c3。典型地,微生物crispr-cas系统被分为1类系统和2类系统。1类系统具有多亚基效应子复合物,而2类系统具有单蛋白效应子。例如,cas9和cpf1是2类效应子。除了cas9和cpf1之外,三种截然不同的2类crispr-cas系统(cas12b/c2c1和cas12c/c2c3)已经由shmakov等人,“discoveryandfunctionalcharacterizationofdiverseclass2crisprcassystems”,mol.cell,2015nov.5;60(3):385-397描述,其整体内容通过引用并入本文。两种系统cas12b/c2c1和cas12c/c2c3的效应子含有与cpf1相关的ruv样核酸内切酶结构域。第三种系统含有具有两个称为hepnrnase的结构域的效应子。不同于通过cas12b/c2c1产生crisprrna,成熟crisprrna的查收讷航能够不依赖于tracrrna。cas12b/c2c1依赖crisprrna和tracrrna两者进行dna裂解。[0581]嗜酸耐热性脂环酸芽孢杆菌(alicyclobaccillusacidoterrastris)cas12b/c2c1(aacc2c1)的晶体结构已经作为具有嵌合单分子向导rna(sgrna)的复合物而有所报导。参见例如,liu等人,“c2c1-sgrnacomplexstructurerevealsrna-guideddnacleavagemechanism”,mol.cell,2017jan.19;65(2):310-322,其整体内容通过引用并入本文。晶体结构已经作为结合至靶标dna的嗜酸耐热性脂环酸芽孢杆菌(alicyclobaccillusacidoterrastris)c2c1三元配合物有所报导。参见例如,yang等人,“pam-dependenttargetdnarecognitionandcleavagebyc2c1crispr-casendonuclease”,cell,2016dec.15;167(7):1814-1828,其整体内容通过引用并入本文。aacc2c1的带有靶标和非靶标dna链的具有催化活性的构象,已经被捕获并独立地定位在单个ruvc催化带中,且cas12b/c2c1介导的裂解导致靶标dna的交错的七核苷酸断裂。cas12b/c2c1三元配合物与先前鉴定的cas9和cpf1配对物之间的结构比较表明了crispr-cas9系统所使用的机制的多样性。[0582]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是cas12b/c2c1或cas12c/c2c3蛋白。在一些实施方案中,napdnabp是cas12b/c2c1蛋白。在一些实施方案中,napdnabp是cas12c/c2c3蛋白。在一些实施方案中,napdnabp包含氨基酸序列,所述氨基酸序列与天然出现的cas12b/c2c1或cas12c/c2c3蛋白为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,napdnabp是天然出现的cas12b/c2c1或cas12c/c2c3蛋白。在一些实施方案中,napdnabp包含氨基酸序列,所述氨基酸序列与本文所提供的任何一种napdnabp序列为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应知悉,来自其他细菌物种的cas12b/c2c1或cas12c/c2c3也可以根据本公开使用。[0583]cas12b/c2c1((uniprot.org/uniprot/t0d7a2#2)sp|t0d7a2|c2c1_aliagcrispr相关核酸内切酶c2c1os=嗜酸耐热性脂环酸芽孢杆菌(alicyclobacillusacido-terrestris)(菌株atcc49025/dsm3922/cip106132/ncimb13137/gd3b)gn=c2c1pe=1sv=1)氨基酸序列如下:[0584]mavksikvklrlddmpeiraglwklhkevnagvryytewlsllrqenlyrrspngdgeqecdktaeeckaellerlrarqvenghrgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekekaetrksadrtadvlraladfglkplmrvytdsemssvewkplrkgqavrtwdrdmfqqaiermmsweswnqrvgqeyaklveqknrfeqknfvgqehlvhlvnqlqqdmkeaspgleskeqtahyvtgralrgsdkvfekwgklapdapfdlydaeiknvqrrntrrfgshdlfaklaepeyqalwredasfltryavynsilrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgerrhairfhkllkvengvarevddvtvpismseqldnllprdpnepialyfrdygaeqhftgefggakiqcrrdqlahmhrrrgardvylnvsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnskgrvpfffpikgndnlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpvdaanhmtpdwreafenelqklkslhgicsdkewmdavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyakdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyaldergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqelinqaqvhdllvgtmyaafssrfdartgapgircrrvparctqehnpepfpwwlnkfvvehtldacplraddliptgegeifvspfsaeegdfhqihadlnaaqnlqqrlwsdfdisqirlrcdwgevdgelvliprltgkrtadsysnkvfytntgvtyyerergkkrrkvfaqeklseeeaellveadeareksvvlmrdpsgiinrgnwtrqkefwsmvnqriegylvkqirsrvplqdsacentgdi。[0585]aaccas12b(嗜酸性脂环酸芽孢杆菌(alicyclobacillusacidiphilus))-wp_067623834[0586]mavksmkvklrldnmpeiraglwklhtevnagvryytewlsllrqenlyrrspngdgeqecyktaeeckaellerlrarqvenghcgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekakaearkstdrtadvlraladfglkplmrvytdsdmssvqwkplrkgqavrtwdrdmfqqaiermmsweswnqrvgeayaklveqksrfeqknfvgqehlvqlvnqlqqdmkeashgleskeqtahyltgralrgsdkvfekwekldpdapfdlydteiknvqrrntrrfgshdlfaklaepkyqalwredasfltryavynsivrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgegrhairfqklltvedgvakevddvtvpismsaqlddllprdphelvalyfqdygaeqhlagefggakiqyrrdqlnhlharrgardvylnlsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnsegrvpfcfpiegnenlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpmdanqmtpdwreafedelqklkslygicgdrewteavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyqkdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyalddergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqellnqaqvhdllvgtmyaafssrfdartgapgircrrvparcareqnpepfpwwlnkfvaehkldgcplraddliptgegeffvspfsaeegdfhqihadlnaaqnlqrrlwsdfdisqirlrcdwgevdgepvliprttgkrtadsygnkvfytktgvtyyerergkkrrkvfaqeelseeeaellveadeareksvvlmrdpsgiinrgdwtrqkefwsmvnqriegylvkqirsrvrlqesacentgdi[0587]bhcas12b(外村尚芽孢杆菌(bacillushisashii))ncbi参考序列:wp_095142515[0588]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkk[0589]名为bvcas12bv4的变体(相对于野生型,具有s893r/k846r/e837g变化)表达如下:5'mrnacap‑‑‑5'utr‑‑‑bhcas12b‑‑‑stop序列‑‑‑3'utr‑‑‑120polya尾部[0590]5'utr:[0591]gggaaataagagagaaaagaagagtaagaagaaatataagagccacc[0592]3'utr(trilink标准utr)[0593]gctggagcctcggtggccatgcttcttgccccttgggcctccccccagcccctcctccccttcctgcacccgtacccccgtggtctttgaataaagtctga[0594]bhcas12b(v4)的核酸序列[0595]atggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgccaccagatccttcatcctgaagatcgagcccaacgaggaagtgaagaaaggcctctggaaaacccacgaggtgctgaaccacggaatcgcctactacatgaatatcctgaagctgatccggcaagaggccatctacgagcaccacgagcaggaccccaagaatcccaagaaggtgtccaaggccgagatccaggccgagctgtgggatttcgtgctgaagatgcagaagtgcaacagcttcacacacgaggtggacaaggacgaggtgttcaacatcctgagagagctgtacgaggaactggtgcccagcagcgtggaaaagaagggcgaagccaaccagctgagcaacaagtttctgtaccctctggtggaccccaacagccagtctggaaagggaacagccagcagcggcagaaagcccagatggtacaacctgaagattgccggcgatccctcctgggaagaagagaagaagaagtgggaagaagataagaaaaaggacccgctggccaagatcctgggcaagctggctgagtacggactgatccctctgttcatcccctacaccgacagcaacgagcccatcgtgaaagaaatcaagtggatggaaaagtcccggaaccagagcgtgcggcggctggataaggacatgttcattcaggccctggaacggttcctgagctgggagagctggaacctgaaagtgaaagaggaatacgagaaggtcgagaaagagtacaagaccctggaagagaggatcaaagaggacatccaggctctgaaggctctggaacagtatgagaaagagcggcaagaacagctgctgcgggacaccctgaacaccaacgagtaccggctgagcaagagaggccttagaggctggcgggaaatcatccagaaatggctgaaaatggacgagaacgagccctccgagaagtacctggaagtgttcaaggactaccagcggaagcaccctagagaggccggcgattacagcgtgtacgagttcctgtccaagaaagagaaccacttcatctggcggaatcaccctgagtacccctacctgtacgccaccttctgcgagatcgacaagaaaaagaaggacgccaagcagcaggccaccttcacactggccgatcctatcaatcaccctctgtgggtccgattcgaggaaagaagcggcagcaacctgaacaagtacagaatcctgaccgagcagctgcacaccgagaagctgaagaaaaagctgacagtgcagctggaccggctgatctaccctacagaatctggcggctgggaagagaagggcaaagtggacattgtgctgctgcccagccggcagttctacaaccagatcttcctggacatcgaggaaaagggcaagcacgccttcacctacaaggatgagagcatcaagttccctctgaagggcacactcggcggagccagagtgcagttcgacagagatcacctgagaagataccctcacaaggtggaaagcggcaacgtgggcagaatctacttcaacatgaccgtgaacatcgagcctacagagtccccagtgtccaagtctctgaagatccaccgggacgacttccccaaggtggtcaacttcaagcccaaagaactgaccgagtggatcaaggacagcaagggcaagaaactgaagtccggcatcgagtccctggaaatcggcctgagagtgatgagcatcgacctgggacagagacaggccgctgccgcctctattttcgaggtggtggatcagaagcccgacatcgaaggcaagctgtttttcccaatcaagggcaccgagctgtatgccgtgcacagagccagcttcaacatcaagctgcccggcgagacactggtcaagagcagagaagtgctgcggaaggccagagaggacaatctgaaactgatgaaccagaagctcaacttcctgcggaacgtgctgcacttccagcagttcgaggacatcaccgagagagagaagcgggtcaccaagtggatcagcagacaagagaacagcgacgtgcccctggtgtaccaggatgagctgatccagatccgcgagctgatgtacaagccttacaaggactgggtcgccttcctgaagcagctccacaagagactggaagtcgagatcggcaaagaagtgaagcactggcggaagtccctgagcgacggaagaaagggcctgtacggcatctccctgaagaacatcgacgagatcgatcggacccggaagttcctgctgagatggtccctgaggcctaccgaacctggcgaagtgcgtagactggaacccggccagagattcgccatcgaccagctgaatcacctgaacgccctgaaagaagatcggctgaagaagatggccaacaccatcatcatgcacgccctgggctactgctacgacgtgcggaagaagaaatggcaggctaagaaccccgcctgccagatcatcctgttcgaggatctgagcaactacaacccctacgaggaaaggtcccgcttcgagaacagcaagctcatgaagtggtccagacgcgagatccccagacaggttgcactgcagggcgagatctatggcctgcaagtgggagaagtgggcgctcagttcagcagcagattccacgccaagacaggcagccctggcatcagatgtagcgtcgtgaccaaagagaagctgcaggacaatcggttcttcaagaatctgcagagagagggcagactgaccctggacaaaatcgccgtgctgaaagagggcgatctgtacccagacaaaggcggcgagaagttcatcagcctgagcaaggatcggaagtgcgtgaccacacacgccgacatcaacgccgctcagaacctgcagaagcggttctggacaagaacccacggcttctacaaggtgtactgcaaggcctaccaggtggacggccagaccgtgtacatccctgagagcaaggaccagaagcagaagatcatcgaagagttcggcgagggctacttcattctgaaggacggggtgtacgaatgggtcaacgccggcaagctgaaaatcaagaagggcagctccaagcagagcagcagcgagctggtggatagcgacatcctgaaagacagcttcgacctggcctccgagctgaaaggcgaaaagctgatgctgtacagggaccccagcggcaatgtgttccccagcgacaaatggatggccgctggcgtgttcttcggaaagctggaacgcatcctgatcagcaagctgaccaaccagtactccatcagcaccatcgaggacgacagcagcaagcagtctatgaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaag[0596]在一些实施方案中,cas12b是bvcas12b。在一些实施方案中,bvcas12b包含下列相对于野生型序列的变化:s893r、k846r和e837g,如下文所提供的bvcas12b示例性序列中的编号。[0597]bvcas12b(芽孢杆菌属种v3-13)ncbi参考序列:wp_101661451.1[0598]mairsiklkmktnsgtdsiylrkalwrthqlinegiayymnlltlyrqeaigdktkeayqaeliniirnqqrnngsseehgsdqeilallrqlyeliipssigesgdanqlgnkflyplvdpnsqsgkgtsnagrkprwkrlkeegnpdwelekkkdeerkakdptvkifdnlnkygllplfplftniqkdiewlplgkrqsvrkwdkdmfiqaierllsweswnrrvadeykqlkektesyykehltggeewiekirkfekernmeleknafapndgyfitsrqirgwdrvyekwsklpesaspeelwkvvaeqqnkmsegfgdpkvfsflanrenrdiwrghseriyhiaaynglqkklsrtkeqatftlpdaiehplwiryespggtnlnlfkleekqkknyyvtlskiiwpseekwiekenieiplapsiqfnrqiklkqhvkgkqeisfsdyssrisldgvlggsriqfnrkyiknhkellgegdigpvffnlvvdvaplqetrngrlqspigkalkvissdfskvidykpkelmdwmntgsasnsfgvasllegmrvmsidmgqrtsasvsifevvkelpkdqeqklfysindtelfaihkrsfllnlpgevvtknnkqqrqerrkkrqfvrsqirmlanvlrletkktpderkkaihklmeivqsydswtasqkevwekelnlltnmaafndeiwkeslvelhhriepyvgqivskwrkglsegrknlagismwnideledtrrlliswskrsrtpgeanrietdepfgssllqhiqnvkddrlkqmanliimtalgfkydkeekdrykrwketypacqiilfenlnrylfnldrsrrensrlmkwahrsiprtvsmqgemfglqvgdvrseyssrfhaktgapgirchalteedlkagsntlkrliedgfineselaylkkgdiipsqggelfvtlskrykkdsdnneltvihadinaaqnlqkrfwqqnsevyrvpcqlarmgedklyipksqtetikkyfgkgsfvknnteqevykweksekmkiktdttfdlqdldgfedisktielaqeqqkkyltmfrdpsgyffnnetwrpqkeywsivnniiksclkkkilsnkvel[0599]在一些实施方案中,cas12b是btcas12b。[0600]btcas12b(热噬淀粉芽孢杆菌(bacillusthermoamylovorans))ncbi参考序列:wp_041902512[0601]matrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdvvfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipftdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekehktleerikediqafksleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkfvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrklvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewgnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsm[0602]在一些实施方案中,napdnabp是指cas12c。在一些实施方案中,cas12c蛋白是cas12c1或cas12c1的变体。在一些实施方案中,cas12蛋白是cas12c2或cas12c2的变体。在一些实施方案中,cas12蛋白是来自嗜油菌属(oleiphilussp.)hi0009的cas12c蛋白(即,ospcas12c)或ospcas12c的变体。这些cas12c分子已经在yan等人,“functionallydiversetypevcrispr-cassystems,”science,2019jan.4;363:88-91中有所描述,其整体内容通过引用并入本文。在一些实施方案中,napdnabp包含氨基酸序列,所述氨基酸序列与天然出现的cas12c1、cas12c2或ospcas12c蛋白为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,napdnabp是天然出现的cas12c1、cas12c2或ospcas12c蛋白。在一些实施方案中,napdnabp包含氨基酸序列,所述氨基酸序列与本文描述的任何cas12c1、cas12c2或ospcas12c蛋白为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应知悉,来自其他细菌物种的cas12c1、cas12c2或ospcas12c也可以根据本公开使用。[0603]cas12c1[0604]mqtkkthlhlisakasrkyrrtiaclsdtakkdlerrkqsgaadpaqelsclktikfklevpegsklpsfdrisqiynaletiekgslsyllfalilsgfrifpnssaaktfassscykndqfasqikeifgemvknfipselesilkkgrrknnkdwteenikrvlnsefgrknsegssalfdsflskfsqelfrkfdswnevnkkyleaaelldsmlasygpfdsvckmigdsdsrnslpdkstiaftnnaeitvdiessvmpymaiaallreyrqskskaapvayvqshltttngnglswffkfgldlirkapvsskqstsdgskslqelfsvpddkldglkfikeacealpeasllcgekgellgyqdfrtsfaghidswvanyvnrlfelielvnqlpesiklpsiltqknhnlvaslglqeaevshslelfeglvknvrqtlkklagidissspneqdikefyafsdvlnrlgsirnqienavqtakkdkidlesaiewkewkklkklpklnglgggvpkqqelldkalesvkqirhyqridferviqwavnehcletvpkflvdaekkkinkesstdfaakenavrfllegigaaargktdsvskaaynwfvvnnflakkdlnryfincqgciykppyskrrslafalrsdnkdtievvwekfetfykeiskeiekfnifsqefqtflhlenlrmklllrriqkpipaeiaffslpqeyydslppnvaflalnqeitpseyitqfnlyssflngnlillrrsrsylrakfswvgnskliyaakearlwkipnaywksdewkmildsnvlvfdkagnvlpaptlkkvceregdlrlfypllrqlphdwcyrnpfvksvgreknvievnkegepkvasalpgslfrligpapfksllddcffnpldkdlrecmlivdqeisqkveaqkveaslesctysiavpiryhleepkvsnqfenvlaidqgeaglayavfslksigeaetkpiavgtiripsirrlihsvstyrkkkqrlqnfkqnydstafimrenvtgdvcakivglmkefnafpvleydvknlesgsrqlsavykavnshflyfkepgrdalrkqlwyggdswtidgieivtrerkedgkegvekivplkvfpgrsvsarftsktcsccgrnvfdwlftekkaktnkkfnvnskgelttadgviqlfeadrskgpkfyarrkertpltkpiakgsysleeierrvrtnlrrapkskqsrdtsqsqyfcvykdcalhfsgmqadenaainigrrfltalrknrrsdfpsnvkisdrlldn[0605]cas12c2[0606]mtkhsiplhafrnsgadarkwkgriallakrgketmrtlqfplemsepeaaainttpfavaynaiegtgkgtlfdywaklhlagfrffpsggaatifrqqavfedaswnaafcqqsgkdwpwlvpsklyerftkaprevakkdgskksieftqenvaneshvslvgasitdktpedqkefflkmagalaekfdswksanedrivamkvideflkseglhlpsleniavkcsvetkpdnatvawhdapmsgvqnlaigvfatcasridniydlnggklskliqesattpnvtalswlfgkgleyfrttdidtimqdfnipasakesikplvesaqaiptmtvlgkknyapfrpnfggkidswianyasrlmllndileqiepgfelpqalldnetlmsgidmtgdelkelieavyawvdaakqglatllgrggnvddavqtfeqfsammdtlngtlntisaryvravemagkdearleklieckfdipkwcksvpklvgisgglpkveeeikvmnaafkdvrarmfvrfeeiaayvaskgagmdvydalekreleqikklksavperahiqayravlhrigravqncsektkqlfsskviemgvfknpshlnnfifnqkgaiyrspfdrsrhapyqlhadkllkndwlellaeisatlmasesteqmedalrlertrlqlqlsglpdweypaslakpdieveiqtalkmqlakdtvtsdvlqrafnlyssvlsgltfkllrrsfslkmrfsvadttqliyvpkvcdwaipkqylqaegeigiaarvvtesspakmvtevemkepkalghfmqqaphdwyfdaslggtqvagrivekgkevgkerklvgyrmrgnsayktvldkslvgntelsqcsmiieipytqtvdadfraqvqaglpkvsinlpvketitasnkdeqmlfdrfvaidlgerglgyavfdaktlelqesghrpikaitnllnrthhyeqrpnqrqkfqakfnvnlselrentvgdvchqinricayynafpvleymvpdrldkqlksvyesvtnryiwsstdahksarvqfwlggetwehpylksakdkkplvlspgrgasgkgtsqtcsccgrnpfdlikdmkprakiavvdgkaklenselklfernleskddmlarrhrneragmeqpltpgnytvdeikallranlrrapknrrtkdttvseyhcvfsdcgktmhadenaavniggkfiadiek[0607]ospcas12c[0608]mtklrhrqkklthdwagskkrevlgsngklqnpllmpvkkgqvtefrkafsayaratkgemtdgrknmfthsfepfktkpslhqceladkayqslhsylpgslahfllsahalgfrifsksgeatafqasskieayesklaselacvdlsiqnltistlfnalttsvrgkgeetsadpliarfytlltgkplsrdtqgperdlaevisrkiassfgtwkemtanplqslqffeeelhaldanvslspafdvlikmndlqgdlknrtivfdpdapvfeynaedpadiiikltaryakeaviknqnvgnyvknaitttnanglgwllnkglsllpvstddellefigvershpschalieliaqleapelfeknvfsdtrsevqgmidsavsnhiarlsssrnslsmdseelerliksfqihtphcslfigaqslsqqleslpealqsgvnsadillgstqymltnslveesiatyqrtlnrinylsgvagqingaikrkaidgekihlpaawselislpfigqpvidvesdlahlknqyqtlsnefdtlisalqknfdlnfnkallnrtqhfeamcrstkknalskpeivsyrdllarltsclyrgslvlrragievlkkhkifesnselrehvherkhfvfvspldrkakkllrltdsrpdllhvideilqhdnlenkdreslwlvrsgyllaglpdqlsssfinlpiitqkgdrrlidliqydqinrdafvmlvtsafksnlsglqyrankqsfvvtrtlspylgsklvyvpkdkdwlvpsqmfegrfadilqsdymvwkdagrlcvidtakhlsnikksvfsseevlaflrelphrtfiqtevrglgvnvdgiafnngdipslktfsncvqvkvsrtntslvqtlnrwfeggkvsppsiqferayykkddqihedaakrkirfqmpatelvhasddagwtpsyllgidpgeygmglslvsinngevldsgfihinslinfaskksnhqtkvvprqqykspyanyleqskdsaagdiahildrliyklnalpvfealsgnsqsaadqvwtkvlsfytwgdndaqnsirkqhwfgashwdikgmlrqpptekkpkpyiafpgsqvssygnsqrcsccgrnpieqlremakdtsikelkirnseiqlfdgtiklfnpdpstvierrrhnlgpsripvadrtfknispsslefkelitivsrsirhspefiakkrgigseyfcaysdcnsslnseanaaanvaqkfqkqlffel[0609]在一些实施方案中,napdnabp是指cas12g、cas12h或cas12i,其已经在例如yan等人,“functionallydiversetypevcrispr-cassystems,”science,2019jan.4;363:88-91中有所描述,各自的整体内容通过引用并入本文。通过汇集超过10tb的序列资料,鉴定了v型cas蛋白的新分类,这些蛋白质显示了与先前表征的v型蛋白质(包括cas12g、cas12h和cas12i)的弱相似性。在一些实施方案中,cas12蛋白是cas12g或cas12g的变体。在一些实施方案中,cas12蛋白是cas12h或cas12h的变体。在一些实施方案中,cas12蛋白是cas12i或cas12i的变体。应知悉,其他rna引导的dna结合蛋白可以用作napdnabp,并且处于本公开的范畴内。在一些实施方案中,napdnabp包含氨基酸序列,所述氨基酸序列与天然出现的cas12g、cas12h或cas12i蛋白为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,napdnabp是天然出现的cas12g、cas12h或cas12i蛋白。在一些实施方案中,napdnabp包含氨基酸序列,所述氨基酸序列与本文描述的任何cas12g、cas12h或cas12i蛋白为至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应知悉,来自其他细菌物种的cas12g、cas12h或cas12i也可以根据本公开使用。在一些实施方案中,cas12i蛋白是cas12i1或cas12i2。[0610]cas12g1[0611]maqasstpavsprprpryreertlvrkllprpgqskqefrenvkklrkaflqfnadvsgvcqwaiqfrprygkpaeptetfwkfflepetslppndsrspefrrlqafeaaagingaaalddpaftnelrdsilavasrpktkeaqrlfsrlkdyqpahrmilakvaaewiesryrrahqnwernyeewkkekqeweqnhpeltpeireafnqifqqlevkekrvricpaarllqnkdncqyagknkhsvlcnqfnefkknhlqgkaikffykdaekylrcglqslkpnvqgpfredwnkylrymnlkeetlrgknggrlphcknlgqecefnphtalckqyqqqlssrpdlvqhdelyrkwrreywreprkpvfrypsvkrhsiakifgenyfqadfknsvvglrldsmpagqylefafapwprnyrpqpgeteissvhlhfvgtrprigfrfrvphkrsrfdctqeeldelrsrtfprkaqdqkfleaarkrlletfpgnaeqelrllavdlgtdsaraaffigktfqqafplkivkieklyeqwpnqkqagdrrdasskqprpglsrdhvgrhlqkmraqaseiaqkrqeltgtpapetttdqaakkatlqpfdlrgltvhtarmirdwarlnarqiiqlaeenqvdlivleslrgfrppgyenldqekkrrvaffahgrirrkvtekavergmrvvtvpylasskvcaecrkkqkdnkqweknkkrglfkcegcgsqaqvdenaarvlgrvfwgeielptaip[0612]cas12h1[0613]mkvheiprsqllkikqyegsfvewyrdlqedrkkfasllfrwaafgyaareddgatyispsqallerrlllgdaedvaikfldvlfkggapssscyslfyedfalrdkakysgakrefieglatmpldkiierirqdeqlskipaeewlilgaeyspeeiweqvaprivnvdrslgkqlrerlgikcrrphdagyckilmevvarqlrshnetyheylnqthemktkvannltnefdlvcefaevleeknyglgwyvlwqgvkqalkeqkkptkiqiavdqlrqpkfaglltakwralkgaydtwklkkrlekrkafpympnwdndyqipvgltglgvftlevkrtevvvdlkehgklfcshshyfgdltaekhpsryhlkfrhklklrkrdsrveptigpwieaalreitiqkkpngvfylglpyalshgidnfqiakrffsaakpdkevinglpsemvvgaadlnlsnivapvkarigkglegplhaldygygelidgpkiltpdgprcgelislkrdiveiksaikefkacqregltmseetttwlsevespsdsprcmiqsriadtsrrlnsfkyqmnkegyqdlaealrlldamdsynsllesyqrmhlspgeqspkeakfdtkrasfrdllrrrvahtiveyfddcdivffedldgpsdsdsrnnalvkllsprtlllyirqalekrgigmvevakdgtsqnnpisghvgwrnkqnkseiyfyedkellvmdadevgamnilcrglnhsvcpysfvtkapekkndekkegdygkrvkrflkdrygssnvrflvasmgfvtvttkrpkdalvgkrlyyhggelvthdlhnrmkdeikylvekevlarrvslsdstiksyksfahv[0614]cas12i1[0615]msnkeknasetrkayttkmiprshdrmkllgnfmdylmdgtpiffelwnqfgggidrdiisgtankdkisddlllavnwfkvmpinskpqgvspsnlanlfqqysgsepdiqaqeyfasnfdtekhqwkdmrveyerllaelqlsrsdmhhdlklmykekciglslstahyitsvmfgtgaknnrqtkhqfyskviqlleestqinsveqlasiilkagdcdsyrklrircsrkgatpsilkivqdyelgtnhddevnvpslianlkeklgrfeyecewkcmekikaflaskvgpyylgsysamlenalspikgmttknckfvlkqidakndikyenepfgkivegffdspyfesdtnvkwvlhphhigesniktlwedlnaihskyeediaslsedkkekrikvyqgdvcqtintyceevgkeaktplvqllrylysrkddiavdkiidgitflskkhkvekqkinpviqkypsfnfgnnskllgkiispkdklkhnlkcnrnqvdnyiwieikvlntktmrwekhhyalsstrfleevyypatsenppdalaarfrtktngyegkpalsaeqieqirsapvglrkvkkrqmrleaarqqnllprytwgkdfninickrgnnfevtlatkvkkkkeknykvvlgydanivrkntyaaieahangdgvidyndlpvkpiesgfvtvesqvrdksydqlsyngvkllyckphvesrrsflekyrngtmkdnrgnniqidfmkdfeaiaddetslyyfnmkyckllqssirnhssqakeyreeifellrdgklsvlklsslsnlsfvmfkvaksligtyfghllkkpknsksdvkappitdedkqkadpemfalrlaleekrlnkvkskkeviankivakalelrdkygpvlikgenisdttkkgkksstnsflmdwlargvankvkemvmmhqglefvevnpnftshqdpfvhknpentfrarysrctpselteknrkeilsflsdkpskrptnayynegamaflatyglkkndvlgvslekfkqimanilhqrsedqllfpsrggmfylatykldadatsvnwngkqfwvcnadlvaaynvglvdiqkdfkkk[0616]cas12i2[0617]mssaiksyksvlrpnerknqllkstiqcledgsafffkmlqglfggitpeivrfsteqekqqqdialwcavnwfrpvsqdslthtiasdnlvekfeeyyggtasdaikqyfsasigesyywndcrqqyydlcrelgvevsdlthdleilcrekclavatesnqnnsiisvlfgtgekedrsvklritkkileaisnlkeipknvapiqeiilnvakatketfrqvyagnlgapstlekfiakdgqkefdlkklqtdlkkvirgkskerdwccqeelrsyveqntiqydlwawgemfnkahtalkikstrnynfakqrleqfkeiqslnnllvvkklndffdseffsgeetyticvhhlggkdlsklykaweddpadpenaivvlcddlknnfkkepirnilryiftirqecsaqdilaaakynqqldryksqkanpsvlgnqgftwtnavilpekaqrndrpnsldlriwlylklrhpdgrwkkhhipfydtrffqeiyaagnspvdtcqfrtprfgyhlpkltdqtairvnkkhvkaaktearirlaiqqgtlpvsnlkiteisatinskgqvripvkfdvgrqkgtlqigdrfcgydqnqtashayslwevvkegqyhkelgcfvrfissgdivsitenrgnqfdqlsyeglaypqyadwrkkaskfvslwqitkknkkkeivtveakekfdaickyqprlykfnkeyayllrdivrgkslvelqqirqeifrfieqdcgvtrlgslslstletvkavkgiiysyfstalnasknnpisdeqrkefdpelfalleklelirtrkkkqkveriansliqtclennikfirgegdlsttnnatkkkansrsmdwlargvfnkirqlapmhnitlfgcgslytshqdplvhrnpdkamkcrwaaipvkdigdwvlrklsqnlraknigtgeyyhqgvkeflshyelqdleeellkwrsdrksnipcwvlqnrlaeklgnkeavvyipvrggriyfathkvatgavsivfdqkqvwvcnadhvaaanialtvkgigeqssdeenpdgsriklqlts[0618]碱基编辑器的代表性核酸和蛋白质序列如下:[0619]位于p153的bhcas12bggsggs-abe8-xten20[0620][0621][0622][0623]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessgsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0624]位于k255的bhcas12bggsggs-abe8-xten20[0625][0626][0627][0628]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessgediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0629]位于d306的bhcas12b[0630][0631][0632][0633]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessgenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0634]位于d980的bhcas12bggsggs-abe8-xten20[0635][0636][0637][0638][0639]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessggqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0640]位于k1019的bhcas12bggsggs-abe8-xten20[0641][0642][0643][0644][0645]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagkggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessglkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0646]对于上述序列,kozak序列加粗并加底线;标记n端核定位元信号(nls);小写字母表示gggsggs连接子;标记编码abe8的序列,未做修饰的序列编码bhcas12b;双底线表示xten20连接子;单底线表示c端nls;表示gs连接子;并且斜体字母表示3x血细胞凝集素(ha)标签的编码序列。[0647]向导多核苷酸[0648]在一种实施方案中,向导多核苷酸是向导rna。如本文所用,术语“向导多核苷酸”是指多核苷酸,其可以对于靶标序列为特异性的并且可与多核苷酸可编程核苷酸结合结构域蛋白(例如,cas9或cpf1)形成复合物。在一种实施方案中,向导多核苷酸是向导rna。如本文所用,术语“向导rna(grna)”及其语法等效物可以指rna,其可以是对于靶标dna为特异性的并且可以与cas蛋白形成复合物。rna/cas复合物可以辅助将cas蛋白“引导”至靶标dna。cas9/crrna/tracrrna核酸内切溶解地裂解与间隔序列互补的线性或环状dsdna靶标。不与crrna互补的靶标链首先被核酸内切溶解地切割,然后被3'-5'核酸外切溶解地修剪。本质上中,dna结合和裂解通常需要蛋白质和两种rna。但是,单向导rna(“sgrna”,或简称为“grna”)可以工程化改造,以将crrna和tracrrna两者的各个方面合并到单个rna物种中。参见例如,jinekm.等人,science337:816-821(2012),其整体内容通过引用并入本文。cas9识别crispr重复序列中的短基序(pam或前间隔序列邻近基序)以帮助区分自我与非自我。cas9核酸酶序列和结构是本领域技术人员已知的(参见例如,“completegenomesequenceofanm1strainofstreptococcuspyogenes.”ferretti,j.j.等人,natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.等人,nature471:602-607(2011);和“programmabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.etal,science337:816-821(2012),其各自的整体内容通过引用并入本文)。cas9直接同源物已经在多种物种中描述,包括但不限于化脓性链球菌和嗜热链球菌。基于本公开,其他合适的cas9核酸酶和序列对于本领域技术人员可以是显而易见的,并且此类cas9核酸酶和序列包括来自生物体的cas9序列和以下文献中公开的基因座:chylinski,rhun,andcharpentier,“thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737;其整体内容通过引用并入本文。在一些实施方案中,cas9核酸酶具有无活性的(例如,灭活的)dna裂解结构域,换言之,cas9是切口酶。[0649]在一些实施方案中,向导多核苷酸是至少一个单向导rna(“sgrna”或“grna”)。在一些实施方案中,向导多核苷酸是至少一个tracrrna。在一些实施方案中,向导多核苷酸不需要pam序列将多核苷酸可编程dna结合结构域(例如,cas9或cpf1)引导至靶标核苷酸序列。[0650]本文所公开的碱基编辑器的多核苷酸可编程核苷酸结合结构域(例如,衍生自crispr的结构域)可以通过与向导多核苷酸缔合而识别靶标多核苷酸序列。向导多核苷酸(例如,grna)典型是单链的,并且可以程式设计以位点特异性地结合(即,经由互补碱基配对)至多核苷酸的靶标序列,从而将与该向导核酸协同作用的碱基编辑器导向至该靶标序列。向导多核苷酸可以是dna。向导多核苷酸可以是rna。在一些实施方案中,向导多核苷酸包含天然核苷酸(例如,腺苷)。在一些实施方案中,向导多核苷酸包含非天然(非自然)核苷酸(例如,肽核酸或核苷酸类似物)。在一些实施方案中,向导核酸序列的靶向区域可以是至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸的长度。向导核酸的靶向区域可以是10-30个核苷酸之间的长度,或15-25个核苷酸之间的长度,或15-20个核苷酸之间的长度。[0651]在一些实施方案中,向导多核苷酸包含两个或更多个个体多核苷酸,这些多核苷的可以经由例如互补性碱基配对(例如,双向导多核苷酸)而彼此相互作用。例如,向导多核苷酸可以包含crisprrna(crrna)和反向启动crisprrna(tracrrna)。例如,向导多核苷酸可以包含一个或多个反向启动crisprrna(tracrrna)。[0652]在ii型crispr系统中,通过crispr蛋白(例如,cas9)靶向核酸典型需要在包含识别靶标序列的序列的第一rna分子(crrna)与包含重复序列的第二rna分子(trrna)之间进行互补性碱基配对,这形成了稳定化向导rna-crispr蛋白复合物的支架区域。此类双向导rna系统可以用作向导多核苷酸来将本文所公开的碱基编辑器导向至靶标多核苷酸序列。[0653]在一些实施方案中,本文所提供的碱基编辑器利用单向导多核苷酸(例如,grna)。在一些实施方案中,本文所提供的碱基编辑器利用双向导多核苷酸(例如,双grna)。在一些实施方案中,本文所提供的碱基编辑器利用一个或多个向导多核苷酸(例如,多grna)。在一些实施方案中,将单向导多核苷酸用于不同的本文所述碱基编辑器中。例如,单向导多核苷酸可用于胞苷碱基编辑器和腺苷碱基编辑器。[0654]在其他实施方案中,向导多核苷酸可以在单分子(即,单分子向导核酸)中包含核酸的多核苷酸靶向部分和核酸的支架部分两者。例如,单分子向导多核苷酸可以是单向导rna(sgrna或grna)。本文中,术语向导多核苷酸设想了能够与碱基编辑器相互作用并将其导向至靶标多核苷酸序列的任何单、双或多分子核酸。[0655]典型地,向导多核苷酸(例如,crrna/trrna复合物或grna)包含包括能够识别并结合至靶标多核苷酸序列的序列的“多核苷酸靶向链段”和将碱基编辑器的多核苷酸可编程核苷酸结合结构域内的向导多核苷酸“蛋白质结合链段”。在一些实施方案中,向导多核苷酸的多核苷酸靶向链段识别并结合至dna多核苷酸,从而促进dna内碱基的编辑。在其他实施方案中,向导多核苷酸的多核苷酸靶向链段识别并结合至rna多核苷酸,从而促进rna内碱基的编辑。本文中,“链段”是指分子的节段或区域,例如,向导多核苷酸中的核苷酸的连续延伸。链段也可以指复合物的区域/节段,使得链段可以包含超过一个分子的区域。例如,若向导多核苷酸包含多个核酸分子,则蛋白结合链段可以包括多个独立分子的全部或部分,这些独立分子例如沿着互补性区域杂交。在一些实施方案中,包含两个独立分子的靶向dna的rna的蛋白结合链段可以包含:(i)长度为100个碱基对的第一rna分子的碱基对40-75;和(ii)长度为50个碱基对的第一rna分子的碱基对10-25。除非在特定语境中具体地另做定义,否则“链段”的定义不限于具体数目的总碱基对,不限于来自给定rna分子的任何特定数目的碱基对,不限于复合物内的特定数目的独立分子,并且可以包括任何总长度的rna分子的区域并且可以包括与其他分子具有互补性的区域。[0656]向导rna或向导多核苷酸可以包含两个或更多个rna,例如,crisprrna(crrna)和反向启动crrna(tracrrna)。向导rna或向导多核苷酸有时可以包含单链rna,或通过融合crrna与tracrrna的部分(例如,功能性部分)形成的单向导rna(sgrna)。向导rna或向导多核苷酸也可以是包含crrna和tracrrna的双rna。此外,crrna可以与靶标dna杂交。[0657]如上所述,向导rna或向导多核苷酸可以是表达产物。例如,编码向导rna的dna可以是包含编码向导rna的序列的载体。可以通过用分离的向导rna或包含编码向导rna的序列和启动子的质粒dna转染细胞而将向导rna或向导多核苷酸转移到该细胞内。也可以通过其他途径诸如使用病毒介导的基因递送将向导rna或向导多核苷酸转移到细胞内。[0658]向导rna或向导多核苷酸可以是经分离的。例如,可以将向导rna以经分离的rna的形式转移到细胞或生物体内。向导rna可以使用本领域中已知的体外转录系统通过体外转录制备。可以将向导rna以经分离的rna的形式而不是以包含向导rna的编码序列的质粒的形式转移到细胞内。[0659]向导rna或向导多核苷酸可以包含三个区域:位于5'末端的可以与染色体序列中的靶标位元点互补的第一区域、可以形成茎环结构的第二内部区域、和可以为单链的第三3'区域。每个向导rna的第一区域也可以是不同的,使得每个向导rna将融合蛋白引导至特定的靶标位点。再者,在全部向导rna中,每个向导rna的第二区域和第三区域可以是相同的。[0660]向导rna或向导多核苷酸的第一区域可以与位于染色体序列中的靶标位点处的序列互补,适当向导rna的第一区域可以与靶标位元点进行碱基配对。在一些实施方案中,向导rna的第一区域可以包含或包含约10个核苷酸至25个核苷酸(即,10个核苷酸至核苷酸;或约10个核苷酸至约25个核苷酸;或10个核苷酸至约25个核苷酸;或约10个核苷酸至25个核苷酸)或更多。例如,在向导rna的第一区域与染色体序列的靶标位点之间进行碱基配对的区域可以是或可以是约10、11、12、13、14、15、16、17、18、19、20、22、23、24、25或更多个核苷酸的长度。有时,向导rna的第一区域可以是或可以是约19、20或21个核苷酸的长度。[0661]向导rna或向导多核苷酸也可以包含形成二级结构的第二区域。例如,由向导rna形成的二级结构可以包含茎(或发夹)和环。环和茎的长度可变。例如,环的长度范围可以是或可以是约3至10个核苷酸,并且茎的长度范围可以是或可以是约6至20个碱基对。茎可以包含一个或多个1至10个或约10个核苷酸的凸起部。第二区域的总体长度可以在或可以在约16至60个核苷酸的长度范围内。例如,环可以是或可以是约4个核苷酸的长度,并且茎可以是或可以是约12个碱基对。[0662]向导rna或向导多核苷酸也可以包含位于3'末端的第三区域,该第三区域可以基本上是单链的。例如,第三区域有时不与感兴趣的细胞中的任何染色体序列互补,而有时不与向导rna的剩余部分互补。再者,第三区域的长度可变。第三区域可以是超过或是超过约4个核苷酸的长度。例如,第三区域的总体长度可以在或可以在约5至60个核苷酸的长度范围内。[0663]向导rna或向导多核苷酸可以靶向基因靶标的任何外显子或内含子。在一些实施方案中,向导可以靶向基因的外显子1或2;在其他实施方案中,向导可以靶向基因的外显子3或4。组合物可以包含多个全部靶向相同外显子的rna,或者在一些实施方案中,包含多个可以靶向不同外显子的rna。基因的外显子和内含子可以被靶向。[0664]向导rna或向导多核苷酸可以靶向约20个核苷酸的核酸序列。靶标核酸可以少于约20个核苷酸。靶标核酸可以是至少约5、10、15、16、17、18、19、20、21、22、23、24、25、30个核苷酸或1-100个核苷酸之间任一处的长度。靶标核酸可以是至多约5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50个核苷酸或1-100个核苷酸之间任一处的长度。靶标核酸序列可以是紧邻pam的5'第一个核苷酸的约20个碱基。向导rna可以靶向核酸序列。靶标核酸可以是至少约1-10、1-20、1-30、1-40、1-50、1-60、1-70、1-80、1-90或1-100个核苷酸。[0665]向导多核苷酸,例如,向导rna,可以指能与细胞基因组中的另一核酸(例如,靶标核酸或前间隔序列)杂交的核酸。向导多核苷酸可以是rna。向导多核苷酸可以是dna。向导多核苷酸可以被程式设计或设计为位点特异性地结合至核酸序列。向导多核苷酸可以包含一个多核苷酸链并且可以称为单向导多核苷酸。向导多核苷酸可以包含两个多核苷酸链并且可以称为双向导多核苷酸。向导rna可以作为rna分子被引入细胞或胚胎内。例如,rna分子可以在体外被转录和/或化学合成。rna可以从合成的dna分子(例如,基因片段)转录。然后,向导rna可以作为rna分子被引入细胞或胚胎中。也可以将向导rna以非rna核酸分子(例如,dna分子)的形式引入细胞或胚胎内。例如,可以将编码向导rna的dna可操作地连接至启动子控制序列,以在感兴趣的细胞或胚胎内进行向导rna的表达。可以将rna编码序列可操作地连接至被rna聚合酶iii(poliii)识别的启动子序列。可用于表达向导rna的质粒载体包括但不限于,px330载体和px333载体。在一些实施方案中,质粒载体(例如,px333载体)可以包含至少两个编码向导rna的dna序列。[0666]用于选择、设计和验证向导多核苷酸(例如,向导rna和靶向序列)的方法在本文中描述并且是本领域技术人员已知的。例如,为了最小化核碱基编辑器系统中脱氨酶结构域(例如,aid结构域)的潜在底物混杂性的影响,可以最小化可能无意中被脱氨反应所靶向的残基(例如,可能潜在地驻留在靶标核酸基因座内的ssdna上的脱靶c残基)的数目。此外,可以使用软体工具来优化对应于靶标核酸序列的grna,例如,以最小化跨基因座的总脱靶活性。例如,对于使用化脓性链球菌cas9的每种可能的靶向结构域选择,可以跨基因组鉴定全部脱靶序列(先前选定的pam,例如,nag或ngg),该序列含有多达某一数目(例如,1、2、3、4、5、6、7、8、9或10个)的误配碱基对。可以鉴定与靶标位点互补的grna的第一区域,并且可以根据预测的总脱靶得分将全部第一区域(例如,crrna)排序;排序靠前的靶向结构域代表那些可能具有最大上靶活性和最小脱靶活性的结构域。可以使用本领域已知和/或如本文详述的方法对候选grna进行功能性评估。[0667]作为非限制性示例,用于与cas9合用的向导rna的crrna中的靶标dna杂交序列可以使用dna序列检索演算法鉴定,可以使用自订grna设计软体基于公共工具cas-offinder完成grna设计,如baes.,parkj.,&kimj.-s.cas-offinder:afastandversatilealgorithmthatsearchesforpotentialoff-targetsitesofcas9rna-guidedendonucleases.bioinformatics30,1473-1475(2014)中所述。这一软体在计算向导的全基因组脱靶倾向性之后对向导进行评分。典型地,对于17到24长度的向导范围,考虑从完美匹配到存在7个误配的匹配范围。一旦通过计算确定了脱靶位点,就计算每个向导的聚集得分并使用web介面将其汇总到表格输出中。除了鉴定邻近pam序列的潜在靶标位元点之外,该软体还鉴定全部pam邻近序列,这些序列与所选择的靶标位点相异1、2、3或超过3个核苷酸。可以使用公共可获得的总结例如repeatmasker程式,获得靶标核酸序列(例如,靶标基因)的基因组dna序列和重复元件。repeatmasker检索输入dna序列的重复元件和低复杂度区域。输出是给定查询序列中存在的重复序列的详细注释。[0668]鉴定之后,可以将向导rna(例如,crrna)的第一区域基于以下各项排序为几个层次:它们与靶标位点的距离、它们的正交性和用于与相关pam序列密切匹配的5'核苷酸(例如,基于对含有相关pam(例如,对于化脓性链球菌是nggpam,对于金黄色葡萄球菌是nngrrt或nngrrvpam)的人类基因组中的密切匹配的鉴定的5'g)的存在。如本文欧勇,正交性是指人类基因组中含有最低数目的与靶标序列的误配的序列的数目。例如,“高水准的正交性”或“良好正交性”可以指20聚体靶向结构域,该结构域除了预期靶标之外没有人类基因组中的相同序列,也不存在任何含有靶标序列中一个或两个误配的序列。可以选择具有良好正交性的靶向结构域以最小化脱靶dna裂解。[0669]在一些实施方案中,可以使用报告系统来检测碱基编辑活性和测试候选向导多核苷酸。在一些实施方案中,报告系统可以包含基于报告基因的测定,其中碱基编辑活性导致该报告基因的表达。例如,报告系统可以包括包含经灭活的启动密码子(例如,在范本链上的3'-tac-5'到3'-cac-5'的突变)的报告基因。当对靶标c成功脱氨基后,相应mrna将被转录为5'-aug-3'而不是5'-gug-3',使得报告基因能够翻译。合适的报告基因对于本领域技术人员将是显而易见的。报告基因的非限制性示例包括编码绿色萤光蛋白(gfp)、红色萤光蛋白(rfp)、萤光素酶、分泌的碱性磷酸酯酶(seap)的基因,或其表达可检测并且对于本领域技术人员显而易见的任何其他基因。报告系统可用来测试多种不同的grna,例如,以便确定各脱氨酶将以靶标dna序列的哪个残基为靶标。也可以测试靶向非范本链的sgrna,以便评估特定碱基编辑蛋白(例如,cas9脱氨酶融合蛋白)的脱靶效应。在一些实施方案中,可以设计此类grna,使得突变的起始密码子将不与grna进行碱基配对。向导多核苷酸可以包含标准核糖核苷酸、经修饰的核糖核苷酸(例如,假尿苷)、核糖核苷酸异构体和/或核糖核苷酸类似物。在一些实施方案中,向导多核苷酸可以包含至少一个可检测的标记物。可检测的表及其可以是萤光团(例如,fam、tmr、cy3、cy5、德克萨斯红、俄勒冈绿、alexafluors、halo标签或合适的萤光染料)、检测标签(例如,生物素、地高辛等)、量子点或金粒子。[0670]向导多核苷酸可以互相合成、酶促合成或经其组合合成。例如,向导rna可以使用基于亚磷酰胺的标准固相合成方法合成。作为另一种选择,向导rna可以通过将编码向导rna的dna可操作地连接至被噬菌体rna聚合酶识别的启动子控制序列而体外合成。合适的是具体启动子序列的示例包括t7、t3、sp6启动子序列或其变种。在其中向导rna包含两个独立分子(例如,crrna和tracrrna)的实施方案中,crrna可以化学地合成,而tracrrna可以酶促地合成。[0671]在一些实施方案中,碱基编辑器系统可以包含多个向导多核苷酸,例如,grna。例如,grna可以靶向碱基编辑器系统中的一个或多个靶标基因座(例如,至少1个grna、至少2个grna、至少5个grna、至少10个grna、至少20个grna、至少30grna、至少50个grna)。多个grna序列可以随机排列,并且优选通过直接重复序列分隔。[0672]编码向导rna或向导多核苷酸的dna序列也可以是载体的一部分。再者,载体可以包含额外的表达控制序列(例如,增强子序列、kozak序列、聚腺苷酸化序列、转录终止序列等)、可选择的标志物序列(例如,gfp或抗生素耐药基因诸如嘌呤霉素)、复制起点等。编码向导rna的dna分子可以是线性的。编码向导rna或向导多核苷酸的dna分子也可以是环状的。[0673]在一些实施方案中,碱基编辑器系统的一个或多个组分可以由dna序列编码。此类dna序列可以被一起或单独地引入表达系统(例如,细胞)中。例如,编码多核苷酸可编程核苷酸结合结构域和向导rna的dna序列可以被引入细胞中,每个dna序列可以是独立分子(例如,一个含有多核苷酸可编程核苷酸结合结构域编码序列的载体和含有向导rna编码序列的第二载体)的一部分,或者两者都可以是同一分子(例如,一个含有用于多核苷酸可编程核苷酸结合结构域和向导rna两者的编码(和调节)序列的载体)的一部分。[0674]向导多核苷酸可以包含一种或多种修饰以向核酸提供新的或增强的特征。向导多核苷酸可以包含核酸亲和性标签。向导多核苷酸可以包含合成核苷酸、合成核苷酸类似物、核苷酸衍生物和/或经修饰的核苷酸。[0675]在一些实施方案中,grna或向导多核苷酸可以包含修饰。修饰可以在grna或向导多核苷酸的任意位置处做出。可以对单grna或向导多核苷酸做出超过一种修饰。grna或向导多核苷酸可以在修饰后经历品质控制。在一些实施方案中,品质控制可以包括page、hplc、ms或其任何组合。[0676]grna或向导多核苷酸的修饰可以是置换、插入、缺失、化学修饰、物理修饰、稳定化、纯化或其任何组合。[0677]grna或向导多核苷酸也可以通过以下进行修饰:5'腺苷酸化、5'鸟苷-三磷酸酯封端、5'n7-甲基鸟苷-三磷酸酯封端、5'三磷酸酯封端、3'磷酸酯、3'硫代磷酸酯、5'粒氨酸酯、5'硫代磷酸酯、cis-syn胸腺嘧啶二聚体、三聚体、c12间隔序列、c3间隔序列、c6间隔序列、dspacer、pc间隔序列、rspacer、间隔序列18、间隔序列9、3'-3'修饰、5'-5'修饰、无碱基、吖啶、偶氮苯、生物素、生物素bb、生物素teg、胆甾醇基teg、脱硫生物素teg、dnpteg、dnp-x、dota、dt-生物素、双生物素、pc生物素、补骨脂素c2、补骨脂素c6、tina、3'dabcyl、黑洞淬灭剂1、黑洞淬灭剂2、dabcylse、dt-dabcyl、irdyeqc-1、qsy-21、qsy-35、qsy-7、qsy-9、羧基连接子、硫醇连接子、2'-去氧核糖核苷类似物嘌呤、2'-去氧核糖核苷类似物嘧啶、核糖核苷类似物、2'-o-甲基核糖核苷类似物、糖修饰的类似物、摆动/通用碱基、萤光染料标记物、2'-氟rna、2'-o-甲基rna、甲基磷酸酯、磷酸二酯dna、磷酸二酯rna、硫代磷酸酯dna、硫代磷酸酯rna、una、假尿苷-5'-三磷酸酯、5'-甲基胞苷-5'-三磷酸酯或其任何组合。[0678]在一些实施方案中,修饰是永久的。在其他实施方案中,修饰是暂时的。在一些实施方案中,对grna或向导多核苷酸做出多种修饰。grna或向导多核苷酸修饰可以改变核苷酸的生理化学性质,诸如它们的构象、极性、疏水性、化学反应性、碱基配对相互作用或其任何组合。[0679]pam序列可以是本领域中已知的任何pam序列。合适的pam序列包括但不限于,ngg、nga、ngc、ngn、ngt、ngcg、ngag、ngan、ngng、ngcn、ngcg、ngtn、nngrrt、nnnrrt、nngrr(n)、tttv、tycv、tycv、tatv、nnnngatt、nnagaaw或naaaac。y是嘧啶;n是任何核苷酸碱基;w是a或t。[0680]修饰也可以是硫代磷酸酯替代物。在一些实施方案中,天然磷酸二酯键可能易受细胞核酸酶造成的快速降解;并且,使用硫代磷酸酯(ps)键替代物对核苷酸间连结进行修饰可能对于通过细胞降解进行的水解而言更为稳定。修饰可以增加grna或向导多核苷酸中的稳定性。修饰也可以增强生物学活性。在一些实施方案中,经硫代磷酸酯增强的rnagrna可以抑制rnasea、rnaset1、牛血清核酸酶或其任何组合。这些性质可以运行将ps-rnagrna用于在体内或体外暴露于核酸酶的可能性很高的应用中。例如,硫代磷酸酯(ps)键可以被引入到位于grna的5'-或‘'-末端的最末端3-5个核苷酸之间,这可以抑制核酸外切酶降解。在一些实施方案中,硫代磷酸酯键可以添加到整个grna中的任何位置处以减少被核酸内切酶攻击。[0681]不同的cas12b直系同源物(例如,bhcas12b、bvcas12b和aacas12b)使用不同的支架序列(也称为tracrrna)。在一些实施方案中,支架序列被优化以与bhcas12b蛋白合用并且具有以下序列:(其中在实际grna中,t被替换为尿苷(u))。[0682]bhcas12bsgrna支架(底线) 20nt至23nt向导序列(以n表示)。[0683]5'gttctgtcttttggtcaggacaaccgtctagctataagtgctgcagggtgtgagaaactcctattgctggacgatgtctcttacgaggcattagcacnnnnnnnnnnnnnnnnnnnn-3'[0684]在一些实施方案中,支架序列被优化以与bvcas12b蛋白合用并且具有以下序列:(其中在实际grna中,t被替换为尿苷(u))。[0685]bvcas12bsgrna支架(底线) 20nt至23nt向导序列(以n表示)[0686]5'gacctatagggtcaatgaatctgtgcgtgtgccataagtaattaaaaattacccaccacaggagcacctgaaaacaggtgcttggcacnnnnnnnnnnnnnnnnnnnn-3'[0687]在一些实施方案中,支架序列被优化以与aacas12b蛋白合用并且具有以下序列:(其中在实际grna中,t被替换为尿苷(u))。[0688]aacas12bsgrna支架(底线) 20nt至23nt向导序列(以n表示)[0689]5'gtctaaaggacagaatttttcaacgggtgtgccaatggccactttccaggtggcaaagcccgttgaacttctcaaaaagaacgatctgagaagtggcacnnnnnnnnnnnnnnnnnnnn-3'[0690]因此,技术人员可以改变cas蛋白的基因组靶标,特异性部分地由grna靶向序列对于基因组靶标与基因组剩余部分的特异性如何而决定。[0691]前间隔序列邻近基序[0692]术语“前间隔序列邻近基序(protospaceradjacentmotif,pam)”或pam样基序是指紧跟在被crispr细菌适应性免疫系统中的cas9核酸酶所靶向的dna序列会后的2-6个碱基对dna序列。在一些实施方案中,pam可以是5'pam(即,定位在前间隔序列的5'末端的上游)。在其他实施方案中,pam可以是5'pam(即,定位在前间隔序列的3'末端的下游)。[0693]pam序列对于靶标结合而言是必不可少的,但确切的序列取决于cas蛋白的类型。[0694]本文所提供的碱基编辑器可以包含衍生自crispr蛋白的结构域,其能够结合含有经典的或非经典的前间隔序列邻近基序(pam)序列的核苷酸序列。pam位点是接近多核苷酸序列的核苷酸序列。本公开的一些方面提供碱基编辑器,这些碱基编辑器包含具有不同pam特异性的crispr蛋白质的全部或部分。[0695]例如,典型地,cas9蛋白诸如来自化脓性链球菌的cas9(spcas9)需要经典的nggpam序列来结合特定的核酸区域,其中“ngg”中的“n”是腺嘌呤(a)、胸腺嘧啶(t)、鸟嘌呤(g)或胞嘧啶(c),并且g是鸟苷。pam可以是crispr蛋白特异性的,并且在包含不同的衍生自crispr蛋白的结构域的不同碱基编辑器之间可以是不同的。pam可以位于靶标序列的5'或3'。pam可以在靶标序列的上游或下游。pam可以是1、2、3、4、5、6、7、8、9、10个或更多个核苷酸的长度。通常,pam是2-6个核苷酸之间的长度。几种pam变体在下表1中描述。[0696]表1.cas9蛋白和相应pam序列[0697][0698][0699]在一些实施方案中,pam是ngc。在一些实施方案中,ngcpam被cas9变体识别。在一些实施方案中,ngcpam变体包括选自下列的一种或多种氨基酸置换:d1135m、s1136q、g1218k、e1219f、a1322r、d1332a、r1335e和t1337r(统称“mqkfraer”)。[0700]在一些实施方案中,pam是ngt。在一些实施方案中,ngtpam被cas9变体识别。在一些实施方案中,通过在一个或多个残基1335、1337、1135、1136、1218和/或1219处的靶向突变来产生ngtpam变体。在一些实施方案中,通过在一个或多个残基1219、1335、1337、1218处的靶向突变来产生ngtpam变体。在一些实施方案中,通过在一个或多个残基1135、1136、1218、1219和/或1335处的靶向突变来产生ngtpam变体。在一些实施方案中,ngtpam变体选自下表2和表3中提供的靶向突变的集合。[0701]表2:位于残基1219、1335、1337、1218处的ngtpam变体突变[0702][0703][0704]表3:位于残基1135、1136、1218、1219和1335处的ngtpam变体突变[0705][0706][0707]在一些实施方案中,ngtpam变体选自表2和表3中的变体5、7、28、31或36。在一些实施方案中,变体具有改善的ngtpam识别。[0708]在一些实施方案中,ngtpam变体具有位于残基1219、1335、1337和/或1218处的突变。在一些实施方案中,从下表4中提供的变体中选择具有用于改善的识别的突变的ngtpam变体。[0709]表4:位于残基1219、1335、1337和1218处的ngtpam变体突变[0710]变体e1219vr1335qt1337g12181fvt2fvr3fvq4fvl5fvtr6fvrr7fvqr8fvlr[0711]在一些实施方案中,可如下表5a中所提供的来产生具有针对ngtpam的特异性的碱基编辑器。[0712]表5a.ngtpam变体[0713][0714]在一些实施方案中,ngtn变体是变体1。在一些实施方案中,ngtn变体是变体2。在一些实施方案中,ngtn变体是变体3。在一些实施方案中,ngtn变体是变体4。在一些实施方案中,ngtn变体是变体5。在一些实施方案中,ngtn变体是变体6。[0715]在一些实施方案中,cas9结构域是来自化脓性链球菌(streptococcuspyogenes)的cas9结构域(spcas9)。在一些实施方案中,spcas9结构域是核酸酶活性spcas9、无核酸酶活性的spcas9(spcas9d)或spcas9切口酶(spcas9n)。在一些实施方案中,sacas9包含n579a突变,或本文所提供的任何氨基酸序列中的相应突变,其中x是除d以外的任何氨基酸。在一些实施方案中,spcas9包含d9a突变,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方案中,spcas9结构域、spcas9d结构域或spcas9n结构域可以结合至具有非经典pam的核酸序列。在一些实施方案中,spcas9结构域、spcas9d结构域或spcas9n结构域可以结合至具有ngg、nga或ngcgpam的核酸序列。在一些实施方案中,spcas9结构域包含d1135x、r1335x和t1337x突变中的一种或多种,或本文所提供的任何氨基酸序列的相应突变,其中x是任何氨基酸。在一些实施方案中,spcas9结构域包含d1135e、r1335q和t1337r突变中的一种或多种,或本文所提供的任何氨基酸序列的相应突变。在一些实施方案中,spcas9结构域包含d1135e、r1335q和t1337r突变,或本文所提供的任何氨基酸序列的相应突变。在一些实施方案中,spcas9结构域包含d1135x、r1335x和t1337x突变中的一种或多种,或本文所提供的任何氨基酸序列的相应突变,其中x是任何氨基酸。在一些实施方案中,spcas9结构域包含d1135v、r1335q和t1337r突变中的一种或多种,或本文所提供的任何氨基酸序列的相应突变。在一些实施方案中,spcas9结构域包含d1135v、r1335q和t1337r突变,或本文所提供的任何氨基酸序列的相应突变。在一些实施方案中,spcas9结构域包含d1135x、g1218x、r1335x和t1337x突变中的一种或多种,或本文所提供的任何氨基酸序列的相应突变,其中x是任何氨基酸。在一些实施方案中,spcas9结构域包含d1135v、g1218r、r1335q和t1337r突变中的一种或多种,或本文所提供的任何氨基酸序列的相应突变。在一些实施方案中,spcas9结构域包含d1135v、g1218r、r1335q和t1337r突变,或本文所提供的任何氨基酸序列的相应突变。[0716]在一些实施方案中,本文所提供的任何融合蛋白的cas9结构域包含氨基酸序列,所述氨基酸序列与本文所述的cas9多肽为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或99.5%相同。在一些实施方案中,本文所提供的任何融合蛋白的cas9结构域包含本文所述的任何cas9多肽的氨基酸序列。在一些实施方案中,本文所提供的任何融合蛋白的cas9结构域由本文所述的任何cas9多肽的氨基酸序列组成。[0717]在一些实施例中,被本文所公开的碱基编辑器的衍生自crispr蛋白的结构域识别的pam可在独立于编码碱基编辑器的插入物(例如,aav插入物)的寡核苷酸上提供至细胞。在此类实施方案中,提供位于独立的寡核苷酸上的pam可以允许靶标序列的裂解,该靶标序列不能以其他方式裂解,因为同一多核苷酸上不存在作为靶标序列的邻近pam。[0718]在一种实施方案中,化脓性链球菌cas9(spcas9)可以用作crispr核酸内切酶以进行基因组工程化。但是,可以使用其他的。在一些实施方案中,不同的核酸内切酶可以用来靶向某些基因组靶标。在一些实施方案中,可以使用具有非nggpam序列的衍生自spcas9的合成变体。此外,已经鉴定了来自多个物种的其他cas9直系同源物,并且这些“非spcas9”可以结合也能用于本公开的多种pam序列。例如,相对大尺寸的spcas9(大约4kb编码序列)可能导致质粒携带不能在细胞中有效表达的spcas9cdna。相反,金黄色葡萄球菌cas9(sacas9)的编码序列比spcas9短大约1千碱基,可能使得它在细胞中被有效地表达。类似于spcas9,sacas9核酸内切酶能够在体外修饰哺乳动物细胞中的靶标基因,并且在小鼠体内修饰细胞中的靶标基因。在一些实施方案中,cas蛋白可以靶向不同的pam序列。在一些实施方案中,靶标基因可以邻近cas9pam,例如,5'-ngg。在其他实施方案中,其他cas9直系同源物可能具有不同的pam要求。例如,其他pam诸如嗜热链球菌(s.thermophilus)的pam(对于crispr1是5'-nnagaa,而对于crispr3是5'-nggng)和脑膜炎双球菌(neisseriameningiditis)的pam(5'-nnnngatt)也可以被发现邻近靶标基因。[0719]在一些实施方案中,对于化脓性链球菌系统,靶标基因序列可能位于5'-nggpam之前(即,位于其5),并且20-nt向导rna序列可以与相对链碱基配对以介导邻近pam的cas9裂解。在一些实施方案中,邻近切割可以在pam上游的(约)3个碱基对处。在一些实施方案中,邻近切割可以在pam上游的(约)10个碱基对处。在一些实施方案中,邻近切割可以在pam上游的(约)0-20个碱基对处。例如,邻近切割可以在pam上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个碱基对旁边。邻近切割也可以在pam下游1至30个碱基对处。[0720]在一些实施方案中,cas9是cas9变体,其具有针对改变的pam序列的特异性。在一些实施方案中,额外的cas9变体和pam序列在miller等人,continuousevolutionofspcas9variantscompatiblewithnon-gpams.natbiotechnol(2020).https://doi.org/10.1038/s41587-020-0412-8中有所描述,其整体内容通过引用并入本文。在一些实施方案中,cas9变体没有特异性pam要求。在一些实施方案中,cas9变体,例如,spcas9变体具有针对nrnhpam的特异性,其中r是a或g,并且h是a、c或t。在一些实施方案中,spcas9变体具有针对pam序列aaa、taa、caa、gaa、tat、gat或cac的特异性。在一些实施方案中,spcas9变体包含位于以下位置处的氨基酸置换:如seqidno:1中编号的位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337或1339,或其相应位置。在一些实施方案中,spcas9变体包含位于以下位置处的氨基酸置换:如seqidno:1中编号的位置1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335或1337,或其相应位置。在一些实施方案中,spcas9变体包含位于以下位置处的氨基酸置换:如seqidno:1中编号的位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333,或其相应位置。在一些实施方案中,spcas9变体包含位于以下位置处的氨基酸置换:如seqidno:1中编号的位置1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339,或其相应位置。在一些实施方案中,spcas9变体包含位于以下位置处的氨基酸置换:如seqidno:1中编号的位置1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349,或其相应位置。spcas9变体的示例性氨基酸置换和pam特异性显示在下表5b、5c、5d和5e中。[0721]表5b.spcas9氨基酸置换和pam。[0722][0723]表5c.spcas9氨基酸置换和pam。[0724][0725][0726]表5d.spcas9氨基酸置换和pam。[0727][0728]表5e.spcas9氨基酸置换和pam。[0729][0730][0731]能够结合pam序列的示例性spcas9蛋白的序列如下:[0732]示例性pam结合spcas9的氨基酸序列如下:[0733]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0734]示例性pam结合spcas9n的氨基酸序列如下:[0735]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0736]示例性pam结合speqrcas9的氨基酸序列如下:[0737][0738][0739]在上述序列中,可能从d1134、r1334和t1336突变以得到speqrcas9的残基e1134、q1334和r1336加底线并以粗体显示。[0740]示例性pam结合spvqrcas9的氨基酸序列如下:[0741][0742][0743]在上述序列中,可能从d1134、r1334和t1336突变以得到spvqrcas9的残基v1134、q1334和r1336加底线并以粗体显示。[0744]示例性pam结合spvrercas9的氨基酸序列如下:[0745][0746][0747]在上述序列中,可能从d1134、g1217、r1334和t1336突变以得到spvrercas9的残基v1134、r1217、q1334和r1336加底线并以粗体显示。[0748]在一些实施方案中,cas9结构域是重组cas9结构域。在一些实施方案中,重组cas9结构域是spymaccas9结构域。在一些实施方案中,spymaccas9结构域是核酸酶活性spymaccas9、无核酸酶活性的spymaccas9(spymaccas9d)或spymaccas9切口酶(spymaccas9n)。在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可以结合至具有非经典pam的核酸序列。在一些实施方案中,spymaccas9结构域、spcas9d结构域或spcas9n结构域可以结合至具有naapam序列的核酸序列。[0749]thesequenceofanexemplaryhomologofin猴链球菌(streptococcusmacacae)中的spycas9的具有天然5'-naan-3'pam特异性的示例性cas9a同源物的序列是本领域中已知的,并且由例如jakimo等人描述(www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf),提供于下。[0750]spymaccas9[0751]mdkkysigldigtnsvgwavitddykvpskkfkvlgntdrhsikknligallfgsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkkladstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqiynqlfeenpinasrvdakailsarlsksrrlenliaqlpgekrnglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnseitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgayhdllkiikdkdfldneenediledivltltlfedrgmieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqghslheqianlagspaikkgilqtvkivdelvkvmghkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsfikddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkkteiqtvgqngglfddnpksplevtpsklvplkkelnpkkyggyqkpttaypvllitdtkqlipisvmnkkqfeqnpvkflrdrgyqqvgkndfiklpkytlvdigdgikrlwasskeihkgnqlvvskksqillyhahhldsdlsndylqnhnqqfdvlfneiisfskkcklgkehiqkienvysnkknsasieelaesfikllgftqlgatspfnflgvklnqkqykgkkdyilpctegtlirqsitglyetrvdlskiged.[0752]在一些实施方案中,变体cas9蛋白荷有h840a、p475a、w476a、n477a、d1125a、w1126a和d1118a突变,使得该多肽裂解靶标dna或rna的能力降低。此类cas9蛋白裂解靶标dna(例如,单链靶标dna)的能力降低,但保留结合靶标dna(例如,单链靶标dna)的能力。作为另一种非限制性示例,在一些实施方案中,变体cas9蛋白荷d10a、有h840a、p475a、w476a、n477a、d1125a、w1126a和d1218a突变,使得该多肽裂解靶标dna的能力降低。此类cas9蛋白裂解靶标dna(例如,单链靶标dna)的能力降低,但保留结合靶标dna(例如,单链靶标dna)的能力。在一些实施方案中,当变体cas9蛋白荷有w476a和w1126a突变时或当变体cas9蛋白荷有p475a、w476a、n477a、d1125a、w1126a和d1218a突变时,变体cas9蛋白不与pam序列有效地结合。因此,在一些此类情况下,当在结合方法中使用此类变体cas9蛋白时,该方法不需要pam序列。换言之,在一些实施方案中,当在接恶化方法中使用此类变体cas9蛋白时,该方法可以包括向导rna,但该方法可以在不存在pam序列的情况下执行(因此,由向导rna的靶向链段提供结合的特异性)。可以突变其他残基以实现上述效果(即,将一个或另一股核酸酶部分灭活)。作为非限制性示例,可以改变(即,置换)残基d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987。而且,除丙氨酸置换之外的突变是合适的。[0753]在一些实施方案中,碱基编辑器的衍生自crispr蛋白的结构域可以包含具有经典pam序列(ngg)的cas9蛋白的全部或一部分。在其他实施方案中,碱基编辑器的衍生自cas9的结构域可以采用非经典pam序列。此类序列已经在本领域中有所描述并且对于技术人员将会是显而易见的。例如,结合非经典pam序列的cas9结构域已经在以下文献中有所描述:kleinstiver,b.p.等人,“engineeredcrispr-cas9nucleaseswithalteredpamspecificities”nature523,481-485(2015);和kleinstiver,b.p.等人,“broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition”naturebiotechnology33,1293-1298(2015);各自的整体内容通过引用并入本文。[0754]在一些实施方案中,cas9是脑膜炎双球菌cas9(nmecas9)或其变体。在一些实施方案中,nmecas9具有针对nnnngaywpam的特异性,其中y是c或t,并且w是a或t。在一些实施方案中,nmecas9具有针对nnnngyttpam的特异性,其中y是c或t。在一些实施方案中,nmecas9结构域具有针对nnnngtctpam的特异性。在一些实施方案中,nmecas9是nme1cas9。在一些实施方案中,nmecas9具有针对nnnngattpam、nnnncctapam、nnnncctcpam、nnnnccttpam、nnnncctgpam、nnnnccgtpam、nnnnccggpam、nnnncccapam、nnnnccctpam、nnnnccccpam、nnnnccatpam、nnnnccagpam、nnnnccatpam或nnngattpam的特异性。在一些实施方案中,nme1cas9具有嗯对nnnngattpam、nnnncctapam、nnnncctcpam、nnnnccttpam或nnnncctgpam的特异性。在一些实施方案中,nmecas9具有针对caapam、caaapam或ccapam的特异性。在一些实施方案中,nmecas9是nme2cas9。在一些实施方案中,nmecas9具有针对nnnncc(n4cc)pam的特异性,其中n是a、g、c或t中的任一个。在一些实施方案中,nmecas9具有针对nnnnccgtpam、nnnnccggpam、nnnncccapam、nnnnccctpam、nnnnccccpam、nnnnccatpam、nnnnccagpam、nnnnccatpam或nnngattpam的特异性。在一些实施方案中,nmecas9是nme3cas9。在一些实施方案中,nmecas9具有针对nnnncaaapam、nnnnccpam或nnnncnnnpam的特异性。如edraki等人mol.cell.(2019)73(4):714-726中所述的额外的nmecas9特征和pam序列通过引用以其整体并入本文。[0755]例示性的nme1cas9氨基酸序列提供于下:[0756]ii型crisprrna引导的核酸内切酶cas9[脑膜炎双球菌]wp_002235162.1[0757][0758]例示性的nme2cas9氨基酸序列提供于下:[0759]ii型crisprrna引导的核酸内切酶cas9[脑膜炎双球菌]wp_002230835.1[0760][0761]具有降低的pam排他性的cas9结构域[0762]典型地,cas9蛋白诸如来自化脓性链球菌的cas9(spcas9)需要经典的nggpam序列来结合特定的核酸区域,其中“ngg”中的“n”是腺苷(a)、胸苷(t)或胞苷(c),并且g是鸟苷。这可能限制了编辑基因组内所希望的碱基的能力。在一些实施方案中,本文所提供的碱基编辑融合蛋白可能需要被放置在精确位置处,例如,在包含位于pam上游的靶标碱基的区域。参见例如,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016),其整体内容通过引用并入本文。据此,在一些实施方案中,本文所提供的任何融合蛋白可以含有能够结合不含经典(例如,ngg)pam序列的核苷酸序列的cas9结构域。结合至非经典pam序列的cas9结构域已经在本领域中有所描述并且对于技术人员将会是显而易见的。例如,结合非经典pam序列的cas9结构域已经在以下文献中有所描述:kleinstiver,b.p.等人,“engineeredcrispr-cas9nucleaseswithalteredpamspecificities”nature523,481-485(2015);和kleinstiver,b.p.等人,“broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition”naturebiotechnology33,1293-1298(2015);各自的整体内容通过引用并入本文。[0763]高保真度cas9结构域[0764]本公开的一些方面提供高保真度cas9结构域。在一些实施方案中,高保真度cas9结构域是经工程化的cas9结构域,与相应的野生型cas9结构域相比,该高保真度cas9结构域包含一种或多种减少cas9结构域与dna的糖-磷酸酯主链之间的静电相互作用的突变。不欲受缚于任何特定理论,与dna的糖-磷酸酯主链的静电相互作用减少的高保真度cas9结构域可能具有较低的脱靶效应。在一些实施方案中,cas9结构域(例如,野生型cas9结构域)包含一种或多种突变,该突变减少cas9结构域与dna的糖-磷酸酯主链之间的缔合。在一些实施方案中,cas9结构域包含一种或多种突变,该突变将cas9结构域与dna的糖-磷酸酯主链之间的缔合减少至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%或至少70%。[0765]在一些实施方案中,本文所提供的任何cas9融合蛋白包含n497x、r661x、q695x和/或q926x突变中的一种或多种,或本文所提供的任何氨基酸序列中的相应突变,其中x是任何氨基酸。在一些实施方案中,本文所提供的任何cas9融合蛋白包含n497a、r661a、q695a和/或q926a突变中的一种或多种,或本文所提供的任何氨基酸序列中的相应突变。在一些实施方案中,cas9结构域包含d10a突变,或本文所提供的任何氨基酸序列中的相应突变。具有高保真度的cas9结构域是本领域中已知的并且对于技术人员将会是显而易见的。例如,具有高保真度的cas9结构域已经在以下文献中有所描述:kleinstiver,b.p.等人“high-fidelitycrispr-cas9nucleaseswithnodetectablegenome-wideoff-targeteffects.”nature529,490-495(2016);和slaymaker,i.m.等人“rationallyengineeredcas9nucleaseswithimprovedspecificity.”science351,84-88(2015);各自的整体内容通过引用并入本文。[0766]在一些实施方案中,经修饰的cas9是高保真度cas9酶。在一些实施方案中,高保真度cas9酶是spcas9(k855a)、espcas9(1.1)、spcas9-hf1或超高精度cas9变体(hypacas9)。经修饰的cas9espcas9(1.1)含有谷氨酸置换,该置换弱化了hnh/ruvc凹槽与非靶标dna链之间的相互作用,防止链分离和在脱靶位点切割。类似地,spcas9-hf1通过丙氨酸置换降低了脱靶编辑,该丙氨酸置换中断了cas9与dna磷酸酯主链的相互作用。hypacas9含有位于rec3结构域中的突变(spcas9n692a/m694a/q695a/h698a),该突变增加cas9校对和靶标辨别力。全部三种高保真度酶都产生比野生型cas9少的脱靶编辑。[0767]示例性的高保真度cas9提供于下。[0768]相对于cas9的高保真度cas9结构域突变以黑体并加底线显示。[0769][0770][0771]包含cas9结构域以及胞苷脱氨酶和/或腺苷脱氨酶的融合蛋白[0772]本公开的一些方面提供包含napdnabp(例如,cas9结构域)以及一个或多个腺苷脱氨酶、胞苷脱氨酶和/或dna糖苷酶结构域的融合蛋白。在一些实施方案中,融合蛋白包含cas9结构域和腺苷脱氨酶结构域(例如,tada*a)。应知悉,cas9结构域可以是本文所提供的任何cas9结构域或cas9蛋白(例如,dcas9或ncas9)。在一些实施方案中,本文所提供的任何cas9结构域或cas9蛋白(例如,dcas9或ncas9)可以与本文所提供的任何胞苷脱氨酶和/或腺苷脱氨酶(例如,tada*a)融合。例如且不限于,在一些实施方案中,融合蛋白包含结构:[0773]nh2-[胞苷脱氨酶]-[cas9结构域]-[腺苷脱氨酶]-cooh;[0774]nh2-[腺苷脱氨酶]-[cas9结构域]-[胞苷脱氨酶]-cooh;[0775]nh2-[腺苷脱氨酶]-[胞苷脱氨酶]-[cas9结构域]-cooh;[0776]nh2-[胞苷脱氨酶]-[腺苷脱氨酶]-[cas9结构域]-cooh;[0777]nh2-[cas9结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-cooh;[0778]nh2-[cas9结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-cooh;[0779]nh2-[腺苷脱氨酶]-[cas9结构域]-cooh;[0780]nh2-[cas9结构域]-[腺苷脱氨酶]-cooh;[0781]nh2-[胞苷脱氨酶]-[cas9结构域]-cooh;或[0782]nh2-[cas9结构域]-[胞苷脱氨酶]-cooh。[0783]在一些实施方案中,包含胞苷脱氨酶、无碱基编辑器、以及腺苷脱氨酶和napdnabp(例如,cas9结构域)的融合蛋白不包括连接子序列。在一些实施方案中,连接子存在于胞苷脱氨酶和/或腺苷脱氨酶结构域与napdnabp之间。在一些实施方案中,上述通用结构中使用的“‑”表示存在任选的连接子。在一些实施方案中,胞苷脱氨酶和腺苷脱氨酶与napdnabp经由本文所提供的任何连接子融合。例如,在一些实施方案中,胞苷脱氨酶和/或腺苷脱氨酶与napdnabp经由本文所提供的任何连接子融合。[0784]包含核定位序列(nls)的融合蛋白[0785]在一些实施方案中,本文所提供的融合蛋白进一步包含一个或多个(例如,2、3、4、5个)核靶向序列,例如,核定位序列(nls)。在一种实施方案中,使用二分nls。在一些实施方案中,nls包含促进将包含nls的蛋白质并入细胞核(例如,通过核转运)中的氨基酸序列。在一些实施方案中,本文所提供的任何融合蛋白进一步包含核定位序列(nls)。在一些实施方案中,nls融合至融合蛋白的n端。在一些实施方案中,nls融合至融合蛋白的c端。在一些实施方案中,nls融合至cas9结构域的n端。在一些实施方案中,nls融合至cas9结构域或dcas9结构域的c端。在一些实施方案中,nls融合至脱氨酶的n端。在一些实施方案中,nls融合至脱氨酶的c端。在一些实施方案中,nls经由一个或多个连接子融合至融合蛋白。在一些实施方案中,nls融合至融合蛋白而没有连接子。在一些实施方案中,nls包含本文所提供或引用的任何一种nls序列的氨基酸序列。额外的核定位序列是本领域中已知的并且对于技术人员将会是显而易见的。例如,nls序列在plank等人的pct/ep2000/011690中有所描述,其内容通过引用其对于示例性核定位序列的公开而并入本文。在一些实施方案中,nls包含氨基酸序列pkkkrkvegadkrtadgsefespkkkrkv、krtadgsefespkkkrkv、krpaatkkagqakkkk、kktelqttnaenktkkl、krgindrnfwrgengrktr、rksgkiaaivvkrprkpkkkrkv或mdsllmnrrkflyqfknvrwakgrretylc。[0786]在一些实施方案中,nls存在于连接子中,或者nls侧翼具有连接子,例如,本文所述的连接子。在一些实施方案中,nls的n端或c端是二分nls。二分nls包含两个碱性氨基酸簇,这两个簇被相对较短的间隔序列分隔(因此,二分即2个部分,而单分nls则不然)。核质蛋白的nls,kr[paatkkagqa]kkkk,是普遍存在的二分信号的原型:两个碱性氨基酸簇,通过约10个氨基酸的间隔序列分隔。示例性二分nls的序列如下:[0787]pkkkrkvegadkrtadgsefespkkkrkv[0788]在一些实施方案中,本发明的融合蛋白不包含连接子序列。在一些实施方案中,存在位于一个或多个结构域或蛋白质之间的连接子序列。在一些实施方案中,具有腺苷脱氨酶或胞苷脱氨酶以及cas9结构域的例示性cas9融合蛋白的通用结构包含下列结构中的任何一种,其中nls是核定位序列(例如,本文所提供的任何nls),nh2是融合蛋白的n端,而cooh是融合蛋白的c端:[0789]nh2-nls-[腺苷脱氨酶]-[cas9结构域]-cooh;[0790]nh2-nls[cas9结构域]-[腺苷脱氨酶]-cooh;[0791]nh2-[腺苷脱氨酶]-[cas9结构域]-nls-cooh;[0792]nh2-[cas9结构域]-[腺苷脱氨酶]-nls-cooh;[0793]nh2-nls-[胞苷脱氨酶]-[cas9结构域]-cooh;[0794]nh2-nls-[cas9结构域]-[胞苷脱氨酶]-cooh;[0795]nh2-[胞苷脱氨酶]-[cas9结构域]-nls-cooh;或[0796]nh2-[cas9结构域]-[胞苷脱氨酶]-nls-cooh。[0797]应知悉,本公开的融合蛋白可以包含一个或多个额外特征。例如,在一些实施方案中,融合蛋白可以包含抑制剂、细胞质定位序列、输出序列诸如核输出序列、或其他定位序列,以及可用于融合蛋白的溶解、纯化或检测的序列标签。本文所提供的合适的蛋白标签包括但不限于,生物素羧化酶载体蛋白(bccp)标签、myc标签、钙调蛋白标签、flag标签、血细胞凝集素(ha)标签、聚组氨酸标签(也称为组氨酸标签或his标签)、麦芽糖结合蛋白(mbp)标签、nus标签、谷胱甘肽-s-转移酶(gst)标签、绿色萤光蛋白(gfp)标签、硫氧还蛋白标签、s标签、softag(例如,softag1、softag3)、链霉素标签、生物素连接酶标签、flash标签、v5标签和sbp标签。其他合适的序列对于本领域技术人员将是显而易见的。在一些实施方案中,融合蛋白包含一个或多个his标签。[0798]可使用编码包含一个或多个核定位序列(nls)的crispr酶的载体。例如,可存在(约)1、2、3、4、5、6、7、8、9、10个被使用的nls。crispr酶可以包含位于氨基端处或附近的nls,大约或超过大约1、2、3、4、5、6、7、8、9、10个位于羧基端处或附近的nls,或这些的任何组合(例如,一个或多个位于氨基端处的nls和一个或多个位于羧基端处的nls)。当存在超过一个nls时,每一个nls可以独立于其他nls而选择,使得单个nls可以存在于超过一个拷贝中及/或与一个或多个其他nls组合存在于一个或多个拷贝中。[0799]该方法中使用的crispr酶可以包含大约6个nls。当最接近nls的氨基酸处于沿着多肽链从n端或c端起约50个氨基酸内,例如,1、2、3、4、5、10、15、20、25、30、40或50个氨基酸内时,则将nls视为位于n端或c端附近。[0800]核碱基编辑结构域[0801]本文描述了包含融合蛋白的碱基编辑器,该融合蛋白包括多核苷酸可编程核苷酸结合结构域和核碱基编辑结构域(例如,脱氨酶结构域)。可将碱基编辑器程式设计,以通过与能够识别靶标序列的向导多核苷酸相互作用来编辑靶标多核苷酸序列中的一个或多个碱基。一旦靶标序列被识别,碱基编辑器就被锚定在待发生编辑之处的多核苷酸上,然后,碱基编辑器脱氨酶结构域组分可以编辑靶标碱基。[0802]在一些实施方案中,核碱基编辑结构域包括脱氨酶结构域。如本文中具体描述的,脱氨酶结构域包括胞苷脱氨酶或腺苷脱氨酶。在一些实施方案中,“胞嘧啶脱氨酶”和“胞苷脱氨酶”可以互换地使用。在一些实施方案中,“腺嘌呤脱氨酶”和“腺苷脱氨酶”可以互换地使用。核碱基编辑蛋白的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用而整体并入本文。也参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017)和komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),其整体内容通过引用并入本文。[0803]a到g的编辑[0804]在一些实施方案中,本文所述的碱基编辑器可以包含脱氨酶结构域,该脱氨酶结构域包括腺苷脱氨酶。碱基编辑器的此类腺苷脱氨酶结构域可以促进通过将腺嘌呤(a)脱氨基以形成肌苷(i)而a核碱基编辑为鸟嘌呤(g)核碱基,肌苷展现了g的碱基配对特性。腺苷脱氨酶能够将去氧核糖核酸(dna)中的去氧腺苷残基的腺嘌呤脱氨基(即,移除氨基团)。[0805]在一些实施方案中,本文所提供的核碱基编辑器可以通过将一个或多个蛋白结构域融合在一起从而产生融合蛋白而制备。在某些实施方案中,本文所提供的融合蛋白包含一种或多种特征,该特征改善融合蛋白的碱基编辑活性(例如,效率、选择性和特异性)。例如,本文所提供的融合蛋白可以包含具有削弱的核酸酶活性的cas9结构域。在一些实施方案中,本文所提供的融合蛋白可以具有不具有核酸酶活性的cas9结构域(dcas9)或者被称为cas9切口酶(ncas9)的切割双螺旋dna分子一条链的cas9结构域。不受缚于任何特定理论,催化残基(例如,h840)的存在保持了cas9裂解含有与所靶向的a相对的t的未经编辑(例如,未经脱氨)的链。cas9的催化残基的突变(例如,d10到a10)防止含有所靶向的a残基的经编辑的链的裂解。此类cas9变体能够基于grna定义的靶标序列而在具体位置处生成单链dna断裂(切口),导致未经编辑的链的修复,最终造成未经编辑的链上t到c的变化。在一些实施方案中,a到g碱基编辑器进一步包含肌苷碱基切除修复的抑制剂,例如,尿嘧啶糖苷酶抑制剂(ugi)结构域或无催化活性的肌苷特异性核酸酶。不受缚于任何特定理论,ugi结构域或无催化活性的肌苷特异性核酸酶可以抑制或防止经脱氨基的腺苷残基(例如,肌苷)的碱基切除修复,这可以改善碱基编辑器的活性或效率。[0806]包含腺苷脱氨酶的碱基编辑器可以作用于任何多核苷酸,包括dna、rna和dna-rna杂交物。在某些实施方案中,包含腺苷脱氨酶的碱基编辑器可以将包含rna的多核苷酸的靶标a脱氨基。例如,碱基编辑器可以包含能够将rna多核苷酸和/或dna-rna杂交多核苷酸的靶标a脱氨基的腺苷脱氨酶结构域。在一种实施方案中,被并入碱基编辑器中的腺苷脱氨酶包含作用于rna的腺苷脱氨酶(adar,例如,adar1或adar2)的全部或一部分。在另一实施方案中,被并入碱基编辑器中的腺苷脱氨酶包含作用于trna的腺苷脱氨酶(adat)的全部或一部分。包含腺苷脱氨酶结构域的碱基编辑器也可以能够将dna多核苷酸的a核碱基脱氨基。在一种实施方案中,碱基编辑器的腺苷脱氨酶包含adat的全部或一部分,其包含一个或多个允许adat将dna中的靶标a脱氨基的突变。例如,碱基编辑器可以包含来自大肠杆菌的adat(ectada)的全部或一部分,其包含以下一个或多个突变:d108n、a106v、d147y、e155v、l84f、h123y、i156f或另一腺苷脱氨酶中的相应突变。[0807]腺苷脱氨酶可以源自任何合适的生物体(例如,大肠杆菌)。在一些实施方案中,腺苷脱氨酶是天然出现的腺苷脱氨酶,其包括对应于本文所提供的任何突变(例如,ectada中的突变)的一个或多个突变。任何同源蛋白质中的相应残基可以通过例如序列比对和同源残基的确定而鉴定。可以据此产生任何天然出现的腺苷脱氨酶(例如,具有与ectada的同源性)的对应于本文所述任何突变(例如,ectada中鉴定的任何突变)的突变。[0808]腺苷脱氨酶[0809]在一些实施方案中,本文所述的碱基编辑器可以包含脱氨酶结构域,该脱氨酶结构域包括腺苷脱氨酶。碱基编辑器的此类腺苷脱氨酶结构域可以促进通过将腺嘌呤(a)脱氨基以形成肌苷(i)而a核碱基编辑为鸟嘌呤(g)核碱基,肌苷展现了g的碱基配对特性。腺苷脱氨酶能够将去氧核糖核酸(dna)中的去氧腺苷残基的腺嘌呤脱氨基(即,移除氨基团)。[0810]在一些实施方案中,本文所提供的腺苷脱氨酶能够将腺嘌呤脱氨基。在一些实施方案中,本文所提供的腺苷脱氨酶能够将dna的去氧腺苷残基中的腺嘌呤脱氨基。在一些实施方案中,腺苷脱氨酶是天然出现的腺苷脱氨酶,其包括对应于本文所提供的任何突变(例如,ectada中的突变)的一个或多个突变。本领域技术人员将能够鉴定任何同源蛋白质中的相应残基,例如,通过序列比对和同源残基的确定。据此,本领域技术人员将能够产生任何天然出现的腺苷脱氨酶(例如,具有与ectada的同源性)的对应于本文所述任何突变(例如,ectada中鉴定的任何突变)的突变。在一些实施方案中,腺苷脱氨酶来自原核生物。在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌、腐败希瓦氏菌、流感嗜血杆菌、新月柄杆菌或枯草芽孢杆菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。[0811]本发明提供具有增加的效率(》50-60%)和特异性的腺苷脱氨酶变体。特别地,本文所述的腺苷脱氨酶变体更有可能编辑多核苷酸内的所希望的碱基,并且更不可能编辑碱基编辑窗内不预期改变的碱基(即,“旁观者”)。[0812]在特定实施方案中,tada是pct/us2017/045381(wo2018/027078)中描述的任何一种tada,该专利通过引用以其整体并入本文。[0813]在一些实施方案中,本发明的核碱基编辑器是腺苷脱氨酶变体,其包含以下序列中的改变:[0814]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd(也称为tada*7.10)。[0815]在特定实施方案中,融合蛋白包含单个(例如,作为单体提供)tada*8变体。在一些实施方案中,tada*8与cas9切口酶连接。在一些实施方案中,本发明的融合蛋白包,含作为异二聚体,野生型tada(tada(wt))与tada*8变体连接。在一些实施方案中,本发明的融合蛋白包,含作为异二聚体,tada*7.10与tada*8变体连接。在一些实施方案中,碱基编辑器是包含tada*8变体单体的abe8。在一些实施方案中,碱基编辑器是abe8,其包含tada*8变体与tada(wt)的异二聚体。在一些实施方案中,碱基编辑器是abe8,其包含tada*8变体与tada*7.10的异二聚体。在一些实施方案中,碱基编辑器是abe8,其包含tada*8变体的异二聚体。在一些实施方案中,tada*8选自表7。在一些实施方案中,abe8选自表7。相关序列如下:[0816]野生型tada(tada(wt))或“tada参考序列”[0817]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd[0818]tada*7.10:[0819]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0820]在一些实施方案中,腺苷脱氨酶包含氨基酸序列,所述氨基酸序列与下文提供的任何腺苷脱氨酶中详述的任何一个氨基酸序列为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或99.5%相同。应知悉,本文所提供的腺苷脱氨酶可以包括一个或多个突变(例如,本文所提供的任何突变)。本公开提供任何具有某一定百分比的同一性加上任何本文所述突变或其组合的脱氨酶结构域。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与参考序列或本文所提供的任何腺苷脱氨酶相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与本领域中已知或本文所述的任何一种氨基酸序列相比,该氨基酸序列具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的毗邻氨基酸残基。[0821]在一些实施方案中,tada脱氨酶是全长大肠杆菌tada脱氨酶。例如,在某些实施方案中,腺苷脱氨酶包含氨基酸序列:[0822]mrrafitgvfflsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd。[0823]但应知悉,可用于本技术的其他腺苷脱氨酶对于技术人员是显而易见的并且处于本公开范畴内。例如,腺苷脱氨酶可以是作用于trna(adat)的腺苷脱氨酶同源物。非限制性地,示例性adat同源物的氨基酸序列包括以下:[0824]金黄色葡萄球菌(staphylococcusaureus)tada:[0825]mgshmtndiyfmtlaieeakkaaqlgevpigaiitkddeviarahnlretlqqptahaehiaieraakvlgswrlegctlyvtlepcvmcagtivmsriprvvygaddpkggcsgslmnllqqsnfnhraivdkgvlkeacstllttffknlrankkstn[0826]枯草芽孢杆菌(bacillussubtilis)tada:[0827]mtqdelymkeaikeakkaeekgevpigavlvingeiiarahnlreteqrsiahaemlvideackalgtwrlegatlyvtlepcpmcagavvlsrvekvvfgafdpkggcsgtlmnllqeerfnhqaevvsgvleeecggmlsaffrelrkkkkaarknlse[0828]鼠伤寒沙门氏菌(salmonellatyphimurium(s.typhimurium))tada:[0829]mppafitgvtslsdveldheywmrhaltlakrawderevpvgavlvhnhrvigegwnrpigrhdptahaeimalrqgglvlqnyrlldttlyvtlepcvmcagamvhsrigrvvfgardaktgaagslidvlhhpgmnhrveiiegvlrdecatllsdffrmrrqeikalkkadraegagpav[0830]腐败希瓦氏菌(shewanellaputrefaciens(s.putrefaciens))tada:[0831]mdeywmqvamqmaekaeaagevpvgavlvkdgqqiatgynlsisqhdptahaeilclrsagkklenyrlldatlyitlepcamcagamvhsriarvvygardektgaagtvvnllqhpafnhqvevtsgvlaeacsaqlsrffkrrrdekkalklaqraqqgie[0832]流感嗜血杆菌(haemophilusinfluenzae)f3031(h.influenzae)tada:[0833]mdaakvrsefdekmmryaleladkaealgeipvgavlvddarniigegwnlsivqsdptαηaeiialrngakniqnyrllnstlyvtlepctmcagailhsrikrlvfgasdyktgaigsrfhffddykmnhtleitsgvlaeecsqklstffqkrreekkiekallkslsdk[0834]新月柄杆菌(caulobactercrescentus(c.crescentus))tada:[0835]mrtdesedqdhrmmrlaldaaraaaeagetpvgavildpstgeviatagngpiaahdptahaeiaamraaaaklgnyrltdltlvvtlepcamcagaisharigrvvfgaddpkggavvhgpkffaqptchwrpevtggvladesadllrgffrarrkaki[0836]硫还原地杆菌(geobactersulfurreducens(g.sulfurreducens))tada:[0837]msslkktpirddaywmgkaireaakaaardevpigavivrdgavigrghnlregsndpsahaemiairqaarrsanwrltgatlyvtlepclmcmgaiilarlervvfgcydpkggaagslydlsadprlnhqvrlspgvcqeecgtmlsdffrdlrrrkkakatpalfiderkvppep[0838]大肠杆菌tada(ectada)的一种实施方案包括以下:[0839]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0840]在一些实施方案中,腺苷脱氨酶来自原核生物。在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌、腐败希瓦氏菌、流感嗜血杆菌、新月柄杆菌或枯草芽孢杆菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。[0841]在一种实施方案中,本发明的融合蛋白包含与tada7.10连接的野生型tada,tada7.10与cas9切口酶连接。在特定实施方案中,融合蛋白包含单个tada7.10结构域(例如,作为单体提供)。在其他实施方案中,abe7.10编辑器包含tada7.10和tada(wt),它们能够形成异二聚体。[0842]在一些实施方案中,腺苷脱氨酶包含氨基酸序列,所述氨基酸序列与下文提供的任何腺苷脱氨酶中详述的任何一个氨基酸序列为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或99.5%相同。应知悉,本文所提供的腺苷脱氨酶可以包括一个或多个突变(例如,本文所提供的任何突变)。本公开提供任何具有某一定百分比的同一性加上任何本文所述突变或其组合的脱氨酶结构域。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与参考序列或本文所提供的任何腺苷脱氨酶相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与本领域中已知或本文所述的任何一种氨基酸序列相比,该氨基酸序列具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的毗邻氨基酸残基。[0843]应知悉,本文所提供的任何突变(例如,基于tada参考序列)可以被引入其他腺苷脱氨酶中,诸如大肠杆菌tada(ectada)、金黄色葡萄球菌tada(satada)或其他腺苷脱氨酶(例如,细菌腺苷脱氨酶)。对于技术人员将会是显而易见的是,可以类似地比对其他脱氨酶以鉴定可能如本文所提供的那样突变的同源氨基酸残基。因此,可以在具有同源氨基酸残基的其他腺苷脱氨酶(例如,ectada)中做出在tada参考序列中鉴定的任何突变。也应知悉,本文所提供的任何突变均可以独立地或以任何组合形式在tada参考序列或另一腺苷脱氨酶中做出。[0844]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d108x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案汇总,腺苷脱氨酶包含d108g、d108n、d108v、d108a或d108y突变,或者另一腺苷脱氨酶中的相应突变。[0845]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106v突变,或另一腺苷脱氨酶(例如,野生型tada或ectada)中的相应突变。[0846]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e155x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x的存在表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e155d、e155g或e155v突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0847]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d147x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x的存在表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d147y突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0848]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106x、e155x或d147x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含e155d、e155g或e155v突变。在一些实施方案中,腺苷脱氨酶包含d147y。[0849]例如,腺苷脱氨酶可以含有包含tada参考序列中的d108n、a106v、155v和/或d147y突变,或另一腺苷脱氨酶(例如,野生型tada或ectada)中的相应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的以下突变组(突变组通过“;”分隔),或另一腺苷脱氨酶(例如,或ectada)中的相应突变:d108n和a106v;d108n和e155v;d108n和d147y;a106v和e155v;a106v和d147y;e155v和d147y;d108n、a106v和e155v;d108n、a106v和d147y;d108n、e155v和d147y;a106v、e155v和d147y;以及d108n、a106v、e155v和d147y。但应知悉,本文所提供的相应突变的任何组合均可以在腺苷脱氨酶(例如,ectada)中做出。[0850]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8x、t17x、l18x、w23x、l34x、w45x、r51x、a56x、e59x、e85x、m94x、i95x、v102x、f104x、a106x、r107x、d108x、k110x、m118x、n127x、a138x、f149x、m151x、r153x、q154x、i156x和/或k157x一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x的存在表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、t17s、l18e、w23l、l34s、w45l、r51h、a56e、或a56s、e59g、e85k、或e85g、m94l、1951、v102a、f104l、a106v、r107c、或r107h、或r107p、d108g、或d108n、或d108v、或d108a、或d108y、k110i、m118k、n127s、a138v、f149y、m151v、r153c、q154l、i156d和/或k157r一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。[0851]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8x、d108x和/或n127x一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、d108n和/或n127s一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。[0852]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8x、r26x、m61x、l68x、m70x、a106x、d108x、a109x、n127x、d147x、r152x、q154x、e155x、k161x、q163x和/或t166x一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、r26w、m61i、l68q、m70v、a106t、d108n、a109t、n127s、d147y、r152c、q154h或q154r、e155g或e155v或e155d、k161q、q163h和/或t166p一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。[0853]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、d108x、n127x、d147x、r152x和q154x所组成的组中的一个、两个、三个、四个、五个或六个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、m61x、m70x、d108x、n127x、q154x、e155x和q163x突变所组成的组中的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、d108x、n127x、e155x和t166x所组成的组中的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。[0854]在一些实施方案中,腺苷脱氨酶包含选自由的h8x、a106x、d108x、另一腺苷脱氨酶中的一个或多个突变所组成的组中的一个、两个、三个、四个、五个或六个突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由h8x、r126x、l68x、d108x、n127x、d147x和e155x突变所组成的组中的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、d108x、a109x、n127x和e155x所组成的组中的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。[0855]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、d108n、n127s、d147y、r152c和q154h所组成的组中的一个、两个、三个、四个、五个或六个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、m61i、m70v、d108n、n127s、q154r、e155g和q163h所组成的组中的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、d108n、n127s、e155v和t166p所组成的组中的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、a106t、d108n、n127s、e155d和k161q所组成的组中的一个、两个、三个、四个、五个或六个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、r126w、l68q、d108n、n127s、d147y和e155v所组成的组中的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、d108n、a109t、n127s和e155g所组成的组中的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。[0856]本文所提供的任何突变和任何其他突变(例如,基于ectada氨基酸序列)可以被引入任何其他腺苷脱氨酶中。本文所提供的任何突变均可以独立地或以任何组合形式在tada参考序列或另一腺苷脱氨酶(例如,ectada)中做出。[0857]a到g的核碱基编辑蛋白质的细节在国际pct申请号pct/2017/045381(wo2018/027078)和gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature,551,464-471(2017)中有所描述,其整体内容通过引用并入本文。[0858]在一些实施方案中,腺苷脱氨酶包含另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d108n、d108g或d108v突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106v和d108n突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r107c和d108n突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、d108n、n127s、d147y和q154h突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、d108n、n127s、d147y和e155v突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d108n、d147y和e155v突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、d108n和n127s突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106v、d108n、d147y和e155v突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0859]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的s2x、h8x、i49x、l84x、h123x、n127x、i156x和/或k160x一个或多个突变,或另一腺苷脱氨酶中的一个或多个相应突变,其中x的存在表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的s2a、h8y、i49f、l84f、h123y、n127s、i156f和/或k160s一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。[0860]在一些实施方案中,腺苷脱氨酶包含l84x突变腺苷脱氨酶,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的l84f突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0861]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h123x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h123y突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0862]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的i156x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的i156f突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0863]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的l84x、a106x、d108x、h123x、d147x、e155x和i156x突变所组成的组中的一个、两个、三个、四个、五个、六个或七个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的s2x、i49x、a106x、d108x、d147x和e155x所组成的组中的一个、两个、三个、四个、五个或六个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、a106x、d108x、n127x和k160x所组成的组中的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸的存在。[0864]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的l84f、a106v、d108n、h123y、d147y、e155v和i156f所组成的组中的一个、两个、三个、四个、五个、六个或七个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的s2a、i49f、a106v、d108n、d147y和e155v所组成的组中的一个、两个、三个、四个、五个或六个突变。[0865]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、a106t、d108n、n127s和k160s所组成的组中的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。[0866]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25x、r26x、r107x、a142x和/或a143x一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x的存在表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25m、e25d、e25a、e25r、e25v、e25s、e25y、r26g、r26n、r26q、r26c、r26l、r26k、r107p、r107k、r107a、r107n、r107w、r107h、r107s、a142n、a142d、a142g、a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含对应于tada参考序列中的本文所述一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。[0867]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25m、e25d、e25a、e25r、e25v、e25s或e25y突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0868]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r26x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r26g、r26n、r26q、r26c、r26l或r26k突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0869]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r107x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r107p、r107k、r107a、r107n、r107w、r107h或r107s突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0870]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a142x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a142n、a142d、a142g突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0871]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a143x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0872]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h36x、n37x、p48x、i49x、r51x、m70x、n72x、d77x、e134x、s146x、q154x、k157x和/或k161x一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变,其中x的存在表示除野生型腺苷脱氨酶中的相应氨基酸外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h36l、n37t、n37s、p48t、p48l、i49v、r51h、r51l、m70l、n72s、d77g、e134g、s146r、s146c、q154h、k157n和/或k161t一个或多个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个相应突变。[0873]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h36x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h36l突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0874]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的n37x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的n37t或n37s突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0875]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的p48x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的p48t或p48l突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0876]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r51x突变或另一腺苷脱氨酶中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r51h或r51l突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0877]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的s146x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的s146r或s146c突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0878]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的k157x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的k157n突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0879]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的p48x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的p48s、p48t或p48a突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0880]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a142x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a142n突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0881]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的w23x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的w23r或w23l突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0882]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r152x突变或另一腺苷脱氨酶(例如,ectada)中的相应突变,其中x表示除野生型腺苷脱氨酶中的相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r152p或r52h突变,或另一腺苷脱氨酶(例如,ectada)中的相应突变。[0883]在一种实施方案中,腺苷脱氨酶可以包含突变h36l、r51l、l84f、a106v、d108n、h123y、s146c、d147y、e155v、i156f和k157n。在一些实施方案中,腺苷脱氨酶包含相对于tada参考序列的突变的下列组合,其中组合的每个突变通过“_”分隔并且突变的每个组合位于括弧内:[0884](a106v_d108n)、[0885](r107c_d108n)、[0886](h8y_d108n_n127s_d147y_q154h)、[0887](h8y_d108n_n127s_d147y_e155v)、[0888](d108n_d147y_e155v)、[0889](h8y_d108n_n127s)、[0890](h8y_d108n_n127s_d147y_q154h)、[0891](a106v_d108n_d147y_e155v)、[0892](d108q_d147y_e155v)、[0893](d108m_d147y_e155v)、[0894](d108l_d147y_e155v)、[0895](d108k_d147y_e155v)、[0896](d108i_d147y_e155v)、[0897](d108f_d147y_e155v)、[0898](a106v_d108n_d147y)、[0899](a106v_d108m_d147y_e155v)、[0900](e59a_a106v_d108n_d147y_e155v)、[0901](e59a催化上死亡的_a106v_d108n_d147y_e155v)、[0902](l84f_a106v_d108n_h123y_d147y_e155v_i156y)、[0903](l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[0904](r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f)、[0905](e25g_r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f)、[0906](e25d_r26g_l84f_a106v_r107k_d108n_h123y_a142n_a143g_d147y_e155v_i156f)、[0907](r26q_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[0908](e25m_r26g_l84f_a106v_r107p_d108n_h123y_a142n_a143d_d147y_e155v_i156f)、[0909](r26c_l84f_a106v_r107h_d108n_h123y_a142n_d147y_e155v_i156f)、[0910](l84f_a106v_d108n_h123y_a142n_a143l_d147y_e155v_i156f)、[0911](r26g_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[0912](e25a_r26g_l84f_a106v_r107n_d108n_h123y_a142n_a143e_d147y_e155v_i156f)、[0913](r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f)、[0914](a106v_d108n_a142n_d147y_e155v)、[0915](r26g_a106v_d108n_a142n_d147y_e155v)、[0916](e25d_r26g_a106v_r107k_d108n_a142n_a143g_d147y_e155v)、[0917](r26g_a106v_d108n_r107h_a142n_a143d_d147y_e155v)、[0918](e25d_r26g_a106v_d108n_a142n_d147y_e155v)、[0919](a106v_r107k_d108n_a142n_d147y_e155v)、[0920](a106v_d108n_a142n_a143g_d147y_e155v)、[0921](a106v_d108n_a142n_a143l_d147y_e155v)、[0922](h36l_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[0923](n37t_p48t_m70l_l84f_a106v_d108n_h123y_d147y_i49v_e155v_i156f)、[0924](n37s_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k161t)、[0925](h36l_l84f_a106v_d108n_h123y_d147y_q154h_e155v_i156f)、[0926](n72s_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f)、[0927](h36l_p48l_l84f_a106v_d108n_h123y_e134g_d147y_e155v_i156f)、[0928](h36l_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k157n)、[0929](h36l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f)、[0930](l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、[0931](n37s_r51h_d77g_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[0932](r51l_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k157n)、[0933](d24g_q71r_l84f_h96l_a106v_d108n_h123y_d147y_e155v_i156f_k160e)、[0934](h36l_g67v_l84f_a106v_d108n_h123y_s146t_d147y_e155v_i156f)、[0935](q71l_l84f_a106v_d108n_h123y_l137m_a143e_d147y_e155v_i156f)、[0936](e25g_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l)、[0937](l84f_a91t_f104i_a106v_d108n_h123y_d147y_e155v_i156f)、[0938](n72d_l84f_a106v_d108n_h123y_g125a_d147y_e155v_i156f)、[0939](p48s_l84f_s97c_a106v_d108n_h123y_d147y_e155v_i156f)、[0940](w23g_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[0941](d24g_p48l_q71r_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l)、[0942](l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[0943](h36l_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f[0944]_k157n),(n37s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_k161t)、[0945](l84f_a106v_d108n_d147y_e155v_i156f)、[0946](r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k161t)、[0947](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k161t)、[0948](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e_k161t)、[0949](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e)、[0950](r74q_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[0951](r74a_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[0952](l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[0953](r74q_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[0954](l84f_r98q_a106v_d108n_h123y_d147y_e155v_i156f)、[0955](l84f_a106v_d108n_h123y_r129q_d147y_e155v_i156f)、[0956](p48s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[0957](p48s_a142n)、[0958](p48t_i49v_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_l157n)、[0959](p48t_i49v_a142n)、[0960](h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[0961](h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156f[0962](h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[0963](h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、[0964](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、(h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、[0965](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156f_k157n)、[0966](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[0967](w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[0968](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、[0969](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152h_e155v_i156f_k157n)、[0970](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、[0971](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、[0972](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_e155v_i156f_k157n)、[0973](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_r152p_e155v_i156f_k157n)、[0974](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、[0975](w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、[0976](h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_r152p_e155v_i156f_k157n)。[0977]在某些实施方案中,本文所提供的融合蛋白包含一种或多种特征,该特征改善融合蛋白的碱基编辑活性。例如,本文所提供的任何融合蛋白可以包含具有削弱的核酸酶活性的cas9结构域。在一些实施方案中,本文所提供的任何融合蛋白可以具有不具有核酸酶活性的cas9结构域(dcas9)或者被称为cas9切口酶(ncas9)的切割双螺旋dna分子一条链的cas9结构域。[0978]在一些实施方案中,腺苷脱氨酶是tada*7.10。在一些实施方案中,tada*7.10包含至少一个改变。在特定实施方案中,tada*7.10包含以下改变中的一种或多种:y147t、y147r、q154s、y123h、v82s、t166r和q154r。本文中,改变y123h也称为h123h(tada*7.10中的改变h123y修复为y123h(wt))。在其他实施方案中,tada*7.10包含选自以下组的改变的组合:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h;i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;andi76y v82s y123h y147r q154r。在特定实施方案中,腺苷脱氨酶变体包含c端的缺失,该缺失起始于残基149、150、151、152、153、154、155、156和157。[0979]在一些实施方案中,tada变体包含至少一个相对于tada7.10的改变。在一些实施方案中,tada变体包含至少一个相对于野生型tada的改变。tada变体中的氨基酸改变可以是相对于tada7.10或野生型tada的如本文所述的任何一种氨基酸置换。在一些实施方案中,tada变体例如tada8包含位于氨基酸位置23、26、36、37、48、49、51、72、84、87、105、108、123、125、142、145、147、152、155、16、157、161处的氨基酸改变或其组合。在一些实施方案中,tada变体包含相对于tada7.10的氨基酸改变v82x,其中x是除v之外的任何氨基酸。在一些实施方案中,tada变体包含相对于tada7.10的v82s改变。在一些实施方案中,氨基酸x是酸性氨基酸、碱性氨基酸或中性氨基酸。在一些实施方案中,tada变体包含相对于tada7.10的氨基酸改变t166x,其中x是除t之外的任何氨基酸。在一些实施方案中,氨基酸x是酸性氨基酸、碱性氨基酸或中性氨基酸。在一些实施方案中,tada变体包含相对于tada7.10的氨基酸改变v82x、y147x、q154x、i76x、y123x、r23x、l36x、a48x、l51x、f84x、v106x、n108x、y123x、c146x、y147x、p152x、q154x、v155x、f156x、n157x、t166x或其任何组合,其中x是除tada7.10中的该氨基酸之外的任何氨基酸。在一些实施方案中,x是酸性氨基酸、碱性氨基酸或中性氨基酸。在一些实施方案中,x将氨基酸逆转为tada参考序列中的野生型氨基酸。[0980]在其他实施方案中,本发明的碱基编辑器是包含腺苷脱氨酶变体(例如,tada*8)的单体,该腺苷脱氨酶变体包含一种或多种以下改变:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。在其他实施方案中,腺苷脱氨酶变体(tada*8)是单体,其包含选自以下组的改变的组合:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h;i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;andi76y v82s y123h y147r q154r。在其他实施方案中,碱基编辑器是异二聚体,其包含野生型腺苷脱氨酶和腺苷脱氨酶变体(例如,tada*8),所述腺苷脱氨酶变体包含以下突变中的一种或多种:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。在其他实施方案中,碱基编辑器是异二聚体,其包含tada*7.10结构域和腺苷脱氨酶变体结构域(例如,tada*8),所述腺苷脱氨酶变体结构域包含选自以下组的改变的组合:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h;i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;andi76y v82s y123h y147r q154r。[0981]在一个实施方案中,腺苷脱氨酶是tada*8,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[0982]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd[0983]在一些实施方案中,tada*8是经截短的。在一些实施方案中,相对于全长度tada*8,经截短的tada*8失去了1、2、3、4、5,6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端氨基酸残基。在一些实施方案中,相对于全长度tada*8,经截短的tada*8失去了1、2、3、4、5,6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个c端氨基酸残基。在一些实施方案中,腺苷脱氨酶变体是全长度tada*8。[0984]在一些实施方案中,tada*8是tada*8.1、tada*8.2、tada*8.3、tada*8.4、tada*8.5、tada*8.6、tada*8.7、tada*8.8、tada*8.9、tada*8.10、tada*8.11、tada*8.12、tada*8.13、tada*8.14、tada*8.15、tada*8.16、tada*8.17、tada*8.18、tada*8.19、tada*8.20、tada*8.21、tada*8.22、tada*8.23、tada*8.24。[0985]在一种实施方案中,本发明的融合蛋白包含与本文所述的腺苷脱氨酶变体(例如,tada*8)连接的野生型tada,该腺苷脱氨酶变体与cas9切口酶连接。在特定实施方案中,融合蛋白包含单个tada*8结构域(例如,作为单体提供)。在其他实施方案中,碱基编辑器包含tada*8和tada(wt),它们能够形成异二聚体。示例性序列如下:[0986]tada(wt):[0987]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd[0988]tada*7.10:[0989]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0990]tada*8:[0991]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd.[0992]在一些实施方案中,腺苷脱氨酶包含氨基酸序列,所述氨基酸序列与下文提供的任何腺苷脱氨酶中详述的任何一个氨基酸序列为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或99.5%相同。应知悉,本文所提供的腺苷脱氨酶可以包括一个或多个突变(例如,本文所提供的任何突变)。本公开提供任何具有某一定百分比的同一性加上任何本文所述突变或其组合的脱氨酶结构域。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与参考序列或本文所提供的任何腺苷脱氨酶相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与本领域中已知或本文所述的任何一种氨基酸序列相比,该氨基酸序列具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的毗邻氨基酸残基。[0993]在特定实施方案中,tada*8包含位于以粗体显示的以下任何位置处的一个或多个突变。在其它实施方案中,tada*8包含位于以底线显示的任何位置处的一个或多个突变:[0994][0995]例如,tada*8包含位于氨基酸位置82和/或166处的改变(例如,v82s、t166r),该改变单独存在或与以下y147t、y147r、q154s、y123h和/或q154r中的任何一个或多个组合。在特定实施方案中,改变的组合选自下列组成的组:y147t q154r;y147t q154s;y147r q154s;v82s q154s;v82s y147r;v82s q154r;v82s y123h;i76y v82s;v82s y123h y147t;v82s y123h y147r;v82s y123h q154r;y147r q154r y123h;y147r q154r i76y;y147r q154r t166r;y123h y147r q154r i76y;v82s y123h y147r q154r;andi76y v82s y123h y147r q154r。[0996]在一些实施方案中,腺苷脱氨酶是tada*8,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[0997]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrig[0998]rvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffr[0999]mprqvfnaqkkaqsstd[1000]在一些实施方案中,tada*8是经截短的。在一些实施方案中,相对于全长度tada*8,经截短的tada*8失去了1、2、3、4、5,6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端氨基酸残基。在一些实施方案中,相对于全长度tada*8,经截短的tada*8失去了1、2、3、4、5,6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个c端氨基酸残基。在一些实施方案中,腺苷脱氨酶变体是全长度tada*8。[1001]在一种实施方案中,本发明的融合蛋白包含与本文所述的腺苷脱氨酶变体(例如,tada*8)连接的野生型tada,该腺苷脱氨酶变体与cas9切口酶连接。在特定实施方案中,融合蛋白包含单个tada*8结构域(例如,作为单体提供)。在其他实施方案中,碱基编辑器包含tada*8和tada(wt),它们能够形成异二聚体。[1002]在一些实施方案中,可以利用腺苷脱氨酶等位基因(例如,tada等位基因)的合成文库来产生具有经修改的碱基编辑效率和/或忒性的腺苷碱基编辑器。在一些实施方案中,从合成文库产生的腺苷碱基编辑器具有更高的碱基编辑效率和/或特异性。在一些实施方案中,与具有野生型tada的腺苷碱基编辑器相比,从合成文库产生的腺苷碱基编辑器展现出增加的碱基编辑效率、增加的碱基编辑特异性、降低的脱靶编辑、降低的旁观者编辑、降低的插入缺失形成、和/或降低的虚假编辑。在一些实施方案中,与具有tada*7.10的腺苷碱基编辑器相比,从合成文库产生的腺苷碱基编辑器展现出增加的碱基编辑效率、增加的碱基编辑特异性、降低的脱靶编辑、降低的旁观者编辑、降低的插入缺失形成、和/或降低的虚假编辑。在一些实施方案中,合成文库包含abe的随机化tada部分。在一些实施方案中,合成文库包含位于tada的每个位置处的所有20种典型氨基酸置换。在一些实施方案中,合成文库包含每文库成员1-2个核苷酸置换突变的平均频率。在一些实施方案中,合成文库包含在tada*7.10中发现的背景突变。[1003]在一些实施方案中,本文所述的碱基编辑系统包含具有插入到cas9中的tada的abe。提供了相关的具有插入到cas9中的tada的abe的序列。[1004]101cas9tadains1015[1005]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1006]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1007]102cas9tadains1022[1008]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1009]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1010]103cas9tadains1029[1011]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1012]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1013]103cas9tadains1040[1014]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1015]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1016]105cas9tadains1068[1017]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdtgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1018]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1019]106cas9tadains1247[1020]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkggssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1021]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1022]107cas9tadains1054[1023]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1024]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1025]108cas9tadains1026[1026]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiaksegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1027]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1028]109cas9tadains768[1029]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1030]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1031]110.1cas9tadains1250[1032]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1033]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1034]110.2cas9tadains1250[1035]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1036]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1037]110.3cas9tadains1250[1038]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1039]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1040]110.4cas9tadains1250[1041]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1042]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1043]110.5cas9tadains1249[1044]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgsgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrpedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1045]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1046]110.5cas9tadainsdelta59-661250[1047]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1048]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1049]110.6cas9tadains1251[1050]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspegssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrdneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1051]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1052]110.7cas9tadains1252[1053]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1054]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1055]110.8cas9tadainsδ59-66c-截短1250[1056]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1057]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1058]111.1cas9tadains997[1059]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1060]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1061]111.2cas9tadains997[1062]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgssgsetpgtsesatpessggssikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1063]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1064]112δhnhtada[1065]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1066]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1067]113n端单tada螺旋截短165-末端[1068]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1069]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1070]114n端单tada螺旋截短165-末端δ59-65[1071]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1072]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1073]115.1cas9tadains1004[1074]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypkgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqlesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1075]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1076]115.2cas9tadains1005[1077]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1078]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1079]115.3cas9tadains1006[1080]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqsefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1081]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1082]115.4cas9tadains1007[1083]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1084]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1085]116.1cas9tadainsc-端截短2792[1086]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelggssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1087]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1088]116.2cas9tadainsc-端截短2791[1089]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1090]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1091]116.3cas9tadainsc-端截短2790[1092]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqlgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1093]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1094]117cas9δ1017-1069[1095]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvyssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1096]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1097]118cas9tada-cp116ins1067[1098]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietnmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypggetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1099]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1100]119cas9tadains701[1101]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1102]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1103]120cas9tadacp136ins1248[1104]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgsmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgpedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1105]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1106]121cas9tadacp136ins1052[1107]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlamnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgngeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1108]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1109]122cas9tadacp136ins1041[1110]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1111]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1112]123cas9tadacp139ins1299[1113]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1114]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1115]124cas9δ792-872tadains[1116]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdeevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1117]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1118]125cas9δ792-906tadains[1119]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1120]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1121]126tadacp65ins1003[1122]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypktahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdplesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1123]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1124]127tadacp65ins1016[1125]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1126]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1127]128tadacp65ins1022[1128]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmitahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1129]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1130]129tadacp65ins1029[1131]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeitahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpgkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1132]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1133]130tadacp65ins1041[1134]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffystahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1135]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1136]131tadacp65ins1054[1137]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlantahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpgeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1138]‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑[1139]132tadacp65ins1246[1140]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1141]据此,在一些实施方案中,产生了腺苷脱氨酶碱基编辑器,以将tada或其变体在经鉴定位置处插入到cas9多肽中。[1142]在一些实施方案中,可以利用腺苷脱氨酶等位基因(例如,tada等位基因)的合成文库来产生具有经修改的碱基编辑效率和/或忒性的腺苷碱基编辑器。在一些实施方案中,从合成文库产生的腺苷碱基编辑器具有更高的碱基编辑效率和/或特异性。在一些实施方案中,与具有野生型tada的腺苷碱基编辑器相比,从合成文库产生的腺苷碱基编辑器展现出增加的碱基编辑效率、增加的碱基编辑特异性、降低的脱靶编辑、降低的旁观者编辑、降低的插入缺失形成、和/或降低的虚假编辑。在一些实施方案中,与具有tada*7.10的腺苷碱基编辑器相比,从合成文库产生的腺苷碱基编辑器展现出增加的碱基编辑效率、增加的碱基编辑特异性、降低的脱靶编辑、降低的旁观者编辑、降低的插入缺失形成、和/或降低的虚假编辑。在一些实施方案中,合成文库包含abe的随机化tada部分。在一些实施方案中,合成文库包含位于tada的每个位置处的所有20种典型氨基酸置换。在一些实施方案中,合成文库包含每文库成员1-2个核苷酸置换突变的平均频率。在一些实施方案中,合成文库包含在tada*7.10中发现的背景突变。[1143]c到t的编辑[1144]在一些实施方案中,本文所公开的碱基编辑器包含融合蛋白,该融合蛋白包含能够将多核苷酸的靶标胞苷(c)碱基脱氨基以产生尿苷(u)的胞苷脱氨酶,尿苷具有胸腺嘧啶的碱基配对特性。在一些实施方案中,例如,当多核苷酸为双链(例如,dna)时,将尿苷碱基取代为胸苷碱基(例如,通过细胞修复结构)以引起c:g到t:a的转换。在其他实施方案中,通过碱基编辑器将核酸中的c脱氨基为u不能伴随u到t的置换。[1145]将多核苷酸中的靶标c脱氨基以导致u,是一种能够通过本文所述的碱基编辑器执行的碱基编辑类型的非限制性示例。在另一实施例中,包含胞苷脱氨酶结构域的碱基编辑器可以接到胞苷(c)碱基到鸟苷(g)碱基的转化。例如,通过碱基编辑器的胞苷脱氨酶将胞苷脱氨基产生的多核苷酸的u可以通过碱基切除修复机制(例如,通过尿嘧啶dna糖苷酶(udg)结构域)从多核苷酸切除,产生无碱基位点。然后,通可以过例如跨损伤聚合酶将与无碱基位点相对的核碱基置换(例如,通过碱基修复机构)为另一碱基诸如c。尽管将与无碱基位点相对的核碱基替换为c是典型的,但也可能发生其他置换(例如,a、g或t)。[1146]据此,在一些实施方案中,本文所述的碱基编辑器包含能够将多核苷酸中的靶标c脱氨基为u的脱氨反应结构域(例如,胞苷脱氨酶结构域)。再者,如下文所述,碱基编辑器可以包含额外结构域,该额外结构域促进脱氨反应所得的u转化为(在一些实施方案中)t或g。例如,包含胞苷脱氨酶结构域的碱基编辑器可以进一步包含尿嘧啶糖苷酶抑制剂(ugi)结构域以介导通过t置换u,完成c到t的碱基编辑事件。在另一实施例中,碱基编辑器可以将跨损伤聚合酶并入以改善c到g的碱基编辑的效率,因为跨损伤聚合酶可以促进与无碱基位点相对的c的并入(即,造成g并入到无碱基位点处并且完成c到g的碱基编辑事件)。在一些实施方案中,额外结构域与脱氨酶结构域在内部融合。[1147]包含胞苷脱氨酶作为结构域的碱基编辑器可以将任何多核苷酸中的靶标c脱氨基,该多核苷酸包括dna、rna和dna-rna杂交物。典型地,胞苷脱氨酶催化定位在多核苷酸的单链部分情境中的c核碱基。在一些实施方案中,包含靶标c的整体多核苷酸可以是单链的。例如,被并入碱基编辑器中的胞苷脱氨酶可以将单链rna多核苷酸中的靶标c脱氨基。在其他实施方案中,包含胞苷脱氨酶结构域的碱基编辑器可以作用于双链多核苷酸,但靶标c可以定位在多核苷酸的一部分中,该部分在脱氨基反应发生时处于单链状态。例如,在其中napdnabp结构域包含cas12结构域的实施方案中,在cas12-grna-靶标dna复合物的形成过程中,可以留下几个未配对的核苷酸,导致cas12“r-环复合物”的形成。这些未配对的核苷酸可以形成单链dna泡,其充当单链特异性核苷酸脱氨酶(例如,胞苷脱氨酶)的底物。[1148]在一些实施方案中,碱基编辑器的胞苷脱氨酶可以包含载脂蛋白bmrna编辑复合物(apobec)家族脱氨酶的全部或一部分。apobec家族包含在进化中保守的胞苷脱氨酶。这一家族的成员是c至u编辑酶。apobec样蛋白的n端结构域是催化结构域,而c端结构域是假催化结构域。更详细地,催化结构域是锌依赖性胞苷脱氨酶结构域,并且对于胞苷脱氨反应而言至关重要。apobec家族成员包括apobec1、apobec2、apobec3a、apobec3b、apobec3c、apobec3d(现在成为“apobec3e”)、apobec3f、apobec3g、apobec3h、apobec4和启动诱导的(胞苷)脱氨酶(aid)。多种包含经修饰的胞苷脱氨酶的碱基编辑器是商业上可获得的,包括但不限于sabe3、sakkh-be3、vqr-be3、eqr-be3、vrer-be3、ye1-be3、ee-be3、ye2-be3和yee-be3,它们可以从addgene获得(质粒85169、85170、85171、85172、85173、85174、85175、85176、85177)。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec1脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec2脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec3脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec3a脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec3b脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec3c脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec3d脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec3e脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec3f脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec3g脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec3h脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含apobec4脱氨酶的全部或一部分。在一些实施方案中,被并入碱基编辑器的脱氨酶包含启动诱导的脱氨酶(aid)的全部或一部分。[1149]在一些实施方案中,被并入碱基编辑器的脱氨酶包含胞苷脱氨酶1(cda1)的全部或一部分。应知悉,碱基编辑器可以包含来自任何合适的生物体(例如,人或大鼠)的脱氨酶。在一些实施方案中,碱基编辑器的脱氨酶来自人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠。在一些实施方案中,碱基编辑器的脱氨酶结构域源自大鼠(例如,大鼠apobec1)。在一些实施方案中,碱基编辑器的脱氨酶结构域是人apobec1。在一些实施方案中,碱基编辑器的脱氨酶结构域是pmcda1。[1150]pmcda1的碱基序列和氨基酸序列以及人aid的cds的碱基序列和氨基酸序列显示于下文中。[1151]》tr|a5h718|a5h718_petma胞嘧啶脱氨酶os=海七鳃鳗ox=7757pe=2sv=1[1152]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsimiqvkilhttkspav[1153]》ef094822.1海七鳃鳗分离物pmcda.21胞嘧啶脱氨酶mrna,完全cds[1154]tgacacgacacagccgtgtatatgaggaagggtagctggatggggggggggggaatacgttcagagaggacattagcgagcgtcttgttggtggccttgagtctagacacctgcagacatgaccgacgctgagtacgtgagaatccatgagaagttggacatctacacgtttaagaaacagtttttcaacaacaaaaaatccgtgtcgcatagatgctacgttctctttgaattaaaacgacggggtgaacgtagagcgtgtttttggggctatgctgtgaataaaccacagagcgggacagaacgtggaattcacgccgaaatctttagcattagaaaagtcgaagaatacctgcgcgacaaccccggacaattcacgataaattggtactcatcctggagtccttgtgcagattgcgctgaaaagatcttagaatggtataaccaggagctgcgggggaacggccacactttgaaaatctgggcttgcaaactctattacgagaaaaatgcgaggaatcaaattgggctgtggaacctcagagataacggggttgggttgaatgtaatggtaagtgaacactaccaatgttgcaggaaaatattcatccaatcgtcgcacaatcaattgaatgagaatagatggcttgagaagactttgaagcgagctgaaaaacgacggagcgagttgtccattatgattcaggtaaaaatactccacaccactaagagtcctgctgtttaagaggctatgcggatggttttc[1155]》tr|q6qj80|q6qj80_human启动诱导的胞苷脱氨酶os=智人ox=9606gn=aicdape=2sv=1[1156]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkapv[1157]》ng_011588.1:5001-15681智人启动诱导的胞苷脱氨酶(aicda),染色体12上的refseqgene(lrg_17)[1158]agagaaccatcattaattgaagtgagatttttctggcctgagacttgcagggaggcaagaagacactctggacaccactatggacaggtaaagaggcagtcttctcgtgggtgattgcactggccttcctctcagagcaaatctgagtaatgagactggtagctatccctttctctcatgtaactgtctgactgataagatcagcttgatcaatatgcatatatattttttgatctgtctccttttcttctattcagatcttatacgctgtcagcccaattctttctgtttcagacttctcttgatttccctctttttcatgtggcaaaagaagtagtgcgtacaatgtactgattcgtcctgagatttgtaccatggttgaaactaatttatggtaataatattaacatagcaaatctttagagactcaaatcatgaaaaggtaatagcagtactgtactaaaaacggtagtgctaattttcgtaataattttgtaaatattcaacagtaaaacaacttgaagacacactttcctagggaggcgttactgaaataatttagctatagtaagaaaatttgtaattttagaaatgccaagcattctaaattaattgcttgaaagtcactatgattgtgtccattataaggagacaaattcattcaagcaagttatttaatgttaaaggcccaattgttaggcagttaatggcacttttactattaactaatctttccatttgttcagacgtagcttaacttacctcttaggtgtgaatttggttaaggtcctcataatgtctttatgtgcagtttttgataggttattgtcatagaacttattctattcctacatttatgattactatggatgtatgagaataacacctaatccttatactttacctcaatttaactcctttataaagaacttacattacagaataaagattttttaaaaatatatttttttgtagagacagggtcttagcccagccgaggctggtctctaagtcctggcccaagcgatcctcctgcctgggcctcctaaagtgctggaattatagacatgagccatcacatccaatatacagaataaagatttttaatggaggatttaatgttcttcagaaaattttcttgaggtcagacaatgtcaaatgtctcctcagtttacactgagattttgaaaacaagtctgagctataggtccttgtgaagggtccattggaaatacttgttcaaagtaaaatggaaagcaaaggtaaaatcagcagttgaaattcagagaaagacagaaaaggagaaaagatgaaattcaacaggacagaagggaaatatattatcattaaggaggacagtatctgtagagctcattagtgatggcaaaatgacttggtcaggattatttttaacccgcttgtttctggtttgcacggctggggatgcagctagggttctgcctcagggagcacagctgtccagagcagctgtcagcctgcaagcctgaaacactccctcggtaaagtccttcctactcaggacagaaatgacgagaacagggagctggaaacaggcccctaaccagagaagggaagtaatggatcaacaaagttaactagcaggtcaggatcacgcaattcatttcactctgactggtaacatgtgacagaaacagtgtaggcttattgtattttcatgtagagtaggacccaaaaatccacccaaagtcctttatctatgccacatccttcttatctatacttccaggacactttttcttccttatgataaggctctctctctctccacacacacacacacacacacacacacacacacacacacacacacaaacacacaccccgccaaccaaggtgcatgtaaaaagatgtagattcctctgcctttctcatctacacagcccaggagggtaagttaatataagagggatttattggtaagagatgatgcttaatctgtttaacactgggcctcaaagagagaatttcttttcttctgtacttattaagcacctattatgtgttgagcttatatatacaaagggttattatatgctaatatagtaatagtaatggtggttggtactatggtaattaccataaaaattattatccttttaaaataaagctaattattattggatcttttttagtattcattttatgttttttatgtttttgattttttaaaagacaatctcaccctgttacccaggctggagtgcagtggtgcaatcatagctttctgcagtcttgaactcctgggctcaagcaatcctcctgccttggcctcccaaagtgttgggatacagtcatgagccactgcatctggcctaggatccatttagattaaaatatgcattttaaattttaaaataatatggctaatttttaccttatgtaatgtgtatactggcaataaatctagtttgctgcctaaagtttaaagtgctttccagtaagcttcatgtacgtgaggggagacatttaaagtgaaacagacagccaggtgtggtggctcacgcctgtaatcccagcactctgggaggctgaggtgggtggatcgcttgagccctggagttcaagaccagcctgagcaacatggcaaaacgctgtttctataacaaaaattagccgggcatggtggcatgtgcctgtggtcccagctactagggggctgaggcaggagaatcgttggagcccaggaggtcaaggctgcactgagcagtgcttgcgccactgcactccagcctgggtgacaggaccagaccttgcctcaaaaaaataagaagaaaaattaaaaataaatggaaacaactacaaagagctgttgtcctagatgagctacttagttaggctgatattttggtatttaacttttaaagtcagggtctgtcacctgcactacattattaaaatatcaattctcaatgtatatccacacaaagactggtacgtgaatgttcatagtacctttattcacaaaaccccaaagtagagactatccaaatatccatcaacaagtgaacaaataaacaaaatgtgctatatccatgcaatggaataccaccctgcagtacaaagaagctacttggggatgaatcccaaagtcatgacgctaaatgaaagagtcagacatgaaggaggagataatgtatgccatacgaaattctagaaaatgaaagtaacttatagttacagaaagcaaatcagggcaggcatagaggctcacacctgtaatcccagcactttgagaggccacgtgggaagattgctagaactcaggagttcaagaccagcctgggcaacacagtgaaactccattctccacaaaaatgggaaaaaaagaaagcaaatcagtggttgtcctgtggggaggggaaggactgcaaagagggaagaagctctggtggggtgagggtggtgattcaggttctgtatcctgactgtggtagcagtttggggtgtttacatccaaaaatattcgtagaattatgcatcttaaatgggtggagtttactgtatgtaaattatacctcaatgtaagaaaaaataatgtgtaagaaaactttcaattctcttgccagcaaacgttattcaaattcctgagccctttacttcgcaaattctctgcacttctgccccgtaccattaggtgacagcactagctccacaaattggataaatgcatttctggaaaagactagggacaaaatccaggcatcacttgtgctttcatatcaaccatgctgtacagcttgtgttgctgtctgcagctgcaatggggactcttgatttctttaaggaaacttgggttaccagagtatttccacaaatgctattcaaattagtgcttatgatatgcaagacactgtgctaggagccagaaaacaaagaggaggagaaatcagtcattatgtgggaacaacatagcaagatatttagatcattttgactagttaaaaaagcagcagagtacaaaatcacacatgcaatcagtataatccaaatcatgtaaatatgtgcctgtagaaagactagaggaataaacacaagaatcttaacagtcattgtcattagacactaagtctaattattattattagacactatgatatttgagatttaaaaaatctttaatattttaaaatttagagctcttctatttttccatagtattcaagtttgacaatgatcaagtattactctttctttttttttttttttttttttttttgagatggagttttggtcttgttgcccatgctggagtggaatggcatgaccatagctcactgcaacctccacctcctgggttcaagcaaagctgtcgcctcagcctcccgggtagatgggattacaggcgcccaccaccacactcggctaatgtttgtatttttagtagagatggggtttcaccatgttggccaggctggtctcaaactcctgacctcagaggatccacctgcctcagcctcccaaagtgctgggattacagatgtaggccactgcgcccggccaagtattgctcttatacattaaaaaacaggtgtgagccactgcgcccagccaggtattgctcttatacattaaaaaataggccggtgcagtggctcacgcctgtaatcccagcactttgggaagccaaggcgggcagaacacccgaggtcaggagtccaaggccagcctggccaagatggtgaaaccccgtctctattaaaaatacaaacattacctgggcatgatggtgggcgcctgtaatcccagctactcaggaggctgaggcaggaggatccgcggagcctggcagatctgcctgagcctgggaggttgaggctacagtaagccaagatcatgccagtatacttcagcctgggcgacaaagtgagaccgtaacaaaaaaaaaaaaatttaaaaaaagaaatttagatcaagatccaactgtaaaaagtggcctaaacaccacattaaagagtttggagtttattctgcaggcagaagagaaccatcagggggtcttcagcatgggaatggcatggtgcacctggtttttgtgagatcatggtggtgacagtgtggggaatgttattttggagggactggaggcagacagaccggttaaaaggccagcacaacagataaggaggaagaagatgagggcttggaccgaagcagagaagagcaaacagggaaggtacaaattcaagaaatattggggggtttgaatcaacacatttagatgattaattaaatatgaggactgaggaataagaaatgagtcaaggatggttccaggctgctaggctgcttacctgaggtggcaaagtcgggaggagtggcagtttaggacagggggcagttgaggaatattgttttgatcattttgagtttgaggtacaagttggacacttaggtaaagactggaggggaaatctgaatatacaattatgggactgaggaacaagtttattttattttttgtttcgttttcttgttgaagaacaaatttaattgtaatcccaagtcatcagcatctagaagacagtggcaggaggtgactgtcttgtgggtaagggtttggggtccttgatgagtatctctcaattggccttaaatataagcaggaaaaggagtttatgatggattccaggctcagcagggctcaggagggctcaggcagccagcagaggaagtcagagcatcttctttggtttagcccaagtaatgacttccttaaaaagctgaaggaaaatccagagtgaccagattataaactgtactcttgcattttctctccctcctctcacccacagcctcttgatgaaccggaggaagtttctttaccaattcaaaaatgtccgctgggctaagggtcggcgtgagacctacctgtgctacgtagtgaagaggcgtgacagtgctacatccttttcactggactttggttatcttcgcaataaggtatcaattaaagtcggctttgcaagcagtttaatggtcaactgtgagtgcttttagagccacctgctgatggtattacttccatccttttttggcatttgtgtctctatcacattcctcaaatccttttttttatttctttttccatgtccatgcacccatattagacatggcccaaaatatgtgatttaattcctccccagtaatgctgggcaccctaataccactccttccttcagtgccaagaacaactgctcccaaactgtttaccagctttcctcagcatctgaattgcctttgagattaattaagctaaaagcatttttatatgggagaatattatcagcttgtccaagcaaaaattttaaatgtgaaaaacaaattgtgtcttaagcatttttgaaaattaaggaagaagaatttgggaaaaaattaacggtggctcaattctgtcttccaaatgatttcttttccctcctactcacatgggtcgtaggccagtgaatacattcaacatggtgatccccagaaaactcagagaagcctcggctgatgattaattaaattgatctttcggctacccgagagaattacatttccaagagacttcttcaccaaaatccagatgggtttacataaacttctgcccacgggtatctcctctctcctaacacgctgtgacgtctgggcttggtggaatctcagggaagcatccgtggggtggaaggtcatcgtctggctcgttgtttgatggttatattaccatgcaattttctttgcctacatttgtattgaatacatcccaatctccttcctattcggtgacatgacacattctatttcagaaggctttgattttatcaagcactttcatttacttctcatggcagtgcctattacttctcttacaatacccatctgtctgctttaccaaaatctatttccccttttcagatcctcccaaatggtcctcataaactgtcctgcctccacctagtggtccaggtatatttccacaatgttacatcaacaggcacttctagccattttccttctcaaaaggtgcaaaaagcaacttcataaacacaaattaaatcttcggtgaggtagtgtgatgctgcttcctcccaactcagcgcacttcgtcttcctcattccacaaaaacccatagccttccttcactctgcaggactagtgctgccaagggttcagctctacctactggtgtgctcttttgagcaagttgcttagcctctctgtaacacaaggacaatagctgcaagcatccccaaagatcattgcaggagacaatgactaaggctaccagagccgcaataaaagtcagtgaattttagcgtggtcctctctgtctctccagaacggctgccacgtggaattgctcttcctccgctacatctcggactgggacctagaccctggccgctgctaccgcgtcacctggttcacctcctggagcccctgctacgactgtgcccgacatgtggccgactttctgcgagggaaccccaacctcagtctgaggatcttcaccgcgcgcctctacttctgtgaggaccgcaaggctgagcccgaggggctgcggcggctgcaccgcgccggggtgcaaatagccatcatgaccttcaaaggtgcgaaagggccttccgcgcaggcgcagtgcagcagcccgcattcgggattgcgatgcggaatgaatgagttagtggggaagctcgaggggaagaagtgggcggggattctggttcacctctggagccgaaattaaagattagaagcagagaaaagagtgaatggctcagagacaaggccccgaggaaatgagaaaatggggccagggttgcttctttcccctcgatttggaacctgaactgtcttctacccccatatccccgcctttttttcctttttttttttttgaagattatttttactgctggaatacttttgtagaaaaccacgaaagaactttcaaagcctgggaagggctgcatgaaaattcagttcgtctctccagacagcttcggcgcatccttttggtaaggggcttcctcgctttttaaattttctttctttctctacagtcttttttggagtttcgtatatttcttatattttcttattgttcaatcactctcagttttcatctgatgaaaactttatttctcctccacatcagctttttcttctgctgtttcaccattcagagccctctgctaaggttccttttccctcccttttctttcttttgttgtttcacatctttaaatttctgtctctccccagggttgcgtttccttcctggtcagaattcttttctcctttttttttttttttttttttttttttaaacaaacaaacaaaaaacccaaaaaaactctttcccaatttactttcttccaacatgttacaaagccatccactcagtttagaagactctccggccccaccgacccccaacctcgttttgaagccattcactcaatttgcttctctctttctctacagcccctgtatgaggttgatgacttacgagacgcatttcgtactttgggactttgatagcaacttccaggaatgtcacacacgatgaaatatctctgctgaagacagtggataaaaaacagtccttcaagtcttctctgtttttattcttcaactctcactttcttagagtttacagaaaaaatatttatatacgactctttaaaaagatctatgtcttgaaaatagagaaggaacacaggtctggccagggacgtgctgcaattggtgcagttttgaatgcaacattgtcccctactgggaataacagaactgcaggacctgggagcatcctaaagtgtcaacgtttttctatgacttttaggtaggatgagagcagaaggtagatcctaaaaagcatggtgagaggatcaaatgtttttatatcaacatcctttattatttgattcatttgagttaacagtggtgttagtgatagatttttctattcttttcccttgacgtttactttcaagtaacacaaactcttccatcaggccatgatctataggacctcctaatgagagtatctgggtgattgtgaccccaaaccatctctccaaagcattaatatccaatcatgcgctgtatgttttaatcagcagaagcatgtttttatgtttgtacaaaagaagattgttatgggtggggatggaggtatagaccatgcatggtcaccttcaagctactttaataaaggatcttaaaatgggcaggaggactgtgaacaagacaccctaataatgggttgatgtctgaagtagcaaatcttctggaaacgcaaactcttttaaggaagtccctaatttagaaacacccacaaacttcacatatcataattagcaaacaattggaaggaagttgcttgaatgttggggagaggaaaatctattggctctcgtgggtctcttcatctcagaaatgccaatcaggtcaaggtttgctacattttgtatgtgtgtgatgcttctcccaaaggtatattaactatataagagagttgtgacaaaacagaatgataaagctgcgaaccgtggcacacgctcatagttctagctgcttgggaggttgaggagggaggatggcttgaacacaggtgttcaaggccagcctgggcaacataacaagatcctgtctctcaaaaaaaaaaaaaaaaaaaagaaagagagagggccgggcgtggtggctcacgcctgtaatcccagcactttgggaggccgagccgggcggatcacctgtggtcaggagtttgagaccagcctggccaacatggcaaaaccccgtctgtactcaaaatgcaaaaattagccaggcgtggtagcaggcacctgtaatcccagctacttgggaggctgaggcaggagaatcgcttgaacccaggaggtggaggttgcagtaagctgagatcgtgccgttgcactccagcctgggcgacaagagcaagactctgtctcagaaaaaaaaaaaaaaaagagagagagagagaaagagaacaatatttgggagagaaggatggggaagcattgcaaggaaattgtgctttatccaacaaaatgtaaggagccaataagggatccctatttgtctcttttggtgtctatttgtccctaacaactgtctttgacagtgagaaaaatattcagaataaccatatccctgtgccgttattacctagcaacccttgcaatgaagatgagcagatccacaggaaaacttgaatgcacaactgtcttattttaatcttattgtacataagtttgtaaaagagttaaaaattgttacttcatgtattcatttatattttatattattttgcgtctaatgattttttattaacatgatttccttttctgatatattgaaatggagtctcaaagcttcataaatttataactttagaaatgattctaataacaacgtatgtaattgtaacattgcagtaatggtgctacgaagccatttctcttgatttttagtaaacttttatgacagcaaatttgcttctggctcactttcaatcagttaaataaatgataaataattttggaagctgtgaagataaaataccaaataaaataatataaaagtgatttatatgaagttaaaataaaaaatcagtatgatggaataaacttg[1159]其他可用于本发明的方法中的胞苷脱氨酶提供于下。[1160]rapobec-1褐家鼠(rattusnorvegicus)[1161]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[1162]mapobec-1小家鼠(musmusculus)[1163]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsvwrhtsqntsn[1164]hvevnflekftteryfrpntrcsitwflswspcgecsraiteflsrhpyvtlfiyiarly[1165]hhtdqrnrqglrdlissgvtiqimteqeycycwrnfvnyppsneaywpryphlwvklyvlelyciilglppclkilrrkqpqltfftitlqtchyqripphllwatglk[1166]maapobec-1金黄仓鼠(mesocricetusauratus)[1167]mssetgpvvvdptlrrriephefdaffdqgelrketcllyeirwggrhniwrhtgqntsrhveinfiekftseryfypstrcsivwflswspcgecskaiteflsghpnvtlfiyaarly[1168]hhtdqrnrqglrdlisrgvtirimteqeycycwrnfvnyppsnevywprypnlwmrlyalelycihlglppclkikrrhqypltffrlnlqschyqripphilwatgfi[1169]hapobec-1智人(homosapiens)[1170]mtsekgpstgdptlrrriepwefdvfydprelrkeacllyeikwgmsrkiwrssgknttnhvevnfikkftserdfhpsmscsitwflswspcwecsqaireflsrhpgvtlviyvarlf[1171]whmdqqnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhltffrlhlqnchyqtipphillatglihpsvawr[1172]ppapobec-1婆罗洲猩猩(pongopygmaeus)[1173]mtsekgpstgdptlrrrieswefdvfydprelrketcllyeikwgmsrkiwrssgknttnhvevnfikkftserrfhssiscsitwflswspcwecsqaireflsqhpgvtlviyvarlf[1174]whmdqrnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhlaffrlhlqnchyqtipphillatglihpsvtwr[1175]ocapobec1穴兔(oryctolaguscuniculus)[1176]masekgpsnkdytlrrriepwefevffdpqelrkeacllyeikwgassktwrssgknttnhvevnflekltsegrlgpstccsitwflswspcwecsmaireflsqhpgvtliifvarlf[1177]qhmdrrnrqglkdlvtsgvtvrvmsvseycycwenfvnyppgkaaqwprypprwmlmyalelyciilglppclkisrrhqkqltffsltpqychykmippyillatgllqpsvpwr[1178]mdapobec-1灰短尾负鼠(monodelphisdomestica)[1179]mnsktgpsvgdatlrrrikpwefvaffnpqelrketcllyeikwgnqniwrhsnqntsqhaeinfmekftaerhfnssvrcsitwflswspcwecskairkfldhypnvtlaifisrlywhmdqqhrqglkelvhsgvtiqimsyseyhycwrnfvdypqgeedywpkypylwimlyvlelhciilglppclkisgshsnqlalfsldlqdchyqkipynvlvatglvqpfvtwr[1180]mapobec-2小家鼠(musmusculus)[1181]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvvevqskggqaqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1182]hapobec-2智人(homosapiens)[1183]maqkeeaavateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnve[1184]yssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweepeiqaalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[1185]ppapobec-2婆罗洲猩猩(pongopygmaeus)[1186]maqkeeaaaateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnve[1187]yssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweeleiqdalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[1188]btapobec-2黄牛(bostaurus)[1189]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnve[1190]yssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1191]mapobec-3小家鼠(musmusculus)[1192]mqpqrlgpragmgpfclgcshrkcyspirnlisqetfkfhfknlgyakgrkdtflcyevtrkdcdspvslhhgvfknkdnihaeicflywfhdkvlkvlspreefkitwymswspcfecaeqivrflathhnlsldifssrlynvqdpetqqnlcrlvqegaqvaamdlyefkkcwkkfvdnggrrfrpwkrlltnfryqdsklqeilrpcyisvpssssstlsnicltkglpetrfwvegrrmdplseeefysqfynqrvkhlcyyhrmkpylcyqleqfngqaplkgcllsekgkqhaeilfldkirsmelsqvtitcyltwspcpncawqlaafkrdrpdlilhiytsrlyfhwkrpfqkglcslwqsgilvdvmdlpqftdcwtnfvnpkrpfwpwkgleiisrrtqrrlrrikeswglqdlvndfgnlqlgppms[1193]hapobec-3a智人(homosapiens)[1194]measpasgprhlmdphiftsnfnngigrhktylcyeverldngtsvkmdqhrgflhnqaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefkhcwdtfvdhqgcpfqpwdgldehsqalsgrlrailqnqgn[1195]hapobec-3b智人(homosapiens)[1196]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgqvyfkpqyhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflsehpnvtltisaarlyyywerdyrralcrlsqagarvtimdyeefaycwenfvynegqqfmpwykfdenyaflhrtlkeilrylmdpdtftfnfnndplvlrrrqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqnqgn[1197]hapobec-3c智人(homosapiens)[1198]mnpqirnpmkamypgtfyfqfknlweandrnetwlcftvegikrrsvvswktgvfrnqvdsethchaercflswfcddilspntkyqvtwytswspcpdcagevaeflarhsnvnltiftarlyyfqypcyqeglrslsqegvaveimdyedfkycwenfvyndnepfkpwkglktnfrllkrrlreslq[1199]hapobec-3d智人(homosapiens)[1200]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgpvlpkrqsnhrqevyfrfenhaemcflswfcgnrlpanrrfqitwfvswnpclpcvvkvtkflaehpnvtltisaarlyyyrdrdwrwvllrlhkagarvkimdyedfaycwenfvcnegqpfmpwykfddnyaslhrtlkeilrnpmeamyphifyfhfknllkacgrneswlcftmevtkhhsavfrkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlcyfwdtdyqeglcslsqegasvkimgykdfvscwknfvysddepfkpwkglqtnfrllkrrlreilq[1201]hapobec-3f智人(homosapiens)[1202]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrprldakifrgqvysqpehhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvysegqpfmpwykfddnyaflhrtlkeilrnpmeamyphifyfhfknlrkaygrneswlcftmevvkhhspvswkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlyyfwdtdyqeglrslsqegasveimgykdfkycwenfvynddepfkpwkglkynflfldsklqeile[1203]hapobec-3g智人(homosapiens)[1204]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrppldakifrgqvyselkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdmatflaedpkvtltifvarlyyfwdpdyqealrslcqkrdgpratmkimnydefqhcwskfvysqrelfepwnnlpkyyillhimlgeilrhsmdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisimtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen[1205]hapobec-4智人(homosapiens)[1206]mepiyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygttf[1207]pqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiil[1208]ysnnspcneanhcciskmynflitypgitlsiyfsqlyhtemdfpasawnrealrslasl[1209]wprvvlspisggiwhsvlhsfisgvsgshvfqpiltgraladrhnayeinaitgvkpyft[1210]dvllqtkrnpntkaqealesyplnnafpgqffqmpsgqlqpnlppdlrapvvfvlvplrdlppmhmgqnpnkprnivrhlnmpqmsfqetkdlgrlptgrsveiveiteqfasskeadekkkkkgkk[1211]mapobec-4小家鼠(musmusculus)[1212]mdsllmkqkkflyhfknvrwakgrhetylcyvvkrrdsatscsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvaeflrwnpnlslriftarlyfcedrkaepeglrrlhragvqigimtfkdyfycwntfvenrertfkaweglhensvrltrqlrrillplyevddlrdafrmlgf[1213]rapobec-4褐家鼠(rattusnorvegicus)[1214]meplyeeylthsgtivkpyywlsvslnctncpyhirtgeearvpytefhqtfgfpwstyp[1215]qtkhltfyelrsssgnliqkglasnctgshthpesmlferdgyldslifhdsnirhiily[1216]snnspcdeanhcciskmynflmnypevtlsvffsqlyhtenqfptsawnrealrglaslwpqvtlsaisggiwqsiletfvsgisegltavrpftagrtltdrynayeincitevkpyft[1217]dalhswqkenqdqkvwaasenqplhnttpaqwqpdmsqdcrtpavfmlvpyrdlppihvnpspqkprtvvrhlntlqlsaskvkalrkspsgrpvkkeearkgstrsqeanetnkskwkkqtlfiksnichllereqkkigilsswsv[1218]mfapobec-4食蟹猴(macacafascicularis)[1219]meptyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygtty[1220]pqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiil[1221]ycnnspcneanhcciskvynflitypgitlsiyfsqlyhtemdfpasawnrealrslasl[1222]wprvvlspisggiwhsvlhsfvsgvsgshvfqpiltgraltdrynayeinaitgvkpfft[1223]dvllhtkrnpntkaqmalesyplnnafpgqsfqmtsgippdlrapvvfvllplrdlppmhmgqdpnkprniirhlnmpqmsfqetkdlerlptrrsvetveiterfasskqaeektkkkkgkk[1224]haid智人(homosapiens)[1225]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1226]claid家犬亚种(canislupusfamiliaris)[1227]mdsllmkqrkflyhfknvrwakgrhetylcyvvkrrdsatsfsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslrifaarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenrektfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1228]btaid黄牛(bostaurus)[1229]mdsllkkqrqflyqfknvrwakgrhetylcyvvkrrdsptsfsldfghlrnkagchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslriftarlyfcdkerkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1230]maid小家鼠(musmusculus)[1231]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1232]pmcda-1海七鳃鳗(petromyzonmarinus)[1233]magyecvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtltmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgiplhlftlqtpllsgrvvwwrv[1234]pmcda-2海七鳃鳗(petromyzonmarinus)[1235]melrevvdcalascvrheplsrvaflrcfaapsqkprgtvilfyvegagrgvtgghavnynkqgtsihaevlllsavraallrrrrcedgeeatrgctlhcystyspcrdcveyiqefgastgvrvvihccrlyeldvnrrrseaegvlrslsrlgrdfrlmgprdaialllggrlantadgesgasgnawvtetnvveplvdmtgfgdedlhaqvqrnkqireayanyasavslmlgelhvdpdkfpflaeflaqtsvepsgtpretrgrprgassrgpeigrqrpadferalgayglflhprivsreadreeikrdlivvmrkhnyqgp[1236]pmcda-5海七鳃鳗(petromyzonmarinus)[1237]magdenvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtlmmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgmplhlft[1238]ycd酿酒酵母(saccharomycescerevisiae)[1239]mvtggmaskwdqkgmdiayeeaalgykeggvpiggclinnkdgsvlgrghnmrfqkgsatlhgeistlencgrlegkvykdttlyttlspcdmctgaiimygiprcvvgenvnfkskgekylqtrghevvvvdderckkimkqfiderpqdwfedige[1240]rapobec-1(δ177-186)[1241]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrglppclnilrrkqpqltfftialqschyqrlpphilwatglk[1242]rapobec-1(δ202-213)[1243]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqhyqrlpphilwatglk[1244]人aid:[1245][1246](底线:核定位序列;双底线:核输出信号)[1247]小鼠aid:[1248][1248](底线:核定位序列;双底线:核输出信号)[1249]犬aid:[1250][1250](底线:核定位序列;双底线:核输出信号)[1251]牛aid:[1252][1252](底线:核定位序列;双底线:核输出信号)[1253]大鼠aid[1254][1254](底线:核定位序列;双底线:核输出信号)[1255]小鼠apobec-3[1256][1256](斜体:核酸编辑结构域)[1257]大鼠apobec-3:[1258][1258][1258](斜体:核酸编辑结构域)[1259]恒河猴(rhesusmacaque)apobec-3g:[1260][1260](斜体:核酸编辑结构域;底线:细胞质定位信号)[1261]黑猩猩apobec-3g:[1262][1262](斜体:核酸编辑结构域;底线:细胞质定位信号)[1263]绿猴apobec-3g:[1264][1264](斜体:核酸编辑结构域;底线:细胞质定位信号)[1265]人apobec-3g:[1266][1266](斜体:核酸编辑结构域;底线:细胞质定位信号)[1267]人apobec-3f:[1268][1268](斜体:核酸编辑结构域)[1269]人apobec-3b:[1270][1270](斜体:核酸编辑结构域)[1271]大鼠apobec-3b:[1272]mqpqglgpnagmgpvclgcshrrpyspirnplkklyqqtfyfhfknvryawgrknnflcyevngmdcalpvplrqgvfrkqghihaelcfiywfhdkvlrvlspmeefkvtwymswspcskcaeqvarflaahrnlslaifssrlyyylrnpnyqqklcrliqegvhvaamdlpefkkcwnkfvdndgqpfrpwmrlrinfsfydcklqeifsrmnllredvfylqfnnshrvkpvqnryyrrksylcyqlerangqeplkgyllykkgeqhveilflekmrsmelsqvritcyltwspcpncarqlaafkkdhpdlilriytsrlyfwrkkfqkglctlwrsgihvdvmdlpqfadcwtnfvnpqrpfrpwneleknswriqrrlrrikeswgl[1273]牛apobec-3b:[1274]dgwevafrsgtvlkagvlgvsmtegwagsghpgqgacvwtpgtrntmnllrevlfkqqfgnqprvpapyyrrktylcyqlkqrndltldrgcfrnkkqrhaerfidkinsldlnpsqsykiicyitwspcpncanelvnfitrnnhlkleifasrlyfhwiksfkmglqdlqnagisvavmthtefedcweqfvdnqsrpfqpwdkleqysasirrrlqriltapi[1275]黑猩猩apobec-3b:[1276]mnpqirnpmewmyqrtfyynfenepilygrsytwlcyevkirrghsnllwdtgvfrgqmysqpehhaemcflswfcgnqlsaykcfqitwfvswtpcpdcvaklakflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvynegqpfmpwykfddnyaflhrtlkeiirhlmdpdtftfnfnndplvlrrhqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagqvraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqvrasslcmvphrpppppqspgpclplcsepplgsllptgrpapslpflltasfsfpppaslpplpslslspghlpvpsfhsltscsiqppcssriretegwasvskegrdlg[1277]人apobec-3c:[1278][1278](斜体:核酸编辑结构域)[1279]大猩猩apobec-3c3c[1280][1281]人apobec-3a:[1282][1282](斜体:核酸编辑结构域)[1283]恒河猴(rhesusmacaque)apobec-3a:[1284][1284](斜体:核酸编辑结构域)[1285]牛apobec-3a3a:[1286][1286](斜体:核酸编辑结构域)[1287]人apobec-3h:[1288]8](斜体:核酸编辑结构域)[1289]恒河猴(rhesusmacaque)apobec-3h:[1290]malltaktfslqfnnkrrvnkpyyprkallcyqltpqngstptrghlknkkkdhaeirfinkiksmgldetqcyqvtcyltwspcpscagelvdfikahrhlnlrifasrlyyhwrpnyqegllllcgsqvpvevmglpeftdcwenfvdhkeppsfnpsekleeldknsqaikrrleriksrsvdvlenglrslqlgpvtpsssirnsr[1291]人apobec-3d:[1292][1292][1292](斜体:核酸编辑结构域)[1293]人apobec-1:[1294]mtsekgpstgdptlrrriepwefdvfydprelrkeacllyeikwgmsrkiwrssgknttnhvevnfikkftserdfhpsmscsitwflswspcwecsqaireflsrhpgvtlviyvarlfwhmdqqnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhltffrlhlqnchyqtipphillatglihpsvawr[1295]小鼠apobec-1:[1296]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsvwrhtsqntsnhvevnflekftteryfrpntrcsitwflswspcgecsraiteflsrhpyvtlfiyiarlyhhtdqrnrqglrdlissgvtiqimteqeycycwrnfvnyppsneaywpryphlwvklyvlelyciilglppclkilrrkqpqltfftitlqtchyqripphllwatglk[1297]大鼠apobec-1:[1298]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[1299]人apobec-2:[1300]maqkeeaavateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweepeiqaalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[1301]小鼠apobec-2:[1302]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvvevqskggqaqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1303]大鼠apobec-2:[1304]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvveaqskggqvqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeylwqnfveqeegeskafepwediqenflyyeekladilk[1305]牛apobec-2:[1306]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnveyssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1307]海七鳃鳗(petromyzonmarinus)cda1(pmcdal)[1308]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsfmiqvkilhttkspav[1309]人apobec3g链a[1310]mdpptftfnfnnepwwgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisftysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailq[1311]根据本公开,可以内部地融合在cas12的氨基酸序列内的其他示例性脱氨酶提供于下。应理解,在一些实施方案中,可使用各序列的活性结构域,例如,没有定位信号(例如,核定位元序列、核输出信号或细胞质定位信号)的结构域。[1312]c到t核碱基编辑蛋白的细节在国际pct申请号pct/us2016/058344(wo2017/070632)和komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016)中有所描述,其整体内容通过引用并入本文。[1313]胞苷脱氨酶[1314]在一种实施方案中,本发明的融合蛋白包含胞苷脱氨酶。在一些实施方案中,本文所提供的胞苷脱氨酶能够将胞嘧啶或5-甲基胞嘧啶脱氨基化为尿嘧啶或胸腺嘧啶。在一些实施方案中,本文所体用的胞嘧啶脱氨酶能够将dna中的胞嘧啶脱氨基。胞苷脱氨酶可以源自任何合适的生物体。在一些实施方案中,胞苷脱氨酶来自原核生物。在一些实施方案中,胞苷脱氨酶来自细菌。在一些实施方案中,胞苷脱氨酶来自哺乳动物(例如,人)。[1315]在一些实施方案中,胞苷脱氨酶包含氨基酸序列,所述氨基酸序列与本文详述的任何一个胞苷脱氨酶氨基酸序列为至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或99.5%相同。[1316]本发明的融合蛋白包含核酸编辑结构域。在一些实施方案中,核酸编辑结构域可以催化c到u的碱基变化。在一些实施方案中,核酸编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白bmrna编辑复合物(apobec)家族脱氨酶。在一些实施方案中,脱氨酶是apobecl脱氨酶。在一些实施方案中,脱氨酶是apobec2脱氨酶。在一些实施方案中,脱氨酶是apobec3脱氨酶。在一些实施方案中,脱氨酶是apobec3a脱氨酶。在一些实施方案中,脱氨酶是apobec3b脱氨酶。在一些实施方案中,脱氨酶是apobec3c脱氨酶。在一些实施方案中,脱氨酶是apobec3d脱氨酶。在一些实施方案中,脱氨酶是apobec3e脱氨酶。在一些实施方案中,脱氨酶是apobec3f脱氨酶。在一些实施方案中,脱氨酶是apobec3g脱氨酶。在一些实施方案中,脱氨酶是apobec3h脱氨酶。在一些实施方案中,脱氨酶是apobec4脱氨酶。在一些实施方案中,脱氨酶是启动诱导的脱氨酶(aid)。在一些实施方案中,脱氨酶是脊椎动物脱氨酶。在一些实施方案中,脱氨酶是无脊椎动物脱氨酶。在一些实施方案中,脱氨酶是人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠脱氨酶。在一些实施方案中,脱氨酶是人脱氨酶。在一些实施方案中,脱氨酶是大鼠脱氨酶,例如,rapobecl。在一些实施方案中,脱氨酶是海七鳃鳗胞苷脱氨酶1(pmcdal)。在一些实施方案中,脱氨酶是人apobec3g。在一些实施方案中,脱氨酶是人apobec3g的片段。在一些实施方案中,核酸编辑结构域与本文所述任何脱氨酶的脱氨酶结构域为至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。[1317]额外结构域[1318]本文所述的碱基编辑器可以包括帮助促进多核苷酸的核碱基的核碱基编辑、修饰或改变的任何结构域。在一些实施方案中,碱基编辑器包含多核苷酸可编程核苷酸结合结构域(例如,cas9)、核碱基编辑结构域(例如,脱氨酶结构域)和一个或多个额外结构域。在一些实施方案中,额外结构域可以促进碱基编辑器的酶促或催化功能、碱基编辑器的结合功能,或者可以是将会干扰所希望的碱基编辑结果的细胞机构(例如,酶)的抑制剂。在一些实施方案中,甲基编辑器可以包含核酸酶、切口酶、重组酶、脱氨酶、甲基转移酶、甲基化酶、乙酰化酶、乙酰转移酶、转录启动因数或转录抑制因数结构域。[1319]在一些实施方案中,碱基编辑器可以包含尿嘧啶糖苷酶抑制剂(ugi)结构域。ugi结构域可以,例如,通过抑制通过c的脱氨反应形成的u转化回c核碱基,改善包含包含胞苷脱氨酶结构域的碱基编辑器的效率。在一些实施方案中,回应u:g异源双螺旋dna的存在的细胞dna修复可能是细胞内核碱基编辑效率下降的原因。在此类实施方案中,尿嘧啶dna糖苷酶(udg)可以催化u从细胞内的dna中移除,这可能启动碱基切除修复(ber),主要导致u:g对逆转为c:g对。在此类实施方案中,ber可以在包含一个或多个结构域的碱基编辑器中被抑制,该结构域结合单链,阻断被编辑的碱基,抑制ugi,抑制ber,保护被编辑的碱基和/或促使未经编辑的链的修复。因此,本公开设想了包含ugi结构域的碱基编辑器融合蛋白。[1320]在一些实施方案中,碱基编辑器包含双链断裂(dsb)结合蛋白的全部或一部分作为结构域。例如,dsb结合蛋白可以包括细菌噬菌体mu的gam蛋白,其结合至dsb的末端并且可以包含dsb免于降解。参见,komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其整体内容通过引用并入本文。[1321]此外,在一些实施方案中,gam蛋白可以融合至碱基编辑器的n端。在一些实施方案中,gam蛋白可以融合至碱基编辑器的c端。细菌噬菌体mu的gam蛋白可以结合至双链断裂(dsb)的末端并且保护它们免于降解。在一些实施方案中,使用gam来结合dsb的自由末端可以减少碱基编辑过程中的插入缺失形成。在一些实施方案中,将174个残基的gam蛋白融合至碱基编辑器的n端。参见,komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)。在一些实施方案中,一个或多个突变可以改变碱基编辑器结构域相对于野生型结构域的长度。例如,在至少一个结构域中至少一个氨基酸的缺失可以缩短碱基编辑器的长度。在另一种情况下,一个或多个突变不改变结构域相对于野生型结构域的长度。例如,任何结构域中的一种或多种置换不改变碱基编辑器的长度。[1322]在一些实施方案中,碱基编辑器可以包含核酸聚合酶(nap)的全部或一部分作为结构域。例如,碱基编辑器可以包含真核生物nap的全部或一部分。在一些实施方案中,被并入碱基编辑器中的nap或其部分是dna聚合酶。在一些实施方案中,被并入碱基编辑器中的nap或其部分具有跨损伤聚合酶活性。在一些实施方案中,被并入碱基编辑器中的nap或其部分是跨损伤dna聚合酶。在一些实施方案中,被并入碱基编辑器中的nap或其部分是rev7、rev1复合物、聚合酶ι、聚合酶κ或聚合酶η。在一些实施方案中,被并入碱基编辑器中的nap或其部分是真核生物聚合酶α、β、γ、δ、ε、ζ、γ、η、ι、κ、λ、μ或ν组分。在一些实施方案中,被并入碱基编辑器中的nap或其部分包含氨基酸序列,该氨基酸序列与核酸聚合酶(例如,跨损伤dna聚合酶)为至少75%、80%、85%、90%、95%、96%、97%、98%、99%或99.5%相同。[1323]其他核碱基编辑器[1324]本发明提供了一种模组化多效应子核碱基编辑器,其中几乎本领域中已知的任何核碱基编辑器都可以插入本文所述的融合蛋白中或替换为胞苷脱氨酶或腺苷脱氨酶。在一种实施方案中,本发明提出一种包含无碱基核碱基编辑器结构域的多效应子核碱基编辑器。无碱基核碱基编辑器是本领域中已知的,并且例如由kavli等人,emboj.[1325]15:3442-3447,1996描述,其通过引用并入本文。[1326]在一种实施方案中,多效应子核碱基编辑器包含以下结构域a-c、a-d或a-e:[1327]nh2-[a-b-c]-cooh、[1328]nh2-[a-b-c-d]-cooh或[1329]nh2-[a-b-c-d-e]-coohefficiencyandproductpurity”scienceadvances3:eaao4774(2017)。在一些情况下,一个或多个突变可以改变碱基编辑器结构域相对于野生型结构域的长度。例如,在至少一个结构域中至少一个氨基酸的缺失可以缩短碱基编辑器的长度。在另一种情况下,一个或多个突变不改变结构域相对于野生型结构域的长度。例如,任何结构域中的一种或多种置换不改变碱基编辑器的长度。其中全部结构域的长度与野生型结构域相同的此类碱基编辑器的非限制性示例可以包括:[1353]nh2-[apobec1]-连接子1-[cas9(d10a)]-连接子2-[ugi]-cooh;[1354]nh2-[cda1]-连接子1-[cas9(d10a)]-连接子2-[ugi]-cooh;[1355]nh2-[aid]-连接子1-[cas9(d10a)]-连接子2-[ugi]-cooh;[1356]nh2-[apobec1]-连接子1-[cas9(d10a)]-连接子2-[ssb]-cooh;[1357]nh2-[ugi]-连接子1-[abobec1]-连接子2-[cas9(d10a)]-cooh;[1358]nh2-[apobec1]-连接子1-[cas9(d10a)]-连接子2-[ugi]-连接子3-[ugi]-cooh;[1359]nh2-[cas9(d10a)]-连接子1-[cda1]-连接子2-[ugi]-cooh;[1360]nh2-[gam]-连接子1-[apobec1]-连接子2-[cas9(d10a)]-连接子3-[ugi]-cooh;[1361]nh2-[gam]-连接子1-[apobec1]-连接子2-[cas9(d10a)]-连接子3-[ugi]-连接子4-[ugi]-cooh;[1362]nh2-[apobec1]-连接子1-[dcas9(d10a,h840a)]-连接子2-[ugi]-cooh;或[1363]nh2-[apobec1]-连接子1-[dcas9(d10a,h840a)]-cooh[1364]碱基编辑器系统[1365]本文所提供的碱基编辑器的使用包括以下步骤:(a)将受试者的多核苷酸(例如,双链dna或rna或者单链dna或rna)的靶标核苷酸序列与包含核碱基编辑器(例如,腺苷碱基编辑器)和向导多核苷酸(例如,grna)的碱基编辑器系统接触,其中靶标核苷酸序列包含被靶向的核碱基对;(b)诱导所述靶标区域的链分离;(c)将靶标区域的单链中的所述靶标核碱基对的第一核碱基转化为第二核碱基;以及(d)切割所述靶标区域的不超过一条链,其中与第一核碱基互补的第三核碱基被替换为与第二核碱基互补的第四核碱基。应知悉,在一些实施方案中,省略了步骤(b)。在一些实施方案中,所述被靶向的核碱基对是一个或多个基因中的多个核碱基对。在一些实施方案中,本文所提供的碱基编辑器系统能够对一个或多个基因中的多个核碱基对进行多元编辑。在一些实施方案中,多个核碱基对定位在同一基因中。在一些实施方案中,多个核碱基对定位在一个或多个基因中,其中至少一个基因定位在不同的基因座中。[1366]在一些实施方案中,被切割的单链(被切口的链)与向导核酸杂交。在一些实施方案中,被切割的单链与包含第一核碱基的链相对。在一些实施方案中,碱基编辑器包含cas9结构域。在一些实施方案中,第一碱基是腺嘌呤,并且第二碱基不是g、c、a或t。在一些实施方案中,第二碱基是肌苷。[1367][[本文所提供的碱基编辑系统提供新的基因组编辑途径,该系统使用含有催化缺陷性化脓性链球菌cas9、胞苷脱氨酶和碱基切除修复抑制剂的融合蛋白来诱导dna中的可编程单核苷酸(c→t或a→g)变化而不产生双链dna断裂、不需要供体dna范本并且不诱导过量的随机插入和缺失。]][1368]本文提供用于使用碱基编辑器系统来编辑核碱基的系统、组合物和方法。在一些实施方案中,碱基编辑器系统包含(1)包含多核苷酸可编程核苷酸结合结构域和用于编辑核碱基的核碱基编辑结构域(例如,脱氨酶结构域)的碱基编辑器(be);和(2)与该多核苷酸可编程核苷酸结合结构域协同作用的向导多核苷酸(例如,向导rna)。在一些实施方案中,碱基编辑器系统包含腺苷碱基编辑器(abe)。在一些实施方案中,碱基编辑器系统包含胞苷碱基编辑器(cbe)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程rna结合结构域。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶结构域可以是腺嘌呤脱氨酶或腺苷脱氨酶。在一些实施方案中,腺苷碱基编辑器可以将dna中的腺嘌呤脱氨基。在一些实施方案中,abe包含进化的tada变体。在一些实施方案中,脱氨酶结构域可以是胞嘧啶脱氨酶或胞苷脱氨酶。在一些实施方案中,“胞嘧啶脱氨酶”和“胞苷脱氨酶”可以互换地使用。[1369]核碱基编辑蛋白的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用而整体并入本文。也参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017)和komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),其整体内容通过引用并入本文。[1370]在一些实施方案中,单向导多核苷酸可用将脱氨酶靶向靶标核酸序列。在一些实施方案中,一对向导多核苷酸可用将不同的脱氨酶靶向靶标核酸序列。[1371]碱基编辑器系统的核碱基组分和多核苷酸可编程核苷酸结合组分可以彼此共价或非共价地缔合。例如,在一些实施方案中,脱氨酶结构域可以通过多核苷酸可编程核苷酸结合结构域被靶向至靶标核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至脱氨酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以通过与脱氨酶结构域非共价地相互作用或缔合而将脱氨酶结构域靶向至核苷酸序列。例如,在一些实施方案中,核碱基编辑组分(例如,脱氨酶组分)可以包含额外的异源部分或结构域,该异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外异源部分或结构域相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够结合至向导多核苷酸。在一些实施方案中,额外异源部分可以能够结合至多肽连接子。在一些实施方案中,额外异源部分可以能够结合至多核苷酸连接子。额外异源部分可以是蛋白结构域。在一些实施方案中,额外异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmu外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[1372]碱基编辑器系统可以进一步包含向导多核苷酸组分。应知悉,碱基编辑器系统的组分可以彼此经由共价键彼此缔合、非共价相互作用、或其缔合及相互作用的任何组合。在一些实施方案中,脱氨酶结构域可以通过向导多核苷酸被靶向至靶标核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的核碱基编辑组分(例如,脱氨酶组分)可以包含额外异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白),该额外异源部分或结构域能够与向导多核苷酸的部分或链段(例如,多核苷酸基序)相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白)可以融合或连接至脱氨酶结构域。在一些实施方案中,额外异源部分可以能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够结合至向导多核苷酸。在一些实施方案中,额外异源部分可以能够结合至多肽连接子。在一些实施方案中,额外异源部分可以能够结合至多核苷酸连接子。额外异源部分可以是蛋白结构域。在一些实施方案中,额外异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmu外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[1373]在一些实施方案中,碱基编辑器系统可以进一步包含碱基切除修复(ber)组分的抑制剂。应知悉,碱基编辑器系统的组分可以彼此经由共价键彼此缔合、非共价相互作用、或其缔合及相互作用的任何组合。ber组分的抑制剂可以包含碱基切除修复抑制剂。在一些实施方案中,碱基切除修复的抑制剂可以是尿嘧啶dna糖苷酶抑制剂(ugi)。在一些实施方案中,碱基切除修复的抑制剂可以是肌苷碱基切除修复抑制剂。在一些实施方案中,碱基切除修复的抑制剂可以通过多核苷酸可编程核苷酸结合结构域被靶向至靶标核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至碱基切除修复的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以融合或连接至脱氨酶结构域和碱基切除修复的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以通过与碱基切除修复的抑制剂非共价地相互作用或缔合而将碱基切除修复的抑制剂靶向至核苷酸序列。例如,在一些实施方案中,碱基切除修复组分的抑制剂可以包含额外的异源部分或结构域,该异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外异源部分或结构域相互作用、缔合或形成复合物。在一些实施方案中,碱基切除修复的抑制剂可以通过向导多核苷酸被靶向至靶标核苷酸序列。例如,在一些实施方案中,碱基切除修复的抑制剂可以包含额外异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白),该额外异源部分或结构域能够与向导多核苷酸的部分或链段(例如,多核苷酸基序)相互作用、缔合或形成复合物。在一些实施方案中,向导多核苷酸的额外异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白)可以融合或连接至碱基切除修复的抑制剂。在一些实施方案中,额外异源部分可以能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外异源部分可以能够结合至向导多核苷酸。在一些实施方案中,额外异源部分可以能够结合至多肽连接子。在一些实施方案中,额外异源部分可以能够结合至多核苷酸连接子。额外异源部分可以是蛋白结构域。在一些实施方案中,额外异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmu外壳蛋白结构域、不育α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[1374]在一些实施方案中,碱基编辑器抑制被编辑链的碱基切除修复(ber)。在一些实施方案中,碱基编辑器保护或结合未经编辑的链。在一些实施方案中,碱基编辑器包含ugi活性。在一些实施方案中,碱基编辑器包含无催化活性的肌苷特异性核酸酶。在一些实施方案中,碱基编辑器包含切口酶活性。在一些实施方案中,预期的碱基对编辑位于pam位点的上游。在一些实施方案中,预期的碱基对编辑位于pam位点的上游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸处。在一些实施方案中,预期的碱基对编辑位于pam位点的下游。在一些实施方案中,预期的被编辑碱基对位于pam位点的下游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸处。[1375]在一些实施方案中,该方法不需要经典(例如,ngg)pam位点。在一些实施方案中,核碱基编辑器包含连接子或间隔序列。在一些实施方案中,连接子或间隔序列为1-25个氨基酸的长度。在一些实施方案中,连接子或间隔序列为5-20个氨基酸的长度。在一些实施方案中,连接子或间隔序列为10、11、12、13、14、15、16、17、18、19或20个氨基酸的长度。[1376]在一些实施方案中,本文所提供的碱基编辑融合蛋白需要被定位在精确位置处,例如,靶标碱基被放置在定义区域(例如,“脱氨基窗”)内。在一些实施方案中,靶标可以位于4个碱基的区域内。在一些实施方案中,此类定义的靶标区域可以位于pam的上游大约15个碱基处。参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017)和komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),其整体内容通过引用并入本文。[1377]在一些实施方案中,靶标区域包含靶标窗,其中靶标窗包含靶标核碱基对。在一些实施方案中,靶标窗包含1-10个核苷酸。在一些实施方案中,靶标窗为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的长度。在一些实施方案中,预期的碱基对编辑位于靶标窗内。在一些实施方案中,靶标窗包含预期的碱基对编辑。在一些实施方案中,使用本文所提供的任何碱基编辑器执行该方法。在一些实施方案中,靶标窗是脱氨基窗。脱氨基窗可以是定义的区域,在该区域中,碱基编辑器作用于靶标核苷酸并将该靶标核苷酸脱氨基。在一些实施方案中,脱氨基窗位于2、3、4、5、6、7、8、9或10个碱基的区域内。在一些实施方案中,脱氨基窗位于pam的上游5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基处。[1378]本公开的碱基编辑器可以包含任何促进靶标多核苷酸序列的编辑的结构域、特征和氨基酸序列。例如,在一些实施方案中,碱基编辑器包含核定位序列(nls)。在一些实施方案中,碱基编辑器的nls定位在脱氨酶结构域与多核苷酸可编程核苷酸结合结构域之间。在一些实施方案中,碱基编辑器的nls定位在多核苷酸可编程核苷酸结合结构域的c端。[1379]可存在于本所公开的碱基编辑器中的其他示例性特征是定位序列,诸如细胞质定位序列、输出序列诸如核输出序列、或其他定位序列,以及可用于融合蛋白的溶解、纯化或检测的序列标签。本文所提供的合适的蛋白标签包括但不限于,生物素羧化酶载体蛋白(bccp)标签、myc标签、钙调蛋白标签、flag标签、血细胞凝集素(ha)标签、聚组氨酸标签(也称为组氨酸标签或his标签)、麦芽糖结合蛋白(mbp)标签、nus标签、谷胱甘肽-s-转移酶(gst)标签、绿色萤光蛋白(gfp)标签、硫氧还蛋白标签、s标签、softag(例如,softag1、softag3)、链霉素标签、生物素连接酶标签、flash标签、v5标签和sbp标签。其他合适的序列对于本领域技术人员将是显而易见的。在一些实施方案中,融合蛋白包含一个或多个his标签。[1380]可包括在融合蛋白中的蛋白结构域的非限制性示例包括脱氨酶结构域(例如,胞苷脱氨酶、腺苷脱氨酶)、尿嘧啶糖苷酶抑制剂(ugi)结构域、表位元标签、和报告基因序列、和/或具有以下一种或多种活性的蛋白结构域:甲基化酶活性、脱甲基酶活性、转录启动活性、转录抑制活性、转录释放因数活性、组蛋白修饰活性、rna裂解活性和核酸结合活性。额外结构域可以是异源性功能结构域。此类异源性功能结构域可以提供功能活性,诸如dna甲基化、dna损伤、dna修复、与靶标dna缔合的靶标多肽(例如,组蛋白、dna结合蛋白等)修饰,导致例如组蛋白甲基化、组蛋白乙酰化、组蛋白泛素化等。[1381]所提供的其他功能可以包括甲基转移酶活性、脱甲基酶活性、脱氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性或糖苷酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、托泛素化活性、腺苷酸化活性、脱腺苷酸活性、sumo化活性、脱sumo化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性、重构活性、蛋白酶活性、氧化还原酶活性、转移酶活性、水解酶活性、裂解酶活性、异构酶活性、合酶活性、合成酶活性和脱豆蔻酰化活性,或其任何组合。[1382]表位标签的非限制性示例包括组氨酸(his)标签、v5标签、flag标签、流感病毒血凝素(ha)标签、myc标签、vsv-g标签和硫氧还蛋白(trx)标签。报告基因的示例包括但不限于,谷胱甘肽-5-转移酶(gst)、辣根过氧化物酶(hrp)、氯霉素乙酰转移酶(cat)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、萤光素酶、绿色萤光蛋白(gfp)、hcred、dsred、青色萤光蛋白(cfp)、黄色萤光蛋白(yfp)和包括蓝色萤光蛋白(bfp)在内的自体萤光蛋白。额外蛋白质序列可以包括结合dna分子或结合其他细胞分子的氨基酸序列,包括但不限于,麦芽糖结合蛋白(mbp)、s标签、lexadna结合结构域(dbd)融合物、gal4dna结合结构域融合物和单纯疱疹病毒(hsv)bp16蛋白融合物。[1383]在一些实施方案中,腺苷碱基编辑器(abe)可以将dna中的腺嘌呤脱氨基。在一些实施方案中,abe是通过将be3的apobec组分替换为天然或经工程化的大肠杆菌tada、人adar2、小鼠ada或人adat2而产生的。在一些实施方案中,abe包含进化的tada变体。在一些实施方案中,abe是abe1.2(tada*-xten-ncas9-nls)。在一些实施方案中,tada*包含a106v和d108n突变。[1384]在一些实施方案中,abe是第二代abe。在一些实施方案中,abe是abe2.1,其包含tada*(tada*2.1)中的额外突变d147y和e155v。在一些实施方案中,abe是abe2.2,其是融合至无催化活性版本的人烷基腺嘌呤dna糖苷酶(具有e125q突变的aag)的abe2.1。在一些实施方案中,abe是abe2.3,其是融合至无催化活性版本的大肠杆菌endov(具有d35a突变而无活性)的abe2.1。在一些实施方案中,abe是abe2.6,其具有两倍于abe2.1中的连接子的连接子(32个氨基酸,(sggs)2-xten-(sggs)2)。在一些实施方案中,abe是abe2.7,其是以额外的野生型tada单体系结的abe2.1。在一些实施方案中,abe是abe2.8,其是以额外的tada*2.1单体系结的abe2.1。在一些实施方案中,abe是abe2.9,其是进化的tada(tada*2.1)直接融合至abe2.1的n端的融合物。在一些实施方案中,abe是abe2.10,其是野生型tada直接融合至abe2.1的n端的融合物。在一些实施方案中,abe是abe2.11,其是在tada*单体的n端处具有无活性e59a突变的abe2.9。在一些实施方案中,abe是abe2.12,其是在内部tada*单体处具有无活性e59a突变的abe2.9。[1385]在一些实施方案中,abe是第三代abe。在一些实施方案中,abe是abe3.1,其是具有三个额外tada突变(l84f、h123y和i156f)的abe2.3。[1386]在一些实施方案中,abe是第四代abe。在一些实施方案中,abe是abe4.3,其是具有额外tada突变a142n(tada*4.3)的abe3.1。[1387]在一些实施方案中,abe是第五代abe。在一些实施方案中,abe是abe5.1,其通过将来自存活克隆体的一组共有突变(h36l、r51l、s146c和k157n)导入abe3.1中而产生的。在一些实施方案中,abe是abe5.3,其具有含有野生型大肠杆菌tada与内部进化的tada*融合的异源二聚构建体。在一些实施方案中,abe是abe5.2、abe5.4、abe5.5、abe5.6、abe5.7、abe5.8、abe5.9、abe5.10、abe5.11、abe5.12、abe5.13或abe5.14,如下表6中所示。在一些实施方案中,abe是第六代abe。在一些实施方案中,abe是abe6.1、abe6.2、abe6.3、abe6.4、abe6.5或abe6.6,如下表6中所示。在一些实施方案中,abe是第七代abe。在一些实施方案中,abe是abe7.1、abe7.2、abe7.3、abe7.4、abe7.5、abe7.6、abe7.7、abe7.8、abe7.9或abe7.10,如下表6中所示。[1388]表6.abe的基因型[1389][1390][1391]在一些实施方案中,碱基编辑器是腺苷碱基编辑器。在一些实施方案中,腺苷碱基编辑器是第八代abe(abe8)。在一些实施方案中,abe8含有tada*8变体。在一些实施方案中,abe8具有含有tada*8变体的单体构建体(“abe8.x-m”)。在一些实施方案中,abe8是abe8.1-m,其具有含有具有y147t突变的tada*7.10(tada*8.1)的单体构建体。在一些实施方案中,abe8是abe8.2-m,其具有含有具有y147r突变的tada*7.10(tada*8.2)的单体构建体。在一些实施方案中,abe8是abe8.3-m,其具有含有具有q154s突变的tada*7.10(tada*8.3)的单体构建体。在一些实施方案中,abe8是abe8.4-m,其具有含有具有y123h突变的tada*7.10(tada*8.4)的单体构建体。在一些实施方案中,abe8是abe8.5-m,其具有含有具有v82s突变的tada*7.10(tada*8.5)的单体构建体。在一些实施方案中,abe8是abe8.6-m,其具有含有具有t166r突变的tada*7.10(tada*8.6)的单体构建体。在一些实施方案中,abe8是abe8.7-m,其具有含有具有q154r突变的tada*7.10(tada*8.7)的单体构建体。在一些实施方案中,abe8是abe8.8-m,其具有含有具有y147r、q154r和y123h突变的tada*7.10(tada*8.8)的单体构建体。在一些实施方案中,abe8是abe8.9-m,其具有含有具有y147r、q154r和i76y突变的tada*7.10(tada*8.9)的单体构建体。在一些实施方案中,abe8是abe8.10-m,其具有含有具有y147r、q154r和t166r突变的tada*7.10(tada*8.10)的单体构建体。在一些实施方案中,abe8是abe8.11-m,其具有含有具有y147t和q154r突变的tada*7.10(tada*8.11)的单体构建体。在一些实施方案中,abe8是abe8.12-m,其具有含有具有y147t和q154s突变的tada*7.10(tada*8.12)的单体构建体。在一些实施方案中,abe8是abe8.13-m,其具有含有具有y123h(y123h从h123y逆转)、y147r、q154r和i76y突变的tada*7.10(tada*8.13)的单体构建体。在一些实施方案中,abe8是abe8.14-m,其具有含有具有i76y和v82s突变的tada*7.10(tada*8.14)的单体构建体。在一些实施方案中,abe8是abe8.15-m,其具有含有具有v82s和y147r突变的tada*7.10(tada*8.15)的单体构建体。在一些实施方案中,abe8是abe8.16-m,其具有含有具有v82s、y123h(y123h从h123y逆转)和y147r突变的tada*7.10(tada*8.16)的单体构建体。在一些实施方案中,abe8是abe8.17-m,其具有含有具有v82s和q154r突变的tada*7.10(tada*8.17)的单体构建体。在一些实施方案中,abe8是abe8.18-m,其具有含有具有v82s、y123h(y123h从h123y逆转)和q154r突变的tada*7.10(tada*8.18)的单体构建体。在一些实施方案中,abe8是abe8.19-m,其具有含有具有v82s、y123h(y123h从h123y逆转)、y147r和q154r突变的tada*7.10(tada*8.19)的单体构建体。在一些实施方案中,abe8是abe8.20-m,其具有含有具有i76y、v82s、y123h(y123h从h123y逆转)、y147r和q154r突变的tada*7.10(tada*8.20)的单体构建体。在一些实施方案中,abe8是abe8.21-m,其具有含有具有y147r和q154s突变的tada*7.10(tada*8.21)的单体构建体。在一些实施方案中,abe8是abe8.22-m,其具有含有具有v82s和q154s突变的tada*7.10(tada*8.22)的单体构建体。在一些实施方案中,abe8是abe8.23-m,其具有含有具有v82s和y123h(y123h从h123y逆转)突变的tada*7.10(tada*8.23)的单体构建体。在一些实施方案中,abe8是abe8.24-m,其具有含有具有v82s、y123h(y123h从h123y逆转)和y147t突变的tada*7.10(tada*8.24)的单体构建体。[1392]在一些实施方案中,abe8具有含有野生型大肠杆菌与tada*8变体融合的异源二聚构建体(“abe8.x-d”)。在一些实施方案中,abe8是abe8.1-d,其具有含有野生型大肠杆菌tada与具有y147t突变的tada*7.10(tada*8.1)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.2-d,其具有含有野生型大肠杆菌tada与具有y147r突变的tada*7.10(tada*8.2)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.3-d,其具有含有野生型大肠杆菌tada与具有q154s突变的tada*7.10(tada*8.3)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.4-d,其具有含有野生型大肠杆菌tada与具有y123h突变的tada*7.10(tada*8.4)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.5-d,其具有含有野生型大肠杆菌tada与具有v82s突变的tada*7.10(tada*8.5)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.6-d,其具有含有野生型大肠杆菌tada与具有t166r突变的tada*7.10(tada*8.6)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.7-d,其具有含有野生型大肠杆菌tada与具有q154r突变的tada*7.10(tada*8.7)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.8-d,其具有含有野生型大肠杆菌tada与具有y147r、q154r和y123h突变的tada*7.10(tada*8.8)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.9-d,其具有含有野生型大肠杆菌tada与具有y147r、q154r和i76y突变的tada*7.10(tada*8.9)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.10-d,其具有含有野生型大肠杆菌tada与具有y147r、q154r和t166r突变的tada*7.10(tada*8.10)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.11-d,其具有含有野生型大肠杆菌tada与具有y147t和q154r突变的tada*7.10(tada*8.11)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.12-d,其具有含有野生型大肠杆菌tada与具有y147t和q154s突变的tada*7.10(tada*8.12)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.13-d,其具有含有野生型大肠杆菌tada与具有y123h(y123h从h123y逆转)、y147r、q154r和i76y突变的tada*7.10(tada*8.13)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.14-d,其具有含有野生型大肠杆菌tada与具有i76y和v82s突变的tada*7.10(tada*8.14)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.15-d,其具有含有野生型大肠杆菌tada与具有v82s和y147r突变的tada*7.10(tada*8.15)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.16-d,其具有含有野生型大肠杆菌tada与具有v82s、y123h(y123h从h123y逆转)和y147r突变的tada*7.10(tada*8.16)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.17-d,其具有含有野生型大肠杆菌tada与具有v82s和q154r突变的tada*7.10(tada*8.17)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.18-d,其具有含有野生型大肠杆菌tada与具有v82s、y123h(y123h从h123y逆转)和q154r突变的tada*7.10(tada*8.18)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.19-d,其具有含有野生型大肠杆菌tada与具有v82s、y123h(y123h从h123y逆转)、y147r和q154r突变的tada*7.10(tada*8.19)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.20-d,其具有含有野生型大肠杆菌tada与具有i76y、v82s、y123h(y123h从h123y逆转)、y147r和q154r突变的tada*7.10(tada*8.20)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.21-d,其具有含有野生型大肠杆菌tada与具有y147r和q154s突变的tada*7.10(tada*8.21)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.22-d,其具有含有野生型大肠杆菌tada与具有v82s和q154s突变的tada*7.10(tada*8.22)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.23-d,其具有含有野生型大肠杆菌tada与具有v82s和y123h(y123h从h123y逆转)突变的tada*7.10(tada*8.23)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.24-d,其具有含有野生型大肠杆菌tada与具有v82s、y123h(y123h从h123y逆转)和y147t突变的tada*7.10(tada*8.24)融合的异源二聚构建体。[1393]在一些实施方案中,abe8具有含有tada*7.10与tada*8变体融合的异源二聚构建体(“abe8.x-7”)。在一些实施方案中,abe8是abe8.1-7,其具有含有tada*7.10与具有y147t突变的tada*7.10(tada*8.1)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.2-7,其具有含有tada*7.10与具有y147r突变的tada*7.10(tada*8.2)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.3-7,其具有含有tada*7.10与具有q154s突变的tada*7.10(tada*8.3)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.4-7,其具有含有tada*7.10与具有y123h突变的tada*7.10(tada*8.4)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.5-7,其具有含有tada*7.10与具有v82s突变的tada*7.10(tada*8.5)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.6-7,其具有含有tada*7.10与具有t166r突变的tada*7.10(tada*8.6)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.7-7,其具有含有tada*7.10与具有q154r突变的tada*7.10(tada*8.7)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.8-7,其具有含有tada*7.10与具有y147r、q154r和y123h突变的tada*7.10(tada*8.8)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.9-7,其具有含有tada*7.10与具有y147r、q154r和i76y突变的tada*7.10(tada*8.9)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.10-7,其具有含有tada*7.10与具有y147r、q154r和t166r突变的tada*7.10(tada*8.10)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.11-7,其具有含有tada*7.10与具有y147t和q154r突变的tada*7.10(tada*8.11)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.12-7,其具有含有tada*7.10与具有y147t和q154s突变的tada*7.10(tada*8.12)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.13-7,其具有含有tada*7.10与具有y123h(y123h从h123y逆转)、y147r、q154r和i76y突变的tada*7.10(tada*8.13)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.14-7,其具有含有tada*7.10与具有i76y和v82s突变的tada*7.10(tada*8.14)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.15-7,其具有含有tada*7.10与具有v82s和y147r突变的tada*7.10(tada*8.15)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.16-7,其具有含有tada*7.10与具有v82s、y123h(y123h从h123y逆转)和y147r突变的tada*7.10(tada*8.16)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.17-7,其具有含有tada*7.10与具有v82s和q154r突变的tada*7.10(tada*8.17)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.18-7,其具有含有tada*7.10与具有v82s、y123h(y123h从h123y逆转)和q154r突变的tada*7.10(tada*8.18)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.19-7,其具有含有tada*7.10与具有v82s、y123h(y123h从h123y逆转)、y147r和q154r突变的tada*7.10(tada*8.19)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.20-7,其具有含有tada*7.10与具有i76y、v82s、y123h(y123h从h123y逆转)、y147r和q154r突变的tada*7.10(tada*8.20)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.21-7,其具有含有tada*7.10与具有y147r和q154s突变的tada*7.10(tada*8.21)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.22-7,其具有含有tada*7.10与具有v82s和q154s突变的tada*7.10(tada*8.22)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.23-7,其具有含有tada*7.10与具有v82s和y123h(y123h从h123y逆转)突变的tada*7.10(tada*8.23)融合的异源二聚构建体。在一些实施方案中,abe8是abe8.24-7,其具有含有tada*7.10与具有v82s、y123h(y123h从h123y逆转)和y147t突变的tada*7.10(tada*8.24)融合的异源二聚构建体。[1394]在一些实施方案中,abe是abe8.1-m、abe8.2-m、abe8.3-m、abe8.4-m、abe8.5-m、abe8.6-m、abe8.7-m、abe8.8-m、abe8.9-m、abe8.10-m、abe8.11-m、abe8.12-m、abe8.13-m、abe8.14-m、abe8.15-m、abe8.16-m、abe8.17-m、abe8.18-m、abe8.19-m、abe8.20-m、abe8.21-m、abe8.22-m、abe8.23-m、abe8.24-m、abe8.1-d、abe8.2-d、abe8.3-d、abe8.4-d、abe8.5-d、abe8.6-d、abe8.7-d、abe8.8-d、abe8.9-d、abe8.10-d、abe8.11-d、abe8.12-d、abe8.13-d、abe8.14-d、abe8.15-d、abe8.16-d、abe8.17-d、abe8.18-d、abe8.19-d、abe8.20-d、abe8.21-d、abe8.22-d、abe8.23-d或abe8.24-d,如下表7中所示。[1395]表7:abe8碱基编辑器[1396][1397][1398][1399]在一些实施方案中,通过将腺苷脱氨酶变体(例如,tada*8)克隆到包括环状高突变的cas9(例如,cp5或cp6)和二分体核定位序列的支架中而产生碱基编辑器(例如,abe8)。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是ngcpamcp5变体(化脓性链球菌cas9或spvrqrcas9)。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是agapamcp5变体(化脓性链球菌cas9或spvrqrcas9)。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是ngcpamcp6变体(化脓性链球菌cas9或spvrqrcas9)。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是agapamcp6变体(化脓性链球菌cas9或spvrqrcas9)。[1400]在一些实施方案中,abe具有下表8中所示的基因型。[1401]表8.abe的基因型[1402]23263637484951728487105108123125142145147152155156157161abe7.9lrlnalnfsvnygncypvfnkabe7.10rrlnalnfsvnygacypvfnk[1403]如下表9中所示,描述了40种abe8的基因型。指明了abe的进化的大肠杆菌tada部分中的残基位置。当不同于abe7.10突变时,显示了abe8中的突变性变化。在一些实施方案中,abe具有下表9中所示的abe之一的基因型。[1404]表9.进化的tada中的残基身份[1405][1406][1407]在一些实施方案中,碱基编辑器是abe8.1,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1408]abe8.1_y147t_cp5_ngcpam_单体[1409][1410]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,而底线序列表示二分体核定位序列。[1411]在一些实施方案中,碱基编辑器是abe8.1,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1412]pnmg-b335abe8.1_y147t_cp5_ngcpam_单体[1413][1414][1415]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,而底线序列表示二分体核定位序列。[1416]在一些实施方案中,碱基编辑器是abe8.14,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1417]具有ngcpamcp5的pnmg-357_abe8.14[1418][1419][1420]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,而底线序列表示二分体核定位序列。[1421]在一些实施方案中,碱基编辑器是abe8.8-m,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1422]abe8.8-m[1423][1424][1425]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分体核定位序列,而双底线序列指示突变。[1426]在一些实施方案中,碱基编辑器是abe8.8-d,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1427]abe8.8-d[1428][1429][1430]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分体核定位序列,而双底线序列指示突变。[1431]在一些实施方案中,碱基编辑器是abe8.13-m,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1432]abe8.13-m[1433][1434][1435]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分体核定位序列,而双底线序列指示突变。[1436]在一些实施方案中,碱基编辑器是abe8.13-d,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1437]abe8.13-d[1438][1439][1440]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分体核定位序列,而双底线序列指示突变。[1441]在一些实施方案中,碱基编辑器是abe8.17-m,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1442]abe8.17-m[1443][1444]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分体核定位序列,而双底线序列指示突变。[1445]在一些实施方案中,碱基编辑器是abe8.17-d,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1446]abe8.17-d[1447][1448][1449]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分体核定位序列,而双底线序列指示突变。[1450]在一些实施方案中,碱基编辑器是abe8.20-m,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1451]abe8.20-m[1452][1453][1454]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分体核定位序列,而双底线序列指示突变。[1455]在一些实施方案中,碱基编辑器是abe8.207-d,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1456]abe8.20-d[1457][1458][1459]在上述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分体核定位序列,而双底线序列指示突变。[1460]在一些实施方案中,本发明的abe8选自以下序列:[1461]01.monoabe8.1_bpnls y147t[1462]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1463]02.monoabe8.1_bpnls y147r[1464]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1465]03.monoabe8.1_bpnls q154s[1466]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1467]04.monoabe8.1_bpnls y123h[1468]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1469]05.monoabe8.1_bpnls v82s[1470]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1471]06.monoabe8.1_bpnls t166r[1472]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1473]07.monoabe8.1_bpnls q154r[1474]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1475]08.monoabe8.1_bpnls y147r_q154r_y123h[1476]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1477]09.monoabe8.1_bpnls y147r_q154r_i76y[1478]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1479]10.monoabe8.1_bpnls y147r_q154r_t166r[1480]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1481]11.monoabe8.1_bpnls y147t_q154r[1482]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1483]12.monoabe8.1_bpnls y147t_q154s[1484]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1485]13.monoabe8.1_bpnls h123y123h_y147r_q154r_i76y[1486]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1487]14.monoabe8.1_bpnls v82s q154r[1488]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1489]在一些实施方案中,碱基编辑器是胞苷编辑器(cbe)。在一些实施方案中,非限制性的示例性cbe是be1(apobec1-xten-dcas9)、be2(apobec1-xten-dcas9-ugi)、be3(apobec1-xten-dcas9(a840h)-ugi)、be3-gam、sabe3、sabe4-gam、be4、be4-gam、sabe4或sab4e-gam。be4将apobec1-cas9n(d10a)连接子延长至32个氨基酸并将cas9n-ugi连接子延长至9个氨基酸,并且将ugi的第二个拷贝附加到构建体的c端并将另一个9个氨基酸的连接子附加到单碱基编辑器构建体内。碱基编辑器sabe3和sabe4的化脓性链球菌cas9n(d10a)被较小的金黄色葡萄球菌cas9n(d10a)替代。be3-gam、sabe3-gam、be4-gam和sabe4-gam具有经由16个氨基酸的xten连接子与be3、sabe3、be4和sabe4的n端融合的174个残基的gam蛋白。[1490]在一些实施方案中,碱基编辑器是包含与核碱基编辑结构域(例如,脱氨酶结构域的全部或一部分)融合的多核苷酸可编程核苷酸结合结构域(例如,衍生自cas9的结构域)。在某些实施方案中,本文所提供的融合蛋白包含一种或多种特征,该特征改善融合蛋白的碱基编辑活性。例如,本文所提供的任何融合蛋白可以包含具有削弱的核酸酶活性的cas9结构域。在一些实施方案中,本文所提供的任何融合蛋白可以具有不具有核酸酶活性的cas9结构域(dcas9)或者被称为cas9切口酶(ncas9)的切割双螺旋dna分子一条链的cas9结构域。[1491]在一些实施方案中,碱基编辑器基因不包含一个结构域,该结构域包含尿嘧啶糖苷酶抑制剂(ugi)的全部或一部分。在一些实施方案中,碱基编辑器基因不包含一个结构域,该结构域包含尿嘧啶结合蛋白(ubp)(诸如尿嘧啶dna糖苷酶(udg))的全部或一部分。在一些实施方案中,碱基编辑器基因不包含一个结构域,该结构域包含核酸聚合酶的全部或一部分。在一些实施方案中,被并入碱基编辑器中的核酸聚合酶或其部分是跨损伤dna聚合酶。[1492]在一些实施方案中,碱基编辑器的结构域可以包含多个结构域。例如,包含衍生自cas9的多核苷酸可编程核苷酸结合结构域的碱基编辑器可以包含对应于野生型或天然cas9的rec叶和nuc叶的rec叶和nuc叶。在另一实施例中,碱基编辑器可以包含ruvci结构域、bh结构域、rec1结构域、rec2结构域、ruvcii结构域、l1结构域、hnh结构域、l2结构域、ruvciii结构域、wed结构域、topo结构域或ctd结构域中的一个或多个。在一些实施方案中,碱基编辑器的一个或多个结构域包含相对于包含该结构域的野生型版本多肽的突变(例如,置换、插入、缺失)。例如,多核苷酸可编程dna结合结构域的hnh结构域可以包含h840a置换。在另一实施例中,多核苷酸可编程dna结合结构域的ruvci结构域可以包含d10a置换。[1493]本文所公开的碱基编辑器的不同结构域(例如,邻近结构域)可以使用或不是使用一个或多个连接子结构域(例如,xten连接子结构域)彼此联接。在一些实施方案中,连接子结构域可以是键(例如,共价键)、化学基团或连接连个分子或部分(例如,融合蛋白的两个结构域,诸如举例而言,第一结构域(例如,衍生自cas9的结构域)和第二结构域(例如,腺苷脱氨酶结构域))的分子。在一些实施方案中,连接子是共价键(例如,碳-碳键、二硫键、碳-杂原子键等)。在某些实施方案中,连接子是酰胺链结的碳-氮键。在某些实施方案中,连接子是环状或非环状的、经取代或未经取代的、分支的或未分支的脂肪族或杂脂肪族连接子。在某些实施方案中,连接子是聚合性的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,连接子包含氨基烷酸的单体、二聚体或聚合物。在一些实施方案中,连接子包含氨基烷酸(例如,甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)。在一些实施方案中,连接子包含氨基己酸(ahx)的单体、二聚体或聚合物。在某些实施方案中,连接子是基于碳环部分(例如,环戊烷、环己烷)的。在其他实施方案中,连接子包含聚乙二醇部分(peg)。在某些实施方案中,连接子包含芳基或杂芳基部分。在某些实施方案中,连接子是基于苯环的。连接子可以包括经功能化的部分以促进来自肽的亲核体(例如,巯基、氨基)附接至连接子。任何亲电体均可用作连接子的一部分。示例性的亲电体包括但不限于,活化的酯、活化的酰胺、michael受体、烷基卤化物、芳基卤化物、酰卤和异硫氰酸酯。在一些实施方案中,连接子接合rna可编程核酸酶的grna接合结构域(包括cas9核酸酶结构域)与核酸编辑蛋白的催化结构域。在一些实施方案中,连接子接合dcas9与第二结构域(例如,ugi等)。[1494]典型地,连接子可以定位在两个基团、分子或其他部分之间或者侧翼具有两个基团、分子或其他部分,并且经由共价键与每个基团、分子或其他部分连结,从而将两者连结。在一些实施方案中,连接子是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子为2-100个氨基酸的长度,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸的长度。在一些实施方案中,连接子为约3至约104(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100)个氨基酸的长度。也设想了更长或更短的连接子。在一些实施方案中,连接子结构域包含氨基酸序列sgsetpgtsesatpes,其也可以称为xten连接子。可以采用任何用于连接融合蛋白结构域的方法(例如,从非常柔性的(sggs)n、(gggs)n、(ggggs)n和(g)n形式的连接子到更为刚性的(eaaak)n、(ggs)n、sgsetpgtsesatpes形式的连接子(参见例如,guilingerjp,thompsondb,liudr.fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.nat.biotechnol.2014;32(6):577-82;其整体内容通过引用并入本文)范围内,或(xp)n基序),以便实现针对核碱基编辑器活性的最优长度。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,连接子包含(ggs)n基序,其中n是1、3或7。在一些实施方案中,本文所提供的融合蛋白的cas9结构域经由包含氨基酸序列sgsetpgtsesatpes的连接子融合。在一些实施方案中,连接子包含多个脯氨酸残基,并且为5-21、5-14、5-9、5-7个氨基酸的长度,例如,papap、papapa、papapap、papapapa、p(ap)4、p(ap)7、p(ap)10(参见例如,tanj,zhangf,karcherd,bockr.engineeringofhigh-precisionbaseeditorsforsite-specificsinglenucleotidereplacement.natcommun.2019jan25;10(1):439;其整体内容通过引用并入本文)。此类富含脯氨酸的连接子也称为“刚性”连接子。[1495]本发明的融合蛋白包含核酸编辑结构域。在一些实施方案中,脱氨酶是腺苷脱氨酶。在一些实施方案中,脱氨酶是脊椎动物脱氨酶。在一些实施方案中,脱氨酶是无脊椎动物脱氨酶。在一些实施方案中,脱氨酶是人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠脱氨酶。在一些实施方案中,脱氨酶是人脱氨酶。在一些实施方案中,脱氨酶是大鼠脱氨酶。[1496]如本文所用,“异源二聚体”可以指包含野生型tada结构域和tada*7.10结构域的变体的融合蛋白,或者可以指两种变体tada结构域(例如,tada7.10和具有y147t和q154s改变的tada7.10)。[1497]可以将异源多肽(例如,脱氨酶)插入napdnabp(例如,cas9)的合适位置处,例如,使得napdnabp保留其结合靶标多核苷酸和向导核酸的能力。可以将脱氨酶插入napdnabp中而不破坏该脱氨酶的功能(例如,碱基编辑活性)或该napdnabp的功能(例如,结合至靶标核酸和向导核酸的能力)。可以将脱氨酶插入napdnabp的例如无序区域内或包含高温因数或b-因数的区域中,如通过晶体学研究所示。蛋白质的不太有序、无序或非结构化区域,例如暴露于溶剂的区域和环,可以用于插入而不破坏结构或功能。可以将脱氨酶插入napdnabp的柔性环区域中或暴露于溶剂的区域中。在一些实施方案中,将脱氨酶插入cas9多肽的柔性环中。[1498]在一些实施方案中,通过对cas9多肽晶体结构的b-因数分子来确定脱氨酶的插入位置。在一些实施方案中,将脱氨酶插入cas9肽的包含高于平均值的b因数(例如,与总蛋白或包含无序区域的蛋白结构域相比,更高的b因数)的区域中。b-因数或温度因数可以表明原子从其平均位置的波动(例如,作为温度依赖性原子振动或晶格中的静态无序的结果)。主链原子的高b-因数(例如,高于平均b-因数)可以指示具有相对高的局部迁移率的区域的标志。此类区域可用于插入脱氨酶而不破坏结构和功能。可以将脱氨酶插入某一位置处,该位置具有含cα原子的残基且b-因数比总蛋白的平均b因数高50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或超过200%。可以将脱氨酶插入某一位置处,该位置具有含cα原子的残基且b-因数比包含该残基的cas9蛋白结构域的平均b因数高50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或超过200%。包含高于平均值的b因数的cas9多肽位置可以包括,例如,残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247和1248,如seqidno:1中编号。包含高于平均值的b因数的cas9多肽区域可以包括,例如,残基792-872、792-906和2-791,如seqidno:1中编号。[1499]可以将异源多肽(例如,脱氨酶)插入napdnabp中的选自由以下所组成的组的氨基酸残基处:768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247和1248,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将异源多肽插入如seqidno:1中编号的氨基酸位置768-769、791-792、792-793、1015-1016、1022-1023、1026-1027、1029-1030、1040-1041、1052-1053、1054-1055、1067-1068、1068-1069、1247-1248或之间1248-1249或其相应的氨基酸位置处。在一些实施方案中,将异源多肽插入如seqidno:1中编号的氨基酸位置769-770、792-793、793-794、1016-1017、1023-1024、1027-1028、1030-1031、1041-1042、1053-1054、1055-1056、1068-1069、1069-1070、1248-1249或1249-1250之间或其相应的氨基酸位置处。在一些实施方案中,异源多肽代替选自由下列组成的组的氨基酸残基:768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247和1248,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。应理解,关于插入位置而对seqidno:1的引用仅用于例示性说明目的。本文所讨论的插入不限于seqidno:1的cas9多肽序列,而是包括在变体cas9多肽(例如,cas9切口酶(ncas9)、核酸酶死亡的cas9(dcas9)、缺乏核酸酶结构域的cas9变体、截短的cas9、或缺乏部分或完整的hnh结构域的cas9结构域)中相应位置处的插入。[1500]可以将异源多肽(例如,脱氨酶)插入napdnabp中的选自由以下所组成的组的氨基酸残基处:768、792、1022、1026、1040、1068和1247,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将异源多肽插入如seqidno:1中编号的氨基酸位置768-769、792-793、1022-1023、1026-1027、1029-1030、1040-1041、1068-1069或1247-1248之间或其相应的氨基酸位置处。在一些实施方案中,将异源多肽插入如seqidno:1中编号的氨基酸位置769-770、793-794、1023-1024、1027-1028、1030-1031、1041-1042、1069-1070或1248-1249之间或其相应的氨基酸位置处。在一些实施方案中,异源多肽代替选自由下列组成的组的氨基酸残基:768、792、1022、1026、1040、1068和1247,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。[1501]在一些实施方案中,将abe(例如,tada)插入选自由下列组成的组的氨基酸残基处:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe(例如,tada)插入如seqidno:1中编号的残基792-872、792-906或2-791位置处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入选自由下列所组成的组的氨基酸的n端:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入选自由下列所组成的组的氨基酸的c端:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替换选自由下列所组成的组的氨基酸:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。[1502]在一些实施方案中,将cbe(例如,apobec1)插入选自由下列组成的组的氨基酸残基处:1016、1023、1029、1040、1069和1247,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入选自由下列所组成的组的氨基酸的n端:1016、1023、1029、1040、1069和1247,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入选自由下列所组成的组的氨基酸的c端:1016、1023、1029、1040、1069和1247,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替换选自由下列所组成的组的氨基酸:1016、1023、1029、1040、1069和1247,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。[1503]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基768处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸768的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸768的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸768,或另一cas9多肽的相应氨基酸残基处。[1504]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基791处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸791的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸791的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸791,或另一cas9多肽的相应氨基酸残基处。[1505]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基792处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸792的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸792的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸792,或另一cas9多肽的相应氨基酸残基处。[1506]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1016处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1016的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1016的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1016,或另一cas9多肽的相应氨基酸残基处。[1507]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1022处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1022的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1022的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1022,或另一cas9多肽的相应氨基酸残基处。[1508]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1023处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1023的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1023的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1023,或另一cas9多肽的相应氨基酸残基处。[1509]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1026处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1026的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1026的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1026,或另一cas9多肽的相应氨基酸残基处。[1510]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1029处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1029的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1029的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1029,或另一cas9多肽的相应氨基酸残基处。[1511]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1040处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸140的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1040的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1040,或另一cas9多肽的相应氨基酸残基处。[1512]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1052处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1052的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1052的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1052,或另一cas9多肽的相应氨基酸残基处。[1513]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1054处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1054的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1054的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1054,或另一cas9多肽的相应氨基酸残基处。[1514]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1067处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1067的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1067的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1067,或另一cas9多肽的相应氨基酸残基处。[1515]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1068处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1068的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1068的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1068,或另一cas9多肽的相应氨基酸残基处。[1516]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1069处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1069的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1069的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1069,或另一cas9多肽的相应氨基酸残基处。[1517]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1246处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1246的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1246的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1246,或另一cas9多肽的相应氨基酸残基处。[1518]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1247处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1247的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1247的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1247,或另一cas9多肽的相应氨基酸残基处。[1519]在一些实施方案中,将脱氨酶插入如seqidno:1中编号的氨基酸残基1248处,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1248的n端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入如seqidno:1中编号的氨基酸1248的c端,或另一cas9多肽的相应氨基酸残基处。在一些实施方案中,将abe插入以替代如seqidno:1中编号的氨基酸1248,或另一cas9多肽的相应氨基酸残基处。[1520]在一些实施方案中,将异源多肽(例如,脱氨酶)插入cas9多肽的柔性环中。柔性环部分可以选自下列所组成的组:如seqidno:1中编号的530-537、569-570、686-691、943-947、1002-1025、1052-1077、1232-1247或1298-1300,或另一cas9肽的相应氨基酸残基。柔性环部分可以选自由下列所组成的组:如seqidno:1中编号的1-529、538-568、580-685、692-942、948-1001、1026-1051、1078-1231或1248-1297,或另一cas9多肽的相应氨基酸残基。[1521]异源多肽(例如,脱氨酶)可以被插入对应于以下氨基酸残基的cas9多肽区域中:如seqidno:1中编号的1017-1069、1242-1247、1052-1056、1060-1077、1002-1003、943-947、530-537、568-579、686-691、1242-1247、1298-1300、1066-1077、1052-1056或1060-1077,或另一cas9多肽的相应氨基酸残基。[1522]可以将异源多肽(例如,脱氨酶)插入cas9多肽的被删除区域的位置处。被删除区域可以对应于cas9多肽的n端或c端。在一些实施方案中,被删除区域对应于如seqidno:1中编号的残基792-872,或另一cas9多肽的相应氨基酸残基。在一些实施方案中,被删除区域对应于如seqidno:1中编号的残基792-906,或另一cas9多肽的相应氨基酸残基。在一些实施方案中,被删除区域对应于如seqidno:1中编号的残基2-791,或另一cas9多肽的相应氨基酸残基。[1523]可以将异源多肽(例如,脱氨酶)插入cas9多肽的结构性或功能性结构域内。可以将异源多肽(例如,脱氨酶)插入cas9多肽的两个结构性或功能性结构域之间。可以将异源多肽(例如,脱氨酶)插入cas9多肽的结构性或功能性结构域的位置处,例如,在从cas9多肽删除该结构域之后。cas9多肽的结构性或功能性结构域可以包括,例如,ruvci、ruvcii、ruvciii、rec1、rec2、pi或hnh。[1524]在一些实施方案中,cas9多肽缺少选自以下所组成的组的一个或多个结构域:ruvci、ruvcii、ruvciii、rec1、rec2、pi或hnh结构域。在一些实施方案中,cas9多肽缺少核酸酶结构域。在一些实施方案中,cas9多肽缺少hnh结构域。在一些实施方案中,cas9多肽缺少hnh结构域的一部分,使得该cas9多肽的hnh活性下降或消失。[1525]在一些实施方案中,cas9多肽包含核酸酶结构域的缺失,并且插入脱氨酶以代替该核酸酶结构域。在一些实施方案中,hnh结构域被删除,并且脱氨酶被插入到其位置处。在一些实施方案中,一个或多个ruvc结构域被删除,并且脱氨酶被插入到其位置处。[1526]包含异源多肽的融合蛋白侧翼可以具有napdnabp的n端和c端片段。在一些实施方案中,融合蛋白包含侧翼具有napdnabp的n端和c端片段的脱氨酶。该n端片段或c端片段可以结合靶标多核苷酸序列。该n端片段的c端或该c端片段的n端可以包含cas9多肽的柔性环的一部分。该n端片段的c端或该c端片段的n端可以包含cas9多肽的α-螺旋结构的一部分。该c端片段的n端可以包含dna结合结构域。该c端片段的n端可以包含ruvc结构域。该c端片段的n端可以包含hnh结构域。在一些实施方案中,该n端片段和c端片段都不包含hnh结构域。[1527]在一些实施方案中,该n端cas9片段的c端包含一个氨基酸,当融合蛋白将靶标核碱基脱氨基时,该氨基酸接近该靶标核碱基。在一些实施方案中,该c端cas9片段的n端包含一个氨基酸,当融合蛋白将靶标核碱基脱氨基时,该氨基酸接近该靶标核碱基。不同脱氨酶的插入位置可以不同,以便在靶标核碱基与n端cas9片段的c端或c端cas9片段的n端之间具有近距离。例如,abe的插入位置可以位于选自由以下组成的组的氨基酸残基处:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。cbe的合适插入位置可以是选自由以下组成的组的氨基酸残基:1016、1023、1029、1040、1069和1247,如seqidno:1中编号,或者另一cas9多肽的相应氨基酸残基处。在某些实施方案中,abe的插入可以被插入上述所列氨基酸残基中任何一个的n端或c端。在某些实施方案中,abe的插入可以被插入以代替上述所列氨基酸残基中的任何一个。[1528]融合蛋白的n端cas9片段(即,位于融合蛋白中脱氨酶侧翼的n端cas9片段)可以包含cas9多肽的n端。融合蛋白的n端cas9片段可以包含至少约下列的长度:100、200、300、400、500、600、700、800、900、1000、1100、1200或1300个氨基酸。融合蛋白的n端cas9片段可以包含对应于以下氨基酸残基的序列:如seqidno:1中编号的1-56、1-95、1-200、1-300、1-400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918或1-1100,或另一cas9多肽的相应氨基酸残基。融合蛋白的n端cas9片段可以包含序列,该序列包含与以下氨基酸序列至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%序列同一性:如seqidno:1中编号的1-56、1-95、1-200、1-300、1-400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918或1-1100,或另一cas9多肽的相应氨基酸残基。[1529]融合蛋白的c端cas9片段(即,位于融合蛋白中脱氨酶侧翼的c端cas9片段)可以包含cas9多肽的c端。融合蛋白的c端cas9片段可以包含至少约下列的长度:100、200、300、400、500、600、700、800、900、1000、1100、1200或1300个氨基酸。融合蛋白的c端cas9片段可以包含对应于以下氨基酸残基的序列:如seqidno:1099中编号的1-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368或56-1368,或另一cas9多肽的相应氨基酸残基。融合蛋白的n端cas9片段可以包含序列,该序列包含与以下氨基酸序列至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%序列同一性:如seqidno:1099中编号的1-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368或56-1368,或另一cas9多肽的相应氨基酸残基。[1530]融合蛋白的n端cas9片段和c端cas9片段整体看来可能并不对应于全长度天然出现的cas9多肽序列,例如,如seqidno:1中详述的。[1531]本文所述的融合蛋白可以实现靶向脱氨基,并且在非靶标位点(例如,脱靶位点)处的脱氨基作用减少,诸如全基因组假脱氨基作用减少。本文所述的融合蛋白可以实现靶向脱氨基,并且在非靶标位点的旁观者脱氨基作用减少。与例如包含融合至cas9多肽的n端或c端的脱氨酶的末端融合蛋白相比,不希望的脱氨基作用或脱靶脱氨基作用可以减少至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%。与例如包含融合至cas9多肽的n端或c端的脱氨酶的末端融合蛋白相比,不希望的脱氨基作用或脱靶脱氨基作用可以减少1倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、至少15倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。[1532]在一些实施方案中,融合蛋白的脱氨酶将r环范围内的不超过两个核碱基脱氨基。在一些实施方案中,融合蛋白的脱氨酶将r环范围内的不超过三个核碱基脱氨基。在一些实施方案中,融合蛋白的脱氨酶将r环范围内的不超过2、3、4、5、6、7、8、9或10个核碱基脱氨基。r环是一种三链核酸结构,其包括dna:rna杂交物、dna:dna或rna:rna互补结构亦即与单链dna缔合。如本文所用,r环可在靶标多核苷酸与crispr复合物或碱基编辑复合物接触时形成,其中向导多核苷酸(例如,向导rna)的一部分与靶标多核苷酸(例如,靶标dna)的一部分杂交并替换该靶标多核苷酸的一部分。在一些实施方案中,r环包含间隔序列与靶标dna互补序列的经杂交区域。r环区域可以为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核碱基对的长度。在一些实施方案中,r环区域为约20个核碱基对的长度。应理解,如本文所用,r环区域不限于与向导多核苷酸杂交的靶标dna链。例如,r环区域内靶标核碱基的编辑可以是对包含与向导rna的互补链的dna链的编辑,或者可以是对作为与向导rna的互补链相反的链的dna链的编辑。在一些实施方案中,r环区域中的编辑包含编辑靶标dna序列中向导rna的非互补链(前间隔序列链)上的核碱基。[1533]本文所述的融合蛋白可以在不同于经典碱基编辑的编辑窗内实现靶标脱氨基。在一些实施方案中,靶标核碱基位于靶标多核苷酸序列中pam序列的上游约1至约20个碱基处。在一些实施方案中,靶标核碱基位于靶标多核苷酸序列中pam序列的上游约2至约12个碱基处。在一些实施方案中,靶标核碱基位于与pam序列相距或该pam序列上游约1至9个碱基对、约2至10个碱基对、约3至11个碱基对、约4至12个碱基对、约5至13个碱基对、约6至14个碱基对、约7至15个碱基对、约8至16个碱基对、约9至17个碱基对、约10至18个碱基对、约11至19个碱基对、约12至20个碱基对、约1至7个碱基对、约2至8个碱基对、约3至9个碱基对、约4至10个碱基对、约5至11个碱基对、约6至12个碱基对、约7至13个碱基对、约8至14个碱基对、约9至15个碱基对、约10至16个碱基对、约11至17个碱基对、约12至18个碱基对、约13至19个碱基对、约14至20个碱基对、约1至5个碱基对、约2至6个碱基对、约3至7个碱基对、约4至8个碱基对、约5至9个碱基对、约6至10个碱基对、约7至11个碱基对、约8至12个碱基对、约9至13个碱基对、约10至14个碱基对、约11至15个碱基对、约12至16个碱基对、约13至17个碱基对、约14至18个碱基对、约15至19个碱基对、约16至20个碱基对、约1至3个碱基对、约2至4个碱基对、约3至5个碱基对、约4至6个碱基对、约5至7个碱基对、约6至8个碱基对、约7至9个碱基对、约8至10个碱基对、约9至11个碱基对、约10至12个碱基对、约11至13个碱基对、约12至14个碱基对、约13至15个碱基对、约14至16个碱基对、约15至17个碱基对、约16至18个碱基对、约17至19个碱基对、约18至20个碱基对处。在一些实施方案中,靶标核碱基位于与pam序列相距或该pam序列上游约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个碱基对处。在一些实施方案中,靶标核碱基位于pam序列上游约1、2、3、4、5、6、7、8或9个碱基对处。在一些实施方案中,靶标核碱基位于pam序列上游约2、3、4或6个碱基对处。[1534]据此,本文也提供融合蛋白库和使用该融合蛋白库来优化碱基编辑的方法,与经典碱基编辑器(例如,be4)相比,该方法允许使用替代性优选碱基编辑窗。在一些实施方案中,本公开提供用于进行优化的碱基编辑的蛋白质库,其包含多个融合蛋白,其中该多个融合蛋白中的每一个包含侧翼具有cas9多肽的n端片段和c端片段的脱氨酶,其中每一个融合蛋白的n端片段不同于该多个融合蛋白中剩余者的n端片段或者其中每一个融合蛋白的c端片段不同于该多个融合蛋白中剩余者的c端片段,其中每一个融合蛋白的脱氨酶将靶标多核苷酸序列中接近前间隔邻近基序(pam)序列的靶标核碱基脱氨基,并且其中该n端片段或该c端片段结合靶标多核苷酸序列。在一些实施方案中,对于crisprr环中的每个核碱基,该多个融合蛋白中的至少一个将该核碱基脱氨基。在一些实施方案中,对于位于与pam序列相距1至20个碱基对的靶标多核苷酸内的每个核碱基,该多个融合蛋白中的至少一个将该核碱基脱氨基。在一些实施方案中,本文提供一种包含融合蛋白库的试剂盒,其允许进行优化的碱基编辑。[1535]融合蛋白可以包含超过一种异源多肽。例如,融合蛋白可以额外地包含一种或多种ugi结构域和/或一种或多种核定位元信号。该两种或更多种异源结构域可以串联插入。可以将两种或更多种异源结构域插入多个位置处,使得它们在napdnabp中不是串联的。[1536]在一些实施方案中,碱基编辑器是包含napdnabp结构域(例如,衍生自cas12的结构域)和内部融合的核碱基编辑结构域(例如,脱氨酶结构域的全部或一部分)的融合蛋白。在一些实施方案中,napdnabp是cas12b。在一些实施方案中,碱基编辑器包含bhcas12b结构域和插入在表18中提供的基因座处的内部融合的tada*8结构域。[1537]表18:cas12b蛋白中的插入基因座[1538][1539][1540]在一些实施方案中,碱基编辑器可以包含多个结构域。例如,包含衍生自cas12蛋白的napdnabp结构域的碱基编辑器可以包含对应于野生型或天然cas12的rec叶和nuc叶的rec叶和nuc叶。在另一实施例中,碱基编辑器可以包含ruvc结合域、wed结构域中的一个或多个。在一些实施方案中,碱基编辑器的一个或多个结构域包含相对于包含该结构域的野生型版本多肽的突变(例如,置换、插入、缺失)。[1541]本发明的融合蛋白包含核酸编辑结构域。在一些实施方案中,核酸编辑结构域可以催化c到u的碱基变化。在一些实施方案中,核酸编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白bmrna编辑复合物(apobec)家族脱氨酶。在一些实施方案中,脱氨酶是apobecl脱氨酶。在一些实施方案中,脱氨酶是apobec2脱氨酶。在一些实施方案中,脱氨酶是apobec3脱氨酶。在一些实施方案中,脱氨酶是apobec3a脱氨酶。在一些实施方案中,脱氨酶是apobec3b脱氨酶。在一些实施方案中,脱氨酶是apobec3c脱氨酶。在一些实施方案中,脱氨酶是apobec3d脱氨酶。在一些实施方案中,脱氨酶是apobec3e脱氨酶。在一些实施方案中,脱氨酶是apobec3f脱氨酶。在一些实施方案中,脱氨酶是apobec3g脱氨酶。在一些实施方案中,脱氨酶是apobec3h脱氨酶。在一些实施方案中,脱氨酶是apobec4脱氨酶。[1542]在一些实施方案中,脱氨酶是启动诱导的脱氨酶(aid)。[1543]在一些实施方案中,脱氨酶是脊椎动物脱氨酶。在一些实施方案中,脱氨酶是无脊椎动物脱氨酶。在一些实施方案中,脱氨酶是人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠脱氨酶。在一些实施方案中,脱氨酶是人脱氨酶。在一些实施方案中,脱氨酶是大鼠脱氨酶,例如,rapobecl。在一些实施方案中,脱氨酶是海七鳃鳗胞苷脱氨酶1(pmcdal)。在一些实施方案中,脱氨酶是人apobec3g。在一些实施方案中,脱氨酶是人apobec3g的片段。在一些实施方案中,核酸编辑结构域与本文所述任何脱氨酶的脱氨酶结构域为至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。[1544]连接子[1545]在某些实施方案中,连接子可以用来连接本发明的任何多肽或多肽结构域。连接子可以简单到是共价键,或者它可以是长度为很多原子的聚合性连接子。在某些实施方案中,连接子是多肽或是基于多个氨基酸的。在其他实施方案中,连接子不是肽样的。在某些实施方案中,连接子是共价键(例如,碳-碳键、二硫键、碳-杂原子键等)。在某些实施方案中,连接子是酰胺链结的碳-氮键。在某些实施方案中,连接子是环状或非环状的、经取代或未经取代的、分支的或未分支的脂肪族或杂脂肪族连接子。在某些实施方案中,连接子是聚合性的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,连接子包含氨基烷酸的单体、二聚体或聚合物。在某些实施方案中,连接子包含氨基烷酸(例如,甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)。在某些实施方案中,连接子包含氨基己酸(ahx)的单体、二聚体或聚合物。在某些实施方案中,连接子是基于碳环部分(例如,环戊烷、环己烷)的。在其他实施方案中,连接子包含聚乙二醇部分(peg)。在其他实施方案中,连接子包含氨基酸。在某些实施方案中,连接子包含肽。在某些实施方案中,连接子包含芳基或杂芳基部分。在某些实施方案中,连接子是基于苯环的。连接子可以包括经功能化的部分以促进来自肽的亲核体(例如,巯基、氨基)附接至连接子。任何亲电体均可用作连接子的一部分。示例性的亲电体包括但不限于,活化的酯、活化的酰胺、michael受体、烷基卤化物、芳基卤化物、酰卤和异硫氰酸酯。[1546]在一些实施方案中,连接子是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是键(例如,共价键)、有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子为约3至约104(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100)个氨基酸的长度。[1547]在一些实施方案中,腺苷脱氨酶与napdnabp经由长度为4、16、32或104个氨基酸的连接子融合。在一些实施方案中,连接子为约3至约104个氨基酸的长度。在一些实施方案中,本文所提供的任何融合蛋白包含经由连接子融合至彼此的腺苷脱氨酶和cas9结构域。可以在脱氨酶结构域(例如,经工程化的ectada)与cas9结构域之间采用各种连接子长度和柔软度(例如,从非常柔性的(gggs)n、(ggggs)n和(g)n形式的连接子到更为刚性的(eaaak)n、(sggs)n、sgsetpgtsesatpes形式的连接子(参见例如,guilingerjp,thompsondb,liudr.fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.nat.biotechnol.2014;32(6):577-82;整体内容通过引用并入本文)范围内和(xp)n),以便实现针对核碱基编辑器的活性的最优长度。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,连接子包含(ggs)n基序,其中n是1、3或7。在一些实施方案中,本文提供的任何融合蛋白的腺苷脱氨酶与cas9结构域经由(例如,xten连接子)融合,该连接子包含氨基酸序列sgsetpgtsesatpes。[1548]具有向导rna的cas9复合物[1549]本公开的一些方面提供复合物,其包含本文提供的任何融合蛋白和结合至融合蛋白的cas9结构域(例如,dcas9、核酸酶活性cas9或cas9切口酶)的向导rna(例如,靶向a\突变的向导)。这些复合物也称为核糖核蛋白(rnp)。可以采用任何用于连接融合蛋白结构域的方法(例如,从非常柔性的(gggs)n、(ggggs)n和(g)n形式的连接子到更为刚性的(eaaak)n、(sggs)n、sgsetpgtsesatpes(参见,例如guilingerjp,thompsondb,liudr.fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.nat.biotechnol.2014;32(6):577-82;其整体内容通过引用并入本文)和(xp)n范围内),以便实现针对核碱基编辑器活性的最优长度。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,连接子包含(ggs)n基序,其中n是1、3或7。在一些实施方案中,本文所提供的融合蛋白的cas9结构域经由包含氨基酸序列sgsetpgtsesatpes的连接子融合。[1550]在一些实施方案中,向导核酸(例如,向导rna)为15-100个核苷酸长,并且包含与靶标序列互补的至少10个毗邻核苷酸。在一些实施方案中,向导rna为15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸长。在一些实施方案中,向导rna包含与靶标序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个毗邻核苷酸的序列。在一些实施方案中,靶标序列为dna序列。在一些实施方案中,靶标序列为细菌、酵母、真菌、昆虫、植物或动物基因组中的序列。在一些实施方案中,靶标序列为人类基因组中的序列。在一些实施方案中,靶标序列的3'末端紧邻经典pam序列(ngg)。在一些实施方案中,靶标序列的3'紧邻非经典pam序列(例如,表1中所列的序列或5'-naa-3')。在一些实施方案中,向导核酸(例如,向导rna)与感兴趣的基因(例如,与疾病或疾患相关的基因)中的序列互补。[1551]本公开的一些方面提供使用本文所提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供包括以下步骤的方法:使dna分子与本文提供的任何具有至少一种向导rna的融合蛋白接触,其中该向导rna为约15-100个核苷酸长并且包含与靶标序列互补的至少10个毗邻核苷酸。在一些实施方案中,靶标序列的3'末端紧邻经典pam序列(ngg)。在一些实施方案中,靶标序列的3'末端不紧邻经典pam序列(ngg)。在一些实施方案中,靶标序列的3'末端紧邻agc、gag、ttt、gtg或caa序列。在一些实施方案中,靶标序列的3'末端紧邻nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5'(tttv)序列。[1552]本公开的一些方面提供包含本文所提供的任何融合蛋白的复合物,以及靶向位于疾病相关基因或致病基因的外显子的5'处的内含子序列中的ag剪接受体的受体rna。在一种实施方案中,被靶向的内含子ag剪接受体位于与als相关的sod1基因的外显子3的5'处。[1553]在一些实施方案中,向导核酸(例如,向导rna)为15-100个核苷酸长,并且包含与靶标序列互补的至少10个毗邻核苷酸。在一些实施方案中,向导rna为15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸长。在一些实施方案中,向导rna包含与靶标序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个毗邻核苷酸的序列。在一些实施方案中,靶标序列为dna序列。在一些实施方案中,靶标序列为细菌、酵母、真菌、昆虫、植物或动物基因组中的序列。在一些实施方案中,靶标序列为人类基因组中的序列。在一些实施方案中,靶标序列的3'末端紧邻经典pam序列(ngg)。在一些实施方案中,靶标序列的3'紧邻非经典pam序列(例如,表1中所列的序列或5'-naa-3')。在一些实施方案中,向导核酸(例如,向导rna)与位于sod1基因的外显子3的5'处的内含子中的ag剪接受体序列互补。[1554]本公开的一些方面提供使用本文所提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供包括以下步骤的方法:使dna分子与本文提供的任何具有至少一种向导rna的融合蛋白接触,其中该向导rna为约15-100个核苷酸长并且包含与靶标序列互补的至少10个毗邻核苷酸。在一些实施方案中,靶标序列的3'末端紧邻agc、gag、ttt、gtg或caa序列。在一些实施方案中,靶标序列的3'末端紧邻nga、naa、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5'(tttv)序列。[1555]应理解,各序列中具体位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号在例如成熟蛋白的前体和成熟蛋白本身中可以是不同的,并且来自不同物种的序列之间的差异可能影响编号。本领域技术人员将能够通过本领域周知的方法鉴定任何同源蛋白质和相应编码核酸中的各残基,例如,通过序列比对和同源残基的确定。[1556]对于本领域技术人员将会是显而易见的是,为了使本文公开的任何融合蛋白靶向靶标位点,例如,包含待编辑的突变的位点,将融合蛋白与向导rna共表达通常是必要的。如本文其余处更详细解释的,向导rna通常包含允许cas9结合的tracrrna框架以及向cas9:核酸编辑酶/结构域融合蛋白提供序列特异性的向导序列。作为另一种选择,向导rna和tracrrna可以作为两个核酸分子而独立地提供。在一些实施方案中,向导rna包含一结构,其中该向导序列包含与靶标序列互补的序列。向导序列通常为20个核苷酸长。基于本公开,适用于使cas9:核酸编辑酶/结构域融合蛋白靶向特定基因组靶标位点的向导rna的序列对于本领域技术人员将会是显而易见的。此类合适的向导rna序列通常包含与位于待编辑的靶标核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。本文提供了一些适用于使所提供的任何融合蛋白靶向特定靶标序列的示例性向导rna序列。[1557]具有向导rna的cas12复合物[1558]本公开的一些方面提供包含本文所提供的任何融合蛋白以及向导rna(例如,靶向靶标多核苷酸以进行编辑的向导)的复合物。[1559]在一些实施方案中,向导核酸(例如,向导rna)为15-100个核苷酸长,并且包含与靶标序列互补的至少10个毗邻核苷酸。在一些实施方案中,向导rna为15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸长。在一些实施方案中,向导rna包含与靶标序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个毗邻核苷酸的序列。在一些实施方案中,靶标序列为dna序列。在一些实施方案中,靶标序列为细菌、酵母、真菌、昆虫、植物或动物基因组中的序列。在一些实施方案中,靶标序列为人类基因组中的序列。在一些实施方案中,靶标序列的3'末端紧邻经典pam序列。在一些实施方案中,靶标序列的3'末端紧邻非经典pam序列。[1560]本公开的一些方面提供使用本文所提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供包括以下步骤的方法:使dna分子与本文提供的任何具有至少一种向导rna的融合蛋白接触,其中该向导rna为约15-100个核苷酸长并且包含与靶标序列互补的至少10个毗邻核苷酸。在一些实施方案中,靶标序列的3'末端紧邻例如ttn、dttn、gttn、attn、attc、dttnt、wttn、haty、tttn、tttv、tttc、tg、rtr或ytnpam位点。[1561]应理解,各序列中具体位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号在例如成熟蛋白的前体和成熟蛋白本身中可以是不同的,并且来自不同物种的序列之间的差异可能影响编号。本领域技术人员将能够通过本领域周知的方法鉴定任何同源蛋白质和相应编码核酸中的各残基,例如,通过序列比对和同源残基的确定。[1562]对于本领域技术人员将会是显而易见的是,为了使本文公开的任何融合蛋白靶向靶标位点,例如,包含待编辑的突变的位点,将融合蛋白与向导rna共表达通常是必要的。如本文其余处更详细解释的,向导rna通常包含允许cas12结合的tracrrna框架以及向cas12:核酸编辑酶/结构域融合蛋白提供序列特异性的向导序列。作为另一种选择,向导rna和tracrrna可以作为两个核酸分子而独立地提供。在一些实施方案中,向导rna包含一结构,其中该向导序列包含与靶标序列互补的序列。向导序列通常为20个核苷酸长。基于本公开,适用于使cas12:核酸编辑酶/结构域融合蛋白靶向特定基因组靶标位点的向导rna的序列对于本领域技术人员将会是显而易见的。此类合适的向导rna序列通常包含与位于待编辑的靶标核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。本文提供了一些适用于使所提供的任何融合蛋白靶向特定靶标序列的示例性向导rna序列。[1563]本文所公开的碱基编辑器的结构域可以任何次序排列,只要脱氨酶结构域被内化到cas12蛋白中即可。包含具有例如cas12结构域和脱氨酶结构域的融合蛋白的碱基编辑器的非限制性示例可以排列如下:[1564]nh2-[cas12结构域]-连接子1-[abe8]-连接子2-[cas12结构域]-cooh;[1565]nh2-[cas12结构域]-连接子1-[abe8]-[cas12结构域]-cooh;[1566]nh2-[cas12结构域]-[abe8]-连接子2-[cas12结构域]-cooh;[1567]nh2-[cas12结构域]-[abe8]-[cas12结构域]-cooh;[1568]nh2-[cas12结构域]-连接子1-[abe8]-连接子2-[cas12结构域]-[肌苷ber抑制剂]-cooh;[1569]nh2-[cas12结构域]-连接子1-[abe8]-[cas12结构域]-[肌苷ber抑制剂]-cooh;[1570]nh2-[cas12结构域]-[abe8]-连接子2-[cas12结构域]-[肌苷ber抑制剂]-cooh;[1571]nh2-[cas12结构域]-[abe8]-[cas12结构域]-[肌苷ber抑制剂]-cooh;[1572]nh2-[肌苷ber抑制剂]-[cas12结构域]-连接子1-[abe8]-连接子2-[cas12结构域]-cooh;[1573]nh2-[肌苷ber抑制剂]-[cas12结构域]-连接子1-[abe8]-[cas12结构域]-cooh;[1574]nh2-[肌苷ber抑制剂]-[cas12结构域]-[abe8]-连接子2-[cas12结构域]-cooh;[1575]nh2-[肌苷ber抑制剂]nh2-[cas12结构域]-[abe8]-[cas12结构域]-cooh;[1576]此外,在一些情况下,gam蛋白可以融合至碱基编辑器的n端。在一些情况下,gam蛋白可以融合至碱基编辑器的c端。细菌噬菌体mu的gam蛋白可以结合至双链断裂(dsb)的末端并且保护它们免于降解。在一些实施方案中,使用gam来结合dsb的自由末端可以减少碱基编辑过程中的插入缺失形成。在一些实施方案中,将174个残基的gam蛋白融合至碱基编辑器的n端。参见,komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)。在一些情况下,一个或多个突变可以改变碱基编辑器结构域相对于野生型结构域的长度。例如,在至少一个结构域中至少一个氨基酸的缺失可以缩短碱基编辑器的长度。在另一种情况下,一个或多个突变不改变结构域相对于野生型结构域的长度。例如,任何结构域中的一种或多种置换不改变碱基编辑器的长度。其中全部结构域的长度与野生型结构域相同的此类碱基编辑器的非限制性示例可以包括:[1577]nh2-[cas12结构域]-连接子1-[apobec1]-连接子2-[cas12结构域]-cooh;[1578]nh2-[cas12结构域]-连接子1-[apobec1]-[cas12结构域]-cooh;[1579]nh2-[cas12结构域]-[apobec1]-连接子2-[cas12结构域]-cooh;[1580]nh2-[cas12结构域]-[apobec1]-[cas12结构域]-cooh;[1581]nh2-[cas12结构域]-连接子1-[apobec1]-连接子2-[cas12结构域]-[ugi]-cooh;[1582]nh2-[cas12结构域]-连接子1-[apobec1]-[cas12结构域]-[ugi]-cooh;[1583]nh2-[cas12结构域]-[apobec1]-连接子2-[cas12结构域]-[ugi]-cooh;[1584]nh2-[cas12结构域]-[apobec1]-[cas12结构域]-[ugi]-cooh;[1585]nh2-[ugi]-[cas12结构域]-连接子1-[apobec1]-连接子2-[cas12结构域]-cooh;[1586]nh2-[ugi]-[cas12结构域]-连接子1-[apobec1]-[cas12结构域]-cooh;[1587]nh2-[ugi]-[cas12结构域]-[apobec1]-连接子2-[cas12结构域]-cooh;[1588]nh2-[ugi]-[cas12结构域]-[apobec1]-[cas12结构域]-cooh;[1589]在一些实施方案中,本文所提供的碱基编辑融合蛋白需要被定位在精确位置处,例如,靶标碱基被放置在定义区域(例如,“脱氨基窗”)内。在一些情况下,靶标可以位于4个碱基的区域内。在一些情况下,此类定义的靶标区域可以位于pam的上游大约15个碱基处。参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017)和komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),其整体内容通过引用并入本文。[1590]定义的靶标区域可以是脱氨基窗。脱氨基窗可以是定义的区域,在该区域中,碱基编辑器作用于靶标核苷酸并将该靶标核苷酸脱氨基。在一些实施方案中,脱氨基窗位于2、3、4、5、6、7、8、9或10个碱基的区域内。在一些实施方案中,脱氨基窗位于pam的上游5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基处。[1591]本公开的碱基编辑器可以包含任何促进靶标多核苷酸序列的编辑的结构域、特征和氨基酸序列。例如,在一些实施方案中,碱基编辑器包含核定位序列(nls)。在一些实施方案中,碱基编辑器的nls定位在脱氨酶结构域与napdnabp结构域之间。在一些实施方案中,碱基编辑器的nls定位在napdnabp结构域的c端。[1592]融合蛋白中包括的蛋白结构域可以是异源性功能结构域。可以包括在融合蛋白中的蛋白结构域的非限制性示例包括脱氨酶结构域(例如,胞苷脱氨酶和/或腺苷脱氨酶)、尿嘧啶糖苷酶抑制剂(ugi)结构域、表位元标签和报告基因序列。蛋白结构域可以是例如具有下列活性中的一种或多种的异源性功能结构域:转录启动活性、转录抑制活性、转录释放因数活性、基因沉默活性、染色质修饰活性、表观遗传修饰活性、组蛋白修饰活性、rna裂解活性和核酸结合活性。此类异源性功能结构域可以提供功能活性,诸与靶标dna缔合的靶标多肽(例如,组蛋白、dna结合蛋白等)修饰,导致例如组蛋白甲基化、组蛋白乙酰化、组蛋白泛素化等。所提供的其他功能和/或活性可以包括转座酶活性、重组酶活性、连接酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷酸haunt活性、sumo化活性、脱sumo化活性或上述者的组合。[1593]可以使用表位标签、报导蛋白、其他结合结构域来检测或标记结构域。表位标签的非限制性示例包括组氨酸(his)标签、v5标签、flag标签、流感病毒血凝素(ha)标签、myc标签、vsv-g标签和硫氧还蛋白(trx)标签。报告基因的示例包括但不限于,谷胱甘肽-5-转移酶(gst)、辣根过氧化物酶(hrp)、氯霉素乙酰转移酶(cat)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、萤光素酶、绿色萤光蛋白(gfp)、hcred、dsred、青色萤光蛋白(cfp)、黄色萤光蛋白(yfp)和包括蓝色萤光蛋白(bfp)在内的自体萤光蛋白。额外蛋白质序列可以包括结合dna分子或结合其他细胞分子的氨基酸序列,包括但不限于,麦芽糖结合蛋白(mbp)、s标签、lexadna结合结构域(dbd)融合物、gal4dna结合结构域融合物和单纯疱疹病毒(hsv)bp16蛋白融合物。[1594]在一些实施方案中,bhcas12b向导多核苷酸具有以下序列:[1595]bhcas12bsgrna支架(底线) 20nt至23nt向导序列(以nn表示)[1596]5'gttctgtcttttggtcaggacaaccgtctagctataagtgctgcagggtgtgagaaactcctattgctggacgatgtctcttacgaggcattagcacnnnnnnnnnnnnnnnnnnnn-3'[1597]在一些实施方案中,bvcas12b和aacas12b向导多核苷酸具有以下序列:[1598]bvcas12bsgrna支架(底线) 20nt至23nt向导序列(以nn表示)[1599]5'gacctatagggtcaatgaatctgtgcgtgtgccataagtaattaaaaattacccaccacaggagcacctgaaaacaggtgcttggcacnnnnnnnnnnnnnnnnnnnn-3'[1600]aacas12bsgrna支架(底线) 20nt至23nt向导序列(以nn表示)[1601]5'gtctaaaggacagaatttttcaacgggtgtgccaatggccactttccaggtggcaaagcccgttgaacttctcaaaaagaacgatctgagaagtggcacnnnnnnnnnnnnnnnnnnnn-3'[1602]使用包含腺苷脱氨酶和cas9结构域的融合蛋白的方法[1603]本公开的一些方面提供使用本文所提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供包括以下步骤的方法:使编码突变形式的蛋白质的dna分子与本文提供的任何具有至少一种向导rna的融合蛋白接触,其中该向导rna为约15-100个核苷酸长并且包含与靶标序列互补的至少10个毗邻核苷酸。在一些实施方案中,靶标序列的3'末端紧邻经典pam序列(ngg)。在一些实施方案中,靶标序列的3'末端不紧邻经典pam序列(ngg)。在一些实施方案中,靶标序列的3'末端紧邻agc、gag、ttt、gtg或caa序列。在一些实施方案中,靶标序列的3'末端紧邻nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5'(tttv)序列。[1604]应理解,各序列中具体位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号在例如成熟蛋白的前体和成熟蛋白本身中可以是不同的,并且来自不同物种的序列之间的差异可能影响编号。本领域技术人员将能够通过本领域周知的方法鉴定任何同源蛋白质和相应编码核酸中的各残基,例如,通过序列比对和同源残基的确定。[1605]对于本领域技术人员将会是显而易见的是,为了使本文公开的包含cas9结构域和腺苷脱氨酶变体(例如,abe8)的任何融合蛋白靶向靶标位点,例如,包含待编辑的突变的位点,将融合蛋白与向导rna(例如,sgrna)共表达通常是必要的。如本文其余处更详细解释的,向导rna通常包含允许cas9结合的tracrrna框架以及向cas9:核酸编辑酶/结构域融合蛋白提供序列特异性的向导序列。作为另一种选择,向导rna和tracrrna可以作为两个核酸分子而独立地提供。在一些实施方案中,向导rna包含一结构,其中该向导序列包含与靶标序列互补的序列。向导序列通常为20个核苷酸长。基于本公开,适用于使cas9:核酸编辑酶/结构域融合蛋白靶向特定基因组靶标位点的向导rna的序列对于本领域技术人员将会是显而易见的。此类合适的向导rna序列通常包含与位于待编辑的靶标核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。本文提供了一些适用于使所提供的任何融合蛋白靶向特定靶标序列的示例性向导rna序列。[1606]base编辑器效率[1607]crispr-cas9核酸酶已经广泛用于介导靶向基因组编辑。在大多数基因组编辑应用中,cas9与向导多核苷酸(例如,单向导rna(sgrna))形成复合物并且诱导被该sgrna序列针对的靶标位点处的双链dna断裂(dsb)。细胞主要通过非同源末端接合(nhej)修复途径来回应这一dsb,导致可能造成中断该基因的移码突变的随机插入或缺失(indel)。在存在与位于dsb侧翼的序列具有高度同源性的供体dna目标的情况下,可以通过被称为同源引导修复(hdr)的替代途径实现基因联接。不幸的是,在大多数非微扰条件下,hdr是低效的,取决于细胞状态和细胞类型,并且更高频率的插入缺失占主导地位。由于大多数已知的与人类疾病相关的基因变异是点突变,因此需要可能更有效、干净地制造精确点突变的方法。本文所提供的碱基编辑系统提供新的途径来提供基因组编辑而不产生双链dna断裂,不需要供体dna目标,并且不诱导过量的随机插入和缺失。[1608]在一些方面,需要可能通过对疾病相关基因的非编码区域5'中的剪接受体进行精确碱基编辑而中断疾病相关基因的mrna转录物的剪接的方法,并且本文提供了该方法。在一种实施方案中,疾病相关基因是与als相关的sod1基因。在一种实施方案中,提供sod1基因的外显子3的剪接受体5'的a到g碱基编辑,以中断sod1mrna转录物的剪接,从而获得截短的sod1蛋白产物合作非功能性(空)蛋白。[1609]本发明的融合蛋白有利地修饰编码包含突变的蛋白质的特定核苷酸碱基而不产生显著的插入缺失部分。如本文所用“插入缺失”是指核酸内核苷酸碱基的插入或缺失。此类插入或缺失可以导致基因的编码区域内的移码突变。在一些实施方案中,希望产生碱基编辑器,其有效地修饰(例如,突变或脱氨基)核酸内的特定核苷酸而不在核酸中产生大量的插入或缺失(即,插入缺失)。在某些实施方案中,本文提供的任何碱基编辑器都能够产生相比于插入缺失更符合预期的修饰(例如,突变或脱氨基)部分。[1610]在一些实施方案中,本文提供的任何碱基编辑器系统导致在靶标多核苷酸序列中低于50%、低于40%、低于30%、低于20%、低于19%、低于18%、低于17%、低于16%、低于15%、低于14%、低于13%、低于12%、低于11%、低于10%、低于9%、低于8%、低于7%、低于6%、低于5%、低于4%、低于3%、低于2%、低于1%、低于0.9%、低于0.8%、低于0.7%、低于0.6%、低于0.5%、低于0.4%、低于0.3%、低于0.2%、低于0.1%、低于0.09%、低于0.08%、低于0.07%、低于0.06%、低于0.05%、低于0.04%、低于0.03%、低于0.02%或低于0.01%的插入缺失形成。[1611]在一些实施方案中,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑器系统导致在靶标多核苷酸序列中低于50%、低于40%、低于30%、低于20%、低于19%、低于18%、低于17%、低于16%、低于15%、低于14%、低于13%、低于12%、低于11%、低于10%、低于9%、低于8%、低于7%、低于6%、低于5%、低于4%、低于3%、低于2%、低于1%、低于0.9%、低于0.8%、低于0.7%、低于0.6%、低于0.5%、低于0.4%、低于0.3%、低于0.2%、低于0.1%、低于0.09%、低于0.08%、低于0.07%、低于0.06%、低于0.05%、低于0.04%、低于0.03%、低于0.02%或低于0.01%的插入缺失形成。在一些实施方案中,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑器系统导致在靶标多核苷酸序列中低于0.8%的插入缺失形成。在一些实施方案中,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑器系统导致在靶标多核苷酸序列中至多0.8%的插入缺失形成。在一些实施方案中,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑器系统导致在靶标多核苷酸序列中低于0.3%的插入缺失形成。在一些实施方案中,与包含一种abe7碱基编辑器的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑器系统导致在靶标多核苷酸序列中更低的插入缺失形成。在一些实施方案中,与包含abe7.10的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑器系统导致在靶标多核苷酸序列中更低的插入缺失形成。[1612]在一些实施方案中,与包含一种abe7碱基编辑器的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑器系统具有降低的插入缺失频率。在一些实施方案中,与包含一种abe7碱基编辑器的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑器系统具有降低至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的插入缺失频率。在一些实施方案中,与包含abe7.10的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的碱基编辑器系统具有降低至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的插入缺失频率。[1613]本发明提供腺苷脱氨酶变体(例如,abe8变体),其具有增加的效率和特异性。特别地,本文所述的腺苷脱氨酶变体更有可能编辑多核苷酸内的所希望的碱基,并且更不可能编辑不预期改变的碱基(例如,“旁观者”)。[1614]在一些实施方案中,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑系统具有减少的旁观者编辑或突变。在一些实施方案中,非预期编辑或突变是旁观者突变或旁观者编辑,例如,对靶标核苷酸序列的靶标窗中的非预期或非靶标位置中靶标碱基(例如,a或c)的碱基编辑。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑系统具有减少的旁观者编辑或突变。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑系统的旁观者编辑或突变减少至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑系统的旁观者编辑或突变减少至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3.0倍。[1615]在一些实施方案中,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑系统具有减少的假编辑。在一些实施方案中,非预期编辑或突变是假突变或假编辑,例如,对基因组的非预期或非靶标区域中的靶标碱基(例如,a或c)的非特异性编辑或不依赖于向导的编辑。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑系统具有减少的假编辑。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑系统的假编辑减少至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑系统的假编辑减少至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3.0倍。[1616]本公开的一些方面是基于以下认知的:本文提供的任何碱基编辑器都能够有效地在核酸(例如,受试者基因组中的核酸)中产生预期突变诸如点突变,而不产生显著数量的非预期突变,诸如非预期点突变(即,旁观者的突变)。在一些实施方案中,本文提供的任何碱基编辑器都能够产生至少0.01%的预期突变(即,至少0.01%的碱基编辑效率)。在一些实施方案中,本文提供的任何碱基编辑器都能够产生至少0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%或99%的预期突变。[1617]在一些实施方案中,本文所述的任何abe8碱基编辑器变体具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的碱基编辑效率。在一些实施方案中,可以通过计算细胞群中被编辑的核碱基的百分比来测量碱基编辑效率。在一些实施方案中,如通过细胞群中被编辑的核碱基所测量的,本文所述的任何abe8碱基编辑器变体具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的碱基编辑效率。[1618]在一些实施方案中,本文所述的任何abe8碱基编辑器变体具有比abe7碱基编辑器高的碱基编辑效率。在一些实施方案中,与abe7碱基编辑器例如abe7.10相比,本文所述的任何abe8碱基编辑器具有高出至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%的碱基编辑效率。[1619]在一些实施方案中,与abe7碱基编辑器例如abe7.10相比,本文所述的任何abe8碱基编辑器具有高出至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍或至少5.0倍的碱基编辑效率。[1620]在一些实施方案中,本文所述的任何abe8碱基编辑器变体具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的上靶碱基编辑效率。在一些实施方案中,如通过细胞群中被编辑的靶标核碱基所测量的,本文所述的任何abe8碱基编辑器变体具有至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的上靶碱基编辑效率。[1621]在一些实施方案中,本文所述的任何abe8碱基编辑器变体具有比abe7碱基编辑器高的上靶碱基编辑效率。在一些实施方案中,与abe7碱基编辑器例如abe7.10相比,本文所述的任何abe8碱基编辑器具有高出至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%的上靶碱基编辑效率。[1622]在一些实施方案中,与abe7碱基编辑器例如abe7.10相比,本文所述的任何abe8碱基编辑器具有高出至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍或至少5.0倍的上靶碱基编辑效率。[1623]可以经由质粒、载体、lnp复合物或mrna将本文所述的abe8碱基编辑器变体递送至宿主细胞。在一些实施方案中,将本文所述的任何abe8碱基编辑器变体作为mrna递送至宿主细胞。在一些实施方案中,如通过被编辑的核碱基测量的,经由基于核酸的递送系统(例如,mrna)递送的abe8碱基编辑器具有至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的上靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送的abe8碱基编辑器相比,通过mrna系统递送的abe8碱基编辑器具有更高的碱基编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体在通过mrna系统递送时具有高出至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%的上靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体在通过mrna系统递送时具有高出至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍或至少5.0倍的上靶编辑效率。[1624]在一些实施方案中,包含本文所述的一种abe8碱基编辑器变体的任何碱基编辑器系统导致在靶标多核苷酸序列中低于50%、低于40%、低于30%、低于20%、低于19%、低于18%、低于17%、低于16%、低于15%、低于14%、低于13%、低于12%、低于11%、低于10%、低于9%、低于8%、低于7%、低于6%、低于5%、低于4%、低于3%、低于2%、低于1%、低于0.9%、低于0.8%、低于0.7%、低于0.6%、低于0.5%、低于0.4%、低于0.3%、低于0.2%、低于0.1%、低于0.09%、低于0.08%、低于0.07%、低于0.06%、低于0.05%、低于0.04%、低于0.03%、低于0.02%或低于0.01%的脱靶编辑。[1625]在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体在通过mrna系统递送时具有较低的引导脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体在通过mrna系统递送时具有低出至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的引导脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体在通过mrna系统递送时具有低出至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3.0倍的引导脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体在通过mrna系统递送时具有降低至少约2.2倍的引导脱靶编辑效率。[1626]在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体在通过mrna系统递送时具有较低的不依赖于向导的脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体在通过mrna系统递送时具有低出至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的不依赖于向导的脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体在通过mrna系统递送时具有低出至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少5.0倍、至少10.0倍、至少20.0倍、至少50.0倍、至少70.0倍、至少100.0倍、至少120.0倍、至少130.0倍或至少150.0倍的不依赖于向导的脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的abe8碱基编辑器变体在通过mrna系统递送时具有降低134.0倍的不依赖于向导的脱靶编辑效率(例如,假rna脱氨基)。在一些实施方案中,本文所述的abe8碱基编辑器变体不增加不依赖于向导的跨基因组突变率。[1627]在一些实施方案中,本文提供的碱基编辑器能够产生大于:1的预期突变与插入缺失的比率。在一些实施方案中,本文提供的碱基编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少200:1、至少300:1、至少400:1、至少500:1、至少600:1、至少700:1、至少800:1、至少900:1、或至少1000:1或更高的预期突变与插入缺失的比率。[1628]可以使用任何合适的方法测定预期突变和插入缺失的数目,例如,如国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632);komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);以及komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)中所述,其整体内容通过引用并入本文。[1629]在一些实施方案中,为了计算插入缺失频率,对测序读取进行扫描,以获得与位于插入缺失可能发生的视窗两侧的两个10-bp序列的精确匹配。如果没有定位到精确匹配,则将该读取从分析中排除。如果这一插入缺失窗的长度与参考序列确切匹配,则将该读取归类为不含插入缺失。如果插入缺失窗比参考序列长或短两个或更多个碱基,则将该测序读取分别归类为插入或缺失。在一些实施方案中,本文提供的碱基编辑器可以限制插入缺失在核酸区域中的形成。在一些实施方案中,该区域位于碱基编辑器所靶向的核苷酸处,或者是位于碱基编辑器所靶向的核苷酸相距2、3、4、5、6、7、8、9或10个核苷酸内的区域。[1630]在靶标核苷酸区域处形成的插入缺失的数目可能取决于核酸(例如,细胞基因组内的核酸)被暴露于碱基编辑器的时间量。在一些实施方案中,在将靶标核苷酸序列(例如,细胞基因组内的核酸)暴露于碱基编辑器至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天之后,测定插入缺失的数目或比例。应知悉,本文所述的碱基编辑器的特征可以应用于本文提供的任何融合蛋白或使用该融合蛋白的方法。[1631]在一些实施方案中,本文提供的碱基编辑器能够限制插入缺失在核酸区域中的形成。在一些实施方案中,该区域位于碱基编辑器所靶向的核苷酸处,或者是位于碱基编辑器所靶向的核苷酸相距2、3、4、5、6、7、8、9或10个核苷酸内的区域。在一些实施方案中,本文提供的任何碱基编辑器能够将核酸区域处的插入缺失的形成限制为低于1%、低于1.5%、低于2%、低于2.5%、低于3%、低于3.5%、低于4%、低于4.5%、低于5%、低于6%、低于7%、低于8%、低于9%、低于10%、低于12%、低于15%或低于20%。在核苷酸区域处形成的插入缺失的数目可能取决于核酸(例如,细胞基因组内的核酸)被暴露于碱基编辑器的时间量。在一些实施方案中,在将核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天之后,测定插入缺失的任何数目或比例。[1632]本公开的一些方面是基于以下认知的:本文提供的任何碱基编辑器都能够有效地在核酸(例如,受试者基因组中的核酸)中产生预期突变,而不产生显著数量的非预期突变(例如,假脱靶编辑或旁观者编辑)。在一些实施方案中,预期突变是由结合至grna的特异性碱基编辑器产生的,该碱基编辑器被特异性地设计为改变或校正靶标基因中的突变。在一些实施方案中,预期突变是由结合至grna的特异性碱基编辑器产生的,该碱基编辑器被特异性地设计为改变或校正hbg突变。[1633]在一些实施方案中,本文提供的碱基编辑器能够产生大于:1的预期突变与非预期突变的比率(例如,预期突变:非预期突变)。在一些实施方案中,本文提供的碱基编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1、或至少1000:1或更高的预期突变与非预期突变的比率。应知悉,本文所述的碱基编辑器的特征可以应用于本文提供的任何融合蛋白或使用该融合蛋白的方法。[1634]多元编辑[1635]在一些实施方案中,本文所提供的碱基编辑器系统能够对一个或多个基因中的多个核碱基对进行多元编辑。在一些实施方案中,多个核碱基对定位在同一基因中。在一些实施方案中,多个核碱基对定位在一个或多个基因中,其中至少一个基因定位在不同的基因座中。在一些实施方案中,多元编辑可以包含一个或多个向导多核苷酸。在一些实施方案中,多元编辑可以包含一个或多个碱基编辑器系统。在一些实施方案中,多元编辑可以包含一个或多个碱基编辑器系统和单向导多核苷酸。在一些实施方案中,多元编辑可以包含一个或多个碱基编辑器系统和多个向导多核苷酸。在一些实施方案中,多元编辑可以包含一个或多个向导多核苷酸和单个碱基编辑器系统。在一些实施方案中,多元编辑可以包含至少一个向导多核苷酸,该向导多核苷酸不需要pam序列来靶向结合至靶标多核苷酸序列。在一些实施方案中,多元编辑可以包含至少一个向导多核苷酸,该向导多核苷酸需要pam序列来靶向结合至靶标多核苷酸序列。在一些实施方案中,多元编辑可以包含至少一个不需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸与至少一个需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸的混合物。应知悉,使用本文所述任何碱基编辑器的多元编辑的特征可以应用至使用本文所提供的任何碱基编辑器的方法的组合。也应知悉,使用本文所述任何碱基编辑器的多元编辑可以包含多个核碱基对的依序编辑。[1636]本文所提供的方法包括以下步骤:(a)将受试者的多核苷酸的靶标核苷酸序列(例如,双链dna序列)与包含核碱基编辑器(例如,腺苷碱基编辑器,例如,abe8碱基编辑器,或者胞苷碱基编辑器)和单向导多核苷酸(例如,grna)的碱基编辑器系统接触,其中靶标核苷酸序列包含所靶向的核碱基对;(b)诱导包含靶标核苷酸序列的靶标区域的链分离;(c)将靶标区域的单链中的靶标核碱基对的第一核碱基编辑为第二核碱基;以及,(d)切割靶标区域的不超过一条链,其中与第一核碱基互补的第三核碱基被替换为与第二核碱基互补的第四核碱基。[1637]在一些实施方案中,多个核碱基对位于一个或多个基因中。在一些实施方案中,多个核碱基对位于同一基因中。在一些实施方案中,一个或多个基因中的至少一个基因定位在不同基因座中。[1638]在一些实施方案中,该编辑是编辑至少一个蛋白质编码区域内的多个核碱基。在一些实施方案中,该编辑是编辑至少一个蛋白质非编码区域内的多个核碱基。在一些实施方案中,该编辑是编辑至少一个蛋白质编码区域和至少一个蛋白质非编码区域内的多个核碱基。[1639]在一些实施方案中,该编辑与一个或多个向导多核苷酸协同作用。在一些实施方案中,碱基编辑器系统可以包含一个或多个碱基编辑器系统。在一些实施方案中,碱基编辑器系统可以包含一个或多个与单向导多核苷酸协同作用的碱基编辑器系统。在一些实施方案中,碱基编辑器系统可以包含一个或多个与多个向导多核苷酸协同作用的碱基编辑器系统。在一些实施方案中,该编辑与一个或多个向导多核苷酸和单个碱基编辑器系统协同作用。在一些实施方案中,该编辑与至少一个向导多核苷酸协同作用,该向导多核苷酸不需要pam序列来靶向结合至靶标多核苷酸序列。在一些实施方案中,该编辑与至少一个向导多核苷酸协同作用,该向导多核苷酸需要pam序列来靶向结合至靶标多核苷酸序列。在一些实施方案中,该编辑与至少一个不需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸与至少一个需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸的混合物协同作用。应知悉,使用本文所述任何碱基编辑器的多元编辑的特征可以应用至使用本文所提供的任何碱基编辑器的方法的组合。也应知悉,该编辑可以包含多个核碱基对的依序编辑。[1640]在一些实施方案中,本文的能够对一个或多个基因中的多个核碱基对进行多元编辑的碱基编辑器系统包含本文所述的abe8碱基编辑器变体之一。在一些实施方案中,本文的能够对一个或多个基因中的多个核碱基对进行多元编辑的碱基编辑器系统包含abe7碱基编辑器之一。在一些实施方案中,与包含abe7碱基编辑器之一的能够进行多元编辑碱基编辑器系统相比,包含本文所述的abe8碱基编辑器变体之一的能够进行多元编辑的碱基编辑器系统具有更高的多元编辑效率。在一些实施方案中,包含本文所述的abe8碱基编辑器变体之一的能够进行多元编辑的碱基编辑器系统的多元编辑效率比包含abe7碱基编辑器之一的能够进行多元编辑碱基编辑器系统高至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%,atleast300%higher、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%或至少500%。在一些实施方案中,包含本文所述的abe8碱基编辑器变体之一的能够进行多元编辑的碱基编辑器系统的多元编辑效率比包含abe7碱基编辑器之一的能够进行多元编辑碱基编辑器系统高至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少4.0倍、至少4.5倍、至少5.0倍、至少5.5倍或至少6.0倍。[1641]用于编辑核酸的方法[1642]本公开的一些方面提供用于编辑核酸的方法。在一些实施方案中,该方法是用于编辑编码蛋白质的核酸分子的核碱基(例如,双链dna序列的碱基对)的方法。在一些实施方案中,该方法包括以下步骤:a)使核酸(例如,双链dna序列)的靶标区域与包含碱基编辑器(例如,与腺苷脱氨酶融合的cas9结构域)和向导核酸(例如,grna)的复合物接触,b)诱导所述靶标区域的链分离,c)将靶标区域的单链中的所述靶标核碱基对的第一核碱基转化为第二核碱基,以及,d)使用ncas9切割所述靶标区域的不超过一条链,其中与第一核碱基互补的核碱基被替换为与第二核碱基互补的第四核碱基。在一些实施方案中,该方法导致核酸中形成少于20%的插入缺失。应知悉,在一些实施方案中,省略了步骤b。在一些实施方案中,该方法导致形成了少于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或少于0.1%的插入缺失。在一些实施方案中,该方法进一步包括用与第四核碱基互补的第五核碱基替换第二核碱基,从而产生预期的被编辑的碱基对(例如,g·c到a·t)。在一些实施方案中,至少5%的预期碱基对被编辑。在一些实施方案中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对被编辑。[1643]在一些实施方案中,靶标核苷酸中的预期产物与非预期产物的比率为至少:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、或200:1或更高。在一些实施方案汇总,预期突变与插入缺失形成的比率大于1:1、10:1、50:1、100:1、500:1、或1000:1或更高。在一些实施方案中,被切割的单链(被切口的链)与向导核酸杂交。在一些实施方案中,被切割的单链与包含第一核碱基的链相对。在一些实施方案中,碱基编辑器包含dcas9结构域。在一些实施方案中,碱基编辑器保护或结合未经编辑的链。在一些实施方案中,预期的被编辑碱基对位于pam位点的上游。在一些实施方案中,预期的被编辑碱基对位于pam位点的上游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸处。在一些实施方案中,预期的被编辑碱基对位于pam位点的下游。在一些实施方案中,预期的被编辑碱基对位于pam位点的下游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸处。在一些实施方案中,该方法不需要经典(例如,ngg)pam位点。在一些实施方案中,核碱基编辑器包含连接子。在一些实施方案中,连接子为1-25个氨基酸的长度。在一些实施方案中,连接子为5-20个氨基酸的长度。在一些实施方案中,连接子为10、11、12、13、14、15、16、17、18、19或20个氨基酸的长度。在一种实施方案中,连接子为32个氨基酸的长度。在另一实施方案中,“长连接子”为至少60个氨基酸的长度。在其他实施方案中,连接子为介于约3-100个氨基酸之间的长度。在一些实施方案中,靶标区域包含靶标窗,其中靶标窗包含靶标核碱基对。在一些实施方案中,靶标窗包含1-10个核苷酸。在一些实施方案中,靶标窗为1-9、1-8、1-7、1-6、1-5、1-4、1-3、1-2或1个核苷酸的长度。在一些实施方案中,靶标窗为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的长度。在一些实施方案中,预期的被编辑碱基对位于靶标窗内。在一些实施方案中,靶标窗包含预期的被编辑碱基对。在一些实施方案中,使用本文所提供的任何碱基编辑器执行该方法。在一些实施方案中,靶标窗是甲基化窗。[1644]在一些实施方案中,本公开提供用于编辑核苷酸(例如,编码蛋白质的基因中的snp)的方法。在一些实施方案中,本公开提供用于编辑双链dna序列的核碱基对。在一些实施方案中,该方法包括:a)使双链dna序列的靶标区域与包含碱基编辑器和向导核酸(例如,grna)的复合物接触,其中该靶标区域包含靶标核碱基对,b)诱导所述靶标区域的链分离,c)将靶标区域的单链中的所述靶标核碱基对的第一核碱基转化为第二核碱基,d)切割所述靶标区域的不超过一条链,其中与第一核碱基互补的第三核碱基被替换为与第二核碱基互补的第四核碱基,并且第二核碱基被替换为与第四核碱基互补的底物核碱基,从而产生预期的被编辑碱基对,其中产生预期的被编辑碱基对的效率为至少5%。应知悉,在一些实施方案中,省略了步骤b。在一些实施方案中,至少5%的预期碱基对被编辑。在一些实施方案中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对被编辑。在一些实施方案中,该方法造成形成了少于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或少于0.1%的插入缺失。在一些实施方案中,靶标核苷酸处的预期产物与非预期产物的比率为至少:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、或200:1或更高。在一些实施方案汇总,预期突变与插入缺失形成的比率大于1:1、10:1、50:1、100:1、500:1、或1000:1或更高。在一些实施方案中,被切割的单链与向导核酸杂交。在一些实施方案中,被切割的单链与包含第一核碱基的链相对。在一些实施方案中,预期的被编辑碱基对位于pam位点的上游。在一些实施方案中,预期的被编辑碱基对位于pam位点的上游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸处。在一些实施方案中,预期的被编辑碱基对位于pam位点的下游。在一些实施方案中,预期的被编辑碱基对位于pam位点的下游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸处。在一些实施方案中,该方法不需要经典(例如,ngg)pam位点。在一些实施方案中,连接子为1-25个氨基酸的长度。在一些实施方案中,连接子为5-20个氨基酸的长度。在一些实施方案中,连接子为10、11、12、13、14、15、16、17、18、19或20个氨基酸的长度。在一些实施方案中,靶标区域包含靶标窗,其中靶标窗包含靶标核碱基对。在一些实施方案中,靶标窗包含1-10个核苷酸。在一些实施方案中,靶标窗为1-9、1-8、1-7、1-6、1-5、1-4、1-3、1-2或1个核苷酸的长度。在一些实施方案中,靶标窗为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的长度。在一些实施方案中,预期的被编辑碱基对出现在靶标窗内。在一些实施方案中,靶标窗包含预期的被编辑碱基对。在一些实施方案中,核碱基编辑器是本文所提供的任何碱基编辑器。[1645]融合蛋白在宿主细胞内的表达[1646]本发明的包含腺苷脱氨酶变体的融合蛋白可以使用技术人员已知的常规方法在包括但不限于,细菌、酵母、真菌、昆虫、植物和动物细胞在内的几乎任何感兴趣的宿主细胞内表达。例如,编码本发明的腺苷脱氨酶的dna可以通过基于cdna序列为cds的上游或下游设计合适的引物而被克隆。可以将克隆的dna直接地、或在当需要时用限制酶消化后、或在添加合适的连接子和/或核定位元信号之后,用编码碱基编辑系统的一个或多个额外组分的dna连接。碱基编辑系统在宿主细胞中被翻译以形成复合物。[1647]通过将编码一个或多个具有核碱基修饰活性的多核苷酸(例如,脱氨酶结构域)可操作地连接至编码napdnabp的多核苷酸来产生融合蛋白,以制备编码本发明的融合蛋白的多核苷酸。在一些实施方案中,编码napdnabp的多核苷酸以及编码具有核酸酶修饰活性的结构域的dna可以各自与编码结合结构域或其结合伙伴的dna融合,或两种dna可以与编码分离内含肽的dna融合,借此,核酸序列识别转化模组和核酸碱基转化酶在宿主细胞中被翻译以形成复合物。在这些情况下,当需要时,连接子和/或核定位元信号可以连接至一个或两个dna的合适位置。[1648]编码本文所述的蛋白结构域的dna可以通过化学合成该dna而获得,或通过利用pcr方法和gibson组装方法来联接合成的部分重迭oligodna短链而获得,以构建编码其全长度的dna。通过化学合成或pcr方法或gibson组装方法来构建全长度dna的优势在于,可以根据该dna所引入至其中的宿主而以cds全长度设计待使用的密码子。在异源dna的表达中,预计蛋白质表达水准通过将其dna序列转化为以高频率用于宿主生物体中的码码字而得以增加。作为密码子在待用宿主中的使用频率的资料,例如,可使用kazusadna研究所主页中公开的遗传密码使用频率资料库(http://www.kazusa.or.jp/codon/index.html),或者可以指显示密码子在每种宿主中使用频率的文献。参照所获得的资料和待引入的dna序列,可以将在用于dna序列的密码子中显示在该宿主中的低使用频率的密码子转化为编码相同氨基酸但显示高使用频率的密码子。[1649]例如,可以通过在合适的表达载体中将dna连接至启动子的下游,产生含有编码核酸序列识别模组和/或核酸碱基转化酶的表达载体。[1650]作为表达载体,使用了源自大肠杆菌的质粒(例如,pbr322、pbr325、puc12、puc13);源自枯草芽孢杆菌的质粒(例如,pub110、ptp5、pc194);源自酵母的质粒(例如,psh19、psh15);昆虫细胞表达质粒(例如,pfast-bac);动物细胞表达质粒(例如,pa1-11、pxt1、prc/cmv、prc/rsv、pcdnai/neo);细菌噬菌体,诸如λ噬菌体等;昆虫病毒载体,诸如杆状病毒等(例如,bmnpv、acnpv);动物病毒载体,诸如逆转录病毒、牛痘病毒、腺病毒等;等等。[1651]作为启动子,可以使用任何适用于待用于基因表达的宿主的任何启动子。在使用dsb的传统方法中,由于宿主细胞的存活率有时由于毒性而显著下降,希望通过使用诱导型启动子来启动诱导而增加细胞的数目。但是,由于也可以通过表达本发明的核酸修饰酶复合物而获得足够的细胞增殖,因此也可以无限制地使用构造型启动子。[1652]例如,当宿主为动物细胞时,使用了srα启动子、sv40启动子、ltr启动子、cmv(巨细胞病毒)启动子、rsv(鲁斯氏肉瘤病毒)启动子、momulv(莫洛尼鼠白血病病毒)ltr、hsv-tk(单纯疱疹病毒胸苷激酶)启动子等。其中,cmv启动子、srα启动子等为优选。当宿主为大肠杆菌时,trp启动子、lac启动子、reca启动子、λpl启动子、lpp启动子、t7启动子等为优选。当宿主为芽孢杆菌属时,spo1启动子、spo2启动子、penp启动子等为优选。当宿主为酵母时,gal1/10启动子、pho5启动子、pgk启动子、gap启动子、adh启动子等为优选。当宿主为昆虫细胞时,多角体蛋白启动子、p10启动子等为优选。当宿主为植物细胞时,camv35s启动子、camv19s启动子、nos启动子等为优选。[1653]在一些实施方案中,表达载体可以根据需要而含有增强子、剪接信号、终止子、polya加入信号、选择标记物(诸如耐药基因、营养缺陷型互补基因等)、复制起点等。[1654]编码本文所述蛋白结构域的rna可以通过下述制备,例如,使用编码dna(该dna编码上述核酸序列识别模组和/或核碱基转化酶)的载体作为范本,在本身已知的体外转录系统)中转录为mrna。[1655]通过将含有编码核酸识别模组和/或核酸碱基转化酶的表达载体引入宿主细胞中,并且培养该宿主细胞,可以细胞内地表达本发明的融合蛋白。[1656]可用于本发明中的宿主细胞包括细菌细胞、酵母、昆虫细胞、动物细胞等。[1657]埃希氏杆菌属包括大肠杆菌k12.cndot.dh1(proc.natl.acad.sci.usa,60,160(1968))、大肠杆菌jm103(nucleicacidsresearch,9,309(1981))、大肠杆菌ja221(journalofmolecularbiology,120,517(1978))、大肠杆菌hb101(journalofmolecularbiology,41,459(1969))、大肠杆菌c600(genetics,39,440(1954))等。[1658]芽孢杆菌属包括枯草芽孢杆菌m1114(gene,24,255(1983))、枯草芽孢杆菌207-21(journalofbiochemistry,95,87(1984))等。[1659]可用于表达本发明的融合蛋白的酵母包括酿酒酵母ah22、ah22r.sup.-、na87-11a、dkd-5d、20b-12;粟酒裂殖酵母ncyc1913、ncyc2036;毕赤酵母km71等。[1660]例如,使用病毒载体诸如acnpv在昆虫细胞中表达融合蛋白。昆虫宿主细胞包括下列任何细胞系:卷心菜粘虫幼虫衍生的建立系(草地贪夜蛾(spodopterafrugiperda)细胞;sf细胞)、衍生自粉纹夜蛾(trichoplusiani)中肠的mg1细胞、衍生自粉纹夜蛾卵的highfive.tm.细胞、衍生自甘蓝夜蛾(mamestrabrassicae)的细胞、衍生自甲虫(estigmenaacrea)的细胞等。当病毒为bmnpv时,使用家蚕(bombyxmori)衍生的建立系细胞(家蚕n细胞;bmn细胞)等作为昆虫细胞。作为sf细胞,例如,使用了sf9细胞(atcccrl1711)、sf21细胞(上述全部,invivo,13,213-217(1977))等。[1661]作为昆虫,例如,使用家蚕幼虫、果蝇(drosophila)、蟋蟀等来表达本发明的融合蛋白(nature,315,592(1985))。[1662]可以使用哺乳动物细胞系来表达融合蛋白。此类细胞系包括猴cos-7细胞、猴vero细胞、中国仓鼠卵巢(cho)细胞、dhfr基因缺陷cho细胞、小鼠l细胞、小鼠att-20细胞、小鼠骨髓瘤细胞、大鼠gh3细胞、人fl细胞等,多能干细胞诸如人或其他哺乳动物的ips细胞、es细胞等,以及从各种组织制备的原代培养细胞。此外,也可以使用斑马鱼胚胎、爪蟾(xenopus)卵细胞等。[1663]可以使用技术人员周知的方法将植物细胞维持在培养中。植物细胞培养包括悬浮从各种植物(例如,稻、小麦、玉米等谷物,番茄、黄瓜、茄子、康乃馨、桔梗(eustomarussellianum)、烟草、拟南芥(arabidopsisthaliana)等产品作物)制备的培养细胞、愈伤组织、原生质体、叶段、根段等。[1664]上述宿主细胞全部可以是单倍体(一倍体)或多倍体(例如,二倍体、三倍体、四倍体等)。在传统突变引入方法中,原则上仅将突变引入一个同源染色体中以产生异质基因类型。因此,除非出现显性突变,否则不会表达所希望的表型,并且纯合性不方便地耗时耗力。相比之下,根据本发明,由于可以将突变引入基因组中同源染色体上的任何等位基因中,即便在隐性突变的情况下也可以在一代中表达所希望的表型,这由于可以解决传统方法的问题而极其有用。[1665]使用任何转染方法(例如,溶菌酶法、感应法(competentmethod)、peg法、cacl2共沉淀法、电穿孔法、显微注射法、粒子枪法、脂质转染法、农杆菌法)将编码本发明的融合蛋白的表达载体引入宿主细胞内。基于待转染的宿主细胞选择转染方法。[1666]可以根据例如proc.natl.acad.sci.usa,69,2110(1972),gene,17,107(1982)等中描述的方法转化大肠杆菌。[1667]可以根据例如molecular&generalgenetics,168,111(1979)等中描述的方法将芽孢杆菌属引入载体中。[1668]可以根据例如methodsinenzymology,194,182-187(1991),proc.natl.acad.sci.usa,75,1929(1978)等中描述的方法将酵母细胞引入载体中。[1669]可以根据例如bio/technology,6,47-55(1988)等中描述的方法将昆虫细胞引入载体中。[1670]可以根据例如cellengineeringadditionalvolume8,newcellengineeringexperimentprotocol,263-267(1995)(秀润社(shujunsha)出版)和virology,52,456(1973)中描述的方法将哺乳动物细胞引入载体中。[1671]根据已知方法培养表达本发明载体的细胞,方法依据宿主而变。[1672]例如,当培养大肠杆菌或芽孢杆菌属时,优选液体培养基作为待用于培养的培养基。培养基优选含有转化株生长所必需的碳源、氮源、无机物质等。碳源的示例包括葡萄糖、糊精、可溶淀粉、蔗糖等;氮源的示例包括无机或有机物质,诸如铵盐、硝酸盐、玉米浆、蛋白胨、酪蛋白、肉膏、豆粕、马铃薯提取物等;并且无机物质的示例包括氯化钙、磷酸二氢钠、氯化镁等。培养基可以含有酵母提取物、微生物、生长促进因数等。培养基的ph优选为约5至约8。[1673]作为用于培养大肠杆菌的培养基,例如,优选为含有葡萄糖、酪蛋白氨基酸的m9培养基(journalofexperimentsinmoleculargenetics,431-433,coldspringharborlaboratory,newyork1972)。若必要,例如,可以将诸如3β-吲哚基丙烯酸的试剂添加到培养基中以确保启动子的有效功能。大肠杆菌通常在约15℃至约43℃培养。若必要,可以执行曝气和搅拌。[1674]芽孢杆菌属通常在约30℃至约40℃培养。若必要,可以执行曝气和搅拌。[1675]用于培养酵母的培养基的示例包括burkholder基础培养基(proc.natl.acad.sci.usa,77,4505(1980))、含有0.5%酪蛋白氨基酸的sd培养基(proc.natl.acad.sci.usa,81,5330(1984))等。培养基的ph优选为约5至约8。培养通常在约20℃至约35℃执行。若必要,可以执行曝气和搅拌。[1676]作为用于培养昆虫细胞或昆虫的培养基,例如,使用了适宜地含有诸如灭活的10%牛血清等添加剂的grace昆虫培养基(nature,195,788(1962))等。培养基的ph优选为约6.2至约6.4。培养通常在约27℃执行。若必要,可以执行曝气和搅拌。[1677]作为用于培养动物细胞的培养基,使用了含有约5%至约20%胎牛血清的最小必需培养基(mem)(science,122,501(1952))、杜尔贝科改进伊格尔培养基(dmem)(virology,8,396(1959))、rpmi1640培养基(thejournaloftheamericanmedicalassociation,199,519(1967))、199培养基(proceedingofthesocietyforthebiologicalmedicine,73,1(1950))等。培养基的ph优选为约6至约8。培养通常在约30℃至约40℃执行。若必要,可以执行曝气和搅拌。[1678]作为用于培养植物细胞的培养基,例如,使用了ms培养基、ls培养基、b5培养基等。培养基的ph优选为约5至约8。培养通常在约20℃至约30℃执行。若必要,可以执行曝气和搅拌。[1679]当使用诸如动物细胞、昆虫细胞、植物细胞等高等真核细胞作为宿主细胞时,在诱导型启动子(例如,金属硫蛋白启动子(通过重金属离子诱导)、热休克蛋白启动子(通过热休克诱导)、tet-on/tet-off系统启动子(通过添加或移除四环素或其衍生物诱导)、类固醇回应型启动子(通过类固醇激素或其衍生物诱导)等)的调节下将编码本发明的点击编辑系统(例如,包含腺苷脱氨酶变体)的dna引入宿主细胞内,在适宜的阶段将诱导物质添加到培养基中(或自培养基中移除)以诱导核酸修饰酶复合物的表达,执行给定时间段的培养以完成碱基编辑并且将突变引入引入靶标基因中,可以实现碱基编辑系统的暂态表达。[1680]原核细胞诸如大肠杆菌等可以利用诱导型启动子。诱导型启动子的示例包括但不限于,lac启动子(通过iptg诱导)、cspa启动子(通过冷休克诱导)、arabad启动子(通过阿拉伯糖诱导)等。[1681]作为另一种选择,当使用诸如动物细胞、昆虫细胞、植物细胞等高等真核细胞作为宿主细胞时,也可利用上述诱导型启动子作为载体移除机制。换言之,载体封固有在宿主细胞中发挥作用的复制起点和编码复制所必需的蛋白质的核酸(例如,对于动物细胞,sv40和大t抗原、orip和ebna-1等),并且通过上述诱导型启动子调节编码该蛋白质的核酸的表达。因此,尽管载体在存在诱导物质的情况下可以自主复制,但当诱导物质被移除时无法进行自主复制,并且载体随着细胞分裂自然地脱落(不可能通过将四环素和强力霉素添加到tet-off系统载体中实现自主复制)。[1682]递送系统[1683]核碱基编辑器和grna的基于核酸的递送[1684]编码苯基本发明的碱基编辑系统的核酸可以通过本领域已知方法或如本文所述给药至受试者或者在体外或体内递送至细胞内。在一种实施方案中,可以通过例如载体(例如,病毒或非病毒载体)、不基于载体的方法(例如,使用裸dna、dna复合物、mrna、脂质纳米粒子)或其组合来递送核碱基编辑器。[1685]编码核碱基编辑器的核酸可以作为裸dna或rna(例如,mrna)例如通过转染或电穿孔被直接递送至细胞(例如,造血细胞和/或诱导多能干细胞),或者可以被偶联至促进被靶标细胞摄取的分子(例如,n-乙酰基半乳糖胺)。可以使用核酸载体,诸如本文所述的载体。[1686]核酸载体可以包含一种或多种编码本文所述融合蛋白的结构域的序列。载体也可以包含与编码蛋白质的序列缔合(例如,插入该序列内或融合至该序列)的编码信号肽(例如,用于核定位、核仁定位或线粒体定位的信号肽)的序列。作为一个示例,核酸载体可以包括包含一个或多个核定位序列(例如,来自sv40的核定位序列)的cas9编码序列,以及腺苷脱氨酶变体(例如,abe8)。[1687]核酸载体也可以包括任何合适数量的调节/控制元件,例如,启动子、增强子、内含子、多腺苷酸化信号、kozak共有序列或内部核糖体进入位点(ires)。这些元件是本领域中周知的。对于造血细胞,合适的启动子可以包括ifnβ或cd45。[1688]根据本公开的核酸载体包括重组病毒载体。示例性病毒载体在本文中详述。也可使用本领域已知的其他病毒载体。此外,可以使用病毒粒子来递送核酸和/或肽形式的碱基编辑系统组分。例如,可以将“空”病毒粒子组装为含有任何合适的载荷。也可以将病毒载体或病毒粒子工程化以静茹靶向配体,从而改变靶标组织特异性。[1689]除了病毒载体之外,非病毒在于可用来递送编码根据本发明的基因组编辑系统的核酸。非病毒核酸载体的一个重要类别是纳米粒子,其可以是有机的或无机的。纳米粒子是本领域周知的。任何合适的纳米粒子设计可以用来递送基因组编辑系统组分或编码此类组分的核酸。例如,在本公开的某些实施方案中,有机(例如,脂质和/或聚合物)纳米粒子可能适合用作递送媒介。用于纳米粒子制剂和/或基因转移的示例性脂质显示在(下)表10中。[1690]表10[1691][1692]表11列出了用于基因转移和/或纳米粒子制剂的示例性聚合物。[1693]表11[1694][1695]表12总结了用于编码本发明的融合蛋白的多核苷酸的递送方法。[1696]表12[1697][1698][1699]在另一方面,基因组编辑系统组分或编码此类组分的核酸(例如,核酸结合蛋白诸如,举例而言,cas9或其变体)以及靶向感兴趣的基因组核酸序列的grna的递送,可以通过递送核糖核蛋白(rnp)至细胞而得以实现。rnp包含处于与靶向grna的复合物中的核酸结合蛋白,例如,cas9。可以使用已知方法将rnp递送至细胞,所述方法诸如电穿孔、核转染或阳离子脂质介导的方法,例如,如zuris,j.a.等人,2015,nat.biotechnology,33(1):73-80中报导的。就用于crispr碱基编辑系统而言,尤其是针对难以转染的细胞诸如原代细胞,rnp具有优势。此外,rnp也可以缓解在细胞内进行蛋白质表达时可能出现的困难,尤其是当不能良好地表达可能用于crispr质粒中的真核启动子(例如,cmv或ef1a)时。有利的是,rnp的使用并不需要将外来dna递送到细胞内。此外,因为包含核酸结合蛋白和grna复合物的rnp随着时间推移而降解,rnp的使用具有限制脱靶效应的潜力。以类似于基于质粒的技术所采用的方式,rnp可以用来递送结合蛋白(例如,cas9变体)并且引导同源诱导修复(hdr)。[1700]用来驱动编码核酸分子表达的碱基编辑器的启动子可以包括aavitr。这对于消除对于可能占据载体内空间的额外启动子元件的需求而言可能是有利的。释放的额外空间可以用来驱动额外元件诸如向导核酸或可选标记物的表达。itr活性相对较弱,因此它可以用来降低由于所选核酸酶的过度表达带来的潜在毒性。[1701]任何合适的启动子可以用来驱动碱基编辑器和(若适宜)向导核酸的表达。对于泛素化表达,可使用的启动子包括cmv、cag、cbh、pgk、sv40、铁蛋白重链或轻链等。对于脑或其他cns细胞表达,合适的启动子包括:用于全部神经元的突触蛋白i、用于兴奋性神经元的camkiiα、用于gaba神经元的gad67或gad65或vgat等。对于肝细胞表达,合适的启动子包括白蛋白启动子。对于非细胞表达,合适的启动子可以包括sp-b。对于内皮细胞,合适的启动子可以包括icam。对于造血细胞,合适的启动子可以包括ifnβ或cd45。对于成骨细胞,合适的启动子可以包括og-2。[1702]在一些实施方案中,本公开的碱基编辑器的尺寸足够小,以致于允许独立的启动子驱动碱基编辑器和同一核酸分子中的相容向导核酸的表达。例如,载体或病毒载体可以包含可操作地连接至编码碱基编辑器的核酸的第一启动子以及可操作地连接至向导核酸的第二启动子。[1703]用来驱动向导核酸的表达的启动子可以包括:poliii启动子,诸如u6或h1。polii启动子和内含子盒用来表达grna腺相关病毒(aav)。[1704]病毒载体[1705]本文所述的碱基编辑器因此可以使用病毒载体递送。在一些实施方案中,本文公开的碱基编辑器可以被编码在病毒载体中含有的核酸上。在一些实施方案中,碱基编辑器系统的一个或多个组分可以被编码在一种或多种病毒载体上。例如,碱基编辑器和向导核酸可以被编码在单个病毒载体上。在其他实施方案中,碱基编辑器和向导核酸被编码在不同的病毒载体上。在每种情况下,碱基编辑器和向导核酸可以各自可操作地连接至启动子和终止子。被编码在病毒载体上的组分的组合可以通过所选病毒载体的载荷尺寸约束条件确定。[1706]基于rna或dna病毒的系统的用于递送碱基编辑器的用途利用了高度进化的过程的优势,这些过程用于将病毒靶向至培养物中或宿主中的特定细胞以及将病毒有效载荷转运到细胞核或宿主细胞基因组。病毒载体可以直接给药至培养物中的细胞、患者(体内),或者它们可以用来在体外处理细胞,并且经修饰的细胞可以任选地被给药至患者(离体)。传统的基于病毒的系统可包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒。使用逆转录病毒、慢病毒和腺相关病毒基因转移方法整合到宿主基因组中是可能的,经常导致感兴趣的转基因的长期表达。此外,已经在很多不同的细胞类型和靶标组织中观察到了高转导效率。[1707]病毒载体可以包括慢病毒(例如,基于hiv和fiv的载体)、腺病毒(例如,ad100)、逆转录病毒(例如,莫洛尼鼠白血病病毒,mml-v)、疱疹病毒在听(例如,hsv-2)和腺相关病毒(aav),或者其他质粒或病毒载体类型,特别地,使用来自美国专利号8,454,972(关于腺病毒的制剂、剂量)、美国专利号8,404,658(关于aav的制剂、剂量)和美国专利号5,846,946(关于dna质粒的制剂、剂量)以及来自临床试验和关于牵涉慢病毒、aav和腺病毒的临床试验的出版物的制剂和剂量。例如,对于aav,给药途径、制剂和剂量可以如美国专利号8,454,972和牵涉aav的临床试验中所示。例如,对于腺病毒,给药途径、制剂和剂量可以如美国专利号8,404,658和牵涉腺病毒的临床试验中所示。例如,对于质粒递送,给药途径、制剂和剂量可以如美国专利号5,846,946和牵涉质粒的临床研究中所示。剂量可以基于或外推至平均体重为70kg的个体(例如,成年男性),并且可以针对患者、受试者、不同体重和物种的哺乳动物进行调节。给药频率处于医疗或兽医从业者(例如,医师、兽医)的能力范围内,取决于包括以下项的因素:患者或受试者的年龄、性别、一般健康情况、其他病症以及待解决的特定病症或症状。可以将病毒载体注射到感兴趣的组织内。对于细胞类型特异性的碱基编辑,碱基编辑器和任选的向导核酸的表达可以由细胞类型特异性启动子驱动。[1708]可以通过并入外来包膜蛋白改变逆转录病毒的向性,拓展靶标细胞的潜在靶标群。慢病毒载体是逆转录病毒载体,其能够转导或感染非分裂细胞并且通常产生高病毒滴度。逆转录病毒基因转移系统的选择将会因此取决于靶标组织。逆转录病毒载体由顺式作用长末端重复序列构成,其封装能力高达6-10kb的外来序列。最小顺式作用ltr对于载体的复制和封装而言是足够的,其随后被用来将治疗性基因整合到靶标细胞内,以提供永久性转基因表达。广泛使用的逆转录病毒载体包括那些基于以下的载体:鼠白血病病毒(mulv)、长臂猿白血病病毒(galv)、猿猴免疫缺陷病毒(siv)、人免疫缺陷病毒(hiv)及其组合(参见例如,buchscher等人,j.virol.66:2731-2739(1992);johann等人,j.virol.66:1635-1640(1992);sommnerfelt等人,virol.176:58-59(1990);wilson等人,j.virol.63:2374-2378(1989);miller等人,j.virol.65:2220-2224(1991);pct/us94/05700)。[1709]逆转录病毒载体,尤其是慢病毒载体,可能需要小于给定长度的多核苷酸序列,以有效地整合到靶标细胞中。例如,与尺寸较小的逆转录病毒载体相比,长度大于9kb的逆转录病毒载体可能导致低病毒滴度。在一些方面,本公开的碱基编辑器的尺寸是足够的,从而能够进行有效封装并经由逆转录病毒载体被递送到靶标细胞内。在一些实施方案中,即便当与向导核酸和/或可靶向的核酸酶系统的其他组分一起被表达时,碱基编辑器的尺寸也允许进行有效封装和递送。[1710]在优选暂态表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的系统能够在很多细胞类型中表现出非常高的转导效率并且不需要细胞分裂。使用此类载体,已经获得了高滴度和表达水准。这一载体可以在相对简单的系统中大量生产。腺相关病毒(“aav”)载体也可以用来使用靶标核酸转染细胞,例如在体外生产核酸和肽,以及进行体内和离体的基因治疗过程(参见例如,west等人,virology160:38-47(1987);美国专利号4,797,368;wo93/24641;kotin,humangenetherapy5:793-801(1994);muzyczka,j.clin.invest.94:1351(1994))。重组aav载体的构建在大量出版物中有所描述,包括美国专利号5,173,414;tratschin等人,mol.cell.biol.5:3251-3260(1985);tratschin等人,mol.cell.biol.4:2072-2081(1984);hermonat&muzyczka,pnas81:6466-6470(1984);和samulski等人,j.virol.63:03822-3828(1989)。[1711]aav是小的、单链dna依赖性病毒,属于细小病毒家族。4.7kb野生型(wt)aav基因组由分别编码四种复制蛋白和三种衣壳蛋白的两个基因组成,并且两侧各具有145-bp的末端反向重复序列(itr)。病毒体由三种衣壳蛋白(vp1、vp2和vp3)构成,以1:1:10的比率产生自同一个开读框但来自差异剪接位点(vp1)和替代性翻译起始位点(分别为vp2和vp3)。vp3是病毒体中丰度最高的亚基,并且参与细胞表面处的定义病毒向性的受体复制。已经在vp1的独特n端中鉴定了在病毒感染性中起作用的磷脂酶结构域。[1712]类似于wtaav,重组aav(raav)利用顺式作用145-bpitr与病毒转基因盒两侧相接,提供高达4.5kb进行外来dna的封装。感染会后,raav可以表达本发明的融合蛋白,并且通过附加基因地存在于环状头至尾串联体中而持续存在,不被整合到宿主基因组中。尽管存在使用这一系统的体外和体内raav成功的大量示例,但当基因编码序列的长度在尺寸上大于或等于wtaav基因组时,有限的封装能力已经限制了aav介导的基因递送的用途。[1713]可基于应用而选择病毒载体。例如,对于体内基因递送,aav可能比其他病毒载体有利。在一些实施方案中,aav导致低毒性,这可能是由于纯化方法不需要对细胞离子进行超离心,而超离心可能启动免疫应答。在一些实施方案中,因为aav不整合到宿主基因组中,所以导致造成插入性诱变的可能性较低。腺病毒因为其诱导强烈的免疫原性应答而常常用作疫苗。病毒载体的封装能力可能限制可以被封装到载体中的碱基编辑器的尺寸。[1714]aav的封装能力为约4.5kb或4.75kb,包括两个145各碱基的末端反向重复序列(itr)。这意味着所公开的碱基编辑器以及启动子和转录终止子可以装入单个病毒载体中。大于4.5或4.75kb的构建体可能导致显著减少的病毒产生。例如,spcas9很大,该基因本身超过4.1kb,这使得它难以封装到aav中。因此,本公开的实施方案包括利用所公开的长度比传统碱基编辑器短的碱基编辑器。在一些实施例中,碱基编辑器小于4kb。所公开的碱基编辑器可以小于4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb或1.5kb。在一些实施方案中,所公开的碱基编辑器的长度为4.5kb或更短。[1715]aav可以是aav1、aav2、aav5或其任何组合。可以关于待靶向的细胞而选择aav的类型,例如,可以选择aav血清型1、2、5或杂交衣壳aav1、aav2、aav5或其任何组合来靶向脑或神经元细胞;并且可以选择aav4来靶向心脏组织。aav8可用于递送至肝脏。关于这些细胞的某些aav血清型的列表可以在grimm,d.等人,j.virol.82:5887-5911(2008)中找到。[1716]慢病毒是复合逆转录病毒,其具有感染并且在有丝分裂细胞和有丝分裂后细胞中表达其基因的能力。最常见的已知慢病毒是人免疫缺陷病毒(hiv),其使用其他病毒的包膜糖蛋白来靶向大范围的细胞类型。[1717]慢病毒可以如下制备。在克隆pcases10(其含有慢病毒转移质粒主链)后,在转染前一天,将低代(p=5)的hek293ft接种到t-75烧瓶中的具有10%胎牛血清且不含抗生素的dmem中,达到50%汇合。20小时后,将培养基变为optimem(无血清)培养基,并在4小时后进行转染。用10μg的慢病毒转移质粒(pcases10)和下列封装质粒转染细胞:5μg的pmd2.g(vsv-g假型)和7.5μg的pspax2(gag/pol/rev/tat)。转染可以在4mloptimem中用阳离子脂质递送剂(50μllipofectamine2000和100ulplus试剂)进行。6小时后,将培养基变为具有10%胎牛血清的无抗生素dmem。这些方法在细胞培养期间使用血清,但优选无血清的方法。[1718]慢病毒可以如下纯化。在48小时后收获病毒上清液。首先清除上清液中的碎屑,并且通过0.45μm低蛋白结合(pvdf)筛检程式过滤。然后将它们在超离心机中以24,000rpm旋转2小时。将病毒球丸重新悬浮在50μl的dmem中,在4℃过夜。然后将它们分为等量小样并立即在-80℃冷冻。[1719]在另一实施方案中,还考虑了基于马感染性贫血病毒(eiav)的最小非灵长动物慢病毒载体。在另一实施例中,考虑经由视网膜下注射递送retinostat.rtm.,一种表达抑制血管生成的蛋白质(即,内皮抑素和血管抑素)的基于马感染性贫血病毒的慢病毒基因治疗载体。在另一实施方案中,考虑使用自灭活的慢病毒载体。[1720]该系统的任何rna,例如,向导rna或编码碱基编辑器的mrna,可以rna的形式递送。可以使用体外转录产生编码碱基编辑器的mrna。例如,可以使用含有下列元件的pcr盒合成核酸酶mrna:t7启动子、任选的kozak序列(gccacc)、核酸酶序列和3'utr诸如来自β珠蛋白-polya尾部的3'utr。该盒可以用于通过t7聚合酶进行的转录。向导多核苷酸(例如,grna)也可以使用体外转录从含有t7启动子、其后的序列“gg”和向导多核苷酸序列的盒转录。[1721]为了增强表达并降低可能的毒性,可以例如使用假-u或5-甲基-c将编码碱基编辑器的序列和/或向导核酸修饰为包括以或多个经修饰的核苷酸。[1722]aav载体的低封装能力使得大量超过这一尺寸的基因的递送和/或大的生理学调节元件的使用颇具挑战性。这些挑战可以例如通过将待递送的蛋白质分为两个或更多个片段而得以解决,其中该n端片段融合至分裂内含肽-n,并且c端片段融合至分裂内含肽-c。然后将这些片段封装到两个或更多个aav载体中。如本文所用,“内含肽”是指自剪接蛋白内含子(例如,肽),其连接位于两侧的n端和c端外显肽(例如,待接合的片段)。某些内含肽用于接合异源蛋白片段的用途在例如wood等人,j.biol.chem.289(21);14512-9(2014)中有所描述。例如,当融合至独立的蛋白片段时,内含肽intn和intc彼此识别,将其自身剪出并同步连接位于两侧的它们所融合的蛋白片段的n端和c端外显肽,从而从两个蛋白片段重构全长度蛋白质。其他合适的内含肽对于本领域技术人员将是显而易见的。[1723]本发明融合蛋白的片段的长度可变。在一些实施方案中,蛋白片段的长度为2个氨基酸至约1000个氨基酸的范围。在一些实施方案中,蛋白片段的长度为约5个氨基酸至约500个氨基酸的范围。在一些实施方案中,蛋白片段的长度为约20个氨基酸至约200个氨基酸的范围。在一些实施方案中,蛋白片段的长度为约10个氨基酸至约100个氨基酸的范围。其他长度的合适的蛋白片段对于本领域技术人员将会是显而易见的。[1724]在一种实施方案中,通过将大的转基因盒剪接为独立的两半(5'和3'末端,或头部和尾部)而产生双aav载体,其中该盒的每一半都被封装到单个aav载体(尺寸《5kb)中。然后,在通过两个双aav载体对同一细胞进行共转染后,遵循下列实现全长度转基因表达盒的重新组装:(1)5'基因组与3'基因组(双aav重迭载体)之间的同源重组(hr);(2)5'基因组和3'基因组(双aav反式剪接载体)的itr介导的尾至头连环化;或(3)这两种机制的组合(双aav杂交载体)。在体内使用双aav载体导致全长度蛋白质的表达。双aav载体平台的使用为尺寸》4.7kb的转基因提供了有效且可行的基因转移策略。[1725]内含肽[1726]在一些实施方案中,将核酸酶(例如,cas9)的一部分或片段融合至内含肽。核酸酶可以融合至内含肽的n端或c端。在一些实施方案中,融合蛋白的一部分或片段融合至内含肽并且融合至aav衣壳蛋白。内含肽、核酸酶和衣壳蛋白可以任何排列(例如,核酸酶-内含肽-衣壳、内含肽-核酸酶-衣壳、衣壳-内含肽-核酸酶等)融合在一起。在一些实施方案中,内含肽的n端融合至融合蛋白的c端,并且内含肽的c端融合至aav衣壳蛋白的n端。[1727]内含肽(干预蛋白)是见于多种不同生物体中的自加工结构域,其完成被称为蛋白质剪接的过程。蛋白质剪接是一种多步骤生化反应,由肽键的裂解和形成构成。尽管蛋白质剪接的内源性底物是在含有内含肽的生物体中发现的蛋白质,但内含肽也可以用来化学地操纵几乎任何多肽主链。[1728]在蛋白质剪接中,内含肽通过裂解两个肽键而从前体多肽切除自身,从而经由形成新的肽键而连接位于两侧的外显肽(外部蛋白质)。这一重排发生在翻译后(或可能与翻译同时发生)。内含肽介导的蛋白质剪接自发地发生,仅需要内含肽结构域的折迭。[1729]大约5%的内含肽是分裂内含肽,其被转录并翻译为两个独立的多肽,即n-内含肽和c-内含肽,各自融合至一个外显肽。翻译之后,内含肽片段自发地且非共价地组装为经典内含肽结构以完成u反式蛋白质剪接。蛋白质剪接的机制包括一系列酰基转移反应,这些反应导致位于内含肽-外显肽接合处的两个肽键段落以及n-外显肽与c外显肽之间的新肽键形成。这一过程通过启动接合n-外显肽与内含肽的n端的肽键启动。几乎全部内含肽均具有位于其n端的半胱氨酸或丝氨酸,该氨基酸供给c端n-外显肽残基的羰基碳。保守的苏氨酸和组氨酸(称为txxh基序)以及常见的天冬氨酸一起促进了这种n到o/s酰基的转移,导致线性(硫代)酯中间体的形成。之后,这一中间体通过第一个c-外显肽残基( 1)的亲核攻击而历经反式(硫代)酯化,该残基是半胱氨酸、丝氨酸或苏氨酸。所得的支化(硫代)酯中间体通过内含肽的高度保守的c端天冬酰胺的独特的转化:环化得以拆分。这一过程为组氨酸(见于高度保守的hnf基序中)和倒数第二的组氨酸所促进,并且也可能牵涉该天冬氨酸。这一琥珀酰亚胺形成反应将内含肽从反应性复合物中切除,并留下通过非肽连结附接的外显肽。这一结构以不依赖于内含肽的模式迅速重排为稳定的肽键。[1730]在一些实施方案中,碱基编辑器(例如,abe、cbe)的n端片段融合至分裂内含肽-n,并且c端片段融合至分裂内含肽-c。这些片段随后被封装到两个或更多个aav载体中。某些内含肽用于接合异源蛋白片段的用途在例如wood等人,j.biol.chem.289(21);14512-9(2014)中有所描述。例如,当融合至独立的蛋白片段时,内含肽intn和intc彼此识别,将其自身剪出并同步连接位于两侧的它们所融合的蛋白片段的n端和c端外显肽,从而从两个蛋白片段重构全长度蛋白质。其他合适的内含肽对于本领域技术人员将是显而易见的。[1731]在一些实施方案中,abe在所选的spcas9区域内的ala、ser、thr或cys残基处分裂为n端片段和c端片段。这些区域对应于通过cas9晶体结构分析检定的环区域。在氨基酸位置s303、t310、t313、s355、a456、s460、a463、t466、s469、t472、t474、c574、s577、a589和s590处,每个片段的n端融合至内含肽-n,并且每个片段的c端融合至内含肽-c,这些位置在下述序列中以粗体大写表示。[1732][1733][1734]核碱基编辑器用于靶向突变的用途[1735]如本文所用,评估了核碱基编辑器的靶向突变的适用性。在一种实施方案中,用碱基编辑系统与少量的编码报告基因(例如,gfp)的载体一起转染感兴趣的单细胞。这些细胞可以是本领域已知的任何细胞,包括永生化的人细胞系,诸如293t、k562或u20s。作为另一种选择,可以使用原代细胞(例如,人)。此类细胞可能与最终的细胞靶标相关。[1736]可以使用病毒载体执行递送。在一种实施方案中,可以使用脂质转染(诸如lipofectamine或fugene)或通过电穿孔执行转染)。转染之后,可通过萤光显微镜检查或通过流式细胞术测定gfp的表达,以证实持续且高水准的转染。这些初步转染可包含不同的核碱基编辑器以确定编辑器的哪些组合给出最大活性。[1737]如本文所述,例如,通过将细胞基因组测序以检测靶标序列中的改变,来评估核碱基编辑器的活性。对于sanger测序,将纯化的pcr扩增子克隆到质粒主链中,转化,小规模制备并使用单引物测序。也可以使用下一代测序技术执行测序。当使用下一代测序时,扩增子可以是具有位于不对称位置的预期切口位点的300-500bp。在pcr之后,可以将下一代测序适配器和条码(例如,illumina多工适配器和索引)添加到扩增子的末端,例如,以在高通量测序中(例如在illuminamiseq上)使用。[1738]可以选择在初始测试中诱导最高水准的靶标特异性改变的融合蛋白进行进一步评估。[1739]在特定实施方案中,使用核碱基编辑器来靶向感兴趣的多核苷酸。在一种实施方案中,将本发明的核碱基编辑器递送至与用来靶向细胞基因组中感兴趣的突变的向导rna协同作用的细胞(例如,造血细胞或其祖细胞、造血干细胞和/或诱导多能干细胞),从而改变该突变。在一些实施方案中,碱基编辑器为向导rna所靶向以将一个或多个编辑引入感兴趣的基因序列中。[1740]在一种实施方案中,使用核碱基编辑器来靶向调节序列,包括但不限于剪接位点、增强子和转录调节元件。然后,使用本领域已知的任何方法测定改变对于被调节元件控制的基因表达的效果。[1741]在其他实施方案中,使用本发明的核碱基编辑器来靶向编码互补决定区(cdr)的多核苷酸,从而在表达的cdr中产生改变。然后,例如,通过测量cdr与其抗原的特异性结合,测定这些改变对于cdr功能的效果。[1742]在其他实施方案中,使用本发明的核碱基编辑器来靶向生物体基因组内感兴趣的多核苷酸。在一种实施方案中,将本发明的核碱基编辑器递送至与用于在细胞基因组中排列各种序列的向导rna库协同作用的细胞,从而系统性地改变整个基因组中的序列。[1743]该系统可以包括一种或多种不同的载体。在一方面,对碱基编辑器进行密码子优化以用于在所希望的细胞类型中表达,以真核细胞为优先,优选哺乳动物细胞或人细胞。[1744]通常,密码子优化是指,通过将原生序列的至少一个密码子(例如,约或超过约1、2、3、4、5、10、15、20、25、50或更多个密码子)替换为更频繁或最频繁地用于该宿主细胞的基因中但同时维持原生氨基酸序列的密码子,修饰核酸序列以增强在感兴趣的宿主细胞中的表达的过程。多个物种针对特定氨基酸的某些密码子表现出特定的偏倚。密码子偏倚(生物体之间的密码子选择差异)经常与信使rna(mrna)的翻译效率相关联,而信使rna(mrna)的翻译效率据信取决于被翻译的密码子的性质和特定转移rna(trna)分子的可用性等。细胞中占据主导地位的所选trna通常反映了肽合成中最频繁使用的密码子。据此,可基于密码子优化裁剪基因以在给定生物体中实现最优基因表达。密码子选择表可以例如在www.kazusa.orjp/codon/(2002年7月9日)获得的“密码子选择资料库”中轻易地获得,并且这些表可以通过多种方式调整。参见,nakamura,y.等人"codonusagetabulatedfromtheinternationaldnasequencedatabases:statusfortheyear2000"nucl.acidsres.28:292(2000)。用于针对在特定宿主细胞中表达而对特定序列进行密码子优化的电脑演算法也是可获得的,诸如geneforge(aptagen;jacobus,pa.)。在一些实施方案中,编码经工程化的核酸酶的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50或更多个或全部密码子)对应于针对特定氨基酸最频繁使用的密码子。[1745]通常使用封装细胞来形成能够感染宿主细胞的病毒粒子。此类细胞包括封装腺病毒的293细胞,以及封装逆转录病毒的ψ2细胞或pa317细胞。用于基因疗法中的病毒载体一般通过生产将核酸载体封装到病毒粒子中的细胞系而产生。载体通常含有封装和后续整合到宿主中所需的最小病毒序列,其他病毒序列则替换为用于待表达的多核苷酸的表达盒。缺失的病毒功能通常由封装细胞系以反式提供。例如,用于基因疗法的aav载体通常仅具备封装和整合到宿主基因组中所需的来自aav基因组的itr序列。病毒dna可以封装在细胞系中,该细胞系含有编码其他aav基因的名为rep和cap的辅助质粒但缺少itr序列。细胞系也可以被作为辅助者的腺病毒感染。辅助病毒可以促进aav载体的复制以及aav基因从辅助质粒表达。在一些情况下,辅助质粒由于缺少itr序列而不以显著的量被封装。可以通过例如热处理减少腺病毒的污染,因为与aav相比,腺病毒对于热处理更加敏感。[1746]使用碱基编辑器的方法[1747]疾病相关基因和等位基因中点突变的校正为基因校正提供了新的策略,并且在治疗学和基础研究中得到应用。[1748]本公开提供用于治疗被诊断患有与点突变相关或点突变所致的疾病的受试者的方法,该点突变可以通过本文提供的碱基编辑器系统校正。例如,在一些实施方案中,提供了包括下述的方法:向患有此类疾病(例如,基因突变所致的疾病)的受试者给药有效量的核碱基编辑器(例如,腺苷脱氨酶碱基编辑器或胞苷脱氨酶碱基编辑器),该核碱基编辑器校正疾病相关基因中的点突变。本公开提供英语治疗与点突变相关或点突变所致的疾病的方法,该点突变可以通过脱氨酶介导的基因编辑得到校正。基于本公开,可使用本文提供的策略和融合蛋白治疗的合适疾病对于本领域技术人员将是显而易见的。本文提供了使用碱基编辑器或碱基编辑器系统对与疾病或疾患相关的靶标核苷酸序列中的核碱基进行编辑的方法。在一些实施方案中,碱基编辑器(例如,包含腺苷脱氨酶和cas12结构域)的活性导致点突变的校正。在一些实施方案中,靶标dna序列包含与疾病或疾患相关的g→a点突变,并且突变的a碱基的脱氨基作用导致了不与疾病或疾患相关的序列。在一些实施方案中,靶标dna序列包含与疾病或疾患相关的t→c点突变,并且突变的c碱基的脱氨基作用导致了不与疾病或疾患相关的序列。[1749]在一些实施方案中,靶标dna序列编码蛋白质,并且点突变处于密码子中且导致由突变密码子编码的氨基酸中相对于野生型密码子产生变化。在一些实施方案中,突变的a的脱氨基作用导致由突变密码子编码的氨基酸产生变化。在一些实施方案中,突变的a的脱氨基作用导致编码野生型氨基酸的密码子中产生变化。在一些实施方案中,突变的c的脱氨基作用导致由突变密码子编码的氨基酸产生变化。在一些实施方案中,突变的c的脱氨基作用导致编码野生型氨基酸的密码子中产生变化。在一些实施方案中,受试者具有或已经被诊断具有疾病或疾患。[1750]在一些实施方案中,本文所提供的腺苷脱氨酶能够将dna的去氧腺苷残基脱氨基。本公开的其他方面提供融合蛋白,该融合蛋白包含腺苷脱氨酶(例如,如本文所述将dna中的去氧腺苷脱氨基的腺苷脱氨酶)和能够结合至特异性核苷酸序列的结构域(例如,cas12)。例如,腺苷可以被转化为肌苷残基,而肌苷残基通常与胞嘧啶残基配对。除其他之外,此类融合蛋白可用于核酸序列的靶向编辑。此类融合蛋白可用于dna的体外靶向编辑,例如,用于产生突变细胞或动物;用于将靶向突变引入细胞中,例如,用于细胞中基因缺陷的离体校正,该细胞是例如从受试者获得的细胞且该细胞接着被重新引入同一或另一受试者体内;以及用于引入体内靶向突变,例如,校正基因缺陷或将失活突变引入疾病相关基因中,可以使用本文提供的核碱基编辑器处理g至a或t至c突变。本公开提供利用脱氨酶和核碱基编辑器的脱氨酶、融合蛋白、核酸、载体、细胞、组合物、方法、试剂盒、系统等。[1751]产生预期突变[1752]在一些实施方案中,本文提供的方法的目的是经由基因编辑恢复失能基因的功能。在一些实施方案中,通过引入预期突变来恢复失能基因的功能。在一些实施方案中,本文提供的方法可以用来中断基因产物的正常功能。本文提供的核碱基编辑蛋白可以被验证用于基于基因编辑的体外人类疗法,例如,通过校正人细胞培养物中的疾病相关突变来验证。技术人员将会理解,本文提供的核碱基编辑蛋白,例如,包含napdnabp结构域(例如,cas12)和核碱基编辑结构域(例如,腺苷脱氨酶结构域或胞苷脱氨酶结构域)的融合蛋白,可以用来校正任何单点a至g或c至t突变。在第一种情况下,突变的a脱氨基化为i校正了该突变,而在后一种情况下,与突变的t进行碱基配对的a的脱氨基作用以及随后的一轮复制校正了该突变。[1753]在一些实施方案中,本文公开提供碱基编辑器,其在核酸(例如,受试者基因组内的核酸)中有效地产生“预期突变”诸如点突变,而不产生显著数量的非预期突变诸如非预期点突变。在一些实施方案中,预期突变是通过结合至向导多核苷酸(例如,grna)的特异性碱基编辑器(例如,胞苷碱基编辑器或腺苷碱基编辑器)产生的突变,该特异性碱基编辑器经过特异性地涉及以产生预期突变。在一些实施方案中,预期突变是与疾病或疾患相关的突变。在一些实施方案中,预期突变是与疾病或疾患相关的腺嘌呤(a)至鸟嘌呤(g)的点突变。在一些实施方案中,预期突变是与疾病或疾患相关的胞嘧啶(c)至胸腺嘧啶(t)的点突变。在一些实施方案中,预期突变是基因的编码区或非编码区内的腺嘌呤(a)至鸟嘌呤(g)的点突变。在一些实施方案中,预期突变是基因的编码区或非编码区内的胞嘧啶(c)至胸腺嘧啶(t)的点突变。在一些实施方案中,预期突变是点突变,该点突变在基因的编码区内产生终止密码子,例如,提前终止密码子。在一些实施方案中,预期突变是消除终止密码子的突变。[1754]在一些实施方案中,本文提供的碱基编辑器能够产生大于1:1的预期突变与非预期突变的比率(例如,预期点突变:非预期点突变)。在一些实施方案中,本文提供的碱基编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1、或至少1000:1或更高的预期突变与非预期突变的比率(例如,预期点突变:非预期点突变).[1755]碱基编辑器效率的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用而整体并入本文。也参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017)和komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),其整体内容通过引用并入本文。[1756]在一些实施方案中,使用本文提供的方法编辑一个或多个基因中的多个核碱基对导致了至少一个预期突变的形成。在一些实施方案中,所述至少一个预期突变的所述形成导致了致病突变的精确校正。应知悉,可以使用本文提供的任何方法或方法的组合可以实现多工编辑。[1757]i.sod基因的修饰[1758]通过靶向位于疾病相关基因(例如,与als相关的sod1基因)或等位基因的一个或多个外显子5′的内含子核酸序列中的剪接受体而中断正常剪接,为影响疾病相关基因的转录提供了一种可用策略,并且在治疗学和基础研究中得到应用。不欲受缚于理论,本文所述的中断正常mrna剪接的碱基编辑系统和方法可以导致基因转录物的替代性剪接,从而产生替代性剪接的mrna,这可能导致截短的蛋白质和/或不正常或异常的蛋白质产物,这些蛋白质产物不具备功能或功能有限。在一些情况下,本文所述的中断正常mrna剪接的碱基编辑系统和方法可能导致可以在细胞中被降解的mrna转录物。作为另一种选择,中断正常mrna剪接最终可能产生在细胞中被降解的异常蛋白质产物(例如,截短的蛋白质或错误折迭的蛋白质)或者功能降低或不具备功能的蛋白质。[1759]本公开提供用于治疗被诊断为患有与疾病基因(例如,与als相关的sod1基因)相关的疾病的受试者的方法,该方法使用本文公开的碱基编辑器系统在sod1基因的转录期间造成剪接中断。例如,在一些实施方案中,提供了包括下述的方法:向患有此类疾病的受试者给药有效量的核碱基编辑器(例如,腺苷脱氨酶碱基编辑器或胞苷脱氨酶碱基编辑器),该核碱基编辑器在疾病相关基因的转录期间中断剪接。本公开提供用于治疗als的方法,其中位于als相关的sod1基因序列的外显子(例如,sod1基因序列特别是人sod1基因序列的外显子3)的5'处的非编码核酸序列中剪接受体(即,ag位点)的脱氨酶介导的碱基编辑中断了sod1mrna转录物的剪接。[1760]本文提供了使用碱基编辑器或碱基编辑器系统对位于疾病或疾患相关基因的外显子的5'处的剪接受体中的核碱基进行编辑的方法。在一些实施方案中,靶标dna序列是邻近疾病相关基因外显子的基因组序列的内含子中的剪接受体,并且导致该剪接受体中相对于野生型剪接受体产生变化。在一些实施方案中,剪接受体中a核碱基的脱氨基作用导致转录期间的mrna转录物的剪接中断。在一些实施方案中,受试者具有或已经被诊断具有疾病或疾患。[1761]在一些实施方案中,碱基编辑器(例如,包含腺苷脱氨酶和cas9结构域)的活性改变疾病相关基因的外显子5'处的剪接受体,例如,sod1基因的外显子3的5'处的剪接受体ag核苷酸序列,造成基因转录期间的正常剪接被中断。在一些实施方案中,将邻近与疾病或疾患相关的基因的外显子的经典ag剪接受体核酸序列的腺苷核苷酸脱氨基以导致鸟苷核苷酸,从而改变该经典ag剪接受体,使得基因转录期间的正常剪接受到影响,例如,产生替代性剪接的基因转录结果,并且疾病相关蛋白的正常产生(翻译)受到不利影响。[1762]在一些实施方案中,本文所提供的腺苷脱氨酶能够将dna的去氧腺苷残基脱氨基。本公开的其他方面提供融合蛋白,该融合蛋白包含腺苷脱氨酶(例如,如本文所述将dna中的去氧腺苷脱氨基的腺苷脱氨酶)和能够结合至特异性核苷酸序列的结构域(例如,cas9或cpf1蛋白)。例如,腺苷可以被转化为肌苷残基,而肌苷残基通常与胞嘧啶残基配对。除其他之外,此类融合蛋白可用于核酸序列的靶向编辑。此类融合蛋白可以用于以体外方式进行dna的靶向编辑,例如,用于产生突变细胞或动物;用于以离体方式将靶向突变引入细胞中邻近疾病相关基因外显子的剪接受体中,该细胞是例如从受试者获得并且随后被重新引入同一或另一受试者体内;以及以体内方式引入靶向突变,例如,将剪接中断突变引入剪接受体(“ag序列)中,影响疾病相关基因(例如,sod1)的正常转录,从而使用本文提供的核碱基编辑器治疗该疾病(als)。本公开提供利用脱氨酶和核碱基编辑器的脱氨酶、融合蛋白、核酸、载体、细胞、组合物、方法、试剂盒、系统等。[1763]核碱基编辑器用于靶向sod1基因的用途[1764]如本文所述,评估了核碱基编辑器靶向位于sod1基因外显子5'的剪接受体中的核苷酸的适用性。在一种实施方案中,用编码本文所述的核碱基编辑器的一种或多种核酸分子与少量编码报告基因(例如,gfp)的载体一起转染、转导或以其他方式修饰感兴趣的单细胞。这些细胞可以是永生化的人细胞系,诸如293t、k562或u20s细胞。作为另一种选择,可以使用原代人细胞。细胞也可以获自受试者或个体,诸如获自组织活检、外科手术、血液、血浆、血清或其他生物流体。此类细胞可能与最终的细胞靶标相关。[1765]可以使用病毒载体如下文进一步描述的执行递送。在一种实施方案中,可以使用脂质转染(诸如lipofectamine或fugene)或通过电穿孔执行转染)。转染之后,可通过萤光显微镜检查或通过流式细胞术测定gfp的表达,以证实持续且高水准的转染。这些初步转染可包含不同的核碱基编辑器以确定编辑器的哪些组合给出最大活性。[1766]如本文所述,例如,通过将靶标基因测序以检测靶标序列中的改变,来评估核碱基编辑器的活性。对于sanger测序,将纯化的pcr扩增子克隆到质粒主链中,转化,小规模制备并使用单引物测序。也可以使用下一代测序技术执行测序。当使用下一代测序时,扩增子可以是具有位于不对称位置的预期切口位点的300-500bp。在pcr之后,可以将下一代测序适配器和条码(例如,illumina多工适配器和索引)添加到扩增子的末端,例如,以在高通量测序中(例如在illuminamiseq上)使用。[1767]可以选择在初始测试中诱导最高水准的靶标特异性改变的融合蛋白进行进一步评估。[1768]在特定实施方案中,使用核碱基编辑器来靶向感兴趣的多核苷酸。在一种实施方案中,将本文所述的核碱基编辑器递送至与用来靶向核酸序列(例如,sod1的外显子(例如,外显子3)的剪接受体中的核碱基)的向导rna协同作用的细胞(例如,运动神经元),从而中断该剪接受体,改变sod1基因的转录,并且例如通过造成替代性转录物的产生而最终影响sod1蛋白的产生。[1769]在一些实施方案中,碱基编辑器为向导rna所靶向以将一个或多个编辑引入感兴趣的序列中。[1770]产生预期突变[1771]在一些实施方案中,本文提供的方法的目的是,通过对剪接受体(例如,位于与疾病相关或致病的基因的内含子的3'和外显子的5'处的ag序列基序)的碱基编辑,在与疾病相关或致病的基因的转录期间中断mrna剪接。在一些实施方案中,通过将预期突变引入剪接受体中而改变或调控基因的转录。在一些实施方案中,由于与疾病相关或致病的基因的外显子的5’的剪接受体的碱基编辑,疾病相关基因没有被转录或没有被正常地转录,使得mrna剪接中断。在一些实施方案中,基因的替代性转录是如本文所述的剪接中断导致的。在一些实施方案中,基因的替代性转录导致截短的/非功能性的该基因编码的蛋白质产物。在一些实施方案中,本文提供的方法可以用来中断基因产物的正常功能。本文提供的核碱基编辑蛋白可以被验证用于基于基因编辑的体外人类疗法,例如,通过减少或降低人细胞培养物中由疾病相关基因编码的正常或功能性蛋白的产生来验证。技术人员将会理解,本文提供的核碱基编辑蛋白,例如,包含多核苷酸可编程核苷酸结合结构域(例如,cas9)和核碱基编辑结构域(例如,腺苷脱氨酶结构域或胞苷脱氨酶结构域)的融合蛋白,可以用来将疾病相关或致病基因的外显子的5'的剪接受体中的a编辑或精确地改变为g核碱基。在一些实施方案中,本文公开提供碱基编辑器,其在核酸(例如,受试者基因组内的核酸)中有效地产生“预期突变”诸如点突变,而不产生显著数量的非预期突变诸如非预期点突变。在一些实施方案中,预期突变是通过结合至向导多核苷酸(例如,grna)的特异性碱基编辑器(例如,腺苷碱基编辑器或胞苷碱基编辑器)产生的突变,该特异性碱基编辑器经过特异性地涉及以产生预期突变。在一些实施方案中,预期突变是基因的非编码区内的腺嘌呤(a)至鸟嘌呤(g)的点突变。在一些实施方案中,预期突变是基因的非编码区内的胞嘧啶(c)至胸腺嘧啶(t)的点突变。在一些实施方案中,预期突变是与疾病或疾患相关的基因的外显子的5'的非编码区中的剪接受体的突变。在一些实施方案中,预期突变是与疾病或疾患相关的基因的外显子的5'的非编码区中的剪接受体的腺嘌呤(a)到鸟嘌呤(g)的点突变。在一些实施方案中,预期突变是中断基因的完全转录物的正常剪接的突变,例如,位于致病或疾病相关基因的外显子的5'处的非编码区内的剪接受体中的a到g的变化。在一些实施方案中,预期突变是剪接受体中的突变,该突变中断基因转录物的剪接并且导致编码截短的和/或非功能性蛋白质产物的替代性转录物。[1772]在一些实施方案中,本文提供的碱基编辑器能够产生大于1:1的预期突变与非预期突变的比率(例如,预期点突变:非预期点突变)。在一些实施方案中,本文提供的碱基编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1、或至少1000:1或更高的预期突变与非预期突变的比率(例如,预期点突变:非预期点突变)。[1773]碱基编辑器效率的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用而整体并入本文。也参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017)和komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),其整体内容通过引用并入本文。[1774]在一些实施方案中,使用本文提供的方法编辑一个或多个基因中的多个核碱基对导致了至少一个预期突变的形成。在一些实施方案中,至少一种预期突变的形成是在疾病相关基因的外显子的5′处的剪接受体中发生的,并且导致疾病相关基因的mrna转录物的剪接中断。应知悉,可以使用本文提供的任何方法或方法的组合可以实现多工编辑。[1775]剪接受体中断[1776]在一些实施方案中,预期突变是,使用腺苷碱基编辑器(例如,abe8)靶向剪接受体(具有保守的核苷酸基序“ag”)中的a核苷酸,以在转录期间造成基因的mrna剪接中断。在一种实施方案中,所靶向的剪接受体是位于与als相关的sod1基因的内含子的3'末端或外显子3的5'处的“ag”序列基序。预期突变改变剪接受体中的保守的“ag”核苷酸序列基序,造成剪接中断以及基因转录过程中的mrna转录物的正常剪接的改变或损失。在一种实施方案中,使用a到g碱基编辑器(abe)将剪接受体保守基序中的a核碱基脱氨基导致了剪接受体序列,该剪接受体序列中断正常mrna剪接并导致mrna转录物,并且在一些情况下,所翻译得到蛋白质是不正常的,例如,截短的、片段化的和/或非功能性的,以补救或治疗疾病或疾患。在一些实施方案中,预期突变是剪接受体的保守核苷酸序列基序“ag”中的a→g点突变。例如,可以通过使cbe靶向至相反链并且编辑致病性g核碱基的补体c来影响a→g点突变。可以使碱基编辑器靶向预期待突变或保守的核碱基,或靶向预期待突变或保守的核碱基的补体。病原学或致病突变的说明的命名法在dendunnen,j.t.andantonarakis,s.e.,“mutationnomenclatureextensionsandsuggestionstodescribecomplexmutations:adiscussion.”humanmutation15:712(2000)中有所描述,其整体内容通过引用并入本文。[1777]ar基因的修饰[1778]将剪接位元点的终止密码子或中断引入第一外显子中导致了ar多肽的提前终止,从而为治疗罹患sbma的受试者提供了新的策略。[1779]本公开提供用于治疗被诊断患有sbma的受试者的方法。例如,在一些实施方案中,提供了包括下述的方法:向患有sbma或具有发展出sbma潜力的受试者给药有效量的核碱基编辑器(例如,腺苷脱氨酶碱基编辑器或胞苷脱氨酶碱基编辑器),该核碱基编辑器引入导致ar多肽提前终止的点突变。[1780]应理解,各序列(例如,分别为疾病相关基因或其编码的蛋白质的多核苷酸或氨基酸序列)中具体位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号在例如成熟蛋白的前体和成熟蛋白本身中可以是不同的,并且来自不同物种的序列之间的差异可能影响编号。本领域技术人员将能够通过本领域周知的方法鉴定任何同源蛋白质和相应编码核酸中的各残基,例如,通过序列比对和同源残基的确定。[1781]本文提供了使用碱基编辑器或碱基编辑器系统对与sbma相关的靶标ar核苷酸序列中的核碱基进行编辑的方法。在一些实施方案中,碱基编辑器(例如,包含胞苷脱氨酶和cas9结构域)的活性导致点突变的引入。[1782]在一些实施方案中,a的脱氨基作用导致ar多肽中剪接位点的中断。在一些实施方案中,c的脱氨基作用导致终止密码子被引入ar多肽中。在一些实施方案中,受试者已经被诊断患有sbma。[1783]核碱基编辑器用于靶向编码雄激素受体(ar)的基因中的核苷酸的用途[1784]如本文所述,评估了核碱基编辑器靶向编码雄激素受体的基因中的核苷酸的适用性。在一种实施方案中,用编码本文所述的核碱基编辑器的一种或多种核酸分子与少量编码报告基因(例如,gfp)的载体一起转染、转导或以其他方式修饰感兴趣的单细胞。这些细胞可以是永生化的人细胞系,诸如293t、k562或u20s。作为另一种选择,可以使用原代人细胞。细胞也可以获自受试者或个体,诸如获自组织活检、外科手术、血液、血浆、血清或其他生物流体。此类细胞可能与最终的细胞靶标相关。[1785]可以使用病毒载体如下文进一步描述的执行递送。在一种实施方案中,可以使用脂质转染(诸如lipofectamine或fugene)或通过电穿孔执行转染)。转染之后,可通过萤光显微镜检查或通过流式细胞术测定gfp的表达,以证实持续且高水准的转染。这些初步转染可包含不同的核碱基编辑器以确定编辑器的哪些组合给出最大活性。[1786]如本文所述,例如,通过将靶标基因测序以检测靶标序列中的改变,来评估核碱基编辑器的活性。对于sanger测序,将纯化的pcr扩增子克隆到质粒主链中,转化,小规模制备并使用单引物测序。也可以使用下一代测序技术执行测序。当使用下一代测序时,扩增子可以是具有位于不对称位置的预期切口位点的300-500bp。在pcr之后,可以将下一代测序适配器和条码(例如,illumina多工适配器和索引)添加到扩增子的末端,例如,以在高通量测序中(例如在illuminamiseq上)使用。[1787]可以选择在初始测试中诱导最高水准的靶标特异性改变的融合蛋白进行进一步评估。[1788]在其他实施方案中,通过检测天然地或重组地表达ar的细胞中是否存在全长度ar多肽来评估核碱基编辑器的活性。用于检测ar蛋白的方法是本领域中已知的,并且包括例如免疫测定、elisa和蛋白质印迹。[1789]在特定实施方案中,使用核碱基编辑器来靶向感兴趣的多核苷酸。在一种实施方案中,将本发明的核碱基编辑器递送至与用来靶向核酸序列(例如,编码雄激素受体的多核苷酸序列)的向导rna协同作用的细胞(例如,神经元),以引入终止密码子或中断该基因中的剪接位点,从而中断雄激素受体的表达。[1790]产生预期突变[1791]本文提供的核碱基编辑蛋白可以被验证用于基于基因编辑的体外人类疗法,例如,通过在人细胞培养物中引入终止密码子或中断ar靶标基因中的剪接位点来验证。技术人员将会理解,本文提供的核碱基编辑蛋白,例如,包含多核苷酸可编程核苷酸结合结构域(例如,cas9)和核碱基编辑结构域(例如,腺苷脱氨酶结构域或胞苷脱氨酶结构域)的融合蛋白,可以用来引入任何单点a至g或c至t突变。[1792]在一些实施方案中,本文公开提供碱基编辑器,其可以在核酸(例如,受试者基因组内的核酸)中有效地产生“预期突变”诸如点突变,而不产生显著数量的非预期突变诸如非预期点突变。在一些实施方案中,预期突变是通过结合至向导多核苷酸(例如,grna)的特异性碱基编辑器(例如,胞苷碱基编辑器或腺苷碱基编辑器)产生的突变,该特异性碱基编辑器经过特异性地涉及以产生预期突变。在一些实施方案中,预期突变是腺嘌呤(a)到鸟嘌呤(g)的点突变,其导致剪接位点的中断。在一些实施方案中,预期突变是胞嘧啶(c)到胸腺嘧啶(t)的点突变,该点突变导致提前终止密码子的引入。在一些实施方案中,预期突变是基因的编码区或非编码区内的腺嘌呤(a)至鸟嘌呤(g)的点突变。在一些实施方案中,预期突变是基因的编码区或非编码区内的胞嘧啶(c)至胸腺嘧啶(t)的点突变。在一些实施方案中,预期突变是点突变,该点突变在基因的编码区内产生终止密码子,例如,提前终止密码子。在一些实施方案中,预期突变是点突变,该点突变中断基因的编码区内的剪接位元点。[1793]在一些实施方案中,本文提供的碱基编辑器能够产生大于1:1的预期突变与非预期突变的比率(例如,预期点突变:非预期点突变)。在一些实施方案中,本文提供的碱基编辑器能够产生至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1、或至少1000:1或更高的预期突变与非预期突变的比率(例如,预期点突变:非预期点突变)。[1794]碱基编辑器效率的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用而整体并入本文。也参见,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017)和komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)),其整体内容通过引用并入本文。[1795]在一些实施方案中,编辑一个或多个基因中的多个核碱基对导致了至少一个预期突变的形成。在一些实施方案中,至少一种预期突变的形成导致了提前终止密码子的引入或间接位点的中断。应知悉,本文所述的碱基编辑器的多元编辑的特征可以应用至使用本文所提供的碱基编辑器的方法的组合。[1796]iii.多效应子核碱基编辑器的应用[1797]多效应子核碱基编辑器可以用来靶向感兴趣的多核苷酸以产生修饰蛋白质表达的改变。在一种实施方案中,使用多效应子核碱基编辑器来修饰非编码或调节序列,包括但不限于剪接位点、增强子和转录调节元件。然后,使用本领域已知的任何方法测定改变对于被调节元件控制的基因表达的效果。在特定实施方案中,多效应子核碱基编辑器能够实质性地改变调节序列,从而废除其调节基因表达的能力。有利的是,可以完成这一点而不在基因组靶标序列中产生双链断裂,与其他rna可编程核酸酶相反。[1798]多效应子核碱基编辑器可以用来靶向感兴趣的多核苷酸以产生修饰蛋白质活性的改变。例如,在诱变的情境中,多效应子核碱基编辑器具有大量优于易错pcr和其他基于聚合酶的方法的优势。因为本发明的多效应子核碱基编辑器在靶标区域中的多个碱基处产生改变,相对于通过易错pcr引入的考虑到密码子中的单个核苷酸变化可能仍编码相同氨基酸(例如,密码子简并性)而较不可能以蛋白质水准表达的突变,此类突变更可能以蛋白质水准被表达。不同于在整个多核苷酸范围内包括随机改变的易错pcr,本发明的多效应子核碱基编辑器可以用来靶向感兴趣的蛋白质的小的或定义的区域中的具体氨基酸。[1799]在另一实施方案中,本发明的多效应子核碱基编辑器用来靶向生物体基因组内的感兴趣的多核苷酸。在一种实施方案中,生物体是微生物组的细菌(例如,拟杆菌门(bacteriodetes)、疣微菌门(verrucomicrobia)、厚壁菌门(firmicutes);γ-变形菌纲(gammaproteobacteria)、α-变形杆菌纲(alphaproteobacteria)、拟杆菌纲、梭菌纲(clostridia)、丹毒丝菌纲(erysipelotrichia)、杆菌纲(bacilli);肠杆菌目(enterobacteriales)、拟杆菌目(bacteriodales)、疣微菌目(verrucomicrobiales)、梭菌目(clostridiales)、丹毒丝菌目(erysiopelotrichales)、乳杆菌目(lactobacillales);肠杆菌科(enterobacteriaceae)、拟杆菌科(bacteroidaceae)、丹毒丝菌科(erysiopelotrichaceae)、普雷沃氏菌科(prevotellaceae)、红蝽菌科(coriobacteriaceae)和产碱菌科(alcaligenaceae);埃希氏杆菌属(escherichia)、拟杆菌属(bacteroides)、另枝菌属(alistipes)、阿克曼菌属(akkermansia)、梭菌属(clostridium)、乳杆菌属(lactobacillus))的细菌。在另一实施方案中,有机体是农业上重要的动物(例如,牛、绵羊、山羊、马、鸡、火鸡)或植物(例如,大豆、小麦、玉米、稻、马铃薯、苹果、葡萄、桃、李、樱桃)。在一种实施方案中,将本发明的多效应子核碱基编辑器递送至与用于将各种序列排列在细胞基因组内的向导rna库协同作用的细胞,从而系统性地改变整个基因组的序列。[1800]可以在多种蛋白质中的任一种中作出突变,以促进对该蛋白质的结构功能分析或改变其内源活性。例如,可以在酶(例如,激酶、磷酸酶、羧化酶、磷酸二酯酶)或酶底物中、在受体或其配体中、以及在抗体及其抗原中作出突变。在一种实施方案中,多效应子核碱基编辑器靶向编码该酶的活性位元点、受体的配体结合位点或抗体的互补决定区(cdr)的核酸分子。在酶的情况向下,将突变引入活性位点中将会增加、降低或废除酶的活性。突变对于酶的效果在酶活性测定中表征,包括任何数量的本领域中已知的和/或对于技术人员将会是显而易见的测定。在受体的情况下,在配体结合位点作出的突变将会增加、降低或废除受体对其配体的亲和性。此类突变的效果在受体/配体结合测定中测定,包括任何数量的本领域中已知的和/或对于技术人员将会是显而易见的测定。在cdr的情况下,在cdr内作出的突变将会增加、降低或废除与抗原的结合。作为另一种选择,在cdr内作出的突变将会改变抗体针对其抗原的特异性。然后测定了这些改变对于cdr功能的效果,例如,通过测量cdr与其抗原的特异性结合或在任何其他类型的免疫测定中测定。[1801]疾病和疾病相关基因[1802]本文提供了用于在致病基因或疾病相关基因的转录期间中断剪接的系统、组合物和方法,通过使用本文所述的可编程碱基编辑器或可编程碱基编辑器系统来靶向并编辑疾病相关或致病基因序列的外显子的5'处的非编码核酸序列中的剪接受体的保守“ag”核酸基序中的核碱基。碱基编辑器(例如,包含腺苷脱氨酶和cas9结构域)的活性造成经典剪接受体基序的改变和中断,因此导致碱基受体序列与野生型剪接受体相比的变化以及疾病相关或致病基因转录期间mrna正常剪接的中断。在一些实施方案中,剪接受体中的a核碱基的脱氨基作用导致mrna转录物的剪接中断。[1803]在一些实施方案中,与引起疾病或疾患相关的基因序列外显子5'的经典ag剪接受体核酸序列的腺苷核苷酸被脱氨基以产生鸟苷核苷酸,从而改变经典ag剪接受体,使剪接中断,或者丧失在基因转录过程中发生正常剪接的能力。举例而言,可能产生经替代性剪接的基因转录物,并且正常或全长度的、功能性蛋白质产物的翻译和产生可能受到负面影响,从而产生截短的和/或非功能性的蛋白质产物。在一种实施方案中,疾病相关或致病基因是超氧化物歧化酶1(sod1)基因,其与肌萎缩性脊髓侧索硬化症(als)相关。在一种实施方案中,在sod1基因的外显子3核酸序列5'处剪接受体核苷酸序列的经典ag基序中发生腺苷到鸟苷(a到g)的变化。在一些实施方案中,受试者是患有als或已经被诊断为患有als的人类患者。[1804]本发明也提出用于通过修饰编码雄激素受体的基因来治疗脊髓和延髓肌萎缩(sbma)的组合物和方法。在一些实施方案中,该修饰产生终止密码子或中断外显子1中的剪接位点。在其他实施方案中,该修饰中断了剪接位点(例如,剪接供体位点或剪接受体位点)。本发明至少部分地基于以下发现:腺苷碱基编辑器(abe)可用来将雄激素受体(ar)基因的外显子1中的腺苷脱氨基,该变化中断剪接供体或剪接受体位点,从而中断具有与sbma相关的三核苷酸重复扩张的ar多肽的表达。[1805]肌萎缩性脊髓侧索硬化症和超氧化物歧化酶1(sod1)[1806]肌萎缩性脊髓侧索硬化症(als)是一种影响脑和脊髓内的神经细胞(神经元)的进行性神经退行性疾病。als的特征在于脑干和脊髓中的运动神经元的死亡,导致进行性瘫痪,并最终导致患者死亡。1939年,纽约洋基棒球队著名球员lougehrig罹患肌萎缩侧索硬化症,引起了国内外对该病的关注;直到今天,这种疾病仍然与他的名字密切相关。als往往在中年(年龄在40岁到70岁之间)发病,但是其他年龄段也可能发展出该疾病。尽管该数字可能会有波动,但据评估,美国有约30,000例患者患有该疾病,并且每年有约5,000人被诊断为患有als。[1807]运动神经元从脑延伸至脊髓,并且从脊髓延伸至整个身体的肌肉。als中运动神经元的进行性退化最终导致细胞死亡和肌肉萎缩。当运动神经元死亡时,脑丧失了启动并控制肌肉移动的能力。作为自主肌肉动作的进行性麻痹的结果,处于该疾病晚期阶段的患者可能变为完全瘫痪。[1808]大体上,als分为两个不同的类型:散发性和家族性。在美国,散发性als(sals;肇因未知的als发作)是最常见形式的该疾病,并且占该疾病全部病例的90%至95%。家族性als(fals)是先天性的,并且在美国占全部病例的5%至10%。fals是由许多基因的显性模式的突变造成的。研究最深入的fals形式是由编码铜-锌(cu/zn)超氧化物歧化酶(sod1)的导致蛋白质一级结构变化的突变造成的,并且占全部该突变导致fals病例的10-15%。[1809]sod1是一种丰富的抗氧化酶,其催化超氧化物歧化为过氧化氢(h2o2)和氧气。在人体内,sod1基因定位在染色体21的长臂上的位置22.11处。人sod1酶是每个亚基具有一个铜结合位点和一个锌结合位点以及一个细胞内二硫键的32-kda同源二聚体。已经鉴定了sod1基因中的超过200种als相关突变,其大多数是遗传显性的。falssod1突变全部导致一级结构变化,而这些变化广泛地散布在整个153个残基的sod1多肽中。此类突变主要是单氨基酸氨基置换,但也有插入、缺失和c端的截短。除了人类之外,已知发展出als样症状和组织病理学的唯一的其他哺乳动物物种自然是狗,并且已经发现了狗的该疾病(犬退行性脊髓病)与sod1基因中的突变之间的关联。(y.sheng等人,2012,currenttopicsinmedicinalchemistry,12:2560-2572)。很多sod1变体表现出正常的酶活性,并且sod1敲除鼠不显示运动神经元死亡,因此表明sod1相关的fals不适功能丧失性疾病。除了表达内源性野生型(wt)鼠sod1之外还表达造成als的人sod1变体的转基因鼠发展出als样神经退化和瘫痪,从而得出结论,突变的sod1通过获得毒性特性而造成als疾病。已经在来自fals-sod1患者和转基因鼠的脊髓中发现了具有针对sod1的免疫反应性的蛋白质包涵体。因此,据信sod1的聚集是sod1相关的fals的病原学基础。[1810]假设突变的sod1自身或与其他细胞内组分寡聚以形成高分子量聚集体(可溶性寡聚物或不溶性聚集体)。als相关的突变sod1变体全部显示高于人wt(hwt)酶的聚集性质,但是,sod1多肽失去稳定性并不是全部sod1突变蛋白共有的特征。sod1的翻译后修饰,包括zn和cu辅因数的结合以及二硫键的形成,对于sod1的稳定性贡献极大。金属化状态和二硫化物状态在sod1聚集中的作用,可能涉及不成熟或错误折迭形式的sod1,已经被y.sheng等人解决(2012,currenttopicsinmedicinalchemistry,12:2560-2572)。[1811]als是一种异质性疾病,因为该疾病发生的方式多种多样。存在不同类型的als,它们通过其迹象和症状以及其遗传原因或明确基因关联的缺乏进行区分。大多数患有散发性als的人往往在五十多岁或六十多岁是表现出病症特征,没有明显先兆。少部分(大约5-10%)患有fals的人具有als或被称为额颞叶痴呆(ftd)的相关病症的家族病史,额颞叶痴呆是一种脑部疾患,其影响人格、行为和语言。fals的迹象和症状通常首先在四十多岁或五十多岁的个体中出现。被称为青少年als的罕见形式的als的症状在儿童时期或十几岁时发展出来。[1812]als的最初迹象和症状往往很微妙并且可能被忽视。最早的als症状包括肌肉抽搐、抽筋、僵硬或虚弱。受影响的个体可能会发展出口齿不清(构音障碍),并且在后来难以咀嚼或吞咽(吞咽困难)。很多als患者因为吞咽困难所致的食物摄入减少而经历营养不良以及长期患病所致的其身体能量需求(新陈代谢)的增加。随着疾病进展,肌肉变得更为虚弱,并且随着肌肉萎缩,胳膊和腿开始看起来更细。受als影响的个体最终丧失肌肉强度和行走能量;因此,它们变为轮椅依赖者。随着时间的推移,肌肉虚弱造成als患者无法使用其手和胳膊。因为呼吸系统肌肉的虚弱,als患者经历呼吸困难并往往在als的迹象和症状首次出现后2至10年内死于呼吸衰竭。尽管如此,在受影响的个体之间,疾病进展的差异极大。大约20%的als患者也发展出ftd。人格和行为的变化可能使得受影响的个体难以与其他人以社会可接受的方式交往。随着疾病进展,社交能力变差。尽管尚不清楚als如何与ftd关联,但发展出两种病症的患者被诊断为患有als-ftd。[1813]引起als的sod1突变全都导致sod1蛋白的折迭平衡朝向未折迭和部分折迭的单体移动,意味着早期折迭事件会产生有害的副反应。通过对蛋白质折迭行为的分析,已经绘制了aposod单体的构象图谱。分析结果允许靶向sod结构的区域,这些区域最易受到在生理条件下局部未折迭影响,导致暴露出正常情况下隐藏在蛋白质内部的结构混杂的介面,并且分析结果证实了其他发现,即不成熟的aposod单体是细胞毒性的前体。(a.nordlundandm.oliveberg,2006;proc.natl.acad.sci.usa.;103(27):10218-10223)。伴随着折迭平衡的移动,als相关的sod突变表明降低的蛋白质稳定性、净电荷与疾病进展之间存在定量相关。综上所述,这些资料表明一种疾病机制,至少在家族性形式的als中,该机制与蛋白质聚集或由结果断裂和排斥电荷减少触发的其他关联过程(例如,分子伴侣超载和与膜脂质的不良集聚)有关。(id.)。[1814]目前,als无法治愈。als的治疗包括解决和减缓疾病症状进展的药物,诸如控制痉挛、疼痛和吞咽功能。药物诸如可以降低als患者脑内较高水准的谷氨酸盐的利鲁唑(riluzole(rilutek))以及可以减轻与als相关的日常功能下降的依达拉奉(edaravone(radicava)),已经减缓或减轻了一些患者的疾病进展,但并未在全部患者中持续一定时间。[1815]迄今为止,现有用于治疗als的药物、疗法和策略取得了有限的成功。因此,迫切需要新颖组合和方法来治疗als患者以及减轻、改善和/或缓解与该疾病相关的症状和毁灭性的衰弱。[1816]脊髓和延髓肌萎缩症与雄激素受体(ar)[1817]脊髓和延髓肌萎缩症(sbma,也称为甘乃迪病)是x-连锁的、成人发病的运动神经元疾病,以延髓和四肢肌肉的进行性虚弱为特征。sbma患者经历面部肌肉虚弱、吞咽苦难,并且在该疾病发作后20至30年内依赖轮椅。sbma是cag-聚谷氨酸扩张疾病家族的成员,该疾病家族包括亨廷顿和七种脊髓小脑共济失调症。cag扩张的长度与发病年龄成反比,即,扩张越长,发病越早。在sbma中,cag重复序列长度也与运动和感觉神经传导异常相关。[1818]sbma受体扩张处于雄激素受体(ar)基因的第一外显子中。雄激素受体是核受体,在正常情况下,其调节配体结合后的基因表达。在人类中,该疾病基因的杂合女性载体通常无症状,甚至纯合女性也仅具有极轻的症状。sbma疾病的表现是由于突变的雄激素受体中功能的配体依赖性毒性获得所致。迄今为止,没有可用的针对sbma的有效疗法。因此,需要预防或改善神经功能的进行性丧失的治疗sbma患者的方法。[1819]剪接受体碱基编辑和外显子剪接[1820]本文提出本文所述的碱基编辑器系统及其使用方法,该系统包括脱氨酶(例如,腺苷脱氨酶诸如abe8,或胞苷脱氨酶),用于突变与疾病相关基因或致病基因(诸如与als相关的sod1基因或其突变形式)的剪接受体内的一个或多个靶标核苷酸(dna碱基)。通过编辑疾病相关基因的剪接受体中的核碱基,本文所述的碱基编辑器系统和方法调控基因剪接(一种关键生物过程,借助该过程,前体信使rna(pre-mrna)通过移除内含子序列而成熟),从而导致外显子并置以在翻译为成熟蛋白质之前形成成熟的转录物。剪接受体(或剪接受体位点)在本领域中称为经典核苷酸序列“ag”,其位于基因的内含子核酸序列的3'末端和外显子(外显子核酸序列)的5'处。在一种实施方案中,该基因是sod1,其编码sod1酶蛋白。在一种实施方案中,外显子是sod1基因的外显子3,并且剪接受体ag接近sod1基因的外显子3的5'末端。(图2)。[1821]rna剪接是一种rna加工形式,其中,新作成的前体信使rna(pre-mrna)转录物被转化为成熟的信使rna(mrna)。在剪接期间,内含子(基因组dna或基因中的非编码核酸序列)被移除,并且外显子(核酸序列中的基因编码区)被并置在一起。对于核编码的基因,剪接发生在细胞核内,或在转录期间发生或在转录后立即发生。对于含有内含子的真核生物基因,一般需要进行剪接,以便产生可以翻译为蛋白质的成熟mrna分子。对于很多真核生物内含子,剪接在一系列由剪接体,即,核内小核糖核蛋白(snrnps)催化的反应中完成。剪接体的组装和活性在pre-mrna的转录期间发生。snrnp的rna组分与内含子相互作用并且牵涉到催化中。也存在能够催化自其亲本rna分子自我切除的自剪接内含子或核糖体。[1822]外显子剪接期间的一个必要步骤是被定义外显子和内含子的高度保守的核酸序列的剪接体机构识别。更具体地,几乎每一个位于基因的外显子之前的内含子的5′末端都以经典或共有的“gt”核酸序列(称为“供体序列”)开始并且以经典或共有的“ag”核酸序列(称为“受体序列”)结束;核心供体和受体核酸序列(位点)牵涉到通过剪接掉内含子的蛋白复合物(剪接体)进行的基因转录和识别中,从而将基因的外显子并置以产生完全基因转录物。根据本文所述的系统和方法,中断基因组dna中外显子的剪接受体位点内的“ag”核酸序列的突变可以导致必需蛋白质的不当剪接,使得一个或多个外显子的正常转录也被中断,从而在一些情况下阻止该外显子并入该基因的成熟转录物中。在一种实施方案中,通过本文所述的碱基编辑器系统和方法将靶标“ag”受体序列的腺苷有效地转化为鸟苷,这产生异常受体序列并且造成mrna剪接的中断。共有剪接受体序列中的变异可能造成氨基酸的插入或缺失,或者造成最终被翻译为蛋白质的mrna的阅读框的中断。[1823]在特定实施方案中,本文所述的碱基编辑系统和方法以精确的方式突变与als相关的sod1基因外显子3的5'处的ag碱基受体中的核碱基,从而造成该基因转录期间的剪接中断。这进而导致改变的或替代性的sod1转录产物(基因转录物),并最终导致中断的sod1基因产物,例如,产生与全长度的、未中断的基因产物相比截短的sod1蛋白。随着pre-mrna转录物被加工,中断的或替代性剪接可能在导致基因的某些外显子被不当转录和/或从成熟转录物中排除。在正常情况下,替代性剪接提供对于蛋白质亚型表达的时间和组织特异性控制,因此在生物学复杂性和发育中发挥关键作用。如通过本文所述碱基编辑系统和方法提供的导致替代性剪接的对于剪接受体的分子编辑提供了一种有优势的分子工具,其中基因转录可以被选择性地中断,并且基因的某些外显子,在一些情况下,含有突变的外显子,得以特异性地避免或者从成熟的转录物中排除。所得蛋白质可能具有降低的功能或没有功能。在一些实施方案中,通过本文所述的剪接中断产生的替代性转录物可以被降解,或者可以导致本身被分子机构降解的片段或缩短的蛋白质。[1824]本文所述的系统和方法可用于影响基因剪接并且调控由给定基因编码的一种或多种基因产物的平衡。本文所述的多核苷酸可编程dna碱基编辑器系统和方法通过特异性地靶向剪接受体位点并将变化引入外显子的基因组dna(gdna)中以改变该gdna,对基因的选定外显子5'的剪接受体进行精确突变,从而实现了转录物剪接的中断。在一种实施方案中,该基因是编码sod1酶的sod1基因,该基因在运动神经元细胞中的毒性过表达与als有关。人sod1基因的编码序列含有5个外显子,它们在sod1基因组序列中描述如下:外显子1涵盖sod1基因组多核苷酸序列的核苷酸149至220;外显子2涵盖核苷酸4169至4265;外显子3涵盖核苷酸6828至6897;外显子4涵盖核苷酸7637至7754;并且外显子5涵盖核苷酸8850至8957。[1825]在一种实施方案中,位于sod1基因外显子3的5'处的“ag”核酸剪接受体位点的“a”核苷酸被该系统的脱氨酶靶向并且被精确地转化为“g”核苷酸。在一个实施方案中,脱氨酶是腺苷脱氨酶。在一个实施方案中,腺苷脱氨酶是abe8。在实施方案中,如本文所述,abe8是abe8.1至abe8.14,或abe7.10。在一种实施方案中,位于sod1基因外显子1的5'处的“ag”核酸剪接受体的“a”核苷酸被靶向以中断sod1转录物的剪接。在一种实施方案中,位于sod1基因外显子2的5'处的“ag”核酸剪接受体的“a”核苷酸被靶向以中断sod1转录物的剪接。在一种实施方案中,位于sod1基因外显子4的5'处的“ag”核酸剪接受体的“a”核苷酸被靶向以中断sod1转录物的剪接。在一种实施方案中,位于sod1基因外显子5的5'处的“ag”核酸剪接受体的“a”核苷酸被靶向以中断sod1转录物的剪接。[1826]治疗方法[1827]还提供了治疗疾病或病症和/或造成该疾病或病症的基因突变的方法。这些方法包括向受试者(例如,哺乳动物,诸如人)给药治疗有效量的药物组合物,该药物组合物包含编码本文所述碱基编辑器系统(例如,碱基编辑器和grna)的多核苷酸。在一些实施方案中,碱基编辑器是融合蛋白,其包含napdnabp结构域和腺苷脱氨酶结构域或胞苷脱氨酶结构域。用该碱基编辑器和一种或多种向导多核苷酸转导受试者的细胞,该向导多核苷酸将该碱基编辑器靶向感兴趣的基因中的含有突变的核酸序列以实现该核酸序列的a·t到g·c改变(如果用腺苷脱氨酶结构域转导细胞)或c·g到u·a改变(如果用胞苷脱氨酶结构域转导细胞)。[1828]本文的方法包括向受试者(包括被鉴定为需要此治疗的受试者,或易处于疾病风险下并且需要此治疗的受试者)给药有效量的本文所述组合物。证实受试者需要此治疗可为专业医护人员对受试者的判断,且可以是主观的(例如,观点)或客观的(例如,通过测试或诊断方法可测)。[1829]通常,治疗方法包括给药治疗有效量的药物组合物,该药物组合物包含例如编码碱基编辑器和grna的载体,该grna靶向有需要的受试者(例如,人类患者)的感兴趣的基因。此治疗将被适当地给予苦于、患有、易患疾病或病症或处于该疾病或病症风险下的受试者,尤其是人类受试者。[1830]在一种实施方案中,本发明提供监测治疗进展的方法。该方法包括以下步骤:确定苦于或易患疾病、疾患或其症状的受试者体内的诊断性标记物(标记物)(例如,与疾病或病症相关的snp)或诊断性措施(例如,扫描、测定)的水准,其中该受试者已经被给药足以治疗该疾病或其症状的治疗量的本文的组合物。可以将该方法中确定的标记物水准与健康的正常对照或其他被折磨的患者中的已知标记物水准进行比较,以建立该受试者的疾病状态。在优选实施方案中,在晚于确定第一水准的时间点确定该受试者体内的第二水准,并且比较两个水准以监测病程或疗效。在某些优选实施方案中,在开始根据本发明进行治疗之前确定受试者体内标记物的治疗前水准;然后可以将这一标记物的治疗前水准与治疗开始之后该受试者体内的标记物水准进行比较,以确定治疗的效力。[1831]在一些实施方案中,细胞获自该受试者并且与本文提供的药物组合物接触。在一些实施方案中,从受试者移除并且以离体方式与药物组合物接触的细胞被重新引入该受试者体内,任选地在所希望的基因组修饰已经实现或在该细胞中被检测到之后进行。递送包含核酸酶的药物组合物的方法在例如美国专利号6,453,242、6,503,717、6,534,261、6,599,692、6,607,882、6,689,558、6,824,978、6,933,113、6,979,539、7,013,219和7,163,824中描述,全部专利的公开内容通过引用而以其整体并入本文。尽管本文提供的药物组合物说明原则上针对适用于给药至人类的药物组合物,但熟练技师应理解,此类组合物通常适用于给药至所有动物或生物体,例如,用于兽用。[1832]本文提供了使用本文所述的碱基编辑器系统或碱基编辑器蛋白治疗疾病或疾患的方法。任选地,本文所述的碱基编辑器系统可以与一种或多种其他治疗合用。在一方面,本文提供了通过给药本文所述的碱基编辑器来治疗有需要的受试者的肌萎缩性脊髓侧索硬化症(als)的方法。在一方面,本文提供了通过给药本文所述的碱基编辑器来治疗有需要的受试者的脊髓和延髓肌萎缩症(sbma)的方法。[1833]个体受试者中的回应可以表征为完全缓解、部分缓解或疾病稳定。在一些实施方案中,该回应是部分缓解(pr)。在一些实施方案中,该回应是完全缓解(cr)。在一些实施方案中,该回应导致该受试者的无进展生存(例如,疾病稳定)。[1834]在一些实施方案中,该治疗导致人类受试者的生存时间比如果该人类受试者不使用该化合物进行治疗时该人类受试者的预期生存时间增加。[1835]在一些实施方案中,待使用所述方法进行治疗的人类受试者是儿童(例如,年龄为0至18岁)。在其他实施方案中,待使用所述方法进行治疗的人类受试者是成人(例如,年龄大于18岁)。[1836]治疗肌萎缩性脊髓侧索硬化症(als)的方法[1837]本文提供了治疗肌萎缩性脊髓侧索硬化症(als)及其症状的方法,该方法通过下述进行:对与als相关的基因诸如超氧化物歧化酶1(sod1)基因内含子中的保守剪接受体位点进行精确碱基编辑,以中断或灭活受试者(例如,哺乳动物受试者或人类受试者)中sod1基因的外显子之间的内含子序列的正常剪接,从而中断或抑制sod1基因外显子转录期间的正常剪接,并进而产生不正常的和/或非功能性的例如截短的sod1酶。剪接中断可以减少或消除该受试者运动神经与中由sod1基因编码的sod1酶的正常或功能性表达。在一种实施方案中,受试者是人类患者。在特定实施方案中,受试者是罹患als的人类患者。这些方法涉及向受试者(例如,哺乳动物,诸如人或患有als的人)给药治疗有效量的药物组合物,该药物组合物包含编码本文所述碱基编辑器系统(例如,碱基编辑器和grna)的多核苷酸。在一些实施方案中,碱基编辑器是融合蛋白,其包含多核苷酸可编程dna结合结构域和腺苷脱氨酶结构域。在一些实施方案中,碱基编辑器是融合蛋白,其包含多核苷酸可编程dna结合结构域和胞苷脱氨酶结构域。用碱基编辑器和一种或多种向导多核苷酸转导受试者的细胞(例如,运动神经元或cns细胞),该向导多核苷酸将该碱基编辑器靶向含有剪接受体序列(ag)的内含子核酸序列以实现该核酸序列的a到g改变(如果用腺苷脱氨酶结构域转导细胞)或c到u改变(如果用包含脱氨酶结构域转导细胞),该剪接受体序列位于该基因的外显子核酸序列的5',诸如位于sod1基因外显子3的5'的剪接受体序列,如本文实施例1中所述。[1838]本文的方法包括向受试者(包括被鉴定为需要此治疗的受试者,或易处于疾病风险下并且需要此治疗的受试者)给药有效量的本文所述组合物。证实受试者需要此治疗可为专业医护人员对受试者的判断,且可以是主观的(例如,观点)或客观的(例如,通过测试或诊断方法可测)。[1839]通常,治疗方法包括给药治疗有效量的药物组合物,该药物组合物包含例如编码碱基编辑器和grna的载体,该grna靶向有需要的受试者(例如,人类患者)的邻近疾病相关或致病基因外显子(例如,sod1基因外显子3)(或位于其5')的剪接受体位点。此治疗将被适当地给予苦于、患有、易患als或处于als风险下的受试者,尤其是人类受试者。本文的组合物也可用于治疗可能涉及als的任何其他疾患。[1840]在一种实施方案中,提供了监测治疗进展的方法。该方法包括以下步骤:确定苦于或易患与als相关的疾患或其症状的受试者体内的诊断性标记物(标记物)(例如,与als相关的snp)或诊断性措施(例如,扫描、测定)的水准,其中该受试者已经被给药足以治疗该疾病或其症状的治疗量的本文的组合物。可以将该方法中确定的标记物水准与健康的正常对照或其他被折磨的患者中的已知标记物水准进行比较,以建立该受试者的疾病状态。在优选实施方案中,在晚于确定第一水准的时间点确定该受试者体内的第二水准,并且比较两个水准以监测病程或疗效。在某些优选实施方案中,在开始根据本发明进行治疗之前确定受试者体内标记物的治疗前水准;然后可以将这一标记物的治疗前水准与治疗开始之后该受试者体内的标记物水准进行比较,以确定治疗的效力。[1841]在一些实施方案中,细胞(诸如运动神经元细胞或cns细胞)获自该受试者并且与本文提供的药物组合物接触。在一些实施方案中,从受试者移除并且以离体方式与药物组合物接触的细胞被重新引入该受试者体内,任选地在所希望的基因组修饰已经被影响或在该细胞中被检测到之后进行。递送包含核酸酶的药物组合物的方法在例如美国专利号6,453,242、6,503,717、6,534,261、6,599,692、6,607,882、6,689,558、6,824,978、6,933,113、6,979,539、7,013,219和7,163,824中描述,全部专利的公开内容通过引用而以其整体并入本文。尽管本文提供的药物组合物说明原则上针对适用于给药至人类的药物组合物,但熟练技师应理解,此类组合物通常适用于给药至所有动物或生物体,例如,用于兽用。[1842]该受试者可能表现出一种或多种als症状的改善。在一个实施方案中,一种或多种症状的改善为至少5%。在另一实施方案中,一种或多种症状的改善为至少10%。在另一实施方案中,一种或多种症状的改善为至少15%。在另一实施方案中,一种或多种症状的改善为至少20%。在另一实施方案中,一种或多种症状的改善为至少25%。在另一实施方案中,一种或多种症状的改善为至少30%。在另一实施方案中,一种或多种症状的改善为至少35%。在另一实施方案中,一种或多种症状的改善为至少40%。在另一实施方案中,一种或多种症状的改善为至少50%。在另一实施方案中,一种或多种症状的改善为至少60%。在另一实施方案中,一种或多种症状的改善为至少70%。在另一实施方案中,一种或多种症状的改善为至少75%。在另一实施方案中,一种或多种症状的改善为至少80%。在另一实施方案中,一种或多种症状的改善为至少85%。在另一实施方案中,一种或多种症状的改善为至少90%。在另一实施方案中,一种或多种症状的改善为至少95%。[1843]治疗脊髓延髓肌肉萎缩症(sbma)的方法[1844]还提供了治疗sbma的方法,其包括向受试者(例如,哺乳动物,诸如人)给药治疗有效量的药物组合物,该药物组合物包含编码本文所述碱基编辑器系统(例如,碱基编辑器和grna)的多核苷酸。在一些实施方案中,碱基编辑器是融合蛋白,其包含多核苷酸可编程dna结合结构域和腺苷脱氨酶结构域或胞苷脱氨酶结构域。用该碱基编辑器和一种或多种向导多核苷酸转导受试者的细胞,该向导多核苷酸将该碱基编辑器靶向ar基因中的含有突变的核酸序列以实现该核酸序列的a·t到g·c改变(如果用腺苷脱氨酶结构域转导细胞)或c·g到u·a改变(如果用胞苷脱氨酶结构域转导细胞)。[1845]本文的方法包括向受试者(包括被鉴定为需要此治疗的受试者,或易处于疾病风险下并且需要此治疗的受试者)给药有效量的本文所述组合物。证实受试者需要此治疗可为专业医护人员对受试者的判断,且可以是主观的(例如,观点)或客观的(例如,通过测试或诊断方法可测)。[1846]通常,治疗方法包括给药治疗有效量的药物组合物,该药物组合物包含例如编码碱基编辑器和grna的载体,该grna靶向有需要的受试者(例如,人类患者)的包含三核苷酸重复序列扩张的突变ar基因。此治疗将被适当地给予苦于、患有、易患sbma或处于sbma风险下的受试者,尤其是人类受试者。本文的组合物也可用于治疗可能涉及ar中三核苷酸重复序列扩张的任何其他疾患。[1847]在一种实施方案中,提供了监测治疗进展的方法。该方法包括以下步骤:确定苦于或易患与sbma相关的疾患或其症状的受试者体内的诊断性标记物(标记物)(例如,ar多肽水准)或诊断性措施(例如,扫描、测定)的水准,其中该受试者已经被给药足以治疗该疾病或其症状的治疗量的本文的组合物。可以将该方法中确定的标记物水准与健康的正常对照或其他被折磨的患者中的已知标记物水准进行比较,以建立该受试者的疾病状态。在优选实施方案中,在晚于确定第一水准的时间点确定该受试者体内的第二水准,并且比较两个水准以监测病程或疗效。在某些优选实施方案中,在开始根据本发明进行治疗之前确定受试者体内标记物的治疗前水准;然后可以将这一标记物的治疗前水准与治疗开始之后该受试者体内的标记物水准进行比较,以确定治疗的效力。[1848]该受试者可能表现出一种或多种sbma症状的改善。在一个实施方案中,一种或多种症状的改善为至少5%。在另一实施方案中,一种或多种症状的改善为至少10%。在另一实施方案中,一种或多种症状的改善为至少15%。在另一实施方案中,一种或多种症状的改善为至少20%。在另一实施方案中,一种或多种症状的改善为至少25%。在另一实施方案中,一种或多种症状的改善为至少30%。在另一实施方案中,一种或多种症状的改善为至少35%。在另一实施方案中,一种或多种症状的改善为至少40%。在另一实施方案中,一种或多种症状的改善为至少50%。在另一实施方案中,一种或多种症状的改善为至少60%。在另一实施方案中,一种或多种症状的改善为至少70%。在另一实施方案中,一种或多种症状的改善为至少75%。在另一实施方案中,一种或多种症状的改善为至少80%。在另一实施方案中,一种或多种症状的改善为至少85%。在另一实施方案中,一种或多种症状的改善为至少90%。在另一实施方案中,一种或多种症状的改善为至少95%。[1849]药物组合物[1850]本公开的其他方面涉及药物组合物,其包含本文所述的任何碱基编辑器、融合蛋白或融合蛋白-向导多核苷酸复合物。在一些实施方案中,药物组合物进一步包含药学可接受的载剂。在一些实施方案中,药物组合物包含额外试剂(例如,用于特异性递送、增加半衰期或其他治疗性化合物)。[1851]合适的药学上可接受的载剂通常包含惰性物质,这些惰性物质辅助将药物组合物给药至受试者,辅助将药物组合物加工为可递送的制剂,或者在给药之前辅助储存药物组合物。药学上可接受的载剂可以包括能够稳定化、优化或以其他方式改变制剂的形式、一致性、粘度、ph、药代动力学、溶解性的试剂。[1852]可用作药学上可接受的载剂的材料的一些非限制性示例包括:(1)糖类,诸如乳糖、葡萄糖和蔗糖;(2)淀粉类,诸如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,诸如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素;(4)黄蓍粉;(5)麦芽;(6)明胶;(7)润滑剂,诸如硬脂酸镁、十二烷基硫酸钠和滑石;(8)赋形剂,诸如可哥脂和栓蜡;(9)油类,诸如花生油、棉籽油、葵花籽油、芝麻油、橄榄油、玉米油和大豆油;(10)二醇类,诸如丙二醇;(11)多元醇类,诸如甘油、山梨醇、甘露醇和聚乙二醇(peg);(12)酯类,诸如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,诸如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等张盐水;(18)ringer溶液;(19)乙醇;(20)ph缓冲溶液;(21)聚酯类、聚碳酸酯类和/或聚酐类;(22)填充剂,诸如多肽和氨基酸;(23)血清醇类,诸如乙醇;和(23)其他用于药物制剂中的无毒相容物质。缓冲剂、润湿剂、乳化剂、稀释剂、成胶囊剂、皮肤渗透剂、着色剂、释放剂、包衣剂、甜味剂、风味剂、芳香剂、防腐剂和抗氧化剂也可以存在于制剂中。例如,载剂可以包括但不限于,盐水、缓冲盐水、葡萄糖、精氨酸、蔗糖、水、甘油、乙醇、山梨醇、葡聚糖、羧甲基纤维素钠及其组合。[1853]药物组合物可以包含一种或多种ph缓冲化合物以将制剂的ph维持在预定水准,该水准反映了生理ph,诸如约5.0至约8.0的范围内。水性液体制剂中使用的ph缓冲化合物可以是氨基酸或氨基酸的混合物,诸如组氨酸或者氨基酸的混合物诸如组氨酸和甘氨酸。作为另一种选择,ph缓冲化合物优选为将制剂的ph维持在预定水准(诸如约5.0至约8.0的范围内)并且不螯合钙离子的试剂。此类ph缓冲化合物的说明性示例包括但不限于,咪唑和醋酸根离子。ph缓冲化合物可能以任何适于将制剂的ph维持在预定水准的量存在。[1854]药物组合物也可以含有一种或多种渗透调节剂的化合物,即,将制剂的渗透性质(例如,紧张性、渗透性和/或渗透压)调节至接纳者个体的血流和血细胞可以接受的水准。渗透调节剂可以是不螯合钙离子的试剂。渗透调节剂可以是本领域技术人员已知或可获得的调节制剂的渗透性质的任何化合物。本领域技术人员可以经验性地确定给定渗透调节剂用于本发明制剂中的适用性。合适类型的渗透调节剂的说明性示例包括但不限于:盐类,诸如氯化钠和醋酸钠;糖类,诸如蔗糖、葡萄糖和甘露醇;氨基酸,诸如甘氨酸;以及一种或多种这些试剂的混合物和/或一种或多种这些类型的试剂的混合物。渗透调节剂可能以足以调节制剂的渗透性质的任何浓度存在。[1855]在一些实施方案中,将药物组合物配制为用于递送至受试者以例如进行基因编辑。在一些实施方案中,本文设想的药物组合物的给药可以使用传统技术实施,该传统技术包括但不限于,输注、输液或肠胃外给药。在一些实施方案中,肠胃外给药包括血管内、静脉内、肌肉内、动脉内、鞘内、肿瘤内、皮内、腹膜内、经气管、皮下、表皮下、关节内、被膜下、蛛网膜下和胸骨内输液或注射。在一些实施方案中,给药本文所述药物组合物的合适途径包括而不限于:外用、皮下、透皮、皮内、病灶内、关节内、腹膜内、膀胱内、跨粘膜、齿龈、皮内、耳蜗内、经鼓膜、器官内、硬膜外、鞘内、肌肉内、静脉内、血管内、骨内、眼周、肿瘤内、脑内和脑室内给药。[1856]在一些实施方案中,将本文所述的药物组合物局部给药至病变位元点(例如,肿瘤位点)。在一些实施方案中,通过注射、通过导管、通过栓剂、或通过植入物将本文所述的药物组合物给药至受试者,该植入物是多孔的、无孔的或凝胶状材料,包括膜(诸如硅橡胶膜)或纤维。[1857]在其他实施方案中,将本文所述的药物组合物以控制释放系统的方式递送。在一个实施方案中,可以使用泵(参见,例如,langer,1990,science249:1527-1533;sefton,1989,crccrit.ref.biomed.eng.14:201;buchwald等人,1980,surgery88:507;saudeketal,1989,n.engl.j.med.321:574)。在另一实施方案中,可以使用聚合材料。(参见,例如,medicalapplicationsofcontrolledrelease(langer和wise编,crcpress,bocaraton,fla.,1974);controlleddrugbioavailability,drugproductdesignandperformance(smolen和ball编,wiley,newyork,1984);rangerandpeppas,1983,macromol.sci.rev.macromol.chem.23:61。也参见,levy等人,1985,science228:190;during等人,1989,ann.neurol.25:351;howardetah,1989,j.neurosurg.71:105。)例如,在上文的langer文献中讨论了其他控制释放系统。[1858]在一些实施方案中,根据常规过程将药物组合物配制为适用于静脉内或皮下给药至受试者(例如,人)的组合物。在一些实施方案中,用于通过注射给药的药物组合物是无菌等渗溶液,用作增溶剂和局部麻醉剂(诸如利多卡因)以缓解注射部位的疼痛。通常,成分或单独供给或混合在一起以单位剂量形式供给,例如,作为干燥冻干粉或无水浓缩物在指示活性剂数量的密封容器诸如安瓿或小袋内供给。若药物待通过输液给药,它可以与装有无菌药用级水或生理盐水的输液瓶配给。若药物组合物待通过注射给药,可提供无菌注射用水或盐水的安瓿,使得成分可以在给药之前混合。[1859]用于全身给药的药物组合物可以是液体,例如,无菌盐水、乳酸和林格溶液或汉克溶液。此外,药物组合物可以是固体形式并且在再溶解或悬浮后立即使用。也考虑了冻干形式。药物组合物可以包含在液体颗粒或媒介物诸如脂质体或微晶体中,这也适用于肠胃外给药。颗粒可以是任何合适的结构,诸如单层的或多层的,只要组合物被包含在其中即可。化合物可以包埋在“稳定化的质粒-脂质颗粒”(splp)中,该颗粒含有促进融合的脂质二油酰基磷脂酰乙醇胺(dope)、低水准(5-10mol%)的阳离子脂质,并且由聚乙二醇(peg)包衣稳定化(zhangy.p.etah,genether.1999,6:1438-47)。对于此类颗粒和媒介物,带正电的脂质诸如n-[l-(2,3-二油酰氧基)丙基]-n,n,n-三甲基-铵乙磺酸盐或“dotap”为尤其优选。此类脂质颗粒的制备是众所周知的。参见例如,美国专利号4,880,635、4,906,477、4,911,928、4,917,951、4,920,016和4,921,757,其各自通过引用并入本文。[1860]例如,本文所述的药物组合物可以作为单位剂量给药或包装。当用于本公开的药物组合物时,术语“单位剂量”是指适合作为单一剂量用于受试者的物理离散单元,每个单元含有经计算以产生所希望的疗效的预定数量的活性成分,该活性成分与所需的稀释剂(即,载体或媒介物)合用。[1861]再者,药物组合物可以提供为药物试剂盒,其包含(a)含有冻干形式的本发明化合物的容器和(b)含有药学可接受的稀释剂(例如,用于冻干的本发明化合物的筹够或稀释的无菌稀释剂)的第二容器。与此类容器任选地关联的可以是由政府机构规定的调节药物或生物产品的制造、使用或规格形式的注意事项,该注意事项反映了该机构批准的用于人类给药的制造、使用或规格。[1862]在其他方面,包括含有上述可用于治疗疾病的物质的制品。在一些实施方案中,该制品包含容器和标签。合适的容器包括,例如,瓶、小瓶、注射器和试管。容器可由各种材料诸如玻璃或塑胶制成。在一些实施方案中,该容器容纳本文所述的对于治疗疾病有效的组合物并且可以具有无菌介面。例如,容器可以是静脉注射溶液袋或具有可被皮下注射针刺穿的塞子的小瓶。组合物中的活性剂是本发明的化合物。在一些实施方案中,位于容器上或与容器关联的标签指示该组合物用于治疗所选择的疾病。该制品可以进一步包含第二容器,该第二容器包含药学上可接受的缓冲剂,诸如磷酸盐缓冲盐水、ringer溶液或葡萄糖溶液。其可进一步包括从商业和使用者角度所需的其他材料,包括其他缓冲剂、稀释剂、筛检程式、针头、注射器和具有使用说明书的包装插页。[1863]在一些实施方案中,提供任何融合蛋白、grna和/或本文所述的复合物作为药物组合物的一部分。在一些实施方案中,药物组合物包含任何本文所述的融合蛋白。在一些实施方案中,药物组合物包含任何本文所述的复合物。在一些实施方案中,药物合物包含和碳核蛋白复合物,该复合物包含与grna和阳离子脂质形成复合物的rna引导的核酸酶(例如cas9)。在一些实施方案中,药物组合物包含grna、核酸可编程dna结合蛋白、阳离子脂质和药学可接受的赋形剂。药物组合物可以任选地包含一种或多种额外的治疗活性物质。[1864]在一些实施方案中,将本文提供的组合物给药至受试者例如人类受试者,以便实现该受试者体内的靶向基因组修饰。在一些实施方案中,细胞获自该受试者并且与本文提供的任何药物组合物接触。在一些实施方案中,从受试者移除并且以离体方式与药物组合物接触的细胞被重新引入该受试者体内,任选地在所希望的基因组修饰已经实现或在该细胞中被检测到之后进行。递送包含核酸酶的药物组合物的方法是已知的,并且在例如美国专利号6,453,242、6,503,717、6,534,261、6,599,692、6,607,882、6,689,558、6,824,978、6,933,113、6,979,539、7,013,219和7,163,824中描述,其公开内容通过引用而以其整体并入本文。尽管本文提供的药物组合物说明原则上针对适用于给药至人类的药物组合物,但熟练技师应理解,此类组合物通常适用于给药至所有动物或生物体,例如,用于兽用。[1865]为了使适用于给药至人类的药物组合物适用于给药至各种动物而对该药物组合物进行的修饰是很好理解的,并且一般熟练的兽医药理学家可仅通过(如果需要)普通实验设计和/或执行此类修饰。考虑对其给药药物组合物的受试者包括但不限于,人类和/或其他灵长动物;哺乳动物、驯养动物、宠物和商业相关的哺乳动物诸如牛、猪、马、绵羊、猫、狗、小鼠和/或大鼠;和/或鸟类,包括商业相关的鸟类诸如鸡、鸭、鹅和/或火鸡。[1866]本文所述药物组合物的制剂可以通过任何已知的或制药领域此后开发的方法制备。通常,此类制备方法包括以下步骤:将活性成分带至与赋形剂和/或一种或多种其他辅助成分关联,随后,若必要和/或希望,成形并且/或将产品包装在所希望的单或多计量单位中。药物制剂可以额外地包含药学可接受的赋形剂,如本文所用,赋形剂包括任何和全部溶剂、分散介质、稀释剂、或其他液体媒介物d、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂、固体粘合剂、润滑剂等,适用于所希望的颗粒剂型。《雷明顿药物可系与实践(第二十一版)(remington’sthescienceandpracticeofpharmacy,21stedition,a.r.gennaro)(lippincott,williams&wilkins,baltimore,md,2006;通过引用以其整体并入本文)公开了用于配制药物组合物的各种赋形剂和用于制备药物组合物的已知技术。关于其他合适的用于生产包含核酸酶的药物组合物的方法、试剂、赋形剂和溶剂也参见通过引用以其整体并入本文的pct申请pct/us2010/055131(公布号wo2011/053982a8,2010年11月2日递交)。[1867]除非任何常规赋形剂介质与物质或其衍生物不相容,诸如通过产生任何不希望的生物效果或者以有害方式与药物组合物的任何其他组分相互作用,否则其用途预期处于本公开的范畴内。[1868]上述组合物可以以有效量给药。有效量将取决于给药模式、所治疗的具体病症和所希望的结果。它也可以取决于病症的阶段、受试者的年龄和身体情况、同期疗法的属性(如果有)等医疗从业者众所周知的因素。对于治疗性应用,它是足以实现医疗上希望的结果的量。[1869]在一些实施方案中,根据本发明的组合物可以用于治疗多种疾病、疾患和/或病症中的任一种。在一些实施方案中,根据本公开的组合物可以用于治疗als。在一些实施方案中,根据本公开的组合物可以用于治疗sbma。[1870]试剂盒[1871]本公开的多个方法提供包含碱基编辑器系统的试剂盒。在一种实施方案中,试剂盒包含核酸构建体,该核酸构建体包含编码核碱基编辑器融合蛋白的核苷酸序列。融合蛋白包含脱氨酶(例如,胞苷脱氨酶或腺嘌呤脱氨酶)和核酸可编程dna结合蛋白(napdnabp)。在一些实施方案中,试剂盒包含至少一种能够靶标感兴趣的核酸分子的向导rna。在一些实施方案中,感兴趣的核酸分子是位于sod1基因的外显子核酸序列(例如,外显子3)之前的内含子核酸序列中的剪接受体位点(例如,ag位点)。在一些实施方案中,试剂盒包含至少一种向导rna,该向导rna能够靶向包含三核苷酸重复序列扩张的ar多核苷酸。在一些实施方案中,试剂盒包含核酸构建体,该核酸构建体包含编码至少一种向导rna的核苷酸序列。[1872]在一些实施方案中,试剂盒提供关于使用该试剂盒来编辑一种或多种突变的使用说明书。在一些实施方案中,试剂盒提供关于使用该试剂盒来编辑位于sod1基因的外显子(例如,外显子3)的5'处的剪接受体的使用说明书。在一些实施方案中,试剂盒提供关于使用该试剂盒将提前终止密码子引入ar多核苷酸中的使用说明书。在其他上岸中,试剂盒提供关于使用该试剂盒来中断ar多核苷酸中的剪接位点的使用说明书。使用说明书通常将包括关于该试剂盒用于编辑核酸分子的用途的资讯。在其他实施方案中,使用说明书包括以下项中的至少一项:注意事项;警告;临床研究;和/或参考文献。使用说明书可直接印在容器(当存在时)上,或作为用于该容器的标签,或作为独立的页、册、卡或折迭式印刷品提供在给容器内或与该容器一起提供。在其他实施方案中,试剂盒可以包含关于合适的指令引数的标签或独立插页(包装插页)形式的使用说明书。在又一实施方案中,试剂盒可以包含一个或多个带有适宜的正对照和负对照或对照样品的容器,该对照或对照样品待作为标准品用于检测、校准或归一化。试剂盒可以进一步包含第二容器,该第二容器包含药学上可接受的缓冲剂,诸如(无菌)磷酸盐缓冲盐水、ringer溶液或葡萄糖溶液。其可进一步包括从商业和使用者角度所需的其他材料,包括其他缓冲剂、稀释剂、筛检程式、针头、注射器和具有使用说明书的包装插页。[1873]在某些实施方案中,试剂盒可用于治疗患有als的受试者。在某些实施方案中,试剂盒可用于治疗患有sbma的受试者。[1874]除非明确指定,否则本发明的实践采用传统的分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学技术,这些技术处于该领域技术人员的知识范围内。此类技术在文献中完整地诠释,如,《分子克隆:实验室手册(第二版)》(molecularcloning:alaboratorymanual,secondedition,(sambrook,1989));《寡核苷酸合成》(oligonucleotidesynthesis(gait,1984));《动物细胞培养》(animalcellculture(freshney,1987));《实验免疫学手册》的《酶学方法》(methodsinenzymologyhandbookofexperimentalimmunology(weir,1996));《用于哺乳动物细胞的转基因载体》(genetransfervectorsformammaliancells(millerandcalos,1987));和《分子生物学现代方法》(currentprotocolsinmolecularbiology”(ausubel,1987));《pcr:聚合酶链反应》(pcr:thepolymerasechainreaction,(mullis,1994));《免疫学现代方法》(currentprotocolsinimmunology(coligan,1991))。这些技术可用来生产本发明的多核苷酸和多肽,且因此可在作成并实践本发明中考虑这些技术。尤其可用于特定实施方式的技术将在下文中讨论。[1875]提出下述实施例以向该领域技术人员提供对于如何制作并使用本发明的测定、筛选和治疗方法的完全公开和说明,但并不试图限制发明人所认定的发明范畴。[1876]实施例[1877]实施例1:编辑效率增加的腺苷碱基编辑器[1878]包括tad7.10-dcas9融合蛋白的碱基编辑西丙酮能够以大约10-20%的效率编辑靶标多核苷酸,但对于需要更高效率的应用,其用途可能有限。在一种鉴定具有增加的效率和特异性的腺嘌呤碱基编辑器的尝试中,通过易错pcr将包含腺苷脱氨酶tada7.10的构建体诱变,随后克隆到邻近编码dcas9(一种核酸可编程dna结合蛋白)的核酸序列的载体中(图1a)。将包含腺苷脱氨酶变体的表达载体与编码氯霉素耐药性(camr)和大观霉素耐药性(spectr)基因并且具有卡那霉素耐药性基因的选择质粒共转化为感受态细菌细胞,该卡那霉素耐药基因通过两个点突变(进化第7轮策略)变为非功能性的(图1b)。选择细胞进行卡那霉素耐药性的恢复,这是腺苷脱氨酶活性的读出。在后续选择轮次中,将表达载体与编码氯霉素耐药性(camr)和大观霉素耐药性(spectr)基因并且具有卡那霉素耐药性基因的质粒共转化为感受态细胞,该卡那霉素耐药基因通过三个点突变(进化第8轮策略)变为非功能性的(图1c)。灭活的卡那霉素耐药性基因核酸序列提供于下:[1879][1880]在上述序列中,小写字母表示卡那霉素耐药性启动子区域,粗体序列指示靶向失活部分(q4*和w15*),斜体序列表示卡那霉素耐药性基因的靶向失活位点(d208n),而底线序列表示pam序列。[1881]再一次,将细胞接种到具有递增的卡那霉素浓度的一系列琼脂糖板上。如图2中所示,具有有效碱基编辑活性的腺苷脱氨酶变体能够校正卡那霉素耐药性基因中存在的突变,并且被选择进行进一步分析。在细菌细胞中显示有效碱基编辑的腺苷脱氨酶变体碱基编辑器在表13中描述。产生了编码包含所选腺苷脱氨酶变体的碱基编辑器的哺乳动物表达载体。[1882]使用表达含有e6v(也称为e7v)突变的与镰状细胞疾病相关的β-珠蛋白的hek293t细胞测试腺苷脱氨酶变体的编辑效率(图3a和3b)。使用表达碱基编辑系统的慢病毒载体转导这些被称为“hek293t/hbbe6v”细胞的细胞”,该碱基编辑系统包括包含表13中所列的abe8碱基编辑器的融合蛋白。通过将腺苷脱氨酶变体克隆到包括环状高突变的cas9和二分体核定位序列的支架中而产生abe8碱基编辑器。环状高突变的cas9是本领域中已知的,并且在例如oakes等人,cell176,254–267,2019中有所描述。这些序列提供在下文中。[1883]上调胎儿血红蛋白是克服链状细胞疾病的治疗性途径。图3a显示用于上调胎儿血红蛋白的治疗相关位点。在残基5和8处编辑腺苷酸可以显著减少bcl11a结合,从而增加胎儿血红蛋白的表达。参照图3a,abe8碱基编辑器表现出比abe7.10碱基编辑器高大约2至3倍的碱基编辑活性。[1884]表13:新颖的腺苷碱基编辑器abe8[1885][1886][1887]参照图4,将abe8碱基编辑器与靶向编码hbbe6v的多核苷酸的18、19、20、21或22个核苷酸向导rna一起引入hek293t/hbbe6v细胞中。当与环状高突变(cp)-cas9融合时,abe8编辑器显示增加的编辑效率。总之,测试了40种不同的abe8构建体(表14)和三种abe7.10构建体在hek293t/hbbe6v细胞中的编辑效率。示例性构建体的序列如下。为了评估编辑的特异性,监测了靶标以及非预期的或旁观者突变(图5)。密码子5中腺苷的非预期编辑是沉默的。但是,密码子9中的非预期编辑导致了丝氨酸到脯氨酸的突变。再次参照图5,多种abe8碱基编辑器显示了比abe7.10编辑器增加的编辑效率和特异性,并且这些编辑器无一具有导致丝氨酸到脯氨酸错义突变的显著旁观者编辑。[1888]在含有链状细胞突变的成纤维细胞中,对所选的abe8碱基编辑器和abe7.10碱基编辑器对照物进行进一步分析。如图6中所示,abe8编辑器具有比abe7.10增加的碱基编辑活性。abe8.18显示大约70%的效率。所选的abe8编辑器也展示了史无前例的特异性。重要的是,对于全部abe8编辑器,平均插入缺失形成低于0.1%。[1889]表14:[1890][1891][1892][1893][1894]实施例2:用于abe8设计的密码子优化和nls选择[1895]已经证实,cas9密码子选择和核定位元序列可以急剧改变真核细胞中的基因组编辑效率(参见例如,kim,s.等人,rescueofhigh-specificitycas9variantsusingsgrnaswithmatched5'nucleotides.genomebiol18,218,doi:10.1186/s13059-017-1355-3(2017);mikami,m.等人,comparisonofcrispr/cas9expressionconstructsforefficienttargetedmutagenesisinrice.plantmolbiol88,561-572,doi:10.1007/s11103-015-0342-x(2015);jinek,m.等人,rna-programmedgenomeeditinginhumancells.elife2,e00471,doi:10.7554/elife.00471(2013))。碱基编辑器的原始cas9n组分含有六个潜在的多腺苷酸化位点,导致在真核细胞中的表达不佳(参见例如,kim,s.等人,rescueofhigh-specificitycas9variantsusingsgrnaswithmatched5'nucleotides.genomebiol18,218,doi:10.1186/s13059-017-1355-3(2017);komor,a.c.等人,programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage.nature533,420-424,doi:10.1038/nature17946(2016);gaudelli,n.m.等人programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017))。用广泛优化的密码子序列替换这一组分改善了碱基编辑效率(参见例如,cong,l.等人multiplexgenomeengineeringusingcrispr/cassystems.science339,819-823,doi:10.1126/science.1231143(2013);koblan,l.w.等人improvingcytidineandadeninebaseeditorsbyexpressionoptimizationandancestralreconstruction.natbiotechnol,doi:10.1038/nbt.4172(2018);zafra,m.p.等人optimizedbaseeditorsenableefficienteditingincells,organoidsandmice.natbiotechnol,doi:10.1038/nbt.4194(2018))。[1896]评估了与四种abe构建体相关的dna上靶(图9a、9b)、dna脱靶(图9c、9d)和rna脱靶(图9e)碱基编辑频率,这四种构建体全部含有经密码子优化的cas9(d10a):i)abe7.10,其具有单个c端bp-sv40nls;ii)monoabe7.10,其缺少abe7.10的5'tada野生型部分;iii)abemax,其含有经密码子优化的tada区域和两个bpnls序列;以及iv)abemax(-bpnls),其具有如同abemax的tada密码子优化但含有单个c端bp-sv40nls。[1897]四种构建体全部展示了相当类似的上靶编辑效率,表明nls架构和tada密码子优化不是上靶编辑效率的决定因素(图9a、9b)。脱靶情况也高度类似,但当与abe7.10比较时,abemax展示了在一个位点处的显著更大的dna脱靶编辑(p=0.00027,学生双尾t检验)(图9c、9d)。abemax(-nbpnls)展示了比abe7.10大1.6倍的rna脱靶编辑效率均值(图9e)。[1898]实施例3:具有扩张的靶向范围的高级腺嘌呤碱基编辑器[1899]abe是一种分子机构,其包含与催化活性受损的cas9蛋白(d10a切口酶cas9,ncas9)共价融合的进化的大肠杆菌trnaarg修饰酶即tada(图7a和7b)。为了克服先前的腺嘌呤碱基编辑器的局限性,通过设计必须同时进行三个a·t到g·c逆转编辑才能在抗生素选择中存活的abe,增加了细菌选择系统的严格性。在先前abe进化中,通过易错pcr产生了tada库。与之相反,利用了tada等位基因的一个合成库,其含有位于tada的每个位置处的全部20种经典氨基酸置换,平均频率为每个库成员存在1-2个核苷酸置换突变。这一化学库可以访问比使用易错pcr技术所能实现的更大的序列空间。[1900]分离了大约300种克隆体并随后测序。从所得测序数据中,鉴定出处于tada*内的八种突变,这些突变出现频率较高(表7和9)。八种所鉴定的氨基酸突变中的六种需要在每个密码子中存在至少两个核碱基变化,而使用先前的tada易错库没有观察到这一点。出现频率高的突变中的两种改变了接近腺嘌呤脱氨基作用的活性位点的残基(i76和v82)(图7c)。除了四种先前报导的位于tada*7.10的c端α螺旋中的突变之外,在同一α-螺旋内观察到了两种新突变(y147r和q154r)(图7c)。这一高度突变的α-螺旋是稳健产物形成所必需的,因为当截短时,碱基编辑效率实质性地降低了(图10a和10b)。[1901]为了测试tada*变体在哺乳动物细胞中的活性,利用了具有最有利的上靶和脱靶情况的be密码子优化和nls取向(参见实施例2;图9a至9e)。将八种出现频率高的tada*突变以各种组合形式并入abe7.10中,得到四十种新的abe8变体(表7和9)。abe8构建体是在abe的tada区域是无活性的(野生型)和活性(进化的)tada*启动子的融合物或者是经工程化的tada*的单个启动子的情况下作成的,产生了约500个碱基对的较小编辑器。这些架构变体分别称为abe8.x-d和abe8.x-m(表7和9)。[1902]首先,评估了这四十种构建体相对于abe7.10的跨八个基因组位点的上靶dna编辑效率,这些基因组位点在经典20-nt化脓性链球菌前间隔序列内的位置2至20范围内(在nggpam=位置21、22、23的情况下)含有靶标a碱基(图11)。就使用abe8进行的稳健dna编辑而言,n端野生型tada构建体不是必需的。事实上,含有n端野生型tada的构建体(abe8.x-d)在编辑窗偏好、总dna编辑结果和插入缺失频率方面而言,与其经济型架构(abe8.x-m)类似(图7d、图11、图12)。尽管构造体内的tada(wt):tada*8二聚化对于abe8活性而言可能不是必需的,但并不排除在abe8表达的碱基编辑器之间发生反式tada*8:tada*8二聚化的可能性。[1903]在全部测试位元点中,与abe7.10相比,abe8在前间隔序列中的经典位置(a5-a7)处都导致了高出约1.5倍的编辑,并且在非经典位置(a3-a4、a8-a10)处都导致了高出约3.2倍的编辑(图13)。在靶标序列、“a”在靶标窗中的位置和abe8构建体身份之间存在倍数差异(图7d、图11、图13)。总体上,在所测试的全部位元点中,跨全部位置的编辑的中值变化为abe7.10的1.94倍(范围为1.34至4.49)。[1904]接着,从四十种构建体的大abe8池中,选择了abe8构建体的子集(abe8.8-m、abe8.13-m、abe8.17-m、abe8.20-m、abe8.8-d、abe8.13-m、abe8.17-d和abe8.20-d)进行更详细的评估。这些构建体表示编辑效能在8个基因组位点间具有如通过层次聚类分析确定的不同差异的abe8(图14)。这些abe8在所测试的全部基因组位元点处全部显著优于abe7.10(p值=0.0006871,双尾wilcoxon秩和检验),并且涵盖从abe8定向进化活动中鉴定的突变的各种组合(图15和图16)。[1905]尽管已经描述了识别非nggpam的abe变体,但当与使用靶向nggpam序列的化脓性链球菌cas9观察到的结果相比时,这些构建体的编辑效率在很多情况下均降低(参见例如,huang,t.p.等人circularlypermutedandpam-modifiedcas9variantsbroadenthetargetingscopeofbaseeditors.natbiotechnol37,626-631,doi:10.1038/s41587-019-0134-y(2019);hua,k.等人,expandingthebaseeditingscopeinricebyusingcas9variants.plantbiotechnolj,doi:10.1111/pbi.12993(2018);yang,l.等人,increasingtargetingscopeofadenosinebaseeditorsinmouseandratembryosthroughfusionoftadadeaminasewithcas9variants.proteincell9,814-819,doi:10.1007/s13238-018-0568-x(2018))。为了确定进化的脱氨酶是否也增加荷有非nggpam的靶标位点处的编辑效率,产生了将化脓性链球菌cas9替换为经工程化的化脓性链球菌变体ng-cas9(pam:ng)(nishimasu,h.等人engineeredcrispr-cas9nucleasewithexpandedtargetingspace.science(2018))或金黄色葡萄球菌cas9(sacas9,pam:nngrrt)(ran,f.a.等人invivogenomeeditingusingstaphylococcusaureuscas9.nature520,186-191,doi:10.1038/nature14299(2015))的abe8编辑器。当将abe8变体与abe7.10进行关于spcas9-ng(ng-abe8.x-m/d)和sacas9(sa-abe8.x-m/d)两者的比较时,观察到a·t至g·c编辑频率的中值增加分别为1.6倍和2.0倍(图8a、8b和17-20)。与spcas9-abe8类似,在位于编辑窗中优选位置周边的靶标a位置处观察到了abe7.10与abe8构建体之间针对非nggpam变体的编辑效率的最大差异(化脓性链球菌:位置4-8;金黄色葡萄球菌:位置6-13;也参见rees,h.a.&liu,d.r.,baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.natrevgenet19,770-788,doi:10.1038/s41576-018-0059-1(2018))。利用非nggpam的abe8直系同源物拓宽了有效a碱基编辑的靶向范畴。[1906]对于最小化插入缺失形成是必要条件的应用,在核心八种abe8构建体(“dc9-abe8.x-m/d”)中,探索了将cas9的催化活性受损的d10a切口酶突变体替换为cas9的催化上“死亡的”版本(d10a h840a)(参见jinek,m.等人aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science337,816-821,doi:10.1126/science.1225829(2012))。通过将切口酶替换为abe中的死亡的cas9,观察到dc9-abe8变体的插入缺失频率比abe7.10减少了》90%,同时保持明显更高(2.1倍)的上靶dna编辑效率(图8c、21、22、23a和23b)。尽管观察到了高于背景的插入缺失,但在所测试位元点的频率范围仅为0.3-0.8%。令人振奋的是,dc9-abe8变体相对于经典abe8的上靶dna编辑效率的减少中值仅为14%。[1907]在上靶基因座处的另一类不希望的abe介导的基因组编辑是abe依赖性的胞嘧啶到尿嘧啶(c·g到t·a)转化(参见,grunewald,j.等人,crisprdnabaseeditorswithreducedrnaoff-targetandself-editingactivities.natbiotechnol37,1041-1048,doi:10.1038/s41587-019-0236-6(2019);lee,c.等人crispr-pass:generescueofnonsensemutationsusingadeninebaseeditors.molther27,1364-1371,doi:10.1016/j.ymthe.2019.05.013(2019))。在所测试的八个靶标位点,c到t的编辑的第95个百分位,在使用abe8变体时测得为0.45%,而在使用abe7.10-d或abe7.10-m时测得为0.15%,表明使用abe时的上靶胞嘧啶脱氨基作用可能发生,但频率通常非常低(图24)。总体而言,这些资料表明,与其他往往产生不希望的副产物的变体相比,abe8保留了较高的a到g转化特异性。[1908]实施例4:通过abe8构建体进行的dna上靶和sgrna依赖性dna脱靶编辑改善了针对dna的特异性[1909]与全部碱基编辑器一样,abe8具有作用于基因组和转录组中脱靶基因座的潜力(参见例如,gaudelli,n.m.等人programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017);komor,a.c.,等人,programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage.nature533,420-424,doi:10.1038/nature17946(2016);grunewald,j.等人crisprdnabaseeditorswithreducedrnaoff-targetandself-editingactivities.natbiotechnol37,1041-1048,doi:10.1038/s41587-019-0236-6(2019);rees,h.a.,等人,analysisandminimizationofcellularrnaeditingbydnaadeninebaseeditors.sciadv5,eaax5717,doi:10.1126/sciadv.aax5717(2019);rees,h.a.等人,improvingthednaspecificityandapplicabilityofbaseeditingthroughproteinengineeringandproteindelivery.natcommun8,15790,doi:10.1038/ncomms15790(2017);jin,s.等人,cytosine,butnotadenine,baseeditorsinducegenome-wideoff-targetmutationsinrice.science364,292-295,doi:10.1126/science.aaw7166(2019);zuo,e.等人,cytosinebaseeditorgeneratessubstantialoff-targetsingle-nucleotidevariantsinmouseembryos.science364,289-292,doi:10.1126/science.aav9973(2019);lee,h.k.,等人,cytosinebutnotadeninebaseeditorgeneratesmutationsinmice.biorxiv,doi:https://doi.org/10.1101/731927(2019);grunewald,j.等人,transcriptome-wideoff-targetrnaeditinginducedbycrispr-guideddnabaseeditors.nature569,433-437,doi:10.1038/s41586-019-1161-z(2019);zhou,c.等人,off-targetrnamutationinducedbydnabaseeditinganditseliminationbymutagenesis.nature571,275-278,doi:10.1038/s41586-019-1314-0(2019))。[1910]测量了在基因组dna中四个上靶基因座(图25a和25b)处和十二个先前鉴定的sgrna相关脱靶基因座处的编辑(tsai,s.q.等人,guide-seqenablesgenome-wideprofilingofoff-targetcleavagebycrispr-casnucleases.natbiotechnol33,187-197,doi:10.1038/nbt.3117(2015))(图25e和25f),其全部被证实为hek293t细胞中真实的cas9脱靶基因座(图26)。如从其在上靶基因座处的活性增加所预期的,abe8构建体表现出比abe7.10高3至6倍的dna脱靶编辑频率。尽管这对于使用abe8构建体是个警告,但对sgrna的谨慎选择和分析可以实质性地减少sgrna依赖性脱靶编辑(参见例如,tsai,s.q.等人,guide-seqenablesgenome-wideprofilingofoff-targetcleavagebycrispr-casnucleases.natbiotechnol33,187-197,doi:10.1038/nbt.3117(2015);yeh,w.h.,等人,invivobaseeditingofpost-mitoticsensorycells.natcommun9,2184,doi:10.1038/s41467-018-04580-3(2018))。对于需要使用混杂sgrna的应用,将增强dna特异性和rna特异性的v106w突变(rees,h.a.,wilson,c.,doman,j.l.&liu,d.r.analysisandminimizationofcellularrnaeditingbydnaadeninebaseeditors.sciadv5,eaax5717,doi:10.1126/sciadv.aax5717(2019))封固在abe8.17m的tada结构域内可以将dna脱靶编辑降低2.6倍,同时保持超过abe7.10的上靶编辑水准(图25c、25d、25g和25h)。[1911]为了测量abe8的不依赖于sgrna的脱靶活性,在用abe处理的hek293t细胞红执行对细胞rna的靶向扩增和高通量测序(参见,gaudelli,n.m.等人,programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017);rees,h.a.,等人,analysisandminimizationofcellularrnaeditingbydnaadeninebaseeditors.sciadv5,eaax5717,doi:10.1126/sciadv.aax5717(2019))。在该测定中,abe8表现出比abe7.10高2.3至5.3倍的细胞rna胞苷脱氨基作用的平均频率(图25a)。[1912]为了减少伪rna脱靶编辑,将先前公布的突变(grunewald,j.等人,crisprdnabaseeditorswithreducedrnaoff-targetandself-editingactivities.natbiotechnol37,1041-1048,doi:10.1038/s41587-019-0236-6(2019);rees,h.a.,等人,analysisandminimizationofcellularrnaeditingbydnaadeninebaseeditors.sciadv5,eaax5717,doi:10.1126/sciadv.aax5717(2019);grunewald,j.等人,transcriptome-wideoff-targetrnaeditinginducedbycrispr-guideddnabaseeditors.nature569,433-437,doi:10.1038/s41586-019-1161-z(2019);zhou,c.等人,off-targetrnamutationinducedbydnabaseeditinganditseliminationbymutagenesis.nature571,275-278,doi:10.1038/s41586-019-1314-0(2019))装入abe8.17-m内的脱氨酶的tada部分中,以评估脱靶编辑频率的降低。这些突变全部以不同程度降低了abe8.17-m的上靶编辑频率,其中v106w和f148a对abe8的损害最小(图25c和25d)。其中,仅v106w能实质性地降低脱靶rna和dna编辑的水准(图25b)。因此,将v106w突变纳入abe8中适用于必须避免细胞转录组的暂态扰动的情况下,或者用于与混杂的sgrna合用。[1913]实施例5:腺苷碱基编辑器用于治疗造血系统疾患[1914]在人类造血干细胞(hsc)中评估了abe8构建体。在作为细胞疗法给药至患者之前对hsc进行离体操纵和/或编辑是一种用于治疗造血系统疾患的有前景的途径。先前已经证明,abe可以将t到c的置换引入hbg1/2的启动子区域的-198位置处(gaudelli,n.m.等人,programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017))。这一天然出现的等位基因导致胎儿血红蛋白(hpfh)的遗传持久性,造成成年后的γ-珠蛋白水准增加,这可能减少了见于镰状细胞疾病和β-地中海贫血中的β-珠蛋白缺陷(wienert,b.等人,klf1drivestheexpressionoffetalhemoglobininbritishhpfh.blood130,803-807,doi:10.1182/blood-2017-02-767400(2017))。为了复制hpfh表型并评估abe8临床相关性的目的,从两位元供体分离cd34 造血干细胞并编码abe8编辑器的mrna和末端修饰的sgrna进行转染,将靶标a放在前间隔序列内的位置7处。[1915]在早期时间点(48h),在-198hbg1/2启动子靶标位点处的平均abe8编辑效率比任何一个abe7.10构建体高2至3倍,而在较晚时间点(144h),比任何一个abe7.10高1.3至2倍(图27a、图28、图29)。这些动力学区别对于离体疗法具有重要的临床意义,在该疗法中,在给药细胞疗法之前,细胞培养必须保持在最低限度。[1916]之后,通过uplc将abe治疗之后产生的γ-珠蛋白以及红细胞分化定量(图30至50)。当与模拟处理的细胞比较时,观察到来源于abe8治疗组的红细胞中的以百分比计γ-珠蛋白/α-组蛋白表达平均增加了3.5倍,而当将abe8.13-d与使用abe7.10-m/d所实现的水准比较时,观察到增加了1.4倍(图27b)。预计需要≥20%hbf来改善镰状细胞疾病的症状,而β-地中海贫血患者可能需要甚至更高的最低水准(参见例如,canver,m.c.&orkin,s.h.customizingthegenomeastherapyforthebeta-hemoglobinopathies.blood127,2536-2545,doi:10.1182/blood-2016-01-678128(2016);fitzhugh,c.d.等人,atleast20%donormyeloidchimerismisnecessarytoreversethesicklephenotypeafterallogeneichsct.blood130,1946-1948,doi:10.1182/blood-2017-03-772392(2017))。在abe8治疗后观察到的γ-珠蛋白水准超过了这一阈值。[1917]总体上,abe8在γ-珠蛋白基因hbg1和hbg2的启动子处重建了天然出现的胎儿血红蛋白(hpfh)的遗传持久性,在人类cd34 细胞培养物中实现了高达60%的编辑效率并且在分化的红细胞中实现了γ-珠蛋白表达的相应上调。[1918]实施例6:互补性碱基编辑途径用于治疗镰状细胞疾病和β-地中海贫血[1919]镰状细胞疾病(scd)和β-地中海贫血是β-珠蛋白产生和功能紊乱,导致严重贫血和跨多个器官系统的严重疾病并发症。通过上调胎儿血红蛋白(hbf)或校正β-珠蛋白基因而工程化的造血干细胞的自体移植具有降低患有β-血红蛋白病的患者疾病负担的潜力。碱基编辑是最近开发的技术,它能够精确修饰基因组而不引入双链dna断裂。[1920]使用[[胞嘧啶]]和腺嘌呤碱基编辑器(abe)对γ-珠蛋白基因启动子进行全面筛选,以用于鉴定将会对hbf去阻遏的改变。鉴定了三个显著上调hbf的区域,并且最有效的核苷酸残基转化得到在具有胎儿血红蛋白(hpfh)遗传持久性的患者中见到的天然变异的支援。已经开发了在hbg1和hbg2启动子内的关键调节基序处进行核苷酸转化之后显著增加hbf水准的abe。将cd34 造血干细胞和祖细胞(hspc)以临床规模纯化并且使用被设计为保留自我更新能力的过程进行编辑。通过uplc测定,用不同的abe在两个独立位点进行的编辑达到了94%并且导致了高达63%的β-珠蛋白(图51a至51e)。所观察的hbf水准应当向大部分scd和β-地中海贫血患者提供保护,因为根据对于hpfh和非介入疗法的临床观察,hbf剂量越高,病情越轻(ngo等人,2011britjhem;musallam等人,2012blood)。[1921]直接校正scd的glu6val突变已经成为被设计用于scd群体的基因疗法的近期目标。目前的碱基编辑技术尚不能转化例如镰状β-珠蛋白中的a-t转换所致的那些突变,但是,已经设计abe变体以识别并编辑缬氨酸的相反链的腺嘌呤残基。这导致缬氨酸转化为丙氨酸并且产生被称为hbg-makassar的天然出现的变体。在该位置处具有丙氨酸的β-珠蛋白对于聚合物形成没有贡献,并且具有hbg-makassar的患者呈现出正常的血液学参数和红细胞形态。使用这些abe变体编辑的scd患者成纤维细胞实现了高达70%的靶标腺嘌呤转化(图52a)。然后,使用前导abe变体编辑来自健康供体的cd34细胞,该变体靶向相邻脯氨酸中的同义突变,该同义突变位于编辑视窗内并且充当编辑scd突变的指示器。平均编辑效率为40%(图52b)。同种异体移植环境中记录的这些水准的供体骨髓嵌合体超过了逆转镰状表型所需水准的20%(fitzhughetal,2017blood)。[1922]实施例7:材料和方法[1923]一般方法:[1924]克隆全部使用user酶(newenglandbiolabs)克隆方法(参见,geu-flores等人,userfusion:arapidandefficientmethodforsimultaneousfusionandcloningofmultiplepcrproducts.nucleicacidsres35,e55,doi:10.1093/nar/gkm106(2007)),而用于pcr扩增的范本作为经细菌或哺乳动物密码子优化的基因片段(geneart)购得。将产生的载体转化为macht1r感受态细胞(thermofisherscientific)并且在-80℃长期储存。该工作中使用的引物全部购自integrateddnatechnologies,并且使用phusionudna聚合酶绿色多重pcr预混液(thermofisher)或q5暖开机高保真度2x预混液(newenglandbiolabs)进行pcr。该工作中使用的质粒全部是使用zymopure质粒midiprep(zymoresearchcorporation)从50ml的mach1培养物新鲜制备的,该制备涉及内毒素清除过程。在全部测定、转染和pcr反应中使用分子生物学级别的hyclone水(gehealthcarelifesciences),以确保排除dnase活性。[1925]用于hek293t哺乳动物细胞转染的sgrna的氨基酸序列提供在下表15中。20-nt的靶标前间隔序列以粗体显示。当靶标dna序列不以“g”开始时,将“g”添加到引物的5'末端,因为已经确定人类u6启动子更喜欢转录起始位点处为“g”(参见例如,cong,l.等人,multiplexgenomeengineeringusingcrispr/cassystems.science339,819-823,doi:10.1126/science.1231143(2013))。将先前所述的pfyfsgrna质粒用作pcr扩增范本。[1926]表15:用于hek293t哺乳动物细胞转染的sgrna的序列。[1927][1928][1929]sgrna支架序列如下:[1930]化脓性链球菌:[1931]guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc[1932]金黄色葡萄球菌:[1933]guuuuaguacucuguaaugaaaauuacagaaucuacuaaaacaaggcaaaaugccguguuuaucucgucaacuuguuggcgaga[1934]生成用于定向进化的输入细菌tada*库[1935]将tada*8.0库设计为编码tada*7.10开放阅读框中每个氨基酸位置处的全部20种氨基酸(gaudelli,n.m.等人,programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017))。每个tada*8.0库成员含有约1-2个新编码突变,并且经化学合成且购自ranomicsinc(toronto,canada)。使用phusionu绿色多重pcr预混液对tada*8.0库进行pcr扩增,并将其user-组装到经优化以进行abe定向进化的细菌载体中(gaudelli,n.m.等人,programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017))。[1936]tada变体的细菌进化[1937]如先前所述并做下列改变,对含有tada*8库的abe进行定向进化(gaudelli,n.m.等人,programmablebaseeditingofa*ttog*cingenomicdnawithoutdnacleavage.nature551,464-471,doi:10.1038/nature24644(2017)):i)使用大肠杆菌10β(newenglandbiolabs)作为进化宿主;和ii)卡那霉素下的生存率依赖于对三种基因灭活成分的校正(例如,生存需要逆转卡那霉素中的两个终止突变和一个活性位点突变)。卡那霉素耐药基因序列含有针对abe8进化的选择突变。将选择质粒和编辑器在10β宿主细胞中供体培养过夜后,将库培养物接种在以质粒维持抗生素和递增浓度的选择抗生素卡那霉素(64-512μg/ml)补充的2xyt-琼脂培养基上。令细菌生长1天,并在富集后对生存菌落的tada*8部分进行sanger测序。然后,通过user组装将鉴定的感兴趣的tada*8突变并入哺乳动物表达载体中。[1938]一般hek293t和rpmi-8226哺乳动物培养条件[1939]将细胞在37℃和5%co2下培养。将hek293t细胞[clbtx013,美国模式培养物保藏中心(atcc)]在具有10%(v/v)胎牛血清(a31606-02,thermofisherscientific)的杜尔贝科改进伊格尔培养基加上glutamax(10566-016,thermofisherscientific)中培养。将rpmi-8226(ccl-155,atcc)细胞在具有10%(v/v)胎牛血清(gibco)的rpmi-1640培养基(gibco)中培养。从供应商处接收之后,对细胞的支原体测试为阴性。[1940]hek293t质粒转染和gdna提取[1941]将hek293t细胞以35,000个细胞/孔的密度接种在经聚-d-赖氨酸处理的48孔biocoat板(corning)上,并在接种后转染18至24小时。使用nucleocounternc-200(chemometec)计数细胞。向这些细胞中加入750ng的碱基编辑器或核酸酶对照物、250ng的sgrna和10ng的gfp-max质粒(lonza),在opti-mem还原血清培养基(thermofisherscientific)中稀释至12.5μl总体积。将溶液与1.5μl的lipofectamine2000(thermofisher)在11μl的opti-mem还原血清培养基中合并,在室温静置15min。然后将整个25μl混合物转移到预先接种的hek293t细胞中,静置培育约120h。培育之后,将培养基吸出,将细胞用250μl的1xpbs溶液(thermofisherscientific)洗涤量测,并添加100μl的新鲜制备的裂解缓冲液(100mmtris-hcl,ph7.0、0.05%sds、25μg/ml蛋白酶k(thermofisherscientific))。将含有裂解缓冲液的转染板在37℃培育1小时,将混合物转移至96孔pcr板中,并在80℃加热30min。[1942]对于abe结构和abe8构建体的dna和rna脱靶编辑的分析[1943]在进行脂质转染之前16至20小时,将hek293t细胞以30,000个细胞每孔的密度在不含抗生素的dmem glutamax培养基(thermofisherscientific)中接种在聚-d-赖氨酸包被的48孔板(corning)上。将750ng切口酶或碱基编辑器表达质粒dna与250ng的sgrna表达质粒dna合并在15μloptimem glutamax中。将其与10μl的脂质混合物合并,该脂质混合物包含1.5μllipofectamine2000和8.5μloptimem glutamax每孔。转染3天后收获细胞,并且收获dna或rna。对于dna分析,将细胞在1xpbs中洗涤一次,然后根据制造商的使用说明书在100μlquickextracttm缓冲液(lucigen)中裂解。对于rna收获,根据制造商的使用说明书,使用magmaxtmmirvanatm总rna分离试剂盒(thermofisherscientific)和kingfishertmflex纯化系统。[1944]在很大程度上如先前所述执行靶向rna测序(参见,rees,h.a.等人,analysisandminimizationofcellularrnaeditingbydnaadeninebaseeditors.sciadv5,eaax5717,doi:10.1126/sciadv.aax5717(2019))。根据制造商的使用说明书,使用superscriptiv一步rt-pcr系统和ezdnase(thermofisherscientific)从分离的rna制备cdna。使用下述程式:58℃,12min;98℃,2min;然后是通过扩增子改变的pcr回圈:对于ctnnb1和ip90:32次回圈[98℃,10sec;60℃,10sec;72℃,30sec];对于rsl1d1:35次回圈[98℃,10sec;58℃,10sec;72℃,30sec]。没有使用这些样品同步运行rt对照。在合并rt-pcr后,如上所述,使用illuminamiseq将扩增子条码化并测序。将每个扩增子的最前面125nt(在每个扩增子中从正向引物末端后的第一个碱基开始)与参考序列比对并用于分析每个扩增子中的平均和最大a到i频率(图53a和53b)。[1945]使用先前公布的下表16中所列的引物执行脱靶dna测序(参见例如,komor,a.c.等人,programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage.nature533,420-424,doi:10.1038/nature17946(2016);rees,h.a.等人,analysisandminimizationofcellularrnaeditingbydnaadeninebaseeditors.sciadv5,eaax5717,doi:10.1126/sciadv.aax5717(2019)),使用两步法pcr和条码化方法来制备样品,以使用上述illuminamiseq侧需求进行测序。[1946]表16:用来扩增基因组位点的hts引物:[1947][1948][1949][1950][1951]用于在cd34 细胞中使用的abe编辑器的mrna生产[1952]将编辑器克隆到编码dt7启动子以及随后的5'utr、kozak序列、orf和3'utr的质粒中。dt7启动子携带t7启动子内的灭活点突变,该突变阻止从环状质粒转录。该质粒将pcr反应范本化(q5暖开机2x预混液),其中正向引物校正t7启动子内的snp,而反向引物将120a尾部附加至3'utr。将所得pcr产物在zymoresearch25μgdcc柱上纯化并作为mrna范本用于后续体外转录中。根据说明手册使用nebhiscribe高产试剂盒,但使用n1-甲基-假尿苷完全置换尿苷,并且使用cleancapag(trilink)进行共转录封端。通过氯化锂沉淀执行反应净化。用于扩增的引物可以在表17中找到。[1953]表17:用于abe8t7体外转录反应的引物[1954][1955]cd34 细胞制备[1956]获取动员的外周血并针对人cd34 hspc进行富集(hemacare,m001f-gcsf/moz-2)。在进行电穿孔之前48小时,将cd34 细胞融化并置于含有1%glutamax(gibco)、100ng/ml的tpo(peprotech)、scf(peprotech)和flt-3(peprotech)的x-vivo10(lonza)中。[1957]cd34 细胞的电穿孔[1958]融化之后48小时,将细胞旋下以移除x-vivo10培养基,并在具有0.1%hsa(akronbiotechnologies)的maxcyte缓冲液(hyclone)中洗涤。然后将细胞以1,250,000个细胞/ml重新悬浮在冷maxcyte缓冲液中,并且分为多个20μl等量小样。然后,根据实验条件将abemrna(0.15μm)和-198hbg1/2sgrna(4.05μm)分为等量小样,并以maxcyte缓冲液增至5μl的总体积。以3组将20μl的细胞添加到5μlrna混合物中,并载入到oc25x3maxcyte小池的每个腔室中进行电穿孔。在接收电荷之后,从腔室收集25μl并置于未经处理的24孔培养板的孔中心。将细胞在培养箱(37℃,5%co2)中恢复20分钟。恢复20分钟后,将含有1%glutamax、100ng/ml的tpo、scf和flt-3的x-vivo10添加到细胞中,直到浓度为1,000,000个细胞/ml.然后将细胞在培养箱(37℃,5%co2)中进一步恢复48小时。[1959]abe电穿孔后的红细胞分化[1960]在电穿孔后休息48h后(培养第0天),将细胞旋下并转移到含有5%人血清、330μg/ml转铁蛋白(sigma)、10μg/ml人胰岛素(sigma)、2u/ml肝素钠(sigma)、3u/mlepo(peprotech)、100ng/mlscf(peprotech)、5μg/mlil3和50μm氢化可的松(sigma)的“第一阶段”imdm培养基(atcc)中,密度为20,000个细胞/ml。在培养第4天,向细胞馈入4倍体积的相同培养基。在第7天,将细胞旋下并转移到含有5%人血清(sigma)、330μg/ml转铁蛋白、10μg/ml人胰岛素、2u/ml肝素钠、3u/mlepo和100ng/mlscf的“第二阶段”imdm培养基中,密度为200,000个细胞/ml。在第11天,将细胞旋下并转移到含有5%人血清、330μg/ml转铁蛋白、10μg/ml人胰岛素、2u/ml肝素钠和3u/mlepo的“第三阶段”imdm培养基中,密度为1,000,000个细胞/ml。在第14天,将细胞旋下并重新悬浮在与第11天相同的培养基中,但密度为5,000,000个细胞/ml。在第18天,以500,000个细胞等量小样收集分化的红血球,在500μldpbs(gibco)中洗涤一次,在-80℃冷冻24小时,再进行uhplc处理。[1961]制备红血球样品以进行uhplc分析[1962]将冷冻的红血球的球丸在室温融化。将球丸用ack裂解缓冲液稀释至最终浓度为5x104cells/μl。将样品通过移液管混合并在室温培育5min。然后将样品在-80℃冷冻5min,融化,通过移液管混合,之后以6,700g离心10min.小心地移除上清液(不扰动细胞碎片球丸),转移到新板上,并且在超纯水中稀释至5x103个细胞/μl以进行uhplc分析。[1963]超高效液相色谱(uhplc)分析[1964]在配置有二元泵和uv检测器的uhplc系统(thermofisherscientific,vanquishhorizon)上执行珠蛋白链的反相分离。固定相由位于aquity肽behc18vanguard预柱(2.1x5mm,1.7μm珠,300a孔)之后的acquity肽behc18色谱柱(2.1x150mm,1.7μm珠,300a孔)(两者均来自waterscorp)组成,柱温为60℃。使用0.1%三氟乙酸(tfa)水溶液(a)和0.08%tfa乙腈溶液(b)以0.25ml/min流速执行洗脱。使用以下线性梯度实现珠蛋白链的分离:0-10min,40-52%b;10-10.5min,52-40%b;直至12min,40%b。进样体积为10μl,整个分析过程中,以5hz的资料速率在220nm收集uv光谱。通过血红蛋白标准的lc/ms分析来证实珠蛋白链身份。[1965]cd34 细胞的基因组dna提取[1966]在abe电穿孔后(48h后),将细胞的等量小样在含有1%glutamax(gibco)、100ng/mloftpo(peprotech)、scf(peprotech)和flt-3(peprotech)的x-vivo10培养基(lonza)中培养。在培养48h和144h后,收集100,000个细胞并旋下。将50μl的quickextract(lucigen)添加至细胞球丸,并将细胞混合物转移至96孔pcr板(bio-rad)。将裂解液在65℃加热15分钟,然后在98℃加热10分钟。将细胞裂解液在-20℃储存。[1967]实施例8:使用腺苷脱氨酶碱基编辑器进行剪接受体中断,以中断或沉默细胞中的sod1基因表达[1968]sod1蛋白是细胞例如运动神经元内的严重大量存在的酶,在正常情况下,它保护细胞免受代谢废物的影响,如果代谢废物不是无害的就会损害细胞。als似乎不是由于sod1蛋白功能的缺乏造成的,因为在动物模型中缺失该基因并未造成疾病。反之,sod1基因中的突变似乎导致sod1蛋白获得新的毒性功能,这可能与突变sod1蛋白聚集并且在运动神经元和星形细胞(即,在als中死亡的细胞)中形成沉积的趋势增加有关。随着蛋白聚集体的形成,它们可以捕获其他通常维持细胞健康的蛋白质。在als中,突变sod1蛋白可以捕获其他蛋白质,造成毒性。作为另一种选择,通过堵塞细胞蛋白体和溶酶体,将会产生聚集体的毒性,导致运动神经元的死亡。[1969]在本实施例中,使用衍生自spcas9切口酶的腺苷碱基编辑器(abe)系统将精确的a到g突变引入位于sod1基因外显子3的5'末端处的高度保守的剪接受体“ag”核酸序列中。经典剪接受体位点的“ag”核酸序列中的a到g碱基变化诱导信使rna(mrna)错误剪接和基因转录中断和/或sod1基因的外显子3的替代性剪接。[1970]通过有效地靶向sod1基因组核酸序列中的ag剪接受体中的“a”核碱基并在该靶向位点处转化a》g,使用abe来中断经典“ag”剪接受体。在hek293t细胞系中测试碱基编辑。使用向导rna(grna)与abe8碱基编辑器变体(即,abe8.1至abe8.14)和abe7.10协同作用来靶向“ag”剪接受体核酸的靶标腺苷(“a”)(图54)。[1971]如本文提供的、或如基于熟练从业者的知识所确定的以及如本领域熟练从业者将会理解的,grna涵盖用于与als相关的人sod1基因的剪接受体核酸序列(“ag”)(即,sod1的外显子3的5′的剪接受体)的支架序列和间隔序列。(参见例如,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017))和rees,h.a.等人,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1)。[1972]在图55中,显示了sod1基因组dna外显子3的5'处内含子剪接受体序列中的靶标腺苷(a)被转化为鸟苷(g),即,[1973]5'-ttataaataggctgtaccagtgcag-3'。此外用于碱基编辑器系统中的向导rna核酸包括图55中显示的序列:grna:5'-aauauuuauccgacauggucacguc-3'。所使用的pam序列是nggpam(即,spcas9),其中n可以是g、a、c或t中的任一种(图55)。对于grna,支架序列如下:[1974]gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt。[1975]由sod1核酸序列外显子3编码的最前面4个氨基酸显示在图55中,如下:5'-gly-cys-thr-ser-ala-3'。[1976]所用的abe碱基编辑器包括abe8变体:abe8.1、abe8.2、abe8.2、abe8.3、abe8.4、abe8.5、abe8.6、abe8.7、abe8.8、abe8.9、abe8.10、abe8.11、abe8.12、abe8.13和abe8.14(参见表7)。正对照碱基编辑器abe7.10和负对照也用于参考比较。[1977]如图56中所见,使用所示的grna,所用的abe碱基编辑器全部提供位于靶标位元点剪接受体位点处的有效的a到g碱基编辑。与对照物相比,所测定的abe8碱基编辑器变体全部具有碱基编辑活性。尽管abe8.5显示约40%的a到g碱基编辑活性,但其他abe8变体全部显示了超过75%或更大的a到g碱基编辑活性。[1978]通过对pcr产物进行深度测序检测的在位置6处对靶标的sod1剪接受体(ag)进行的a到g碱基编辑效率(图55)呈现在图56中。如图56中所示,在靶向剪接受体位点即位置6处实现了大约81%的a到g碱基编辑。显示了与所测试的abe8腺苷脱氨酶相关的脱靶效应(即,sod1内含子中的旁观者“a”的a到g编辑)(在图56中,位置2-4处的“g”核碱基的百分比),但显著低于靶标位置6处的a到g碱基编辑的百分比。[1979]用于对sod1基因剪接受体进行碱基编辑的单向导rna(sgrna)[1980]其他适合在本文所述的系统和方法中使用的用于sod1剪接受体中断的单向导rna(sgrna)核酸序列的示例在下文中详述。这些sgrna始于“u6”(在所示核酸序列中呈递“t”核碱基而非“u”核碱基,u6与图55所示的sod1基因组核酸序列的剪接受体“ag”序列的靶标腺苷(a)序列互补。图55中所示的位于序列位置6处的sod1外显子3剪接受体“ag”序列的靶标“a”核碱基在图中以向上的箭头指示。下文呈现的sgrna包括sgrna支架序列。[1981]向导16(u6至sgrna支架)[1982]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgccttgccttctgctcgaaatgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[1983]向导17(u6至sgrna支架)[1984]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgtgcagggcatcatcaatttgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[1985]向导18(u6至sgrna支架)[1986]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgttaaaggaaagtaatggaccgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[1987]向导19(u6至sgrna支架)[1988]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgttactttcctttaagaaaaggttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[1989]向导20(u6至sgrna支架)[1990]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgtaaataggctgtaccagtgcgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[1991]向导21(u6至sgrna支架)[1992]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccggtacagcctatttataagagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[1993]向导22(u6至sgrna支架)[1994]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgatgcttccccacaccttcacgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[1995]向导24(u6至sgrna支架)[1996]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgttcattattaggcatgttgggttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[1997]向导25(u6至sgrna支架)[1998]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgaacatgcctaataatgaaaagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[1999]向导39(u6至sgrna支架)[2000]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgttcctttaagaaaagtgcaagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2001]向导40(u6至sgrna支架)[2002]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgacagcctatttataagaagagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2003]向导41(u6至sgrna支架)[2004]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgaaataggctgtaccagtgcagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2005]向导42(u6至sgrna支架)[2006]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgtattaggcatgttggagactgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2007]下列各表呈现使用上文所示多种sgrna进行sod1剪接受体碱基编辑的结果。在表19中,呈现了针对几种grna和abe的位于靶点处的碱基编辑百分比。[2008]表19[2009][2010][2011]与对照相比,通过如本文所述的几种不同的abe8(或abe7.10)腺苷碱基编辑器和sgrna“向导20”实现将位于靶点处的a替换为g的碱基编辑的存在显示在下表20中。[2012]表20[2013]ꢀ“向导20”abe平均(总)%abe8.155.29abe8.254.03abe8.352.72abe8.451.55abe8.533.80abe8.655.60abe8.737.71abe8.815.31abe8.913.49abe8.1031.43abe8.1129.21abe8.1247.53abe8.137.10abe8.1416.63abe7.1046.51对照0.02[2014]与对照相比,通过如本文所述的几种不同的abe8(或abe7.10)腺苷碱基编辑器和sgrna“向导42”实现将位于靶点处的a替换为g的碱基编辑的存在显示在下表21中。[2015]表21[2016][2017][2018]与对照相比,通过如本文所述的几种不同的abe8(或abe7.10)腺苷碱基编辑器和sgrna“向导41”实现将位于靶点处的a替换为g的碱基编辑的存在显示在下表22中。[2019]表22[2020]ꢀ“向导41”‑平均(总)%pv3446.11pv3636.50pv5741.33pv6046.35pv6547.71editingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017))和rees,h.a.等人,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1)。[2029]所用的abe碱基编辑器包括abe8变体:abe8.1、abe8.2、abe8.2、abe8.3、abe8.4、abe8.5、abe8.6、abe8.7、abe8.8、abe8.9、abe8.10、abe8.11、abe8.12、abe8.13和abe8.14(参见表7)。正对照碱基编辑器abe7.10和负对照也用于参考比较。所用的abe碱基编辑器也包括pv变体:pv1、pv2、pv3、pv4、pv5、pv6、pv7、pv8、pv9、pv10、pv11、pv12、pv13、pv14、pv34、pv36、pv57、pv60、pv65、pv188、pv189、pv190、pv191、pv192、pv193、pv194、pv195、pv196、pv197、pv198和pv216。所用的cbe碱基编辑器包括pv217-233、pv266-268、pv271和pv284-be4vrqr。使用负对照进行参考比较。[2030]图60b、64b、66b、68和72至79显示使用不同grna测试的abe和cbe碱基编辑器的a到g或c到t碱基编辑效率,如通过深度测序pcr产物所检测的。[2031]测量sod1蛋白水准,以证实碱基编辑导致sod1mrna剪接的中断和蛋白水准(图62)。在hek293t细胞系中,使用abe8.8或abe7.10碱基编辑器和向导20(grna20),使用lipofectamine2000系统测试碱基编辑。使用jessproteinsimple测量蛋白水准(蛋白质印迹)。将样品归一化至负载对照β-肌动蛋白。[2032]用于对sod1基因剪接受体进行碱基编辑的单向导rna(sgrna)[2033]适合在本文所述的系统和方法中使用的用于sod1剪接受体中断的单向导rna(sgrna)核酸序列的示例在实施例8中详述。这些sgrna始于“u6”(在所示核酸序列中呈递“t”核碱基而非“u”核碱基,u6与图55所示的sod1基因组核酸序列的剪接受体“ag”序列的靶标腺苷(a)序列互补。图55中所示的位于序列位置6处的sod1外显子3剪接受体“ag”序列的靶标“a”核碱基在图中以向上的箭头指示。下列各表呈现使用实施例8中描述的多种sgrna进行sod1剪接受体碱基编辑的结果。在表23中,描述了grna核酸序列和pam序列。[2034]表23[2035][2036]在表24中,呈现了针对几种grna和abe/cbe的位于靶点处的最高上靶碱基编辑。[2037]表24[2038][2039]在表25至34中,显示了与对照物相比,使用本文所述的多种不同的abe8(或abe7.10)腺苷碱基编辑器、pv腺苷碱基编辑器或cbe诸如be4以及不同的sgrna实现的靶标位点处或靶标位点附近(例如,旁观者)的a到g或c到t碱基编辑的百分比。[2040]表25.als向导15[2041][2042]表26.als向导16[2043][2044]表27.als向导17[2045][2046]表28a.als向导18[2047][2048][2049][2050]表28b.als向导18[2051][2052][2053]表29.als向导19[2054][2055][2056][2057]表30.als向导21[2058][2059][2060]表31.als向导22[2061][2062]表32.als向导24[2063][2064][2065][2066]表33.als向导40[2067][2068]表34a.als向导41[2069][2070][2071][2072]表34b.als向导41[2073][2074][2075]细胞培养和转染[2076]hek293t(293t)细胞系从美国组织培养典藏中心(atcc)获得。在37℃和5%co2下,将293t细胞维持在以10%胎牛血清和1%青霉素/链霉素的dmem中。遵循制造商的使用说明书,将全部细胞系在24孔板中用lipofectamine2000(invitrogen)转染。用于脂质转染的dna的量为每孔1μg。如通过在递送对照gfp表达质粒后进行萤光显微镜分析所才确定的,针对293t细胞的转染效率通常高于80%。[2077]对于质粒转染,将hek293t细胞铺板,并且使用opti-mem培养基和lipofectamine2000,用250ng的含有u6启动子且编码该grna的表达质粒以及750ng的编码cas9/abe8变体碱基编辑器的表达质粒进行转染。所用的abe8碱基编辑器变体包括nggpam序列。将细胞在37℃和5%co2下维持5天,在转染后第3天更换培养基。之后,将细胞裂解,分离基因组dna,并且使用标准程式,通常使用20-100ng的范本dna执行pcr。添加适配物(illumina)之后,对dna进行深度测序。通过miseq分析对所希望的位点处的碱基编辑进行分析。[2078]对来自从293t细胞的两次平行转染收获的基因组dna或rna的pcr扩增子执行深度测序。通过凝胶电泳验证pcr产物的品质后,通过凝胶提取分离pcr产物,例如,使用zymoclean凝胶dna回收试剂盒(zymoresearch)进行。散弹枪基因库(shotgunlibraries)是在没有剪切的情况下制备的。该库通过qpcr进行定量,并且miseq500次回圈测序试剂盒版本2,在一个miseq纳米流动池上对该片段每个末端进行251次回圈而对该库测序。生成fastq档,并且用bcl2fastqv2.17.1.14转化软体(illumina)分解。[2079]实施例10:使用胞苷碱基编辑器将种子密码子引入ar基因的外显子1或外显子2中[2080]sbma的分子基础是雄激素受体(ar)基因的第一外显子中的三核苷酸cag重复序列的扩张,该重复序列编码ar多核苷酸的聚谷氨酰胺(polyq)链段。含有突变ar蛋白的核内包涵体存在于脑干和脊髓的运动神经元中。此类包涵体的存在与sbma的病理生理学相关。[2081]本实施例中,使用a到g碱基编辑器系统将精确的c到t突变引入突变ar基因的外显子1中的编码谷氨酰胺的cag密码子处,该突变基因包括扩张的三核苷酸重复序列。c到t碱基变化将靶标“cag”核酸序列转化为tag,这导致蛋白质的提前终止。在其他实施方案中,本发明的cbe将caa改变为taa,将cga改变为tga,或将tgg改变为tga、tag或taa。[2082]实施例11:使用腺苷碱基编辑器(abe)来中断ar多核苷酸内的剪接受体位点和剪接供体位点[2083]在本实施例中,使用a到g碱基编辑器系统将精确的a到g突变引入突变ar基因的外显子1中的剪接供体位点处,该突变基因包括扩张的三核苷酸重复序列。使用c到t碱基编辑器将精确的c到t突变引入突变ar基因的外显子1中的剪接供体位点处,该突变基因包括扩张的三核苷酸重复序列。还使用a到g碱基编辑器系统在外显子2之前紧邻该外显子的剪接受体位点中产生精确的a到g突变。[2084]在每个上述实施例中,在hek293t细胞系中测试碱基编辑。所使用的向导rna(grna)利用具有下文所提供序列的胞苷碱基编辑器靶向ar“cag”:[2085]bgx5-d10a(cmv至sv40nls)[2086]gattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatgacctctgagaagggccctagcacaggcgaccccaccctgcggcggagaatcgagagctgggagttcgacgtgttctacgaccctagagaactgagaaaggaaacctgcctgctgtacgagatcaagtggggcatgagcagaaagatctggcggagctctggcaagaacaccaccaaccacgtggaagtgaatttcatcaagaagttcaccagcgagagaaggttccacagcagcatcagctgcagcatcacctggttcctgagctggtccccttgctgggaatgcagccaggccatcagagagttcctgagccaacaccccggagtgacactggtgatctacgtggccagactgttctggcacatggaccagagaaacagacagggcctgagagatctggtcaacagcggcgtgactatccagatcatgcgggccagcgagtactaccactgttggcggaacttcgtgaactacccccccggcgatgaggcccactggcctcagtaccctcctctgtggatgatgctgtacgccctggaactgcactgcatcatcctgtctctgcctccatgtctgaagatctctagaagatggcagaaccacctggccttcttcagactgcacctgcagaattgccactaccagaccatccccccccacatcctgctggctacaggcctgatccacccttctgtgacctggagacttaagagcggaggatctagcggcggctctagcggatctgagacacctggcacaagcgagtctgccacacctgagagtagcggcggatcttctggtggctctgacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggtggaagcggaggatctggcggcagcaccaatctgagcgacatcatcgagaaagagacaggcaagcagctggtcatccaagagtccatcctgatgctgcctgaagaggtggaagaagtgatcggcaacaagcccgagtccgacatcctggtgcacaccgcctacgatgagagcaccgacgagaacgtgatgctgctgacctctgacgcccctgagtacaagccttgggctctcgtgatccaggacagcaacggcgagaacaagatcaagatgctgagcggcggctctggtggctctggcggatctacaaacctgtccgatattattgagaaagaaaccgggaaacagctcgtgattcaagagtctattctcatgctcccggaagaagtcgaggaagtcattggaaacaagcctgagagcgatattctggtccatacagcctacgacgagtctaccgatgagaatgtcatgctcctcaccagcgacgctcccgagtataagccatgggcacttgtcattcaggactccaatggggaaaacaaaatcaaaatgctcccaaagaaaaaacgcaaggtggagggagctgataagcgcaccgccgatggttccgagttcgaaagccccaagaagaagaggaaagtct[2087]apobec1婆罗洲猩猩(猩猩)替换rapobec1[2088]mtsekgpstgdptlrrrieswefdvfydprelrketcllyeikwgmsrkiwrssgknttnhvevnfikkftserrfhssiscsitwflswspcwecsqaireflsqhpgvtlviyvarlfwhmdqrnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhlaffrlhlqnchyqtipphillatglihpsvtwrlksggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlpkkkrkvegadkrtadgsefespkkkrkv[2089]bgx27-d10a(cmv至sv40nls)[2090]cattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatggccggctacgagtgcgtgcgggtgtccgagaagctggatttcgataccttcgagttccagttcgagaacctgcactacgccacagagagacacagaacctacgtgatcttcgacgtgaaacctcagagcgccggaggcagaagccggcggctgtggggctacatcatcaacaaccccaacgtgtgccacgccgagctgatcctgatgagcatgatcgaccggcacctggaatctaatcctggcgtgtacgccatgacctggtacatgagctggtccccatgtgctaattgcagcagcaagctgaacccttggctgaaaaacctgctcgaggaacagggccacaccctgaccatgcacttcagcagaatctacgacagagatagagaaggcgaccaccgaggactgagaggcctgaagcacgtgtccaacagcttcagaatgggcgtggtcggaagagccgaggtgaaggaatgtctggccgaatacgtggaagccagcagaagaacactgacatggctggacaccacagagagcatggccgccaagatgcggagaaagctgttctgcatcctggtgcggtgcgccggcatgagagagagcggcatccccctgcacctgtttaccctgcagacccctctgctgagcggcagagtggtgtggtggcgggtgcttaagagcggaggatctagcggcggctctagcggatctgagacacctggcacaagcgagtctgccacacctgagagtagcggcggatcttctggtggctctgacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggtggaagcggaggatctggcggcagcaccaatctgagcgacatcatcgagaaagagacaggcaagcagctggtcatccaagagtccatcctgatgctgcctgaagaggtggaagaagtgatcggcaacaagcccgagtccgacatcctggtgcacaccgcctacgatgagagcaccgacgagaacgtgatgctgctgacctctgacgcccctgagtacaagccttgggctctcgtgatccaggacagcaacggcgagaacaagatcaagatgctgagcggcggctctggtggctctggcggatctacaaacctgtccgatattattgagaaagaaaccgggaaacagctcgtgattcaagagtctattctcatgctcccggaagaagtcgaggaagtcattggaaacaagcctgagagcgatattctggtccatacagcctacgacgagtctaccgatgagaatgtcatgctcctcaccagcgacgctcccgagtataagccatgggcacttgtcattcaggactccaatggggaaaacaaaatcaaaatgctcccaaagaaaaaacgcaaggtggagggagctgataagcgcaccgccgatggttccgagttcgaaagccccaagaagaagaggaaagt[2091]胞苷脱氨酶1海七鳃鳗(七鳃鳗)替换rapobec1[2092]magyecvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtltmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgiplhlftlqtpllsgrvvwwrvlksggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlpkkkrkvegadkrtadgsefespkkkrk[2093]bgx29-d10a[2094]cattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatggctggcgatgagaacgtgcgggtgagtgaaaagctggacttcgacaccttcgagttccagttcgagaatctgcactacgccaccgagagacaccggacctacgtgatcttcgacgtgaaacctcagtctgccggcggcagaagccggcggctgtggggctacatcatcaacaaccctaacgtgtgccacgccgagctgatcctgatgagcatgatcgacagacacctggaaagcaaccccggcgtgtacgccatgacctggtacatgtcttggtccccatgtgccaactgcagcagcaagctgaacccctggctgaaaaacctgctggaggaacagggccacaccctgatgatgcacttcagcagaatctacgaccgggaccgcgagggcgaccacagaggcctgagaggactgaagcacgtgtccaacagcttcagaatgggcgtggtgggcagagccgaagtgaaggaatgcctggccgagtacgtggaagccagcagaagaacactgacctggctggatacaaccgagagcatggccgccaagatgagaaggaagctgttctgcatcctggtgcggtgcgccggcatgcgggaatctggcatgcctctgcacctgtttacccttaagagcggaggatctagcggcggctctagcggatctgagacacctggcacaagcgagtctgccacacctgagagtagcggcggatcttctggtggctctgacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgacaccaatctgagcgacatcatcgagaaagagacaggcaagcagctggtcatccaagagtccatcctgatgctgcctgaagaggtggaagaagtgatcggcaacaagcccgagtccgacatcctggtgcacaccgcctacgatgagagcaccgacgagaacgtgatgctgctgacctctgacgcccctgagtacaagccttgggctctcgtgatccaggacagcaacggcgagaacaagatcaagatgctgagcggcggctctggtggctctggcggatctacaaacctgtccgatattattgagaaagaaaccgggaaacagctcgtgattcaagagtctattctcatgctcccggaagaagtcgaggaagtcattggaaacaagcctgagagcgatattctggtccatacagcctacgacgagtctaccgatgagaatgtcatgctcctcaccagcgacgctcccgagtataagccatgggcacttgtcattcaggactccaatggggaaaacaaaatcaaaatgctcccaaagaaaaaacgcaaggtggagggagctgataagcgcaccgccgatggttccgagttcgaaagccccaagaagaagaggaaagtctaacc[2095]胞苷脱氨酶5海七鳃鳗(七鳃鳗)替换rapobec1[2096]magdenvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtlmmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgmplhlftlksggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdtnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlpkkkrkvegadkrtadgsefespkkkrk[2097]btx448(cmv-nls)[2098]ttgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatgagcagcgagacaggccctgtggctgtggatcctacactgcggagaagaatcgagccccacgagttcgaggtgttcttcgaccccagagagctgcggaaagagacatgcctgctgtacgagatcaactggggcggcagacactctatctggcggcacacaagccagaacaccaacaagcacgtggaagtgaactttatcgagaagtttacgaccgagcggtacttctgccccaacaccagatgcagcatcacctggtttctgagctggtccccttgcggcgagtgcagcagagccatcaccgagtttctgtccagatatccccacgtgaccctgttcatctatatcgcccggctgtaccaccacgccgatcctagaaatagacagggactgcgcgacctgatcagcagcggagtgaccatccagatcatgaccgagcaagagagcggctactgctggcggaacttcgtgaactacagccccagcaacgaagcccactggcctagatatcctcacctgtgggtccgactgtacgtgctggaactgtactgcatcatcctgggcctgcctccatgcctgaacatcctgagaagaaagcagcctcagctgaccttcttcacaatcgccctgcagagctgccactaccagagactgcctccacacatcctgtgggccaccggacttaagagcggaggatctagcggcggctctagcggatctgagacacctggcacaagcgagtctgccacacctgagagtagcggcggatcttctggcggctccgacaagaagtactctatcggactggccatcggcaccaactctgttggatgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaatctgatcggcgccctgctgttcgactctggcgaaacagccgaagccaccagactgaagagaaccgccaggcggagatacacccggcggaagaaccggatctgctacctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggacaagaagcacgagcggcaccccatcttcggcaacatcgtggatgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgagactgatctacctggctctggcccacatgatcaagttccggggccactttctgatcgagggcgatctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgcctctggcgtggacgccaaggctatcctgtctgccagactgagcaagagcagaaggctggaaaacctgatcgcccagctgcctggcgagaagaagaatggcctgttcggcaacctgattgccctgagcctgggactgacccctaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaatctgctggcccagatcggcgatcagtacgccgacttgtttctggccgccaagaacctgtccgacgccatcctgctgagcgatatcctgagagtgaacaccgagatcacaaaggcccctctgagcgcctctatgatcaagagatacgacgagcaccaccaggatctgaccctgctgaaggccctcgttagacagcagctgccagagaagtacaaagagattttcttcgatcagtccaagaacggctacgccggctacattgatggcggagccagccaagaggaattctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctggtcaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaatggctctatccctcaccagatccacctgggagagctgcacgccattctgcggagacaagaggacttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttcaggatcccctactacgtgggaccactggccagaggcaatagcagattcgcctggatgaccagaaagagcgaggaaaccatcacaccctggaacttcgaggaagtggtggacaagggcgccagcgctcagtccttcatcgagcggatgaccaacttcgataagaacctgcctaacgagaaggtgctgcccaagcactccctgctgtatgagtacttcaccgtgtacaacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgcctttctgagcggcgagcagaaaaaggccattgtggatctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgacagcgtggaaatcagcggcgtggaagatcggttcaatgccagcctgggcacataccacgacctgctgaaaattatcaaggacaaggacttcctggacaacgaagagaacgaggacattctcgaggacatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacatacgcccacctgttcgacgacaaagtgatgaagcaactgaagcggaggcggtacacaggctggggcagactgtctcggaagctgatcaacggcatccgggataagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccaaggcgattctctgcacgagcacattgccaacctggccggatctcccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagcttgtgaaagtgatgggcagacacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacacagaagggccagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatggacgggatatgtacgtggaccaagagctggacatcaaccggctgagcgactacgatgtggaccatatcgtgccccagagctttctgaaggacgactccatcgataacaaggtcctgaccagaagcgacaagaaccggggcaagagcgataacgtgccctccgaagaggtggtcaagaagatgaagaactactggcgacagctgctgaacgccaagctgattacccagcggaagttcgataacctgaccaaggccgagagaggcggcctgagcgaacttgataaggccggcttcattaagcggcagctggtggaaacccggcagatcaccaaacacgtggcacagattctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtcatcaccctgaagtctaagctggtgtccgatttccggaaggatttccagttctacaaagtgcgggaaatcaacaactaccatcacgcccacgacgcctacctgaatgccgttgttggaacagccctgatcaagaagtatcccaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgaacaagagatcggcaaggctaccgccaagtactttttctacagcaacatcatgaactttttcaagacagagatcaccctggccaacggcgagatccggaaaagacccctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggcagagattttgccacagtgcggaaagtgctgagcatgccccaagtgaatatcgtgaagaaaaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcctaagcggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgatagccctaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaaaaagctcaagagcgtgaaagagctgctggggatcaccatcatggaaagaagcagctttgagaagaacccgatcgactttctggaagccaagggctacaaagaagtcaagaaggacctcatcatcaagctccccaagtacagcctgttcgagctggaaaatggccggaagcggatgctggcctcagcaggcgaactgcagaaaggcaatgaactggccctgcctagcaaatacgtcaacttcctgtacctggccagccactatgagaagctgaagggcagccccgaggacaatgagcaaaagcagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaacctggataaggtgctgtctgcctataacaagcaccgggacaagcctatcagagagcaggccgagaatatcatccacctgtttaccctgaccaacctgggagcccctgccgccttcaagtacttcgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccacactgatccaccagtctatcaccggcctgtacgaaacccggatcgacctgtctcagctcggcggcgattctggtggttctggcggaagtggcggatccaccaatctgagcgacatcatcgaaaaagagacaggcaagcagctcgtgatccaagaatccatcctgatgctgcctgaagaggttgaggaagtgatcggcaacaagcctgagtccgacatcctggtgcacaccgcctacgatgagagcaccgatgagaacgtcatgctgctgacaagcgacgcccctgagtacaagccttgggctctcgtgattcaggacagcaatggggagaacaagatcaagatgctgagcggaggtagcggaggcagtggcggaagcacaaacctgtctgatatcattgaaaaagaaaccgggaagcaactggtcattcaagagtccattctcatgctcccggaagaagtcgaggaagtcattggaaacaaacccgagagcgatattctggtccacacagcctatgacgagtctacagacgaaaacgtgatgctcctgacctctgacgctcccgagtataagccctgggcacttgttatccaggactctaacggggaaaacaaaatcaaaatgttgtccggcggcagcaagcggacagccgatggatctgagttcgagagccccaagaagaaacggaaggtggagtgaccggtcatc[2099]apobec1(大鼠)[2100]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglksggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggskrtadgsefespkkkrk[2101]碱基编辑器bgx5-d10a包括猩猩apobec1、spcas9d10a、cmv启动子和sv40nls。bgx27-d10a包括pmcda1腺苷脱氨酶、spcas9d10a、cmv启动子和sv40nls。bgx29-d10a包括pmcda5、spcas9d10a、cmv启动子和sv40nls。btx448包括rapobec1、spcas9d10a、cmv启动子和sv40nls。[2102]若需要,将rapobec1替换为apobec1婆罗洲猩猩、胞苷脱氨酶1海七鳃鳗(七鳃鳗)或胞苷脱氨酶5海七鳃鳗(七鳃鳗)。[2103]可用于c到t碱基编辑器中的胞苷脱氨酶包括,例如,以下任一种:[2104]rapobec-1褐家鼠(rattusnorvegicus)[2105]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[2106]mapobec-1小家鼠(musmusculus)[2107]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsvwrhtsqntsnhvevnflekftteryfrpntrcsitwflswspcgecsraiteflsrhpyvtlfiyiarlyhhtdqrnrqglrdlissgvtiqimteqeycycwrnfvnyppsneaywpryphlwvklyvlelyciilglppclkilrrkqpqltfftitlqtchyqripphllwatglk[2108]maapobec-1金黄仓鼠(mesocricetusauratus)[2109]mssetgpvvvdptlrrriephefdaffdqgelrketcllyeirwggrhniwrhtgqntsrhveinfiekftseryfypstrcsivwflswspcgecskaiteflsghpnvtlfiyaarlyhhtdqrnrqglrdlisrgvtirimteqeycycwrnfvnyppsnevywprypnlwmrlyalelycihlglppclkikrrhqypltffrlnlqschyqripphilwatgfi[2110]hapobec-1智人(homosapiens)[2111]mtsekgpstgdptlrrriepwefdvfydprelrkeacllyeikwgmsrkiwrssgknttnhvevnfikkftserdfhpsmscsitwflswspcwecsqaireflsrhpgvtlviyvarlfwhmdqqnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhltffrlhlqnchyqtipphillatglihpsvawr[2112]ppapobec-1婆罗洲猩猩(pongopygmaeus)[2113]mtsekgpstgdptlrrrieswefdvfydprelrketcllyeikwgmsrkiwrssgknttnhvevnfikkftserrfhssiscsitwflswspcwecsqaireflsqhpgvtlviyvarlfwhmdqrnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhlaffrlhlqnchyqtipphillatglihpsvtwr[2114]ocapobec1穴兔(oryctolaguscuniculus)[2115]masekgpsnkdytlrrriepwefevffdpqelrkeacllyeikwgassktwrssgknttnhvevnflekltsegrlgpstccsitwflswspcwecsmaireflsqhpgvtliifvarlfqhmdrrnrqglkdlvtsgvtvrvmsvseycycwenfvnyppgkaaqwprypprwmlmyalelyciilglppclkisrrhqkqltffsltpqychykmippyillatgllqpsvpwr[2116]mdapobec-1灰短尾负鼠(monodelphisdomestica)[2117]mnsktgpsvgdatlrrrikpwefvaffnpqelrketcllyeikwgnqniwrhsnqntsqhaeinfmekftaerhfnssvrcsitwflswspcwecskairkfldhypnvtlaifisrlywhmdqqhrqglkelvhsgvtiqimsyseyhycwrnfvdypqgeedywpkypylwimlyvlelhciilglppclkisgshsnqlalfsldlqdchyqkipynvlvatglvqpfvtwr[2118]mapobec-2小家鼠(musmusculus)[2119]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvvevqskggqaqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[2120]hapobec-2智人(homosapiens)[2121]maqkeeaavateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweepeiqaalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[2122]ppapobec-2婆罗洲猩猩(pongopygmaeus)[2123]maqkeeaaaateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweeleiqdalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[2124]btapobec-2黄牛(bostaurus)[2125]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnveyssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[2126]mapobec-3小家鼠(musmusculus)[2127]mqpqrlgpragmgpfclgcshrkcyspirnlisqetfkfhfknlgyakgrkdtflcyevtrkdcdspvslhhgvfknkdnihaeicflywfhdkvlkvlspreefkitwymswspcfecaeqivrflathhnlsldifssrlynvqdpetqqnlcrlvqegaqvaamdlyefkkcwkkfvdnggrrfrpwkrlltnfryqdsklqeilrpcyisvpssssstlsnicltkglpetrfwvegrrmdplseeefysqfynqrvkhlcyyhrmkpylcyqleqfngqaplkgcllsekgkqhaeilfldkirsmelsqvtitcyltwspcpncawqlaafkrdrpdlilhiytsrlyfhwkrpfqkglcslwqsgilvdvmdlpqftdcwtnfvnpkrpfwpwkgleiisrrtqrrlrrikeswglqdlvndfgnlqlgppms[2128]hapobec-3a智人(homosapiens)[2129]measpasgprhlmdphiftsnfnngigrhktylcyeverldngtsvkmdqhrgflhnqaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefkhcwdtfvdhqgcpfqpwdgldehsqalsgrlrailqnqgn[2130]hapobec-3b智人(homosapiens)[2131]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgqvyfkpqyhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflsehpnvtltisaarlyyywerdyrralcrlsqagarvtimdyeefaycwenfvynegqqfmpwykfdenyaflhrtlkeilrylmdpdtftfnfnndplvlrrrqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqnqgn[2132]hapobec-3c智人(homosapiens)[2133]mnpqirnpmkamypgtfyfqfknlweandrnetwlcftvegikrrsvvswktgvfrnqvdsethchaercflswfcddilspntkyqvtwytswspcpdcagevaeflarhsnvnltiftarlyyfqypcyqeglrslsqegvaveimdyedfkycwenfvyndnepfkpwkglktnfrllkrrlreslq[2134]hapobec-3d智人(homosapiens)[2135]mnpqirnpmermyrdtfydnfenepilygrsytwlcyevkikrgrsnllwdtgvfrgpvlpkrqsnhrqevyfrfenhaemcflswfcgnrlpanrrfqitwfvswnpclpcvvkvtkflaehpnvtltisaarlyyyrdrdwrwvllrlhkagarvkimdyedfaycwenfvcnegqpfmpwykfddnyaslhrtlkeilrnpmeamyphifyfhfknllkacgrneswlcftmevtkhhsavfrkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlcyfwdtdyqeglcslsqegasvkimgykdfvscwknfvysddepfkpwkglqtnfrllkrrlreilq[2136]hapobec-3f智人(homosapiens)[2137]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrprldakifrgqvysqpehhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvysegqpfmpwykfddnyaflhrtlkeilrnpmeamyphifyfhfknlrkaygrneswlcftmevvkhhspvswkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlyyfwdtdyqeglrslsqegasveimgykdfkycwenfvynddepfkpwkglkynflfldsklqeile[2138]hapobec-3g智人(homosapiens)[2139]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrppldakifrgqvyselkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdmatflaedpkvtltifvarlyyfwdpdyqealrslcqkrdgpratmkimnydefqhcwskfvysqrelfepwnnlpkyyillhimlgeilrhsmdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisimtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen[2140]hapobec-4智人(homosapiens)[2141]mepiyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygttfpqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiilysnnspcneanhcciskmynflitypgitlsiyfsqlyhtemdfpasawnrealrslaslwprvvlspisggiwhsvlhsfisgvsgshvfqpiltgraladrhnayeinaitgvkpyftdvllqtkrnpntkaqealesyplnnafpgqffqmpsgqlqpnlppdlrapvvfvlvplrdlppmhmgqnpnkprnivrhlnmpqmsfqetkdlgrlptgrsveiveiteqfasskeadekkkkkgkk[2142]mapobec-4小家鼠(musmusculus)[2143]mdsllmkqkkflyhfknvrwakgrhetylcyvvkrrdsatscsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvaeflrwnpnlslriftarlyfcedrkaepeglrrlhragvqigimtfkdyfycwntfvenrertfkaweglhensvrltrqlrrillplyevddlrdafrmlgf[2144]rapobec-4褐家鼠(rattusnorvegicus)[2145]meplyeeylthsgtivkpyywlsvslnctncpyhirtgeearvpytefhqtfgfpwstypqtkhltfyelrsssgnliqkglasnctgshthpesmlferdgyldslifhdsnirhiilysnnspcdeanhcciskmynflmnypevtlsvffsqlyhtenqfptsawnrealrglaslwpqvtlsaisggiwqsiletfvsgisegltavrpftagrtltdrynayeincitevkpyftdalhswqkenqdqkvwaasenqplhnttpaqwqpdmsqdcrtpavfmlvpyrdlppihvnpspqkprtvvrhlntlqlsaskvkalrkspsgrpvkkeearkgstrsqeanetnkskwkkqtlfiksnichllereqkkigilsswsv[2146]mfapobec-4食蟹猴(macacafascicularis)[2147]meptyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygttypqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiilycnnspcneanhcciskvynflitypgitlsiyfsqlyhtemdfpasawnrealrslaslwprvvlspisggiwhsvlhsfvsgvsgshvfqpiltgraltdrynayeinaitgvkpfftdvllhtkrnpntkaqmalesyplnnafpgqsfqmtsgippdlrapvvfvllplrdlppmhmgqdpnkprniirhlnmpqmsfqetkdlerlptrrsvetveiterfasskqaeektkkkkgkk[2148]haid智人(homosapiens)[2149]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[2150]claid家犬亚种(canislupusfamiliaris)[2151]mdsllmkqrkflyhfknvrwakgrhetylcyvvkrrdsatsfsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslrifaarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenrektfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[2152]btaid黄牛(bostaurus)[2153]mdsllkkqrqflyqfknvrwakgrhetylcyvvkrrdsptsfsldfghlrnkagchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslriftarlyfcdkerkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[2154]maid小家鼠(musmusculus)[2155]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[2156]pmcda-1海七鳃鳗(petromyzonmarinus)[2157]magyecvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtltmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgiplhlftlqtpllsgrvvwwrv[2158]pmcda-2海七鳃鳗(petromyzonmarinus)[2159]melrevvdcalascvrheplsrvaflrcfaapsqkprgtvilfyvegagrgvtgghavnynkqgtsihaevlllsavraallrrrrcedgeeatrgctlhcystyspcrdcveyiqefgastgvrvvihccrlyeldvnrrrseaegvlrslsrlgrdfrlmgprdaialllggrlantadgesgasgnawvtetnvveplvdmtgfgdedlhaqvqrnkqireayanyasavslmlgelhvdpdkfpflaeflaqtsvepsgtpretrgrprgassrgpeigrqrpadferalgayglflhprivsreadreeikrdlivvmrkhnyqgp[2160]pmcda-5海七鳃鳗(petromyzonmarinus)[2161]magdenvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtlmmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgmplhlft[2162]ycd酿酒酵母(saccharomycescerevisiae)[2163]mvtggmaskwdqkgmdiayeeaalgykeggvpiggclinnkdgsvlgrghnmrfqkgsatlhgeistlencgrlegkvykdttlyttlspcdmctgaiimygiprcvvgenvnfkskgekylqtrghevvvvdderckkimkqfiderpqdwfedige[2164]rapobec-1(δ177-186)[2165]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrglppclnilrrkqpqltfftialqschyqrlpphilwatglk[2166]rapobec-1(δ202-213)[2167]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqhyqrlpphilwatglk[2168]所使用的grna涵盖用于具有三核苷酸重复序列扩张的ar基因的支架序列和间隔序列(靶标序列)。用于在基因组ar核酸序列的外显子1的5'末端处进行碱基编辑的靶标序列如下:[2169]5'-agtgcagttagggctgggaa-3'(图80)。[2170]如图81和82a至82i中可见,使用图中引用的grna,所使用的cbe全部提供有效的c到t碱基编辑。与对照物相比,所测定的cbe变体全部具有碱基编辑活性。[2171]如图82a至82i中观察到的,使用向导9在所靶向的c处实现了超过63%的碱基编辑。将终止密码子引入外显子1中导致了ar的功能性敲除,如图83a和83b中所示,在该处观察到了超过60%的编辑。用来产生图81和82a至82i中的结果的具体序列和向导如下:[2172]向导8(u6至sgrna支架)[2173]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgacttaccgcatgtccccgtagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2174]向导9(u6至sgrna支架)[2175]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgagtgcagttagggctgggaagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2176]向导10(u6至sgrna支架)[2177]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgaagtgcagttagggctgggagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2178]向导11(u6至sgrna支架)[2179]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgacctaccgaggagctttccgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2180]向导12(u6至sgrna支架)[2181]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgttccagagcgtgcgcgaaggttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2182]向导13(u6至sgrna支架)[2183]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgtttccagtttggagactgccgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2184]向导14(u6至sgrna支架)[2185]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgttccagtttggagactgccagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2186]向导15(u6至sgrna支架)[2187]tacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgtccaccccagaagacctgccgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt[2188]所使用的pam序列是nggpam(即,spcas9),其中n可以是g、a、c或t中的任一种。具有pam的向导以粗体显示:表35中所示的以斜体表示的核苷酸是被靶向以进行编辑的核苷酸。[2189]表35a[2190][2191][2192]表35b[2193][2194]向导编辑资料[2195]表36-40中引用的编辑器与所设计的向导合用,以完成度上表35中所示的ar靶标核苷酸的编辑。[2196]表36[2197]ꢀ“向导8”‑abe平均abe8.129.88abe8.225.57abe8.326.69abe8.428.26abe8.511.27abe8.624.00abe8.738.32abe8.837.86abe8.930.64abe8.1033.17abe8.1120.42abe8.1234.48abe8.1329.34abe8.1432.05abe7.1025.87对照0.06[2198]表37[2199]ꢀ“向导14”‑abe平均abe8.16.13abe8.28.19abe8.37.85abe8.49.44abe8.51.06abe8.64.85abe8.712.26abe8.830.14abe8.928.30abe8.1015.06abe8.1115.76abe8.1211.96abe8.1330.93abe8.1421.66abe7.107.38对照0.04[2200]表38[2201][2202][2203]表39[2204][2205]表40[2206]ꢀ“向导10”‑cbe-位于位置6的c至t总数的平均值bgx5-d10a43.08bgx27-d10a37.34bgx29-d10a30.40btx44844.04对照0.04[2207]用来编辑ar基因的方法如本文所提供或如基于熟练从业人员的知识所确定的,并且如本领域熟练从业人员所理解的。(参见例如,komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017))和rees,h.a.等人,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1)。[2208]本文所述实施例中提供的结果是使用下述材料和方法获得的。[2209]克隆。[2210]所使用的靶标核苷酸的dna序列以及grna和引入在本文中描述。对于grna,呈现了下列支架序列:guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。这一支架用于nggpam;上文所列的grna涵盖用于ar的支架序列和间隔序列(靶标序列)。[2211]使用verasequltradna聚合酶(enzymatics)或q5hotstart高保真dna聚合酶(newenglandbiolabs)执行pcr。使用user克隆(newenglandbiolabs)构建碱基编辑器(be)质粒。将脱氨酶基因合成为gblocks基因片段(integrateddnatechnologies)。cas9基因从先前报导的质粒获得。将脱氨酶和融合基因克隆到pcmv(经哺乳动物密码子优化的)或pet28b(经大肠杆菌密码子优化的)主链中。使用定点诱变构建sgrna表达质粒。[2212]简单地说,根据制造商的使用说明书,使用t4多核苷酸激酶(newenglandbiolabs)将上文所列的引物5'磷酸化。接着,使用q5暖开机高保真聚合酶(newenglandbiolabs)和磷酸化的引物以及编码感兴趣基因的质粒作为范本,根据制造商的使用说明书执行pcr。根据制造商的使用说明书,将pcr产物用dpni(20u,newenglandbiolabs)在37℃培育1小时,在qiaprep吸附柱(qiagen)上纯化,并使用quickligase(newenglandbiolabs)连接。使用mach1感受态细胞(thermofisherscientific)完成dna载体扩增。[2213]碱基编辑器的表达和纯化[2214]使用质粒(例如,编码碱基编辑器bgx5-d10a、bgx27-d10a、bgx29-d10a和btx448的质粒)转化大肠杆菌bl21star(de3)感受态细胞(thermofisherscientific)。[2215]使所得表达株在含有100μgml-1的卡那霉素的luria-bertani(lb)培养液中在37℃生长过夜。将细胞以1:100稀释到相同的生长培养基中,并且在37℃生长至od600=~0.6。将培养物冷却至4℃,冷却历时2h,添加0.5mm的异丙基-β-d-1-硫代吡喃半乳糖苷(iptg)以诱导蛋白质表达。~16h之后,通过以4,000g离心收集细胞,重新悬浮在裂解缓冲液(50mm三(羟甲基)-氨基甲烷(tris)-hcl(ph7.5)、1mnacl、20%甘油、10mm三(2-羧基乙基)膦(tcep,soltecventures))中。通过超声波处理(开启脉冲20秒,关闭脉冲20秒,总计回圈8分钟,6w输出)将细胞裂解,分离裂解上清液,然后以25,000g离心15分钟。裂解液与his-pur镍-次氮基乙酸(镍-nta)树脂(thermofisherscientific)在4℃培育1小时,以捕获带his标签的融合蛋白。将树脂转移到柱中,并且用40ml裂解缓冲液洗涤。将带his标签的融合蛋白洗脱在以285mm咪唑补充的裂解缓冲液中,通过超滤(amicon-millipore,100-kda分子量截留)浓缩至总体积为1ml。在含有50mm三(羟甲基)-氨基甲烷(tris)-hcl(ph7.0)、0.1mnacl、20%甘油、10mmtcep的低盐纯化缓冲液中将蛋白质稀释至20ml,并载入到sp琼脂糖快速流动树脂(gelifesciences)上。用40ml的这一低盐缓冲液洗涤树脂,用5ml的含有50mm三(羟甲基)-氨基甲烷(tris)-hcl(ph7.0)、0.5mnacl、20%甘油、10mmtcep的活性缓冲液洗脱蛋白质。洗脱的蛋白质通过sds–page定量。[2216]sgrna的体外转录。[2217]根据制造商的使用说明书,使用transcriptaidt7高产转录试剂盒(thermofisherscientific)对含有cmv启动子和随后的sgrna靶标序列的线性dna片段进行体外转录。根据制造商的使用说明书,使用megaclear试剂盒(thermofisherscientific)纯化sgrna产物,并通过uv吸收进行定量。[2218]cy3偶联dsdna底物的制备。[2219]通常,未标记的序列链(例如,80-nt未标记链的序列)作为经page纯化的寡核苷酸从idt获得。与每个80-nt底物的3'末端互补的25-ntcy3标记的引物作为经hplc纯化的寡核苷酸获自idt。为了产生cy3标记的dsdna底物,将80-nt链(5μl的100μm溶液)与cy3标记的引物(5μl的100μm溶液)在nebuffer2(38.25μl的50mmnacl、10mmtris-hcl、10mmmgcl2、1mmdtt,ph7.9溶液,newenglandbiolabs)中与dntp(0.75μl的100mm溶液)合并,加热至95℃,保持5min,然后以0.1℃/s的速率逐渐冷却至45℃。这一退火过程后,添加klenowexo–(5u,newenglandbiolabs),并将反应在37℃培育1h。溶液用缓冲液pb(250μl,qiagen)和异丙醇(50μl)吸收,并且在qiaprep旋转柱(qiagen)上纯化,用50μl的tris缓冲液洗脱。对dsdna进行脱氨酶测定。将纯化的融合蛋白(20μl,1.9μm在活性缓冲液中)与1当量的适宜sgrna合并,并且在环境温度培育5min。添加cys标记的dsdna底物至最终浓度为125nm,并将所得溶液在37℃培育2h。通过添加缓冲pb(100μl,qiagen)和异丙醇(25μl)将dsdna从融合物中分离,并且在econospin微型旋转柱(epochlifescience)上纯化,用20μl的cutsmart缓冲液(newenglandbiolabs)洗脱。将user酶(1u,newenglandbiolabs)添加至经纯化、编辑的dsdna中,并在37℃培育1h。通过将5μl的反应溶液与15μl的基于dmso的载入缓冲液(5mmtris、0.5mmedta、12.5%甘油、0.02%溴酚蓝、0.02%二甲苯青、80%dmso)合并,将cy3标记的链从其补体完全变性。在10%tbe-脲凝胶(bio-rad)上将全长度的含c底物与任何裂解的含u经编辑底物分离,并且在geamershamtyphoon成像仪上成像。[2220]制备经体外编辑的dsdna进行高通量测序。[2221]寡核苷酸获自idt。将互补序列合并(5μl的100μm溶液)在tris缓冲液中,并通过下述退火以产生60-bpdsdna底物:加热至95℃,持续5min,然后以0.1℃/s的速率逐渐冷却至45℃。将纯化的融合蛋白(20μl,1.9μm在活性缓冲液中)与1当量的适宜sgrna合并,并且在环境温度培育5min。添加60-merdsdna底物至最终浓度为125nm,并将所得溶液在37℃培育2h。通过添加缓冲pb(100μl,qiagen)和异丙醇(25μl)将dsdna从融合物中分离,并且在econospin微型旋转柱(epochlifescience)上纯化,用20μl的tris缓冲液洗脱。根据制造商的使用说明书,通过使用高通量测序引物对和verasequltra(enzymatics)的pcr扩增所得经编辑的dna(使用1μl作为范本),采用13次扩增回圈。使用rapidtips(diffinitygenomics)纯化pcr产物,如先前所述,经纯化的dna使用含有测序适配物的pcr扩增,纯化,并在miseq高通量dna测序仪(illumina)上测序。[2222]细胞培养。[2223]在37℃和5%co2下,将hek293t(atcccrl-3216)维持在以10%(v/v)胎牛血清(fbs)补充的杜尔贝科改进伊格尔培养基加上glutamax(thermofisher)中。将含有感兴趣的基因(例如,包含三核苷酸重复扩张的突变ar基因)的永生化细胞(taconicbiosciences)在以10%(v/v)胎牛血清(fbs)和200μg/ml遗传毒素(thermofisherscientific)补充的杜尔贝科改进伊格尔培养基加上glutamax(thermofisherscientific)中培养。[2224]转染。[2225]将hek293t细胞接种在胶原包被的biocoat48孔板(corning)上,并在大约85%融合下转染。简单地说,根据制造商的建议,使用每孔1.5μl的lipofectamine2000(thermofisherscientific)转染750ng的be和250ng的sgrna表达质粒。根据制造商的使用说明书,使用适宜的amaxanucleofectorii程式(v试剂盒,使用针对hek293t细胞的程式q-001的)转染hek293t细胞。[2226]基因组dna样品的高通量dna测序。[2227]3天后,收获被转染的细胞,并根据制造商的使用说明书,使用agencourtdnadvance基因组dna分离试剂盒(beckmancoulter)分离基因组dna。使用侧翼高通量测序引物对,通过pcr扩增感兴趣的上靶和脱靶基因组区域。根据制造商的使用说明书,使用phusion高保真度dna聚合酶(thermofisher),使用5ng的基因组dna作为范本,完成pcr扩增。针对每个引物对独立地确定回圈次数,以确保反应在扩增的线性范围内终止。使用rapidtips(diffinitygenomics)纯化pcr产物。经纯化的dna通过使用含有测序适配物的引物的pcr进行扩增。对产物进行凝胶纯化,并使用quant-itpicogreendsdna测定试剂盒(thermofisher)和kapa文库定量试剂盒-illumina(kapabiosystems)进行定量。如先前所述,在illuminamiseq上对样品进行测序(pattanayak,naturebiotechnol.31,839–843(2013))。[2228]资料分析。[2229]使用miseqreporter(illumina)自动分解测序读取,并使用自订matlab分析单个fastq档。使用smith-waterman演算法将每个读取与参考序列成对地比对。将q分低于31的碱基调用替换为n,并因此将其从计算核苷酸频率中排除。该处理获得大约千分之一的预期miseq碱基调用错误率。将其中读取和参考序列不含空位的被比对序列存储在比对表中,从该表中可以列出每个基因座的碱基频率。使用自订matlab脚本,使用先前所述的策略,对插入缺失频率进行定量(zuris等人,naturebiotechnol.33,73–80(2015)。对测序读取进行扫描,以获得与位于插入缺失可能发生的视窗两侧的两个10-bp序列的精确匹配。如果没有定位到精确匹配,则将该读取从分析中排除。如果这一插入缺失窗的长度与参考序列确切匹配,则将该读取归类为不含插入缺失。如果插入缺失窗比参考序列长或短两个或更多个碱基,则将该测序读取分别归类为插入或缺失。[2230]实施例12:使用腺苷碱基编辑器(abe)或胞苷碱基编辑器(cbe)来中断ar多核苷酸中的剪接受体位点和剪接供体位元点或者将终止密码子分别引入ar基因的外显子1或外显子2中。[2231]本实施例中,使用a到g碱基编辑器系统将精确的c到t突变引入突变ar基因的外显子1中的编码谷氨酰胺的cag密码子处,该突变基因包括扩张的三核苷酸重复序列。c到t碱基变化将靶标“cag”核酸序列转化为tag,这导致蛋白质的提前终止。在其他实施方案中,本发明的cbe将caa密码子改变为taa,将cga密码子改变为tga,或将tgg密码子改变为tga、tag或taa。此外,使用a到g碱基编辑器系统将精确的a到g突变引入突变ar基因的外显子1中的剪接供体位点处,该突变基因包括扩张的三核苷酸重复序列。还使用a到g碱基编辑器系统在外显子2之前紧邻该外显子的剪接受体位点中产生精确的a到g突变。在每个实施例中,在hek293t细胞系中测试碱基编辑。腺苷碱基编辑器和胞苷碱基编辑器的序列在实施例11中和本技术的多个段落中描述。[2232]所使用的grna涵盖用于具有三核苷酸重复序列扩张的ar基因的支架序列和间隔序列(靶标序列)。用于在基因组ar核酸序列的外显子1的5'末端处进行碱基编辑的靶标序列如下:[2233]5'-agtgcagttagggctgggaa-3'(图80)。[2234]通过有效地靶向ar基因组核酸序列中的剪接受体中的“a”核碱基并在该靶向位点处转化a》g,使用abe在外显子2之前紧邻该外显子的剪接受体位点中产生精确的a到g突变。使用向导rna(grna)与abe8碱基编辑器变体(即,abe8.1至abe8.14)和abe7.10协同作用来靶向“ag”剪接受体核酸的靶标腺苷(“a”)(图85)。此外,通过有效地靶向ar基因组核酸序列的外显子1处的“c”核碱基并在该靶向位点处转化c》t,使用cbe将精确的c到t突变引入突变ar基因的外显子1中的编码谷氨酰胺(gln)的cag密码子中。使用向导rna(grna)与cbe碱基编辑器变体(例如,be4或bgx5、bgx27、bgx29、btx448)协同作用来靶向靶标胞苷(“c”)(图84a、86a、87a和88)。在hek293t细胞系中测试碱基编辑。[2235]图84b、86b、87b和89至93显示使用不同grna测试的abe和cbe碱基编辑器的a到g或c到t碱基编辑效率,如通过深度测序pcr产物所检测的。[2236]在表41a中,描述了grna核酸序列和pam序列。[2237]表41a[2238][2239]在表41b中,呈现了针对几种grna和abe/cbe的位于靶点处的最高上靶碱基编辑。[2240]表41b[2241][2242][2243]在表42至46中,显示了与对照物相比,使用本文所述的多种不同的abe8(或abe7.10)腺苷碱基编辑器、pv腺苷碱基编辑器或cbe(诸如be4和bgx变体)以及不同的sgrna实现的靶标位点处或靶标位点附近(例如,旁观者)的a到g或c到t碱基编辑的百分比。[2244]表42.sbma向导8[2245][2246]表43.sbma向导9[2247][2248]表44sbma向导10[2249][2250][2251]表45.sbma向导11[2252][2253][2254]表46.sbma向导12[2255][2256]序列[2257]在下述序列中,小写字母表示卡那霉素耐药性启动子区域,粗体序列指示靶向失活部分(q4*和w15*),斜体序列表示卡那霉素耐药基因的靶向失活位点(d208n),而底线序列表示pam序列。[2258]无活性的卡那霉素耐药基因:[2259][2260][2261]在下述序列中,普通文本表示腺苷脱氨酶序列,粗体序列指示衍生自cas9的序列,斜体序列表示连接子序列,底线序列表示二分体核定位序列,而双底线序列指示突变。[2262]cp5(具有msp“ngc”pid和“d10a”切口酶):[2263][2264]abe8.1_y147t_cp5_ngcpam_单体[2265][2266][2267]pnmg-b335abe8.1_y147t_cp5_ngcpam_单体[2268][2269][2270]具有ngcpamcp5的pnmg-357_abe8.14[2271][2272]abe8.8-m[2273][2274][2275]abe8.8-d[2276][2277]abe8.13-m[2278][2279][2280]abe8.13-d[2281][2282]abe8.17-m[2283][2284][2285]abe8.17-d[2286][2287]abe8.20-m[2288][2289][2290]abe8.20-d[2291][2292]01.monoabe8.1_bpnls y147t[2293]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2294]02.monoabe8.1_bpnls y147r[2295]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2296]03.monoabe8.1_bpnls q154s[2297]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2298]04.monoabe8.1_bpnls y123h[2299]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2300]05.monoabe8.1_bpnls v82smsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2301]06.monoabe8.1_bpnls t166r[2302]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2303]07.monoabe8.1_bpnls q154r[2304]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2305]08.monoabe8.1_bpnls y147r_q154r_y123h[2306]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2307]09.monoabe8.1_bpnls y147r_q154r_i76y[2308]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2309]10.monoabe8.1_bpnls y147r_q154r_t166r[2310]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2311]11.monoabe8.1_bpnls y147t_q154r[2312]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2313]12.monoabe8.1_bpnls y147t_q154s[2314]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2315]13.monoabe8.1_bpnls h123y123h_y147r_q154r_i76y[2316]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2317]14.monoabe8.1_bpnls v82s q154r[2318]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[2319]其它实施方案[2320]从前述说明书可知,可对本文所述的发明作出改变和修改以令其适应各种用途和条件。此类实施方案也处于所附权利要求书的范畴内。[2321]本文中,对任何变数定义中一系列元件的描述包括该变数作为任何单一元件或作为所列元件的组合(或亚组合)的定义。对本文中实施方案的描述包括该实施方案作为任何单一实施方案或作为与任何其它实施方案或其部分的组合。[2322]本说明书中提及的全部出版物、专利和专利申请通过引用并入本文,其并入程度与各独立的出版物、专利或专利申请具体且独立地指明以待通过引用并入相同。如果不另外指明,则本说明书中提及的出版物、专利和专利申请通过引用而以其整体并入本文。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献