核酶介导的RNA组装和表达

2022-11-14 03:01:08 来源：中国专利 TAG：

核酶介导的rna组装和表达
1.相关申请的引证
2.本技术要求2020年2月7日提交的美国临时专利申请号62/971,356的优先权，该美国临时专利申请的内容通过引用整体并入本文。

背景技术：

3.在某些情况下，由于质粒和载体的大小限制，全长蛋白的表达受到限制。例如，在治疗环境中，一些编码全长蛋白的核酸超过了aav的包装大小，从而限制了它们在基因治疗环境中的适用性。此外，某些生物学和工业相关的蛋白含有大量重复，这可能使表达变得困难。
4.因此，本领域需要改进的用于有效蛋白表达的组合物和方法。本发明满足了这一未被满足的需求。

技术实现要素：

5.在一个实施方案中，本发明包括用于产生编码目的蛋白的rna分子的系统，该系统包含：编码第一rna分子的核酸分子，该第一rna分子包含编码目的蛋白的第一部分的编码区和3'核酶；和编码第二rna分子的核酸分子，该第二rna分子包含编码目的蛋白的第二部分的编码区和5'核酶。
6.在一个实施方案中，3'核酶催化自身脱离第一rna分子，从而产生3'p或2'3'cp末端。在一个实施方案中，5'核酶催化自身脱离第二rna分子，从而产生5'oh末端。在一个实施方案中，3'p或2'3'cp末端连结到5'oh末端从而形成包含第一rna分子的编码区和第二rna分子的编码区的rna分子。在一个实施方案中，3'核酶是hdv核酶家族的成员。在一个实施方案中，所述5'核酶是hh核酶家族的成员。
7.在一个实施方案中，该系统进一步包含一种或多种编码一种或多种附加rna分子的附加核酸分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶。
8.在一个实施方案中，该系统进一步包含一种或多种编码一种或多种附加rna分子的附加核酸分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶识别序列。在一个实施方案中，该系统进一步包含与3'核酶识别序列相互作用的核酶，该核酶诱导3'识别序列的去除。在一个实施方案中，3'核酶识别序列包含vs-s并且其中该核酶是vs-rz。
9.在一个实施方案中，本发明涉及用于产生编码目的蛋白的rna分子的方法，该方法包括：向细胞或组织施用编码第一rna分子的核酸分子，该第一rna分子包含编码目的蛋白的第一部分的编码区和3'核酶；以及向细胞或组织施用编码第二rna分子的核酸分子，所述第二rna分子包含编码目的蛋白的第二部分的编码区和5'核酶。
10.在一个实施方案中，3'核酶催化自身脱离第一rna分子，从而产生3'p或2'3'cp末端。在一个实施方案中，5'核酶催化自身脱离第二rna分子，从而产生5'oh末端。在一个实施
方案中，3'p或2'3'cp末端连结到5'oh末端从而形成包含第一rna分子的编码区和第二rna分子的编码区的rna分子。在一个实施方案中，3'核酶是hdv核酶家族的成员。在一个实施方案中，所述5'核酶是hh核酶家族的成员。
11.在一个实施方案中，该方法进一步包括向细胞或组织施用一种或多种编码一种或多种附加rna分子的附加核酸分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶。
12.在一个实施方案中，该方法进一步包括向细胞或组织施用一种或多种编码一种或多种附加rna分子的附加核酸分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶识别序列。在一个实施方案中，该方法进一步包括向细胞或组织施用与3'核酶识别序列相互作用的核酶，该核酶诱导3'识别序列的去除。在一个实施方案中，3'核酶识别序列包含vs-s并且其中该核酶是vs-rz。在一个实施方案中，该方法进一步包括向细胞或组织施用连结酶以诱导rna分子的组装。在一个实施方案中，连结酶是rna2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。
13.在一个实施方案中，本发明包括产生编码目的蛋白的rna分子的体外方法，该方法包括：提供包含编码目的蛋白的第一部分的编码区和3'核酶的第一rna分子；提供包含编码目的蛋白的第二部分的编码区和5'核酶的第二rna分子；以及提供连结酶以诱导由第一rna分子的编码区和第二rna分子的编码区组装rna分子。
14.在一个实施方案中，本发明包括产生编码目的重复结构域蛋白的rna分子的体外方法，该方法包括以下步骤：a)提供包含编码目的蛋白的第一部分的编码区和3'核酶的第一rna分子；b)提供包含编码目的蛋白的结构域的编码区、5'核酶和3'核酶识别序列的一种或多种附加rna分子；c)提供连结酶以将该第一rna分子的编码区和该一种或多种附加rna分子的编码区连结；d)提供识别3'核酶识别序列并催化该3'核酶识别序列的去除的核酶；e)重复步骤b)-d)一次或多次以产生编码多个重复结构域的rna分子；f)提供包含编码目的蛋白的最后一个部分的编码区和5'核酶的最后一种rna分子；以及g)提供连结酶以将该一种或多种附加rna分子的编码区和该最后一种rna分子的编码区连结，从而产生编码重复结构域蛋白的完整rna分子。
15.在一个实施方案中，本发明包括治疗受试者中由目的大蛋白中的突变引起的疾病或病症的方法，该方法包括：向所述受试者施用包含编码目的蛋白的第一部分的编码区和3'核酶的第一核酸分子；以及向所述受试者施用包含编码目的蛋白的第二部分的编码区和5'核酶的第二核酸。
16.在一个实施方案中，该疾病或病症是选自由以下组成的组的一种或多种：杜氏肌营养不良症；常染色体隐性多囊肾病；血友病a；stargardt黄斑变性；肢带型肌营养不良；dfnb9；神经感觉非综合征性隐性耳聋；囊性纤维化；威尔逊病(wilson disease)；常染色体隐性三好肌营养不良和耳聋9型(miyoshi muscular dystrophy and deafness；autosomal recessive 9)；尤塞氏综合症i型和常染色体隐性耳聋2型；常染色体隐性耳聋3型和非综合征性听力损失；尤塞氏综合征i型；常染色体隐性耳聋16(dfnb16)；梅尼埃病(meniere'sdisease,md)；常染色体显性耳聋12型和常染色体隐性耳聋21型；尤塞氏综合征1f型(ush1f)和dfnb23；常染色体隐性耳聋28型和非综合征性听力损失；常染色体隐性耳聋30型和非综合征性听力损失；常染色体隐性耳脊椎肥大骨骺发育不良和常染色体显性耳椎肥大
骨骺发育不良；常染色体隐性耳聋77型和常染色体隐性非综合征性感觉神经性耳聋dfnb型；常染色体隐性非综合征性听力障碍dfnb84；常染色体隐性耳聋84b型和罕见性遗传性耳聋；常染色体显性周围神经病变、肌病、声音嘶哑和听力损失和耳聋4a型；先天性血小板减少症；感觉性听力损失；dfna56；hxb；常染色体显性耳聋56；六臂蛋白(hexabrachion)；癫痫性脑病；timothy综合征和长qt综合征8型；x-连锁视网膜病症；醛固酮增多症；脊髓小脑性共济失调42型；原发性醛固酮增多症；癫痫发作和神经系统异常和窦房结功能障碍和耳聋；神经发育病症；低钾性周期性麻痹；癫痫；发育性和癫痫性脑病；布罗迪肌病(brody myopathy)；darier氏病/心脏病；血管性血友病(von willebrand disease)和齐薇格综合征(zellweger syndrome)。
17.在一个实施方案中，本发明包括用于产生编码目的蛋白的rna分子和环状rna分子的系统，该环状rna分子包含编码以下的核酸：目的蛋白的第一部分；包含5'核酶、货物序列和3'核酶的合成内含子；和目的蛋白的第二部分。
18.在一个实施方案中，目的蛋白是选自由以下组成的组的一种或多种：治疗性蛋白、报告蛋白和cas9蛋白。
19.在一个实施方案中，货物序列是选自由以下组成的组的一种或多种：编码目的治疗性蛋白的序列、crispr指导rna序列、小rna序列和反式切割核酶序列。在一个实施方案中，所述小rna序列包括选自由以下组成的组的一种或多种：微rna(mirna)、piwi相互作用rna(pirna)、小干扰rna(sirna)、小核仁rna(snorna)、小trna来源的rna(tsrna)、小rdna来源的rna(srrna)和小核rna(snrna)。
20.在一个实施方案中，合成内含子的3'核酶是hh核酶家族的成员。在一个实施方案中，合成内含子的5'核酶是选自由以下组成的组的一种或多种：hdv核酶家族成员、hdv核酶家族成员和vs-s核酶识别序列。在一个实施方案中，该系统进一步包含选自由以下组成的组的一种或多种：rtcb连结酶和编码rtcb连结酶的核酸。
21.在一个实施方案中，本发明包括递送编码目的蛋白的rna分子和环状rna分子的方法，该方法包括向细胞或组织施用编码以下的核酸：目的蛋白的第一部分；包含顺式切割5'核酶、货物序列和顺式切割3'核酶的合成内含子；以及目的蛋白的第二部分。
22.在一个实施方案中，目的蛋白是选自由以下组成的组的一种或多种：治疗性蛋白、报告蛋白和cas9蛋白。
23.在一个实施方案中，货物序列是选自由以下组成的组的一种或多种：编码目的治疗性蛋白的序列、crispr指导rna序列、小rna序列和反式切割核酶序列。在一个实施方案中，所述小rna序列包括选自由以下组成的组的一种或多种：微rna(mirna)、piwi相互作用rna(pirna)、小干扰rna(sirna)、小核仁rna(snorna)、小trna来源的rna(tsrna)、小rdna来源的rna(srrna)和小核rna(snrna)。
24.在一个实施方案中，该方法进一步包括向细胞或组织施用选自由以下组成的组的一种或多种：rtcb连结酶和编码rtcb连结酶的核酸。
附图说明
25.当结合附图阅读时，能更好地理解本发明实施方案的以下详细描述。应该理解，本发明不限于附图中所示的实施方案的精确布置和手段。
26.图1包括图1a至图1e，描绘了哺乳动物细胞中的核酶介导的反式剪接和表达。图1a示出了描绘编码具有3'hdv核酶的gfp的n-端(nt)半分子以及具有5'锤头状(hh)核酶的gfp的c-端(ct)半分子的载体的图。图1b描绘了证明nt-gfp-hdv和hh-ct-gfp在cos7和hek293t细胞中的共表达导致可检测到的gfp荧光，但在单独转染时未能如此的示例性结果。图1c-1d描绘了使用对每个独立rna(g1和g2)特异的引物进行的rt-pcr扩增(图1c)和桑格序列分析(sanger sequence analysis)(图1d)的示例性结果，该结果示出了核酶的去除以及gfp编码序列的无疤痕反式剪接和恢复。图1e描绘了使用对gfp特异的抗体的示例性蛋白质印迹结果，该结果示出了针对gfp预测的全长蛋白大小。
27.图2包括图2a至图2e，描绘了用于量化核酶序列对哺乳动物细胞中反式剪接的影响的基于荧光素酶的报告基因的开发。图2a示出了描绘编码具有3'hdv核酶的荧光素酶的n-端(nt)半分子以及具有5'锤头状(hh)核酶的荧光素酶的c-端(ct)半分子的载体的图。图2b-2c描绘了使用对每个独立luc rna(l1和l2)特异的引物进行的rt-pcr扩增(图2b)和桑格序列分析(图2c)的示例性结果，该示例性结果示出了核酶的去除和荧光素酶开放阅读框的无疤痕反式剪接。图2d-2e展示了不同hdv(图2d)和hh(图2e)核酶序列对哺乳动物细胞中的反式剪接的影响。此外，核酶催化核苷酸的突变导致荧光素酶活性丧失(图2d，最后一列和图2e，最后一列)。
28.图3包括图3a至图3d，展示了nt和ct载体对蛋白质表达的调节。图3a示出了描绘阻止nt载体编码的蛋白质表达的c-端蛋白降解序列的布置的图。图3b描绘了证明不同蛋白降解序列在阻止由编码全长gfp的nt载体表达gfp-hdv方面的效率的示例性结果。图3c示出了描绘用于阻止ct载体中的蛋白序列翻译的n-端翻译控制序列的布置的图。图3d描绘了证明不同的gfp序列修饰或翻译控制序列在阻止哺乳动物细胞中的gfp荧光方面的效率的示例性结果。
29.图4包括图4a至图4d，展示了哺乳动物细胞中单个和多重核酶介导的反式剪接。图4a示出了描绘编码4xmts和全长gfp(无起始atg密码子)的载体的图，其中核酶介导靶向线粒体的gfp蛋白的反式剪接和表达。图4b描绘了证明这些载体的共表达导致定位于线粒体的绿色荧光与mitotracker cmxros的红色荧光重叠的示例性结果。图4c示出了描绘用于阅读框1中靶向线粒体的gfp蛋白(4xmts-gfp)和阅读框2中靶向肉豆蔻酰化膜的红色荧光蛋白(f2-myr-rfp)的多重反式剪接和表达的载体的图。图4d描绘了证明哺乳动物cos7细胞中所有四种载体的共表达导致线粒体中的特异性绿色荧光和膜中的红色荧光的示例性结果。
30.图5包括图5a和图5b，展示了使用优化的核酶序列和顺式剪接剪接受体和剪接供体序列增强的核酶介导的反式剪接。图5a示出了描绘嵌合剪接供体(sd)和剪接受体(sa)序列在通用nt-gfp-3'rz和5'rz-ct-gfp反式剪接gfp报告基因(其中rz表示顺式切割核酶)中的布置的图。图5b描绘了在转染后18小时(前三列)或转染后36小时(最后一列)单载体转染(前两列)或共转染(后两列)后cos7细胞中的gfp荧光的示例性结果。第一行描绘了未优化的hh和hdv核酶的使用，第二行描绘了优化的twister核酶和rzb核酶的使用，最后一行描绘了twister核酶和rzb核酶与sd和sa序列的组合。
31.图6包括图6a至图6d，展示了核酶介导的大蛋白编码基因的反式剪接。图6a示出了描绘编码用于使用aav载体进行递送的分裂的μ抗肌萎缩蛋白(μdystrophin)-gfp融合蛋白的载体的图。图6b-6c描绘了对用nt-dys和ct-dys载体转染的细胞进行的rt-pcr(图6b)和
桑格测序(图6c)分析的示例性结果，该结果示出特异性反式剪接。图6d描绘了使用共聚焦显微镜成像的用nt和ct抗肌萎缩蛋白载体转染的细胞的gfp荧光的示例性结果，其示出抗肌萎缩蛋白的预测膜定位。
32.图7包括图7a至图7c，展示了用慢病毒递送用于在靶细胞中进行反式剪接的含有核酶的rna。图7a示出了描绘慢病毒基因转移载体中nt和ct分裂的gfp表达盒的负向取向的图。图7b描绘了展示只有与编码nt-gfp和ct-gfp基因的慢病毒共转导的细胞显示出gfp荧光的示例性结果。图7c示出了描绘慢病毒基因转移载体中nt和ct分裂的dys表达盒的负向取向的图。
33.图8包括图8a和图8b，展示了核酶介导的毒性dta基因的反式剪接和表达。图8a示出了描绘编码分裂的nt和ct dta基因的载体的图。图8b描绘了展示用nt-dta和ct-dta共同转染的细胞导致共同转染的gfp报告基因的表达降低(这与dta在哺乳动物细胞中的翻译抑制功能一致)的示例性结果。
34.图9描绘了展示外源rna调节酶的共表达可以增强或抑制哺乳动物细胞中核酶介导的反式剪接的示例性结果。
35.图10包括图10a至图10d，展示了rtcb足以在体外催化核酶介导的反式剪接。图10a示出了描绘分裂的荧光素酶反式剪接报告基因的图，该报告基因含有上游t7 rna启动子以允许体外rna转录。图10b示出了展示体外反式剪接的荧光素酶rna依赖于使用制造商推荐的反应条件添加rtcb蛋白(neb)的示例性rt-pcr结果。图10c示出了描绘蛛丝蛋白(spidroin)的保守n-端(n1l)和c-端(n3r)结构域的反式剪接载体的图。图10d描绘了展示来自大肠杆菌的rtcb连结酶足以催化核酶切割的n1l和n3r编码rna的反式连结的示例性桑格测序结果。
36.图11描绘了使用rtcb、vs-s和vs-rz在体外定向连结经核酶催化的rna。
37.图12包括图12a至12d，描绘了使用反式切割核酶进行rna的反式剪接。图12a描绘了以顺式切割的核酶的二级结构。图12b描绘了能够以反式切割的工程化核酶。图12c和图12d描绘了展示反式切割核酶在删除致病突变(诸如移码或过早终止密码子)以恢复蛋白表达和功能方面的潜在应用的图。
38.图13包括图13a和图13b，描绘了可用于rna的无疤痕反式剪接的代表性核酶的二级结构。图13a描绘了可用于无疤痕5'切割的代表性核酶。图13b描绘了可用于无疤痕3'切割的代表性核酶。n＝任何核苷酸。红色剪刀划定切割位点。红色核苷酸指示催化突变。橙色核苷酸代表待被反式剪接的rna序列。深蓝色核苷酸指示形成茎所需的核酶序列。浅蓝色指示茎1中的三级稳定基序(tsm)，该茎1与茎2环相互作用。hh
–
锤头状，hdv
–
丁型肝炎病毒，rz
–
核酶。
39.图14包括图14a至图14c，描绘了无疤痕切割和可利用反式活化核酶诱导的rna反式剪接和表达。图14a描绘了显示vs核酶可以分裂成两个组分(一个小vs-s茎环，其缺乏自催化活性；和一个较大vs-rz，其在被以反式递送时诱导vs-s切割)的图。该vs-s/vs-rz核酶对可用于产生可诱导的无疤痕反式剪接。图14b示出了描绘用于利用vs-s/vs-rz反式活化核酶对产生可诱导的rna反式剪接系统的方法的图。只有在递送或表达vs-rz后，nt-gfp-vs-s rna才会产生合适的rna端，该端可以参与使用共表达的ct-gfp rna的反式剪接。图14c示出了描绘用于产生具有n-端序列、可变或非可变重复区和c-端序列的rna的方法的
图。“重复”rna含有5'自催化核酶和3'反式活化核酶(诸如vs-s)，其允许根据反式活化vs-rz和连结酶(诸如rtcb)的选择性添加来控制重复添加。
40.图15包括图15a至图15e，描绘了核酶介导的反式剪接以及稳定的内含子rna序列的产生。图15a示出了描绘使用顺式切割核酶来介导两种独立rna的反式剪接的图。图15b示出了描绘使用内部顺式切割核酶来产生合成内含子的图。图15c描绘了展示合成内含子的有效顺式切割和独立rna的反式剪接产生功能性蛋白(gfp)的示例性结果。图15d和图15e示出了描绘使用内部顺式切割核酶来产生经反式剪接和翻译的报告基因和内含子序列“货物”(其可以是任何有用的rna序列或基因表达盒)的图。
41.图16包括图16a至图16c，描绘了用于体内核酶介导的反式剪接的优化核酶序列的示例性结果。图16a描绘了使用萤光素酶反式剪接报告基因的相对核酶活性的比较。含有三级稳定基序并且在低镁浓度下具有活性的rzb锤头状核酶变体在哺乳动物细胞中表现出最大的荧光素酶活性。图16b描绘了hdv核酶(hdv68和基因组hdv)与twister核酶(twst)的比较。位于nt-luc的3'末端上的twister核酶提供了最大的荧光素酶活性，该荧光素酶活性被催化失活突变(twst mut)消除。图16c描绘了twister核酶序列修饰的比较。p1茎的缩短降低了报告基因的活性。第一残基的修饰揭示twister核酶可以耐受1位处的a核苷酸(u1a)。
具体实施方式
42.定义
43.除非另有定义，否则本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。
44.一般而言，本文使用的命名法以及细胞培养、分子遗传学、有机化学、核酸化学和杂交中的实验室程序是本领域熟知和常用的。
45.标准技术被用于核酸和肽合成。该技术和程序一般根据本领域的常规方法和贯穿本文档提供的各种通用参考文献(例如，sambrook和russell，2012,molecular cloning,a laboratory approach,cold spring harbor press,cold spring harbor,ny，以及ausubel等人，2012,current protocols in molecular biology,john wiley&sons,ny)来执行。
46.本文使用的命名法和下文描述的分析化学和有机合成中使用的实验室程序是本领域熟知和常用的那些。标准技术或其修改形式被用于化学合成和化学分析。
47.在本发明的上下文中(尤其是在权利要求书的上下文中)使用的术语“一个/种(a)”、“一个/种(an)”、“该/所述”以及类似术语应被解读为涵盖单数和复数两者，除非在本文另外地指示或明显地与上下文矛盾。
48.当提及可测量的值诸如量、持续时间等时，如本文所用的“约”意在涵盖指定值相差
±
20％，或
±
10％，或
±
5％，或
±
1％，或
±
0.1％的变化，因为此类变化适用于执行公开的方法。
[0049]“反义”特别是指编码蛋白质的双链dna分子的非编码链的核酸序列，或与该非编码链基本上同源的序列。如本文所定义，反义序列与编码蛋白质的双链dna分子的序列互补。反义序列不必仅与dna分子编码链的编码部分互补。反义序列可以与编码蛋白质的dna分子的编码链上指定的调控序列互补，该调控序列控制编码序列的表达。
[0050]
当提及将分子(例如核酸分子)固定至固体支持物时，如本文所用的术语“附接”旨在涵盖直接或间接、共价或非共价附接，除非另有明确或上下文指示。
[0051]
如本文可互换使用的，“微球体”、“珠粒”或其语法等价物描述了能够充当用于附接生物分子(例如，核酸分子)的固体支持物的小的离散颗粒。
[0052]“疾病”是动物的一种如下健康状态，其中动物不能维持体内平衡，并且其中，如果疾病没有改善，则动物的健康继续恶化。
[0053]
相对来说，动物中的“病症”是一种如下健康状态，其中动物能够维持体内平衡，但其中动物的健康状态不如没有病症时的健康状态。如果不加以治疗，病症不一定会导致动物健康状态进一步下降。
[0054]
如果疾病或病症的体征或症状的严重性、患者经历此种体征或症状的频率，或两者都降低，则疾病或病症“缓和”。
[0055]“编码”是指多核苷酸中的特定核苷酸序列(诸如基因、cdna或mrna)的固有特性，该特定核苷酸序列用于在生物过程中充当合成具有确定的核苷酸序列(即rrna、trna和mrna)或确定的氨基酸序列以及由此产生的生物学特性的其他聚合物和大分子的模板。因此，如果对应于基因的mrna的转录和翻译在细胞或其他生物系统中产生蛋白质，则该基因编码蛋白。编码链(其核苷酸序列与该mrna序列相同，并且通常提供在序列表中)和非编码链(用作基因或cdna转录的模板)都可以称为编码该基因或cdna的蛋白质或其他产物。
[0056]
术语“患者”、“受试者”、“个体”等在本文中可互换使用，并且是指无论在体外还是在体内都适用于本文所述的方法的任何动物或细胞。在一个实施方案中，受试者包括脊椎动物和无脊椎动物。无脊椎动物包括但不限于黑腹果蝇和秀丽隐杆线虫。脊椎动物包括但不限于灵长类动物、啮齿动物、家养动物或狩猎动物。灵长类动物包括但不限于黑猩猩、食蟹猴、蜘蛛猴和猕猴(例如，恒河猴)。啮齿动物包括但不限于小鼠、大鼠、土拨鼠、雪貂、兔子和仓鼠。家养动物和狩猎动物包括但不限于牛、马、猪、鹿、野牛、水牛、猫科物种(例如家猫)、犬科物种(例如狗、狐狸、狼)、鸟类物种(例如，鸡、鸸鹋、鸵鸟)和鱼(例如斑马鱼、鳟鱼、鲶鱼和鲑鱼)。在一些实施方案中，受试者是哺乳动物，例如灵长类动物，例如人。在某些非限制性实施方案中，患者、受试者或个体是人。
[0057]
如本文所用的关于抗体的术语“特异性地结合”意指识别特定抗原但基本上不识别或结合样品中的其他分子的抗体。例如，与来自一个物种的抗原特异性结合的抗体也可以与来自一个或多个物种的该抗原结合。但是，这种跨物种反应性本身不会改变抗体的特异性分类。在另一个例子中，特异性结合抗原的抗体也可以结合抗原的不同等位基因形式。然而，这种交叉反应性本身不会改变抗体的特异性分类。
[0058]
在一些情况下，术语“特异性结合(specific binding)”或“特异性地结合(specifically binding)”可用于指抗体、蛋白或肽与第二化学物质的相互作用，以表示该相互作用取决于该化学物质上存在的特定结构(例如，抗原决定簇或表位)；例如，抗体识别并结合至特定的蛋白结构，而不是一般蛋白。如果抗体对表位“a”具有特异性，则在含有经标记的“a”和抗体的反应中，含有表位a(或游离的未经标记的a)的分子的存在将减少与该抗体结合的经标记的a的数量。
[0059]
基因的“编码区”由基因的编码链的核苷酸残基和基因的非编码链的核苷酸组成，它们分别与由该基因转录产生的mrna分子的编码区同源或互补。
[0060]
mrna分子的“编码区”也由mrna分子的核苷酸残基组成，该核苷酸残基在mrna分子的翻译过程中与转移rna分子的反密码子区匹配或编码终止密码子。因此，编码区可以包括这样的核苷酸残基，该核苷酸残基包含不存在于由mrna分子编码的成熟蛋白中的氨基酸残基(例如，蛋白输出信号序列中的氨基酸残基)的密码子。
[0061]
如本文用于指代核酸的“互补”是指两条核酸链的区域之间或同一核酸链的两个区域之间的序列互补性的广义概念。已知如果残基是胸腺嘧啶或尿嘧啶，则第一核酸区域的腺嘌呤残基能够与和第一区域反平行的第二核酸区域的残基形成特定的氢键(“碱基配对”)。类似地，已知第一条核酸链的胞嘧啶残基能够与第二条核酸链的残基配对，如果该残基是鸟嘌呤，则该第二条核酸链与第一条链反平行。核酸的第一区域与相同或不同核酸的第二区域在下面的情况下互补：如果当这两个区域以反平行方式被布置时，第一区域的至少一个核苷酸残基能够与第二区域的残基配对。在一个实施方案中，第一区域包括第一部分并且第二区域包括第二部分，由此，当第一部分和第二部分以反平行方式被布置时，第一部分的核苷酸残基的至少约50％、至少约75％、至少约90％，或至少约95％能够与第二部分中的核苷酸残基进行碱基配对。在一个实施方案中，第一部分的所有核苷酸残基都能够与第二部分中的核苷酸残基进行碱基配对。
[0062]
如本文所用的术语“dna”被定义为脱氧核糖核酸。
[0063]
如本文所用的术语“表达”被定义为特定核苷酸序列的由其启动子驱动的转录和/或翻译。
[0064]
如本文所用的术语“表达载体”是指含有对能够被转录的基因产物的至少一部分编码的核酸序列的载体。在某些情况下，rna分子然后被翻译成蛋白质、多肽或肽。在其他情况下，这些序列不被翻译，例如，在反义分子、sirna、核酶等的生产中。表达载体可以含有多种控制序列，该控制序列是指特定宿主生物中可操作地连接的编码序列的转录和可能翻译所必需的核酸序列。除了管控转录和翻译的控制序列外，载体和表达载体还可含有具有其他功能的核酸序列。
[0065]
如本文所用，术语“野生型”是本领域技术人员理解的术语，并且意指与突变体或变体形式有区别的如在自然界中存在的生物体、菌株、基因或特征的典型形式。
[0066]
术语“同源性”是指一定程度的互补性。可能存在部分同源性或完全同源性(即同一性)。同源性常常使用序列分析软件(例如，genetics computer group.(university of wisconsin biotechnology center.1710university avenue.madison,wis.53705)的序列分析软件包)来测量。此类软件通过将同源性程度分配给各种取代、缺失、插入和其他修饰来匹配相似的序列。保守性取代通常包括以下各组内的取代：甘氨酸、丙氨酸；缬氨酸、异亮氨酸、亮氨酸；天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺；丝氨酸、苏氨酸；赖氨酸、精氨酸；以及苯丙氨酸、酪氨酸。
[0067]“分离的”是指改变或脱离自然状态。例如，在活动物中在正常环境中自然存在的核酸或肽不是“分离的”，但部分或完全从其自然环境的共存物质中分离的同一核酸或肽是“分离的”。分离的核酸或蛋白质可以以基本上纯化的形式存在，或者可以存在于非天然环境例如宿主细胞中。
[0068]
术语“分离的”在与核酸相关被使用时，如“分离的寡核苷酸”或“分离的多核苷酸”是指这样的核酸序列，该核酸序列是从至少一种通常与其来源相关的污染物中鉴定和分离
出来的。因此，分离的核酸以不同于其在自然界中被发现的形式或环境存在。相对来说，非分离的核酸(例如dna和rna)以它们在自然界中存在的状态被发现。例如，给定dna序列(例如，基因)被发现在宿主细胞染色体上与相邻基因相邻；rna序列(例如，编码特定蛋白的特定mrna序列)被发现在细胞中以与编码众多蛋白的许多其他mrna的混合物的形式存在。然而，分离的核酸包括，举例来说，通常表达该核酸的细胞中的这样的核酸，该核酸位于与天然细胞的染色体位置不同的染色体位置或者以其他方式侧接有与在自然界中发现的核酸序列不同的核酸序列。分离的核酸或寡核苷酸可以单链或双链形式存在。当使用分离的核酸或寡核苷酸来表达蛋白时，寡核苷酸至少包含有义链或编码链(即寡核苷酸可以是单链的)，但可以同时包含有义链和反义链(即寡核苷酸可以是双链的)。
[0069]
术语“分离的”在与多肽相关被使用时，如在“分离的蛋白”或“分离的多肽”中，是指这样的多肽，该多肽是从至少一种通常与其来源相关的污染物中鉴定和分离出来的。因此，分离的多肽以不同于其在自然界中被发现的形式或环境存在。相反，非分离的多肽(例如蛋白和酶)以它们在自然界中存在的状态被发现。
[0070]
所谓“核酸”是指任何核酸，无论是由脱氧核糖核苷或核糖核苷组成，也无论是由磷酸二酯连键或经修饰的连键(诸如磷酸三酯、氨基磷酸酯、硅氧烷、碳酸酯、羧甲基酯、亚氨基乙酸酯(acetamidate)、氨基甲酸酯、硫醚、桥联氨基磷酸酯、桥联亚甲基膦酸酯、硫代磷酸酯、甲基膦酸酯、二硫代磷酸酯、桥联硫代磷酸酯或砜连键以及此类连键的组合)组成。术语核酸还具体包括由除五种生物学上存在的碱基(腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶和尿嘧啶)以外的碱基组成的核酸。术语“核酸”通常是指大的多核苷酸。
[0071]
本文使用常规符号来描述多核苷酸序列：单链多核苷酸序列的左手端是5'端；双链多核苷酸序列的左手方向称为5'方向。
[0072]
核苷酸从5'到3'被添加到新生rna转录本中的方向称为转录方向。与mrna具有相同序列的dna链称为“编码链”；dna链上的位于dna上参考点的5'处的序列称为“上游序列”；dna链上的位于dna上参考点的3'处的序列称为“下游序列”。
[0073]“表达盒”意指包含编码序列的核酸分子，该编码序列可操作地连接至该编码序列的转录和任选的翻译所需的启动子/调控序列。
[0074]
如本文所用的术语“可操作地连接”是指核酸序列的这样的连接，该连接使得产生能够指导给定基因的转录和/或所需蛋白分子的合成的核酸分子。该术语还指编码氨基酸的序列的这样的连接，该连接使得产生功能性(例如，具有酶促活性的、能够与结合配偶体结合、能够抑制等)的蛋白或多肽。
[0075]
如本文所用，术语“启动子/调控序列”意指表达可操作地连接至该启动子/调控序列的基因产物所需的核酸序列。在一些情况下，该序列可以是核心启动子序列，而在其他情况下，该序列还可以包括增强子序列和基因产物表达所需的其他调控元件。该启动子/调控序列可以例如是以可诱导方式表达基因产物的序列。
[0076]
如本文所用，用于杂交的“严格条件”是指与靶序列具有互补性的核酸主要与靶序列杂交并且基本上不与非靶序列杂交的条件。严格条件一般是序列依赖性的，并且取决于许多因素。一般而言，序列越长，序列与其靶序列特异性地杂交的温度越高。严格条件的非限制性实例详细描述于tijssen(1993)，laboratory techniques in biochemistry and molecular biology-hybridization with nucleic acid probes第1部分，第二章“overview of principles of hybridization and the strategy of nucleic acid probe assay”,elsevier,n.y。
[0077]“杂交”是指一种或多种多核苷酸反应形成经由核苷酸残基的碱基之间的氢键键合而稳定的复合物的反应。该氢键键合可以通过watson crick碱基配对、hoogstein结合，或以任何其他序列特异性方式发生。该复合物可包括形成双链体结构的两条链、形成多链复合物的三条或更多条链、单个自杂交链，或这些的任何组合。杂交反应可以构成更广泛过程中的步骤，例如pcr的启动，或酶对多核苷酸的切割。能够与给定序列杂交的序列称为该给定序列的“互补序列”。
[0078]“诱导型”启动子是这样的核苷酸序列，该核苷酸序列在与编码或指定基因产物的多核苷酸可操作地连接时，导致基因产物基本上仅在对应于启动子的诱导物存在时才产生。
[0079]“组成型”启动子是这样的核苷酸序列，该核苷酸序列在与编码或指定基因产物的多核苷酸可操作地连接时，导致基因产物在细胞中在该细胞的大部分或所有生理条件下产生。
[0080]
如本文所用的术语“多核苷酸”被定义为核苷酸链。此外，核酸是核苷酸的聚合物。因此，如本文所用的核酸和多核苷酸是可互换的。本领域技术人员具有核酸是可以水解成单体“核苷酸”的多核苷酸的常识。单体核苷酸可以水解成核苷。如本文所用，多核苷酸包括但不限于通过本领域可用的任何方式获得的所有核酸序列，所述方式包括但不限于重组方式，即使用普通的克隆技术和pcr等从重组文库或细胞基因组中克隆核酸序列，以及合成方式。
[0081]
在本发明的上下文中，使用常用核酸碱基的以下缩写。“a”是指腺苷，“c”是指胞嘧啶，“g”是指鸟苷，“t”是指胸苷，“u”是指尿苷。
[0082]
如本文所用，术语“肽”、“多肽”和“蛋白质”可互换使用，是指由通过肽键共价连接的氨基酸残基组成的化合物。蛋白质或肽必须含有至少两种氨基酸并且对于可构成蛋白质或肽序列的氨基酸的最大数目没有设限。多肽包括包含通过肽键彼此联接的两种或更多种氨基酸的任何肽或蛋白质。如本文所用，该术语既指短链(其在本领域中也通常称为例如肽、寡肽和寡聚体)，也指更长链(其在本领域中一般称为蛋白质)，其有很多类型。“多肽”包括例如生物活性片段、基本上同源的多肽、寡肽、同二聚体、异二聚体、多肽的变体、经修饰的多肽、衍生物、类似物、融合蛋白等。多肽包括天然肽、重组肽、合成肽或它们的组合。
[0083]
如本文所用的术语“rna”被定义为核糖核酸。
[0084]
如本文所用的术语“核酶”是指能够充当酶的rna分子。例如，一些核酶能够切割rna分子。rna切割核酶通常至少由催化结构域和由催化结构域识别的识别序列组成。催化结构域可以是与识别序列相同的rna分子的一部分，因此介导顺式切割。替代地，催化结构域可以是与包含识别序列的rna分子分开的rna分子，并因此介导反式切割。
[0085]“重组多核苷酸”是指具有非天然地联接在一起的序列的多核苷酸。扩增或组装的重组多核苷酸可包含在合适的载体中，并且该载体可用于转化合适的宿主细胞。
[0086]
重组多核苷酸也可以具有非编码功能(例如，启动子、复制起点、核糖体结合位点等)。
[0087]
如本文所用的术语“重组多肽”被定义为通过使用重组dna方法产生的多肽。
[0088]
如本文所用，术语“固体表面”、“固体支持物”以及它们的其他语法等同物是指适合于或可以被修饰成适合于生物分子(例如，核酸分子)的附接的任何材料。
[0089]
如本文所用，术语“标签”是指生物分子(例如核酸分子)的任何化学修饰，该化学修饰提供附加功能性(例如，与固体支持物的附接、荧光可视化等)。
[0090]
如本文所用的术语“变体”是分别在序列上与参考核酸序列或肽序列不同但保留了参考分子的基本生物学特性的核酸序列或肽序列。核酸变体序列的变化可能不会改变参考核酸编码的肽的氨基酸序列，或可能会导致氨基酸取代、添加、缺失、融合和截短。肽变体序列的变化通常是有限的或保守的，因此参考肽和变体的序列总体上非常相似，并且在许多区域中是相同的。变体和参考肽的氨基酸序列可能因呈任何组合的一个或多个取代、添加、缺失而不同。核酸或肽的变体可以是天然存在的(诸如等位基因变体)，或者可以是尚不知道是否天然存在的变体。核酸和肽的非天然存在的变体可以通过诱变技术或通过直接合成来制备。
[0091]“载体”是包含分离的核酸并且可用于将分离的核酸递送至细胞内部的物质组合物。许多载体是本领域已知的，该载体包括但不限于线性多核苷酸、与离子或两亲化合物缔合的多核苷酸、质粒和病毒。因此，术语“载体”包括自主复制的质粒或病毒。该术语还应解读为包括促进核酸转移到细胞中的非质粒和非病毒化合物，诸如，例如聚赖氨酸化合物、脂质体等。病毒载体的实例包括但不限于腺病毒载体、腺相关病毒载体、逆转录病毒载体等。
[0092]
范围：在整个本公开中，本发明的各个方面可以以范围格式呈现。应当理解，以范围格式进行描述只是为了方便和简洁，并且不应被解释为对本发明的范围的僵硬限制。因此，范围的描述应该被认为已明确公开了所有可能的子范围以及该范围内的各个数值。例如，诸如从1至6的范围的描述应该被认为已明确公开了诸如1至3、1至4、1至5、2至4、2至6、3至6等的子范围，以及该范围内的各个数字，例如1、2、2.7、3、4、5、5.3和6。这在任何宽度范围的情况下均适用。
[0093]
详述
[0094]
本发明提供了用于有效且可靠地连结两种或更多种单独的rna分子以产生编码蛋白和融合蛋白的更大的单种rna分子的组合物和方法。本发明利用核酶介导的多种rna分子的反式剪接来组装编码目的蛋白或融合蛋白的单种rna分子。本发明可用于有效地生产融合蛋白、嵌合蛋白等。进一步地，本发明可用于产生大的全长蛋白，其编码序列可能太大而不能包装到单个载体中。进一步地，本发明的技术还允许快速且容易地组合两种不同的序列，这对于产生新的蛋白组合或文库序列可具有倍增效应(multiplier effect)。这可能例如对于产生合成抗体(如纳米抗体)或对于酶的功能选择特别有用。
[0095]
本发明还提供了用于有效地递送一种或多种具有侧接有核酶的合成内含子的rna分子的组合物和方法。侧接有核酶的合成内含子可被置于编码目的蛋白的n-端部分的第一rna部分与编码目的蛋白的c-端部分的第二rna部分之间。侧接有核酶的合成内含子可以包含货物序列，例如，编码治疗性蛋白或包含功能性rna的序列。两种核酶的使用允许顺式剪接以产生以下三个rna片段：1)编码目的蛋白的n-端部分的第一rna部分，2)侧接有核酶的合成内含子，和3)编码目的蛋白的c-端部分的第二rna部分。所述顺式剪接产生用于连结的相容末端。经顺式剪接的合成内含子的相容末端的连结产生环状rna分子，该环状rna分子比线性rna分子更耐降解。编码目的蛋白的n-端部分的第一rna部分和编码目的蛋白的c-端
部分的第二rna部分的相容末端的连结产生编码全长目的蛋白的rna分子。全长目的蛋白可以是例如治疗性蛋白、crispr-cas蛋白，或报告蛋白，该报告蛋白用于提供包含侧接有核酶的合成内含子的环状rna分子中的货物序列的递送和表达的代表性指标(proxy indicator)。
[0096]
在一方面，本发明提供一种或多种编码两种或更多种rna分子的核酸分子。在某些实施方案中，该rna分子中的一种或多种包含核酶。在一个实施方案中，该rna分子中的一种或多种包含编码区和核酶。在某些实施方案中，核酶自切割脱离rna分子，从而留下编码区。可以在本发明的上下文中使用的示例性核酶包括但不限于锤头状(hh)核酶、丁型肝炎病毒(hdv)核酶、varkud卫星(vs)核酶、sister核酶、twister-sister核酶、发夹状核酶、hatchet核酶和pistol核酶家族的成员。
[0097]
例如，在一个实施方案中，所述组合物包含编码第一rna分子的核酸分子，其中第一rna分子包含编码区和3'核酶，其中该3'核酶能够催化自身脱离该rna分子，从而留下具有3'p或2'3'环状磷酸酯(cp)末端的编码区。在一个实施方案中，3'核酶包括hdv核酶。进一步地，在一个实施方案中，所述组合物包含编码第二rna分子的核酸分子，其中该第二rna分子包含编码区和5'核酶，其中该5'核酶能够催化自身脱离该rna分子，从而留下具有5'oh末端的编码区。在一个实施方案中，5'核酶包括hh核酶。在某些情况下，连结酶将第一rna分子的编码区与第二rna分子的编码区联接在一起，从而形成编码目的蛋白的较长的rna分子。
[0098]
例如，在一个实施方案中，所述组合物包含第一rna分子，其中第一rna分子包含编码区和3'核酶，其中该3'核酶能够催化自身脱离该rna分子，从而留下具有3'p或2'3'环状磷酸酯(cp)末端的编码区。在一个实施方案中，3'核酶包括hdv核酶。进一步地，在一个实施方案中，所述组合物包含第二rna分子，其中该第二rna分子包含编码区和5'核酶，其中该5'核酶能够催化自身脱离该rna分子，从而留下具有5'oh末端的编码区。在一个实施方案中，5'核酶包括hh核酶。在某些情况下，连结酶将第一rna分子的编码区与第二rna分子的编码区联接在一起，从而形成编码目的蛋白的较长的rna分子。
[0099]
在某些实施方案中，第一rna包含编码目的蛋白的第一部分的编码区，并且第二rna包含编码目的蛋白的第二部分的编码区，因此核酶介导的rna分子切割和连结酶介导的rna分子组装导致产生编码具有第一和第二部分的蛋白的rna分子。本发明可用于由多种rna产生全长蛋白，每种rna均包含编码全长蛋白的一部分的编码区。进一步地，本发明可用于产生包含多个结构域的融合蛋白，其中每种rna分子均包含编码融合蛋白的结构域的编码区。例如，本发明可被用于通过由包含编码前导序列、n-端标签或c-端标签的编码序列的第一rna和包含编码蛋白质的编码序列的第二rna分子组装rna来产生编码具有前导序列、n-端标签、c-端标签等的蛋白质的rna分子。
[0100]
在某些实施方案中，本发明涉及由三种或更多种单独的rna分子形成单种rna分子。例如，在某些方面，所述组合物包含编码第一rna分子的核酸分子，其中第一rna分子包含编码蛋白质的n-端区域的编码区；编码第二rna分子的核酸分子，其中第二rna分子包含编码蛋白质的c-端区域的编码区；以及一种或多种编码一种或多种附加rna分子的核酸分子，每种附加rna分子均包含编码蛋白质的结构域(例如，重复结构域)的编码区。在一个实施方案中，第一rna分子包含编码n-端区域的编码区和3'核酶，其中3'核酶能够催化自身脱离rna分子，从而留下具有3'p或2'3'环状磷酸酯(cp)末端的编码区。在一个实施方案中，3'
核酶包括hdv核酶。在一个实施方案中，第二rna分子包含编码c-端区域的编码区和5'核酶，其中5'核酶能够催化自身脱离rna分子，从而留下具有5'oh末端的编码区。在一个实施方案中，5'核酶包括hh核酶。在一个实施方案中，该附加rna分子各自包含编码蛋白结构域的编码区、3'核酶和5'核酶。在一个实施方案中，3'核酶是hdv核酶。在一个实施方案中，5'核酶是hh核酶。在某些方面，3'核酶能够催化自身脱离rna分子并且5'核酶能够催化自身脱离rna分子，从而留下具有5'oh和3'p或2'3'cp末端的编码区。在一个实施方案中，该附加rna分子各自包含编码蛋白的结构域的编码区、5'核酶和3'核酶识别序列。在某些方面，5'核酶能够催化自身脱离rna分子，从开留下具有5'oh末端的编码区；并且3'核酶识别序列与核酶相互作用从而诱导3'核酶识别序列从rna分子中剪接出来，从而留下具有3'p或2'3'cp末端的编码区。在一个实施方案中，3'核酶识别序列包含与vs核酶相互作用的vsv1序列。该技术可被用于产生编码具有多个重复结构域的蛋白的rna分子，这通过如下方式实现：通过依次提供核酶(例如vs核酶)以与3'核酶识别序列相互作用从而产生3'p或2'3'cp末端来依次添加编码重复结构域的编码区，并且将编码区连结到另一个编码重复结构域的编码区的5'oh末端。在某些方面，重复结构域的顺序添加可以在固体衬底或支持物上执行，在该固体衬底或支持物中，编码n-端区域的第一rna分子与衬底或支持物结合。
[0101]
在某些方面，多个rna分子在核酶介导的5'oh和3'p或2'3'cp末端产生后被连结在一起。在一些情况下，该rna分子通过存在于发生rna组装的天然细胞或组织中的内源性连结酶被连结在一起。在一些情况下，本发明的方法包括添加外源连结酶以诱导经加工的rna分子连结在一起的步骤。在一个实施方案中，连结酶是rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。
[0102]
组合物
[0103]
在一个实施方案中，本发明涉及一种组合物，包含一种或多种编码一种或多种核酶的核酸分子。在一个实施方案中，本发明包括一种或多种含有一种或多种核酶的rna分子。在一些实施方案中，该一种或多种rna分子包含至少第一rna分子和第二rna分子。
[0104]
在一些实施方案中，所述组合物的所述一种或多种核酶能够从所述一种或多种rna分子自发顺式切割。在一些实施方案中，所述一种或多种核酶是3'核酶。在一些实施方案中，所述3'核酶在自发顺式切割后在剩余的一种或多种rna分子上产生3'p或2'3'cp末端。在一些实施方案中，所述一种或多种核酶是5'核酶。在一些实施方案中，所述5'核酶在自发顺式切割后在剩余的一种或多种rna分子上产生5’oh末端。在一些实施方案中，所述3'p或2'3'cp末端和所述5'oh末端可以被连结在一起。
[0105]
在一些实施方案中，所述第一rna分子包含3'核酶。在一些实施方案中，所述3'核酶来自选自由以下组成的组的一个或多个家族：锤头状(hh)核酶、丁型肝炎病毒(hdv)核酶、varkud卫星(vs)核酶、twister(twst)核酶、sister核酶、twister-sister(ts)核酶、发夹状核酶、hatchet核酶和pistol核酶，或它们的保持了顺式切割功能的变体或片段。在一些实施方案中，3'核酶包含一个或多个核苷酸的突出端。在一个实施方案中，该突出端包含与第一rna分子内的所述3'核酶上游的序列杂交的核苷酸序列。在一些实施方案中，该突出端提高了自发顺式切割的效率。
[0106]
在一些实施方案中，所述第二rna分子包含5'核酶。在一些实施方案中，所述5'核酶来自选自由以下组成的组的一个或多个家族：锤头状(hh)核酶、丁型肝炎病毒(hdv)核
酶、varkud卫星(vs)核酶、twister(twst)核酶、sister核酶、twister-sister(ts)核酶、发夹状核酶、hatchet核酶和pistol核酶，或它们的保持了顺式切割功能的变体或片段。在一些实施方案中，所述5'核酶包含一个或个种核苷酸的突出端。在一个实施方案中，该突出端包含与第二rna分子内的所述5'核酶下游的序列杂交的核苷酸序列。在一些实施方案中，该突出端提高了自发顺式切割的效率。
[0107]
在一个实施方案中，所述组合物的hdv核酶包含选自由以下组成的组的一种或多种：hdv、hdv68、hdv67、hdv56、genhdv和抗hdv，或它们的变体或片段。在一个实施方案中，hdv68包含seq id no:9的核酸序列。在一个实施方案中，hdv67包含seq id no:10的核酸序列。在一个实施方案中，hdv56包含seq id no:11的核酸序列。在一个实施方案中，genhdv包含seq id no:12的核酸序列。在一个实施方案中，抗hdv包含seq id no:13的核酸序列。
[0108]
在一个实施方案中，hh核酶包含在茎1突出端中的一个或多个核苷酸，该核苷酸与该hh核酶上游或下游序列的核苷酸杂交。在一个实施方案中，该茎1突出端中的核苷酸数目可以是1个或更多个核苷酸、2个或更多个核苷酸、4个或更多个核苷酸、6个或更多个核苷酸、8个或更多个核苷酸、10个或更多个核苷酸、12个或更多个核苷酸、14个或更多个核苷酸、16个或更多个核苷酸、18个或更多个核苷酸，或20个或更多个核苷酸。在一个实施方案中，包含一个或多个核苷酸茎1突出端的hh核酶包含选自由以下组成的组的核酸序列：seq id no:111、seq id no:112、seq id no:113、seq id no:114、seq id no：115、seq id no：116、seq id no：117和seq id no：118，其中指定为n的核苷酸对应于与所述hh核酶下游序列的核苷酸杂交的核苷酸。在一个实施方案中，hh核酶具有在茎3突出端中的一个或多个核苷酸。在一个实施方案中，hh核酶具有5个核苷酸的茎3突出端。在一个实施方案中，hh核酶包含seq id no：105的核酸序列，其中指定为n的核苷酸对应于与所述hh核酶上游序列的核苷酸杂交的核苷酸。在一个实施方案中，hh核酶在茎2环中被修饰。在一个实施方案中，具有经修饰的茎2环的hh核酶包含选自由以下组成的组的核酸序列：seq id no:119、seq id no:120、seq id no:121、seq id no:122、seq id no:123和seq id no：124，其中指定为n的核苷酸对应于与所述hh核酶下游序列的核苷酸杂交的核苷酸。在一个实施方案中，hh核酶在茎1中被修饰成包括三级稳定基序(tsm)。在一个实施方案中，所述hh核酶在茎2环中被修饰，并且在茎1中被修饰成包括三级稳定基序(tsm)。在一个实施方案中，经修饰的hh核酶顺式切割比hh核酶更有效。在一个实施方案中，经修饰的hh核酶是rzb。在一个实施方案中，rzb包含seq id no:125的核酸序列，其中指定为n的核苷酸对应于与所述hh核酶下游序列的核苷酸杂交的核苷酸。
[0109]
在一个实施方案中，twister核酶包含seq id no:32的核酸序列。在一个实施方案中，twister核酶包含在p1茎突出端中的一个或多个核苷酸。在一个实施方案中，p1茎突出端中的核苷酸数目可以是1个或更多、2个或更多、3个或更多、4个或更多，或5个或更多。
[0110]
在一个实施方案中，包含一个或多个核苷酸p1茎突出端的twister核酶包含选自由seq id no:106、seq id no:107、seq id no:108、seq id no:109和seq id no:110组成的组的核酸序列，其中指定为n的核苷酸对应于与所述twister核酶下游序列的核苷酸杂交的核苷酸。
[0111]
在一些实施方案中，所述组合物的所述一种或多种核酶由第一部分和第二部分组成。在一些实施方案中，所述第一部分被掺入到所述一种或多种rna分子中。在一些实施方
案中，所述第一部分是核酶识别序列。在一些实施方案中，所述第二部分是单独引入的。在一些实施方案中，所述第一部分从所述一种或多种rna分子的顺式切割仅在所述第一部分和所述第二部分彼此接触时发生。在一些实施方案中，所述一种或多种核酶是vs核酶。在一个实施方案中，所述vs核酶包含seq id no:14的核酸序列。在一个实施方案中，所述第一部分是vs核酶茎环(vs-s)。在一个实施方案中，vs-s包含seq id no:15的核酸序列。在一个实施方案中，所述第二部分是不含茎环的vs的剩余部分(vs-rz)。在一个实施方案中，vs-rz包含seq id no:16的核酸序列。
[0112]
核酶是以顺式切割以产生如本文所述的独特rna 3'和5'端的自催化rna。然而，顺式切割核酶可以被工程化成以反式切割，使得靶rna可以以核苷酸特异性方式被切割，从而产生相似的rna端。在一些实施方案中，本发明包括包含编码单种rna分子的单个核酸分子的组合物，该单种rna分子包含反式切割工程化核酶。在一个实施方案中，该反式切割工程化核酶能够反式切割单独的rna分子。在一个实施方案中，该反式切割工程化核酶识别单独的rna分子中的特定核酸序列。在一些实施方案中，该反式切割工程化核酶靶向致病突变以进行删除。在一些实施方案中，该致病突变位于外显子中。在一些实施方案中，该致病突变位于内含子中。在一些实施方案中，所述组合物包含两种反式切割工程化核酶，该两种反式切割工程化核酶靶向致病突变的上游和下游。在一些实施方案中，在致病突变的上游和下游的反式切割导致该致病突变的去除。在一些实施方案中，在该致病突变的反式切割后，该基因的剩余部分被反式剪接在一起。在一些实施方案中，经反式剪接的基因表达为功能性蛋白。
[0113]
如本文所述，已经经受核酶介导的切割的rna分子的3'p或2'3'cp末端和5'oh末端可以被连结在一起。因此，编码较大全长蛋白的分开的部分的分离的rna序列可以以无疤痕的方式被反式剪接在一起，以实现全长蛋白的表达。在一个实施方案中，本发明涉及一种组合物，该组合物包含一种或多种编码目的蛋白的两个或更多个部分并且编码一种或多种核酶的核酸分子。在一个实施方案中，本发明涉及一种组合物，该组合物包含一种或多种编码目的蛋白的两个或更多个部分并且包含一种或多种核酶的rna分子。
[0114]
在一个实施方案中，所述一种或多种编码目的蛋白的两个或多个部分的核酸分子包括编码目的蛋白的第一部分的第一核酸分子和编码目的蛋白的第二部分的第二核酸分子。在一个实施方案中，所述第一核酸包含第一rna分子。在一个实施方案中，所述第二核酸包含第二rna分子。在一个实施方案中，所述第一rna分子在3'末端与3'核酶连接。在一个实施方案中，所述第二rna分子在5'端与5'核酶连接。在一个实施方案中，在3'和5'核酶序列的顺式切割后，第一rna分子的3'p或2'3'cp末端被连结到第二rna分子的5'oh末端，从而产生编码全长目的蛋白的单种rna分子。在一个实施方案中，该全长目的蛋白的功能与相同序列的内源表达的全长蛋白的功能是同一的。
[0115]
在一个实施方案中，该全长目的蛋白包含治疗性蛋白。在一个实施方案中，该治疗性蛋白包含选自由以下(但是不限于以下)组成的组的一种或多种：utrophin、抗肌萎缩蛋白(dystrophin)、dysferlin、myoferlin、囊性纤维化跨膜电导调节剂(cftr)、凝血因子viii、纤维囊蛋白(fibrocystin)、视网膜特异性磷脂-转运atp酶(abca4)、耳畸蛋白(otoferlin)、铜转运atp酶2、myo7a、myo15a、cdh23、strc、otog、tecta、pcdh15、triobp、myo3a、col11a2、loxhd1、ptprq、otogl、myh14、myh9、tnc、cacna1a、cacna1c、cacna1f、
id no:61、seq id no:62、seq id no:63、seq id no:64、seq id no:65、seq id no:66、seq id no:67、seq id no:68、seq id no:69、seq id no:70、seq id no:71、seq id no:72、seq id no:73、seq id no:74、seq id no:76、seq id no:78和seq id no:80。
[0117]
在某些方面，为了进一步阻止不需要的或截短的蛋白表达，rna核定位信号可用于阻止未经剪接的rna分子的胞浆输出和翻译。在一个实施方案中，所述组合物的所述一种或多种rna分子包含编码rna核定位序列的核酸序列。在一个实施方案中，所述第一rna分子包含编码rna核定位序列的核酸序列。在一个实施方案中，所述第二rna分子包含编码rna核定位序列的核酸序列。在一个实施方案中，所述rna核定位序列在核酶序列的切割和剪接之前阻止不完全蛋白(partial protein)的胞质rna输出和翻译。在一个实施方案中，所述rna核定位序列包含一种或多种选自由以下组成的组的核酸序列：seq id no:50和seq id no:51。
[0118]
在一些实施方案中，所述组合物进一步包含一种或多种附加rna分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区；5
′
核酶；和3
′
核酶。在一些实施方案中，所述系统进一步包含一种或多种编码一种或多种附加rna分子的附加核酸分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶。
[0119]
在一些实施方案中，所述组合物进一步包含一种或多种附加rna分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区；5
′
核酶；和3
′
核酶识别序列。在一些实施方案中，所述系统进一步包含一种或多种编码一种或多种附加rna分子的附加核酸分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶识别序列。
[0120]
由剪接体进行的前mrna剪接已被证明可通过沉积促进首轮翻译的因子或者通过促进rna加工和向细胞质的输出来增强mrna翻译。在转基因内添加嵌合顺式剪接内含子也已被证明可促进转基因蛋白表达。因此，在某些实施方案中，被剪接体识别和顺式剪接的剪接供体和剪接受体位点的添加可以增强来自分裂的前体rna分子的蛋白表达。在一个实施方案中，所述组合物包含一种或多种rna分子，该rna分子包含剪接供体或剪接受体序列。在一个实施方案中，所述组合物的所述第一rna分子包含剪接供体序列。在一个实施方案中，所述剪接供体序列连接至核酶序列之后的第一rna分子的3'末端。在一个实施方案中，所述组合物的所述第二rna分子包含剪接受体序列。在一个实施方案中，所述剪接受体序列连接至核酶序列之前的第二rna分子的5'末端。在一个实施方案中，剪接供体和剪接受体序列的纳入核增强了酶介导的反式剪接后的蛋白表达。
[0121]
由于蛋白在其中被翻译的三个开放阅读框，核酶介导的同时多种不同功能蛋白的反式剪接和表达也可能是可能的。通过利用这一特性，可以使用位于三个不同的不相容开放阅读框中的rna的反式剪接来产生功能性蛋白。在一个实施方案中，本发明的组合物包含至少四种核酸分子，该核酸分子包括至少两对核酸分子。在一个实施方案中，每对核酸分子编码目的蛋白的至少两个部分并且编码至少两种核酶。在一个实施方案中，所述组合物包含至少四种rna分子，该至少四种rna分子包括至少两对rna分子。在一个实施方案中，每对rna分子编码目的蛋白的至少两个部分并且包含至少两种核酶。
[0122]
在一个实施方案中，所述至少两对rna分子包括第一对rna分子和第二对rna分子。在一个实施方案中，所述第一对rna分子包括第一rna分子和第二rna分子。在一个实施方案中，所述第二对rna分子包括第三rna分子和第四rna分子。在一些实施方案中，所述第三rna
分子和所述第四rna分子与所述第一rna分子和所述第二rna分子具有不同的开放阅读框，使得在自发顺式切割后，所述第一rna分子或所述第二rna分子与所述第三rna分子或第四rna分子的连结不能翻译全长的功能性蛋白产物。
[0123]
在一个实施方案中，所述至少两对rna分子进一步包括第三对rna分子。在一个实施方案中，第三对rna分子包括第五rna分子和第六rna分子。在一些实施方案中，所述第五rna分子和所述第六rna分子具有与所述第一对rna分子和所述第二对rna分子不同的开放阅读框，以使得在自发顺式切割后，仅所述第一对、第二对或第三对rna分子的连结可以翻译全长的功能性蛋白产物。
[0124]
如本文所述，当一种rna含有3'核酶而另一种rna含有5'核酶时，两种独立rna之间可以发生核酶介导的反式剪接。然而，当在同一种rna分子中以顺式被转录时，两种核酶可以介导它们自己的无疤痕去除。这种方法类似地产生两个独立的具有3'-p和5'oh端的rna，该rna可以在细胞中经受反式剪接和翻译。在所述3'和5'核酶之间纳入货物序列也会产生在连结后产生环化rna分子的可能性。
[0125]
在一个实施方案中，本发明涉及一种组合物，该组合物包含单一的编码目的蛋白的两个或更多个部分并且编码一种或多种核酶的核酸分子。在一个实施方案中，本发明涉及一种组合物，该组合物包含单一的编码目的蛋白的两个或更多个部分并且包含一种或多种核酶的rna分子。
[0126]
在一个实施方案中，所述单个核酸分子编码rna的第一部分、合成内含子，和rna的第二部分。在一个实施方案中，该合成内含子包含5'核酶和3'核酶。在一个实施方案中，rna的所述第一部分编码目的蛋白的第一部分。在一个实施方案中，rna的所述第二部分编码目的蛋白的第二部分。在一个实施方案中，所述单个核酸包含按以下顺序连接的序列：(编码目的蛋白的第一部分的rna的第一部分)-(合成内含子的5'核酶)-(合成内含子的3'核酶)-(编码目的蛋白的第二部分的rna的第二部分)。在一个实施方案中，所述目的蛋白的所述第一部分是gfp的n
‑‑
端部分。在一个实施方案中，所述合成内含子的5'核酶包括hdv。在一个实施方案中，rna的第一部分和合成内含子的5'核酶包含seq id no:127的核酸序列，其中小写字母表示5'核酶序列并且大写字母表示编码gfp的n-端部分的序列(参见实施例4，“含有具有和不具有货物的内部合成核酶内含子的gfp”)。在一个实施方案中，所述目的蛋白的所述第二部分是gfp的c-端部分。在一个实施方案中，所述合成内含子的所述3'核酶包含hh。在一个实施方案中，所述rna的第二部分和所述合成内含子的3'核酶包含seq id no:128的核酸序列，其中小写字母表示3'核酶序列并且大写字母表示编码gfp的c-端部分的序列。(参见实施例4，“含有具有和不具有货物的内部合成核酶内含子的gfp”)。
[0127]
在一个实施方案中，所述合成内含子包含置于所述5'核酶和所述3'核酶之间的货物序列。在一个实施方案中，所述单个核酸包含按以下顺序连接的序列：(编码目的蛋白的第一部分的rna的第一部分)-(合成内含子的5'核酶)-(货物序列)-(合成内含子的3'核酶)-(编码目的蛋白的第二部分的rna的第二部分)。
[0128]
在一个实施方案中，所述合成内含子的5'核酶序列不需要双侧侧接序列来发挥活性。在一个实施方案中，由包含不需要双侧侧接序列来发挥活性的5'核酶序列的合成内含子末端的连结产生的环状rna可以以环状形式和经再切割的线性形式存在。在一个实施方案中，所述核酶序列是hdv核酶。
[0129]
在一个实施方案中，合成内含子的5'核酶序列确实需要双侧侧接序列来发挥活性。在一个实施方案中，由包含确实需要双侧侧接序列来发挥活性的5'核酶序列的合成内含子末端的连结产生的环状rna可仅以环状形式存在。在一个实施方案中，所述核酶序列是hh核酶。
[0130]
在一个实施方案中，所述合成内含子的5'核酶序列是核酶识别序列。在一个实施方案中，该核酶识别序列需要添加反式切割核酶以进行诱导型切割。在一个实施方案中，所述核酶识别序列包含vs-s。在一些实施方案中，vs-s由包含seq id no:15的核酸序列编码。在一个实施方案中，所述反式切割核酶包含vs-rz。在一些实施方案中，vs-s由包含seq id no:16的核酸序列编码。
[0131]
在一个实施方案中，5'核酶序列和3'核酶序列的自切割产生以下三个单独的rna分子：1)第一片段，包含编码目的蛋白的第一部分的rna的第一部分；2)第二片段，包含合成内含子；3)第三片段，包含编码目的蛋白的第二部分的rna的第二部分。在一个实施方案中，第二片段的相容末端被连结从而产生包含含有货物序列的合成内含子的环状rna分子。在实施方案中，第一片段和第三片段被连结在一起从而产生单个全长线性rna分子。
[0132]
在一个实施方案中，合成内含子的货物序列是选自由以下组成的组的一种或多种：编码目的治疗性蛋白的序列、crispr指导rna序列、小rna序列和反式切割核酶序列。在一个实施方案中，所述小rna序列包括选自由以下组成的组的一种或多种：微rna(mirna)、piwi相互作用rna(pirna)、小干扰rna(sirna)、小核仁rna(snorna)、小trna来源的rna(tsrna)、小rdna来源的rna(srrna)和小核rna(snrna)。
[0133]
在一个实施方案中，所述单个全长线性rna分子编码全长目的蛋白。在一个实施方案中，该全长目的蛋白是治疗性蛋白。在一个实施方案中，该治疗性蛋白可以是但不限于选自由以下组成的组的一种或多种：utrophin、抗肌萎缩蛋白、dysferlin、myoferlin、囊性纤维化跨膜电导调节剂(cftr)、凝血因子viii、纤维囊蛋白、视网膜特异性磷脂-转运atp酶(abca4)、耳畸蛋白、铜转运atp酶2、myo7a、myo15a、cdh23、strc、otog、tecta、pcdh15、triobp、myo3a、col11a2、loxhd1、ptprq、otogl、myh14、myh9、tnc、cacna1a、cacna1c、cacna1f、cacna1h、cacna1g、cacna1d、cacna1b、cacna1s、cacna1i、cacna1e、atp2a1、atp2a2、adcy6、fkbp12-雷帕霉素结合域和cas9。在一个实施方案中，该全长目的蛋白是重组酶。在一个实施方案中，该重组酶是选自由以下(但是不限于以下)组成的组的一种或多种：cre重组酶、flp重组酶。在一个实施方案中，该全长目的蛋白是真核/原核抗生素抗性基因产物。在一个实施方案中，该真核/原核抗生素抗性基因产物是选自由以下(但是不限于以下)组成的组的一种或多种：氨苄青霉素、卡那霉素、杀稻瘟菌素、嘌呤霉素、新霉素和潮霉素。在一个实施方案中，该全长目的蛋白是报告蛋白。在一个实施方案中，该报告蛋白是选自由以下组成的组的一种或多种：绿色荧光蛋白(gfp)、红色荧光蛋白(rfp)和荧光素酶(luc)。在一个实施方案中，该报告蛋白用作用于评估货物序列的递送和表达的代表性指标。在某些实施方案中，该全长目的蛋白是抗体。在一个实施方案中，该抗体能够结合至目的靶蛋白。在一些实施方案中，该抗体是抗体片段、合成抗体、纳米抗体或它们的保持了结合至靶蛋白的能力的片段或变体。
[0134]
在某些方面，本发明的技术可用于组装全长rna病毒基因组。在一个实施方案中，所述一种或多种编码本发明的一种或多种核酶的核酸分子编码rna病毒基因组的一个或多
个部分。在一个实施方案中，包含本发明的一种或多种核酶的所述一种或多种rna分子包含rna病毒基因组的一个或多个部分。
[0135]
在一个实施方案中，所述一种或多种核酸分子包含编码rna病毒基因组的第一部分并且编码3'核酶的第一核酸分子。在一个实施方案中，所述一种或多种核酸分子包含编码rna病毒基因组的第二部分并且编码5'核酶的第二核酸。在一个实施方案中，所述一种或多种rna分子包括包含rna病毒基因组的第一部分和3'核酶的第一rna分子。在一个实施方案中，所述一种或多种rna分子包括包含rna病毒基因组的第二部分和5'核酶的第二rna分子。在一个实施方案中，所述组合物包含编码连结酶的核酸或连结酶。在一个实施方案中，在3'和5'核酶顺式切割后，rna病毒基因组的第一部分和rna病毒基因组的第二部分被连结在一起，从而产生全长rna病毒基因组。示例性的rna病毒包括但不限于：冠状病毒、副粘病毒、正粘病毒、逆转录病毒、慢病毒、甲病毒、黄病毒、弹状病毒、麻疹病毒、新城病病毒和小核糖核酸病毒。
[0136]
在一些实施方案中，本发明包括包含编码连结酶的核酸的组合物。在一些实施方案中，该连结酶介导3'p或2'3'cp末端和5'oh末端的连结。在一些实施方案中，该连结酶是rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。在一些实施方案中，该rtcb连结酶来自选自由以下组成的组的生物体的一种或多种结构域：真核生物、细菌和古生菌。在一些实施方案中，该生物体选自由以下组成的组：人、大肠杆菌、耐辐射异常球菌(deinococcus radiodurans)、霍里科什火球菌(pyrococcus horikoshii)、火球菌属种(pyrococcus sp.)st04，和热球菌属种ep。在一些实施方案中，编码连结酶的核酸序列是选自由以下组成的组的一种或多种：seq id no:82、seq id no:84、seq id no:86、seq id no:88、seq id no:90，seq id no：92。在一些实施方案中，编码连结酶的核酸序列编码一种或多种选自由以下组成的组的氨基酸序列：seq id no:81、seq id no:83、seq id no:85、seq id no:87、seq id no：89、seq id no：91。
[0137]
核酸
[0138]
在一些实施方案中，本发明的一种或多种核酸包含与本文所述的核酸序列基本上同源的核酸序列。例如，在一些实施方案中，该核酸与原始核酸序列的同一性程度为至少60％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％，或至少99.5％。
[0139]
在一些实施方案中，本发明的一种或多种核酸包含作为本文所述核酸序列的一部分的核酸序列。例如，在一些实施方案中，该核酸具有相对于原始核酸序列的至少60％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％的长度。
[0140]
在一些实施方案中，本发明的一种或多种核酸包含作为本文所述核酸序列的一部分的核酸序列，并且与本文所述核酸序列基本上同源。例如，在一些实施方案中，该核酸与原始核酸序列的同一性程度为至少60％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少
98％、至少99％、或至少99.5％，并且/或者该核酸具有相对于原始核酸序列的至少60％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％，或至少99.5％的长度。
[0141]
本发明的核酸可以包括任何类型的核酸，包括但不限于dna和rna。例如，在一个实施方案中，所述组合物包含编码本发明的融合蛋白的分离的dna分子，包括例如分离的cdna分子。在一个实施方案中，所述组合物包含编码本发明的融合蛋白或其功能片段的分离的rna分子。
[0142]
可以修饰本发明的核酸分子以提高在血清中或在用于细胞培养的生长培养基中的稳定性。可以添加修饰以增强稳定性、功能性和/或特异性以及最小化本发明核酸分子的免疫刺激特性。例如，为了增强稳定性，可以稳定3'-残基以防止降解，例如，它们可以被选择成使得它们由嘌呤核苷酸，特别是腺苷或鸟苷核苷酸组成。可替代地，嘧啶核苷酸被经修饰的类似物的取代(例如尿苷被2'-脱氧胸苷的取代)能被耐受并且不影响该分子的功能。
[0143]
在本发明的一个实施方案中，所述核酸分子可以含有至少一种经修饰的核苷酸类似物。例如，可以通过掺入经修饰的核苷酸类似物来稳定末端。
[0144]
核苷酸类似物的非限制性例子包括糖和/或骨架被修饰的核糖核苷酸(即包括对磷酸-糖骨架的修饰)。例如，可以修饰天然rna的磷酸二酯连键以纳入氮或硫杂原子中的至少一者。在示例性的骨架被修饰的核糖核苷酸中，连接到相邻核糖核苷酸的磷酸酯基团被经修饰的基团(例如硫代磷酸酯基团)置换。在示例性糖被修饰的核糖核苷酸中，2'oh-基团被选自h、or、r、卤基、sh、sr、nh2、nhr、nr2或on的基团置换，其中r是c
1-c6烷基、烯基或炔基，并且卤基是f、cl、br或i。
[0145]
修饰的其他实例是核碱基被修饰的核糖核苷酸，即，含有至少一种非天然存在的核碱基而不是天然存在的核碱基的核糖核苷酸。碱基可以被修饰成阻断腺苷脱氨酶的活性。示例性经修饰的核碱基包括但不限于在5-位被修饰的尿苷和/或胞苷，例如5-(2-氨基)丙基尿苷、5-溴尿苷；在8位被修饰的腺苷和/或鸟苷，例如8-溴鸟苷；脱氮核苷酸，例如7-脱氮-腺苷；o-烷基化核苷酸和n-烷基化核苷酸，例如n6-甲基腺苷是合适的。应当注意，上述修饰可以组合。
[0146]
在一些情况下，核酸分子包含以下化学修饰中的至少一种：一个或多个核苷酸的2'-h、2'-o-甲基或2'-oh修饰。在某些实施方案中，本发明的核酸分子可以对核酸酶具有增强的抗性。为了增加核酸酶抗性，核酸分子可以包含，例如，2'-经修饰的核糖单元和/或硫代磷酸酯连键。例如，2'羟基(oh)可以被许多不同的“氧基”或“脱氧基”取代基修饰或置换。为了增加核酸酶抗性，本发明的核酸分子可以包含2'-o-甲基、2'-氟、2'-o-甲氧基乙基、2'-o-氨基丙基、2'-氨基和/或硫代磷酸酯连键。锁核酸(lna)、乙烯核酸(ena)(例如2'-4'-乙烯桥连的核酸)，以及某些核碱基修饰(诸如2-氨基-a、2-硫代(例如2-硫代-u)、g-clamp修饰)的纳入也可以增加与靶标的结合亲和力。
[0147]
在一个实施方案中，所述核酸分子包括2'-经修饰的核苷酸，例如2'-脱氧、2'-脱氧-2'-氟、2'-o-甲基、2'-o-甲氧基乙基(2'-o-moe)、2'-o-氨基丙基(2'-o-ap)、2'-o-二甲基氨基乙基(2'-o-dmaoe)、2'-o-二甲基氨基丙基(2'-o-dmap),2'-o-二甲基氨基乙氧基乙基(2'-o-dmaeoe)或2'-o-n-甲基乙酰胺基(2'-o-nma)。在一个实施方案中，所述核酸分子
包括至少一个2'-o-甲基被修饰的核苷酸，并且在一些实施方案中，所述核酸分子的所有核苷酸都包括2'-o-甲基修饰。
[0148]
在某些实施方案中，本发明的核酸分子具有以下一种或多种性质：
[0149]
本文讨论的核酸剂包括在其他方面未经修饰的rna和dna以及已经例如为了提高功效而被修饰的rna和dna，以及核苷替代物的聚合物。未经修饰的rna是指其中核酸的成分(即糖、碱基和磷酸酯部分)与自然界中或人体内天然存在的成分相同或基本相同的分子。本领域将稀有或不常见但天然存在的rna称为经修饰rna，参见例如limbach等人(nucleic acids res.,1994,22:2183-2196)。此类常常被称为经修饰rna的稀有或不常见的rna通常是转录后修饰的结果，并且在如本文所用的术语未经修饰的rna的范围内。如本文所用的经修饰rna是指其中核酸的组分(即糖、碱基和磷酸酯部分)中的一种或多种组分不同于自然界中存在的一种或多种组分或不同于人体中存在的一种或多种组分的分子。虽然它们被称为“经修饰的rna”，但它们当然会因为修饰而包括严格来说不是rna的分子。核苷替代物是其中核糖磷酸酯骨架被允许碱基以正确的空间关系呈现的非核糖磷酸酯构建体置换，从而使得杂交基本上类似于在核糖磷酸酯骨架情况下所见的杂交的分子(例如核糖磷酸酯骨架的不带电的模拟物)。
[0150]
本发明的核酸的修饰可以存在于磷酸酯基团、糖基团、骨架、n-端、c-端或核碱基中的一者或多者处。
[0151]
载体
[0152]
本发明还包括包含一种或多种插入有一种或多种本发明的核酸分子的载体的组合物。在一个实施方案中，该载体编码至少两种rna分子。在一个实施方案中，该系统包含至少两种rna分子。在一些实施方案中，该至少两种rna分子由同一载体编码。在一些实施方案中，该至少两种rna分子包含在同一载体内。在一个实施方案中，所述至少两种rna分子包含第一rna分子和第二rna分子。
[0153]
在一些实施方案中，本发明包括编码至少两种rna分子的至少两种载体。在一些实施方案中，该至少两种载体包含至少两种rna分子。在一些实施方案中，该至少两种载体编码单独rna分子。在一个实施方案中，该至少两种载体包含单独rna分子。在一些实施方案中，该至少两种单独rna分子包含第一rna分子和第二rna分子。在一些实施方案中，第一rna分子由第一载体编码并且第二rna分子由第二载体编码。在一些实施方案中，第一rna分子包含第一载体并且第二rna分子包含第二载体。
[0154]
在一些实施方案中，本发明进一步包括编码一种或多种附加rna分子的载体。在一些实施方案中，本发明进一步包括一种或多种包含一种或多种附加rna分子的载体。在一些实施方案中，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶。在一些实施方案中，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶识别序列。
[0155]
本领域存在很多可用于本发明的合适载体。简而言之，编码本发明融合蛋白的天然或合成核酸的表达通常通过将编码本发明融合蛋白或其部分的核酸可操作地连接至启动子，并且将构建体掺入到表达载体中来实现。待使用的载体适合于在真核细胞中复制和任选地整合。典型的载体含有转录和翻译终止子、起始序列和可用于调节所需核酸序列表达的启动子。
[0156]
本发明的载体也可使用标准基因递送方案用于核酸免疫和基因疗法。用于基因递送的方法是本领域已知的。参见，例如，美国专利号5,399,346、5,580,859、5,589,466，该美国专利通过引用整体并入本文。在另一个实施方案中，本发明提供了一种基因治疗载体。
[0157]
本发明的分离的核酸可以被克隆到许多类型的载体中。例如，所述核酸可被克隆到包括但不限于质粒、噬菌粒、噬菌体衍生物、动物病毒和粘粒的载体中。特别感兴趣的载体包括表达载体、复制载体、探针产生载体和测序载体。
[0158]
进一步地，该载体可以以病毒载体的形式被提供给细胞。病毒载体技术在本领域中是众所周知的并且例如在sambrook等人(2012,molecular cloning:a laboratory manual,cold spring harbor laboratory,new york)中以及在其他病毒学和分子生物学手册中有描述。可用作载体的病毒包括但不限于逆转录病毒、腺病毒、腺相关病毒、疱疹病毒和慢病毒。一般而言，合适的载体含有在至少一种生物体中起作用的复制起点、启动子序列、方便的限制性内切核酸酶位点和一种或多种选择标记(例如，wo 01/96584、wo 01/29058和美国专利号6,326,193)。
[0159]
进一步地，已经开发了许多另外的用于将基因转移到哺乳动物细胞中的基于病毒的系统。例如，逆转录病毒为基因递送系统提供了一个方便的平台。可以使用本领域已知的技术将选定的基因插入到载体中并包装在逆转录病毒颗粒中。然后可以分离出重组病毒并且在体内或离体将其递送至受试者的细胞。许多逆转录病毒系统是本领域已知的。在一些实施方案中，使用腺病毒载体。许多腺病毒载体是本领域已知的。
[0160]
在一个实施方案中，所述组合物包含衍生自腺相关病毒(aav)的载体。术语“aav载体”意指衍生自腺相关病毒血清型的载体，包括但不限于aav-1、aav-2、aav-3、aav-4、aav-5、aav-6、aav-7、aav-8和aav-9。aav载体已成为用于治疗各种病症的强大基因递送工具。aav载体具有许多使其非常适合于基因疗法的特征，包括缺乏致病性、最小的免疫原性以及以稳定且有效的方式转导有丝分裂后细胞的能力。通过选择aav血清型、启动子和递送方法的适当组合，可以使aav载体内包含的特定基因的表达特异性地靶向至一种或多种类型的细胞。
[0161]
aav载体可以具有一个或多个aav野生型基因(优选rep和/或cap基因)的全部或部分缺失，但保留了功能性侧接itr序列。尽管同源性程度很高，但不同的血清型对不同的组织具有嗜性。aav1的受体是未知的；然而，已知aav1比aav2更有效地转导骨骼肌和心肌。由于大多数研究都是用假型载体完成的，其中侧接有aav2 itr的载体dna被包装到交替血清型的衣壳中，很明显，生物学差异与衣壳有关，而不是与基因组有关。最近的证据表明，包装在aav 1衣壳中的dna表达盒在转导心肌细胞方面的效率比包装在aav2衣壳中的那些高至少1个log10。在一个实施方案中，病毒递送系统是腺相关病毒递送系统。该腺相关病毒可以是血清型1(aav 1)、血清型2(aav2)、血清型3(aav3)、血清型4(aav4)、血清型5(aav5)、血清型6(aav6)、血清型7(aav7)、血清型8(aav8)或血清型9(aav9)。
[0162]
用于组装成载体的理想aav片段包括帽蛋白(包括vp1、vp2、vp3和高变区)、rep蛋白(包括rep 78、rep 68、rep 52和rep 40)，以及编码这些蛋白的序列。这些片段可以很容易地用于各种载体系统和宿主细胞。此类片段可单独使用，与其他aav血清型序列或片段组合使用，或与来自其他aav或非aav病毒序列的元件组合使用。如本文所用，人工aav血清型包括但不限于具有非天然存在的衣壳蛋白的aav。此种人工衣壳可以通过任何合适的技术
使用选择的aav序列(例如，vp1衣壳蛋白的片段)与异源序列的组合来产生，该异源序列可以从不同的选择的aav血清型、同一aav血清型的非连续部分、非aav病毒来源，或非病毒来源获得。人工aav血清型可以是但不限于嵌合aav衣壳、重组aav衣壳或“人源化”aav衣壳。因此，适用于表达一种或多种蛋白的示例性aav或人工aav包括aav2/8(参见美国专利号7,282,199)、aav2/5(可从美国国立卫生研究院获得)、aav2/9(国际专利公布号wo2005/033321)、aav2/6(美国专利号6,156,303)和aavrh8(国际专利公布号wo2003/042397)，等等。
[0163]
在一个实施方案中，所述组合物包含慢病毒载体以递送一种或多种本发明的核酸。在一个实施方案中，本发明包括一种慢病毒载体，该慢病毒载体包含一种或多种编码一种或多种目的蛋白的rna分子。例如，来源于逆转录病毒(诸如慢病毒)的载体是用于实现长期基因转移的合适工具，因为它们允许转基因的长期稳定整合以及转基因在子细胞中的繁殖。慢病毒载体与来源于肿瘤逆转录病毒(诸如鼠白血病病毒)的载体相比具有附加优势，因为它们可以转导非增殖细胞，如肝细胞。它们还具有低免疫原性的额外优势。
[0164]
在某些实施方案中，该载体还包括常规控制元件，该常规控制元件以允许其在用质粒载体转染或感染本发明产生的病毒的细胞中转录、翻译和/或表达的方式可操作地连接到转基因。如本文所用，“可操作地连接的”序列包括与目的基因邻接的表达控制序列和反式或远距离作用以控制目的基因的表达控制序列。表达控制序列包括适当的转录起始、终止、启动子和增强子序列；高效的rna处理信号，诸如剪接和多聚腺苷酸(polya)信号；稳定细胞质mrna的序列；提高翻译效率的序列(即kozak共有序列)；增强蛋白稳定性的序列；以及在需要时，增强编码产物分泌的序列。包括天然的、组成型的、诱导型的和/或组织特异性的启动子在内的大量表达控制序列在本领域中是已知的并且可以被使用。
[0165]
附加启动子元件(例如增强子)调节转录启动的频率。通常，这些位于起始位点上游30-110bp的区域，但是最近已证明许多启动子也含有位于起始位点下游的功能元件。启动子元件之间的间距通常是灵活的，因此当元件相对于彼此倒置或移动时，启动子功能得以保留。在胸苷激酶(tk)启动子中，在活性开始下降之前，启动子元件之间的间距可以增加到50bp。根据启动子，似乎各个元件可以协同或独立地发挥作用来活化转录。
[0166]
合适的启动子的一个例子是立即早期巨细胞病毒(cmv)启动子序列。该启动子序列是强组成型启动子序列，其能够驱动与其可操作连接的任何多核苷酸序列的高水平表达。合适的启动子的另一个例子是延伸生长因子-1α(ef-1α)。然而，也可以使用其他组成型启动子序列，包括但不限于猴病毒40(sv40)早期启动子、小鼠乳腺肿瘤病毒(mmtv)、人类免疫缺陷病毒(hiv)长末端重复(ltr)启动子、momulv启动子、禽白血病病毒启动子、爱泼斯坦-巴尔病毒(epstein-barrvirus)立即早期启动子、劳斯肉瘤(roussarcoma)病毒启动子，以及人基因启动子，诸如但不限于肌动蛋白启动子、肌球蛋白启动子、血红蛋白启动子和肌酸激酶启动子。进一步地，本发明不应限于使用组成型启动子。诱导型启动子也被认为是本发明的一部分。诱导型启动子的使用提供了一种分子开关，该分子开关能够在需要与其可操作连接的多核苷酸序列的表达时开启此种表达，或者在不需要表达时关断表达。诱导型启动子的实例包括但不限于金属硫氨酸(metallothionine)启动子、糖皮质激素启动子、孕酮启动子和四环素启动子。
[0167]
在载体上发现的增强子序列也调节其中所含基因的表达。通常，增强子与蛋白因
子结合以增强该基因的转录。增强子可能位于它所调节的基因的上游或下游。增强子也可以是组织特异性的，以增强特定细胞或组织类型中的转录。在一个实施方案中，本发明的载体包含一种或多种增强子以促进存在于载体内的基因的转录。
[0168]
为了评估本发明的融合蛋白的表达，待引入到细胞中的表达载体还可以含有可选择标记基因或报告基因或两者，以促进从寻求通过病毒载体转染或感染的细胞群中鉴定出和选择出表达细胞。在其他方面，可选择标记可被携带在单独的dna片段上并且被用于共转染程序中。可选择标记和报告基因都可侧接有适当的调节序列，以使其能够在宿主细胞中表达。有用的可选择标记包括例如抗生素抗性基因，诸如neo等。
[0169]
报告基因被用于识别可能转染的细胞和评估调控序列的功能性。一般而言，报告基因是这样的基因，该基因不存在于受体生物体或组织中或者不被受体生物体或组织表达，并且编码这样的多肽，该多肽的表达可通过一些容易检测的特性(例如酶活性)来证明。在将dna引入到受体细胞中后的合适时间测定报告基因的表达。合适的报告基因可以包括编码荧光素酶、β-半乳糖苷酶、氯霉素乙酰转移酶、分泌型碱性磷酸酶或绿色荧光蛋白基因的基因(例如，ui-tei等人，2000febs letters 479:79-82)。合适的表达系统是众所周知的并且可以使用已知技术制备或商业获得。一般而言，具有显示出最高水平的报告基因表达的最小5'侧接区的构建体被鉴定为启动子。此类启动子区域可与报告基因连接并且可被用于评估剂调节启动子驱动的转录的能力。
[0170]
蛋白质
[0171]
在一些实施方案中，本发明包括包含连结酶的组合物。在一些实施方案中，连结酶介导rna分子的3'p或2'3'cp末端与rna分子的5'oh末端的连结。在一些实施方案中，该连结酶是rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。在一些实施方案中，该rtcb连结酶来自选自由以下组成的组的生物体的一种或多种结构域：真核生物、细菌和古生菌。在一些实施方案中，该生物体选自由以下组成的组：人、大肠杆菌、耐辐射异常球菌、霍里科什火球菌、火球菌属种st04，和热球菌属种ep。在一些实施方案中，该连结酶包含一种或多种选自由以下组成的组的氨基酸序列：seq id no:81、seq id no:83、seq id no:85、seq id no:87、seq id no:89、seq id no：91。
[0172]
在一些实施方案中，本发明的一种或多种蛋白包含与本文所述的氨基酸序列基本上同源的氨基酸序列。例如，在一些实施方案中，该蛋白具有相对于原始氨基酸序列为至少60％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％的同一性程度。
[0173]
在一些实施方案中，本发明的一种或多种蛋白包含作为本文所述氨基酸序列的一部分的氨基酸序列。例如，在一些实施方案中，该蛋白具有相对于原始氨基酸序列为至少60％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％的长度。
[0174]
在一些实施方案中，本发明的一种或多种蛋白包含作为本文所述氨基酸序列的一部分的氨基酸序列，并且与本文所述氨基酸序列基本上同源。例如，在一些实施方案中，所
述蛋白具有相对于原始氨基酸序列为至少60％、至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％，或至少99.5％的同一性程度，并且/或者所述蛋白具有相对于原始氨基酸序列为至少60％、至少65％、至少至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％的长度。
[0175]
药物组合物
[0176]
本发明还涵盖本发明的药物组合物或其盐用于实施本发明的方法的用途。此种药物组合物可以由呈适合于施用于受试者的形式的至少一种本发明的核酸或其盐组成，或者该药物组合物可以包含至少一种本发明的核酸或其盐，以及一种或多种药学上可接受的载体、一种或多种附加成分，或这些的一些组合。本发明的核酸可以存在于生理上可接受的盐的形式，例如以与如本领域所熟知的生理上可接受的阳离子或阴离子的组合的药物组合物中。
[0177]
在一个实施方案中，可以施用可用于实施本发明方法的药物组合物以递送介于1ng/kg/天和100mg/kg/天之间的剂量。在另一个实施方案中，可以施用可用于实施本发明的药物组合物以递送介于1ng/kg/天和500mg/kg/天之间的剂量。
[0178]
本发明的药物组合物中活性成分、药学上可接受的载体和任何其他成分的相对量将根据被治疗受试者的身份、大小和状况以及进一步取决于组合物的施用途径而变化。举例来说，该组合物可以包含介于0.1％和100％(w/w)之间的活性成分。
[0179]
可用于本发明方法的药物组合物可适当地被开发用于口服、直肠、阴道、肠胃外、局部、肺部、鼻内、颊部、眼部施用或另外的施用途径。在本发明的方法内有用的组合物可以直接施用于哺乳动物的皮肤或任何其他组织。其他考虑的制剂包括脂质体配制物、含有活性成分的重新密封的红细胞和基于免疫学的制剂。一种或多种施用途径对于技术人员来说是显而易见的，并且将取决于许多因素，包括所治疗疾病的类型和严重程度、所治疗的兽医或人受试者的类型和年龄等。
[0180]
本文所述的药物组合物的制剂可以通过药理学领域中已知的或药理学领域中以后开发的任何方法来制备。一般而言，此类制备方法包括以下步骤：将活性成分与载体或一种或多种其他辅助成分联合，以及然后，如果有必要或需要，将产品成型或包装成所需的单剂量或多剂量单位。
[0181]
如本文所用，“单位剂量”是包含预定量的活性成分的药物组合物的离散量。活性成分的量一般等于将被施用给受试者的活性成分的剂量或此种剂量的方便分数，诸如，例如此种剂量的二分之一或三分之一。单位剂型可以是单次日剂量，或多次日剂量(例如，每天约1至4次或更多次)的一次剂量。当使用多个日剂量时，每次剂量的单位剂型可以相同或不同。
[0182]
在一个实施方案中，使用一种或多种药学上可接受的赋形剂或载体配制本发明的组合物。在一个实施方案中，本发明的药物组合物包含治疗有效量的本发明的核酸和药学上可接受的载体。有用的药学上可接受的载体包括但不限于甘油、水、生理盐水、乙醇和其
他药学上可接受的盐溶液，诸如磷酸盐和有机酸盐。这些和其他药学上可接受的载体的例子在remington's pharmaceutical sciences(1991,mack publication co.,new jersey)中有描述。
[0183]
该载体可以是溶剂或分散介质，其含有例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等)、它们的合适混合物，以及植物油。例如，通过使用诸如卵磷脂的包衣、通过在分散体的情况下保持所需的颗粒大小，以及通过使用表面活性剂，可以保持适当的流动性。可以通过各种抗细菌剂和抗真菌剂，例如对羟基苯甲酸酯、氯丁醇、苯酚、抗坏血酸、硫柳汞等来实现对微生物作用的预防。在许多情况下，所述组合物中包含等渗剂，例如糖、氯化钠或多元醇，诸如甘露醇和山梨糖醇。可通过在可注射组合物中纳入延迟吸收的剂，例如单硬脂酸铝或明胶来延长该组合物的吸收。在一个实施方案中，药学上可接受的载体不是单独的dmso。
[0184]
制剂可以与常规赋形剂(即适用于口服、阴道、肠胃外、鼻、静脉内、皮下、肠或本领域已知的任何其他合适的施用方式的药学上可接受的有机或无机载体物质)混合使用。可以对药物配制物进行灭菌，并且如果需要，可以将其与助剂(例如润滑剂、防腐剂、稳定剂、润湿剂、乳化剂、用于影响渗透压的盐、缓冲剂、着色剂、调味剂和/或芳香物质等)混合。还可以在需要时将它们与其他活性剂，例如其他镇痛剂组合。
[0185]
如本文所用，“附加成分”包括但不限于以下中的一种或多种：赋形剂；表面活性剂；分散剂；惰性稀释剂；造粒和崩解剂；粘合剂；润滑剂；甜味剂；调味剂；着色剂；防腐剂；生理可降解组合物，诸如明胶；水性媒介物和溶剂；油性媒介物和溶剂；悬浮剂；分散剂或润湿剂；乳化剂、缓和剂；缓冲剂；盐类；增稠剂；填充物；乳化剂；抗氧化剂；抗生素；抗真菌剂；稳定剂；以及药学上可接受的聚合或疏水材料。可以包含在本发明的药物组合物中的其他“附加成分”在本领域中是已知的并且例如在genaro编辑(1985,remington’spharmaceutical sciences,mack publishing co.,easton,pa)中有描述，其通过引用并入本文。
[0186]
本发明组合物可包含按组合物总重量计约0.005％至2.0％的防腐剂。防腐剂用于防止在暴露于环境中的污染物的情况下变质。根据本发明有用的防腐剂的实例包括但不限于选自由苯甲醇、山梨酸、对羟基苯甲酸酯、酰亚胺脲以及它们的组合组成的组的那些。示例性防腐剂是约0.5％至2.0％苯甲醇和0.05％至0.5％山梨酸的组合。
[0187]
在一个实施方案中，所述组合物包含抗氧化剂和抑制核酸降解的螯合剂。一些化合物的示例性抗氧化剂是按所述组合物总重量计在约0.01重量％至0.3重量％范围内的bht、bha、α-生育酚和抗坏血酸，以及在0.03重量％至0.1重量％范围内的bht。在一个实施方案中，螯合剂以按所述组合物总重量计0.01重量％至0.5重量％的量存在。示例性螯合剂包括重量范围为约0.01％至0.20％的依地酸盐(例如依地酸二钠)和柠檬酸。在一些实施方案中，螯合剂在按所述组合物总重量计的0.02重量％至0.10重量％的范围内。螯合剂可用于螯合组合物中可能对制剂的保质期有害的金属离子。虽然bht和依地酸二钠分别是一些化合物的示例性抗氧化剂和螯合剂，但其他合适的等效的抗氧化剂和螯合剂因此可以被取代，如本领域技术人员已知的。
[0188]
可以使用常规方法制备液体悬浮液以实现活性成分在水性或油性媒介物中的悬浮。水性媒介物包括例如水和等渗生理盐水。油性媒介物包括例如杏仁油、油性酯、乙醇、植
物油(如花生油、橄榄油、芝麻油或椰子油)、分馏植物油和矿物油(如液体石蜡)。液体悬浮液可进一步包含一种或多种附加成分，该附加成分包括但不限于悬浮剂、分散剂或润湿剂、乳化剂、缓和剂、防腐剂、缓冲剂、盐、调味剂、着色剂和甜味剂。油性悬浮液可进一步包含增稠剂。已知的悬浮剂包括但不限于山梨糖醇糖浆、氢化可食用脂肪、海藻酸钠、聚乙烯吡咯烷酮、黄蓍胶、阿拉伯树胶和纤维素衍生物(如羧甲基纤维素钠、甲基纤维素、羟丙基甲基纤维素)。已知的分散剂或润湿剂包括但不限于天然存在的磷脂(诸如卵磷脂)；烯化氧与脂肪酸、与长链脂族醇、与衍生自脂肪酸和己糖醇的偏酯，或与衍生自脂肪酸和己糖醇酐的偏酯的缩合产物(例如分别为硬脂酸聚氧乙烯酯、十七乙烯氧基鲸蜡醇(heptadecaethyleneoxy cetanol)、单油酸聚氧乙烯山梨糖醇酯和单油酸聚氧乙烯山梨醇酐酯)。已知的乳化剂包括但不限于卵磷脂和阿拉伯胶。已知的防腐剂包括但不限于对羟基苯甲酸甲酯、对羟基苯甲酸乙酯或对羟基苯甲酸正丙酯、抗坏血酸和山梨酸。已知的甜味剂包括例如甘油、丙二醇、山梨糖醇、蔗糖和糖精。用于油性悬浮液的已知增稠剂包括例如蜂蜡、硬石蜡和鲸蜡醇。
[0189]
活性成分在水性或油性溶剂中的液体溶液可以以与液体悬浮液基本相同的方式制备，主要区别在于活性成分溶解在溶剂中，而不是悬浮在溶剂中。如本文所用，“油性”液体是一种包含含碳液体分子并且表现出比水更小的极性特征的液体。本发明的药物组合物的液体溶液可以包含针对液体悬浮液描述的组分中的每一种组分，应当理解，悬浮剂将不一定有助于活性成分在溶剂中的溶解。水性溶剂包括例如水和等渗生理盐水。油性溶剂包括例如杏仁油、油性酯、乙醇、植物油(如花生油、橄榄油、芝麻油或椰子油)、分馏植物油和矿物油(如液体石蜡)。
[0190]
本发明药物配制物的粉末和颗粒制剂可以使用已知方法制备。此类制剂可被直接施用给受试者，被用来例如形成片剂、填充胶囊或通过向其中添加水性或油性媒介物来制备水性或油性悬浮液或溶液。这些制剂中的每一种制剂均可以进一步包含分散剂或润湿剂、悬浮剂和防腐剂中的一种或多种。这些制剂中还可以包含附加赋形剂，诸如填充剂和甜味剂、调味剂或着色剂。
[0191]
本发明的药物组合物还可以以水包油乳剂或油包水乳剂的形式制备、包装或销售。油相可以为植物油(诸如橄榄油或花生油)、矿物油(诸如液体石蜡)，或这些的组合。此类组合物可进一步包含一种或多种乳化剂，诸如天然存在的树胶(诸如阿拉伯树胶或黄蓍胶)、天然存在的磷脂(诸如大豆或卵磷脂磷脂)、衍生自脂肪酸和己糖醇酐的组合的酯或偏酯(诸如脱水山梨糖醇单油酸酯)，以及此类偏酯与环氧乙烷的缩合产物(诸如单油酸聚氧乙烯山梨醇酐酯)。这些乳剂还可以包含附加成分，包括例如甜味剂或调味剂。
[0192]
用化学组合物浸渍或涂覆材料的方法在本领域中是已知的，并且包括但不限于将化学组合物沉积或结合到表面上的方法、在材料的合成期间将化学组合物掺入到该材料的结构中的方法(即，诸如用生理可降解材料)，以及将水或油溶液或悬浮液吸收到吸收性材料中(随后进行干燥或不进行干燥)的方法。
[0193]
施用方案可以影响有效量的构成。可在疾病诊断之前或之后将治疗性制剂施用给受试者。进一步地，可以每天或依次施用若干个分开的剂量以及交错的剂量，或者该剂量可以被连续输注，或者可以是团注。进一步地，治疗性制剂的剂量可以根据治疗或预防情况的紧急程度按比例增加或减少。
[0194]
可以使用已知程序，以有效预防或治疗疾病的剂量和时间段向受试者(包括哺乳
动物，例如人)施用本发明组合物。实现治疗效果所需的核酸的有效量可以根据诸如以下的因素而变化：所用特定核酸的活性；施用时间；核酸的排泄率；治疗持续时间；与该核酸组合使用的其他药物、化合物或材料；接受治疗的受试者的疾病或病症的状态、年龄、性别、体重、状况、一般健康状况和既往病史；以及医学领域中众所周知的类似因素。可以调整给药方案以提供最佳的治疗响应。例如，可以每天施用若干分开的剂量或者可以根据治疗情况的紧急程度按比例减小剂量。本发明的核酸化合物的有效剂量范围的非限制性实例为约1至5,000mg/kg体重/每天。本领域普通技术人员将能够在无需过多实验的情况下研究相关因素并确定治疗性核酸的有效量。
[0195]
该核酸可以按每天数次的频率施用于受试者，或者可以按更低的频率施用，例如每天一次、每周一次、每两周一次、每月一次，或者按甚至更低的频率施用，例如每几个月一次或甚至一年一次或更久一次。应当理解，在非限制性实例中，每天给药的核酸量可以每天、隔天、每2天、每3天、每4天或每5天施用。例如，就每隔一天施用而言，可以在星期一启动5mg/天剂量，然后在星期三施用第一后续的5mg/天剂量，然后在星期五施用第二后续的5mg/天剂量，依此类推。给药频率对技术人员来说将是显而易见的，并且取决于许多因素，例如但不限于所治疗疾病的类型和严重程度、动物的类型和年龄等。
[0196]
本发明药物组合物中活性成分的实际剂量水平可以变化，以获得有效实现特定受试者、组合物和施用方式的所需治疗反应，而不对受试者有毒的活性成分的量。
[0197]
具有本领域普通技术的医生，例如医师或兽医可以容易地确定和开出所需药物组合物的有效量。例如，医师或兽医可以使药物组合物中使用的本发明核酸的开始剂量低于实现期望治疗效果所需的水平，并逐渐增加该剂量直至实现所需效果。
[0198]
在特定的实施方案中，将核酸配制成剂量单位形式是特别有利的，以便于施用和剂量的均匀性。如本文所用的剂量单位形式是指适合作为用于待治疗的受试者的单一剂量的物理上离散单位；每个单位均含有经计算可产生期望治疗效果的与所需药物媒介物联合的预定量的治疗性核酸。本发明的剂量单位形式由以下决定由并且直接取决于以下：(a)核酸的独特特性和要达到的特定治疗效果，以及(b)复合/配制此种核酸用于治疗受试者疾病的技术中固有的限制。
[0199]
在一个实施方案中，本发明组合物以每天1至5次或更多次的剂量施用于受试者。在另一个实施方案中，本发明组合物以包括但不限于每天一次、每两天一次、每三天一次至每周一次，和每两周一次的剂量范围施用于受试者。对本领域技术人员而言，很明显，本发明的各种组合组合物的施用频率将因受试者而异，这取决于许多因素，包括但不限于年龄、待治疗的疾病或病症、性别、整体健康状况和其他因素。因此，本发明不应被解读为限于任何特定的剂量方案，并且将由主治医生在考虑与任何受试者有关的所有其他因素的情况下确定给该受试者施用的精确剂量和组合物。
[0200]
用于施用的本发明组合物可以在以下范围内：约1mg至约10,000mg、约20mg至约9,500mg、约40mg至约9,000mg、约75mg至约8,500mg、约150mg至约7,500mg、约200mg至约7,000mg、约3050mg至约6,000mg、约500mg至约5,000mg、约750mg至约4,000mg、约1mg至约3,000mg、约10mg至约2,500mg、约20mg至约2,000mg、约25mg至约1,500mg、约50mg至约1,000mg、约75mg至约900mg、约100mg至约800mg、约250mg至约750mg、约300mg至约600mg、约400mg至约500mg，以及它们之间的任何和所有全部或部分增量。
[0201]
在一些实施方案中，本发明组合物的剂量为约1mg至约2,500mg。在一些实施方案中，用于本文所述组合物中的本发明组合物的剂量小于约10,000mg，或小于约8,000mg，或小于约6,000mg，或小于约5,000mg，或小于约3,000mg，或小于约2,000mg，或小于约1,000mg，或小于约500mg，或小于约200mg，或小于约50mg。类似地，在一些实施方案中，如本文所述的第二组合物(即，用于治疗与通过本发明组合物治疗的疾病相同的疾病或另一种疾病的药物)的剂量小于约1,000mg，或小于约800mg，或小于约600mg，或小于约500mg，或小于约400mg，或小于约300mg，或小于约200mg，或小于约100mg，或小于约50mg，或小于约40mg，或小于约30mg，或小于约25mg，或小于约20mg，或小于约15mg，或小于约10mg，或小于约5mg，或小于约2mg，或小于约1mg，或小于约0.5mg，以及它们的任何和所有全部或部分增量。
[0202]
在一个实施方案中，本发明涉及一种包装的药物组合物，该组合物包括容器，该容器容纳单独或与第二药剂组合的治疗有效量的本发明核酸；以及使用核酸治疗、预防或减轻受试者的一种或多种疾病症状的说明书。
[0203]
术语“容器”包括用于容纳药物组合物的任何容器。例如，在一个实施方案中，容器是含有药物组合物的包装。在其他实施方案中，容器不是含有药物组合物的包装，即容器是含有包装的药物组合物或未包装的药物组合物和药物组合物的使用说明书的器皿，诸如盒子或小瓶。此外，包装技术在本领域中是众所周知的。应当理解，药物组合物的使用说明书可以包含在含有药物组合物的包装上，因此说明书与经包装产品形成了增强的功能关系。然而，应当理解，说明书可以含有与所述核酸执行其预期功能(例如，治疗或预防受试者的疾病，或将成像剂或诊断剂递送至受试者)的能力有关的信息。
[0204]
本发明的任何组合物的施用途径包括口服、鼻、肠胃外、舌下、经皮、经粘膜(例如，舌下、舌、(经)颊部和鼻(内))、膀胱内、十二指肠内、胃内、直肠、腹膜内、皮下、肌肉内、真皮内、动脉内、静脉内或施用。
[0205]
合适的组合物和剂型包括例如片剂、胶囊、囊片、丸剂、凝胶帽、锭剂、分散体、悬浮液、溶液、糖浆剂、颗粒剂、珠粒、透皮贴剂、凝胶、粉末、小丸剂(pellet)、乳浆剂、糖锭(lozenge)、霜剂、糊剂、膏药、洗剂、圆片(disc)、栓剂、用于鼻或口服施用的液体喷雾剂、用于吸入的干粉剂或雾化制剂、用于膀胱内施用的组合物和制剂等。应当理解，可用于本发明的制剂和组合物不限于本文所述的特定制剂和组合物。
[0206]
系统
[0207]
在一些实施方案中，本发明涉及用于独立rna分子的顺式切割和反式剪接的系统。在一些实施方案中，本发明涉及单种rna分子的顺式切割和反式剪接系统。在一些实施方案中，独立rna分子或单个rna分子片段的顺式切割和反式剪接产生编码如本文所述的全长目的蛋白的单个rna分子。在一些实施方案中，该系统包含如本文所述的连结酶或编码连结酶(诸如rtcb)的核酸。
[0208]
在一个实施方案中，本发明涉及一种用于从编码全长蛋白的第一部分和第二部分的两个单独rna分子通过核酶的顺式切割和该两个独立rna分子的反式剪接来产生编码全长蛋白的单种rna的诱导型系统。在一些实施方案中，该系统包含如本文所述的核酶识别序列和核酶。在一些实施方案中，该系统包含如本文所述的连结酶或编码连结酶的核酸。
[0209]
在一个实施方案中，本发明涉及一种组装全长rna病毒基因组的系统。示例性的rna病毒包括但不限于：冠状病毒、副粘病毒、正粘病毒、逆转录病毒、慢病毒、甲病毒、黄病
毒、弹状病毒、麻疹病毒、新城病病毒和小核糖核酸病毒。在一个实施方案中，该系统包含编码rna病毒基因组的第一部分并且编码3'核酶的第一核酸。在一个实施方案中，该系统包含编码rna病毒基因组的第二部分并且编码5'核酶的第二核酸。在一个实施方案中，该系统包含rna病毒基因组的第一部分，和3'核酶。在一个实施方案中，该系统包含rna病毒基因组的第二部分，和5'核酶。在一个实施方案中，该系统包含编码连结酶的核酸或连结酶。在一个实施方案中，在3'和5'核酶顺式切割后，rna病毒基因组的第一部分和rna病毒基因组的第二部分被连结在一起，从而产生全长rna病毒基因组。
[0210]
体内
[0211]
在一个实施方案中，本发明涉及一种用于通过编码一种或多种全长蛋白的部分的独立rna分子的顺式切割和反式剪接来递送和表达该全长蛋白的系统。在一些实施方案中，该系统允许递送和表达超过传统载体包装尺寸的大蛋白(例如，超过aav载体包装尺寸的抗肌萎缩蛋白)、其中的核酸构建体难以体外合成的合成重复结构域蛋白(例如，合成蜘蛛丝)，或有毒/抗病毒蛋白(例如dta)。在一个实施方案中，本发明包括用于递送和表达一种或多种全长目的蛋白的aav系统。在一些实施方案中，该系统包含如本文所述的连结酶或编码连结酶的核酸。
[0212]
在一个实施方案中，本发明包括一种慢病毒递送系统用以递送一种或多种编码一种或多种目的蛋白的核酸分子。在一个方面，慢病毒递送系统包含(1)包装质粒，(2)包膜质粒，和(3)转移质粒。在一个实施方案中，该转移质粒编码第一rna分子和第二rna分子。
[0213]
在一个实施方案中，本发明包括双慢病毒递送系统，包含第一慢病毒载体和第二慢病毒载体。在一个实施方案中，第一慢病毒载体系统包含(1)包装质粒，(2)包膜质粒，和(3)第一转移质粒。在一个实施方案中，第二慢病毒载体系统包含(1)包装质粒，(2)包膜质粒，和(3)第二转移质粒。在一个实施方案中，第一转移质粒编码第一rna分子。在一个实施方案中，第二转移质粒编码第二rna分子。
[0214]
在一个实施方案中，包装质粒包含编码gag-pol多聚蛋白的核酸序列。在一个实施方案中，gag-pol多聚蛋白包含催化死亡的整合酶。在一个实施方案中，gag-pol多聚蛋白包含d116n整合酶突变。
[0215]
在一个实施方案中，包膜质粒包含编码包膜蛋白的核酸序列。在一个实施方案中，包膜质粒包含编码hiv包膜蛋白的核酸序列。在一个实施方案中，包膜质粒包含编码水疱性口炎病毒g-蛋白(vsv-g)包膜蛋白的核酸序列。在一个实施方案中，可以基于所需的细胞类型来选择包膜蛋白。
[0216]
在一个实施方案中，单个转移质粒的第一rna分子包含编码目的蛋白的第一部分的蛋白编码区和3'核酶。在一个实施方案中，单个转移质粒的第二rna分子包含编码目的蛋白的第二部分的蛋白编码区和5'核酶。在一个实施方案中，该转移质粒包含5'长末端重复(ltr)序列和3'ltr序列。在一个实施方案中，3'ltr是自失活(sin)ltr。因此，在一个实施方案中，5'ltr包含u3序列、r序列和u5序列，并且3'ltr包含r序列和u5序列，但不包含u3序列。在一个实施方案中，5'ltr和3'ltr与编码目的蛋白的第一部分和目的蛋白的第二部分的序列侧接。
[0217]
在一个实施方案中，第一转移质粒的第一rna分子包含编码目的蛋白的第一部分的蛋白编码区和3'核酶。在一个实施方案中，第二转移质粒的第二rna分子包含编码目的蛋
白的第二部分的蛋白编码区和5'核酶。在一个实施方案中，该第一和第二转移质粒包含5'长末端重复(ltr)序列和3'ltr序列。在一个实施方案中，3'ltr是自失活(sin)ltr。因此，在一个实施方案中，5'ltr包含u3序列、r序列和u5序列，并且3'ltr包含r序列和u5序列，但不包含u3序列。在一个实施方案中，第一转移质粒的5'ltr和3'ltr与编码目的蛋白的第一部分和3'核酶的序列侧接。在一个实施方案中，第二转移质粒的5'ltr和3'ltr与编码目的蛋白的第二部分和5'核酶的序列侧接。
[0218]
在一个实施方案中，将包装质粒、包膜质粒和转移质粒引入到细胞中。在一个实施方案中，该细胞转录并且翻译编码gag-pol蛋白的核酸序列以产生gag-pol多聚蛋白。在一个实施方案中，该细胞转录并且翻译编码包膜蛋白的核酸序列以产生包膜蛋白。在一个实施方案中，该细胞转录单个转移质粒以提供第一rna分子和第二rna分子。在一个实施方案中，该细胞转录第一转移质粒以提供第一rna分子并且转录第二转移质粒以提供第二rna分子。在一个实施方案中，gag-pol蛋白、包膜多聚蛋白、第一rna分子和第二rna分子被包装到病毒颗粒中。在一个实施方案中，病毒颗粒是从细胞培养基中收集的。在一个实施方案中，该病毒颗粒转导靶细胞，其中3'核酶催化自身脱离第一rna分子，从而产生3'p或2'3'cp末端，5'核酶催化自身脱离第二rna分子，从而产生5'oh末端，内源性rna 2',3'-环状磷酸酯，并且5'-oh(rtcb)连结酶将该3'p或2'3'cp末端连结到该5'oh末端，从而产生编码目的蛋白的完整rna分子，并且该细胞翻译目的蛋白。
[0219]
在一个实施方案中，包装质粒、包膜质粒和第一转移质粒被引入到细胞中。在一个实施方案中，该细胞转录并且翻译编码gag-pol蛋白的核酸序列以产生gag-pol多聚蛋白。在一个实施方案中，该细胞转录并且翻译编码包膜蛋白的核酸序列以产生包膜蛋白。在一个实施方案中，该细胞转录第一转移质粒以提供第一rna分子。在一个实施方案中，gag-pol蛋白、包膜多聚蛋白、第一rna分子被包装到第一病毒颗粒中。在一个实施方案中，第一病毒颗粒是从细胞培养基中收集的。
[0220]
在一个实施方案中，包装质粒、包膜质粒和第二转移质粒被引入到细胞中。在一个实施方案中，该细胞转录并且翻译编码gag-pol蛋白的核酸序列以产生gag-pol多聚蛋白。在一个实施方案中，该细胞转录并且翻译编码包膜蛋白的核酸序列以产生包膜蛋白。在一个实施方案中，该细胞转录第二转移质粒以提供第二rna分子。在一个实施方案中，gag-pol蛋白、包膜多聚蛋白、第二rna分子被包装到第二病毒颗粒中。在一个实施方案中，第二病毒颗粒是从细胞培养基中收集的。
[0221]
在一个实施方案中，第一病毒颗粒和第二病毒颗粒转导靶细胞，其中3'核酶催化自身脱离第一rna分子，从而产生3'p或2'3'cp末端，5'核酶催化自身脱离第二rna分子，从而产生5'oh末端，内源性rna 2',3'-环状磷酸酯，并且5'-oh(rtcb)连结酶将该3'p或2'3'cp末端连结到该5'oh末端，从而产生编码目的蛋白的完整rna分子，并且该细胞翻译目的蛋白。在一个实施方案中，本发明涉及一种阻止来自分裂的前体rna分子的不想要的不完全蛋白表达的系统。在一个实施方案中，该系统包含在如本文所述的分裂的前体rna分子中掺入蛋白降解序列的翻译控制器。
[0222]
在一个实施方案中，本发明涉及一种用于从编码目的蛋白的部分的两对或更多对独立rna分子通过核酶的顺式切割以及该成对独立rna分子的反式剪接来表达两种或更多种目的蛋白的系统。在一个实施方案中，每个单个对的独立rna分子具有单独的阅读框，使
得不需要的对的反式剪接不会导致如本文所述的全长功能蛋白的翻译。在一些实施方案中，该系统包含如本文所述的连结酶或编码连结酶的核酸。
[0223]
在一个实施方案中，本发明包括用于递送和表达全长目的蛋白和货物序列的系统。在一个实施方案中，所述系统包含编码目的蛋白的第一部分的rna的第一部分，该rna的第一部分以其3'末端连接到合成内含子；以及编码的目的蛋白的第二部分的rna的第二部分，该rna的第二部分以其5'末端连接到合成内含子。在一个实施方案中，所述合成内含子在任一侧侧接有5'核酶序列和3'核酶序列。在一个实施方案中，所述合成内含子包含被置于所述5'核酶序列和3'核酶序列之间的货物序列。在一个实施方案中，5'核酶序列和3'核酶序列的自切割产生以下三个单独的rna分子：1)第一片段，包含编码目的蛋白的第一部分的rna的第一部分；2)第二片段，包含合成内含子；3)第三片段，包含编码目的蛋白的第二部分的rna的第二部分。在一个实施方案中，第二片段的相容末端被连结从而产生包含含有货物序列的合成内含子的环状rna分子。在实施方案中，第一片段和第三片段被连结在一起从而产生单个全长线性rna分子。在一个实施方案中，全长目的蛋白包括治疗性蛋白、报告蛋白、重组酶、抗生素抗性基因产物、抗体或cas9蛋白。在一个实施方案中，货物序列包含治疗性核酸序列(例如，mirna序列或crispr指导rna序列)或编码治疗性蛋白。在一些实施方案中，全长目的蛋白包含cas9并且货物序列包含指导rna序列，从而使cas9靶向特定基因组序列以进行编辑。在一些实施方案中，该系统包含如本文所述的连结酶或编码连结酶的核酸。
[0224]
在一个实施方案中，本发明包括一种用于基因编辑的系统，该系统包含一种或多种反式切割工程化核酶。在一些实施方案中，所述系统包含两种反式切割工程化核酶，该两种反式切割工程化核酶靶向致病突变的上游和下游。在一些实施方案中，在致病突变的上游和下游的反式切割导致该致病突变的去除。在一些实施方案中，在该致病突变的反式切割后，该基因的剩余部分被反式剪接在一起。在一些实施方案中，经反式剪接的基因表达为功能性蛋白。在一些实施方案中，该系统包含如本文所述的连结酶或编码连结酶的核酸。
[0225]
体外
[0226]
在一个实施方案中，本发明包括用于产生编码目的蛋白的rna分子的体外系统。在一个实施方案中，该系统包含至少两种rna分子。在一个实施方案中，所述至少两种rna分子包含第一rna分子和第二rna分子。
[0227]
在一个实施方案中，所述第一rna分子包含编码目的蛋白的第一部分的编码区。在一个实施方案中，所述第一rna分子包含3'核酶。在一个实施方案中，所述第一rna分子包含如本文所述的编码目的蛋白的第一部分的编码区和3'核酶。
[0228]
在一个实施方案中，所述第二rna分子包含编码目的蛋白的第二部分的编码区。在一个实施方案中，所述第二rna分子包含5'核酶。在一个实施方案中，所述第二rna分子包含如本文所述的编码目的蛋白的第二部分的编码区和5'核酶。
[0229]
在一个实施方案中，用于产生编码目的蛋白的rna分子的体外系统进一步包含连结酶。在一个实施方案中，该连结酶诱导由第一rna分子的编码区和第二rna分子的编码区组装rna分子。在一个实施方案中，所述连结酶是如本文所述的rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。
[0230]
在一个实施方案中，本发明包括用于产生编码目的重复结构域蛋白的rna分子的体外系统。在一个实施方案中，所述系统包含第一rna分子、一种或多种附加rna分子和最后
一种rna分子。
[0231]
在一个实施方案中，所述第一rna分子包含编码目的蛋白的第一部分的编码区。在一个实施方案中，所述第一rna分子包含3'核酶。在一个实施方案中，所述第一rna分子包含编码目的蛋白的第一部分的编码区和3'核酶。在一个实施方案中，3'核酶催化自身脱离第一rna分子，从而产生3'p或2'3'cp末端。在一个实施方案中，所述第一rna分子进一步包含5'标签。在一个实施方案中，所述5'标签介导所述第一rna分子与固体支持物的附接。
[0232]
在一个实施方案中，所述一种或多种附加rna分子包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶识别序列。在一个实施方案中，所述5'核酶切割自身从而产生5'oh末端。在一个实施方案中，所述3'核酶识别序列包含如本文所述的vs-s序列。
[0233]
在一个实施方案中，所述最后一种rna分子包含编码目的蛋白的最后一个部分的编码区。在一个实施方案中，所述最后一种rna分子包含5'核酶。在一个实施方案中，所述最后一种rna分子包含编码目的蛋白的最后一个部分的编码区和5'核酶。在一个实施方案中，所述5'核酶切割自身从而产生5'oh末端。
[0234]
在一个实施方案中，该系统进一步包含核酶。在一个实施方案中，所述核酶包含如本文所述的vs-rz。在一个实施方案中，如本文所述，所述vs-rz识别vs-s，并且介导vs-s从一种或多种附加rna分子上的切割。在一个实施方案中，所述切割产生3'p或2'3'cp末端。
[0235]
在一个实施方案中，该系统包含连结酶。在一些实施方案中，该连结酶将第一rna分子的3'p或2'3'cp末端连结到该一种或多种附加rna分子的5'oh末端。在一些实施方案中，该连结酶将该一种或多种附加rna分子的3'p或2'3'cp末端连结到最后一种rna分子的5'oh末端。在一些实施方案中，连结酶将第一rna分子的3'p或2'3'cp末端连结到该一种或多种附加rna分子的5'oh末端，并且将该一种或多种附加rna分子的3'p或2'3'cp末端连结到最后一种rna分子的5'oh末端，从而产生编码n-端结构域、一个或多个附加结构域和c-端结构域的完整rna分子。在一些实施方案中，该连结酶是如本文所述的rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。
[0236]
方法
[0237]
在一些实施方案中，本发明涉及独立rna分子的顺式切割和反式剪接的方法。在一些实施方案中，本发明涉及单种rna分子的顺式切割和反式剪接方法。在一些实施方案中，独立rna分子或单个rna分子片段的顺式切割和反式剪接产生编码如本文所述的全长目的蛋白的单个rna分子。在一些实施方案中，该方法包括施用如本文所述的连结酶或编码连结酶的核酸。
[0238]
在一个实施方案中，本发明涉及一种用于从编码全长蛋白的第一部分和第二部分的两个单独rna分子通过核酶的顺式切割和该两个独立rna分子的反式剪接来产生编码全长蛋白的单种rna的诱导型方法。在一些实施方案中，该方法包括如本文所述的核酶识别序列和核酶。在一些实施方案中，该方法包括施用如本文所述的连结酶或编码连结酶的核酸。
[0239]
体内
[0240]
在一个实施方案中，本发明包括产生编码目的蛋白的rna分子的方法。在一些实施方案中，该方法包括向细胞或组织施用至少两种核酸分子。在一个实施方案中，该至少两种核酸分子包括第一rna分子和第二rna分子。在一些实施方案中，该至少两种核酸分子编码第一rna分子和第二rna分子。
[0241]
在一个实施方案中，所述第一rna分子包含编码目的蛋白的第一部分的编码区。在一个实施方案中，所述第一rna分子包含3'核酶。在一个实施方案中，所述第一rna分子包含编码目的蛋白的第一部分的编码区和3'核酶。在一个实施方案中，所述3'核酶催化自身脱离第一rna分子，从而产生3'p或2'3'cp末端。在一个实施方案中，所述3'核酶是hdv核酶家族的成员。
[0242]
在一个实施方案中，所述第二rna分子包含编码目的蛋白的第二部分的编码区。在一个实施方案中，所述第二rna分子包含5'核酶。在一个实施方案中，所述第二rna分子包含编码目的蛋白的第二部分的编码区和5'核酶。在一个实施方案中，所述5'核酶催化自身脱离第二rna分子，从而产生5'oh末端。在一个实施方案中，所述5'核酶是hh核酶家族的成员。
[0243]
在一个实施方案中，所述3'p或2'3'cp末端连结到5'oh末端从而形成包含第一rna分子的编码区和第二rna分子的编码区的rna分子。
[0244]
在一个实施方案中，所述方法包括向细胞或组织施用一种或多种编码一种或多种附加rna分子的附加核酸分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶。
[0245]
在一个实施方案中，所述方法包括向细胞或组织施用一种或多种编码一种或多种附加rna分子的附加核酸分子，每种附加rna分子均包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶识别序列。在一个实施方案中，该3’核酶识别序列包含vs-s。在一个实施方案中，该核酶是vs。
[0246]
在一个实施方案中，该方法包括向细胞或组织施用选自由以下组成的组的一种或多种：编码连结酶的核酸分子和连结酶。在一个实施方案中，该连结酶诱导由第一rna分子的编码区和第二rna分子的编码区组装rna分子。在一个实施方案中，连结酶是rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。
[0247]
在一些实施方案中，该方法包括向细胞或组织施用至少一种aav载体，该aav载体编码第一rna分子和第二rna分子，该第一rna分子包含编码目的蛋白的第一部分的蛋白编码区和3'核酶，该第二rna分子包含编码目的蛋白的第二部分的蛋白编码区和5'核酶。在一些实施方案中，该方法包括施用如本文所述的连结酶或编码连结酶的核酸。
[0248]
在一些实施方案中，该方法包括施用至少两种aav载体，包括第一aav载体和第二aav载体。在一个实施方案中，第一aav载体编码第一rna分子，该第一rna分子包含编码目的蛋白的第一部分的蛋白编码区和3'核酶。在一个实施方案中，第二aav载体向细胞或组织编码第二rna分子，该第二rna分子包含编码目的蛋白的第二部分的蛋白编码区和5'核酶。在一些实施方案中，该方法包括施用如本文所述的连结酶或编码连结酶的核酸。
[0249]
在一些实施方案中，该方法包括向细胞或组织施用至少一种慢病毒载体，该慢病毒载体编码第一rna分子和第二rna分子，该第一rna分子包含编码目的蛋白的第一部分的蛋白编码区和3'核酶，该第二rna分子包含编码目的蛋白的第二部分的蛋白编码区和5'核酶。在一些实施方案中，该方法包括施用如本文所述的连结酶或编码连结酶的核酸。
[0250]
在一些实施方案中，该方法包括施用至少两种慢病毒载体，包括第一慢病毒载体和第二慢病毒载体。在一个实施方案中，第一慢病毒载体编码第一rna分子，该第一rna分子包含编码目的蛋白的第一部分的蛋白编码区和3'核酶。在一个实施方案中，第二慢病毒载体向细胞或组织编码第二rna分子，该第二rna分子包含编码目的蛋白的第二部分的蛋白编
码区和5'核酶。在一些实施方案中，该方法包括施用如本文所述的连结酶或编码连结酶的核酸。
[0251]
在一些实施方案中，该方法包括向细胞或组织施用至少一种慢病毒载体递送系统以提供第一rna分子和第二rna分子，该第一rna分子包含编码目的蛋白的第一部分的蛋白编码区和3'核酶，该第二rna分子包含编码目的蛋白的第二部分的蛋白编码区和5'核酶。在一些实施方案中，该方法包括施用如本文所述的连结酶或编码连结酶的核酸。
[0252]
在一些实施方案中，该方法包括施用至少两种慢病毒载体递送系统，包括第一慢病毒载体递送系统和第二慢病毒载体递送系统。在一个实施方案中，第一慢病毒载体递送系统提供第一rna分子，该第一rna分子包含编码目的蛋白的第一部分的蛋白编码区和3'核酶。在一个实施方案中，第二慢病毒载体递送系统向细胞或组织提供第二rna分子，该第二rna分子包含编码目的蛋白的第二部分的蛋白编码区和5'核酶。在一些实施方案中，该方法包括施用如本文所述的连结酶或编码连结酶的核酸。
[0253]
在一些实施方案中，该方法包括施用两种或更多种选自由以下组成的组的递送媒介物：aav载体、慢病毒载体、慢病毒载体递送系统或它们的组合。在一个实施方案中，所述两种或更多种递送媒介物包括第一递送媒介物和第二递送媒介物。在一个实施方案中，第一递送媒介物提供第一rna分子，该第一rna分子包含编码目的蛋白的第一部分的蛋白编码区和3'核酶。在一个实施方案中，第二递送媒介物向细胞或组织提供第二rna分子，该第二rna分子包含编码目的蛋白的第二部分的蛋白编码区和5'核酶。在一些实施方案中，该方法包括施用如本文所述的连结酶或编码连结酶的核酸。
[0254]
将基因引入到细胞中以及使基因表达到细胞中的方法是本领域已知的。在表达载体的情况下，可以容易地通过本领域中的任何方法将该载体引入到宿主细胞，例如哺乳动物、细菌、酵母或昆虫细胞中。例如，表达载体可以通过物理、化学或生物学方式转移到宿主细胞中。
[0255]
用于将多核苷酸引入到宿主细胞中的物理方法包括磷酸钙沉淀、脂质转染、粒子轰击、显微注射、电穿孔等。用于产生包含载体和/或外源核酸的细胞的方法在本领域中是众所周知的。参见，例如，sambrook等人(2012,molecular cloning:a laboratory manual,cold spring harbor laboratory,new york)。用于将多核苷酸引入到宿主细胞中的示例性方法是磷酸钙转染。
[0256]
用于将目的多核苷酸引入到宿主细胞中的生物学方法包括使用dna和rna载体。病毒载体，并且尤其是逆转录病毒载体，已成为用于将基因插入到哺乳动物例如人细胞中最广泛使用的方法。其他病毒载体可以来源于慢病毒、痘病毒、单纯疱疹病毒i、腺病毒和腺相关病毒等。参见，例如，美国专利号5,350,674和5,585,362。
[0257]
用于将多核苷酸引入到宿主细胞中的化学方式包括胶体分散系统，诸如大分子复合物、纳米胶囊、微球、珠粒和基于脂质的系统，包括水包油乳剂、胶束、混合胶束和脂质体。用作体外和体内递送媒介物的示例性胶体系统是脂质体(例如，人造膜囊泡)。
[0258]
在使用非病毒递送系统的情况下，示例性递送媒介物是脂质体。考虑了使用脂质制剂将所述核酸引入到宿主细胞(体外、离体或体内)中。在另一个方面，所述核酸可以与脂质缔合。与脂质缔合的核酸可以包封在脂质体的水性内部中、散布在脂质体的脂质双层中、通过与脂质体和寡核苷酸缔合的连接分子附接至脂质体、包埋在脂质体中、与脂质体复合、
分散在含有脂质的溶液中、与脂质混合、与脂质组合、作为悬浮液包含在脂质中、与胶束一起被包含或复合，或以其他方式与脂质缔合。与脂质、脂质/dna或者脂质/表达载体缔合的组合物不限于溶液中的任何特定结构。例如，它们可能以胶束形式存在于双层结构中，或以“塌陷”结构存在。它们也可以简单地散布在溶液中，从而可能形成大小或形状不均匀的聚集体。脂质是脂肪性物质，其可以是天然存在的脂质或合成脂质。例如，脂质包括天然存在于细胞质中的脂肪滴以及含有长链脂肪烃及其衍生物的一类化合物，诸如脂肪酸、醇、胺、氨基醇和醛。
[0259]
适用的脂质可以从商业来源获得。例如，二肉豆蔻基磷脂酰胆碱(“dmpc”)可以从sigma,st.louis,mo获得；磷酸二十六烷基酯(“dcp”)可以从k&k laboratories(plainview,ny)获得；胆固醇(“choi”)可以从calbiochem-behring获得；二肉豆蔻基磷脂酰甘油(“dmpg”)和其他脂质可以从avanti polar lipids,inc.(birmingham,al)获得。脂质在氯仿或氯仿/甲醇中的储备溶液可储存在约-20℃。氯仿被用作唯一的溶剂，因为它比甲醇更容易蒸发。“脂质体”是一个通用术语，其涵盖通过产生封闭的脂质双层或聚集体形成的各种单层和多层脂质媒介物。脂质体可以被表征为具有含有磷脂双层膜和内部水性介质的囊泡结构。多层脂质体具有由水性介质隔开的多个脂质层。它们在磷脂悬浮在过量的水溶液中时会自发形成。脂质组分在形成封闭结构之前经历自我重排，并在脂质双层之间夹带水和溶解的溶质(ghosh等人，1991glycobiology 5:505-10)。然而，也涵盖在溶液中具有不同于正常囊泡结构的结构的组合物。例如，脂质可能呈现胶束结构或仅作为脂质分子的不均匀聚集体存在。还考虑了lipofectamine-核酸复合物。
[0260]
不管用于将外源核酸引入到宿主细胞中的方法如何，为了确认宿主细胞中重组dna序列的存在，可以执行多种多样的测定。此类测定包括例如本领域技术人员熟知的“分子生物学”测定，诸如southern和northern印迹、rt-pcr和pcr；“生化”测定，诸如检测特定肽的存在或不存在，例如通过免疫学方式(elisa和蛋白质印迹)或通过本文所述的测定来鉴定落入本发明范围内的剂。
[0261]
在一个实施方案中，本发明涉及一种从编码目的蛋白的部分的两对或更多对独立rna分子通过核酶的顺式切割以及该成对独立rna分子的反式剪接来表达两种或更多种目的蛋白的方法。在一个实施方案中，该方法包括施用一对、两对或三对编码或包含rna分子的核酸分子，其中每个单个对的独立rna分子具有单独的阅读框，使得不需要的对的反式剪接不会导致全长功能蛋白的翻译。在一个实施方案中，该方法进一步包括向细胞或组织施用选自由以下组成的组的一种或多种：编码连结酶的核酸分子和连结酶。在一个实施方案中，所述连结酶是如本文所述的rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。
[0262]
在一个实施方案中，本发明包括递送和表达全长目的蛋白和货物序列的方法。在一个实施方案中，所述方法包括向细胞或组织施用编码目的蛋白的第一部分的rna的第一部分，该rna的第一部分以其3'末端连接到合成内含子；以及编码目的蛋白的第二部分的rna的第二部分，该rna的第二部分以其5'末端连接到合成内含子。在一个实施方案中，所述合成内含子在任一侧侧接有5'核酶序列和3'核酶序列。在一个实施方案中，所述合成内含子包含被置于所述5'核酶序列和3'核酶序列之间的货物序列。在一个实施方案中，5'核酶序列和3'核酶序列的自切割产生以下三个单独的rna分子：1)第一片段，包含编码目的蛋白的第一部分的rna的第一部分；2)第二片段，包含合成内含子；3)第三片段，包含编码目的蛋
白的第二部分的rna的第二部分。在一个实施方案中，第二片段的相容末端被连结从而产生包含含有货物序列的合成内含子的环状rna分子。在实施方案中，第一片段和第三片段被连结在一起从而产生单个全长线性rna分子。在一个实施方案中，全长目的蛋白包括治疗性蛋白、报告蛋白、重组酶、抗生素抗性基因产物、抗体或cas9蛋白。在一个实施方案中，货物序列包含治疗性核酸序列(例如，mirna序列或crispr指导rna序列)或者编码治疗性蛋白。在一些实施方案中，全长目的蛋白包含cas9并且货物序列包含指导rna序列，从而使cas9靶向特定基因组序列以进行编辑。在一些实施方案中，所述方法包括向细胞或组织施用如本文所述的连结酶或编码连结酶的核酸。
[0263]
在一个实施方案中，本发明包括一种基因编辑方法，该方法包括一种或多种反式切割工程化核酶。在一些实施方案中，所述方法包括施用第一反式切割工程化核酶和第二反式切割工程化核酶，其中该第一反式切割工程化核酶靶向致病突变的上游并且该第二反式切割工程化核酶靶向致病突变的下游。在一些实施方案中，在致病突变的上游和下游的反式切割导致该致病突变的去除。在一些实施方案中，在该致病突变的反式切割后，该基因的剩余部分被反式剪接在一起。在一些实施方案中，经反式剪接的基因表达为功能性蛋白。
[0264]
在一个实施方案中，本发明涉及组装全长rna病毒基因组的体内方法。示例性的rna病毒包括但不限于：冠状病毒、副粘病毒、正粘病毒、逆转录病毒、慢病毒、甲病毒、黄病毒、弹状病毒、麻疹病毒、新城病病毒和小核糖核酸病毒。在一个实施方案中，该方法发包括向细胞或组织施用编码rna病毒基因组的第一部分并且编码3'核酶的第一核酸。在一个实施方案中，所述方法包括向细胞或组织施用编码rna病毒基因组的第二部分并且编码5'核酶的第二核酸。在一个实施方案中，所述方法包括向细胞或组织施用包含rna病毒基因组的第一部分和3'核酶的第一rna分子。在一个实施方案中，所述方法包括向细胞或组织施用包含rna病毒基因组的第二部分和5'核酶的第二rna分子。在一个实施方案中，所述方法包括向细胞或组织施用编码如本文所述的连结酶的核酸或连结酶。在一个实施方案中，在3'和5'核酶顺式切割后，rna病毒基因组的第一部分和rna病毒基因组的第二部分被连结在一起，从而产生全长rna病毒基因组。
[0265]
体外
[0266]
在一个实施方案中，本发明包括一种产生编码目的蛋白的rna分子的体外方法。在一个实施方案中，所述方法包括提供至少两种rna分子的步骤。在一个实施方案中，所述步骤包括提供第一rna分子和第二rna分子。
[0267]
在一个实施方案中，所述第一rna分子包含编码目的蛋白的第一部分的编码区。在一个实施方案中，所述第一rna分子包含3'核酶。在一个实施方案中，所述第一rna分子包含编码目的蛋白的第一部分的编码区和3'核酶。
[0268]
在一个实施方案中，所述第二rna分子包含编码目的蛋白的第二部分的编码区。在一个实施方案中，所述第二rna分子包含5'核酶。在一个实施方案中，所述第二rna分子包含编码目的蛋白的第二部分的编码区和5'核酶。
[0269]
在一个实施方案中，产生编码目的蛋白的rna分子的体外方法进一步包括提供连结酶。在一个实施方案中，该连结酶诱导由第一rna分子的编码区和第二rna分子的编码区组装rna分子。在一个实施方案中，所述连结酶是如本文所述的rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。
[0270]
在一个实施方案中，本发明包括一种产生编码目的多结构域蛋白的rna分子的体外方法。在一个实施方案中，所述方法包括以下步骤：a)提供第一rna分子，b)提供一种或多种附加rna分子，c)提供核酶，和d)提供最后一种rna分子。
[0271]
在一个实施方案中，步骤a)的所述第一rna分子包含编码目的蛋白的第一部分的编码区。在一个实施方案中，所述第一rna分子包含3'核酶。在一个实施方案中，所述第一rna分子包含编码目的蛋白的第一部分的编码区和3'核酶。在一个实施方案中，3'核酶催化自身脱离第一rna分子，从而产生3'p或2'3'cp末端。在一个实施方案中，所述第一rna分子进一步包含5'标签。在一个实施方案中，所述5'标签介导所述第一rna分子与固体支持物的附接。
[0272]
在一个实施方案中，步骤b)的所述一种或多种附加rna分子包含编码目的蛋白的结构域的编码区、5'核酶，和3'核酶识别序列。在一个实施方案中，所述5'核酶切割自身从而产生5'oh末端。在一个实施方案中，提供连结酶以催化所述第一rna分子与所述一种或多种附加rna分子的连结。在一个实施方案中，所述连结酶是如本文所述的rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。在一个实施方案中，所述3'核酶识别序列包含如本文所述的vs-s序列。
[0273]
在一个实施方案中，步骤c)的所述核酶包含如本文所述的vs-rz。在一个实施方案中，所述vs-rz识别vs-s，并且介导vs-s从所述一种或多种附加rna分子上的切割。在一个实施方案中，所述切割产生3'p或2'3'cp末端。在一个实施方案中，步骤b)至c)被重复至少一次以产生编码多个结构域的rna分子。在一个实施方案中，在重复步骤b)之前去除所述vs-rz。
[0274]
在一个实施方案中，步骤d)的所述最后一种rna分子包含编码目的蛋白的最后一个部分的编码区。在一个实施方案中，所述最后一种rna分子包含5'核酶。在一个实施方案中，所述最后一种rna分子包含编码目的蛋白的最后一个部分的编码区和5'核酶。在一个实施方案中，所述5'核酶催化自身脱离最后一种rna分子，从而产生5'oh末端。在一个实施方案中，提供连结酶以催化所述一种或多种附加rna分子与所述最后一种rna分子的连结，从而产生编码n-端结构域、一个或多个附加结构域和c-端结构域的完整rna分子。在一个实施方案中，所述连结酶是如本文所述的rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶。
[0275]
本公开的任何rna分子都可以从模板dna(称为“体外转录模板”)体外转录。该dna的来源可以是例如基因组dna、质粒dna、噬菌体dna、cdna、合成dna序列或任何其他合适的dna来源。在一些实施方案中，体外转录模板编码5'非翻译(utr)区，含有开放阅读框，并且编码3'utr和polya尾。体外转录模板的特定核酸序列组成和长度将取决于由模板编码的mrna。
[0276]
在一个实施方案中，5'utr的长度在0至3000个核苷酸之间。可通过不同方法改变要添加到编码区的5'和3'utr序列的长度，该方法包括但不限于设计与utr不同区域退火的pcr引物。使用这种方法，本领域的普通技术人员可以在转染转录的rna后修饰实现最佳翻译效率所需的5'和3'utr长度。
[0277]
该5'和3'utr可以是目的基因的天然存在的内源性5'和3'utr。可替代地，可以通过将utr序列掺入到正向和反向引物中或通过模板的任何其他修饰来添加对于目的基因不是内源的utr序列。使用对于目的基因不是内源的utr序列可用于修饰该rna的稳定性和/或
翻译效率。例如，已知3'utr序列中富含au的元素会降低mrna的稳定性。因此，可以根据本领域众所周知的utr的特性来选择或设计3'utr以增加转录的rna的稳定性。
[0278]
在一个实施方案中，该5'utr可以含有内源性基因的kozak序列。可替代地，当如上所述通过pcr添加对于目的基因不是内源性的5'utr时，可以通过添加5'utr序列来重新设计共有kozak序列。kozak序列可以提高某些rna转录本的翻译效率，但似乎并非所有rna都需要实现高效翻译。许多mrna对kozak序列的要求是本领域已知的。在其他实施方案中，5'utr可以来源于其中的rna基因组在细胞中是稳定的rna病毒。在其他实施方案中，可以在3'或5'utr中使用各种核苷酸类似物以阻止mrna的外切核酸酶降解。
[0279]
为了能够从dna模板合成rna，转录启动子应附接到待转录序列上游的dna模板。当起rna聚合酶的启动子作用的序列被添加到正向引物的5'末端时，rna聚合酶启动子在要转录的开放阅读框上游被掺入到pcr产物中。在一个实施方案中，该启动子是如本文别处所述的t7 rna聚合酶启动子。其他有用的启动子包括但不限于t3和sp6 rna聚合酶启动子。t7、t3和sp6启动子的共有核苷酸序列是本领域已知的。
[0280]
在一个实施方案中，该mrna具有位于5'末端的帽和3'poly(a)尾，其决定细胞中的核糖体结合、翻译启动和mrna稳定性。在环状dna模板(例如质粒dna)上，rna聚合酶产生长的串联产物，其不适合在真核细胞中表达。在3'utr末端处被线性化的质粒dna的转录产生正常大小的mrna，当它在转录后被多腺苷酸化时，它在真核转染中是有效的。
[0281]
在线性dna模板上，噬菌体t7 rna聚合酶可以将转录本的3'端延伸到该模板的最后一个碱基之外(schenborn和mierendorf，nuc acids res.，13:6223-36(1985)；nacheva和berzal-herranz,eur.j.biochem.,270:1485-65(2003))。
[0282]
将polya/t序列段(stretch)整合到dna模板中的常规方法是分子克隆。然而，整合到质粒dna中的polya/t序列会导致质粒不稳定性，这可以通过使用重组无能细菌细胞进行质粒繁殖来改善。
[0283]
在体外转录后，可以使用poly(a)聚合酶(例如大肠杆菌polya聚合酶(e-pap)或酵母polya聚合酶)进一步延长rna的poly(a)尾。在一个实施方案中，将poly(a)尾的长度从100个核苷酸增加到300至400个核苷酸导致rna的翻译效率增加约两倍。此外，将不同化学基团附接到3'末端可以增加mrna稳定性。此种附接物(attachment)可以含有经修饰的核苷酸/人工核苷酸、适体和其他化合物。例如，可以使用poly(a)聚合酶将atp类似物掺入到poly(a)尾中。atp类似物可以进一步增加rna的稳定性。
[0284]
5'帽还为mrna分子提供稳定性。在一个实施方案中，通过该方法产生的rna包括5'帽1结构。此种帽1结构可以使用牛痘加帽酶和2'-o-甲基转移酶(cellscript,madison,wi)来产生。可替代地，使用本领域已知并且本文中描述的技术提供5'帽(cougot等人，trends in biochem.sci.,29:436-444(2001)；stepinski等人，rna,7:1468-95(2001)；elango等人,biochim.biophys.res.commun.,330:958-966(2005))。
[0285]
本发明的某些实施方案可以使用由惰性衬底或基质(例如载玻片、聚合物珠粒等)构成的固体支持物，该惰性衬底或基质已例如通过施加允许共价附接到生物分子(诸如多核苷酸)的包含反应性基团的中间材料的层或涂层来官能化。此类支持物的实例包括但不限于支撑在惰性衬底(诸如玻璃)上的聚丙烯酰胺水凝胶，特别是如wo 2005/065814和us 2008/0280773(其内容通过引用整体并入本文)中所描述的聚丙烯酰胺水凝胶。在此类实施
方案中，生物分子(例如多核苷酸)可以直接共价附接到中间材料(例如水凝胶)，但是中间材料本身可以非共价地附接到衬底或基质(例如玻璃衬底)上。术语“共价附接到固体支持物”应相应解释为包括这种类型的布置。
[0286]
如本领域技术人员将理解的，可能的衬底的数量非常大。可能的衬底包括但不限于玻璃和经修饰或功能化的玻璃、塑料(包括丙烯酸树脂、聚苯乙烯和苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、teflon
tm
等)、多糖、尼龙或硝酸纤维素、陶瓷、树脂、二氧化硅或二氧化硅基材料(包括硅和经修饰硅)、碳、金属、无机玻璃、塑料、光纤束和多种多样的其他聚合物。
[0287]
在一些实施方案中，固体支持物包括微球或珠粒。合适的珠粒组合物包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸聚合物、顺磁性材料、氧化钍溶胶(thoria sol)、碳石墨、二氧化钛、胶乳或交联葡聚糖(如琼脂糖)、纤维素、尼龙、交联胶束和聚四氟乙烯，以及本文概述的用于固体支持物的任何其他材料都可以使用。来自bangs laboratories,fishers ind.的“微球检测指南(microsphere detection guide)”是一个有用的指南。在某些实施方案中，微球是磁性微球或珠粒。
[0288]
珠粒不必是球形的；可以使用不规则颗粒。可替代地或另外地，珠粒可以是多孔的。珠粒尺寸范围从纳米，即100nm到毫米，即1mm，优选约0.2微米至约200微米的珠粒，特别优选约0.5微米至约5微米的珠粒，但是在一些实施方案中可使用更小或更大的珠粒。
[0289]
在一个实施方案中，本发明涉及组装全长rna病毒基因组的体外方法。示例性的rna病毒包括但不限于：冠状病毒、副粘病毒、正粘病毒、逆转录病毒、慢病毒、甲病毒、黄病毒、弹状病毒、麻疹病毒、新城病病毒和小核糖核酸病毒。在一个实施方案中，所述方法包括提供包含rna病毒基因组的第一部分和3'核酶的第一rna分子。在一个实施方案中，所述方法包括提供包含rna病毒基因组的第二部分和5'核酶的第二rna分子。在一个实施方案中，在3'和5'核酶的顺式切割后，如本文所述，rna病毒基因组的第一部分和rna病毒基因组的第二部分具有用于连结的相容端。在一个实施方案中，所述方法包括使第一rna分子和第二rna分子与如本文所述的连结酶接触，从而产生全长rna病毒基因组。
[0290]
治疗和用途
[0291]
本发明提供了治疗受试者的疾病或病症、减轻受试者的疾病或病症的症状，以及/或者降低受试者发展疾病或病症的风险的方法。例如，在一个实施方案中，本发明的方法治疗哺乳动物的疾病或病症、减轻哺乳动物的疾病或病症的症状，以及/或者降低哺乳动物发展疾病或病症的风险。在一个实施方案中，本发明的方法治疗植物的疾病或病症、减轻植物的疾病或病症的症状，以及/或者降低植物发展疾病或病症的风险。在一个实施方案中，本发明的方法治疗酵母生物的疾病或病症、减轻酵母生物的疾病或病症的症状，以及/或者降低酵母生物发展疾病或病症的风险。
[0292]
在一个实施方案中，受试者是细胞。在一些实施方案中，该细胞为原核细胞或真核细胞。在一个实施方案中，该细胞是真核细胞。在一个实施方案中，该细胞是植物、动物或真菌细胞。在一些实施方案中，该细胞是植物细胞。在一个实施方案中，该细胞是动物细胞。在一些实施方案中，该细胞是酵母细胞。
[0293]
在一个实施方案中，该受试者是哺乳动物。例如，在一个实施方案中，该受试者是人、非人灵长类动物、狗、猫、马、牛、山羊、绵羊、兔、猪、大鼠或小鼠。在一个实施方案中，该
受试者是非哺乳动物类受试者。例如，在一个实施方案中，该受试者是斑马鱼、果蝇或蛔虫。
[0294]
在一个实施方案中，该疾病或病症由缺失或有缺陷的蛋白引起，该蛋白的核酸序列超过病毒载体的包装尺寸。因此，在一个实施方案中，可以使用本发明的组合物、系统和方法来治疗、减轻该疾病或病症，或者降低该疾病或病症的风险。因此，在一个实施方案中，所述方法包括向受试者施用一种或多种本发明的组合物。进一步地，在一个实施方案中，所述方法包括利用一种或多种本发明系统来治疗受试者的疾病或病症、减轻受试者的疾病或病症的症状，以及/或者降低受试者发展疾病或病症的风险。
[0295]
在一个实施方案中，该疾病或病症是选自由以下组成的组的一种或多种：杜氏肌营养不良症；常染色体隐性多囊肾病；血友病a；stargardt黄斑变性；肢带型肌营养不良；dfnb9；神经感觉非综合征性隐性耳聋；囊性纤维化；威尔逊病；常染色体隐性三好肌营养不良和耳聋9型；尤塞氏综合症i型和常染色体隐性耳聋2型；常染色体隐性耳聋3型和非综合征性听力损失；尤塞氏综合征i型；常染色体隐性耳聋16(dfnb16)；梅尼埃病(md)；常染色体显性耳聋12型和常染色体隐性耳聋21型；尤塞氏综合征1f型(ush1f)和dfnb23；常染色体隐性耳聋28型和非综合征性听力损失；常染色体隐性耳聋30型和非综合征性听力损失；常染色体隐性耳脊椎肥大骨骺发育不良和常染色体显性耳椎肥大骨骺发育不良；常染色体隐性耳聋77型和常染色体隐性非综合征性感觉神经性耳聋dfnb型；常染色体隐性非综合征性听力障碍dfnb84；常染色体隐性耳聋84b型和罕见性遗传性耳聋；常染色体显性周围神经病变、肌病、声音嘶哑和听力损失和耳聋4a型；先天性血小板减少症；感觉性听力损失；dfna56；hxb；常染色体显性耳聋56；六臂蛋白；癫痫性脑病；timothy综合征和长qt综合征8型；x-连锁视网膜病症；醛固酮增多症；脊髓小脑性共济失调42型；原发性醛固酮增多症；癫痫发作和神经系统异常和窦房结功能障碍和耳聋；神经发育病症；低钾性周期性麻痹；癫痫；发育性和癫痫性脑病；布罗迪肌病；darier氏病/心脏病；血管性血友病和齐薇格综合征。在一个实施方案中，该疾病或病症是由适合crispr-cas9介导的编辑的基因突变引起的任何疾病或病症。
[0296]
在一个实施方案中，本发明的方法包括向患有杜氏肌营养不良症的受试者施用组合物，该组合物包含第一核酸和第二核酸，该第一核酸包含编码抗肌萎缩蛋白的第一部分的编码区和3'核酶，该第二核酸包含编码抗肌萎缩蛋白的第二部分的编码区和5'核酶，其中第一核酸转录第一rna分子并且第二核酸转录第二rna分子，并且其中3'和5'核酶的顺式切割以及编码抗肌萎缩蛋白的第一部分的编码区和编码抗肌萎缩蛋白的第二部分的编码区的反式剪接产生编码全长抗肌萎缩蛋白的单种rna分子。
[0297]
在一个实施方案中，本发明的方法包括向患有杜氏肌营养不良症的受试者施用施用组合物，该组合物包含第一核酸和第二核酸，该第一核酸编码seq id no:129的核酸序列，该第二核酸编码seq id no:130的核酸序列，其中该第一核酸转录第一rna分子并且该第二核酸转录第二rna分子，并且其中3'和5'核酶的顺式切割以及第一rna分子和第二rna的反式剪接产生编码全长肌抗肌萎缩蛋白的单个rna分子。
[0298]
在一个实施方案中，本发明的方法包括向患有杜氏肌营养不良症的受试者施用施用组合物，该组合物包含第一核酸和第二核酸，该第一核酸编码seq id no:22的核酸序列，该第二核酸编码seq id no:23的核酸序列，其中该第一核酸转录第一rna分子并且该第二核酸转录第二rna分子，并且其中3'和5'核酶的顺式切割以及第一rna分子和第二rna的反
式剪接产生编码具有c-端gfp报告蛋白的全长肌抗肌萎缩蛋白的单个rna分子。在一个实施方案中，第二核酸编码seq id no：23的片段，其中该片段不包括c-端gfp报告分子的编码序列。
[0299]
在一个实施方案中，所述方法包括向患有杜氏肌营养不良症的受试者施用组合物，该组合物包含第一rna分子和第二rna分子，该第一rna分子编码肌抗肌萎缩蛋白的第一部分并且包含3'核酶，该第二rna分子编码抗肌萎缩蛋白的第二部分并且包含5'核酶，其中所述3
′
和5
′
核酶的顺式切割以及所述第一和第二rna分子的反式剪接产生编码全长肌抗肌萎缩蛋白的单种rna分子。
[0300]
在一个实施方案中，所述方法包括向患有杜氏肌营养不良症的受试者施用组合物，该组合物包含第一rna分子和第二rna分子，该第一rna分子包含seq id no：129的核酸序列，该第二rna分子包含seq id no：130的核酸序列，其中3'和5'核酶的顺式切割以及第一和第二rna分子的反式剪接产生编码全长抗肌萎缩蛋白的单种rna分子。
[0301]
在一个实施方案中，所述方法包括向患有杜氏肌营养不良症的受试者施用组合物，该组合物包含第一rna分子和第二rna分子，该第一rna分子包含seq id no：22的核酸序列，该第二rna分子包含seq id no：23的核酸序列，其中3'和5'核酶的顺式切割以及第一和第二rna分子的反式剪接产生编码具有c-端gfp报告蛋白的全长抗肌萎缩蛋白的单种rna分子。在一个实施方案中，第二核酸编码seq id no：23的片段，其中该片段不包括c-端gfp报告分子的编码序列。
[0302]
在一个实施方案中，本发明的方法包括向患有选自表1的一种或多种疾病的受试者施用组合物，该组合物包含第一核酸和第二核酸，该第一核酸包含编码对应于表1中相关疾病的治疗性蛋白的第一部分的编码区和3'核酶，该第二核酸包含编码对应于表1中相关疾病的治疗性蛋白的第二部分的编码区和5'核酶，其中第一核酸转录第一rna分子并且第二核酸转录第二rna分子，并且其中3'和5'核酶的顺式切割以及编码治疗性蛋白的第一部分的编码区和编码肌治疗性蛋白的第二部分的编码区的反式剪接产生编码全长治疗性蛋白的单种rna分子。
[0303]
在一个实施方案中，所述方法包括向患有一种或多种选自表1的疾病的受试者施用组合物，该组合物包含第一rna分子和第二rna分子，该第一rna分子编码对应于表1中相关疾病的治疗性蛋白的第一部分并且包含3'核酶，该第二rna分子编码对应于表1中相关疾病的治疗性蛋白的第二部分并且包含5'核酶，其中3'和5'核酶的顺式切割以及第一和第二rna分子的反式剪接产生编码全长治疗性蛋白的单种rna分子。
[0304]
表1.由大基因突变引起的单基因疾病列表(包括蛋白大小(氨基酸数目)、基因符号、蛋白名称和疾病名称)。
[0305]
[0306]
[0307]
[0308][0309]
实验实施例
[0310]
参照以下实验实施例进一步详细描述本发明。这些实施例仅仅是为了说明的目的而提供的，除非另有说明，否则这些实施例无意是限制性的。因此，本发明决不应被解释为限于以下实施例，而是应被解释为涵盖由于本文提供的教导而变得明显的任何和所有变化。
[0311]
无需进一步描述，据信本领域普通技术人员可以使用前面的描述和以下说明性实施例来实现和利用本发明并实践所要求保护的方法。因此，以下工作实施例不应被解读为以任何方式限制本公开的其余部分。
[0312]
实施例1:核酶介导的哺乳动物细胞中的rna组装和表达
[0313]
核酶(rz)是能够进行核苷酸特异性自切割的小型催化rna序列(doherty和doudna 2000)。核酶介导的rna切割产生独特的3'磷酸酯和5'-羟基端，它们类似于所有三个生命王国中普遍存在的rna修复途径的底物。如本文所示，核酶介导的顺式切割可被用于哺乳动物细胞中独立rna转录本的反式剪接，这种方法称为stitchr(stitch rna)。值得注意的是，通过stitchr重构信使rna允许在哺乳动物细胞中有效翻译和表达全长蛋白。正如所证明的，stitchr可被用于组合蛋白编码功能结构域或者被用于通过病毒载体递送和表达大蛋白编码序列。进一步地，rna 2',3'-环状磷酸酯和5'-oh(rtcb)连结酶的过表达增强了哺乳动物细胞中的stitchr活性，并足以在体外催化stitchr活性。这些数据表征了一种利用核酶对细胞中功能性rna进行无瘢痕反式剪接的新方法，该方法可用于无数研究和治疗应用。
[0314]
自催化rna序列在自然界中广泛存在并且催化多种多样的生物过程，包括内含子剪接、滚环病毒基因组复制和肽键形成(weinberg等人，2019年)。已鉴定出具有不同序列和结构特征的至少七个主要核酶家族，包括锤头状(hh)核酶、丁型肝炎病毒(hdv)核酶、varkud卫星(vs)核酶、sister核酶、twister-sister核酶、发夹状核酶、hatchet核酶和pistol核酶。研究最广泛的是hh、hdv和twister核酶家族成员，它们由于小尺寸和切割特性，已在体外和体内用于产生没有核酶序列的具有精确端的rna(图13)(ferre-d'amare和doudna 1996；avis等人2012；zhang等人2017)。
[0315]
在原核生物和真核生物中，包括信使和长非编码rna在内的大多数细胞rna是用5'-磷酸酯(p)和3'-羟基(oh)端合成和剪接的。相比之下，许多trna和编码er应激反应蛋白
xbp1的mrna的非常规顺式剪接由酶途径催化，这产生独特的5'-oh以及3'-p或2'3'环状磷酸酯(cp)末端。最近的研究结果表明，哺乳动物中普遍存在的rna2',3'-环状磷酸酯和5'-oh(rtcb)连结酶催化了非常规的rna顺式剪接。此外，rtcb和其他几个酶家族可能起到修复已被应激或外源性核毒素损伤的宿主细胞rna的作用。由于核酶介导的切割导致相似的终末端，因此核酶切割的rna可能会经受通过内源性rna修复途径进行的反式剪接。
[0316]
核酶切割的mrna在哺乳动物细胞中被反式剪接和翻译
[0317]
为了确定核酶是否可用于哺乳动物细胞中rna的无疤痕反式剪接，设计了两种表达质粒，该质粒含有荧光报告基因gfp的非重叠n-端(nt)和c-端(ct)片段(分别为nt-gfp和ct-gfp)。核酶被设计成催化它们自己从gfp片段的相邻核苷酸中去除，包括nt-gfp上的3'hdv核酶和ct-gfp上的5'hh核酶(图1a)。当被转染到哺乳动物cos-7或hek293t细胞中时，单独的编码gfp核酶rna的nt或ct的表达导致无可检测的gfp荧光(图1b)。值得注意的是，nt和ct-gfp编码的rna的共表达在48小时后会产生绿色荧光(图1b)。rt-pcr分析和桑格测序显示，在预测的核酶催化切割位点之间发生了单独的nt-和ct-gfp rna的反式剪接(图1c和图1d)。进一步地，通过蛋白质印迹在共转染细胞中检测到全长gfp蛋白(图1e)。这些数据表明，内源性哺乳动物细胞rna修复途径足以催化独立的经核酶加工的rna的反式剪接，这些rna被有效地翻译成全长蛋白。这种rna反式剪接方法被命名为stitchr。
[0318]
核酶序列和类型对核酶介导的反式剪接的影响
[0319]
为了精确量化细胞中由核酶介导的反式剪接产生的功能性全长蛋白的相对量，使用萤火虫荧光素酶的两个不重叠的半部产生报告基因(图2a)。与我们之前的研究结果一致，只有编码rna的nt-荧光素酶核酶和ct-荧光素酶核酶的共转染才能导致细胞中产生反式剪接和荧光素酶活性(图2b和图2c)。使用该测定法，进一步表征了不同hh和hdv核酶序列对哺乳动物细胞中的反式剪接活性的影响。茎1hh核酶中的6个碱基对(bp)重叠提供了最大的荧光素酶活性和hh催化残基突变消除活性，这与先前关于体外表征的hh核酶活性的报道一致(图2d)。此外，基因组和反基因组hdv核酶序列的荧光素酶活性相当，除了最小的56核苷酸hdv核酶(hdv56)，其活性显著降低(图2e)。同样与之前的报道一致，hdv催化所需的核苷酸的c到u突变导致荧光素酶活性完全丧失(图2e)。这些发现表明核酶介导的反式剪接活性依赖于哺乳动物细胞中的核酶切割。
[0320]
使用翻译控制器和/或蛋白降解序列阻止来自nt或ct载体的不需要或截短的蛋白表达
[0321]
nt或ct rna可能会在核酶介导的切割之前经受翻译，或者当被单独表达时，可能导致不需要的或截断的蛋白表达。为了限制未经剪接的nt或ct载体的表达，测试了先前表征的蛋白降解序列的翻译控制器对编码全长gfp的载体的稳定性的功效。在gfp的3'末端添加hdv核酶似乎不会改变gfp荧光(图3a和3b)。为了选择性地阻止gfp的表达，测试了蛋白降解序列hcl1-pest、e1a-pest，载体的poly(a)序列的去除，或为产生poly k尾而通过poly a尾进行的模拟翻译的影响(图3a和3b)。所有降解序列都与gfp开放阅读框框内克隆，从而通过hdv核酶序列进行翻译。hcl1-pest的纳入显示gfp荧光显著降低，而ef1a pest则没有。从表达载体中删除载体poly(a)序列导致gfp表达完全丧失，而为产生poly k尾通过多poly a序列进行的翻译也导致荧光降低。
[0322]
对于ct编码的gfp报告基因，5'hh核酶的纳入和gfp起始密码子(atg)的删除仍然
导致弱但可检测的gfp表达，尽管缺乏预测的上游替代atg(图3c和d)。gfp(gfpcdn)中n-端ntg密码子内的进一步沉默突变进一步降低了gfp检测，然而，弱荧光仍然明显。编码起到翻译抑制剂作用的4个小上游orf的酵母gcn4基因的5'utr的纳入消除了可检测的gfp荧光。仅编码该4个uorf的gcn45'utr的较小内部片段在阻止gfp表达方面同样有效。这些数据表明，蛋白降解序列的翻译控制器可被用于阻止来自单个nt或ct载体的不需要的蛋白表达。
[0323]
这些翻译控制器或蛋白降解序列可被用于需要限制不需要或截短的蛋白表达的其他双载体应用，诸如依赖同源重组来产生大蛋白编码开放阅读框的双aav载体策略。
[0324]
功能蛋白编码rna的单一和多重反式剪接
[0325]
为了确定核酶介导的反式剪接是否可用于细胞中蛋白编码功能结构域的组合，产生了编码4个线粒体靶向序列(nt-4xmts)拷贝的rna和编码缺乏atg起始密码子的全长gfp(ct-gfp)的开放阅读框(图4a)。这两种独立rna的共表达导致定位于线粒体的gfp的强烈表达，其与红色荧光线粒体标记mitotracker red cmxros重叠(图4b)。这些发现表明，核酶介导的反式剪接可用于快速地组合两种独立rna，以在细胞中表达特定功能融合蛋白。
[0326]
由于蛋白在其中被翻译的三个开放阅读框，核酶介导的同时多种不同功能蛋白的反式剪接和表达也可能是可能的。通过利用这一特性，可以使用位于相容的三个不同不开放阅读框中的rna的反式剪接来产生功能性蛋白。为了证明这一功能性，在阅读框2(f2)中设计了附加核酶对，其编码肉豆蔻酰化膜靶向序列(nt-f2-myr)和红色荧光蛋白(ct-f2-rfp)(图4c)。这些nt和ct载体对还包括hcl1-pest蛋白降解序列和gcn4翻译抑制序列，以分别限制来自单个nt和ct载体的截短蛋白表达。在共转染细胞中，gfp荧光对线粒体具有高度特异性，而rfp荧光对膜具有高度特异性(图4d)，证明了这种rna反式剪接方法在细胞中产生不同功能蛋白的能力。
[0327]
优化的核酶增强核酶介导的反式剪接中的蛋白表达
[0328]
小的序列修饰可以通过改变二级结构、稳定性或与金属离子辅因子的结合来深刻影响核酶的催化活性。使用我们的反式剪接荧光素酶报告基因测定，我们鉴定出了改进的核酶类型和序列修饰，它们增强了哺乳动物细胞内的反式剪接荧光素酶报告基因活性(图16)。含有三级稳定基序(tsm)的rzb锤头状变体核酶显示出比没有tsm的核酶更高的活性(图16a)。进一步地，当被克隆到nt-luc的3'处时，twister(twst)核酶显示出比hdv核酶更大的活性。twister核酶内的催化突变可以类似地消除荧光素酶活性(图16b)并且依赖于p1茎的形成(图16c)。由于twister核酶在1位需要一个u，这一要求可能会将无疤痕反式剪接的设计限制为以u结束的序列。因此，我们测试了1位处的核苷酸取代是否可以被耐受，并且发现u1a没有显示出显著不同的活性，而u1c或u1g取代保留了活性，但是有所降低(图16c)。
[0329]
优化的剪接供体和受体序列增强了核酶介导的反式剪接中的蛋白表达
[0330]
由剪接体进行的前mrna剪接已被证明可通过沉积促进首轮翻译的因子或者通过促进rna加工和向细胞质的输出来增强mrna翻译。在转基因内添加嵌合顺式剪接内含子也已被证明可促进转基因蛋白表达。然后研究了经反式剪接的rna是否可以经受通过剪接体进行的顺式剪接，以及这是否会影响经反式剪接的mrna的翻译和表达。为了测试这一点，将剪接供体(sd)和剪接受体(sa)序列掺入到反式剪接gfp报告基因中，使得经反式剪接的rna将重构嵌合内含子(图5a)。值得注意的是，与不含sd或sa序列的反式剪接gfp报告基因相比，添加sd和sa序列可稳健地增强gfp荧光(图5b)。rt-pcr和桑格测序显示含有sd和sa序列
的nt-gfp和ct-gfp rna都被反式剪接和顺式剪接，导致正常gfp开放阅读框的恢复(数据未显示)。这些数据表明反式剪接可能发生在细胞核中，并且随后的顺式剪接是增强由经反式剪接的rna的表达的有用策略。
[0331]
核酶介导的用于使用病毒治疗载体进行递送的大基因序列的反式剪接和表达
[0332]
核酶介导的反式剪接可被用于递送和表达超过治疗性病毒基因治疗载体(如aav)的包装尺寸限制的大蛋白编码mrna(图6a)。这可能有助于恢复在许多人单基因疾病中发生突变的大基因(诸如杜氏肌营养不良症(dmd)中的抗肌萎缩蛋白(dys)、囊性纤维化(cf)中的cftr、血友病a中的因子viii(f8)等)的表达。在基于细胞的转染测定中，编码nt和ct分裂的μ抗肌萎缩蛋白(μdystrophin)的载体与c-端gfp标签的共表达物在哺乳动物细胞中被反式剪接(图6b和图6c)并且被定位到膜上(图6d)。这些数据证明了使用核酶介导的反式剪接重构和表达大蛋白编码基因的可行性。
[0333]
用于在细胞中进行反式剪接的经核酶激活(ribozyme-enabled)的rna的慢病毒递送
[0334]
核酶的自催化自切割可能会阻碍正义rna病毒(诸如常用的γ逆转录病毒和慢病毒载体)对编码核酶的rna的包装。为了规避这一潜在问题，使nt和ct分裂的gfp表达盒编码在第三代慢病毒载体骨架中的负义链上(图7a)。分别为nt和ct载体产生慢病毒颗粒，然后将其用于转导hek293t细胞。用nt-gfp和ct-gfp二者转导的细胞显示出绿色荧光表达，而用单独的nt-gfp或ct-gfp转导的细胞未显示出可检测到的荧光(图7b)。这些数据表明，慢病毒载体能够递送和表达编码rna的核酶以进行反式剪接。
[0335]
这种方法也可用于递送超过这些病毒载体的包装大小的大基因序列，诸如dys(图7c)。核酶介导的反式剪接还可以允许安全操作或重构病毒基因组，诸如慢病毒或大型冠状病毒rna基因组。
[0336]
使用病毒载体安全操作、递送和表达毒性基因或抗病毒基因
[0337]
核酶介导的反式剪接还可以允许安全操作或重构毒性或抗病毒蛋白，这些蛋白可能会抑制哺乳动物包装细胞中慢病毒颗粒的产生。这些包括许多细胞自杀基因，诸如翻译抑制性白喉毒素a(dta)(图8a)。我们证明了编码分裂的dta序列的载体，在反式剪接和表达后，抑制cs2gfp报告基因构建体的共表达，这与dta在哺乳动物细胞中的翻译抑制作用一致(图8b)。
[0338]
用于增强或抑制核酶介导的反式剪接的酶
[0339]
许多酶家族被建议连结5'-oh和3'-p或2'3'环状磷酸酯(cp)末端，最值得注意的是rtcb，它在所有三个生命领域中都被发现是保守的。克隆并共表达来自真核生物(智人(h.sapiens))、细菌(大肠杆菌)和古生菌(霍里科什火球菌(p.horikoshii))物种的人密码子优化的rtcb直系同源物，以测量它们对反式剪接荧光素酶报告基因活性的影响。有趣的是，来自霍里科什火球菌的rtcb的共表达导致荧光素酶活性增强(4.5倍)，而人和细菌直系同源物分别显示出适度的增强或没有显示出增强(图9)。
[0340]
其他酶家族已被证明可以调节这些rna端。有趣的是，起到5'-羟基激酶和3'-磷酸酶和2',3'-环状磷酸二酯酶的作用的t4多核苷酸激酶(t4 pnk)的表达显著抑制荧光素酶活性(图9)。这些数据表明，外源酶的共表达可以增强或抑制哺乳动物细胞中核酶介导的反式剪接。
[0341]
rtcb足以在体外催化核酶介导的rna反式剪接
[0342]
由于它们的核苷酸特异性切割，核酶已在体外广泛用于产生精确的rna末端。接下来试图确定核酶是否可用于体外独立合成的rna的定向反式剪接。使用t7 rna聚合酶对nt-和ct-萤光素酶-核酶报告基因构建体进行体外rna转录，发现重组大肠杆菌rtcb的添加对于催化使用rt-pcr检测的反式剪接既必要又充分(图10a和图10b)。类似地，设计了编码蜘蛛丝蛋白spidroin的结构域的rna(图10c)。spidroin是蜘蛛牵引丝的主要组分，这种材料因其拉伸特性而备受推崇，但由于该蛋白的高度重复性，很难在异源系统中合成。spidroin天然地由多个侧接有保守n-端(n1l)和c-端(n3r)结构域的a和q重复序列组成。在用t7聚合酶体外合成spidroin rna后，发现来自大肠杆菌的重组rtcb连结酶的添加足以催化编码经核酶切割的n1l和n3r的rna的反式连结，如由rt-pcr和桑格测序所检测的(图10d)。
[0343]
编码多结构域蛋白的rna的受控串联反式剪接
[0344]
接下来检查添加编码具有侧接核酶的a-q融合结构域的第三rna是否会导致串联重复组装，尽管不受控制(图11a)。虽然能够检测到每种单独rna之间的定向反式剪接，但无法检测到三种或更多种独立rna片段的组装(数据未示出)。这可能是由于含有与rtcb连结相容的端的rna的快速环化。作为一种替代方法，反式活化的vs核酶的使用有可能允许体外rna序列的顺序和受控组装(图11b和图11c)。在这种方法中，3'端rna核酶仅适用于rtcb在添加和vs-rz反式切割后的连结。由于vs-rz反式活化核酶rna不是共价附接的，因此逐步添加stitchr相容的rna、vs-rz和rtcb连结酶可以实现rna序列的受控串联组装，这可能有助于组装编码生物学或工业上重要的蛋白(如合成蜘蛛丝、弹性蛋白、胶原蛋白等)的重复rna。
[0345]
使用反式切割核酶对内源性rna进行反式剪接——纠正致病突变的治疗应用
[0346]
核酶是自催化rna，其以顺式切割以产生独特的rna端，我们已经证明这些端被反式剪接，并且随后在哺乳动物细胞中表达(图12a)。值得注意的是，顺式切割核酶可以被工程化成以反式切割，使得靶rna可以以核苷酸特异性方式被切割，从而产生相似的rna端(图12b)(carbonell等人2011；webb和luptak 2018)。因此，反式切割核酶可被用于在细胞内或体外催化rna的无痕反式剪接。这种方法可用于无数应用，其中一个主要应用是通过靶向外显子或内含子序列中的突变侧接序列来删除基因转录本中的致病突变(图12c和图12d)。
[0347]
总之，本文证明了核酶介导的对细胞中表达的独立rna的切割被有效组装并且能够在哺乳动物细胞中翻译。这种在本文中称为stitchr的方法能够用作一种对用于基础和治疗应用的功能性rna和蛋白进行组合组装的新方法。由于核酶的自催化性质和细胞中存在的内源性rna修复途径，stitchr只需要表达单独的rna就可以在细胞中发生反式剪接和翻译。在体外，已证明rtcb连结酶足以进行反式剪接，并且由于rtcb在所有三个生命界中普遍存在且广泛表达，stitchr有可能成为在许多不同生物体中有用的方法。
[0348]
这种系统的稳健性依赖于核酶介导的rna切割的高效和精确性质，该核酶介导的rna切割产生可靠且精确的对于恢复蛋白编码开放阅读框架至关重要的核苷酸特异性末端。进一步地，使用完全催化自身的去除的核酶产生rna的能力允许无疤痕组装，从而产生与其天然对应物基本上无法区分的rna。
[0349]
虽然核酶切割已在体外被广泛研究，但体内核酶切割被了解得较少，并且被认为受通过与rna结合蛋白的相互作用进行的折叠和催化所需金属离子的可获得性的影响。
stitchr用作核酶介导的切割的间接读出，有趣的是，本文发现其受到核酶序列和结构变化的显著影响。这表明核酶裂解的优化可能是用于增强体内stitchr活性的有用方法。进一步分析诸如rtcb、rtca和archease的rna修复途径组分的影响也可用作调节stitchr活性的重要因素。
[0350]
核酶已自然进化为以顺式发挥作用以促进其自我切割，然而，许多核酶家族(特别是hdv和hh)已被工程化为以反式切割靶rna。本文值得注意的是，将反式切割核酶与stitchr组合可以进一步允许在细胞中或体外执行强大的rna切割和修复方法。这种方法可以用作rna的核苷酸特异性“剪切和粘贴”方法，该方法可能有助于产生rna多样性或者有助于去除致病rna中的某些有害突变。
[0351]
实施例2：可使用经反式活化的核酶诱导的rna的反式剪接和表达
[0352]
大多数核酶是自催化的，并且只需要金属离子作为辅助因子，在生物环境中很容易找到，这有助于折叠和化学催化。如果供体rna以g核苷酸结束，则varkud卫星(vs)核酶可用于无疤痕反式剪接。有趣的是，vs核酶可以被修饰成允许该核酶的反式活化以诱导催化作用(guo和collins 1995；ouellet等人2009)。当分裂成两个组分时，小vs茎环(vs-s)不足以单独诱导顺式切割，然而，剩余序列vs-rz的添加促进了vs-s的有效切割(图14a)。这种反式活化特征可以允许诱导型核酶介导的反式切割，其中需要添加vs-rz序列才能在nt供体rna上进行vs-s切割，该nt供体rna然后可适合于与含有5'-oh端的ct受体rna进行反式剪接(图14b)。含有典型5'-p-和3'-oh rna端的vs-rz序列不能参与反式剪接，因此可以作为反应的多周转催化剂。
[0353]
诸如通过所需的反式活化序列(诸如vs-rz)添加来控制核酶介导的切割的能力可以允许控制可变或非可变rna序列的添加以产生合成重复rna(图14c)。一种方法是产生具有独特n-端结构域、独特c-端结构域和内部可变或非可变“重复”结构域的rna。这种方法需要n-端和c-端rna分别在3'末端和5'末端含有单种核酶。内部重复rna在5'和3'末端都需要核酶，以使其在反式剪接过程中同时作为受体和供体发挥作用。然而，在rna的两个端或同时具有3'-p和5'-oh的rna上添加核酶会导致连结酶(诸如rtcb)环化(desai等人，2015)，从而阻止参与不断增长的线性链。然而，利用诱导型反式活化核酶可以通过添加和去除vs-rz和rtcb连结酶来逐步连结5'和3'末端，从而控制rna结构域合成(图14c)。这种方法可用于产生高度重复的rna序列，该高度重复的rna序列随后可被翻译从而产生合成重复蛋白(诸如构成水凝胶、合成蜘蛛丝或胶原蛋白等的蛋白)，由于重组，这些蛋白很难生成并编码为dna。这些方法可能对药物递送、生物材料或工业材料的产生有用(chambre等人，2020)。
[0354]
实施例3：使用核酶产生稳定的合成内含子序列
[0355]
当一种rna含有3'核酶而另一种rna含有5'核酶时，两种独立rna之间可以发生核酶介导的反式剪接(图15a)。然而，已证明，当在同一rna中以顺式被转录时，两种核酶可以介导它们自身的无疤痕去除(图15b)。这种方法同样会产生两个独立的具有3'-p和5'oh端的rna，它们可以在细胞中经受反式剪接和翻译(图15b)。这也可以通过添加连结酶(诸如rtcb)在体外实现。
[0356]
由核酶产生的内含子序列也含有相容5'-oh和3'-p末端，可以被顺式剪接或环化，是体外rtcb连结酶活性的常见读出。与外显子剪接期间由剪接体产生的快速降解的套索rna不同，rna环被认为是高度稳定的，因为它们不再包含5'或3'末端，因此不能被rna外切
核酸酶降解。可以包含任意数量的功能性或有用的rna(诸如微rna、crispr指导rna等)或基因表达序列的货物序列可以作为“货物”被插入在两种核酶之间(图15c)。这种方法可用于在核酶介导的反式剪接和表达过程中共同递送和表达有用的rna序列。如果其中一种内部核酶不需要双侧侧接序列来发挥活性，诸如对于5'hdv核酶，rna环可以以环状和经再切割的线性形式存在(图15c)。当使用vs-s代替hdv时，所述系统可以被制成可诱导的，需要vs-rz的递送或表达。使用需要双侧侧接序列进行切割的核酶(诸如hh核酶)，可以将切割设计成使得货物rna的rna环化是单向的(图15d)。
[0357]
实施例4：序列
[0358]
编码反式剪接蛋白的核酸序列
[0359]
nt-gfp(seq id no:1)
[0360]
auggugagcaagggcgaggagcuguucaccgggguggugcccauccuggucgagcuggacggcgacguaaacggccacaaguucagcguguccggcgagggcgagggcgaugccaccuacggcaagcugacccugaaguucaucugcaccaccggcaagcugcccgugcccuggcccacccucgugaccacccugaccuacggcgugcagugcuucagccgcuaccccgaccacaugaagcagcacgacuucuucaaguccgccaugcccgaaggcuacguccaggagcgcaccaucuucuu
[0361]
ct-gfp(seq id no:2)
[0362]
caaggacgacggcaacuacaagacccgcgccgaggugaaguucgagggcgacacccuggugaaccgcaucgagcugaagggcaucgacuucaaggaggacggcaacauccuggggcacaagcuggaguacaacuacaacagccacaacgucuauaucauggccgacaagcagaagaacggcaucaaggugaacuucaagauccgccacaacaucgaggacggcagcgugcagcucgccgaccacuaccagcagaacacccccaucggcgacggccccgugcugcugcccgacaaccacuaccugagcacccaguccgcccugagcaaagaccccaacgagaagcgcgaucacaugguccugcuggaguucgugaccgccgccgggaucacucucggcauggacgagcuguacaaguaguaa
[0363]
nt-萤光素酶(seq id no:3)
[0364]
auggaagacgccaaaaacauaaagaaaggcccggcgccauucuauccgcuggaagauggaaccgcuggagagcaacugcauaaggcuaugaagagauacgcccugguuccuggaacaauugcuuuuacagaugcacauaucgagguggacaucacuuacgcugaguacuucgaaauguccguucgguuggcagaagcuaugaaacgauaugggcugaauacaaaucacagaaucgucguaugcagugaaaacucucuucaauucuuuaugccgguguugggcgcguuauuuaucggaguugcaguugcgcccgcgaacgacauuuauaaugaacgugaauugcucaacaguaugggcauuucgcagccuaccgugguguucguuuccaaaaagggguugcaaaaaauuuugaacgugcaaaaaaagcucccaaucauccaaaaaauuauuaucauggauucuaaaacggauuaccagggauuucagucgauguacacguucgucacaucucaucuaccucccgguuuuaaugaauacgauuuugugccagaguccuucgauagggacaagacaauugcacugaucaugaacuccucuggaucuacuggucugccuaaaggugucgcucugccucauagaacugccugcgugagauucucgcaugccagagauccuauuuuuggcaaucaaaucauuccggauacugcgauuuuaaguguuguuccauuccaucacgguuuuggaauguuuacuacacucggauauuugauauguggauuucgagucgucuuaauguauagauuugaagaagagcuguuucugaggagccuu
[0365]
ct-萤光素酶(seq id no:4)
[0366]
caggauuacaagauucaaagugcgcugcuggugccaacccuauucuccuucuucgccaaaagcacucugauugacaaauacgauuuaucuaauuuacacgaaauugcuucugguggcgcuccccucucuaaggaagucggggaagcgguugccaagagguuccaucugccagguaucaggcaaggauaugggcucacugagacuacaucagcuauucugauuacacccgagggggaugauaaaccgggcgcggucgguaaaguuguuccauuuuuugaagcgaagguuguggaucuggau
accgggaaaacgcugggcguuaaucaaagaggcgaacugugugugagagguccuaugauuauguccgguuauguaaacaauccggaagcgaccaacgccuugauugacaaggauggauggcuacauucuggagacauagcuuacugggacgaagacgaacacuucuucaucguugaccgccugaagucucugauuaaguacaaaggcuaucagguggcucccgcugaauuggaauccaucuugcuccaacaccccaacaucuucgacgcaggugucgcaggucuucccgacgaugacgccggugaacuucccgccgccguuguuguuuuggagcacggaaagacgaugacggaaaaagagaucguggauuacgucgccagucaaguaacaaccgcgaaaaaguugcgcggaggaguuguguuuguggacgaaguaccgaaaggucuuaccggaaaacucgacgcaagaaaaaucagagagauccucauaaaggccaagaagggcggaaagaucgccguguaguaa
[0367]
n1l(seq id no:5)
[0368]
atgggtcaggccaatacgccctggagcagtaaggcaaacgcggatgcctttataaattcattcatcagtgcagcatccaatactggttccttctctcaagaccaaatggaggacatgtcactcatcggcaatactctgatggctgccatggacaatatgggaggccgcataacaccatctaagttgcaggcgttggatatggccttcgcatcatcagtggccgagatcgcggctagtgagggcggcgacttgggagtcactaccaacgcgatcgcggatgccctcacttctgctttttatcaaacgaccggggttgtcaattcacgattcatatctgagatcaggagcctcataggaatgttcgcgcaggcttccgcaaatgacgtttatgcatctgctggctctggcagcgggggtggtgggtatggagccagctcagcatctgcggcttctgcaagtgctgctgccccgagtggcgtagcttatcaggctcctgctcaggctcaaatcagttttacgttgcgagggcaacaacctgtttcc
[0369]
aq(seq id no:6)
[0370]
ggtccttatggacccggtgctagcgctgcggcagcagccgctggcggttatggcccaggttcagggcaacaggggcctgggcaacaaggacctggccaacaaggtcctggtcagcagggtccagggcagcag
[0371]
nr3(seq id no:7)
[0372]
ggcgctgcttccgctgcagtatcagtaggtggctatggacctcaatctagtagcgcccctgttgcctctgccgccgcatctcgactttcaagtcccgccgctagttccagggtcagttccgcggtatctagcttggtaagtagcggacccactaatcaagcggcactttcaaacacaatatcctcagtagtcagtcaagtaagcgcatcaaaccctggcttgtcagggtgtgacgttctggttcaggcacttctggaagttgtctcagcgttggtaagcatcctgggtagctcctccataggtcaaattaattatggcgcgagcgcccaatacacacaaatggtgggtcagagtgtggcgcaggcactcgcaggcgactacaaggatcatgacggagactataaggatcatgatatagattacaaggacgatgatgacaaggcctagtaa
[0373]
nt-4xmts(seq id no:8)
[0374]
augaguguguugacgccguugcuucugcgagggcuuaccgggucugcuagaagacuuccgguccccagggccaagauacauagccucggagacccgaugucugugcucacuccucugcuuuugcgaggacugacuggguccgccagacgacucccggugccgagagcuaaaauccauagccugggaaaauuggcaacuaugucaguccugacgccgcuucuucuccggggucuuacagggucugcaagaaggcugccuguaccucgggcgaaaauucauagcuugggcgacccgaugaguguauugacgccccuguugcugagaggauugacugggucagcgcgccggcucccugucccccgagcuaagauucacucccuugguaagcugagaauccuccaaucaacgguuccgagagcaagagauccgccggucgccacgaggccucucgag
[0375]
nt-dta(seq id no:17)
[0376]
auggaccccgacgacgugguggacagcagcaagagcuucgugauggagaacuucagcagcuaccacggcaccaagcccggcuacguggacagcauccagaagggcauccagaagcccaagagcggcacccagggcaacuacgacgacgacuggaagggcuucuacagcaccgacaacaaguacgacgcugccggcuacagcguggacaacgagaacccccugagcggcaaggccggcggcguggugaaggugaccuaccccggccugaccaaggugcuggcccugaaggug
[0377]
ct-dta(seq id no:18)
[0378]
gacaaugccgagaccaucaagaaggagcugggccugagccugaccgagccccugauggagcaggugggcaccgaggaguucaucaagagauucggcgacggcgccagcagaguggugcugagccugcccuucgccgagggcagcagcagcguggaguacaucaacaacugggagcaggccaaggcccugagcguggagcuggagaucaacuucgagaccagaggcaagagaggccaggacgccauguacgaguacauggcccaggcuugcgccggcaacagagugagaagauaguaa
[0379]
gfpcdn(无起始atg密码子)(seq id no:19)
[0380]
guuagcaagggcgaggagcucuucaccggggucguccccauccucgucgagcucgacggcgacguaaacggccacaaguucagcgucuccggcgagggcgagggcgaugccaccuacggcaagcucacccugaaguucaucugcaccaccggcaagcugcccgugcccuggcccacccucgugaccacccugaccuacggcgugcagugcuucagccgcuaccccgaccacaugaagcagcacgacuucuucaaguccgccaugcccgaaggcuacguccaggagcgcaccaucuucuucaaggacgacggcaacuacaagacccgcgccgaggugaaguucgagggcgacacccuggugaaccgcaucgagcugaagggcaucgacuucaaggaggacggcaacauccuggggcacaagcuggaguacaacuacaacagccacaacgucuauaucauggccgacaagcagaagaacggcaucaaggugaacuucaagauccgccacaacaucgaggacggcagcgugcagcucgccgaccacuaccagcagaacacccccaucggcgacggccccgugcugcugcccgacaaccacuaccugagcacccaguccgcccugagcaaagaccccaacgagaagcgcgaucacaugguccugcuggaguucgugaccgccgccgggaucacucucggcauggacgagcuguacaaguag
[0381]
f2-myr(seq id no:20)
[0382]
auggguuguuguuucagcaagacagcggcgaaaggugaagcagcagcagaaagaccaggcgaggcugcgguagcaucaagucccuccaaggcuaaugggcaggaaaacggacacgucaaaguuggaagcgu
[0383]
f2-rfp(seq id no:21)
[0384]
agccaucaucaaggaguucaugcgcuucaaggugcacauggagggcuccgugaacggccacgaguucgagaucgagggcgagggcgagggccgccccuacgagggcacccagaccgccaagcugaaggugaccaaggguggcccccugcccuucgccugggacauccuguccccucaguucauguacggcuccaaggccuacgugaagcaccccgccgacauccccgacuacuugaagcuguccuuccccgagggcuucaagugggagcgcgugaugaacuucgaggacggcggcguggugaccgugacccaggacuccucccugcaggacggcgaguucaucuacaaggugaagcugcgcggcaccaacuuccccuccgacggccccguaaugcagaagaagaccaugggcugggaggccuccuccgagcggauguaccccgaggacggcgcccugaagggcgagaucaagcagaggcugaagcugaaggacggcggccacuacgacgcugaggucaagaccaccuacaaggccaagaagcccgugcagcugcccggcgccuacaacgucaacaucaaguuggacaucaccucccacaacgaggacuacaccaucguggaacaguacgaacgcgccgagggccgccacuccaccggcggcauggacgagcuguacaaguaguaa
[0385]
nt-udys(seq id no:22)
[0386]
augcuuuggugggaagaaguagaggacuguuaugaaagagaagauguucaaaagaaaacauucacaaaauggguaaaugcacaauuuucuaaguuugggaagcagcauauugagaaccucuucagugaccuacaggaugggaggcgccuccuagaccuccucgaaggccugacagggcaaaaacugccaaaagaaaaaggauccacaagaguucaugcccugaacaaugucaacaaggcacugcggguuuugcagaacaauaauguugauuuagugaauauuggaaguacugacaucguagauggaaaucauaaacugacucuugguuugauuuggaauauaauccuccacuggcaggucaaaaauguaaugaaaaauaucauggcuggauugcaacaaaccaacagugaaaagauucuccugagcuggguccgacaaucaacucguaauuauccacagguuaauguaaucaacuucaccaccagcuggucugauggccuggcuuugaaugcucucauccauagucauaggccagaccuauuugacuggaauagugugguuugccagcagucagccacacaacgacuggaacaugcauucaacaucgccagauaucaauuaggcauagagaaacuacucgauccugaagauguugauaccaccuauccagauaagaaguccaucuuaauguacaucacaucacucuuccaaguuuugccucaacaagugagcauugaagccauccaggaaguggaaauguug
ccaaggccaccuaaagugacuaaagaagaacauuuucaguuacaucaucaaaugcacuauucucaacagaucacggucagucuagcacagggauaugagagaacuucuuccccuaagccucgauucaagagcuaugccuacacacaggcugcuuaugucaccaccucugacccuacacggagcccauuuccuucacagcauuuggaagcuccugaagacaagucauuuggcaguucauugauggagagugaaguaaaccuggaccguuaucaaacagcuuuagaagaaguauuaucguggcuucuuucugcugaggacacauugcaagcacaaggagagauuucuaaugauguggaaguggugaaagaccaguuucauacucaugagggguacaugauggauuugacagcccaucagggccggguugguaauauucuacaauugggaaguaagcugauuggaacaggaaaauuaucagaagaugaagaaacugaaguacaagagcagaugaaucuccuaaauucaagaugggaaugccucaggguagcuagcauggaaaaacaaagcaauuuacauagaguuuuaauggaucuccagaaucagaaacugaaagaguugaaugacuggcuaacaaaaacagaagaaagaacaaggaaaauggaggaagagccucuuggaccugaucuugaagaccuaaaacgccaaguacaacaacauaaggugcuucaagaagaucuagaacaagaacaagucagggucaauucucucacucacaugguggugguaguugaugaaucuaguggagaucacgcaacugcugcuuuggaagaacaacuuaagguauugggagaucgaugggcaaacaucuguagauggacagaagaccgcuggguucuuuuacaagacauccuucucaaauggcaacgucuuacugaagaacagugccuuuuuagugcauggcuuucagaaaaagaagaugcagugaacaagauucacacaacuggcuuuaaagaucaaaaugaaauguuaucaagucuucaaaaacuggccguuuuaaaagcggaucuagaaaagaaaaagcaauccaugggcaaacuguauucacucaaacaagaucuucuuucaacacugaagaauaagucagugacccagaagacggaagcauggcuggauaacuuugcccgguguugggauaauuuaguccaaaaacuugaaaagaguacagcacagauuucacaggcugucaccaccacucagccaucacuaacacagacaacuguaauggaaacaguaacuacggugaccacaagggaacagauccugguaaagcaugcucaagaggaacuuccaccaccaccuccccaaaagaagaggcagauuacuguggaucuugaaagacuccaggaacuucaagaggccacggaugagcuggaccucaagcugcgccaagcugaggugaucaagggauccuggcagcccgugggcgaucuccucauugacucucuccaagaucaccucgagaaagucaaggcacuucgaggagaaauugcgccucugaaagagaacgugagccac
[0387]
ct-udys-gfp(seq id no:23)
[0388]
gucaaugaccuugcucgccagcuuaccacuuugggcauucagcucucaccguauaaccucagcacucuggaagaccugaacaccagauggaagcuucugcagguggccgucgaggaccgagucaggcagcugcaugaagcccacagggacuuugguccagcaucucagcacuuucuuuccacgucuguccagggucccugggagagagccaucucgccaaacaaagugcccuacuauaucaaccacgagacucaaacaacuugcugggaccaucccaaaaugacagagcucuaccagucuuuagcugaccugaauaaugucagauucucagcuuauaggacugccaugaaacuccgaagacugcagaaggcccuuugcuuggaucucuugagccugucagcugcaugugaugccuuggaccagcacaaccucaagcaaaaugaccagcccauggauauccugcagauuauuaauuguuugaccacuauuuaugaccgccuggagcaagagcacaacaauuuggucaacgucccucucugcguggauaugugucugaacuggcugcugaauguuuaugauacgggacgaacagggaggauccguguccugucuuuuaaaacuggcaucauuucccuguguaaagcacauuuggaagacaaguacagauaccuuuucaagcaaguggcaaguucaacaggauuuugugaccagcgcaggcugggccuccuucugcaugauucuauccaaauuccaagacaguugggugaaguugcauccuuugggggcaguaacauugagccaaguguccggagcugcuuccaauuugcuaauaauaagccagagaucgaagcggcccucuuccuagacuggaugagacuggaaccccaguccaugguguggcugcccguccugcacagaguggcugcugcagaaacugccaagcaucaggccaaauguaacaucugcaaagaguguccaaucauuggauucagguacaggagucuaaagcacuuuaauuaugacaucugccaaagcugcuuuuuuucuggucgaguugcaaaaggccauaaaaugcacuaucccaugguggaauauugcacuccgacuacaucaggagaagauguucgagacuuugccaagguacuaaaaaacaaauuucgaaccaaaagguauuuugcgaagcauccccgaaugggcuaccugccagugcagacugucuuagagggggacaacauggaaacugacacaauucuagaggugagcaagggcgaggagcuguucaccgggguggugcccauccu
ggucgagcuggacggcgacguaaacggccacaaguucagcguguccggcgagggcgagggcgaugccaccuacggcaagcugacccugaaguucaucugcaccaccggcaagcugcccgugcccuggcccacccucgugaccacccugaccuacggcgugcagugcuucagccgcuaccccgaccacaugaagcagcacgacuucuucaaguccgccaugcccgaaggcuacguccaggagcgcaccaucuucuucaaggacgacggcaacuacaagacccgcgccgaggugaaguucgagggcgacacccuggugaaccgcaucgagcugaagggcaucgacuucaaggaggacggcaacauccuggggcacaagcuggaguacaacuacaacagccacaacgucuauaucauggccgacaagcagaagaacggcaucaaggugaacuucaagauccgccacaacaucgaggacggcagcgugcagcucgccgaccacuaccagcagaacacccccaucggcgacggccccgugcugcugcccgacaaccacuaccugagcacccaguccgcccugagcaaagaccccaacgagaagcgcgaucacaugguccugcuggaguucgugaccgccgccgggaucacucucggcauggacgagcuguacaaguaa
[0389]
nt-minidys(δh2-r15)(seq id no:129)
[0390]
augcuuuggugggaagaaguagaggacuguuaugaaagagaagauguucaaaagaaaacauucacaaaauggguaaaugcacaauuuucuaaguuugggaagcagcauauugagaaccucuucagugaccuacaggaugggaggcgccuccuagaccuccucgaaggccugacagggcaaaaacugccaaaagaaaaaggauccacaagaguucaugcccugaacaaugucaacaaggcacugcggguuuugcagaacaauaauguugauuuagugaauauuggaaguacugacaucguagauggaaaucauaaacugacucuugguuugauuuggaauauaauccuccacuggcaggucaaaaauguaaugaaaaauaucauggcuggauugcaacaaaccaacagugaaaagauucuccugagcuggguccgacaaucaacucguaauuauccacagguuaauguaaucaacuucaccaccagcuggucugauggccuggcuuugaaugcucucauccauagucauaggccagaccuauuugacuggaauagugugguuugccagcagucagccacacaacgacuggaacaugcauucaacaucgccagauaucaauuaggcauagagaaacuacucgauccugaagauguugauaccaccuauccagauaagaaguccaucuuaauguacaucacaucacucuuccaaguuuugccucaacaagugagcauugaagccauccaggaaguggaaauguugccaaggccaccuaaagugacuaaagaagaacauuuucaguuacaucaucaaaugcacuauucucaacagaucacggucagucuagcacagggauaugagagaacuucuuccccuaagccucgauucaagagcuaugccuacacacaggcugcuuaugucaccaccucugacccuacacggagcccauuuccuucacagcauuuggaagcuccugaagacaagucauuuggcaguucauugauggagagugaaguaaaccuggaccguuaucaaacagcuuuagaagaaguauuaucguggcuucuuucugcugaggacacauugcaagcacaaggagagauuucuaaugauguggaaguggugaaagaccaguuucauacucaugagggguacaugauggauuugacagcccaucagggccggguugguaauauucuacaauugggaaguaagcugauuggaacaggaaaauuaucagaagaugaagaaacugaaguacaagagcagaugaaucuccuaaauucaagaugggaaugccucaggguagcuagcauggaaaaacaaagcaauuuacauagaguuuuaauggaucuccagaaucagaaacugaaagaguugaaugacuggcuaacaaaaacagaagaaagaacaaggaaaauggaggaagagccucuuggaccugaucuugaagaccuaaaacgccaaguacaacaacauaaggugcuucaagaagaucuagaacaagaacaagucagggucaauucucucacucacaugguggugguaguugaugaaucuaguggagaucacgcaacugcugcuuuggaagaacaacuuaagguauugggagaucgaugggcaaacaucuguagauggacagaagaccgcuggguucuuuuacaagacauccuucucaaauggcaacgucuuacugaagaacagugccuuuuuagugcauggcuuucagaaaaagaagaugcagugaacaagauucacacaacuggcuuuaaagaucaaaaugaaauguuaucaagucuucaaaaacuggccguuuuaaaagcggaucuagaaaagaaaaagcaauccaugggcaaacuguauucacucaaacaagaucuucuuucaacacugaagaauaagucagugacccagaagacggaagcauggcuggauaacuuugcccgguguugggauaauuuaguccaaaaacuugaaaagaguacagcacagauuucacaggaaauuucuuaugugccuucuacuuauuugacugaaaucacucaugucucacaagcccuauuagaaguggaacaacuucucaaugcuccugaccucugugcuaaggacuuugaagaccucuuuaagcaagaggagucucugaagaauauaaaagauagucuacaacaaagcucaggucggauugacauuauucauagcaagaagacagcagcauugcaaagugc
aacgccuguggaaagggugaagcuacaggaagcucucucccagcuugauuuccaaugggaaaaaguuaacaaaauguacaaggaccgacaagggcgauuugacagauccguugagaaauggcggcguuuucauuaugauauaaagauauuuaaucaguggcuaacagaagcugaacaguuucucagaaagacacaaauuccugagaauugggaacaugcuaaauacaaaugguaucuuaaggaacuccaggauggcauugggcagcggcaaacuguugucagaacauugaaugcaacuggggaagaaauaauucagcaauccucaaaaacagaugccaguauucuacaggaaaaauugggaagccugaaucugcgguggcaggaggucugcaaacagcugucagacagaaaaaagaggcuagaagaacaaaagaauaucuugucagaauuucaaagagauuuaaaugaauuuguuuuaugguuggaggaagcagauaacauugcuaguaucccacuugaaccuggaaaagagcagcaacuaaaagaaaagcuugagcaagucaaguuacugguggaagaguugccccugcgccagggaauccucaaacaauuaaaugaaacuggaggacccgugcuuguaagugcucccauaagcccagaagagcaagauaaacuugaaaauaagcucaagcagacaaaucuccaguggauaaagguuuccagagcuuuaccugagaaacaaggagaaauugaagcucaaauaaaagaccuugggcagcuugaaaaaaagcuugaagaccuugaagagcaguuaaaucaucugcugcugugguuaucuccuauuaggaaucaguuggaaauuuauaaccaaccaaaccaagaaggaccauuugacguuaaggaaacugaaauagcaguucaagcuaaacaaccggauguggaagagauuuugucuaaagggcagcauuuguacaaggaaaaaccagccacucagccagugaagaggaaguuagaagaccuguccucugaguggaaggcgguaaaccguuuacuucaagagcugagggcaaagcagccugaccuagcuccuggacugaccacuauuggagccucuccuacucagacuguuacucuggugacacaaccugugguuacuaaggaaacugccaucuccaaacuagaaaugccaucuuccuugauguuggagguaccugcucuggcagauuucaaccgggcuuggacagaacuuaccgacuggcuuucucugcuugaucaaguuauaaaaucacaacgcgugauggugggcgaccuugaggauaucaacgagaugaucaucaagcagaaggcaacaaugcaggauuuggaacagaggcguccccaguuggaagaacucauuaccgcugcccaaaauuugaaaaacaagaccagcaaucaagaggcuagaacaaucauuacggaucgaauugaaagaauucagaaucagugggaugaaguacaag
[0391]
ct-minidys(δh2-r15)(seq id no:130)
[0392]
aacaccuucagaaccggaggcaacaguugaaugaaauguuaaaggauucaacacaauggcuggaagcuaaggaagaagcugagcaggucuuaggacaggccagagccaagcuggagucauggaaggagggucccuauacaguagaugcaauccaaaagaaaaucacagaaaccaagcaguuggccaaagaccuccgccaguggcagacaaauguagauguggcaaaugacuuggcccugaaacuucuccgggauuauucugcagaugauaccagaaaaguccacaugauaacagagaauaucaaugccucuuggagaagcauucauaaaagggugagugagcgagaggcugcuuuggaagaaacucauagauuacugcaacaguucccccuggaccuggaaaaguuucuugccuggcuuacagaagcugaaacaacugccaauguccuacaggaugcuacccguaaggaaaggcuccuagaagacuccaagggaguaaaagagcugaugaaacaauggcaagaccuccaaggugaaauugaagcucacacagauguuuaucacaaccuggaugaaaacagccaaaaaauccugagaucccuggaagguuccgaugaugcaguccuguuacaaagacguuuggauaacaugaacuucaaguggagugaacuucggaaaaagucucucaacauuaggucccauuuggaagccaguucugaccaguggaagcgucugcaccuuucucugcaggaacuucugguguggcuacagcugaaagaugaugaauuaagccggcaggcaccuauuggaggcgacuuuccagcaguucagaagcagaacgaugugcauagggccuucaagagggaauugaaaacuaaagaaccuguaaucaugaguacucuugagacuguacgaauauuucugacagagcagccuuuggaaggacuagagaaacucuaccaggagcccagagagcugccuccugaggagagagcccagaaugucacucggcuucuacgaaagcaggcugaggaggucaauacugagugggaaaaauugaaccugcacuccgcugacuggcagagaaaaauagaugagacccuugaaagacuccgggaacuucaagaggccacggaugagcuggaccucaagcugcgccaagcugaggugaucaagggauccuggcagcccgugggcgaucuccucauugacucucuccaagaucaccuggagaaagucaaggcacuucgaggagaaauugcgccucugaaagagaacgugagccacgucaaugaccuugcucgccagcuuaccacuuugggcauucagcucucaccguauaaccucagcacucuggaagaccugaacaccagauggaa
gcuucugcagguggccgucgaggaccgagucaggcagcugcaugaagcccacagggacuuugguccagcaucucagcacuuucuuuccacgucuguccagggucccugggagagagccaucucgccaaacaaagugcccuacuauaucaaccacgagacucaaacaacuugcugggaccaucccaaaaugacagagcucuaccagucuuuagcugaccugaauaaugucagauucucagcuuauaggacugccaugaaacuccgaagacugcagaaggcccuuugcuuggaucucuugagccugucagcugcaugugaugccuuggaccagcacaaccucaagcaaaaugaccagcccauggauauccugcagauuauuaauuguuugaccacuauuuaugaccgccuggagcaagagcacaacaauuuggucaacgucccucucugcguggauaugugucugaacuggcugcugaauguuuaugauacgggacgaacagggaggauccguguccugucuuuuaaaacuggcaucauuucccuguguaaagcacauuuggaagacaaguacagauaccuuuucaagcaaguggcaaguucaacaggauuuugugaccagcgcaggcugggccuccuucugcaugauucuauccaaauuccaagacaguugggugaaguugcauccuuugggggcaguaacauugagccaaguguccggagcugcuuccaauuugcuaauaauaagccagagaucgaagcggcccucuuccuagacuggaugagacuggaaccccaguccaugguguggcugcccguccugcacagaguggcugcugcagaaacugccaagcaucaggccaaauguaacaucugcaaagaguguccaaucauuggauucagguacaggagucuaaagcacuuuaauuaugacaucugccaaagcugcuuuuuuucuggucgaguugcaaaaggccauaaaaugcacuaucccaugguggaauauugcacuccgacuacaucaggagaagauguucgagacuuugccaagguacuaaaaaacaaauuucgaaccaaaagguauuuugcgaagcauccccgaaugggcuaccugccagugcagacugucuuagagggggacaacauggaaacucccguuacucugaucaacuucuggccaguagauucugcgccugccucguccccucagcuuucacacgaugauacucauucacgcauugaacauuaugcuagcaggcuagcagaaauggaaaacagcaauggaucuuaucuaaaugauagcaucucuccuaaugagagcauagaugaugaacauuuguuaauccagcauuacugccaaaguuugaaccaggacuccccccugagccagccucguaguccugcccagaucuugauuuccuuagagagugaggaaagaggggagcuagagagaauccuagcagaucuugaggaagaaaacaggaaucugcaagcagaauaugaccgucuaaagcagcagcacgaacauaaaggccuguccccacugccguccccuccugaaaugaugcccaccucuccccagaguccccgggaugcugagcucauugcugaggccaagcuacugcgucaacacaaaggccgccuggaagccaggaugcaaauccuggaagaccacaauaaacagcuggagucacaguuacacaggcuaaggcagcugcuggagcaaccccaggcagaggccaaagugaauggcacaacgguguccucuccuucuaccucucuacagagguccgacagcagucagccuaugcugcuccgagugguuggcagucaaacuucggacuccaugggugaggaagaucuucucaguccuccccaggacacaagcacaggguuagaggaggugauggagcaacucaacaacuccuucccuaguucaagaggaagaaauaccccuggaaagccaaugagagaggacacaauguaa
[0393]
用于无疤痕3'rna切割的核酶核酸序列
[0394]
hdv68(seq id no:9)
[0395]
ggccggcauggucccagccuccucgcuggcgccggcugggcaacaugcuucggcauggcgaaugggac
[0396]
hdv68催化突变体(seq id no:24)
[0397]
5'-ggccggcauggucccagccuccucgcuggcgccggcugggcaacaugcuucggcauggugaaugggac-3'
[0398]
hdv67(seq id no:10)
[0399]
gggucggcauggcaucuccaccuccucgcgguccgaccugggcuacuucgguaggcuaagggagaag
[0400]
hdv56(seq id no:11)
[0401]
gagggauaguacagagccuccccguggcucccuuggauaaccaacugauacuguac
[0402]
基因组hdv(genhdv)(seq id no:12)
[0403]
ggccggcauggucccagccuccucgcuggcgccggcugggcaacauuccgaggggaccguccccucgguaauggcgaaugggaccca
[0437]
用于无疤痕5'rna切割的核酶核酸序列
[0438]
具有对ct-luc特异的茎1突出端的锤头状(hh)核酶
[0439]
16hh(seq id no:33)
[0440]5’‑
gaaucuuguaauccugcugaugaguccgugaggacgaaacgaguaagcucguc-3’[0441]
14hh(seq id no:34)
[0442]5’‑
aucuuguaauccugcugaugaguccgugaggacgaaacgaguaagcucguc-3’[0443]
12hh(seq id no:35)
[0444]5’‑
cuuguaauccugcugaugaguccgugaggacgaaacgaguaagcucguc-3’[0445]
8hh(seq id no:36)
[0446]5’‑
uaauccugcugaugaguccgugaggacgaaacgaguaagcucguc-3’[0447]
6hh(seq id no:37)
[0448]5’‑
auccugcugaugaguccgugaggacgaaacgaguaagcucguc-3’[0449]
6hh突变体(seq id no:38)
[0450]5’‑
auccugcugaugaguccgugaggacgagacgaguaagcucguc-3’[0451]
4hh(seq id no:39)
[0452]5’‑
ccugcugaugaguccgugaggacgaaacgaguaagcucguc-3’[0453]
用于5'的锤头状核酶4nt突出端(seq id no:111)
[0454]5’
nnnncugaugaguccgugaggacgaaacgaguaagcucguc3’[0455]
用于5'的锤头状核酶6nt突出端(seq id no:112)
[0456]5’
nnnnnncugaugaguccgugaggacgaaacgaguaagcucguc 3’[0457]
用于5’的锤头状核酶8nt突出端(seq id no:113)
[0458]5’
nnnnnnnncugaugaguccgugaggacgaaacgaguaagcucguc 3’[0459]
用于5’的锤头状核酶10nt突出端(seq id no:114)
[0460]5’
nnnnnnnnnncugaugaguccgugaggacgaaacgaguaagcucguc 3’[0461]
用于5’的锤头状核酶12nt突出端(seq id no:115)
[0462]5’
nnnnnnnnnnnncugaugaguccgugaggacgaaacgaguaagcucguc 3’[0463]
用于5’的锤头状核酶14nt突出端(seq id no:116)
[0464]5’
nnnnnnnnnnnnnncugaugaguccgugaggacgaaacgaguaagcucguc 3’[0465]
用于5’的锤头状核酶16nt突出端(seq id no:117)
[0466]5’
nnnnnnnnnnnnnnnncugaugaguccgugaggacgaaacgaguaagcucguc 3’[0467]
用于5’的tx2锤头状核酶4nt突出端(huang等人2019)(seq id no:118)
[0468]5’
nnnncugaugaguccgguagcggacgaaacgcgcuucggugcguc 3’[0469]
用于5’的tx2锤头状核酶6nt突出端(huang等人，2019)(seq id no:119)
[0470]5’
nnnnnncugaugaguccgguagcggacgaaacgcgcuucggugcguc 3’[0471]
用于5’的tx2锤头状核酶8nt突出端(huang等人2019)(seq id no:120)
[0472]5’
nnnnnnnncugaugaguccgguagcggacgaaacgcgcuucggugcguc 3’[0473]
用于5’的tx2锤头状核酶10nt突出端(huang等人2019)(seq id no:121)
[0474]5’
nnnnnnnnnncugaugaguccgguagcggacgaaacgcgcuucggugcguc 3’[0475]
用于5’的tx2锤头状核酶12nt突出端(huang等人2019)(seq id no:122)
[0476]5’
nnnnnnnnnnnncugaugaguccgguagcggacgaaacgcgcuucggugcguc 3’[0477]
用于5’的tx2锤头状核酶14nt突出端(huang等人2019)(seq id no:123)
[0478]5’
nnnnnnnnnnnnnncugaugaguccgguagcggacgaaacgcgcuucggugcguc 3’[0479]
用于5’的tx2锤头状核酶16nt突出端(huang等人2019)(seq id no:124)
[0480]5’
nnnnnnnnnnnnnnnncugaugaguccgguagcggacgaaacgcgcuucggugcguc 3’[0481]
用于5'的rzb锤头状核酶(saksmerprome等人，2004)(seq id no:125)
[0482]5’
nnnnnnuaannnnncugaugagucgcugggaugcgacgaaacgccuucgggcguc 3’[0483]
rzb(saksmerprome等人，2004)，具有对ct-luc特异的茎1突出端(seq id no:40)
[0484]5’‑
uuguaauaauccugcugaugagucgcugggaugcgacgaaacgccuucgggcguc-3’[0485]
nt载体的剪接供体序列(seq id no:41)
[0486]5’‑
guaaguaucaagguuacaagacagguuuaaggagaccaauagaaacugggcu-3’[0487]
ct载体的剪接受体序列(seq id no:42)
[0488]5’‑
ugucgagacagagaagacucuugcguuucugauaggcaccuauuggucuuacugacauccacuuugccuuucucuccacag-3’[0489]
ct载体的翻译调控序列
[0490]
gcn4 5'utr uorf(zhang和hinnebusch 2011)(seq id no:43)
[0491]5’‑
aaacaaaaacucacaacacagguuacucuccccccuaaauucaaauuuuuuuugcccaucaguuucacuagcgaauuauacaacucaccagccacacagcucacucaucuacuucgcaaucaaaacaaaauauuuuauuuuaguucaguuuauuaaguuauuaucaguaucguauuaaaaaauuaaagaucauugaaaaauggcuugcuaaaccgauuauauuuuguuuuuaaaguagauuauuauuagaaaauuauuaagagaauuauguguuaaauuuauugaaagagaaaauuuauuuucccuuauuaauuaaaguccuuuacuuuuuuugaaaacugucaguuuuuugaagaguuauuuguuuuguuaccaauugcuaucauguacccguagaauuuuauucaagauguuuccguaacgguuaccuuucugucaaauuauccagguuuacucgccaauaaaaauuucccuauacuaucauuaauuaaaucauuauuauuacuaaaguuuuguuuaccaauuugucugcucaagaaaauaaauuaaauacaaauaaa-3’[0492]
sgcn4 5'utr uorf(seq id no:104)
[0493]
uuaaagaucauugaaaaauggcuugcuaaaccgauuauauuuuguuuuuaaaguagauuauuauuagaaaauuauuaagagaauuauguguuaaauuuauugaaagagaaaauuuauuuucccuuauuaauuaaaguccuuuacuuuuuuugaaaacugucaguuuuuugaagaguuauuuguuuuguuaccaauugcuaucauguacccguagaauuuuauucaagauguuuccguaacgguuaccu
[0494]
sry 5'utr uorf(calvo等人，2009)(seq id no:44)
[0495]5’‑
guugaggggguguugagggcggagaaaugcaaguuucauuacaaaaguuaacguaacaaagaaucugguagaaaugaguuuuggauaguaaaauaaguuucgaacucuggcaccuuucaauuuugucgcacucuccuuguuuuugaca-3’[0496]
hoxa9 tie(leppek等人，2020)(seq id no:45)
[0497]
5'-gaaaaaacagaagagggaaggauaccagagcgguucauacagggcccagaaacuaggcgaggugaccccucagcaagacaaacaccucuugauguugacuggcgauuuuccccaucuccagucuggggagcgggacuaggcauacagaugauggagcuuagaacccgcuggcuagggaauaaaauucgcugggcaguuugugcucaaagaagugggccagggcgcuugugacacaaucagggcguuugugacacaaacccuugaggguuggcaguucucuccuuggcgguugcucugguugcucuguggggccuucccuguggagcaagggugaucuggccga-3'
[0498]
hoxa3 tie(leppek等人，2020)(seq id no:46)
[0499]5’‑
aggacaauucgucucuugggcugccgaagcgacagcugucagagaggcagaagcuucugggagccgcggucugaaggcuacgugugcugccuggucauucaaagugucaauuuuagguccagaaguguccaaaccacaaguucucaaaacucugaaaaauggcucccucc-3’[0500]
nras 5'utr g-四链体(kumari等人，2007)(seq id no:47)
[0501]
5'-cgucccgugugggaggggcgggucugggugcggccugc-3'
[0502]
人ifng 5'utr假结(kaempfer 2006)(seq id no:48)
[0503]
cacauuguucugaucaucugaagaucagcuauuagaagagaaagaucaguuaaguccuuuggaccugaucagcuugauacaagaacuacugauuucaacuucuuuggcuuaauucucucggaaacg
[0504]
大鼠odc 5'utr(manzella和blackshear 1990)(seq id no:49)
[0505]
5'-ugucagucccugcagccgccgccgccggccgccuucagucagcagcucggcgccaccuccggucggcgacugcggcgggcucgacgaggcggcugacggggcggcggcgggaagacggccgggugcgccuug-3'
[0506]
rna核定位信号
[0507]
sirloin rna核定位信号(lubelsky和ulitsky 2018)(seq id no:50)
[0508]
5'-cgccucccggguucaagcgauucuccugccucagccucccgaguagcug-3'
[0509]
borg lncrna nls(zhang等人，2014)(seq id no:51)
[0510]
5'-accucagaaucuacaagucagccccaauuaaauguuguuuua-3'
[0511]
蛋白降解氨基酸序列
[0512]
nt或ct载体的n-端和c-端蛋白降解序列
[0513]
fkbp dd(banaszynski等人，2006)(seq id no:52)
[0514]
mgvqvetispgdgrtfpkrgqtcvvhytgmledgkkvdssrdrnkpfkfmlgkqevirgweegvaqmsvgqrakltispdyaygatghpgiipphatlvfdvellkpe
[0515]
c-端蛋白降解序列
[0516]
pest(增强型odc pest)(li等人，1998)(seq id no:53)
[0517]
shgfppeveeqaagtlpmscaqesgmdrhpaacasarinv*
[0518]
odc pest(酵母)(rogers等人，1986)(seq id no:54)
[0519]
shgfppeveeqddgtlpmscaqesgmdrhpaacasarinv*
[0520]
odc pest(人)(seq id no:55)
[0521]
npdfppeveeqdastlpvscawesgmkrhraacasasinv*
[0522]
cl1(gilon等人，1998)(seq id no:56)
[0523]
acknwfsslshfvihlnshgfppeveeqaagtlpmscaqesgmdrhpaacasarinv*
[0524]
cl1-pest(seq id no:57)
[0525]
acknwfsslshfvihlnshgfppeveeqaagtlpmscaqesgmdrhpaacasarinv*
[0526]
e1a pest(rogers等人，1986)(seq id no:58)
[0527]
srecnsstdscdsgpsntppeihpvvplcpikpvavrvggrrqaveciedllnepgqpldlsckrprp*
[0528]
c-myc pest(rogers等人，1986)(seq id no:59)
[0529]
lheetppttssdseeeqedeeeidvvsvekr
[0530]
c-fos pest(rogers等人，1986)(seq id no:60)
[0531]
aahrkgsssnepssdslssptllal
[0532]
v-myb pest(rogers等人，1986)(seq id no:61)
[0533]
psppvdhgclpeesasparcmivhqs
[0534]
npdc1 pest(seq id no:62)
[0535]
ppkeldtassdeenedgdftvyecpglaptgemevrnplfdhaalsaplpapssppalp
[0536]
ikba pest(shumway等人，1999)(seq id no:63)
[0537]
pesedeesydtesefteftedelpyddcvfggqrltl
[0538]
m.m.azin2 pest(lambertos和penafiel 2019)(seq id no:64)
[0539]
gqllpaeedqdaegvckplscgweitdtlcvgpvftpasim*
[0540]
x.l.azin2 pest(lambertos和penafiel 2019)(seq id no:65)
[0541]
vqllqrglqqteekenvctpmscgweisdslcftrtfaatsii*
[0542]
由crl2泛素连结酶指导的c-末端degrons(lin等人，2018)
[0543]
ns1(seq id no:66)
[0544]
tslykkvgmgrk*
[0545]
ns6(seq id no:67)
[0546]
slykkvgtmaag*
[0547]
ns7(seq id no:68)
[0548]
ykkvgtmrgrgl*
[0549]
ns12(seq id no:69)
[0550]
eraptgrwgrrg*
[0551]
ns15(seq id no:70)
[0552]
egplwhpricgs*
[0553]
selk(seq id no:71)
[0554]
lrgpspppmagg*
[0555]
sels(seq id no:72)
[0556]
wrpgrrgpssgg*
[0557]
由e3泛素连结酶指导的c-末端degrons(koren等人，2018)
[0558]
emid1(seq id no:73)
[0559]
rderg*
[0560]
irx6(seq id no:74)
[0561]
gaeag*
[0562]
泛素degrons(chassin等人，2019)
[0563]
ubvr(seq id no:75)
[0564]
qifvktltgktitlevepsdtienvkakiqdkegippdqqrlifagkqledgrtlsdyniqkestlhlvlrlrgvrasas
[0565]
2xubvr(seq id no:76)
[0566]
tsqifvktltgktitlevepsdtienvkakiqdkegippdqqrlifagkqledgrtlsdyniqkestlhlvlrlrgvrasasqifvktltgktitlevepsdtienvkakiqdkegippdqqrlifagkqledgrtlsdyniqkestlhlvlrlrgvrasas
[0567]
通过polya尾模拟翻译的序列
[0568]
12x poly k编码尾序列(seq id no:77)
[0569]
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaataa
[0570]
翻译产物12x poly k(seq id no:78)
[0571]
kkkkkkkkkkkk*
[0572]
16x poly k编码尾序列(seq id no:79)
[0573]
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaataa
[0574]
翻译产物16x poly k(seq id no:80)
[0575]
kkkkkkkkkkkkkkkk*
[0576]
用于增强或阻抑核酶介导的反式剪接的酶
[0577]
人rtcb蛋白序列(seq id no:81)
[0578]
msrsyndelqflekinkncwrikkgfvpnmqvegvfyvndaleklmfeelrnacrgggvggflpamkqignvaalpgivhrsiglpdvhsgygfaignmaafdmndpeavvspggvgfdincgvrllrtnldesdvqpvkeqlaqamfdhipvgvgskgvipmnakdleealemgvdwslregyawaedkehceeygrmlqadpnkvsarakkrglpqlgtlgagnhyaeiqvvdeifneyaakkmgidhkgqvcvmihsgsrglghqvatdalvamekamkrdkiivndrqlacariaspegqdylkgmaaagnyawvnrssmtfltrqafakvfnttpddldlhviydvshniakveqhvvdgkertllvhrkgstrafpphhpliavdyqltgqpvliggtmgtcsyvltgteqgmtetfgttchgagralsraksrrnldfqdvldkladmgiairvaspklvmeeapesyknvtdvvntchdagiskkaiklrpiavikg*
[0579]
人rtcb人密码子优化的核酸序列(seq id no:82)
[0580]
atgtcccggtcatataatgacgagctgcaattccttgagaagataaataagaattgctggcgcatcaagaaaggcttcgttcctaatatgcaagttgaaggtgtattttatgtaaatgacgctttggaaaagttgatgttcgaggaactgaggaacgcatgtcgcggtggaggtgtcgggggttttcttcccgctatgaagcagattggcaatgtggcggctctgcccggaattgtgcaccgctctataggattgcctgacgtacacagcggctacggattcgccattgggaatatggcggcgttcgatatgaacgaccctgaggcggttgttagccctggaggtgtcggcttcgatataaattgcggagtcagattgcttcggacaaatttggatgaatctgacgtacaaccagtgaaagagcaacttgcacaagcgatgttcgatcatattcccgtgggtgtggggtcaaagggagtaatcccaatgaacgcgaaagacctggaagaagcattggagatgggtgtagactggtcactgcgagaaggttatgcctgggctgaagacaaagagcactgcgaggagtacggtcgcatgttgcaagcagacccaaataaagtatccgcgagggccaagaaaagaggtttgccgcagctggggacattgggggccggtaaccactatgcagaaatacaagtagtggatgagattttcaatgagtacgctgcgaagaaaatggggatcgaccataaaggtcaagtgtgcgtaatgatacattctgggagtcgcggactcgggcaccaagttgcaacggacgcccttgtcgccatggaaaaagcgatgaagcgggataaaatcatcgtaaatgataggcaattggcttgcgctcgcattgcgagtccggaagggcaagactacttgaaagggatggctgctgccgggaattatgcatgggtcaaccggagcagtatgacattcttgacgcggcaggcttttgcaaaagtgtttaatacgactccggacgacctcgatctccatgttatatatgatgtatcacacaatatcgcaaaggttgagcaacacgttgtggatggtaaggaaaggactctgctggtacaccggaaaggcagtacacgggcattcccgcctcatcacccattgatcgcagtcgattatcaattgacaggtcagccagttctgatcggaggaacaatgggcacatgtagctacgtattgaccgggactgaacaggggatgaccgaaacttttggcacaacatgccatggcgcggggagggcactctcccgagctaaaagtaggaggaatcttgacttccaggatgtactggataagctggccgatatggggatagccatccgggtagcgtcacccaaattggtaatggaggaagctcctgaaagctataaaaatgtcactgacgttgtcaacacatgccatgacgcgggtatatccaagaaagctattaagctgcgcccaatagctgtaattaaaggatag
[0581]
大肠杆菌rtcb蛋白序列(seq id no:83)
[0582]
mnyellttenapvkmwtkgvpveadarqqlintakmpfifkhiavmpdvhlgkgstigsviptkgaiipaavgvdigcgmnalrtaltaedlpenlaelrqaietavphgrttgrckrdkgawenppvnvdakwaeleagyqwltqkyprflntnnykhlgtlgtgnhfieicldesdqvwimlhsgsrgignaigtyfidlaqkemqetletlpsrdlayfmegteyfddylkavawaqlfaslnrdammenvvtalqsitqktvrqpqtlameeinchhnyvqkeqhfgeeiyvtrkgavsaragqygiipgsmgaksfivrglgneesfcscshgagrvmsrtkakklfsvedqiratahvecrkdaevideipmaykdidavmaaqsdlveviytlrqvvcvkg
[0583]
大肠杆菌rtcb人密码子优化的核酸序列(seq id no:84)
[0584]
atgaattacgagcttcttaccactgagaatgcacctgtgaaaatgtggactaagggagtgcccgtggaagcggacgcaaggcagcagctcataaatacagctaagatgcctttcatcttcaaacacatcgcggttatgcccgacgtgcacctcggaaaaggctctactattggaagtgtgattccgacaaagggtgcgatcatacctgctgccgtcggggtggacataggctgtggaatgaatgccctgcgaacggctcttaccgcagaagatcttcctgagaatctggccgagctgcgacaggccattgaaacagcggttccgcatggtcggactaccggacggtgcaaaagggacaaaggtgcgtgggaaaaccctcccgttaacgtggatgcgaaatgggctgagttggaagcaggctatcaatggcttacccagaaatatccacggttcttgaacactaataactacaaacacctggggaccttggggacggggaatcatttcatcgaaatctgtcttgatgagtctgaccaagtgtggattatgcttcatagcggtagccgcggcattggtaacgcaattgggacatattttattgacctcgcgcagaaagagatgcaggaaacgcttgagacgctgccgtcccgagatcttgcgtattttatggaagggacggaatactttgacgattatctgaaggcggtagcatgggctcaactgtttgctagtctcaaccgagacgcgatgatggaaaatgtggtaacagcacttcaatcaatcacccaaaagacagtgcgacagccccaaactctcgctatggaagaaatcaattgccaccacaattacgttcagaaagagcaacatttcggagaagaaatttacgtgacaagaaaaggagctgttagcgcgagggccggacagtacggcatcattcctgggtcaatgggtgcgaaatcttttatagtacgcgggcttggtaatgaagaatccttctgcagctgttctcatggagccggaagggtaatgtccaggactaaggccaagaaactcttctctgtggaagatcaaattagagctacagcacatgttgaatgtagaaaggatgccgaagtcatagacgagatccctatggcttacaaagatatagatgctgtaatggctgcacagtcagacctcgtagaggttatctacacactccggcaagtcgtatgcgtaaaaggatag
[0585]
耐辐射异常球菌rtcb蛋白序列(seq id no:85)
[0586]
mngkhitklgfegkavglalsaaglredagvsrgdildelrsvqnypeqyqgggvyadlathlieqqaaqqtrqsaklraaplpyrtwgedliepgahrqmdvamqlpisragalmpdahvgyglpiggvlatenavipygvgvdigcsmmlsvfpvaatglsvdearslllkhtrfgagvgfekrdrldhpvlaeatwdeqpllrhlfdkaagqigssgsgnhfvefgtftlaqadpqlegldpgeylavlshsgsrgfgaqvaghftnlaqrlwpaldkeaqklawlpldseagqaywqamnlagryalanheqiharlaralgekpllraqnshnlawkqqvngqelivhrkgatpaeagqlglipgsmadpgylvrgrgnpealasashgagrqlgrkaaerslakkdvqaylkdrgvtligggideapqaykriedviarqrdlvdvlgefrprvvrmdtgsedv
[0587]
耐辐射异常球菌rtcb人密码子优化的核酸序列(seq id no:86)
[0588]
atgaacggaaagcacatcacgaagttgggtttcgaagggaaggctgttggcctggcattgtctgcggctggtctcagggaagacgcaggcgtttcccgaggagatattctcgatgaacttaggtctgtccagaattatccggagcaatatcaagggggaggggtctatgccgacttggcgacacaccttattgagcaacaagctgctcagcagactaggcaatccgccaagctgcgagcagcaccacttccgtaccgaacgtggggtgaagacctgatcgagccaggcgcacacagacagatggatgtagcaatgcagctcccgatctcccgggcgggagcgctgatgccagatgcccacgtaggatacgga
cttcccattggaggcgtgctcgctaccgaaaacgccgtaatcccctatggagtgggcgttgacatcggttgctcaatgatgttgagtgttttcccggtggctgcaacaggtctgtcagtggatgaggcgcggtcactgcttctcaaacacacgcgcttcggtgcgggggtcggattcgagaaacgcgacaggctcgaccatcctgtcttggcggaggctacgtgggacgagcagcctttgctgagacacttgtttgataaagctgctggccagattgggtcttccggatcagggaaccacttcgtcgaatttggaactttcaccctcgcacaggccgatccgcagttggaaggtttggaccctggggaatacttggctgttctttcacactcagggagtagaggatttggagcccaggtggctgggcattttaccaacttggcgcagcgcttgtggcccgcacttgataaggaagctcaaaaactcgcatggctgccactggattctgaggctgggcaagcctactggcaagccatgaacttggcgggacgatatgcgttggctaaccatgagcaaattcacgcccgactggcccgcgcacttggtgagaagcctcttctgcgcgcccagaactcccacaatctggcctggaaacagcaggtgaatgggcaggaattgatagtccaccgcaaaggggctactcctgcggaagccgggcaacttggtctcatccctggctccatggccgacccgggatatttggtcaggggaaggggaaatccggaagcattggcctctgcgtcacacggagcaggtagacagctcggccggaaggcagcggaaaggtccctggcgaagaaagatgtgcaggcttaccttaaagatagaggagtaacccttatcgggggcgggattgacgaggctccccaggcgtataaaaggatcgaagacgtcatagcacgccagcgggaccttgtggatgtgttgggagaatttaggccacgagtagtgcggatggatacagggtctgaagatgtttag
[0589]
霍里科什火球菌rtcb蛋白序列(seq id no:87)
[0590]
mvvplkridkirweipkfdkrmrvpgrvyadevllekmkndrtleqatnvamlpgiykysivmpdghqgygfpiggvaafdvkegvispggigydincgvrlirtnltekevrprikqlvdtlfknvpsgvgsqgriklhwtqiddvlvdgakwavdngygwerdlerleeggrmegadpeavsqrakqrgapqlgslgsgnhflevqvvdkifdpevakayglfegqvvvmvhtgsrglghqvasdylrimerairkyripwpdrelvsvpfqseegqryfsamkaaanfawanrqmithwvresfqevfkqdpegdlgmdivydvahnigkveehevdgkrvkvivhrkgatrafppgheavprlyrdvgqpvlipgsmgtasyilagtegamketfgstchgagrvlsrkaatrqyrgdrirqellnrgiyvraasmrvvaeeapgayknvdnvvkvvseagiaklvarmrpigvakg*
[0591]
霍里科什火球菌rtcb人密码子优化的核酸序列(seq id no:88)
[0592]
atggtggttcccctgaagagaatagataaaattcgctgggagatccctaagttcgacaaaaggatgagagtaccaggacgggtgtatgcagatgaggtcttgctcgaaaaaatgaaaaatgaccgcacgcttgaacaggcaacgaacgtcgcaatgctgccaggcatttataaatacagtattgtgatgcccgatggccaccaggggtacggatttccaattggaggggtagccgctttcgatgttaaagagggcgtaatcagtcctggtgggatcgggtacgacatcaattgtggagtccgactgatcagaaccaatctcactgagaaagaagtaaggcccagaatcaagcaactggttgatactctgtttaaaaacgtcccttctggagtgggcagtcaagggcggattaaactgcattggactcaaatagacgatgtactcgtagacggggcaaaatgggctgtggacaacggatatggatgggagcgcgacctcgaacggttggaagaaggtggtcggatggagggggccgatccagaggcggtctcccaacgggcaaagcagaggggagcaccccagctcgggtccctggggtctggcaaccatttcctcgaagtacaggtcgtagataagatctttgatcctgaagtagcgaaagcgtatggcctcttcgaggggcaagtggttgtgatggttcacactggtagcagaggtcttgggcaccaagttgcatccgactacttgcgaatcatggagcgcgcaattaggaagtatagaatcccctggccggatagagagcttgtctcagtcccttttcaaagcgaggaaggacaaagatacttcagcgccatgaaagccgcggcaaactttgcatgggcaaatcggcagatgataactcattgggtacgagaatcattccaagaggtcttcaaacaagatccggaaggcgacctcggcatggacattgtgtacgatgtcgcccacaatataggcaaagtggaggagcacgaggtcgatggcaaacgggtgaaagttatagtccatcgaaagggagcaactcgcgcttttccaccaggtcacgaggctgtacctaggctgtatcgggatgtcggtcaacctgtactcatacccggatctatgggcacagcttcctatattctggctggcactgaaggagcaatgaaagagacgtttggatctacctgtcacggagctggtagg
gtactctcccggaaggccgcgacacgacaatatcgcggggacaggatcagacaagaacttttgaatagaggcatctacgtgcgcgccgctagtatgcgcgtcgtggccgaagaggcacctggggcttacaagaacgtggataacgtagttaaagtagtaagtgaagccggcatcgccaagctggtggcccggatgcgcccgattggcgtggcaaagggttag
[0593]
火球菌属种st04 rtcb蛋白序列(seq id no:89)
[0594]
mtvplkridrirweipkfdkrmrvpgrvyadevliekmrsdrtleqaanvamlpgiykysivmpdghqgygfpiggvaafdvkegvispggigydincgvrlirtnltekevrpkikqlvdtlfknvpsgvgsqgrirlhwtqiddvlvdgakwavdngygwerdlerleeggrmegadpdavsqrakqrgapqlgslgsgnhflevqvvdkiydeevakayglfegqvvvmvhtgsrglghqvasdylrimerairkyripwpdrelvsvpfqseegqryfsamkaaanfawanrqmithwvresfqevfrqdpegdlgmdivydvahnigkveehevdgkkvtvivhrkgatrafppgheaipriyrdvgqpvlipgsmgtasyvlagtegamketfgstchgagrvlsrkaatrqyrgdrirnellqrgiyvraasmrvvaeeapgayknvdnvvkvvseagiaklvarmrpigvakg*
[0595]
火球菌属种st04 rtcb人密码子优化的核酸序列(seq id no:90)
[0596]
atgaccgttcccctgaagagaatagataggattcgctgggagatccctaagttcgacaaaaggatgagagtaccaggacgggtgtatgcagatgaggtcttgatcgagaaaatgagaagcgaccgcacgcttgaacaggcagccaacgtcgcaatgctgccaggcatttataaatacagtattgtgatgcccgatggccaccaggggtacggatttccaattggaggggtagccgctttcgatgttaaagagggcgtaatcagtcctggtgggatcgggtacgacatcaattgtggagtccgactgatcagaaccaatctcactgagaaagaagtaaggcccaaaatcaagcaactggttgatactctgtttaaaaacgtcccttctggagtgggcagtcaagggcggattagactgcattggactcaaatagacgatgtactcgtagacggggcaaaatgggctgtggacaacggatatggatgggagcgcgacctcgaacggttggaagaaggtggtcggatggagggggccgatccagacgcggtctcccaacgggcaaagcagaggggagcaccccagctcgggtccctggggtctggcaaccatttcctcgaagtacaggtcgtagataagatctacgatgaggaagtagcgaaagcgtatggcctcttcgaggggcaagtggttgtgatggttcacactggtagcagaggtcttgggcaccaagttgcatccgactacttgcgaatcatggagcgcgcaattaggaagtatagaatcccctggccggatagagagcttgtctcagtcccttttcaaagcgaggaaggacaaagatacttcagcgccatgaaagccgcggcaaactttgcatgggcaaatcggcagatgataactcattgggtacgagaatcattccaagaggtcttcagacaagatccggaaggcgacctcggcatggacattgtgtacgatgtcgcccacaatataggcaaagtggaggagcacgaggtcgatggcaagaaagtgaccgttatagtccatcgaaagggagcaactcgcgcttttccaccaggtcacgaggctatccctaggatctatcgggatgtcggtcaacctgtactcatacccggatctatgggcacagcttcctatgtgctggctggcactgaaggagcaatgaaagagacgtttggatctacctgtcacggagctggtagggtactctcccggaaggccgcgacacgacaatatcgcggggacaggatcagaaatgaacttttgcaaagaggcatctacgtgcgcgccgctagtatgcgcgtcgtggccgaagaggcacctggggcttacaagaacgtggataacgtagttaaagtagtaagtgaagccggcatcgccaagctggtggcccggatgcgcccgattggcgtggcaaagggttag
[0597]
热球菌属种ep1 rtcb蛋白序列(seq id no:91)
[0598]
meiplkrldkirweipkfnrrmrvpgrvyaddtllqkmrqdktleqatnvamlpgiykysivmpdghqgygfpiggvaafdvkegvispggvgydincgvrlirtnlvekevrpkikqlidtlfknvpsglgskgrirlhwtqlddvladgakwavdngygwkddlehleeggrmeganpnavsqkakqrgapqlgslgsgnhfleiqvvdkvfneeiakayglfegqivvmvhtgsrglghqvasdylrimekanrkynvpwpdrelvsvpfqteegqryfsamkaaanfawanrqmithwvresfeevfkqkaedlgmhivydvahniakveehevngrkikvvvhrkgatrafpagheaipkayrdvgqpvlipgsmgtasyvlagaegsmretfgstchgagrvlsrhaatrqfrgdrlrnelmqrgiyiraasmrvvaeeapgayknvdnvvrvvheagianlvarmrpigvakg*
[0599]
热球菌属种ep1 rtcb人密码子优化的核酸序列(seq id no:92)
[0600]
atggagataccactcaaacgacttgacaagatccgatgggagattcccaaatttaacagacgaatgagagttccgggaagagtttacgcagatgatacattgctccaaaagatgcgacaagataagacgctcgaacaagccaccaacgtggccatgctcccaggcatttataagtatagtatagtcatgcctgacggacaccagggttatggattcccgattggcggtgtagcagccttcgacgtaaaagagggagtaattagtcctggcggtgttggttatgatattaactgtggcgtgaggcttatcaggacgaatcttgtagagaaggaagtgcgaccaaaaatcaaacaacttatagatactttgttcaaaaatgtcccgtctgggctcggatcaaagggtcggataaggctccactggactcaactggatgatgttctggctgatggggcaaaatgggctgttgacaatgggtacgggtggaaggatgatctcgaacatttggaggagggcggacggatggagggcgcaaaccccaatgccgtttcacagaaagcgaagcaaaggggagcgccacagcttgggtcccttggctcaggcaatcatttcctcgaaattcaggtcgtcgataaggtttttaacgaagagatagcaaaggcttacggactctttgaaggtcagatagtggtaatggtccatacgggctctcggggactgggacatcaagtcgcaagtgactacctgaggatcatggagaaagccaatcgcaagtacaatgtgccctggcctgaccgggagcttgttagcgtgcccttccagacggaagagggtcaacgatactttagcgctatgaaggcggcagctaatttcgcttgggcaaacagacagatgataacacattgggttagagagtccttcgaggaggtctttaaacaaaaagctgaggaccttggaatgcatattgtctatgatgttgcccataacatagcaaaagtagaggaacatgaggtgaacgggcggaaaattaaggtcgtagtacacagaaaaggcgctaccagagcattccccgcaggacacgaggccatacccaaagcatatagagatgtcggccagccagtgctcataccgggatctatgggtacggcgtcctatgtcttggcgggtgctgaaggatcaatgagggagacgttcggctcaacctgtcatggggcaggtcgggtcttgtctcggcatgctgcaactcggcagttccgcggggatcgactcaggaatgaactcatgcagagaggcatttacatacgcgctgcctccatgcgcgttgtcgccgaggaagctcccggcgcctataagaacgtagacaatgtcgtcagggtggtgcatgaagcgggaattgcgaacttggtagccaggatgcgcccaataggggttgccaagggatagtaa
[0601]
人archease蛋白序列(seq id no:93)
[0602]
maqeeedvrdynlteeqkaikakyppvnrkyeyldhtadvqlhawgdtleeafeqcamamfgymtdtgtveplqtvevetqgddlqsllfhfldewlykfsadeffiprevkvlsidqrnfklrsigwgeefslskhpqgtevkaitysamqvyneenpevfviidi*
[0603]
人archease人密码子优化的核酸序列(seq id no:94)
[0604]
aggaacaaaaggccatcaaagcgaaatatccgcctgtaaaccgaaagtatgagtacctggatcacactgcggacgtccagttgcatgcctggggcgacactctggaggaggcattcgaacaatgtgcaatggcaatgtttggctacatgactgatacaggcacagtggagccccttcaaacggtagaggtagaaactcagggagatgatcttcagagcttgctcttccattttctcgacgaatggttgtataagttcagtgccgacgagttcttcattccacgcgaagtgaaagtgctgagtattgatcagagaaactttaaacttaggtctattgggtggggtgaagagttctctttgtctaaacaccctcaaggaactgaggtaaaggcgataacttactcagccatgcaggtatataacgaggagaatcctgaggttttcgtaatcattgatatatag
[0605]
霍里科什火球菌archease蛋白序列(seq id no:95)
[0606]
mkkwehyehtadigirgygdsleeafeavaialfdvmvnvnkvekkevreieveaedleallysfleellvihdieglvfrdfevkiervngkyrlrakaygekldlkkhepkeevkaityhdmkierlpngkwmaqlvpdi*
[0607]
霍里科什火球菌archease人密码子优化的核酸序列(seq id no:96)
[0608]
atgaagaaatgggagcactatgagcatactgccgacattggtattcggggatatggggatagccttgaggaggcattcgaagcagtagccatcgcgctctttgatgtaatggtgaacgtgaataaagtcgagaagaaggaagtccg
agaaattgaagtggaggcagaagatttggaggccctcctttattcattcctggaagaactgttggttattcatgatatagagggactggttttcagggactttgaagttaagatagagagagtaaatggcaaataccgacttcgagcgaaagcctacggtgagaagctcgacctcaagaagcacgaaccgaaagaggaagtaaaggcgataacctaccatgatatgaaaattgaacggttgcccaatggaaagtggatggctcaactcgttccagatatttag
[0609]
t4多核苷酸激酶(t4 pnk)蛋白序列(seq id no:97)
[0610]
mkkiiltigcpgsgkstwarefiaknpgfyninrddyrqsimaheerdeykytkkkegivtgmqfdtaksilyggdsvkgviisdtnlnperrlawetfakeygwkvehkvfdvpwtelvkrnskrgtkavpidvlrsmyksmreylglpvyngtpgkpkavifdvdgtlakmngrgpydlekcdtdvinpmvvelskmyalmgyqivvvsgresgtkedptkyyrmtrkwvediagvplvmqcqreqgdtrkddvvkeeifwkhiaphfdvklaiddrtqvvemwrrigvecwqvasgdf*
[0611]
t4 pnk人密码子优化的核酸序列(seq id no:98)
[0612]
atgaagaaaattatacttacaatcggatgccctggtagtggtaagagcacttgggcgagggaatttattgcgaagaaccctggattttataatatcaatcgagacgactaccggcagtctattatggcccacgaggaacgagacgaatacaagtataccaagaagaaagaagggattgtcacgggtatgcaatttgacaccgccaaatcaatactgtacggaggtgattcagtcaaaggcgttatcatatcagacactaacctcaatcctgaacgccgattggcatgggaaacatttgcgaaggaatacggttggaaggttgaacacaaggtgttcgatgtcccgtggaccgaactggtaaaacgcaattctaaacgaggcactaaagctgtgcccattgacgtacttcgaagtatgtacaagtccatgagagagtacctggggcttcccgtctataacggtacgccgggcaaaccgaaggcggtgatctttgacgtagatgggactctggcgaagatgaatggtcgcggaccatacgatttggaaaaatgtgacacagatgtaatcaacccaatggtagtagagcttagcaagatgtacgcattgatgggctaccaaattgtcgtggtgtccgggcgggagtcaggcacaaaagaagatccgacgaagtattatcgcatgacacggaaatgggtcgaagatatagccggggtgcctctcgttatgcaatgtcaacgagaacagggcgacacacggaaggatgacgtagtgaaggaggaaattttctggaagcatatagcgccacactttgacgttaagctcgccatcgacgaccgaactcaggtggtcgagatgtggcgacgaattggcgtagagtgttggcaagttgcatctggagatttttag
[0613]
大肠杆菌thpr蛋白序列(seq id no:99)
[0614]
msepqrlffaidlpaeireqiihwrathfppeagrpvaadnlhltlaflgevsaekekalsllagrirqpgftltlddagqwlrsrvvwlgmrqpprgliqlanmlrsqaarsgcfqsnrpfhphitllrdaseavtipppgfnwsyavteftlyassfargrtrytplkrwaltq*
[0615]
大肠杆菌thpr人密码子优化的核酸序列(seq id no:100)
[0616]
atgagtgagcctcaacgattgttctttgccatagatttgcctgctgaaattagagagcaaattatccattggagagccacccatttccccccagaagctggacgaccagtcgcagcggacaacctccaccttacactggcgttcttgggtgaagtgagcgccgagaaagagaaagctctctcacttctggctgggaggattcggcagccgggctttacccttactctggatgatgccggccagtggctgaggtccagggttgtctggctcggaatgaggcaaccacctagggggctcatccagctcgccaatatgctgagatcccaggccgcaaggtctggctgcttccaatcaaacaggccattccacccgcatattaccttgctcagagatgcctccgaggcagtaactattccacctcccggctttaactggagttacgccgtcacagaatttactctgtacgcctccagcttcgcccgagggagaaccaggtacacgcctttgaagcggtgggccttgacccagtag
[0617]
人pnkp蛋白序列(seq id no:101)
[0618]
mgeveapgrlwlesppggappiflpsdgqalvlgrgpltqvtdrkcsrtqvelvadpetrtvavkqlgvnpsttgtqelkpglegslgvgdtlylvnglhpltlrweetrtpesqpdtppgtplvsqdekrdaelpkkrmrksnpgwenlekllvftaagvkpqgkvagfdldgtlittrsgkvfptgpsdwrilypeiprklreleaegyklviftnqm
sigrgklpaeefkakveavveklgvpfqvlvathaglyrkpvtgmwdhlqeqandgtpisigdsifvgdaagrpanwapgrkkkdfscadrlfalnlglpfatpeefflkwpaagfelpafdprtvsrsgplclpesrallsaspevvvavgfpgagkstflkkhlvsagyvhvnrdtlgswqrcvttcetalkqgkrvaidntnpdaasraryvqcaraagvpcrcflftatleqarhnnrfremtdsshipvsdmvmygyrkqfeaptlaegfsaileipfrlwveprlgrlycqfseg*
[0619]
人pnkp人密码子优化的核酸序列(seq id no:102)
[0620]
atgggcgaggtggaggccccgggccgcttgtggctcgagagcccccctgggggagcgccccccatcttcctgccctcggacgggcaagccctggtcctgggcaggggacccctgacccaggttacggaccggaagtgctccagaactcaagtggagctggtcgcagatcctgagacccggacagtggcagtgaaacagctgggagttaacccctcaactaccgggacccaggagttgaagccggggttggagggctctctgggggtgggggacacactgtatttggtcaatggcctccacccactgaccctgcgctgggaagagacccgcacaccagaatcccagccagatactccgcctggcacccctctggtgtcccaagatgagaagagagatgctgagctgccgaagaagcgtatgcggaagtcaaaccccggctgggagaacttggagaagttgctagtgttcaccgcagctggggtgaaaccccagggcaaggtggctggctttgatctggacgggacgctcatcaccacacgctctgggaaggtctttcccactggccccagtgactggaggatcttgtacccagagattccccgtaagctccgagagctggaagccgagggctacaagctggtgatcttcaccaaccagatgagcatcgggcgcgggaagctgccagccgaggagttcaaggccaaggtggaggctgtggtggagaagctgggggtccccttccaggtgctggtggccacgcacgcaggcttgtaccggaagccggtgacgggcatgtgggaccatctgcaggagcaggccaacgacggcacgcccatatccatcggggacagcatctttgtgggagacgcagccggacgcccggccaactgggccccggggcggaagaagaaagacttctcctgcgccgatcgcctgtttgccctcaaccttggcctgcccttcgccacgcctgaggagttctttctcaagtggccagcagccggcttcgagctcccagcctttgatccgaggactgtctcccgctcagggcctctctgcctccccgagtccagggccctcctgagcgccagcccggaggtggttgtcgcagtgggattccctggggccgggaagtccacctttctcaagaagcacctcgtgtcggccggatatgtccacgtgaacagggacacgctaggctcctggcagcgctgtgtgaccacgtgtgagacagccctgaagcaagggaaacgggtcgccatcgacaacacaaacccagacgccgcgagccgcgccaggtacgtccagtgtgcccgagccgcgggcgtcccctgccgctgcttcctcttcaccgccactctggagcaggcgcgccacaacaaccggtttcgagagatgacggactcctctcatatccccgtgtcagacatggtcatgtatggctacaggaagcagttcgaggccccaacgctggctgaaggcttctctgccatcctggagatcccgttccggctatgggtggagccgaggctggggcggctgtactgccagttctccgagggctag
[0621]
具有含货物和不含货物的内部合成核酶内含子的gfp
[0622]
ntgfp-hdv-hh-ctgfp(seq id no:103)
[0623]
auggugagcaagggcgaggagcuguucaccgggguggugcccauccuggucgagcuggacggcgacguaaacggccacaaguucagcguguccggcgagggcgagggcgaugccaccuacggcaagcugacccugaaguucaucugcaccaccggcaagcugcccgugcccuggcccacccucgugaccacccugaccuacggcgugcagugcuucagccgcuaccccgaccacaugaagcagcacgacuucuucaaguccgccaugcccgaaggcuacguccaggagcgcaccaucuucuuggccggcauggucccagccuccucgcuggcgccggcugggcaacaugcuucggcauggcgaaugggaccccgggacauaacuaguuaaaccaaauccuugcugaugaguccgugaggacgaaacgaguaagcucguccaaggacgacggcaacuacaagacccgcgccgaggugaaguucgagggcgacacccuggugaaccgcaucgagcugaagggcaucgacuucaaggaggacggcaacauccuggggcacaagcuggaguacaacuacaacagccacaacgucuauaucauggccgacaagcagaagaacggcaucaaggugaacuucaagauccgccacaacaucgaggacggcagcgugcagcucgccgaccacuaccagcagaacacccccaucggcgacggccccgugcugcugcccgacaaccacuaccugagcacccaguccgcccugagcaaagaccccaacgagaagcgcgaucacaugguccugcuggaguucgugaccgccgccgggaucacucuc
ggcauggacgagcuguacaaguag
[0624]
ntgfp-hdv-cargo-hh-ctgfp(seq id no:126)
[0625]
auggugagcaagggcgaggagcuguucaccgggguggugcccauccuggucgagcuggacggcgacguaaacggccacaaguucagcguguccggcgagggcgagggcgaugccaccuacggcaagcugacccugaaguucaucugcaccaccggcaagcugcccgugcccuggcccacccucgugaccacccugaccuacggcgugcagugcuucagccgcuaccccgaccacaugaagcagcacgacuucuucaaguccgccaugcccgaaggcuacguccaggagcgcaccaucuucuuggccggcauggucccagccuccucgcuggcgccggcugggcaacaugcuucggcauggcgaaugggacnuccuugcugaugaguccgugaggacgaaacgaguaagcucguccaaggacgacggcaacuacaagacccgcgccgaggugaaguucgagggcgacacccuggugaaccgcaucgagcugaagggcaucgacuucaaggaggacggcaacauccuggggcacaagcuggaguacaacuacaacagccacaacgucuauaucauggccgacaagcagaagaacggcaucaaggugaacuucaagauccgccacaacaucgaggacggcagcgugcagcucgccgaccacuaccagcagaacacccccaucggcgacggccccgugcugcugcccgacaaccacuaccugagcacccaguccgcccugagcaaagaccccaacgagaagcgcgaucacaugguccugcuggaguucgugaccgccgccgggaucacucucggcauggacgagcuguacaaguag
[0626]
ntgfp-hdv(seq id no:127)
[0627]
auggugagcaagggcgaggagcuguucaccgggguggugcccauccuggucgagcuggacggcgacguaaacggccacaaguucagcguguccggcgagggcgagggcgaugccaccuacggcaagcugacccugaaguucaucugcaccaccggcaagcugcccgugcccuggcccacccucgugaccacccugaccuacggcgugcagugcuucagccgcuaccccgaccacaugaagcagcacgacuucuucaaguccgccaugcccgaaggcuacguccaggagcgcaccaucuucuuggccggcauggucccagccuccucgcuggcgccggcugggcaacaugcuucggcauggcgaaugggac
[0628]
hh-ctgfp(seq id no:128)
[0629]
uccuugcugaugaguccgugaggacgaaacgaguaagcucguccaaggacgacggcaacuacaagacccgcgccgaggugaaguucgagggcgacacccuggugaaccgcaucgagcugaagggcaucgacuucaaggaggacggcaacauccuggggcacaagcuggaguacaacuacaacagccacaacgucuauaucauggccgacaagcagaagaacggcaucaaggugaacuucaagauccgccacaacaucgaggacggcagcgugcagcucgccgaccacuaccagcagaacacccccaucggcgacggccccgugcugcugcccgacaaccacuaccugagcacccaguccgcccugagcaaagaccccaacgagaagcgcgaucacaugguccugcuggaguucgugaccgccgccgggaucacucucggcauggacgagcuguacaaguag
[0630]
本文引用的每一个专利、专利申请和出版物的公开内容在此通过引用整体并入本文。虽然已参考特定实施方案公开了本发明，但很明显，在不脱离本发明的真实精神和范围的情况下，本领域的其他技术人员可以设计出本发明的其他实施方案和变型。所附权利要求书旨在被解释为包括所有此类实施方案和等同变化。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种有机电极化复合薄膜及其制作方法

核酶介导的RNA组装和表达

相关文献

最热文献