一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

指环体和使用方法与流程

2021-11-10 04:08:00 来源:中国专利 TAG:

指环体和使用方法
1.相关申请的交叉引用
2.本技术要求2018年12月12日提交的美国临时申请号62/778,841和2018年12月12日提交的美国临时申请号62/778,866的权益。上述申请的内容通过引用整体并入本文。
3.序列表
4.本技术包含序列表,该序列表已以ascii格式电子提交,并通过引用以其整体并入本文。所述ascii副本创建于2019年12月9日,名为v2057

7005wo_sl.txt,并且大小为825,796字节。


背景技术:

5.持续需要开发合适的载体以向患者递送治疗性遗传物质。


技术实现要素:

6.本公开提供了一种指环体(anellosome),例如合成的指环体,其可用作递送媒介物,例如用于向真核细胞(例如人细胞或人组织)递送遗传材料、用于递送效应子(例如有效负载),或用于递送治疗剂或治疗效应子。在一些实施例中,指环体(例如颗粒,例如病毒颗粒,例如指环病毒(anellovirus)颗粒)包含包封在蛋白质外部的遗传元件(例如,包含治疗性dna序列的遗传元件)(例如,包含指环病毒衣壳蛋白,例如,指环病毒orf1蛋白或由指环病毒orf1核酸编码的多肽的蛋白质外部,例如,如本文所述),所述蛋白质外部能够将遗传元件引入细胞(例如哺乳动物细胞,例如人细胞)。在一些实施例中,指环体是包含蛋白质外部的颗粒,所述蛋白质外部包含由以下编码的多肽:指环病毒的orf1核酸(例如,甲型细环病毒、乙型细环病毒或丙型细环病毒的orf1核酸,例如,甲型细环病毒进化分枝1、甲型细环病毒进化分枝2、甲型细环病毒进化分枝3、甲型细环病毒进化分枝4、甲型细环病毒进化分枝5、甲型细环病毒进化分枝6或甲型细环病毒进化分枝7的orf1,例如如本文所述)。本公开的指环体的遗传元件可以是环状和/或单链dna分子(例如环状和单链),并且通常包括与蛋白质外部结合的由所述蛋白质外部封闭的蛋白质结合序列或附接于其上的多肽,其可以促进遗传元件被封闭在蛋白质外部内和/或遗传元件相对于其他核酸在蛋白质外部内富集。在一些情况下,遗传元件是环状或线性的。在一些情况下,遗传元件包含或编码效应子(例如,核酸效应子,例如非编码rna,或多肽效应子,例如,蛋白质),例如,所述效应子可以在细胞中表达。在一些实施例中,效应子是治疗剂或治疗效应子,例如,如本文所述。在一些情况下,效应子例如对于野生型指环病毒或靶细胞是内源性效应子或外源性效应子。在一些实施例中,效应子对于野生型指环病毒或靶细胞是外源的。在一些实施例中,指环体可以通过接触细胞并将编码外效应子的遗传元件引入细胞中而将效应子递送到细胞中,从而效应子由细胞产生或表达。在某些情况下,效应子是内源性效应子(例如,对于靶细胞是内源的,但例如由指环体以增加的量提供)。在其他情况下,效应子是外源性效应子。在一些情况下,外源性效应子可以调节细胞的功能或调节细胞中靶分子的活性或水平。例如,效应子可以降低细胞中靶蛋白的水平(例如,如实例3和4中所述)。在另一个实例中,指环体可以递送和体
内表达效应子,例如外源蛋白质(例如,如实例19和28中所述)。指环体可用于例如将遗传物质递送至靶细胞、组织或受试者;将效应子递送至靶细胞、组织或受试者;或用于治疗疾病和病症,例如通过将可作为治疗剂起作用的效应子递送至所期望细胞、组织或受试者。
7.本发明进一步提供合成的指环体。合成的指环病毒与野生型病毒(例如,野生型指环病毒,例如本文所述的)相比具有至少一个结构差异,例如相对于野生型病毒的缺失、插入、取代、修饰(例如,酶促修饰)。通常,合成的指环体包括封闭在蛋白质外部内的外源性遗传元件,所述蛋白质外部可用以将遗传元件,或其中编码的效应子(例如,外源性效应子或内源性效应子)(例如,多肽或核酸效应子)递送到真核细胞(例如人细胞)中。在实施例中,指环体不会引起可检测的和/或不想要的免疫或炎症应答,例如不会引起炎症的一种或多种分子标志物(例如,tnf

α、il

6、il

12、ifn)增加超过1%、5%、10%、15%,以及不会引起b细胞应答,例如反应性或中和抗体,例如指环体可以对靶细胞、组织或受试者基本上无免疫原性。
8.在一方面,本发明的特征在于一种指环体,其包含:(i)遗传元件,其包含启动子元件和编码效应子(例如内源性或外源性效应子)的序列和蛋白质结合序列(例如,外部蛋白质结合序列,例如包装信号);以及(ii)蛋白质外部;其中所述遗传元件被封闭在所述蛋白质外部(例如衣壳)内;并且其中所述指环体能够将所述遗传元件递送到真核(例如,哺乳动物,例如,人)细胞中。在一些实施例中,遗传元件是单链和/或环状dna。可替代地或组合地,遗传元件具有以下特性中的一种、两种、三种或全部:是环状的,是单链的,它以少于进入细胞的遗传元件的约0.0001%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%、或2%频率整合进入细胞的基因组中,和/或它以小于1、2、3、4、5、6、7、8、9、10、15、20、25或30个拷贝/基因组整合进入靶细胞的基因组中。在一些实施例中,整合频率如wang等人(2004,gene therapy[基因疗法]11:711

721,通过引用整体并入本文)所述确定。在一些实施例中,遗传元件被包封在蛋白质外部内。在一些实施例中,指环体能够将遗传元件递送到真核细胞中。在一些实施例中,遗传元件包含与野生型指环病毒序列(例如,野生型细环病毒(ttv)、细小环病毒(ttmv)或ttmdv序列,例如,表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中列出的野生型指环病毒序列)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的核酸序列(例如,300

4000个核苷酸的核酸序列,例如300

3500个核苷酸、300

3000个核苷酸、300

2500个核苷酸、300

2000个核苷酸、300

1500个核苷酸)。在一些实施例中,遗传元件包含与野生型指环病毒序列(例如,如本文所述的野生型指环病毒序列,例如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中列出的)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的核酸序列(例如,至少300个核苷酸、500个核苷酸、1000个核苷酸、1500个核苷酸、2000个核苷酸、2500个核苷酸、3000个核苷酸或更多的核酸序列)。在一些实施例中,核酸序列是经密码子优化的,例如用于在哺乳动物(例如人)细胞中表达。在一些实施例中,核酸序列中至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的密码子是经密码子优化,例如,用于在哺乳动物(例如,人)细胞中的表达。
[0009]
在一方面,本发明的特征在于一种感染性(对人细胞感染性)颗粒,其包含指环病
毒衣壳(例如,包含指环病毒orf,例如orf1,多肽的衣壳),所述指环病毒衣壳包封遗传元件,所述遗传元件包含与衣壳结合的蛋白质结合序列和编码治疗性效应子的异源(对于指环病毒而言)序列。在实施例中,所述颗粒能够将遗传元件递送到哺乳动物例如人的细胞中。在一些实施例中,遗传元件与野生型指环病毒具有小于约6%(例如,小于6%、5.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%或更少)同一性。在一些实施例中,遗传元件与野生型指环病毒具有不超过1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%或6%同一性。在一些实施例中,遗传元件与野生型指环病毒具有至少约2%到至少约5.5%(例如,2至5%、3%至5%、4%至5%)同一性。在一些实施例中,遗传元件具有大于约2000、3000、4000、4500或5000个核苷酸的非病毒序列(例如,非指环病毒基因组序列)。在一些实施例中,遗传元件具有大于约2000至5000、2500至4500、3000至4500、2500至4500、3500或4000、4500(例如,约3000至4500)个核苷酸的非病毒序列(例如,非指环病毒基因组序列)。在一些实施例中,遗传元件是单链、环状dna。可替代地或组合地,遗传元件具有以下特性中的一种、两种或3种:是环状的,是单链的,它以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%、或2%的频率整合进入细胞的基因组中,它以小于1、2、3、4、5、6、7、8、9、10、15、20、25或30个拷贝/基因组整合进入靶细胞的基因组中或以少于进入细胞的遗传元件的约0.0001%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合。在一些实施例中,整合频率如wang等人(2004,gene therapy[基因疗法]11:711

721,通过引用整体并入本文)所述确定。
[0010]
本文还描述了基于指环病毒的病毒载体和病毒颗粒,其可用于将药剂(例如,外源性效应子或内源性效应子,例如,治疗性效应子)递送到细胞(例如,待治疗受试者中的细胞)。在一些实施例中,指环病毒可用作有效递送媒介物,将药剂(例如本文所述的效应子)引入靶细胞,例如治疗性或预防性治疗的受试者中的靶细胞。
[0011]
在一方面,本发明的特征在于一种多肽(例如合成多肽,例如orf1分子),其包含(例如,串联):
[0012]
(i)第一区域,其包含精氨酸富集区,与本文描述的精氨酸富集区序列具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列,或者含有至少60%、70%或80%碱性残基(例如,精氨酸、赖氨酸或其组合)的至少约40个氨基酸的序列,
[0013]
(ii)第二区域,其包含胶冻卷(jelly

roll)结构域,例如与本文所述的胶冻卷区域序列具有至少30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列或含有至少6个β链的序列,
[0014]
(iii)第三区域,其包含与本文所述n22结构域序列具有至少30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列,
[0015]
(iv)第四区域,其包含与本文所述的指环病毒病毒orf1 c末端结构域(ctd)序列具有至少70%(例如至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列,以及
[0016]
(v)任选地,其中所述多肽具有与本文描述的野生型指环病毒orf1蛋白的序列同一性小于100%、99%、98%、95%、90%、85%、80%的氨基酸序列。
[0017]
在一些实施例中,所述多肽包含与本文所述的指环病毒orf1分子(例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)至少约70%、80%、90%、95%、96%、97%、98%、99或100%的序列同一性。在一些实施例中,所述多肽包含与本文所述指环病毒orf1分子(例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10)中任一个中所列)的子序列(例如,精氨酸(arg)富集结构域、胶冻卷结构域、高可变区(hvr)、n22结构域或c末端结构域(ctd))至少约70%、80%、90%、95%、96%、97%、98%、99%或100%的序列同一性。在一个实施例中,(i)、(ii)、(iii)和(iv)区的氨基酸序列与其各自的参考具有至少90%序列同一性,并且其中所述多肽具有与本文描述的野生型指环病毒orf1蛋白具有低于100%、99%、98%、95%、90%、85%、80%序列同一性的氨基酸序列。
[0018]
在一方面,本发明的特征在于复合物,所述复合物包含如本文所述的多肽(例如,如本文所述的指环病毒orf1分子)和包含启动子元件和编码效应子(例如,外源性效应子或内源性效应子)的核酸序列(例如,dna序列)以及蛋白质结合序列的遗传元件。
[0019]
本公开还提供了核酸分子(例如,包括如本文所述的遗传元件的核酸分子,或包括编码如本文所述的蛋白质外部蛋白的序列的核酸分子)。本发明的核酸分子可包括(a)本文所述的遗传元件和(b)编码本文所述的蛋白质外部蛋白的核酸序列中的一者或两者。
[0020]
在一方面,本发明的特征在于分离的核酸分子,其包含遗传元件,所述遗传元件包含与编码效应子例如有效负载的序列可操作地连接的启动子元件和外部蛋白质结合序列。在一些实施例中,外部蛋白质结合序列包括与本文公开的指环病毒的5’utr序列至少75%(80%、85%、90%、95%、97%、100%)相同的序列。在实施例中,遗传元件是单链dna,是环状的,以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%、或2%的频率整合,和/或以小于1、2、3、4、5、6、7、8、9、10、15、20、25或30个拷贝/基因组整合进入靶细胞的基因组中或以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合。在一些实施例中,整合频率如wang等人(2004,gene therapy[基因疗法]11:711

721,通过引用整体并入本文)所述确定。在实施例中,效应子不是源自ttv,并且不是sv40

mir

s1。在实施例中,核酸分子不包含ttmv

ly2的多核苷酸序列。在实施例中,启动子元件能够指导效应子在真核(例如哺乳动物,例如人)细胞中的表达。
[0021]
在一些实施例中,核酸分子是环状的。在一些实施例中,核酸分子是线性的。在一些实施例中,本文所述的核酸分子包含一个或多个经修饰的核苷酸(例如碱基修饰、糖修饰或骨架修饰)。
[0022]
在一些实施例中,核酸分子包含编码orf1分子(例如,指环病毒orf1蛋白,例如,如本文所述)的序列。在一些实施例中,核酸分子包含编码orf2分子(例如,指环病毒orf2蛋白,例如,如本文所述)的序列。在一些实施例中,核酸分子包含编码orf3分子(例如,指环病毒orf3蛋白,例如,如本文所述)的序列。在一方面,本发明的特征在于一种遗传元件,其包含以下中的一个、两个或三个:(i)启动子元件和编码效应子的序列,例如外源性或内源性效应子;(ii)与野生型指环病毒序列具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的至少72个连续核苷酸(例如,至少72、73、74、75、76、77、78、79、80、90、100或150个核苷
酸);或与野生型指环病毒序列具有至少72%(例如,至少72、73、74、75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的至少100(例如,至少300、500、1000、1500)个连续核苷酸;以及(iii)蛋白质结合序列,例如外部蛋白质结合序列,其中核酸构建体是单链dna;并且其中核酸构建体是环状的,以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%、或2%频率整合,和/或以小于1、2、3、4、5、6、7、8、9、10、15、20、25或30个拷贝/基因组整合进入靶细胞的基因组中。在一些实施例中,编码效应子(例如,外源性或内源性效应子,例如,如本文所述)的遗传元件是经密码子优化的。在一些实施例中,遗传元件是环状的。在一些实施例中,遗传元件是线性的。在一些实施例中,遗传元件包括指环载体,例如,如本文所述。在一些实施例中,本文所述的遗传元件包含一个或多个经修饰的核苷酸(例如碱基修饰、糖修饰或骨架修饰)。在一些实施例中,遗传元件包含编码orf1分子(例如,指环病毒orf1蛋白,例如,如本文所述)的序列。在一些实施例中,遗传元件包含编码orf2分子(例如,指环病毒orf2蛋白,例如,如本文所述)的序列。在一些实施例中,遗传元件包含编码orf3分子(例如,指环病毒orf3蛋白,例如,如本文所述)的序列。
[0023]
在一方面,本发明的特征在于宿主细胞或辅助细胞,其包含:(a)核酸,其包含编码orf1分子、orf2分子或orf3分子中的一个或多个的序列(例如,编码本文描述的指环病毒orf1多肽的序列),其中所述核酸是质粒,是病毒核酸,或者整合到辅助细胞染色体中;和(b)遗传元件,其中所述遗传元件包含(i)可操作地连接至编码效应子(例如,外源性效应子或内源性效应子)的核酸序列(例如,dna序列)的启动子元件和(ii)结合(a)的多肽的蛋白质结合序列,其中任选地所述遗传元件不编码orf1多肽(例如,orf1蛋白质)。例如,宿主细胞或辅助细胞包括以顺式(同一核酸分子的两个部分)或以反式(不同核酸分子的每个部分)的(a)和(b)。在实施例中,(b)的遗传元件是环状单链dna。在一些实施例中,宿主细胞是生产细胞系。在一些实施例中,宿主细胞或辅助细胞是贴壁的或悬浮的,或两者。在一些实施例中,宿主细胞或辅助细胞在微载剂中生长。在一些实施方案中,宿主细胞或辅助细胞与cgmp生产实践相容。在一些实施例中,宿主细胞或辅助细胞在适合促进细胞生长的培养基中生长。在某些实施例中,一旦宿主细胞或辅助细胞已经充分生长(例如,达到合适的细胞密度),可以将培养基更换为适合宿主细胞或辅助细胞生产指环体的培养基。
[0024]
在一方面,本发明的特征在于一种药物组合物,其包含本文所述的指环体(例如合成的指环体)。在实施例中,药物组合物进一步包含药学上可接受的载剂或赋形剂。在实施例中,药物组合物包含以下单位剂量,所述单位剂量包含约105‑
10
14
基因组当量的指环体/千克目标受试者。在一些实施例中,包含制剂的药物组合物在可接受的时间和温度范围内是稳定的,和/或与所期望的施用途径和/或该施用途径需要的任何装置(例如针头或注射器)相容。在一些实施例中,药物组合物被配制用于作为单剂量或多剂量施用。在一些实施例中,药物组合物在施用地点配制,例如由医疗保健专业人员配制。在一些实施例中,药物组合物包含所期望浓度的指环体基因组或基因组等价物(例如,如由基因组数量/体积所定义)。
[0025]
在一方面,本发明的特征在于一种治疗受试者的疾病或障碍的方法,所述方法包括向所述受试者施用例如本文所述的指环体,例如合成的指环体。
[0026]
在一方面,本发明的特征在于一种将效应子或有效负载(例如,内源性或外源性效
应子)递送到细胞、组织或受试者的方法,所述方法包括向所述受试者施用例如本文所述的指环体,例如合成的指环体,其中所述指环体包含编码效应子的核酸序列。在实施例中,有效负载是核酸。在实施例中,有效负载是多肽。
[0027]
在一方面,本发明的特征在于一种将指环体递送至细胞的方法,所述方法包括使指环体,例如合成的指环体(例如如本文所述)与细胞(例如,真核细胞,例如,哺乳动物细胞)接触,例如在体内或离体接触。
[0028]
在一方面,本发明的特征在于一种制备指环体,例如合成的指环体的方法。所述方法包括:
[0029]
a)提供宿主细胞,其包含:
[0030]
(i)第一核酸分子,其包含如本文所述的指环体,例如合成的指环体的遗传元件的核酸序列,和
[0031]
(ii)所述第一核酸或第二核酸分子,所述第二核酸分子编码以下中的一种或多种:选自orf1、orf2、orf2/2、orf2/3、orf1/1或orf1/2的氨基酸序列(例如,如表16中任一个中所列),或与其具有至少70%(例如,至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;以及
[0032]
b)在适合于制备指环体的条件下孵育所述宿主细胞。
[0033]
在一些实施例中,所述方法进一步包括,在步骤(a)之前,将所述第一核酸分子和/或所述第二核酸分子引入所述宿主细胞。在一些实施例中,所述第二核酸分子在所述第一核酸分子之前、与其同时或在其之后被引入所述宿主细胞。在其他实施例中,所述第二核酸分子被整合到所述宿主细胞的基因组中。在一些实施例中,所述第二核酸分子是辅助(例如辅助质粒或辅助病毒的基因组)。
[0034]
在另一方面,本发明的特征在于一种制备指环体组合物的方法,所述方法包括:
[0035]
a)提供宿主细胞,其包含例如表达例如本文所述的指环体(例如合成的指环体)的一种或多种组分(例如,所有组分)。例如,所述宿主细胞包含(a)包含编码本文所述的指环病毒orf1多肽的序列的核酸,其中所述核酸是质粒、病毒核酸或整合到辅助细胞染色体中;(b)遗传元件,其中所述遗传元件包含(i)可操作地连接至编码效应子(例如,外源性效应子或内源性效应子)的核酸序列(例如,dna序列)的启动子元件和(i)结合(a)的多肽的蛋白质结合序列(例如包装序列),其中所述宿主细胞或辅助细胞包括以顺式或以反式的(a)和(b)。在实施例中,(b)的遗传元件是环状单链dna。在一些实施例中,宿主细胞是生产细胞系;
[0036]
b)在适合从所述宿主细胞产生指环体制剂的条件下培养所述宿主细胞,其中所述制剂的指环体包含包封所述遗传元件(例如,如本文所述)的蛋白质外部(例如,包含orf1分子),从而制备指环体制剂;并且
[0037]
任选地,c)将指环体的制剂配制为例如适于向受试者施用的药物组合物。
[0038]
在一些实施例中,在生产时(例如,通过瞬时转染)将指环体的组分引入宿主细胞。在一些实施例中,宿主细胞稳定表达指环体的组分(例如,其中一种或多种编码指环体的组分的核酸被引入宿主细胞或其祖细胞,例如通过稳定转染)。
[0039]
在一些实施例中,所述方法进一步包括一个或多个纯化步骤(例如,通过沉降、层析和/或超滤纯化)。在一些实施例中,纯化步骤包括从制剂中去除血清、宿主细胞dna、宿主
细胞蛋白质、缺乏遗传元件的颗粒和/或酚红中的一种或多种。在一些实施例中,所得制剂或包含所述制剂的药物组合物在可接受的时间和温度范围内是稳定的,和/或与所期望的施用途径和/或该施用途径需要的任何装置(例如针头或注射器)相容。
[0040]
在一方面,本发明的特征在于一种制备指环体组合物的方法,所述方法包括:a)提供多个本文所述的指环体,或本文所述的指环体的制剂;b)将所述指环体或其制剂配制成例如适合施用于受试者的药物组合物。
[0041]
在一方面,本发明的特征在于一种制备包含指环体的宿主细胞的方法,所述宿主细胞例如第一宿主细胞或生产者细胞(例如,如图12所示),例如第一宿主细胞的群体,所述方法包括将例如本文所述的遗传元件引入宿主细胞中并在适合于生产指环体的条件下培养宿主细胞。在实施例中,所述方法进一步包括将辅助物例如辅助病毒引入宿主细胞中。在实施例中,引入包括用指环体对宿主细胞进行转染(例如化学转染)或电穿孔。
[0042]
在一方面,本发明的特征在于一种制备指环体的方法,其包括提供包含例如本文所述的指环体的宿主细胞,例如第一宿主细胞或生产者细胞(例如,如图12所示),并从宿主细胞中纯化指环体。在一些实施例中,所述方法进一步包括,在提供步骤之前,使宿主细胞与例如本文所述的指环体接触,并且在适合于生产指环体的条件下孵育宿主细胞。在实施例中,宿主细胞是在上述制备宿主细胞的方法中描述的第一宿主细胞或生产者细胞。在实施例中,从宿主细胞中纯化指环体包括裂解宿主细胞。
[0043]
在一些实施例中,所述方法进一步包括第二步骤,所述步骤使由第一宿主细胞或生产者细胞产生的指环体与第二宿主细胞,例如允许细胞(例如,如图12所示),例如第二宿主细胞群体接触。在一些实施例中,所述方法进一步包括在适合于生产指环体的条件下孵育第二宿主细胞。在一些实施例中,所述方法进一步包括从第二宿主细胞中纯化指环体,例如从而产生指环体种子群体。在实施例中,与第一宿主细胞群体相比,第二宿主细胞群体产生至少约2

100倍更多的指环体。在实施例中,从第二宿主细胞中纯化指环体包括裂解第二宿主细胞。在一些实施例中,所述方法进一步包括第二步骤,所述步骤使第二宿主细胞产生的指环体与第三宿主细胞,例如允许细胞(例如,如图12所示),例如第三宿主细胞群体接触。在一些实施例中,所述方法进一步包括在适合于生产指环体的条件下孵育第三宿主细胞。在一些实施例中,所述方法进一步包括从第三宿主细胞中纯化指环体,例如从而产生指环体储备群体。在实施例中,从第三宿主细胞中纯化指环体包括裂解第三宿主细胞。在实施例中,与第二宿主细胞群体相比,第三宿主细胞群体产生至少约2

100倍更多的指环体。
[0044]
在一些实施例中,宿主细胞在适合促进细胞生长的培养基中生长。在某些实施例中,一旦宿主细胞已经充分生长(例如,达到合适的细胞密度),可以将培养基更换为适合宿主细胞生产指环体的培养基。在一些实施例中,由宿主细胞生产的指环体从宿主细胞分离(例如,通过裂解宿主细胞),之后与第二宿主细胞接触。在一些实施例中,由宿主细胞生产的指环体与第二宿主细胞接触而无需介入纯化步骤。
[0045]
在一方面,本发明的特征在于一种制备药物指环体制剂的方法。所述方法包括(a)制备如本文所述的指环体制剂,(b)针对以下一种或多种药物质量控制参数评估所述制剂(例如,药物指环体制剂、指环体种子群体或指环体储备物群体):同一性、纯度、效价、效力(例如,以每个指环体颗粒的基因组当量)和/或例如来自指环体所包含的遗传元件的核酸序列,和(c)配制用于评估的药物用途的制剂满足预定标准,例如,满足药物规范。在一些实
施例中,评估同一性包括评估(例如,确认)指环体的遗传元件的序列,例如编码效应子的序列。在一些实施例中,评估纯度包括评估杂质的量,所述杂质是例如支原体、内毒素、宿主细胞核酸(例如,宿主细胞dna和/或宿主细胞rna)、动物来源的过程杂质(例如,血清白蛋白或胰蛋白酶)、具有复制能力的因子(rca),例如具有复制能力的病毒或不需要的指环体(例如,除所需的指环体例如本文所述的合成的指环体以外的指环体)、游离病毒衣壳蛋白、外源因子和聚集体。在一些实施例中,评估效价包括评估制剂中功能性相比于非功能性(例如感染性相比于非感染性)指环体的比率(例如,如通过hplc评估的)。在一些实施例中,评估效力包括评估制剂中可检测的指环体功能水平(例如,其中编码的效应子的表达和/或功能或基因组等价物)。
[0046]
在实施例中,配制的制剂基本上不含病原体、宿主细胞污染物或杂质;具有预定水平的非感染性颗粒或预定比例的颗粒:感染单位(例如,<300:1、<200:1、<100:1或<50:1)。在一些实施例中,可以在单个批次中生产多个指环体。在实施例中,可以评估批次中生产的指环体的水平(例如,单独或一起)。
[0047]
在一方面,本发明的特征在于一种宿主细胞,其包含:
[0048]
(i)第一核酸分子,其包含如本文所述的指环体的遗传元件的核酸序列,和
[0049]
(ii)任选地,第二核酸分子,所述第二核酸分子编码以下中的一种或多种:选自orf1、orf2、orf2/2、orf2/3、orf1/1或orf1/2的氨基酸序列(如表16中任一个中所列),或与之具有至少约70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列。
[0050]
在一方面,本发明的特征在于一种反应混合物,其包含本文所述的指环体和辅助病毒,其中所述辅助病毒包含多核苷酸,例如编码外部蛋白质的多核苷酸(例如,能够结合外部蛋白质结合序列和任选的脂质包膜的外部蛋白质),编码复制蛋白(例如聚合酶)的多核苷酸或其任何组合。
[0051]
在一些实施例中,分离指环体(例如,合成的指环体),例如从宿主细胞中分离和/或从溶液(例如,上清液)中的其他成分中分离。在一些实施例中,例如从溶液(例如上清液)中纯化指环体(例如,合成的指环体)。在一些实施例中,相对于溶液中的其他成分,富集溶液中的指环体。
[0052]
在任何上述指环体、组合物或方法的一些实施例中,提供指环体包括从包含产生指环体的细胞(例如,如本文所述)的组合物中分离(例如收获)指环体。在其他实施例中,提供指环体包括例如从第三方获得指环体或其制剂。
[0053]
在任何前述指环体、指环载体、组合物或方法的一些实施例中,遗传元件包含指环体基因组,例如,根据实例9中所述的方法鉴定。在实施例中,指环体基因组包含ttv

tth8核酸序列,例如表5中所示的ttv

tth8核酸序列,其具有ttv

tth8核酸序列的核苷酸3436

3707的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或100%的缺失。在实施例中,指环体基因组包含ttmv

ly2核酸序列,例如表15中所示的ttmv

ly2核酸序列,其具有ttmv

ly2核酸序列的核苷酸574

1371、1432

2210、574

2210和/或2610

2809的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或100%的缺失。在实施例中,指环体基因组是能够自我复制和/或自我扩增的指环体基因组。在实施例中,指环体基因组不能够自我复制和/或自我扩增。在实施例中,指环体基因组能够以反式复制和/
或扩增,例如在辅助物例如辅助病毒存在下。
[0054]
任何前述指环体、指环载体、组合物或方法的附加特征包括以下列举的实施例中的一个或多个。
[0055]
本领域技术人员将认知到、或不使用过度常规实验就能够确定本案所述发明的特定实施例的许多等效实例。此类等效实施例意在由以下列举的实施例涵盖。
[0056]
列举的实施例
[0057]
1000.一种多肽,例如orf1分子,其包含以下中的一项或多项:
[0058]
(a)第一区域,其包含与本文描述的精氨酸富集区序列(例如mpyyyrrrrynyrrprwygrgwirrpfrrrfrrkrrvr(seq id no:216)或
[0059]
mawgwwkrrrrwwfrkrwtrgrlrrrwprsarrrprrrrvrrrrrwrrgrrktrtyrrrrrfrrrgrk(seq id no:186),或如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列,或者含有至少60%、70%或80%碱性残基(例如,精氨酸、赖氨酸或其组合)的至少约40个氨基酸的序列,
[0060]
(b)第二区域,其包含与本文所述的胶冻卷区域序列(例如ptyttiplkqwqppykrtcyikgqdcliyysnlrlgmnstmyeksivpvhwpgggsfsvsmltldalydihklcrnwwtstnqdlplvrykgckitfyqstftdyivrihtelpansnkltypnthplmmmmskykhiipsrqtrrkkkpytkifvkpppqfenkwyfatdlykipllqihctacnlqnpfvkpdklsnnvtlwslnt(seq id no:217),或如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)具有至少30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列或含有至少6个(例如,至少6、7、8、9、10、11或12个)β链的序列;
[0061]
(c)第三区域,其包含与本文所述n22结构域序列(例如tmaltpfnepiftqiqynpdrdtgedtqlyllsnatgtgwdppgipelilegfplwliywgfadfqknlkkvtnidtnymlvaktkftqkpgtfylvilndtfvegnspyekqplpednikwypqvqyqleaqnkllqtgpftpniqgqlsdnismfykfyfk(seq id no:219),或如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)具有至少30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;以及
[0062]
(d)第四区域,其包含与本文所述的指环病毒病毒orf1 c末端结构域(ctd)序列(例如
[0063]
wggsppkainvenpahqiqypiprnehettslqspgeapesilysfdyrhgnytttalsrisqdwalkdtvskitepdrqqllkqaleclqiseetqekkekevqqlisnlrqqqqlyreriisllkdq(seq id no:220),或如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)具有至少30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;
[0064]
其中所述orf1分子包含相对于野生型orf1蛋白(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、化学或酶促修饰,和/或缺失,例如结构域(例如,精氨酸富集区、胶冻卷结构域、hvr、n22或ctd中的一个或多个,例如如本文所述)的缺失。
[0065]
1000a.如实施例1000所述的多肽,其中(a)、(b)、(c)和(d)的区域的氨基酸序列与其各自的参考具有至少90%序列同一性。
[0066]
1001.如实施例1000所述的多肽,其中所述多肽包含:
[0067]
(i)所述第一区域和所述第二区域;
[0068]
(ii)所述第一区域和所述第三区域;
[0069]
(iii)所述第一区域和所述第四区域;
[0070]
(iv)所述第二区域和所述第三区域;
[0071]
(v)所述第二区域和所述第四区域;
[0072]
(vi)所述第三区域和所述第四区域;
[0073]
(vii)所述第一区域、所述第二区域和所述第三区域;
[0074]
(viii)所述第一区域、所述第二区域和所述第四区域;
[0075]
(ix)所述第一区域、所述第三区域和所述第四区域;或
[0076]
(x)所述第二区域、所述第三区域和所述第四区域。
[0077]
1002.一种多肽,例如orf1分子,其包含:
[0078]
(a)第一区域,其包含与本文描述的精氨酸富集区序列(例如mpyyyrrrrynyrrprwygrgwirrpfrrrfrrkrrvr(seq id no:216)或
[0079]
mawgwwkrrrrwwfrkrwtrgrlrrrwprsarrrprrrrvrrrrrwrrgrrktrtyrrrrrfrrrgrk(seq id no:186),或如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列,或者含有至少60%、70%或80%碱性残基(例如,精氨酸、赖氨酸或其组合)的至少约40个氨基酸的序列,
[0080]
(b)第二区域,其包含与本文所述的胶冻卷区域序列(例如ptyttiplkqwqppykrtcyikgqdcliyysnlrlgmnstmyeksivpvhwpgggsfsvsmltldalydihklcrnwwtstnqdlplvrykgckitfyqstftdyivrihtelpansnkltypnthplmmmmskykhiipsrqtrrkkkpytkifvkpppqfenkwyfatdlykipllqihctacnlqnpfvkpdklsnnvtlwslnt(seq id no:217),或如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)具有至少30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列或含有至少6个β链的序列;
[0081]
(c)第三区域,其包含与本文所述n22结构域序列(例如tmaltpfnepiftqiqynpdrdtgedtqlyllsnatgtgwdppgipelilegfplwliywgfadfqknlkkvtnidtnymlvaktkftqkpgtfylvilndtfvegnspyekqplpednikwypqvqyqleaqnkllqtgpftpniqgqlsdnismfykfyfk(seq id no:219),或如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)具有至少30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;以及
[0082]
(d)第四区域,其包含与本文所述的指环病毒病毒orf1 c末端结构域(ctd)序列(例如
[0083]
wggsppkainvenpahqiqypiprnehettslqspgeapesilysfdyrhgnytttalsrisqdwalkdtvskitepdrqqllkqaleclqiseetqekkekevqqlisnlrqqqqlyreriisllkdq(seq id no:220),或如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一
个中所列)具有至少30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;
[0084]
其中所述orf1分子包含相对于野生型orf1蛋白(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、化学或酶促修饰,和/或缺失,例如结构域(例如,精氨酸富集区、胶冻卷结构域、hvr、n22或ctd中的一个或多个,例如如本文所述)的缺失。
[0085]
1002a.如实施例1002所述的多肽,其中(a)、(b)、(c)和(d)区域的氨基酸序列与其各自的参考具有至少90%序列同一性。
[0086]
1003.如前述实施例中任一项所述的多肽,其中:
[0087]
所述第一区域包含与表16中列出的orf1序列的氨基酸1

38具有至少70%(例如至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;
[0088]
所述第二区域包含与表16中列出的orf1序列的氨基酸39

246具有至少70%(例如至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;
[0089]
所述第二区域包含与表16中列出的orf1序列的氨基酸375

537具有至少70%(例如至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;和/或
[0090]
所述第四区域包含与表16中列出的orf1序列的氨基酸538

666具有至少70%(例如至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列。
[0091]
1003a.如实施例1003所述的多肽,其中所述第一、第二、第三和第四区域的氨基酸序列与其各自的参考具有至少90%序列同一性。
[0092]
1004.如前述实施例中任一项所述的多肽,其中:
[0093]
所述第一区域包含与如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的精氨酸富集区序列具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;
[0094]
所述第二区域包含与如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的胶冻卷区域序列具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;
[0095]
所述第三区域包含与如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的n22结构域序列具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;和/或
[0096]
所述第四区域包含与如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的ctd序列具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列。
[0097]
1004a.如实施例1004所述的多肽,其中所述第一、第二、第三和第四区域的氨基酸序列与其各自的参考具有至少90%序列同一性。
[0098]
1005.如前述实施例中任一项所述的多肽,其中所述多肽以n末端到c末端的顺序包含所述第一区域、所述第二区域、所述第三区域和所述第四区域。
[0099]
1006.如前述实施例中任一项所述的多肽,其中所述至少一个差异包括所述第一
区域相对于野生型orf1蛋白的精氨酸富集区的至少一个差异。
[0100]
1007.如前述实施例中任一项所述的多肽,其中所述第一区域包含来自与所述多肽或其不包括所述第一区域的部分具有最大序列同一性的野生型指环病毒以外的指环病毒的orf1蛋白的精氨酸富集区。
[0101]
1008.如前述实施例中任一项所述的多肽,其中所述第一区域包含氨基酸序列,所述氨基酸序列与来自除野生型指环病毒(所述多肽与其具有最大序列同一性)之外的指环病毒的精氨酸富集区具有至少70%序列同一性。
[0102]
1009.如前述实施例中任一项所述的多肽,其中所述第一区域包含多肽,所述多肽与野生型指环病毒基因组(例如,如本文所述)或其与所述第一区域具有相同氨基酸长度的部分具有小于15%(例如,小于15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%)序列同一性。
[0103]
1010.如前述实施例中任一项所述的多肽,其中所述第一区域具有dna结合活性和/或核定位活性。
[0104]
1011.如前述实施例中任一项所述的多肽,其中所述第一区域包含dna结合区域和/或核定位序列。
[0105]
1012.如前述实施例中任一项所述的多肽,其中所述至少一个差异包括所述第二区域中相对于野生型orf1蛋白的胶冻卷区域的至少一个差异。
[0106]
1013.如前述实施例中任一项所述的多肽,其中所述第二区域包含来自与所述多肽或其不包括所述第二区域的部分具有最大序列同一性的野生型指环病毒以外的指环病毒的orf1蛋白的胶冻卷区域。
[0107]
1014.如前述实施例中任一项所述的多肽,其中所述第二区域包含氨基酸序列,所述氨基酸序列与来自除野生型指环病毒(所述多肽与其具有最大序列同一性)之外的指环病毒的胶冻卷区具有至少70%序列同一性。
[0108]
1015.如前述实施例中任一项所述的多肽,其中所述第二区域包含多肽,所述多肽与野生型指环病毒基因组(例如,如本文所述)或其与所述第二区域具有相同氨基酸长度的部分具有小于15%(例如,小于15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%)序列同一性。
[0109]
1016.如前述实施例中任一项所述的多肽,其中所述至少一个差异包括所述第三区域中相对于野生型orf1蛋白的n22结构域的至少一个差异。
[0110]
1017.如前述实施例中任一项所述的多肽,其中所述第三区域包含来自与所述多肽或其不包括所述第三区域的部分具有最大序列同一性的野生型指环病毒以外的指环病毒的orf1蛋白的n22结构域。
[0111]
1018.如前述实施例中任一项所述的多肽,其中所述第三区域包含氨基酸序列,所述氨基酸序列与来自除野生型指环病毒(所述多肽与其具有最大序列同一性)之外的指环病毒的n22区具有至少70%序列同一性。
[0112]
1019.如前述实施例中任一项所述的多肽,其中所述第三区域包含多肽,所述多肽与野生型指环病毒基因组(例如,如本文所述)或其与所述第三区域具有相同氨基酸长度的部分具有小于15%(例如,小于15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%)序列同一性。
[0113]
1020.如前述实施例中任一项所述的多肽,其中所述至少一个差异包括所述第四区域中相对于野生型orf1蛋白的ctd结构域的至少一个差异。
[0114]
1021.如前述实施例中任一项所述的多肽,其中所述第四区域包含来自与所述多肽或其不包括所述第四区域的部分具有最大序列同一性的野生型指环病毒以外的指环病毒的orf1蛋白的ctd结构域。
[0115]
1022.如前述实施例中任一项所述的多肽,其中所述第四区域包含氨基酸序列,所述氨基酸序列与来自除野生型指环病毒(所述多肽与其具有最大序列同一性)之外的指环病毒的ctd区具有至少70%序列同一性。
[0116]
1023.如前述实施例中任一项所述的多肽,其中所述第四区域包含多肽,所述多肽与野生型指环病毒基因组(例如,如本文所述)或其与所述第四区域具有相同氨基酸长度的部分具有小于15%(例如,小于15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%)序列同一性。
[0117]
1024.如前述实施例中任一项所述的多肽,所述多肽进一步包含氨基酸序列,例如高变区(hvr)序列(例如,如本文所述的指环病毒orf1分子的hvr序列),其中所述氨基酸序列包含至少约55(例如,至少约45、50、51、52、53、54、55、56、57、58、59、60或65)个氨基酸(例如,约45

160、50

160、55

160、60

160、45

150、50

150、55

150、60

150、45

140、50

140、55

140或60

140个氨基酸)。
[0118]
1025.如实施例1024所述的多肽,其中所述hvr序列位于所述第二区域和所述第三区域之间。
[0119]
1026.如实施例1024或1025所述的多肽,其中所述hvr序列包含氨基酸序列,所述氨基酸序列与来自跟所述orf1蛋白具有最大序列同一性的野生型指环病毒以外的指环病毒的hvr具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性。
[0120]
1027.如实施例1024

1026中任一项所述的多肽,其中所述hvr序列相对于所述第一区域、第二区域、第三区域和/或第四区域中的一个或多个是异源的。
[0121]
1028.如实施例1024

1027中任一项所述的多肽,其中所述至少一个差异包括所述hvr序列中相对于野生型orf1蛋白(例如,来自野生型指环病毒基因组,例如如本文所述)的hvr序列的至少一个差异。
[0122]
1029.如实施例1024

1028中任一项所述的多肽,其中所述hvr序列包含来自与所述多肽或其不包括所述hvr类型的部分具有最大序列同一性的野生型指环病毒以外的指环病毒的orf1蛋白的hvr。
[0123]
1030.如实施例1024

1029中任一项所述的多肽,其中所述hvr序列包含氨基酸序列,所述氨基酸序列与来自跟所述多肽具有最大序列同一性的野生型指环病毒以外的指环病毒的hvr具有至少约70%序列同一性。
[0124]
1031.如实施例1024

1030中任一项所述的多肽,其中所述hvr包含与如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的hvr序列具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列。
[0125]
1032.如实施例1024

1031中任一项所述的多肽,其中所述hvr序列包含与表16中
列出的orf1序列的氨基酸247

374的至少70%(例如至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性。
[0126]
1033.如前述实施例中任一项所述的多肽,所述多肽进一步包含异源多肽,例如以下多肽,其相对于所述第一区域、第二区域、第三区域和/或第四区域中的一个或多个是异源,和/或相对于包含所述多肽的指环体是外源的。
[0127]
1034.如实施例1033所述的多肽,其中所述多肽缺乏指环病毒hvr序列。
[0128]
1035.如实施例1033所述的多肽,其中所述异源多肽存在于所述指环体的外部。
[0129]
1036.如实施例1033所述的多肽,其中所述异源多肽存在于所述指环体的内部。
[0130]
1037.如实施例1033

1036中任一项所述的多肽,其中所述异源多肽具有对所述指环体或野生型指环病毒而言是外源的功能性。
[0131]
1038.如实施例1033

1037中任一项所述的多肽,其中所述异源多肽由约140个或更少的氨基酸(例如,100、110、120、125、130、135、136、137、138、139、140、145、150、155或160个或更少的氨基酸)。
[0132]
1039.实施例1033

1038中任一项所述的多肽,其中所述异源多肽的大小相对于例如本文所述的指环病毒的野生型hvr区为50%

150%。
[0133]
1039a.如实施例1033

1039中任一项所述的多肽,其中所述异源多肽位于所述第二区域和所述第三区域之间。
[0134]
1040.如前述实施例中任一项所述的多肽,其进一步包含在所述第一区域和所述第二区域之间的一个或多个氨基酸、在所述第二区域和所述第三区域之间的一个或多个氨基酸和/或在所述第三区域和所述第四区域之间的一个或多个氨基酸。
[0135]
1041.如前述实施例中任一项所述的多肽,其进一步包含一个或多个相对于所述第一区域位于n末端的氨基酸。
[0136]
1042.如前述实施例中任一项所述的多肽,其进一步包含一个或多个相对于所述第四区域位于c末端的氨基酸。
[0137]
1043.如前述实施例中任一项所述的多肽,其包含多个子序列,所述多个子序列具有至少四个(例如,4、5、6、7、8、9、10、15、20、25或30个)连续氨基酸,与例如如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的野生型指环病毒orf1氨基酸序列的相应子序列具有100%序列同一性。
[0138]
1044.如前述实施例中任一项所述的多肽,其包含多个子序列,所述多个子序列具有至少十个(例如,10、15、20、25、30、40或50个)连续氨基酸,与例如如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的野生型指环病毒orf1氨基酸序列的相应子序列具有80%序列同一性。
[0139]
1045.如前述实施例中任一项所述的多肽,其包含多个子序列,所述多个子序列具有至少二十个(例如,20、25、30、40、50、60、70、80、90或100个)连续氨基酸,与例如如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的野生型指环病毒orf1氨基酸序列的相应子序列具有60%序列同一性。
[0140]
1046.如实施例1043

1045任一项所述的多肽,其中所述多个子序列位于所述第一区域、第二区域、第三区域和/或第四区域内。
[0141]
1047.如前述实施例中任一项所述的多肽,其中所述第一区域包含至少约40个氨
基酸(例如,至少约50、60、70、80、90或100个氨基酸,例如,约40

100、40

90、40

80、40

70、50

100、50

70、60

100、60

90、60

80或60

70个氨基酸)。
[0142]
1048.如前述实施例中任一项所述的多肽,其中所述第一区域包含至少约70%(例如,至少约70%、75%、80%、85%、90%、95%或100%)碱性残基(例如精氨酸、赖氨酸或其组合)。
[0143]
1049.如前述实施例中任一项所述的多肽,其中所述第一区域包含至少约70%(例如,至少约70%、75%、80%、85%、90%、95%或100%)精氨酸残基。
[0144]
1050.如前述实施例中任一项所述的多肽,其中所述多肽与所述多肽的另外拷贝形成同多聚体。
[0145]
1051.如实施例1050所述的多肽,其中所述第一区域结合所述多肽的另外拷贝上的相应第一区域。
[0146]
1052.如实施例1050所述的多肽,其中所述同多聚体形成衣壳,例如包封核酸,例如遗传元件或指环病毒基因组或其部分。
[0147]
1053.如前述实施例中任一项所述的多肽,其中所述多肽是衣壳蛋白或可形成衣壳的一部分。
[0148]
1054.如前述实施例中任一项所述的多肽,其中所述多肽具有复制酶活性。
[0149]
1055.如前述实施例中任一项所述的多肽,其中所述多肽结合核酸(例如,dna)。
[0150]
1056.一种复合物,其包含:
[0151]
(a)如前述实施例中任一项所述的多肽,以及
[0152]
(b)遗传元件,其包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列。
[0153]
1057.一种复合物,其包含:
[0154]
(a)orf1分子,和
[0155]
(b)遗传元件,其包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列;
[0156]
其中所述orf1分子结合(例如,非共价结合)所述遗传元件,
[0157]
其中orf1分子、遗传元件或orf1分子和遗传元件两者包含相对于野生型orf1蛋白、野生型指环病毒基因组或野生型orf1蛋白和野生型指环病毒基因组两者(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、化学或酶促修饰,和/或缺失,例如结构域(例如,例如如本文所述的精氨酸富集区、胶冻卷结构域、hvr、n22或ctd中的一个或多个)或基因组区域(例如,例如如本文所述的tata盒、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失。
[0158]
1058.如实施例1056或1057所述的复合物,其中所述复合物是体外的,例如,其中所述复合物处于基本上无细胞的组合物中。
[0159]
1059.如实施例1056

1058中任一项所述的复合物,其中所述复合物在细胞中,例如宿主细胞,例如辅助细胞,例如在细胞核中。
[0160]
1060.如实施例1056

1059中任一项所述的复合物,其中所述orf1分子是蛋白质外部的一部分。
[0161]
1061.如实施例1056

1060中任一项所述的复合物,其中所述遗传元件正在经历复
制。
[0162]
1062.如实施例1056

1061中任一项所述的复合物,其中所述复合物在指环体中。
[0163]
1063.如实施例1056

1062中任一项所述的复合物,其中所述遗传元件进一步包含编码所述多肽的核酸序列。
[0164]
1064.如实施例1056

1063中任一项所述的复合物,其中所述遗传元件不包含编码所述多肽的核酸序列。
[0165]
1065.如实施例1056

1064中任一项所述的复合物,其中所述遗传元件包含gc富集区,例如如本文所述。
[0166]
1066.如实施例1065所述的复合物,其中所述gc富集区包含以下任一者的核酸序列的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸:
[0167]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0168]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0169]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0170]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0171]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0172]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0173]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0174]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0175]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0176]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0177]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[0178]
1067.一种指环体,所述指环体包含:
[0179]
(a)蛋白质外部;
[0180]
(b)如前述实施例中任一项所述的多肽或复合物;
[0181]
(c)遗传元件,其包含可操作地连接至编码效应子(例如内源性效应子或外源性效应子,例如,如本文所述)的核酸序列(例如,dna序列)的启动子元件;并且
[0182]
其中所述遗传元件被封闭在所述蛋白质外部内。
[0183]
1068.一种指环体,所述指环体包含:
[0184]
(a)蛋白质外部;
[0185]
(b)遗传元件,其包含:
[0186]
(i)可操作地连接至编码效应子(例如内源性效应子或外源性效应子,例如,如本文所述)的核酸序列(例如,dna序列)的启动子元件,以及
[0187]
(ii)编码如前述实施例中任一项所述的多肽的核酸;并且
[0188]
其中所述遗传元件被封闭在所述蛋白质外部内。
[0189]
1069.一种指环体,所述指环体包含:
[0190]
(a)蛋白质外部;
[0191]
(b)orf1分子或编码所述orf1分子的核酸;
[0192]
(c)遗传元件,其包含可操作地连接至编码效应子的异源核酸序列(例如,dna序列)的启动子元件;并且
[0193]
其中所述遗传元件被封闭在所述蛋白质外部内。
[0194]
1070.一种指环体,所述指环体包含:
[0195]
(a)蛋白质外部;
[0196]
(b)orf1分子或编码所述orf1分子的核酸;
[0197]
(c)遗传元件,其包含启动子元件,编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和含有以下核酸序列的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸的区域:
[0198]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0199]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0200]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0201]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0202]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0203]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0204]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0205]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0206]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0207]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0208]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列;并且
[0209]
其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0210]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0211]
其中指环体被配置为将遗传元件递送到真核细胞中;并且任选地,其中所述遗传元件:
[0212]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0213]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0214]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0215]
1071.一种指环体,所述指环体包含:
[0216]
(a)蛋白质外部;
[0217]
(b)orf1分子或编码所述orf1分子的核酸;
[0218]
(c)遗传元件,其包含启动子元件,编码效应子(例如外源性效应子或内源性效应
子)的核酸序列(例如,dna序列),和含有具有至少70%(例如,至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%)的gc含量的至少20个(例如,至少20、25、30、31、32、33、34、35或36个)连续核苷酸的序列;
[0219]
其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0220]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0221]
其中指环体被配置为将遗传元件递送到真核细胞中;并且
[0222]
任选地,其中所述遗传元件:
[0223]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0224]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0225]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0226]
1072.一种指环体,所述指环体包含:
[0227]
(a)蛋白质外部;
[0228]
(b)orf1分子或编码所述orf1分子的核酸;
[0229]
其中:
[0230]
(i)所述orf1分子的至少30%(例如至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、90%或更多)的氨基酸是β

链的一部分;
[0231]
(ii)所述orf1分子的二级结构包含至少三(例如至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20)个β

链;
[0232]
(iii)所述orf1分子的二级结构包含β

链与α

螺旋的比例为至少1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1;并且
[0233]
(c)遗传元件,其包含启动子元件,编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列;
[0234]
其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0235]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0236]
其中指环体被配置为将遗传元件递送到真核细胞中;并且
[0237]
任选地,其中所述遗传元件:
[0238]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0239]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0240]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0241]
1073.一种指环体,所述指环体包含:
[0242]
(a)蛋白质外部;
[0243]
(b)orf1分子或编码所述orf1分子的核酸;
[0244]
(c)遗传元件,其包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列;
[0245]
其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0246]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0247]
其中指环体被配置为将遗传元件递送到真核细胞中;并且
[0248]
任选地,其中所述遗传元件:
[0249]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0250]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0251]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0252]
1074.一种指环体,所述指环体包含:
[0253]
(a)蛋白质外部;
[0254]
(b)遗传元件,其包含启动子元件,编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和含有以下核酸序列的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸的区域:
[0255]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0256]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0257]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0258]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0259]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0260]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0261]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0262]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0263]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0264]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0265]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列;并且
[0266]
其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的
至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0267]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0268]
其中指环体被配置为将遗传元件递送到真核细胞中;并且
[0269]
任选地,其中所述遗传元件:
[0270]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0271]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0272]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0273]
1075.一种指环体,所述指环体包含:
[0274]
(a)蛋白质外部;
[0275]
(b)遗传元件,其包含启动子元件,编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和含有具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的至少20、25、30、31、32、33、34、35或36个连续核苷酸的序列;以及
[0276]
其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0277]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0278]
其中指环体被配置为将遗传元件递送到真核细胞中;并且
[0279]
任选地,其中所述遗传元件:
[0280]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0281]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0282]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0283]
1076.一种指环体,所述指环体包含:
[0284]
(a)蛋白质外部;
[0285]
(b)遗传元件,其包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),
[0286]
其中所述遗传元件包含区域(例如,包装区域,例如,相对于编码所述效应子的核酸序列定位在3'处),所述区域具有:
[0287]
与以下核酸序列的至少95%(例如,至少95%、96%、97%、98%、99%或100%)序列同一性:
[0288]
cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160);
[0289]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0290]
其中所述指环体被配置为将遗传元件递送到真核细胞中。
[0291]
1076a.一种指环体,所述指环体包含:
[0292]
(i)遗传元件,其包含启动子元件和编码治疗性外源性效应子的核酸序列,其中所述遗传元件包含与来自本文所述的指环病毒(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列)的5’utr核苷酸序列具有至少95%序列同一性的序列;和/或
[0293]
(ii)蛋白质外部,其包含与本文所述的指环病毒(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列)的orf1基因编码的多肽具有至少95%序列同一性的多肽;
[0294]
其中所述遗传元件被封闭在所述蛋白质外部内,并且
[0295]
任选地,其中所述指环体能够将所述遗传元件递送到哺乳动物细胞中。
[0296]
1076b.一种指环体,所述指环体包含:
[0297]
(i)遗传元件,其包含:(a)启动子元件,和(b)编码外源性效应子(例如,如本文所述的外源性效应子)的核酸序列,其中所述核酸序列与所述启动子元件可操作地连接;和(c)5’utr结构域,其包含以下之一:
[0298]
(c)(i)seq id no:54的核苷酸323

393的核酸序列,或与其至少85%相同的核酸序列;
[0299]
(c)(ii)seq id no:113、seq id no:114、seq id no:115、seq id no:116、seq id no:117、seq id no:118、seq id no:119的核酸序列或与其至少85%相同的核酸序列;或
[0300]
(c)(iii)seq id no:61的核苷酸117

187的核酸序列,或与其至少85%相同的核酸序列;
[0301]
(ii)包含orf1分子的蛋白质外部;
[0302]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0303]
其中合成的指环体能够将所述遗传元件递送到哺乳动物例如人的细胞中。
[0304]
1077.如前述实施例中任一项所述的指环体,其中所述蛋白质外部包含orf1分子。
[0305]
1078.如前述实施例中任一项所述的指环体,其中所述蛋白质外部中至少60%(例如,至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98、99%或100%)的蛋白质包含orf1分子。
[0306]
1079.如前述实施例中任一项所述的指环体,其中所述蛋白质外部中不超过1%(例如,不超过1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%或40%)的蛋白质包含orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3分子。
[0307]
1080.如前述实施例中任一项所述的指环体,其中所述orf1分子包含与表a1

a12、b1

b5、c1

c5、1

18、20

37、或d1

d10中的任一个中所列的或由其中的序列编码的orf1蛋白具有至少70%(例如,至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的氨基酸序列。
[0308]
1081.如前述实施例中任一项所述的指环体,其中所述orf1分子包含前述实施例中任一项所述的多肽。
[0309]
1082.如前述实施例中任一项所述的指环体,其中所述遗传元件进一步包含编码所述orf1分子的核酸序列。
[0310]
1083.如前述实施例中任一项所述的指环体,其中所述遗传元件不包含编码所述orf1分子的核酸序列。
[0311]
1084.如前述实施例中任一项所述的指环体,其中所述遗传元件包含具有至少80%的gc含量的至少20、25、30、31、32、33、34、35或36个连续核苷酸。
[0312]
1085.如前述实施例中任一项所述的指环体,其中所述遗传元件包含具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的至少36个连续核苷酸。
[0313]
1086.如前述实施例中任一项所述的指环体,其中所述遗传元件包含具有至少80%的gc含量的至少36个连续核苷酸。
[0314]
1087.一种分离的核酸组合物(例如,包含一种、两种或更多种核酸分子),其包含编码如前述实施例中任一项所述的多肽的核酸;
[0315]
任选地,其中所述分离的核酸组合物进一步包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;并且
[0316]
任选地,其中所述核酸分子不包含:
[0317]
(i)相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0318]
(ii)相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0319]
(iii)相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0320]
1088.一种分离的核酸组合物(例如,包含一种、两种或更多种核酸分子),其中所述分离的核酸组合物包含编码orf1分子的遗传元件;
[0321]
其中:
[0322]
(i)所述orf1分子的至少30%(例如至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、90%或更多)的氨基酸是β

折叠的一部分;
[0323]
(ii)所述orf1分子的二级结构包含至少三(例如至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20)个β

折叠;
[0324]
(iii)orf1分子的二级结构包含β

折叠与α

螺旋的比例为至少1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1;并且
[0325]
其中所述遗传元件包含启动子元件,编码效应子(例如外源性效应子或内源性效应子)的核酸序列,和蛋白质结合序列;
[0326]
其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;并且
[0327]
任选地,其中所述核酸分子不包含:
[0328]
(i)相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0329]
(ii)相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0330]
(iii)相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0331]
1089.一种分离的核酸组合物(例如,包含一种、两种或更多种核酸分子),其包含:
[0332]
(a)编码orf1分子的遗传元件;
[0333]
(b)以下核酸序列的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸:
[0334]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0335]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0336]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0337]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0338]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0339]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0340]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0341]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0342]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0343]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0344]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列;并且
[0345]
(c)相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0346]
任选地,其中所述核酸分子不包含:
[0347]
(i)相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0348]
(ii)相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0349]
(iii)相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0350]
1090.一种分离的核酸组合物(例如,包含一种、两种或更多种核酸分子),其中所述分离的核酸组合物包含:
[0351]
(a)编码orf1分子的遗传元件;
[0352]
(b)具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的至少20、25、30、31、32、33、34、35或36个连续核苷酸;并且
[0353]
其中所述分离的核酸组合物包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;并且
[0354]
任选地,其中所述核酸分子不包含:
[0355]
(i)相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0356]
(ii)相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0357]
(iii)相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0358]
1090a.一种分离的核酸组合物(例如,包含一种、两种或更多种核酸分子),其中所述分离的核酸组合物包含遗传元件,所述遗传元件包含来自本文所述的指环病毒(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列)的5’utr核苷酸序列。
[0359]
1091.如实施例1089

1090中任一项所述的分离的核酸组合物,其中(a)和(b)是相同核酸的部分。
[0360]
1092.如实施例1089

1091中任一项所述的分离的核酸组合物,其中(a)和(b)是不同核酸的部分。
[0361]
1093.如前述实施例中任一项所述的分离的核酸组合物,其中所述遗传元件进一步包含以下中的一种或多种:tata盒、起始元件、帽位点、转录起始位点、5’utr保守结构域、orf1编码序列、orf1/1编码序列、orf1/2编码序列、orf2编码序列、orf2/2编码序列、orf2/3编码序列、orf2/3t编码序列、三开放阅读框区域、聚(a)信号和/或来自本文所述的指环病毒的gc富集区(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列),或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[0362]
1094.如前述实施例中任一项所述的分离的核酸组合物,其中所述遗传元件进一步包含指环病毒基因组序列(例如,如本文所述,例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列),或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[0363]
1095.如实施例1094所述的分离的核酸组合物,所述分离的核酸组合物进一步包含指环病毒基因组序列的至少一个另外拷贝或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列(例如,总共1、2、3、4、5或6个拷贝)。
[0364]
1096.如前述实施例中任一项所述的分离的核酸组合物,所述分离的核酸组合物进一步包含所述遗传元件的至少一个另外拷贝(例如,总共1、2、3、4、5或6个拷贝)。
[0365]
1097.一种分离的核酸组合物(例如,包含一种、两种或更多种核酸分子),其包含以下核酸序列的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸:
[0366]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0367]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g
或a;
[0368]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0369]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0370]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0371]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0372]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0373]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0374]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0375]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0376]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列;并且
[0377]
相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0378]
任选地,其中所述核酸分子不包含:
[0379]
(i)相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0380]
(ii)相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0381]
(iii)相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0382]
1098.一种分离的核酸组合物(例如,包含一种、两种或更多种核酸分子),其中所述分离的核酸组合物包含具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的至少20、25、30、31、32、33、34、35或36个连续核苷酸;并且
[0383]
其中所述分离的核酸组合物包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;并且
[0384]
任选地,其中所述核酸分子不包含:
[0385]
(i)相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0386]
(ii)相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0387]
(iii)相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述。
[0388]
1099.如前述实施例中任一项所述的分离的核酸组合物,其中所述orf1分子包含前述实施例中任一项所述的多肽。
[0389]
1100.如前述实施例中任一项所述的分离的核酸组合物,其包含具有至少80%的
gc含量的至少20、25、30、31、32、33、34、35或36个连续核苷酸。
[0390]
1101.如前述实施例中任一项所述的分离的核酸组合物,其包含具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的至少36个连续核苷酸。
[0391]
1102.如前述实施例中任一项所述的分离的核酸组合物,其包含具有至少80%的gc含量的至少36个连续核苷酸。
[0392]
1103.如前述实施例中任一项所述的分离的核酸组合物,其进一步包含以下中的一种或多种:启动子元件、编码效应子(例如外源性效应子或内源性效应子)的核酸序列和/或蛋白质结合序列(例如,外部蛋白质结合序列)。
[0393]
1104.如前述实施例中任一项所述的分离的核酸组合物,其包含野生型指环病毒基因组序列的至少约100、150、200、250、300、350、400、450或500个连续核苷酸或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[0394]
1105.一种分离的核酸分子(例如,表达载体),其包含与以下核酸序列具有至少95%(例如,至少95%、96%、97%、98%、99%或100%)序列同一性的核酸序列:
[0395]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0396]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0397]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0398]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0399]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0400]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0401]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0402]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0403]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0404]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172)。
[0405]
1106.如前述实施例中任一项所述的分离的核酸组合物,其中所述分离的核酸分子是环状的。
[0406]
1107.一种分离的细胞,其包含:
[0407]
(a)编码如前述实施例中任一项所述的多肽的核酸,其中所述核酸是质粒、病毒核酸或整合到细胞染色体中,和
[0408]
(b)遗传元件,其中所述遗传元件包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),以及蛋白质结合序列,其中任选地所述遗传元件不编码orf1多肽(例如,orf1蛋白)。
[0409]
1108.一种分离的细胞,例如宿主细胞,所述分离的细胞包含:
[0410]
(a)编码orf1分子的核酸,其中所述核酸是质粒、病毒核酸或整合到细胞染色体中,和
[0411]
(b)遗传元件,其中遗传元件包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列。
[0412]
1109.一种分离的细胞,例如宿主细胞,所述分离的细胞包含:
[0413]
(a)编码orf1分子的核酸(例如,其中所述核酸是质粒、病毒核酸或整合到细胞染色体中),和
[0414]
(b)不编码orf1分子的遗传元件,其中所述遗传元件包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列。
[0415]
1109a.一种分离的细胞,例如宿主细胞,所述分离的细胞包含:
[0416]
(i)一种核酸分子(例如,第一核酸分子),其包含如本文所述的指环体的遗传元件(例如,不编码orf1分子的遗传元件)的核酸序列,和
[0417]
(ii)任选地,核酸分子,例如第二核酸分子,所述第二核酸分子编码以下中的一种或多种:选自orf1、orf2、orf2/2、orf2/3、orf1/1或orf1/2的氨基酸序列(例如,如表16中任一个中所列),或与其具有至少70%(例如,至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列。
[0418]
1110.如前述实施例中任一项所述的分离的细胞,其中不编码orf1分子的遗传元件编码orf1分子的片段,例如不形成衣壳的片段,例如少于1000、900、800、700、600、500、400、300、200、100、50、20或10个核苷酸的片段。
[0419]
1111.一种分离的细胞,例如宿主细胞,所述分离的细胞包含编码orf1分子的核酸(例如,其中所述核酸是质粒,是病毒核酸,或者整合到细胞染色体中),其中所述分离的细胞不包含orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3分子中的一种或多种。
[0420]
1112.一种分离的细胞,例如宿主细胞,所述分离的细胞包含如前述实施例中任一项所述的核酸组合物。
[0421]
1113.一种编码orf1分子的辅助核酸(例如,质粒或病毒核酸),其中所述分离的细胞不包含orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3分子中的一种或多种。
[0422]
1114.一种组合物,所述组合物包含:
[0423]
(a)本文所述的分离的细胞,和
[0424]
(b)本文所述的指环体。
[0425]
1115.一种组合物,所述组合物包含:
[0426]
(a)细胞,其编码orf1分子的核酸(例如,其中所述核酸是质粒、病毒核酸或整合到细胞染色体中),和
[0427]
(b)不编码orf1分子的遗传元件(例如,在细胞内或在细胞外,例如细胞培养基中),其中所述遗传元件包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列。
[0428]
1116.一种药物组合物,其包含如前述实施例中任一项所述的多肽、复合物、指环体或分离的核酸以及药学上可接受的载剂和/或赋形剂。
[0429]
1117.一种制造orf1分子的方法,所述方法包括:
[0430]
(a)提供包含编码如前述实施例中任一项所述的多肽的核酸的宿主细胞(例如,本文所述的宿主细胞),并且
[0431]
(b)将所述宿主细胞维持在允许细胞生产所述多肽的条件下;
[0432]
从而制造所述orf1分子。
[0433]
1118.一种制造orf1分子的方法,所述方法包括:
[0434]
(a)提供包含如前述实施例中任一项所述的核酸组合物的宿主细胞(例如,本文所述的宿主细胞),并且
[0435]
(b)将所述宿主细胞维持在允许细胞生产所述多肽的条件下;
[0436]
从而制造所述orf1分子。
[0437]
1119.如实施例1117或1118所述的方法,其中所述宿主细胞是辅助细胞。
[0438]
1120.如实施例1119所述的方法,其中所述辅助细胞包含一种或多种另外的编码一种或多种另外的orf(例如,orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3)的野生型指环病毒,例如,如本文所述。
[0439]
1121.如实施例1117

1120中任一项所述的方法,其中所述核酸整合到所述宿主细胞的基因组中。
[0440]
1122.如实施例1117

1121中任一项所述的方法,其中所述宿主细胞产生至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500、1000、10,000、50,000、100,000、500,000或1,000,000个拷贝(例如至少约60个拷贝)的所述多肽/宿主细胞。
[0441]
1123.如实施例1117

1122中任一项所述的方法,其中所述宿主细胞产生至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、1000、10,000或100,000个拷贝(例如至少约60个拷贝)的所述多肽/由所述宿主细胞产生的指环体。
[0442]
1124.如实施例1117

1123中任一项所述的方法,其中所述方法包括提供多个宿主细胞,并将所述宿主细胞维持在允许产生至少1000个拷贝的所述多肽/细胞的条件下。
[0443]
1125.如实施例1124所述的方法,其中所述多个宿主细胞产生至少约1
×
105、1
×
106、1
×
107、1
×
108、9
×
108、1
×
109、1
×
10
10
、1
×
10
11
或1
×
10
12
个拷贝的所述多肽。
[0444]
1126.一种制备指环体组合物的方法,所述方法包括:
[0445]
(a)提供辅助细胞,例如本文所述的辅助细胞;
[0446]
(b)在允许细胞生产指环体的条件下将遗传元件引入所述辅助细胞,并且
[0447]
(c)配制所述指环体,例如,作为适合施用给受试者的药物组合物,从而制备所述指环体组合物。
[0448]
1127.一种制备指环体组合物的方法,所述方法包括:
[0449]
(a)提供宿主细胞;
[0450]
(b)将辅助核酸引入所述宿主细胞;
[0451]
(c)在允许细胞生产指环体的条件下将遗传元件引入所述宿主细胞(例如,在(b)之前、之后或与其同时);并且
[0452]
(d)配制所述指环体,例如,作为适合施用给受试者的药物组合物;
[0453]
从而制备所述指环体组合物。
[0454]
1128.一种制备指环体组合物的方法,所述方法包括:
[0455]
(a)提供辅助细胞,其包含编码orf1分子的核酸(例如,其中所述核酸是质粒、病毒核酸或整合到辅助细胞染色体中);
[0456]
(b)在允许细胞生产指环体的条件下将遗传元件引入所述辅助细胞,其中所述遗传元件不编码orf1分子,其中所述遗传元件包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列;并且
[0457]
(c)配制所述指环体,例如,作为适合施用给受试者的药物组合物;
[0458]
从而制备所述指环体组合物。
[0459]
1129.一种制备指环体组合物的方法,所述方法包括:
[0460]
(a)提供宿主细胞;
[0461]
(b)将编码orf1分子的辅助核酸(例如,其中所述核酸是质粒或病毒核酸)引入所述宿主细胞中;并且
[0462]
(c)在允许细胞生产指环体的条件下将遗传元件引入所述宿主细胞(例如,在(b)之前、之后或与其同时),其中所述遗传元件包不编码orf1分子,其中所述遗传元件包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列,
[0463]
从而制备所述指环体。
[0464]
1130.如前述实施例中任一项所述的方法,所述方法进一步包括将所述指环体与所述辅助细胞或宿主细胞分离。
[0465]
1131.如前述实施例中任一项所述的方法,其中提供辅助细胞包括将辅助核酸引入所述宿主细胞,例如,其中所述辅助核酸编码orf1分子(例如,其中所述核酸是质粒或病毒核酸)。
[0466]
1132.如前述实施例中任一项所述的方法,其中所述辅助细胞包含所述orf1分子。
[0467]
1133.如前述实施例中任一项所述的方法,其中所述核酸包含以下中的一种或多种:tata盒、起始元件、帽位点、转录起始位点、5’utr保守结构域、orf1编码序列、orf1/1编码序列、orf1/2编码序列、orf2编码序列、orf2/2编码序列、orf2/3编码序列、orf2/3t编码序列、三开放阅读框区域、聚(a)信号和/或来自本文所述的指环病毒的gc富集区(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列),或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[0468]
1134.如前述实施例中任一项所述的方法,其中所述核酸包含指环病毒基因组序列(例如,如本文所述,例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列),或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[0469]
1135.如前述实施例中任一项所述的方法,其中所述核酸包含指环病毒基因组序列的至少一个另外拷贝或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列(例如,总共1、2、3、4、5或6个拷贝)。
[0470]
1136.如前述实施例中任一项所述的方法,其中所述宿主细胞或辅助细胞包含所述核酸的至少一个另外拷贝(例如,总共1、2、3、4、5或6个拷贝)。
[0471]
1137.如前述实施例中任一项所述的方法,其中所述核酸是环状的。
[0472]
1137a.一种制备指环体,例如合成的指环体的方法,所述方法包括:
[0473]
a)提供宿主细胞,其包含:
[0474]
(i)核酸分子,例如第一核酸分子,其包含如本文所述的指环体,例如合成的指环体的遗传元件的核酸序列,和
[0475]
(ii)核酸分子,例如第二核酸分子,所述第二核酸分子编码以下中的一种或多种:选自orf1、orf2、orf2/2、orf2/3、orf1/1或orf1/2的氨基酸序列(例如,如表16中任一个中所列),或与其具有至少70%(例如,至少70%、75%、80%、85%、90%、95%、96%、97%、
98%、99%或100%)序列同一性的氨基酸序列;并且
[0476]
b)在适合于制备指环体的条件下培养所述宿主细胞。
[0477]
1137b.如实施例1137a所述的方法,所述方法进一步包括,在步骤(a)之前,将所述第一核酸分子和/或所述第二核酸分子引入所述宿主细胞。
[0478]
1137c.如实施例1137a或1137b所述的方法,其中所述第二核酸分子在所述第一核酸分子之前、与其同时或在其之后被引入所述宿主细胞。
[0479]
1137d.如实施例1137c所述的方法,其中所述第二核酸分子被整合到所述宿主细胞的基因组中。
[0480]
1137e.如实施例1137c所述的方法,其中所述第二核酸分子是辅助(例如辅助质粒或辅助病毒的基因组)。
[0481]
1137f.如实施例1137a

1137e中任一项所述的方法,其中所述第一核酸包含以下中的一种或多种:tata盒、起始元件、帽位点、转录起始位点、5’utr保守结构域和/或来自本文所述的指环病毒的gc富集区(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列),或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[0482]
1138.一种向受试者递送效应子的方法,所述方法包括向所述受试者施用包含以下的指环体:
[0483]
(a)包含orf1分子的蛋白质外部;
[0484]
(b)遗传元件,其包含启动子元件和编码所述效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和含有以下核酸序列的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸的区域:
[0485]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0486]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0487]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0488]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0489]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0490]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0491]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0492]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0493]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0494]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0495]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列;并且
[0496]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0497]
任选地,其中所述遗传元件:
[0498]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0499]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例
如,如本文所述;和/或
[0500]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述,
[0501]
从而将所述效应子递送给受试者。
[0502]
1139.一种向受试者递送效应子的方法,所述方法包括向所述受试者施用包含以下的指环体:
[0503]
(a)包含orf1分子的蛋白质外部;
[0504]
(b)遗传元件,其包含启动子元件,编码所述效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和含有具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的序列的至少20、25、30、31、32、33、34、35或36个连续核苷酸;
[0505]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0506]
任选地,其中所述遗传元件:
[0507]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0508]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0509]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述,
[0510]
从而将所述效应子递送给受试者。
[0511]
1140.一种向受试者递送效应子的方法,所述方法包括向所述受试者施用包含以下的指环体:
[0512]
(a)包含orf1分子的蛋白质外部;
[0513]
(b)遗传元件,其包含启动子元件和编码所述效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列;
[0514]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0515]
任选地,其中所述遗传元件:
[0516]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0517]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0518]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述,
[0519]
从而将所述效应子递送给受试者。
[0520]
1141.一种将效应子递送至靶细胞的方法,所述非包括使所述靶细胞与指环体接触,所述指环体包含:
[0521]
(a)包含orf1分子的蛋白质外部;
[0522]
(b)遗传元件,其包含启动子元件和编码所述效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和含有以下核酸序列的至少10、15、20、25、30、31、32、
33、34、35或36个连续核苷酸的区域:
[0523]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0524]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0525]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0526]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0527]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0528]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0529]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0530]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0531]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0532]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0533]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列;并且
[0534]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0535]
任选地,其中所述遗传元件:
[0536]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0537]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0538]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述,
[0539]
从而将所述效应子递送至所述靶细胞。
[0540]
1142.一种将效应子递送至靶细胞的方法,所述非包括使所述靶细胞与指环体接触,所述指环体包含:
[0541]
(a)包含orf1分子的蛋白质外部;
[0542]
(b)遗传元件,其包含启动子元件,编码所述效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和含有具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的序列的至少20、25、30、31、32、33、34、35或36个连续核苷酸;
[0543]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0544]
任选地,其中所述遗传元件:
[0545]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0546]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0547]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述,
[0548]
从而将所述效应子递送至所述靶细胞。
[0549]
1143.一种将效应子递送至靶细胞的方法,所述非包括使所述靶细胞与指环体接触,所述指环体包含:
[0550]
(a)包含orf1分子的蛋白质外部;
[0551]
(b)遗传元件,其包含启动子元件和编码所述效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列;
[0552]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0553]
任选地,其中所述遗传元件:
[0554]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0555]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0556]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述,
[0557]
从而将所述效应子递送至所述靶细胞。
[0558]
1143a.一种将效应子递送至靶细胞的方法,所述非包括使所述靶细胞与指环体接触,所述指环体包含:
[0559]
(i)遗传元件,其包含启动子元件和编码治疗性外源性效应子的核酸序列,其中所述遗传元件包含与来自本文所述的指环病毒(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列)的5’utr核苷酸序列具有至少95%序列同一性的序列;和/或
[0560]
(ii)蛋白质外部,其包含与本文所述的指环病毒(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列)的orf1基因编码的多肽具有至少95%序列同一性的多肽;
[0561]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0562]
任选地,其中所述遗传元件:
[0563]
(i)不包含相对于野生型ttv

tth8基因组序列的核苷酸3436至3607的缺失,例如,如本文所述;
[0564]
(ii)不包含相对于野生型ttmv

ly2基因组序列的核苷酸1432至2210的缺失,例如,如本文所述;和/或
[0565]
(iii)不包含相对于野生型ttmv

ly2基因组序列的至少101个核苷酸的缺失,例如,如本文所述,
[0566]
从而将所述效应子递送至所述靶细胞。
[0567]
1144.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件不编码ncbi登录号a7xce8.1的氨基酸序列。
[0568]
1145.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述orf1分子包含与表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的orf1序列具有至少70%(例如至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列。
[0569]
1146.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组
合物或方法,其中所述orf1分子的至少30%(例如至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、90%或更多)的氨基酸是β

折叠的一部分。
[0570]
1147.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述orf1分子的二级结构包含至少三(例如至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20)个β

折叠。
[0571]
1148.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述orf1分子的二级结构包含β

折叠与α

螺旋的比例为至少1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。
[0572]
1149.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述orf1分子包含精氨酸富集区(例如,与表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的精氨酸富集区序列具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性)。
[0573]
1150.如实施例1149所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述精氨酸富集区包含至少15、20、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45或50个连续核苷酸,所述连续核苷酸包含至少40%(例如至少40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、55%、60%、65%、66%、67%、68%、69%、70%、75%、80%、85%、90%或95%)精氨酸残基。
[0574]
1151.如实施例1149或1150所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述精氨酸富集区位于所述orf1分子的n末端或c末端。
[0575]
1152.如1149

1151中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述精氨酸富集区与氨基酸序列
[0576]
tvvrrrgrsprrrtpsprrrrsqsprrrrsqsresqc(seq id no:808)、rrryarpyrrrhirryrrrrrhfrrrr(seq id no:809)、mpyyyrrrrynyrrprwygrgwirrpfrrrfrrkrrvr(seq id no:216)或
[0577]
mawgwwkrrrrwwfrkrwtrgrlrrrwprsarrrprrrrvrrrrrwrrgrrktrtyrrrrrfrrrgrk(seq id no:186)具有至少70%(例如,至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)序列同一性。
[0578]
1153.如1149

1152中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述精氨酸富集区与表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的精氨酸富集区序列具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性。
[0579]
1154.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述orf1分子包含胶冻卷结构域,例如与本文所述orf1分子的胶冻卷结构域的氨基酸序列具有至少30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性,例如,具有氨基酸序列ptyttiplkqwqppykrtcyikgqdcliyysnlrlgmnstmyeksivpvhwpgggsfsvsmltldalydihklcrnwwtstnqdlplvrykgckitfyqstftdyivrihtelpansnkltypnthplmmmmskykhiipsrqtrrkkkpytkifvkpppqfenkwyfatdlykipllqihctacnlqnpfvkpdklsnnvtlwslnt(seq id no:217)的胶冻卷结构域,或表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个
中所列的胶冻卷结构域序列。
[0580]
1155.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述orf1分子包含n22结构域,例如与本文所述orf1分子的n22结构域的氨基酸序列具有30%(例如至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性,例如,具有氨基酸序列tmaltpfnepiftqiqynpdrdtgedtqlyllsnatgtgwdppgipelilegfplwliywgfadfqknlkkvtnidtnymlvaktkftqkpgtfylvilndtfvegnspyekqplpednikwypqvqyqleaqnkllqtgpftpniqgqlsdnismfykfyfk(seq id no:219)的n22结构域,或表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的n22结构域序列。
[0581]
1156.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述orf1分子定位于所述细胞的核。
[0582]
1157.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型指环病毒基因组序列的约500、1000、1100、1200、1210或1219个连续核苷酸包含不超过50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[0583]
1158.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型指甲型细环病毒(甲型细环病毒)(例如甲型细环病毒的进化分枝1、2或3)基因组序列的约500、1000、1500、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3450、3460、3470、3480、3490、3500、3510、3520、3530、3540、3550、3560、3570或3580个连续核苷酸包含不超过50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[0584]
1159.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型乙型细环病毒(betatorquevirus)基因组序列的约500、1000、1100、1200、1210或1219个连续核苷酸包含不超过50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[0585]
1160.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型丙型细环病毒(gammatorquevirus)基因组序列的约500、1000、1500、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3120、3130、3140、3141或3142个连续核苷酸包含不超过50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[0586]
1161.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型甲型细环病毒(例如甲型细环病毒的进化分枝1、2或3)基因组序列的至少约500,1000,1500,2000,2100,2200,2300,2400,2500,2600,2700,2800,2900,3000,3100,3200,3300,3400,3450,3460,3470,3480,3490,3500,3510,3520、3530、3540、3550、3560、3570或3580个连续核苷酸(例如,约500

3580、1000

3580、1500

3580、2000

3580或3000

3580个连续核苷酸)包含至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[0587]
1162.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型乙型细环病毒基因组序列的至少约500、1000、1100、1200、1210或1219个连续核苷酸(例如,约500

1000、500

1100、500

1200、500

1219、1000

1100、1000

1200或1000

1219个连续核苷酸)包含至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[0588]
1163.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型丙型细环病毒基因组序列的至少约500、1000、1500、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3120、3130、3140、3141或3142个连续核苷酸(例如,约500

3142、1000

3142、1500

3142、2000

3142或2500

3142个连续核苷酸)包含至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[0589]
1164.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型ttmv

ly2基因组序列的约500、1000、1100、1200、1210或1219个连续核苷酸包含不超过50%、60%、70%、80%、90%、95%、96%、97%、98%或99%序列同一性。
[0590]
1165.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型ttv

tth8基因组序列的约500、1000、1500、2000,2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3550、3560、3570、3580或3581个连续核苷酸包含不超过50%、60%、70%、80%、90%、95%、96%、97%、98%或99%序列同一性。
[0591]
1166.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型指环病毒基因组序列包含至少1578、1579、1580、1590、1600、1650、1700、1750或2000个核苷酸的缺失。
[0592]
1167.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型指环病毒基因组序列包含1至99、1至90、1至80、1至70、1至60、1至50、10至99、10至90、10至80、10至70、10至60、10至50、20至99、20至90、20至80、20至70、20至60、20至50、30至99、30至90、30至80、30至70、30至60、30至50、40至99、40至90、40至80、40至70、40至60、或40至50个核苷酸的缺失。
[0593]
1168.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子相对于例如如本文所述的野生型指环病毒基因组序列不具有100个核苷酸缺失、172个核苷酸缺失或1577个核苷酸。
[0594]
1169.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含相对于例如如本文所述的野生型指环病毒基因组序列的三个或更多个缺失。
[0595]
1170.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含与以下核酸序列具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%或100%)序列同一性的区域:
[0596]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0597]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0598]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0599]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0600]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0601]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0602]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0603]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0604]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0605]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172)。
[0606]
1171.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含与以下核酸序列具有至少95%(例如,至少95%、96%、97%、98%、99%或100%)序列同一性的区域:
[0607]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0608]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0609]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0610]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0611]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0612]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0613]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0614]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0615]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0616]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172)。
[0617]
1172.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含与核酸序列
[0618]
ccgccatcttaagtagttgaggcggacggtggcgtgagttcaaaggtc accatcagccacacctactcaaaatggtgg(seq id no:161)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的区域。
[0619]
1173.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含与核酸序列
[0620]
cttaagtagttgaggcggacggtggcgtgagttcaaaggtcaccatcagccacacctactcaaaatggtggacaatttcttccgggtcaaaggttacagccgccatgttaaaacacgtgacgtatgacgtcacggccgccattttgtgacacaagatggccgacttccttcc(seq id no:162)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的区域。
[0621]
1174.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含具有至少80%的gc含量的至少20、25、30、31、32、33、34、35或36个连续核苷酸。
[0622]
1175.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的至少36个连续核苷酸。
[0623]
1176.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含具有至少80%的gc含量的至少36个连续核苷酸。
[0624]
1177.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其进一步包含编码例如如本文所述的指环病毒,例如野生型指环病毒的orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3的核酸序列。
[0625]
1178.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述启动子元件、编码所述效应子的核酸序列或蛋白质结合序列对应地与表a1

a12、b1

b5、c1

c5或1

18中的任一个中的指环病毒的启动子元件、编码效应子的核酸序列或蛋白质结合序列具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性。
[0626]
1179.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含相对于编码所述效应子的核酸序列位于3’的包装区域。
[0627]
1180.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含相对于编码所述效应子的核酸序列位于5’的包装区域。
[0628]
1181.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含编码指环病毒蛋白的核酸序列,所述指环病毒蛋白与本文所述的指环病毒的orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3的氨基酸序列具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性。
[0629]
1182.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含单链dna。
[0630]
1183.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子是环状的和/或少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%、或2%的频率整合到真核细胞的基因组中。
[0631]
1184.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸与野生型指环病毒序列(例如,野生型细环病毒(ttv)、细环微小病毒(ttmv)或ttmdv序列,例如野生型指环病毒序列,例如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列),或其由约50、60、70、80、
90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900或3000个连续核苷酸组成的部分具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性。
[0632]
1185.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述蛋白质结合序列表20中所示的共有5’utr序列具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性。
[0633]
1186.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述蛋白质结合序列与表21中所示的共有富gc序列具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性。
[0634]
1187.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述蛋白质结合序列与表38中所示的5’utr序列和表39中所示的富gc序列具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性。
[0635]
1188.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含与表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中的核酸序列的指环病毒5’utr保守结构域具有至少85%序列同一性的序列。
[0636]
1189.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件或分离的核酸分子包含与表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中的核酸序列的指环病毒富gc区域具有至少85%序列同一性的序列。
[0637]
1190.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述启动子元件包括rna聚合酶ii依赖性启动子、rna聚合酶iii依赖性启动子、pgk启动子、cmv启动子、ef

1α启动子、sv40启动子、cagg启动子或ubc启动子、ttv病毒启动子、组织特异性u6(polliii)、具有激活蛋白(tetr

vp16、gal4

vp16、dcas9

vp16等)的上游dna结合位点的最小cmv启动子。
[0638]
1191.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述效应子编码治疗剂,例如治疗性肽或多肽或治疗性核酸。
[0639]
1192.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述效应子包含调节性核酸,例如,mirna、sirna、mrna、lncrna、rna、dna、反义rna、grna;荧光标签或标记、抗原、肽、天然生物活性肽的合成或类似物肽、激动剂或拮抗剂肽、抗微生物肽、成孔肽、双环肽、靶向或细胞毒性肽、降解或自毁肽、小分子、免疫效应子(例如,影响对免疫应答/信号的敏感性)、死亡蛋白(例如,凋亡或坏死的诱导物)、肿瘤的非裂解性抑制剂(例如,癌蛋白抑制剂)、表观遗传修饰剂、表观遗传酶、转录因子、dna或蛋白质修饰酶、dna嵌入剂、外排泵抑制剂、核受体激活剂或抑制剂、蛋白酶体抑制剂、酶的竞
争性抑制剂、蛋白质合成效应子或抑制剂、核酸酶、蛋白质片段或结构域、配体、抗体、受体或crispr系统或组分。
[0640]
1193.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述指环体能够自主复制。
[0641]
1194.如前述实施例中任一项的分离的核酸分子,其中所述表达载体选自由以下组成的组:质粒、粘粒、人工染色体、噬菌体和病毒。
[0642]
1195.一种分离的细胞,所述分离的细胞包含如前述实施例中任一项所述的分离的核酸或指环体。
[0643]
1196.如实施例195所述的分离的细胞,所述分离的细胞进一步包含例如如本文所述的例如野生型指环病毒的orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3。
[0644]
1197.一种向受试者递送效应子的方法,所述方法包括向所述受试者施用如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、分离的细胞或组合物;其中所述遗传元件或分离的核酸分子编码效应子,并且其中所述效应子在所述受试者中表达。
[0645]
1198.一种治疗有需要的受试者的疾病或障碍的方法,所述方法包括向所述受试者施用如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、分离的细胞或组合物;其中所述遗传元件或分离的核酸分子编码治疗剂,并且其中所述治疗剂在所述受试者中表达。
[0646]
1199.一种将效应子递送至离体细胞或细胞群(例如,从受试者获得的细胞或细胞群)的方法,所述方法包括向所述细胞或细胞群引入如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、分离的细胞或组合物;其中所述遗传元件或分离的核酸分子编码效应子,并且其中所述效应子在所述细胞或细胞群中表达。
[0647]
1200.如前述实施例中任一项所述的指环体,其中所述遗传元件是单链dna,并且具有以下特性中的一种或两种:呈环状和/或以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合到真核细胞的基因组中。
[0648]
1201.如前述实施例中任一项所述的指环体,其中所述遗传元件与野生型指环病毒序列(例如,野生型细环病毒(ttv)、细小环病毒(ttmv)或ttmdv序列,例如野生型指环病毒序列,例如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中任一个所列)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性。
[0649]
1202.如前述实施例中任一项所述的指环体,其中所述蛋白质结合序列与表38中所示的共有5’utr序列,或与表39中所示的共有富gc序列,或与表38中所示的共有5’utr序列和表39中所示的共有富gc序列具有至少75%(例如至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性。
[0650]
1203.如前述实施例中任一项所述的指环体,其中所述启动子元件包括rna聚合酶ii依赖性启动子、rna聚合酶iii依赖性启动子、pgk启动子、cmv启动子、ef

1α启动子、sv40启动子、cagg启动子或ubc启动子、ttv病毒启动子、组织特异性u6(polliii)、具有激活蛋白(tetr

vp16、gal4

vp16、dcas9

vp16等)的上游dna结合位点的最小cmv启动子。
[0651]
1204.如前述实施例中任一项所述的指环体,其中所述启动子元件包含tata盒。
[0652]
1205.如前述实施例中任一项所述的指环体,其中所述启动子元件对于野生型指环病毒,例如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、6、9、11、13、15或17中的任一个中所列的野生型指环病毒序列是内源性的。
[0653]
1206.如前述实施例中任一项所述的指环体,其中所述启动子元件对于野生型指环病毒,例如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、6、9、11、13、15或17中的任一个中所列的野生型指环病毒序列是外源性的。
[0654]
1207.如前述实施例中任一项所述的指环体,其中所述效应子编码治疗剂,例如治疗性肽或多肽或治疗性核酸。
[0655]
1208.如前述实施例中任一项所述的指环体,其中所述效应子包含调节性核酸,例如,mirna、sirna、mrna、lncrna、rna、dna、反义rna、grna;荧光标签或标记、抗原、肽、天然生物活性肽的合成或类似物肽、激动剂或拮抗剂肽、抗微生物肽、成孔肽、双环肽、靶向或细胞毒性肽、降解或自毁肽、小分子、免疫效应子(例如,影响对免疫应答/信号的敏感性)、死亡蛋白(例如,凋亡或坏死的诱导物)、肿瘤的非裂解性抑制剂(例如,癌蛋白抑制剂)、表观遗传修饰剂、表观遗传酶、转录因子、dna或蛋白质修饰酶、dna嵌入剂、外排泵抑制剂、核受体激活剂或抑制剂、蛋白酶体抑制剂、酶的竞争性抑制剂、蛋白质合成效应子或抑制剂、核酸酶、蛋白质片段或结构域、配体、抗体、受体或crispr系统或组分。
[0656]
1209.如前述实施例中任一项所述的指环体,其中所述效应子包含mirna。
[0657]
1210.如前述实施例中任一项所述的指环体,其中所述效应子例如mirna靶向宿主基因,例如调节基因的表达,例如增加或减少基因的表达。
[0658]
1211.如前述实施例中任一项所述的指环体,其中所述效应子包含mirna,并降低宿主基因的表达。
[0659]
1212.如前述实施例中任一项所述的指环体,其中所述效应子包含长度为约20

200、30

180、40

160、50

140或60

120个核苷酸的核酸序列。
[0660]
1213.如前述实施例中任一项所述的指环体,其中编码所述效应子的核酸序列的长度为约20

200、30

180、40

160、50

140或60

120个核苷酸。
[0661]
1214.如前述实施例中任一项所述的指环体,其中编码所述效应子的序列的大小为至少约100个核苷酸。
[0662]
1215.如前述实施例中任一项所述的指环体,其中编码所述效应子的序列的大小为约100至约5000个核苷酸。
[0663]
1216.如前述实施例中任一项所述的指环体,其中编码所述效应子的序列的大小为约100

200、200

300、300

400、400

500、500

600、600

700、700

800、800

900、900

1000、1000

1500或1500

2000个核苷酸。
[0664]
1217.如前述实施例中任一项所述的指环体,其中编码所述效应子的序列位于orf1基因座(例如,orf1基因座的c末端)、mirna基因座、tata盒上游的5'非编码区、5'utr、聚a区下游的3'非编码区、或所述遗传元件的gc富集区上游的非编码区中一个或多个处、之内或附近(例如,5’或3’)。
[0665]
1218.如实施例1217所述的指环体,其中编码所述效应子的序列位于所述遗传元件的聚a区和gc富集区之间。
[0666]
1219.如前述实施例中任一项所述的指环体,其中所述蛋白质结合序列包含与野生型指环病毒(例如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、6、9、11、13、15或17中任一个所列的野生型指环病毒序列)的5'utr保守结构域或gc富集结构域具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的核酸序列。
[0667]
1220.如前述实施例中任一项所述的指环体,其中所述遗传元件(例如所述遗传元件的蛋白质结合序列)与以下具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性:
[0668]
(i)表38中所示的共有5'utr核酸序列;
[0669]
(ii)表38中所示的示例性ttv 5’utr核酸序列;
[0670]
(iii)表38所示的ttv

ct30f 5'utr核酸序列;
[0671]
(iv)表38所示的ttv

hd23a 5'utr核酸序列;
[0672]
(v)表38中所示的ttv

ja20 5'utr核酸序列;
[0673]
(vi)表38所示的ttv

tjn02 5'utr核酸序列;
[0674]
(vii)表38所示的ttv

tth8 5'utr核酸序列;
[0675]
(viii)表39所示的共有gc富集区;
[0676]
(ix)表39中所示的示例性ttv gc富集区;
[0677]
(x)表39中所示的ttv

ct30f gc富集区;
[0678]
(xi)表39中所示的ttv

ja20 gc富集区;
[0679]
(xii)表39中所示的ttv

tjn02 gc富集区;
[0680]
(xiii)表39中所示的ttv

hd23a gc富集区;或
[0681]
(xiv)表39中所示的ttv

tth8 gc富集区。
[0682]
1221.如前述实施例中任一项所述的指环体,其中所述蛋白质外部包含能够与蛋白质结合序列特异性结合的外部蛋白质。
[0683]
1222.如前述实施例中任一项所述的指环体,其中所述蛋白质外部包含以下一种或多种:一个或多个糖基化蛋白、亲水性dna结合区、精苏氨酸富集区、谷氨酰胺富集区、n末端聚精氨酸序列、可变区、c末端聚谷氨酰胺/谷氨酸序列、以及一个或多个二硫键。
[0684]
1223.如前述实施例中任一项所述的指环体,其中所述蛋白质外部包含以下一种或多种特征:二十面体对称、识别和/或结合与一个或多个宿主细胞分子相互作用以介导进入宿主细胞的分子、缺乏脂质分子、缺乏碳水化合物、ph和温度稳定、耐洗涤剂、以及在宿主中基本上是非免疫原性的或基本上是非致病性的。
[0685]
1224.如前述实施例中任一项所述的指环体,其中所述蛋白质外部包含至少一个提供一个或多个功能的功能结构域,所述功能是例如,物种和/或组织和/或细胞选择性、遗传元件结合和/或包装、免疫逃逸(基本上非免疫原性的和/或耐受性)、药代动力学、内吞作用和/或细胞附着、核进入、细胞内调节和定位、胞吐作用调节、繁殖和核酸保护。
[0686]
1225.如前述实施例中任一项所述的指环体,其中除所述效应子之外的遗传元件部分的组合大小为约2.5kb

5kb(例如,约2.8kb

4kb、约2.8kb

3.2kb、约3.6kb

3.9kb或约2.8kb

2.9kb)、小于约5kb(例如,小于约2.9kb、3.2kb、3.6kb、3.9kb或4kb)或至少100个核苷酸(例如,至少1kb)。
[0687]
1226.如前述实施例中任一项所述的指环体,其中所述遗传元件是单链的。
[0688]
1227.如前述实施例中任一项所述的指环体,其中所述遗传元件是环状的。
[0689]
1228.如前述实施例中任一项所述的指环体,其中所述遗传元件是dna。
[0690]
1229.如前述实施例中任一项所述的指环体,其中所述遗传元件是负链dna。
[0691]
1230.如前述实施例中任一项所述的指环体,其中所述遗传元件包括附加体。
[0692]
1231.如前述实施例中任一项所述的指环体,其中所述指环体的脂质含量按重量计小于10%、5%、2%或1%,例如不包含脂质双层。
[0693]
1232.如前述实施例中任一项所述的指环体,其中相对于包含外部脂质双层的病毒颗粒例如逆转录病毒,所述指环体抵抗被洗涤剂降解(例如,温和洗涤剂,例如,胆盐,例如脱氧胆酸钠)。
[0694]
1233.如实施例1232所述的指环体,其中至少约50%(例如,至少约50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%)的指环体在37℃下与洗涤剂(例如,按重量计0.5%的洗涤剂)孵育30分钟后不会被降解。
[0695]
1234.如前述实施例中任一项所述的指环体,其中所述遗传元件包括相对于野生型指环病毒序列,例如野生型ttv序列或野生型ttmv序列的至少一个元件的缺失,例如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列的元件。
[0696]
1235.如实施例1234所述的指环体,其中所述遗传元件包含缺失,所述缺失包含对应于以下的核酸序列:
[0697]
(i)ttv

tth8序列的核苷酸3436

3607,例如表5中所示的核酸序列;
[0698]
(ii)ttmv

ly2序列的核苷酸574

1371和/或核苷酸1432

2210,例如表15中所示的核酸序列;
[0699]
(iii)ttmv

ly2序列的核苷酸1372

1431,例如表15中所示的核酸序列;或
[0700]
(iv)ttmv

ly2序列的核苷酸2610

2809,例如表15中所示的核酸序列。
[0701]
1236.如前述实施例中任一项所述的指环体,其中所述遗传元件包括野生型指环病毒序列(例如,野生型细环病毒(ttv)、细小环病毒(ttmv)或ttmdv序列,例如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中任一个所列的序列)的至少72个核苷酸(例如至少73、74、75等个核苷酸,任选地小于基因组的全长)。
[0702]
1237.如前述实施例中任一项所述的指环体,其中所述遗传元件进一步包括以下序列中的一个或多个:编码一个或多个mirna的序列、编码一个或多个复制蛋白的序列、编码外源基因的序列、编码治疗剂序列的序列、调节性序列(例如启动子、增强子)、编码一个或多个靶向内源基因的调节性序列(sirna、lncrna、shrna)的序列、编码治疗性mrna或蛋白质的序列以及编码细胞溶解/细胞毒性rna或蛋白质的序列。
[0703]
1238.如前述实施例中任一项所述的指环体,其中所述指环体进一步包括第二遗传元件,例如封闭在所述蛋白质外部内的第二遗传元件。
[0704]
1239.如实施例1238所述的指环体,其中所述第二遗传元件包含蛋白质结合序列,例如外部蛋白质结合序列,例如包装信号,例如5’utr保守结构域或gc富集区,例如本文所述。
[0705]
1240.如前述实施例中任一项所述的指环体,其中所述指环体不能可检测地感染细菌细胞,例如感染少于1%、0.5%、0.1%或0.01%的细菌细胞。
[0706]
1241.如前述实施例中任一项所述的指环体,其中所述指环体能够例如在体外感染哺乳动物细胞,例如人细胞,例如免疫细胞、肝细胞、上皮细胞。
[0707]
1242.如前述实施例中任一项所述的指环体,其中所述遗传元件以少于进入细胞的指环体的10%、8%、6%、4%、3%、2%、1%、0.5%、0.2%、0.1%的频率整合,例如,其中所述指环体是非整合的。
[0708]
1243.如前述实施例中任一项所述的指环体,其中所述遗传元件能够复制(例如通过滚环复制),例如能够每个细胞产生至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、102、2x102、5x102、103、2x103、5x103或104个基因组当量的遗传元件,例如通过定量pcr测定法测定。
[0709]
1244.如前述实施例中任一项所述的指环体,其中所述遗传元件能够复制(例如通过滚环复制),例如与将所述遗传元件递送到细胞中之前的指环体中所存在量相比,能够在所述细胞中多产生至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、102、2x102、5x102、103、2x103、5x103或104个遗传元件的基因组当量,例如通过定量pcr测定法测定。
[0710]
1244a.如实施例1243或1244所述的指环体,其中相对于所述遗传元件以顺式和/或以反式提供所述蛋白质外部。
[0711]
1244b.如实施例1243

1244a中任一项所述的指环体,其中所述细胞中的辅助核酸(例如辅助病毒)编码所述蛋白质外部或其一部分(例如orf1分子)。
[0712]
1244c.如实施例1243

1244b中任一项所述的指环体,其中一种或多种复制因子(例如,复制酶)相对于所述遗传元件以顺式和/或反式提供。
[0713]
1244d.如实施例1244c所述的指环体,其中所述细胞中的辅助核酸(例如辅助病毒)编码所述一种或多种复制因子。
[0714]
1245.如前述实施例中任一项所述的指环体,其中所述遗传元件不能够复制,例如其中所述遗传元件在复制起点发生改变或缺乏复制起点。
[0715]
1246.如前述实施例中任一项所述的指环体,其中所述遗传元件不能够自我复制,例如在不整合到宿主细胞基因组中的情况下不能够复制。
[0716]
1247.如前述实施例中任一项所述的指环体,其中所述指环体基本上是非致病性的,例如,在受试者中不诱导可检测到的有害症状(例如,相对于未暴露于指环体的受试者,增加的细胞死亡或毒性)。
[0717]
1248.如前述实施例中任一项所述的指环体,其中所述指环体基本上是非免疫原性的,例如不诱导可检测的和/或不想要的免疫应答,例如根据实例4中所述的方法检测到的。
[0718]
1249.如实施例1248所述的指环体,其中所述基本上非免疫原性的指环体在受试者中具有缺乏免疫应答的参考受试者中效力的至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%的效力。
[0719]
1250.如实施例1248或1249所述的指环体,其中所述免疫应答包含一种或多种对所述指环体或其部分,或由其核酸编码的产物具有特异性的抗体;针对所述指环体或包含所述指环体的细胞的细胞应答(例如免疫效应细胞(例如,t细胞或nk细胞)应答);或巨噬细胞对所述指环体或包含所述指环体的细胞的吞噬。
[0720]
1251.如前述实施例中任一项所述的指环体,其中所述指环体的免疫原性低于
aav,例如如通过本文所述的测定法测定的引发的免疫应答低于同等量的aav所检测到的免疫应答,如通过本文所述的测定法测定的诱导的抗体流行率小于70%(例如小于约60%、50%、40%、30%、20%或10%抗体流行率),或者基本上是非免疫原性的。
[0721]
1252.如前述实施例中任一项所述的指环体,其中具有至少1000个所述指环体的群体能够递送至少约100个拷贝(例如,至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000个拷贝)的所述遗传元件进入所述真核细胞中的一个或多个。
[0722]
1253.如前述实施例中任一项所述的指环体,其中所述指环体的群体(例如,每个细胞至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000基因组当量的所述遗传元件)能够将所述遗传元件递送到所述真核细胞的群体的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多中,例如,其中所述真核细胞是hek293t细胞,如实例22所述。
[0723]
1254.如前述实施例中任一项所述的指环体,其中所述指环体的群体(例如,每个细胞至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000基因组当量的所述遗传元件)能够将每个细胞至少1、2、3、4、5、6、7、8、9、10、20、50、100、200、500、1000、2000、5000、8,000、1x104、1x105、1x106、1x107或更多个拷贝的所述遗传元件递送到所述真核细胞的群体中,例如,其中所述真核细胞是hek293t细胞,如实例22所述。
[0724]
1255.如前述实施例中任一项所述的指环体,其中所述指环体的群体(例如,每个细胞至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000基因组当量的所述遗传元件)能够将每个细胞1

3、1

4、1

5、1

6、1

7、1

8、1

9、1

10、5

10、10

20、20

50、50

100、100

1000、1000

104、1x104‑
1x105、1x104‑
1x106、1x104‑
1x107、1x105‑
1x106、1x105‑
1x107或1x106‑
1x107个拷贝的所述遗传元件递送到所述真核细胞的群体中,例如,其中所述真核细胞是hek293t细胞,如实例22所述。
[0725]
1256.如前述实施例中任一项所述的指环体,其中所述指环体在至少两次传代后而存在。
[0726]
1257.如前述实施例中任一项所述的指环体,其中所述指环体是通过包括至少两次传代的方法而产生的。
[0727]
1258.如前述实施例中任一项所述的指环体,其中所述指环体将所述效应子选择性地递送至期望的细胞类型、组织或器官(例如,骨髓、血液、心脏、gi、皮肤、视网膜中的光感受器、上皮衬里或胰腺)或在其中以更高的水平存在(例如,优选地在其中累积)。
[0728]
1259.如前述实施例中任一项所述的指环体,其中所述真核细胞是哺乳动物细胞,例如人细胞。
[0729]
1260.如前述实施例中任一项所述的指环体,其中所述指环体或其拷贝在递送到细胞中后24小时(例如1天、2天、3天、4天、5天、6天、1周、2周、3周、4周、30天或1个月)可在细胞中检测到。
[0730]
1261.如前述实施例中任一项所述的指环体,其中例如相对于感染细胞所用的指环体的量,在感染后3

4天后,例如,使用感染性测定法,例如根据实例7的测定法,所述指环体在细胞沉淀和上清液中以至少约108倍(例如,约105倍、106倍、107倍、108倍、109倍或10
10
倍)基因组当量/ml产生。
[0731]
1262.一种组合物,其包括如前述实施例中任一项所述的指环体。
[0732]
1263.一种药物组合物,其包括如前述实施例中任一项所述的指环体,以及药学上可接受的载剂或赋形剂。
[0733]
1264.如实施例1262或1263所述的组合物或药物组合物,其包括至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更多指环体,例如合成的指环体。
[0734]
1265.如实施例1262

1264中任一项所述的组合物或药物组合物,其包括至少103、104、105、106、107、108或109个合成的指环体。
[0735]
1266.如实施例1262

1265中任一项所述的组合物或药物组合物,其具有以下一种或多种特征:
[0736]
a)所述药物组合物满足药物或良好生产规范(gmp)标准;
[0737]
b)所述药物组合物是根据良好生产规范(gmp)制成的;
[0738]
c)所述药物组合物具有低于预定参考值的病原体水平,例如基本上不含病原体;
[0739]
d)所述药物组合物具有低于预定参考值的污染物水平,例如,基本上不含污染物;
[0740]
e)所述药物组合物具有预定水平的非感染性颗粒或预定比例的颗粒:感染性单位(例如,<300:1、<200:1、<100:1或<50:1),或
[0741]
f)所述药物组合物具有低免疫原性或基本上是非免疫原性的,例如,如本文所述。
[0742]
1267.如实施例1262

1266中任一项所述的组合物或药物组合物,其中所述药物组合物具有低于预定参考值的污染物水平,例如,基本上不含污染物。
[0743]
1268.如实施例1267所述的组合物或药物组合物,其中所述污染物选自由以下组成的组:支原体、内毒素、宿主细胞核酸(例如,宿主细胞dna和/或宿主细胞rna)、动物来源的过程杂质(例如,血清白蛋白或胰蛋白酶)、具有复制能力的因子(rca),例如具有复制能力的病毒或不需要的指环体(例如,除所需的指环体例如本文所述的合成的指环体以外的指环体)、游离病毒衣壳蛋白、外源因子和聚集体。
[0744]
1269.如实施例1268所述的组合物或药物组合物,其中所述污染物是宿主细胞dna,并且阈值量是约10ng宿主细胞dna/所述剂量药物组合物。
[0745]
1270.如实施例1262

1269中任一项所述的组合物或药物组合物,其中所述药物组合物包含按重量计小于10%(例如小于约10%、5%、4%、3%、2%、1%、0.5%或0.1%)的污染物。
[0746]
1271.如前述实施例中任一项所述的指环体、组合物或药物组合物用于治疗受试者的疾病或障碍(例如,如本文所述)的用途。
[0747]
1272.如前述实施例中任一项所述的指环体、组合物或药物组合物,其用于治疗受试者的疾病或障碍(例如,如本文所述)。
[0748]
1273.一种治疗受试者的疾病或障碍(例如,如本文所述)的方法,所述方法包括向所述受试者施用人前述实施例中任一项所述的指环体(例如,合成的指环体)或药物组合物。
[0749]
1274.一种调节,例如增强或抑制受试者的生物学功能(例如,如本文所述)的方法,所述方法包括向所述受试者施用如前述实施例中任一项所述的指环体(例如,合成的指环体)或药物组合物。
[0750]
1275.如实施例1273

1274中任一项所述的方法,其中所述指环体不包括外源性效
应子。
[0751]
1276.如实施例1273

1275中任一项所述的方法,其中所述指环体包含例如如本文所述的野生型野生型指环病毒。
[0752]
1277.如实施例1273

1276中任一项所述的方法,其中施用所述指环体例如合成的指环体导致将所述遗传元件递送到所述受试者中至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多的靶细胞群体中。
[0753]
1278.如实施例1273

1277中任一项所述的方法,其中施用所述指环体例如合成的指环体导致将所述效应子递送到所述受试者中至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多的靶细胞群体中。
[0754]
1279.如实施例1277或1278所述的方法,其中所述靶细胞包括例如体外的哺乳动物细胞,例如人细胞,例如免疫细胞、肝细胞、肺上皮细胞。
[0755]
1280.如实施例1277

1279中任一项所述的方法,其中所述靶细胞存在于肝或肺中。
[0756]
1281.如实施例1277

1280中任一项所述的方法,其中所述遗传元件被递送到其中的靶细胞各自接受所述遗传元件的至少10、50、100、500、1000、10,000、50,000、100,000或更多个拷贝。
[0757]
1282.如实施例1273

1281中任一项所述的方法,其中所述效应子包含mirna,并且其中所述mirna降低(例如所述指环体被递送到其中的)细胞或细胞群体中靶蛋白或rna的水平例如至少10%、20%、30%、40%或50%。
[0758]
1283.一种将指环体(例如,合成的指环体)递送至细胞的方法,所述方法包括将如前述实施例中任一项所述的指环体与细胞(例如,真核细胞,例如,哺乳动物细胞)接触。
[0759]
1284.如实施例1283所述的方法,其进一步包括使辅助病毒与所述细胞接触,其中所述辅助病毒包含多核苷酸,例如编码外部蛋白质例如能够结合所述外部蛋白质结合序列的外部蛋白质和任选的脂质包膜的多核苷酸。
[0760]
1285.如实施例1284所述的方法,其中使所述辅助病毒在所述指环体与所述细胞接触之前、同时或之后与所述细胞接触。
[0761]
1286.如实施例1283所述的方法,其进一步包括使辅助多核苷酸与所述细胞接触。
[0762]
1287.如实施例1286所述的方法,其中所述辅助多核苷酸包含编码外部蛋白质例如能够结合所述外部蛋白质结合序列的外部蛋白质和脂质包膜的序列多核苷酸。
[0763]
1288.如实施例1286所述的方法,其中所述辅助多核苷酸是rna(例如,mrna)、dna、质粒、病毒多核苷酸或其任何组合。
[0764]
1289.如实施例1286

1288中任一项所述的方法,其中使所述辅助多核苷酸在所述指环体与所述细胞接触之前、同时或之后与所述细胞接触。
[0765]
1290.如实施例1283

1289中任一项所述的方法,其进一步包括使辅助蛋白(例如,生长因子)与所述细胞接触。
[0766]
1291.如实施例1290所述的方法,其中所述辅助蛋白包括病毒复制蛋白或衣壳蛋白。
[0767]
1292.一种宿主细胞,其包括如前述实施例中任一项所述的指环体。
[0768]
1293.一种核酸分子,其包括启动子元件、编码效应子(例如有效负载)的序列和外
部蛋白质结合序列,
[0769]
其中所述核酸分子是单链dna,并且其中所述核酸分子呈环状和/或以少于进入细胞的核酸分子的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合;
[0770]
其中所述效应子不是源自ttv,并且不是sv40

mir

s1;
[0771]
其中所述核酸分子不包含ttmv

ly的多核苷酸序列;
[0772]
其中所述启动子元件能够指导效应子在真核细胞中的表达。
[0773]
1294.一种遗传元件,其包含:
[0774]
(i)启动子元件和编码效应子例如有效负载的序列,任选地,其中所述效应子相对于野生型指环病毒序列是外源的;
[0775]
(ii)与野生型指环病毒序列具有至少75%序列同一性的至少72个连续核苷酸(例如,至少72个、73个、74个、75个、76个、77个、78个、79个、80个、90个、100个或150个核苷酸);或与野生型指环病毒序列具有至少72%(例如,至少72%、73%、74%、75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99或100%)序列同一性的至少100个连续核苷酸;以及
[0776]
(iii)蛋白质结合序列,例如外部蛋白质结合序列,以及
[0777]
其中所述核酸构建体是单链dna;以及
[0778]
其中所述核酸构建体呈环状和/或以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合。
[0779]
1295.一种制造指环体组合物的方法,所述方法包括:
[0780]
a)提供宿主细胞,其包含一种或多种编码指环体的组分的核酸分子,例如本文所述的合成的指环体,例如,其中所述指环体包含蛋白质外部和遗传元件,例如包含启动子元件、编码效应子的序列(例如内源性或外源性效应子)和蛋白质结合序列(例如外部蛋白质结合序列,例如包装信号)的遗传元件;
[0781]
b)从所述宿主细胞产生指环体,从而制造指环体;并且
[0782]
c)将所述指环体配制为例如适于向受试者施用的药物组合物。
[0783]
1296.一种制造合成的指环体组合物的方法,所述方法包括:
[0784]
a)提供多个如前述实施例中任一项所述的指环体、组合物或药物组合物;
[0785]
b)任选地对所述多个如前述实施例中任一项所述的指环体、组合物或药物组合物评估以下一种或多种:本文所述的污染物、光密度测量值(例如od 260)、颗粒数(例如通过hplc)、感染性(例如颗粒:感染单位比,例如,通过荧光和/或elisa确定);并且
[0786]
c)例如,如果(b)的一种或多种参数满足指定的阈值,则将所述多个指环体例如配制为适于施用于受试者的药物组合物。
[0787]
1297.如实施例1296所述的方法,其中所述指环体组合物包含至少105、106、107、108、109、10
10
、10
11
、10
12
、10
13
、10
14
或10
15
个指环体,或其中所述指环体组合物包含至少105、106、107、108、109、10
10
、10
11
、10
12
、10
13
、10
14
或10
15
个指环体基因组/ml。
[0788]
1298.如实施例1296或1297所述的方法,其中所述指环体组合物包含至少10ml、20ml、50ml、100ml、200ml、500ml、1l、2l、5l、10l、20l或50l。
[0789]
1299.一种反应混合物,所述反应混合物包含如前述实施例中任一项所述的指环
体和辅助病毒,其中所述辅助病毒包含多核苷酸,例如编码外部蛋白质例如能够结合所述外部蛋白质结合序列的外部蛋白质和任选的脂质包膜的多核苷酸。
[0790]
1300.一种反应混合物,所述反应混合物包含如前述实施例中任一项所述的指环体和编码选自表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18、20

37或d1

d10中任一个的orf2、orf2/2、orf2/3、orf2t/3、orf1、orf1/1或orf1/2的氨基酸序列或与其具有至少75%(例如75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列中一个或多个的第二核酸序列。
[0791]
1301.如实施例1300所述的反应混合物,其中所述第二核酸序列是所述遗传元件的一部分。
[0792]
1302.如实施例1301所述的反应混合物,其中所述第二核酸序列不是所述遗传元件的一部分,例如,所述第二核酸序列包含在辅助细胞或辅助病毒中。
[0793]
1303.一种合成的指环体,所述合成的指环体包含:
[0794]
遗传元件,其包含(i)编码非致病性外部蛋白质的序列,(ii)使所述遗传元件与所述非致病性外部蛋白质结合的外部蛋白质结合序列,和(iii)编码效应子例如调节性核酸的序列;以及
[0795]
与所述遗传元件相关联(例如包封或封闭所述遗传元件)的蛋白质外部。
[0796]
1304.一种药物组合物,其包含:
[0797]
a)指环体,其包含:
[0798]
遗传元件,其包含(i)编码非致病性外部蛋白质的序列,(ii)使所述遗传元件与所述非致病性外部蛋白质结合的外部蛋白质结合序列,和(iii)编码效应子例如调节性核酸的序列;以及
[0799]
与所述遗传元件相关联(例如包封或封闭所述遗传元件)的蛋白质外部;以及
[0800]
b)药物赋形剂。
[0801]
1305.一种药物组合物,其包含:
[0802]
a)至少103、104、105、106、107、108或109个指环体(例如,本文所述的合成的指环体),其包含:
[0803]
遗传元件,其包含(i)编码非致病性外部蛋白质的序列,(ii)使所述遗传元件与所述非致病性外部蛋白质结合的外部蛋白质结合序列,和(iii)编码效应子例如调节性核酸的序列;以及
[0804]
与所述遗传元件相关联(例如包封或封闭所述遗传元件)的蛋白质外部;
[0805]
b)药物赋形剂,以及任选地,
[0806]
c)少于预定量的:支原体、内毒素、宿主细胞核酸(例如,宿主细胞dna和/或宿主细胞rna)、动物来源的过程杂质(例如,血清白蛋白或胰蛋白酶)、具有复制能力的因子(rca),例如具有复制能力的病毒或不需要的指环体、游离病毒衣壳蛋白、外源因子、内源因子和/或聚集体。
[0807]
1306.如前述实施例中任一项所述的指环体或组合物,所述指环体或组合物进一步包括以下特征中的至少一个:所述遗传元件是单链dna;所述遗传元件呈环状;所述指环体是非整合的;所述指环体具有基于指环病毒或其他非致病性病毒的序列、结构和/或功能,并且所述指环体是非致病性的。
[0808]
1307.如前述实施例中任一项所述的指环体或组合物,其中所述蛋白质外部包含非致病性外部蛋白质。
[0809]
1308.如前述实施例中任一项所述的指环体或组合物,其中所述蛋白质外部包含以下一种或多种:一个或多个糖基化蛋白、亲水性dna结合区、精氨酸富集区、苏氨酸富集区、谷氨酰胺富集区、n末端聚精氨酸序列、可变区、c末端聚谷氨酰胺/谷氨酸序列、以及一个或多个二硫键。
[0810]
1309.如前述实施例中任一项所述的指环体或组合物,其中所述蛋白质外部包含以下一种或多种特征:二十面体对称、识别和/或结合与一个或多个宿主细胞分子相互作用以介导进入宿主细胞的分子、缺乏脂质分子、缺乏碳水化合物、包含一种或多种所期望的碳水化合物(例如,糖基化)、ph和温度稳定、耐洗涤剂、以及在宿主中是非免疫原性的或是非致病性的。
[0811]
1310.如前述实施例中任一项所述的指环体或组合物,其中编码所述非致病性外部蛋白质的序列包含与表19中所列的一个或多个序列或其片段具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%同一性的序列。
[0812]
1311.如前述实施例中任一项所述的指环体或组合物,其中所述非致病性外部蛋白质包含至少一个提供一个或多个功能的功能结构域,所述功能是例如物种和/或组织和/或细胞嗜性、病毒基因组结合和/或包装、免疫逃逸(非免疫原性和/或耐受性)、药代动力学、内吞作用和/或细胞附着、核进入、细胞内调节和定位、胞吐作用调节、繁殖和核酸保护。
[0813]
1312.如前述实施例中任一项所述的指环体或组合物,其中所述效应子包含调节性核酸,例如,mirna、sirna、mrna、lncrna、rna、dna、反义rna、grna;治疗剂,例如荧光标签或标记、抗原、肽治疗剂、天然生物活性肽的合成或类似物肽、激动剂或拮抗剂肽、抗微生物肽、成孔肽、双环肽、靶向或细胞毒性肽、降解或自毁肽、以及多种降解或自毁肽、小分子、免疫效应子(例如,影响对免疫应答/信号的敏感性)、死亡蛋白(例如,凋亡或坏死的诱导物)、肿瘤的非裂解性抑制剂(例如,癌蛋白抑制剂)、表观遗传修饰剂、表观遗传酶、转录因子、dna或蛋白质修饰酶、dna嵌入剂、外排泵抑制剂、核受体激活剂或抑制剂、蛋白酶体抑制剂、酶的竞争性抑制剂、蛋白质合成效应子或抑制剂、核酸酶、蛋白质片段或结构域、配体或受体、以及crispr系统或组分。
[0814]
1313.如前述实施例中任一项所述的指环体或组合物,其中所述效应子包含与表40中列出的一种或多种mirna序列具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
[0815]
1314.如前述实施例所述的指环体或组合物,其中所述效应子例如mirna靶向宿主基因,例如调节所述基因的表达。
[0816]
1315.如前述实施例的指环体或组合物,其中所述mirna包含与表40中列出的一种或多种mirna序列具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
[0817]
1316.如前述实施例中任一项所述的指环体或组合物,其中所述遗传元件进一步包含以下一个或多个序列:编码一个或多个mirna的序列、编码一个或多个复制蛋白的序列、编码外源基因的序列、编码治疗剂序列的序列、调节性序列(例如启动子、增强子)、编码一个或多个靶向内源基因的调节性序列(sirna、lncrna、shrna)的序列、编码治疗性mrna或
蛋白质的序列以及编码细胞溶解/细胞毒性rna或蛋白质的序列。
[0818]
1317.如前述实施例中任一项所述的指环体或组合物,其中所述遗传元件具有以下一个或多个特征:与宿主细胞的基因组不整合、是附加体核酸、是单链dna、是约1kb至10kb、存在于细胞核内、能够与内源蛋白结合,以及产生靶向宿主基因的微小rna。
[0819]
1318.如前述实施例中任一项所述的指环体或组合物,其中所述遗传元件包含至少一个病毒序列或与表23中列出的一个或多个序列或其片段(例如,编码orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3分子的片段,和/或包含tata盒、帽位点、转录起始位点、5'utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个的片段)具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%同一性。
[0820]
1319.前述实施例的指环体或组合物,其中所述病毒序列来自以下至少一种:单链dna病毒(例如指环病毒、比那病毒、圆环病毒、双生病毒、基诺病毒、丝状病毒、微小病毒、纳米病毒、细小病毒和斯派拉病毒)、双链dna病毒(例如腺病毒、瓶状病毒、囊泡病毒、非洲猪瘟病毒、杆状病毒、福斯罗病毒、球状病毒、滴状病毒、腺炎病毒、疱疹病毒、虹彩病毒、脂毛病毒、线性病毒和痘病毒)、rna病毒(例如甲病毒、真菌传杆状病毒、肝炎病毒、大麦病毒、烟草花叶病毒、烟草脆裂病毒、三角病毒、风疹病毒、双rna病毒、囊状病毒、分体病毒和呼肠病毒)。
[0821]
1320.如前述实施例所述的指环体或组合物,其中所述病毒序列来自一种或多种非指环病毒,例如腺病毒、疱疹病毒、pox病毒、痘苗病毒、sv40、乳头瘤病毒、rna病毒(例如逆转录病毒、例如慢病毒)、单链rna病毒(例如肝炎病毒)或双链rna病毒(例如轮状病毒)。
[0822]
1321.如前述实施例中任一项所述的指环体或组合物,其中所述蛋白质结合序列与所述蛋白质外部的精氨酸富集区相互作用。
[0823]
1322.如前述实施例中任一项所述的指环体或组合物,其中所述指环体能够在哺乳动物细胞例如人细胞中复制。
[0824]
1323.如前述实施例所述的指环体或组合物,其中所述指环体在宿主细胞中是非致病性的和/或非整合的。
[0825]
1324.如前述实施例中任一项所述的指环体或组合物,其中所述指环体在宿主中是非免疫原性的。
[0826]
1325.如前述实施例中任一项所述的指环体或组合物,其中所述指环体在宿主或宿主细胞中抑制/增强一种或多种病毒特性,例如选择性,例如感染性,例如免疫抑制/激活。
[0827]
1326.如前述实施例所述的指环体或组合物,其中所述指环体的量足以调节(例如表型、病毒水平、基因表达、与其他病毒竞争、疾病状态等至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更高)。
[0828]
1327.如前述实施例中任一项所述的组合物,所述组合物进一步包含至少一种病毒或包含所述病毒的基因组的载体,例如所述指环体的变体,例如普通/天然病毒。
[0829]
1328.如前述实施例中任一项所述的组合物,所述组合物进一步包含异源部分、至少一个小分子、抗体、多肽、核酸、靶向剂、显像剂、纳米颗粒及其组合。
[0830]
1329.一种载体,所述载体包含遗传元件,所述遗传元件包含(i)编码非致病性外部蛋白质的序列,(ii)使所述遗传元件与所述非致病性外部蛋白质结合的外部蛋白质结合
序列,和(iii)编码效应子例如调节性核酸的序列。
[0831]
1330.如前述实施例所述的载体,其中所述遗传元件无法与宿主细胞的基因组整合。
[0832]
1331.如前述实施例中任一项所述的载体,其中所述遗传元件能够在哺乳动物细胞例如人细胞中复制。
[0833]
1332.如前述实施例中任一项所述的载体,所述载体进一步包含外源核酸序列,例如,所述外源核酸序列被选择来调节基因例如人基因的表达。
[0834]
1333.一种药物组合物,其包含如前述实施例中任一项所述的载体和药物赋形剂。
[0835]
1334.如前述实施例所述的组合物,其中所述载体在宿主细胞中是非致病性的和/或非整合的。
[0836]
1335.如前述实施例中任一项所述的组合物,其中所述载体在宿主中是非免疫原性的。
[0837]
1336.如前述实施例所述的组合物,其中所述载体的量足以调节(例如表型、病毒水平、基因表达、与其他病毒竞争、疾病状态等至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更高)。
[0838]
1337.如前述实施例中任一项所述的组合物,所述组合物进一步包含至少一种病毒或包含所述病毒的基因组的载体,例如所述指环体的变体,普通/天然病毒、辅助病毒、非指环病毒。
[0839]
1338.如前述实施例中任一项所述的组合物,所述组合物进一步包含异源部分、至少一个小分子、抗体、多肽、核酸、靶向剂、显像剂、纳米颗粒及其组合。
[0840]
1339.一种产生、繁殖和收获如前述实施例中任一项所述的指环体的方法。
[0841]
1340.一种设计和制造如前述实施例中任一项所述的载体的方法。
[0842]
1341.一种向受试者施用有效量的如前述实施例中任一项所述的组合物的方法。
[0843]
1342.一种将核酸或蛋白质有效负载递送至靶细胞、组织或受试者的方法,所述方法包括使所述靶细胞、组织或受试者与核酸组合物接触,所述核酸组合物包含(a)衍生自病毒的第一dna序列,其中所述第一dna序列足以产生能够感染所述靶细胞、组织或受试者的颗粒,以及(a)编码所述核酸或蛋白质有效负载的第二dna序列,改进包括:
[0844]
所述第一dna序列包含与表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中任一个中所列的相应序列具有至少80%(至少85%、90%、95%、97%、99%、100%)序列同一性的至少500个(至少600、700、800、900、1000、1200、1400、1500、1600、1800、2000)个核苷酸,或
[0845]
所述第一dna序列编码与表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中所列的orf具有至少80%(至少85%、90%、95%、97%、99%、100%)序列同一性的序列,或
[0846]
所述第一dna序列包含与表19中所列的共有序列具有至少90%(至少95%、97%、99%、100%)序列同一性的序列。
[0847]
1343.一种将核酸或蛋白质效应子递送至靶细胞、组织或受试者的方法,所述方法包括将所述靶细胞、组织或受试者与如前述实施例中任一项所述的指环体或核酸组合物接触,所述核酸组合物包含(a)衍生自病毒的第一dna序列,其中所述第一dna序列足以产生能
够感染所述靶细胞、组织或受试者的如前述实施例中任一项所述的指环体,以及(a)编码所述核酸或蛋白质效应子的第二dna序列。
[0848]
1344.一种经密码子优化的核酸分子,所述经密码子优化的核酸分子编码与野生型指环病毒orf1、orf2或orf3氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0849]
1345.如实施例1344所述的经密码子优化的核酸分子,所述经密码子优化的核酸分子编码与例如如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的野生型指环病毒orf1氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0850]
1346.一种药物组合物,所述药物组合物包含:
[0851]
(a)指环体,例如如前述实施例中任一项所述的指环体,和
[0852]
(b)载剂,其选自囊泡、脂质纳米颗粒(lnp)、红细胞、外泌体(例如哺乳动物或植物外泌体)或融合体。
[0853]
2001.一种指环体,所述指环体包含:
[0854]
(a)蛋白质外部;
[0855]
(b)遗传元件,其包含启动子元件和编码效应子(例如内源性效应子或外源性效应子)的核酸序列(例如dna序列)和蛋白质结合序列(例如外部蛋白质结合序列),
[0856]
其中所述遗传元件:
[0857]
(i)与如表a1所列的指环病毒序列具有至少72.2%(例如,至少72.2%、72.3%、72.4%、72.5%、73%、74%、75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0858]
(ii)与如表a3所列的指环病毒序列具有至少68.4%(例如,至少68.4%、68.5%、68.6%、68.7%、68.8%、68.9%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0859]
(iii)与如表a5所列的指环病毒序列具有至少81.7%(例如,至少81.7%、81.8%、81.9%、82%、83%、84%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0860]
(iv)与如表a7所列的指环病毒序列具有至少92.6%(例如,至少92.6%、92.7%、92.8%、92.9%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0861]
(v)与如表a9所列的指环病毒序列具有至少65%(例如,至少65%、66%、67%、68%、69%、70%、75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;或
[0862]
(vi)与如表a11所列的指环病毒序列具有至少65%(例如,至少65%、66%、67%、68%、69%、70%、75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0863]
任选地,其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚
(a)信号或gc富集区中的一个或多个)的缺失;
[0864]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0865]
其中所述指环体被配置为将遗传元件递送到真核细胞中。
[0866]
2002.一种指环体,所述指环体包含:
[0867]
(a)蛋白质外部;
[0868]
(b)遗传元件,其包含启动子元件和编码效应子(例如内源性效应子或外源性效应子)的核酸序列(例如dna序列)和蛋白质结合序列(例如外部蛋白质结合序列),
[0869]
其中所述遗传元件包含不超过约:
[0870]
(i)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、1000、1010、1011、1012、1013、1014、1015、1016或1017个核苷酸差异,例如取代、插入或缺失,这是相对于如表a1所列的指环病毒序列;
[0871]
(ii)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、1000、1100、1110、1120、1130、1140、1150、11160、1170、1171、1172、1173或1174个核苷酸差异,例如取代、插入或缺失,这是相对于如表a3所列的指环病毒序列;
[0872]
(iii)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、610、620、630、640、650、660、670、671或672个核苷酸差异,例如取代、插入或缺失,这是相对于如表a5所列的指环病毒序列;
[0873]
(iv)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、260、270、271、272、273、274、275、276、277、278、279或280个核苷酸差异,例如取代、插入或缺失,这是相对于如表a7所列的指环病毒序列;
[0874]
(v)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900或1000个核苷酸差异,例如取代、插入或缺失,这是相对于如表a9所列的指环病毒序列;或(vi)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900或1000个核苷酸差异,例如取代、插入或缺失,这是相对于如表a11所列的指环病毒序列;
[0875]
任选地,其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0876]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0877]
其中所述指环体被配置为将遗传元件递送到真核细胞中。
[0878]
2002.一种指环体,所述指环体包含:
[0879]
(a)蛋白质外部;
[0880]
(b)遗传元件,其包含启动子元件和编码效应子(例如内源性效应子或外源性效应子)的核酸序列(例如dna序列)和蛋白质结合序列(例如外部蛋白质结合序列),
[0881]
其中所述遗传元件包含不超过约:
[0882]
(i)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、1000、1010、1011、1012、1013、1014、1015、1016、或1017个核苷酸差异,例如取代、插入或缺失,这是相对于如表b1所列的指环病毒序列;
[0883]
(ii)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、1000、1100、1110、1120、1130、1140、1150、11160、1170、1171、1172、1173、或1174个核苷酸差异,例如取代、插入或缺失,这是相对于如表b2所列的指环病毒序列;
[0884]
(iii)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、610、620、630、640、650、660、670、671、或672个核苷酸差异,例如取代、插入或缺失,这是相对于如表b3所列的指环病毒序列;
[0885]
(iv)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、260、270、271、272、273、274、275、276、277、278、279、或280个核苷酸差异,例如取代、插入或缺失,这是相对于如表b4所列的指环病毒序列;或
[0886]
(v)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、或1000个核苷酸差异,例如取代、插入或缺失,这是相对于如表b5所列的指环病毒序列;
[0887]
任选地,其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失;
[0888]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[0889]
其中所述指环体被配置为将遗传元件递送到真核细胞中。
[0890]
2003.如前述实施例中任一项所述的指环体,其中所述遗传元件不是天然存在的序列(例如,相对于野生型指环病毒序列(例如,野生型细环病毒(ttv)、细环微小病毒(ttmv)或ttmdv序列,例如野生型指环病毒序列,例如,如表b1

b5、a1、a3、a5、a7、a9、a11、1、3、5、7、9、11或13中的任一个中所列)包含至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如,tata盒、帽位点、转录起始位点、5'utr、开放阅读框(orf)、聚(a)信号中或gc富集区中的一个或多个)的缺失)。
[0891]
2004.如前述实施例中任一项所述的指环体,指环体包含多肽,所述多肽包含与指环病毒orf1分子的氨基酸序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列。
[0892]
2005.如实施例2004所述的指环体,其中所述蛋白质外部包含所述多肽。
[0893]
2006.如实施例2005所述的指环体,其中所述蛋白质外部中至少60%(例如至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)的蛋白质包含所述多肽。
[0894]
2007.如前述实施例中任一项所述的指环体,其中所述蛋白质外部中至少60%(例如,至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98、99%或100%)的蛋白质包含orf1分子。
[0895]
2008.如前述实施例中任一项所述的指环体,所述指环体包含编码氨基酸序列的核酸分子(例如,在遗传元件中),所述氨基酸序列与指环病毒orf1分子的氨基酸序列(例如表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性)。
[0896]
2009.如前述实施例中任一项所述的指环体,其中所述遗传元件包含区域,所述区域包含以下核酸序列的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸:
[0897]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0898]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0899]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0900]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0901]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0902]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0903]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0904]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0905]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0906]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0907]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[0908]
2010.如前述实施例中任一项所述的指环体,其中所述遗传元件包含如本文所述的5’utr区和/或gc富集区(例如,分别列于表38或39中)。
[0909]
2011.一种分离的核酸分子(例如,表达载体),所述分离的核酸分子包含遗传元件,所述遗传元件:
[0910]
(i)与如表a1所列的指环病毒序列具有至少72.2%(例如,至少72.2%、72.3%、72.4%、72.5%、73%、74%、75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0911]
(ii)与如表a3所列的指环病毒序列具有至少68.4%(例如,至少68.4%、68.5%、68.6%、68.7%、68.8%、68.9%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0912]
(iii)与如表a5所列的指环病毒序列具有至少81.7%(例如,至少81.7%、81.8%、81.9%、82%、83%、84%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0913]
(iv)与如表a7所列的指环病毒序列具有至少92.6%(例如,至少92.6%、92.7%、92.8%、92.9%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0914]
(v)与如表a9所列的指环病毒序列具有至少65%(例如,至少65%、66%、67%、
68%、69%、70%、75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;或
[0915]
(vi)与如表a11所列的指环病毒序列具有至少65%(例如,至少65%、66%、67%、68%、69%、70%、75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;
[0916]
任选地,其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失。
[0917]
2012.一种分离的核酸分子(例如,表达载体),所述分离的核酸分子包含遗传元件,所述遗传元件包含不超过约:
[0918]
(i)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、1000、1010、1011、1012、1013、1014、1015、1016或1017个核苷酸差异,例如取代、插入或缺失,这是相对于如表a1所列的指环病毒序列;
[0919]
(ii)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、1000、1100、1110、1120、1130、1140、1150、11160、1170、1171、1172、1173或1174个核苷酸差异,例如取代、插入或缺失,这是相对于如表a3所列的指环病毒序列;
[0920]
(iii)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、610、620、630、640、650、660、670、671或672个核苷酸差异,例如取代、插入或缺失,这是相对于如表a5所列的指环病毒序列;
[0921]
(iv)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、260、270、271、272、273、274、275、276、277、278、279或280个核苷酸差异,例如取代、插入或缺失,这是相对于如表a7所列的指环病毒序列;
[0922]
(v)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900或1000个核苷酸差异,例如取代、插入或缺失,这是相对于如表a9所列的指环病毒序列;或
[0923]
(vi)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900或1000个核苷酸差异,例如取代、插入或缺失,这是相对于如表a11所列的指环病毒序列;
[0924]
任选地,其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失。
[0925]
2012a.一种分离的核酸分子(例如,表达载体),所述分离的核酸分子包含遗传元件,所述遗传元件包含不超过约:
[0926]
(i)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、
90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、1000、1010、1011、1012、1013、1014、1015、1016、或1017个核苷酸差异,例如取代、插入或缺失,这是相对于如表b1所列的指环病毒序列;
[0927]
(ii)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、1000、1100、1110、1120、1130、1140、1150、11160、1170、1171、1172、1173、或1174个核苷酸差异,例如取代、插入或缺失,这是相对于如表b2所列的指环病毒序列;
[0928]
(iii)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、610、620、630、640、650、660、670、671、或672个核苷酸差异,例如取代、插入或缺失,这是相对于如表b3所列的指环病毒序列;
[0929]
(iv)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、260、270、271、272、273、274、275、276、277、278、279、或280个核苷酸差异,例如取代、插入或缺失,这是相对于如表b4所列的指环病毒序列;或
[0930]
(v)1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、600、700、800、900、或1000个核苷酸差异,例如取代、插入或缺失,这是相对于如表b5所列的指环病毒序列;
[0931]
任选地,其中所述遗传元件包含相对于野生型指环病毒基因组序列(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如tata框、帽位点、转录起始位点、5’utr、开放阅读框(orf)、聚(a)信号或gc富集区中的一个或多个)的缺失。
[0932]
2013.如前述实施例中任一项所述的分离的核酸分子,其中所述遗传元件不是天然存在的序列(例如,相对于野生型指环病毒序列(例如,野生型细环病毒(ttv)、细环微小病毒(ttmv)或ttmdv序列,例如野生型指环病毒序列,例如,如表b1

b5、a1、a3、a5、a7、a9、a11、1、3、5、7、9、11或13中的任一个中所列)包含至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、酶促修饰和/或缺失,例如结构域(例如,tata盒、帽位点、转录起始位点、5'utr、开放阅读框(orf)、聚(a)信号中或gc富集区中的一个或多个)的缺失)。
[0933]
2014.如前述实施例中任一项所述的分离的核酸分子,其中所述分离的核酸分子包含编码orf1分子(例如,表c1

c5、a2、a4、a6、a8、a10或a12中的任一个中所列的orf1分子,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的多肽);
[0934]
其中:
[0935]
(i)所述orf1分子的至少30%(例如至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、90%或更多)的氨基酸是β

折叠的一部分;
[0936]
(ii)所述orf1分子的二级结构包含至少三(例如至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20)个β

折叠;
[0937]
(iii)所述orf1分子的二级结构包含β

折叠与α

螺旋的比例为至少1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1;并且
[0938]
2015.如前述实施例中任一项所述的分离的核酸分子,所述分离的核酸分子包含
以下核酸序列的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸:
[0939]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0940]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0941]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0942]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0943]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0944]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0945]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0946]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0947]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0948]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0949]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[0950]
2016.如前述实施例中任一项所述的分离的核酸分子,所述分离的核酸分子包含具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的至少20、25、30、31、32、33、34、35或36个连续核苷酸。
[0951]
2017.如前述实施例中任一项所述的分离的核酸分子,其中所述遗传元件进一步包含以下中的一种或多种:tata盒、起始元件、帽位点、转录起始位点、5’utr保守结构域、orf1编码序列、orf1/1编码序列、orf1/2编码序列、orf2编码序列、orf2/2编码序列、orf2/3编码序列、orf2/3t编码序列、三开放阅读框区域、聚(a)信号和/或来自本文所述的指环病毒的gc富集区(例如,如表b1

b5、a1、a3、a5、a7、a9或a11中的任一个中所列),或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[0952]
2018.如前述实施例中任一项所述的分离的核酸分子,其中所述遗传元件进一步包含指环病毒基因组序列(例如,如本文所述,例如,如表b1

b5、a1、a3、a5、a7、a9、a11、1、3、5、7、9、11、13、15或17中的任一个中所列)的至少一个或两个拷贝(例如,1、2、3、4、5或6个拷贝),或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[0953]
2019.如前述实施例中任一项所述的分离的核酸分子,所述分离的核酸分子进一步包含所述遗传元件的至少一个另外拷贝(例如,总共1、2、3、4、5或6个拷贝)。
[0954]
2020.如前述实施例中任一项所述的分离的核酸分子,其中所述分离的核酸分子是环状的。
[0955]
2021.一种分离的核酸组合物(例如,包含一种、两种或更多种核酸分子),所述分离的核酸组合物包含编码如前述实施例中任一项所述的分离的核酸。
[0956]
2022.如前述实施例中任一项所述的分离的核酸,其中所述遗传元件进一步包含启动子元件、编码效应子(例如内源性效应子或外源性效应子)的核酸序列(例如,dna序列)、和/或蛋白质结合序列(例如,外部蛋白质结合序列)。
[0957]
2022a.如前述实施例中任一项所述的分离的核酸分子,其中所述遗传元件包含所述orf1的高变结构域(hvd)中的插入或取代。
[0958]
2023.如前述实施例中任一项所述的指环体或分离的核酸分子,其中所述遗传元件包含以下中的一种或多种:tata盒、起始位点、5'utr保守结构域、orf1、orf2、orf2下游序列、orf2、orf3和/或gc富集区,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列,例如,如表b1

b5、a1、a3、a5、a7、a9或a11中的任一个中所示。
[0959]
2024.如前述实施例中任一项所述的指环体或分离的核酸,所述指环体或分离的核酸包含(例如,在蛋白质外部中)或编码一种或多种包含以下的多肽:选自表c1

c5、a2、a4、a6、a8、a10或a12中任一个中的orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3的氨基酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[0960]
2025.如前述实施例中任一项所述的指环体或分离的核酸,其中所述遗传元件包含序列,所述序列包含具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的至少20、25、30、31、32、33、34、35或36个连续核苷酸的。
[0961]
2026.如实施例2025所述的指环体或分离的核酸,其中所述遗传元件包含具有至少80%的gc含量的至少20、25、30、31、32、33、34、35或36个连续核苷酸。
[0962]
2027.如实施例2025所述的指环体或分离的核酸,其中所述遗传元件包含具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%或80.6%的gc含量的至少36个连续核苷酸。
[0963]
2028.如实施例2025所述的指环体或分离的核酸,其中所述遗传元件包含具有至少80%的gc含量的至少36个连续核苷酸。
[0964]
2029.如前述实施例中任一项所述的指环体或分离的核酸,其中所述遗传元件包含区域(例如包装区域),所述区域包含以下核酸序列的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸:
[0965]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[0966]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[0967]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[0968]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[0969]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[0970]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[0971]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[0972]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[0973]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[0974]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172);
[0975]
或与其具有至少75%、76%、77%、78%、79%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[0976]
2030.如实施例2029所述的指环体或分离的核酸,其中所述包装区域相对于编码所述效应子的核酸序列位于3'。
[0977]
2031.一种多肽,所述多肽包含以下中的一个或多个:
[0978]
(a)第一区域,其包含与本文所述的指环病毒orf1分子的精氨酸富集区序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;
[0979]
(b)第二区域,其包含与本文所述的指环病毒orf1分子的胶冻卷区序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少30%(例如,至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;
[0980]
(c)第三区域,其包含与本文所述的指环病毒orf1分子的n22结构域序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少30%(例如,至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;和/或
[0981]
(d)第四区域,其包含与本文所述的指环病毒orf1分子的指环病毒orf1 c末端结构域(ctd)序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少30%(例如,至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;
[0982]
其中所述orf1分子包含相对于野生型orf1蛋白(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、化学或酶促修饰,和/或缺失,例如结构域(例如,精氨酸富集区、胶冻卷结构域、hvr、n22或ctd中的一个或多个,例如如本文所述)的缺失。
[0983]
2031a.如实施例2031所述的多肽,所述多肽包含以下中的一个或多个:
[0984]
(a)第一区域,其包含与本文所述的指环病毒orf1分子的精氨酸富集区序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少90%序列同一性的氨基酸序列;
[0985]
(b)第二区域,其包含与本文所述的指环病毒orf1分子的胶冻卷区序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少90%序列同一性的氨基酸序列;
[0986]
(c)第三区域,其包含与本文所述的指环病毒orf1分子的n22结构域序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少90%序列同一性的氨基酸序列;和/或
[0987]
(d)第四区域,其包含与本文所述的指环病毒orf1分子的指环病毒orf1 c末端结构域(ctd)序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少90%序列同一性的氨基酸序列;
[0988]
其中所述orf1分子包含相对于野生型orf1蛋白(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变),例如插入、取代、化学或酶促修饰,和/或缺失,例如结构域(例如,精氨酸富集区、胶冻卷结构域、hvr、n22或ctd中的一个或多个,例如如本文所述)的缺失。
[0989]
2032.如实施例2031所述的多肽,其中所述多肽包含:
[0990]
(i)所述第一区域和所述第二区域;
[0991]
(ii)所述第一区域和所述第三区域;
[0992]
(iii)所述第一区域和所述第四区域;
[0993]
(iv)所述第二区域和所述第三区域;
[0994]
(v)所述第二区域和所述第四区域;
[0995]
(vi)所述第三区域和所述第四区域;
[0996]
(vii)所述第一区域、所述第二区域和所述第三区域;
[0997]
(viii)所述第一区域、所述第二区域和所述第四区域;
[0998]
(ix)所述第一区域、所述第三区域和所述第四区域;或
[0999]
(x)所述第二区域、所述第三区域和所述第四区域。
[1000]
2033.如实施例2031或2032所述的多肽,其中所述多肽以n末端到c末端的顺序包含所述第一区域、所述第二区域、所述第三区域和所述第四区域。
[1001]
2034.如前述实施例中任一项所述的多肽,所述多肽进一步包含氨基酸序列,例如高变区(hvr)序列(例如,如本文所述的指环病毒orf1分子的hvr序列),其中所述氨基酸序列包含至少约55(例如,至少约45、50、51、52、53、54、55、56、57、58、59、60或65)个氨基酸(例如,约45

160、50

160、55

160、60

160、45

150、50

150、55

150、60

150、45

140、50

140、55

140或60

140个氨基酸)。
[1002]
2035.如实施例2034所述的多肽,其中所述hvr包含与本文所述的指环病毒orf1分子的指环病毒orf1 hvr序列(例如,表c1

c5、a2、a4、a6、a8、a10或a12中任一个中所列的指环病毒orf1序列)具有至少30%(例如,至少约30%、35%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列。
[1003]
2036.如实施例2034或2035所述的多肽,其中所述hvr序列位于所述第二区域和所述第三区域之间。
[1004]
2037.如实施例2034

2036中任一项所述的多肽,其中所述hvr包含如本文所述的hvr的一个或多个特征。
[1005]
2038.一种多肽,所述多肽包含表c1

c5、a2、a4、a6、a8、a10或a12中任一个中的orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3的氨基酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述多肽进一步包含相对于野生型指环病毒orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3序列(例如,如本文所述,例如,如表c1

c5、a2、a4、a6、a8、a10或a12中的任一个中所列)的至少一个差异(例如,突变或化学修饰),例如缀合、添加、插入、取代和/或缺失,例如结构域的缺失。
[1006]
2039.一种多肽,所述多肽包含表c1

c5、a2、a4、a6、a8、a10或a12中任一个中的orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3的氨基酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。
[1007]
2040.一种多肽,所述多肽与选自表c1

c5、a2、a4、a6、a8、a10或a12中任一个中的orf1、orf2、orf2或orf3的氨基酸序列具有至少75%、80%、85%、90%、95%、96%、97%或98%但不超过99%的序列同一性。
[1008]
2041.一种多肽,所述多肽相对于选自表c1

c5、a2、a4、a6、a8、a10或a12中任一个中的orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3的氨基酸序列具有至
少1个但不超过2、5、10、20、50或100个氨基酸差异,例如取代、插入或缺失。
[1009]
2042.如前述实施例中任一项所述的多肽,其中所述多肽是分离的多肽。
[1010]
2043.一种复合物,其包含:
[1011]
(a)如前述实施例中任一项所述的多肽,以及
[1012]
(b)遗传元件,其包含启动子元件和编码效应子(例如外源性效应子或内源性效应子)的核酸序列(例如,dna序列),和蛋白质结合序列。
[1013]
2044.如实施例2043所述的复合物,其中所述复合物包含如本文所述的复合物的一个或多个特征。
[1014]
2045.一种融合蛋白,所述融合蛋白包含第一氨基酸序列以及异源性部分,所述第一氨基酸序列选自表c1

c5、a2、a4、a6、a8、a10或a12中任一个中的orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。
[1015]
2046.一种融合蛋白,所述融合蛋白包含第一氨基酸序列以及异源性部分,所述第一氨基酸序列选自表c1

c5、a2、a4、a6、a8、a10或a12中任一个中的orf1分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[1016]
2047.如前述实施例中任一项所述的融合蛋白,其中所述异源性部分包含靶向部分。
[1017]
2048.如前述实施例中任一项所述的融合蛋白,其中所述第一氨基酸序列包含相对于野生型指环病毒orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3序列(例如,如本文所述,例如,如表c1

c5、a2、a4、a6、a8、a10或a12中的任一个中所列)的至少一个差异(例如,突变或化学修饰),例如缀合、添加、插入、取代和/或缺失,例如结构域的缺失。
[1018]
2049.一种宿主细胞,所述宿主细胞包含如前述实施例中任一项所述的指环体、分离的核酸、融合蛋白或多肽。
[1019]
2050.一种反应混合物,所述反应混合物包含如前述实施例中任一项所述的指环体和辅助病毒,其中所述辅助病毒包含多核苷酸,例如编码外部蛋白质例如结合所述外部蛋白质结合序列的外部蛋白质和任选的脂质包膜的多核苷酸。
[1020]
2051.一种治疗受试者的疾病或障碍的方法,所述方法包括向所述受试者施用如前述实施例中任一项所述的指环体、分离的核酸分子、融合蛋白或多肽或如前述实施例中任一项所述的药物组合物。
[1021]
2052.如实施例2051所述的方法,其中所述疾病或障碍选自免疫障碍、感染性疾病、炎性障碍、自身免疫病、癌症(例如实体瘤)和胃肠道障碍。
[1022]
2053.如前述实施例中任一项所述的指环体、分离的核酸、融合蛋白或多肽用于治疗受试者的疾病或障碍的用途。
[1023]
2054.如实施例2053所述的用途,其中所述疾病或障碍选自免疫障碍、感染性疾病、炎性障碍、自身免疫病、癌症(例如实体瘤,例如肺癌)和胃肠道障碍。
[1024]
2055.如前述实施例中任一项所述的指环体、分离的核酸、组合物或药物组合物,其用于治疗受试者的疾病或障碍。
[1025]
2055a.如前述实施例中任一项所述的指环体、分离的核酸、组合物或药物组合物,
其用于用作药物。
[1026]
2056.一种调节,例如抑制或增强受试者的生物学功能的方法,所述方法包括向所述受试者施用如前述实施例中任一项所述的指环体、分离的核酸、融合蛋白或多肽或如前述实施例中任一项所述的药物组合物。
[1027]
2057.一种将指环体递送至细胞的方法,所述方法包括使如前述实施例中任一项所述的指环体、分离的核酸、融合蛋白或多肽与细胞例如真核细胞例如哺乳动物细胞接触。
[1028]
2058.如实施例2057所述的方法,其进一步包括使辅助病毒与所述细胞接触,其中所述辅助病毒包含多核苷酸,例如编码外部蛋白质例如结合所述外部蛋白质结合序列的外部蛋白质和任选的脂质包膜的多核苷酸。
[1029]
2059.如实施例2058所述的方法,其中使所述辅助病毒在所述指环体与所述细胞接触之前、同时或之后与所述细胞接触。
[1030]
2060.如实施例2057所述的方法,其进一步包括使辅助多核苷酸与所述细胞接触。
[1031]
2061.如实施例2060所述的方法,其中所述辅助多核苷酸包含编码外部蛋白质例如结合所述外部蛋白质结合序列的外部蛋白质和脂质包膜的序列多核苷酸。
[1032]
2062.如实施例2060所述的方法,其中所述辅助多核苷酸是rna(例如,mrna)、dna、质粒、病毒多核苷酸或其任何组合。
[1033]
2063.如实施例2060

2062中任一项所述的方法,其中使所述辅助多核苷酸在所述指环体与所述细胞接触之前、同时或之后与所述细胞接触。
[1034]
2064.如实施例2057

2063中任一项所述的方法,其进一步包括使辅助蛋白与所述细胞接触。
[1035]
2065.如实施例2064所述的方法,其中所述辅助蛋白包括病毒复制蛋白或衣壳蛋白。
[1036]
2066.一种将核酸或蛋白质效应子递送至靶细胞、组织或受试者的方法,所述方法包括使所述靶细胞、组织或受试者与核酸组合物接触,所述核酸组合物包含(a)衍生自病毒的第一dna序列,其中所述第一dna序列足以产生感染所述靶细胞、组织或受试者的颗粒,以及(a)编码所述核酸或蛋白质效应子的第二dna序列,改进包括:
[1037]
所述第一dna序列包含与表b1

b5、a1、a3、a5、a7、a9或a11中任一个中所列的相应序列具有至少80%(至少85%、90%、95%、97%、99%、100%)序列同一性的至少500个(至少600、700、800、900、1000、1200、1400、1500、1600、1800、2000)个核苷酸,或
[1038]
所述第一dna序列编码与指环病毒orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3和/或orf3分子(例如,表c1

c5、a2、a4、a6、a8、a10或a12中的任一个中所列)具有至少80%(至少85%、90%、95%、97%、99%、100%)序列同一性的序列。
[1039]
2067.一种制造指环体组合物的方法,所述方法包括:
[1040]
a)提供宿主细胞,其包含一种或多种编码如前述实施例中任一项所述的指环体的组分的核酸分子,例如本文所述的合成的指环体,例如,其中所述指环体包含蛋白质外部和遗传元件,例如包含启动子元件、编码效应子的序列(例如内源性效应子或外源性效应子)和蛋白质结合序列(例如外部蛋白质结合序列,例如包装信号)的遗传元件;
[1041]
b)从所述宿主细胞产生指环体,从而制造指环体;并且
[1042]
c)将所述指环体配制为例如适于向受试者施用的药物组合物;
[1043]
任选地,其中所述一种或多种核酸分子编码辅助蛋白。
[1044]
2068.一种制造指环体组合物的方法,所述方法包括:
[1045]
a)提供多个如前述实施例中任一项所述的指环体;
[1046]
b)任选地对所述多个如前述实施例中任一项所述的指环体评估以下一种或多种:本文所述的污染物、光密度测量值(例如od 260)、颗粒数(例如通过hplc)、感染性(例如颗粒:感染单位比);并且
[1047]
c)例如,如果(b)的一种或多种参数满足指定的阈值,则将所述多个指环体例如配制为适于施用于受试者的药物组合物。
[1048]
2069.如实施例2068所述的方法,其中所述指环体组合物包含至少105、106、107、108、109、10
10
、10
11
、10
12
、10
13
、10
14
或10
15
个指环体。
[1049]
2070.如实施例2068或2069所述的方法,其中所述指环体组合物包含至少10ml、20ml、50ml、100ml、200ml、500ml、1l、2l、5l、10l、20l或50l。
[1050]
2071.如前述实施例中任一项所述的指环体或分离的核酸,其中所述遗传元件被配置为在哺乳动物细胞例如人细胞中复制。
[1051]
2072.如前述实施例中任一项所述的指环体或分离的核酸,其中遗传元件进一步包含外源核酸序列,例如,选择用于调节基因,例如人基因的表达。
[1052]
2073.如前述实施例中任一项所述的指环体或分离的核酸,其中所述蛋白质结合序列的至少60%(例如至少60%、65%、70%、75%、80%、85%、90%、95%或100%)由g或c组成。
[1053]
2074.如前述实施例中任一项所述的指环体或分离的核酸,其中所述遗传元件包含长度为至少80、90、100、110、120、130或140个核苷酸的序列,所述序列的至少70%(例如,至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)或约70

100%、75

95%、80

95%、85

95%、或85

90%位置由g或c组成。
[1054]
2075.如前述实施例中任一项所述的指环体或分离的核酸,其中所述蛋白质结合序列结合所述蛋白质外部的精氨酸富集区。
[1055]
2076.如前述实施例中任一项所述的指环体或分离的核酸,其中所述蛋白质外部包含与所述蛋白质结合序列特异性结合的外部蛋白质。
[1056]
2077.如前述实施例中任一项所述的指环体或分离的核酸,其中除所述效应子之外的遗传元件部分的组合大小为约2.5kb

5kb(例如,约2.8kb

4kb、约2.8kb

3.2kb、约3.6kb

3.9kb或约2.8kb

2.9kb)、小于约5kb(例如,小于约2.9kb、3.2kb、3.6kb、3.9kb或4kb)或至少100个核苷酸(例如,至少1kb)。
[1057]
2078.如前述实施例中任一项所述的指环体或分离的核酸,其中所述遗传元件是单链的。
[1058]
2079.如前述实施例中任一项所述的指环体或分离的核酸,其中所述遗传元件是环状的。
[1059]
2080.如前述实施例中任一项所述的指环体或分离的核酸,其中所述遗传元件是dna。
[1060]
2081.如前述实施例中任一项所述的指环体或分离的核酸,其中遗传元件是负链dna。
[1061]
2082.如前述实施例中任一项所述的指环体或分离的核酸,其中所述遗传元件包含附加体。
[1062]
2083.如前述实施例中任一项所述的指环体或分离的核酸,其中所述指环体在所需器官或组织中以相对于其他器官或组织更高的水平存在(例如,优先积累在其中)。
[1063]
2084.如前述实施例中任一项所述的指环体或分离的核酸,其中所述真核细胞是哺乳动物细胞,例如人细胞。
[1064]
2085.一种组合物,所述组合物包含如前述实施例中任一项所述的指环体或分离的核酸。
[1065]
2086.一种药物组合物,所述药物组合物包含指环体或分离的核酸以及药学上可接受的载剂或赋形剂。
[1066]
2087.一种药物组合物,其包含:
[1067]
a)至少103、104、105、106、107、108或109个如前述实施例中任一项所述的指环体;
[1068]
b)药物赋形剂,以及任选地,
[1069]
c)少于预定量的:支原体、内毒素、宿主细胞核酸(例如,宿主细胞dna和/或宿主细胞rna)、动物来源的过程杂质(例如,血清白蛋白或胰蛋白酶)、具有复制能力的因子(rca),例如具有复制能力的病毒或不需要的指环体、游离病毒衣壳蛋白、外源因子和/或聚集体。
[1070]
2088.如实施例2085或2086所述的组合物或药物组合物,其包含至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更多指环体,例如合成的指环体。
[1071]
2089.如实施例2085

2088中任一项所述的组合物或药物组合物,其包含至少103、104、105、106、107、108或109个指环体。
[1072]
2090.一种药物组合物,其包含:
[1073]
a)至少103、104、105、106、107、108或109个如前述实施例中任一项所述的指环体;
[1074]
b)药物赋形剂,以及任选地,
[1075]
c)少于预定量的:支原体、内毒素、宿主细胞核酸(例如,宿主细胞dna和/或宿主细胞rna)、动物来源的过程杂质(例如,血清白蛋白或胰蛋白酶)、具有复制能力的因子(rca),例如具有复制能力的病毒或不需要的指环体、游离病毒衣壳蛋白、外源因子和/或聚集体。
[1076]
2091.如实施例2085

2090中任一项所述的组合物或药物组合物,其具有以下一种或多种特征:
[1077]
a)所述药物组合物满足药物或良好生产规范(gmp)标准;
[1078]
b)所述药物组合物是根据良好生产规范(gmp)制成的;
[1079]
c)所述药物组合物具有低于预定参考值的病原体水平,例如基本上不含病原体;
[1080]
d)所述药物组合物具有低于预定参考值的污染物水平,例如,基本上不含污染物;
[1081]
e)所述药物组合物具有预定水平的非感染性颗粒或预定比例的颗粒:感染性单位(例如,<300:1、≤200:1、≤100:1或<50:1),或
[1082]
f)所述药物组合物具有低免疫原性或基本上是非免疫原性的,例如,如本文所述。
[1083]
2092.如实施例2085

2091中任一项所述的组合物或药物组合物,其中所述药物组合物具有低于预定参考值的污染物水平,例如,基本上不含污染物。
[1084]
2093.如实施例92所述的组合物或药物组合物,其中所述污染物选自由以下组成的组:支原体、内毒素、宿主细胞核酸(例如,宿主细胞dna和/或宿主细胞rna)、动物来源的
过程杂质(例如,血清白蛋白或胰蛋白酶)、具有复制能力的因子(rca),例如具有复制能力的病毒或不需要的指环体(例如,除所需的指环体例如本文所述的合成的指环体以外的指环体)、游离病毒衣壳蛋白、外源因子和聚集体。
[1085]
2094.如实施例2093所述的组合物或药物组合物,其中所述污染物是宿主细胞dna,并且阈值量是约500ng宿主细胞dna/所述剂量药物组合物。
[1086]
2095.如实施例2085

2094中任一项所述的组合物或药物组合物,其中所述药物组合物包含按重量计小于10%(例如小于约10%、5%、4%、3%、2%、1%、0.5%或0.1%)的污染物。
[1087]
2096.如前述实施例中任一项所述的方法,其中所述指环体不包含外源性效应子。
[1088]
2097.如前述实施例中任一项所述的方法,其中施用所述指环体例如合成的指环体导致将所述遗传元件递送到所述受试者中至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多的靶细胞群体中。
[1089]
2098.如前述实施例中任一项所述的方法,其中施用所述指环体例如合成的指环体导致将所述外源性效应子递送到所述受试者中至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多的靶细胞群体中。
[1090]
2099.如实施例2097或2098所述的方法,其中所述靶细胞包括例如体外的哺乳动物细胞,例如人细胞,例如免疫细胞、肝细胞、肺上皮细胞。
[1091]
2100.如实施例2097

2099中任一项所述的方法,其中所述靶细胞存在于肝或肺中。
[1092]
2101.如实施例2097

2100中任一项所述的方法,其中所述遗传元件被递送到其中的靶细胞各自接受所述遗传元件的至少10、50、100、500、1000、10,000、50,000、100,000或更多个拷贝。
[1093]
2102.如前述实施例中任一项所述的方法,其中所述效应子包含mirna,并且任选地其中所述mirna降低(例如所述指环体被递送到其中的)细胞或细胞群体中靶蛋白或rna的水平例如至少10%、20%、30%、40%或50%。
[1094]
2103.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件(例如,遗传元件的5'utr)物理地关联(例如,结合)至所述蛋白质外部(例如,蛋白质外部的orf1分子)。
[1095]
2104.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中封闭在所述蛋白质外部的遗传元件对核酸内切酶消化具有抗性,例如根据martin等人(2013,hum.gene ther.methods[人类基因疗法与方法]24(4):253

269,通过引用以其整体并入本文)中描述的方法确定;任选地,其中使用的dna酶的量为约60u/ml或约300u。
[1096]
2105.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件包含长度至少为100个核苷酸的序列,所述序列在至少80%的位置上由g或c组成。
[1097]
2106.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件是环状单链dna。
[1098]
2107.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组
合物或方法,其中所述遗传元件不包含一个或多个细菌质粒元件(例如,细菌复制起点或可选择标记,例如,细菌抗性基因)。
[1099]
2108.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件以少于进入哺乳细胞的指环体的1%的频率整合。
[1100]
2109.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述启动子元件对于野生型指环体病毒是外源的或内源的。
[1101]
2110.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述外源性效应子是治疗性外源性效应子,例如治疗性肽、治疗性多肽或治疗性核酸(例如,mirna)。
[1102]
2111.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中具有至少1000(例如至少1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、50,000、75,000、100,000、200,000、500,000、1,000,000或更多)个所述指环体的群体将至少100(例如至少100、150、200、250、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、50,000、100,000或更多)个拷贝的所述遗传元件递送到一个或更多个哺乳动物细胞中。
[1103]
2112.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述指环体包含一种或多种多肽,所述多肽包含以下中的一种或多种:选自指环病毒orf2、orf2/2、orf2/3、orf1、orf1/1或orf1/2(例如,如本文所述)的氨基酸序列或与其具有至少95%序列同一性的氨基酸序列。
[1104]
2113.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件包含编码以下的核酸序列:选自指环病毒orf1、orf2、orf2/2、orf2/3、orf1/1或orf1/2(例如,如本文所述)的氨基酸序列,或与其具有至少95%序列同一性的氨基酸序列。
[1105]
2114.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述指环体不包含编码复制因子和衣壳蛋白之一或两者的多核苷酸,或其中所述指环体是复制缺陷的。
[1106]
2115.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中使所述指环体与细胞在体外或体内接触。
[1107]
2116.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述指环体不包含与指环病毒orf2、orf2/2、orf2/3、orf1/1或orf1/2(例如,如本文所述)具有至少95%序列同一性的多肽。
[1108]
2117.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件能够通过滚环复制被扩增(例如,在细胞中,例如宿主细胞,例如哺乳动物细胞,例如人细胞,例如hek293t或a549细胞),例如产生至少2、4、8、16、32、64、128、256、518或1024个拷贝。
[1109]
2118.如前述实施例中任一项所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述遗传元件由双链环状dna分子产生。
[1110]
2119.如实施例2118所述的多肽、复合物、指环体、分离的核酸、细胞、组合物或方法,其中所述双链环状dna分子通过体外环化产生。
no:886的核苷酸501

2489编码。
[1132]
3006.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件包含以下的核酸序列:
[1133]
(i)seq id no:878的核苷酸3141

3264,或
[1134]
(ii)seq id no:886的核苷酸3076

3176;
[1135]
或与其具有至少90%序列同一性的核酸序列。
[1136]
3007.如前述实施例中任一项所述的合成的指环体,其中所述orf1分子包含氨基酸序列,所述氨基酸序列包含以下中的一种或多种:如表d2或d4中所列的精氨酸富集区、胶冻卷结构域、高变结构域、n22结构域和/或c末端结构域的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1137]
3008.如前述实施例中任一项所述的合成的指环体,其中所述orf1分子包含以下的氨基酸序列:
[1138]
(i)seq id no:883,或
[1139]
(ii)seq id no:891;
[1140]
或与其具有至少85%序列同一性的氨基酸序列。
[1141]
3009.如前述实施例中任一项所述的合成的指环体,所述合成的指环体进一步包含多肽,所述多肽包含表c1或c2中所列的orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1142]
3010.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件编码表c1或c2中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1143]
3011.如前述实施例中任一项所述的合成的指环体,其中所述合成的指环体不包含含有如表c1或c2中所列的orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列或与其具有至少85%同一性的氨基酸序列的多肽。
[1144]
3012.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件不编码表c1或c2中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1145]
3013.一种合成的指环体,所述合成的指环体包含:
[1146]
(i)遗传元件,其包含:
[1147]
(a)启动子元件,
[1148]
(b)编码外源性效应子的核酸序列,其中所述核酸序列与所述启动子元件可操作地连接,和
[1149]
(c)与seq id no:894的核苷酸178

248的核酸序列具有至少90%序列同一性的核酸序列;和
[1150]
(ii)蛋白质外部,所述蛋白质外部包含orf1分子,所述orf1分子包含seq id no:933的氨基酸序列,或与其具有至少90%同一性的氨基酸序列;
[1151]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[1152]
其中所述合成的指环体能够将所述遗传元件递送到真核细胞中。
[1153]
3014.一种合成的指环体,所述合成的指环体包含:
[1154]
(i)遗传元件,其包含:
[1155]
(a)启动子元件,
[1156]
(b)编码外源性效应子的核酸序列,其中所述核酸序列与所述启动子元件可操作地连接,和
[1157]
(c)与seq id no:903的核苷酸176

246的核酸序列具有至少90%序列同一性的核酸序列;和
[1158]
(ii)蛋白质外部,所述蛋白质外部包含orf1分子,所述orf1分子包含seq id no:939的氨基酸序列,或与其具有至少90%同一性的氨基酸序列;
[1159]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[1160]
其中所述合成的指环体能够将所述遗传元件递送到真核细胞中。
[1161]
3015.一种合成的指环体,所述合成的指环体包含:
[1162]
(i)遗传元件,其包含:
[1163]
(a)启动子元件,
[1164]
(b)编码外源性效应子的核酸序列,其中所述核酸序列与所述启动子元件可操作地连接,和
[1165]
(c)与seq id no:911的核苷酸170

240的核酸序列具有至少90%序列同一性的核酸序列;和
[1166]
(ii)蛋白质外部,所述蛋白质外部包含orf1分子,所述orf1分子包含seq id no:945的氨基酸序列,或与其具有至少90%同一性的氨基酸序列;
[1167]
其中所述遗传元件被封闭在所述蛋白质外部内;并且
[1168]
其中所述合成的指环体能够将所述遗传元件递送到真核细胞中。
[1169]
3016.如实施例3013所述的合成的指环体,其中所述orf1分子由seq id no:894的核苷酸572

2758编码。
[1170]
3017.如实施例3014所述的合成的指环体,其中所述orf1分子由seq id no:903的核苷酸581

2884编码。
[1171]
3018.如权利要求3015所述的合成的指环体,其中所述orf1分子由seq id no:911的核苷酸614

2911编码。
[1172]
3019.如实施例3013

3018中任一项所述的合成的指环体,其中所述遗传元件包含以下的核酸序列:
[1173]
(i)seq id no:894的核苷酸3555

3696,
[1174]
(ii)seq id no:903的核苷酸3720

3828;或
[1175]
(iii)seq id no:911的核苷酸3716

3815;
[1176]
或与其具有至少90%序列同一性的核酸序列。
[1177]
3020.如实施例3013所述的合成的指环体,其中所述orf1分子包含氨基酸序列,所述氨基酸序列包含以下中的一种或多种:如表d6中所列的精氨酸富集区、胶冻卷结构域、高变结构域、n22结构域和/或c末端结构域的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1178]
3021.如实施例3014所述的合成的指环体,其中所述orf1分子包含氨基酸序列,所述氨基酸序列包含以下中的一种或多种:如表d8中所列的精氨酸富集区、胶冻卷结构域、高
变结构域、n22结构域和/或c末端结构域的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1179]
3022.如实施例3015所述的合成的指环体,其中所述orf1分子包含氨基酸序列,所述氨基酸序列包含以下中的一种或多种:如表d10中所列的精氨酸富集区、胶冻卷结构域、高变结构域、n22结构域和/或c末端结构域的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1180]
3023.如实施例3013所述的合成的指环体,其中所述orf1分子包含seq id no:900的氨基酸序列,或与其具有至少85%序列同一性的氨基酸序列。
[1181]
3024.如实施例3014所述的合成的指环体,所述orf1分子包含seq id no:908的氨基酸序列,或与其具有至少85%序列同一性的氨基酸序列。
[1182]
3025.如实施例3015所述的合成的指环体,其中所述orf1分子包含seq id no:916的氨基酸序列,或与其具有至少85%序列同一性的氨基酸序列。
[1183]
3026.如实施例3013所述的合成的指环体,所述合成的指环体进一步包含多肽,所述多肽包含如表c3中所列的orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列或与其具有至少85%同一性的氨基酸序列。
[1184]
3027.如实施例3014所述的合成的指环体,所述合成的指环体进一步包含多肽,所述多肽包含如表c4中所列的orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列或与其具有至少85%同一性的氨基酸序列。
[1185]
3028.如实施例3015所述的合成的指环体,所述合成的指环体进一步包含多肽,所述多肽包含如表c5中所列的orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列或与其具有至少85%同一性的氨基酸序列。
[1186]
3029.如实施例3013所述的合成的指环体,其中所述遗传元件编码表c3中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1187]
3030.如实施例3014所述的合成的指环体,其中所述遗传元件编码表c4中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1188]
3031.如实施例3015所述的合成的指环体,其中所述遗传元件编码表c5中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1189]
3032.如实施例3013所述的合成的指环体,其中所述遗传元件编码表c3中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1190]
3033.如实施例3014所述的合成的指环体,其中所述遗传元件编码表c4中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1191]
3034.如实施例3015所述的合成的指环体,其中所述遗传元件编码表c5中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1192]
3035.如实施例3013所述的合成的指环体,其中所述遗传元件编码表c3中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1193]
3036.如实施例3014所述的合成的指环体,其中所述遗传元件编码表c4中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1194]
3037.如实施例3015所述的合成的指环体,其中所述遗传元件编码表c5中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1195]
3038.如实施例3013

3037中任一项所述的合成的指环体,其中所述合成的指环体不包含以下多肽,所述多肽包含如表c3

c5中的任一个中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1196]
3039.如实施例3013

3038中任一项所述的合成的指环体,其中所述遗传元件不编码表c3

c5中的任一个中所列的orf1、orf2、orf2/2、orf2/3、taip、orf1/1或orf1/2的氨基酸序列,或与其具有至少85%同一性的氨基酸序列。
[1197]
3040.如前述实施例中任一项所述的合成的指环体,其中所述orf1分子包含氨基酸序列ynpx2dxgx2n,其中x
n
各自独立地是任何n个氨基酸的连续序列。
[1198]
3041.如实施例3040所述的合成的指环体,其中所述orf1分子进一步包含位于氨基酸序列ynpx2dxgx2n侧翼的第一β链和第二β链,例如,其中所述第一β链包含氨基酸序列ynpx2dxgx2n的酪氨酸(y)残基和/或其中所述第二β链包含氨基酸序列ynpx2dxgx2n的第二个天冬酰胺(n)残基(从n到c)。
[1199]
3042.如前述实施例中任一项所述的合成的指环体,其中所述orf1分子按从n末端到c末端方向的顺序包含第一β链、第二β链、第一α螺旋、第三β链、第四β链、第五β链、第二α螺旋、第六β链、第七β链、第八β链和第九β链。
[1200]
3043.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件能够通过滚环复制在宿主细胞中扩增,例如产生至少8个拷贝。
[1201]
3044.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件是单链的。
[1202]
3045.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件是环状的。
[1203]
3046.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件是dna。
[1204]
3047.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件是负链dna。
[1205]
3048.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件以少于进入细胞的指环体的10%、8%、6%、4%、3%、2%、1%、0.5%、0.2%、0.1%的频率整合,例如,其中所述合成的指环体是非整合的。
[1206]
3049.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件包含表16

1中所示的共有5'utr核酸序列的序列。
[1207]
3050.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件包含表16

2中所示的共有gc富集区的序列。
[1208]
3051.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件包含长度
为至少100个核苷酸的序列,所述序列的至少70%(例如,约70%

100%、75%

95%、80%

95%、85%

95%、或85%

90%)位置由g或c组成。
[1209]
3052.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件包含seq id no:120的核酸序列。
[1210]
3053.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件包含与表11的核酸序列的核苷酸1

393的指环病毒5’utr保守结构域核苷酸序列具有至少85%序列同一性的序列和与表11的核酸序列的核苷酸2868

2929的指环病毒gc富集区具有至少85%序列同一性的序列。
[1211]
3054.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件与表11的核苷酸序列具有至少75%同一性。
[1212]
3055.如前述实施例中任一项所述的合成的指环体,其中所述启动子元件对于野生型指环病毒是外源的。
[1213]
3056.如前述实施例中任一项所述的合成的指环体,其中所述启动子元件对于野生型指环病毒是内源的。
[1214]
3057.如前述实施例中任一项所述的合成的指环体,其中所述外源性效应子编码治疗剂,例如治疗性肽或多肽或治疗性核酸。
[1215]
3058.如前述实施例中任一项所述的合成的指环体,其中所述外源性效应子包含调节性核酸,例如,mirna、sirna、mrna、lncrna、rna、dna、反义rna、grna;荧光标签或标记、抗原、肽、天然生物活性肽的合成或类似物肽、激动剂或拮抗剂肽、抗微生物肽、成孔肽、双环肽、靶向或细胞毒性肽、降解或自毁肽、小分子、免疫效应子(例如,影响对免疫应答/信号的敏感性)、死亡蛋白(例如,凋亡或坏死的诱导物)、肿瘤的非裂解性抑制剂(例如,癌蛋白抑制剂)、表观遗传修饰剂、表观遗传酶、转录因子、dna或蛋白质修饰酶、dna嵌入剂、外排泵抑制剂、核受体激活剂或抑制剂、蛋白酶体抑制剂、酶的竞争性抑制剂、蛋白质合成效应子或抑制剂、核酸酶、蛋白质片段或结构域、配体、抗体、受体或crispr系统或组分。
[1216]
3059.如前述实施例中任一项所述的合成的指环体,其中所述外源性效应子包含mirna,并减少宿主基因的表达。
[1217]
3060.如前述实施例中任一项所述的合成的指环体,其中所述外源性效应子包含约20

200、30

180、40

160、50

140、60

120、200

2000、200

500、500

1000、1000

1500或1500

2000个核苷酸长度的核酸序列。
[1218]
3061.如前述实施例中任一项所述的合成的指环体,其中编码所述外源性效应子的核酸序列是约20

200、30

180、40

160、50

140、60

120、200

2000、200

500、500

1000、1000

1500或1500

2000个核苷酸长度。
[1219]
3062.如前述实施例中任一项所述的合成的指环体,所述合成的指环体包含(例如,在蛋白质外部中)选自以下的氨基酸序列中的一种或多种:如表c1

c5中任一个中所列的orf2、orf2/2、orf2/3、orf1、orf1/1或orf1/2,或与其具有至少85%序列同一性的氨基酸序列。
[1220]
3063.如前述实施例中任一项所述的合成的指环体,其中所述遗传元件的长度为约1.5

2.0、2.0

2.5、2.5

3.0、3.0

3.5、3.1

3.6、3.2

3.7、3.3

3.8、3.4

3.9、3.5

4.0、4.0

4.5或4.5

5.0kb。
[1221]
3064.如前述实施例中任一项所述的合成的指环体,其中所述合成的指环体能够感染人细胞,例如免疫细胞、肝细胞或肺上皮细胞。
[1222]
3065.如前述实施例中任一项所述的合成的指环体,所述合成的指环体是基本上非免疫原性的,例如不诱导可检测的和/或不想要的免疫应答,例如根据实例4中所述的方法检测到的。
[1223]
3066.如实施例3065所述的合成的指环体,其中所述基本上非免疫原性的指环体在受试者中具有缺乏免疫应答的参考受试者中效力的至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%的效力。
[1224]
3067.如前述实施例中任一项所述的合成的指环体,其中具有至少1000个所述指环体的群体能够递送至少约100个拷贝(例如,至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000个拷贝)的所述遗传元件进入一个或多个人细胞中。
[1225]
3068.如前述实施例中任一项所述的合成的指环体,所述合成的指环体包含(例如,在蛋白质外部中)选自以下的氨基酸序列中的一种或多种:如表c1

c5中任一个中所列的orf2、orf2/2、orf2/3、orf2t/3、orf1、orf1/1、或orf1/2,或与其具有至少85%序列同一性的氨基酸序列。
[1226]
3069.一种药物组合物,其包含如前述实施例中任一项所述的合成的指环体,以及药学上可接受的载剂或赋形剂。
[1227]
3070.如实施例3069所述的药物组合物,其包含至少103、104、105、106、107、108或109个合成的指环体。
[1228]
3071.如实施例3069或3070所述的药物组合物,其中所述药物组合物具有预定比例的颗粒:感染性单位(例如,<300:1、<200:1、<100:1或<50:1)。
[1229]
3072.一种核酸分子,其编码以下中的一种或多种(例如,全部):
[1230]
(i)orf1分子,其例如如表c1

c5中任一个中所列,或包含表b1

b5中任一个中所列的核酸序列的orf1区域;
[1231]
(ii)orf2分子,其例如如表c1

c5中任一个中所列,或包含表b1

b5中任一个中所列的核酸序列的orf2区域;和/或
[1232]
(iii)orf3分子,其例如如表c1

c5中任一个中所列,或包含表b1

b5中任一个中所列的核酸序列的orf3区域。
[1233]
3073.如实施例3072所述的核酸分子,其中所述核酸分子是质粒、病毒基因组或双链环状dna(例如,通过体外环化产生)。
[1234]
3074.一种反应混合物,所述反应混合物包含:
[1235]
(i)第一核酸(例如,双链或单链环状dna),其包含前述实施例中任一项所述的合成的指环体的遗传元件的序列,和
[1236]
(ii)第二核酸序列,其编码选自例如如表c1

c5中任一个中所列的orf1、orf2、orf2/2、orf2/3、orf1/1或orf1/2中的一种或多种氨基酸序列,或与其具有至少85%序列同一性的氨基酸序列。
[1237]
3075.如实施例3074所述的反应混合物,其中所述第一核酸和所述第二核酸在同一核酸分子中。
[1238]
3076.如实施例3074所述的反应混合物,其中所述第一核酸和所述第二核酸是不
同的核酸分子。
[1239]
3077.如实施例3074所述的反应混合物,其中所述第一核酸和所述第二核酸是不同的核酸分子并且其中所述第二核酸作为双链环状dna提供。
[1240]
3078.如实施例3074所述的反应混合物,其中所述第一核酸和所述第二核酸是不同的核酸分子并且其中所述第一核酸和所述第二核酸作为双链环状dna提供。
[1241]
3079.如实施例3076所述的反应混合物,其中所述第二核酸序列包含在辅助细胞或辅助病毒中。
[1242]
3080.一种制备合成的指环体的方法,所述方法包括:
[1243]
a)提供宿主细胞,其包含:
[1244]
(i)第一核酸分子,其包含如前述实施例中任一项所述的合成的指环体的遗传元件的核酸序列,和
[1245]
(ii)第二核酸分子,其编码选自例如如表c1

c5中任一个中所列的orf1、orf2、orf2/2、orf2/3、orf1/1或orf1/2中的一种或多种氨基酸序列,或与其具有至少85%序列同一性的氨基酸序列;并且
[1246]
b)在适合于制备合成的指环体的条件下孵育所述宿主细胞;
[1247]
从而制备所述合成的指环体。
[1248]
3081.如实施例3080所述的方法,所述方法进一步包括,在步骤(a)之前,将所述第一核酸分子和/或所述第二核酸分子引入所述细胞。
[1249]
3082.如实施例3081所述的方法,其中所述第二核酸分子在所述第一核酸分子之前、与其同时或在其之后被引入所述宿主细胞。
[1250]
3083.如实施例3080或3081中任一项所述的方法,其中所述第二核酸分子被整合到所述宿主细胞的基因组中。
[1251]
3084.如实施例3080

3083中任一项所述的方法,其中所述第二核酸分子是辅助物(例如辅助质粒,或辅助病毒的基因组)。
[1252]
3085.如实施例3080

3084中任一项所述的方法,其中第二核酸分子编码包含氨基酸序列[w/f]x7hx3cx1cx5h的orf2分子,其中x
n
是任何n个氨基酸的连续序列。
[1253]
3086.一种制造合成的指环体制剂的方法,所述方法包括:
[1254]
a)提供多个如实施例3001

3068所述的合成的指环体、如实施例3069

3071任一项所述的药物组合物、或如实施例3074

3079任一项所述的反应混合物;
[1255]
b)任选地对所述多个如实施例3001

3068所述的合成的指环体评估以下一种或多种:本文所述的污染物、光密度测量值(例如od 260)、颗粒数(例如通过hplc)、感染性(例如颗粒:感染单位比);并且
[1256]
c)例如,如果(b)的一种或多种参数满足指定的阈值,则将所述多个合成的指环体配制为例如适于施用于受试者的药物组合物。
[1257]
3087.一种宿主细胞,所述宿主细胞包含:
[1258]
(i)第一核酸分子,其包含如前述实施例中任一项所述的合成的指环体的遗传元件的核酸序列,和
[1259]
(ii)任选地,第二核酸分子,其编码选自如表c1

c5中任一个中所列的orf1、orf2、orf2/2、orf2/3、orf1/1或orf1/2中的一种或多种氨基酸序列,或与其具有至少85%序列同
一性的氨基酸序列。
[1260]
3088.一种将外源性效应子(例如,治疗性外源性效应子)递送至哺乳动物细胞的方法,所述方法包括:
[1261]
(a)提供如前述实施例中任一项所述的合成的指环体;并且
[1262]
(b)使哺乳动物细胞与所述合成的指环体接触;
[1263]
其中所述合成的指环体能够将所述遗传元件递送到所述哺乳动物细胞中;以及
[1264]
任选地,其中在适合在宿主细胞中将所述遗传元件封闭在蛋白质外部内的条件下,通过将所述遗传元件引入所述宿主细胞来产生所述合成的指环体;
[1265]
从而将所述治疗性外源性效应子递送至所述哺乳动物细胞。
[1266]
3089.如实施例3001

3068中任一项所述的合成的指环体或如实施例3069

3071中任一项所述的药物组合物用于将所述遗传元件递送至宿主细胞的用途。
[1267]
3090.如实施例3001

3068中任一项所述的合成的指环体或如实施例3069

3071中任一项所述的药物组合物用于治疗受试者的疾病或障碍的用途。
[1268]
3091.如实施例3090所述的用途,其中所述疾病或障碍选自免疫障碍、干扰素病(例如,i型干扰素病)、感染性疾病、炎性障碍、自身免疫病、癌症(例如实体瘤,例如肺癌)和胃肠道障碍。
[1269]
3092.如实施例3001

3068任一项所述的合成的指环体或如实施例3069

3071任一项所述的药物组合物,用于治疗受试者的疾病或障碍。
[1270]
3093.一种治疗受试者的疾病或障碍的方法,所述方法包括向所述受试者施用如实施例3001

3068中任一项所述的合成的指环体或如实施例3069

3071中任一项所述的药物组合物,其中所述疾病或障碍选自免疫障碍、干扰素病(例如,i型干扰素病)、感染性疾病、炎性障碍、自身免疫病、癌症(例如实体瘤,例如肺癌)和胃肠道障碍。
[1271]
3094.如实施例3001

3068中任一项所述的合成的指环体或如实施例3069

3071中任一项所述的药物组合物在制造用于治疗受试者的疾病或障碍的药物中的用途,任选地其中所述疾病或障碍是免疫障碍、干扰素病(例如,i型干扰素病)、感染性疾病、炎性障碍、自身免疫病、癌症(例如实体瘤,例如肺癌)或胃肠道障碍。
[1272]
根据说明书和附图并且根据权利要求书,本发明的其他特征、目标和优点将是显而易见的。
[1273]
除非另外定义,否则本文所用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。所有的公开物、专利申请、专利、以及在此提及的其他参考文献以其全文通过引用结合。另外,材料、方法和实施例仅是说明性的而不旨在限制。
附图说明
[1274]
当结合附图阅读时,将更好地理解以下详细描述的本发明的实施例。出于说明本发明的目的,在附图中示出了本发明示例的实施例。然而,应当理解,本发明不限于附图中所示实施例的精确安排和手段。本专利或申请文件包含至少一个彩色附图。应请求并且支付必要的费用后,具有一个或多个彩色附图的本专利或专利申请公开的副本将由专利局提供。
[1275]
图1a是示出衣壳蛋白序列的氨基酸区的百分比序列相似性的图示。
[1276]
图1b是示出衣壳蛋白序列的百分比序列相似性的图示。
[1277]
图2是示出指环体的一个实施例的图示。
[1278]
图3描绘了编码ttminiv的ly1菌株(“指环体1”)的卡那霉素载体的示意图。
[1279]
图4描绘了编码ttminiv的ly2菌株(“指环体2”)的卡那霉素载体的示意图。
[1280]
图5描述了293t和a549细胞中合成的指环体的转染效率。
[1281]
图6a和6b描述了定量pcr结果,所述结果说明了合成的指环体对293t细胞的成功感染。
[1282]
图7a和7b描述了定量pcr结果,所述结果说明了合成的指环体对a549细胞的成功感染。
[1283]
图8a和8b描述了定量pcr结果,所述结果说明了合成的指环体对raji细胞的成功感染。
[1284]
图9a和9b描述了定量pcr结果,所述结果说明了合成的指环体对jurkat细胞的成功感染。
[1285]
图10a和10b描述了定量pcr结果,所述结果说明了合成的指环体对chang细胞的成功感染。
[1286]
图11a

11b是一系列图表,其显示了用ttmv

ly2δ574

1371、δ1432

2210、2610::nluc转染或感染的细胞中萤光素酶的表达。在受感染的细胞中观察到发光,这表明成功复制和包装。
[1287]
图11c是描绘了甲型细环病毒(细环病毒;ttv)的系统进化树的图,其中进化分枝突出显示。代表了至少100个指环病毒株。来自几个进化分枝的示例性序列在本文中提供,例如在表a1

a12、b1

b5、c1

c5和1

18中。
[1288]
图12是示出了用于产生指环体(例如,本文所述的具有复制能力的指环体或复制缺陷型指环体)的示例性工作流程的示意图。
[1289]
图13是示出了针对设计用于定量ttv和ttmv基因组当量的引物组的引物特异性的图。基于sybr绿色化学的定量pcr显示在编码各个基因组的质粒上,使用ttmv或ttv特异性引物组(如所示)对每个扩增产物都有一个不同的峰。
[1290]
图14是一系列图,其显示了通过qpcr定量ttv基因组当量的pcr效率。浓度增加的引物和固定浓度的水解探针(250nm)与两种不同的商业qpcr预混合物一起使用。90%

110%的效率产生定量过程中最低的误差传播。
[1291]
图15是图,其示出了利用7个基因组当量浓度log10,线性扩增ttmv(靶标1)或ttv(靶标2)的示例性扩增图。用7个10倍稀释以高pcr效率和线性对基因组当量进行定量(r
2 ttmv:0.996;r
2 ttv:0.997)。
[1292]
图16a

16b是一系列图,其显示了对指环体储备物中ttmv基因组当量的定量。(a)两种储备物的扩增图,每种按1:10稀释并一式两份运行。(b)与图a相同的两个样品,此处在线性范围的情况下显示。显示的是两个代表性样品的上限和下限。pcr效率:99.58%,r2:0988。
[1293]
图17是显示用指定质粒转染的hek293t细胞中mir

625表达倍数变化的图。
[1294]
图18是示出了来自每个甲型细环病毒进化分枝的代表性序列的比对的成对同一
性的图。将ttv

ct30f、ttv

p13

1、ttv

tth8、ttv

hd20a、ttv

16、ttv

tjn02和ttv

hd16d的dna序列进行比对。沿着比对长度显示了50bp滑动窗口中的成对百分比同一性。上方的括号指示了成对同一性的非编码和编码区,其中指示了成对同一性。下面的括号表示高或低序列保守的区域。
[1295]
图19是示出了七个甲型细环病毒进化分枝中推定蛋白质的氨基酸比对的成对同一性的图。将来自ttv

ct30f、ttv

p13

1、ttv

tth8、ttv

hd20a、ttv

16、ttv

tjn02和ttv

hd16d的推定蛋白质的氨基酸序列进行比对。沿着每个比对的长度显示了15aa滑动窗口中的成对百分比同一性。指示了开放阅读框dna序列和蛋白质氨基酸序列的成对同一性。(*)针对ttv

ct30f、ttv

tth8、ttv

16和ttv

tjn02,比对推定的orf2t/3氨基酸序列。
[1296]
图20是示出了七个甲型细环病毒进化分枝中5’utr内结构域高度保守的图(分别为seq id no 810

817,按出现顺序)。将每个代表性甲型细环病毒的71

bp 5’utr保守结构域序列进行比对。所述序列在七个进化分枝之间具有95.2%的成对同一性。
[1297]
图21是示出了来自七个甲型细环病毒进化分枝的gc富集结构域的比对的图。每种指环病毒在orf的下游都有gc含量大于70%的区。显示的是来自ttv

ct30f、ttv

p13

1、ttv

tth8、ttv

hd20a、ttv

16、ttv

tjn02和ttv

hd16d的gc富集区的比对。这些区的长度不同,但是在比对时,它们显示出75.4%的成对同一性。
[1298]
图22是显示用编码靶向n

myc相互作用蛋白(nmi)的mirna的指环体感染raji b细胞的图。显示的是在用nmi mirna编码的指环体感染raji b细胞(箭头)或对照细胞后检测到的指环体基因组当量的量化。
[1299]
图23是显示用编码靶向n

myc相互作用蛋白(nmi)的mirna的指环体感染raji b细胞的图。蛋白质印迹显示编码针对nmi的mirna的指环体降低了rajib细胞中nmi蛋白的表达,而用缺乏所述mirna的指环体感染的raji b细胞显示出与对照相当的nmi蛋白表达。
[1300]
图24是一系列图,显示了在用包含内源mirna编码序列的指环体和相应的其中内源mirna编码序列被缺失的指环体感染后宿主细胞中产生的指环体颗粒的量化。
[1301]
图25a

25c是一系列图,显示了来自与纳米萤光素酶融合的ttmv

ly2的orf的细胞内定位。(a)在vero细胞中,orf2(顶行)似乎定位于细胞质,而orf1/1(底行)似乎定位于细胞核。(b)在hek293细胞中,orf2(顶行)似乎定位于细胞质,而orf1/1(底行)似乎定位于细胞核。(c)细胞中orf1/2和orf2/2的定位模式。
[1302]
图26是一系列图,显示了ttv

tth8的3'非编码区(ncr)中的顺序缺失对照。顶行显示野生型ttv

tth8指环病毒的结构。第二行显示ttv

tth8,其在3’ncr的gc富集区中缺失36个核苷酸(δ36nt(gc))。第三行显示缺失36个核苷酸和另外缺失mirna序列的ttv

tth8,导致总共缺失78个核苷酸(δ36nt(gc)δmir)。第四行显示从3’ncr缺失171个核苷酸的ttv

tth8,3’ncr包括36个核苷酸缺失区和mirna序列(δ3’ncr)。
[1303]
图27a

27d是一系列图,显示ttv

tth8的3’ncr中的顺序缺失对指环病毒orf转录物水平具有显著影响。显示的是第2天的orf1和orf2(a)、第2天的orf1/1和orf2/2(b)、第2天的orf1/2和orf2/3(c)和第2天的orf2t3(d)的表达。
[1304]
图28a

28b是一系列图,显示用于产生表达纳米萤光素酶的指环体的构建体(a)和用于转染细胞的一系列指环体/质粒组合(b)
[1305]
图29a

29c是一系列图,显示注射了指环体的小鼠中纳米萤光素酶的表达。(a)注
射后第0

9天小鼠中的纳米萤光素酶表达。(b)注射了各种指环体/质粒构建体组合的小鼠中的纳米萤光素酶表达,如所示。(c)注射后在小鼠体内检测到的纳米萤光素酶发光的定量。a组接受ttmv

ly2载体
±
纳米萤光素酶。b组接受纳米萤光素酶蛋白和ttmv

ly2 orf。
[1306]
图29d是来自七个不同甲型细环病毒进化分枝的代表性指环体的基因组组织的示意图。将ttv

ct30f、ttv

p13

1、ttv

tth8、ttv

hd20a、ttv

16、ttv

tjn02和ttv

hd16d的序列进行比对,其中标注了关键区域。推定的开放阅读框(orf)以浅灰色表示,tata盒以深灰色表示,关键的推定调控区以中灰色表示,包括起始元件、5'utr保守结构域和gc富集区(例如,如所示)。
[1307]
图30是显示用于确定指环病毒前mirna的内源性靶的示例性工作流程的示意图。
[1308]
图31a

31b是一系列图,显示串联的指环病毒质粒可以增加指环病毒或指环病毒的产生。(a)示例性串联指环病毒质粒的质粒图谱。(b)用串联指环病毒质粒转染hek293t细胞,产生的病毒基因组数目是携带单拷贝的质粒的四倍。
[1309]
图31c是显示ttmv

ly2质粒pvl46

063和pvl46

240的环化的凝胶电泳图像。
[1310]
图31d是显示线性和环状ttmv

ly2构建体的拷贝数的色谱图,如通过尺寸排阻色谱法(sec)确定的。
[1311]
图32是显示来自九个指环病毒基因组序列的36个核苷酸的gc富集区和基于其的共有序列的比对的图(分别为seq id no 818

827,按出现顺序)。
[1312]
图33是一系列图,显示了来自指环病毒株ly2和cbd203的orf1结构。推定结构域被标记:精氨酸富集区(arg富集),核心区域,包括胶冻卷结构域、高变区(hvr)、n22区和c末端结构域(ctd),如所示。
[1313]
图34是显示来自乙型细环病毒株cbs203的orf1结构的图。指出了在一组110种乙型细环病毒之间显示出高度相似性的残基。指示的是所有评估的株中60%

79.9%相似性的残基、80%

99.9%相似性的残基和100%相似性的残基。
[1314]
图35是显示以下的图:来自甲型细环病毒的258个序列的比对的共有序列(seq id no:828),具有高相似性得分的残基突出显示深灰色(100%)、中灰色(80

99.9%)、浅灰色(60%

80%)。推定结构域在框中指示。共有序列下方的框图也指示了同一性百分比,其中中灰色框表示100%同一性,浅灰色框表示30%

99%同一性,深灰色框表示低于30%同一性。
[1315]
图36是示意图,显示了指环病毒orf1分子的结构域和将被来自不同指环病毒的高变结构域替换的高变区。
[1316]
图37是示意图,显示了orf1的结构域和将被来自非指环病毒来源的目的蛋白质或肽(poi)替换的高变区。
[1317]
图38是一系列图,显示了基于指环病毒基因组的示例性指环体遗传元件的设计。从指环病毒基因组(左)中缺失了蛋白质编码区,留下了指环病毒非编码区(ncr),包括病毒启动子、5'utr保守结构域(5cd)和gc富集区。有效负载dna被插入到蛋白质编码基因座的非编码区(右)。由此产生的指环体含有有效负载dna(包括开放阅读框、基因、非编码rna等)和必需的指环病毒顺式复制和包装元件,但缺乏用于复制和包装的必需蛋白质元件。
[1318]
图39是柱状图,显示了包含编码外源人免疫粘附素的遗传元件的指环体成功转导人肺衍生细胞系ekvx。
[1319]
图40是显示了以下的图:基于tth8或ly2被设计为包含编码人促红细胞生成素(hepo)的序列的指环体可以将功能性转基因递送至哺乳动物细胞。
[1320]
图41a和41b是一系列图,显示了在静脉注射后七天可检测到施用给小鼠的工程化指环体。
[1321]
图42是显示了以下的图:在静脉内施用编码hgh的工程化指环体后七天在全血的细胞级分中检测到hgh mrna。
[1322]
图43a

43d是一系列图,说明了指环病毒orf2中高度保守的基序。图43公开了seq id no:949。
[1323]
图44a和44b是一系列图,显示了人组织中全长orf1 mrna表达的证据。
[1324]
图45是显示了以下的图:体外环化(ivc)的ttv

tth8基因组(ivc ttv

tth8)与质粒中的ttv

tth8基因组相比在hek293t细胞中以预期密度产生ttv

tth8基因组拷贝的能力。
[1325]
图46是一系列图,显示了体外环化(ivc)的ly2基因组(wt ly2 ivc)和质粒(wt ly2质粒)中的野生型ly2基因组在jurkat细胞中以预期密度产生ly2基因组拷贝的能力。
[1326]
图47是显示了以下的图:来自甲型细环病毒、乙型细环病毒和丙型细环病毒(seq id no:950

975)的指环病毒orf1蛋白的胶冻卷结构域的二级结构的比对。这些二级结构元件是高度保守的。
[1327]
图48是显示了以下的图:位于n22结构域中的orf1基序的保守序列和二级结构(按出现顺序分别为seq id no 976

1000和851)。人ttv orf1的保守ynpxxdxgxxn(seq id no:829)基序具有保守的二级结构。特别是,基序中的酪氨酸破坏了β链,第二β链从基序的末端天冬酰胺开始。
具体实施方式
[1328]
定义
[1329]
本发明将针对特定实施例并参考某些附图进行描述,但是本发明不限于此,而是仅由权利要求书来限定。除非另有说明,否则下文陈述的术语通常应以其共识来理解。
[1330]
在本说明书和权利要求中使用术语“包含”时,不排除其他要素。出于本发明的目的,术语“由
……
组成”被认为是术语“包含”的优选实施例。如果在下文中将组定义为包含至少一定数量的实施例,则这将被理解为优选地还公开了仅由这些实施例组成的组。
[1331]
当指代单数名词时使用不定冠词或定冠词,例如“一个(a)”、“一种(an)”或“所述(the)”,除非另有说明,否则这包括该名词的复数形式。
[1332]
词语“用于治疗、调节等的化合物、组合物、产物等”应理解为是指本身适合于所指示的治疗、调节等目的的化合物、组合物、产物等。词语“用于治疗、调节等的化合物、组合物、产物等”另外作为一个实施例披露了这种化合物、组合物、产物等用于治疗、调节等。
[1333]
词语“用于

的化合物、组合物、产物等”、“化合物、组合物、产物等用于制造用以

的药物、药物组合物、兽用组合物、诊断组合物等的用途”或“用于用作药物
……
的化合物、组合物、产品等”表示这些化合物、组合物、产物等将用于可在人体或动物身上实施的治疗方法中。它们被认为是涉及治疗方法等的实施例和权利要求的等同披露。如果实施例或权利要求因此是指“用于治疗疑似患有疾病的人或动物的化合物”,则这也被认为是披露

化合物在制造用于治疗疑似患有疾病的人或动物的药物中的用途”或“通过向疑似患有疾病的人或动物施用化合物的治疗方法”。词语“用于治疗、调节等的化合物、组合物、产物等”应理解为是指本身适合于所指示的治疗、调节等目的的化合物、组合物、产物等。
[1334]
如果在下文中在括号中提供术语、值、数量等的实例,则这将被理解为表示在括号中提及的实例可以构成实施例。例如,如果指出“在实施例中,核酸分子包含与表1的指环病毒orf1编码核苷酸序列(例如,表1的核酸序列的核苷酸571

2613)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列”,则一些实施例涉及包含与表1的核酸序列的核苷酸571

2613具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列的核酸分子。
[1335]
如本文所用,术语“指环体”是指包含封闭在蛋白质外部中的遗传元件,例如附加体,例如环状dna的媒介物。如本文所用,“合成的指环体”通常是指非天然存在的指环体,例如具有相对于野生型病毒(例如,如本文所述的野生型指环病毒)不同的序列。在一些实施例中,合成的指环体被工程化或重组,例如,包含遗传元件,所述遗传元件包含相对于野生型病毒基因组(例如,如本文所述的野生型指环病毒基因组)的差异或修饰。在一些实施例中,封闭在蛋白质外部中包含被蛋白质外部100%覆盖,以及小于100%覆盖,例如95%、90%、85%、80%、70%、60%、50%或更少。例如,在蛋白质外部可以存在间隙或不连续(例如,使得所述蛋白质外部可透过水、离子、肽或小分子),只要遗传元件例如进入宿主细胞之前保留在蛋白质外部中即可,。在一些实施例中,将指环体纯化,例如,将其从其原始来源中分离和/或基本上不含(>50%、>60%、>70%、>80%、>90%)其他组分。
[1336]
如本文所用,术语“指环载体(anellovector)”是指包含足够的核酸序列(所述核酸序列来源于或高度类似于(例如,至少85%、90%、95%、96%、97%、98%、99%或100%相同)指环病毒基因组序列或其连续部分以允许包装到蛋白质外部(例如,衣壳)中)并进一步包含异源序列的载体。在一些实施例中,指环载体是病毒载体或裸核酸。在一些实施例中,指环载体包含天然指环病毒序列的至少约50、60、70、71、72、73、74、75、80、90、100、150、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000或3500个连续核苷酸与其或高度相似(至少85%、90%、95%、96%、97%、98%、99%或100%相同)的序列。在一些实施例中,指环载体进一步包含指环病毒orf1、orf2或orf3中的一种或多种。在一些实施例中,异源序列包含多克隆位点、包含异源启动子、包含治疗性蛋白质的编码区或编码治疗性核酸。在一些实施例中,衣壳是野生型指环病毒衣壳。在实施例中,指环载体包含本文所述的遗传元件,例如,包含遗传元件,所述遗传元件包含启动子、编码治疗效应子的序列和衣壳结合序列。
[1337]
如本文所用,术语“抗体分子”是指包含至少一个免疫球蛋白可变结构域序列的蛋白质,例如免疫球蛋白链或其片段。术语“抗体分子”包括全长抗体和抗体片段(例如,scfv)。在一些实施例中,抗体分子是多特异性抗体分子,例如,所述抗体分子包含多个免疫球蛋白可变结构域序列,其中该多个中的第一免疫球蛋白可变结构域序列对第一表位具有结合特异性并且该多个中的第二免疫球蛋白可变结构域序列对第二表位具有结合特异性。在实施例中,多特异性抗体分子是双特异性抗体分子。双特异性抗体分子的特征通常在于对第一表位具有结合特异性的第一免疫球蛋白可变结构域序列和对第二表位具有结合特异性的第二免疫球蛋白可变结构域序列。
[1338]
如本文所用,“编码”的核酸是指编码氨基酸序列或功能性多核苷酸(例如非编码rna,例如sirna或mirna)的核酸序列。
[1339]
如本文所用,“外源性”因子(例如,效应子、核酸(例如,rna)、基因、有效负载、蛋白质)是指不被相应的野生型病毒(例如,本文所述的指环病毒)包括或编码的因子。在一些实施例中,外源性因子不是天然存在的,例如具有相对于天然存在的蛋白质或核酸(例如,通过插入、缺失或置换)发生改变的序列的蛋白质或核酸。在一些实施例中,外源性因子不天然存在于宿主细胞中。在一些实施例中,外源性因子天然存在于宿主细胞中,但是对于病毒是外源的。在一些实施例中,外源性因子天然存在于宿主细胞中,但是不以期望的水平或在期望的时间存在。
[1340]“异源”药剂或元件(例如,效应子、核酸序列、氨基酸序列),如本文关于另一种药剂或元件(例如,效应子、核酸序列、氨基酸序列)所使用,指不是天然地一起发现的药剂或元件,例如,在野生型病毒,例如指环病毒中。在一些实施例中,异源核酸序列可以与天然存在的核酸序列(例如,天然存在于指环病毒中的序列)存在于同一核酸中。在一些实施例中,异源药剂或元件相对于指环病毒是外源性的,指环体的其他(例如,其余的)元件基于该指环病毒。
[1341]
如本文所用,术语“遗传元件”是指通常在指环体中的核酸序列。应当理解,遗传元件可以作为裸dna产生,并且任选地进一步装配到蛋白质外部中。还应理解,指环体可将其遗传元件插入细胞中,从而导致遗传元件存在于细胞中,而蛋白质外部不一定进入细胞。
[1342]
如本文所用,术语“orf1分子”是指具有指环病毒orf1蛋白(例如,如本文所述的指环病毒orf1蛋白,例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)的活性和/或结构特征的多肽,或其功能片段。在一些情况下,orf1分子可以包含以下中的一种或多种(例如,1、2、3或4种):包含至少60%碱性残基(例如,至少60%精氨酸残基)的第一区域,包含至少约六个β链(例如,至少4、5、6、7、8、9、10、11或12个β链)的第二区域,包含指环病毒n22结构域(例如,如本文所述,例如来自如本文所述的指环病毒orf1蛋白的n22结构域)的结构或活性的第三区域,和/或包含指环病毒c末端结构域(ctd)(例如,如本文所述,例如来自如本文所述的指环病毒orf1蛋白的ctd)的结构或活性的第四区域。在一些情况下,orf1分子以n末端到c末端的顺序包含所述第一、第二、第三和第四区域。在一些情况下,指环体包含orf1分子,所述分子以n末端到c末端的顺序包含所述第一、第二、第三和第四区域。在一些情况下,orf1分子可以包含由指环病毒orf1核酸(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列)编码的多肽。在一些情况下,orf1分子可进一步包含异源序列,例如高变区(hvr),例如来自例如本文所述的指环病毒orf1蛋白的hvr。如本文所用,“指环病毒orf1蛋白”是指由指环病毒基因组(例如,野生型指环病毒基因组,例如,如本文所述)编码的orf1蛋白,例如具有表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的氨基酸序列的orf1蛋白,或由表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列的orf1基因编码的orf1蛋白。
[1343]
如本文所用,术语“orf2分子”是指具有指环病毒orf2蛋白(例如,如本文所述的指环病毒orf2蛋白,例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)的活性和/或结构特征的多肽,或其功能片段。如本文所用,

指环病毒orf2蛋白”是指由指环病毒基因组(例如,野生型指环病毒基因组,例如,如本文所述)编码的orf2蛋白,例如具有表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列的氨基酸序列的orf2蛋白,或由表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列的orf2基因编码的orf2蛋白。
[1344]
如本文所用,术语“蛋白质外部”是指主要(例如>50%、>60%、>70%、>80%、>90%)是蛋白质的外部组分。
[1345]
如本文所用,术语“调节性核酸”是指修饰编码表达产物的dna序列的表达,例如转录和/或翻译的核酸序列。在实施例中,表达产物包含rna或蛋白质。
[1346]
如本文所用,术语“调节性序列”是指修饰靶基因产物的转录的核酸序列。在一些实施例中,调节性序列是启动子或增强子。
[1347]
如本文所用,术语“复制蛋白”是指在感染、病毒基因组复制/表达、病毒蛋白合成和/或病毒组分装配过程中使用的蛋白,例如病毒蛋白。
[1348]
如本文所用,“基本上非致病性的”生物体、颗粒或组分是指例如在宿主生物例如哺乳动物例如人中不会引起或诱导可检测的疾病或致病性状况的生物、颗粒(例如,病毒或指环体,例如本文所述)或其组分。在一些实施例中,向受试者施用指环体可导致轻微的反应或副作用,其作为护理标准的一部分是可接受的。
[1349]
如本文所用,术语“非致病性的”是指例如在宿主生物例如哺乳动物例如人中不会引起或诱导可检测的疾病或致病性状况的生物体或其组分。
[1350]
如本文所用,“基本上非整合的”遗传元件是指一种遗传元件,例如病毒或指环体中的遗传元件,例如如本文所述,其中进入宿主细胞(例如,真核细胞)或生物体(例如,哺乳动物,例如人)的遗传元件中的少于约0.01%、0.05%、0.1%、0.5%或1%整合到基因组中。在一些实施例中,遗传元件没有可检测地整合到例如宿主细胞的基因组中。在一些实施例中,可以使用本文所述的技术,例如核酸测序、pcr检测和/或核酸杂交,检测遗传元件整合到基因组中。
[1351]
如本文所用,“基本上非免疫原性的”生物体、颗粒或组分是指例如在宿主组织或生物体(例如哺乳动物,例如人)中不会引起或诱导不期望或未靶向的免疫应答的生物体、颗粒(例如,病毒或指环体,例如本文所述)或其组分。在实施例中,基本上非免疫原性的生物体、颗粒或组分不产生可检测的免疫应答。在实施例中,基本上非免疫原性的指环体对包含表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中任一个所示的氨基酸序列或由表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中任一个所示的核酸序列编码的蛋白质不产生可检测的免疫应答。在实施例中,通过测定受试者中抗体的存在或水平(例如,抗指环体抗体的存在或水平,例如针对本文所述的指环体的抗体的存在或水平)来检测免疫应答(例如,不期望的或未靶向的免疫应答),例如,根据tsuda等人(1999;j.virol.methods[病毒学方法杂志]77:199

206;通过引用并入本文)中所述的抗ttv抗体检测方法和/或kakkola等人(2008;virology[病毒学]382:182

189;通过引用并入本文)中所述的测定抗ttv igg水平的方法。针对指环病毒或基于其的指环体的抗体还可以通过本领域中检测抗病毒抗体的方法来检测,例如检测抗aav抗体的方法,例如calcedo等人(2013;front.immunol.[免疫学前沿]4(341):1

7;通过引用并入本文)。
[1352]
如本文所用的“子序列”是指分别包含在较大核酸序列或氨基酸序列中的核酸序
列或氨基酸序列。在一些情况下,子序列可以包含较大序列的结构域或功能片段。在一些情况下,子序列可以包含较大序列的片段,所述片段当从所述较大序列分离时能够形成与当与所述较大序列的其余部分一起存在时形成的二级和/或三级结构相似的二级和/或三级结构。在一些情况下,子序列可以被另一序列替换(例如,包含外源序列的子序列或与较大序列的其余部分异源的序列,例如来自不同指环病毒的相应子序列)。
[1353]
如本文所用,“治疗(treatment)”,“治疗(treating)”及其同源词是指旨在改善、改进、稳定、预防或治愈疾病、病理状况或障碍的受试者的医学管理。该术语包括积极治疗(旨在改善疾病、病理状况或障碍的治疗)、因果治疗(针对相关疾病、病理状况或障碍的原因的治疗)、姑息治疗(旨在缓解症状而设计的治疗)、预防性治疗(旨在预防、最小化或部分或完全抑制相关疾病、病理状况或障碍进展的治疗);以及支持治疗(用于补充另一治疗的治疗)。
[1354]
如本文所用,术语“病毒组”是指在特定环境中,例如身体的一部分,例如在生物体中,例如在细胞中,例如在组织中的病毒。
[1355]
本发明一般涉及指环体,例如合成的指环体,及其用途。本发明提供指环体,包含指环体的组合物,以及制备或使用指环体的方法。指环体通常用作递送媒介物,例如用于将治疗剂递送至真核细胞。通常,指环体将包括遗传元件,所述遗传元件包含封闭在蛋白质外部内的核酸序列(例如,编码效应子,例如外源性效应子或内源性效应子)。相对于指环病毒序列(例如,如本文所述),指环体可包括一个或多个序列(例如,如本文所述的区域或结构域)的缺失。指环体可以用作基本上非免疫原性的媒介物,用于将遗传元件或其中编码的效应子(例如,多肽或核酸效应子,例如如本文所述)递送到真核细胞中,例如用以治疗包含所述细胞的受试者的疾病或障碍。
[1356]
内容列表
[1357]
i.指环体
[1358]
a.指环病毒
[1359]
b.orf1分子
[1360]
c.orf2分子
[1361]
d.遗传元件
[1362]
e.蛋白质结合序列
[1363]
f.5'utr区域
[1364]
g.gc富集区
[1365]
h.效应子
[1366]
i.蛋白质外部
[1367]
ii.载体
[1368]
iii.组合物
[1369]
iv.宿主细胞
[1370]
v.使用方法
[1371]
vi.生产方法
[1372]
vii.施用/递送
[1373]
i.指环体
[1374]
在一些方面,本文所述的发明包括使用和制备指环体、指环体制剂和治疗性组合物的组合物和方法。在一些实施例中,指环体具有基于指环病毒(例如,本文所述的指环病毒,例如,包含含有表a1

a12、b1

b5、c1

c5、1

18、20

37或d1

d10中任一个中所示的序列的核酸或多肽的指环病毒)或其片段、或其他基本上非致病性的病毒(例如共生病毒(symbiotic virus)、普通病毒(commensal virus)、天然病毒)的序列、结构和/或功能。在一些实施例中,基于指环病毒的指环体包含至少一个对于指环病毒是外源的元件,例如,外源效应子或编码指环体的遗传元件内的外源效应子的核酸序列。在一些实施例中,基于指环病毒的指环体包含至少一个与来自该指环病毒的另一元件异源的元件,例如,与另一连接的核酸序列异源的效应子编码核酸序列,例如启动子元件。在一些实施例中,指环体包含遗传元件(例如,环状dna,例如单链dna),其包含至少一个相对于遗传元件的其余部分和/或蛋白质外部是异源的元件(例如,编码效应子的外源元件,例如,如本文所述)。指环体可以是用于将有效负载进入宿主例如人的递送媒介物(例如,基本上非致病性的递送媒介物)。在一些实施例中,指环体能够在真核细胞例如哺乳动物细胞例如人细胞中复制。在一些实施例中,指环体在哺乳动物(例如人)细胞中是基本上非致病性的和/或基本上非整合的。在一些实施例中,指环体在哺乳动物例如人中是基本上非免疫原性的。在一些实施例中,指环体是复制缺陷型。在一些实施例中,指环体具有复制能力。
[1375]
在一些实施例中,指环体包含指环体或其组分(例如,遗传元件,例如,包含编码效应子的序列和/或蛋白质外部),例如,如pct申请号pct/us2018/037379所描述,其通过引用整体并入本文。
[1376]
在一个方面,本发明包括指环体,所述指环体包含(i)遗传元件,其包含启动子元件,编码效应子的序列(例如内源性效应子或外源性效应子,例如有效负载)和蛋白质结合序列(例如外部蛋白质结合序列,例如包装信号),其中遗传元件是单链dna,并具有以下一种或两种性质:呈环状和/或以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合到真核细胞的基因组中;以及(ii)蛋白质外部;其中所述遗传元件被封闭在所述蛋白质外部内;并且其中指环体能够将遗传元件递送到真核细胞中。
[1377]
在本文描述的指环体的一些实施例中,遗传元件以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合。在一些实施例中,施用给受试者的多个指环体的少于约0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%或5%的遗传元件将整合到受试者的一个或多个宿主细胞的基因组中。在一些实施例中,例如本文所述的指环体的群体的遗传元件以低于相当的aav病毒群体的频率的频率整合到宿主细胞的基因组中,例如以比相当的aav病毒群体的频率低约50%、60%、70%、75%、80%、85%、90%、95%、100%或更低的频率。
[1378]
在一个方面,本发明包括指环体,其包含:(i)遗传元件,其包含启动子元件和编码效应子(例如内源性效应子或外源性效应子,例如有效负载)的序列,以及蛋白质结合序列(例如外部蛋白质结合序列),其中遗传元件与野生型指环病毒序列(例如,野生型细环病毒(ttv)、细小环病毒(ttmv)或ttmdv序列,例如,表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列的野生型指环病毒序列)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或
100%)序列同一性;以及(ii)蛋白质外部;其中所述遗传元件被封闭在所述蛋白质外部内;并且其中指环体能够将遗传元件递送到真核细胞中。
[1379]
在一个方面,本发明包括指环体,其包含:
[1380]
a)遗传元件,其包含(i)编码外部蛋白质(例如,非致病性外部蛋白质)的序列,(ii)使所述遗传元件与所述非致病性外部蛋白质结合的外部蛋白质结合序列,和(iii)编码效应子(例如内源性效应子或外源性效应子)的序列;以及
[1381]
b)与所述遗传元件相关联(例如包封或封闭所述遗传元件)的蛋白质外部。
[1382]
在一些实施例中,所述指环体包括来自非包膜、环状、单链dna病毒的序列或表达产物(或与其具有>70%、75%、80%、85%、90%、95%、97%、98%、99%、100%同源性)。动物环状单链dna病毒通常是指感染真核非植物宿主并具有环状基因组的单链dna(ssdna)病毒亚组。因此,动物环状ssdna病毒可区别于感染原核生物的ssdna病毒(即微病毒科和丝状噬菌体科)和感染植物的ssdna病毒(即双生病毒科和矮化病毒科)。它们也可区别于感染非植物真核生物的线性ssdna病毒(即细小病毒科)。
[1383]
在一些实施例中,所述指环体例如瞬时或长期地调节宿主细胞功能。在某些实施例中,细胞功能发生稳定地改变,例如调节持续存在至少约1小时至约30天,或至少约2小时、6小时、12小时、18小时、24小时、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天、21天、22天、23天、24天、25天、26天、27天、28天、29天、30天、60天或更长时间或其间的任何时间。在某些实施例中,细胞功能发生瞬时地改变,例如调节持续存在不超过约30分钟至约7天、或不超过约1小时、2小时,3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、24小时、36小时、48小时、60小时、72小时、4天、5天、6天、7天或其间的任何时间。
[1384]
在一些实施例中,遗传元件包括启动子元件。在实施例中,启动子元件选自rna聚合酶ii依赖性启动子、rna聚合酶iii依赖性启动子、pgk启动子、cmv启动子、ef

1α启动子、sv40启动子、cagg启动子或ubc启动子、ttv病毒启动子、组织特异性u6(polliii)、具有激活蛋白(tetr

vp16、gal4

vp16、dcas9

vp16等)的上游dna结合位点的最小cmv启动子。在实施例中,启动子元件包含tata盒。在实施例中,启动子元件对于野生型指环病毒(例如本文所述)是内源性的。
[1385]
在一些实施例中,遗传元件包括以下一种或多种特征:单链、环状、负链和/或dna。在实施例中,遗传元件包括附加体。在一些实施例中,除效应子之外的遗传元件部分的组合大小为约2.5kb

5kb(例如,约2.8kb

4kb、约2.8kb

3.2kb、约3.6kb

3.9kb或约2.8kb

2.9kb)、小于约5kb(例如,小于约2.9kb、3.2kb、3.6kb、3.9kb或4kb)或至少100个核苷酸(例如,至少1kb)。
[1386]
在一些情况下,本文所述的指环体、包含指环体的组合物、使用所述指环体的方法等部分基于实例,这些实例说明了不同的效应子(例如mirna(例如针对ifn或mir

625)、shrna等)和蛋白质结合序列(例如与衣壳蛋白例如q99153结合的dna序列)如何与蛋白质外部(例如arch virol[病毒学文献](2007)152:1961

1975中披露的衣壳)组合,产生可随后用于将效应子递送至细胞(例如动物细胞,例如人细胞或非人动物细胞,例如猪或小鼠细胞)的指环体。在实施例中,效应子可以沉默诸如干扰素的因子的表达。实例进一步描述了
如何通过将效应子插入例如衍生自指环病毒的序列中来制备指环体。基于这些实例,下文中的描述考虑了实例中所考虑的具体发现和组合的各种变型。例如,技术人员将从实例中理解,特定mirna仅用作效应子的实例,而其他效应子可以是例如其他调节性核酸或治疗性肽。类似地,实例中使用的特定衣壳可以替换为下文所述的基本上非致病性的蛋白质。在实例中描述的特定指环病毒序列也可以替换为下文描述的指环病毒序列。这些考虑类似地适用于蛋白质结合序列、调节性序列例如启动子等。独立于此,本领域技术人员将特别考虑与实例紧密相关的这些实施例。
[1387]
在一些实施例中,将指环体或指环体中包含的遗传元件引入细胞(例如人细胞)中。在一些实施例中,例如由指环体的遗传元件编码的效应子(例如,rna,例如mirna)在细胞(例如,人细胞)中表达,例如,一旦将指环体或遗传元件引入细胞中。在实施例中,将指环体或其中包含的遗传元件引入细胞中例如通过改变细胞中靶分子的表达水平,来调节(例如,增加或减少)靶分子(例如,靶核酸,例如rna,或靶多肽)在细胞中的水平。在实施例中,引入指环体或其中包含的遗传元件降低了细胞产生的干扰素的水平。在实施例中,将指环体或其中包含的遗传元件引入细胞中调节(例如,增加或减少)细胞的功能。在实施例中,将指环体或其中包含的遗传元件引入细胞中调节(例如,增加或降低)细胞的存活力。在实施例中,将指环体或其中包含的遗传元件引入细胞中降低了细胞(例如癌细胞)的存活力。
[1388]
在一些实施例中,本文描述的指环体(例如,合成的指环体)诱导小于70%的抗体流行率(例如小于约60%、50%、40%、30%、20%或10%抗体流行率)。在实施例中,根据本领域已知的方法测定抗体流行率。在实施例中,通过检测生物样品中的针对指环病毒(例如本文所述)或基于其的指环体的抗体来测定抗体流行率,例如,根据tsuda等人(1999;j.virol.methods[病毒学方法杂志]77:199

206;通过引用并入本文)中所述的抗ttv抗体检测方法和/或kakkola等人(2008;virology[病毒学]382:182

189;通过引用并入本文)中所述的测定抗ttv igg血清阳性率的方法。针对指环病毒或基于其的指环体的抗体还可以通过本领域中检测抗病毒抗体的方法来检测,例如检测抗aav抗体的方法,例如calcedo等人(2013;front.immunol.[免疫学前沿]4(341):1

7;通过引用并入本文)。
[1389]
在一些实施例中,复制不足、复制缺陷或复制无能力遗传元件不编码遗传元件复制所需的所有必要机器或组分。在一些实施例中,复制缺陷遗传元件不编码复制因子。在一些实施例中,复制缺陷遗传元件不编码一个或多个orf(例如,orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3和/或orf2t/3,例如,如本文所述)。在一些实施例中,可以以反式提供不由遗传元件编码的机器或组分(例如,使用辅助病毒,例如辅助病毒或辅助质粒,或在由宿主细胞包含的核酸中编码,例如整合到宿主细胞的基因组中),例如,使得遗传元件可以在以反式提供的机器或组分的存在下进行复制。
[1390]
在一些实施例中,包装不足、包装缺陷或包装无能的遗传元件不能被包装到蛋白质外部(例如,其中蛋白质外部包含衣壳或其部分,例如包含由orf1核酸编码的多肽,例如,如本文所述)中。在一些实施例中,与野生型指环病毒(例如,如本文所述)相比,包装缺陷遗传元件以小于10%(例如,小于10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%或0.001%)的效率包装进入蛋白质外部中。在一些实施例中,即使在允许包装野生型指环病毒的遗传元件(例如,如本文所述)的因子(例如,orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、或orf2t/3)存在下,包装缺陷遗传元件也不能被包装到蛋白质外部
中。在一些实施例中,即使在允许包装野生型指环病毒的遗传元件(例如,如本文所述)的因子(例如,orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3或orf2t/3)存在下,与野生型指环病毒(例如,如本文所述)相比,包装缺陷遗传元件以小于10%(例如,小于10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%或0.001%)的效率包装进入蛋白质外部中。
[1391]
在一些实施例中,包装感受态遗传元件可被包装到蛋白质外部(例如,其中蛋白质外部包含衣壳或其部分,例如包含由orf1核酸编码的多肽,例如,如本文所述)中。在一些实施例中,与野生型指环病毒(例如,如本文所述)相比,包装感受态遗传元件以至少20%(例如,至少20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%或更高)的效率包装进入蛋白质外部中。在一些实施例中,在允许包装野生型指环病毒的遗传元件(例如,如本文所述)的因子(例如,orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、或orf2t/3)存在下,包装感受态遗传元件能被包装到蛋白质外部中。在一些实施例中,在允许包装野生型指环病毒的遗传元件(例如,如本文所述)的因子(例如,orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3或orf2t/3)存在下,与野生型指环病毒(例如,如本文所述)相比,包装感受态遗传元件以至少20%(例如,至少20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%或更高)的效率包装进入蛋白质外部中。
[1392]
指环病毒
[1393]
在一些实施例中,例如本文所述的指环体包括衍生自指环病毒的序列或表达产物。在一些实施例中,指环体包括相对于指环病毒是外源的一种或多种序列或表达产物。在一些实施例中,指环体包括相对于指环病毒是内源的一种或多种序列或表达产物。在一些实施例中,指环体包括相对于指环体中的一种或多种其他序列或表达产物是异源的一种或多种序列或表达产物。指环病毒通常具有负极性的单链环状dna基因组。指环病毒通常与任何人疾病无关联。但是,在一个或多个对照队列群体中无症状的指环病毒病毒血症发生率高,指环病毒病毒科内显著的基因组多样性,病史上无法在体外传播所述因子以及缺乏指环病毒疾病的一种或多种动物模型妨碍了将指环病毒感染与人疾病相关联的尝试(yzebe等人,panminerva med.[帕米涅瓦医学](2002)44:167

177;biagini,p.,vet.microbiol.[兽医微生物学](2004)98:95

101)。
[1394]
指环病毒通常是通过口鼻或粪口感染、母婴传播和/或子宫内传播而传播的(gerner等人,ped.infect.dis.j.[小儿传染病杂志](2000)19:1074

1077)。在一些情况下,感染者的特征可以是延长(数月至数年)的指环病毒属病毒血症。人可以共同感染一种以上的基因群或菌株(saback,等人,scad.j.infect.dis.[斯堪的纳维亚感染病杂志](2001)33:121

125)。有建议认为这些基因群可以在感染者内重组(rey等人,infect.[感染](2003)31:226

233)。在诸如肝脏、外周血单核细胞和骨髓的几种组织中发现了双链同工型(复制性)中间体(kikuchi等人,j.med.virol.[医学病毒学杂志](2000)61:165

170;okamoto等人,biochem.biophys.res.commun.[生物化学和生物物理研究通讯](2002)270:657

662;rodriguez

lnigo等人,am.j.pathol.[美国病理学杂志](2000)156:1227

1234)。
[1395]
在一些实施例中,遗传元件包含编码以下的核苷酸序列:氨基酸序列或其功能片段或与本文所述的氨基酸序列中任一个(例如,指环病毒氨基酸序列)具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[1396]
在一些实施例中,本文所述的指环体包含一个或多个核酸分子(例如本文所述的遗传元件),其包含与例如本文所述的指环病毒序列或其片段具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,指环体包含选自以下的核酸序列:表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所示的序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,指环体包含多肽,所述多肽包含如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中任一个中所示的序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[1397]
在一些实施例中,本文所述的指环体包含一个或多个核酸分子(例如,如本文所述的遗传元件),其包含与本文所述的任一指环病毒(例如,表a1

a12、b1

b5、c1

c5或1

18中任一个中注释或所列序列编码的指环病毒序列)的tata盒、帽位点、起始元件、转录起始位点、5'utr保守结构域、orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3、三开放阅读框区、聚(a)信号、gc富集区、或其任何组合中的一个或多个具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,核酸分子包含编码衣壳蛋白的序列,例如本文所述的任一指环病毒(例如,表a1

a12或1

18中任一个中注释或所列序列编码的指环病毒序列)的orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3、orf2t/3序列。在实施例中,核酸分子包含编码衣壳蛋白的序列,所述衣壳蛋白包含与指环病毒orf1或orf2蛋白(例如,表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所示的orf1或orf2氨基酸序列,或表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所示的核酸序列编码的orf1或orf2氨基酸序列)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,核酸分子包含编码衣壳蛋白的序列,所述衣壳蛋白包含与指环病毒orf1蛋白(例如,表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所示的orf1氨基酸序列,或表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所示的核酸序列编码的orf1氨基酸序列)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[1398]
在实施例中,核酸分子包含与表a1的指环病毒orf1核苷酸序列(例如,表a1的核酸序列的核苷酸574

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒orf1/1核苷酸序列(例如表a1的核酸序列的核苷酸574

699和/或2326

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒orf1/2核苷酸序列(例如表a1的核酸序列的核苷酸574

699和/或2552

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒orf2核苷酸序列(例如,表a1的核酸序列的核苷酸335

703)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒orf2/2核苷酸序列(例如表a1的核酸序列的核苷酸335

699和/
或2326

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒orf2/3核苷酸序列(例如表a1的核酸序列的核苷酸335

699和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒orf2t/3核苷酸序列(例如表a1的核酸序列的核苷酸335

465和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒tata盒核苷酸序列(例如,表a1的核酸序列的核苷酸77

81)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒起始元件核苷酸序列(例如,表a1的核酸序列的核苷酸95

110)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒转录起始位点核苷酸序列(例如,表a1的核酸序列的核苷酸105)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒5'utr保守结构域核苷酸序列(例如,表a1的核酸序列的核苷酸165

235)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒三开放阅读框区核苷酸序列(例如,表a1的核酸序列的核苷酸2535

2746)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒聚(a)信号核苷酸序列(例如,表a1的核酸序列的核苷酸2953

2958)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a1的指环病毒gc富集核苷酸序列(例如,表a1的核酸序列的核苷酸3620

3648)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1399]
在实施例中,核酸分子包含与表a3的指环病毒orf1核苷酸序列(例如,表a3的核酸序列的核苷酸599

2887)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒orf1/1核苷酸序列(例如,表a3的核酸序列的核苷酸599

724和/或2414

2887)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒orf1/2核苷酸序列(例如,表a3的核酸序列的核苷酸599

724和/或2643

2849)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒orf2核苷酸序列(例如,表a3的核酸序列的核苷酸342

728)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒orf2/2核苷酸序列(例如,表a3的核酸序列的核苷酸342

724和/或2414

2849)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒orf2/3核苷酸序列(例如,表a3的核酸序列的核苷酸342

724和/或2643

3057)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例
中,核酸分子包含与表a3的指环病毒tata盒核苷酸序列(例如,表a3的核酸序列的核苷酸87

91)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒起始元件核苷酸序列(例如,表a3的核酸序列的核苷酸105

120)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒转录起始位点核苷酸序列(例如,表a3的核酸序列的核苷酸115)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒5'utr保守结构域核苷酸序列(例如,表a3的核酸序列的核苷酸175

245)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒三开放阅读框区核苷酸序列(例如,表a3的核酸序列的核苷酸2626

2846)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a3的指环病毒聚(a)信号核苷酸序列(例如,表a3的核酸序列的核苷酸3052

3058)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1400]
在实施例中,核酸分子包含与表a5的指环病毒orf1核苷酸序列(例如,表a5的核酸序列的核苷酸556

2904)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒orf1/1核苷酸序列(例如,表a5的核酸序列的核苷酸556

687和/或2422

2904)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒orf1/2核苷酸序列(例如,表a5的核酸序列的核苷酸556

687和/或2564

2878)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒orf2核苷酸序列(例如,表a5的核酸序列的核苷酸305

691)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒orf2/2核苷酸序列(例如,表a5的核酸序列的核苷酸305

687和/或2422

2878)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒orf2/3核苷酸序列(例如,表a5的核酸序列的核苷酸305

687和/或2564

3317)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒orf2t/3核苷酸序列(例如,表a5的核酸序列的核苷酸305

360和/或2564

3317)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒tata盒核苷酸序列(例如,表a5的核酸序列的核苷酸50

55)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒起始元件核苷酸序列(例如,表a5的核酸序列的核苷酸68

83)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒转录起始位点核苷酸序列(例如,表a5的核酸序列的核苷酸78)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、
98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒5'utr保守结构域核苷酸序列(例如,表a5的核酸序列的核苷酸138

208)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒三开放阅读框区核苷酸序列(例如,表a5的核酸序列的核苷酸2626

2846)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a5的指环病毒聚(a)信号核苷酸序列(例如,表a5的核酸序列的核苷酸3316

3319)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1401]
在实施例中,核酸分子包含与表a7的指环病毒orf1核苷酸序列(例如,表a7的核酸序列的核苷酸589

2889)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒orf1/1核苷酸序列(例如,表a7的核酸序列的核苷酸589

711和/或2362

2889)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒orf1/2核苷酸序列(例如,表a7的核酸序列的核苷酸589

711和/或2555

2863)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒orf2核苷酸序列(例如,表a7的核酸序列的核苷酸353

715)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒orf2/2核苷酸序列(例如,表a7的核酸序列的核苷酸353

711和/或2362

2863)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒orf2/3核苷酸序列(例如,表a7的核酸序列的核苷酸353

711和/或2555

3065)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒orf2t/3核苷酸序列(例如,表a7的核酸序列的核苷酸353

432和/或2555

3065)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒tata盒核苷酸序列(例如,表a7的核酸序列的核苷酸86

90)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒起始元件核苷酸序列(例如,表a7的核酸序列的核苷酸104

119)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒转录起始位点核苷酸序列(例如,表a7的核酸序列的核苷酸114)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒5'utr保守结构域核苷酸序列(例如,表a7的核酸序列的核苷酸174

244)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒三开放阅读框区核苷酸序列(例如,表a7的核酸序列的核苷酸2555

2863)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒聚(a)信号核苷酸序列(例如,表a7的核酸序列的核苷酸3062

3066)具有至少约70%、75%、80%、
85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a7的指环病毒gc富集核苷酸序列(例如,表a7的核酸序列的核苷酸3720

3742)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1402]
在实施例中,核酸分子包含与表a9的指环病毒orf1核苷酸序列(例如,表a9的核酸序列的核苷酸511

2793)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒orf1/1核苷酸序列(例如,表a9的核酸序列的核苷酸511

711和/或2326

2793)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒orf1/2核苷酸序列(例如,表a9的核酸序列的核苷酸511

711和/或2525

2767)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒orf2核苷酸序列(例如,表a9的核酸序列的核苷酸272

637)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒orf2/2核苷酸序列(例如,表a9的核酸序列的核苷酸272

633和/或2326

2767)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒orf2/3核苷酸序列(例如,表a9的核酸序列的核苷酸272

633和/或2525

2984)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒orf2t/3核苷酸序列(例如,表a9的核酸序列的核苷酸272

633和/或2525

2984)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒tata盒核苷酸序列(例如,表a9的核酸序列的核苷酸12

17)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒起始元件核苷酸序列(例如,表a9的核酸序列的核苷酸30

45)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒转录起始位点核苷酸序列(例如,表a9的核酸序列的核苷酸40)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒5'utr保守结构域核苷酸序列(例如表a9的核酸序列的核苷酸100

171)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒三开放阅读框区核苷酸序列(例如,表a9的核酸序列的核苷酸2525

2767)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a9的指环病毒聚(a)信号核苷酸序列(例如,表a9的核酸序列的核苷酸2981

2985)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1403]
在实施例中,核酸分子包含与表a11的指环病毒orf1核苷酸序列(例如,表a11的核酸序列的核苷酸704

3001)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒
orf1/1核苷酸序列(例如,表a11的核酸序列的核苷酸704

826和/或2534

3001)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒orf1/2核苷酸序列(例如,表a11的核酸序列的核苷酸704

826和/或2721

2975)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒orf2核苷酸序列(例如,表a11的核酸序列的核苷酸465

830)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒orf2/2核苷酸序列(例如,表a11的核酸序列的核苷酸465

826和/或2534

2975)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒orf2/3核苷酸序列(例如,表a11的核酸序列的核苷酸465

826和/或2721

3192)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒orf2t/3核苷酸序列(例如,表a11的核酸序列的核苷酸465

595和/或2721

3192)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒tata盒核苷酸序列(例如,表a11的核酸序列的核苷酸206

210)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒起始元件核苷酸序列(例如,表a11的核酸序列的核苷酸224

239)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒转录起始位点核苷酸序列(例如,表a11的核酸序列的核苷酸234)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒5'utr保守结构域核苷酸序列(例如,表a11的核酸序列的核苷酸294

364)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒三开放阅读框区核苷酸序列(例如,表a11的核酸序列的核苷酸2721

2975)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒聚(a)信号核苷酸序列(例如,表a11的核酸序列的核苷酸3189

3193)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表a11的指环病毒gc富集核苷酸序列(例如,表a11的核酸序列的核苷酸3844

3895)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1404]
在实施例中,核酸分子包含与表b1的指环病毒orf1核苷酸序列(例如,表b1的核酸序列的核苷酸574

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒orf1/1核苷酸序列(例如表b1的核酸序列的核苷酸574

699和/或2326

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒orf1/2核苷酸序列(例如表b1的核酸序列的核苷酸574

699和/或2552

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、
98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒orf2核苷酸序列(例如,表b1的核酸序列的核苷酸335

703)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒orf2/2核苷酸序列(例如表b1的核酸序列的核苷酸335

699和/或2326

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒orf2/3核苷酸序列(例如表b1的核酸序列的核苷酸335

699和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒orf2t/3核苷酸序列(例如表b1的核酸序列的核苷酸335

465和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒tata盒核苷酸序列(例如,表b1的核酸序列的核苷酸77

81)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒起始元件核苷酸序列(例如,表b1的核酸序列的核苷酸95

110)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒转录起始位点核苷酸序列(例如,表b1的核酸序列的核苷酸105)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒5'utr保守结构域核苷酸序列(例如,表b1的核酸序列的核苷酸165

235)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒三开放阅读框区核苷酸序列(例如,表b1的核酸序列的核苷酸2535

2746)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒聚(a)信号核苷酸序列(例如,表b1的核酸序列的核苷酸2953

2958)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b1的指环病毒gc富集核苷酸序列(例如,表b1的核酸序列的核苷酸3620

3648)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1405]
在实施例中,核酸分子包含与表b2的指环病毒orf1核苷酸序列(例如,表b2的核酸序列的核苷酸574

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒orf1/1核苷酸序列(例如表b2的核酸序列的核苷酸574

699和/或2326

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒orf1/2核苷酸序列(例如表b2的核酸序列的核苷酸574

699和/或2552

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒orf2核苷酸序列(例如,表b2的核酸序列的核苷酸335

703)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒orf2/2核苷酸序列(例如表b2的核酸序列的核苷酸335

699和/
或2326

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒orf2/3核苷酸序列(例如表b2的核酸序列的核苷酸335

699和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒orf2t/3核苷酸序列(例如表b2的核酸序列的核苷酸335

465和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒tata盒核苷酸序列(例如,表b2的核酸序列的核苷酸77

81)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒起始元件核苷酸序列(例如,表b2的核酸序列的核苷酸95

110)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒转录起始位点核苷酸序列(例如,表b2的核酸序列的核苷酸105)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒5'utr保守结构域核苷酸序列(例如,表b2的核酸序列的核苷酸165

235)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒三开放阅读框区核苷酸序列(例如,表b2的核酸序列的核苷酸2535

2746)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒聚(a)信号核苷酸序列(例如,表b2的核酸序列的核苷酸2953

2958)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b2的指环病毒gc富集核苷酸序列(例如,表b2的核酸序列的核苷酸3620

3648)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1406]
在实施例中,核酸分子包含与表b3的指环病毒orf1核苷酸序列(例如,表b3的核酸序列的核苷酸574

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒orf1/1核苷酸序列(例如表b3的核酸序列的核苷酸574

699和/或2326

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒orf1/2核苷酸序列(例如表b3的核酸序列的核苷酸574

699和/或2552

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒orf2核苷酸序列(例如,表b3的核酸序列的核苷酸335

703)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒orf2/2核苷酸序列(例如表b3的核酸序列的核苷酸335

699和/或2326

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒orf2/3核苷酸序列(例如表b3的核酸序列的核苷酸335

699和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例
中,核酸分子包含与表b3的指环病毒orf2t/3核苷酸序列(例如表b3的核酸序列的核苷酸335

465和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒tata盒核苷酸序列(例如,表b3的核酸序列的核苷酸77

81)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒起始元件核苷酸序列(例如,表b3的核酸序列的核苷酸95

110)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒转录起始位点核苷酸序列(例如,表b3的核酸序列的核苷酸105)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒5'utr保守结构域核苷酸序列(例如,表b3的核酸序列的核苷酸165

235)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒三开放阅读框区核苷酸序列(例如,表b3的核酸序列的核苷酸2535

2746)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒聚(a)信号核苷酸序列(例如,表b3的核酸序列的核苷酸2953

2958)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b3的指环病毒gc富集核苷酸序列(例如,表b3的核酸序列的核苷酸3620

3648)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1407]
在实施例中,核酸分子包含与表b4的指环病毒orf1核苷酸序列(例如,表b4的核酸序列的核苷酸574

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒orf1/1核苷酸序列(例如表b4的核酸序列的核苷酸574

699和/或2326

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒orf1/2核苷酸序列(例如表b4的核酸序列的核苷酸574

699和/或2552

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒orf2核苷酸序列(例如,表b4的核酸序列的核苷酸335

703)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒orf2/2核苷酸序列(例如表b4的核酸序列的核苷酸335

699和/或2326

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒orf2/3核苷酸序列(例如表b4的核酸序列的核苷酸335

699和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒orf2t/3核苷酸序列(例如表b4的核酸序列的核苷酸335

465和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒tata盒核苷酸序列(例如,表b4的核酸序列的核苷酸77

81)具有至少约70%、75%、80%、85%、
90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒起始元件核苷酸序列(例如,表b4的核酸序列的核苷酸95

110)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒转录起始位点核苷酸序列(例如,表b4的核酸序列的核苷酸105)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒5'utr保守结构域核苷酸序列(例如,表b4的核酸序列的核苷酸165

235)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒三开放阅读框区核苷酸序列(例如,表b4的核酸序列的核苷酸2535

2746)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒聚(a)信号核苷酸序列(例如,表b4的核酸序列的核苷酸2953

2958)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b4的指环病毒gc富集核苷酸序列(例如,表b4的核酸序列的核苷酸3620

3648)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1408]
在实施例中,核酸分子包含与表b5的指环病毒orf1核苷酸序列(例如,表b5的核酸序列的核苷酸574

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒orf1/1核苷酸序列(例如表b5的核酸序列的核苷酸574

699和/或2326

2775)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒orf1/2核苷酸序列(例如表b5的核酸序列的核苷酸574

699和/或2552

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒orf2核苷酸序列(例如,表b5的核酸序列的核苷酸335

703)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒orf2/2核苷酸序列(例如表b5的核酸序列的核苷酸335

699和/或2326

2759)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒orf2/3核苷酸序列(例如表b5的核酸序列的核苷酸335

699和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒orf2t/3核苷酸序列(例如表b5的核酸序列的核苷酸335

465和/或2552

2957)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒tata盒核苷酸序列(例如,表b5的核酸序列的核苷酸77

81)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒起始元件核苷酸序列(例如,表b5的核酸序列的核苷酸95

110)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒转录起始位点核苷酸序列(例如,表
b5的核酸序列的核苷酸105)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒5'utr保守结构域核苷酸序列(例如,表b5的核酸序列的核苷酸165

235)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒三开放阅读框区核苷酸序列(例如,表b5的核酸序列的核苷酸2535

2746)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒聚(a)信号核苷酸序列(例如,表b5的核酸序列的核苷酸2953

2958)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表b5的指环病毒gc富集核苷酸序列(例如,表b5的核酸序列的核苷酸3620

3648)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1409]
在实施例中,核酸分子包含与表1的指环病毒orf1核苷酸序列(例如,表1的核酸序列的核苷酸571

2613)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒orf1/1核苷酸序列(例如,表1的核酸序列的核苷酸571

587和/或2137

2613)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒orf1/2核苷酸序列(例如,表1的核酸序列的核苷酸571

687和/或2339

2659)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒orf2核苷酸序列(例如,表1的核酸序列的核苷酸299

691)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒orf2/2核苷酸序列(例如,表1的核酸序列的核苷酸299

687和/或2137

2659)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒orf2/3核苷酸序列(例如,表1的核酸序列的核苷酸299

687和/或2339

2831)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒orf2t/3核苷酸序列(例如,表1的核酸序列的核苷酸299

348和/或2339

2831)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒tata盒核苷酸序列(例如,表1的核酸序列的核苷酸84

90)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒帽位点核苷酸序列(例如,表1的核酸序列的核苷酸107

114)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒转录起始位点核苷酸序列(例如,表1的核酸序列的核苷酸114)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒5'utr保守结构域核苷酸序列(例如,表1的核酸序列的核苷酸177

247)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子
包含与表1的指环病毒三开放阅读框区核苷酸序列(例如,表1的核酸序列的核苷酸2325

2610)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒聚(a)信号核苷酸序列(例如,表1的核酸序列的核苷酸2813

2818)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表1的指环病毒gc富集核苷酸序列(例如,表1的核酸序列的核苷酸3415

3570)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1410]
在实施例中,核酸分子包含与表3的指环病毒orf1核苷酸序列(例如,表3的核酸序列的核苷酸729

2972)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒orf1/1核苷酸序列(例如,表3的核酸序列的核苷酸729

908和/或2490

2972)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒orf1/2核苷酸序列(例如,表3的核酸序列的核苷酸729

908和/或2725

3039)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒orf2核苷酸序列(例如,表3的核酸序列的核苷酸412

912)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒orf2/2核苷酸序列(例如,表3的核酸序列的核苷酸412

908和/或2490

3039)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒orf2/3核苷酸序列(例如,表3的核酸序列的核苷酸412

908和/或2725

3208)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒tata盒核苷酸序列(例如,表3的核酸序列的核苷酸112

119)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒起始元件核苷酸序列(例如,表3的核酸序列的核苷酸128

148)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒转录起始位点核苷酸序列(例如,表3的核酸序列的核苷酸148)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒5'utr保守结构域核苷酸序列(例如,表3的核酸序列的核苷酸204

273)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒三开放阅读框区核苷酸序列(例如,表3的核酸序列的核苷酸2699

2969)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒聚(a)信号核苷酸序列(例如,表3的核酸序列的核苷酸3220

3225)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表3的指环病毒gc富集核苷酸序列(例如,表3的核酸序列的核苷酸3302

3541)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1411]
在实施例中,核酸分子包含与表5的指环病毒orf1核苷酸序列(例如,表5的核酸序列的核苷酸599

2830)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒orf1/1核苷酸序列(例如,表5的核酸序列的核苷酸599

715和/或2363

2830)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒orf1/2核苷酸序列(例如,表5的核酸序列的核苷酸599

715和/或2565

2789)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒orf2核苷酸序列(例如,表5的核酸序列的核苷酸336

719)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒orf2/2核苷酸序列(例如,表5的核酸序列的核苷酸336

715和/或2363

2789)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒orf2/3核苷酸序列(例如,表5的核酸序列的核苷酸336

715和/或2565

3015)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒orf2t/3核苷酸序列(例如,表5的核酸序列的核苷酸336

388和/或2565

3015)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒tata盒核苷酸序列(例如,表5的核酸序列的核苷酸83

88)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒帽位点核苷酸序列(例如,表5的核酸序列的核苷酸104

111)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒转录起始位点核苷酸序列(例如,表5的核酸序列的核苷酸111)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒5'utr保守结构域核苷酸序列(例如,表5的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒三开放阅读框区域核苷酸序列(例如,表5的核酸序列的核苷酸2551

2786)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒聚(a)信号核苷酸序列(例如,表5的核酸序列的核苷酸3011

3016)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表5的指环病毒gc富集核苷酸序列(例如,表5的核酸序列的核苷酸3632

3753)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1412]
在实施例中,核酸分子包含与表7的指环病毒orf1核苷酸序列(例如,表7的核酸序列的核苷酸586

2928)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒orf1/1核苷酸序列(例如,表7的核酸序列的核苷酸586

717和/或2446

2928)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实
施例中,核酸分子包含与表7的指环病毒orf1/2核苷酸序列(例如,表7的核酸序列的核苷酸586

717和/或2675

2902)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒orf2核苷酸序列(例如,表7的核酸序列的核苷酸335

721)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒orf2/2核苷酸序列(例如,表7的核酸序列的核苷酸335

717和/或2446

2902)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒orf2/3核苷酸序列(例如,表7的核酸序列的核苷酸335

717和/或2675

3109)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒tata盒核苷酸序列(例如,表7的核酸序列的核苷酸82

87)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒起始元件核苷酸序列(例如,表7的核酸序列的核苷酸95

115)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒转录起始位点核苷酸序列(例如,表7的核酸序列的核苷酸115)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒5'utr保守结构域核苷酸序列(例如,表7的核酸序列的核苷酸170

238)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒三开放阅读框区域核苷酸序列(例如,表7的核酸序列的核苷酸2640

2899)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒聚(a)信号核苷酸序列(例如,表7的核酸序列的核苷酸3106

3114)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表7的指环病毒gc富集核苷酸序列(例如,表7的核酸序列的核苷酸3768

3878)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1413]
在实施例中,核酸分子包含与表9的指环病毒orf1核苷酸序列(例如,表9的核酸序列的核苷酸588

2873)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒orf1/1核苷酸序列(例如,表9的核酸序列的核苷酸588

722和/或2412

2873)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒orf1/2核苷酸序列(例如,表9的核酸序列的核苷酸588

722和/或2638

2847)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒orf2核苷酸序列(例如,表9的核酸序列的核苷酸331

726)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒orf2/2核苷酸序列(例如,表9的核酸序列的核苷酸331

722和/或2412

2847)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%
序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒orf2/3核苷酸序列(例如,表9的核酸序列的核苷酸331

722和/或2638

3058)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒orf2t/3核苷酸序列(例如,表9的核酸序列的核苷酸331

380和/或2638

3058)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒tata盒核苷酸序列(例如,表9的核酸序列的核苷酸82

86)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒起始元件核苷酸序列(例如,表9的核酸序列的核苷酸100

115)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒转录起始位点核苷酸序列(例如,表9的核酸序列的核苷酸115)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒5'utr保守结构域核苷酸序列(例如,表9的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒三开放阅读框区核苷酸序列(例如,表9的核酸序列的核苷酸2699

2969)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒聚(a)信号核苷酸序列(例如,表9的核酸序列的核苷酸3220

3225)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表9的指环病毒gc富集核苷酸序列(例如,表9的核酸序列的核苷酸3302

3541)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1414]
在实施例中,核酸分子包含与表11的指环病毒orf1核苷酸序列(例如,表11的核酸序列的核苷酸599

2839)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒orf1/1核苷酸序列(例如,表11的核酸序列的核苷酸599

727和/或2381

2839)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒orf1/2核苷酸序列(例如,表11的核酸序列的核苷酸599

727和/或2619

2813)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒orf2核苷酸序列(例如,表11的核酸序列的核苷酸357

731)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒orf2/2核苷酸序列(例如,表11的核酸序列的核苷酸357

727和/或2381

2813)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒orf2/3核苷酸序列(例如,表11的核酸序列的核苷酸357

727和/或2619

3021)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒orf2t/3核苷酸序列(例如,表11的核酸序列的核苷酸357

406和/或2619

3021)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、
99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒tata盒核苷酸序列(例如,表11的核酸序列的核苷酸89

90)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒帽位点核苷酸序列(例如,表11的核酸序列的核苷酸107

114)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒转录起始位点核苷酸序列(例如,表11的核酸序列的核苷酸114)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒5'utr保守结构域核苷酸序列(例如,表11的核酸序列的核苷酸174

244)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒三开放阅读框区核苷酸序列(例如,表11的核酸序列的核苷酸2596

2810)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒聚(a)信号核苷酸序列(例如,表11的核酸序列的核苷酸3017

3022)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表11的指环病毒gc富集核苷酸序列(例如,表11的核酸序列的核苷酸3691

3794)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1415]
在实施例中,核酸分子包含与表13的指环病毒orf1核苷酸序列(例如,表13的核酸序列的核苷酸599

2896)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒orf1/1核苷酸序列(例如,表13的核酸序列的核苷酸599

724和/或2411

2896)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒orf1/2核苷酸序列(例如,表13的核酸序列的核苷酸599

724和/或2646

2870)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒orf2核苷酸序列(例如,表13的核酸序列的核苷酸357

728)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒orf2/2核苷酸序列(例如,表13的核酸序列的核苷酸357

724和/或2411

2870)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒orf2/3核苷酸序列(例如,表13的核酸序列的核苷酸357

724和/或2646

3081)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒tata盒核苷酸序列(例如,表13的核酸序列的核苷酸82

86)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒起始元件核苷酸序列(例如,表13的核酸序列的核苷酸94

115)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒转录起始位点核苷酸序列(例如,表13的核酸序列的核苷酸115)具有至少约70%、
75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒5'utr保守结构域核苷酸序列(例如,表13的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒三开放阅读框区核苷酸序列(例如,表13的核酸序列的核苷酸2629

2867)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒聚(a)信号核苷酸序列(例如,表13的核酸序列的核苷酸3076

3086)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表13的指环病毒gc富集核苷酸序列(例如,表13的核酸序列的核苷酸3759

3866)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1416]
在实施例中,核酸分子包含与表15的指环病毒orf1核苷酸序列(例如,表15的核酸序列的核苷酸612

2612)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒orf1/1核苷酸序列(例如,表15的核酸序列的核苷酸612

719和/或2274

2612)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒orf1/2核苷酸序列(例如,表15的核酸序列的核苷酸612

719和/或2449

2589)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒orf2核苷酸序列(例如,表15的核酸序列的核苷酸424

723)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒orf2/2核苷酸序列(例如,表15的核酸序列的核苷酸424

719和/或2274

2589)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒orf2/3核苷酸序列(例如,表15的核酸序列的核苷酸424

719和/或2449

2812)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒tata盒核苷酸序列(例如,表15的核酸序列的核苷酸237

243)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒帽位点核苷酸序列(例如,表15的核酸序列的核苷酸260

267)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒转录起始位点核苷酸序列(例如,表15的核酸序列的核苷酸267)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒5'utr保守结构域核苷酸序列(例如,表15的核酸序列的核苷酸323

393)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒三开放阅读框区核苷酸序列(例如,表15的核酸序列的核苷酸2441

2586)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒聚(a)信号核苷酸序列(例如,表15的核酸序列的
核苷酸2808

2813)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表15的指环病毒gc富集核苷酸序列(例如,表15的核酸序列的核苷酸2868

2929)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1417]
在实施例中,核酸分子包含与表17的指环病毒orf1核苷酸序列(例如,表17的核酸序列的核苷酸432

2453)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒orf1/1核苷酸序列(例如,表17的核酸序列的核苷酸432

584和/或1977

2453)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒orf1/2核苷酸序列(例如,表17的核酸序列的核苷酸432

584和/或2197

2388)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒orf2核苷酸序列(例如,表17的核酸序列的核苷酸283

588)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒orf2/2核苷酸序列(例如,表17的核酸序列的核苷酸283

584和/或1977

2388)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒orf2/3核苷酸序列(例如,表17的核酸序列的核苷酸283

584和/或2197

2614)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒tata盒核苷酸序列(例如,表17的核酸序列的核苷酸21

25)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒帽位点核苷酸序列(例如,表17的核酸序列的核苷酸42

49)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒转录起始位点核苷酸序列(例如,表17的核酸序列的核苷酸49)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒5'utr保守结构域核苷酸序列(例如,表17的核酸序列的核苷酸117

187)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒三开放阅读框区核苷酸序列(例如,表17的核酸序列的核苷酸2186

2385)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒聚(a)信号核苷酸序列(例如,表17的核酸序列的核苷酸2676

2681)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表17的指环病毒gc富集核苷酸序列(例如,表17的核酸序列的核苷酸3054

3172)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[1418]
在实施例中,核酸分子包含编码与表a2的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a2的指环病毒orf1/1氨基酸序列具有
至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a2的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a2的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a2的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a2的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a2的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1419]
在实施例中,核酸分子包含编码与表a4的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a4的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a4的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a4的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a4的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a4的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1420]
在实施例中,核酸分子包含编码与表a6的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a6的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a6的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a6的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a6的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a6的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a6的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、
99%或100%序列同一性的氨基酸序列的核酸序列。
[1421]
在实施例中,核酸分子包含编码与表a8的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a8的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a8的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a8的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a8的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a8的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a8的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1422]
在实施例中,核酸分子包含编码与表a10的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a10的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a10的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a10的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a10的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a10的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a10的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1423]
在实施例中,核酸分子包含编码与表a12的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a12的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a12的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a12的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列
同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a12的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a12的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表a12的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1424]
在实施例中,核酸分子包含编码与表c1的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c1的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c1的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c1的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c1的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c1的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c1的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1425]
在实施例中,核酸分子包含编码与表c2的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c2的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c2的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c2的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c2的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c2的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c2的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1426]
在实施例中,核酸分子包含编码与表c3的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序
列的核酸序列。在实施例中,核酸分子包含编码与表c3的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c3的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c3的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c3的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c3的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c3的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1427]
在实施例中,核酸分子包含编码与表c4的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c4的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c4的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c4的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c4的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c4的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c4的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1428]
在实施例中,核酸分子包含编码与表c5的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c5的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c5的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c5的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c5的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c5的指环病毒
orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表c5的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1429]
在实施例中,核酸分子包含编码与表2的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表2的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表2的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表2的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表2的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表2的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表2的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1430]
在实施例中,核酸分子包含编码与表4的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表4的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表4的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表4的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表4的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表4的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1431]
在实施例中,核酸分子包含编码与表6的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表6的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表6的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表6的指环病毒orf2氨基酸序列
具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表6的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表6的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表6的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1432]
在实施例中,核酸分子包含编码与表8的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表8的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表8的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表8的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表8的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表8的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1433]
在实施例中,核酸分子包含编码与表10的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表10的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表10的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表10的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表10的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表10的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表10的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1434]
在实施例中,核酸分子包含编码与表12的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表12的指环病毒orf1/1氨基酸序列具有
至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表12的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表12的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表12的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表12的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表12的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1435]
在实施例中,核酸分子包含编码与表14的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表14的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表14的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表14的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表14的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表14的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1436]
在实施例中,核酸分子包含编码与表16的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表16的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表16的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表16的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表16的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表16的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1437]
在实施例中,核酸分子包含编码与表18的指环病毒orf1氨基酸序列具有至少约
70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表18的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表18的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表18的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表18的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。在实施例中,核酸分子包含编码与表18的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的核酸序列。
[1438]
在实施例中,本文所述的指环体包含具有与表a2的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a2的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a2的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a2的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a2的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a2的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a2的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表a1的核酸序列的核苷酸574

2775的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表a2的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1439]
在实施例中,本文所述的指环体包含具有与表a4的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a4的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a4的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a4的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、
97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a4的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a4的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表a3的核酸序列的核苷酸599

2887的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表a4的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1440]
在实施例中,本文所述的指环体包含具有与表a6的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a6的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a6的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a6的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a6的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a6的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a6的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表a5的核酸序列的核苷酸556

2904的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表a6的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1441]
在实施例中,本文所述的指环体包含具有与表a8的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a8的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a8的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a8的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a8的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a8的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、
85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a8的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表a7的核酸序列的核苷酸589

2889的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表a8的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1442]
在实施例中,本文所述的指环体包含具有与表a10的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a10的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a10的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a10的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a10的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a10的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a10的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表a9的核酸序列的核苷酸511

2793的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表a10的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1443]
在实施例中,本文所述的指环体包含具有与表a12的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a12的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a12的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a12的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a12的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表a12的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋
白质。在实施例中,本文所述的指环体包含具有与表a12的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表a11的核酸序列的核苷酸704

3001的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表a12的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1444]
在实施例中,本文所述的指环体包含具有与表c1的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c1的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c1的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c1的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c1的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c1的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c1的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c1的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表b1的核酸序列的核苷酸512

2545的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表c1的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1445]
在实施例中,本文所述的指环体包含具有与表c2的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c2的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c2的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c2的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c2的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c2的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、
85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c2的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c2的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表b2的核酸序列的核苷酸501

2489的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表c2的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1446]
在实施例中,本文所述的指环体包含具有与表c3的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c3的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c3的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c3的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c3的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c3的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c3的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c3的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表b3的核酸序列的核苷酸572

2758的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表c3的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1447]
在实施例中,本文所述的指环体包含具有与表c4的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c4的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c4的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c4的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环
体包含具有与表c4的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c4的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c4的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c4的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表b4的核酸序列的核苷酸581

2884的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表c4的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1448]
在实施例中,本文所述的指环体包含具有与表c5的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c5的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c5的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c5的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c5的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c5的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c5的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表c5的指环病毒taip氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表b5的核酸序列的核苷酸614

2911的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表c5的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1449]
在实施例中,本文所述的指环体包含具有与表2的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表2的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表2的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或
100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表2的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表2的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表2的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表2的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表1的核酸序列的核苷酸571

2613的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表2的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1450]
在实施例中,本文所述的指环体包含具有与表4的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表4的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表4的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表4的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表4的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表4的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表3的核酸序列的核苷酸729

2972的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表4的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1451]
在实施例中,本文所述的指环体包含具有与表6的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表6的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表6的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表6的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表6的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、
96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表6的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表6的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表5的核酸序列的核苷酸599

2830的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表6的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1452]
在实施例中,本文所述的指环体包含具有与表8的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表8的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表8的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表8的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表8的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表8的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表7的核酸序列的核苷酸586

2928的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表8的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1453]
在实施例中,本文所述的指环体包含具有与表10的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表10的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表10的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表10的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表10的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表10的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表10的指环病毒orf2t/3氨基酸序列具有至少约
70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表9的核酸序列的核苷酸588

2873的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表10的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1454]
在实施例中,本文所述的指环体包含具有与表12的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表12的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表12的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表12的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表12的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表12的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表12的指环病毒orf2t/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表11的核酸序列的核苷酸599

2839的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表12的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1455]
在实施例中,本文所述的指环体包含具有与表14的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表14的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表14的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表14的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表14的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表14的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表13的核酸序列的核苷酸599

2896的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)
包含表14的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1456]
在实施例中,本文所述的指环体包含具有与表16的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表16的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表16的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表16的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表16的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表16的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表15的核酸序列的核苷酸612

2612的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表16的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1457]
在实施例中,本文所述的指环体包含具有与表18的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表18的指环病毒orf1/1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表18的指环病毒orf1/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表18的指环病毒orf2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表18的指环病毒orf2/2氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在实施例中,本文所述的指环体包含具有与表18的指环病毒orf2/3氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的蛋白质。在一些实施例中,orf1分子(例如,包含在指环体中)包含由表17的核酸序列的核苷酸432

2453的指环病毒orf1核酸序列编码的多肽。在一些实施例中,orf1分子(例如,包含在指环体中)包含表18的指环病毒orf1蛋白或其剪接变体或翻译后加工(例如,蛋白水解加工)变体。
[1458]
在一些实施例中,本文所述的多肽包含与本文所述的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表2的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表4的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序
列。在实施例中,本文所述的多肽包含与表6的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表8的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表10的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表12的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表14的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表16的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表18的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表a2的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表a4的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表a6的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表a8的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表a10的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表a12的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表c1的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表c2的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表c3的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表c4的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与表c5的指环病毒orf1氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[1459]
在一些实施例中,本文所述的多肽包含与由本文所述的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表1中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%
或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表3中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表5中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表7中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表9中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表11中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表13中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表15中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表17中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表a1中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表a3中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表a5中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表a7中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表a9中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表a11中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表b1中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表b2中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表b3中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,本文所述的多肽包含与由表b4中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在
实施例中,本文所述的多肽包含与由表b5中所列的指环病毒orf1核酸编码的orf1分子具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[1460]
在一些实施例中,多肽包含如表2、4、6、8、10、12、14、16或18中任一个中所示的氨基酸序列(例如,orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3或orf2t/3序列),或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99的序列%或100%序列同一性的序列。
[1461]
表a1.新颖指环病毒核酸序列(甲型细环病毒)
[1462]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

rtx1
[1463]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝6
[1464]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
srr2167793
[1465]
全序列:3648bp
[1466]
[1467]
[1468][1469]
注释:
[1470]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1471]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
77

81
[1472]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
95

110
[1473]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
105
[1474]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
165

235
[1475]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
335

703
[1476]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
335

699;2326

2759
[1477]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
335

699;2552

2957
[1478]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
335

465;2552

2957
[1479]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
574

2775
[1480]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
574

699;2326

2775
[1481]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
574

699;2552

2759
[1482]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2535

2746
[1483]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2953

2958
[1484]
gc富集区**
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3620

3648
[1485]
表a2.新颖指环病毒氨基酸序列(甲型细环病毒,进化分枝6)
[1486]
[1487][1488]
表a3.新颖指环病毒核酸序列(甲型细环病毒)
[1489]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

rtx2
[1490]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝6
[1491]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
srr3479021
[1492]
全序列:3704bp
[1493]
[1494]
[1495][1496]
注释:
[1497]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1498]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
87

91
[1499]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
105

120
[1500]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
115
[1501]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
175

245
[1502]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
342

728
[1503]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
342

724;2414

2849
[1504]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
342

724;2643

3057
[1505]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

2887
[1506]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

724;2414

2887
[1507]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

724;2643

2849
[1508]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2626

2846
[1509]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3052

3058
[1510]
表a4.新颖指环病毒氨基酸序列(甲型细环病毒,进化分枝6)
[1511]
[1512][1513]
表a5.新颖指环病毒核酸序列(甲型细环病毒)
[1514]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

rtx3
[1515]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝4
[1516]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
srr3479781
[1517]
全序列:3653bp
[1518]
[1519]
[1520][1521]
注释:
[1522]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1523]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
50

55
[1524]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
68

83
[1525]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
78
[1526]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
138

208
[1527]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
305

691
[1528]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
305

687;2422

2878
[1529]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
305

687;2564

3317
[1530]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
305

360;2564

3317
[1531]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
556

2904
[1532]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
556

687;2422

2904
[1533]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
556

687;2564

2878
[1534]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2626

2846
[1535]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3316

3319
[1536]
表a6.新颖指环病毒氨基酸序列(甲型细环病毒,进化分枝4)
[1537]
[1538]
[1539][1540]
表a7.新颖指环病毒核酸序列(甲型细环病毒)
[1541]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

rtx4
[1542]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝4
[1543]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
srr3481579
[1544]
全序列:3742bp
[1545]
[1546]
[1547][1548]
注释:
[1549]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1550]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
86

90
[1551]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
104

119
[1552]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
114
[1553]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
174

244
[1554]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
353

715
[1555]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
353

711;2362

2863
[1556]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
353

711;2555

3065
[1557]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
353

432;2555

3065
[1558]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
589

2889
[1559]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
589

711;2362

2889
[1560]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
589

711;2555

2863
[1561]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2555

2863
[1562]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3062

3066
[1563]
gc富集区或其一部分**
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3720

3742
[1564]
表a8.新颖指环病毒氨基酸序列(甲型细环病毒,进化分枝4)
[1565]
[1566][1567]
表a9.新颖指环病毒核酸序列(甲型细环病毒)
[1568]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

rtx5b
[1569]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝5
[1570]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
srr3481639
[1571]
全序列:3553bp
[1572]
[1573]
[1574][1575]
注释:
[1576]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1577]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
12

17
[1578]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
30

45
[1579]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
40
[1580]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
100

171
[1581]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
272

637
[1582]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
272

633;2326

2767
[1583]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
272

633;2525

2984
[1584]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
272

633;2525

2984
[1585]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
511

2793
[1586]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
511

711;2326

2793
[1587]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
511

711;2525

2767
[1588]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2525

2767
[1589]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2981

2985
[1590]
未知序列
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3125

3176
[1591]
*注释:为保持阅读框所做的修改:
[1592]
‑“
c”插入orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
430
[1593]
‑“
n”插入orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
1842
[1594]
表a10.新颖指环病毒氨基酸序列(甲型细环病毒,进化分枝5)
[1595]
[1596][1597]
表a11.新颖指环病毒核酸序列(甲型细环病毒)
[1598]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

rtx6
[1599]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝5
[1600]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
srr3438066
[1601]
全序列:3896bp
[1602]
[1603]
[1604]
[1605][1606]
注释:
[1607]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1608]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
206

210
[1609]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
224

239
[1610]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
234
[1611]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
294

364
[1612]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
465

830
[1613]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
465

826;2534

2975
[1614]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
465

826;2721

3192
[1615]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
465

595;2721

3192
[1616]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
704

3001
[1617]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
704

826;2534

3001
[1618]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
704

826;2721

2975
[1619]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2721

2975
[1620]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3189

3193
[1621]
未知序列
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3198

3655
[1622]
gc富集区或其一部分**
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3844

3895
[1623]
表a12.新颖指环病毒氨基酸序列(甲型细环病毒,进化分枝5)
[1624]
[1625][1626]
表1.示例性指环病毒核酸序列(甲型细环病毒,进化分枝1)
[1627]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

ct30f
[1628]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝1
[1629]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ab064597.1
[1630]
全序列:3570bp
[1631]
[1632]
[1633][1634]
注释:
[1635]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1636]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
84

90
[1637]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
107

114
[1638]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
114
[1639]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
177

247
[1640]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
299

691
[1641]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
299

687;2137

2659
[1642]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
299

687;2339

2831
[1643]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
299

348;2339

2831
[1644]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
571

2613
[1645]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
571

687;2137

2613
[1646]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
571

687;2339

2659
[1647]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2325

2610
[1648]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2813

2818
[1649]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3415

3570
[1650]
表2.示例性指环病毒氨基酸序列(甲型细环病毒,进化分枝1)
[1651]
[1652][1653]
表3.示例性指环病毒核酸序列(甲型细环病毒,进化分枝2)
[1654]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

p13
‑1[1655]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝2
[1656]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
kt163896.1
[1657]
全序列:3451bp
[1658]
[1659]
[1660][1661]
注释:
[1662]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1663]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
112

119
[1664]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
128

148
[1665]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
148
[1666]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
204

273
[1667]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
412

912
[1668]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
412

908;2490

3039
[1669]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
412

908;2725

3208
[1670]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
729

2972
[1671]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
729

908;2490

2972
[1672]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
729

908;2725

3039
[1673]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2699

2969
[1674]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3220

3225
[1675]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3302

3541
[1676]
表4.示例性指环病毒氨基酸序列(甲型细环病毒,进化分枝2)
[1677]
[1678]
[1679][1680]
表5.示例性指环病毒核酸序列(甲型细环病毒,进化分枝3)
[1681]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

tth8
[1682]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝3
[1683]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aj620231.1
[1684]
全序列:3753bp
[1685]
[1686]
[1687][1688]
注释:
[1689]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1690]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
83

88
[1691]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
104

111
[1692]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
111
[1693]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
170

240
[1694]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
336

719
[1695]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
336

715;2363

2789
[1696]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
336

715;2565

3015
[1697]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
336

388;2565

3015
[1698]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

2830
[1699]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

715;2363

2830
[1700]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

715;2565

2789
[1701]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2551

2786
[1702]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3011

3016
[1703]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3632

3753
[1704]
表6.示例性指环病毒氨基酸序列(甲型细环病毒,进化分枝3)
[1705]
[1706][1707]
表7.示例性指环病毒核酸序列(甲型细环病毒,进化分枝4)
[1708]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

hd20a
[1709]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝4
[1710]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
fr751492.1
[1711]
全序列:3878bp
[1712]
[1713]
[1714][1715]
注释:
[1716]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1717]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
82

87
[1718]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
95

115
[1719]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
115
[1720]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
170

238
[1721]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
335

721
[1722]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
335

717;2446

2902
[1723]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
335

717;2675

3109
[1724]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
586

2928
[1725]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
586

717;2446

2928
[1726]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
586

717;2675

2902
[1727]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2640

2899
[1728]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3106

3114
[1729]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3768

3878
[1730]
表8.示例性指环病毒氨基酸序列(甲型细环病毒,进化分枝4)
[1731]
[1732][1733]
表9.示例性指环病毒核酸序列(甲型细环病毒,进化分枝5)
[1734]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

16(tus01)
[1735]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝5
[1736]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ab017613.1
[1737]
全序列:3818bp
[1738]
[1739]
[1740]
[1741][1742]
注释:
[1743]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1744]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
82

86
[1745]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
100

115
[1746]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
115
[1747]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
170

240
[1748]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
331

726
[1749]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
331

722;2412

2847
[1750]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
331

722;2638

3058
[1751]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
331

380;2638

3058
[1752]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
588

2873
[1753]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
588

722;2412

2873
[1754]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
588

722;2638

2847
[1755]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2699

2969
[1756]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3220

3225
[1757]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3302

3541
[1758]
表10.示例性指环病毒氨基酸序列(甲型细环病毒,进化分枝5)
[1759]
[1760]
[1761][1762]
表11.示例性指环病毒核酸序列(甲型细环病毒,进化分枝6)
[1763]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

tjn02
[1764]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝6
[1765]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ab028669.1
[1766]
全序列:3794bp
[1767]
[1768]
[1769][1770]
注释:
[1771]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1772]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
89

90
[1773]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
107

114
[1774]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
114
[1775]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
174

244
[1776]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
357

731
[1777]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
357

727;2381

2813
[1778]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
357

727;2619

3021
[1779]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
357

406;2619

3021
[1780]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

2839
[1781]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

727;2381

2839
[1782]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

727;2619

2813
[1783]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2596

2810
[1784]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3017

3022
[1785]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3691

3794
[1786]
表12.示例性指环病毒氨基酸序列(甲型细环病毒,进化分枝6)
[1787]
[1788][1789]
表13.示例性指环病毒核酸序列(甲型细环病毒,进化分枝7)
[1790]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttv

hd16d
[1791]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒,进化分枝7
[1792]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
fr751479.1
[1793]
全序列:3866bp
[1794]
[1795]
[1796]
[1797][1798]
注释:
[1799]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1800]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
82

86
[1801]
起始元件
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
94

115
[1802]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
115
[1803]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
170

240
[1804]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
357

728
[1805]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
357

724;2411

2870
[1806]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
357

724;2646

3081
[1807]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

2896
[1808]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

724;2411

2896
[1809]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
599

724;2646

2870
[1810]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2629

2867
[1811]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3076

3086
[1812]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3759

3866
[1813]
表14.示例性指环病毒氨基酸序列(甲型细环病毒,进化分枝7)
[1814]
[1815][1816]
表15.示例性指环病毒核酸序列(乙型细环病毒)
[1817]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttmv

ly2
[1818]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
乙型细环病毒
[1819]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
jx134045.1
[1820]
全序列:2797bp
[1821]
[1822]
[1823][1824]
注释:
[1825]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1826]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
237

243
[1827]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
260

267
[1828]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
267
[1829]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
323

393
[1830]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
424

723
[1831]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
424

719;2274

2589
[1832]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
424

719;2449

2812
[1833]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
612

2612
[1834]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
612

719;2274

2612
[1835]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
612

719;2449

2589
[1836]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2441

2586
[1837]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2808

2813
[1838]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2868

2929
[1839]
表16.示例性指环病毒氨基酸序列(乙型细环病毒)
[1840][1841]
表17.示例性指环病毒核酸序列(丙型细环病毒)
[1842]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ttmdv

md1

073
[1843]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
丙型细环病毒
[1844]
登录号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ab290918.1
[1845]
全序列:3242bp
[1846]
[1847]
[1848][1849]
注释:
[1850]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1851]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
21

25
[1852]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
42

49
[1853]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
49
[1854]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
117

187
[1855]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
283

588
[1856]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
283

584;1977

2388
[1857]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
283

584;2197

2614
[1858]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
432

2453
[1859]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
432

584;1977

2453
[1860]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
432

584;2197

2388
[1861]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2186

2385
[1862]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2676

2681
[1863]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3054

3172
[1864]
表18.示例性指环病毒氨基酸序列(丙型细环病毒)
[1865]
[1866][1867]
表b1.示例性指环病毒核酸序列(丙型细环病毒)
[1868]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环3.1
[1869]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
丙型细环病毒
[1870]
登录号
[1871]
全序列:3264bp
[1872]
[1873]
[1874][1875]
注释:
[1876]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1877]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
87

93
[1878]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
110

117
[1879]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
117
[1880]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
185

255
[1881]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
285

671
[1882]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
285

667;2063

2498
[1883]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
285

667;2295

2697
[1884]
taip
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
385

585
[1885]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
512

2545
[1886]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
512

667;2063

2545
[1887]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
512

667;2295

2498
[1888]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2295

2495
[1889]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2729

2734
[1890]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3141

3264
[1891]
表c1.示例性指环病毒氨基酸序列(丙型细环病毒)
[1892]
[1893]
[1894][1895]
表b2.示例性指环病毒核酸序列(丙型细环病毒)
[1896]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环4.0
[1897]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
丙型细环病毒
[1898]
登录号
[1899]
全序列:3176bp
[1900]
[1901]
[1902][1903]
注释:
[1904]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1905]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
87

93
[1906]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
110

117
[1907]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
117
[1908]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
185

254
[1909]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
286

660
[1910]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
286

656;1998

2442
[1911]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
286

656;2209

2641
[1912]
taip
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
385

484
[1913]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
501

2489
[1914]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
501

656;1998

2489
[1915]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
501

656;2209

2442
[1916]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2209

2439
[1917]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2672

2678
[1918]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3076

3176
[1919]
表c2.示例性指环病毒氨基酸序列(丙型细环病毒)
[1920]
[1921][1922]
表b3.示例性指环病毒核酸序列(甲型细环病毒)

进化分枝1
[1923]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环5.2
[1924]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒进化分枝1
[1925]
登录号
[1926]
全序列:3696bp
[1927]
[1928]
[1929]
[1930][1931]
注释:
[1932]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1933]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
85

91
[1934]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
108

115
[1935]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
115
[1936]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
178

248
[1937]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
300

692
[1938]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
300

688;2282

2804
[1939]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
300

688;2484

2976
[1940]
orf2t/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
300

349:2484

2976
[1941]
taip
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
322

471
[1942]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
572

2758
[1943]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
572

688;2282

2758
[1944]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
572

688;2484

2804
[1945]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2484

2755
[1946]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3018

3023
[1947]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3555

3696
[1948]
表c3.示例性指环病毒氨基酸序列(甲型细环病毒)进化分枝1
[1949]
[1950]
[1951][1952]
表b4.示例性指环病毒核酸序列(甲型细环病毒)

进化分枝3
[1953]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环6.0
[1954]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒

进化分枝3
[1955]
登录号
[1956]
全序列:3828bp
[1957]
[1958]
[1959]
[1960][1961]
注释:
[1962]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1963]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
85

92
[1964]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
109

116
[1965]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
116
[1966]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
176

246
[1967]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
351

710
[1968]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
351

706;2360

2825
[1969]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
351

706;2556

3060
[1970]
taip
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
373

528
[1971]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
581

2884
[1972]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
581

706;2360

2884
[1973]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
581

706;2556

2825
[1974]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2556

2821
[1975]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3055

3061
[1976]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3720

3828
[1977]
表c4.示例性指环病毒氨基酸序列(甲型细环病毒)进化分枝3
[1978]
[1979][1980][1981]
表b5.示例性指环病毒核酸序列(甲型细环病毒)

进化分枝7
[1982]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环7
[1983]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒

进化分枝7
[1984]
登录号
[1985]
全序列:3815bp
[1986]
[1987]
[1988][1989]
注释:
[1990]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碱基范围
[1991]
tata盒
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
82

87
[1992]
帽位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
103

110
[1993]
转录起始位点
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
110
[1994]
5'utr保守结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
170

240
[1995]
orf2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
351

740
[1996]
orf2/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
351

737;2378

2843
[1997]
orf2/3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
351

737;2526

3057
[1998]
taip
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
379

543
[1999]
orf1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
614

2911
[2000]
orf1/1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
614

737;2378

2911
[2001]
orf1/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
614

737;2526

2843
[2002]
三开放阅读框区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
2526

2840
[2003]
聚(a)信号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3056

3062
[2004]
gc富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
3716

3815
[2005]
表c5.示例性指环病毒氨基酸序列(甲型细环病毒)

进化分枝7
[2006]
[2007][2008]
在一些实施例中,指环体包含核酸,所述核酸包含在pct申请号pct/us 2018/037379(通过引用整体并入本文)中列出的序列。在一些实施例中,指环体包含多肽,所述多肽包含在pct申请号pct/us 2018/037379(通过引用整体并入本文)中列出的序列。
[2009]
在一些实施例中,指环体包含指环病毒基因组,例如,根据实例9中所述的方法所鉴定的。在一些实施例中,指环体包含指环病毒序列或其一部分,如实例13中所述。
[2010]
在一些实施例中,指环体包含遗传元件,所述遗传元件包含共有的指环病毒基序,例如,如表19所示。在一些实施例中,指环体包含遗传元件,所述遗传元件包含共有的指环病毒orf1基序,例如,如表19所示。在一些实施例中,指环体包含遗传元件,所述遗传元件包
含共有的指环病毒orf1/1基序,例如,如表19所示。在一些实施例中,指环体包含遗传元件,所述遗传元件包含共有的指环病毒orf1/2基序,例如,如表19所示。在一些实施例中,指环体包含遗传元件,所述遗传元件包含共有的指环病毒orf2/2基序,例如,如表19所示。在一些实施例中,指环体包含遗传元件,所述遗传元件包含共有的指环病毒orf2/3基序,例如,如表19所示。在一些实施例中,指环体包含遗传元件,所述遗传元件包含共有的指环病毒orf2t/3基序,例如,如表19所示。在一些实施例中,如表19中所示,x表示任何氨基酸。在一些实施例中,如表19中所示,z表示谷氨酸或谷氨酰胺。在一些实施例中,如表19所示,b表示天冬氨酸或天冬酰胺。在一些实施例中,如表19中所示,j表示亮氨酸或异亮氨酸。
[2011]
表19.指环病毒的开放阅读框(orf)中的共有基序
[2012]
[2013][2014]
orf1分子
[2015]
在一些实施例中,指环体包含orf1分子和/或编码orf1分子的核酸。通常,orf1分子包含具有指环病毒orf1蛋白(例如,如本文所述的指环病毒orf1蛋白,例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)的结构特征和/或活性的多肽,或其功能片段。在一些实施例中,orf1分子包含相对于指环病毒orf1蛋白(例如,如本文所述的指环病毒orf1蛋白,例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所列)的截短。在一些实施例中,orf1分子被截短了指环病毒orf1蛋白的至少10、20、30、40、50、60、70、80、90、100、150、
200、250、300、350、400、450、500、550、600、650或700个氨基酸。在一些实施例中,orf1分子包含与如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所示的指环病毒orf1蛋白序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,orf1分子包含与例如如本文所述的甲型细环病毒、乙型细环病毒或丙型细环病毒orf1蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。orf1分子通常可以结合核酸分子,例如dna(例如,遗传元件,例如,如本文所述)。在一些实施例中,orf1分子定位于细胞核。在某些实施例中,orf1分子定位于细胞的核仁。
[2016]
不希望受理论束缚,orf1分子可能能够与其他orf1分子结合,例如,形成蛋白质外部(例如,如本文所述)。这种orf1分子可被描述为具有形成衣壳的能力。在一些实施例中,蛋白质外部可以包壳核酸分子(例如,如本文所述的遗传元件)。在一些实施例中,多个orf1分子可形成多聚体,例如以产生蛋白质外部。在一些实施例中,多聚体可以是同多聚体。在其他实施例中,多聚体可以是异多聚体(例如,包含多个不同的orf1分子)。还预期orf1分子可具有复制酶活性。
[2017]
在一些实施例中,orf1分子可以包含以下中的一种或多种:包含精氨酸富集区的第一区域,例如具有至少60%的碱性残基(例如,至少60%、65%、70%、75%、80%、85%、90%、95%或100%碱性残基;例如,60%

90%、60%

80%、70%

90%或70

80%的碱性残基)的区域,以及包含胶冻卷结构域的第二区域,例如至少六个β链(例如,4、5、6、7、8、9、10、11或12个β链)。
[2018]
精氨酸富集区
[2019]
精氨酸富集区与本文描述的精氨酸富集区序列具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性,或者包含至少60%、70%或80%碱性残基(例如,精氨酸、赖氨酸或其组合)的至少约40个氨基酸的序列。
[2020]
胶冻卷结构域
[2021]
胶冻卷结构域或区域包含以下(例如,由以下组成):包含以下特征中的一个或多个(例如,1、2或3个)的多肽(例如,包含在较大多肽中的结构域或区域):
[2022]
(i)胶冻卷结构域的至少30%(例如,至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、90%或更多)的氨基酸是一个或多个β

折叠的部分;
[2023]
(ii)胶冻卷结构域的二级结构包含至少四个(例如,至少4、5、6、7、8、9、10、11或12)个β

链;和/或
[2024]
(iii)胶冻卷结构域的三级结构包含至少两个(例如,至少2、3或4个)β

折叠;和/或
[2025]
(iv)胶冻卷结构域包含β

折叠与α

螺旋的比例为至少2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。
[2026]
在某些实施例中,胶冻卷结构域包含两个β

折叠。
[2027]
在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β

折叠包含约八个(例如,4、5、6、7、8、9、10、11或12个)β

链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β

折叠包含八个β

链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β

折叠包含七个β

链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、
7、8、9或10个)β

折叠包含六个β

链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β

折叠包含五个β

链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β

折叠包含四个β

链。
[2028]
在一些实施例中,胶冻卷结构域包含与第二β

折叠反平行取向的第一β

折叠。在某些实施例中,第一β

折叠包含约四个(例如,3、4、5或6个)β

链。在某些实施例中,第二β

折叠包含约四个(例如,3、4、5或6个)β

链。在实施例中,第一和第二β

折叠总共包含约八个(例如,6、7、8、9、10、11或12个)β

链。
[2029]
在某些实施例中,胶冻卷结构域是衣壳蛋白(例如,如本文所述的orf1分子)的组分。在某些实施例中,胶冻卷结构域具有自组装活性。在一些实施例中,包含胶冻卷结构域的多肽结合包含胶卷结构域的多肽的另一拷贝。在一些实施例中,第一多肽的胶冻卷结构域结合多肽的第二拷贝的胶冻卷结构域。
[2030]
orf1分子还可包括包含指环病毒n22结构域(例如,如本文所述,例如来自如本文所述的指环病毒orf1蛋白的n22结构域)的结构或活性的第三区域,和/或包含指环病毒c末端结构域(ctd)(例如,如本文所述,例如来自如本文所述的指环病毒orf1蛋白的ctd)的结构或活性的第四区域。在一些实施例中,orf1分子以n末端到c末端的顺序包含所述第一、第二、第三和第四区域。
[2031]
在一些实施例中,orf1分子可以进一步包含高变区(hvr),例如来自例如本文所述的指环病毒orf1蛋白的hvr。在一些实施例中,hvr位于所述第二区域和所述第三区域之间。在一些实施例中,hvr包含至少约55(例如,至少约45、50、51、52、53、54、55、56、57、58、59、60或65)个氨基酸(例如,约45

160、50

160、55

160、60

160、45

150、50

150、55

150、60

150、45

140、50

140、55

140或60

140个氨基酸)。
[2032]
在一些实施例中,第一区域可以结合核酸分子(例如,dna)。在一些实施例中,碱性残基选自精氨酸、组氨酸或赖氨酸,或其组合。在一些实施例中,第一区域包含至少60%、65%、70%、75%、80%、85%、90%、95%或100%的精氨酸残基(例如,60%

90%、60%

80%、70%

90%或70

80%精氨酸残基)。在一些实施例中,第一区域包含约30

120个氨基酸(例如,约40

120、40

100、40

90、40

80、40

70、50

100、50

90、50

80、50

70、60

100、60

90或60

80个氨基酸)。在一些实施例中,第一区域包含病毒orf1精氨酸富集区(例如,来自例如本文所述的指环病毒orf1蛋白的精氨酸富集区)的结构或活性。在一些实施例中,第一区域包含核定位信号。
[2033]
在一些实施例中,第二区域包含胶冻卷结构域,例如病毒orf1胶冻卷结构域的结构或活性(例如,来自例如如本文所述的指环病毒orf1蛋白的胶冻卷结构域)。在一些实施例中,第二区域能够与另一个orf1分子的第二区域结合,例如,形成蛋白质外部(例如衣壳)或其一部分。
[2034]
在一些实施例中,第四区域暴露在蛋白质外部(例如,包含例如如本文所述的orf1分子的多聚体的蛋白质外部)的表面上。
[2035]
在一些实施例中,第一区域、第二区域、第三区域、第四区域和/或hvr各自包含少于四个(例如,0、1、2或3)个β折叠。
[2036]
在一些实施例中,第一区域、第二区域、第三区域、第四区域和/或hvr中的一个或多个可以被异源氨基酸序列(例如来自异源orf1分子的相应区域)替换。在一些实施例中,
异源氨基酸序列具有所期望的功能性,例如,如本文所述。
[2037]
在一些实施例中,orf1分子包含多个保守基序(例如,包含约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100或更多个氨基酸的基序)(例如,如图34所示)。在一些实施例中,保守基序可显示与一个或多个野生型指环病毒进化分枝(例如,甲型细环病毒、进化分枝1;甲型细环病毒,进化分枝2;甲型细环病毒,进化分枝3;甲型细环病毒,进化分枝4;甲型细环病毒,进化分枝5;甲型细环病毒,进化分枝6;甲型细环病毒,进化分枝7;乙型细环病毒;和/或丙型细环病毒)的orf1蛋白的60%、70%、80%、85%、90%、95%或100%序列同一性。在实施例中,保守基序各自具有1

1000(例如,介于5

10、5

15、5

20、10

15、10

20、15

20、5

50、5

100、10

50、10

100、10

1000、50

100、50

1000或100

1000)个氨基酸的长度。在某些实施例中,保守基序由orf1分子序列的约2%

4%(例如,约1%

8%、1%

6%、1%

5%、1%

4%、2%

8%、2%

6%、2%

5%或2%

4%)组成,并且每个都显示与野生型指环病毒进化分枝的orf1蛋白中相应基序的100%序列同一性。在某些实施例中,保守基序由orf1分子序列的约5%

10%(例如,约1%

20%、1%

10%、5%

20%或5%

10%)组成,并且每个都显示与野生型指环病毒进化分枝的orf1蛋白中相应基序的80%序列同一性。在某些实施例中,保守基序由orf1分子序列的约10%

50%(例如,约10%

20%、10%

30%、10%

40%、10%

50%、20%

40%、20%

50%或30%

50%)组成,并且每个都显示与野生型指环病毒进化分枝的orf1蛋白中相应基序的60%序列同一性。在一些实施例中,保守基序包含一个或多个如表19中所列的氨基酸序列。
[2038]
在一些实施例中,orf1分子包含相对于例如如本文所述的野生型orf1蛋白(例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16、18、20

37或d1

d10中的任一个中所示)的至少一个差异(例如,突变、化学修饰或表观遗传改变)。
[2039]
n22结构域中的保守orf1基序
[2040]
在一些实施例中,本文所述的多肽(例如,orf1分子)包含氨基酸序列ynpx2dxgx2n(seq id no:829),其中x
n
是任何n个氨基酸的连续序列。例如,x2表示任何两个氨基酸的连续序列。在一些实施例中,ynpx2dxgx2n(seq id no:829)包含在例如如本文所述的orf1分子的n22结构域内。在一些实施例中,本文所述的遗传元件包含编码氨基酸序列ynpx2dxgx2n(seq id no:829)的核酸序列(例如,编码例如如本文所述的orf1分子的核酸序列),其中x
n
是任何n个氨基酸的连续序列。
[2041]
在一些实施例中,多肽(例如,orf1分子)包含保守的二级结构,例如,侧接和/或包含ynpx2dxgx2n(seq id no:829)基序,例如在n22结构域中。在一些实施例中,保守二级结构包含第一β链和/或第二β链。在一些实施例中,第一β链的长度为约5

6个(例如,3、4、5、6、7或8个)氨基酸。在一些实施例中,第一β链包含位于ynpx2dxgx2n(seq id no:829)基序的n末端的酪氨酸(y)残基。在一些实施例中,ynpx2dxgx2n(seq id no:829)基序包含无规卷曲(例如,约8

9个氨基酸的无规卷曲)。在一些实施例中,第二β链的长度为约7

8个(例如,5、6、7、8、9或10个)氨基酸。在一些实施例中,第二β链包含位于ynpx2dxgx2n(seq id no:829)基序的c末端的天冬酰胺(n)残基。
[2042]
示例性ynpx2dxgx2n(seq id no:829)基序侧翼二级结构在实例47和图48中描述。在一些实施例中,orf1分子包含区域,所述区域包含图48中所示的二级结构元件(例如,β链)中的一个或多个(例如,1、2、3、4、5、6、7、8、9、10个或全部)。在一些实施例中,orf1分子
包含区域,所述区域包含图48中所示的侧翼于ynpx2dxgx2n(seq id no:829)基序(例如,如本文所述)的二级结构元件(例如,β链)中的一个或多个(例如,1、2、3、4、5、6、7、8、9、10个或全部)。
[2043]
orf1胶冻卷结构域中的保守二级结构基序
[2044]
在一些实施例中,本文所述的多肽(例如,orf1分子)包含一个或多个由指环病毒orf1蛋白(例如,如本文所述)所包含的二级结构元件。在一些实施方案中,orf1分子包含一个或多个由指环病毒orf1蛋白(例如,如本文所述)的胶冻卷结构域所包含的二级结构元件。通常,orf1胶冻卷结构域包含二级结构,所述二级结构在n末端到c末端的方向上依次包含第一β链、第二β链、第一α螺旋、第三β链、第四β链、第五β链、第二α螺旋、第六β链、第七β链、第八β链和第九β链。在一些实施例中,orf1分子包含二级结构,所述二级结构按从n末端到c末端的方向依次包含第一β链、第二β链、第一α螺旋、第三β链、第四β链、第五β链、第二α螺旋、第六β链、第七β链、第八β链和/或第九β链。
[2045]
在一些实施例中,一对保守的二级结构元件(即β链和/或α螺旋)被间隙氨基酸序列隔开,例如包含无规卷曲序列、β链或α螺旋,或其组合。保守二级结构元件之间的间隙氨基酸序列可包含例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个氨基酸。在一些实施例中,orf1分子可进一步包含一个或多个另外的β链和/或α螺旋(例如,在胶冻卷域中)。在一些实施例中,可以组合连续的β链或连续的α螺旋。在一些实施例中,第一β链和第二β链包含在更大的β链中。在一些实施例中,第三β链和第四β链包含在更大的β链中。在一些实施例中,第四β链和第五β链包含在更大的β链中。在一些实施例中,第六β链和第七β链包含在更大的β链中。在一些实施例中,第七条β链和第八条β链包含在更大的β链中。在一些实施例中,第八β链和第九β链包含在更大的β链中。
[2046]
在一些实施例中,第一β链的长度为约5

7个(例如,3、4、5、6、7、8、9或10个)氨基酸。在一些实施例中,第二β链的长度为约15

16个(例如,13、14、15、16、17、18或19个)氨基酸。在一些实施例中,第一α螺旋的长度为约15

17个(例如,13、14、15、16、17、18、19或20个)氨基酸。在一些实施例中,第三β链的长度为约3

4个(例如,1、2、3、4、5或6个)氨基酸。在一些实施例中,第四β链的长度为约10

11个(例如,8、9、10、11、12或13个)氨基酸。在一些实施例中,第五β链的长度为约6

7个(例如,4、5、6、7、8、9或10个)氨基酸。在一些实施例中,第二α螺旋的长度为约8

14个(例如,5、6、7、8、9、10、11、12、13、14、15、16或17个)氨基酸。在一些实施例中,第二α螺旋可以分解成两个较小的α螺旋(例如,由无规卷曲序列隔开)。在一些实施例中,两个较小的α螺旋中的每一个的长度为约4

6个(例如,2、3、4、5、6、7或8个)氨基酸。在一些实施例中,第六β链的长度为约4

5个(例如,2、3、4、5、6或7个)氨基酸。在一些实施例中,第七β链的长度为约5

6个(例如,3、4、5、6、7、8或9个)氨基酸。在一些实施例中,第八β链的长度为约7

9个(例如,5、6、7、8、9、10、11、12或13个)氨基酸。在一些实施例中,第九β链的长度为约5

7个(例如,3、4、5、6、7、8、9或10个)氨基酸。
[2047]
示例性胶冻卷结构域二级结构在实例47和图47中描述。在一些实施例中,orf1分子包含区域,所述区域包含图47中所示的任何胶冻卷结构域二级结构的二级结构元件(例如,β链和/或α螺旋)中的一个或多个(例如,1、2、3、4、5、6、7、8、9、10或全部)。
[2048]
示例性orf1序列
[2049]
在一些实施例中,本文所述的多肽(例如,orf1分子)包含与例如如表20

37或d1

d10中的任一个中所述的一个或多个指环病毒orf1子序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,本文所述的指环体包含orf1分子,所述orf1分子包含与例如如表20

37或d1

d10中的任一个中所述的一个或多个指环病毒orf1子序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,本文所述的指环体包含编码orf1分子的核酸分子(例如,遗传元件),所述orf1分子包含与例如如表20

37或d1

d10中的任一个中所述的一个或多个指环病毒orf1子序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2050]
在一些实施例中,一个或多个指环病毒orf1子序列包含精氨酸(arg)富集结构域、胶冻卷结构域、高变区(hvr)、n22结构域或c末端结构域(ctd)中的一个或多个(例如,如表20

37或d1

d10中的任一个中所列),或与其具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,orf1分子包含来自不同指环病毒的多个子序列(例如,选自表20

37或d1

d10中所列的甲型细环病毒进化分枝1

7子序列的orf1子序列的任何组合)。在实施例中,orf1分子包含来自一种指环病毒的arg富集结构域、胶冻卷结构域、n22结构域和ctd中的一个或多个,以及来自另一种的hvr。在实施例中,orf1分子包含来自一种指环病毒的胶冻卷结构域、hvr、n22结构域和ctd中的一个或多个,以及来自另一种的arg富集结构域。在实施例中,orf1分子包含来自一种指环病毒的arg富集结构域、hvr、n22结构域和ctd中的一个或多个,以及来自另一种的胶冻卷结构域。在实施例中,orf1分子包含来自一种指环病毒的arg富集结构域、胶冻卷结构域、hvr和ctd中的一个或多个,以及来自另一种的n22结构域。在实施例中,orf1分子包含来自一种指环病毒的arg富集结构域、胶冻卷结构域、hvr和n22结构域中的一个或多个,以及来自另一种的ctd。
[2051]
在实施例中,一个或多个指环病毒orf1子序列包含与表20的arg富集区氨基酸序列(例如,表20的氨基酸1

66)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表21的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表20的胶冻卷区氨基酸序列(例如,表20的氨基酸67

277)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表21的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表20的hvr氨基酸序列(例如,表20的氨基酸278

347)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表21的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表20的n22结构域氨基酸序列(例如,表20的氨基酸348

513)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在
实施例中,一个或多个指环病毒orf1子序列包含与表21的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表20的ctd氨基酸序列(例如,表20的氨基酸513

680)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表21的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2052]
在实施例中,一个或多个指环病毒orf1子序列包含与表22的arg富集区氨基酸序列(例如,表22的氨基酸1

69)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表23的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表22的胶冻卷区氨基酸序列(例如,表22的氨基酸70

279)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表23的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表22的hvr氨基酸序列(例如,表22的氨基酸280

411)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表23的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表22的n22结构域氨基酸序列(例如,表22的氨基酸412

578)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表23的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表22的ctd氨基酸序列(例如,表22的氨基酸579

747)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表23的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2053]
在实施例中,一个或多个指环病毒orf1子序列包含与表24的arg富集区氨基酸序列(例如,表24的氨基酸1

68)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表25的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表24的胶冻卷区氨基酸序列(例如,表24的氨基酸69

280)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表25的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨
基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表24的hvr氨基酸序列(例如,表24的氨基酸281

413)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表25的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表24的n22结构域氨基酸序列(例如,表24的氨基酸414

479)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表25的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表24的ctd氨基酸序列(例如,表24的氨基酸580

743)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表25的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2054]
在实施例中,一个或多个指环病毒orf1子序列包含与表26的arg富集区氨基酸序列(例如,表26的氨基酸1

74)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表27的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表26的胶冻卷区氨基酸序列(例如,表26的氨基酸75

284)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表27的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表26的hvr氨基酸序列(例如,表26的氨基酸285

445)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表27的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表26的n22结构域氨基酸序列(例如,表26的氨基酸446

611)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表27的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表26的ctd氨基酸序列(例如,表26的氨基酸612

780)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表27的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2055]
在实施例中,一个或多个指环病毒orf1子序列包含与表28的arg富集区氨基酸序列(例如,表28的氨基酸1

75)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、
98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表29的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表28的胶冻卷区氨基酸序列(例如,表28的氨基酸75

284)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表29的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表28的hvr氨基酸序列(例如,表28的氨基酸285

432)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表29的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表28的n22结构域氨基酸序列(例如,表28的氨基酸433

599)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表29的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表28的ctd氨基酸序列(例如,表28的氨基酸600

780)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表29的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2056]
在实施例中,一个或多个指环病毒orf1子序列包含与表30的arg富集区氨基酸序列(例如,表30的氨基酸1

77)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表31的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表30的胶冻卷区氨基酸序列(例如,表30的氨基酸78

286)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表31的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表30的hvr氨基酸序列(例如,表30的氨基酸287

416)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表31的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表30的n22结构域氨基酸序列(例如,表30的氨基酸417

585)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表31的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸
序列。在实施例中,一个或多个指环病毒orf1子序列包含与表30的ctd氨基酸序列(例如,表30的氨基酸586

746)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表31的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2057]
在实施例中,一个或多个指环病毒orf1子序列包含与表32的arg富集区氨基酸序列(例如,表32的氨基酸1

74)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表33的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表32的胶冻卷区氨基酸序列(例如,表32的氨基酸75

286)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表33的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表32的hvr氨基酸序列(例如,表32的氨基酸287

428)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表33的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表32的n22结构域氨基酸序列(例如,表32的氨基酸429

595)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表33的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表32的ctd氨基酸序列(例如,表32的氨基酸596

765)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表33的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2058]
在实施例中,一个或多个指环病毒orf1子序列包含与表34的arg富集区氨基酸序列(例如,表34的氨基酸1

38)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表35的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表34的胶冻卷区氨基酸序列(例如,表34的氨基酸39

246)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表35的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表34的hvr氨基酸序列(例如,表34的氨基酸247

374)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、
98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表35的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表34的n22结构域氨基酸序列(例如,表34的氨基酸375

537)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表35的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表34的ctd氨基酸序列(例如,表34的氨基酸538

666)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表35的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2059]
在实施例中,一个或多个指环病毒orf1子序列包含与表36的arg富集区氨基酸序列(例如,表36的氨基酸1

57)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表37的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表36的胶冻卷区氨基酸序列(例如,表36的氨基酸58

259)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表37的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表36的hvr氨基酸序列(例如,表36的氨基酸260

351)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表37的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表36的n22结构域氨基酸序列(例如,表36的氨基酸352

510)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表37的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表36的ctd氨基酸序列(例如,表36的氨基酸511

673)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表37的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2060]
在实施例中,一个或多个指环病毒orf1子序列包含与表d1的arg富集区氨基酸序列(例如,表d1的氨基酸1

66)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d2的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、
96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d1的胶冻卷区氨基酸序列(例如,表d1的氨基酸67

277)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d2的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d1的hvr氨基酸序列(例如,表d1的氨基酸278

347)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d2的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d1的n22结构域氨基酸序列(例如,表d1的氨基酸348

513)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d2的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d1的ctd氨基酸序列(例如,表d1的氨基酸513

680)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d2的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2061]
在实施例中,一个或多个指环病毒orf1子序列包含与表d3的arg富集区氨基酸序列(例如,表d3的氨基酸1

66)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d4的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d3的胶冻卷区氨基酸序列(例如,表d3的氨基酸67

277)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d4的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d3的hvr氨基酸序列(例如,表d3的氨基酸278

347)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d4的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d3的n22结构域氨基酸序列(例如,表d3的氨基酸348

513)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d4的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d3的ctd氨基酸序列(例如,表d3的氨基酸513

680)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%
或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d4的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2062]
在实施例中,一个或多个指环病毒orf1子序列包含与表d5的arg富集区氨基酸序列(例如,表d5的氨基酸1

66)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d6的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d5的胶冻卷区氨基酸序列(例如,表d5的氨基酸67

277)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d6的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d5的hvr氨基酸序列(例如,表d5的氨基酸278

347)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d6的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d5的n22结构域氨基酸序列(例如,表d5的氨基酸348

513)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d6的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d5的ctd氨基酸序列(例如,表d5的氨基酸513

680)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d6的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2063]
在实施例中,一个或多个指环病毒orf1子序列包含与表d7的arg富集区氨基酸序列(例如,表d7的氨基酸1

57)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d8的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d7的胶冻卷区氨基酸序列(例如,表d7的氨基酸58

259)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d8的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d7的hvr氨基酸序列(例如,表d7的氨基酸260

351)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d8的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、
98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d7的n22结构域氨基酸序列(例如,表d7的氨基酸352

510)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d8的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d7的ctd氨基酸序列(例如,表d7的氨基酸511

673)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d8的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2064]
在实施例中,一个或多个指环病毒orf1子序列包含与表d9的arg富集区氨基酸序列(例如,表d9的氨基酸1

57)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d10的arg富集区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d9的胶冻卷区氨基酸序列(例如,表d9的氨基酸58

259)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d10的胶冻卷区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d9的hvr氨基酸序列(例如,表d9的氨基酸260

351)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d10的hvr氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d9的n22结构域氨基酸序列(例如,表d9的氨基酸352

510)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d10的n22结构域氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d9的ctd氨基酸序列(例如,表d9的氨基酸511

673)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,一个或多个指环病毒orf1子序列包含与表d10的ctd区氨基酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2065]
表20.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝1)
[2066]
[2067]
全序列:680 aa
[2068][2069]
注释:
[2070]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2071]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
66
[2072]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
67

277
[2073]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
278

347
[2074]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
348

513
[2075]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
513

680
[2076]
表21.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝1)
[2077][2078]
表22.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝2)
[2079][2080]
全序列:747 aa
[2081]
[2082][2083]
注释:
[2084]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2085]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
69
[2086]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
70

279
[2087]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
280

411
[2088]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
412

578
[2089]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
579

747
[2090]
表23.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝2)
[2091]
[2092][2093]
表24.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝3)
[2094][2095]
全序列:743 aa
[2096]
[2097][2098]
注释:
[2099]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2100]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
68
[2101]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
69

280
[2102]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
281

413
[2103]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
414

579
[2104]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
580

743
[2105]
表25.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝3)
[2106][2107][2108]
表26.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝4)
[2109][2110]
全序列:780 aa
[2111][2112]
注释:
[2113]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2114]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
74
[2115]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
75

284
[2116]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
285

445
[2117]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
446

611
[2118]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
612

780
[2119]
表27.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝4)
[2120][2121]
表28.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝5)
[2122][2123]
全序列:761 aa
[2124][2125]
注释:
[2126]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2127]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
75
[2128]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
75

284
[2129]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
285

432
[2130]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
433

599
[2131]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
600

780
[2132]
表29.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝5)
[2133]
[2134][2135]
表30.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝6)
[2136][2137]
全序列:746 aa
[2138]
[2139][2140]
注释:
[2141]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2142]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
77
[2143]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
78

286
[2144]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
287

416
[2145]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
417

585
[2146]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
586

746
[2147]
表31.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝6)
[2148]
[2149][2150]
表32.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝7)
[2151][2152]
全序列:765 aa
[2153]
[2154][2155]
注释:
[2156]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2157]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
74
[2158]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
75

286
[2159]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
287

428
[2160]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
429

595
[2161]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
596

765
[2162]
表33.示例性指环病毒orf1氨基酸子序列(甲型细环病毒,进化分枝7)
[2163][2164]
表34.示例性指环病毒orf1氨基酸子序列(乙型细环病毒)
[2165][2166]
全序列:666 aa
[2167][2168]
注释:
[2169]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2170]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
38
[2171]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
39

246
[2172]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
247

374
[2173]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
375

537
[2174]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
538

666
[2175]
表35.示例性指环病毒orf1氨基酸子序列(乙型细环病毒)
[2176][2177]
表36.示例性指环病毒orf1氨基酸子序列(丙型细环病毒)
[2178][2179]
全序列:673 aa
[2180]
[2181][2182]
注释:
[2183]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2184]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
57
[2185]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
58

259
[2186]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
260

351
[2187]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
352

510
[2188]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
511

673
[2189]
表37.示例性指环病毒orf1氨基酸子序列(丙型细环病毒)
[2190]
[2191][2192]
表d1.示例性指环病毒orf1氨基酸子序列(丙型细环病毒)
[2193]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环3.1
[2194]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
丙型细环病毒
[2195]
登录号
[2196]
蛋白质登录号
[2197]
全序列:677 aa
[2198][2199]
注释:
[2200]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2201]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
59
[2202]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
60

260
[2203]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
261

356
[2204]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
357

517
[2205]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
518

677
[2206]
表d2.示例性指环病毒orf1氨基酸子序列(丙型细环病毒)
[2207][2208]
表d3.示例性指环病毒orf1氨基酸子序列(丙型细环病毒)
[2209]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环4.0
[2210]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
丙型细环病毒
[2211]
登录号
[2212]
蛋白质登录号
[2213]
全序列:662 aa
[2214][2215]
注释:
[2216]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2217]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
58
[2218]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
59

260
[2219]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
261

339
[2220]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
340

499
[2221]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
500

662
[2222]
表d4.示例性指环病毒orf1氨基酸子序列(丙型细环病毒)
[2223]
[2224][2225]
表d5.示例性指环病毒orf1氨基酸子序列(甲型细环病毒)进化分枝1
[2226]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环5.2
[2227]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒进化分枝1
[2228]
登录号
[2229]
蛋白质登录号
[2230]
全序列:728 aa
[2231]
[2232][2233]
注释:
[2234]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2235]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
66
[2236]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
67

277
[2237]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
278

395
[2238]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
396

561
[2239]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
562

728
[2240]
表d6.示例性指环病毒orf1氨基酸子序列(甲型细环病毒)进化分枝1
[2241]
[2242][2243]
表d7.示例性指环病毒orf1氨基酸子序列(甲型细环病毒)

进化分枝3
[2244]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环6.0
[2245]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒进化分枝3
[2246]
登录号
[2247]
蛋白质登录号
[2248]
全序列:767 aa
[2249][2250]
注释:
[2251]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2252]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
69
[2253]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
70

269
[2254]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
270

424
[2255]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
425

584
[2256]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
585

767
[2257]
表d8.示例性指环病毒orf1氨基酸子序列(甲型细环病毒)

进化分枝3
[2258][2259]
表d9.示例性指环病毒orf1氨基酸子序列(甲型细环病毒)

进化分枝7
[2260]
名称
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
环7.0
[2261]
属/进化分枝
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
甲型细环病毒

进化分枝7
[2262]
登录号
[2263]
蛋白质登录号
[2264]
全序列:766 aa
[2265][2266]
注释:
[2267]
推定结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aa范围
[2268]
arg富集区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ1‑
70
[2269]
胶冻卷结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
71

271
[2270]
高变区
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
272

418
[2271]
n22
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
419

579
[2272]
c末端结构域
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
580

766
[2273]
表d10.示例性指环病毒orf1氨基酸子序列(甲型细环病毒)

进化分枝7
[2274][2275]
共有orf1结构域序列
[2276]
在一些实施例中,orf1分子,例如,如本文所述,包含胶冻卷结构域、n22结构域和/或c末端结构域(ctd)中的一个或多个。在一些实施例中,胶冻卷结构域包含具有如本文所述的胶冻卷结构域共有序列的氨基酸序列(例如,如表37a

37c中的任一个中所列)。在一些实施例中,n22结构域包含具有如本文所述的n22结构域共有序列的氨基酸序列(例如,如表37a

37c中的任一个中所列)。在一些实施例中,ctd结构域包含具有如本文所述的ctd结构域共有序列的氨基酸序列(例如,如表37a

37c中的任一个中所列)。在一些实施例中,以“(x
a

b
)”格式在表37a

37c中的任一个中列出的氨基酸包含连续系列的氨基酸,其中该系列包含至少a个和至多b个氨基酸。在某些实施例中,该系列中的所有氨基酸都是相同的。在其他实施例中,该系列包括至少两个(例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或21)个不同的氨基酸。
[2277]
表37a.甲型细环病毒orf1结构域共有序列
[2278][2279]
表37b.乙型细环病毒orf1结构域共有序列
[2280]
[2281][2282]
表37c.丙型细环病毒orf1结构域共有序列
[2283]
[2284][2285]
在一些实施例中,胶冻卷结构域包含如表21、23、25、27、29、31、33、35、d2、d4、d6、d8、d10、或37a

37c中的任一个中所列的胶冻卷结构域氨基酸劜,或与其具有至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,n22结构域包含如表21、23、25、27、29、31、33、35、d2、d4、d6、d8、d10、或37a

37c中的任一个中所列的n22结构域氨基酸劜,或与其具有至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,ctd结构域包含如表21、23、25、27、29、31、33、35、d2、d4、d6、d8、d10、或37a

37c中的任一个中所列的ctd结构域氨基酸劜,或与其具有至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2286]
orf2分子
[2287]
在一些实施例中,指环体包含orf2分子和/或编码orf2分子的核酸。通常,orf2分子包含具有指环病毒orf2蛋白(例如,如本文所述的指环病毒orf2蛋白,例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中的任一个中所列)的结构特征和/或活性的多肽,或其功能片段。在一些实施例中,orf2分子包含与如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中的任一个中所示的指环病毒orf2蛋白序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
[2288]
在一些实施例中,orf2分子包含与甲型细环病毒、乙型细环病毒或丙型细环病毒orf2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施例中,orf2分子(例如,与甲型细环病毒orf2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的orf2分子)的长度为250个或更少个氨基酸(例如,约150

200个氨基酸)。在一些实施例中,orf2分子(例如,与乙型细环病毒orf2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的orf2分子)的长度约为50

150个氨基酸。在一些实施例中,orf2分子(例如,与丙型细环病毒orf2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的orf2分子)的长度为约100

200个氨基酸(例如,约100

150个氨基酸)。在一些实施例中,orf2分子包含螺旋

转角

螺旋基序(例如,包含两个位于转角区侧翼的α螺旋的螺旋

转角

螺旋基序)。在一些实施例中,orf2分子不包含ttv分离株ta278或ttv分离株sanban的orf2蛋白的氨基酸序列。在一些实施例中,orf2分子具有蛋白磷酸酶活性。在一些实施例中,orf2分子
包含相对于例如如本文所述的野生型orf2蛋白(例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中的任一个中所示)的至少一个差异(例如,突变、化学修饰或表观遗传改变)。
[2289]
保守的orf2基序
[2290]
在一些实施例中,本文所述的多肽(例如,orf2分子)包含氨基酸序列[w/f]x7hx3cx1cx5h(seq id no:949),其中x
n
是任何n个氨基酸的连续序列。在实施例中,x7表示任何七个氨基酸的连续序列。在实施例中,x3表示任何三个氨基酸的连续序列。在实施例中,x1表示任何单个氨基酸。在实施例中,x5表示任何五个氨基酸的连续序列。在一些实施例中,[w/f]可以是色氨酸或苯丙氨酸。在一些实施例中,[w/f]x7hx3cx1cx5h(seq id no:949)包含在例如如本文所述的orf2分子的n22结构域内。在一些实施例中,本文所述的遗传元件包含编码氨基酸序列[w/f]x7hx3cx1cx5h(seq id no:949)的核酸序列(例如,编码例如如本文所述的orf2分子的核酸序列),其中x
n
是任何n个氨基酸的连续序列。
[2291]
遗传元件
[2292]
在一些实施例中,指环体包含遗传元件。在一些实施例中,遗传元件具有以下一种或多种特征:基本上不与宿主细胞的基因组整合,是游离核酸,是单链dna,是环状的,大约1至10kb,存在于细胞核内,可以与内源性蛋白质结合,产生效应子,例如靶向宿主或靶细胞的基因、活性或功能的多肽或核酸(例如,rna、irna、微小rna)。在一个实施例中,遗传元件是基本上非整合的dna。在一些实施例中,遗传元件包含包装信号,例如结合衣壳蛋白的序列。在一些实施例中,在包装或衣壳结合序列之外,遗传元件与野生型指环病毒核酸序列具有小于70%、60%、50%、40%、30%、20%、10%、5%序列同一性,例如,与例如如本文所述的指环病毒核酸序列具有小于70%、60%、50%、40%、30%、20%、10%、5%序列同一性。在一些实施例中,在包装或衣壳结合序列之外,遗传元件具有与指环病毒核酸序列至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%相同的少于500、450、400、350、300、250、200、150或100个连续核苷酸。在某些实施例中,遗传元件是包含启动子序列、编码治疗效应子的序列和衣壳结合蛋白的环状单链dna。
[2293]
在一实施例中,遗传元件与例如本文所述(例如,表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中任一个所述)的指环病毒核酸序列或其片段具有至少约70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性,或编码与指环病毒氨基酸序列(例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中任一个所述)或其片段具有至少约70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,遗传元件包含编码效应子(例如内源性效应子或外源性效应子,例如有效负载),例如多肽效应子(例如蛋白质)或核酸效应子(例如非编码rna,例如mirna、sirna、mrna、lncrna、rna、dna、反义rna、grna)的序列。
[2294]
在一些实施例中,遗传元件的长度小于20kb(例如,小于约19kb、18kb、17kb、16kb、15kb、14kb、13kb、12kb、11kb、10kb、9kb、8kb、7kb、6kb、5kb、4kb、3kb、2kb、1kb或更小)。在一些实施例中,遗传元件独立地或额外地具有大于1000b的长度(例如,至少约1.1kb、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2kb、2.1kb、2.2kb、2.3kb、2.4kb、2.5kb、2.6kb、2.7kb、2.8kb、2.9kb、3kb、3.1kb、3.2kb、3.3kb、3.4kb、3.5kb、3.6kb、3.7kb、3.8kb、3.9kb、4kb、4.1kb、4.2kb、4.3kb、4.4kb、4.5kb、4.6kb、4.7kb、4.8kb、4.9kb、5kb或更大)。在
一些实施例中,遗传元件的长度为约2.5kb

4.6kb、2.8kb

4.0kb、3.0kb

3.8kb或3.2kb

3.7kb。在一些实施例中,遗传元件具有约1.5

2.0、1.5

2.5、1.5

3.0、1.5

3.5、1.5

3.8、1.5

3.9、1.5

4.0、1.5

4.5或1.5

5.0kb的长度。在一些实施例中,遗传元件具有约2.0

2.5、2.0

3.0、2.0

3.5、2.0

3.8、2.0

3.9、2.0

4.0、2.0

4.5或2.0

5.0kb的长度。在一些实施例中,遗传元件具有约2.5

3.0、2.5

3.5、2.5

3.8、2.5

3.9、2.5

4.0、2.5

4.5或2.5

5.0kb的长度。在一些实施例中,遗传元件具有约3.0

5.0、3.5

5.0、4.0

5.0或4.5

5.0kb的长度。在一些实施例中,遗传元件具有约1.5

2.0、2.0

2.5、2.5

3.0、3.0

3.5、3.1

3.6、3.2

3.7、3.3

3.8、3.4

3.9、3.5

4.0、4.0

4.5或4.5

5.0kb的长度。
[2295]
在一些实施例中,遗传元件包含本文描述的一个或多个特征,例如,编码基本上非致病性蛋白的序列,蛋白质结合序列,编码调节性核酸的一个或多个序列,一个或多个调节性序列,编码复制蛋白的一个或多个序列,以及其他序列。在一些实施例中,基本上非致病性的蛋白包含氨基酸序列或其功能片段或与本文所述的氨基酸序列中任一个(指环病毒氨基酸序列,例如,表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中任一个所列)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[2296]
在实施例中,遗传元件由双链环状dna产生(例如,通过体外环化产生)。在一些实施例中,遗传元件通过双链环状dna的滚环复制产生。在实施例中,滚环复制发生在细胞(例如宿主细胞,例如哺乳动物细胞,例如人细胞,例如hek293t细胞、a549细胞或jurkat细胞)中。在实施例中,遗传元件可以通过细胞中的滚环复制以指数扩增。在实施例中,遗传元件可以通过细胞中的滚环复制以线性扩增。在实施例中,双链环状dna或遗传元件能够通过细胞中的滚环复制产生原始量的至少2、4、8、16、32、64、128、256、518、1024倍或更多倍。在实施例中,将例如如本文所述的双链环状dna引入细胞中。
[2297]
在一些实施例中,双链环状dna和/或遗传元件不包含一种或多种细菌质粒元件(例如细菌复制起点或可选择标记,例如细菌抗性基因)。在一些实施例中,双链环状dna和/或遗传元件不包含细菌质粒骨架。
[2298]
在一个实施例中,本发明包括一种遗传元件,所述遗传元件包括编码(i)基本上非致病性的外部蛋白质,(ii)将所述遗传元件结合至所述基本上非致病性的外部蛋白质的外部蛋白质结合序列,以及(iii)调节性核酸的核酸序列(例如dna序列)。在这样的实施例中,遗传元件可包含一个或多个序列,所述序列与天然病毒序列(例如,天然指环病毒序列,例如,如本文所述)的核苷酸序列中任一个具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性。
[2299]
蛋白质结合序列
[2300]
许多病毒采用的策略是病毒衣壳蛋白识别其基因组中的特定蛋白质结合序列。例如,在具有未分段基因组的病毒(例如酵母的l

a病毒)中,在基因组的5'端有二级结构(茎环)和特定序列,它们都用于结合病毒衣壳蛋白。但是,具有分段基因组的病毒(如呼肠孤病毒科、正粘病毒科(流行性感冒)、布尼亚病毒科和沙粒病毒)需要包装每个基因组片段。一些病毒利用片段的互补区来帮助病毒包括每个基因组分子中的一个。其他病毒对于每个不同的片段具有特定的结合位点。例如,参见curr opin struct biol.[结构生物学最新观点]2010年2月;20(1):114

120;和journal of virology[病毒学杂志](2003),77(24),
13036

13041。
[2301]
在一些实施例中,遗传元件编码与基本上非致病性的蛋白质结合的蛋白质结合序列。在一些实施例中,蛋白质结合序列有助于将遗传元件包装到蛋白质外部中。在一些实施例中,蛋白质结合序列特异性结合基本上非致病性的蛋白质的精氨酸富集区。在一些实施例中,遗传元件包含如实例8中所述的蛋白质结合序列。在一些实施例中,遗传元件包含蛋白质结合序列,其与指环病毒序列的5’utr保守结构域或gc富集结构域(例如,如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中任一个所示)具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[2302]
在实施例中,蛋白质结合序列与表a1的指环病毒5’utr保守结构域核苷酸序列(例如,表a1的核酸序列的核苷酸165

235)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表a1的指环病毒gc富集核苷酸序列(例如,表a1的核酸序列的核苷酸3620

3648)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表a3的指环病毒5’utr保守结构域核苷酸序列(例如,表a3的核酸序列的核苷酸175

245)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表a5的指环病毒5’utr保守结构域核苷酸序列(例如,表a5的核酸序列的核苷酸138

208)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表a7的指环病毒5’utr保守结构域核苷酸序列(例如,表a7的核酸序列的核苷酸174

244)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表a7的指环病毒gc富集核苷酸序列(例如,表a7的核酸序列的核苷酸3720

3742)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表a9的指环病毒5’utr保守结构域核苷酸序列(例如,表a9的核酸序列的核苷酸100

171)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表a11的指环病毒5’utr保守结构域核苷酸序列(例如,表a11的核酸序列的核苷酸294

364)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表a1的指环病毒gc富集核苷酸序列(例如,表a11的核酸序列的核苷酸3844

3895)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[2303]
在实施例中,蛋白质结合序列与表1的指环病毒5’utr保守结构域核苷酸序列(例如,表1的核酸序列的核苷酸177

247)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表1的指环病毒gc富集核苷酸序列(例如,表1的核酸序列的核苷酸3415

3570)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表3的指环病毒5’utr保守结构域核苷酸序列(例如,表3的核酸序列的核苷酸204

273)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表3的指环病毒gc富集核苷酸序列(例如,表3的核酸序列的核苷酸3302

3541)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或
100%序列同一性。在实施例中,蛋白质结合序列与表5的指环病毒5’utr保守结构域核苷酸序列(例如,表5的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表5的指环病毒gc富集核苷酸序列(例如,表5的核酸序列的核苷酸3632

3753)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表7的指环病毒5’utr保守结构域核苷酸序列(例如,表7的核酸序列的核苷酸170

238)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表7的指环病毒gc富集核苷酸序列(例如,表7的核酸序列的核苷酸3768

3878)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表9的指环病毒5’utr保守结构域核苷酸序列(例如,表9的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表9的指环病毒gc富集核苷酸序列(例如,表9的核酸序列的核苷酸3302

3541)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表11的指环病毒5’utr保守结构域核苷酸序列(例如,表11的核酸序列的核苷酸174

244)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表11的指环病毒gc富集核苷酸序列(例如,表11的核酸序列的核苷酸3691

3794)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表13的指环病毒5’utr保守结构域核苷酸序列(例如,表13的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表13的指环病毒gc富集核苷酸序列(例如,表13的核酸序列的核苷酸3759

3866)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表15的指环病毒5’utr保守结构域核苷酸序列(例如,表15的核酸序列的核苷酸323

393)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表15的指环病毒gc富集核苷酸序列(例如,表15的核酸序列的核苷酸2868

2929)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表17的指环病毒5’utr保守结构域核苷酸序列(例如,表17的核酸序列的核苷酸117

187)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表17的指环病毒gc富集核苷酸序列(例如,表17的核酸序列的核苷酸3054

3172)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[2304]
在实施例中,蛋白质结合序列与表b1的指环病毒5’utr保守结构域核苷酸序列(例如,表b1的核酸序列的核苷酸185

255)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表b1的指环病毒gc富集核苷酸序列(例如,表b1的核酸序列的核苷酸3141

3264)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表b2的指环病毒5’utr保守结构域核苷酸序列(例如,表b2的核酸序列的核苷酸
185

254)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表b2的指环病毒gc富集核苷酸序列(例如,表b2的核酸序列的核苷酸3076

3176)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表b3的指环病毒5’utr保守结构域核苷酸序列(例如,表b3的核酸序列的核苷酸178

248)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表b3的指环病毒gc富集核苷酸序列(例如,表b3的核酸序列的核苷酸3555

3696)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表b4的指环病毒5’utr保守结构域核苷酸序列(例如,表b4的核酸序列的核苷酸176

246)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表b4的指环病毒gc富集核苷酸序列(例如,表b4的核酸序列的核苷酸3720

3828)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表b5的指环病毒5’utr保守结构域核苷酸序列(例如,表b5的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在实施例中,蛋白质结合序列与表b5的指环病毒gc富集核苷酸序列(例如,表b5的核酸序列的核苷酸3716

3815)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
[2305]5’
utr区域
[2306]
在一些实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38和/或图20中所示的核酸序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在一些实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括表38所示的共有5'utr序列的核酸序列,其中x1、x2、x3、x4和x5各自独立地是任何核苷酸,例如其中x1=g或t,x2=c或a,x3=g或a,x4=t或c,并且x5=a、c或t)。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的共有5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的示例性ttv 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的ttv

ct30f 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的ttv

hd23a 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的ttv

ja20 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的ttv

tjn02 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的
ttv

tth8 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
[2307]
在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的甲型细环病毒共有5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的甲型细环病毒进化分枝1 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的甲型细环病毒进化分枝2 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的甲型细环病毒进化分枝3 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的甲型细环病毒进化分枝4 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的甲型细环病毒进化分枝5 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的甲型细环病毒进化分枝6 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表38中所示的甲型细环病毒进化分枝7 5’utr序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
[2308]
在实施例中,遗传元件包含与表a1的指环病毒5'utr保守结构域核苷酸序列(例如,表a1的核酸序列的核苷酸165

235)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表a3的指环病毒5'utr保守结构域核苷酸序列(例如,表a3的核酸序列的核苷酸175

245)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表a5的指环病毒5'utr保守结构域核苷酸序列(例如,表a5的核酸序列的核苷酸138

208)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表a7的指环病毒5'utr保守结构域核苷酸序列(例如,表a7的核酸序列的核苷酸174

244)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表a9的指环病毒5'utr保守结构域核苷酸序列(例如,表a9的核酸序列的核苷酸100

171)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表a11的指环病毒5'utr保守结构域核苷酸序列(例如,表a11的核酸序列的核苷酸294

364)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[2309]
在实施例中,遗传元件包含与表1的指环病毒5'utr保守结构域核苷酸序列(例如,
表1的核酸序列的核苷酸177

247)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表3的指环病毒5'utr保守结构域核苷酸序列(例如,表3的核酸序列的核苷酸204

273)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表5的指环病毒5'utr保守结构域核苷酸序列(例如,表5的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表7的指环病毒5'utr保守结构域核苷酸序列(例如,表7的核酸序列的核苷酸170

238)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表9的指环病毒5'utr保守结构域核苷酸序列(例如,表9的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表11的指环病毒5'utr保守结构域核苷酸序列(例如,表11的核酸序列的核苷酸174

244)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表13的指环病毒5'utr保守结构域核苷酸序列(例如,表13的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表15的指环病毒5'utr保守结构域核苷酸序列(例如,表15的核酸序列的核苷酸323

393)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表17的指环病毒5'utr保守结构域核苷酸序列(例如,表17的核酸序列的核苷酸117

187)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[2310]
在实施例中,遗传元件包含与表b1的指环病毒5'utr保守结构域核苷酸序列(例如,表b1的核酸序列的核苷酸185

255)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表b2的指环病毒5'utr保守结构域核苷酸序列(例如,表b2的核酸序列的核苷酸185

254)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表b3的指环病毒5'utr保守结构域核苷酸序列(例如,表b3的核酸序列的核苷酸178

248)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表b4的指环病毒5'utr保守结构域核苷酸序列(例如,表b4的核酸序列的核苷酸176

246)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表b5的指环病毒5'utr保守结构域核苷酸序列(例如,表b5的核酸序列的核苷酸170

240)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[2311]
表38.来自指环病毒的示例性5'utr序列
[2312]
[2313][2314]
gc富集区
[2315]
在一些实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39和/或图20和32中的任一个中所示的核酸序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的gc富集序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
[2316]
在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中所示的36个核苷酸的gc富集序列(例如,36个核苷酸的共有gc富集区序列1、36个核苷酸的共有gc富集区序列2、ttv进化分枝1 36个核苷酸的区域、ttv进化分枝3 36个核苷酸的区域、ttv进化分枝3分离株gh1 36个核苷酸的区域、ttv进化分枝3sle1932 36个核苷酸的区域、ttv进化分枝4 ctdc002 36个核苷酸的区域、ttv进化分枝5 36个核苷酸区域、ttv进化分枝6 36
个核苷酸的区域或ttv进化分枝7 36个核苷酸的区域)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包含核酸序列,所述核酸序列包含表39中所示的36个核苷酸的gc富集序列(例如,36个核苷酸的共有gc富集区序列1、36个核苷酸的共有gc富集区序列2、ttv进化分枝1 36个核苷酸的区域、ttv进化分枝3 36个核苷酸的区域、ttv进化分枝3分离株gh1 36个核苷酸的区域、ttv进化分枝3sle1932 36个核苷酸的区域、ttv进化分枝4ctdc002 36个核苷酸的区域、ttv进化分枝5 36个核苷酸区域、ttv进化分枝6 36个核苷酸的区域或ttv进化分枝7 36个核苷酸的区域)的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸。
[2317]
在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包含与甲型细环病毒gc富集区序列(例如选自ttv

ct30f、ttv

p13

1、ttv

tth8、ttv

hd20a、ttv

16、ttv

tjn02或ttv

hd16d,例如,如表39中所列)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包含核酸序列,所述核酸序列包含甲型细环病毒gc富集区序列(例如选自ttv

ct30f、ttv

p13

1、ttv

tth8、ttv

hd20a、ttv

16、ttv

tjn02或ttv

hd16d,例如,如表39中所列)的至少10、15、20、25、30、35、40、45、50、60、70、80、90、100、104、105、108、110、111、115、120、122、130、140、145、150、155或156个连续核苷酸。
[2318]
在实施例中,36个核苷酸的gc富集序列选自:
[2319]
(i)cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160),
[2320]
(ii)gcgctx1cgcgcgcgcgccggggggctgcgccccccc(seq id no:164),其中x1选自t、g或a;
[2321]
(iii)gcgcttcgcgcgccgcccactagggggcgttgcgcg(seq id no:165);
[2322]
(iv)gcgctgcgcgcgccgcccagtagggggcgcaatgcg(seq id no:166);
[2323]
(v)gcgctgcgcgcgcggcccccgggggaggcattgcct(seq id no:167);
[2324]
(vi)gcgctgcgcgcgcgcgccgggggggcgccagcgccc(seq id no:168);
[2325]
(vii)gcgcttcgcgcgcgcgccggggggctccgccccccc(seq id no:169);
[2326]
(viii)gcgcttcgcgcgcgcgccggggggctgcgccccccc(seq id no:170);
[2327]
(ix)gcgctacgcgcgcgcgccggggggctgcgccccccc(seq id no:171);或
[2328]
(x)gcgctacgcgcgcgcgccggggggctctgccccccc(seq id no:172)。
[2329]
在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包含核酸序列cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160)。
[2330]
在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包含表39中所示的共有gc富集序列的核酸序列,其中x1、x4、x5、x6、x7、x
12
、x
13
、x
14
、x
15
、x
20
、x
21
、x
22
、x
26
、x
29
、x
30
和x
33
各自独立地是任何核苷酸,并且其中x2、x3、x8、x9、x
10
、x
11
、x
16
、x
17
、x
18
、x
19
、x
23
、x
24
、x
25
、x
27
、x
28
、x
31
、x
32
和x
34
各自独立地是不存在的或任何核苷酸。在一些实施例中,x1至x
34
中的一个或多个(例如全部)各自独立地是表39中指定的核苷酸(或不存在)。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的示例性ttv gc富集序列(例如,全序列、片段1、片段2、片段3或其任何组合,例如按顺序排列的片段1

3)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实
施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的ttv

ct30f gc富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8或其任何组合,例如按顺序排列的片段1

7)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的ttv

hd23a gc富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、或其任何组合,例如按顺序排列的片段1

6)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的ttv

ja20 gc富集序列(例如,全序列、片段1、片段2或其任何组合,例如按顺序排列的片段1和2)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的ttv

tjn02 gc富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8或其任何组合,例如按顺序排列的片段1

8)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的ttv

tth8 gc富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、片段9或其任何组合,例如按顺序排列的片段1

6)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的片段7具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的片段8具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白质结合序列)包括与表39中显示的片段9具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
[2331]
表39.来自指环病毒的示例性gc富集序列
[2332]
[2333]
[2334]
[2335]
[2336]
[2337]
[2338][2339]
在实施例中,遗传元件包含与表a1的指环病毒gc富集核苷酸序列(例如,表a1的核酸序列的核苷酸3620

3648)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表a7的指环病毒gc富集核苷酸序列(例如,表a7的核酸序列的核苷酸3720

3742)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表a1的指环病毒gc富集核苷酸序列(例如,表a11的核酸序列的核苷酸3844

3895)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[2340]
在实施例中,遗传元件包含与表1的指环病毒gc富集核苷酸序列(例如,表1的核酸序列的核苷酸3415

3570)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表3的指环病毒gc富集核苷酸序列(例如,表3的核酸序列的核苷酸3302

3541)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表5的指环病毒gc富集核苷酸序列(例如,表5的核酸序列的核苷酸3632

3753)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表7的指环病毒gc富集核苷酸序列(例如,表7的核酸序列的核苷酸3768

3878)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表9的指环病毒gc富集核苷酸序列(例如,表9的核酸序列的核苷酸3302

3541)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表11的指环病毒gc富集核苷酸序列(例如,表11的核酸序列的核苷酸3691

3794)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表13的指环病毒gc富集核苷酸序列(例如,表13的核酸序列的核苷酸3759

3866)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表15的指环病毒
gc富集核苷酸序列(例如,表15的核酸序列的核苷酸2868

2929)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表17的指环病毒gc富集核苷酸序列(例如,表17的核酸序列的核苷酸3054

3172)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[2341]
在实施例中,遗传元件包含与表b1的指环病毒gc富集核苷酸序列(例如,表b1的核酸序列的核苷酸3141

3264)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表b2的指环病毒gc富集核苷酸序列(例如,表b2的核酸序列的核苷酸3076

3176)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表b3的指环病毒gc富集核苷酸序列(例如,表b3的核酸序列的核苷酸3555

3696)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表b4的指环病毒gc富集核苷酸序列(例如,表b4的核酸序列的核苷酸3720

3828)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,遗传元件包含与表b5的指环病毒gc富集核苷酸序列(例如,表b5的核酸序列的核苷酸3716

3815)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
[2342]
效应子
[2343]
在一些实施例中,遗传元件可包括一种或多种编码功能性效应子的序列,例如内源性效应子或外源性效应子,例如治疗性多肽或核酸,例如细胞毒性或细胞溶解性rna或蛋白质。在一些实施例中,功能性核酸是非编码rna。在一些实施例中,功能性核酸是编码rna。效应子可以调节生物活性,例如增加或降低酶活性、基因表达、细胞信号传导以及细胞或器官功能。效应子活性还可包括结合调节性蛋白以调节调节子的活性,例如转录或翻译。效应子活性还可以包括激活剂或抑制剂功能。例如,效应子可通过触发酶中底物亲和力的增加来诱导酶活性,例如,果糖2,6

二磷酸激活磷酸果糖激酶1并增加糖酵解响应于胰岛素的速率。在另一个实例中,效应子可以抑制底物与受体的结合并抑制其激活,例如,纳曲酮和纳洛酮结合阿片样物质受体而不激活它们,并阻断受体结合阿片样物质的能力。效应子活性还可以包括调节蛋白质的稳定性/降解和/或转录物的稳定性/降解。例如,可以通过多肽辅因子泛素在蛋白质上以将它们标记为降解,从而将蛋白质靶向降解。在另一个实例中,效应子通过阻断酶的活性位点来抑制酶活性,例如,甲氨蝶呤是四氢叶酸(一种二氢叶酸还原酶的辅酶)的结构类似物,其与二氢叶酸还原酶的结合力比天然底物高1000倍,并抑制核苷酸碱基合成。
[2344]
在一些实施例中,编码效应子的序列是遗传元件的一部分,例如,它可以插入在如实例10、12或22中所述的插入位点。在实施例中,在非编码区处将编码效应子的序列插入遗传元件中,例如,位于开放阅读框的3'和遗传元件的gc富集区的5'的非编码区,在tata盒上游的5'非编码区中,在5’utr中,在聚a信号下游或gc富集区上游的3'非编码区中。在实施例中,在例如本文所述的ttv

tth8质粒的约核苷酸3588处或在例如本文所述的ttmv

ly2质粒的约核苷酸2843处将编码效应子的序列插入遗传元件中。在实施例中,在例如本文所述的
ttv

tth8质粒的核苷酸336

3015处或之内或在例如本文所述的ttv

ly2质粒的核苷酸242

2812处或之内将编码效应子的序列插入遗传元件中。在一些实施例中,编码效应子的序列替代了开放阅读框的一部分或全部(例如,本文所述的orf,例如,表a1

a12、b1

b5、c1

c5或1

18中任一个中所示的orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3和/或orf2t/3)。
[2345]
在一些实施例中,编码效应子的序列包括100

2000、100

1000、100

500、100

200、200

2000、200

1000、200

500、500

1000、500

2000或1000

2000个核苷酸。在一些实施例中,效应子是核酸或蛋白质有效负载,例如,如实例11中所述。
[2346]
调节性核酸
[2347]
在一些实施例中,效应子是调节性核酸。调节性核酸修饰内源基因和/或外源基因的表达。在一实施例中,调控核酸靶向宿主基因。调节性核酸可包括但不限于与内源基因杂交的核酸(例如,如本文其他地方所述的mirna、sirna、mrna、lncrna、rna、dna、反义rna、grna)、与外源核酸(例如病毒dna或rna)杂交的核酸、与rna杂交的核酸、干扰基因转录的核酸、干扰rna翻译的核酸、稳定rna或去稳定rna的核酸(例如通过靶向降解),以及调节dna或rna结合因子的核酸。在实施例中,调节性核酸编码mirna。
[2348]
在一些实施例中,调节性核酸包含通常包含5

500个碱基对的rna或rna样结构(取决于特定的rna结构,例如mirna 5

30bp、lncrna 200

500bp)并且可以具有与细胞内表达的靶基因中的编码序列或编码细胞内表达的靶基因的序列相同(或互补)或几乎相同(或基本上互补)的核碱基序列。
[2349]
在一些实施例中,调节性核酸包含核酸序列,例如,指导rna(grna)。在一些实施例中,dna靶向部分包含指导rna或编码指导rna的核酸。grna短合成rna可以由与不完整的效应子部分结合所必需的“支架”序列和用于基因组靶标的用户定义的约20个核苷酸靶向序列组成。在实践中,指导rna序列通常被设计为具有17

24个核苷酸(例如19、20或21个核苷酸)的长度,并且与靶核酸序列互补。定制的grna生成器和算法可从商业上获得,用于设计有效的指导rna。还使用嵌合的“单指导rna”(“sgrna”),一种模拟天然存在的crrna

tracrrna复合物并包含tracrrna(用于结合核酸酶)和至少一个crrna(以将核酸酶指导至编辑目标序列)的工程化(合成)单rna分子,实现了基因编辑。也已经证明,在基因组编辑中,化学修饰的sgrna是有效的;参见,例如,hendel等人(2015)nature biotechnol.[自然生物技术],985

991。
[2350]
调节性核酸包含识别特定dna序列(例如,与基因的启动子、增强子、沉默子或阻遏子相邻或在其内的序列)的grna。
[2351]
某些调节性核酸可以通过rna干扰(rnai)的生物过程抑制基因表达。rnai分子包含rna或rna样结构,其通常包含15

50个碱基对(例如约18

25个碱基对)并且具有与细胞内表达的靶基因中的编码序列相同(互补)或几乎相同(基本上互补)的核碱基序列。rnai分子包括但不限于:短干扰rna(sirna)、双链rna(dsrna)、微小rna(mirna)、短发夹rna(shrna)、部分双螺旋和dicer底物(美国专利号8,084,599、8,349,809和8,513,207)。
[2352]
长非编码rna(lncrna)定义为长于100个核苷酸的非蛋白质编码转录本。这个有点随意的限制将lncrna与小型调控rna(例如微小rna(mirna)、短干扰rna(sirna)和其他短rna)区分开来。通常,大多数(约78%)lncrna的特征为组织特异性的。以与附近蛋白质编码基因相反的方向转录的发散lncrna(占哺乳动物基因组中总lncrna的约20%大比例)可能
会调控附近基因的转录。
[2353]
遗传元件可以编码具有与内源基因或基因产物(例如,mrna)的全部或片段基本上互补或完全互补的序列的调节性核酸。调节性核酸可以与内含子和外显子之间的边界处的序列互补,从而防止特异性基因的新生成的核rna转录物成熟为用于转录的mrna。与特定基因互补的调控核酸可与该基因的mrna杂交并阻止其翻译。反义调控核酸可以是dna、rna或其衍生物或杂交体。
[2354]
与目的转录物杂交的调节性核酸的长度可以在5至30个核苷酸之间,在约10至30个核苷酸之间,或约11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个核苷酸。调节性核酸与靶向转录物的同一性程度应为至少75%、至少80%、至少85%、至少90%或至少95%。
[2355]
遗传元件可以编码调节性核酸,例如与靶基因的约5至约25个连续核苷酸相同的微小rna(mirna)分子。在一些实施例中,mirna序列靶向mrna并从二核苷酸aa开始,其gc含量为约30%

70%(约30%

60%、约40%

60%或约45%

55%),并且例如通过标准blast搜索测定,与要引入其中的哺乳动物基因组中的靶标以外的任何核苷酸序列不具有高百分比同一性。
[2356]
在一些实施例中,调节性核酸是至少一种mirna,例如2、3、4、5、6种或更多种。在一些实施例中,遗传元件包含编码mirna的序列,所述mirna与本文所述例如表40中所述的核苷酸序列或与序列互补的序列中任一个具有至少约75%、80%、85%、90%、95%、96%、97%、98%、99%或100%核苷酸序列同一性。
[2357]
表40:调节性核酸例如mirna的实例。
[2358]
[2359]
[2360]
[2361]
[2362]
[2363]
[2364]
[2365]
[2366]
[2367]
[2368]
[2369]
[2370]
[2371]
[2372]
[2373]
[2374][2375]
sirna和shrna类似于内源性微小rna(mirna)基因的加工途径中的中间体(bartel,cell[细胞]116:281

297,2004)。在一些实施例中,sirna可以用作mirna,反之亦然(zeng等人,mol cell[分子细胞学]9:1327

1333,2002;doench等人,genes dev[基因与发育]17:438

442,2003)。像sirna一样,微小rna使用risc来下调靶基因,但与sirna不同,大多数动物mirna都不切割mrna。相反,mirna通过翻译抑制或聚a去除和mrna降解降低蛋白质输出(wu等人,proc natl acad sci usa[美国科学院院报]103:4034

4039,2006)。已知的mirna结合位点位于mrna 3’utr内;mirna似乎靶向与mirna 5'端的2

8个核苷酸几乎完全互补的位点(rajewsky,nat genet[自然遗传学]38增刊:s8

13,2006;lim等人,nature[自然]433:769

773,2005)。该区域称为种子区域。由于sirna和mirna是可互换的,因此外源sirna下调与sirna具有种子互补性的mrna(birmingham等人,nat methods[自然方法]3:199

204,2006)。3'utr内的多个靶位点会产生更强的下调(doench等人,genes dev[基因与发育]17:438

442,2003)。
[2376]
已知mirna序列的列表可在研究组织维护的数据库中找到,这些组织例如维康信
托基金会桑格研究院(wellcome trust sanger institute)、宾夕法尼亚生物信息学中心(penn center for bioinformatics)、斯隆凯特灵癌症中心(memorial sloan kettering cancer center)和欧洲分子生物学实验室(european molecule biology laboratory)等。已知的有效的sirna序列和同源结合位点也很好地呈现在相关文献中。通过本领域已知的技术,rnai分子易于设计和生产的。此外,存在增加发现有效并且特异性的基序的机会的计算工具(lagana等人,methods mol.bio.[分子生物学方法],2015,1269:393

412)。
[2377]
调节性核酸可以调节基因编码的rna的表达。因为多个基因可以彼此共享一定程度的序列同源性,所以在一些实施例中,可以将调节性核酸设计为靶向具有足够序列同源性的一类基因。在一些实施例中,调节性核酸可包含与在不同基因靶之间共享的序列互补的或特定基因靶所特有的序列。在一些实施例中,可以将调节性核酸设计为靶向在几个基因之间具有同源性的rna序列的保守区,从而靶向基因家族中的几个基因(例如,不同的基因同工型、剪接变体、突变基因等)。在一些实施例中,可以将调节性核酸设计为靶向单一基因的特定rna序列所特有的序列。
[2378]
在一些实施例中,遗传元件可以包括一个或多个编码调节一个或多个基因表达的调节性核酸的序列。
[2379]
在一个实施例中,本文其他地方描述的grna被用作用于基因编辑的crispr系统的一部分。出于基因编辑的目的,可将指环体设计为包括一个或多个与所需的靶dna序列相对应的指导rna序列;参见,例如,cong等人(2013)science[科学],339:819

823;ran等人(2013)nature protocols[自然实验手册],8:2281

2308。grna序列的至少约16或17个核苷酸通常允许cas9介导的dna切割发生;对于cpf1,需要grna序列的至少约16个核苷酸,从而实现可检测的dna切割。
[2380]
治疗性肽或多肽
[2381]
在一些实施例中,遗传元件包含编码治疗性肽或多肽的序列。在一些实施例中,遗传元件包括编码蛋白质例如治疗性蛋白质的序列。治疗性蛋白质的一些实例可以包括但不限于激素、细胞因子、酶、抗体、转录因子、受体(例如膜受体)、配体、膜转运蛋白、分泌的蛋白质、肽、载剂蛋白、结构蛋白、核酸酶或其组分。
[2382]
在一些实施例中,遗传元件包括编码肽例如治疗性肽的序列。肽可以是直链或支链的。所述肽的长度为约5至约500个氨基酸、约15至约400个氨基酸、约20至约325个氨基酸、约25至约250个氨基酸、约50至约200个氨基酸或其间的任何范围。肽的一些实例包括但不限于荧光标签或标记、抗原、治疗性肽、天然生物活性肽的合成或类似物肽、激动剂或拮抗剂肽、抗微生物肽、靶向或细胞毒性肽、降解或自毁肽、以及多种降解或自毁肽。本文所述的可用于本发明的肽还包括抗原结合肽,例如抗原结合抗体或抗体样片段,例如单链抗体、纳米抗体(参见,例如,steeland等人2016.nanobodies as therapeutics:big opportunities for small antibodies.[纳米抗体作为治疗剂:小抗体的巨大机会]drug discov today[今日药物发现]:21(7):1076

113)。这样的抗原结合肽可以结合细胞质抗原、核抗原或细胞内抗原。
[2383]
在一些实施例中,遗传元件包含编码小肽、肽模拟物(例如拟肽)、氨基酸和氨基酸类似物的序列。这样的治疗剂通常具有小于约5,000克/摩尔的分子量、小于约2,000克/摩尔的分子量、小于约1,000克/摩尔的分子量、小于约500克/摩尔的分子量和此类化合物的
盐、酯和其他药学上可接受的形式。这样的治疗剂可以包括但不限于神经递质、激素、药物、毒素、病毒或微生物颗粒、合成分子及其激动剂或拮抗剂。
[2384]
在一些实施例中,本文所述的组合物或指环体包括与能够靶向特定位置、组织或细胞的配体连接的多肽。
[2385]
调节性序列
[2386]
在一些实施例中,遗传元件包含与编码效应子的序列可操作地连接的调控序列,例如启动子或增强子。
[2387]
在一些实施例中,启动子包括与编码表达产物的dna序列相邻的dna序列。启动子可以可操作地连接至相邻的dna序列。与不存在启动子时表达的产物的量相比,启动子通常增加dna序列表达的产物的量。来自一种生物体的启动子可用于增强来自另一生物体的dna序列的产物表达。例如,脊椎动物启动子可用于在脊椎动物中表达水母gfp。另外,一个启动子元件可以增加串联连接的多个dna序列表达的产物的量。因此,一种启动子元件可以增强一种或多种产物的表达。多个启动子元件是本领域普通技术人员众所周知的。
[2388]
在一个实施例中,期望高水平的组成型表达。此类启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(rsv)长末端重复(ltr)启动子/增强子、巨细胞病毒(cmv)立即早期启动子/增强子(参见,例如,boshart等人,cell[细胞],41:521

530(1985))、sv40启动子、二氢叶酸还原酶启动子、细胞质β

肌动蛋白启动子和磷酸甘油激酶(pgk)启动子。
[2389]
在另一个实施例中,可能期望诱导型启动子。诱导型启动子是由外源供应的化合物以顺式或反式调节的那些启动子,包括但不限于锌诱导的绵羊金属硫蛋白(mt)启动子;地塞米松(dex)诱导型小鼠乳腺肿瘤病毒(mmtv)启动子;t7聚合酶启动子系统(wo 98/10088);四环素阻抑型系统(gossen等人,proc.natl.acad.sci.usa[美国科学院院报],89:5547

5551(1992));四环素诱导型系统(gossen等人,science[科学],268:1766

1769(1995);还参见harvey等人,curr.opin.chem.biol.[化学生物学新见],2:512

518(1998));ru486诱导型系统(wang等人,nat.biotech.[自然生物技术],15:239

243(1997)和wang等人,gene ther.[基因治疗],4:432

441(1997));和雷帕霉素诱导型系统(magari等人,j.clin.invest.[临床投资杂志],100:2865

2872(1997);rivera等人,nat.medicine.[自然医学]2:1028

1032(1996))。可在本文中使用的其他类型的诱导型启动子是那些由特定的生理状态例如温度、急性期或仅在复制细胞中调节的启动子。
[2390]
在一些实施例中,使用目的基因或核酸序列的天然启动子。当期望基因或核酸序列的表达应模拟天然表达时,可以使用天然启动子。当基因或其他核酸序列的表达必须在时间或发育上,或以组织特异性方式或响应于特定转录刺激进行调节时,可以使用天然启动子。在另一个实施例中,也可以使用其他天然表达控制元件,例如增强子元件、聚腺苷酸化位点或kozak共有序列来模拟天然表达。
[2391]
在一些实施例中,遗传元件包含可操作地连接至组织特异性启动子的基因。例如,如果需要在骨骼肌中表达,则可以使用在肌肉中有活性的启动子。这些包括来自编码骨骼肌α

肌动蛋白、肌球蛋白轻链2a、肌营养不良蛋白、肌肉肌酸激酶、以及具有比天然启动子更高活性的合成肌肉启动子的启动子。参见li等人,nat.biotech.[自然生物技术],17:241

245(1999)。对于以下的组织特异性的启动子的实例是已知的:肝白蛋白,miyatake等人j.virol.[病毒学杂志],71:5124

32(1997);乙型肝炎病毒核心启动子,sandig等人,
gene ther.[基因治疗]3:1002

9(1996);甲胎蛋白(afp),arbuthnot等人,hum.gene ther.[人类基因治疗],7:1503

14(1996),骨骼(骨钙素,stein等人,mol.biol.rep.[分子生物学报告],24:185

96(1997);骨骼唾液蛋白,chen等人,j.bone miner.res.[骨与矿物研究杂志]11:654

64(1996)),lymphocytes[淋巴细胞](cd2,hansal等人,j.immunol.[免疫学杂志],161:1063

8(1998);免疫球蛋白重链;t细胞受体a链),神经元(神经元特异性烯醇化酶(nse)启动子,andersen等人cell.mol.neurobiol.[细胞与分子神经生物学],13:503

15(1993);神经丝轻链基因,piccioli等人,proc.natl.acad.sci.usa[美国科学院院报],88:5611

5(1991);神经元特异性vgf基因,piccioli等人,neuron[神经元],15:373

84(1995)];等。
[2392]
遗传元件可包括增强子,例如与编码基因的dna序列相邻的dna序列。增强子元件通常位于启动子元件的上游,或者可以位于编码dna序列(例如,转录或翻译成一种或多种产物的dna序列)的下游或之内。因此,增强子元件可位于编码产物的dna序列上游或下游的100个碱基对、200个碱基对或300个或更多个碱基对。增强子元件可以增加dna序列表达的重组产物的量,超出由启动子元件提供的增加的表达。对于本领域普通技术人员而言,多个增强子元件是容易获得的。
[2393]
在一些实施例中,遗传元件包括在编码本文所述的表达产物的序列侧翼的一个或多个反向末端重复序列(itr)。在一些实施例中,遗传元件包含在编码本文所述的表达产物的序列侧翼的一个或多个长末端重复序列(ltr)。可以使用的启动子序列的实例包括但不限于猿猴病毒40(sv40)早期启动子、小鼠乳腺肿瘤病毒(mmtv)、人免疫缺陷病毒(hiv)长末端重复序列(ltr)启动子、momulv启动子、禽白血病病毒启动子、epstein

barr病毒立即早期启动子和劳斯肉瘤病毒启动子。
[2394]
复制蛋白
[2395]
在一些实施例中,指环体例如合成的指环体的遗传元件可包括编码一种或多种复制蛋白的序列。在一些实施例中,指环体可以通过滚环复制法复制,例如,前导链和滞后链的合成是不偶联的。在这样的实施例中,指环体包含三个附加元件:i)编码起始蛋白的基因,ii)双链起点,和iii)单链起点。包含复制蛋白的滚环复制(rcr)蛋白复合物与前导链结合并使复制起点去稳定。rcr复合物切割基因组以产生游离的3'oh末端。细胞dna聚合酶从游离的3'oh末端开始病毒dna复制。复制基因组后,rcr复合物共价地闭合环。这导致释放出正的环状单链亲本dna分子和由负的亲本链和新合成的正链组成的环状双链dna分子。单链dna分子可以被包壳或涉及第二轮复制。参见例如virology journal[病毒学杂志]2009,6:60doi:10.1186/1743

422x
‑6‑
60。
[2396]
遗传元件可包含编码聚合酶,例如rna聚合酶或dna聚合酶的序列。
[2397]
其他序列
[2398]
在一些实施例中,遗传元件还包括编码产物(例如核酶、编码蛋白质的治疗性mrna、外源基因)的核酸。
[2399]
在一些实施例中,遗传元件包括一个或多个影响指环体在宿主或宿主细胞中的物种和/或组织和/或细胞嗜性(例如衣壳蛋白序列)、感染性(例如衣壳蛋白序列)、免疫抑制/激活(例如调节核酸)、病毒基因组结合和/或包装、免疫逃逸(非免疫原性和/或耐受性)、药代动力学、内吞作用和/或细胞附着、核进入、细胞内调节和定位、胞吐作用调节、繁殖和核
酸保护的序列。
[2400]
在一些实施例中,遗传元件可以包含其他序列,其包括dna、rna或人工核酸。其他序列可以包括但不限于基因组dna,cdna或编码trna、mrna、rrna、mirna、grna、sirna或其他rnai分子的序列。在一个实施例中,遗传元件包括编码sirna的序列,以靶向与调节性核酸相同的基因表达产物的不同基因座。在一个实施例中,遗传元件包括编码sirna的序列,以靶向与调节性核酸不同的基因表达产物。
[2401]
在一些实施例中,遗传元件进一步包含以下序列中的一个或多个:编码一个或多个mirna的序列、编码一个或多个复制蛋白的序列、编码外源基因的序列、编码治疗剂的序列、调节性序列(例如启动子、增强子)、编码一个或多个靶向内源基因(sirna、lncrna、shrna)的调节性序列的序列和编码治疗性mrna或蛋白质的序列。
[2402]
其他序列的长度可为约2nt至约5000nt、约10nt至约100nt、约50nt至约150nt、约100nt至约200nt、约150nt至约250nt、约200至约300nt、约250nt至约350nt、约300nt至约500nt、约10nt至约1000nt、约50nt至约1000nt、约100nt至约1000nt、约1000nt至约2000nt、约2000nt至约3000nt、约3000nt至约4000nt、约4000nt至约5000nt或其间的任何范围。
[2403]
编码的基因
[2404]
例如,遗传元件可以包括与信号传导生化途径相关的基因,例如与信号传导生化途径相关的基因或多核苷酸。实例包括与疾病相关的基因或多核苷酸。“与疾病相关的”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在患病组织衍生的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。它可能是会以异常高水平表达的基因;它可能是会以异常低水平表达的基因,其中表达的改变与疾病的发生和/或进展相关。与疾病相关的基因还指具有直接引起病因或与引起病因的一个或多个基因连锁不平衡的一个或多个突变或基因变异的基因。
[2405]
与疾病相关的基因和多核苷酸的实例可得自约翰
·
霍普金斯大学的麦考斯克

纳森斯遗传医学研究所(马里兰州巴尔的摩)(mckusick

nathans institute of genetic medicine,johns hopkins university(baltimore,md.))和国家医学图书馆的国家生物技术信息中心(马里兰州贝塞斯达)(national center for biotechnology information,national library of medicine(bethesda,md.))。与疾病相关的基因和多核苷酸的实例列于美国专利号:8,697,359的表a

c中,所述专利通过引用整体并入本文。特定疾病信息可获自约翰
·
霍普金斯大学的麦考斯克

纳森斯遗传医学研究所(马里兰州巴尔的摩)(mckusick

nathans institute of genetic medicine,johns hopkins university(baltimore,md.))和国家医学图书馆的国家生物技术信息中心(马里兰州贝塞斯达)(national center for biotechnology information,national library of medicine(bethesda,md.))。与信号传导生化途径相关的基因和多核苷酸的实例列于美国专利号:8,697,359的表a

c中,所述专利通过引用整体并入本文。
[2406]
此外,如本文其他地方所述,遗传元件可以编码靶向部分。这可以例如通过插入编码糖、糖脂或蛋白质例如抗体的多核苷酸来实现。本领域技术人员知道用于生成靶向部分的其他方法。
[2407]
病毒序列
[2408]
在一些实施例中,遗传元件包含至少一个病毒序列。在一些实施例中,所述序列与
来自单链dna病毒,例如指环病毒、比那病毒、圆环病毒、双生病毒、基诺病毒、丝状病毒、微小病毒、纳米病毒、细小病毒和斯派拉病毒的一个或多个序列具有同源性或同一性。在一些实施例中,所述序列与来自双链dna病毒,例如腺病毒、瓶状病毒、囊泡病毒、非洲猪瘟病毒、杆状病毒、福斯罗病毒、球状病毒、滴状病毒、腺炎病毒、疱疹病毒、虹彩病毒、脂毛病毒、尼马病毒和痘病毒的一个或多个序列具有同源性或同一性。在一些实施例中,所述序列与来自rna病毒,例如甲病毒、真菌传杆状病毒、肝炎病毒、大麦病毒、烟草花叶病毒、烟草脆裂病毒、三角病毒、风疹病毒、双rna病毒、囊状病毒、分体病毒和呼肠病毒的一个或多个序列具有同源性或同一性。
[2409]
在一些实施例中,遗传元件可包含来自非致病性病毒,例如共生病毒(symbiotic virus),例如共栖病毒(commensal virus),例如天然病毒,例如指环病毒的一个或多个序列。命名法的最新变化已将三种能够感染人细胞的指环病毒划分为病毒的指环病毒科的甲型细环病毒(tt)、乙型细环病毒(ttm)和丙型细环病毒(ttmd)属。迄今为止,指环病毒尚未与任何人疾病相关联。在一些实施例中,遗传元件可包含与细环病毒(tt)具有同源性或同一性的序列,所述细环病毒(tt)是一种具有环状负义基因组的非包膜单链dna病毒。在一些实施例中,遗传元件可包含与sen病毒、前哨病毒、ttv样微小病毒和tt病毒具有同源性或同一性的序列。已经描述了不同类型的tt病毒,包括tt病毒基因型6、tt病毒群、ttv样病毒dxl1和ttv样病毒dxl2。在一些实施例中,遗传元件可包含与较小病毒、细环样微小病毒(ttm)或基因组大小在ttv和ttmv之间的第三种病毒(称为细环样中型病毒(ttmd))具有同源性或同一性的序列。在一些实施例中,遗传元件可包含与本文所述核苷酸序列中任一个具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性的来自非致病性病毒的一个或多个序列或序列的片段。
[2410]
在一些实施例中,遗传元件可包含与本文所述例如表41中核苷酸序列中任一个具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性的来自基本上非致病性病毒的一个或多个序列或序列的片段。
[2411]
表41:指环病毒及其序列的实例。登录号和相关序列信息可在www.ncbi.nlm.nih.gov/genbank/上获得,以2018年12月11日作为参考。
[2412]
[2413]
[2414]
[2415]
[2416]
[2417]
[2418]
[2419]
[2420]
[2421][2422]
在一些实施例中,遗传元件包含与来自一种或多种非指环病毒,例如腺病毒、疱疹病毒、pox病毒、痘苗病毒、sv40、乳头瘤病毒、rna病毒(例如逆转录病毒、例如慢病毒)、单链rna病毒(例如肝炎病毒)或双链rna病毒(例如轮状病毒)的一个或多个序列具有同源性或同一性的一个或多个序列。由于在一些实施例中,重组逆转录病毒是有缺陷的,因此可以提供协助以产生感染性颗粒。可以例如通过使用辅助细胞系来提供这种协助,所述辅助细胞系包含在ltr内的调节性序列的控制下编码逆转录病毒的所有结构基因的质粒。用于复制本文所述的指环体的合适细胞系包括本领域已知的细胞系,例如a549细胞,其可以如本文所述进行修饰。所述遗传元件可以另外包含编码可选择标记的基因,从而可以鉴定期望的遗传元件。
[2423]
在一些实施例中,遗传元件包括非沉默突变,例如导致编码的多肽中氨基酸差异的碱基置换、缺失或添加,只要序列与由第一核苷酸序列编码的多肽保持至少约70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性或以其他方式可用于实施本发明。在这方面,可以进行某些保守的氨基酸置换,这些置换通常被认为不会使蛋白质的整体功能失活:例如对于带正电的氨基酸(反之亦然),赖氨酸、精氨酸和组氨酸;对于带负电的氨基酸(反之亦然),天冬氨酸和谷氨酸;对于某些电中性氨基酸的组(在所有情况下,反之亦然),(1)丙氨酸和丝氨酸,(2)天冬酰胺、谷氨酰胺和组氨酸,(3)半胱氨酸和丝氨酸,(4)甘氨酸和脯氨酸,(5)异亮氨酸、亮氨酸和缬氨酸,(6)蛋氨酸、亮氨酸和异亮氨酸,(7)苯丙氨酸、蛋氨酸、亮氨酸和酪氨酸,(8)丝氨酸和苏氨酸,(9)色氨酸和酪氨酸,(10)以及例如酪氨酸、色氨酸和苯丙氨酸。氨基酸可以根据物理性质以及对二级和三级蛋白质结构的贡献进行分类。保守置换在本领域中被认为是一个氨基酸被具有相似特性的另一氨基酸置换。
[2424]
具有相同或指定百分比的相同核苷酸或氨基酸残基的两个或更多个核酸或多肽序列的同一性(例如,当在比较窗口或指定区域内进行最大对应性的比较和对齐时,在具体区域内约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性)可使用具有以下所述默认参数的blast或blast 2.0序列比较算法,或通过手动比对和目视检查(例如,参见ncbi网站www.ncbi.nlm.nih.gov/blast/等)进行测量。同一性也可以指或可以用于对测试序列的补充。同一性还包括具有缺失和/或添加的序列以及具有置换的序列。如本文所述,算法考虑了缺口等。同一性可以在长度为至少约10个氨基酸或核苷酸、长度为约15个氨基酸或核苷酸、长度为约20个氨基酸或核苷酸、长度为约25个氨基酸或核苷酸、长度为约30个氨基酸或核苷酸、长度为约35个氨基酸或核苷酸、长度为约40个氨基酸或核苷酸、长度为约45个氨基酸或核苷酸、长度为约50个氨基
酸或核苷酸、或更多的区域中存在。
[2425]
在一些实施例中,遗传元件包含与本文所述例如如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15、17或41中的任一个中所列的核苷酸序列中任一个具有至少约75%核苷酸序列同一性,至少约80%、85%、90%、95%、96%、97%、98%、99%或100%核苷酸序列同一性的核苷酸序列。由于遗传密码是简并的,因此同源核苷酸序列可包括任何数目的“沉默”碱基改变,即仍然编码相同氨基酸的核苷酸置换。
[2426]
基因编辑组分
[2427]
指环体的遗传元件可以包括一个或多个编码基因编辑系统的组分的基因。示例性的基因编辑系统包括成簇的调节性间隔短回文重复序列(crispr)系统、锌指核酸酶(zfn)和基于转录激活子样效应子的核酸酶(talen)。基于zfn、talen和crispr的方法已在例如在gaj等人trends biotechnol.[生物技术动向]31.7(2013):397

405中描述;crispr基因编辑方法例如在guan等人,application of crispr

cas system in gene therapy:pre

clinical progress in animal model.[crispr

cas系统在基因治疗中的应用:动物模型中的临床前进展]dna repair[dna修复]2016年10月;46:1

8.doi:10.1016/j.dnarep.2016.07.004;zheng等人,precise gene deletion and replacement using the crispr/cas9 system in human cells[使用crispr/cas9系统在人细胞中进行精确基因缺失和替换].biotechniques[生物技术],第57卷,第3号,2014年9月,第115

124页中描述。
[2428]
crispr系统是最初在细菌和古细菌中发现的自适应防御系统。crispr系统使用称为crispr相关或“cas”内切核酸酶的rna指导的核酸酶(例如,cas9或cpf1)来切割外源dna。在典型的crispr/cas系统中,内切核酸酶通过靶向单链或双链dna序列的序列特异性的非编码“指导rna”定向到靶核苷酸序列(例如,基因组中待序列编辑的位点)。已经鉴定了三类(i

iii)crispr系统。ii类crispr系统使用单个cas内切核酸酶(而不是多个cas蛋白)。一种ii类crispr系统包括ii类cas内切核酸酶,例如cas9、crispr rna(“crrna”)和反式激活crrna(“tracrrna”)。crrna包含“指导rna”,即通常对应于靶dna序列的约20个核苷酸rna序列。crrna还包含与tracrrna结合的区域,以形成被rnase iii切割的部分双链结构,产生crrna/tracrrna杂交体。然后,crrna/tracrrna杂交体指导cas9内切核酸酶识别并切割靶dna序列。靶dna序列必须总体上邻近针对给定cas内切核酸酶来说是特异性的“原间隔子邻近基序”(“pam”);然而,pam序列似乎遍布整个给定基因组。
[2429]
在一些实施例中,指环体包括crispr内切核酸酶的基因。例如,从不同原核物种鉴定的一些crispr内切核酸酶具有独特的pam序列要求;pam序列的实例包括5
’‑
ngg(酿脓链球菌(streptococcus pyogenes))、5
’‑
nnagaa(嗜热链球菌(streptococcus thermophilus)crispr1)、5
’‑
nggng(嗜热链球菌crispr3)、和5
’‑
nnngatt(奈瑟氏脑膜炎双球菌(neisseria meningiditis))。一些内切核酸酶例如cas9内切核酸酶与富含g的pam位点例如5'

ngg有关,并在距pam位点上游(5')3个核苷酸处对靶dna进行平末端切割。另一个ii类crispr系统包括小于cas9的v型内切核酸酶cpf1;实例包括ascpf1(来自氨基酸球菌属物种(acidaminococcus sp.))和lbcpf1(来自毛螺旋菌属物种(lachnospiraceae sp.))。cpf1内切核酸酶与富含t的pam位点例如5'

ttn相关。cpf1也可以识别5'

cta pam基序。cpf1通过引入具有4或5个核苷酸的5'突出端的错位或交错的双链断裂来切割靶dna,例如
切割如下靶dna,该靶dna中的5个核苷酸的错位或交错的切割位于距离编码链上的pam位点下游(3’)18个核苷酸的位置处和距离互补链上的pam位点下游23个核苷酸的位置处;由这种错位切割产生的5个核苷酸突出端使得通过同源重组的dna插入比在平末端切割的dna的插入更精确地进行基因组编辑。参见例如,zetsche等人(2015)cell[细胞],163:759

771。
[2430]
指环体中可以包括多种crispr相关(cas)基因。基因的具体实例是那些编码来自ii类系统的cas蛋白(包括cas1、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9、cas10、cpf1、c2c1或c2c3)的基因。在一些实施例中,指环体包括编码cas蛋白例如cas9蛋白的基因,所述cas蛋白可以来自多种原核物种中的任一种。在一些实施例中,指环体包括编码特定cas蛋白例如特定cas9蛋白的基因,所述cas蛋白被选择以识别特定的原间隔子邻近基序(pam)序列。在一些实施例中,指环体包括编码两种或更多种不同cas蛋白或两种或更多种cas蛋白的核酸,所述cas蛋白可以被引入细胞、合子、胚胎或动物中,例如,以允许识别和修饰包含相同、相似或不同pam基序的位点。在一些实施例中,指环体包括编码具有失活的核酸酶的修饰的cas蛋白(例如,核酸酶缺陷的cas9)的基因。
[2431]
野生型cas9蛋白在被grna靶向的特定dna序列上产生双链断裂(dsb),而许多具有经修饰的功能的crispr内切核酸酶是已知的,例如:cas9的“切口酶”版本仅产生单链断裂;不具有催化活性的cas9(“dcas9”)不会切割靶dna。可以将编码dcas9的基因与编码效应子结构域的基因融合,以抑制(crispri)或激活(crispra)靶基因的表达。例如,所述基因可以编码cas9与转录沉默子(例如krab结构域)或转录激活子(例如dcas9

vp64融合体)的融合体。可以包括编码与foki核酸酶(“dcas9

foki”)融合的不具有催化活性的cas9(dcas9)的基因,以在与两个grna同源的靶序列处产生dsb。参见例如,许多crispr/cas9质粒披露于并且可公开获得自阿德基因质粒库(addgene repository)(阿德基因公司(addgene),西德尼大街75号(sidney st.),550a单元,剑桥郡,马萨诸塞州02139;addgene.org/crispr/)。ran等人(2013)cell[细胞],154:1380

1389将引入两个独立的双链断裂(每个断裂被独立的指导rna指向)的“双切口酶”cas9描述为实现了更准确的基因组编辑。
[2432]
在美国专利申请公开2016/0138008 a1和us 2015/0344912 a1以及美国专利8,697,359、8,771,945、8,945,839、8,999,641、8,993,233、8,895,308、8,865,406、8,889,418、8,871,445、8,889,356、8,932,814、8,795,965和8,906,616中披露了用于编辑真核生物的基因的crispr技术。cpf1内切核酸酶和相应的指导rna和pam位点在美国专利申请公开2016/0208243 a1中披露。
[2433]
在一些实施例中,指环体包含编码本文所述多肽(例如靶向核酸酶,例如cas9,例如野生型cas9、切口酶cas9(例如cas9 d10a)、失活cas9(dcas9)、espcas9、cpf1、c2c1或c2c3)以及grna的基因。编码核酸酶和一个或多个grna的基因的选择取决于靶向突变是核苷酸的缺失、置换或添加,例如靶序列的核苷酸缺失、置换或添加。编码与(一个或多个)效应子结构域(例如vp64)的全部或部分(例如,其生物活性部分)连接在一起的不具有催化活性的内切核酸酶(例如,失活cas9(dcas9,例如d10a;h840a))的基因产生可以调节一个或多个靶核酸序列的活性和/或表达的嵌合蛋白。
[2434]
如本文所用,“效应子结构域的生物活性部分”是维持效应子结构域(例如,“最小”或“核心”结构域)的功能(例如,完全、部分或最小功能)的部分。在一些实施例中,指环体包括编码dcas9与一个或多个效应子结构域的全部或一部分的融合体的基因,以产生可用于
本文所述方法的嵌合蛋白。因此,在一些实施例中,指环体包括编码dcas9

甲基化酶融合体的基因。在其他一些实施例中,指环体包括编码dcas9酶与位点特异性grna的融合体的基因,以靶向内源基因。
[2435]
在其他方面,指环体包括编码1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、或更多个与dcas9融合的效应子结构域(全部或生物学活性部分)的基因。
[2436]
蛋白质外部
[2437]
在一些实施例中,指环体例如合成的指环体包含封闭遗传元件的蛋白质外部。蛋白质外部可以包含不能引起不想要的哺乳动物免疫应答的基本上非致病性的外部蛋白质。指环体的蛋白质外部通常包含可自组装成构成蛋白质外部的二十面体结构的基本上非致病的蛋白质。
[2438]
在一些实施例中,蛋白质外部蛋白由指环体的遗传元件的序列编码(例如,与遗传元件顺式)。在其他实施例中,蛋白质外部蛋白由与指环体的遗传元件分离的核酸编码(例如,与遗传元件反式)。
[2439]
在一些实施例中,蛋白质,例如基本上非致病性的蛋白质和/或蛋白质外部蛋白质,包含一个或多个糖基化氨基酸,例如2、3、4、5、6、7、8、9、10或更多个。
[2440]
在一些实施例中,蛋白质,例如基本上非致病性的蛋白质和/或蛋白质外部蛋白质,包含至少一个亲水性dna结合区、精氨酸富集区、苏氨酸富集区、谷氨酰胺富集区、n

末端聚精氨酸序列、可变区、c

末端聚谷氨酰胺/谷氨酸序列和一个或多个二硫键。
[2441]
在一些实施例中,蛋白质是衣壳蛋白,例如具有与由编码本文所述衣壳蛋白的任一核苷酸序列编码的蛋白(例如表1

18,a1

a12、b1

b5、c1

c5、d1

d10或20

37中的任一个中所列的指环病毒orf1序列或衣壳蛋白序列)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,蛋白质或衣壳蛋白的功能片段由核苷酸序列编码,所述核苷酸序列与本文所述的任一核苷酸序列具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性,例如表a1

a12、b1

b5、c1

c5、d1

d10或20

37中的任一个中所列的指环病毒衣壳序列或衣壳蛋白序列。在一些实施例中,蛋白包含衣壳蛋白或衣壳蛋白的功能片段,其由衣壳核苷酸序列或与本文所述的核苷酸序列中任一个具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%核苷酸序列同一性的序列编码,例如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15或17中的任一个中所列的指环病毒衣壳序列或衣壳蛋白序列。
[2442]
在一些实施例中,指环体包含编码以下的核苷酸序列:衣壳蛋白或衣壳蛋白的功能片段或与本文所述的氨基酸序列中任一个(例如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中的任一个中所列的指环病毒衣壳序列或衣壳蛋白序列)具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,指环体包含编码以下的核苷酸序列:衣壳蛋白或衣壳蛋白的功能片段或与本文所述的氨基酸序列中任一个(例如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中的任一个中所列的指环病毒衣壳序列或衣壳蛋白序列)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[2443]
在一些实施例中,指环体包含核苷酸序列,所述核苷酸序列编码具有本文所述的
氨基酸序列(指环病毒氨基酸序列,例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中的任一个中所列或如图1所示)或其功能片段的约1位至约150位(例如,或每个范围内的氨基酸的任何子集,例如约20位至约35位、约25位至约30位、约26位至约30)、约150位至约390位(例如,或每个范围内的氨基酸的任何子集,例如约200位至约380位、约205位至约375位、约205位至约371)、约390至约525位、约525位至约850位(例如,或每个范围内的氨基酸的任何子集,例如约530位至约840位、约545位至约830位、约550位至约820)、约850至约950位(例如,或每个范围内的氨基酸的任何子集,例如约860位至约940位、约870位至约930位、约880位至约923)的氨基酸序列。在一些实施例中,蛋白质包含氨基酸序列或其功能片段或与本文所述的氨基酸序列(指环病毒氨基酸序列,例如,如表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中的任一个中所列或如图1所示)的约1位至约150位(例如,或本文所述的每个范围内的氨基酸的任何子集)、约150位至约390位、约390位至约525位、约525位至约850位、约850位至约950位具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
[2444]
在一些实施例中,蛋白包含氨基酸序列或其功能片段或与本文所述的氨基酸序列或氨基酸范围中任一个(指环病毒氨基酸序列,例如,表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中任一个所列或如图1所示)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,具有较少序列同一性的氨基酸范围可以提供本文所述的一种或多种性质以及细胞/组织/物种特异性(例如嗜性)的差异。
[2445]
在一些实施例中,指环体在蛋白质外部缺少脂质。在一些实施例中,指环体缺少脂质双层,例如病毒包膜。在一些实施例中,指环体的内部被蛋白质外部完全覆盖(例如100%覆盖)。在一些实施例中,指环体内部被蛋白质外部覆盖少于100%,例如95%、90%、85%、80%、70%、60%、50%或更少的覆盖。在一些实施例中,蛋白质外部包括间隙或不连续,例如,使得可透过水、离子、肽或小分子,只要遗传元件保留在指环体中即可。
[2446]
在一些实施例中,蛋白质外部包含特异性识别和/或结合宿主细胞例如互补蛋白或多肽以介导遗传元件进入宿主细胞的一种或多种蛋白质或多肽。
[2447]
在一些实施例中,蛋白质外部包含以下一种或多种:一个或多个糖基化蛋白、亲水性dna结合区、精氨酸富集区、苏氨酸富集区、谷氨酰胺富集区、n末端聚精氨酸序列、可变区、c末端聚谷氨酰胺/谷氨酸序列、以及一个或多个二硫键。例如,蛋白质外部包含由本文所述的指环病毒orf1编码的蛋白质。
[2448]
在一些实施例中,蛋白质外部包括以下一种或多种特征:二十面体对称、识别和/或结合与一个或多个宿主细胞分子相互作用以介导进入宿主细胞的分子、缺乏脂质分子、缺乏碳水化合物、ph和温度稳定、耐洗涤剂、以及在宿主中基本上是非免疫原性的或是非致病性的。
[2449]
ii.载体
[2450]
本文所述的遗传元件可以包含在载体中。合适的载体及其制造和使用方法在现有技术中是众所周知的。
[2451]
一方面,本发明包括一种载体,所述载体包含遗传元件,所述遗传元件包含(i)编码非致病性外部蛋白质的序列,(ii)使所述遗传元件与所述非致病性外部蛋白质结合的外
部蛋白质结合序列,和(iii)编码调节性核酸的序列。
[2452]
遗传元件或遗传元件内的任何序列可以使用任何合适的方法获得。多种重组方法在本领域中是已知的,例如,使用标准技术,从具有病毒序列的细胞中筛选文库,从已知包含序列的载体中获得所述序列,或直接从包含序列的细胞和组织中分离所述序列。可替代地或组合地,遗传元件的部分或全部可以合成产生,而不是克隆。
[2453]
在一些实施例中,载体包括调节性元件,与靶基因同源的核酸序列,以及用于在活细胞内和/或当靶细胞内存在细胞内分子时引起报道分子表达的各种报道构建体。
[2454]
报告基因用于鉴定潜在转染的细胞和评估调节性序列的功能。通常,报告基因是如下基因,所述基因不存在于受体生物体或组织中或由其表达并且编码多肽,所述多肽的表达通过一些可易于检测的特性(例如,酶活性)表现出来。在将dna引入受体细胞后,在适当的时间测定报告基因的表达。合适的报告基因可包括编码萤光素酶、β

半乳糖苷酶、氯霉素乙酰转移酶、分泌的碱性磷酸酶、或绿色荧光蛋白基因的基因(例如,ui

tei等人,2000febs letters[欧洲生化学会联合会快报]479:79

82)。合适的表达系统是熟知的,可以使用已知技术制备或商业获得。通常,具有显示报告基因最高表达水平的最小5'侧翼区的构建体被鉴定为启动子。此类启动子区可以连接至报告基因,并且用于评估药剂调节启动子驱动的转录的能力。
[2455]
在一些实施例中,载体在宿主细胞中是基本上非致病性的和/或基本上非整合的,或者在宿主中是基本上非免疫原性的。
[2456]
在一些实施例中,载体的量足以调节表型、病毒水平、基因表达、与其他病毒竞争、疾病状态等中的一种或多种至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更高。
[2457]
iii.组合物
[2458]
本文所述的指环体或载体也可以包括在具有例如本文所述的药物赋形剂的药物组合物中。在一些实施例中,药物组合物包含至少105、106、107、108、109、10
10
、10
11
、10
12
、10
13
、10
14
或10
15
个指环体。在一些实施例中,药物组合物包含约105‑
10
15
、105‑
10
10
、或10
10

10
15
个指环体。在一些实施例中,药物组合物包含约108(例如约105、106、107、108、109、或10
10
)个基因组当量/ml的指环体。在一些实施例中,药物组合物包含105‑
10
10
、106‑
10
10
、107‑
10
10
、108‑
10
10
、109‑
10
10
、105‑
106、105‑
107、105‑
108、105‑
109、105‑
10
11
、105‑
10
12
、105‑
10
13
、105‑
10
14
、105‑
10
15
或10
10

10
15
个基因组当量/ml的指环体,例如,根据实例18的方法所测定。在一些实施例中,药物组合物包含足够的指环体以将指环体中包含的遗传元件的至少1、2、5或10、100、500、1000、2000、5000、8,000、1x104、1x105、1x106、1x107个或更大数量的拷贝/细胞递送到真核细胞群体中。在一些实施例中,药物组合物包含足够的指环体以将指环体中包含的遗传元件的至少约1x104、1x105、1x106、1x107、或约1x104‑
1x105、1x104‑
1x106、1x104‑
1x107、1x105‑
1x106、1x105‑
1x107、或1x106‑
1x107个拷贝/细胞递送到真核细胞群体中。
[2459]
在一些实施例中,药物组合物具有以下一种或多种特征:所述药物组合物满足药物或良好生产规范(gmp)标准;所述药物组合物是根据良好生产规范(gmp)制成的;所述药物组合物具有低于预定参考值的病原体水平,例如基本上不含病原体;所述药物组合物具有低于预定参考值的污染物水平,例如,基本上不含污染物;或所述药物组合物具有低免疫原性或基本上是非免疫原性的,例如,如本文所述。
[2460]
在一些实施例中,药物组合物包含低于阈值量的一种或多种污染物。在药物组合物中理想地不包括或最少包括的示例性污染物包括但不限于宿主细胞核酸(例如,宿主细胞dna和/或宿主细胞rna)、动物来源的组分(例如,血清白蛋白或胰蛋白酶)、具有复制能力的病毒、非感染性颗粒、游离病毒衣壳蛋白、外源因子和聚集体。在实施例中,污染物是宿主细胞dna。在实施例中,组合物包含少于约10ng的宿主细胞dna/剂量。在实施例中,组合物中宿主细胞dna的水平通过宿主细胞dna的过滤和/或酶促降解而降低。在实施例中,药物组合物由按重量计小于10%(例如小于约10%、5%、4%、3%、2%、1%、0.5%或0.1%)的污染物组成。
[2461]
一方面,本文所述的发明包括药物组合物,其包含:
[2462]
a)指环体,其包含遗传元件,所述遗传元件包含(i)编码非致病性外部蛋白质的序列,(ii)使所述遗传元件与所述非致病性外部蛋白质结合的外部蛋白质结合序列,和(iii)编码调节性核酸的序列;和与所述遗传元件相关联(例如包封或封闭所述遗传元件)的蛋白质外部;以及
[2463]
b)药物赋形剂。
[2464]
囊泡
[2465]
在一些实施例中,组合物进一步包含载剂组分,例如微粒、脂质体、囊泡或外来体。在一些实施例中,脂质体包含球形囊泡结构,所述球形囊泡结构由围绕内部水性隔室的单层或多层的脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。脂质体可以是阴离子的、中性的或阳离子的。脂质体通常具有生物相容性,无毒,可以递送亲水性和亲脂性药物分子,保护其货物免受血浆酶的降解,并将其负载运输穿过生物膜(关于综述,参见,例如,spuch和navarro,journal of drug delivery[药物递送杂志],第2011卷,文章id 469679,第12页,2011.doi:10.1155/2011/469679)。
[2466]
囊泡可由几种不同类型的脂质制成;然而,磷脂最常用于产生脂质体作为药物载剂。囊泡可包括但不限于dotma、dotap、dotim、ddab,单独使用或与胆固醇一起产生dotma和胆固醇、dotap和胆固醇、dotim和胆固醇以及ddab和胆固醇。制备多层囊泡脂质的方法是本领域已知的(参见例如美国专利号6,693,086,其关于多层囊泡脂质制备的教导通过引用并入本文)。尽管当脂质膜与水溶液混合时,囊泡的形成是自发的,但也可以通过使用均质器、超声仪或挤压装置以振荡的形式施加力来加快囊泡的形成(关于综述,参见例如,spuch和navarro,journal of drug delivery[药物递送杂志],第2011卷,文章id 469679,第12页,2011.doi:10.1155/2011/469679)。可通过挤出通过具有减小尺寸的过滤器来制备挤出的脂质,如templeton等人,nature biotech[自然生物技术],15:647

652,1997中所述,其关于挤出脂质制备的教导通过引用并入文中。
[2467]
如本文所述,可将添加剂添加至囊泡以改变其结构和/或性质。例如,可以将胆固醇或鞘磷脂加入混合物中,以帮助稳定结构并防止内部货物泄漏。此外,可以由氢化的卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇和磷酸二鲸蜡酯制备囊泡。(关于综述,参见,例如,spuch和navarro,journal of drug delivery[药物递送杂志],第2011卷,文章id 469679,第12页,2011.doi:10.1155/2011/469679)。同样,囊泡可以在合成期间或之后进行表面修饰以包括与受体细胞上的反应性基团互补的反应性基团。这样的反应性基团包括但不限于马来酰亚胺基团。例如,可以合成囊泡以包括马来酰亚胺缀合的磷脂,例如但不限于dspe

mal

peg2000。
[2468]
囊泡制剂可以主要由天然磷脂和脂质(例如1,2

二硬脂酰基

sn

甘油
‑3‑
磷脂酰胆碱(dspc)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷脂)构成。仅由磷脂组成的制剂在血浆中不太稳定。然而,用胆固醇操纵脂质膜降低了包封的货物的快速释放,或者1,2

二油酰基

sn

甘油
‑3‑
磷酸乙醇胺(dope)增加了稳定性(关于综述,参见,例如,spuch和navarro,journal of drug delivery[药物递送杂志],第2011卷,文章id 469679,第12页,2011.doi:10.1155/2011/469679)。
[2469]
在实施例中,脂质可用于形成脂质微粒。脂质包括但不限于dlin

kc2

dma4、c12

200和可使用自发囊泡形成程序配制的共脂质二硬脂酰磷脂酰胆碱、胆固醇和peg

dmg(参见例如novobrantseva,molecular therapy

nucleic acids[分子治疗

核酸](2012)1,e4;doi:10.1038/mtna.2011.3)。组分摩尔比可以为约50/10/38.5/1.5(dlin

kc2

dma或c12

200/二硬脂酰磷脂酰胆碱/胆固醇/peg

dmg)。tekmira在美国和国外拥有约95个专利同族组合,涉及脂质微粒和脂质微粒制剂的各个方面(参见,例如,美国专利7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;7,745,651;7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658以及欧洲专利号1766035;1519714;1781593和1664316),所有这些都可以用于和/或适用于本发明。
[2470]
在一些实施例中,微粒包含以随机方式排列的一种或多种固化聚合物。微粒可以是可生物降解的。可生物降解的微粒可以例如使用本领域已知的方法合成,包括但不限于溶剂蒸发、热熔微囊化、溶剂去除和喷雾干燥。bershteyn等人,soft matter[软物质]4:1787

1787,2008和us 2008/0014144a1中描述了用于合成微粒的示例性方法,其关于微粒合成的具体教导通过引用并入本文。
[2471]
可用于形成可生物降解的微粒的示例性合成聚合物包括但不限于脂肪族聚酯、聚(乳酸)(pla)、聚(乙醇酸)(pga)、乳酸和乙醇酸的共聚物(plga)、聚己内酯(pcl)、聚酐、聚(原)酸酯、聚氨酯、聚(丁酸)、聚(丙酸)和聚(丙交酯

己内酯)以及天然聚合物,例如白蛋白、藻酸盐和其他多糖,包括葡聚糖和纤维素、胶原蛋白、其化学衍生物,包括化学基团的取代、添加,例如烷基、亚烷基、羟基化、氧化和本领域技术人员常规进行的其他修饰)、白蛋白和其他亲水蛋白、玉米蛋白和其他醇溶蛋白和疏水性蛋白质、共聚物及其混合物。通常,这些材料通过酶水解或暴露于水、通过表面或整体腐蚀而降解。
[2472]
微粒的直径范围为0.1

1000微米(μm)。在一些实施例中,它们的直径的尺寸范围为1μm

750μm、或50μm

500μm、或100μm

250μm。在一些实施例中,它们的直径的尺寸范围为50μm

1000μm、50μm

750μm、50μm

500μm或50μm

250μm。在一些实施例中,它们的直径的尺寸范围是.05μm

1000μm、10μm

1000μm、100μm

1000μm或500μm

1000μm。在一些实施例中,它们的直径为约0.5μm、约10μm、约50μm、约100μm、约200μm、约300μm、约350μm、约400μm、约450μm、约500μm、约550μm、约600μm、约650μm、约700μm、约750μm、约800μm、约850μm、约900μm、约950μm或约1000μm。如微粒直径的上下文中所用,术语“约”是指所述绝对值的 /

5%。
[2473]
在一些实施例中,配体通过存在于颗粒表面上并存在于待连接的配体上的官能化学基团(羧酸、醛、胺、巯基和羟基)与微粒表面缀合。可以通过例如在微粒的乳液制备期间,并入具有官能化学基团的稳定剂来将官能度引入微粒中。
[2474]
将官能团引入微粒的另一个实例是在微粒制备后,通过用均双官能或异双官能交
联剂直接交联颗粒和配体。该程序可以使用合适的化学物质和一类交联剂(cdi、edac、戊二醛等,如下文更详细讨论)或通过制备后对颗粒表面进行化学修饰将配体偶联至颗粒表面的任何其他交联剂。这还包括这样的程序,通过所述程序可以将两亲性分子(例如脂肪酸、脂质或功能稳定剂)被动吸附并粘附到颗粒表面,从而引入官能性端基用以连接到配体上。
[2475]
在一些实施例中,可以合成微粒以在其外表面上包含一个或多个靶向基团以靶向特定的细胞或组织类型(例如,心肌细胞)。这些靶向基团包括但不限于受体、配体、抗体等。这些靶向基团将其配偶体结合在细胞表面上。在一些实施例中,微粒将整合到构成细胞表面的脂质双层中,并且将线粒体递送至细胞中。
[2476]
微粒还可在其最外表面上包含脂质双层。该双层可以由一个或多个相同或不同类型的脂质组成。实例包括但不限于磷脂,例如磷酸胆碱和磷酸肌醇。具体实例包括但不限于dmpc、dopc、dspc和各种其他脂质,例如本文针对脂质体所述的那些。
[2477]
在一些实施例中,载剂包含例如本文所述的纳米颗粒。
[2478]
在一些实施例中,本文所述的囊泡或微粒用诊断剂官能化。诊断剂的实例包括但不限于用于正电子发射断层扫描(pet)、计算机辅助断层扫描(cat)、单光子发射计算机断层扫描、x射线、荧光检查和磁共振成像(mri)的市售成像剂;和造影剂。在mri中用作造影剂的合适材料的实例包括钆螯合物,以及铁、镁、锰、铜和铬。
[2479]
载剂
[2480]
本文所述的组合物(例如,药物组合物)可包含载剂、与载剂一起配制和/或在载剂中递送。在一个方面,本发明包括组合物,例如药物组合物,其包含载剂(例如囊泡、脂质体、脂质纳米颗粒、外泌体、红细胞、外泌体(例如哺乳动物或植物外泌体)),融合体),所述载剂包含(例如,包封)本文所述的组合物(例如,指环体、指环病毒、指环载体或本文所述的遗传元件)。
[2481]
在一些实施例中,本文所述的组合物和系统可以配制在脂质体或其他类似的囊泡中。通常,脂质体是球形囊泡结构,所述球形囊泡结构由围绕内部水性隔室的单层或多层的脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。脂质体可以是阴离子的、中性的或阳离子的。脂质体通常具有以下特征中的一种或多种(例如,所有):生物相容性,无毒,可以递送亲水性和亲脂性药物分子,可以保护其货物免受血浆酶的降解,并可以将其负载运输穿过生物膜和血脑屏障(bbb)(参见,例如,spuch和navarro,journal of drug delivery[药物递送杂志],第2011卷,文章id 469679,第12页,2011.doi:10.1155/2011/469679;和zylberberg&matosevic.2016.drug delivery[药物递送],23:9,3319

3329,doi:10.1080/10717544.2016.1177136)。
[2482]
囊泡可由几种不同类型的脂质制成;然而,磷脂最常用于产生脂质体作为药物载剂。制备多层囊泡脂质的方法是已知的(参见例如美国专利号6,693,086,其关于多层囊泡脂质制备的教导通过引用并入文中)。尽管当脂质膜与水溶液混合时,囊泡的形成是自发的,但也可以通过使用均质器、超声仪或挤压装置以振荡的形式施加力来加快囊泡的形成(关于综述,参见,例如,spuch和navarro,journal of drug delivery[药物递送杂志],第2011卷,文章id 469679,第12页,2011.doi:10.1155/2011/469679)。如empleton等人,nature biotech[自然生物技术],15:647

652,1997中所述,挤出的脂质可以通过例如通过用于减小尺寸的过滤器挤出来制备。
[2483]
脂质纳米颗粒(lnp)是为本文所述的药物组合物提供生物相容性和可生物降解的递送系统的载剂的另一个实例。参见,例如,gordillo

galeano等人european journal of pharmaceutics and biopharmaceutics[欧洲药剂学和生物药剂学杂志].第133卷,2018年12月,第285

308页。纳米结构化的脂质载剂(nlc)是经修饰的固体脂质纳米颗粒(sln),其保留了sln的特性,提高了药物的稳定性和载药量,并防止了药物泄漏。聚合物纳米颗粒(pnp)是药物递送的重要组成部分。这些纳米颗粒可以有效地将药物递送引导至特定靶并改善药物稳定性和受控的药物释放。也可以使用脂质聚合物纳米颗粒(pln),其是一种组合了脂质体和聚合物的新型载剂。这些纳米颗粒具有pnp和脂质体的互补优势。pln由核

壳结构构成;聚合物核提供了稳定的结构,磷脂壳提供了良好的生物相容性。这样,这两种组分提高了药物包封有效率,促进了表面修饰,并防止了水溶性药物的泄漏。对于综述,参见例如li等人2017,nanomaterials[纳米材料]7,122;doi:10.3390/nano7060122。
[2484]
外来体也可用作本文所述的组合物和系统的药物递送媒剂。对于综述,参见ha等人2016年7月.acta pharmaceutica sinica b.[药学学报]第6卷,第4期,第287

296页;doi.org/10.1016/j.apsb.2016.02.001。
[2485]
离体分化的红细胞也可用作本文所述组合物的载剂。参见,例如,wo 2015073587;wo 2017123646;wo 2017123644;wo 2018102740;wo 2016183482;wo 2015153102;wo 2018151829;wo 2018009838;shi等人2014.proc natl acad sci usa.[美国国家科学院院刊]111(28):10131

10136;美国专利9,644,180;huang等人2017.nature communications[自然通讯]8:423;shi等人2014.proc natl acad sci usa.[美国国家科学院院刊]111(28):10131

10136。
[2486]
融合体组合物,例如,如wo 2018208728中所述,也可用作载剂以递送本文所述的组合物。
[2487]
膜穿透多肽
[2488]
在一些实施例中,组合物进一步包含膜穿透多肽(mpp),以将组分携带到细胞中或穿过膜例如细胞或核膜。能够促进物质跨膜运输的膜穿透多肽包括但不限于细胞穿透肽(cpp)(参见,例如,美国专利号:8,603,966)、用于植物细胞内递送的融合肽(参见,例如,ng等人,plos one,2016,11:e0154081)、蛋白质转导结构域、木马肽和膜移位信号(mts)(参见,例如,tung等人,advanced drug delivery reviews[先进药物递送论述]55:281

294(2003))。一些mpp富含氨基酸,例如精氨酸,带有带正电的侧链。
[2489]
膜穿透多肽具有诱导组分的膜穿透的能力,并且在全身性施用后可在体内在多个组织的细胞内进行大分子移位。膜穿透多肽还可以指在适当条件下与细胞接触时,从外部环境通过进入细胞内环境(包括细胞质,细胞器如线粒体或细胞核)中的肽,其量明显超过被动扩散所能达到的量。
[2490]
跨膜运输的组分可以可逆地或不可逆地连接至膜穿透多肽。接头可以是化学键,例如一个或多个共价键或非共价键。在一些实施例中,接头是肽接头。这样的接头可以在2

30个氨基酸之间,或更长。接头包括柔性、刚性或可切割的接头。
[2491]
组合
[2492]
在一方面,本文所述的指环体或包含指环体的组合物还可包含一个或多个异源部分。在一方面,本文所述的指环体或包含指环体的组合物还可在融合体中包含一个或多个
异源部分。在一些实施例中,异源部分可以与遗传元件连接。在一些实施例中,异源部分可以被封闭在蛋白质外部中作为指环体的一部分。在一些实施例中,异源部分可以与指环体一起施用。
[2493]
在一方面,本发明包括一种细胞或组织,其包含本文所述的指环体和异源部分中的任一种。
[2494]
在另一方面,本发明包括一种药物组合物,其包含本文所述的指环体和异源部分。
[2495]
在一些实施例中,异源部分可以是病毒(例如,效应子(例如,药物、小分子)、靶向剂(例如,dna靶向剂、抗体、受体配体)、标签(例如,荧光团、光敏剂例如killerred)或本文所述的编辑或靶向部分。在一些实施例中,本文所述的膜移位多肽与一个或多个异源部分连接。在一个实施例中,异源部分是小分子(例如,肽模拟物或分子量小于2000道尔顿的有机小分子)、肽或多肽(例如,抗体或其抗原结合片段)、纳米颗粒、适体或药剂。
[2496]
病毒
[2497]
在一些实施例中,组合物可进一步包含病毒作为异源部分,例如单链dna病毒,例如指环病毒、比那病毒(bidnavirus)、圆环病毒、双生病毒、基诺病毒(genomovirus)、丝状病毒、微小病毒、纳米病毒、细小病毒和斯派拉病毒(spiravirus)。在一些实施例中,组合物可进一步包含双链dna病毒,例如腺病毒、瓶状病毒、囊泡病毒、非洲猪瘟病毒、杆状病毒、福斯罗病毒(fusellovirus)、球状病毒、滴状病毒、腺炎病毒、疱疹病毒、虹彩病毒、脂毛病毒、尼马病毒(nimavirus)和痘病毒。在一些实施例中,组合物可以进一步包含rna病毒,例如甲病毒、真菌传杆状病毒、肝炎病毒、大麦病毒、烟草花叶病毒、烟草脆裂病毒、三角病毒(tricornavirus)、风疹病毒、双rna病毒、囊状病毒、分体病毒和呼肠病毒。在一些实施例中,将指环体与作为异源部分的病毒一起施用。
[2498]
在一些实施例中,异源部分可以包含非致病性病毒,例如,共生病毒、共栖的病毒、天然病毒。在一些实施例中,非致病性病毒是一种或多种指环病毒,例如,甲型细环病毒(tt)、乙型细环病毒(ttm)和丙型细环病毒(ttmd)。在一些实施例中,指环病毒可以包括细环病毒(tt)、sen病毒、前哨病毒、ttv样微小病毒、tt病毒、tt病毒基因型6、tt病毒群、ttv样病毒dxl1、ttv样病毒dxl2、细环样微小病毒(ttm)或细环样中型病毒(ttmd)。在一些实施例中,非致病性病毒包含一个或多个序列,所述序列与本文所述例如如表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15、17或41中的任一个中所列的核苷酸序列中任一个具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性。
[2499]
在一些实施例中,异源部分可包含一种或多种被鉴定为受试者缺乏的病毒。例如,可以向被鉴定为患有病毒缺乏症的受试者施用组合物,所述组合物包含指环体和在所述受试者中失衡或具有不同于参考值例如健康受试者的比率的一种或多种病毒组分或病毒。
[2500]
在一些实施例中,异源部分可以包含一种或多种非指环病毒,例如腺病毒、疱疹病毒、pox病毒、痘苗病毒、sv40、乳头瘤病毒、rna病毒(例如逆转录病毒、例如慢病毒)、单链rna病毒(例如肝炎病毒)或双链rna病毒(例如轮状病毒)。在一些实施例中,指环体或病毒是有缺陷的,或需要协助以产生感染性颗粒。可以例如通过使用辅助细胞系来提供这种协助,所述辅助细胞系包含在ltr内的调节性序列的控制下编码复制缺陷型指环体或病毒的(例如所有)结构基因中一个或多个的核酸,例如整合到基因组中的质粒或dna。用于复制本文所述的指环体的合适细胞系包括本领域已知的细胞系,例如a549细胞,其可以如本文所
述进行修饰。
[2501]
靶向部分
[2502]
在一些实施例中,本文所述的组合物或指环体可进一步包含靶向部分,例如与存在于靶细胞上的目的分子特异性结合的靶向部分。靶向部分可调节目的分子或细胞的特定功能,调节特定分子(例如酶、蛋白质或核酸),例如通路中目的分子下游的特定分子,或特异性结合靶标以定位指环体或遗传元件。例如,靶向部分可以包括与目的特定分子相互作用以增加,减少或以其他方式调节其功能的治疗剂。
[2503]
标记部分或监测部分
[2504]
在一些实施例中,本文所述的组合物或指环体可以进一步包含标签以标记或监测本文所述的指环体或遗传元件。标记部分或监测部分可以通过化学试剂或酶促裂解,例如蛋白水解或内含肽剪接而去除。亲和标签可用于使用亲和技术纯化标记的多肽。一些实例包括几丁质结合蛋白(cbp)、麦芽糖结合蛋白(mbp)、谷胱甘肽

s

转移酶(gst)和聚(his)标签。增溶标签可用于帮助在分子伴侣缺乏的物种(例如大肠杆菌)中表达的重组蛋白,以帮助蛋白质正确折叠并防止其沉淀。一些实例包括硫氧还蛋白(trx)和聚(nanp)。标记部分或监测部分可以包括光敏标签,例如荧光。荧光标签对于可视化是有用的。gfp及其变体是通常用作荧光标签的一些实例。蛋白质标签可允许发生特定的酶促修饰(例如通过生物素连接酶进行生物素化)或化学修饰(例如与flash

edt2反应进行荧光成像)。通常将标记部分或监测部分组合,以便将蛋白质连接到多个其他组分。标记部分或监测部分也可以通过特异性蛋白水解或酶促裂解(例如通过tev蛋白酶、凝血酶、因子xa或肠肽酶)去除。
[2505]
纳米颗粒
[2506]
在一些实施例中,本文所述的组合物或指环体可以进一步包含纳米颗粒。纳米颗粒包括无机材料,其尺寸在约1至约1000纳米之间、在约1至约500纳米之间、在约1至约100nm之间、在约50nm至约300nm之间、在约75nm至约200nm之间、在约100nm至约200nm之间、以及其间的任何范围。纳米颗粒通常具有纳米尺度的复合结构。在一些实施例中,纳米颗粒通常是球形的,尽管取决于纳米颗粒的组成,不同的形态是可能的。纳米颗粒与纳米颗粒外部的环境接触的部分通常被鉴定为纳米颗粒的表面。在本文所述的纳米颗粒中,尺寸限制可被限制为二维,从而纳米颗粒包括直径为约1至约1000nm的复合结构,其中特定直径取决于纳米颗粒的组成和根据实验设计的纳米颗粒的预期用途。例如,用于治疗应用的纳米颗粒通常具有约200nm或更小的尺寸。
[2507]
鉴于感兴趣的具体应用,纳米颗粒的其他期望的性质(例如表面电荷和空间稳定性)也可以变化。在davis等人,nature[自然]2008第7卷,第771

782页;duncan,nature[自然]2006第6卷,第688

701页;和allen,nature[自然]2002第2卷第750

763页中描述了在临床应用(例如癌症治疗)中可能需要的示例性特性,每个文章均通过引用整体并入本文。技术人员在阅读本发明后可以鉴定出其他性质。纳米颗粒的尺寸和性质可以通过本领域已知的技术来检测。检测颗粒尺寸的示例性技术包括但不限于动态光散射(dls)和各种显微技术,例如透射电子显微镜(tem)和原子力显微镜(afm)。检测颗粒形态的示例性技术包括但不限于tem和afm。检测纳米颗粒的表面电荷的示例性技术包括但不限于ζ电势方法。适用于检测其他化学性质的其他技术包括通过1h、
11
b、和
13
c和
19
f nmr、uv/vis和红外/拉曼光谱和荧光光谱(当纳米颗粒与荧光标记组合使用时)和技术人员可以鉴定的其他技术。
[2508]
小分子
[2509]
在一些实施例中,本文所述的组合物或指环体可以进一步包含小分子。小分子部分包括但不限于小肽、拟肽(例如类肽)、氨基酸、氨基酸类似物、合成多核苷酸、多核苷酸类似物、核苷酸、核苷酸类似物、通常具有小于约5,000克/摩尔的分子量的有机和无机化合物(包括杂有机和有机金属化合物),例如,具有小于约2,000克/摩尔的分子量的有机或无机化合物,例如,具有小于约1,000克/摩尔的分子量的有机或无机化合物,例如,具有小于约500克/摩尔的分子量的有机或无机化合物,以及此类化合物的盐、酯和其他医药可接受形式。小分子可以包括但不限于神经递质、激素、药物、毒素、病毒或微生物颗粒、合成分子以及激动剂或拮抗剂。
[2510]
合适的小分子的实例包括在以下中描述的那些:“the pharmacological basis of therapeutics[治疗学的药理基础],”goodman和gilman,mcgraw

hill,纽约州纽约,(1996),第九版,在以下章节:drugs acting at synaptic and neuroeffector junctional sites[药物作用于突触和神经效应连接点];drugs acting on the central nervous system[药物作用于中枢神经系统];autacoids:drug therapy of inflammation[自体活性物质:炎症的药物治疗];water,salts and ions[水,盐和离子];drugs affecting renal function and electrolyte metabolism[药物影响肾功能和电解质代谢];cardiovascular drugs[心血管药物];drugs affecting gastrointestinal function[药物影响胃肠功能];drugs affecting uterine motility[药物影响子宫动力];chemotherapy of parasitic infections[寄生虫感染的化学疗法];chemotherapy of microbial diseases[微生物疾病的化学疗法];chemotherapy of neoplastic diseases[肿瘤性疾病的化学疗法];drugs used for immunosuppression[药物用于免疫抑制];drugs acting on blood

forming organs[药物作用于造血器官];hormones and hormone antagonists;[激素和激素拮抗剂];vitamins,dermatology[维生素,皮肤病学];和toxicology[毒理学],均以引用方式并入本文。小分子的一些实例包括但不限于朊病毒药物,例如他克莫司、泛素连接酶或hect连接酶抑制剂例如heclin、组蛋白修饰药物例如丁酸钠、酶抑制剂例如5

氮杂胞苷、蒽环类药物例如阿霉素、β

内酰胺类例如青霉素、抗菌剂、化学治疗剂、抗病毒剂、来自其他生物体的调节剂例如vp64、以及生物利用度不足的药物、例如药代动力学不足的化学治疗药。
[2511]
在一些实施例中,小分子是一种表观遗传修饰剂,例如,如de groote等人nuc.acids res.[核酸研究](2012):1

18中所述的那些。示例性的小分子表观遗传修饰剂描述于例如lu等人j.biomolecular screening[生物分子筛选杂志]17.5(2012):555

71(例如表1或2)中,其通过引用并入本文。在一些实施例中,表观遗传修饰剂包括伏立诺他或罗米地辛。在一些实施例中,表观遗传修饰剂包含i、ii、iii和/或iv类组蛋白脱乙酰酶(hdac)的抑制剂。在一些实施例中,表观遗传修饰剂包含sirti的激活剂。在一些实施例中,表观遗传修饰剂包括山竹子素,lys

coa、c646、( )

jqi、i

bet、bici、ms120、dznep、unc0321、epz004777、az505、ami

i、吡唑酰胺7b、苯并[d]咪唑17b、酰化氨苯砜衍生物(例如prmti)、methylstat、4,4'

二羧基

2,2'

联吡啶、sid 85736331、异羟肟酸酯类似物8、tanylcypromie、双胍和双胍多胺类似物、unc669、维达扎、地西他滨、苯丁酸钠(sdb)、硫辛酸(la)、槲皮素、丙戊酸、肼苯哒嗪、新诺明、绿茶提取物(例如表没食子儿茶素没食子酸酯
(egcg))、姜黄素、萝卜硫素和/或大蒜素/二烯丙基二硫化物。在一些实施例中,表观遗传修饰剂抑制dna甲基化,例如dna甲基转移酶的抑制剂(例如5

氮杂胞苷和/或地西他滨)。在一些实施例中,表观遗传修饰剂修饰组蛋白修饰,例如组蛋白乙酰化、组蛋白甲基化、组蛋白类泛素化和/或组蛋白磷酸化。在一些实施例中,表观遗传修饰剂是组蛋白脱乙酰基酶的抑制剂(例如伏立诺他和/或曲古抑菌素a)。
[2512]
在一些实施例中,小分子是药物活性剂。在一个实施例中,小分子是代谢活性或组分的抑制剂。有用的药物活性剂类别包括但不限于抗生素、抗炎药、血管生成剂或血管活性剂、生长因子和化学治疗(抗肿瘤)剂(例如肿瘤抑制剂)。可以使用来自本文描述的类别和实例或来自(orme

johnson 2007,methods cell biol.[细胞生物学方法]2007;80:813

26)的分子的一种或组合。在一个实施例中,本发明包括一种组合物,其包含抗生素、抗炎药、血管生成剂或血管活性剂、生长因子或化学治疗剂。
[2513]
肽或蛋白质
[2514]
在一些实施例中,本文所述的组合物或指环体可以进一步包含肽或蛋白质。肽部分可包括但不限于肽配体或抗体片段(例如,结合受体如细胞外受体的抗体片段)、神经肽、激素肽、肽药物、毒性肽、病毒或微生物肽、合成肽、以及激动剂或拮抗剂肽。
[2515]
肽部分可以是直链或支链的。肽的长度为约5至约200个氨基酸、约15至约150个氨基酸、约20至约125个氨基酸、约25至约100个氨基酸或其间的任何范围。
[2516]
肽的一些实例包括但不限于荧光标签或标记、抗原、抗体、抗体片段例如单域抗体、配体和受体例如胰高血糖素样肽

1(glp

1)、glp

2受体2、胆囊收缩素b(cckb)和生长抑素受体、肽治疗剂例如与特定细胞表面受体例如g蛋白偶联受体(gpcr)或离子通道结合的那些、天然生物活性肽的合成或类似物肽、抗微生物肽、成孔肽、肿瘤靶向或细胞毒性肽、以及降解或自毁肽例如凋亡诱导肽信号或光敏肽。
[2517]
本文所述的可用于本发明的肽还包括小抗原结合肽,例如抗原结合抗体或抗体样片段,例如单链抗体、纳米抗体(参见,例如,steeland等人2016.nanobodies as therapeutics:big opportunities for small antibodies.[纳米抗体作为治疗剂:小抗体的巨大机会]drug discov today[今日药物发现]:21(7):1076

113)。这样的小抗原结合肽可以结合细胞质抗原、核抗原、细胞内抗原。
[2518]
在一些实施例中,本文所述的组合物或指环体包括与能够靶向特定位置、组织或细胞的配体连接的多肽。
[2519]
寡核苷酸适体
[2520]
在一些实施例中,本文所述的组合物或指环体可以进一步包含寡核苷酸适体。适体部分是寡核苷酸或肽适体。寡核苷酸适体是单链dna或rna(ssdna或ssrna)分子,其可以以高亲和力和特异性结合预先选择的靶标(包括蛋白质和肽)。
[2521]
寡核苷酸适体是可以通过重复多轮的体外选择或等效地selex(通过指数富集的配体系统进化)而工程化以结合到各种分子靶标(例如小分子、蛋白质、核酸甚至细胞、组织和生物体)的核酸种类。适体提供区分的分子识别,并且可以通过化学合成来产生。另外,适体可能具有理想的储存特性,并且在治疗应用中几乎没有引起免疫原性。
[2522]
dna和rna适体均可显示出对各种靶标的稳健结合亲和力。例如,已经选择了dna和rna适体用于溶菌酶、凝血酶、人免疫缺陷病毒反式反应响应元件(hiv tar)(参见
en.wikipedia.org/wiki/aptamer

cite_note

10)、氯化血红素、干扰素γ、血管内皮生长因子(vegf)、前列腺特异性抗原(psa)、多巴胺和非经典癌基因、热休克因子1(hsf1)。
[2523]
肽适体
[2524]
在一些实施例中,本文所述的组合物或指环体可以进一步包含肽适体。肽适体具有一个(或多个)短可变肽结构域,包括具有低分子量12kda

14kda的肽。肽适体可以被设计为特异性结合并干扰细胞内部的蛋白质

蛋白质相互作用。
[2525]
肽适体是经选择或经工程化以结合特定靶分子的人工蛋白质。这些蛋白质包括一个或多个可变序列的肽环。它们通常是从组合文库中分离出来的,并且常常随后通过定向突变或多轮的可变区诱变和选择而得到改进。在体内,肽适体可以结合细胞蛋白靶标并发挥生物学作用,包括干扰其靶向分子与其他蛋白的正常蛋白相互作用。特别地,针对附着于转录因子激活结构域的靶蛋白筛选附着于转录因子结合结构域的可变肽适体环。将肽适体通过该选择策略与其靶标的体内结合检测为下游酵母标记基因的表达。这样的实验鉴定了与适体结合的特定蛋白质,以及适体破坏的蛋白质相互作用以引起表型。另外,用适当的官能部分衍生的肽适体可引起其靶蛋白的特异性翻译后修饰,或改变靶标的亚细胞定位。
[2526]
肽适体还可以在体外识别靶标。已发现它们可代替生物传感器中的抗体,并用于从包含无活性和活性蛋白形式的群体中检测活性蛋白同工型。其中肽适体“头部”与独特的序列双链dna“尾部”共价连接的称为蝌蚪的衍生物可通过其dna尾部的pcr(例如,使用定量实时聚合酶链反应)定量混合物中的稀缺靶分子。
[2527]
可以使用不同的系统进行肽适体选择,但目前使用最多的是酵母双杂交系统。肽适体还可以选自通过噬菌体展示和其他表面展示技术(例如mrna展示、核糖体展示、细菌展示和酵母展示)构建的组合肽文库。这些实验程序也称为生物淘选。在从生物淘选获得的肽中,模拟表位可被认为是一种肽适体。从组合肽文库淘选的所有肽已存储在名为mimodb的特殊数据库中。
[2528]
iv.宿主
[2529]
本发明进一步涉及包含本文所述的指环体的宿主或宿主细胞。在一些实施例中,宿主或宿主细胞是植物、昆虫、细菌、真菌、脊椎动物、哺乳动物(例如人)或其他生物体或细胞。在某些实施例中,如本文所证实的,所提供的指环体感染一系列不同的宿主细胞。靶宿主细胞包括中胚层、内胚层或外胚层来源的细胞。靶宿主细胞包括例如上皮细胞、肌肉细胞、白细胞(例如淋巴细胞)、肾组织细胞、肺组织细胞。
[2530]
在一些实施例中,指环体在宿主中是基本上非免疫原性的。指环体或遗传元件无法通过宿主的免疫系统产生不希望的实质性反应。一些免疫应答包括但不限于体液免疫应答(例如,抗原特异性抗体的产生)和细胞介导的免疫应答(例如,淋巴细胞增殖)。
[2531]
在一些实施例中,宿主或宿主细胞与指环体接触(例如,感染)。在一些实施例中,宿主是哺乳动物,例如人。施用后任何时候都可以测量宿主体内的指环体的量。在某些实施例中,测定培养物中指环体生长的时程。
[2532]
在一些实施例中,指环体例如本文所述的指环体是可遗传的。在一些实施例中,指环体在流体和/或细胞中从母亲线性传输给孩子。在一些实施例中,来自原始宿主细胞的子细胞包含指环体。在一些实施例中,母亲以至少25%、50%、60%、70%、80%、85%、90%、95%或99%的效率将指环体传输给孩子或从宿主细胞到子细胞的传输效率为至少25%、
50%、60%、70%、80%、85%、90%、95%或99%。在一些实施例中,宿主细胞中的指环体在减数分裂期间具有至少25%、50%、60%、70%、80%、85%、90%、95%或99%的传输效率。在一些实施例中,宿主细胞中的指环体在有丝分裂期间具有至少25%、50%、60%、70%、80%、85%、90%、95%或99%的传输效率。在一些实施例中,细胞中的指环体具有约10%

20%、20%

30%、30%

40%、40%

50%、50%

60%、60%

70%、70%

75%、75%

80%、80%

85%、85%

90%、90%

95%、95%

99%或其间任何百分比的传输效率。
[2533]
在一些实施例中,指环体例如指环体在宿主细胞内复制。在一实施例中,指环体能够在哺乳动物细胞例如人细胞中复制。在其他实施例中,指环体复制缺陷或复制无能力。
[2534]
尽管在一些实施例中,指环体在宿主细胞中复制,但是指环体未整合到宿主的基因组中,例如未与宿主的染色体整合。在一些实施例中,指环体具有例如与宿主的染色体的可忽略的重组频率。在一些实施例中,指环体与例如宿主的染色体的重组频率例如小于约1.0cm/mb、0.9cm/mb、0.8cm/mb、0.7cm/mb、0.6cm/mb、0.5cm/mb、0.4cm/mb、0.3cm/mb、0.2cm/mb、0.1cm/mb或更低。
[2535]
v.使用方法
[2536]
本文所述的指环体和包含指环体的组合物可用于例如在需要其的受试者(例如哺乳动物受试者,例如人受试者)中治疗疾病、障碍或病症的方法中。本文描述的药物组合物的施用可以例如通过肠胃外(包括静脉内、肿瘤内、腹膜内、肌内、腔内和皮下)施用。指环体可以单独施用或配制成药物组合物。
[2537]
指环体可以以单位剂量组合物的形式,例如单位剂量肠胃外组合物的形式来施用。这样的组合物通常通过混合制备,并且可以适合于肠胃外施用。这样的组合物可以是例如可注射和可输注的溶液或悬浮液或栓剂或气雾剂的形式。
[2538]
在一些实施例中,例如本文所述的指环体或包含其的组合物的施用可导致将指环体所包含的遗传元件递送至例如受试者的靶细胞中。
[2539]
本文所述的指环体或其组合物,例如,包含效应子(例如,内源性或外源性效应子),可用于将效应子递送至细胞、组织或受试者。在一些实施例中,指环体或其组合物用于将效应子递送至骨髓、血液、心脏、gi或皮肤。通过施用本文所述的指环体组合物来递送效应子可以调节(例如,增加或减少)细胞、组织或受试者中非编码rna或多肽的表达水平。以这种方式调节表达水平可导致效应子被递送其中的细胞中功能活性的改变。在一些实施例中,调节的功能活性本质上可以是酶促的、结构的或调节的。
[2540]
在一些实施例中,指环体或其拷贝在递送至细胞中后24小时(例如1天、2天、3天、4天、5天、6天、1周、2周、3周、4周、30天或1个月)可在细胞中检测到。在实施例中,指环体或其组合物介导对靶细胞的作用,并且所述作用持续至少1、2、3、4、5、6或,7天、2、3或4周,或1、2、3、6或12个月。在一些实施例中(例如,其中指环体或其组合物包含编码外源蛋白质的遗传元件),所述作用持续少于1、2、3、4、5、6或7天,2、3或4周,或1、2、3、6或12个月。
[2541]
可以用本文所述的指环体或包含该指环体的组合物治疗的疾病、障碍和病症的实例包括但不限于:免疫障碍、干扰素病(例如i型干扰素病)、传染病、炎性障碍、自身免疫性病症、癌症(例如实体瘤,例如肺癌、非小细胞肺癌,例如,表达对mir

625有响应的基因(例如,胱天蛋白酶3)的肿瘤)和胃肠道障碍。在一些实施例中,指环体在与指环体接触的细胞中调节(例如增加或减少)活性或功能。在一些实施例中,指环体在与指环体接触的细胞中
调节(例如增加或减少)分子(例如核酸或蛋白质)的水平或活性。在一些实施例中,指环体将与指环体接触的细胞例如癌细胞的存活力降低例如至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更高。在一些实施例中,指环体包含效应子,例如mirna,例如mir

625,其将与指环体接触的细胞例如癌细胞的存活力降低例如至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更高。在一些实施例中,指环体例如通过增加胱天蛋白酶

3活性将与指环体接触的细胞例如癌细胞的细胞凋亡增加例如至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更高。在一些实施例中,指环体包含效应子,例如mirna,例如mir

625,其例如通过增加胱天蛋白酶

3活性将与指环体接触的细胞例如癌细胞的细胞凋亡增加例如至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更高。
[2542]
vi.生产方法
[2543]
产生遗传元件
[2544]
制备指环体的遗传元件的方法描述于以下中,例如,khudyakov&fields,artificial dna:methods and applications[人工dna:方法与应用],crc出版社(2002);zhao,synthetic biology:tools and applications[合成生物学:工具和应用],(第一版),学术出版社(academic press)(2013);和egli&herdewijn,chemistry and biology of artificial nucleic acids[人工核酸的化学与生物学],(第一版),wiley

vch(2012)。
[2545]
在一些实施例中,可以使用计算机辅助设计工具来设计遗传元件。可将指环体分为更容易合成的较小的重叠块(例如,在约100bp至约10kb片段的范围内或单独的orf)。这些dna片段由一组重叠的单链寡核苷酸合成。然后将所得的重叠合成子装配成较大的dna块,例如指环体。可以将片段或orf装配成指环体,例如,体外重组或在5

和3

末端的独特的限制性位点以实现连接。
[2546]
替代地,可以使用设计算法来合成遗传元件,所述设计算法将指环体解析为寡核苷酸长度的片段,考虑到序列空间的复杂性,为合成创造最佳的设计条件。然后在基于半导体的高密度芯片上化学合成寡核苷酸,每个芯片可合成超过200,000个单独的寡核苷酸。用诸如的装配技术装配寡核苷酸,以由较小的寡核苷酸构建更长的dna片段。这是通过并行方式完成的,因此一次可以构建成百上千个合成的dna片段。
[2547]
可以对每个遗传元件或遗传元件的片段进行序列验证。在一些实施例中,可以使用anydot.chips(genovoxx,德国)进行rna或dna的高通量测序,其允许监测生物学过程(例如,mirna表达或等位基因变异性(snp检测)。具体而言,anydot.chips使核苷酸荧光信号检测提高10x

50x。anydot.chips及其使用方法在以下中有部分地描述:国际公开申请号wo 02088382、wo 03020968、wo 0303 1947、wo 2005044836、pctep 05105657、pcmep 05105655;以及德国专利申请号de 101 49 786、de 102 14 395、de 103 56 837、de 10 2004 009 704、de 10 2004 025 696、de 10 2004 025 746、de 10 2004 025 694、de 10 2004 025 695、de 10 2004 025 744、de 10 2004025 745和de 10 2005 012 301。
[2548]
其他高通量测序系统包括在venter,j.,等人science[科学]2001年2月16日;adams,m.等人science[科学]2000年3月24日;和m.j,levene,等人science[科学]299:682

686,2003年1月;以及us公布申请号20030044781和2006/0078937中披露的那些。总体上,这样的系统包括通过经由在核酸分子上测量的聚合反应在时间上添加碱基来对具有多个碱
基的靶核酸分子进行测序,即实时跟踪核酸聚合酶对要测序的模板核酸分子的活性。然后可以通过在碱基添加顺序的每个步骤中通过核酸聚合酶的催化活性来鉴定哪个碱基被掺入到靶核酸的生长互补链中来推导该序列。在适合于沿着靶核酸分子移动并在活性位点延伸寡核苷酸引物的位置提供在靶核酸分子复合物上的聚合酶。在活性位点附近提供多个经标记的类型的核苷酸类似物,每个可区分类型的核苷酸类似物与靶核酸序列中的不同核苷酸互补。通过使用聚合酶以在活性位点向核酸链添加核苷酸类似物来延伸正在生长的核酸链,其中所添加的核苷酸类似物在活性位点与靶核酸的核苷酸互补。鉴定作为聚合步骤结果的添加至寡核苷酸引物的核苷酸类似物。重复提供经标记的核苷酸类似物,聚合生长的核酸链和鉴定添加的核苷酸类似物的步骤,从而使核酸链进一步延伸并鉴定靶核酸的序列。
[2549]
在一些实施例中,执行鸟枪测序。在鸟枪测序中,将dna随机分为许多小片段,使用链终止法对其进行测序以获得读数。通过执行几轮这种片段化和测序,可以获得靶dna的多个重叠读数。然后,计算机程序使用不同读数的重叠末端以将它们组装成连续序列。
[2550]
在一些实施例中,相对于遗传元件,可以以顺式或以反式提供用于复制或包装的因子。例如,当以顺式提供时,遗传元件可以包含一个或多个编码例如如本文所述的指环病毒orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3或orf2t/3的基因。在一些实施例中,复制和/或包装信号可以掺入遗传元件中,例如,以诱导扩增和/或包封。在一些实施例中,这在指环体基因组的较大区域的背景下进行(例如,将效应子插入基因组中的特定位点,或用效应子替换病毒orf)。
[2551]
在另一个实例中,当以反式提供时,遗传元件可能缺乏编码例如如本文所述的指环病毒orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3,或orf2t/3中的一个或多个的基因;该一种或多种蛋白质可以由例如另一核酸例如辅助核酸提供。在一些实施例中,遗传元件中存在最小的顺式信号(例如,5’utr和/或gc富集区)。在一些实施例中,遗传元件不编码复制或包装因子(例如,复制酶和/或衣壳蛋白)。在一些实施例中,此类因子可由一种或多种辅助核酸(例如,辅助病毒核酸、辅助质粒或整合到宿主细胞基因组中的辅助核酸)提供。在一些实施例中,辅助核酸表达足以诱导扩增和/或包装的蛋白质和/或rna,但可能缺乏它们自己的包装信号。在一些实施例中,将遗传元件和辅助核酸引入宿主细胞(例如,同时地或分开地),导致遗传元件而不是辅助核酸的扩增和/或包装。
[2552]
体外环化
[2553]
在某些情况下,要包装到蛋白质外部内的遗传元件是单链环状dna。在一些情况下,遗传元件可以以不同于单链环状dna的形式引入宿主细胞。例如,遗传元件可以作为双链环状dna引入宿主细胞。双链环状dna然后可以在宿主细胞中转化为单链环状dna(例如,包含用于滚环复制的合适酶的宿主细胞,例如指环病毒rep蛋白,例如,rep68/78、rep60、repa、repb、pre、mobm、trax、trwc、mob02281、mob02282、nikb、orf50240、nikk、tech、orfj或trai,例如,如wawrzyniak等人2017,front.microbiol.[微生物学前沿]8:2353所述;就列出的酶而言通过引用并入本文)。在一些实施例中,双链环状dna通过体外环化产生,例如,如实例35中所述。通常,体外环化的dna构建体可以通过消化包含待包装的遗传元件序列的质粒来产生,使得遗传元件序列被切除为线性dna分子。然后可以连接所得线性dna,例如,使用dna连接酶,以形成双链环状dna。在一些情况下,由体外环化产生的双链环状dna可以
进行滚环复制,例如,如本文所述。不希望受理论束缚,预期体外环化产生双链dna构建体,所述构建体无需进一步修饰即可进行滚环复制,从而能够产生合适大小的单链环状dna以包装进入指环体,例如,如本文所述。在一些实施例中,双链dna构建体小于质粒(例如,细菌质粒)。在一些实施例中,双链dna构建体从质粒(例如细菌质粒)中切除,然后例如通过体外环化进行环化。
[2554]
生产指环体
[2555]
可以多种方式使用如本文所述制备的遗传元件和包含遗传元件的载体,以在适当的宿主细胞中表达指环体。在一些实施例中,遗传元件和包含遗传元件的载体被转染到适当的宿主细胞中,并且所得的rna可以指导指环体基因产物例如非致病性蛋白质和蛋白质结合序列的高水平表达。提供高水平表达的宿主细胞系统包括提供病毒功能的连续细胞系,例如分别重叠感染apv或mpv的细胞系,经工程化以补充apv或mpv功能的细胞系等。
[2556]
在一些实施例中,如实例1、2、5、6或15

17中任一项所述地产生指环体。
[2557]
在一些实施例中,将指环体在体外在连续的动物细胞系中培养。根据本发明的一个实施例,细胞系可以包括猪细胞系。在本发明的上下文中设想的细胞系包括永生的猪细胞系,例如但不限于猪肾上皮细胞系pk

15和sk、单髓细胞系3d4/31和睾丸细胞系st。此外,还包括其他哺乳动物细胞系,如cho细胞(中国仓鼠卵巢)、marc

145、mdbk、rk

13、eel。另外地或替代地,本发明方法的特定实施例利用了动物细胞系,其是上皮细胞系,即上皮谱系细胞的细胞系。易受指环体感染的细胞系包括但不限于人或灵长类动物来源的细胞系,例如人或灵长类动物肾癌细胞系。
[2558]
在一些实施例中,遗传元件和包含遗传元件的载体被转染到表达病毒聚合酶蛋白的细胞系中,以实现指环体的表达。为此,可以将表达指环体聚合酶蛋白的转化细胞系用作合适的宿主细胞。宿主细胞可以类似地被工程化以提供其他病毒功能或额外功能。
[2559]
为了制备本文披露的指环体,可以使用本文披露的遗传元件或包含遗传元件的载体来转染细胞,所述细胞提供指环体蛋白以及复制和产生所需的功能。可替代地,可以在被本文披露的遗传元件或包含遗传元件的载体转染之前、期间或之后用辅助病毒来转染细胞。在一些实施例中,辅助病毒可用于补充不完整病毒颗粒的产生。辅助病毒可能具有条件性生长缺陷,例如宿主范围限制或温度敏感性,从而允许随后选择转染病毒。在一些实施例中,辅助病毒可以提供宿主细胞利用的一种或多种复制蛋白以实现指环体的表达。在一些实施例中,可以用编码病毒蛋白例如一种或多种复制蛋白的载体转染宿主细胞。在一些实施例中,辅助病毒包括抗病毒敏感性。
[2560]
可以通过本领域已知的多种技术将本文披露的遗传元件或包含遗传元件的载体复制和产生成指环体颗粒,例如,美国专利号4,650,764;美国专利号5,166,057;美国专利号5,854,037;欧洲专利公开ep 0702085 a1;美国专利申请系列号09/152,845;国际专利公开pct wo 97/12032;wo 96/34625;欧洲专利公开ep

a780475;wo 99/02657;wo 98/53078;wo 98/02530;wo 99/15672;wo 98/13501;wo 97/06270;和epo 780 47sa1中所述,其中每一个均通过引用整体并入本文。
[2561]
根据本发明的含指环体的细胞培养物的产生可以以不同的规模进行,例如在烧瓶、滚瓶或生物反应器中。用于培养要感染的细胞的培养基是技术人员已知的,并且可以通常包含细胞活力所需的标准营养物,但是还可以包含取决于细胞类型的其他营养物。任选
地,培养基可以不含蛋白质和/或不含血清。根据细胞类型,可以将细胞悬浮培养或在底物上培养。在一些实施例中,不同的培养基用于宿主细胞的生长和指环体的生产。
[2562]
可以根据病毒生产的技术人员已知的方法进行指环体的纯化和分离,例如rinaldi等人,dna vaccines:methods and protocols(methods in molecular biology)[dna疫苗:方法和方案(分子生物学方法)],第3版.2014,humana出版社所描述。
[2563]
在一方面,本发明包括一种本文所述的指环体的体外复制和繁殖的方法,所述方法可以包括以下步骤:(a)将线性化的遗传元件转染到对指环体感染敏感的细胞系中;(b)收获所述细胞并分离出显示所述遗传元件存在的细胞;(c)根据实验条件和基因表达,将在步骤(b)中获得的细胞培养至少三天,例如至少一周或更长时间;以及(d)收获步骤(c)的细胞。
[2564]
在一些实施例中,可以将指环体引入到生长至高细胞密度的宿主细胞系中。在一些实施例中,在用药物赋形剂配制之前,可以通过基于生物物理特性分离溶质,例如离子交换色谱或切向流过滤来收获和/或纯化指环体。
[2565]
vii.施用/递送
[2566]
可以将组合物(例如,包含本文所述的指环体的药物组合物)配制成包括药学上可接受的赋形剂。药物组合物可任选地包含一种或多种另外的活性物质,例如治疗和/或预防活性物质。本发明的药物组合物可以是无菌的和/或无热原的。可以在以下中找到药学制剂的配制和/或生产中的一般考虑:例如,remington:the science and practice of pharmacy 21st ed.[雷明顿:药学科学与实践第21版],lippincott williams&wilkins,2005(通过引用并入本文)。
[2567]
尽管本文提供的药物组合物的描述主要针对适合于施用给人的药物组合物,但是本领域技术人员应理解,此类组合物通常适合于施用给任何其他动物,例如非人动物,例如非人哺乳动物。为了使组合物适合于施用给各种动物而对适合于施用给人的药物组合物的修饰是众所周知的,并且普通兽医药理师可以仅通过普通的实验(如果有的话)来设计和/或进行这种修饰。预期施用药物组合物的受试者包括但不限于人和/或其他灵长类;哺乳动物,包括与商业有关的哺乳动物,例如牛、猪、马、绵羊、猫、狗、小鼠和/或大鼠;和/或鸟类,包括与商业相关的鸟类,例如家禽、鸡、鸭、鹅和/或火鸡。
[2568]
本文描述的药物组合物的制剂可以通过药理学领域中已知的或以后开发的任何方法来制备。通常,这样的制备方法包括以下步骤:使活性成分与赋形剂和/或一种或多种其他辅助成分结合,然后,如果必要和/或期望的话,将产品分开、成形和/或包装。
[2569]
在一方面,本发明的特征在于一种向受试者递送指环体的方法。所述方法包括向受试者施用包含本文所述的指环体的药物组合物。在一些实施例中,所施用的指环体在受试者中复制(例如,成为受试者的病毒组的一部分)。
[2570]
药物组合物可以包含野生型或天然病毒元件和/或修饰的病毒元件。指环体可以包括表a1

a12、b1

b5、c1

c5或1

18中任一个中的一个或多个序列(例如,核酸序列或编码其氨基酸序列的核酸序列)或与这些核苷酸序列中的任何一个具有至少约60%、65%、70%、75%、80%、85%、90%、95%,、96%、97%、98%和99%核苷酸序列同一性的序列或与表a1

a12、b1

b5、c1

c5或1

18中任一个中的序列互补的序列。指环体可包含核酸分子,所述核酸分子包含与表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15、17或41中的任一
个中的一个或多个序列具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%序列同一性的核酸序列。指环体可包含核酸分子,所述核酸分子编码与表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中的任一个中的氨基酸序列的任何一个具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%序列同一性的氨基酸序列。指环体可包含多肽,所述多肽包含与表a2、a4、a6、a8、a10、a12、c1

c5、2、4、6、8、10、12、14、16或18中的任一个中的氨基酸序列的任何一个具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%序列同一性的氨基酸序列。指环体可以包括表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15、17或41中的任一个中的一个或多个序列,或与表a1、a3、a5、a7、a9、a11、b1

b5、1、3、5、7、9、11、13、15、17或41中的任一个中的核苷酸序列的任一个或跟其互补的序列具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性的序列。
[2571]
在一些实施例中,指环体足以与参考例如健康对照相比,增加(刺激)内源基因和蛋白质表达例如至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。在某些实施例中,与参考例如健康对照相比,指环体足以降低(抑制)内源基因和蛋白质表达例如至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。
[2572]
在一些实施例中,与参考例如健康对照相比,指环体在宿主或宿主细胞中抑制/增强一种或多种病毒特性,例如嗜性、感染性、免疫抑制/激活例如至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。
[2573]
在一些实施例中,向受试者施用药物组合物,所述药物组合物进一步包含一种或多种在病毒遗传信息中未表示的病毒株系。
[2574]
在一些实施例中,以足以调节病毒感染的剂量和时间施用包含本文所述的指环体的药物组合物。病毒感染的一些非限制性实例包括腺相关病毒、爱知病毒、澳大利亚蝙蝠狂犬病病毒、bk多瘤病毒、班纳病毒、巴马森林病毒、布尼亚韦拉病毒、布尼亚病毒拉克罗斯、布尼亚病毒雪兔、鹿角皮膜疱疹疱疹病毒、钱迪普拉病毒、基孔肯雅病毒、科萨病毒(cosavirus)a、牛痘病毒、柯萨奇病毒、克里米亚

刚果出血热病毒、登革热病毒、多里病毒、杜拜病毒、杜温哈格病毒、东部马脑炎病毒、埃博拉病毒、回声病毒、脑心肌炎病毒、爱泼斯坦

巴尔病毒、欧洲蝙蝠狂犬病病毒、gb病毒c型/g型肝炎病毒、汉坦病毒、亨德拉病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、戊型肝炎病毒、丁型肝炎病毒、马痘病毒、人腺病毒、人星形病毒、人冠状病毒、人巨细胞病毒、人肠病毒68、人肠病毒70、人疱疹病毒1、人疱疹病毒2、人疱疹病毒6、人疱疹病毒7、人疱疹病毒8、人免疫缺陷病毒、人乳头瘤病毒1、人乳头瘤病毒2、人乳头瘤病毒16、人乳头瘤病毒18、人副流感、人细小病毒b19、人呼吸道合胞病毒、人鼻病毒、人sars冠状病毒、人膜细小病毒、人t淋巴病毒、人环状病毒、甲型流感病毒、乙型流感病毒、丙型流感病毒、伊斯法罕病毒、jc多瘤病毒、日本脑炎病毒、胡宁球菌病毒、ki多瘤病毒、昆津病毒、拉各斯蝙蝠病毒、维多利亚湖马尔堡病毒、兰加特病毒、拉萨病毒、洛兹代尔病毒、跳跃病病毒、淋巴细胞性脉络膜脑膜炎病毒、马库波病毒、马亚罗病毒、mers冠状病毒、麻疹病毒、芒果脑心肌炎病毒、默克尔细胞多瘤病毒、莫可拉病毒、软体动物接触性疱疹病毒、猴痘病毒、腮腺炎病毒、默里谷脑炎病毒、纽约病毒、尼帕病毒、诺沃克病毒、奥

奈氏病毒、口疮病毒、奥罗泼希病毒、皮钦德病毒、脊髓灰质炎病毒、庞塔托鲁静脉病毒、普马拉病毒、狂犬病病毒、裂谷热病毒、罗莎病毒a、罗斯河病毒、轮状病毒a、轮状病毒b、轮
状病毒c、风疹病毒、鹭山病毒、萨里病毒(salivirus)a、桑蝇热西西里病毒、札幌病毒、塞姆利基森林病毒、汉城病毒、猿猴泡沫病毒、猿猴病毒5、辛德比斯病毒、南安普敦病毒、圣路易斯脑炎病毒、蜱传波瓦桑病毒、细环病毒、托斯卡纳病毒、尤库尼米病毒、牛痘病毒、水痘带状疱疹病毒、天花病毒、委内瑞拉马脑炎病毒、水泡口腔炎病毒、西部马脑炎病毒、wu多瘤病毒、西尼罗河病毒、亚巴猴肿瘤病毒、亚巴样病病毒、黄热病病毒和寨卡病毒。在某些实施例中,相对于参考,指环体足以胜出和/或替换已经存在于受试者中的病毒例如至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更高。在某些实施例中,指环体足以与慢性或急性病毒感染竞争。在某些实施例中,可预防性地施用指环体以免遭病毒感染(例如预防病毒)。在一些实施例中,指环体的量足以调节(例如表型、病毒水平、基因表达、与其他病毒竞争、疾病状态等至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更高)。
[2575]
本文引用的所有参考和出版物均通过引用并入本文。
[2576]
提供以下实例以进一步说明本发明的一些实施例,但无意于限制本发明的范围;通过它们的示例性性质将理解,可以替换地使用本领域技术人员已知的其他程序、方法或技术。
[2577]
实例
[2578]
内容列表
[2579]
实例1:指环体的制备:抑制干扰素(ifn)表达的合成的指环体的设计和合成
[2580]
实例2:大规模产生指环体(指环体a和/或b):指环体的产生和繁殖
[2581]
实例3:指环体的体外作用(指环体a):细胞感染后指环体的表达和效应子功能例如mirna的表达的体外评估
[2582]
实例4:指环体的免疫学作用(指环体):施用后指环体的体内效应子功能,例如mirna的表达
[2583]
实例5:制备合成的指环体:合成的指环体的体外产生
[2584]
实例6:指环体的装配和感染:使用实例5中所述的合成dna序列在体外产生感染性指环体
[2585]
实例7:指环体的选择性:体外产生的合成的指环体感染多种组织来源的细胞系的能力
[2586]
实例8:蛋白质结合序列的鉴定和使用:指环病毒基因组中推定的蛋白质结合位点
[2587]
实例9:指环病毒基因组
[2588]
实例10:将各种长度的核苷酸插入指环病毒基因组中:将各种长度的dna序列添加到指环病毒基因组中
[2589]
实例11:要递送的示例性货物:指环体中核酸和蛋白质有效负载的示例性类别
[2590]
实例12:示例性有效负载整合位点
[2591]
实例13:定义的类别的指环病毒和其保守区
[2592]
实例14:复制缺陷型指环体和辅助病毒
[2593]
实例15:具有复制能力的指环体的制造方法
[2594]
实例16:复制缺陷型指环体的制造方法:复制缺陷型指环体的回收和扩大生产
[2595]
实例17:使用悬浮细胞生产指环体:在悬浮细胞中生产指环体。
[2596]
实例18:通过qpcr对指环体基因组当量进行定量:用以定量指环体的基于水解探针的定量pcr测定的开发
[2597]
实例19:利用指环体在小鼠中表达外源蛋白:使用指环体在体内表达功能性模型蛋白
[2598]
实例20:基因组比对,以测定指环体dna是否整合到宿主基因组中
[2599]
实例21:指环体整合到宿主基因组中的评估
[2600]
实例22:表达外源性微小rna序列的指环体的功能作用:使用指环体表达功能性核酸效应子
[2601]
实例23:表达外源性非编码rna的指环体的制备和产生:使用指环体表达外源性小非编码rna
[2602]
实例24:指环病毒进化分枝中的保守性:甲型细环病毒属中七个进化分枝的鉴定
[2603]
实例25:从指环体表达内源性mirna和内源性mirna的缺失
[2604]
实例26:指环病毒orf的定位
[2605]
实例27:指环体开发所需区域的表征
[2606]
实例28:外源蛋白质的指环体体内递送:本实例展示了指环体在施用后的体内效应子功能(例如蛋白质的表达)
[2607]
实例29:指环病毒中前体mirna(前mir)的鉴定:用以鉴定各种指环病毒编码的新颖前体mirna的计算和实验方法
[2608]
实例30:确定指环病毒前mir的内源性靶:分析以确定由各种指环病毒株编码的前mir的内源性靶和潜在的治疗相关靶途径
[2609]
实例31:制造编码天然指环病毒前mir的指环体:包装表达天然指环病毒前mir的指环体的复制或非复制形式的过程
[2610]
实例32:在体外细胞培养模型中利用指环病毒前mir作为肿瘤抑制因子:从例如如实例29中所述的分析中鉴定为肿瘤抑制性的候选前mir的表型作用
[2611]
实例33:利用指环病毒前mir作为体内肿瘤抑制因子:体内实验,以确认来自如实例32中所述的体外分析的肿瘤抑制性指环病毒前mir和癌细胞系的肿瘤抑制作用
[2612]
实例34:指环病毒基因组的串联拷贝
[2613]
实例35:体外环化的指环病毒基因组:包含环状双链环病毒基因组dna和最少非病毒dna的构建体
[2614]
实例36:orf1建模和保守残基和结构域的鉴定:乙型细环病毒orf1蛋白的建模和定义推定的结构域
[2615]
实例37:生产含有来自不同细环病毒株的具有高变结构域的嵌合orf1的指环体
[2616]
实例38:生产含有非ttv蛋白/肽代替高变结构域的嵌合orf1
[2617]
实例39:设计包含dna有效负载的指环体
[2618]
实例40:编码抗体转基因的指环体的转导
[2619]
实例41:基于tth8和ly2的指环体分别成功地将epo基因转导到肺癌细胞中
[2620]
实例42:静脉内(i.v.)施用后,可以在体内检测到带有治疗性转基因的指环体
[2621]
实例43:指环病毒中的编码序列大小分布
[2622]
实例44:用以表征orf2的高度保守基序
[2623]
实例45:人全长指环病毒orf1 mrna的证据
[2624]
实例46:体外环化的基因组作为体外生产指环体的输入材料
[2625]
实例47:指环病毒orf1中保守二级结构基序的鉴定
[2626]
实例1:指环体的制备
[2627]
该实例描述了抑制干扰素(ifn)表达的合成的指环体的设计和合成。
[2628]
设计了一种指环体(指环体a),其起始于1)编码非致病性包装外壳的衣壳基因的dna序列(arch virol(2007)152:1961

1975),登录号:a7xce8.1(orf11_ttw3);2)编码靶向宿主基因(例如ifn)的微小rna的dna序列(plos pathogen[公共科学图书馆—病原体](2013),9(12),e1003818),登录号:aj620231.1;和3)与衣壳蛋白中的特定区域(例如,具有登录号:q99153.1的衣壳特定区域)结合的dna序列(journal of virology[病毒学杂志](2003),77(24),13036

13041)。
[2629]
向该序列添加1kb非编码dna序列(指环体b)。将所设计的指环体(图2)化学合成为3kb(总大小),并进行序列验证。
[2630]
按照制造商的建议,用jetpei试剂(polyplus

transfection,法国伊尔基希(illkirch,france))将指环体序列转染到人胚肾293t细胞中(12孔平板上每105个细胞1mg)。对照转染仅包含载体或单独用jetpei转染的细胞,并用编码gfp的报告质粒优化了转染效率。测量对照转染的荧光以确保适当转染细胞。将转染培养物在37℃和5%二氧化碳中孵育过夜。
[2631]
18小时后,在加入新鲜培养基之前,将细胞用pbs洗涤3次。如下收集上清液,用于超速离心和收获指环体。通过以4,000x g离心30分钟然后以8,000x g离心15分钟以除去细胞和细胞碎片来清除培养基。然后将上清液通过0.45μm孔径的过滤器过滤。通过5%蔗糖垫(5ml)以27,000rpm将指环体沉淀1小时,然后将其重悬于1x磷酸盐缓冲盐水(pbs)和0.1%杆菌肽(以1/100原始体积)中。将浓缩的指环体以24,000rpm通过20%至35%蔗糖梯度离心2小时。收集梯度结处的指环体带。然后将指环体用1x pbs稀释并以27,000rpm沉淀1小时。将指环体沉淀重悬于1x pbs中,并通过20%至35%连续蔗糖梯度进一步纯化。
[2632]
实例2:大规模产生指环体(指环体a和/或b)
[2633]
此实例描述了指环体的生产和繁殖。
[2634]
制备实例1中所述的纯化的指环体,用于在具有悬浮生长的生产a549细胞的旋转瓶中大规模扩增。将a549细胞维持在f12k培养基、10%胎牛血清、2mm谷氨酰胺和抗生素中。在37℃和5%二氧化碳中孵育24小时后,以106个指环体的指环体负载用指环体感染a549细胞,从而产生约1x107个指环体颗粒。然后将细胞用pbs洗涤3次,并与新鲜培养基孵育6小时。
[2635]
对于指环体的纯化,如下进行基于氯化铯梯度的两个超速离心步骤,然后进行透析(bio

protocol[生物学方案](2012)bio101:e201)。离心(6000x g,10分钟)除去细胞,然后将上清液先通过0.8μm过滤器过滤,然后再通过0.2μm过滤器过滤。滤液通过滤膜(100,000mw)浓缩至8ml体积。将渗余物负载到硫酸铯溶液中,并以247,000x g离心20h。去除指环体带,放入14,000mw截止分子量的透析管中,并进行透析。如果需要,可以进行进一步的浓缩。
[2636]
实例3:指环体的体外作用(指环体a)
[2637]
该实例描述了细胞感染后指环体的表达和效应子功能例如mirna的表达的体外评估。
[2638]
通过内源基因调节(例如ifn信号传导)在体外评估实例1中所述的纯化的指环体的作用。将hek293t细胞用双萤光素酶质粒(具有基于干扰素刺激的响应元件(isre)的启动子的萤火虫萤光素酶和具有组成型启动子的转染对照海肾萤光素酶):萤光素酶报告混合物(pcdna3.1dsrluc与pisre

luc,1:4比率(clonetech))共转染(j virol[病毒学杂志](2008),82:9823

9828)。
[2639]
向接种在6孔板(2组一式三份的3个对照孔和3个使用指环体a的实验孔)中的hek293t细胞,以107次感染复数施用指环体。
[2640]
48小时后,用含或不含100u/ml通用i型干扰素(pbl,新泽西州皮斯卡塔韦(piscataway,nj))的新培养基替换培养基。ifn治疗后十六小时,进行了双萤光素酶测定(j virol[病毒学杂志](2008),82:9823

9828)以测定ifn信号传导。将萤火虫萤光素酶归一化为海肾萤光素酶表达,以控制转染差异。通过将相当的实验孔除以对照孔,计算出isre ffluc报告基因的诱导倍数,并相对于阴性对照比较每种条件的诱导。
[2641]
在一个实施例中,与对照相比,在指环体治疗组中萤光素酶信号降低将表明该指环体降低了细胞中ifn的产生。
[2642]
实例4:指环体的免疫学作用(指环体)
[2643]
该实例描述了施用后指环体的体内效应子功能,例如mirna的表达。
[2644]
使用的百倍稀释度,从10
14
个基因组当量/千克开始,降到0个基因组当量/千克,将按照实例1和2中所述制备的纯化的指环体以各种剂量静脉内施用给健康的猪。为了评估对免疫耐受性的影响,每天向猪注射以上指定剂量的指环体或媒介物对照pbs,持续3天,并在3天后处死。
[2645]
收获脾脏、骨髓和淋巴结。从每个组织制备单细胞悬浮液,并用mhc

ii、cd11c和细胞内ifn的细胞外标记物染色。通过流式细胞术分析来自每个组织的mhc 、cd11c 、ifn 抗原呈递细胞,例如,其中对于上述标记物中给定一种呈阳性的细胞是荧光表现高于在相同条件下缺少标记物表达但在其他方面与细胞分析群体相似的阴性对照群体中99%细胞的细胞。
[2646]
在一个实施例中,与对照相比,指环体治疗组中ifn 细胞数量的减少将表明指环体在施用后降低了细胞中ifn的产生。
[2647]
实例5:制备合成的指环体。
[2648]
该实例说明了合成的指环体的体外产生。
[2649]
将ecorv限制性酶切位点之间来自ttminiv的ly1和ly2株系的dna序列(eur respir j.[欧洲呼吸杂志]2013年8月;42(2):470

9)克隆到卡那霉素载体(集成dna技术公司(integrated dna technologies))中。在实例6和7以及图6a

10b中,将包括来自ttminiv的ly1和ly2株系的dna序列的指环体分别称为愈指环体1(指环(anello)1)和指环体2(指环2)。按照制造商的规程,将克隆的构建体转化到10

β感受态大肠杆菌中(新英格兰生物实验室公司(new england biolabs inc.)),然后纯化质粒(凯杰公司(qiagen))。
[2650]
根据制造商的规程,将dna构建物(图3和图4)在37℃下用ecorv限制性酶切消化(新英格兰生物实验室公司(new england biolabs inc.))线性化6小时,产生包含ttminiv
基因组的双链线性dna片段,但不包括细菌骨架元件(例如复制起点和可选择标记)。然后进行琼脂糖凝胶电泳,切除ttminiv基因组片段(2.9千碱基对)的正确大小的dna带,并根据制造商的方案使用凝胶提取试剂盒(凯杰公司(qiagen))从切除的琼脂糖带中凝胶纯化dna。
[2651]
实例6:指环体的装配和感染
[2652]
该实例说明了使用实例5中所述的合成dna序列成功地在体外产生感染性指环体。
[2653]
用脂质转染试剂(赛默飞世尔科技公司(thermo fisher scientific))以完整质粒或线性化形式将双链线性化的经凝胶纯化的指环病毒基因组dna(在实施例5中获得)转染到hek293t细胞(人胚胎肾细胞系)或a549细胞(人肺癌细胞系)中。将6ug质粒或1.5ug线性化的指环病毒基因组dna用于在t25烧瓶中转染70%汇合细胞。将缺少指环体中包含的病毒序列的空载体主链用作阴性对照。转染后6小时,将细胞用pbs洗涤两次,并使其在37℃和5%二氧化碳下在新鲜生长培养基中生长。从idt合成了编码人ef1α启动子后跟yfp基因的dna序列。将该dna序列平末端连接到克隆载体(赛默飞世尔科技公司(thermo fisher scientific))中。将所得的载体用作评估转染效率的对照。转染后72小时,使用细胞成像系统(赛默飞世尔科技公司(thermo fisher scientific))检测yfp。hek293t和a549细胞的转染效率分别计算为85%和40%(图5)。
[2654]
转染后96小时,收获用指环体转染的293t和a549细胞的上清液。将收获的上清液在4℃下以2000rpm离心10分钟,以去除任何细胞碎片。将每种收获的上清液分别用于感染新的293t和a549细胞,它们在24孔板的孔中70%汇合。在37℃和5%二氧化碳中孵育24小时后,将上清液洗掉,然后两次pbs洗涤,并用新鲜的生长培养基替换。将这些细胞在37度和5%二氧化碳中再孵育48小时后,分别收获细胞用于基因组dna提取。根据制造商的方案,使用基因组dna提取试剂盒(赛默飞世尔科技公司(thermo fisher scientific))收集每个样品的基因组dna。
[2655]
为了证实体外产生的指环体成功感染了293t和a549细胞,使用针对乙型细环病毒或ly2特异性序列具有特异性的引物,将100ng如本文所述收获的基因组dna用以进行定量聚合酶链反应(qpcr)。根据制造商的方案,使用sybr绿色试剂(赛默飞世尔科技公司(thermo fisher scientific))进行qpcr。使用针对gapdh的基因组dna序列具有特异性的引物的qpcr进行归一化。表42列出了所有使用的引物的序列。
[2656]
表42:
[2657][2658]
如图6a、6b、7a和7b所示的qpcr结果所示,体外产生且如本实例所述的指环体具有传染性。
[2659]
实例7:指环体的选择性
[2660]
该实例说明了体外产生的合成的指环体感染多种组织来源的细胞系的能力。
[2661]
将具有感染性ttminiv指环体(如实例5中所述)的上清液与70%汇合293t、a549、jurkat(急性t细胞白血病细胞系)、raji(伯基特氏淋巴瘤b细胞系)和chang细胞系在37度和5%二氧化碳下在24孔板的孔中一起孵育。感染后24小时,用pbs洗涤细胞两次,然后用新鲜的生长培养基替换。然后将细胞在37度和5%二氧化碳中再次孵育48小时,然后收获进行基因组dna提取。根据制造商的方案,使用基因组dna提取试剂盒(赛默飞世尔科技公司(thermo fisher scientific))收集每个样品的基因组dna。
[2662]
为了证实在先前实例中产生的指环体成功感染了这些细胞系,使用针对乙型细环病毒或ly2特异性序列具有特异性的引物,将100ng如本文所述收获的基因组dna用以进行定量聚合酶链反应(qpcr)。根据制造商的方案,使用sybr绿色试剂(赛默飞世尔科技公司(thermo fisher scientific))进行qpcr。使用针对gapdh的基因组dna序列具有特异性的引物的qpcr进行归一化。表42列出了所有使用的引物的序列。
[2663]
如图6a

10b所示的qpcr结果所示,在体外产生的指环体不仅具有传染性,而且它们也能够感染多种细胞系,包括上皮细胞、肺组织细胞、肝细胞、癌细胞、淋巴细胞、淋巴母细胞、t细胞、b细胞和肾细胞的实例。还观察到合成的指环体能够感染hepg2细胞(肝细胞系),相对于对照增加超过100倍。
[2664]
实例8:蛋白质结合序列的鉴定和使用
[2665]
该实例描述了指环病毒基因组中推定的蛋白质结合位点,其可用于例如在本文所述的指环体中扩增和包装效应子。在一些情况下,蛋白质结合位点可能能够结合外部蛋白质,例如衣壳蛋白。
[2666]
指环病毒基因组中的两个保守结构域是假定的复制起点:5'utr保守结构域(5cd)和gc富集结构域(gcr)(de villiers等人,journal of virology[病毒学杂志]2011;okamoto等人,virology[病毒学]1999)。在一个实例中,为了证实这些序列是作为dna复制位点还是作为衣壳包装信号,在包括ttmv

ly2的质粒中对每个区域进行缺失。用pttmv

ly2δ5cd或pttmv

ly2δgcr转染a539细胞。将转染的细胞孵育四天,然后从上清液和细胞沉淀中分离出病毒。用病毒感染a549细胞,四天后,从上清液和感染的细胞沉淀中分离出病毒。进行qpcr以定量来自样品的病毒基因组。复制起点的破坏阻止了病毒复制酶扩增病毒dna,与野生型病毒相比,导致从转染的细胞沉淀中分离出的病毒基因组减少。仍包装了少量病毒,并且可以在转染的上清液和感染的细胞沉淀中找到。在一些实施例中,包装信号的破坏将防止病毒dna被衣壳蛋白包封。因此,在实施例中,在转染的细胞中仍然存在病毒基因组的扩增,但是在上清液或感染的细胞沉淀中未发现病毒基因组。
[2667]
在另一个实例中,为了表征dna中的额外复制或包装信号,使用了整个ttmv

ly2基因组上的一系列缺失。在序列的长度上逐步缺失100bp。将包括ttmv

ly2缺失的质粒转染到a549中并如上所述进行测试。在一些实施例中,破坏病毒扩增或包装的缺失将包含潜在的顺式调节结构域。
[2668]
可以将复制和包装信号掺入编码效应子的dna序列中(例如在指环体的遗传元件中)以诱导扩增和包封。这是在指环体基因组的较大区域的背景下完成的(即将效应子插入基因组的特定位点,或用效应子代替病毒orf等),或者通过将最小的顺式信号掺入效应子
dna中来完成。在指环体缺乏反式复制或包装因子(例如,复制酶和衣壳蛋白等)的情况下,反式因子由辅助基因提供。辅助基因表达足以诱导扩增和包装的所有蛋白质和rna,但缺乏其自身的包装信号。指环体dna与辅助基因共转染,导致效应子而非辅助基因的扩增和包装。
[2669]
实例9:指环病毒基因组
[2670]
该实例描述了指环病毒基因组中的缺失。
[2671]
在orf下游但gc富集区上游的ttv

tth8的非编码区(ncr)中缺失了172个核苷酸(nt)(nt 3436至3607)。将56

nt随机序列tttgtgacacaagatggccgacttccttcctctttagtcttccccaaagaagacaa(seq id no:696))插入缺失中。产生了pttv

tth8(3436

3707::56nt),一个含有改变的ttv

tth8的dna质粒。使用lipofectamine 2000将2μg双链环状质粒或双链smai线性化dna(产生与细菌骨架元件分离的ttv

tth8基因组片段)以转染到6cm盘中60%汇合度的hek293或a549细胞中,一式两份。转染后96小时,通过冻融从细胞沉淀和上清液中分离出病毒,在液氮与37℃水浴之间交替进行三次。将来自上清液的病毒用于再感染细胞(hek293细胞被从hek293分离出的病毒感染,并且a549细胞被从a549分离出的病毒感染)。感染后72小时,通过冻融从细胞沉淀和上清液中分离出病毒。对所有样品进行qpcr。如下表43所示,在感染的细胞的细胞沉淀和上清液中均观察到ttv

tth8,表明pttv

tth8(3436

3707::56nt)成功产生了病毒。因此,ttv

tth8能够耐受nt 3436至3707的缺失。
[2672]
表43:hek293和a549中的ttv

tth8(3436

3707::56nt)感染导致病毒扩增。与不添加质粒或病毒的阴性对照细胞相比,重复实验得到的平均基因组当量。
[2673][2674]
装配了ttmv

ly2的工程化版本,缺失了核苷酸574至1371和1432至2210(1577bp缺失),并在orf1的c末端(野生型ttmv

ly2的nt 2609之后)插入了513bp nanoluc(nluc)报告基因orf。如实例17所述,将包括用于工程化ttmv

ly2的dna序列的质粒(pvl46

015b)转染到a549细胞中,然后分离病毒并用于感染新的a549细胞。在感染的细胞的细胞沉淀和上清液中检测到nluc发光,表明病毒复制(图11a

11b)。这说明ttmv

ly2可以耐受orf区域中缺失至少1577bp。
[2675]
为了进一步表征病毒基因组,在ttmv

ly2 dna中进行了一系列缺失。如前所述,制备了具有nt 574

1371和1432

2210缺失但没有nluc插入的ttmv

ly2,并测试其病毒复制。对ttmv

ly2δ574

1371,δ1432

2210进行了进一步缺失。缺失nt 1372

1431,以产生ttmv

ly2δ574

2210。此外,将orf1下游的orf3序列缺失(δ2610

2809)。最后,为了测试非编码区的缺失,在整个ncr上依次进行了一系列100bp的缺失。如前所述,测试所有缺失突变体的病毒复制。将导致成功病毒产生的缺失(表明缺失的区域对于病毒复制不是必不可少的)组合在一起,以制成具有更多缺失核苷酸的ttmv

ly2变体。为了鉴定可以用辅助基因扩增的
病毒基因组,将破坏病毒复制的每个缺失突变体与携带反式复制和包装元件的辅助基因一起进行测试。通过复制元件的反式表达挽救的缺失表明当从单独的来源提供辅助基因时可以在不阻止病毒形成的情况下缺失的病毒基因组区域。
[2676]
实例10:将各种长度的核苷酸插入指环病毒基因组中
[2677]
该实例描述了将各种长度的dna序列添加到指环病毒基因组中,其在某些情况下可用于产生本文所述的指环体。
[2678]
将dna序列克隆到含有ttv

tth8(genbank登录号aj620231.1)和ttmv

ly2(genbank登录号jx134045.1)的质粒中。在开放阅读框的非编码区(ncr)3'和gc富集区的5'中进行插入:在ttv

tth8的核苷酸3588或ttmv

ly2的核苷酸2843之后。
[2679]
将以下长度的随机dna序列插入ttv

tth8和ttmv

ly2的ncr中:100个碱基对(bp)、200bp、500bp、1000bp和2000bp。设计这些序列以匹配每个病毒基因组的相对gc含量:约50%gc用于插入ttv

tth8,而约38%gc用于ttmv

ly2。另外,将几个转基因插入到ncr中。这些包括由u6启动子(351bp)驱动的mirna(例如ff4 mirna)和由组成型hef1a启动子(2509bp)驱动的egfp。
[2680]
如前所述,将包括各种大小的dna插入物的ttv

tth8和ttmv

ly2变体转染到哺乳动物细胞系中,包括hek293和a549。从上清液或细胞沉淀中分离出病毒。将分离的病毒用于感染其他细胞。通过定量pcr监测从感染细胞产生病毒。在一些实施例中,病毒的成功产生将指示插入的耐受性。实例11:要递送的示例性货物
[2681]
该实例描述了可以与例如本文所述的指环体例如基于指环病毒的指环体一起递送的示例性类别的核酸和蛋白质有效负载。
[2682]
有效负载的一个实例是用于蛋白质表达的mrna。目的编码序列是从源病毒(例如指环病毒)天然的病毒启动子转录的,或者是从与有效负载一起作为转基因一部分而引入的启动子转录的。可替代地,在病毒mrna的开放阅读框内编码mrna,导致病毒蛋白与目的蛋白之间的融合。当需要时,切割结构域例如2a肽或蛋白酶靶位点可用于将目的蛋白与病毒蛋白分离。
[2683]
非编码rna(ncrna)是有效负载的另一个实例。通常使用rna聚合酶iii启动子(例如u6或va)转录这些rna。可替代地,使用rna聚合酶ii(例如天然病毒启动子或可调节的合成启动子)转录ncrna。当从rna聚合酶ii启动子表达时,ncrna被编码为mrna外显子、内含子或在聚a信号下游转录的额外rna的一部分。ncrna通常被编码为较大rna分子的一部分,或者使用核酶或核糖内切核酸酶切割。可在指环体基因组中编码为货物的ncrna包括微小rna(mirna)、小干扰rna(sirna)、短发夹rna(shrna)、反义rna、mirna海绵、长非编码rna(lncrna)和指导rna(grna)。
[2684]
dna可以用作功能元件,而无需rna转录。例如,dna可用作同源重组的模板。在另一个实例中,可以使用蛋白质结合dna序列来驱动目的蛋白质包装到衣壳中(例如指环体的蛋白质外部)。为了同源重组,将与人基因组dna同源的区域编码到载体dna中以充当同源臂。重组可以由靶向内切核酸酶(例如具有grna的cas9,或锌指核酸酶)驱动,所述靶向内切核酸酶可以从载体或从单独的来源表达。在细胞内部,单链dna基因组被转换为双链dna,然后作为基因组dna断裂位点的同源重组的模板。为了募集目的蛋白质,可以将蛋白质结合序列编码到指环体dna中。目的dna结合蛋白或与dna结合蛋白(例如gal4)融合的目的蛋白与指
环体dna结合。当指环体dna被衣壳蛋白包封时,dna结合蛋白也被包封,并且可以与指环体一起递送到细胞中。
[2685]
实例12:示例性有效负载整合位点
[2686]
该实例描述了核酸有效负载可插入其中的ttv

tth8(genbank登录号aj620231.1)和ttmv

ly2(genbank登录号jx134045)的基因组中的示例性位点。
[2687]
可以采用几种策略以插入ttv

tth8(核苷酸336至3015)和ttmv

ly2(核苷酸424至2812)的开放阅读框(orf)区。在一个实例中,为了标记病毒蛋白或产生融合蛋白,将有效负载按读框插入目的特定orf内。替代地,缺失部分或全部orf区,这可能会或可能不会破坏病毒蛋白功能。然后将有效负载插入缺失区域。另外,ttv

tth8(核苷酸716和2362之间)或ttmv

ly2(核苷酸724和2273之间)的orf1中的高变结构域(hvd)可以用作插入位点。在一些情况下,hvd中的插入或核苷酸替换可能会被更好地耐受和/或在较小程度上破坏病毒功能。
[2688]
替代地,将有效负载插入与ttv

tth8或ttmv

ly2的非编码区(ncr)相当的载体区中。特别是,在tata盒上游的5'ncr、5'非翻译区(utr)、聚a信号下游和gc富集区上游的3'ncr中进行插入。另外,在ttv

tth8的mirna区(核苷酸3429至3506)中插入。对于5'ncr区,在tata盒上游进行插入(在ttv

tth8中的核苷酸1和82之间,在ttmv

ly2中的核苷酸1和236之间)。在一些实施例中,以相反方向插入转基因以减少启动子干扰。对于5'utr,在转录起始位点的下游(ttv

tth8中的核苷酸111,ttmv

ly2中的核苷酸267)和orf2起始密码子的上游(ttv

tth8中的核苷酸336,ttmv

ly2中的核苷酸421)进行插入。5'utr插入会在5'utr中添加或替换核苷酸。如实例10中所述,在gc富集区上游进行3'ncr插入,特别是在ttv

tth8中的核苷酸3588或ttmv

ly2中的核苷酸2843之后。将ttv

tth8的mirna替换为可替代的天然或合成mirna发夹。
[2689]
实例13:定义的类别的指环病毒和其保守区
[2690]
人中存在三种指环病毒属:甲型细环病毒(细环病毒,ttv)、乙型细环病毒(细环中型病毒,ttmdv)和丙型细环病毒(细环小型病毒,ttmv)。甲型细环病毒包括至少五个(例如七个)得到充分支持的系统发育进化分枝(图11c)。可以预期的是,这些指环病毒中的任一种都可以用作来源病毒(例如,病毒dna序列的来源),用于产生本文所述的指环体。
[2691]
在这些序列中,在5'utr结构域(约75%保守性)和gc富集结构域(大于100个碱基对,gc含量大于70%,约70%保守性)中发现了最高保守性。另外,序列中的高变结构域(hvd)具有非常低的保守性(约30%保守性)。所有指环病毒也都包含其中所有三个阅读框均开放的区域。在一些情况下,5'utr或gc富集区可能充当复制起点。
[2692]
本文还提供了来自ttv进化分枝以及ttmdv和ttmv中每一个的代表性病毒的示例性序列,其用保守区注释(参见例如表a1

a12、b1

b5、c1

c5或1

18)。
[2693]
实例14:复制缺陷型指环体和辅助病毒
[2694]
为了复制和包装指环体,可以反式提供一些元件。这些包括指导或支持dna复制或包装的蛋白质或非编码rna。在某些情况下,反式元件可以从替代指环体的来源中获得,例如辅助病毒、质粒或从细胞基因组中获得。
[2695]
通常以顺式提供其他元件。这些元件可以是例如指环体dna中的序列或结构,其充当复制起点(例如,允许指环体dna的扩增)或包装信号(例如,结合蛋白以将基因组负载到
衣壳中)。通常,复制缺陷型病毒或指环体将丢失这些元件中的一个或多个,使得即使反式提供其他元件,dna也不能包装成传染性病毒粒子或指环体。
[2696]
复制缺陷型病毒可用作辅助病毒,例如,用于控制指环体(例如复制缺陷型或包装缺陷型指环体)在同一细胞中的复制。在某些情况下,辅助病毒将缺少顺式复制或包装元件,但会表达反式元件,例如蛋白质和非编码rna。通常,治疗性指环体将缺少这些反式元件中的一些或所有,因此将无法单独复制,但会保留顺式元件。当共转染/感染到细胞中时,复制缺陷型辅助病毒将驱动指环体的扩增和包装。因此,收集的包装颗粒将仅由治疗性指环体组成,而不会感染辅助病毒。
[2697]
为了开发复制缺陷型指环体,将去除指环病毒的非编码区域中的保守元件。特别是,将分别或一起测试保守的5'utr结构域和gc富集结构域的缺失。两种元件被认为对于病毒复制或包装是重要的。此外,将在整个非编码区中进行一系列缺失,以鉴定以前未知的目的区。
[2698]
复制元件的成功缺失将导致细胞内的指环体dna扩增减少,例如,通过qpcr所测量,但将支持某些传染性指环体产生,例如,通过对受感染的细胞的测定所监测,所述测定可包括qpcr、蛋白质印迹、荧光测定或发光测定中任一种或全部。包装元件的成功缺失不会破坏指环体dna扩增,因此通过qpcr在转染的细胞中可观察到指环体dna的增加。但是,指环体基因组不会被包封,因此不会观察到传染性指环体产生。
[2699]
实例15:具有复制能力的指环体的制造方法
[2700]
此实例描述了一种用于回收和扩大具有复制能力的指环体的产生的方法。当它们在基因组中编码在细胞中复制所需的所有必需遗传元件和orf时,指环体具有复制能力。由于这些指环体的复制没有缺陷,因此它们不需要反式提供的互补活性。但是,它们可能需要辅助活性,例如转录增强子(例如丁酸钠)或病毒转录因子(例如腺病毒e1、e2、e4、va;hsv vp16和立即早期蛋白)。
[2701]
在该实例中,将编码线性或环状形式的合成的指环体的全序列的双链dna通过化学转染引入t75烧瓶中的5e 05粘附哺乳动物细胞中,或通过电穿孔引入5e 05悬浮细胞中。在最佳时间段后(例如,转染后3

7天),通过将细胞刮入上清液培养基中来收集细胞和上清液。加入温和洗涤剂(如胆盐)至最终浓度为0.5%,并在37℃下孵育30分钟。加入氯化钙和氯化镁至最终浓度分别为0.5mm和2.5mm。加入内切核酸酶(例如dnase i,benzonase),并在25℃

37℃下孵育0.5

4小时。将指环体悬浮液在4℃下以1000x g离心10分钟。将澄清的上清液转移至新试管中,并用冷冻保护剂缓冲液(也称为稳定化缓冲液)以1:1稀释,并根据需要在

80℃下保存。这将产生第0代的指环体(p0)。为了使洗涤剂的浓度低于用于培养细胞的安全极限,根据指环体效价,将这种接种物在无血清培养基(sfm)中稀释至少100倍或更多倍。
[2702]
将t225烧瓶中新鲜的哺乳动物细胞单层用足以覆盖培养物表面的最小体积覆盖,并在37℃和5%二氧化碳下以温和摇动孵育90分钟。用于该步骤的哺乳动物细胞可以与用于p0回收的细胞类型相同或不同。孵育后,将接种物替换为40ml无血清、无动物源的培养基。将细胞在37℃和5%二氧化碳下孵育3

7天。加入4ml先前使用的相同温和洗涤剂的10x溶液,以使最终洗涤剂浓度达到0.5%,然后将混合物在37℃下以温和搅拌孵育30分钟。加入内切核酸酶并在25℃

37℃下孵育0.5

4小时。然后收集培养基,并在4℃下以1000x g离
心10分钟。将澄清的上清液与40ml稳定缓冲液混合,并在

80℃下保存。这将产生种子储备物或第一代的指环体(p1)。
[2703]
根据储备物的效价,将其在sfm中稀释不少于100倍,并添加到在所需大小的多层烧瓶中生长的细胞中。感染复数(moi)和孵育时间已在较小的规模上进行了优化,以确保最大的指环体生产。收获后,可根据需要纯化和浓缩指环体。图12中提供了显示工作流程的示意图,例如,本实例中所述。
[2704]
实例16:复制缺陷型指环体的制造方法
[2705]
此实例描述了一种用于回收和扩大复制缺陷型指环体的产生的方法。
[2706]
通过缺失复制中涉及的一个或多个orf(例如,orf1、orf1/1、orf1/2、orf2、orf2/2、orf2/3和/或orf2t/3),可以使指环体成为复制缺陷型。复制缺陷型指环体可以在互补细胞系中生长。这种细胞系组成型表达促进指环体生长但在指环体的基因组中丢失或无功能的组分。
[2707]
在一个实例中,将参与指环体繁殖的任何一个或多个orf的一个或多个序列克隆到适合于产生编码选择标记的稳定细胞系的慢病毒表达系统中,并如本文所述产生慢病毒载体。使能够支持指环体繁殖的哺乳动物细胞系感染该慢病毒载体,并经受选择标记(例如嘌呤霉素或任何其他抗生素)的选择压力,以选择已稳定整合了克隆的orf的细胞群。一旦对这种细胞系进行了表征并证明可以互补工程化的指环体中的缺陷,从而支持此类指环体的生长和繁殖,就可以将其扩增并储存在低温储存库中。在这些细胞的扩增和维持过程中,将选择抗生素添加到培养基中以维持选择压力。一旦将指环体引入这些细胞中,就可以抑制选择抗生素。
[2708]
一旦建立了该细胞系,就进行复制缺陷型指环体的生长和产生,例如,实例15中所述。
[2709]
实例17:使用悬浮细胞生产指环体
[2710]
该实例描述了悬浮细胞中产生指环体。
[2711]
在该实例中,使适于在悬浮条件下生长的a549或293t生产细胞系在无动物组分和无抗生素的悬浮培养基(赛默飞世尔科技公司(thermo fisher scientific))中于wave生物反应器袋中于37度和5%二氧化碳下生长。使用lipofectamine 2000(赛默飞世尔科技公司(thermo fisher scientific))在目前的良好生产规范(cgmp)下,将以1x106个活细胞/ml接种的这些细胞用含有指环体序列的质粒以及适合或需要包装指环体的任何互补质粒(例如在复制缺陷型指环体的情况下,例如,如实例16中所述)进行转染。在一些情况下,互补质粒可以编码已经从指环体基因组(例如,基于例如本文所述例如指环病毒基因组的病毒基因组的指环体基因组)中缺失但是用于或需要用于复制和包装指环体的病毒蛋白。转染的细胞在wave生物反应器袋中生长,并在以下时间点收获上清液:转染后48小时、72小时和96小时。使用离心将上清液与每个样品的细胞沉淀分离。然后,使用离子交换色谱法从收获的上清液和裂解的细胞沉淀中纯化包装的指环体颗粒。
[2712]
可以例如通过使用纯化的制备物的少量等分试样以使用病毒基因组提取试剂盒(凯杰公司(qiagen))来收获指环体基因组,然后使用靶向指环体dna序列的引物和探针进行qpcr,例如实例18中所述,来测定指环体的纯化制备物中的基因组当量。
[2713]
可通过对纯化的制备物进行连续稀释以感染新的a549细胞来定量纯化的制备物
中的指环体的感染性。转染后72小时,收获这些细胞,然后使用对指环体dna序列具有特异性的引物和探针对基因组dna进行qpcr测定。
[2714]
实例18:通过qpcr对指环体基因组当量进行定量
[2715]
该实例说明了用以定量指环体的基于水解探针的定量pcr测定的开发。使用geneious软件,基于选择的ttv(登录号aj620231.1)和ttmv(登录号jx134045.1)的基因组序列设计引物和探针组,并进行最终用户优化。引物序列显示在下表44中。
[2716]
表44:正向和反向引物和水解探针的序列,用于通过定量pcr定量ttmv和ttv基因组当量。
[2717][2718][2719]
作为开发方法的第一步,使用ttv和ttmv引物以及sybr绿色化学进行qpcr,以检查引物特异性。图13显示了每个引物对的一个不同的扩增峰。
[2720]
订购的水解探针在5'末端标记有荧光团6fam,在3'末端标记有小沟结合非荧光猝灭剂(mgbnfq)。然后使用两种不同的商业预混物,使用纯化的质粒dna作为标准曲线的组成并增加引物的浓度来评估新引物和探针的pcr效率。通过使用纯化的质粒建立标准曲线,所述纯化的质粒包含用于不同引物

探针组的靶序列。进行了七次十倍系列稀释,以实现7个对数内的线性范围和每20ul反应15个拷贝的定量下限。2号预混物能够产生90%

110%的pcr效率,这是定量pcr可接受的值(图14)。qpcr的所有引物均购自idt。与荧光团6fam和小沟结合非荧光猝灭剂(mgbnfq)缀合的水解探针以及所有qpcr预混物均购自赛默飞世尔(thermo fisher)。示例性扩增图如图15所示。
[2721]
使用这些引物

探针组和试剂,对基因组当量(geq)/ml指环体储备物进行定量。线性范围为每20ul反应1.5e 07

15geq,然后用于计算geq/ml,如图16a

16b所示。浓度高于线性范围的样品可以根据需要进行稀释。
[2722]
实例19:利用指环体在小鼠中表达外源蛋白
[2723]
此实例描述了指环体的用法,其中将细小环病毒(ttmv)基因组工程化以在小鼠中表达萤火虫萤光素酶蛋白。
[2724]
将编码工程化ttmv的dna序列的质粒通过化学转染引入a549细胞(人肺癌细胞系)中,所述工程化ttmv编码萤火虫萤光素酶基因。将18ug质粒dna用于转染10cm组织培养板中70%汇合的细胞。将缺少ttmv序列的空载体主链用作阴性对照。转染后5小时,将细胞用pbs
洗涤两次,并使其在37℃和5%二氧化碳下于新鲜生长培养基中生长。
[2725]
转染后96小时,收获转染的a549细胞及其上清液。将收获的物质在37℃下用0.5%脱氧胆酸盐(体积重量)处理1小时,然后进行内切核酸酶处理。使用离子交换色谱从该裂解物中纯化指环体颗粒。为了测定指环体浓度,将指环体储备物的样品运行通过病毒dna纯化试剂盒,并使用靶向指环体dna序列的引物和探针通过qpcr测定每ml的基因组当量。
[2726]
通过多种注射途径(例如静脉内、腹膜内、皮下、肌肉内)在8

10周龄的小鼠中进行1x磷酸盐缓冲液中的指环体的基因组当量的剂量范围。在注射后3、7、10和15天,对每只动物进行腹侧和背侧生物发光成像。根据制造商的规程,在指定的时间点通过向每只动物腹膜内添加萤光素酶底物(perkin

elmer),然后进行活体成像来进行成像。
[2727]
实例20:基因组比对,以测定指环体dna是否整合到宿主基因组中
[2728]
此实例描述了通过检查细环病毒(ttv)是否已整合到人基因组中来测定指环体dna是否可以整合到宿主基因组中而进行的计算分析。
[2729]
使用基本局部比对检索工具(blast)将来自五个示例性甲型细环病毒进化分枝中每一个的代表性ttv序列的全基因组与人基因组序列进行比对,所述工具会发现序列之间的局部相似性区域。分析了表45中所示的代表性ttv序列:
[2730]
表45:代表性ttv序列
[2731]
ttv进化分枝ncbi登录号进化分枝aab064597.1进化分枝bab028669.1进化分枝caj20231.1进化分枝daf122914.3进化分枝eaf298585.1
[2732]
没有发现来自对齐的ttv的序列与人基因组具有任何显著相似性,这表明ttv尚未整合到人基因组中。
[2733]
实例21:指环体整合到宿主基因组中的评估
[2734]
在此实例中,将a549细胞(人肺癌细胞系)和hek293t细胞(人胚胎肾细胞系)以5、10、30或50的moi感染指环体颗粒或aav颗粒。感染后5小时,将细胞用pbs洗涤,更换为新鲜的生长培养基。然后使细胞在37度和5%二氧化碳下生长。感染后五天,收获细胞,并使用基因组dna提取试剂盒(凯杰公司(qiagen))将其处理以收获基因组dna。还从未感染的细胞中收获基因组dna(阴性对照)。根据制造商规程,使用nextera dna文库制备试剂盒(illumina)为这些收获的dna制备全基因组测序文库。根据制造商规程,使用nextseq 550系统(illumina)对dna文库进行测序。将测序数据装配到参考基因组中,并进行分析以寻找指环体或aav基因组与宿主基因组之间的连接。在检测到连接的情况下,将在原始基因组dna样品中对其进行验证,然后再通过pcr进行测序文库制备。设计引物来扩增包含连接和连接周围的区域。通过qpcr定量样品中的连接数(代表整合事件)和指环体拷贝总数,来测定指环体整合到宿主基因组中的频率。可以将该比率与aav的比率进行比较。
[2735]
实例22:表达外源性微小rna序列的指环体的功能作用
[2736]
该实例展示了使用天然启动子从指环体基因组中成功表达外源mirna(mir

625)。
[2737]
将500ng以下质粒dna转染到24孔板中hek293t细胞的60%汇合孔中:
[2738]
i)空质粒骨架
[2739]
ii)含有ttv

tth8基因组的质粒,其中内源性mirna被敲除(ko)
[2740]
iii)ttv

tth8,其中内源性mirna被非靶向乱序mirna取代
[2741]
iv)ttv

tth8,其中内源性mirna序列被编码mir

625的mirna替换
[2742]
转染后72小时,使用qiagen mirneasy试剂盒从转染细胞中收集总mirna,然后使用mirna script rt ii试剂盒进行逆转录。使用应特异性检测mirna

625或rnu6小rna的引物对逆转录的dna进行定量pcr。rnu6小rna用作管家基因,数据绘制在图17中,作为相对于空载体的倍数变化。如图17所示,mir

625指环体导致mir

625表达增加约100倍,而对于空载体、mir

敲除(ko)和乱序mir,未检测到信号。
[2743]
实例23:表达外源性非编码rna的指环体的制备和产生
[2744]
该实例描述了表达外源性小非编码rna的指环体的合成和产生。
[2745]
合成了来自ttv的tth8菌株的dna序列(jelcic等人,journal of virology[病毒学杂志],2004),并将其克隆到含有细菌复制起点和细菌抗生素抗性基因的载体中。在该载体中,编码ttv mirna发夹的dna序列被替换为编码外源性小非编码rna(例如mirna或shrna)的dna序列。然后,将工程化的构建体转化到电感受态细菌中,然后根据制造商的规程使用质粒纯化试剂盒进行质粒分离。
[2746]
将编码外源性小非编码rna的指环体dna转染到真核生产细胞系中,以生产指环体颗粒。在转染后的不同时间点,收获含有指环体颗粒的转染细胞的上清液。将来自过滤的上清液或纯化后的指环体颗粒用于下游应用,例如本文所述。
[2747]
实例24:指环病毒进化分枝中的保守性
[2748]
本实例描述了甲型细环病毒属中七个进化分枝的鉴定。这些进化分枝之间的代表性序列在整个序列中显示54.7%成对同一性(图18)。在开放阅读框中,成对同一性最低(约48.8%),在非编码区则较高(在5'ncr中为69.1%,在3'ncr中为74.6%)(图18)。这表明非编码区的dna序列或结构在病毒复制中起重要作用。
[2749]
还比较了甲型细环病毒中推定蛋白质的氨基酸序列。dna序列显示约47%至50%成对同一性,而氨基酸序列显示约32%至38%成对同一性(图19)。有趣的是,来自甲型细环病毒进化分枝的代表性序列能够在体内成功复制并在人群中观察到。这表明指环病毒蛋白的氨基酸序列可以广泛变化,同时保留诸如复制和包装的功能。
[2750]
发现指环病毒在非编码区中具有局部高度保守的区域。在启动子下游的区域是71

bp 5’utr保守结构域,其在七个甲型细环病毒进化分枝中具有95.2%成对同一性(图20)。在甲型细环病毒的3'非编码区的开放阅读框的下游,存在其中代表性序列之间具有大量成对同一性的区域。在这个3'保守非编码区的3’末端附近是高度保守的序列。指环病毒还包括gc含量超过70%的gc富集区,其在它们对齐的区域中表现出75.4%的成对同一性(图21)。实例25:从指环体表达内源性mirna和内源性mirna的缺失
[2751]
在一个实例中,使用包含经修饰的ttv

tth8基因组的指环体来感染培养中的raji b细胞,其中ttv

tth8基因组被修饰为缺失gc富集区,如实例27所述。这些指环体包含编码ttv

tth8指环体病毒的内源有效负载的序列,其是一种靶向编码n

myc相互作用蛋白(nmi)的mrna的mirna,并通过引入包含指环病毒基因组的质粒进入宿主细胞。nmi在jak/stat途径的下游运行,以调节各种细胞内信号的转录,包括干扰素刺激的基因、增殖和生长基因以
及炎症反应的介质。如图22所示,在靶raji b细胞中检测到病毒基因组。与对照细胞相比,在靶raji b细胞中也观察到了nmi的成功敲低(图23)。与对照细胞相比,包含针对nmi的mirna的指环体诱导nmi蛋白水平降低75%以上。该实例说明具有天然指环病毒mirna的指环体可以敲低宿主细胞中的靶分子。
[2752]
在另一个实例中,缺失了基于指环病毒的指环体的内源性mirna。然后将所得的指环体(δmir)与宿主细胞一起孵育。然后将δmir指环体遗传元件的基因组等效物与保留内源性mirna的相应指环体的基因组等效物进行比较。如图24所示,在细胞中以与仍然存在内源性mirna的指环体基因组所观察到的水平相当的水平检测到缺失了内源性mirna的指环体基因组。该实例表明,基于指环病毒的指环体的内源性mirna可以发生突变或完全缺失,并且仍然可以在靶细胞中检测到该指环体基因组。
[2753]
实例26:指环病毒orf的定位
[2754]
该实例描述了指环病毒的各种推定orf的新功能。在该实例中,推定的开放阅读框(orf)序列被设计在每个orf的n末端的标记蛋白(即纳米萤光素酶)的下游。通过化学转染将每个orf

nluc质粒引入12孔板中的5e 05贴壁细胞(vero或hek293t)或通过电穿孔引入悬浮的5e 05细胞。在最佳时间段后(例如,转染后3

7天),用pbs中的4%多聚甲醛(赛默飞世尔公司cat#28908)固定细胞,并用0.5%triton x

100进行透化,并用兔多克隆抗nluc抗体(普洛麦格公司(promega)的赠品),然后是山羊抗兔alexa488(赛默飞世尔公司cat#a

11008)偶联二抗对nluc染色。细胞核用dapi(赛默飞世尔公司cat#d3571)染色。染色的细胞在带有20x物镜和单色axiocam 506相机的zeiss axiovert a1上可视化,用于标记的蛋白的细胞定位。
[2755]
如图25a

25b所示,在vero细胞和hek293细胞中观察到orf2定位于细胞质,观察到orf1/1定位于细胞核。图25c显示了orf1/2和orf2/2的定位。
[2756]
实例27:指环体开发所需区域的表征
[2757]
该实例描述了指环病毒基因组中的缺失,以帮助表征足以复制病毒和指环病毒生产的基因组部分。在orf(nt 3016至3753)下游的ttv

tth8的非编码区(ncr)中进行了一系列缺失。36个核苷酸(nt)的序列(cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160))从gc区域中缺失(标记为δ36nt(gc))。此外,从3’ncr中缺失了78

nt前微小rna序列(ccgccatcttaagtagttgaggcggacggtggcgtgagttcaaaggtcaccatcagccacacctactcaaaatggtgg(seq id no:161))(标记为δ36nt(gc)δmir)。最后,在δ36nt(gc)的3'ncr缺失额外的171个nt(cttaagtagttgaggcggacggtggcgtgagttcaaaggtcaccatcagccacacctactcaaaatggtggacaatttcttccgggtcaaaggttacagccgccatgttaaaacacgtgacgtatgacgtcacggccgccattttgtgacacaagatggccgacttccttcc(seq id no:162))并且标记为δ3'ncr(图26)。将上述分别描述的2μg环状pttv

tth8(wt)、pttv

tth8(δ36nt(gc))、pttv

tth8(δ36nt(gc)δmir)、包含改变的3'ncr ttv

tth8的pttv

tth8(δ3'ncr)dna质粒使用lipofectamine 2000转染到12孔板中的60%汇合度的hek293中,一式三份。转染后48小时,收获细胞沉淀并裂解以分离mrna转录物(rneasy,凯杰公司cat#74104)并转化为cdna(高容量cdna逆转录试剂盒,赛默飞世尔公司,cat#4368814)。对所有样品进行qpcr,测量每个缺失情况下的病毒转录物表达,并标准化为gapdh的内部对照mrna。
[2758]
如图27a

27d所示,所有三种缺失突变体在体外都显著抑制病毒转录物表达。因
此,ttv

tth8的3’ncr是生产用于表达转基因的指环体所必需的。
[2759]
ttv株tth8,genebank登录号aj620231.1,以全基因组序列保藏。然而,在gc富集区,有一段36个核苷酸被注释为通用n。该区域在ttv株中高度保守,因此可能对这些病毒的生物学很重要。将数百个ttv菌株的dna序列进行计算比对,并用于生成这36个核苷酸的强共有序列(cgcgctgcgcgcgccgcccagtagggggagccatgc(seq id no:160))。ttv

tth8基因组序列在本文中称为“野生型”序列,因此该共有序列被插入以替代公开可用的ttv

tth8序列中列出的36个n的区段。
[2760]
实例28:外源蛋白质的指环体体内递送
[2761]
本实例展示了指环体在施用后的体内效应子功能(例如蛋白质的表达)。
[2762]
制备包含编码纳米萤光素酶(nluc)的转基因的指环体(图28a

28b)。简而言之,将含有ttmv

ly2非编码区和nluc表达盒的双链dna质粒与编码完整ttmv

ly2基因组的双链dna质粒一起转染到hek293t细胞中,作为反式复制和包装因子。转染后,培养细胞以允许产生指环体,并通过核酸酶处理、超滤/渗滤和无菌过滤收获和富集指环体材料。使用以下转染另外的hek293t细胞:包含nluc表达盒和ttmv

ly2 orf转染盒的非复制dna质粒,但缺乏复制和包装所必需的非编码结构域,以充当“非病毒”阴性对照。非病毒样品是按照与指环体材料相同的方案制备的。
[2763]
对三只健康小鼠进行肌内注射,并在九天内通过ivis lumina成像(布鲁克公司(bruker))进行监测(图29a)。作为非病毒对照,将非复制型制剂施用于另外三只小鼠(图29b)。在第0天向左后腿注射25μl的指环体或非病毒制剂,并在第4天再注射右后腿(参见图29a和b中的箭头)。在ivis成像9天后,与非病毒制剂(图29b)相比,在注射了指环体制剂(图29a)的小鼠中观察到更多的nluc发光信号,这与体内指环体转导后的反式基因表达一致。
[2764]
实例29:指环病毒中前体mirna(前mir)的鉴定
[2765]
该实例描述了用以鉴定各种指环病毒编码的新颖前体mirna的各种计算和实验方法。
[2766]
计算方法
[2767]
指环病毒株在核苷酸序列水平上彼此非常不同。然而,指环病毒株,尤其是同一进化分枝内的那些,在启动子、gc富集区、非编码区和编码区等各种成分的基因组组织方面可以表现出显著的相似性(参见例如图29d)。本文描述了一种方法,其中通过与已通过实验验证的前mir序列的指环病毒株进行比对来预测各种指环病毒株(其前mir序列未知)的前mir序列。
[2768]
简而言之,挖掘来自细胞系和各种人样品的小rna的各种公开可用的小rna测序数据集,以发现由各种指环病毒株编码的新颖前mir序列。基于结构预测或机器学习分类的公开可用的计算工具和算法,例如mfold程序、miranda算法、mirscan、miranalyzer、mirdeep(https://www.ncbi.nlm.nih.gov/pmc/articles/pmc1559940/,https://www.frontiersin.org/articles/10.3389/fbioe.2015.00007/full)用于预测由各种指环病毒编码的新颖mirna。然后使用针对特异性mirna序列设计的探针的rna印迹和/或使用针对mirna的特异性引物的rt

qpcr来确认、验证和定量新颖mirna的表达。
[2769]
实验方法
[2770]
在一个实例中,对感染了指环病毒的人组织或血液样品进行高通量小rna测序,以
发现新颖的指环病毒编码的前mirna。为此,需要从匀浆的人组织样品或人血液样品中采集rna。使用illumina试剂盒和测序平台制备和测序小rna文库。测序读段在basespace sequence hub(依诺米那公司(illumina))上存储、比对和分析。
[2771]
在第二实例中,对用以下条件处理的各种细胞系进行高通量小rna测序,以发现由指环病毒编码的新颖前mirna:(a)感染了天然存在的指环病毒的细胞系,转染了体外合成的指环病毒基因组的细胞系,以及(c)感染了使用合成的基因组在体外包装的指环病毒的细胞系。使用针对特异性mirna序列设计的探针的rna印迹和/或使用针对mirna的特异性引物的rt

qpcr来确认、验证和定量新颖mirna的表达。
[2772]
实例30:确定指环病毒前mir的内源性靶
[2773]
该实例描述了分析以确定由各种指环病毒株编码的前mir的内源性靶和潜在的治疗相关靶途径。
[2774]
由各种指环病毒编码的经计算预测和/或实验验证的单个前mirna序列被克隆到慢病毒载体中,由u6启动子驱动。由u6启动子驱动的非靶向乱序mirna序列也以类似的方式克隆,用作对照。慢病毒质粒被克隆,使得当包装时,其基因组将包含(i)由u6启动子驱动的前mirna序列,(ii)由sv40启动子驱动的嘌呤霉素抗性基因,以及(iii)由cmv启动子驱动的绿色荧光蛋白(gfp)基因。这些慢病毒质粒中的每一个都与慢病毒辅助质粒一起单独共转染到hek

293t细胞中以包装病毒。转染后六小时,吸出转染细胞的培养基,用pbs洗涤一次并更换为新鲜培养基。转染后72小时收集含有慢病毒的培养基。培养基通过0.4um过滤器过滤以去除任何细胞,然后用于感染目的细胞类型,如hela、raji和thp1,一式三份。通过在感染后3天开始用嘌呤霉素处理来选择含有整合的慢病毒基因组的细胞。使用rna提取试剂盒(凯杰公司)从稳定选择的细胞系中收获rna,然后使用逆转录酶试剂盒(赛默飞世尔科技公司)逆转录为cdna。处理cdna样品以生成带索引的短读段文库。使用illumina测序平台,经独特索引的短读段文库被多路复用测序,每个样品产生约2000万个读段。测序读段使用basespace sequence hub(依诺米那公司(illumina))进行存储、比对和分析。通过比较表达候选前mir的细胞系中的基因表达与表达乱序前mir的细胞系中的基因表达来确定每个单独的候选前mir的靶。进行ingenuity pathway分析以测试前mirna是否靶向特定通路,尤其是治疗相关通路。该实例中描述的工作流程示意图如图30所示。
[2775]
实例31:制造编码天然指环病毒前mir的指环体
[2776]
该实例描述了包装表达天然指环病毒前mir的指环体的复制或非复制形式的过程。
[2777]
合成的非复制形式的指环体的基因组包含以下组分:(i)复制起点,(ii)编码指环病毒前mirna的序列,(iii)rna聚合酶iii,例如u6或h1,驱动前mirna的表达,以及(iv)包装信号。该基因组通过转染到辅助细胞系中进行包装,所述辅助细胞系稳定表达病毒包装所需的所有蛋白质。如本文所述,转染后7天收获转染的细胞并进行加工以制备指环体制剂。如本文所述,通过进行qpcr确定指环体制剂的基因组等效效价。然后将适当剂量的指环体制剂用于下游应用。
[2778]
可以合成指环体的复制形式的基因组,例如,通过产生天然指环病毒,除了使用外源启动子如u6或组织特异性启动子操纵前mirna序列的表达。基因组通过转染到hek

293t细胞中进行包装。如本文所述,转染后7天收获转染的细胞并进行加工以制备指环体制剂。
如本文所述,通过进行qpcr确定指环体制剂的基因组等效效价。将适当剂量的指环体制剂用于下游应用。
[2779]
实例32:在体外细胞培养模型中利用指环病毒前mir作为肿瘤抑制因子
[2780]
该实例描述了研究以确认从例如如实例29中所述的分析中鉴定为肿瘤抑制性的候选前mir的表型作用。
[2781]
基于如实例29中所述的分析鉴定具有肿瘤抑制作用的候选前mirna。如实例31中所述制备编码这些候选前mirna以及乱序前mirna的指环体的复制形式的指环体制剂。来自nci

60癌细胞系组的癌细胞系接种在96孔板中。当30%汇合时,这些细胞系用包含候选前mir或乱序前mir的指环体以每个细胞五个基因组当量的剂量处理。感染后五小时吸出含有指环体的培养基,然后用pbs洗涤两次,并更换为新鲜培养基。处理后三天对处理过的细胞进行alamar blue测定,以确定哪些前mir抑制癌细胞系的增殖。
[2782]
实例33:利用指环病毒前mir作为体内肿瘤抑制因子
[2783]
该实例描述了体内实验,以确认来自如实例32中所述的体外分析的筛选的候选肿瘤抑制性指环病毒前mir和癌细胞系的肿瘤抑制作用。
[2784]
异种移植物是通过将来自实例32中描述的分析的经筛选的癌细胞系连同基质胶一起皮下注射到无胸腺小鼠的侧腹中来产生的。一旦异种移植肿瘤变得可触及,就会进行3x106基因组当量的编码肿瘤抑制性前mirna或乱序前mirna的指环体的局部肿瘤注射。通过三周的常规肿瘤生长测量,在实验结束时异种移植肿瘤的肿瘤重量测量以及通过brdu掺入测定确定指环体注射对肿瘤生长的影响。
[2785]
实例34:指环病毒基因组的串联拷贝
[2786]
该实例描述了基于质粒的表达载体,其包含单个环病毒基因组的两个拷贝,串联排列,使得上游基因组的gc富集区靠近下游基因组的5'区域(图31a)。
[2787]
指环病毒通过滚环复制,其中复制酶(rep)蛋白在复制起点与基因组结合并启动围绕该环的dna合成。对于包含在质粒骨架中的指环病毒基因组,这需要复制完整的质粒长度,其比天然病毒基因组长,或者质粒的重组导致包含具有最少骨架的基因组的较小环。因此,从质粒复制病毒可能效率低下。为了提高病毒基因组复制效率,质粒被工程化为具有ttv

tth8和ttmv

ly2的串联拷贝。这些质粒呈现了指环病毒基因组的每一种可能的环状排列:无论rep蛋白结合在哪里,它都能驱动病毒基因组从复制起点上游到起点下游的复制。类似的策略已用于生产猪指环病毒(huang等人,2012,journal of virology[病毒学杂志]86(11)6042

6054)。
[2788]
串联ttv

tth8是通过将基因组的拷贝依次克隆到质粒骨架中来组装的,在两个序列之间留下12bp的非病毒dna。几个ttv

tth8变体被组装成串联质粒,包括野生型和ttv

tth8(δ36gc)(即,ttv

tth8基因组被工程化为包括本文所述的36个核苷酸的gc富集序列),它缺失了来自gc富集区的36个碱基对。串联ttmv

ly2是通过金门(golden

gate)组装进行组装的,同时将基因组的两个拷贝合并到骨架中,并且在基因组之间不留下额外的核苷酸。
[2789]
将携带ttv

tth8(δ36gc)的串联拷贝的质粒转染到hek239t细胞中。将细胞培养五天,然后使用0.1%triton x

100裂解并用核酸酶处理以消化不受病毒衣壳保护的dna。然后使用taqman探针对ttv

tth8基因组序列和质粒骨架进行qpcr。ttv

tth8基因组拷贝被
标准化为骨架拷贝。如图31b所示,串联ttv

tth8产生的病毒基因组数量是携带单拷贝的质粒的多于四倍。当考虑ttv

tth8基因组序列数量翻倍时,串联质粒每个转染拷贝产生的新合成基因组拷贝数是其两倍多。这些数据表明,工程化串联指环病毒基因组可以增加病毒基因组复制,并可用作增加指环病毒产量的策略。
[2790]
实例35:体外环化的指环病毒基因组
[2791]
该实例描述了包含环状双链环病毒基因组dna和最少非病毒dna的构建体。这些环状病毒基因组与野生型指环病毒复制过程中发现的双链dna中间体更加匹配。当引入细胞时,这种具有最少非病毒dna的环状双链指环病毒基因组dna可以进行滚环复制以产生例如本文所述的遗传元件。
[2792]
在一个实例中,携带ttv

tth8变体和ttmv

ly2的质粒用限制性内切核酸酶消化,所述限制性内切核酸酶识别基因组dna侧翼的位点。然后将得到的线性化基因组连接起来形成环状dna。这些连接反应是用不同的dna浓度进行的,以优化分子内连接。连接的环要么直接转染到哺乳动物细胞中,要么通过用限制性内切核酸酶消化以切割质粒骨架和用外切核酸酶以降解线性dna来进一步加工以去除非环状基因组dna。对于ttv

tth8,xmai核酸内切酶用于使dna线性化;连接的环在gc富集区和5'非编码区域之间含有53bp的非病毒dna。对于ttmv

ly2,使用iis型限制性内切酶esp3i,产生不含非病毒dna的病毒基因组dna环。该方案改编自先前公开的ttv

tth8环化(kincaid等人,2013,plos pathogens[公共科学图书馆—病原体]9(12):e1003818)。为了证明指环病毒产量的改进,将环化的ttv

tth8和ttmv

ly2转染到hek293t细胞中。孵育7天后,裂解细胞,并进行qpcr以比较环化的和基于质粒的指环病毒基因组之间的指环病毒基因组水平。指环病毒基因组水平的增加表明病毒dna的环化是增加指环病毒产量的有用策略。
[2793]
在另一个实例中,ttmv

ly2质粒(pvl46

240)和ttmv

ly2

nluc分别用esp3i或ecorv

hf线性化。消化后的质粒在1%琼脂糖凝胶上纯化,然后电洗脱或qiagen柱纯化,并用t4 dna连接酶连接。转染前将环化的dna在100kda uf/df膜上浓缩。环化通过凝胶电泳确认,如图31c所示。在用lipofectamine 2000进行脂质转染前一天,将hek293t以3x104个细胞/cm2接种到t

225烧瓶中。在烧瓶接种后一天共转染九微克环化的ttmv

ly2 dna和50μg环化的ttmv

ly2

nluc。作为比较,另外的t

225烧瓶用50μg线性化的ttmv

ly2和50μg线性化的ttmv

ly2

nluc共转染。
[2794]
在triton x

100收获缓冲液中收获细胞前,指环体生产进行了八天。通常,可以通过例如宿主细胞的裂解、裂解物的澄清、过滤和色谱来富集指环体。在该实例中,收获的细胞在氯化钠调整和1.2μm/0.45μm正常流动过滤之前进行了核酸酶处理。在750kda mwco mpes中空纤维膜上浓缩澄清的收获物并将缓冲液交换到pbs中。将tff渗余物用0.45μm过滤器过滤,然后装入在pbs中预平衡的sephacryl s

500 hr sec柱。指环体以30cm/hr通过sec柱进行处理。如图31d所示,将各个级分通过qpcr收集并且分析其病毒基因组拷贝数和转基因拷贝数。从sec色谱图的空隙体积,级分7,开始观察到病毒基因组和转基因拷贝。在级分15处观察到残留质粒峰。ttmv

ly2基因组和ttmv

ly2

nluc转基因的拷贝数与使用环化的输入dna在级分7

级分10处产生的指环体非常一致,表明包装的指环体包含nluc转基因。将sec级分合并和使用100kda mwco pvdf膜浓缩,然后在体内施用之前0.2μm过滤。
[2795]
与线性化的指环体dna相比,输入指环体dna的环化导致在整个纯化过程中核酸酶
保护的基因组的回收百分比增加了三倍,表明使用环化的输入指环体dna提高了制造效率,如表46所示。
[2796]
表46.纯化过程产率
[2797][2798]
实例36:orf1建模和保守残基和结构域的鉴定
[2799]
该实例描述了乙型细环病毒的orf1蛋白的计算机模拟建模,并根据结构基序和氨基酸保守性/相似性定义推定结构域。
[2800]
orf1蛋白被预测为指环病毒的主要衣壳蛋白,这是基于精氨酸富集区的存在和使用psipred的二级结构预测中β

折叠的高度存在(http://bioinf.cs.ucl.ac.uk/psipred/)。raptorx(http://raptorx.uchicago.edu/)被用于对八种乙型细环病毒的序列进行结构预测和接触预测。使用乙型细环病毒orf1序列是因为它们比甲型细环病毒(约750个氨基酸)更短(约650个氨基酸),后者预测为非结构化的区域更少。预测的结构中的五个包含用于鉴定orf1推定结构域的具有相似性的元件(图33)。orf1分为五个区域

精氨酸富集区、推定的核心(胶冻卷结构域)、高变区、n22区域和c末端结构域。
[2801]
乙型细环病毒株cbs203的结构模型用于展示在乙型细环病毒家族中具有一定保守性的残基/结构区域。为了分析保守残基,使用clustalw比对算法在geneious中比对了110个乙型细环病毒orf1序列。然后使用阈值为1的blosum62矩阵通过同一性和相似性百分比评估残基的保守性。结构模型上突出显示了比对中所有株的具有大于60%相似性的残基(图34)。总共有26个残基(约4%)与100%的比对序列具有氨基酸相似性。80%和60%截断值分别包含总残基的23.7%和36.7%。
[2802]
对甲型细环病毒的258个株进行了类似的比对算法和相似性测定。相似性和同一性展示在来自比对的共有序列中,并且基于与乙型细环病毒的一级序列比对来分配推定结构域(图35)。甲型细环病毒具有29个残基(3.9%),它们100%相似,与乙型细环病毒的观察结果非常一致。有趣的是,与具有至少80%(30.9%的残基)或60%(42.9%的残基)相似性的乙型细环病毒相比,甲型细环病毒具有更高百分比的残基。
[2803]
实例37:生产含有来自不同细环病毒株的具有高变结构域的嵌合orf1的指环体
[2804]
该实例描述了orf1的高变区的结构域交换,以产生嵌合指环体,所述嵌合指环体包含一个ttv株的orf1精氨酸富集区、胶冻卷结构域、n22和c末端结构域,以及来自不同ttv株的orf1蛋白的高变结构域。
[2805]
乙型细环病毒的全长基因组ly2株已被克隆到表达载体中,用于在哺乳动物细胞中表达。对该基因组进行突变以去除ly2的高变结构域并将其替换为远亲乙型细环病毒的高变结构域(图36)。然后使用先前公布的方法(kincaid等人,plos pathogens[公共科学图书馆—病原体]2013)将含有具有交换的高变价格域的ly2基因组的质粒(pttmv

ly2

hvra

z)线性化和环化。hek293t细胞用环化的基因组转染并孵育5

7天,以允许指环体生产。孵育期后,通过梯度超速离心从转染的细胞的上清液和细胞沉淀中纯化出指环体。
[2806]
为了确定嵌合指环体是否仍然具有感染性,将分离的病毒颗粒添加到未感染的细胞中。将细胞孵育5

7天以允许病毒复制。孵育后,嵌合指环体建立感染的能力将通过免疫荧光、蛋白质印迹和qpcr进行监测。嵌合病毒的结构完整性通过负染色和冷冻电子显微镜进行评估。可以进一步测试嵌合指环体在体内感染细胞的能力。通过高变结构域交换产生功能性嵌合指环体的能力的建立可以允许病毒工程化以改变向性并可能逃避免疫检测。
[2807]
实例38:生产含有非ttv蛋白/肽代替高变结构域的嵌合orf1
[2808]
该实例描述了用其他目的蛋白质或肽替换orf1的高变区,以产生嵌合orf1蛋白,其包含一个ttv株的精氨酸富集区、胶冻卷结构域、n22和c末端结构域,以及替代高变结构域的非ttv蛋白/肽。
[2809]
如实例b所示,ly2的高变结构域从基因组中缺失,目的蛋白质或肽可以插入该区域(图37)。可以引入该区域的序列类型的实例包括但不限于亲和标签、抗体的单链可变区(scfv)和抗原肽。质粒(pttmv

ly2

δhvr

poi)中的突变基因组如实例b中所述进行线性化和环化。将环化的基因组转染到hek293t细胞中并孵育5

7天。孵育后,在合适的情况下,通过超速离心和/或亲和色谱从上清液和细胞沉淀中纯化含有poi的嵌合指环体。
[2810]
使用各种技术评估产生含有poi的功能性嵌合指环体的能力。首先,将纯化的病毒添加到未感染的细胞中,以确定嵌合指环体是否可以复制和/或将有效负载递送给原初细胞。此外,使用电子显微镜评估嵌合指环体的结构完整性。对于体外功能性的嵌合指环体,还评估了体内复制/递送有效负载的能力。
[2811]
实例39:设计包含有效负载的指环体
[2812]
该实例描述了包含反式基因的示例性指环体遗传元件的设计。遗传元件由来自指环病毒科成员的必需顺式复制和包装结构域以及非指环病毒有效负载组成,所述非指环病毒有效负载可能包括例如蛋白质或非编码rna表达基因。指环体缺乏复制和包装所必需的反式蛋白质元件,并且需要其他来源(例如,辅助病毒,例如复制病毒、表达质粒或基因组整合)提供的蛋白质来进行滚环复制和衣壳化。
[2813]
在一组实例中,缺失了整个蛋白质编码dna序列,从第一个起始密码子到最后一个终止密码子(图38)。对于ttv

tth8,从orf2起始密码子到orf3终止密码子的第336至3015位核苷酸被缺失。对于ttmv

ly2,从orf2起始密码子到orf3终止密码子的424到2813被缺失。所得dna保留了病毒非编码区(ncr),包括病毒启动子、5'utr保守结构域、3’utr(在某些指环病毒株中编码mirna,例如ttv

tth8)和gc富集区。指环体ncr包含必需的顺式结构域,包括病毒复制起点和衣壳结合结构域。然而,由于缺乏编码指环病毒蛋白的开放阅读框,指环
体无法表达dna复制和衣壳化所需的必需蛋白质因子,因此除非以反式提供这些元件,否则无法扩增或包装。
[2814]
有效负载dna,包括但不限于蛋白质编码序列、完整的反式基因(包括非指环病毒启动子序列)和非编码rna基因,通过插入到缺失的指环病毒开放阅读框的位点中来掺入指环体遗传元件(图38)。例如,可以通过天然病毒启动子或作为反式基因掺入的合成启动子驱动蛋白质编码序列的表达。
[2815]
复制缺陷或无复制能力的指环体遗传元件(例如,如本文所述)可能缺乏用于病毒复制和/或衣壳因子的蛋白质编码序列。因此,包装的指环体是通过用该实例中描述的指环体dna和病毒蛋白编码dna共转染细胞来产生的。病毒蛋白由具有复制能力的野生型病毒基因组、包含受病毒启动子控制的病毒蛋白的非复制型质粒或包含受强组成型启动子控制的病毒蛋白的质粒表达。
[2816]
实例40:编码转基因的指环体的转导
[2817]
在该实例中,指环体ly2

免疫粘附素(ia)是使用指环病毒ly2制成的,从肺样品中分离出来,然后经过工程化以递送人免疫粘附素。设计了双链环状ly2

ia指环体dna(其包括ly2非编码区(5’utr,gc富集区)和ia编码盒,但不包括指环病毒orf(例如,如在实例39中所述)),然后通过体外环化产生,如本文所述。指环病毒orf以反式提供,位于单独的体外环化dna中。两种dna在两个生物学重复中被共转染到hek293t细胞中(在图39中显示为“a”和“b”)。还测试了两个生物学重复,各自是阴性对照(模拟转染)和阳性对照(质粒中的ia表达盒)。将指环体制剂转导到肺源性人细胞系ekvx和a549中导致通过elisa检测到分泌型免疫粘附素(图39;参见右侧的条形图)。此外,ly2

ia转导的ekvx细胞的免疫荧光分析揭示了免疫粘附表达阳性的细胞。
[2818]
实例41:基于tth8和ly2的指环体分别成功地将epo基因转导到肺癌细胞中
[2819]
在该实例中,非小细胞肺癌细胞系(ekvx)使用两种不同的携带促红细胞生成素基因(epo)的指环体转导。如本文所述,指环体通过体外环化产生,并且包括基于ly2或tth8骨架的两种类型的指环体(例如,分别如表15和16或表5和6中所述)。ly2

epo和tth8

epo指环体中的每一个都包括遗传元件,所述遗传元件分别包括epo编码盒和ly2或tth8基因组的非编码区(5'utr,gc富集区),但不包括指环病毒orf,例如,如实例39中所述。用纯化的指环体或阳性对照(高剂量或与指环体相同剂量的aav2

epo)接种细胞并孵育7天。指环病毒orf以反式提供,位于单独的体外环化dna中。在接种后3、5.5和7天对培养物上清液取样,并使用商业elisa试剂盒进行测定以检测epo。ly2

epo和tth8

epo指环体均成功转导细胞,与未处理(阴性)对照细胞相比,epo效价显著更高(在所有时间点p<0.013)(图40)。
[2820]
实例42:静脉内(i.v.)施用后,可以在体内检测到带有治疗性转基因的指环体
[2821]
在该实例中,静脉内(i.v.)施用后,在体内检测到编码人生长激素(hgh)的指环体。基于ly2骨架并编码外源hgh(ly2

hgh)的复制缺陷型指环体通过如本文所述的体外环化产生。ly2

hgh指环体的遗传元件包括ly2非编码区(5'utr,gc富集区)和hgh编码盒,但不包括指环体病毒orf,例如,如实例39中所述。ly2

hgh指环体静脉内施用给小鼠。指环病毒orf以反式提供,位于单独的体外环化dna中。简而言之,在第0天静脉内注射指环体(ly2

hgh)或pbs(n=4只小鼠/组)。指环体以每只小鼠4.66e 07个指环体基因组施用于独立的动物组。
[2822]
在第一实例中,检测到指环体病毒基因组dna拷贝。在第7天,收集血液和血浆并通过qpcr分析hgh dna扩增子。在体内感染后7天后,ly2

hgh指环体存在于全血的细胞级分中(图41a)。此外,血浆中不存在指环体证明这些指环体无法在体内复制(图41b)。
[2823]
在第二实例中,在体内转导后检测到hgh mrna转录物。在第7天,收集血液并通过qrt

pcr分析hgh mrna转录扩增子。gapdh用作对照看家基因。在全血的细胞级分中测量hgh mrna转录物。在体内检测到来自指环体编码的转基因的mrna(图42)。
[2824]
实例43:指环病毒中的编码序列大小分布
[2825]
所有指环病毒的编码序列(cds)长度是利用内部鉴定的野生型株的广泛目录进行评估的。绘制指环病毒的cds长度,比较三个人指环病毒属(甲型细环病毒,α;乙型细环病毒,β;和丙型细环病毒,γ)的病毒株,并将公开可用的基因组序列长度与发明人内部(内部)组装的那些进行比较。所有指环病毒的平均cds长度为约2100个核苷酸。甲型细环病毒属中的ttv大于来自乙型细环病毒和丙型细环病毒属的指环病毒(分别为ttv小型和ttv中型)。具体而言,在甲型细环病毒ttv中观察到的平均cds为2237个核苷酸,范围为1800

2541个核苷酸。观察到乙型细环病毒的平均cds长度为2011个核苷酸,范围为1803

2229个核苷酸。观察到丙型细环病毒的平均cds长度为2012个核苷酸,范围为1812

2379个核苷酸。
[2826]
实例44:用以表征orf2的高度保守基序
[2827]
如图43a中的示例性基因组所示,指环病毒orf2可能编码具有可能的磷酸酶活性和在病毒复制和宿主免疫调节中的作用的非结构蛋白。检查了广泛的病毒序列库中是否存在保守的orf2氨基酸基序(图43b)。然后使用该基序在内部和公共序列中鉴定超过1,000个指环病毒orf2序列。发现该orf2基序在大量人指环病毒株以及所有检查的非人指环病毒(啮齿动物、猪和灵长类动物指环病毒,以及鸡贫血病毒)中保持保守,使其成为迄今为止鉴定的最高度保守的指环病毒基序。还进行了orf2结构建模,这表明orf2基序中的保守残基保持在螺旋

转角

螺旋结构中,其取向表明可能存在金属结合结构域(图43c)。有趣的是,orf1与orf2相比的系统发育树(图43d)显示出甲型细环病毒、乙型细环病毒和丙型细环病毒的类似属级分解,表明orf2是属特异性的。
[2828]
实例45:人全长指环病毒orf1 mrna的证据
[2829]
指环病毒在体外表达至少三种可变剪接的mrna,其中最长的(约2.2kb)预计编码全长orf1。在该实例中,在体内评估orf1 mrna转录。
[2830]
为此,检查了来自gtex(基因型

组织表达)项目的公开可用的rna seq组织数据。目标是鉴定包含足够的指环病毒rna读段的人组织样品,以对病毒转录物进行分类。鉴定了104个具有指环病毒rna读段的组织样品(占所有组织的2.4%,占血液样品的19%);其中7个样品具有超过20个指环病毒rna读段,允许进行病毒转录组分析。这7个指环病毒阳性样品中的3个还具有匹配的wgs数据,从中可以组装相应的指环病毒dna基因组以进行精确读段映射(图44a)。由于缺乏相应的病毒参考基因组,指环病毒多样性禁止提供信息性的rna读段映射。在三个供体(两个血液样品和一个肺组织样品)中检测到映射到orf1区域的rna读段。在一个供体血液样品中,鉴定了涵盖全长orf1区域的指环病毒rna读段(图44b,灰色条表示读段对)。这是使用rna seq数据首次在体内确认全长指环病毒转录物。
[2831]
实例46:体外环化的基因组作为体外生产指环体的输入材料
[2832]
该实例证明体外环化(ivc)的双链指环病毒dna,作为本文所述指环病毒遗传元件
的源材料,比质粒中的指环病毒基因组dna更稳健,以产生预期密度的包装的指环病毒基因组。
[2833]
t75烧瓶中的1.2e 07 hek293t细胞(人胚胎肾细胞系)用11.25ug的以下任一种转染:(i)体外环化的双链ttv

tth8基因组(ivc ttv

tth8),(ii)在质粒骨架中的ttv

tth8基因组,或(iii)仅包含ttv

tth8(非复制型ttv

tth8)的orf1序列的质粒。转染后7天收获细胞,用0.1%triton裂解,并用100单位/ml的benzonase处理。裂解物用于氯化铯密度分析;测量密度,并对氯化铯线性梯度的每个级分进行ttv

tth8拷贝定量。如图45所示,与ttv

tth8质粒相比,ivc ttv

tth8在1.33的预期密度下产生了显著更多的病毒基因组拷贝。
[2834]
1e 07jurkat细胞(人t淋巴细胞细胞系)用体外环化ly2基因组(ly2ivc)或质粒中的ly2基因组进行核转染。转染后4天收获细胞并使用含有0.5%氚和300mm氯化钠的缓冲液裂解,然后进行两轮即时冻融。裂解物用100单位/ml的benzonase处理,然后进行氯化铯密度分析。对氯化铯线性梯度的每个级分进行密度测量和ly2基因组定量。如图46所示,与包含ly2基因组的质粒转染(其在图46中未显示可检测的峰)相比,jurkat细胞中体外环化的ly2基因组的转染导致在预期密度处的尖峰。
[2835]
实例47:指环病毒orf1中保守二级结构基序的鉴定
[2836]
在该实例中,计算模型被用来鉴定指环病毒orf1蛋白的二级结构中的保守基序。使用jpred程序对单个菌株进行二级结构预测。
[2837]
通常,人ttv的胶冻卷结构域的长度为约200个氨基酸(aa)
±
3 aa。示例性胶冻卷结构域的二级结构以5

7 aa的β链开始,然后是3

5 aa无规卷曲、15

16 aa β链、26

28 aa无规卷曲、15

17 aa α螺旋、2 aa无规卷曲、3

4 aa β链、8 aa无规卷曲、10

11 aa β链、5

6 aa无规卷曲、6

7 aa β链、8

14 aa无规卷曲、8

14 aa α

螺旋(在一些情况下可能会分成2个较小的螺旋)、3

4 aa无规卷曲、4

5 aa β链、10 aa无规卷曲、5

6 aa β链、20

21 aa无规卷曲、7

9 aa β链、14

16 aa无规卷曲、5

7 aa β链。图47显示了来自甲型细环病毒、乙型细环病毒和丙型细环病毒进化分枝的示例性指环病毒orf1二级结构的比对。
[2838]
orf1的n22结构域中ynpx2dxgx2n(seq id no:829)基序的二级结构也具有围绕它的保守二级结构。从在基序的位置1处的酪氨酸(y)之后断裂的5

6 aa β链开始,大多数基序排队在8

9 aa无规卷曲中,直到末端天冬酰胺(n),此处另一个7

8 aa β链起始。示例性指环病毒orf1 n22基序序列的比对显示在图48中。基序中的酪氨酸破坏了β链,第二β链从基序的末端天冬酰胺开始。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献