一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

分析RNA用于诊断感染类型的制作方法

2022-09-01 09:28:28 来源:中国专利 TAG:
分析rna用于诊断感染类型
1.本技术是国际申请日为2017年3月2日的国际申请pct/il2017/050270进入中国、申请号为201780014568.0的题为“分析rna用于诊断感染类型”的发明专利申请的分案申请。
2.技术领域和

背景技术:
在本发明的一些实施方案中,本发明涉及与细菌和病毒感染相关的识别标志(signature)和决定子(determinant)的鉴定。更具体地,本发明涉及在具有细菌和病毒感染的受试者中以统计学显著的方式差异表达的rna决定子。
3.抗生素(abx)是世界上最常开处方的药物类型,具有250至300亿美元的全球市场。abx也是世界上最滥用的药物,所有药物中的相当大部分(40-70%)被错误地开处方(linder和stafford 2001; scott和cohen 2001; davey, p.和e. brown等人,2006; cadieux, g.和r. tamblyn等人,2007; pulcini, c.和e. cua等人2007),(“cdc
ꢀ‑ꢀ
get smart: fast facts about antibiotic resistance
”ꢀ
2011)。
4.一种类型的abx滥用是在非细菌性疾病例如病毒感染的情况下施用药物,abx对其是无效的。例如,根据美国疾病控制和预防中心cdc,美国每年有超过6000万错误的abx处方用于治疗流感。abx过量处方(over-prescription)的保健和经济后果包括:(i)全球不必要开处方的抗生素成本,估计每年》100亿美元;(ii)因不必要的abx治疗而产生的副作用正在降低保健质量、引起并发症和延长的住院(例如,变态反应、abx相关性腹泻、肠内酵母等);和(iii)由于过度使用出现细菌的抗性菌株。
5.微生物病原体对抗生素的抗性在世界范围内以加速的速度增加(“cdc
ꢀ‑ꢀ
get smart: fast facts about antibiotic resistance
”ꢀ
2013;
ꢀ“
european surveillance of antimicrobial consumption network (esac-net)
”ꢀ
2014;
ꢀ“
cdc
ꢀ‑ꢀ
about antimicrobial resistance
”ꢀ
2013;
ꢀ“
threat report 2013 | antimicrobial resistance | cdc
”ꢀ
2013),伴随着与抗生素抗性病原体引起的感染相关的发病率和死亡率的增加(“threat report 2013 | antimicrobial resistance | cdc
”ꢀ
2013)。仅在美国,每年至少有200万人感染抗生素抗性细菌,并且至少有23,000人作为这些感染的直接结果而死亡(“threat report 2013 | antimicrobial resistance | cdc
”ꢀ
2013)。在欧盟,估计每年有400,000名患者表现出抗性细菌菌株,其中25,000名患者死亡(“who europe
ꢀ‑
data and statistics”2014)。因此,世界卫生组织(world health organization)已警告,治疗覆盖率将在10年内不足,从而使世界面临进入“抗生素后时代”的风险,其中抗生素将不再有效对抗感染性疾病(“who | antimicrobial resistance
”ꢀ
2013)。cdc认为这一现象是“21世纪世界上最紧迫的健康问题之一”(“cdc
ꢀ‑ꢀ
about antimicrobial resistance
”ꢀ
2013; arias和murray 2009)。
6.抗生素处方不足(under-prescription)也不罕见。例如,在美国,高达15%的成年细菌性肺炎住院患者接受延迟的或无abx治疗,即使在这些情况下,早期治疗可以挽救生命并减少并发症(houck, p.m.和d. w. bratzler等人,2002)。
7.用于感染性疾病诊断的技术有可能减少与abx滥用相关的相关健康和财务负担。
理想地,这种技术应该:(i)准确区分细菌和病毒感染;(ii)迅速(在几分钟内);(iii)能够区分病原菌和作为身体天然菌群一部分的非病原菌;(iv)区分混合性共感染和纯病毒感染;和(v)适用于病原体不可接近的情况(例如,鼻窦炎、肺炎、中耳炎、支气管炎等)。
8.目前的解决方案(例如培养、pcr和免疫测定)不满足所有这些要求:(i)一些测定产生较差的诊断准确性(例如低灵敏度或特异性)(uyeki等人,2009),并限于有限组的细菌或病毒株;(ii)它们经常需要数小时至数天;(iii)它们不区分病原菌和非病原菌(del mar,c 1992),从而导致假阳性;(iv)它们经常无法区分混合的和纯的病毒感染;和(v)它们需要感染部位的直接取样,其中寻找致病剂的痕迹,从而阻止在病原体位于不可接近组织中的情况下的诊断,所述情况是通常的情况。而且,目前可用的诊断方法经常遭受降低的临床效用,这是因为它们不区分微生物的致病菌株和潜在的定居者(colonizers),其可以作为天然小型生物群的一部分存在而不引起感染(kim, shin, 和kim 2009; shin, han, 和kim 2009; jung, lee, 和chung 2010; rhedin等人,2014)。例如,rhedin及同事最近测试了qpcr对急性呼吸道疾病中常见病毒的临床功用(rhedin等人,2014)。作者断定,由于无症状儿童中的高检出率,应谨慎解释包括鼻病毒、肠道病毒和冠状病毒的几种呼吸道病毒的qpcr检测。在分析了无症状患者中不同细菌菌株的检出率后,其它研究得出了类似的结论(bogaert,de groot和hermans 2004; spuesens等人,2013)。
9.因此,仍然存在诊断缺口,这进而常常导致医生或是过量处方abx(“以防万一方法(just-in-case-approach)”),或是abx处方不足(“观望方法(wait-and-see-approach)”)(little, p.s.和i. williamson 1994; little, p. 2005; spiro, d. m.和k. y. tay等人,2006),这两者都具有影响深远的健康和财务后果。
10.因此,需要一种解决这些挑战的快速方法,其准确地区分细菌、病毒、混合和非感染性疾病患者。一种有可能解决这些挑战的方法依赖于监控宿主对感染的免疫应答,而不是直接的病原体检测(cohen等人,2015)。细菌诱导的宿主蛋白如降钙素原、c-反应蛋白(crp)和白细胞介素-6通常用于支持感染的诊断。但是,它们的表现受到患者间变异性的负面影响,包括自症状发作以来的时间、临床综合征和病原体物种(tang等人,2007; limper等人,2010; engel等人,2012; quenot等人,2013; van der meer等人,2005; falk和fahey 2009)。oved等人,2015已开发出一种免疫识别标志,其组合了细菌和病毒诱导的循环宿主蛋白,其可以有助于正确诊断具有急性感染的患者。
11.其它背景技术包括ramilo等人,blood, 2007年3月1日, vol 109, no. 5, 第2066-2077页, zaas等人,sci transl med. 2013年9月18日; 5(203) 203ra126. doi:10.1126/scitranslmed.3006280; 美国专利申请号20080171323、wo2011/132086、wo2013/117746、wo2007011412和wo2004108899 a2。


技术实现要素:

12.根据本发明的一个方面,提供了确定受试者中的感染类型的方法,其包括测量受试者的样品中至少一种rna决定子的表达,其中所述测量在一个外显子或多个外显子处实现,所述外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,由此确定受试者的感染类型。
13.根据本发明的一个方面,提供了选择其表达水平提供关于受试者的感染类型的信
息的rna的外显子的方法,其包括比较源自细菌感染的受试者的样品和源自病毒感染的受试者的样品中在多个外显子处的rna的表达水平,其中选择在细菌感染的受试者和病毒感染的受试者之间提供高于预定水平的差异表达的外显子作为其表达提供关于感染类型的信息的rna的外显子。
14.根据本发明的一个方面,提供了包含至少两种寡核苷酸的试剂盒,其中所述至少两种寡核苷酸中的第一种在第一外显子处与第一rna特异性杂交,且所述至少两种寡核苷酸中的第二种在第二外显子处与第一rna特异性杂交,选择第一和第二外显子,从而使得来自第一外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,且来自第二外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染。
15.根据本发明的一个方面,提供了包含至少两种寡核苷酸的试剂盒,其中所述至少两种寡核苷酸中的第一种在第一外显子处与第一rna特异性杂交,且所述至少两种寡核苷酸中的第二种在第二外显子处与第二rna特异性杂交,选择第一和第二外显子,从而使得来自第一外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,且来自第二外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染。
16.根据本发明的一个方面,提供了在外显子处与rna杂交的引物对,所述外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染。
17.根据本发明的一个方面,提供了阵列,其包含固体支持体和在预定外显子处与第一rna特异性杂交的多核苷酸,所述多核苷酸附着于固体支持体,选择预定外显子,从而使得来自其的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,其中所述阵列包含与不超过3个第一rna的外显子杂交的寡核苷酸。
18.根据本发明的一个方面,提供了阵列,其包含固体支持体、在第一外显子处与第一rna特异性杂交的第一多核苷酸和与第二rna的第二外显子特异性杂交的第二多核苷酸,所述第一和第二多核苷酸附着于固体支持体,选择第一外显子,从而使得来自其的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,且选择第二外显子,从而使得来自其的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,其中所述阵列包含与不超过20种不相同rna杂交的寡核苷酸。
19.根据本发明的实施方案,所述外显子在细菌感染的受试者和病毒感染的受试者之间提供高于预定水平的差异表达。
20.根据本发明的实施方案,与rna的所有外显子相比,所述外显子在源自细菌感染的受试者的样品中提供了与病毒感染的受试者相比最高程度的差异表达。
21.根据本发明的实施方案,所述rna列于表10a或10b中。
22.根据本发明的实施方案,如表10a或10b中所述选择rna的外显子。
23.根据本发明的实施方案,所述样品包含rna。
24.根据本发明的实施方案,所述样品包含cdna。
25.根据本发明的实施方案,使用多种寡核苷酸实现比较。
26.根据本发明的实施方案,所述方法包括:(a)使用多种与rna或由其产生的cdna的不相同外显子杂交的寡核苷酸分析源自细菌感染的受试者的样品中rna的表达水平;(b)使用多种与不相同外显子杂交的寡核苷酸分析源自病毒感染的受试者的样品
中rna的表达水平,其中步骤(a)的多种寡核苷酸对所述外显子与步骤(b)的多种寡核苷酸对所述外显子具有相同的结合严格性。
27.根据本发明的实施方案,步骤(a)的寡核苷酸的核酸序列与步骤(b)的寡核苷酸的核酸序列相同。
28.根据本发明的实施方案,所述方法进一步包括比较rna的每个外显子上的rna的表达水平。
29.根据本发明的实施方案,选择提供最高程度的差异表达的外显子作为其表达提供关于感染类型的信息的rna的外显子。
30.根据本发明的实施方案,在相同的实验条件下进行比较。
31.根据本发明的实施方案,所述样品是全血或其级分。
32.根据本发明的实施方案,所述血液级分样品包含选自淋巴细胞、单核细胞和粒细胞的细胞。
33.根据本发明的实施方案,所述血液级分样品包含血清或血浆。
34.根据本发明的实施方案,多个外显子包含不超过2个外显子。
35.根据本发明的实施方案,多个外显子包含不超过5个外显子。
36.根据本发明的实施方案,所述寡核苷酸附着于可检测部分。
37.根据本发明的实施方案,所述试剂盒包含与不超过3个第一rna的外显子杂交的寡核苷酸。
38.根据本发明的实施方案,所述试剂盒包含与不超过20种rna杂交的寡核苷酸。
39.根据本发明的实施方案,所述试剂盒包含与不超过10种rna杂交的寡核苷酸。
40.根据本发明的实施方案,所述试剂盒包含与不超过3种rna杂交的寡核苷酸。
41.根据本发明的实施方案,所述阵列包含与不超过20种不相同的rna杂交的寡核苷酸。
42.根据本发明的实施方案,所述阵列包含与不超过3个第一rna和/或第二rna的外显子杂交的寡核苷酸。
43.根据本发明的实施方案,所述rna列于表10a或10b中。
44.根据本发明的实施方案,所述寡核苷酸中的至少一种与表10a或10b中所述的rna的外显子杂交。
45.除非另外定义,否则本文使用的所有技术和/或科学术语都具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文描述的那些类似或等同的方法和材料可用于实践或测试本发明的实施方案,但下文描述了示例性方法和/或材料。在有冲突的情况下,将以专利说明书包括定义为准。另外,材料、方法和实施例仅是说明性的,且不意图必然为限制性的。
附图说明
46.仅通过举例的方式,本文中参考附图描述了本发明的一些实施方案。现在详细地具体参考附图,要强调的是,所示的细节是作为示例并且为了说明性地讨论本发明实施方案的。在这方面,连同附图进行的描述使得本领域技术人员明白可以如何实践本发明的实施方案。
47.在附图中:图1是临床研究设计的流程图。
48.图2a-c说明单个外显子在细菌和病毒患者之间差异表达(a. otof基因;b. treml4基因;c. rgs1基因)。x-轴代表基因组坐标;外显子在彩色矩形中显示;虚线描绘细菌和病毒感染之间的log 2变化倍数(其中正数和负数分别指示细菌和病毒感染的超表达)。在图像的底部部分,描绘了差异表达的wilcoxon秩和log 10(p-值)。高度有辨别力的外显子通过红色圆圈标记。
49.图3a-l说明具体单个外显子在细菌和病毒患者之间差异表达。x-轴代表基因组坐标;外显子在彩色矩形中显示;虚线描绘细菌和病毒感染之间的变化倍数(其中正数和负数分别指示细菌和病毒感染的超表达)。在图像的底部部分,描绘了差异表达的-log 10 (t-检验 p-值)。数据基于实施例2中描述的实验。示例性高度有辨别力的外显子通过红色圆圈标记。
具体实施方式
50.在一些实施方案中,本发明涉及与细菌和病毒感染相关的识别标志和决定子的鉴定。更具体地,本发明涉及在具有细菌和病毒感染的受试者中以统计学显著的方式差异表达的rna决定子。
51.在详细解释本发明的至少一个实施方案之前,应理解本发明不必定限于其对于以下描述中阐述的或通过实施例举例说明的细节的应用。本发明能够具有其它实施方案或者能够以各种方式实践或实施。
52.通过分析蛋白质决定子来区分细菌和病毒感染的方法已在本发明人的国际专利申请wo2013/117746中公开。为了设法扩大可以帮助准确诊断的决定子的数目和类型,本发明人现在已经进行了另外的临床实验并且已经鉴定了可以用于该目的的其它决定子。
53.本发明人研究了从具有急性感染的患者获得的血液白细胞的基因表达谱。结果表明,免疫系统对细菌和病毒感染存在差异应答,其可以潜在地用于对急性感染患者进行分类。最初,本发明人鉴定了62种rna决定子,其在测试的细菌和病毒患者中差异表达(表11)。
54.在将本发明付诸实施的同时,本发明人计算了表11中描述的62种基因的外显子水平差异表达,并比较了每种个别外显子与其全长基因的中位数对数变化倍数(log fold change)(表12)。出乎意料地,本发明人发现,决定子的特定外显子在源自细菌和病毒感染的受试者的样品中显示比相应的全长rna更高的差异表达。
55.使用更大的患者群(cohort),本发明人发现了另外的rna决定子,其中特定外显子可用于准确地区分细菌和病毒感染。这些描述于下文实施例部分的表13和14中。
56.所有这些外显子都具有充当诊断生物标志或增强由几种完整或部分rna决定子组成的转录组学识别标志的表现的潜力。例如,本发明人发现全长otof基因是细菌和病毒患者之间的差-中度辨别者(-0.83的log
2-变化倍数;表11),而其外显子的子集是高度有辨别力的(-2.3和-3.9之间的log
2-变化倍数;图2a)并且可潜在地充当有用的生物标志。
57.因此,本教导提示,为了使用rna决定子区分细菌和病毒感染,重要的是选择rna上提供最有辨别力的结果的位置。
58.因此,根据本发明的第一个方面,提供了选择其表达水平提供关于受试者的感染
类型的信息的rna的外显子的方法,其包括比较源自细菌感染的受试者的样品和源自病毒感染的受试者的样品中在多个外显子处的rna的表达水平,其中选择在细菌感染的受试者和病毒感染的受试者之间提供高于预定水平的差异表达的外显子作为其表达提供关于感染类型的信息的rna的外显子。
59.术语“rna决定子”是指其表达水平提供关于受试者的感染类型的信息的rna。所述rna可以编码多肽。在另一个实施方案中,所述rna是非编码rna。
60.可以使用affymetrix数据库和其它公有领域如ucsc基因组浏览器(genome browser)找到rna的外显子的编号(即,基因注释)。对于本技术中的每种rna,外显子的位置在下文实施例部分的表中注释。
61.如本文中所用的,“样品”是指从受试者分离的生物样品,并且可以包括,例如但不限于,全血、血清、血浆、唾液、粘液、呼出的气体、尿、csf、痰、汗、粪便、毛发、精液、活组织检查、鼻漏、组织活检、细胞学样品、血小板、网织红细胞、白细胞、上皮细胞或全血细胞。
62.为了测量rna决定子,优选地,样品是血液样品,其包含白细胞例如淋巴细胞、单核细胞和粒细胞(其排除了红细胞)。在一个实施方案中,样品不是血清样品。
63.排除红细胞的方法是本领域已知的,并且包括例如溶血、离心、沉降、过滤或其组合。
64.在一个实施方案中,本发明的这一方面的样品包含rna。
65.本发明的这一方面的rna样品可包含来自异质细胞群或来自单个细胞群的rna。rna可包含总rna、mrna、线粒体rna、叶绿体rna、dna-rna杂交体、病毒rna、无细胞rna及其混合物。在一个实施方案中,rna样品不含dna。
66.样品可为新鲜的或冷冻的。
67.rna的分离、提取或衍生可通过任何合适的方法进行。从生物样品中分离rna通常包括以这样的方式处理生物样品,从而提取样品中存在的rna并使其可用于分析。产生提取的rna的任何分离方法均可用于本发明的实践中。将理解的是,用于提取rna的特定方法将取决于来源的性质。
68.rna提取的方法是本领域熟知的,并在下文中进一步描述。
69.基于苯酚的提取方法:基于异硫氰酸胍(gitc)/苯酚/氯仿提取的这些单步rna分离方法比传统方法(例如,cscl2超速离心)需要少得多的时间。许多商业试剂(例如 trizol、rnazol、rnawiz)基于这一原理。整个程序可在一小时内完成,以产生高得率的总rna。
70.基于硅胶的纯化方法:rneasy是由qiagen销售的纯化试剂盒。它在旋转柱(spin-column)中使用基于硅胶的膜来选择性地结合大于200个碱基的rna。所述方法快速且不涉及苯酚的使用。
71.基于寡脱氧胸苷酸的mrna亲和纯化:由于细胞rna总库中mrna的低丰度,减少总rna制剂中rrna和trna的量大大增加mrna的相对量。使用寡脱氧胸苷酸亲和层析以选择性富集聚腺苷酸 rna已经实践了超过20年。制备的结果是富集的mrna群,其具有最小的rrna或其它小rna污染。mrna富集对于构建cdna文库和高度期望完整mrna的其它应用是必需的。最初的方法使用寡脱氧胸苷酸缀合的树脂柱层析并且可以是耗时的。最近,更方便的形式例如旋转柱和基于磁珠的试剂盒变得可用。
72.也可在进行本发明的诊断方法之前处理样品。处理样品可涉及以下中的一种或多种:过滤、蒸馏、离心、提取、浓缩、稀释、纯化、干扰组分的灭活、试剂的添加等。
73.在另一个实施方案中,本发明的这一方面的样品包含cdna。
74.对于cdna的合成,模板mrna可直接从裂解的细胞获得,或者可从总rna或mrna样品纯化。可对总rna样品施加力以促进rna分子的剪切,从而使得每个rna分子的平均大小在100-300个核苷酸之间,例如大约200个核苷酸。为了将异质mrna群与细胞中发现的大多数rna分离,可使用各种技术,所述技术基于使用附着于固体支持体的寡脱氧胸苷酸寡核苷酸。这种寡脱氧胸苷酸寡核苷酸的实例包括:寡脱氧胸苷酸纤维素/旋转柱、寡脱氧胸苷酸/磁珠和寡脱氧胸苷酸寡核苷酸包被的板。
75.从rna产生cdna需要合成中间rna-dna杂交体。为此,需要与rna的3'末端杂交的引物。退火温度和时间控制由引物预期与模板退火的效率和要耐受的错配程度两者确定。
76.退火温度通常选择为提供最佳效率和特异性,且通常在约50℃和约80℃之间、通常在约55℃和约70℃之间、且更通常在约60℃和约68℃之间变化。退火条件通常保持一段时间,所述时间在约15秒和约30分钟之间、通常在约30秒和约5分钟之间变化。
77.根据具体实施方案,引物包含polydt寡核苷酸序列。
78.优选地,polydt序列包含至少5个核苷酸。根据另一实施方案,是约5至50个核苷酸,更优选约5-25个核苷酸,并且甚至更优选约12至14个核苷酸。
79.在将引物(例如polydt引物)与rna样品退火后,使用依赖于rna的dna聚合酶通过逆转录合成rna-dna杂交体。用于本发明方法和组合物的合适依赖于rna的dna聚合酶包括逆转录酶(rt)。rt的实例包括但不限于:莫洛尼鼠类白血病病毒(m-mlv)逆转录酶、人免疫缺陷病毒(hiv)逆转录酶、劳斯肉瘤病毒(rsv)逆转录酶、禽类成髓细胞瘤病毒(amv)逆转录酶、劳斯相关病毒(rav)逆转录酶和成髓细胞瘤相关病毒(mav)逆转录酶或其它禽类肉瘤-白血病病毒(aslv)逆转录酶,以及由它们衍生的修饰的rt。参见例如,美国专利号7,056,716。许多逆转录酶,例如来自禽类成髓细胞瘤病毒(amv-rt)和莫洛尼鼠类白血病病毒(mmlv-rt)的那些包含多于一种活性(例如,聚合酶活性和核糖核酸酶活性)并且可以在形成双链cdna分子中起作用。
80.逆转录反应中所需的其它组分包括dntps(datp、dctp、dgtp和dttp)和任选地还原剂如二硫苏糖醇(dtt)和mncl2。
81.在本发明的上下文中的“受试者”可以是哺乳动物(例如,人、狗、猫、马、牛、绵羊、猪、山羊)。根据另一个实施方案,所述受试者是鸟(例如,鸡、火鸡、鸭或鹅)。根据具体实施方案,所述受试者是人。所述受试者可以是雄性或雌性。
82.如本文所用的,“病毒感染的受试者”是指已经被病毒、优选致病性病毒感染的受试者。
83.示例性致病性病毒可以属于以下科:腺病毒科(adenoviridae)、小rna病毒科(picornaviridae)、疱疹病毒科(herpesviridae)、嗜肝dna病毒科(hepadnaviridae)、黄病毒科(flaviviridae)、逆转录病毒科(retroviridae)、正粘病毒科(orthomyxoviridae)、副粘病毒科(paramyxoviridae)、乳多空病毒科(papovaviridae)、多瘤病毒科(polyomavirus)、弹状病毒科(rhabdoviridae)、披膜病毒科(togaviridae)。本发明预期的具体致病性病毒是引起天花、流感、腮腺炎、麻疹、水痘、依波拉出血热或风疹的那些。
84.根据具体实施方案,所述病毒是引起呼吸感染(例如,上呼吸道感染和/或下呼吸道感染)的病毒。
85.因此,根据具体实施方案,所述致病性病毒是流感病毒(例如,甲型流感病毒
ꢀ‑ꢀ
(例如,h1n1、h2n2、h3n2、h5n1、h7n7、h1n2、h9n2、h7n2、h7n3、h10n7和h7n9)、乙型流感病毒或丙型流感病毒)。
86.在另一个实施方案中,所述致病性病毒是副流感病毒(hpiv),包括人副流感病毒1型(hpiv-1)(引起哮吼);人副流感病毒2型(hpiv-2)(引起哮吼和其它上和下呼吸道疾病)、人副流感病毒3型(hpiv-3)(与细支气管炎和肺炎相关)和人副流感病毒4型(hhpiv-4)。
87.在又另一个实施方案中,所述致病性病毒是呼吸道合胞病毒(rsv)。
88.如本文所用的,“细菌感染的受试者”是指已经被细菌、优选致病菌感染的受试者。
89.示例性致病菌包括引起结核病的结核分枝杆菌(mycobacterium tuberculosis)、引起肺炎的链球菌属(streptococcus)和假单胞菌属(pseudomonas)以及引起食物传染疾病的志贺氏菌属(shigella)、弯曲杆菌属(campylobacter)和沙门氏菌属(salmonella)。本发明预期的其它示例性致病菌是引起感染(例如,破伤风、伤寒、白喉、梅毒和hansen病)的那些。
90.如所提及的,本发明的这一方面包括比较源自细菌感染的受试者的样品中的rna在多个外显子处的表达水平与源自病毒感染的受试者的样品中的相同rna在相同的多个外显子处的表达水平。
91.为了使比较准确,优选来自细菌感染的受试者的样品类型与来自病毒感染的受试者的样品类型是相同的。因此,例如,如果细菌样品类型是血液样品,则病毒样品类型也应当是血液样品。作为另一个实例,如果细菌样品包含cdna,则病毒样品也应当包含cdna。
92.优选地,以与病毒受试者的样品相同的方式制备细菌受试者的样品。在一些实施方案中,使用相同的规程用于制备样品。
93.如所提及的,在多个外显子处分析rna的表达水平。根据本发明的这一方面,每个样品分析特定rna的至少两个外显子的表达水平,每个样品分析特定rna的至少三个外显子的表达水平,每个样品分析特定rna的至少四个外显子的表达水平,每个样品分析特定rna的至少五个外显子的表达水平。根据其它实施方案,每个样品分析特定rna的外显子的至少10%,每个样品分析特定rna的外显子的至少20%,每个样品分析特定rna的外显子的至少30%,每个样品分析特定rna的外显子的至少40%,每个样品分析特定rna的外显子的至少50%,每个样品分析特定rna的外显子的至少60%,每个样品分析特定rna的外显子的至少70%,每个样品分析特定rna的外显子的至少80%,每个样品分析特定rna的外显子的至少90%,每个样品分析特定rna的外显子的100%。
94.在一个实施方案中,分析的外显子中的至少一个是3’外显子。在另一个实施方案中,分析的外显子中的至少一个是5’外显子。
95.在一些实施方案中,寡核苷酸用于分析rna在特定外显子处的表达水平。与rna的其它外显子相比,所述寡核苷酸优选与靶外显子有区别地杂交。
96.寡核苷酸(例如,dna或rna寡核苷酸)一般包含互补核苷酸序列的区域,其在严格条件下与靶核酸分子中的至少约8、10、13、16、18、20、22、25、30、40、50、55、60、65、70、80、90、100、120(或中间的任何其它数目)或更多个连续核苷酸杂交。
97.为了鉴定对任何决定子序列特异的寡核苷酸,一般使用从核苷酸序列的5'或3'末端开始的计算机算法检查目的基因/转录物。然后,一般的算法将鉴定限定长度的寡核苷酸,其对于基因是独特的、具有适合于杂交的范围内的gc含量、缺乏可能干扰杂交的预测的二级结构和/或具有其它期望的特征或缺乏其它不期望的特征。
98.在鉴定寡核苷酸后,可在湿或干条件下测试对决定子的特异性。因此,例如,在寡核苷酸是引物的情况下,可测试引物使用pcr扩增决定子序列以产生可检测产物的能力,以及其不能扩增样品中其它决定子的能力。可在凝胶上分析pcr反应的产物,并根据存在和/或大小进行验证。
99.另外或可替代地,可通过计算机分析来分析寡核苷酸的序列,以查看它是否与其它已知序列同源(或能够与其杂交)。可对所选择的寡核苷酸进行blast 2.2.10(基本局部比对搜索工具(basic local alignment search tool))分析(worldwideweb(dot)ncbi(dot)nlm(dot)nih(dot)gov/blast/)。blast程序找到序列之间的局部相似性区域。它将核苷酸或蛋白质序列与序列数据库进行比较,并计算匹配的统计学显著性,从而提供有关“查询”序列的可能身份和完整性的有价值信息。
100.根据另外的实施方案,寡核苷酸的长度为约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。尽管探针的最大长度可以与待检测的靶序列一样长,但取决于其使用的测定类型,其长度一般小于约50、60、65或70个核苷酸。在引物的情况下,其长度一般小于约30个核苷酸。在本发明的具体优选实施方案中,引物或探针在约18至约28个核苷酸的长度内。将理解的是,当附着于固体支持体时,探针的长度可为约30-70、75、80、90、100或更多个核苷酸。
101.本发明这一方面的寡核苷酸不需要反映决定子外显子核酸序列的确切序列(即,不需要完全互补),但必须足够互补以在特定实验条件下与决定子外显子核酸序列杂交。因此,寡核苷酸的序列与靶决定子外显子核酸序列一般具有至少70%同源性,优选至少80%、90%、95%、97%、99%或100%同源性,例如在至少13个或更多个邻接核苷酸的区域上。选择条件从而使得寡核苷酸与决定子外显子核酸序列杂交是有利的,并且使与其它决定子外显子核酸序列的杂交最小化。
102.作为例子,短核酸(长度低于200 bp,例如,长度为13-50 bp)的杂交取决于所期望的严格性可以通过以下杂交规程实现;(i)6
×
ssc和1%sds或3m tmacl,0.01 m磷酸钠(ph 6.8),1 mm edta(ph 7.6),0.5%sds,100μg/ml变性鲑精dna和0.1%的脱脂奶粉的杂交溶液,比tm低1-1.5℃的杂交温度,于比tm低1-1.5℃的3 m tmacl,0.01 m磷酸钠(ph 6.8),1 mm edta(ph 7.6),0.5%sds的最终洗涤溶液(严格杂交条件);(ii)6
×
ssc和0.1%sds或3m tmaci,0.01 m磷酸钠(ph 6.8),1 mm edta(ph 7.6),0.5%sds,100μg/ml变性鲑精dna和0.1%脱脂奶粉的杂交溶液,比tm低2-2.5℃的杂交温度,于比tm低1-1.5℃的3 m tmacl,0.01 m磷酸钠(ph 6.8),1 mm edta(ph 7.6),0.5 %sds的最终洗涤溶液,6
×
ssc的最终洗涤溶液,和在22℃的最终洗涤(严格至中等杂交条件);和(iii)6
×
ssc和1%sds或3m tmaci,0.01 m磷酸钠(ph 6.8),1 mm edta(ph 7.6),0.5%sds,100μg/ml变性鲑精dna和0.1%脱脂奶粉的杂交溶液,比tm低2.5-3℃的杂交温度,和在22℃ 6
×
ssc的最终洗涤溶液(中等杂交溶液)。
103.将理解的是,用于分析源自细菌感染的受试者的样品中特定外显子的表达的寡核
6383 (1995)描述。将寡核苷酸附着于固态基质的有用方法由guo等人, nucleic acids res. 22:5456-5465 (1994)描述。
112.根据另一个实施方案,寡核苷酸是引物对的引物。如本文所用的,术语“引物”是指在适当条件下(例如,在四种不同的核苷三磷酸和聚合剂,如dna聚合酶、rna聚合酶或逆转录酶、dna连接酶等的存在下,在含有任何必需的辅因子的适当的缓冲溶液中和在合适的一个或多个温度下),使用方法如pcr(聚合酶链反应)或lcr(连接酶链反应),充当模板指导的合成的起始点的寡核苷酸。这种模板指导的合成也称为“引物延伸”。例如,可设计引物对以使用pcr扩增dna的区域。这样的对将包括“正向引物”和“反向引物”,其与dna分子的互补链杂交并限定待合成/扩增的区域。本发明这一方面的引物在实验条件下能够连同其对(例如,通过pcr)扩增外显子特异性核酸序列以提供可检测信号,并且在相同的实验条件下不扩增其它决定子核酸序列的外显子以提供可检测信号。
113.本发明的寡核苷酸可通过多种方法中的任一种制备(参见,例如, j. sambrook等人, "molecular cloning: a laboratory manual", 1989, 第2版, cold spring harbour laboratory press: new york, n.y.; "pcr protocols: a guide to methods and applications", 1990, m. a. innis (ed.), academic press: new york, n.y.; p. tijssen "hybridization with nucleic acid probes
‑‑
laboratory techniques in biochemistry and molecular biology (parts i and ii)", 1993, elsevier science; "pcr strategies", 1995, m. a. innis (ed.), academic press: new york, n.y.; 和"short protocols in molecular biology", 2002, f. m. ausubel (ed.), 第5版, john wiley & sons: secaucus, n.j.)。例如,可使用本领域众所周知的多种化学技术中的任一种制备寡核苷酸,包括例如化学合成和基于模板的聚合,如例如在s. a. narang等人, meth. enzymol. 1979, 68: 90-98; e. l. brown等人, meth. enzymol. 1979, 68: 109-151; e. s. belousov等人, nucleic acids res. 1997, 25: 3440-3444; d. guschin等人, anal. biochem. 1997, 250: 203-211; m. j. blommers等人, biochemistry, 1994, 33: 7886-7896; 和k. frenkel等人, free radic. biol. med. 1995, 19: 373-380;和美国专利号4,458,066中描述的。
114.例如,可使用基于亚磷酰胺方法的自动化固相程序制备寡核苷酸。在这一方法中,将每个核苷酸个别添加到生长中的寡核苷酸链的5'-末端,其在3'末端附着到固体支持体上。添加的核苷酸是三价3'-亚磷酰胺的形式,其在5'-位被二甲氧三苯甲基(dimethoxytriyl)(或dmt)基团保护免于聚合。在碱诱导的亚磷酰胺偶联后,温和氧化以产生五价磷酸三酯中间体,且dmt去除为寡核苷酸延伸提供新位点。然后将寡核苷酸从固体支持体上切下,并用氢氧化铵将磷酸二酯和环外氨基脱保护。这些合成可在寡核苷酸合成仪上进行,例如可从perkin elmer/applied biosystems, inc. (foster city, calif.)、dupont (wilmington, del.)或milligen (bedford, mass.)商购的那些。可选地,寡核苷酸可从本领域众所周知的多种商业来源定制和订购,包括,例如midland certified reagent company (midland, tex.)、expressgen, inc. (chicago, ill.)、operon technologies, inc. (huntsville, ala.)和许多其它来源。
115.必要或期望时,本发明的寡核苷酸的纯化可通过本领域众所周知的多种方法中的任一种进行。寡核苷酸的纯化一般通过天然丙烯酰胺凝胶电泳、通过阴离子交换hplc进行,
如例如j. d. pearson和f. e. regnier (j. chrom., 1983, 255: 137-149)所述的,或通过反相hplc(g. d. mcfarland和p. n. borer, nucleic acids res., 1979, 7: 1067-1080)进行。
116.寡核苷酸的序列可以使用任何合适的测序方法来验证,包括但不限于化学降解(a. m. maxam和w. gilbert, methods of enzymology, 1980, 65: 499-560)、基质辅助激光解吸电离飞行时间(maldi-tof)质谱分析法(u. pieles等人, nucleic acids res., 1993, 21: 3191-3196)、碱性磷酸酶和外切核酸酶消化组合后的质谱分析法(h. wu和h. aboleneen, anal. biochem., 2001, 290: 347-352)等。
117.如上文已经提及的,可使用本领域已知的几种方法中的任一种制备修饰的寡核苷酸。此类修饰的非限制性实例包括甲基化、“帽”、用类似物取代一个或多个天然存在的核苷酸和核苷酸间修饰,如,例如,具有不带电荷的键(例如,甲基膦酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等),或带电荷的键(例如,硫代磷酸酯、二硫代磷酸酯等)的那些。寡核苷酸可含有一个或多个另外的共价连接的部分,如,例如蛋白质(例如,核酸酶、毒素、抗体、信号肽、聚-l-赖氨酸等)、嵌入剂(例如,吖啶、补骨脂素等)、螯合剂(例如,金属、放射性金属、铁、氧化性金属等)和烷化剂。寡核苷酸也可通过形成甲基或乙基磷酸三酯或烷基氨基磷酸酯键来衍生化。此外,本发明的寡核苷酸序列也可用标记修饰。
118.在某些实施方案中,在用于扩增/检测测定之前,用可检测的试剂或部分标记检测探针或扩增引物或探针和引物两者。在某些实施方案中,用可检测试剂标记检测探针。优选地,选择可检测试剂,从而使得其产生信号,所述信号可以被测量,并且其强度与被分析样品中的扩增产物的量相关(例如,成比例)。
119.寡核苷酸和可检测试剂之间的缔合可以是共价的或非共价的。标记的检测探针可以通过参入或缀合可检测部分来制备。标记可以直接附着于核酸序列或间接附着(例如,通过接头)。各种长度的接头或间隔臂在本领域中是已知的并且是可商购的,并且可以进行选择以减少空间位阻,或赋予所得标记的分子其它有用或所期望的性质(参见,例如,e. s. mansfield等人, mol. cell. probes, 1995, 9: 145-156)。
120.用于标记核酸分子的方法是本领域众所周知的。关于标记规程、标记检测技术和该领域中的最新发展的综述,参见,例如,l. j. kricka, ann. clin. biochem. 2002, 39: 114-129; r. p. van gijlswijk等人, expert rev. mol. diagn. 2001, 1: 81-91; 和s. joos等人, j. biotechnol. 1994, 35: 135-153。标准核酸标记方法包括:参入放射性试剂,荧光染料(l. m. smith等人, nucl. acids res., 1985, 13: 2399-2412)或酶(b. a. connoly和o. rider, nucl. acids. res., 1985, 13: 4485-4502)的直接附着;使其可免疫化学或通过其它亲和反应检测的核酸分子的化学修饰(t. r. broker等人, nucl. acids res. 1978, 5: 363-384; e. a. bayer等人, methods of biochem. analysis, 1980, 26: 1-45; r. langer等人, proc. natl. acad. sci. usa, 1981, 78: 6633-6637; r. w. richardson等人, nucl. acids res. 1983, 11: 6167-6184; d. j. brigati等人., virol. 1983, 126: 32-50; p. tchen等人, proc. natl. acad. sci. usa, 1984, 81: 3466-3470; j. e. landegent等人, exp. cell res. 1984, 15: 61-72; 和a. h. hopman等人, exp. cell res. 1987, 169: 357-368);和酶介导的标记方法,例如随机引发、切口平移、pcr和用末端转移酶加尾(关于酶促标记的综述,参见,例
如,j. temsamani和s. agrawal, mol. biotechnol. 1996, 5: 223-232)。更近开发的核酸标记系统包括但不限于:uls(universal linkage system),其基于单反应性顺式铂氨衍生物与dna中鸟嘌呤部分的n7位的反应(r. j. heetebrij等人, cytogenet. cell. genet. 1999, 87: 47-52),补骨脂素-生物素,其嵌入核酸中并在紫外线照射时与核苷酸碱基共价键合(c. levenson等人, methods enzymol. 1990, 184: 577-583; 和c. pfannschmidt等人, nucleic acids res. 1996, 24: 1702-1709),光反应性叠氮衍生物(c. neves等人, bioconjugate chem. 2000, 11: 51-55)和dna烷化剂(m. g. sebestyen等人, nat. biotechnol. 1998, 16: 568-576)。
121.多种可检测试剂中的任一种都可以用于本发明的实践中。合适的可检测试剂包括但不限于各种配体,放射性核素(例如,
32
p、
35
s、3h、
14
c、
125
i、
131
i等);荧光染料(对于特定示例性荧光染料,见下文);化学发光剂(如,例如,吖啶酯(acridinium ester)、稳定的1,2-二氧杂环丁烷等);光谱可分辨的无机荧光半导体纳米晶体(nanocrystals)(即,量子点(quantum dots)),金属纳米颗粒(metal nanoparticles)(例如金、银、铜和铂)或纳米簇(nanoclusters);酶(如,例如,用于elisa的那些酶,即,辣根过氧化物酶、β-半乳糖苷酶、萤光素酶、碱性磷酸酶);比色标记(如,例如,染料,胶体金等);磁性标记(如,例如,dynabeads
tm
);和生物素,dioxigenin或其它可获得抗血清或单克隆抗体的半抗原和蛋白质。
122.在某些实施方案中,本发明的检测探针是荧光标记的。众多已知的具有多种化学结构和物理特征的荧光标记部分适合用于本发明的实践。合适的荧光染料包括但不限于荧光素和荧光素染料(例如,异硫氰酸荧光素(fluorescein isothiocyanine)或fitc、萘并荧光素(naphthofluorescein)、4',5'-二氯-2',7'-二甲氧基荧光素、6羧基荧光素或fam),羰花青,部花青,苯乙烯基染料,氧杂菁染料,藻红蛋白,赤藓红,伊红,罗丹明染料(例如,羧基四甲基罗丹明或tamra、羧基罗丹明6g、羧基-x-罗丹明(rox)、丽丝胺罗丹明b、罗丹明6g、罗丹明绿、罗丹明红、四甲基罗丹明或tmr),香豆素和香豆素染料(例如,甲氧基香豆素、二烷基氨基香豆素、羟基香豆素和氨甲基香豆素或amca),oregon green dyes(例如,oregon green 488、oregon green 500、oregon green 514),德克萨斯红,德克萨斯红-x,spectrum red.tm.,spectrum green.tm.,花菁染料(例如,cy-3
tm
、cy-5 tm
、cy-3.5 tm
、cy-5.5 tm
),alexa fluor染料(例如,alexa fluor 350、alexa fluor 488、alexa fluor 532、alexa fluor 546、alexa fluor 568、alexa fluor 594、alexa fluor 633、alexa fluor 660和alexa fluor 680),bodipy染料(例如,bodipy fl、bodipy r6g、bodipy tmr、bodipy tr、bodipy 530/550、bodipy 558/568、bodipy 564/570、bodipy 576/589、bodipy 581/591、bodipy 630/650、bodipy 650/665),irdyes (例如,ird40、ird 700、ird 800)等。对于合适的荧光染料的更多实例和将荧光染料连接于或参入核酸分子的方法,参见,例如,"the handbook of fluorescent probes and research products", 第9版, molecular probes, inc., eugene, oreg。荧光染料以及标记试剂盒可从例如amersham biosciences, inc. (piscataway, n.j.)、molecular probes inc. (eugene, oreg.)和new england biolabs inc. (berverly, mass.)商购获得。
123.使用寡核苷酸分析rna的量的方法是本领域已知的且在下文中概述:rna印迹分析:这一方法涉及检测rna的混合物中的特定rna。通过用防止碱基对之
间的氢键键合的试剂(例如甲醛)处理使rna样品变性,从而确保所有rna分子都具有未折叠的线性构象。然后通过凝胶电泳根据大小分离个别rna分子,并将其转移到硝化纤维素或基于尼龙的膜上,变性的rna粘粘附于所述膜上。然后将膜暴露于标记的dna探针。可使用放射性同位素或酶联核苷酸标记探针。检测可使用放射自显影、比色反应或化学发光。这一方法允许定量一定量的特定rna分子并通过膜上的相对位置确定其身份,所述相对位置指示电泳期间凝胶中的迁移距离。
124.扩增反应:可使用扩增反应进行决定子上的外显子的鉴定。
125.如本文所用的,术语“扩增”是指通过产生所期望序列的多个(即,至少2个)拷贝来增加样品中具体核酸序列群的表现的过程。用于核酸扩增的方法是本领域已知的,并且包括但不限于聚合酶链反应(pcr)和连接酶链反应(lcr)。在一般的pcr扩增反应中,目标核酸序列的量经常比起始样品中的其量放大至少五万倍。“拷贝”或“扩增子”不一定意味着与模板序列的完美序列互补性或同一性。例如,拷贝可以包括核苷酸类似物,例如脱氧肌苷、有意的序列改变(例如通过引物引入的序列改变,所述引物包含可与模板杂交但不互补的序列)和/或在扩增过程中发生的序列错误。
126.一般的扩增反应通过使正向和反向引物(引物对)与样品dna连同任何另外的扩增反应试剂在允许扩增靶序列的条件下接触来进行。
127.术语“正向引物”和“正向扩增引物”在本文中可互换使用,并且是指与靶(模板链)杂交(或退火)的引物。术语“反向引物”和“反向扩增引物”在本文中可互换使用,并且是指与互补靶链杂交(或退火)的引物。正向引物相对于反向引物与靶序列5'杂交。
128.如本文所用的,术语“扩增条件”是指促进引物序列退火和/或延伸的条件。这些条件在本领域中是众所周知的并且取决于所选择的扩增方法。因此,例如,在pcr反应中,扩增条件通常包括热循环,即,反应混合物在两个或更多个温度之间的循环。在等温扩增反应中,尽管可能需要初始温度升高来起始反应,但在没有热循环的情况下发生扩增。扩增条件包括所有反应条件,包括但不限于温度和温度循环、缓冲液、盐、离子强度和ph等。
129.如本文所用的,术语“扩增反应试剂”是指用于核酸扩增反应的试剂,并且可包括但不限于缓冲液,试剂,具有逆转录酶和/或聚合酶活性或外切核酸酶活性的酶,酶辅因子例如镁或锰,盐,烟酰胺腺嘌呤二核酸酶(nad)和脱氧核苷三磷酸(dntp),例如脱氧腺苷三磷酸、脱氧鸟苷三磷酸、脱氧胞苷三磷酸和胸苷三磷酸。本领域技术人员可根据所用的扩增方法容易地选择扩增反应试剂。
130.根据本发明的这一方面,扩增可使用诸如聚合酶链反应(pcr)的技术实现,其包括但不限于等位基因特异性pcr,装配pcr或聚合酶循环装配(polymerase cycling assembly)(pca),不对称pcr,解旋酶依赖性扩增,热启动pcr,序列间特异性pcr(intersequence-specific pcr)(issr),反向pcr,连接介导pcr,甲基化特异性pcr(msp),小引物pcr(miniprimer pcr),多重连接依赖性探针扩增,多重pcr,嵌套式pcr,重叠序列延伸pcr,定量pcr(q-pcr),逆转录pcr(rt-pcr),固相pcr:包括多种含义,包括聚合酶集落扩增(polony amplification)(例如,其中pcr集落在凝胶基质中衍生),桥式pcr(引物与固体支持体表面共价连接),常规固相pcr(其中不对称pcr在带有引物的固体支持体存在下应用,所述引物的序列与水性引物之一匹配)和增强的固相pcr(其中通过使用高tm和嵌套式固体支持体引物,任选应用热

步骤’以有利于固体支持体引发,可以改善常规固相pcr),交
错式热不对称pcr(thermal asymmetric interlaced pcr)(tail-pcr),递降pcr(逐步下降pcr(step-down pcr)),pan-ac和通用快速步移(universal fast walking)。
131.pcr(或聚合酶链反应)技术是本领域众所周知的,并且已公开于例如k. b. mullis和f. a. faloona, methods enzymol., 1987, 155: 350-355和美国专利号4,683,202、4,683,195和4,800,159(其各自整体引入本文作为参考)。在其最简单的形式中,pcr是用于酶促合成具体dna序列的体外方法,其使用两个寡核苷酸引物,所述引物与相对的链杂交并侧接靶dna中的目标区域。多个反应循环导致具体dna片段的指数积累,每个循环包括:变性步骤、退火步骤和聚合步骤("pcr protocols: a guide to methods and applications", m. a. innis (ed.), 1990, academic press: new york; "pcr strategies", m. a. innis (ed.), 1995, academic press: new york; "polymerase chain reaction: basic principles and automation in pcr: a practical approach", mcpherson等人(eds.), 1991, irl press: oxford; r. k. saiki等人, nature, 1986, 324: 163-166)。扩增片段的末端定义为引物的5'末端。能够在pcr反应中产生扩增产物的dna聚合酶的实例包括但不限于:大肠杆菌(e. coli)dna聚合酶i,dna聚合酶i的克列诺片段,t4 dna聚合酶,热稳定dna聚合酶,其分离自水生栖热菌(thermus aquaticus)(taq)(可得自多种来源(例如,perkin elmer))、嗜热栖热菌(thermus thermophilus)(united states biochemicals)、嗜热脂肪芽孢杆菌(bacillus stereothermophilus)(bio-rad)或海滨热球菌(thermococcus litoralis)(“vent”聚合酶, new england biolabs)。如上所述,可通过将mrna逆转录成cdna,并然后进行pcr(rt-pcr)来扩增rna靶序列。可选地,可将单一酶用于两个步骤,如美国专利号5,322,770中所述的。
132.pcr循环的每个步骤的持续时间和温度以及循环数通常根据实际上的严格性要求进行调整。退火温度和时间控制由预期引物与模板退火的效率和要耐受的错配程度两者确定。最优化反应循环条件的能力完全在本领域普通技术人员的知识范围内。尽管反应循环数可根据所进行的检测分析而变化,但它通常为至少15,更通常至少20,并且可最高达60或更高。然而,在许多情况下,反应循环数一般在约20与约40之间变化。
133.pcr循环的变性步骤通常包括将反应混合物加热至升高的温度并将混合物在升高的温度下保持足以使反应混合物中存在的任何双链或杂交的核酸解离的时间段。为了变性,通常将反应混合物的温度升至并在约85℃至约100℃、通常约90℃至约98℃、并且更通常约93℃至约96℃的温度保持约3至约120秒、通常约5至约30秒的时间段。
134.变性后,使反应混合物经受足以使引物退火至混合物中存在的模板dna的条件。通常选择降低反应混合物以达到这些条件的温度以提供最佳效率和特异性,并且通常为约50℃至约70℃、通常约55℃至约70℃、且更通常约60℃至约68℃。退火条件通常保持约15秒至约30分钟、通常约30秒至约5分钟的时间段。
135.在将引物退火至模板dna之后或在引物与模板dna退火期间,使反应混合物经受足以提供用于核苷酸以这样的方式聚合到引物末端的条件,所述方式为,使用与其杂交的dna作为模板,引物以5'至3'方向延伸(即,足以酶促产生引物延伸产物的条件)。为了实现引物延伸条件,一般将反应混合物的温度升高至约65℃至约75℃、通常约67℃至约73℃的温度,并在该温度保持约15秒至约20分钟、通常约30秒至约5分钟的时间段。
136.上述变性、退火和聚合循环可使用一般称为热循环仪或循环变温器的自动化设备进行。可采用的热循环仪描述于美国专利号5,612,473、5,602,756、5,538,871和5,475,610(各自整体引入本文作为参考)中。热循环仪可从例如perkin elmer-applied biosystems(norwalk,conn.)、biorad(hercules,calif.)、roche applied science(indianapolis,ind.)和stratagene(la jolla,calif.)商购获得。
137.使用本发明的引物获得的扩增产物可使用琼脂糖凝胶电泳和通过溴化乙锭染色和暴露于紫外(uv)光显色、或通过扩增产物的序列分析而检测。
138.根据一个实施方案,可实时实现扩增产物的扩增和定量(qrt-pcr)。一般,qrt-pcr方法使用双链dna检测分子来实时测量扩增的产物的量。
139.如本文所用的,短语“双链dna检测分子”是指产生可定量的信号(例如,荧光信号)的双链dna相互作用分子。例如,这种双链dna检测分子可以是荧光染料,其(1)与dna片段或扩增子相互作用,和(2)在存在双链体形成中的扩增子的情况下,以不同于存在分离的扩增子的情况下的波长发射。双链dna检测分子可以是双链dna嵌入检测分子或基于引物的双链dna检测分子。
140.双链dna嵌入检测分子不与引物、扩增子或核酸模板共价连接。检测分子在双链dna存在下增加其发射,并在双链体dna解开时减少其发射。实例包括但不限于溴化乙锭、yo-pro-1、hoechst 33258、sybr gold和sybr green i。溴化乙锭是一种荧光化学药品,其嵌入双链dna片段中的碱基对之间并且通常用于在凝胶电泳后检测dna。当被254 nm至366 nm的紫外光激发时,它于590 nm发射荧光。dna-溴化乙锭复合体产生的荧光是在单链dna存在下的溴化乙锭的约50倍。sybr green i在497 nm处激发并在520 nm处发射。相对于单链dna,在结合双链dna时,sybr green i的荧光强度增加超过100倍。sybr green i的替换物是molecular probes inc.提出的sybr gold。与sybr green i类似,sybr gold的荧光发射在双链体中dna存在下增强,并且当双链dna解开时减少。然而,sybr gold的激发峰在495 nm,且发射峰在537 nm。据报道,sybr gold似乎比sybr green i更稳定。hoechst 33258是一种已知的双苯酰亚胺(bisbenzimide)双链dna检测分子,其与双链体中dna的富含at区域结合。hoechst 33258在350 nm处激发并在450 nm处发射。据报道,在450 nm激发并在550 nm发射的yo-pro-1是双链dna特异性检测分子。在本发明的特定实施方案中,双链dna检测分子是sybr green i。
141.基于引物的双链dna检测分子与引物共价连接,并且当扩增子形成双链体结构时增加或减少荧光发射。当基于引物的双链dna检测分子靠近引物的3'末端附着并且引物末端碱基是dg或dc时,观察到增加的荧光发射。检测分子在末端dc-dg和dg-dc碱基对附近猝灭,并且当检测分子远离引物末端至少6个核苷酸在内部定位时,由于扩增子的双链体形成的结果而去猝灭(dequench)。去猝灭导致荧光发射的相当大增加。这些类型的检测分子的实例包括但不限于荧光素(在488 nm激发并在530 nm发射)、fam(在494 nm激发并在518 nm发射)、joe(在527激发并在548发射)、hex(在535 nm激发并在556 nm发射)、tet(在521 nm激发并在536 nm发射)、alexa fluor 594(在590 nm激发并在615 nm发射)、rox(在575 nm激发并在602 nm发射)和tamra(在555 nm激发并在580 nm发射)。相对照而言,相对于单链dna,一些基于引物的双链dna检测分子在存在双链dna的情况下减少它们的发射。实例包括但不限于罗丹明和bodipy-fi(在504 nm激发并在513 nm发射)。这些检测分子通常与引物
在5'末端dc或dg处共价缀合,并且当扩增子处于双链体时发出较少的荧光。据信,双链体形成时荧光的减少是由于密切接近检测分子的互补链中鸟苷的猝灭或末端dc-dg碱基对的猝灭。
142.根据一个实施方案,基于引物的双链dna检测分子是5'核酸酶探针。这种探针在寡核苷酸的5'或3'末端参入荧光报道分子,且在相对末端参入猝灭剂。扩增过程的第一步涉及加热以使双链dna靶分子变性为单链dna。在第二步期间,正向引物与dna的靶链退火并通过taq聚合酶延伸。然后将反向引物和5'核酸酶探针与这一新复制的链退火。
143.在这一实施方案中,引物对或5'核酸酶探针中的至少一个应与独特的决定子序列杂交。聚合酶从靶链延伸并切割探针。在切割时,报道分子不再因其接近猝灭剂而猝灭,并且荧光被释放。每次复制都将导致探针的切割。结果,荧光信号将与扩增产物的量成比例地增加。
144.rna原位杂交染色:在这一方法中,dna或rna探针附着至细胞中存在的rna分子。通常,首先将细胞固定到显微镜载玻片上以保持细胞结构并防止rna分子降解,且然后使其经受含有标记的探针的杂交缓冲液。杂交缓冲液包括诸如甲酰胺和盐(例如,氯化钠和柠檬酸钠)的试剂,其能够使dna或rna探针与其靶mrna分子原位特异性杂交,同时避免探针的非特异性结合。本领域技术人员能够调节对具体探针和细胞类型的杂交条件(即,温度、盐和甲酰胺的浓度等)。杂交后,洗掉任何未结合的探针,并使用已知方法检测结合的探针。例如,如果使用放射性标记的探针,则载玻片经受照相乳胶,其显示使用放射性标记的探针产生的信号;如果探针用酶进行标记,则加入酶特异性底物以形成比色反应;如果使用荧光标记来标记探针,则使用荧光显微镜显示结合的探针;如果使用标签(例如,洋地黄毒苷、生物素等)来标记探针,则可以在与标签特异性抗体相互作用后检测结合的探针,所述标签特异性抗体可以使用已知方法检测。
145.原位rt-pcr染色:这一方法描述于nuovo gj等人[intracellular localization of polymerase chain reaction (pcr)-amplified hepatitis c cdna. am j surg pathol. 1993, 17: 683-90]和komminoth p等人[evaluation of methods for hepatitis c virus detection in archival liver biopsies. comparison of histology, immunohistochemistry, in situ hybridization, reverse transcriptase polymerase chain reaction (rt-pcr) and in situ rt-pcr. pathol res pract. 1994, 190: 1017-25]中。简而言之,通过将标记的核苷酸参入pcr反应,在固定的细胞上进行rt-pcr反应。使用特定的原位rt-pcr装置进行反应,例如可从arcturus engineering(mountainview,ca)获得的激光捕获显微解剖pixcell i lcm系统。
[0146]
dna微阵列/ dna芯片:可以使用dna微阵列同时分析数千个基因的表达,从而允许在特定的发育过程或生理反应期间分析生物的完整转录程序。dna微阵列由数千个个别基因序列组成,所述基因序列附着于支持体例如玻璃显微镜载玻片表面上的紧密叠集区域(closely packed areas)。已经开发了各种方法用于制备dna微阵列。在一种方法中,用于分析的每个基因的编码区的约1千碱基区段被个别地pcr扩增。使用机器人装置将每个扩增的dna样品应用于玻璃显微镜载玻片表面上的紧密间隔区(closely spaced zones),随后通过热处理和化学处理将其进行加工以将dna序列结合到支持体的表面并使它们变性。一般,这些阵列约为2
×
2cm,且含有约6000个个别的核酸点。在所述技术的变形中,通常长度为20个核苷酸的多个dna寡核苷酸由与支持体表面共价结合的初始核苷酸合成,从而使得在支持体表面上的小正方形区中合成数以万计的相同的寡核苷酸。来自单个基因的多个寡核苷酸序列在载玻片的相邻区域中合成以用于分析该基因的表达。因此,可以在一个载玻片上表示数千个基因。如上所述,这种合成寡核苷酸的阵列在本领域中可称为“dna芯片”,与“dna微阵列”形成对照[lodish等人(eds.). 第7.8章: dna microarrays: analyzing genome-wide expression. in: molecular cell biology, 第4版, w. h. freeman, new york. (2000)]。
[0147]
寡核苷酸微阵列
ꢀ‑ꢀ
在这一方法中,能够与本发明的一些实施方案的多核苷酸特异性杂交的寡核苷酸探针附着于固体表面(例如,玻璃晶片)。每个寡核苷酸探针的长度为约20-25个核酸。为了检测特定细胞样品(例如,血细胞)中本发明一些实施方案的多核苷酸的表达模式,使用本领域已知的方法从细胞样品中提取rna(使用例如,trizol溶液,gibco brl,美国)。可以使用标记的寡核苷酸探针(例如,5'-生物素化的探针)或互补dna(cdna)或rna(crna)的标记的片段进行杂交。简而言之,使用逆转录酶(rt)(例如,superscript ii rt)、dna连接酶和dna聚合酶i从rna制备双链cdna,均根据制造商的说明书(invitrogen life technologies,frederick,md,usa)。为了制备标记的crna,使用例如bioarray high yield rna transcript labeling kit(enzo,diagnostics,affymetix santa clara ca)在生物素化的核苷酸存在下对双链cdna进行体外转录反应。为了有效杂交,可以通过将rna在40 mm tris乙酸盐(acetate)(ph 8.1)、100 mm乙酸钾和30 mm乙酸镁中于94℃温育35分钟来片段化标记的crna。杂交后,洗涤微阵列并使用共焦激光荧光扫描仪扫描杂交信号,所述扫描仪测量与探针阵列结合的标记的crna发射的荧光强度。
[0148]
例如,在affymetrix微阵列(affymetrix
tm
,santa clara,ca)中,阵列上的每个基因都由一系列不同的寡核苷酸探针表示,其中每个探针对由完美匹配寡核苷酸和错配寡核苷酸组成。虽然完美匹配探针具有与特定基因完全互补的序列,因此使得能够测量特定基因的表达水平,但错配探针与完美匹配探针的不同之处在于中心碱基位置处的单碱基取代。使用agilent扫描仪扫描杂交信号,并且microarray suite软件从由完美匹配探针产生的信号中减去由错配探针产生的非特异性信号。
[0149]
将理解的是,可以在不使用外显子特异性寡核苷酸的情况下

例如,通过如下文进一步描述的rna测序,分析来自特定外显子的rna的表达。
[0150]
rna测序:用于rna序列测定的方法是本领域技术人员通常已知的。优选的测序方法是下一代测序方法(next generation sequencing method)或并行高通量测序方法(parallel high throughput sequencing method)。设想的序列方法的一个例子是焦磷酸测序(pyrosequencing),特别是454焦磷酸测序,例如,基于roche 454基因组测序仪。这一方法在油溶液中的水滴内扩增dna,每个液滴含有单个dna模板,所述dna模板附着于单个引物包被的珠上,其然后形成克隆集落。焦磷酸测序使用萤光素酶以产生光以检测添加到新生dna的个别核苷酸,并且组合的数据用于产生序列读数(read-outs)。另一个设想的例子是illumina或solexa测序,例如,通过使用illumina基因组分析仪技术,所述技术基于可逆染料终止剂。dna分子一般附着于载玻片上的引物并扩增,从而形成局部克隆集落。随后可每次添加一种类型的核苷酸,并且洗掉未参入的核苷酸。随后,可采取荧光标记的核苷酸的
图像,并且从dna中化学除去染料,从而允许下一个循环。另一个例子是applied biosystems的solid技术的使用,所述技术采用边连接边测序(sequencing by ligation)。这一方法基于使用固定长度的所有可能寡核苷酸的库(pool),其根据测序的位置进行标记。将这些寡核苷酸退火并连接。随后,dna连接酶对匹配序列的优先连接一般导致提供该位置核苷酸信息的信号。由于一般通过乳剂pcr扩增dna,所以可以将得到的珠(每个仅包含相同dna分子的拷贝)沉积在载玻片上,从而产生与illumina测序相当的量和长度的序列。另一种方法基于helicos的heliscope技术,其中片段被栓系于阵列的聚胸苷酸(polyt)寡聚体捕获。在每个测序循环中,加入聚合酶和单荧光标记的核苷酸,并对阵列进行成像。随后移除荧光标签并重复循环。包括在本发明方法内的测序技术的其它实例是通过杂交测序、通过使用纳米孔测序、基于显微镜的测序技术、微观流体sanger测序或基于微芯片的测序方法。本发明还设想了这些技术的进一步开发,例如,进一步提高序列测定的准确性,或确定生物基因组序列所需的时间等。
[0151]
根据一个实施方案,测序方法包括深度测序(deep sequencing)。
[0152]
如本文所用的,术语“深度测序”是指测序方法,其中在单次测试中多次读取靶序列。单个深度测序运行由在相同靶序列上运行的多个测序反应组成,并且每个测序反应产生独立的序列读数。
[0153]
一个或多个最佳外显子的选择可以完全或部分基于细菌和病毒样品之间的差异表达水平。在一个实施方案中,选择提供最高差异表达的外显子作为最佳外显子。将理解的是,当选择最佳一个外显子/多个外显子时,还可以考虑次要考虑因素,诸如探针的gc含量、探针的长度、探针的二维或三维结构、探针的特异性等。因此,设想由于这些次要考虑因素,选择具有第二或甚至第三最高差异表达的外显子作为最佳外显子。只要差异表达高于预定水平,就可以认为次要考虑因素是相关的并且被考虑在内。
[0154]
一旦已选择最佳外显子,确定感染性受试者的样品中的其表达就可以使得能够诊断感染类型。
[0155]
因此,根据本发明的另一个方面,提供了确定受试者中的感染类型的方法,其包括测量受试者的样品中至少一种rna决定子的表达,其中所述测量在一个外显子或多个外显子处实现,所述外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,由此确定受试者的感染类型。
[0156]
如本文所用的,术语“分析(analyzing)”或“分析(analysis)”、“测量(measuring)”或“测量(measurement)”、或者可选地“检测(detecting)”或“检测(detection)”是指,评估临床或受试者衍生的样品中的决定子的存在、不存在、数量或量(其可以是有效量),包括推导出这种决定子的定性或定量浓度水平。
[0157]
将理解的是,其表达水平以高于预定水平的准确性程度区分细菌和病毒感染的外显子基于差异表达分析,并且可以根据上文所述的方法选择。
[0158]
在一个实施方案中,测量提供rna的所有外显子中细菌和病毒样品之间的最高差异表达的外显子的表达水平。在另一个实施方案中,测量提供比当测量全长rna决定子的表达时提供的更高的准确性(基于差异表达分析)的外显子的表达水平。如上文所提及的,当选择由其分析表达的一个/多个外显子时,也可以考虑次要考虑因素,诸如探针的gc含量、探针的长度、探针的二维或三维结构、探针的特异性、测定中其它探针的身份等。因此,设想
由于这些次要考虑因素,测量来自具有第二或甚至第三最高差异表达(在细菌和病毒样品之间)的外显子的表达水平。只要差异表达高于预定水平,就可以认为次要考虑因素是相关的并且被考虑在内。
[0159]
根据具体实施方案,所述外显子不是3’外显子。
[0160]
全长rna决定子的表达水平可以依赖于用于测量它的阵列的类型而不同地计算。一些阵列依赖于计算基因的3’末端区域的平均值,例如具有位于基因的最3’末端的探针的基于3’的表达阵列(诸如affymetrix u133a和b系列),或一般依赖于从转录物的聚腺苷酸尾引发的经典3’测定。
[0161]
其它阵列(包括实施例部分中描述的human gene 1.0 st阵列(affymetrix))使用分布在基因的全长上的探针,从而提供更完整和准确的总体基因表达图。在这些阵列中,将不同外显子上的多个探针的基因水平分析总结为代表来自同一基因的所有转录物的表达值。
[0162]
术语“准确性”是指测量或计算的量(测试报告值)与其实际(或真实)值的一致程度。临床准确性与真实结果(真阳性(tp)或真阴性(tn)与错误分类结果(假阳性(fp)或假阴性(fn))相比的比例有关,且可表示为灵敏度、特异性、阳性预测值(ppv)或阴性预测值(npv)、matthews相关系数(mcc),或似然、优势比、接收者操作特征(roc)曲线、曲线下面积(auc)以及其它度量。
[0163]
在一个实施方案中,在外显子处测量表达水平,所述外显子代表与rna决定子的所有其它外显子相比如在细菌和病毒样品中测量的最高程度的差异表达。
[0164]
可以测量的示例性rna决定子列于下文表1-4中。
[0165]
表1

表2

表3
表4
对于特定决定子,示例性基因组序列提供于表1-3的每一个中。
[0166]
本发明预期分析每种rna决定子的任何数目的外显子,其中选择的每个外显子都显示高于预定水平的准确性程度(基于差异表达分析)。因此,例如,在一些实施方案中,每种rna决定子测量来自仅1个外显子的表达水平,测量来自不超过2个外显子的表达水平,测量来自不超过3个外显子的表达水平,测量来自不超过4个外显子的表达水平或测量来自不超过5个外显子的表达水平。在一些实施方案中,每种rna决定子测量决定子的外显子的不
超过75%,测量决定子的外显子的不超过50%,测量决定子的外显子的不超过40%,测量决定子的外显子的不超过30%,测量决定子的外显子的不超过20%,测量决定子的外显子的不超过10%。
[0167]
在一个实施方案中,每种rna决定子分析一个外显子,其中所述外显子显示高于预定水平的准确性程度(基于差异表达分析)。
[0168]
在另一个实施方案中,每种rna决定子分析两个外显子,其中所述外显子中的至少一个显示高于预定水平的准确性程度(基于差异表达分析)。进一步考虑每种rna决定子分析两个外显子,其中每个外显子都显示高于预定水平的准确性程度(基于差异表达分析)。优选地,与rna决定子的所有其它外显子相比,所分析的两个外显子中的一个外显子在细菌和病毒样品中呈现最高程度的差异表达。
[0169]
在另一个实施方案中,每种rna决定子分析三个外显子,其中所述外显子中的至少一个显示高于预定水平的准确性程度。进一步考虑每种rna决定子分析三个外显子,其中每个外显子都显示高于预定水平的准确性程度(基于差异表达分析)。优选地,与rna决定子的所有其它外显子相比,所分析的三个外显子中的一个外显子在细菌和病毒样品中呈现最高程度的差异表达。
[0170]
在另一个实施方案中,每种rna决定子分析四个外显子,其中所述外显子中的至少一个显示高于预定水平的准确性程度。进一步考虑每种rna决定子分析四个外显子,其中每个外显子都显示高于预定水平的准确性程度(基于差异表达分析)。优选地,与rna决定子的所有其它外显子相比,所分析的四个外显子中的一个外显子在细菌和病毒样品中呈现最高程度的差异表达。
[0171]
在另一个实施方案中,每种rna决定子分析五个外显子,其中所述外显子中的至少一个显示高于预定水平的准确性程度。进一步考虑每种rna决定子分析四个外显子,其中每个外显子都显示高于预定水平的准确性程度(基于差异表达分析)。优选地,与rna决定子的所有其它外显子相比,所分析的五个外显子中的一个外显子在细菌和病毒样品中呈现最高程度的差异表达。
[0172]
将理解的是,为了增强诊断的准确性,可以分析多于1种rna决定子,其中每种rna决定子可以在如上文所指定的一个或多个外显子处测量。因此,关于两种或更多种rna决定子的信息可以通过使用各种公式组合并在临床上有用,包括统计学分类算法和其它,结合并在许多情况下扩展组合的性能特征超出个别rna决定子的那种。这些具体组合可以显示出可接受的诊断准确性水平,并且当来自多种rna决定子的足够信息在训练的公式中组合时,经常可靠地实现可从一个群体移动到另一个群体的高水平诊断准确性。
[0173]
如何将两个较不特异或较低性能的rna决定子组合成用于预期适应症的新颖和更有用的组合的一般概念是本发明的关键方面。当使用正确的数学和临床算法时,与个别组分相比,多个生物标志经常可以产生更好的性能;这在灵敏度和特异性两者中经常是明显的,并且导致更大的auc。其次,在现有的生物标志中经常存在新的未被察觉的信息,这是因为其是通过新的公式实现提高的灵敏度或特异性水平所必需的。即使对于通常被认为自身具有次优临床性能的生物标志,这种隐藏的信息也可能适用。实际上,单独测量的单个生物标志的高假阳性率方面的次优性能可能非常好地作为生物标志结果中含有一些重要的另外信息的指示物
ꢀ–ꢀ
在没有与第二个生物标志的组合和数学公式的情况下,将无法阐明的
信息。
[0174]
本领域已知的若干统计学和建模算法可用于辅助rna决定子选择的选择方案并最优化组合这些选择方案的算法。统计学工具如因子和交叉生物标志(cross-biomarker)相关/协方差分析允许对小组(panel)构建的更多原理方法。可以有利地使用数学聚类和分类树,其示出了rna决定子之间的欧氏标准化距离。也可采用这种统计学分类技术的途径知情接种(pathway informed seeding),如基于根据个别rna决定子在特定途径或生理功能中的参与选择所述个别rna决定子的许多合理方法。
[0175]
最终,诸如统计学分类算法的公式可以直接用于选择rna决定子并生成和训练将来自多种决定子的结果组合成单个指数所必需的最佳公式。经常使用技术,如前向(根据零潜在解释参数)和后向选择(根据所有可用的潜在解释参数),并且使用信息标准如aic或bic来定量小组性能和诊断准确性与使用的rna决定子数目之间的权衡。在前向或后向选择的小组上的个别rna决定子的位置可以与其为算法提供增量信息内容密切相关,因此贡献的顺序高度依赖于小组中的其它组成rna决定子。可以使用的统计分类算法的另外的实例包括支持向量机(svm)、逻辑回归(logreg)、神经网络、贝叶斯网络和隐马尔可夫模型。
[0176]
可以根据本发明的方面测量的示例性rna决定子对列于表5-7中。
[0177]
表5
表6
表7其它示例性对在下文中提供:
可根据本发明的方面测量的rna决定子的示例性三联体在表8-9中列出:表8
表9可根据本发明的这一方面测量的其它示例性三联体在本文下面提供:
可根据本发明的方面测量的另外的决定子包括病原体(细菌或病毒)特异性rna决定子。这可以进行以帮助鉴定具体病原体。测量可以与上述测量同时发生或接连发生。可以对用于确定患者免疫应答的生物样品(如上文所述)或对不同的患者衍生的生物样品(例如,血液样品;血清样品;唾液;鼻咽样品等)进行测量。在一个实施方案中,在患者衍生的血清样品中测量宿主免疫rna决定子,并在鼻咽样品上进行病原体特异性rna决定子的分析。
[0178]
感染类型可为细菌感染、病毒感染或混合感染(细菌和病毒感染的组合)。
[0179]
感染可为急性或慢性感染。
[0180]
慢性感染是缓慢发展并持续长时间的感染。可导致慢性感染的病毒包括丙型肝炎和hiv。急性和慢性感染之间的一个区别在于,在急性感染期间,免疫系统经常产生针对传染因子的igm 抗体,而感染的慢性期通常特征是igm-/igg 抗体。此外,急性感染引起免疫介导的坏死过程,而慢性感染经常引起炎症介导的纤维变性过程和瘢痕形成(例如,肝脏中的丙型肝炎)。因此,急性和慢性感染可引发不同的潜在免疫学机制。
[0181]
在一个实施方案中,决定子的水平可用于划入(rule in)感染类型。在另一个实施方案中,决定子的水平可用于排除感染类型。
[0182]“划入”感染意味着受试者具有该类型的感染。
[0183]“排除”感染意味着受试者没有该类型的感染。
[0184]
对于已被分类为在细菌感染期间增加的所有决定子(如表11或13中所指定的),当该决定子的水平高于预定水平时,其指示受试者具有细菌感染(例如,当通过在表10a或10b中指定的外显子处分析而测量时;即,划入细菌感染)。
[0185]
对于已被分类为在病毒感染期间增加的所有决定子(如表11或13中所指定的),当该决定子的水平高于预定水平时,其指示受试者具有病毒感染(例如,当通过在表10a或10b中指定的外显子处分析而测量时;即,划入病毒感染)。
[0186]
本发明任何方面的预置/预定水平可为源自群体研究的参考值,包括但不限于具有已知感染的受试者,具有相同或相似年龄范围的受试者,处于相同或相似人种群中的受试者,或相对于正在接受感染治疗的受试者的起始样品。这些参考值可以从统计学分析和/或从数学算法和计算的感染指数获得的群体的风险预测数据导出。还可以使用算法和统计学和结构分类的其它方法来构建和使用参考决定子指数。
[0187]
在本发明的一个实施方案中,预置水平是来自一个或多个不具有感染的受试者
(即,健康和或非感染个体)的对照样品中决定子的量(即,水平)。在另一个实施方案中,在这种测试之后,对这种受试者进行监控和/或定期重复测试诊断相关的时间段(“纵向研究”),以验证感染持续的不存在。这一时间段可为距用于确定参考值的初始测试日期一天、两天、两天到五天、五天、五天到十天、十天、或十天或更多天。此外,对适当存储的历史受试者样品中的决定子的回顾性测量可用于确立这些参考值,从而缩短所需的研究时间。
[0188]
参考值还可以包括源自受试者的决定子的量,所述受试者作为用于感染的治疗和/或疗法的结果而显示出改善。参考值还可以包括源自已通过已知技术确认感染的受试者的决定子的量。
[0189]
细菌感染的参考值的实例是在已被诊断为具有细菌感染的统计学上显著数目的受试者中该决定子的平均浓度或中位数浓度。
[0190]
病毒感染的参考值的实例是在已被诊断为具有病毒感染的统计学上显著数目的受试者中该决定子的平均浓度或中位数浓度。
[0191]
下文表10a和10b提供了外显子列表,其与示例性rna决定子中的其全长基因相比呈现更高程度的差异表达。对于表10a,探针集id和外显子基因组坐标包括在下文实施例1中的表12中。对于表10b,探针集id和外显子基因组坐标包括在下文实施例2中的表13中。
[0192]
表10a
因此,例如,当所述rna是isg15时,所述外显子对应于外显子2、3和/或4;当所述rna是ifi44l时,所述外显子对应于外显子1、3和/或5;
当所述rna是ifi44时,所述外显子对应于外显子2、4、5、6和/或8;当所述rna是rgs1时,所述外显子对应于外显子4和/或5;当所述rna是ifi6时,所述外显子对应于外显子1、4和/或5;当所述rna是aim2时,所述外显子对应于外显子4、5和/或7;当所述rna是ifit2时,所述外显子对应于外显子4;当所述rna是ifit3时,所述外显子对应于外显子2、3、4和/或8;当所述rna是ifit1时,所述外显子对应于外显子3或4;当所述rna是ankrd22时,所述外显子对应于外显子1或3;当所述rna是serping1时,所述外显子对应于外显子4、5、6、7、9、11或12;当所述rna是ifitm3时,所述外显子对应于外显子3和/或4;当所述rna是irf7时,所述外显子对应于外显子1、2、3、7、9和/或12;当所述rna是clec4d时,所述外显子对应于外显子3、4、7和/或8;当所述rna是oas3时,所述外显子对应于外显子3、4、5、7、9、10、12、14和/或15;当所述rna是oas2时,所述外显子对应于外显子1、3、5、9、13和/或17;当所述rna是oasl时,所述外显子对应于外显子1、2、4、5和/或6;当所述rna是epsti1时,所述外显子对应于外显子2、5、6、7、11、12和/或13;当所述rna是ifi27时,所述外显子对应于外显子4、6和/或7;当所述rna是mt2a时,所述外显子对应于外显子1和/或2;当所述rna是xaf1时,所述外显子对应于外显子4、5、6、7、9和/或10;当所述rna是ccl2时,所述外显子对应于外显子4、5和/或6;当所述rna是jup时,所述外显子对应于外显子6、7、8、9、11、15和/或16;当所述rna是phospho1时,所述外显子对应于外显子2和/或3;当所述rna是pstpip2时,所述外显子对应于外显子7、10、12和/或13;当所述rna是c19orf59时,所述外显子对应于外显子6、9和/或10;当所述rna是ffar3时,所述外显子对应于外显子2;当所述rna是cd177时,所述外显子对应于外显子7和/或8;当所述rna是ceacam1时,所述外显子对应于外显子1、2、6、9、13、14和/或16;当所述rna是cd177时,所述外显子对应于外显子2;当所述rna是rsad2时,所述外显子对应于外显子2-6、8和/或9;当所述rna是galm时,所述外显子对应于外显子4-8和/或9;当所述rna是tnfaip6时,所述外显子对应于外显子1、2和/或3;当所述rna是cybrd1时,所述外显子对应于外显子2-5和/或6;当所述rna是cmpk2时,所述外显子对应于外显子1-5和/或6;当所述rna是otof时,所述外显子对应于外显子2、4、5、6、7、10、13、14、16、17、18、21、23、25-28和/或29;当所述rna是eif2ak2时,所述外显子对应于外显子1、2、3、6、8、9、14、16和/或17;当所述rna是cyp1b1时,所述外显子对应于外显子4和/或5;当所述rna是siglec1时,所述外显子对应于外显子2、3 8、10、11、14-17和/或18;当所述rna是mx1时,所述外显子对应于外显子2、4、6、8-16和/或17;
当所述rna是usp18时,所述外显子对应于外显子5、6、9、10和/或11;当所述rna是rtp4时,所述外显子对应于外显子2、3和/或4;当所述rna是plscr1时,所述外显子对应于外显子4、6、8、9、10和/或11;当所述rna是lamp3时,所述外显子对应于外显子1、2和/或3;当所述rna是herc5时,所述外显子对应于外显子2-6、8-11、13、14、16、19、21和/或22;当所述rna是ppbp时,所述外显子对应于外显子1、3和/或5;当所述rna是cxcl10时,所述外显子对应于外显子2和/或3;当所述rna是dx60时,所述外显子对应于外显子3-13、17-19、24、25、29、30、31-33和/或35;当所述rna是hla-dqa1时,所述外显子对应于外显子2、5和/或7;当所述rna是treml4时,所述外显子对应于外显子2、6和/或7;当所述rna是sh3bgrl2时,所述外显子对应于外显子2、3和/或4;当所述rna是f13a1时,所述外显子对应于外显子1、3、8、11、12和/或13;当所述rna是trem176a时,所述外显子对应于外显子2、3和/或5;当所述rna是ly6e时,所述外显子对应于外显子4和/或7;当所述rna是bmx时,所述外显子对应于外显子5-7、9、12、13、14、17-19和/或21;当所述rna是eif1ay时,所述外显子对应于外显子3-6和/或7;当所述rna是uty时,所述外显子对应于外显子5、8、9、14 24和/或25;或当所述rna是hla-dqa1时,所述位置对应于外显子1、2、7和/或8。
[0193]
表10b
可用于区分细菌和病毒感染的特定rna决定子包括例如:rabgap1l的外显子38和/或42;pnpt1的外显子11和/或21;herc6的外显子34和/或30;impa2的外显子4和/或7;tmem123的外显子1;lta4h的外显子17和/或18;enst00000436616的外显子13和/或14;usp41的外显子2和/或3;n383778的外显子13和/或15;mir1182/fam89a的外显子5和/或6;rsad2的外显子14和/或16;mx1的外显子33和/或39;
ifi44l的外显子26和/或27;ifi27的外显子3和/或7。
[0194]
根据本发明的这一方面,mrna是蛋白质的生物前体,并且预期其表达水平的变化先于其蛋白质对应物的变化。因此,蛋白质和rna生物标志在它们的时间动力学模式中可能不同,并且可以在症状发作之前或恢复期之后相互补充以检测感染。因此,将理解的是,除了确定本文所述的rna决定子的水平之外,本发明人还预期将这些测量与已知指示感染类型的多肽决定子的测量相结合。本发明预期的多肽决定子的实例包括wo2013/117746、wo2011/132086、pct申请il2015/051024和pct申请il2015/051201中描述的那些,其各自的内容引入本文作为参考。本发明人预期的其它多肽决定子是本文所述rna决定子的多肽对应物。
[0195]
本发明人预期的多肽的实例是包括但不限于:trail、crp、ip-10、mx1、rsad2、pct、otof、cybrd1、eif2ak2、ngal和cmpk2。
[0196]
试剂盒本发明的一些方面还包括决定子检测试剂,例如以用于诊断感染类型的试剂盒形式包装在一起的寡核苷酸。试剂盒可在分开的容器中包含:寡核苷酸(或者已经与固体基质结合,或者与用于将它们结合到基质的试剂分开包装),对照制剂(阳性和/或阴性),和/或可检测标记,如荧光素、绿色荧光蛋白、罗丹明、花菁染料、alexa染料、萤光素酶、放射性标记等。用于进行测定的说明书(例如,书面的、磁带、vcr、cd-rom等)可包括在试剂盒中。
[0197]
本发明这一方面的试剂盒可包含有助于检测决定子的另外组分,例如酶、盐、缓冲液等,它们是进行检测反应所必需的。
[0198]
因此,根据本发明的另一个方面,提供了包含至少两种寡核苷酸的试剂盒,其中所述至少两种寡核苷酸中的第一种在第一外显子处与第一rna特异性杂交,且所述至少两种寡核苷酸中的第二种在第二外显子处与第一rna特异性杂交,选择所述第一外显子和所述第二外显子,从而使得来自所述第一外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染(基于如上文所述的差异表达数据),且来自所述第二外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染(基于如上文所述的差异表达数据)。
[0199]
在本发明的另一个方面,提供了在外显子处与rna杂交的引物对,所述外显子的表达水平以高于预定水平的准确性程度区分细菌和病毒感染(基于如上文所述的差异表达数据)。
[0200]
根据又另一个方面,提供了包含至少两种寡核苷酸的试剂盒,其中所述至少两种寡核苷酸中的第一种在第一外显子处与第一rna特异性杂交,且所述至少两种寡核苷酸中的第二种在第二外显子处与第二rna特异性杂交,选择第一外显子,以便以高于预定水平的准确性程度区分细菌和病毒感染(基于如上文所述的细菌和病毒样品之间的差异表达数据),且选择第二外显子,以便以高于预定水平的准确性程度区分细菌和病毒感染(基于如上文所述的细菌和病毒样品之间的差异表达数据)。
[0201]
根据本发明的又另一个方面,提供了包含至少两种寡核苷酸的试剂盒,其中所述至少两种寡核苷酸与表10a或表10b中列出的rna决定子的指定外显子之一杂交:寡核苷酸可附着于如上所述的可检测部分。
[0202]
优选地,试剂盒含有许多寡核苷酸,从而使得可以检测不超过20种决定子(例如,
rna)。
[0203]
优选地,试剂盒含有许多寡核苷酸,从而使得可以检测不超过10种决定子(例如,rna)。
[0204]
优选地,试剂盒含有许多寡核苷酸,从而使得可以检测不超过5种决定子(例如,rna)。
[0205]
优选地,试剂盒含有许多寡核苷酸,从而使得可以检测不超过3种决定子(例如,rna)。
[0206]
优选地,试剂盒含有许多寡核苷酸,从而使得可以检测不超过2种决定子(例如,rna)。
[0207]
在一个实施方案中,试剂盒中的检测试剂仅能够检测出现在表1-2中的决定子。
[0208]
在其它实施方案中,试剂盒中的检测试剂仅能够分析出现在表1-4之一中的决定子的表达。
[0209]
在仍然其它实施方案中,试剂盒中的至少一种检测试剂能够分析出现在表1-4之一中的决定子的表达。
[0210]
可以测量的另外的rna决定子包括例如病原体特异性rna决定子。
[0211]
根据进一步的实施方案,本发明的试剂盒包含许多寡核苷酸,从而使得测量来自每种rna决定子不超过1个外显子的表达水平。
[0212]
根据进一步的实施方案,本发明的试剂盒包含许多寡核苷酸,从而使得测量来自每种rna决定子不超过2个外显子的表达水平。根据进一步的实施方案,本发明的试剂盒包含许多寡核苷酸,从而使得测量来自每种rna决定子不超过3个外显子的表达水平。根据进一步的实施方案,本发明的试剂盒包含许多寡核苷酸,从而使得测量来自每种rna决定子不超过4个外显子的表达水平。根据进一步的实施方案,本发明的试剂盒包含许多寡核苷酸,从而使得测量来自每种rna决定子不超过5个外显子的表达水平。
[0213]
如所提及的,本发明还预期使用阵列来测定来自rna的特定外显子的表达水平。
[0214]
因此,根据本发明的另一个方面,提供了阵列,其包含固体支持体和在预定外显子处与第一rna特异性杂交的多核苷酸,所述多核苷酸附着于固体支持体,选择预定外显子,从而使得来自其的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,其中所述阵列包含与不超过3个所述第一rna的外显子杂交的寡核苷酸。
[0215]
根据本发明的又另一个方面,提供了阵列,其包含固体支持体、在第一外显子处与第一rna特异性杂交的第一多核苷酸和与第二rna的第二外显子特异性杂交的第二多核苷酸,所述第一和第二多核苷酸附着于固体支持体,选择所述第一外显子,从而使得来自其的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,且选择所述第二外显子,从而使得来自其的表达水平以高于预定水平的准确性程度区分细菌和病毒感染,其中所述阵列包含与不超过20种不相同rna杂交的寡核苷酸。
[0216]
本发明的一些方面还可用于在许多环境中筛选患者或受试者群体。例如,健康维护组织(health maintenance organization)、公共卫生实体(public health entity)或学校健康计划(school health program)可以筛选一组受试者以鉴定需要干预的那些,如上所述,或用于收集流行病学数据。保险公司(例如,健康、人寿或伤残)可在确定承保范围或定价的过程中筛选申请人,或者筛选现有客户用于可能的干预。在这种群体筛选中收集
的数据,特别是当被诸如感染的状况的任何临床进展限制时,将在例如健康维护组织、公共卫生计划和保险公司的操作中具有价值。这种数据阵列或数据集可以存储在机器可读介质中并且用于许多健康相关的数据管理系统中以提供改进的保健服务、成本有效的保健、改进的保险操作等。参见,例如,美国专利申请号2002/0038227;美国专利申请号us 2004/0122296;美国专利申请号us 2004/0122297;和美国专利号5,018,067。这种系统可以直接从内部数据存储器访问数据或者从一个或多个数据存储站点远程访问数据,如本文进一步详述的。
[0217]
机器可读存储介质可以包括用机器可读数据或数据阵列编码的数据存储材料,当使用编程有用于使用数据的指令的机器时,所述数据存储材料能够用于多种目的。可以在可编程计算机上执行的计算机程序中实现对本发明的生物标志的有效量的测量和/或由那些生物标志得到的风险评价,所述计算机尤其包括处理器、数据存储系统(包括易失性和非易失性存储器和/或存储元件)、至少一个输入设备和至少一个输出设备。程序代码可以应用于输入数据以执行上述功能并生成输出信息。根据本领域已知的方法,输出信息可以应用于一个或多个输出设备。计算机可为例如传统设计的个人计算机、微型计算机或工作站。
[0218]
每个程序都可以以高级过程式或面向对象的编程语言实现,以与计算机系统通信。但是,如果期望,程序可以以汇编语言或机器语言实现。语言可以是编译或解释语言。每个这样的计算机程序都可以存储在可由通用或专用可编程计算机读取的存储介质或设备(例如,rom或磁盘或本公开内容中其它地方定义的其它)上,用于在由计算机读取存储介质或设备时配置和操作计算机以执行本文所述的过程。在本发明的一些方面中使用的健康相关的数据管理系统还可被认为实现为配置有计算机程序的计算机可读存储介质,其中如此配置的存储介质使得计算机以特定的和预先确定的方式操作以执行本文描述的各种功能。
[0219]
在其一些实施方案中,本发明的决定子可以用于产生那些没有感染的受试者的“参考决定子谱”。本文公开的决定子还可以用于产生取自具有感染的受试者的“受试者决定子谱”。可以将受试者决定子谱与参考决定子谱进行比较,以诊断或鉴定具有感染的受试者。可以比较不同感染类型的受试者决定子谱以诊断或鉴定感染类型。在本发明的一些实施方案中,本发明的参考和受试者决定子谱可以包含在机器可读介质中,例如但不限于,诸如可由vcr读取的那些的模拟磁带、cd-rom、dvd-rom、usb闪存介质(flash media)等。这种机器可读介质还可以包含另外的测试结果,例如但不限于临床参数和传统实验室危险因子的测量结果。可选地或另外地,机器可读介质还可以包含诸如病史和任何相关家族史的受试者信息。机器可读介质还可以含有与其它疾病风险算法和计算的指数有关的信息,例如本文所述的那些。
[0220]
治疗方案的有效性可以通过随着时间的过去检测从受试者获得的样品的有效量(可为一种或多种)的决定子并比较检测的决定子的量来监控。例如,可以在受试者接受治疗之前获得第一样品,并且在受试者治疗之后或期间采取一个或多个后续样品。
[0221]
例如,本发明的方法可用于区分细菌和病毒感染(即,细菌和病毒共感染)。这将允许患者得到相应地分层和治疗。
[0222]
在本发明的具体实施方案中,如下提供对于受试者的治疗推荐(即,选择治疗方案):根据公开的方法中的任何一种的方法鉴定受试者中的感染类型(即,细菌或病毒),并且如果受试者被鉴定为具有细菌感染,则推荐受试者接受抗生素治疗;或者如果受试者被
鉴定为具有病毒感染,则推荐抗病毒治疗。
[0223]
在另一个实施方案中,本发明的方法可用于推动另外的靶向诊断,例如病原体特异性pcr、胸x-射线、培养等。例如,根据本发明的实施方案指示病毒感染的诊断可推动使用另外的病毒特异性多重pcr,而根据本发明的实施方案指示细菌感染的诊断可推动使用细菌特异性多重pcr。因此,人们可以降低不必要的昂贵诊断学的成本。
[0224]
在具体实施方案中,如下提供对于受试者的诊断测试推荐:根据任何公开的方法鉴定受试者中的感染类型(即,细菌或病毒感染),并且如果受试者被鉴定为具有细菌感染或混合感染,则推荐测试以确定细菌感染的来源;或者如果受试者被鉴定为具有病毒感染,则推荐测试以确定病毒感染的来源。
[0225]
本发明的性能和准确性度量如上文所指出的,可以多种方式评估本发明的性能以及因此绝对和相对临床有用性。在各种性能评估中,本发明的一些方面意图是提供临床诊断和预后的准确性。诊断或预后测试、测定或方法的准确性涉及测试、测定或方法区分具有感染的受试者的能力,基于受试者是否具有决定子水平的“显著改变”(例如,临床上显著的和诊断上显著的)。“有效量”是指测量适当数目的决定子(其可为一种或多种)以产生与对于该一种或多种决定子的预定截止点(或阈值)不同的“显著改变”(例如,决定子的表达或活性水平),并且因此表明受试者具有该一种或多种决定子是其指示的感染。决定子水平的差异优选是统计学上显著的。如下文所指出的,并且不受本发明的任何限制,实现统计学显著性,并且因此优选的分析、诊断和临床准确性,可能需要在小组(panel)中一起使用几种决定子的组合并与数学算法组合以实现统计学上显著的决定子指数。
[0226]
在疾病状态的分类诊断中,改变测试(或测定)的截止点或阈值通常改变灵敏度和特异性,但是是以定性反比关系的。因此,在评估建议的评估受试者状况的医学测试、测定或方法的准确性和有用性中,人们应始终考虑灵敏度和特异性两者,并注意在报告灵敏度和特异性处的截止点是什么,这是因为灵敏度和特异性在截止点范围内可显著变化。实现这一点的一种方式是通过使用matthews相关系数(mcc)度量标准,所述度量标准取决于灵敏度和特异性两者。当使用本发明的一些方面时,对于大多数分类风险度量,优选使用诸如roc曲线下面积(auc)的统计量,包括所有潜在的截止点值,而对于连续风险度量,优选使用拟合优度和对观察结果或其它黄金标准的校准的统计量。
[0227]
预定水平的可预测性是指所述方法提供可接受水平的临床或诊断准确性。使用这样的统计量,“可接受的诊断准确性程度”在本文中定义为测试或测定(例如,在本发明的一些方面中用于确定临床上显著的决定子存在的测试,其因此表明存在感染类型),其中auc(用于测试或测定的roc曲线下面积)为至少0.60,期望地为至少0.65,更期望地为至少0.70,优选为至少0.75,更优选为至少0.80,且最优选为至少0.85。
[0228]“非常高的诊断准确性程度”是指测试或测定,其中auc(用于测试或测定的roc曲线下面积)为至少0.75,0.80,期望地为至少0.85,更期望地为至少0.875,优选至少0.90,更优选至少0.925,且最优选至少0.95。
[0229]
可选地,所述方法预测感染或对治疗的反应的存在或不存在,总准确性为至少75%,更优选80%、85%、90%、95%、97%、98%、99%或更高的总准确性。
[0230]
可选地,所述方法预测细菌感染或对治疗的反应的存在,灵敏度为至少75%,更优
选80%、85%、90%、95%、97%、98%、99%或更高的灵敏度。
[0231]
可选地,所述方法预测病毒感染或对治疗的反应的存在,特异性为至少75%,更优选80%、85%、90%、95%、97%、98%、99%或更高的特异性。可选地,所述方法以大于0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1.0的mcc预测感染或对治疗的反应的存在或不存在。
[0232]
一般而言,当相关医学学会和医学实践尚未明确定义疾病类别时,在治疗用途的阈值尚未确定,或者不存在用于诊断未病(pre-disease)的黄金标准的情况下,确定诊断准确性的可选方法通常用于连续度量。对于连续的风险度量,计算的指数的诊断准确性度量一般基于曲线拟合和预测的连续值与实际观测值(或历史指数计算值)之间的校准,并利用诸如r平方、hosmer-lemeshow p-值统计量和置信区间的度量。基于历史观察群的预测报告使用这种算法的预测值并不罕见,包括置信区间(通常为90%或95%ci),如在通过genomic health, inc.(redwood city, california)商业化的未来乳腺癌复发风险的测试中。
[0233]
通常,通过定义诊断准确性程度,即roc曲线上的截止点,定义可接受的auc值以及确定构成本发明的决定子的有效量的相对浓度的可接受范围允许本领域技术人员以预定水平的可预测性和性能使用决定子来鉴定、诊断或预测受试者。
[0234]
此外,其它未列出的生物标志将与决定子非常高度相关(对本技术来说,当它们具有0.5或更高的测定系数(r2)时,任何两个变量将被认为是“非常高度相关的”)。本发明的一些方面包括上述决定子的这种功能和统计学等价物。此外,这种另外的决定子的统计学效用基本上取决于多种生物标志之间的互相关联,并且将经常需要任何新的生物标志在小组内操作以阐明潜在生物学的含义。
[0235]
在本发明的一些实施方案中,可以在本发明的实践中检测列出的决定子中的一种或多种。例如,可以检测二(2)、三(3)、四(4)、五(5)、十(10)、十五(15)、二十(20)、四十(40)或更多种决定子。
[0236]
在一些方面,可以检测本文列出的所有决定子。可以从中检测决定子的数目的优选范围包括由选自1,和特别是2、3、4、5、6、7、8、9 10、20或40之间的任何最小值定界的范围。特别优选的范围包括2至5(2-5)、2至10(2-10)、2至20(2-20)或2至40(2-40)。
[0237]
临床算法的构建可以使用任何公式将决定子结果组合成可用于本发明实践的指数。如上所述,但不限于此,除了各种其它指标之外,这种指数可指示概率、可能性、绝对或相对风险、从一种疾病状态转变到另一种疾病状态的时间或速率,或对感染的未来生物标志测量进行预测。这可以针对特定时间段或范围,或针对剩余终生风险(remaining lifetime risk),或者仅作为相对于另一参考受试者群体的指数提供。
[0238]
尽管这里描述了各种优选的公式,但是除了本文和上述定义中提到的那些之外的若干其它模型和公式类型是本领域技术人员众所周知的。所使用的实际模型类型或公式本身可以基于其在训练群体中的结果的性能和诊断准确性特征从潜在模型的范围内选择。公式本身的细节通常可来自相关训练群体中的决定子结果。除了其它用途之外,这种公式可意图将从一种或多种决定子输入导出的特征空间映射到一组受试者类(例如,用于预测受试者的类成员资格为正常、具有感染),以使用贝叶斯方法得出对风险概率函数的估计,或估计类-条件概率,然后使用贝叶斯规则产生类概率函数,如在前一种情况中那样。
[0239]
优选的公式包括广泛种类的统计学分类算法,且特别是判别式分析的使用。判别
式分析的目标是从先前鉴定的一组特征中预测类成员资格。在线性判别式分析(lda)的情况下,鉴定特征的线性组合,其通过一些标准最大化组间的分离。可以使用具有不同阈值的基于本征基因(eigengene)的方法(elda)或基于多变量方差分析(manova)的步进算法鉴定lda的特征。可以执行前向、后向和步进算法,其基于hotelling-lawley统计量最小化不分离的概率。
[0240]
基于本征基因的线性判别式分析(elda)是shen等人(2006)开发的一种特征选择技术。所述公式使用修改的本征分析在多变量框架中选择特征(例如,生物标志),以鉴定与最重要的本征向量相关联的特征。“重要的”被定义为那些本征向量,其解释了试图相对于某个阈值进行分类的样本之间差异的最大方差。
[0241]
支持向量机(support vector machine)(svm)是一种分类公式,其试图找到一个分开两个类的超平面。这一超平面含有支持向量(support vector),恰好离开超平面边界距离的数据点。在数据当前维度中不存在分开超平面的可能情况下,通过采取始变量的非线性函数将数据投影到更大的维度,极大地扩展维度(venables和ripley,2002)。虽然不是必需的,但svm的特征的过滤经常改进预测。可以使用非参数kruskal-wallis(kw)检验鉴定支持向量机的特征(例如,生物标志),以选择最佳单变量特征。随机森林(random forest)(rf,breiman,2001)或递归分区(recursive partitioning)(rpart,breiman等人,1984)也可以单独使用或组合使用,以鉴定最重要的生物标志组合。kw和rf都要求从总数中选择许多特征。rpart使用可用生物标志的子集创建单个分类树。
[0242]
可使用其它公式,以在将个别决定子测量的结果呈现给预测公式之前将它们预处理成更有价值的信息形式。最值得注意的是,根据群体的平均值使用常见的数学变换如对数或逻辑函数将生物标志结果标准化为正态或其它分布情况等都是本领域技术人员众所周知的。特别重要的是基于临床决定子的一组标准化,例如自症状以来的时间、性别、种族或性别,其中具体公式仅用于一类中的受试者或连续组合临床决定子作为输入。在其它情况下,基于分析物的生物标志可以组合成计算的变量,随后将其呈现给公式。
[0243]
除了可能标准化的一个受试者的个别参数值之外,根据d'agostino等人,(2001)jama 286:180-187中概述的技术,或其它类似的标准化和再校准技术,对所有受试者或任何已知受试者类别的总体预测公式本身可基于对群体预期的流行和平均生物标志参数值的调整来再校准或以其它方式调整。这种流行病学调整统计学可通过提供给模型的过去数据的记录连续捕获、确认、改进和更新,所述数据可为机器可读的或其它方式,或偶尔通过对存储的样品的回顾性查询或参考这些参数和统计学的历史研究。可为公式再校准或其它调整的对象的另外的实例包括关于优势比的局限性的pepe, m.s.等人, 2004、与roc曲线有关的cook, n.r., 2007的研究中使用的统计学。最后,分类器公式本身的数值结果可通过其对实际临床群体和研究结果以及观察到的终点的参考进行转化后处理,以校准绝对风险并为分类器的不同数值结果或风险公式提供置信区间。
[0244]
一些决定子可表现出取决于患者年龄的趋势(例如,群体基线可随年龄而上升或下降)。人们可以使用

年龄依赖性标准化或分层(age dependent normalization or stratification)’方案以对年龄相关的差异进行调整。执行年龄依赖性标准化、分层或不同的数学公式可以用于改善区分不同类型感染的决定子的准确性。例如,本领域技术人员可以产生拟合随年龄而变的每种决定子的群体平均水平的函数,并使用它来标准化不同年
龄的个别受试者水平的决定子。另一个例子是根据他们的年龄对受试者分层,并独立确定每个年龄组的年龄特异性阈值或指数值。
[0245]
将理解的是,如果用于诊断感染类型的决定子是位于性染色体上的rna,则患者性别可影响基于rna的诊断识别标志的诊断准确性。因此提出,当使用rna决定子eif1ay和uty(其位于y染色体上)或rna决定子bmx(其位于x染色体上)时,考虑受试者的性别。
[0246]
在本发明的上下文中,可使用以下统计学术语:“tp”是真阳性,意味着准确反映所测试的活性(tested-for activity)的阳性测试结果。例如,在本发明的上下文中,tp为例如但不限于正确地对细菌感染进行分类本身。
[0247]“tn”是真阴性,意味着准确反映所测试的活性的阴性测试结果。例如,在本发明的上下文中,tn为例如但不限于正确地对病毒感染进行分类本身。
[0248]“fn”是假阴性,意味着看起来阴性、但未能揭示情况的结果。例如,在本发明的上下文中,fn为例如但不限于将细菌感染错误地分类为病毒感染。
[0249]“fp”是假阳性,意味着错误地分类于阳性类别的测试结果。例如,在本发明的上下文中,fp为例如但不限于将病毒感染错误地分类为细菌感染。
[0250]“灵敏度”通过tp/(tp fn)或疾病受试者的真阳性分数计算。
[0251]“特异性”通过tn/(tn fp)或非疾病或正常受试者的真阴性分数计算。
[0252]“总准确性”通过(tn tp)/(tn fp tp fn)计算。
[0253]“阳性预测值”或“ppv”通过tp /(tp fp)或所有阳性测试结果的真阳性分数计算。它固有地受到疾病的流行和意图测试的群体的测试前概率(pre-test probability)的影响。
[0254]“阴性预测值”或“npv”通过tn /(tn fn)或所有阴性测试结果的真阴性分数计算。它也固有地受到疾病的流行和意图测试的群体的测试前概率的影响。参见,例如,o’marcaigh as, jacobson rm,
ꢀ“
estimating the predictive value of a diagnostic test, how to prevent misleading or confusing results,
”ꢀ
clin. ped. 1993, 32(8): 485-491,其讨论了测试的特异性、灵敏度和阳性和阴性预测值,所述测试例如临床诊断测试。
[0255]“mcc”(matthews相关系数)计算如下:mcc = (tp * tn
ꢀ–ꢀ
fp * fn) / {(tp fn) * (tp fp) * (tn fp) * (tn fn)}^0.5,其中tp、fp、tn、fn分别是真阳性、假阳性、真阴性和假阴性。注意,mcc值在-1和 1之间变化,分别表示完全错误和完美分类。mcc为0表示随机分类。已经显示mcc对于将灵敏度和特异性结合到单个度量标准中是有用的(baldi,brunak等人,2000)。在不平衡的类大小的情况下,它也可用于测量和最优化分类准确性(baldi,brunak等人,2000)。
[0256]
经常,对于使用连续诊断测试测量的二元疾病状态分类方法,灵敏度和特异性根据pepe等人,
ꢀ“
limitations of the odds ratio in gauging the performance of a diagnostic, prognostic, or screening marker,
”ꢀ
am. j. epidemiol 2004, 159 (9): 882-890通过接收者操作特征(roc)曲线总结,并且由曲线下面积(auc)或c-统计量总结,一种允许只用单个值在测试(或测定)截止点的整个范围内表现测试、测定或方法的灵敏度和特异性的指示物。还参见,例如,shultz,“clinical interpretation of laboratory procedures,
”ꢀ
第14章,teitz, fundamentals of clinical chemistry, burtis和
ashwood (eds.), 第4版1996, w.b. saunders company, 第192-199页;和zweig等人,“roc curve analysis: an example showing the relationships among serum lipid and apolipoprotein concentrations in identifying subjects with coronory artery disease,
”ꢀ
clin. chem., 1992, 38(8): 1425-1428。使用似然函数、优势比、信息理论、预测值、校准(包括拟合优度)和重新分类测量的可选方法根据cook,
ꢀ“
use and misuse of the receiver operating characteristic curve in risk prediction,
”ꢀ
circulation 2007, 115: 928-935总结。
[0257]“准确性”是指测量或计算的量(测试报告值)与其实际(或真实)值的一致程度。临床准确性与真实结果(真阳性(tp)或真阴性(tn)与错误分类结果(假阳性(fp)或假阴性(fn))相比的比例有关,且可表示为灵敏度、特异性、阳性预测值(ppv)或阴性预测值(npv)、matthews相关系数(mcc),或似然、优势比、接收者操作特征(roc)曲线、曲线下面积(auc)以及其它度量。
[0258]“公式”、“算法”或“模型”是采用一个或多个连续或分类输入(此处称为“参数”)并计算输出值的任何数学方程、算法、分析或程序化过程或统计学技术,有时被称为“指数”或“指数值”。“公式”的非限制性实例包括总和、比率和回归算子,例如系数或指数、生物标志值转化和标准化(包括但不限于基于临床决定子的那些标准化方案,例如性别、年龄或种族特点)、规则和指南、统计学分类模型以及对历史群体训练的神经网络。在组合决定子中特别有用的是线性和非线性方程和统计学分类分析,以确定在受试者样品中检测到的决定子水平与受试者具有感染或某种类型感染的概率之间的关联。在小组和组合构建中,特别重要的是结构和语法统计学分类算法,以及指数构建方法,其利用模式识别特征,包括已确立的技术,如互相关联,主成分分析(principal components analysis)(pca),因素转动(factor rotation),逻辑回归(logreg),线性判别式分析(lda),本征基因线性判别式分析(elda),支持向量机(svm),随机森林(rf),递归分区树(rpart),以及其它相关的决策树(decision tree)分类技术,shrunken centroids(sc),stepaic,kth-nearest neighbor,boosting,决策树,神经网络,贝叶斯网络和隐马尔可夫模型等。其它技术可用于存活和事件发生所需的时间危害分析,包括本领域技术人员众所周知的cox、weibull、kaplan-meier和greenwood模型。这些技术中的许多或者与决定子选择技术结合是有用的,例如前向选择、后向选择或逐步选择、给定大小的所有潜在小组的完整列举、遗传算法,或者它们本身在它们自己的技术中可包括生物标志选择方法。这些可以与信息标准相结合,例如akaike的信息标准(aic)或bayes信息标准(bic),以定量另外的生物标志和模型改进之间的权衡,并有助于最小化过度拟合(overfit)。使用这样的技术如bootstrap、leave-one-out(loo)和10-倍交叉验证(10-倍cv),得到的预测模型可在其它研究中验证,或者在它们最初被训练的研究中交叉验证。在各个步骤,可以根据本领域已知的技术通过值置换(value permutation)来估计错误发现率。“健康经济效用函数”是一种公式,它得自在诊断或治疗干预引入护理标准之前和之后,理想化适用患者群体中一系列临床结果的预期概率的组合。它包括对这种干预的准确性、有效性和性能特征,以及与每种结果相关的成本和/或价值测量(效用)的估计,其可得自护理的实际健康系统成本(服务、供应品、设备和药物等)和/或作为导致每一结果的每个质量调整寿命年(quality adjusted life year)(qaly)的估计可接受值得出。跨越所有预测结果,对一个结果预测的群体大小乘以各自结果的预期
效用的乘积的总和是给定护理标准的总健康经济效用。(i)对具有干预的护理标准计算的总健康经济效用与(ii)对没有干预的护理标准的总健康经济效用相比之间的差异导致干预的健康经济成本或价值的总体度量。这本身可在被分析的整个患者组间(或仅在干预组间)分配,以获得每单位干预的成本,并指导诸如市场定位、定价和卫生系统接受度假设的决策。这种健康经济效用函数通常用于比较干预的成本-效益,但也可被转化以估计卫生保健系统愿意支付的每qaly的可接受值,或者新的干预所需的可接受的成本效益临床性能特征。
[0259]
对于本发明的诊断(或预后)干预,由于每个结果(在疾病分类诊断测试中可为tp、fp、tn或fn)具有不同的成本,所以健康经济效用函数基于临床情况和个体结果成本和价值可优先支持灵敏度超过特异性、或ppv超过npv,并且因此提供了另一种健康经济性能和价值的度量,其可与更直接的临床或分析性能度量不同。这些不同的测量和相对权衡通常将仅在完美测试的情况下汇合,具有零错误率(也就是说,零预测的受试者结果错误分类或fp和fn),其所有性能度量将优先于不完美,但是程度不同。
[0260]“分析准确性”指测量过程本身的可再现性和可预测性,并且可在诸如变异系数(cv)、pearson相关以及相同样品或对照用不同时间、用户、设备和/或试剂的一致和校准检验的测量中总结。vasan,2006中也总结了评价新生物标志中的这些和其它考虑因素。
[0261]“性能”是与诊断或预后测试的总体有用性和质量相关的术语,除了其它之外包括临床和分析准确性、其它分析和过程特征,例如使用特征(例如,稳定性,易用性)、健康经济价值以及测试组分的相对成本。这些因素中的任何一个都可为优良性能并因此测试的有用性的来源,并且可通过相关的适当“性能度量标准”例如auc和mcc、结果发生所需的时间、贮存期限等来测量。
[0262]“统计学上显著的”意味着改变大于可能预期单独偶然发生的改变(其可为“假阳性”)。统计学显著性可以通过本领域已知的任何方法确定。常用的显著性度量包括p-值,其表示假设数据点仅是偶然的结果,获得至少与给定数据点一样极端的结果的概率。在p-值为0.05或更小时,结果经常被认为是高度显著的。
[0263]
在本发明的上下文中,可使用以下缩写:抗生素(abx)、不利事件(ae)、任意单位(a.u.)、全血细胞计数(cbc)、病例报告表(crf)、胸x-射线(cxr)、电子病例报告表(ecrf)、美国食品药品监督管理局(fda)、良好临床实践(gcp)、胃肠道(gi)、胃肠炎(ge)、国际协调会议(international conference on harmonization)(ich)、感染性疾病(id)、体外诊断(ivd)、下呼吸道感染(lrti)、心肌梗死(mi)、聚合酶链反应(pcr)、口服(per-oss)(p.o)、经直肠(p.r)、护理标准(soc)、标准操作程序(sop)、尿道感染(uti)、上呼吸道感染(urti)。
[0264]
如本文所用的,术语“约”指
±
10%。
[0265]
术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有(having)”和它们的词形变化指“包括但不限于”。
[0266]
术语“由
……
组成”指“包括且限于”。
[0267]
术语“基本上由
……
组成”指组合物、方法或结构可包括另外的成分、步骤和/或部件,但只有当另外的成分、步骤和/或部件不实质上改变请求保护的组合物、方法或结构的基本和新颖特征时。
[0268]
如本文所用的,单数形式“一(a)”、“一个(an)”和“所述(the)”包括复数参考,除非
biology" volumes i-iii ausubel, r. m., ed. (1994); ausubel等人, "current protocols in molecular biology", john wiley and sons, baltimore, maryland (1989); perbal, "a practical guide to molecular cloning", john wiley & sons, new york (1988); watson等人, "recombinant dna", scientific american books, new york; birren等人(eds) "genome analysis: a laboratory manual series", vols. 1-4, cold spring harbor laboratory press, new york (1998);如列于美国专利号4,666,828; 4,683,202; 4,801,531; 5,192,659和5,272,057中的方法;"cell biology: a laboratory handbook", volumes i-iii cellis, j. e., ed. (1994); "culture of animal cells
ꢀ‑ꢀ
a manual of basic technique" by freshney, wiley-liss, n. y. (1994), third edition; "current protocols in immunology" volumes i-iii coligan j. e., ed. (1994); stites等人(eds), "basic and clinical immunology" (8th edition), appleton & lange, norwalk, ct (1994); mishell和shiigi (eds), "selected methods in cellular immunology", w. h. freeman and co., new york (1980);在专利和科学文献中广泛描述了可用的免疫测定,参见,例如,美国专利号3,791,932; 3,839,153; 3,850,752; 3,850,578; 3,853,987; 3,867,517; 3,879,262; 3,901,654; 3,935,074; 3,984,533; 3,996,345; 4,034,074; 4,098,876; 4,879,219; 5,011,771和5,281,521; "oligonucleotide synthesis" gait, m. j., ed. (1984);
ꢀ“
nucleic acid hybridization" hames, b. d.和higgins s. j., eds. (1985); "transcription and translation" hames, b. d.和higgins s. j., eds. (1984); "animal cell culture" freshney, r. i., ed. (1986); "immobilized cells and enzymes" irl press, (1986); "a practical guide to molecular cloning" perbal, b., (1984)和"methods in enzymology" vol. 1-317, academic press; "pcr protocols: a guide to methods and applications", academic press, san diego, ca (1990); marshak等人, "strategies for protein purification and characterization
ꢀ‑ꢀ
a laboratory course manual" cshl press (1996);所有这些都引入本文作为参考,如同在此完全阐述一样。贯穿本文件自始至终提供了其它一般参考。其中的程序被认为是本领域众所周知的,并且是为了方便读者而提供的。其中包含的所有信息都引入本文作为参考。
[0279]
实施例1单个和多个外显子作为潜在的生物标志可变剪接是基因表达期间的受调节过程,其导致单一基因编码多种蛋白质。在该过程中,基因的特定外显子可以包括在由该基因生产的最终加工的信使rna (mrna)内或从其中排除。因此,某些外显子可以在细菌或病毒患者中差异表达,即使整个全长基因不是如此。实际上,现在已经鉴定了几种基因,对于其,特定外显子的表达模式比全长基因提供更强的差异信号。这些外显子都具有充当诊断生物标志或增强由几种完整或部分rna决定子组成的转录组学识别标志的表现的潜力。
[0280]
材料和方法患者募集:作为

好奇心(curiosity)’临床研究的一部分,前瞻性地募集患者(nct01917461;(oved等人,2015))。适用时,从每个参与者或法定监护人处获得知情同意。
plus mini kit(qiagen,cat.74134)根据制造商推荐的规程纯化总rna。
[0285]
微阵列实验 将总共10μl的200 ng/3μl(66.67 ng/μl)rna转移至微阵列芯片杂交。使用wt cdna合成和wt cdna扩增试剂盒(900672, affymetrix)从200 ng总rna制备扩增的crna。按照制造商的规程,从扩增的crna产生生物素化的单链cdna,并且然后用wt末端标记试剂盒(affymetrix)片段化并标记。将样品与human gene 1.0 st arrays (affymetrix)杂交,其中探针分布在基因的整个长度上,从而提供更完整和准确的总体基因表达图。这一阵列用764,885个不同的探针访问28,869个良好注释的基因。此外,它包含来自exon 1.0 st array的探针子集,其侧重于良好注释的内容。使用affymetrix genechip scanner 3000 7g扫描阵列。然后使用partek genomic suite软件提取原始数据,执行平均探针合计、rma和五分位数标准化(quintile normalization)以及gc含量校正(downey 2006)。
[0286]
统计学分析初步分析基于接受者操作曲线下面积(auc)、matthews相关系数(mcc)、灵敏度、特异性和总准确性。这些度量如下定义:(mcc)、灵敏度、特异性和总准确性。这些度量如下定义:(mcc)、灵敏度、特异性和总准确性。这些度量如下定义:(mcc)、灵敏度、特异性和总准确性。这些度量如下定义:p、n、tp、fp、tn、fn分别为阳性、阴性、真阳性、假阳性、真阴性和假阴性。除非另有说明,否则阳性和阴性分别指具有细菌和病毒感染的患者。
[0287]
结果患者特征研究的儿科患者组包括7名女性(47%)和8名男性(53%),年龄为7个月至16岁。患者表现出影响不同生理系统(例如,呼吸系统、泌尿(urinal)系统、中枢神经系统、全身性的)的多种临床综合征。表10c中总结了研究的患者的详细表征。
[0288]
表10c. 研究的患者的详细描述。uti-尿道感染;urti-上呼吸道感染;wbc-白细胞计数(white blood count)。
rna决定子可以区分细菌和病毒患者研究了使用human gene 1.0 st array (affymetrix)从所述急性感染患者获得的血液白细胞的基因表达谱。结果暗示免疫系统对细菌和病毒感染的不同反应。鉴定在测试的细菌和病毒患者中差异表达的63种rna决定子(表11;与细菌患者基线相比计算log
2-变化倍数(fold change)。本发明人进一步计算了这
些rna决定子在区分细菌和病毒患者中的准确性的度量,包括auc、mcc、总准确性、灵敏度、特异性和wilcoxon秩和p-值(表11)。
[0289]
表11. 差异表达的rna决定子及它们在区分细菌或混合与病毒感染的受试者中的准确性的度量。表达水平的变化计算为log2(变化倍数细菌)-log2(变化倍数病毒)。
然后计算表11中描述的62种基因的外显子水平差异表达,并将每个个别外显子的中位数对数变化倍数与其全长基因进行比较(表12,下文)。
[0290]
表12-在细菌和病毒患者中差异表达的62种基因的外显子水平分析。从表11中描述的6名细菌和9名病毒患者获得的表达水平数据。探针集id基于affymetrix芯片数据。与完整基因的比较计算为绝对中位数对数变化倍数(外显子i)
ꢀ‑ꢀ
绝对中位数对数变化倍数(全长基因);" "和"-"代表与全长基因相比单个外显子的差异表达的更高和更低程度。
[0291] 如从表11和12可以看出的,发现全长otof基因是细菌和病毒患者之间的中度鉴别者(-0.83的log
2-变化倍数;表3),而其外显子的子集是高度有辨别力的(-2.3和-3.9之
间的log
2-变化倍数;图2a,表12)并且可能潜在地充当有用的生物标志。类似地,treml4的外显子2和7比全长基因提供更多信息(与-1.64相比-3.76和-3.62的log
2-变化倍数;图2b,表11和12);rgs1的外显子5比全长基因提供更多信息(与-0.53相比-1.93的log
2-变化倍数;图2c,表11和12)。
[0292]
实施例2全转录组表达分析以鉴定单个和多个外显子,用于区分具有细菌和病毒感染的患者为了进一步鉴定在细菌或病毒患者中差异表达的外显子,即使整个全长基因不是如此,本发明人对具有细菌和病毒感染的充分表征的患者的大群进行了全转录组分析。
[0293]
材料和方法患者募集作为

好奇心’和

定制治疗(tailored-treatment)’临床研究的一部分,前瞻性地募集患者(nct01917461和nct02025699)。适用时,从每个参与者或法定监护人处获得知情同意。感染性疾病群的算入标准包括:临床怀疑急性感染性疾病,自症状发作的峰值发热》 37.5℃,且症状持续时间≤12天。对照组的算入标准包括:非感染性疾病(例如创伤、中风和心肌梗死)的临床印象或健康受试者。排除标准包括:登记前两周内任何急性感染性疾病发作的证据;诊断为先天性免疫缺陷;目前采用免疫抑制或免疫调谐疗法治疗;活动性恶性肿瘤,已证实或疑似的人免疫缺陷病毒(hiv)-1、乙型肝炎病毒(hbv)或丙型肝炎病毒(hcv)感染。重要的是,为了使得能够广泛的一般化,登记时的抗生素治疗不导致从研究排除。研究工作流程概述在图1中描绘。
[0294]
登记过程和数据收集:如实施例1那样。
[0295]
微生物学调查:如实施例1那样。
[0296]
确立参考标准:如实施例1那样。
[0297]
样品、程序和rna纯化:将静脉血样品收集在含edta的cbc管中,并在4℃就地储存最长达5小时,并且随后分级分离成血浆和细胞沉淀。使用el缓冲液(qiagen,cat 79217)在室温(rt)裂解红细胞。将白细胞在rlt缓冲液(qiagen,cat 79216)中裂解,并通过qiashredder匀浆器(qiagen,cat 79654)匀浆。根据制造商推荐的规程,使用rneasy
™ꢀ
micro kit (qiagen, cat. 74004)从400μl裂解的白细胞纯化总rna。
[0298]
微阵列实验:转移总共3μl的255 ng/3μl(85 ng/μl)rna,并对用genechip
™ꢀ
whole transcript (wt) expression arrays的全转录组表达分析作好准备。使用genechip
™ꢀ
wt plus reagent kit (902310, affymetrix),遵从制造商的规程,从255 ng总rna制备扩增的ss-cdna。将样品与genechip human transcriptome arrays 2.0(hta-affymetrix)杂交,其为用于所有转录物同种型的基因表达谱分析的最高分辨率微阵列。hta每个外显子展示约10个探针,并且每个外显子-外显子剪接点展示4个探针。这一阵列访问》245,000个编码转录物、》 40,000个非编码转录物和》339,000个覆盖外显子-外显子接界的探针集。使用affymetrix genechip scanner 3000 7g扫描阵列。
[0299]
统计学分析:如实施例1那样进行初步分析。
[0300]
结果患者特征研究的患者组包括71名儿童和59名成年人,并且性别平衡(65名女性和65名男性)。所述群包括51名具有细菌感染的患者和79名具有病毒感染的患者,如上所述由
专家小组确定的。此外,研究了13名非感染性患者(作为对照)。患者表现出影响不同生理系统(例如,呼吸系统、泌尿系统、中枢神经系统、全身性的)的多种临床综合征。
[0301]
单个和多个外显子可以区分细菌和病毒患者研究了使用genechip human transcriptome arrays 2.0(hta-affymetrix)从所述急性感染患者获得的血液白细胞的基因表达谱。本发明人鉴定了140种另外的编码和非编码rna决定子(除了实施例1中呈现的那些之外),对于所述rna决定子,一个或多个个别外显子与其完整基因相比呈现改善的差异表达。本发明人进一步计算了这些外显子在区分细菌和病毒患者中的准确性的度量,包括auc、灵敏度、特异性和t-检验p-值(表13)。
[0302]
表14描述了表13中包括的全部基因的表达水平,以及它们在区分细菌和病毒患者中的准确性的度量。
[0303]
表13-在细菌和病毒患者中差异表达的140种rna决定子的外显子水平分析。探针集id基于genechip human transcriptome arrays 2.0 (hta-affymetrix)数据。与完整基因的比较计算为绝对变化倍数(外显子i)
ꢀ‑ꢀ
绝对变化倍数(全长基因);仅包括与全长基因相比呈现更高的单个外显子的差异表达的外显子。
[0304]
表14-差异表达的rna决定子(编码和非编码)及其在区分细菌(“b”)与病毒(“v”)感染的受试者中的准确性的度量
尽管已经结合其具体实施方案描述了本发明,但显然许多替代、修改和变化对于本领域技术人员来说将是显而易见的。因此,意图包含落入所附权利要求的精神和广泛范围内的所有这些替代、修改和变化。
[0305]
本说明书中提及的所有出版物、专利和专利申请均整体引入本说明书中作为参考,其程度如同每个个别的出版物、专利或专利申请被具体和个别地指出引入本文作为参考一样。另外,本技术中任何参考文献的引用或确定不应被解释为承认这样的参考文献可用作本发明的现有技术。在使用章节标题的范围内,它们不应被解释为必定是限制性的。
[0306]
参考文献
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献