一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

结肠直肠癌和/或进行性腺瘤的检测的制作方法

2022-06-22 20:44:54 来源:中国专利 TAG:


1.本发明大体上涉及用于检测和/或预先筛查结肠直肠癌和/或进行性腺瘤的方法和试剂盒。在某些实施方式中,本文所述的方法和试剂盒利用人类基因组中已鉴定的差异甲基化区域作为标志物来确定受试者中结肠直肠癌和/或进行性腺瘤的存在和/或风险。


背景技术:

2.癌症筛查是癌症预防、诊断和治疗的重要组成部分。根据一些报告,结肠直肠癌(crc)已被鉴定为世界上第三大最常见的癌症类型和频率第二大的癌症死亡原因。根据一些报道,每年有超过180万例新发结肠直肠癌病例,约881,000人死于结肠直肠癌,占癌症死亡人数的约十分之一。建议进行定期结肠直肠癌筛查,尤其是50岁以上的个体。此外,50岁以下的个体的结肠直肠癌的发病率随着时间的推移而增加。统计数据表明,目前的结肠直肠癌筛查技术是不够的。尽管随着时间的推移有所改善,但目前只有约40%至44%的结肠直肠癌在早期、局部阶段通过筛查被检测到。这至少部分是由于当前筛查技术的灵敏度和/或特异性不足。目前推荐的技术包括对50岁以上的人进行结肠镜检查和/或粪便血液检测。
3.大多数结肠直肠癌起源于结肠息肉,根据组织学,结肠息肉最初表现为良性。因此,结肠息肉的先进检测和去除是结肠癌筛查的重要组成部分。然而,仅基于组织病理学分类很难确定哪些息肉会发展为浸润性癌症。对息肉的组织病理学分类通常对在例如结肠镜检查期间从结肠组织切除的样品进行,分类为进行性腺瘤的息肉具有进展为恶性肿瘤的趋势。进行性腺瘤被归类为具有一项或多项以下特征:尺寸大(即大于1厘米的腺瘤);具有高度不典型增生;具有突出的绒毛成分;和/或具有锯齿状特征。然而,即使当根据上述分类将腺瘤分类为进行性腺瘤时,腺瘤也可能不会进展为浸润性癌。
4.不希望受任何特定理论的束缚,进展为浸润性癌的腺瘤或息肉将获得和积累不同于正常组织的遗传改变。通过鉴定这些不同的改变,可以开发分子指纹来帮助确定腺瘤是否会进展为浸润性癌。开发用于确定晚期癌和结肠直肠癌的分子指纹的工具和技术将有助于在早期阶段鉴定结肠直肠癌。因此,需要工具和筛查技术来准确筛查早期阶段的结肠直肠癌。


技术实现要素:

5.本公开尤其提供用于结肠直肠癌和/或进行性腺瘤筛查的方法和与其相关的组合物。在本文具体公开的各种实施方式中,本公开提供用于结肠直肠癌和/或进行性腺瘤筛查的方法,其包括鉴定在人类受试者的dna的差异甲基化区域(dmr)中发现的一个或多个甲基化位点中的至少一个的甲基化状态。在本文具体公开的各种实施方式中,本公开提供了用于结肠直肠癌和/或进行性腺瘤筛查的方法,其包括筛查cfdna(无细胞dna),例如ctdna(循环肿瘤dna)中一种或多种甲基化生物标志物的甲基化状态。在各种实施方式中,本公开提供了用于结肠直肠癌和/或进行性腺瘤筛查的方法,其包括使用msre-qpcr筛查cfdna,例如ctdna中的一种或多种甲基化生物标志物的甲基化状态。本文提供的各种组合物和方法提
供足以用于结肠直肠癌和/或进行性腺瘤筛查的临床应用的灵敏度和特异性。本文提供的各种组合物和方法可用于通过分析受试者的可及组织样品,例如作为血液或血液成分(例如,cfdna,例如,ctdna)、结肠直肠组织或粪便的组织样品,进行结肠直肠癌和/或进行性腺瘤筛查。
6.在某些实施方式中,本文公开的任何方法都可以在体外使用。
7.在一个方面,本公开提供了一种(i)筛查结肠直肠癌,或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括确定在表1或表7中列出的人类受试者dna的差异甲基化区域(dmr)内发现的至少一个甲基化位点的甲基化状态。
8.在如前一段中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个dmr中的每一个,确定在该dmr内发现的至少三个甲基化位点的甲基化状态。
9.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个dmr中的每一个,确定在该dmr内发现的至少四个甲基化位点的甲基化状态。
10.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个dmr中的每一个,确定在该dmr内发现的至少五个甲基化位点的甲基化状态。
11.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上dmr中的每一个,确定在该dmr内发现的至少一个甲基化位点的甲基化状态。
12.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上dmr中的每一个,确定在该dmr内发现的至少三个甲基化位点的甲基化状态。
13.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上dmr中的每一个,确定在该dmr内发现的至少四个甲基化位点的甲基化状态。
14.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上dmr中的每一个,确定在该dmr内发现的至少五个甲基化位点的甲基化状态。
15.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上dmr中的每一个,确定在该dmr内发现的至少一个甲基化位点的甲基化状态。
16.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上dmr中的每一个,确定在该dmr内发现的至少三个甲基化位点的甲基化状态。
17.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上dmr中的每一个,确定在该dmr内发现的至少四个甲基化位点的甲基化状态。
18.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上dmr中的每一个,确定在该dmr内发现的至少五个甲基化位点的甲基化状态。
19.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上dmr中的每一个,确定在该dmr内发现的至少一个甲基化位点的甲基化状态。
20.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上dmr中的每一个,确定在该dmr内发现的至少三个甲基化位点的甲基化状态。
21.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上dmr中的每一个,确定在该dmr内发现的至少四个甲基化位点的甲基化状态。
22.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上dmr中的每一个,确定在该dmr内发现的至少五个甲基化位点的甲基化状态。
23.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个
以上dmr中的每一个,确定在该dmr内发现的至少三个甲基化位点的甲基化状态。
24.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上dmr中的每一个,确定在该dmr内发现的至少四个甲基化位点的甲基化状态。
25.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上dmr中的每一个,确定在该dmr内发现的至少五个甲基化位点的甲基化状态。
26.在如前面段落中具体提及的各种实施方式中,dmr包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
27.在如前面段落中具体提及的各种实施方式中,该方法包括确定与参照相比,至少一个甲基化位点是否被甲基化(例如,其中参照是从已被确认为不患有进行性腺瘤或结肠直肠癌的一个或多个人类受试者群体获得的dna),其中甲基化指示(i)结肠直肠癌,(ii)进行性腺瘤,或(iii)结肠直肠癌和/或进行性腺瘤。
28.在如前一段落中具体提及的各种实施方式中,其中该方法包括确定在表2中列出的每个dmr内发现的至少一个甲基化位点的甲基化状态。
29.在如前面段落中具体提及的各种实施方式中,该方法包括确定在表3中列出的每个dmr内发现的至少一个甲基化位点的甲基化状态。
30.在如前面段落中具体提及的各种实施方式中,该方法包括确定在表4中列出的每个dmr内发现的至少一个甲基化位点的甲基化状态。
31.在如前面段落中具体提及的各种实施方式中,一个或多个dmr通过如表5中所列的寡核苷酸引物对扩增。
32.在如前面段落中具体提及的各种实施方式中,人类受试者的dna分离自选自由人类受试者的组织(例如结肠直肠组织,例如息肉、腺瘤)、血液、血浆、尿液、唾液和粪便组成的组中的成员。
33.在如前面段落中具体提及的各种实施方式中,dna是人类受试者的无细胞dna。
34.在如前面段落中具体提及的各种实施方式中,受试者在筛查时没有结肠直肠癌和/或进行性腺瘤的症状。
35.在如前面段落中具体提及的各种实施方式中,所述受试者先前进行过结肠直肠癌和/或进行性腺瘤筛查。
36.在如前面段落中具体提及的各种实施方式中,受试者在过去10年内、过去5年内、过去4年内、过去3年内、过去2年内或过去1年内已进行过结肠直肠癌和/或进行性腺瘤筛查。
37.在如前面段落中具体提及的各种实施方式中,受试者先前的进行性腺瘤和/或结肠直肠癌筛查已诊断出所述受试者没患有(i)结肠直肠癌、(ii)进行性腺瘤或(iii)进行性腺瘤和/或结肠直肠癌。在该段落和前面段落中具体提及的各种实施方式中,已诊断出所述受试者没患有(i)结肠直肠癌、(ii)进行性腺瘤或(iii)进行性腺瘤和/或结肠直肠癌的先前进行性腺瘤和/或结肠直肠癌筛查是在一年内。
38.在如前面段落中具体提及的各种实施方式中,已诊断出受试者没患有进行性腺瘤和/或结肠直肠癌的先前进行性腺瘤和/或结肠直肠癌筛查是结肠镜检查。
39.在如前面段落中具体提及的各种实施方式中,该方法包括早期结肠直肠癌的诊断
(例如,其中所述结肠直肠癌是0期、i期、iia期、iib期或iic期结肠直肠癌)。
40.在如前面段落中具体提及的各种实施方式中,该方法包括早期结肠直肠癌的诊断,其中所述癌尚未转移。
41.在如前面段落中具体提及的各种实施方式中,使用选自由甲基化敏感性限制酶定量聚合酶链式反应(msre-qpcr)、甲基化特异性pcr、甲基化特异性核酸酶辅助的小等位基因富集pcr和杂交捕获靶向下一代测序组成的组中的一种或多种方法确定甲基化状态。
42.在如前面段落中具体提及的各种实施方式中,甲基化状态使用全基因组亚硫酸氢盐测序来确定。
43.在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
44.在另一个方面,本公开提供了一种用于(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查是否存在结肠直肠癌和/或进行性腺瘤的甲基化特异性限制酶定量聚合酶链式反应(msre-qpcr)的方法,该方法包括:(a)将人类受试者的dna与一种或多种甲基化特异性限制酶接触;和(b)对酶消化的dna或其扩增子进行qpcr,以确定dna的一个或多个区域的甲基化状态,其中dna的一个或多个区域中的每一个包含表1的一个或多个dmr的至少一部分,每部分的长度为至少10、至少15、至少20、至少24、至少30、至少40、至少50、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少1000个以上碱基对。
45.在如前一段中具体提及的各种实施方式中,其中dna的一个或多个区域中的至少一个被相应的寡核苷酸引物对扩增(例如,其中引物对包含正向引物和反向引物)。
46.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域中的每一个包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
47.在如前面段落中具体提及的各种实施方式中,相应的寡核苷酸引物对是表5中列出的寡核苷酸引物对。在本文和前面段落中具体提及的各种实施方式中,相应寡核苷酸引物对的正向引物与表5中列出的正向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性。
48.在如前面段落中具体提及的各种实施方式中,相应寡核苷酸引物对的反向引物与表5中列出的反向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性。
49.在如前面段落中具体提及的各种实施方式中,dna分离自选自由人类受试者的组织(例如结肠直肠组织,例如息肉、腺瘤)、血液、血浆、尿液、唾液和粪便组成的组的成员。
50.在如前面段落中具体提及的各种实施方式中,dna是人类受试者的无细胞dna。
51.在如前面段落中具体提及的各种实施方式中,该方法提供的检测结肠直肠癌的灵敏度为至少0.67。在本段和前面段落中具体提及的各种实施方式中,该方法提供的检测结肠直肠癌的灵敏度为至少0.78。
52.在如前面段落中具体提及的各种实施方式中,该方法提供的用于检测进行性腺瘤和结肠直肠癌的组合的总体灵敏度为至少0.48。在本段和前面段落中具体提及的各种实施方式中,该方法提供的用于检测进行性腺瘤和结肠直肠癌的组合的总体灵敏度为至少0.53。
53.在如前面段落中具体提及的各种实施方式中,该方法提供的特异性为至少0.9。在本段和前面段落中具体提及的各种实施方式中,该方法提供的特异性为至少0.93。
54.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域包含表2的每个dmr。
55.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域中的每一个与表2的相应dmr具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表2的相应dmr。
56.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域包含表3的每个dmr。
57.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域中的每一个与表3的相应dmr具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表3的相应dmr。
58.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域包含表4的每个dmr。
59.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域中的每一个与表4的相应dmr具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表4的相应dmr。
60.在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
61.在另一个方面,本公开提供了用于(i)筛查结肠直肠癌,或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的试剂盒,所述试剂盒包括:(a)至少一个寡核苷酸引物对,其设计用于扩增表1的一个或多个dmr的至少一部分,每个部分的长度至少10个、至少15个、至少20个、至少24个、至少30个、至少40个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少500个、至少1000个或更多碱基对;和(b)至少一种甲基化特异性限制酶和/或亚硫酸氢盐试剂。
62.在如前一段中具体提及的各种实施方式中,一个或多个dmr的一部分包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
63.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表2的每个dmr的寡核苷酸引物对。
64.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表3的每个dmr的寡核苷酸引物对。
65.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表4的每个dmr的寡核苷酸引物对。
66.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括表5的至少一个寡核苷酸引物对。
67.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对的至少一个寡核苷酸与表5的至少一种正向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表5的至少一种正向引物。
68.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对的至少一个寡核苷
酸与表5的至少一种反向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表5的至少一种反向引物。
69.在如前面段落中具体提及的各种实施方式中,试剂盒还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者存在结肠直肠癌;(ii)人类受试者的结肠直肠癌的易感性;(iii)人类受试者中结肠直肠癌的风险增加,和(iv)人类受试者结肠直肠癌的阶段。
70.在如前面段落中具体提及的各种实施方式中,试剂盒还包括使用一个或多个甲基化位点的以确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者中存在一种或多种进行性腺瘤;(ii)人体受试者的进行性腺瘤的易感性;(iii)人类受试者中进行性腺瘤的风险增加,和(iv)人类受试者中腺瘤的类型。
71.在如前面段落中具体提及的各种实施方式中,试剂盒还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者中存在结肠直肠癌和/或进行性腺瘤;(ii)人类受试者的结肠直肠癌和/或进行性腺瘤的易感性;(iii)人类受试者中结肠直肠癌和/或进行性腺瘤的风险增加,和(iv)人类受试者中结肠直肠癌和/或进行性腺瘤的阶段。
72.在如前面段落中具体提及的各种实施方式中,试剂盒在体外使用。
73.在另一个方面,本公开提供了用于(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的诊断性qpcr反应,所述诊断性qpcr反应包括:(a)人类dna;(b)聚合酶;(c)至少一个寡核苷酸引物对,其设计用于扩增表1的一种或多种dmr的至少一部分,所述一种或多种dmr的每个部分的长度为至少10个、至少15个、至少20个、至少24个、至少30个、至少40个、至少50个、至少100个、150个、200个、250个、300个、350个、400个、500个、1000个以上碱基对,其中人类dna是亚硫酸氢盐处理的人类dna或甲基化特异性限制酶消化的人类dna。
74.在如前一段中具体提及的各种实施方式中,一个或多个dmr的一部分包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
75.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表2的每个dmr的寡核苷酸引物对。
76.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表3的每个dmr的寡核苷酸引物对。
77.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表4的每个dmr的寡核苷酸引物对。
78.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括表5的至少一个寡核苷酸引物对。
79.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对的至少一个寡核苷酸与表5的至少一种正向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表5的至少一种正向引物。
80.在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对的至少一个寡核苷
酸与表5的至少一种反向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表5的至少一种反向引物。
81.在如前面段落中具体提及的各种实施方式中,反应还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者存在结肠直肠癌;(ii)人类受试者的结肠直肠癌的易感性;(iii)人类受试者中结肠直肠癌的风险增加,和(iv)人类受试者结肠直肠癌的阶段。
82.在如前面段落中具体提及的各种实施方式中,反应还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者中存在一种或多种进行性腺瘤;(ii)人体受试者的进行性腺瘤的易感性;(iii)人类受试者中进行性腺瘤的风险增加,和(iv)人类受试者中的腺瘤的类型。
83.在如前面段落中具体提及的各种实施方式中,反应还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者中存在结肠直肠癌和/或进行性腺瘤;(ii)人类受试者的结肠直肠癌和/或进行性腺瘤的易感性;(iii)人类受试者中结肠直肠癌和/或进行性腺瘤的风险增加,和(iv)人类受试者中结肠直肠癌和/或进行性腺瘤的阶段。
84.在如前面段落中具体提及的各种实施方式中,反应在体外进行。
85.在另一方面,本公开提供了一种(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定一个或多个差异甲基化区域(dmr)的甲基化状态,所述一个或多个dmr中的每一个包含一个或多个基因或与所述一个或多个基因重叠,所述一个或多个基因选自由以下组成的组:pax7、ntng1、syt6、linc01248、kcnk3、galnt14、chst10、thsd7b、unc80、epha6、med12l、adgrl3、rnf150、spock3、gpm6a、helt、gfpt2、hspa1l、hspa1a、nkain2、tmem178b、dpp6、micu3、alkal1、loc401463、bhlhe22、rims2、loc105375690、slc25a32、dmrt1、cdkn2a、cdkn2b-as1、pax5、c1ql3、myo3a、loc101929073、gad2、myo3a、foxi2、loc105369438、amotl1、loc101928847、ncam1、dscaml1、ptpro、rerg、dpy19l2、cux2、pcdh9、mir4500hg、slitrk5、slc8a3、loc646548、gatm、pif1、rasgrf1、vac14、vat1l、jph3、slfn13、zacn、srp68、galr2、adcyap1、cdh2、dok6、znf461、znf829、znf568、znf540、znf571-as1、cic、znf582-as1、znf582、znf471、znf264、znf671、znf551、znf776、nkx2-2、adamts1、tiam1和olig1;应用分类模型,所述分类模型使用所述一个或多个dmr中每一个的确定的甲基化状态作为输入;并且从所述模型中输出人类受试者的结肠直肠癌的预测状态或进行性腺瘤的预测状态或者结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
86.在如前一段中具体提及的各种实施方式中,该方法包括确定一种或多种dmr的甲基化状态,所述dmr包含基因gad2、myo3a和alkal1中的至少每一个或与其重叠。
87.在如前面段落中具体提及的各种实施方式中,该方法包括确定一种或多种dmr的甲基化状态,所述dmr包含基因gad2、myo3a、alkal1、rasgrf1、micu3、rasgrf1、foxi2、c1ql3、cdkn2a和cdkn2b-as1中的至少每一个或与其重叠。
88.在如前面段落中具体提及的各种实施方式中,该方法包括确定一种或多种dmr的
甲基化状态,所述dmr包含基因gad2、myo3a、alkal1、rasgrf1、micu3、rasgrf1、foxi2、c1ql3、cdkn2a、cdkn2b-as1、syt6、slfn13、gpm6a、thsd7b、zbf582-as1、znf582、gatm、znf540、znf571-as1、olig1、epha6、dpy19l2、slc8a3、loc646548、loc101929073、unc80、dpp6、znf568、jph3、znf461、ntng1、adgrl3、adamst1、cdh2、linc01248、ptpro、rerg、slc8a3、loc646548、pax5、gfpt2中的至少每一个或与其重叠。
89.在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(svm)算法的分类模型。
90.在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
91.在另一方面,本公开提供了一种(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定一个或多个差异甲基化区域(dmr)的甲基化状态,所述一个或多个dmr中的每一个与选自由以下组成的组的至少一个序列具有至少80%、至少85%、至少90%、至少95%、至少99%、或至少99.5%的序列同一性或包含选自由以下组成的组的至少一个序列:seq id no.190、seq id no.191、seq id no.192、seq id no.193、seq id no.194、seq id no.195、seq id no.196、seq id no.197、seq id no.198、seq id no.199、seq id no.200、seq id no.201、seq id no.202、seq id no.203、seq id no.204、seq id no.205、seq id no.206、seq id no.207、seq id no.208、seq id no.209、seq id no.210、seq id no.211、seq id no.212、seq id no.213、seq id no.214、seq id no.215、seq id no.216、seq id no.217、seq id no.218、seq id no.219、seq id no.220、seq id no.221、seq id no.222、seq id no.223、seq id no.224、seq id no.225、seq id no.226、seq id no.227、seq id no.228和seq id no.229,应用分类模型,所述分类模型使用所述一个或多个dmr的确定的甲基化状态作为输入;并且从所述模型中输出人类受试者的(i)结肠直肠癌的预测状态或(ii)进行性腺瘤的预测状态或者(iii)结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
92.在前一段中具体提及的各种实施方式中,该方法包括确定三个以上差异甲基化区域(dmr)的甲基化状态。
93.在如前面段落中具体提及的各种实施方式中,该方法包括确定10个以上差异甲基化区域(dmr)的甲基化状态。
94.在如前面段落中具体提及的各种实施方式中,该方法包括确定40个差异甲基化区域(dmr)的甲基化状态。
95.在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(svm)算法的分类模型。
96.在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
97.在另一方面,本公开提供了一种(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定在表1或表7中列出的人类受试者dna的差异甲基化区域(dmr)内发现的至少一个甲基化位点的甲基化状态;通过计算设备的处理器基于至少一个甲基化位点的甲基化状态确定人类受试者dna的差异甲基化区域(dmr)的甲基化状态;以及使用分类模型通过处理器确定人类受试者的(i)结肠直肠癌的预测状态,(ii)进行性腺瘤的预测状态,或(iii)结肠直肠癌或进行性腺瘤的预测
状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
98.在如前一段中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个dmr中的每一个,确定在dmr内发现的至少3个甲基化位点的甲基化状态。
99.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个dmr中的每一个,确定在dmr内发现的至少4个甲基化位点的甲基化状态。
100.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个dmr中的每一个,确定在dmr内发现的至少5个甲基化位点的甲基化状态。
101.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上dmr中的每一个,确定在dmr内发现的至少一个甲基化位点的甲基化状态。
102.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上dmr中的每一个,确定在dmr内发现的至少3个甲基化位点的甲基化状态。
103.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上dmr中的每一个,确定在dmr内发现的至少4个甲基化位点的甲基化状态。
104.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上dmr中的每一个,确定在dmr内发现的至少5个甲基化位点的甲基化状态。
105.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上dmr中的每一个,确定在dmr内发现的至少一个甲基化位点的甲基化状态。
106.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上dmr中的每一个,确定在dmr内发现的至少3个甲基化位点的甲基化状态。
107.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上dmr中的每一个,确定在dmr内发现的至少4个甲基化位点的甲基化状态。
108.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上dmr中的每一个,确定在dmr内发现的至少5个甲基化位点的甲基化状态。
109.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上dmr中的每一个,确定在dmr内发现的至少一个甲基化位点的甲基化状态。
110.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上dmr中的每一个,确定在dmr内发现的至少3个甲基化位点的甲基化状态。
111.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上dmr中的每一个,确定在dmr内发现的至少4个甲基化位点的甲基化状态。
112.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上dmr中的每一个,确定在dmr内发现的至少5个甲基化位点的甲基化状态。
113.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上dmr中的每一个,确定在dmr内发现的至少3个甲基化位点的甲基化状态。
114.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上dmr中的每一个,确定在dmr内发现的至少4个甲基化位点的甲基化状态。
115.在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上dmr中的每一个,确定在dmr内发现的至少5个甲基化位点的甲基化状态。
116.在如前面段落中具体提及的各种实施方式中,dmr包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12
个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
117.在如前面段落中具体提及的各种实施方式中,该方法包括由处理器确定与参照相比,至少一个甲基化位点是否被甲基化(例如,其中参照是来自一个或多个已证实未患有进行性腺瘤或结肠直肠癌的人类受试者群体的dna),其中甲基化指示(i)结肠直肠癌,(ii)进行性腺瘤,或(iii)结肠直肠癌和/或进行性腺瘤。
118.在如前面段落中具体提及的各种实施方式中,该方法包括确定在表2中列出的每个dmr内发现的至少一个甲基化位点的甲基化状态。
119.在如前面段落中具体提及的各种实施方式中,该方法包括确定在表3中列出的每个dmr内发现的至少一个甲基化位点的甲基化状态。
120.在如前面段落中具体提及的各种实施方式中,该方法包括确定在表4中列出的每个dmr内发现的至少一个甲基化位点的甲基化状态。
121.在如前面段落中具体提及的各种实施方式中,dmr通过如表5中列出的寡核苷酸引物对扩增。
122.在如前面段落中具体提及的各种实施方式中,人类受试者的dna分离自选自由人类受试者的组织(例如结肠直肠组织,例如息肉、腺瘤)、血液、血浆、尿液、唾液和粪便组成的组的成员。
123.在如前面段落中具体提及的各种实施方式中,dna是人类受试者的无细胞dna。
124.在如前面段落中具体提及的各种实施方式中,受试者在筛查时没有结肠直肠癌和/或进行性腺瘤的症状。
125.在如前面段落中具体提及的各种实施方式中,受试者先前进行过结肠直肠癌和/或进行性腺瘤筛查。在当前或前面段落中具体提及的各种实施方式中,受试者在过去10年内、过去5年内、过去4年内、过去3年内、过去2年内或过1年内已进行过结肠直肠癌和/或进行性腺瘤筛查。
126.在如前面段落中具体提及的各种实施方式中,受试者中的先前进行性腺瘤和/或结肠直肠癌的筛查已经诊断出所述受试者没患有(i)结肠直肠癌、(ii)进行性腺瘤或(iii)结肠直肠癌和/或进行性腺瘤。在当前或前面段落中具体提及的各种实施方式中,已诊断出所述受试者没患有(i)结肠直肠癌、(ii)进行性腺瘤或(iii)结肠直肠癌和/或进行性腺瘤的先前进行性腺瘤和/或结肠直肠癌筛查是在一年内。
127.在如前面段落中具体提及的各种实施方式中,已诊断出所述受试者没患有进行性腺瘤和/或结肠直肠癌的先前的进行性腺瘤和/或结肠直肠癌筛查是结肠镜检查。
128.在如前面段落中具体提及的各种实施方式中,该方法包括通过处理器鉴定早期结肠直肠癌的存在(例如,其中结肠直肠癌是0期、i期、iia期、iib期或iic期结肠直肠癌)。
129.在如前面段落中具体提及的各种实施方式中,该方法包括通过处理器鉴定早期结肠直肠癌的存在,其中癌症尚未转移。
130.在如前面段落中具体提及的各种实施方式中,甲基化状态使用选自由甲基化敏感性限制酶定量聚合酶链式反应(msre-qpcr)、甲基化特异性pcr、甲基化特异性核酸酶辅助的小等位基因富集pcr、杂交捕获靶向下一代测序和基于扩增的靶向下一代测序组成的组中的一个或多个成员确定。
131.在如前面段落中具体提及的各种实施方式中,甲基化状态使用全基因组亚硫酸氢
盐测序确定。
132.在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(svm)算法的分类模型。
133.在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
134.在另一个方面,本公开提供了一种用于(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查是否存在结肠直肠癌和/或进行性腺瘤的甲基化特异性限制酶定量聚合酶链式反应(msre-qpcr)的方法,该方法包括:(a)将人类受试者的dna与一种或多种甲基化特异性限制酶接触;(b)对酶消化的dna或其扩增子进行qpcr,以确定一个或多个dna区域的甲基化状态,其中一个或多个dna区域中的每一个包含表1的一个或多个dmr的至少一部分,每个部分的长度为至少10个、至少15个、至少20个、至少24个、至少30个、至少40个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少500个、至少1000个以上碱基对;(c)通过计算设备的处理器将分类模型应用于所确定的一个或多个dna区域的甲基化状态;(d)基于所应用的分类模型通过处理器确定人类受试者的结肠直肠癌的预测状态、进行性腺瘤的预测状态或者结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
135.在如前一段中具体提及的各种实施方式中,dna的一个或多个区域中的至少一个通过相应的寡核苷酸引物对扩增(例如,其中所述引物对包含正向引物和反向引物)。
136.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域中的每一个包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
137.在如前面段落中具体提及的各种实施方式中,相应的寡核苷酸引物对是表5中列出的寡核苷酸引物对。
138.在如前面段落中具体提及的各种实施方式中,相应寡核苷酸引物对的正向引物与表5中列出的正向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性。
139.在如前面段落中具体提及的各种实施方式中,相应寡核苷酸引物对的反向引物与表5中列出的反向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性。
140.在如前面段落中具体提及的各种实施方式中,dna分离自选自由人类受试者的组织(例如结肠直肠组织,例如息肉、腺瘤)、血液、血浆、尿液、唾液和粪便组成的组中的成员。
141.在如前面段落中具体提及的各种实施方式中,dna是人类受试者的无细胞dna。
142.在如前面段落中具体提及的各种实施方式中,该方法提供的检测结肠直肠癌的灵敏度为至少0.67。在本段和前面段落中具体提及的各种实施方式中,该方法提供的检测结肠直肠癌的灵敏度为至少0.78。
143.在如前面段落中具体提及的各种实施方式中,该方法提供的用于检测进行性腺瘤和结肠直肠癌的组合的总体灵敏度为至少0.48。在本段和前面段落中具体提及的各种实施方式中,该方法提供的用于检测进行性腺瘤和结肠直肠癌的组合的总体灵敏度为至少0.53。
144.在如前面段落中具体提及的各种实施方式中,该方法提供的特异性为至少0.9。在本段和前面段落中具体提及的各种实施方式中,该方法提供的特异性为至少0.93。
145.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域包含表2的每个dmr。
146.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域中的每一个与表2的相应dmr具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表2的相应dmr。
147.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域包含表3的每个dmr。
148.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域中的每一个与表2的相应dmr具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表2的相应dmr。
149.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域包含表4的每个dmr。
150.在如前面段落中具体提及的各种实施方式中,dna的一个或多个区域中的每一个与表4的相应dmr具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表4的相应dmr。
151.在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(svm)算法的分类模型。
152.在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
153.在另一方面,本公开提供了一种(i)筛查结肠直肠癌或者(ii)筛查进行性腺瘤或者(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定(例如,通过计算设备的处理器确定)一个或多个差异甲基化区域(dmr)的甲基化状态,所述一个或多个dmr中的每一个包含一个或多个基因或与所述一个或多个基因重叠,所述一个或多个基因选自由以下组成的组:pax7、ntng1、syt6、linc01248、kcnk3、galnt14、chst10、thsd7b、unc80、epha6、med12l、adgrl3、rnf150、spock3、gpm6a、helt、gfpt2、hspa1l、hspa1a、nkain2、tmem178b、dpp6、micu3、alkal1、loc401463、bhlhe22、rims2、loc105375690、slc25a32、dmrt1、cdkn2a、cdkn2b-as1、pax5、c1ql3、myo3a、loc101929073、gad2、myo3a、foxi2、loc105369438、amotl1、loc101928847、ncam1、dscaml1、ptpro、rerg、dpy19l2、cux2、pcdh9、mir4500hg、slitrk5、slc8a3、loc646548、gatm、pif1、rasgrf1、vac14、vat1l、jph3、slfn13、zacn、srp68、galr2、adcyap1、cdh2、dok6、znf461、znf829、znf568、znf540、znf571-as1、cic、znf582-as1、znf582、znf471、znf264、znf671、znf551、znf776、nkx2-2、adamts1、tiam1和olig1;通过处理器应用分类模型,所述分类模型使用所述一个或多个dmr中每一个的已确定的甲基化状态作为输入;并且通过所述处理器从所述模型中输出人类受试者的(i)结肠直肠癌的预测状态,(ii)进行性腺瘤的预测状态,或者(iii)结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
154.在如前一段中具体提及的各种实施方式中,该方法包括确定一种或多种dmr的甲基化状态,所述dmr包含基因gad2、myo3a和alkal1中的至少每一个或与其重叠。
155.在如前面段落中具体提及的各种实施方式中,该方法包括确定一种或多种dmr的
甲基化状态,所述dmr包含基因gad2、myo3a、alkal1、rasgrf1、micu3、rasgrf1、foxi2、c1ql3、cdkn2a和cdkn2b-as1中的至少每一个或与其重叠。
156.在如前面段落中具体提及的各种实施方式中,该方法包括确定一种或多种dmr的甲基化状态,所述dmr包含基因gad2、myo3a、alkal1、rasgrf1、micu3、rasgrf1、foxi2、c1ql3、cdkn2a、cdkn2b-as1、syt6、slfn13、gpm6a、thsd7b、zbf582-as1、znf582、gatm、znf540、znf571-as1、olig1、epha6、dpy19l2、slc8a3、loc646548、loc101929073、unc80、dpp6、znf568、jph3、znf461、ntng1、adgrl3、adamst1、cdh2、linc01248、ptpro、rerg、slc8a3、loc646548、pax5、gfpt2中的至少每一个或与其重叠。
157.在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(svm)算法的分类模型。
158.在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
159.在另一方面,本公开提供了一种(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定一个或多个差异甲基化区域(dmr)的甲基化状态,所述一个或多个dmr中的每一个与选自由以下组成的组的至少一个序列具有至少80%、至少85%、至少90%、至少95%、至少99%、或至少99.5%的序列同一性或包含选自由以下组成的组的至少一个序列:seq id no.190、seq id no.191、seq id no.192、seq id no.193、seq id no.194、seq id no.195、seq id no.196、seq id no.197、seq id no.198、seq id no.199、seq id no.200、seq id no.201、seq id no.202、seq id no.203、seq id no.204、seq id no.205、seq id no.206、seq id no.207、seq id no.208、seq id no.209、seq id no.210、seq id no.211、seq id no.212、seq id no.213、seq id no.214、seq id no.215、seq id no.216、seq id no.217、seq id no.218、seq id no.219、seq id no.220、seq id no.221、seq id no.222、seq id no.223、seq id no.224、seq id no.225、seq id no.226、seq id no.227、seq id no.228和seq id no.229;通过处理器应用分类模型,所述分类模型使用所述一个或多个dmr的确定的甲基化状态作为输入;并且通过处理器从所述模型中输出人类受试者的(i)结肠直肠癌的预测状态或(ii)进行性腺瘤的预测状态或者(iii)结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
160.在前一段中具体提及的各种实施方式中,该方法包括确定三个以上差异甲基化区域(dmr)中每一个的甲基化状态。
161.在如前面段落中具体提及的各种实施方式中,该方法包括确定10个以上差异甲基化区域(dmr)中每一个的甲基化状态。
162.在如前面段落中具体提及的各种实施方式中,该方法包括确定40个差异甲基化区域(dmr)中每一个的甲基化状态。
163.在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(svm)算法的分类模型。
164.在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
165.在各个方面,本发明的方法和组合物可以与本领域已知(例如,如美国专利no.10,006,925中所公开的,其通过引用整体上并入本文)的生物标志物组合使用。
166.另一方面,本发明涉及鉴定一个或多个差异甲基化区域以用于(i)筛查结肠直肠
癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,其中该方法包括:使用全基因组硫酸氢盐测序对诊断为患有(i)结肠直肠癌或(ii)进行性腺瘤,或(iii)结肠直肠癌和/或进行性腺瘤的受试者的第一群体(例如,至少10、至少20、至少50、至少100个以上受试者)的基因组的dna进行测序;将第一群体的每个基因组与参比基因组(例如,其中参比基因组是grch38)比对;鉴定(例如,使用生物信息学工具,例如,methylkit)多个甲基化结肠直肠癌和/或进行性腺瘤位点,其中多个甲基化结肠直肠癌和/或进行性腺瘤位点中的每一个是第一群体的dna相对于参考群体(例如,包括健康受试者的群体)的相应位点的差异甲基化位点(例如,其中第一群体的dna甲基化百分比相对于参考群体的差异为至少5%,至少10%、至少15%以上);生成包含多个差异甲基化区域(dmr)的列表,多个差异甲基化区域(dmr)中的每一个包含多个已鉴定的甲基化结肠直肠癌和/或进行性腺瘤癌位点中的一个或多个(例如,其中甲基化结肠直肠癌和/或进行性腺瘤癌位点是甲基化cpg区域或包含甲基化cpg区域)(例如,其中dmr包含至少三个甲基化cpg区域,cpg之间的最大距离为200个碱基对);确定第一群体的多个dmr中的每一个的甲基化状态(例如甲基化百分比、甲基化位点的数量);至少部分基于多个dmr中的每一个的甲基化状态对多个dmr进行排序;和过滤来自多个dmr的一组候选dmr(例如,过滤包含至少五个cpg区域的dmr)(例如,其中第一受试者组和参考群体之间的最小甲基化百分比差异为至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少15%以上)以用于结肠直肠癌和/或进行性腺瘤的诊断。
167.在如前一段中具体提及的各种实施方式中,该方法包括:鉴定多个dmr中的每一个内的一个或多个cpg区域;确定第一群体的多个dmr中的每一个内每个鉴定的cpg区域的甲基化状态(例如甲基化百分比、甲基化位点的数量);以及至少部分地基于dmr的一个或多个cpg区域中的每一个的确定的甲基化状态对多个dmr进行排序。
168.在如前面段落中具体提及的某些实施方式中,该方法进一步包括:确定参考群体的多个dmr中的每一个的甲基化状态;将参考群体的多个dmr中的每一个的确定的甲基化状态与第一群体的相应dmr的甲基化状态进行比较(例如,比较甲基化百分比);以及至少部分地基于所述比较对多个dmr进行排序。
169.在如前面段落中具体提及的某些实施方式中,第一群体的dna分离自第一群体的每个人类受试者的组织(例如,结肠直肠组织,例如息肉、腺瘤)。
170.在如前面段落中具体提及的某些实施方式中,第一群体的dna分离自第一群体的每个人类受试者的血液、血浆、尿液、唾液或粪便。
171.在其他方面,本发明涉及用于执行前述段落中提及的任何方法的系统,该系统包括处理器;以及其上具有指令的存储器,所述指令在由处理器执行时使处理器执行该方法的一个或多个(直至所有)步骤。
172.定义
173.一个或一种:冠词“一个”和“一种”在本文中用于指代一个或多于一个(即至少一个)冠词的语法对象。例如,“一种元素”是指一种元素或多于一种的元素。
174.约:术语“约”,当在本文中用于提及值时,是指在上下文中与所引用的值相似的值。一般而言,熟悉上下文的本领域技术人员将理解在该上下文中“约”所涵盖的相关差异程度。例如,在一些实施方式中,术语“约”可涵盖在参考值的25%、20%、19%、18%、17%、
16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或百分之几的值的范围。
175.进行性腺瘤:如本文所用,术语“进行性腺瘤”用于指结肠和直肠的腺瘤性息肉(腺瘤),其是良性(非癌性)的细胞生长。进行性腺瘤是结肠腺瘤性腺瘤,至少具有以下特征之一:尺寸≥1cm;管状绒毛状或绒毛状腺瘤;高度不典型增生;和锯齿状腺瘤伴发育不良。在某些情况下,例如,如本文所述,进行性腺瘤也可归类为“高风险”腺瘤。
176.施用:如本文所用,术语“施用”通常是指将组合物施用至受试者或系统,例如以实现包括在组合物中或以其他方式由组合物递送的试剂的递送。
177.试剂:如本文所用,术语“试剂”是指实体(例如,小分子、肽、多肽、核酸、脂质、多糖、复合物、组合、混合物、系统或现象,例如热、电流、电场、磁力、磁场等)。
178.改善:如本文所用,术语“改善”是指受试者状态的预防、减轻、缓和或改良。改善包括但不要求完全康复或完全预防疾病、病症或状况。
179.扩增子或扩增子分子:如本文所用,术语“扩增子”或“扩增子分子”是指通过从模板核酸分子转录产生的核酸分子,或具有与其互补的序列的核酸分子,或双链核酸,包括任何此类核酸分子。转录可以从引物开始。
180.扩增:如本文所用,术语“扩增”是指使用模板核酸分子与各种试剂组合以从模板核酸分子产生另外的核酸分子,这些另外的核酸分子可以相同或与模板核酸分子的片段相似(例如,具有至少70%的同一性,例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性)和/或是与其互补的序列。
181.扩增反应混合物:如本文所用,术语“扩增反应混合物”或“扩增反应”是指模板核酸分子连同足以扩增模板核酸分子的试剂。
182.生物样品:如本文所用,术语“生物样品”通常是指从感兴趣的生物来源(例如,组织或生物体或细胞培养物)获得或衍生的样品,如本文所述。在一些实施方式中,生物来源是或包括生物体,例如动物或人。在一些实施方式中,例如,如本文所提出的,生物样品是或包括生物组织或流体。在一些实施方式中,例如,如本文所提出的,生物样品可以是或包括细胞、组织或体液。在一些实施方式中,例如,如本文所提出的,生物样品可以是或包括血液、血细胞、无细胞dna、自由漂浮的核酸、腹水、活检样品、手术试样、含有细胞的体液、痰、唾液、粪便、尿液、脑脊液、腹腔液、胸水、淋巴液、妇科液、分泌物、排泄物、皮肤拭子、阴道拭子、口腔拭子、鼻拭子、冲洗液或灌洗液,例如导管灌洗液或支气管肺泡灌洗液、抽吸物、刮屑、骨髓。在一些实施方式中,例如,如本文所提出的,生物样品是或包括从单个受试者或多个受试者获得的细胞。样品可以是直接从生物来源获得的“原始样品”,也可以是“处理过的样品”。生物样品也可称为“样品”。
183.生物标志物:如本文所用,术语“生物标志物”与其在本领域中的使用一致,是指其存在、水平或形式与特定生物事件或感兴趣的状态相关的实体,因此其被认为是成为该事件或状态的“标志物”。本领域技术人员将理解,例如,在dna生物标志物的上下文中,生物标志物可以是或包括基因座(例如一个或多个甲基化基因座)和/或基因座的状态(例如,一个或多个甲基化基因座的状态)。仅举几个生物标志物的例子,在一些实施方式中,例如,如本文所提出的,生物标志物可以是或包括特定疾病、病症或状况的标志物,或者可以是特定疾病、病症或状况可以例如在受试者中发展、发生或复发的定量概率的定性标志物。在一些实
施方式中,例如,如本文所提出的,生物标志物可以是或包括特定治疗结果的标志物,或其定量概率的定性。因此,在各种实施方式中,如本文所提出的,生物标志物可以预测、预后和/或诊断相关生物事件或感兴趣的状态。生物标志物可以是任何化学类别的实体。例如,在一些实施方式中,例如,如本文所提出的,生物标志物可以是或包括核酸、多肽、脂质、碳水化合物、小分子、无机试剂(例如,金属或离子)或其组合。在一些实施方式中,例如,如本文所提出的,生物标志物是细胞表面标志物。在一些实施方式中,例如,如本文所提出的,生物标志物是细胞内的。在一些实施方式中,例如,如本文所提出的,在细胞外发现生物标志物(例如,在细胞外分泌或以其他方式产生或存在,例如在体液中,例如血液、尿液、眼泪、唾液、脑脊液等)。在一些实施方式中,例如,如本文所提出的,生物标志物是甲基化基因座的甲基化状态。在某些情况下,例如,如本文所提出的,生物标志物可称为“标志物”。
184.仅举一个生物标志物的实例,在一些实施方式中,例如,如本文所提出的,该术语指由基因编码的产物的表达,其表达是特定肿瘤、肿瘤亚类、肿瘤分期等的特征。作为另选或另外,在一些实施方式中,例如,如本文所提出的,特定标志物的存在或水平可以与特定信号传导途径的活性(或活性水平)相关,例如,其活性是特定类别肿瘤特征的信号传导途径。
185.本领域技术人员将理解,生物标志物可以单独确定特定生物事件或感兴趣的状态,或者可以代表或有助于确定特定生物事件或感兴趣状态的统计概率。本领域技术人员将理解,标志物在其与特定生物事件或感兴趣状态相关的特异性和/或灵敏度方面可能不同。
186.血液成分:如本文所用,术语“血液成分”是指全血的任何成分,包括红细胞、白细胞、血浆、血小板、内皮细胞、间皮细胞、上皮细胞和无细胞dna。血液成分还包括血浆成分,包括蛋白质、代谢物、脂质、核酸和碳水化合物,以及可存在于血液中的任何其他细胞,例如由于怀孕、器官移植、感染、损伤或疾病而存在于血液中的任何其他细胞。
187.癌症:如本文所用,术语“癌症”、“恶性肿瘤”、“赘生物”、“肿瘤”和“癌”可互换使用,指其中细胞表现出或表现了相对异常的、不受控制的和/或自主生长的疾病、病症或状况,因此它们展现出或展现了异常升高的增殖率和/或异常生长表型。在一些实施方式中,例如,如本文所提出的,癌症可包括一种或多种肿瘤。在一些实施方式中,例如,如本文所提出的,癌症可以是或包括癌前(例如良性)、恶性、转移前、转移和/或非转移的细胞。在一些实施方式中,例如,如本文所提出的,癌症可以是或包括实体瘤。在一些实施方式中,例如,如本文所提出的,癌症可以是或包括血液肿瘤。一般而言,本领域已知的不同类型癌症的实例包括例如结肠直肠癌,造血系统癌症包括白血病、淋巴瘤(霍奇金和非霍奇金)、骨髓瘤和骨髓增生性疾病;肉瘤,黑色素瘤,腺瘤,实体组织癌,口腔、咽喉、喉癌和肺癌的鳞状细胞癌,肝癌,泌尿生殖系统癌症如前列腺癌、宫颈癌、膀胱癌、子宫癌和子宫内膜癌,以及肾细胞癌,骨癌,胰腺癌,皮肤癌,皮肤或眼内黑色素瘤,内分泌系统癌,甲状腺癌,甲状旁腺癌,头颈癌,乳腺癌,胃肠癌和神经系统癌,良性病变等如乳头状瘤等。
188.化学治疗剂:如本文所用,术语“化学治疗剂”与其在本领域中的使用一致,是指一种或多种已知用于治疗癌症或有助于治疗癌症的或具有用于治疗癌症或有助于治疗癌症的已知特征的试剂。特别地,化学治疗剂包括促凋亡剂、细胞生长抑制剂和/或细胞毒性剂。在一些实施方式中,例如,如本文所提出的,化学治疗剂可以是或包括烷化剂、蒽环类、细胞
骨架破坏剂(例如微管靶向部分,例如紫杉烷、美登素及其类似物)、埃坡霉素、组蛋白脱乙酰酶抑制剂hdac)、拓扑异构酶抑制剂(例如抑制剂拓扑异构酶i和/或拓扑异构酶ii)、激酶抑制剂、核苷酸类似物或核苷酸前体类似物、肽抗生素、铂类药物、维甲酸类、长春花生物碱了和/或具有相关抗增殖活性的类似物。在一些特定实施方式中,例如,如本文所提出的,化学治疗剂可以是或包括放线菌素、全反式视黄酸、奥瑞他汀、阿扎胞苷、硫唑嘌呤、博来霉素、硼替佐米、卡铂、卡培他滨、顺铂、氯霉素、环磷酰胺、姜黄素、阿糖胞苷、柔红霉素、多西紫杉醇、多西氟尿苷、多柔比星、表柔比星、埃坡霉素、依托泊苷、氟尿嘧啶、吉西他滨、羟基脲、伊达比星、伊马替尼、伊立替康、美登素和/或其类似物(如dm1)、氮芥、巯嘌呤、甲氨蝶呤、米托蒽醌、美坦素、奥沙利铂、紫杉醇、培美曲塞、泰尼泊苷、硫鸟嘌呤、托泊替康、戊柔比星、长春碱、长春新碱、长春地辛、长春瑞滨或其组合。在一些实施方式中,例如,如本文所提出的,可以在抗体-药物偶联物的上下文中使用化学治疗剂。在一些实施方式中,例如,如本文所提出的,化学治疗剂是在抗体-药物缀合物中发现的一种,其选自由以下组成的组:hll1-多柔比星、hrs7-sn-38、hmn-14-sn-38、hll2-sn-38、ha20-sn-38、hpam4-sn-38、hll1-sn-38、hrs7-pro-2-p-dox、hmn-14-pro-2-p-dox、hll2-pro-2-p-dox、ha20-pro-2-p-dox、hpam4-pro-2-p-dox、hll1-pro-2-p-dox、p4/d10-多柔比星、吉妥珠单抗奥佐米星、本妥昔单抗、曲妥珠单抗、奥英妥珠单抗、格巴妥莫单抗(glembatumomab vedotin)、sar3419、sar566658、biib015、bt062、sgn-75、sgn-cd19a、amg-172、amg-595、bay-94-9343、asg-5me、asg-22me、asg-16m8f、mdx-1203、mln-0264、anti-psma adc、rg-7450、rg-7458、rg-7593、rg-7596、rg-7598、rg-7599、rg-7600、rg-7636、abt-414、imgn-853、imgn-529、玛汀-沃瑟妥珠单抗(vorsetuzumab mafodotin)和莫星-洛沃妥珠单抗(lorvotuzumab mertansine)。在一些实施方式中,如本文所提出的,化学治疗剂可以是或包含法呢基-硫代水杨酸(fts)、4-(4-氯-2-甲基苯氧基)-n-羟基丁酰胺(cmh)、雌二醇(e2)、四甲氧基芪(tms)、δ-生育三烯酚、盐霉素或姜黄素。
189.可比较:如本文所用,术语“可比较”是指两个以上条件、环境、试剂、实体、群体等的组,它们可能彼此不相同,但足够相似以允许在之间进行比较,使得本领域技术人员将理解可以基于观察到的差异或相似性合理地得出结论。在一些实施方式中,例如,如本文所提出的,条件、环境、试剂、实体、群体等的可比较组通常以多个基本上相同的特征和零个、一个或多个不同的特征为特征。本领域普通技术人员将理解,在上下文中,需要何种程度的同一性才能使组中的成员是可比较的。例如,本领域普通技术人员将理解,当以足够数量和类型的基本上相同的特征为特征以保证观察到的差异可以全部或部分归因于其不相同的特征的合理结论。
190.可检测部分:如本文所用,术语“可检测部分”是指可检测的任何元素、分子、官能团、化合物、片段或其他部分。在一些实施方式中,例如,如本文所提出的,可检测部分单独提供或使用。在一些实施方式中,例如,如本文所提出的,提供和/或利用与另一试剂相关联(例如,连接至另一试剂)的可检测部分。可检测部分的实例包括但不限于各种配体、放射性同位素(例如3h、
14
c、
18
f、
19
f、
32
p、
35
s、
135
i、
125
i、
123
i、
64
cu、
187
re、
111
in、
90
y、
99m
tc、
177
lu、
89
zr等)、荧光染料、化学发光剂、生物发光剂、光谱可分辨的无机荧光半导体纳米晶体(即量子点)、金属纳米颗粒、纳米团簇、顺磁性金属离子、酶、比色标记、生物素、地高辛(dioxigenin)、半抗原和可获得抗血清或单克隆抗体的蛋白质。
191.诊断:如本文所用,术语“诊断”是指确定受试者是否患有或将发展疾病、病症、状况或状态,和/或定量概率的定性。例如,在癌症的诊断中,诊断可以包括关于癌症的风险、类型、阶段、恶性度或其他分类的确定。在一些情况下,例如,如本文所提出的,诊断可以是或包括与预后和/或对一种或多种一般或特定治疗剂或方案的可能响应有关的确定。
192.诊断信息:如本文所用,术语“诊断信息”是指可用于提供诊断的信息。诊断信息可以包括但不限于生物标志物状态信息。
193.差异甲基化:如本文所用,术语“差异甲基化”描述了甲基化状态在第一条件和第二条件之间不同的甲基化位点。差异甲基化的甲基化位点可称为差异甲基化位点。在一些情况下,例如,如本文所提出的,dmr由通过使用寡核苷酸引物扩增产生的扩增子定义,例如,选择用于扩增dmr或扩增存在于扩增子中的感兴趣的dna区域的一对寡核苷酸引物。在一些情况下,例如,如本文所提出的,dmr被定义为由一对寡核苷酸引物扩增的dna区域,包括具有寡核苷酸引物的序列或与寡核苷酸引物互补的序列的区域。在一些情况下,例如,如本文所提出的,dmr被定义为由一对寡核苷酸引物扩增的dna区域,不包括具有寡核苷酸引物的序列或与寡核苷酸引物互补的序列的区域。
194.差异甲基化区域:如本文所用,术语“差异甲基化区域”(dmr)是指包含一个或多个差异甲基化位点的dna区域。在选定的感兴趣的条件下,例如癌症状态,包括更多数量或频率的甲基化位点的dmr可以被称为超甲基化dmr。在选定的感兴趣的条件下,例如癌症状态,包括较少数量或频率的甲基化位点的dmr可以被称为低甲基化dmr。作为结肠直肠癌甲基化生物标志物的dmr可称为结肠直肠癌dmr。在某些情况下,例如,如本文所提出的,作为结肠直肠癌甲基化生物标志物的dmr也可用于鉴定进行性腺瘤。在一些情况下,例如,如本文所提出的,作为进行性腺瘤的甲基化生物标志物的dmr可以被称为进行性腺瘤dmr。在一些情况下,例如,如本文所提出的,作为进行性腺瘤甲基化生物标志物的dmr也可用于鉴定结肠直肠癌。在一些情况下,例如,如本文所提出的,dmr可以是单核苷酸,该单核苷酸是甲基化位点。优选地,dmr的长度为至少约10、15、20、24、50、100、150、200、250、300、350、400、500、1000、1500、2000、2225、2500以上碱基对。
195.dna区:如本文所用,“dna区”是指较大dna分子的任何连续部分。本领域技术人员将熟悉用于确定第一dna区和第二dna区是否对应的技术,例如基于第一dna区和第二dna区的序列相似性(例如,序列同一性或同源性)和/或上下文(例如,第一dna区和第二dna区上游和/或下游的核酸的序列同一性或同源性)。
196.除非本文另有说明,在人类中发现的或与人类相关的序列(例如,与人类dna杂交的序列)发现于、基于和/或衍生自实例代表性的人基因组序列,其通常称为和本领域技术人员已知为智人(人类)基因组组装grch38、hg38和/或基因组参考联盟human build 38。本领域技术人员将进一步理解,hg38的dna区可以通过已知系统提及,所述已知系统包括根据指定的编号鉴定特定核苷酸位置或其范围。
197.下游:如本文所用,术语“下游”是指第一dna区相对于第二dna区更靠近包括第一dna区和第二dna区的核酸的c末端。
198.基因:如本文所用,术语“基因”是指例如在染色体中的单个dna区,其包括编码产物(例如,rna产物和/或多肽产物)的编码序列,连同所有、一些或没有有助于调节编码序列表达的dna序列。在一些实施方式中,例如,如本文所提出的,基因包括一个或多个非编码序
列。在一些特定实施方式中,例如,如本文所提出的,基因包括外显子和内含子序列。在一些实施方式中,例如,如本文所提出的,基因包括一种或多种调控元件,其例如可以控制或影响基因表达的一个或多个方面(例如,细胞类型特异性表达、诱导性表达等)。在一些实施方式中,例如,如本文所提出的,基因包括启动子。在一些实施方式中,例如,如本文所提出的,基因包括(i)在编码序列上游延伸预定数量的核苷酸的dna核苷酸和(ii)在编码序列下游延伸预定数量的核苷酸的dna核苷酸中的一者或两者。在各种实施方式中,例如,如本文所提出的,预定数量的核苷酸可以是500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。
199.杂交:如本文所用,“杂交”是指第一核酸与第二核酸结合以形成双链结构,该结合通过核苷酸的互补配对发生。本领域技术人员将认识到,互补序列尤其可以杂交。在各种实施方式中,例如,如本文所提出的,杂交可发生在例如具有至少70%互补性,例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互补性的核苷酸序列之间。本领域技术人员将进一步理解第一核酸和第二核酸的杂交是否发生可取决于各种反应条件。可以发生杂交的条件是本领域已知的。
200.低甲基化:如本文所用,术语“低甲基化”是指与参考状态相比,在感兴趣的状态中甲基化核苷酸至少一个少一个的甲基化基因座的状态(例如,与健康对照相比在结肠直肠癌中甲基化核苷酸至少少一个)。
201.超甲基化:如本文所用,术语“超甲基化”是指与参考状态相比在感兴趣的状态中甲基化核苷酸至少一个多一个的甲基化基因座的状态(例如,与健康对照相比在结肠直肠癌中甲基化核苷酸至少多一个)。
202.同一性,同一的:如本文所用,术语“同一性”和“同一的”是指聚合性分子之间,例如核酸分子(例如,dna分子和/或rna分子)之间和/或多肽分子之间的总体相关性。计算两个提供的序列之间的百分比同一性的方法是本领域已知的。两个核酸或多肽序列的百分比同一性的计算,例如,可以通过比对两个序列(或一个或两个序列的互补序列)以实现最佳比较目的(例如,可以在第一序列和第二序列中的一个或两个中引入缺口以用于最佳比对,以及出于比较目的可以忽略不相同的序列)。然后比较相应位置处的核苷酸或氨基酸。当第一序列中的一个位置被与第二个序列中的相应位置相同的残基(例如,核苷酸或氨基酸)占据时,则分子在该位置是相同的。两个序列之间的百分比同一性是序列共享的相同位置数量的函数,可选地考虑缺口的数量和每个缺口的长度,可能需要引入其以实现两个序列的最佳比对。序列的比较和两个序列之间同一性百分比的确定可以使用计算算法来完成,例如blast(基本局部比对搜索工具)。
[0203]“改善”、“增加”或“减少”:如本文所用,这些术语或语法上可比较的比较术语表示相对于可比较的参考测量的值。例如,在一些实施方式中,例如,如本文所提出的,相对于使用可比较的参考试剂或没有试剂获得的评估值,使用感兴趣的试剂实现的评估值可以“提高”。替代地或另外地,在一些实施方式中,例如,如本文所提出的,相对于在不同条件下或在不同时间点(例如,在诸如施用感兴趣的试剂等事件之前或之后)在相同受试者或系统中获得的评估值,或在不同的比比较的受试者中(例如,在可比较的受试者或系统中,其与感兴趣的受试者或系统不同之处在于存在一种或多种特定疾病、感兴趣的障碍或状况,或之前接触过某种状况或试剂等),在感兴趣受试者或系统中的评估值可以“提高”。在一些实施
方式中,例如,如本文所提出的,比较性术语指的是统计相关的差异(例如,足以实现统计相关性的普遍性和/或量级的差异)。本领域技术人员将意识到或将能够容易地确定在给定上下文中需要或足以实现此类统计显著性的差异的程度和/或普遍性。
[0204]
甲基化:如本文所用,术语“甲基化”包括在(i)胞嘧啶的c5位置;(ii)胞嘧啶的n4位置;(iii)腺嘌呤的n6位置中的任何位置处的甲基化。甲基化还包括(iv)其他类型的核苷酸甲基化。甲基化的核苷酸可称为“甲基化核苷酸”或“甲基化核苷酸碱基”。在某些实施方式中,例如,如本文所提出的,甲基化特指胞嘧啶残基的甲基化。在某些情况下,例如,如本文所提出的,甲基化特指存在于cpg位点中的胞嘧啶残基的甲基化。
[0205]
甲基化测试:如本文所用,术语“甲基化测试”是指可用于确定甲基化基因座的甲基化状态或甲基化位点的任何技术。
[0206]
甲基化生物标志物:如本文所用,术语“甲基化生物标志物”是指生物标志物,其是或包括至少一个甲基化位点或基因座和/或至少一个甲基化基因座的甲基化状态,例如超甲基化基因座。特别地,甲基化生物标志物是一种生物标志物,其特征在于一个或多个核酸基因座的甲基化状态在第一状态和第二状态之间(例如,在癌性状态和非癌性状态之间)的变化。
[0207]
甲基化基因座:如本文所用,术语“甲基化基因座”是指包含至少一个差异甲基化区域的dna区。在选定的感兴趣的条件下,例如癌症状态,包括更多数量或频率的甲基化位点的甲基化基因座可以被称为超甲基化基因座。在选定的感兴趣的条件下,例如癌症状态,包括较少数量或频率的甲基化位点的甲基化基因座可以被称为低甲基化基因座。
[0208]
甲基化位点:如本文所用,甲基化位点是指在至少一种条件下被甲基化的核苷酸或核苷酸位置。在其甲基化状态下,甲基化位点可称为甲基化的位点。
[0209]
甲基化状态:如本文所用,“甲基化状态”、“甲基化态”或“甲基化谱”是指甲基化基因座内甲基化位点处甲基化的数量、频率或模式。因此,第一状态和第二状态之间甲基化状态的变化可以是或包括甲基化位点的数量、频率或模式的增加,或者可以是或包括甲基化位点的数量、频率或模式的减少。在各种情况下,例如,如本文所提出的,甲基化状态的变化是甲基化值的变化。在各种情况下,例如,如本文所提出的,“甲基化状态”是指在个体甲基化位点是否存在甲基化。
[0210]
甲基化值:如本文所用,术语“甲基化值”是指甲基化状态的数字表示,例如,以代表甲基化基因座甲基化频率或比率的数字形式。在一些情况下,例如,如本文所提出的,甲基化值可以通过包括在用甲基化依赖性限制酶对样品进行限制性消化后定量样品中存在的完整核酸的量的方法产生。在一些情况下,例如,如本文所提出的,甲基化值可以通过包括在样品的亚硫酸氢盐反应之后比较扩增谱的方法产生。在一些情况下,例如,如本文所提出的,可以通过比较亚硫酸氢盐处理的和未处理的核酸的序列来产生甲基化值。在一些情况下,例如,如本文所提出的,甲基化值是或包括或基于定量pcr结果。
[0211]
核酸:如本文所用,在其最广泛的意义上,术语“核酸”是指被引入或可以引入寡核苷酸链中的任何化合物和/或物质。在一些实施方式中,例如,如本文所提出的,核酸是通过磷酸二酯键引入或可以引入寡核苷酸链中的化合物和/或物质。从上下文中将清楚,在一些实施方式中,例如,如本文所提出的,术语核酸指单体核酸残基(例如,核苷酸和/或核苷),并且在一些实施方式中,例如,如本文所提出的,指包含多个单体核酸残基的多核苷酸链。
核酸可以是或包括dna、rna或其组合。核酸可包括天然核酸残基、核酸类似物和/或合成残基。在一些实施方式中,例如,如本文所提出的,核酸包括天然核苷酸(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)。在一些实施方式中,例如,如本文所提出的,核酸是或包括一种或多种核苷酸类似物(例如,2-氨基腺苷、2-硫胸苷、肌苷、吡咯-嘧啶、3-甲基腺苷、5-甲基胞苷、c-5丙炔基-胞苷、c-5-丙炔基-尿苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基-尿苷、c5-丙炔基-胞苷、c5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷8-氧代腺苷、8-氧代鸟苷、0(6)-甲基鸟嘌呤、2-硫胞苷、甲基化碱基、嵌入碱基及其组合)。
[0212]
在一些实施方式中,例如,如本文所提出的,核酸具有编码功能基因产物例如rna或蛋白质的核苷酸序列。在一些实施方式中,例如,如本文所提出的,核酸包括一个或多个内含子。在一些实施方式中,例如,如本文所提出的,核酸包括一个或多个基因。在一些实施方式中,例如,如本文所提出的,核酸通过从天然来源分离、通过基于互补模板的聚合酶促合成(体内或体外)、在重组细胞或系统中繁殖和化学合成中的一种或多种来制备。
[0213]
在一些实施方式中,例如,如本文所提出的,核酸类似物与核酸的不同之处在于它不利用磷酸二酯骨架。例如,在一些实施方式中,例如,如本文所提出的,核酸可以包括一种或多种肽核酸,其是本领域已知的并且在主链中具有肽键而不是磷酸二酯键。作为选择或另外,在一些实施方式中,例如,如本文所提出的,核酸具有一个或多个硫代磷酸酯和/或5'-n-亚磷酰胺键而不是磷酸二酯键。在一些实施方式中,例如,如本文所提出的,与天然核酸中的那些相比,核酸包含一种或多种经修饰的糖(例如,2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖)。
[0214]
在一些实施方式中,例如,如本文所提出的,核酸是或包括至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、1 10、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000或更多个残基。在一些实施方式中,例如,如本文所提出的,核酸部分或完全是单链的,或者部分或完全是双链的。
[0215]
核酸检测测试:如本文所用,术语“核酸检测测试”是指确定感兴趣核酸的核苷酸组成的任何方法。核酸检测测试包括但不限于dna测序方法、基于聚合酶链式反应的方法、探针杂交方法、连接酶链反应等。
[0216]
核苷酸:如本文所用,术语“核苷酸”是指例如dna和/或rna聚合物的多核苷酸的结构组分或构件。核苷酸包括碱基(例如,腺嘌呤、胸腺嘧啶、尿嘧啶、鸟嘌呤或胞嘧啶)和糖分子和至少一个磷酸基团。如本文所用,核苷酸可以是甲基化的核苷酸或未甲基化的核苷酸。本领域技术人员将理解,核酸术语,例如“基因座”或“核苷酸”可以指单个核酸分子的基因座或核苷酸和/或指基因座的累积群体或代表基因座或核苷酸的多个核酸(例如样品和/或受试者的代表中的多个核酸)中的核苷酸(例如,具有相同的相同核酸序列和/或核酸序列背景,或具有基本上相同的核酸序列和/或核酸背景)。
[0217]
寡核苷酸引物:如本文所用,术语寡核苷酸引物或引物是指使用、能够使用或用于从模板核酸分子产生扩增子的核酸分子。在允许转录的条件下(例如,在核苷酸和dna聚合酶的存在下,以及在合适的温度和ph值下),寡核苷酸引物可以提供从与寡核苷酸引物杂交的模板的转录起始点。通常,寡核苷酸引物是长度为5至200个核苷酸的单链核酸。本领域技
术人员将理解用于从模板核酸分子产生扩增子的最佳引物长度可随包括温度参数、引物组成和转录或扩增方法在内的条件而变化。如本文所用,一对寡核苷酸引物是指分别与模板双链核酸分子的第一链和第二链互补的一组两条寡核苷酸引物。就模板核酸链而言,一对寡核苷酸引物的第一成员和第二成员可分别称为“正向”寡核苷酸引物和“反向”寡核苷酸引物,因为正向寡核苷酸引物能够和与模板核酸链互补的核酸链杂交,反向寡核苷酸引物能够与模板核酸链杂交,并且正向寡核苷酸引物相对于模板核酸链的位置为反向寡核苷酸引物序列相对于模板核酸链的位置的5'。本领域技术人员将理解,第一寡核苷酸引物和第二寡核苷酸引物分别作为正向寡核苷酸引物和反向寡核苷酸引物的鉴定是任意的,因为这些标识符取决于给定的核酸链或其互补物是否被用作模板核酸分子。
[0218]
重叠:术语“重叠”在本文中用于指dna的两个区域,每个区域包含与另一个区域中相同长度的子序列基本上相同的子序列(例如,dna的两个区域具有共同的子序列)。“基本上相同”是指两个长度相同的子序列的差异小于给定数量的碱基对。在某些情况下,例如,如本文所提出的,每个子序列具有至少20个碱基对的长度,这些碱基对彼此相差少于4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少24个碱基对的长度,这些碱基对相差少于5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少50个碱基对的长度,这些碱基对相差少于10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少100个碱基对的长度,这些碱基对相差少于20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少200个碱基对的长度,这些碱基对相差少于40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少250个碱基对的长度,这些碱基对相差少于50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少300个碱基对的长度,这些碱基对相差少于60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少500个碱基对的长度,这些碱基对相差少于100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少1000个碱基对的长度,这些碱基对相差少于200、
100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,两个dna区域的第一个区域的子序列可以包含两个dna区域的第二个区域的全部(或反之亦然)(例如,共同的子序列可以包含一个或两个区域的全部)。
[0219]
预防或防止:如本文所用的与疾病、病症或状况的发生相关的术语“预防”和“防止”是指降低发生疾病、病症或状况的风险;延迟疾病、病症或状况的发作;延迟疾病、病症或状况的一种或多种特征或症状的发作;和/或降低疾病、病症或状况的一种或多种特征或症状的频率和/或严重性。预防可以指对特定受试者的预防或对受试者群体的统计影响。当疾病、病症或状况的发作延迟了预定的时间段时,可以认为预防是完全的。
[0220]
探针:如本文所用,术语“探针”是指能够与互补靶标杂交并包括可检测部分的单链或双链核酸分子。在某些实施方式中,例如,如本文所提出的,探针是限制性消化产物或合成产生的核酸,例如通过重组或扩增产生的核酸。在一些情况下,例如,如本文所提出的,探针是可用于检测、鉴定和/或分离靶序列例如基因序列的捕获探针。在各种情况下,例如,如本文所提出的,探针的可检测部分可以是例如酶(例如elisa,以及基于酶的组织化学分析)、荧光部分、放射性部分或与发光信号相关的部分。
[0221]
预后:如本文所用,术语“预后”是指确定至少一种可能的未来结果或事件的定量概率的定性。如本文所用,预后可以是对受试者中疾病、病症或状况例如癌症的可能进程的确定,关于受试者预期寿命的确定,或关于对治疗(例如特殊疗法)的响应的确定。
[0222]
预后信息:如本文所用,术语“预后信息”是指可用于提供预后的信息。预后信息可包括但不限于生物标志物状态信息。
[0223]
启动子:如本文所用,“启动子”可以指直接或间接(例如,通过启动子结合的蛋白质或物质)与rna聚合酶结合并参与编码序列转录起始的dna调控区。
[0224]
参考:如本文所用,描述了相对于其进行比较的标准或对照。例如,在一些实施方式中,例如,如本文所提出的,将感兴趣的试剂、受试者、动物、个体、群体、样品、序列或值与参考或对照试剂、受试者、动物、个体、群体、样品、序列或值进行比较。在一些实施方式中,例如,如本文所提出的,与感兴趣样品中的特征的测试或确定基本上同时地测试和/或确定参考或其特征。在一些实施方式中,例如,如本文所提出的,参考是历史参考,可选地体现在有形媒介中。通常,如本领域技术人员将理解的,参考是在与评估中的那些可比较的条件或环境下确定或表征,例如,关于样品。当存在足够的相似性以证明对特定可能参考或对照的依赖和/或比较是合理的时,本领域技术人员将理解。
[0225]
风险:如本文所用,关于疾病、病症或状况,术语“风险”是指特定个体发展疾病、病症或状况的定量概率(无论以百分比或其他方式表示)的定性。在一些实施方式中,例如,如本文所提出的,风险表示为百分比。在一些实施方式中,例如,如本文所提出的,风险是等于或大于0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100%的定量概率的定性。在一些实施方式中,例如,如本文所提出的,风险被表达为相对于参考风险或水平的风险或归因于参考的相同结果的风险的定量水平的定性。在一些实施方式中,例如,如本文所提出的,相对风险与参考样品相比增加或减少了的系数为1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、10或更多。
[0226]
样品:如本文所用,术语“样品”通常是指从感兴趣的来源获得或衍生的材料的等分试样。在一些实施方式中,例如,如本文所提出的,感兴趣的来源是生物或环境来源。在一些实施方式中,例如,如本文所提出的,样品是直接从感兴趣的来源获得的“原始样品”。在一些实施方式中,例如,如本文所提出的,从上下文中将清楚,术语“样品”是指通过处理原始样品(例如,通过去除一种或多种成分和/或通过将一种或多种试剂添加到原始样品中)获得的制剂。这样的“处理过的样品”可以包括例如从样品中提取的或通过使原始样品经受诸如核酸的扩增或逆转录、某些成分的分离和/或纯化等技术获得的细胞、核酸或蛋白质,等等。
[0227]
在某些情况下,例如,如本文所提出的,处理过的样品可以是已被扩增(例如,预扩增)的dna样品。因此,在各种情况下,例如,如本文所提出的,鉴定的样品可以指样品的原始形式或样品的加工形式。在一些情况下,酶消化的dna样品可以指初级酶消化的dna(酶消化的直接产物)或进一步加工的样品,例如酶消化的dna,其已经经过扩增步骤(例如,中间扩增步骤,例如预扩增)和/或过滤步骤、纯化步骤或修饰样品的步骤以促进进一步的步骤,例如在确定甲基化状态(例如,dna的原始样品的甲基化状态和/或存在于其原始来源背景中的dna的原始样品的甲基化状态)。
[0228]
筛查:如本文所用,术语“筛查”是指旨在生成诊断信息和/或预后信息的任何方法、技术、过程或任务。因此,本领域技术人员将理解,术语筛查涵盖确定个体是否患有、可能患有或发展、或有风险患有或发展疾病、病症或状况,例如,结肠直肠癌的方法、技术、过程或任务。
[0229]
特异性:如本文所用,生物标志物的“特异性”是指以不存在感兴趣的事件或状态为特征的样品的百分比,对此,生物标志物的测量准确地表明不存在感兴趣的事件或状态(真阴性率)。在各种实施方式中,例如,如本文所提出的,阴性样品的表征不依赖于生物标志物,并且可以通过任何相关测量来实现,例如本领域技术人员已知的任何相关测量。因此,特异性反映了当在未表征感兴趣的事件或状态的样品中测量时生物标志物检测不存在感兴趣的事件或状态的概率。在其中感兴趣的事件或状态是结肠直肠癌的特定实施方式中,例如,如本文所提出的,特异性是指生物标志物检测没有结肠直肠癌的受试者中没有结肠直肠癌的概率。例如,可以通过组织学来确定没有结肠直肠癌。
[0230]
灵敏度:如本文所用,生物标志物的“灵敏度”是指以存在感兴趣的事件或状态为特征的样品的百分比,对此,生物标志物的测量准确地表明存在感兴趣的事件或状态(真阳性率)。在各种实施方式中,例如,如本文所提出的,阳性样品的表征不依赖于生物标志物,并且可以通过任何相关测量来实现,例如本领域技术人员已知的任何相关测量。因此,灵敏度反映了当在以存在感兴趣的事件或状态为特征的样品中测量时,生物标志物将检测到感兴趣的事件或状态存在的概率。在其中感兴趣的事件或状态是结肠直肠癌的特定实施方式中,例如,如本文所提出的,灵敏度是指生物标志物检测患有结肠直肠癌的受试者中是否存在结肠直肠癌的概率。结肠直肠癌的存在可以例如通过组织学来确定。
[0231]
实体瘤:如本文所用,术语“实体瘤”是指包括癌细胞在内的异常组织块。在各种实施方式中,例如,如本文所提出的,实体瘤是或包括不包含囊肿或液体区域的异常组织块。在一些实施方式中,例如,如本文所提出的,实体瘤可以是良性的;在一些实施方式中,实体瘤可以是恶性的。实体瘤的例子包括癌、淋巴瘤和肉瘤。在一些实施方式中,例如,如本文所
提出的,实体瘤可以是或包括肾上腺、胆管、膀胱、骨、脑、乳腺、子宫颈、结肠、子宫内膜、食道、眼睛、胆囊、胃肠道、肾、喉、肝、肺、鼻腔、鼻咽、口腔、卵巢、阴茎、垂体、前列腺、视网膜、唾液腺、皮肤、小肠、胃、睾丸、胸腺、甲状腺、子宫、阴道和/或外阴肿瘤。
[0232]
癌症分期:如本文所用,术语“癌症分期”是指对癌症进展水平的定性或定量评估。在一些实施方式中,例如,如本文所提出的,用于确定癌症分期的标准可以包括但不限于癌症在身体中的位置、肿瘤大小、癌症是否已经扩散到淋巴结、癌症是否已经扩散到身体的一个或多个不同部位等。在一些实施方式中,例如,如本文所提出的,可以使用所谓的tnm系统对癌症进行分期,根据该系统,t是指主要肿瘤的大小和范围,通常称为原发肿瘤;n是指附近有癌症的淋巴结数量;m是指癌症是否已经转移。在一些实施方式中,例如,如本文所提出的,癌症可被称为0期(存在异常细胞但尚未扩散到附近组织,也称为原位癌或cis;cis不是癌症,但它可以变成癌症)、i-iii期(存在癌症;数字越大,肿瘤越大,扩散到附近组织越多),或iv期(癌症已扩散到身体的远处部位)。在一些实施方式中,例如,如本文所提出的,癌症可被指定为选自由以下组成的组的阶段:原位(存在异常细胞但未扩散至附近组织);局部(癌症仅限于它开始的地方,没有扩散的迹象);区域性(癌症已经扩散到附近的淋巴结、组织或器官):远处(癌症已经扩散到身体的远处部位);和未知(没有足够的信息来鉴定癌症分期)。
[0233]

……
易感:对疾病、病症或状况“易感”的个体有风险发展该疾病、病症或状况。在一些实施方式中,例如,如本文所提出的,对疾病、病症或状况易感的个体不表现出该疾病、病症或状况的任何症状。在一些实施方式中,例如,如本文所提出的,对疾病、病症或状况易感的个体尚未被诊断出患有该疾病、病症和/或状况。在一些实施方式中,例如,如本文所提出的,对疾病、病症或状况易感的个体是已经暴露于与疾病、病症或状况的发展相关的状况或呈现与疾病、病症或状况的发展相关的生物标志物状态(例如甲基化状态)的个体。在一些实施方式中,例如,如本文所提出的,发展疾病、病症和/或状况的风险是基于人群的风险(例如,患有疾病、病症或状况的个体的家庭成员)。
[0234]
受试者:如本文所用,术语“受试者”是指生物体,通常是哺乳动物(例如,人)。在一些实施方式中,例如,如本文所提出的,受试者患有疾病、病症或状况。在一些实施方式中,例如,如本文所提出的,受试者对疾病、病症或状况易感。在一些实施方式中,例如,如本文所提出的,受试者表现出疾病、病症或状况的一个或多个症状或特征。在一些实施方式中,例如,如本文所提出的,受试者未患有疾病、病症或状况。在一些实施方式中,例如,如本文所提出的,受试者不表现出疾病、病症或状况的任何症状或特征。在一些实施方式中,例如,如本文所提出的,受试者是具有对疾病、病症或状况的易感性或风险为特征的一种或多种特性的人。在一些实施方式中,例如,如本文所提出的,受试者是患者。在一些实施方式中,例如,如本文所提出的,受试者是已对其进行诊断和/或已对其进行治疗的个体。在某些情况下,例如,如本文所提出的,人类受试者可以互换地称为“个体”。
[0235]
治疗剂:如本文所用,术语“治疗剂”是指当施用于受试者时引起所需药理学作用的任何试剂。在一些实施方式中,例如,如本文所提出的,如果一种试剂在合适的人群中表现出统计学上显著的效果,则该试剂被认为是治疗剂。在一些实施方式中,例如,如本文所提出的,合适的群体可以是模型生物体群体或人类群体。在一些实施方式中,例如,如本文所提出的,合适的群体可以通过各种标准定义,例如特定年龄组、性别、遗传背景、预先存在
的临床状况等。在一些实施方式中,例如,如本文所提出的,治疗剂是可用于治疗疾病、病症或状况的物质。在一些实施方式中,例如,如本文所提出的,治疗剂是在其可上市用于施用于人类之前已经或需要由政府机构批准的试剂。在一些实施方式中,例如,如本文所提出的,治疗剂是需要医学处方才能施用于人类的试剂。
[0236]
治疗:如本文所用,术语“治疗”(也称为“治疗”或“治疗”)是指施用部分或完全减轻、改善、缓解、抑制、延迟特定疾病、病症或状况的发作、降低特定疾病、病症或状况的严重程度和/或降低特定疾病、病症或状况的一种或多种症状、特征和/或原因的发生率,或为实现任何此类结果的目的而施用。在一些实施方式中,例如,如本文所提出的,此类治疗可以针对不表现出相关疾病、病症或状况的迹象的受试者和/或仅表现出疾病、病症或状况的早期征兆的受试者。作为选择或另外,此类治疗可以针对表现出相关疾病、病症和/或状况的一种或多种确定迹象的受试者。在一些实施方式中,例如,如本文所提出的,治疗可以针对已被诊断患有相关疾病、病症和/或状况的受试者。在一些实施方式中,例如,如本文所提出的,治疗可以针对已知具有一种或多种易感因素的受试者,所述一种或多种易感因素与相关疾病、病症或状况的发展风险增加在统计学上相关。在各种实例中,治疗是针对癌症的。
[0237]
上游:如本文所用,术语“上游”是指第一dna区相对于第二dna区更靠近包括第一dna区和第二dna区的核酸的n末端。
[0238]
未甲基化:如本文所用,术语“未甲基化”和“非甲基化”可互换使用,是指鉴定的dna区不包括甲基化核苷酸。
[0239]
变体:如本文所用,术语“变体”是指与参考实体显示显著结构同一性但与参考实体相比在一个或多个化学部分的存在、不存在或水平上与参考实体在结构上不同的实体。在一些实施方式中,例如,如本文所提出的,变体在功能上也不同于其参考实体。一般而言,特定实体是否被适当地视为参考实体的“变体”取决于其与参考实体的结构同一性程度。变体可以是与参考相当但不完全相同的分子。例如,变体核酸可以在核苷酸序列的一个或多个差异处不同于参考核酸。在一些实施方式中,例如,如本文所提出的,变体核酸显示与参考核酸的总体序列同一性为至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%。在许多实施方式中,例如,如本文所提出的,如果感兴趣的核酸具有与参考的序列相同但在特定位置有少量序列改变的序列,则感兴趣的核酸被认为是参考核酸的“变体”。在一些实施方式中,例如,如本文所提出的,与参考相比,变体具有10、9、8、7、6、5、4、3、2或1个取代的残基。在一些实施方式中,例如,如本文所提出的,与参考相比,变体具有不超过5、4、3、2或1个残基添加、取代或缺失。在各种实施方式中,例如,如本文所提出的,添加、取代或缺失的数目少于约25、约20、约19、约18、约17、约16、约15、约14、约13、约10、约9、约8个、约7个、约6个,并且通常少于约5个、约4个、约3个或约2个残基。
附图说明
[0240]
通过结合附图参考以下描述,本公开的前述和其他目的、方面、特征和优点将变得更加明显和更好理解,其中:
[0241]
图1是显示示例msre-qpcr方法的示意图。
[0242]
图2是显示用于训练用于开发生物标志物特征的计算模型的166个受试者的训练集的特征的表格。女性受试者的数量,男性受试者的数量,以及受试者的平均年龄和范围。
受试者被诊断为患有结肠直肠癌(crc)、健康对照受试者(对照;被诊断患有增生性息肉,被诊断为患有非进行性腺瘤(naa)的患者,以及结肠镜检查未发现结果的患者)。图2基于结肠镜检查评估进一步区分患有crc的患者的癌症位置为近端或远端。
[0243]
图3是显示用于验证所选标志物的535名人类受试者的验证组的特征的表格。3提供了女性受试者的数量、男性受试者的数量以及受试者的平均年龄和范围。受试者被诊断为患有结肠直肠癌(crc),健康对照受试者(对照组;被诊断患有增生性息肉,被诊断为患有非进行性腺瘤(naa)的患者,以及结肠镜检查未发现结果的患者)和患有进行性腺瘤(aa)的患者。
[0244]
图4显示了对受试者的验证集进行的初始主成分分析的图表。受试者被分为三组:患有进行性腺瘤的患者(aa)、对照患者(cnt)和患有结肠直肠癌的患者(crc)。对照患者(cnt)被定义为结肠镜检查未发现结果的患者、具有增生性息肉的患者和非进行性腺瘤的患者(naa)。围绕三个分组中的每一个都绘制了相关圆圈。
[0245]
图5a是显示使用dmr的40个标志物组对535个受试者组进行结肠直肠癌筛查的图表。显示了验证组所有受试者的roc和auc。
[0246]
图5b是显示准确度值的图表,从左到右包括进行性腺瘤筛查的总体灵敏度、结肠直肠癌筛查的总体灵敏度、局部结肠直肠癌的结直肠筛查灵敏度、晚期结肠直肠癌的结直肠筛查灵敏度,以及对照受试者(结肠镜检查无结果、有增生性息肉和/或诊断为非进行性腺瘤(naa)的患者)的结肠直肠筛查的特异性。
[0247]
图6显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_29_1的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0248]
图7显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_272.3_2的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0249]
图8显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_277.7_2的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0250]
图9显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_272.4的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0251]
图10显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试
者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_174.3的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0252]
图11显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_260.2_1的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0253]
图12显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_260.1的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0254]
图13显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_137.1的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0255]
图14显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_17_2的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0256]
图15显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为udx_230的区域的msre-qpcr的ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去ct值(45

ct)。较高的45

ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
[0257]
图16是显示正常细胞和癌细胞之间甲基化状态的示例甲基化变化的示意图,并进一步表明甲基化状态的变化如何能够影响正常细胞和癌细胞之间的基因表达差异。
[0258]
图17是例如,如本文所述在某些实施方式中使用的示例性云计算环境的框图。
[0259]
图18是例如,如本文所述在某些实施发生中使用的示例性计算设备和示例性移动计算设备的框图。
[0260]
本发明的特征和优点将在下面结合附图的详细描述中变得更加明显。
具体实施方式
[0261]
预期要求保护的本发明的系统、架构、设备、方法和过程包括使用来自这里描述的实施方式的信息开发的变化和适应。如本说明书所设想的,可以执行本文描述的系统、架
构、设备、方法和过程的适应和/或修改。
[0262]
在整个说明书中,在物品、设备、系统和架构描述为具有、包括或包含特定组件的情况下,或者在过程和方法被描述为具有、包括或包含特定步骤的情况下,预期另外还存在本发明的物品、设备、系统和架构,其基本上由所述组件组成或由所述组件组成,并且存在基本上由所述处理步骤组成或由所述处理步骤组成的根据本发明的过程和方法。
[0263]
应当理解,只要本发明保持可操作,步骤的顺序或执行某些动作的顺序是无关紧要的。此外,可以同时进行两个以上步骤或动作。
[0264]
在此提及任何出版物,例如在背景部分中提及,并不承认该出版物作为本文提出的任何权利要求的现有技术。背景部分是为了清楚起见而呈现的,并不意味着对任何权利要求的现有技术的描述。
[0265]
如所指出的,文献通过引用并入本文。如果特定术语的含义存在任何差异,则以上定义部分中提供的含义是控制性的。
[0266]
提供标题是为了方便读者——标题的存在和/或放置并不旨在限制本文所述主题的范围。
[0267]
结肠直肠癌的筛查
[0268]
需要改进的筛查结肠直肠癌和/或进行性腺瘤的方法,包括用于早期结肠直肠癌的筛查。尽管建议对个体(例如50岁以上)进行筛查,但结肠直肠癌筛查计划通常是无效的或不令人满意的。改进的结肠直肠癌和/或进行性腺瘤筛查可改善诊断并降低结肠直肠癌死亡率。
[0269]
dna甲基化(例如,超甲基化或低甲基化)可以激活或失活基因,包括影响癌症发展的基因(参见,例如,图16)。因此,例如,超甲基化可使一种或多种通常用于抑制癌症的基因失活,从而导致或促进样品或受试者中的癌症发展。
[0270]
本公开包括下述发现,本文提供的一个或多个甲基化基因座的甲基化状态,和/或本文提供的一个或多个dmr的甲基化状态,和/或本文提供的一个或多个甲基化位点的甲基化状态的确定可以提供例如具有高度灵敏度和/或特异性的结肠直肠癌和/或进行性腺瘤筛查。本公开提供包括或涉及结肠直肠癌和/或进行性腺瘤的甲基化生物标志物的组合物和方法,其单独地或在包含两种以上生物标志物的各种组中,以高度特异性和/或灵敏度提供对结肠直肠癌的筛查。
[0271]
在各种实施方式中,例如,如本文所提出的,本公开的结肠直肠癌和/或进行性腺瘤甲基化生物标志物选自甲基化基因座,该基因座是或包括如以下表1中鉴定的差异甲基化区域(dmr)的序列的一部分(例如,至少1个共同碱基对)。dmr由dmr所在的染色体编号(chr.no.)、染色体上dmr的起始位置(起始碱基对)、染色体上dmr的结束位置、dmr的宽度,与dmr重叠或包含在dmr中的一个或多个基因的注释名称(如果可获得),以及dmr的序列id号,序列id号如说明书的“序列”部分和提供的序列表中所示。所鉴定的区域的染色体编号和开始(起始碱基对)和结束(结束碱基对)位置是参考鉴定为grch38的人类基因组构建。
[0272]
表1.进行性腺瘤和结肠直肠癌筛查时的69个目的dmr的列表。
[0273]
[0274]
[0275][0276]
为避免任何疑问,本文提供的任何甲基化生物标志物尤其可以是或被包括在结肠直肠癌甲基化生物标志物和/或进行性腺瘤甲基化生物标志物中。
[0277]
在一些实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物可以是或包括单个甲基化基因座。在一些实施方式中,例如,如本文所提出的,所述甲基化生物标志物可以是或包括两个以上甲基化基因座。在一些实施方式中,例如,如本文所提出的,所述甲基化生物标志物可以是或包括单个差异甲基化区域(dmr)。甲基化生物标志物可以是或包括单个甲基化位点。在其他实施方式中,例如,如本文所提出的,甲基化生物标志物可以是或包括两个以上甲基化位点。在一些实施方式中,例如,如本文所提出的,甲基化基因座可以包括两个以上dmr并且进一步包括与一个或多个所包括的dmr相邻的dna区。
[0278]
在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因,例如表1中提供的基因。在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的一部分,例如表1中提供的基因的一部分。在一些情况下,例如,如本文所提出的,甲基化基因座包括但不限于基因的经鉴定核酸边界。在一些情况下,例如,如本文所提出的,甲基化基因座位于先前注释的基因之外,例如表1中提供的基因序列的未注释区域。在一些情况下,例如,如本文所提出的,甲基化基因座是或包括多个基因的一部分,例如,如表1中提供的。
[0279]
在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的编码区,例如表1中提供的基因的编码区。在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的编码区的一部分,例如,表1中提供的基因的编码区的一部分。在一些情况下,例如,如本文所提出的,甲基化基因座包括但不限于基因编码区的经鉴定的核酸边界。
[0280]
在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的启动子和/或其他调控区,例如表1中提供的基因的启动子和/或其他调控区。在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的启动子和/或调控区的一部分,例如表1中提供的基因的启动子和/或调控区的一部分。在一些情况下,例如,如本文所提出的,甲基化基因座包括但不限于基因的启动子和/或其他调控区的经鉴定核酸边界。在一些实施方式中,例如,如本文所提出的,甲基化基因座是或包括高cpg密度启动子,或其一部分。
[0281]
在一些实施方式中,例如,如本文所提出的,甲基化基因座是或包括非编码序列。在一些实施方式中,例如,如本文所提出的,甲基化基因座是或包括一个或多个外显子和/或一个或多个内含子。
[0282]
在一些实施方式中,例如,如本文所提出的,甲基化基因座包括在编码序列上游延伸预定数量的核苷酸的dna区,和/或在编码序列下游延伸预定数量的核苷酸的dna区。在各
种情况下,例如,如本文所提出的,上游和/或下游的预定数量的核苷酸是或包括例如500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。本领域技术人员将理解,能够影响编码序列表达的甲基化生物标志物通常可以在编码序列上游和/或下游的任何这些距离内。
[0283]
本领域技术人员将理解,鉴定为甲基化生物标志物的甲基化基因座不必在单个实验、反应或扩增子中进行测试。鉴定为结肠直肠癌和/或进行性腺瘤甲基化生物标志物的单个甲基化基因座可以例如以下述方法测试,所述方法包括单独扩增甲基化基因座内的一个或多个独立或重叠dna区(或提供足以扩增甲基化基因座内的一个或多个不同或重叠dna区的寡核苷酸引物和条件)。本领域技术人员将进一步理解,不需要分析被鉴定为甲基化生物标志物的甲基化基因座的每个核苷酸的甲基化状态,也不需要分析存在于甲基化基因座内的每个cpg。相反,可以例如通过分析甲基化基因座内的单个dna区,例如通过分析甲基化基因座内的单个dmr,来分析作为甲基化生物标志物的甲基化基因座。
[0284]
本公开的dmr可以是甲基化基因座或包括甲基化基因座的一部分。在一些情况下,例如,如本文所提出的,dmr是具有例如长度为1至5,000bp的甲基化基因座的dna区。在各种实施方式中,例如,如本文所提出的,dmr是具有长度等于或小于5000bp、4,000bp、3,000bp、2,000bp、1,000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp的甲基化基因座的dna区。在一些实施方式中,例如,如本文所提出的,dmr的长度为1、2、3、4、5、6、7、8或9bp。
[0285]
甲基化生物标志物,包括但不限于本文提供的甲基化基因座、甲基化位点和dmr。
[0286]
为清楚起见,本领域技术人员将理解术语甲基化生物标志物被广泛使用,使得甲基化基因座可以是包括一个或多个dmr的甲基化生物标志物,其中每个dmr本身也是甲基化生物标志物,并且每个所述dmr可以包括一个或多个甲基化位点,每个所述甲基化位点本身也是甲基化生物标志物。此外,甲基化生物标志物可以包括两个以上甲基化基因座。因此,作为甲基化生物标志物的状态不会开启生物标志物中包含的核酸的连续性,而是开启第一状态和第二状态之间(例如在结肠直肠癌和对照之间,和/或在进行性腺瘤和对照之间)所包含的dna区的甲基化状态变化的存在。
[0287]
如本文所提供的,甲基化基因座可以是一个或多个甲基化基因座中的任何一个,其中每个甲基化基因座是或包括如表1中鉴定的遗传区域(例如,dmr)。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括单个甲基化基因座,该基因座是或包括表1中鉴定的基因(全部或部分)。
[0288]
在一些具体实施方式中,例如,如本文所述,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括两个以上甲基化基因座,每个甲基化基因座是或包括表1中鉴定的遗传区域。在一些实施方式中,例如,如所述在本文中,甲基化生物标志物包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69个甲基化基因座,其中每个包括表1中鉴定的遗传区域(全部或部分)。
[0289]
表2-4中提供的dmr序列是由表1的dmr中一部分组成、与其重叠或包含其的选定区
域。也就是说,表2-4中每个已鉴定的dna区域涵盖了表1中鉴定的dmr的一部分直至包括表1中鉴定的所有dmr。为了清楚起见,表1的dmr与表2-4的dmr重叠的评估是基于序列开始和结束位置以及染色体数进行的。如果在同一染色体上发现两个dmr,并且两个dmr序列中的一个在起点和终点之间或在两个dmr序列的第二个的起点和终点之一处具有起点和/或终点,则它们被视为重叠。例如,表4的udx_224.14(seq id no.190)涵盖了21号染色体上111个连续碱基对的选择。所有111个连续碱基对均在表1的seq id no.67中找到,该序列也发现于21号染色体。udx_224.14的起点是26844767,终点在26844877,而seq id no.67的起点是26843133,终点是26845357。由于发现udx_224.14的起点和终点都在seq id no.67的起点和终点之间,并且都在同一条染色体上,因此它们相互重叠,因此共享相同的重叠序列。
[0290]
在另一个实例中,表4的udx_244_2(seq id no.213)与表1的seq id no.2的一部分重叠(即,不包括全部)。udx_244_2的长度为213个碱基对,并与长度为242个碱基对的seq id no.2共享73个碱基对的连续序列。udx_224_2在1号染色体上的起始位置为107140056,结束位置为107140173。seq id no.2的起始位置为107140100,结束位置为107140341。因此,由于seq id no.2的起始位置在udx_224.2的起始和结束位置之间并且都都位于1号染色体上,这些序列也被称为彼此“重叠”。在一些特定实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括三个以上甲基化基因座,三个以上甲基化基因座中的每一个是或包括在表1至4中任一个中鉴定的遗传区域,包括但不限于三个以上甲基化基因座的组合,它们分别是或包括在表2至4之一中鉴定的遗传区域。
[0291]
在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括三个甲基化基因座,所述三个甲基化基因座包括这样的甲基化基因座,其是或包括表2中鉴定的遗传区域。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌甲基化生物标志物包括10个甲基化基因座,所述10个甲基化基因座包括这样的甲基化基因座,其是或包括表3中鉴定的遗传区域。在一些特定实施方式中,例如,如本文所提出的,结肠直肠癌甲基化生物标志物包括40个甲基化基因座,所述40个甲基化基因座包括这样的甲基化基因座,其是或包括表4中鉴定的遗传区域。
[0292]
表2. 3个甲基化位点的组合,按对结肠直肠癌和/或进行性腺瘤诊断的重要性的顺序排序。
[0293][0294]
表3. 10个甲基化位点的组合,按对结肠直肠癌和/或进行性腺瘤诊断的重要性的顺序排序
[0295][0296]
表4. 40个甲基化位点的组合,按对结肠直肠癌和/或进行性腺瘤诊断的重要性的顺序排序
[0297]
[0298][0299]
如本文所提供的,dmr可以是一种或多种dmr中的任何一种,其中的每一个都存在于甲基化基因座中,所述甲基化基因座是或包括表1中鉴定的遗传区域的(全部或部分)。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物是或包括单个dmr,所述单个dmr包括表1中鉴定的遗传区域的全部或部分,或存在于其中。
[0300]
在一些具体的实施方式中,例如,如本文所提出的,结肠直肠癌甲基化生物标志物包括三个以上dmr,其中的每一个是、包括表1中鉴定的遗传区域的全部或部分,或存在于表1中鉴定的遗传区域中。在一些实施方式中,例如,如本文所提出的,结肠直肠癌甲基化生物标志物包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69个dmr,其中每个都包括表1中鉴定的遗传区域的(全部或部分)。
[0301]
在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括两个以上dmr,所述两个以上dmr中的每一个是、包括表1-4中的任何一
个鉴定的基因的全部或部分,或者存在于表1-4中的任何一个鉴定的基因中。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括三个dmr,所述三个dmr包括这样的dmr,其是、包括表2中鉴定的基因区域的全部或部分,或者存在于表2中鉴定的基因区域中。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括10个dmr,所述10个dmr包括这样的dmr,其是、包括表3中鉴定的基因区域的全部或部分,或者存在于表3中鉴定的基因区域中。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括40个dmr,所述40个dmr包括这样的dmr,其是、包括表4中鉴定的基因区域的全部或部分,或者存在于表4中鉴定的基因区域中。
[0302]
在各种实施方式中,例如,如本文所提出的,甲基化生物标志物可以是或包括存在于本文提供的一个或多个甲基化基因座(例如,一个或多个dmr)中的一个或多个个体核苷酸(例如,cpg情况中的单个个体半胱氨酸残基)或多个个体半胱氨酸残基(例如,多个cpg的多个单独的半胱氨酸残基)。因此,在某些实施方式中,甲基化生物标志物是或包括多个个体甲基化位点的甲基化状态。
[0303]
在各种实施方式中,例如,如本文所提出的,甲基化生物标志物是或包括或特征在于甲基化状态的变化,所述变化是一个或多个甲基化基因座(例如,一个或多个dmr)内的一个或多个甲基化位点的甲基化的变化。在各种实施方式中,例如,如本文所提出的,甲基化生物标志物是或包括甲基化状态的变化,所述变化是一个或多个甲基化基因座(例如,一个或多个dmr)内甲基化位点数量的变化。在各种实施方式中,例如,如本文所提出的,甲基化生物标志物是或包括甲基化状态的变化,所述变化是一个或多个甲基化基因座(例如,一个或多个dmr)内甲基化位点频率的变化。在各种实施方式中,例如,如本文所提出的,甲基化生物标志物是或包括甲基化状态的变化,所述变化是一个或多个甲基化基因座(例如,一个或多个dmr)内甲基化位点模式的变化。
[0304]
在各种实施方式中,例如,如本文所提出的,一个或多个甲基化基因座(例如,一个或多个dmr)的甲基化状态表示为被甲基化的样品中存在的一个或多个甲基化基因座(例如,一个或多个dmr)的分数或百分比,例如,作为在一个或多个特定甲基化基因座(例如,一个或多个特定dmr)处甲基化的样品中dna的单个dna链的数量的分数。本领域技术人员将理解,在一些情况下,例如,如本文所提出的,甲基化的分数或百分比可以从例如样品内的一个或多个分析的dmr的甲基化dmr与未甲基化dmr的比率计算。在一些实施方式中,例如,如本文所提出的,一个或多个甲基化基因座(例如,一个或多个dmr)的甲基化状态表示为被甲基化的cpg岛的一个或多个区域的分数或百分比。
[0305]
在各种实施方式中,例如,如本文所提出的,将一个或多个甲基化基因座(例如,一个或多个dmr)的甲基化状态与参考甲基化状态值和/或与参考样品中的一个或多个甲基化基因座(例如,一个或多个dmr)的甲基化状态进行比较。在某些情况下,例如,如本文所提出的,参考是来自相同来源的非同期样品,例如来自相同来源的先前样品,例如来自相同受试者。在某些情况下,例如,如本文所提出的,一个或多个甲基化基因座(例如,一个或多个dmr)的甲基化状态的参考是已知代表特定状态(例如,癌症状态或非癌症状态)的样品(例如,来自受试者的样品)或多个样品中一个或多个甲基化基因座(例如,一个或多个dmr)的甲基化状态)。因此,参考可以是或包括一个或多个预定阈值,该预定阈值可以是定量的(例
如甲基化值)或定性的。在某些情况下,例如,如本文所提出的,dmr甲基化状态的参考是在不包括dmr的核苷酸的同一样品中存在的一个核苷酸或多个核苷酸(例如,多个连续寡核苷酸)的甲基化状态。本领域技术人员将理解,参考测量通常通过使用与进行非参考测量的方法相同、相似或相当的方法进行测量来产生。
[0306]
不希望受任何特定科学理论的束缚,图16提供了基因调控序列的超甲基化或低甲基化可以影响表达的一种可能机制的示意图。如图16所示,低甲基化可导致表达增加和/或超甲基化可导致表达抑制。在各种情况下,例如,如本文所提出的,与参考相比,表达调控区例如启动子区和增强子区的甲基化增加可以降低或沉默可操作地连接的基因的表达,例如通常起到抑制癌症作用的可操作地连接的基因的表达。在各种实施方式中,例如,如本文所提出的,与参考相比,表达调节区例如启动子区和增强子区的甲基化降低可以增加可操作地连接的基因的表达,例如具有有助于肿瘤发生的活性的可操作地连接的基因的表达。不希望受任何特定科学理论的束缚,dna甲基化可以提供比rna表达或蛋白质表达本身更具有化学和生物学稳定性的癌症状态指标。
[0307]
甲基化通常被认为是高度组织特异性的,提供了dna序列分析中不一定存在的信息维度。
[0308]
实质上有助于肿瘤发生的甲基化事件可以发生在例如与癌症相关基因(例如通常起到抑制癌症作用的基因)可操作地连接的dna的表达调控区(例如,在启动子区、增强子区、转录因子结合位点、ctcf结合位点、cpg岛或其他序列)。因此,通常用于抑制癌症的基因的失活导致或促成肿瘤发生。
[0309]
癌症
[0310]
本公开的方法和组合物可用于筛查癌症,特别是结肠直肠癌,和结肠直肠癌的前体肿瘤(例如进行性腺瘤)。结肠直肠癌包括但不限于结肠癌、直肠癌及其组合。结肠直肠癌包括转移性结肠直肠癌和非转移性结肠直肠癌。结肠直肠癌包括位于结肠癌近端的癌症和位于结肠远端的癌症。
[0311]
结肠直肠癌包括本领域已知的各种可能分期中的任何一个的结肠直肠癌,包括例如i期、ii期、iii期和iv期结肠直肠癌(例如0、i、iia、iib、iic、iiia、iiib、iiic、iva、ivb和ivc期)。结肠直肠癌包括肿瘤/淋巴结/转移(tnm)分期系统的所有阶段。对于结肠直肠癌,t可以指肿瘤是否生长到结肠壁还是直肠壁中,如果如此的话多少层;n可以指肿瘤是否已经扩散到淋巴结,如果如此,有多少个淋巴结以及它们位于哪里;并且m可以指癌症是否已经扩散到身体的其他部位,如果如此,已经扩散到哪些部位,扩散到什么程度。t、n和m的特定阶段是本领域已知的。t阶段可以包括tx、t0、tis、t1、t2、t3、t4a和t4b;n阶段可以包括nx、n0、n1a、n1b、n1c、n2a和n2b;m阶段可以包括m0、m1a和m1b。此外,结肠直肠癌的等级可包括gx、g1、g2、g3和g4。癌症、尤其是结肠直肠癌分期的各种手段是本领域众所周知的,例如在万维网上的cancer.net/cancer-types/colorectal-cancer/stages上总结的。
[0312]
在某些情况下,例如,如本文所提出的,本公开内容包括早期结肠直肠癌的筛查。早期结肠直肠癌可以包括例如位于受试者内的结肠直肠癌,例如,因为它们尚未扩散至受试者的淋巴结,例如癌附近的淋巴结(n0期),并且尚未扩散至远端位点(m0期)。早期癌症包括对应于例如0至ii c期的结肠直肠癌。
[0313]
因此,本公开的结肠直肠癌尤其包括恶性前结肠直肠癌(例如进行性腺瘤)和恶性
结肠直肠癌。本公开的方法和组合物可用于筛查所有形式和阶段的结肠直肠癌,包括但不限于本文命名的或本领域已知的那些,以及其所有亚组。因此,本领域技术人员将理解,此处提供的对结肠直肠癌的所有参考包括但不限于其所有形式和阶段的结肠直肠癌,包括但不限于本文命名的或本领域已知的那些,以及所有其亚组。
[0314]
受试者和样品
[0315]
使用本文提供的方法和组合物分析的样品可以是任何生物样品和/或任何样品,包括核酸。在各种特定实施方式中,使用本文提供的方法和组合物分析的样品可以是来自哺乳动物的样品。在各种特定实施方式中,使用本文提供的方法和组合物分析的样品可以是来自人类受试者的样品。在各种特定实施方式中,使用本文提供的方法和组合物分析的样品可以是来自小鼠、大鼠、猪、马、鸡或牛的样品。
[0316]
在各种情况下,例如,如本文所提出的,人类受试者是被诊断或寻求诊断为患有癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,被诊断为或寻求诊断为有风险患癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,和/或被诊断为或寻求诊断为有直接风险患癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者。在各种情况下,例如,如本文所提出的,人类受试者是被鉴定为需要结肠直肠癌和/或进行性腺瘤筛查的受试者。在某些情况下,例如,如本文所提出的,人类受试者是被鉴定为需要由执业医师进行结肠直肠癌和/或进行性腺瘤筛查的受试者。在各种情况下,例如,如本文所提出的,人类受试者被鉴定为由于年龄而需要筛查,例如由于年龄等于或大于50岁,例如年龄等于或大于50、55、60、65、70、75、80、85或90岁。在各种情况下,例如,如本文所提出的,人类受试者是未被诊断为患有癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,没有风险患癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,或没有直接风险患癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,未被诊断为患有癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,和/或没有尝试诊断癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,或其任何组合。
[0317]
来自受试者例如人类或其他哺乳动物受试者的样品可以是例如血液、血液成分、cfdna、ctdna、粪便或结肠直肠组织的样品。在一些特定实施方式中,样品是受试者的排泄物或体液(例如受试者的唾液、粪便、血液、淋巴液或尿液)、结肠直肠癌组织样品或腺瘤或息肉组织样品。来自受试者的样品可以是细胞或组织样品,例如具有癌症或包括癌细胞(例如具有肿瘤或转移性组织)的细胞或组织样品。在各种实施方式中,例如,如本文所提出的,可以通过活组织检查(例如,细针抽吸或组织活组织检查)或手术获得来自受试者例如人或其他哺乳动物受试者的样品。
[0318]
在各种实施方式中,例如,如本文所提出的,样品是无细胞dna(cfdna)样品。cfdna通常以短的双链片段形式存在于人体生物体液(例如血浆、血清或尿液)中。cfdna的浓度通常很低,但在特定条件下会显著增加,包括但不限于怀孕、自身免疫性疾病、心肌梗塞和癌症。循环肿瘤dna(ctdna)是特异性源自癌细胞的循环dna的组成部分。ctdna可以存在于与白细胞和红细胞结合或不与白细胞和红细胞结合的人类生物体液中。用于检测肿瘤来源的cfdna的各种测试基于对癌症(例如相关癌症)或癌前肿瘤(例如进行性腺瘤)特征的遗传或表观遗传修饰的检测。癌症特征的遗传或表观遗传修饰可包括但不限于肿瘤抑制基因中的致癌突变或癌症相关突变、活化的致癌基因、超甲基化和/或染色体疾病。检测癌症特征的
遗传或表观遗传修饰可以确认所检测的cfdna是ctdna。
[0319]
cfdna和ctdna可提供源组织甲基化状态的实时或近乎实时的指标。cfdna和ctdna在血液中的半衰期约为2小时,因此在给定时间采集的样品可以相对及时地反映源组织的状态。
[0320]
从样品中分离核酸(例如,从血液或血浆中分离cfdna)的各种方法是本领域已知的。核酸可以通过例如但不限于标准dna纯化技术,通过直接基因捕获(例如,通过澄清样品以去除测试抑制剂并用捕获剂从澄清样品中捕获靶核酸(如果存在的话),以产生捕获复合物,并分离捕获复合物以回收目标核酸)来分离。
[0321]
测量甲基化状态的方法
[0322]
甲基化状态可以通过本领域已知的多种方法和/或通过本文提供的方法测量。本领域技术人员将理解,用于测量甲基化状态的方法通常可应用于来自任何来源和任何种类的样品,并且将进一步理解可用于将样品修饰成适合通过以下方法进行测量的形式的处理步骤。测量甲基化状态的方法包括但不限于,包括甲基化状态特异性聚合酶链式反应(pcr)的方法、包括核酸测序的方法、包括质谱的方法、包括甲基化特异性核酸酶的方法、包括基于质量的分离的方法、包括目标特异性捕获的方法,包括甲基化特异性寡核苷酸引物在内的方法,包括杂交捕获靶向下一代测序在内的方法,包括基于扩增子的靶向下一代测序在内的方法,以及包括全基因组亚硫酸氢盐测序在内的方法。甲基化的某些特定的测试使用亚硫酸氢盐试剂(例如,亚硫酸氢根离子)。
[0323]
亚硫酸氢盐试剂尤其可包括亚硫酸氢盐(bisulfite)、焦亚硫酸氢盐(disulfite)、氢化亚硫酸盐(hydrogen sulfite)或它们的组合等,这些试剂可用于区分甲基化和未甲基化的核酸。亚硫酸氢盐与胞嘧啶和5-甲基胞嘧啶的相互作用不同。在典型的基于亚硫酸氢盐的方法中,dna与亚硫酸氢盐接触会使未甲基化的胞嘧啶脱氨基为尿嘧啶,而甲基化的胞嘧啶不受影响;选择性保留甲基化胞嘧啶,而不是未甲基化胞嘧啶。因此,在经亚硫酸氢盐处理的样品中,尿嘧啶残基代替未甲基化的胞嘧啶残基,并因此提供未甲基化胞嘧啶残基的识别信号,而残留的(甲基化)胞嘧啶残基因此提供甲基化胞嘧啶残基的识别信号。可以例如,通过pcr或通过全基因组亚硫酸氢盐测序来分析经亚硫酸氢盐处理的样品。
[0324]
各种甲基化测试程序可与亚硫酸氢盐处理结合使用,以确定靶序列如dmr的甲基化状态。此类测试可尤其包括甲基化特异性限制酶qpcr、甲基化敏感性限制酶qpcr、经亚硫酸氢盐处理的核酸的测序、pcr(例如,使用序列特异性扩增)、甲基化特异性核酸酶辅助的小等位基因富集pcr、甲基化敏感性高分辨率溶解、杂交捕获靶向下一代测序和基于扩增子的靶向下一代测序。在一些实施方式中,从经亚硫酸氢盐处理的dna样品中扩增dmr,并根据例如illumina方案或基于转座的nextera xt方案制备dna测序文库以用于测序。在某些实施方式中,高通量和/或下一代测序技术用于实现dna序列的碱基对水平解析,允许分析甲基化状态。当与亚硫酸氢盐处理相结合并覆盖人类基因组的很大一部分(例如,》50%)时,这些全基因组测序技术可统称为全基因组亚硫酸氢盐测序(wgbs)。
[0325]
在各种实施方式中,例如,如本文所提出的,甲基化状态通过包括使用甲基化特异性寡核苷酸引物的pcr扩增的方法(msp方法)检测,例如应用于经亚硫酸氢盐处理的样品(参见例如herman 1992 proc.natl.acad.sci.usa 93:9821-9826,其关于确定甲基化状态
的方法通过引用并入本文)。使用甲基化状态特异性寡核苷酸引物来扩增经亚硫酸氢盐处理的dna可以区分甲基化和非甲基化核酸。用于msp方法的寡核苷酸引物对包括至少一种寡核苷酸引物,其能够与包括甲基化位点(例如cpg)的序列杂交。在与胞嘧啶残基互补的位置包含t残基的寡核苷酸引物将选择性地与其中胞嘧啶在亚硫酸氢盐处理之前未甲基化的模板杂交,而在与胞嘧啶残基互补的位置包含g残基的寡核苷酸引物将在亚硫酸氢盐处理之前,与其中胞嘧啶是甲基化胞嘧啶的模板选择性杂交。msp结果可以在使用或不使用测序扩增子的情况下获得,例如使用凝胶电泳。msp(甲基化特异性pcr)允许使用亚硫酸氢盐转化的dna的pcr扩增对位点特异性dna甲基化进行高灵敏度检测(检测水平为0.1%的等位基因,具有完全特异性)。
[0326]
可用于确定样品在亚硫酸氢盐处理后的甲基化状态的另一种方法是甲基化敏感高分辨率溶解(ms-hrm)pcr(参见,例如hussmann 2018 methods mol biol.1708:551-571,其关于确定甲基化状态的方法通过引用并入本文)。ms-hrm是一种基于pcr的管内方法,其可基于杂交熔解检测感兴趣的特定基因座的甲基化水平。在执行ms-hrm之前对dna进行亚硫酸氢盐处理可确保甲基化和未甲基化dna之间的不同碱基组成,其用于通过高分辨率熔解分离所得扩增子。独特的引物设计促进了测试的高灵敏度,能够在未甲基化背景中检测低至0.1-1%的甲基化等位基因。用于ms-hrm测试的寡核苷酸引物设计为与甲基化等位基因互补,特定的退火温度使这些引物能够与甲基化和未甲基化等位基因退火,从而提高测试的灵敏度。
[0327]
另一种可用于在亚硫酸氢盐处理样品后确定甲基化状态的方法是定量多重甲基化特异性pcr(qm-msp)。qm-msp使用甲基化特异性引物对dna甲基化进行灵敏定量(参见,例如fackler 2018 methods mol biol.1708:473-496,其关于确定甲基化状态的方法通过引用并入本文)。qm-msp是一种两步pcr方法,在第一步中,一对基因特异性引物(正向和反向)在一个pcr反应中同时和多重扩增同一基因的甲基化和未甲基化拷贝。在36个pcr循环后,该甲基化独立扩增步骤可产生每μl高达109个拷贝的扩增子。在第二步中,使用实时pcr和两个独立的荧光团检测同一孔中每个基因的甲基化/未甲基化dna(例如6fam和vic),用标准曲线对第一次反应的扩增子进行量化。在100,000个参考基因拷贝中可检测到一个甲基化拷贝。
[0328]
另一种可用于确定在亚硫酸氢盐处理样品后甲基化状态的方法是甲基化特异性核酸酶辅助小等位基因富集(ms-name)(参见,例如,liu 2017 nucleic acids res.45(6):e39,其关于确定甲基化状态的方法通过引用并入本文)。ms-name基于对在双链(ds)dna(dsn)具有特异性的dna核酸酶的存在下探针与靶序列的选择性杂交,从而杂交产生随后被dsn消化的双链dna的区域。因此,靶向未甲基化序列的寡核苷酸探针产生局部双链区域,导致未甲基化靶标的消化;能够与甲基化序列杂交的寡核苷酸探针会产生局部双链区,其导致甲基化靶标的消化,使甲基化靶标保持完整。此外,寡核苷酸探针可以同时将dsn活性导向经亚硫酸氢盐处理的dna中的多个靶标。随后的扩增可以富集未消化的序列。ms-name可以单独使用或与本文提供的其他技术组合使用。
[0329]
另一种可用于确定在亚硫酸氢盐处理样品后甲基化状态的方法是甲基化灵敏度单核苷酸引物延伸(ms-snupe
tm
)(参见例如gonzalgo 2007 nat protoc.2(8):1931-6,其关于确定甲基化状态的方法通过引用并入本文)。在ms-snupe中,执行链特异性pcr以生成dna
模板,以用于使用ms-snupe进行定量甲基化分析。然后用寡核苷酸进行snupe,该寡核苷酸设计用于在被询问的cpg位点的紧接上游进行杂交。反应产物可以在聚丙烯酰胺凝胶上电泳,以用于通过磷光体图像分析进行可视化和定量。扩增子还可以携带直接或间接可检测的标记,例如荧光标记、放射性同位素或可脱离的分子片段或具有可通过质谱法区分的质量的其他实体。检测可以通过例如基质辅助激光解吸/电离质谱(maldi)或使用电子喷雾质谱(esi)来进行和/或可视化。
[0330]
可用于在亚硫酸氢盐处理样品后确定甲基化状态的某些方法在基于扩增的方法中利用第一寡核苷酸引物、第二寡核苷酸引物和寡核苷酸探针。例如,寡核苷酸引物和探针可用于实时聚合酶链式反应(pcr)或液滴数字pcr(ddpcr)的方法中。在各种情况下,例如,如本文所提出的,第一寡核苷酸引物、第二寡核苷酸引物和/或寡核苷酸探针选择性杂交甲基化dna和/或未甲基化dna,使得扩增或探针信号指示样品的甲基化状态。
[0331]
用于检测甲基化状态(例如,5-甲基胞嘧啶水平的存在)的其他基于亚硫酸氢盐的方法公开于例如frommer(1992 proc natl acad sci u s a.1;89(5):1827-31,其通过引用并入本文)。
[0332]
用于检测甲基化状态的基于亚硫酸氢盐的方法可以包括基于扩增子的靶向下一代测序,例如,参见masser(2015 j vis exp,(96):52488,doi:10.3791/52488,其通过引用并入本文)。通常,基于扩增子的靶向下一代测序利用亚硫酸氢盐转化和区域特异性pcr扩增结合下一代文库构建,从而以高通量方式检查目标靶向区域的甲基化状态。
[0333]
用于检测甲基化状态的另一种基于亚硫酸氢盐的方法可以包括基于杂交捕获的靶向下一代测序,例如参见ivanov(2013,nucleic acids res,doi:10.1093/nar.gks1467,其通过引用并入本文)。通常,该方法包括用亚硫酸氢盐处理基因组dna。然后,靶区域与溶液中的dna或rna探针杂交或与固体支持物结合。然后根据已知方案对结合的靶区域进行富集和测序,参见gasc(2016,front.microbiol.,doi:10.1093/nar/gkw309,其通过引用并入本文)。
[0334]
可用于确定甲基化状态的某些方法不包括样品的亚硫酸氢盐处理。例如,可以通过基于pcr的方法检测甲基化状态的变化,所述方法中在pcr扩增(例如,通过msre-qpcr)之前用一种或多种甲基化敏感限制酶(msre)消化dna。通常,msre具有包含至少一个cpg基序的识别位点,因此如果该位点包含5-甲基胞嘧啶,则msre的活性被阻止切割可能的识别位点。(参见,例如,beikircher 2018 methods mol biol.1708:407-424,其通过引用并入本文)。因此,msre根据msre识别位点的甲基化状态选择性消化核酸;它们可以在未甲基化的msre识别位点消化dna,但不能在甲基化的msre识别位点消化dna。在某些实施方式中,样品的等分试样可以用msre消化,产生其中未甲基化的dna已被msre切割的加工样品,使得在msre位点识别内具有至少一个甲基化位点的未切割的和/或可扩增的dna(例如,dna分子的每个msre识别位点内的至少一个甲基化位点)相对于在msre识别位点内不包括至少一个甲基化位点(例如,在dna分子的每个msre识别位点内不包括至少有一个甲基化位点)的未切割的和/或可扩增的dna的比例增加。然后可以将限制性酶消化样品的未切割序列进行预扩增(例如以pcr),并定量,例如通过qpcr、实时pcr或数字pcr定量。用于msre-qpcr的寡核苷酸引物扩增包括一个或多个msre切割位点和/或多个msre切割位点的区域。包含多个msre切割位点的扩增子通常更有可能产生可靠的结果。dmr扩增子内切割位点的数量,以及在某
些情况下(例如,如本文所提出的)所产生的dmr甲基化状态确定的鲁棒性,可以通过设计在dmr扩增子中包含多个msre识别位点(而不是单个识别位点)的dmr来增加。在各种情况下,例如,如本文所提出的,多个msre可以应用于同一样品,包括例如acii、hin6i、hpych4iv和hpaii中的两个以上(例如,包括acii、hin6i和hpych4iv)。多个msre(例如,acii、hin6i、hpych4iv和hpaii的组合,或acii、hin6i和hpych4iv的组合)可以在dmr扩增子内提供改善的msre识别位点频率。
[0335]
鉴于血液中cfdna的患病率较低,msre-qpcr还可以包括在通过msre消化样品之后但在qpcr之前进行预扩增步骤,以提高可用样品的数量。
[0336]
在某些msre-qpcr实施方式中,例如,如本文所提出的,使用例如实时pcr或数字pcr在天然(例如未消化)形式的样品的等分试样中测量总dna的量。
[0337]
各种扩增技术可单独使用或与本文所述的其他技术结合使用以检测甲基化状态。本领域技术人员在阅读了本说明书后将理解如何将本领域已知的和/或本文描述的各种扩增技术与本领域已知的和/或本文提供的用于甲基化状态确定的各种其他技术结合起来。扩增技术包括但不限于pcr,例如定量pcr(qpcr)、实时pcr和/或数字pcr。本领域技术人员将理解聚合酶扩增可以在单个反应中多重扩增多个靶标。pcr扩增子的长度通常为100至2000个碱基对。在各种情况下,例如,如本文所提出的,扩增技术足以确定甲基化状态。
[0338]
基于数字pcr(dpcr)的方法涉及将样品分配和分布在具有96孔、384孔或更多孔的板的孔中,或分配和分布在单个乳液液滴(ddpcr)中,例如,使用微流体装置,使得一些孔包括一个或多个模板拷贝,其他不包含模板拷贝。因此,扩增前每孔的平均模板分子数小于1。发生模板扩增的孔的数量提供了模板浓度的量度。如果样品已与msre接触,发生模板扩增的孔的数量提供了甲基化模板浓度的量度。
[0339]
在各种实施方式中,例如,如本文所提出的,基于荧光的实时pcr测试,例如methylight
tm
,可用于测量甲基化状态(参见,例如campan 2018 methods mol biol.1708:497-513,其通过引用并入本文)。methylight是一种基于荧光的定量实时pcr方法,其可灵敏地检测和量化基因组候选区的dna甲基化。methylight特别适合在未甲基化dna的高背景下检测低频甲基化dna区,因为它结合了甲基化特异性引发和甲基化特异性荧光探测。此外,methylight可与数字pcr结合使用,用于高度灵敏地检测个体甲基化分子,用于疾病检测和筛查。
[0340]
用于确定甲基化状态的基于实时pcr的方法通常包括基于外部标准的分析生成未甲基化dna的标准曲线的步骤。标准曲线可以由至少两个点构建,并且可以将消化的dna的实时ct值和/或未消化的dna的实时ct值与已知的定量标准进行比较。在特定情况下,例如,如本文所提出的,可以确定msre消化和/或未消化样品或样品等分试样的样品ct值,并且可以从标准曲线计算dna的基因组当量。可以评估msre消化和未消化dna的ct值,以鉴定消化的扩增子(例如,有效消化;例如,产生45的ct值)。也可以鉴定在消化或未消化条件下未扩增的扩增子。然后可以跨条件直接比较感兴趣的扩增子的校正ct值,以确定条件之间甲基化状态的相对差异。作为选择或另外,消化和未消化dna的ct值之间的delta差异可用于确定条件之间甲基化状态的相对差异。
[0341]
测量甲基化状态的方法可以包括但不限于大规模平行测序(例如下一代测序)以确定甲基化状态,例如合成测序、实时(例如单分子)测序、珠乳液测序、纳米孔测序或本领
域已知的其他测序技术。在一些实施方式中,例如,如本文所提出的,测量甲基化状态的方法可以包括全基因组测序,例如,具有碱基对分辨率。
[0342]
在某些特定实施方式中,例如,如本文所提出的,msre-qpcr以及其他技术可用于确定是或包括单个甲基化基因座的结肠直肠癌甲基化生物标志物的甲基化状态。在某些特定实施方式中,例如,如本文所提出的,msre-qpcr以及其他技术可用于确定是或包括两个以上甲基化基因座的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在某些特定的实施方式中,例如,如本文所提出的,msre-qpcr以及其他技术可用于确定是或包括单个差异甲基化区域(dmr)的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在某些特定实施方式中,例如,如本文所提出的,msre-qpcr以及其他技术可用于确定是或包括两个以上dmr的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在某些特定实施方式中,例如,如本文所提出的,msre-qpcr以及其他技术可用于确定是或包括单个甲基化位点的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在某些特定实施方式中,例如,如本文所提出的,msre-qpcr以及其他技术可用于确定是或包括两个以上甲基化位点的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在各种实施方式中,例如,如本文所提出的,结肠直肠癌甲基化和/或进行性腺瘤生物标志物可以是本文提供的任何结肠直肠癌和/或进行性腺瘤甲基化生物标志物。本公开尤其包括用于扩增dmr,例如用于扩增表5中鉴定的dmr的寡核苷酸引物对。
[0343]
在某些特定实施方式中,例如,如本文所提出的,cfdna样品源自受试者血浆并与msre(甲基化敏感性限制酶)接触,msre是或包括acii、hin6i、hpych4iv和hpaii中的一个或多个(例如,acii、hin6i和hpych4iv)。经消化的样品可以用一个或多个dmr的寡核苷酸引物对进行扩增,例如用以下表5中提供的一个或多个寡核苷酸引物对。表5标识了染色体编号(chr.no.)、唯一id(uid)、染色体上遗传区域的起始位置(起始位置)、染色体上遗传区域的结束位置(结束位置)、区域宽度(序列宽度)、msre-qpcr中使用的正向引物(fp)和反向引物(rp)的序列id编号(seq id no.)和由正向引物和反向引物扩增的dna区域的seq id no.。经消化的dna,例如,预扩增的经消化的dna,可以用qpcr用一个或多个dmr的寡核苷酸引物对进行定量,例如,使用以下表5中提供的一个或多个寡核苷酸引物对。然后可以确定qpcr ct值并用于确定每个dmr扩增子的甲基化状态。较低的ct值(因此较高的45

ct值)对应于较高的甲基化状态,证明具有结肠直肠癌和/或进行性腺瘤的受试者中的超甲基化。
[0344]
表5.用相应引物对鉴定的40个高等级dmr。
[0345][0346][0347]
本领域技术人员将理解,表5中提供的寡核苷酸引物对可根据本文鉴定的结肠直
肠癌和/或进行性腺瘤甲基化生物标志物的任何组合使用。技术人员将意识到表5的寡核苷酸引物对可以单独包括或不包括在给定的分析中以分析特别期望的drm组合。
[0348]
本领域技术人员将进一步理解,虽然可以使用其他寡核苷酸引物对,但是选择和配对寡核苷酸引物以产生有用的dmr扩增子是重要的并且代表了实质性的贡献。
[0349]
本领域技术人员将进一步理解,qpcr的方法、试剂和方案是本领域公知的。与传统pcr不同,qpcr能够检测扩增过程中(例如,在每个扩增循环结束时)随时间推移产生的扩增子,通常通过使用扩增响应荧光系统,例如,结合具有荧光检测能力的热循环仪。qpcr中使用的荧光报告基因的两种常见类型包括(i)双链dna结合染料,其在结合时比未结合时发出的荧光更亮;(ii)标记的寡核苷酸(例如标记的寡核苷酸引物或标记的寡核苷酸探针)。
[0350]
本领域技术人员将理解,以本文提供的结肠直肠癌筛查方法分析多个甲基化基因座(例如,多个dmr)的甲基化状态的实施方式中,每个甲基化基因座的甲基化状态可以是以多种形式中的任一种测量或表示,并且多个甲基化基因座的甲基化状态(优选地每个以相同、相似或可比较的方式测量和/或表示)一起或累积地以各种形式的任一种分析或表示。在各种实施方式中,例如,如本文所提出的,每个甲基化基因座的甲基化状态可以测量为ct值。在各种实施方式中,例如,如本文所提出的,每个甲基化基因座的甲基化状态可以表示为测量样品和参考之间的ct值差异。在各种实施方式中,例如,如本文所提出的,每个甲基化基因座的甲基化状态可以表示为与参考的定性比较,例如通过将每个甲基化基因座鉴定为超甲基化或未超甲基化。
[0351]
在其中分析单个甲基化基因座的一些实施方式中,例如,如本文所提出的,单个甲基化基因座的超甲基化构成受试者患有或可能患有结肠直肠癌和/或进行性腺瘤的诊断,而不存在单甲基化基因座的超甲基化构成受试者可能不患有结肠直肠癌和/或进行性腺瘤的诊断。在一些实施方式中,例如,如本文所提出的,多个分析的甲基化基因座的单甲基化基因座(例如单个dmr)的超甲基化构成受试者患有或可能患有结肠直肠癌和/或进行性腺瘤的诊断,而在多个分析的甲基化基因座的任何甲基化基因座不存在超甲基化构成受试者可能不患有任一疾病的诊断。在一些实施方式中,例如,如本文所提出的,多个所分析的甲基化基因座中确定百分比(例如,预定百分比)(例如,至少10%(例如,至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%))的甲基化基因座超甲基化构成受试者患有或可能患有结肠直肠癌的诊断,而多个所分析的甲基化基因座中不存在确定百分比(例如,预定百分比)(例如,至少10%(例如,至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%))的甲基化基因座超甲基化构成受试者不可能患有结肠直肠癌或进行性腺瘤的诊断。在一些实施方式中,例如,如本文所提出的,多个经分析的甲基化基因座(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个甲基化基因座dmr)中确定数量(例如,预定数量)的甲基化基因座(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个dmr)的超甲基化构成受试者患有或可能患有结肠直肠癌和/或进行性腺瘤的诊断,而多个经分析的甲基化基因座(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个dmr)中不存在确定数量(例如,预定数量)的甲基化基
因座(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个dmr)的超甲基化构成受试者不可能患有结肠直肠癌或进行性腺瘤的诊断。
[0352]
在一些实施方式中,例如,如本文所提出的,定性或定量测量多个甲基化基因座(例如,多个dmr)的甲基化状态,并且组合多个甲基化基因座中的每一个的测量以提供诊断。在一些实施方式中,例如,如本文所提出的,多个甲基化基因座中的每一个的定量测量的甲基化状态的定性被单独加权,并且加权值被组合以提供可以与参考进行比较以提供诊断的单个值。为了仅提供这种方法的一个实例,支持向量机(svm)算法可用于分析本公开的多个甲基化基因座的甲基化状态以产生诊断。支持向量机算法的至少一个目标是在n维空间(n—特征的数量)中鉴定一个超平面,该超平面对数据点进行明确分类,目标是找到一个具有最大边距的平面,即两类数据点之间的最大距离。如本实施例中所讨论的,svm模型建立在源自训练样品集(例如,训练受试者组)的标记值(例如,ct值)上,其在进行预测时被转化成支持向量值。在将svm模型应用于验证样品集的新样品时,样品将被映射到模型的向量空间并分类为具有属于第一条件(例如对照组)、第二条件(例如,诊断有结肠直肠癌的组)或第三组(例如诊断有进行性腺瘤的组)的概率,例如,基于每个新样品相对于两个条件之间的间隙的位置。本领域技术人员将理解,一旦确定了相关组合物和方法,向量值可以与由r-package的predict()函数定义的svm算法结合使用(参见超文本传输协议安全(https)://cran.r-project.org/web/packages/e1071/index.html,其svm在此通过引用并入)以容易地生成对新样品的预测。因此,利用本文公开的用于结肠直肠癌诊断和/或进行性腺瘤的组合物和方法(并且仅在那时),利用算法输入信息组合来预测r包的predict()函数(参见超文本传输协议安全(https)://cran.r-project.org/web/packages/e1071/index.html,其svm在此通过引用并入)的预测模型的生成以提供结肠直肠癌和/或进行性腺瘤诊断将是直截了当的。本领域技术人员将理解,使用在手头的本公开中,svm向量的生成可以根据本文提供的方法以及本领域已知的其他方法来完成。
[0353]
应用
[0354]
本公开的方法和组合物可用于多种应用中的任何一种。例如,本公开的方法和组合物可用于筛查或帮助筛查结肠直肠癌或进行性腺瘤。在各种情况下,例如,如本文所提出的,使用本公开内容的方法和组合物进行筛查可以检测任何阶段的结肠直肠癌,包括但不限于早期结肠直肠癌,并且可以检测进行性腺瘤。在一些实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌和进行性腺瘤筛查适用于50岁以上,例如50、55、60、65、70、75、80、85或90岁以上的个体。在一些实施方式中,例如,如本文所提出的,使用本公开的方法和组合物进行的结肠直肠癌筛查适用于20岁以上,例如20、25、30、35、40、45、50、55、60、65、70、75、80、85或90岁以上的个体。在一些实施方式中,例如,如本文所提出的,使用本公开的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查适用于20至50岁,例如20至30岁、20至40岁、20至50岁、30岁至40岁、30至50岁或40至50岁的个体。在各种实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查适用于经历腹痛或不适的个体,例如,经历未诊断或不完全诊断的腹痛或不适的个体。在各种实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查适用于没有可能与结肠直肠癌相关
的症状的个体。因此,在某些实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌筛查是完全或部分预防性或防止性的,至少对于晚期或非早期的结肠直肠癌而言如此。
[0355]
在各种实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查可应用于无症状的人类受试者。如本文所用,如果受试者通过非侵入性可观察标记(例如,没有一个、几个或所有基于装置的探测、组织样品分析、体液分析、手术或结肠直肠癌筛查)没有报告和/或证明结肠直肠癌和/或进行性腺瘤的充分特征以支持对受试者可能患有结肠直肠癌和/或进行性腺瘤的医学合理怀疑,则受试者可以称为是“无症状的”。早期结肠直肠癌或存在进行性腺瘤特别可能在根据本公开内容的方法和组合物筛查的无症状个体中检测到。
[0356]
在各种实施方式中,例如,如本文所公开的,使用本公开内容的方法和组合物进行的结肠直肠癌和/或筛查可应用于有症状的人类受试者。如本文所用,如果受试者通过非侵入性可观察标记(例如,没有基于装置的探测、组织样品分析、身体体液分析、手术或结肠直肠癌筛查)报告和/或证明结肠直肠癌和/或进行性腺瘤的充分特征以支持医学上合理怀疑受试者可能患有结肠直肠癌、进行性腺瘤和/或癌症,则受试者可以称为是“有症状的”。结肠直肠癌和进行性腺瘤的症状可以包括但不限于持续(例如持续超过3天)的排便习惯改变(腹泻、便秘或大便变窄),需要排便的感觉(这种感觉是排便后未缓解)、直肠出血(例如,鲜红色的血液)、便血(可导致大便呈黑色)、腹部绞痛、腹痛、虚弱、疲劳、意外体重减轻、贫血及其组合。本领域技术人员将理解,不会单独表明或引起结肠直肠癌和/或进行性腺瘤怀疑的个体症状当以组合(例如为了提供但非限制性的实例,腹部绞痛和便血的组合)存在时,可能会表明或引起所述怀疑。
[0357]
本领域技术人员将理解对结肠直肠癌的定期、预防性和/或防止性筛查改善了结肠直肠癌和进行性腺瘤的诊断,包括和/或特别是早期癌症。如上所述,根据至少一种癌症分期系统,早期癌症包括结肠直肠癌的0至iic期。因此,本公开尤其提供了适用于早期结肠直肠癌的诊断和治疗的方法和组合物。通常,特别是在根据本公开每年进行结肠直肠癌筛查和/或其中受试者在筛查时无症状的实施方式(例如,如本文所提出的)中,本发明的方法和组合物特别有可能检测到早期阶段结肠直肠癌和/或进行性腺瘤。
[0358]
在各种实施方式中,例如,如本文所提出的,根据本公开的结肠直肠癌或进行性腺瘤筛查对给定受试者进行一次或对给定受试者进行多次。在各种实施方式中,例如,如本文所提出的,根据本公开定期进行筛查,例如每六个月、每年、每两年、每三年、每四年、每五年或每十年。
[0359]
在各种实施方式中,例如,如本文所提出的,使用本文公开的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查将提供结肠直肠癌的诊断。在其他情况下,例如,如本文所提出的,使用本文公开的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查将指示结肠直肠癌的诊断(例如通过发现进行性腺瘤),但不能确定结肠直肠癌和/或进行性腺瘤的诊断。在使用本公开的方法和组合物筛查结肠直肠癌和/或进行性腺瘤的各种情况下,例如,如本文所提出的,使用本公开的方法和组合物进行筛查之后可以进行进一步的诊断确认测试,该进一步的诊断确认测试可以确认、支持、破坏、或拒绝由先前筛查(例如,根据本公开的筛查)产生的诊断。如本文所用,诊断确认测试可以是提供被执业医师确认为确定性
的诊断的结肠直肠癌和/或进行性腺瘤测试,例如基于结肠镜检查的诊断,或显著增加或降低先前诊断的可能性的结肠直肠癌测试是正确的,例如,根据本公开的筛查产生的诊断。诊断确认测试可以包括现有的筛查技术,这些技术通常需要在灵敏度、特异性和非侵入性中的一个或多个方面进行改进,特别是在检测早期结肠直肠癌方面。
[0360]
在一些情况下,例如,如本文所提出的,诊断确认测试是一种测试,它是或包括受试者组织的视觉或结构检查,例如通过结肠镜检查。在一些实施方式中,例如,如本文所提出的,结肠镜检查包括或之后是组织学分析。结肠直肠癌的视觉和/或结构测试可以包括检查结肠和/或直肠的结构是否有任何异常组织和/或结构。例如,可以通过直肠使用内窥镜或通过ct扫描进行视觉和/或结构检查。在一些情况下,例如,如本文所提出的,诊断确认测试是结肠镜检查,例如,包括或随后进行组织学分析。根据一些报告,结肠镜检查是目前主要的和/或最依赖于诊断确认测试。
[0361]
另一种基于计算机断层扫描(ct)的视觉和/或结构诊断确认测试是ct结肠成像,有时也称为虚拟结肠镜检查。ct扫描利用结肠和/或直肠的大量x射线图像来生成结肠的尺寸表示。尽管可用作诊断确认测试,但一些报告表明ct结肠成像不足以替代结肠镜检查,至少部分是因为医生没有实际接触受试者的结肠来获取组织以进行组织学分析。
[0362]
另一种诊断确认测试可以是乙状结肠镜检查。在乙状结肠镜检查中,乙状结肠镜用于通过直肠对结肠和/或直肠的部分进行成像。根据一些报道,乙状结肠镜检查并未得到广泛应用。
[0363]
一种特别的筛查技术是基于粪便的筛查测试((exact sciences corporation,madison,wi,united states),其将fit分析与dna的异常修饰(例如突变和甲基化)分析相结合。测试与单独的fit检测相比,显示出改善的灵敏度,但由于依从率低,临床上可能不切实际或无效,所述低依从率至少部分是由于受试者不喜欢使用基于粪便的检测(参见,例如,doi:10.1056/nejmc1405215(e.g.,2014 n engl j med.371(2):184-188))。测试似乎将几乎一半的合格人群排除在筛查计划之外(参见,例如,van der vlugt 2017 br j cancer.116(1):44-49)。如本文提供的筛查的使用(例如通过基于血液的分析),将增加选择筛查结肠直肠癌的个体数量(参见,例如adler 2014 bmc gastroenterol.14:183;liles 2017 cancer treatment and research communications 10:27-31)。就目前所知,只有一种现有的结肠直肠癌筛查技术epiprocolon获得fda批准和ce-ivd准售,并且是基于血液的。epiprocolon基于sept9基因的超甲基化。epiprocolon测试的结肠直肠癌检测的准确度低,灵敏度为68%,进行性腺瘤灵敏度仅为22%(参见,例如,potter 2014 clin chem.60(9):1183-91)。本领域尤其需要一种非侵入性结肠直肠癌和进行性腺瘤筛查,其可以实现高受试者依从性,并且具有高和/或改进的特异性和/或灵敏度。
[0364]
在各种实施方式中,例如,如本文所提出的,根据本公开的方法和组合物的筛查降低了结肠直肠癌死亡率,例如通过早期结肠直肠癌诊断,例如通过检测进行性腺瘤。数据支持结肠直肠癌筛查降低结肠直肠癌死亡率(参见,例如,shaukat 2013 n engl j med.369(12):1106-14)。此外,结肠直肠癌特别难以治疗,至少部分是因为没有及时筛查的结肠直肠癌可能直到癌症过了早期阶段才被检测到。至少出于这个原因,结肠直肠癌的治疗通常是不成功的。为了使结肠直肠癌结果的全人群改善最大化,根据本公开的筛查的利用可以
与例如合格受试者的招募配对以确保广泛筛查。
[0365]
在各种实施方式中,例如,如本文所提出的,包括一种或多种本文公开的方法和/或组合物的结肠直肠癌和/或进行性腺瘤筛查之后是结肠直肠癌的治疗,例如早期结肠直肠癌的治疗。在各种实施方式中,例如,如本文所提出的,结肠直肠癌例如早期结肠直肠癌的治疗包括施用治疗方案,所述治疗方案包括手术、放射疗法和化学疗法中的一种或多种。在各种实施方式中,例如,如本文所提出的,结肠直肠癌例如早期结肠直肠癌的治疗包括施用包括本文提供的一种或多种治疗的治疗方案,以用于治疗0期结肠直肠癌、i期结肠直肠癌和/或ii期结肠直肠癌。
[0366]
在各种实施方式中,例如,如本文所提出的,进行性腺瘤和/或结肠直肠癌筛查是基于粪便的测试。通常,当使用基于粪便的测试代替目视或结构检查时,建议以比使用目视或结构检查所需的频率更高的频率使用。在一些情况下,例如,如本文所提出的,筛查测试是基于guiac的粪便潜血试验或粪便免疫化学试验(gfobts/fits)(参见,例如navarro 2017 world j gastroenterol.23(20):3632-3642,其关于结肠直肠癌测试通过引用并入本文)。fobts和fits有时用于诊断结肠直肠癌(参见,例如,nakamura 2010 j diabetes investig.oct 19;1(5):208-11,其关于结肠直肠癌测试通过引用并入本文)。fit是基于粪便中潜血的检测,潜血的存在通常预示着结肠直肠癌或进行性腺瘤,但通常量不足以通过肉眼进行鉴定。例如,在典型的fit中,该测试利用血红蛋白特异性试剂来测试粪便样品中的潜血。在各种情况下,例如,如本文所提出的,fit试剂盒适合个人在其自己家中使用。当在没有其他诊断确认测试的情况下使用时,建议每年使用一次fit。通常不依赖fit为结肠直肠癌或进行性腺瘤的结论性诊断提供足够的诊断信息。
[0367]
在各种实施方式中,例如,如本文所提出的,进行性腺瘤和/或结肠直肠癌筛查还包括gfobt,其经设计以通过化学反应检测粪便中的潜血。与fit一样,可能建议每年使用一次gfobt。通常不依赖gfobt为结肠直肠癌或进行性腺瘤的结论性诊断提供足够的诊断信息。
[0368]
在各种情况下,例如,如本文所提出的,筛查测试还可以包括粪便dna检测。结肠直肠癌或进行性腺瘤的粪便dna检测可经设计以鉴定粪便样品中结肠直肠癌和/或进行性腺瘤的dna序列特征。当在没有其他诊断确认测试的情况下使用时,建议每三年使用一次粪便dna检测。通常不依赖粪便dna检测来为结肠直肠癌和/或进行性腺瘤的结论性诊断提供足够的诊断信息。
[0369]
在各种实施方式中,例如,如本文所提出的,结肠直肠癌的治疗包括通过以下中的一种或多种来治疗早期结肠直肠癌,例如0期结肠直肠癌或i期结肠直肠癌:手术切除癌组织(例如通过局部切除(例如通过结肠镜)、部分结肠切除术或全结肠切除术)。
[0370]
在各种实施方式中,例如,如本文所提出的,结肠直肠癌的治疗包括通过以下中的一种或多种来治疗早期结肠直肠癌,例如ii期结肠直肠癌:手术切除癌组织(例如,通过局部切除(例如,通过结肠镜)、部分结肠切除术或全结肠切除术)、手术切除已识别的结肠直肠癌组织附近的淋巴结,以及化学疗法(例如,施用5-fu和亚叶酸、奥沙利铂或卡培他滨。
[0371]
在各种实施方式中,例如,如本文所提出的,结肠直肠癌的治疗包括通过以下中的一种或多种来治疗iii期结肠直肠癌:手术切除癌组织(例如,通过局部切除(例如,通过基于结肠镜检查的切除)、部分结肠切除术或全结肠切除术)、手术切除已识别的结肠直肠癌
组织附近的淋巴结,以及化学疗法(例如,施用5-fu和亚叶酸、奥沙利铂或卡培他滨中的一种或多种,例如以下述组合:(i)5-fu和亚叶酸,(ii)5-fu、亚叶酸和奥沙利铂(例如,folfox),或(iii)卡培他滨和奥沙利铂(例如,capeox))和放射疗法。
[0372]
在各种实施方式中,例如,如本文所提出的,结肠直肠癌的治疗包括通过以下中的一种或多种来治疗iv期结肠直肠癌:手术切除癌组织(例如,通过局部切除(例如,通过基于结肠镜检查的切除)、部分结肠切除术或全结肠切除术)、手术切除已识别的结肠直肠癌组织附近的淋巴结,手术切除转移灶、化学疗法(例如,施用5-fu、亚叶酸、奥沙利铂、卡培他滨、伊立替康、vegf靶向治疗剂(例如,贝伐单抗、阿柏西普、或雷莫芦单抗)、egfr靶向治疗剂(例如,西妥昔单抗或帕尼单抗)、瑞戈非尼、三氟尿苷和替吡嘧啶中的一种或多种,例如以下述组合:(i)5-fu和亚叶酸,(ii)5-fu、亚叶酸和奥沙利铂(例如,folfox),(iii)卡培他滨和奥沙利铂(例如,capeox)、以及(v)氟尿嘧啶和替吡嘧啶(lonsurf))、放射疗法、肝动脉输注(例如,如果癌已转移至肝脏)、肿瘤消融、肿瘤栓塞、结肠支架、结肠切除术、结肠造口术(例如,分流结肠造口术)和免疫疗法(例如,派姆单抗)。
[0373]
本领域技术人员本文提供的结肠直肠癌的治疗可以例如如由执业医师确定的那样,单独或以任何组合,以任何顺序、方案和/或治疗程序使用。本领域技术人员将进一步理解,高级治疗选择可能适用于先前患有癌症或结肠直肠癌的受试者中的早期癌症,例如,被诊断为患有复发性结肠直肠癌的受试者。
[0374]
在一些实施方式中,例如,如本文所提出的,本文提供的用于结肠直肠癌和进行性腺瘤筛查的方法和组合物可以告知例如由个体,医疗保健机构、医疗保健从业者、医疗保险提供者、政府机构或对医疗保健费用感兴趣的其他各方做出的治疗和/或支付(例如,医疗保健的费用的报销或减少,例如筛查或治疗)决定和/或行动。
[0375]
在一些实施方式中,例如,如本文所提出的,本文提供的用于结肠直肠癌和进行性腺瘤筛查的方法和组合物可以告知与健康保险提供者是否偿付医疗保健费用支付者或接受者(或不)有关的决策,例如,用于(1)筛查本身(例如,报销筛查,除非不可用,仅适用于定期/定期筛查,或仅适用于临时和/或偶然动机的筛查);和/或用于(2)治疗,包括例如,基于筛查结果启动、维持和/或改变治疗。例如,在一些实施方式中,例如,如本文所提出的,本文提供的用于结肠直肠癌筛查的方法和组合物用作基础、有助于或支持确定是否将向医疗保健费用支付者或接受者提供报销或成本降低。在一些情况下,例如,如本文所提出的,寻求报销或降低成本的一方可以提供根据本说明书进行的筛查的结果以及对医疗保健费用的这种报销或成本降低的请求。在某些情况下,例如,如本文所提出的,作出关于是否提供医疗费用的报销或费用降低的决定的一方将全部或部分基于接收和/或审查根据本说明书进行的筛选的结果来作出决定。
[0376]
为避免任何疑问,本领域技术人员将从本公开中理解,本说明书的用于结肠直肠癌和/或进行性腺瘤诊断的方法和组合物至少用于体外使用。因此,本公开的所有方面和实施方式可以至少在体外进行和/或使用。
[0377]
试剂盒
[0378]
本公开内容尤其包括试剂盒,该试剂盒包括一种或多种如本文提供的用于结肠直肠癌和/或进行性腺瘤筛查的组合物,任选地与其在结肠直肠癌筛查中的使用说明书组合。在各种实施方式中,例如,如本文所提出的,用于结肠直肠癌和/或进行性腺瘤筛查的试剂
盒可包括以下中的一种或多种:一种或多种寡核苷酸引物(例如,一个或多个寡核苷酸引物对,例如见表15)、一种或多种msre、一种或多种用于qpcr的试剂(例如,足以完成qpcr反应混合物的试剂,包括但不限于dntp和聚合酶),以及用于结肠直肠癌筛查的试剂盒的一种或多种成分的使用说明书。在各种实施方式中,用于结肠直肠癌筛查的试剂盒可包括以下中的一种或多种:一种或多种寡核苷酸引物(例如,一个或多个寡核苷酸引物对,例如见表15)、一种或多种亚硫酸氢盐试剂、一种或多种用于qpcr的试剂(例如,足以完成qpcr反应混合物的试剂,包括但不限于dntp和聚合酶),以及用于结肠直肠癌筛查的试剂盒的一种或多种成分的使用说明书。
[0379]
在某些实施方式中,本公开的试剂盒包括用于扩增如本文公开的甲基化基因座和/或dmr的至少一个寡核苷酸引物对。
[0380]
在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增本公开的一个或多个甲基化区域的一个或多个寡核苷酸引物对。在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增一个或多个甲基化区域的一个或多个寡核苷酸引物对,所述甲基化区域是或包括表1中提供的一个或多个遗传区域的全部或部分。在一些特定情况下,例如,如本文所提出的,本公开的试剂盒包括用于多个甲基化区域的寡核苷酸引物对,每个甲基化区域包括表1中鉴定的遗传区域的(全部或部分),所述多个甲基化区域包括表1至4中的任一个中提供的甲基化区域的(全部或部分),例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69个甲基化区域。
[0381]
在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增本公开的一种或多种dmr的一个或多个寡核苷酸引物对。在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增一种或多种dmr的一个或多个寡核苷酸引物对,所述dmr包括表1中鉴定的基因的(全部或部分)。在一些具体实施方式中,本公开的试剂盒包括用于多个dmr的寡核苷酸引物对,其中每个dmr包括表1中鉴定的(全部或部分)遗传区域,例如,根据表1-4中鉴定的遗传区域,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69个dmr。
[0382]
在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增表5的一种或多种dmr的一个或多个寡核苷酸引物对。在一些特定情况下,例如,如本文所提出的,本公开的试剂盒包括用于表5的多个dmr的寡核苷酸引物对,多个dmr包括表1的(全部或部分)dmr,例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个dmr,例如,如表2至4中任一个所提供的。
[0383]
在各种实施方式中,例如,如本文所提出的,本公开的试剂盒包括表5中提供的一个或多个寡核苷酸引物对。本领域技术人员将理解表5中提供的寡核苷酸引物对可以以一个或多个寡核苷酸引物对的任何组合提供,例如以表2-4中任一项提供的组合。
[0384]
本公开的试剂盒还可包括单独或在单一溶液中的一种或多种msre。在各种实施方式中,一个或多个msre选自包括acii、hin6i、hpych4iv和hpaii的msre组(例如,使得该试剂
盒包括acii、hin6i和hpych4iv,单独或在单一溶液中)。在某些实施方式中,本公开的试剂盒包括一种或多种用于qpcr的试剂(例如,足以完成qpcr反应混合物的试剂,包括但不限于dntp和聚合酶)。
[0385]
实施例
[0386]
本文的实施例确认,本公开尤其提供了用于筛查和治疗结肠直肠癌和/或进行性腺瘤的方法和组合物。本实施例进一步证明本文提供的组合物和方法在结肠直肠癌和/或进行性腺瘤的筛查和/或治疗中提供了显著高度的灵敏度和特异性。还提供了比较来自诊断为患有结肠直肠癌的受试者的样品中的生物标志物的甲基化和来自对照受试者的样品中的生物标志物的甲基化的临床研究,进一步证明了包括本公开的方法和/或组合物的结肠直肠癌的筛查。本实施例的样品是人或人源的。
[0387]
实施例1.与结肠直肠癌相关的甲基化生物标志物的鉴定
[0388]
本实施例包括与健康组织相比,在结肠直肠癌和进行性腺瘤中鉴定dmr的cpg区的超甲基化。具体而言,本实施例的实验检查了来自总共150个受试者的结肠直肠组织样品。受试者分组如下:(i)52个先前被诊断患有结肠直肠癌的受试者,(ii)33个被诊断患有进行性腺瘤的受试者,以及(iii)从52个被诊断患有结肠直肠癌的受试者和33个被诊断患有进行性腺瘤的受试者获得的65个健康结肠组织样品。组织样品是新鲜冷冻组织。
[0389]
使用来自illumina的novaseq
tm 6000测序系统通过全基因组亚硫酸氢盐测序分析样品的dna。全基因组亚硫酸氢盐测序已在本文先前描述。一般而言,全基因组亚硫酸氢盐测序涉及在使用如前所述的多种下一代技术中的任何一种对基因组进行测序之前,用亚硫酸氢盐(例如亚硫酸氢钠)处理dna样品。
[0390]
样品的平均测序覆盖率为37.5x,这意味着已测序基因组的给定区域已被唯一测序约37-38次。平均覆盖率大于30x表明测序已以临床级(即高)可靠性进行。
[0391]
然后处理从样品中获得的原始测序文件,以确定与对照组织样品相比的差异甲基化区域(dmr)。首先,将原始序列与grch38(基因组研究联盟人类构建体38,genome research consortium human build 38)的参比基因组进行比对,并使用bismark bisulfite mapper进行重复数据删除。bismark输出每个样品的甲基化调用文件。这些甲基化调用文件包含每个碱基输出的甲基化百分比分数。然后使用methylkit进一步分析甲基化调用输出文件。methylkit用于比较结肠直肠癌组织与对照组织的输出文件以及进行性腺瘤组织与对照组织的输出文件。这些比较导致了结肠直肠癌和进行性腺瘤样品的dmr的鉴定。从methylkit输出的已鉴定dmr被认为是存在至少3个cpg且cpg之间的最大距离为200bp的区域。对照和病例之间的最小甲基化百分比差异设置为10%。
[0392]
然后针对进行性腺瘤和结肠直肠癌样品中相对于对照样品的超甲基化区域来过滤dmr。再次过滤dmr以选择每个区域长度的更高数量的甲基化cpg。考虑到两个相邻甲基化cpg之间最少5个cpg,且最多200bp。此外,通过排除病症和对照的甲基化之间差异小于25%的区域,使用病症(例如,结肠直肠癌或进行性腺瘤)和对照之间的最高平均甲基化百分比差异。
[0393]
处理产生了69个dmr的列表(即,如下表6所示),这些dmr被选择用于进一步的靶向测定开发。如下表6中可见,每个dmr通过对应于本文提供的其序列的其序列id(seq id no)、dmr所在的染色体编号、dmr在染色体上的起始和结束碱基对、dmr区域的宽度(区域宽
度)以及落入dmr区域的一个(或多个)基因的注释名称(如果有)来标识。dmr的开始和结束碱基对和染色体数目对应于grch38参比基因组上的位置。基因名称的注释根据ensemble基因组浏览器98。
[0394]
表6.为靶向测定开发确定的69个dmr。
[0395]
[0396]
[0397][0398]
实施例2:通过msre-qpcr开发用于甲基化生物标志物的无细胞dna检测
[0399]
本实施例开发了一种基于循环无细胞dna(cfdna)确定结肠直肠癌和进行性腺瘤甲基化生物标志物的甲基化状态的测试。cfdna不完整和片段化,并且cfdna从癌细胞传输到血液的机制(作为一部分称为循环肿瘤dna)是未知的。至少因为实施例1的69个甲基化生物标志物是从组织样品中鉴定的,因此在本实施例的实验之前不知道是否可以从cfdna充分分析鉴定的结肠直肠癌甲基化生物标志物以成功捕获ctdna部分,所述ctdna部分允许鉴定对应于结肠直肠癌和/或进行性腺瘤的诊断的受试者或受试者样品。
[0400]
作为确定是否可以从cfdna中充分分析实施例1中鉴定的结肠直肠癌甲基化生物标志物以成功捕获允许鉴定结肠直肠癌受试者或样品的ctdna部分的关键步骤,开发了一种灵敏的测试法来筛查这些生物标志物。特别是,开发了甲基化灵敏度限制酶(msre)-qpcr方法。开发msre-qpcr方法是为了测量dmr的甲基化,所述dmr覆盖血液样品中已鉴定的cpg位点,特别是在血液中存在的肿瘤的无细胞dna(cfdna)中。
[0401]
msre-qpcr方法的开发具有重要意义,至少部分是因为通过分析cfdna来分析源自肿瘤组织的cpg甲基化生物标志物具有挑战性,这归因于与样品的非肿瘤dna背景相比,血液中循环的肿瘤来源的dna的浓度低(0.1-1%)。因此,虽然通常优选开发依赖于容易获得的样品(例如血液、尿液或粪便)的生物标志物分析,但使用血液来分析肿瘤衍生的甲基化生物标志物是具有挑战性的。因此,即使在组织中鉴定了具有结肠直肠癌和进行性腺瘤特征的甲基化生物标志物之后,如上所述,也无法预测ctdna的碎片化和知之甚少的性质是否
允许使用在组织中鉴定的甲基化生物标志物进行成功筛查。
[0402]
msre-qpcr需要设计扩增dna区域的寡核苷酸引物(msre-qpcr寡核苷酸引物对),每个所述dna区域包括至少一个msre切割位点(即,覆盖至少一个甲基化生物标志物位点的msre切割位点,使得允许在核酸分子中切割msre切割位点,其中所有的所述至少一个甲基化生物标志位点都未甲基化,并且在其中至少一个甲基化生物标志位点被甲基化的核酸分子中被阻断)。msre-qpcr测试可以利用多种限制性内切酶来扩大可通过单个msre-qpcr反应测试的甲基化生物标志物位点的范围,因为单个msre不太可能切割包括所有感兴趣的甲基化生物标志物位点的位点。本实施例的msre-qpcr测试利用msres acii、hin6i和hpych4iv,发现它们一起提供了足够的覆盖率。
[0403]
图1中提供了msre-qpcr的示例性工作流程示意图。如本实施例中所执行的,根据制造商方案(qiaamp minelute ccfdna handbook 08/2018,qiagene)通过qiaamp minelute ccfdna试剂盒从受试者血液(通常为约10ml的血浆样品)中提取循环无细胞肿瘤dna。如图1所示,分离的cfdna被分成两份等分试样,其中一份等分试样用于qpcr品质控制分析,第二份等分试样用于msre-qpcr。
[0404]
对于msre-qpcr,2/3体积的洗脱cfdna被msre消化。由于非甲基化dna被选择性切割,因此将cfdna与msre接触可富集样品的甲基化衍生信号;甲基化的dna保持完整且可量化。剩余的1/3体积的洗脱cfdna用于使用msre-qpcr寡核苷酸引物进行qpcr,以确认从cfdna中成功扩增了扩增子,该扩增确认模板存在,从而提供技术品质控制。
[0405]
如本文所应用的,成功开发了用于将dmr扩增的msre-qpcr寡核苷酸引物对,因此从实施例1的dmr中鉴定的甲基化生物标志物区域产生88个不同的靶dmr。88种不同的靶dmr列于下表7中。与匹配的对照组织相比,鉴定的区域在结肠直肠癌和进行性腺瘤中具有显著更高的超甲基化。根据ensembl基因组浏览器98为具有注释的基因添加了基因注释。由于一些dmr与不同的基因重叠,因此列出了区域中的所有重叠基因。下面的表7包含dmr的唯一标识符(uid)、发现dmr的染色体编号(chr)、dmr的开始和结束位置、dmr的长度/碱基对的数量、在dmr内发现的带注释的基因(或多个基因)的名称,以及已鉴定dmr的seq id no。列出的基因组区域参数,包括染色体数量和dmr开始和结束位置,对应于grch38的参比基因组。
[0406]
dmr通常包括1至15个msre切割位点,所述msre切割位点共同覆盖了88个甲基化生物标志物区域中的每一个。如本文所用,四种基因(jub、h19、snrpn、irf4)的甲基化状态提供了甲基化对照,允许监测测定的鲁棒性和再现性。
[0407]
表7.为msre-qpcr鉴定的88个候选dmr。
[0408]
[0409]
[0410][0411]
实施例3:cfdna的msre-qpcr通过结肠直肠癌状态成功区分了受试者
[0412]
为了探测已鉴定甲基化生物标志物的临床诊断和预后能力,在从人类受试者血浆中提取的cfdna中测试了由覆盖88个甲基化生物标志物区域的msre-qpcr寡核苷酸引物对扩增的dmr,和适当的对照。特别是,cfdna是从2017年至2018年间在西班牙、英国和美国的筛查中心和肿瘤诊所寻求或正在获得有关可能的结肠直肠癌诊断的个体的样品。第一受试者组(“训练集”)包括166个这样的个体(参见图2中第一个受试者组的描述),第二受试者组(“验证集”)包括535个这样的个体(参见图3中第二受试者组的描述)。
[0413]
为了验证甲基化生物标志物dmr对结肠直肠癌的预测能力,进一步对从来自受试者训练集的样品的msre-qpcr分析得到的数据进行分析,以基于表7的88个甲基化生物标志物位点进行初始特征选择。使用monte-carlo交叉验证超过50次,使用随机森林算法以进行特征排序,vip》2的标志物用于构建基于支持向量机(svm)算法的分类模型。该分析确定了几个标志物子集(如表2-4中所述的3、10和40),它们在svm模型中给出了良好的预测。
[0414]
用于在msre-qpcr中扩增40个drm的寡核苷酸引物对(表5)覆盖至少一个msre切割位点。但是,通常会覆盖3至15个msre切割位点。msre-qpcr根据实施例2中描述的方法进行。
[0415]
在测试的535个受试者中基于40个标志物组的初始主成分分析揭示了结肠直肠癌患者(即患有结肠直肠癌的患者)和对照患者(即结肠镜检查未发现结果、增生性息肉和/或非进行性腺瘤的患者)之间的良好分离),如图4所示。在测试的受试者组中,只有一些被诊断患有进行性腺瘤的患者与对照组表现出良好的分离。不希望受任何特定理论的束缚,在某些受试者中结果特征与结肠直肠癌的相似性可能表明进行性腺瘤在其进展为恶性结肠直肠癌的路径上更进一步。
[0416]
基于svm算法的结果的统计分析显示在图5a和5b中。40个标志物组允许以78%的灵敏度鉴定对照患者和患有结肠直肠癌的患者。从对照患者中确定患有进行性腺瘤的患者的灵敏度为14%。早期局部癌症检测的灵敏度为78%。图5a中提供了基于表4的40个标志物组的数据的roc曲线分析,如svm模型所鉴定的。
[0417]
下面显示的表8显示了对具有少于40个dmr的组的额外研究。用于3个dmr组合研究的dmr列表显示在表2中。用于10个dmr组合研究的dmr列表显示在表3中。用于40个dmr组合研究的dmr列表显示在表4中。“灵敏度全体(sensitivityall)”是指检测受试者是否患有结肠直肠癌或进行性腺瘤时的灵敏度。“灵敏度crc”是指检测患有结肠直肠癌的受试者的灵敏度。“灵敏度aa”是指检测患有进行性腺瘤的受试者的灵敏度。为了突出一个特定的实例,3个标志物组表明结肠直肠癌和进行性腺瘤与对照受试者的分离特别好,总体灵敏度为48%,特异性为93%。在93%的特异性下,进行性腺瘤的检测灵敏度为14%,结肠直肠癌的检测灵敏度为67%。
[0418]
表8.将40个结肠直肠癌dmr组及其子集应用于验证组的准确度度量。
[0419][0420]
实施例4.各种单独的甲基化生物标志物均具有高度信息性
[0421]
对来自40个结肠直肠癌dmr组的个体结肠直肠癌和进行性腺瘤dmr的性能进行评估揭示了各种个体结肠直肠癌dmr足以筛查结肠直肠癌和进行性腺瘤(参见图6-15)。图6-15分别显示了表示来自被鉴定为udx_29_1(图6)、udx_272.3_2(图7)、udx_277.7_2(图8)、
udx_272.4(图9).udx_174.3(图10)、udx_260.2_1(图11)、udx_260.1(图12)、udx_137.1(图13)、udx_17_2(图14)、and udx_230(图15)的dmr的msre-qpcr的ct(循环阈值)值的图表。
[0422]
对于选定的结肠直肠癌和进行性腺瘤dmr,图6-15显示了结肠直肠癌和进行性腺瘤样品(统称为“crc”)和对照样品(表示为“cnt”;健康受试者、患有增生性息肉的患者和非进行性腺瘤受试者)。结果显示为从45中减去的msre-qpcrct(“循环阈值”)值(即45

ct值)以用于显示目的。
[0423]
45-ct值越高,样品中甲基化程度越高。本实施例提供的数据以及本实施例提供的数据累积地(包括例如图4-9)证明对于鉴定的每个单独的dmr,甲基化状态信号在受试者组之间足够稳定以允许临床筛查用于结肠直肠癌和进行性腺瘤的组合。因此,呈现在图4-15的结果证实了本文提供的结肠直肠癌和进行性腺瘤的甲基化标志物可以提供用于筛查结肠直肠癌和进行性腺瘤的整体、鲁棒的信号。此外,本领域技术人员将理解,本公开提供了单独独立地用于筛查结肠直肠癌和进行性腺瘤的组合的甲基化生物标志物,特别是本文提供的甲基化生物标志物可单独使用或与相互组合使用。
[0424]
计算机系统和网络环境
[0425]
如图17所示,示出和描述了网络环境1700的实现,其用于提供用于检索、管理和分析来自本文所述的多个源的数据的系统、方法和架构。简要概述,现在参考图17,示出并描述了示例性云计算环境1700的框图。云计算环境1700可以包括一个或多个资源提供者1702a、1702b、1702c(统称为1702)。每个资源提供者1702可以包括计算资源。在一些实施方式中,计算资源可以包括用于处理数据的任何硬件和/或软件。例如,计算资源可以包括能够执行算法、计算机程序和/或计算机应用程序的硬件和/或软件。在一些实施方式中,示例性计算资源可以包括具有存储和检索能力的应用服务器和/或数据库。每个资源提供者1702可以连接到云计算环境1700中的任何其他资源提供者1702。在一些实现中,资源提供者1702可以通过计算机网络1708连接。每个资源提供者1702可以通过计算机网络1708连接到一个或多个计算设备1704a、1704b、1704c(统称为1704)。
[0426]
云计算环境1700可以包括资源管理器1706。资源管理器1706可以通过计算机网络1708连接到资源提供者1702和计算设备1704。在一些实施方式中,资源管理器1706可以促进由一个或多个资源提供者1702将计算资源提供至一个或多个计算设备1704。资源管理器1706可以从特定计算设备1704接收对计算资源的请求。资源管理器1706可以鉴定一个或多个资源提供者1702,所述资源提供者1702能够提供计算设备1704请求的计算资源。资源管理器1706可以选择资源提供者1702来提供计算资源。资源管理器1706可以促进资源提供者1702和特定计算设备1704之间的连接。在一些实施方式中,资源管理器1706可以建立特定资源提供者1702和特定计算设备1704之间的连接。在一些实施方式中,资源管理器1706可以将特定计算设备1704重定向到具有所请求计算资源的特定资源提供者1702。
[0427]
图18展示可用于实施本发明中描述的技术的计算设备1800和移动计算装置1850的实例。计算设备1800旨在表示各种形式的数字计算机,例如膝上型电脑、台式机、工作站、个人数字助理、服务器、刀片式服务器、大型机和其他适当的计算机。移动计算设备1850旨在表示各种形式的移动设备,例如个人数字助理、蜂窝电话、智能电话和其他类似的计算设备。这里显示的组件、它们的连接和关系以及它们的功能仅是示例,而不是限制。
[0428]
计算设备1800包括处理器1802、存储器1804、存储设备1806、连接到存储器1804的
高速接口1808和多个高速扩展端口1810、以及连接到低速扩展端口1814和存储设备1806的低速接口1812。处理器1802、存储器1804、存储设备1806、高速接口1808、高速扩展端口1810和低速接口1812中的每一个使用各种总线互连,并且可以安装在普通主板上或以其他适当的方式安装。处理器1802可以处理用于在计算设备1800内执行的指令,包括存储在存储器1804中或存储设备1806上的指令,以在外部输入/输出设备上显示gui的图形信息,例如连接到高速接口1808的显示器1816。在其他实施中,可以适当地使用多个处理器和/或多个总线以及多个存储器和存储器类型。
[0429]
存储器1804在计算设备1800内存储信息。在一些实施方式中,存储器1804是一个或多个易失性存储器单元。在一些实施方式中,存储器1804是一个或多个非易失性存储器单元。存储器1804也可以是另一种形式的计算机可读介质,例如磁盘或光盘。
[0430]
存储设备1806能够为计算设备1800提供大容量存储。在一些实施方式中,存储设备1806可以是或包含计算机可读介质,例如软盘设备、硬盘设备、光盘设备,或磁带设备、闪存或其他类似的固态存储设备,或设备阵列,包括存储区域网络或其他配置中的设备。指令可以存储在信息载体中。指令在由一个或多个处理设备(例如,处理器1802)执行时,执行一种或多种方法,例如上述那些。指令还可以由一个或多个存储设备存储,例如计算机或机器可读介质(例如,存储器1804、存储设备1806或处理器1802上的存储器)。
[0431]
高速接口1808管理计算设备1800的带宽密集型操作,而低速接口1812管理较低带宽密集型操作。这种功能分配仅是示例。在一些实施方式中,高速接口1808耦合至存储器1804、显示器1816(例如,通过图形处理器或加速器),并且耦合至可以接受各种扩展卡(未示出)的高速扩展端口1810)。在实施中,低速接口1812耦合至存储设备1806和低速扩展端口1814。低速扩展端口1814可以包括各种通信端口(例如,usb、以太网、例如,无线以太网),并且可以耦合至一个或多个输入/输出设备,例如键盘、定点设备、扫描仪或通过例如网络适配器耦合至网络设备,例如交换机或路由器。
[0432]
如图所示,计算设备1800可以以多种不同的形式实施。例如,其可以实现为标准服务器1820,或在一组这样的服务器中多次实施。此外,其可以在个人计算机中实现,例如膝上型计算机1822。其也可以作为机架服务器系统1824的一部分来实施。或者,来自计算设备1800的组件可以与移动设备(例如移动计算设备1850)中的其他组件组合(未示出)。这样的设备中的每一个可以包含计算设备1800和移动计算设备1850中的一个或多个,并且整个系统可以由相互通信的多个计算设备组成。
[0433]
移动计算设备1850包括处理器1852、存储器1864、诸如显示器1854的输入/输出设备、通信接口1866和收发器1868,以及其他组件。移动计算设备1850还可以配备有存储设备,例如微型驱动器或其他设备,以提供额外的存储。处理器1852、存储器1864、显示器1854、通信接口1866和收发器1868中的每一个都使用各种总线互连,并且可以将若干组件安装在公共母板上或以其他适当的方式安装。
[0434]
处理器1852可以在移动计算设备1850内执行指令,包括存储在存储器1864中的指令。处理器1852可以实现为包括单独和多个模拟和数字处理器的芯片组。处理器1852可以提供例如移动计算设备1850的其他组件的协调,例如用户界面的控制、移动计算设备1850运行的应用程序和移动计算设备1850的无线通信。
[0435]
处理器1852可以通过控制接口1858和耦合至显示器1854的显示接口1856与用户
通信。显示器1854可以是例如tft(薄膜晶体管液晶显示器)显示器或oled(有机发光二极管)显示器或其他合适的显示技术。显示接口1856可以包括用于驱动显示器1854向用户呈现图形和其他信息的适当电路。控制接口1858可以接收来自用户的命令并将它们转换以提交给处理器1852。另外,外部接口1862可以提供与处理器1852的通信,从而使移动计算设备1850能够与其他设备进行近距离区域通信。外部接口1862可以例如在一些实施中提供有线通信,或者在其他实施中提供无线通信,并且还可以使用多个接口。
[0436]
存储器1864将信息存储在移动计算设备1850内。存储器1864可以实施为一种或多种计算机可读介质、一个或多个易失性存储器单元、或一个或多个非易失性存储器单元。还可以提供扩展存储器1874并通过扩展接口1872连接至移动计算设备1850,扩展接口1872可以包括例如simm(单列直插存储器模块)卡接口。扩展存储器1874可以为移动计算设备1850提供额外的存储空间,或者也可以为移动计算设备1850存储应用程序或其他信息。具体地,扩展存储器1874可以包括用于执行或补充上述过程的指令,并且可能还包括安全信息。因此,例如,扩展存储器1874可以作为移动计算设备1850的安全模块提供,并且可以用允许安全使用移动计算设备1850的指令进行编程。此外,安全应用程序以及其他信息可以通过simm卡提供,例如以不可破解的方式将鉴定信息放置在simm卡上。
[0437]
存储器可以包括例如闪存和/或nvram存储器(非易失性随机存取存储器),如下所述。在一些实施方式中,指令存储在信息载体中。所述指令在由一个或多个处理设备(例如,处理器1852)执行时,执行一种或多种方法,例如上述那些。指令还可以由一个或多个存储设备存储,例如一个或多个计算机或机器可读介质(例如,存储器1864、扩展存储器1874或处理器1852上的存储器)。在一些实施方式中,可以例如通过收发器1868或外部接口1862在传播的信号中接收指令。
[0438]
移动计算设备1850可以通过通信接口1866进行无线通信,通信接口1866在必要时可以包括数字信号处理电路。通信接口1866可以提供各种模式或协议下的通信,例如gsm语音呼叫(全球移动通信系统)、sms(短消息服务)、ems(增强型消息服务)或mms消息(多媒体消息服务)、cdma(码分多址)、tdma(时分多址)、pdc(个人数字蜂窝)、wcdma(宽带码分多址)、cdma2000或gprs(通用分组无线服务)等。这种通信可以例如通过使用射频的收发器1868发生。此外,可能会发生短距离通信,例如使用wi-fi
tm
或其他此类收发器(未示出)。此外,gps(全球定位系统)接收器模块1870可以向移动计算设备1850提供额外的导航和位置相关的无线数据,这些数据可以由在移动计算设备1850上运行的应用程序适当地使用。
[0439]
移动计算设备1850还可以使用音频编解码器1860进行可听通信,该音频编解码器1860可以接收来自用户的语音信息并将其转换为可用的数字信息。音频编解码器1860同样可以为用户生成可听的声音,例如通过扬声器,例如,在移动计算设备1850的听筒(handset)中。这种声音可以包括来自语音电话呼叫的声音,可以包括录制的声音(例如,语音消息、音乐文件等)并且还可以包括由在移动计算设备1850上运行的应用程序生成的声音。
[0440]
如图所示,移动计算设备1850可以以多种不同的形式实施。例如,其可以实施为蜂窝电话1880。其也可以实施为智能电话1882、个人数字助理或其他类似移动设备的一部分。
[0441]
可以在数字电子电路、集成电路、专门设计的asic(专用集成电路)、计算机硬件、
固件、软件和/或它们的组合中实现这里描述的系统和技术的各种实施方式。这些不同的实施可以包括在一个或多个计算机程序中的实施,所述计算机程序在包括至少一个可编程处理器的可编程系统上是可执行和/或可解释的,该可编程处理器可以是专用或通用的,耦合以从存储系统、至少一个输入设备和至少一个输出设备接收数据和指令,并将数据和指令传递给存储系统、至少一个输入设备和至少一个输出设备。
[0442]
这些计算机程序(也称为程序、软件、软件应用程序或代码)包括用于可编程处理器的机器指令,并且可以以高级程序和/或面向对象的编程语言和/或汇编/机器来执行。如本文所用,术语机器可读介质和计算机可读介质是指用于向可编程处理器提供机器指令和/或数据的任何计算机程序产品、装置和/或设备(例如,磁盘、光盘、存储器、可编程逻辑设备(pld)),包括接收机器指令作为机器可读信号的机器可读介质。术语机器可读信号是指用于向可编程处理器提供机器指令和/或数据的任何信号。
[0443]
为了提供与用户的交互,这里描述的系统和技术可以在计算机上实施,所述计算机具有用于向用户显示信息的显示设备(例如,crt(阴极射线管)或lcd(液晶显示器)监视器),以及用户可以通过其向计算机提供输入的键盘和指点设备(例如鼠标或轨迹球)。也可以使用其他类型的设备来提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感官反馈(例如,视觉反馈、听觉反馈或触觉反馈);可以以任何形式接收来自用户的输入,包括声音、语音或触觉输入。
[0444]
此处描述的系统和技术可以在计算系统中实施,所述计算系统包括后端组件(例如,作为数据服务器)或包括中间件组件(例如,应用服务器)或包括前端组件的(例如,具有图形用户界面或web浏览器的客户端计算机,用户可以通过其与此处描述的系统和技术的实现进行交互),或此类后端、中间件或前端组件的任何组合。系统的组件可以通过任何形式或媒介的数字数据通信(例如,通信网络)相互连接。通信网络的实例包括局域网(lan)、广域网(wan)和互联网。
[0445]
计算系统可以包括客户端和服务器。客户端和服务器通常彼此远离并且通常通过通信网络进行交互。客户端和服务器的关系是通过在各自的计算机上运行并且彼此具有客户端-服务器关系的计算机程序而产生的。
[0446]
在一些实施方式中,本文描述的模块(例如,数据聚合模块1830、映射模块1850、规范模块1870)可以被分离、组合或并入单个或组合模块中。图中描绘的模块并非旨在将本文描述的系统限制于其中所示的软件架构。
[0447]
本文所述的不同实施方式的元件可以组合以形成以上未具体阐述的其他实施方式。元件可以被排除在本文描述的过程、计算机程序、数据库等之外,而不会对它们的操作产生不利影响。此外,图中描绘的逻辑流程不需要所示的特定顺序或次序来实现所需的结果。各种单独的元件可以组合成一个或多个单独的元件以执行本文所述的功能。
[0448]
在整个描述中,在设备和系统被描述为具有、包括或包含特定组件的情况下,或者在过程和方法被描述为具有、包括或包含特定步骤的情况下,预期另外还存在主要由所列举的组分组成或由所列举的组分组成的本发明的设备和系统,并且存在基本上由所列举的加工步骤组成或由所列举的处理步骤组成的根据本发明的工艺和方法。
[0449]
应当理解,只要本发明保持可操作,步骤的顺序或执行某些动作的顺序是无关紧要的。此外,可以同时进行两个以上步骤或动作。
[0450]
虽然本发明已参照特定的优选实施方式进行了具体展示和描述,但本领域技术人员应理解,在不背离由所附权利要求限定的本发明的精神和范围的情况下,可以在其中进行形式和细节上的各种改变。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献