一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

判定癌症状态之方法及系统与流程

2021-11-30 21:25:00 来源:中国专利 TAG:

判定癌症状态之方法及系统
本技术是申请日为2016年1月15日,申请号为201680004125.9,发明名称为“判定癌症状态之方法及系统(变更后的名称为“判定癌症状态之系统”)”的申请的分案申请。交叉参考
1.本技术主张2015年1月18日申请之美国临时申请第62/104,785号及2015年12月31日申请之美国申请第14/986,520号的权益,该等申请以引用的方式并入本文中。序列表
2.本技术含有序列表,该序列表已以ascii格式经efs网提交且以全文引用的方式并入本文中。2016年1月12日创建的该ascii复本命名为49697

701.601_sl.txt且大小为846个千字节。


背景技术:

3.癌症为世界范围内之主要死亡原因,预计在接下来的二十年期间,每年个案自2012年的一千四百万增至二千二百万(who)。在一些情况下,诊断程序仅在患者已呈现症状之后才开始,导致程序成本高、侵入性且耗时。另外,不可接近的区域有时会有碍于准确诊断。另外,较高的癌症发病率及死亡率与诊断较迟有关。


技术实现要素:

4.本文在某些实施方案中揭示用于判定个体之癌症类型的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒。在一些实施方案中,本文所述亦包括癌症早期侦测用的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒。在其他实施方案中,本文所述包括供非侵入性侦测癌症用的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒。在另外的其他实施方案中,本文所述包括用于区分不同癌症阶段的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒。在其他实施方案中,本文所述包括用于判定有需要之个体之癌症预后、预测治疗反应及治疗反应监测的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒。在其他实施方案中,本文所述包括用于产生cpg甲基化图谱数据库的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒,以及用于产生cpg甲基化数据的探针。
5.本文在某些实施方案中揭示一种利用cpg癌症甲基化数据产生癌症cpg甲基化图谱数据库的计算平台,该计算平台包含:(a)第一计算装置,其包含处理器、内存模块、操作系统及计算机程序,该计算机程序包括可由处理器执行以产生数据撷取应用程序之指令,以便产生一组生物样品的cpg甲基化数据,该数据撷取应用程序包含:(1)测序模块,其设置为可操作测序装置以产生一组生物样品的cpg甲基化数据,其中该组包含第一癌症生物样品、第二癌症生物样品、第三癌症生物样品、第一正常生物样品、第二正常生物样品及第三正常生物样品;其中该第一、第二及第三癌症生物样品为不同的;且其中该第一、第二及第三正常生物样品为不同的;及
(2)数据接收模块,其设置为可接收:(i)自第一癌症生物样品及第一正常生物样品产生的第一对cpg甲基化数据集,其中自第一癌症生物样品产生的cpg甲基化数据形成第一对数据集内的第一数据集,自第一正常生物样品产生的cpg甲基化数据形成第一对数据集内的第二数据集,且第一癌症生物样品及第一正常生物样品来自同一生物样品来源;(ii)自第二正常生物样品及第三正常生物样品产生的第二对cpg甲基化数据集,其中自第二正常生物样品产生的cpg甲基化数据形成第二对数据集内之第三数据集,自第三正常生物样品产生的cpg甲基化数据形成第二对数据集内的第四数据集,且第一、第二及第三正常生物样品为不同的;及(iii)自第二癌症生物样品及第三癌症生物样品产生的第三对cpg甲基化数据集,其中自第二癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第五数据集,自第三癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第六数据集,且第一、第二及第三癌症生物样品为不同的;及(b)第二计算装置,其包含处理器、内存模块、操作系统及计算机程序,该计算机程序包括可由处理器执行以产生数据分析应用程序的指令,以便产生癌症cpg甲基化图谱数据库,该数据分析应用程序包含数据分析模块,该数据分析模块设置为可:(1)利用第一对、第二对及第三对数据集产生逐对甲基化差异数据集;及(2)藉由机器学习方法、利用对照数据集分析逐对甲基化差异数据集以产生癌症cpg甲基化图谱数据库,其中(i)机器学习方法包含:基于最高分数鉴别复数个标志物及复数个权重,及基于该复数个标志物及复数个权重对样品进行分类;及(ii)癌症cpg甲基化图谱数据库包含一组cpg甲基化图谱且各cpg甲基化图谱代表一种癌症类型。
6.在一些实施方案中,产生逐对甲基化差异数据集包含:(a)计算第一对数据集内之第一数据集与第二数据集之间的差异;(b)计算第二对数据集内之第三数据集与第四数据集之间的差异;及(c)计算第三对数据集内之第五数据集与第六数据集之间的差异。在一些实施方案中,产生逐对甲基化差异数据集进一步基于所计算的第一对数据集差异、所计算的第二对数据集差异及所计算的第三对数据集差异。
7.在一些实施方案中,机器学习方法包含半监督学习方法或无监督学习方法。在一些实施方案中,机器学习方法系利用选自以下一种或多种的算法:主分量分析、逻辑回归分析、最近相邻分析、支持向量机及神经网络模型。
8.在一些实施方案中,cpg甲基化数据系自经脱胺剂处理的经萃取基因组dna产生。在一些实施方案中,数据分析模块经进一步设置为可藉由下一代测序方法分析经萃取的基因组dna以产生cpg甲基化数据。在一些实施方案中,下一代测序方法为数字pcr测序方法。
9.在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200或超过200个选自由表15至表18组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表15组
成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表16组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表17组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表18组成的组中的生物标志物。
10.在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200或超过200个选自以下的生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、
cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
11.在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100或超过100个选自表20的生物标志物。在一些实施方案中,甲基化图谱包含至少10、20、30、40、50、100或超过100个选自以下的生物标志物:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044。
12.在一些实施方案中,甲基化图谱包含至少1、2、3或4个选自cg25574765、cg25490145、cg18384097、cg25922751及cg17126555的生物标志物。
13.在一些实施方案中,癌症类型为实体癌症类型或血液学恶性癌症类型。在一些实施方案中,癌症类型为转移性癌症类型或复发性或难治性癌症类型。在一些实施方案中,癌症类型包含急性骨髓性白血病(laml或aml)、急性淋巴母细胞白血病(all)、肾上腺皮质癌(acc)、膀胱尿道上皮癌(blca)、脑干神经胶质瘤、脑低级神经胶质瘤(lgg)、脑肿瘤、乳癌(brca)、支气管肿瘤、伯基特淋巴瘤(burkitt lymphoma)、原发位点未知之癌症、类癌瘤、原发位点未知之癌瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤、子宫颈鳞状细胞癌、子宫颈内腺癌(cesc)癌症、儿童期癌症、胆管癌(chol)、脊索瘤、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生病、结肠(腺癌)癌症(coad)、结肠直肠癌、颅咽管瘤、皮肤t细胞淋巴瘤、内分泌胰脏胰岛细胞肿瘤、子宫内膜癌、室管膜母细胞瘤、室管膜瘤、食道癌(esca)、嗅神经母细胞瘤、尤文氏肉瘤(ewing sarcoma)、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、胆囊癌、胃癌、胃肠类癌瘤、胃肠基质细胞肿瘤、胃肠
基质肿瘤(gist)、妊娠期滋养层肿瘤、神经胶母细胞瘤多形神经胶质瘤(gbm)、毛细胞白血病、头颈癌(hnsd)、心脏癌症、霍奇金氏淋巴瘤(hodgkin lymphoma)、下咽癌、眼内黑色素瘤、胰岛细胞肿瘤、卡波西肉瘤(kaposi sarcoma)、肾脏癌症、兰格汉氏细胞组织细胞增多病(langerhans cell histiocytosis)、喉癌、唇癌、肝癌、淋巴细胞性赘瘤弥漫性大b细胞淋巴瘤(dlbcl)、恶性纤维组织细胞瘤骨癌、神经管胚细胞瘤、神经管上皮瘤、黑色素瘤、梅克尔细胞癌(merkel cell carcinoma)、梅克尔细胞皮肤癌、间皮瘤(meso)、原发不明的转移性鳞状颈癌、口癌、多发性内分泌赘瘤形成症候群、多发性骨髓瘤、多发性骨髓瘤/浆细胞赘瘤、蕈样真菌病、骨髓发育不良症候群、骨髓增生性赘瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金氏淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、口部癌、口腔癌、口咽癌、骨肉瘤、其他脑及脊髓肿瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤、胰脏癌、乳头状瘤症、副鼻窦癌、副甲状腺癌、骨盆癌、阴茎癌、咽癌、嗜铬细胞瘤及副神经节瘤(pcpg)、中分化松果体实质性肿瘤、松果体母细胞瘤、脑垂体肿瘤、浆细胞赘瘤/多发性骨髓瘤、胸膜肺母细胞瘤、原发中枢神经系统(cns)淋巴瘤、原发肝细胞肝癌、前列腺癌(诸如前列腺腺癌(prad))、直肠癌、肾癌、肾细胞(肾脏)癌症、肾细胞癌、呼吸道癌症、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌症、肉瘤(sarc)、塞扎莱症候群(sezary syndrome)、表皮皮肤黑色素瘤(skcm)、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌、小脑幕上原始神经外胚层肿瘤、t细胞淋巴瘤、睪丸癌睪丸生殖细胞肿瘤(tgct)、咽喉癌、胸腺癌、胸腺瘤(thym)、甲状腺癌(thca)、移行细胞癌、肾盂及输尿管之移行细胞癌、滋养层肿瘤、输尿管癌、尿道癌、子宫癌、子宫癌、葡萄膜黑色素瘤(uvm)、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症(waldenstrom macroglobulinemia)或威尔姆氏肿瘤(wilm's tumor)。在一些实施方案中,癌症类型包含急性淋巴母细胞白血病、急性骨髓性白血病、膀胱癌、乳癌、脑癌、子宫颈癌、胆管癌(chol)、结肠癌、结肠直肠癌、子宫内膜癌、食道癌、胃肠癌、神经胶质瘤、神经胶母细胞瘤、头颈癌、肾脏癌、肝癌、肺癌、淋巴细胞性赘瘤、黑色素瘤、骨髓赘瘤、卵巢癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、鳞状细胞癌、睪丸癌、胃癌或甲状腺癌。在一些实施方案中,癌症类型包含膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、胃癌或甲状腺癌。
14.在一些实施方案中,对照数据集包含一组甲基化图谱,其中该甲基化图谱各自利用获自已知癌症类型的生物样品产生。
15.在一些实施方案中,生物样品包含无细胞生物样品。在一些实施方案中,生物样品包含流行性肿瘤dna样品。在一些实施方案中,生物样品包含活检样品。在一些实施方案中,生物样品包含组织样品。
16.在一些实施方案中,本文描述一种计算系统,其包含处理器、内存模块、设置为可执行机器可读指令的操作系统,及计算机程序,该计算机程序包括可由处理器执行以产生分析应用程序之指令以便产生癌症cpg甲基化图谱数据库,该分析应用程序包含:(a)数据接收模块,其设置为可接收:(1)自第一癌症生物样品及第一正常生物样品产生的第一对cpg甲基化数据集,其中自第一癌症生物样品产生的cpg甲基化数据形成第一对数据集内的第一数据集,自第一正常生物样品产生的cpg甲基化数据形成第一对数据集内的第二数据集,且第一癌症生物
样品及第一正常生物样品来自同一生物样品来源;(2)自第二正常生物样品及第三正常生物样品产生的第二对cpg甲基化数据集,其中自第二正常生物样品产生的cpg甲基化数据形成第二对数据集内之第三数据集,自第三正常生物样品产生的cpg甲基化数据形成第二对数据集内的第四数据集,且第一、第二及第三正常生物样品为不同的;及(3)自第二癌症生物样品及第三癌症生物样品产生的第三对cpg甲基化数据集,其中自第二癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第五数据集,自第三癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第六数据集,且第一、第二及第三癌症生物样品为不同的;及(b)数据分析模块,其设置为可:(1)利用第一对、第二对及第三对数据集产生逐对甲基化差异数据集;及(2)藉由机器学习方法、利用对照数据集分析逐对甲基化差异数据集以产生癌症cpg甲基化图谱数据库,其中(i)机器学习方法包含:基于最高分数鉴别复数个标志物及复数个权重,及基于该复数个标志物及复数个权重对样品进行分类;及(ii)癌症cpg甲基化图谱数据库包含一组cpg甲基化图谱且各cpg甲基化图谱代表一种癌症类型。
17.本文在某些实施方案中揭示一种产生癌症cpg甲基化图谱数据库的计算机实施方法,其包含:a.藉由测序方法产生一组生物样品的cpg甲基化数据,其中该组包含第一癌症生物样品、第二癌症生物样品、第三癌症生物样品、第一正常生物样品、第二正常生物样品及第三正常生物样品;其中该第一、第二及第三癌症生物样品为不同的;且其中该第一、第二及第三正常生物样品为不同的;b.利用第一处理器获得自第一癌症生物样品及第一正常生物样品产生的第一对cpg甲基化数据集,其中自第一癌症生物样品产生的cpg甲基化数据形成第一对数据集内之第一数据集,自第一正常生物样品产生的cpg甲基化数据形成第一对数据集内之第二数据集,且第一癌症生物样品及第一正常生物样品来自同一生物样品来源;c.利用第一计算装置获得自第二正常生物样品及第三正常生物样品产生的第二对cpg甲基化数据集,其中自第二正常生物样品产生的cpg甲基化数据形成第二对数据集内之第三数据集,自第三正常生物样品产生的cpg甲基化数据形成第二对数据集内之第四数据集,且第一、第二及第三正常生物样品为不同的;d.利用第一计算装置获得自第二癌症生物样品及第三癌症生物样品产生的第三对cpg甲基化数据集,其中自第二癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第五数据集,自第三癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第六数据集,且第一、第二及第三癌症生物样品为不同的;e.利用第二处理器,自第一、第二及第三对数据集产生逐对甲基化差异数据集;及f.藉由机器学习方法、利用对照数据集分析逐对甲基化差异数据集以产生癌症cpg甲基化图谱数据库,其中(1)机器学习方法包含:基于最高分数鉴别复数个标志物及复数个权重,及基于该
复数个标志物及复数个权重对样品进行分类;及(2)癌症cpg甲基化图谱数据库包含一组cpg甲基化图谱且各cpg甲基化图谱代表一种癌症类型。
18.在一些实施方案中,步骤e)进一步包含(a)计算第一对数据集内之第一数据集与第二数据集之间的差异;(b)计算第二对数据集内之第三数据集与第四数据集之间的差异;及(c)计算第三对数据集内之第五数据集与第六数据集之间的差异。在一些实施方案中,步骤e)进一步包含利用第二处理器自所计算的第一对数据集差异、所计算的第二对数据集差异及所计算的第三对数据集差异产生逐对甲基化差异数据集。
19.在一些实施方案中,机器学习方法包含半监督学习方法或无监督学习方法。在一些实施方案中,机器学习方法系利用选自以下一种或多种的算法:主分量分析、逻辑回归分析、最近相邻分析、支持向量机及神经网络模型。
20.在一些实施方案中,cpg甲基化数据系自经脱胺剂处理的经萃取基因组dna产生。
21.在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200或超过200个选自由表15至表18组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表15组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表16组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表17组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表18组成的组中的生物标志物。
22.在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200或超过200个选自以下的生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、
cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
23.在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100或超过100个选自表20的生物标志物。在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100或超过100个选自以下的生物标志物:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、
cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044。
24.在一些实施方案中,甲基化图谱包含至少1、2、3或4个选自cg25574765、cg25490145、cg18384097、cg25922751及cg17126555的生物标志物。
25.在一些实施方案中,癌症类型为实体癌症类型或血液学恶性癌症类型。在一些实施方案中,癌症类型为复发性或难治性癌症类型。在一些实施方案中,癌症类型包含急性骨髓性白血病(laml或aml)、急性淋巴母细胞白血病(all)、肾上腺皮质癌(acc)、膀胱尿道上皮癌(blca)、脑干神经胶质瘤、脑低级神经胶质瘤(lgg)、脑肿瘤、乳癌(brca)、支气管肿瘤、伯基特淋巴瘤、原发位点未知之癌症、类癌瘤、原发位点未知之癌瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤、子宫颈鳞状细胞癌、子宫颈内腺癌(cesc)癌症、儿童期癌症、胆管癌(chol)、脊索瘤、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生病、结肠(腺癌)癌症(coad)、结肠直肠癌、颅咽管瘤、皮肤t细胞淋巴瘤、内分泌胰脏胰岛细胞肿瘤、子宫内膜癌、室管膜母细胞瘤、室管膜瘤、食道癌(esca)、嗅神经母细胞瘤、尤文氏肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、胆囊癌、胃癌、胃肠类癌瘤、胃肠基质细胞肿瘤、胃肠基质肿瘤(gist)、妊娠期滋养层肿瘤、神经胶母细胞瘤多形神经胶质瘤(gbm)、毛细胞白血病、头颈癌(hnsd)、心脏癌症、霍奇金氏淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞肿瘤、卡波西肉瘤、肾脏癌症、兰格汉氏细胞组织细胞增多病、喉癌、唇癌、肝癌、淋巴细胞性赘瘤弥漫性大b细胞淋巴瘤(dlbcl)、恶性纤维组织细胞瘤骨癌、神经管胚细胞瘤、神经管上皮瘤、黑色素瘤、梅克尔细胞癌、梅克尔细胞皮肤癌、间皮瘤(meso)、原发不明的转移性鳞状颈癌、口癌、多发性内分泌赘瘤形成症候群、多发性骨髓瘤、多发性骨髓瘤/浆细胞赘瘤、蕈样真菌病、骨髓发育不良症候群、骨髓增生性赘瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金氏淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、口部癌、口腔癌、口咽癌、骨肉瘤、其他脑及脊髓肿瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤、胰脏癌、乳头状瘤症、副鼻窦癌、副甲状腺癌、骨盆癌、阴茎癌、咽癌、嗜铬细胞瘤及副神经节瘤(pcpg)、中分化松果体实质性肿瘤、松果体母细胞瘤、脑垂体肿瘤、浆细胞赘瘤/多发性骨髓瘤、胸膜肺母细胞瘤、原发中枢神经系统(cns)淋巴瘤、原发肝细胞肝癌、前列腺癌(诸如前列腺腺癌(prad))、直肠癌、肾癌、肾细胞(肾脏)癌症、肾细胞癌、呼吸道癌症、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌症、肉瘤(sarc)、塞扎莱症候群、表皮皮肤黑色素瘤(skcm)、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌、小脑幕上原始神经外胚层肿瘤、t细胞淋巴瘤、睪丸癌睪丸生殖细胞肿瘤(tgct)、咽喉癌、胸腺癌、胸腺瘤(thym)、甲状腺癌(thca)、移行细胞癌、肾盂及输尿管之移行细胞癌、滋养层肿瘤、输尿管癌、尿道癌、子宫癌、子宫癌、葡萄膜黑色素瘤(uvm)、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症或威尔姆氏肿瘤。在一些实施方案中,癌症类型包含急性淋巴母细胞白血病、急性骨髓性白血病、膀胱癌、乳癌、脑癌、子宫颈癌、胆管癌(chol)、结肠癌、结肠直肠癌、子宫内膜癌、食道癌、胃肠癌、神经胶质瘤、神经胶母细胞瘤、头颈癌、肾脏癌、肝癌、肺癌、淋巴细胞性赘瘤、黑色素瘤、骨髓赘瘤、卵巢癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、鳞状细胞癌、睪丸癌、胃癌或甲状腺癌。在一些实施方案中,癌症类型包含膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、胃癌或甲状腺
癌。
26.在一些实施方案中,对照数据集包含一组甲基化图谱,其中该甲基化图谱各自利用获自已知癌症类型的生物样品产生。
27.在一些实施方案中,生物样品包含无细胞生物样品。在一些实施方案中,生物样品包含流行性肿瘤dna样品。在一些实施方案中,生物样品包含活检样品。在一些实施方案中,生物样品包含组织样品。
28.在一些实施方案中,本文描述一种诊断有需要之个体之癌症的计算机实施方法,其包含:a.利用第一处理器获得自第四癌症生物样品及第四正常生物样品产生的第四对cpg甲基化数据集,其中自第四癌症生物样品产生的cpg甲基化数据形成第四对数据集内之第七数据集,自第一正常生物样品产生的cpg甲基化数据形成第四对数据集内之第八数据集,且第四癌症生物样品及第四正常生物样品来自同一生物样品来源;b.利用第一处理器获得自第五正常生物样品及第六正常生物样品产生的第五对cpg甲基化数据集,其中自第五正常生物样品产生的cpg甲基化数据形成第五对数据集内之第九数据集,自第六正常生物样品产生的cpg甲基化数据形成第五对数据集内之第十数据集,且第四、第五及第六正常生物样品为不同的;c.利用第一处理器获得自第五癌症生物样品及第六癌症生物样品产生的第六对cpg甲基化数据集,其中自第五癌症生物样品产生的cpg甲基化数据形成第六对数据集内之第十一数据集,自第六癌症生物样品产生的cpg甲基化数据形成第六对数据集内之第十二数据集,且第四、第五及第六癌症生物样品为不同的;d.利用第二处理器自第四对、第五对及第六对数据集产生第二逐对甲基化差异数据集;及e.利用上述癌症cpg甲基化图谱数据库分析第二逐对甲基化差异数据集,其中第二逐对甲基化差异数据集与癌症cpg甲基化图谱数据库内之cpg甲基化图谱之间的相关性决定个体的癌症类型。
29.在一些实施方案中,第一处理器位于第一计算装置且第二处理器位于第二计算装置。在一些实施方案中,方法进一步包含基于所诊断的癌症类型实施治疗方案。
30.在一些实施方案中,本文描述一种区分有需要之个体之原发肿瘤与转移性癌症的计算机实施方法,其包含:a.利用第一处理器获得自第四癌症生物样品及第四正常生物样品产生的第四对cpg甲基化数据集,其中自第四癌症生物样品产生的cpg甲基化数据形成第四对数据集内之第七数据集,自第一正常生物样品产生的cpg甲基化数据形成第四对数据集内之第八数据集,且第四癌症生物样品及第四正常生物样品来自同一生物样品来源;b.利用第一处理器获得自第五正常生物样品及第六正常生物样品产生的第五对cpg甲基化数据集,其中自第五正常生物样品产生的cpg甲基化数据形成第五对数据集内之第九数据集,自第六正常生物样品产生的cpg甲基化数据形成第五对数据集内之第十数据集,且第四、第五及第六正常生物样品为不同的;c.利用第一处理器获得自第五癌症生物样品及第六癌症生物样品产生的第六对cpg甲基化数据集,其中自第五癌症生物样品产生的cpg甲基化数据形成第六对数据集内之
第十一数据集,自第六癌症生物样品产生的cpg甲基化数据形成第六对数据集内之第十二数据集,且第四、第五及第六癌症生物样品为不同的;d.利用第二处理器自第四对、第五对及第六对数据集产生第二逐对甲基化差异数据集;及e.利用上述癌症cpg甲基化图谱数据库分析第二逐对甲基化差异数据集,其中第二逐对甲基化差异数据集与癌症cpg甲基化图谱数据库内之cpg甲基化图谱之间的相关性将区分个体之原发肿瘤与转移性癌症。
31.在一些实施方案中,本文描述一种监测有需要之个体之癌症进展的计算机实施方法,其包含:a.利用第一处理器获得自第四癌症生物样品及第四正常生物样品产生的第四对cpg甲基化数据集,其中自第四癌症生物样品产生的cpg甲基化数据形成第四对数据集内之第七数据集,自第一正常生物样品产生的cpg甲基化数据形成第四对数据集内之第八数据集,且第四癌症生物样品及第四正常生物样品来自同一生物样品来源;b.利用第一处理器获得自第五正常生物样品及第六正常生物样品产生的第五对cpg甲基化数据集,其中自第五正常生物样品产生的cpg甲基化数据形成第五对数据集内之第九数据集,自第六正常生物样品产生的cpg甲基化数据形成第五对数据集内之第十数据集,且第四、第五及第六正常生物样品为不同的;c.利用第一处理器获得自第五癌症生物样品及第六癌症生物样品产生的第六对cpg甲基化数据集,其中自第五癌症生物样品产生的cpg甲基化数据形成第六对数据集内之第十一数据集,自第六癌症生物样品产生的cpg甲基化数据形成第六对数据集内之第十二数据集,且第四、第五及第六癌症生物样品为不同的;d.利用第二处理器自第四对、第五对及第六对数据集产生第二逐对甲基化差异数据集;及e.利用上述癌症cpg甲基化图谱数据库分析第二逐对甲基化差异数据集,其中第二逐对甲基化差异数据集与癌症cpg甲基化图谱数据库内之cpg甲基化图谱之间的相关性指示个体是否存在癌症进展。
32.在一些实施方案中,个体在获得第一癌症生物样品及第一正常生物样品之前已接受治疗。
33.在一些实施方案中,本文描述判定有需要之个体之癌症进展的计算机实施方法,其包含:a.利用第一处理器获得自第四癌症生物样品及第四正常生物样品产生的第四对cpg甲基化数据集,其中自第四癌症生物样品产生的cpg甲基化数据形成第四对数据集内之第七数据集,自第一正常生物样品产生的cpg甲基化数据形成第四对数据集内之第八数据集,且第四癌症生物样品及第四正常生物样品来自同一生物样品来源;b.利用第一处理器获得自第五正常生物样品及第六正常生物样品产生的第五对cpg甲基化数据集,其中自第五正常生物样品产生的cpg甲基化数据形成第五对数据集内之第九数据集,自第六正常生物样品产生的cpg甲基化数据形成第五对数据集内之第十数据集,且第四、第五及第六正常生物样品为不同的;c.利用第一处理器获得自第五癌症生物样品及第六癌症生物样品产生的第六对
cpg甲基化数据集,其中自第五癌症生物样品产生的cpg甲基化数据形成第六对数据集内之第十一数据集,自第六癌症生物样品产生的cpg甲基化数据形成第六对数据集内之第十二数据集,且第四、第五及第六癌症生物样品为不同的;d.利用第二处理器自第四对、第五对及第六对数据集产生第二逐对甲基化差异数据集;及e.利用上述癌症cpg甲基化图谱数据库分析第二逐对甲基化差异数据集,其中第二逐对甲基化差异数据集与癌症cpg甲基化图谱数据库内之cpg甲基化图谱之间的相关性决定个体之癌症预后。
34.在一些实施方案中,癌症预后与癌症阶段相关。在一些实施方案中,癌症预后与癌症阶段无关。在一些实施方案中,癌症预后指示个体具有治疗反应的潜在性。
35.本文在某些实施方案中揭示包含复数个探针的探针组,各探针为式i之探针:其中:a为第一标靶结合区;b为第二标靶结合区;及l为连接体区;其中a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少30个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性;b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少12个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性;l连接至a;且b连接至a或l。
36.在一些实施方案中,l连接至a且b连接至l。在一些实施方案中,复数个探针包含至少10、20、30、50、100或超过100个探针。在一些实施方案中,基于溶液的下一代测序反应中使用复数个探针来产生cpg甲基化数据。在一些实施方案中,基于溶液的下一代测序反应为液滴数字pcr测序方法。在一些实施方案中,每个探针与一个cpg位点相关。在一些实施方案中,l的长度介于10与60个、15与55个、20与50个、25与45个及30与40个核苷酸之间。在一些实施方案中,l进一步包含接附子区域。在一些实施方案中,接附子区域包含用于鉴别各探针的序列。
37.在某些实施方案中,本文揭示一种其上储存有指令的非暂时性计算机可读介质,该等指令当藉由处理器执行时,执行包含以下之步骤:a.藉由测序方法产生一组生物样品的cpg甲基化数据,其中该组包含第一癌症生物样品、第二癌症生物样品、第三癌症生物样品、第一正常生物样品、第二正常生物样品及第三正常生物样品;其中该第一、第二及第三癌症生物样品为不同的;且其中该第一、第二及第三正常生物样品为不同的;b.利用第一处理器获得自第一癌症生物样品及第一正常生物样品产生的第一对cpg甲基化数据集,其中自第一癌症生物样品产生的cpg甲基化数据形成第一对数据集内之
第一数据集,自第一正常生物样品产生的cpg甲基化数据形成第一对数据集内之第二数据集,且第一癌症生物样品及第一正常生物样品来自同一生物样品来源;c.利用第一计算装置获得自第二正常生物样品及第三正常生物样品产生的第二对cpg甲基化数据集,其中自第二正常生物样品产生的cpg甲基化数据形成第二对数据集内之第三数据集,自第三正常生物样品产生的cpg甲基化数据形成第二对数据集内之第四数据集,且第一、第二及第三正常生物样品为不同的;d.利用第一计算装置获得自第二癌症生物样品及第三癌症生物样品产生的第三对cpg甲基化数据集,其中自第二癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第五数据集,自第三癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第六数据集,且第一、第二及第三癌症生物样品为不同的;e.利用第二处理器,自第一、第二及第三对数据集产生逐对甲基化差异数据集;及f.藉由机器学习方法、利用对照数据集分析逐对甲基化差异数据集以产生癌症cpg甲基化图谱数据库,其中(1)机器学习方法包含:基于最高分数鉴别复数个标志物及复数个权重,及基于该复数个标志物及复数个权重对样品进行分类;及(2)癌症cpg甲基化图谱数据库包含一组cpg甲基化图谱且各cpg甲基化图谱代表一种癌症类型。
38.在一些实施方案中,步骤e)进一步包含(a)计算第一对数据集内之第一数据集与第二数据集之间的差异;(b)计算第二对数据集内之第三数据集与第四数据集之间的差异;及(c)计算第三对数据集内之第五数据集与第六数据集之间的差异。在一些实施方案中,步骤e)进一步包含利用第二处理器自所计算的第一对数据集差异、所计算的第二对数据集差异及所计算的第三对数据集差异产生逐对甲基化差异数据集。
39.在一些实施方案中,机器学习方法包含半监督学习方法或无监督学习方法。在一些实施方案中,机器学习方法系利用选自以下一种或多种的算法:主分量分析、逻辑回归分析、最近相邻分析、支持向量机及神经网络模型。
40.在一些实施方案中,cpg甲基化数据系自经脱胺剂处理的经萃取基因组dna产生。
41.在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200或超过200个选自由表15至表18组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表15组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表16组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表17组成的组中的生物标志物。在一些实施方案中,甲基化图谱包含约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个选自由表18组成的组中的生物标志物。
42.在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200或超过200个选自以下的生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、
cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
43.在一些实施方案中,甲基化图谱包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、100或超过100个选自表20的生物标志物。在一些实施方案中,甲基化图谱包含至少1、2、3、
4、5、6、7、8、9、10、20、30、40、50、100或超过100个选自以下的生物标志物:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044。
44.在一些实施方案中,甲基化图谱包含至少1、2、3或4个选自cg25574765、cg25490145、cg18384097、cg25922751及cg17126555的生物标志物。
45.在一些实施方案中,癌症类型为实体癌症类型或血液学恶性癌症类型。在一些实施方案中,癌症类型为复发性或难治性癌症类型。在一些实施方案中,癌症类型包含急性骨髓性白血病(laml或aml)、急性淋巴母细胞白血病(all)、肾上腺皮质癌(acc)、膀胱尿道上皮癌(blca)、脑干神经胶质瘤、脑低级神经胶质瘤(lgg)、脑肿瘤、乳癌(brca)、支气管肿瘤、伯基特淋巴瘤、原发位点未知之癌症、类癌瘤、原发位点未知之癌瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤、子宫颈鳞状细胞癌、子宫颈内腺癌(cesc)癌症、儿童期癌症、胆管癌(chol)、脊索瘤、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生病、结肠(腺癌)癌症(coad)、结肠直肠癌、颅咽管瘤、皮肤t细胞淋巴瘤、内分泌胰脏胰岛细胞肿瘤、子宫内膜癌、室管膜母细胞瘤、室管膜瘤、食道癌(esca)、嗅神经母细胞瘤、尤文氏肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、胆囊癌、胃癌、胃肠类癌瘤、胃肠基质细胞肿瘤、胃肠基质肿瘤(gist)、妊娠期滋养层肿瘤、神经胶母细胞瘤多形神经胶质瘤(gbm)、毛细胞白血病、头颈癌(hnsd)、心脏癌症、霍奇金氏淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞肿瘤、卡波西肉瘤、肾脏癌症、兰格汉氏细胞组织细胞增多病、喉癌、唇癌、肝癌、淋巴细胞性赘瘤弥漫性大b细胞淋巴瘤(dlbcl)、恶性纤维组织细胞瘤骨癌、神经管胚细胞瘤、神经管上皮瘤、黑色素瘤、梅克尔细胞癌、梅克尔细胞皮肤癌、间皮瘤(meso)、原发不明的转移性鳞状颈癌、口癌、多发性内分泌赘瘤形成症候群、多发性骨髓瘤、多发性骨髓瘤/浆细胞赘瘤、蕈样真菌病、骨髓发育不良症候群、骨髓增生性赘瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金氏淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、口部癌、口腔癌、口咽癌、骨肉瘤、其他脑及脊髓肿瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤、胰脏癌、乳头状瘤症、副鼻窦癌、副甲状腺癌、骨盆癌、阴茎癌、咽癌、嗜铬细胞瘤及副神经节瘤(pcpg)、中分化松果体实质性肿瘤、松果体母细胞瘤、脑垂体肿瘤、浆细
胞赘瘤/多发性骨髓瘤、胸膜肺母细胞瘤、原发中枢神经系统(cns)淋巴瘤、原发肝细胞肝癌、前列腺癌(诸如前列腺腺癌(prad))、直肠癌、肾癌、肾细胞(肾脏)癌症、肾细胞癌、呼吸道癌症、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌症、肉瘤(sarc)、塞扎莱症候群、表皮皮肤黑色素瘤(skcm)、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌、小脑幕上原始神经外胚层肿瘤、t细胞淋巴瘤、睪丸癌睪丸生殖细胞肿瘤(tgct)、咽喉癌、胸腺癌、胸腺瘤(thym)、甲状腺癌(thca)、移行细胞癌、肾盂及输尿管之移行细胞癌、滋养层肿瘤、输尿管癌、尿道癌、子宫癌、子宫癌、葡萄膜黑色素瘤(uvm)、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症或威尔姆氏肿瘤。在一些实施方案中,癌症类型包含急性淋巴母细胞白血病、急性骨髓性白血病、膀胱癌、乳癌、脑癌、子宫颈癌、胆管癌(chol)、结肠癌、结肠直肠癌、子宫内膜癌、食道癌、胃肠癌、神经胶质瘤、神经胶母细胞瘤、头颈癌、肾脏癌、肝癌、肺癌、淋巴细胞性赘瘤、黑色素瘤、骨髓赘瘤、卵巢癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、鳞状细胞癌、睪丸癌、胃癌或甲状腺癌。在一些实施方案中,癌症类型包含膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、胃癌或甲状腺癌。
46.在一些实施方案中,对照数据集包含一组甲基化图谱,其中该甲基化图谱各自利用获自已知癌症类型的生物样品产生。
47.在一些实施方案中,生物样品包含无细胞生物样品。在一些实施方案中,生物样品包含流行性肿瘤dna样品。在一些实施方案中,生物样品包含活检样品。在一些实施方案中,生物样品包含组织样品。
48.在某些实施方案中,本文揭示一种判定有需要之个体中之癌症之存在的方法,其包含:(a)用脱胺剂处理所萃取的基因组dna以产生包含脱胺基核苷酸之经处理基因组dna,其中所萃取的基因组dna系获自个体生物样品;(b)自经处理之基因组dna产生包含一或多个选自表20之生物标志物的甲基化图谱;及(c)对该甲基化图谱与对照图谱进行比较,其中甲基化图谱与对照图谱之间的相关性决定个体中癌症之存在。
49.在一些实施方案中,甲基化图谱进一步包含一或多个选自表15至表18的生物标志物。
50.在一些实施方案中,甲基化图谱进一步包含一或多个选自以下之生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、
cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
51.在一些实施方案中,该比较进一步包含产生逐对甲基化差异数据集,该数据集包含(i)经处理之基因组dna之甲基化图谱与第一正常样品之甲基化图谱之间的第一差异;(ii)第二正常样品之甲基化图谱与第三正常样品之甲基化图谱之间的第二差异;及(iii)第一原发癌样品之甲基化图谱与第二原发癌样品之甲基化图谱之间的第三差异。在一些实施方案中,该比较进一步包含藉由机器学习方法、利用对照来分析逐对甲基化差异数据集以产生甲基化图谱。在一些实施方案中,该比较进一步包含判定个体之癌症类型。在一些实施方案中,机器学习方法系利用选自以下一种或多种的算法:主分量分析、逻辑回归分析、最近相邻分析、支持向量机及神经网络模型。
52.在一些实施方案中,该产生进一步包含使一种或多种生物标志物中的每一个与探针杂交及执行dna测序反应以定量一种或多种生物标志物中之每一者的甲基化。在一些实
施方案中,dna测序反应为数字pcr反应。
53.在一些实施方案中,对照图谱包含正常样品之甲基化图谱。在一些实施方案中,对照图谱包含癌症样品之甲基化图谱。
54.在一些实施方案中,癌症类型为实体癌症类型或血液学恶性癌症类型。在一些实施方案中,癌症类型为转移性癌症类型或复发性或难治性癌症类型。在一些实施方案中,癌症类型包含急性骨髓性白血病(laml或aml)、急性淋巴母细胞白血病(all)、肾上腺皮质癌(acc)、膀胱尿道上皮癌(blca)、脑干神经胶质瘤、脑低级神经胶质瘤(lgg)、脑肿瘤、乳癌(brca)、支气管肿瘤、伯基特淋巴瘤、原发位点未知之癌症、类癌瘤、原发位点未知之癌瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤、子宫颈鳞状细胞癌、子宫颈内腺癌(cesc)癌症、儿童期癌症、胆管癌(chol)、脊索瘤、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生病、结肠(腺癌)癌症(coad)、结肠直肠癌、颅咽管瘤、皮肤t细胞淋巴瘤、内分泌胰脏胰岛细胞肿瘤、子宫内膜癌、室管膜母细胞瘤、室管膜瘤、食道癌(esca)、嗅神经母细胞瘤、尤文氏肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、胆囊癌、胃癌、胃肠类癌瘤、胃肠基质细胞肿瘤、胃肠基质肿瘤(gist)、妊娠期滋养层肿瘤、神经胶母细胞瘤多形神经胶质瘤(gbm)、毛细胞白血病、头颈癌(hnsd)、心脏癌症、霍奇金氏淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞肿瘤、卡波西肉瘤、肾脏癌症、兰格汉氏细胞组织细胞增多病、喉癌、唇癌、肝癌、淋巴细胞性赘瘤弥漫性大b细胞淋巴瘤(dlbcl)、恶性纤维组织细胞瘤骨癌、神经管胚细胞瘤、神经管上皮瘤、黑色素瘤、梅克尔细胞癌、梅克尔细胞皮肤癌、间皮瘤(meso)、原发不明的转移性鳞状颈癌、口癌、多发性内分泌赘瘤形成症候群、多发性骨髓瘤、多发性骨髓瘤/浆细胞赘瘤、蕈样真菌病、骨髓发育不良症候群、骨髓增生性赘瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金氏淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、口部癌、口腔癌、口咽癌、骨肉瘤、其他脑及脊髓肿瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤、胰脏癌、乳头状瘤症、副鼻窦癌、副甲状腺癌、骨盆癌、阴茎癌、咽癌、嗜铬细胞瘤及副神经节瘤(pcpg)、中分化松果体实质性肿瘤、松果体母细胞瘤、脑垂体肿瘤、浆细胞赘瘤/多发性骨髓瘤、胸膜肺母细胞瘤、原发中枢神经系统(cns)淋巴瘤、原发肝细胞肝癌、前列腺癌(诸如前列腺腺癌(prad))、直肠癌、肾癌、肾细胞(肾脏)癌症、肾细胞癌、呼吸道癌症、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌症、肉瘤(sarc)、塞扎莱症候群、表皮皮肤黑色素瘤(skcm)、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌、小脑幕上原始神经外胚层肿瘤、t细胞淋巴瘤、睪丸癌睪丸生殖细胞肿瘤(tgct)、咽喉癌、胸腺癌、胸腺瘤(thym)、甲状腺癌(thca)、移行细胞癌、肾盂及输尿管之移行细胞癌、滋养层肿瘤、输尿管癌、尿道癌、子宫癌、子宫癌、葡萄膜黑色素瘤(uvm)、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症或威尔姆氏肿瘤。在一些实施方案中,癌症类型包含急性淋巴母细胞白血病、急性骨髓性白血病、膀胱癌、乳癌、脑癌、子宫颈癌、胆管癌(chol)、结肠癌、结肠直肠癌、子宫内膜癌、食道癌、胃肠癌、神经胶质瘤、神经胶母细胞瘤、头颈癌、肾脏癌、肝癌、肺癌、淋巴细胞性赘瘤、黑色素瘤、骨髓赘瘤、卵巢癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、鳞状细胞癌、睪丸癌、胃癌或甲状腺癌。在一些实施方案中,癌症类型包含膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、胃癌或甲状腺癌。
55.在一些实施方案中,生物样品包含流行性肿瘤dna样品或组织样品。在一些实施方案中,生物样品为活检样品。在一些实施方案中,生物样品为无细胞生物样品。
56.一种选择适于患有癌症之个体之疗法的方法包含:(a)根据本文所述之方法鉴别个体之癌症类型;及(b)基于步骤(a)选择适用于该癌症类型的疗法。
57.一种区分有需要之个体之原发肿瘤与转移性癌症的方法,其包含:(a)用脱胺剂处理所萃取的基因组dna以产生包含脱胺基核苷酸之经处理基因组dna,其中所萃取的基因组dna系获自个体生物样品;(b)自经处理之基因组dna产生包含一或多个选自表20之生物标志物的甲基化图谱;及(c)对该甲基化图谱与对照图谱进行比较,其中甲基化图谱与对照图谱之间的相关性将区分个体之原发肿瘤与转移性癌症。
58.一种监测有需要之个体之癌症进展的方法,其包含(a)用脱胺剂处理所萃取之基因组dna以产生包含脱胺基核苷酸之经处理基因组dna,其中所萃取之基因组dna获自个体生物样品;(b)自经处理之基因组dna产生包含一或多个选自表20之生物标志物的甲基化图谱;及(c)对该甲基化图谱与第二甲基化图谱进行比较,其中第二甲基化图谱系自获自第二生物样品之经处理基因组dna产生,该第二生物样品系在获得第一生物样品之前自个体获得,且其中第一甲基化图谱与第二甲基化图谱之间的差异指示个体之癌症是否已进展。
59.在某些实施方案中,本文中所揭示亦包括包含上述探针组的试剂盒。
60.在某些实施方案中,本文中所揭示进一步包括包含上述方法的服务。具体地,本技术提供了以下内容:1.一种判定有需要之个体中癌症之存在的方法,该方法包含:a.用脱胺剂处理所萃取之基因组dna以产生包含脱胺基核苷酸的经处理之基因组dna,其中该所萃取之基因组dna获自该个体之生物样品;b.产生甲基化图谱,该甲基化图谱包含该经处理之基因组dna中之选自表20的一种或多种生物标志物;及c.将该甲基化图谱与对照进行比较,其中该甲基化图谱与该对照之间的相关性决定该个体中癌症的存在。2.如项目1所述的方法,其中该甲基化图谱进一步包含选自表15至表18的一种或多种生物标志物。3.如项目1或2所述的方法,其中该甲基化图谱进一步包含选自以下的一种或多种生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、
cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。4.如项目1所述的方法,其中该比较进一步包含产生逐对甲基化差异数据集,该逐对甲基化差异数据集包含:(i)该经处理之基因组dna之甲基化图谱与第一正常样品之甲基化图谱之间的第一差异;(ii)第二正常样品之甲基化图谱与第三正常样品之甲基化图谱之间的第二差异;及(iii)第一原发癌样品之甲基化图谱与第二原发癌样品之甲基化图谱之间的第三差异。5.如项目1或4所述的方法,其中该比较进一步包含藉由机器学习方法、利用对照数据集分析该逐对甲基化差异数据集以产生该甲基化图谱。
6.如项目1、4或5所述的方法,其中该比较进一步包含判定该个体之癌症类型。7.如项目1

6中任一项所述的方法,其中该机器学习方法利用选自以下一种或多种的算法:主分量分析、逻辑回归分析、最近相邻分析、支持向量机及神经网络模型。8.如项目1

7中任一项所述的方法,其中该产生进一步包含使该一种或多种生物标志物中之每一种与探针杂交,及执行dna测序反应以量化该一种或多种生物标志物中之每一种的甲基化。9.如项目1

8中任一项所述的方法,其中该癌症类型为实体癌症类型或血液学恶性癌症类型。10.如项目1

9中任一项所述的方法,其中该癌症类型为转移性癌症类型或复发性或难治性癌症类型。11.如项目1

10中任一项所述的方法,其中该癌症类型包含急性骨髓性白血病(laml或aml)、急性淋巴母细胞白血病(all)、肾上腺皮质癌(acc)、膀胱尿道上皮癌(blca)、脑干神经胶质瘤、脑低级神经胶质瘤(lgg)、脑肿瘤、乳癌(brca)、支气管肿瘤、伯基特淋巴瘤(burkitt lymphoma)、原发位点未知之癌症、类癌瘤、原发位点未知之癌瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤、子宫颈鳞状细胞癌、子宫颈内腺癌(cesc)癌症、儿童期癌症、胆管癌(chol)、脊索瘤、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生病、结肠(腺癌)癌症(coad)、结肠直肠癌、颅咽管瘤、皮肤t细胞淋巴瘤、内分泌胰脏胰岛细胞肿瘤、子宫内膜癌、室管膜母细胞瘤、室管膜瘤、食道癌(esca)、嗅神经母细胞瘤、尤文氏肉瘤(ewing sarcoma)、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、胆囊癌、胃癌、胃肠类癌瘤、胃肠基质细胞肿瘤、胃肠基质肿瘤(gist)、妊娠期滋养层肿瘤、神经胶母细胞瘤多形神经胶质瘤(gbm)、毛细胞白血病、头颈癌(hnsd)、心脏癌症、霍奇金氏淋巴瘤(hodgkin lymphoma)、下咽癌、眼内黑色素瘤、胰岛细胞肿瘤、卡波西肉瘤(kaposi sarcoma)、肾脏癌症、兰格汉氏细胞组织细胞增多病(langerhans cell histiocytosis)、喉癌、唇癌、肝癌、淋巴细胞性赘瘤弥漫性大b细胞淋巴瘤(dlbcl)、恶性纤维组织细胞瘤骨癌、神经管胚细胞瘤、神经管上皮瘤、黑色素瘤、梅克尔细胞癌(merkel cell carcinoma)、梅克尔细胞皮肤癌、间皮瘤(meso)、原发不明的转移性鳞状颈癌、口癌、多发性内分泌赘瘤形成症候群、多发性骨髓瘤、多发性骨髓瘤/浆细胞赘瘤、蕈样真菌病、骨髓发育不良症候群、骨髓增生性赘瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金氏淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、口部癌、口腔癌、口咽癌、骨肉瘤、其他脑及脊髓肿瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤、胰脏癌、乳头状瘤症、副鼻窦癌、副甲状腺癌、骨盆癌、阴茎癌、咽癌、嗜铬细胞瘤及副神经节瘤(pcpg)、中分化松果体实质性肿瘤、松果体母细胞瘤、脑垂体肿瘤、浆细胞赘瘤/多发性骨髓瘤、胸膜肺母细胞瘤、原发中枢神经系统(cns)淋巴瘤、原发肝细胞肝癌;前列腺癌,诸如前列腺腺癌(prad);直肠癌,诸如直肠腺癌(read);肾癌、肾细胞(肾脏)癌症、肾细胞癌、呼吸道癌症、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌症、肉瘤(sarc)、塞扎莱症候群(sezary syndrome)、表皮皮肤黑色素瘤(skcm)、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌、小脑幕上原始神经外胚层肿瘤、t细胞淋巴瘤、睪丸癌睪丸生殖细胞肿瘤(tgct)、咽喉癌、胸腺癌、胸腺瘤(thym)、甲状腺癌(thca)、移行细胞癌、肾盂及输尿管之移行细胞癌、滋养层肿瘤、输尿管癌、尿道癌、子宫癌、子宫癌、葡萄膜黑色素瘤(uvm)、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋
白血症(waldenstrom macroglobulinemia)或威尔姆氏肿瘤(wilm's tumor)。12.如项目1

11中任一项所述的方法,其中该等生物样品包含循环中之肿瘤dna样品或组织样品。13.一种为患有癌症之个体选择疗法的方法,该方法包含:(a)根据如项目1至12所述的方法鉴别该个体之癌症类型;及(b)基于步骤(a)来选择适用于该癌症类型的疗法。14.一种利用cpg癌症甲基化数据产生癌症cpg甲基化图谱数据库的计算平台,该计算平台包含:(a)第一计算装置,其包含处理器、内存模块、操作系统及计算机程序,该计算机程序包括可由该处理器执行以产生数据撷取应用程序之指令,以便产生一组生物样品的cpg甲基化数据,该数据撷取应用程序包含:(1)测序模块,其设置为可操作测序装置以产生一组生物样品的cpg甲基化数据,其中该组包含第一癌症生物样品、第二癌症生物样品、第三癌症生物样品、第一正常生物样品、第二正常生物样品及第三正常生物样品;其中该第一、第二及第三癌症生物样品为不同的;且其中该第一、第二及第三正常生物样品为不同的;及(2)数据接收模块,其设置为可接收:(i)自该第一癌症生物样品及该第一正常生物样品产生的第一对cpg甲基化数据集,其中自该第一癌症生物样品产生的cpg甲基化数据形成该第一对数据集内的第一数据集,自该第一正常生物样品产生的cpg甲基化数据形成该第一对数据集内的第二数据集,且该第一癌症生物样品及该第一正常生物样品来自同一生物样品来源;(ii)自该第二正常生物样品及该第三正常生物样品产生的第二对cpg甲基化数据集,其中自该第二正常生物样品产生的cpg甲基化数据形成该第二对数据集内之第三数据集,自该第三正常生物样品产生的cpg甲基化数据形成该第二对数据集内的第四数据集,且该第一、第二及第三正常生物样品为不同的;及(iii)自该第二癌症生物样品及该第三癌症生物样品产生的第三对cpg甲基化数据集,其中自该第二癌症生物样品产生的cpg甲基化数据形成该第三对数据集内之第五数据集,自该第三癌症生物样品产生的cpg甲基化数据形成该第三对数据集内之第六数据集,且该第一、第二及第三癌症生物样品为不同的;及(b)第二计算装置,其包含处理器、内存模块、操作系统及计算机程序,该计算机程序包括可由该处理器执行以产生数据分析应用程序之指令,以便产生癌症cpg甲基化图谱数据库,该数据分析应用程序包含数据分析模块,该数据分析模块设置为可:(1)利用该第一对、第二对及第三对数据集产生逐对甲基化差异数据集;及(2)藉由机器学习方法、利用对照数据集分析该逐对甲基化差异数据集以产生该癌症cpg甲基化图谱数据库,其中(i)该机器学习方法包含:基于最高分数鉴别复数个标志物及复数个权重,及基于该复数个标志物及该复数个权重对该等样品进行分类;及(ii)该癌症cpg甲基化图谱数据库包含一组cpg甲基化图谱且各cpg甲基化图谱代表一种癌症类型。15.如项目14所述的平台,其中产生该逐对甲基化差异数据集包含:(a)计算该第一对数据集内之该第一数据集与该第二数据集之间的差异;
(b)计算该第二对数据集内之该第三数据集与该第四数据集之间的差异;及(c)计算该第三对数据集内之该第五数据集与该第六数据集之间的差异。16.如项目14或15所述的平台,其中该机器学习方法利用选自以下一种或多种的算法:主分量分析、逻辑回归分析、最近相邻分析、支持向量机及神经网络模型。17.如项目14

16中任一项所述的平台,其中该cpg甲基化数据系自经脱胺剂处理之所萃取基因组dna产生。18.如项目14

17中任一项所述的平台,其中该序列装置经进一步设置为可藉由下一代测序方法分析该所萃取之基因组dna以产生该cpg甲基化数据。19.如项目18所述的平台,其中该下一代测序方法为数字pcr测序方法。20.如项目14

19中任一项所述的平台,其中该甲基化图谱包含至少10、20、30、40、50、100、200或超过200种选自由表15至表18组成的组中的生物标志物。21.如项目14

20中任一项所述的平台,其中该甲基化图谱包含至少10、20、30、40、50、100、200种或超过200种选自以下的生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、
cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。22.如项目14

21中任一项所述的平台,其中该甲基化图谱包含至少1、2、3、4、5、10、20、30、40、50、100种或超过100种选自表20的生物标志物。23.如项目14

22中任一项所述的平台,其中该癌症类型为实体癌症类型或血液学恶性癌症类型。24.如项目14

23中任一项所述的平台,其中该癌症类型为转移性癌症类型或复发性或难治性癌症类型。25.项目14

24中任一项所述的方法,其中该癌症类型包含急性骨髓性白血病(laml或aml)、急性淋巴母细胞白血病(all)、肾上腺皮质癌(acc)、膀胱尿道上皮癌(blca)、脑干神经胶质瘤、脑低级神经胶质瘤(lgg)、脑肿瘤、乳癌(brca)、支气管肿瘤、伯基特淋巴瘤、原发位点未知之癌症、类癌瘤、原发位点未知之癌瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤、子宫颈鳞状细胞癌、子宫颈内腺癌(cesc)癌症、儿童期癌症、胆管癌(chol)、脊索瘤、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生病、结肠(腺癌)癌症(coad)、结肠直肠癌、颅咽管瘤、皮肤t细胞淋巴瘤、内分泌胰脏胰岛细胞肿瘤、子宫内膜癌、室管膜母细胞瘤、室管膜瘤、食道癌(esca)、嗅神经母细胞瘤、尤文氏肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、胆囊癌、胃癌、胃肠类癌瘤、胃肠基质细胞肿瘤、胃肠基质肿瘤(gist)、妊娠期滋养层肿瘤、神经胶母细胞瘤多形神经胶质瘤(gbm)、毛细胞白血病、头颈癌(hnsd)、心脏癌症、霍奇金氏淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞肿瘤、卡波西肉瘤、肾脏癌症、兰格汉氏细胞组织细胞增多病、喉癌、唇癌、肝癌、淋巴细胞性赘瘤弥漫性大b细胞淋巴瘤(dlbcl)、恶性纤维组织细胞瘤骨癌、神经管胚细胞瘤、神经管上皮瘤、黑色素瘤、梅克尔细胞癌、梅克尔细胞皮肤癌、间皮瘤(meso)、原发不明的转移性鳞状颈癌、口癌、多发性内分泌赘瘤形成症候群、多发性骨髓瘤、多发性骨髓瘤/浆细胞赘瘤、蕈样真菌病、骨髓发育不良症候群、骨髓增生性赘瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金氏淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、口部癌、口腔癌、口咽癌、骨肉瘤、其他脑及脊髓肿瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤、胰脏癌、乳头状瘤症、副鼻窦癌、副甲状腺癌、骨盆癌、阴茎癌、咽癌、嗜铬细胞瘤及副神经节
瘤(pcpg)、中分化松果体实质性肿瘤、松果体母细胞瘤、脑垂体肿瘤、浆细胞赘瘤/多发性骨髓瘤、胸膜肺母细胞瘤、原发中枢神经系统(cns)淋巴瘤、原发肝细胞肝癌;前列腺癌,诸如前列腺腺癌(prad);直肠癌、肾癌、肾细胞(肾脏)癌症、肾细胞癌、呼吸道癌症、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌症、肉瘤(sarc)、塞扎莱症候群、表皮皮肤黑色素瘤(skcm)、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌、小脑幕上原始神经外胚层肿瘤、t细胞淋巴瘤、睪丸癌睪丸生殖细胞肿瘤(tgct)、咽喉癌、胸腺癌、胸腺瘤(thym)、甲状腺癌(thca)、移行细胞癌、肾盂及输尿管之移行细胞癌、滋养层肿瘤、输尿管癌、尿道癌、子宫癌、子宫癌、葡萄膜黑色素瘤(uvm)、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症或威尔姆氏肿瘤。26.如项目14

25中任一项所述的平台,其中该对照数据集包含一组甲基化图谱,其中各该甲基化图谱系自获自已知癌症类型的生物样品产生。27.如项目14

26中任一项所述的平台,其中该等生物样品包含循环中之肿瘤dna样品或组织样品。28.一种用于产生癌症cpg甲基化图谱数据库的计算机实施方法,该方法包含:a.藉由测序方法产生一组生物样品的cpg甲基化数据,其中该组包含第一癌症生物样品、第二癌症生物样品、第三癌症生物样品、第一正常生物样品、第二正常生物样品及第三正常生物样品;其中该第一、第二及第三癌症生物样品为不同的;且其中该第一、第二及第三正常生物样品为不同的;b.利用第一处理器获得自该第一癌症生物样品及该第一正常生物样品产生的第一对cpg甲基化数据集,其中自该第一癌症生物样品产生的cpg甲基化数据形成该第一对数据集内之第一数据集,自该第一正常生物样品产生的cpg甲基化数据形成该第一对数据集内之第二数据集,且该第一癌症生物样品及该第一正常生物样品来自同一生物样品来源;c.利用第一计算装置获得自该第二正常生物样品及该第三正常生物样品产生的第二对cpg甲基化数据集,其中自该第二正常生物样品产生的cpg甲基化数据形成该第二对数据集内之第三数据集,自该第三正常生物样品产生的cpg甲基化数据形成该第二对数据集内之第四数据集,且该第一、第二及第三正常生物样品为不同的;d.利用该第一计算装置获得自该第二癌症生物样品及该第三癌症生物样品产生的第三对cpg甲基化数据集,其中自该第二癌症生物样品产生的cpg甲基化数据形成该第三对数据集内之第五数据集,自该第三癌症生物样品产生的cpg甲基化数据形成该第三对数据集内之第六数据集,且该第一、第二及第三癌症生物样品为不同的;e.利用第二处理器,自该第一、第二及第三对数据集产生逐对甲基化差异数据集;及f.藉由机器学习方法、利用对照数据集分析该逐对甲基化差异数据集以产生该癌症cpg甲基化图谱数据库,其中(1)该机器学习方法包含:基于最高分数鉴别复数个标志物及复数个权重,及基于该复数个标志物及该复数个权重对该等样品进行分类;及(2)该癌症cpg甲基化图谱数据库包含一组cpg甲基化图谱且各cpg甲基化图谱代表一种癌症类型。29.如项目28之计算机实施方法,其中步骤e)进一步包含
a.计算该第一对数据集内之该第一数据集与该第二数据集之间的差异;b计算该第二对数据集内之该第三数据集与该第四数据集之间的差异;及c.计算该第三对数据集内之该第五数据集与该第六数据集之间的差异。30.如项目28或29所述的计算机实施方法,其中该机器学习方法利用选自以下一种或多种的算法:主分量分析、逻辑回归分析、最近相邻分析、支持向量机及神经网络模型。31.如项目28

30中任一项所述的计算机实施方法,其中该cpg甲基化资料系自经脱胺剂处理之所萃取基因组dna产生。32.如项目28

31中任一项所述的计算机实施方法,其中该甲基化图谱包含至少10、20、30、40、50、100、200种或超过200种选自由表15至表18组成的组中的生物标志物。33.如项目28

32中任一项所述的计算机实施方法,其中该甲基化图谱包含至少10、20、30、40、50、100、200种或超过200种选自以下的生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、
cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。34.如项目28

33中任一项所述的计算机实施方法,其中该甲基化图谱包含至少1、2、3、4、5、10、20、30、40、50、100种或超过100种选自表20的生物标志物。35.如项目28

34中任一项所述的计算机实施方法,其中该癌症类型为实体癌症类型或血液学恶性癌症类型。36.如项目28

35中任一项所述的计算机实施方法,其中该癌症类型为复发性或难治性癌症类型。37.如项目28

36中任一项所述的计算机实施方法,其中该癌症类型包含急性骨髓性白血病(laml或aml)、急性淋巴母细胞白血病(all)、肾上腺皮质癌(acc)、膀胱尿道上皮癌(blca)、脑干神经胶质瘤、脑低级神经胶质瘤(lgg)、脑肿瘤、乳癌(brca)、支气管肿瘤、伯基特淋巴瘤、原发位点未知之癌症、类癌瘤、原发位点未知之癌瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤、子宫颈鳞状细胞癌、子宫颈内腺癌(cesc)癌症、儿童期癌症、胆管癌(chol)、脊索瘤、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生病、结肠(腺癌)癌症(coad)、结肠直肠癌、颅咽管瘤、皮肤t细胞淋巴瘤、内分泌胰脏胰岛细胞肿瘤、子宫内膜癌、室管膜母细胞瘤、室管膜瘤、食道癌(esca)、嗅神经母细胞瘤、尤文氏肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、胆囊癌、胃癌、胃肠类癌瘤、胃肠基质细胞肿瘤、胃肠基质肿瘤(gist)、妊娠期滋养层肿瘤、神经胶母细胞瘤多形神经胶质瘤(gbm)、毛细胞白血病、头颈癌(hnsd)、心脏癌症、霍奇金氏淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞肿瘤、卡波西肉瘤、肾脏癌症、兰格汉氏细胞组织细胞增多病、喉癌、唇癌、肝癌、淋巴细胞性赘瘤弥漫性大b细胞淋巴瘤(dlbcl)、恶性纤维组织细胞瘤骨癌、神经管胚细胞瘤、神经管上皮瘤、黑色素瘤、梅克尔细胞癌、梅克尔细胞皮肤癌、间皮瘤(meso)、原发不明的转移性鳞状颈癌、口癌、多发性内分泌赘瘤形成症候群、多发性骨髓瘤、多发性骨髓瘤/浆细胞赘瘤、蕈样真菌病、骨髓发育不良症候群、骨髓增生性赘瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金氏淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、口部癌、口腔癌、口咽癌、骨肉瘤、其他脑及脊髓肿瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤、胰脏癌、乳头状瘤症、副鼻窦癌、副甲状腺癌、骨盆癌、阴茎癌、咽癌、嗜铬细胞瘤及副神经节瘤(pcpg)、中分化松果体实质性肿瘤、松果体母细胞瘤、脑垂体肿瘤、浆细胞赘瘤/多发性骨髓瘤、胸膜肺母细胞瘤、原发中枢神经系统(cns)淋巴瘤、原发肝细胞肝
癌;前列腺癌,诸如前列腺腺癌(prad);直肠癌、肾癌、肾细胞(肾脏)癌症、肾细胞癌、呼吸道癌症、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌症、肉瘤(sarc)、塞扎莱症候群、表皮皮肤黑色素瘤(skcm)、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌、小脑幕上原始神经外胚层肿瘤、t细胞淋巴瘤、睪丸癌睪丸生殖细胞肿瘤(tgct)、咽喉癌、胸腺癌、胸腺瘤(thym)、甲状腺癌(thca)、移行细胞癌、肾盂及输尿管之移行细胞癌、滋养层肿瘤、输尿管癌、尿道癌、子宫癌、子宫癌、葡萄膜黑色素瘤(uvm)、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症或威尔姆氏肿瘤。38.如项目28

37中任一项所述的计算机实施方法,其中该等生物样品包含循环中之肿瘤dna样品或组织样品。39.一种包含复数个探针的探针组,各探针为式i之探针:其中:a为第一标靶结合区;b为第二标靶结合区;及l为连接体区;其中a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少30个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性;b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少12个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性;l连接至a;且b连接至a或l。40.如项目39所述的探针组,其中l连接至a且b连接至l。41.如项目39或40所述的探针组,其中该复数个探针包含至少10、20、30、50、100个或超过100个探针。42.如项目39

41中任一项所述的探针组,其中该复数个探针用于基于溶液之下一代测序反应中以产生cpg甲基化数据。43.如项目42所述的探针组,其中该基于溶液之下一代测序反应为液滴数字pcr测序方法。44.如项目39

43中任一项所述的探针组,其中l的长度在10与60个核苷酸之间、15与55个核苷酸之间、20与50个核苷酸之间、25与45个核苷酸之间,及30与40个核苷酸之间。45.如项目39

44中任一项所述的探针组,其中l进一步包含用于鉴别各探针的接附子区域。46.一种上面储存有指令的非暂时性计算机可读介质,其在由处理器执行时,执行包含以下之步骤:a.藉由测序方法产生一组生物样品的cpg甲基化数据,其中该组包含第一癌症生物样品、第二癌症生物样品、第三癌症生物样品、第一正常生物样品、第二正常生物样品及第三正常生物样品;其中该第一、第二及第三癌症生物样品为不同的;且其中该第一、第二
及第三正常生物样品为不同的;b.利用第一处理器获得自该第一癌症生物样品及该第一正常生物样品产生的第一对cpg甲基化数据集,其中自该第一癌症生物样品产生的cpg甲基化数据形成该第一对数据集内之第一数据集,自该第一正常生物样品产生的cpg甲基化数据形成该第一对数据集内之第二数据集,且该第一癌症生物样品及该第一正常生物样品来自同一生物样品来源;c.利用第一计算装置获得自该第二正常生物样品及该第三正常生物样品产生的第二对cpg甲基化数据集,其中自该第二正常生物样品产生的cpg甲基化数据形成该第二对数据集内之第三数据集,自该第三正常生物样品产生的cpg甲基化数据形成该第二对数据集内之第四数据集,且该第一、第二及第三正常生物样品为不同的;d.利用该第一计算装置获得自该第二癌症生物样品及该第三癌症生物样品产生的第三对cpg甲基化数据集,其中自该第二癌症生物样品产生的cpg甲基化数据形成该第三对数据集内之第五数据集,自该第三癌症生物样品产生的cpg甲基化数据形成该第三对数据集内之第六数据集,且该第一、第二及第三癌症生物样品为不同的;e.利用第二处理器,自该第一、第二及第三对数据集产生逐对甲基化差异数据集;及f.藉由机器学习方法、利用对照数据集分析该逐对甲基化差异数据集以产生该癌症cpg甲基化图谱数据库,其中(1)该机器学习方法包含:基于最高分数鉴别复数个标志物及复数个权重,及基于该复数个标志物及该复数个权重对该等样品进行分类;及(2)该癌症cpg甲基化图谱数据库包含一组cpg甲基化图谱且各cpg甲基化图谱代表一种癌症类型。47.如项目46所述的非暂时性计算机可读介质,其中步骤e)进一步包含a.计算该第一对数据集内之该第一数据集与该第二数据集之间的差异;b.计算该第二对数据集内之该第三数据集与该第四数据集之间的差异;及c.计算该第三对数据集内之该第五数据集与该第六数据集之间的差异。48.如项目46或47所述的非暂时性计算机可读介质,其中步骤e)进一步包含使用该第二处理器、利用该第一对数据集之该所计算差异、该第二对数据集之该所计算差异及该第三对数据集之该所计算差异产生该逐对甲基化差异数据集。49.如项目46

48中任一项所述的非暂时性计算机可读介质,其中该cpg甲基化数据系自经脱胺剂处理之所萃取基因组dna产生。50.如项目46

49中任一项所述的非暂时性计算机可读介质,其中该甲基化图谱包含至少10、20、30、40、50、100、200种或超过200种选自由表15至表18组成的组中的生物标志物。51.如项目46

50中任一项所述的非暂时性计算机可读介质,其中该甲基化图谱包含至少10、20、30、40、50、100、200种或超过200种选自以下的生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、
cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。52.如项目46

51中任一项所述的非暂时性计算机可读介质,其中该甲基化图谱包含至少1、2、3、4、5、10、20、30、40、50、100种或超过100种选自表20的生物标志物。53.如项目46

52中任一项所述的非暂时性计算机可读介质,其中该癌症类型为实
体癌症类型或血液学恶性癌症类型。54.如项目46

53中任一项所述的非暂时性计算机可读介质,其中该癌症类型为复发性或难治性癌症类型。55.如项目46

54中任一项所述的非暂时性计算机可读介质,其中该癌症类型包含急性骨髓性白血病(laml或aml)、急性淋巴母细胞白血病(all)、肾上腺皮质癌(acc)、膀胱尿道上皮癌(blca)、脑干神经胶质瘤、脑低级神经胶质瘤(lgg)、脑肿瘤、乳癌(brca)、支气管肿瘤、伯基特淋巴瘤、原发位点未知之癌症、类癌瘤、原发位点未知之癌瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤、子宫颈鳞状细胞癌、子宫颈内腺癌(cesc)癌症、儿童期癌症、胆管癌(chol)、脊索瘤、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生病、结肠(腺癌)癌症(coad)、结肠直肠癌、颅咽管瘤、皮肤t细胞淋巴瘤、内分泌胰脏胰岛细胞肿瘤、子宫内膜癌、室管膜母细胞瘤、室管膜瘤、食道癌(esca)、嗅神经母细胞瘤、尤文氏肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、胆囊癌、胃癌、胃肠类癌瘤、胃肠基质细胞肿瘤、胃肠基质肿瘤(gist)、妊娠期滋养层肿瘤、神经胶母细胞瘤多形神经胶质瘤(gbm)、毛细胞白血病、头颈癌(hnsd)、心脏癌症、霍奇金氏淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞肿瘤、卡波西肉瘤、肾脏癌症、兰格汉氏细胞组织细胞增多病、喉癌、唇癌、肝癌、淋巴细胞性赘瘤弥漫性大b细胞淋巴瘤(dlbcl)、恶性纤维组织细胞瘤骨癌、神经管胚细胞瘤、神经管上皮瘤、黑色素瘤、梅克尔细胞癌、梅克尔细胞皮肤癌、间皮瘤(meso)、原发不明的转移性鳞状颈癌、口癌、多发性内分泌赘瘤形成症候群、多发性骨髓瘤、多发性骨髓瘤/浆细胞赘瘤、蕈样真菌病、骨髓发育不良症候群、骨髓增生性赘瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金氏淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、口部癌、口腔癌、口咽癌、骨肉瘤、其他脑及脊髓肿瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤、胰脏癌、乳头状瘤症、副鼻窦癌、副甲状腺癌、骨盆癌、阴茎癌、咽癌、嗜铬细胞瘤及副神经节瘤(pcpg)、中分化松果体实质性肿瘤、松果体母细胞瘤、脑垂体肿瘤、浆细胞赘瘤/多发性骨髓瘤、胸膜肺母细胞瘤、原发中枢神经系统(cns)淋巴瘤、原发肝细胞肝癌;前列腺癌,诸如前列腺腺癌(prad);直肠癌、肾癌、肾细胞(肾脏)癌症、肾细胞癌、呼吸道癌症、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌症、肉瘤(sarc)、塞扎莱症候群、表皮皮肤黑色素瘤(skcm)、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌、小脑幕上原始神经外胚层肿瘤、t细胞淋巴瘤、睪丸癌睪丸生殖细胞肿瘤(tgct)、咽喉癌、胸腺癌、胸腺瘤(thym)、甲状腺癌(thca)、移行细胞癌、肾盂及输尿管之移行细胞癌、滋养层肿瘤、输尿管癌、尿道癌、子宫癌、子宫癌、葡萄膜黑色素瘤(uvm)、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症或威尔姆氏肿瘤。56.如项目46

55中任一项所述的非暂时性计算机可读介质,其中该等生物样品包含循环中之肿瘤dna样品或组织样品。援引加入
61.本说明书中所提及之所有公开案、专利及专利申请均以引用的方式并入本文中,其引用的程度如同各个别公开案、专利或专利申请经具体且个别地指示以引用的方式并入一般。
附图说明
62.本发明之新颖特征详细阐明于随附权利要求书中。结合附图,参考其中记载利用本发明原理之说明性实施方案的以下详细说明,将更好地了解本发明之特征及优点:
63.图1a及图1b说明本文中所揭示之方法、平台及系统的概要。
64.图2说明本文中所揭示之计算机系统之图示。
65.图3说明来自尿液之无细胞dna产量。尿液中之无细胞dna为每1ml尿液1

30ng不等,其为血浆中所观测到之浓度的约1/5。该范围因不同个体之样品而异且亦视其他因素而定,例如性别、某些疾病病况。
66.图4说明尿液稳定性缓冲液(usb)对尿液之无细胞dna产量的影响。尿液样品在与usb缓冲液或另一种商业条带缓冲液混合之后,在室温下保持14天。14天之后,无缓冲液样品中释放基因组dna使得dna产量高得多。但usb或条带缓冲液有碍于细胞dna释放。
67.图5说明使用不同操作浓度之usb所得的dna产量。相较于使用商业条带缓冲液或不使用缓冲液,使用不同比率之尿液稳定性缓冲液所得的尿液dna产量说明usb缓冲液在相对于尿液1:10至1:50稀释的情况下起作用。
68.图6说明血浆中之胚胎dna之侦测信号相较于尿液的变化倍数。以4ml初始血浆及尿液样品开始,根据男性特有的sry基因、藉由q

rt pcr侦测到无细胞dna中出现男性胚胎dna的信号。在体积相同的情况下,血浆中的信号比尿液中的信号强约2

8倍。
69.图7说明一位肺癌患者在不同时间点之尿液及肺液中之无细胞dna的产量。肺液中的平均无细胞dna为约130ng/ml且尿液中的平均无细胞dna为约20ng/ml。
70.图8说明与不同癌症类型之甲基化图谱相关的无监督层级聚类及热图。
71.图9a至图9c说明利用与不同癌症类型之参考甲基化图谱相关之无监督层级聚类及热图而用于区分相同组织类型内之不同癌症类型的甲基化图谱。如图9a所说明的热图获自511lgg、138gbm及150个正常脑组织样品(基于1409个标志物)。如图9b所说明的热图获自311luad、359lusc及74个正常肺组织样品(基于926个标志物)。如图9c所说明的热图获自321kirc、226kirp及205个正常肾脏组织样品(基于716个标志物)。
72.图10a至图10b说明例示甲基化标志物的图,该等甲基化标志物用于预测患有不同类型癌症(包括:lgg、kirp、kirc、lusc及luad)之患者的总体存活期且根据肿瘤状态及肿瘤阶段分层。
73.图11a至图11d说明基于甲基化的存活期分类与驱动基因突变状态相关。图11a说明与lgg之甲基化图谱和驱动基因突变相关的无监督层级聚类及热图。图11b根据pca值与idh突变之组合显示lgg患者的5年存活率曲线。图11c说明与lihc之甲基化图谱及频繁突变型基因相关的无监督层级聚类及热图。图11d说明与kirc之甲基化图谱及频繁突变型基因相关的无监督层级聚类及热图。
74.图12说明热图,该热图对乳癌或肝癌之高甲基化基因相较于所匹配正常组织的差异性表达进行了比较。
75.图13a至图13c说明以来自tcga之rna

seq资料作为发现群,以计算乳癌或肝癌之高甲基化基因相较于所匹配正常组织的差异性表达。
76.图14显示的图说明甲基化型态与基因表达图谱及癌症行为相关。乳癌及肝癌之差异甲基化基因的mrna表达系使用qpcr测定。肿瘤样品中的mrna表达相对于来源于同一患者
之邻近正常组织中的表达归一化。结果系以多个样品(n=3

7)之表达的平均变化百分比显示,其中每个样品进行3次技术复制。将所有样品合并在一起,使用威尔科克森符号秩检验(wilcoxon sign

rank test)进行统计学分析,以确定基因表达是否如所预测因甲基化而发生逆变化;所合并样品的p值经测定为1.21x10

21

77.图15a至图15j说明经工程改造之基因抑制乳癌细胞株生长的作用。将经工程改造之基因转导至乳癌细胞株中。图15a及图15f说明相应的cpg甲基化位点。图15b及图15g显示将经工程改造之基因转导至裸小鼠中或将对照细胞植入裸小鼠中之后经切除且经量测之肿瘤。图15d及图15i显示此等肿瘤随时间之量化生长。图15c、图15e、图15h及图15j显示经工程改造之基因所转导之细胞相对于对照细胞的活体外群落形成。
78.图16说明与结肠癌相关的dna甲基化标志物。无监督层级聚类及热图与435个tcga样本(结肠癌:390个;正常结肠:45个)之甲基化图谱相关,该甲基化图谱使用一组311个cpg标志物。每一行代表一个个别患者且每一列代表一个个别cpg标志物。
79.图17说明与结肠癌、肺癌及肝癌相关的dna甲基化标志物。无监督层级聚类及热图与1108个tcga样本(结肠癌:390个;正常结肠:45个;肝癌:238个;正常肝脏:50个;肺癌:311个;正常肺:74个)的甲基化图谱相关,该甲基化图谱基于2793个cpg标志物。每一行代表一个个别患者且每一列代表一个个别cpg标志物。
80.图18说明与中国人群之原发及转移性结肠癌、肝癌及肺癌相关的dna甲基化标志物。无监督层级聚类及热图与567个原发肿瘤样本之基于104个标志物的甲基化图谱相关。
81.图19a至图19e说明用于以卡普兰

迈耶曲线(kaplan

meier curve)预测结肠腺癌(coad)患者之总体存活率的甲基化标志物。图19a显示根据甲基化图谱分层的5年存活率。pca值>0之群组(n=127)的存活机率(81.2%)相较于pca值<0之群组(n=145)的存活机率(42%)得以改善(p=0.007)。图19b显示根据甲基化图谱分析所分层之i

ii期患者的5年存活率,pca值>0之群组(n=73)的存活机率(100%)相较于pca值<0之群组(n=77)的存活机率(51.3%)得以改善(p=0.007)。图19c显示根据甲基化图谱分析所分层之iii

iv期患者的5年存活率,pca值>0之群组(n=49)的存活机率(81.1%)相较于pca值<0之群组(n=66)的存活机率(42%)得以改善(p=0.01)。图19d显示根据甲基化图谱分析所分层之ii期患者的5年存活率,pca值>0之群组(n=51)的存活机率(100%)相较于pca值<0之群组(n=58)的存活机率(53.4%)得以改善(p=0.029)。图19e显示根据甲基化图谱分析所分层之iii期患者的5年存活率,pca值>0之群组(n=34)的存活机率(94.1%)相较于pca值<0之群组(n=46)的存活机率(57.2%)得以改善(p=0.021)。
82.图20a至图20f说明基于甲基化的存活期分类与驱动基因突变状态相关。图20a根据pca值说明coad患者的5年存活率曲线。图20b根据基因突变显示coad患者的5年存活率曲线。图20c根据pca值与基因突变之组合说明coad患者的5年存活率曲线。图20d显示与coad之甲基化图谱及频繁突变型基因相关的无监督层级聚类及热图。图20e说明与总体存活率显著相关之基因的p值。图20f说明突变状态与患者存活率之间的关系(p值藉由对数秩检验来估算)。
83.图21说明患者群特征。
84.图22说明使用qpcr所测定之差异甲基化基因在结肠癌中的mrna表达。肿瘤样品中的mrna表达相对于来源于同一患者之邻近正常组织中的表达归一化。结果系以多个样品(n
=3

7)之表达的平均变化百分比显示,其中每个样品进行3次技术复制。将所有样品合并在一起,使用威尔科克森符号秩检验进行统计学分析,以确定基因表达是否如所预测因甲基化而发生逆变化;所合并样品的p值经测定为1.21x10

21

85.图23a至图23e说明pcdh17抑制结肠癌细胞株生长的作用。将pcdh17转导至hct116细胞中。图23a说明cpg甲基化图谱。图23b显示将经工程改造之基因所转导之细胞或对照细胞植入裸小鼠之后经切除且经量测的肿瘤。图23c显示此等肿瘤随时间之量化生长。图23d及图23e显示经工程改造之基因所转导之细胞相对于对照细胞的活体外群落形成。
86.图24说明与aml之甲基化图谱相关的无监督层级聚类及热图(相对于正常血液)。
87.图25说明复制群之与aml之甲基化图谱相关的无监督层级聚类及热图(相对于正常血液样品)。
88.图26说明与all之甲基化图谱(根据所示色标)相关的无监督层级聚类及热图(相对于正常血液样品)。
89.图27说明甲基化图谱可区分白血病亚型。层级聚类及热图与all、aml癌症类型相关。
90.图28a至图28b说明甲基化标志物图谱。图28a显示可预测aml患者之五年总体存活率的甲基化标志物且图28b显示可预测all患者之五年总体存活率的甲基化标志物。
91.图29说明结肠癌组织与正常结肠组织样品(远位点)中之四个例示性cpg位点(cg06747543、cg15536663、cg22129276及cg07418387)的甲基化比率。
92.图30说明转移性结肠癌组织样品、原发结肠癌参考样品及正常淋巴细胞基因组dna参考样品中之五个例示性cpg位点的甲基化比率。
93.图31a至图31c显示来源于结肠癌之无细胞dna(cfdna)样品中的甲基化标志物。图31a显示基因组cfdna之甲基化区域且图31b说明基因组cfdna之非甲基化区域。图31c说明来自三位患者(2043089、2042981及2004651)、正常cfdna参考样品、原发结肠组织参考样品及正常血液参考样品之cpg位点cg10673833的甲基化比率。患者2043089及2042981患有原发结肠癌,且患者2004651患有转移性结肠癌。
94.图32a至图32c显示原发肝癌、乳癌及肺癌的甲基化图谱。图32a显示肝癌cfdna样品、正常cfdna样品、原发肝癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)中之cpg位点cg00401797的甲基化比率。图32b显示乳癌cfdna样品、正常cfdna样品、原发乳癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)中之cpg位点cg07519236的甲基化比率。图32c显示肺癌cfdna样品、正常cfdna样品、原发肺癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)中之cpg位点cg02877575的甲基化比率。
95.图33a至图33b显示区分原发结肠癌与正常样品的两种不同探针。图33a显示靶向cpg位点cg10673833的探针cob

2及三位结肠癌患者之cfdna样品、正常cfdna样品、原发结肠癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)的甲基化图谱。三位患者中有两位(2043089及2042981)患有原发结肠癌。其余患者(2004651)患有转移性结肠癌。图33b显示靶向cpg位点cg07974511的探针brb

2及两位原发结肠癌患者(2043089及2042981)之cfdna样品、正常cfdna样品、原发结肠癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)的甲基化图谱。
96.图34a至图34d显示对乳癌患者之cfdna的分析。使用四种探针:brb

3(图34a)、brb

4(图34b)、brb

8(图34c)及brb

13(图34d)。对原发乳癌cfdna的甲基化比率与正常cfdna样品、原发乳癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)进行比较。
97.图35a至图35b显示利用两种探针cob_3及brb_13侦测49位患者之组织样品中的转移性结肠癌。
98.图36说明本文所述之利用pca及ica过滤的分析方法。
99.图37显示训练群的临床病理学特征。
100.图38显示验证群1之临床病理学特征。
101.图39显示验证群2之临床病理学特征。
102.图40显示脑癌、肾癌及肺癌亚型之临床病理学特征。
103.图41显示与中国人群中之原发乳癌、乳癌肝脏转移、正常乳房、肝癌及正常肝脏组织相关的dna甲基化标志物。无监督层级聚类及热图与126个肿瘤及75个正常样本之基于128个标志物的甲基化图谱相关。色彩条指示相对甲基化。
104.图42a至图42b说明基于甲基化的存活期分类与驱动基因突变状态相关。图42a根据pca值与基因突变状态之组合说明lihc患者的5年存活率曲线。图42b根据pca值与基因突变状态之组合说明kirc患者的5年存活率曲线。
105.图43a至图43b说明各种所选差异甲基化cpg标志物与brca(图43a)及lihc(图43b)中之基因表达的关系。分散图上的每个点代表针对相应基因之表达所绘制之指定cpg标志物的甲基化程度。图中第一列显示癌症中之与降低之基因表达相关的高甲基化cpg位点;图中第二列显示癌症中之似乎不影响基因表达的高甲基化cpg位点;且图中第三列显示癌症中之相关高甲基化cpg位点。分散图上的每个点代表针对相应基因之表达所绘制之指定cpg标志物的甲基化程度。图中第一列显示癌症中之与降低之基因表达相关的高甲基化cpg位点;图中第二列显示癌症中之不影响基因表达之高甲基化cpg位点;且图中第三列显示癌症中之相关高甲基化cpg位点。
106.图44a至图44b显示tcga及中国患者群的临床病理学特征。
107.图45显示差异甲基化标志物与基因表达的关系。分散图上的每个点展现针对相应基因之表达所绘制之指定cg标志物的甲基化程度。第一行图显示与降低之基因表达相关的高甲基化;第二行图显示甲基化程度与基因表达量不相关;第三行图显示甲基化程度与基因表达量不具有任何关系。
108.图46说明使用两种不同的结肠癌探针(cob

2及cob

9)所测得之两种说明性cpg位点(cpg位点1及cpg位点2)之甲基化图谱的变化。
109.图47说明根据结肠癌探针cob

2及cob

9所得之手术后四位患者样品(患者2045021、2044629、2044645及2045021)中之甲基化图谱变化。
110.图48说明根据结肠癌探针cob

2及cob

9所得之不同癌症阶段样品中之甲基化图谱变化。
111.图49a至图49j说明19种不同癌症类型及正常血液样品中之十个说明性cpg位点的甲基化图谱变化。癌症类型包括膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉
瘤、皮肤癌、胃癌或甲状腺癌。
112.图50a至图50n说明乳癌、结肠癌、肝癌、肺癌及正常血液样品中之约280个cpg位点(生物标志物)的甲基化图谱变化。
具体实施方式
113.癌症的特征为一或多个基因突变或修饰引起的细胞生长异常,其导致细胞增殖与细胞死亡之平衡失调。dna甲基化使肿瘤抑制基因的表达静默,且本身以最先的赘生性变化之一呈现。赘生性组织及血浆中所发现的甲基化型态展现均质性,且在一些情况下用作灵敏诊断标志物。举例而言,cmethdna分析在一项研究中已显示当用于诊断转移性乳癌时具有约91%灵敏性及约96%特异性。在另一项研究中,当其用于鉴别一大群转移性结肠癌患者中之kras基因突变时,流行性肿瘤dna(ctdna)具有约87.2%灵敏性及约99.2%特异性(bettegowda等人,detection of circulating tumor dna in early

and late

stage human malignancies.sci.transl.med,6(224):ra24.2014)。相同研究进一步证明,在患有晚期胰脏癌、卵巢癌、结肠直肠癌、膀胱癌、胃食道癌、乳癌、黑色素瘤、肝细胞癌及头颈癌的>75%患者中可侦测到ctdna(bettegowda等人)。
114.其他研究已证明cpg甲基化型态与赘生性进展相关。举例而言,在对乳癌甲基化型态的一项研究中,已发现p16高甲基化与早期乳癌相关,而timp3启动子高甲基化已与晚期乳癌相关。另外,bmp6、cst6及timp3启动子高甲基化已显示与乳癌转移至淋巴结中有关。
115.在一些实施方案中,就癌症侦测而言,dna甲基化图谱分析提供的临床灵敏性及动态范围高于体细胞突变分析。在其他情况下,改变的dna甲基化标志物已显示与特定癌症之治疗反应的预后相关。举例而言,一项研究说明,在一组晚期直肠癌患者中,利用十个差异甲基化区域预测患者预后。同样,血清中的rassf1a dna甲基化量测结果用于预测在不同研究中经历乳癌患者之佐剂疗法的患者中的不良结果。另外,srbc基因高甲基化与不同研究中用奥沙利铂(oxaliplatin)治疗之结肠直肠癌患者中的不良结果相关。另一项研究已证明esr1基因甲基化与接受他莫昔芬(tamoxifen)之乳癌患者中的临床反应相关。另外,arhi基因启动子高甲基化显示为未用他莫昔芬治疗之乳癌患者之长期存活的预测因子。
116.在一些情况下,根据特定癌症类型定制dna甲基化图谱分析。在一些情况下,dna甲基化图谱分析在泛癌症背景下无法区分不同癌症类型。在其他情形中,在样品浓度较低的情况下(例如在ng浓度的情况下),dna甲基化图谱分析缺乏再现性且灵敏性低于样品浓度较高的情况。
117.本文中揭示用于判定个体之癌症类型的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒。在一些实施方案中,本文所述亦包括癌症早期侦测用的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒。在其他实施方案中,本文所述包括供非侵入性侦测癌症用的方法、系统、非暂时性计算机可读介质、服务及试剂盒。在另外的其他实施方案中,本文所述包括用于区分不同癌症阶段的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒。在其他实施方案中,本文所述包括用于判定有需要之个体之癌症预后、预测治疗反应及治疗反应监测的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒。在其他实施方案中,本文所述包括用于产生cpg甲基化图谱数据库的方法、系统、平台、非暂时性计算机可读介质、服务及试剂盒,以及用于产生cpg甲基化数据的探针。
判定患者之癌症状态
118.dna甲基化为甲基在核苷酸碱基胞嘧啶之c5位置及腺嘌呤之n6位置连接。腺嘌呤的甲基化主要发生于原核生物中,而胞嘧啶的甲基化发生于原核生物与真核生物中。在一些情况下,胞嘧啶甲基化发生于cpg二核苷酸基元。在其他情况下,胞嘧啶甲基化发生于例如chg及chh基元中,其中h为腺嘌呤、胞嘧啶或胸腺嘧啶。在一些情况下,一或多个cpg二核苷酸基元或cpg位点形成cpg岛(富含cpg二核苷酸的短dna序列)。在一些情况下,cpg岛存在于所有人类基因之约一半的5'区域中。cpg岛的长度典型地,但未必总是为约0.2至约1kb。胞嘧啶甲基化进一步包含5

甲基胞嘧啶(5

mcyt)及5

羟甲基胞嘧啶。
119.cpg(胞嘧啶

磷酸盐

鸟嘌呤)或cg基元系指dna分子中的区域,其中胞嘧啶核苷酸紧邻着鸟嘌呤核苷酸以线性链存在。在一些情况下,cpg二核苷酸中的胞嘧啶发生甲基化而形成5

甲基胞嘧啶。在一些情况下,cpg二核苷酸中的胞嘧啶发生甲基化而形成5

羟甲基胞嘧啶。cpg甲基化图谱数据库
120.在一些实施方案中,产生复数个cpg甲基化数据且整合成cpg甲基化图谱数据库。在一些情况下,cpg甲基化图谱数据库用作本文所述之方法、系统、非暂时性计算机可读介质、服务或试剂盒的参考数据库。在一些情况下,cpg甲基化图谱数据库含有cpg甲基化图谱之文库,其中各cpg甲基化图谱与癌症类型(例如乳癌、结肠直肠癌、脑癌及其类似癌症)相关。在一些情况下,各该cpg甲基化图谱进一步与癌症亚型(例如三阴性乳癌、结肠直肠腺癌、星形细胞瘤及其类似癌症亚型)相关。
121.在一些实施方案中,产生cpg甲基化图谱数据库,如图1a所说明。在一些情况下,自生物样品中分离出基因组dna(例如核dna或循环dna),接着用脱胺剂处理以产生所萃取之基因组dna(101)。在一些情况下,所萃取之基因组dna(例如所萃取之核dna或所萃取之循环dna)视情况经一种或多种限制酶处理以产生一组dna片段,随后提交用于测序分析以产生cpg甲基化数据(102)。接着将cpg甲基化数据输入机器学习/分类程序(103)以产生cpg甲基化图谱数据库(105)。
122.在一些情况下,产生一组生物样品且随后输入机器学习/分类程序(103)。在一些情况下,该组生物样品包含2、3、4、5、6、7、8、9、10、20、30或超过30个生物样品。在一些情况下,该组生物样品包含2、3、4、5、6、7、8、9、10、20、30或超过30个正常生物样品。在一些情况下,该组生物样品包含2、3、4、5、6、7、8、9、10、20、30或超过30个癌症生物样品。在一些情况下,该组生物样品包含第一癌症生物样品、第二癌症生物样品、第三癌症生物样品、第一正常生物样品、第二正常生物样品及第三正常生物样品;其中该第一、第二及第三癌症生物样品为不同的;且其中该第一、第二及第三正常生物样品为不同的。在一些情况下,产生三对数据集,其中三对数据集包含自第一癌症生物样品及第一正常生物样品产生的第一对cpg甲基化数据集,其中自第一癌症生物样品产生的cpg甲基化数据形成第一对数据集内之第一数据集,自第一正常生物样品产生的cpg甲基化数据形成第一对数据集内之第二数据集,且第一癌症生物样品与第一正常生物样品来自相同生物样品来源;自第二正常生物样品及第三正常生物样品产生的第二对cpg甲基化数据集,其中自第二正常生物样品产生的cpg甲基化数据形成第二对数据集内之第三数据集,自第三正常生物样品产生的cpg甲基化数据形成第二对数据集内之第四数据集,且第一、第二及第三正常生物样品为不同的;及自第二
癌症生物样品及第三癌症生物样品产生的第三对cpg甲基化数据集,其中自第二癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第五数据集,自第三癌症生物样品产生的cpg甲基化数据形成第三对数据集内之第六数据集,且第一、第二及第三癌症生物样品为不同的。在一些情况下,计算该每一对数据集内之差异,接着将该等差异输入机器学习/分类程序(103)。在一些情况下,自第一、第二及第三对数据集产生逐对甲基化差异数据集,接着藉由机器学习/分类方法(103)、在对照数据集或训练数据集(104)存在下分析以产生癌症cpg甲基化图谱数据库(105)。在一些情况下,机器学习方法包含基于最高分数(例如t检验值、β检验值)鉴别复数个标志物及复数个权重,及基于该复数个标志物及复数个权重对样品进行分类。在一些情况下,癌症cpg甲基化图谱数据库(105)包含一组cpg甲基化图谱且每种cpg甲基化图谱代表一种癌症类型。
123.在一些实施方案中,第一生物标志物组用于侦测癌症之存在。在一些情况下,至少另一生物标志物组(例如至少2、3、4、5、6或超过6个生物标志物组)用于判定癌症类型。在一些情况下,至少另一生物标志物组(例如至少2、3、4、5、6或超过6个生物标志物组)用于视情况判定癌症阶段,区分原发癌与转移性癌症亚型,监测癌症进展,判定癌症预后,或监测治疗方案。
124.在一些实施方案中,cpg甲基化图谱数据库用作诊断癌症类型的参考数据库。在一些情况下,cpg甲基化图谱数据库用作诊断癌症之参考数据库的用途如图1b中所说明。在一些情况下,自生物样品中分离出基因组dna(例如核dna或循环dna),接着用脱胺剂处理以产生所萃取之基因组dna(111)。在一些情况下,所萃取之基因组dna(例如所萃取之核dna或所萃取之循环dna)视情况经一种或多种限制酶处理以产生一组dna片段,随后提交用于测序分析以产生cpg甲基化数据。进一步分析cpg甲基化资料且汇编成所关注的cpg甲基化图谱(112)。所关注的cpg甲基化图谱视情况输入机器学习/分类程序(114),接着与cpg甲基化图谱数据库内之cpg甲基化图谱进行比较(115)。cpg甲基化图谱数据库内之cpg甲基化图谱与所关注cpg甲基化图谱之间的匹配指明癌症类型。
125.在一些情况下,cpg甲基化图谱数据库进一步用作判定原发癌与转移性癌症亚型或用于监测癌症进展的参考数据库。
126.在一些实施方案中,自活检样品之cpg甲基化数据产生cpg甲基化图谱数据库。在一些情况下,自组织样品之cpg甲基化数据产生cpg甲基化图谱数据库。在一些情况下,利用来自无细胞生物样品之cpg甲基化数据产生cpg甲基化图谱数据库。在一些情况下,利用来自流行肿瘤dna(ctdna)样品的cpg甲基化数据产生cpg甲基化图谱数据库。生物标志物
127.在一些实施方案中,相较于正常组织,本文所述之生物标志物(或标志物)在癌症中发生的甲基化不同。在一些实施方案中,生物标志物指示或代表甲基化标志物,诸如cpg甲基化位点、甲基化状态、甲基化指数或甲基化图谱。在一些情况下,一组生物标志物说明产生诸如甲基化图谱(一或多个基因之甲基化)及其类似物的甲基化标志物集合。在一些情况下,生物标志物系个别地或共同地用作诊断工具,或组合使用或转换为生物标志物组形式使用。在一些实施方案中,评估一或多个基因内之生物标志物,在一些情况下进一步与一或多个基因之甲基化图谱(诸如参考甲基化图谱)进行比较,从而表征癌症状态。
128.在一些实施方案中,本文中描述基于一种或多种生物标志物之甲基化图谱或甲基
化标志物判定癌症类型的方法、系统、平台及非暂时性计算机可读介质。在一些实施方案中,一种或多种生物标志物用于癌症之早期侦测。在其他实施方案中,一种或多种生物标志物用于癌症之非侵入性侦测。在另外的其他实施方案中,一种或多种生物标志物用于区分不同癌症阶段。在其他实施方案中,一种或多种生物标志物用于判定癌症之预后、治疗反应之预测及/或监测治疗反应。
129.在一些实施方案中,本文中亦描述用于产生cpg甲基化图谱数据库的方法、系统、平台及非暂时性计算机可读介质。在一些实施方案中,一种或多种生物标志物用于产生cpg甲基化图谱数据库。
130.在一些实施方案中,本文所述之生物标志物包括表15中所示的生物标志物。在一些实施方案中,本文所述之生物标志物包括表15、16、17及/或18中所揭示之生物标志物。在一些实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用表15、16、17及/或18中之一种或多种生物标志物判定癌症类型。在一些实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用表15、16、17及/或18中之一种或多种生物标志物进行癌症之早期侦测。在其他实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用表15、16、17及/或18中之一种或多种生物标志物进行癌症之非侵入性侦测。在另外的其他实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用表15、16、17及/或18中之一种或多种生物标志物区分癌症之不同阶段。在其他实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用表15、16、17及/或18中之一种或多种生物标志物判定癌症之预后、预测治疗反应及/或监测治疗反应。在一些实施方案中,癌症类型包含急性淋巴母细胞白血病、急性骨髓性白血病、膀胱癌、乳癌、脑癌、子宫颈癌、胆管癌(chol)、结肠癌、结肠直肠癌、子宫内膜癌、食道癌、胃肠癌、神经胶质瘤、神经胶母细胞瘤、头颈癌、肾脏癌、肝癌、肺癌、淋巴细胞性赘瘤、黑色素瘤、骨髓赘瘤、卵巢癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、鳞状细胞癌、睪丸癌、胃癌或甲状腺癌。在一些实施方案中,癌症类型包含膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、胃癌或甲状腺癌。
131.在一些实施方案中,本文所述之生物标志物包括:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、
cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231或cg26017930。在一些实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用以下一种或多种生物标志物判定癌症类型:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、
cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。在一些实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用以下一种或多种生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、
cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930,用于癌症之早期侦测、癌症之非侵入性侦测、区分不同癌症阶段、判定癌症之预后、预测治疗反应及/或监测治疗反应。在一些实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用以下一种或多种生物标志物判定癌症类型:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、
cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20)。在一些实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用以下一种或多种生物标志物:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20),用于癌症之早期侦测、癌症之非侵入性侦测、区分不同癌症阶段、判定癌症之预后、预测治疗反应及/或监测治疗反应。在一些实施方案中,癌症类型包含急性淋巴母细胞白血病、急性骨髓性白血病、膀胱癌、乳癌、脑癌、子宫颈癌、胆管癌(chol)、结肠癌、结肠直肠癌、子宫内膜癌、食道癌、胃肠癌、神经胶质瘤、神经胶母细胞瘤、头颈癌、肾脏癌、肝癌、肺癌、淋巴细胞性赘瘤、黑色素瘤、骨髓赘瘤、卵巢癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、鳞状细胞癌、睪丸癌、胃癌或甲状腺癌。在一些实施方案中,癌症类型包含膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、胃癌或甲状腺癌。
132.在一些实施方案中,本文所述之生物标志物包括cg25574765、cg25490145、cg18384097、cg25922751及cg17126555。在一些实施方案中,本文所述之方法、系统或非暂时性计算机可读介质使用生物标志物cg25574765、cg25490145、cg18384097、cg25922751及
cg17126555中之一或多者判定癌症类型。在一些实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555中之一或多者进行癌症之早期侦测、癌症之非侵入性侦测、区分不同癌症阶段、判定癌症之预后、预测治疗反应及/或监测治疗反应。在一些实施方案中,癌症类型包含急性淋巴母细胞白血病、急性骨髓性白血病、膀胱癌、乳癌、脑癌、子宫颈癌、胆管癌(chol)、结肠癌、结肠直肠癌、子宫内膜癌、食道癌、胃肠癌、神经胶质瘤、神经胶母细胞瘤、头颈癌、肾脏癌、肝癌、肺癌、淋巴细胞性赘瘤、黑色素瘤、骨髓赘瘤、卵巢癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、鳞状细胞癌、睪丸癌、胃癌或甲状腺癌。在一些实施方案中,癌症类型包含膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、胃癌或甲状腺癌。
133.在一些实施方案中,一组包含本文所述之生物标志物中之一或多者。在一些情况下,一组包含选自表15或表16的一种或多种生物标志物。在一些情况下,一组包含选自表17或表18之一种或多种生物标志物。在一些情况下,表15至表18表示癌症或正常样品标志物组。在一些情况下表15及表16表示癌症样品标志物组。在一些情况下,表17及表18表示癌症样品标志物组。
134.在一些情况下,一组包含一种或多种以下生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、
cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
135.在一些情况下,一组包含一种或多种以下生物标志物:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20)。
136.在一些实施方案中,一组包含一种或多种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555。在一些实施方案中,一组包含两种或超过两种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555。在一些实施方案中,一组包含三种或超过三种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555。在一些实施方案中,一组包含四种或超过四种生物标志物
cg25574765、cg25490145、cg18384097、cg25922751及cg17126555。在一些实施方案中,一组包含生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555。在一些实施方案中,一组系由一种或多种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555组成。在一些实施方案中,一组系由两种或超过两种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555组成。在一些实施方案中,一组系由三种或超过三种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555组成。在一些实施方案中,一组系由四种或超过四种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555组成。在一些实施方案中,一组系由生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555组成。在一些实施方案中,一组包含生物标志物cg25574765。在一些实施方案中,一组包含生物标志物cg25490145。在一些实施方案中,一组包含生物标志物cg18384097。在一些实施方案中,一组包含生物标志物cg17126555。在一些实施方案中,一组包含生物标志物cg25922751。在一些实施方案中,一组包含一种或多种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555,以及视情况存在之一种或多种选自表15、表16、表17、表18的生物标志物,及/或生物标志物cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、
cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
137.在一些实施方案中,一组包含一种或多种选自表20的生物标志物,以及视情况存在之一种或多种选自表15、表16、表17、表18的生物标志物,及/或生物标志物cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、
cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
138.在一些实施方案中,一组包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000或超过1000种生物标志物。在一些情况下,一组包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000或超过1000种生物标志物,其中该等生物标志物系选自表15、16、17及/或18。在一些情况下,一组包含约5种或超过5种生物标志物,包括6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000或超过1000种选自表15、16、17及/或18中之任一者的生物标志物或标志物。
139.在一些实施方案中,一组包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000或超过1000种生物标志物,其中该等生物标志物系选自表15至表16。在一些情况下,一组包含约5种或超过5种生物标志物,包括6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、
22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000或超过1000种选自表15至表16中之任一者的生物标志物或标志物。
140.在一些实施方案中,一组包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000或超过1000种生物标志物,其中该等生物标志物系选自表17至表18。在一些情况下,一组包含约5种或超过5种生物标志物,包括6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表17至表18中之任一者的生物标志物或标志物。
141.在一些实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表15、16、17及/或18之用于判定癌症类型的生物标志物。在一些实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表15、16、17及/或18之用于癌症之早期侦测的生物标志物。在其他实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、2829、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表15、16、17及/或18之用于癌症之非侵入性侦测的生物标志物。在另外的其他实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表15、16、17及/或18之用于区分不同癌症阶段的生物标志物。在其他实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、2829、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、
70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000或超过1000种选自表15、16、17及/或18的生物标志物,用于判定癌症之预后、预测治疗反应及/或监测治疗反应。
142.在一些实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表17及/或表18之用于判定癌症类型的生物标志物。在一些实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表17及/或表18之用于癌症之早期侦测的生物标志物。在其他实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表17及/或表18之用于癌症之非侵入性侦测的生物标志物。在另外的其他实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表17及/或表18之用于区分不同癌症阶段的生物标志物。在其他实施方案中,本文所述之方法、系统或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表17及/或18的生物标志物,用于判定癌症之预后、预测治疗反应及/或监测治疗反应。
143.在一些实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250种或超过250种用于判定癌症类型的生物标志物cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、
cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
144.在一些实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使
用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、2829、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250或超过250种生物标志物cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、
cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930,用于癌症之早期侦测、癌症之非侵入性侦测、区分不同癌症阶段、判定癌症之预后、预测治疗反应及/或监测治疗反应。在一些情况下,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含以下之组:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、2829、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100种或超过100种生物标志物cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20)。
145.在一些实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含1、2、3、4种或超过4种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555的组用于判定癌症类型。在一些实施方案中,本文所述之方法、系统、平台或非暂时性计算机可读介质系使用包含1、2、3、4种或超过4种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555的组,用于癌症之早期侦测、癌症之非侵入性侦测、区分不同癌症阶段、判定癌症之预后、预测治疗反应及/或监测治疗反应。
146.在一些实施方案中,cpg甲基化图谱数据库包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自表15、16、17及/或18的生物标志物。在一些实施方案中,cpg甲基化图谱数据库包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过
1000种选自表17至表18的生物标志物。在一些情况下,cpg甲基化图谱数据库包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000种或超过1000种选自以下的生物标志物:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、
cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。在一些情况下,cpg甲基化图谱数据库包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100种或超过100种选自以下的生物标志物:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20)。在一些情况下,cpg甲基化图谱数据库包含1、2、3、4或超过4种选自cg25574765、cg25490145、cg18384097、cg25922751及cg17126555的生物标志物。甲基化图谱
147.本文所述之甲基化图谱系指表示dna分子内之一种或多种生物标志物(或基因座)之甲基化状态或程度的一组数据。在一些情况下,本文所述之甲基化图谱系指表示表15、16、17及/或18之一种或多种生物标志物之甲基化状态或程度的一组数据。在一些情况下,本文所述之甲基化图谱系指表示以下一种或多种生物标志物之甲基化状态或程度的一组数据:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、
cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。在一些情况下,本文所述之甲基化图谱系指表示以下一种或多种生物标志物之甲基化状态或程度的一组数据:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、
cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20)。在一些情况下,本文所述之甲基化图谱系指表示一种或多种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555之甲基化状态或程度的一组数据。在一些情况下,dna甲基化数据报括(但不限于)cpg位点之甲基化指数、区域中之cpg位点之甲基化密度、cpg位点在邻接区域上之分布、含有超过一个cpg位点之区域内之一或多个个别cpg位点的甲基化型态或程度、cpg甲基化之缺乏,及/或非cpg甲基化。在一些情况下,甲基化图谱包含cpg位点之一组甲基化指数、区域中之cpg位点之一组甲基化密度、cpg位点在邻接区域内之一组分布、含有超过一个cpg位点之区域内之一或多个个别cpg位点之一组甲基化型态或程度、一组缺乏的cpg甲基化、一组非cpg甲基化,或其组合。在一些情况下,甲基化图谱在本文中亦称为甲基化指纹或甲基化标志物。
148.在一些实施方案中,甲基化图谱包含选自表15、16、17及/或18之一组生物标志物的甲基化状态或程度。在一些情况下,方法、系统、平台或非暂时性计算机可读介质使用包含选自表15、16、17及/或18之一组生物标志物之甲基化状态或程度的甲基化图谱来判定癌症类型。在一些情况下,方法、系统、平台或非暂时性计算机可读介质使用包含选自表15、16、17及/或18之一组生物标志物之甲基化状态或程度的甲基化图谱来进行癌症之早期侦测。在一些情况下,方法、系统、平台或非暂时性计算机可读介质使用包含选自表15、16、17及/或18之一组生物标志物之甲基化状态或程度的甲基化图谱来侦测癌症之存在。在一些情况下,方法、系统、平台或非暂时性计算机可读介质使用包含选自表15、16、17及/或18之一组生物标志物之甲基化状态或程度的甲基化图谱来进行癌症之非侵入性侦测。在一些情况下,方法、系统、平台或非暂时性计算机可读介质使用包含选自表15、16、17及/或18之一组生物标志物之甲基化状态或程度的甲基化图谱来区分不同癌症阶段。在一些情况下,方法、系统、平台或非暂时性计算机可读介质使用包含选自表15、16、17及/或18之一组生物标志物之甲基化状态或程度的甲基化图谱来判定癌症之预后、预测治疗反应及/或监测治疗反应。
149.在一些实施方案中,自组织样品产生选自表15、16、17及/或18之一组生物标志物的甲基化状态或程度。在一些情况下,自无细胞dna(cfdna)样品产生选自表15、16、17及/或18之一组生物标志物的甲基化状态或程度。在一些情况下,自流行肿瘤dna(ctdna)样品产生选自表15、16、17及/或18之一组生物标志物的甲基化状态或程度。
150.在一些实施方案中,方法、系统、平台或非暂时性计算机可读介质使用包含选自表15之一组生物标志物之甲基化状态或程度的甲基化图谱来判定癌症类型。在一些情况下,
方法、系统、平台或非暂时性计算机可读介质使用包含选自表16之一组生物标志物之甲基化状态或程度的甲基化图谱来判定癌症类型。在一些情况下,方法、系统、平台或非暂时性计算机可读介质使用包含选自表17之一组生物标志物之甲基化状态或程度的甲基化图谱来判定癌症类型。在一些实施方案中,方法、系统、平台或非暂时性计算机可读介质使用包含选自表18之一组生物标志物之甲基化状态或程度的甲基化图谱来判定癌症类型。
151.在一些实施方案中,方法、系统、平台或非暂时性计算机可读介质使用包含选自表15、16、17及/或18之一组生物标志物之甲基化状态或程度的甲基化图谱来侦测生物样品中癌症之存在。在一些情况下,随后,方法、系统、平台或非暂时性计算机可读介质至少使用包含选自表15、16、17及/或18之一组生物标志物之甲基化状态或程度的第二甲基化图谱来判定癌症类型,且视情况区分不同癌症阶段、判定癌症之预后、预测治疗反应及/或监测治疗反应。
152.在一些实施方案中,方法、系统、平台或非暂时性计算机可读介质使用包含选自以下之一组生物标志物之甲基化状态或程度的甲基化图谱来侦测生物样品中癌症之存在:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、
cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。在一些情况下,随后,方法、系统、平台或非暂时性计算机可读介质至少使用包含选自以下之一组生物标志物之甲基化状态或程度的第二甲基化图谱来判定癌症类型,且视情况区分不同癌症阶段、判定癌症之预后、预测治疗反应及/或监测治疗反应:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、
cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。在一些情况下,第一甲基化图谱及/或第二甲基化图谱包含选自以下之一组生物标志物的甲基化状态或程度:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20)。
153.在一些实施方案中,方法、系统、平台或非暂时性计算机可读介质使用包含选自表20之一组生物标志物之甲基化状态或程度的甲基化图谱来侦测生物样品中癌症之存在。在一些情况下,随后,方法、系统、平台或非暂时性计算机可读介质至少使用包含选自表20之一组生物标志物之甲基化状态或程度的第二甲基化图谱来判定癌症类型,且视情况区分不
同癌症阶段、判定癌症之预后、预测治疗反应及/或监测治疗反应。
154.在一些实施方案中,方法、系统、平台或非暂时性计算机可读介质使用包含选自表20之一组生物标志物之甲基化状态或程度的甲基化图谱来侦测生物样品中癌症之存在。在一些情况下,随后,方法、系统、平台或非暂时性计算机可读介质至少使用包含选自以下之一组生物标志物之甲基化状态或程度的第二甲基化图谱来判定癌症类型,且视情况区分不同癌症阶段、判定癌症之预后、预测治疗反应及/或监测治疗反应:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、
cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
155.在一些情况下,包含超过30%、40%、50%、60%、70%、80%、90%、95%或超过95%基因组之甲基化图谱视为甲基化基因组。在一些情况下,自一组选自表15、16、17及/或18之生物标志物产生甲基化基因组。在一些情况下,方法、系统、平台或非暂时性计算机可读介质使用本文所述之甲基化基因组判定癌症类型。在其他情况下,方法、系统或非暂时性计算机可读介质使用本文所述之甲基化基因组进行癌症之早期侦测。在一些情况下,方法、系统、平台或非暂时性计算机可读介质使用本文所述之甲基化基因组进行癌症之非侵入性侦测。在其他情况下,方法、系统或非暂时性计算机可读介质使用本文所述之甲基化基因组区分不同癌症阶段。在另外的其他情况下,方法、系统、平台或非暂时性计算机可读介质使用本文所述之甲基化基因组判定癌症之预后、预测治疗反应及/或监测治疗反应。
156.在一些情况下,甲基化状态或甲基化程度指示特定核苷酸或一部分dna内之核苷酸之甲基化的存在、缺乏及/或量。在一些情况下,特定dna序列之甲基化状态(例如如本文所述的生物标志物或dna区域)指示序列内之每个碱基的甲基化状态或可指示序列内之一小类碱基对的甲基化状态(例如胞嘧啶之甲基化状态或一种或多种特定限制酶识别序列之甲基化状态),或可指示关于序列内之区域性甲基化密度的信息,而不提供序列中何处发生甲基化的确切信息。在一些实施方案中,甲基化状态/程度用于区分不同亚型或肿瘤实体。在一些情况下,特定dna甲基化型态区分转移潜在性低及高的肿瘤,从而允许定制治疗方案。
157.在一些情况下,dna序列内之一或多个cpg甲基化位点的甲基化状态包括未甲基化、完全甲基化及/或半甲基化位点。在一些情况下,使用甲基化图谱之集合产生甲基化图,例如表示一群个体或肿瘤类型或特征之甲基化图谱。在一些情况下,高甲基化为,相对于正常对照dna样品内之对应cpg二核苷酸处所发现之5

mcyt的量,与测试dna样品之dna序列内之一或复数个cpg二核苷酸处之5

mcyt之存在增加对应的平均甲基化状态。在一些情况下,低甲基化为,相对于正常对照dna样品内之对应cpg二核苷酸处所发现之5

mcyt的量,与测试dna样品之dna序列内之一或复数个cpg二核苷酸处之5

mcyt之存在减少对应的平均甲基化状态。
158.在一些实施方案中,各基因组位点(例如cpg位点)之甲基化指数系指显示甲基化位点之序列读数占涵盖该位点之总读数个数的比例。在一些情况下,区域甲基化密度为该区域内之显示甲基化之位点读数个数除以涵盖该区域内之位点之总读数个数。在一些情况下,区域中之cpg甲基化密度为显示cpg甲基化之读数个数除以涵盖该区域中之cpg位点(例如特定cpg位点、cpg岛或更大区域内之cpg位点)之总读数个数。举例而言,人类基因组中之每个100kb区段的甲基化密度系根据cpg位点处之未转化胞嘧啶(对应于甲基化胞嘧啶)之总数确定,该等cpg位点为与100kb区域对映之序列读数所涵盖之所有cpg位点的一部分。在
一些情况下,此分析亦根据其他区段尺寸(例如50kb或1mb等)进行。在一些情况下,区域为全基因组或为染色体或染色体的一部分(例如染色体臂)。在一些情况下,当区域仅包括cpg位点时,该cpg位点的甲基化指数与该区域的甲基化密度相同。在一些情况下,甲基化胞嘧啶之比例系指在区域中,显示发生甲基化(例如在脱胺处理(诸如亚硫酸氢盐转化)之后未发生转化)之胞嘧啶位点「c's」的数目相对于所分析胞嘧啶残基(亦即包括cpg情形外之胞嘧啶)之总数。在一些情况下,甲基化指数、甲基化密度及甲基化胞嘧啶比例为甲基化程度之实例。
159.在一些实施方案中,甲基化图谱的判定包含判定dna样品中之超过至少约1、5、10、15、20、25、30、35、40、50、75或100、150、200、250、300、400、500、750、1000、2000、2500、3000、4000、5000、7500、10000、20000、25000、30000、40000、50000、75000、100000、200000、300000、400000、500000、600000及700000个cpg位点的甲基化状态。在此实施方案之一个态样中,根据约1至约500,000个cpg位点之甲基化状态产生甲基化图谱。
160.在一些实施方案中,甲基化图谱来源于活检样品。在一些情况下,甲基化图谱来源于组织样品。在一些情况下,甲基化图谱来源于无细胞生物样品。在一些情况下,甲基化图谱来源于流行肿瘤dna(ctdna)样品。对照
161.本文所述之各种方法包括将值、程度、特点、特征、特性等与适合对照(本文中可互换地称为适当对照)、对照样品或对照进行比较的步骤。在一些实施方案中,对照为获自患者之细胞、组织、器官或样品中所测定的值、程度、特点、特征、特性等。在一些情况下,细胞、组织、器官或样品为正常细胞、组织、器官或样品。在一些情况下,细胞组织、器官或样品为癌症细胞、组织、器官或样品。举例而言,分析本发明的生物标志物在来自未感染个体或正常对照个体或个体之未感染家族成员之样品中的甲基化程度。在另一个实施方案中,对照为开始对患者进行治疗(例如癌症治疗)之前所测定的值、程度、特点、特征、特性等,或其间的治疗方案。在其他实施方案中,对照为预定义的值、程度、特点、特征、特性等。
162.在一些实施方案中,对照为与一种癌症类型相关、与患者样品比较之本发明一种或多种生物标志物的甲基化图谱。在一些情况下,对照为表15、16、17、18及/或20中之一种或多种生物标志物的甲基化图谱。在一些情况下,对照为以下一种或多种生物标志物之甲基化图谱:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、
cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。在一些情况下,对照为一种或多种生物标志物cg25574765、cg25490145、cg18384097、cg25922751及cg17126555之甲基化图谱。
163.在一些情况下,对照为阳性对照,例如获自癌症样品的甲基化图谱;或为阴性对照,例如获自正常样品的甲基化图谱。在一些情况下,对照亦称为训练集或训练数据集。侦测方法
164.在一些实施方案中,利用多种方法量测、侦测、判定、鉴别及表征生物标志物(亦即dna之区域/片段或基因组dna之区域/片段(例如含有cpg岛之区域/片段))在疾病或病状(例如癌症)发展中的甲基化状态/程度且从而诊断疾病或病状之发作、存在或状态。
165.在一些情况下,自分离自个体之生物样品产生甲基化图谱。在一些实施方案中,生物样品为活检体。在一些情况下,生物样品为组织样品。在其他情况下,生物样品为无细胞生物样品。在其他情况下,生物样品为流行肿瘤dna样品。在一个实施方案中,生物样品为含
有流行肿瘤dna的无细胞生物样品。
166.在一些实施方案中,生物标志物(本文中亦称为标志物)系获自组织样品。在一些情况下,组织对应于任何细胞。不同类型的组织对应于不同类型的细胞(例如肝脏、肺、血液、结缔组织及其类似物),而且对应于健康细胞相对于肿瘤细胞或处于不同赘瘤阶段的肿瘤细胞,或对应于经置换的恶性肿瘤细胞。在一些实施方案中,组织样品进一步包含临床样品,且亦包括培养物的细胞、细胞上清液、器官及其类似物。样品亦包含新鲜冷冻的组织区块及/或经福尔马林固定、经石蜡包埋的组织区块,诸如由临床或病理学活检体制备的区块,其经制备用于病理学分析或免疫组织化学研究。
167.在一些实施方案中,生物标志物获自液体样品。在一些实施方案中,液体样品包含血液及生物学来源之其他液体样品(包括(但不限于)周边血液、血清、血浆、腹水、尿液、脑脊髓液(csf)、痰、唾液、骨髓、滑液、水状液、羊膜液、耳垢、母乳、支气管肺泡灌洗液、精液、前列腺体液、考珀液(cowper's fluid)或预射精液、女性预射液、汗液、泪液、囊内液、肋膜及腹膜液、心包液、腹水、淋巴、食糜、乳糜、胆汁、间质液、月经、脓、皮脂、呕吐物、阴道分泌物/冲洗物、滑液、黏膜分泌液、水性粪便、胰液、窦腔灌洗液、支气管与肺抽出物、胚囊腔液或脐带血)。在一些实施方案中,生物体液为血液、血液衍生物或血液部分,例如血清或血浆。在一个特定实施方案中,样品包含血液样品。在另一个实施方案中,使用血清样品。在另一个实施方案中,样品包含尿液。在一些实施方案中,液体样品亦包含在其获取之后已以任何方式操作的样品,诸如离心、过滤、沉淀、透析、层析、试剂处理、洗涤或根据特定细胞群增浓。
168.在一些实施方案中,正常样品(例如无疾病的正常或对照组织,或正常或对照体液、粪便、血液、血清、羊膜液)中的生物标志物,最重要的是,健康粪便、血液、血清、羊膜液或其他体液中的生物标志物,发生甲基化或未发生甲基化。在其他实施方案中,来自患有癌症或处于癌症风险中之患者之样品中的生物标志物发生低甲基化或高甲基化,例如相较于正常样品,甲基化频率(分别)降低或增加至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。在一个实施方案中,相较于患有癌症或处于癌症风险中之同一患者的先前所得样品分析(尤其为了比较疾病进展),样品亦发生低甲基化或高甲基化。
169.在一些实施方案中,甲基化基因组包含一组生物标志物,诸如上述生物标志物。在一些情况下,与生物体(例如人类)之肿瘤之甲基化基因组对应的甲基化基因组归类为肿瘤甲基化基因组。在一些情况下,使用肿瘤组织或生物样品中之无细胞(或无蛋白质)肿瘤dna测定肿瘤甲基化基因组。所关注之甲基化基因组之其他实例包括器官中之有助于dna进入体液中的甲基化基因组(例如组织(诸如脑、乳房、肺、前列腺及肾脏、血浆等)之甲基化基因组)。
170.在一些实施方案中,血浆甲基化基因组为自动物(例如人类)之血浆或血清中所测定的甲基化基因组。在一些情况下,由于血浆及血清包括无细胞dna,因此血浆甲基化基因组为无细胞或无蛋白质甲基化基因组之一个实例。由于血浆甲基化基因组为肿瘤与所关注之其他甲基化基因组之混合物,因此血浆甲基化基因组亦为混合型甲基化基因组之一个实例。在一些情况下,自个体之尿液样品测定尿液甲基化基因组。在一些情况下,细胞甲基化基因组对应于自患者细胞(例如来自器官(诸如脑、肺、乳房及其类似物)之组织细胞)测定
的甲基化基因组。血细胞的甲基化基因组称为血细胞甲基化基因组(或血液甲基化基因组)。
171.在一些实施方案中,藉由此项技术中的任何标准方式(包括使用市购试剂盒)分离dna(例如基因组dna,诸如所萃取之基因组dna或经处理之基因组dna)。简言之,在所关注之dna由细胞膜囊封的情况下,必须破碎生物样品且藉由酶促、化学或机械方式溶胞。在一些情况下,接着清除dna溶液中的蛋白质及其他污染物,例如藉由蛋白酶k消化来清除。接着自溶液中回收dna。在此等情况下,此系藉助于多种方法进行,包括盐析、有机萃取或使dna结合至固相载体。在一些情况下,选择方法受若干因素影响,包括时间、费用及dna的所需量。
172.在样品dna(例如来自无细胞样品(诸如血液或尿液)的循环dna)不围封于膜中的情况下,视情况使用此项技术中用于分离及/或纯化dna的标准方法(参见例如bettegowda等人,detection of circulating tumor dna in early

and late

stage human malignancies.sci.transl.med,6(224):ra24.2014)。此类方法包括使用蛋白质变性试剂,例如离液盐,例如胍盐酸盐或尿素;或清洁剂,例如十二烷基硫酸钠(sds)、溴化氰。替代方法包括(但不限于)乙醇沉淀或丙醇沉淀、真空浓缩,尤其藉助于离心机之真空浓缩。在一些情况下,本领域技术人员亦利用诸如以下之装置:过滤装置,例如超滤、二氧化硅表面或膜、磁性颗粒、聚苯乙烯颗粒、聚苯乙烯表面、带正电表面及带正电膜、带电荷膜、带电荷表面、带电荷之交换膜、带电荷之交换表面。
173.在一些情况下,核酸一经萃取,则藉由此项技术中已知的任何方式进行甲基化分析。多种甲基化分析程序在此项技术中已知且可用于实施本发明。此等分析允许判定组织样品内之一或复数个cpg位点的甲基化状态。另外,此等方法可用于甲基化核酸的绝对或相对量化。此类甲基化分析包括两个主要步骤及其他技术。第一步骤为甲基化特异反应或分离,诸如(i)亚硫酸氢盐处理;(ii)甲基化特异性结合;或(iii)甲基化特异性限制酶。第二个主要步骤包括(i)扩增及侦测,或(ii)藉由多种方法直接侦测,诸如(a)pcr(序列特异性扩增),诸如taqman(r);(b)未处理及经亚硫酸氢盐处理之dna的dna测序;(c)藉由连接(包括环状连接及裂解)经染料修饰之探针进行的测序;(d)焦磷酸测序;(e)单分子测序;(f)质谱;或(g)southern印迹分析。
174.另外,可使用限制酶消化自亚硫酸氢盐转化dna所扩增之pcr产物,例如sadri及hornsby所述的方法(1996,nucl.acids res.24:5058

5059)或cobra(组合式亚硫酸氢盐限制分析)(xiong及laird,1997,nucleic acids res.25:2532

2534)。cobra分析为适用于判定少量基因组dna中之特定基因座发生之dna甲基化程度的定量甲基化分析。简言之,限制酶消化系用于揭露经亚硫酸氢钠处理之dna之pcr产物中的甲基化相关序列差异。首先藉由标准亚硫酸氢盐处理法、根据frommer等人所述的程序(frommer等人,1992,proc.nat.acad.sci.usa,89,1827

1831)将甲基化相关序列差异引入基因组dna中。接着使用特异性针对所关注之cpg位点的引物对亚硫酸氢盐转化之dna进行pcr扩增,随后进行限制性核酸内切酶消化、凝胶电泳且经标记之特定杂交探针侦测。原始dna样品中的甲基化程度系在dna甲基化程度之宽范围内、以线性定量方式、由消化及未消化pcr产物之相对量表示。另外,此技术可靠地应用于自微解剖之经石蜡包埋之组织样品获得之dna。用于cobra分析的典型试剂(例如如可能在基于cobra之典型试剂盒中发现)可包含(但不限于):用于特定基因(或甲基化改变之dna序列或cpg岛);限制酶及适当缓冲液;基因杂交寡核苷酸;对照
杂交寡核苷酸;用于寡核苷酸探针的激酶标记试剂盒;及放射性核苷酸。另外,亚硫酸氢盐转化试剂可包括:dna变性缓冲液;磺化缓冲液;dna回收试剂或试剂盒(例如沉淀、超滤、亲和柱);脱磺缓冲液;及dna回收组分。
175.在一个实施方案中,所选cpg位点的甲基化图谱系使用甲基化特异性pcr(msp)测定。msp允许评估cpg岛内之cpg位点之几乎任何群组的甲基化状态,而不依赖于使用甲基化敏感性限制酶(herman et al,1996,proc.nat.acad.sci.usa,93,9821

9826;美国专利第5,786,146号、第6,017,704号、第6,200,756号、第6,265,171号(herman及baylin);美国专利公开案第2010/0144836号(van engeland等人);该等文献以全文引用的方式并入本文中)。简言之,dna经脱胺剂(诸如亚硫酸氢钠)修饰而将未甲基化胞嘧啶(而非甲基化胞嘧啶)转化为尿嘧啶,且随后用特异性针对甲基化相对于未甲基化dna的引物扩增。用于msp分析的典型试剂(例如如可能在基于msp之典型试剂盒中所发现)可包括(但不限于):用于特定基因(或甲基化改变之dna序列或cpg岛)的甲基化及未甲基化pcr引物、优化pcr缓冲液及脱氧核苷酸,及特异性探针。colosure
tm
测试为针对结肠癌之市售测试,其基于msp技术及波形蛋白(vimentin)基因甲基化之量测(itzkowitz等人,2007,clin gastroenterol.hepatol.5(1),111

117)。或者,可使用如以下文献中所述的定量式多任务型甲基化特异性pcr(qm

pcr):fackler等人,2004,cancer res.64(13)4442

4452;或fackler等人,2006,clin.cancer res.12(11pt 1)3306

3310。
176.在一个实施方案中,所选cpg位点的甲基化图谱系使用methylight及/或重甲基方法(heavy methyl methods)测定。methylight及重甲基分析为利用基于荧光之实时pcr(taq man(r))技术的高处理量定量甲基化分析,其无需pcr步骤之后的进一步操作(eads,c.a.等人,2000,nucleic acid res.28,e 32;cottrell等人,2007,j.urology 177,1753;美国专利第6,331,393号(laird等人),该等文献之内容以全文引用的方式并入本文中)。简言之,methylight方法以基因组dna之混合样品开始,根据标准程序、以亚硫酸氢钠反应转化为甲基化相关序列差异之混合池(亚硫酸氢盐方法使未甲基化胞嘧啶残基转化为尿嘧啶)。接着以「无偏性」(使用与已知cpg甲基化位点不重迭的引物)pcr反应或以「有偏倚」(使用与已知cpg二核苷酸重迭的pcr引物)反应进行基于荧光的pcr。在一些情况下,在扩增方法的层面上或在荧光侦测方法的层面上,在两者的层面上进行序列辨别。在一些情况下,methylight分析系用作基因组dna样品中之甲基化型态的定量测试,其中序列辨别系在探针杂交层面上发生。在此定量形式中,pcr反应在与特定假定甲基化位点重迭的荧光探针存在下提供无偏性扩增。藉由既非引物、亦非探针上覆于任何cpg二核苷酸的反应来提供无偏性对照以获得输入dna的量。或者,藉由用不「涵盖」已知甲基化位点之对照寡核苷酸或用涵盖潜在甲基化位点的寡核苷酸探测偏向pcr池来达成基因组甲基化的定性测试。用于methylight分析的典型试剂(例如如可能在基于methylight之典型试剂盒中所发现)可包括(但不限于):用于特定基因(或甲基化改变的dna序列或cpg岛)的pcr引物;taqman(r)探针;优化pcr缓冲液及脱氧核苷酸;及taq聚合酶。methylight技术作为市售测试用于肺癌(epi prolung bl reflex分析);结肠癌(epi procolon分析及msept9分析)(epigenomics,berlin,germany),pct公开案第wo2003/064701号(schweikhardt及sledziewski),该文献之内容以全文引用的方式并入本文中。
177.定量methylight使用亚硫酸氢盐转化基因组dna且使用pcr、使用甲基化无关引物
扩增甲基化位点。特异性针对甲基化及未甲基化位点之具有两种不同荧光团的侦测探针可对甲基化同时进行定量量测。重甲基技术始于dna之硫酸氢盐转化。接着,利用特定阻断剂防止未甲基化dna发生扩增。甲基化基因组dna不结合阻断剂且其序列将得到扩增。经扩增的序列系用甲基化特异性探针侦测。(cottrell等人,2004,nuc.acids res.32:e10,该文献之内容以全文引用的方式并入本文中)。
178.ms

snupe技术为评估特定cpg位点之甲基化差异的定量方法,其基于dna之亚硫酸氢盐处理,随后为单一核苷酸引物延伸(gonzalgo及jones,1997,nucleic acids res.25,2529

2531)。简言之,使基因组dna与亚硫酸氢钠反应以使未甲基化胞嘧啶转化为尿嘧啶,同时使5

甲基胞嘧啶不变。接着使用特异性针对亚硫酸氢盐转化dna之pcr引物对所要目标序列进行扩增,且分离所得产物且作为模板用于所关注之cpg位点之甲基化分析。在一些情况下,分析少量dna(例如微解剖之病变切片),且该方法避免使用限制酶测定cpg位点之甲基化状态。用于ms

snupe分析的典型试剂(例如如基于ms

snupe之典型试剂盒中所发现)包括(但不限于)用于特定基因(或甲基化改变之dna序列或cpg岛)的pcr引物;优化pcr缓冲液及脱氧核苷酸;凝胶萃取试剂盒;阳性对照引物;用于特定基因的ms

snupe引物;反应缓冲液(用于ms

snupe反应);及放射性核苷酸。另外,亚硫酸氢盐转化试剂可包括:dna变性缓冲液;磺化缓冲液;dna回收试剂或试剂盒(例如沉淀、超滤、亲和柱);脱磺缓冲液;及dna回收组分。
179.在另一个实施方案中,所选cpg位点之甲基化状态系使用基于差异性结合之甲基化侦测方法测定。为了鉴别差异甲基化区域,一种方法为捕捉甲基化dna。此方法系使用蛋白质,其中mbd2之甲基结合域与抗体之fc片段融合(mbd

fc)(gebhard等人,2006,cancer res.66:6118

6128;及pct公开案第wo 2006/056480a2号(relhi),该等文献之内容以全文引用的方式并入本文中)。此融合蛋白相较于习知甲基化特异性抗体具有若干优点。mbd fc对甲基化dna的亲和力较高且其结合双链dna。最重要的是,两种蛋白质在其结合dna的方式上不同。甲基化特异性抗体随机结合dna,此意谓仅可获得二元答案。另一方面,mbd

fc之甲基结合域结合dna分子,不论其甲基化状态。此蛋白质

dna相互作用力藉由dna甲基化程度定义。结合基因组dna之后,可使用盐浓度增加的洗脱液将非甲基化dna及甲基化dna分级分离,从而使得分离更可控(gebhard等人,2006,nucleic acids res.34:e82)。因此,此方法(称为甲基

cpg免疫沉淀(mcip))不仅使基因组dna增浓,而且根据甲基化程度使基因组dna分级分离,当亦应研究未甲基化dna分率时,此尤其有帮助。
180.在一个替代性实施方案中,5

甲基胞苷抗体结合甲基化dna且使其沉淀。抗体获自abeam(cambridge,ma)、diagenode(sparta,nj)或eurogentec(c/o anaspec,fremont,ca)。甲基化片段一经分离,则其可使用基于微阵列之技术(诸如甲基化cpg岛回收分析(mira)或甲基化dna免疫沉淀(medip))测序(pelizzola等人,2008,genome res.18,1652

1659;o'geen等人,2006,biotechniques 41(5),577

580;weber等人,2005,nat.genet.37,853

862;horak及snyder,2002,methods enzymol,350,469

83;lieb,2003,methods mol biol,224,99

109)。另一种技术为甲基

cpg结合域柱/部分解链分子分离(mbd/spm,shiraishi等人,1999,proc.natl.acad.sci.usa 96(6):2913

2918)。
181.在一些实施方案中,甲基化侦测方法包括对基因组dna进行随机剪切或随机断裂、利用甲基化依赖性或甲基化敏感性限制酶切割dna及随后选择性地鉴别及/或分析经切割
i及zra i。当识别序列内之腺苷在位置n6发生甲基化时、不会使dna在或接近其识别序列处裂解的适合甲基化敏感性限制酶包括例如mbo i。本领域技术人员将了解,任何甲基化敏感性限制酶,包括本文所述之限制酶的同源物及直系同源物,亦适用于本发明。本领域技术人员将进一步了解,在胞嘧啶甲基化存在下未能在或接近其识别序列处切割的甲基化敏感性限制酶可能在或接近其识别序列处对腺苷甲基化的存在不敏感。同样,在腺苷甲基化存在下未能在或接近其识别序列处切割的甲基化敏感性限制酶可能在或接近其识别序列处对胞嘧啶甲基化之存在不敏感。举例而言,sau3ai在或接近其识别序列处对甲基化胞嘧啶之存在敏感(亦即未能切割),但在或接近其识别序列处对甲基化腺苷之存在不敏感(亦即切割)。本领域技术人员亦将了解,一些甲基化敏感性限制酶因dna之一或两条链(包含其识别序列)之碱基发生甲基化而被阻断,而其他甲基化敏感性限制酶仅因两条链发生甲基化而被阻断,但在识别位点发生半甲基化时可切割。
185.在替代实施方案中,视情况将接附子添加至随机断裂之dna之末端,接着利用甲基化依赖性或甲基化敏感性限制酶消化dna,且随后使用与接附子序列杂交的引物扩增完整dna。在此情况下,执行第二步骤以判定dna扩增池中之特定基因的存在、缺乏或量。在一些实施方案中,使用实时定量pcr扩增dna。
186.在其他实施方案中,方法包含对一群基因组dna内之目标序列的平均甲基化密度进行量化。在一些实施方案中,方法包含使基因组dna与甲基化依赖性限制酶或甲基化敏感性限制酶在允许基因座中之潜在限制酶裂解位点之至少一些复本保持不裂解的条件下接触;量化基因座之完整复本;及对扩增产物的量与表示对照dna甲基化之量的对照值进行比较,从而相较于对照dna之甲基化密度量化该基因座中之平均甲基化密度。
187.在一些情况下,如下测定dna之基因座甲基化之量:提供包含基因座之基因组dna之样品,用甲基化敏感性或甲基化依赖性限制酶使dna裂解,接着量化完整dna之量或量化所关注之dna基因座之经切割dna之量。完整或经切割dna之量将视以下而定:含有基因座之基因组dna的初始量、基因座甲基化之量,及基因组dna中发生甲基化之基因座中之核苷酸数目(亦即分率)。dna基因座中之甲基化之量可藉由比较完整dna或经切割dna之量与对照值来测定,对照值表示经类似处理之dna样品中之完整dna或经切割dna之量。对照值可表示已知或预测的甲基化核苷酸数目。或者,对照值可表示另一种(例如正常、非病变)细胞中之相同基因座或第二基因座中之完整或经切割dna的量。
188.藉由在允许基因座中之潜在限制酶裂解位点之至少一些复本保持不裂解的条件下使用至少一种甲基化敏感性或甲基化依赖性限制酶且随后量化剩余完整复本且比较该量与对照值,可测定基因座的平均甲基化密度。若甲基化敏感性限制酶在允许基因座中之潜在限制酶裂解位点之至少一些复本保持不裂解的条件下接触dna基因座之复本,则剩余的完整dna将与甲基化密度成正比,且从而可与对照值进行比较以测定样品中之基因座的相对甲基化密度。类似地,若甲基化依赖性限制酶在允许基因座中之潜在限制酶裂解位点之至少一些复本保持不裂解的条件下接触dna基因座之复本,则剩余的完整dna将与甲基化密度成反比,且从而可与对照值进行比较以测定样品中之基因座的相对甲基化密度。此类分析揭示于例如美国专利第7,910,296号中。
189.甲基化cpg岛扩增(mca)技术为一种可用于筛选基因组dna中之所改变甲基化型态以及分离与此等变化相关的特定的序列的方法(toyota等人,1999,cancer res.59,2307

2312;美国专利第7,700,324号(issa等人),该等文献之内容以全文引用的方式并入本文中)。简言之,使用对其识别位点中之胞嘧啶甲基化具有不同敏感性的限制酶消化来自原发性肿瘤、细胞株及正常组织的基因组dna,随后进行任意的预致敏pcr扩增。pcr产物在高分辨率聚丙烯酰胺凝胶上解析之后,对显示差异性甲基化的片段进行克隆及测序。所克隆片段接着用作southern分析法中的探针以证实此等区域中之差异性甲基化。用于mca分析的典型试剂(例如如可能在基于mca之典型试剂盒中发现)可包括(但不限于)用于任意预致敏基因组dna的pcr引物;pcr缓冲液及核苷酸、限制酶及适当缓冲液;基因杂交寡核苷酸或探针;对照杂交寡核苷酸或探针。
190.其他甲基化侦测方法包括以下文献中所述的那些方法:例如美国专利第7,553,627号;第6,331,393号;美国专利第12/476,981号;美国专利公开案第2005/0069879号;rein等人,26(10)nucleic acids res.2255

64(1998);及olek等人,17(3)nat.genet.275

6(1997)。
191.在另一个实施方案中,所选cpg位点的甲基化状态系使用甲基化敏感性高分辨率解链法(high resolution melting;hrm)测定。最近,wojdacz等人报导甲基化敏感性高分辨率解链法为一种评估甲基化的技术。(wojdacz及dobrovic,2007,nuc.acids res.35(6)e41;wojdacz等人,2008,nat.prot.3(12)1903

1908;balic等人,2009j.mol.diagn.11 102

108;及美国专利公开案第2009/0155791号(wojdacz等人),该等文献之内容以全文引用的方式并入本文中)。多种市售实时pcr机器具有hrm系统,包括roche lightcycler480、corbett research rotorgene6000及applied biosystems 7500。hrm亦可与其他扩增技术组合,诸如焦磷酸测序法,如candiloro等人所述(candiloro等人,2011,epigenetics 6(4)500

507)。
192.在另一个实施方案中,所选cpg基因座之甲基化状态系使用引物延伸分析测定,包括产生所扩增标靶供使用质谱分析的优化pcr扩增反应。分析亦可以多任务形式进行。质谱为一种侦测与差异性甲基化调节组件相关之聚核苷酸的特别有效方法。藉由对所侦测信号之质量与所关注之聚核苷酸之预期质量进行比较来检验聚核苷酸序列之存在。特定聚核苷酸序列之相对信号强度(例如光谱上之质量峰)指示特定等位基因之相对群体,从而能够根据此资料直接计算等位基因比率。此方法详细描述于pct公开案第wo 2005/012578a1号(beaulieu等人)中,该案以全文引用的方式并入本文中。在甲基化分析中,可采用该分析侦测亚硫酸氢盐所引入的甲基化依赖性c至t序列变化。此等方法特别适用于在单孔中实施多任务扩增反应及多任务引物延伸反应(例如多任务均质引物质量延伸(hme)分析),以进一步提高处理量及降低引物延伸反应之单位反应成本。
193.用于dna甲基化分析的其他方法包括限制地标基因组扫描(restriction landmark genomic scanning;rlgs,costello等人,2002,meth.mol biol,200,53

70)、甲基化敏感性代表性差异分析(methylation

sensitive

representational difference analysis;ms

rda,ushijima及yamashita,2009,methods mol biol 507,117

130)。用于相对甲基化(charm)技术的全面高通量阵列描述于wo 2009/021141(feinberg及irizarry)中。roche(r)nimblegen(r)微阵列包括芯片上之染色质免疫沉淀(chromatin immunoprecipitation

on

chip;chlp

芯片)或芯片上之甲基化dna免疫沉淀(methylated dna immunoprecipitation

on

chip;medip

芯片)。此等工具已用于多种癌症应用,包括黑
methylated markers with a novel methylation specific technology;及美国专利第7,011,944号(prudent等人))。
199.适合的下一代测序技术可广泛获得。实例包括454life sciences平台(roche,branford,ct)(margulies等人,2005nature,437,376

380);lllumina的基因组分析仪、goldengate甲基化分析,或infinium甲基化分析,亦即infinium humanmethylation 27k beadarray或veracode goldengate甲基化阵列(illumina,san diego,ca;bibkova等人,2006,genome res.16,383

393;美国专利第6,306,597号及第7,598,035号(macevicz);第7,232,656号(balasubramanian等人));bio

rad的qx200
tm droplet digital
tm pcr系统;或藉由连接进行dna测序的solid系统(applied biosystems/life technologies;美国专利第6,797,470号、第7,083,917号、第7,166,434号、第7,320,865号、第7,332,285号、第7,364,858号及第7,429,453号(barany等人));helicos true单一分子dna测序技术(harris等人,2008science,320,106

109;美国专利第7,037,687号及第7,645,596号(williams等人);第7,169,560号(lapidus等人);第7,769,400号(harris))、pacific biosciences的单一分子实时(smrt
tm
)技术,及测序(soni及meller,2007,clin.chem.,1996

2001);半导体测序(ion torrent;personal genome machine);dna奈米球测序;使用dover systems之技术(polonator)进行的测序,及在测序之前不需要扩增或以其他方式转型原生dna的技术(例如pacific biosciences及helicos),诸如基于奈米孔之策略(例如oxford nanopore,genia technologies及nabsys)。此等系统允许以平行方式、以高阶多任务对自样本中分离的多种核酸分子进行测序。此等平台中之每一者允许对以纯系扩增或非扩增之单一核酸片段分子进行测序。特定平台包括例如(i)藉由连接经染料修饰之探针(包括环状连接及裂解)来测序、(ii)焦磷酸测序,及(iii)单一分子测序。
200.焦磷酸测序为一种基于合成测序的核酸测序方法,其依赖于核苷酸并入时所释放之焦磷酸盐的侦测。一般而言,合成测序包括一次合成一个核苷酸(一条dna链,与其互补之链的序列处于寻求之中)。研究核酸可固着至固体载体,与测序引物杂交,与dna聚合酶、atp硫酸化酶、荧光素酶、腺苷三磷酸双磷酸酶(apyrase)、腺苷5'磷酰硫酸盐及荧光素一起培育。依序添加核苷酸溶液且移除。核苷酸之正确并入使焦磷酸盐释放,其与atp硫酸化酶发生相互作用且在腺苷5'磷酰硫酸盐存在下产生atp,促进荧光素反应,产生化学发光信号,从而可进行序列测定。焦磷酸测序机器及甲基化特异性试剂获自qiagen,inc.(valencia,ca)。亦参见tost及gut,2007,nat.prot.2 2265

2275。本领域技术人员基于焦磷酸测序可使用之系统实例通常包括以下步骤:使接附子核酸与研究核酸连接且使该研究核酸与珠粒杂交;在乳液中扩增研究核酸中之核苷酸序列;使用皮升多孔固体载体分选珠粒;及藉由焦磷酸测序方法(例如nakano等人,2003,j.biotech.102,117

124)对所扩增的核苷酸序列测序。此类系统可用于以指数规律扩增藉由本文所述方法产生的扩增产物,例如将异源核酸连接至藉由本文所述方法产生的第一扩增产物。探针
201.在一些情况下,上述测序方法中使用探针组中的一或多个探针。在一些情况下,探针组中的一或多个探针包含式i之探针:
其中:a为第一标靶结合区;b为第二标靶结合区;及l为连接体区;其中a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少30个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性;b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少12个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性;l连接至a;且b连接至a或l。
202.在一些情况下,l连接至a且b连接至l。在一些情况下,a、b及l如式ia中所说明连接:
203.在一些情况下,复数个探针包含至少10、20、30、50、100、200、500、1000、1500、1775、1800、2000或超过2000个探针。在一些情况下,复数个探针包含10、20、30、50、100或超过100个探针。
204.在一些实施方案中,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少35个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少40个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少45个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少50个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少55个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少60个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少65个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少70个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少80个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,a与选自seq id no:1

1775之序列之5'末端之位置1起始的至少90个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。
205.在一些实施方案中,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少14个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少15个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少18个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少20个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少22个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少25个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少28个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少30个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少35个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少40个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少45个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少50个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少55个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少60个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少65个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少70个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少80个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。在一些情况下,b与选自seq id no:1

1775之相同序列之3'末端之位置1'起始的至少90个邻接核苷酸具有至少70%、80%、90%、95%或99%序列同一性。
206.在一些情况下,下一代测序反应中使用复数个探针来产生cpg甲基化数据。在一些情况下,基于溶液的下一代测序反应中使用复数个探针来产生cpg甲基化数据。在一些情况下,下一代测序反应包含454life sciences平台(roche,branford,ct);lllumina的基因组分析仪、goldengate甲基化分析,或infinium甲基化分析,亦即infinium humanmethylation 27k beadarray或veracode goldengate甲基化阵列(illumina,san diego,ca);得自bio

rad的qx200
tm droplet digital
tm pcr系统;藉由连接进行dna测序的solid系统(applied biosystems/life technologies);helicos true单一分子dna测序技术;半导体测序(ion torrent;个人基因组机器);dna奈米球测序;使用dover systems技术
(polonator)进行的测序,及在测序之前不需要扩增或以其他方式转型原生dna的技术(例如pacific biosciences及helicos),诸如基于奈米孔的策略(例如oxford nanopore、genia technologies,及nabsys)。在一些情况下,基于溶液的下一代测序反应为液滴数字pcr测序方法。
207.在一些情况下,每个探针与一个cpg位点相关。在一些情况下,每个探针与选自表15至表18及/或表20相关的生物标志物(例如cpg位点)。在一些情况下,每个探针与选自以下的生物标志物相关:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、
cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。在一些情况下,每个探针与选自以下的生物标志物相关:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20)。在一些情况下,每个探针与选自cg25574765、cg25490145、cg18384097、cg25922751及cg17126555的生物标志物相关。
208.在一些情况下,l的长度介于10与60个、15与55个、20与50个、25与45个及30与40个核苷酸之间。在一些情况下,l的长度为约15、20、25、30、35、40、45、50、55或60个核苷酸。
209.在一些情况下,l进一步包含接附子区域。在一些情况下,接附子区域包含用于鉴别各探针的序列。
210.在一些实施方案中,探针组中的一或多个探针包含与选自seq id no:1

2333之序列具有至少50%、60%、70%、80%、90%、95%、98%或99%序列同一性的序列。在一些实施方案中,探针组中的一或多个探针包含与选自seq id no:1830

2321之序列具有至少50%、60%、70%、80%、90%、95%、98%或99%序列同一性的序列。在一些情况下,探针组中的一或多个探针包含与选自seq id no:1830

2321之序列具有约100%序列同一性的序列。在一些情况下,探针组中的一或多个探针系由选自seq id no:1830

2321组成的序列。在一些情况下,数字pcr测序方法中使用探针组中的一或多个探针。在一些情况下,液滴数字pcr(ddpcr)测序方法中使用探针组中的一或多个探针。cpg甲基化数据分析方法
211.在某些实施方案中,将针对生物标志物组之标志物所量测的甲基化值以数学方式
组合且组合值与潜在诊断问题相关。在一些情况下,藉由先前技术中任何适当的数学方法将甲基化生物标志物值组合。使标志物组合与疾病状态相关联的熟知数学方法系使用以下方法:如判别分析(da)(例如线性da、二次da、规则化da)、判别功能性分析(dfa)、核方法(例如svm)、多维量表法(mds)、非参数方法(例如k最近邻分类法)、pls(部分最小平方)、基于树之方法(例如逻辑回归、cart、随机森林方法(random forest methods)、强化/装袋方法(boosting/bagging methods)、广义型线性模型(例如逻辑回归)、基于主分量之方法(例如simca)、广义型相加模型、基于模糊逻辑之方法、神经网络及基于遗传学算法之方法。本领域技术人员在选择评价本发明之生物标志物组合的适当方法上不会出现问题。在一个实施方案中,使本发明之生物标志物组合之甲基化状态与例如诊断crc相关联所用的方法系选自da(例如线性判别分析、二次判别分析、规则化判别分析)、dfa、核方法(例如svm)、mds、非参数方法(例如k最近邻分类法)、pls(部分最小平方)、基于树之方法(例如逻辑回归、cart、随机森林方法、强化方法),或广义型线性模型(例如逻辑回归),及主分量分析。关于此等统计学方法的详情见于以下参考文献中:ruczinski等人,12j.of computational and graphical statistics 475

511(2003);friedman,j.h.,84j.of the american statistical association165

75(1989);hastie,trevor,tibshirani,robert,friedman,jerome,the elements of statistical learning,springer series in statistics(2001);breiman,l.,friedman,j.h.,olshen,r.a.,stone,c.j.classification and regression trees,california:wadsworth(1984);breiman,l.,45machine learning 5

32(2001);pepe,m.s.,the statistical evaluation of medical tests for classification and prediction,oxford statistical science series,28(2003);及duda,r.o.,hart,p.e.,stork,d.o.,pattern classification,wiley interscience,第2版(2001)。
212.在一个实施方案中,各甲基化组的相关结果系根据其与疾病或肿瘤类型阳性状态来评级,诸如根据p值检验或t值检验或f检验。接着随后选择所评级(最佳为前者,亦即低p值或t值)的标志物且添加至甲基化组中直至达成特定的诊断值。此类方法包括鉴别甲基化组或更宽泛而言,使用例如随机方差t检验(wright g.w.及simon r,bioinformatics19:2448

2455,2003)所测,在若干类别之间发生差异甲基化的基因。其他方法包括特定说明测定生物标志物组中所包含之生物标志物所用之显著性程度的步骤。该组中包括在各类别之间发生单变量参数显著性程度小于指定临限值之差异甲基化的生物标志物。指定显著性程度是否小得足以排除足够的假发现并不重要。在一些问题中,藉由对作为特征使用的生物标志物组进行丰富的描述可达成更好的预测。在一些情况下,生物标志物组可用生物学解释且在临床上为适用的,然而条件为所包括的生物标志物较少。类似于交叉验证,对交叉验证过程中所产生的各训练集重复进行生物标志物选择。此目的为对预测误差提供无偏性估算。用于新患者样品数据的甲基化组为对「已知」甲基化信息应用甲基化选择及分类法所产生的甲基化组或对照甲基化组。
213.亦可使用利用甲基化图谱预测将来样品之类别的模型。此等模型可基于混合共变量预测因子(radmacher等人,journal of computational biology 9:505

511,2002)、对角线线性判别分析(dudoit等人,journal of the american statistical association 97:77

87,2002)、最近相邻分类(亦为dudoit等人),及利用线性核的支持向量机器
(ramaswamy等人,pnas usa 98:15149

54,2001)。该等模型并有以指定显著性程度(例如0.01、0.05或0.1)发生差异甲基化的生物标志物,如藉由随机方差t检验所评估(wright g.w.及simon r.bioinformatics 19:2448

2455,2003)。可使用交叉验证(较佳为留一法交叉验证)(simon等人,journal of the national cancer institute 95:14

18,2003)估算各模型之预测误差。在各留一法交叉验证训练集中,重复整个模型构筑过程,包括生物标志物选择过程。亦可评价模型的交叉验证误差率估算是否显著小于随机预测之预期。分类标记可随机排列且接着重复整个留一法交叉验证过程。显著性程度为使得交叉验证误差率不超过使用真实甲基化数据所得之交叉验证误差率的随机排列比例。
214.另一种分类方法为bo及jonassen(genome biology3(4):research0017.1

0017.11,2002)所述的贪婪对方法(greedy

pairs method)。贪婪对方法始于对训练集之所有生物标志物基于其个别t分数来分级。此方法试图选择合起来起良好作用以区分类别的生物标志物对。
215.此外,利用甲基化图谱的二元树分类法可用于预测将来样品之类别。树之第一节点并入二元分类法,该二元分类法区分总类集中的两个子集。个别二元分类法系基于「支持向量机」,其并入在各生物标志物之间以显著性程度(例如0.01、0.05或0.1)差异表达之生物标志物,如藉由随机方差t检验(wright g.w.及simon r.bioinformatics 19:2448

2455,2003)所评估。评价所有可能二元分区的分类法且所选分区为使得交叉验证的预测误差最小的分区。接着针对藉由先前二元分解所确定的两个类别子集依次重复进行该过程。二元树分类法的预测误差可藉由交叉验证整个树构筑过程来估算。此总体交叉验证包括对各节点的最佳分区进行再选择及对各交叉验证训练集所用的生物标志物进行再选择,如simon等人(simon等人,journal of the national cancer institute 95:14

18,2003)所述。进行数折交叉验证,其中保留一部分样品,对剩余样品开发二元树,接着预测所保留样品的类别成员资格。此过程重复数次,每次保留不同百分比的样品。将样品随机分割成部分测试集(simon r及lam a.brb

arraytools user guide,3.2版.biometric research branch,national cancer institute)。
216.因此,在一个实施方案中,各生物标志物的相关结果b)系根据其与疾病或肿瘤类型阳性状态的校正相关性(较佳根据p值检验)来评级。亦可包括根据评级次序选择生物标志物d)的步骤。
217.在其他实施方案中,另外可利用诸如以下因素:转录速率、mrna含量、转译速率、蛋白质含量、生物活性、细胞特征或特性、基因型、表型等之值、程度、特点、特征、特性等,随后、在此期间或在此之后向患者投与疗法以能够对患者之癌症状态达成进一步分析。特异性及灵敏性
218.诊断测试正确预测状态的能力通常以分析之灵敏性、分析之特异性或接受者操作特征(「roc」)曲线下之面积量测。灵敏性为藉由测试预测为阳性之真实阳性百分比,而特异性为藉由测试预测为阴性之真实阴性百分比。roc曲线提供测试之灵敏性与1

特异性的函数关系。roc曲线下之面积愈大,测试之预测值则愈有效。测试效用之其他适用度量为阳性预测值及阴性预测值。阳性预测值为测试阳性实际上为阳性者之百分比。阴性预测为测试阴性实际上为阴性者的百分比。
219.在特定实施方案中,本发明的生物标志物组可显示不同癌症状态具有至少p<
0.05、p<10
‑2、p<10
‑3、p<10
‑4或p<10
‑5之统计学差异。使用此等生物标志物的诊断测试可显示至少0.6、至少约0.7、至少约0.8或至少约0.9之roc。未感染个体(或正常对照个体)与癌症中的生物标志物发生差异甲基化,且各癌症类型的生物标志物发生差异甲基化且因此适用于帮助判定癌症状态。在某些实施方案中,使用本文所述方法量测患者样品中的生物标志物且与例如预定义的生物标志物含量进行比较且与癌症状态相关联。在其他实施方案中,比较患者样品中之生物标志物组合与例如预定义之生物标志物组的相关性。在又另一个实施方案中,对患者样品中之一或多个基因的甲基化图谱与经鉴别发生差异甲基化之与肿瘤类型或状态或癌症状态相关之基因的甲基化图谱进行比较。在特定实施方案中,接着可对量测结果与相关诊断量、截止值或多变量模型分数进行比较,从而区分阳性癌症状态与阴性癌症状态。诊断量代表表观遗传生物标志物之量测量,高于其或低于其,患者则归类为具有特定癌症状态。如此项技术中所充分了解,藉由调节分析中所用的特定诊断截止值,可提高诊断分析的灵敏性或特异性,此视诊断医师的偏好而定。在特定实施方案中,特定诊断截止值可如下确定:例如量测具有不同癌症状态之患者之统计显著数目个样品中之生物标志物高甲基化或低甲基化的量,且得到适于特异性及灵敏性之所要程度的截止值。癌症
220.在一些实施方案中,本文中所揭示包括使用上述一种或多种生物标志物侦测、表征及/或预测癌症。在一些情况下,生物标志物在诊断测试中用于判定、表征、鉴定及/或评估癌症。在一些情况下,生物标志物包括表15、16、17、18及/或20中所示的生物标志物。
221.在一些情况下,癌症为实体肿瘤或血液科恶性疾病。在一些情况下,癌症为癌瘤、肉瘤、淋巴瘤或白血病。在一些情况下,癌症为初始癌症,或尚未经特定治疗剂治疗的癌症。在一些情况下,癌症为原发肿瘤或原发癌症,起源于其存在之位置或器官且并非自另一位置转移至该位置的肿瘤。在一些态样中,癌症为转移性癌症。在一些情况下,癌症为复发性或难治性癌症。
222.在一些情况下,肿瘤或癌症起源于血液、淋巴结、肝脏、脑/神经母细胞瘤、食道、气管、胃、肠、结肠、直肠、肛门、胰脏、喉、舌、骨、卵巢、子宫、子宫颈、腹膜、前列腺、睪丸、乳房、肾脏、肺,或皮肤、胃、结肠直肠、膀胱、头颈部、鼻咽、子宫内膜、胆管、口腔、多发性骨髓瘤、白血病、软组织肉瘤、胆囊、内分泌、间皮瘤、威尔姆斯肿瘤、十二指肠、神经内分泌、唾液腺、喉、绒膜癌、心脏、小肠、眼睛、生殖细胞癌症及其类似物。
223.在一些情况下,肿瘤或癌症包括(但不限于)急性淋巴母细胞白血病(all)、急性骨髓性白血病(laml或aml)、肾上腺皮质癌(acc)、aids相关癌症、aids相关淋巴瘤、肛门癌、附件癌、星形细胞瘤、非典型畸胎样/横纹肌样肿瘤、基底细胞癌、膀胱或膀胱尿道上皮癌(blca)、脑干神经胶质瘤、脑低级神经胶质瘤(lgg)、脑肿瘤(包括脑干神经胶质瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤、星形细胞瘤、颅咽管瘤、室管膜母细胞瘤、室管膜瘤、神经管胚细胞瘤、神经管上皮瘤、中分化松果体实质性肿瘤、小脑幕上原始神经外胚层肿瘤及松果体母细胞瘤)、乳房或脑侵入性癌症(brca)、支气管肿瘤、伯基特淋巴瘤、原发位点未知之癌症、类癌瘤、原发位点未知之癌瘤、中枢神经系统非典型畸胎样/横纹肌样肿瘤、中枢神经系统胚胎肿瘤;包括子宫颈鳞状细胞癌及子宫颈内腺癌(cesc)癌症、儿童期癌症、胆管癌(chol)、脊索瘤、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生病、结肠(腺癌)癌症(coad)、结肠直肠癌、颅咽管瘤、皮肤t细胞淋巴瘤、内
分泌胰脏胰岛细胞肿瘤、子宫内膜癌、室管膜母细胞瘤、室管膜瘤、食道癌(esca)、嗅神经母细胞瘤、尤文氏肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、胆囊癌、胃癌、胃肠类癌瘤、胃肠基质细胞肿瘤、胃肠基质肿瘤(gist)、妊娠期滋养层肿瘤、神经胶母细胞瘤多形神经胶质瘤(gbm)、毛细胞白血病、头颈癌(hnsd)、心脏癌症、霍奇金氏淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞肿瘤、卡波西肉瘤、肾脏癌症(包括肾脏嫌色细胞(kihc)肾脏肾透明细胞癌瘤(kirc)及肾脏肾乳头状细胞癌瘤(kirp))、兰格汉氏细胞组织细胞增多病、喉癌、唇癌、肝癌(包括肝脏肝细胞癌(lihc))、肺腺癌(luad)及肺鳞状细胞癌(lusc)、淋巴细胞性赘瘤弥漫性大b细胞淋巴瘤(dlbc)、恶性纤维组织细胞瘤骨癌、神经管胚细胞瘤、神经管上皮瘤、黑色素瘤、梅克尔细胞癌、梅克尔细胞皮肤癌、间皮瘤(meso)、原发不明的转移性鳞状颈癌、口癌、多发性内分泌赘瘤形成症候群、多发性骨髓瘤、多发性骨髓瘤/浆细胞赘瘤、蕈样真菌病、骨髓发育不良症候群、骨髓增生性赘瘤、鼻腔癌、鼻咽癌、神经母细胞瘤、非霍奇金氏淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、口部癌、口腔癌、口咽癌、骨肉瘤、其他脑及脊髓肿瘤、卵巢癌(诸如卵巢浆液性囊腺癌(ov)、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤)、胰脏癌(诸如胰脏腺癌(paad))、乳头状瘤症、副鼻窦癌、副甲状腺癌、骨盆癌、阴茎癌、咽癌、嗜铬细胞瘤及副神经节瘤(pcpg)、中分化松果体实质性肿瘤、松果体母细胞瘤、脑垂体肿瘤、浆细胞赘瘤/多发性骨髓瘤、胸膜肺母细胞瘤、原发中枢神经系统(cns)淋巴瘤、原发肝细胞肝癌、前列腺癌(诸如前列腺腺癌(prad))、直肠癌(诸如直肠腺癌(read))、肾癌、肾细胞(肾脏)癌症、肾细胞癌、呼吸道癌症、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌症、肉瘤(sarc)、塞扎莱症候群、表皮皮肤黑色素瘤(skcm)、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌(诸如胃腺癌(stad))、小脑幕上原始神经外胚层肿瘤、t细胞淋巴瘤、睪丸癌睪丸生殖细胞肿瘤(tgct)、咽喉癌、胸腺癌、胸腺瘤(thym)、甲状腺癌(thca)、移行细胞癌、肾盂及输尿管之移行细胞癌、滋养层肿瘤、输尿管癌、尿道癌、子宫癌、子宫癌(诸如子宫癌肉瘤(ucs)及子宫体子宫内膜癌(ucec))、葡萄膜黑色素瘤(uvm)、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症或威尔姆氏肿瘤。在一些实施方案中,癌症包含胃肠癌、癌症、肝细胞癌、肝癌、胃肠基质肿瘤(gist)、食道癌、胰脏癌或结肠直肠癌。
224.在一些情况下,癌症(例如原发肿瘤)包含急性淋巴母细胞白血病(all)、急性骨髓性白血病(aml)、膀胱癌、乳癌、脑癌、子宫颈癌、结肠癌、结肠直肠癌、子宫内膜癌、胃肠癌、神经胶质瘤、神经胶母细胞瘤、头颈癌、肾脏癌、肝癌、肺癌、淋巴细胞性赘瘤、黑色素瘤、骨髓赘瘤、卵巢癌、胰脏癌、前列腺癌、鳞状细胞癌、睪丸癌、胃癌或甲状腺癌。在一些情况下,癌症包括淋巴细胞性赘瘤、头颈癌、胰脏癌、子宫内膜癌、结肠或结肠直肠癌、前列腺癌、神经胶质瘤或其他脑/脊髓癌、卵巢癌、肺癌、膀胱癌、黑色素瘤、乳癌、骨髓赘瘤、睪丸癌、胃癌、子宫颈癌、肾脏癌、肝癌或甲状腺癌。在一些实施方案中,癌症类型包含急性淋巴母细胞白血病、急性骨髓性白血病、膀胱癌、乳癌、脑癌、子宫颈癌、胆管癌(chol)、结肠癌、结肠直肠癌、子宫内膜癌、食道癌、胃肠癌、神经胶质瘤、神经胶母细胞瘤、头颈癌、肾脏癌、肝癌、肺癌、淋巴细胞性赘瘤、黑色素瘤、骨髓赘瘤、卵巢癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、鳞状细胞癌、睪丸癌、胃癌或甲状腺癌。在一些实施方案中,癌症类型包含膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、胃癌或甲状腺癌。在一些情况下,癌症为all。在一些情况下,癌症为aml。在一些情况
下,癌症为脑癌。在一些情况下,癌症为结肠癌。在一些情况下,癌症为肺癌。在一些情况下,癌症为乳癌。在一些情况下,癌症为前列腺癌。在一些情况下,癌症为膀胱癌。在一些情况下,癌症为子宫颈癌。在一些情况下,癌症为胆管癌(chol)。在一些情况下,癌症为食道癌。在一些情况下,癌症为头颈癌。在一些情况下,癌症为肾脏癌。在一些情况下,癌症为肝癌。在一些情况下,癌症为胰脏癌。在一些情况下,癌症为嗜铬细胞瘤及副神经节瘤(pcpg)。在一些情况下,癌症为直肠癌。在一些情况下,癌症为肉瘤。在一些情况下,癌症为皮肤癌。在一些情况下,癌症为胃癌。在一些情况下,癌症为甲状腺癌。
225.在一些情况下,癌症为淋巴瘤。淋巴瘤系指免疫系统之一部分(称为淋巴系统)的癌症。其通常分为非霍奇金氏淋巴瘤及霍奇金氏淋巴瘤。
226.在一些情况下,癌症为淋巴细胞性赘瘤。如本文所用,淋巴细胞性赘瘤系指因b或t淋巴细胞发生恶性变化而产生的赘瘤且包括(不限于)任何类型的淋巴瘤。两种主要类型的淋巴瘤为霍奇金氏病及非霍奇金氏淋巴瘤。霍奇金病为相对单纯的疾病,仅包括四种主要类型。相比之下,非霍奇金氏淋巴瘤(nhl)为许多不同类型之淋巴癌所应有的术语,包括以下亚型;前驱b细胞淋巴瘤、小淋巴细胞性淋巴瘤/慢性淋巴细胞性白血病、边缘区淋巴瘤(结内边缘区淋巴瘤、结外malt、脾)、毛细胞白血病、滤泡性淋巴瘤、套细胞淋巴瘤、弥漫性大b细胞淋巴瘤、伯基特氏淋巴瘤、多形性大细胞淋巴瘤、周边t细胞淋巴瘤及蕈样真菌病。在一些实施方案中,与非霍奇金氏淋巴瘤不严格相关、但本文中所包括的其他淋巴细胞性赘瘤包含急性淋巴母细胞白血病、淋巴浆细胞样淋巴瘤、t细胞慢性淋巴细胞性白血病/前淋巴细胞性白血病,及不容易分类之具有淋巴细胞源之任何其他癌症。
227.在一些情况下,癌症为头颈癌。头颈癌为一组生物学类似癌症,其始于上呼吸消化道,包括唇、口腔(口)、鼻腔(鼻内)、鼻窦、咽及喉。90%的头颈癌为鳞状细胞癌(scchn),其起源于此等区域的黏膜内层(上皮)。头颈部鳞状细胞癌(hnscc)占头颈癌的绝大部分,且起因于整个此解剖学区域之黏膜表面。此等包括鼻腔、鼻窦、口腔、鼻咽、口咽、下咽及喉之肿瘤。
228.在一些情况下,癌症为胰脏癌或胰腺癌。胰脏癌来源于胰脏细胞,包括(但不限于)腺癌、腺鳞癌、印戒细胞癌、肝样癌瘤、胶质癌瘤、未分化癌瘤、破骨细胞样巨细胞之未分化癌瘤及胰岛细胞癌瘤。
229.在一些情况下,癌症为子宫内膜癌。子宫内膜癌为子宫内层(子宫内膜)产生的恶性疾病。该术语系指(但不限于)子宫内膜癌瘤及子宫内膜腺癌。如本文所用,子宫内膜癌亦包括其他熟知的细胞类型,诸如乳头状浆液性癌瘤、透明细胞癌瘤、乳头状子宫内膜样癌瘤及黏液性癌瘤。
230.在一些情况下,癌症为结肠癌,亦称为结肠直肠癌或肠癌。结肠癌系指大肠(结肠)或直肠(结肠末端)中产生的恶性疾病,且结肠、直肠及附件中之癌症生长,包括腺癌。结肠直肠癌之前为腺瘤(起源于上皮之赘瘤),其来源于腺组织或展现明确界定之腺结构。
231.在一些情况下,癌症为前列腺癌。前列腺癌描述起源于前列腺腺体之不可控(恶性)细胞生长。
232.在一些情况下,癌症为肾脏癌,亦称为肾癌。肾脏癌为其中肾脏细胞变成恶性(癌变)且生长无法控制、从而形成肿瘤的疾病。最常见的肾脏癌首先出现于肾脏之微小管(小管)之内层中,其为肾细胞癌。
233.在一些情况下,癌症为甲状腺癌。甲状腺癌系指起源于滤泡性或旁滤泡性甲状腺细胞的癌症。
234.在一些情况下,癌症为神经胶质瘤。神经胶质瘤系指起始于脑或脊椎中且由神经胶质细胞及/或其前驱体引起的癌症类型,包括室管膜瘤(来源于室管膜细胞的神经胶质瘤)、星形细胞瘤(来源于星形胶质细胞的神经胶质瘤,包括多形性胶质母细胞瘤甲状腺瘤、寡突神经胶质细胞瘤(来源于寡突神经胶质细胞的神经胶质瘤)及混合型神经胶质瘤,诸如寡突星形细胞瘤(来源于不同类型之神经胶质的细胞))。
235.在一些情况下,癌症为卵巢癌。卵巢癌为一组起源于卵巢的肿瘤且包括(不限于)浆液性卵巢癌、非侵入性卵巢癌、混合表型卵巢癌、黏液性卵巢癌、子宫内膜样卵巢癌、透明细胞卵巢癌、乳头状浆液性卵巢癌、勃伦那细胞(brenner cell)及未分化腺癌。
236.在一些情况下,癌症为肺癌。肺癌系指肺组织中的任何不可控之细胞生长,包括(但不限于)小细胞肺癌瘤、组合型小细胞癌瘤、非小细胞肺癌、肉瘤样癌瘤、唾液腺肿瘤、类癌瘤、腺鳞状癌瘤、胸膜肺母细胞瘤及类癌瘤。
237.在一些情况下,癌症为膀胱癌。膀胱癌系指若干种类型之膀胱恶性生长中的任一者且包括(不限于)移行细胞癌、鳞状细胞癌、腺癌、肉瘤及小细胞癌瘤。
238.在一些情况下,癌症为黑色素瘤。黑色素瘤系指起始于黑色素细胞的任何癌症形式。黑色素瘤包括(但不限于)以下亚型:恶性雀斑样痣、恶性雀斑样痣黑色素瘤、浅表扩散性黑素瘤、肢端雀斑样黑色素瘤、黏膜黑色素瘤、结节性黑色素瘤、息肉样黑色素瘤、促结缔组织增生性黑色素瘤、无黑色素黑色素瘤、软组织黑色素瘤及转移性黑色素瘤。
239.在一些情况下,癌症为乳癌。通常使用乳癌或恶性乳房赘瘤作为起源于乳房组织、最常起源于乳管之内层或供乳导管之小叶之癌症的通用名称。根据其受体状态(如免疫组织化学所侦测),详言之,根据雌激素受体(er)、孕酮受体(pr)之存在或不存在及根据her2/neu之表达量(正常表达/表达不足相对于过度表达),乳癌可分成er阳性(er )乳癌、er阴性(er

)乳癌、pr阳性(pr )乳癌、pr阴性(pr

)乳癌、her2阳性(her2 )乳癌(过度表达her2的癌症)、her2阴性(her2

)乳癌(her2表达量正常或her2表达不足或her2表达量不可侦测的癌症)、激素受体阴性乳癌(亦即,既无雌激素受体、亦无孕酮受体的乳癌(缩写为er

/pr

乳癌));及三阴性乳癌,亦即,既无雌激素受体、亦无孕酮受体且her2之表达正常/表达不足(或缺乏可侦测之表达量)的乳癌(缩写为er

/pr

/her2

乳癌)。根据其基因表达型态,乳癌在一些情况下分成管腔a亚型乳癌、管腔b亚型乳癌、正常样乳癌、her2 乳癌及基底样乳癌(sorlie等人(2001)proc.nat.acad.sci.98:10869

10874)。管腔a亚型及b亚型基本上呈er阳性。相比之下,her2 乳癌显示与her2扩增子相关之基因之高表达增强且正常样乳癌具有正常乳房组织之共同分子特征。
240.在一些情况下,癌症为骨髓赘瘤。骨髓赘瘤包括骨髓谱系之细胞的癌症,例如来源于颗粒球(例如嗜中性球、嗜伊红血球及嗜碱性血球)或单核细胞的骨髓(骨髓细胞性或骨髓性)白血病。在一些实施方案中,骨髓赘瘤包括慢性骨髓细胞性白血病、急性骨髓细胞性白血病、慢性嗜中性球白血病、慢性嗜伊红血球白血病及脊髓发育不良症候群。
241.在一些情况下,癌症为睪丸癌。睪丸癌为睾丸癌症。在一些实施方案中,睪丸癌包括(但不限于)恶性癌症,诸如精原细胞瘤、非精原细胞瘤、绒膜癌、胚胎癌瘤、不成熟畸胎瘤、卵黄囊肿瘤、雷迪格及塞特利氏细胞肿瘤(leydig and sertoli cell tumors)、pnet、
平滑肌肉瘤、横纹肌肉瘤及间皮瘤。
242.在一些情况下,癌症为胃癌。胃肿瘤或胃癌系指胃之任何肿瘤或癌症,包括例如腺癌(诸如弥漫型及肠型),及不太流行的形式,诸如淋巴瘤、平滑肌肉瘤及鳞状细胞癌。其他方法
243.在特定实施方案中,本文所提供的内容包括测定患者出现癌症之风险的方法。生物标志物甲基化百分比、量或型态表征不同风险状态,例如高、中或低风险。出现癌症的风险如下测定:量测相关生物标志物的甲基化状态,接着将其提交给分类算法或将其与参考量(亦即,与特定风险级别相关之甲基化(及/或未甲基化)生物标志物之预定义含量或型态)进行比较。测定癌症严重度
244.在另一个实施方案中,本文所提供的内容包括用于测定患者癌症之严重度的方法。癌症之特定阶段或严重度可具有生物标志物之高甲基化或低甲基化之特征水平或一组生物标志物(型态)之相对高甲基化或低甲基化程度。在一些情况下,癌症严重度如下测定:量测相关生物标志物的甲基化状态,接着将其提交给分类算法或将其与参考量(亦即,与特定阶段相关之甲基化生物标志物之预定义甲基化程度或型态)进行比较。
245.在一些实施方案中,利用选自表15、16、17、18及/或20的一种或多种生物标志物测定患者癌症之严重度。在一些情况下,利用选自表15的一种或多种生物标志物测定患者癌症之严重度。在一些情况下,使用选自表16的一种或多种生物标志物测定患者癌症之严重度。在一些情况下,使用选自表17的一种或多种生物标志物测定患者癌症之严重度。在一些情况下,使用选自表18的一种或多种生物标志物测定患者癌症之严重度。
246.在一些情况下,使用选自以下的一种或多种生物标志物测定患者癌症之严重度:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、
cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
247.在一些情况下,使用选自以下的一种或多种生物标志物测定患者癌症之严重度:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044
(表20)。
248.在一些情况下,使用选自cg25574765、cg25490145、cg18384097、cg25922751及cg17126555的一种或多种生物标志物测定患者癌症之严重度。判定癌症预后
249.在一个实施方案中,本文所提供的内容包括判定患者癌症之病程的方法,癌症病程系指癌症状态随时间发生的变化,包括癌症进展(恶化)及癌症消退(改善)。随时间,生物标志物甲基化的量或相对量(例如型态)发生变化。举例而言,生物标志物「x」及「y」之高甲基化或低甲基化在癌症之一些情况下增加。因此,此等生物标志物相对于癌症或非癌症之倾向(随时间增加或减少的甲基化)指示疾病之病程。因此,此方法包括在至少两个不同时间点(例如第一次及第二次)量测患者中之一种或多种生物标志物之甲基化程度或状态及比较变化(若存在)。癌症病程系基于此等比较来判定。
250.在一些实施方案中,利用选自表15、16、17、18及/或20的一种或多种生物标志物判定患者癌症之病程,癌症病程系指癌症状态随时间发生的变化,包括癌症进展(恶化)及癌症消退(改善)。在一些情况下,使用选自表15的一种或多种生物标志物判定患者癌症之病程,癌症病程系指癌症状态随时间发生的变化,包括癌症进展(恶化)及癌症消退(改善)。在一些情况下,使用选自表16的一种或多种生物标志物判定患者癌症之病程,癌症病程系指癌症状态随时间发生的变化,包括癌症进展(恶化)及癌症消退(改善)。在一些情况下,使用选自表17的一种或多种生物标志物判定患者癌症之病程,癌症病程系指癌症状态随时间发生之变化,包括癌症进展(恶化)及癌症消退(改善)。在一些情况下,使用选自表18的一种或多种生物标志物判定患者癌症之病程,癌症病程系指癌症状态随时间发生的变化,包括癌症进展(恶化)及癌症消退(改善)。
251.在一些情况下,使用选自以下的一种或多种生物标志物判定患者癌症之病程:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、
cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930,癌症病程系指癌症状态随时间发生的变化,包括癌症进展(恶化)及癌症消退(改善)。
252.在一些情况下,使用选自以下的一种或多种生物标志物判定患者癌症之病程:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、
cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20),癌症病程系指癌症状态随时间发生的变化,包括癌症进展(恶化)及癌症消退(改善)。
253.在一些情况下,使用选自cg25574765、cg25490145、cg18384097、cg25922751及cg17126555之一种或多种生物标志物判定患者癌症之病程,癌症病程系指癌症状态随时间发生的变化,包括癌症进展(恶化)及癌症消退(改善)。患者管理
254.在鉴定癌症状态之方法的某些实施方案中,该等方法进一步包含基于状态来管理患者疗法。此类管理包括医师或临床医师在判定癌症状态之后的行动。举例而言,若医师对癌症作出诊断或预后,则依循特定监测方案。使用本发明的方法评估癌症病程则需要特定的癌症治疗方案。或者,诊断非癌症之后,进一步测试以判定患者罹患的特定疾病。视情况,若诊断测试产生的关于癌症状态之结果不确定,则需要进一步测试。
255.在一些实施方案中,利用选自表15、16、17、18及/或20的一种或多种生物标志物鉴定癌症状态。在一些情况下,使用选自表15的一种或多种生物标志物鉴定癌症状态。在一些情况下,使用选自表16的一种或多种生物标志物鉴定癌症状态。在一些情况下,使用选自表17的一种或多种生物标志物鉴定癌症状态。在一些情况下,使用选自表18的一种或多种生物标志物鉴定癌症状态。
256.在一些情况下,使用选自以下的一种或多种生物标志物鉴定癌症状态:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、
cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
257.在一些情况下,使用选自以下的一种或多种生物标志物鉴定癌症状态:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20)。
258.在一些情况下,使用选自cg25574765、cg25490145、cg18384097、cg25922751及
cg17126555的一种或多种生物标志物鉴定癌症状态。判定医药之治疗功效
259.在另一个实施方案中,本文所提供的内容包括判定医药之治疗功效的方法。此等方法适用于实施临床药物试验以及监测患者服用药物后之进展。
260.疗法或临床试验包括依特定疗程投与药物。在一些情况下,疗程包括单次给与药物或随时间多次给与药物。在投药过程中,医生或临床研究人员监测药物对患者或个体的作用。若药物对病状具有药理学影响,则改变本发明之一种或多种生物标志物之高甲基化或低甲基化的量或相对量(例如型态或图谱)以接近非癌症图谱。
261.在一些情况下,在治疗过程中,追踪患者中之一种或多种生物标志物之甲基化状态的过程。因此,此方法包括量测接受药物疗法之患者中之一种或多种生物标志物的甲基化程度,及使该等程度与患者之癌症状态相关联(例如藉由与对应于不同癌症状态之生物标志物的预定义甲基化程度比较)。此方法的一个实施方案包括在药物疗法过程中的至少两个不同时间点(例如第一时间及第二时间)测定一种或多种生物标志物的甲基化程度及比较生物标志物之甲基化程度发生的变化(若存在)。举例而言,在投与药物之前及之后或在药物投与期间的两个不同时间点量测一种或多种生物标志物之甲基化程度。基于此等比较来判定疗效。若治疗有效,则一种或多种生物标志物的甲基化状态倾向于正常;而若疗法无效,则一种或多种生物标志物的甲基化状态倾向于癌症指示。
262.在一些实施方案中,利用选自表15、16、17、18及/或20的一种或多种生物标志物测定医药的治疗功效。在一些情况下,使用选自表15的一种或多种生物标志物测定医药的治疗功效。在一些情况下,使用选自表16的一种或多种生物标志物测定医药的治疗功效。在一些情况下,使用选自表17的一种或多种生物标志物测定医药的治疗功效。在一些情况下,使用选自表18的一种或多种生物标志物测定医药的治疗功效。
263.在一些情况下,使用选自以下的一种或多种生物标志物判定医药的治疗功效:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、
cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231及cg26017930。
264.在一些情况下,使用选自以下的一种或多种生物标志物判定医药的治疗功效:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、
cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244及cg00025044(表20)。
265.在一些情况下,使用选自cg25574765、cg25490145、cg18384097、cg25922751及cg17126555的一种或多种生物标志物判定医药的治疗功效。产生分类算法用于鉴定癌症状态
266.在一些实施方案中,使用一种型态识别方法分析与潜在诊断问题相关之生物标志物组之标志物的所量测甲基化值。在一些情况下,型态识别方法包含甲基化程度之线性组合或甲基化程度之非线性组合,以提取自未展现疾病证据、展现全身性癌症或展现生物化学复发之患者获得生物样品的机率,以及区分此等疾病病况及类型,尤其原发肿瘤类型。在一些情况下,以机器可读形式提供模型及/或算法,且其用于使甲基化程度或甲基化图谱与疾病病况相关联,及/或指示患者或患者类别之治疗模式。
267.在一些实施方案中,分析复数个标靶的甲基化程度包含使用算法或分类法。使用此项技术中已知且本文所述之技术对阵列数据进行管理、分类及分析。在一些情况下,分析复数个标靶的甲基化含量包含探针组模型建立及数据预处理。在一些情况下,探针组模型建立及数据预处理系使用稳定多阵列(robust multi

array;rma)算法或变数gc

rma、rma、探针对数强度误差(probe logarithmic intensity error;plier)算法或变数iterplier。使用rma算法,对处理前资料应用方差或强度过滤法,例如藉由分别移除标准偏差<10或平均强度<归一化数据范围之100个强度单位的标靶序列。
268.在一些实施方案中,使用样品(诸如「已知样品」或「对照」)产生的数据接着用于「训练」分类模型。「已知样品」为已预分类的样品,诸如来自非病变或非癌症「正常」样品的适合对照(例如生物标志物)及/或来自已知肿瘤组织类型或阶段或癌症状态的适合对照(例如生物标志物)。用于形成分类模型的数据称为「训练数据集」。在一些情况下,用于形成分类模型的训练数据集包含原始数据或经预处理的数据。一经训练,分类模型识别使用未知样品所产生之数据的型态。在一些情况下,接着使用分类模型将未知样品分类。此适用于例如预测特定生物样品是否与特定生物学状况(例如病变相对于非病变)相关。
269.模型一经构筑且验证,即将其封装以便最终使用者可接取。举例而言,此包括建构电子表格应用程序,或视觉呈现的替代形式(其中已嵌入模型)、统计学软件包之脚本处理,或由信息技术人员将模型重构成硬编码应用程序。
270.在一些实施方案中,分类模型形成于且用于任何适合的数字计算机上。适合的数字计算机包括使用任何标准或特定操作系统(诸如基于unix、或linux
tm
的操作系统)的微电脑、小型计算机或大型计算机。在使用质谱仪的实施方案中,所用数字计算机在物理上与用于产生所关注之光谱的质谱仪分离,或其与质谱仪耦接。
271.根据本发明实施方案的训练数据集及分类模型系藉由数字计算机执行或使用的计算机代码实施。计算机代码储存于任何适合的计算机可读介质上,包括光盘或磁盘、棒、带等,且可以任何适合的计算机程序设计语言(包括r、c、c 、visual basic等)书写。
272.上述学习算法适用于开发已发现之生物标志物的分类算法,及用于发现新的生物标志物。对于单个使用或组合使用的生物标志物而言,分类算法又藉由提供诊断值(例如截止点)而形成诊断测试的基础。
计算机系统、平台及程序
273.在一些态样中,本文所述之内容系关于一种计算机系统或平台,其具备用于实施本文所述之一种或多种方法的构件。在一些实施方案中,计算机系统包括:(a)至少一种内存,其含有至少一种经调适可控制计算机系统操作以实现包括以下之方法的计算机程序:(i)接收dna甲基化数据,例如cup之甲基化图谱及一种或多种原发性肿瘤之甲基化图谱;(ii)测定cup之甲基化图谱与原发性肿瘤之甲基化图谱之间之一致性程度及(b)至少一种用于执行计算机程序的处理器。在一些实施方案中,平台包含一种或多种计算机系统。
274.本文所述之另一态样系关于用于控制计算机系统以执行根据本文所述之一种或多种方法之步骤的计算机程序。
275.在一些实施方案中,计算机系统系指具有计算机之系统,其中计算机包含含有可操作计算机之软件的计算机可读介质。在一些情况下,计算机系统包括一或多个通用或专用处理器及相关内存,包括挥发性及非挥发性内存装置。在一些情况下,计算机系统内存储存用于控制计算机系统操作的软件或计算机程序以产生本发明之专用系统或建构执行本发明之方法的系统。在一些情况下,计算机系统包括基于单核或多核中央处理单元(cpu)、arm处理器或类似计算机处理器的intel或amd x86用于处理数据。在一些情况下,cpu或微处理器为任何习知的通用单芯片或多芯片微处理器,诸如intel pentium处理器、intel 8051处理器、risc或miss处理器、power pc处理器或alpha处理器。在一些情况下,微处理器为任何习知或专用微处理器,诸如数字信号处理器或图形处理器。微处理器典型地具有习知地址线、习知数据线及一或多个习知控制线。如下文所述,本发明之软件系用专用系统或具有dos、cpm、windows、unix、linix或其他操作系统的通用计算机执行。在一些情况下,系统包括非挥发性内存,诸如用于储存计算机程序、软件及数据的记忆碟及固态内存,以及挥发性内存,诸如用于执行程序及软件的高速ram。
276.在一些实施方案中,计算机可读介质系指用于储存可由计算机存取之数据的任何储存装置,以及用于可由计算机存取数据的任何其他构件。储存装置型计算机可读介质之实例包括:硬磁盘;软磁盘;光盘,诸如cd

rom及dvd;磁带;内存芯片。适用于本发明之各种实施方案中的计算机可读物理储存媒体可包括任何计算机可读物理储存媒体,例如固态内存(诸如闪存)、磁性及光学计算机可读储存媒体及装置,及使用其他持久性储存技术的内存。在一些实施方案中,计算机可读介质为允许计算机程序及数据由计算机存取的任何有形媒体。计算机可读介质可包括以任何方法或技术建构的挥发性及非挥发性、可拆式及不可拆式有形媒体,其能够储存信息,诸如计算机可读指令、程序模块、程序、数据、数据结构及数据库信息。在本发明的一些实施方案中,计算机可读介质包括(但不限于)ram(随机存取内存)、rom(只读存储器)、eprom(可擦除可程序化只读存储器)、eeprom(电可擦除可程序化只读存储器)、闪存或其他内存技术、cd

rom(光盘只读存储器)、dvd(数字多功能光盘)或其他光学储存媒体、磁性卡匣、磁带、磁盘储存或其他磁性储存媒体、其他类型之挥发性及非挥发性内存,以及可用于储存信息且可由计算机阅读的任何其他有形媒体,包括前述者之任何适合组合。
277.在一些情况下,本文所述之一种或多种方法系用单独计算机或作为网络化计算机系统或计算平台的一部分实施。在单独计算机中,所有软件及数据可存在于局部内存装置上,例如可用于储存供实施本发明以及数据用之计算机软件的光盘或闪存装置。在替代实
施方案中,软件或数据或两者可经由连接至远程装置的网络存取。在一个网络化计算机系统或计算平台实施方案中,本发明使用公用网络上的客户

服务器环境,诸如连接至远程位置及/或中央位置所储存之数据及资源的因特网或专用网络。在此实施方案中,包括网站服务器的服务器可提供根据本发明所提供之信息的存取(开放式存取、随收随付制或基于预订之存取)。在客户服务器环境中,执行客户软件或程序(诸如网络浏览器)的客户计算机经网络连接至服务器。客户软件或网络浏览器向本发明之用户提供用户接口以输入数据及信息及接受数据及信息的存取。在一些情况下,客户软件系在局部计算机显示器或其他输出装置上检视且可允许用户输入信息,诸如藉由使用计算机键盘、鼠标或其他输入设备来输入信息。服务器执行一种或多种允许客户软件输入数据、根据本发明之处理数据及将数据输出给用户以及可存取局部及远程计算机资源的计算机程序。举例而言,用户接口可包括图形用户接口,其包含存取组件(诸如文本框),其允许输入分析数据(例如参考多能干细胞群及/或所关注之多能干细胞群中之标靶基因的dna甲基化程度资料或dna基因表达量);以及显示组件,其可提供读出图形作为与计分卡之比较结果,或在执行计算机可读介质所编码之指令之后,传输至处理器或可供处理器使用的数据集。如本文所用,术语「软件」可与「程序」互换使用且系指可操作计算机的指定规则。软件之实例包括:软件;码段;指令;计算机程序;及程序化逻辑。
278.在一些实施方案中,作为参考文献使用的原发性肿瘤甲基化图谱可以电子或数字方式记录、注释及自数据库检索,数据库包括(但不限于)genbank(ncbi)蛋白质及dna数据库,诸如基因组、ests、snps、traces、celara、ventor读数、watson读数、hgts等;瑞士生物信息研究所(swiss institute of bioinformatics)数据库,诸如enzyme、prosite、swiss

2dpage、swiss

prot及trembl数据库;melanie软件包或expasy www服务器等,swiss

model、swiss

shop及其他基于网络之计算工具;全面微生物资源数据库(基因组研究所(the institute of genomic research))。在一些情况下,所得信息储存于关系数据库中,该关系数据库用于判定基因组内及基因组之间的参考数据或基因或蛋白质之间的同源性。
279.在一些实施方案中,系统对「比较模块」中的数据进行比较,该模块使用多种可利用软件程序及格式进行比较性操作以对判定模块中所测定之序列信息与参考数据进行比较。在一个实施方案中,比较模块设置为可使用图形识别技术对来自一或多个输入项的序列信息与一种或多种参考数据型态进行比较。比较模块可使用现有市售或自由可得的型态比较软件加以设置,且可针对所执行的特定数据比较进行优化。比较模块亦可提供与序列信息有关的计算机可读信息,可包括例如侦测dna序列中之cpg甲基化位点的存在或不存在;测定甲基化程度。
280.在一些实施方案中,比较模块提供计算机可读的比较结果,其可根据预定义标准或使用者定义的标准、以计算机可读形式处理,以提供报导,该报导包含部分地基于比较结果的内容,该内容可储存且经用户请求可使用显示模块输出。在一些实施方案中,显示模块能够向用户显示部分地基于比较结果之内容,其中该内容为指示所关注之cup之甲基化图谱与肿瘤细胞之甲基化图谱之比较结果的报导。
281.在一些实施方案中,显示模块能够向最终用户显示部分地基于比较结果之报导或内容,其中该内容为指示cup之甲基化图谱与所选原发性肿瘤之甲基化图谱之比较结果的报导。在本发明之此态样及所有其他态样的一些实施方案中,比较模块或本发明之任何其
他模块可包括操作系统(例如unix、windows),在操作系统上运作关系数据库管理系统、全球信息网应用程序及全球信息网服务器。全球信息网应用程序可包括产生数据库语言语句[例如标准查询语言(sql)语句]所需的可执行码。可执行码可包括嵌入型sql语句。另外,全球信息网应用程序可包括设置档案,其含有各种软件实体(包含服务器以及必须存取的各种外部及内部数据库以服务于用户请求)的指针及地址。若服务器分布于两个或超过两个各别计算机,则设置档案可根据需要亦将对服务器资源的请求导向适当硬件。在一个实施方案中,全球信息网服务器支持tcp/ip协议。局部网络(诸如此局部网络)有时被称作「内部网络」。此类内部网络之优点在于,其容易与存在于全球信息网(例如genbank或瑞士pro全球信息网网站)上的公共领域数据库(诸如癌症基因组图谱(the cancer genome atlas;tcga)或国际癌症基因组联盟(international cancer genome consortium;icgc)及其类似数据库)通信。因此,在本发明的一个特定实施方案中,用户使用由网络浏览器及网络服务器提供的html接口可直接存取存在于因特网数据库上的数据(经由例如hypertext链路)。在本发明之其他实施方案中,可使用其他接口(诸如基于http、ftp、ssh及vpn的接口)连接至因特网数据库。
[0282]
在一些情况下,计算机指令系以软件、韧体或硬件建构且包括由信息处理系统之模块执行之任何类型的程序化步骤。在一些情况下,计算机系统连接至局域网络(lan)或广域网(wan)。局域网络之一个实例可为公司计算网络,包括对包含数据处理系统之计算机及计算装置所连接之因特网的存取。在一个实施方案中,lan使用行业标准传输控制协议/因特网协议(transmission control protocol/internet protocol;tcp/ip)网络通信协议。传输控制协议(tcp)可用作传输层协议以提供计算机系统之间的连接取向之可靠传输层连接。网络层向传输层提供服务。使用双向交握方案,tcp提供建立、维持及端接计算机系统之间之逻辑连接的机制。tcp传输层使用ip作为其网络层协议。另外,tcp藉由包括各讯息的目标及源端口编号来提供协议端口以区分在单个装置上执行的多个程序。tcp执行诸如以下功能:传输字节流、数据流定义、数据确认、失去或破坏数据再传输,及经由单一网络连接进行的多任务多连接。最后,tcp负责将信息封装成数据块结构。在替代实施方案中,lan可符合其他网络标准,包括(但不限于)国际标准化组织(international standards organization)的开放系统互连(open systems interconnection)、ibm的sna、novell的netware及banyan vines。
[0283]
在一些实施方案中,比较模块提供计算机可读数据,计算机可读数据可以计算机可读形式根据预定义标准或使用者定义的标准处理以提供所检索的内容,该检索内容可储存且经用户请求可使用显示模块输出。根据本发明之一些实施方案,计算机化系统可包括或可操作地连接至显示模块,诸如计算机监视器、触摸屏或视讯显示系统。显示模块可将用户指令呈现给系统用户、检视系统输入及系统将结果作为用户接口的一部分显示给用户。视情况,计算机化系统可包括或操作性地连接至印刷装置以便产生系统之信息输出的印刷复本。
[0284]
在一些实施方案中,可使用全球信息网浏览器提供用户接口以允许用户与系统相互作用以输入信息、建构请求及显示检索内容。另外,系统的各种功能模块可经调适以使用网络浏览器提供用户接口。用户使用网络浏览器可建构检索数据源(诸如数据库)之数据的请求,且与比较模块相互作用以执行比较及型态匹配。用户可点击及单击用户接口组件,诸
如按钮、下拉式菜单、滚动条等,其习知用于图形用户接口中与系统相互作用且促使系统执行本发明之方法。经用户网络浏览器制订的请求可经网络传输至网络应用程序,该网络应用程序可处理或格式化请求以向可用于提供与dna甲基化程度及基因表达量、所检索内容相关之中肯信息的一种或多种数据库产生查询,处理此信息且输出结果。服务器
[0285]
在一些实施方案中,本文所提供之方法在服务器或计算机服务器上处理(图2)。在一些实施方案中,服务器401包括中央处理单元(cpu,亦称「处理器」)405,其为单核处理器、多核处理器或复数个用于平行处理之处理器。在一些实施方案中,作为控制总成之一部分使用的处理器为微处理器。在一些实施方案中,服务器401亦包括内存410(例如随机存取内存、只读存储器、闪存);电子储存单元415(例如硬盘);与一种或多种其他系统通信的通信接口420(例如网络转接器);及周边装置425,包括高速缓存、其他内存、数据储存及/或电子显示器转接器。内存410、储存单元415、接口420及周边装置425经由诸如母板之通信总线(实线)与处理器405通信。在一些实施方案中,储存单元415为用于储存数据之数据储存单元。服务器401藉助于通信接口420、可操作地与计算机网络(「网络」)430耦接。在一些实施方案中,藉助于其他硬件之处理器亦可操作地与网络耦接。在一些实施方案中,网络430为因特网、内部网络及/或商际网络、与因特网通信之内部网络及/或商际网络、电信或数据网络。在一些实施方案中,网络430藉助于服务器401实施同级间网络,从而使得与服务器401耦接的装置能够表现得如同客户或服务器。在一些实施方案中,服务器能够经网络430传输之电子信号传输及接收计算机可读指令(例如装置/系统操作协议或参数)或数据(例如传感器量测值、获自侦测代谢物之原始数据、获自侦测代谢物之原始数据的分析、获自侦测代谢物之原始数据的说明等)。此外,在一些实施方案中,网络用于例如跨国界传输或接收数据。
[0286]
在一些实施方案中,服务器401与一种或多种输出装置435(诸如显示器或打印机)及/或与一种或多种输入设备440(诸如键盘、鼠标或操纵杆)通信。在一些实施方案中,显示器为触摸屏显示器,在此情况下,其充当显示设备与输入设备。在一些实施方案中,存在不同及/或其他输入设备,诸如发声器、扬声器或麦克风(microphone)。在一些实施方案中,服务器使用多种操作系统中的任一者,诸如或或或若干版本中之任一者。
[0287]
在一些实施方案中,储存单元415储存与操作本文所述之装置、系统或方法有关之档案或数据。
[0288]
在一些实施方案中,服务器经由网络430与一或多个远程计算机系统通信。在一些实施方案中,一或多个远程计算机系统包括例如个人计算机、膝上型计算机、平板计算机、电话、智能电话或个人数字助理。
[0289]
在一些实施方案中,控制总成包括单个服务器401。在其他情况中,系统包括彼此间经由内部网络、商际网络及/或因特网通信之多个服务器。
[0290]
在一些实施方案中,服务器401经调适可储存本文所述之装置操作参数、协议、方法及其他潜在相关信息。在一些实施方案中,此类信息储存在储存单元415或服务器401上且此类数据经由网络传输。试剂盒及制品
[0291]
在另一态样中,本发明提供用于侦测及/或表征癌症状态及/或产生cpg甲基化图谱数据库的试剂盒,其中该试剂盒包含复数个引物或探针以侦测或量测本文所述之一种或多种样品中的甲基化状态/程度。在一些情况下,此类试剂盒包含至少一种与本发明之甲基化生物标志物序列中的至少一者杂交的聚核苷酸及至少一种用于侦测基因甲基化的试剂。用于侦测甲基化的试剂包括例如硫酸氢钠、为了与作为标志物序列之产物的序列杂交所设计的聚核苷酸(若标志物序列未发生甲基化(例如含有至少一种c

u转化)),及/或甲基化敏感性或甲基化依赖性限制酶。在一些情况下,试剂盒以经调适可用于分析中之分析设备形式提供固体载体。在一些情况下,试剂盒进一步在试剂盒中包含视情况连接至聚核苷酸(例如探针)的可侦测标志物。
[0292]
在一些实施方案中,本发明之试剂盒包含一种或多种(例如1、2、3、4或超过4种)不同聚核苷酸(例如引物及/或探针),其能够特异性地扩增本发明生物标志物之dna区域的至少一部分。在一些情况下,试剂盒包含探针组,其中该探针组内之各探针与seq id no:1

1775之探针具有约60%

99%序列同一性。视情况,试剂盒中亦包括能够与所扩增部分杂交的一种或多种以可侦测方式经标记之多肽。在一些实施方案中,试剂盒包含足以扩增2、3、4、5、6、7、8、9、10或超过10个不同dna区域或其一部分的引物,且视情况包括能够与所扩增之各dna区域或其一部分杂交的以可侦测方式经标记之聚核苷酸。试剂盒进一步可包含甲基化依赖性或甲基化敏感性限制酶及/或亚硫酸氢钠。
[0293]
在一些实施方案中,试剂盒包含亚硫酸氢钠、全基因组扩增用的引物及接附子(例如可连接或以其他方式连接至基因组片段的寡核苷酸),以及聚核苷酸(例如以可侦测方式经标记之聚核苷酸)以量化本发明生物标志物之dna区域中之至少一个胞嘧啶之转化甲基化及转化未甲基化序列的存在。
[0294]
在一些实施方案中,试剂盒包含甲基化敏感性限制酶(例如甲基化依赖性限制酶及/或甲基化敏感性限制酶)、全基因组扩增用的引物及接附子,以及量化本发明生物标志物之dna区域之至少一部分之复本数目的聚核苷酸。
[0295]
在一些实施方案中,试剂盒包含甲基化结合部分及一种或多种聚核苷酸以量化本发明生物标志物之dna区域之至少一部分的复本数目。甲基化结合部分系指特异性结合至甲基

胞嘧啶的分子(例如多肽)。
[0296]
实例包括缺乏dna切割活性、但保持结合甲基化dna之能力的限制酶或其片段、特异性结合至甲基化dna的抗体等。
[0297]
在一些实施方案中,试剂盒包括封装材料。如本文所用,术语「封装材料」可指容纳试剂盒之组件的物理结构。在一些情况下,封装材料维持试剂盒组件之无菌性,且由常用于此类目的之材料(例如纸、波纹状纤维、玻璃、塑料、箔、安瓿等)制成。试剂盒中包括适用于执行分析的其他材料,包括试管、转移吸液管及其类似物。在一些情况下,试剂盒亦包括在本文所述之任一种分析中使用一种或多种此等试剂的书面说明书。
[0298]
在一些实施方案中,试剂盒亦包括缓冲液、防腐剂或蛋白质/核酸稳定剂。在一些情况下试剂盒亦包括如本文所述之反应混合物中的其他组分。举例而言,试剂盒包括如本文所述之热稳定性dna聚合酶的一或多个等分试样,及/或dntp的一或多个等分试样。在一些情况下,试剂盒亦包括含有基因座之个别等位基因之模板dna分子的已知量之对照样品。在一些实施方案中,试剂盒包括阴性对照样品,例如不含含有基因座之个别等位基因之dna
分子的样品。在一些实施方案中,试剂盒包括阳性对照样品,例如含有已知量之基因座之一种或多种个别等位基因的样品。某些术语
[0299]
除非另有定义,否则本文所用之所有技术及科学术语具有与熟习所主张之目标物所属技术者通常所了解相同之含义。应了解,以上一般描述及以下详细描述仅具例示性及解释性且不限制所主张之任何目标物。在本技术中,除非另有特定陈述,否则单数之使用包括复数。必须指出,除非上下文另有明确规定,否则如本说明书及随附权利要求书中所使用,单数形式「一(a)」、「一(an)」及「该」包括复数个指示物。在本技术中,除非另有陈述,否则「或」之使用意谓「及/或」。此外,术语「包括(including)」以及其他形式(诸如「包括(include)」、「包括(includes)」及「包括(included)」)之使用不具限制性。
[0300]
如本文所使用,范围及量可以「约」特定值或范围表示。约亦包括准确量。因此,「约5μl」意谓「约5μl」以及「5μl」。一般而言,术语「约」包括预期在实验误差内的量。
[0301]
本文所用之章节标题仅出于组织目的,且不应理解为限制所述目标物。
[0302]
如本文所用,术语「个体(individual(s))」、「个体(subject(s))」及「患者」意谓任何哺乳动物。在一些实施方案中,哺乳动物为人类。在一些实施方案中,哺乳动物为非人类。
[0303]
「位点」对应于单一位点,其可为单个碱基位置或一组相关碱基位置,例如cpg位点。「基因座」对应于包括多个位点的区域。在一些情况下,基因座包括一个位点。
[0304]
如本文所用,术语「比较」系指对患者样品中之一种或多种生物标志物之甲基化状态、比例、含量或基因组局域化与标准或对照样品中之相应一种或多种生物标志物之甲基化状态、比例、含量或基因组局域化相关的程度作出评估。举例而言,「比较」可指评估患者样品中之一种或多种生物标志物之甲基化状态、比例、含量或细胞局域化是否与标准或对照样品中之相应一种或多种生物标志物之甲基化状态、比例、含量或细胞局域化相同、大于或小于其或与其不同。在一个实施方案中,术语比较系指评估一种或多种样品与多个标准或对照样品之比较情况(相同、大于或小于,或不同)。
[0305]
术语「统计显著」或「显著」系指统计显著性且通常意谓比标志物之正常浓度低两个标准偏差(2sd)或低于标志物浓度的两个标准偏差(2sd)。术语系指存在差异的统计学证据。其定义为当虚无假设实际上为真时,作出拒绝虚无假设之决定的机率。往往使用p值作出决定。
[0306]
术语「预后」或「预测」系指预报或计算出现癌症或疾病或肿瘤类型之风险,及患者之进展程度,及是否存在恢复的可能性。「癌症预后」通常系指预报或预测癌症及/或患者之可能病程或结果,评估癌症发生或复发之风险、确定治疗模式或测定治疗功效或反应。预后可使用个体信息以及与个体信息比较的外部数据,诸如群体数据、存活者反应率、家族或其他遗传学信息及其类似信息。「预后」亦在预测疾病进展之情形下使用,特定而言,预测疾病之特定疗法对特定赘生性病状或肿瘤类型之治疗结果。疗法预后用于例如预测成功(亦即治愈疾病)可能性或将疾病严重度降低至特定程度的可能性。作为一般性构思,为此目的所筛选的标志物较佳来源于根据所预测疗法治疗之患者的样品资料。标志物组亦可用于监测患者治疗性结果或阳性疾病进展的出现。
[0307]
术语「癌症等级」或「癌症状态」系指是否存在癌症、癌症阶段、肿瘤尺寸、是否存在转移、身体总肿瘤负荷、癌症之位置及/或起源,及/或癌症严重度之其他度量。癌症等级可
为数字或其它字符。在一些情况下,等级为零。在一些情况下,癌症等级亦包括与突变或多种突变相关的恶化前或癌变期病状(状态)。
[0308]
如本文所用,术语「治疗(treating)」及「治疗(treatment)」系指向个体投与有效量的组合物,使得个体之疾病之至少一种症状减少或疾病改善,例如有益或所要临床结果。出于本发明之目的,有益或所要临床结果包括(但不限于)一种或多种症状缓解、疾病程度减轻、疾病状态稳定(亦即不恶化)、疾病进展延迟或减缓、疾病状态改善或缓和,及缓解(部分或完全),不论可侦测或不可侦测。在一些实施方案中,治疗系指相较于预期存活期(若未接受治疗),存活期延长。在一些情况下,治疗包括预防。或者,若疾病之进展减缓或停止,则治疗为「有效的」。在一些实施方案中,术语「治疗」亦意谓相较于预期存活期(若未接受治疗),存活期延长。需要治疗者包括已诊断患有疾病或病状者,以及由于遗传敏感性或导致疾病或病状的其他因素(作为非限制性实例,诸如个体之体重、膳食及健康,其为可导致个体可能出现糖尿病之因素)而可能出现疾病或病状者。需要治疗者亦包括需要医学或外科关注、照护或管理的个体。个体通常为有病的或受伤的,或相对于群体中之普通成员,处于增加之患病风险中且需要此类关注、照护或管理。
[0309]
无需进一步详细描述,咸信本领域技术人员可使用前文描述最大程度地利用本发明。以下实例仅具说明性,且无论如何不以任何方式限制本发明之其余部分。实施例
[0310]
此等实施例仅为了说明目的而提供且不限制本文所提供之权利要求书之范畴。实施例1

自尿液中萃取无细胞dna用于非侵入性诊断稳定及储备批准
[0311]
此项目由sysu及四川大学(sichuan university)之irb核准。自所有患者获得知情同意书。在患者签署知情同意书之后获得肿瘤及正常组织。
[0312]
3个步骤:尿液稳定缓冲液

离心

冷冻上清液尿液稳定缓冲液
[0313]
调配尿液稳定缓冲液以达成尿液dna稳定化及无细胞dna保护。防腐剂使尿液中的细胞稳定,防止基因组dna释放,从而可分离出高质量无细胞dna。在尿液稳定缓冲液中收集的样品在室温下稳定长达14天,从而达成方便的样品收集、转运及储存。
[0314]
尿液稳定缓冲液之配方:2.2%柠檬酸钠0.8%柠檬酸0.245%右旋糖500mm egta1%戊二醛或1%甲醛离心
[0315]
尿液样品高速(例如11,000
×
g)离心15分钟且使用上清液进行核酸萃取。由此移除样品中的细胞物质及细胞核酸。储备
[0316]
上清液在

20至

80℃保持以便长期储备。
[0317]
程序:1.将至多40ml尿液转移至锥形管中。2.每1ml尿液中添加50μl尿液稳定缓冲液。藉由将管倒置超过10次来充分混合尿液混合物。添加且将尿液与尿液稳定缓冲液混合之后,可将尿液在环境温度下储存14天。3.以11000
×
g离心15分钟。4.在不扰乱离心块的情况下,将尿液上清液小心地转移至新锥形管中。5.接着使无细胞尿液(尿液上清液)在

20至

80℃作为储备液保存或加以处理用于dna萃取。dna萃取
[0318]
4个步骤:溶解

结合

洗涤

洗脱溶解样品
[0319]
在高温下、在蛋白酶k及dna溶胞缓冲液存在下、在高度变性条件下溶解尿液样品,其合起来确保脱氧核糖核酸酶不活化及核酸自所结合之蛋白质、脂质及微脂粒中完全释放。结合dna
[0320]
溶解之后自尿液中释放的核酸选择性地结合至二氧化硅膜柱或珠粒。
[0321]
藉由添加bing缓冲液以允许循环中之核酸与二氧化硅膜达成最佳结合来调整结合条件。接着将溶解物转移至二氧化硅膜上且循环中之核酸大体积吸收至小二氧化硅膜上,同时溶解物被真空压力抽吸。
[0322]
结合缓冲液之盐及ph条件确保蛋白质及其他污染物(在一些情况下抑制pcr及其他下游酶促反应)不滞留于二氧化硅膜上。洗涤
[0323]
核酸保持结合至膜,同时在3个洗涤步骤期间,污染物被有效洗掉。纯核酸之洗脱
[0324]
在单个步骤中,用洗脱缓冲液洗脱循环中之高纯度核酸。核酸之产量及尺寸
[0325]
使用qubit ds dna hs试剂盒或定量扩增方法测定产量。产量依赖于样品体积及样品中之循环核酸之浓度。自样品获得之循环dna及rna之绝对产量在不同个体之样品之间显著变化且亦视其他因素而定,例如性别、某些疾病状态。藉由琼脂糖凝胶电泳检查使用此程序所纯化之循环核酸之尺寸分布。实施例2

自尿液中分离自由循环无细胞dna。
[0326]
使用得自4ml尿液的qiaamp循环核酸试剂盒,其为藉由尿液稳定缓冲液混合物处理且如上文所述离心的上清液。尿液样品为新鲜或冷冻样品,接着相对于室温平衡。
[0327]
程序1.将500μl qiagen蛋白酶k吸移至50ml管(未提供)中。2.添加4ml尿液至50ml管中。3.添加4ml缓冲液acl(需要时含有载剂rna)及1.0ml缓冲液atl;盖紧且藉由脉冲涡旋混合30秒。4.在60℃培育30分钟。
5.将管置回至实验台上且旋开盖子。6.添加9.0ml缓冲液acb至溶解物中,盖紧且藉由脉冲涡旋充分混合15至30秒。7.溶解物

缓冲液acb混合物在冰上培育5分钟。8.将qiaamp小型柱插入qiavac 24plus上之vacconnector中。将20ml延伸管插入敞开的qiaamp小型柱中。确保延伸管紧紧插入qiaamp小型柱中以避免样品泄漏。9.将得自步骤7的溶解物小心地施加至qiaamp小型柱的延伸管中。开启真空泵。当所有溶解物已完全被抽吸通过柱时,关闭真空泵且使压力释放至0毫巴。小心地移出且抛弃延伸管。10.将600μl缓冲液acw1施加至qiaamp小型柱中。将柱的盖子打开且开启真空泵。所有缓冲液acw1已被抽吸通过qiaamp小型柱之后,关闭真空泵且使压力释放至0毫巴。11.将750μl缓冲液acw2施加至qiaamp小型柱中。将柱的盖子打开且开启真空泵。所有缓冲液acw2已被抽吸通过qiaamp小型柱之后,关闭真空泵且使压力释放至0毫巴。12.将750μl乙醇(96

100%)施加至qiaamp小型柱中。将柱的盖子打开且开启真空泵。所有乙醇已被抽吸通过qiaamp小型柱之后,关闭真空泵且使压力释放至0毫巴。13.将qiaamp小型柱的盖子盖紧,将其自真空歧管中移出且抛弃vacconnector。将qiaamp小型柱置放于清洁的2ml收集管中(步骤8中省去)且全速(20,000
×
g;14,000rpm)离心3分钟。14.将qiaamp小型柱置放于新的2ml收集管中,打开盖子,且将总成在56℃培育10分钟以使膜完全干燥。15.将qiaamp小型柱置放于清洁的1.5ml洗脱管中且抛弃得自步骤14的收集管。将20

150μl缓冲液ave小心地施加至qiaamp小型柱膜之中心。盖紧且在室温下培育3分钟。16.全速(20,000
×
g;14,000rpm)离心1分钟以洗脱核酸。
[0328]
用缓冲液ave洗脱自由循环无细胞dna,即用于扩增反应或在

15至

30℃储存。纯化核酸不含蛋白质、核酸酶及其他杂质。分离的dna理想地用于pcr、阵列、甲基化侦测等。实施例3

产生甲基化标志物数据源
[0329]
dna甲基化数据获自各种来源,包括癌症基因组图谱(tcga)。使用infinium 450k甲基化阵列产生485,000个位点的甲基化状态。其他数据来自以下gse数据集:gse46306、gse50192、gse58298及gse41826。分析用于肿瘤及其相应正常组织的甲基化图谱(表1)。
[0330]
甲基化数据文件系以idat格式获得,其中各珠粒之比率值已扫描。使用得自bioconductor的minfi封装将此等数据文件转化为分数,称为β值。
[0331]
获得所有样品之β值之后,移除所有20个数据集中不存在的任何标志物。表1.得自癌症基因组图谱(tcga)之各样品类型的样品计数
鉴别各比较中之高分标志物
[0332]
鉴别癌症类型的特异性标志物如下达成:比较特定癌症类型相对于其周围正常组织之间的逐对甲基化差异、两种不同癌症类型之间的差异以及两种不同正常组织之间的差异。研究1100个肿瘤样品及231个匹配相邻正常组织样品之训练组中的所有485,000个cpg甲基化位点。
[0333]
比较各组与每个其他组的图谱。使用上列总共20个癌症组(表1),进行总共20*19/2=190次不同组比较。使用r基因筛选程序包中的colttests()函数,对一组与另一组的所有450k个标志物进行比较。此分析产生t

统计p值及各类别之间之各标志物在比较中的平均甲基化分率差异。此比较之后,根据t

统计绝对值对标志物进行分选及评级以鉴别最有
可能区分两个类别的标志物。选择每次比较中的前十个标志物用于进一步验证分析。在190个比较组的情况下,选择10x190=1900个标志物用于将来分析。移除复制品之后,选择958个独特标志物用于泛癌症组,其在4000个肿瘤及1000个正常组织之验证组中加以测试。接着使用此组检验得自肺、乳房、肝脏及结肠直肠癌患者及无癌症对照者的血浆及体液样品以验证其诊断及预后值。甲基化型态与此组中之标志物的表达基因表达图谱相关。计算各比较中之前十个标志物的权重
[0334]
使用stats环境中的函数:prcomp(),对各比较组中的前十个标志物应用主分量分析且提取各组之第一主分量的权重且将该等权重与各组中的十个相应标志物进行匹配。存在190组权重及标志物。产生变量
[0335]
数据中之每个样品产生190个变量。使用权重/标志物组合,使用以下方程式计算各变量v:
[0336][0337]
其中w为权重且m为相应标志物之0与1之间的甲基化β值。
[0338]
产生矩阵,其中维度为(1)样品数目乘以(2)190个变数。样品分类
[0339]
使用上述矩阵对样品进行分类。在此使用若干种分类算法,包括逻辑回归、最近相邻(nn)及支持向量机(svm)。
[0340]
使用r的kernlab文库产生支持向量机。crammer、singer算法的结果稍微优于weston、watson算法。在分析中,发现四种潜在的分类误差类型。1.错误组织。此发生于结肠组织被鉴别为肺组织时。2.假阴性3.假阳性4.正确组织及预后。错误癌症类型。举例而言,此发生于肾脏肾透明细胞癌瘤被鉴别为肾脏肾乳头状细胞癌瘤时。
[0341]
使用三种方法验证结果。前两者使用最后一个步骤检验。1.将样品分成五等份且4份用于训练且第五份用于测试结果。2.使用留一法,其中除一个样品外,所有样品用于训练。留一个用于测试。各样品重复此过程直至其全部被测试。3.在两阶段复制研究中,在处理开始时,将样品分成两个集合。使用训练集,鉴别各比较中之具有最高t

检验分数的10个标志物。此等标志物接着用于产生主分量,接着使用此等变量产生svm。接着对测试集应用所得标志物以产生主分量及svm结果。
[0342]
使用此等方法中之每一者,预测准确度高于95%。组织误差数目小于1%。对于测试数据集而言,特异性为约95%且灵敏性为近似99%。
[0343]
另外,亦将pca与ica组合应用。在ica中,过程分量的总和假定等于所量测的甲基化值,而无需预先指定噪声项,但包括一些分量或代表数据中之一种或多种'噪声'类型。举例而言,在此情况下,变量的数目(例如117k甲基化值)比样品数目(例如7706个样品)大得多。由于ica需要足以自输入数据学习非混合矩阵的样品数目,因此在一些情况下不利用降维进行的ica分解不发生收敛。步骤进一步说明于图36中且如下论述:
[0344]
无监督学习

部分1:标志物选择
[0345]
此部分为自总原始标志物空间(117k)中选择n最多的信息性标志物(例如n为5000)。由此对有成本效益的精确标志物阵列进行研究以对血细胞取样以便进行连续血液样品分类。其他修改包括放大n值或复制相同标志物集合(亦即,将5000个标志物中之每一者置放于两种不同位置)以在血液细胞取样时提高信杂比(signal

to

noise ratio;snr)。
[0346]
步骤1:独立分量分析(independent component analysis;ica)
[0347]
ica发现'非混合'矩阵w,其使输入数据矩阵x(7176
×
117k)以线性方式非混合成空间独立源矩阵u,其中u=wx。估算源矩阵u(分量活化)中之各列为相应ic沿着各标志物的波形。在此步骤,ica分析返回7176个分量进行进一步分析。在ica中,过程分量的总和假定等于所量测的甲基化值,而无需预先指定噪声项,但实际上可包括一些分量或该等分量代表数据中之一种或多种类型的'噪声'。
[0348]
步骤2:相对于分量活化的z

转换标准化
[0349]
为了很好地评估各标志物在7176个ic中之比重,应用相对于分量活化的z

转换标准化。特定而言,各分量活化(一列u)移除其平均值且将该值除以标准偏差以具有零平均值及单位方差。此程序以所谓的z

值产生归一化分量活化u(亦即标志物权重)。
[0350]
步骤3:针对各分量对z计分标志物进行评级
[0351]
此步骤为鉴别117k个标志物对7176个分量中之每一者的重要性。对于各分量而言,对根据绝对z

值的所有标志物进行评级,使得各标志物经1至117k标签标记。标记为「1」的标志物指示最大比重,而标记为「117k」的标志物为重要性最小。此步骤之后,使各标志物与7176个值相关联;其中之每一者指示7176个分量中之每一者的比重。
[0352]
步骤4:检索所有分量中之n比重最大的标志物
[0353]
此步骤系自117k中检索n最重要标志物。检索始于收集藉由任何分量标记为「1」之标志物,随后为藉由任何分量标记为「2」之标志物等。检索终止于完全收集到所要数目个有贡献标志物。
[0354]
部分2:基于ica之特征提取
[0355]
选择最大比重标志物(自117k中选择5000个)之后,对标志物微调矩阵(7176
×
5000)进行ica分解(上文所述)以得到视为特征的分量。ica分解之前,使用主分量分析(pca)将维度自7176降低至25。从而,在此步骤,pca及ica产生35
×
5000之特征矩阵用于血液样品分类。
[0356]
部分3:血液样品分类
[0357]
比较k

最近相邻(knn)及支持向量机(svm)之后,装备有径向基底函数(rbf)之核函数的svm超过knn且返回93.99%之分类行为以自30个类别中正确识别7176个样品之一(knn=91.54%,其中k=5)。
[0358]
比较使用全部原始标志物(117k)所得之95.55%分类行为时,标志物微调矩阵返回可比较行为(93.99%)。dna/rna分离及定量pcr
[0359]
患者及组织之特征:匹配的相邻正常组织用作对照。此等正常组织藉由组织学检验无任何癌症证据。
[0360]
肿瘤及相应的远位点样品获自经历外科肿瘤切除的患者;将样品冷冻且在

80℃
储存直至使用。自样品中分离dna及rna系使用allprep dna/rna小型试剂盒(qiagen,valencia,ca)进行且对rna进行柱脱氧核糖核酸酶消化。使用nanodrop 2000(thermo scientific)量化rna,使用iscript cdna合成试剂盒(bio

rad,inc)、根据制造商说明书、使用200ng各样品rna进行互补dna合成。简言之,将样品在25℃培育5分钟,在42℃培育30分钟,随后在85℃培育5分钟。使用基因特异性引物及power sybr green pcr主混合物、在7500实时pcr系统(applied biosystems)上、藉由40轮扩增来进行qpcr。三重复进行量测且相对于内源性actb含量进行归一化。使用δδct方法(循环临限值<30)计算相对表达变化倍数。数据以基于三次重复的平均值
±
s.d.显示。全基因组甲基化图谱分析鉴别癌症中之特异性甲基化标志物
[0361]
为了鉴别癌症类型的特异性标志物,以逐对方式比较特定癌症类型与其周围正常组织之间的甲基化差异、不同癌症类型之间的差异,以及两个正常组织之间的差异。使用illumina 450,000cpg甲基化微阵列分析十二种癌症类型(包括肺癌之两种nsclc亚型(腺癌及鳞状细胞癌)及结肠癌及直肠癌)之患者之训练组的全基因组dna甲基化图谱。使用包括12个肿瘤组及9个正常组织组的总共21个组织组,进行总共21
×
20/2=210次独特逐对比较。使用r基因筛选程序包中的colttests()函数,对一组与另一组的所有450k个标志物进行比较。利用t

统计中的最低p值及各比较之间的平均甲基化分率最大差异对标志物评级且选择各组中之前十个标志物进行进一步验证分析。190次比较之后,产生958个独特非冗余标志物作为泛癌症组。使用stats环境中的函数:prcomp()、藉由对各比较组中的前十个标志物应用主分量分析来赋予各标志物权重且提取各组之第一主分量的权重且将该等权重与各组中的十个相应标志物进行匹配。使用此等标志物、利用若干算法对样品分类,若干算法包括神经网络、逻辑回归、最近相邻(nn)及支持向量机(svm),其皆产生一致结果。发现使用svm的分析最稳定且因此用于所有后续分析中。以无监督方式对癌症及正常样品中之此等958个评级最高的cpg位点作图。
[0362]
层级聚类能够以高特异性及灵敏性区分癌症类型。若鉴别癌症之存在及位点最可能提供最大临床效用,则将相同组织产生的癌症组合用于评价算法有效性之目的。所组合肿瘤包括结肠及直肠癌症、肺鳞状细胞及腺癌瘤、肾乳头状及透明细胞癌瘤,及低级神经胶质瘤及多形性胶质母细胞瘤。除结肠及直肠癌之外,算法基本上有效地区分自相同组织产生的癌症,从而可能反映此等肿瘤之类似生物学。训练组由2852个癌症样品及1278个正常样品组成。4130个样品中之4087个或98.9%样品正确地鉴别为癌症或正常。仅2个癌症样品正确鉴别为癌症、但为错误组织。对于癌症之总体灵敏性为99.5%且在个别癌症之间为一致的,而特异性为97.8%,其中组织类型之间存在更多变化。详言之,前列腺与甲状腺分别具有74.1%及75%之较低特异性,此可能反映出算法之局限、可供训练利用之样品数目较低,或顽固性恶性疾病在此等组织中之盛行率较高。验证算法在由1220个癌症及550个正常样品组成之独立组中鉴别癌症的能力。此组达成的结果类似,其中98.7%样品正确鉴别为癌症或正常且仅4个癌症样品鉴别为错误组织。验证组中之总体灵敏性及特异性分别为98.9%及98.4%,其预测特征与训练组极类似。总体而言,此等结果证明此等甲基化型态在鉴别恶性疾病之存在以及其起源位点方面的性质稳定。与基因表达型态相关的癌症甲基化图谱
[0363]
若dna甲基化为基因表达之主要表观遗传调节因子,则研究该组中之肿瘤相对于
正常组织之位点基因差异性甲基化与基因表达的相关性。特定而言,关注上述算法中预测恶性疾病存在的那些甲基化位点。选择与其所匹配正常组织对应物比较时,在癌症类型中显示高甲基化的高分标志物且鉴别其在乳癌、肝癌、肺癌及结肠癌中的相应基因。得自tcga的rna seq资料用作发现组以计算此等基因之差异性表达且癌症组织集合用作验证组。所选的几乎每种基因均展现标志物cpg高甲基化(相对于正常),且在此等基因中之每一者中观测到表达减少。使用威尔科克森符号秩检验来确定1.21x10

21
的p值。在一些情况下,所选基因与癌发生有关。泛癌症组用于早期癌症诊断
[0364]
验证8000个甲基化标志物及其在第二组癌症患者中得到验证之后,藉由检验血浆及尿液中的无细胞肿瘤dna来研究其侦测早期癌症的用途。实施例4

常见癌症诊断及预后中的泛癌症甲基化标志物批准
[0365]
自tcga网站下载癌症基因组图谱(tcga)资料。此项目由sysu及四川大学之irb核准。自所有患者获得知情同意书。在患者签署知情同意书之后获得肿瘤及正常组织。数据源
[0366]
初始训练集及第一测试集的dna甲基化资料获自癌症基因组图谱(tcga)。自tcga获得4032个肿瘤及所匹配相邻正常组织样品之训练组以及1150个患者肿瘤及所匹配正常样品之验证组的临床特征及分子图谱分析,包括甲基化数据。使用亚硫酸氢盐测序方法,自华西医院(west china hospital)及中山大学癌症中心(sun yat

sen university cancer center)获得810位中国癌症患者之各别验证组。研究组患者之临床特征列举于表2及图37至图40中。自同一患者同时收集所匹配相邻正常组织样品及肿瘤且藉由组织学检验以证明无癌症。使用infinium 450k甲基化阵列产生485,000个位点的甲基化状态。其他数据来自以下gse数据集:gse46306、gse50192、gse58298及gse41826。甲基化数据文件系以idat格式获得,其中各珠粒之比率值已扫描。得自bioconductor的minfi程序包用于将此等数据文件转换成分数,称为β值。获得所有样品之β值之后,排除所有20个数据集中不存在的任何标志物。表2.癌症组之特征
产生泛癌症标志物组
[0367]
藉由比较特定癌症类型相对于其相应正常组织之间的逐对甲基化差异、两种不同癌症类型之间的差异以及两种不同正常组织之间的差异来鉴别癌症类型特异性标志物,其中总共12个组织组包括6个肿瘤组及6个正常组织组。根据呈现来自6种不同组织之9种癌症类型及所匹配相邻正常组织的tcga,将患者样品随机分成训练组及验证组。为此,进行总共12*11/2=66次独特逐对比较。使用illumina 450,000cpg甲基化微阵列,使用r基因筛选程序包中的[行列t检验]colttests()函数来比较一组与另一组的450k标志物。利用t

统计中的最低p值及各比较之间的平均甲基化分率最大差异对标志物评级且选择各组中之前十个标志物进行进一步验证分析。450次比较之后,产生432个独特非冗余标志物作为泛癌症组。以无监督方式,对各种癌症类型及正常样品中之此等432个评级最高cpg位点作图(图8)。
[0368]
此等样品以此方式根据cpg位点之差异性甲基化进行的分层聚集能够在tcga训练组中区分癌症起源组织以及正常组织(表3)。总体正确诊断率为99.2%。接着对tcga验证组应用此等标志物(表4),得到97.9%之类似正确率。结果亦在独立的第三组中国癌症患者中得到证实(表5),正确率为95.2%,其中使用替代亚硫酸氢盐测序技术、在不同种族及地理背景下、利用tcga进行甲基化分析(中国人群中未获得足够数目个低级神经胶质瘤(lgg)及多形性胶质母细胞瘤(gbm))。
[0369]
检查20例乳癌转移至肝脏及30例结肠直肠癌转移至肝脏。此等转移相较于原发乳癌、原发结肠直肠癌、原发肝癌及正常肝脏的层级聚类说明于图41中。分析显示诊断除19/
20乳癌转移及29/30结肠直肠癌转移(表5)。两个误诊鉴别为正常肝脏,表明误差原因为组织污染。表3.tcga训练组组表4.tcga测试组
表5.中国测试组
[0370]
算法区分组织起源之恶性疾病与自相同组织产生的癌症。组织学亚型涉及疗法选择及预后。因此,进一步针对低级神经胶质瘤(lgg)相对于多形性胶质母细胞瘤(gbm)(图9a,表6)、肺腺癌(luad)相对于鳞状细胞癌(lusc)(图9b,表7)及肾脏肾透明细胞(kirc)相对于肾脏肾乳头状细胞癌瘤(kirp)(图9c,表8),研究算法区分共同起源组织之组织学亚型的能力。举例说明组织学亚型之无监督层级聚类的热图绘制于图9a至图9c中且基于甲基化的分类结果显示于表6

8中。此等甲基化标志物能够在tcga组中正确鉴别97.6%脑癌、95.5%肺癌及98%肾癌的组织学亚型。大部分的不正确分类正确地鉴别出癌症、但组织学亚型错误;少于1%的样品误鉴别为正常组织。表6.脑肿瘤组
表7.肺癌组
表8.肾脏肿瘤组计算各比较中之前十个标志物的权重
[0371]
使用stats环境中的函数:prcomp(),对各比较组中的前十个标志物应用主分量分析且提取各组之第一主分量的权重且与各组中的十个相应标志物进行匹配。存在45组权重及标志物。使用此等标志物、利用若干算法对样品分类,若干算法包括神经网络、逻辑回归、最近相邻(nn)及支持向量机(svm),其皆产生一致结果。发现使用svm的分析最稳定且因此用于所有后续分析中。
[0372]
对于各种肿瘤类型而言,基于所得甲基化标志物将样品分成两组且使用卡普兰

迈耶曲线对其存活期作图(图10a至图10b)。亦分析基于肿瘤阶段的亚群及治疗之后残余肿瘤的存在。此等甲基化图谱能够预测所有肿瘤类型及所检查之大部分亚群之存活期的统计学高显著性差异。若干个特定结果具有潜在临床显著性。在所有lgg患者以及具有残余肿瘤的患者中,甲基化鉴别出存活期尤其有利的个体亚群(图10a至图10b,p<0.001)。在肾脏肾透明细胞癌瘤(kirc)中,分析鉴别出存活期相对不良的较小患者亚群,相比之下,治疗后无残余肿瘤之患者组的存活期相对较好(86.3%相对于34.8%)(图10a至图10b)。在kirp中,
算法鉴别出治疗后具有残余肿瘤或患有晚期疾病之患者亚群中存在预后特别不良的患者(图10a至图10b)。虽然具有统计显著性,但此作用之量值的估算受到此等群组中之低数目的限制。治疗后无残余肿瘤的luad患者亚群经进一步鉴别,其预后相较于大部分患者尤其有利(图10a至图10b),表明此等患者之复发率较低。最后,在lusc中,甲基化型态预测治疗后无残余肿瘤之患者亚群具有类似优良的存活期(图10a至图10b)此等结果突出显示了在预测存活期方面及在若干个上述实例中鉴别可能需要较多或较少侵袭性监测或治疗之患者组方面使用甲基化型态补充组织学的可能性。
[0373]
进行实验以测试体细胞突变是否将其他预后信息添加至单独甲基化标志物中,或甲基化标志物是否与体细胞突变相关联。在三种癌症类型(lgg、lihc及kirc)中,发现基于预后的dna甲基化与体细胞突变相关且甲基化与体细胞突变分析之组合为预测5年存活期提供改良之效能。体细胞突变之分布及相对频率显示于图43a至图43b中。对于lgg而言,idh1或idh2之突变为共同的且彼此具有排他性,其中idh1中发生突变的频率大于idh2。具有预测改良预后之甲基化标志物的92%样品中存在idh1或idh2突变,相比之下,具有预测不良预后之甲基化标志物的样品中仅42%存在idh1或idh2突变(图11a)。有趣的是,在具有预测不良预后之甲基化标志物的群组中根本未观测到idh2突变。独特的是,在肿瘤类型之体细胞突变中,除甲基化标志物之外,idh1/idh2状态独立地预测改良之预后(图11b)。虽然idh1及阳性甲基化标志物预测优良的预后,但idh2突变对存活期的预测似乎甚至更好。样品组之idh2突变体中未观测到死亡,但此观测结果受到样品数22的限制。idh1及idh2突变已知在lgg中为共有的且预测此肿瘤的预后良好,缺乏idh1/2突变的lgg展现的临床行为更类似于gbm。idh1及idh2涉及细胞中的代谢过程;此等基因中的突变被认为干扰mcpg位点的羟基化及去甲基化。值得注意的是,预测预后的甲基化标志物既不与体细胞突变相关,亦不与组织学标志物(包括her2及er/pr表达)相关。
[0374]
在lihc中,体细胞突变总数与预测更坏预后的甲基化标志物相关(图11c)。对于kirc而言,图11d显示与甲基化图谱及频繁突变型基因相关的无监督层级聚类及热图,图42a显示体细胞突变总数与预测更坏预后的甲基化标志物相关。另外,三种基因(bap1、tp53及ptch1)之一之甲基化标志物与体细胞突变组合用于预测预后(图42b,p<0.0001),且鉴别出具有原本有利预后之此癌症中存在存活期尤其不良的较小亚群。与其基因表达型态及功能相关的癌症甲基化图谱
[0375]
进一步研究相对于与基因表达相关之正常组织,肿瘤基因中之差异性甲基化位点。选择正常组织中平均甲基化值<5%及癌症组织中平均甲基化值>50%的高分标志物,此等标志物在癌症与正常组织中均显示甲基化与基因表达量之良好相关性。使用得自tcga的rna

seq数据计算此等基因之差异性表达(图15a)。相对于正常样品,在癌症中观测到cpg高甲基化且在相应基因中具有逆向减少的表达。进一步测试经鉴别具有新发现之肿瘤抑制功能的基因。选择zscan18来测试其与癌症生物学的功能相关性,且znf502已牵涉乳癌发病机制。znf502在基因表达逆向减少之乳癌(p=xx,p=xx)中发生高甲基化(图15a至图15e)。另外,乳癌中的znf502表达受到抑制,且观测到细胞培养物及裸小鼠中的肿瘤生长减少(图15g)。类似地,fuz之甲基化程度在基因表达量逆向减少的肝癌中增加,且显示可抑制细胞培养物及裸小鼠中的肿瘤生长(图15f至图15j)。产生变量
methods.2012年2月5日;9(3):270

272)进行。首先,利用各测序读数提取umi且使用d.d.慷慨提供的定制脚本附加至fastq档案内之阅读标题。使用bowtie2(langmead b,salzberg s.fast gapped

read alignment with bowtie 2.nature methods.2012,9:357

359)对读数进行动态转化,如同所有c为非甲基化且与人类基因组之计算机仿真转化dna链对映,亦如同所有c为非甲基化。合并原始读数且根据单一umi进行过滤,亦即舍弃携有相同umi的读数,得到单一umi。提取所有cpg标志物的甲基化频率,据此设计挂锁探针。自分析中排除任何样品中少于20个读数的标志物。由此产生约600个cpg标志物,其甲基化程度的测定准确度为约5%或超过5%。dna/rna分离及定量pcr
[0392]
肿瘤及相应的远位点样品获自经历外科肿瘤切除的患者;将样品冷冻且在

80℃储存直至使用。自样品中分离dna及rna系使用allprep dna/rna小型试剂盒(qiagen,valencia,ca)进行且对rna进行柱脱氧核糖核酸酶消化。使用nanodrop 2000量化rna,使用200ng各样品rna、使用iscript cdna合成试剂盒(bio

rad,inc)、根据制造商说明书进行互补dna合成。简言之,将样品在25℃培育5分钟,在42℃培育30分钟,随后在85℃培育5分钟。使用基因特异性引物(表9)及power sybr green pcr主混合物、在7500实时pcr系统(applied biosystems)上、藉由40轮扩增来进行qpcr。三重复进行量测且相对于内源性actb含量进行归一化。使用δδct方法(循环临限值<30)计算相对表达变化倍数。数据以基于三次重复的平均值
±
s.d.显示。表9.用于实时pcr的引物
[0393]
进一步研究群组中之肿瘤相对于正常组织之基因中之cpg位点差异性甲基化与基因表达的相关性。相较于所匹配正常组织,选择乳癌或肝癌中显示高甲基化之最高差异甲基化cpg标志物。得自tcga的rna

seq资料作为发现组用于计算此等基因相较于所匹配正常组织的差异性表达(图12及图13a至图13c)。使用rt

qpcr表征此等基因在作为验证组之癌症组织集合中的表达(图14)。观测到此等高甲基化基因中之每一者的表达减少。肿瘤异种移植物
[0394]
根据机构及国际动物规定来进行所有动物研究。动物方案由中山大学癌症中心及
华西医院之机构动物照护及使用委员会(institutional animal care and use committee)批准。自供货商(广东省实验室动物中心,中国广州)购得雌性无胸腺balb/c裸小鼠(4

5周龄,18

20g)。将肿瘤细胞悬浮于100μl无血清培养基中且皮下注射至小鼠中。每3天藉由检查来监测肿瘤生长,直至最大肿瘤达到尺寸定义为10mm或大于10mm的肿瘤负荷。使用测径规量测肿瘤尺寸,且根据以下方程序计算肿瘤体积:肿瘤体积(mm3)=(长度(mm)
×
宽度(mm)2)
×
0.5。获得每个实验组五只小鼠的代表性资料。利用单向重复量测anova进行统计学分析。实施例5

基于dna甲基化的标志物以及结肠癌及其转移的诊断及预后批准
[0395]
此项目由中山大学癌症中心及华西医院批准。自所有患者获得知情同意书。在患者签署知情同意书之后获得肿瘤及正常组织。潜伏性癌症
[0396]
此研究中募集转移性腺癌起源未知的患者。其呈现渐进性体重减轻、疲乏及虚弱。检查包括详细病史、完全检查(包括骨盆、直肠、睪丸组织)、实验室测试(包括cbc、cmp、ua、粪便隐性血液、组织病理学、成像、内窥镜检查)。患者及组织之特征
[0397]
由于目标为诊断结肠癌及其转移,因此除结肠癌之外,亦必需产生针对肝癌及肺腺癌的准确癌症标志物,原因在于肝脏及肺为最频繁的转移位点。因此,研究2487位癌症及正常患者(表10及图21)。来源于相同患者的邻近正常组织用作对照。藉由组织学检验此等正常组织以证明无癌症。患者特征概述于图44a至图44b中。表10.三个癌症组之概述产生癌症标志物组
[0398]
为了鉴别癌症类型特异性标志物,对结肠癌、肝癌及肺癌进行比较以鉴别特定癌症类型与其周围正常组织之间的甲基化差异。进行三次逐对比较分析以便产生癌症特异性及组织特异性甲基化标志物:1)特定癌症类型相对于其相应正常组织之间的逐对甲基化差异;2)两种不同癌症类型之间的差异;及3)两种不同正常组织之间的差异。使用总共6个组织组(包括3个肿瘤组及3个正常组织组)进行总共15次独特逐对比较(6*5/2)。使用illumina 470,000cpg甲基化微阵列,使用r基因筛选程序包中的[行列t检验]colttests
()函数,每次比较使用450,000个标志物。根据如藉由t

统计检验所测定的最低p值与各比较之间之平均甲基化分率最大差异来对标志物评级且选择各组中之前十个标志物用于进一步验证分析。15次比较之后,产生127个独特非冗余标志物作为癌症组。
[0399]
以逐对方式比较不同癌症类型之间的差异,以及三种正常组织之间的差异。分析得自tcga之1108位患者之训练组的全基因组dna甲基化(使用illumina 470,000cpg甲基化微阵列获得)图谱。产生786个独特非冗余标志物作为癌症组。以无监督方式对939个癌症样品及169个正常样品中之此等786个最高评级cpg位点之层级聚类作图(图16)。接着使用939个癌症样品及169个正常样品,使用另外311个标志物比较不同癌症类型(结肠癌、肝癌、肺癌)(图17)。
[0400]
层级聚类能够将各种癌症类型彼此间及与正常组织区分开来。将tcga样品随机分成训练组及测试组且训练组由939个癌症样品及169个正常样品组成。训练组之层级聚类用于基于甲基化型态来区分癌症类型及正常组织(表11a)。939个癌症样品中之926个且169个正常样品中之166个得到正确鉴别,产生98.6%之总体灵敏性及99%之特异性。观测到在各种个别癌症中存在恒高的特异性及灵敏性(表11a)。在由393个癌症及52个正常样品组成的各别tcga测试组中,验证算法鉴别癌症的能力(表11b)。在此组中达成类似的结果,其中384个样品正确鉴别为癌症,且47个样品正确鉴别为正常。此验证组之总体正确率为96.9%。接着在由323个癌症样品及283个正常样品组成的另一测试组中测试此算法(表11c)。此外,总体正确诊断率为95.9%。使用下一个产生测序平台测试第三组样品,从而减少平台偏差或系统性误差的可能性。在33例结肠直肠癌肝脏转移个案及34例结肠直肠癌肺转移个案中,93.9%及94.1%的样品分别得到正确的鉴别。4个误诊样品预测为所侵入器官之正常组织,表明组织活体检查存在导致误诊的潜在污染。表11a.tcga训练组
表11b.tcga测试组1表11c.中国测试组(测试组2)
[0401]
接着,研究使用甲基化标志物判定癌症之存在及转移起源组织的潜在性。自一组中国患者收集各种正常组织及癌症病变的样品(表10)。此标志物可再现地鉴别肝脏、肺及淋巴结之转移性病变中的癌症起源。此外,测试一组起源未知的癌症,且发现所有该等癌症均可自原发结肠腺癌预测(图18)。计算各比较中之前十个标志物的权重
[0402]
使用stats环境中的prcomp()函数,对各比较组中的前十个标志物应用主分量分析。提取各组中之第一主分量的权重且与各组中之十个相应标志物的权重匹配。存在总共45组权重及标志物。使用此等标志物、利用若干算法对样品分类,若干算法包括神经网络、逻辑回归、最近相邻(nn)及支持向量机(svm),其皆产生一致结果。发现使用svm的分析最稳定且因此用于所有后续分析中。
[0403]
由于甲基化型态可反映特定肿瘤之潜在生物学差异,因此研究甲基化标志物预测结肠直肠癌、肺癌及肝癌患者组之总体存活期的能力。对于各种癌症而言,比较第5年存活或死亡的患者且利用主分量分析(pca)推导预测5年存活期的甲基化标志物。基于分期来预测结肠癌组及各亚群的显著不同总体存活期(图19a至图19e)。对于所有患者而言,甲基化标志物预测良好预后组的5年os为81.2%,相比之下,不良预后组的5年os为42%。在i

ii期结肠癌患者的亚群分析(图19b)中,鉴别在第5年具有100%os相对于51.3%os的患者组。此等结果表明,此等肿瘤的甲基化图谱分析在预测预后及潜在导引治疗选择方面起较大作用。体细胞突变之分布及相对频率显示于图45中。数据源
[0404]
dna甲基化数据获自若干来源,包括癌症基因组图谱(tcga)、使用infinium 450k甲基化阵列所产生之485,000个位点的分析,及得自以下gse数据集的其他数据:gse46306、gse50192、gse58298及gse41826。分析肿瘤及其相应正常组织的甲基化图谱。甲基化数据文件系以idat格式获得,其中各珠粒之比率值已扫描。得自bioconductor的minfi程序包用于将此等数据文件转换成分数,称为β值。排除所有20个数据集中不存在之任何标志物的β值。产生变量
[0405]
数据中之每个样品产生45个变量。使用权重/标志物组合,使用以下方程式计算各变量v:
[0406][0407]
其中w为权重且m为相应标志物之0与1之间的甲基化β值。产生矩阵,其中维度为(1)样品数目乘以(2)190个变数。样品分类
[0408]
使用上述矩阵对样品进行分类。在此使用若干种分类算法,包括逻辑回归、最近相邻(nn)及支持向量机(svm)。所有该等算法产生一致结果。然而,使用svm的分析更好且更稳定且因此用于所有后续分析中。
[0409]
利用r之基于核之机器学习实验室(kernlab)文库来产生支持向量机。最佳结果为具有「rbf」核。crammer、singer算法的结果稍微优于weston、watson算法。在分析中,发现四种潜在的分类误差类型:1.不正确组织;例如结肠组织鉴别为肺组织。2.假阴性;3.假阳性;4.正确组织及预后、不正确癌症类型。
[0410]
使用三种方法验证结果:1.将样品分成五等份。四份用于训练且第五份用于测试结果。2.留一法情形,其中所有样品用于训练,但一者用于测试留下来的群组。各样品重复此过程直至其全部被测试。3.两阶段复制研究:在处理开始时,将样品分成两组。使用训练集,选择各比较中之具有最高t

检验分数的10个标志物。此等标志物接着用于产生主分量且所得变量用于产生svm。接着对测试集应用所得标志物,且产生主分量及svm结果。
[0411]
使用此等方法中之每一者,预测准确度高于95%。组织误差数目小于1%。对于测试数据集而言,特异性为约95%且灵敏性为近似99%。肿瘤dna萃取
[0412]
以约0.5mg组织开始,使用qiaamp dna小型试剂盒(qiagen)、根据制造商方案萃取基因组dna。使用肿瘤与相应正常及转移组织样品且平均获得5ug总dna。dna在

20℃储存且在制备一周内分析。自ffpe样品中萃取dna
[0413]
使用具有若干处修改的qiaamp dna ffpe组织试剂盒自ffpe样品中萃取基因组dna。dna在

20℃储存且在制备一周内分析。基因组dna之亚硫酸氢盐转化
[0414]
使用ez dna甲基化lightning
tm
试剂盒(zymo research),根据制造商方案,将得自健康、肿瘤及转移组织的1μg基因组dna转化成双dna。基于tape station分析(agilent),所得双dna具有约200至3000bp之尺寸分布,其中峰为约500

1000bp。亚硫酸氢盐转化效率为>99.8%,如藉由双dna之深度测序及分析ch(非cg)二核苷酸中之c至t转化比率所检验。藉由对经分子逆转(挂锁)探针捕捉之双dna进行深度测序来量化cpg甲基化
[0415]
甲基化程度在癌症组织与正常组织之间的任一比较中显著不同的cpg标志物用于
设计测序用的挂锁探针。双dna之挂锁捕捉及测序系基于g.church及同事(porreca gj,nat methods.2007年11月;4(11):931

6.)及k.zhang及同事(diep,d nat methods.2012年2月5日;9(3):270

2;deng,j.等人,nat.biotechnol.27,353

360(2009))所开发的有修改之技术。探针设计及合成
[0416]
使用ppdesigner软件(diep,d,nat methods.2012年2月5日;9(3):270

272)设计平均捕捉区域长度为70bp的挂锁探针。cpg标志物位于所捕捉区域的中央部分内。捕捉臂排他性地定位于缺乏cg二核苷酸的区域内以防止外来cpg标志物之未知甲基化状态引入不希望的偏差。捕捉臂藉由含有扩增引物用之结合序列的连接体序列连接。将重复cs之可变区段插入引物位点之间以产生平均长度为91bp的探针。探针并有6

bp独特分子标识符(umi)序列以允许鉴别个别分子捕捉事件及对dna甲基化程度准确评分。
[0417]
使用标准商业合成方法,以各别寡核苷酸形式合成探针。在捕捉实验中,将探针混合,使用t4 pnk(neb)、根据制造商建议进行活体外磷酸化且使用p

30micro bio

spin柱(bio

rad)进行纯化。双dna捕捉
[0418]
将20ng经亚硫酸氢盐转化之dna与定义莫耳比之挂锁探针(1:20,000,如实验方式所测定)在含有1x ampligase缓冲液(epicentre)的20μl反应物中混合。为了防止蒸发,接着用50μl矿物油(sigma)覆盖反应物。使dna在95℃变性30秒,随后以每秒0.02℃之速率缓慢冷却至55℃,以允许探针黏接至dna。在55℃完成杂交历时15小时。为了使捕捉区域聚合,向各反应中添加5μl以下混合物:2u之pfuturbocx聚合酶(在95℃预活化3分钟(agilent))、0.5u之ampligase(epicentre)及250pmol各dntp于1x ampligase缓冲液中。在55℃培育5小时之后,使反应物在94℃变性2分钟且在冰上快速冷却。添加5μl核酸外切酶混合物(20u之exo i及100u之exoiii,两者均得自epicentre)且在37℃进行单链dna降解2小时,随后在94℃进行酶不活化2分钟。
[0419]
藉由pcr扩增位点特异性捕捉之环状产物,同时赋予各别样品条形码。使用特异性针对挂锁探针内之连接体dna的引物进行扩增,其中之一为所有探针上之共同扩增引物位点且另一者含有独特的6bp条形码。两种引物均含有illumina下一代测序接附子序列。如下进行pcr:1x phusion flash主混合物、3μl所捕捉dna及200nm最终[c]引物,使用以下循环:在98℃维持10秒,8x之(98℃维持1秒,58℃维持5秒,72℃维持10秒),25x之(98℃维持1秒,72℃维持15秒),72℃维持60秒。将5ul各pcr反应物混合且使用agencourt ampure xp珠粒(beckman coulter)对所得文库进行尺寸选择,以包括有效捕捉物(约230bp)且排除「空」捕捉物(约150bp)。使用illumina流动池接附子引物(p5及p7)、藉由pcr检验文库纯度且使用qubit dsdna hs分析(thermo fisher)测定浓度。使用miseq及hiseq2500系统(illumina)对文库测序。捕捉物覆盖均一性之优化
[0420]
原始试验性捕捉实验之深度测序显示大部分有效探针与非有效探针所捕捉之读数个数之间存在显著差异(平均覆盖率>0.2之所捕捉区域的60

65%)。为了对此进行改善,利用测序数据计算相对效率且以经调节的莫耳比混合探针。由此使捕捉均一性在>0.2平均覆盖率下增加至85%区域。
测序资料分析
[0421]
使用有一些修改的软件工具bisreadmapper(diep,d,nat methods.2012年2月5日;9(3):270

272)对测序读数定位。首先,利用各测序读数提取umi且使用d.d.慷慨提供的定制脚本附加至fastq档案内之阅读标题。使用bowtie2(langmead b,salzberg s.fast gapped

read alignment with bowtie 2.nature methods.2012,9:357

359)对读数进行动态转化,如同所有c为非甲基化且与人类基因组之计算机仿真转化dna链对映,亦如同所有c为非甲基化。合并原始读数且根据单一umi进行过滤,亦即舍弃携有相同umi的读数以排除双重复读数。提取所有cpg标志物的甲基化频率,据此设计挂锁探针。自分析中排除任何样品中少于20个读数的标志物。由此产生约600个cpg标志物,其甲基化程度的测定准确度为约5%或超过5%。dna/rna分离及定量pcr
[0422]
肿瘤及相应的远位点样品获自经历外科肿瘤切除的患者;将样品冷冻且在

80℃储存直至使用。使用allprep dna/rna小型试剂盒(qiagen,valencia,ca)、根据制造商建议自样品中分离dna及rna,且对rna进行柱上脱氧核糖核酸酶消化。使用nanodrop 2000(thermo scientific)量化rna。使用iscript cdna合成试剂盒(bio

rad,inc),根据制造商说明书,使用200ng各样品rna进行cdna合成。藉由标准40轮扩增方案、使用基因特异性引物(表9及12)及power sybr greenpcr主混合物、在7500实时pcr系统(applied biosystems)上进行qpcr。三重复进行实验且相对于内源性actb含量归一化。使用δδct方法(循环临限值<30)计算相对表达变化倍数。数据以基于三次重复的平均值
±
s.d.显示。表12.用于实时pcr的引物
[0423]
若dna甲基化为基因表达之主要表观遗传调节因子,则研究吾人之群组中之肿瘤相对于正常组织之位点基因差异性甲基化与基因表达的相关性。特定而言,关注上述算法中预测恶性疾病存在的那些甲基化位点。相较于所匹配之正常组织对应物,选择癌症类型中显示高甲基化的高等级标志物,且鉴别其在结肠癌中之相应基因。得自tcga的rna

seq资料作为发现组用于计算此等基因之差异性表达且癌症组织集合作为验证组(参见图20a至图20f及图22)。大部分所选基因展现标志物cpg高甲基化(相对于正常),且在此等基因中之每一者中观测到表达减少。使用威尔科克森符号秩检验来确定1.21x10

21
的p值。重要的是,所选基因已知在癌发生中具有重要作用,从而为此等标志物作为恶性疾病之预测因子提供生物学验证。并不惊人的是,此等所选基因(皆被抑制)包括已知肿瘤抑制因子与一些新发现的基因。选择pcdh17测试其与癌症生物学的功能相关性。pcdh17(cg02994463)在基因表达逆向减少的结肠癌中发生高甲基化。根据细胞培养物中的群落形成分析及裸小鼠中的肿瘤形成分析,pcdh17的表达增强显示细胞培养物及活体内的癌症生长受到抑制(图23a至图23e)。
细胞株
[0424]
人类结肠直肠癌细胞株dld

1获自atcc。此细胞株经转染可稳定表达gfp或所要gfp融合构筑体,且facs根据纯度分选。细胞在补充有10%fbs、1%青霉素

链霉素及1%非必需胺基酸的dmem中维持。成株分析方法。
[0425]
对在上述培养条件下生长的细胞进行胰蛋白酶处理,且使用自动细胞计数器计数。在6孔盘之各孔中接种500个细胞且允许形成群落。7至10天之后,细胞在10%v/v乙酸/甲醇中固定且用0.1%结晶紫染色。群落数目藉由对三重复孔进行人工计数来测定。软琼脂分析
[0426]
将1%高级琼脂(gifco)在对应于各细胞株的2x培养基中、在42℃稀释至0.5%,该培养基具有20%fbs、2%pen

strep及2%非必需胺基酸。将1.5ml之0.5%琼脂培养基混合物涂铺至6孔盘之各孔中且允许在室温下冷却45分钟。对在上述培养条件下生长的细胞进行胰蛋白酶处理,使用自动细胞计数器计数且在2x培养基中稀释至4000个细胞/毫升。将0.6%高级琼脂与等体积之稀释细胞在42℃混合至0.3%之最终浓度。在各孔中之底部琼脂层顶上涂铺1.5ml,且允许在室温下冷却45分钟。使培养盘在37℃生长,且每周添加100ul培养基两次。3周之后,群落用10%v/v乙酸/甲醇固定且用0.005%结晶紫染色。对于各细胞株构筑体而言,藉由对三重复孔进行人工计数来测定群落数目。肿瘤异种移植物
[0427]
根据机构及国际动物规定来进行所有动物研究。动物方案由中山大学癌症中心及华西医院之机构动物照护及使用委员会批准。自供货商(广东省实验室动物中心,中国广州)购得雌性无胸腺balb/c裸小鼠(4

5周龄,18

20g)。将肿瘤细胞悬浮于100μl无血清培养基中且皮下注射至小鼠中。每3天藉由检查来监测肿瘤生长。使用测径规量测肿瘤尺寸,且根据以下方程序计算肿瘤体积:肿瘤体积(mm3)=(长度(mm)
×
宽度(mm)2)
×
0.5。3

4周之后,将所有动物处死且收集异种移植物。获得每个实验组五只小鼠的代表性资料。利用单向重复量测anova进行统计学分析。实施例6

常见白血病类型诊断及预后中的dna甲基化标志物批准
[0428]
自tcga网站下载癌症基因组图谱(tcga)资料。此项目由广州妇女及儿童中心(guangzhou women and children center)、华西医院之irb批准。自所有患者获得知情同意书。在患者签署知情同意书之后获得肿瘤及正常组织。患者特征
[0429]
临床特征及分子图谱分析包括研究组之甲基化资料,研究组包括232aml、161all及647个正常血液样品。研究组患者之临床特征列举于表13中。表13.研究组患者之临床特征。
数据源
[0430]
初始训练集及第一测试集的dna甲基化资料获自癌症基因组图谱(tcga)。使用infinium 450k甲基化阵列产生470,000个位点的甲基化状态。使用亚硫酸氢盐测序方法获得第二组中国癌症患者之dna甲基化资料。计算各比较中之前十个标志物的权重
[0431]
使用stats环境中的函数:prcomp(),对各比较组中的前十个标志物应用主分量分析且提取各组之第一主分量的权重且与各组中的十个相应标志物进行匹配。存在45组权重及标志物。使用此等标志物、利用若干算法对样品分类,若干算法包括神经网络、逻辑回归、
最近相邻(nn)及支持向量机(svm),其皆产生一致结果。发现使用svm的分析最稳定且因此用于所有后续分析中。样品分类
[0432]
使用上述机器学习方法对all、aml及正常血液样品进行分类。在此使用若干种分类算法,包括逻辑回归、最近相邻(nn)及支持向量机(svm)。所有该等算法产生一致结果。所有后续分析中进一步使用利用svm的分析。
[0433]
利用r之基于核之机器学习实验室(kernlab)文库来产生支持向量机。最佳结果为具有「rbf」核。crammer、singer算法的结果稍微优于weston、watson算法。在分析中,发现四种潜在的分类误差类型:1.不正确组织;2.假阴性;例如all鉴别为正常血液3.假阳性;例如正常血液鉴别为all或aml4.正确组织、不正确白血病类型;例如all鉴别为aml。肿瘤dna萃取
[0434]
使用qiaamp dna小型试剂盒(qiagen),根据制造商建议,自新鲜冷冻之健康或癌症组织切片中萃取基因组dna。使用约0.5mg组织获得平均5μg基因组dna。dna在

20℃储存且在制备一周内分析。基因组dna之亚硫酸氢盐转化
[0435]
使用ez dna甲基化lightning
tm
试剂盒(zymo research),根据制造商方案,将1μg基因组dna转化成双dna。所得双dna具有约200

3000bp之尺寸分布,具有约500

1000bp之峰。亚硫酸氢盐转化效率为>99.8%,如藉由双dna之深度测序及分析ch(非cg)二核苷酸中之c至t转化比率所检验。藉由经分子逆转(挂锁)探针捕捉之双dna之深度测序测定第二验证组之dna甲基化程度
[0436]
甲基化程度在癌症组织与正常组织之间的任一比较中不同的cpg标志物用于设计测序用的挂锁探针。双dna之挂锁捕捉及测序系基于g.church及同事(porreca gj,nat methods.2007年11月;4(11):931

6.)及k.zhang及同事(diep,d nat methods.2012年2月5日;9(3):270

2;deng,j.等人,nat.biotechnol.27,353

360(2009))所开发的有修改之技术。探针设计及合成
[0437]
使用ppdesigner软件设计挂锁探针。所捕捉区域之平均长度为70bp,其中cpg标志物位于所捕捉区域之中央部分。为了防止cpg标志物之未知甲基化状态引入偏差,捕捉臂排他性地定位于不含cg二核苷酸的序列内。各臂之间的连接体序列含有扩增引物用的结合序列,其由cs之可变区段分隔以产生长度相等之探针。探针之平均长度为91bp。探针并有6

bp独特分子标识符(umi)序列以允许鉴别个别分子捕捉事件及对dna甲基化程度准确评分。
[0438]
使用标准商业合成方法,以各别寡核苷酸形式合成探针。在捕捉实验中,将探针混合,使用t4 pnk(neb)、根据制造商建议进行活体外磷酸化且使用p

30micro bio

spin柱(bio

rad)进行纯化。双dna捕捉
[0439]
将20ng经亚硫酸氢盐转化之dna与定义莫耳比之挂锁探针在含有1x ampligase缓冲液(epicentre)的20μl反应物中混合。探针与dna之最佳莫耳比在实验上确定为20,000:1。反应物用50μl矿物油覆盖以防止蒸发。为了使探针黏接至dna,在95℃进行30秒变性,随后以每秒0.02℃的速率缓慢冷却至55℃。在55℃完成杂交历时15小时。为了填充黏接臂之间的间隙,向各反应中添加5μl以下混合物:2u之pfuturbocx聚合酶(在95℃预活化3分钟(agilent))、0.5之u ampligase(epicentre)及250pmol各dntp于1x ampligase缓冲液中。在55℃培育5小时之后,使反应物在94℃变性2分钟且在冰上快速冷却。添加5μl核酸外切酶混合物(20u之exo i及100u之exoiii,两者均得自epicentre)且在37℃进行单链dna降解2小时,随后在94℃进行酶不活化2分钟。
[0440]
藉由pcr扩增位点特异性捕捉之环状产物,同时赋予各别样品条形码。使用特异性针对挂锁探针内之连接体dna的引物进行扩增,其中之一含有特定6bp条形码。两种引物均含有illumina下一代测序接附子序列。如下进行pcr:1x phusion flash主混合物、3μl所捕捉dna及200nm最终[c]引物,使用以下循环:在98℃维持10秒,8x之(98℃维持1秒,58℃维持5秒,72℃维持10秒),25x之(98℃维持1秒,72℃维持15秒),72℃维持60秒。将pcr反应物混合且使用agencourt ampure xp珠粒(beckman coulter)对所得文库进行尺寸选择,以包括有效捕捉物(约230bp)且排除「空」捕捉物(约150bp)。使用illumina流动池接附子引物(p5及p7)、藉由pcr检验文库纯度且使用qubit dsdna hs分析(thermo fisher)测定浓度。使用miseq及hiseq2500系统(illumina)对文库测序。捕捉物覆盖均一性之优化
[0441]
原始试验性捕捉实验之深度测序显示大部分有效探针与非有效探针所捕捉之读数个数之间存在显著差异(平均覆盖率>0.2之所捕捉区域的60

65%)。为了对此进行改善,利用测序数据计算相对效率且以经调节的莫耳比混合探针。由此使捕捉均一性在>0.2平均覆盖率下增加至85%区域。测序资料分析
[0442]
使用有一些修改的软件工具对测序读数进行定位。首先,利用各测序读数提取umi且使用d.d.慷慨提供的定制脚本附加至fastq档案内之阅读标题。使用bowtie2对读数进行动态转化,如同所有c非甲基化且与人类基因组之计算机仿真转化dna链对映,亦如同所有c非甲基化。合并原始读数且根据单一umi进行过滤,亦即舍弃携有相同umi的读数,得到单一umi。提取所有cpg标志物的甲基化频率,据此设计挂锁探针。自分析中排除任何样品中少于20个读数的标志物。由此产生约600个cpg标志物,其甲基化程度的测定准确度为约5%或超过5%。全基因组甲基化图谱分析鉴别白血病中之特异性甲基化标志物
[0443]
为了鉴别白血病型特异性标志物,以逐对方式比较all或aml相对于正常血液样品之间的全基因组甲基化差异。对甲基化差异最大的cpg标志物进行评级。以无监督方式,对aml相对于正常血液样品中之此等50个最高评级cpg位点作图(图24)。区分aml与正常血液样品(图24,表14a)。该发现进一步复制于中国aml组中(图25及表14c)。类似地,区分all与正常血液样品(图26,表14b)。综合而言,此等数据证明,cpg位点之差异性甲基化能够以特异性及灵敏性区分特定白血病类型与正常血液(表14)。总体灵敏性为约98%且特异性为约97%。总体而言,此等结果证明此等甲基化型态在鉴别特定白血病类型之存在时的稳定性
质。表14a.tcga训练组表14b.tcga测试组。表14b.tcga测试组。表14c.中国白血病群组。
甲基化图谱可区分不同白血病
[0444]
该方法有能力区分特定白血病类型与正常血液样品,因此,研究算法区分不同类型之白血病癌症(all及aml)的能力(表14c),all及aml起因于骨髓。区分各肿瘤亚型的灵敏性及特异性均大于90%(图27)。总之,此等结果证明使用甲基化型态准确诊断组织学亚型之癌症的功效。甲基化图谱预测预后及存活率
[0445]
使用主分量分析(pca)分析各白血病亚型(aml及all)以鉴别预测存活率(特定而言,诊断后第5年存活对死亡)的甲基化标志物。对于各种白血病类型而言,基于所得甲基化标志物将样品分成两组且使用卡普兰

迈耶曲线对其存活率作图(图28a至图28b)。此等甲基化图谱能够预测all及aml之存活率的高度显著差异。实施例7

藉由数字液滴pcr分析组织及无细胞dna样品无细胞dna样品处理
[0446]
血浆样品在4℃以1500g离心5分钟以移除细胞碎片。离心之后,使用qiaamp血液dna小型试剂盒(qiagent)、根据制造商方案自上清液中萃取淋巴细胞无细胞dna(cfdna)。
[0447]
使用ez dna甲基化lightning
tm
试剂盒(zymo research),根据制造商方案,将基因组dna转化成双dna。使用qubit
tm ssdna分析试剂盒进一步量化双dna。肿瘤组织基因组dna样品处理
[0448]
使用qiaamp dna小型试剂盒(qiagen),根据制造商建议,自新鲜冷冻之健康或癌症组织切片中萃取基因组dna。使用约0.5mg组织获得平均5μg基因组dna。dna在

20℃储存且在制备一周内分析。
[0449]
使用ez dna甲基化lightning
tm
试剂盒(zymo research),根据制造商方案,将1μg基因组dna转化成双dna。所得双dna具有约200

3000bp之尺寸分布,具有约500

1000bp之
峰。液滴数字pcr(ddpcr)
[0450]
使用qx200
tm
液滴数字pcr系统,根据制造商建议(bio

rad)进行液滴数字pcr(ddpcr)。使用bio

rad推荐的两步热循环方案进行ddpcr。引物及探针之序列说明于表17至表18中。使用约0.4

0.8μm正向引物及反向引物及约0.2μm各探针,使用约1ng至约20ng双dna样品用于各反应。使用quantasoft(bio

rad)进行数据分析。甲基化图谱分析将区分癌症类型及癌症亚型
[0451]
结肠癌组织与正常结肠组织样品(远位点)中之四个例示性cpg位点(cg06747543、cg15536663、cg22129276及cg07418387)的甲基化比率说明于图29中。各条形图代表24个样品之平均值。进一步分析已转移至肺之结肠癌组织样品中的此等四个cpg位点以及cpg位点cg14519356。图30说明转移性结肠癌组织样品、原发结肠癌参考样品及正常淋巴细胞基因组dna参考样品中之此等五个cpg位点的甲基化比率。比较转移性结肠癌样品与其相应原发结肠癌参考样品,cg15536663及cg14519356之甲基化比率类似。然而,比较转移性结肠癌样品与其相应原发结肠癌参考样品,cg06747543、cg22129276及cg07418387之甲基化比率不同。类似地,比较转移性结肠癌样品与其相应正常淋巴细胞基因组dna参考样品,此等五个cpg位点之甲基化比率亦不同。五个cpg位点之甲基化比率指示转移性结肠癌、原发结肠癌及正常淋巴细胞样品之间的不同甲基化型态。
[0452]
来源于结肠癌之无细胞dna(cfdna)样品的甲基化标志物说明于图31a至图31c中。图31a显示基因组cfdna之甲基化区域且图31b说明基因组cfdna之非甲基化区域。图31c说明来自三位患者(2043089、2042981及2004651)、正常cfdna参考样品、原发结肠组织参考样品及正常血液参考样品之cpg位点cg10673833的甲基化比率。患者2043089及2042981患有原发结肠癌,且患者2004651患有转移性结肠癌。
[0453]
原发肝癌、乳癌及肺癌之甲基化图谱说明于图32a至图32c中。图32a显示肝癌cfdna样品、正常cfdna样品、原发肝癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)中之cpg位点cg00401797的甲基化比率。图32b显示乳癌cfdna样品、正常cfdna样品、原发乳癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)中之cpg位点cg07519236的甲基化比率。图32c显示肺癌cfdna样品、正常cfdna样品、原发肺癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)中之cpg位点cg02877575的甲基化比率。
[0454]
图33a至图33b显示区分原发结肠癌与正常样品的两种不同探针。图33a显示靶向cpg位点cg10673833的探针cob

2及三位结肠癌患者之cfdna样品、正常cfdna样品、原发结肠癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)的甲基化图谱。三位患者中有两位(2043089及2042981)患有原发结肠癌。其余患者(2004651)患有转移性结肠癌。比较cfdna原发结肠癌样品与cfdna转移性结肠癌样品,cg10673833之甲基化比率不同;而cfdna转移性结肠癌样品与原发结肠癌组织参考样品之间的甲基化比率类似。图33b显示靶向cpg位点cg07974511的探针brb

2及两位原发结肠癌患者(2043089及2042981)之cfdna样品、正常cfdna样品、原发结肠癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)的甲基化图谱。在cpg位点cg07974511,cfdna结肠癌样品与原发结肠癌组织参考样品之间的甲基化比率类似,但与正常cfdna样品及正常淋巴细胞参考样品(基因组dna)的
甲基化比率不同。
[0455]
图34a至图34d显示对乳癌患者之cfdna的分析。使用四种探针(brb

3、brb

4、brb

8及brb

13)。对原发乳癌cfdna的甲基化比率与正常cfdna样品、原发乳癌组织参考样品(基因组dna)及正常淋巴细胞参考样品(基因组dna)进行比较。所有四种探针均能够侦测cfdna样品中乳癌之存在。
[0456]
图35a及图35b显示两种探针cob_3及brb_13,其各能够侦测49位患者之组织样品中的转移性结肠癌。图35a显示49位患者之甲基化图谱(相较于结肠癌组织参考样品、肺癌组织参考样品及正常肺组织参考样品,使用cob_3探针)。49位患者中约47位之甲基化比率高于正常肺组织参考样品之甲基化比率。在使用brb_13探针的图35b中,49位患者中约30位之甲基化比率低于正常肺组织参考样品之甲基化比率。实施例8

甲基化图谱将区分疗法
[0457]
如实施例7中所述处理血浆样品。图46说明使用两种不同的结肠癌探针(cob

2及cob

9)所测得之两种说明性cpg位点(cpg位点1及cpg位点2)之甲基化图谱的变化。图47说明根据结肠癌探针cob

2及cob

9所得之手术后四位患者样品(患者2045021、2044629、2044645及2045021)中之甲基化图谱变化。相较于正常cfdna样品的甲基化图谱,四个患者样品之甲基化图谱显示截然不同的图谱(使用cob

2探针)。对于cob

9探针而言,四个患者样品与正常cfdna样品之间的甲基化图谱仍类似。实施例9

甲基化图谱分析将区分癌症阶段
[0458]
如实施例7中所述处理血浆样品。图48说明根据结肠癌探针cob

2及cob

9所得之不同癌症阶段样品中之甲基化图谱变化。实施例10

甲基化图谱分析将区分正常样品与无肿瘤细胞dna样品
[0459]
如实施例7中所述处理血浆样品。图49a至图49j说明19种不同癌症类型与正常血液样品之十个说明性cpg位点(cg02874908、cg08098128、cg10542975、cg11252953、cg11334870、cg13911392、cg23130731、cg23612220、cg25432518及cg25922751)之甲基化图谱变化。癌症类型包括膀胱癌、乳癌、子宫颈癌、胆管癌(chol)、结肠癌、食道癌、头颈癌、肾脏癌、肝癌、肺癌、胰脏癌、嗜铬细胞瘤及副神经节瘤(pcpg)、前列腺癌、直肠癌、肉瘤、皮肤癌、胃癌或甲状腺癌。
[0460]
图50a

50n说明乳癌、结肠癌、肝癌、肺癌及正常血液样品中之约280个cpg位点(生物标志物)的甲基化图谱变化。
[0461]
表19说明各种癌症类型之cpg位点cg25922751之p值。表19.各种癌症类型之cpg位点cg25922751的p值
实施例11


[0462]
表15及表16说明结合本文所述之方法、系统、非暂时性计算机可读介质或试剂盒中之一或多者所用的cpg位点。
[0463]
表17及表18说明结合本文所述之方法、系统、非暂时性计算机可读介质或试剂盒中之一或多者所用的cpg位点及探针。
[0464]
表20说明结合本文所述之方法、系统、非暂时性计算机可读介质或试剂盒中之一或多者所用的cpg位点(或cpg标志物)。表15
表20
[0465]
虽然本文已显示及描述本发明之较佳实施方案,但本领域技术人员将显而易知,此等实施方案仅为了举例而提供。本领域技术人员现将想到诸多变化、变更及取代而不背离本发明。应了解,本文所述之本发明实施方案之各种替代方案可用于实施本发明。希望以下权利要求书限定本发明之范畴,且从而涵盖此权利要求书及其等效物之范畴内的方法及结构。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献