一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

确定生物样本是否源自肝脏组织的方法与流程

2022-07-23 23:23:15 来源:中国专利 TAG:


1.本发明涉及用于确定未知来源的生物样本是否源自肝脏组织的方法,以及用于实施该方法的包含肝脏组织特异性dna甲基化标记物的组合物。


背景技术:

2.人体内的细胞具有相同的遗传信息,但每个细胞的功能和形状却非常多样。这是因为每个细胞中都表达了特定的基因,因此细胞分化过程不同,导致细胞表型不同。几个因素,如dna甲基化、组蛋白修饰、组织特异性转录因子都参与了这些特定基因的表达。具体而言,dna甲基化,特别是cpg位点的甲基化,是细胞特异性基因表达的基本要素,并且已知对每个细胞或组织具有独特的dna甲基化特征。因此,使用dna甲基化特征可以很容易地识别细胞或组织的来源。
3.识别细胞或组织的来源可以实现疾病的早期诊断并提高诊断的准确性。例如,循环细胞游离dna(cfdna)存在于活体中循环的血液中,其中可能有循环肿瘤dna(ctdna)从肿瘤细胞中流出。即使通过液体活检检测到ctdna的存在,为了准确诊断癌症,也需要额外确认ctdna来源的组织,在此过程中,癌症的诊断会延迟。然而,如果在检测相应的ctdna的同时可以识别出癌症来源的组织,则癌症的早期诊断是可能的,并且越来越需要一种识别生物样本来源的方法以早期诊断其他疾病以及癌症。
4.本发明人研究了一种基于dna甲基化数据来确定来源不明的组织和细胞的来源的方法,结果确认了对于肝脏组织具有特异性的高甲基化水平的标记物,从而完成了本发明。


技术实现要素:

5.技术问题
6.本发明的一个目的是提供一种用于确定未知来源的生物样本是否源自肝脏组织的方法以及用于实施该方法的组合物。
7.技术方案
8.为了实现上述目的,本发明的一个方面提供了一种确定生物样本是否源自肝脏组织的方法,包括以下步骤:
9.(a)从受试者的分离的生物样本中分离dna;和
10.(b)测量分离的dna中由seq id no:1和seq id no:2所示的序列的cpg位点的甲基化水平。
11.在本发明的一种具体实施方式中,所述受试者可以是人,所述生物样本包括从所述受试者分离的组织、组织碎片、细胞、细胞碎片、血液、血浆、体液、粪便和尿液等,但不限于此。组织、组织碎片、细胞和细胞碎片等可以从采集自受试者的血液、血浆、体液、尿液等中分离出来。另外,dna可以是从组织、细胞等中分离的dna,也可以是漂浮在血液、血浆、体液等中的细胞游离dna(cfdna)或从肿瘤细胞中流出的循环肿瘤dna(ctdna)。
12.本说明书中使用的术语“甲基化”是指甲基(-ch3)与构成dna的碱基的结合,优选
是指在特定dna的特定cpg位点的胞嘧啶上发生的甲基化。术语“甲基化水平”是指定量评价特定dna序列中存在的cpg位点的甲基化状态,甲基化状态是指dna序列中的一个或多个cpg位点是否存在5-甲基-胞嘧啶。
13.本说明书中使用的术语“cpg位点”是指胞嘧啶(c)和鸟嘌呤(g)通过磷酸基团连接的序列,它可以存在于包含启动子区、蛋白质编码区(开放阅读框,orf)和终止区等的dna序列中。已知cpg位点的甲基化涉及维持基因组稳定性和调节基因表达等。
14.本发明人试图发现肝脏组织特异性甲基化标记物,结果发现了在正常肝脏组织和肝癌组织样本中具有高甲基化水平以及在包括血液在内的其他组织中具有低甲基化水平的cg12137206(seq id no:1)和cg03792768(seq id no:2)标记物。两种标记物的目标甲基化位点是分别位于由seq id no:1和seq id no:2所示的序列中的第61位核苷酸的cpg位点。然而,由于甲基化甚至可能发生在除目标甲基化位点之外的其他cpg位点中,因此在本发明中,可以测量包含目标cpg位点的由seq id no:1和2所示的序列中存在的总cpg位点的甲基化水平。
15.在本发明的一种具体实施方式中,(b)可以通过选自由pcr、甲基化特异性pcr、实时甲基化特异性pcr、methylight pcr、mehtylight数字化pcr、epityper、使用甲基化dna特异性结合蛋白的pcr、定量pcr、dna芯片、分子信标、ms-hrm(甲基化敏感性高分辨率熔解)、不对称pcr、不对称pcr ms-hrma(不对称pcr甲基化敏感性高分辨率熔解分析)、重组酶聚合酶扩增、lamp(环介导的等温扩增)、eclipse探针、下一代测序面板(ngs面板)、焦磷酸测序和二硫化物测序组成的组中的方法实施。
16.例如,甲基化水平可以通过微阵列来识别,并且微阵列可以使用固定在固体表面上的探针。探针可包含与包含cpg位点的10至100个连续核苷酸序列互补的序列。
17.在本发明的一种具体实施方式中,该方法在(b)之后,还可包括(c)将甲基化水平与正常对照组的甲基化水平进行比较。例如,当生物样本的甲基化水平高于正常对照组的甲基化水平时,可以确定该生物样本源自肝脏组织,而当甲基化水平较低或相似时,可以确定该生物样本源自除肝脏以外的其他组织。
18.本发明的另一方面提供了一种用于检测生物样本中来自肝脏组织的dna的方法,包括:
19.(a)从受试者的分离的生物样本中分离dna;和
20.(b)测量分离的dna中由seq id no:1和seq id no:2所示的序列的cpg位点的甲基化水平。
21.由于该方法与确定生物样本是否源自肝脏组织的方法采用了相同序列的甲基化水平检测技术,因此省略了两种方法之间重复的内容,以避免说明书的过多描述。
22.在本发明中,来自肝脏组织的dna的检测方法可以与常规肝癌诊断方法组合使用。
23.本发明的另一方面提供了一种用于确定生物样本是否源自肝脏组织的组合物,其包含能够测量由seq id no:1和seq id no:2所示的序列的甲基化水平的试剂。
24.在本发明的一种具体实施方式中,cpg位点可以是1个至多个,包括位于由seq id no:1和seq id no:2所示的序列中第61位核苷酸的cpg位点。
25.在本发明的一种具体实施方式中,能够测量甲基化水平的试剂可以是与由seq id no:1和seq id no:2所示的序列的cpg位点结合的引物、探针或反义核酸,并且引物、探针或
反义核酸可以用作可杂交阵列元件并且可以固定在基底上。
26.另外,seq id no:1或2所示的序列可以是基因组dna,也可以是通过亚硫酸氢盐处理将非甲基化胞嘧啶转化为尿嘧啶的序列。
27.基底是合适的固体或半固体支持物,例如,它可以包括薄膜、过滤器、芯片、载玻片、晶片、纤维、磁珠或非磁珠、凝胶、管材、板、聚合物、微粒和毛细管。可杂交阵列元件可以通过化学结合方法、共价结合方法如uv或连接剂(例如:乙二醇低聚物和二胺)固定在基底上。
28.在本发明的一种具体实施方式中,从生物样本中分离的dna(样本dna)应用于可杂交阵列时可以与阵列元件进行杂交,并且根据本领域已知的技术对杂交条件可进行各种修改,对杂交水平的检测和分析可以各种方式进行。此外,为了提供允许确认杂交的信号,样本dna和/或引物、探针或反义核酸可以被标记,并与寡核苷酸连接。
29.标记可包含荧光团(例如,荧光素、藻红蛋白、罗丹明、丽丝胺、cy3和cy5(pharmacia))、生色团、化学发光团、磁性粒子、放射性同位素(p32和s35)、酶(碱性磷酸酶或辣根过氧化物酶)、辅因子、酶的底物、重金属(例如金)、抗体、链霉亲和素、生物素、地高辛和具有特定结合配偶体(例如螯合基团)的半抗原,但不限于此。
30.在本发明中,引物、探针或反义核酸与样本dna的杂交取决于多种因素,例如反应温度、杂交和洗涤时间、缓冲液组分及其ph和离子强度、核苷酸长度、核苷酸序列、gc序列的数量等。杂交的详细条件可参考joseph sambrook等人,分子克隆(molecularcloning),实验室手册(alaboratorymanual),cold spring harbor laboratory press,cold spring harbor,n.y.(2001);和m.l.m.anderson,核酸杂交(nucleicacid hybridization),springer-verlag new york inc.n.y.(1999)。
31.在杂交反应之后,可以检测通过杂交反应产生的杂交信号。例如,当探针被酶标记时,可以通过使酶的底物与杂交反应产物反应来确认杂交。
32.作为酶和底物,可以使用过氧化物酶(例如辣根过氧化物酶)和氯萘酚、氨基乙基咔唑、二氨基联苯胺、d-荧光素、光泽精(双-n-甲基吖啶硝酸盐)、试卤灵苄醚、鲁米诺、amplex red试剂(10-乙酰-3,7-二羟基吩恶嗪)、hyr(对苯二胺-hcl和邻苯二酚)、tmb(四甲基联苯胺)、abts(2,2'-氮杂二[3-乙基苯并噻唑啉磺酸盐])、邻苯二胺(opd)和萘酚/焦宁;碱性磷酸酶和溴氯吲哚磷酸盐(bcip)、氯化硝基四氮唑蓝(nbt)、萘酚-as-b1-磷酸盐和ecf底物;葡萄糖氧化酶和t-nbt(氯化硝基四氮唑蓝)和m-pms(吩嗪硫酸甲酯)。
[0033]
在本发明中,基于dna甲基化发现了肝脏组织特异性标记物。具体而言,通过对血液和各种器官样本中的各种细胞类型进行甲基化分析,选择了除肝脏组织外的其他器官中低甲基化的标记物和肝脏组织特异性的高甲基化的标记物,并通过机器学习确认了标记物的有效性。选择的标记物在从独立队列正常肝脏组织到肝癌的所有样本中具有高甲基化水平,而在包括血液在内的其他组织中具有低甲基化水平,并且证实只有两种标记物具有超过99%或更高准确度的肝脏特异性。在相应标记物的基因表达中也证实了肝脏特异性的高趋势。已确定肝脏特异性甲基化标记物可作为确认组织来源的主要标记物,有意作为未来提高肝脏相关疾病监测和早期检测的准确性的指标。
[0034]
有益效果
[0035]
用于确定生物样本是否来自肝脏组织的方法和实施该方法的组合物使用肝脏组
织特异性dna甲基化标记物,并且该肝脏组织特异性标记物在除肝脏组织之外的其他组织中具有低甲基化水平,而且在正常肝脏组织和肝癌组织中具有高甲基化水平,因此可以非常准确地确定生物样本是否来自肝脏组织。
[0036]
附图的简要说明
[0037]
图1示意性地示出了发现肝脏组织特异性标记物的过程。
[0038]
图2示出了发现的肝脏组织特异性标记物的可变重要性图(varimp图)。
[0039]
图3示出了根据发现的肝脏组织特异性标记物的数量确认性能的结果。
[0040]
图4中,a为最终选择的cg12137206和cg03792768标记物在正常肝脏组织(肝脏n)和肝癌组织(肝脏t)中甲基化水平的确认结果,b示出了在正常肝脏组织(lihc_n)和肝癌组织(lihc_t),肝脏以外的正常组织(pan_n)和肝脏以外的癌组织(pan_t)的确认结果。
[0041]
图5示出了在各种正常组织(a)和癌组织(b)中cg12137206标记物的甲基化水平的确认结果。
[0042]
图6示出了在各种正常组织(a)和癌组织(b)中cg03792768标记物的甲基化水平的确认结果。
[0043]
图7示出了在主要正常组织和癌组织中cg12137206和cg03792768标记物的甲基化水平的确认结果:膀胱(bl)、乳房(br)、宫颈(ce)、结肠(co)、食道(es)、胶质母细胞瘤(gb)、头颈部(hn)、肾脏(ki)、肝脏(li)、肺(lu)、胰腺(pa)、副神经节瘤(pc)、前列腺(pr)、直肠(re)、肉瘤(sa)、皮肤(sk)、胃(st)、胸腺(th)、子宫(uc)和血液(b)。
具体实施方式
[0044]
在下文中,将通过一个或多个具体实施例更详细地描述本发明。然而,这些实施例旨在说明一个或多个具体实施例,但本发明的范围不受这些实施例的限制。
[0045]
实施例1:肝脏组织特异性甲基化标记物的发现
[0046]
各种癌和正常组织的dna甲基化数据从the cancer genome atlas(以下简称tcga)下载。从tcga下载的数据中,甲基化cpg位点选自肝癌组织样本(n=379),而非甲基化cpg位点另外选自其他组织的癌样本(n=7260)。标准是在50%或更多的样本被甲基化的情况下分类为甲基化,并且在90%或更多的样本未被甲基化的情况下分类为未甲基化。
[0047]
然后,进一步选择除肝癌以外的90%的癌样本(泛肿瘤)中的非甲基化cpg位点,以及除肝脏以外的90%的正常组织(泛正常)中的非甲基化cpg位点。
[0048]
在图1中,示意性地示出了发现本发明的肝脏组织特异性标记物的过程。
[0049]
实施例2:肝脏组织特异性甲基化标记物的性能的验证
[0050]
上述实施例1中发现的肝脏组织特异性标记物的可变重要性图(varimp图)是通过随机森林法制作的,如图2所示。在图2中,x轴的准确度平均减少量(meandecreaseaccuracy)表示各标记物有助于提高肝脏组织/其他组织的分类准确度的程度,y轴的基尼指数平均降低量(meandecreasegini)表示各标记物有助于改善肝脏组织/其他组织分类中不纯度的程度。换言之,较大的值意味着该标记物可以清楚地区分肝脏组织与其他组织。
[0051]
然后,通过将实施例1中使用的癌组织的甲基化数据随机分为训练数据和验证数据来测试肝脏组织特异性标记物。结果,如下表1所示,可以确认发现的标记物以高效率和
准确度区分肝脏组织和其他组织。肝脏组织特异性标记物的性能显示其准确度为0.9988、灵敏度为0.9884、特异性为0.9994和曲线下面积(auc)为0.9999。
[0052]
[表1]
[0053][0054]
另外,为了根据标记物的数量确认性能,用不同的标记物的数量进行5次试验,确认平均值。结果,如表2和图3所示,发现当使用两种或更多种标记物时,性能汇集到0.999。
[0055]
[表2]
[0056] 1种标记物2种标记物3种标记物4种标记物5种标记物6种标记物准确度0.99160.99760.997360.997840.997960.9982卡帕(kappa)0.91420.975260.972640.977620.978860.98142灵敏度0.9230360.9696860.9650340.969630.9719540.976718特异性0.9953380.9991180.9991180.999370.999370.999362正预测值0.9150480.9837640.9837640.9881720.9883180.988428负预测值0.9958440.9983640.9981120.9983640.998490.998742平衡的准确度0.9591880.9844020.9820780.98450.9856640.988048
[0057]
此外,进一步验证了在可变重要性图中发现具有高重要性的两种标记物(cg12137206、cg03792768)的性能。结果,如下表3所示,可以确认这些标记物清楚地将肝脏组织与其他组织区分开来。结果显示其准确度为0.9982,灵敏度为0.9647,特异性为1,曲线下面积(auc)为0.9939。
[0058]
[表3]
[0059][0060]
基于以上结果,最终选择cg12137206、cg03792768标记物作为肝脏组织特异性标记物。在下表4和表5中,描述了cg12137206、cg03792768标记物的信息和序列。
[0061]
[表4]
[0062][0063]
[表5]
[0064][0065]-在表中,[cg]是指每个探针的目标甲基化位点。
[0066]
实施例3:最终选择的肝脏组织特异性标记物的验证
[0067]
最终选择的cg12137206和cg03792768标记物在活体组织和其他组织中的甲基化水平得到确认。结果,如图4的a所示,可以看出在正常肝脏组织(肝脏n)和肝癌组织(肝脏t)中,两种标记物以高水平甲基化,如图4的b所示,可以看出在所有其他癌组织和其他正常组织中,两种标记物具有低甲基化水平。
[0068]
在图5至图7中,示出了在肝脏组织和其他组织中确认的cg12137206和cg03792768标记物的甲基化水平,并在表6至表8中描述了标记物的交叉验证结果。
[0069]
[表6]
[0070][0071]
[表7]
[0072]
组织tcga样本数量准确度_n准确度_t膀胱(bl)blca43411乳房(br)brca86911宫颈(ce)cesc31211
结肠(co)coad33511直肠(re)read10611食道(es)esca20211胶质母细胞瘤(gb)gbm15411头颈部(hn)hnsc58011肾脏(ki)kirc48011肾脏(ki)kirp32111肺(lu)luad49211肺(lu)lusc41211胰腺(pa)paad19511副神经节瘤(pc)pcpg18711前列腺(pr)prad54911胃(st)stad39711肉瘤(sa)sarc26911皮肤(sk)skcm47511胸腺(th)thca57411胸腺(th)thym12611子宫(uc)ucec46611
[0073]
[表8]
[0074][0075]
从目前的结果可以看出,cg12137206和cg03792768标记物在肝脏组织中具有高甲基化水平,而在其他组织中具有低甲基化水平,因此这两种标记物可以作为肝脏组织特异
性标记物。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献