一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种DNA甲基化测序文库甲基化转化率的评估方法、应用、终端设备及存储介质与流程

2022-11-30 13:51:17 来源:中国专利 TAG:

一种dna甲基化测序文库甲基化转化率的评估方法、应用、终端设备及存储介质
技术领域
1.本发明属于基因检测技术领域,具体涉及一种dna甲基化测序文库甲基化转化率的评估方法、应用、终端设备及计算机可读存储介质。


背景技术:

2.dna甲基化是最早发现的基因表观修饰方式之一,在维持正常细胞功能、遗传印记、胚胎发育和肿瘤发生发展中起着重要作用,具体是在dna甲基化转移酶(dnmt)的作用下将甲基选择性地添加到胞嘧啶(c)上形成5
′‑
甲基胞嘧啶(5mc)。
3.随着高通量测序技术(ngs)的发展,全基因组水平分析5
′‑
甲基胞嘧啶成为可能,即dna甲基化测序。全基因组重亚硫酸盐甲基化测序(wgbs)可以实现全基因组范围内精确检测所有单个胞嘧啶的甲基化水平,是dna甲基化研究的金标准,其经典的转化方法是用重亚硫酸氢盐处理dna,dna中未甲基化的胞嘧啶会被转化成尿嘧啶(u),而5
′‑
甲基胞嘧啶(5mc)则不会被转化,但是其转化过程中需经过高温或者强碱处理,因此对模板损伤严重。酶学转化法则是首先使用tet2和氧化增强剂来保护经过修饰的胞嘧啶,tet2通过级联反应将5-甲基胞嘧啶(5mc)和5-羟甲基胞嘧啶(5hmc)氧化成5-羧基胞嘧啶(5cac),再利用脱氨酶apobec进行脱氨基处理,将胞嘧啶转化为胸腺嘧啶(t),而5-羟甲基胞嘧啶(5hmc)和5-羧基胞嘧啶(5cac)则不受影响。酶学转化法甲基化位点c-t转化效果与重亚硫酸氢盐相同,但是转化过程中避免了强碱或者高温等对dna极端反应条件,完美解决了重亚硫酸氢盐转化时模板损伤的问题。在dna甲基化测序过程中,无论哪种转化方法,c-x转化率(c转化成u,或者c转化为t)均无法达到100%,因此,在dna甲基化测序过程中,c-x转化率的评估对甲基化频率的评估就显得尤为重要。
4.在酶学转化法dna甲基化测序过程中,若未甲基化c不能被转化为t,则会被误判为甲基化状态,继而造成甲基化频率的高估。传统评估甲基化文库中c-x转化率的方法是在建库之初加入1%外源完全未甲基化λdna(线性双链完全未甲基化λ噬菌体dna,自甲基化酶缺陷型的大肠杆菌分离获得,ncbi reference sequence: nc_001416.1),下机后通过分析λdna甲基化水平,评估甲基化文库c-x转化率,该过程需要经过测序、分析等冗长的过程,耗时耗力,下机后甲基化转化率过低的数据很难被下游使用,也导致费用、资源等的浪费。此外,也有文献报道通过qpcr评估内参基因β-actin启动区域或者ddpcr(droplet digital pcr,微滴式数字pcr)评估alu重复序列方式快速评估甲基化文库c-x甲基化转化率,其原理是用特定区域甚至单个位点c-x转化率来评估甲基化文库c-x甲基化转化率。但是发明人在研究中发现,不同位点c-t转化率存在差异,部分位点c-t转化率与甲基化文库c-t转化率趋势并不相同,推测可能是因为酶学转化法dna甲基化测序是一种酶参与的反应,不同于重亚硫酸盐测序过程中仅是化学物质参与,前者与碱基序列相关,而后者完全不受碱基序列影响。
5.综上,通过某个基因或者某一类基因特定位点/区域建立质控标准并不一定适用
于酶学转化法甲基化文库甲基化转化率的质控,准确选择其特定位点/区域对甲基化文库c-x甲基化转化率,进一步准确评估甲基化频率具有重要的意义。


技术实现要素:

6.1. 要解决的问题本发明针对目前甲基化文库c-t甲基化转化率的评估方法中未考虑酶学转化法甲基化文库的特性(受碱基序列影响),从而导致基于某个基因或者某一类基因特定位点/区域(参照位点)建立的甲基化转化率评估方法并不能准确评估甲基化转化率的问题,提供了一种参照位点的筛选方法,该参照位点甲基化转化率与甲基化文库甲基化转化率变化趋势相似,该参照位点甲基化转化率可以用表征甲基化文库甲基化转化率,利用该参照位点甲基化转化率能够快速评估甲基化文库甲基化转化率,并用于dna甲基化检测中甲基化转化率的质控,方便快捷,解决了传统方法周期长耗时耗力的问题。
7.2. 技术方案为了解决上述问题,本发明所采用的技术方案如下:本发明提供了一种dna甲基化测序文库甲基化转化率的评估方法,该方法包括对待测文库的dna进行酶学甲基化转化处理后,通过参照位点的位点甲基化转化率与文库甲基化转化率之间的相关性评估文库甲基化转化率,所述参照位点的位点甲基化转化率与文库甲基化转化率相关,且能够通过函数拟合。参照位点的位点甲基化转化率与文库甲基化转化率相关是指在文库甲基化转化率较低的文库中,参照位点的位点甲基化转化率更低,且随着文库转化率升高而升高;能够通过函数拟合是指参照位点的位点甲基化转化率与文库甲基化转化率能够定量计算,从而使用参照位点的位点甲基化转化率计算文库甲基化转化率。
8.优选地,上述评估方法中参照位点在其上下游
±
10 bp内的其余位点的位点甲基化转化率与文库甲基化转化率不相关。
9.优选地,上述评估方法中参照位点可选自外源λdna,λdna(ncbi reference sequence: nc_001416.1)作为传统质控评估掺入外源基因,选择该基因无需增加实验操作,其作为外源基因组,所涉及引物及探针不会和人源基因组结合,在一定程度保证引物及探针结合特异性,选自外源λdna时在建库之初加入外源完全未甲基化λdna。
10.优选地,上述评估方法中参照位点可选自内源基因组非cpg位点,如β-actin、gapdh、alu基因。
11.优选地,上述评估方法中参照位点选自外源λdna基因组中位点4625位点或6443位点。
12.优选地,上述评估方法中照位点的位点甲基化转化率与文库甲基化转化率之间的相关性为:y=-0.4773x2 1.0395x 0.4313,其中y为文库甲基化转化率,x为参照位点甲基化转化率。
13.优选地,上述参照位点的位点甲基化转化率通过ddpcr的方法检测。
14.优选地,上述参照位点上游设计引物为seq id no:1,参照位点下游设计引物为seq id no:2,针对转化前c的探针为seq id no:3及转化后t的探针为 seq id no:4。
15.优选地,上述ddpcr的反应体系中模板浓度为1~10ng/20μl。
16.优选地,上述上游引物和下游引物的工作浓度为600~900 nmol/l,探针的工作浓度为200~300 nmol/l。
17.优选地,引物在扩增过程中的退火温度为52~58℃。
18.本发明还提供了上述参照位点的筛选方法,该方法利用c-t甲基化转化率差异文库筛选与转化率相关的参照位点,首先构建不同甲基化转化率的文库获得甲基化转化率差异文库;再获得各甲基化转化率差异文库中相应λdna所有c位点c-t位点转化率;统计λdna c位点c-t转化率与文库转化率的相关性,选择位点甲基化转化率与文库甲基化转化率相关,即在文库甲基化转化率较低的文库中,参照位点的位点甲基化转化率更低,且随着文库转化率升高而升高;且能够通过函数拟合的位点为参照位点。
19.本发明还提供了上述一种dna甲基化测序文库甲基化转化率的评估方法的应用,将其用于甲基化文库甲基化转化率快速质控中,评估文库甲基化转化率是否满足设定的质控阈值。
20.优选地,上述阈值不低于0.980,即当检测的文库甲基化转化率低于0.980时,判定文库质控不合格,无需安排上机测序,减少上机资源的浪费,具体质控阈值可以根据实际情况进行设定。
21.优选地,上述应用还包括评估检测的文库甲基化转化率后继而评估是否满足上机质控要求。
22.本发明还提供了一种终端设备,该设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时实现上述一种dna甲基化测序文库甲基化转化率的评估方法或上述一种dna甲基化测序文库甲基化转化率的评估方法的应用,即根据参照位点的位点甲基化转化率及参照位点的位点甲基化转化率与文库甲基化转化率之间的函数,计算并输出文库甲基化转化率;或者进一步地根据设定的质控阈值,当文库甲基化转化率低于设定的质控阈值时,输出文库质控不合格的结果,否则输出质控合格的结果。
23.本发明还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,所述计算机程序能够实现上述根据参照位点的位点甲基化转化率及参照位点的位点甲基化转化率与文库甲基化转化率之间的函数,计算并输出文库甲基化转化率;或者进一步地根据设定的质控阈值,当文库甲基化转化率低于设定的质控阈值时,输出文库质控不合格的结果,否则输出质控合格的结果。
24.3. 有益效果本发明与现有技术相比,其有益效果在于:(1)本发明的一种针对酶学转化的文库甲基化转化率检测方法及其应用,综合考虑的不同碱基序列对c-t转化率的差异性,弥补了酶学转化文库甲基化转化率检测的缺失。
25.(2)本发明的一种针对酶学转化的文库甲基化转化率检测方法及其应用,通过ddpcr检测λdna转化率,评估文库甲基化转化率,转化率低样本停止上机,减少了上机测序资源的浪费。
26.(3)本发明的一种针对酶学转化的文库甲基化转化率检测方法及其应用,选取λdna基因组中位点4625位点或6443位点为参照位点,其位点甲基化转化率与文库甲基化转化率之间能够通过函数拟合,且其上下游
±
10 bp内的其余位点的位点甲基化转化率与文
库甲基化转化率不相关,能够设计特异性探针,减少上下游位点的干扰。
附图说明
27.图1是c-t转化率差异文库中λdna c位点c-t转化率;图2是c-t转化率差异文库中λdna c位点c-t转化率;图3是c-t转化率差异文库中λdna c位点c-t转化率;图4是c-t转化率差异文库中λdna c位点c-t转化率;图5是λdna位点转化率与文库转化率相关图,其中x轴为λdna位点c-t转化率,y轴为相应文库c-t位点转化率。
具体实施方式
28.下面结合具体实施例对本发明进一步进行描述。
29.需要说明的是,本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”等用语,亦仅为便于叙述的明了,而非用以限定可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
30.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同;本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
31.实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
32.如本文所使用,术语“约”用于提供与给定术语、度量或值相关联的灵活性和不精确性。本领域技术人员可以容易地确定具体变量的灵活性程度。
33.如本文所使用,术语“......中的至少一个”旨在与“......中的一个或多个”同义。例如,“a、b和c中的至少一个”明确包括仅a、仅b、仅c以及它们各自的组合。
34.浓度、量和其他数值数据可以在本文中以范围格式呈现。应当理解,这样的范围格式仅是为了方便和简洁而使用,并且应当灵活地解释为不仅包括明确叙述为范围极限的数值,而且还包括涵盖在所述范围内的所有单独的数值或子范围,就如同每个数值和子范围都被明确叙述一样。例如,约1至约4.5的数值范围应当被解释为不仅包括明确叙述的1至约4.5的极限值,而且还包括单独的数字(诸如2、3、4)和子范围(诸如1至3、2至4等)。相同的原理适用于仅叙述一个数值的范围,诸如“小于约4.5”,应当将其解释为包括所有上述的值和范围。此外,无论所描述的范围或特征的广度如何,都应当适用这种解释。
35.实施例1本实施例提供甲基化文库甲基化转化率参照位点的选择,具体包括:通过酶学转化法随机建立不同c-t甲基化转化率的甲基化文库,即c-t甲基化转化率差异文库;通过高通量测序(ngs)获得c-t甲基化转化率差异文库的c-t甲基化转化率数据;获得各c-t甲基化转化率差异文库中相应的λdna(ncbi reference sequence: nc_001416.1,购买自thermo fisher scientific)所有c位点c-t转化率数据(完全转化位点是100%);
统计观察差异文库的c-t转化率与差异文库中λdna所有c位点c-t转化率之间的相关性。
36.结果分析:数据分析结果如图1-4所示,显示了λdna c位点c-t转化率在c-t甲基化转化率差异文库的表现,其中λdna c位置为c碱基在λ基因组(nc_001416.1)位置;w/c代表c位点位于双链核酸watson-crick,其中 代表watson链,-代表crick链;c类型、序列代表甲基化类型及对应碱基序列;转化率,第一列为甲基化文库的c-t转化率,其余为λdna对应c位点转化率。从中可以发现如下:(1)如图1所示,类型1位点(如位点5331),单个位点转化率与文库的转化率无相关性,在文库转化率较低的文库中,这些位点转化率高,随着文库转化率升高,位点转化率没有明显变化,不宜选择用单个位点的转化率表征文库的转化率;(2)如图2所示,类型2位点(如:位点4367),单个位点转化率与文库的转化率相关,在文库转化率较低文库中转化率更低(相较于文库c-t转化率),且随着文库转化率升高而升高,但是该位点的上下游多个位点的单个位点转化率也与文库的转化率相关,考虑探针特异性也不宜选择;(3)如图3-4所示,类型3位点(如:位点4625、6443),单个位点转化率与文库的转化率相关,在文库转化率较低文库中转化率更低(相较于文库c-t转化率),且随着文库转化率升高而升高,且在某个区域仅单个位点转化率与文库的转化率相关,最终选择这些位点所在区域设计引物及探针。
37.实施例2本实施例提供实施例1中的参照位点6443的位点甲基化转化率与文库甲基化转化率之间的相关性拟合,具体包括:选取65例已知甲基化转化率的甲基化文库,通过ddpcr检测参照位点6443的c-t转化率,引物及探针如表1所示,其结果如图5所示,通过拟合,参照位点6443的c-t转化率与文库的甲基化转化率相关性为y=-0.4773x2 1.0395x 0.4313,其中y为文库甲基化转化率,x为参照位点甲基化转化率。
38.表1备注:引物终浓度:900nmol/l ,探针终浓度250nmol/l。
39.实施例3本实施例提供一种针对酶学转化的甲基化文库的甲基化转化率的评估方法,该方法是在建库之初加入1%外源完全未甲基化λdna(线性双链完全未甲基化λ噬菌体dna,自甲基化酶缺陷型的大肠杆菌分离获得,ncbi reference sequence: nc_001416.1),选取λdna 6443位点为参照位点,对待测文库的dna进行酶学甲基化转化处理后,通过ddpcr的方法检
测转化后λdna中参照位点转化拷贝数/总拷贝数(t/(t c))比值,根据参照位点的位点甲基化转化率与文库甲基化转化率之间的相关性计算文库甲基化转化率。
40.选择实施例2中的12个样品进行验证,结果如表2所示,位点转化率与文库转化率一致性高(计算的文库转化率/实际转化率》99.00%),表明该方法可以通过位点转化率可以准确推测文库转化率。
41.表2实施例4本实施例提供样品的重复性实验,具体方法同实施例3。
42.结果如表3所示,参照位点转化率重复实验2次定性完全一致,且与文库转化率定性完全一致。
43.表3实施例5本实施例提供实施例3所述的一种针对酶学转化的甲基化文库的甲基化转化率的评估方法的应用,将其用于甲基化测序过程中甲基化文库的甲基化转化率的快速质控,甲基化文库构建完成后,直接利用上述评估方法评估甲基化文库的甲基化转化率,当评估的甲基化文库的甲基化转化率低于0.980时,判定甲基化文库质控不合格,不合格文库无需进行后续测序,减少上机测序资源的浪费。
44.从以上的描述中,可以看出,通过利用ddpcr检测本发明的参照位点的位点转化
率,可以快速评估酶学人源类甲基化文库的甲基化转化效率。文库构建完成后,直接检测评估,进行上机前文库质控,转化效率低的不合格文库无需进行后续测序,减少上机测序资源的浪费。
45.实施例6本实施例提供一种终端设备,该设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,获得参照位点的位点甲基化转化率后将其输入终端设备,处理器运行计算机程序,根据参照位点的位点甲基化转化率及参照位点的位点甲基化转化率与文库甲基化转化率之间的函数,计算并输出文库甲基化转化率。
46.实施例7本实施例提供一种终端设备,该设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,获得参照位点的位点甲基化转化率后将其输入终端设备,处理器运行计算机程序,根据参照位点的位点甲基化转化率及参照位点的位点甲基化转化率与文库甲基化转化率之间的函数,计算文库甲基化转化率,当文库甲基化转化率低于0.980时,输出甲基化文库质控不合格;否则,输出甲基化文库质控合格。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献