一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种检测样本中目标序列整合和突变的方法及其引物的设计方法和试剂盒与流程

2021-10-27 21:26:00 来源:中国专利 TAG:引物 方法 基因工程 分子生物学 突变


1.本发明涉及基因工程和分子生物学领域,具体而言,涉及一种检测样本中目标序列整合和突变的方法及其引物的设计方法和试剂盒。


背景技术:

2.人类乙型肝炎病毒(hbv)感染是肝硬化(lc)和肝细胞癌(hcc)最常见的病因之一。据统计,全球约有2.4亿人患有慢性hbv感染。每年由hbv感染引起的病毒性肝炎的发病和死亡的患者高达150万人。虽然预防乙肝病毒感染的疫苗现在已经广泛使用,但是目前还没有治疗慢性乙肝病毒的方法。
3.hbv整合和hcc的进展密切相关,相关统计显示,与hbv有关的肝癌病例中,大约有90%的病例发生了hbv的dna整合。相比之下,在癌旁组织中较少发现hbv整合。hbv整合在肝癌发生中的作用已经被多种假说证实,包括形成持续的hbv基因表达模板,诱导染色体不稳定,以及破坏癌症相关的基因。hbv整合在宿主细胞基因组中随机发生,然而,重复整合位点的发现揭示了引起肝细胞克隆性扩张的特异性驱动基因,为肝癌的发生提供了可能的解释。hbv在hcc组织中的整合已被广泛研究。复发性整合事件经常发生在编码人类端粒酶逆转录酶(htert)、混合谱系白血病4(mll4)和细胞周期蛋白e1(ccne1)的基因中。值得注意的是,纤维连接蛋白1(fn1)在癌旁组织中反复受到hbv整合的影响。
4.hbv属于肝病毒科(hepadnaviridae),由包膜病毒组成,其不完整双链dna基因组为3.2kb。hbv基因组包含四个部分重叠的开放阅读框(orfs):c,编码核衣壳(core)蛋白(hbcag)和分泌e抗原(hbeag);p,聚合酶蛋白(pol);s,包膜蛋白以及转录反式激活蛋白x。虽然hbv的突变可能发生在整个基因组中,但大多数以前发表的研究都集中在bcp区域(nt1751

1769),该区域主要受增强子ⅱ(nt1636

1744)的调控,并控制precore mrna和pre genome rna的转录。a1762t/g1764a是目前研究最多的bcp区突变热点,这两个突变点已被证明是识别hbv感染的hcc高危人群的重要生物标志物。然而,在hbv全基因组范围内的变异情况还缺乏相关研究。
5.循环游离细胞dna(cfdna)已被证明是一种强有力的无创血液来源性的生物标志物,用于癌症早期检测、监测癌症发展和预测癌症预后。在健康人群中,血浆cfdna主要来源于造血细胞。然而,在癌症患者中,它也可以在凋亡或坏死过程中从肿瘤细胞中释放出来,这被称为循环肿瘤dna(ctdna)。ctdna占cfdna的一部分,范围为0.1%

90%,ctdna的数量可以反映肿瘤患者的肿瘤发展情况。最近的研究发现,cfdna携带的遗传和表观遗传信息在hcc中具有重要的诊断和预后价值。然而,hbv在hcc cfdna中的整合/突变情况仍然未知。
6.全基因组测序(wgs)是实现同时检测cfdna中的整合/突变的理想方式,2012年《nature genetic》的研究中用wgs的方法检测了81例hbv阳性肝癌患者中的hbv整合情况,共得到399个整合位点。随后作者从399个整合位点中随机选取了32个整合位点进行pcr验证,有82%的整合位点得到验证。wgs是一种检测全面,且方法简单的方法。但是wgs的成本
高昂,且产生的数据量大,对分析wgs数据的计算机资源要求高。这两个缺点限制了wgs在hbv整合和突变检测中的应用。
7.探针捕获也是一种可以用来检测hbv整合的方法。2016年《nature communication》的研究中使用探针捕获的方法检测了426例hcc样本,共得到4225个hbv整合位点,随后作者随机选取了180个整合位点进行pcr验证,其中有81.1%的位点验证成功。探针捕获也是一种能在碱基水平检测hbv整合的方法,但是如果要覆盖各种hbv亚型,需要设计大量的探针,极大增加了捕获成本。此外,捕获的探针模板只能参考hbv的基因组序列,而cfdna中的目标序列是一部分人基因组一部分hbv基因组,捕获的效率也会受影响。
8.鉴于此,特提出本发明。


技术实现要素:

9.本发明的目的在于提供一种检测样本中目标序列整合和突变的方法及其引物的设计方法和试剂盒。
10.本发明是这样实现的:
11.第一方面,本发明实施例提供了一种检测样本中目标序列整合和/或突变的方法,其包括:获取待测样本中的cfdna,在所述cfdna片段的两端添加带有标签的环化接头,并将添加环化接头的cfdna片段环化;
12.以目标序列为模板设计多组背靠背引物,多组所述背靠背引物分别与所述目标序列上不同的目标区域互补,每组背靠背引物均包括前导链引物和后随链引物,所述前导链引物和所述后随链引物的扩增方向相反,且所述后随链引物与所述目标序列互补的区域位于所述前导链引物与所述目标序列互补的区域的上游;
13.将多组所述背靠背引物分为两个或两个以上的引物池,使得每个引物池中相邻两组背靠背引物对应的目标区域之间的间隔距离≥所述引物池的个数

(45~75);
14.采用两个或两个以上的所述引物池分别单独地对环化后的cfdna片段进行环化扩增,并对扩增后的产物进行测序分析。
15.第二方面,本发明实施例提供了一种引物的设计方法,应用于如前述实施例所述的检测样本中目标序列整合和/或突变的方法,其包括以目标序列为模板设计多组背靠背引物,多组所述背靠背引物分别与所述目标序列上不同的目标区域互补,每组背靠背引物均包括前导链引物和后随链引物,所述前导链引物和所述后随链引物的扩增方向相反,且所述后随链引物与所述目标序列互补的区域位于所述前导链引物与所述目标序列互补的区域的上游;
16.将多组所述背靠背引物分为两个或两个以上的引物池,使得每个引物池中相邻两组背靠背引物对应的目标区域之间的间隔距离≥所述引物池的个数

(45~75)。
17.第三方面,本发明实施例提供了一种用于检测目标序列整合和/或突变的试剂盒,其包括如前述实施例所述的引物的设计方法设计的引物组。
18.本发明具有以下有益效果:
19.本发明实施例提供了一种检测样本中目标序列整合和突变的方法及其引物的设计方法和试剂盒,基于上述引物设计原则,能够同时对目标序列(如病毒)的整合和突变进行高特异性的检测,为基因整合和基因突变的检测方法提供了新的思路。
amplification and resequencing technology),通过对外周血中游离的dna片段进行标记,环化,扩增和测序,能够定量的分析外周血游离dna片段所携带的突变。
36.本发明以csmart技术为基础,对其进行改进,将多组背靠背引物分为两个或两个以上的引物池,使得每个引物池中相邻两组背靠背引物对应的目标区域之间的间隔距离≥所述引物池的个数

(45~75),以大幅提高背靠背引物的扩增效率,同时有效提高检测灵敏度。具体地,上述“45~75”可以为45、50、55、60、65、70和75中的任意数值。
37.优选地,所有背靠背引物对应的目标区域的总覆盖率占所述目标序列总长的50%以上。本文中的“背靠背引物对应的目标区域”是指在扩增时,“背靠背引物与所述目标区域互补结合时的区域。在该设置范围下,能够进一步提高检测的灵敏度。
38.优选地,所述总覆盖率占所述目标序列总长的80%以上。在该设置范围下,能够进一步提高检测的灵敏度。更优选地,所述总覆盖率占所述目标序列总长的90%以上。更有选地,所述总覆盖率占所述目标序列总长的95%以上。
39.优选地,引物池的个数为4时,所述间隔距离的设置范围如下:180bp≤所述间隔距离≤300bp。在该设置范围内,能更有效地进行检测,且不会造成数据资源的浪费。
40.在没有进行限定时,每组背靠背引物中前导链引物的数量和后随链引物的数量无具体限制,可以为1条或多条;优选为2~8条。
41.优选地,当所述目标序列为具有多个亚型的序列时,每组所述背靠背引物中,所述前导链引物和/或所述后随链引物的条数≥2,以使该组背靠背引物能够对同一区域的不同亚型进行扩增检测。
42.当具有多个亚型时,所述目标序列为复数,因此采用针对同一区域的不同亚型设计同组不同的引物能够保证对多种亚型的同时检测,显著提高检测的灵敏度。
43.优选地,cfdna片段环化的方法如下:在样本中添加辅助成环序列,以使添加有环化接头的cfdna片段环化;
44.所述环化接头包括有相互连接的标签序列和接头序列,当环化接头连接于cfdna序列两端时,所述接头序列通过所述标签序列与cfdna片段相连;优选地,所述环化接头为y型,参照图2。
45.所述辅助成环序列上具有能够分别与2段接头序列互补配对的第一结合区域和第二结合区域,当第一结合区域与所述第二结合区域分别与所述cfdna片段两端的接头序列相连时,所述cfdna片段成环状。
46.优选地,所述辅助成环序列的序列长度为32bp。
47.优选地,辅助成环序列为:5
’‑
gtgcgtccctactctgtgtgcatgggacgcac
‑3’
,参照图3。
48.优选地,在环化扩增后,测序分析前,所述方法还包括在环化扩增产物序列的两端添加测序接头;优选地,所述测序接头为y型的测序接头。
49.优选地,在所述测序分析中,序列的起止点和标签相同的多个扩增产物被认为是重复的,只进行一次计数。
50.优选地,所述测序分析包括:去除扩增产物的测序接头后,将扩增产物根据重叠部分(overlap)进行组装;
51.基于引物的位置信息、环化接头以及标签信息,对组装后的序列进行重构;
52.将重构序列比对至参考序列和参考基因组的集合,根据比对信息和barcode信息
获得待测样本中初始cfdna模板序列。
53.优选地,在进行组装前,所述方法包括对扩增产物进行低质量过滤。
54.优选地,当检测样本中目标序列的整合时,所述测序分析还包括:将所有初始cfdna模板序列比对至所述参考序列和所述参考基因组的集合,并基于比对信息对cfdna模板序列进行过滤:
55.将初始cfdna模板序列上能够比对至所述参考序列上的区域标记为第一区域,能够比对至所述参考基因组上的区域标记为第二区域;
56.只保留同时具有所述第一区域和所述第二区域且所述第一区域和所述第二区域的长度≥50bp的cfdna模板序列,用于获取整合位点。不符合“同时具有所述第一区域和所述第二区域且所述第一区域和所述第二区域的长度≥50bp”的cfdna模板,则进行去除。
57.优选地,对cfdna模板序列进行过滤时,还包括基于比对信息进行筛选,只保留cigar信息为s/m的cfdna模板序列,用于获取整合位点。cigar为获取的简要比对信息表达形式,英文为concise idiosyncratic gapped alignment report,其以参考序列为基础,使用数字加字母表的形式表示比对结果。s为soft clip,为软跳过,m为alignment match,意为匹配。在本发明实施例中,仅对cigar信息出现s和m的cfdna模板进行保留,其余则进行去除。
58.优选地,所述方法还包括对检测获得的整合位点进行过滤,若一条cfdna模板序列上的所述第一区域和所述第二区域在交界处存在重叠,则将该重叠的部分视为归属于第一区域,用于判断获取最终的整合位点。“交界处存在重叠”是指目标序列的中的某个区域可能同时与参考序列和参考基因组比对上,在该种情况下,将该部分视为比对至参考序列更有利于检测结果的有效性。
59.优选地,当检测目标序列的突变时,所述测序分析还包括:将所有初始cfdna模板序列与参考序列进行比对,并基于对比结果和测序信息对检测得到的初始突变位点进行过滤:
60.若初始突变位点的测序深度小于10

,则去除该位点,反之则保留;基于测序中的测序深度,对结果进行筛选,这样设置更有利于提高检测结果的有效性。
61.若初始突变位点的vaf为1且群体基因频率大于0.9,则去除该位点,反之则保留。在该设置下,能有效排除单核苷酸多态性(snp)位点的干扰,使检测结果更具有分析价值。
62.优选地,所述目标序列为病毒序列。
63.优选地,所述目标序列为hbv,所述参考序列为hbv基因组序列,所述参考基因组为人类基因组序列;
64.参照图4,本发明实施例还提供了一种引物的设计方法,应用于如前述任一实施例所述的检测样本中目标序列整合和/或突变的方法,其包括以目标序列为模板设计多组背靠背引物,多组所述背靠背引物分别与所述目标序列上不同的目标区域互补,每组背靠背引物均包括前导链引物和后随链引物,所述前导链引物和所述后随链引物的扩增方向相反,且所述后随链引物与所述目标序列互补的区域位于所述前导链引物与所述目标序列互补的区域的上游;
65.将多组所述背靠背引物分为两个或两个以上的引物池,使得每个引物池中相邻两组背靠背引物对应的目标区域之间的间隔距离≥
66.180bp。
67.背靠背引物、目标序列、引物池等具体的实施方案同前述任意实施方式所述,不再赘述。
68.本发明实施例还提供了一种用于检测目标序列整合和/或突变的试剂盒,其包括如前述实施例所述的引物的设计方法设计的引物组。
69.优选地,所述目标序列为hbv,所述引物池的个数为4个,包括引物池a、引物池b、引物池c和引物池d;
70.所述引物池a包括14组引物:
71.引物组a1,前导链引物的序列选自seq id no.1~4中的至少一种,后随链引物的序列选自seq id no.5~8中的至少一种;引物组a2,前导链引物的序列选自seq id no.9~11中的至少一种,后随链引物的序列选自seq id no.12;引物组a3,前导链引物的序列选自seq id no.13~15中的至少一种,后随链引物的序列选自seq id no.16~19中的至少一种;引物组a4,前导链引物的序列选自seq id no.20~22中的至少一种,后随链引物的序列选自seq id no.23~25中的至少一种;引物组a5,前导链引物的序列选自seq id no.26~29中的至少一种,后随链引物的序列选自seq id no.30~33中的至少一种;引物组a6,前导链引物的序列选自seq id no.34~37中的至少一种,后随链引物的序列选自seq id no.38~41中的至少一种;引物组a7,前导链引物的序列选自seq id no.42~45中的至少一种,后随链引物的序列选自seq id no.46;引物组a8,前导链引物的序列选自seq id no.47~50中的至少一种,后随链引物的序列选自seq id no.51~53中的至少一种;引物组a9,前导链引物的序列选自seq id no.54~57中的至少一种,后随链引物的序列选自seq id no.58~60中的至少一种;引物组a10,前导链引物的序列选自seq id no.61~64中的至少一种,后随链引物的序列选自seq id no.65~68中的至少一种;引物组a11,前导链引物的序列选自seq id no.69~71中的至少一种,后随链引物的序列选自seq id no.72;引物组a12,前导链引物的序列选自seq id no.73~77中的至少一种,后随链引物的序列选自seq id no.78~81中的至少一种;引物组a13,前导链引物的序列选自seq id no.82~85中的至少一种,后随链引物的序列选自seq id no.86;引物组a14,前导链引物的序列选自seq id no.87~90中的至少一种,后随链引物的序列选自seq id no.91~93中的至少一种。
72.所述引物池b包括14组引物;
73.引物组b1,前导链引物的序列选自seq id no.94~97中的至少一种,后随链引物的序列选自seq id no.98~101中的至少一种;引物组b2,前导链引物的序列选自seq id no.102~105中的至少一种,后随链引物的序列选自seq id no.106~107中的至少一种;引物组b3,前导链引物的序列选自seq id no.108~111中的至少一种,后随链引物的序列选自seq id no.112~115中的至少一种;引物组b4,前导链引物的序列选自seq id no.116~119中的至少一种,后随链引物的序列选自seq id no.120~122中的至少一种;引物组b5,前导链引物的序列选自seq id no.123~126的至少一种,后随链引物的序列选自seq id no.127~130中的至少一种;引物组b6,前导链引物的序列选自seq id no.131~132中的至少一种,后随链引物的序列选自seq id no.133~135中的至少一种;引物组b7,前导链引物的序列选自seq id no.136,后随链引物的序列选自seq id no.137;引物组b8,前导链引物的序列选自seq id no.138,后随链引物的序列选自seq id no.139~142中的至少一种;引
物组b9,前导链引物的序列选自seq id no.143~145中的至少一种,后随链引物的序列选自seq id no.146~148中的至少一种;引物组b10,前导链引物的序列选自seq id no.149~150中的至少一种,后随链引物的序列选自seq id no.151~156中的至少一种;引物组b11,前导链引物的序列选自seq id no.157~161中的至少一种,后随链引物的序列选自seq id no.162~165中的至少一种;引物组b12,前导链引物的序列选自seq id no.166~170中的至少一种,后随链引物的序列选自seq id no.171~176中的至少一种;引物组b13,前导链引物的序列选自seq id no.177~180中的至少一种,后随链引物的序列选自seq id no.181~184中的至少一种;引物组b14,前导链引物的序列选自seq id no.185~186中的至少一种,后随链引物的序列选自seq id no.187~189中的至少一种。
74.所述引物池c包括13组引物:
75.引物组c1,前导链引物的序列选自seq id no.190~192中的至少一种,后随链引物的序列选自seq id no.193~195中的至少一种;引物组c2,前导链引物的序列选自seq id no.196~198中的至少一种,后随链引物的序列选自seq id no.199中的至少一种;引物组c3,前导链引物的序列选自seq id no.200~202中的至少一种,后随链引物的序列选自seq id no.203~205中的至少一种;引物组c4,前导链引物的序列选自seq id no.206~210中的至少一种,后随链引物的序列选自seq id no.211~216中的至少一种;引物组c5,前导链引物的序列选自seq id no.217~220中的至少一种,后随链引物的序列选自seq id no.221~222中的至少一种;引物组c6,前导链引物的序列选自seq id no.223~226中的至少一种,后随链引物的序列选自seq id no.227~230中的至少一种;引物组c7,前导链引物的序列选自seq id no.231~232中的至少一种,后随链引物的序列选自seq id no.233;引物组c8,前导链引物的序列选自seq id no.234~235中的至少一种,后随链引物的序列选自seq id no.236~238中的至少一种;引物组c9,前导链引物的序列选自seq id no.239~245中的至少一种,后随链引物的序列选自seq id no.246~251中的至少一种;引物组c10,前导链引物的序列选自seq id no.252,后随链引物的序列选自seq id no.253~255中的至少一种;引物组c11,前导链引物的序列选自seq id no.256~259中的至少一种,后随链引物的序列选自seq id no.260~263中的至少一种;引物组c12,前导链引物的序列选自seq id no.264~265中的至少一种,后随链引物的序列选自seq id no.266~269中的至少一种;引物组c13,前导链引物的序列选自seq id no.270~272中的至少一种,后随链引物的序列选自seq id no.273~276中的至少一种。
76.所述引物池d包括13组引物:
77.引物组d1,前导链引物的序列选自seq id no.277~279中的至少一种,后随链引物的序列选自seq id no.280;引物组d2,前导链引物的序列选自seq id no.281,后随链引物的序列选自seq id no.282~284中的至少一种;引物组d3,前导链引物的序列选自seq id no.285,后随链引物的序列选自seq id no.286;引物组d4,前导链引物的序列选自seq id no.287~292中的至少一种,后随链引物的序列选自seq id no.293~299中的至少一种;引物组d5,前导链引物的序列选自seq id no.300~302中的至少一种,后随链引物的序列选自seq id no.303~309中的至少一种;引物组d6,前导链引物的序列选自seq id no.310~311中的至少一种,后随链引物的序列选自seq id no.312~313中的至少一种;引物组d7,前导链引物的序列选自seq id no.314~316中的至少一种,后随链引物的序列选
自seq id no.317~319中的至少一种;引物组d8,前导链引物的序列选自seq id no.320~321中的至少一种,后随链引物的序列选自seq id no.322~323中的至少一种;引物组d9,前导链引物的序列选自seq id no.324~327中的至少一种,后随链引物的序列选自seq id no.328~330中的至少一种;引物组d10,前导链引物的序列选自seq id no.331,后随链引物的序列选自seq id no.332;引物组d11,前导链引物的序列选自seq id no.333~336中的至少一种,后随链引物的序列选自seq id no.337~340中的至少一种;引物组d12,前导链引物的序列选自seq id no.341~344中的至少一种,后随链引物的序列选自seq id no.345~347中的至少一种;引物组d13,前导链引物的序列选自seq id no.348~351中的至少一种,后随链引物的序列选自seq id no.352~355中的至少一种。
78.以下结合实施例对本发明的特征和性能作进一步的详细描述。
79.实施例1
80.本发明实施例提供了一种用于检测hbv整合和突变的试剂盒,其包括:引物池1~4,序列信息见表1~4。
81.表1引物池1
82.83.[0084][0085]
表2引物池2
[0086]
[0087]
[0088]
[0089][0090]
表3引物池3
[0091]
[0092]
[0093][0094]
表4引物池4
[0095]
[0096]
[0097][0098]
备注:表1~4中,gr为引物池;hbv

x1x2

x3

x4种,x1为数字,相同x1的引物为同一组;x2为字母f或r,f代表前导链引物,r代笔后随链引物;x3为字母,不同的字母代表不同的亚型;x4为数字,代表具有简并碱基的引物。
[0099]
实施例2
[0100]
本发明实施例提供了一种用于检测hbv整合和突变的方法,其包括:
[0101]
一、检测步骤
[0102]
a、血浆dna(cfdna)提取
[0103]
取2

4ml血浆,使用货号为55114的qiaamp circulating nucleic acid kit提取血浆dna。最后用45μl的洗脱缓冲液洗脱dna,取2μl qubit测定浓度。
[0104]
b:血浆dna补平加a
[0105]
制备表5中的反应混合液:
[0106]
表5反应混合液
[0107]
组分体积t4dna聚合酶缓冲液(10
×
)5μl血浆dna40.5μltaq0.5μlt4dna聚合酶2.0μl10mm dntp2.0μl总体积50μl
[0108]
pcr仪上反应:37℃:20min;72℃:20min;4℃:保持。将加a产物2
×
磁珠纯化,融于21μl buffer eb。
[0109]
c、环形接头连接
[0110]
制备表6中的反应混合液:
[0111]
表6反应混合液
[0112]
组分体积dna19μl2
×
快速连接酶缓冲液25μl7.5μm cycab适配子3μlt4dna连接酶(hc)3μl总体积50μl
[0113]
pcr仪上反应:20℃:15min;65℃:10min;4℃:保持。
[0114]
d、预文库构建
[0115]
pcr(体系100μl),制备表7中的反应混合液:
[0116]
表7反应混合液
[0117]
组分体积phusion pcr master mix(2
×
)50μlcycuniprimer(f

10μm,r

35μm)2μl连接适配子的产物50μl总体积102μl
[0118]
pcr反应条件如表8所示:
[0119]
表8反应条件
[0120][0121][0122]
e、磷酸化和环化反应
[0123]
配置磷酸化和环化体系如表9:
[0124]
表9配置磷酸化和环化体系
[0125]
组分体积连接酶buffer8μlbridge(10μm)4μl预文库产物40μltaq连接酶4μl总体积56μl
[0126]
pcr反应条件如表10所示:
[0127]
表10反应条件
[0128][0129]
f:外切酶消化
[0130]
在步骤e的反应体系中依次加入表11组分:
[0131]
表11组分
[0132]
组分体积exo i2μl
exo iii2μl
[0133]
反应条件如表12所示:
[0134]
表12反应条件
[0135]
37℃10min99℃4min4℃保持
[0136]
g、背靠背引物扩增
[0137]
采用如实施例1提供的引物池a~d,分别标记为hbv

gra、hbv

grb、hbv

grc和hbv

grd;配制如表13~16所示的pcr反应体系。
[0138]
表13反应体系
[0139]
组分体积phusion pcr master mix(2
×
)25μlhbv

gra primer mix(2

4umeach)10μl环化dna15μl总体积50μl
[0140]
表14反应体系
[0141][0142][0143]
表15反应体系
[0144]
组分体积phusion pcr master mix(2
×
)25μlhbv

grc primer mix(2

4umeach)10μl环化dna15μl总体积50μl
[0145]
表16反应体系
[0146]
组分体积phusion pcr master mix(2
×
)25μlhbv

grd primer mix(2

4umeach)10μl环化dna15μl总体积50μl
[0147]
pcr反应条件如表17所示:
[0148]
表17反应条件
[0149][0150]
pcr反应完后,以上四组pcr扩增产物各取10ul等体积混匀,立即使用45μl xp beads(0.9
×
)进行纯化,最后溶于25μl的buffer eb。
[0151]
h、上机文库的制备
[0152]
扩增后目标区dna修饰,配制pcr反应体系如表18所示:
[0153]
表18反应体系
[0154]
组分体积特异目标区产物23μl聚合酶缓冲液30μldatp(100mm)0.1μlklenow(3'

5'exo

)1μlt4 pnk1μl总体积55μl
[0155]
pcr仪上反应:37℃:20min;4℃:保持
[0156]
扩增后目标区域dna修饰,配置pcr反应体系如表19。
[0157]
表19反应体系
[0158]
组分体积末端修饰后产物55μlturseq适配子(25um)2μlt4dna连接酶(hc)3μl总体积60μl
[0159]
pcr仪上反应:20℃:15min;65℃:10min;4℃:保持
[0160]
连接反应完后,立即使用24μl xp beads(0.4
×
)进行纯化,最后溶于22μl的buffer eb。作为上机文库进行后续的q

pcr,上机文库大少为320bp(用于换算qpcr浓度),上机需混nextera的read1 sequencing primer。illumina公司novaseq进行300bp双端测序。
[0161]
二、数据分析
[0162]
a、数据指控
[0163]
使用fastqc(v0.11.5)和flexbar(v2.5)软件对测序下机数据进行指控和数据过滤,包括减去测序接头序列,去除测序读长小于50bp的dna片段,去除测序质量较低的dna片段。
[0164]
b、重构得到模板序列
[0165]
去除测序接头和低质量的序列后,用csmart中的fastq

join程序(version 1.3.1,https://expressionanalysis.github.io/ea

utils/)把有overlap的reads组装起
来,随后根据引物的位置和环化接头以及barcode信息对序列进行重构,随后用bwa

mem把重构后的序列比对到human

hbv的基因组上,根据barcode和比对位置得到血浆中的原始cfdna分子序列(模板序列)。同终止同起始同barcode的序列被认为是duplication,在后续分析中只计算一次。
[0166]
c、hbv整合检测
[0167]
得到原始的cfdna分子模板序列后,把序列再次比对到人类

hbv的基因组上,用软件检测hbv整合,整合筛选原则:
[0168]
(1)将初始cfdna模板序列上能够比对至所述参考序列上的区域标记为第一区域,能够比对至所述参考基因组上的区域标记为第二区域;
[0169]
只保留同时具有所述第一区域和所述第二区域且所述第一区域和所述第二区域的长度≥50bp的cfdna模板序列,用于获取整合位点;
[0170]
(2)对cfdna模板序列进行过滤时,还包括基于比对信息进行筛选,只保留cigar信息为s/m的cfdna模板序列,用于获取整合位点;
[0171]
(3)所述方法还包括对检测获得的整合位点进行过滤,若一条cfdna模板序列上的所述第一区域和所述第二区域在交界处存在重叠,则将该重叠的部分视为归属于第一区域,用于判断获取最终的整合位点。
[0172]
d、hbv突变检测
[0173]
得到初始cfdna模板序列后,把序列再次比对到人类

hbv的基因组上。用软件strelka(version 2.8.4)进行call突变。
[0174]
(1)因sim是用模板序列call的突变,为了保证结果的完整性,不对“lowdepth”的突变点进行过滤。
[0175]
(2)若初始突变位点的测序深度小于10

,则去除该位点,反之则保留。
[0176]
(3)高频突变的定义:样本数量大于10,且人群突变频率大于0.1的突变点。
[0177]
(4)为了避免snp的干扰,过滤那些vaf为1,人群频率大于0.9的突变点。
[0178]
验证例1
[0179]
本验证例对实施例2提供的方法进行检测有效性的验证。
[0180]
本发明使用改进后csmart技术

sim(csmart

based method),同时检测cfdna中hbv的整合和突变的情况并和组织进行比较。
[0181]
相对于现有的检测手段,sim可以较低成本检测cfdna中所有的hbv整合和突变情况。为了验证sim的准确性,本验证例在481例hcc样本和517例肝硬化样本中进行sim分析,并选取其中446例hcc样本进行wgs测序用于验证sim结果。
[0182]
在481例肝细胞癌(hcc)样本中,检测出321例发生了hbv整合,总计2141个整合基因(图5)。
[0183]
在517例肝硬化(lc)样本中,有315例发生了hbv整合,总计864个基因(图6)。
[0184]
hbv突变方面,在481例肝癌样本中筛选到了119个gtc型高频突变和109个gtb型高频突变。
[0185]
在517例肝硬化样本中,筛选出119个gtb型高频突变,109个gtc型高频突变(图7)。相对于现有检测hbv突变的方法,sim同时兼顾成本效益和检测全面性。
[0186]
本发明使用sim,对hbv整合和hbv的突变进行检测并和配对的组织低深度wgs的结
果进行对比(表20)。
[0187]
表20检测结果
[0188][0189]
在检测hbv整合方面,sim在hbv

tert的整合敏感性和特异性分别达到了0.56和0.91,准确性达到了89.91%,优于《nature genetic》报道的82%和《nature communication》报道的81.1%。sim检测hbv突变方面也有较好的表现。在hbv基因组中两个常见突变位点nt1762和nt1764中,sim的敏感性和特异性分别达到了0.65和0.83以及0.68和0.82。在保证hbv突变检测全面性的同时,也保证了准确性。
[0190]
本发明在csmart的基础上,根据hbv的特性,设计了一系列特异性引物,结合生信分析,得到一种高特异性、可以同时检测cfdna中hbv与宿主之间的整合和hbv突变的方法(sim)。本发明提供了一种检测宿主和病毒整合以及病毒突变的方法,通过本发明的方法,不仅可以同时检测整合和突变,还能降低检测费用,为后续的检测病毒整合/突变方法的探索,提供了新的思路。
[0191]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜