一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于检测PAH基因突变的非诊断方法及探针的设计方法与流程

2023-04-05 06:17:57 来源:中国专利 TAG:

用于检测pah基因突变的非诊断方法及探针的设计方法
技术领域
1.本公开涉及苯丙酮尿症早筛技术领域,特别涉及一种用于检测pah基因突变的非诊断方法及探针的设计方法。


背景技术:

2.苯丙酮尿症(phenylketonuria,pku)是一种最常见的常染色体隐性遗传代谢病,因苯丙氨酸羟化酶(phenylalanine hydroxylase,pah)基因突变导致pah活性降低或丧失,苯丙氨酸(phenylalanine,phe)在肝脏中代谢紊乱所致。未经治疗的pku患者血液和组织中phe浓度增高,由于过量的phe和旁路代谢产物的神经毒性作用而逐渐出现发育迟缓、智力缺陷、语言障碍、小头畸形、孤独症、皮肤湿疹和癫痫抽搐等不同程度且不可逆的智能损害。pku发病率有种族和地区差异,我国的pku发病率约为1/11,188,其中北方地区发病高于南方地区。
3.pah基因定位于染色体12q23.2,全长约171kb,共包含13个外显子和12个内含子。pah基因突变广泛,分布在13个外显子和12个内含子的上、下游非翻译区。大多数pah变异为错义突变(58.3%),而移码突变(13.9%)、剪接变异(13.1%)、无义突变(6.9%)和同义突变(4.9%)则不常见。pah基因突变具有以下特点:1.突变位置多变:在所有外显子、内含子、5'utr和3'utr区均发现突变;2.突变类型多样:最常见的是错义突变,其他还有缺失突变、剪切突变、沉默突变、无义突变、插入突变等;3.突变呈现明显的异质性:不同种族和地域pah基因突变位点和形式各不相同。
4.传统的pah基因产前诊断主要通过羊膜腔穿刺术(简称羊穿)、绒毛穿刺术或脐带血穿刺术等有创操作获取胎儿细胞进行检测,均属于侵入性产前诊断。侵入性产前诊断虽然准确度高,但仍旧存在约1%的流产风险。
5.1997年,lo等在妊娠男性胎儿孕妇的外周血中检测到y染色体性别决定基因,证实孕妇外周血中存在胎儿游离dna cffdna。cffdna主要来源于胎盘合体滋养层细胞,以小片段dna形式存在,cffdna的浓度随孕周的增加而增大,可达20%。基于cffdna这一特性的无创产前检测(nipt)技术应用而生,nipt对于胎儿21/18/13三体的检测,因其方法的高灵敏度、高准确度已经普遍用于临床,并逐步向其他染色体异常检测扩展。目前绝大多数单基因病的无创检测都需要依赖于先证者的样本来构建胎儿的单倍体型,从而判断胎儿是否患有单基因遗传病。这在极大程度上限制了无创单基因病检测成为一种临床筛查技术。


技术实现要素:

6.为了解决现有技术中存在的上述问题,本公开的目的是为了提供一种非侵入性的仅使用孕妇及其丈夫的外周血样本来确定胎儿的pah基因的基因型,从而进行苯丙酮尿症早筛的用于检测pah基因突变的非诊断方法及探针的设计方法。
7.为了实现上述目的,本公开采用了以下的技术方案:
8.本公开还提供了一种用于检测pah基因突变的非诊断方法,上述方法包括:
9.步骤101、从待检测的胎儿的父母的白细胞中获取基因组dna;
10.步骤102、基于上述基因组dna形成二代测序文库;
11.步骤103、从孕妇的血浆中获取游离dna;
12.步骤104、基于上述游离dna形成游离dna全基因组文库;
13.步骤105、将上述二代测序文库和上述游离dna全基因组文库采用探针捕获杂交,形成靶序列捕获文库;
14.步骤106、对上述靶序列捕获文库进行高通量测序,得到测序原始数据;具体地,对上述靶序列捕获文库采用二代测序平台进行高通量测序,得到测序原始数据;
15.步骤107、对上述测序原始数据进行处理得到clean数据;
16.步骤108、基于上述clean数据确定胎儿pah基因的基因型。
17.在一些实施例中,基于上述基因组dna形成二代测序文库,包括:
18.采用tell-seq平台对上述基因组dna进行标码、稳化、酶法片段化dna、清洗微珠、扩增文库、清理文库及质检和量检文库形成二代测序文库。
19.在一些实施例中,对上述测序原始数据进行处理得到clean数据,包括:
20.对上述测序原始数据切除接头序列、低质量碱基、过滤小片段并比对到参考基因组(ucsc genome browser on human(grch37/hg19))的相应位置,去除由于pcr扩增偏好引起的重复序列,得到clean数据。
21.在一些实施例中,基于上述clean数据确定胎儿pah基因的基因型,包括:
22.对上述clean数据进行分析,得到游离dna中的单核苷酸变异信息和插入缺失突变信息;
23.对上述游离dna中的单核苷酸变异信息和插入缺失突变信息进行注释,对正常人数据库中所有的单核苷酸变异信息和插入缺失突变信息进行注释,去除游离dna中的正常人的单核苷酸变异信息和插入缺失突变信息;
24.对剩余的单核苷酸变异信息和插入缺失突变信息对应的错义突变和剪切位点改变进行致病性预测;
25.对上述二代测序文库中父母双方的基因信息进行比对,获取父母双方的突变信息;具体地,采用tell-seq数据分析软件longranger分别对上述二代测序文库中记载父母双方的基因信息的tell-seq数据进行比对,获取父母双方的突变信息;
26.基于上述父母双方的突变信息和上述致病性预测结果进行分析,确定胎儿基因型。
27.在一些实施例中,上述基于上述父母双方的突变信息和上述致病性预测结果进行分析,确定胎儿基因型,包括:
28.基于上述父母双方的突变信息按照位点进行合并分类,统计单倍型区域,得到父母的单倍型信息;
29.计算胎儿dna浓度;
30.进行母系遗传单倍型分析:基于上述父母的单倍型信息,获取包含pah基因的单倍体区域,采用基于序贯概率比检验分类的rhdo算法获取胎儿遗传母亲的单倍型,通过获取等位基因之间的剂量平衡性,确定pah基因区域遗传的单倍型块,计算胎儿遗传单倍体块的阈值公式如下:
[0031][0032][0033]
其中,
[0034][0035][0036]
upper boundary为胎儿遗传单倍体块的上限,lower boundary为胎儿遗传单倍体块的下限,1200为优势比,q0为当胎儿遗传母亲hap ii时,hap i等位基因占比;q1为当胎儿遗传母亲的hapi时,hapi等位基因占比;
[0037]
当a型snp进行rhdo分析时,q0=0.5,q1=0.5 f/2其中f为胎儿dna浓度,备择假设是母亲血浆中hapi含量过多;当β型snp进行rhdo分析时,q1=0.5,q0=0.5 f/2;备择假设是母亲血浆中hapi含量过少;rhdo分析在目标基因突变位点所在单倍型体积累snp深度的计数,直到突变位点的单倍型被分类;
[0038]
进行父系遗传单倍型分析:为分析父系遗传的单倍型,提取母亲纯合父亲杂合的snp;基于上述母亲纯合父亲杂合的snp,统计母亲血浆中对应位点的突变信息,得出父亲遗传的单倍型。
[0039]
在一些实施例中,上述计算胎儿dna浓度的计算方法为基于胎儿特异性等位基因读数计算胎儿dna浓度,包括:
[0040]
通过统计母亲血浆中第一类点和第三类点等位基因频数,即统计父母同为纯合但等位基因不同的位点或父亲杂合,母亲纯合的位点等位基因的读数,采用下式进行胎儿dna浓度的计算:
[0041][0042]
其中,p为父亲遗传胎儿单倍型的等位基因计数,q为母亲与胎儿共享的等位基因计数。
[0043]
在一些实施例中,上述计算胎儿dna浓度的计算方法为采用伽马分布模拟胎儿dna浓度,包括:
[0044]
提取母亲血浆vcf文件中突变频率小于0.25的低频突变;采用最大似然估计的方法,使用所有的突变频率≤0.25或≥0.75进行伽马分布拟合,确定最优的伽马分布函数,其中最大似然估计定义为:
[0045][0046]
xi是突变频率值,f(
·
|θ)是待估计的密度分布函数—伽马密度分布函数,使用r
语言来拟合伽马函数,求得伽马分布的期望值,期望值为胎儿dna浓度。
[0047]
在一些实施例中,本公开中对上述游离dna中的单核苷酸变异信息和插入缺失突变信息进行注释,对正常人数据库中所有的单核苷酸变异信息和插入缺失突变信息进行注释使用annovar软件,上述annovar软件同时关联的数据库包括但不限于dbsnp,1000g,esp6500,hgmd,omim等snp数据库。
[0048]
在一些实施例中,上述基因组dna优选为完整性较好的基因组dna,特别优选dna片段大于50kb的样品。
[0049]
在一些实施例中,二代测序平台可选本领域已知的类型,包括但不限于nextseq500、x ten、novaseq的illumina平台。
[0050]
本公开的方法可用于诊断或非诊断用途,上述非诊断用途的例子包括但不限于苯丙酮尿症科研、基因遗传病科研、疾病数据统计、人口数据统计、保险和医疗规划用人群风险状态普查等。
[0051]
本公开提供了一种用于检测pah基因突变的探针的设计方法,包括:
[0052]
步骤201、获取pah基因全长并向上下游各延伸1mb;
[0053]
步骤202、去除重复序列;具体地,采用repeatmask软件分析去除重复序列;
[0054]
步骤203、将从第一个碱基开始的78bp的序列作为探针,向后移动n个碱基,截取78bp的序列作为探针,直至最后一个78bp。
[0055]
在一些实施例中,上述探针的密度基于参考序列中gc含量进行调整,调整方法参见下式:
[0056]dgc
=a a*10*|gc-0.5|
[0057]
其中,d
gc
代表gc含量下的探针密度,a代表gc含量为50%时候的探针密度,为20,gc代表gc含量。
[0058]
在一些实施例中,上述探针为生物素标记的探针。
[0059]
本公开提供的上述技术方案的有益效果至少包括:
[0060]
本公开的一种用于检测pah基因突变的非诊断方法及探针的设计方法,本公开的方法可以采用胎儿的父母的外周血判断胎儿pah基因的基因型,属于非侵入性的检测方法,避免了在检测过程中可能出现的流产风险,同时,采用tell-seq的linked-read测序结合捕获技术,分析父母亲基因组的单倍型并鉴定致病基因位点周围的snp点来判断胎儿基因型,检测准确度高,测序成本低。本公开设计的探针可以特异性的对pah基因中所有的位点的单核苷酸变异和插入缺失突变进行捕获,不限于pah基因中的某些位点,提高了苯丙酮尿症早筛的准确性。
具体实施方式
[0061]
下面将结合具体实施例方式对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。应理解,这些详细说明只是对本公开的示例性实施方式的描述,而非以任何方式限制本公开的范围。
[0062]
下述实施例的方法如无特殊说明,均为常规实验方法。
[0063]
下述实施例实验使用的试剂、耗材等,如无特殊说明,均可以从商业途径得到。且下述实施例实验使用的试剂、耗材等均为示例,本公开对此不做一一限定。
[0064]
实施例1构建父母单倍型方法建立
[0065]
一、目标区域探针设计及制备
[0066]
1.探针设计:
[0067]
从ucsc数据库获取pah基因全长并向上下游各延伸1mb,采用repeatmask软件分析去掉重复序列,从第一个碱基开始截取78bp的序列做探针,再依次往后移动n个碱基,截取78bp的序列做探针,直到最后一个78bp。根据参考序列中gc含量的不同,调整探针的密度,探针的密度调整方法见下式:
[0068]dgc
=q a*10*|gc-0.5|
[0069]
其中,d
gc
代表gc含量下对应的探针密度,a代表gc含量为50%时候的探针密度,为20,gc代表gc含量。
[0070]
2.将设计的探针序列合成探针后进行生物素标记及纯化,得到生物素标记探针,具体包括:
[0071]
2.1将各条探针等摩尔数混合,用生物素标记的通用引物扩增;
[0072]
2.2用纯化试剂盒纯化扩增产物,作为示例,纯化试剂盒选用商用试剂盒minelute pcr purification kit(qiagen,28006);
[0073]
2.3纯化产物用myone链酶亲和素磁珠(invitrogen,35602)结合,naoh溶液处理,洗脱未生物素标记的探针;
[0074]
2.4用100℃预热的甲酰胺液洗涤磁珠,使探针从磁珠上分离下来;
[0075]
2.5乙醇沉淀洗脱液,得到生物素标记的探针。
[0076]
二、基因组dna提取
[0077]
1、从外周血中分离血浆、白细胞
[0078]
1)用edta抗凝血管采集待测胎儿父母的外周血各10ml,4℃、1600g离心15min,收集上清1及中间层分别置于不同的低吸附离心管中。
[0079]
2)将上述上清1在12000rpm离心5min,收集上清2置于低吸附离心管,上清2即为血浆。
[0080]
3)向步骤1)中的储存中间层的低吸附离心管中加1ml细胞裂解液,使用移液器吸打混匀,4℃放置15min,放置期间每5min上下颠倒3-5次;
[0081]
4)完成步骤3)后,500g离心10min,
[0082]
5)弃去步骤4)中离心后的上清液,加入1ml细胞裂解液,使用移液器吸打混匀;
[0083]
6)重复步骤4)和步骤5)两次,弃去上清液,保留沉淀即白细胞;
[0084]
2、基因组dna提取
[0085]
将获得的胎儿父母的白细胞采用magattract hmw dna kit(qiagen,67563)进行提取,获得gdna,测定浓度及琼脂糖凝胶电泳检测基因组dna的完整性,完整性需大于50kb。
[0086]
三、文库制备
[0087]
将获得的大于50kb的较完整基因组dna精确地稀释到1ng/μl,采用转座酶关联长度长测序(transposase enzyme linked longread sequencing;tell-seq)系统及相关试剂制备二代测序文库,具体涉及试剂有tell-seq
tm wgs library prep kit,ht24、tell-seq
tm library multiplex primer kit(pn100003)、tell-seq
tm illumina sequencing primer kit(pn100004)。具体包括:
[0088]
1、tell bead与dna分子进行混合完成dna标码,在稳定剂的作用下将标码好的dna进行稳化;
[0089]
2、利用标记酶和外切酶将稳化好的dna进行片段化,随后将片段化的dna进行纯化;
[0090]
3、对纯化好的dna进行pcr扩增,将有标签序列的文库dna从磁珠上释放出来形成tell-seq二代测序文库。
[0091]
四、靶向捕获
[0092]
靶向捕获试剂参照专利201810580442.6
[0093]
1、配制富集体系。富集体系为100μl,由48μl待测基因组dna的二代测序文库、12μl富集缓冲液、5μl探针和经过65℃预热的35μl杂交缓冲液组成。
[0094]
2、完成步骤1后,取上述富集体系,置于pcr仪进行过夜杂交富集,杂交时间至少16h,得到富集产物。
[0095]
反应程序:95℃7min,65℃16h以上。
[0096]
3、链霉亲和素包被磁珠的溶液的获得,其中,链霉亲和素包被磁珠在保存液中保存,进行这一步的目的为去除保存液。具体包括:
[0097]
(1)取低吸附离心管,加入50μlm-280链霉亲和素磁珠,然后置于磁力架1min。
[0098]
(2)完成步骤(1)后,弃上清,加入50μl文库结合缓冲液,重悬磁珠,然后短暂离心。
[0099]
(3)取完成步骤(2)后的低吸附离心管,置于磁力架1min,弃上清,然后加入50μl文库结合缓冲液,重悬磁珠。
[0100]
(4)取完成步骤(3)后的上述低吸附离心管,置于磁力架1min,弃上清,然后加入50μl文库结合缓冲液,重悬磁珠,得到链霉亲和素包被磁珠的溶液。
[0101]
4、共孵育捕获
[0102]
(1)向含有链霉亲和素包被磁珠的溶液的低吸附离心管中,加入步骤2获得的全部的富集产物,涡旋震荡5sec,然后置于室温的旋转混匀仪上1h。
[0103]
(2)将含有旋转混匀好的溶液的低吸附离心管,置于磁力架1min,弃上清。
[0104]
5、洗涤和pcr扩增
[0105]
(1)取完成步骤4后的低吸附离心管,加入500μl漂洗缓冲液1,混匀,置于旋转混匀仪旋转15min。
[0106]
(2)取完成步骤(1)后的低吸附离心管,置于磁力架上静置2min,弃上清。
[0107]
(3)取完成步骤(2)后的低吸附离心管,加入已65℃预热的500μl漂洗缓冲液2,65℃下孵育10min。
[0108]
(4)取完成步骤(3)后的低吸附离心管,置于磁力架上静置2min,弃上清。
[0109]
(5)重复步骤(4)两次。
[0110]
进行步骤(1)~步骤(5)的目的为将没有与m-280链霉亲和素磁珠结合的探针洗掉。
[0111]
(6)取完成步骤(5)的低吸附离心管,加入30μl文库富集洗脱液,重悬磁珠,置于室温旋转混匀仪10-20min。
bwa.sourceforge.net/)比对到参考基因组hg19的相应位置。
[0134]
3、用gatk软件(网址为:https://software.broadinstitute.org/gatk/)去除由于pcr扩增偏好引起的重复序列,然后分析数据,得到单核苷酸变异(single nucleotide variation,snv)和插入缺失突变(inserts and deletions,indel)的相关信息。
[0135]
4、利用annovar软件(网址为:http://annovar.openbioinformatics.org/en/latest/)对上一步得到的相关信息中所有的snv和indel进行注释,然后筛选掉正常人数据库(包括千人基因组计划(网址为:http://www.1000genomes.or/)、exome variant server(网址为:http://evs.gs.washington.edu/evs/)和exac(网址为:http://exac.broadinstitute.org/))中频率小于0.05的突变位点,错义突变使用sift软件(网址为:http://sift.jcvi.org/)、polyphen-2软件(网址为:http://genetics.bwh.harvard.edu/pph2/)、mutationtaster软件(网址为:http://www.mutationtaster.org/)和gerp 软件(网址为:http://mendel.stanford.edu/sidowlab/downloads/gerp/index.html)进行致病性预测和保守性预测,剪切位点的改变用spidex软件(网址为:http://www.deepgenomics.com/spidex)分析其致病性。
[0136]
5、用tell-seq数据分析软件longranger分别对父母双方的tell-seq数据进行比对,得到父母双方的突变信息,用vcf文件储存。
[0137]
6、胎儿基因组遗传突变分析
[0138]
6.1、为确定胎儿基因组遗传突变信息,将储存父母双方突变信息的vcf文件按照位点进行合并分类并统计单倍型区域,如下表1所示;
[0139]
表1
[0140][0141]
位点分类解释如下:父亲是纯合的,母亲是纯合的,且碱基不同的位点为第一类点;父亲是纯合的,母亲是纯合的,且碱基相同的位点为第二类点;父亲是杂合的,母亲是纯合的位点为第三类点;父亲是纯合的,母亲是杂合的位点为第四类点,当父亲的基因型与母亲在该位点第一单倍型(hapi)相同时,这种第四类点被标记为α型snp,当父亲的基因型与母亲在该位点第二单倍型(hapii)相同时,这种第四类点被标记为β型snp;父亲是杂合的,
母亲是杂合的位点为第五类点。如下表2所示。
[0142]
表2
[0143]
snp分类父亲母亲1a|ac|c2a|aa|a3a|ca|a4a|aa|cα4a|ac|aβ5a|ca|c
[0144]
6.2、计算胎儿dna浓度
[0145]
胎儿dna浓度决定判断胎儿遗传单倍体型阈值,影响两种单倍型的分离趋势,因此准确的计算胎儿dna浓度对后续胎儿单倍型的确定,起着至关重要的作用。本公开采用两种方法计算胎儿dna浓度。通过以下两种计算方法,综合得出胎儿dna浓度。
[0146]
6.2.1胎儿特异性等位基因读数计算胎儿dna浓度
[0147]
通过统计母亲血浆中6.1展示的第一类点和第三类点等位基因频数,分别进行胎儿dna浓度的计算,即统计父母同为纯合但等位基因不同的位点或父亲杂合,母亲纯合的位点等位基因的读数进行计算,计算方法如下式:
[0148][0149]
其中,p为父亲遗传胎儿单倍型的等位基因计数,q为母亲与胎儿共享的等位基因计数。
[0150]
6.2.2伽马分布模拟胎儿dna浓度
[0151]
提取母亲血浆vcf文件中突变频率小于0.25的低频突变。采用最大似然估计的方法,使用所有的突变频率≤0.25或≥0.75进行gamma分布拟合,确定最优的gamma分布函数,其中最大似然估计定义为:
[0152][0153]
xi是突变频率值,f(
·
|θ)是待估计的密度分布函数——gamma密度分布函数,使用r语言来拟合gamma函数,求得gamma分布的期望值,期望值为胎儿dna浓度。
[0154]
6.3、母系遗传单倍型分析
[0155]
根据6.1得到的父母单倍型snp表,筛选包含目标基因的单倍体区域,采用基于序贯概率比检验(sprt)分类的rhdo算法推导胎儿遗传母亲的单倍型。通过估计等位基因之间的剂量平衡性,确定目标基因区域遗传的单倍型块。计算胎儿遗传单倍体块的阈值公式如下:
[0156]
[0157][0158]
其中,
[0159][0160][0161]
1200为优势比;q0为当胎儿遗传母亲hapii时,hapi等位基因占比;q1为当胎儿遗传母亲的hapi时,hapi等位基因占比。
[0162]
当a型snp进行rhdo分析时,q0=0.5,q1=0.5 f/2其中f为胎儿dna浓度。备择假设是母亲血浆中hapi含量过多。当β型snp进行rhdo分析时,q1=0.5,q0=0.5 f/2,备择假设是母亲血浆中hapi含量过少。rhdo分析在目标基因突变位点所在单倍型体积累snp深度的计数,直到突变位点的单倍型被分类。
[0163]
6.4、父系遗传单倍型分析
[0164]
为分析父系遗传的单倍型,提取步骤6.1得到的父母单倍型snp表中母亲纯合父亲杂合的snp。根据这些具有父亲特异遗传信息的位点,统计母亲血浆中这些位点的突变信息,得出父亲遗传的单倍型。
[0165]
实施例3采用实施例1、2方法检测胎儿苯丙酮尿症基因突变
[0166]
在孕妇知情同意的情况下,采集4个家系的孕妇及其丈夫外周血样本按照实施例1、实施例2的方法进行检测,检测父母(孕妇及其丈夫)单倍型结果见表3,通过分析父母双方的单倍型及胎儿遗传信息确定胎儿结果见表4,
[0167]
部分结果描述如下:
[0168]
1号家系:父亲携带pah-1238g》c突变,母亲携带pah-755g》a突变。通过实施例1、实施例2的方法构建父母单倍型hapi、hapii并判断胎儿遗传了父亲单倍型hapi、遗传母亲单倍型hapi,即胎儿遗传了父亲的pah-1238g》c突变、母亲的pah-755g》a突变,由此可见1号家系胎儿基因型为pah-1238g》c/755g》a复合杂合突变。这一结果与羊水穿刺检测结果一致。
[0169]
2号家系:父亲携带pah-833c》t突变,母亲携带pah-1238g》c突变。通过实施例1、实施例2的方法构建父母单倍型hapi、hapii并判断胎儿遗传了父亲单倍型hapi、遗传母亲单倍型hapii,即胎儿不携带母亲pah-1238g》c突变,携带父亲pah-833c》t突变,为杂合携带者。这一结果与羊水穿刺检测结果一致。
[0170]
表3
[0171]
[0172][0173]
表4
[0174]
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献