一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种肺癌MRD融合基因判定方法、装置、存储介质及设备与流程

2022-02-22 20:30:43 来源:中国专利 TAG:

一种肺癌mrd融合基因判定方法、装置、存储介质及设备
技术领域
1.本技术属于医学检测技术领域,具体涉及一种肺癌mrd融合基因判定方法、装置、存储介质及设备。


背景技术:

2.肺癌是发病率和死亡率增长最快,对人类健康和生命威胁最大的恶性肿瘤之一。目前手术切除和辅助治疗是肺癌的主要治疗方式,但是仍有一定比例的患者会出现肿瘤复发。如i期、ii期和iii期五年复发率分别为21%、36%和55%。识别高复发风险群体并及时干预处理,可以提高患者的总生存,改善生活质量。目前,临床上主要采用tnm分期评估肺癌患者的预后或复发风险,但还有待完善。循环肿瘤dna(ctdna)是由肿瘤细胞凋亡坏死释放到血液中的短dna片段,目前被广泛应用于肿瘤患者的早期诊断、用药指导、耐药监测等多个方面。国内外多项研究数据均显示,检测ctdna可以对肺癌患者进行个体化复发风险分层,为后续干预措施的决策提供更多维度参考信息。
3.目前,针对肺癌的融合基因的检出有专门用于ctdna分析的ngs panel,并且许多基因融合的问题是使用杂交捕获panel获得的,经典的肺癌融合基因主要包括alk、ret、ros1重排,现有技术中,针对这三类经典融合基因的鉴定存在不同的缺陷,例如融合基因的检出容易出现假阳性的问题,从而导致对融合基因检测的准确性差。


技术实现要素:

4.技术问题:针对现有对肺癌mrd融合基因的鉴定技术准确性差的问题,本技术提出一种肺癌mrd融合基因判定方法、装置、存储介质及设备,从而能够对肺癌患者的经典融合基因的检出进行准确的鉴定。
5.技术方案:第一方面,本发明提供一种肺癌mrd融合基因判定方法,包括:接收肿瘤组织、肿瘤血细胞和血浆的测序数据;根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列;在肿瘤血细胞和血浆的测序数据中追踪所述第一融合基因序列和第二融合基因序列,得到第一融合基因;对所述第一融合基因通过过滤血细胞中的融合基因,判定最终的经典融合基因,所述的经典融合基因为alk、ret和ros1。
6.进一步地,所述第一检测软件为fusionmap,第二检测软件为factera。
7.进一步地,所述利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列包括:利用第一检测软件进行融合基因分析,得到第一融合基因结果和第一比对结果;对所述第一融合基因结果进行条件过滤,得到第一融合基因序列;根据第一比对结果,利用第二检测软件得到第二融合基因结果,对所述第二融合
基因结果进行过滤,得到第二融合基因序列。
8.进一步地,所述对所述第一融合基因结果进行条件过滤包括:对第一融合基因结果按照softclipped reads序列的支持数大于或等于10进行过滤。
9.进一步地,对所述第二融合基因结果进行过滤包括:过滤多重比对位点;过滤已知数据库中假阳性位点基因,所述数据库为基于至少500例基线样本;若此融合在大于或等于2例样本中出现,则被列为黑名单融合位点;对于经典融合基因alk/ret/ros1位点的reads支持数要大于5,其他基因大于10。
10.进一步地,所述在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列包括:利用bwa软件,分别用肿瘤血细胞和血浆的测序数据对所述第一融合基因序列和第二融合基因序列进行比对,保留完全匹配到的融合基因,得到第一融合基因。
11.进一步地,所述通过过滤血细胞中的融合,判定最终的经典融合基因包括:针对第一融合基因,通过配对样本,过滤血浆中追踪到血细胞的胚系融合基因,只保留三类经典融合基因alk、ret和ros1的结果,确定该样本最终的融合基因。
12.进一步地,所述确定该样本最终的融合基因的方法为:分别利用第一检测软件和第二检测软件分别进行分析,若在任一检测软件中融合基因的报出符合筛选条件,则确定为最终的融合基因。
13.进一步地,所述方法还包括对第二检测软件进行优化,所述优化包括:添加factera软件默认没有输出的比对位置信息;优化第二软件的融合序列拼接方向,结合基因所在正负链信息与cigar值进一步优化融合方向,若基因在正链,则cigar值不变;若基因在负链,则cigar值取反向,得到矫正后的融合方向。
14.第二方面,本发明提供一种肺癌mrd融合基因判定装置,根据所提供的肺癌mrd融合基因判定方法对肺癌mrd融合基因,包括:数据接收模块,其被配置为用于接收肿瘤组织、肿瘤血细胞和血浆的测序数据;序列检出模块,其被配置为用于根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列;序列追踪模块,其被配置为用于在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列,得到第一融合基因;鉴定模块,其被配置为对第一融合基因通过过滤血细胞中的融合,判定最终的经典融合基因。
15.第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,所述计算机指令能够被处理器执行以实现本发明所提供的肺癌mrd融合基因判定方法。
16.第四方面,本发明提供一种电子设备,包括:本发明所提供的计算机可读存储介质,以及处理器,所述处理器被配置为能够执行计算机可读存储介质中存储的计算机指
令。
17.部分英文缩写说明:ctdna: circulating tumor dna,循环肿瘤dnamrd : minimal residual disease,经过根治性治疗的早中期癌症患者体内的隐匿性微转移或微小残留病灶。
18.cigar:比对结果,代表比对到参考基因组的具体情况,如37m1d2m1i的意思是37个匹配,1个参考序列上的删除,2个匹配,1个参考序列上的插入。
19.本发明首先根据所述肿瘤组织的测序数据获得融合基因序列;然后在肿瘤血细胞和血浆中追踪组织的融合基因序列;最后通过过滤血细胞中的融合,鉴定最终的经典融合基因。本发明相对于现有技术,对肺癌mrd融合基因的检测判定具有较高的准确率,能够有效避免现有技术中容易出现假阳性的问题。同时,本发明基于肺癌肿瘤组织dna样本测序获得原始数据,降低了对样本质量的要求。
附图说明
20.图1为本发明的实施例中肺癌mrd融合基因判定方法的流程图;图2为本发明的实施例中从肿瘤组织的原始测序数据得到融合基因序列的流程图;图3为本发明的实施例中生成肺癌mrd经典融合基因的igv示例图;图4为本发明的实施例中肺癌mrd融合基因判定装置的框图;图5为本发明的实施例中电子设备的框图。
具体实施方式
21.下面结合实施例和说明书附图对本发明作进一步的说明。说明的是,术语“第一”、“第二”等仅仅是为了便于说明,并不能作为对数量等的限定。
22.第一方面,本发明的实施例中提供了一种肺癌mrd融合基因判定方法,图1示出了该方法的流程图。结合图1所示,本发明的实施例中,该方法包括:步骤s100:接收肿瘤组织、肿瘤血细胞和血浆的测序数据。在本发明的实施例中,可以基于一代、二代、三代基因测序技术对肿瘤组织、肿瘤血细胞和血浆进行测序,得到测序数据,利用所得到的测序数据完成对肺癌mrd融合基因的判定。
23.步骤s200:根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列。
24.具体的,在本发明的实施例中,可以按照如下的步骤进行,如图2所示。
25.步骤s201:对肺癌肿瘤组织dna样本的测序数据进行过滤,包括对测序接头序列以及低质量碱基的移除;在本发明的实施例中,可以采用trimmomatic(v0.36)进行相应操作。
26.步骤s202:将过滤后的测序数据比对到人类基因组上;具体操作时,是采用bwa(v0.7.17)软件将过滤后的测序数据比对到hg19版本的人类基因组上,在软件参数保持默认的情况下完成比对。
27.在本发明的优选实施例中,第一检测软件可以选择fusionmap,第二检测软件可以采用factera。
28.步骤s203:将步骤s202得到的比对结果采用fuisonmap软件进行融合基因分析,得到第一融合基因结果和第一比对结果。本实施例中,在利用fusionmap软件时,第一融合基因结果为fusionmap.filter.results文件输出,第一比对结果为fusionmap.bam文件输出。利用fuisonmap软件进行融合基因分析,检出经典融合基因,提取softclipped 跨断点支持的reads组装得到融合序列。通过对第一融合基因结果进行条件过滤,得到第一融合基因序列,即利用第一检测软件生成的融合基因序列文件。具体的,在本发明的实施例中,第一融合基因结果fusionmap.filter.results按照softclipped reads 序列的reads支持数大于等于10,即可生成fusionmap融合基因序列文件。
29.步骤s204:根据第一比对结果,利用第二检测软件得到第二融合基因结果,对第二融合基因结果进行过滤,得到第二融合基因序列。在本发明的实施例中,第二检测软件是factera,第二融合基因结果指的是利用factera软件得到的融合基因,具体的是第一融合基因结果fusionmap.filter.results输入到factera软件中组装得到融合基因序列,然后对该融合基因序列在进行过滤,得到的就是第二融合基因序列。
30.更具体的,对融合基因序列进行过滤时包括:过滤多重比对位点;过滤已知数据库中假阳性位点基因,这里的数据库为基于至少500例基线样本,若此融合在大于或等于2例样本中出现,则被列为黑名单融合位点,对于经典融合基因alk/ret/ros1 位点的reads支持数要大于5,其他基因大于10,过滤完的基因提取生成为第二检测软件的融合基因序列文件,也就是第二融合基因序列。
31.在本发明的实施例中,通过验证分析确定使用第一检测软件比对结果作为第二检测软件的比对输入文件,可以得到更高的检出率。在本发明的示例中,如表1所示。
32.表1 比对文件选择融合结果示例fusionnumratio肿瘤组织样本—rna&dna共同检出118100.0�ctera原始检出-fusionmap.bam10488.1�ctera原始检出-mkdup.bam10084.7%如表1所示,通过118例肿瘤组织样本,在这些样本的rna和dna样本中都确定有经典融合的报出,通过测试factera软件适用哪种比对文件融合基因的检出率更高,最终确定用fusionmap软件输出的比对文件。
33.在本发明的实施例中,在利用factera软件进行融合基因检测时,对factera软件进行了优化,从而提高检测的准确性。具体包括两方面:一是,添加了factera软件默认没有输出的比对位置信息。经过测试,factera软件没有输出位置信息是有真实融合位点的检出,通过实现factera软件分析结果能够输出全部比对的结果,从一定意义上防止了真实融合基因的漏检。二是,优化factera软件融合序列拼接方向。factera软件根据reads比对到参考基因组cigar值判断融合方向,即保留断点前的片段(nc)或断点后的片段(cn),进而拼接融合序列。本技术结合基因所在正负链信息与cigar值进一步优化融合方向,若基因在正链,则cigar值不变。若基因在负链,则cigar值取反向,得到矫正后的融合方向。根据融合方向的4种可能(nc-》cn, nc-》nc,cn-》cn, cn-》nc)拼接融合序列,得到准确的融合序列。具体算法为:nc-》cn,融合序列为两个基因片段顺序连接;nc-》nc,第二个基因片段取反向互补;cn-》nc,融合序列为第二个基因片段连接第一个基因片段;cn-》cn,融合序列为第二个
基因片段取反向互补后连接第一个基因片段。
34.步骤s300:在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列,得到第一融合基因。该步骤的主要目的,是为了在肿瘤血浆和血细胞中追踪监测组织得到的融合基因,具体的,利用bwa软件,将步骤s200得到的第一融合基因序列和第二融合基因序列分别用肿瘤血细胞和血浆样本测序数据进行比对,保留完全匹配到的融合基因,也就是所谓的第一融合基因。可以得到融合基因的比对文件,然后根据测序数据平台提取得到第一融合基因id和支持reads数。
35.步骤s400:通过过滤血细胞中的融合,判定最终的经典融合基因。在本发明的实施例中,该步骤的主要目的是为了排除假阳性融合基因。具体的,对步骤s300得到的融合基因,通过配对样本,过滤血浆中追踪到血细胞的胚系融合基因,只保留三类经典融合基因alk、ret和ros1的结果,确定该样本最终的融合基因。在本发明的实施例中,为了更加准确地确定最终的融合基因,在该步骤中,分别利用第一检测软件和第二检测软件分别进行分析,若在任一个检测软件中融合基因的报出符合筛选条件,则确定为最终的融合基因。
36.如表2所示,给出了本发明的一个示例中,利用所提供的方法得出的血浆中的追踪结果。
37.表2结果文件内容示例
fusionidff_supportreascf_supportreasoriginalchr6-117647588:chr5-149777997|ros1-tcof1269fusionmapchr2:29450322-29450822,chr2:42506433-42506933|alk-eml4855factera
a.fusionid:表示融合基因1/2的位置及基因名称b.ff_supportreads:肿瘤组织样本的融合基因reads支持数c.cf_supportreads:肿瘤血浆样本的融合基因reads支持数d.original:融合基因结果来源软件如表2 给出了本发明的示例中第一检测软件和第二检测软件分析得到的融合基因检测结果。
38.如表3所示,给出了本发明的一个示例中,利用所提供的方法得出的最终fusion_mrd的判定结果。
39.表3 fusion_mrd 结果
pidfusion_mrdfusioninfop1_cf0positivechr10:32316465-32316965,chr10:43611765-43612265|ret-kif5b|14|93|factera;chr10-32316466:chr10-43611766|kif5b-ret|58|1|fusionmapp1_cf3dpositivechr10:32316465-32316965,chr10:43611765-43612265|ret-kif5b|14|126|factera;chr10-32316466:chr10-43611766|kif5b-ret|58|5|fusionmapp1_cf1mpositivechr10:32316465-32316965,chr10:43611765-43612265|ret-kif5b|14|163|facterap1_cf3mpositivechr10:32316465-32316965,chr10:43611765-43612265|ret-kif5b|14|111|facterap1_cf6mpositivechr10:32316465-32316965,chr10:43611765-43612265|ret-kif5b|14|124|facterap1_cf9mpositivechr10:32316465-32316965,chr10:43611765-43612265|ret-kif5b|14|227|facterap1_cf12mpositivechr10:32316465-32316965,chr10:43611765-43612265|ret-kif5b|14|518|factera
如表3所示,血浆样本随时间检测,肺癌mrd融合阳性保持稳定趋势,融合断点的支
持reads数也在不断递增,提示肿瘤存在微小残留病灶未清除。
40.图3示出了本发明示例中具体生成肺癌mrd经典融合基因的igv示例图。图中展示了肺癌肿瘤组织样本p1_ffz,肿瘤血浆样本p1_cf9m和p1_cf12m,肿瘤血细胞样本p1_bc的融合比对结果igv实例图,可以看出肺癌mrd经典融合基因kif5b-ret,在组织中检测到后,在随后的9个月和12个月采集的血浆中也检测到,肿瘤血细胞样本中没有检测到,验证了本实施方法的准确性和真实性。
41.igv(integrative genomics viewer)是一款本地即可使用的基因组浏览器,该软件支持芯片数据,ngs数据,基因组注释等多种类型的数据。
42.第二方面,本发明的实施例中提供了一种肺癌mrd融合基因判定装置,该装置可以根据本发明所提供的肺癌mrd融合基因判定方法对肺癌mrd融合基因进行判定,如图4所示,在本发明的实施例中,该装置包括数据接收模块、序列检出模块、追踪模块和鉴定模块,其中数据接收模块被配置为用于接收肿瘤组织、肿瘤血细胞和血浆的测序数据;序列检出模块被配置为用于根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列;追踪模块被配置为用于在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列;鉴定模块被配置为用于通过过滤血细胞中的融合,判定最终的经典融合基因。对于各个模块具体如何实现相应的功能,与本发明的所提供的方法中相应的方法步骤相同,此处不再赘述。
43.第三方面,本发明提供一种计算机可读存储介质,其中存储有计算机指令,当计算机指令由处理器执行时,能够实现本发明的实施例中所提出的肺癌mrd融合基因判定方法。本发明中所称的计算机可读介质包括各种类型的计算机存储介质,可以是通用或专用计算机能够存取的任何可用介质。举例而言,计算机可读介质可以包括ram、rom、eprom、e2prom、寄存器、硬盘、可移动盘、cd-rom或其他光盘存储器、磁盘存储器或其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码单元并能够由通用或特定用途计算机、或者通用或特定用途处理器进行存取的任何其他临时性或者非临时性介质。如本文所使用的,盘(disk)和碟(disc)包括紧致碟(cd)、激光碟、光碟、数字多用途光碟(dvd)、软盘和蓝光碟,其中盘通常磁性地复制数据,而碟则用激光来光学地复制数据。上述的组合也应当包括在计算机可读介质的保护范围之内。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读写信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在asic中。asic可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
44.本发明的第四方面,提供一种电子设备。如图5所示,电子设备包括如上文所述的任意一种计算机可读存储介质和处理器。其中,处理器被配置成能够执行计算机可读存储介质中存储的计算机指令。需要说明的是,电子设备还可以包括其他部件,例如输入设备、显示设备等,出于清楚说明本发明的原理角度考虑,这些部件并未示出。
45.上述实施例仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和等同替换,这些对本发明权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献