一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用于人类遗传病基因检测的智能解读方法及系统与流程

2021-11-26 23:41:00 来源:中国专利 TAG:


1.本发明涉及基因检测的智能解读领域,特别是涉及一种用于人类遗传病基因检测的智能解读方法及系统。


背景技术:

2.2011年,美国科学院、美国工程院、美国国立卫生研究院及美国科学委员会共同发出“迈向精准医学”的倡议。著名基因组学家maynardv.olson博士参与起草的报告《走向精准医学》正式发表。这篇报告提出了通过遗传关联研究与临床医学紧密接轨,实现人类疾病精准治疗和有效预警。
3.2015年,奥巴马在国情咨文演讲中提出了“精准医学(precisionmedicine)”计划,呼吁美国要增加医学研究经费,推动个体化基因组学研究,依据个人基因信息为癌症及其他疾病患者制定个体医疗方案。
4.随着精准医学的发展,目前国内外能结合大规模检测数据,提供的针对大数据的个体化遗传病知识解读服务的公司还很少,大部分还处于手工整理。
5.因此,现有服务都存在以下一些局限性:
6.1.知识库的局限性:手工收集不但效率低下,而且不能充分体现证据的系统性和实时性。
7.2.解读的局限性:虽然有acmg指南,但规则复杂,具体到某一种遗传病需要进一步调整解读规则;并且,目前市面的遗传病基因检测产品主要通过简单的判断或者手工解读完成,解读结果不够全面,也不够严谨,没有统一的标准,依赖解读人员的知识水平和经验水平较多,容易形成主观偏差,相同的数据不同的解读结果的现象多次出现在sci刊物报道中。
8.3.批量报告的局限性:在面对大规模测序数据时,解读、报告撰写等环节都无法为受检者提供有效高质量的服务。


技术实现要素:

9.鉴于以上所述现有技术的缺点,本发明的目的在于提供一种用于人类遗传病基因检测的智能解读方法及系统,提供属性注释模块、属性注释模块、智能分级模块、报告自动化模块、交互确认模块,组成完整的智能解读流程,实现人类遗传病知识解读标准化、自动化、模块化。
10.本发明提供一种用于人类遗传病基因检测的智能解读方法,所述方法包括以下步骤:
11.步骤1:采集基因样本文件,并且调用docker容器对基因样本文件进行变异位点注释,生成注释结果文件;
12.步骤2:采集基因列表文件,并且调用docker容器对注释结果文件进行变异位点注释结果质控调整,生成质控结果文件;
13.步骤3:对质控结果文件中的变异位点注释属性进行证据等级划分,并且根据致病判别规则进行致病性判别,生成解读结果文件;
14.步骤4:采集excel文件,并且将解读结果文件内容填充到excel文件,输出最终报告。
15.于本发明的一实施例中,步骤1中调用docker容器,以基因为单位加载人类遗传病属性注释所需数据库,并且对基因样本文件进行变异位点注释,调整数据库格式并建立索引。
16.于本发明的一实施例中,步骤2中调用docker容器对注释结果文件进行参数配置注释结果质控调整,生成质控结果文件的具体流程为:
17.步骤2.1:读取注释结果文件中候选基因的外显子物理位置,组成目标区域;
18.步骤2.2:解析基因列表文件,记录目标区域范围内每个基因片段的覆盖深度;
19.步骤2.3:统计目标区域范围内的整体覆盖深度和每个外显子覆盖深度,生成质控结果文件。
20.于本发明的一实施例中,步骤3中对质控结果文件中的变异位点注释属性进行证据等级划分,并且根据致病判别规则进行致病性判别,生成解读结果文件的具体流程为:
21.步骤3.1:对质控结果文件中的变异位点注释属性进行证据等级划分;
22.步骤3.2:过滤多态性位点和假阳性位点,并且对变异位点进行致病性判别,生成解读结果文件。
23.于本发明的一实施例中,步骤4输出最终报告前,需要进行交互确认。
24.一种用于人类遗传病基因检测的智能解读系统,所述智能解读系统包括:
25.属性注释模块:采集基因样本文件,并且调用docker容器对基因样本文件进行变异位点注释,生成注释结果文件;
26.质控模块:采集基因列表文件,并且调用docker容器对注释结果文件进行变异位点注释结果质控调整,生成质控结果文件;
27.智能分级模块:对质控结果文件中的变异位点注释属性进行证据等级划分,并且根据致病判别规则进行致病性判别,生成解读结果文件;
28.报告自动化模块:采集excel文件,并且将解读结果文件内容填充到excel文件,输出最终报告。
29.于本发明的一实施例中,所述智能解读系统包括还包括交互确认模块,所述交互确认模块用于显示交互界面,并且采集交互确认信息。
30.如上所述,本发明的一种用于人类遗传病基因检测的智能解读方法及系统,具有以下有益效果:
31.1.标准化的优势:每个模块提供的功能都经过医学专家、生物信息工程硕士、遗传学家设计、论证、训练、测试,不论在任何实验室、任何时间使用,数据库属性注释方法和解读规则都是标准化,弥补了知识库的局限性和解读的局限性。
32.2.自动化的优势:智能解读方法兼容性强,适用windows/linux/mac等桌面操作系统,计算资源配置不低于2核cpu、4g内存的电脑上,均可以正常运行,单个基因样本文件的解读时间不超过2分钟;而且可以批量完成上百份基因样本文件的解读,不仅标准而且免去了繁琐的手工操作。
33.3.模块化的优势:每个模块的输入输出接口都是标准的,实现了每个模块都是独立可删改的,意味着,对于多种类型疾病,只需要调整智能分级模块,通过报告自动化模块,实现同一个智能解读,快速适应多种疾病。
附图说明
34.图1显示为本发明实施例中公开的智能解读方法的流程图。
35.图2显示为本发明实施例中公开的生成质控结果文件的流程图。
36.图3显示为本发明实施例中公开的生成解读结果文件的流程图。
具体实施方式
37.以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
38.需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
39.请参阅图1,本发明提供一种用于人类遗传病基因检测的智能解读方法,所述方法包括以下步骤:
40.步骤1:采集基因样本文件(即为vcf.gz文件格式),并且调用docker容器对基因样本文件进行变异位点注释,生成注释结果文件;
41.通过调用docker容器,将变异位点属性注释相关的数据库、软件、依赖包环境由预先封装的docker镜像启动,以基因为单位加载人类遗传病变异位点属性注释所需要的数据库,例如:人群相关数据库、疾病特异性数据库、序列数据库、自检数据库等,对基因样本文件进行变异位点注释,调整数据库格式并且建立索引;其中,docker镜像体积缩小到原有文件的1/12,约5gb,经过测试,2核4g内存的电脑(windows操作系统),对单个基因样本文件的注释时间缩减到1/120,约20秒。
42.步骤2:采集基因列表文件(即为gvcf.gz文件格式),并且调用docker容器对注释结果文件和基因列表文件进行变异位点注释结果质控调整,生成质控结果文件;
43.将采集的基于序列文件格式由bam文件格式替换为gvcf.gz文件格式,基于序列文件大小缩小为1/200,从而降低存储和传输成本;并且,通过调用docker容器,将质控相关的目标区域配置文件、软件、依赖包环境由预先封装好的docker镜像启动,经过测试,2核4g内存的电脑(windows操作系统),对单个基因样本文件的质控时间缩减到1/30,约10秒。
44.请参阅图2,生成质控结果文件的具体流程为:
45.步骤2.1:读取注释结果文件中候选基因的外显子物理位置,组成目标区域;
46.步骤2.2:解析基因列表文件,记录目标区域范围内每个基因片段的覆盖深度;
47.步骤2.3:统计目标区域范围内的整体覆盖深度和每个外显子覆盖深度,生成质控
结果文件(cov.txt格式文件)。
48.通过解析基因列表文件中每个基因片段的覆盖深度,经过拼接还原目标区域情况,不仅可以提供整个目标区域的整体覆盖深度,还可以提供精确到每个离散的基因、每个外显子、每个变异位点的覆盖深度,提示没有被覆盖区域所在的人类基因的物理位置,基因外显子的具体位置,可以直接评估该目标区域范围是否需要使用一代测序补齐、二次测序补齐。
49.步骤3:对质控结果文件中的变异位点注释属性进行证据等级划分,并且根据致病判别规则进行致病性判别,生成解读结果文件;
50.请参阅图3,生成解读结果文件的具体流程为:
51.步骤3.1:按照acmg分类规则对质控结果文件中的变异位点注释属性进行28证据等级划分;
52.步骤3.2:过滤多态性位点和假阳性位点,并且按照致病性判别规则对变异位点进行致病性判别,生成解读结果文件。
53.由于基因样本的变异位点数量不等,范围在几百到几万,等级划分过程根据变异位点注释过程中标注是否属于假阳性位点集合,并且按照致病性判别规则对变异位点进行致病性判断,即致病的、可能致病的、良性的、可能良性的、意义未表明的;经过测试,2核4g内存的电脑(windows操作系统),对单个基因样本文件的分级时间缩减到1/900,即原来手动至少15分钟完成分级现在不足1秒的时间就可以完成标准化、自动化分级,能够提高遗传咨询师的解读效率。
54.所述acmg分类规则如表1所示:
55.56.[0057][0058]
表1
[0059]
为了将每个变异位点致病性进行智能分级,每个变异位点会注释上百个维度的属性,然后划分成以上28个证据等级,然后根据致病判别规则进行致病性判别,得到致病的、可能致病的、良性的、可能良性的、意义未表明的结论,如表2所示:
[0060]
[0061][0062]
表2
[0063]
步骤4:采集excel文件,并且将解读结果文件内容填充到excel文件,输出最终报告。
[0064]
为了配合批量完成多个基因样本文件同时出报告,只需要按照一定的格式填写excel文件,然后将该excel文件以配置文件的形式输入,就可以完成报告撰写中基因样本文件对应的个人信息和临床信息的自动填充;并且通过交互确认为遗传咨询师一个交互操作的空间,智能分级得到的致病性位点,需要遗传咨询师人工确认才能出临床诊断报告;并且通过预先制备好的模板,将遗传咨询师的解读结果进行提炼,自动填充到模板中,输出最终报告。
[0065]
本发明提供一种用于人类遗传病基因检测的智能解读系统,所述智能解读系统包括:
[0066]
属性注释模块:采集基因样本文件,并且调用docker容器对基因样本文件进行变异位点注释,生成注释结果文件;
[0067]
质控模块:采集基因列表文件,并且调用docker容器对注释结果文件进行变异位点注释结果质控调整,生成质控结果文件;
[0068]
智能分级模块:对质控结果文件中的变异位点注释属性进行证据等级划分,并且根据致病判别规则进行致病性判别,生成解读结果文件;
[0069]
报告自动化模块:采集excel文件,并且将解读结果文件内容填充到excel文件,输出最终报告;
[0070]
所述智能解读系统包括还包括交互确认模块,所述交互确认模块用于显示交互界面,并且采集交互确认信息。
[0071]
综上所述,本发明提供属性注释模块、属性注释模块、智能分级模块、报告自动化模块、交互确认模块,组成完整的智能解读流程,实现人类遗传病知识解读标准化、自动化、模块化。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
[0072]
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完
成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献