一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种环境样本中病原细菌毒力因子的高通量检测方法和系统与流程

2022-02-20 15:25:51 来源:中国专利 TAG:


1.本发明实施例涉及微生物组学和生物信息学技术领域,特别涉及一种环境样本中病原细菌毒力因子的高通量检测方法和系统。


背景技术:

2.病原细菌通常是指任何具有致病能力的细菌,这些细菌的致病能力称之为致病性。对病原细菌致病性或者致病可能性的定量测量就是毒性。这些毒性是由病原细菌的毒力因子所造成的。毒力因子是指微生物能够在特定的宿主上或者宿主体内建立起自身并增强其致病能力的特性(即基因产物)。常见的毒力因子包括细菌毒素、介导细菌附着的细胞表面蛋白、保护细菌的细胞表面碳水化合物和蛋白质,以及可能有助于细菌致病性的一些水解酶等。毒力因子是病原细菌具备致病能力的要素之一。病原细菌是危害人类和动物健康的重要源头之一;同时一些食品上病原细菌的存在,也会间接的对人体造成危害。因此对这些病原细菌中毒力因子的进行全面的、高通量的检测具有重要意义和广泛的应用价值。
3.随着技术的发展,对病原细菌检测的传统生物化学的方法和分子生物学技术都经历了重大的革新,一些新式仪器的开发和应用,都提高了检测病原细菌的速度和准确性。例如全自动微生物生化检测系统和pcr技术的使用等。其中病原细菌基因扩增检测(pcr)是基因扩增技术的一次重大革新,通过将极微量的靶dna特异性的扩增,使其含量增加上百万倍,从而大大提高了对dna分子的分析和检测能力。但是这样的扩增方法在检测对象上是具有靶向性致使其检测的速度较慢,通量也不高,不能全面的对样本中的病原细菌及其毒力因子进行有效的识别和鉴定。
4.因此,如何开发一种环境样本中病原细菌毒力因子的高通量检测方法和系统,以克服现有技术中检测的速度较慢,通量也不高,不能全面的对样本中的病原细菌及其毒力因子进行有效的识别和鉴定的问题,迫在眉睫。


技术实现要素:

5.本发明实施例目的是提供一种环境样本中病原细菌毒力因子的高通量检测方法和系统,检测速度快,通量高,能全面的对样本中的病原细菌及其毒力因子进行有效的识别和鉴定。
6.在本发明的第一方面,本发明实施例提供了一种环境样本中病原细菌毒力因子的高通量检测方法,所述方法包括:
7.对环境样本的宏基因组dna进行提取和测序建库,获得宏基因组数据;
8.对所述宏基因组数据进行质量控制,获得高质量宏基因组数据;
9.将所述高质量宏基因组数据进行拼接,获得拼接序列;
10.将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因;
11.对具有完整序列的所述基因进行病原细菌毒力因子的预测和筛选,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物。
12.进一步地,所述环境样本包括水体、动植物、土壤、沉积物和空气中的至少一种。
13.进一步地,所述对所述宏基因组数据进行质量控制,获得高质量宏基因组数据,包括:
14.采用prinseq软件通过预设质控条件以去除低质量的所述宏基因组数据,获得高质量宏基因组数据,其中所述质控条件为:-ns_max_p:10,-no_qual_header,-min_len:25,和-min_qual_mean:20。
15.进一步地,所述将所述高质量宏基因组数据进行拼接,获得拼接序列,包括:
16.采用宏基因组数据组装软件megahit对所述高质量宏基因组数据进行拼接,获得拼接序列contigs。
17.进一步地,所述将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因,包括:
18.采用prodigal软件对所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因。
19.进一步地,所述对具有完整序列的所述基因进行病原细菌毒力因子的预测和筛选,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物,包括:
20.采用abricate软件和vfdb数据库对具有完整序列的所述基因进行病原细菌毒力因子的预测,获得预测病原细菌毒力因子;
21.将所述预测病原细菌毒力因子与对应的病原细菌毒力因子进行序列比对,筛选相似性≥80%,覆盖率≥70%的所述预测病原细菌毒力因子,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物。
22.在本发明的第二方面,本发明实施例还提供了一种环境样本中病原细菌毒力因子的高通量检测系统,所述系统包括:
23.获取模块,用于获得环境样本的宏基因组数据;
24.质量控制模块,用于对所述宏基因组数据进行质量控制,获得高质量宏基因组数据;
25.拼接模块,用于将所述高质量宏基因组数据进行拼接,获得拼接序列;
26.第一预测模块,将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因;
27.第二预测模块,对具有完整序列的所述基因进行病原细菌毒力因子的预测和筛选,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物。
28.进一步地,所述获取模块包括宏基因组dna提取模块和测序模块;所述质量控制模块包括prinseq软件;所述拼接模块包括宏基因组数据组装软件megahit;所述第一预测模块包括prodigal软件;所述第二预测模块包括abricate软件和vfdb数据库。
29.在本发明的第三方面,本发明实施例还提供了一种环境样本中病原细菌毒力因子的高通量检测系统,所述系统包括:
30.处理器和存储器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时使所述微生物认证的系统执行所述方法的步骤。
31.在本发明的第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。
32.本发明实施例中的一个或多个技术方案,至少具有如下技术效果或优点:
33.本发明实施例提供的一种环境样本中病原细菌毒力因子的高通量检测方法和系统,所述方法包括:对环境样本的宏基因组dna进行提取和测序建库,获得宏基因组数据;对所述宏基因组数据进行质量控制,获得高质量宏基因组数据;将所述高质量宏基因组数据进行拼接,获得拼接序列;将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因;对具有完整序列的所述基因进行病原细菌毒力因子的预测和筛选,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物。与现有技术相比,本发明实施例以环境样本的高通量的宏基因组数据为源头,基于微生物组学的研究方法和生物信息学的分析思路,提供了一种实现对环境样本中病原细菌毒力因子高通量的检测方法。该方法有以下优点:
34.1、通量高;与病原细菌毒力因子的传统方法相比,基于宏基因组数据,可以获取样本中较为全面的病原细菌毒力因子及其产物,该检测方法通量高且检测对象具有非靶向性。
35.2、高性价比;基于样本的一次宏基因组测序,就可以得到较为全面的病原细菌毒力因子的组成,相对于传统的pcr方法,不需设计引物和扩增,性价比高。
36.3、易用性;该检测方法分析思路清楚,易于理解;检测所需用到的工具和数据库易于获取和实现本地化,按照工具的操作说明,易于使用,不需要更多的专业知识就能实现对该方法的掌握。
附图说明
37.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
38.图1为本发明实施例提供的一种环境样本中病原细菌毒力因子的高通量检测方法的流程图;
39.图2为本发明实施例提供的一种环境样本中病原细菌毒力因子的高通量检测系统的结构图;10-获取模块;20-质量控制模块;30-拼接模块;40-第一预测模块;50-第二预测模块。
具体实施方式
40.下文将结合具体实施方式和实施例,具体阐述本发明实施例,本发明实施例的优点和各种效果将由此更加清楚地呈现。本领域技术人员应理解,这些具体实施方式和实施例是用于说明本发明实施例,而非限制本发明实施例。
41.在整个说明书中,除非另有特别说明,本文使用的术语应理解为如本领域中通常所使用的含义。因此,除非另有定义,本文使用的所有技术和科学术语具有与本发明实施例所属领域技术人员的一般理解相同的含义。若存在矛盾,本说明书优先。
42.除非另有特别说明,本发明实施例中用到的各种原材料、试剂、仪器和设备等,均可通过市场购买得到或者可通过现有方法制备得到。
43.本发明实施例提供的技术方案为解决上述技术问题,总体思路如下:
44.本技术人通过分析发现:毒力因子实际上就是一种基因产物,是存在于细菌染色体上的,所以可以基于微生物组学的方法和生物信息学的分析手段来识别和鉴定这些病原细菌的毒力因子,从而确定病原细菌可能产生的毒性,而不必关注那些病原细菌的存在。在微生物组学的研究方法中,借助高通量测序技术获取微生物群落的基因遗传信息,从而能够对这些基因信息进行生物信息学处理,通过和相应的数据库进行比对,从而获得相应的基因。在这个过程中可以实现多种毒力因子的鉴定,具有速度快和通量高和高附加值等特点。但是目前对于基于高通量测序的环境样本毒力因子的检测方法还没有建立。因此针对环境样本中病原细菌毒力因子的高通量检测非常有必要运用微生物组学中宏基因组学的研究方法和生物信息学中毒力因子鉴定的方法。
45.根据本发明实施例一种典型的实施方式,提供一种环境样本中病原细菌毒力因子的高通量检测方法,如图1所示,包括:
46.s1、对环境样本的宏基因组dna进行提取和测序建库,获得宏基因组数据;
47.所述环境样本包括水体、动植物、土壤、沉积物和空气中的至少一种。
48.所述步骤s1中,具体包括对环境样本的宏基因组dna的提取、建库和测序,获得样本的宏基因组数据。
49.全基因组的研究对象是单个物种,如细菌的某一个菌株;宏基因组的研究对象则广泛一些,可以是某个特定环境下的全部微生物种群;
50.宏基因组,不需要分离微生物,从发酵物中直接提取基因,全部检测。比如研究醋的发酵过程中,微生物种群的变化,用宏基因组测序,可以判断出其中的微生物种类。
51.s2、对所述宏基因组数据进行质量控制,获得高质量宏基因组数据;
52.所述步骤s2,具体包括:
53.采用prinseq软件通过预设质控条件以去除低质量的所述宏基因组数据,获得高质量宏基因组数据,其中所述质控条件为:-ns_max_p:10,-no_qual_header,-min_len:25,和-min_qual_mean:20。
54.所使用的宏基因组数据分析方法是生物信息学中宏基因组数据分析的有效方法。该方法不仅可以实现对宏基因组数据的质量控制,还可以实现对样本宏基因组数据组装(步骤s3)以及样本中基因和蛋白质预测(步骤s4)。
55.s3、将所述高质量宏基因组数据进行拼接,获得拼接序列;
56.所述步骤s3,具体包括:
57.采用宏基因组数据组装软件megahit对所述高质量宏基因组数据进行拼接,获得拼接序列contigs。
58.高通量测序平台产生的序列就称为reads。拼接软件基于reads之间的overlap区,拼接获得的序列称为contig(重叠群)。
59.基因组de novo测序,通过reads拼接获得contigs后,往往还需要构建454paired-end库或illumina mate-pair库,以获得一定大小片段(如3kb、6kb、10kb、20kb)两端的序列。基于这些序列,可以确定一些contig之间的顺序关系,这些先后顺序已知的contigs组成scaffold。
60.s4、将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因;
61.所述步骤s4,具体包括:
62.采用prodigal软件对所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因。
63.s5、对具有完整序列的所述基因进行病原细菌毒力因子的预测和筛选,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物。
64.所述步骤s5,具体包括:
65.采用abricate软件和vfdb数据库对具有完整序列的所述基因进行病原细菌毒力因子的预测,获得预测病原细菌毒力因子;
66.将所述预测病原细菌毒力因子与对应的病原细菌毒力因子进行序列比对,筛选相似性≥80%,覆盖率≥70%的所述预测病原细菌毒力因子,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物。
67.所使用的病原细菌毒力因子检测数据库是vfdb数据库。该数据库是病原细菌毒力因子检测目前较为为全面的,并且更新速度较快,且集成在一些检测工具中易于本地化,能够实现对环境样本中病原细菌毒力因子的全面检测,从而实现环境样本中病原细菌的毒力因子的快速准确的检测。
68.所使用的病原细菌毒力因子检测工具是abricate,该工具是免费开源的,易于获取、本地化和易于使用。
69.所使用的分析方法是生物信息学中对病原细菌毒力因子的快速有效方法。该方法可以实现对环境样本中的病原细菌毒力因子的有效和准确的鉴定,还可以实现对病原细菌毒力因子产物进行有效输出。
70.所述处理得到的病原细菌毒力因子及其对应的产物可以作为评价环境样本存在的潜在危害和危害评价,也可以作为其他一些高级分析的输入文件,实现多组学数据之间的关联分析研究等等。
71.根据本发明实施例一种典型的实施方式,提供一种环境样本中病原细菌毒力因子的高通量检测系统,所述系统包括:
72.获取模块10,用于获得环境样本的宏基因组数据;
73.质量控制模块20,用于对所述宏基因组数据进行质量控制,获得高质量宏基因组数据;
74.拼接模块30,用于将所述高质量宏基因组数据进行拼接,获得拼接序列;
75.第一预测模块40,将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因;
76.第二预测模块50,对具有完整序列的所述基因进行病原细菌毒力因子的预测和筛选,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物。
77.作为一种可选的实施方式,所述获取模块包括宏基因组dna提取模块和测序模块;所述质量控制模块包括prinseq软件;所述拼接模块包括宏基因组数据组装软件megahit;所述第一预测模块包括prodigal软件;所述第二预测模块包括abricate软件和vfdb数据库。
78.根据本发明实施例一种典型的实施方式,提供一种环境样本中病原细菌毒力因子的高通量检测系统,所述系统包括:
79.处理器和存储器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时使所述微生物认证的系统执行所述方法的步骤。
80.根据本发明实施例一种典型的实施方式,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。
81.下面将结合实施例、对比例及实验数据对本技术的一种环境样本中病原细菌毒力因子的高通量检测方法和系统进行详细说明。
82.实施例一
83.本发明实施例涉及的样本为巢湖中靠近南淝河入口的水体样本(ch01),涉及到的数据为巢湖中靠近南淝河入口的宏基因组数据。对该环境样本中病原细菌毒力因子检测过程如图1所示,具体如下:
84.步骤s1、提取环境样本ch01的宏基因组,进行建库测序,获取样本的宏基因组数据;
85.步骤s2、对样本宏基因组数据进行质量控制,使用的工具为prinseq(http://prinseq.sourceforge.net/),去除低质量的测序数据,质控条件为:-ns_max_p:10,-no_qual_header,-min_len:25,和-min_qual_mean:20,得到高质量的宏基因组数据;
86.步骤s3、使用宏基因组数据组装软件megahit对高质量的宏基因组数据进行组装,得到contigs序列;
87.步骤s4、使用prodigal对contigs序列上的基因进行预测和蛋白质序列的预测,该步骤只取具有完整序列的基因和蛋白质;
88.步骤s5、使用abricate工具和vfdb数据库对步骤4中的基因进行抗生素抗性基因的预测;对所述的结果进行筛选,避免假阳性结果的出现;基于以上步骤的结果输出环境样本中病原细菌毒力因子组成信息和其产物信息。
89.表1-ch01样本中病原细菌毒力因子的分类和数目统计
90.[0091][0092]
本发明实施例检测所需时间为2h,通量高(具体高达1万个基因每小时),能全面的对样本中的病原细菌及其毒力因子进行有效的识别和鉴定。
[0093]
实施例二
[0094]
本发明实施例涉及的样本为数据库的土壤样本soil01,涉及到土壤的宏基因组数据。对该环境样本中病原细菌毒力因子检测过程如图1所示,具体如下:
[0095]
步骤s1、提取环境样本soil01的宏基因组,进行建库测序,获取样本的宏基因组数据;
[0096]
步骤s2、对样本宏基因组数据进行质量控制,使用的工具为prinseq(http://prinseq.sourceforge.net/),去除低质量的测序数据,质控条件为:-ns_max_p:10,-no_qual_header,-min_len:25,和-min_qual_mean:20,得到高质量的宏基因组数据;
[0097]
步骤s3、使用宏基因组数据组装软件megahit对高质量的宏基因组数据进行组装,得到contigs序列;
[0098]
步骤s4、使用prodigal对contigs序列上的基因进行预测和蛋白质序列的预测,该
步骤只取具有完整序列的基因和蛋白质;
[0099]
步骤s5、使用abricate工具和vfdb数据库对步骤4中的基因进行抗生素抗性基因的预测;对所述的结果进行筛选,避免假阳性结果的出现;基于以上步骤的结果输出环境样本中病原细菌毒力因子组成信息和其产物信息。
[0100]
表2-soil01样本中病原细菌毒力因子的分类和数目统计
[0101][0102]
[0103]
本发明实施例检测所需时间为2h,通量高(具体高达1万个基因每小时),能全面的对样本中的病原细菌及其毒力因子进行有效的识别和鉴定。
[0104]
实施例三
[0105]
本发明实施例涉及的样本为数据库的废水样本(ww01),涉及到的数据为废水的宏基因组数据。对该环境样本中病原细菌毒力因子检测过程如图1所示,具体如下:
[0106]
步骤s1、提取环境样本ww01的宏基因组,进行建库测序,获取样本的宏基因组数据;
[0107]
步骤s2、对样本宏基因组数据进行质量控制,使用的工具为prinseq(http://prinseq.sourceforge.net/),去除低质量的测序数据,质控条件为:-ns_max_p:10,-no_qual_header,-min_len:25,和-min_qual_mean:20,得到高质量的宏基因组数据;
[0108]
步骤s3、使用宏基因组数据组装软件megahit对高质量的宏基因组数据进行组装,得到contigs序列;
[0109]
步骤s4、使用prodigal对contigs序列上的基因进行预测和蛋白质序列的预测,该步骤只取具有完整序列的基因和蛋白质;
[0110]
步骤s5、使用abricate工具和vfdb数据库对步骤4中的基因进行抗生素抗性基因的预测;对所述的结果进行筛选,避免假阳性结果的出现;基于以上步骤的结果输出环境样本中病原细菌毒力因子组成信息和其产物信息。
[0111]
表3-ww01样本中病原细菌毒力因子的分类和数目统计
[0112][0113]
[0114]
本发明实施例检测所需时间为2h,通量高(具体高达1万个基因每小时),能全面的对样本中的病原细菌及其毒力因子进行有效的识别和鉴定。
[0115]
实施例四
[0116]
本发明实施例提供了一种环境样本中病原细菌毒力因子的高通量检测系统,如图2所示,所述系统包括:
[0117]
获取模块10,用于获得环境样本的宏基因组数据;所述获取模块包括宏基因组dna提取模块和测序模块;
[0118]
质量控制模块20,用于对所述宏基因组数据进行质量控制,获得高质量宏基因组数据;所述质量控制模块包括prinseq软件;
[0119]
拼接模块30,用于将所述高质量宏基因组数据进行拼接,获得拼接序列;所述拼接模块包括宏基因组数据组装软件megahit;
[0120]
第一预测模块40,将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因;所述第一预测模块包括prodigal软件;
[0121]
第二预测模块50,对具有完整序列的所述基因进行病原细菌毒力因子的预测和筛选,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物;所述第二预测模块包括abricate软件和vfdb数据库。
[0122]
实施例五
[0123]
本发明实施例三提供了一种环境样本中病原细菌毒力因子的高通量检测系统,所述系统包括:
[0124]
处理器和存储器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时使所述微生物认证的系统执行实施例一-实施例三任一所述方法的步骤。
[0125]
实施例六
[0126]
实施例四公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现实施例一-实施例三任一所述方法的步骤。
[0127]
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的方法中的相关操作。
[0128]
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory,rom)、随机存取存储器(randomaccess memory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0129]
值得注意的是,上述实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0130]
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他
性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0131]
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
[0132]
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明实施例权利要求及其等同技术的范围之内,则本发明实施例也意图包含这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献