一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

肌痛性脑脊髓炎标志基因及其应用的制作方法

2022-05-21 05:09:50 来源:中国专利 TAG:


1.本发明涉及生物技术领域,具体的,本发明涉及肌痛性脑脊髓炎标志基因及其应用,更具体的,本发明涉及一种试剂盒、试剂在制备试剂盒中的用途、用于预防或者治疗肌痛性脑脊髓炎的药物组合物或者食品组合物、确定个体是否患有肌痛性脑脊髓炎方法、确定个体是否患有肌痛性脑脊髓炎的装置、一种装置、一种筛选药物的方法。


背景技术:

2.肌痛性脑脊髓炎(myalgic encephalomyelitis,me)又称慢性疲劳综合症(chronic fatigue syndrome, cfs),也称慢性疲劳免疫功能紊乱综合征(chronic fatigue immune dysfunction syndrome,cfids)。是累及机体许多系统的疾病,该病病程长,病人感到极度疲倦,肌痛,可引起认知功能障碍。各年龄段均可患有肌痛性脑脊髓炎。。肌痛性脑脊髓炎的发病机理尚不清楚,但其自身因素和外界因素已被确认。前者包括年龄、遗传易感性、家庭集聚性、激素状况,后者包括传染、免疫接种、情绪紧张登上很火事件、机体损伤(包括意外事故和手术)及环境中的毒素等。
3.临床评估包括全面采集病史、睡眠评估、机体检查、心理健康评估(包括精神状态和心理学评估)。基本检查包括全血化验、尿常规、c-反应蛋白、肌酐、电解质、肝功能、甲状腺功能、肌酸磷酸激酶和类风湿因子检测。应排除的疾病有甲状腺病、慢性传染病、炎症、代谢性疾病、抑郁症。在体检发现异常结果时,应针对特异性症状进行特殊化验检查以排除其他疾病。一般在6个月内做一次鉴别诊断,再满3个月再次检查并调整治疗方案。
4.随着人体基因组测序完成及高通量测序技术的高速发展,基因筛查成为肌痛性脑脊髓炎诊断的方向,对于发现肌痛性脑脊髓炎潜在人群很有优势。有研究表明肌痛性脑脊髓炎患者肠道微生物的水平出现异常。到目前为止,还没有肌痛性脑脊髓炎患者肠道微生物标记物的相关报道。


技术实现要素:

5.本发明旨在至少解决上述问题至少之一或者提供至少一种可选择的商业手段。
6.为此,在本发明的第一方面,本发明提出了一种试剂盒。根据本发明的实施例,根据本发明的实施例,包括适于检测第一基因集中的至少一种基因的试剂,所述第一基因集由以下基因组成: srr6784535_gi_0048977、srr6784550_gi_0026032、srr6784547_gi_0011164、 srr6784521_gi_0025733和srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no:1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seq id no:1-5中的序列具有不小于90%的同一性。根据本发明具体实施例的试剂盒,可以准确的检测生物样品中是否含有所述第一基因集中的至少一种基因,更进一步地,也可以准确区分或诊断肌痛性脑脊髓炎患者和健康个体。
7.在本发明的第二方面,本发明提出了试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因。根据本发明的实施例,所述试剂盒用于诊断肌痛性脑
脊髓炎或检测肌痛性脑脊髓炎的治疗效果,所述第一基因集由以下基因组成:srr6784535_gi_0048977、srr6784550_gi_0026032、 srr6784547_gi_0011164、srr6784521_gi_0025733和srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no:1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seqid no:1-5中的序列具有不小于90%的同一性。根据本发明具体实施例的试剂制备的试剂盒,可以准确的检测生物样品中是否含有所述第一基因集中的至少一种基因,更进一步地,也可以极准确的区分肌痛性脑脊髓炎患者和健康个体,由此,可以有效的在早期进行肌痛性脑脊髓炎诊断,或用于检测治疗过程中肌痛性脑脊髓炎的变化。
8.在本发明的第三方面,本发明提出了一种用于预防或者治疗肌痛性脑脊髓炎的药物组合物或者食品组合物。根据本发明的实施例,含有提高所述第一基因集中的至少一种基因丰度的物质,所述第一基因集由以下基因组成:srr6784535_gi_0048977、srr6784550_gi_0026032、srr6784547_gi_0011164、 srr6784521_gi_0025733和srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no: 1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seq id no:1-5中的序列具有不小于90%的同一性。根据本发明实施例的肌痛性脑脊髓炎标志基因中第一基因集的基因可以非侵入性的在早期发现或辅助检测肌痛性脑脊髓炎,确定个体患有肌痛性脑脊髓炎的概率高低或者个体处于健康状态的概率高低;同时,提高肌痛性脑脊髓炎高风险人群或已肌痛性脑脊髓炎患者肠道内的所述第一基因集中的各种基因的丰度,可以降低患肌痛性脑脊髓炎的概率或减缓、治愈肌痛性脑脊髓炎,因此,所述包含提高所述第一基因集中的至少一种基因丰度的药物或者食品组合物能够用于平衡肠道菌群,有效预防或治疗肌痛性脑脊髓炎。
9.在本发明的第四方面,本发明提出了一种确定个体是否患有肌痛性脑脊髓炎的方法。根据本发明的实施例,包括:(1)确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有肌痛性脑脊髓炎;其中,所述第一基因集由以下基因组成:srr6784535_gi_0048977、 srr6784550_gi_0026032、srr6784547_gi_0011164、srr6784521_gi_0025733和 srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no:1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seq id no:1-5中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:srr6784537_gi_0039489和srr6784544_gi_0029966,其中,所述第二基因集中的基因与seq id no:6、7所示的核酸序列一一对应,所述第二基因集中的基因与其对应的 seq id no:6、7中的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以依据个体的粪便样本中的所述标志基因的丰度确定个体是否患有肌痛性脑脊髓炎,所述标志基因是发明人对大量已知状态的粪便样本进行验证,通过差异比较分析各种肠道基因在肌痛性脑脊髓炎组和健康组粪便样本中的丰度,而确定下来的。
10.在本发明的第五方面,本发明提出了一种确定个体是否患有肌痛性脑脊髓炎的装置。根据本发明的实施例,包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有肌痛性脑脊髓炎;其中,所述第一基因集由以下基因组成: srr6784535_gi_0048977、srr6784550_gi_
0026032、srr6784547_gi_0011164、 srr6784521_gi_0025733和srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no: 1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seq id no:1-5中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:srr6784537_gi_0039489和 srr6784544_gi_0029966,其中,所述第二基因集中的基因与seq id no:6、7所示的核酸序列一一对应,所述第二基因集中的基因与其对应的seq id no:6、7中的核酸序列具有不小于90%的同一性。所述标志基因是发明人通过差异比较分析各种肠道基因在肌痛性脑脊髓炎患者和健康人群的粪便样本中的丰度并经过分析和大量已知状态的粪便样本的验证而确定下来的,根据本发明实施例的装置可以准确确定个体是否为肌痛性脑脊髓炎的高风险人群或肌痛性脑脊髓炎患者。
11.在本发明的第六方面,本发明提出了一种装置。根据本发明的实施例,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行第四方面所述的方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。根据本发明实施例的装置可以准确确定个体是否为肌痛性脑脊髓炎的高风险人群或肌痛性脑脊髓炎患者。
12.在本发明的第七方面,本发明提出了一种筛选药物的方法。根据本发明的实施例,所述药物用于治疗或者预防肌痛性脑脊髓炎,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防肌痛性脑脊髓炎:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度升高;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度降低;其中,所述第一基因集由以下基因组成:srr6784535_gi_0048977、 srr6784550_gi_0026032、srr6784547_gi_0011164、srr6784521_gi_0025733和 srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no:1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seq id no:1-5中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:srr6784537_gi_0039489和srr6784544_gi_0029966,其中,所述第二基因集中的基因与seq id no:6、7所示的核酸序列一一对应,所述第二基因集中的基因与其对应的 seq id no:6、7中的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以生产或筛选出升高所述标志基因中第一基因集中各种基因丰度,和/或降低肠道标志基因中第二基因集中的各种基因丰度的药物,对于辅助减轻肌痛性脑脊髓炎的临床症状具有重要意义。
13.本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
14.本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
15.图1是根据本发明实施例的筛选肌痛性脑脊髓炎标志基因的实验分析流程示意图;以及
16.图2是根据本发明实施例的标志基因综合指标auc评价结果示意图,其中,specificity表示特异度,即预测为阳性且实际为阳性,真阳性,纵坐标sensitivity表示敏
感度,即真阴性:
17.2-a为第一期74个样品数据roc曲线下auc值和置信区间结果图;
18.2-b为第二期26个样品数据roc曲线下auc值和置信区间结果图。
具体实施方式
19.下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
20.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
21.术语“任选地”仅用于描述目的,而不能理解为指示或暗示相对重要性。由此,限定有“任选地”的特征可以明示或者隐含地包括或不包括该特征。
22.生物学标志物是从生物学介质中可以检测到的细胞/生物化学或分子改变。生物学介质包括各种体液、组织、细胞、粪便、头发、呼气等。
23.所称的丰度指在某一微生物或者核酸序列群体中该种微生物或者序列的丰富程度。例如在肠道基因群体中该种微生物的丰富程度,可表示为该种微生物在该群体中的含量;又例如在一组核酸序列中某种核酸序的丰富程度,可表示为该种核酸序列的数目占该组序列的总数的比例。
24.同一性,本发明,为了比较两个或更多个核苷酸序列,可以通过将[第一序列中与相应位置的核苷酸相同的核苷酸的数目相除]来计算第一序列和第二序列之间的“序列同一性”的百分比。第二个序列中的核苷酸]减去[第一个序列中核苷酸的总数],然后乘以[100%],其中第二个核苷酸序列中每个核苷酸的缺失,插入,取代或添加-相对于第一核苷酸序列-被认为是单个核苷酸(位置)上的差异。
[0025]
或者,可以使用标准设置,使用用于序列比对的已知计算机算法,例如ncbi blast v2.0,计算两个或多个核苷酸序列之间的序列同一性程度。
[0026]
用于确定序列同一性程度的一些其他技术,计算机算法和设置例如在wo 04/037999,ep 0 967 284, ep 1 085 089,wo 00/55318,wo 00/78972,wo 98/49185和gb 2357768-a。
[0027]
需要说明的是,本技术中所述的“标志基因”的长度不受特别限制,可以为完整基因,也可以为基因的编码区或非编码区,更进一步地,根据不同的实验目的,可以选择相关的任意的核酸片段作为标志基因。
[0028]
根据本发明的一个实施方式提供的一种试剂盒,包括适于检测第一基因集中的至少一个基因的试剂,所述第一基因集由以下基因组成:srr6784535_gi_0048977、srr6784550_gi_0026032、 srr6784547_gi_0011164、srr6784521_gi_0025733和srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no:1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seqid no:1-5中的序列具有不小于90%的同一性。
[0029]
根据本发明的一个具体的实施方案,所述试剂盒进一步包括适于检测第二基因集
中的至少一个基因的试剂,所述第二基因集由以下基因组成:srr6784537_gi_0039489和srr6784544_gi_0029966,其中,所述第二基因集中的基因与seq id no:6、7所示的核酸序列一一对应,所述第二基因集中的基因与其对应的seq id no:6、7中的核酸序列具有不小于90%的同一性。
[0030]
根据本发明的具体实施例,所述试剂盒包括适于检测所述第一基因集中全部所述基因的试剂。
[0031]
根据本发明的具体实施例,所述试剂盒包括适于检测所述第二基因集中全部所述基因的试剂。
[0032]
根据本发明的具体实施例,所述标志基因是发明人通过对大量患肌痛性脑脊髓炎个体和大量健康对照个体的粪便样本中的微生物的基因丰度的差异比较分析、以及验证,而确定下来的,明确了肠道中肌痛性脑脊髓炎相关的标志基因。利用包含检测所述标志基因的试剂的试剂盒能够确定个体处于患有肌痛性脑脊髓炎状态的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测肌痛性脑脊髓炎。
[0033]
根据本发明的具体实施例,所述适于检测所述第一基因集或第二基因集的试剂不受特别限制,任何可以直接或间接检测所述标志基因的丰度的试剂均包含在本发明的范围内,如:利用pcr技术、高通量测序等方法直接进行检测时使用的试剂,或通过western blot技术检测所述基因对应的蛋白的含量间接获得所述基因丰度时所使用的试剂等。
[0034]
根据本发明提供的试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因,所述试剂盒用于诊断肌痛性脑脊髓炎或者检测肌痛性脑脊髓炎的治疗效果,所述第一基因集由以下基因组成:srr6784535_gi_0048977、srr6784550_gi_0026032、srr6784547_gi_0011164、 srr6784521_gi_0025733和srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no: 1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seq id no:1-5中的序列具有不小于90%的同一性。
[0035]
根据本发明的具体实施例,所述标志基因是发明人通过对大量患肌痛性脑脊髓炎个体和大量健康对照个体的粪便样本中的微生物基因进行差异比较分析、以及验证,而确定下来的,明确了肠道中肌痛性脑脊髓炎相关的微生物的基因标志物。利用检测所述标志基因的试剂能够确定个体患有肌痛性脑脊髓炎的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测肌痛性脑脊髓炎。
[0036]
根据本发明一些具体的实施例,所述试剂进一步适于检测第二基因集中的至少一种基因,所述第二基因集由以下基因组成:srr6784537_gi_0039489和srr6784544_gi_0029966,其中,所述第二基因集中的基因与seq id no:6、7所示的核酸序列一一对应,所述第二基因集中的基因与其对应的seqid no:6、7中的核酸序列具有不小于90%的同一性。
[0037]
根据本发明的具体实施例,所述适于检测所述第一基因集或第二基因集的试剂不受特别限制,任何可以直接或间接检测所述标志基因的丰度的试剂均包含在本发明的范围内,如:利用pcr技术、高通量测序等方法直接进行检测时使用的试剂,或通过western blot技术检测所述基因对应的蛋白的含量间接获得所述基因丰度时所使用的试剂等。
[0038]
根据本发明提供的一种用于预防或者治疗肌痛性脑脊髓炎的药物组合物或者食品组合物,含有提高第一基因集中的至少一种基因丰度的物质,所述第一基因集由以下基因组成:srr6784535_gi_0048977、 srr6784550_gi_0026032、srr6784547_gi_0011164、
srr6784521_gi_0025733和 srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no:1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seq id no:1-5中的序列具有不小于90%的同一性。
[0039]
上述标志基因是发明人通过差异比较分析各种肠道微生物的基因在肌痛性脑脊髓炎疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。所述标志基因中的第一基因集中的基因相较于肌痛性脑脊髓炎患者群体,在健康群体组中显著富集,所述显著富集是指与在肌痛性脑脊髓炎患者组中的丰度相比,上述基因在健康组中的丰度均具有统计意义地高于或者明显地、实质性地高于在肌痛性脑脊髓炎患者组中的丰度;能够使该部分基因丰度提高的物质能够用于治疗肌痛性脑脊髓炎或者益于肌痛性脑脊髓炎患者服用,所述物质不受特别限制,能够使其丰度提高的物质包括但不限于治疗肌痛性脑脊髓炎的药物和有益肠道菌群平衡的功能性食品。因此,该实施例提供的能够使所述第一基因集中的基因丰度提高的物质能够用于制备治疗肌痛性脑脊髓炎的药物和/或用于制备益于平衡肠道菌群的功能性食品、保健药等,所述药物或食品可有效治疗或缓解肌痛性脑脊髓炎。
[0040]
根据本发明提供的一种确定个体是否患有肌痛性脑脊髓炎的方法,包括步骤(1)和(2)。
[0041]
(1)确定所述个体的粪便样本中的标志基因的丰度。
[0042]
所述标志基因包括第一基因集和第二基因集中的至少一种基因。其中,所述第一基因集由以下基因组成:srr6784535_gi_0048977、srr6784550_gi_0026032、srr6784547_gi_0011164、 srr6784521_gi_0025733和srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no: 1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seq id no:1-5中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:srr6784537_gi_0039489和 srr6784544_gi_0029966,其中,所述第二基因集中的基因与seq id no:6、7所示的核酸序列一一对应,所述第二基因集中的基因与其对应的seq id no:6、7中的核酸序列具有不小于90%的同一性。
[0043]
根据本发明的一些具体的实施例,步骤(1)进一步包括:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
[0044]
根据本发明的具体实施例,在步骤(1)中,按照下列公式确定所述标志基因的丰度: ab(g)=ab(ug) ab(mg),其中,g表示基因的编号,ab(g)表示基因g的丰度,ab(ug)表示所述测序数据与所述基因g的参考序列唯一比对的读段的丰度,ab(mg)表示所述测序数据与所述基因g 的参考序列非唯一比对读段的丰度;ab(ug)=ug/lg,其中,ug表示所述测序数据中与所述基因g 的参考基因唯一比对的读段数目,lg表示所述基因g的参考基因长度;其中,mg为所述测序数据中与所述基因g的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,coi为所述第i读段对应的丰度系数;其中,co
i,g
表示针对所述标志基因g,所述非唯一比对的读段i的丰度系
数,n为所述非唯一比对的读段i能够比对的基因的总数,j 表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。
[0045]
根据本发明的具体实施方案,进行以下以完成该步骤:获得所述个体的粪便样本中的核酸序列的测序数据,所述测序数据包括多个读段;将所述读段比对至所述标志物中的各种基因的基因组,获得比对结果;依据所述比对结果,确定所述标志物中的各种基因的丰度。
[0046]
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如pgm、ion proton、bgiseq-100平台,合成边测序的技术平台,比如illumina公司的hiseq、miseq序列平台以及单分子实时测序平台,比如pacbio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
[0047]
比对可以利用已知比对软件进行,例如soap、bwa和teramap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
[0048]
reads与参考基因组比对,比对上的可以被分为两部分:a)unique reads(u):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads 为unique reads;b)multiple reads(m):比对上一个以上基因的序列,定义为multiple reads。即,如果 reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
[0049]
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择ncbi数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
[0050]
(2)丰度比较,以确定个体是否患有肌痛性脑脊髓炎。
[0051]
根据本发明的一个实施例,将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有肌痛性脑脊髓炎。
[0052]
根据本发明的一些具体实施例,所述阈值为预先设定的。将标志物中的各种基因在对健康个体以及患病个体中的丰度预先测定保存,用以作为设定阈值的依据。所述阈值可以为一数值或者数值范围,基于已知患病或健康状态个体中的标志基因的丰度均值,该基因对应的阈值可以设为该基因丰度均值的 95%的置信区间(confidence interval)。
[0053]
所述的置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这
个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”,这个概率被称为置信水平。
[0054]
根据本发明的一些具体实施例,当步骤(1)中确定的标志基因的丰度达到所述患肌痛性脑脊髓炎丰度阈值,未达到所述不患肌痛性脑脊髓炎丰度阈值时,确定所述个体患有肌痛性脑脊髓炎,当(1) 中确定的标志基因的丰度达到不患肌痛性脑脊髓炎丰度阈值,未达到患肌痛性脑脊髓炎丰度阈值时,确定所述个体不患肌痛性脑脊髓炎。
[0055]
需要说明的是,根据目的或要求不同,可能对确定个体状态结果的可信程度有不同的要求,本领域技术人员可以选择不同的显著性水平或阈值。
[0056]
该方法基于检测个体的粪便样本中的标志基因中的各种基因的丰度,分别将检测确定的各种基因的丰度与其阈值进行比较,依据获得的比较结果能够确定个体为肌痛性脑脊髓炎个体或者为健康个体的概率。为早期发现肌痛性脑脊髓炎提供一种非侵入性的辅助检测或者辅助干预治疗的方法。
[0057]
以上任一实施例中的利用标志基因确定个体是否患有肌痛性脑脊髓炎的方法的全部或部分步骤,可以利用包含可拆分的相应单元功能模块的装置/系统来施行,或者将方法程序化、存储于机器可读介质,利用机器运行该可读介质来实现。
[0058]
根据本发明提供的一种确定个体是否患有肌痛性脑脊髓炎的装置,该装置包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有肌痛性脑脊髓炎;其中,所述第一基因集由以下基因组成:srr6784535_gi_0048977、srr6784550_gi_0026032、 srr6784547_gi_0011164、srr6784521_gi_0025733和srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no:1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seqid no:1-5中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成: srr6784537_gi_0039489和srr6784544_gi_0029966,其中,所述第二基因集中的基因与seq idno:6、7所示的核酸序列一一对应,所述第二基因集中的基因与其对应的seq id no:6、7中的核酸序列具有不小于90%的同一性。上述对本发明任一实施例的利用标志基因确定个体是否患有肌痛性脑脊髓炎的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
[0059]
根据本发明的实施例,所述丰度确定单元适于通过下列步骤确定所述丰度:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
[0060]
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如pgm、ion proton、bgiseq-100平台,合成边测序的技术平台,比如illumina公司的hiseq、miseq序列平台以及单分子实时测序平台,比如pacbio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
[0061]
比对可以利用已知比对软件进行,例如soap、bwa和teramap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对
到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
[0062]
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择ncbi数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
[0063]
reads与参考基因组比对,比对上的可以被分为两部分:a)unique reads(u):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads 为unique reads;b)multiple reads(m):比对上一个以上基因的序列,定义为multiple reads。即,如果 reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
[0064]
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择ncbi数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
[0065]
根据本发明的一个实施例,按照下列公式确定所述标志基因的丰度:ab(g)=ab(ug) ab(mg),其中,g表示基因的编号,ab(g)表示基因g的丰度,ab(ug)表示所述测序数据与所述基因g的参考序列唯一比对的读段的丰度,ab(mg)表示所述测序数据与所述基因g的参考序列非唯一比对读段的丰度;ab(ug)=ug/lg,其中,ug表示所述测序数据中与所述基因g的参考基因唯一比对的读段数目, lg表示所述基因g的参考基因长度;其中,mg为所述测序数据中与所述基因g的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,coi为所述第i读段对应的丰度系数;其中,co
i,g
表示针对所述标志基因g,所述非唯一比对的读段i 的丰度系数,n为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。上述对本发明任一实施例的利用标志基因确定个体是否患有肌痛性脑脊髓炎的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
[0066]
根据本发明的又一个实施例提供的一种装置,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行前面所述的一种确定个体是否患有肌痛性脑脊髓炎方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
[0067]
根据本发明的又一个实施例提供的一种筛选药物的方法,所述药物用于治疗或者
预防肌痛性脑脊髓炎,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防肌痛性脑脊髓炎:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度升高;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度降低;其中,所述第一基因集由以下基因组成:srr6784535_gi_0048977、srr6784550_gi_0026032、 srr6784547_gi_0011164、srr6784521_gi_0025733和srr6784524_gi_0020407,其中,所述第一基因集中的基因与seq id no:1-5所示的核酸序列一一对应,所述第一基因集中的基因与其对应的seqid no:1-5中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成: srr6784537_gi_0039489和srr6784544_gi_0029966,其中,所述第二基因集中的基因与seq idno:6、7所示的核酸序列一一对应,所述第二基因集中的基因与其对应的seq id no:6、7中的核酸序列具有不小于90%的同一性。
[0068]
利用本发明这一方面的生产或筛选治疗肌痛性脑脊髓炎的药物的方法,通过合理有效地应用确定的肌痛性脑脊髓炎标志基因进行筛选,能够获得提高肠道有益基因的丰度和/或降低肠道潜在致病基因的丰度的药物。
[0069]
下面将对实施例作具体介绍。以下实施例中涉及的未特别交待的试剂、序列、软件及仪器,都是常规市售产品。以下实施例包括第一阶段和第二阶段,即对应发现阶段和验证阶段。发现阶段包括:基于分析比较37个肌痛性脑脊髓炎患者及37个健康对照组的肠道微生物基因成分及功能改变,以确定基因标志物;验证阶段包括:利用13个肌痛性脑脊髓炎患者及13个健康对照组验证第一阶段结果的准确性。
[0070]
实施例1生物标志物的鉴定
[0071]
本实施例中,发明人通过对37个肌痛性脑脊髓炎患者和37个健康对照的粪便样品进行研究,从而获得肠道菌群基因群落及功能成分特征。总的来说,发明人下载约115.2gb高质量的测序数据(健康人 lc)以及实验测序得到的116.6gb高质量测序数据构建了肌痛性脑脊髓炎(as)参照基因集,并且igc 基因集构建一个更加完整的基因集。宏基因组分析显示,2599个组装基因与肌痛性脑脊髓炎密切相关,其中2499个基因在健康人的肠道基因中富集,150个组装基因在肌痛性脑脊髓炎病人中富集。
[0072]
1、测序数据的获取
[0073]
肌痛性脑脊髓炎患者来自美国四个地点(纽约州纽约市;犹他州盐湖城;内华达州因克莱恩村;和佛罗里达州迈阿密)招募的37名me/cfs病例和37名健康对照者,数据下载的ncbi的项目编号是 srp102150。
[0074]
参照图1所示的实验流程,鉴定肌痛性脑脊髓炎的相关基因标志物,其中省略的步骤或者细节为本领域技术人员所熟知,几个重要步骤介绍如下面所述。
[0075]
2、基因基因丰度分析
[0076]
2.1序列优化统计
[0077]
1)首先进行第一期测序,本期测序采集74个样品的数据,获得第一期的74个样品的测序数据以后,对其进行过滤,质控按以下标准进行:a)移除大于5个n碱基的reads;b)去除低质量碱基(q20) 大于50%的reads;c)移除尾部低质量(q20)和n碱基。丢失成对的reads序列被认为是单条reads用于组装,并进行基因预测。
[0078]
2)采用1)所述方法同样处理下载的健康人数据。
[0079]
3)从ftp://climb.genomics.cn/pub/10.5524/100001_101000/100064/1.genecatalogs/igc.fa.gz下载得到 igc基因集。
[0080]
2.2基因丰度分析
[0081]
利用soapdenovo 2.04将经过上步骤处理的paired-end clean reads分别进行组装。设置kmers设为为51、59及63,并筛选最优的组装结果。再使用基于从头预测的metagenemark3.26对组装结果进行基因的预测,设置参数-k-r-a-d-f g。对多个样本样本进行比较分析时,就需要我们将每个样本通过基因预测软件预测的基因构建一个非冗余的基因集。由于测序数据有限会导致一些低丰度微生物不能被检测到,另外就是我们进行基因集预测时的错误,所以整合已知的公共基因集,例如hmp基因集、metahit 基因集、9.9m igc基因集等,保证基因集的完整性,将有利于优化自身数据分析得到的基因集合。我们使用cd-hit 4.5.7软件构建非冗余基因集,设置参数-g 0-n 8-as 0.9-c 0.95-m 0-g 1。
[0082]
利用soapalign 2.21将经过上述步骤处理的paired-end clean reads比对(匹配)到上述非冗余基因组,比对参数为

r 2

m 200

x 1000。reads与非冗余基因组的比对结果,可分为两部分:a)unique reads (u):reads只比对上一个基因的序列;这些reads被定义为unique reads。即,如果这些序列来自同一基因,发明人将这些reads定义为unique reads。b)multiple reads(m):如果reads比对上两个及两个以上基因的序列,定义为multiple reads。即,如果比对上的序列来自不同基因,发明人定义这些reads为 multiple reads。
[0083]
对于给定的基因g,其丰度为ab(s),与u reads和m reads相关,丰度的计算方式如下:
[0084]
ab(g)=ab(ug) ab(mg),
[0085]
其中,g表示基因的编号,ab(g)表示基因g的丰度,ab(ug)表示所述测序数据与所述基因g的参考序列唯一比对的读段的丰度,ab(mg)表示所述测序数据与所述基因g的参考序列非唯一比对读段的丰度;
[0086]
ab(ug)=ug/lg,
[0087]
其中,ug表示所述测序数据中与所述基因g的参考基因唯一比对的读段数目,lg表示所述基因g 的参考基因长度;
[0088][0089]
其中,mg为所述测序数据中与所述基因g的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,coi为所述第i读段对应的丰度系数;
[0090][0091]
其中,co
i,g
表示针对所述标志基因g,所述非唯一比对的读段i的丰度系数,n为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。
[0092]
对于这些reads,发明人以加和的n个基因的unique reads的丰度作为标准,即对
于multiple reads,发明人把其所比对上的n个基因的unique reads丰度之和作为分母。
[0093]
2.3筛选基因基因标记物
[0094]
为了获得与肌痛性脑脊髓炎疾病密切相关的基因标记物,发明人利用肌痛性脑脊髓炎患者组 (37例)与健康人组(37例)两组粪便基因丰度数据,在基因层面做了一个与疾病相关性的研究。
[0095]
基于得到的基因丰度表,发明人设置标准如下:(1)肌痛性脑脊髓炎患者组或健康人组基因丰度的中位数必须大于0.000001;(2)通过结合benjamini hochberg的多重检验的wilcoxon秩和检验进行检验,得到每个基因和肌痛性脑脊髓炎疾病的相关性p值;(3)使用一个相对严格的阈值(p值《0.05)。利用上述参数进行筛选后,发明人得到2599个与肌痛性脑脊髓炎疾病密切相关的肠道微生物基因标志物,其中,在肌痛性脑脊髓炎(as)患者中富集的基因有150个,在健康人(hd)中富集的有2499个基因,这2599个基因标记物top20如表1所示。
[0096]
表1:
[0097]
基因(taxonomy)p值富集人群srr6784537_gi_00394890.0198177032assrr6784544_gi_00299660.0054547483assrr6784409_gi_00238860.002795973assrr6784528_gi_00551050.003165861assrr6784539_gi_00038010.0003591816assrr6784543_gi_00641590.005698201assrr6784406_gi_00252370.007219927assrr6784406_gi_00252380.007525114assrr6784536_gi_00641690.008293418assrr6784405_gi_00274840.008337881assrr6784535_gi_00489770.0189753217hdsrr6784550_gi_00260320.0358235702hdsrr6784547_gi_00111640.0088504045hdsrr6784521_gi_00257330.0066832579hdsrr6784524_gi_00204070.006543542hdsrr6784411_gi_00018660.000627872hdsrr6784404_gi_00268120.000632798hdsrr6784511_gi_00364010.000801993hdsrr6784531_gi_00288440.00082717hdsrr6784513_gi_00319310.00093459hd
[0098]
实施例2基因标记物的验证
[0099]
为了验证实施例1中的发现,发明人进一步分析验证群体中的13个健康人及13个肌痛性脑脊髓炎患者的粪便样本中的所述2599个基因的丰度,并根据验证情况对所述2599个基因做出删选,验证群体的dna提取、测序以及基因丰度的分析参照实施例1进行。
[0100]
验证结果如下:对于上述富集在健康人群中的2449个基因中,5个在验证集中得到
高质量的验证(p值《0.05),验证群体中在健康人富集的基因标志物的p值如表2所示。分别为srr6784535_gi_0048977,srr6784550_gi_0026032,srr6784547_gi_0011164, srr6784521_gi_0025733和srr6784524_gi_0020407。
[0101]
表2:
[0102]
基因名称p值富集的群体srr6784535_gi_00489770.007650375hd(健康人群)srr6784550_gi_00260320.014165928hdsrr6784547_gi_00111640.04210119hdsrr6784521_gi_00257330.042908136hdsrr6784524_gi_00204070.044726416hd
[0103]
对于上述富集在肌痛性脑脊髓炎患者中150个基因中,2个在验证集中得到高质量的验证(p 值《0.05),肌痛性脑脊髓炎患者富集的肠道微生物基因标志物验证的p值如表3所示,分别为srr6784537_gi_0039489和srr6784544_gi_0029966。
[0104]
表3:
[0105]
基因名称p值富集人群srr6784537_gi_00394890.019098706as(疾病组)srr6784544_gi_00299660.03777589as
[0106]
发明人认为,可以将从健康人富集的5个基因标记物,作为肌痛性脑脊髓炎疾病患病的反向指标,或作为治疗肌痛性脑脊髓炎进行研发的基因制剂药物菌群成分,或作为检测肌痛性脑脊髓炎、监测肌痛性脑脊髓炎治疗进程的指标;将肌痛性脑脊髓炎患者富集的2个基因标记物,作为肌痛性脑脊髓炎疾病患病的正向指标,特别用于肌痛性脑脊髓炎疾病简单、非创伤式的检测和诊断。
[0107]
发明人利用这7个基因标记物,构建一个综合指标,估计roc(receiver-operating characteristic) 曲线下面积auc,auc越大,表示诊断能力越高,评价综合得分对应其对肌痛性脑脊髓炎的诊断能力。通过对一期(第一阶段)的74个样品和二期(第二阶段)的26个样品进行评测,具体情况如图2所示,都表现出了很好的诊断能力,在一期得到auc=70.5%,如图2-a所示,置信区间为46.5%-94.5%;二期得到auc=86.7%,如图2-b所示,置信区间为57.4%-100.0%。
[0108]
上述各个基因包括如下所示的核苷酸序列:
[0109]
srr6784535_gi_0048977
[0110]
cagacggtttatttagaacgaggttacaagagcaaagaagtctgtggtcctgaacagcat cgaaataaatacgccggaggtatcaaaatggtttgtgttggaattgacgttgccaaggat aagcacgactgctgtattctcgactcggacggaacgattcgtgccgactgcattaccatc cccaataacatggatggcttcaagcagctgcttcagacgattcgagactgtaccaaaaag tcagacaaaataaaagtaggacttgaggctaccggacattacagctacaacattcttgga tttcttcttgacaatgacctggccgtctatgtcatgaatcctttgcacaccaacctgtac cgaaaaagtctcagccttcgcaaaaccaaaaccgatcgtgtggatgcaagaacgattgca actatgctattgtccgatgtagacctcaagtcctacacggatacagcataccataacgaa gagttaaagtcactaacaagataccgattcgataaggttcgtgaaagagccaagctgaag cagtcagtgtccagactggtcacgattctgtttccagaactggagaagctcgttccctct ctccatattgcttcggtttatgcgctcctcagtgaatatcccggtgcaaaacagatttca gaaat
tcatctcaccaagctgacaaaccttcttgcgacagcatccaagggtcgttatggc aaagataaggctatccagattcgagatgctgccagaacttccattggttccgttatgcct gctaaatttctggaactgaagcataccattaaactcattcgggaactcacctccgagatt gatgaaattgaagtttctattcagaaaatcatggatgaactgaatccaccgattctttct attcccggtgtcggtatccagtcagcagccatgattcttgctgaaatcggtgatttttcc aactttgaatctcctgacaaaatccttgcttacgctggctgctctccatctacataccag tccggaaaacttacaaactgttacgctcacatggagaagcgtggttctcgttatttgcga tatgccctctacaacgcaaccaagtacgtctgccactggaatcccgtctttgctgaatat cttgccaagaaacgtgctgaaggaaagcactacaatgttgccttatcccatgccacgaag aaacttgtgcggctaatctatgccttgcagaaatctggcaaagcatatcttgtagctgcc tga(seq id no:1)。
[0111]
srr6784550_gi_0026032
[0112]
gaagagccggaatgttcctgccgggctacccactccatatatatggcagaatctgtaatt aaggtcaggatacccgtaatttatctacaaagaactcaagcaaatatacctaaatttgca acatcataa(seq id no:2)。
[0113]
srr6784547_gi_0011164
[0114]
ctgaggacttcgtttttattcaacttaaccttttgggaattagtagaaaggttattggtg ctttcattcgagcaggagaataatgtaattcctgcaaagaatagtgataatggaatgatt ttcataagtttgttattagaatattatgtatga(seq id no:3)。
[0115]
srr6784521_gi_0025733
[0116]
atgaaacagtatgatgtgaaaatttcccggatggcactcagcgatatggagcagatttac agctacattgctgaccgtctgcttgaacctgatacggctatggggcagtacaaccgcatt gcagaagccatccagtcgctgaacatcctgccggaacgctgtgcgctggtggaaagtgag ccggagcgcacccaagggctgcggcagatgctggtggacaactactcggtgttctacatc gtgggcggggatgccgtgtcggtggcccgtgttctgtacagtgcatccgaccttgtgcgc cgcctgcggagaatgaagtga(seq id no:4)。
[0117]
srr6784524_gi_0020407
[0118]
atgcgcaaactgcatatcgtaaatatgccgttctgttcggcgctatttttgaaaaccgca ataaaagcagcagaaatttttgagcatctcataattctgtcaagagggctggcaccgtcc ggccctctctctttttgccaaagttttccttgtgttttcttgcaagctgccgaaatcagc gtgttctcaaaagttcgcgtttgcggagcggagcggagcaatgaaagccccagtggggct tttaagcgacagaacggtcttgcgcagcaagat(seq id no:5)。
[0119]
srr6784537_gi_0039489
[0120]
atggcaaccacacgcatcatgccgctgcatatcggcaagggtcggactgagagccgtgcc atcagcgatattattgactatgtggcaaatccccaaaagaccgacaacggaaaattgatt accagctatggatgtgacagccgcactgctgatgcagagtttctgttggcaaagcggcag tatattgccgccaccggacgagtgcgcggtacagatgatgtgatcgcctaccatgtgcgc cagtcgttcaggcccggagagatcacaccggaggaagccaaccggctgggcatagaattt gccaggcggttcaccaaaggcaatcattcctttgtggtctgcacccacatcgacaaatcg catattcataatcacatcatctggtcggcggtcaatatggattgtgaccggaagttccgt aacttttggggaagcaccagagctgttcgacgtttaagtgacaccatttgtatcgagaac ggactatccattgtggagaaccccaagccccacggaaaaagctacaacaagtggctgggc gaacaagccaagccctcccatcgggaacagctacgggtgatgattgaccgggcgctggag caaaagccagcagactttgacacacttctgcaactgctttccgagatgggctgcgaggta tctcggcgcgggaaagcaatccgccttaaagctcccggctggaagaatgtagcccgtatg gatgacaagctgggagccgggtacagcgaaacagaaatccgtgcggtgctggctggagaa aagcagcacacgccccgcaagaaatccaccgtgca
gccggagccacccaaggtcaatttg ctggtggatattcaggcaaaattgcaggccgggaaaggtgctggatatgcacgctgggcc aaggtttttaacttaaaacagatggcgcagaccgtgaattttcttaccgaacatcaccta ctggactatacagagctggaagaaaaagcggtggcggctaccgcccatcacaatgagctg tcagcgcagattaaggcgacggagaaacgcatggcagagatcgccgtcctgcgtacccat atcgttaattatgccaagacccgcgagacctatgttgcctatcgcaaggccggttattcc cgaaaatttcgggaggaacatgagcaagaaattctgctccatcaggcggcaaaaaatgcc tttgatgagatgggagtgaagaagctgcccaaggtcaaagacctgcaatctgagtatgcc aaactgctggaggaaaagaagaaaacctacgccgagtaccggcgttcccgtgaggaaatg cgggaacttttgacggcaaaggccaatgtggatcggctgctgaaaatggatgaggaacag aaaaaagaacaagaaaaagaccacggccagcggtaa(seq id no:6)。
[0121]
srr6784544_gi_0029966
[0122]
atggaaaaattgatttcgcggaaagaggctgccaaattactggggattagcattgccact ttggatgcagctcgaaacagtgggctaatttcctatgttcagtatgtgcaaaatggttgc gtgtactttacagatgctggccttcaggagtatatcgcaaaatgcacccatcgtgcaaag ccagtggaaaaaagcgctacataccgcaagctgcgaagtgtccgagcttga(seq id no:7)。
[0123]
srr6784405_gi_0027484
[0124]
atgccagcactttttgcgcagcaaaaggcaaagcaaaacgcccgtgaggacaatgcttct ttcatgtttacagaatcacaattgaatgaggatgatgatgcagcacagagcacatctgca ttggtcacttctaacaatgatgtttatctgtcaaatgtaggttatctgtttagcccaatg agatttcgtgtaaggggatatgattcccagtacagtgacatgtatatcaatggggtacag tttaatgatgcagaaacaggacgtttcagctacggattaataggaggattgaacgatgct acccgtaataaggaagggatcggtccttttgaatttaacaactttacttttggtgcgata ggaggtgccaccaatatcaatttacgtgccagccaatatgcggctggctcaaaactaaca ctgtcaggtagtaaccgcaactacattttgcgtggaatgtatacttattctacaggtctg atgaacaatggttgggcatttaccggatcattaggttatcgctggggtaatgagggaaat attgaaggaatcaaatataattctttttcttacttcctcggtgcggagaaagtattcaac gaacgccatagtctctctttggcaacttggggaacaccgacagagagaggacagcaaatg gcggcaaccgaagaagcttattatttagcgaacagtcattattataatccgaactgggga tatcagaatggagaaaaacgaaatgcacgtattgtacgtcagttcgaaccatcggctatt gcttcatggaatttcactattgatgataataagaaattagtgacaagtgccggattcaaa tattctaactatgggaaaagtgctctaggctggaatggtaatgcggccgatccacgcccg gattattataaaaagttgcctagctcaatctttgatgtatgggaatctgttcctactgcc gatgaattgcagcagtttaatgaagttacagataattggaaaaataataaagcttatcgt cagttagattgggatgctctttattttgccaataaacaggcgaatgcattaggtaaagag acactttattatgtagaagaacgtcatgatgatcagttggctttcaactttagttcggta ttcaatcatcaatggaatgaacacaacagctacattgcgggagttgccgtgaatacaacc aaaggtatgcattataaaaaaatgaaggatttgctgggcggacagctttatactgacgtc gacaaatttgcagtgcgcgatcatggagctagttccagtatggtgcaaaatgatcttgat aatcctaaccgccgtattggtgaaggtgataaatttggttatgattataacatctatgtg aataagcagagtgcatgggtgcgttatcagggtaacaatggcgggtcattaaactatttt gcttccggtaagataggatctacacagatgttccgcgatggattgatgagaaacggacgt gctccgttgaaatcacttggtagcagcggtacggctaaattccttgaaggaggtataaaa gccggtttgaattgggctatcaatggtaaccattctttcacgttgaatgccggatatgaa gaacgtgcaccgttggcctataactcttttattgctccacgtattaagaatgactttgtg agagacttgaaaacagagcgcatcattggtggtgatttgacttataacttcaacactcca tgggtgatgggacgtttgactggttattacactcgcttccagaatca
ggtagaaatggat gctttttataatgatagcgaagcacgtttcacttatctttctatgaatggcattgaaaag gaacattggggaatagaagcagcggctacctttaagttgacaagtgaactttcattgacg gctatcggtacttggagtgaagctaaatacaccaataatccggatgctgtattgacatat gaaagtgagaatgagtcaaacctcgatcgtgtttatgctaaaggtatgcgtgctaatggt actccgctttctgcttatagccttgctttggattataacgtaaaaggttggttcttcaat ttgaccggaaactattatgatcgtgtatatatcgatttctcaagctatcgtcgtcttggc agcgtattggataaaaatggtgccggcgtagatgctaatggaaatccggttctccatgta ccgggtcaggagaaactggatggtggatttatgttggatgcttccatcggaaaatacatt cgtttacgcaatggaaagagcattagccttaatttgagtttgactaatatcttgaacaat acagatttgcgtacaggtggtttcgaacagaaccgtgatgataattacaaagacggtgac gcacgtgtttacaagttttctaagaactctaagtatttctacgcattcccgttcaacgct ttcttgaacattggttatagattttaa(seq id no:8)。
[0125]
srr6784404_gi_0026812
[0126]
atggctgaaaaacaaaccagcaaagaccggatgcgggagatcgttgacagcatcgaaaac ggcatcaaggagctgttcgagagcgataagtaccggcagtatctctccactatgagccgc tttcaccgctactcggtcaacaataccatgctcatctatatgcagcgccccgacgccacc catgtggcgggcttcaacaagtggcgcgatcagttcggcaggaacgtcctgaaaggcgaa aaaggtatccgcatcatcgctcctactccctataagaaaaaggtcgaggaaatcaagacc gaccccgaaaccaatgcgccggtgctggacgcagacggcaaggccatcattgaggaaaag gaaatccgtatccctatgttcaaggtggtatccgtctttgacgtgtcgcagacttctgga aagcccttgccccagcttgccgccgatctgagcggcaatgtgcagcagtatgaggttttc atggaggcgctgcgccgtgcttctcccgttccgatggagataaagcccgttgcgcgggat acggacggctttttcagcattaaggcgcagagcatcaccatccgcgccggtatgagtgag gtgcagacggtatgcgccgccgtccatgagattgcccacgccaagctccacgactacgaa cacatgacggagcttgcggacgatggtgagacgatccttgtccccggtgaaaagagccgc aacaccgaggaggtcgaggccgaaagcatctcctatgcggtctgccagtattacggcatt gaaacgggcgaaaacagcttcggctatatcgccacatggtcaaagggcaaggagttgaaa gagcttcgcgccagtctggaaaccatcaacaagactgcctccgagctgattacggacatt gaccggcactttgcggagatttgcaaggagcgcggcatcgaccgggaggatttggccgct gcggaacagccaagtgtggaagcgcaagaggtggaaaagctctacatggtggacaacgac aaatacattcacgttcagcgcagcgacacgggcattgattacaccatctatgatgccggt tccgcaaaagtgctggatggcggcgtactcgacggcaccgaacagcaactgtccacagcg gcgcttgaggtttgcaaactccacaacatcggcgaagccgcaccgatccgccttgcgccg ctggagctgttgaaagacttgcgggaggcaaacgagctgcccctcgatgccgccgaacag atcaccggcgcagtcgctgttcccaccgatgcggcagataccatgctcccggagctggaa caggccgtcccgatgcctgaccccacgctgacggtggacgatatgcgcagctatgggtat ctggatagcgatatgctcccactttccaaggatcgggcggtggagctgctggagcatgac atcacggtttatatgctctatcccgacaacgccgaggaaatggtctttgaagccgaggac atcatcaagcacgacggaatgttcggtgtcacaagaccggattgggatgcggtcaaaggc catatcccaccccgcgatgtggagcagcgttttttgaacagtcccaccgattctatggcg atctaccaactgcgccgggatgcgccggtggagcttcgttttgccaacctcggcagtctg gccgcgccgcctgacccggccaactatgaagccgtctatacccgtgaggtgtacccggac gatgataccggcagaatccttgaaaacttctactacattttcaacgacgagcgccccggc gattttgtgggacacagcctctccgtcagcgacatcgttgcgctgaaacaggacggcaag gtatcctatcactactgtgacagcatggggtttcaggagctgcccgcctttcagaaaccg gagaattatctgaaggccgccgagatgtcgatggaggacgattacggcatgatcgacggc attatcaacaacggccccaaacagcccaccgtcgccgaccttgaagcacaggtcaaggcc ggtatgtccatctccctgatggatttggcagaggcggcacaccggg
aaaagaagaaatct gtgctggagcagctcaaaagccaaccggcccaagaacgtccacacaaaacagcgcccaaa aagagcgcggaaaaggagctttga(seq id no:9)。
[0127]
srr6784511_gi_0036401
[0128]
atggtgcggcagcccgcgtcgcaacgggcagtggcacaaaacgaaataaataaagacaat atgaaaataataaggaacatagcgagaaggccgtggccgcgcatcggcggctggttgccg gttatgatgctcatctgtggggtgctcgcttcctgtagcagtgaggatgaaagcaccgcg cccctgcccgacggcaagtacccgctgcaactgacggcggaggtggcgcagccgcagacc cgcgccggaggtaaggatgcgtggacgggcggcgaggagattagagtgtcactggaaggc gtgtttggtaacaaaacatacgtgatggacgcatcgggcaatgcaagcccgaaggatgcc gataatgccttctattggaagaacaccgatgaagcccgcgtcagtgcatggaccccggac atagaatcggaaacggatatttccgaccaaagtggcgggtacgccgctttcgatgtcctg tacgccagtgccatagggcgttatgaccaagccataaatctccgtttcatccaccgcatg gcgaaaatcgaagtaattctcaaagctggcgaaggcattacggaagaggagttggagggt gcgaccgtcaccattttcggagacccgctaacgcactcaaccgccggcttggtatcaccg ggtgaccaatcggacggcgagataaagccctattacgatgccgcaacgaagaaatacgag gcgttagtgccgccgcaggatatgacgggcaagccgctcatccgaatcagcataggcagc aatgactttacctacactcccgaaacagaagctgccggcaaatttgggtttttcggtggc aagcggtatgcctacaccatcaccgtgaaagccagtggcatagaggtgaccgcagccaag ggcggaacgtggaacgccggcggcagcgagaatgtgggcgtgaccatcacctatgacggc acggaaacagaaccgaaaatcggcgactattactactccgacggcacctggagcgacggt ggcctgcgcaagctctatgccgacggcacgatggagtgggcagagaccaagccgcagccg gagaacggtaagaacgttatcgccatcgtgttccatgccggtcatcacgaaaacgatgcc tccgattactcc(seq id no:10)。
[0129]
srr6784539_gi_0003801
[0130]
atgacaaagattgatattatctccggtttccttggagccggaaagactacatttattaag aagcttttgcaggaagccatttccggcgaacaggttgtgctgatcgaaaatgagttcggc gagatcgggatcgacggcggatttttaaaggattccggcattgagatccgtgagatgaat tccggctgtatctgctgttccctggtgggagattttggaaaatctctggcagaggtgctg acgacctataagccggaccgcatcatcatcgagccctccggcgtaggaaagctgtctgat gttatgaaagctgtaatcgacgtatctgcagatatggatgtggccttaaacagcgcggtt accattgtggatgcggcaaagtgcaaaatgtatatgaaaaacttcggtgaatttttcaat aatcagattgaaaatgcaggtaccattgttttgagccgtactgatatcacagacccggcc aagatccagaaggatgtggagctgatccgtgagaaaaatccaaaggcagccgttgtgacg actcctctgggagagctgggcggagaccagttattagagattattgagaagcgcgacacc atgctggatgatctgatggcagaggtgagagcgcatcaccatcatgatgaggagtgcggc tgcggtgagcatcaccatgatcacgagggccatgatcaccatcacggccatgaacatggc gagtcctgtacctgcggctgtcatgagcatgaggagcatgagcaccatcatcatcatgac cacggcgaagactgcacctgcggctgccacgatcatgagcatcaccaccatcatcatgca gatgaagtatttaccagctggggcatggaaactattgttcctgttaccagggatcagctg gaggacatcttaaagcgtctggcagatacaaaggaatttggcgatgtactgcgggcaaag ggaatgcttcctacggaaaatccgggagagtggctgtactttgatctggttccccagcag tatgagatccgccagggccgtcccgattataccggtaaggtatgtgtcatcggagccagc ttaaaggaagaagaattgaacagcctgtttggaagaggctaa(seq id no:11)。
[0131]
srr6784406_gi_0025237
[0132]
atgaaactgcaaaatttatctgtcagggcatttttgagaaaaattgtggcggggactctg ctcactgccgctttgctgctgttgatttttttcctgttgacgaaagatgtgcgtgttgtc atctgcggcattattttgacag
ctgtattttacatttggggcatggtttttctgcactat tttcaaaagaaactttctctgttcaccgatggtttgtgccagacattggatcacatgatg gacagtacagaccggccccaggtagactatgaagcggaaacactgctgtctcggattagc catcgtctggaacggctctataatgtgatgcagaaaaccagacatacggcagagggagaa aaggaagaactgcaatccctggtatcagatatttcccaccagaccaaaacccccatcgca aatttgaagctgatcaacgatacgatgctgacaaggccattgacagaagaaaagcgcaag gagtttttgcaggccacaggcacgcagctggataaattggattttctcattcagggaatg gtgaaaacctcccgtctggaaacgggtgtcattacgctggagaaacaggatgctgtgatc ggggatacgctggtgagcgccatcaatggtgttctggctccgatggaacaaaaagagatt agcctgtcggtggactgcccatctgatctgacaatatcccatgacagccgctggacttcc gaagcattgtttaacattctggataatgcggtaaagtacacctctgccggtggcagcatc caggtgagggtacgggattgggagatgtatttgaggatagatgtgacggatacaggcaga ggcatcccggagcattctcagggcacgatcttcaaacgcttctatcgggatgaagcggtg catgatatagatggggtcggaatcggcttataccttgcccgtgagatcattaccatgcag ggcggctatattaccgtcgagtctaaagttggggaaggatcaaccttttccgtgttcctg cccataaaataa(seq id no:12)。
[0133]
srr6784536_gi_0064169
[0134]
ctttataagcagtgtgaggaaaacggcacaagctatgtgatccggctgaaggagaatggc attctccgcaaaaaagcatcctatcttgtggatgagcttgatgagatcaccaaaaataat aaagtcgattatgcagtagcctatggcgaattcatgtatagagcgagttcatggccttat gaaaggcgtgtggtatgcaaggttgaaaagccggaaaaccaaatggtttacatgtacaca tttgttgtcacaaacatggattcctcaccagagtatctcatcaaattttactgcaagcga gggctgatggaaaacttcattaaagaaagcaaatccggttttgattttgcatccgtaagc agtcataccagaatggtaaatgccaatagactgcaggtacatgctcttgcgtataacata tttaattggtttagaagattggtgttatcagcaaatatgcgaaagcaacgcattgatacc gtccgtttaaaattgctgaagattgctgcaaaagtagttcattcagcaagatatatcaca ttcaaactgtgcagcagttgcccctataagaatgaattctatgagacactttcaaatatc ggcaagctgaatgtacagctggaatag(seq id no:13)。
[0135]
srr6784513_gi_0031931
[0136]
atggaacagcttttgaaaattctggaagataacgcgcggctttccgttgaggacattgcc acgatgctgaataaatcccccgccgaggtggcggccatgatcgacctggcccgggcgcag ggcatcatcaagggctacaagacccttgtggactgggaaaaggccggggtgaaccgggtg gaggcggtcattgagctgaacgtcagccccaagaagagccgaggctttgatgagatcgcg gccaccattgccgcttttgacgaggtggagagcgtgctgctgatgagcggcggttacgac ctgcagctggtcatcaagggccagacgttccaggagatcgccctgtttgtggcaaagcgg ctgagcccgctggacgatgtgctgtccacggccactcactttgtcctccgcacctacaaa aaagagggccgcctgtaccaggacgacgagatcgatgaaagagagtgcacggtgctgtga(seqid no:14)。
[0137]
srr6784531_gi_0028844
[0138]
atggattgtgcaaggccgggcccttcgggtttcgcggaaaaatcatcctcgctgcgcttg cggtatttttcccgaaagccttgcgcaatccggcacggaacggcggggcaggcaagaaat aaaatctcggctctacaaagccggggatgtctaactcaaaaaacaaaaggtatgagcaga agcaactttacaccgatgggacggttcaaagagataatcgaccgatacggactgaaactg atggaggtgggaaccaaccacctgagaatattcgctgacaacaggaagctgttcgactac tatccgctacggatgaaactgttcgattaccgacagtggaaacagctgacctacccgtca ctcattgagggggcggacaagtgggaaacggagcttgacgaaattataaaaagacttatg gtttcaccccaataa(seq id no:15)。
[0139]
srr6784409_gi_0023886
[0140]
atgatgaagccatctgaatttcagacaaccatagagaaccagtttgattacatctgtaaa gtcgctatggaagatgaacgcaaagactatctcaaagcgttgtccagacagtgcaaacgg gaaaccctgttttgtgatatggacgattacaccgttaatctgttttcttccgaagacacc tacccatcccacttccatacttttgaaatggatggatttactgtccgtattgaaaacagc ctgttagcagaagcattagaaaatctggatggaaagaaacgtgatgttatcctgagatat tattttcttggatttgacgatacggaaatttcaaaaattctggaagtcaaccgttctact atccagagaagaagacacgccggactagaatttatcaaaaaatttatggaggaggaagca tga(seq id no:16)。
[0141]
srr6784528_gi_0055105
[0142]
atgccaatagagaagaatctaaaaagtagaaatatggtgaagttttttatagtaatggct atgttattgggtagtagcgttgcaagtgcagaaaataaacagataacaagtcctgatgga aagctggtagtaacagtcgcagatatggatggaagaccctcttattctgttagttatgac aatgttctctttttgaaaccatctccattggggatgattgcaaatataggagatttctca tcggggatgtcgctggagaagaatgtttcaacaaataaaatagatgaaacatacgagttg gcttctattaaaaagagtaaggtacattatgtggca(seq id no:17)。
[0143]
srr6784411_gi_0001866
[0144]
atgaggattaaacgatcaggcatgaaacagaacaatgacataccggataaaatcatggaa cgtatccgcaagctgatgcgtctgaaggagtctaccacttccgaaggtgaagcacgggaa accgccctaacatgctgccatgacgcgcttattgacaagtacctggaaaaaataggagcc ggcacttcaaaggcacatccgagaaagaccggaaccgaccgctccgcgtattactcaggc atgggtgacggcaggaacatcagtctgaactggcagataaaaggaggtggtatatga(seq idno:18)。
[0145]
srr6784543_gi_0064159
[0146]
atgaataagacaagacctaaacaattatcattccgggtaagtgaagaagaataccagcag ttgcagcagaagattttagagagtggaaagaaccaacaggagtatatcctttcctgcgtg ctggagaagcagatcgtgaatatggacggtatcaaggaacttatcccggaactgaaacgg atagggaacaacctcaaccagatagcaaagcggtgtaatgaggggggaatgttgccgagt gaagcggaagtgcggaagcatggagaggagctgaacaaagtatggcagtcattaagg(seq idno:19)。
[0147]
srr6784406_gi_0025238
[0148]
atggaaatcacaaagacattactcatcaatgcagcttgcttgctgatcccgccggtcgtt gttgttctgctgctccggcacttctttccaaggaaaattagatggtcggctggtgtggtg gctctggtagatctggtgatcttctggacagatattttttattatgagagcgtttggctg acgctgttttttgttgtaattcagttcgcaacggttttgcttatatctatctggctttat aaaaaagacacacgaaaatga(seq id no:20)。
[0149]
实施例3个体状态的检测
[0150]
本实施例中,发明人利用25个粪便样本进行样本来源的个体状态的检测。
[0151]
参照实施例2的方法确定各粪便样本中表3所示的srr6784537_gi_0039489和 srr6784544_gi_0029966的丰度,判断各样本中的这2个基因的丰度是否落入各自在疾病对照组或者健康对照组的丰度的95%的置信区间,判定这2个基因的丰度均落入疾病组的对应区间的样本所对应的个体的状态为肌痛性脑脊髓炎患者,判定2个基因的丰度均落入健康组的对应区间的样本所对应的个体的状态为非肌痛性脑脊髓炎患者。
[0152]
结果显示,利用本实施例所述方法能够对25样本进行个体状态判断,而且这25个粪便样本中的14个粪便样本的个体状态判断结果与记录的该样本来源个体的状态一致。
[0153]
另外,发明人发现对表2和表3中的基因联合检测,例如检测表3中的基因标志物被富集,同时表2中基因标记物不被富集,能够更准确的判断发现肌痛性脑脊髓炎患者或易感人群。
[0154]
在利用标志物治疗肌痛性脑脊髓炎的方案中,发明人发现使3中的基因标志物生长得到抑制或者清除,同时使表2中基因标记物被富集,治疗效果极佳。
[0155]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0156]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献