一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种胶质母细胞瘤自噬相关预后模型的建立方法与流程

2022-12-31 15:46:17 来源:中国专利 TAG:


1.本发明涉及医学技术领域,尤其涉及胶质母细胞瘤自噬相关预后模型的建立方法。


背景技术:

2.胶质瘤是最常见的神经系统恶性肿瘤,随着who 2016版中枢神经系统肿瘤分型的发布,胶质瘤及其他分子肿瘤正式进入了分子诊断时代,其典型的预后分子标志物包括idh1/2突变、tert突变、1p/19q缺失以及mgmt甲基化等,已成为当前常规胶质瘤病理诊断所需检测项目。
3.然而,预后标志物仅能提示一类人群的生存时间os和无进展生存时间pfs,却仍然无法很好地进行个体化的预后判断,此外,自噬活动异常是一个新发现的肿瘤特征,与肿瘤的发生、生存和治疗有关,如果合理利用自噬在gbm中的作用机制,将有助于有效利用自噬来治疗gbm。


技术实现要素:

4.本发明的目的是为了解决现有技术中存在的缺陷,而提出的胶质母细胞瘤自噬相关预后模型的建立方法。
5.为了实现上述目的,本发明采用了如下技术方案:
6.一种胶质母细胞瘤自噬相关预后模型的建立方法,包括以下步骤:
7.s1:通过cox回归分析筛选与gbm预后相关的自噬基因;
8.s2:分别构建gbm的os预后风险比例模型和pfs预后风险比例模型;
9.s3:通过k-m生存分析刻画gbm风险比例模型预测效能;
10.s4:对os预后风险比例模型和pfs预后风险比例模型分别进行数据处理分析;
11.s5:构建预后预测模型。
12.进一步地,在步骤s1中,对每一个差异自噬基因的连续表达值进行单因素cox回归分析,识别出预后显著的基因;
13.以性别和年龄作为协变量,继续进行多因素cox回归分析,进一步识别到最终的预后显著的基因,即:p值《0.05。
14.进一步地,在步骤s2中,构建gbm的os预后风险比例模型的具体流程为:利用多变量cox回归结果中的基因的回归系数组建风险模型,在每一个样本中计算风险得分risk score。
15.进一步地,在步骤s3中,利用构建的risk score以中位值作为阈值将样本分成两组:将大于等于中位值的分为高风险组,将低于中位值的分为低风险组,并进行km曲线分析。
16.进一步地,在s4中,对os预后风险比例模型的处理分析流程为,进行os预后风险比例模型在独立数据集中预测效能的验证,获得包含样本的基因表达数据和样本的生存数
据;
17.计算每个样本的风险得分,依据得分均值将样本分成高风险组和低风险组,进行km曲线分析,发现数据中生存时间显著的差异。
18.进一步地,在s4中,对pfs预后风险比例模型的处理分析流程为,进行自噬基因在高低风险得分组的表达差异分析。
19.相比于现有技术,本发明的有益效果在于:
20.构建的风险模型能够很好地在tcga中预测病人整体生存,并可以独立数据中得到验证;
21.通过分析,筛选整合tcga-gbm数据库中差异表达的自噬相关基因,分别利用功能富集分析筛选与预后相关的自噬基因,进行预后回归分析,计算预后风险比例模型,并在另外两个独立的geo数据集中验证风险比例模型的预测效能,且模型能够与已知的idh1/2突变情况、mgmt甲基化水平以及患者年龄等临床高风险因素结合,具有一定的临床病理意义;
22.建立的预测模型,能够结合临床因素(idh突变状态和年龄),很好地在tcga中预测病人无进展生存。
附图说明
23.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
24.图1为本发明提出的胶质母细胞瘤自噬相关预后模型的步骤流程图;
25.图2为本发明提出的胶质母细胞瘤自噬相关预后模型的逻辑图。
具体实施方式
26.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
27.实施例一
28.参照图1-2,胶质母细胞瘤自噬相关预后模型的建立方法,包括以下步骤:
29.s1:通过cox回归分析筛选与gbm预后相关的自噬基因;
30.s2:分别构建gbm的os预后风险比例模型和pfs预后风险比例模型;
31.s3:通过k-m生存分析刻画gbm风险比例模型预测效能;
32.s4:对os预后风险比例模型和pfs预后风险比例模型分别进行数据处理分析;
33.s5:构建预后预测模型。
34.具体的,在步骤s1中,对每一个差异自噬基因的连续表达值进行单因素cox回归分析,识别出预后显著的基因;
35.以性别和年龄作为协变量,继续进行多因素cox回归分析,进一步识别到最终的预后显著的基因,即:p值《0.05,分别为p4hb、casp1、diras3、serpina1、cflar、ctsl1、itpr1、nfkb1、myc、hspa5和ddit3。
36.在步骤s2中,构建gbm的os预后风险比例模型的具体流程为:利用上一步中多变量cox回归结果中的基因的回归系数组建风险模型,在每一个样本中计算风险得分risk score:
37.risk score=0.1439*p4hb_exp 0.0998*casp1_exp 0.0906*diras3_exp 0.0633*serpina1_exp 0.2406*cflar_exp 0.1474*ctsl1_exp 0.1614*itpr1_exp 0.1767*nfkb1_exp (-0.0897)*myc_exp 0.1975*hspa5_exp 0.1398*ddit3_exp。公式中的exp表示每个基因在特定样本中的表达值。
38.在步骤s3中,利用构建的risk score以中位值作为阈值将样本分成两组:将大于等于中位值的分为高风险组,将低于中位值的分为低风险组,并进行km曲线分析。
39.在s4中,对os预后风险比例模型的处理分析流程为,进行os预后风险比例模型在独立数据集中预测效能的验证,获得包含样本的基因表达数据和样本的生存数据;
40.对于4套geo数据验证,gse83300,gse61335,gse4412和gse84010,它们均包含基因表达数据和样本的生存数据,分别包含50,44,59和333个样本。
41.计算每个样本的风险得分,依据得分均值将样本分成高风险组和低风险组,进行km曲线分析,发现数据中生存时间显著的差异。(p value=0.0409,0.0168,0.0375和0.027)。
42.在s4中,对pfs预后风险比例模型的处理分析流程为,进行自噬基因在高低风险得分组的表达差异分析,具体流程为:高低风险组中,每个自噬基因的表达差异如图prog_genes_diff_pfs.pdf,所有基因在两组中差异的p value均小于0.0001。
43.实施例二
44.在实施例一的基础上,结合tcga gbm表达数据,识别52个差异表达自噬基因,作为同一发明的优选实施例,具体如下:
45.在步骤s1和s2中,对每一个差异自噬基因(52个)的连续表达值进行单因素cox回归分析,识别18个预后显著的基因(pvalue《0.05),以性别和年龄作为协变量,继续进行多因素cox回归分析,最终识别到11个预后显著的基因(p value《0.05),它们分别是p4hb、casp1、diras3、serpina1、cflar、ctsl1、itpr1、nfkb1、myc、hspa5和ddit3;
46.利用这些基因的表达的中位数和最佳分割点进行分组得到的km曲线结果,其中最佳分割点的确定,在每个基因的表达向量中遍历25%到75%的百分位点的分割样本组,选择生存差异最大的百分位点;
47.利用得到的多变量cox回归的结果中11个基因的回归系数组建风险模型,在每一个样本中计算风险得分risk score,其中:
48.构建gbm的os预后风险比例模型为,risk score=0.1439*p4hb_exp 0.0998*casp1_exp 0.0906*diras3_exp 0.0633*serpina1_exp 0.2406*cflar_exp 0.1474*ctsl1_exp 0.1614*itpr1_exp 0.1767*nfkb1_exp (-0.0897)*myc_exp 0.1975*hspa5_exp 0.1398*ddit3_exp,公式中的exp表示每个基因在特定样本中的表达值。
49.构建gbm的pfs预后风险比例模型方式为,risk score=0.1121*casp1_exp 0.2205*sh3glb1_exp 0.0951*diras3_exp 0.1049*serpina1_exp 0.1597*cflar_exp 0.1658*ctsl1_exp 0.1129*casp4_exp 0.1093*fas_exp (-0.0983)*myc_exp 0.1593*tmem49_exp 0.1976*hspa5_exp 0.1043*ddit3_exp,公式中的exp表示每个基因在特定样本中的表达值。
50.在步骤s3中,利用构建的risk score以中位值作为阈值将样本分成两组:将大于等于中位值的分为高风险组,将低于中位值的分为低风险组,并进行km曲线分析,其中:
51.gbm的os预后风险比例模型的结果显著二者具有显著的生存差异(p value=0.0012);
52.pfs预后风险比例模型的结果显著二者具有显著的生存差异(pvalue=0.00091)。
53.在s4中,对os预后风险比例模型的处理分析流程为,进行os预后风险比例模型在独立数据集中预测效能的验证:
54.对于4套geo数据验证,分别为gse83300、gse61335、gse4412和gse84010,它们均包含基因表达数据和样本的生存数据,分别包含50,44,59和333个样本;
55.计算每个样本的风险得分,依据得分均值将样本分成高风险组和低风险组,进行km曲线分析,发现数据中生存时间显著的差异(p value=0.0409,0.0168,0.0375和0.027)。
56.在s4中,对pfs预后风险比例模型的处理分析流程为,进行自噬基因在高低风险得分组的表达差异分析,具体流程为:高低风险组中,所有基因在两组中差异的p value均小于0.0001。
57.在上述实施的基础上,综合预测模型(prognosis_index)和临床病理风险因子(idh_status和age),构建预后预测模型,同时构建roc预测1年生存率图,并展示列线图。
58.综上所述,在tcga gbm表达数据中识别了52个差异表达自噬基因,其中11个能够预测病人整体生存,基于这11个基因构建的风险模型能够很好地在tcga中预测病人整体生存,并在4套独立数据中得到验证,该预测模型与一些临床因素(idh突变状态和年龄)显著相关;
59.另外12个基因能够预测病人无进展生存,基于这12个基因构建的风险模型能够很好地在tcga中预测病人无进展生存,该预测模型与一些临床因素(idh突变状态和年龄)显著相关。
60.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献