一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

组合的焦亡相关基因在食管腺癌预后模型中的应用的制作方法

2022-02-21 11:39:17 来源:中国专利 TAG:


1.本发明属于肿瘤分子生物学技术领域,具体涉及一种组合的焦亡相关基因在食管腺癌预后模型中的应用。


背景技术:

2.食管癌是全球最常见的恶性肿瘤之一,全球每年约有60万新发病例和54万死亡病例;食管腺癌(eac)和食管鳞状细胞癌(escc)构成了食管癌的主要组织学亚型,其中西方国家的eac发病率在过去几十年急剧增加;尽管在手术、放疗、化疗和靶向药物治疗方面取得了进展,但食管癌的5年生存率仍低于20%。因此,迫切需要生物标志物和有效模型来预测eac的预后。
3.细胞焦亡是一种伴随着炎症反应的细胞程序性死亡方式,依赖于半胱氨酸天冬氨酸蛋白酶(caspase)家族的炎性蛋白酶活性。细胞焦亡的特点是细胞质膜迅速破裂,随后释放促炎细胞内内容物。近年来,关于细胞焦亡在神经、感染、自身免疫、心血管和肿瘤等疾病中的作用的研究不断涌现。
4.然而,尽管已有研究表明细胞焦亡在escc中的作用及重要性,细胞焦亡在eac中的作用仍有待探索,并且目前缺乏方便、准确、高效的eac预后预警模型。因此,本专利对eac中的焦亡相关基因进行了综合评估,并开发出一种基于焦亡基因的模型来预测患者的预后。


技术实现要素:

5.针对现有技术的缺陷,本发明提供了一种组合的焦亡相关基因在食管腺癌预后模型中的应用,具有准确性高的优点,在临床上可以为食管腺癌患者提供疾病诊断及预后的新方法。
6.为了实现上述目的,本发明的具体技术方案是:
7.组合的焦亡相关基因在食管腺癌预后模型中的应用,其中,组合的焦亡相关基因为casp1、gsdmb、il1b、pycard和zbp1。
8.作为本发明的另一种具体实施方式,食管腺癌预后模型的建立方法包括以下步骤:
9.步骤一、数据的收集整理
10.癌症基因组图谱(tcga)数据库中获取食管腺癌患者的临床数据和正常组织转录组数据;
11.步骤二、筛选差异表达的焦亡相关基因
12.对已知的多个细胞焦亡相关基因使用limma算法进行差异表达分析,筛选出相较于正常组织显著表达的基因组合;
13.步骤三、差异表达的焦亡相关基因的再分析
14.针对筛选出的基因组合采用r语言的glmnet包进行lasso回归法分析,剔除冗杂基因,得到差异基因组合;
15.步骤四、建立风险指数评估模型
16.使用lasso cox回归法基于步骤三中所得到的差异基因组合建立焦亡相关基因预后风险指数评估模型,评估模型计算方法为:
17.风险指数评分=回归系数
×
基因表达水平;
18.其中,采用glmnet函数计算出差异基因组合中每个基因所对应的回归系数;
19.步骤五、构建列线图
20.基于基因特征和临床特征,使用rms、foreign、survival包构建列线图,评估患者的生存率以及评估模型的效能。
21.作为本发明的另一种具体实施方式,步骤二中所筛选出的相较于正常组织显著表达的基因组合为casp1,casp5,gsdmb,gzmb,il1b,nlrp6,pycard,tnf,trem2和zbp1。
22.作为本发明的另一种具体实施方式,步骤三中所得到的差异基因组合为casp1、gsdmb、il1b、pycard和zbp1。
23.作为本发明的另一种具体实施方式,步骤四中的模型计算方法为:
24.风险指数评分=(0.042
×
casp1 mrna表达水平) (﹣0.025
×
gsdmb mrna表达水平) (0.021
×
il1b mrna表达水平) (﹣0.037
×
pycard mrna表达水平) (﹣0.243
×
zbp1 mrna表达水平)。
25.作为本发明的另一种具体实施方式,步骤四中,根据中位风险评分,将患者分为高风险组和低风险组,并使用kaplan-meier分析比较两组之间的总生存率。
26.作为本发明的另一种具体实施方式,分别对高风险组和低风险组进行主成分分析,通过“prcomp”函数评估两组的可分离性,使用“survival”、“survminer”、“timeroc”和“riskregression”包构建受试者工作特征曲线和曲线下面积计算。
27.本发明具备以下有益效果:
28.本发明利用tcga数据库对食管腺癌的全基因组进行了分析,基于五个焦亡相关基因建立与食管腺癌预后相关的预后模型,预后模型具有准确性高的优点,在临床上可以为食管腺癌患者提供疾病诊断及预后的新方法。
29.下面结合附图对本发明作进一步的详细说明。
附图说明
30.图1是本发明初步筛选10个差异表达的细胞焦亡相关基因的表达示意图;
31.图2是本发明tcga队列中焦亡相关基因风险特征的构建示意图;
32.图3是本发明使用tcga队列中与焦亡相关的五基因特征预测预后的示意图;
33.图4是本发明gse13898队列中与焦亡相关的五基因特征的验证示意图;
34.图5是本发明基于焦亡相关的五基因特征构建列线图。
具体实施方式
35.为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
36.在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可
以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。
37.方法
38.1)数据集
39.2021年5月20日,tcga数据库中检索到87名患者(78名患有eac;9名正常样本)的rna测序(rna-seq)数据和相应的临床信息。验证队列rna-seq数据和临床信息是从基因表达综合(geo)数据库获得。(编号:gse13898)。
40.2)焦亡相关基因组中差异表达基因(degs)的鉴定
41.58个与焦亡相关的基因可以从此前发表的综述和go术语“焦亡”(id:go0070269)获得。使用“limma”包验证p《0.05的deg。
42.3)焦亡相关基因预测模型的开发和验证
43.cox回归分析用于进一步评估焦亡相关deg对预后的价值。使用r包“glmnet”及lasso cox回归分析构建了预后模型,风险评分的计算采用以下公式:
44.风险评分=(coef i表示系数,xi表示标准化后的基因表达水平)。根据中位风险评分将eac患者分为低风险组和高风险组,并使用kaplan-meier分析比较两组之间的总生存率(os)。主成分分析(pca)用于通过“prcomp”函数评估两组的可分离性。r包“survival”、“survminer”、“timeroc”和“riskregression”用于1、2和5年的受试者工作特征(roc)曲线图和曲线下面积(auc)计算由r包“rms”、“foreign”和“survival”构建具有临床特征(包括分期和风险评分)的列线图模型。使用来自geo数据库的eac队列(gse13898)进行验证,并通过与上述相同的方法计算风险评分,将队列分为两个亚组(低风险组和高风险组)。
45.4)变量的预后分析
46.从tcga队列和gse13898队列中提取患者的临床数据(性别和分期)。通过单变量和多变量cox回归分析在回归模型中分析包括性别、分期和风险评分在内的变量。
47.结果
48.1)eac和正常组织之间deg的鉴定
49.在tcga队列的78个eac和9个正常组织中验证了58个焦亡相关基因的表达水平,并鉴定出10个deg(|log2fc|≥1且p值《0.05;casp1、casp5、gsdmb、gzmb、il1b、nlrp6、pycard、tnf、trem2、zbp1),其在肿瘤组中均上调。deg的表达谱如图1所示(红色代表较高的表达水平;蓝色代表较低的表达水平)。
50.2)基于degs的预后模型构建
51.使用单变量cox回归分析以评估deg的预后价值(图2a)。其中,6个基因(casp1、casp5、gsdmb、il1b、pycard和zbp1)的p值《0.2,casp1、casp5、il1b的高表达与风险增加相关(hr》1),而gsdmb、pycard、zbp1与较低风险相关(hr《1)。随后,lasso cox回归分析基于最佳λ值得出5个用于预后模型构建的基因(图2b、2c)。
52.风险评分计算如下:风险评分=(0.042*expcasp1) (﹣0.025*expgsdmb) (0.021*expil1b) (﹣0.037*exppycard) (﹣0.243 expzbp1)。根据计算的中位风险评分,65例患者分为两组(高风险组32例,低风险组33例),临床资料见图3a。患者较好地被区分为两个亚组(图3b)。风险评分和生存时间的分布如图3c、3d所示。高风险组的os显着低于低风险组(p=
0.0012,图3e)。风险模型的roc分析表明,1年、2年和5年生存的auc分别为0.708、0.815和0.952(图3f、3g、3h)。单变量和多变量cox回归分析均显示焦亡相关基因特征可以独立预测eac患者的预后(图3i、3j)。
53.3)通过外部数据集验证焦亡基因组合
54.来自geo的gse13898数据集的60名eac患者的信息被用于验证上述焦亡相关基因组合。如上所述,将患者分别细分为低风险组和高风险组。患者较好地被区分为两个亚组(图4a)。风险评分和生存时间的分布如图4b、4c所示。低风险组患者是存活率明显高于高风险组(p=0.003;图4d)。根据roc曲线,1年和2年生存预测模型的auc分别为0.678和0.663(图4e、4f)。风险评分也可以作为验证队列中的独立预后因素(图4g、4h)。
55.4)基于基因特征和临床数据的列线图构建
56.为了更准确地预测eac患者的预后,我们结合tnm分期构建列线图模型,如图5a所示。用于预测1年、2年和5年生存率的列线图的auc分别为0.722、0.884、1.000(图5b、5c、5d),表明列线图对患者生存的预测效果较为理想。
57.虽然本发明以较佳实施例揭露如上,但并非用以限定本发明实施的范围。任何本领域的普通技术人员,在不脱离本发明的发明范围内,当可作些许的改进,即凡是依照本发明所做的同等改进,应为本发明的范围所涵盖。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献