一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于结直肠癌预后评估的基因标志物的制作方法

2021-10-09 15:09:00 来源:中国专利 TAG:预后 分子生物学 基因 评估 用于


1.本发明涉及医学分子生物学技术领域,尤其涉及用于结直肠癌预后评估的基因标志物。


背景技术:

2.结直肠癌(colorectal cancer,crc)作为全球第三常见的癌症,其高发病率和高死亡率使得攻克结直肠癌成为一件刻不容缓的事情。然而,尽管对于结直肠癌在治疗上相较以前已经有所改善,但由于结直肠癌并不明显的早期症状容易被患者忽视,通常在晚期时才被确诊,导致结直肠癌的死亡率高居不下。现阶段对于结直肠癌的治疗手段一般采用手术切除和药物辅助治疗,但是由于肿瘤具有高度异质性的特点,不同患者之间的治疗效果存在很大差异。因此有效预防结直肠癌、实现正确诊断和治疗是当前结直肠癌研究中的重要目标。为了解决这一问题,相关的研究人员及技术人员在研究用于临床鉴定的分子标记方面已经做出了大量努力,例如,原发肿瘤的基因表达特征可以预测转移。然而,到目前为止,相关的标志物的临床应用仍然受到限制。
3.生物标志物筛选对肿瘤精准医疗至关重要。基于患者个性化基因型和临床信息的crc生物标志物发现可以促进对某些类型和阶段的癌症患者进行分类,从而个性化定制预防和治疗方法。越来越多新的标志物被提出用来做前期肿瘤诊断、病程检测控制以及预后生存评估,推动了肿瘤的个性化治疗。虽然高通量组学的发展产生了大量的组学数据,大大增加了开发有效生物标志物的机会,但目前常用的肿瘤生物标志物筛选策略往往只基于组学数据,背景噪声大,导致只有有限的肿瘤标志物被批准用于临床。随着进化医学开始发展,积累的进化知识已被成功地用于多种疾病发病机制解析和致病基因鉴别。脊椎动物进化史中的全基因组复制中保留的一批重复基因被称为ohnolog,在生物体的发育和调控起重要作用。除此之外,癌细胞通过“快速”进化可以逃脱细胞分裂和程序性死亡控制,使得癌症迅速扩散,因此癌症驱动基因具有特殊的起源进化阶段特征。


技术实现要素:

4.基于以上背景,本发明提供了基于进化理论而得到的用于结直肠癌预后评估的基因标志物,并且基于癌症和进化之间的重要关联,提供了一种基于进化理论筛选结直肠癌预后评估的基因标志物的方法。
5.本发明的技术方案为:
6.用于结直肠癌预后评估的基因标志物,其包括以下基因:
7.casp6、clock、dennd6a、larp1、slc36a4、serbp1、st7l、sec22c、usp33。
8.进一步的,上述的基因标志物基于进化理论筛选得到。
9.进一步的,所述基因标志物可用于制备用于结直肠癌预后评估的试剂盒,所述试剂盒包括基因探针或引物,所述基因探针或引物可通过定量pcr技术来检测所述基因标志物。
10.本发明还提供了一种基于进化理论筛选结直肠癌预后评估的基因标志物的方法,其包括如下步骤:
11.(1)从进化角度确定生物标志物具有的进化特征;
12.(2)从tcga中下载了结肠腺癌病人(tcga

coad)和直肠腺癌病人(tcga

read)的数据并进行合并,即为tcga

crc数据,所述数据包括病人基因表达数据、临床数据,所述临床数据包括生存状态、生存时长,所述基因表达数据为rna

seq测序得到的基因表达量fpkm;
13.(3)收集临床病人的样本,并进行rna

seq测序,构建dch

crc数据;
14.(4)对步骤(2)的tcga

crc数据进行预处理,得到有关的蛋白编码基因在结直肠腺癌病人中的基因表达矩阵,并对有关蛋白的编码基因的表达与病人预后生存时间建立cox比例风险回归模型,鉴别出表达水平与生存预后有显著相关关系(p

value<0.05)的基因;
15.并结合步骤(1)的进化特征,进一步地筛选出在tcga的病人基因组中存在非同义突变的基因,此为候选基因标志物;
16.(5)对步骤(4)筛选出的候选基因标志物采用功能富集分析来验证其准确性;
17.(6)采用gatk最佳变异鉴别流程对结直肠癌rna

seq数据(dch

crc)进行snp鉴别分析,将步骤(4)筛选出的候选生物标志物在dch

crc中进行生存分析验证,进一步地筛选出能够显著对对结直肠癌病患进行预后的基因标志物。
18.进一步的,所述进化特征包括进化特征一、进化特征二;
19.所述进化特征一基于ttd数据库中现有生物标志物中ohnolog基因的分布情况得到,其为:生物标志物多显著富集ohnolog基因;
20.所述进化特征二基于内源性分子网络理论追踪癌症相关基因的进化起源阶段得到,其为:癌症相关基因多起源于真核生物,后鞭毛生物以及真后生动物进化阶段。
21.采用上述技术方案,具有的有益效果如下:
22.本发明的基因标志物是基于进化理论筛选得到,筛选的过程考虑到了癌症细胞与进化之间的关联,并且经过实验与临床验证,通过本发明9个基因标志物的表达水平能够对结直肠癌病人预后的生存时间上具有很好的区分能力,其可作为有效的生物标记物对结直肠癌病患进行预后评估,以能够对病患进行有效地、个性化的防护与治疗,并且本发明的基于进化理论筛选结直肠癌预后评估的基因标志物的方法可推及到其他的癌症预后基因标志物的筛选,为开发有效的生物标志物提供新的思路。
附图说明
23.图1为本发明实施例1中的从tcga中筛选的候选生物标志物的go功能注释;
24.图2为本发明实施例1中从tcga中筛选的候选生物标志物的kegg通路富集;
25.图3为本发明实施例1中的从dch

crc的rna

seq数据鉴定变异信息,其中:a鉴定到的变体种类分布;b鉴定到的变体类型分布;c变体的碱基变异类型分布;d病人样本中的变体总数分布;e不同种类变体的样本数;f突变频率排前10的基因分布;
26.图4为本发明实施例1中的dch

crc病人中非同义突变频率前30的基因的分布行表示基因,列表示病人样本;
27.图5为本发明实施例1中的筛选到9个结直肠癌生物标志物筛选的维恩图。深色圈内为从tcga

crc筛选到的539个候选生物标志物;中深色圈内为从dchcrc筛选到的570个候
选生物标志物;浅色圈内为根据dch

crc鉴定到的具有nssnp的11,204个突变基因;
28.图6为本发明实施例1中的预后显著相关基因在dch

crc病人中的非同义突变分布;
29.图7为本发明实施例1中的生物标志物在dch

crc的生存曲线;
30.a

i分别为clock、larp1、slc36a4、usp33、casp6、serbp1、st7l、dennd6a、sec22c在不同表达分组的生存曲线;生存时间(天)指从手术到病人死亡或最后一次随访的时间。
具体实施方式
31.下面通过具体实施方式对本发明作进一步详细的说明:
32.实施例1:一种基于进化理论筛选结直肠癌预后评估的基因标志物的方法,其具体的筛选的过程为:
33.(1)本实施例从tcga中下载了结肠腺癌病人(tcga

coad)和直肠腺癌病人(tcga

read)的数据,进行合并,即为tcga

crc数据,tcga

coad中有521例病人癌症样本的基因表达数据,其中459例病人有临床数据(生存状态、生存时长)记录,399例病人存在经mutect鉴定的基因组变异数据;tcga

read中有177例病人癌症样本的基因表达数据,其中171例病人有临床数据(生存状态、生存时长)记录,137例病人存在经mutect工具鉴定的基因组变异数据。基因表达数据为rna

seq测序得到的基因表达量fpkm。
34.(2)本实施例的临床病人的rna

seq数据,即为dch

crc数据,其来源于四川达州市中心医院提供的3批结直肠癌rna

seq数据。结直肠癌样本来自医院2018年2月至2019年10月间的病人手术组织,涵盖153个病人的癌症组织样本和癌旁组织样本,一共306份样本。
35.(3)对(1)中的tcga

crc的基因表达数据进行预处理,得到了18,837个蛋白编码基因在581例结直肠癌患者中的基因表达矩阵。分别对18,837个基因的表达与病人预后生存时间建立cox比例风险回归模型,鉴别出2,011个基因的表达水平与生存预后有显著相关关系(p

value<0.05)。结合生物标志物的两项进化特征对候选生物标志物进行过滤,得到551个候选基因,其中539个基因在tcga的病人基因组中存在非同义突变,此539个基因被锁定为结直肠癌候选生物标志物。
36.(4)为了探究上述步骤(3)对基因过滤筛选的准确性,对候选生物标志物进行功能富集分析,结果见图1和图2。图1的go功能富集结果显示步骤(3)的候选基因主要参与wnt信号通路以及该通路调控的细胞信号转导,轴突发育,胞内运输调控,突触小炮定位与运输,钙离子依赖的胞吐调控;图2中的kegg通路富集结果显示候选基因富集人类乳头瘤病毒感染,钙离子信号通路,wnt信号通路以及胃癌,肝细胞癌,乳腺癌等癌症相关通路。go和kegg中均富集到wnt信号通路和钙离子调控通路,一方面说明该功能注释结果是互相支持的,另一方面由于wnt通路和癌症的发展密切相关,目前有多种wnt通路靶向性药物已经进入了临床阶段,因此从这539个基因中获得癌症生物标志物是有效可行的。
37.(5)基于肿瘤突变基因更容易成为生物标志物,因此本发明结合dch

crc的病人体细胞变异数据对生物标志物进行筛选和验证。本实施例从dch

crc的癌症样本和对应癌旁样本的rna

seq数据出发,利用生物信息学工具鉴别了病人的体细胞变异位点。图3是153例病人的变异情况,经calling snp分析一共识别出12,453个基因在病人中出现变异,识别到变异位点有691,218个。其中变异类型为影响蛋白功能的非同义突变的位点共40,027个,分
布在11,204个基因中。通过对样本和基因的变异数量统计分析得到每例样本平均存在402个变异,最高频的突变基因为znf506,在76个患者中都发生了变异,突变频率达到50%。
38.为了检验识别变异位点的准确性,本实施例挑选出识别到的高频突变基因与常见的突变基因进行比较。图4是dch

crc中非同义突变频率前30的突变基因在病人中的分布,其中包括了tp53,kras等常见的结直肠癌高频突变基因,说明从rna

seq中识别到的变异位点是准确的,可以进行后续结直肠癌的生物标志物筛选。
39.为了准确筛选出结直肠癌的生物标志物,本实施例对从tcga中筛选得到的539个候选生物标志物在dch

crc中进行验证。如图5所示,同样对dch

crc病人分组后建立cox比例风险回归模型后,从tcga中获得的539个潜在生物标志物中,有12个基因在dch

crc数据中表达水平同样和病人显著相关(p

value<0.05)。结合dch

crc的calling snp分析结果,其中9个基因在153例病人中发生非同义突变,此9个基因即为所最终筛选出的结直肠癌生物标志物(图6)。
40.并且通过图7展示的潜在生物标志物的生存曲线,其km生存曲线的log

rank检验结果说明其中9个基因(casp6、clock、dennd6a、larp1、sec22c、serbp1、slc36a4、st7l、usp33)的生存曲线在dch

crc病人的不同表达分组中有显著差异,并且表1中的风险比例分析结果中8个基因的高表达与病人不良预后相关(hr>1),1个基因的低表达与不良预后相关(hr<1)。这些结果说明这9个基因的表达水平对于病人预后生存时间上具有很好的区分能力,可以作为有效的结直肠癌预后生物标记物。
41.表1:在dch

crc病人中生存曲线存在显著差异的生物标志物的cox风险回归结果
[0042][0043]
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜