一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

与结直肠癌预后相关的标志分子的制作方法

2022-02-19 00:55:09 来源:中国专利 TAG:


1.本发明涉及癌症治疗以及预后评价领域,具体涉及与结直肠癌预后相关的标志分子。


背景技术:

2.结直肠癌(colorectal cancer,crc)是指发生在结肠或直肠上的恶性肿瘤。如今,它约占全球所有诊断出的癌症和与癌症相关的死亡病例的10%,每年约有90万人因该病去世。crc大部分是零星散发的,并且在很大程度上归因于西化的环境风险因素,例如肥胖、不良饮食习惯、饮酒和吸烟。其诊断主要是依靠结肠镜检查以及在结肠镜下取样进行病理确诊。结直肠癌在治疗上大多采取以手术治疗为主的综合治疗,相对于结肠癌,直肠癌对放疗的敏感性更高,效果更好一些。结直肠癌由于解剖位置关系复杂,彻底手术难度大,术后复发率高;结肠癌由于发生快和转移多而通常预后较差。
3.转录因子(tfs)是具有调节功能的蛋白质。它们通过识别基因上游的特定dna序列来调节基因转录,从而在发育和分化中起关键作用。许多转录因子不仅影响细胞类型的决定和个体发育模式,还参与许多生物途径的调节(例如免疫应答)。大量研究表明,tfs与肿瘤的形成和治疗密切相关。以往研究都是利用少量样本的rna

seq数据筛选与结直肠癌预后相关的基因集;很少关注转录因子在结直肠癌早期诊断与预后方面的提示作用;大多研究是基于已知的结直肠癌相关调控因子,结合测序数据或者文献报道挖掘与该调控因子具有显著上下游相关调控关系的基因或信号通路及其在结直肠癌中的调控作用,未有研究利用数据库大量癌症与癌旁样本的测序数据结合wgcna分析筛选与结直肠癌预后相关的特征转录因子。因此,直接利用crc相关的tfs来构建结直肠癌的预后模型可能为crc的诊断和治疗提供新的思路。


技术实现要素:

4.在过去十年中,新技术的飞速发展使我们能够快速获取大量的crc生理和病理信息。加权基因共表达网络分析(wgcna)是探索基因与表型之间复杂关系的有效方法。wgcna的独特优势是其可将基因表达数据转换为共表达模块,从而深入了解可能负责人们感兴趣表型特征的信号网络。它不仅可以比较差异表达的基因,还可以帮助我们弄清楚不同共表达模块中基因间的相互作用。因此,本发明通过提取crc癌症和癌旁组织中的差异表达基因,利用wgcna分析来筛选疾病相关tfs,同时建立疾病预后风险模型,实现tfs靶标调控网络的构建。
5.本发明的第一目的在于提供分离的与结直肠癌预后相关的标志分子,包括:如seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5、seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10、seq id no:11、seq id no:12以及seq id no:13所示的至少一个基因序列。
6.具体而言,本发明提供的与结直肠癌预后相关的标志分子可以是seq id no:1~
seq id no:13中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或全部十三个序列。
7.其中,如seq id no:1所示的基因序列,其编码的蛋白又名zeb1。zeb1是肿瘤上皮

间质转化的关键驱动因子,直接与cdh1启动子结合,抑制e

cadherin转录。目前,尚未见该基因序列与结直肠癌预后相关的报道。
8.如seq id no:2所示的基因序列,其编码的蛋白又名转录因子7样蛋白1,tcf7l1。tcf7l1是一种定位于内质网的氨基酸蛋白,属于糖基转移酶的岩藻糖基转移酶亚家族,在胰腺、肾、肺、心脏、脑、肝、胎盘和骨骼肌中高表达。目前,尚未见该基因序列与结直肠癌预后相关的报道。
9.如seq id no:3所示的基因序列,其编码的蛋白又名meis1。meis1是调控细胞发育和增殖过程中决定细胞命运的重要转录因子,其在非小细胞肺癌细胞中的表达增加会导致肿瘤细胞增殖受限。目前,尚未见该基因序列与结直肠癌预后相关的报道。
10.如seq id no:4所示的基因序列,其编码的蛋白又名微邻苯二甲酸相关转录因子,mitf。mitf能够协调十分广泛的生物学过程,包括细胞存活、分化、增殖、侵袭、衰老、新陈代谢和dna损伤修复等。目前,尚未见该基因序列与结直肠癌预后相关的报道。
11.如seq id no:5所示的基因序列,其编码的蛋白又名nk3同源框蛋白,nkx3

2。经人卵巢癌验证,nkx3

2在耐药性肿瘤中显著上调,其过表达与远处转移显著相关。目前,尚未见该基因序列与结直肠癌预后相关的报道。
12.如seq id no:6所示的基因序列,其编码的蛋白又名pgr。pgr基因位于染色体11q22上,可编码孕酮受体(pgr或pr)。大多数乳腺癌显示具有雌激素受体或孕激素受体的过表达。根据er、pr、her2三种激素受体状态的变化,乳腺癌可被分为四种亚型,这些分类影响疾病治疗方法的选择。目前,尚未见该基因序列与结直肠癌预后相关的报道。
13.如seq id no:7所示的基因序列,其编码的蛋白又名meis2。meis2蛋白通常与hox或pbx蛋白相互作用形成同源蛋白

dna复合物,在调节神经嵴和肢体发育中起重要作用。目前,尚未见该基因序列与结直肠癌预后相关的报道。
14.如seq id no:8所示的基因序列,其编码的蛋白又名wwtr1(taz)。wwtr1(taz)是hippo信号通路的核心组分,yap/taz使癌细胞克服接触抑制,不受控制地生长和扩散。小g蛋白rac1的鸟苷酸交换因子tiam1在细胞质中可与taz相互作用,促进taz降解。目前,尚未见该基因序列与结直肠癌预后相关的报道。
15.如seq id no:9所示的基因序列,其编码的蛋白又名kcnip3。钾离子电压门控通道相互作用蛋白kcnip3目前与癌症疾病相关关系的研究较少。目前,尚未见该基因序列与结直肠癌预后相关的报道。
16.如seq id no:10所示的基因序列,其编码的蛋白又名apbb1。apbb1最初作为脑发育过程中的淀粉样前体蛋白结合蛋白被发现,与阿尔兹海默症的发病过程密切相关,但它在癌症中的作用研究甚少。有研究发现apbb1与增强癌症干细胞(csc)和上皮

间充质转化(emt)以及增强肺癌细胞的抗辐射特性有关。目前,尚未见该基因序列与结直肠癌预后相关的报道。
17.如seq id no:11所示的基因序列,其编码的蛋白又名cbx7。cbx7蛋白属于转录抑制因子的一种,能够参与细胞增殖转录过程,在维持胚胎干细胞自身更新和全能性、抑制
esc分化中有着非常重要的作用。已有文献报道cbx7与甲状腺癌的恶性表型相关。目前,尚未见该基因序列与结直肠癌预后相关的报道。
18.如seq id no:12所示的基因序列,其编码的蛋白又名hand2。hand2是心脏形成的一种关键调节因子,同时也是子宫内膜癌中差异甲基化的热点,hand2甲基化是子宫内膜癌中常见而重要的分子改变。目前,尚未见该基因序列与结直肠癌预后相关的报道。
19.如seq id no:13所示的基因序列,其编码的蛋白又名lmo3。神经特异性转录因子lmo3可通过akt

mtor和akt

gsk3β信号通路促进前列腺癌细胞增殖和转移,同时lmo3

borcs5融合癌基因在尤文氏肉瘤复发时是肿瘤进展的驱动因素。目前,尚未见该基因序列与结直肠癌预后相关的报道。
20.本发明的第二目的是提供评价结直肠癌预后效果的检测试剂盒,其中包括:用于检测与结直肠癌预后相关的标志分子表达量的试剂;所述标志分子包括:如seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5、seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10、seq id no:11、seq id no:12以及seq id no:13所示的至少一个基因序列。
21.具体而言,所述标志分子可以是seq id no:1~seq id no:13中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或者全部十三个序列。
22.作为本发明的优选方案,所述试剂盒用于检测标志分子mrna的表达量,所述试剂包括针对所述标志分子的反转录引物对,优选还包括针对所述标志分子的特异性荧光探针,通过实时监控pcr体系中的荧光信号,对检测患者样品中所述标志分子的表达量进行定量检测。
23.本发明的第三目的是提供结直肠癌预后效果的评价模型,所述模型具体为:
24.riskscore=

1.140*zeb1

0.301*mitf

0.146*apbb1

0.142*cbx7

0.052*hand2 0.013*lmo3 0.164*kcnip3 0.189*wwtr1 0.213*meis2 0.213*pgr 0.215*nkx3

2 0.311*meis1 0.895*tcf7l1;
25.其中,zeb1代表样品中如seq id no:1所示基因序列的表达量,mitf代表样品中如seq id no:4所示基因序列的表达量,apbb1代表样品中如seq id no:10所示基因序列的表达量,cbx7代表样品中如seq id no:11所示基因序列的表达量,hand2代表样品中如seq id no:12所示基因序列的表达量,lmo3代表样品中如seq id no:13所示基因序列的表达量,kcnip3代表样品中如seq id no:9所示基因序列的表达量,wwtr1代表样品中如seq id no:8所示基因序列的表达量,meis2代表样品中如seq id no:7所示基因序列的表达量,pgr代表样品中如seq id no:6所示基因序列的表达量,nkx3

2代表样品中如seq id no:5所示基因序列的表达量,meis1代表样品中如seq id no:3所示基因序列的表达量,tcf7l1代表样品中如seq id no:2所示基因序列的表达量;所述表达量为基因序列对应的mrna含量。
26.本发明的第四目的是提供结直肠癌预后效果的评价系统,所述评价系统包括:(1)数据输入模块,用于将与结直肠癌预后相关的标志分子的表达量检测结果输入模型计算模块;所述表达量为标志分子对应的mrna含量;(2)模型计算模块,用于对输入的检测结果进行计算处理,得到被测患者的预后效果数据;(3)结果输出模块,用于根据结直肠癌预后效果评价标准对被测患者的预后效果数据进行评价,输出评价结果。
27.作为本发明的优选方案,所述模型计算模块采用的模型具体为:
28.riskscore=

1.140*zeb1

0.301*mitf

0.146*apbb1

0.142*cbx7

0.052*hand2 0.013*lmo3 0.164*kcnip3 0.189*wwtr1 0.213*meis2 0.213*pgr 0.215*nkx3

2 0.311*meis1 0.895*tcf7l1;
29.其中,zeb1代表样品中如seq id no:1所示基因序列的表达量,mitf代表样品中如seq id no:4所示基因序列的表达量,apbb1代表样品中如seq id no:10所示基因序列的表达量,cbx7代表样品中如seq id no:11所示基因序列的表达量,hand2代表样品中如seq id no:12所示基因序列的表达量,lmo3代表样品中如seq id no:13所示基因序列的表达量,kcnip3代表样品中如seq id no:9所示基因序列的表达量,wwtr1代表样品中如seq id no:8所示基因序列的表达量,meis2代表样品中如seq id no:7所示基因序列的表达量,pgr代表样品中如seq id no:6所示基因序列的表达量,nkx3

2代表样品中如seq id no:5所示基因序列的表达量,meis1代表样品中如seq id no:3所示基因序列的表达量,tcf7l1代表样品中如seq id no:2所示基因序列的表达量;所述表达量为基因序列对应的mrna含量。
30.所述与结直肠癌预后相关的标志分子包括:如seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5、seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10、seq id no:11、seq id no:12以及seq id no:13所示的至少一个基因序列。
31.具体而言,所述标志分子可以是seq id no:1~seq id no:13中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或者全部十三个序列。
32.本发明的第五目的是提供所述标志分子、所述试剂盒、所述评价模型或所述评价系统在结直肠癌诊断中的应用。
33.本发明的第六目的是提供所述标志分子、所述试剂盒、所述评价模型或所述评价系统在结直肠癌患者预后评价中的应用。
34.本发明首次从转录因子与疾病预后关系的角度出发,在结直肠癌组织和癌旁组织中筛选出差异表达的tfs基因集(df

tfs),后续通过wgcna分析、lasso回归分析、cox回归分析、roc曲线分析和风险评分等方法,筛选出与结直肠癌预后显著相关的13个转录因子。在利用特征计算的风险评分预测肿瘤患者的预后和临床病理特征时,其roc曲线下面积值较高,表明这13个基因能很好的反应直肠癌患者的预后,为提高临床结直肠癌患者的诊断和生存预后提供了新思路。
附图说明
35.图1为tcga数据库结直肠癌样本中差异转录因子的表达热图;
36.图2为wgcna分析结果;a.软阈值筛选;b.聚类结果;c.模块内gs指标均值;d.模块与表型的相关性计算;
37.图3为turquoise模块内tfs的共表达网络图;外围为hub tfs,内部为相对低节点的tfs,后续选择外围tfs进行分析;
38.图4为利用cox单因素回归结果进行lasso回归;
39.图5为模型的km曲线验证(a)和roc曲线(b)验证;
40.图6为外部数据集验证;a.高低风险组的k

m曲线图;b.样本风险表;c.样本删失
图;d.模型中tfs的表达热图;
41.图7为单因素和多因素cox分析结果;
42.图8为基于cox多因素回归的列线图(a)和1年(b)、2年(c)、3年(d)、5年(e)os的校正曲线;
43.图9为模型内tfs的tf

target调控网络;网络内围为tfs,点的大小符合tfs节点度的大小,外围为作用靶点基因。
具体实施方式
44.以下实施例用于说明本发明,但不用来限制本发明的范围。
45.实施例
46.本实施例利用tcga数据库得到具有表型信息的结直肠癌rna

seq测序样本;整合trrust数据库和jaspar数据库收集目前已报道的所有tfs;通过wgcna分析、lasso回归分析、cox回归分析、roc曲线分析和风险评分筛选出与结直肠癌预后密切相关的基因。
47.具体采用包括如下步骤的方法:
48.首先从tcga数据库中下载得到434份具有表型的rna

seq测序样本,其中有383个癌症样本和51个癌旁样本。进一步整合trrust数据库和jaspar数据库提供的转录因子信息,最终得到981个tfs的表达矩阵用于后续分析。进一步使用r包limma进行差异表达tfs的鉴定,去掉低表达的tfs,最终利用978个tfs进行差异分析,筛选出250个tfs,其中上调102个,下调148个。tcga数据库结直肠癌样本中差异转录因子的表达热图如图1所示。
49.进一步利用de_tfs进行wgcna分析(结果如图2所示),通过软阈值筛选得到最适power=3,然后以此通过一步法构建网络,合并相似模块后最终的得到两个模块,通过模块与预后表型的关联分析,确定与os_status相关性最高turquoise模块(113tfs),导出网络,导入cytoscape,以degree=112筛选出62个具有高节点数的tfs(hub tfs),用于后期模型构建。turquoise模块内tfs的共表达网络图如图3所示。
50.对62个hub tfs进行批量cox单因素回归分析,最终筛选到14个显著相关的tfs。对相关tfs进行功能富集分析,主要富集在各器官系统发育,转录因子复合体,癌症相关的转录失调以及rna聚合酶ii特异的dna结合活性等通路。
51.进一步利用lasso回归从cox单因素回归分析结果(如图4所示)中筛选出更加显著相关的13个tfs,利用公式计算每个样本依赖模型的风险得分,并以median为cutoff区分高低风险组,利用该分组结合生存数据绘制km曲线(如图5a所示),发现高风险组的生存率显著低于低风险组,表明构建的模型具有代表性,之后进一步绘制roc曲线(如图5b所示),得到的auc=0.706,暗示模型的预测能力较强。
52.然后利用geo数据库中的gse14333数据进行模型验证,按照同上的数据处理方法,对测试数据进行基于模型的高低风险分组,然后结合生存数据绘制k

m曲线,曲线表明高风险组的生存率显著低于低风险组,暗示构建模型的的预后效果较好(如图6所示)。
53.为了鉴定risk score是否为唯一预后影响因素,选择年龄,性别,pathologic stage和lymphatic invasion为其他因素,分别利用cox单因素回归和多因素回归鉴定相关因素与疾病预后的相关性(结果如图7所示),在cox单因素回归分析中,pathologic stage的hazardratio值最高,其次为risk score和lymphatic invasion。之后进一步对以上5种
因素进行了cox多因素回归分析(结果如图8所示),除了pathologic stage,其他因素分析结果的hazard ratio值均有所下降,risk score的hazardratio值仍为第二高,表明除了pathologic stage外,依赖模型的risk score是较合适的预后因素。模型内tfs的tf

target调控网络图如图9所示。
54.riskscore=

1.140*zeb1

0.301*mitf

0.146*apbb1

0.142*cbx7

0.052*hand2 0.013*lmo3 0.164*kcnip3 0.189*wwtr1 0.213*meis2 0.213*pgr 0.215*nkx3

2 0.311*meis1 0.895*tcf7l1。
55.以上结果表明如seq id no:1~seq id no:13所示的13个因子与结直肠癌的预后密切相关,有潜力作为结直肠癌患者预后预测与分析的特征因子,且基于上述13个因子提供的直肠癌预后效果的评价模型能够有效评价直肠癌的预后效果。
56.虽然,上文中已经用一般性说明、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献