一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

与性别相关的肝癌预后标志性因素及其筛选方法与流程

2021-10-19 23:08:00 来源:中国专利 TAG:预后 肝癌 标志性 筛选 性别


1.本发明涉及医疗技术领域,具体涉及与性别相关的肝癌预后标志性因素及其筛选方法。


背景技术:

2.肝脏为人体最大的消化腺体,主要参与人体消化、代谢、排泄、解毒及免疫等多个过程。同样肝癌被称为人体的代谢工厂,来自胃肠吸收的物质,几乎均进入肝脏,在肝脏内进行合成、分解、转运和存储。能够引起肝癌损害的各种病因作用于肝脏后,可导致不同程度的肝脏细胞受损及肝脏功能障碍。
3.肝癌是我国常见的恶性肿瘤之一,同时该疾病发生率、病死率高,病死率位居全世界恶性肿瘤第三位,该病疗程短、医治困难,对人类的生命健康造成严重威胁。随着医疗水平的发展,治疗肝癌的措施也多样化,现在的治疗逐步发展为以联合治疗为主,不再是单一的治疗,但是患者的治疗效果差异巨大,5年内生存率仅为7%,因此肝癌的治疗形式不容乐观。患者的生存率受到多种因素的影响,在研究中发现性别不同的患者的预后因素也有所不同,在治疗过程中如果能针对性的加以诊断研究,对控制肝癌的快速发展进而提高患者生存期以及改善肝癌的预后有着重要的意义。


技术实现要素:

4.为解决现有技术中的问题,本发明专利设计了与性别相关的肝癌预后标志性因素的筛选方法,找到了不同性别的肝癌患者预后的标志性因素,对临床来说为性别不同的肝癌患者在预后方面提供有针对性的诊断治疗。
5.对于女性患者,肝癌预后的标志性因素是肿瘤直径、有无淋巴结转移和child.pugh 评分,对于男性患者,肝癌预后的标志性因素是肿瘤直径、child.pugh评分、afp和有无肝硬化。
6.本技术公开的与性别相关的肝癌预后标志性因素的筛选方法,用r语言软件进行统计分析、采用了方差分析、随机森林、主成分分析等方法,具体筛选方法为:步骤1、选取足够样本数量的肝癌患者统计生存资料,确认多个可能与患者的总生存周期有关的因素,分别统计男性患者和女性患者的与总生存周期有关的因素情况;
7.步骤2、采用r语言软件对采集的患者样本进行统计分析,基于主成分分析的总生存期差异原因提取,得到碎石图,得到需要保留的主成分进行分析;基于随机森林的总生存期差异原因提取,通过调用随机森林函数得到拟合优度数值,对各个因素的重要性进行分析;
8.步骤3、进行预测,利用多元回归分析,剔除相关性低的因素,对保留的剩余因素调用随机森林函数得到拟合优度值,筛选出男、女肝癌患者的预后标志性因素,得到最终的重要性因素排序结果。
9.进一步的,步骤1中确认的与患者的总生存周期有关的因素是性别、年龄、afp、肿
瘤直径、肝硬化、hbv感染、淋巴结转移、门脉癌栓和child.pugh评分。
10.进一步的,步骤2基于主成分分析的总生存期差异原因提取,得到碎石图,表明只需要保留两个主成分;进行主成分分析,得到两个主成分在每个因素上的荷载、主成分公因子方差、成分唯一性以及两个主成分的特征值、方差比例和累积方差比例;之后进行主成分旋转,调用head函数得到主成分与原始变量之间的线性回归方程系数。
11.进一步的,得到女性患者肝癌预后标志性因素及其重要性排序为:肿瘤直径>有无淋巴结转移>child.pugh评分,男性患者肝癌预后标志性因素及其重要性排序为肿瘤直径>child.pugh评分>afp>有无肝硬化。
12.相对于现有技术,本发明专利设计的与性别相关的肝癌预后标志性因素及其筛选方法的进步之处在于:通过r语言软件统计分析手段,准确筛选出与性别相关的肝癌预后标志性因素,其中对于女性患者,肝癌预后的标志性因素是肿瘤直径、有无淋巴结转移和 child.pugh评分,对于男性患者,肝癌预后的标志性因素是肿瘤直径、child.pugh评分、 afp和有无肝硬化。本发明所采用的筛选方法更加科学、可靠,在治疗过程中有针对性的对上述标志性因素加以诊断研究,有益于控制肝癌的快速发展,进而提高患者生存期,改善肝癌的预后。
附图说明
13.图1是女性患者统计图
14.图2是女性患者碎石图
15.图3是女性患者主成分分析结果
16.图4是女性患者主成分旋转分析结果
17.图5是女性患者的线形回归方程系数结果
18.图6是女性患者各因素重要性分析结果
19.图7是女性患者各因素重要性分析结果图像
20.图8、图9女性患者多元回归分析结果
21.图10、图11女性患者剩余三项因素的重要性分析结果
22.图12、图13女性患者剩余三项因素多元回归分析结果
23.图14男性患者统计图
24.图15男性患者碎石图
25.图16男性患者主成分分析结果
26.图17是男性患者主成分旋转分析结果
27.图18女性患者的线形回归方程系数结果
28.图19、图20是男性患者各因素重要性分析结果
29.图21、图22是男性患者多元回归分析结果
30.图23、图24男性患者剩余四项因素的重要性分析结果
31.图25、图26男性患者剩余四项因素多元回归分析结果
具体实施方式
32.下面结合附图和具体实施例对本发明做进一步的说明。对本发明实施例中的技术
方案进行清楚、完整的描述,所描述的实施例仅仅是本发明创造一部分的实施例,而不是全部。基于本发明创造中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明创造保护的范围。
33.本发明选取120例肿瘤患者完整的生存资料,选择了9个可能与患者的总生存期有关的因素进行分析,包括性别、年龄、afp、肿瘤直径、有无肝硬化、有无hbv感染、有无淋巴结转移、有无门脉癌栓、child.pugh评分。用r语言软件进行统计分析,采用了方差分析、随机森林、主成分分析等方法。
34.将120名患者(女性患者22人,男性患者98人)的性别、年龄、afp、肿瘤直径、肝硬化、hbv感染、淋巴结转移、门脉癌栓、child.pugh评分9项因素分别设置为x1

x9, 总生存期设置为y。分成男、女两部分分别进行统计分析。
35.实施例1
36.女性患者肝癌预后标志性因素筛选
37.step1:统计全部22名女性患者有无肝硬化、hbv感染、淋巴结转移、门脉癌栓。统计结果如图1所示。
38.step2:基于主成分分析的总生存期差异原因提取,得到碎石图,如图2所示:说明了只需要保留两个主成分。
39.进行主成分分析,得到结果如图3所示,
40.图3中的第一部分:
41.pc1,pc2:各主成分在每个观测变量上的载荷,即观测变量与主成分的相关系数。
42.h2:主成分公因子方差,即主成分对每个变量的方差解释度。
43.u2:成分唯一性,即方差无法被主成分解释的比例。
44.第二部分:对于两个主成分进行说明
45.ss loading:两主成分的特征值
46.porportion var:方差比例,即各主成分对数据的解释程度
47.cumulative var:累计方差比例。
48.之后进行主成分旋转,得到分析结果如图4所示,
49.调用head函数得到主成分与原始变量之间的线形回归方程系数。结果如图5所示,
50.即
51.rc1=0.331967769x2 0.002301612x3 0.065787514x4 0.341201996x5 0.256129375 x6 0.307579902x7
52.rc2=

0.31021926x2 0.34902973x3 0.23255103x4

0.03138882x5 0.04034265x6

0. 09537888x7
53.rc1主要为x2年龄,x5是否有肝硬化,x6是否有hbv感染,x7是否有淋巴结转移对总生存期的影响,rc2主要为x3afp和x4肿瘤直径对总生存期的影响。
54.基于随机森林的总生存期差异原因提取,通过调用随机森林函数得到拟合优度为 30.75,对各个因素的重要性进行分析得到的结果及图像如图6、图7所示,
55.因此可以得到女性患者的各因素的重要性的先后顺序为: x4>x9>x8>x3>x7>x6>x5>x2,即,肿瘤直径>child.pugh评分>有无门脉癌栓>afp>是否有淋巴结转移>是否有hbv感染>是否有肝硬化>年龄。
56.step3:进行预测,用多元回归分析,得到的结果如图8、图9所示,
57.结果表明x2,x3,x5,x6,x8的p值远大于统计显著性所要求的0.05,无法通过t检验,需要在回归模型中剔除,剩余x4,x7,x9;
58.对x4,x7,x9调用随机森林函数,拟合优度为38.61,
59.得到的重要性结果如图10、图11所示:
60.通过图示结果可以得到剩余三项因素的重要性的先后顺序为:x4>x9>x7,及肿瘤直径>child.pugh评分>是否有淋巴结转移。
61.进行多元回归分析,得到的结果如图12、图13所示,
62.图中三个变量的p值均小于0.05,因此y与这三个因素均有相关关系。即女性肿瘤总生存期与肿瘤直径、有无淋巴结转移和child.pugh评分有关。
63.实施例2
64.男性患者肝癌预后标志性因素筛选
65.对男性患者进行分析,男性患者一共有98人。
66.step1:对所有男性患者有无肝硬化、有无hbv感染、有无淋巴结转移、是否门脉癌栓的人数进行统计对比,结果如图14所示。
67.step2:基于主成分分析的总生存期差异原因提取,得到碎石图,如图15所示.
68.图15说明只需要保留两个主成分,然后进行主成分分析,得到分析结果如图16所示。
69.图16中第一部分:
70.pc1,pc2:各主成分在每个观测变量上的载荷,即观测变量与主成分的相关系数。
71.h2:主成分公因子方差,即主成分对每个变量的方差解释度。
72.u2:成分唯一性,即方差无法被主成分解释的比例。
73.第二部分:对于两个主成分进行说明
74.ss loading:两主成分的特征值
75.porportion var:方差比例,即各主成分对数据的解释程度
76.cumulative var:累计方差比例。
77.进行主成分旋转,得到的分析结果如图17,
78.调用head函数得倒主成分与原始变量之间线性回归方程的系数,结果如图18所示,
79.即
80.rc1=

0.18515561x2 0.20818351x3 0.23548719x4 0.09684601x5 0.06244058 x6 0.21921164x7
81.rc2=0.760313825x2

0.006271847x3 0.066226063x4 0.313416066x5 0.354369959 x6

0.095319739x7
82.rc1主要为afp、肿瘤直径和有无淋巴结转移对总生存期的影响,rc2主要为年龄,是否有肝硬化,是否有hbv感染对总生存期的影响。
83.基于随机森林的总生存期差异原因提取,通过调用随机森林函数得到拟合优度为 67.81,对各个因素的重要性进行分析,得到的分析结果及图像如图19、图20所示,
84.通过图20可以得到各因素的重要性的先后顺序为:x4>x3>x9>x8>x7>x5>x6>x2,即
肿瘤直径>afp>child.pugh评分>有无门脉癌栓>是否有淋巴结转移>是否有肝硬化>是否有hbv感染>年龄。
85.step3:进行predict预测,利用多元回归分析得到的结果如图21、图22所示,
86.结果显示x2,x6,x7,x8的p值远大于统计显著性所要求的0.05,无法通过t检验,需要在回归模型中剔除,剩余x3,x4,x5,x9,即afp、肿瘤直径、是否有肝硬化、child.pugh 评分。
87.对x3,x4,x5,x9调用随机森林函数,拟合优度为66.23。
88.得到的重要性排序结果如图23以及图24所示,
89.从图中我们可以得知重要性的先后顺序为:x4>x9>x3>x5。
90.进行多元回归分析得到的结果如图25及图26所示
91.结果显示四个变量的p值均小于0.05,因此y与这四个因素有相关关系。即男性肿瘤总生存期与afp,肿瘤直径,有无肝硬化和child.pugh评分这四项因素有关。
92.上述内容仅为本发明创造的较佳实施例而已,不能以此限定本发明创造的实施范围,即凡是依本发明创造权利要求及发明创造说明内容所做出的简单的等效变化与修饰,皆仍属于本发明创造涵盖的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜