一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

胆囊癌患者放化疗后生存获益的预测模型建立方法与流程

2021-10-27 20:23:00 来源:中国专利 TAG:预测 化疗 获益 患者 诊断


1.本发明涉及一种诊断预测技术,特别涉及一种iii

iv期胆囊癌患者放化疗后生存获益的预测模型建立方法。


背景技术:

2.胆囊癌(gbc)是胃肠道肿瘤中发病率第五的肿瘤,年发病率为每10万人2至27人。尽管相对少见,gbc是胆道最具侵袭性的恶性肿瘤,5年生存率约为5%。手术切除是治疗gbc的唯一方法。但完全切除后的复发率高,往往导致不良预后。因此,术后化疗、化疗联合放疗等辅助治疗被应用于gbc患者,以改善患者预后。
3.但由于gbc发病率较低,gbc辅助治疗指征及术后化疗、化疗联合放疗疗效差异尚存争议。中国临床肿瘤学会胆道系统肿瘤诊断治疗专家共识建议iii

iv期gbc患者接受术后辅助治疗,胆道外科学组胆囊癌诊断和治疗共识建议ii期及以上gbc患者接受术后辅助治疗。此外,对术后化疗、化疗联合放疗的疗效差异缺乏深入研究,目前尚无较好方法预测gbc患者接受化疗或化疗联合放疗的预后。


技术实现要素:

4.针对胆囊癌患者后期治疗预测问题,提出了一种胆囊癌患者放化疗后生存获益的预测模型建立方法,可有效地应用于对iii

iv期胆囊癌患者辅助治疗的指导。
5.本发明的技术方案为:一种胆囊癌患者放化疗后生存获益的预测模型建立方法,具体包括如下步骤:
6.1)收集数据:收集临床、病理数据,包括性别、年龄、肿瘤分化程度、tnm分期、手术方式、清扫淋巴结个数、术后辅助治疗方式、总生存时间;
7.2)数据筛选:采用广义增强模型gbm计算倾向评分ps,采用逆概率加权法iptw,均衡各组中无辅助治疗、化疗、化疗联合放疗患者性别、年龄、肿瘤分化程度、手术方式、清扫淋巴结个数变量后,绘制kaplan

meier生存曲线,比较不同tnm分期接受不同辅助治疗后生存差异,发现iii

iv期胆囊癌患者可从辅助治疗中获益;
8.3)步骤1)中iii

iv期胆囊癌患者数据按确诊时间分为建模组和内部验证组,使用spss软件,首先通过单因素cox风险比例模型分析建模组性别、年龄、分化等级、t分期、n分期、手术方式、淋巴结清扫数量、辅助治疗方式变量对总生存时间os的预测能力,分析结果中有统计学意义p<0.05的变量被认为显著与os相关并纳入多因素分析;
9.4)将步骤3)分析获得的所有与os相关因素输入,进行多因素cox风险比例模型分析,将分析结果p值小于0.05的变量纳入最后的列线图模型;
10.5)将步骤4)分析获得的变量,使用r软件的survival和rms包绘制用于预测os的列线图;
11.6)在列线图模型建立后,使用内部验证组和外部验证组数据对模型进行验证。
12.进一步,所述步骤2)实现具体步骤如下:
13.2.1)gbm模型计算ps:总模型由若干子模型根据相应权值累加而成,子模型的假设空间没有特别的限制,可以为任意离散或连续的函数,gbm借助迭代算法可按类别输出概率值,即为各组ps;
14.2.2)使用倾向评分ps对样本进行iptw:倾向性评分加权法在计算得出倾向性评分的基础上,利用标准化法的原理,通过倾向性评分值赋予每个研究对象一个相应的权重进行加权,使得各组中倾向性评分分布一致,从而达到消除混杂因素影响的目的,样本权重w为2.1)中计算得到ps的倒数,w=1/ps;
15.2.3)使用绝对标准差异比较iptw前后各组变量差异,绝对标准差异小于10%时,可认为组间均衡性较好;
16.2.4)生存分析:通过kaplan

meier法对iptw加权前后的样本进行生存分析,采用log

rank检验比较生存曲线的差异,检验水准α=0.05。
17.进一步,所述模型的验证通过c

index指数以及一致性曲线分析完成。
18.本发明的有益效果在于:本发明胆囊癌患者放化疗后生存获益的预测模型建立方法,操作过程简便、直观、易于重复。由住院医师均可以完成。利用采集患者常规临床病理指标提取特征。结果客观准确,对特定的个体分别进行预测分析,提供可信的预测与分析结果。
附图说明
19.图1a为本发明ii期gbc患者ncrt\ct匹配、加权前后基线指标差异变化图;
20.图1b为本发明ii期gbc患者ncrt\crt匹配、加权前后基线指标差异变化图;
21.图1c为本发明ii期gbc患者ct\crt匹配、加权前后基线指标差异变化图;
22.图2a为本发明ii期gbc患者匹配前k

m生存曲线图;
23.图2b为本发明ii期gbc患者匹配后k

m生存曲线图;
24.图3a为本发明iii

iv期gbc患者ncrt\ct匹配、加权前后基线指标差异变化图;
25.图3b为本发明iii

iv期gbc患者ncrt\crt匹配、加权前后基线指标差异变化图;
26.图3c为本发明iii

iv期gbc患者ct\crt匹配、加权前后基线指标差异变化图;
27.图4a为本发明iii

iv期gbc患者匹配前k

m生存曲线图;
28.图4b为本发明iii

iv期gbc患者匹配后k

m生存曲线图;
29.图5为本发明iii

iv期gbc患者预后列线图;
30.图6a为本发明建模组数据获得的12、24、36个月预测生存率一致性曲线图;
31.图6b为本发明内部验证组数据获得的12、24、36个月预测生存率一致性曲线图;
32.图6c为本发明外部验证组数据获得的12、24、36个月预测生存率一致性曲线图。
具体实施方式
33.下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
34.一种胆囊癌患者放化疗后生存获益的预测模型建立方法,具体步骤如下:
35.1、收集数据:收集2004

2015年seer数据库中接受手术的2689例gbc患者及2016

2018年在复旦大学附属中山医院接受手术的88例gbc患者。收集临床、病理资料如下:性别,年龄,肿瘤分化程度,tnm分期,手术方式,清扫淋巴结个数,术后辅助治疗方式,总生存时间(os)。
36.2、将seer数据库2689例gbc患者按tnm分期,分为ii期和iii

iv期组。采用广义增强模型(generalized boosted models,gbm)计算倾向评分(propensity score,ps),采用逆概率加权法(inverse probability of treatment weighting,iptw),均衡各组中无辅助治疗、化疗、化疗联合放疗患者性别、年龄、肿瘤分化程度、手术方式、清扫淋巴结个数等变量后,绘制kaplan

meier生存曲线,比较ii期和iii

iv期接受不同辅助治疗后生存差异,发现iii

iv期gbc患者可从辅助治疗中获益。从而对数据有效性进行筛选。
37.2.1 gbm模型计算样本ps
38.经典的ps估计大多是采用参数线性logistic回归模型或变量选择技术筛选出交互项或非线性项而得出的,这样很可能会遗漏重要的混杂变量或错误指定模型中协变量与处理选择之间的函数关系。本发明基于gbm模型,gbm模型是一种结合多种回归树,获得在干预分配和预处理协变量间的复杂非线性关系的迭代过程,且不会过度拟合数据的模型。其总模型由若干子模型根据相应权值累加而成,子模型的假设空间没有特别的限制,可以为任意离散或连续的函数。gbm借助迭代算法可按类别输出概率值,即为各组ps。
39.对ii期gbc患者,纳入其年龄,性别,分化等级,手术方式,淋巴结清扫个数等变量,计算其ps。对iii

iv期gbc患者纳入其年龄,性别,分化等级,t分期,n分期,手术方式,淋巴结清扫个数等变量计算ps。通过r软件(v 4.0.2)的twang包实现。
40.2.2使用倾向评分对样本进行iptw
41.假定不存在未识别的混杂因素,加权调整是基于两种在一定条件下反事实事件的概率对数据进行调整:即假设每个观察对象均接受处理因素和均不接受处理两种情况。利用倾向性评分估计的权重对各观察单位加权产生一个虚拟的标准人群(所谓的产生虚拟人群是指权重是多少,就复制权重个人数),在该虚拟人群中,两组混杂因素趋于一致,均近似于某一预先选定的标准人口分布。倾向性评分加权法在计算得出倾向性评分的基础上,利用标准化法的原理,通过倾向性评分值赋予每个研究对象一个相应的权重进行加权,使得各组中倾向性评分分布一致,从而达到消除混杂因素影响的目的。因此倾向性评分加权法是一种基于个体的标准化法。iptw是以所有观察对象为“标准人群”进行调整的一种加权方法。样本权重w为2.1中计算得到ps的倒数,w=1/ps;
42.2.3使用绝对标准差异(absolute standardized difference)比较iptw前(p
treat
)后(p
control
)各组变量差异d。
43.绝对标准差异
44.一般认为绝对标准差异小于10%时,可认为组间均衡性较好。由图1a,1b,1c中可见iptw加权后接受不同辅助治疗的ii期gbc患者变量趋于平衡。由图3a,3b,3c中可见iptw加权后接受不同辅助治疗的iii

iv期gbc患者变量趋于平衡。
45.2.4生存分析
46.通过kaplan

meier法对iptw加权前后的样本进行生存分析,采用log

rank检验比
较生存曲线的差异,检验水准α=0.05。图2a、2b分别为iptw加权前、后ii期gbc患者接受不同辅助治疗方式生存情况,可见ncrt,ct,crt组患者预后无显著差异。图4a、4b分别为iptw加权前,后iii

iv期gbc患者接受不同辅助治疗方式生存情况,可见iii

iv期gbc患者接受crt治疗预后优越ct治疗,接受ct治疗其预后优于ncrt。因此iii

iv期gbc患者可从ct,crt辅助治疗中获益。
47.3、将seer数据库1496例iii

iv期接受手术的gbc患者按确诊时间分为建模组(2004

2012年确诊)和内部验证组(2013

2015年确诊),2016

2018年在复旦大学附属中山医院接受手术的88例gbc患者作为外部验证组。
48.4、使用spss软件(v 19.0统计软件),首先通过单因素cox风险比例模型分析建模组性别,年龄,分化等级,t分期,n分期,手术方式,淋巴结清扫数量,辅助治疗方式等变量对os的预测能力,分析结果中有统计学意义(p<0.05)的变量被认为显著与os相关并纳入多因素分析。其中性别,年龄,分化等级,t分期,n分期淋巴结清扫数量,辅助治疗方式等变量在单因素cox风险比例模型中与患者os显著相关。
49.5、将步骤4分析获得的所有与os相关因素输入,进行多因素cox风险比例模型分析,将分析结果p值小于0.05的变量纳入最后的列线图模型。年龄,分化等级,t分期,n分期,淋巴结清扫数量,辅助治疗方式在多因素cox风险比例模型中与os显著相关。
50.6、将步骤5分析获得的变量,使用r软件(v 4.0.2)的survival和rms包绘制用于预测os的列线图。图5列线图中,第一行为分值标尺,分值范围为0

10。第二行为年龄,第三行为分化等级,第四行t分期,第五行为n分期,第六行为淋巴结清扫数量,第七行为辅助治疗方式。第八行为总得分,分值范围0

35分。第九行为1年生存率,第十行为2年生存率,第十一行为3年生存率,第十二为中位生存时间。
51.7、在列线图模型建立后,使用内部验证组和外部验证组数据对模型进行验证。模型的验证通过c

index指数以及一致性曲线分析完成。建模组、内部验证组、外部验证组c

index指数分别为0.673(95%ci:0.654

0.692),0.707(95%ci:0.677
‑0·
739),and 0.729(95%ci:0.688
‑0·
775)。对应的一致性曲线见图6a~6c。
52.对于任意接受手术切除的gbc患者,通过列线图(图5)第2列至第7列中各临床病理变量的实际情况进行打分,各变量具体的分值刻度即为与第1列对应位置的分值。6个变量的分值求和后可确定该患者的总分,并在第8列找到对应的分值位置,继而可根据总分在第10

12列的对应位置得出该患者在第12、24、36个月内存活的预测概率,及其中位os时间。
53.回顾性研究中不同组件存在难以控制的混杂因素,因此常使用倾向性评分匹配控制偏倚。但传统倾向性评分匹配仅可在两组之间进行匹配,而gbm模型及iptw法可对多组进行加权。因此本发明首先采用gbm模型及iptw法比较不同分期gbc患者接受不同辅助治疗的预后差异。
54.列线图作为一种内容丰富、直观易懂且能准确评估结局事件发生概率的机器学习模型,现已广泛应用于预测恶性肿瘤的预后。但gbc患者迄今为止仍没有一套全面且能够准确评估接受不同辅助治疗的预后的列线图模型。
55.以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护
范围。因此,本发明专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜