一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种肺炎患儿预后风险标志物的筛选与恶性分级方法、系统及其标志物和应用

2023-02-04 18:26:50 来源:中国专利 TAG:


1.本发明属于医疗人工智能技术领域,具体涉及一种肺炎患儿预后风险标志物的筛选与恶性分级方法、系统及其标志物和应用。


背景技术:

2.肺炎是一种肺部感染和炎症,可引起严重的发病率,导致全球每年约1.5亿人患病。此外,肺炎对儿童的影响更为严重,据世界卫生组织报道,在2019年期间,全球因肺炎死亡的5岁以下儿童约74万,占5岁以下儿童总死亡人数的14%。2019年的《中国妇幼健康事业发展报告》指出,导致5岁以下儿童死亡的前五位死因是早产、肺炎、出生窒息、先天性心脏病和意外窒息,占全部死因的55.7%。目前,肺炎仍然是儿童死亡的主要原因,因此肺炎患儿的预后风险标志物筛选与恶性分级方法具有极其重要的社会意义和价值。
3.营养不良、低出生体重、非母乳喂养、使用固体燃料、过度拥挤和锌的摄入被认为是儿童肺炎发病相关的危险因素,但目前仍缺乏肺炎患儿死亡的预测因素。放射学检查是一种肺炎患儿死亡风险评估手段,但由于这种手段操作复杂,评估结果受医师主观经验影响,价格较为昂贵且容易让儿童暴露在x射线下等问题,无法进行普及。而临床检验是包括血液检测、尿液检测及粪便检测等实验室检测项目的结果,是已经在人群中普及的方便快捷的检查手段。因此,通过人工智能方法,从临床检验指标中鉴定最优的肺炎患儿预后风险筛查标志物,进一步建立一种临床适用、可靠性高的肺炎患儿预后预测模型并对患者进行恶性分级,有助于辅助临床治疗,进一步提高肺炎重症患儿的生存率。


技术实现要素:

4.本发明的目的是提供一种肺炎患儿预后风险标志物筛选与恶性分级方法、系统及其标志物和应用,通过基于临床检验指标的预后风险标志物,辅助临床治疗,提高肺炎患儿的生存率。
5.因此,作为本发明其中一个方面,本发明提供一种肺炎患儿预后风险标志物的筛选与恶性分级方法,其包括,
6.s1,数据获取:获取临床肺炎确诊患儿的临床检验指标数据,包括治愈组和死亡组;
7.s2,数据预处理:将治愈组肺炎患儿临床检验指标数据作为阴性数据,将死亡组肺炎患儿临床检验指标数据作为阳性数据;
8.s3,指标筛选:根据cox比例风险回归分析筛选肺炎患儿死亡风险指标,作为肺炎患儿预后风险标志物;
9.s4,构建模型:根据阳性数据和阴性数据的分类标签,基于s3步骤中筛选的指标组合,采用分层随机抽样将阴性数据和阳性数据分为训练集和测试集,根据训练集构建肺炎患儿预后模型;
10.s5,模型效能评估:对模型的预测结果进行评估。
11.作为本发明所述肺炎患儿预后风险标志物的筛选与恶性分级方法的一个优选方案:步骤s1中,还包括,
12.s101,临床检验指标:包含血液检测、尿液检测及粪便检测结果。
13.作为本发明所述肺炎患儿预后风险标志物的筛选与恶性分级方法的一个优选方案:步骤s2中,还包括:
14.s201,缺失值处理:将检测人数低于所有样本80%的指标删除。
15.作为本发明所述肺炎患儿预后风险标志物的筛选与恶性分级方法的一个优选方案:步骤s3中,所述指标筛选的计算过程如下:
16.1)在整个数据集中,通过单因素cox比例风险回归分析,获得在阴性和阳性数据分类标签中具有显著差异的指标;
17.2)对单因素cox比例风险回归分析据有显著差异的指标进行多因素cox比例风险回归分析,获取独立因子,作为预后死亡风险的指标组合;
18.3)将预后死亡风险的指标组合作为最终的肺炎患儿预后风险标志物输出。
19.作为本发明所述肺炎患儿预后风险标志物的筛选与恶性分级方法的一个优选方案:步骤s3中,所述肺炎患儿预后风险标志物,由4个临床检验指标组成,所述4个临床检验指标为:氧饱和度、血红蛋白、尿素和尿酸。
20.作为本发明所述肺炎患儿预后风险标志物的筛选与恶性分级方法的一个优选方案:步骤s4中,还包括:
21.s401,数据集拆分:将步骤s3筛选后的指标数据采用分层随机抽样将阴性数据和阳性数据按照4:1分为训练集和测试集;
22.s402,构建极端梯度提升模型:根据训练集构建基于步骤s3中筛选指标的极端梯度提升(extreme gradient boosting,xgboost)模型;
23.s403,训练极端梯度提升模型:在训练集中通过十折交叉验证(10 fold cross-validation)调整参数达到最优组合。
24.s404,肺炎患儿预后模型确定:基于最优参数组合构建肺炎患儿预后模型,使用受试者工作特征曲线(roc)评估训练集中机器学习算法的性能,进而确定区分不同预后结局的风险打分最佳截断值,以及曲线下面积(auc)、敏感性(sensitivity)和特异性(specificity)。
25.作为本发明所述肺炎患儿预后风险标志物的筛选与恶性分级方法的一个优选方案:步骤s5还包括:
26.s501,按照训练集的风险打分最佳截断值对测试集中的肺炎患儿进行恶性分级;
27.s502,以s404同样的方法使用测试集评估肺炎患儿预后模型的性能。
28.作为本发明的另一个方面,本发明提供一种肺炎患儿预后风险标志物的筛选与恶性分级系统,其包括,
29.数据获取模块(m1),用以获取临床确诊肺炎患儿的临床检验指标数据;
30.数据预处理模块(m2),用以将已治愈肺炎患儿的临床检验指标数据作为阴性数据,将已死亡肺炎患儿的临床检验指标数据作为阳性数据;
31.指标筛选模块(m3),用以根据单因素cox比例风险回归分析筛选在阳性数据和阴
性数据中具有显著差异的指标,并根据多因素cox比例风险回归分析,筛选具有预后死亡风险的指标,作为肺炎患儿预后风险标志物;
32.模型构建模块(m4),基于筛选后的指标,采用分层随机抽样将阴性数据和阳性数据分为训练集和测试集,用训练集构建肺炎患儿预后预测模型;
33.模型效能评估模块(m5),基于肺炎患儿预后模型,按照风险打分最佳截断值对肺炎患儿进行恶性分级,并根据测试集对模型的预测结果进行评估。
34.作为本发明的另一个方面,本发明提供所述方法得到的肺炎患儿预后风险标志物,其中,所述标志物为氧饱和度、血红蛋白、尿素和尿酸。
35.作为本发明的另一个方面,本发明提供所述肺炎患儿预后风险标志物的筛选与恶性分级方法、系统的应用,其中:所述构建极端梯度增强模型,其参数设置为:学习率值(eta)为0.1,样本采样比例(subsample)为80%、子树的最大深度值(max.depth)为3,特征采样比例(colsample_bytree)为0.5,最大迭代次数(nround)为170,评估指标为logloss。
36.本发明的有益效果:本发明提供一种肺炎患儿预后风险标志物的筛选与恶性分级方法、系统及其标志物和应用,基于临床检验指标数据,并从中筛选出最优的肺炎患儿死亡特异性标志物,以此构建基于人工智能机器学习技术的肺炎预后预测模型,大大提高了肺炎患儿预后预测的特异性和灵敏度,并实现高效、精准的人工智能肺炎死亡风险预测以及恶性分级,能够解决目前肺炎患儿预后评估手段缺乏、价格昂贵、无法推广普及等问题。
附图说明
37.为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
38.图1是本发明实施例的肺炎患儿预后风险标志物筛选方法流程图。
39.图2是本发明实施例的肺炎患儿预后风险标志物筛选系统的系统框架图。
40.图3是本发明实施例的肺炎患儿在阴性、阳性分类标签中具有显著差异的24个临床检验指标的多因素cox比例风险回归森林图。
41.图4是本发明实施例的肺炎患儿预后预测模型的受试者工作特征曲线图。
42.图5是本发明实施例的肺炎患儿预后预测模型在外部肺炎患儿中的恶性分级后的生存曲线图。
43.图6是本发明4个肺炎患儿预后风险标志物的重要性排序。
具体实施方式
44.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合具体实施例对本发明的具体实施方式做详细的说明。
45.在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
46.图1是本发明一个实施例的肺炎患儿预后风险标志物筛选及恶性分级方法的方法
流程图。如图1所示,该评价方法包括以下步骤:
47.s1,数据获取:获取临床肺炎确诊患儿的临床检验指标数据。
48.在一个实施例中,本方法从浙江大学医学院附属儿童医院获取2010-2018年临床肺炎确诊631例患儿的所有临床检验指标数据。
49.s2,数据预处理:将治愈组肺炎患儿临床检验指标数据作为阴性数据,将死亡组肺炎患儿临床检验指标数据作为阳性数据。
50.在一个实施例中,在临床肺炎确诊患儿的临床检验指标数据中,治愈出院的536例患者数据为阴性数据,发生院内死亡的95例患者数据作为阳性数据。
51.优选的,在确定阳性数据和阴性数据后还需要进行数据预处理。包括以下步骤:
52.s201,缺失值处理:将检测人数低于所有样本80%的指标删除。
53.在一个实施例中,在临床肺炎确诊患儿的临床检验指标数据中,缺失值处理后,还剩余87个指标。
54.s3,指标筛选:根据cox比例风险回归分析筛选肺炎患儿死亡风险指标,作为肺炎患儿预后风险标志物。
55.具体的,指标筛选的计算过程为:
56.1)在整个数据集中,通过单因素cox比例风险回归分析,获得在阴性和阳性数据分类标签中具有显著差异的指标,即24个临床检验指标;
57.2)对单因素cox比例风险回归分析后据有显著差异的指标,再进行多因素cox比例风险回归分析,获取具有预后死亡风险的4个独立因子,作为预后死亡风险的指标组合;
58.3)将具有预后死亡风险的指标组合,作为最终的肺炎患儿预后风险标志物输出;
59.图3是本发明实施例的24个临床检验指标的森林图。如图3所示,经过单因素cox比例风险回归分析筛选后,共有24个指标在阴性组和阳性组中有显著预后风险,这些指标经过多因素cox比例风险回归分析筛选后,获取具有预后风险的4个独立因子,分别是:氧饱和度(oxygen saturation,%)、血红蛋白(hemoglobin,g/dl)、尿素(urea,mmol/l)、尿酸(uric acid,μmol/l)。
60.s4,构建模型:根据阳性数据和阴性数据的分类标签,基于s3筛选的指标组合,采用分层随机抽样将阴性数据和阳性数据分为训练集和测试集,根据训练集构建肺炎患儿预后模型。
61.在一个实施例中,为了保障模型的泛化能力,采用极端梯度提升(extreme gradient boosting,xgboost)模型进行分类预测。具体的,模型构建的步骤包括:
62.s401,数据集拆分:将步骤s3筛选后的指标数据采用分层随机抽样将阴性数据和阳性数据按照4:1分为训练集和测试集;
63.在一个实施例中,训练集共505例,含阴性数据429例,阳性数据76例;测试集共126例,含阴性数据107例,阳性数据19例。
64.s402,构建极端梯度提升模型:根据训练集构建基于步骤s3中筛选指标的xgboost模型;
65.s403,训练极端梯度提升模型:在训练集中通过十折交叉验证(10 fold cross-validation)不断调整参数达到最优组合。
66.在一个实施例中,极端梯度提升模型的具体参数如下:
[0067][0068]
s404,肺炎患儿预后模型确定:基于最优参数组合构建肺炎患儿预后模型,使用受试者工作特征曲线(roc)评估训练集中机器学习算法的性能,进而确定区分不同预后结局的风险打分最佳截断值,以及曲线下面积(auc)、敏感性(sensitivity)和特异性(specificity)。
[0069]
如图4所示,在一个实施例中,将4个具有独立预后死亡风险的指标作为样本数据训练肺炎患儿预后风险模型,在评估结果中各项参数如下:sensitivity=0.928、specificity=1.0、auc=0.992;最佳截断值为:cutoff=0.210。
[0070]
s5,模型效能评估:对模型的预测结果进行评估。
[0071]
如图4所示,在一个实施例中,测试集数据验证的评估结果如下:auc=0.855。
[0072]
如图5所示,测试集按照最佳截断值把患者分为高风险组和低风险组,高风险组的患儿100天内死亡率显著高于低风险组(p-value《0.001),风险比(hazard ratio,hr)达到1306。
[0073]
图2是本发明实施例的肺炎患儿预后风险标志物筛选与恶性分级系统的系统框架图。如图2所示,本发明的系统包括:
[0074]
数据获取模块(m1),用以获取临床确诊肺炎患儿的临床检验指标数据;
[0075]
数据预处理模块(m2),用以将已治愈肺炎患儿的临床检验指标数据作为阴性数据,将已死亡肺炎患儿的临床检验指标数据作为阳性数据;
[0076]
指标筛选模块(m3),用以根据单因素cox比例风险回归分析筛选在阳性数据和阴性数据中具有显著差异的指标,并根据多因素cox比例风险回归分析,筛选具有预后死亡风险的指标;
[0077]
模型构建模块(m4),基于筛选后的指标,采用分层随机抽样将阴性数据和阳性数据分为训练集和测试集,用训练集构建肺炎患儿预后预测模型;
[0078]
模型效能评估模块(m5),按照风险打分最佳截断值对肺炎患儿进行恶性分级,并根据测试集对模型的预测结果进行评估。
[0079]
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献