一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种脑出血患者神经功能预后预测模型的建立方法及系统

2022-11-30 14:53:43 来源:中国专利 TAG:


1.本发明涉及系统生物学技术领域,尤其是涉及一种脑出血患者神经功能预后预测模型的建立方法及系统。


背景技术:

2.脑出血(intracerebral hemorrhage,ich)是神经系统常见的急性重症之一,也是世界范围内致死和致残的重要原因。在存活患者中,约80%的会遗留神经功能残疾,肢体瘫痪是致残中最常见的后遗症,这给社会和家庭带来了沉重的负担。脑出血是高血压和动脉硬化等不良因素诱发的脑血管破裂出血事件的总称,患者在出血后血液会在脑内形成凝血块引发脑血肿,并伴随头痛、呕吐、昏迷及偏瘫等临床症状。目前,脑出血主要的治疗方式包括内科药物治疗和外科手术治疗,同时,ich的预后也具有重要意义。
3.目前,用于预测脑出血后功能恢复的工具,如ich评分量表。ich评分量表是由加利福尼亚大学的hamphill等人于2001年提出,用于脑出血的临床分级。ich评分量表的评分范围为0~6分,共包括5项指标,分别是入院时gcs 评分、血肿量、患者的年龄、血肿是否破入脑室和血肿是否来自幕下。这五项指标在ich评分表中的评分如表1所示,
4.表1 ich评分量表的评价指标和评分
[0005][0006]
然而,本技术人发现现有技术至少存在以下技术问题:
[0007]
(1)ich评分量表是一种静态指标,无法反映病情的动态变化,同时,值得注意的是,血肿量等指标可能随评估时间不同而变化,但目前无法明确适宜的评估时间。
[0008]
(2)该评分无法支持功能预后评估预测,而在当前,虽然病死率仍是评价 ich患者预后的主要指标,但预测ich患者的功能预后对于指导治疗改善存活的ich患者的生活质量可能更有意义。
[0009]
(3)除此之外,ich评分仅包括gcs评分、血肿量、年龄、血肿破入脑室和血肿源自幕下。血肿部位可能对评估预测也很重要,出血量相同的血肿在脑内不同部位对患者的影响差别可能会很大,已有研究证明血肿部位与ich的早期病死率和功能预后密切相关。同时,
有些指标,如年龄的分界可能并不适合所有国家的实际情况。
[0010]
因此,目前的ich评分量表的分级方法对临床治疗的指导作用还不够明确。


技术实现要素:

[0011]
本发明的目的在于提供一种脑出血患者神经功能预后预测模型的建立方法及系统。本发明提供的诸多技术方案中的优选技术方案所能产生的诸多技术效果详见下文阐述。
[0012]
为实现上述目的,本发明提供了以下技术方案:
[0013]
本发明提供了一种脑出血患者神经功能预后预测模型的建立方法,包括如下步骤:
[0014]
s1:数据收集及预处理:对脑出血患者数据进行多维度、多层次的数据预处理;
[0015]
s2:数据统计分析:对所有候选特征变量进行单因素分析,评估不同神经功能恢复状态结局的患者各个变量的统计学差异;
[0016]
s3:特征筛选:采用交叉验证递归特征消除法获得每个模型的最佳特征组合;
[0017]
s4:建立模型:根据所筛选出的最佳特征组合进行6种算法模型建模,并进行相应的模型调参,得出相应模型的最好参数结果,利用接受者操作特定曲线的曲线下面积来评价各模型的预测性能,以得到预测性能效果最佳的功能预测模型,其中,6种算法模型包括逻辑回归模型、逻辑回归cv模型、支持向量机模型、随机森林模型、极端梯度助推模型和类别助推模型。
[0018]
根据一种优选方式,在步骤s1中,所述的对脑出血患者数据进行多维度、多层次的数据预处理,包括:
[0019]
缺失值清洗、多角度的异常值检测与处理以及数据标准化;其中,所述缺失值清洗包括采用decision tree regression算法对连续特征的多重插补以及采用众数对离散特征的填补;所述多角度异常值检测与处理包括采用iqr准则和临床经验进行多角度异常值检测与处理;所述数据标准化包括利用z-score 标准化对数据进行标准化。
[0020]
根据一种优选方式,所述脑出血患者数据包括患者的人口学信息、生命体征、影像学检查结果、实验室检查结果、既往病史和治疗情况。
[0021]
根据一种优选方式,在步骤s2中,所述的对所有候选特征变量进行单因素分析,评估不同神经功能恢复状态结局的患者各个变量的统计学差异;包括:
[0022]
将全部41个候选特征变量分为离散型特征和连续型特征,分别对连续变量进行t检验或wilcoxon检验,对离散变量进行卡方检验或fisher精确检验,以评估不同神经功能恢复状态结局的患者各个变量的统计学差异,共15个特征变量具有统计学差异。
[0023]
根据一种优选方式,在步骤s3中,所述的采用交叉验证递归特征消除法获得每个模型的最佳特征组合;包括递归特征消除和交叉验证,
[0024]
所述递归特征消除包括对所有41个候选特征变量进行递归特征消除,所述递归特征消除方法为首先使用包含所有41个特征的变量集来训练,得到每个特征对结局预测的贡献度,之后剔除对模型贡献度低的变量;再使用新的变量集训练模型,不断递归,获得每个模型最佳的变量组合。
[0025]
根据一种优选方式,所述交叉验证为采用五重交叉验证,包括将所有样本分为五
个大小相等的子样本,使用其中4个子样本作为训练数据,剩下的1个子样本作为检验模型的验证集,重复5次,每一个子样本都只使用一次进行验证,然后将5个重复的结果平均以产生最终的最佳特征组合。
[0026]
根据一种优选方式,在步骤s4中,所述6种算法模型中的特征变量包括年龄、血肿位置、初始血肿体积、ivh、gcs、bt、hr、bg、肌酐、氯、egfr、wbc、中性粒细胞绝对计数、单核细胞绝对计数和d-二聚体。
[0027]
根据一种优选方式,所构建的6种不同算法的功能预测模型中逻辑回归模型的性能最优,逻辑回归cv模型的性能次之。
[0028]
本发明还提供了一种脑出血患者神经功能预后预测模型系统,所述预测模型系统是由所述的建立方法构建而成。
[0029]
基于上述技术方案,本发明的脑出血患者神经功能预后预测模型的建立方法及系统至少具有如下技术效果:
[0030]
本发明的脑出血患者神经功能预后预测模型的建立方法先通过对所有候选变量进行单变量分析,后采用交叉验证递归特征消除法获得每个模型的最佳特征组合,基于6种不同算法,即:逻辑回归(lr)、逻辑回归cv(lrcv)、支持向量机(svm)、随机森林(rf)、xgboost、catboost,构建功能预测模型,本发明通过大规模研究分析和实验对比,确定了15种与脑出血功能预测相关的特征因素,并构建6种机器学习模型,根据roc曲线(auc值)确定脑出血功能预测的最优模型,在实际应用中,可有效减少实际临床检验指标收集的复杂性,增加医护人员使用的便捷性,提高对患者结局预估的准确性。
附图说明
[0031]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]
图1是接受者操作特定曲线示出的各模型自发性脑出血后90天功能恢复预测性能;
具体实施方式
[0033]
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
[0034]
实施例1
[0035]
本发明共建立了6种功能预测模型,包括逻辑回归(lr)模型、逻辑回归 cv(lrcv)模型、支持向量机(svm)模型、随机森林(rf)模型、极端梯度助推(xgboost)模型和类别助推(catboost)模型。
[0036]
本发明的功能预测模型的数据收集自华西医院的电子病历,包括临床、影像学和首次评估时的实验室变量,如:患者的人口学信息、生命体征、影像学检查结果、实验室检查
结果、既往病史和治疗情况等。本发明中所用的数据,所有患者均随访3个月以上,主要结果为第3个月时的功能障碍,功能障碍的评定采用改良rankin量表进行评估([mrs]从0(无功能障碍)到6(死亡)),其中,mrs为0-2被定义为良好的功能预后,而mrs为3-6被定义为不利的功能预后。
[0037]
本发明提供了一种脑出血患者神经功能预后预测模型的建立方法,包括如下步骤:
[0038]
s1:数据收集及预处理。
[0039]
首先,系统性回顾了自2018年1月1日至2019年12月31日期间就诊于四川大学华西医院并被诊断为脑出血的患者,共计751名。从患者的电子病历中提取了多维度的数据,包括患者首次就诊时的临床、影像及实验室检查,共 41项变量。变量包括:年龄、性别、首次就诊的生命体征(体温、心率、血压)、在急诊停留时间、glasgow昏迷评分、ct示血肿位置、ct估算血肿体积、脑室内出血、既往史(高血压、糖尿病、冠心病、慢性肾病、肺部疾病、凝血功能障碍、使用抗凝治疗、及使用抗板治疗)、个人史(吸烟、饮酒)、脑卒中家族史、实验室检查(血糖、血肌酐、尿酸、甘油三酯、胆固醇、高密度脂蛋白、低密度脂蛋白、血钠、血氯、egfr、血小板、白细胞、中性粒细胞、淋巴细胞、单核细胞计数、红细胞压积、纤维蛋白原、d-二聚体)、及治疗方案(手术治疗或保守治疗)。
[0040]
之后,对所收集的脑出血患者数据进行多维度、多层次的数据预处理,包括缺失值清洗、多角度的异常值检测与处理以及数据标准化。其中缺失值清洗包括采用decision tree regression算法对连续特征的多重插补以及采用众数对离散特征的填补。多角度异常值检测与处理包括采用iqr准则和临床经验进行多角度异常值检测与处理。数据标准化包括利用z-score标准化对数据进行标准化。
[0041]
s2:数据分析。
[0042]
在模型构建过程中,首先对所有候选特征变量进行单变量分析。具体做法如下,先将全部特征(41个)分为离散型特征和连续型特征,对连续变量进行 t检验或wilcoxon检验,对离散变量进行卡方检验或fisher精确检验,以评估不同神经功能恢复状态结局的患者各个变量的统计学差异,共15个特征变量存在统计学差异。
[0043]
s3:特征筛选。
[0044]
采用交叉验证递归特征消除法(rfecv)获得每个模型的最佳特征组合。其中,rfecv包括两个部分:递归特征消除(rfe)和交叉验证。rfe可以逐渐减少模型所需的变量数,从而筛选特征。对每个模型,首先使用包含所有41 个特征的变量集来训练,从而得到每个特征对结局预测的贡献度;之后,将对模型贡献度最低的变量剔除;再使用新的变量集训练模型。不断递归这个过程,从而获得此模型最佳的变量组合。交叉验证采用五重交叉验证方法,具体做法为:将所有样本分成五个大小大致相等的子样本。使用4个子样本作为训练数据,保留剩下的1个子样本作为检验模型的验证集。这个过程重复了五次,每一个子样品都只使用一次进行验证。然后将这五个重复的结果平均,以获得最终的效果评估。
[0045]
s4:建模。
[0046]
根据筛选后的各模型的最佳特征组合进行6种算法模型建模,并进行参数调整,以得出相应模型的最好预测效果。利用接受者操作特定曲线(receiver operator characteristic curve,roc)的曲线下面积(auc)来评价各模型的预测性能,进而得到预测
性能效果最佳的功能预测模型。同时,采用配对t检验将ich评分(根据gcs、脑出血体积、ivh、血肿位置和年龄计算)的性能与本发明的6种功能预测模型的性能进行比较。结果如下:
[0047]
实验结果,如图1所示:
[0048]
对于单变量分析,共15个特征变量在功能预后良好的患者与功能预后不良的患者中显著不同,该15个特征变量包括年龄(年轻)、血肿位置(幕上)、初始血肿体积(小)、ivh(没有)、gcs(大)、bt(低)、hr(低)、bg(低)、肌酐(低)、氯(高)、egfr(高)、wbc(低)、中性粒细胞绝对计数(anc,低)、单核细胞绝对计数(amc,低)和d-二聚体(低),其中p值分别为0.004、 《0.001、《0.001、《0.001、《0.001、《0.001、《0.001、《0.001、《0.001、《0.001、 《0.001、《0.001、0.004、0.002、《0.001、《0.001、《0.001、《0.001、0.006、 《0.001。
[0049]
对于所构建的6种功能预测模型,具体结果如图1及表2所示(*p《0.05;**p《0.01;***p《0.001)。可见lr性能最优,其auc值是0.890,lrcv性能次之,其auc值是0.887,均显著优于ich评分;其次为catboost、xgboost、rf 和svm(auc分别为0.871、0.864、0.862、0.849)。同时,在lr和lrcv模型中,血肿的位置、凝血功能障碍、amc、gcs和脑室出血都对模型有重要影响, lr又称logistic回归分析,是一种广义的线性回归分析模型,从本质来说属于二分类问题,由于算法的简单和高效,在实际中应用非常广泛;lrcv属于判别式模型,具有实现简单,分类时计算量小、速度快等优点。
[0050]
表2自发性脑出血后90天功能恢复预测性能
[0051][0052]
由上述实验结果可知,lr模型效果最优,lr模型详细参数见表3。
[0053]
表3 lr模型最优参数结果
[0054][0055][0056]
表4模型变量解释
[0057]
变量英文名变量中文名coagulation disorders是否有凝血障碍location of the hematoma血肿的位置gcsgcs评分(格拉斯哥昏迷评分)ivh是否存在脑室内出血amc绝对的单核细胞计数bg血糖bt体温d-dimerd-二聚体age年龄anc绝对中性粒细胞计数chlorine氯wbc白血细胞hematoma volume血肿体积egfr估计肾小球滤过率creatine肌酸
[0058] 本发明通过大规模研究分析和实验对比,极大程度地缩小并确定了与脑出血神经功能预测相关的特征因子,并构建多各机器学习模型,根据roc曲线(auc 值)确定脑出血功能预测最优模型。本发明通过对患者脑出血后神经功能恢复情况进行预测,从而评估对患者神经功能预后的价值,为临床进行合理、有效的康复治疗提供指导。有研究证明,结合临床表现、实验室数据和影像学发现的预后预测模型对于保证最佳的治疗效果具有重要意义。本发明基于此,分析了被诊断为脑出血的患者的相关资料,并通过模型构建和统计分析,实现了脑出血后功能恢复的ai预测风险模型的构建,并获得了较优的预测效果,实践证明,该模型对ich的预后具有强指导意义。本发明的实验数据主要来源于医院的电子病历系统和临床诊断资料。在实际应用中,可有效减少实际临床检验指标收集的复杂性,增加医护人员使用的便捷性,提高对患者结局预估的准确性。
[0059]
实施例2
[0060]
本实施例还提供了一种脑出血患者神经功能预后预测模型系统,所述预测模型系统是由实施例1所述的建立方法构建而成,所述预后预测模型系统包括 lr模型。
[0061]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献