一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于随机森林的脓毒症肾衰竭早期预测系统

2023-08-30 21:08:16 来源:中国专利 TAG:

1.本发明专利属于人工智能领域与医学诊断技术领域。


背景技术:

2.脓毒症是由身体严重感染、非感染性创伤、严重组织缺血、坏死等引起的人体感染反应失调的一种全身炎症反应。重症感染发病过程遵循着感染、全身炎症反应(脓毒症)、严重脓毒症、脓毒性休克、多脏器功能障碍的疾病过程。脓毒症是人类死因的前十位之一,其死亡率高于心肌梗死。脓毒症不仅严重影响患者的免疫功能,而且可能会涉及到复杂的全身炎症网络效应,甚至导致患者凝血功能异常及全身重要脏器损伤、引起患者多器官功能衰竭,极易导致患者死亡。在西方发达国家,大约每年有一百五十万人患病,死亡率高达30%~50%。文献报告脓毒症的死亡率从28%~56%不等。在重症监护室(intensive care unit,icu)中,脓毒症患者的死亡率为28%~30%左右,30天死亡率为42.3%~35.5%,而住院患者死亡率高达47%。在我国,北京协和医院的一项前瞻性调查发现230名危重病患者中脓毒症的发病率为15.7%,病死率为30.6%;解放军烧伤中心报道严重烧伤病人中有36.4%并发了脓毒症;东南大学中大医院对1991-2001年icu内严重感染的流行病学特征进行了调查发现其总病死率为46%,11年间逐年病死率无显著性变化。而抗生素的不规范使用、合并症的存在、多器官损伤、中性粒细胞降低等各种因素也可增加其死亡风险。目前脓毒症的特异、有效治疗仍然是一大难点。
3.肾脏是脓毒症发生发展过程中极易受损害的脏器之一,急性肾衰竭(acute kidney injury,aki)是脓毒症常见并发症,aki的发生大多是由肾缺血再灌注损伤、炎症因子的破坏、肾组织细胞凋亡等因素引起,可导致机体肾功能短时间内急速下降,引起患者死亡。脓毒症相关aki病情发展迅速、发病机制复杂,其病死率超单纯脓毒症患者1倍以上,如何有效降低脓毒症相关aki患者的病死率是目前临床工作亟待解决的问题。多个临床研究表明脓毒症合并aki患者病死率高达70%,无脓毒症的aki患者的死亡率为4%,而无aki的脓毒症患者的死亡率为45%,脓毒症合并aki的死亡率远高于后两者。
4.由于脓毒症的高发病率及高死亡率,其带来的社会经济负担也非常大。在美国每年花费将近80亿美元用于治疗成人的aki。多数学者认为脓毒症可能有着其独特的发病机制有关,脓毒症与非脓毒症在临床特点、对治疗的反应、预后等方面的不同也支持此观点。但是目前脓毒症的发病机制仍不十分清楚,因此仍需要大量的研究。而在我国脓毒症aki发病情况的相关资料比较缺乏。很多研究在探究脓毒症发生的机理,并且认为脓毒症与各炎症因子的活化以及诱导细胞凋亡关系密切。大多数研究从分子生物学的角度来研究脓毒症发病原理,但直到现在都没有得到一个准确、权威的定义来说明脓毒症的发病究竟是哪些因素造成的。因此我们希望通过提前预测脓毒症肾衰竭发生的概率,作为临床上早期干预的参考,提醒医生早期介入,尽量避免脓毒症肾衰竭的发生,降低脓毒症患者的肾衰竭率和病死率。


技术实现要素:

5.本发明专利的目的在于提供一种基于随机森林的脓毒症肾衰竭早期预测系统,以解决上述背景技术中所提出的现有的早期预测方法存在的不足。本发明专利所用的数据采用患者入院的实验室检查数据,通过这些早期获得的临床检测数据进行预测,对早期诊断更加有意义。
6.为了实现上述目的,本发明专利提供如下技术方案:一种基于随机森林的脓毒症肾衰竭早期预测系统,包括数据采集及存储部分、所述数据预处理部分、所述机器学习模型预测部分、所述脓毒症肾衰竭预测结果显示部分,包括如下步骤:
7.步骤1,对脓毒症患者的生理指标进行数据预处理,将预处理后的生理指标输入预测模型,所述预测模型为随机森林算法;
8.步骤2,所述预测模型计算后输出所述脓毒症患者发生肾衰竭的概率。
9.优选的,数据选取部分,包括如下步骤:步骤1,患者筛选;步骤2,生理数据提取。
10.优选的,数据处理部分,包括数据清洗和数据标准化。
11.优选的,随机森林模型预测部分。同时进行了5折交叉验证。
12.优选的,脓毒症肾衰竭预测结果显示部分,显示脓毒症患者发生脓毒症肾衰竭的概率大小(输出一个0~1之间的值,越接近于0表明发生脓毒症肾衰竭的概率越小,越接近于1表明发生脓毒症肾衰竭的概率越大)。在上述技术方案中,本发明专利提供的一种基于随机森林的脓毒症肾衰竭早期预测系统,具有以下有益效果:
13.1、该发明专利,能快速获得对脓毒症肾衰竭的预测结果。
14.2、该发明专利,预测脓毒症肾衰竭的准确率较高,auc(auc,area under curve,roc曲线下的面积)能达到0.903,正确率(accuracy)能达到0.889,召回率能达到0.938。
15.3、该发明专利,能实现脓毒症肾衰竭的早期预测。
16.4、该发明专利,通过重要特征排序,发现对脓毒症肾衰竭预测最关键的6个生理指标,分别为血糖、肌酐、乳酸脱氢酶、总胆红素、血尿素氮、动脉二氧化碳分压。
附图说明
17.图1为本发明专利实施例提供的系统结构组成。
18.图2为本发明专利实施例提供的系统整体流程示意图。
19.图3为本发明专利实施例提供的患者筛选流程示意图。
具体实施方式
20.以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。需要特别说明的是,实施例中未具体说明的数据采集、传输、储存和处理等步骤的算法均可通过现有技术已公开的内容实现。
21.基于随机森林的脓毒症肾衰竭早期预测系统主要组成部分包括数据采集及存储部分、数据处理部分、机器学习模型预测部分及脓毒症肾衰竭预测结果显示部分共四个部分。通过输入发明内容中数据采集及存储部分提及的24个生理指标的数据,即可得到脓毒症肾衰竭发生的概率(取值范围介于0~1之间)。
22.一种基于随机森林的脓毒症肾衰竭早期预测系统,其特征在于,所述数据采集及存储部分、所述数据预处理部分、所述机器学习模型预测部分、所述脓毒症肾衰竭预测结果显示部分,包括如下步骤:
23.步骤1,对脓毒症患者的生理指标进行数据预处理,将预处理后的生理指标输入预测模型,所述预测模型为随机森林算法;
24.步骤2,所述预测模型计算后输出所述脓毒症患者发生肾衰竭的概率。
25.1.研究对象
26.将mimic iii数据库中icu患者的临床资料,根据下述纳入标准及排除标准,筛选出符合条件的脓毒症肾衰竭患者。
27.(1)纳入标准:

年龄≥18岁;

符合疾病和相关健康问题的国际统计分类(icd-9)的脓毒症、败血症及其子分类的诊断标准,得到疾病名称为脓毒症、严重脓毒症、沙门菌性败血病、炭疽性败血症、链球菌性败血病、肺炎球菌性败血病、厌氧菌性败血病、其他特定的败血症、非特异性败血症、疱疹性败血病、耐甲氧西林金黄色葡萄球菌败血症、由革兰氏阴性菌引起的败血症、由流感嗜血杆菌引起的败血症、由大肠杆菌引起的败血症、假单胞菌致败血病、沙雷菌致败血病、其他由革兰氏阴性菌引起的败血症、分娩期间的全身性感染(未指明护理情况或不适用)败血症、产褥期脓毒症(未指明护理发作或不适用)、产褥期脓毒症(分娩,并提到产后并发症)、产褥期败血症(产后情况或并发症)

仅发生肾衰竭而不发生心力衰竭、肝衰竭和呼吸衰竭(肺衰竭)。
28.(2)排除标准:

年龄<18岁;

没有记录肾脏衰竭标记(即是否发生肾脏衰竭)的脓毒症患者;

所需临床资料或实验室数据不完整或数据缺失过多的患者。
29.2.数据采集
30.(1)基本信息:年龄、性别。
31.(2)icu中脓毒症患者数据:

血常规:白细胞(wbc)、血小板(platelet);

肾功能:总胆红素(tb)、直接胆红素(db)、乳酸脱氢酶(ldh)、天冬氨酸转氨酶与丙氨酸转氨酶比值(ast/alt);

肾功能:血清肌酐(cr)、血尿素氮(bun);

凝血功能:纤维蛋白原(fib)、凝血酶原时间(pt);

血气分析:酸碱度(ph)、动脉二氧化碳分压(paco2)、动脉血氧分压(pao2)、吸入氧浓度(fio2);

血流动力学:动脉收缩压(abps)、无创血压收缩压(nibps);

血生化检查:肌酸激酶(ck)、葡萄糖(glucose)、乳酸(lactate);

其他:格拉斯哥昏迷评分(gcs)、心率(hr)、呼吸频率(rr)。
32.(3)模型输入数据为结果评估前一天,每一项生理指标的检测数据(若多次测量,则取其平均值)。
33.3.数据清洗和数据归一化
34.包括以下步骤:
35.(1)同一患者保留其第一次因脓毒症而入院或在icu中诊断为脓毒症的数据;
36.(2)删除患者姓名、检查日期、患者id等信息,仅保留生理指标数据;
37.(3)统一年龄数据格式为整数;
38.(4)对于性别的数字化处理,用“1”表示男性,“0”表示女性;
39.(5)将发生脓毒症肾衰竭的患者标签取为1,未发生脓毒症肾衰竭的患者标签取为0;
40.(6)对于空缺数据之处通过knn(k nearest neighbors,k-近邻)算法来填补;
41.(7)对于异常值的处理,首先使用上四分位数和下四分位数来进行判定(正常值的范围在[q2-1.5
×
q3]至[q1 1.s
×
q2]之间,其中q1为上四分位数,q2为下四分位数,q3为中位差q3=q1-q2),被判定为异常值之处用该指标对应的中位数来代替;
[0042]
(8)对数据进行归一化处理,即(原始数据-最小值)/(最大值-最小值)。
[0043]
4.模型构建
[0044]
根据随机森林原理进行构建模型其中的参数设置:树的棵树为1200棵,树的最大深度为5层,分隔的最小样本数为5(节点的样本数小于此数将不在进行分隔),分隔后叶子结点上最少的样本数为4,随机森林建树时随机选用的特征个数为auto(自动选取)。网格搜索的参数设置为:需要最优化的参数取值形式为字典(值为字典或者列表的形式),模型评价标准为accuracy(准确率),交叉验证参数为5(5折交叉验证),其余参数设置默认。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表