一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于脂质成分预测老年人急性死亡的预测系统及方法与流程

2022-07-22 22:02:58 来源:中国专利 TAG:


1.本发明涉及人工智能与医疗应用领域,具体涉及一种基于脂质成分预测老年人急性死亡的预测系统及方法。


背景技术:

2.老年人群是增长最快速的群体,其中以动脉粥样硬化为特征的心血管疾病,包括缺血性心脏病和缺血性中风,是死亡的主要原因。既往研究已经证实血脂异常是动脉粥样硬化的主要原因,对动脉粥样硬化的发生、发展及并发症有重要作用。低密度脂蛋白(ldl)已经被证实是致动脉粥样硬化的主要脂蛋白胆固醇,最近各国专家提出了非高密度脂蛋白(non-hdl,即总胆固醇减去高密度脂蛋白),并将其引入各国指南包括esc/eas,加拿大ccsc,中国成人血脂异常防治指南等,用于衡量人群动脉粥样硬化心脏病(ascvd)的风险以及作为降脂治疗的次要靶标。同时最近有研究显示与ldl相比,non-hdl能够更好的预测心血管事件及死亡结局的发生。中国成人血脂异常防治指南提出要对人群全面评估ascvd发病风险,并对non-hdl提出来不同发病风险的目标值。
3.既往的心血管事件或死亡风险预测模型,大多数为长期死亡风险,对于急性死亡风险的预测较为缺乏,如framingham风险评分、中国-par风险评分、汇总队列方程pce模型。其次是暂时无针对老年人这一特殊群体的预测模型,上述模型均在一般成年人中进行,无针对老年人这一特殊群体的预测模型。最后,既往的发明对于死亡风险的预测集中于伴随疾病的患者,无针对一般人群的死亡风险预测模型,且目前现有的死亡风险预测模型没有引入non-hdl,还没有用于预测急性死亡风险的模型。
4.针对现有技术预测模型存在的问题,寻找一种适用于老年人急性死亡风险预测的系统及方法十分必要。


技术实现要素:

5.本发明针对现有技术存在的问题,提供了一种基于脂质成分预测老年人急性死亡的预测系统及方法,该系统及方法解决了既往模型用于中长期死亡预测的问题,能够独立或联合其他危险因素预测老年人急性死亡风险。
6.本发明中相关技术术语的名词解释如下:
7.年龄,age
8.性别,sex
9.体重指数,body mass index,bmi
10.吸烟状况,smoking
11.饮酒状况,drinking
12.锻炼状况,exercise
13.收缩压,systolic blood pressure,sbp
14.舒张压,diastolic blood pressure,dbp
15.高密度脂蛋白,high-density lipoprotein cholesterol,hdl
16.低密度脂蛋白,low-density lipoprotein cholesterol,ldl
17.总胆固醇,total cholesterol,tc
18.甘油三脂,triglycerides,tg
19.非高密度脂蛋白,non-high-density lipoprotein cholesterol,non-hdl
20.空腹血糖,fasting blood glucose,fbg
21.血肌酐,serum creatinine,scr
22.高血压,hypertension,htn
23.糖尿病,diabetes mellitus,dm
24.心血管疾病,cardiovascular disease,cvd
25.为实现上述目的,本发明采用的技术方案如下:
26.本发明提供了一种预测老年人急性死亡的预测方法,包括以下步骤:
27.(1)随机将人群分为训练集和测试集,利用训练集建立模型,利用测试集对模型进行内部验证;
28.(2)根据lasso回归分析筛选与老年人急性死亡结局相关临床基线数据,利用r语言中cv.glment函数实现lasso回归;设置随机种子数并定义5折交叉验证模型,并绘制变异系数的变化图,根据cv大小选取lambda.1se时对应的模型,获取对应的自变量系数值,最终非0系数对应的特征即为最终筛选出的变量;
29.(3)利用逐步回归法判断步骤(2)中筛选出的变量是否为老年人急性死亡的独立危险因素,将系数p《0.05的变量纳入,最终筛选出相关变量,对相关变量建立cox回归模型;根据cox回归模型建立急性死亡风险发生概率列线图,计算总风险分值,得到死亡风险值;
30.(4)利用测试集的数据验证cox回归模型,当c-index大于0.5即认为该模型对预后的预测具有统计学意义。此处的c-index代表模型最终预测正确的概率,本发明中等同于受试者工作曲线下面积(auc),c-index越大越好。
31.进一步地,步骤(1)中所述训练集和测试集的人群特征包括:11个连续变量和7个分类变量。
32.进一步地,所述11个连续变量包括非高密度脂蛋白、年龄、体重指数、收缩压、舒张压、高密度脂蛋白、低密度脂蛋白、总胆固醇、甘油三酯、空腹血糖、血肌酐;所述7个分类变量包括性别、吸烟状况、饮酒状况、锻炼状况、高血压、糖尿病、心血管疾病。
33.进一步地,步骤(2)中所述筛选出的变量包括:年龄、性别、体重指数、锻炼状况、收缩压、非高密度脂蛋白、血肌酐、糖尿病和心血管疾病。
34.进一步地,步骤(2)中所述随机种子数为123。
35.进一步地,步骤(3)中所述相关变量包含9个变量,即年龄、性别、体重指数、锻炼状况、收缩压、非高密度脂蛋白、血肌酐、糖尿病和心血管疾病。
36.进一步地,所述9个变量的cox回归模型的多项式为:y=0.0997*xa 0.503*xb (-0.0700*xc) 0.410*xd (-0.0166*xe) 0.232*xf 0.00558*xg 0.333*xh 0.649*xi
37.其中,y代表急性死亡情况,xa代表年龄,xb代表性别,xc代表bmi,xd代表锻炼情况,xe代表收缩压,xf代表非高密度脂蛋白,xg代表血肌酐,xh代表糖尿病,xi代表心血管疾病。
38.进一步地,步骤(3)中所述建立急性死亡风险发生概率列线图具体过程为应用r语言rms软件包、survival软件包、foreign软件包、performance软件包、pec软件包、aod软件包和nomogramformula软件包(以上均为统计软件中的相关工具包),将所得到的cox回归模型转化为可视化的老年人群急性死亡风险发生概率列线图。
39.进一步地,步骤(3)中所述建立急性死亡风险发生概率列线图具体过程具体命令如下:
40.*建立cox回归模型*
41.coxm《-cph(surv(survivaltime,death)~age sex nonhdl bmi
42.dm scr sbp exercise cvd,data=train,x=t,y=t,surv=t)
43.dd《-datadist(data)
44.option《-options(datadist="dd")
45.*绘制列线图*
46.nom《-nomogram(coxm,fun=plogis,
47.fun.at=c(.001,.01,.05,seq(.1,.9,by=.1),.95,.99,.999),
48.funlabel="risk of death")
49.plot(nom)。
50.进一步地,步骤(3)中所述总风险分值为患者年龄、性别、体重指数、锻炼状况、收缩压、非高密度脂蛋白、血肌酐、是否伴随糖尿病、是否伴随心血管疾病在急性死亡风险发生概率列线图上对应分值的累加和。
51.进一步地,步骤(3)中所述死亡风险值为总风险分值在急性死亡风险发生概率列线图上对应的死亡风险值。
52.在一些具体的实施例中,以本发明图3所示的列线图为例,最上边一行point代表的是每一个变量对应的分值,如年龄70岁代表10分,性别男sex=1代表12分,non-hdl为3.5代表20分,以此类推,加起来的总分即为总风险分值。并对照total points,如总风险分值为120分,对应的risk of death为0.5,既死亡风险为50%。
53.本发明还提供了一种基于上述预测方法的系统,包括:数据获取模块、模型获取模块以及预测模块。
54.在一些具体的实施方式中,所述的预测方法包括以下步骤:
55.步骤s101,获取老年人体检的基线生命体征、实验室检查等临床数据;
56.步骤s102,根据所述临床数据建立老年人急性死亡发生概率的列线图并计算总风险分值;
57.步骤s103,根据所述总风险分值计算老年人急性死亡发生概率的预测值;
58.步骤s104,输出根据所述总风险分值计算老年人急性死亡发生概率的预测值。
59.本发明所取得的技术效果是:
60.1.本发明发现一种基于脂质成分的老年人急性死亡风险预测模型,解决了既往模型用于中长期死亡预测的问题。
61.2.本发明提出的脂质成分是一种新颖的,用于人群ascvd风险评估和降脂治疗靶点的成分,能够独立或联合其他危险因素预测老年人急性死亡风险。
附图说明
62.图1为老年急性死亡发生结局概率的预测方法实施例2的流程示意图;
63.图2为老年急性死亡结局发生概率的预测值的计算流程示意图;
64.图3为老年急性死亡风险发生概率列线图;
65.图4为老年急性死亡结局发生概率的cox回归模型。
具体实施方式
66.以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
67.在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。
68.当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本文中使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同意义。
69.实施例1
70.一种基于脂质成分的老年人急性死亡风险的预测模型。本研究使用方法为cox比例风险模型,其原理是将生存时间与协变量联系起来。cox比例风险模型将建立患者的生存率和几个解释变量之间的关系,评估这些因素对生存时间的效应。cox比例风险模型无需生存时间有任何特定的分布,其假设不同变量对生存的影响随时间变化是恒定的,并且在特定范围内是累加的。
71.cox比例风险模型的执行式如下:
72.h(t)=h0(t)
×
exp(b1x1 b2x2

b
p
x
p
)
73.式中:t表示生存时间;h(t)是由一组p个协变量(x1,x2,

,xp)确定的风险函数(hazard function);系数(b1,b2,

,bp)量化了协变量的影响(例如,效应的大小);h0称为基线风险(baseline hazard),如果所有xi=0(即exp(xi)=1),则它对应于风险值;h(t)中的“t”提醒我们,风险可能随时间而变化。
74.将上述公式进行对数转换后,可以变换为形似线性方程的结构:
[0075][0076]
因此,cox比例风险模型可以视为风险与变量xi的对数的多元线性回归,其中基线风险是一个随时间变化的“截距”项。研究的具体步骤如下:
[0077]
研究数据利用2010-2020年湖南省基本公共卫生系统中,65岁以上老年人的首次体检数据,共569,312例纳入研究。本研究共纳入18个研究变量,其中包括11个连续变量(非高密度脂蛋白、年龄、体重指数、收缩压、舒张压、高密度脂蛋白、低密度脂蛋白、总胆固醇、甘油三酯、空腹血糖、血肌酐)和7个分类变量(性别(男=1,女=0)、吸烟状况(当前吸烟=1,不吸烟=0)、饮酒状况(经常饮酒=2,偶尔饮酒=1,不饮酒=0)、锻炼状况(不锻炼=1,
锻炼=0)、高血压(有高血压=1,无高血压=0)、糖尿病(有糖尿病=1,无糖尿病=0)、心血管疾病(有心血管疾病=1,无心血管疾病=0)),结局指标定义为体检后一个月内死亡。生存时间即体检时间至发生死亡事件的时间。死亡信息通过身份信息关联中国疾病预防控制中心的死亡数据,获取死亡时间,死亡原因和死亡icd-10代码。
[0078]
第一,在步骤s101,随机将人群分为训练集(398,647人,70%)和测试集(170,665人,30%)。利用训练集建立模型,利用测试集对模型进行内部验证。训练集和测试集人群特征如表1。
[0079]
表1:研究人群基线资料
[0080][0081][0082]
第二,如图2显示。以一个月内死亡作为临床结局,利用表一所列变量,对训练集数据进行分析。应用根据lasso回归分析筛选与老年人急性死亡结局相关临床基线数据,利用r语言中cv.glment函数实现lasso回归,设置随机种子数123并定义5折交叉验证模型,并绘制变异系数(coefficient variable,cv)的变化图,根据cv大小选取lambda.1se时对应的模型,获取对应的自变量系数值,最终非0系数对应的特征即为最终筛选出的变量。筛选出的变量共9个,包括年龄、性别、体重指数、锻炼状况、收缩压、非高密度脂蛋白、血肌酐、糖尿病、心血管疾病。lasso回归系数如表2.
[0083]
表2:lasso回归系数
[0084]
变量相关系数是否与结局相关年龄(age)0.089669012是
性别(sex)0.270274284是当前吸烟(smoking)————饮酒状况(drinking)————体重指数(bmi)-0.024287192是锻炼(exercise)0.158113137是收缩压(sbp)-0.008123488是舒张压(dbp)————高密度脂蛋白(hdl)————低密度脂蛋白(ldl)————总胆固醇(tc)————甘油三脂(tg)————非高密度脂蛋白(non-hdl)-0.112456589是空腹血糖(fbg)————血肌酐(scr)0.003702922是高血压(htn)————糖尿病(dm)0.003281837是心血管疾病(cvd)0.426956148是
[0085]
第三,利用逐步回归法判断上述9个变量是否为老年人急性死亡的独立危险因素,将系数p《0.05的变量纳入,最终筛选出年龄、性别、体重指数、锻炼状况、收缩压、非高密度脂蛋白、血肌酐、糖尿病、心血管疾病9个变量均与老年人急性死亡风险增加有关。对上述9个变量建立cox回归模型,结果如表3。
[0086]
表3
[0087][0088]
包含上述9个变量的cox回归模型的多项式如下:
[0089]
y=0.0997*xa 0.503*xb (-0.0700*xc) 0.410*xd (-0.0166*xe) 0.232*xf 0.00558*xg 0.333*xh 0.649*xi
[0090]
y代表急性死亡情况,xa代表年龄,xb代表性别,xc代表bmi,xd代表锻炼情况,xe代表收缩压,xf代表非高密度脂蛋白,xg代表血肌酐,xh代表糖尿病,xi代表心血管疾病。
[0091]
根据老年人急性死亡风险cox回归模型建立相应的如图3所示的老年急性死亡风险发生概率列线图,具体过程为应用r语言rms包、survival包、foreign包、performance包、
pec包、aod包、nomogramformula包,将所得到的cox回归模型转化为可视化的老年人群急性死亡风险发生概率列线图。其中,具体命令如下:
[0092]
*建立cox回归模型*
[0093]
coxm《-cph(surv(survivaltime,death)~age sex nonhdl bmi
[0094]
dm scr sbp exercise cvd,data=train,x=t,y=t,surv=t)
[0095]
dd《-datadist(data)
[0096]
option《-options(datadist="dd")
[0097]
*绘制列线图*
[0098]
nom《-nomogram(coxm,fun=plogis,
[0099]
fun.at=c(.001,.01,.05,seq(.1,.9,by=.1),.95,.99,.999),
[0100]
funlabel="risk of death")
[0101]
plot(nom)
[0102]
经过以上步骤可以得到如图3所示的老年人急性死亡风险发生概率列线图,患者年龄、性别、体重指数、锻炼状况、收缩压、非高密度脂蛋白、血肌酐、是否伴随糖尿病、是否伴随心血管疾病分别对应不同的分值范围,以此来计算总风险分值,所述总风险分值为患者年龄、性别、体重指数、锻炼状况、收缩压、非高密度脂蛋白、血肌酐、是否伴随糖尿病、是否伴随心血管疾病在急性死亡风险发生概率列线图上对应分值的累加和。
[0103]
使用患者年龄、性别、体重指数、锻炼状况、收缩压、非高密度脂蛋白、血肌酐、是否伴随糖尿病、是否伴随心血管疾病9个因素构建的cox模型,如图4所示,最终auc为0.754(95%ci:0.719-0.789),一般认为auc大于0.5即认为该模型对预后的预测具有统计学意义。
[0104]
实施例2
[0105]
图1为老年急性死亡发生结局概率的预测方法的流程示意图。如图所示,该实施例的预测方法包括:
[0106]
步骤s101,获取老年人体检的基线生命体征、实验室检查等临床数据;
[0107]
步骤s102,根据所述临床数据建立老年人急性死亡发生概率的列线图并计算总风险分值;
[0108]
步骤s103,根据所述总风险分值计算老年人急性死亡发生概率的预测值;
[0109]
步骤s104,输出根据所述总风险分值计算老年人急性死亡发生概率的预测值。
[0110]
最后应当说明的是,以上内容仅用以说明本发明的技术方案,而非对本发明保护范围的限制,本领域的普通技术人员对本发明的技术方案进行的简单修改或者等同替换,均不脱离本发明技术方案的实质和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献