一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种肺功能检测缺失数据的修复方法与流程

2022-06-01 03:00:14 来源:中国专利 TAG:


1.本发明涉及肺功能参数技术领域,具体是一种肺功能检测缺失数据的修复方法。


背景技术:

2.肺功能测试主要用于检测呼吸道的通畅程度、肺容量的大小,可用于评估肺、气道病变,鉴别呼吸困难的原因,诊断病变部位。肺功能测试的主要测试数据包括一秒用力呼气容积(fev1)、三秒用力呼气容积(fev3)、六秒用力呼气容积(fev6)、用力肺活量(fvc)等数据,在实际测试中,由于个体差异或其它原因,会存在六秒用力呼气容积数据缺失的情况,数据的缺失会对肺功能的诊断分析造成一定影响。
3.申请号为201711385611.2的中国发明专利“一种基于呼气数学模型的肺功能测试系统”采用肺功能测试系统的数据处理模块对用力呼气曲线进行数据处理,系统的输出模块输出肺功能指标参数;所述肺功能指标参数主要包括用力肺活量、肺驱动压力、气道阻力、第一秒用力肺活量、一秒率。申请号为201910114502.x的中国发明专利“一种肺功能检测及数据统计的方法及系统”根据呼气气流对于超声波的影响计算并显示实时肺活量;计算并显示实时肺活量关于时间的函数图像;计算并显示用户肺功能指标;用户肺功能指标包括用户肺活量、用力呼气一秒量、呼气峰流速和肺活量容积曲线。上述两个发明专利虽然涉及了肺功能检测的相关数据的处理,但不涉及缺失数据的修复。在对居民进行肺功能评估时,若肺功能检测数据缺失,无法准确的对居民肺功能进行评估。因此,急需一种肺功能检测缺失数据的修复方法。


技术实现要素:

4.针对现有技术存在的上述不足,本发明提供一种肺功能检测缺失数据的修复方法,可对缺失的肺功能数据进行修复,可为肺功能的诊断与分析提供数据支撑。
5.本发明采用的技术方案为:
6.一种肺功能检测缺失数据的修复方法,包括以下步骤:
7.a、收集肺功能数据;
8.b、对步骤a收集的肺功能数据进行预处理;
9.c、根据步骤b预处理后的肺功能数据,计算各参数之间的相关性,得到相关性强的参量;
10.d、根据步骤c得到的相关性强的参量,建立基于神经网络的肺功能参数缺失数据修复模型;
11.e、根据步骤d建立的肺功能参数缺失数据修复模型,对肺功能缺失数据进行修复。
12.进一步的,步骤a收集肺功能的相关数据,包括人员编号、年龄(age)、性别(sex)、身高(height)、体重(weight)、人员对应的25%肺活量的呼气流速(fef25)、50%肺活量的呼气流速(fef50)、75%肺活量的呼气流速(fef75)、一秒用力呼气容积(fev1)、三秒用力呼气容积(fev3)、六秒用力呼气容积(fev6)、用力肺活量(fvc)。
13.进一步的,步骤b中对获取的数据进行预处理,具体为:假设共收集了n个人的肺功能数据,对于第i个人,计算其指标当zi≥0.7时,表明为非慢阻肺病人,则将该人员划入集合p,通过上述方法完成所有人员的集合划分,若集合p中有m个人员,
14.则集合p记为
[0015][0016]
其中fev
1,i
,fev
3,i
,fev
6,i
,agei,sexi,weighti,heighti,fef
25,i
,fef
50,i
,fef
75,i
分别表示第i个人的一秒用力呼气容积、三秒用力呼气容积、六秒用力呼气容积、年龄(age)、性别(sex)、身高(height)、体重(weight)、人员对应的25%肺活量的呼气流速(fef25)、50%肺活量的呼气流速(fef50)、75%肺活量的呼气流速(fef75)。
[0017]
进一步的,步骤c中根据步骤b预处理后的肺功能数据,计算各参数之间的相关性,得到相关性强的参量,具体为:通过logistics回归分析计算各参量之间的相关系数,当两个相关系数大于0.8时,认为两个参量强相关。
[0018]
进一步的,步骤d中根据步骤c得到的相关性强的参量,建立基于神经网络的肺功能参数缺失数据修复模型,具体为:
[0019]
从相关性强的参量组成的结合p中随机选取70%的元素作为训练集p1,剩下的30%作为验证集p2;
[0020]
对于其中需要修复的某一相关性强的参量,将训练集p1中除需要修复的某一相关性强的参量外的其他相关性强的参量的数据作为神经网络输入数据,需要修复的某一相关性强的参量的数据作为输出数据,设置神经网络的相关参数,包括隐层数yc,神经元个数sj,训练并生成神经网络;
[0021]
将验证集p2中的除需要修复的某一相关性强的参量外的其他相关性强的参量的数据输入训练好的神经网络模型,神经网络模型将输出预测的需要修复的某一相关性强的参量的数据,计算预测的需要修复的某一相关性强的参量的数据与实际值的误差的绝对值;
[0022]
计算验证集p2的误差绝对值的平均值,若误差绝对值的平均值达到某一阈值,则表明模型准确率可接受,否则重新训练新的神经网络模型,计算验证集的误差,直至得到满足预测误差的模型,该模型即为数据修复模型。
[0023]
进一步的,步骤e中根据步骤d建立的肺功能参数缺失数据修复模型,对肺功能缺失数据进行修复,具体为:若数据修复模型中某一项数据缺失,记为缺失项数据,则将数据修复模型中其余数据输入数据修复模型,即可得到修复的缺失项数据。
[0024]
本发明通过对收集的肺功能数据进行预处理,进而得到关性强的参量,然后建立基于神经网络的肺功能参数缺失数据修复模型,最后利用数据修复模型对肺功能缺失数据进行修复,试验证明本发明可对缺失的肺功能数据进行有效修复,且准确性高,可为肺功能的诊断与分析提供数据支撑。
附图说明
[0025]
图1是本发明一种肺功能检测缺失数据的修复方法其中一个实施例的流程示意图。
具体实施方式
[0026]
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述。
[0027]
请参阅图1,为本发明一种肺功能检测缺失数据的修复方法其中一个实施例的流程示意图,所述方法包括以下步骤:
[0028]
步骤a:收集肺功能的相关数据,包括人员编号、年龄(age)、性别(sex)、身高(height)、体重(weight)、人员对应的25%肺活量的呼气流速(fef25)、50%肺活量的呼气流速(fef50)、75%肺活量的呼气流速(fef75)、一秒用力呼气容积(fev1)、三秒用力呼气容积(fev3)、六秒用力呼气容积(fev6)、用力肺活量(fvc)。
[0029]
步骤b:对获取的数据进行预处理,具体为:假设共收集了n个人的肺功能数据,对于第i个人,计算其指标当zi≥0.7时,表明为非慢阻肺病人,则将该人员划入集合p,通过上述方法完成所有人员的集合划分,若集合p中有m个人员,
[0030]
则集合p可记为
[0031][0032]
其中fev
1,i
,fev
3,i
,fev
6,i
,agei,sexi,weighti,heighti,fef
25,i
,fef
50,i
,fef
75,i
分别表示第i个人的一秒用力呼气容积、三秒用力呼气容积、六秒用力呼气容积、年龄(age)、性别(sex)、身高(height)、体重(weight)、人员对应的25%肺活量的呼气流速(fef25)、50%肺活量的呼气流速(fef50)、75%肺活量的呼气流速(fef75)。
[0033]
步骤c:根据步骤b预处理后的肺功能数据,计算各参数之间的相关性,得到相关性强的参量。具体的,通过logistics回归分析计算各参量之间的相关系数,当两个相关系数大于0.8时,认为两个参量强相关。由于肺功能参数较多,为了确保数据修复的准确性,本发明实施例通过相关性大小筛选出相关性强的量,可将相关性强的量纳入神经网络模型,训练并得到数据修复模型。
[0034]
步骤d:根据步骤c得到的相关性强的参量,建立基于神经网络的肺功能参数缺失数据修复模型,具体为:
[0035]
若相关性强的参量为fev
1,i
,fev
3,i
,fev
6,i
,则集合p中随机选取70%的元素作为训练集p1,剩下的30%作为验证集p2,可记为:
[0036][0037][0038]
假如需要修复六秒用力呼气容积数据,则将训练集p1中的一秒用力呼气容积、三秒用力呼气容积等数据作为神经网络输入数据,六秒用力呼气容积数据作为输出数据。设置神经网络的相关参数,包括隐层数yc,神经元个数sj,训练并生成神经网络。
[0039]
将验证集p2中的每个人的一秒用力呼气容积、三秒用力呼气容积输入训练好的神经网络模型,神经网络模型将输出预测的六秒用力呼气容积,计算预测的六秒用力呼气容积与实际值的误差的绝对值,以第j个人为例,wcj=abs(fev
6,jy-fev
6,j
),其中fev
6,jy
为预测的第j个人的六秒用力呼气容积。
[0040]
计算验证集p2的误差绝对值的平均值wc,若wc≤0.05,则表明模型准确率可接受,否则重新训练新的神经网络模型,计算验证集的误差,直至得到满足预测误差的模型,该模型即为数据修复模型,如下所示:
[0041]
fev6=a1*tansig(a2*fev1 a3*fev3 a4) b1*tansig(b2*fev1 b3*fev3 b4) c1*tansig(c2*fev1 c3*fev3 c4) d1*tansig(d2*fev1 d3*fev3 d4) e1*tansig(e2*fev1 e3*fev3 e4) a
[0042]
其中a1,a2,a3,a4,b1,b2,b3,b4,c1,c2,c3,c4,d1,d2,d3,d4,a等均为常数。
[0043]
步骤e:建立的肺功能参数缺失数据修复模型,肺功能缺失数据进行修复,具体为:
[0044]
若六秒用力呼气容积(fev6)数据缺失,则将一秒用力呼气容积(fev1)、三秒用力呼气容积(fev3)输入数据修复模型,得到修复的六秒用力呼气容积(fev6)。
[0045]
下面以一个具体实施例对本发明的技术方案和效果进行详细说明:
[0046]
步骤a,收集了某地区1056名人员的肺功能数据,包括人员编号、年龄(age)、性别(sex)、身高(height)、体重(weight)、人员对应的25%肺活量的呼气流速(fef25)、50%肺活量的呼气流速(fef50)、75%肺活量的呼气流速(fef75)、一秒用力呼气容积(fev1)、三秒用力呼气容积(fev3)、六秒用力呼气容积(fev6)、用力肺活量(fvc)。
[0047]
步骤b中,对收集的肺功能数据进行预处理,计算每个人员的fev1/fvc的值,通过计算指标有566个人满足zi≥0.7,因此这些人员划入集合p。
[0048]
步骤c中,根据步骤b预处理后的数据,计算各参数之间的相关性,得到相关性强的
参量,见表1。
[0049]
表1
[0050][0051]
从表1中可以看到与fev6相关性强的有fev3和fev1,相关系数均大于0.9。
[0052]
步骤d中根据步骤c确定的相关性强的参量,随机选择集合p中的70%的元素作为训练集(即随机选择396个元素),剩下的170个元素作为验证集。隐含层个数设置为1,神经元个数设置为5个,训练并得到如下缺失数据修复模型:
[0053]
fev6=-0.510*tansig(0.370*fev1 0.132*fev3-1.889) 0.622*tansig(1.231*fev1 1.641*fev3-3.818)-0.079*tansig(2.773*fev1 1.109*fev3 0.081) 1.145*tansig(-0.572*fev1 1.319*fev3-0.093) 0.187*tansig(0.269*fev1 2.252*fev3 2.222) 0.055
[0054]
计算验证集的误差,通过计算得到验证集的误差为0.016,小于0.05,因此该模型满足精度要求,当六秒用力呼气容积缺失时,可用于对缺失的六秒用力呼气容积进行修复。
[0055]
步骤e中,根据缺失数据模型进行修正,如表2所示,用缺失数据修复模型计算的5名人员的fev6与真实值的平均误差为0.038,精度为可接受的范围,表明了本发明所提缺失数据修复模型的准确性。
[0056]
表2
[0057]
序号fev1fev3fev6(真实值)缺失数据修复模型计算值误差12.182.612.722.7424280.02242822.462.812.882.8945130.01451332.312.893.013.0996080.08960841.331.511.511.5354920.02549251.621.952.012.0513930.041393
[0058]
上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献