一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于慢特征分析和深度神经网络的AMS易感性评估系统

2022-05-11 12:39:01 来源:中国专利 TAG:

一种基于慢特征分析和深度神经网络的ams易感性评估系统
技术领域
1.本发明涉及急性高原病易感性评估与预防领域,具体涉及一种基于性能监控与深度神经网络的数据驱动ams易感性评估系统。


背景技术:

2.急性高原病(acute mountain sickness,ams),俗称高原反应,是一种由高原地区低气压、低氧环境引起的综合症。无法适应高海拔环境的人突然到达高原时,会出现头通、恶心、厌食、失眠和疲惫等不适症状,严重者会影响正常的工作和生活。ams的个体易感性评估有助于提前制定预防策略,但是ams很难进行客观诊断。从生理学角度来看,ams常见诊断方法是路易斯湖评分(lake louisescore,lls)指标评估。这是一种依赖于个体通过评测问卷形式对症状严重程度自我评价的指标,具有高度主观性。此外,lls方法诊断ams的特异性低,潜在原因是静态lls无法反映个体面临缺氧环境的应激全过程信息。从医学角度来看,通过标志物或者检测试剂盒来对ams的易感性进行评估诊断(专利号:201811637725.6,201811038384.0),需要对受试者血液或者dna进行采样,进而做出诊断,该方法在医学上可行,但是对于在高原地区生活工作的多数人不具备这样的条件。随着可穿戴设备技术的发展,最近一篇综述文章(s.r.muza,wearable physiological sensors and real-time algorithms for detection of acute mountain sickness,journal of applied physiology 124(3)(2018)557

563.)指出可穿戴设备连续测量的生理变量可以促进ams易感性评估与诊断。因此,基于监测变量的数据驱动动态过程性能评估是一种极具潜力的预测ams易感性的方法。
3.在工业过程控制的文献中,过程性能评估方法已被证明是评估运行中非线性系统的有效解决方案。由于存在动态监测数据,由动态而非静态指标的数据驱动性能评估方法已被广泛研究。ma等人(y.ma,s.zhao,b.huang,feature extraction of constrained dynamic latent variables,ieee transactions on industrial informatics 15(10)(2019)5637

5645.)开发了一种新颖的状态转换模型,以从具有影响概率描述的观察数据中学习受约束的动态特征。yin等人(j.yin,x.yan,mutual information-dynamic stacked sparse autoencoders for fault detection,industrial and engineering chemistry research 58(47)(2019)21614

21624.)提出了一种基于互信息和堆叠稀疏自编码器的非线性动态故障检测模型。该模型不仅可以自动提取观测数据的显著特征,还可以学习动态过程数据中包含的潜在信息。特别地,慢特征分析(slow feature analysis,sfa)是一种反映动态过程数据本质特征的突出方法。尚超等人(ang,b.huang,f.yang,d.huang,slow feature analysis for monitoring and diagnosis of control performance,journal of process control 39(2016)21

34.)提出了基于sfa的监控方法,通过提取慢特征,深入挖掘数据的本质特征,实现对全过程控制性能的综合评估。赵春晖等人(c.zhao,b.huang,a full-condition monitoring method for nonstationary dynamic chemical processes with cointegration and slow feature analysis,aiche journal 64(5)(2018)1662

1681.)基于sfa同步分析数据的慢、快特性,提出全状态监测方法。scott等人(d.scott,c.shang,b.huang,d.huang,a holistic probabilistic framework for monitoring nonstationary dynamic industrial processes,ieee transactions on control systems technology(2020)1

8.)提出了一种新的非平稳概率sfa算法来全面描述常规操作过程中过程测量的非平稳和稳定变化。此外,动态性能监测方法实现ams风险评估的可行性也得到初步验证。陈婧等人(专利号:202010264555.2)基于来自可穿戴设备的连续测量数据,提出了动态外周血氧饱和度指数(dynamic spo2 index,dsi)来评估ams,表明低氧环境中生理信号的动力学信息有助于反映个体的ams易感性。然而,如何设计系统从动态监测的生理数据中快速提取关键信息,客观判断ams的易感性,仍是一个悬而未决的问题。


技术实现要素:

4.本发明的目的在于提供一种基于性能监控与深度神经网络的数据驱动ams易感性评估系统,可以快速、客观地评估ams易感性,且不受时间和地点的限制。
5.一种急性高原病ams易感性评估系统,包括数据采集与预处理模块、低氧耐受适应域构建模块以及个体急性高原病易感性评估模块;
6.所述数据采集与预处理模块用于采集第一阶段和第二阶段的监测数据,并进行预处理;
7.其中,第一阶段的监测数据获得的过程为:多个受试者进行高氧和低氧环境的周期性切换的呼吸训练,训练持续多天后,采集受试者在最后一天的多个生理指标数据,其中生理指标包括spo2数据;
8.第二阶段的监测数据获得的过程为:受试者在完成第一阶段的呼吸训练后,进行高原低氧环境睡眠测试,并获得睡眠质量数据x
1:n
,n表示睡眠质量数据的观测样本数量,每个样本中包括多个观测变量;
9.所述低氧耐受适应域构建模块用于:
10.对睡眠质量数据x
1:n
中受试者的每个观测样本进行路易斯湖评分测试,得到急性高原病ams易感性的评分结果;
11.基于k-means聚类方法对睡眠质量数据x
1:n
进行急性高原病ams易感性分类,得到急性高原病ams易感性的分类结果;
12.求取路易斯湖评分测试的评分结果与k-means聚类方法的分类结果的互信息值,选取互信息值最大的一组聚类结果作为受试者最终的低氧耐受适应域,作为受试者急性高原病ams易感性的标签;
13.所述个体急性高原病易感性评估模块用于构建及训练长短时记忆网络,并对待评估个体的低氧耐受能力进行评估,具体为:
14.用于训练所述长短时记忆网络的训练数据的构建过程为:提取第一阶段监测数据中的各受试者spo2数据的慢特征数据,将其与各受试者最后一天的多个生理指标的数据进行拼接,得到训练数据;训练数据的标签为低氧耐受适应域构建模块得到的急性高原病ams易感性的标签;
15.所述评估过程为:先按照所述第一阶段的监测数据获得过程,采集待评估个体最后一天的生理指标数据,输入到训练好的长短时记忆网络,输出该待评估个体的急性高原
病ams易感性标签。
16.较佳的,所述生理指标数据还包括心率、呼吸频率。
17.较佳的,所述数据采集与预处理模块在第一阶段的监测数据时,高氧和低氧周期性切换方式为:每天持续1小时,作为一个iht片段;在每个iht片段,每个周期通入高氧3分钟,低氧5分钟,周期交替循环直至满1小时。
18.较佳的,在获得第一阶段的监测数据时,对于低氧段数据,如果后200秒的数据平均值低于设定阈值90%或者数据长度小于250秒则被认为是受污染的数据,剔除该数据。
19.较佳的,所述数据采集与预处理模块选择最后一天的生理指标数据中的最后一个iht片段的数据,并将该数据进行重构处理,具体为:采用设定长度的滑窗,对最后一天的每个生理指标的数据进行拆分重构,并将重构后数据与对应的spo2的慢特征数据进行拼接,作为训练数据。
20.较佳的,所述低氧耐受适应域构建模块还采用pca方法对睡眠质量数据x
1:n
进行降维处理,则k-means聚类方法采用降维后睡眠质量数据进行分类。
21.较佳的,所述低氧耐受适应域构建模块基于k-means聚类方法对睡眠质量数据x
1:n
进行ams易感性分类的过程为:
22.首先从睡眠质量数据中随机选择k个临时样本作为适应域的初始簇聚类质心,每个聚类质心代表一个适应域类别;计算睡眠质量数据中除聚类质心外其它数据样本分别到各个聚类质心的距离;对于各数据样本,将其所属适应域类别确定为与其距离最近的聚类质心所属的类别;
23.对于每一个适应域类别,根据类别中所有数据样本选取该类别新的聚类质心点;然后再计算除聚类质心外其它数据样本分别到各个聚类质心的距离,将数据样本所属适应域类别确定为与其距离最近的聚类质心所属的类别;以此类推,经过多次迭代后,确定出各数据样本所属适应域类别,即为ams易感性的分类结果。
24.较佳的,在进行k-means聚类方法迭代时,循环迭代次数达到最大设置次数或错误达到预期最小误差的条件时,停止迭代。
25.较佳的,睡眠质量数据包括10个观测变量,具体为:睡眠时间、深睡时间、深睡时间比例、觉醒时间、觉醒次数、平均心率、平均血氧、晨醒血氧、体动时间指数和体动次数指数。
26.较佳的,所述长短时记忆网络的批大小设置为64,单元数为100;优化器选择adam。
27.本发明具有如下有益效果:
28.本发明将性能监控技术结合深度神经网络应用于低氧耐受能力动态性能评估中,学习spo2慢特征和iht过程采集的数据中关键信息,并对人体低氧耐受能力进行分类。
29.本发明系统最突出的特征是引入性能监控与深度神经网络的思想对动态生理数据进行个体ams易感性评估。同时,评估过程融合了由睡眠质量数据和lls构成的低氧耐受适应域,以达到多角度全面评估效果。
30.本发明首次结合睡眠质量数据和lls指标构建低氧耐受适应域,以消除lls存在的主观性问题。
31.本发明利用慢特征分析和长短时记忆网络构建分类器,充分挖掘生理数据的本质特征,实现快速且高准确率地对个体耐低氧能力进行分类。
32.该系统的数据获取仅需要个体进入模拟高原环境,而无须个体真实进入高原环
境,可随时停止,避免低氧耐受能力弱的个体受到不必要的伤害。
33.在非高原环境中评估个体的耐低氧能力可以增强实际评估的便利性和灵活性,可以为个体进入高原潜在的风险做出预判并相应地做出预防措施。
附图说明
34.图1是本发明系统的总体架构图;
35.图2是本发明实施例中基于滑动窗口的重建数据示意图;
36.图3是本发明实施例中主成分方差与方差比率图;
37.图4是本发明实施例中gap统计值图;
38.图5是本发明实施例中spo2的慢特征图;
具体实施方式
39.下面结合附图与具体实施方式对本发明系统作进一步详细描述,本实施例在以本发明技术方案为前提下进行实施,但本发明的保护范围不限于以下的实施方式。
40.如图1所示,本发明的ams易感性评估系统包括数据采集与预处理模块、低氧耐受适应域构建模块以及个体急性高原病易感性评估模块。
41.第一、数据采集与预处理模块。
42.本实施例对18名受试者进行两阶段的数据采集,第一阶段是间歇式低氧训练,第二阶段是模拟低氧环境的睡眠质量数据监测。
43.在第一阶段,受试者带上氧气面罩,进行为期10天的周期性高低氧吸入训练,每天持续1小时,此为一个iht片段。在每次的iht过程中,每个周期通入高氧(35%-38%o2)持续3分钟,低氧(11%-14%o2)持续5分钟,周期交替循环直至满1小时,每个iht片段大约有7个有效周期,在训练过程中,持续监测人体动态生理指标数据,包括心率、呼吸频率和spo2,采样周期为1秒。
44.设为iht中第m个片段的序列数据,分别表示spo2、心率、呼吸频率和氧气浓度。表示第i个指标在第k个时间点的原始数据。在本发明中采集的生理数据(主要是spo2和心率),会存在一些离群值点k
α
,使得本发明采用线性插值技术来替代离群值点数据。本发明更加关注于低氧段数据,在低氧情况下,spo2值会先下降,再慢慢地趋于平稳。但由于训练过程中,一些受试者为了缓解低氧带来的不适,会在低氧段摘下面罩,吸入空气中常规浓度氧气,致使spo2在低氧段有短暂下降以后回升的现象。通常,一个低氧段数据为300秒,本发明约定如果后200秒的数据平均值低于阈值90%或者数据长度小于250秒则被认为是受污染的数据,进而被剔除。
45.在第二阶段,18名受试者在进行阶段1的训练之后,暴露在模拟的高原低氧环境(即低氧舱)中进行一整夜的睡眠,监测设备在不干扰受试者睡眠的情况对其睡眠质量数据进行监测,睡眠质量数据包括10个观测变量,具体为:睡眠时间、深睡时间和比例、觉醒时间和次数、平均心率、平均血氧、晨醒血氧、体动时间指数和次数指数。
46.阶段2的睡眠质量数据定义为:
[0047][0048]
其中,x
11

x
1p
表示第一个观测样本的p个观测变量;共有n个观测样本。
[0049]
受试者第二天早晨睡醒之后,对其再进行路易斯湖lls测试,即根据专家经验对受试者的每个观测样本给一个ams易感性评分。
[0050]
考虑到个体在第一阶段获得的一个iht片段中多个训练时间点之间的差异,本发明通过移动时间窗对数据重构。由于阶段1最后一天训练监测的生理数据最接近于阶段2的生理状态,因此阶段1的最后一个iht片段m的数据被选定为重构对象。如图2所示,序列数据被拆分为多段,假设为h段,重构的数据可以表示为:
[0051][0052]
其中表示第j个指标在第i个滑动窗的低氧段数据,其中i∈1,2,...,h;j∈1,2,3,4。时间滑动窗窗宽设定为128秒,每次滑动间距为64秒。由于滑动窗在滑到最后一段数据的时候,窗宽可能大于数据段长度,存在该情况的数据段被舍弃。
[0053]
第二、低氧耐受适应域构建模块。不同的人对高原低氧环境有不同的身体应激反应,特别是在短时间内迅速到达高原。因此本发明提出了低氧耐受适应域的概念。阶段2采集的数据是对模拟高海拔地区低氧环境下人体生理睡眠指标的监测,除去路易斯湖评分外,仍有10个维度,首先利用pca方法对其进行降维,接着利用k-means聚类方法识别低氧耐受性能,初步构建低氧耐受适应域,最后计算聚类与路易斯湖评分之间的互信息值,取互信息值最大的一组聚类结果为最终的低氧耐受适应域。
[0054]
对阶段2的睡眠质量数据x
1:n
进行零均值单位方差的归一化之后,使用pca方法提取数据中的关键特征,pca最大化按照顺序捕获的主成分方差。因此,第一个主成分包含最大的方差,并且后续主成分依次递减。对睡眠数据x
1:n
进行奇异值分解可得:
[0055]
x
1:n
=udv
t
,z=ud,
[0056]
u=[u1,u2,...,u
p
]是特征向量矩阵,对应于特征值矩阵d=diag(e1,e2,...,e
p
)的对角元素。v=[v1,v2,...,v
p
]是载荷矩阵,z=[z1,z2,...,z
p
]是得分矩阵。
[0057]
为了确保睡眠数据尽可能不失真,选择具有前d个较大方差的主成分值。第i个主成分的方差值为:利用解释方差的累积百分比(cumulative percentage of explained variance,cpv)来确定主成分个数d,定义为:
[0058][0059]
其中,阈值m是解释方差的可接受百分比。进而,睡眠数据转变成:
[0060][0061]
维度有效地降低为d个主成分维度。
[0062]
特征选择后,利用k-means聚类方法将x
pc
聚类成k个类别,分别表示个体缺氧耐受
性的k个不同适应域,具体为:
[0063]
首先从睡眠质量主成分数据x
pc
中随机选择k个临时样本作为适应域的初始簇聚类质心每个聚类质心代表一个初始适应域类别。计算x
pc
中除聚类质心外其它n-k个数据样本分别到各个聚类质心的距离,表示为:
[0064][0065]
其中,xi∈x
pc
,数据样本xi将落入与其距离最近的聚类质心所属的适应域类别。xi所属类别定义为:
[0066][0067]
对于每一个低氧耐受适应域类别类别中所有样本的质心点被选为该类别新的聚类质心点。因此在e轮迭代更新后的簇质心点定义为:
[0068][0069]
e轮迭代更新后xi所属的聚类类别定义为:
[0070][0071]
重复更新分类类别和聚类质心点的操作,直到循环迭代次数达到最大设置次数或错误达到预期最小误差的条件。
[0072]
其中,k值的选择是一个关键步骤,它对k-means方法的结果有很大的影响。常用的方法包括肘部法和间隙统计法,肘部法需要判断肘点的位置,但有时并不清晰。因此,我们采用间隙统计法确定k值。
[0073]
由于低氧耐受适应域和路易斯湖评分在一定程度上均体现了ams的易感性风险,我们认定它们之间存在关联关系。因此,计算聚类结果与lls之间的互信息值,互信息值能够严格量化了由于低氧耐受适应域的已知值而导致的lls的不确定性降低程度。选取互信息值最大的一组聚类结果作为受试者最终的低氧耐受适应域,被视为个体低氧耐受能力的标签,记为y。
[0074]
第三、个体急性高原病易感性评估模块。基于动态生理指标数据的评价方法是避免ams评估存在主观性的有效方法。本发明基于慢特征分析和长短时记忆网络方法,旨在使用动态监测数据来评估个体的ams易感性。
[0075]
由于不断变化的信号存在不变因子以反映其固有属性。本发明采用sfa方法提取阶段1中的spo2数据的慢特征,具体为:
[0076]
sfa的目标是在输入的spo2序列数据和输出属性信号之间找到有效的映射使得特征变化最为缓慢(即为慢特征)。spo2的特征随时间变化速度定义为一阶差分平方的时间平均,即其中是随时间点k的一阶微分,定义为《
·

t
表示信号数据的时间平均值。spo2慢
特征问题可以描述成一个优化问题,目的是最小化spo2的特征变化,即:
[0077][0078]
受约束于:
[0079]
零均值:
[0080]
单位方差:
[0081]
去相关性:
[0082]
慢特征分析主要提取spo2中缓慢变化特征。慢变化特征的线性模型可以被视为原始变量的线性组合,即其中w是权重矩阵。慢特征分析求解问题可以看作是一个广义的特征值求解问题。在分析spo2数据的慢速特征之前,对其进行中心化处理以满足零均值的约束。优化问题重写为:
[0083][0084]
同时,单位方差也可以重写成如下形式:
[0085][0086]
其中,co和c
deri
分别表示spo2数据及其差分值的协方差矩阵的时间平均值。此外,通过求解以下公式的广义特征值解决了上述优化问题:
[0087]cderi
w=cowd
[0088]
其中d是广义特征值的对角矩阵。权重变换矩阵由广义特征值求解后,自动满足去相关约束。特征值矩阵中的特征值λi按从小到大的顺序排序。索引较小的较慢特征随时间变化更慢,即慢速特征根据时间变化最慢,其次是慢速特征依此类推。变化速度最慢的功能最终被选中作为慢特征,并重新定义为
[0089]
人体监测系统采集的数据为序列数据,存在着长期依赖特征的问题,不仅短期间距数据之间存在关系,而且具有长期间距的数据点之间也可能存在潜在关系。由于长短时记忆网络的显著优点是对长序列的实用性,本发明引入长短时记忆网络从生理数据中提取特征。长短时记忆网络由链条中的多个长短时记忆模块组成,这些模块通过设计具有不同功能的多个门信号,可以有选择地记住和忘记多个时间间隔内生理信号的隐藏特征。长短时记忆网络的输入数据h
m
为阶段1获得的监测数据hm再拼接spo2的慢特征得到,定义为:
[0090][0091]
低氧耐受适应域y作为输入数据h
m
的标签,其中,每个受试者的输入数据的各个样本对应的标签均为该受试者的标签;将输入数据h
m
及对应的标签,输入到长短时记忆网络,对其进行训练。
[0092]
长短时记忆网络的核心是门模块,包括遗忘门f
t
、输入门i
t
和输出门o
t
。遗忘门是有选择地忘记从前一个时间节点转换而来的生理信号的隐式状态输入。它确定上一时刻单元状态c
t-1
保留到当前时刻的c
t
。遗忘门f
t
定义为:
[0093]ft
=σ(wf·
[h
t-1
,h
m
] bf),
[0094]
其中σ是sigmoid函数,wf和bf是遗忘门的权重参数和偏差参数。h
t
和h
t-1
分别是指当前时刻t和前一时刻t-1时生理数据的隐藏状态。h
t
定义为:
[0095][0096]
输入门是有选择地记忆当前阶段输入的生理信号,即决定当前时刻输入h
m
在单元状态c
t
下能保留多少。输入门定义为:
[0097]it
=σ(wi·
[h
t-1
,h
m
] bi),
[0098]
其中wi和bi是输入门的权重参数和偏置参数。
[0099]
输出门判断哪个当前单元状态将被视为当前状态输出。其公式定义为:
[0100]ot
=σ(wo.[h
t-1
,h
m
] bo),
[0101]
其中wo和bo是输出门的权重参数和偏置参数。单元状态c
t
和c
t-1
分别表示当前时刻t和前一时刻t-1的单元状态。c
t
的公式定义为:
[0102][0103]
其中被定义为矩阵的hadamard乘积。wc和bc是单元状态的权重参数和偏差参数。
[0104]
在本发明中,长短时记忆网络的批大小设置为64,单元数为100。模型选择adam优化器。为了避免数据训练过程中过拟合,利用dropout进行正则化操作,在神经网络中丢弃一些神经元。提取的特征送入softmax层进行个体低氧耐受能力分类。
[0105]
对于待评估个体,按照第一阶段的方式获得重构的数据,输入到训练好的长短时记忆网络,输出该待评估个体的易感性标签。
[0106]
实施例:
[0107]
本发明还对上述方法进行了性能验证分析与评价。pca方法用于突出显示睡眠数据的关键特征。如图3所示,柱状图显示了对应于每个主成分的方差,按从大到小的顺序排列。前几个主成分的方差较大,表明它们包含数据的主要信息。特别是,第一个主成分的方差约占所有方差之和的一半。本发明以cpv作为pca主成分数的选择依据。cpv阈值设置为90%。因此,选择d=6作为主成分数,并将具有阶段2数据映射到具有6个关键特征维度的数据。数据维度降低之后,利用k-means进行聚类以确定初步的低氧耐受适应域。使用间隙统计法确定聚类的k值,如图4所示,当k=2时,gap值取得最大值。因此,低氧适应域被分为两个类别,强低氧耐受能力和弱低氧耐受能力。最后求取聚类结果与路易斯湖评分之间的互信息值,如表1所示,选取与路易斯湖评分之间互信息值最大的一组聚类结果作为低氧耐受适应域。
[0108]
表1聚类结果与路易斯湖评分的互信息
[0109][0110]
对阶段1的监测数据,首先提取spo2的慢特征,如图5所示,实线表示spo2的原始数据,虚线表示spo2的慢特征信号。本发明提出的基于长短时记忆网络和慢特征分析结合的方法对个体耐低氧能力强弱进行分类,分类的混淆矩阵如表2所示。
[0111]
表2耐低氧能力分类的混淆矩阵结果
[0112][0113][0114]
本发明采用了六个量化指标来量化评估分类的性能,包括准确率(accuracy,acc)、精度(precision,pre)、灵敏度(sensitivity,sen)、特异性(specificity,spe)、f1得分和马修斯相关系数(matthews correlation coefficient,mcc),结果如表3所示。
[0115]
表3耐低氧能力分类的量化结果
[0116][0117]
此外,利用接收器工作特性(receiver operating characteristic,roc)曲线下面积(area under curve,auc)分析慢速特征是否对分类结果有效。当lstm的输入值包含spo2的慢速特征时,auc为0.925,高于没有慢速特征的模型获得的auc=0.866。结果反映,模型中结合生理信号的缓慢特征可以很好地反映信号的最基本特征,从而提高低氧耐受能力的分类性能。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献