一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种急性呼吸系统疾病环境危险因素的识别方法与流程

2022-03-19 21:26:25 来源:中国专利 TAG:


1.本发明涉及一种急性呼吸系统疾病环境危险因素的识别方法,属于生物环境信息处理技术领域。


背景技术:

2.当今社会飞速发展,呼吸系统疾病与环境状况密切相关,尤其是急性呼吸系统疾病。随着各种环境问题的出现,急性呼吸系统疾病发病率日益增长,同时,急性呼吸系统疾病发病急、病情发展较快,很容易在短时间内引起明显的医疗资源负担,给各级医疗机构及其管理部门带来较大的突发压力。
3.因此,如何积极有效的开展急性呼吸系统疾病的环境危险因素识别成为亟待解决的问题。对急性呼吸系统疾病发生进行及时预测预警,不仅有利于提升公众疾病预防意识,而且有利于各级医疗机构有效分配医疗资源,能够为有针对性的预防和控制急性呼吸系统疾病提供理论依据。


技术实现要素:

4.本发明的目的是为了解决目前急性呼吸系统疾病与环境相关的发病危险因素不清晰的技术问题,提出一种急性呼吸系统疾病环境危险因素的识别方法。本方法基于深度神经网络,准确提取并识别出急性呼吸系统疾病的环境危险因素。
5.本发明的创新点在于:将急性呼吸系统疾病数据、空气污染数据和气象环境数据等跨领域资源整合到一起,对数据进行人群分层处理,并构建深度神经网络模型,然后通过深度神经网络模型识别出不同分层人群的环境危险因素,最后对识别出的环境危险因素进行定性和定量分析。
6.为了实现上述目的,本发明采用的技术方案如下。
7.一种急性呼吸系统疾病环境危险因素的识别方法,包括如下步骤:
8.步骤1:获取急性呼吸系统疾病数据、空气污染数据和气象环境数据,整合形成跨领域数据源。
9.步骤2:在步骤1得到跨领域数据源的基础上开展数据预处理,得到预处理后的数据。
10.具体地,本方法给出一种步骤2的具体实现方法,本领域技术人员也可以使用其他方法实现。
11.步骤2包括以下步骤:
12.步骤2.1:对数据源进行数据处理操作,包括空缺值弥补、识别或删除离群点、数据噪声平滑,从而解决数据源中出现的白噪声、冗余、数据不一致等问题;
13.步骤2.2:为了满足深度神经网络模型构建时所需要的hdf5数据格式,对数据进行数据格式转换,得到hdf5格式的数据;
14.步骤2.3:对hdf5格式的数据进行人群分层处理,得到预处理后数据。
15.进一步地,本方法给出一种人群分层处理的方法。首先对数据按照性别进行划分,然后按照年龄大于等于m岁和小于m岁进行划分,从而生成p组分层人群,其中,m值由人为自主设定。分层划分后的数据,称为预处理后数据。
16.本领域技术人员也可以使用其他方法,进行人群分层处理。
17.步骤3:使用步骤2得到的预处理后数据,分别训练不同人群的深度神经网络模型,得到各分层人群的环境危险因素。
18.具体地,本方法给出一种步骤3的具体实现方法,本领域技术人员也可以使用其他方法实现。
19.步骤3包括以下步骤:
20.步骤3.1:对p组分层人群的数据,分别建立训练集和测试集;
21.其中,将p组分层人群的数据中的n%作为训练集,1-n%为作为测试集。优选地,n的取值范围为50到90。
22.步骤3.2:利用训练集,构建生成p个深度神经网络模型。
23.将训练集中的数据作为深度神经网络模型的输入,通过隐含层计算不同环境危险因素的权重,在输出层得到环境危险因素各自的权重值,得到p个深度神经网络模型。
24.步骤3.3:将测试集输入至p个训练好的深度神经网络模型,识别出各分层人群的环境危险因素。
25.将各个分层测试集中的数据分别对应作为p个深度神经网络模型的输入,深度神经网络模型隐含层计算不同环境危险因素的权重,输出层得到环境危险因素各自的权重值。
26.步骤4:对各分层人群的危险因素对应的不同分层人群急性呼吸系统疾病环境危险因素的权重分别进行归一化处理,按照权重得到环境危险因素,对急性呼吸系统疾病的影响程度,进而识别出p组分层人群中各自的环境危险因素,并对这些危险因素进行定性和定量分析。
27.有益效果
28.本发明方法,与现有的采用c4.5分类算法、逻辑回归等危险因素识别方法等技术相比,具有以下优点:
29.1.本方法首次采用深度神经网络,具有计算精度高和计算速度快的优势,可作为大规模数据的高速计算使用;
30.2.本方法具有定量化识别、定性和定量相结合、准确率高的优点,并且操作简单。
附图说明
31.图1为本发明方法的原理示意图。
具体实施方式
32.下面结合附图和实施例对本发明方法做进一步详细说明。
33.实施例
34.一种急性呼吸系统疾病环境危险因素的识别方法,基于深度神经网络识别出急性呼吸系统疾病环境危险因素,如图1所示,包括如下步骤:
35.步骤1:获取急性呼吸系统疾病数据、空气污染数据和气象环境数据,整合形成涉及多领域的呼吸系统疾病数据源r。
36.在本实施例中,通过调查2009-2012年的急性呼吸系统疾病数据、空气污染数据和气象环境数据,整合得到跨领域数据源r。具体地,以2009-2012年130000名急性呼吸系统疾病数据作为模型的一部分输入,同时按照疾病数据对应的就诊日期把空气污染数据、气象环境数据和急性呼吸系统疾病数据整合到一起,形成跨领域数据源r,共同作为急性呼吸系统疾病的环境危险因素识别模型的输入。
37.步骤2:在步骤1得到数据源r的基础上开展数据预处理。具体过程如下:
38.步骤2.1:采取空缺值弥补、识别或删除离群点、数据噪声平滑等数据处理操作来解决数据源中存在的白噪声、冗余、数据不一致等问题。
39.步骤2.2:将初步处理后的数据转换成hdf5格式。
40.步骤2.3:对步骤2.2基础上得到的数据进行人群分层处理。具体方法为:首先对数据按照性别划分,在此基础上按照年龄大于等于m岁和小于m岁进行划分,从而生成p组分层人群;
41.步骤3:用步骤2得到的分层人群分别训练深度神经网络模型。具体包括:
42.步骤3.1:对p组分层人群的数据分别建立训练集和测试集。
43.步骤3.2:利用p组分层人群训练生产p个深度神经网络模型。具体方法为:把训练集中的数据作为深度神经网络模型的输入,通过隐含层计算不同环境危险因素的权重,在模型的输出层得到环境危险因素各自的权重值,整个过程如图1急性呼吸系统疾病的环境危险因素识别模型构建原理所示。
44.步骤3.3:通过深度神经网络模型得到各分层人群的环境危险因素的权重。
45.步骤4:对不同分层人群急性呼吸系统疾病环境危险因素的权重分别进行归一化处理,得到环境危险因素对急性呼吸系统疾病的影响程度,进而识别出p组分层人群中各自的环境危险因素。
46.利用步骤2得到的预处理后数据,分别训练c4.5分类模型,识别急性呼吸系统疾病环境危险因素。与步骤4输出的p组分层人群的环境危险因素进行对比,完成急性呼吸系统疾病的环境危险因素识别。
47.具体为:利用分层人群分别训练生成基于深度神经网络的急性呼吸系统疾病环境危险因素识别模型,采用十折交叉法对模型进行验证,模型性能如表1所示。表1中,采用深度神经网络模型性能与c4.5分类模型有明显提升,在大于等于50岁、小于50岁、男性大于等于50岁、男性大于等于50岁、男性小于50岁和女性小于50岁人群的模型准确率分别提升12.51%、10.78%、11.34%、9.77%、10.67%和8.96%,且深度神经网络模型训练速度快,节省了时间成本。
48.表1急性呼吸系统疾病环境危险因素识别模型性能
49.[0050][0051]
通过六个急性呼吸系统疾病环境危险因素识别模型,得到六组分层人群中环境危险因素对急性呼吸疾病的影响程度,如表2所示。
[0052]
表2分层人群中环境危险因素对急性呼吸系统疾病的影响程度
[0053][0054]
对不同分层人群中急性呼吸系统疾病的环境危险因素识别和分析,得到以下结果:
[0055]
1.年龄大于50岁人群比小于50岁人群对空气污染物pm2.5更敏感,尤其是大于50岁女性。如表2所示,空气污染物pm10对小于50岁人群的影响要大于对大于50岁人群的影响。
[0056]
2.与女性相比,男性无论大于50岁还是小于50岁都对空气污染物pm10更敏感。
[0057]
3.小于50岁女性比小于50岁男性对一般空气污染物(如:so2、no2等)更敏感,说明空气污染天气更容易引发小于50岁女性的急性呼吸系统疾病。
[0058]
4.不仅空气污染物,而且气象因素也能够对急性呼吸系统疾病发生产生影响。如表1所示,风速和降水量对急性呼吸系统疾病发生有一定影响。气象因素(如:风速、降水等)有利于一般空气污染物(如:so2、no2等)和细颗粒物(pm2.5、pm10等)的扩散,因此随着风速和降水量的增加,空气污染物将随之扩散,进而急性呼吸系统疾病就诊人数有可能出现减少,对医疗资源有效合理分配有积极指导意义。
[0059]
以上结合了具体实施例对本发明的实施方式进行详细描述,但是对于本领域技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,这些也视为属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献