一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于呼出气体标志物检测的健康状态识别方法与流程

2021-11-09 23:00:00 来源:中国专利 TAG:


1.本发明涉及健康状态识别方法技术领域,具体为一种基于呼出气体标志物检测的健康状态识别方法,特别是设计一种慢性阻塞性肺疾病状态快速预测识别的工作方法。


背景技术:

2.慢性阻塞性肺疾病(chronic obstructive pulmonary disease,copd,简称慢阻肺)是具有气流阻塞特征的慢性支气管炎和(或)肺气肿,是一种全球常见多发的呼吸系统疾病,copd易导致肺功能减弱、呼吸急促、咳嗽、咳痰和多种并发症,甚至死亡,尽管在copd临床症状治疗和急性加重缓解上有了进步,但在控制其高死亡率和医疗成本方面进展缓慢。肺功能检查(呼吸量测定法)是当前copd诊断的通行标准,然而,一些患者无法适应该侵入性方法,不能提供令人满意的测定结果,尤其是儿童或非常年老的群体在肺功能检查中准确性会大大降低;此外,由于早期copd呼吸症状在临床表现不明显,现行的检查方法存在无法对copd作出全面准确诊断的风险,而copd的早期诊断和治疗不仅能显著降低copd患者的死亡率,而且还能显著减少该疾病治疗的经济负担,因此,为突破上述传统copd诊断方法的局限性,我们提出一种基于呼出气体标志物检测的健康状态识别方法。


技术实现要素:

3.本发明的目的在于提供一种基于呼出气体标志物检测的健康状态识别方法,以解决上述背景技术中提出的问题。
4.为实现上述目的,本发明提供如下技术方案:一种基于呼出气体标志物检测的健康状态识别方法,识别方法的步骤为:s1:与测量仪器通信获得测量样本因子;s2:对测量样本因子进行标准化处理;s3:结合历史数据,采用随机森林决策树的深度调整算法进行训练,得出特征因子和疾病程度的最优算法模型;s4:采用该最优算法模型判定算法模型训练效果是否达到设定阈值,是则对测量样本进行实时快速预测,否则回到s3步骤中重新进行模型训练;s5:测量样本预测后进行结果输出。
5.优选的,s1步骤中测量仪器是可以快速准确测定人体呼出气中挥发性有机物浓度的检测设备。
6.优选的,s2步骤中测量样本因子标准化是仪器能检出的所有vocs浓度进行归一化处理(x

min)/(max

min),使所有特征因子的数值范围转化为[0

1],对已经诊断的疾病分类进行6个one

hot标签独热编码,极重度copd对应标签为1,重度copd对应标签为2,中度copd对应标签为3,轻度copd对应标签为4,肺部炎症对应标签为5,健康者对应标签为0,且疾病状态分为健康、肺部炎症、ⅰ级(轻度)copd、ⅱ级(中度)copd、ⅲ级(重度)copd和ⅳ级(极重度)copd等六种。
[0007]
优选的,s3步骤中最优算法模型中采用最优化算法思想,不停地迭代训练使误差最小化。
[0008]
优选的,s3步骤中随机森林就是由若干个决策树组成的集成分类器;每个决策树随机的选择样本属性进行预测,最后得到结果,整个决策树组成的森林可以进行投票,最后将样本属于六个类别中得票最高的一个类别作为最终预测结果;随机森林是一个并行式集成学习方法,其是以决策树为单学习器构建并行集成的基础上,进一步在决策树的训练过程中引入了随机属性和随机树选择;且决策树是一种对样本特征按照信息增益大小排序,然后分别对每个属性进行分类的单分类器;信息增益(gain)表示信息熵(ent)的变化:信息增益(gain)表示信息熵(ent)的变化:其中,样本集合中第类样本所占的比例为,离散属性有个可能取值,若使用来对样本集进行划分,则会产生个分支节点,其中第个分支节点包含了中所有在属性上取值为的样本,记为;由上公式可以计算出信息熵和信息增益。
[0009]
优选的,s3和s4步骤中训练算法模型是指将历史数据随机拆分为不均等两份,多的部分数据作为训练集,少的为测试集,可以迭代训练出接近最优模型的新模型,从而用该模型对新的病患样本进行预测。
[0010]
与现有技术相比,本发明的有益效果是:本发明设计合理,基于呼出气生物标志物的copd状态识别方法不仅具有非侵入性、取样方便快捷和在线快速诊断等优势,而且克服了传统copd诊断方法不适用早期诊断的局限性。本发明应用大数据技术方法对大量的copd患者和健康对照人群呼出气vocs在线监测数据进行分析,整体采用闭环数据演算对比,筛选能够识别copd疾病程度的vocs标志物,建立基于呼出气vocs标志物的健康状态快速识别的模型算法,对人体无侵入性、取样方便快捷、诊断迅速、诊断准确度高,能更好地服务于copd早期筛查,及早发现病症,降低copd死亡率,因此,本发明对人体健康状态识别,尤其是copd的早期诊断具有重要的应用价值和广阔的应用前景。
附图说明
[0011]
图1为本发明整体工作原理图。
具体实施方式
[0012]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0013]
请参阅图1,本发明提供一种技术方案:一种基于呼出气体标志物检测的健康状态识别方法,识别方法的步骤为:
s1:与测量仪器通信获得测量样本因子;s2:对测量样本因子进行标准化处理;s3:结合历史数据,采用随机森林决策树的深度调整算法进行训练,得出特征因子和疾病程度的最优算法模型;s4:采用该最优算法模型判定算法模型训练效果是否达到设定阈值,是则对测量样本进行实时快速预测,否则回到s3步骤中重新进行模型训练;s5:测量样本预测后进行结果输出。
[0014]
s1步骤中测量仪器是可以快速准确测定人体呼出气中挥发性有机物浓度的检测设备;s2步骤中测量样本因子标准化是仪器能检出的所有vocs浓度进行归一化处理(x

min)/(max

min),使所有特征因子的数值范围转化为[0

1],对已经诊断的疾病分类进行6个one

hot标签独热编码,极重度copd对应标签为1,重度copd对应标签为2,中度copd对应标签为3,轻度copd对应标签为4,肺部炎症对应标签为5,健康者对应标签为0,且疾病状态分为健康、肺部炎症、ⅰ级(轻度)copd、ⅱ级(中度)copd、ⅲ级(重度)copd和ⅳ级(极重度)copd等六种;s3步骤中最优算法模型中采用最优化算法思想,不停地迭代训练使误差最小化;s3步骤中随机森林就是由若干个决策树组成的集成分类器;每个决策树随机的选择样本属性进行预测,最后得到结果,整个决策树组成的森林可以进行投票,最后将样本属于六个类别中得票最高的一个类别作为最终预测结果;随机森林是一个并行式集成学习方法,其是以决策树为单学习器构建并行集成的基础上,进一步在决策树的训练过程中引入了随机属性和随机树选择;且决策树是一种对样本特征按照信息增益大小排序,然后分别对每个属性进行分类的单分类器;信息增益(gain)表示信息熵(ent)的变化:信息增益(gain)表示信息熵(ent)的变化:其中,样本集合中第类样本所占的比例为,离散属性有个可能取值,若使用来对样本集进行划分,则会产生个分支节点,其中第个分支节点包含了中所有在属性上取值为的样本,记为;由上公式可以计算出信息熵和信息增益;s3和s4步骤中训练算法模型是指将历史数据随机拆分为不均等两份,多的部分数据作为训练集,少的为测试集,可以迭代训练出接近最优模型的新模型,从而用该模型对新的病患样本进行预测。
[0015]
本发明中的状态识别方法不仅具有非侵入性、取样方便快捷和在线快速诊断等优势,而且克服了传统copd诊断方法不适用早期诊断的局限性。本发明应用大数据技术方法对大量的copd患者和健康对照人群呼出气vocs在线监测数据进行分析,整体采用闭环数据演算对比,筛选能够识别copd疾病程度的vocs标志物,建立基于呼出气vocs标志物的健康状态快速识别的模型算法,对人体无侵入性、取样方便快捷、诊断迅速、诊断准确度高,能更好地服务于copd早期筛查,及早发现病症,降低copd死亡率,因此,本发明对人体健康状态
识别,尤其是copd的早期诊断具有重要的应用价值和广阔的应用前景。
[0016]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献