一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于自适应提升算法的电子鼻甲状腺癌患者呼气诊断装置的制作方法

2022-11-28 10:22:16 来源:中国专利 TAG:


1.本发明属于疾病传感诊断装置领域,特别是涉及基于自适应提升算法的电子鼻甲状腺癌患者呼气诊断装置。


背景技术:

2.甲状腺癌是世界上最常见的内分泌肿瘤。随着高分辨率超声在临床实践中的广泛应用,越来越多的甲状腺良性结节被发现,这些结节大多数是良性的,只有5%的人被证明为恶性的。临床医生的挑战是识别甲状腺良性结节的性质和发展后续的治疗。超声检测在鉴别结节部位、大小方面具有可靠检测价值,但在鉴别结节良恶性上性能较低。细胞穿刺活检是目前判断甲状腺良性结节良恶性最常用的方法,特异性60-98%,敏感性54-90%。这种方法增加了医疗系统的负担和结节患者的心理压力,且高度依赖准确的穿刺技术及临床医生细胞学检测的经验。大多数有良性结节的患者需要长期随访,他们可能需要进行超声检测或者细针穿刺等方法来确定结节情况,这显然不被大多数人接受。因此医疗系统需要一种快速、廉价、无创的检测方法来指导临床检测和制定治疗方案。
3.呼气分析是最近发展起来的一种疾病早期检测方法。由于其快速、无创、易于被患者接受等优点,在医疗系统中越来越受到重视。呼出的气体中含有1000多种有机化合物。与正常组织相比,癌变组织可能表现出特定的代谢模式,由此产生的挥发性代谢物经血液循环到肺泡,并通过呼气排出体外。检测呼气产生的挥发性有机化合物主要通过两种方法进行,即化学成分分析和基于模式识别的方法。前者最常用的技术是气相色谱/质普法(gc/ms)来寻找呼气特异性生物标志物。但gc-ms具有一定的局限性,如成本高、不便携和操作难度高等。而基于模式识别的方法指采用电子鼻。电子鼻是一种以气体传感器阵列为基础,结合人工智能算法,对气体性质进行检测的设备。这种设备具有快速,无损,廉价的优点,已被利用在食品,环境,医疗等领域。


技术实现要素:

4.为了解决现有技术的问题,本发明提出了基于自适应提升算法的电子鼻甲状腺癌患者呼气诊断装置。
5.为了实现以上目的,本发明采取的一种技术方案:基于自适应提升算法的电子鼻甲状腺癌患者呼气诊断装置,包括:
6.电子鼻设备,用于采集呼气气体,并构成原始响应数据集,并将原始响应数据集输出至上位机模块;
7.上位机模块,所述上位机模块包括顺序串联的预处理模块、标准化处理模块、特征降维模块、自适应算法分类模块;其中,
8.所述预处理模块,用于接收来自电子鼻设备的原始响应数据集,并对原始响应数据进行预处理,获得预处理后的训练样本集和测试样本集;所述标准化处理模块,用于对分别对预处理后的训练样本集和测试样标准化处理,对应获得标准化处理后的训练样本集和
标准化处理后的测试样本集;
9.所述特征降维模块,用于分别对标准化处理后的训练样本集和标准化处理后的测试样本集中的特征进行特征降维,对应获得低维特征训练样本子集和低维特征测试样本子集;
10.所述自适应算法分类模块,用于构建及训练以低维特征训练样本子集为输入、甲状腺分类检测结果为输出的甲状腺检测分类模型,并在训练过程中绘制roc曲线,通过roc曲线的auc来确定模型性能;获得分类检测结果。
11.进一步地,所述电子鼻包括用于接收呼气气体的吹嘴、以及与吹嘴顺序相连的检测腔、微型泵、流量计;所述检测腔内部集成气体传感器阵列,用于在所述检测腔在微型泵的控制下采集呼气气体的原始响应信号,所述流量计用于实时监测检测腔接收到的呼气气体流量,并对所述微型泵反馈控制;所述检测腔与控制电路相连,并通过控制电路输出原始响应数据集至预处理模块。
12.进一步地,所述预处理模块被配置执行以下动作:
13.对原始响应数据集x中呼气信号和基线信号之间按如下公式将呼气信号与基线信号之间的电阻变化除以基线信号中位数:
[0014][0015][0016]
其中,为第k个呼气样本在基线阶段某一时刻传感器对环境气的响应值,为第k个呼气样本在呼气阶段某一时刻传感器对呼气信号的响应值,为第k个呼气样本在某一个时刻传感器响应特征信号,k=300,v为基线阶段总点数,w为呼气阶段总点数。
[0017]
进一步地,所述标准化处理模块被配置执行以下动作:
[0018]
s101、计算训练样本集x
train
中特征的均值
[0019]
s102、计算训练样本集x
train
中特征的标准差σ;
[0020]
s103、按如下公式对训练样本集x
train
和测试样本集x
test
分别进行标准化处理:
[0021][0022]
其中,x
train
和x
test
分别为训练样本集和测试样本集响应数据,x
train_std
为训练样本集标准化处理后数据,x
test_std
为测试样本集标准化处理后数据。
[0023]
进一步地,所述特征降维模块被配置执行以下动作:
[0024]
s201:对所有特征x=(x1,x2,

,xm)进行中心化,对于每一个特征xi,都减去自身
均值:
[0025][0026]
其中,n为每一个特征的特征点数;
[0027]
s202:求出x的协方差矩阵:
[0028]
s203:求出协方差矩阵c的特征值和特征向量:
[0029]
cβi=λiβ
i i=1,2,

,n
[0030]
满足:λ1≥λ2≥

≥λn;
[0031]
s204:特征向量单位化:
[0032][0033]
s205:取前k大的特征值以及其对应的单位特征向量:
[0034][0035]
s206:得到降维后的数据:
[0036]
y=qx=(y1,y2,

,ym)k×m;
[0037]
s207:预设主成分累计方差贡献率阈值,选取方差贡献率大于阈值的特征值对应的特征向量组成映射矩阵w,通过映射矩阵w得到新的低维特征子集x
train_pca
和x
test_pca

[0038]
进一步地,所述自适应算法分类模块被配置执行以下动作:
[0039]
s301、利用自适应提升算法,以低维特征训练样本子集x
train_pca
为输入,低维特征训练样本子集x
train_pca
对应的甲状腺癌与健康人群、甲状腺癌与甲状腺良性结节、甲状腺良性结节与健康人群的三种分类检测结果为输出,构建并训练甲状腺检测分类模型;
[0040]
s302、根据约登指数计算动作s301三种分类结果的roc横坐标与纵坐标差异最大的点所对应的最佳阈值;
[0041]
s303、应用甲状腺检测分类模型,以及最佳阈值对x
test_pca
中呼气样本进行分类,并计算正确率、敏感性、特异性指标。
[0042]
进一步地,所述通过roc曲线的auc来确定模型性能包括如下子动作:
[0043]
s301-1、根据低维特征训练样本子集x
train_kpca
被预测为正类p的概率score以及真正标签p/n,将score从高到低依次作为阈值,绘制roc曲线;
[0044]
s301-2、roc曲线下面积即为auc,属于0-1之间,用于评价模型的分类准确率。
[0045]
进一步地,所述动作s302包括如下子动作:
[0046]
s302-1、按如下约登指数找出roc曲线横坐标与纵坐标差异最大的点所对应的阈值:
[0047]
index=1 tpr-fpr,
[0048]
其中,tpr指正确识别的正类占据总正类的比例,fpr为将负类预测为正类的比例;
[0049]
s302-2、取约登指数最大值为最佳阈值。
[0050]
相对于现有技术,本发明的有益效果在于:利用电子鼻传感器阵列采集不同人群的呼气“指纹”,并通过上位机显示呼气原始信号,判断呼气样本的标准与否,应用于自适应提升算法可以很好地区分开健康、甲状腺良性结节、甲状腺癌三种人群的呼气信号。本发明提供的检测系统具有自动采集、处理并上传数据的功能,一方面降低了系统的硬件成本,另一方面给临床医生鉴别甲状腺良性结节是否存在以及结节的良恶性提供了一种快速、便捷、精确度高、非侵入式的检测装置。
附图说明
[0051]
图1为自适应提升算法的电子鼻甲状腺癌患者呼气诊断装置原理图。
[0052]
图2为基于甲状腺检测分类模型流程图。
[0053]
图3为三种人群呼气信号原始响应图。
[0054]
图4为基线信号呼气信号相关运算前后响应对比图。
[0055]
图5为三种人群两两分类的roc曲线图。
具体实施方式
[0056]
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
[0057]
在本发明中参照附图来描述本发明的各方面,附图中示出了许多说明性实施例。本发明的实施例不局限于附图所述。应当理解,本发明通过上面介绍的多种构思和实施例,以及下面详细描述的构思和实施方式中的任意一种来实现,这是因为本发明所公开的构思和实施例并不限于任何实施方式。另外,本发明公开的一些方面可以单独使用,或者与本发明公开的其他方面的任何适当组合来使用。
[0058]
如图1所示,基于自适应提升算法的电子鼻甲状腺癌患者呼气诊断装置,包括电子鼻和与其连接上位机。电子鼻包括用于接收人体呼气气体的吹嘴、以及与吹嘴顺序相连的检测腔、微型泵、流量计;检测腔内部集成气体传感器阵列,用于在所述检测腔在微型泵的控制下采集呼气气体的原始响应信号,流量计用于实时监测检测腔接收到的呼气气体流量,并对所述微型泵反馈控制,以确保整个系统的气体流速恒定;所述检测腔与控制电路相连。
[0059]
所述上位机模块应用已训练好的甲状腺检测分类模型,够判断呼气样本的标准与否,实现对健康、甲状腺良性结节、甲状腺癌三类人群的两两分类。
[0060]
本实施例中的电子鼻设备中传感器阵列包括12个气体传感器(6类,每类2个)和1个温湿度传感器,其工作过程如下:开始工作前,先对传感器预热5min,工作电压为5v,采样频率为1hz,将传感器阵列输出的信号数据实时发送至至上位机中通过甲状腺检测分类模型的自适应提升算法进行检测。
[0061]
本实施例运行的环境为实验的实施环境为在dell 3681计算机上编写实现,windows10,因特尔i5处理器,8g运行内存,pycharm2020,python3.8,scikit-learn0.24.2。
[0062]
如图2所示,本发明提供的基于自适应提升算法的电子鼻甲状腺癌患者呼气诊断装置,上位机模块包括顺序串联的预处理模块、标准化处理模块、特征降维模块、自适应算
法分类模块;其中,
[0063]
所述预处理模块,用于接收来自电子鼻设备的原始响应数据集,并对原始响应数据进行预处理,获得预处理后的训练样本集和测试样本集;所述标准化处理模块,用于对分别对预处理后的训练样本集和测试样标准化处理,对应获得标准化处理后的训练样本集和标准化处理后的测试样本集;
[0064]
所述特征降维模块,用于分别对标准化处理后的训练样本集和标准化处理后的测试样本集中的特征进行特征降维,对应获得低维特征训练样本子集和低维特征测试样本子集;
[0065]
所述自适应算法分类模块,用于构建及训练以低维特征训练样本子集为输入、甲状腺分类检测结果为输出的甲状腺检测分类模型,并在训练过程中绘制roc曲线,通过roc曲线的auc来确定模型性能;获得甲状腺癌与健康人群、甲状腺癌与甲状腺良性结节、甲状腺良性结节与健康人群的三种分类检测结果。
[0066]
图3显示了三种人群呼气信号原始响应图。传感器阵列获得不同人群呼气的原始响应数据矩阵x;
[0067][0068]
其中,为第k个呼气样本在基线阶段某一时刻传感器对环境气的响应值,为第k个呼气样本在呼气阶段某一时刻传感器对呼气信号的响应值。
[0069]
预处理模块被配置执行以下动作:
[0070]
对原始响应数据集x中呼气信号和基线信号之间按如下公式将呼气信号与基线信号之间的电阻变化除以基线信号中位数:
[0071][0072][0073]
其中,为第k个呼气样本在基线阶段某一时刻传感器对环境气的响应值,为第k个呼气样本在呼气阶段某一时刻传感器对呼气信号的响应值,为第k个呼气样本
在某一个时刻传感器响应特征信号,k=300,v为基线阶段总点数,w为呼气阶段总点数。
[0074]
如图4、图5所示,基线信号与呼气信号经过相关运算后排除了每次因为环境气体改变造成的基线不同的问题。
[0075]
将样本数据集xm划分为训练样本集x
train
及测试样本集x
test
,其中训练样本集比重占70%,测试样本集比重占30%。
[0076]
标准化处理模块被配置执行以下动作:
[0077]
s101、计算训练样本集x
train
中特征的均值
[0078]
s102、计算训练样本集x
train
中特征的标准差σ;
[0079]
s103、按如下公式对训练样本集x
train
和测试样本集x
test
分别进行标准化处理:
[0080][0081]
其中,x
train
和x
test
分别为训练样本集和测试样本集响应数据,x
train_std
为训练样本集标准化处理后数据,x
test_std
为测试样本集标准化处理后数据。
[0082]
特征降维模块被配置执行以下动作:
[0083]
s201:对所有特征x=(x1,x2,

,xm)进行中心化,对于每一个特征xi,都减去自身均值:
[0084][0085]
其中,n为每一个特征的特征点数;
[0086]
s202:求出x的协方差矩阵:
[0087]
s203:求出协方差矩阵c的特征值和特征向量:
[0088]
cβi=λiβ
i i=1,2,

,n
[0089]
满足:λ1≥λ2≥

≥λn;
[0090]
s204:特征向量单位化:
[0091][0092]
s205:取前k大的特征值以及其对应的单位特征向量:
[0093][0094]
s206:得到降维后的数据:
[0095]
y=qx=(y1,y2,

,ym)k×m;
[0096]
s207:预设主成分累计方差贡献率阈值为95%,选取方差贡献率大于阈值的特征值对应的特征向量组成映射矩阵w,通过映射矩阵w得到新的低维特征子集x
train_pca

x
test_pca
,以实现既保留了关键信息,又降低了训练数据的维数,从而间接提高分类模型的训练效率与调度性能。
[0097]
分类算法为自适应提升算法adaboost,模型中基分类器选择决策树模型,基分类器循环次数设为30次,学习率设为0.08,模型提升准则方式为samme.r。
[0098]
取前2个主成分累计方差贡献率大于95%作为新的特征子集。主成分贡献率统计如表1所示:
[0099]
表1
[0100][0101]
自适应算法分类模块被配置执行以下动作:
[0102]
s301、利用自适应提升算法,以低维特征训练样本子集x
train_pca
为输入,低维特征训练样本子集x
train_pca
对应的甲状腺癌与健康人群、甲状腺癌与甲状腺良性结节、甲状腺良性结节与健康人群的三种分类检测结果为输出,构建并训练甲状腺检测分类模型;
[0103]
s302、根据约登指数计算动作s301三种分类结果的roc横坐标与纵坐标差异最大的点所对应的最佳阈值;具体为:
[0104]
按如下约登指数找出roc曲线横坐标与纵坐标差异最大的点所对应的阈值:
[0105]
index=1 tpr-fpr
[0106]
其中,tpr指正确识别的正类占据总正类的比例,fpr为将负类预测为正类的比例;
[0107]
取约登指数最大值为最佳阈值。以该阈值代替二元分类的默认阈值0.5,在假正率fpr与真正率tpr之间做折中可以使分类效果达到最优,符合实际应用要求,即为最佳阈值。根据最佳阈值对测试样本集进行分类。
[0108]
s303、应用甲状腺检测分类模型,以及最佳阈值对x
test_pca
中呼气样本进行分类,并计算正确率、敏感性、特异性指标。
[0109]
训练过程中绘制roc曲线,通过roc曲线的auc来确定模型性能包括如下子动作:
[0110]
s301-1、根据低维特征训练样本子集x
train_kpca
被预测为正类p的概率score以及真正标签p/n,将score从高到低依次作为阈值,绘制roc曲线;
[0111]
s301-2、roc曲线下面积即为auc,属于0-1之间,用于评价模型的分类准确率。如图6所示,绘制了甲状腺癌与健康人群、甲状腺癌与甲状腺良性结节、甲状腺良性结节与健康分类结果的roc曲线图,并分别计算了最佳阈值。
[0112]
实验共收集了健康、甲状腺良性结节、甲状腺癌三种人群呼气样本各100例。三种人群年龄、性别分布均匀,90%以上人群没有抽烟史,70%以上人群无潜在慢性病和家族遗传病。良性结节以结节性甲状腺肿为主,甲状腺癌皆为乳头状癌。每个分类实验都利用70个样本训练,30个样本测试,并在完成训练的自适应提升算法模型结构下分析预测概率,并通过roc曲线的最佳阈值进行分类。表2统计了三种类别两两分类结果的正确率、灵敏度、特异度三种评价指标。
[0113]
表2
[0114][0115]
结果表明,本发明提出的基于自适应提升算法的甲状腺癌患者呼气检测系统及方法可以快速、准确地筛选出甲状腺癌、良性结节、健康三种人群,一方面降低了系统的硬件成本,另一方面给临床医生别甲状腺良性结节是否存在以及结节的良恶性提供了帮助。
[0116]
以上所述仅为本技术的部分优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献