一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于集成学习融合多模式特征的疾病分类方法及设备与流程

2022-02-20 13:30:23 来源:中国专利 TAG:


1.本发明涉及基于医学影像的计算机处理技术领域,尤其是涉及一种基于集成学习融合多模式特征的疾病分类方法及设备。


背景技术:

2.随着医学成像技术的发展,对多种成像方式的数据检测,包括磁共振(magnetic resonance,mr)显像、弥散张量成像(diffusion tensor imaging,dti)等,以更完整地揭示采样者的情况,已成为提高检测准确性的发展趋势。
3.现有对医学成像数据的挖掘利用还不够,对疾病的计算机辅助分类模型上的研究虽然有一定成果,但仍存在以下不足:(1)特征模态单一。目前模型中大都是基于独立的模式分析,只考虑了单模态影像特征,分类准确性不足。(2)仅使用单个分类器模型,但没有某一种算法总是优于其他算法的情况,基于不同的模态特征具有不同的最优分类器,构建一种稳健、鲁棒性强的帕金森病分类模型仍有待考察。


技术实现要素:

4.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种准确性佳、鲁棒性强的基于集成学习融合多模式特征的疾病分类方法及设备,可应用于早期帕金森病的分类。
5.本发明的目的可以通过以下技术方案来实现:
6.一种基于集成学习融合多模式特征的疾病分类方法,包括以下步骤:
7.获取同一对象在同一设备上获得的多模态磁共振图像及临床文本信息,并进行数据预处理;
8.从经预处理后的所述多模态磁共振图像中提取各模态下的全脑形态学特征图,对应计算感兴趣脑区内的影像特征值,同时提取具有组间差异的临床文本信息,形成文本特征值;
9.将各模态的影像特征值及所述文本特征值作为对应最佳基分类器的输入,获得多个粗分类结果;
10.融合多个所述粗分类结果,获得最终分类结果。
11.进一步地,所述多模态磁共振图像包括t1加权磁共振图像、弥散张量图像和静息态功能磁共振图像。
12.进一步地,所述影像特征值通过以下方式获得:
13.对所述全脑形态学特征图进行基于体素的形态学分析,获得能够体现差异性的体素簇团块,作为感兴趣脑区,计算感兴趣脑区内所有体素的形态学特征均值作为所述影像特征值。
14.进一步地,所述全脑形态学特征图包括灰质体积特征图、灰质密度特征图、白质体积特征图、白质密度特征图、分数各向异性图、平均扩散率图以及低频振幅和脑区的局部一
致性指标。
15.进一步地,采用双样本t检验统计提取所述具有组间差异的临床文本信息。
16.进一步地,所述最佳基分类器经训练获得,训练过程包括:
17.预定义备选基分类器模型;
18.初始化各基分类器模型的超参数搜索空间,采用联合交叉验证的网格搜索法进行各基分类器模型的参数寻优;
19.在最优参数下,训练各个基分类器模型,使用交叉验证返回各模型的平均分类准确率,并基于该平均分类准确率获得各基模型的损失函数值;
20.选择最小损失函数值所对应的模型为最佳基分类器。
21.进一步地,所述基分类器模型包括支持向量机算法、随机森林算法、k近邻算法、多层感知器分类器或朴素贝叶斯模型。
22.进一步地,通过元学习器集成学习融合多个所述粗分类结果。
23.进一步地,所述元学习器为逻辑回归分类器。
24.本发明还提供一种电子设备,包括:
25.一个或多个处理器;
26.存储器;和
27.被存储在存储器中的一个或多个程序,所述一个或多个程序包括用于执行如上所述基于集成学习融合多模式特征的疾病分类方法的指令。
28.与现有技术相比,本发明具有以下有益效果:
29.1、本发明基于多模式特征,提出一种堆叠式两级集成学习模型,首先对不同模式的各特征进行粗分类,针对不同模态特点实现最佳分类器的自动选择,再进行元学习器集成学习,拥有良好的自学习能力和稳定的鲁棒性,以解决现有模型准确率低、模型鲁棒性差等问题。
30.2、本发明融合多模态信息能够提供更加丰富的互补的特征,能够从不同数据结构角度和算法的空间角度实现多模式特征的高效融合,能够获得更准确的分类结果。
31.3、本发明基于不同的模态进行基分类器的自适应选择,有利于充分发挥各模态的特征表达,避免了因分类器使用范围上的不足而带来预测误差。
32.4、本发明通过元学习器的集成学习,可以实现基分类器模型的分类性能互补,使整个模型能够充分学习复杂多样的多模式特征,从而使得各模态特征得到高效融合,提高分类精度和模型泛化能力。
附图说明
33.图1为本发明的流程示意图;
34.图2为本发明最佳基分类器的获取流程示意图。
具体实施方式
35.下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
low frequency fluctuation,alff)和脑区的局部一致性指标(regional homogeneity,reho)。
49.影像特征值通过以下方式获得:对全脑形态学特征图进行平滑处理,平滑核大小均采用8mm fwhm的高斯滤波器,以降低图像噪声;进行基于体素的形态学分析,获得能够体现差异性的体素簇团块,作为感兴趣脑区rois,计算感兴趣脑区内所有体素的形态学特征均值作为影像特征值,具体地:首先采用基于全脑体素水平上的glm统计分析方法,挖掘各形态学度量图中具有显著性差异的体素簇,p《0.001,体素数》30的体素簇团块即视为感兴趣区rois;其次,进行二值化处理,得到相应的rois掩模图像i
mask
;最后,计算掩模内所有体素的形态学特征均值为该roi的影像特征值,本实施例可以获得各对象的8种类型包含多个rois的形态学特征值,即为影像特征值。
50.本实施例中采用双样本t检验统计出具有组间差异(p《0.05)的临床文本信息,形成文本特征值,纳入特征集。
51.步骤3:将各模态的影像特征值及所述文本特征值作为对应最佳基分类器的输入,获得多个粗分类结果。
52.最佳基分类器为自动训练并筛选出的针对特定模态特征的模型。如图2所示,适用于不同模态特征的最佳基分类器模型的自适应选择过程如下,以m模态特征为例:
53.1)数据集划分:将原始数据观测值表示为xi∈rm,i=1,...,n,其中m表示基于m模态所提取出的特征数量,n表示用于训练的样本数,类别标签为yi∈{0,1},其中,“0”和“1”分别代表健康人群nc和早期pd的类别。
54.2)预定义备选基分类器模型,可以选择支持向量机算法、随机森林算法、k近邻算法、多层感知器分类器、朴素贝叶斯模型等。
55.3)初始化各基分类器模型的超参数搜索空间,采用联合交叉验证的网格搜索法进行各基分类器模型的参数寻优,具体地:假设第i个模型的第j个超参数为s
ij
,s
ij
的取值范围为[u
ij
,w
ij
],第i个模型共有h个超参数,则第i个模型的参数向量空间即为:si=[s
i1
,s
i2
,...,s
ih
]。
[0056]
4)在最优参数下,训练各个基分类器模型,使用交叉验证返回各模型的平均分类准确率acc,并基于该平均分类准确率获得各基模型的损失函数值,损失函数表示为:loss=-acc,选择最小损失函数值所对应的模型为最佳基分类器。
[0057]
步骤4:融合多个所述粗分类结果,获得最终分类结果。
[0058]
步骤3获得的粗分类结果记为:元学习器集成学习的实施步骤为:首先,通过线性拼接方式将上一层各模态下的最佳基分类器的粗分类结果进行融合,得到下一级元分类器的输入特征,记为其后,元学习进行集成学习上级各基模型的分类结果,完成第二次分类,得到最终分类结果。元学习器可选为逻辑回归分类器。
[0059]
实施例2
[0060]
本实施例还提供一种基于集成学习融合多模式特征的疾病分类装置,包括数据筛选及预处理模块、特征提取模块、自适应基分类器选择模块和元学习器集成学习模块,其中,数据筛选及预处理模块用于获取t1加权磁共振图像、弥散张量图像、静息态功能磁共振
图像以及临床前期非运动障碍评分,分别对三种模态磁共振影像数据进行相应的图像预处理,对临床文本信息进行数据归一化预处理;特征提取模块用于提取各模态影像的全脑形态学特征图,并计算感兴趣脑区内的形态学特征值,并采用双样本t检验统计出具有组间差异的临床文本信息被纳入特征集;自适应基分类器选择模块将各模态特征分别输入到自适应最佳基模型中进行分类,得到粗分类结果;元学习器集成学习模块集成学习各基模型的粗预测结果,输出最终分类结果。其余同实施例1。
[0061]
实施例3
[0062]
本发明还提供一种电子设备,包括一个或多个处理器、存储器和被存储在存储器中的一个或多个程序,一个或多个程序包括用于执行如实施例1所述的基于集成学习融合多模式特征的疾病分类方法的指令。
[0063]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献