一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于脑结构影像评估疾病引起大脑衰老的机器学习方法与流程

2022-11-16 08:15:41 来源:中国专利 TAG:


1.本发明涉及神经影像数据分析的技术领域,尤其涉及一种基于脑结构影像评估疾病引起大脑衰老的机器学习方法。


背景技术:

2.大脑老化是一种自然过程,但在这个过程中,大脑体积、皮层厚度等存在的变化有着明显的个体差异。大脑发育在正常衰老过程中遵循特定模式,这意味着人们可以根据大脑发育模式预测正常年龄。大脑年龄预测不仅具有重要的科学意义,而且还具有广泛的临床价值。有研究表明,多种类型的神经系统疾病、代谢疾病如精神分裂症、代谢障碍,糖尿病,心功能下降都与大脑衰老有关。而脑龄预测模型产生的脑龄已经很好的用来评估这些疾病与大脑衰老的相关性。如果一个受试者的脑龄大于实际生理年龄,受试者可能有一个更老的大脑,或者说大脑老化程度偏高,偏离了正常老化的轨迹,患有相关疾病的风险程度高。反之亦然,如果一个受试者的脑龄小于实际生理年龄,受试者可能具有一个年轻的大脑。给定个体的预测大脑年龄和实际年龄之间的差异被称为“大脑年龄差”。该值被认为反映了全脑弥漫性、多变量的形态学改变,并且可能是整体大脑健康的标志。大脑老化轨迹相对健康大脑老化平均轨迹的偏离程度,可以反映该个体未来患神经退型性疾病的风险。因此,基于神经影像数据中包含的大脑老化特征模式构建模型,检测个体大脑的老化轨迹,可为研究大脑在衰老过程中的变化以及脑部疾病如何影响正常的大脑老化提供了一种新方法。
3.结构磁共振图像(structural magnetic resonance imaging,smri)具有独特的无创性研究脑结构的能力,对于健康和患者来说,其影像数据上会呈现不同的结构特征。利用这些特征,可以进行被试相应的脑龄预测,估计大脑的生物学年龄。由于不同大脑图谱对全脑划分的依据不同,所以不同脑图谱对大脑年龄预测效果也不同。
4.近年来,随着人工智能的发展,基于机器学习利用影像学数据对不同个体进行脑龄预测是临床上重点研究方向之一,不仅可以有效提高疾病的诊断率,同时也为疾病治疗方案的制定提供有益指导。目前,在影像学的脑龄预测研究中常采用使用支持向量回归(support vector regression,svr)、岭回归、随机森林(random forest,rf)等各种回归模型来进行脑龄预测。岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法。这些研究证实,基于磁共振大脑结构信息的脑龄预测算法对临床诊断具有很大的帮助。然而,从结构磁共振图像中提取与脑龄相关的特征,如皮层厚度、皮层面积、曲率等。将这些特征进行组合会得到高维的特征,对于高维特征需要进行特征选择。目前,在影像学的脑龄研究中常采用主成分分析法、偏最小二乘法等进行降维,但是这些降维方法具有模糊性,解释性差,因此如何选择特征选择算法对脑龄预测至关重要。另外,目前基于机器学习的脑龄预测模型很少定位出与脑龄相关的大脑区域特征,定位出影响脑龄的关键大脑区域对模型可解释性和临床诊断具有重要意义。
同时,通过大脑年龄和实际年龄之间的差异衡量大脑衰老的程度有助于疾病的早期发现和鉴别。因此,亟需一种新型预测方法以解决上述问题。


技术实现要素:

5.本发明的目的在于针对现有技术的不足,提出一种基于脑结构影像评估疾病引起大脑衰老的机器学习方法。该方法可以筛选出在不同训练子集上可泛化的且更简约有效的特征,此外还可以定位出与对预测脑龄贡献最大的脑区结构特征。最好将训练好的模型在病人数据上进行预测,能够评估疾病影响大脑衰老的程度。
6.本发明是通过以下技术方案来实现的:一种基于脑结构影像评估疾病引起大脑衰老的机器学习方法,包括如下步骤:s1:对大脑结构磁共振影像进行预处理及特征提取;s2:对步骤s1提取的大脑结构特征采用bootstrap自展法进行特征筛选;s3:根据s2的筛选结果构建岭回归脑龄预测模型;s4:采用k折交叉验证定位出对预测脑龄贡献最大的脑区;s5:对构建的脑龄预测模型进行训练和测试;s6:使用独立病人组数据集进行测试,评估疾病影响大脑衰老的程度。
7.作为优选,所述步骤s1包含以下子步骤:s1.1:将采集得到的临床数据,根据临床表现分为0型病人,1型病人以及健康人,将这些病人的大脑结构磁共振影像中的非脑结构影像移除;s1.2:根据大脑的解刨结构将目标组织的磁共振影像提取出来;s1.3:采用图像分割算法将目标组织的磁共振影像按脑灰质、脑白质、脑脊液结构分割成3个不同的组织;s1.4:通过freesurfer软件包对分割组织进行皮层重建,量化人脑的功能、连接以及结构属性,对结构像进行三维重建,生成展平或胀平图像,利用不同脑图谱得到不同脑区的皮质厚度、曲率、面积、灰质容积的解剖参数。
8.作为优选,所述步骤s2包含以下子步骤:s2.1:针对健康组数据集,设置抽样子集占健康组数据集的比例;s2.2:设置抽样次数和抽样方式,即执行多少次有放回的抽样;s2.3:根据s2.1设置的比例和s2.2设置的次数和方式进行抽样,对抽样出的子集计算皮层厚度、皮层表面积等特征与脑龄的皮尔森相关性,保留具有显著相关性的结构特征作为候选特征,并统计这些特征在抽样中出现的频次;s2.4:设置抽样子集提取的特征出现的频率值,按频率值将筛选出的特征作为模型最终特征。
9.作为优选,所述步骤s3包含以下子步骤:s3.1:将健康组数据集按照比例随机划分为训练集和测试集;s3.2:对划分完成的训练集和测试集的特征数据进行标准化,把不同来源的数据统一到一个参考系下方便进行比较,保正程序运行时收敛加快,大部分模型归一化后收敛速度会加快;s3.3:定义岭回归模型alpha参数取值范围;
s3.4:定义交叉验证的评价指标为r2,利用k折交叉验证在岭回归模型alpha参数取值范围内寻找最优参数,即使模型准确率最高的参数;s3.5:将最优参数作为大脑模板下的模型参数。
10.作为优选,所述步骤s4包含以下子步骤:s4.1:针对训练集进行k折交叉验证,设置交叉验证评价指标为r2;s4.2:通过岭回归模型的coef_参数获取k个模型的特征权重,对所述k个模型的权重进行从大到小排序,分别获取k个模型的前h个特征权重对应的结构特征;s4.3:识别出在这k个模型中重复出现的特征,定位出对预测脑龄贡献最大的脑区结构特征。
11.作为优选,所述步骤s5包含以下子步骤:s5.1:选择n个大脑模板下的k折交叉验证中测试分数最好的模型,使其在整个训练集上进行重新训练;s5.2:在测试集上进行模型测试,得到模型测试的大脑年龄;s5.3:计算真实年龄与预测脑龄之间的mae、r2、皮尔森相关系数以及平均误差,作为模型的评价指标,最终选择brainnetome脑图谱所建立的脑龄预测模型作为最优模型。
12.作为优选,所述步骤s6包含以下子步骤:s6.1:对独立病人组数据进行归一化处理,加载训练完成的脑龄预测模型,利用训练好的最优模型对病人测试集进行测试,获取模型预测出的大脑年龄;s6.2:计算真实年龄与预测脑龄的平均误差,与健康测试集测试出的平均误差进行比较,病人测试集平均误差高于健康组则表明该疾病会导致病人大脑衰老;s6.3:生成健康组数据集和病人组数据集真实值与预测值之间的拟合线,通过对比两个拟合线的斜率证明病人大脑偏离健康大脑衰老轨迹。
13.作为优选,所述步骤s1.5采用的脑图谱包括aal、dkt、destrieux和brainnetome。
14.本发明提出一种基于脑结构影像评估疾病引起大脑衰老的机器学习方法,从大脑结构磁共振影像中提取不同脑区大脑结构特征,包括不同脑区大脑皮层厚度以及体积等结构特征。由于并不是所有特征对模型预测都有帮助,因此对特征进行筛选,使用筛选出的在不同训练子集上可泛化的且更简约有效的特征构建基于岭回归的脑龄预测模型。采用k折交叉验证找出在k个模型中均被反复识别的特征,定位出与脑龄预测最相关的脑区结构特征。最后将训练好的模型在病人数据上进行预测,来评估疾病影响大脑衰老的程度。该方法可以定位出与对预测脑龄贡献最大的脑区结构特征,同时将训练好的模型在病人数据上进行预测,能够评估疾病影响大脑衰老的程度。
附图说明
15.图1是基于脑结构影像评估疾病引起大脑衰老的机器学习方法流程示意图;图2是bootstrap自展法特征筛选示意图;图3是脑龄预测模型测试集结果图。
具体实施方式
16.下面将结合附图对本发明作进一步的说明。为了使本领域的人员更好地理解本申
请中的技术方案,下面将结合附图对本发明作进一步的说明。但这仅仅是本技术的一部分实施例,而不是全部的实施例。基于本技术所述的具体实施例,本领域的其他人员在没有做出创造性劳动的前提下所获得的其他实施例,都应当落在本发明的构思范围之内。
17.本发明的一种基于脑结构影像评估疾病引起大脑衰老的机器学习方法,包括如下步骤:s1:对大脑结构磁共振影像进行预处理及特征提取;s2:对步骤s1提取的大脑结构特征采用bootstrap自展法进行特征筛选;s3:根据s2的筛选结果构建岭回归脑龄预测模型;s4:采用k折交叉验证定位出对预测脑龄贡献最大的脑区;s5:对构建的脑龄预测模型进行训练和测试;s6:使用独立病人组数据集进行测试,评估疾病影响大脑衰老的程度。
18.所述步骤s1中,大脑结构磁共振影像预处理及特征提取包括以下步骤:首先,由于磁共振数据的原始结构图像中都包含着一些非脑结构,比如头骨等。因为头骨信号在后续分析中并不使用且图像边缘的信噪比较差,所以需要在图像预处理操作中将图像中的头骨等非脑结构移除。然后,在磁共振图像处理时,有时只关注某些特定区域的状态,这就需要根据大脑的解剖结构将目标部位的组织提取出来。在预处理流程中,将脑影像按脑灰质、白质、脑脊液结构分割成为3个不同的组织,这是因为这三个组织在大脑中有着不同的功能,因此这一步骤需要用到图像分割算法。最后,通过freesurfer软件包进行皮层重建,量化人脑的功能、连接以及结构属性,对结构像进行三维重建,生成展平或胀平图像,并得到皮质厚度、曲率、面积、灰质容积等解剖参数。 采用4种常用的脑图谱分别获取大脑结构特征,包括aal、dkt、destrieux和brainnetome。具体包含以下子步骤:s1.1:将采集得到的临床数据,根据临床表现分为0型病人,1型病人以及健康人,将这些病人的大脑结构磁共振影像中的非脑结构影像移除;s1.2:根据大脑的解刨结构将目标组织的磁共振影像提取出来;s1.3:采用图像分割算法将目标组织的磁共振影像按脑灰质、脑白质、脑脊液结构分割成3个不同的组织;s1.4:通过freesurfer软件包对分割组织进行皮层重建,量化人脑的功能、连接以及结构属性,对结构像进行三维重建,生成展平或胀平图像,利用不同脑图谱得到不同脑区的皮质厚度、曲率、面积、灰质容积的解剖参数。
19.所述步骤s2中,采用bootstrap自展法进行特征筛选包括以下步骤:首先,针对健康组数据集,设置抽样子集占数据集的比例为r%,即有r%样本用来构建抽样的样本集;其次,设置抽样次数及方式,即执行s次无放回抽样;然后,计算每个特征与脑龄的皮尔森相关性,保留具有显著相关的结构特征(p《0.05)作为候选特征,并统计这些特征在s次抽样中出现的频次;最后,设置抽样子集提取的特征出现的频率为t,即在s次抽样中被筛选出t次的特征作为模型最终特征。特征集最终大小为m*n,m即样本个数,n即每个样本结构特征维数。筛选出的这些特征在不同训练子集上可泛化且更简约有效。具体包含以下子步骤:s2.1:针对健康组数据集,设置抽样子集占健康组数据集的比例;s2.2:设置抽样次数和抽样方式,即执行多少次有放回的抽样;s2.3:根据s2.1设置的比例和s2.2设置的次数和方式进行抽样,对抽样出的子集
计算皮层厚度、皮层表面积等特征与脑龄的皮尔森相关性,保留具有显著相关性的结构特征作为候选特征,并统计这些特征在抽样中出现的频次;s2.4:设置抽样子集提取的特征出现的频率值,按频率值将筛选出的特征作为模型最终特征。
20.所述步骤s3中,构建岭回归脑龄预测模型包括以下步骤:首先,将健康组数据集按照a:b比例随机划分为训练集和测试集;其次,对划分完成的训练集和测试集的特征数据进行标准化,标准化后的数据的均值为0,标准差为1;然后,定义岭回归模型alpha参数取值范围(0.01,0.1,1,3...60),定义交叉验证的评价指标为r2,利用k折交叉验证在取值范围内寻找最优参数;最后,将最优参数作为4个大脑模板下的模型参数。具体包含以下子步骤:s3.1:将健康组数据集按照比例随机划分为训练集和测试集;s3.2:对划分完成的训练集和测试集的特征数据进行标准化,把不同来源的数据统一到一个参考系下方便进行比较,保正程序运行时收敛加快,大部分模型归一化后收敛速度会加快;s3.3:定义岭回归模型alpha参数取值范围;s3.4:定义交叉验证的评价指标为r2,利用k折交叉验证在岭回归模型alpha参数取值范围内寻找最优参数,即使模型准确率最高的参数;s3.5:将最优参数作为大脑模板下的模型参数。
21.所述步骤s4中,采用k折交叉验证定位出对预测脑龄贡献最大的脑区包括以下步骤:首先,针对训练集进行k折交叉验证,设置交叉验证评价指标为r2;然后,通过岭回归模型的coef_参数获取k个模型的特征权重,对这k个模型的权重进行从大到小排序,分别获取k个模型的前h个特征权重对应的结构特征;最后,识别出在这k个模型中重复出现的特征,定位出与脑龄预测最相关的脑区结构特征。具体包含以下子步骤:s4.1:针对训练集进行k折交叉验证,设置交叉验证评价指标为r2;s4.2:通过岭回归模型的coef_参数获取k个模型的特征权重,对所述k个模型的权重进行从大到小排序,分别获取k个模型的前h个特征权重对应的结构特征;s4.3:识别出在这k个模型中重复出现的特征,定位出对预测脑龄贡献最大的脑区结构特征。
22.所述步骤s5中,对构建脑龄预测模型进行训练和测试包括以下步骤:首先,选择n个大脑模板下的k折交叉验证中测试分数最好的模型,使其在整个训练集上进行重新训练;其次,在测试集上进行模型测试,得到模型测试的大脑年龄;最后,计算真实年龄与预测脑龄之间的mae、r2、皮尔森相关系数以及平均误差,作为模型的评价指标,最终选择brainnetome脑图谱所建立的脑龄预测模型作为最优模型。具体包含以下子步骤:s5.1:选择n个大脑模板下的k折交叉验证中测试分数最好的模型,使其在整个训练集上进行重新训练;s5.2:在测试集上进行模型测试,得到模型测试的大脑年龄;s5.3:计算真实年龄与预测脑龄之间的mae、r2、皮尔森相关系数以及平均误差,作为模型的评价指标,最终选择brainnetome脑图谱所建立的脑龄预测模型作为最优模型。
23.所述步骤s6中,使用独立病人组数据集进行测试,来评估疾病影响大脑衰老的程度包括以下步骤:首先,病人组数据集大小为p*n,p表示病人样本数,n为每个样本结构特征
维数,对病人数据进行归一化处理,加载训练完成的脑龄预测模型,利用训练好的最优模型对病人测试集进行测试,获取模型预测出的大脑年龄;然后,计算真实年龄与预测脑龄的平均误差,与健康测试集测试出的平均误差进行比较,病人测试集平均误差高于健康组则表明该疾病会导致病人大脑衰老;最后,为了进一步验证病人组的大脑会出现衰老现象,生成健康组和病人组真实值与预测值之间的拟合线,通过对比两个拟合线的斜率证明病人大脑偏离健康大脑衰老轨迹。具体包含以下子步骤:s6.1:对独立病人组数据进行归一化处理,加载训练完成的脑龄预测模型,利用训练好的最优模型对病人测试集进行测试,获取模型预测出的大脑年龄;s6.2:计算真实年龄与预测脑龄的平均误差,与健康测试集测试出的平均误差进行比较,病人测试集平均误差高于健康组则表明该疾病会导致病人大脑衰老;s6.3:生成健康组数据集和病人组数据集真实值与预测值之间的拟合线,通过对比两个拟合线的斜率证明病人大脑偏离健康大脑衰老轨迹。
24.总体而言,本发明提出一种基于脑结构影像评估疾病引起大脑衰老的机器学习方法。该方法可以定位出与对预测脑龄贡献最大的脑区结构特征,同时将训练好的模型在病人数据上进行预测,能够评估疾病影响大脑衰老的程度。整体方法流程如图1所示,首先,对结构磁共振数据进行预处理及特征提取,流程包括:去除脑影像的颅骨和非脑组织、对图像灰质、白质、脑脊液的分割、对结构像进行皮层重建,生成展平图像。完成预处理后,统计得到不同脑区的皮层厚度、面积、曲率、体积等结构特征,构建组合的大脑区域特征。其次,基于bootstrap自展法对基于不同脑区的组合特征进行筛选,即在s次抽样中被筛选出t次的特征作为模型最终特征,在不同训练子集上可泛化的且更简约有效。接下来,构建岭回归脑龄预测模型,通过k折交叉验证获取岭回归最优alpha参数。再次,采用k折交叉验证识别出在这k个模型中重复出现的特征,定位出与脑龄预测最相关的脑区结构特征。然后,基于正常组数据集对模型进行训练和测试。最后,基于训练完成的脑龄预测模型对独立的病人组数据集进行测试,证明病人大脑出现衰老症状。
25.实施例1该实例用到的是医院采集得到的临床数据,根据临床表现将数据分为0型病人,1型病人以及健康人。对数据进行整理和质量控制,最后入组的被试有0型病人138例,1型病人94例,健康人109例。
26.本方法的具体实施过程包括如下步骤:(1)脑结构磁共振影像预处理及特征提取:首先,由于磁共振数据的原始结构图像中都包含着一些非脑结构,比如头骨等。因为头骨信号在后续分析中并不使用且图像边缘的信噪比较差,所以需要在图像预处理操作中将图像中的头骨等非脑结构移除。然后,在磁共振图像处理时,有时只关注某些特定区域的状态,这就需要根据大脑的解剖结构将目标部位的组织提取出来。在预处理流程中,将脑影像按脑灰质、白质、脑脊液结构分割成为3个不同的组织,这是因为这三个组织在大脑中有着不同的功能,因此这一步骤需要用到图像分割算法。最后,通过freesurfer软件包进行皮层重建,量化人脑的功能、连接以及结构属性,对结构像进行三维重建,生成展平或胀平图像,并得到皮质厚度、曲率、面积、灰质容积等解剖参数。 采用4种常用的脑图谱分别获取大脑结构特征,包括aal、dkt、destrieux和brainnetome。
27.(2)如图2所示,采用bootstrap自展法进行特征筛选:首先,针对健康组数据集,设置抽样子集占数据集的比例为80%,即有r%样本用来构建抽样的样本集;其次,设置抽样次数及方式,即执行s次无放回抽样;然后,计算每个特征与脑龄的皮尔森相关性,保留具有显著相关的结构特征(p《0.05)作为候选特征,并统计这些特征在s次抽样中出现的频次;最后,设置抽样子集提取的特征出现的频率为t,即在s次抽样中被筛选出t次的特征作为模型最终特征。特征集最终大小为m*n,m即样本个数,n即每个样本结构特征维数。筛选出的这些特征在不同训练子集上可泛化且更简约有效。
28.(3)构建岭回归脑龄预测模型:首先,将健康组数据集按照a:b比例随机划分为训练集和测试集;其次,对划分完成的训练集和测试集的特征数据进行标准化,标准化后的数据的均值为0,标准差为1;然后,定义岭回归模型alpha参数取值范围(0.01,0.1,1,3...60),定义交叉验证的评价指标为r2,利用k折交叉验证在取值范围内寻找最优参数;最后,将最优参数作为4个大脑模板下的模型参数。岭回归脑龄预测结果如图3所示。
29.(4)采用k折交叉验证定位出与对预测脑龄贡献最大的脑区:首先,针对训练集进行k折交叉验证,即将训练集分成k份,轮流将其中k-1份作为训练数据,1份作为测试数据,进行试验,设置交叉验证评价指标为r2;然后,通过岭回归模型的coef_参数获取k个模型的特征权重,对这k个模型的权重进行从大到小排序,分别获取k个模型的前h个特征权重对应的不同脑区的结构特征;最后,识别出在这k个模型中重复出现的特征,定位出对脑龄预测贡献大的脑区结构特征,特征权重越大表明该脑区结构特征对脑龄预测的贡献越大。
30.(5)对构建脑龄预测模型进行训练和测试:首先,选择4个大脑模板下的k折交叉验证中测试分数最好的模型,使其在整个训练集上进行重新训练;其次,在测试集上进行模型测试,得到模型测试的大脑年龄;最后,计算真实年龄与预测脑龄之间的mae、r2、皮尔森相关系数以及平均误差,作为模型的评价指标,最终选择brainnetome脑图谱所建立的脑龄预测模型作为最优模型。
31.(6) 使用独立病人组数据集进行测试,来评估疾病影响大脑衰老的程度:首先,病人组数据集大小为p*n,p表示病人样本数,n为每个样本结构特征维数,对病人数据进行归一化处理,加载训练完成的脑龄预测模型,利用训练好的最优模型对病人测试集进行测试,获取模型预测出的大脑年龄;然后,计算真实年龄与预测脑龄的平均误差,与健康测试集测试出的平均误差进行比较,病人测试集平均误差高于健康组则表明该疾病会导致病人大脑衰老;最后,为了进一步验证病人组的大脑会出现衰老现象,生成健康组和病人组真实值与预测值之间的拟合线,通过对比两个拟合线的斜率证明病人大脑偏离健康大脑衰老轨迹。
32.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献